Windows. Вирусы. Ноутбуки. Интернет. Office. Утилиты. Драйверы

Аннотация: Рассматриваются два вида средств поддержания высокой доступности: обеспечение отказоустойчивости (нейтрализация отказов, живучесть) и обеспечение безопасного и быстрого восстановления после отказов (обслуживаемость).

Доступность

Основные понятия

Информационная система предоставляет своим пользователям определенный набор услуг (сервисов). Говорят, что обеспечен нужный уровень доступности этих сервисов, если следующие показатели находятся в заданных пределах:

  • Эффективность услуг . Эффективность услуги определяется в терминах максимального времени обслуживания запроса, количества поддерживаемых пользователей и т.п. Требуется, чтобы эффективность не опускалась ниже заранее установленного порога.
  • Время недоступности . Если эффективность информационной услуги не удовлетворяет наложенным ограничениям, услуга считается недоступной. Требуется, чтобы максимальная продолжительность периода недоступности и суммарное время недоступности за некоторый период (месяц, год) не превышали заранее заданных пределов.

В сущности, требуется, чтобы информационная система почти всегда работала с нужной эффективностью. Для некоторых критически важных систем (например, систем управления) время недоступности должно быть нулевым, без всяких "почти". В таком случае говорят о вероятности возникновения ситуации недоступности и требуют, чтобы эта вероятность не превышала заданной величины. Для решения данной задачи создавались и создаются специальные отказоустойчивые системы , стоимость которых, как правило, весьма высока.

К подавляющему большинству коммерческих систем предъявляются менее жесткие требования, однако современная деловая жизнь и здесь накладывает достаточно суровые ограничения, когда число обслуживаемых пользователей может измеряться тысячами, время ответа не должно превышать нескольких секунд, а время недоступности – нескольких часов в год.

Задачу обеспечения высокой доступности необходимо решать для современных конфигураций, построенных в технологии клиент/сервер. Это означает, что в защите нуждается вся цепочка – от пользователей (возможно, удаленных) до критически важных серверов (в том числе серверов безопасности).

Основные угрозы доступности были рассмотрены нами ранее.

В соответствии с ГОСТ 27.002, под отказом понимается событие, которое заключается в нарушении работоспособности изделия. В контексте данной работы изделие – это информационная система или ее компонент.

В простейшем случае можно считать, что отказы любого компонента составного изделия ведут к общему отказу , а распределение отказов во времени представляет собой простой пуассоновский поток событий. В таком случае вводят понятие интенсивности отказов и , которые связаны между собой соотношением

где – номер компонента,

интенсивность отказов ,

– .

Интенсивности отказов независимых компонентов складываются:

а среднее время наработки на отказ для составного изделия задается соотношением

Уже эти простейшие выкладки показывают, что если существует компонент, интенсивность отказов которого много больше, чем у остальных, то именно он определяет среднее время наработки на отказ всей информационной системы. Это является теоретическим обоснованием принципа первоочередного укрепления самого слабого звена .

Пуассоновская модель позволяет обосновать еще одно очень важное положение, состоящее в том, что эмпирический подход к построению систем высокой доступности не может быть реализован за приемлемое время. При традиционном цикле тестирования/отладки программной системы по оптимистическим оценкам каждое исправление ошибки приводит к экспоненциальному убыванию (примерно на половину десятичного порядка) интенсивности отказов . Отсюда следует, что для того, чтобы на опыте убедиться в достижении необходимого уровня доступности, независимо от применяемой технологии тестирования и отладки, придется потратить время, практически равное среднему времени наработки на отказ . Например, для достижения среднего времени наработки на отказ 10 5 часов потребуется более 10 4,5 часов, что составляет более трех лет. Значит, нужны иные методы построения систем высокой доступности , методы, эффективность которых доказана аналитически или практически за более чем пятьдесят лет развития вычислительной техники и программирования.

Пуассоновская модель применима в тех случаях, когда информационная система содержит одиночные точки отказа , то есть компоненты, выход которых из строя ведет к отказу всей системы. Для исследования систем с резервированием применяется иной формализм .

В соответствии с постановкой задачи будем считать, что существует количественная мера эффективности предоставляемых изделием информационных услуг. В таком случае вводятся понятия показателей эффективности отдельных элементов и эффективности функционирования всей сложной системы.

В качестве меры доступности можно принять вероятность приемлемости эффективности услуг, предоставляемых информационной системой, на всем протяжении рассматриваемого отрезка времени. Чем большим запасом эффективности располагает система, тем выше ее доступность.

При наличии избыточности в конфигурации системы вероятность того, что в рассматриваемый промежуток времени эффективность информационных сервисов не опустится ниже допустимого предела, зависит не только от вероятности отказа компонентов, но и от времени, в течение которого они остаются неработоспособными, поскольку при этом суммарная эффективность падает, и каждый следующий отказ может стать фатальным. Чтобы максимально увеличить доступность системы, необходимо минимизировать время неработоспособности каждого компонента. Кроме того, следует учитывать, что, вообще говоря, ремонтные работы могут потребовать понижения эффективности или даже временного отключения работоспособных компонентов; такого рода влияние также необходимо минимизировать.

Несколько терминологических замечаний. Обычно в литературе по теории надежности вместо доступности говорят о готовности (в том числе о высокой готовности ). Мы предпочли термин "доступность", чтобы подчеркнуть, что информационный сервис должен быть не просто "готов" сам по себе, но доступен для своих пользователей в условиях, когда ситуации недоступности могут вызываться причинами, на первый взгляд не имеющими прямого отношения к сервису (пример – отсутствие консультационного обслуживания).

Далее, вместо времени недоступности обычно говорят о коэффициенте готовности . Нам хотелось обратить внимание на два показателя – длительность однократного простоя и суммарную продолжительность простоев, поэтому мы предпочли термин " время недоступности " как более емкий.

Основы мер обеспечения высокой доступности

Основой мер повышения доступности является применение структурированного подхода, нашедшего воплощение в объектно-ориентированной методологии. Структуризация необходима по отношению ко всем аспектам и составным частям информационной системы – от архитектуры до административных баз данных, на всех этапах ее жизненного цикла – от инициации до выведения из эксплуатации. Структуризация , важная сама по себе, является одновременно необходимым условием практической реализуемости прочих мер повышения доступности. Только маленькие системы можно строить и эксплуатировать как угодно. У больших систем свои законы, которые, как мы уже указывали, программисты впервые осознали более 30 лет назад.

При разработке мер обеспечения высокой доступности

Наиболее удобным для аналитического описания является так называемый экспоненциальный (или показательный) закон надежности, который выражается формулой

где - постоянный параметр.

График экспоненциального закона надежности показан на рис. 7.10. Для этого закона функция распределения времени безотказной работы имеет вид

а плотность

Это есть уже известный нам показательный закон распределения, по которому распределено расстояние между соседними событиями в простейшем потоке с интенсивностью (см. § 4 гл. 4).

При рассмотрении вопросов надежности часто бывает удобно представлять себе дело так, словно на элемент действует простейший поток отказов с интенсивностью Я; элемент отказывает в момент, когда приходит первое событие этого потока.

Образ «потока отказов» приобретает реальный смысл, если отказавший элемент немедленно заменяется новым (восстанавливается).

Последовательность случайных моментов времени, в которые проис ходят отказы (рис. 7.11), представляет собой простейший поток событии, а интервалы между событиями - независимые случайные величины, распределенные по показательному закону (3,3),

Понятие «интенсивности отказов» может быть введено не только для экспоненциального, но и для любого другого закона надежности о плотностью вся разница будет в том, что при неэкспоненциальном законе интенсивность отказов Я будет уже не постоянной величиной, а переменной.

Интенсивностью (или иначе «опасностью») отказов называется отношение плотности распределения времени безотказной работы элемента к его надежности:

Поясним физический смысл этой характеристики. Пусть одновременно испытывается большое число N однородных элементов, каждый - до момента своего отказа. Обозначим - число элементов, оказавшихся исправными к моменту , как и и раньше, - число элементов, отказавших на малом участке времени На единицу времени придется среднее число отказов

Разделим эту величину не на общее число испытываемых элементов N, а на число исправных к моменту t элементов . Нетрудно убедиться, что при большом N это отношение будет приближенно равно интенсивности отказов

Действительно, при большом N

Но согласно формуле (2.6)

В работах по надежности приближенное выражение (3.5) часто рассматривают как определение интенсивности отказов, т. е. определяют ее как среднее число отказов в единицу времени, приходящееся на один работающий элемент.

Характеристике можно дать еще одно истолкование: это есть условная плотность вероятности отказа элемента в данный момент времени t, при условии, что до момента t он работал безотказно. Действительно, рассмотрим элемент вероятности - вероятность того, что за время элемент перейдет из состояния «работает» в состояние «не работает», при условии, что до момента t он работал. В самом деле, безусловная вероятность отказа элемента на участке равна Это - вероятность совмещения двух событий:

А - элемент работал исправно до момента

В - элемент отказал на участке времени По правилу умножения вероятностей:

Учитывая, что получим:

а величина есть не что иное, как условная плотность вероятности перехода из состояния «работает» в состояние «отказал» для момента t.

Если известна интенсивность отказов , то можно выразить через нее надежность Учитывая, что запишем формулу (3.4) в виде:

Интегрируя, получим:

Таким образом надежность выражается через интенсивность отказов.

В частном случае, когда , формула (3.6) дает:

т. е. уже известный нам экспоненциальный закон надежности.

Пользуясь образом «потока отказов», можно истолковать не только формулу (3.7), но и более общую формулу (3.6). Представим себе (совершенно условно!), что на элемент с произвольным законом надежности действует поток отказов с переменной интенсивностью Тогда формула (3.6) для выражает вероятность того, что на участке времени (0, t) не появится ни одного отказа.

Таким образом, как при экспоненциальном, так и при любом другом законе надежности работу элемента, начиная с момента включения можно представлять себе так, что на элемент действует пуассоновский поток отказов; для экспоненциального закона надежности это будет поток с постоянной интенсивностью , а для неэкспоненциального - с переменной интенсивностью

Заметим, что этот образ годится только в том случае, когда отказавший элемент не заменяется новым. Если, как мы это делали раньше, немедленно заменять отказавший элемент новым, поток отказов уже не будет пуассоновским. Действительно, интенсивность его будет зависеть не просто от времени t, протекшего с начала всего процесса, а и от времени , протекшего со случайного момента включения именно данного элемента; значит, поток событий имеет последействие и пуассоновским не является.

Если же на протяжении всего исследуемого процесса данный элемент не заменяется и может отказать не более одного раза, то при описании процесса, зависящего от его функционирования, можно пользоваться схемой марковского случайного процесса, но при переменной, а не постоянной интенсивности потока отказов.

Если неэкспоненциальный закон надежности сравнительно мало отличается от экспоненциального, то можно, в целях упрощения, приближенно заменить его экспоненциальным (рис. 7.12). Параметр этого закона выбирается так, чтобы сохранить неизменным математическое ожидание времени безотказной работы, равное, как мы знаем, площади, ограниченной кривой и осями координат. Для этого нужно положить параметр показательного закона равным

где - площадь, ограниченная кривой надежности

Таким образом, если мы хотим характеризовать надежность элемента некоторой средней интенсивностью отказов, нужно в качестве этой интенсивности взять величину, обратную среднему времени безотказной работы элемента.

Выше мы определяли величину t как площадь, ограниченную кривой Однако, если требуется знать только среднее время безотказной работы элемента, проще найти его непосредственно по статистическому материалу как среднее арифметическое всех наблюденных значений случайной величины Т - времени работы элемента до его отказа. Такой способ может быть применен и в случае, когда число опытов невелико и не позволяет достаточно точно построить кривую

Пример 1. Надежность элемента убывает со временем по линейному закону (рис. 7.13). Найти интенсивность отказов и среднее время безотказной работы элемента

Решение. По формуле (3.4) на участке ) имеем:

Согласно заданному закону надежности 4

Надежность и живучесть бортовых вычислительных систем (БЦВС).

Надежность – это свойство изделий выполнять требуемые функции, сохраняя свои эксплуатационные показатели в заданных пределах в течение требуемого промежутка времени.

Живучесть - способность вычислительной системы выполнять свои основные функции, несмотря на полученные повреждения и вышедшие из строя элементы аппаратуры.

К надежности и живучести БУВМ и БЦВС предъявляются более жесткие требования, чем к надежности и живучести универсальных и персональных ЭВМ. При отказе БЦВМ нарушается работоспособность системы, и не выполняются поставленные задачи, что может привести к непоправимым последствиям, в том числе и к человеческим жертвам.

Повторное решение задачи после восстановления БЦВМ и БЦВС часто невозможно. Так, например, при сбое в работе БЦВС зенитно-ракетного комплекса будет уничтожен обороняемый объект. И, если вы в короткий срок восстановите работу системы, то разрушения не удастся вернуть так же, как и потерянные жизни. Сбой в авионике может привести к крушению самолета или самопроизвольному сходу ракет. В этом случае восстановление работы БЦВС так же не позволит исправить последствия ошибки.

Обеспечение высокой надежности и живучести БЦВС усложняется условиями работы аппаратуры на борту при больших колебаниях температуры, влажности, действии механических нагрузок и в условии высокой запыленности. Так же ограничение накладывается на габариты и массу аппаратуры. Это в основном относится к авиации, но так же большое значение имеет и для БЦВС других направлений.

Таким образом, проблема надежности и живучести БЦВМ и БЦВС имеет ряд особенностей, обусловленных своеобразием структуры БЦВМ и характером выполняемых ими функций.

Задача обеспечения в сложной системе высокой надежности и живучести может оказаться весьма дорогостоящей, сложной и требующей больших затрат времени, хотя затруднения с выпуском продукции и проблемы, возникающие во время эксплуатации, в связи с необходимостью обеспечения и поддержания требуемого уровня надежности, могут вызвать еще большие затруднения.

Например, при уменьшении надежности ракетной системы на 10% для обеспечения одной и той же степени поражения цели потребуется увеличение, по меньшей мере, на 10% фактического количества боевых ракет. Для этих ракет нужны дополнительные пусковые площадки, испытательная аппаратура, оборудование для пуска, обслуживающий персонал и вспомогательное оборудование, что связано с большими затратами денежных средств и времени.

Чем сложнее структура вычислительной системы, тем труднее обеспечить надежность и живучесть. Следует заметить, что большинство отказов, имевших место при пусках управляемых ракет и искусственных спутников в США, не было вызвано неисправностью какого-либо экзотического устройства, конструкция которого ускорила прогресс современного уровня техники. Напротив, многие отказы были вызваны неисправностью функциональных и конструктивных элементов ранее апробированной конструкции. Иногда элементы были изготовлены неправильно, а в других случаях имели место ошибки в работе программистов или обслуживающего персонала. Нет такой мелочи, которая была бы слишком ничтожной для того, чтобы не оказаться возможной причиной отказа. Высокие потенциальная и практически достижимая надежности в значительной степени являются результатом глубокого и пристального внимания к мелочам.

Проблема повышения надежности и отказоустойчивости свойственна не только БЦВС, но и коммерческой аппаратуре. Например, в кластере Google в среднем происходит отказ 1 компьютера в день (то есть за год аварии происходят примерно на 3% компьютеров). Конечно, за счет резервирования данных и кода эти сбои пользователям незаметны, но для программиста они являются большой проблемой.

Случай, когда вычислительная система или ее часть вышли из строя, и дальнейшая работа невозможна без ремонта - называется отказом.

Теория надежности различает 3 характерных признака отказов, которые могут быть присуще аппаратуре и проявляются без всякого воздействия со стороны людей.

1. Приработные отказы. Эти отказы происходят в течение раннего периода эксплуатации и в большинстве случаев вызваны недостатком технологии производства и дефектами при изготовлении элементов вычислительных систем. Эти отказы могут быть исключены процессом отбраковки, приработки и технологического тестирования готового изделия.

2. Дефектные или постепенные отказы. Это - отказы, возникающие из-за износа отдельных параметров или частей аппаратуры. Они характеризуются постепенным изменением параметров изделия или элементов. В начале эти отказы могут проявляется как временные сбои. Однако, по мере того, как износ возрастает, временные сбои превращаются в серьезные отказы аппаратуры. Эти отказы являются признаком старения БЦВС. Они частично могут быть устранены при правильной эксплуатации, хорошей профилактике и своевременной замене изношенных элементов аппаратуры.

3. Внезапные или катастрофические отказы. Эти отказы не могут быть устранены ни при отладке аппаратуры, ни правильным обслуживанием, ни профилактикой. Внезапные отказы возникают случайно, никто не может их предсказать, однако, они подчиняются определенным законам вероятности. Так что частота внезапных отказов в течение достаточно большого периода времени становится примерно постоянной. Это происходит в любой аппаратуре. Примером случайных отказов является обрыв или замыкание цепей. Такой отказ приводит, обычно, к тому, что на выходе устанавливается постоянно либо 0, либо 1. При возникновении случайных отказов необходимо заменять элементы, в которых они произошли. Для этого вычислительная система должна быть ремонтопригодной и позволять быстро проводить профилактические работы в полевых условиях.

В отдельную группу можно выделить перемежающиеся отказы или сбои. Под сбоем подразумевается кратковременное нарушение нормальной работы БЦВМ, при котором один или несколько ее элементов, при выполнении одной или нескольких смежных операции, дает случайный результат. После сбоя вычислительная система может нормально функционировать в течение длительного времени.

Причиной возникновения сбоев могут быть электромагнитные наводки, механические воздействия и др. Часто сбои не приводит к выходу из строя комплекса, а только изменяют ход работы программного обеспечения из-за неверного выполнения одной или нескольких команд, что может привести к катастрофическим последствиям. Отличие сбоев от отказов в том, что при обнаружении последствий от сбоя, необходимо восстанавливать не аппаратуру, а информацию, искаженную сбоем.

Рассказывая о сбоях, необходимо упомянуть о, так называемых, Шрёдинбагах. Шрёдинбаг – это ошибка, при которой вычислительная система долгое время функционирует нормально, однако, при определенных условиях, например, задании нестандартных параметров работы, возникает сбой. При анализе этого сбоя оказывается, что программное обеспечение вычислительной системы имеет принципиальную ошибку, из-за которой оно в принципе не должно было функционировать.

Шрёдинбаг может быть образован сложной комбинацией парных ошибок (когда ошибка в одном месте компенсируется ошибкой противоположного действия в другом месте). При определенном стечении обстоятельств баланс ошибок разрушается, что приводит к парализации работы.

Таким образом, для БЦВС характерно еще одно свойство, определяющее ее надежность – безошибочность или достоверность функционирования. Следовательно, надежность БЦВС – это совокупность безотказности, достоверности функционирования, живучести и ремонтопригодности.

В качестве параметров надежности применяют:

1. Интенсивность отказов –

2. Средняя наработка на отказ –

3. Вероятность безотказной работы в течение заданного времени – Р

4. Вероятность отказа – Q

Интенсивность отказов

Интенсивность отказов – это частота, с которой происходят отказы. Если аппаратура состоит из нескольких элементов, то ее интенсивность отказов равна сумме интенсивности отказов всех элементов, отказы которых приводят к неисправности оборудования.

Кривая интенсивности отказов, в зависимости от времени эксплуатации, изображена на рисунке ниже.

При начале эксплуатации (в момент времени t = 0) вводится в действие большое количество элементов. Эта совокупность элементов в начале может имеет большую интенсивность отказов, за счет дефектных образцов. Поскольку дефектные элементы отказывают один за другим, интенсивность отказов относительно быстро уменьшается в течение периода приработки и становится приблизительно постоянной к моменту нормальной эксплуатации (Т норм), когда дефектные элементы уже отказали, и были заменены на работоспособные.

Совокупность элементов, прошедших период приработки, имеет самый низкий уровень отказов, который сохраняется примерно постоянным до начала выхода из строя элементов, из-за износа (Т износа). С этого момента интенсивность отказов начинает возрастать.

Средняя наработка на отказ

Средняя наработка на отказ – это отношение общего отработанного времени к общему числу отказов. В течение периода нормальной эксплуатации, когда интенсивность отказов примерно постоянна, средняя наработка на отказ представляет собой величину обратную интенсивности отказов:

Вероятность безотказной работы.

Вероятностью безотказной работы называется вероятное или ожидаемое число устройств, которое будет безотказно функционировать в течение заданного периода времени:

Эта формула справедлива для всех устройств, которые прошли приработку, но не испытывают влияние износа. Следовательно, время t не может превышать периода нормальной эксплуатации устройств.

График, показывающий вероятность безотказной работы в зависимости от времени нормальной эксплуатации, приведен ниже:

Вероятность отказа.

Вероятность отказа – это величина обратная вероятности безотказной работы.

Номинальная интенсивность отказов.

Элементы аппаратуры проектируют так, чтобы они могла выдерживать определенные номинальные: напряжение, силу тока, температуру, вибрации, влажность и так далее. Когда аппаратура в процессе работы подвергается влиянию таких воздействий, наблюдается некая определенная интенсивность отказов. Ее называют номинальной интенсивностью отказов.

При увеличении общей рабочей нагрузи или некоторых частных нагрузок, или вредных воздействий окружающей среды сверх номинальных уровней, интенсивность отказов возрастает довольно резко по сравнению со своим номинальным значением. И наоборот, интенсивность отказов уменьшается, когда нагрузка становится ниже номинального уровня.

Например, если элемент должен работать при номинальном значении температуры 60 градусов, то путем понижения температуры, в результате применения принудительной системы охлаждения, можно снизить интенсивность отказов. Однако, если снижение температуры влечет за собой слишком большое увеличение количества элементов и веса аппаратуры, то более выгодным может оказаться выбор элементов с увеличенным номинальным значением рабочей температуры и применение их при температуре, ниже номинальной. В этом случае аппаратура может стать дешевле, а масса меньше (что принципиально при работе в летательном аппарате), чем при применении принудительной системы охлаждения.

Методы определения надежности БЦВС.

Когда проектируются и создаются новые изделия механическими, электрическими, химическими или другими измерениями, нельзя определить значение интенсивности отказов. Интенсивность отказов можно определить путем сбора статистических данных, полученных при испытании на надежность этого или аналогичных изделий.

Вероятность безотказной работы в течение любого момента времени испытаний выражается формулой:

Интенсивность отказов определяется формулой:

При измерении интенсивности отказов необходимо поддерживать постоянное число элементов, участвующих в испытании, путем замены отказавших элементов новыми.

Таким образом, для получения данных о количественных характеристиках надежности аппаратуры, необходимо изготовить специальный образец аппаратуры для испытаний на надежность. Испытания на надежность должны проводиться в условиях, соответствующих реальным условиям эксплуатации оборудования по внешним воздействиям, периодичности включения и изменения параметров питания.


Интенсивности отказов электротехнического изделия. Он характеризует как затраты на их ремонты, так и величину экономического ущерба, имеющего место в результате отказов электроизделий. Целевая функция 3 для решения указанной задачи выглядит следующим образом  

Безотказность показывает свойство изделия непрерывно сохранять работоспособность в течение некоторого времени или некоторой наработки, выражающееся в вероятности безотказной работы , средней наработке до отказа, интенсивности отказов.  

Как показывает опыт эксплуатации, наибольшая интенсивность отказов средств автоматизации наблюдается в период, следующий за их ремонтом, аналогично тому, как  

В общем случае интенсивность отказов может не подчиняться экспоненциальному закону распределения . Тогда указанное выражение примет вид  

Тогда, если система состояла из Nu исправных элементов с интенсивностью отказов Ли каждый, и Nd некачественных элементов с интенсивностью отказа каждого Arf, начальная интенсивность отказов системы (Яс) в первый период ввода ее в действие после ремонтов равна  

При качественной замене отказавших элементов интенсивность отказов системы после окончания периода приработки повышается до значения  

Интенсивность отказов находится по формуле  

В приведен интересный, также основанный на большом фактическом материале анализ двух групп повреждений газопроводов, носящих аварийный характер, а именно разрывов стыков газопроводов и коррозионных повреждений. Убедительно показана зависимость количества повреждений от качества производства работ, в связи с чем число отказов на газопроводах, уложенных после 1951 г., значительно ниже, чем на газопроводах более ранних лет укладки. Однако некоторые выводы статьи представляются излишне категоричными. Так, исключение из рассмотрения, т. е. приравнивание к нулю, вероятности механических повреждений газопроводов, ... так как они возникают при неправильном или небрежном производстве работ и их можно предотвратить, как и полный отказ от учета коррозионных повреждений при определении интенсивности отказов газопроводов представляются необоснованным завышением надежности газопроводов. Вероятность этих событий снижена в результате улучшения качества противокоррозионной защиты, улучшения надзора за проведением земляных работ в зоне газопровода и т. п., но все же не исключена. Спорным кажется и утверждение, что к отказу может привести только полный разрыв стыка газопровода. При частичном разрыве отказ будет характеризоваться лишь меньшей глубиной. Учитывая изложенное, а также опыт ленинградских организаций, можно принимать в расчетах величину ау на 15 -20% меньшей, чем было рекомендовано в 1966 г. . Конечно желательно, чтобы исследование этого вопроса было продолжено.  

И о н и н А. А., Жила В. А. Интенсивность отказов участков газопроводов городских газовых сетей.- Газовая промышленность, 1972, № 10,. с, 20-25.  

Интенсивность отказов K(t) - доля изделий, отказавших в единицу времени после данного момента, рассчитанная по отношению к числу испытываемых изделий, работоспособных в данный момент времени.  

Практически интенсивность отказов оценивается по формуле  

Теоретическое значение интенсивности отказов определяется по формуле  

Показатель интенсивности отказов применяется только для неремонтируемых изделий.  

Рис. 9. График изменения величины интенсивности отказов. /info/35056">постоянной величины . Во II период - период нормальной эксплуатации - интенсивность отказов остается практически постоянной величиной . В III период - период интенсивного износа - интенсивность отказов резко возрастает.  

Если время отказов каждого элемента подчинено экспоненциальному закону с интенсивностью отказов Ki, то-  

Безотказность - свойство изделия непрерывно сохранять работоспособность в течение некоторого интервала времени без вынужденных перерывов. Показателями безотказности являются , средняя наработка до первого отказа, наработка на отказ, интенсивность отказов.  

Уровень загрузки, с которой работают элементы машины, является одним из факторов, который следует учитывать и при анализе надежности -системы, так ак он определяет величину интенсивности отказов элементов в системе. Именно взаимодействие между прочностью элемента, с одной стороны, и уровнем нагрузки, воздействующей на элемент, с другой стороны, определяет в основном интенсивность отказов элемента.  

Известно, что при увеличении общей нагрузки или (некоторых частных нагрузок интенсивность отказов элемента довольно резко возрастает. Кривая на рис. 7 иллюстрирует общий характер изменения интенсивности отказов электрических и электронных элементов машин в зависимости от окружающих условий. Как видим, значение интенсивности отказов на приведенной кривой возрастает почти прямолинейно при увеличении нагрузки.  

Среднее время между отказами имеет непосредственное значение для организации эксплуатации оборудования, так как оно позволяет определять предполагаемую интенсивность отказов, что важно при планировании резерва, количества оборудования и обслуживающего персонала. Восстановление различных блоков машин должно проводиться с учетом среднего времени между отказами, определенного для них.  

Время эксплуатации Рис. 13.2. Интенсивность отказов  

Периодически из строя выходит огнеупорный туннель, что требует полной реконструкции печи. Эта процедура занимает 8 дней и обходится в 5800 фунтов стерлингов . Еще два дня уходят на разогрев печи до рабочей температуры, причем во второй день нужно обжигать отходы, чтобы не разрушить новый туннель. В табл. 13.2 приведена интенсивность отказов туннеля.  

Интенсивность отказов является удобной характеристикой надежности различных аппаратов и узлов и определяет-  

Проводится детальная классификация технико-экономических показателей качества изделий с целью выявления таких из них, которые в большей или меньшей мере оказывают влияние на величину потребности. Проведенный анализ показателей качества показал, что нет необходимости учитывать в расчетах все изменяющиеся показатели качества , так как многие из них практически или совсем не влияют на изменение величины потребности, или это влияние незначительное, или возможность изменения потребности находится в функции еще целого ряда факторов. Реальное влияние на изменение потребности оказывают такие из них, как производительность (объем работы) изделия безотказность и срок службы. В дальнейших исследованиях ограничимся рассмотрением только этих трех основных показателей . Следует заметить, что для различных изделий существуют различные показатели, характеризующие выбранные основные характеристики. Например, производительность и объем работы . Для турбогенераторов, сверхпроводниковых синхронных компенсаторов, коллекторных, синхронных и асинхронных электрических машин, гидрогенераторов - это номинальная мощность для безколлекторных регулируемых машин и регулируемых электроприводов - момент вращения для светотехнического оборудования - световой поток и мощность ламп для оборудования по производству оптического волокна - скорость вытяжки оптического волокна для коммутационной аппаратуры - число коммутируемых цепей для магистральных и промышленных электровозов - мощность для щеток электрических машин, вращающихся, - плотность тока для электросварочного оборудования - скорость сварки (резки) и др. Показатель безотказности изделий характеризует такие свойства изделий, как наработка на отказ, интенсивность отказов, вероятность безотказной работы , коэффициент готовности и др. И наконец, срок службы характеризуется количеством лет эксплуатации, ресурсом работы, ресурсом до капитального ремонта , межремонтным периодом.  

Отношение nd/nu характеризует прирост установившейся интенсивности отказов, возникающей в результате некачественной замены элементов, по сравнению с совершенной заменой. Поэтому коэффициент nd/nu называют коэффициентом приращения интенсивности отказов. Дополнительные потери, наносимые приработочными отказами, возникающими в результате некачественной замены элементов, (Пн) определяются из  

В теории надежности К означает интенсивность отказа. При экспоненциальном законе К= onst, т. е. не зависит от времени.  

Компьютерный кристалл памяти состоит из большого числа транзисторов - по два на каждый бит. Кристалл емкостью 64 Кбит содержит 128000 транзисторов, емкостью 1 Мбит - свыше 2000000. Если бы за функции памяти отвечали отдельные транзисторы, то интенсивность отказов была бы такой, что персональный компьютер просто не смог бы работать. Если из 1000000 отказывает хотя бы 1, то интенсивность отказов микросхемы с 64 Кбит памяти равнялась бы 12 %, а микросхемы с 1 Мбит памяти - 86 %.  

Индикатором наиболее вероятной частоты ревизий может послужить динамика интенсивности отказов в течение срока эксплуатации данного вида оборудования. Для большинства продуктов и систем она имеет вид tZ-образной кривой , как показано на рис. 13.2. Высокая частота поломок в начале эксплуатации может быть вызвана дефектными или неправильно установленными компонентами, ошибками при монтаже оборудования или неопытностью операторов. После устранения этих недочетов наблюдается период стабильно нтгзкого числа отказов. Ближе к окончанию срока эксплуатации из-за износа их частота снова растет. Снизить интенсивность поломок на начальном этапе можно путем обкатки продукта, в конце - за-  

Часть 1.

Введение
Развитие современной аппаратуры характеризуется значительным увеличением ее сложности. Усложнение обуславливает повышение гарантии своевременности и правильности решения задач.
Проблема надежности возникла в 50-х годах, когда начался процесс быстрого усложнения систем, и стали вводиться в действие новые объекты. В это время появились первые публикации, определяющие понятия и определения, относящиеся к надежности [ 1 ] и была создана методика оценки и расчета надежности устройств вероятностно-статистическими методами.
Исследование поведения аппаратуры (объекта) во время эксплуатации и оценка ее качества определяет его надежность. Термин "эксплуатация" происходит от французского слова "exploitation", что означает получение пользы или выгоды из чего-либо.
Надежность - свойство объекта выполнять заданные функции, сохраняя во времени значения установленных эксплуатационных показателей в заданных пределах.
Для количественного выражения надежности объекта и для планирования эксплуатации используются специальные характеристики - показатели надежности. Они позволяют оценивать надежность объекта или его элементов в различных условиях и на разных этапах эксплуатации.
Более подробно с показателями надежности можно ознакомиться в ГОСТ 16503-70 - "Промышленные изделия. Номенклатура и характеристика основных показателей надежности.", ГОСТ 18322-73 - "Системы технического обслуживания и ремонта техники. Термины и определения.", ГОСТ 13377-75 - "Надежность в технике. Термины и определения".

Определения
Надежность - свойство [далее - (сво-во)] объекта [далее - (ОБ)] выполнять требуемые функции, сохраняя свои эксплуатационные показатели в течение заданного периода времени.
Надежность представляет собой комплексное сво-во, сочетающее в себе понятие работоспособности, безотказности, долговечности, ремонтопригодности и сохранности.
Работоспособность - представляет собой состояние ОБ, при котором он способен выполнять свои функции.
Безотказность - сво-во ОБ сохранять свою работоспособность в течение определенного времени. Событие, нарушающее работоспособность ОБ, называется отказом. Самоустраняющийся отказ называется сбоем.
Долговечность - сво-во ОБ сохранять свою работоспособность до предельного состояния, когда его эксплуатация становится невозможной по техническим, экономическим причинам, условиям техники безопасности или необходимости капитального ремонта.
Ремонтопригодность - определяет приспособляемость ОБ к предупреждению и обнаружению неисправностей и отказов и устранению их путем проведения ремонтов и технического обслуживания.
Сохраняемость - сво-во ОБ непрерывно поддерживать свою работоспособность в течение и после хранения и технического обслуживания.

Основные показатели надежности
Основными качественными показателями надежности является вероятность безотказной работы, интенсивность отказов и средняя наработка до отказа.
Вероятность безотказной работы P(t) представляет собой вероятность того, что в пределах указанного периода времени t , отказ ОБ не возникнет. Этот показатель определяется отношение числа элементов ОБ, безотказно проработавших до момента времени t к общему числу элементов ОБ, работоспособных в начальный момент.
Интенсивность отказов l (t) - это число отказов n(t) элементов ОБ в единицу времени, отнесенное к среднему числу элементов Nt ОБ, работоспособных к моменту времени D t :
l (t )= n (t )/(Nt * D t ) , где
D t - заданный отрезок времени.
Например : 1000 элементов ОБ работали 500 часов. За это время отказали 2 элемента. Отсюда, l (t )= n (t )/(Nt * D t )=2/(1000*500)=4*10 -6 1/ч, т.е. за 1 час может отказать 4-е элемента из миллиона.
Показатели интенсивности отказов комплектующих берутся на основании справочных данных [ 1, 6, 8 ]. Для примера в приведена интенсивность отказов l (t) некоторых элементов.

Наименование элемента

Интенсивность отказов, *10 -5, 1/ч

Резисторы

Конденсаторы

Трансформаторы

Катушки индуктивности

Коммутационные устройства

Соединения пайкой

Провода, кабели

Электродвигатели


Надежность ОБ, как системы, характеризуется потоком отказов L , численно равное сумме интенсивности отказов отдельных устройств:
L = ål i
По формуле рассчитывается поток отказов и отдельных устройств ОБ, состоящих, в свою очередь, из различных узлов и элементов, характеризующихся своей интенсивностью отказов. Формула справедлива для расчета потока отказов системы из n элементов в случае, когда отказ любого из них приводит к отказу всей системы в целом. Такое соединение элементов называется логически последовательным или основным. Кроме, того, существует логически параллельное соединение элементов, когда выход их строя одного из них не приводит к отказу системы в целом. Связь вероятности безотказной работы P(t) и потока отказов L определяется:
P (t )= exp (- D t ) , очевидно, что 0И 0< P (t )<1 и p (0)=1, а p (¥ )=0
Средняя наработка до отказа To - это математическое ожидание наработки ОБ до первого отказа:
To=1/ L =1/(ål i) , или , отсюда : L =1/To
Время безотказной работы равно обратной величине интенсивности отказов.
Например : технология элементов обеспечивает среднюю интенсивность отказов l i =1*10 -5 1/ч . При использовании в ОБ N=1*10 4 элементарных деталей суммарная интенсивность отказов l о= N * l i =10 -1 1/ч . Тогда среднее время безотказной работы ОБ To =1/ l о=10 ч. Если выполнить ОБ на основе 4-х больших интегральных схем (БИС), то среднее время безотказной работы ОБ увеличится в N/4=2500 раз и составит 25000 ч. или 34 месяца или около 3 лет.

Расчет надежности
Формулы позволяют выполнить расчет надежности ОБ, если известны исходные данные - состав ОБ, режим и условия его работы, интенсивности отказов его компонент (элементов). Однако при практических расчетах надежности есть трудности из-за отсутствия достоверных данных о интенсивности отказов для номенклатуры элементов, узлов и устройств ОБ. Выход из этого положения дает применение коэффициентного метода. Cущность коэффициентного метода состоит в том, что при расчете надежности ОБ используют не абсолютные значения интенсивности отказов l i , а коэффициент надежности ki , связывающий значения l i с интенсивностью отказов l b какого-либо базового элемента:
ki = l i / l b
Коэффициент надежности ki практически не зависит от условий эксплуатации и для данного элемента является константой, а различие условий эксплуатации ku учитывается соответствующими изменениями l b . В качестве базового элемента в теории и практике выбран резистор. Показатели надежности комплектующих берутся на основании справочных данных [ 1, 6, 8 ]. Для примера в приведен коэффициенты надежности ki некоторых элементов. В табл. 3 приведены коэффициенты условий эксплуатации ku работы для некоторых типов аппаратуры.
Влияние на надежность элементов основных дестабилизирующих факторов - электрических нагрузок, температуры окружающей среды - учитывается введением в расчет поправочных коэффициентов a . В табл. 4 приведены коэффициенты условий a работы для некоторых типов элементов. Учет влияния других факторов - запыленности, влажности и т.д. - выполняется коррекцией интенсивности отказов базового элемента с помощью поправочных коэффициентов.
Результирующий коэффициент надежности элементов ОБ с учетом поправочных коэффициентов:
ki"=a1*a2*a3*a4*ki*ku, где
ku - номинальное значение коэффициента условий эксплуатации
ki - номинальное значение коэффициент надежности
a1 - коэффициент учитывающий влияние электрической нагрузки по U, I или P
a2 - коэффициент учитывающий влияние температуры среды
a3 - коэффициент снижения нагрузки от номинальной по U, I или P
a4 - коэффициент использования данного элемента, к работе ОБ в целом

Условия эксплуатации

Коэффициент условий

Лабораторные условия

Аппаратура стационарная:

В помещениях

Вне помещений

Подвижная аппаратура:

Корабельная

Автомобильная

Поездная

Наименование элемента и его параметры

Коэффициент нагрузки

Резисторы:

По напряжению

По мощности

Конденсаторы

По напряжению

По реактивной мощности

По прямому току

По обратному напряжению

По температуре перехода

По току коллектора

По напряж. коллектор-эмиттер

По рассеиваемой мощности

Порядок расчета состоит в следующем:
1. Определяют количественные значения параметров, характеризующие нормальную работу ОБ.
2. Составляют поэлементную принципиальную схему ОБ, определяющую соединение элементов при выполнении ими заданной функции. Вспомогательные элементы, использующиеся при выполнении функции ОБ, не учитываются.
3. Определяются исходные данные для расчета надежности:

  • тип, количество, номинальные данные элементов
  • режим работы, температура среды и другие параметры
  • коэффициент использования элементов
  • коэффициент условий эксплуатации системы
  • определяется базовый элемент l b и интенсивность отказов l b "
  • по формуле: ki "= a 1* a 2* a 3* a 4* ki * ku определяется коэффициент надежности

4. Определяются основные показатели надежности ОБ, при логически последовательном (основном) соединении элементов, узлов и устройств:

  • вероятность безотказной работы : P(t)=exp{- l b*To*} , где
    Ni - число одинаковых элементов в ОБ
    n - общее число элементов в ОБ, имеющих основное соединение
  • наработка на отказ :
    To=1/{ l b*}

Если в схеме ОБ есть участки с параллельным соединением элементов, то сначала делается расчет показателей надежности отдельно для этих элементов, а затем для ОБ в целом.
5. Найденные показатели надежности сравниваются с требуемыми. Если не соответствуют, то принимаются меры к повышению надежности ОБ ().
6. Средствами повышения надежности ОБ являются:
- введение избыточности, которая бывает:

  • внутриэлементная - применение более надежных элементов
  • структурная - резервирование - общее или раздельное

Пример расчета:
Рассчитаем основные показатели надежности для вентилятора на асинхронном электродвигателе. Схема приведена на . Для пуска М замыкают QF, а затем SB1. KM1 получает питание, срабатывает и своими контактами КМ2 подключает М к источнику питания, а вспомогательным контактом шунтирует SB1. Для отключения М служит SB2.

В защите М используются FA и тепловое реле KK1 с КК2. Вентилятор работает в закрытом помещении при T=50 C в длительном режиме. Для расчета применим коэффициентный метод, используя коэффициенты надежности компонент схемы. Принимаем интенсивность отказов базового элемента l b =3*10 -8 . На основании принципиальной схемы и ее анализа, составим основную схему для расчета надежности (). В расчетную схему включены компоненты, отказ которых приводит к полному отказу устройства. Исходные данные сведем в .

Базовый элемент, 1/ч

l б

3*10 -8

Коэф. условий эксплуатации

Интенсивность отказов

l б ’

l б* ku =7,5*10 -8

Время работы, ч

Элемент принципиальной схемы

Элемент расчетной схемы

Число элементов

Коэф. надежности

Коэф. нагрузки

Коэф. электрической нагрузки

Коэф. температуры

Коэф. нагрузки по мощности

Коэф. использования

Произведение коэф. a

Коэф. надежности

S (Ni * ki ’)

Наработка до отказа, ч

1/[ l б ’* S (Ni*ki’)]=3523,7

Вероятность

е [- l б ’*To* S (Ni*ki’)] =0,24

По результатам расчета можно сделать выводы:
1. Наработка до отказа устройства: To=3524 ч.
2. Вероятность безотказной работы: p(t)=0,24. Вероятность того, что в пределах заданного времени работы t в заданных условиях работы не возникнет отказа.

Частные случай расчета надежности.

1. Объект (далее ОБ) состоит из n блоков, соединенных последовательно (). Вероятность безотказной работы каждого блока p. Найти вероятность безотказной работы P системы в целом.

Решение: P = p n
2. ОБ состоит из n блоков, соединенных параллельно (). Вероятность безотказной работы каждого блока p. Найти вероятность безотказной работы P системы в целом.

Решение: P =1-(1- p ) 2
3. ОБ состоит из n блоков, соединенных параллельно (). Вероятность безотказной работы каждого блока p. Вероятность безотказной работы переключателя (П) p1. Найти вероятность безотказной работы P системы в целом.

Решение: P=1-(1-p)*(1-p1*p)
4. ОБ состоит из n блоков (), с вероятность безотказной работы каждого блока p. С целью повышения надежности ОБ произведено дублирование, еще такими-же блоками. Найти вероятность безотказной работы системы: с дублированием каждого блока Pa, с дублированием всей системы Pb.

Решение: Pa = n Pb = 2
5. ОБ состоит из n блоков (см. рис. 10). При исправном C вероятность безотказной работы U1=p1, U2=p2. При неисправном C вероятность безотказной работы U1=p1", U2=p2". Вероятность безотказной работы C=ps. Найти вероятность безотказной работы P системы в целом.

Решение: P = ps *+(1- ps )*
9. ОБ состоит из 2-х узлов U1 и U2. Вероятность безотказной работы за время t узлов: U1 p1=0.8, U2 p2=0.9. По истечении времени t ОБ несправен. Найти вероятность, что:
- H1 - неисправен узел U1
- H2 - неисправен узел U2
- H3 - неисправны узлы U1 и U2
Решение: Очевидно, имело место H0, когда оба узла исправны.
Событие A=H1+H2+H3
Априорные (первоначальные) вероятности:
- P(H1)=(1-p1)*p2 =(1-0.8)*0.9=0.2*0.9=0.18
- P(H2)=(1-p2)*p1 =(1-0.9)*0.8=0.1*0.8=0.08
- P(H3)=(1-p1)*(1-p2) =(1-0.8)*0.9=0.2*0.1=0.02
- A= i=1 å 3 *P(Hi)=P(H1)+P(H2)+P(H3) =0.18+0.08+0.02=0.28
Апостерионые (конечные) вероятности:
- P(H1/A)=P(H1)/A=0.18/0.28=0.643
- P(H2/A)=P(H2)/A=0.08/0.28=0.286
- P(H3/A)=P(H3)/A=0.02/0.28=0.071
10. ОБ состоит из m блоков типа U1 и n блоков типа U2. Вероятность безотказной работы за время t каждого блока U1=p1, каждого блока U2=p2. Для работы ОБ достаточно, чтобы в течение t работали безотказно любые 2-а блока типа U1 и одновременно с этим любые 2-а блока типа U2. Найти вероятность безотказной работы ОБ.
Решение: Событие A (безотказная работа ОБ) есть произведение 2-х событий:
- A1 - (не менее 2-х из m блоков типа U1 работают)
- A2 - (не менее 2-х из n блоков типа U2 работают)
Число X1 работающих безотказно блоков типа U1 есть случайная величина, распределенная по биномиальному закону с параметрами m, p1. Событие A1 состоит в том, что X1 примет значение не менее 2, поэтому:

P(A1 )=P{X1>2}=1-P(X1<2)=1-P(X1=0)-P(X1=1)=1-(g1 m +m*g2 m-1 *p1) , где g1=1-p1

аналогично: P(A2)=1-(g2 n +n*g2 n-1 *p2) , где g2=1-p2

Вероятность безотказной работы ОБ:

R =P(A)=P(A1)*P(A2)=* , где g1=1-p1, g2=1-p2

11. ОБ состоит из 3-х узлов (). В узле U1 n1 элементов с интенсивностью отказов l1. В узле U2 n2 элементов с интенсивностью отказов l2. В узле U3 n3 элементов с интенсивностью отказов l2, т.к. U2 и U3 дублируют друг друга. U1 выходит из строя если в нем отказало не менее 2-х элементов. U2 или U3, т.к. дублируются, выходят из строя если в них отказал хотя бы один элемент. ОБ выходит из строя если отказал U1 или U2 и U3 вместе. Вероятность безотказной работы каждого элемента p. Найти вероятность того, что за время t ОБ не выйдет из строя.
Вероятности выхода из строя U 2 и U 3 равны:

R2=1-(1-p2) n2 R3=1-(1-p3) n3

Вероятности выхода из строя всего ОБ:
R=R1+(1-R1)*R2*R3

Литература:

  • Малинский В.Д. и др. Испытания радиоаппаратуры, "Энергия", 1965 г.
  • ГОСТ 16503-70 - "Промышленные изделия. Номенклатура и характеристика основных показателей надежности".
  • Широков А.М. Надежность радиоэлектронных устройств, М, Высшая школа, 1972 г.
  • ГОСТ 18322-73 - "Системы технического обслуживания и ремонта техники. Термины и определения".
  • ГОСТ 13377-75 - "Надежность в технике. Термины и определения".
  • Козлов Б.А., Ушаков И.А. Справочник по расчету надежности аппаратуры радиоэлектроники и автоматики, М, Сов. Радио, 1975 г.
  • Перроте А.И., Сторчак М.А. Вопросы надежности РЭА, М, Сов. Радио, 1976 г.
  • Левин Б.Р. Теория надежности радиотехнических систем, М, Сов. Радио, 1978 г.
  • ГОСТ 16593-79 - "Электроприводы. Термины и определения".

И. Брагин 08.2003 г.

Если заметили ошибку, выделите фрагмент текста и нажмите Ctrl+Enter
ПОДЕЛИТЬСЯ: