Аннотация: Рассматриваются два вида средств поддержания высокой доступности: обеспечение отказоустойчивости (нейтрализация отказов, живучесть) и обеспечение безопасного и быстрого восстановления после отказов (обслуживаемость).
Информационная система предоставляет своим пользователям определенный набор услуг (сервисов). Говорят, что обеспечен нужный уровень доступности этих сервисов, если следующие показатели находятся в заданных пределах:
В сущности, требуется, чтобы информационная система почти всегда работала с нужной эффективностью. Для некоторых критически важных систем (например, систем управления) время недоступности должно быть нулевым, без всяких "почти". В таком случае говорят о вероятности возникновения ситуации недоступности и требуют, чтобы эта вероятность не превышала заданной величины. Для решения данной задачи создавались и создаются специальные отказоустойчивые системы , стоимость которых, как правило, весьма высока.
К подавляющему большинству коммерческих систем предъявляются менее жесткие требования, однако современная деловая жизнь и здесь накладывает достаточно суровые ограничения, когда число обслуживаемых пользователей может измеряться тысячами, время ответа не должно превышать нескольких секунд, а время недоступности – нескольких часов в год.
Задачу обеспечения высокой доступности необходимо решать для современных конфигураций, построенных в технологии клиент/сервер. Это означает, что в защите нуждается вся цепочка – от пользователей (возможно, удаленных) до критически важных серверов (в том числе серверов безопасности).
Основные угрозы доступности были рассмотрены нами ранее.
В соответствии с ГОСТ 27.002, под отказом понимается событие, которое заключается в нарушении работоспособности изделия. В контексте данной работы изделие – это информационная система или ее компонент.
В простейшем случае можно считать, что отказы любого компонента составного изделия ведут к общему отказу , а распределение отказов во времени представляет собой простой пуассоновский поток событий. В таком случае вводят понятие интенсивности отказов и , которые связаны между собой соотношением
где – номер компонента,
– интенсивность отказов ,
– .
Интенсивности отказов независимых компонентов складываются:
а среднее время наработки на отказ для составного изделия задается соотношением
Уже эти простейшие выкладки показывают, что если существует компонент, интенсивность отказов которого много больше, чем у остальных, то именно он определяет среднее время наработки на отказ всей информационной системы. Это является теоретическим обоснованием принципа первоочередного укрепления самого слабого звена .
Пуассоновская модель позволяет обосновать еще одно очень важное положение, состоящее в том, что эмпирический подход к построению систем высокой доступности не может быть реализован за приемлемое время. При традиционном цикле тестирования/отладки программной системы по оптимистическим оценкам каждое исправление ошибки приводит к экспоненциальному убыванию (примерно на половину десятичного порядка) интенсивности отказов . Отсюда следует, что для того, чтобы на опыте убедиться в достижении необходимого уровня доступности, независимо от применяемой технологии тестирования и отладки, придется потратить время, практически равное среднему времени наработки на отказ . Например, для достижения среднего времени наработки на отказ 10 5 часов потребуется более 10 4,5 часов, что составляет более трех лет. Значит, нужны иные методы построения систем высокой доступности , методы, эффективность которых доказана аналитически или практически за более чем пятьдесят лет развития вычислительной техники и программирования.
Пуассоновская модель применима в тех случаях, когда информационная система содержит одиночные точки отказа , то есть компоненты, выход которых из строя ведет к отказу всей системы. Для исследования систем с резервированием применяется иной формализм .
В соответствии с постановкой задачи будем считать, что существует количественная мера эффективности предоставляемых изделием информационных услуг. В таком случае вводятся понятия показателей эффективности отдельных элементов и эффективности функционирования всей сложной системы.
В качестве меры доступности можно принять вероятность приемлемости эффективности услуг, предоставляемых информационной системой, на всем протяжении рассматриваемого отрезка времени. Чем большим запасом эффективности располагает система, тем выше ее доступность.
При наличии избыточности в конфигурации системы вероятность того, что в рассматриваемый промежуток времени эффективность информационных сервисов не опустится ниже допустимого предела, зависит не только от вероятности отказа компонентов, но и от времени, в течение которого они остаются неработоспособными, поскольку при этом суммарная эффективность падает, и каждый следующий отказ может стать фатальным. Чтобы максимально увеличить доступность системы, необходимо минимизировать время неработоспособности каждого компонента. Кроме того, следует учитывать, что, вообще говоря, ремонтные работы могут потребовать понижения эффективности или даже временного отключения работоспособных компонентов; такого рода влияние также необходимо минимизировать.
Несколько терминологических замечаний. Обычно в литературе по теории надежности вместо доступности говорят о готовности (в том числе о высокой готовности ). Мы предпочли термин "доступность", чтобы подчеркнуть, что информационный сервис должен быть не просто "готов" сам по себе, но доступен для своих пользователей в условиях, когда ситуации недоступности могут вызываться причинами, на первый взгляд не имеющими прямого отношения к сервису (пример – отсутствие консультационного обслуживания).
Далее, вместо времени недоступности обычно говорят о коэффициенте готовности . Нам хотелось обратить внимание на два показателя – длительность однократного простоя и суммарную продолжительность простоев, поэтому мы предпочли термин " время недоступности " как более емкий.
Основой мер повышения доступности является применение структурированного подхода, нашедшего воплощение в объектно-ориентированной методологии. Структуризация необходима по отношению ко всем аспектам и составным частям информационной системы – от архитектуры до административных баз данных, на всех этапах ее жизненного цикла – от инициации до выведения из эксплуатации. Структуризация , важная сама по себе, является одновременно необходимым условием практической реализуемости прочих мер повышения доступности. Только маленькие системы можно строить и эксплуатировать как угодно. У больших систем свои законы, которые, как мы уже указывали, программисты впервые осознали более 30 лет назад.
При разработке мер обеспечения высокой доступности
Наиболее удобным для аналитического описания является так называемый экспоненциальный (или показательный) закон надежности, который выражается формулой
где - постоянный параметр.
График экспоненциального закона надежности показан на рис. 7.10. Для этого закона функция распределения времени безотказной работы имеет вид
а плотность
Это есть уже известный нам показательный закон распределения, по которому распределено расстояние между соседними событиями в простейшем потоке с интенсивностью (см. § 4 гл. 4).
При рассмотрении вопросов надежности часто бывает удобно представлять себе дело так, словно на элемент действует простейший поток отказов с интенсивностью Я; элемент отказывает в момент, когда приходит первое событие этого потока.
Образ «потока отказов» приобретает реальный смысл, если отказавший элемент немедленно заменяется новым (восстанавливается).
Последовательность случайных моментов времени, в которые проис ходят отказы (рис. 7.11), представляет собой простейший поток событии, а интервалы между событиями - независимые случайные величины, распределенные по показательному закону (3,3),
Понятие «интенсивности отказов» может быть введено не только для экспоненциального, но и для любого другого закона надежности о плотностью вся разница будет в том, что при неэкспоненциальном законе интенсивность отказов Я будет уже не постоянной величиной, а переменной.
Интенсивностью (или иначе «опасностью») отказов называется отношение плотности распределения времени безотказной работы элемента к его надежности:
Поясним физический смысл этой характеристики. Пусть одновременно испытывается большое число N однородных элементов, каждый - до момента своего отказа. Обозначим - число элементов, оказавшихся исправными к моменту , как и и раньше, - число элементов, отказавших на малом участке времени На единицу времени придется среднее число отказов
Разделим эту величину не на общее число испытываемых элементов N, а на число исправных к моменту t элементов . Нетрудно убедиться, что при большом N это отношение будет приближенно равно интенсивности отказов
Действительно, при большом N
Но согласно формуле (2.6)
В работах по надежности приближенное выражение (3.5) часто рассматривают как определение интенсивности отказов, т. е. определяют ее как среднее число отказов в единицу времени, приходящееся на один работающий элемент.
Характеристике можно дать еще одно истолкование: это есть условная плотность вероятности отказа элемента в данный момент времени t, при условии, что до момента t он работал безотказно. Действительно, рассмотрим элемент вероятности - вероятность того, что за время элемент перейдет из состояния «работает» в состояние «не работает», при условии, что до момента t он работал. В самом деле, безусловная вероятность отказа элемента на участке равна Это - вероятность совмещения двух событий:
А - элемент работал исправно до момента
В - элемент отказал на участке времени По правилу умножения вероятностей:
Учитывая, что получим:
а величина есть не что иное, как условная плотность вероятности перехода из состояния «работает» в состояние «отказал» для момента t.
Если известна интенсивность отказов , то можно выразить через нее надежность Учитывая, что запишем формулу (3.4) в виде:
Интегрируя, получим:
Таким образом надежность выражается через интенсивность отказов.
В частном случае, когда , формула (3.6) дает:
т. е. уже известный нам экспоненциальный закон надежности.
Пользуясь образом «потока отказов», можно истолковать не только формулу (3.7), но и более общую формулу (3.6). Представим себе (совершенно условно!), что на элемент с произвольным законом надежности действует поток отказов с переменной интенсивностью Тогда формула (3.6) для выражает вероятность того, что на участке времени (0, t) не появится ни одного отказа.
Таким образом, как при экспоненциальном, так и при любом другом законе надежности работу элемента, начиная с момента включения можно представлять себе так, что на элемент действует пуассоновский поток отказов; для экспоненциального закона надежности это будет поток с постоянной интенсивностью , а для неэкспоненциального - с переменной интенсивностью
Заметим, что этот образ годится только в том случае, когда отказавший элемент не заменяется новым. Если, как мы это делали раньше, немедленно заменять отказавший элемент новым, поток отказов уже не будет пуассоновским. Действительно, интенсивность его будет зависеть не просто от времени t, протекшего с начала всего процесса, а и от времени , протекшего со случайного момента включения именно данного элемента; значит, поток событий имеет последействие и пуассоновским не является.
Если же на протяжении всего исследуемого процесса данный элемент не заменяется и может отказать не более одного раза, то при описании процесса, зависящего от его функционирования, можно пользоваться схемой марковского случайного процесса, но при переменной, а не постоянной интенсивности потока отказов.
Если неэкспоненциальный закон надежности сравнительно мало отличается от экспоненциального, то можно, в целях упрощения, приближенно заменить его экспоненциальным (рис. 7.12). Параметр этого закона выбирается так, чтобы сохранить неизменным математическое ожидание времени безотказной работы, равное, как мы знаем, площади, ограниченной кривой и осями координат. Для этого нужно положить параметр показательного закона равным
где - площадь, ограниченная кривой надежности
Таким образом, если мы хотим характеризовать надежность элемента некоторой средней интенсивностью отказов, нужно в качестве этой интенсивности взять величину, обратную среднему времени безотказной работы элемента.
Выше мы определяли величину t как площадь, ограниченную кривой Однако, если требуется знать только среднее время безотказной работы элемента, проще найти его непосредственно по статистическому материалу как среднее арифметическое всех наблюденных значений случайной величины Т - времени работы элемента до его отказа. Такой способ может быть применен и в случае, когда число опытов невелико и не позволяет достаточно точно построить кривую
Пример 1. Надежность элемента убывает со временем по линейному закону (рис. 7.13). Найти интенсивность отказов и среднее время безотказной работы элемента
Решение. По формуле (3.4) на участке ) имеем:
Согласно заданному закону надежности 4
Надежность – это свойство изделий выполнять требуемые функции, сохраняя свои эксплуатационные показатели в заданных пределах в течение требуемого промежутка времени.
Живучесть - способность вычислительной системы выполнять свои основные функции, несмотря на полученные повреждения и вышедшие из строя элементы аппаратуры.
К надежности и живучести БУВМ и БЦВС предъявляются более жесткие требования, чем к надежности и живучести универсальных и персональных ЭВМ. При отказе БЦВМ нарушается работоспособность системы, и не выполняются поставленные задачи, что может привести к непоправимым последствиям, в том числе и к человеческим жертвам.
Повторное решение задачи после восстановления БЦВМ и БЦВС часто невозможно. Так, например, при сбое в работе БЦВС зенитно-ракетного комплекса будет уничтожен обороняемый объект. И, если вы в короткий срок восстановите работу системы, то разрушения не удастся вернуть так же, как и потерянные жизни. Сбой в авионике может привести к крушению самолета или самопроизвольному сходу ракет. В этом случае восстановление работы БЦВС так же не позволит исправить последствия ошибки.
Обеспечение высокой надежности и живучести БЦВС усложняется условиями работы аппаратуры на борту при больших колебаниях температуры, влажности, действии механических нагрузок и в условии высокой запыленности. Так же ограничение накладывается на габариты и массу аппаратуры. Это в основном относится к авиации, но так же большое значение имеет и для БЦВС других направлений.
Таким образом, проблема надежности и живучести БЦВМ и БЦВС имеет ряд особенностей, обусловленных своеобразием структуры БЦВМ и характером выполняемых ими функций.
Задача обеспечения в сложной системе высокой надежности и живучести может оказаться весьма дорогостоящей, сложной и требующей больших затрат времени, хотя затруднения с выпуском продукции и проблемы, возникающие во время эксплуатации, в связи с необходимостью обеспечения и поддержания требуемого уровня надежности, могут вызвать еще большие затруднения.
Например, при уменьшении надежности ракетной системы на 10% для обеспечения одной и той же степени поражения цели потребуется увеличение, по меньшей мере, на 10% фактического количества боевых ракет. Для этих ракет нужны дополнительные пусковые площадки, испытательная аппаратура, оборудование для пуска, обслуживающий персонал и вспомогательное оборудование, что связано с большими затратами денежных средств и времени.
Чем сложнее структура вычислительной системы, тем труднее обеспечить надежность и живучесть. Следует заметить, что большинство отказов, имевших место при пусках управляемых ракет и искусственных спутников в США, не было вызвано неисправностью какого-либо экзотического устройства, конструкция которого ускорила прогресс современного уровня техники. Напротив, многие отказы были вызваны неисправностью функциональных и конструктивных элементов ранее апробированной конструкции. Иногда элементы были изготовлены неправильно, а в других случаях имели место ошибки в работе программистов или обслуживающего персонала. Нет такой мелочи, которая была бы слишком ничтожной для того, чтобы не оказаться возможной причиной отказа. Высокие потенциальная и практически достижимая надежности в значительной степени являются результатом глубокого и пристального внимания к мелочам.
Проблема повышения надежности и отказоустойчивости свойственна не только БЦВС, но и коммерческой аппаратуре. Например, в кластере Google в среднем происходит отказ 1 компьютера в день (то есть за год аварии происходят примерно на 3% компьютеров). Конечно, за счет резервирования данных и кода эти сбои пользователям незаметны, но для программиста они являются большой проблемой.
Случай, когда вычислительная система или ее часть вышли из строя, и дальнейшая работа невозможна без ремонта - называется отказом.
Теория надежности различает 3 характерных признака отказов, которые могут быть присуще аппаратуре и проявляются без всякого воздействия со стороны людей.
1. Приработные отказы. Эти отказы происходят в течение раннего периода эксплуатации и в большинстве случаев вызваны недостатком технологии производства и дефектами при изготовлении элементов вычислительных систем. Эти отказы могут быть исключены процессом отбраковки, приработки и технологического тестирования готового изделия.
2. Дефектные или постепенные отказы. Это - отказы, возникающие из-за износа отдельных параметров или частей аппаратуры. Они характеризуются постепенным изменением параметров изделия или элементов. В начале эти отказы могут проявляется как временные сбои. Однако, по мере того, как износ возрастает, временные сбои превращаются в серьезные отказы аппаратуры. Эти отказы являются признаком старения БЦВС. Они частично могут быть устранены при правильной эксплуатации, хорошей профилактике и своевременной замене изношенных элементов аппаратуры.
3. Внезапные или катастрофические отказы. Эти отказы не могут быть устранены ни при отладке аппаратуры, ни правильным обслуживанием, ни профилактикой. Внезапные отказы возникают случайно, никто не может их предсказать, однако, они подчиняются определенным законам вероятности. Так что частота внезапных отказов в течение достаточно большого периода времени становится примерно постоянной. Это происходит в любой аппаратуре. Примером случайных отказов является обрыв или замыкание цепей. Такой отказ приводит, обычно, к тому, что на выходе устанавливается постоянно либо 0, либо 1. При возникновении случайных отказов необходимо заменять элементы, в которых они произошли. Для этого вычислительная система должна быть ремонтопригодной и позволять быстро проводить профилактические работы в полевых условиях.
В отдельную группу можно выделить перемежающиеся отказы или сбои. Под сбоем подразумевается кратковременное нарушение нормальной работы БЦВМ, при котором один или несколько ее элементов, при выполнении одной или нескольких смежных операции, дает случайный результат. После сбоя вычислительная система может нормально функционировать в течение длительного времени.
Причиной возникновения сбоев могут быть электромагнитные наводки, механические воздействия и др. Часто сбои не приводит к выходу из строя комплекса, а только изменяют ход работы программного обеспечения из-за неверного выполнения одной или нескольких команд, что может привести к катастрофическим последствиям. Отличие сбоев от отказов в том, что при обнаружении последствий от сбоя, необходимо восстанавливать не аппаратуру, а информацию, искаженную сбоем.
Рассказывая о сбоях, необходимо упомянуть о, так называемых, Шрёдинбагах. Шрёдинбаг – это ошибка, при которой вычислительная система долгое время функционирует нормально, однако, при определенных условиях, например, задании нестандартных параметров работы, возникает сбой. При анализе этого сбоя оказывается, что программное обеспечение вычислительной системы имеет принципиальную ошибку, из-за которой оно в принципе не должно было функционировать.
Шрёдинбаг может быть образован сложной комбинацией парных ошибок (когда ошибка в одном месте компенсируется ошибкой противоположного действия в другом месте). При определенном стечении обстоятельств баланс ошибок разрушается, что приводит к парализации работы.
Таким образом, для БЦВС характерно еще одно свойство, определяющее ее надежность – безошибочность или достоверность функционирования. Следовательно, надежность БЦВС – это совокупность безотказности, достоверности функционирования, живучести и ремонтопригодности.
В качестве параметров надежности применяют:
1. Интенсивность отказов –
2. Средняя наработка на отказ –
3. Вероятность безотказной работы в течение заданного времени – Р
4. Вероятность отказа – Q
Интенсивность отказов
Интенсивность отказов – это частота, с которой происходят отказы. Если аппаратура состоит из нескольких элементов, то ее интенсивность отказов равна сумме интенсивности отказов всех элементов, отказы которых приводят к неисправности оборудования.
Кривая интенсивности отказов, в зависимости от времени эксплуатации, изображена на рисунке ниже.
При начале эксплуатации (в момент времени t = 0) вводится в действие большое количество элементов. Эта совокупность элементов в начале может имеет большую интенсивность отказов, за счет дефектных образцов. Поскольку дефектные элементы отказывают один за другим, интенсивность отказов относительно быстро уменьшается в течение периода приработки и становится приблизительно постоянной к моменту нормальной эксплуатации (Т норм), когда дефектные элементы уже отказали, и были заменены на работоспособные.
Совокупность элементов, прошедших период приработки, имеет самый низкий уровень отказов, который сохраняется примерно постоянным до начала выхода из строя элементов, из-за износа (Т износа). С этого момента интенсивность отказов начинает возрастать.
Средняя наработка на отказ
Средняя наработка на отказ – это отношение общего отработанного времени к общему числу отказов. В течение периода нормальной эксплуатации, когда интенсивность отказов примерно постоянна, средняя наработка на отказ представляет собой величину обратную интенсивности отказов:
Вероятность безотказной работы.
Вероятностью безотказной работы называется вероятное или ожидаемое число устройств, которое будет безотказно функционировать в течение заданного периода времени:
Эта формула справедлива для всех устройств, которые прошли приработку, но не испытывают влияние износа. Следовательно, время t не может превышать периода нормальной эксплуатации устройств.
График, показывающий вероятность безотказной работы в зависимости от времени нормальной эксплуатации, приведен ниже:
Вероятность отказа.
Вероятность отказа – это величина обратная вероятности безотказной работы.
Номинальная интенсивность отказов.
Элементы аппаратуры проектируют так, чтобы они могла выдерживать определенные номинальные: напряжение, силу тока, температуру, вибрации, влажность и так далее. Когда аппаратура в процессе работы подвергается влиянию таких воздействий, наблюдается некая определенная интенсивность отказов. Ее называют номинальной интенсивностью отказов.
При увеличении общей рабочей нагрузи или некоторых частных нагрузок, или вредных воздействий окружающей среды сверх номинальных уровней, интенсивность отказов возрастает довольно резко по сравнению со своим номинальным значением. И наоборот, интенсивность отказов уменьшается, когда нагрузка становится ниже номинального уровня.
Например, если элемент должен работать при номинальном значении температуры 60 градусов, то путем понижения температуры, в результате применения принудительной системы охлаждения, можно снизить интенсивность отказов. Однако, если снижение температуры влечет за собой слишком большое увеличение количества элементов и веса аппаратуры, то более выгодным может оказаться выбор элементов с увеличенным номинальным значением рабочей температуры и применение их при температуре, ниже номинальной. В этом случае аппаратура может стать дешевле, а масса меньше (что принципиально при работе в летательном аппарате), чем при применении принудительной системы охлаждения.
Методы определения надежности БЦВС.
Когда проектируются и создаются новые изделия механическими, электрическими, химическими или другими измерениями, нельзя определить значение интенсивности отказов. Интенсивность отказов можно определить путем сбора статистических данных, полученных при испытании на надежность этого или аналогичных изделий.
Вероятность безотказной работы в течение любого момента времени испытаний выражается формулой:
Интенсивность отказов определяется формулой:
При измерении интенсивности отказов необходимо поддерживать постоянное число элементов, участвующих в испытании, путем замены отказавших элементов новыми.
Таким образом, для получения данных о количественных характеристиках надежности аппаратуры, необходимо изготовить специальный образец аппаратуры для испытаний на надежность. Испытания на надежность должны проводиться в условиях, соответствующих реальным условиям эксплуатации оборудования по внешним воздействиям, периодичности включения и изменения параметров питания.
Интенсивности отказов электротехнического изделия. Он характеризует как затраты на их ремонты, так и величину экономического ущерба, имеющего место в результате отказов электроизделий. Целевая функция 3 для решения указанной задачи выглядит следующим образом
Безотказность показывает свойство изделия непрерывно сохранять работоспособность в течение некоторого времени или некоторой наработки, выражающееся в вероятности безотказной работы , средней наработке до отказа, интенсивности отказов.
В общем случае интенсивность отказов может не подчиняться экспоненциальному закону распределения . Тогда указанное выражение примет вид
Тогда, если система состояла из Nu исправных элементов с интенсивностью отказов Ли каждый, и Nd некачественных элементов с интенсивностью отказа каждого Arf, начальная интенсивность отказов системы (Яс) в первый период ввода ее в действие после ремонтов равна
При качественной замене отказавших элементов интенсивность отказов системы после окончания периода приработки повышается до значения
Интенсивность отказов находится по формуле
В приведен интересный, также основанный на большом фактическом материале анализ двух групп повреждений газопроводов, носящих аварийный характер, а именно разрывов стыков газопроводов и коррозионных повреждений. Убедительно показана зависимость количества повреждений от качества производства работ, в связи с чем число отказов на газопроводах, уложенных после 1951 г., значительно ниже, чем на газопроводах более ранних лет укладки. Однако некоторые выводы статьи представляются излишне категоричными. Так, исключение из рассмотрения, т. е. приравнивание к нулю, вероятности механических повреждений газопроводов, ... так как они возникают при неправильном или небрежном производстве работ и их можно предотвратить, как и полный отказ от учета коррозионных повреждений при определении интенсивности отказов газопроводов представляются необоснованным завышением надежности газопроводов. Вероятность этих событий снижена в результате улучшения качества противокоррозионной защиты, улучшения надзора за проведением земляных работ в зоне газопровода и т. п., но все же не исключена. Спорным кажется и утверждение, что к отказу может привести только полный разрыв стыка газопровода. При частичном разрыве отказ будет характеризоваться лишь меньшей глубиной. Учитывая изложенное, а также опыт ленинградских организаций, можно принимать в расчетах величину ау на 15 -20% меньшей, чем было рекомендовано в 1966 г. . Конечно желательно, чтобы исследование этого вопроса было продолжено.
И о н и н А. А., Жила В. А. Интенсивность отказов участков газопроводов городских газовых сетей.- Газовая промышленность, 1972, № 10,. с, 20-25.
Интенсивность отказов K(t) - доля изделий, отказавших в единицу времени после данного момента, рассчитанная по отношению к числу испытываемых изделий, работоспособных в данный момент времени.
Практически интенсивность отказов оценивается по формуле
Теоретическое значение интенсивности отказов определяется по формуле
Показатель интенсивности отказов применяется только для неремонтируемых изделий.
Рис. 9. График изменения величины интенсивности отказов. | /info/35056">постоянной величины . Во II период - период нормальной эксплуатации - интенсивность отказов остается практически постоянной величиной . В III период - период интенсивного износа - интенсивность отказов резко возрастает.
Если время отказов каждого элемента подчинено экспоненциальному закону с интенсивностью отказов Ki, то- Безотказность - свойство изделия непрерывно сохранять работоспособность в течение некоторого интервала времени без вынужденных перерывов. Показателями безотказности являются , средняя наработка до первого отказа, наработка на отказ, интенсивность отказов. Уровень загрузки, с которой работают элементы машины, является одним из факторов, который следует учитывать и при анализе надежности -системы, так ак он определяет величину интенсивности отказов элементов в системе. Именно взаимодействие между прочностью элемента, с одной стороны, и уровнем нагрузки, воздействующей на элемент, с другой стороны, определяет в основном интенсивность отказов элемента. Известно, что при увеличении общей нагрузки или (некоторых частных нагрузок интенсивность отказов элемента довольно резко возрастает. Кривая на рис. 7 иллюстрирует общий характер изменения интенсивности отказов электрических и электронных элементов машин в зависимости от окружающих условий. Как видим, значение интенсивности отказов на приведенной кривой возрастает почти прямолинейно при увеличении нагрузки. Среднее время между отказами имеет непосредственное значение для организации эксплуатации оборудования, так как оно позволяет определять предполагаемую интенсивность отказов, что важно при планировании резерва, количества оборудования и обслуживающего персонала. Восстановление различных блоков машин должно проводиться с учетом среднего времени между отказами, определенного для них. Время эксплуатации Рис. 13.2. Интенсивность отказов Периодически из строя выходит огнеупорный туннель, что требует полной реконструкции печи. Эта процедура занимает 8 дней и обходится в 5800 фунтов стерлингов . Еще два дня уходят на разогрев печи до рабочей температуры, причем во второй день нужно обжигать отходы, чтобы не разрушить новый туннель. В табл. 13.2 приведена интенсивность отказов туннеля. Интенсивность отказов является удобной характеристикой надежности различных аппаратов и узлов и определяет- Проводится детальная классификация технико-экономических показателей качества изделий с целью выявления таких из них, которые в большей или меньшей мере оказывают влияние на величину потребности. Проведенный анализ показателей качества показал, что нет необходимости учитывать в расчетах все изменяющиеся показатели качества , так как многие из них практически или совсем не влияют на изменение величины потребности, или это влияние незначительное, или возможность изменения потребности находится в функции еще целого ряда факторов. Реальное влияние на изменение потребности оказывают такие из них, как производительность (объем работы) изделия безотказность и срок службы. В дальнейших исследованиях ограничимся рассмотрением только этих трех основных показателей . Следует заметить, что для различных изделий существуют различные показатели, характеризующие выбранные основные характеристики. Например, производительность и объем работы . Для турбогенераторов, сверхпроводниковых синхронных компенсаторов, коллекторных, синхронных и асинхронных электрических машин, гидрогенераторов - это номинальная мощность для безколлекторных регулируемых машин и регулируемых электроприводов - момент вращения для светотехнического оборудования - световой поток и мощность ламп для оборудования по производству оптического волокна - скорость вытяжки оптического волокна для коммутационной аппаратуры - число коммутируемых цепей для магистральных и промышленных электровозов - мощность для щеток электрических машин, вращающихся, - плотность тока для электросварочного оборудования - скорость сварки (резки) и др. Показатель безотказности изделий характеризует такие свойства изделий, как наработка на отказ, интенсивность отказов, вероятность безотказной работы , коэффициент готовности и др. И наконец, срок службы характеризуется количеством лет эксплуатации, ресурсом работы, ресурсом до капитального ремонта , межремонтным периодом. Отношение nd/nu характеризует прирост установившейся интенсивности отказов, возникающей в результате некачественной замены элементов, по сравнению с совершенной заменой. Поэтому коэффициент nd/nu называют коэффициентом приращения интенсивности отказов. Дополнительные потери, наносимые приработочными отказами, возникающими в результате некачественной замены элементов, (Пн) определяются из В теории надежности К означает интенсивность отказа. При экспоненциальном законе К= onst, т. е. не зависит от времени. Компьютерный кристалл памяти состоит из большого числа транзисторов - по два на каждый бит. Кристалл емкостью 64 Кбит содержит 128000 транзисторов, емкостью 1 Мбит - свыше 2000000. Если бы за функции памяти отвечали отдельные транзисторы, то интенсивность отказов была бы такой, что персональный компьютер просто не смог бы работать. Если из 1000000 отказывает хотя бы 1, то интенсивность отказов микросхемы с 64 Кбит памяти равнялась бы 12 %, а микросхемы с 1 Мбит памяти - 86 %. Индикатором наиболее вероятной частоты ревизий может послужить динамика интенсивности отказов в течение срока эксплуатации данного вида оборудования. Для большинства продуктов и систем она имеет вид tZ-образной кривой , как показано на рис. 13.2. Высокая частота поломок в начале эксплуатации может быть вызвана дефектными или неправильно установленными компонентами, ошибками при монтаже оборудования или неопытностью операторов. После устранения этих недочетов наблюдается период стабильно нтгзкого числа отказов. Ближе к окончанию срока эксплуатации из-за износа их частота снова растет. Снизить интенсивность поломок на начальном этапе можно путем обкатки продукта, в конце - за- |
Часть 1.
Введение
Развитие современной аппаратуры характеризуется значительным увеличением ее сложности. Усложнение обуславливает повышение гарантии своевременности и правильности решения задач.
Проблема надежности возникла в 50-х годах, когда начался процесс быстрого усложнения систем, и стали вводиться в действие новые объекты. В это время появились первые публикации, определяющие понятия и определения, относящиеся к надежности [ 1 ] и была создана методика оценки и расчета надежности устройств вероятностно-статистическими методами.
Исследование поведения аппаратуры (объекта) во время эксплуатации и оценка ее качества определяет его надежность. Термин "эксплуатация" происходит от французского слова "exploitation", что означает получение пользы или выгоды из чего-либо.
Надежность - свойство объекта выполнять заданные функции, сохраняя во времени значения установленных эксплуатационных показателей в заданных пределах.
Для количественного выражения надежности объекта и для планирования эксплуатации используются специальные характеристики - показатели надежности. Они позволяют оценивать надежность объекта или его элементов в различных условиях и на разных этапах эксплуатации.
Более подробно с показателями надежности можно ознакомиться в ГОСТ 16503-70
- "Промышленные изделия. Номенклатура и характеристика основных показателей надежности.", ГОСТ 18322-73
- "Системы технического обслуживания и ремонта техники. Термины и определения.", ГОСТ 13377-75
- "Надежность в технике. Термины и определения".
Определения
Надежность
- свойство [далее - (сво-во)] объекта [далее - (ОБ)] выполнять требуемые функции, сохраняя свои эксплуатационные показатели в течение заданного периода времени.
Надежность представляет собой комплексное сво-во, сочетающее в себе понятие работоспособности, безотказности, долговечности, ремонтопригодности и сохранности.
Работоспособность
- представляет собой состояние ОБ, при котором он способен выполнять свои функции.
Безотказность
- сво-во ОБ сохранять свою работоспособность в течение определенного времени. Событие, нарушающее работоспособность ОБ, называется отказом. Самоустраняющийся отказ называется сбоем.
Долговечность
- сво-во ОБ сохранять свою работоспособность до предельного состояния, когда его эксплуатация становится невозможной по техническим, экономическим причинам, условиям техники безопасности или необходимости капитального ремонта.
Ремонтопригодность
- определяет приспособляемость ОБ к предупреждению и обнаружению неисправностей и отказов и устранению их путем проведения ремонтов и технического обслуживания.
Сохраняемость
- сво-во ОБ непрерывно поддерживать свою работоспособность в течение и после хранения и технического обслуживания.
Основные показатели надежности
Основными качественными показателями надежности является вероятность безотказной работы, интенсивность отказов и средняя наработка до отказа.
Вероятность безотказной работы
P(t)
представляет собой вероятность того, что в пределах указанного периода времени
t
, отказ ОБ не возникнет. Этот показатель определяется отношение числа элементов ОБ, безотказно проработавших до момента времени
t
к общему числу элементов ОБ, работоспособных в начальный момент.
Интенсивность отказов
l
(t)
- это число отказов n(t)
элементов ОБ в единицу времени, отнесенное к среднему числу элементов
Nt
ОБ, работоспособных к моменту времени
D
t
:
l
(t
)=
n
(t
)/(Nt
*
D
t
)
, где
D
t
- заданный отрезок времени.
Например
: 1000 элементов ОБ работали 500 часов. За это время отказали 2 элемента. Отсюда,
l
(t
)=
n
(t
)/(Nt
*
D
t
)=2/(1000*500)=4*10 -6
1/ч, т.е. за 1 час может отказать 4-е элемента из миллиона.
Показатели интенсивности отказов комплектующих берутся на основании справочных данных [ 1, 6, 8 ]. Для примера в
приведена интенсивность отказов
l
(t)
некоторых элементов.
Наименование элемента |
Интенсивность отказов, *10 -5, 1/ч |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Резисторы |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Конденсаторы |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Трансформаторы |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Катушки индуктивности |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Коммутационные устройства |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Соединения пайкой |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Провода, кабели |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Электродвигатели |
Надежность ОБ, как системы, характеризуется потоком отказов L , численно равное сумме интенсивности отказов отдельных устройств: L = ål i По формуле рассчитывается поток отказов и отдельных устройств ОБ, состоящих, в свою очередь, из различных узлов и элементов, характеризующихся своей интенсивностью отказов. Формула справедлива для расчета потока отказов системы из n элементов в случае, когда отказ любого из них приводит к отказу всей системы в целом. Такое соединение элементов называется логически последовательным или основным. Кроме, того, существует логически параллельное соединение элементов, когда выход их строя одного из них не приводит к отказу системы в целом. Связь вероятности безотказной работы P(t) и потока отказов L определяется: P (t )= exp (- D t ) , очевидно, что 0 И
0<
P
(t
)<1
и
p
(0)=1,
а
p
(¥
)=0
Расчет надежности
|