MTBF - средно време между отказите

Как мога да разбера живота на твърдия диск; къде е границата на износване, при достигане на която HDD трябва спешно да се смени? На помощ идва MTBF - индикаторът за времето между отказите

Всички сме наясно, че загубата на данни може да се отрази много, много негативно на всеки от нас. За много от нас загубата на значима информация идва под формата на повреда на твърдия диск (HDD). Това могат да бъдат различни механични и електронни дефекти, които правят информацията, съхранявана на твърдия диск, нечетима. Има десетки възможни причини за този тип повреда, вариращи от логически софтуерни грешки до очевидни или фини физически повреди на HDD. Все пак не можем да не споменем, че всички устройства за съхранение имат ограничен живот.

Повечето от нас могат да назоват някои признаци, че твърдият диск е на ръба на повредата. Например, ако вашият твърд диск издава звуци - от приятно бръмчене, скърцане, това е знак, че твърдият диск е на път да "залепи перките". Освен това, ако достъпът до данни на компютъра се забави или започнат да се появяват странни действия или явления (повредени данни, лоши сектори и липсващи файлове) - всичко това са надеждни индикатори за неправилна работа на твърдия диск.

За съжаление, няма така наречените научни индикатори за идентифициране на неизправност на HDD и бъдещи повреди или повреда - въпреки че това би помогнало да се предотврати загубата на информация и да се прибегне до спешен ремонт на HDD навреме. В същото време има начини да наблюдавате различни "странни неща", случващи се с вашия лаптоп или настолен компютър. Можете също да приложите същата методология към дискови масиви занезависими дискове (RAID), чрез отдалечен център за данни.

И така, как бизнес потребителите, корпоративните потребители и личните потребители могат да предвидят кога техните твърди дискове ще достигнат ръба на здравето? Първата стъпка е да проверите оценките на производителите за живота на устройството. Тези оценки обикновено се определят като средно време между откази иливреме между откази (MTBF). Това е обща насока за твърди дискове. Какво всъщност означава това и изчислява ли се рейтингът MTBF?

Какво е средното време между отказите, т.е. приблизителен експлоатационен живот

Рейтингът MTBF означава това, което звучи. Това е средният период от време между една присъща грешка и следващата в живота на един компонент. С други думи, ако е открита повреда и след това е поправена, MTBF е число, броят часове, през които твърдият диск може да се очаква да функционира нормално, преди да се повреди отново или да бъде открита най-малката повреда.

За съжаление има разлика между показателите за MTBF и реалната продължителност на живота. Показателят MTBF има дълго и отличително родословие във военни и космически приложения. Цифрите са взети от нивата на грешки в статистически значим брой задвижващи механизми, работещи седмици или месеци наведнъж.

Проучванията показват, че като правило средното време между отказите (MTBF) в действителност има по-ниска стойност. През 2007 г. изследователи от университета Карнеги Мелън изследваха проби от 100 000 твърди диска с инсталиран MTB, при които MTBF варира от един милион до 1,5 милиона часа. Това води до годишен процент на отказ (AFR) от 0,88 процента.Това проучване обаче установи, че индексът обикновено надхвърля един процент, вариращ от 3:58 процента до 13 процента в някои системи за съхранение.

Защо MTBF е неефективна мярка за износване на HDD?

По принцип MTBF има значение само когато устройството има постоянен процент на отказ, т.е. отказите се разпределят експоненциално. Твърдите дискове са предимно механични устройства с механични повреди. Тоест механичните повреди са общо разпространени.

Ако приемем, че приложението използва голям брой твърди дискове и грешките са експоненциално разпределени, броят на грешките във всеки два интервала с еднакъв размер ще бъде еднакъв. Твърдият диск ще генерира грешки както на 100 дни, така и на 10 000 дни. Хард дисковете в реални работни условия имат различно износване. След първоначалната фаза на "детска смъртност" (когато грешките са незначителни) ще има момент във времето, когато процентът на неуспех ще се увеличи драстично. За типичните механични твърди дискове точката на износване е между 3 и 5 години непрекъсната работа.

В резултат на това, тъй като MTBF е сравнително ненадежден индикатор за здравето на твърдия диск, как иначе можем да предвидим края на живота на твърд диск или друго устройство за съхранение? След това ще обсъдим предимствата и недостатъците на използването на SMART, диагностичен инструмент, който ще ви позволи да определите кога твърдият диск е износен.