Големи данни и прераждането на магнитната лента, Computerra
Обещаващите задачи понякога дават втори вятър на остарелите технологии. На тях се разчита винаги, когато е необходимо решение, доказано през годините. Това се случва сега с използването на касети за съхранение на големи количества данни.
Магнитната лента е използвана за първи път за съхраняване на програмен код на компютър UNIVAC през 1951 г. Активното използване на касети за съхраняване на всякаква информация продължи доскоро. Стриймър касетите остават една от най-рентабилните и надеждни опции за съхранение на архивни копия.
Магнитна лента на компютър UNIVAC (снимка: briosolutions.com).Постепенно търсенето им намалява. Това беше улеснено от появата на твърди дискове с нарастваща плътност на запис и ниска цена. До 2008 г. лентата вече се бореше да се конкурира с дисковите масиви, дори в специфични приложения.
До 2012 г. пазарът на лентови устройства намаляваше с 14% годишно и технологията вече беше психически заровена. Но по същото време в Тайланд имаше наводнение, което продължи сто седемдесет и пет дни. Сред наводнените индустриални зони бяха тези, които произвеждаха продукти за Western Digital, Seagate и Toshiba. Общият брой на произведените твърди дискове в света е намалял с една четвърт. Цените им скочиха до 60%, а качеството на изработка падна.
Приблизително по същото време бяха стартирани редица дългосрочни научни проекти, генериращи огромно количество данни. Ако е по-удобно да ги обработвате на масиви от RAM или флаш памет (IMDG / SSD), тогава оптималният метод за съхранение се определя от надеждността и ниската цена. Нямаше толкова много възможности за организиране на последното.
НовЕксперименти на CERN в LHC, изследвания в областта на генетиката и радиоастрономията - всичко това изискваше ново търсене на оптимални начини за съхраняване на информация. Така магнитната лента получи втори живот.
Проектът SKA сам ще генерира повече трафик на дневна база от общото количество трафик в Интернет (Изображение: SPDO/Swinburne Astronomy Productions).Алберто Пейс, ръководител на обработката и съхранението на данни в CERN, отбелязва, че днешните роботизирани лентови библиотеки имат четири предимства пред масивите с твърд диск.
Първият от тях (достатъчно странно) е скоростта. Да, може да отнеме на робот до секунди, за да избере желаната касета от архива и да я постави в четеца. Тогава обаче линейното четене е четири пъти по-бързо, отколкото от мрежови дискови хранилища.
Второто е надеждността. Ако магнитната лента се счупи, тя може просто да бъде залепена за няколко секунди. В този случай стотици мегабайти данни ще бъдат загубени, но повечето от тях могат да бъдат автоматично възстановени поради излишък. Когато един твърд диск се повреди, често всички терабайти данни на него се губят завинаги.
На конкретни фигури изглежда по-ясно. Общото количество данни на CERN днес надхвърля 50 PB. Над сто терабайта от тях се губят всяка година поради повреда на твърдия диск (случва се някой RAID масив да бъде напълно унищожен). По-малко от гигабайт на година се губи поради повредени магнитни ленти.
Лентово съхранение на данни в CERN (снимка: hardware.slashdot.org).Третото е минималната консумация на енергия поради съхранение в неактивно състояние. Лентата се изтегля през главите само за операции за четене/запис и през повечето време е такавътре в касетата. Следователно лентовите устройства са десет пъти по-икономични от масивите с твърди дискове при продължителна работа.
Четвърто е сигурността. Случайно или злонамерено можете да изтриете всички данни от твърдите дискове за няколко минути. Операторът просто няма да има време да забележи и спре процеса, а възстановяването ще изисква същото количество празни твърди дискове. Пълното изтриване на всички ленти би отнело месеци и затова е почти невъзможно да се направи тайно.
Служителите на изследователската лаборатория на IBM в Цюрих посочват още две важни разлики. В момента средната цена на гигабайт е четири цента за касети и десет цента за твърди дискове. Освен това гарантираното време за съхранение на касетите е шест пъти по-дълго.
Касетата за лентово устройство е пасивно устройство. Магнитната лента, която лежи в архива, се унищожава много бавно. При подходящи условия на съхранение той остава четим дори след тридесет години. Твърдият диск е много по-сложен. Дизайнът му е проектиран за периодична или дори денонощна работа. Дългият престой в неактивно състояние води до неизправност на механичната му част. В диск, който е лежал повече от пет години, моторът на шпиндела може да задръсти при първото стартиране.
Поддръжка на системата StorageTek (снимка: bnl.gov).Разбира се, има и достатъчно недостатъци за лентовите устройства. Роботизираното съхранение изисква поддръжка и поради краткото време за произволен достъп такива системи никога няма да станат доминираща (и още повече - единствена) опция. Но касетите все още заемат важно място в йерархичната структура на съхранението на информация.
„Големите данни“ вече се сблъскват не само в науката. Те проникват във всички сфери на живота и то активноинтегрирани в съвременните бизнес процеси. Според доклад на Андрю Леунг от Калифорнийския държавен университет, около 90% от информацията във всяко предприятие остарява след няколко месеца. Тези данни все още са ценни, но е малко вероятно да са необходими в близко бъдеще. Магнитната лента е идеална за архивирането им.
Касета Sony LTX2500G (снимка: itdevicesonline.com).Съвременните стример касети имат капацитет над шест терабайта при използване на максималното съотношение на компресия, но това все още не е достатъчно. Fujifilm създаде прототип на 35TB касета преди две години. Сега компанията работи върху начини за увеличаване на обема на една касета до сто терабайта.