производителност на съхранение

Статията на връзката разказва общата теория за различните нива на raid масиви (Raid1, Raid5, Raid6 и Raid10).

По-специално виждаме, че в теорията на IOPS санкциите за запис за R10 - 2, за R5 - 4 и за R6 - 6. Логично ли е да се предположи, че за MB / s наказанието ще бъде същото?

IOPS е операция за четене/запис в системата за съхранение. Пролетариите от всички страни не могат да се споразумеят за стойността на тези IOPS за различните видове дискове (7k, 10k, 15k).

Причината за това се крие във факта, че размерът на блока, с който се тества дискът, е много важен. Вземете например HP MSA500 G2 за съхранение в нашите тестове. Според HP: на два хоста на два канала, той постига производителност от 14000IOPS. Междувременно скоростта на четене в MB / s на тази система от един хост (14 SCSI) е по-ниска от седем SAS диска (тоест има наполовина по-малко дискове, а скоростта на четене с HDTune е по-висока)!

Тук предложих да познаете кой ще бъде по-бърз: 7 SAS диска или 14 SCSI 🙂

Давам дългоочаквания отговор:

Ще дам няколко обяснения: seq е последователен достъп, rand е произволен.

Бяха тествани три комплекта хардуер (физически сървър HP Proliant DL380 G5, 2Xeon 53**, 4GB RAM):

  1. Smart Array P400 PCI-E, 8 hdd 300Gb 10k, Raid6 (модел на устройството - HP DG0300FARVV - двупортови SAS устройства);
  2. Smart Array P400 PCI-E, 7 hdd 72Gb 10k, Raid6 (модел на устройство - HP DG072A8B54 - еднопортови SAS устройства);
  3. MSA500 G2 (SAN) SCSI + Smart Array 642(HBA) PCI-X, 14 твърди диска 72Gb 15k, Raid10 (модел на устройство - COMPAQ BF0728A4CB)

За чистотата на експеримента бяха направени три теста за 5 минути в IOmeter. Произволният достъп беше тестван в блокове от 8kb, последователен - 32kb. Други настройки на IOmeter:

Целеви настройки по подразбиране за работник

Брой неизпълнени IO, скорост на тестова връзка, транзакции на връзка

Максимален размер на диска, начален сектор

Времетраене = 5 минути

Както виждаме, SCSI дисковете са по-лоши от по-новите SAS дискове в операциите за последователен достъп, докато SCSI дисковете са разделени от произволен достъп 😉

Освен това, ако операциите за четене са 50% по-бързи, тогава операциите за запис са 200% по-бързи (Raid10 - сила) 😉

Въпроси повдига само блокирането на скоростта на запис за 300GB SAS дискове. Това може да се обясни отчасти с факта, че по време на тестването DFS репликацията на файловото хранилище се проведе на тези дискове.

След триумфа на R10 реших, че всичко това е добре, но е хубаво да се сравняват различни типове нападения на един и същ набор от хардуер.

В резултат на това бяха избрани HP Proliant BL460G6 и система за съхранение HP EVA4400 (8*FC300GB_15k), на която бяха създадени три 50GB луни (R1, R5, R6).

Както можем да видим от произволния достъп за запис, теорията е блестящо потвърдена. От друга страна, теорията казва, че загубата на IOPS при запис в R10 е два пъти в сравнение с четенето. Съответно, ако получим 3000 IOPS за запис, тогава трябва да получим 6000 IOPS за четене. Но фиг Хмм?

Препятствието в скоростта на последователно записване на R6 е неразбираемо. По-ниската скорост на четене на R1 също не е съвсем ясна ...

Тествах всяко подобно блокиране на скоростта и в двата теста още два пъти, за да се уверя, че няма грешка.

За да се уверя още веднъж в триумфа на теорията (и в същото време да проверя дали не се натъквам на канали, беше извършен тест за произволен запис на R1 / R5 (на 27 диска, заредени с друг товар

500IOPS четене/запис от VMware vSphere).

Резултатите са повече или по-малко предвидими: R1 - 9529, R5 - 4290.

Има добра новина - не всеки тип изтегляне се характеризира сслучаен запис, особено в такива количества. Например базите данни на MS Exchange 2007 използват произволен достъп, но само 50% от тях са записани.

В допълнение към скоростта на дисковия масив, струва си да се вземе предвид и степента на неговата надеждност и натоварване в случай на възстановяване на масива.

R1/R10 е в състояние (в оптимистичния сценарий) да преживее смъртта на половината от своите твърди дискове. В песимистичния ще бъде победен от смъртта на два диска от една двойка. Възстановяването на масива дава 35% наказание, според препоръките на MS (което е посочено в документа на връзката).

R5 оцелява след смъртта на само един диск от масива. Възстановяването удвоява наказанието (т.е. имаме нужда от два пъти повече дискове, за да не паднем в IOPS по време на повторното изграждане).

R6 оцелява след смъртта на всеки два диска, наказанието за възстановяване на масива е подобно на R5.

Тук те сравняват R10 срещу R5 - колко диска са необходими за бази данни на Exchange 2007 в CCR конфигурация. 8,9 TB на възел в R10 срещу 39 TB в R5 - какво мислите?

Ромкс обаче вече писа за това, когато предложи системите да се броят по IOPS, а не по мегабайти.

Резюме

  1. Отчитаме скоростта в MB / s само ако трябва да имаме достъп до данни последователно! Както видяхме в тестовете, наличието на кеш е напълно способно да изравни до известна степен последователното натоварване на дискове в различни типове raid масиви. Производителността при произволен достъп може да варира;
  2. Не трябва да приемате, че ако 8 диска за четене ще дадат 750 MB / s, тогава 16 диска ще дадат 1,5 GB / s. Това е погрешно както от гледна точка на архитектурата, така и от това, че производителността на кеша не се увеличава пропорционално на броя на дисковете 😉 Изглежда, че този тест (последователно четене) се натъкна на скоростта на интерфейса - FC8GBIT / s. Не забравяйте, че ефективността на последователния достъп се влияе оталгоритми и разширен кеш;
  3. Според HP, FC15k извежда 115IOPS. Познат учител от HP нарече 120 IOPS. В същото време твърд диск с EVA при тестове произвежда от 352 до 386 IOPS. Подозирам, че хората препоръчват тези номера, защото много от нас ще изберат R5/R6, а той има 100% наказание за възстановяване на масива. Съответно, за да не лети с IOPS от калкулатори / документация, е зададена подобна граница на безопасност;
  4. Скорост на диска според документацията на курса HP EVA-20MB/s. Бих обмислил 20MB/s за SATA устройство. И за SAS / FC 15k - 40 MB / s. Това е по-справедливо, отколкото да вярваме на търговците, които твърдят, че домашният SATA дава скорости от 50-60MB / s;
  5. Избираме вида на нападението за съществуващия товар. Възможно е да се записват регистрационни файлове на транзакции на R6 (благодарение на кеширащите алгоритми), но би било по-оптимално това да се направи на R1/R10;
  6. От гледна точка на надеждността не трябва да обединявате повече от 8 диска в Ra >