Мерни единици за капацитет на медия и обем информация

Информационни единицисе използват за измерване на различни характеристики, свързани с информацията.

Най-често измерването на информация се отнася до измерване на капацитета на компютърната памет (устройства за съхранение) и измерване на количеството данни, предадени по цифрови комуникационни канали. Рядко количеството информация се измерва.

Съдържание

Голямо количество данни може да съдържа много малко информация. Тоест,количество даннииколичество информацияса различни характеристики, използвани в различни области, свързани с информацията, но исторически името "количество информация" се използва в смисъла на "количество данни", а имената "информационна ентропия" и "стойност на информацията" се използват за измерване на количеството информация.

Единици за измерване на капацитета на носителя и обема на данните

Използват се за измерване накапацитет на носители на информация- устройства за съхранение и за измерване наобем от данни.

Единици за измерване на количество информация

Използва се за измерване наколичество информациявколичество данни. Информационна ентропия

Основната характеристика наобема от данниеброят възможни състояния.

Основната единица наобем от данние1 възможно състояние(стойност, код).

Вторичната характеристикаобем на данниецифра.

Капацитетът (обемът) на една цифра може да бъде различен и зависи от основата на прилаганата система за кодиране.

Капацитет на една цифра в двоични, троични и десетични системи за кодиране:

Една двоична цифра (бит) има 2 взаимно изключващи севъзможни състояния(стойности, кодове).

Една троична цифра (трит) има 3 взаимно изключващи севъзможни състояния(стойност, код).

Един десетичен знак (decite) има 10 взаимно изключващи севъзможни състояния(стойности, кодове).

Третичните характеристики на обема от данни са различнинабори от битове.

Капацитетътна набор от цифрие равен наброя на възможните състоянияна тозинабор от цифри, който се определя в комбинаториката, равен е на броя на поставянията с повторения и се изчислява по формулата:

Тоест капацитетътна набор от битовее експоненциална функция от броя набитоветес основа, равна наброя възможни състоянияна единбит.

Когато някои количества, включително количеството данни, са експоненциални функции, тогава в много случаи е по-удобно да се използват не самите количества, а логаритмите на тези количества.

Количеството данни може също да бъде представено логаритмично, като логаритъмот броя на възможните състояния[1] .

Количество информация (количество данни) – може да се измери логаритмично. [2] Това означава, че когато множество обекти се третират като един,броят на възможните състояниясе умножава и количеството информация се добавя. Няма значение дали говорим за случайни променливи в математиката, цифрови паметови регистри в технологиите или квантови системи във физиката.

За обеми от двоични данни е по-удобно да се използват двоични логаритми.

Най-малкото цяло число, чийто двоичен логаритъм е положително цяло число, е 2. Съответстващата му единица, бит, е основата за изчисляване на информация в цифровите технологии.

За троични обеми от данни е по-удобно да се използват троични логаритми.

Единицата, съответстваща на числото 3, трит, е равна на log23≈1,585 бита.

Такава единица като nat(nat), съответстващ на натурален логаритъм, се използва в инженерни и научни изчисления. В компютърните технологии практически не се използва, тъй като основата на естествените логаритми не е цяло число.

За обеми от десетични данни е по-удобно да се използват десетични логаритми.

Единицата, съответстваща на числото 10decitе равна на log210≈3,322 бита.

В целиброя двоични цифри(битове),броят на възможните състоянияе равен на степени на две.

Тетрада, хапка, хапка

Четири двоични цифри (4 бита) имат специално наименование - тетрада, нибъл, нибъл, които съдържат количеството информация, съдържащо се в една шестнадесетична цифра.

Измервания в байтовеGOST 8.417-2002 SI префикси IEC префиксиИме Наименование Степен Име Степен Име Символ Степен
байтб100100байтбб20
килобайтkb10 3кило-10 3кибибайтKiBKiB2 10
мегабайтMB10 6мега-10 6мебибайтMiBMiB2 20
гигабайтGB10 9гига-10 9гибибайтGiBGiB2 30
терабайттуберкулоза10 12тера-10 12тебебайтTiBтиб2 40
петабайтpb10 15пета-10 15пебибайтPiBP&B2 50
екзабайтEbyte10 18екза-10 18ексбибайтEiBЕИБ2 60
зетабайтZbyte10 21зета-10 21зебибайтZiBZiB2 70
йотабайтИбайт10 24йота-10 24yobibyteYiBY&B2 80

Следващата популярна единица информация е 8 бита, илибайта(терминологичните тънкости са описани по-долу). Всички големи количества информация, изчислени в компютърната технология, са директно дадени на байт (а не на бит).

Стойности като машинна дума и т.н., които съставляват няколко байта, почти никога не се използват катомерни единици.

За измерване на голям капацитет на устройства за съхранение и големи количества информация, които имат голям брой байтове, се използват единиците „килобайт“ = [1000] байта и „KByte“ [3] (кибибайт, kibibyte) = 1024 байта (вижте по-долу за объркването на десетични и двоични единици и термини). Този порядък е например:

  • Секторът на диска обикновено е равен на 512 байта, тоест половин KB, въпреки че за някои устройства може да бъде равен на един или два kibibytes.
  • Класическият размер на "блок" във файловите системи UNIX е един KB (1024 байта).
  • Една „страница с памет“ в процесорите x86 (започвайки с Intel 80386) е 4096 байта, тоест 4 KB.

Количеството информация, получена при четене на дискета с висока плътност "3.5", е 1440 KB (точно); други формати също се изчисляват в цяло число KB.

Единици мегабайт = 1000 килобайта = [1 000 000]байтове и "mebibyte" [3] (mebibyte) = 1024 KB = 1 048 576 байта се използват за измерване на обема на носителя за съхранение.

Капацитетът на RAM и CD-ROM се измерва в двоични единици (мебибайти, въпреки че обикновено не се наричат ​​така), но за капацитета на твърдия диск десетичните мегабайти са по-популярни.

Съвременните твърди дискове имат обеми, изразени в тези единици като поне шестцифрени числа, така че за тях се използват гигабайти.

Единиците "гигабайт" = 1000 мегабайта = [1 000 000] килобайта = [1 000 000 000] байта и "GB" [3] (гибибайт, гибибайт) = 1024 MB = 230 байта измерват размера на големи носители за съхранение като твърди дискове. Разликата между двоичните и десетичните единици вече е над 7%.

За изчисляване на още по-големи количества информация иматерабайтаитебебайта(съответно 10 12 и 2 40 байта),петабайтаипебибайта(съответно 10 15 и 2 50 байта) и т.н.

В означения катоbyte(български) илиB(английски), под байт (B) се разбират 8 бита, въпреки че самият термин „байт” не е съвсем коректен от гледна точка на теорията.

На френски се използва обозначениетоo,Ko,Moи т.н. (от думата octet), за да се подчертае, че говорим за 8 бита.

Дълго време разликата между коефициенти 1000 и 1024 се опитваше да не придава голямо значение. За да избегнете недоразумения, разграничението между:

  • двоични кратни единици, обозначени съгласно GOST 8.417-2002 като "KB", "MB", "GB" и т.н. (две в степени, кратни на десет);
  • единицикилобайта,мегабайта,гигабайтаи т.н., разбирани като научни термини (десет на степени, кратни на три),

тезиединици по дефиницияса равни съответно на 10 3 , 10 6 , 10 9 байта и т.н.

IEC предлага kibibyte, mebibyte, gibibyte и т.н. като термини за "KB", "MB", "GB" и т.н., но тези термини са критикувани, че са непроизносими и не се срещат в говоримия език.

В различните области на компютърните науки предпочитанията за използване на десетични и двоични единици също са различни. Освен това, въпреки че са минали няколко години от стандартизирането на терминологията и обозначенията, далеч не навсякъде те се стремят да изяснят точното значение на използваните единици.