Методи за оценка на количеството информация - Студопедия

Както за характеристиките на веществото, така и за характеристиките на информацията има мерни единици, което позволява на определена част от информацията да се присвоят номера -количествени характеристики на информацията.

Към днешна дата следнитеметоди за измерване на информация са най-известни:

Обемът е най-простият и груб начин за измерване на информация. Естествено е съответната количествена оценка на информацията да се нарече обем информация.

Количеството информация в съобщението е броят знаци (цифри) в съобщението.

Защото, например, едно и също число може да бъде написано по много различни начини (използвайки различни азбуки):

тогава този метод съответства на формата на представяне (запис) на съобщението.

В различните бройни системи една цифра има различно тегло и единицата данни се променя съответно:

В двоичната бройна система мерната единица е бит (знаци 0 и 1).Имайте предвид, че създателите на компютри предпочитат двоичната бройна система, защото най-лесно е да се реализират две противоположни физически състояния в едно техническо устройство: някакъв физически елемент, който има две различни състояния: намагнитване в две противоположни посоки; устройство, което пропуска или не електрически ток; кондензатор, зареден или незареден и др. В един компютърbit е най-малката възможна единица информация. Количеството информация, записана в двоични знаци в паметта на компютъра или на външен носител за съхранение, се изчислява просто от броя на двоичните знаци, необходими за такъв запис. В този случай, по-специално, нецелият брой битове е невъзможен (за разлика от вероятностния подход).

Завъведена използваемост и по-големи от битови единици за количество информация: 1 байт = 8 бита

1KB = 1024 байта

1024 килобайта - мегабайта (MB)

1024 мегабайта е гигабайт (GB).

В десетичната бройна система мерната единица е dit (десетичен знак)

Пример: Двоично съобщение 1011110112=8 бита=1 байт

Десетично съобщение 275903 = 6 dit

Ентропийният подход към измерването на информацията е приет в теорията на информацията и кодирането. Този метод на измерване идва от следния модел. Получателят на информация (съобщение) има определени идеи за възможното настъпване на определени събития. Тези представи обикновено са ненадеждни и се изразяват чрез вероятностите, с които той очаква това или онова събитие. Общата мярка за несигурност (ентропия) се характеризира с известна математическа зависимост от съвкупността от тези вероятности.

K.Shannon въвежда концепцията заентропия - количествена мярка за информация, като мярка за несигурността на състоянието на обект или определена ситуация с краен брой резултати. В статистическата теория основното внимание се обръща на разпределението на вероятността за възникване на отделни събития и изграждането въз основа на него на обобщени характеристики, които позволяват да се оцени количеството информация в едно събитие или в тяхната съвкупност.

По този начин,статистическата количествена мярка на информацията е мярка за несигурността на системата, отстранена в процеса на получаване на информация. Количеството информация зависи от закона за разпределение на състоянието на системата.

Семантичният подход се основава на ценността на информацията. Терминът "семантика" исторически се използва в металогиците и семиотиките. В металогията семантиката се разбира като набор от правила за съответствие между формалнитеизрази и тяхното тълкуване (интерпретация). Семиотиката се разбира като комплекс от научни теории, които изучават свойствата на знаковите системи, т.е. системи от конкретни или абстрактни обекти, всеки от които има някаква стойност, свързана с него. Примери за жестови системи са естествени езици и изкуствени езици: алгоритмични езици, езици за програмиране, информационни езици и т.н. Като цяло, терминът "жестови езици" означава всички устройства, считани за "черни кутии". В компютърните науки езиците от различни нива заемат все по-голямо място.

Семантичната теория оценява съдържателния аспект на информацията, семантичният подход се основава на анализа на нейната стойност. Ценността на информацията е свързана с времето, защото с течение на времето тя остарява и нейната стойност, а оттам и „количеството” намалява.

Семантичният подход е от особено значение при използване на информация за управление, т.к количеството информация е тясно свързано с ефективността на управлението в системата.

Структурният подход разглежда изграждането на информационни масиви, което е от особено значение при съхраняването на информация. Компютрите се превърнаха в универсално средство както за оперативно, така и за дългосрочно съхранение на различна информация. Оценяването на количеството информация от гледна точка на структурния подход се оказва изключително плодотворно, тъй като някои "рангови" структурни единици се приемат като информационни единици: детайли - логически неделими елементи на документацията, които описват определени свойства на обект (детайли - бази, които определят числови данни: тегло, количество, цена, номер, година, детайли - знаци: фамилия, цвят, марка), записи, информационни масиви, комплекси от информационни масиви, информационна база, база данни .

Структурен подход къмОценката на количеството информация сега става все по-важна, тъй като е необходимо да се оцени непрекъснато нарастващото количество съхранявана информация.

По този начин статистическата количествена характеристика на информацията е мярка за несигурността на системата, отстранена в процеса на получаване на информация. Количеството информация зависи от закона за разпределение на състоянията на системата.

В зависимост от вида на обработваната информация (типа на съобщенията) компютрите и устройствата се делят на два основни класа: аналогови (непрекъснати) и цифрови (дискретни).

Аналоговите компютри (AVM) работят с информация, представена под формата на непрекъснати промени в някои физически величини (ток, напрежение, ъгъл на въртене, скорост на тялото и др.). Използвайки факта, че много явления в природата, обществото и технологията се описват математически с едни и същи уравнения, AVM обикновено са предназначени за решаване на определен клас проблеми.

Обект на предаване и трансформиране в цифровите компютри (компютри) са дискретни съобщения, както беше отбелязано по-горе, формирани от различни последователности от елементи. Елементите (цифри, букви, математически символи, цветове на сигнални лампи и др.), които изграждат дискретни съобщения, се наричат ​​символи. Фиксиран краен набор от знаци съставлява азбуката, а броят на знаците в азбуката е размерът на азбуката.

Принципите за количествена оценка на информацията, основани на ентропийната функция, заложени от К. Шанън, запазват своето значение и до днес и са полезни при определяне на информационното съдържание на символи и съобщения.

Не намерихте това, което търсихте? Използвайте търсачката: