Кодиране - Термин - Енциклопедична основа

Кодирането е процес на представяне на информация под формата на код, т.е. набор от символи за представяне на информация. Човек изразява мислите си под формата на изречения, съставени от думи. Те са азбучно представяне на информацията. Основата на всеки език е азбуката - краен набор от различни знаци (символи) от всякакво естество, които съставляват съобщението. Кодирането се свежда до използването на набор от знаци по строго определени правила и има две основни значения: ■ Метод за представяне на информация във форма, приемлива и разбираема за даден обект (например компютър), ■ Метод за защита на информацията от нежелан достъп или разпространение. Възможно е да се комбинират тези функции поради универсалността на удобството и / или поради естествените особености на местоположението на група хора (езика на определен народ).

Кодирането се използва за представяне на информация в компютър. Компютърът може да обработва само информация, представена в цифрова форма. Цялата друга информация (например звуци, изображения, показания на инструменти и т.н.) трябва да се преобразува в цифрова форма за обработка на компютър. Например, за да се определи количествено музикалният звук, може да се измери интензитета на звука при определени честоти на кратки интервали, представяйки резултатите от всяко измерване в цифрова форма. С помощта на компютърни програми можете да извършвате трансформации на получената информация, например да "наслагвате" звуци от различни източници един върху друг. По подобен начин текстовата информация може да се обработва на компютър. Когато се въвежда в компютър, всяка буква се кодира с определен номер, а когато се извежда на външни устройства (екран или печат), за човешкото възприятие изображенията на буквите се изграждат с помощта на тези числа. Кореспонденциямежду набор от букви и цифри се нарича кодиране на знаци. Обикновено всички числа в компютъра се представят с нули и единици. Тоест компютрите обикновено работят в двоичната бройна система, тъй като в този случай устройствата за обработката им са много по-прости. Въвеждането на числа в компютър и извеждането им за четене от човек може да се извърши в обичайната десетична форма и всички необходими преобразувания се извършват от програми, работещи на компютър. Броителната система е набор от методи за наименуване и запис на числа. Във всяка бройна система някои знаци са избрани за представяне на числа (те се наричат числа), а останалите числа се получават в резултат на всякакви операции върху цифрите на тази бройна система. Аритметика операциите с числа във всяка позиционна бройна система се извършват по същите правила като десетичната система, тъй като всички те се основават на правилата за извършване на операции върху съответните полиноми. В този случай трябва да използвате само онези таблици за събиране и умножение, които съответстват на дадената основа P на бройната система. 1. При преобразуване на числа от десетична към основна P > 1 обикновено се използва следният алгоритъм: ако се транслира цялата част от числото, то се дели на P, след което се запомня остатъкът от делението. Полученото частно отново се дели на P, остатъкът се запомня. Процедурата продължава, докато коефициентът стане нула. Остатъците от разделянето на P се изписват в реда, обратен на тяхното получаване; ако дробната част от числото се превежда, тогава се умножава по P, след което цялата част се запомня и изхвърля. Новополучената дробна част се умножава по P и т.н. Процедурата продължава, докато дробната част стане равна нанула. Целите числа се изписват след двоичната точка в реда, в който са получени. Резултатът може да бъде или крайна, или периодична двоична дроб. Следователно, когато дробта е периодична, трябва да прекъснете умножението на някаква стъпка и да се задоволите с приблизително записване на оригиналното число в система с основа P. Превод на числа от 10-та бройна система във 2-ра, от 10-та в 8-ма, от 10-та в 16-та. 2. При преобразуване на числата от бройна система с основа P в десетична бройна система е необходимо цифрите на цялата част да се номерират отдясно наляво, като се започне от нула, а в дробната част, като се започне от цифрата непосредствено след десетичната запетая отляво надясно (първоначално число -1). След това изчислете сумата от продуктите на съответните стойности на цифрите въз основа на числовата система в степен, равна на номера на цифрата. Това е представянето на оригиналното число в десетична система.

Двоично кодиране на данни. С развитието на технологиите се появиха различни начини за кодиране на информация. През втората половина на XIX век. Американският изобретател Самюел Морз изобретил кода, който се използва и днес. Информацията се кодира от три знака: дълъг сигнал (тире), кратък сигнал (точка), без сигнал (пауза) - за разделяне на буквите Компютърната технология има своя собствена система - тя се нарича двоично кодиране и се основава на представянето на данни чрез последователност от само два знака: 0 и 1. Тези знаци се наричат двоични цифри, на английски - двоична цифра или съкратено бит (бит). Един бит може да изразява две понятия: 0 или 1 (да или не, черно или бяло, вярно или невярно и т.н.). Ако броят на битовете се увеличи до два, тогава вече могат да бъдат изразени четири различни понятия: 00 01 10 11. Три - съответно осем. Увеличаване на броя набитове в двоичната система за кодиране, броят на стойностите, които могат да бъдат изразени в тази система, се удвоява, съгласно формулата N=2 на степен m, където N е броят на независимите кодирани стойности, m е битовата дълбочина на двоичното кодиране.

Двоично кодиране на данни. Има два основни формата за представяне на числа в компютърната памет. Единият от тях се използва за кодиране на цели числа, вторият (така нареченото представяне на число във формат с плаваща запетая) се използва за задаване на определено подмножество от реални числа. Наборът от цели числа, които могат да бъдат представени в компютърната памет, е ограничен. Диапазонът от стойности зависи от размера на областта на паметта, използвана за съхраняване на числата. Една k-битова клетка може да съхранява 2k различни стойности на цели числа. За да получите вътрешното представяне на положително цяло число N, съхранено в k-битова машинна дума, трябва да преобразувате числото N в двоичната система и полученият резултат се допълва отляво с незначещи нули до k цифри. Например, за да получите вътрешното представяне на цяло число 1607 в 2-байтова клетка, трябва да преобразувате число в двоичната система: 1 60710 = 11001000111(2). Вътрешното представяне на това число в клетката ще бъде както следва: 0000 0110 0100 0111. За да напишете вътрешното представяне на отрицателно цяло число (-N), трябва да получите вътрешното представяне на положително число N, да получите кода за връщане на това число, като замените 0 с 1 и 1 с 0, и добавете 1 към полученото число. Кодирането на реално число с помощта на формат с плаваща запетая използвайте други алгоритми.

Кодиране на текст. Наборът от знаци, използвани за писане на текст, се нарича азбука. Броят на знаците в една азбука се нарича нейна кардиналност. За представяне на текстИнформацията в компютъра най-често използва азбука с капацитет 256 знака. Един знак от такава азбука носи 8 бита информация, тъй като 28 = 256. Двоичният код на всеки знак (8 бита) заема 1 байт памет на компютъра. За различните типове компютри и операционни системи се използват различни таблици за кодиране, които се различават по реда, в който азбучните знаци са поставени в таблицата за кодиране. Вече споменатата ASCII кодираща таблица е международният стандарт за персонални компютри. Принципът на последователното азбучно кодиране е, че в ASCII кодиращата таблица латинските букви (главни и малки) са подредени по азбучен ред. Цифрите също са подредени във възходящ ред. Само първите 128 знака са стандартни в тази таблица, т.е. знаци с числа от нула (двоичен код 00000000) до 127 (01111111). Това включва букви от латинската азбука, цифри, препинателни знаци, скоби и някои други символи. Останалите 128 кода, започващи с 128 (двоичен код 10000000) и завършващи с 255 (11111111), се използват за кодиране на букви от национални азбуки, псевдографика и научни символи.