Йерархична класификационна система
КЛАСИФИКАЦИЯ
И КОДИРАНЕ
Насоки
за самостоятелна работа
практически и лабораторни занятия
за редовни и задочни студенти
в посока 656100
Доцент в катедра „Информатика“.
O.I. Лантрати
Кандидат на техническите науки, доцент на катедра „Информатика“
И.В. Барилов
Асистент в катедра Информатика
Н.В. Тюхаева
Кандидат на техническите науки, доцент на катедра „Информатика“
G.D. Диброва
Кандидат на филологическите науки, доцент в катедра „Информатика“.
E.B. Ивушкин
Методическите указания са разработени въз основа на Държавния образователен стандарт за висше образование.
Насоките разглеждат основните въпроси на автоматизираната обработка на информация - класификацията и кодирането на информацията, предоставят обща информация за системите за класификация и методите за кодиране. Представянето на теоретичния материал е придружено с голям брой примери. Дадени са типични варианти за изпълнение на лабораторната работа.
Тази работа е предназначена за студенти, обучаващи се в посока 656100.
UDC 002.001
Ó Южнобългарска държава
Висше училище по икономика и услуги, 2001г
О.И. Лантратов, И.В. Барилов,
Н.В. Тюхаева, 2001
Съдържание
ВЪВЕДЕНИЕ
Сега повечето от операциите по обработка на данни се извършват на компютър. Структурата на изходните данни оказва решаващо влияние върху организацията на информационните масиви и скоростта на тяхната обработка.
При прехвърляне на изходните данни на машинен носител и организиране на съхранението им в компютърни устройства за съхранение, текстовите имена се заменят с кодове, т.е. от естествен език се превеждат в условен. Товапозволява, първо, да се елиминира несигурността при обработката на информация с подобни имена, и второ, да се намали значително количеството информация, която се обработва.
Пример. При осчетоводяване на мебели в голяма организация неизбежно възниква проблем с голям брой артикули, в частност бюра. Когато масите пристигнат в склада, им се присвоява името, посочено в придружаващите документи (пътни листове). В тази връзка дори еднакви маси от различни производители могат да имат различно име: „бюро с два пиедестала“; „бюро офис с две стойки”, „бюро с две стойки за шкафове” и др. Следователно на всяко новопостъпило бюро се присвоява инвентарен номер, който в случая е код.
В този случай кодовете служат като изображения за търсене на недвижими имоти в процеса на вземане на проби и обработка на данни.
Резултатите от обработката се оформят под формата на документ, където кодовете отново се заменят с текстови имена. Тъй като текстовете не претърпяват промени по време на обработката на информацията, информацията за еднозначното съответствие на имена и кодове се разпределя в специален масив - “речник”.
ТЕРМИНОЛОГИЯ
Човек не съществува изолирано, а в обществото, следователно той постоянно е във взаимодействие с различни процеси и явления. Съвкупността от тези процеси и явления може да се наречесреда.
Обектите на околната среда са свързани помежду си чрез канали за предаване на информация, по които циркулиратинформационни потоци. Информационният поток е набор отсъобщенияза всякакви свойства на обекти, за процеси, събития или за връзката между обектите на околната среда и човек. Тези съобщения определятсъщносттана явлението, коетоизразено чрез съвкупността от свойствата му.
Съобщението за същността на дадено явление носи логически пълна информация за това явление. Елементарно съобщениее набор от информация, определен от термина „индикатор“. Този термин се разбира като логическо твърдение, съдържащо количествена и качествена характеристика на показаната единица, тоест описващо явление или процес. Групата от индикатори образуваинформационен набор.
Елементите на индикатора сареквизити, всеки от които изразява определено свойство на обекта. Реквизитът не може да бъде разчленен, тъй като в този случай се губи смисълът му, така че реквизитът може да се определи катонай-простият елемент на съобщението. Според съдържанието детайлите могат да бъдат разделени на две групи:основиизнаци.
Основнитедаватколичественоописание на дадено образувание (явление, процес), изразено в определена мерна единица (m, kg, r. и др.). Техните стойности могат да бъдат само числа.
Знацитехарактеризираткачественисвойства на обект (явление, процес), времеви и пространствени координати на наблюдаваните явления и процеси.
- 8 и 15 - основни детайли,
- дата и обозначение “клас по висша математика” - реквизити-знаци.
Всеки атрибут на атрибут има краен набор от специфични стойности. Например стойността на атрибута “Дрехи” може да бъде “палто”, “рокля”, “костюм” и др., а стойността на атрибута “Спортно облекло” може да бъде “спортен костюм”, “костюм за аеробика”, “бански костюм” и др.
Стойността на този наборе ограниченаза определен период от време. Това означава, че всяко множество не е безкрайно, т.е. можете да изброите всичкивъзможните стойности на този атрибут. С течение на времето броят на възможните стойности на набор може да се увеличи или намали. Следователно, специално е уредено, че стойността на множеството е крайна точно на определен интервал от време. Това може да бъде година, месец, десетилетия и т.н., в зависимост от динамиката на въпросната система.
Списъкът със стойности на атрибути съставлява неговатаноменклатура.
КЛАСИФИКАЦИЯ
Класификацияе логическа операция, която се състои в разпределяне на елементите от разглежданото множество в подмножества (класове) въз основа на общ признак или група признаци. Всеки обект на класификация се характеризира с редица свойства. Свойството на обект, което ви позволява да установите неговата прилика или разлика с други обекти на класификацията, се наричаатрибутна класификацията.
Подредено подреждане на класифицирани елементи въз основа на установени връзки и зависимости между техните характеристики екласификационна система.
Всяка класификация се основава на разделянето на оригиналната концепция (набор) на подмножества според определени критерии. Характеристика или група от характеристики, въз основа на които оригиналният набор е разделен на подмножества, се наричабаза на разделяне. Системите за класификация се характеризират с гъвкавост, капацитет и заетост.
Гъвкавосттана класификационната система е свойството на класификационната система да позволява включването на нови класификационни групи, без да се нарушава структурата на съществуваща класификация.
Капацитетсе отнася до най-големия брой групи в дадена класификационна система.
Степента на заетостна класификацията се определя от съотношението на действителния брой класификациигрупировки в дадена класификация до капацитета на класификационната система, използвана в нея.
Класификатор- систематизиран набор от имена и кодове на класификационни групи.
Във всяка класификация е желателно да бъдат изпълнени следните изисквания:
- пълнота на покритие на обектите в разглежданата област;
- възможност за включване на нови обекти.
Във всяка държава, държава, индустрия, регионални класификатори са разработени и се използват. Така например се класифицират: индустрии, оборудване, професии, мерни единици, разходни позиции и др.
Има няколко типа класификации:йерархична, фасетиранаидескрипторна.
Йерархична класификационна система
Подйерархиясе разбира такава връзка, когато един клас е подклас на друг, като напълно обхваща първия.
Ако в една класификация всяко множество от по-висок ред съдържа непресичащи се подмножества от по-нисък ред, тогава тази класификация се наричайерархична. Понякога такава класификация се наричалинейна. Например разделението на хората на мъже и жени. Първоначалното множество - "хора" е разделено на непресичащи се подмножества: "мъже" и "жени". Тук основата на разделението е полът на лицето.
Така че, когато разделяте комплекта „Връхни дрехи“, можете да използвате само такива характеристики, които ви позволяват да формирате подгрупи (тип, тип, материал) и не можете да използвате такава характеристика като например наличието на качулка, тъй като използването на тази характеристика не осигурява разделяне на оригиналния комплект на подмножества, които не се припокриват.
Фигура 2.1 Йерархична класификационна система
Важно! В йерархичниясистема за класификация поради твърдата структура, трябва да се обърне специално внимание на избора на класификационни характеристики.
Пример. Създайте йерархична класификационна система за информационния обект „Връхни дрехи“, която ще позволи класифициране на информацията за обекта по следните класификационни признаци: вид, тип и материал на производство. Нека обобщим основните характеристики в таблица.
Таблица 2.1 - Стойности на знаците за класификация на горно облекло