ТЪРСЕНЕ НА ИНФОРМАЦИЯ В БАЗИ ДАННИ
ТЪРСЕНЕ НА ИНФОРМАЦИЯ В БАЗИ ДАННИ
Процедурата за търсене е една от централните процедури в системите за автоматична обработка на информация. При решаване на всеки проблем е необходимо да изберете първоначалните данни от някои предварително подготвени масиви от информация и да запишете резултатите от решението в тези или други масиви. Най-рационалният подход за организиране на информационни масиви при решаване на изчислителни задачи е концепцията за банки и бази данни. Най-сериозно внимание заслужават проблемите на търсенето на информация във формализирани бази данни. Търсенето на информация в базите данни е процес на избор от тях на набор от описания на обекти, които отговарят на условията, формулирани в заявката. В същото време не всички характеристики на обекти, а само част от тях могат да бъдат показани като резултати от търсенето, в съответствие с условията на заявката. Обект може да бъде избран от масива чрез стойността на една идентифицираща (ключова) характеристика или чрез комбинация от стойности на няколко ключови характеристики. Той може да бъде избран и чрез комбинация от всякакви други (неключови) характеристики, ако тази комбинация го избира уникално от набора от всички обекти на масива.
Важен методологичен проблем на приложната компютърна лингвистика е правилната оценка на необходимата корелация между декларативните и процедурните компоненти на системите за автоматична обработка на текстова информация. На какво да дадете предпочитание: мощни изчислителни процедури, базирани на сравнително малки речникови системи с богата граматична и семантична информация, или мощен декларативен компонент с относително прости процедурни инструменти. И изразиха мнение, че вторият начин е за предпочитане. Можем да си представим краен случай на такова предпочитание, когато езиков проблем се решава чрез създаванеголям речник и търсете в този речник необходимата информация. По-реалистична ситуация обаче е, когато проблемът се решава чрез последователно търсене в малък брой достатъчно представителни речници и извършване на прости процедури за трансформиране на резултатите от търсенето.
Ще разграничаваме първични и производни (по-специално обобщени) характеристики на обектите. Първичните признаци се задават при първоначалното описание на обектите, а производните са функции на първичните. Търсенето може да се извърши както по първични, така и по производни признаци. Най-често в процеса на търсене на информация се избира не един обект, а много обекти. Може да се специфицира по различни начини: 1) чрез списък със стойности на ключови характеристики или комбинации от ключови характеристики; 2) стойност или интервал (списък) от стойности на една неключова характеристика; 3) Булева функция на стойности или интервали (списъци) със стойности на всякакви характеристики на обекта (както ключови, така и неключови); 4) връзката между характеристиките, изразена с помощта на аритметични и логически операции (операции като „И“, „ИЛИ“, „НЕ“), както и отношения =, >,