Търсачка - Голяма енциклопедия на нефта и газа, статия, страница 1
търсачка
Търсачката преминава през индексната база данни, съставя списък от страници, които отговарят на заявката (по-конкретно, списък с връзки към тези страници) и го връща на уеб сървъра. [1]
Търсачките непрекъснато автоматично обхождат мрежата, за да попълнят своите бази данни с документи. Обикновено това не изисква никакви усилия от страна на човека. Мрежовият агент - автоматичен робот (паяк) заобикаля всички зададени му уеб сървъри и събира индекс - информация какво на коя страница е намерено. Но индексирането се извършва чисто формално, проверява се наличието на определени ключови думи в текстовете на документите и се правят изводи по същество от тези понякога случайни съвпадения. Следователно не се извършва смислена класификация в търсачките. Такива системи често се наричат индексатори. Търсачките често използват фрагменти от класификатори, заимствани от каталози за търсене, тъй като последните извършват по-смислен подбор на информация. [2]
Търсачките Open Text Index, AltaVista, Yahoo, Lycos и други са мощни системи за извличане на информация, хоствани на сървъри със свободен достъп, чиито специални програми непрекъснато автоматично сканират уеб информация въз основа на определени алгоритми, индексиращи документи. Впоследствие търсачките предоставят на потребителя, въз основа на създадените бази данни, достъп до информация, разпределена по възлите на мрежата чрез изпълнение на заявка за търсене в рамките на техния собствен интерфейс. [4]
Овладяването на интерфейса на търсачката AltaVista е отлична основа за работа с други търсачки. [5]
Обикновено търсачкитепредоставя интерфейс от тип меню, с който потребителят може да състави заявка за търсене на информация, използвайки ключови думи и/или фрази и И-ИЛИ-НЕ логически връзки. Повечето търсачки намират огромен брой подходящи страници за заявката на потребителя. Всеки намерен документ обикновено се класира според степента на корелация със заявката. Уместността на всеки документ се оценява с помощта на различни технологии, като например вземане под внимание на честотата на появяване на думите за търсене на страницата. Някои търсачки използват и други фактори в допълнение, като например честотата, с която се посещава дадена страница и/или близостта на думите за търсене един до друг. [7]
Най-известната търсачка е Alta Vista ( www. [8]
По време на процеса на сканиране търсачката трябва да получи достъп до ресурсите на мрежата, естествено такъв достъп се осъществява в рамките на един от протоколите на приложния слой. В тази връзка е обичайно да се прави разлика между търсачките по област на сканиране, на първо място, това са уеб хипертекстови бази данни, световни космически ресурси GopherSpace, FTP архиви. [9]
За WWW най-характерни са търсачките и директориите за търсене. [10]
Освен това много WWW търсачки ви позволяват предварително да посочите в заявката за търсене текстовото поле, в което трябва да се появи дадения термин. [единадесет]
Процесът на управление с помощта на търсачките се осъществява в резултат на търсене на оптимума въз основа на съществуващия критерий за постигане на крайната цел. [12]
Директориите, за разлика от търсачките, попълват информацията си по инициатива на човек. Добавената страница трябва да бъде стриктно обвързана с приетите в каталога тематични раздели. Каталогът е колекция от връзки към множество уеб-страници и сайтове. Каталогът, като правило, се съставя, поддържа и поддържа от специалисти от различни профили, които по искане на собствениците на сайтове или независимо попълват списъка с връзки и съставят прегледи на уеб страници, съдържащи кратко описание на информационния ресурс, него. Каталозите често се наричат класификатори, защото са йерархични структури, където всички информационни ресурси са класифицирани по теми. [13]
Разбира се, достъпът до търсачката ще отнеме известно време, но когато изобщо няма работа с избрания сървър или отнема чаена лъжичка на час, а GetRight намира заместител за него, макар и за няколко минути, това е страхотно. [15]