Какво е лично търсене, Hostinfo

Силата на търсачките е невероятна. С тяхна помощ можете да намерите всичко - от пирон до звезда. Да не говорим за хиляди други полезни и напълно безполезни неща. Нищо чудно, че милиони ги използват. Те са много удобни, когато трябва всеки път да търсите нещо ново, което все още не сте търсили. Зададе въпрос - получи отговор. Следващият път всичко е отначало. За тези, които обичат да задават едни и същи въпроси многократно, са измислени други възможности, например запазването им в лични настройки (което е удобно в случаите, когато заявките са сложни, с многократен избор на резултати).

Но това, което българските търсачки засега не предлагат, е настройката на заявки не само за избор на резултати, но и за ограничен списък от сайтове, в които трябва да се търси. Да приемем, че знаете, че има дузина или два сайта, които най-много уважавате по определена тема. И когато търсите информация, бихте искали да се обръщате към тях всеки път, а не към целия безкраен брой сайтове в световния интернет. Разбира се, можете последователно да отидете на всеки любим сайт и да потърсите в него това, от което се нуждаете. Но е неудобно и не всеки сайт може да има вградена система за търсене.

Ограничаването на търсенето до определен състав от сайтове се предоставя от търсачката Rollyo. В него можете да създадете своя собствена подсистема за търсене с набор от сайтове, които искате да използвате, за да търсите информацията, която ви интересува. Системата Rollyo е добавка към търсачката Yahoo!, използва възможностите на своята търсачка и индексирана от нея информация и не променя принципите и правилата на нейната работа.

Комбинирайки системата за търсене и възможността за избор на сайтове за нейното внедряване, компанията "Search Technologies" предложи нова търсачка - "Personal Search". По-точно не есамо търсачка, но и система за наблюдение на сайтове и страници, които сте избрали. "Personal Search", за разлика от Rollyo, се базира на собствена търсачка. Ако сте собственик на сайта и анализирате кои търсачки го индексират, можете да отбележите името на новия "паяк" - ще бъде записано като Novoteka personal search/1.0. И когато видите следи от него на вашия сайт, знайте, че някой е добавил вашия сайт към индивидуалния си списък с индексирани сайтове.

лично

Следващият параметър е дълбочината на изпомпване: колко нива на дълбочина от входната точка ще бъде индексиран сайтът. Максималната стойност е зададена на седем нива, но винаги ли ще използвате тази дълбочина? Освен това пространството, което сте разпределили, може да приключи, преди всички страници, които попадат в задачата, да бъдат качени и индексирани. И тук е необходимо да се отбележи още един момент - честотата на преиндексиране. Може да се настрои както ежедневна актуализация на данните, така и седмична или месечна актуализация. Или не можете да актуализирате - всичко зависи от сайта източник, колко често се актуализира. По време на процеса на изтегляне страниците се съхраняват в системния кеш, така че при често преиндексиране ще се актуализират само нови, останалите ще бъдат взети от кеша. Индексът обаче ще се изгражда отново всеки път.

Ако искате при индексирането на директорията да се вземат предвид връзките, които водят извън нея, трябва да изберете опцията „Излизане извън поддиректорията“. В противен случай проследяването на външни връзки няма да се извърши. И можете да зададете повече ограничаващи или забраняващи маски. В първия случай ще бъдат индексирани само онези страници, които отговарят на зададените маски, дори ако има други страници в раздела(ограничението важи само за страници, които са подчинени на една от входните точки). Във втория случай страниците, които отговарят на маската, напротив, няма да бъдат индексирани. Второто ограничение има предимство пред първото, така че страниците, които попадат под забраната, няма да бъдат индексирани, дори ако попадат под ограничителните настройки.

След като попълните напълно въпросника, сайтът ще бъде индексиран. Времето, изразходвано за тази работа, зависи както от обема на сайта, така и от натоварването на услугата като цяло. Но засега няма голямо натоварване, така че индексирането е доста бързо (10-15 минути - и се формира индекс). След извършване на тази операция списъкът със сайтове за всеки ще покаже общия брой индексирани страници, а в случай на повторно индексиране - броя на новите. И ето какво е интересно - ако сайтът е недостъпен при следващото преиндексиране, тогава всички индексирани преди това страници ще бъдат изтрити. Може да е добре, ако сайтът вече не съществува, но недостъпността може да бъде причинена от други причини, които не са свързани със самия сайт, и тогава трябва да изчакате следващото преиндексиране, така че страниците да бъдат изтеглени и индексирани отново.

Истинският въпрос е какво ще се случи с онези сайтове, които попадат в индивидуалните списъци на различни потребители? Как ще бъдат индексирани? Първо, за втория и следващ потребител вече изтеглените страници ще бъдат взети от кеша, ако попаднат и в двете селекции. И само в случай на несъответствие, допълнителните ще бъдат изтеглени отново. Но самият индекс за всеки потребител ще бъде изграден самостоятелно.

какво

Сега за това как да използвате подготвено търсене. За какво го правишсъздадено? Вероятно за изпълнение на заявки за търсене. Затова на първо място – издирвателни действия. Това може да бъде проста опция, при която въвеждате ключова дума или фраза, или опция за разширено търсене. Когато използвате разширената опция, можете да ограничите търсенето до конкретни дати, подраздели на сайта (страници, чийто URL започва с префикса, който сте посочили), да търсите само в заглавията на страниците и т.н. Но и в двете опции можете да добавите още една настройка за търсене – дали да търсите във всички ваши сайтове, във всеки конкретен сайт или в цялата информация, съхранена във вашия акаунт.

търсене

И има още един раздел на търсачката, който вече се отнася до наблюдението на сайтове или техните страници. Това е архив. На зададени от вас интервали ще проследява появата на промените на конкретни страници на сайтовете, които ви интересуват. Например можете да проследявате появата на нови съобщения във форуми или блогове, промени в цените в онлайн магазини, обменни курсове и т.н. Процесът на проследяване се състои в съхраняване на копие на заявената страница в архива. (Това няма да запази таблици със стилове и други елементи, представени от отделни файлове, а само кода на самата страница.) Няколко версии на една и съща страница могат да бъдат запазени в архива, което ви позволява да проследявате последователността на нейните промени. При достигане на горната граница на броя на версиите, по-новата ще "избута" най-старата от архива.

лично

Остава да добавим, че тестовете на новата търсачка ще продължат още месец, след което тя ще бъде достъпна за масово ползване.