Yandex за това как да определите темата на заявките за търсене, SEO пазарни новини 17 август 2017 г.
Наталия Крупенина, ръководител на отдела за външни изследвания на Yandex, разказа как да се определи темата на заявките за търсене.
В повечето случаи идентифицирането на тема е лесно. Например темата на заявката [грипни симптоми] е здраве. Една заявка може да има няколко теми: [антипиретик за деца под една година] засяга както здравето, така и децата. В някои случаи обаче дефинирането на темата става трудно. И така, заявката [снежната кралица] може да бъде за дрехи, приказка на Андерсен, филм или детска пиеса.
Темите на заявката се определят от автоматичен класификатор. Той не знае какво има предвид потребителят във всеки случай, но може да вземе предвид поведението му. Класификаторът се основава на маркирането на най-популярните сайтове. 80% от популярните сайтове успяват да определят основната тема, останалите се посещават от заявки за различни теми.
След това класификаторът прехвърля ръчното маркиране на няколко хиляди сайта на милиони сайтове в Runet. Той определя кои сайтове се посещават от заявки със същата формулировка като ръчно маркирани ресурси и задава вероятностите за теми. Колкото повече заявки съвпадат, толкова по-вероятно е сайтът да е свързан със същата тема.
Познавайки темите на сайтовете, можете да определите темите на заявките. За всяка заявка класификаторът отчита колко пъти е била посетена от сайтове с различни теми и определя съотношението на всяка тема.
Темите не трябва да се сравняват директно една с друга. Поради факта, че класификаторът се основава на маркирането на най-популярните сайтове, а не на произволни, популярните теми получават предимство. Следователно в проучванията не темите се сравняват една с друга, а интересът към всяка тема в различни раздели.