Скрипт за улавяне на въвеждане на ботове на търсачките





Техническо задание за разработване на скрипт за записване на посещения на страници от роботи на търсачките.
Основната същност на скрипта е да покаже кога ботът за търсене е посетил всяка страница от сайта. Как изглежда според мен:
1. На всяка страница от сайта се поставя определен елемент (скрипт като брояч на посещения), който не се вижда от посетителите.
2. Този скрипт улавя записа на Yandex и Google бот от потребителски агент, всички други записи (посетители или други търсачки) се игнорират.
3. След като коригира въвеждането на бота, скриптът изпраща информация до базата данни (може MySQL) за точния час на въвеждане, с точност до минута.
4. Потребителят на скрипта (администратор или уеб администратор) създава специална страница (има две опции, или страницата трябва да има уникално име, например page-1254-bot-fixed.php, или трябва да бъде достъпна с парола за защита на информацията от външен посетител). Тази страница е вграден код, който ще покаже информацията, взета от базата данни под формата на таблица. Тоест на тази страница потребителят ще види всички резултати от посещения на страници от ботове.
Самата таблица изглежда така (вижте приложението). Той съдържа серийния номер на страницата, URL адреса на страницата (без домейн за пестене на място), колоната „Yandex“, която показва времето, когато ботът на Yandex е посетил Yandex, колоната „google“, която показва времето, когато ботът на Google е посетил всяка конкретна страница, и колоната „изтриване“, която ви позволява да премахнете страницата (реда) от списъка.
Размерът на масата е фиксиран - 900px (като на снимката). Тук също е необходимо да се осигури пагинация, на всеки 100 реда се появява нова страница.
Всички графики трябва да имат функция за подреждане, в низходящ и в низходящ ред.възходящ.
5. Съхраняване на информация в базата данни само под формата на последно посещение, тоест тя се актуализира постоянно. Ако не е имало посещение, покажете нули (00.00.00 - 00:00). Това може да се случи, ако, да речем, страницата е посетена от бота на Google, но все още не е посетена от бота на yandex.
Тук също трябва да се отбележи, че страниците в списъка се появяват, след като са били посетени от някой от ботовете. С други думи, ботът влезе в страницата - информацията отиде в базата данни и беше създаден ред с нов url и информация. Ако страницата (редът) е била изтрита по-рано, тя се създава отново с актуализирани данни.
Това е общо взето. Основни три точки (елементи)
1. Скрипт, който "хваща" въвеждането на бота на търсачката (имплементира се на всяка страница или на тези страници, които потребителят желае). 2. База данни, в която се съхранява и актуализира цялата информация. 3. Таблица за извеждане на информация в удобна за четене форма.
Ако имате въпроси - свържете се с ЛС. Искам да добавя, че е много вероятно този скрипт да бъде подобрен и допълнен, така че работата не е "еднократна".