Как да почистя TOP Base - Почистване на TOP Base, най-добрата база за Allsubmitter в Runet
Днес и утре завършвам още едно дълбоко почистване на ТОП базата за редовно безплатно обновяване на моите клиенти. Реших да разкрия по-подробно за всички, които работят - как почиствам базата данни.
Само за да съм наясно защо отнема толкова време и какво правя, докато го правя, и може би това ще помогне на някого, когато почиства собствените си компилации.
Някои методи са измислени лично от мен, други са просто очевидни.Ако някой знае други ефективни опции за почистване, моля да сподели. )
Почиствам базата данни с помощта на Allsubmitter, но много неща се случват автоматично само на първия етап - при определяне на параметрите на сайтовете в базата данни, останалото е ръчно - отворете и вижте всеки сайт.
Средно при всяко почистване преглеждам 5-8 хиляди сайта от моята ТОП база данни.
Първият етап на почистване, най-простият и очевиден - до отговора на сървъра (HTTP код)
Избирам желаната част от базата данни, отивам в секцията „Определяне на настройките на сайта“. И избирам да проверя параметъра на http кода.Само предупреждение! Не стартирайте голям брой сайтове наведнъж. Най-добре на групи от 1-3 хиляди сайта наведнъж. В противен случай програмата може да увисне.
Дефиниране на параметри на сайта в базата данни с помощта на Allsubmitter
Основен отговор, успешен - 200. Други, вероятно грешни - 403, 404, 500, 502, 12007, 12039 и други. Със сигурност погрешно, но не е факт (виж по-долу).
Пускам го 2-3 пъти, т.к понякога се случва по някаква причина при първото откриване на грешка, когато тя не съществува.
Подравнявам сайтовете по колоната с http код и след това преглеждам всеки сайт с грешка в кода - 403, 404 и т.н.
Подравняване на базата данни на сайта чрез параметъра http код
Често можете да намерите 3 опции, когато http отпадакод 404, 403 и т.н., а сайта реално работи:
1. Сайтът работи, всичко е в идеален ред, но Allsubmitter многократно показва отговор 404
3. Сайтът, поради модернизация или за защита от досаден спам, промени страницата с формата за добавяне
По тези причини обикновено проверявам всеки сайт, който изглежда извежда грешка.
При отговор на сървъра 0, аз често го оставям такъв, какъвто е. Преди поставях незабавно в черен списък, но от опит тези сайтове често се връщат. Най-често това е временна грешка в сървъра.
Вторият етап на почистване - стартирам всички сайтове на параметъра Title
И филтрирам базата данни по стойности, които могат да съдържат фрази за грешки, затваряне за реконструкция, изтичане на хостинга и т.н.
И така, филтрирам всички сайтове с бази данни по следните стойности:
%error% %hosting% %rror% %omen% %40% %50% %10% %denied% %access% %blocked% %onnect% %.info% %.com% %.net% %service% % работи % %construct% %ccount% %Изпратете LinkWeb Directory%
Лично измислих този списък и той продължава да расте с мен.
Доста често (с отговор на сървъра 200) в заглавието можете да намерите следните стойности (примери не от моята база данни, която се почиства в момента, са взети от сайтове, които се проверяват и присъединяват):
%хостинг%
http://msk.dax.ru/php4/catalog/addeditss.phtml дава таковазаглавие - "WALLST.RU - Безплатен хостинг". Диагноза - хостингът е изтекъл или е деактивиран.
%свързване%
http://www.herpdigest.org/cgi-bin/weblinks/add.cgi,title Не може да се свърже със сървъра, connectcode=0
%construct%
http://www.audit-premier.ru/?act=s_addзаглавие Audit Premier. Обект в процес на реконструкция.
%maintenance% http://legkost.spb.ru/cat/add.php ще покажезаглавие Грешка: поддръжката на сайта е спряна – хостингът е изтекъл или е деактивиран
%ccount% http://www.phobi.net/submit.php връщазаглавие Акаунтът е спрян - хостингът е деактивиран
%40% http://polukarov.ru/kat.htmtitle Erorr Code = 404, въпреки че сървърът издава код 200. Очевидно домейнът е изтекъл.
След това преглеждам на случаен принцип всички пакети само на ръка - ако е възможно, възможно най-много сайтове.
А) Със съмнително заглавие – на английски. език в българската част, под формата на обикновено име на домейн или просто име на фирма
Б) просто различни тематични сборки - там е най-трудно да се проследят неработещите сайтове, т.к. сайтът често изглежда, че работи, но всъщност последните статии са от 2005 г. или регистрацията е временно или напълно забранена и т.н.
Е, по принцип това е всичко ) Почивах, като промених вида дейност, написах материала, връщам се по-нататък към почистването )) Кой купи - очаквайте актуализация през уикенда!
И ще се радвам на всякакви предложения за модернизация, развитие, подобряване на базата, методи за почистване и т.н.