Всичко в един seo pack грешка с индексиране
Здравейте приятели! Както разбирате от заглавието на статията, днес ще ви разкажа за една от най-големите грешки при индексирането на нови статии, която може да имате и ако използвате плъгина All In One Seo Pack за генериране на карта на сайта в XML формат.
Защо изобщо говорих за грешката. Факт е, че преди много време забелязах колко дубликати на страници от този вид се появяват в индекса на търсачките:
Тоест, ако има 5 изображения на страница, тогава в индекса се появяват 5 дублиращи се страници, които не съдържат съдържание, освен едно изображение и неговото описание. Ето екранна снимка на такова заснемане:
Първо си помислих, че въпросът е във файла robots.txt, тъй като регистрирах принудително индексиране на изображения в него. Но въпросът се оказа съвсем различен. Между другото, ако не знаете как да настроите robots.txt, препоръчвам ви да прочетете тази статия.
Може би дълго време не бих придавал никакво значение на това, ако не беше конкурсът, който споменах по-горе.
Минаха два дни и в търсенето на Google се появи страница за заявката „как попаднах в блогосферата“. Ще изглежда, че се е появила, но не главната страница, а нейният дубликат и цели 47 позиции. Къде другаде би имало празна страница 🙂 И това в момент, когато най-силните "състезатели" вече бяха в ТОП.
Тъкмо щях да помоля за съвет във форумите, когато си помислих, позволете ми да проверя картата на сайта. И какво мислите? Картата съдържа десетки връзки към подобни страници. Оказва се, че аз самият насочвам роботите за търсене към дубликати, защото роботите на търсачките се ръководят предимно от XML картата на сайта. И най-интересното е, че в тази карта на дубликата имаше приоритет пред главната страница.
И цялата тази калибър се оказа заради баналнотоневнимание при настройване на карта на сайта в плъгина All In One Seo Pack. Може би това се е случило при следващата актуализация, не знам.
Как да проверите дали имате такава грешка при индексирането на страници? Елементарно. Отворете настройките на XML карта на сайта.
Сега нека проверим всички настройки. Веднага трябва да кажа, че имам версия 2.2.6, ако вашата е различна, тогава настройките може да са малко по-различни.
1. Файлов префикс. Това е името на връзката, където ще бъде достъпна картата на сайта. Препоръчвам да въведете стандартната карта на сайта.
2. Уведомете Google и Bing. Това трябва да бъде отметнато. Благодарение на тази настройка, когато се появи нова статия, ще бъде изпратено известие до търсачките, което съответно ще ускори индексирането.
3. Активиране на индексите на Sitemap. Поставянето на отметка в това квадратче ще раздели картата на сайта на няколко файла. Затова в никакъв случай не правете това, ако имате по-малко от 50 000 страници.
4. Видове записи. И тук е най-грубата грешка, за която говорих от самото начало. В този раздел ние определяме връзки към кои страници трябва да присъстват в XML картата на сайта. По логиката на нещата за един блог това са публикации и страници. И веднъж маркирах всички видове записи, в резултат на което медиите започнаха да се индексират, което съответно е погрешно. Сега ще трябва да изтриете около петстотин индексирани страници от индекса на Google или да изчакате, докато той сам ги изхвърли.
Не пропускайте да проверите сами, че в секцията "Медия / Прикачени файлове" нямате отметка! Изключение правят сайтовете за галерии.
5. Таксономии. Маркирането на това квадратче изпраща връзки към категории и тагове към sitemap.xml.
7. Създайте компресирана версия на картата. За тези, които са използвали приставката Google XML Sitemap,спомня си, че трябваше да архивирам картата и да я кача в корена на сайта, а пътя до нея да напиша във файла robots.txt. В резултат на това във файла robots.txt имаше две връзки, едната от които водеше към архивираната компресирана версия на картата, а втората - към основната. Всичко е много по-умно в плъгина All In One Seo Pack. Когато робот за търсене поиска XML карта на сайта, плъгинът автоматично генерира компресирана карта и я предоставя на робота.
8. Връзка към картата от robots.txt. Не забравяйте да поставите отметка в квадратчето, ако все още я нямате. Наличието на такъв линк е предпоставка за оптимизиран блог.
9. Динамична карта на сайта. Трябва също да поставите отметка в квадратчето. В крайна сметка вие редовно актуализирате блога с нови записи, следователно вашата карта също трябва да бъде динамична.
10. Noindex Sitemap файл. С тази опция можете да деактивирате индексирането на картата на сайта. Не мога да разбера защо разработчиците изобщо са въвели тази функция. Ако сте поставили отметка тук, премахнете я незабавно!
В допълнителни настройки можете да посочите изключени страници, това са тези, които искате да забраните индексирането. Но това е по-скоро препоръка за робот, отколкото предпоставка.