Внимателно! WordPress създава много дубликати!
Здравейте всички! Онзи ден открих грешка в WordPress, която създава безброй дублирани страници. Проблемът засяга всички, които имат сайтове на тази CMS. Да, да, любимият на много хора двигател може да създаде голям брой идентични документи.
уплашен? Не се притеснявайте =) . Грешката е наистина сериозна, но може да бъде поправена доста лесно. По-долу ще ви кажа какъв вид животно е и как да се отървете от него.
Във връзка с последните събития в Баден-Баден започнах внимателно да изучавам информацията в Yandex.Webmaster. Анализирано обобщение на индексирането („Страници в търсене“). Търсих връзка между отметките "Страница с лошо качество" и филтъра за наслагване за повторна оптимизация.
И така, влизайки в статистиката за блога, бях неприятно шокиран - стотици дубликати на несъществуващи документи.
Оказва се, че ако добавите някакви числа към която и да е публикация в блог, тогава WordPress ще създаде такава страница - тя ще бъде идентична с основната публикация. Грешка с пагиниране на отделни публикации - стотици или хиляди възможни дубликати.
На такива страници няма мета таг robots и има canonical, който указва точно дубликата като каноничен документ.
Проверете дали и вие
Ситуацията се влошава от връзката с приставката All in one SEO pack, която допълнително предоставя връзка към предишния запис: роботът за търсене не само посещава всъщност несъществуваща страница, но също така започва да следва други подобни. Стотици подобни "публикации" бяха добавени и успешни.
Започнах да копая по-дълбоко и създадох тема на wordpress.org. Оказа се, че още през 2014 г. е имало грешка при създаване на многостранични публикации с помощта на . Тогава също бяха създадени несъществуващи документи, но канонични за 2-ра, 3-та или следващи страници, напротив,винаги сочеше към първия, тоест не бяха индексирани.
Започвайки с WordPress 4.4, каноничният бъг е премахнат (всяка „страницирана“ публикация има свой собствен канон), но грешката със създаването на несъществуващи документи не е премахната. Следователно сега се индексира повече от необходимото.
Какво да направите и как да премахнете дубликати?
Първо, искам да кажа, че в една от следващите версии на WordPress ще се опитат да поправят този бъг.
Междувременно ще трябва да го премахнем с така наречените "патерици". Има 2 варианта.