Дублирано съдържание
Дублираното съдържание на сайта често може да се появи без ваше знание. Какво трябва да се проверява и как да се предотврати?
1 ноември 2016 г. 4205 0
Със сигурност сте чували фразата „дублирано съдържание“ повече от веднъж и като опитен собственик на сайт никога не бихте публикували едно и също съдържание два пъти, нали?
Дублираното съдържание може да се сравни с банков овърдрафт. Само в този случай изразходвате ценния си бюджет за обхождане.
Бюджетът за обхождане е броят страници на сайта, които роботът за търсене може да обходи за определен период от време. Затова е толкова важно да го изразходваме на страниците, от които се нуждаем.
Проявявайки се под различни форми, дублираното съдържание може да се превърне в един от най-неуловимите и невидими проблеми, които могат да повлияят негативно на класирането и популяризирането на даден сайт. Появата му често се свързва с особеностите на архитектурата на сайта или ограниченията на CMS.
За съжаление в Google Webmaster няма такъв инструмент за проверка, който лесно може да открие дублирано съдържание. Дори най-модерните инструменти на трети страни не винаги са добри в тази задача, особено когато източникът на проблема е вътре. Ръчната проверка е неизбежна.
Ето списък с 8 потенциални причини за появата на дублиращи се страници в сайта:
Един от най-бързите начини да проверите дали имате две версии на сайт, налични за индексиране, е да опитате да получите достъп до него, като използвате протоколите HTTP и HTTPS. Ако и двете версии се отворят, очевидно е, че вашият разработчик е преместил сайта към HTTPS и не е настроил пренасочване 301 от HTTP версията.
По същия начин трябва да проверите дали сайтът има две версии на страници с WWW и без WWW. РешиМожете да разрешите този проблем, като настроите пренасочване 301 и посочите предпочитания от вас домейн (главно огледало) в Google Webmaster.
Сайтове, които крадат вашето съдържаниеВъпреки че няма въведено законодателство, което да ви върне откраднато съдържание, има само начини, по които можете да използвате код, за да затрудните крадците да представят вашето съдържание за свое. За да направите това, винаги използвайте абсолютни връзки на сайта вместо относителни:
Абсолютни връзки:http://seo.artox-media.ru/wiki/dublirovannyi-kontent.html (започва с протокола и съдържа името на сайта).Относителни връзки:/wiki/dublirovannyi-content.html (произлиза от основата на сайта или текущия документ).
Ако разработчикът не иска да пренапише целия сайт, могат да се използват самореферентни канонични тагове. Когато вашето съдържание се хоства на друг сайт, каноничните тагове може да останат, помагайки на Google да определи, че вашият сайт е оригиналният източник на съдържанието.
За да разберете, че вашето съдържание е откраднато, можете да използвате някоя от безплатните услуги (например Siteliner, Copyscape. Etxt, AdvegoPlagiatus и др.)
Да приемем, че сте се отказали от поддомейн и сте решили да използвате поддиректория вместо това. Или например сте създали напълно нов уебсайт. Във всеки случай, вашето старо съдържание може все още да е достъпно и, нещо повече, може да има лош ефект върху класирането на новите страници. Най-добрият начин за решаване на проблема е да използвате пренасочване 301 от този поддомейн към новия сайт/директория. Това е особено важно, ако вашият стар ресурс има голяма маса от връзки.
Скрити страници в процес на разработка
Решихте да актуализирате дизайна? Подготвяте ли уебсайта си за голяма промяна? Ако не сте затваряли вашите тестови случаи предистраници (и още повече dev версията на сайта) от индексиране, тогава не сте имунизирани от факта, че роботът няма да ги открие.
Има често срещано погрешно схващане, че никой никога няма да се досети да въведе някакъв фиктивен URL адрес на вашия сайт http://razrabotka.sait.ru/ в лентата на браузъра, ако никъде в кода няма връзка към него, изглежда, че това е просто нереалистично. Но не е! Google непрекъснато търси и индексира нови уеб страници, включително тези в процес на разработка. Всичко това може да повлияе на резултатите от класирането, както и да подведе потребителите.
Това не само оказва огромно влияние върху сайта по отношение на поверителността и сигурността, но също така може да нанесе тежък удар върху бюджета за обхождане. Избягването на това е лесно: използвайте мета маркера robots c noindex на всички тестови страници или ги блокирайте във файла robots.txt.
Не забравяйте, че когато премествате страници от режим за разработка в режим на живо, трябва да премахнете тези блокиращи директиви от кода.
Динамично генерирани URL параметри
Най-често динамичните URL адреси се генерират въз основа на филтрите, използвани в сайта. Как точно изглеждат тези URL адреси?
URL 1: www.shop.com/chocolate/cake/vanilla URL 2: www.shop.com/chocolate/cake/vanilla%8in URL 3: www.shop.com/chocolate/cake/vanilla%8in=marble
Така Google може да създава и индексира безкрайни комбинации от URL адреси, които потребителят дори не изисква.
В този случай приложете каноничния маркер с предпочитания от вас URL адрес и конфигурирайте опциите за обхождане на URL адреси в Google Webmaster.
Вашият бизнес оперира ли в множество региони? Някои компании предпочитат да създадат основна целева страница, която позволява на потребителите да изберат региона, който е най-подходящ за тях, ислед това ги пренасочва към съответната поддиректория. Например:
Синдикация на съдържаниеСиндикирането на съдържание е повторното използване на едно и също съдържание на различни ресурси с цел популяризиране на вашия уебсайт/марка/съдържание и привличане на допълнителен трафик.
Синдикирането е чудесен начин да представите нова аудитория на вашия сайт, но си струва да зададете правила за това кой ще публикува отново вашето съдържание.
В идеалния случай трябва да помолите издателите да използват атрибута „rel=canonical“ на страницата със съдържание, за да посочат на търсачките, че вашият уебсайт е оригиналният източник на съдържанието. В допълнение, те могат също така да предотвратят индексирането на съдържание, което ще реши потенциални проблеми с дублирането в резултатите от търсенето.
В крайна сметка издателите могат да се свържат обратно към оригиналната статия, като ви посочват като първоизточник.
Подобно съдържание може да причини също толкова вреда, колкото и дублирано съдържание. Дефиницията на Google за дублирано съдържание дори включва фразата „по същество подобно“. Докато части от материала може да се различават по синтаксис, общото правило е, че ако можете да получите една и съща информация от тях, тогава няма причина и двете да съществуват на уебсайт. Тук чудесно решение на проблема е да използвате каноничния етикет или да обмислите комбинирането на тези части от съдържание в едно.