Хороший способ избавиться от дублей страниц в Google

Некоторые CMS (системы управления контентом) представляют такую возможность как доступ к одному и тому же материалу по разным ссылкам. Например здесь выведены несколько нод (статей) на главную, которые также доступны из блога и по некоторым другим ссылкам. Для пользователей конечно это совсем не страшно, а иногда даже полезно, так как можно заметить то, что не увиделось сразу. Поисковые Системы же посчитают такой контент на сайте за дубляж и попросту понизят позиции вашего сайта в выдаче. Именно для того чтобы убрать из индекса дубли страниц, Google (Yahoo и MSN) еще в 2009 году придумали новый meta-tag который располагается в заголовке страницы и позволяет поисковому роботу точно идентифицировать ноду. То есть поисковый робот забрав главную страницу сайта по адресу «/» уже не будет считать страницу по адресу «/node» за отдельную, так как материал на них одинаковый. Данный момент актуален для CMS Drupal где контент главной страницы может быть и по адресу «/» и по адресу «/node» и по адресу «/blog». Таксономия в Drupal также создает много дублей страниц ведь зачастую одна и таже статья доступна сразу по двум или трем терминам. Решить эту проблему (по крайней мере в Drupal) можно с помощью модуля Nodewords, в настройках которого нужно поставить чекбокс на «Canonical URL» в меню «Мета-теги, для вывода в HTML» после чего модуль встроит в HTML код страницы ее каноническое, уникальное имя.

P.S. Данную проблему можно конечно решить с помощью robots.txt, но это на мой взгляд гораздо дольше и муторней.

Оцените статью