Хороший способ избавиться от дублей страниц в Google
Некоторые CMS (системы управления контентом) представляют такую возможность как доступ к одному и тому же материалу по разным ссылкам. Например здесь выведены несколько нод (статей) на главную, которые также доступны из блога и по некоторым другим ссылкам. Для пользователей конечно это совсем не страшно, а иногда даже полезно, так как можно заметить то, что не увиделось сразу. Поисковые Системы же посчитают такой контент на сайте за дубляж и попросту понизят позиции вашего сайта в выдаче.
Именно для того чтобы убрать из индекса дубли страниц, Google (Yahoo и MSN) еще в 2009 году придумали новый meta-tag который располагается в заголовке страницы и позволяет поисковому роботу точно идентифицировать ноду. То есть поисковый робот забрав главную страницу сайта по адресу "/" уже не будет считать страницу по адресу "/node" за отдельную, так как материал на них одинаковый. Данный момент актуален для CMS Drupal где контент главной страницы может быть и по адресу "/" и по адресу "/node" и по адресу "/blog". Таксономия в Drupal также создает много дублей страниц ведь зачастую одна и таже статья доступна сразу по двум или трем терминам.
Решить эту проблему (по крайней мере в Drupal) можно с помощью модуля Nodewords, в настройках которого нужно поставить чекбокс на "Canonical URL" в меню "Мета-теги, для вывода в HTML" после чего модуль встроит в HTML код страницы ее каноническое, уникальное имя.
P.S. Данную проблему можно конечно решить с помощью robots.txt, но это на мой взгляд гораздо дольше и муторней.
Комментарии
27 недель 5 дней назад
29 недель 1 день назад
40 недель 2 часа назад
41 неделя 5 дней назад
42 недели 10 часов назад
48 недель 4 дня назад
48 недель 5 дней назад
50 недель 6 дней назад
51 неделя 4 дня назад
1 год 1 неделя назад