Настройка канонических страниц. Новый тег rel=canonical для удаления дубликатов страниц
Настройка канонических страниц. Новый тег rel=canonical для удаления дубликатов страниц
Если ваш сайт имеет идентичный или очень похожий контент, доступный по разным URL
, тогда новый формат позволит указать тот URL
, который должен возвращаться в поисковой системе. Также можно быть уверенным, что все характеристики, такие как ссылочный вес и т.д. передадутся на нужную версию адреса.
Теперь вы можете добавить этот тег, для указания вашей версии адреса, внутри тега
на страницах с дублированным контентом:
Таким образом, Google поймет, что все дубликаты ссылаются на канонический адрес, указанный в теге. Дополнительные свойства адреса, такие как PageRank и связанные сигналы также перенесутся с дублированных страниц на указанную.
Подобный тег будет полезным в основном при использовании различных движков (phpBB, IPB
, WordPress, и т.д., напр. сайту ipbskins.ru – разработка дизайна сайта на IPB
, приходится использовать длинный robots.txt в целях избежания дублированного контента), создающих множество похожих страниц, например, это могут быть страницы:
печатной версии статьи:
http://site.ru/article01.html?print=true
текстовой версии статей для моб. телефонов:
http://site.ru/lofiversion/article01.html
дублированные из-за недостатка движка:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=keyword
и ряд других…
Этот стандарт может быть адаптирован любой поисковой машиной при индексации сайта.
Для популярного блог-движка WordPress уже разработан плагин canonical , вставляющий тег на нужные страницы. Другие популярные движки для блогов, форумов, интернет-магазинов и т.д. также в ближайшем будущем расширят свою функциональность (следите за обновлениями).
Ответы на некоторые популярные вопросы по тегу:
Является ли rel=“canonical” подсказкой или директивой?
Это подсказка, которую мы берем во внимание и во взаимодействии с другими сигналами вычисляем наиболее релевантную страницу для отображения в поисковых результатах.
Могу ли я использовать относительный путь для указания canonical, например так: ?
Да, относительные пути распознаются также, как и в обычном теге . Даже если вы введете тег с ссылкой на документ, тогда относительные пути будут считаться в соответствии с базовым URL
.
Это нормально, если канонические адреса содержат не полностью дублированный контент?
Мы позволяем небольшие различия, такие как порядок сортировки в таблице продуктов. Также мы понимаем, что канонические адреса могут парситься роботом в разное время, поэтому все это нормально.
Что если rel=“canonical” возвращает 404 ошибку?
Мы продолжим индексировать ваш контент и использовать эвристический подход, для определения канонического адреса, однако, мы рекомендуем, чтобы вы использовали существующие URL
в качестве канонических.
Что если rel=“canonical” ещё не проиндексирован?
Мы стараемся достучаться до канонического URL
быстро. Как только мы его проиндексируем, тогда сразу же перерассмотрим подсказку rel=“canonical”.
Может ли канонический урл содержать редирект?
Да, вы можете указать редирект, в этом случае поисковая машина обработает просесс перенаправления как обычно и попытается проиндексировать новый адрес.
Что если я имею противоречивые сигналы для rel=“canonical”?
Наши алгоритмы мягкие: мы можем следовать по каноническим цепям, однако, мы настоятельно рекомендуем, чтобы вы на страницах указывали единственный канонический адрес, чтобы быть уверенным в оптимальном результате канонизации.
Может ли этот тег для ссылки предложить канонический адрес на совершенно другом домене?
Нет. Чтобы мигрировать на другой домен, более подходящ. В настоящее время Google поддерживает канонизацию внутри поддоменов или внутри одного домена. Таким образом, владельцы сайтов могут указать www.example.com
вместо example.com
или help.example.com
, однако, не могут указать example.com
вместо example-widgets.com
.
Звучит интересно, но могу ли я увидеть пример?
Да, wikia.com помогла нам, как трастовый тестер. Например, вы замтетите, что исходный код по адресу http://starwars.wikia.com/wiki/Nelvana_Limited содержит rel=canonical http://starwars.wikia.com/wiki/Nelvana
.
Два адреса почти идентичны, исключая то, что Nelvana_Limited, первый URL
, содержит короткое сообщение возле заголовка. Это хороший пример использования тега в будущем. С rel=canonical, свойства двух адресов обьединяются и поисковые результаты отображают нужную версию.
Если у вас есть какие-либо вопросы по использованию нового тега, вы можете их задать в комментариях на официальном блоге Google для вебмастеров .
1. Помимо избавления от естественного дублированного контента (из-за недостатка движка), мы также избавляемся от дублированного контента искусственного, когда конкуренты нам пытаются насолить, добавляя в страницы с произвольными параметрами в URL
.
2. Теперь нет надобности использовать robots.txt для запрета индексации таких страниц, как “печатная версия” и других дубликатов (напр. в WordPress нужно было закрывать путь /teg/) и угождать каждому поисковику отдельно (есть общие стандарты для robots.txt, но есть также и ряд особенностей работы каждого поисковика с этим файлом, поэтому мы раньше не могли предусмотреть запрет индексации некоторых страниц сразу для всех ботов).
3. Мы теперь имеем хороший инструмент для ускорения индексации сайта 🙂
Сегодня мы поговорим про атрибут Rel=” Canonical” и в каких случаях его необходимо прописывать.
Что означает Rel Canonical?
Это атрибут указывается в теге и используется для отображения канонических страниц на сайте. Каноническая страница
– является главной страницей, именно она будет при на сайте.
История Canonical
12 февраля 2009 года Google представил атрибут canonical, который был создан, чтобы избавить сайт от дублированных страниц, указав необходимый URL адрес (каноническую страницу).
Где прописывать rel canonical
Атрибут тега rel canonical прописывается в разделе и может встречаться только 1 раз на странице. Данный тег не может указывается в других разделах на сайте