Что значит неканоническая страница

Атрибут rel=canonical. Что это за атрибут и какая от него польза в SEO

Привет, друзья! Я уже писал про дубли страниц и то какой вред они могут нанести сайту. Сегодняшняя тема напрямую связана с этим явлением. Я расскажу про атрибут rel=canonical.

Атрибут rel=canonical был введен Google 12 февраля 2009 года. Он учитывается до сих пор, поисковой системой Яндекс в том числе. Атрибут rel=canonical указывает поисковым роботам какая страница является предпочтительной при индексации, если на сайте имеется несколько страниц с одинаковым содержимым, но с разными URL-адресами.

Допустим существует 2 страницы:

В данном случае первая страница является основной, именно для нее и должен быть прописан атрибут rel=canonical. А вторая страница является лишь ее копией, но с другим URL-адресом. Следовательно, если не будет прописан rel=canonical, то поисковая система будет индексировать как основной адрес, так и дубль страницы.

Конечно, поисковые системы не глупы и со временем выкинут дубль из индекса, но на это требуется время. А если сайт ежедневно пополняется несколькими сотнями новых страниц, то отсутствие указания канонического URL-адреса может негативно сказаться на продвижении.

Возьмем интернет магазин с 10 000 товарами. У каждого товара на сайте своя страница и несколько дублей. Представляете как подпортит продвижение сайта могут 20 000 дублированных страниц?

Откуда берутся неканонические страницы на сайте

Неканонические страницы или дубли генерируют движки управления, такие как WordPress, phpBB и прочие. Если у вас сайт написан на чистом HTML, то дублированных страниц в принципе быть не должно, если только вы их специально не добавляли конечно.

Если мы обратимся к справочнику вебмастера в Google и Яндекс, то увидим следующее:

Сообщение Google

Рекомендации Яндекс

Как прописать атрибут rel=canonical

С тех пор, как Google ввел данный атрибут, прошло много времени и практически на всех CMS и конструкторах сайтов есть возможность его прописать. В конструкторах сайтов он обычно прописывается автоматически, а для движков существуют дополнения в виде модулей и плагинов.

Если взять CMS WordPress, то практически все SEO плагины предоставляют возможность прописать канонический URL автоматически. Я пользуюсь плагином All In One Seo Pack, поэтому покажу на его примере.

В настройках плагина нужно отметить галочкой, чтобы автоматически прописывались канонические URL-адреса.

Если взглянем на исходный код страницы, то увидим что rel=canonical прописан. И если поисковый робот зайдет на этот дубль страницы, то увидит, что страница не является основной.

Вот такой вот интересный атрибут. Конечно, ничего нового я вам не открыл. Но почему-то многие не обращают внимания на вот такие мелочи, особенно владельцы небольших интернет-магазинов.

Источник

Канонические страницы (неканонические). Блогеру это нужно знать

Канонические страницы позволяют определить важные разделы на ваших ресурсах. В статье рассмотрим, что это за страницы и разберем, что такое неканонические страницы. Эта информация поможет блогерам бороться с дублирующим контентом на сайтах.

Канонические страницы блога (неканонические), что это такое

Здравствуйте, друзья! Канонические страницы блога – это адреса страниц, которые являются предпочтительными для показа в поисковой выдаче Яндекса и Гугла. Простыми словами, на блоге могут быть несколько страниц с похожим содержимым. Поисковый робот может посчитать их дублями. Тогда робот объединяет страницы в группы и выбирает только ту, которая соответствует поисковым запросам. Это каноническая страница.

Что такое неканонические страницы? Это дубликаты канонических страниц (похожие по смыслу), которые не должны попадать в поиск. Но, есть исключения. Допустим, на блоге публиковалась статья о программе онлайн офис. Яндекс Вебмастер посчитал статью, как неканонической (скрин 1).

Если статья отвечает на запрос пользователя и отличается от других, то неканоническая страница остается в поиске Яндекса.

Коротко о дубликатах страниц и каннибализме от поисковиков

Нередко на блогах и других сайтах появляются дубликаты страниц, которые мешают продвижению ресурса в Интернете. Дублями страниц называют похожие фрагменты материалов в статьях или страницах. Кроме того, некоторые статьи пишутся под одинаковые запросы, которые могут быть дубликатами (скрин 2).

В алгоритме поисковых систем Google и Яндекса предусмотрена борьба с так называемым «каннибализмом».

Создается ситуация, когда ключ первой статьи не дает продвигаться второй статье по похожему ключу. Статьи на одном блоге (сайте) начинают конкурировать друг с другом. Та статья, которая для вас важна, просто пропадает из поиска. Если таких статей несколько, то это влияет на позиции в поисковой выдаче всего сайта (блога). В результате снижается посещаемость всего сайта в целом.

По нашим наблюдениям, например, пара ключей: «привлечение клиентов в Инстаграм» и «сервис для привлечения клиентов в Инстаграм» были каннибалами в глазах поисковых систем. Эти статьи исчезли из поиска Яндекса. Позже, один из ключей пришлось заменить, и статьи появились в Интернете.

Использование схожих ключей нужно избегать, например, писать статьи под разные запросы. Тогда все статьи будут показываться в поиске Яндекса и Google.

Какие канонические страницы нужно оставлять, пути сохранения похожих статей

Рассмотрим, какие канонические страницы нужно оставлять, чтобы не прописывать в них атрибут rel=»canonical»:

Есть несколько путей сохранения похожих статей. Первый способ – с помощью плагина. Если вы ведете блог на Вордпресс и используете плагин Seo by Yoast, то сможете прописать полный адрес страницы, нажав кнопку внизу под статьей Дополнительно, далее в разделе «Канонический URL адрес» (скрин 3)

Введите полный канонический URL-адрес без www, в поле «канонический URL-адрес». Далее нажмите «Обновить». После чего, плагин сгенерирует автоматически каноническую ссылку выше. Для каждой страницы указывают только одну каноническую ссылку.

Более подробно о канонической ссылке вы можете прочитать в Яндекс справочнике – «yandex.ru/support/webmaster/robot-workings/canonical.html».

Что не нужно делать при канонизации похожих статей

Если разобраться в вопросе, то канонизация страниц (статей) достаточно простой процесс. Но в процессе канонизации нужно соблюдать правила, чтобы не было ошибок в продвижении вашего ресурса:

Это основные правила, которым нужно придерживаться при канонизации статей или страниц на вашем ресурсе.

Заключение

В статье рассмотрели, что такое канонические страницы и неканонические. Если у вас на блоге или другом ресурсе есть статьи с похожими ключевыми словами, вы можете установить канонические страницы. Это поможет вам улучшить ранжирование и посещаемость вашего ресурса в поисковых системах.

Источник

Руководство по работе с канониклами

В этой статье собраны свежие данные на лето 2021 года о канонических страницах. Разобраны все возможные случаи использования атрибута rel=“canonical”. Рассмотрены основные ошибки при работе, а также даны ответы на популярные вопросы.

Определения каноничности

Каноническая страница — это страница, которую поисковая система считает главной в группе схожих по содержимому.

Неканоническая страница — это страница на которой размещен атрибут rel=»canonical» с адресом другой страницы.

Как выглядит атрибут каноникал

Атрибут rel=“canonical” может быть прописан двумя способами:

Какой из этих методов выбрать лучше всего, разберем в главе «Как указать канонический адрес страницы».

Процесс канонизации

Канонизация — это процесс выбора главной страницы среди дублей (одинаковых страниц доступных по разным адресам) и/или среди страниц с похожим контентом.

В подкасте Search Off the Record от 4 ноября 2020 сотрудник Google Мартин Сплитт рассказал, как поисковик обрабатывает канонизацию:

Сначала нужно обнаружить дубликаты, сгруппировать их вместе и отметить, что эти страницы дублируют друг друга. Затем для всех них нужно найти страницу лидера.

На вопрос: «Обнаруживает ли такой метод только точные дубли или частичные тоже?» специалист ответил:

У нас есть несколько алгоритмов, которые пытаются обнаружить и не учитывать шаблонную часть страниц. Так, например, мы исключаем навигацию из расчета контрольной суммы, убираем нижний колонтитул. Тогда у нас остается то, что мы называем центральным элементом, то есть центральное содержимое страницы, что-то вроде самой сути страницы.

После вычисления и сравнения контрольных сумм, те, которые похожи между собой (сильно или частично) мы объединяем в дублирующий кластер.

Далее по словам Мартина, необходимо выбрать один документ из кластера, который и будет показываться в результатах поиска:

Но вычислить какая из них будет ведущей в кластере не так просто. Есть случаи, когда даже людям будет сложно определить, какая именно страница должна отображаться в результатах поиска. Мы используем более 20 сигналов, чтобы решить, какую страницу выбрать как каноническую из дублирующего кластера.

После сравнения всех сигналов для всех пар страниц, мы приближаемся к фактическому определению канонической.

Почему канониклы важны для SEO

1) Поисковики не любят дублирующийся контент, потому что он засоряют выдачу. Так же алгоритмам бывает непросто выбрать правильно главную страницу. Атрибут rel=»canonical» подсказывает какой URL стоит индексировать.

Google и Яндекс заявляют, что они не всегда признают указанный канонический адрес. Из-за того, что теги каноничности считаются подсказками, а не директивами (указаниями). Учитываются различные сигналы (были рассмотрены выше). Грамотное использование тегов каноничности помогает снизить риск того, что робот сочтет канонической не ту страницу.

Источник

«Яндекс» начнёт чаще показывать неканонические страницы

Часто на сайтах присутствуют страницы с разными URL, но с одинаковым или очень похожим содержанием. С помощью атрибута rel=«canonical» вебмастера могут указать, какая страница является «канонической» — предпочтительной для индексации и появления в результатах поиска. Остальные, неканонические версии, как правило, на поиск не попадают.

Исследования «Яндекса» показывают, что страницы, размеченные как неканонические могут быть полезны, а их наличие в поиске может влиять на качество и полноту ответа на запрос пользователя. Например, если для темы форума владелец сайта указал канонической страницу с началом ветки, то многие важные и нужные ответы, которые были даны пользователями позже, на поиск не попадают.

Другой пример: бывает, что какое-то литературное произведение разбито на страницы и в качестве канонической прописана первая страница. В результате сайт не находится по запросу-цитате, соответствующей тексту за пределами первой страницы. Поэтому теперь в поиске неканонические страницы будут появляться чаще.

Они будут показаны в том случае, если они более релевантны запросу и их контент существенно отличался от канонической версии во время сканирования роботом. В Вебмастере такие страницы можно увидеть на странице «Страницы в поиске» с пометкой «Неканоническая». Помимо этого статуса поисковик начал показывать статусы «Каноническая» и «Каноническая страница не указана» для всех страниц, попавших в поиск.

Если канонические страницы настроены на сайте без ошибок, то никаких дополнительных действий от вебмастера не требуется. Для сайтов, имеющих много неканонических страниц, которые сильно отличались от канонических, возможен прирост количества страниц в Поиске.

Впрочем, канонические страницы по-прежнему попадают на поиск гораздо чаще и имеют более высокий приоритет при показе в результатах поиска. Объем трафика для каждого конкретного сайта существенно не изменится.

Источник

Все о rel canonical: как указывать атрибут правильно и зачем он нужен

Разбираемся, что нужно знать оптимизатору о работе с каноническими тегами. Материал для начинающих или тех, кто хочет освежить знания в памяти.

В статье:

Что такое rel canonical и для чего он нужен

Одинаковый контент на разных страницах — плохо, за это следуют санкции. Но есть случаи, когда дубли оправданы. К примеру, одна и та же страница может входить в несколько категорий, один и тот же сайт может быть доступен с www и без, а еще в каталогах товаров есть сортировка и фильтрация.

Страницы могут быть не полностью одинаковыми. К примеру, на одной включен фильтр товаров по сезона, а на другой — сортировка по цене. Тем не менее, от включенных фильтров уникальными они не станут.

Фильтр в каталоге сайта www.asos.com

В таких случаях нужно указывать, какой вариант страницы роботу считать основным, то есть каноническим, а какие дублями. Для этого придумали канонический тег — rel = «canonical», он решает проблему дублирования контента.

Каноническая страница — это основной URL. Атрибут rel = «canonical» добавляют на страницы-дубли и в нем указывают адрес канонической страницы, чтобы дать боту знать, какую страницу они повторяют.

Зачем указывать основную версию страницы?

Причины указывать canonical:

избежать санкций поисковиков за дублирование контента;

корректно передавать ссылочный вес на нужную версию сайта и страницы;

из контента, доступного по нескольким URL, выбрать страницу, которая будет получать все сигналы и показываться в выдаче;

Краткая информация о канонических URL из первых уст есть в справке Google и Яндекса.

Например, есть страница, доступная по трем адресам:

Допустим, мы хотим, чтобы страница site.ru/blog/category/tema ранжировалась в выдаче, получала весь положенный ей ссылочный вес и другие сигналы — считалась канонической.

Тогда эту страницу мы не трогаем, в коде страниц дублей site.ru/page?id=123 и site.ru/blog/tema указываем ее как каноническую. В коды дублей мы добавляем такую строчку:

Неканонические страницы не попадут в индекс?

Страницы, отмеченные как неканонические, все равно могут попасть в выдачу. Яндекс отмечает:

«Они будут показаны в том случае, если они более релевантны запросу и их контент существенно отличался от канонической версии во время сканирования роботом».

В Вебмастере у всех страниц появилась пометка «каноническая», «неканоническая» и «каноническая страница не указана». Вы можно посмотреть неканонические страницы, попавшие в выдачу, для этого откройте «Страницы в поиске» и ищите строчки с пометкой «Неканоническая».

Неканоническая страница в выдаче

Google тоже заявляет, что система признает указанный канонический URL, но не всегда, поскольку тег canonical — рекомендация, а не приказ к действию. Если неканоническая покажется ему релевантнее, она и появится в выдаче.

Но если сеошник указывает этот атрибут, уменьшается риск, что Google сам определит основной не ту версию страницы.

Канонические страницы все равно появляются в поиске чаще и имеют приоритет при показе в выдаче, а ошибки с настройкой canonical могут привести к проблемам в индексировании страниц. Разберем все варианты, когда нужно использовать канонический тег.

Когда нужно прописывать канонический тег

Используйте canonical, когда одинаковый контент доступен по разным URL. Когда дублирующиеся URL создаются системой, фактически сам контент не дублируется — разные URL обслуживают одно содержимое. Тем не менее, это дубли, канонический тег стоит указать. Разберем разные случаи.

Дублирование страниц

Дублирующиеся страницы с похожим содержанием, которые генерируются CMS. Они бывают на всех сайтах интернет-магазинов, где можно настраивать параметры выбора товара. Ссылки для навигации по каталогу, сортировка товаров, фильтрация, ссылки с UTM-метками для отслеживания, другие страницы с GET-параметрами в URL.

К примеру, если в каталоге есть несколько позиций одного дивана, отличающиеся только цветом обивки, можно выбрать самый популярный вариант и указать его каноническим. Все варианты диванов будут доступны пользователям, но ссылочный вес и другие сигналы будут идти на страницу с основным вариантом.

Другой вариант — страница товара подходит сразу под несколько категорий, так что образовываются множественные URL одного предмета. Решение такое же: выбрать популярную в качестве основной и указать ее на остальных дублирующих страницах в rel = «canonical».

Страницы пагинации

Переключение страниц в каталоге рождает дубли. Иногда для всех страниц пагинации указывают первую страницу в качестве канонической — это советуют не делать, потому что тогда проиндексируется только первая страница.

Пагинация на сайте www.petshop.ru

Вариант 1

Если на странице есть «Показать все», страница со всеми вариантами и будет канонической. На каждой из страниц пагинации укажите ее в атрибуте rel = «canonical».

Например, для страницы https://site.ru/category1/page-2 нужно прописать канонический URL:

Вариант 2

Если «Показать все» нет, для каждой страницы пагинации советуют указывать эти же страницы как канонические.

Например, на странице https://site.ru/category1/page2 нужно указать каноническую ссылку:

Вариант 3

Есть и другое мнение: если указать canonical страницы саму на себя, все страницы пагинации пойдут в выдачу. Если вы считаете, что плохо, если у разных URL с отличающимся контентом будут одинаковые Title и Description, то не делайте так.

В таком случае не нужно проставлять canonical, а лучше закрыть страницы пагинации в noindex, follow и использовать dissalow в robots для /page. Это значит, что индексировать нельзя, а переходить по ссылкам можно.

Напомним, что noindex подходит только для Яндекса.

HTTPS, HTTP, www

Один сайт может быть доступен по трем вариантам: http://site.ru и http://www.site.ru и https://www.site.ru. Но поисковые системы будут рассматривать все три как наборы отдельных страниц, если не указать canonical. Из-за чего могут быть проблемы со сканированием и индексацией сайта.

Мобильный URL

Google уже давно переходит на Mobile-First Indexing, то есть при индексировании он ориентируется на мобильную версию сайта.

Представитель Google Джон Мюллер рассказал, что делать с каноническим тегом в этих условиях.

Если у вас есть мобильная версия сайта m.site.ru, обычно у нее указывают rel = «canonical», ведущий на десктопную. А для десктопной используют тег rel=alternate, ведущий на мобильную. Если вы сделали так, ничего менять не надо. Бот распознает мобильную версию как каноническую, даже если в коде канонической указана десктопная. Если и в Sitemap.xml также, то тоже можно не трогать.

URL страны

Бывает, что для конкретной страны у сайта есть несколько версий с разными URL. При этом язык один и контент одинаковый с несущественными отличиями. Тогда нужно выбрать каноническую и сделать отсылки к ней на всех дублях.

Но если речь идет о разных языковых версиях, нужно использовать hreflang, чтобы поисковики выдавали отдельные результаты. Атрибут hreflang нужен для указания дополнительных URL с аналогичным или похожим содержимым на других языках или для отдельных регионов.

Из-за перехода Google на Mobile-First Indexing, нужно правильно настроить hreflang. Десктопные hreflang-теги должны ссылаться на десктопные URL, мобильные — соответственно на мобильные URL. И редиректить пользователей на нужную версию в зависимости от устройства.

Верхний и нижний регистр

Поисковик может посчитать разными два адреса, написанные в разном регистре. При назначении URL система должна применять только нижний регистр, чтобы одни и те же ссылки были действительно одинаковыми.

Итак, с помощью rel = «canonical» можно указать поисковику, какую страницу считать основной и главной среди дублей, чтобы сканировать ее, индексировать, показывать в выдаче и направлять на нее ссылочный вес. Разберемся, как настраивать тег.

Как настроить canonical правильно: 6 способов указать основной URL

Для использования канонического тега нужно выбрать среди дублей основной URL, вписать его в атрибут:

и добавить ко всем неосновным страницам.

Для добавления есть несколько способов:

С помощью плагина CMS

Большинство CMS имеют встроенную функцию или плагины, которые позволяют автоматизировать настройку канонического URL.

настроить canonical на WordPress можно с помощью плагина Yoast SEO;

в OpenCart в настройках товара можно задать SEO URL;

в Joomla версии от 3 и выше можно включить функцию SEF. Тогда в код технических страниц вида /index.php?option добавится атрибут rel = «canonical» с указанием основной страницы с ЧПУ.

Для примера подробнее рассмотрим WordPress как самую популярную CMS среди наших подписчиков.

Настройка canonical WordPress

Все просто: установите плагин Yoast SEO, чтобы канонические теги добавлялись автоматически.

Настроить теги для конкретной страницы можно в разделе «Дополнительно» («Advanced»), там нужно указать основной URL:

Настройка канонического тега WordPress

Yoast SEO делает так, что если на странице появляется noindex или nofollow, тег canonical пропадает, чтобы не было проблем с представлением сайта в выдаче.

Если вы не используете CMS и не можете реализовать канонический тег плагинами, можно сделать все иначе.

Прописать между тегами любой HTML-страницы

Основной способ — прописать rel = «canonical» в секцию любой страницы-копии.

Например, если для страницы https://site.ru/*utm_content= канонической будет https://site.ru/, на страницу https://site.ru/*utm_content= нужно добавить код:

В заголовке HTTP

При запросе дублирующего файла сервер должен отдавать ссылку на оригинальный файл:

К примеру, вы составили руководство, выложили его в блог и отдельно оформили в PDF-файл для скачивания, который разместили в подкаталоге http://site.ru/blog/*. HTTP-заголовок для этого руководства в PDF может выглядеть так:

С другими страницами так тоже можно.

В файле Sitemap

Поисковики по умолчанию думают обо всех ссылках в XML-файле как о канонических. У Google есть требование включать в Карту сайта только канонические адреса страниц. Но Карта не свод правил для поисковых ботов, а список рекомендаций, который поисковики могут проигнорировать.

Через 301 редирект

Отвести трафик и ссылочный вес от дублей к канонической страницы можно с помощью 301 редиректа. Этот способ можно использовать, если сайт, к примеру, доступен по нескольким адресам:

Можно выбрать в качестве основного https://site.ru/, а со всех остальных настроить перенаправление.

Дополнительный сигнал — ссылки

Представитель Google Джон Мюллер в этом видео перечислял все сигналы, которые поисковик использует для определения канонического адреса.

К примеру, между адресами HTTPS и HTTP Google выберет HTTPS, а еще он может предпочесть привлекательный с его точки зрения URL. В числе сигналов каноникализации числятся ссылки с одной страницы на другую. Если вы указали канонической одну страницу, а по совокупности факторов другая кажется поисковику более подходящей, он не будет вас слушать.

Неправильной настройкой можно навредить индексированию страниц. Разберем несколько типичных ошибок оптимизаторов.

Неправильно указан canonical: популярные ошибки настройки

Использование нескольких канонических ссылок для одной страницы

Для одной страницы нужно указать один канонический адрес. Если указано несколько, бот либо проигнорирует страницу вообще, либо примет к сведению первый указанный URL.

Проверяйте, как плагин CMS реализует canonical, иногда из-за неправильной настройки он может указывать несколько адресов.

Настройка разных канонических URL одной странице

Похожий пункт, но речь идет не о нескольких канонических адресах для одной страницы, а в о разных, указанных разными способами.

Настройка цепочки канонических URL

Бот не будет учитывать канонический адрес, если для страницы, которую вы указали основной, настроена какая-то своя основная страница. Например, для адреса site.ru/1 канонической ссылкой указана site.ru/2, а для нее указана site.ru/3.

Размещение rel = «canonical» не в секции head

Указание первой страницы пагинации как канонической

Если для всех страниц пагинации канонической указать первую, бот не проиндексирует остальные. Выше мы писали, как лучше сделать, есть три варианта:

сделать канонической страницу «Показать все», если она есть;

для каждой страницы поставить ее же URL в качестве канонической, если нет общей страницы.

Использование канонических URL вместо 301 редиректа

Тег canonical и 301 редирект кажутся похожими — перенаправляют бота на основную страницу. Но не стоит использовать canonical вместо редиректа. Редирект переводит весь трафик на один URL, а при использовании rel = «canonical» страница откроется, будет активной и сможет получать трафик, но не появится в индексе.

Выбор главной как канонической для всех страниц

Ошибкой будет указать главную страницу в качестве канонической для всего сайта. Боты могут проигнорировать все страницы, кроме главной.

Закрытие канонической страницы от индексирования

Если канонический URL закрыт от индексирования или по другой причине недоступен для поискового бота, он не сможет участвовать в формировании выдачи. В этом случае бот возьмет доступный неканонический URL.

Как проверить canonical

Проверить, для каких страниц вы настроили canonical и какие канонические страницы указали, можно с помощью сервиса Screaming Frog SEO Spider.

Результаты проверки страниц краулером

Узнать, какую страницу Google считает основной для конкретного URL, можно через инструмент проверки URL.

Проверить, как поступил Яндекс, можно в Вебмастере: если вы верно указали каноническую страницу, дубли пропадут из поиска. Посмотрите страницу «Индексирование» — «Страницы в поиске». Если страницу исключили из результатов, она будет в блоке «Исключённые страницы».

Проверка наличия дубля в выдаче

Рассказывайте, о каких необходимых вариантах использования canonical мы забыли, и какие еще ошибки настройки вы встречали в своей практике!

Источник