Поисковые системы не показывают пользователям сайты, которым не доверяют. Если у вашего сайта будет много проблем по технической или коммерческой части, то его могут просто исключить из выдачи. И в противовес этому, чем меньше на нем технических ошибок, чем удобнее сервис, и чем лучше поведение пользователей - тем выше его позиции в выдаче, а следовательно, доход компании. Расскажем, как найти и исправить одну из самых частых ошибок - дублирование контента на сайте.
Содержание
- Почему на сайте не должно быть дублирующегося контента
- Как найти страницы с дублями
- Как исправить дубли контента на сайте
Почему на сайте не должно быть дублирующегося контента
Дублирование - одна из частых технических ошибок сайтов. Страницы с похожим содержимым могут появляться из-за ошибок в административной панели или связанных с ней системах, а также невнимательности или умысла администраторов.
Наличие на сайте страниц с дублирующим контентом может привести к таким проблемам:
- Неправильное определение посадочной страницы. Поисковые системы возьмут в индекс только одну страницу - все остальные будут считаться дублями. В таком случае продвигаемая страница может не попасть в выдачу.
- Канибализация выдачи. Несколько страниц будут считаться релевантными для определенного запроса, и в итоге ни одна не получит хороших позиций.
- Проблема со ссылками. Ссылочное продвижение будет затруднено, так как один и тот же контент будет доступен по нескольким ссылкам. Посетители будут делиться разными ссылками, и ни одна страница не сможет получить хороший ссылочный вес.
- Растрачивание краулингового бюджета сайта. Роботы поисковых систем, которые изучают сайты (краулеры), могут проанализировать за один раз определенное количество страниц. При наличии дублей они будут обращать внимание на них, пропуская важные страницы.
- Санкции поисковых систем. Поисковики могут посчитать, что дубли созданы намеренно, чтобы заполнить выдачу одним сайтом. Такие действия наказываются санкциями со стороны Яндекс и Google.
Это основные проблемы, связанные с повторением содержимого на сайте. Теперь рассмотрим, как решить эту проблему.
Как найти страницы с дублями
Найти страницы с дублями контента можно разными способами, мы расскажем про 4 самых распространенных.
Яндекс.Вебмастер
Сервис анализа сайта от Яндекса содержит много полезной информации. В частности, вы можете найти страницы, которые роботы поисковой системы оценили как дубли. Для этого нужно перейти в раздел Индексирование на вкладку Страницы в поиске. Далее выберите раздел Исключенные страницы. В колонке Статус вы можете увидеть причины, по которым система отклонила те или иные страницы. Нажав на значок слева от названия колонки, можно установить фильтр - выбираем вариант Дубль. Синим цветом будет показана исключенная страница, а серым - уже имеющаяся в индексе.
Google Search Console
В сервисе анализа от Google тоже есть раздел об индексировании, в котором можно увидеть, какие страницы поисковик добавил в индекс, а какие - отклонил (и главное, по каким причинам).
Чтобы увидеть дубли, которые нашли роботы Google, необходимо перейти в раздел Индексирование страниц в вашем проекте. В Поле Почему эти страницы не индексируются вы увидите все отклоненные страницы и соответствующие причины отклонения. Чтобы увидеть список дублей, нажмите на строчку Страница является копией. Канонический вариант не выбран пользователем.
Screaming Frog SEO Spider
С помощью программы Screaming Frog вы можете просканировать сайт и найти множество проблем и другой полезной информации о его состоянии.
Чтобы найти дубли в этой программе, нужно:
- Просканировать сайт;
- Открыть вкладку Content;
- Выбрать пункт фильтра Exact Duplicates.
Labrika
Сервис анализа Labrika может показать много различных проблем сайта. Результаты проверки контента можно найти в разделе Проблемы в содержании сайта. В данном случае нас интересует пункт Точные дубли страниц, но можно также изучить пункт Страницы с очень похожим текстом.
Как исправить дубли контента
Исправление дублирования контента на сайте может стать как задачей на 5 минут, так и причиной траты большого количества времени и денег. Все зависит от причины появления дублей:
- если на разных страницах разместили одинаковые тексты, их можно заменить и уникализировать;
- если кто-то по ошибке создал копию страницы, то ее можно просто удалить или настроить редирект;
- если же страницы-дубли генерируются автоматически, то необходимо разобраться в причине и настроить шаблоны.
Если дублирующие страницы не участвуют в продвижении, вы можете установить на них тег rel=”canonical” и указать оригинал. Тогда поисковые системы не будут добавлять дубли в индекс. Подробнее про этот тег мы говорили в этой инструкции.
Дублирование контента - одна из распространенных проблем сайтов. Причиной могут быть шаблонная генерация, копирование блоков и текста с одних страниц на другие, а также случайное создание дубликатов вручную. В любом случае, дублирование продвигаемых страниц приведет к проблемам с продвижением, поэтому их необходимо решать как можно скорее.
Спасибо, что дочитали до конца. Переходите к следующей инструкции.