Как убрать дубли страниц в WordPress. Как убрать дубли страниц в wordpress


Как убрать дубли страниц wordpress

Replytocom! Как найти, убрать и избавиться от дублей страниц replytocom в wordpress блоге!

избавление от дублейПривет! В предыдущей статье я рассказывала о том, как найти дубликаты страниц и чем они опасны. Сегодня мы узнаем как избавиться от дублей страниц раз и навсегда.

В WordPress есть отдельная категория дублей страниц, которые образуются из-за технических особенностей системы и присутствуют только в Google. Такие повторения сложно заметить на сайте и еще сложнее самостоятельно удалить. Радуйтесь, что вы читаете эту статью, потому что сейчас я вас всему научу!

Простой способ убрать дубли страниц

Если вы давно занимаетесь техническим совершенствованием своего блога, то наверняка уже сделали самые простые шаги, предотвращающие появление дублей. Проверьте себя:

Если ваш блог сделан на WordPress, у вас наверняка присутствуют следующие типы дублей страниц:

Например, если добавить в конце урла любой статьи /feed, откроется xml версия статьи для RSS-рассылки - ее текст тот же самый, но адрес отличается. Replytocom используется в древовидных комментариях при нажатии кнопки «Ответить». Выходит, что каждый комментарий создает дополнительный url одной и той же страницы. А если у статьи тысяча комментариев, то и дублей у нее будет 1000.

гугл и дубли страниц

  • В настройках плагина «All in One SEO Pack» должны стоять галочки «Канонические URL'ы (Canonical URLs)». Подробнее об этом можно прочитать тут.
  • comment-page
  • Многое зависит от настроек файла robots.txt. Если у вас нет понимания, для чего он нужен, обязательно прочитайте статью по ссылке.
  • Почему именно Гугл, я уже объясняла. Все дело в файле robots.txt. Когда в нем закрыт доступ к чему-то, Google все равно забирает это в выдачу. Просто не показывает содержимое:

    Хорошо, если у вас сделаны эти три простейших пункта, но это еще не значит, что вы знаете, как удалить дубли страниц. Все самое интересное впереди.

    Что такое дубли страниц WordPress replytocom и другие?

    1. category
    2. trackback
    3. attachment_id
    4. Каждый из этих типов связан с определенной технической возможностью WordPress. Определить, какие из них есть у вас можно с помощью оператора site, об этом очень подробно написано в прошлой статье - тут.

    5. Убедитесь, что у вас настроен редирект с www на без www (или наоборот). Проверить это можно, набрав в адресной строке браузера адрес сайта: www.pro-wordpress.ru. Он должен автоматически замениться на pro-wordpress.ru. Если у вашего сайта несколько доменов, аналогично со всех них должен стоять редирект на главное зеркало сайта.

      С такими дублями страниц срочно нужно бороться, потому что сайт с подобной проблемой мгновенно попадает под фильтр Гугла Панда.

    6. www.pro-wordpress.ru

      Чтобы этого избежать, нужно наоборот открыть Гуглу доступ ко всему в файле robots.txt, при этом в head каждого файла добавить запрещающий индексацию мета-тег:

      Фото по теме с интрнетаКак убрать дубли страниц wordpressКак убрать дубли страниц wordpressКак убрать дубли страниц wordpressКак убрать дубли страниц wordpressКак убрать дубли страниц wordpress

      kakware.blogspot.com

      Как убрать дубли страниц в WordPress

      Как убрать дубли страниц в WordPress

      От автора: дубли страниц – одна из самых распространенных технических проблем, которая может ухудшить позиции сайта в поиске. Как с ней разобраться? Невозможно в одной статье рассказать о всех видах дублей на всех движках, давайте сосредоточимся на чем-то одном. Например, на cms WordPress, так как это самый популярный движок. Как убрать дубли страниц в wordpress? Давайте рассмотрим самые основные.

      Самое большое зло WordPress

      В этом движке есть один вид дублей, который особенно опасен и от него в свое время страдали очень многие сайты. Это так называемый replytocom. Появится он только в том случае, если включить в настройках обсуждения древовидные комментарии. Таким образом, появится возможность ответить на комментарий какого-то человека. Это очень удобно, если только не одно но.

      Если присмотреться к url-адресу на кнопке “Ответить”, то можно найти там тот самый злосчастный отросток – replytocom. Ну и что? А то, что чем больше комментариев теперь у вас будет на странице, тем больше дублей. Причем 1 новый комментарий породит не 1 дубль, а много.

      Все это происходит потому, что к странице теперь можно будет обратиться не только так: http://site.ru/название-записи

      Практический курс по верстке адаптивного лендинга с нуля!

      Научитесь с нуля верстать адаптивные лендинги на HTML5 и CSS3 за ближайшие 6 дней

      Узнать подробнее

      Но и так: http://site.ru/название-записи?replytocom=…

      Таким образом, если к статье оставили 100 комментариев, то появится как минимум 100 дублей, но на самом деле гораздо больше. Я часто анализирую различные сайты с помощью специальных сервисов вроде pr-cy. Так вот, там можно наблюдать историю количества проиндексированных страниц.

      Так вот, в 2012-13 годах, когда решение проблемы знали немногие, у многих сайтов было 100 тысяч – 10 миллионов страниц в индексе! Сейчас их в тысячи раз меньше, хотя с тех пор на сайтах появилось намного больше контента.

      Как раз все эти тысячи и даже миллионы дублей в основном были из-за дублей replytocom. Когда же владельцы сайтов узнали о проблеме и о ее решении, они избавились от дублей и со временем из поисковой выдаче исчезли сотни миллионов мусорных страниц!

      Лечение или как избавиться от replytocom

      Вариантов тут есть несколько. Во-первых, можно установить плагин Yoast SEO, который используют тысячи веб-мастеров для поисковой оптммизации своих записей. Если хорошенько покопаться в его настройках, то можно найти там пункт “Убрать replytocom”. Ставим галочку и спим спокойно.

      Во-вторых, можно просто не включать древовидные комментарии, если вы в них не нуждаетесь. Конечно, будет не так удобно, но это самый простой способ никогда не сталкиваться с этими дублями.

      В-третьих, поставить какой-то другой плагин. В частности, не так давно нашел плагин Ark hidecommentslinks, который делает сразу 2 полезных дела: заменяет ссылки в комментариях на кликабельный текст, а заодно и убирает replytocom. Но плагин приведен только в пример, потому что я уверен, что это не единственное расширение, которое справляется с этой проблемой.

      Четвертый способ более сложен – замена кнопки ответить. Эта кнопка должна выводиться не стандартными средствами wordpress, а с помощью скрипта. Обычно эту работу делает программист, либо вы можете найти готовое решение в каком-нибудь шаблоне, где стоит самописная система комментариев.

      Практический курс по верстке адаптивного лендинга с нуля!

      Научитесь с нуля верстать адаптивные лендинги на HTML5 и CSS3 за ближайшие 6 дней

      Узнать подробнее

      Думаю, этих способов вам хватит, тут еще нужно сказать о том, что чем раньше вы сделаете что-либо для устранения дублей, тем лучше. Самое главное, чтобы ваши статьи не были доступны по такому адресу: http://site.ru/название-записи?replytocom=какое-то число

      Потому что если они недоступны (вылазит 404 ошибка) то со временем все дубли, если они уже попали в выдачу, пропадут. Если они еще не успели попасть в выдачу, то еще лучше.

      Простой способ проверить дубли

      Самый простой способ – воспользоваться сервисом, который покажет вам, сколько страниц вашего сайта проиндексировано поисковиком. Для этой цели я использую pr-cy.ru/analysis, так как уже очень привык к нему.

      В WordPress на главной странице вы можете видеть, сколько на вашем блоге на данный момент записей, а также сколько страниц. Вот вы и можете примерно прикинуть, сколько страниц должно быть в индексе. Вводим адрес своего сайта в сервис для проверки этих показателей.

      Там вы увидите данные для Яндекса и Гугла. Если они примерно отвечают вашим подсчетам и отличаются незначительно, значит, на данный момент все в порядке. Если же вы видите существенную разницу между количеством страниц в Индексе поисковиков, либо в обоих поисковиках это количество сильно превышает кол-во реальных записей, нужно начинать бить тревогу и принимать меры по борьбе с дублями.

      Дубли на страницах рубрик

      На странице рубрики обычно содержится анонс статьи и кнопка на нее полное прочтения. Так вот, хотя это и не полный дубль, но все же какая-то часть текста может совпадать на обеих страницах (300-600 символов). Таким образом, вы сами у себя понижаете уникальность. Чтобы этого не допустить, желательно закрывать текст в анонсах в теги noindex.

      Хорошо, но из-за этого страницы рубрик вообще могут не проиндексироваться? Если вы хотите все-таки их индексировать, рекомендую добавить для каждой рубрики ее уникальное описание в 150-250 символов и выводить его в шаблоне рубрик – category.php.

      Дубли в архивах

      По умолчанию в wordpress есть архивы по дате и архивы по автору. На этих страницах также выводится описание статей, а еще одинаковые title. Если вы в них не нуждаетесь, можно просто отключить. Это можно сделать с помощью seo-плагина. Например, Yoast SEO.

      Дубль на уровне домена

      По умолчанию при создании сайта он доступен по двум адресам: site.ru и www.site.ru. По сути, для поисковой системе это 2 разных сайта. Чтобы контент не дублировался, нужно явно указать главное зеркало. Это можно сделать с помощью файла robots.txt, прописав в нем следующее:

      User-Agent: * Host: site.ru

      Со временем поисиковые роботы поймут, что вариант без www является основным зеркалом. Теперь, если кто-то наберет www.site.ru, его будет редиректить на вариант без www. Также настроить главное зеркало можно в новом Бета-вебмастере Яндекса.

      Итак, мы с вами рассмотрели самые основные дубли в wordpress, а также как от них можно избавиться. Но это далеко не все дубли. Вообще, если вы хотите провести тотальную зачистку блога на wordpress и избавиться абсолютно от всех видов дублей, я рекомендую к просмотру наш курс о продвижении и монетизации блогов. Вы получите такие знания, которые пригодятся вам, когда вы решите зарабатывать серьезные деньги на сайтах.

      Практический курс по верстке адаптивного лендинга с нуля!

      Научитесь с нуля верстать адаптивные лендинги на HTML5 и CSS3 за ближайшие 6 дней

      Узнать подробнее

      Хотите быстро научиться создавать сайты и блоги на WordPress с уникальным дизайном?

      Получите самую полную в Рунете бесплатную систему обучения создания сайтов на WordPress “Уникальный сайт с нуля”

      Получить

      webformyself.com

      Осторожно! Wordpress создает дубли многостраничными постами

      Всем привет! На днях обнаружил баг в WordPress, который создает бесчисленное множество дублей страниц. Проблема касается всех, у кого есть сайты на этой CMS. Да-да, многими любимый движок может создать большое количество идентичных документов.

      Напугал? Не переживайте =) . Баг, действительно, серьезный, но исправить его можно достаточно просто. Ниже я расскажу, что это за зверь и как от него избавиться.

      wordpress создает дубли

      В связи с недавними баден-баденовскими событиями начал плотно изучать информацию в Яндекс.Вебмастере. Анализировал сводку по индексированию ("Страницы в поиске"). Искал связь между пометками "Некачественная страница" и наложением фильтра за переоптимизацию.

      пример некачественного документа

      И вот, зайдя в статистику для блога, был неприятно шокирован — сотни дублей несуществующих документов.

      дубли страниц

      идентичные документы

      Оказывается, если к любому посту в блоге добавить любые цифры, то WordPress создаст такую страницу — она будет идентична основной записи. Баг с постраничной навигацией отдельных постов — сотни или тысячи вероятных дублей.

      На таких страницах нет мета-тега robots и есть canonical, который в качестве канонического документа указывает именно дубль.

      canonical

      Проверьте, у вас также?

      Усугубляет ситуацию связь с плагином All in one SEO pack, который дополнительно дает ссылку на предыдущую запись: поисковый робот не только заходит, по сути, на несуществующую страницу, но и начинает ходить по другим таким же. Добавлялось и удалялось сотни подобных "постов".

      добавлено/удалено

      Я начал копать глубже и создал топик на wordpress.org. Оказалось, что еще в 2014 был баг при создании многостраничных постов с помощью тега <!--nextpage-->. Тогда также создавались несуществующие документы, но canonical для 2-й, 3-й или последующих страниц, наоборот, указывали всегда на первую, то есть не индексировались.

      Начиная с WordPress 4.4 баг с canonical убрали (у каждой "пагинированной" страницы поста появился свой каноникал), а вот ошибку с созданием несуществующих документов не убрали. Поэтому сейчас индексируется больше, чем нужно :smile:.

      Что делать и как убрать дубли?

      Сперва, хочу сказать, что в одной из ближайших версий вордпресса этот баг постараются исправить.

      ошибку уберут в вордпресс 4.8

      Пока же нам придется убирать его, так называемыми, "костылями" :smile:. Существует 2 варианта.

      1) Плагин After Last Page Fix от Белотицкого Юрия. Скачать можно здесь. Установка в один клик, настроек нет. Скрипт вместо создания множества дублированных документов отдает 404-ошибку. На мой взгляд, самый удачный вариант. Недостатки:

      2) Дополнительная настройка All in One SEO Pack. Разработчики этого плагина, скорее всего, оказались в курсе данного бага и в новых версиях появились дополнительные чекбоксы.

      noindex и nofollow для постов с пагинацией

      Несуществующие записи будут создаваться, но в них будет указан мета-тег robots, запрещающий их индексирование.

      meta name=robots noindex и nofollow

      В других SEO-плагинах для wordpress не смотрел. Вероятно, в Yoast SEO или подобных будут такие же настройки. UPD. Да, действительно, в плагине от Yoast прописывается каноникал на основную запись.

      Вот и все :smile:! Баг достаточно серьезный, но исправляется, можно сказать, в один клик. Вам остается проверить, создаются ли у вас подобные страницы. Если да, то выбрать один из вариантов решения проблемы.

      Получается, что, обновляясь на новую версию wordpress, не только устраняешь старые ошибки CMS, но можешь и получить новые. Интересно, какая у вас версия движка и создаются ли такие несуществующие посты? Поделитесь статистикой в комментариях ;-).

      Загрузка...

      sosnovskij.ru

      Как удалить дубли страниц WordPress?

      Страницы с одинаковыми адресами — это распространенная техническая проблема, которая довольно таки серьезно может негативно повлиять на поисковую выдачу Вашего сайта в поисковых системах.

      Что такое дубли страниц?

      Причин появления дублей на сайте может быть несколько: если страница имеет несколько подстраниц, присутствие комментариев (особенно если для них активна функция постраничного отображения или древовидный вид), прикрепленные картинки, начилие календаря в сайдбаре, и др.

      Как удалить дубли?

      Наиболее простой и универсальный способ — использовать плагины, которые корректно и безболезненно решают данную проблему.

      Удаляем дубли страниц в комментариях

      Присутствие кнопки “Ответить” в блоке комментариев порождает самый злосчастный вид дублей — replytocom. К примеру, если в одной статье 50 раз нажмут на “Ответить” и оставят свой комментарий, то на сайте будет присутствовать 50 дублей этой статьи. Чтобы обезопасить Ваш сайт от подобной беды, необходимо в админ-панели перейти Настройки -> Обсуждение и убрать галочки напротив пунктов Разрешить древовидные (вложенные) комментарии глубиной и Разбивать комментарии верхнего уровня на страницы по.

      Страница настройки комментирования

      Используем плагин Yoast SEO

      После установки и активации плагина Yoast SEO в админ-панели необходимо перейти SEO -> Возможности, в разделе Дополнительные настройки страницы перетянуть ползунок в состояние Включено и нажать кнопку Сохранить изменения. У Вас в разделе SEO появятся новые подменю, из которых нужно выбрать Дополнительно -> Постоянные ссылки. На этой вкладке необходимо поставить ползунки в положения, согласно рисунку ниже:

      Удаление дублей в Yoast SEO

      Для вступления изменений в силу следует нажать кнопку Сохранить изменения.

      Если Вы используете плагин Clearfy, то для удаления дублей страниц необходимо в админ-панели перейти Clearfy -> Основные -> Дубли страниц и отметить все пункты меню в этом окне.

      Если Вам понравилась статья — поделитесь с друзьями

      wpschool.ru

      Как удалить дубли страниц WordPress?

      Дубли страниц — это ничто иное, как наличие одного и того же адреса у нескольких страниц сайта. Дублирование адресов является распространенной технической проблемой, которая может негативно отразится на поисковой выдаче Вашего сайта.

      Почему создаются дубли?

      Наличие одинаковых адресов может быть следствием нескольких причин: постраничное отображение комментариев, начилие календаря на сайте и т.д.

      Наиболее простой вариант избавится от дублей — воспользоваться плагином Clearfy Pro, о котором мы писали в одном из наших материалов.

      Удаление дублей в комментариях

      Избавится от повторения страниц в комментариях помогут стандартные средства WordPress. Для этого необходимо в админ-панели перейти Настройки -> Обсуждение и убрать галочки напротив пунктов Разрешить древовидные (вложенные) комментарии глубиной и Разбивать комментарии верхнего уровня на страницы по.

      Страница настройки комментирования

      Удаление дублей в прикрепленных файлах

      С удалением дублей в прикрепленных файлах хорошо справляется бесплатный плагин Yoast SEO. Итак, после его установки и активации, необходимо перейти SEO -> Возможности, где в разделе Дополнительные настройки страницы перетянуть ползунок в состояние Включено и нажать кнопку Сохранить изменения. После этого в разделе SEO появятся новые подменю, из которых нужно выбрать Дополнительно -> Постоянные ссылки. Находясь на этой вкладке, необходимо перетянуть ползунки в положения, согласно рисунку:

      Удаление дублей в Yoast SEO

      Плагин Clearfy Pro

      Плагин Clearfy Pro решает эту задачу комплексно, удаляя дубли в архивах дат, пользователей и тегов, а также страницы вложений, пагинации постов. Для этого достаточно на странице настроек плагина (Clearfy Pro -> Основные), во вкладке Дубли, отметить все перечисленные пункты и нажать кнопку Сохранить изменения.

      Удаление дублей в плагине Clearfy Pro

      wpplus.ru

      Найти и удалить дубли wordpress ! — ТОП

      С помощью плагина — Trash Duplicate and 301 Redirect вы сможете найти и удалить дубли записей и страниц сайта wordpress. Данный плагин довольно простой он ищет и показывает дубли на вашем сайте, если они есть. Если дубли есть, то вы сможете очень просто удалить их, нажав на кнопку. Установить плагин вы сможете прямо из админ-панели wordpress. Перейдите на страницу: Плагины — Добавить новый, введите название плагина в форму поиска, нажмите Enter, установите и активируйте плагин.

       

      11-03-2016 17-51-27

       

      После установки и активации плагина, перейдите на страницу: Trash Duplicates. Если на вашем сайте есть дубли, то они сразу же отобразятся на данной странице. Вверху страницы будет показано количество дублей и общее количество записей.

       

      11-03-2016 18-05-22_mini

       

      Чтобы удалить дубль записи, нажмите рядом с названием записи на кнопку — Apply. Если вы хотите удалить одновременно несколько записей, то поставьте слева вверху галочку возле значения All и нажмите рядом на кнопку Apply. Удалённые дубли переместятся в корзину, не забудьте потом очистить корзину на странице всех записей.

       

      11-03-2016 18-22-15

       

      У плагина есть функция редиректа, то есть, на все имеющиеся у вас на сайте дубли будет создан автоматический 301 редирект. После удаления дублей редирект останется, вы можете оставить его на некоторое время, 1-2 месяца. На сайте у вас больше не будет дублей, но в поисковой системе останутся URL адреса дублей, для этого и нужен редирект, хотя и не обязательно. Чтобы удалить редирект для дубля, нажмите рядом с ссылкой на вкладку — Delete.

       

      11-03-2016 18-31-15

       

      Если на вашем сайте нет дублей, но вы заметили, что дубли есть в поисковой системе, то есть в поиске, то возможно вы стали жертвой вируса  replytocom.

       

      info-effect.ru

      info-effect.ru

      Убираем дубли страниц на WordPress

      При создании сайта на движке WordPress, да и вообще на любом другом движке, вы можете столкнуться с весьма неприятной ситуацией. Особенно, если это блог или сайт, предназначающийся для продажи ссылок. Ситуация заключается в возникновении дублирующихся страниц. Т.е. в поисковые системы попадают две или более ссылки, которые ведут на одну и ту же страницу. Естественно, что содержимое этих страниц полностью совпадает. Чаще всего дублируются: главная страница сайта, различные посты с комментариями на форумах и другие страницы. Как вы думаете, понравится ли страницы поисковым системам 2-4 одинаковых по структуре и содержимому? Естественно, нет. Оптимизаторы и так стараются написать достаточно простые сайты, для продажи ссылок. А тут ещё и дубли страниц. В итоге, ваш сайт может быть заблокирован в поисковой системе и вытеснен за её приделы и получить санкции. Естественно, не оптимизатору, не тем более любому другому бизнесмену – это не нужно. Давайте поговорим о том, как бороться с этим.

      Для начала, рассмотрим основные причины такого явления, как дубли. Самой частой причиной является использование так называемых древовидных комментариев. Видели когда-нибудь форум? Вот и здесь аналогичная структура. Когда человек отвечает на чей-то вопрос в комментариях, то его ответ появляется рядом. Это облегчает посетителю поиск нужной информации и помогает понять тему разговора. Однако движок wordpress создаёт дубликат страницы с содержимым поста, которое и индексируется поисковой системой.В данном случае, именно параметр replytocom является причиной появления таких дублирующихся страниц. Как же быть? Отключить древовидность у сайта или блога, или пойти навстречу пользователям?

      Выбор, разумеется, за вами. Можно, конечно, отключить древовидность комментариев, убрав соответствующий флажок в программе, но если вы хотите сделать ваш блог удобным для пользователя, и в тоже самое время избавиться от дублирующихся страниц, то придётся сделать несколько действий.Для начала заглянем в файл Robots.txt. Это служебный файл, находящийся обычно в корневой директории вашего сайта. В нём содержится информация о том, какие файлы и страницы будут индексироваться поисковиками, а какие не будут. Вот и пропишите в нём запрет на индексацию дублей. Шаблон для закрытия индексации дублей будет выглядеть так: Disallow: /*/?replytocom=*

      Т.е. тем самым, мы исключаем наши дубли из индексации поисковиком.

      Есть и другие способы исключить дубли, но для этого придётся покопаться в файлах самого сайта. Первое, что нужно сделать, это найти файл comment-template.php в папке wp-includes. В этом файле находим строку под номером 1062 и дописываем параметр nofollow. После этого строка будет выглядеть следующим образом:

      $link = "$reply_text";

      Конечно, в интернете существует куча плагинов и программ, которые убирают эти самые дубли страниц автоматически, однако вручную это сделать хоть и несколько сложнее, за то надёжнее. Не забывайте, что дубли страниц могут свести на нет все остальные ваши усилия по оптимизации сайта. Поэтому к данному вопросу, нужно подходить с особой серьёзностью! В противном случае, вы можете получить санкции от поисковых систем. И тогда, сайт придётся продвигать заново!

      krutim-all.ru


      Смотрите также

      Prostoy-Site | Все права защищены © 2018 | Карта сайта