Как убрать дубли страниц replytocom в WordPress

Как убрать дубли страниц replytocom в WordPressВсем привет! Сегодня я расскажу вам о том, как я убрал дубли страниц replytocom на WordPress-блоге. Понимаю, что эта тема уже давно «заюзанная», но лично я у себя провёл эти мероприятия не так давно, а раньше просто не особо обращал внимания на почти тысячу страниц в индексе Google.

Как вы уже можете знать, дубли страниц replytocom в WordPress отображаются таким образом в Google по запросу «site:domain.ru»:

Как убрать дубли страниц replytocom в WordPress

И вот таких страниц у моего блога было около тысячи. Не могу точно вспомнить, почему я целый год ничего не предпринимал, чтобы от этого избавиться, но точно помню, что не придавал особого значения этому моменту до тех пор, пока не стал всё чаще и чаще натыкаться на статьи о том, насколько сильно дубли replytocom убивают WordPress-сайты.

У себя в файле robots.txt я нашёл вот такие строчки, которые, если мне не изменяет память, сам и прописывал год назад:

Disallow: /*?*
Disallow: /*?
Disallow: /*?replytocom
Disallow: /?replytocom

Как оказалось, быть их НЕ ДОЛЖНО. Поэтому, если в вашем robots.txt есть директивы Disallow с этими параметрами, то удаляйте их, не задумываясь.

Следующим шагом, который вам необходимо выполнить, вы открываете ваш .htaccess (я надеюсь, не нужно рассказывать, что это за файл и где он находится) и вписать в него две строчки:

RewriteCond %{QUERY_STRING} ^replytocom= [NC]
RewriteRule (.*) $1? [R=301,L]

После этого, когда я пытался открыть ссылку, содержащую фрагмент replytocom, меня перебросило на саму статью без мусора в URL. Вот, собственно, и всё. Я использовал этот способ, потому что для меня он оказался самым удобным и без установки плагина.

В Google Webmaster Tools в разделе «Сканирование — Параметры URL» у вас должен быть задан параметр replytocom с следующими моментами:

Как убрать дубли страниц replytocom в WordPress

Кстати, когда я зашёл сюда, у меня уже всё это было указано, а я, хоть убейте, не могу вспомнить, когда настраивал параметр. Про эту настройку я вспомнил, прочитав этот пост у Дениса Тумиловича. Кстати, если вам чем-то не нравится способ избавления от дублей replytocom в WordPress через .htaccess, вы можете прочитать о других решениях по ссылке выше. Там есть два способа через .htaccess (404 ошибка и 301-й редирект), а также при помощи плагинов Replytocom Redirector и WordPress Thread Comment.

Мне же теперь остаётся только ждать, пока Google выбросит ненужный мусор из индекса, а на это, как говорят, обычно требуется довольно-таки много времени.

Расскажите в комментариях, есть ли у вас на сайтах такая проблема и как вы избавляетесь от дублей replytocom в WordPress. И вообще, может быть, вы не используете древовидные комментарии и у вас такой проблемы нет по умолчанию?

До новых встреч!

 

Комментарии к записи “Как убрать дубли страниц replytocom в WordPress” (21)

  1. Я не использую древовидные комментарии и у меня такой проблемы нет по умолчанию.

    До новых встреч!

  2. Сделала редирект и открыла индексацию в роботсе. В вебмастере наоборот убрала указанную настройку (у меня изначально тоже была, как ни странно). Все страницы дублей принудительно удалила через инструмент Гугла. Страниц в доп. индексе нет, но вот почему-то гугл помнит об их существовании, рдс бар показывает 80% 🙂

    • У меня их настолько много, что я, наверное, сойду с ума их удалять вручную 😀

  3. Сколько уже статей про дубли прочитал, это жесть 🙂

    А почему никто не упоминает, что дополнительно нужно добавить meta robots noindex,nofollow для страниц в файле function.php ?

    • Неудивительно, большинство людей написало об этом после того, как подобную статью опубликовал у себя А. Борисов, и с этим нельзя не согласиться.

      Я не упомянул про «meta robots noindex,nofollow для страниц в файле function.php» по причине того, что я не в курсе насчёт этого момента. Мне известно только о перекидывании ссылок с replytocom на 404 через functions.php.

  4. Привет, Анатолий. Дубли страниц самая злободневная тема для владельцев сайтов на вордпресс.

    Месяца четыре назад занялась этой проблемой — было более 1,5 тысяч дублей.

    Сейчас 400 с небольшим. Убирала при помощи Google Webmaster. У меня в robots.txt директива

    Allow: *?replytocom. В общем дубли убираются сами потихоньку, читала, что процесс приблизительно продолжается полгода. Ещё, смотря сколько дублей:)

    • Добрый день, Лариса! Ну у меня не 1500, но стремится к тысяче, потому что постов меньше, чем у вас вроде бы:)

  5. Я считаю, что лучше строчку из роботса с /*?replytocom лучше вообще убрать и воспользоваться плагином. Я так у себя сделал и ничего страницы хорошо себя чувствуют из индекса и весь мусор потихоньку уходит из выдачи

  6. Делал всего лишь два момента:

    1 — удалил replytocom из robots.txt

    2 — запретил сканирование через Google Webmaster.

    Всё, больше ничего не делал, в .htaccess никакие редиректы не прописывал. Дубли уходят. было около 3000, сейчас осталось где-то 800.

    • Александр, а у меня ситуация пока совсем не изменилась в Google. Как было 900+ страниц, так и осталось.

      • Анатолий, значит 301-й редирект работает?

        Просто я боролся с дублями через ошибку 404, и никаких изменений, а прошло уже несколько месяцев! Буду пробовать ставить редирект

        А вообще дубли появились после того, как я сменил шаблон, в котором одним из нововведений стали древовидные комментарии. До них о дублях и не подозревал, так как их просто не было

        • Сейчас проверил — в гугле почти 900 страниц, но их уже на 20 меньше, чем было. Посмотрим, что будет дальше.

  7. Впервые об этой теме узнал у Александра Борисова. Он писал в своём привычном стиле: из-за этой проблемы сайты не растут, блоги закрываются, да и вообще едва ли не конец света. Но стоит их убрать, как уже через месяц посещаемость даже захудалых блогов вырастет в сотни раз, настанет мир и счастье на Земле. А как их убрать? Для этого купите мой новый тренинг, где я дам вам ключ к разгадке.

    Да уж, и этот кадр — один из самый популярных блогеров.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *