Всем привет! Сегодня я расскажу вам о том, как я убрал дубли страниц replytocom на WordPress-блоге. Понимаю, что эта тема уже давно «заюзанная», но лично я у себя провёл эти мероприятия не так давно, а раньше просто не особо обращал внимания на почти тысячу страниц в индексе Google.
Как вы уже можете знать, дубли страниц replytocom в WordPress отображаются таким образом в Google по запросу «site:domain.ru»:
И вот таких страниц у моего блога было около тысячи. Не могу точно вспомнить, почему я целый год ничего не предпринимал, чтобы от этого избавиться, но точно помню, что не придавал особого значения этому моменту до тех пор, пока не стал всё чаще и чаще натыкаться на статьи о том, насколько сильно дубли replytocom убивают WordPress-сайты.
У себя в файле robots.txt я нашёл вот такие строчки, которые, если мне не изменяет память, сам и прописывал год назад:
Disallow: /*?*
Disallow: /*?
Disallow: /*?replytocom
Disallow: /?replytocom
Как оказалось, быть их НЕ ДОЛЖНО. Поэтому, если в вашем robots.txt есть директивы Disallow с этими параметрами, то удаляйте их, не задумываясь.
Следующим шагом, который вам необходимо выполнить, вы открываете ваш .htaccess (я надеюсь, не нужно рассказывать, что это за файл и где он находится) и вписать в него две строчки:
RewriteCond %{QUERY_STRING} ^replytocom= [NC]
RewriteRule (.*) $1? [R=301,L]
После этого, когда я пытался открыть ссылку, содержащую фрагмент replytocom, меня перебросило на саму статью без мусора в URL. Вот, собственно, и всё. Я использовал этот способ, потому что для меня он оказался самым удобным и без установки плагина.
В Google Webmaster Tools в разделе «Сканирование — Параметры URL» у вас должен быть задан параметр replytocom с следующими моментами:
Кстати, когда я зашёл сюда, у меня уже всё это было указано, а я, хоть убейте, не могу вспомнить, когда настраивал параметр. Про эту настройку я вспомнил, прочитав этот пост у Дениса Тумиловича. Кстати, если вам чем-то не нравится способ избавления от дублей replytocom в WordPress через .htaccess, вы можете прочитать о других решениях по ссылке выше. Там есть два способа через .htaccess (404 ошибка и 301-й редирект), а также при помощи плагинов Replytocom Redirector и WordPress Thread Comment.
Мне же теперь остаётся только ждать, пока Google выбросит ненужный мусор из индекса, а на это, как говорят, обычно требуется довольно-таки много времени.
Расскажите в комментариях, есть ли у вас на сайтах такая проблема и как вы избавляетесь от дублей replytocom в WordPress. И вообще, может быть, вы не используете древовидные комментарии и у вас такой проблемы нет по умолчанию?
До новых встреч!
Я не использую древовидные комментарии и у меня такой проблемы нет по умолчанию.
До новых встреч!
Алексей, вам очень повезло.
Сделала редирект и открыла индексацию в роботсе. В вебмастере наоборот убрала указанную настройку (у меня изначально тоже была, как ни странно). Все страницы дублей принудительно удалила через инструмент Гугла. Страниц в доп. индексе нет, но вот почему-то гугл помнит об их существовании, рдс бар показывает 80% 🙂
У меня их настолько много, что я, наверное, сойду с ума их удалять вручную 😀
Сколько уже статей про дубли прочитал, это жесть 🙂
А почему никто не упоминает, что дополнительно нужно добавить meta robots noindex,nofollow для страниц в файле function.php ?
Неудивительно, большинство людей написало об этом после того, как подобную статью опубликовал у себя А. Борисов, и с этим нельзя не согласиться.
Я не упомянул про «meta robots noindex,nofollow для страниц в файле function.php» по причине того, что я не в курсе насчёт этого момента. Мне известно только о перекидывании ссылок с replytocom на 404 через functions.php.
Привет, Анатолий. Дубли страниц самая злободневная тема для владельцев сайтов на вордпресс.
Месяца четыре назад занялась этой проблемой — было более 1,5 тысяч дублей.
Сейчас 400 с небольшим. Убирала при помощи Google Webmaster. У меня в robots.txt директива
Allow: *?replytocom. В общем дубли убираются сами потихоньку, читала, что процесс приблизительно продолжается полгода. Ещё, смотря сколько дублей:)
Добрый день, Лариса! Ну у меня не 1500, но стремится к тысяче, потому что постов меньше, чем у вас вроде бы:)
Анатолий, тогда месяца три — четыре и дубли исчезнут. У меня 113 постов, не так то уж и много=)
Я считаю, что лучше строчку из роботса с /*?replytocom лучше вообще убрать и воспользоваться плагином. Я так у себя сделал и ничего страницы хорошо себя чувствуют из индекса и весь мусор потихоньку уходит из выдачи
Делал всего лишь два момента:
1 — удалил replytocom из robots.txt
2 — запретил сканирование через Google Webmaster.
Всё, больше ничего не делал, в .htaccess никакие редиректы не прописывал. Дубли уходят. было около 3000, сейчас осталось где-то 800.
Александр, а у меня ситуация пока совсем не изменилась в Google. Как было 900+ страниц, так и осталось.
Хотя нет, сейчас показывает уже 227!
Анатолий, значит 301-й редирект работает?
Просто я боролся с дублями через ошибку 404, и никаких изменений, а прошло уже несколько месяцев! Буду пробовать ставить редирект
А вообще дубли появились после того, как я сменил шаблон, в котором одним из нововведений стали древовидные комментарии. До них о дублях и не подозревал, так как их просто не было
Сейчас проверил — в гугле почти 900 страниц, но их уже на 20 меньше, чем было. Посмотрим, что будет дальше.
Позавчера поставил 301 редирект, сегодня стало на 11 страниц меньше! Можно сказать результат не заставил себя долго ждать 🙂 Метод работает!
Что ж, а я продолжаю ждать 🙂
Большое спасибо за статью, пока, Слава Богу, дублей страниц нет, но, думаю, это ненадолго, хорошая информация)
Алексей, не за что.
Впервые об этой теме узнал у Александра Борисова. Он писал в своём привычном стиле: из-за этой проблемы сайты не растут, блоги закрываются, да и вообще едва ли не конец света. Но стоит их убрать, как уже через месяц посещаемость даже захудалых блогов вырастет в сотни раз, настанет мир и счастье на Земле. А как их убрать? Для этого купите мой новый тренинг, где я дам вам ключ к разгадке.
Да уж, и этот кадр — один из самый популярных блогеров.
Ну а что поделать? Человек зарабатывает так.