Внимание! Google может определять дублированный контент еще до сканирования

 

Одна из последних видеовстреч для вебмастеров была интересна заявлением представителя Google Дж. Мюллера о возможностях поисковой системы определять дублированный контент еще до его сканирования.

 

Считаются ли дубликатами страницы на разных языках

 

как исправить дубли страниц?

 

В процессе встречи был задан вопрос: может ли поисковик воспринять франкоязычную версию вебстраницы как дубликат аналогичной страницы на английском языке и если да, то как это происходит?

В ответ Мюллер сказал, что в некоторых случаях можно признать, что контент, скорее всего, является дубликатом, пока он не просканирован. В качестве примера он привел следующую ситуацию: допустим, страница содержит языковой параметр, он может быть задан для какого угодно термина (как вариант, «language=English», «language=German», «language=French» и т. д.). Если выясняется, что каждая из этих страниц выдает англоязычный контент, кроме «language=Italian», значит поисковик может сделать вывод, что к данной вебстранице установленный языковой параметр никак не относится, соответственно, на ней содержится уникальный контент.

 

По каким параметрам Google воспринимает дублированный контент

 

уникальность контента для страниц

 

Если не брать во внимание языковой момент, по словам Мюллера, Гугл считает дублированным такой контент, когда проверяемая страница имеет одинаковые параметры URL с другими дубликатами. Важно учесть, что бывают ситуации, когда не только дублированные страницы, но и вебстраницы, содержащие уникальный контент, имеют те же самые параметры URL.

Дабы не возникла ситуация, при которой Гугл будет расценивать уникальные вебстраницы, как дублированные, стоит обращать особое внимание на процесс генерирования на ресурсах параметров URL. При этом за ошибки в распознавании страниц-дубликатов ответственность не во всех случаях несут вебмастера.

Существует вариант, что это «баги» самого Гугла.

Вы можете уникализировать контент, путём внедрения рерайта текста. Этот метод сработает как подушка безопасноти для предотвращения дублирования страниц.

Так же отметим, что Google не предусматривает наказание сайтов, дублирующих контент в различных форматах, и не считает проблемой дублирование контента вебстраницы PDF-файлом.

Если вы помните, ранее в марте 2016 представитель Google Г. Илш говорил о том, что переживать о дублировании контента на ресурсе вебмастерам не нужно.

Комментарии закрыты.