Как Google анализирует содержимое веб-страниц и взвешивает его

Мартин Сплитт из Google представляет концепцию аннотации центрального элемента и то, как анализируются и взвешиваются различные части веб-страницы.

0

Мартин Сплитт на вебинаре Duda объяснил концепцию под названием Centerpiece Annotation, в которой рассматривается, как Google анализирует содержимое веб-страницы.

Я не буду воспроизводить вопрос, потому что он несколько не по теме и длинный.

Но Мартин рассказывает о том, как Google отделяет шаблонную часть веб-страницы и затем на основе структуры текстового контента обобщает, о чем эта веб-страница.

Он упоминает так называемую центральную аннотацию.

Мартин Сплитт пояснил:

«Это просто наш анализ контента, и я не знаю, что мы публично говорили об этом, но, кажется, я поднимал эту тему в одном из эпизодов подкаста.

Поэтому я могу сказать, что у нас есть, например, аннотация «Центральная часть», и есть несколько других аннотаций, в которых мы рассматриваем семантический контент, а также, возможно, дерево компоновки.

Но в принципе мы можем прочитать это из структуры содержимого в HTML и понять: «О! Это выглядит так, как будто после обработки естественного языка, которую мы провели для всего этого текстового содержимого, которое мы получили, похоже, что это в первую очередь относится к теме A, корму для собак».

Скриншот Мартина Сплитта, обсуждающего аннотацию центрального элемента
Мартин Сплитт из Google

Далее Мартин рассказывает о том, как анализ страницы разделяет веб-страницу на составные части, некоторые из которых не имеют отношения к Centerpiece.

Части страницы, объясняет он, взвешиваются по-разному. Вес — это указание на то, насколько важен тот или иной элемент страницы. Таким образом, если часть получает легкий весовой балл, значит, она не так важна, как та, что имеет более высокий вес.

Мартин продолжил:

«И еще здесь есть одна вещь, которая выглядит как ссылки на сопутствующие товары, но на самом деле она не является частью центрального элемента. Это не совсем основной контент. Кажется, что это дополнительные материалы.

И еще куча шаблонов или: «Эй, мы выяснили, что меню выглядит практически одинаково на всех этих страницах и списках. Это очень похоже на то меню, которое есть на всех остальных страницах этого домена», например, или мы уже видели это раньше. Мы даже не идем по домену или типа: «О, это похоже на меню».

Мы выясняем, что похоже на шаблон, и затем это тоже получает разный вес».

Похожие: 9 HTML-тегов (и 11 атрибутов), которые вы должны знать для SEO

Контенту не по теме уделяется меньше внимания
Далее Мартин упоминает, что после того, как Google определит, о чем веб-страница, если какой-то раздел не по теме, то ему не уделяется столько внимания, предположительно для целей ранжирования.

Разблокировка (не предоставляется) с помощью Keyword Hero
Просмотр всех ваших органических ключевых слов в GA и их конкретных показателей эффективности. Бесплатная пробная версия. Отмена в любое время. Профессиональная поддержка. 4-минутная настройка.

Мартин объясняет:

«Если у вас на странице есть контент, который не связан с основной темой остального контента, мы можем не уделять ему столько внимания, сколько вы думаете.

Мы все равно используем эту информацию для обнаружения ссылок, определения структуры вашего сайта и всего прочего.

Но если на странице 10 000 слов о корме для собак, а затем 3000, 2000 или 1000 слов о велосипедах, то, вероятно, это не очень хороший контент для велосипедов».

Это действительно интересно, потому что, похоже, это показывает, что когда Google определяет, о чем страница, то контент не по теме может не иметь шансов на ранжирование или, как говорит Мартин, ему не уделяется «столько внимания».

Джейсон Барнард спросил:

«Мне кажется, что вы догадываетесь о семантическом HTML5. Дает ли вам семантический HTML5e какую-то помощь или вам просто все равно? Нет смысла?»

Джейсон имел в виду разметку HTML5, которая определяет различные разделы веб-страницы, такие как заголовок, навигация, нижний колонтитул и т.д.

В начале дискуссии Мартин говорил об анализе структуры контента и фактического текста. Теперь тема немного ушла в сторону семантической структуры HTML5.

Мартин ответил:

«Это помогает нам, но это не единственное, на что мы обращаем внимание. Да».

Похожие: 3 ответа на вопросы по HTML и кодированию

Аннотация по центру
Аннотация — это примечание, поясняющее что-либо. Центральная часть — это то, что должно быть в центре внимания.

Аннотация в центре, похоже, представляет собой краткое изложение темы основного содержания.

Мартин объясняет, как Google разделяет страницу на различные разделы и по-разному оценивает части, не относящиеся к центральной аннотации.

Он также упоминает, что части страницы, которые отличаются от основной темы, не получают особого внимания, что, по-видимому, означает, что это не тот контент, который может ранжироваться.

Вам также могут понравиться Еще от автора

Оставьте ответ

Ваш электронный адрес не будет опубликован.