Семантический поиск: как Google учится понимать контент на странице
Наверняка вы замечали, что Google может ответить практически на любой вопрос.
На скриншоте, несмотря на игнорирование имени Йоды, Google понял, о ком мы хотим узнать. Это было бы невозможно без семантического поиска.
- Что такое семантический поиск и почему он важен?
- Пользователи часто не используют тот же язык, что и нужный контент
- Многие запросы многозначны
- Необходимо понимать лексическую иерархичность и отношения сущностей
- Необходимо отражать личные интересы и тенденции
- Какие технологии использует Google для семантического поиска
- Граф знаний
- Колибри
- RankBrain
- BERT
- Как адаптировать SEO для семантического поиска
- 1. Фокусироваться на темах, а не на ключевых словах
- 2. Не забывать про поисковый интент
- 3. Используйте семантическую разметку HTML
- 4. Используйте микроразметку
- 5. Создайте свой бренд, чтобы попасть в Граф знаний
- 6. Указывайте релевантность при помощи ссылок
- Заключение
Что такое семантический поиск и почему он важен?
Это такой процесс, который позволяет поисковым системам давать наиболее релевантный ответ на вопрос пользователя. Он учитывает значение поисковых слов, а не просто смотрит на их соответствие.
Вот несколько принципов, по которым работает семантический поиск. Переменных много, но если понять основы, все будет выглядеть достаточно просто.
Пользователи часто не используют тот же язык, что и нужный контент
Иногда человек даже не знает, как правильно сформулировать поисковый запрос. Например, вы услышали какую-то песню по радио и не успели включить Шазам. Придется наугад вводить разные словосочетания, чтобы найти название трека:
А теперь можно сравнить то, что вы вводите в строку поиска, с тем, что говорите голосовым помощникам. Ключевые слова становятся разговорными.
Есть много способов выразить мысль. Поисковикам приходится иметь дело с каждым — им нужно уметь сопоставлять содержание своего индекса с поисковым запросом, основываясь на значении и того, и другого.
Многие запросы многозначны
40% слов в английском языке имеют два и более значений. Это самая значительнаЯ проблема, которую пытается решить семантический поиск.
Например, слово «python» в США имеет 533 тыс. запросов:
Если запрос вводит программист, он хочет получить техническую статью. Если простой обыватель, ему нужно животное. Слова редко имеют определенное значение без контекста. Помимо многозначных слов у вас есть вариативность частей речи — существительные, прилагательные, глаголы, которые могут быть образованы друг от друга.
Все становится еще сложнее, когда мы углубимся в предполагаемые значения (подумайте о сарказме).
Контекст определяет значение в семантическом поиске. Это приводит нас к двум следующим выводам.
Необходимо понимать лексическую иерархичность и отношения сущностей
Давайте посмотрим на следующий запрос и топовый результат поиска:
Вот, что нужно поисковику, чтобы понять этот запрос:
- «Партнер» означает мужа, жену, парня, девушку, супруга.
- Выяснить, что Оби-Вана Кеноби играли в разных фильмах разные актеры.
- Установить связи.
- Отразить их в результатах поиска.
Представьте, каким бы был ответ в 2010 году.
Лексическая иерархичность иллюстрирует отношения между словами. Слово «партнер» располагается выше по отношению к «жена», «супруг» и т. д. Наши запросы часто не соответствуют точной формулировке желаемого контента.
Связи — в данном примере — персонажи в фильмах и сериалах, люди с определенной профессией — «актер», и люди, с ним связанные. Другими словами, связи — это объекты или концепции, которые можно определить единственным образом.
Необходимо отражать личные интересы и тенденции
Независимо от того, насколько нам не нравится способы, которыми используют наши персональные данные, как минимум, это полезно для поисковых систем. Google использует их вместе с историей поисковых запросов, чтобы предоставить наиболее релевантные результаты.
Введите в строку любой тип компании услуг, и получите результаты из вашего района:
Google способен временно корректировать результаты поиска, основываясь на динамических целях.
Например, коронавирус не новый термин. Это всегда было названием группы вирусов. Но, как мы знаем, в начале 2020 года изменился поисковый интент. Люди начали гуглить статистику и симптомы.
Как видно из истории позиций для этого запроса, ни один из результатов не ранжировался до 2020 года.
То же самое можно увидеть в е-коме во время крупных распродаж. Поисковый интент в это время транзакционный, в то время как люди ищут сравнения или обзоры.
Какие технологии использует Google для семантического поиска
Google постоянно выкатывает обновления, которые улучшают поиск и его возможности распознавания естественного языка. Есть четыре аспекта.
Граф знаний
Вышел в 2012 году. Это база знаний об объектах и их отношениях друг с другом. Вы можете представить это примерно как на скриншоте ниже. Всего сущностей больше 5 миллиардов:
Если кратко, технология позволила перейти от сопоставления ключевых слов к сопоставлению смыслов. Есть два основных метода интерпретации графа знаний:
- структурированные данные;
- извлечение сущности из текста.
Колибри
В 2013 году Гугл запустил алгоритм Колибри, чтобы получить лучшие результаты поиска. Это было полезно для сложных поисковых запросов.
Колибри — первое большое обновление, которое подчеркивало важность поисковых запросов по отдельным ключевым словам. Это был необходимый рычаг, чтобы показать важность написания контента на определенные темы, а не по собранным ключам.
RankBrain
Если вы когда-то видели фразу латентно-семантическое индексирование или LSI, забудьте. Google убрал проблему, которую пытались решить с помощью LSI, введя алгоритм RankBrain.
Речь шла о несоответствии между языком запроса и итоговым контентом. RankBrain работает с технологиями, которые превосходят LSI. С точки зрения непрофессионала алгоритм может понять значение даже незнакомых слов и фраз, потому что использует машинное обучение.
Можно считать RB обновлением Колибри, а не отдельным алгоритмом поиска. Это один из самых сильных сигналов ранжирования, но единственное, что можно сделать для его оптимизации — сделать контент подходящим для поискового интента.
BERT
Следующая веха в совершенствовании семантического поиска. С 2019 года влияет на 10% запросов по всему миру.
BERT улучшает понимание длинных и сложных предложений и запросов. Это решение для устранения двусмысленности, потому что оно пытается понять контекст каждого слова.
Как адаптировать SEO для семантического поиска
Есть 6 практик, которые помогут.
1. Фокусироваться на темах, а не на ключевых словах
Когда-то вы могли получить высокий рейтинг для отдельных частей контента на одну и ту же тему, используя чуть различающиеся ключевые слова, например:
- open graph tags
- open graph meta tags
- og meta tags
- open graph tag
- what is open graph
- facebook open graph tags
Теперь Google понимает, что все эти запросы значат одно и то же, и присваивает им одни и те же страницы.
Цель сейчас не в ранжировании строго по определенному ключу, а в углубленном охвате темы, чтобы Google оценил страницу по множеству похожих ключей разной длины.
Статья Ahrefs о метатегах OpenGraph подходит для сотни ключей. Многие их них — разные варианты поиска одного и того же контента.
Ahrefs могут ранжироваться по всем этим ключевым словам, потому что написали большую и подробную статью, а не только описали основной ключ.
Посмотрите на отчет Топ-страницы по нужному вам запросу. Проанализируйте контент, смысловые блоки и подтемы. Например, пишем про выращивание спаржи. Если посмотреть на топ выдачи и заглянуть в отчет о ключевых словах, можно увидеть следующее:
- how deep to plant asparagus
- asparagus growing conditions
- when to plant asparagus
- best place to plant asparagus
- how to harvest asparagus
- how to care for asparagus plants
Все это нужно упомянуть в статье, чтобы сделать подробный контент, который будет получать органический трафик.
Но помните о том, что вовсе не обязательно углубленно описывать каждый аспект. Взять статью, которую вы сейчас читаете: можно потратить десятки часов на изучение алгоритмов машинного обучения, а потом подробно про них написать. Но читателям это не нужно.
2. Не забывать про поисковый интент
Например, вы — специалист по маркетингу, хотите написать статью об отчетности по SEO. Естественно, желаете поделиться всей необходимой информацией по этой теме, например, «Используйте всю мощь запросов для создания лучшего SEO-отчета».
Это может стать частью контента, которая рассказывает о главной теме — отчетности. Но большинство людей, которые ищут этот запрос, вряд ли знакомы с описываемыми функциями. Они просто ищут инструмент, который сделает часть работы за них.
Поэтому перед написанием оцените страницы в топе выдачи, чтобы понять намерение пользователей, которые это будут искать.
3. Используйте семантическую разметку HTML
Перед переходом к семантическому поиску, всем пришлось освоить семантический WEB. Изначально концепция WWW толковалась как стандартизированные взаимосвязанные документы без явного значения. Сейчас это не так.
И все начинается с гиперразметки. Сравните эти элементы HTML:
Семантический HTML добавляет значение в простой код: машина может распознавать отдельные блоки навигации, подвал и футер, таблицы или видео.
В HTML5 есть отдельные разметки для элементов, которые присутствуют в большинстве CMS. А если такого в вашей системе управления контентом нет, наверняка все можно решить плагинами.
Но семантический HTML все еще ограничен. Он сообщает, какой тип контента есть на странице, но не передает его значения. Поэтому….
4. Используйте микроразметку
Микроразметка — это дополнительный способ указать тип контента на странице. Другое название — структурированные данные.
В Schema.org есть сотни типов для данных. Вы можете использовать их для разметки контента таким образом, чтобы его легко понял Google.
Например, для блюда можно указать количество калорий и длительность приготовления. А когда пользователь захочет узнать, сколько времени нужно для варки пельменей, Google представит ответ лучшим образом.
5. Создайте свой бренд, чтобы попасть в Граф знаний
Заголовок в значительной мере говорит сам за себя. Об этом есть большая статья на английском.
Среди всех советов этот самый трудный. Это долгосрочное выстраивание присутствия бренда в интернете разными способами — от рекламы до контент-маркетинга.
6. Указывайте релевантность при помощи ссылок
Ссылки всегда были одним из основных показателей актуальности. Если документ А связан с документом Б, их можно рассматривать как связные сущности.
И внутренние, и внешние ссылки с релевантных страниц с естественным анкором помогают Google понять, какой контент на дочерней странице.
Заключение
Семантический поиск изменил всю экосистему контента в интернете. Пользователи получают релевантный и качественный контент по запросу. А это мотивирует авторов такой контент производить.
Принципы семантического поиска легко понять — нужно только правильно их интерпретировать и применить для своего сайта.