Как Google корректирует результаты SERP? Обзор важного патента о работе алгоритма поисковика
Страсть Билла Славски — патенты Google. Он настоящий гик и изучение патентов для него сродни чтению романов или новостей о фильмах Marvel. Билл оказывает SEO-специалистам неоценимую услугу — находит самые важные для оптимизаторов патенты, которые помогают выявить ряд проблем, с которыми сталкивается Google, и понять, как работают алгоритмы, чтобы их устранять.
Например, патент от 2 июля 2019 года, который будем рассматривать, демонстрирует состояние нынешних алгоритмов Google:
Как правило, за поисковые операции отвечает надежный алгоритм, который работает с широким спектром ресурсов. Однако для формирования результатов выдачи специфика и особенности одних запросов и наборов ресурсов могут быть важнее, чем для других.
Например, для конкретного запроса с определенными терминами наличие этих терминов на ресурсах может очень сильно повлиять на результаты выдачи и наоборот, для другого запроса с другими терминами гораздо большее влияние может оказывать авторитет ресурса, нежели наличие терминов из запроса.
Тем не менее, относительную важность конкретных характеристик для конкретных запросов и ресурсов зачастую трудно, если не невозможно, предсказать априори.
Недавно «Пиксель Тулс» публиковали результаты опроса SEO-специалистов, большинство из которых уверены — различные запросы Google ранжируют по-разному, что и подтверждается патентом.
Таким образом, Google может корректировать функции ранжирования для различных типов запросов и перераспределить результаты выдачи.
Поэтому процесс, описанный в патенте, включает:
-
Получение данных с доменов, идентифицированных поисковиком, как соответствующих запросу, и их ранжирование в соответствии с первым порядком. При этом, каждый ресурс получает оценку, по которой занимает место в выдаче относительно других ресурсов, также идентифицированных алгоритмом как соответствующих запросу. Оценка частично происходит на основе характеристиках ресурса, самого запроса и полученном наборе доменов.
-
Определение, на основе первичных результатов SERP и по каждой из характеристик ресурсов и запроса, меры воздействия данных признаков на ранжирование доменов.
-
Переоценка ресурсов (переранжирование), основанная в соответствии со вторым порядком ранжирования, отличным от первого.
-
Предоставление пользователю ответов на запрос по второму порядку ранжирования.
Получается, что Google для любых запросов сначала оценивает первичный набор документов, анализирует особенности запроса и набора страниц, переоценивает, если необходимо, и отдаёт пользователю откорректированные результаты.
Патент также включает перечень преимуществ использования данной механики и прогнозируемые результаты:
-
Поисковые функции могут корректироваться с учетом новых явлений, влияющих на скоринг (оценку) ресурсов = процесс переранжирования в поиске.
-
Эти корректировки могут быть произведены во время запроса, так что основная поисковая функция не нуждается в корректировке и по-прежнему строится на основополагающих приоритетах.
-
Такой подход позволяет сохранить основополагающую поисковую функцию, которая хорошо работает для большинства ресурсов, а также обеспечивает гибкость в корректировке для каждого запроса, если конкретные особенности влияют на ранжирование и могут привести к отклонениям от ожидаемых результатов.
-
Переоценка результатов ранжирования в соответствии с корректировками, как правило, выявляет более значимые ресурсы, способные удовлетворить информационные потребности пользователя, тем самым повышая качество пользовательского опыта.
Оригинальное описание патента доступно по ссылке.
Inventors: Trystan G. Upstill, Andre Duque Madeira, Wisam Dakka and Zhong Xiu
Assignee: Google LLC
US Patent: 10,339,144
Granted: July 2, 2019
Filed: May 21, 2015
Подробнее о корректировке результатов SERP
Вот с чем могут быть связаны подобные корректировки и переоценка:
-
Поиск информации, в которой важна точность и полнота, но не в качестве абстрактных понятий, а вполне измеряемых величин. Например, для текстовой информации они рассчитываются как соотношения.
Мера точности (precision):
Мера полноты (recall):
relevant documents — релевантные документы
retrieved documents — все найденные документы
-
Относительная авторитетность источника в общем графе ресурсов Google.
-
Термины и условия запроса.
-
Фидбек пользователей относительно ресурса по запросу и другим запросам.
Важно: к фидбеку пользователей, судя по всему, приравниваются логи запросов, кликов и история поиска.
Данные о кликах и результатах выдачи хранятся в логах. Логи запросов и кликов определяют историю поиска, которая включают в себя данные из предыдущих поисковых запросов и связанных с ними.
Такая информация может храниться в виде баллов и фидбека для запросов и ресурсов.
В патенте говорится, что подобные особенности могут быть смоделированы в поисковой системе в виде параметров, и для каждого параметра могут быть выбраны различные значения.
Что касается важности и влияния факторов ранжирования для различных типов запросов или «свежих» тем в Интернете, то интересен следующий пример в патенте:
Кроме того, такое влияние может быть краткосрочным. Например, для новой предметной области (темы) сама информация может иметь приоритет в течение первых нескольких недель, а позднее большее влияние получат авторитет источника и отзывы пользователей.
Таким образом, компенсация этих особенностей затруднена до их обнаружения, если не невозможна.
Если вы когда-нибудь замечали резкую перемену в SERP по новой теме, то, вероятно, это тот самый случай «обнаружения» особенностей и переоценка.
Следующий абзац подтверждает концепцию «поискового дарвинизма», о котором рекомендуем прочитать здесь. Суть в том, что Google рассчитывает коэффициенты для каждого фактора и присваивает соответствующие баллы для параметров, что подтверждается в патенте:
Поисковая система использует функцию, которая генерирует баллы для источников и ранжирует ресурсы на основе этих оценок. Релевантность ресурса определяется на основе количественных оценок, которые в свою очередь базируются на различных факторах. Такие факторы включают баллы информационного поиска («IR»), баллы отзывов пользователей и, опционально, рейтинг каждого ресурса по отношению к другим ресурсам (например, баллы авторитетности).
Что в итоге?
1. Патент сообщает — в Google запросы ранжируются по-разному. Имеет значение не только характер запроса, но и характеристики первичного набора идентифицированных документов.
2. Вес факторов может корректироваться со временем на основе различных данных, в том числе логов о пользовательских кликах. То есть, по ряду ключевых фраз возможна переоценка влияния различных факторов ранжирования.
Что с этим делать?
Анализировать выдачу Google на предмет интента и характеристики конкурентов из ТОПа:
Рейтинг статьи:
По оценкам 35 пользователей