Поиск

Как Google корректирует результаты SERP? Обзор важного патента о работе алгоритма поисковика

09 Октября 2019

Страсть Билла Славски — патенты Google. Он настоящий гик и изучение патентов для него сродни чтению романов или новостей о фильмах Marvel. Билл оказывает SEO-специалистам неоценимую услугу — находит самые важные для оптимизаторов патенты, которые помогают выявить ряд проблем, с которыми сталкивается Google, и понять, как работают алгоритмы, чтобы их устранять.

Например, патент от 2 июля 2019 года, который будем рассматривать, демонстрирует состояние нынешних алгоритмов Google:

Как правило, за поисковые операции отвечает надежный алгоритм, который работает с широким спектром ресурсов. Однако для формирования результатов выдачи специфика и особенности одних запросов и наборов ресурсов могут быть важнее, чем для других.

Например, для конкретного запроса с определенными терминами наличие этих терминов на ресурсах может очень сильно повлиять на результаты выдачи и наоборот, для другого запроса с другими терминами гораздо большее влияние может оказывать авторитет ресурса, нежели наличие терминов из запроса.

Тем не менее, относительную важность конкретных характеристик для конкретных запросов и ресурсов зачастую трудно, если не невозможно, предсказать априори.

Недавно «Пиксель Тулс» публиковали результаты опроса SEO-специалистов, большинство из которых уверены — различные запросы Google ранжируют по-разному, что и подтверждается патентом.

Вес факторов ранжирования в Google для разных запросов

Таким образом, Google может корректировать функции ранжирования для различных типов запросов и перераспределить результаты выдачи.

Поэтому процесс, описанный в патенте, включает:

  • Получение данных с доменов, идентифицированных поисковиком, как соответствующих запросу, и их ранжирование в соответствии с первым порядком. При этом, каждый ресурс получает оценку, по которой занимает место в выдаче относительно других ресурсов, также идентифицированных алгоритмом как соответствующих запросу. Оценка частично происходит на основе характеристиках ресурса, самого запроса и полученном наборе доменов.

  • Определение, на основе первичных результатов SERP и по каждой из характеристик ресурсов и запроса, меры воздействия данных признаков на ранжирование доменов.

  • Переоценка ресурсов (переранжирование), основанная в соответствии со вторым порядком ранжирования, отличным от первого.

  • Предоставление пользователю ответов на запрос по второму порядку ранжирования.

Получается, что Google для любых запросов сначала оценивает первичный набор документов, анализирует особенности запроса и набора страниц, переоценивает, если необходимо, и отдаёт пользователю откорректированные результаты.

Корректировка результатов выдачи и ранжирование второго порядка

Патент также включает перечень преимуществ использования данной механики и прогнозируемые результаты:

  • Поисковые функции могут корректироваться с учетом новых явлений, влияющих на скоринг (оценку) ресурсов = процесс переранжирования в поиске.

  • Эти корректировки могут быть произведены во время запроса, так что основная поисковая функция не нуждается в корректировке и по-прежнему строится на основополагающих приоритетах.

  • Такой подход позволяет сохранить основополагающую поисковую функцию, которая хорошо работает для большинства ресурсов, а также обеспечивает гибкость в корректировке для каждого запроса, если конкретные особенности влияют на ранжирование и могут привести к отклонениям от ожидаемых результатов.

  • Переоценка результатов ранжирования в соответствии с корректировками, как правило, выявляет более значимые ресурсы, способные удовлетворить информационные потребности пользователя, тем самым повышая качество пользовательского опыта.

Оригинальное описание патента доступно по ссылке.

Inventors: Trystan G. Upstill, Andre Duque Madeira, Wisam Dakka and Zhong Xiu
Assignee: Google LLC
US Patent: 10,339,144
Granted: July 2, 2019
Filed: May 21, 2015

Подробнее о корректировке результатов SERP

Вот с чем могут быть связаны подобные корректировки и переоценка:

  • Поиск информации, в которой важна точность и полнота, но не в качестве абстрактных понятий, а вполне измеряемых величин. Например, для текстовой информации они рассчитываются как соотношения.

Мера точности (precision):

Мера точности

Мера полноты (recall):

Мера полноты

relevant documents — релевантные документы
retrieved documents — все найденные документы

  • Относительная авторитетность источника в общем графе ресурсов Google.

  • Термины и условия запроса.

  • Фидбек пользователей относительно ресурса по запросу и другим запросам.

Важно: к фидбеку пользователей, судя по всему, приравниваются логи запросов, кликов и история поиска.

Данные о кликах и результатах выдачи хранятся в логах. Логи запросов и кликов определяют историю поиска, которая включают в себя данные из предыдущих поисковых запросов и связанных с ними.

Такая информация может храниться в виде баллов и фидбека для запросов и ресурсов.

В патенте говорится, что подобные особенности могут быть смоделированы в поисковой системе в виде параметров, и для каждого параметра могут быть выбраны различные значения.

Что касается важности и влияния факторов ранжирования для различных типов запросов или «свежих» тем в Интернете, то интересен следующий пример в патенте:

Кроме того, такое влияние может быть краткосрочным. Например, для новой предметной области (темы) сама информация может иметь приоритет в течение первых нескольких недель, а позднее большее влияние получат авторитет источника и отзывы пользователей.

Таким образом, компенсация этих особенностей затруднена до их обнаружения, если не невозможна.

Если вы когда-нибудь замечали резкую перемену в SERP по новой теме, то, вероятно, это тот самый случай «обнаружения» особенностей и переоценка.

Следующий абзац подтверждает концепцию «поискового дарвинизма», о котором рекомендуем прочитать здесь. Суть в том, что Google рассчитывает коэффициенты для каждого фактора и присваивает соответствующие баллы для параметров, что подтверждается в патенте:

Поисковая система использует функцию, которая генерирует баллы для источников и ранжирует ресурсы на основе этих оценок. Релевантность ресурса определяется на основе количественных оценок, которые в свою очередь базируются на различных факторах. Такие факторы включают баллы информационного поиска («IR»), баллы отзывов пользователей и, опционально, рейтинг каждого ресурса по отношению к другим ресурсам (например, баллы авторитетности).

Что в итоге?

1. Патент сообщает — в Google запросы ранжируются по-разному. Имеет значение не только характер запроса, но и характеристики первичного набора идентифицированных документов.

2. Вес факторов может корректироваться со временем на основе различных данных, в том числе логов о пользовательских кликах. То есть, по ряду ключевых фраз возможна переоценка влияния различных факторов ранжирования.

Что с этим делать?

Анализировать выдачу Google на предмет интента и характеристики конкурентов из ТОПа:

Узнайте, как увеличить SEO‑трафик сайта в 3+ раза?

Укажите домен вашего сайта, приоритетные регионы продвижения и получите самый
полный список точек взрывного роста трафика и заявок с вашего сайта

Выберите ваш сайт
 
укажите сайт, регион и близких вам конкурентов
Немного магии поисковой
оптимизации —
мы подготовим для вас не менее 25 персональных рекомендаций
Отслеживайте прогресс
 
и получайте регулярные советы, рост трафика и продаж

Задайте вопрос или оставьте комментарий

Инструменты доступны после быстрой регистрации

?
Прочитал и принимаю условия Оферты сервиса.