Утечка данных об алгоритмах и факторах ранжирования Google

Главная Новости

Как извлечь пользу из утечки факторов ранжирования Google?

17 Июня 2024

Руководитель развития проекта «Пиксель Тулс»

Как извлечь пользу из утечки факторов ранжирования Google?

Сегодня, мы расскажем вам об утечке факторов ранжирования Google и расскажем, как это можно использовать для улучшения ваших SEO-экспериментов и стратегий.

В конце мая, была обнаружена утечка документа из публичной платформы Google Cloud под названием Document AI Warehouse, которая используется для анализа, организации, поиска и хранения данных. Эта публичная документация называется Document AI Warehouse overview. В сообщениях говорится, что «утечка» данных — это «внутренняя версия» публично доступной документации Document AI Warehouse.

Это, похоже, ставит крест на идее, что «утечка» данных представляет собой внутреннюю информацию Google Search.

Важно относиться к этим данным непредвзято, потому что многое в них не подтверждено. Например, неизвестно, является ли это внутренним документом команды ответственной за развитие поиска. Поэтому, вероятно, не стоит воспринимать эти данные как истину в последней инстанции. Также не стоит анализировать данные, чтобы подтвердить свои давние убеждения. Так человек попадает в ловушку Confirmation Bias.

Confirmation Bias — это тенденция искать, интерпретировать, отдавать предпочтение и воспринимать информацию таким образом, чтобы она подтверждала или поддерживала прежние убеждения или ценности.

Как извлечь пользу из утечки факторов ранжирования Google?

Такое поведение приводит к тому, что человек отрицает то, что эмпирически является правдой. Например, существует давняя идея, что Google автоматически не дает новым сайтам ранжироваться — теория, называемая «песочницей». Люди каждый день сообщают, что их новые сайты и новые страницы почти сразу попадают в первую десятку поиска Google. Но если вы твердо верите в «песочницу», то такой реальный опыт будет отвергнут, сколько бы людей ни наблюдали обратное.

Единственный вопрос, который мы должны себе задать, изучая этот документ, звучит так: «Как я могу проверить и узнать как можно больше из этих данных?» SEO — это прикладная наука, где теория не конечная цель, а основа для экспериментов.

14 000 идей для тестирования

Лучшего рассадника идей для тестов и не придумаешь. Но мы не можем тестировать все факторы одинаково. У них разные типы (число/целое число: диапазон, булево: да/нет, строка: слово/список) и время реакции (имеется в виду скорость, с которой они приводят к изменению органического ранжирования).

В результате мы можем проводить A/B-тестирование быстрых и активных факторов, в то время как медленные и пассивные приходится тестировать до/после.

Как извлечь пользу из утечки факторов ранжирования Google?

Сетка 2x2 с осями «Быстрый» - «Медленный» по оси Y и «Пассивный» - «Активный» по оси X, отражающая факторы ранжирования Google.

Систематически тестируйте факторы ранжирования:

Выбираем фактор ранжирования.
Выбор метрики воздействия (успеха).
Определите место тестирования.
Определите тип теста.

Дмитрий Севальнев, евангелист Пиксель Тулс, считает:

«В этом и парадокс подобных утечек, что вроде ВОТ У ТЕБЯ В РУКАХ самое ценное, что есть у поисковой системы, а сделать с этим ты, фактически, почти ничего не можешь =)

— Хорошая идея брать факторы и тестировать работу с ними на реальном проекте. Но, по опыту, это будут делать единицы.

— Можно попробовать построить свою формулу на этих факторах с помощью ML, но, это ещё менее подъёмная задача.

Мы просто изучаем списки, читаем описания. Чем-то похоже на академическую работу, когда ты повышаешь свою глубину знаний и начинаешь думать, как ПС».

Факторы ранжирования

Большинство факторов ранжирования в утечке — целые числа, то есть они работают на спектре, но некоторые булевы факторы легко протестировать:

Сжатие изображений: Да/Нет?
Навязчивые интерстиции: Да/Нет?
Core Web Vitals: Да/Нет?

Факторы, которые вы можете непосредственно контролировать:

UX (навигация, размер шрифта, межстрочный интервал, качество изображений).
Контент (актуальный, оптимизированные заголовки, отсутствие дублирования, фокус на одном намерении пользователя, указание оригинальных источников, использование канонических форм слова вместо сленга, высококачественный пользовательский контент, автор-эксперт).
Вовлеченность пользователей (высокий процент кликабельности).

Негативные факторы ранжирования:

Ссылки с низкокачественных страниц и доменов.
Агрессивный якорный текст (если только у вас не очень сильный ссылочный профиль).
Плохая навигация.
Плохие пользовательские сигналы.

Факторы, на которые вы можете повлиять только пассивно:

Соответствие заголовка и релевантность между исходным и связанным документом.
Клики по ссылкам.
Ссылки с новых и доверенных страниц.
Авторитет домена.
Упоминания бренда.
PageRank домашней страницы.

Начните с оценки ваших показателей в той области, в которой вы хотите провести тестирование. В качестве примера можно привести Core Web Vitals.

Метрики

Выберите правильную метрику для нужного фактора, основываясь на описании в документе или на своем понимании того, как фактор может повлиять на метрику:

Crawl rate.
Индексирование (да/нет).
Позиция (по главному ключевому слову).
CTR.
Вовлеченность.
Ключевые слова, по которым страница ранжируется.
Органические клики.
Богатые сниппеты.

Где тестировать?

Найдите подходящее место для тестирования:

Если вы настроены скептически, используйте поддомен региона с низким спросом или сайт, на котором можно провести тестирование с низким риском. Если у вас есть сайт на нескольких языках, вы можете внести изменения, основываясь на рекомендациях для одной страны и сравнить относительную эффективность с основной страной.
Можно ограничить тесты одним типом страниц или подкаталогом, чтобы максимально изолировать воздействие.
Ограничьте тесты страницами с определенным типом ключевого слова (например, «Лучший X») или намерением пользователя (например, «Прочитать отзывы»).
Некоторые факторы ранжирования являются общесайтовыми сигналами, например авторитетность сайта, а другие — специфическими для страниц, например количество кликов.

Тестировать или нет?

Факторы ранжирования могут работать как вместе, так и против друг друга, поскольку они являются частью уравнения. Люди, как известно, плохо понимают интуитивно функции с большим количеством переменных, поэтому мы, скорее всего, недооцениваем, как много зависит от достижения высоких результатов по весомым факторам, но также и то, как несколько маленьких переменных могут существенно повлиять на результат.

Как извлечь пользу из утечки факторов ранжирования Google?

Высокая сложность взаимосвязи между факторами ранжирования не должна удерживать нас от экспериментов. Агрегаторам тестировать легче, чем интеграторам, потому что у них больше сопоставимых страниц, которые приводят к более значимым результатам. Интеграторы, которым приходится самим создавать контент, имеют различия между всеми страницами, по итогу они размывают результаты тестов.

На этот счет Дмитрий Севальнев рекомендует:

«Мы в российском сегменте немного избалованы утечками из других поисковых систем… =)

Из мыслей:

— Инженеры поисковых систем мыслят в одну сторону. Если что-то работает, скажем, в Яндексе, то оно с большой долей вероятности есть и в Google.

— Всё, что вы придумаете и что будет иметь логику — будет в поисковой системе!

— Google и правда более замороченный в плане ссылочных факторов.

Каждая ссылка — под микроскопом!»

Сергей Просветов, старший SEO-специалист команды Пиксель Плюс, поддерживает мнение Дмитрия:

«Одна из самых обсуждаемых тем сегодня, при этом уверенно сказать, что мы сейчас проработаем 2-3 пункта и сайт займет лидирующие позиции – нельзя.

«Вот тебе слитые данные Google, почему мы еще не в ТОПе!?»

Если предположить, что факторы являются частью общего уравнения, едва ли получится достигнуть высоких результатов влиянием на какие-то отдельные из них (как последнее время ПФ в Яндексе).

Более того, нет гарантий, что целенаправленно усилив влияние каких-то отдельных факторов (например, ссылочное или поведенческие), мы не сделаем только хуже.

В конечном итоге мы не отходим от концепции комплексного развития проектов с тестированием гипотез.»

Игорь Хомяков, руководитель SEO-производства Пиксель Плюс настроен более рационально:

«К сожалению, того, что мы действительно можем применить на практике не так и много. В сведениях нет четкого руководства к действию, когда взяли один или несколько факторов, проработали документ/сайт и далее получили рост видимости/трафика. Там вы не увидите однозначных критериев по оптимизации Title или того какие и сколько блоков должно находиться на странице, чтобы она ранжировалась в ТОП-10.

Я бы слитые данные предложил рассматривать в плоскости исследовательской деятельности:

сопоставления факторов, подходов к ранжированию Google и Яндекс (по последнему в прошлом году также была утечка) с целью понять, насколько они схожи;
повышения своих знаний касательно работы поиска. Именно так, кстати, поступили западные специалисты в области SEO, когда была утечка Яндекса. Они рьяно разбирали полученные данные, формировали дискуссионные площадки, всяческие материалы и, самое главное, экстраполировали полученные знания на работу ПС Google.

Знание действительно сила, ведь в руках пытливого SEO-шника они перевоплощаются в мощнейшие инструменты осознанного контроля и управления поисковой оптимизации любых сайтов. Каждая гипотеза, каждое действие и принятое решение будет находиться в реальной «зоне влияния» на документ и сайт в целом».

Системы мониторинга

Тестирование дает лишь первоначальный ответ на вопрос о важности факторов ранжирования. Мониторинг позволяет измерить взаимосвязь с течением времени и прийти к более надежным выводам.

Идея заключается в том, чтобы отслеживать метрики, отражающие факторы ранжирования, как CTR может отражать оптимизацию заголовков, и строить графики с течением времени, чтобы увидеть, приносит ли оптимизация плоды. Идея ничем не отличается от обычного (или того, что должно быть обычным) мониторинга, за исключением новых метрик.

Вы можете настроить мониторинг проекта в Пиксель Тулс, используя Группы URL, проводите тестирование, отслеживайте эффективность ваших доработок и масштабируйте результаты на весь домен.

Как извлечь пользу из утечки факторов ранжирования Google?

Пример метрик

Измерьте метрики по типу страницы или группе URL-адресов с течением времени, чтобы оценить влияние оптимизации. На какие метрики можно ориентироваться?

Вовлеченность пользователей:
- Среднее количество кликов по навигации.
- Средняя глубина прокрутки.
- CTR (от SERP к сайту).
Качество обратных ссылок:
- % ссылок с высокой степенью соответствия темы/заголовка между источником и целью.
- % ссылок со страниц, которые моложе 1 года.
- % ссылок со страниц, входящих хотя бы по одному ключевому слову в ТОП-10.
Качество страницы:
- Среднее время пребывания (сравнение между страницами одного типа).
- % пользователей, которые проводят на сайте не менее 30 секунд.
- % страниц, входящих в топ-3 по целевому ключевому слову.
Качество сайта:
- % страниц, которые приводят органический трафик.
- % URL-адресов с нулевым кликом за последние 90 дней.
- Соотношение между проиндексированными и непроиндексированными страницами.

Одним из примеров является сопоставление заголовков исходных и целевых страниц для обратных ссылок. С помощью обычных SEO-инструментов мы можем получить заголовки, якорный текст и окружающий контент ссылки для ссылающейся и целевой страниц.

Затем мы можем оценить тематическую близость или совпадение маркеров с помощью распространенных инструментов искусственного интеллекта, интеграций Google Sheets/Excel или местных LLM и базовых подсказок типа «Оцените тематическую близость заголовка (столбец B) по сравнению с анкором (столбец C) по шкале от 1 до 10, где 10 — это абсолютно одинаково, а 1 — вообще нет связи».

Как извлечь пользу из утечки факторов ранжирования Google?

Собственная утечка

Утечка данных о факторах ранжирования Google — не первый случай, когда внутренняя работа алгоритма крупной платформы становится достоянием общественности:

1. В январе 2023 года утечка из Яндекса раскрыла многие факторы ранжирования, которые мы также обнаружили в последней утечке из Google.

2. В марте 2023 года Twitter* опубликовал большинство частей своего алгоритма. Как и в случае с утечкой из Google, в нем отсутствует контекст между факторами, но, тем не менее, он был очень интересным.

Как извлечь пользу из утечки факторов ранжирования Google?

3. Также в марте 2023 года глава Instagram* Адам Моссери опубликовал подробный пост о том, как платформа ранжирует контент в различных частях своего продукта.

Сергей Просветов, старший SEO-специалист команды Пиксель Плюс, считает:

Вопрос: «SEO мертво или еще нет?» в условиях утечки данных Яндекса и Google об алгоритмах ранжирования, играет новыми красками.

Не сказать, что информация «открыла Америку», тем не менее ряд пунктов подтвердили определенные догадки относительно влияния на ранжирование документа и сайта в целом.

В любом случае предстоит проверить информацию на практике и протестировать гипотезы с привязкой к полученным данным, чтобы удостовериться, что: «да, вот это действительно имеет место!

Не стоит игнорировать и тот факт, что официального подтверждения / опровержения со стороны Google (на момент написания статьи) так и не последовало, поэтому полностью отказываться от намеченных планов и стратегий продвижения не стоит, а внести корректировки в список задачи и приоритеты — вполне возможно!»

Игорь Хомяков, руководитель SEO-производства Пиксель Плюс, на вопрос «Открыли ли вы для себя что-то новое с данной утечки?», отвечает:

«Я бы сказал — расширил горизонты. Это как смотреть на мир через узкую щель, ты вроде бы видишь очертания предметов, движения каких-то тел, а что-то и целиком.

Общую же картину составляешь из части увиденного, домысленного. А потом тебе дают кольцевую пилу на 81 мм и ты делаешь круглое отверстие. Стал ли ты больше видеть? Безусловно. Увидел ли ты все? Конечно нет.

Чтобы увидеть весь мир, нужно снести это забор. А когда снесешь его, то всегда встанет вопрос: а как ты его понимаешь? И вот тут уже нужно работать с «заборами» в своей голове.»

Чем больше платформа поощряет вовлеченность в свой алгоритм, тем сложнее с ней взаимодействовать. И все же утечка информации об алгоритме Google весьма интересна, поскольку это платформа, ориентированная на намерения, где пользователи указывают на свои интересы через поиск, а не через поведение.

В результате знание ингредиентов для торта — это уже большой шаг вперед, даже если не знать, сколько каждого из них использовать.

Связана ли утечка данных с поиском Google?

На данный момент нет никаких веских доказательств того, что утечка данных действительно связана с Google Search. Существует огромное количество неясностей относительно назначения этих данных. Примечательно, что есть намеки на то, что эти данные являются внешним API для создания хранилища документов, как следует из названия и никак не связаны с тем, как сайты ранжируются в Google Search.

Вывод, что эти данные были получены не из Google Search, на данный момент не является окончательным, но именно в этом направлении дует ветер доказательств.

* Организации запрещенные на территории Российской Федерации.

Рейтинг новости

5 (2 оценки)

Задайте вопрос или оставьте комментарий

ТОП-4 популярных инструментов

Список URL в ТОП

Сервис для быстрой выгрузки ТОП-10 до ТОП-200 сайтов по заданным поисковым запросам в Яндекс и Google. Получение списка URL в ТОПе с выбором региона по заданной глубине проверки

ИИ-генератор изображений

Онлайн-генерация картинок из текста на русском языке нейросетями Midjourney, Dall-E 3, Leonardo AI. Просто введите описание и искусственный интеллект (ИИ) создаст красивое и уникальное изображение.

Проверка индексации страниц в Яндексе и Google

Онлайн-сервис поможет узнать возраст сайта (домена) в днях, дату первой индексации и дату кэша страницы в Яндексе

Проверка кода ответа, скорости загрузки и размера страниц

Онлайн-сервис поможет измерить скорость загрузки сайта и определить размер документа. Узнайте время отклика сервера и время загрузки исходного кода