Новый поисковый алгоритм Королёв в Яндексе — влияние на SEO, качество и логика работы

Главная

Самостоятельно

Статьи

Алгоритм Яндекса «Королёв»

— по оценке 3 пользователей

28 августа, 23:15

Дмитрий Севальнев

28 августа, 23:15

24975

Содержание

Влияние алгоритма на запросы разных типов

Сравнение: Яндекс versus Google

Значимость для SEO

Техническая реализация

Дальнейшее развитие подхода

Полезные ссылки

Размер текста:

Искусственная нейронная сеть со скрытыми слоями, «длинный хвост», дополнительный индекс и поиск с учётом семантического соответствия («смысла»).
Хм, серьёзно? Вместе разбираемся с новым алгоритмом Яндекса.

Иллюстрация для наглядности

Во второй половине августа Яндекс запустил новый алгоритм с названием «Королёв». Официальный анонс состоялся 22 августа 2017 года в блоге Яндекса для вебмастеров [1] и в блоге на Хабрахабре [2]. Реальные же изменения выдачи — были заметны и ранее, благодаря анализатору апдейтов выдачи «Пиксель Тулс».

Основная задача: улучшение качества выдачи по многословным низкочастотным запросам, по которым качество выдачи было низким (заведомо хуже, чем у Google — основного конкурента в рунете). В данный сегмент фраз часто попадают и голосовые запросы, заданные с переносных устройств на естественном языке (растущий спрос).

Что отличает данный алгоритм «Королёв» от предыдущего «Палеха» [3]? Добавление в общий набор факторов ранжирования, которые учитывают:

Схожесть того «смысла», который скрыт в поисковой фразе и «смысла» всего документа, а не только заголовка окна браузера Title.
Качество ответа документа на схожие по «смыслу» запросы пользователей.
Новая техническая реализация с расчётом ряда факторов на этапе индексирования и внедрением дополнительного индекса (см. ниже).

Чтобы понять, какой смысл* вкладывает пользователь в поисковый запрос и какой смысл раскрывается в тексте страницы — используется нейронная сеть. То есть, нейронная сеть как один из методов машинного обучения, лежит в основе вычисления ряда новых факторов, которые далее используются в алгоритме ранжирования.

^* — далее мы будем употреблять это слово без кавычек, но важно понимать, что «смысл», который вычисляется с помощью компьютерного алгоритма и реальный смысл, который вкладывает в запрос/документ автор — неэквивалентные понятия.

Влияние алгоритма на запросы разных типов

В первую очередь, «Королёв» затрагивает ранжирование по длинным и/или редким поисковым запроса, которые часто задаются на естественном языке. Пример: [фильм где человек бежит из тюрьмы после очень долгой отсидки].

С точки зрения SEO-классификации это НЧ- и мНЧ-запросы, как правило, информационные, но возможных и коммерческие варианты, скажем: [купить штуку которая крутиться на пальцах]. Именно данный сегмент поисковых фраз носит название «длинного хвоста». На него приходится более 34% запросов из потока.

На текущий момент, для ряда запросов, по которым новая группа факторов получила высокую значимость, но поисковая система не до конца уверена в корректности его применения — проводится анкетирование пользователей (Рис. 1).

Опрос по качеству на странице выдаче Яндекса
Рис. 1. Яндекс уточняет у пользователя, корректно ли была повышена значимость новой группы факторов для запроса
[как называется бритва в стиле ножа], какой ответ за вопрос является правильным и где он был найден?

Сравнение: Яндекс versus Google

С запросом, который приведён выше — Google справляется куда лучше, чем Яндекс (Рис. 2), но репрезентативная ли это картина? Для ответа на данный вопрос — выборка была увеличена и проведена ручная оценка качества выдачи по каждому из 127 запросов в режиме «Инкогнито». Исходный файл в TXT-формате, разделитель между колонками — точка с запятой. Данные собраны Викторией Левеной («Пиксель Плюс») через 3 дня после официального анонса.

Сравнение SERP Яндекса и Google
Рис. 2. Сравнение качества выдачи Яндекса и Google по запросу [фильм где человек бежит из тюрьмы после очень долгой отсидки].

В результате анализа SERP двух поисковых систем по пулу запросов, можно сделать следующие выводы:

Качество отработки алгоритмов «Королёв» и «RankBrain» — является соизмеримым.
В большинстве случаев (около 70% из выборки) — SERP оказывается схожим по качеству, что может говорить о близости самих алгоритмов реализации (напомним, что «RankBrain» был запущен в Google в октябре 2015 года).
Доля запросов, для которых алгоритмам удается успешно угадывать смысл, заданного на естественном языке составляет около 80% из выборки (полнота).

Итоги работы ПС по выборке
Рис. 3. Итоговые показатели работы алгоритмов Яндекса и Google по выборке мНЧ-фраз.

Значимость для SEO

Как сказывается новый алгоритм ранжирования Яндекса на поисковой оптимизации (SEO)? Фактически, наиболее значимые изменения наблюдаются лишь для фраз, по которым нет достаточного количества релевантных ответов с классической точки зрения (нет страниц с точными вхождениями фраз и высокой частотой встречаемости термов). Это значит, что ранжирование по частотным запросам, по которым продвигается большинство коммерческих проектов претерпит минимальные изменения за счёт вклада новой группы факторов.

Как показывает практика, значительно чаще точное вхождение ключевой фразы (если оно есть) «побеждает» вклад новой группы факторов в ранжирование. Для примера рассмотрим запрос [ленивая кошка из монголии], который упоминался в презентации алгоритма как один из тех, по которому «Королёв» помогает найти короткий и правильный ответ — манула.

На иллюстрации ниже (Рис. 4) видно, что хотя алгоритм и угадывает смысл фразы (объектный ответ справа [4]), но выше в SERP оказываются документы с вхождениями слов из запроса и точным вхождением в тексте (те же анонсы), что наглядно подтверждает гипотезу. Это одна из причин, по которой примеры, которые публично анонсируют для иллюстрации отработки алгоритма перестают «работать» после пресс-релиза.

Текущая выдача Яндекса
Рис. 4. Текущий «сломанный» вид SERP Яндекса по запросу из презентации.

Итого: если SEO-специалист провёл работы по улучшению «классических» факторов ранжирования, то URL будет хорошо ранжироваться по нужной НЧ-фразе. Здесь революции нет.

В коммерческом ранжировании, при прочих равных, новая группа факторов, конечно, может вносить некий вклад в ранжирование. Для улучшения значений по ней используются приёмы LSI-копирайтинга.

Техническая реализация

Для ускорения формирования ответа на запрос пользователя, используется не только итоговая формула ранжирования. Имеется несколько этапов, каждый из которых отбирает претендентов для следующего, более «тяжелого» алгоритма (Рис. 5).

Четыре этапа ранжирования
Рис. 5. Этапы ранжирования в поисковой системе Яндекс (фильтрация / кворум, Fast Rank, моном или частичное выполнение Матрикснет и итоговая формула релевантности).

Так как вычисление смысла для большого числа текстов на лету является длительной задачей, то данный процесс был сдвинут с финальной стадии ранжирования (как было в «Палехе») на этап индексирования.

Для ускорения финальной стадии ранжирования и освобождения вычислительных ресурсов был введён дополнительный индекс, который содержит уже вычисленную информацию об «ориентировочной» релевантности всех документов для всех одиночных слов и популярных пар слов, которые встречаются в запросах пользователей. Данный шаг позволил высвободить для поиска вычислительные мощности, которые необходимы для отработки сложных моделей, основанных на нейронных сетях (новый набор факторов).

Обучение нейронной сети производилось опираясь на многочисленные асессорские оценки и поведение пользователей. Напомним, что для увеличение общего числа оцененных пар запрос-документ, Яндексом был запущен публичный сервис «Толока» [5], который позволил кратно увеличить число асессоров и самих оценок (Рис. 6).

Сервис Толока
Рис. 6. Внешний вид сервиса Яндекс.Толока для исполнителя заданий (асессора).

Вторая причина причина по которой примеры, которые публично анонсируют перестают «работать» состоит именно в резком изменении паттерна поведения пользователей по ним и росте их популярности.

Дальнейшее развитие подхода

Машинное обучение используется в поиске Яндекса для построения формулы ранжирования начиная с 2009 года [6]. Итоговая формула и сейчас формируется благодаря методу Матрикснет, но ряд факторов в ней являются «непростыми» и сами получены с помощью нейронных сетей (машинного обучения). В каком-то смысле — матрёшка.

В дальнейшем планируется:

Улучшение качества оценки семантического соответствия (смысла) запроса и страницы.
Повышение полноты отработки.
Изменение логики фильтрации документов на стартовом этапе L0 (Рис. 5) — прохождения кворума.
Добавление к модели вектора персональных интересов пользователя (персонификация выдачи).

Вместе следим за развитием событий!

Полезные ссылки

Поиск, который мы делаем вместе, 2017, https://yandex.ru/blog/company/korolev
Как Яндекс научил искусственный интеллект понимать смысл документов, 2017, https://habrahabr.ru/company/yandex/blog/336094/
Все алгоритмы Яндекса по годам, хронология 2007–2017, 2016–2017, https://pixelplus.ru/samostoyatelno/stati/prodvizhenie-saytov/algoritmy-ranzhirovaniya-yandex.html
Объектный ответ, 2015, https://yandex.ru/company/technologies/entity_search/
Яндекс.Толока, 2014, https://toloka.yandex.ru/
Матрикснет, 2009, https://yandex.ru/company/technologies/matrixnet

Автор

Дмитрий Севальнев

Канал про развитие бизнеса

от Дмитрия Севальнева

Перейти

Канал про SEO‑продвижение

от Сергея Просветова

Перейти

Кейсы, инсайты и внутрянка ПИКСЕЛЬ ПЛЮС

Перейти

Подписывайтесь
на рассылку

Понравилась статья?

— по оценке 3 пользователей

28 августа, 23:15

Оставить комментарий

Комментариев пока что нет

Наши достижения

Входим в число лучших компаний России в сферах интернет-рекламы и разработки сайтов по результатам самых авторитетных рейтингов

Победитель в номинации «SEO для e-commerce» по итогам WORKSPACE DIGITAL AWARDS 2025

Победитель в номинации «SEO под ключ» по итогам WORKSPACE DIGITAL AWARDS 2024

Рейтинг с самой прозрачной методологией SEO глазами клиентов 2023

Рейтинг известности SEO-компаний 2020 по версии SEO-news

Подробнее о компании Наши достижения

Другие статьи автора

Вернуться в раздел

Как продвигать свои товары на ...
Какие карточки товара «любит» Озон, по каким принципам их ранжирует, как получить трафик и увеличить продажи на этой площадке?
1 апреля
9 способов продвижения товаров...
В 2021 и 2022 году популярность маркетплейсов продолжает расти, что говорит о большом потенциале этого направления для бизнеса.
28 февраля
Создаем идеальную карточку тов...
Повышаем продажи за счет оформления карточек товаров и удерживаем клиентов.
28 февраля
Что такое продвижение по трафику?
Что такое продвижение по трафику и когда его нужно использовать?
10 декабря
Кто такие асессоры Яндекса и G...
Асессоры поисковой системы могут понизить ваш сайт? Как угодить асессорам Яндекса и Google?
9 ноября
Что такое семантическое ядро и...
Сбор семантического ядра (СЯ) — сложная и трудоемкая задача. Уже на этом, втором этапе продвижения сайта часто буксуют новички. Расскажем, что предста...
8 ноября
С чего начать продвижение сайта?
5 самых важных шагов при запуске продвижения своего сайта. Строим систему самостоятельно.
24 октября
Добавляем микроразметку через GTM
Провели эксперимент с целью проверить возможность добавления микроразметки на URL через Google Tag Manager.
1 октября
Рейтинг факторов ранжирования ...
Точная оценка важности факторов ранжирования сайтов в Google.
17 августа
Гостевой доступ к Яндекс.Метрике
Как быстро предоставить гостевой доступ? Пошаговая инструкция из 5 действий.
19 мая
Что такое лид-магнит?
Как с помощью этого инструмента можно уменьшить CPA и кратно повышаем конверсию привлекаемого трафика.
30 апреля
Поисковое пространство
Как работать с поисковым пространством и что входит в его оптимизацию? Работа с выдачей в целом.
15 апреля

‹ ›

Другие статьи рубрики

Вернуться в раздел

Все эти ваши E-E-A-T или: что ...
Прошло достаточно времени с момента анонса обновленный концепции E-E-A-T, чтобы учесть их в своих процессах, а также оценить влияние на практике и в р...
19 декабря
Экспертная статья для Google: ...
В декабре 2022 года поисковая система Google обновила свою концепцию E-A-T, добавив еще одну оценку: «E» — Experience (опыт).
29 ноября
Рейтинг факторов E-E-A-T в Goo...
Ранее мы провели опрос ведущих SEO-специалистов с целью выяснить, какие из факторов E-E-A-T наиболее значимы для ранжирования YMYL-проектов в Google.
4 июля
Кто такие асессоры Яндекса и G...
Асессоры поисковой системы могут понизить ваш сайт? Как угодить асессорам Яндекса и Google?
9 ноября
Рейтинг факторов ранжирования ...
Точная оценка важности факторов ранжирования сайтов в Google.
17 августа
Факторы ранжирования в Яндексе
Узнайте точную оценку важности факторов ранжирования, основанную на уникальной базе данных из 1,3 млн запросов и 2 350 сайтах.
31 декабря

‹ ›

Оставьте заявку

Нужна помощь с сайтом? Заполните форму, и наши менеджеры проконсультируют вас уже сегодня!

Согласен с обработкой моих персональных данных в соответствии с политикой конфиденциальности.

* — Поля, обязательные к заполнению.