Александр:

Расскажите, какие важные зоны можно выделить в документе для определения текстовой релевантности?

Или по каким зонам, по вашему мнению, рассчитывается BM25 на документе без учёта входящего анкор-листа?

К примеру, по title и body. Или гораздо шире, например по title, h1...h6, анкоры исходящих ссылок, по подписям, если они в одном блоке с изображениями/видео, комментариям и т.д.

Спасибо за ответ!


20.10.2015

Расчёт BM25 по зонам документа

Приветствую, Александр.

Действительно, вы правы, значение текстовой релевантности по алгоритму BM25 считается по ряду зон документа. Данная модификация алгоритма и носит название BM25F. Буква «F» является сокращением от английского слова field — зона (область) и указывает на расчёт значения релевантности отдельно для определенных зон документа.

Вычисленные по BM25 значения, вероятно, входят в формулу ранжирования Яндекса в качестве отдельных факторов. К числу анализируемых зон относятся:

  1. Заголовок документа Title.
  2. Текст документа, но с рядом модификаций:
    • стандартный вариант
    • с «угасающим» весом от начала документа (приоритет отдается вхождениям в начале текста)
    • только по точным вхождениям
    • по части слов из запроса (скажем, по парам слов)
  3. По текстовым заголовкам и фрагментам с акцентами (strong и т.п.).
  4. По текстам анкоров исходящих с документа ссылок (вероятно, внутренних).
  5. По URL-адресу документа (вспоминаем про важность ЧПУ).

Рост BM25 при росте TF: расчёт

Численный расчёт BM25 для документов трёх длин


Не BM25 единым

Конечно, при анализе текстовой релевантности документа используются и другие формулы, и подходы, учитывающие:

  • Наличие/отсутствие точных вхождений многословного запроса в документе.
  • Взаимное расположение слов из запроса (пар слов) в документе.
  • Сочетание Title и текста документа.
  • Соответствие языковой модели.

Удачи в самостоятельной оптимизации документов и выводу запросов в ТОП!


Презентация по текстовой релевантности


Работа в Пиксель Плюс
SEO-сервисы от Пиксель Плюс

Дата ответа: 24.10.2015
Автор ответа: Дмитрий Севальнев
Вопросы по теме
Отключение ссылок     Оптимизация Title    


Поделиться с друзьями

Последние вопросы из категории: Текстовая оптимизация
Данный вопрос — приоритетный!
Евгений:
Сайт в ТОП-1 по запросу [диван на кухню] и у него нет текста и вхождений в текст слова «кухни». Почему так? Всегда считалось, что текст крайне важен для ранжирования по подобным запросам.
15.05.2018
Отличный кейс, давайте разберём. В действительности же, всё чаще встречаются ситуации, когда сайты в ТОП не содержат текста, а добирают релевантности за счёт прочих факторов. В первую очередь, речь о запросах, которые ведут на листинги товаров / разделы. Читать ответ полностью »
Дата ответа: 18.07.2018
Данный вопрос — приоритетный!
Александр Захаров:
Использую инструмент Пиксель Тулс «Техническое задание для копирайтера», но не могу в нём до конца разобраться. Просьба помочь с подробной инструкцией по теме. Почему выдаются те или иные ошибки?
23.07.2016
Техническое задание для копирайтера в рамках сервиса призвано автоматизировать проверку составленного ТЗ после SEO-специалиста и понизить число достигаемых ошибок. Давайте разберём работу в инструменте в формате видео-инструкции. Читать ответ полностью »
Дата ответа: 29.07.2016
Данный вопрос — приоритетный!
Андрей Медведев:
Произвёл оптимизацию страницы под запрос. Просьба оценить, всё ли верно или есть ошибки? В чём?
13.04.2016
Отличный и очень конкретный вопрос, Андрей. Давайте разберём на вашем примере нюансы внутренней и текстовой оптимизации под указанный поисковый запрос. Читать ответ полностью »
Дата ответа: 19.04.2016
Данный вопрос — приоритетный!
Андрей Леонов:
Как определяются пороги по числу вхождений ключевых слов в текст в задании (ТЗ) для копирайтера? Если мы задаем значения для слова от и до, то как определить их?
17.06.2015
Приветствую, Андрей. Хороший практический вопрос, давайте вместе поймём, откуда берутся пороги по числу вхождений ключевых слов в текст и как определять их самостоятельно. Читать ответ полностью »
Дата ответа: 25.06.2015
Задать свой вопрос #
Ваше имя:
E-mail:
Ваш вопрос:
Получать информацию о новых вопросах:
Прикрепить файл:
Максимальное количество файлов 30,
не более 5 МБ каждый

Выделяем 10 000 000 рублей на поддержку бизнеса!

Не позволяйте и далее падать обороту вашего бизнеса.

Обеспечьте себя трафиком и заявками с сайта, воспользовавшись программой антикризисной поддержки бизнеса от «Пиксель Плюс». 

Всё просто, мы компенсируем вам до 100 000 рублей на услуги компании, общая сумма поддержки — 10 миллионов рублей. Выберите услуги, которые подходят вам больше всего, чтобы получить консультацию.

Выбрать услуги