Александр:

Расскажите, какие важные зоны можно выделить в документе для определения текстовой релевантности?

Или по каким зонам, по вашему мнению, рассчитывается BM25 на документе без учёта входящего анкор-листа?

К примеру, по title и body. Или гораздо шире, например по title, h1...h6, анкоры исходящих ссылок, по подписям, если они в одном блоке с изображениями/видео, комментариям и т.д.

Спасибо за ответ!


20.10.2015

Расчёт BM25 по зонам документа

Приветствую, Александр.

Действительно, вы правы, значение текстовой релевантности по алгоритму BM25 считается по ряду зон документа. Данная модификация алгоритма и носит название BM25F. Буква «F» является сокращением от английского слова field — зона (область) и указывает на расчёт значения релевантности отдельно для определенных зон документа.

Вычисленные по BM25 значения, вероятно, входят в формулу ранжирования Яндекса в качестве отдельных факторов. К числу анализируемых зон относятся:

  1. Заголовок документа Title.
  2. Текст документа, но с рядом модификаций:
    • стандартный вариант
    • с «угасающим» весом от начала документа (приоритет отдается вхождениям в начале текста)
    • только по точным вхождениям
    • по части слов из запроса (скажем, по парам слов)
  3. По текстовым заголовкам и фрагментам с акцентами (strong и т.п.).
  4. По текстам анкоров исходящих с документа ссылок (вероятно, внутренних).
  5. По URL-адресу документа (вспоминаем про важность ЧПУ).

Рост BM25 при росте TF: расчёт

Численный расчёт BM25 для документов трёх длин


Не BM25 единым

Конечно, при анализе текстовой релевантности документа используются и другие формулы, и подходы, учитывающие:

  • Наличие/отсутствие точных вхождений многословного запроса в документе.
  • Взаимное расположение слов из запроса (пар слов) в документе.
  • Сочетание Title и текста документа.
  • Соответствие языковой модели.

Удачи в самостоятельной оптимизации документов и выводу запросов в ТОП!


Презентация по текстовой релевантности


Работа в Пиксель Плюс
SEO-сервисы от Пиксель Плюс

Дата ответа: 24.10.2015
Автор ответа: Дмитрий Севальнев
Вопросы по теме
Отключение ссылок     Оптимизация Title    


Поделиться с друзьями
Последние вопросы из категории: Текстовая оптимизация
Алина Хапкина:
Что приоритетнее? Написать большую статью по всем SEO-правилам или более короткую, которую точно прочитают и будет дешевле?
05.01.2021
При подготовке уникального контента для продвигаемой страницы важно учитывать не только оптимизацию под ключевые запросы, но и потребность в большом объеме текстового содержимого. Читать ответ полностью »
Дата ответа: 05.11.2021
Игорь:
Мы размещаем самый частотный запрос в заголовок H1, а как быть с другими фразами — размещать их в H2 или только в тексте?
30.12.2020
Если говорить об оптимизации статьи под список ключевых запросов, стоит подходить к этому вопросу комплексно. Читать ответ полностью »
Дата ответа: 14.03.2022 13:10:00
Данный вопрос — приоритетный!
Евгений:
Сайт в ТОП-1 по запросу [диван на кухню] и у него нет текста и вхождений в текст слова «кухни». Почему так? Всегда считалось, что текст крайне важен для ранжирования по подобным запросам.
15.05.2018
Отличный кейс, давайте разберём. В действительности же, всё чаще встречаются ситуации, когда сайты в ТОП не содержат текста, а добирают релевантности за счёт прочих факторов. В первую очередь, речь о запросах, которые ведут на листинги товаров / разделы. Читать ответ полностью »
Дата ответа: 18.07.2018
Данный вопрос — приоритетный!
Александр Захаров:
Использую инструмент Пиксель Тулс «Техническое задание для копирайтера», но не могу в нём до конца разобраться. Просьба помочь с подробной инструкцией по теме. Почему выдаются те или иные ошибки?
23.07.2016
Техническое задание для копирайтера в рамках сервиса призвано автоматизировать проверку составленного ТЗ после SEO-специалиста и понизить число достигаемых ошибок. Давайте разберём работу в инструменте в формате видео-инструкции. Читать ответ полностью »
Дата ответа: 29.07.2016
Задать свой вопрос #
Ваше имя:
E-mail:
Ваш вопрос:
Получать информацию о новых вопросах:
Прикрепить файл:
Максимальное количество файлов 30,
не более 5 МБ каждый

Найдём не менее 7 точек роста продаж с сайта за 4 950 рублей и 3 дня

Идеально подходит для интернет-магазинов и сайтов услуг. 100% гарантия возврата всей стоимости аудита, если не найдём ни одной значимой точки роста продаж и конверсии!

Формирование рекомендаций, направленных на рост продаж. Только самое важное и ничего лишнего.

Ценность аудита для бизнеса за 12 месяцев —
от 109 091 рублей.

Подробнее об акции