Расскажите, какие важные зоны можно выделить в документе для определения текстовой релевантности?

Или по каким зонам, по вашему мнению, рассчитывается BM25 на документе без учёта входящего анкор-листа?

К примеру, по title и body. Или гораздо шире, например по title, h1...h6, анкоры исходящих ссылок, по подписям, если они в одном блоке с изображениями/видео, комментариям и т.д.

Спасибо за ответ!


Расчёт BM25 по зонам документа

Приветствую, Александр.

Действительно, вы правы, значение текстовой релевантности по алгоритму BM25 считается по ряду зон документа. Данная модификация алгоритма и носит название BM25F. Буква «F» является сокращением от английского слова field — зона (область) и указывает на расчёт значения релевантности отдельно для определенных зон документа.

Вычисленные по BM25 значения, вероятно, входят в формулу ранжирования Яндекса в качестве отдельных факторов. К числу анализируемых зон относятся:

  1. Заголовок документа Title.
  2. Текст документа, но с рядом модификаций:
    • стандартный вариант
    • с «угасающим» весом от начала документа (приоритет отдается вхождениям в начале текста)
    • только по точным вхождениям
    • по части слов из запроса (скажем, по парам слов)
  3. По текстовым заголовкам и фрагментам с акцентами (strong и т.п.).
  4. По текстам анкоров исходящих с документа ссылок (вероятно, внутренних).
  5. По URL-адресу документа (вспоминаем про важность ЧПУ).

Рост BM25 при росте TF: расчёт

Численный расчёт BM25 для документов трёх длин


Не BM25 единым

Конечно, при анализе текстовой релевантности документа используются и другие формулы, и подходы, учитывающие:

  • Наличие/отсутствие точных вхождений многословного запроса в документе.
  • Взаимное расположение слов из запроса (пар слов) в документе.
  • Сочетание Title и текста документа.
  • Соответствие языковой модели.

Удачи в самостоятельной оптимизации документов и выводу запросов в ТОП!


Презентация по текстовой релевантности


Работа в Пиксель Плюс
SEO-сервисы от Пиксель Плюс

Дата ответа:
Вопросы по теме
Отключение ссылок     Оптимизация Title    


Поделиться с друзьями
Последние вопросы из категории: Текстовая оптимизация
Алексей:
Как продвигать в Яндексе сайты-фотогалереи и страницы, созданные без текста под спрос пользователей, которые ищут фотографии?
При продвижении сайта не всегда текстовая составляющая является самой важной составляющей страницы — важно, чтобы страница в полной мере удовлетворяла запрос пользователя. Читать ответ полностью »
Дата ответа:
Алина Хапкина:
Что приоритетнее? Написать большую статью по всем SEO-правилам или более короткую, которую точно прочитают и будет дешевле?
При подготовке уникального контента для продвигаемой страницы важно учитывать не только оптимизацию под ключевые запросы, но и потребность в большом объеме текстового содержимого. Читать ответ полностью »
Дата ответа:
Игорь:
Мы размещаем самый частотный запрос в заголовок H1, а как быть с другими фразами — размещать их в H2 или только в тексте?
Если говорить об оптимизации статьи под список ключевых запросов, стоит подходить к этому вопросу комплексно. Читать ответ полностью »
Дата ответа:
Данный вопрос — приоритетный!
Евгений:
Сайт в ТОП-1 по запросу [диван на кухню] и у него нет текста и вхождений в текст слова «кухни». Почему так? Всегда считалось, что текст крайне важен для ранжирования по подобным запросам.
Отличный кейс, давайте разберём. В действительности же, всё чаще встречаются ситуации, когда сайты в ТОП не содержат текста, а добирают релевантности за счёт прочих факторов. В первую очередь, речь о запросах, которые ведут на листинги товаров / разделы. Читать ответ полностью »
Дата ответа:
Задать свой вопрос #
Ваше имя:
E-mail:
Ваш вопрос:
Получать информацию о новых вопросах:
Прикрепить файл:
Максимальное количество файлов 30,
не более 5 МБ каждый

Задать свой вопрос
Получать информацию о новых вопросах
Максимальное количество файлов 30 (не более 5 МБ каждый)

Принципиально новые условия сотрудничества в SEO — зарабатываем только вместе!

Уникальный тариф «Оборот», где доход агентства больше не зависит от визитов и позиций вашего сайта, а привязан исключительно к росту оборота вашей компании.

Тариф, который хотели сделать многие, но реализовали только мы.

К тарифу «Оборот»