Как вы относитесь к закону Ципфа? Учитываете ли его в текстах на сайтах?

Эмпирический закон Ципфа

Хорошо известная (и, при этом, простая) эмпирическая закономерность распределения частоты слов естественного языка в текстах большого объема — помогает отсеивать отделам антиспама искусственные (генерированные) тексты. Это значит, что в общем случае, рекомендуется проверять большие объемы текста на соответствие этому закону.

Напомним, в базовой формулировке закон гласит:

Если все слова языка (или слова текста большого объема) упорядочить по убыванию частоты их использования, то частота N-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру N. Число N носит название ранга слова. Так, скажем, второе по популярности слово, будет встречаться в тексте примерно в два раза реже первого, а десятое по популярности — в десять раз реже первого. И так далее.

Тут требуется брать во внимание три момента:

  1. Чем меньше объем текста (в словах) — тем большие отклонения от закона Ципфа будут наблюдаться. Это «нормально» в данном случае.
  2. При анализе всей совокупности текстов сайта — рекомендуется анализировать именно контентную часть и исключать из рассмотрения обвязку документов (меню, сквозные блоки).
  3. Закон Ципфа является далеко не единственным при анализе текстов на естественность. Рекомендуем ознакомиться с первой передачей из цикла «Аналитика SEO».

Работа в Пиксель Плюс
SEO-сервисы от Пиксель Плюс

Дата ответа:


Поделиться с друзьями
Последние вопросы из категории: Текстовая оптимизация
Алексей:
Как продвигать в Яндексе сайты-фотогалереи и страницы, созданные без текста под спрос пользователей, которые ищут фотографии?
При продвижении сайта не всегда текстовая составляющая является самой важной составляющей страницы — важно, чтобы страница в полной мере удовлетворяла запрос пользователя. Читать ответ полностью »
Дата ответа:
Игорь:
Мы размещаем самый частотный запрос в заголовок H1, а как быть с другими фразами — размещать их в H2 или только в тексте?
Если говорить об оптимизации статьи под список ключевых запросов, стоит подходить к этому вопросу комплексно. Читать ответ полностью »
Дата ответа:
Данный вопрос — приоритетный!
Евгений:
Сайт в ТОП-1 по запросу [диван на кухню] и у него нет текста и вхождений в текст слова «кухни». Почему так? Всегда считалось, что текст крайне важен для ранжирования по подобным запросам.
Отличный кейс, давайте разберём. В действительности же, всё чаще встречаются ситуации, когда сайты в ТОП не содержат текста, а добирают релевантности за счёт прочих факторов. В первую очередь, речь о запросах, которые ведут на листинги товаров / разделы. Читать ответ полностью »
Дата ответа:
Данный вопрос — приоритетный!
Александр Захаров:
Использую инструмент Пиксель Тулс «Техническое задание для копирайтера», но не могу в нём до конца разобраться. Просьба помочь с подробной инструкцией по теме. Почему выдаются те или иные ошибки?
Техническое задание для копирайтера в рамках сервиса призвано автоматизировать проверку составленного ТЗ после SEO-специалиста и понизить число достигаемых ошибок. Давайте разберём работу в инструменте в формате видео-инструкции. Читать ответ полностью »
Дата ответа:
Задать свой вопрос #
Ваше имя:
E-mail:
Ваш вопрос:
Получать информацию о новых вопросах:
Прикрепить файл:
Максимальное количество файлов 30,
не более 5 МБ каждый

Задать свой вопрос
Получать информацию о новых вопросах
Максимальное количество файлов 30 (не более 5 МБ каждый)

Принципиально новые условия сотрудничества в SEO — зарабатываем только вместе!

Уникальный тариф «Оборот», где доход агентства больше не зависит от визитов и позиций вашего сайта, а привязан исключительно к росту оборота вашей компании.

Тариф, который хотели сделать многие, но реализовали только мы.

К тарифу «Оборот»