TF-IDF (Term Frequency — Inverse Document Frequency)
Краткая суть
TF-IDF — это детектор "Важности и Редкости".
* TF (Term Frequency) измеряет: Как часто вы повторяете слово "Ипотека" в своей статье? (Спойлер: часто).
* Но если бы мы оценивали только по TF, тексты состояли бы из мусорных слов (И, В, НА, С), так как они встречаются чаще всего. IDF (Inverse Document Frequency) исправляет это: он проверяет, как часто слово встречается ВО ВСЕМ интернете. Союзы "И, НА" есть на миллиардах сайтов, поэтому IDF обнуляет их вес (Превращает в стоп-слова).
У слова "Ипотека" огромный вес: оно часто встречается в вашей статье, но его нет на сайтах про рецепты и котиков. Формула понимает: Ваша статья действительно про Ипотеку (Высокая Релевантность).
Как это работает на практике
Простой пример:
Если в статье про Москву 10 раз употребить слово "Метро" и 10 раз слово "Колизей".
Для обычного счетчика важны оба слова (Счет 10:10).
Но алгоритм TF-IDF "знает", что слово "Метро" часто встречается в текстах про Москву (Это норма / Низкий IDF). А вот слово "Колизей" — аномально редкое для статей про Москву (Высокий IDF). Значит, именно "Колизей" является главной уникальной Сутью вашей статьи и Гугл будет ранжировать вас именно по нему.
Актуальность в 2026 году
В эру Нейросетей (MUM/YATI) голая формула TF-IDF — это "Медный век SEO". Гугл больше не считает слова как калькулятор. Он перешел на векторные модели (BM25) и Семантические Эмбеддинги.
Однако, все Русские Текстовые Анализаторы (СайтРепорт, Rush Analytics, Just-Magic) всё еще базируются на производных от алгоритма TF-IDF и LSI-хвостов. Это до сих пор самый практичный способ "выровнять" ваш SEO-текст (Медиану ключей) по эталонам конкурентов из ТОП-10.
Как применять на практике
- Если вы оптимизируете карточку товара (E-commerce), используйте TF-IDF анализ конкурентов. Закиньте ТОП-3 ссылки конкурентов в текстовый анализатор. Он покажет "Хвосты" (Слова, задающие контекст), которые конкуренты пишут часто, а вы забыли. Например, вы продаете Шкафы, но забыли слово "Петли", "МДФ", "Рассрочка", "Доводчики". Гугл (через TF-IDF) видит этот "недобор" и считает вашу страницу "Менее экспертной" (Thin Content). Добавите эти слова — получите рост.
Частые ошибки
- Искусственная "Перекачка" (Keyword Stuffing) важных TF-IDF маркеров. Анализатор говорит "Вам нужно написать слово купить 12 раз". Стажер вписывает: "Купить купить купить шкаф купить". Да, формула TF-IDF формально удовлетворена. Но алгоритм SpamBrain (Баден-Баден) немедленно заблокирует страницу за неестественный, машинно-сгенерированный язык (Нечитабельность / Тошнота Переспама). В 2026 году Текст пишется для Людей, а не для калькуляторов.
Последнее обновление термина: 2026 год.