Как производится расчет индекса информационного фона акций?

Что такое индекс информационного фона акций?

Индекс информационного фона акций (ИИФ) — это комплексный количественный показатель, который оценивает тональность и насыщенность публикаций в СМИ и социальных сетях об определенной компании, отрасли или рынке в целом.

Проще говоря, это "градусник" новостного настроения, который показывает, как часто о чем-то пишут и в каком ключе (позитивном, негативном или нейтральном).

Как это работает?

ИИФ строится с помощью технологий обработки естественного языка (NLP) и анализа тональности (sentiment analysis):

  1. Сбор данных: Роботы (краулеры) агрегируют новости из тысяч источников: деловые СМИ (Bloomberg, РБК, Коммерсант), официальные пресс-релизы, социальные сети (Twitter, Telegram), форумы и т.д.

  2. Анализ тональности: Каждый текст "прочитывается" алгоритмом, который определяет его эмоциональную окраску:

    • Позитивная тональность: слова-маркеры: "рост", "прибыль", "прорыв", "лидер".

    • Негативная: "убыток", "снижение", "скандал", "суд".

    • Нейтральная: фактологическая информация без явной оценки.

Взвешивание и расчет: Разным источникам и типам упоминаний присваиваются разные веса (упоминание в крупном СМИ важнее, чем в маленьком блоге). На основе этого рассчитывается итоговый индекс. Он может быть представлен в виде числа (например, от -10 до +10) или градации (например, "крайне негативный", "нейтральный", "крайне позитивный").

В своем же расчете на данный момент для оценки новости, я использую большую языковую модель (LLM). В частности DeepSeek.
Новости пока что берутся только с РБК, поэтому оценивается вес каждой новости, вес источника не учитывается.
Новость оценивается от -10 до +10.
Для того чтобы минимизировать ошибку оценки новости нейросетью, оценка производится до 6 раз.

Как рассчитывается итоговый результат?

Расчет итогового результата ведется по алгоритму экспоненциального затухания.

Идея: каждая оценка "теряет вес" со временем по экспоненте. Чем старше оценка, тем меньше её вклад.

Формула:

Итог = Σ(Оценка_i * Сила_i * e^(-λ * Δt_i)) / Σ(Сила_i * e^(-λ * Δt_i))

Где:

  • Оценка_i — значение i-й оценки.

  • Сила_i — ваш "вес" или "важность" этой оценки (например, от 0 до 1).

  • Δt_i — время, прошедшее с момента выставления оценки до момента расчета (в днях, неделях и т.д.).

  • λ (лямбда) — коэффициент затухания. Ключевой параметр!

    • Чем больше λ, тем быстрее "стареют" старые оценки.

    • Например, λ = 0.1 означает умеренное затухание. За 7 дней вес упадёт в e^(-0.1*7) ≈ 0.5 раза.

    • λ = 0.02 — медленное затухание (вес за месяц упадёт примерно до 0.55).

  • e — основание натурального логарифма (~2.71828).


Сейчас выбираются новости за 90 дней, а λ равна коэффициенту полузатухания новости за 7 дней, то есть ln(2) / 7.

Важные ограничения и нюансы
  • Не прямой приказ к действию: Высокий позитивный ИИФ не гарантирует рост акций, а негативный — падение. Это один из многих инструментов.

  • Запаздывание: Иногда рынок уже отреагировал на новость, а индекс только фиксирует пик публикаций.

  • Манипуляции: Информационный фон могут пытаться искусственно накручивать (как в позитивную, так и в негативную сторону).

  • Качество алгоритмов: Точность сильно зависит от того, насколько хорошо алгоритм обучен понимать контекст, иронию, профессиональный жаргон.