Прогнозирование компонент инфляции методами машинного обучения

Аннотация

С задачей прогнозирования инфляции методы машинного обучения справляются не хуже, а зачастую и лучше подходов, основанных на классических эконометрических моделях. Однако, несмотря на наличие временных рядов по ценам для всех товаров и услуг, являющихся отдельными компонентами потребительской корзины, для которой рассчитывается индекс потребительских цен (ИПЦ), и на то, что методы машинного обучения работают точнее с ростом объема данных, в большинстве работ покомпонентные данные ИПЦ не используются. Исследований, посвященных прогнозированию ИПЦ путем агрегации прогнозов индексов цен для отдельных категорий товаров и услуг (bottom-up approach), немного, и на их основании нельзя однозначно утверждать, будет ли агрегированный прогноз точнее, чем прогноз ИПЦ, не использующий покомпонентные данные. Мы показываем на российских данных, что в зависимости от горизонта прогнозирования покомпонентный агрегированный прогноз инфляции может быть до 1,5 раза точнее. Даже при использовании таких ставших уже классическими моделей машинного обучения, как градиентный бустинг или регрессии с регуляризацией, преимущество статистически значимо на горизонтах до полугода. Каждую компоненту инфляции и на каждый горизонт мы прогнозируем отдельной моделью независимо от остальных компонент и от остальных горизонтов.