Корректное сравнение предиктивных свойств моделей машинного обучения на примере прогнозирования инфляции в Сибири

Аннотация

В работе сравнивается качество прогнозирования с помощью методов машинного обучения и традиционных моделей на одинаковом массиве информации на примере инфляции в регионах Сибири. На первом этапе мы делаем прогнозы региональной инфляции на разные сроки при помощи нескольких методов машинного обучения и методов бенчмарка. На втором этапе мы комбинируем прогнозы методами машинного обучения и взвешиваем их на основе полученных метрик качества. В завершение мы сопоставляем полученные метрики качества с бенчмарками и подтверждаем устойчивость полученных результатов при помощи теста Диболда – Мариано. По результатам исследования мы делаем вывод, что для большинства выбранных для примера рядов инфляции на сроках свыше года методы машинного обучения работают лучше бенчмарков в отличие от прогнозов на 1–3 квартала вперед. Вместе с тем для каждого региона необходима предварительная оценка качества прогноза методами машинного обучения и целесообразности их использования в сравнении с эконометрическими методами. Прогнозирование методом комбинирования моделей машинного обучения в большинстве случаев предпочтительнее, чем с использованием какой-то одной модели.