Прогнозирование безработицы в России с помощью методов машинного обучения

Аннотация

В статье прогнозируется динамика безработицы в России на основе ряда методов машинного обучения: случайный лес, градиентный бустинг, эластичные и нейронные сети. Научный вклад работы выражается в трех аспектах. Во-первых, наряду с полносвязными нейронными сетями прямого распространения применяются рекуррентные нейронные сети класса моделей «последовательность к последовательности», учитывающие временную структуру выборочной совокупности. Во-вторых, учитываются дополнительные макроэкономические показатели для оценки в дополнение к однофакторным многофакторных моделей рекуррентных нейронных сетей. В-третьих, в процессе оценки моделей учитываются пересмотры статистической информации в режиме реального времени. С целью повышения прогнозной способности моделей используются дополнительные неструктурированные показатели: поисковые запросы и новостные индексы. В сравнении со структурной моделью динамики безработицы средняя абсолютная ошибка прогноза на один месяц вперед сокращается на 65% (до 0,12 процентного пункта) уровня безработицы в моделях рекуррентных нейронных сетей и долгой краткосрочной памяти и на 56% (до 0,14 процентного пункта) – в модифицированных алгоритмах градиентного бустинга. Учет пересмотров статистической информации повышает точность по предложенным методам.

Ключевые слова: прогноз безработицы, машинное обучение, случайный лес, эластичные сети, нейронные сети, градиентный бустинг

JEL: C53, E27, E37

Эта статья доступна по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.