Прогнозирование российских макроэкономических показателей на основе информации в новостях и поисковых запросах

Аннотация

В современной экономической литературе строится довольно много различных индексов экономической активности. Часть из них основана на опросах экономических агентов («ручные» индексы), часть – на неструктурированных данных из интернета («автоматические» индексы). При этом вопрос о том, какие из подходов оказываются самыми успешными, остается открытым. В этой работе мы сравниваем несколько различных индексов экономической активности по их объясняющей и прогнозной способности. «Автоматические» индексы мы строим с помощью методов машинного обучения. В качестве исходных данных используются поисковые запросы, новостные статьи и комментарии пользователей под новостными постами из социальных сетей. Анализ получившихся индексов экономической активности показывает, что существует причинность по Грейнджеру между поисковыми и новостными индексами, с одной стороны, и «ручными» индексами – с другой, при этом поисковые и новостные индексы являются причинами по Грейнджеру для «ручных» индексов. Кроме того, оказывается, что поисковые и новостные индексы экономической активности лучше «ручных» индексов объясняют и прогнозируют набор выбранных для исследования макроэкономических переменных. Хорошая объясняющая способность данных индексов позволяет использовать их для наукастинга в условиях наличия лага в выходе макроэкономической статистики.