Твердые цифры: открытые микроданные о потребительских ценах

Аннотация

Мы документируем новый источник микроданных о потребительских ценах. Новая база позволяет исследователям, изучающим поведение потребительских цен, получить доступ к оперативным и гранулярным данным на уровне первичных статистических наблюдений. Спектр наблюдаемых цен включает товары и услуги, полностью охватывает выборку индекса потребительских цен Росстата и выходит за ее пределы. В этой работе мы преследуем две цели. Во-первых, мы описываем механизм наблюдения, структуру данных, их доступность, демонстрируем четыре примера использования API для данных в прикладных задачах: обучение моделей машинной классификации текстовых названий, оперативный мониторинг цен класса товаров, построение гедонистических регрессий для товарных групп, расчет произвольных аналитических индексов цен. Во-вторых, в интересах исследователей, заинтересованных в создании собственных наборов альтернативных данных, мы делимся набором базовых навыков и технологий.