| Найдено документов - 1 | Выборка документов | Версия для печати |
Сортировать по:
1. Статья из журнала
| Автор(ы): | Шуляк, Е. |
| Ключевые слова: | Макроэкономическое прогнозирование, Машинное обучение, Анализ текста, Градиентный бустинг, Анализ данных, Кластеризация текста |
| Аннотация: | В настоящей работе мы строим ряд индексов экономических настроений для России на основе новостных постов и комментариев к ним из российской социальной сети «ВКонтакте». Тексты из социальной сети подвергаются обработке, и для выделения новостных постов экономической тематики применяется алгоритм семплирования Гиббса для Дирихле-мультиномиального распределения (Gibbs Sampling for the Dirichlet Multinomial Mixture, GSDMM). Чтобы проверить, действительно ли полученные индексы могут описывать настроения потребителей и бизнеса, мы сравниваем их с существующими индексами: индексом потребительских настроений «Левада-центра» и индексами менеджеров по закупкам PMI для секторов производства и услуг в России. Мы используем построенные индексы для прогнозирования при помощи методов машинного обучения (алгоритмов случайного леса, сверхслучайных деревьев, градиентного бустинга, XGBoost) макроэкономических показателей для России. При сравнении среднеквадратичных ошибок моделей машинного обучения и ошибок авторегрессии первого порядка почти во всех случаях ошибки моделей машинного обучения оказались меньше. АНО «Аналитический центр Юрия Левады» («Левада-центр») и SIA Medusa Project («Медуза») внесены Министерством юстиции РФ в реестр иностранных агентов |
| Поиск: | Источник |