GrainMonitor — заглядываем в будущее цен зернового рынка
На рынке работает немало профессиональных аналитических агентств, собирающих и предоставляющих информацию о волатильности — изменении цен на разную продукцию в среднесрочной и долгосрочной перспективе. Пожалуй, самыми известными примерами таких агентств можно назвать Reuters и Bloomberg, но есть, конечно, и другие.
Названные игроки охватывают практически все области производства и сельского хозяйства, но у них есть одна существенная проблема. Они сконцентрированы на долгосрочных прогнозах, упуская ничуть не менее важную нишу изменений цен в краткосрочной перспективе, например, в течение 5 дней. При этом краткосрочная волатильность позволяет компаниям выигрывать до 15% стоимости разовой поставки, если они имеют представление о грядущих изменениях рынка
Именно поэтому и была разработана наша система GrainMonitor, позволяющая эффективно прогнозировать ценовые факторы зернового рынка. Работает все очень просто: мы собираем информацию, формируем датасет, ищем математическую модель, максимально точно описывающую корреляцию между переменными и ищем дополнительные данные.
Что дает визуальная информация?
К примеру, такими данными может выступать собранная визуальная информация — снимки с БПЛА или со спутника. Даже с этими данными можно узнать и предсказать многое. А именно, снимки позволяют проверить факт уборки того или иного участка, определить эффективность работы контрагента, его способность собрать урожай в установленные сроки и прогнозировать объем опоздания.
Кроме того, собранные данные можно сравнить со сведениями из Росреестра. Если наложить снимки на кадастровую карту, получим информацию о том, как задействованные юридические лица справляются с уборкой, кто уже выполнил свою работу, кто опаздывает и т. д. Также с помощью снимков можно отслеживать стадии выращивания урожая.
Но одними только снимками ограничиваться вовсе не обязательно. Интернет предоставляет возможность работать с огромным объемом полезной текстовой информации.
Форумы для прогнозирования цен — реальность
Мы проводим сентимент-анализ, то есть, анализируем любые сообщения и тексты, относящиеся к нашему вопросу. Здесь полезным может быть почти что угодно: от графика работы портов и наличия пробок на дорогах, до статей на аналитических сайтах, показывающих в реальном времени изменения цен на рынке, а также позволяющих предсказать дальнейшее изменение стоимости зерна.
Очень полезными в этом вопросе могут быть также сайты, где публикуются и анализируются принимаемые правительством законодательные акты, которые могут напрямую влиять на цены сельскохозяйственного рынка.
Проще говоря, анализируются любые сообщения и данные, от которых так или иначе зависит стоимость зерна, если из них можно извлечь полезную информацию. Таким образом, мы получаем коэффициент, способный влиять на ценовые факторы зернового рынка.
Дополнительными полезными данными при формировании коэффициента могут выступить поисковые запросы, которые показывают, что в интернете ищут участники рынка.
Среди всех данных и сообщений в интернете наиболее важными оказались сведения из специализированных порталов, форумов и социальных сетей, где обсуждаются вопросы перевозки сельскохозяйственной продукции: пшеница, ячмень и другие.
В целом, можно сказать, что корреляции между переменными бывают сильными и слабыми. К сильным, по нашему опыту, относятся: курсы валют, цены на биржах и в портах, да вообще все цены, которыми оперируют участники рынка. Однако существует самая прямая связь между предложениями участников рынка о перевозке товаров и конечной ценой.
Другими словами, если ВКонтакте и на форумах воронежской области 500 человек суммарно предлагают перевезти 500 тонн пшеницы на элеватор Новороссийского порта в определенную дату, то в эту дату в Воронежской области исчезнет 500 тонн пшеницы, а в Новороссийске она появится в том же объеме после выполнения перевозки.
На основе этих данных можно составить представление об объемах продукции в конкретном месте в конкретный момент времени. Это, конечно, не вся продукция, однако некий слепок рынка с помощью методики получить можно и его будет вполне достаточно, чтобы эффективно предсказывать цены, причем, корректность таких предсказаний математически доказана.
Это пример более или менее достоверный корреляций.
«Логистическая связанность» и цены зерна
Мы также проверили и другую гипотезу, нашедшую подтверждение: описываемые ценовые факторы напрямую связаны с тем, что мы называем логистической связанностью. То есть, в момент пиковых поставок портовый терминал может быть забит, из-за чего корабли в порту просто не успевают вовремя загрузить, потому возникает очередь. Такая же очередь может появиться не только в порту, но и на элеваторе.
Если мы получаем данные о возникших заторах, можно судить о нарушении логистической связанности, потому товар из точки А в точку Б идет медленнее, чем запланировано, а это тоже повлияет на цену. Однако форма и выражение такой корреляции намного менее ясна, чем в случае с перевозками.
Это еще один пример информации, которую можно получить на форумах и в социальных сетях. Здесь можно собирать данные о конкретных участниках рынка, а также о разных событиях с ними связанными, после чего им можно присваивать определенный коэффициент влияния на цену.
Прогнозирование цен с GrainMonitor
GrainMonitor в данный момент — это стандартный сентимент-анализ, однако мы продолжаем работы и развиваем направление. По сути, мы строим предиктивную модель, которая на основе небольшого слепка рынка дает достоверное, математически подтвержденное предсказание в отношении краткосрочных факторов изменения цен.
Мы можем предсказывать изменение цен в принципе в среднесрочной перспективе, без точной информации в какую сторону. Но в краткосрочной перспективе (3-4 дня) методика дает вполне корректные результаты.
Вся система работает по следующему принципу:
- Берем информацию со спутников.
- Собираем структурированную текстовую информацию об изменении цен на бирже, курсах валют и т. д.
- Берем веса, связанные с нашей оценкой тональности сообщений о настроении рынка.
- Собираем информацию, связанную с перемещением определенных партий товара из одной точки в другую.
- Проводим анализ и получаем результат.
Таким образом, мы можем получить и представить данные, которых нет ни у кого на отечественном рынке. Вообще цельной информации о том, как в России существует рынок зерна, нет. В будущем планируется введение специализированной государственной системы, однако пока она только в планах.
В целом, GrainMonitor — это система предиктивной аналитики, не полноценный прогноз и мы даже гордимся этим, так как оперируем простыми фактами, простыми экономическими законами и предполагаем, что если где-то объем пшеницы сильно уменьшился, то ее цена закономерно возрастет. И наоборот, где пшеницы много, там уменьшится ее стоимость.
Простые подтвержденные корреляции позволяют эффективно предсказывать подобные изменения.