Благовещенск — не Москва и не Лондон. Здесь нет высотных башен инвестиционных банков и команд из сотен квантовых аналитиков. Но именно отсюда, с дальневосточного берега Амура, в двух шагах от китайской границы, Роман Вячеславович Шульга — старший инженер отдела телекоммуникаций и серверной инфраструктуры АО «Азиатско-Тихоокеанский Банк» — построил, запустил и годами поддерживал в промышленной эксплуатации систему, которая каждый день предсказывала валютные курсы для одного из ключевых банков Дальнего Востока. Не прототип. Не пилот. Не лабораторный эксперимент. Живая система, которую банк использовал в реальных операциях. Период с 2014 по 2018 год — это история не об исследовании, а о внедрении.

Откуда берутся такие проекты в региональных банках?
— Роман, расскажите, как вообще появился этот проект. Это инициатива банка или ваша личная идея?
— Задача пришла от руководства аналитического подразделения банка ещё в 2013 году, и с самого начала она звучала как операционная необходимость, а не исследовательская программа: банку нужен был инструмент поддержки решений для ежедневных конверсионных операций. Изначально речь шла о классическом техническом анализе. Но уже к середине 2014 года стало ясно: статистические модели хорошо работают в спокойной воде, но едва рынок начинает реагировать на события — санкции, геополитика, неожиданные решения ЦБ — они просто слепнут. Именно это противоречие заставило нас двигаться в сторону гибридной системы. И всё, что мы разрабатывали, немедленно шло в бой — в продуктивную среду банка, где принимались реальные финансовые решения.
— АТБ — региональный банк. Это накладывало ограничения?
— Колоссальные. В 2014 году наша вся вычислительная инфраструктура под задачи машинного обучения — это два сервера HP ProLiant с процессорами Intel Xeon и 128 гигабайтами оперативной памяти суммарно. Никаких GPU. Они появились только в 2016-м, когда банк специально приобрёл рабочую станцию с NVIDIA GeForce GTX 1080 под нужды этого проекта. И всё это время система работала — не в тестовом контуре, а в продакшне. Каждое утро трейдеры банка открывали дашборд с прогнозами, которые вычислила эта машина за ночь. Это реальная ответственность. Ты не можешь сослаться на «недостаточно вычислительных ресурсов» — ты просто обязан сделать так, чтобы оно работало на том железе, которое есть.
Машины, которые умеют читать
— Вы работали с несколькими классами алгоритмов. Как вы выстраивали архитектуру системы?
— Мы выстраивали систему итерационно, и каждый следующий компонент добавлялся уже на работающую платформу — без права остановить производство. Начинали с классики: ARIMA и GARCH в качестве базовых линий и инструментов мониторинга волатильности. Затем добавили машины опорных векторов — они хорошо зарекомендовали себя на ограниченных выборках. Потом подключили LSTM — рекуррентные нейронные сети, которые умеют удерживать в памяти долгосрочные зависимости. Ансамблевые методы — случайный лес и градиентный бустинг — появились позже. Но главным нашим архитектурным решением стала интеграция второго контура — автоматизированной системы анализа новостных потоков, которая работала в режиме реального времени и подавала текстовые сигналы в количественные модели.
— Расскажите об этом подробнее. Как машина «читает» новости?
— Система в автоматическом режиме собирала финансовые новостные ленты — преимущественно русскоязычные источники — и обрабатывала каждое сообщение в режиме, близком к реальному времени. Для векторизации текстов применялся TF-IDF, для классификации тональности — наивный байесовский классификатор, дополнительно велась тематическая кластеризация. Каждая новость автоматически получала метку: позитивный, негативный или нейтральный сигнал для валютного рынка. Этот сигнал тут же поступал в модели прогнозирования временных рядов и корректировал прогноз. Когда в ноябре 2014 года ЦБ отпустил рубль в свободное плавание и курс рванул вниз — система зафиксировала информационный шторм в новостях за несколько часов до пика волатильности. Это был наш лучший операционный тест.
Цифры, которые говорят сами за себя
— Каков главный результат исследования?
— Главное — система четыре года работала в продуктивной среде банка без остановок и давала измеримый результат. По метрике MAPE интеграция новостного анализа с количественными моделями повысила точность краткосрочного прогноза на горизонте 24–72 часа на 11–18% по сравнению с базовыми статистическими моделями. Банк использовал прогнозы при планировании конверсионных операций и управлении валютной позицией. Для учреждения, которое ежедневно проводит трансграничные операции между рублём и юанем, каждый процентный пункт точности — это не абстракция, это деньги. Операционные журналы, протоколы мониторинга, инциденты и их разборы — всё это задокументировано. Это не расчёты на бумаге.
Юань на Амуре: уникальный контекст
— В вашем исследовании особое место занимает валютная пара CNY/RUB. Почему?
— Амурская область граничит с китайской провинцией Хэйлунцзян. АТБ исторически специализируется на обслуживании трансграничных операций с КНР — переводы, конверсия, внешнеэкономическая деятельность. Для большинства российских банков, особенно московских, пара CNY/RUB была экзотикой. Для нас — основным рабочим инструментом. Это создало уникальную ситуацию: у нас был собственный массив данных по трансграничным операциям, недоступный для федеральных игроков. Мы могли строить локально-ориентированные модели, обученные на региональной специфике.
— Это и есть то, что делает вашу работу уникальной в масштабах российской банковской науки?
— Безусловно. Большинство российских публикаций того периода на тему ИИ в банкинге носили обзорный характер. Описывали зарубежный опыт. Мы описываем систему, которая четыре года работала непрерывно в продуктивной среде действующего банка. С конкретными серверами, конкретными инцидентами — когда модель давала сбой и надо было разбираться почему, конкретными операционными протоколами обслуживания. Мы видели, как система ведёт себя в турбулентные периоды — конец 2014-го, 2015-й. Мы знаем, где она справляется, а где ей нужна помощь человека. Это знание невозможно получить в лаборатории.
Почему это важно для отрасли?
Значимость работы Шульги для отрасли выходит далеко за рамки одного банка в одном регионе. Прежде всего, это один из редчайших в российской банковской практике задокументированных случаев полного цикла: от постановки задачи — через разработку, тестирование и развёртывание — до многолетней промышленной эксплуатации системы на базе методов ИИ в реальном коммерческом банке. Не пилот, не proof-of-concept, а рабочий инструмент, на который опирались операционные решения. Во-вторых, исследование честно фиксирует не только успехи, но и пределы: где модели справляются, а где структурный перелом рынка (конец 2014 года) ломает любой алгоритм, обученный на исторических данных. Это ценнее любого победного отчёта. Наконец, работа показывает: внедрение ИИ в банковском секторе возможно без столичных бюджетов и облачных кластеров — при наличии инженерной воли и операционной дисциплины.
— Если бы вы начинали этот проект сегодня, в 2019 году, что бы сделали иначе?
— Начал бы сразу с более мощной NLP-архитектурой. Уделил бы больше внимания объяснимости модели — банковский регулятор не принимает «чёрный ящик», и это правильно. Больше инвестировал бы в систему мониторинга качества прогноза в реальном времени: когда система работает четыре года, она неизбежно деградирует по мере изменения рынка, и нужен автоматический триггер на переобучение. Но главное я бы не изменил: всё в бой, всё в продакшн, никаких вечных пилотов. Либо система работает и приносит пользу банку сегодня, либо она не нужна.
Роман Шульга — живое опровержение тезиса о том, что технологическая революция в финансах происходит только в Москве, Нью-Йорке и Лондоне. Иногда она начинается на границе двух великих стран, в серверном зале регионального банка, на двух серверах HP и с одной видеокартой NVIDIA. И работает — по-настоящему работает — четыре года подряд, пока трейдеры каждое утро открывают дашборд с прогнозами, которые вычислила система, построенная одним инженером.
17.02.2019
Александр Петухов.




