Как найти золотую середину? Начинайте с простого. Один-два скрытых слоя – отличный старт для большинства финансовых задач. Это как построить сначала надежный одноэтажный дом, в котором можно жить, а потом, если нужно, достраивать этажи. Поэкспериментируйте. Создайте несколько версий модели-архитектуры и посмотрите, какая из них лучше справляется с тестовыми данными, которых она раньше не видела. Этот процесс напоминает настройку музыкального инструмента – чуть больше нейронов здесь, чуть другая функция активации там, пока звучание прогноза не станет чистым и уверенным.
Результат: выходной слой и ваш прогноз
После всех преобразований в скрытых слоях информация поступает в выходной слой. Это наша цель, финишная прямая. Количество нейронов здесь зависит от того, что именно мы хотим предсказать. Нужен прогноз выручки на следующий месяц? Тогда в выходном слое будет один нейрон, который выдаст одно число – ожидаемую сумму в рублях. Хотите предсказать вероятность кассового разрыва в следующем квартале? Выходной слой может выдать вероятность от 0 до 1. Планируете сценарный анализ? Тогда нейронов может быть несколько, каждый для своего сценария (оптимистичный, пессимистичный, реалистичный).
Выходной слой – это и есть тот самый ответ, ради которого все затевалось. Но важно помнить, что это не «истина в последней инстанции», а наиболее вероятный расчет, основанный на тех данных и той архитектуре, которые вы заложили. Это как прогноз погоды. Метеорологи строят сложнейшие модели атмосферы, но мы все равно иногда берем с собой зонт на всякий случай. Ваша финансовая модель – такой же профессиональный инструмент предсказания. Он резко повышает ваши шансы на успех, но не отменяет необходимости здравого смысла и управленческой интуиции.
Подумайте на минутку о своем бизнесе. Какие данные лежат у вас в столах и компьютерах мертвым грузом? Может, это старые отчеты по продажам, логи рекламных кампаний, отзывы клиентов? Теперь представьте, что все эти разрозненные листочки пазла могут сложиться в единую, динамичную и умную картину будущего. Архитектура модели – это рамка для этого пазла. Вы ее проектируете. Вы решаете, какие кусочки важны, а какие – шум. Вы определяете, насколько сложной и детальной будет итоговая картина.
Не стремитесь создать шедевр архитектуры с первого раза. Создайте что-то рабочее, что-то, что можно потрогать и испытать. Простая, но продуманная архитектура даст вам больше пользы, чем самая навороченная, но непонятная вам конструкция. Помните, вы не просто строите модель, вы проектируете новый способ видеть свой бизнес. И первый чертеж для этого начинается у вас в голове прямо сейчас.
Подготовка и обработка входных данных
Если бы нейросеть была поваром, то входные данные – это её продукты. Можно ли приготовить кулинарный шедевр из подпорченных овощей и несвежего мяса? Теоретически, наверное, можно, но результат вряд ли кого-то обрадует, а ужин закончится визитом в больницу. Точно так же и с нейросетевой моделью: качество её прогнозов напрямую зависит от того, чем вы её ‘кормите’. Эта глава – о том, как выбрать лучшие ‘продукты’ на рынке данных и правильно их ‘помыть’, ‘почистить’ и ‘нарезать’, чтобы модель не болела и выдавала вам точные, полезные прогнозы.
Давайте сразу договоримся: магия начинается не в тот момент, когда вы запускаете сложный алгоритм. Она начинается гораздо раньше – в утомительной, кропотливой, порой рутинной работе с данными. Специалисты говорят, что на подготовку данных уходит 80% времени всего проекта. И они не шутят. Но пусть это вас не пугает. Представьте, что вы собираете пазл. Сначала вам нужно убедиться, что все кусочки на месте, что они не погнуты, не испачканы и что они вообще от этой картинки. Подготовка данных – это тот же процесс. И именно он определяет, получится ли у вас в итоге красивое изображение будущего вашего бизнеса или абстрактный набор цветных пятен.
Что пойдёт в суп, или Какие данные собирать
Первое и самое важное – решить, какие данные вам вообще нужны. Нейросеть, в отличие от нас с вами, не догадается, что ‘падение продаж в июле’ связано с сезоном отпусков, если вы не скажете ей об этом явно. Поэтому наш первый шаг – мозговой штурм. Сядьте и подумайте: что влияет на тот финансовый показатель, который вы хотите спрогнозировать? Если это выручка, то очевидные кандидаты – исторические данные по продажам, трафик на сайт или в магазин, маркетинговый бюджет, цены. Но не только.