Алгоритмы машинного обучения помогут точнее оценивать будущее российских компаний

19 июня 2023
182

Ученые из Национального исследовательского Томского политехнического университета (Томск) с коллегой из Санкт-Петербургского государственного университета (Санкт-Петербург) и Географического института имени Йована Цвийича (Сербия) на практике сравнили точность методов машинного обучения и регрессионного подхода для прогнозирования рентабельности фирм. Авторы использовали данные о 551 торговой компании за 2017–2020 годы. Среди показателей, которые интересовали ученых как потенциально влияющие на рентабельность, были размер и возраст фирмы, рентабельность за предыдущий год, наличие роста продаж, веб-трафик и другие.

Авторы использовали пять различных компьютерных алгоритмов: три простых, включающих разные типы нейронных сетей, и два сложных. Последние — так называемые портфели и ансамбли — сочетали в себе несколько простых алгоритмов, способных учитывать и исправлять ошибки друг друга. Программы обучались на наборах данных за 2017–2019 годы, тогда как информация за 2020 год использовалась непосредственно для их тестирования.

Затем математическими методами исследователи рассчитали ошибки прогнозов, полученных с помощью регрессионного анализа и компьютерных алгоритмов. Оказалось, что алгоритмы, называемые портфелями и ансамблями, давали наиболее точные прогнозы. При этом самых достоверных оценок удавалось достичь, опираясь на такие показатели фирм как рентабельность за предыдущий год, динамика роста продаж и веб-трафик. При применении сложных методов машинного обучения (портфели и ансамбли методов) в среднем медиана абсолютной ошибки прогноза составила около 3%.

Это объясняется тем, что данные факторы в значительной степени влияют на состояние компании в будущем. Так, например ученые определили, что максимальной прибыли фирмы достигают, если у них постоянно возрастает количество продаж, и при этом они развивают цифровые каналы торговли, например, через веб-сайт. Если соблюдается лишь одно из условий, доход компании падает. Худшая ситуация наблюдается при падении продаж и одновременно высокой посещаемости сайта фирмы.