На определённом этапе внедрения Machine Learning в бизнес-процессы компании простые и опробованные решения не дают ощутимых приростов качества — нейросети являются следующим, естественным этапом развития рекомендательных систем после простых линейных моделей и градиентного бустинга над деревьями.
Есть неисчислимое множество архитектур (RNN, LSTM, Transformers и т.д.), подходов к обучению (оптимизаторы, шедулеры и т.д.), оптимизации (прунинг, квантизация, ...) нейросетей, и каждый день появляются новые и новые подходы (Kolmogorov-Arnold Networks, Admin, sigma-reparam, Adan, ...).
В докладе рассмотрим, как мы внедряли нейросети в рекомендательную систему Ozon. Расскажем, каким образом использовали различные подходы, включая новейшие, к какой системе и архитектуре в итоге пришли, и что нам дало применение нейросетей с точки зрения бизнеса. Доклад имеет прямое прикладное значение: обозначим проблемы, с которыми столкнулись и пути их решения, а также как применять нейросети на >10K RPS в realtime-режиме: последнее действие пользователя учитывается спустя сотни миллисекунд.
--------
Соавтор доклада: Александр Хроменков, Ozon, ведущий математик-разработчик. 15 лет опыта в разработке, выпускник МФТИ, 2 года занимался научной деятельностью в Объединённом институте проблем информатики Национальной академии наук Беларуси, где получил несколько патентов, затем 4 года в Сингапурском филиале Иллинойсского Университета (США).