Как собрать визуальную языковую модель
Привет, друзья!
Принесли полезности для тех, кто работает с GenAI и мультимодальными системами.
Визуальные языковые модели: от разбора архитектуры до запуска
Эмиль Шакиров из SberDevices поделился опытом: как собрать и запустить визуальную языковую модель — от подготовки датасета до архитектурных решений и оптимизации под прод. В докладе — реальные инженерные приемы, особенности мультимодального обучения и те нюансы, которые редко встречаются в общедоступных туториалах.
Мультимодальные LLM: ключик к AGI, или Зачем бизнесу модели, которые видят, слышат и понимают?
Представим, что мультимодальную модель вы уже собрали. А как ее встроить в бизнес? Об этом рассказал руководитель исследовательских ML-команд в Сбере Александр Капитанов. Какие задачи решают такие модели? Как внедрять их в продукты и оценивать результат? Узнаем из статьи.
26 сентября в Москве пройдёт AiConf X 2025 — прикладная конференция по Data Science. Уже опубликованы первые доклады, программа пополняется. Альфа-версия расписания — уже на сайте.
Что будет на площадке:
🔹25+ докладов не только из IT, но и из индустрии, медицины, Automotive,
🔹мастер-классы, выставка от партнеров, кофе, обеды, фуршеты,
🔹и, главное, 500+ человек, с кем есть о чем поговорить.