Как собрать визуальную языковую модель

Привет, друзья!

Принесли полезности для тех, кто работает с GenAI и мультимодальными системами.

Визуальные языковые модели: от разбора архитектуры до запуска

Эмиль Шакиров из SberDevices поделился опытом: как собрать и запустить визуальную языковую модель — от подготовки датасета до архитектурных решений и оптимизации под прод. В докладе — реальные инженерные приемы, особенности мультимодального обучения и те нюансы, которые редко встречаются в общедоступных туториалах.

Смотреть видео

Мультимодальные LLM: ключик к AGI, или Зачем бизнесу модели, которые видят, слышат и понимают?

Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?

Представим, что мультимодальную модель вы уже собрали. А как ее встроить в бизнес? Об этом рассказал руководитель исследовательских ML-команд в Сбере Александр Капитанов. Какие задачи решают такие модели? Как внедрять их в продукты и оценивать результат? Узнаем из статьи.

Читать статью

26 сентября в Москве пройдёт AiConf X 2025 — прикладная конференция по Data Science. Уже опубликованы первые доклады, программа пополняется. Альфа-версия расписания — уже на сайте.

Что будет на площадке:
🔹25+ докладов не только из IT, но и из индустрии, медицины, Automotive,
🔹мастер-классы, выставка от партнеров, кофе, обеды, фуршеты,
🔹и, главное, 500+ человек, с кем есть о чем поговорить.

Как собрать визуальную языковую модель

Привет, друзья!

Визуальные языковые модели: от разбора архитектуры до запуска

Мультимодальные LLM: ключик к AGI, или Зачем бизнесу модели, которые видят, слышат и понимают?

Забронировать билет на AiConf X 2025

До новых встреч!

Как собрать визуальную языковую модель

Привет, друзья!

Визуальные языковые модели: от разбора архитектуры до запуска

Мультимодальные LLM: ключик к AGI, или Зачем бизнесу модели, которые видят, слышат и понимают?

Забронировать билет на AiConf X 2025

До новых встреч!

Стать партнером

Корпоративное участие

Мы используем файлы cookie