AiConf

Конференция завершена.

Ждем вас

на AiConf

в следующий раз!

Визуальные языковые модели: от разбора архитектуры до запуска

Обработка естественного языка

Доклад принят в программу конференции

Мнение Программного комитета о докладе

LLM обрастает разными модальностями, одной из которых является зрение. Эмиль расскажет об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур. Будет интересно!

Целевая аудитория

NLP-специалисты, ML-специалисты/

Тезисы

* Зачем нам нужны мультимодальные, а, в частности, визуальные языковые модели.
* Как собрать хорошие данные для визуальной языковой модели.
* Как выглядит типичная архитектура мультимодальных моделей, и на какой архитектуре мы остановились.
* Какие секреты и фишки удалось узнать во время работы.

Тимлид SFT-команды GigaChat. Делает так, чтобы GigaChat из языковой модели превратился в вопросно-ответную модель, которая полезна как обычным людям, так и большим бизнесам.

Видео