AiConf

VLM для автоматической разметки сцен автономного вождения: практический опыт, вызовы и решения

LLM

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

ML-инженеры, data scientists, computer vision специалисты, deep learning engineers, исследователи в области autonomous driving и data labeling и продакты

Тезисы

VLM/LLM обещают автоматизировать разметку данных для автономного вождения и ускорить процесс в 50 раз, но в реальности модели работают избирательно. В докладе я покажу, где Vision Language Models действительно помогают, а где появляются проблемы. Разберем, как выбор разрешения, количества кадров и prompt engineering влияют на качество и стоимость разметки, когда VLM можно использовать самостоятельно, а когда нужен взгляд человека.
Вы узнаете, как строить гибридные pipeline (VLM для предварительной разметки + LLM для структурирования + ручная проверка критичных объектов), балансируя скорость, качество и затраты.

Доклад будет полезен ML-инженерам, data scientists и исследователям, работающим с computer vision в automotive, robotics и задачах автоматической разметки данных.

Видео

Другие доклады секции

LLM