VLM для автоматической разметки сцен автономного вождения: практический опыт, вызовы и решения
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
VLM/LLM обещают автоматизировать разметку данных для автономного вождения и ускорить процесс в 50 раз, но в реальности модели работают избирательно. В докладе я покажу, где Vision Language Models действительно помогают, а где появляются проблемы. Разберем, как выбор разрешения, количества кадров и prompt engineering влияют на качество и стоимость разметки, когда VLM можно использовать самостоятельно, а когда нужен взгляд человека.
Вы узнаете, как строить гибридные pipeline (VLM для предварительной разметки + LLM для структурирования + ручная проверка критичных объектов), балансируя скорость, качество и затраты.
Доклад будет полезен ML-инженерам, data scientists и исследователям, работающим с computer vision в automotive, robotics и задачах автоматической разметки данных.
-
Видео
Другие доклады секции
LLM