VLM для автоматической разметки сцен автономного вождения: практический опыт, вызовы и решения

LLM

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

ML-инженеры, data scientists, computer vision специалисты, deep learning engineers, исследователи в области autonomous driving и data labeling и продакты

Тезисы

VLM/LLM обещают автоматизировать разметку данных для автономного вождения и ускорить процесс в 50 раз, но в реальности модели работают избирательно. В докладе я покажу, где Vision Language Models действительно помогают, а где появляются проблемы. Разберем, как выбор разрешения, количества кадров и prompt engineering влияют на качество и стоимость разметки, когда VLM можно использовать самостоятельно, а когда нужен взгляд человека.
Вы узнаете, как строить гибридные pipeline (VLM для предварительной разметки + LLM для структурирования + ручная проверка критичных объектов), балансируя скорость, качество и затраты.

Доклад будет полезен ML-инженерам, data scientists и исследователям, работающим с computer vision в automotive, robotics и задачах автоматической разметки данных.

Иван Катречко

Navio

-

Видео

Другие доклады секции

LLM

Мутационное тестирование как будущее агентского кодинга

Евгений Блинов

The Mutating Company

От чат-бота к агенту: как строить интерпретируемую автоматизацию поддержки с GPT

Николай Пономаренко

Техплатформа Городских сервисов Яндекса

Эволюция Red Teaming’a в эпоху агентного ИИ

Данил Капустин

Raft Digital Solution

«LigaGPT: как мы построили и эксплуатируем агентную AI-платформу для QA, SRE и поддержки»

Константин Попандопуло

Umbrella IT

Построение защиты LLM и агентов: контроль, guardrail-подходы и их валидация

Никита Облаков

HiveTrace

RAG умер. Да здравствует Agentic RAG: Эволюция умного поиска.

Артем Косенко

CodeInside

Быстро делаем вашу AI систему расширяемой и поддерживаемой с помощью DSPy

Николай Сенин

Независимый исследователь

Как “смотреть” на табличные данные: подвыборки и мета-характеристики вместо отдельных объектов

Ирина Деева

Университет ИТМО

Как сделать умный поиск кандидатов?

Алексей Осипов

ГК Юзтех

Практика применения LLM в задачах безопасности приложений

Дмитрий Марюшкин

Ozon Fintech

RAG и agentic‑подход в отечественных ИТ‑решениях: от бота к фабрике цифровых агентов

Максим Малышев

NOTAMEDIA

Как ломаются LLM Guardrails: практический разбор NER для ПД

Богдан Минко

Hivetrace

Кентавр: Революция в запуске IT-продуктов через гибридную аналитику

Шагалов Андрей Владимирович

Артезио

Внедрение LLM в модерацию: от PoC до целевого решения

Сакаев Руслан

Авито

Ускоряем работу с контент маркетингом и SMM при помощи ИИ

Сатаров Дмитрий

Агентство интернет-маркетинга "Эй, Стартапер!"

Как мы растим эффективность в Яндекс Доставке: аналитические методы, unsupervised learning и LLM для повышения точности навигации

Андрей Нарцев

Яндекс Доставка

Как мы автоматизировали процесс Code review в Авито при помощи LLM

Марк Каширский

Авито тех

Приручаем зоопарк - архитектура и оркестрация в мультиагентных системах

Сергей Мамонов

Домклик

Большие языковые модели: история и причины "взрыва"

Рыскулов Сергей Николаевич

Т-Банк

LLM Performance Playbook: как выбрать модель и конфигурацию сервинга на основе воспроизводимых тестов

Антон Удалов

Magnit Tech

Опыт перехода от maas к selfhosted/on premise моделям: проблемы, боли, решения

Сергей Нотевский

Битрикс24

Наш путь в Machine Unlearning: От теории к практике

Вадим Шубин

Raft