AiConf

Разметка данных в 2025: LLM, VLM и RAG

Обработка данных и бенчмарки

Machine Learning
Обработка данных
Метрики

Доклад принят в программу конференции

Целевая аудитория

Продакт-менеджеры, аналитики

Тезисы

Все больше продуктов строят свои метрики на разметке и обучают свои модели размеченными данными. Возрастает и инструментарий обработки данных. На ряду с классической разметкой людьми, LLM-разметки занимают все большую долю. Внедряются VLM и RAG там где раньше размечали люди. Что теперь можно сразу сделать моделями, а что мы продолжаем делать разметчиками?

Тезисы:
- Способы использования LLM/VLM в разметке
- RAG в разметке и его актуальность на фоне растущих контекстных окон
- Комбинации технологий

Кейсы:
- Разметка и обогащение данных для eCom
- Работа с изображениями и видео
- Классические разметки в AI исполнении

Доклад служит теоретической основой к Мастер-классу «Человек и/или LLM в разметке данных: Практика гибридных решений 2025»

Герман Ганус

Яндекс Крауд

Руководитель направления разметки для внешних заказчиков.
Прежде отвечал за разметки для Алисы: релевантность, ASR, TTS.

Видео