Разметка данных в 2025: LLM, VLM и RAG
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Все больше продуктов строят свои метрики на разметке и обучают свои модели размеченными данными. Возрастает и инструментарий обработки данных. На ряду с классической разметкой людьми, LLM-разметки занимают все большую долю. Внедряются VLM и RAG там где раньше размечали люди. Что теперь можно сразу сделать моделями, а что мы продолжаем делать разметчиками?
Тезисы:
- Способы использования LLM/VLM в разметке
- RAG в разметке и его актуальность на фоне растущих контекстных окон
- Комбинации технологий
Кейсы:
- Разметка и обогащение данных для eCom
- Работа с изображениями и видео
- Классические разметки в AI исполнении
Доклад служит теоретической основой к Мастер-классу «Человек и/или LLM в разметке данных: Практика гибридных решений 2025»
Руководитель направления разметки для внешних заказчиков.
Прежде отвечал за разметки для Алисы: релевантность, ASR, TTS.
Видео
Другие доклады секции
Обработка данных и бенчмарки