AiConf

Конференция завершена.

Ждем вас

на AiConf

в следующий раз!

Разметка данных в 2025: LLM, VLM и RAG

Обработка данных и бенчмарки

Machine Learning
Обработка данных
Метрики

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Чем дальше, тем больше человеческих задач можно передать LLM. В разметке данных, кажется, нельзя передать все, но можно передать очень многое, от чего разметка становится быстрее и дешевле. Из доклада мы узнаем, куда по этому пути сейчас добралось человечество.

Целевая аудитория

Продакт-менеджеры, аналитики.

Тезисы

Все больше продуктов строят свои метрики на разметке и обучают свои модели размеченными данными. Возрастает и инструментарий обработки данных. Наряду с классической разметкой людьми, LLM-разметки занимают все большую долю. Внедряются VLM и RAG там, где раньше размечали люди. Что теперь можно сразу сделать моделями, а что мы продолжаем делать разметчиками?

Тезисы:
* способы использования LLM/VLM в разметке;
* RAG в разметке и его актуальность на фоне растущих контекстных окон;
* комбинации технологий.

Кейсы:
* разметка и обогащение данных для eCom;
* работа с изображениями и видео;
* классические разметки в AI-исполнении.

Доклад служит теоретической основой к мастер-классу «Человек и/или LLM в разметке данных: практика гибридных решений в 2025».

Герман Ганус

Яндекс Крауд

Руководитель направления разметки для внешних заказчиков.
Прежде отвечал за разметки для Алисы: релевантность, ASR, TTS.

Видео