AiConf

Конференция завершена.

Ждем вас

на AiConf

в следующий раз!

Разметка будущего: как GPT помогает обучать модели?

Умные механизмы

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Герман рассмотрит новую концепцию приложения LLM к разметке данных, приведет подходы с указанием их плюсов и минусов, а также степени вовлеченности LLM. Опишет бизнес-процессы для новой концепции, а также затронет аспекты использования ML-моделей для специфических задач разметки (OCR, CV, ASR).

Целевая аудитория

Разработчики, аналитики, ML-разработчики, Solution Architector.

Тезисы

- Как GPT помогает размечать данные для обучения моделей.
-- Как GPT влияет на краудсорсинг.
-- Способы использования GPT для разметки данных:
--- полная разметка;
--- саджест;
--- предразметка;
--- плюсы и минусы каждого способа.
-- Скорость/стоимость для разных задач. GPT vs Человек в классификации, генерации и пр.
- Как внедрить GPT в разметку.
-- Промпт-инжиниринг:
--- состав хорошего промпта: определение цели, определение ограничений, установка роли, описание примеров;
--- промпт-инжиниринг как задача краудсорсинга.
-- Качество.
-- Декомпозиция и перекрытие.
- GPT помощник или замена исполнителям?
- Не GPT единым. Более легкие и дешевые модели для специфичных задач. OCR, CV, ASR.

Герман Ганус

Яндекс Крауд

Руководитель направления разметки для внешних заказчиков.
Прежде отвечал за разметки для Алисы: релевантность, ASR, TTS.

Видео