Как готовить датасеты для мультимодальных моделей?
Привет, друзья!
Датасеты — топливо для моделей, и важно готовить их качественно. Если хотите узнать об основных задачах разметки в эпоху мультимодальности: текста, аудио, картинок и видео; ознакомиться с кейсами реальной жизни, понять, как спарсить что угодно и генерировать данные из необычных мест — посмотрите запись доклада Дмитрия Антипова «Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения» с AiConf 2024.
Спикер провёл слушателей через систему подготовки размеченных мультимодальных данных. От парсинга интернета через кейсы мультимодальной разметки; через использование вспомогательных моделей, в том числе LLM; через бизнес-процессы и контроль качества разметки к финальным метрикам моделей.
Если у вас есть ценные кейсы или исследования, которыми вы готовы поделиться, отправляйте заявку на участие в AiConf X 2025. Приём докладов открыт до 25 апреля. Подробности и форма подачи здесь.
Встреча с Программным комитетом AiConf X 2025
Когда встречаемся: 25 марта в 18:00 (МСК), онлайн.
Кто будет на встрече: Члены Программного комитета AiConf X 2025 и профессиональное сообщество.
О чём поговорим: концепция конференции и критерии отбора докладов, бонусы для спикеров.
5 причин подключиться к онлайн-встрече с Программным комитетом:
- Определить актуальные темы — узнаете, какие направления востребованы на конференции.
- Получить обратную связь — эксперты подскажут, как улучшить тему и структуру доклада.
- Разобраться с форматом — рассмотрим требования к выступлениям, регламент, ключевые ожидания.
- Влиять на программу — предлагайте темы, которые, на ваш взгляд, важны для сообщества.
- Понять тренды — обсудите актуальные проблемы индустрии с экспертами.
Участие бесплатное, но встреча закрытая, необходима регистрация.