Мнение Программного комитета о докладе
Из доклада вы получите целых две ценности: с одной стороны, практики переноса моделей для распознавания речи на CPU, с другой стороны, подходы к правильному сравнению производительности этих моделей.
Доклад принят в программу конференции
Из доклада вы получите целых две ценности: с одной стороны, практики переноса моделей для распознавания речи на CPU, с другой стороны, подходы к правильному сравнению производительности этих моделей.
В докладе будут рассмотрены вопросы сравнительного анализа производительности ASR-модели на CPU при использовании различных бэкендов. Мы детально исследуем различия в работе ONNX Runtime (с поддержкой INT8-квантизации) и OpenVINO (с оптимизациями под AMX-инструкции). Особое внимание уделим влиянию конфигурации Triton Server (батчинг, параллелизм) на итоговую производительность. Представим результаты тестирования на разных CPU-архитектурах.
9 лет в IT, совмещаю научную деятельность с практической разработкой. В 2023 году защитил кандидатскую диссертацию по оценке надёжности распределённых вычислительных систем. Карьерный путь начинал как научный сотрудник в исследовательском институте, где занимался алгоритмами обработки сигналов. Участвовал в масштабировании системы «Безопасный город» для Департамента транспорта Москвы (оптимизация потоковой обработки видео). Сейчас руковожу группой разработки в MTS AI: наша команда обеспечивает промышленное внедрение ML-моделей для задач распознавания речи и синтеза текста (ASR/TTS).
ML Edge — оптимизация обучения и инференса, дистилляция, квантизация, hardware и т.д.
Прикладная конференция по Data Science
Прикладная конференция по Data Science
Варианты участия
Офлайн-участие
Стоимость конференции постоянно растет — чем ближе к мероприятию, тем дороже.
Текущая стоимость билета — 37000 ₽
Онлайн-участие
Все потоки с докладами (но не потоки с митапами) будут транслироваться нами онлайн.
Текущая стоимость билета — 18500 ₽
Корпоративное участие (от 10 билетов)
Для заказа от 10 билетов на очное или онлайн-участие, свяжитесь с нами по partners@ontico.ru.
Передумали покупать?
Расскажите, почему
Благодарим вас за ответ!
Прикладная конференция по Data Science