ML в промышленности и образовании
Привет, друзья!
Сегодня у нас два кейса. Один – про ML в тяжелой промышленности. Другой – про автоматическую расшифровку Тотального диктанта.
ML в промышленности
Чугун, бентонит, шихта, окатыш… Нет, это не старый учебник металлургии. Это реалии, с которыми приходится работать ML-моделям. Мы привыкли слышать про успехи AI в финансах, маркетинге и e-com, но что насчет заводов? В статье Андрея Голова – разбор, как алгоритмы справляются с реальными физическими процессами и какие данные нужны, чтобы это работало. Андрей отвечет за направление Data Science в «Северсталь Диджитал».
Читать статью
Как ПИСЕЦ на Тотальный диктант ходил
В 2024 году на Тотальный диктант пришёл «Писец». Не тот «Писец», когда всё плохо, диктант прошёл как запланировано, а открытая система автоматической расшифровки звукозаписей. Как получилось такое боевое крещение системы в экстремальных условиях, поделится сооснователь стартапа «Сибирские нейросети» Иван Бондаренко. Он расскажет о трудностях, которые возникли при создании Писца, об использовании Wav2vec2 и Whisper в пайплайне распознавания, о том, как и зачем файнтюнить Whisper. И немного о парадигме минимизации инвариантного риска и понятии среды (environment) в распознавании речи.