AiConf

Конференция завершена.

Ждем вас

на AiConf

в следующий раз!

Эволюция Transformer: как меняется самая успешная архитектура в DL

Обработка естественного языка

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Трансформер — базовая архитектура нейронной сети в наши дни. С 2017 года она претерпела множество изменений, направленных на улучшение качества моделей и оптимизацию. Мурат подробно расскажет о популярных направлениях развития разных элементов архитектуры трансформеров, их свойствах и перспективах.

Целевая аудитория

Специалисты в DL.

Тезисы

Transformer — одна из наиболее успешных архитектур, совершившая революцию в области обработки естественного языка, — не стоит на месте и активно развивается. Помимо адаптации к новым модальностям, ученые и инженеры придумывают подходы для улучшения качества и эффективности обучения и использования сетей на основе Transformer. Это могут быть новые функции активации, иные нормализации или даже замена привычного механизма внимания. Доклад посвящён хронологическому обзору развития Transformer и тому, как те или иные успешные решения позволили прийти от оригинальной версии к текущему состоянию, и какие разработки могут стать основой для будущих нейросетевых архитектур.

Мурат Апишев

ecom.tech (ex-Samokat.tech)

Технический руководитель поиска Мегамаркета.

Видео