Обзор уязвимостей и техник защиты для LLM
Доклад принят в программу конференции
Целевая аудитория
Тезисы
В докладе Евгений расскажет, какие типы атак направлены на LLM и приоритизирует самые важные с прикладной точки зрения. Каждый месяц публикуется около сотни статей в области безопасности LLM, поэтому мы акцентируем внимание на самых значимых работах. Обсудим современные фреймворки классификации, включая OWASP, Mitre и Databricks, и как они могут быть применены для защиты решений на базе LLM.
Кроме того, Евгений сравнит защиту и alignment Open Source и проприетарных моделей. После доклада слушатели смогут использовать чек-лист для проверки ИИ-приложений перед выводом в продакшн, что позволит повышать уровень защиты своих систем.
Имеет опыт работы в проектах Microsoft, Google и Сбер, где занимался внедрением сложных технологических решений в различные отрасли от финтеха до медицины. Выводил на рынок специализированные продукты для маркетплейсов AWS, PowerBI, Slack, и Atlassian. Сейчас фокусируюсь на изучении аспектов безопасности ИИ и разработке мер защиты для ИИ-приложений.
Raft
Видео
Другие доклады секции
Обработка естественного языка