Мастер-класс «Однажды в AIвуде... как взламывать и защищать AI-приложения»

GenAI & Perception: генерация и распознавание текстов, музыки, изображений, видео и 3D

Google Outlook Apple

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Мастер-класс раскрывает секреты тестирования и защиты AI-систем от зловредов. На примере работы с такими LLM, как Mistral, OpenAI, DeepSeek, GigaChat, YandexGPT и др. Вы узнаете методики проникновения, освоите создание эффективной защиты AI-решений, а также изучите инструменты для оценки рисков.

Целевая аудитория

Разработчики ИИ-приложений, архитекторы ML-систем, специалисты по кибербезопасности, работающие с генеративными моделями.

Тезисы

Скачать презентацию Все презентации конференции

Системы на базе LLM помогают писать код, анализировать финансы, нанимать сотрудников. Тем временем хакеры научились атаковать ИИ-системы: обходить инструкции, генерировать вредоносный контент, воровать данные или просто ронять сервисы. Вместе с участниками мастер-класса мы не только изучим громкие кейсы, но и вместе разберем, как взломать и защитить ИИ-систему для найма сотрудников. Рассмотрим популярные техники промпт-инъекций и джейлбрейкинга и не забудем про проблемы классической информационной безопасности.

Тимур Низамов

Альфа-Банк

Разрабатывал AI-решения в EdTech и столкнулся с проблемами безопасности, так что теперь исследует атаки на модели ML и разрабатывает фреймворк динамического тестирования genAI-систем LLAMATOR в лаборатории Безопасности ИИ Университета ИТМО.

Никита Беляевский

Raft

AI Security Red-Teamer.
Специалист в области информационной безопасности.
Работал как в классическом ИБ, так и в AI Security.

Видео

Подготовительное задание

Участникам желательно иметь с собой ноутбук с возможностью поднятия Docker-контейнера тестового стенда, ключи для подключения к API LLM (OpenAI, DeepSeek, GigaChat, YandexGPT, etc)