В преддверии AiConf 2024: еще раз о безопасности LLM
Привет, друзья!
AiConf 2024 состоится уже на следующей неделе. Вы готовы? Самое время ещё раз заглянуть в расписание и распланировать два дня на конференции — 26 и 27 сентября.
А пока почитайте статьи по следам докладов на наших прошлых конференциях.
Последнее время про нейросети пишут постоянно, но, помимо полезных свойств, сообщается и об атаках хакеров, утечках данных. И с новыми видами атак и уязвимостей ещё предстоит научиться бороться. Никита Беляевский из лаборатории LLM Security AI Talent Hub покажет один из инструментов для выявления угроз в системах на основе LLM. Расскажет о настройках open source-сканера Garak и его применении.
Читать статью
Как сделать поиск с помощью картинок? Есть хороший подход, предложенный OpenAI, — модель CLIP. Использование мультимодальных моделей позволяет работать с более широким классом запросов и контента в сервисе. Модели с одной модальностью так не могут. Дмитрий Огурцов из Okko рассказал, как обучать сеть, чтобы искать изображения через текстовые описания.
Читать статью
Доклады трека «Академические исследования»
Теперь — к самому важному. 26 и 27 сентября в рамках AiConf 2024 вас ждут выступления ведущих экспертов в области AutoML, feature engineering и разметки данных. Вот несколько докладов, которые точно нельзя пропустить.
В мире больших данных основная проблема — это не только их сбор, но и правильная обработка. Когда объём признаков исчисляется тысячами, feature engineering становится сложным и трудоемким процессом. Валерия Дымбицкая расскажет о том, как в Upgini разработали универсальные решения для автоматизации этого процесса с помощью ML и эвристик. Она поделится, как их инструменты позволяют сократить количество вычисляемых фич в сотни раз, при этом улучшая качество работы моделей. Если вам интересно, как AutoML может помочь в feature engineering, этот доклад — то, что нужно!
AutoML часто кажется отличной теоретической концепцией, но на практике его применение встречает множество препятствий. Евгений Смирнов в своём докладе расскажет, как в Альфа-Банке разработали собственные AutoML- и AutoDL-сервисы, которые автоматизируют рутинные задачи Data Science: от сбора данных и отбора признаков до финальной аналитики. Эти сервисы используются десятками дата-сайентистов и значительно ускоряют процессы разработки. Вы узнаете, как автоматизация помогает команде добиваться высоких результатов и сохранять прозрачность всех этапов работы.
Когда речь идет о мультимодальных моделях, важнейшую роль играют качественные датасеты. Дмитрий Антипов поделится опытом работы над проектами GigaChat и Kandinsky, расскажет о ключевых задачах мультимодальной разметки (текст, изображения, аудио, видео) и о том, как справляться с новыми вызовами. В докладе будут рассмотрены кейсы парсинга данных, использование вспомогательных моделей, таких как LLM, и организация бизнес-процессов для подготовки качественных данных. Если вас интересует будущее разметки данных и её влияние на развитие моделей, не пропустите этот доклад.
С приходом больших языковых моделей (LLM) даже такая, казалось бы, проработанная область, как поиск, претерпела изменения. Вместе с Валерией Гурьяновой будем разбираться, как LLM улучшают различные аспекты поисковых систем: от разметки данных и индексов до семантического поиска и ранжирования. Вы узнаете, как с помощью LLM можно ускорить сбор и анализ данных, улучшить качество поиска и внедрить эмбеддинги для повышения точности запросов. Этот доклад будет полезен всем, кто хочет глубже понять, как LLM могут трансформировать классические задачи поиска.
AiConf 2024 — площадка для обмена уникальным опытом и свежими идеями в области AI и Data Science. Присоединяйтесь, чтобы пообщаться с экспертами и коллегами по отрасли.