AiConf

Доклады

Работа со звуком (2)

LLM говорит: мультимодальные задачи в речевом домене

Доклад о возможностях ЛЛМ архитектур в аудио домене: понимание аудио, распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса. Рассмотрим как узкоспециализированные, так и мультизадачные архитектуры. А так же SFT предобученной текстовой ЛЛМ на аудио данных.

Доклад принят в программу конференции

Как «Писец» на «Тотальный диктант» ходил, или пара слов о робастном распознавании речи

ML

В 2024 году состоялся юбилейный, вот уже десятый по счёту «Тотальный диктант». Но «Писец» на него пришёл в первый раз. Вы не подумайте, ничего плохого не произошло! Просто «Писец» - это открытая система автоматической расшифровки различных звукозаписей, от журналистского интервью до заседания диссертационного совета. Эта система, будто древнерусский писец за боярином, записывает всё, что говорите вы и ваши собеседники, и сохраняет в виде структурированного текста с таймингами. И в своём докладе я расскажу о том, с какими трудностями нам пришлось столкнуться при создании нашего «Писца», как мы используем Wav2Vec2 и Whisper в пайплайне распознавания и зачем нам надо было файнтюнить Whisper (он же хорош из коробки, разве нет?). Кроме того, интересным является не только вопрос, зачем файнтюнить Whisper, но и как его файнтюнить так, чтобы получилось действительно хорошо. Поэтому в ходе доклада я также коснусь необходимости робастного обучения, парадигмы минимизации инвариантного риска и понятия среды (environment) в распознавании речи.

Доклад принят в программу конференции

Компьютерное зрение и генерация изображений (9)

Жестовый язык: особенности сбора данных, опыт и результаты

Machine Learning
Обработка данных

Характеристики и особенности датасетов для распознавания жестовых языков.
Сложности и ошибки при сборе датасета РЖЯ.
Полный цикл сбора данных для распознавания РЖЯ.

Доклад принят в программу конференции

Виртуальная примерка одежды для кабинета мерчанта

Искусственный интеллект дошел и до такой области, как виртуальная примерка одежды, косметики, строительных материалов и т.д. За последний год появился целый ряд научных статей, решающих задачу примерки одежды с помощью различных диффузионных моделей. Компания ecom.tech выбрала это направление в качестве одного из перспективных проектов, способных помочь как мерчантам, так и пользователям на нашей платформе Мегамаркета.

В докладе мы подробно расскажем о том, как мы пришли к текущему решению, состоящему из следующих шагов:
- анализ open-source решений
- выбор наилучшего с учетом различных ограничений
- доработка алгоритмов для применения модели на различных позах человека и сложных категориях одежды
- дообучение модели под важные для бизнеса типы одежды
- расширение пайплайна моделей с целью создания удобного интерфейса для пользователя

Доклад принят в программу конференции

Синтетические данные для поиска дефектов в Северстали

Олег Карташев

Северсталь Диджитал

- Почем редкие объекты нуждаются во внимании и ими стоит заниматься
- Какие библиотеки можно использовать для генерации синтетических данных
- Какие подходы применяет Северсталь, какие получаем результаты и что получается красивее
- Как автоматически проверять качество синтезированных данных
- Как синтетика может повлиять на обучения и с какими проблемами мы столкнулись
- Как выстроен процесс генерации, в какой момент использовать ценные реальные данные

Доклад принят в программу конференции

Увеличиваем число обнаружений в задачах Object Detection и Instance Segmentation

Python
ML
Дмитрий Колесников

ООО "Цифровые технологии и платформы"

Patch-Based-Inference является усовершенствованным SAHI подходом для обнаружения большого количества маленьких объектов на изображениях с поддержкой задач инстанс сегментации, улучшенной технологией подавления дубликатов и удобной библиотекой с широкой кастомизацией.

Разработанная Python библиотека поддерживает следующие модели по Object Detection и Instance Segmentation: YOLOv8, YOLOv8-seg, YOLOv9, YOLOv9-seg, YOLOv10, FastSAM, и RTDETR.

В рамках доклада будет рассказана как работает данная технология, какие актуальные задачи может помочь решить. Вы узнаете, как можно в разы увеличить число обнаруживаемых объектов без дополнительного обучения нейронных сетей.

Ссылка на open-source проект - github.com/Koldim2001/YOLO-Patch-Based-Inference

Доклад принят в программу конференции

3D pose estimation объектов фиксированной геометрии для складских роботов

Расскажем о том как мы настроили 3D локализацию коробок с товарами для складской робототехники, с какими особенностями и проблемами столкнулись, а также покажем как мы поддерживаем текущее решение в среде активно меняющихся доменов. Поговорим об keypoints estimation, instance segmentation и active learning.

Доклад принят в программу конференции

Мягкая модерация изображений: скрыть нельзя блокировать

ML

Самый простой способ модерации контента — отклонение и ручная проверка, однако при больших нагрузках даже проверка прогнозов точных классификаторов составляет проблему. Мы оптимизировали нагрузку на ручную модерацию: автоматически скрываем нарушения и отправляем на проверку только сложные случаи. В докладе мы расскажем как прошли путь от сбора данных до успешного запуска системы, выдерживающей высокую нагрузку, и снизили необходимость ручных проверок изображений с контактами в 10 раз.

Доклад принят в программу конференции

Вместо зеленого экрана: гармонизация портрета с помощью нейросети

Хотите сделать селфи под пальмой на Мальдивах, не выходя из дома? Это возможно благодаря технологиям замены фона. А чтобы результат получился наиболее реалистичным, применяется гармонизация изображения.
В докладе мы расскажем про задачу гармонизации портретов с помощью нейросетей, рассмотрим, какие сейчас существуют датасеты и решения (спойлер: их очень мало) и поговорим про нашу State-of-the-Art модель гармонизации PHNet, в основе которой лежит идея нормализации по патчам.
Также мы расскажем, как быстро и бесплатно собрать свой датасет гармонизации портретов с 70 000 высококачественных изображений. Код, веса предобученых моделей и датасет мы выложили в открытый доступ!

Доклад принят в программу конференции

Диффузионные модели для мобильных телефонов

Большие диффузионные модели продемонстрировали отличные возможности для генерации фотореалистичных изображений. Диффузионные модели, использующие текстовый запрос для условной генерации, позволяют пользователю получить разнообразные изображения из описания на естественном языке. Однако, для решения конкретной бизнес задачи очень большое разнообразие может не требоваться. Диффузионные модели имеют обычно порядка 1 миллиарда параметров и требуют значительных вычислительных ресурсов. Уменьшение покрытия диффузионной моделью различных объектов, тем и стилей к выбранному домену, позволит уменьшить размер модели и сократить вычислительные ресурсы и время для генерации. Уменьшение и упрощение архитектуры диффузионной модели также облегчает её развёртывание на мобильных устройствах, что даёт следующие преимущества: отсутствие дорогостоящих серверов, улучшение приватности пользователей и возможность работать в оффлайн режиме.
В данной работе мы провели исследование с диффузионными моделями относительно небольшого размера и упрощенной архитектуры в выбранной доменной области – портретные изображения – и показали, что они могут соперничать с большими диффузионными моделями. Мы интегрировали нашу диффузионную модель в приложение для смартфонов, и продемонстрировали её практическое применение для редактирования фотографий, генерации аватаров и ассетов для дополненной реальности.

Доклад принят в программу конференции

Побеждают ли диффузионные модели генеративные состязательные сети в задаче повышения разрешения?

Machine Learning

В современной литературе преобладает мнение, что диффузионные модели работают однозначно лучше, чем генеративные состязательные сети (GANы) в задаче повышения разрешения (Image Super Resolution). Однако в большинстве сравнений диффузионные модели на порядок превосходят подходы, основанные на GANах, по размеру и величине затраченных ресурсов. Отсюда возникает предположение, что превосходство диффузионных моделей может быть обусловлено большим масштабом моделей и данных, а не превосходством самой парадигмы. В нашей работе мы впервые проводим контролируемое исследование, в котором диффузионные модели и GANы выровнены по размеру моделей и объёму затраченных на их обучение вычислительных ресурсов, и показываем, что GANы достигают результатов не хуже, чем диффузионные модели. Кроме того, мы исследуем влияние различных факторов, таких как обусловливание на текст и аугментации изображений, на качество работы моделей повышения разрешения.

Доклад принят в программу конференции

Обработка естественного языка (7)

Эволюция Transformer: как меняется самая успешная архитектура в DL

Transformer - одна из наиболее успешных архитектур, совершившая революцию в области обработки естественного языка, - не стоит на месте и активно развивается. Помимо адаптации к новым модальностям, ученые и инженеры придумывают подходы для улучшения качества и эффективности обучения и использования сетей на основе Transformer. Это могут быть новые функции активации, иные нормализации или даже замена привычного механизма внимания. Доклад посвящён хронологическому обзору развития Transformer и тому, как те или иные успешные решения позволили прийти от оригинальной версии к текущему состоянию. Слушатель познакомится с проблемами таких моделей, путями их решения и поймёт, в каких случаях важнее правильная работа с данными и методами обучения, а в каких - архитектурные доработки.

Доклад принят в программу конференции

Обзор уязвимостей и техник защиты для LLM

Защита информации
Machine Learning
Управление уязвимостями

В докладе Евгений расскажет, какие типы атак направлены на LLM и приоритизирует самые важные с прикладной точки зрения. Каждый месяц публикуется около сотни статей в области безопасности LLM, поэтому мы акцентируем внимание на самых значимых работах. Обсудим современные фреймворки классификации, включая OWASP, Mitre и Databricks, и как они могут быть применены для защиты решений на базе LLM.

Кроме того, Евгений сравнит защиту и alignment Open Source и проприетарных моделей. После доклада слушатели смогут использовать чек-лист для проверки ИИ-приложений перед выводом в продакшн, что позволит повышать уровень защиты своих систем.

Доклад принят в программу конференции

Кодовый ассистент Яндекса. Как мы из 0 сделали 1.

ML

Яндекс не остался в стороне от темы кодовых ассистентов.
Расскажу про:
* Как и почему мы стали заниматься развитием своего кодового ассистента.
* Какие существуют подходы к обучению LLM моделей для inline code completion.
* Поговорим про оффлайн и онлайн метрики оценки качества и устройство runtime

Доклад принят в программу конференции

Beyond the script: Continuous testing for adaptable and safe LLM systems

Systems based on LLMs offer immense business potential, from chatbots to automating complex agent workflows. However, their unpredictable nature and sensitivity to behavior shifts raise concerns about safety and reliability in production environments. While thorough pre-deployment testing is crucial, it can't catch every issue.

Several strategies can enhance LLM safety and reliability. One approach is to add safeguards within the LLM's response mechanism. Another is continuous testing and monitoring to identify and address issues as they arise.

This talk delves into the complementary roles of monitoring and continuous testing:
- Monitoring: We'll explain how tracking quantitative measures like sentiment, toxicity, length, and trigger words in model inputs and outputs can provide a dynamic overview of system performance and help alert to ongoing issues.
- Continuous testing: We'll discuss how to complement monitoring with tests for complex behaviors, such as compliance with specific policies and the emergence of new topics.

We'll present practical examples and implementation strategies using open-source tools. This talk is valuable for anyone working with LLMs, including developers, engineers, and product managers aiming to use these systems responsibly and effectively.







Доклад принят в программу конференции

Как мы делаем прагматичный поиск и Q&A без LLM

ML

В докладе расскажу:
- Как мы сделали удобную поисковую строку в сервисе HelpDesk для сотрудников Билайн.
- Как поисковая строка снижает нагрузку с операторов службы поддержки HelpDesk.
- Как мы смогли простой настройкой OpenSearch заменить нейронку.
- Как мы завели Q&A на бертах в продакшене поверх базы знаний Билайн.
- Как мы размечали датасет с использованием LLM.

Доклад принят в программу конференции

От промпта к агентной системе: Как превратить LLM в высококачественный сервис

ML

LLM все чаще используются в качестве сервиса. Мы привыкли к высокому качеству проприетарных моделей от OpenAI и Anthropic, но открытые модели часто не достигают такого уровня "из коробки". В таких случаях специалисты по NLP вынуждены применять различные методы для достижения необходимого качества генерации.

В этом докладе я поделюсь нашим опытом и последними достижениями в этой области, показывая, как вместо простого "промптинга" можно создать целые агентные системы для улучшения качества генерации текста.

Мы рассмотрим, как разделение задач на подзадачи, контекстуализация запросов и механизмы обратной связи помогают создать гибкие и качественные сервисы на основе LLM.

Доклад принят в программу конференции

Визуальные языковые модели: от разбора архитектуры до запуска.

Зачем нам нужны мультимодальные, а в частности визуальные языковые модели.
Как собрать хорошие данные для визуальной языковой модели.
Как выглядит типичная архитектура мультимодальных моделей и на какой архитектуре мы остановились.
Какие секреты и фишки удалось узнать во время работы.

Доклад принят в программу конференции

Рекомендательные системы и поиск (9)

Трансформеры на главной Wildberries

Расскажу про то, как мы в течение полутора лет после выкатки ALBERT4REc в прод, шаг за шагом его дорабатывали.

Доклад принят в программу конференции

Нейросети в рекомендациях: от идеи до продакшена

Hadoop
Machine Learning
Обработка данных

Соавтор доклада: Александр Хроменков, Ozon, ведущий математик-разработчик. 15 опыт в разработке, выпускник МФТИ, 2 года занимался научной деятельностью в Объединённом институте проблем информатики Национальной академии наук Беларуси, где получил несколько патентов, затем 4 года в Сингапурском филиале Иллинойсского Университета (США).

На определённом этапе внедрения Machine Learning в бизнес процессы компании, простые и опробованные решения не дают ощутимых приростов качества - нейросети являются следующим, естественным этапам развития рекомендательных систем после простых линейных моделей и градиентного бустинга над деревьями.

Есть неисчислимое множество архитектур (RNN, LSTM, Transformers и т.д.), подходов к обучению (оптимизаторы, шедулеры и т.д.), оптимизации (прунинг, квантизация, ...) нейросетей и каждый день появляются новые и новые подходы (Kolmogorov-Arnold Networks, Admin, sigma-reparam, Adan, ...).

В докладе рассмотрим, как мы внедряли нейросети в рекомендательную систему Ozon. Расскажем, каким образом использовали различные подходы, включая новейшие, к какой системе и архитектуре в итоге пришли, и что нам дало применение нейросетей с точки зрения бизнеса. Доклад имеет прямое прикладное значение: обозначим проблемы, с которыми столкнулись и пути их решения, а также - как применять нейросети на >10K RPS в realtime режиме: последнее действие пользователя учитывается спустя сотни миллисекунд.

Доклад принят в программу конференции

Эволюция отбора кандидатов в системе товарных рекомендаций Ozon

Рекомендации / ML
ML

Расскажем, как мы провели полный редизайн системы отбора кандидатов в товарных рекомендациях Ozon на основе сегментации пользователей, внедрили унифицированную нейросетевую архитектуру и улучшили релевантность наших лент.

Доклад принят в программу конференции

Поиск точек роста ВКонтакте: как мы в ленте сделали таргет для оптимизации таймспента всего приложения

Аналитика / другое
Рекомендации / ML
ML
Степан Малькевич

VK, ВКонтакте

Есть мнение, что оптимизировать сессионные таргеты либо очень сложно, либо вовсе невозможно. Тем более невозможно оптимизировать суммарный таймспент всего приложения. Ведь уже не получится просто обучить ML-модельку на клики и замерять в оффлайне RocAuc по ним. А если цель вашей системы – рост сразу нескольких метрик, то и вовсе непонятно, как действовать. Так ли это на самом деле?

В докладе я расскажу, как вырастить таймспент всего приложения через методы машинного обучения без падения всех остальных важных метрик. Мы рассмотрим полный цикл создания сессионного таргета на таймспент, все подводные камни и неочевидные моменты. Поделюсь результатами внедрения этого таргета в умную ленту ВКонтакте.

Доклад принят в программу конференции

PostgreSQL для AI. Настоящий векторный поиск в PostgreSQL.

PostgreSQL
Оптимизация производительности
Лайфхаки
Владлен Пополитов

ООО Постгрес Профессиональный

Олег Бартунов

Postgres Professional

Поиск векторов в реляционных базах данных стремительно развивается, появляются не только новые алгоритмы и виды индексов, но и новые типы данных, ускоряющие поиск, новые подходы к формирования запросов. Часто ускорение поиска возможно сделать, не переформатируя существующие данные. В докладе будет рассказано о таких способах на примере PostgreSQL, показано, какие факторы влияют на точность и скорость поиска.

Доклад принят в программу конференции

Less is more: как уменьшить отправку пушей и вырастить DAU

Дарья Никанорова

Одноклассники

Мобильные пуши - это эффективный инструмент для коммуникации с пользователями. С их помощью мы можем рассказать о релевантном контенте, предложить новых друзей или напомнить о приятном моменте из прошлого. Основная же цель такой коммуникации - вернуть пользователей в приложение. Другими словами, отправка пушей нацелена на рост таких продуктовых метрик, как DAU и retention. Очевидно, что на короткой дистанции мы сможем вырастить эти метрики, отправляя все больше пушей. Но в долгосрочной перспективе бесконтрольная рассылка оповещений неизбежно приведет к потере лояльной аудитории. Как сделать так, чтобы пользователям не хотелось отключать пуши из вашего приложения, а продуктовые метрики при этом росли?

Я расскажу о том, как мы смогли сократить объем пушей на 20% и вырастить при этом DAU и timespent. В основе нашего подхода лежит модель машинного обучения, предсказывающая вероятность совершения пользователем целевого действия при получении пуша. Я расскажу о деталях обучения ML-модели, об особенностях реализации пайплайна real-time инференса, а также о планах на дальнейшее развитие сервиса.

Доклад принят в программу конференции

Как мы развернули трансформер на событиях интерфейса операторов поддержки

На докладе подробно разберем как завели трансформер на событиях в интерфейсе оператора и как его используем в бою.

Исторически сложилось простое решение на Top Popular + марковские цепи на открытых интентах. Решение плохо масштабировалось и имело ряд проблем, поэтому было решено использовать трансформер.

В процессе деплоя трансформера под небольшой нагрузкой проблем не было, однако нам было интересно как сработает подход NLP к событиям интерфейса оператора. И оно сработало. Однако в бою поймали пару непонятных моментов, которые пришлось дебажить.

Доклад принят в программу конференции

ML на графах в e-commerce: Как эффективно собирать группы на миллионах товаров

ML

В докладе мы расскажем о том, как добавили алгоритмы на графах в классический подход к матчингу товаров и получили крутой алгоритм для поиска групп одинаковых товаров на огромной e-commerce-площадке.

Основные пункты доклада:

1. Про нашу задачу и цель.
2. Классический подход к матчингу товаров.
3. Community Detection Algorithms.
4. Поиск сообществ на графах-товаров, self-supervised и unsupervised подходы.
5. Распределенные графовые алгоритмы. Кластеризация на больших данных.

Доклад принят в программу конференции

Валидация в RecSys для корреляции с А/Б: что работает в контентных рекомендациях

A/B-тестирование
Рекомендации / ML
Метрики
Дарья Тихонович

МТС Диджитал

Проблема разрыва между оффлайн валидацией рекомендательных моделей и результатами А/Б тестов по продуктовым метрикам широко распространена в индустрии и значительно влияет на эффективность работы исследователей при разработке новых моделей. В докладе будут освещены подходы, которые помогают построить оффлайн валидацию, коррелирующую с продуктовыми метриками. Также будут показаны результаты применения данных подходов в ходе разработке рекомендательных систем для реальных сервисов экосистемы МТС.

Доклад принят в программу конференции

Умные механизмы (2)

Система управления процессом окомкования железорудных окатышей

Андрей Голов

Северсталь Диджитал

«Северсталь» разработала комплекс моделей машинного обучения для линии окомкования окатышей. Система, внедренная на «Карельском окатыше», на основе компьютерного зрения оценивает качество процесса окомкования и автоматически управляет параметрами процесса, что позволяет повысить производительность агрегата на 11% с сохранением качества продукции. Ранее оператор управлял процессом окомкования вручную на основании экспертизы, визуального контроля и лабораторных проб, которые производятся раз в несколько часов, а по некоторым параметрам – раз в сутки.
В докладе будут рассмотрены общие подходы, которые использовались при разработке системы, а также практические сложности при внедрении решений на основе ML на промышленных объектах.

Доклад принят в программу конференции

Задачи и вызовы при создании автопилота

ML

Над созданием дорожного автопилота люди активно работают уже около 20-ти лет и похоже очень близки к решению. Эта задача замечательна двумя вещами, во-первых, ее очень просто сформулировать и, во-вторых, ее очень сложно решить.
Для создания автопилота, помимо прочего, вам понадобится множество ML моделей и дело не ограничивается одними только системами компьютерного зрения.
Обзору всех этих моделей и подходов, специфике их применения у нас, в Яндексе, будет посвящен мой доклад.

Доклад принят в программу конференции

Академические исследования (3)

Физически-обоснованное машинное обучение - что можно и что нужно

Алгоритмы и их сравнение
Machine Learning
Обработка данных
Теория
Расширение кругозора
Александр Хватов

Университет ИТМО

В докладе поговорим о текущем состоянии области физически-обоснованного машинного обучения. Затронем два больших острова - поиск уравнений по данным и решение с помощью PINN, а так же мелкие вроде нейронных операторов Фурье. Поговорим, какие задачи уже решены, что можно сделать уже сейчас, а что требует исследования, о том как мы применяем физически-обоснованные модели и методы в приложениях. Обсудим основные современные направления, почему где-то развитие остановилось, а где-то всё цветёт и пахнет. Наметим куда можно двинуться дальше и почему это может быть интересно на практике.

Доклад принят в программу конференции

Превращаем нейросети в SOTA и для табличных задач

Аналитика / другое
Machine Learning
Рекомендации / ML
ML
Олег Сидоршин

Альфа-Банк

Табличные данные являются основной Data Science на практике и присутствуют в абсолютном большинстве задач. Несмотря на прорывы нейросетей в компьютерном зрении и NLP, в табличном домене нейросети показывают слабые результаты, проигрывая классическим моделям градиентного бустинга.

В последнее время статус-кво меняется - нейросети на табличных данных появляются все чаще как в статьях, так и в решениях победителей соревнований на Kaggle.

В докладе мы расскажем про наше исследование State of the art табличных нейросетей: рассмотрим актуальные тенденции, покажем лучшие найденные техники и дадим практические советы.
Мы расскажем, как первыми в финтехе покрыли табличными нейросетями ряд важных бизнес-задач, принося существенный финансовый эффект и открывая новые горизонты моделирования.

Доклад принят в программу конференции

Kolmogorov Arnold Networks: новая архитектура нейронных сетей

Python
Алгоритмы и их сравнение
Machine Learning
ML
Теория
Расширение кругозора

Последние несколько месяцев активно обсуждается перспективная альтернатива для Многослойного перцептрона (MLPs) – Kolmogorov Arnold Networks (KANs). В KANs нет обучения линейных весов – вместо этого тренируются нелинейные функции активации. Эта архитектура позволяет по сути обучать математические формулы на признаках, благодаря чему их проще визуализировать и интерпретировать результаты. Также, есть основания полагать, что KANs обладают более быстрыми законами масштабирования нейронных сетей (scaling laws) по сравнению с MLPs и для некоторых задач меньшим количеством параметров достигают сопоставимого качества, что может быть особенно полезным для обучения более продвинутых LLM моделей.

В докладе мы подробно обсудим особенности работы KANs, их плюсы и минусы, сравнив их с MLPs. Разберемся для каких задач сейчас имеет смысл использовать KANs. Посмотрим, какие есть модификации и оптимизации KANs. Рассмотрим свертки на их основе и прочие реализации уже знакомых слоев, сетей и блоков с KANs под капотом.

Доклад принят в программу конференции

Прочее (6)

AutoFE-сапёр: укрощаем взрыв размерности в автоматической генерации признаков

Чтобы данные работали для модели, их практически всегда нужно адаптировать и извлечь из них дополнительную информацию – то есть провести feature engineering. И если на небольших объёмах признаков задача, может, и не сложная, то когда их десятки тысяч – начинаются проблемы.

В Upgini мы делаем сервис поиска признаков для любой модели, используя сотни разных источников, а значит, делать feature engineering нам нужно уметь: а) универсально, б) автоматически, и в) на очень широких таблицах. Да ещё и не потратить на это все деньги. Исходя из нашего опыта, я расскажу:

- Какие проблемы AutoML-инструментов для генерации признаков (в частности, Featuretools и OpenFE) не позволяют применять их на широких таблицах
- Как, взяв за основу OpenFE, мы почти полностью переписали его в свой фреймворк, чтобы эти проблемы побороть
- Какие простые и не очень соображения позволили нам генерировать в 500 раз меньше фичей с лучшим качеством

И кроме того – как ML помогает нам делать ML, чтобы помогать вашему ML :)

Доклад принят в программу конференции

Кто хочет стать гео-сайентистом — мастер-класс по работе с гео-данными

Мы подготовили специализированный мастер-класс по работе с пространственными данными и их применением в моделях машинного обучения для решения типичных задач в геоаналитике телекома, службах доставки и геомаркетинге.

На мастер-классе продемонстрируем базовый и продвинутый набор гео-инструментов: работа с распространенными форматами данных, способы визуализации данных на карте, пространственные выборки, построение регулярных сеток, расчет изохрон, обход графов, создание гео-признаков и другие.

Доклад принят в программу конференции

Как AutoML и AutoDL сервисы улучшают реальную разработку

Hadoop
Machine Learning
ML
Инструменты
Евгений Смирнов

Альфа-Банк

В Data Science есть большая проблема с рутиной - даже для построения рядовых моделей необходимо писать повторяющийся из проекта в проект boilerplate код. Несмотря на обилие открытых AutoML инструментов, они редко применяются в реальной разработке из-за низкой прозрачности и автоматизации лишь малой части DS.

В Альфа-Банке мы решаем данную проблему сервисным подходом - в докладе мы расскажем, как разработали собственные AutoML и AutoDL сервисы, автоматизирующие большую часть цикла ML разработки: от сбора данных и отбора признаков до построения ансамбля моделей и финальной аналитики. Сервисы помогают в разработке десяткам Data Scientist'ов в департаменте и сохраняют прозрачность и масштабируемость при высоком качестве моделей.

Доклад принят в программу конференции

Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения

Продуктовая разработка
Управление изменениями, управление требованиями
Machine Learning
ML
Обработка данных

Датасеты — топливо для моделей и важно готовить их качественно. В докладе на основе опыта работы над GigaChat, Kandinsky и другими проектами я расскажу об основных задачах разметки в эпоху мультимодальности: текста, аудио, картинок и видео, приведу кейсы реальной жизни и поделюсь как спарсить что угодно и генерировать данные из необычных мест. Расскажу как мультимодальность меняет смысл задач и почему для хорошего результата нужна глубокая техническая подготовка.

Особое внимание уделю авторазметке и разметке через LLM во всех трех вариантах, нюансам работы со всеми типами разметчиков и разберу пайплайны создания идеальных датасетов: от постановки ML-задачи до контроля и получения итогового результата.

Доклад принят в программу конференции

Как ML помогает производить лекарства?

Ежедневно мы видим, как машинное обучение помогает развивать беспилотный транспорт, улучшать алгоритмы рекомендательных систем в социальных сетях и даже прогнозировать погодные условия с невероятной точностью. Но не стоит забывать и про одну из самых значимых и, пожалуй, одну из самых чувствительных областей применения машинного обучения — фармацевтическу отрасль.

Фармацевтические компании всегда находились на передовой борьбы за человеческое здоровье и благополучие. Но современные вызовы — стремительно распространяющиеся заболевания, необходимость разработки новых лекарств и вакцин, а также требования к повышению эффективности и снижению затрат — требуют кардинально новых подходов. Машинное обучение открывает перед нами потрясающие возможности, которые еще недавно казались недостижимыми.

В докладе будет рассказано про то, как машинное обучение помогает оптимизировать процессы в различных бизнес-доменах нашей компании и какие направления машинного обучения и анализа данных мы для этого используем.

Доклад принят в программу конференции

Где и как использовать LLM в задачах поиска

В докладе расскажу о том как LLM могут быть полезны для улучшения качества поисковых алгоритмов.
Будут затронуты следующие вопросы:
— как ускорить разметку и собрать больше примеров для обучения и валидации;

— как обогатить индекс дополнительной информацией и знать больше о документах;

— как сгенерировать обучающие примеры для моделей ранжирования;

— как использовать эмбеддинги от LLM в проде для улучшения семантического поиска;

— как сформировать позапросный индекс дообучая LLM и в чем его преимущества по сравнению с эмбеддиноговым поиском.

Доклад принят в программу конференции