Мнение Программного комитета о докладе
Владислав расскажет про In-Context RL — новую подобласть машинного обучения с подкреплением, которая базируется на предположении, что можно дистиллировать траектории RL-обучения в модель. Приведет примеры текущих работ в области, в том числе собственных, которые прошли апробацию на ICML 2024.