30 октября 2024 года состоялось заседание совместного семинара РАИИ и ФИЦ ИУ РАН «Проблемы искусственного интеллекта».
На заседании семинара был представлен доклад на тему «Обучение с подкреплением: теоретические основы и алгоритмические реализации».
Докладчик: кандидат физико-математических наук, доцент Александр Игоревич Панов (в.н.с. Федерального исследовательского центра «Информатика и управление» РАН и AIRI, руководитель Научно-образовательного центра когнитивного моделирования МФТИ)
Аннотация доклада
В докладе были рассмотрены различные формальные постановки задачи обучения с подкреплением: без модели и с моделью среды, многоагентная и объектно-центричная. Были представлены теоретические основы, лежащие в основе базовых алгоритмов обучения с подкреплением, и проанализированы ключевые алгоритмические особенности основных подходов. Особое внимание было уделено обучению с моделью мира и различным вариантам интеграции методов планирования в процесс обучения. В заключение рассматривались несколько примеров решения задач с помощью методов, разрабатываемых под руководством автора доклада, в том числе из области робототехники.
Заседание состоялось конференц-зале ФИЦ ИУ РАН (Москва, ул. Вавилова, дом 44, корп. 2, пом. 124) в смешанном формате.