31 января 2024 года состоялось заседание совместного семинара РАИИ и ФИЦ ИУ РАН.
На заседании семинара был представлен доклад на тему «От слабого ИИ к общему универсальному интеллекту (обзор тенденций 2020-2023гг.)».
Докладчик: доктор физико-математических наук, профессор РАН Юрий Валентинович Визильтер (директор по направлению – руководитель научного комплекса «Искусственный интеллект и техническое зрение» ФАУ «ГосНИИАС»)
Аннотация доклада
В докладе обсуждались современные подходы и научные результаты в области искусственного интеллекта (ИИ), нацеленные на получение практически значимых результатов в области компьютерного зрения и анализа больших данных.
Появление в 2011 г. глубоких сверточных нейронных сетей (ГНС, CNN) привело к прорыву в области области компьютерного зрения и распознавания образов. В 2016-2017 гг. этот успех был пересен на области синтеза реалистичных сигналов и изображений, анализа текстов на естественном языке (NLP), обучение с подкреплением (Reinforcement Learning). Следует упомянуть генеративно-состязательные сети (GAN), архитектуры типа Transformer, GPT, BERT, обучение ГНС методом подкрепления, глубокое обучение с использованием структурных моделей (Graph CNN), автоматическое конструирование и обучение глубоких сетей (Auto-ML и др.).
Особый упор в изложении был сделан на современные (2020-2023 гг.) тенденции развития технологий машинного обучения.
В области компьютерного зрения обсуждались визуальные трансформеры и гибридные архитектуры (ConvNeXt).
В области анализа текстов на естественном языке (NLP) главным трендом стало создание и использование больших языковых (LLM) и многомодальных моделей, таких как GPT-3, ChatGPT и др.
В области обучения с подкреплением (RL) были описаны обучение LLM с человеком в обратной связи, совместное обучение универсальных агентов анализу данных и игровым задачам (GATO), обучение с открытым списком виртуальных сред и целевых задач для приобретения когнитивного поведения (Open-Ended Learning), обучение с подкреплением путем программирования LLM для поиска управляющих решений (GITM). Особенно следует выделить появление новой парадигмы программирования в ИИ, которую можно назвать «программированием на LLM для извлечения и применения знаний». Эта новая дисциплина разработки и оптимизации запросов для эффективного использования языковых моделей (LM) получила название «промпт-инжиниринг».
В области генерации данных обсуждались GAN и диффузные модели.
В области универсальных моделей для анализа данных и управления особый упор в изложении дыл сделан на кооперативные модели ГНС, общающихся между собой на естественном языке с целью совместного решения задач (Socratic Models).
В заключении были приведены доводы в пользу начинающегося «большого объединения» всех методов, подходов и задач машинного обучения, а также их объединения с технологиями ИИ на основе формализации знаний и логического вывода. Целью такого объединения может быть создание «объяснимого» универсального ИИ.
Заседание состоялось в конференц-зале ФИЦ ИУ РАН (Москва, ул. Вавилова, дом 44, корп. 2, пом. 124) в смешанном формате.