03.11.2022

Анонс открытой лекции по прикладной математике

9 ноября, в 15.40, в аудитории 1.8 Festo в рамках Научного семинара ИПИ состоится лекция профессора Ажмякова Вадима Викторовича.

9 ноября, в 15.40, в аудитории 1.8 Festo в рамках Научного семинара ИПИ состоится лекция профессора Ажмякова Вадима Викторовича. Тема лекции: «ON THE CONTROL THEORETICAL FOUNDATIONS OF REINFORCEMENT LEARNING».

ABSTRACT

Our talk is devoted to the control theoretical principles and algorithmic implementation of the advanced numerical methods from the Optimal Control Theory (OCT). We consider OCT techniques in the Reinforcement Learning (RL) computational framework. Recently some researchers (mostly from USA, China) have detected a deep interconnection between the classical OCT and the conceptual part of the RL.

We also refer to [2 - 3] for the related ideas and results. It is common knowledge, that the conventional OCT includes many effective, rigorous, and practically approved systems optimization algorithms (see e.g. [1] and [3]). This fact is due to a relatively large “uptime” of this specific control engineering area.

The main idea of the proposed concept consists in the natural methodology transfer from OCT to the modern RL. We discuss here the above transferring approach and indicate some novel RL research directions.   

Bibliography

[1] V. Azhmyakov, A Relaxation Based Approach to Optimal Control of Switched Systems, Elsevier, Oxford, 2019.

[2] D. P. Bertsekas, Value and Policy Iteration in Deterministic Optimal Control and Adaptive Dynamic Programming, Lab. for Information and Decision Systems Report LIDS-P-3174, MIT, May 2015 (revised Sept. 2015);

IEEE Transactions on Neural Networks and Learning Systems, Vol. 28, 2017, pp. 500-509.

[3] D.P. Bertsekas, Reinforcement Learning and Optimal Control, Athena Scientific, 2019

Последние новости

Зачем мошенники похищают аккаунты россиян на «Госуслугах»?

Преступники пытаются получить доступ к аккаунту на «Госуслугах», чтобы взять кредит или микрозайм.

ЛДПР отказалось от объединения с одной из политической партий

Руководство партии ЛДПР отказалось от идеи слияния с Партией дела, которую возглавляет бизнесмен Константин  Бабкин.

В Индии заинтересованы в сотрудничестве с Россией в сфере цифровых инноваций

Прогресс России в цифровых инновациях является ценным опытом для Индии, совместные проекты в этой сфере могут пойти на пользу обеим странам.

Card image

Как они помогают управлять бюджетом и сэкономить

Комментарии (0)

Добавить комментарий

Ваш email не публикуется. Обязательные поля отмечены *