コロキウム

マルコフ決定過程とエルゴード最適化

本永翔也 氏

2023年7月27日(木) 15時00分

総合研究10号館317号室

マルコフ決定過程は,方策と呼ばれる制御入力を選択して目的関数を最適化する確率制御システムの一つであり,ロボット制御や経済学などに用いられるだけでなく,機械学習の一分野である強化学習にも活用されている.一方,エルゴード最適化は,力学系に対し目的関数を最大化する不変確率測度を求める問題であり,Matherによるラグランジュ系の不変集合に関する研究を源流として,近年盛んに研究されている.本講演では,マルコフ決定過程をエルゴード最適化の観点から捉え,両者の関係について現在までに得られた結果を紹介するとともに今後の展望について述べる.