报告题目:Zero-sum stochastic games with the risk-sensitive average criterion
报告人:郭先平教授(中山大学)
时间:10月31日上午10:00
地点:数学学院425
摘要:
This talk concerns with zero-sum stochastic games with the risk-sensitive average criterion. First, we establish the existence of the value and a saddle point under a mild condition,which is weaker than those in [SIAM J. Control Optim. 2019, 57(1): 219-240] and [Stochastic Process. Appl. 2014, 124(1): 961-983]. Next, different from the existing literature on the risk-sensitive average stochastic games which only focuses on the existence of saddle points, we additionally propose two efficient algorithms to approximate the value and saddle points, respectively. Finally, we illustrate our conclusions with an example.
报告人简介:
郭先平教授1996年于中南大学获博士学位(概率统计专业),2002于中山大学晋升为教授,2009年获国家杰出青年科学基金。郭先平教授从事马氏过程和随机最优化的研究,曾应邀到美国Wayne State大学,英国Liverpool大学,澳大利亚Queensland大学,澳大利亚South Australia 大学,墨西哥CINVESTAV,香港科技大学,香港中文大学等进行多年合作与研究。在马氏决策过程(英文缩写为MDP)和随机对策(又称博弈)的研究中取得若干创新性成果和重要进展。比如:他原创性地建立了研究MDP平均最优的第三种方法---“平均最优双不等式”方法;首次建立美法学者等关注的离散时间非平稳MDP的平均最优方程;还首次给出连续时间Markov对策的最优性条件和逼近算法。他的主要成果以学术论文形式发表在Ann. Appl. Probab., IEEE Trans. Autom. Control, SIAM J. Optim., SIAM J. Control Optim., Math. Oper. Res.,Adv. in Appl. Probab., J. Appl. Probab., J. Optim. Theory Appl., J.Theory Probab., IFAC Automat., European J. Oper. Res., Systems Control Lett., Bernoulli,《中国科学》,《科学通报》等多种国际杂志上,并在国际顶级出版社Springer 出版第一本关于连续时间MDP的英文专著。他的科研成果还得到国际同行学者发表在 SIAM J. Control Optim., Automatica J.IFAC, Math. Meth. Oper. Res., J. Math. Anal. Appl.,TOP, Math. Reviews,和Zentralblatt MATH等国际杂志上的高度肯定和公开评价。