時間:2023年3月25日(周六)上午10:30
地點:武漢大學櫻頂老圖書館
主講人:鄧小鐵教授 歐洲科學院院士
題目:MARL=PPAD
主講人簡介:
鄧小鐵教授,ACM/IEEE/CSIAM Fellow,歐洲科學院外籍院士。CSIAM區(qū)塊鏈專委會首任主任、CCF計算經濟專業(yè)組首任主任、北京大學前沿計算中心講席教授。主要研究方向為算法及博弈論、互聯網經濟、在線算法,及并行計算。作為項目負責人,他曾承擔十幾項加拿大、香港、英國,及國家基金委科研項目,發(fā)表論文200余篇,被引用數千次;多次做國際學術會議特邀報告;曾獲得IEEE理論計算機學術會議FOCS的最佳論文獎;其成果“關于圖與組合優(yōu)化的若干經典問題的研究”獲高等學校科學研究優(yōu)秀成果獎(自然科學)二等獎(排名第二)。2022年獲選ACM SIGecom時間檢驗獎。應用方面獲得多項專利,曾擔任主要互聯網公司機制設計顧問。
Brief Introduction of Professor Xiaotie Deng
Professor Xiaotie Deng is a Chair Professor at Peking University with a Ph.D. from Stanford University. His research focuses on algorithmic game theory, particularly in the con-text of the Internet and Blockchain Economics. Deng has taught at several universi-ties and is a Fellow of the ACM, CSIAM, IEEE. He is a foreign member of Academia Europaea. He was awarded the 2022 Test of Time Award from ACM SIGecom.
摘要:
馬爾科夫博弈(也稱為隨機博弈)為多智能體強化學習和順序智能體交互的研究奠定了基礎。我們研究折扣通用和有限狀態(tài)隨機博弈中(近似)馬爾科夫完美均衡的計算復雜度,并證明其為PPAD完備問題。這為開發(fā)多智能體強化學習算法以與普通納什均衡計算方式相同地處理通用和有限狀態(tài)隨機博弈開辟了可能性。