時(shí)間:2023年3月25日(周六)上午10:30
地點(diǎn):武漢大學(xué)櫻頂老圖書館
主講人:鄧小鐵教授 歐洲科學(xué)院院士
題目:MARL=PPAD
主講人簡介:
鄧小鐵教授,ACM/IEEE/CSIAM Fellow,歐洲科學(xué)院外籍院士。CSIAM區(qū)塊鏈專委會首任主任、CCF計(jì)算經(jīng)濟(jì)專業(yè)組首任主任、北京大學(xué)前沿計(jì)算中心講席教授。主要研究方向?yàn)樗惴安┺恼?、互?lián)網(wǎng)經(jīng)濟(jì)、在線算法,及并行計(jì)算。作為項(xiàng)目負(fù)責(zé)人,他曾承擔(dān)十幾項(xiàng)加拿大、香港、英國,及國家基金委科研項(xiàng)目,發(fā)表論文200余篇,被引用數(shù)千次;多次做國際學(xué)術(shù)會議特邀報(bào)告;曾獲得IEEE理論計(jì)算機(jī)學(xué)術(shù)會議FOCS的最佳論文獎(jiǎng);其成果“關(guān)于圖與組合優(yōu)化的若干經(jīng)典問題的研究”獲高等學(xué)??茖W(xué)研究優(yōu)秀成果獎(jiǎng)(自然科學(xué))二等獎(jiǎng)(排名第二)。2022年獲選ACM SIGecom時(shí)間檢驗(yàn)獎(jiǎng)。應(yīng)用方面獲得多項(xiàng)專利,曾擔(dān)任主要互聯(lián)網(wǎng)公司機(jī)制設(shè)計(jì)顧問。
Brief Introduction of Professor Xiaotie Deng
Professor Xiaotie Deng is a Chair Professor at Peking University with a Ph.D. from Stanford University. His research focuses on algorithmic game theory, particularly in the con-text of the Internet and Blockchain Economics. Deng has taught at several universi-ties and is a Fellow of the ACM, CSIAM, IEEE. He is a foreign member of Academia Europaea. He was awarded the 2022 Test of Time Award from ACM SIGecom.
摘要:
馬爾科夫博弈(也稱為隨機(jī)博弈)為多智能體強(qiáng)化學(xué)習(xí)和順序智能體交互的研究奠定了基礎(chǔ)。我們研究折扣通用和有限狀態(tài)隨機(jī)博弈中(近似)馬爾科夫完美均衡的計(jì)算復(fù)雜度,并證明其為PPAD完備問題。這為開發(fā)多智能體強(qiáng)化學(xué)習(xí)算法以與普通納什均衡計(jì)算方式相同地處理通用和有限狀態(tài)隨機(jī)博弈開辟了可能性。