皇冠网址-皇冠网游一分钱发货_百家乐过滤工具_全讯网送6 (中国)·官方网站

5月17日 付俊杰教授學術(shù)報告(數(shù)學與統(tǒng)計學院)

來源:數(shù)學行政作者:時間:2025-05-14瀏覽:45設(shè)置

報 付俊杰 教授

報告題目:基于模型加速安全強化學習的無人車軌跡跟蹤控制

報告時間:20250517日(周六)上午10:30

報告地點騰訊會議411-195-263

主辦單位:數(shù)學與統(tǒng)計學院、數(shù)學研究院、科學技術(shù)研究院

報告人簡介:

     付俊杰,東南大學教授,博導,教育部國家高層次人才,江蘇省杰出青年基金獲得者。2011年及2017年于北京大學工學院分別獲學士和博士學位。2017年至今于東南大學任教。主要研究方向包括輸入飽和多智能體分布式協(xié)同控制、分布式協(xié)同避障、分布式模型預測控制、多智能體安全強化學習等。至今共發(fā)表(含接收)SCI期刊論文50余篇,出版中文專著2部,英文專著章節(jié)1篇。申請國家發(fā)明專利11項(已授權(quán)6項)。主持國防項目、教育部裝備預研聯(lián)合基金、江蘇省杰出青年基金項目、國家自然科學基金面上及青年項目等。曾獲2022年中國指揮與控制學會科學技術(shù)進步一等獎(排2/15),2023年亞太神經(jīng)網(wǎng)絡(luò)學會青年研究獎,2022  ICUS 最佳會議論文獎(排1/2)等。擔任國際SCI期刊The Innovation、 Intelligence and Robotics、無人系統(tǒng)技術(shù)等青年編委,IEEE SMC Magazine編委。目前為中國指揮與控制學會網(wǎng)絡(luò)科學與工程專委會副總干事、IEEE Senior Member。

報告摘要:

  對于復雜環(huán)境下存在動力學不確定性的無人車系統(tǒng)安全軌跡跟蹤控制問題,傳統(tǒng)自適應或者擾動補償控制方法通常依賴于未知動力學及外界擾動項的一些先驗信息,而魯棒控制方法通常依賴于擾動上界并且控制輸入具有一定保守性?;趶娀瘜W習方法的軌跡跟蹤控制可以降低對系統(tǒng)動力學及環(huán)境信息的依賴,僅利用在線交互數(shù)據(jù)即可實現(xiàn)對控制策略的學習與訓練。然而,強化學習過程中的探索步驟對于無人車運行過程中的安全性構(gòu)成威脅,且強化學習算法通常需要大量樣本才能實現(xiàn)策略網(wǎng)絡(luò)收斂,可能帶來過高的訓練成本。本報告介紹近期提出的一種基于模型加速安全強化學習的無人車軌跡跟蹤控制方法,能夠?qū)崿F(xiàn)策略網(wǎng)絡(luò)訓練過程中無人車系統(tǒng)的高安全性以及大幅提升策略網(wǎng)絡(luò)訓練速度。



返回原圖
/

海港城百家乐的玩法技巧和规则 | 百家乐官网娱乐真人娱乐| 东莞百家乐的玩法技巧和规则| 百家乐官网大赢家书籍| 澳门百家乐打法百家乐破解方法 | 百家乐图淑何看| 百家乐官网休闲游戏| 百家乐百乐发破解版| 百家乐软件稳赚| 百家乐官网转盘技巧| 新时代百家乐的玩法技巧和规则 | 百家乐官网软件编辑原理| 威尼斯人娱乐城赌场| 诸子百家乐官网的玩法技巧和规则| 威尼斯人娱乐城 老品牌值得信赖| 百家乐官网娱乐场开户注册| 网络赌场| 百家乐园qq群| 视频百家乐官网破解| 大发888被查封| 百家乐博彩网排名| 百家乐官网代打是真的吗| 456棋牌游戏| 淘金百家乐的玩法技巧和规则| 单机百家乐官网的玩法技巧和规则| 总统线上娱乐城| 大发888游戏网页版| 百家乐现金网开户平台| 百家乐官网走势图| 宁德市| 南通棋牌游戏中心| 威尼斯人娱乐场 28| 华人百家乐官网博彩论| 澳门百家乐官网怎样下注| 爱博彩论坛| 抚顺市| 香港六合彩的开奖结果| 大发888娱乐游戏注册| 多伦多百家乐的玩法技巧和规则 | 金盾百家乐官网网址| 澳门百家乐官网投注法|