關(guān)鍵詞:agent 強(qiáng)化學(xué)習(xí) 交通信號 交叉口 信號配時
摘要:相對于傳統(tǒng)的交通信號配時決策方法,多Agent強(qiáng)化學(xué)習(xí)及其協(xié)調(diào)方法能更好地適應(yīng)城市路網(wǎng)交通環(huán)境的變化。為探討其在城市路網(wǎng)自適應(yīng)交通信號配時決策中的應(yīng)用,系統(tǒng)地總結(jié)了多Agent強(qiáng)化學(xué)習(xí)及協(xié)調(diào)機(jī)制的研究方法,詳細(xì)地分析了國內(nèi)外研究現(xiàn)狀,并指出現(xiàn)有研究中存在的問題,在此基礎(chǔ)上對未來研究進(jìn)行了展望。研究結(jié)果表明,既有研究主要針對規(guī)模較小的路網(wǎng),存在維數(shù)災(zāi)難問題,強(qiáng)化學(xué)習(xí)與協(xié)調(diào)機(jī)制結(jié)合研究還不夠深入,相關(guān)學(xué)習(xí)參數(shù)分析不夠細(xì)致,仿真環(huán)境和情景現(xiàn)實性不強(qiáng)。未來研究可以引入馬爾科夫博弈提高決策協(xié)調(diào)性,嵌入混合交通流、公交優(yōu)先等交通管理思想增強(qiáng)決策實用性,引入先驗知識及其他學(xué)習(xí)技術(shù)加快學(xué)習(xí)速度,融入物聯(lián)網(wǎng)、主動管理、大數(shù)據(jù)等先進(jìn)理念和前沿技術(shù)增加決策的實時性,與交通誘導(dǎo)等集成提升決策的系統(tǒng)性。
交通標(biāo)準(zhǔn)化雜志要求:
{1}前言應(yīng)充分說明研究工作的背景、意義、本文擬解決的問題、采用的方法和手段,引出重要文獻(xiàn),全面評述相關(guān)研究工作,突出本工作的重要性和創(chuàng)新性,不要忽視國內(nèi)同行的工作。
{2}作者文責(zé)自負(fù),因抄襲、剽竊他人文章而引起的一切后果完全由作者自己負(fù)責(zé),本刊概不承擔(dān)連帶責(zé)任。若發(fā)現(xiàn)抄襲、剽竊他人文章,本刊將予以曝光,并嚴(yán)肅處理。
{3}題目務(wù)必言簡意賅,一般不用副標(biāo)題,字?jǐn)?shù)不超過20個字,中英文題目應(yīng)一致。
{4}引用的參考文獻(xiàn)應(yīng)為最近5年內(nèi)發(fā)表的,且一般要求5篇以上;另外,參考文獻(xiàn)著錄采用順序編碼制,即按在正文中被引用的先后順序排列。
{5}作者署名在文章題目下方按順序排列,其姓名排列順序應(yīng)在來稿時確定,編排過程中不應(yīng)再做改動。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社