關鍵詞:路徑規劃 智能車輛 強化學習 深度學習 車輛模型
摘要:針對智能駕駛車輛傳統路徑規劃中出現車輛模型跟蹤誤差和過度依賴問題,提出一種基于深度強化學習的模型遷移的智能駕駛車輛軌跡規劃方法.首先,提取真實環境的抽象模型,該模型利用深度確定性策略梯度(DDPG)和車輛動力學模型,共同訓練逼近最優智能駕駛的強化學習模型;其次,通過模型遷移策略將實際場景問題遷移至虛擬抽象模型中,根據該環境中訓練好的深度強化學習模型計算控制與軌跡序列;而后,根據真實環境中評價函數選擇最優軌跡序列.實驗結果表明,所提方法能夠處理連續輸入狀態,并生成連續控制的轉角控制序列,減少橫向跟蹤誤差;同時通過模型遷移能夠提高模型的泛化性能,減小過度依賴問題.
控制理論與應用雜志要求:
{1}原稿中圖、表集中附于文后,分別按其在正文中出現的先后次序連續編碼。每幅圖表應冠有圖(表)題。說明性的文字應置于圖(表)下方注釋中,并在注釋中標明圖表中使用的全部非公知公用的縮寫。
{2}3個月內未接到用稿通知,作者可自行處理。
{3}來稿所涉及的課題如屬于基金資助項目,應于文題頁左下方加以注釋,并附基金證書復印件。
{4}正文標題:內容應簡潔、明了。標題層次一級標題用“一、二、……”來標識,二級標題用“(一)、(二)、……”來標識,三級標題用“1.2.”來標識,四級標題用“(1)(2)”來標識。一般不宜超過4層。
{5}注釋均采用當頁腳注連排,標號為①、②、③……
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社