本發(fā)明實(shí)施例提供一種自動(dòng)駕駛汽車(chē)決策方法及裝置,所述方法包括:獲取不同駕駛場(chǎng)景下的標(biāo)準(zhǔn)駕駛演示數(shù)據(jù),根據(jù)標(biāo)準(zhǔn)駕駛演示數(shù)據(jù)進(jìn)行模仿學(xué)習(xí),得到不同駕駛場(chǎng)景下的最優(yōu)獎(jiǎng)勵(lì)函數(shù);基于最優(yōu)獎(jiǎng)勵(lì)函數(shù)對(duì)對(duì)應(yīng)的駕駛動(dòng)作進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,得到下層駕駛動(dòng)作決策模型;根據(jù)駕駛場(chǎng)景獲取對(duì)應(yīng)的交通狀態(tài),基于強(qiáng)化學(xué)習(xí)確定與下層駕駛動(dòng)作決策模型對(duì)應(yīng)的上層駕駛場(chǎng)景決策模型;檢測(cè)到汽車(chē)處于自動(dòng)駕駛模式中,通過(guò)上層駕駛場(chǎng)景決策模型,輸出匹配的實(shí)時(shí)駕駛場(chǎng)景,然后確定對(duì)應(yīng)的下層駕駛動(dòng)作決策模型,輸出對(duì)應(yīng)的駕駛動(dòng)作并執(zhí)行。采用本方法能夠更精確地對(duì)駕駛數(shù)據(jù)等進(jìn)行規(guī)劃,增加駕駛行為與人類(lèi)駕駛行為的匹配度。
聲明:
“自動(dòng)駕駛汽車(chē)決策方法及裝置” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)