本發(fā)明屬于室內(nèi)定位技術(shù)領(lǐng)域,具體是涉及一種面向異構(gòu)環(huán)境的基于深度強化學(xué)習(xí)的軌跡定位方法。本發(fā)明充分利用了環(huán)境中的觀測和智能體自身的歷史動態(tài)信息,以智能體的位置、環(huán)境中具有設(shè)備異構(gòu)性的RSS向量和過去n個時刻的歷史動作為狀態(tài),用于動作的選擇。再基于近場條件選擇強于RSS閾值對應(yīng)的APs,以構(gòu)成選定的APs集合,再根據(jù)集合的大小計算最終獎賞值。依據(jù)MDP中設(shè)計的各要素對智能體的位置進(jìn)行估計,并以獎賞值為學(xué)習(xí)導(dǎo)向基于經(jīng)驗重放機(jī)制和目標(biāo)網(wǎng)絡(luò)進(jìn)行深度強化學(xué)習(xí)算法的迭代訓(xùn)練。本發(fā)明基于路徑損耗模型得到具有設(shè)備異構(gòu)性的仿真RSS數(shù)據(jù),實驗結(jié)果證明本發(fā)明所提方法能夠?qū)崿F(xiàn)較高的定位精度,并對處理異構(gòu)RSS數(shù)據(jù)也具有一定的魯棒性。
聲明:
“面向異構(gòu)環(huán)境的基于深度強化學(xué)習(xí)的軌跡定位方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)