本發(fā)明公開(kāi)了一種基于高斯強(qiáng)化學(xué)習(xí)的信號(hào)源遍歷方法。首先離散化任務(wù)環(huán)境,并在離散化的環(huán)境中,確定每一個(gè)方格的中心位置;然后,根據(jù)當(dāng)前檢測(cè)到的信號(hào)強(qiáng)度信息和歷史檢測(cè)到的信號(hào)強(qiáng)度信息,采用高斯過(guò)程方法預(yù)測(cè)區(qū)域內(nèi)每一個(gè)方格中心位置的信號(hào)強(qiáng)度信息,并將該信號(hào)強(qiáng)度信息作為強(qiáng)化學(xué)習(xí)中對(duì)應(yīng)的獎(jiǎng)勵(lì)函數(shù);根據(jù)獎(jiǎng)勵(lì)函數(shù),計(jì)算每一個(gè)方格的狀態(tài)值函數(shù),并依據(jù)狀態(tài)值函數(shù),采用滾動(dòng)優(yōu)化思想,得到最優(yōu)方格序列,并將第一個(gè)方格作為四旋翼無(wú)人機(jī)下一步的目標(biāo)位置;開(kāi)發(fā)了預(yù)測(cè)控制方法,能夠根據(jù)目標(biāo)位置,控制四旋翼無(wú)人機(jī)沿著光滑的軌跡到達(dá)目標(biāo)位置,最后完成信號(hào)源遍歷任務(wù)。本發(fā)明采用的方法可以有效提高信號(hào)源遍歷速度,縮短飛行路徑。
聲明:
“基于高斯強(qiáng)化學(xué)習(xí)的信號(hào)源遍歷方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)