本發(fā)明公開一種基于強化學(xué)習(xí)的無人機傳感器故障時容錯控制方法,測定無人機各項物理常數(shù),搭建無人機環(huán)境模擬器,在訓(xùn)練時隨機設(shè)置傳感器故障干擾無人機控制并使用DDPG算法訓(xùn)練無人機控制策略模型,逐步增加無人機故障種類并將穩(wěn)定表現(xiàn)的策略收集到容錯控制策略候選池中,在仿真環(huán)境隨機故障測試后,得到最優(yōu)的容錯控制策略;在推理階段,對于訓(xùn)練好的策略模型,基于策略網(wǎng)絡(luò)輸出交給無人機執(zhí)行。本發(fā)明在仿真環(huán)境中模擬無人機不同的傳感器故障組合,在策略與環(huán)境交互時,保證固定比例的無故障樣本數(shù)據(jù)的存在,使得強化學(xué)習(xí)可以同時學(xué)習(xí)到傳感器故障時和非故障時的飛行策略,使得無人機傳感器故障時的容錯控制更加魯棒,高效。
聲明:
“基于強化學(xué)習(xí)的無人機傳感器故障時容錯控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)