本發(fā)明公開了基于Rainbow的通道注意力網(wǎng)絡(luò)的軟件自動(dòng)測(cè)試方法,包括以下步驟:S1、搭建包括有數(shù)據(jù)池的智能體?環(huán)境交互系統(tǒng);S2、收集先驗(yàn)樣本數(shù)據(jù),并將收集到的先驗(yàn)樣本數(shù)據(jù)放入智能體?環(huán)境交互系統(tǒng)的數(shù)據(jù)池中;S3、搭建基于通道注意力機(jī)制融合競(jìng)爭(zhēng)模塊的決策網(wǎng)絡(luò);S4、對(duì)步驟S3搭建的基于通道注意力機(jī)制融合競(jìng)爭(zhēng)模塊的決策網(wǎng)絡(luò)進(jìn)行訓(xùn)練;S5、結(jié)合訓(xùn)練完成的基于通道注意力機(jī)制融合競(jìng)爭(zhēng)模塊的決策網(wǎng)絡(luò)進(jìn)行軟件測(cè)試。本發(fā)明有效地提高了游戲軟件自動(dòng)測(cè)試的效率,節(jié)約了時(shí)間成本。相較于傳統(tǒng)的Q學(xué)習(xí)或者其他強(qiáng)化學(xué)習(xí)的范式,本發(fā)明在策略搜索的速度得到進(jìn)一步提升,一定程度上解決了強(qiáng)化學(xué)習(xí)策略搜索收斂速度較慢的困境。
聲明:
“基于Rainbow的通道注意力網(wǎng)絡(luò)的軟件自動(dòng)測(cè)試方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)