本公開(kāi)提供了一種移動(dòng)順序確定模型的訓(xùn)練方法、確定移動(dòng)順序的方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),涉及人工智能領(lǐng)域,具體涉及時(shí)空大數(shù)據(jù)領(lǐng)域和強(qiáng)化學(xué)習(xí)領(lǐng)域。移動(dòng)順序確定模型的訓(xùn)練方法的具體實(shí)現(xiàn)方案為:針對(duì)多個(gè)第一對(duì)象中的未移動(dòng)對(duì)象,確定針對(duì)未移動(dòng)對(duì)象的環(huán)境信息;將環(huán)境信息輸入移動(dòng)順序確定模型,獲得針對(duì)多個(gè)第一對(duì)象的預(yù)測(cè)概率信息;根據(jù)預(yù)測(cè)概率信息,確定針對(duì)移動(dòng)順序確定模型的第一獎(jiǎng)勵(lì)信息;以及根據(jù)第一獎(jiǎng)勵(lì)信息,訓(xùn)練移動(dòng)順序確定模型,其中,預(yù)測(cè)概率信息包括多個(gè)第一對(duì)象中的每個(gè)第一對(duì)象作為目標(biāo)對(duì)象的概率值。
聲明:
“移動(dòng)順序確定模型的訓(xùn)練方法和確定移動(dòng)順序的方法、裝置” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)