本發(fā)明實(shí)施例公開(kāi)了一種報(bào)價(jià)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。該方法包括:獲取目標(biāo)資源的被測(cè)狀態(tài)參數(shù)和被測(cè)資源參數(shù),其中,所述被測(cè)資源參數(shù)包括至少一個(gè)被測(cè)報(bào)價(jià)系數(shù);將所述被測(cè)狀態(tài)參數(shù)和被測(cè)資源參數(shù)輸入到預(yù)先訓(xùn)練完成的目標(biāo)報(bào)價(jià)模型中,得到輸出的目標(biāo)報(bào)價(jià)系數(shù)和與所述目標(biāo)報(bào)價(jià)系數(shù)對(duì)應(yīng)的目標(biāo)收益,其中,所述目標(biāo)報(bào)價(jià)模型基于深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練得到。本發(fā)明實(shí)施例通過(guò)基于深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練目標(biāo)報(bào)價(jià)模型,解決了不完全信息影響報(bào)價(jià)準(zhǔn)確度的問(wèn)題,為目標(biāo)資源的供應(yīng)商提供最優(yōu)的報(bào)價(jià)決策,以使得供應(yīng)商的市場(chǎng)收益最大化。
聲明:
“報(bào)價(jià)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)