本發(fā)明公開一種基于云原生的強(qiáng)化學(xué)習(xí)流水線方法、系統(tǒng)、設(shè)備及存儲介質(zhì);包括:基于系統(tǒng)框架和數(shù)據(jù)序列化協(xié)議,構(gòu)建云原生存儲系統(tǒng);對原始數(shù)據(jù)集進(jìn)行預(yù)處理,并將預(yù)處理的數(shù)據(jù)集存儲至云原生存儲系統(tǒng);啟動強(qiáng)化學(xué)習(xí)智能體和強(qiáng)化學(xué)習(xí)環(huán)境進(jìn)行交互,產(chǎn)生軌跡數(shù)據(jù),存儲到軌跡緩存池,并構(gòu)建強(qiáng)化學(xué)習(xí)自有數(shù)據(jù)集;調(diào)用軌跡緩存池的軌跡數(shù)據(jù),更新強(qiáng)化學(xué)習(xí)智能體模型;保存更新完成的強(qiáng)化學(xué)習(xí)智能體模型到云原生存儲系統(tǒng)中,構(gòu)建模型推理服務(wù);基于訓(xùn)練過程中的訓(xùn)練日志,構(gòu)建日志可視化微服務(wù),實時反饋智能體訓(xùn)練結(jié)果,并將結(jié)果保存到云原生存儲系統(tǒng)。本發(fā)明能夠提高決策分析場景中分布式訓(xùn)練、循環(huán)運行和云原生部署的可靠性、簡便性和實用性。
聲明:
“基于云原生的強(qiáng)化學(xué)習(xí)流水線方法、系統(tǒng)、設(shè)備及存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)