本發(fā)明的實施例公開一種基于人機混合增強的復(fù)雜產(chǎn)品自主構(gòu)建方法和模塊,所述方法包括:S10、根據(jù)人的知識建立從關(guān)鍵特征狀態(tài)到行動映射的參數(shù)化知識模型,將所述知識模型中的待測參數(shù)編碼成神經(jīng)網(wǎng)絡(luò)的輸出向量;S20、根據(jù)環(huán)境的關(guān)鍵特征狀態(tài)以及獎勵函數(shù)輸出值編碼神經(jīng)網(wǎng)絡(luò)的輸入向量;S40、智能體配置;S50、基于人已知的經(jīng)驗知識產(chǎn)生從關(guān)鍵特征狀態(tài)到行動映射的訓(xùn)練數(shù)據(jù),利用所述訓(xùn)練數(shù)據(jù)反向擬合神經(jīng)網(wǎng)絡(luò)參數(shù),驅(qū)動知識模型在訓(xùn)練環(huán)境中推演;S60、基于強化學(xué)習持續(xù)優(yōu)化所述神經(jīng)網(wǎng)絡(luò)參數(shù),直至完成所述神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,最終實現(xiàn)智能體的自適應(yīng)。
聲明:
“基于人機混合增強的復(fù)雜產(chǎn)品自主構(gòu)建方法和模塊” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)