一種基于深度強化學(xué)習(xí)的優(yōu)化
芯片布局系統(tǒng)及方法,包括:數(shù)據(jù)預(yù)處理模塊、策略網(wǎng)絡(luò)模塊、獎勵預(yù)測模塊和參數(shù)更新模塊,其中:數(shù)據(jù)預(yù)處理模塊讀取并解析pl、net文件,將其中的網(wǎng)表圖信息轉(zhuǎn)換為智能體的初始狀態(tài)以及獎勵函數(shù);策略網(wǎng)絡(luò)模塊通過卷積神經(jīng)網(wǎng)絡(luò)和圖神經(jīng)網(wǎng)絡(luò)分別得到分別包含粗細粒度的全局嵌入特征與結(jié)點嵌入特征,將兩個網(wǎng)絡(luò)分別得到的特征向量融合,最終預(yù)測出當前時刻行為,即元件可能的放置位置的概率分布;獎勵預(yù)測模塊在網(wǎng)表圖內(nèi)的所有元件都放置完畢后,對布局結(jié)果進行總體評價,估計得到線長和擁塞程度指標反饋給智能體;參數(shù)更新模塊根據(jù)從經(jīng)驗池中進行采樣得到的樣本采用近端策略優(yōu)化算法周期地更新神經(jīng)網(wǎng)絡(luò)的參數(shù),實現(xiàn)更好的擬合效果。
聲明:
“基于深度強化學(xué)習(xí)的優(yōu)化芯片布局系統(tǒng)及方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)