基礎(chǔ)金屬	銅電解銅銅精礦銅管銅棒廢銅銅排銅合金精銅桿再生銅桿銅板帶鋁鋁土礦氧化鋁電解鋁鋁輔料鋁棒鋁合金錠廢鋁鋁桿鋁型材鋁板卷鉛鉛精礦鉛錠鉛蓄電池再生精鉛還原鉛廢鉛蓄電池鉛合金鋅鋅精礦電解鋅鋅合金氧化鋅鋅粉錫錫精礦錫錠錫材
稀貴金屬	稀土稀土礦稀土氧化物稀土金屬釹鐵硼小金屬銻鉍銦鍺鎵硒鉭鋯貴金屬白銀
新能源	鋰鋰礦鋰化合物正極材料電芯金屬鋰鎳鎳礦鎳鐵精煉鎳鎳鹽三元前驅(qū)體材料高冰鎳 MHP 鈷電解鈷鈷粉氯化鈷四氧化三鈷硫酸鈷鈷中間品氧化鈷碳酸鈷三元前驅(qū)體三元材料鈷酸鋰三元正極材料錳錳礦電解錳電池級(jí)硫酸錳鋰電正極三元前驅(qū)體磷酸鐵四氧化三鈷鋰電負(fù)極石油焦煅燒焦針狀焦瀝青焦包覆瀝青炭黑增炭劑光伏材料多晶硅硅片電池片光伏組件光伏玻璃工業(yè)硅隔膜隔膜電解液電解液

基礎(chǔ)金屬

銅電解銅銅精礦銅管銅棒廢銅銅排銅合金精銅桿再生銅桿銅板帶鋁鋁土礦氧化鋁電解鋁鋁輔料鋁棒鋁合金錠廢鋁鋁桿鋁型材鋁板卷鉛鉛精礦鉛錠鉛蓄電池再生精鉛還原鉛廢鉛蓄電池鉛合金鋅鋅精礦電解鋅鋅合金氧化鋅鋅粉錫錫精礦錫錠錫材

稀貴金屬

稀土稀土礦稀土氧化物稀土金屬釹鐵硼 小金屬銻鉍銦鍺鎵硒鉭鋯 貴金屬白銀

新能源

鋰鋰礦鋰化合物正極材料電芯金屬鋰鎳鎳礦鎳鐵精煉鎳鎳鹽三元前驅(qū)體材料高冰鎳 MHP 鈷電解鈷鈷粉氯化鈷四氧化三鈷硫酸鈷鈷中間品氧化鈷碳酸鈷三元前驅(qū)體三元材料鈷酸鋰三元正極材料錳錳礦電解錳電池級(jí)硫酸錳 鋰電正極三元前驅(qū)體磷酸鐵四氧化三鈷 鋰電負(fù)極石油焦煅燒焦針狀焦瀝青焦包覆瀝青炭黑增炭劑 光伏材料多晶硅硅片電池片光伏組件光伏玻璃工業(yè)硅隔膜隔膜 電解液電解液

華東	上海上海保稅區(qū)江蘇南京無(wú)錫徐州常州蘇州南通連云港淮安鹽城揚(yáng)州鎮(zhèn)江泰州宿遷南京港宜興浙江杭州寧波溫州紹興湖州嘉興金華衢州臺(tái)州麗水舟山安徽合肥蕪湖蚌埠淮南馬鞍山淮北銅陵安慶黃山阜陽(yáng)宿州滁州六安宣城池州亳州福建福州廈門(mén)漳州泉州三明莆田南平龍巖寧德江西南昌九江上饒撫州宜春吉安贛州景德鎮(zhèn)萍鄉(xiāng)新余鷹潭山東濟(jì)南青島淄博棗莊東營(yíng)煙臺(tái)濰坊濟(jì)寧泰安威海日照濱州德州聊城臨沂菏澤萊州港龍口港黃島前灣港董家口港日照港青島港威海港煙臺(tái)港鄒平萊蕪
華北	北京天津天津港河北石家莊唐山秦皇島邯鄲邢臺(tái)保定張家口承德滄州廊坊衡水京唐港曹妃甸港黃驊港曹妃甸寧晉山西太原大同朔州忻州陽(yáng)泉呂梁晉中長(zhǎng)治晉城臨汾運(yùn)城內(nèi)蒙古呼和浩特包頭烏海赤峰通遼鄂爾多斯呼倫貝爾巴彥淖爾烏蘭察布興安盟錫林郭勒盟阿拉善盟
華南	廣東廣州韶關(guān)深圳珠海汕頭佛山江門(mén)湛江茂名肇慶惠州梅州汕尾河源陽(yáng)江清遠(yuǎn)東莞中山潮州揭陽(yáng)云浮廣東保稅區(qū)黃埔港廣西南寧柳州桂林梧州北海崇左來(lái)賓賀州玉林百色河池欽州防城港貴港北海港欽州港來(lái)賓海南海口三亞三沙
華中	河南鄭州開(kāi)封洛陽(yáng)平頂山安陽(yáng)鶴壁新鄉(xiāng)焦作濮陽(yáng)許昌漯河三門(mén)峽商丘周口駐馬店南陽(yáng)信陽(yáng)濟(jì)源鞏義湖北武漢黃石十堰宜昌襄陽(yáng)鄂州荊門(mén)孝感荊州黃岡咸寧隨州恩施州仙桃潛江天門(mén)湖南長(zhǎng)沙株洲湘潭衡陽(yáng)邵陽(yáng)岳陽(yáng)常德張家界益陽(yáng)婁底郴州永州懷化湘西州
東北	遼寧沈陽(yáng)大連鞍山撫順本溪丹東錦州營(yíng)口阜新遼陽(yáng)盤(pán)錦鐵嶺朝陽(yáng)葫蘆島鲅魚(yú)圈盤(pán)錦港錦州港吉林長(zhǎng)春四平遼源通化白山松原白城延邊州黑龍江哈爾濱齊齊哈爾雞西鶴崗雙鴨山大慶伊春佳木斯七臺(tái)河牡丹江黑河綏化大興安嶺地區(qū)
西南	重慶貴州貴陽(yáng)遵義六盤(pán)水安順畢節(jié)銅仁黔東南州黔南州黔西南州四川成都自貢攀枝花瀘州德陽(yáng)綿陽(yáng)廣元遂寧內(nèi)江樂(lè)山南充眉山宜賓廣安達(dá)州雅安巴中資陽(yáng)阿壩州甘孜州涼山州西藏拉薩日喀則昌都林芝山南那曲阿里地區(qū)云南昆明曲靖玉溪昭通保山麗江普洱臨滄德宏州怒江州迪慶州大理州楚雄彝族州紅河彝族州文山苗族州西雙版納州
西北	甘肅蘭州嘉峪關(guān)金昌白銀天水武威張掖平?jīng)?/a>酒泉慶陽(yáng)定西隴南臨夏州甘南州陜西西安寶雞咸陽(yáng)銅川渭南延安榆林漢中安康商洛青海西寧海東海北州黃南州海南州果洛州玉樹(shù)州海西州寧夏銀川石嘴山吳忠固原中衛(wèi)新疆烏魯木齊克拉瑪依吐魯番哈密阿克蘇地區(qū)喀什和田昌吉州博爾塔州巴音州克孜州伊犁州塔城阿勒泰自治區(qū)

華東

上海上海保稅區(qū)江蘇南京無(wú)錫徐州常州蘇州南通連云港淮安鹽城揚(yáng)州鎮(zhèn)江泰州宿遷南京港宜興浙江杭州寧波溫州紹興湖州嘉興金華衢州臺(tái)州麗水舟山安徽合肥蕪湖蚌埠淮南馬鞍山淮北銅陵安慶黃山阜陽(yáng)宿州滁州六安宣城池州亳州福建福州廈門(mén)漳州泉州三明莆田南平龍巖寧德江西南昌九江上饒撫州宜春吉安贛州景德鎮(zhèn)萍鄉(xiāng)新余鷹潭山東濟(jì)南青島淄博棗莊東營(yíng)煙臺(tái)濰坊濟(jì)寧泰安威海日照濱州德州聊城臨沂菏澤萊州港龍口港黃島前灣港董家口港日照港青島港威海港煙臺(tái)港鄒平萊蕪

華北

北京天津天津港河北石家莊唐山秦皇島邯鄲邢臺(tái)保定張家口承德滄州廊坊衡水京唐港曹妃甸港黃驊港曹妃甸寧晉山西太原大同朔州忻州陽(yáng)泉呂梁晉中長(zhǎng)治晉城臨汾運(yùn)城 內(nèi)蒙古呼和浩特包頭烏海赤峰通遼鄂爾多斯呼倫貝爾巴彥淖爾烏蘭察布興安盟錫林郭勒盟阿拉善盟

華南

廣東廣州韶關(guān)深圳珠海汕頭佛山江門(mén)湛江茂名肇慶惠州梅州汕尾河源陽(yáng)江清遠(yuǎn)東莞中山潮州揭陽(yáng)云浮廣東保稅區(qū)黃埔港廣西南寧柳州桂林梧州北海崇左來(lái)賓賀州玉林百色河池欽州防城港貴港北海港欽州港來(lái)賓海南海口三亞三沙

華中

河南鄭州開(kāi)封洛陽(yáng)平頂山安陽(yáng)鶴壁新鄉(xiāng)焦作濮陽(yáng)許昌漯河三門(mén)峽商丘周口駐馬店南陽(yáng)信陽(yáng)濟(jì)源鞏義湖北武漢黃石十堰宜昌襄陽(yáng)鄂州荊門(mén)孝感荊州黃岡咸寧隨州恩施州仙桃潛江天門(mén)湖南長(zhǎng)沙株洲湘潭衡陽(yáng)邵陽(yáng)岳陽(yáng)常德張家界益陽(yáng)婁底郴州永州懷化湘西州

東北

遼寧沈陽(yáng)大連鞍山撫順本溪丹東錦州營(yíng)口阜新遼陽(yáng)盤(pán)錦鐵嶺朝陽(yáng)葫蘆島鲅魚(yú)圈盤(pán)錦港錦州港吉林長(zhǎng)春四平遼源通化白山松原白城延邊州 黑龍江哈爾濱齊齊哈爾雞西鶴崗雙鴨山大慶伊春佳木斯七臺(tái)河牡丹江黑河綏化大興安嶺地區(qū)

西南

重慶貴州貴陽(yáng)遵義六盤(pán)水安順畢節(jié)銅仁黔東南州黔南州黔西南州四川成都自貢攀枝花瀘州德陽(yáng)綿陽(yáng)廣元遂寧內(nèi)江樂(lè)山南充眉山宜賓廣安達(dá)州雅安巴中資陽(yáng)阿壩州甘孜州涼山州西藏拉薩日喀則昌都林芝山南那曲阿里地區(qū)云南昆明曲靖玉溪昭通保山麗江普洱臨滄德宏州怒江州迪慶州大理州楚雄彝族州紅河彝族州文山苗族州西雙版納州

西北

甘肅蘭州嘉峪關(guān)金昌白銀天水武威張掖平?jīng)?/a>酒泉慶陽(yáng)定西隴南臨夏州甘南州陜西西安寶雞咸陽(yáng)銅川渭南延安榆林漢中安康商洛青海西寧海東海北州黃南州海南州果洛州玉樹(shù)州海西州寧夏銀川石嘴山吳忠固原中衛(wèi)新疆烏魯木齊克拉瑪依吐魯番哈密阿克蘇地區(qū)喀什和田昌吉州博爾塔州巴音州克孜州伊犁州塔城阿勒泰自治區(qū)

基于事后回顧和漸進(jìn)式擴(kuò)展的持續(xù)強(qiáng)化學(xué)習(xí)非完全信息博弈方法及裝置

938 編輯：管理員來(lái)源：中冶有色技術(shù)網(wǎng)

2023-03-19 07:00:51

本發(fā)明公開(kāi)了一種基于事后回顧和漸進(jìn)式擴(kuò)展的持續(xù)強(qiáng)化學(xué)習(xí)非完全信息博弈方法及裝置，包括下述步驟：獲取非完全博弈環(huán)境，確定任務(wù)目標(biāo)；構(gòu)建第一神經(jīng)網(wǎng)絡(luò)和基于未來(lái)值預(yù)測(cè)的強(qiáng)化學(xué)習(xí)方法；構(gòu)建事后經(jīng)驗(yàn)回顧池；對(duì)第一神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，直至第一神經(jīng)網(wǎng)絡(luò)收斂；構(gòu)建漸進(jìn)式神經(jīng)網(wǎng)絡(luò)，實(shí)現(xiàn)網(wǎng)絡(luò)模型的漸進(jìn)式擴(kuò)展；選擇下一個(gè)任務(wù)作為任務(wù)目標(biāo)，利用基于未來(lái)值預(yù)測(cè)的強(qiáng)化學(xué)習(xí)方法持續(xù)訓(xùn)練，直至所有的任務(wù)都訓(xùn)練完成。本發(fā)明通過(guò)使用非完全信息博弈場(chǎng)景中豐富的智能體狀態(tài)變化作為監(jiān)督信號(hào)，解決該環(huán)境下的獎(jiǎng)勵(lì)稀疏問(wèn)題，同時(shí)引入持續(xù)學(xué)習(xí)框架漸進(jìn)式神經(jīng)網(wǎng)絡(luò)對(duì)未來(lái)值預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行動(dòng)態(tài)擴(kuò)展，解決了在該環(huán)境下的多任務(wù)場(chǎng)景中的災(zāi)難性遺忘的問(wèn)題。

聲明：

“基于事后回顧和漸進(jìn)式擴(kuò)展的持續(xù)強(qiáng)化學(xué)習(xí)非完全信息博弈方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系該技術(shù)所有人。

我是此專利(論文)的發(fā)明人(作者)