本發(fā)明涉及機器學習裝置、機器學習方法以及記錄介質。本發(fā)明生成用于適當?shù)剌斔洼斔臀锏尿寗釉吹目刂菩畔?。在學習沿著輸送路徑連續(xù)地輸送至少2個輸送物的輸送裝置中的驅動源的行動的機器學習裝置中,基于設置于輸送路徑的檢測部的檢測結果,獲取至少2個輸送物在輸送路徑上的位置信息,并基于獲取到的位置信息,根據(jù)預先決定出的規(guī)則來計算報酬,并基于獲取到的位置信息和計算出的報酬計算強化學習的行動價值,來學習行動,并生成用于使驅動源進行基于學習結果確定出的行動的控制信息并輸出。
聲明:
“機器學習裝置、機器學習方法以及機器學習程序” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)