九九百科網

位置:首頁 > 生活常識 > 

強化學習同一個學習率的圖一樣嗎

強化學習同一個學習率的圖一樣嗎

強化學習同一個學習率的圖不一樣。監督學習要求訓練集和測試集資料分佈越相近越好,但是包含的資料不一樣,不能把分類任務中的一張圖片,同時放到訓練集和測試集中,因為實際情況中可能出現訓練集不包含的圖片,這時要保證監督學習演算法具有一定的泛化能力,能夠在沒見過這張圖片的情況下,對其正確處理。強化學習的目的是優化馬爾科夫決策過程中的智慧體的策略,每次學習是專門針對一個任務進行的。因此,不能讓強化學習優化好一個走迷宮的任務,然後拿學習好的策略去幹其他事,哪怕是讓訓練好的智慧體走一個佈局稍有變化的迷宮,效果也會下降。

標籤:學習 強化