九九百科網

位置:首頁 > 經驗 > 

蒙特卡洛樹是什麼算法

經驗3.92K

蒙特卡洛樹是什麼算法

將遊戲中所有的可能性表示成一棵樹,樹的第N層就代表着遊戲中的第N步。樹的node數是隨着樹的深度成指數增長的,不考慮剪枝,每個node都是需要進行估值的。 Minimax tree在諸如象棋,黑白棋等傳統遊戲中取得了巨大的成功,主要原因還是有兩個, 1、 遊戲本身的探索空間相對較小,配合剪枝,開局和殺棋棋譜,非平衡樹探索等優化技術,加上並行計算和Iterative Deepening,使得探索到樹的深層甚至底層成為可能。 2、 搜素的最終目的就是找出對自己最有利的一步,而判斷是不是有利自然需要一定的評判標準。一般我們用一個評價函數來作為標準。象棋等遊戲的子有不同的強弱,並且有明確的目的性(諸如殺死對方的王),容易人工設計出或者通過機器學習得出一個良好的評價函數來正確評估一步落子所引發的後續局面。