[討論] 或許類似征子的大型單行道棋形才是弱點

看板GO (圍棋)作者 (Cython)時間9年前 (2016/03/14 21:02), 9年前編輯推噓7(707)
留言14則, 9人參與, 最新討論串1/1
這幾天看來看去似乎最多篇文章都是想要針對打劫來突破 不過很少人討論征子...我個人覺得這可能是一個突破點 (其實我覺得#1MveEG8q 這篇內文和推文有些跟我想法就有點相似...) 為什麼會覺得征子是一個突破點呢 因為他是一個手數很長的單行道 以前AI用的Alpha-Beta系列演算法和現在的MCTS演算法 如果沒有特別去補這塊 可能都會碰到難題 Alpha-Beta系列其實本質上是窮舉 征子征到棋盤對面要二三十手 要窮舉這麼多手不太可能 只能窮舉到一半 然後用審局函數(類似形勢判斷的意思)判定現在盤面 但是沒有特別給電腦征子的知識的話 這個下到一半的征子恐怕電腦是看不懂誰死誰活的.. 至於MCTS為什麼會有問題呢 就如上面說的 他是一個手數很長的單行道 假設我(電腦)是白方 黑方一直跑 我每一手都只有一個著點可以繼續征(沒引征點的話) 中間只要我一手下錯 黑方就跑掉了 反過來說也是 只要被征方一手沒跑 就馬上被吃了 而MCTS是靠(大量)隨機下子模擬棋局的話 相對於根本沒有標準答案的序盤 可能有不同手筋/不同轉換餘地/局部手順沒這麼長的中盤 征子你要電腦連續隨機下30手都下在"標準答案"的地方是很困難的 或者可以說 我隨機模擬一盤 剛好模擬到這個正確結果的機率小到趨近於0 就算模擬到了那樣本數也微不足道 當然還有一招是從職棋的譜中自然習得 但是職棋的譜又不可能真的把征子征到棋盤底死給你看 電腦怎麼知道被征掉的那方不跑是因為會跑到最後被吃掉? 怎麼知道征掉別人的那方不提掉是因為對方不可能跑得掉? 所以說征子的確是大有可能需要特別寫規則去照顧的.. 當然我們是希望這種人類的"特別干涉"越少越好 我們不會特別去教電腦下什麼定石什麼手筋 這樣case by case的去教不但根本教不完而且可能根本反效果 但至少初階的程式不特別照顧征子的話一定會爆炸 這種特別餵給電腦的知識叫domain knowledge 其實靠隨機模擬的MCTS一開始可能就需要一些基本的domain knowledge 不然會很恐怖 例如至少要教他有兩個眼的大龍不可以去自填 不然一方下到形勢大好結果把單官填完開始填自己眼位自殺..這樣模擬的結果根本沒意義 (而且這樣電腦怎麼知道什麼時候一盤棋是下完了???) 嗯...回到一開始說的目的 當然我相信AlphaGo一定有做好面對基本征子的準備 (連我都知道征子是個常見的困擾 他們怎可能不知道...) 補強這塊的演算法可能也比初階的程式採取的方案更完備 不過如果變得更複雜 例如帶有征子的攻殺 或是引征又複合其他手筋的情況 或許alphago會產生很大的困擾 當然其他手數長的(對人類而言的)單行道 我也覺得都可以試試 征子對電腦的難題總歸一句就是 有手數長的唯一解 但是人類解答非常輕鬆 電腦很困難 所以才要特別解決 其他棋型有手數長的單行道的話 恐怕一般人類也不是這麼容易看清 但是職棋應該是有機會得多... (P.S.其實我覺得中盤阿法狗那些莫名其妙的著手也是跟單行道有關...雖然人類 看得很明白我都應對你這些來鬧的著手都沒有用 但是對電腦而言你只要中間一手下錯 我就出棋逆轉了 所以判斷自己劣勢的時候就會來搞這些地方 就戰略來講是對的(落後要搞棋) 只是戰術上來講 他選擇了隨機模擬時對手有可能下錯 但實際上人類不可能應錯的點 所以那些棋就人的眼光看起來很可笑 但我不覺得這是bug) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.4.192 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457960575.A.299.html

03/14 21:11, , 1F
印象中rollout有避免被吃子的policy
03/14 21:11, 1F

03/14 21:28, , 2F
手數長的唯一解對人類來說就是區域的窮舉法,這人腦有優勢
03/14 21:28, 2F

03/14 21:31, , 3F
mcts不是隨機下子 所以這結果無法預測
03/14 21:31, 3F
^^^^^^^^^^^^^^^^ 呃..那是? ※ 編輯: Django (140.112.4.192), 03/14/2016 21:40:18

03/14 21:40, , 4F
想看alphaGO下大雪崩定石的各種變化...
03/14 21:40, 4F

03/14 21:43, , 5F
ladder是他神經網路的基本參數 審盤時就直接算玩死活了
03/14 21:43, 5F

03/14 21:43, , 6F
論文附表有寫
03/14 21:43, 6F
嗯 感覺蠻合理的 他有寫到他可以處理多複雜的征子嗎?

03/14 21:46, , 7F
古力講第三盤提到的活征不知道alphago會不會
03/14 21:46, 7F
※ 編輯: Django (140.112.4.192), 03/14/2016 21:53:58

03/14 21:59, , 8F
下大雪崩真的會累死棋士 XD 可以試試看啦 也要阿發師願
03/14 21:59, 8F

03/14 21:59, , 9F
意應才行
03/14 21:59, 9F

03/14 22:02, , 10F
說不定alphago遇到大雪崩或大斜千變這種棋都會選簡單定型的
03/14 22:02, 10F

03/14 22:02, , 11F
變化(OS:誰跟你算到死
03/14 22:02, 11F

03/14 23:11, , 12F
但它可能不會乖乖征,要弄出一個夠大的征子不容易
03/14 23:11, 12F

03/15 01:43, , 13F
AG的模擬走子網路有3段 不是光隨機亂下的
03/15 01:43, 13F

03/15 01:44, , 14F
李世石是和幾百個能高速運算的三段對決
03/15 01:44, 14F
文章代碼(AID): #1MvhP_AP (GO)
文章代碼(AID): #1MvhP_AP (GO)