Re: [爆卦] AlphaGo發現自己79步失誤

看板GO (圍棋)作者 (討推專家)時間10年前 (2016/03/13 17:09), 編輯推噓15(15041)
留言56則, 18人參與, 最新討論串2/6 (看更多)
這篇應該和他後來又po的一篇一起看 https://twitter.com/demishassabis/status/708934687926804482 When I say 'thought' and 'realisation' I just mean the output of #AlphaGo value net. It was around 70% at move 79 and then dived on move 87 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.224.90.96 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457860165.A.569.html

03/13 17:10, , 1F
希望他們可以公佈勝率走勢圖...
03/13 17:10, 1F

03/13 17:11, , 2F
https://goo.gl/8iqGuw 他也對87感到不解啊
03/13 17:11, 2F

03/13 17:12, , 3F
所以是如何推論79錯,而不是更早?
03/13 17:12, 3F

03/13 17:13, , 4F
所以AG自己也不知道在幹嘛?就亂填一個?
03/13 17:13, 4F

03/13 17:13, , 5F
躲打劫變化圖, 下出敗著. AG不喜歡打劫.
03/13 17:13, 5F

03/13 17:13, , 6F
應該就是下現行運算中最佳解
03/13 17:13, 6F

03/13 17:13, , 7F
應該是說79時還有70% 到87直接往下掉?
03/13 17:13, 7F

03/13 17:14, , 8F
因為79開始預估勝率直線下滑吧 所以顯然79是敗著
03/13 17:14, 8F

03/13 17:15, , 9F
AlphaGO 的架構沒有所謂的"概念" 只有"勝率"
03/13 17:15, 9F

03/13 17:15, , 10F
正常來說不會因為一手棋就讓勝率直接改變,但如果
03/13 17:15, 10F

03/13 17:16, , 11F
走勢突然往下滑,那就代表是轉折點的那手棋失誤了
03/13 17:16, 11F

03/13 17:16, , 12F
轉折點不是在87嗎?
03/13 17:16, 12F

03/13 17:17, , 13F
如果是這樣反而該說AlphaGO的決策過程依然不明白自
03/13 17:17, 13F

03/13 17:17, , 14F
己79~87手臭
03/13 17:17, 14F

03/13 17:18, , 15F
右中那八子是關鍵
03/13 17:18, 15F

03/13 17:18, , 16F
他不會明白阿,但輸出資料讓人看得出那是壞棋
03/13 17:18, 16F

03/13 17:19, , 17F
86手時 那七子穩死 卻在87手時又放一子 這種生死連初學
03/13 17:19, 17F

03/13 17:20, , 18F
者都會解 怎超級電腦不會? 這就是他的邏輯有bug阿
03/13 17:20, 18F

03/13 17:20, , 19F
想知道AlphaGO知不知道自己錯在哪 有沒有從自己錯誤
03/13 17:20, 19F

03/13 17:20, , 20F
學習的能力
03/13 17:20, 20F

03/13 17:20, , 21F
這樣算是AI的"盲點〃嗎?
03/13 17:20, 21F

03/13 17:21, , 22F
那為何不是說69手?
03/13 17:21, 22F

03/13 17:22, , 23F
69也是關鍵 但我對87手不解 這種電腦叫高手?
03/13 17:22, 23F

03/13 17:22, , 24F
應該是說 直到87前 AG仍認為自己勝率有70%
03/13 17:22, 24F

03/13 17:22, , 25F
AlphaGO是機器,用意識或概念去理解它是錯誤的
03/13 17:22, 25F

03/13 17:22, , 26F
圍棋連一子都不能亂放 損失很大的
03/13 17:22, 26F

03/13 17:22, , 27F
重新計算後發現79那步讓勝率大幅降低?
03/13 17:22, 27F

03/13 17:23, , 28F
79步就出錯了 但似乎87步才發現勝率降低 表示電腦這七步中
03/13 17:23, 28F

03/13 17:23, , 29F
圍棋高手叫做勝率高的下棋人,不是比誰蠢錯誤少
03/13 17:23, 29F

03/13 17:23, , 30F
不理解他下了勝率差的步數...
03/13 17:23, 30F

03/13 17:23, , 31F
那幾顆本來就是白吃掉了
03/13 17:23, 31F

03/13 17:23, , 32F
但再愚蠢的步數對電腦都不過是勝率計算 這也是為甚麼之前
03/13 17:23, 32F

03/13 17:24, , 33F
AlphaGO 那79手已經是它評估過認為最好的一手
03/13 17:24, 33F

03/13 17:24, , 34F
alphago會下得那麼可怕的原因 你不能因為他下了初學者也不
03/13 17:24, 34F

03/13 17:24, , 35F
會下的蠢步 就說「那麼強」的棋手也會下出「那麼蠢」的步..
03/13 17:24, 35F

03/13 17:25, , 36F
這不是他被設計的方式...
03/13 17:25, 36F

03/13 17:26, , 37F
可以用死活棋玩來難倒他了 下錯一步穩死 這是致命弱點
03/13 17:26, 37F

03/13 17:28, , 38F
演算法只要修改一個點 很多都要大改了 等著看
03/13 17:28, 38F

03/13 17:29, , 39F
這個價值網路有得改了...
03/13 17:29, 39F

03/13 17:29, , 40F
所以柯潔也能掌握這個弱點來應對?
03/13 17:29, 40F

03/13 17:30, , 41F
因為為alphaGO沒算到,還是只要是死活棋爭都行?
03/13 17:30, 41F

03/13 17:31, , 42F
只要出現一個失誤就GG了
03/13 17:31, 42F

03/13 17:31, , 43F
因為阿發狗是走圍地機率的一步棋
03/13 17:31, 43F

03/13 17:32, , 44F
最高
03/13 17:32, 44F

03/13 17:32, , 45F
所以應該是說:問題手應該在79之前,79本身是該發現勝率降
03/13 17:32, 45F

03/13 17:33, , 46F
的點
03/13 17:33, 46F

03/13 17:37, , 47F
我覺得是沒學過 這個變化估計分數應該不高
03/13 17:37, 47F

03/13 17:39, , 48F
這是有可能的,剪枝的概率陡降會發生在正解路線上
03/13 17:39, 48F

03/13 17:40, , 49F
很可能87之後的剪枝選項大幅減少,導致勝率陡降
03/13 17:40, 49F

03/13 17:41, , 50F
但在79時因為白棋選項還很多,無法反應在勝率上
03/13 17:41, 50F

03/13 17:42, , 51F
分數不高會直接反應在計算上, 不深入就可能導致漏算
03/13 17:42, 51F

03/13 17:43, , 52F
只要有算進去應該就會發現大虧 不可能選它
03/13 17:43, 52F

03/13 18:43, , 53F
wnglon對AlphaGo不會下死活棋的判斷跟前三盤不衝突嗎?
03/13 18:43, 53F

03/13 18:44, , 54F
我不懂圍棋不知道,只是覺得既然李九段之前苦戰那麼久@@
03/13 18:44, 54F

03/13 18:44, , 55F
譬如可能只有非常特定盤面+特定型態的死活棋才會發bug
03/13 18:44, 55F

03/13 18:45, , 56F
就像CGary板友的說明,不能直接跟人類棋手類比的。
03/13 18:45, 56F
文章代碼(AID): #1MvIv5Lf (GO)
文章代碼(AID): #1MvIv5Lf (GO)