[心得] Alphago的弱點

看板GO (圍棋)作者 (QQQ)時間10年前 (2016/03/13 18:39), 10年前編輯推噓18(18024)
留言42則, 22人參與, 最新討論串1/3 (看更多)
http://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works Shou-de Lin Facebook上面最新的文章(一直判定廣告網站不能貼) 這裡有講alphago的怎麼運作的 "反而利用過去學到的policy 結合了蒙地卡羅樹狀搜尋(MCTS)的方法找出最好棋步" "必須要能夠走出前所未見的局面,降低它對於盤面估測的準確度才會有機會" 可以解釋為甚麼在李九段下出神之一手後就開始秀逗了 alphago利用過去棋譜和不斷自我訓練得一個函數 加上蒙地卡羅樹狀搜尋 來模擬最好的棋步 因為這神之一步是alphago在這幾千萬局中完全沒模擬到的一步 導致模擬全部重來所以之後幾步都下出低級失誤 弱點非常清楚下出alphago沒想出的一步 不過這一步的機會只能用一次 但是因為alphgo能一直不斷學習 這棋譜加入資料庫後同樣的手法就沒用了 所以第五局除非李九段可以下出和今天一樣的神之一手不然沒有機會贏 問題是根本不知道alphago哪些是它下過、哪些是它沒下過的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.249.104.200 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457865583.A.415.html

03/13 18:40, , 1F
其實最有趣的是Alphago不知他在下棋XD
03/13 18:40, 1F

03/13 18:41, , 2F
聖鬥士表示:
03/13 18:41, 2F

03/13 18:41, , 3F
希望阿法狗是蘿莉
03/13 18:41, 3F

03/13 18:41, , 4F
這是誤解吧,每一手AG都是獨立模擬計算,沒有全部重來的
03/13 18:41, 4F

03/13 18:42, , 5F
說法?應該是形勢判斷的邏輯編寫上有問題。
03/13 18:42, 5F

03/13 18:42, , 6F
希望週二能再現奇蹟
03/13 18:42, 6F

03/13 18:45, , 7F
我覺得這次李世石在棋界重返顛峰
03/13 18:45, 7F

03/13 18:48, , 8F
神之一手!?
03/13 18:48, 8F

03/13 18:49, , 9F
如果他下場順序放法都一樣,也會贏,因為alpha還沒修正,但
03/13 18:49, 9F

03/13 18:49, , 10F
李不會這樣做,就是了
03/13 18:49, 10F

03/13 18:51, , 11F
應該是有很多選擇可以下,不一定會一樣吧
03/13 18:51, 11F

03/13 18:51, , 12F
就算你跟一般電腦玩,也不太可能按部就班每次就會一樣
03/13 18:51, 12F

03/13 18:52, , 13F
這盤棋只是他千萬模型的一個,要影響整個學習成果還早
03/13 18:52, 13F

03/13 19:17, , 14F
這隱含的意義是過去以人類棋譜為主的訓練有問題
03/13 19:17, 14F

03/13 19:17, , 15F
也難怪已經計畫好要砍掉重練了
03/13 19:17, 15F

03/13 19:18, , 16F
神個蛋 感覺狗狗被調過了 顯然deepmind不想太招遙
03/13 19:18, 16F

03/13 19:18, , 17F
全敗太難看 讓一下輸一場較好 那麼低級的失誤誰相信
03/13 19:18, 17F

03/13 19:23, , 18F
兩方輸了都有人不相信崩潰 板上也不少
03/13 19:23, 18F

03/13 19:25, , 19F
果然出現了XDD 我就知道有人會說阿發夠被調過 這跟之前
03/13 19:25, 19F

03/13 19:25, , 20F
懷疑保密協定是有啥兩樣
03/13 19:25, 20F

03/13 19:26, , 21F
推"liaon98: 兩方輸了都有人不相信崩潰"XDDD
03/13 19:26, 21F

03/13 19:30, , 22F
alphago以為自己在算數學呢
03/13 19:30, 22F

03/13 19:31, , 23F
進化過的陰謀論嗎 XD
03/13 19:31, 23F

03/13 19:52, , 24F
MK12 亂說,MC 每次算出的機率又不會一樣
03/13 19:52, 24F

03/13 19:53, , 25F
阿法溝的下法有玩過電腦圍棋的應該都看過,只是他是
03/13 19:53, 25F

03/13 19:53, , 26F
阿發溝,怎麼會犯這種低級失誤 XDDDDDD
03/13 19:53, 26F

03/13 19:58, , 27F
我覺得現在在講Alphago低級失誤的跟前三盤在講李失誤的
03/13 19:58, 27F

03/13 19:59, , 28F
的不覺得有即視感嗎?他之所以沒下出好棋是因為對手逼出
03/13 19:59, 28F

03/13 20:00, , 29F
只能推liaon98了...不知道後天又是哪一方崩潰XDD
03/13 20:00, 29F

03/13 20:01, , 30F
來的,就像Google說明了AI到87步發覺了79步開始下錯了
03/13 20:01, 30F

03/13 20:01, , 31F
而79步之後的局面是因為李78步的絕妙好棋造成的
03/13 20:01, 31F
當時看著古力直播 下完那76步之後 ALPHAGO有下左下角一步古力直接挖了一聲 小李也滿臉狐疑(youtube 3h35m) 還有好幾次下在中間右方絕對逃不出去 一直下到棋盤邊邊 古力一直說一直在損失目 bug太明顯了 ※ 編輯: cscscscs22 (111.249.104.200), 03/13/2016 20:13:49

03/13 20:08, , 32F
我不是指誤算喔,我是指必死棋還補一手和下那種低段才
03/13 20:08, 32F

03/13 20:08, , 33F
會下的死活棋. 不過也很合理,電腦只會想贏,他哪知道
03/13 20:08, 33F

03/13 20:09, , 34F
對手實力來決定對方最簡單的死活是否會出錯...
03/13 20:09, 34F

03/13 20:22, , 35F
其實看過這篇就多半會懷疑AlphaGo的 value net 偶爾會錯了
03/13 20:22, 35F

03/13 20:23, , 36F
http://goo.gl/3qzyIv <- 奇怪的圖片偶而騙過 net
03/13 20:23, 36F

03/13 20:27, , 37F
AlphaGo 就是把棋盤當成圖片餵給類似上面文章的 net
03/13 20:27, 37F

03/13 20:33, , 38F
真的, 那步棋就是全場狐疑怎麼會下在那邊
03/13 20:33, 38F

03/13 20:34, , 39F
以籃球比喻, 失誤可能是投球沒進或運球掉球
03/13 20:34, 39F

03/13 20:34, , 40F
而那手就好像AlphaGo拿球跑去投自己籃送你分
03/13 20:34, 40F

03/13 20:36, , 41F
不過這也說明人跟AI的差別, 重要決定還是不能只由AI決定
03/13 20:36, 41F

03/14 08:21, , 42F
Alphago沒有資料庫 是靠不停得自我修正程式
03/14 08:21, 42F
文章代碼(AID): #1MvKDlGL (GO)
文章代碼(AID): #1MvKDlGL (GO)