PTT遊戲區 / GO (圍棋)

Re: [心得] Alphago的弱點

看板GO (圍棋)作者turing (涂妮)時間10年前 (2016/03/13 21:31)推噓7(8推 1噓 16→)

留言25則, 11人參與討論串2/3 (看更多)

先簡介AlphaGo的原理， AlphaGo有兩個主要的分析網路, 1. 策略網路 policy network 在當前的局面分析可能下的棋點，並計算出現的機率。例如:第二局的37手的五路肩沖的機率是萬分之一。機率高的會分配較多的資源，算的比較深。 2. 值網路 value network 給定一盤面，計算出黑白獲勝的機率。另外，它不是每步棋重新計算。在對手下棋之後，符合的分枝之前計算過的結果會保留繼續用。而在對手思考的同時，他的每個分枝也繼續地再算下去。再看今天第78手後，發生什麼事情？明顯這個「神之一手」不在其策略網路之前估計的棋步中。所以，之前所有值網路所估計的勝率全部報廢。 AlphaGo必需全部重新計算勝率，而需要約五步的時間(到第79~87步) 值網路才回復正常。另外，由前面幾局知道，當它勝定時，有可能會亂下而損棋，原因是勝率都差不多。而今天知道，當它敗定，也會亂下，原因同樣是勝率差不多。所以AlphaGo會有兵敗如山倒的缺陷。真的要測試AlphaGo的Bug，需要的可能是「屁之一手」，在大約80手左右，它已經累計了大量的計算之後，下一手明顯它不曾考慮過的棋，即使它非常地差。再看看它是否會亂掉。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.164.86.21 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457875864.A.3E0.html

噓

03/13 21:35, , 1^F

03/13 21:35, 1^F

推

03/13 21:37, , 2^F

03/13 21:37, 2^F

→

03/13 21:43, , 3^F

03/13 21:43, 3^F

→

03/13 21:43, , 4^F

03/13 21:43, 4^F

→

03/13 21:43, , 5^F

03/13 21:43, 5^F

→

03/13 21:45, , 6^F

03/13 21:45, 6^F

推

03/13 21:51, , 7^F

03/13 21:51, 7^F

→

03/13 21:51, , 8^F

03/13 21:51, 8^F

→

03/13 21:52, , 9^F

03/13 21:52, 9^F

→

03/13 21:52, , 10^F

03/13 21:52, 10^F

→

03/13 21:53, , 11^F

03/13 21:53, 11^F

→

03/13 21:53, , 12^F

03/13 21:53, 12^F

推

03/13 21:54, , 13^F

03/13 21:54, 13^F

推

03/13 22:19, , 14^F

03/13 22:19, 14^F

推

03/13 22:29, , 15^F

03/13 22:29, 15^F

→

03/13 22:32, , 16^F

03/13 22:32, 16^F

推

03/13 23:12, , 17^F

03/13 23:12, 17^F

→

03/13 23:14, , 18^F

03/13 23:14, 18^F

→

03/13 23:23, , 19^F

03/13 23:23, 19^F

→

03/13 23:24, , 20^F

03/13 23:24, 20^F

推

03/13 23:33, , 21^F

03/13 23:33, 21^F

→

03/13 23:51, , 22^F

03/13 23:51, 22^F

推

03/13 23:55, , 23^F

03/13 23:55, 23^F

→

03/13 23:56, , 24^F

03/13 23:56, 24^F

→

03/13 23:56, , 25^F

03/13 23:56, 25^F

‣ 返回看板[ GO ] 棋類

‣ 更多 turing 的文章

文章代碼(AID): #1MvMkOFW (GO)

討論串 (同標題文章)

以下文章回應了本文：

8

35

Re: [心得] Alphago的弱點

10年前, 03/13

完整討論串 (本文為第 2 之 3 篇)：

排序：最新先 | 最舊先 | 留言數

8

35

Re: [心得] Alphago的弱點

10年前, 03/13

7

25

Re: [心得] Alphago的弱點

10年前, 03/13

18

42

[心得] Alphago的弱點

10年前, 03/13

在新視窗開啟完整討論串 (共3篇)

GO 近期熱門文章

3

19

Re: [新聞]第三次“人機大戰”申真諝受讓兩子2比1勝出

1天前, 07/22

2

6

Re: [新聞]第三次“人機大戰”申真諝受讓兩子2比1勝出

1天前, 07/22

4

7

[問題] 為何段差是要讓子，而不是讓目？

1天前, 07/22

5

14

[新聞]第三次“人機大戰”申真諝受讓兩子2比1勝出

1天前, 07/21

1

1

[新聞] 農心杯選拔屠曉宇出線，中國隊陣容“五

3天前, 07/20

7

28

[討論] 申vs KataGo棋譜名字遮住會什麼評價？

3天前, 07/20

5

9

[新聞] 人機大戰次局：申真諝力擒AI模型扳平比分

3天前, 07/19

13

29

[新聞] 申真諝受讓兩子首戰告負，人機大戰十年後

5天前, 07/17

更多近期熱門文章 >>

PTT遊戲區即時熱門文章

5

5

[公告] LoL 樂透開獎

27分鐘前, 07/23

28

71

Re: [閒聊] 叉燒覺得小明劍魔在講幹話

1小時前, 07/23

13

36

[閒聊] Bin大小姐是不是可以回歸了

1小時前, 07/23

-2

27

[閒聊] Viper 打個TT Ahn能被打爛？

1小時前, 07/23

72

167

[閒聊] 叉燒覺得小明劍魔在講幹話

1小時前, 07/23

20

32

Re: [閒聊] Ruler也有自己的卡車了

1小時前, 07/23

42

94

[外絮] T1選手去年有102天投入業外商業活動

1小時前, 07/23

4

5

[公告] LoL 板開始舉辦樂透!

2小時前, 07/23

更多即時熱門文章 >>

‣ 返回看板[ GO ] 棋類

‣ 更多 turing 的文章

文章代碼(AID): #1MvMkOFW (GO)