PTT遊戲區 / GO (圍棋)

Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

看板GO (圍棋)作者BBSealion (Peaceful Warrior)時間9年前 (2017/05/23 20:23)推噓11(12推 1噓 29→)

留言42則, 17人參與討論串2/5 (看更多)

這問題從第一次人機戰開始就不停有人問，我來認真解釋一下好了其實推文也有人講到重點了大家已經知道電腦看的是勝率了，這是根本原因沒錯但這勝率是怎樣來的才是重點簡單說AlphoGo有兩個系統一個可以靠當下就猜出大概每步棋的價值（可以簡單想成勝率）另一個就是，反正我就選一步，然後自己左右互搏下他個上千盤，看勝率多少就好目前v25版本的第一個系統到底有多準還有這兩個系統現在互相比重佔了幾成在官方公布前不知道我們就簡單先拿容易理解的第二系統來說就會知道AlphaGo到底在"讓"什麼鬼了現在假想一個情境：AlphaGo執白，棋局已到中後盤全局無弱棋，領先5目半但這"領先5目半"從人類的角度來看的電腦看到什麼呢？他只看到"我怎麼下勝率都接近100%" 那假如現在有10個可能的選點其中最好的一手（不損目）的只有1種損1目、損2目、損3目的各三種 AlphaGo把每一種都試一次之後結果會發現，啊怎麼好像都一樣啊？（勝率都接近100%) 於是只剩一些微小的模擬隨機誤差來決定他想選哪個簡單說等於他就是隨便選了一個，當然選中最佳解的機率是不高的所以雖然人類角度看起來他就是在損、在讓但在電腦的角度這叫做"我就真的不知道哪個比較好啊？看起來不都一模一樣嗎？" 當然，這絕對是不影響最終勝負的因為假如電腦不幸選了損3目的棋，現在上帝視角來看盤面只領先2目半了下一次同樣看到10的選點，一樣的價值分布他會發現，不損目、損1目、損2目的勝率都一樣，接近100%，但損3目的勝率只有30% 他很自然就會在前三種可能性隨機挑一個，但絕不會挑到會輸的那種如此隨機的挑著挑著，由於每次最佳解被挑到的機率，一定小於其他解最後結果就是會變成只贏一點點，但他就是會贏這其實是很有趣的一個地方因為”思考方式”的不同造成互相不理解就像電腦也會覺得人類布局的棋非常詭異（假如電腦有感情的話）明明我試了一千次就發現A下法勝率比B下法高5百分點你為什麼還是選A，你是故意在讓我嗎？他就無法理解人類真的就是沒辦法看出A、B哪個選點比較好就只是靠感覺隨便選了一個而已 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.6.25 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495542184.A.EC1.html

推

05/23 20:27, , 1^F

05/23 20:27, 1^F

→

05/23 20:29, , 2^F

05/23 20:29, 2^F

→

05/23 20:29, , 3^F

05/23 20:29, 3^F

→

05/23 20:30, , 4^F

05/23 20:30, 4^F

→

05/23 20:30, , 5^F

05/23 20:30, 5^F

→

05/23 20:32, , 6^F

05/23 20:32, 6^F

→

05/23 20:32, , 7^F

05/23 20:32, 7^F

推

05/23 21:07, , 8^F

05/23 21:07, 8^F

→

05/23 21:08, , 9^F

05/23 21:08, 9^F

→

05/23 21:17, , 10^F

05/23 21:17, 10^F

→

05/23 21:26, , 11^F

05/23 21:26, 11^F

→

05/23 21:26, , 12^F

05/23 21:26, 12^F

→

05/23 21:27, , 13^F

05/23 21:27, 13^F

→

05/23 21:34, , 14^F

05/23 21:34, 14^F

→

05/23 21:36, , 15^F

05/23 21:36, 15^F

推

05/23 22:07, , 16^F

05/23 22:07, 16^F

推

05/23 22:59, , 17^F

05/23 22:59, 17^F

→

05/23 22:59, , 18^F

05/23 22:59, 18^F

推

05/23 23:13, , 19^F

05/23 23:13, 19^F

→

05/23 23:14, , 20^F

05/23 23:14, 20^F

→

05/23 23:14, , 21^F

05/23 23:14, 21^F

推

05/23 23:40, , 22^F

05/23 23:40, 22^F

→

05/23 23:40, , 23^F

05/23 23:40, 23^F

→

05/23 23:40, , 24^F

05/23 23:40, 24^F

→

05/23 23:40, , 25^F

05/23 23:40, 25^F

推

05/24 00:08, , 26^F

05/24 00:08, 26^F

→

05/24 01:03, , 27^F

05/24 01:03, 27^F

→

05/24 01:03, , 28^F

05/24 01:03, 28^F

推

05/24 02:10, , 29^F

05/24 02:10, 29^F

推

05/24 03:27, , 30^F

05/24 03:27, 30^F

→

05/24 03:27, , 31^F

05/24 03:27, 31^F

→

05/24 03:27, , 32^F

05/24 03:27, 32^F

→

05/24 03:27, , 33^F

05/24 03:27, 33^F

噓

05/24 05:08, , 34^F

05/24 05:08, 34^F

推

05/24 07:09, , 35^F

05/24 07:09, 35^F

推

05/24 07:56, , 36^F

05/24 07:56, 36^F

→

05/24 07:56, , 37^F

05/24 07:56, 37^F

→

05/24 07:57, , 38^F

05/24 07:57, 38^F

推

05/24 10:46, , 39^F

05/24 10:46, 39^F

→

05/24 10:48, , 40^F

05/24 10:48, 40^F

→

05/24 10:48, , 41^F

05/24 10:48, 41^F

→

05/24 12:07, , 42^F

05/24 12:07, 42^F

稍微澄清一下 1. 100%是誇張的說法，實際上通常頂多就是70%, 80%之類，但這對電腦已經算是很穩的意思了，套句人類口語說法就是"贏定了" 2. 如果某損目下法，確實能讓局面更穩勝率提高，這選擇沒啥爭議，我只是特別針對某些明明看起來損了目，同時其他不損目的下法也完全看不出有什麼風險在裡面，甚至感覺上沒有減少到任何複雜度的特別情境討論而已很多人懷疑這種100%盡損的棋一定是刻意讓，其實不是 3. 這只是個簡化和只取片段的說法若直接照搬說AlphaGo就是這樣判斷的，確實會有點誤導之嫌，我只是單純用非常簡單誇張的例子，讓大家試著從勝率之眼去看棋盤，而不是從人類數目的眼光去看 ※ 編輯: BBSealion (114.25.6.25), 05/24/2017 21:30:00

‣ 返回看板[ GO ] 棋類

‣ 更多 BBSealion 的文章

文章代碼(AID): #1P92cex1 (GO)

討論串 (同標題文章)

以下文章回應了本文：

2

5

Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

9年前, 05/24

完整討論串 (本文為第 2 之 5 篇)：

排序：最新先 | 最舊先 | 留言數

3

7

Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

9年前, 05/25

4

12

Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

9年前, 05/24

2

5

Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

9年前, 05/24

11

42

Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

9年前, 05/23

27

46

[問題] 為什麼現在AlphaGO開始會"讓"呢?

9年前, 05/23

在新視窗開啟完整討論串 (共5篇)

GO 近期熱門文章

2

2

[新聞] 農心杯韓國“二申”確定出戰，白山水杯

4天前, 07/12

1

1

[新聞] 晉城賽半決賽雙世冠會師決賽，趙晨宇陳

1周前, 07/05

2

2

[閒聊] 圍棋比賽沒服裝限制嗎？

1周前, 07/04

2

2

[新聞] 福岡航太朗奪得本因坊，打破塵封55年紀錄

2周前, 07/02

3

3

[新聞] 王元均直落二奪得圍棋快棋王　終結3年冠

3周前, 06/24

5

8

[新聞] 許皓鋐圍棋名人賽稱王　自評整體發揮不夠出色

3周前, 06/22

1

1

[新聞] 佐田篤史終於等到這一天:首次挑戰七大頭銜

4周前, 06/18

8

12

[新聞] LG杯決賽三番棋落幕，王星昊榮膺生涯第二

1月前, 06/16

更多近期熱門文章 >>

PTT遊戲區即時熱門文章

28

94

[閒聊] 所以T1破解HLE斯溫的方法是正解嗎?

15分鐘前, 07/17

12

50

[閒聊] 狀態是能這麼快調整好的嗎==?

16分鐘前, 07/17

13

41

[閒聊] 韓華有可能是受時差影響嗎

17分鐘前, 07/17

47

78

[閒聊] EWC含金量比MSI高對吧

18分鐘前, 07/17

11

25

[閒聊] Bin哥是最大贏家嗎

18分鐘前, 07/17

31

53

[閒聊] 石油盃的含金量是不是比MSI高

19分鐘前, 07/17

10

57

[閒聊] 紅米、Kanavi、Delight到底什麼時候滾

19分鐘前, 07/17

6

12

[閒聊] 名字要有「世界」 T1才會打比賽?

20分鐘前, 07/17

更多即時熱門文章 >>

‣ 返回看板[ GO ] 棋類

‣ 更多 BBSealion 的文章

文章代碼(AID): #1P92cex1 (GO)