PTT遊戲區 / GO (圍棋)

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好消失

看板GO (圍棋)作者fallcolor時間9年前 (2016/03/12 11:35)推噓10(10推 0噓 43→)

留言53則, 10人參與討論串8/8 (看更多)

有些觀念我覺得要釐清一下比較好 ML的訓練過程說穿了也只是一種數學問題要分析演算法還是得回到數學的本質既然Alphago的決策模式加入了隨機性再加上訓練NN的過程也不能保證得到global optimum 換言之不管你在training階段餵多棒的data進去 testting階段就是有機會掉到local optimum 而當local optimum距離真正的global optimum很遠時預測就可能出錯 NN模型具有弱點可以從不同面向說明: 1. 因為它的數學模型複雜, 不屬於convex函數任何最佳化演算法本來就不能在這類模型上保證得到global optimum 2. 訓練時採用的stochast gradient descent演算法本身就是局部最佳求解的方式之一 3. 訓練過程中其實也參與一些隨機的機制 (dropout) 現在NN能再紅起來是靠大數據加上研究者聰明的訓練方式 (冠上deep learning之名重新出發) 很大程度地壓抑住上面的本質問題但不代表它就沒有被破解的空間否則那些研究如何加雜訊使模型失效的研究者不就是做心酸的嗎 : -- : 推 ddavid: 不過其實我覺得談到雜訊的時候training處理比較重要 03/12 01:00 : → ddavid: 因為只要training沒因為雜訊造成overfitting，就相對不怕 03/12 01:02 : → ddavid: testing用的資料也有雜訊 03/12 01:03 這個說法是有問題的以NN來說研究者的確透過加雜訊的方式使模型失效但你會說訓練出來的模型overfittting嗎不會呀因為它的泛化能力在一般資料上還是表現得很好只是這不代表它就沒有漏洞可鑽 : → aaaba: 反正就是圍棋的輸入很乾淨，沒也所謂雜訊干擾的問題。train 03/12 01:18 : → aaaba: ing的時候根本就沒有加爛譜砸自己腳的道理。測試階段也無法 03/12 01:18 : → aaaba: 讓電腦接收到雜訊，落子偏一路之類的，對電腦可不是什麼雜 03/12 01:18 : → aaaba: 訊，而是你下壞了。 03/12 01:18 這個說法也太武斷如果演算法能準確判斷每一步壞棋相當於有能力找到global optimum了但從數學本質分析NN就是只能做到近似最佳解而已所以必然存在一些決策容易使訓練出來的系統預測失準只不過要找到這些漏洞悲觀地說還是得靠演算法而不是人不過我很認同你說的圍棋資料是相對乾淨的data這件事要處理的data乾淨與否對ML是非常重要的在這方面我甚至認為是圍棋資料的優勢以下是我第一局比完當天寫在個人FB頁面的看法作為參考佐證: -- 今天有在關心AI的人應該都很興奮吧，下午我在辦公室其實也興奮得做不下事，一直找同事討論這話題。不過持平說，AI(或者說machine learning)在圍棋競技取得的勝利其意義未必像一般人想像的這麼大：　 1. ML的精神是透過模型訓練機制從大量的、看似無規則的資料中歸納出有意義的pattern ，換言之若資料本身不具此性質(或pattern性質遭到破壞)，再高明的ML技術也難使力。從這點來看，圍棋遊戲是非常適合ML大展手腳的data。19x19棋盤格搭配黑/白/無三種狀態變化，可能的輸入棋面為3^361種，這個數字對於許多現實應用所要處理的資料變化其實還遠小得多。例如一張640x480以8 bit編碼的數位影像，資料可能性就有 256^(640x480)種。　 2. 第1點從資料空間說明了圍棋遊戲這種資料形態在ML應用上的優勢，但更關鍵的一點或許是圍棋資料不太出現會影響決策的雜訊，也就是說資料的pattern性質不容易被破壞。這裡可以將雜訊直觀地理解成無法預測的隨機變數。在圍棋世界裡造成棋手判斷錯誤的一步並不是雜訊，而是對手對數十回合後精密預測的結果，換言之這裡面必然存在某種 pattern可以學習。然而真實世界中，不管是從感測器(sensor)收到的訊號或者從人類活動中量化得到的數值，卻會面臨各式各樣雜訊挑戰。這些雜訊基本無法歸納，都是模型殺手。　 3. 綜合1,2點，如果將ML技術看待成data-model-prediction三者之間建立起來的關係，圍棋遊戲在data-model這一段的難度其實遠遠低於其他AI應用。然而alphago的成功也不容抹煞，它證明了現在的ML演算法已經差不多征服model-prediction這一段的複雜度，畢竟以決策結果的空間來說圍棋是非常困難的，而今天中盤後alphago卻做到近乎零失誤演出。但未來ML的挑戰仍然是在data-model這一段，要縮小資料空間的複雜度，必須仰賴對問題的先驗知識(prior knowledge)以及考驗演算法本身對雜訊的容錯程度。說白話一點，當資料本身的pattern性質已經微乎其微了，你怎麼期待ML演算法能夠分辨什麼是雜訊的擾動而什麼又是這世界隱含的規則呢？從不完美的資料裡發掘由資料詮釋的完美邏輯，這才應該是ML研究者們繼續努力的價值所在。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.43.207.184 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457753722.A.E98.html

推

03/12 11:39, , 1^F

03/12 11:39, 1^F

→

03/12 11:39, , 2^F

03/12 11:39, 2^F

→

03/12 11:40, , 3^F

03/12 11:40, 3^F

→

03/12 11:45, , 4^F

03/12 11:45, 4^F

推

03/12 11:46, , 5^F

03/12 11:46, 5^F

→

03/12 11:46, , 6^F

03/12 11:46, 6^F

→

03/12 11:46, , 7^F

03/12 11:46, 7^F

→

03/12 11:46, , 8^F

03/12 11:46, 8^F

→

03/12 11:46, , 9^F

03/12 11:46, 9^F

→

03/12 11:46, , 10^F

03/12 11:46, 10^F

→

03/12 11:47, , 11^F

03/12 11:47, 11^F

→

03/12 11:48, , 12^F

03/12 11:48, 12^F

→

03/12 11:48, , 13^F

03/12 11:48, 13^F

→

03/12 11:48, , 14^F

03/12 11:48, 14^F

→

03/12 11:48, , 15^F

03/12 11:48, 15^F

→

03/12 11:49, , 16^F

03/12 11:49, 16^F

→

03/12 11:50, , 17^F

03/12 11:50, 17^F

→

03/12 11:51, , 18^F

03/12 11:51, 18^F

→

03/12 11:52, , 19^F

03/12 11:52, 19^F

→

03/12 11:53, , 20^F

03/12 11:53, 20^F

→

03/12 11:54, , 21^F

03/12 11:54, 21^F

因為你的說法有點矛盾所以我試著回答兩個面向如果是指不告訴演算法label而要它學習出資料的pattern 這叫unsupervised learning ML一直都有這種技術而如果是指訓練label中帶noie的情況卻期望演算法自動抵抗這個題目過去ML也一直在研究只是改良的幅度沒到十分驚人而已基於deep learning的NN可以超越過去所有ML技術主要原因還是它的模型複雜度比過去高太多了

推

03/12 11:59, , 22^F

03/12 11:59, 22^F

→

03/12 12:00, , 23^F

03/12 12:00, 23^F

→

03/12 12:01, , 24^F

03/12 12:01, 24^F

→

03/12 12:02, , 25^F

03/12 12:02, 25^F

推

03/12 12:03, , 26^F

03/12 12:03, 26^F

→

03/12 12:03, , 27^F

03/12 12:03, 27^F

→

03/12 12:03, , 28^F

03/12 12:03, 28^F

→

03/12 12:03, , 29^F

03/12 12:03, 29^F

→

03/12 12:03, , 30^F

03/12 12:03, 30^F

→

03/12 12:03, , 31^F

03/12 12:03, 31^F

→

03/12 12:03, , 32^F

03/12 12:03, 32^F

我了解你的意思不過貼那個連結就是想表達即使模型預測失效的機率很低研究者還是有策略利用另外一套演算法找出它的缺點不用這麼絕望畢竟面對的不是百分百global optimum

→

03/12 12:03, , 33^F

03/12 12:03, 33^F

→

03/12 12:09, , 34^F

03/12 12:09, 34^F

→

03/12 12:10, , 35^F

03/12 12:10, 35^F

這是當然阿 data source複雜度越高當然就要提高模型的複雜度我心得那一段要說明的是圍棋這種乾淨資料對"所有ML技術"而言都是比較歡迎的 (但是這種說法並沒有討論到決策空間的複雜度)

推

03/12 12:24, , 36^F

03/12 12:24, 36^F

→

03/12 12:24, , 37^F

03/12 12:24, 37^F

→

03/12 12:24, , 38^F

03/12 12:24, 38^F

→

03/12 12:24, , 39^F

03/12 12:24, 39^F

推

03/12 12:24, , 40^F

03/12 12:24, 40^F

→

03/12 12:32, , 41^F

03/12 12:32, 41^F

→

03/12 12:33, , 42^F

03/12 12:33, 42^F

→

03/12 12:36, , 43^F

03/12 12:36, 43^F

推

03/12 12:36, , 44^F

03/12 12:36, 44^F

→

03/12 12:37, , 45^F

03/12 12:37, 45^F

你好像誤會了希望做到的是在testing階段下出怪手(像對輸入資料加noise)使模型預測失準而不是在訓練階段加雜訊

→

03/12 12:38, , 46^F

03/12 12:38, 46^F

※ 編輯: fallcolor (114.43.207.184), 03/12/2016 12:51:53

推

03/12 12:57, , 47^F

03/12 12:57, 47^F

→

03/12 12:58, , 48^F

03/12 12:58, 48^F

→

03/12 13:00, , 49^F

03/12 13:00, 49^F

→

03/12 13:03, , 50^F

03/12 13:03, 50^F

→

03/12 13:04, , 51^F

03/12 13:04, 51^F

推

03/12 14:01, , 52^F

03/12 14:01, 52^F

推

03/12 15:22, , 53^F

03/12 15:22, 53^F

‣ 返回看板[ GO ] 棋類

‣ 更多 fallcolor 的文章

文章代碼(AID): #1MuuvwwO (GO)

討論串 (同標題文章)

本文引述了以下文章的的內容：

15

169

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好消失

9年前, 03/12

完整討論串 (本文為第 8 之 8 篇)：

排序：最新先 | 最舊先 | 留言數

10

53

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好消失

9年前, 03/12

4

30

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好

9年前, 03/12

3

11

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好

9年前, 03/12

15

169

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好消失

9年前, 03/12

6

22

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好

9年前, 03/11

6

29

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好

9年前, 03/11

5

21

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好

9年前, 03/11

10

28

Re: [好文推薦] 這兩盤棋沒人會比李世石做得好

9年前, 03/11

在新視窗開啟完整討論串 (共8篇)

GO 近期熱門文章

2

5

[棋訊] 2025台灣十大圍棋新聞票選

1周前, 01/01

1

1

[新聞] 棋仙戰王星昊打進決賽，明年2月將與朴廷桓

2周前, 12/29

1

3

[新聞] 首屆世界棋仙戰八強中國棋手佔據兩席

2周前, 12/28

5

5

[棋訊] 棋仙戰16強對陣

2周前, 12/25

5

6

[討論] 仲邑菫擊敗許家元

2周前, 12/25

3

5

[新聞] 不止黑嘉嘉！激萌美少女竟是職業圍棋棋士

3周前, 12/22

1

1

[新聞] 金恩持十天番棋兩勝崔精聯賽屠龍楊鼎新

3周前, 12/21

1

1

[新聞] 72歲徐奉洙午夜鬥魂率隊登頂韓國元老聯

3周前, 12/20

更多近期熱門文章 >>

PTT遊戲區即時熱門文章

5

11

[閒聊] 任務鋼鐵雄心應該要算稜彩了吧

11小時前, 01/13

10

19

[戰棋] 賭貝爾薇絲安比薩玩起來有夠爽==

12小時前, 01/13

-4

6

[情報]索尼宣傳「支援 8500 款舊作」遭玩家狠酸

[ PlayStation ]

12小時前, 01/13

8

11

[閒聊] 台哥大翻譯的媽媽還在嗎?

13小時前, 01/12

15

15

Re: [閒聊] Doran直播狂喊Oner

14小時前, 01/12

27

57

Re: [閒聊] 韓國積分神秘93%勝率帳號

14小時前, 01/12

10

11

[閒聊] Doran上學的時候就知道怎麼卡視野了

14小時前, 01/12

12

35

[戰棋] 幹為啥我這樣五階段會五連敗

15小時前, 01/12

更多即時熱門文章 >>

‣ 返回看板[ GO ] 棋類

‣ 更多 fallcolor 的文章

文章代碼(AID): #1MuuvwwO (GO)