Re: [影片] 張東岳解說李世石獲勝第四盤

看板GO (圍棋)作者 (天堂的定義)時間9年前 (2016/03/14 08:56), 9年前編輯推噓-1(1233)
留言36則, 4人參與, 最新討論串3/3 (看更多)
※ 引述《nanlong (懶龍)》之銘言: : ※ 引述《zkow (逍遙山水憶秋年)》之銘言: : : 圍棋世紀人機大戰李世石 vs AlphaGo 第四盤 : : 張東岳點評:彌足珍貴的一場勝利【圍棋TV】 : : https://www.youtube.com/watch?v=00HP4e8e_iQ
: : 解說詳細,長達二十幾分鐘,可看看 : 看了影片及網路一些高手解說後 : 才知那手還真不是 圍棋 所說的神之一手 : , 因為對手冷靜下來想就有幾種應法都可不吃虧繼續領先 : 甚至直接讓棋局告終。 : 不過實戰結果卻有讓狗狗中風的奇效 算是另一類的 "神之一手" 哈。 : ps: 棋界的神之一手大概是說 讓所有人在事前事 後 : 怎樣想都無法抵抗的勝著妙手吧。 : 有時對手會驚訝到 "含笑九泉" ~~ 有可能這是這一代AlphaGo系統伴隨的不穩定性 請參考 我的文章 #1MvKziMw 這也是為什麼AlphaGo所有的選擇都傾向 簡明 + 高勝率 這在系統工程上不是小問題 問題的解決有可能需要讓AlphaGo加上一個穩定係數/函數 當盤面/系統的不穩定情況大增 計算方式或是記算量需要調整 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.12.82 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457917019.A.F10.html

03/14 09:05, , 1F
等等,你上一篇文章沒有解釋為什麼會傾向簡明+高勝率呀?
03/14 09:05, 1F

03/14 09:32, , 2F
我個人是覺得 AG自身學習的結論, 對含有打劫的分支權重偏低
03/14 09:32, 2F

03/14 09:34, , 3F
有可能是樣本不夠多, 有可能是多重劫的分支很難有效展開
03/14 09:34, 3F

03/14 09:34, , 4F
因此都會採取避免打劫的的方式進行
03/14 09:34, 4F

03/14 09:37, , 5F
不過這樣子會不會反而輕忽對手可以導入打劫的下子?
03/14 09:37, 5F

03/14 09:38, , 6F
純粹討論AI,如果AlphaGo自己覺得打劫很不好,那應該同
03/14 09:38, 6F

03/14 09:39, , 7F
時會輕忽李九段可以導入打劫的棋手,但看了職業講解不像
03/14 09:39, 7F

03/14 09:39, , 8F
很有可能,前三盤要不就是成功避開,要不就是打劫影響不夠大
03/14 09:39, 8F

03/14 09:41, , 9F
因為我聽講解好像是說,李九段本來有機會打劫,但AG規避
03/14 09:41, 9F

03/14 09:42, , 10F
當然像你說的,只有三盤本來我這樣想就很容易有盲點XD
03/14 09:42, 10F

03/14 09:44, , 11F
不太懂你上面兩段說的, 輕忽導入打劫的棋手 vs AG規避
03/14 09:44, 11F

03/14 09:44, , 12F
這兩件事情不一樣嗎? 我的意思是AG對往打劫的分支權重較低
03/14 09:44, 12F

03/14 09:45, , 13F
噢sorry,我是說,單論他們paper內容,搜尋樹對黑白對稱
03/14 09:45, 13F

03/14 09:45, , 14F
所以如果覺得黑主動挑起劫爭是壞棋,那反過來應該也會,
03/14 09:45, 14F

03/14 09:46, , 15F
也就是會樂意製造讓對手有機會產生劫爭的棋步,
03/14 09:46, 15F

03/14 09:47, , 16F
但前三盤轉播的看法好像與此相反,認為AG會規避劫爭
03/14 09:47, 16F

03/14 09:50, , 17F
我猜是自我對弈的中,不管AG執黑或白,打劫分支都會降低勝率
03/14 09:50, 17F

03/14 09:52, , 18F
打劫分支的展開可能會比避劫多出很多,而且勝負難料,算不完
03/14 09:52, 18F

03/14 09:57, , 19F
黑白同時降低勝率這個我自己覺得是演算法的基本錯誤XD
03/14 09:57, 19F

03/14 09:57, , 20F
假設打劫雙方都討不了好,勝率50%,當時避劫AG評估將近80%
03/14 09:57, 20F

03/14 09:57, , 21F
跟棋手不應該下出97一樣比較難相信@@
03/14 09:57, 21F

03/14 09:58, , 22F
那樣的話,就是要贏了不想打劫,要輸了很想打?
03/14 09:58, 22F

03/14 09:58, , 23F
以50%舉例, 就是說對黑方不利, 白方有利
03/14 09:58, 23F

03/14 09:59, , 24F
至於 97 那邊我覺得是另外一個問題
03/14 09:59, 24F

03/14 09:59, , 25F
對不起97舉例可能不太好,譬如說93 :p 只是類比
03/14 09:59, 25F

03/14 09:59, , 26F
之前的棋局裡面, 好像還沒有逼到AG勝率低迷的情況 ?
03/14 09:59, 26F

03/14 10:00, , 27F
嗯嗯,我不反對你的結論XD
03/14 10:00, 27F

03/14 10:07, , 28F
對不起補充一下,你說的對,我主要就是因為這裡是圍棋板
03/14 10:07, 28F

03/14 10:07, , 29F
搞不好AG還有一個"靠北,算不完,我不要打劫"的價值評估
03/14 10:07, 29F

03/14 10:08, , 30F
覺得應該強調『演算法的結論是AI可能在優勢時避免劫爭』
03/14 10:08, 30F

03/14 10:08, , 31F
說不定XD 也許圍棋高手會得到這樣的結論 :p
03/14 10:08, 31F

03/14 10:09, , 32F
但是從演算法的觀點沒有理由特別相信這樣..吧? :D
03/14 10:09, 32F

03/14 10:12, , 33F
看你ID,應該是懂點數學,請解釋在NN這種高度非線性函數裡
03/14 10:12, 33F

03/14 10:12, , 34F
,什麼叫穩定係數。你要說得那麼空泛,乾脆推文就可以了
03/14 10:12, 34F
可以設計類似 the Lyapunov function的東東 或是其他方式(e.g. 做一些pertubation?) (請參考 http://jacobi.math.wvu.edu/~ef/preprints/LyapNeuralNetsLNCSFormatted.pdf )

03/14 10:48, , 35F
學點 deep learning 再來好嗎? 一篇一篇打臉很累
03/14 10:48, 35F
※ 編輯: mathbug (180.177.12.82), 03/14/2016 15:41:48

03/14 17:35, , 36F
抱歉,我看不出alphaGo有回授
03/14 17:35, 36F
我初步的想法是 1. 從AI系統的角度來看 有沒有辦法了解它系統係數/NN係數的穩定性? (容不容易產生bifurcations?) 2. 從棋盤上的理解來看 (e.g. 一般認為中腹複雜於邊角) 當可選的點多分散在中腹時,也許我們就認為風險係數提高(穩定係數降低) AlphaGo應該花更多的精神或是分支計算 ※ 編輯: mathbug (180.177.12.82), 03/14/2016 17:57:10
文章代碼(AID): #1MvWnRyG (GO)
文章代碼(AID): #1MvWnRyG (GO)