Re: [討論] 電腦弱點:中腹有打劫可能的複雜生死戰?

看板GO (圍棋)作者 (可以吃嗎?)時間9年前 (2016/03/14 17:25), 編輯推噓36(36097)
留言133則, 25人參與, 最新討論串2/3 (看更多)
※ 引述《Vonix (台灣大賭場歡迎您)》之銘言: : 我嘗試用一句話來講ALphaGo的弱點 : 昨天AlphaGo第一次暴露出弱點,不知道是不是李世石有意為之? : 李世石在左右方都避開了戰鬥,卻在大局不利時才在中央掀起戰鬥, : 從盤後解析可以看出,白78神手挽回了局面,但若黑棋應對得宜, : 局面其實還是細微;但卻造成電腦崩潰自爆。 : 從機器的角度來理解,中腹戰鬥比邊角更複雜難算,且昨天的例子有 : 可能形成大劫爭(但打下去黑棋整體也沒有不利),電腦在這種CASE : 爆掉,不知道第五盤李世石會不會再度製造這種局面? 我覺得人一開始誤會了電腦的強處與弱處,也許是小李前幾盤一直無法突破的關 鍵。 多數人覺得電腦布局或大局觀應該很弱,因為變化太多,但這可能反而才是電腦 的強處。人類學布局的棋書通常是給幾個選項讓人去分辨哪個點更大,但這其實 很難估計的,很多解只是方向配合或"感覺上"較佳,是否如此難以驗證。但電腦 是用海量的模擬資料的勝率來決定落點,假設電腦是九段實力。他自我對弈了那 麼多盤,如此選出的著點更準確是頗有可能的。 所以這幾盤看得出電腦對厚勢的利用或是對弱棋的處理下得非常好。當然電腦應 該不知道厚勢是甚麼,但他用海量的模擬下去就會發現某些著點因為能和厚勢搭 配自然勝率高。而電腦也會適時補弱棋,因為模擬後應該會發現不補會讓勝率下 降。 而電腦真的不及人類的可能反而在於攻殺,而且是要較大範圍延伸且手順較複雜 的攻殺(範圍太小電腦的模擬應該可以把所有情況都跑完)。一開始多數人都假設 電腦對於攻殺的細算應該不可能出錯,因為可以暴力窮舉法,但正因為AG不是用 窮舉法,反而高段棋士對於區域的細算會更接近窮舉法,也就是更接近圍棋上帝 ,所以可以占優。 人在算攻殺的時候靠經驗可以把可能落子侷限在非常少數的著點,並且細算其中 所有變化。而且變化中可能部分手順是固定的,對人來說又把問題變簡單很多。 但對電腦來說其他各種不相干的點他都要考慮,人類所謂的必然解對他來說也不 是必然(像小李昨天說只此一手,AG字典裡絕對沒有只此一手這種事),自然有機 會選錯點或誤判情勢。第二盤的左下處理或昨天中間被手筋一挖就當機都是這種 較大範圍的攻殺。 前幾盤看得出來電腦是能走厚就走厚,能補棋就補棋,沒甚麼機會讓小李搞出複 雜攻殺,到昨天才第一次出現。 電腦好似還有一個問題就是落後時下出的各種大虧損無理手。當然可以理解電腦 的邏輯就是:這樣下你不應我就贏了所以勝率很高,但這對人類是沒用的。相對 於之前有人假設電腦落後會變更強因為要追回來,目前看起來反而是電腦落後就 走遠了,因為它的追棋方式對人類來說是毫無意義的只會讓自己越虧越多勝機越 渺茫。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.51.208 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457947536.A.234.html

03/14 17:32, , 1F
這論點很有道理
03/14 17:32, 1F

03/14 17:35, , 2F
還有一個可以利用的明顯弱點, 就是棋手跳出一般作戰區域
03/14 17:35, 2F

03/14 17:35, , 3F
時, 可能造成 MCTS 前面計算的結果全部作廢 要重新計算
03/14 17:35, 3F

03/14 17:38, , 4F
alphaGo下一手的候選機率也不是集中在局部區域
03/14 17:38, 4F

03/14 17:38, , 5F
所以有先手的時候可以選擇適時換邊攻擊, 佔電腦的便宜
03/14 17:38, 5F

03/14 17:38, , 6F
通常都是 至少排在後面的棋步 算的深度就不會一樣
03/14 17:38, 6F

03/14 17:39, , 7F
尤其是中盤之前 因為選擇性太多 平常不可能都算的很深
03/14 17:39, 7F

03/14 17:40, , 8F
毫無意義會自殺的棋要用機制擋住
03/14 17:40, 8F

03/14 17:41, , 9F
樓上還是沒搞懂啊... 這種違背開發原意的事情不可能做的
03/14 17:41, 9F

03/14 17:42, , 10F
最多再設計一些訓練方式想辦法教會它...
03/14 17:42, 10F

03/14 17:42, , 11F
這是安全機制 加進去有什麼問題嗎
03/14 17:42, 11F

03/14 17:42, , 12F
其它開發者也注意到它完全不理會局部死活和對殺分析
03/14 17:42, 12F

03/14 17:42, , 13F
這樣就不是他自己學會了…
03/14 17:42, 13F

03/14 17:43, , 14F
因為不是要製作圍棋軟體, 而是想辦法教會這套系統下圍棋
03/14 17:43, 14F

03/14 17:43, , 15F
推這篇 某人的發言真的可以不用理會 夏蟲語冰
03/14 17:43, 15F

03/14 17:43, , 16F
不然征子就要跑嗎
03/14 17:43, 16F

03/14 17:43, , 17F
這軟體下圍棋只是順便
03/14 17:43, 17F

03/14 17:44, , 18F
過程中發現問題設法改良, 將來都可能直接用在其它領域
03/14 17:44, 18F

03/14 17:45, , 19F
如果只是下棋的話, 哪會有這麼多大公司相繼投錢進來研究
03/14 17:45, 19F

03/14 17:48, , 20F
其實安全機制也沒說錯,今天會發生勝率狂跌就相當於發
03/14 17:48, 20F

03/14 17:49, , 21F
除了最後的應手部分推論怪怪的,基本上蠻合理的。
03/14 17:49, 21F

03/14 17:49, , 22F
生超出原先AI預期的情況,就圍棋來看AI的處理還有很大
03/14 17:49, 22F

03/14 17:49, , 23F
AG有發現勝率狂跌啊, 只是已經來不及了
03/14 17:49, 23F

03/14 17:50, , 24F
的進步空間,就像電動車總不能突然有個突發事件,車子
03/14 17:50, 24F

03/14 17:50, , 25F
本來就要考慮安全機制好嗎 一個沒有安全機制的系統是能
03/14 17:50, 25F

03/14 17:50, , 26F
商業化?
03/14 17:50, 26F

03/14 17:50, , 27F
突然加速去撞牆壁吧
03/14 17:50, 27F

03/14 17:51, , 28F
要注意設安全機制也是會把好棋下爛
03/14 17:51, 28F

03/14 17:51, , 29F
問題是現在沒有要商業化啊, 現在單純只想看ML的效果而已
03/14 17:51, 29F

03/14 17:52, , 30F
這不是雖便說說就能做到
03/14 17:52, 30F

03/14 17:52, , 31F
AlphaGo從一開始就沒有要商業化,那只是研究人工智慧中
03/14 17:52, 31F

03/14 17:52, , 32F
現在還研發階段 加上這種安全機制反而就看不出問題了
03/14 17:52, 32F

03/14 17:52, , 33F
既然要談 這個原來不用加安全機制 那谷哥的自動車你可以
03/14 17:52, 33F

03/14 17:52, , 34F
去做了
03/14 17:52, 34F

03/14 17:52, , 35F
限之一的「圍棋」罷了。
03/14 17:52, 35F

03/14 17:53, , 36F
發現問題直接想辦法掩蓋掉不算是什麼好方法吧 /_\
03/14 17:53, 36F

03/14 17:53, , 37F
google的無人車是已經有在做了啊,只是還沒量產商業化
03/14 17:53, 37F

03/14 17:53, , 38F
你要設定好的安全機制 前題你實力要有李世石水準才行
03/14 17:53, 38F

03/14 17:53, , 39F
直接找到問題的根源並且想辦法改進才是上策
03/14 17:53, 39F
還有 54 則推文
03/14 18:13, , 94F
不知能不能應用在圍棋上
03/14 18:13, 94F

03/14 18:14, , 95F
只要偷到一個重要的棋 局勢就會崩盤
03/14 18:14, 95F

03/14 18:14, , 96F
SL網路確保走子有多樣性, 後面再改用RL走到完提高精確度
03/14 18:14, 96F

03/14 18:15, , 97F
只是第三盤的劫殺 李40看樣子是輸了
03/14 18:15, 97F

03/14 18:16, , 98F
不過也是因為時間不夠
03/14 18:16, 98F

03/14 18:16, , 99F
這種作法是不是夠好目前沒人知道 所以才需要測試工程師
03/14 18:16, 99F

03/14 18:16, , 100F
有點機率用偷的方式
03/14 18:16, 100F

03/14 18:23, , 101F
覺得可以加入危機意識網路,當有危機時啟動深入分析
03/14 18:23, 101F

03/14 18:28, , 102F
圍棋真的是一個很好的測試AI水平之競技
03/14 18:28, 102F

03/14 18:42, , 103F
實戰測試的前提是要拐到一流的棋手陪你玩啊 lol
03/14 18:42, 103F

03/14 18:54, , 104F
如果看到職業看到97 101應該是不會來下的
03/14 18:54, 104F

03/14 18:55, , 105F
職業棋士如果看了覺得很弱很簡單, 真的上去會死的很難看
03/14 18:55, 105F

03/14 18:55, , 106F
不過第四盤可以確定 谷哥測到他想要的一些額外的事
03/14 18:55, 106F

03/14 18:57, , 107F
對照當時局面那一連串參數變化, 對未來改進方向很有價值
03/14 18:57, 107F

03/14 19:00, , 108F
不過蠻好奇AJA沒有測過讓AG在極劣下下過棋嗎?還是說不是每
03/14 19:00, 108F

03/14 19:01, , 109F
一種劣勢AG都會發瘋? 或是97手時李世石贏的其實比想像還多
03/14 19:01, 109F

03/14 19:18, , 110F
這樣想用雪崩類複雜定石也可能可以婊到電腦
03/14 19:18, 110F

03/14 19:20, , 111F
可是如果是定石 AG的走子網路來自職棋不容易錯吧?
03/14 19:20, 111F

03/14 19:26, , 112F
職棋棋譜數量應該不足把複雜定石變化都走完,加上AG又有自
03/14 19:26, 112F

03/14 19:26, , 113F
己神奇的判斷,定石走錯一手崩盤應該有機會:D
03/14 19:26, 113F

03/14 19:30, , 114F
DeepMind老闆說他們沒用職業棋譜 只用業餘棋譜 lol
03/14 19:30, 114F

03/14 19:31, , 115F
SL 網路的目的不是要多準 有個大概也就行了
03/14 19:31, 115F

03/14 19:32, , 116F
這很合理啊 因為開發者有人只到業餘高段
03/14 19:32, 116F

03/14 19:33, , 117F
演算法要設計的好 也要設計者很懂圍棋
03/14 19:33, 117F

03/14 19:49, , 118F
那種無理手都是線上下棋會遇到的賴皮棋,真沒看到是
03/14 19:49, 118F

03/14 19:49, , 119F
會逆轉
03/14 19:49, 119F

03/14 20:10, , 120F
雪崩應該沒機會,看13盤就知道了,大攻殺會變單行道
03/14 20:10, 120F

03/14 20:11, , 121F
24盤穩穩走的比較有機會,因為次一手分布很廣
03/14 20:11, 121F

03/14 20:13, , 122F
我們覺得"單行道"電腦不見得覺得是,加上周遭點夠多混淆它
03/14 20:13, 122F

03/14 20:14, , 123F
或許會有下錯,也是猜測而已 因為定石幾乎都人類窮舉法最
03/14 20:14, 123F

03/14 20:15, , 124F
佳解,電腦既然不懂這個要靠模擬是有機會推不出來的
03/14 20:15, 124F

03/14 20:24, , 125F
所以我覺得雪崩妖刀或開頭大攻殺沒機會,把譜上輸的著
03/14 20:24, 125F

03/14 20:24, , 126F
手濾掉就好,反而是大模樣爆破比較不好運算
03/14 20:24, 126F

03/14 20:25, , 127F
被爆的位置太隨機了
03/14 20:25, 127F

03/14 20:43, , 128F
03/14 20:43, 128F

03/14 22:10, , 129F
蠻合理
03/14 22:10, 129F

03/14 22:14, , 130F
認同
03/14 22:14, 130F

03/14 22:22, , 131F
雪崩alphago好像會主動避開
03/14 22:22, 131F

03/15 02:35, , 132F
樊麾表示
03/15 02:35, 132F

03/15 09:23, , 133F
AG要「學」會安全機制,而不是「教」他安全機制
03/15 09:23, 133F
文章代碼(AID): #1MveEG8q (GO)
文章代碼(AID): #1MveEG8q (GO)