Re: [心得] 電腦圍棋的小常識

看板GO (圍棋)作者 (低語森林悄悄寧靜)時間10年前 (2016/02/01 17:43), 編輯推噓23(23090)
留言113則, 3人參與, 最新討論串3/3 (看更多)
推 staristic: 我猜應該秒殺,這些名局應該是第一批餵AI的食物 02/01 11:57 → staristic: 就算不是第一批,應該也是餵過。如果答不出來…… 02/01 11:57 很難阿 之前做題目都會遇到 題目太大電腦跑不動的狀況 就算是付費的熊貓老師也一樣 哈哈 推 kafai: 餵過跟TRAIN起來是兩回事,偶發的鬼手可能當NOISE進不去 02/01 13:07 推 coldmilk: 我不行啦,身體太多毛病,已經不寫圍棋程式了。還有Cold 02/01 13:16 → coldmilk: milk根本比不上Zen,倒是交大吳毅成老師的團隊開發的CGI 02/01 13:16 → coldmilk: 最近棋力突飛猛進,我看很有可能已經有KGS 6D水準了 02/01 13:16 喔喔 這訊息就沒跟上 那這次如果有去溫哥華的話 再來學學 推 aaaba: 這個問題太有趣了。因為機器學習講究的是學到普遍性的原則 02/01 13:19 → aaaba: ,而非記憶各種特殊解,所以這個問題就得看這些鬼手發生當 02/01 13:19 → aaaba: 時的盤面會不會透過類神經網路映射到一個容易發現鬼手的特 02/01 13:19 → aaaba: 殊空間(而不是人類直觀看到的361維空間)。如果可以,表示Al 02/01 13:19 → aaaba: phaGo的普遍性原則萃取得非常之好,很神。 02/01 13:19 → nanlong: 有時鬼手妙手是因非理性或失衡造成某種局面而爆發出來的. 02/01 14:02 → nanlong: 人比較會這樣..電腦很理性我就不知會不會這樣會爆。 02/01 14:03 → nanlong: 有時雙方無錯著還挺無聊的-看起伏落差大的對局有趣點。 02/01 14:05 我以為圍棋的美麗就是這些層出不窮的鬼手跟妙手阿 這不也是實力展現的一部分 另外藤澤跟加藤的對局 如果那一手是唯一解 那理論上電腦就該跑得出來這位置 這也是個很好的測試阿 http://imgur.com/FljPwS6
不然遇到這個狀態下的李世石要贏還真是很辛苦.... 白68右下角托 大部分的人跟電腦應該都會覺得這只能跟著應... 手拔中央尖一個實在太強 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.41.35 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1454319812.A.6BE.html

02/04 12:22, , 1F
Deep Learning 不可能學到鬼手 鬼手只能靠硬爆 也就是暴力
02/04 12:22, 1F

02/04 12:23, , 2F
窮舉破解法 等電腦速度能算到五十步以後鬼手就會出來了
02/04 12:23, 2F

02/04 12:25, , 3F
現在AlphaGo的演算法就是跟人一樣是靠學習的 不要把它想的
02/04 12:25, 3F

02/04 12:26, , 4F
那麼厲害 還有我不太懂什麼叫做唯一解@@ 下圍棋還有唯一
02/04 12:26, 4F

02/04 12:27, , 5F
解的話除了局部攻殺 我不覺得有人可以證出來
02/04 12:27, 5F

02/04 12:30, , 6F
我覺得現階段AlphaGo不可能靠佈局贏人類 只能靠人類的失誤
02/04 12:30, 6F

02/04 12:30, , 7F
但人是很容易算不清打勺的
02/04 12:30, 7F

02/04 12:39, , 8F
有一點我是覺得值得討論 當AI贏了人類後 圍棋的普及是會進
02/04 12:39, 8F

02/04 12:41, , 9F
步還是退步呢?我自己感覺是會退步 因為他的魅力對沒有接
02/04 12:41, 9F

02/04 12:42, , 10F
觸過圍棋的人來講是減少很多的 不知道國際象棋在1997年以
02/04 12:42, 10F

02/04 12:42, , 11F
後普及的程度有提高嗎?還是越來越少人下了?
02/04 12:42, 11F

02/04 12:43, , 12F
“不可能找出鬼手”,是一句不能證明的論述。人感知的鬼手
02/04 12:43, 12F

02/04 12:43, , 13F
隱蔽程度高段與低段就有所不同,何況是不同參數學出的各種c
02/04 12:43, 13F

02/04 12:43, , 14F
nn
02/04 12:43, 14F

02/04 12:48, , 15F
如果如果某些鬼手在AlphaGo認為下一手可能位置的機率值的前
02/04 12:48, 15F

02/04 12:48, , 16F
二十名,算是學到了嗎?
02/04 12:48, 16F

02/04 13:03, , 17F
如果機率是前20 然後最後應法都正確的話 就算找出鬼手沒錯
02/04 13:03, 17F

02/04 21:32, , 18F
就這些完全資訊公開的棋類遊戲來說,最佳解都是被證明存在
02/04 21:32, 18F

02/04 21:33, , 19F
的啊,當然最佳解可能不是唯一的
02/04 21:33, 19F

02/04 21:34, , 20F
至於鬼手只能靠暴力法找這個論述你講得有點果斷,我不同意
02/04 21:34, 20F

02/05 06:00, , 21F
我說的鬼手只能靠暴力解是以目前的演算法作為基礎的
02/05 06:00, 21F

02/05 06:02, , 22F
以目前發展的演算法 鬼手要出來的話必須靠暴力搜索來
02/05 06:02, 22F

02/05 06:03, , 23F
"找到" (並不是學到) 當然科技進步那麼快 說不定兩年後新
02/05 06:03, 23F

02/05 06:04, , 24F
的演算法發表出來也是有可能的
02/05 06:04, 24F

02/05 06:10, , 25F
我是覺得以目前這個演算法就有機會打敗人類頂尖了 Google
02/05 06:10, 25F

02/05 06:11, , 26F
並沒有想要把圍棋AI變成神 等到目前這個AI的棋力比頂尖棋
02/05 06:11, 26F

02/05 06:12, , 27F
手強一子後這個象徵性的研究項目大概也會結束 接下來會研
02/05 06:12, 27F

02/05 06:13, , 28F
究的可能就只剩對圍棋有興趣的 要組織二三十人有AI知識的
02/05 06:13, 28F

02/05 06:14, , 29F
研究者是不太可能的
02/05 06:14, 29F

02/05 07:46, , 30F
我認為人和機器行棋中目的都是在於“有效率的搜尋到較佳的
02/05 07:46, 30F

02/05 07:46, , 31F
一手棋”。至於你所謂“學到”和“找到”到底區隔在哪?我
02/05 07:46, 31F

02/05 07:46, , 32F
不是把AI當神,而是認為不必把人的“學習”當成神聖的詞彙
02/05 07:46, 32F

02/05 07:46, , 33F
,套在機器上面好像就有種抗拒感。
02/05 07:46, 33F

02/05 10:19, , 34F
我非常同意你所說的"有效率搜索到最佳的一手棋"因為這以目
02/05 10:19, 34F

02/05 10:20, , 35F
前的狀況下(例如機器資源配置 秒數設定) 所能得到的最佳手
02/05 10:20, 35F

02/05 10:22, , 36F
鬼手有點像是唯一一手 神之一手這樣 想要強調的是AI沒有
02/05 10:22, 36F

02/05 10:24, , 37F
那麼強 不要把那麼神聖的任務放在他身上
02/05 10:24, 37F

02/05 10:25, , 38F
AI沒辦法達到唯一的一手是很正常的 也不要因為這樣就覺得
02/05 10:25, 38F

02/05 10:27, , 39F
人類最終還是比較有創造性啊什麼的 然後去排斥AI
02/05 10:27, 39F
還有 34 則推文
02/06 14:46, , 74F
容易辦得到 尤其是以機器學習這種方法來實現
02/06 14:46, 74F

02/06 14:49, , 75F
至於你說人類算得清機器也算得清唯一必勝的下法 我覺得他
02/06 14:49, 75F

02/06 14:51, , 76F
用的算法一定是brute force 圍棋跟棋類相比 就是以目前的
02/06 14:51, 76F

02/06 14:53, , 77F
圍棋跟其他棋類相比 就是以目前的硬體效能 還不能用暴力法
02/06 14:53, 77F

02/06 14:54, , 78F
不能說國際象棋可以找出唯一解 圍棋就可以 又如果人類都算
02/06 14:54, 78F

02/06 14:56, , 79F
不清 你又如何評斷電腦算得清呢?(暴力解法除外) 所以我認
02/06 14:56, 79F

02/06 14:57, , 80F
為這是假議題.
02/06 14:57, 80F

02/06 15:00, , 81F
電腦贏人類 應該是不需要鬼手就可以贏了(最多三年吧@@)
02/06 15:00, 81F

02/06 15:52, , 82F
你的brute force到底是多brute?難道涉及到樹的搜尋都被你
02/06 15:52, 82F

02/06 15:52, , 83F
歸類為brute force?那人找出鬼手時如果用上一手手排除的尋
02/06 15:52, 83F

02/06 15:52, , 84F
找,也要被你認為是brute force?好吧!那你對了,deep lea
02/06 15:52, 84F

02/06 15:52, , 85F
rning 的確不是用來取代搜尋而是輔助搜尋,不用樹的搜尋而
02/06 15:52, 85F

02/06 15:52, , 86F
解類似賽局概念的問題我還沒想過有這種可能性,無論是人或
02/06 15:52, 86F

02/06 15:52, , 87F
機器。
02/06 15:52, 87F

02/07 00:25, , 88F
你說的學不到鬼手其實是建立在一個前提上,就是不能為了學
02/07 00:25, 88F

02/07 00:26, , 89F
鬼手而多學垃圾手拖累棋力。這叫是不為也,非不能也。
02/07 00:26, 89F

02/07 00:27, , 90F
然後我還是要說你沒有搞清楚你講出「AI沒辦法達到唯一的一
02/07 00:27, 90F

02/07 00:28, , 91F
手是很正常的」這句話到底有多不嚴謹XD
02/07 00:28, 91F

02/07 00:30, , 92F
我並沒有否定「現在的AI,很難在圍棋上得到絕對最佳解」,
02/07 00:30, 92F

02/07 00:33, , 93F
當人類跟AI都算不清時,你講那句話根本沒有論證任何高下的
02/07 00:33, 93F

02/07 00:33, , 94F
效果,特別是你句子還沒有指定圍棋XD
02/07 00:33, 94F

02/07 00:34, , 95F
然後鬼手也跟最佳著手一點關係也沒有,反而跟人類的思考比
02/07 00:34, 95F

02/07 00:36, , 96F
較有關,鬼手並不一定要是最佳著手,只要對人類來說是出乎
02/07 00:36, 96F

02/07 00:39, , 97F
意料,導致後續取得利益就可稱之,而要學到這種著手只要調
02/07 00:39, 97F

02/07 00:40, , 98F
整評估方式就有機會將之納入,只不過會同時也學到很多垃圾
02/07 00:40, 98F

02/07 00:40, , 99F
手而已,並非學不到。
02/07 00:40, 99F

02/07 00:43, , 100F
鬼手被算清後,它就可能會變成標準的妙著或其實是應對得當
02/07 00:43, 100F

02/07 00:44, , 101F
就沒那麼好的下法,而相對於人類使用大量研究來證實這些東
02/07 00:44, 101F

02/07 00:45, , 102F
西,AI也可以利用大量帶隨機性的模擬對局來進行「研究」,
02/07 00:45, 102F

02/07 00:45, , 103F
這其中唯一的問題就在於鬼手的稀少有可能導致AI一開始就沒
02/07 00:45, 103F

02/07 00:46, , 104F
有打算把它列入需要花運算資源去驗證的範圍內。因此,只要
02/07 00:46, 104F

02/07 00:48, , 105F
這邊做些設計,讓鬼手有可能進入被模擬對局驗證的範圍即可
02/07 00:48, 105F

02/07 00:49, , 106F
。當然如上面一直強調的,危險性就在可能讓很多垃圾下法也
02/07 00:49, 106F

02/07 00:50, , 107F
進去搶奪運算資源,甚至劣幣驅逐良幣,這跟灌進大量低棋棋
02/07 00:50, 107F

02/07 00:51, , 108F
譜結果越學越差是某程度上相似的狀況。
02/07 00:51, 108F

02/07 00:56, , 109F
賽局理論的話,事實上解賽局理論更需要窮舉,因為需要得到
02/07 00:56, 109F

02/07 00:57, , 110F
完整的pay-off table......XD
02/07 00:57, 110F

02/07 01:01, , 111F
而且事實上賽局理論的分析在某些情況還是會使用樹狀展開處
02/07 01:01, 111F

02/07 01:05, , 112F
理的,不管用樹狀或矩陣式,目標都是窮舉所有選擇對雙方的
02/07 01:05, 112F

02/07 01:05, , 113F
價值
02/07 01:05, 113F
文章代碼(AID): #1MhoZ4Q- (GO)
文章代碼(AID): #1MhoZ4Q- (GO)