[討論] AlphaGo走了,圍棋AI界的發展會怎麼樣呢?

看板GO (圍棋)作者 (異質運算)時間8年前 (2017/05/29 06:12), 8年前編輯推噓21(22156)
留言79則, 15人參與, 最新討論串1/1
AlphaGo即將離開圍棋界(可能也不會再研發下去), 那其他AI接下來呢? 絕藝 騰訊的圍棋AI,世界第二棋手以及第二圍棋AI, 實力大概在AlphaGoV18版本(李世石版本), 投入的規模資金龐大,並且應該還會再陪人類玩一段時間, 不過依照公司目標可能深度學習練功練到AlphaGoV25時(可能約一年), 就跟Deepmind一樣停止開發了。 Zen 可能將會是陪伴人類最久的圍棋AI,世界第三圍棋AI, 但是慢棋可能不是人類世界冠軍的對手XD 目前實力約在AlphaGoV13~V18之間, 開發環境是E5*2+TitanX*4, 考量到與AlphaGo的硬體差距, 可能要接近10年才能開發到跟AlphaGoV25的程度。 題外話,Zen7不知道什麼時候會出, 感覺如果今年不出的話,大概有一段時間都不會商業化了。 CGI、Aya以及神算子等私人開發軟體 從cgos等其他側面消息來源, 大概是比AlphaGo V13強一點,但是大概也不會強多少。 Rn Leela Hira 免費圍棋AI,實力大概是比V13弱一些, 不過聽到消息說reinforcement learning因為受限於硬體的關係, 效果都很差,官子也都奇爛無比, 可能實力的天花板很快就到了。 圍棋AI是個需要大量投入經費的專案, 有能力的大公司(如騰訊)可能練完功就走了, 稍微有一點資源又有名氣的大概就是Zen了,但是跟他同等級的卻一個也找不到, 對岸聽說有許多圍棋AI,不過卻也都沒有出來打廣告下棋(除了清華神算子), 不經讓人懷疑是否業界對研發圍棋AI興趣缺缺, 才會造成目前雷聲大雨點小的狀況。 如果目前投入的只有檯面上的這些圍棋AI, 那非常有可能我們現在看到的AlphaGo的自戰譜的實力, 將要是十年二十年後才能達到同樣的水準, 也就是哪天AlphaGoV25終於來到我們的個人電腦時, 也許已經是十年二十年後的事情了? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.163.112 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1496009546.A.B57.html

05/29 06:21, , 1F
用的硬體與PC不一樣,等PC用了TPU才有可能
05/29 06:21, 1F
TPU只是深度學習比GPU強很多而已,而且面向的是企業應用, PC應該是沒有機會使用TPU,短期內應該還是以GPU為主。

05/29 06:51, , 2F
馬雲說對了,技術超出人類太多就失去競賽的可看性,也同
05/29 06:51, 2F

05/29 06:51, , 3F
時把自己的市場做窄了,當技術達到阿法狗境界,就意味著
05/29 06:51, 3F

05/29 06:51, , 4F
從這塊市場畢業
05/29 06:51, 4F

05/29 06:54, , 5F
如果想在圍棋軟體市場繼續深耕幾十年,就不會設計第二個
05/29 06:54, 5F

05/29 06:54, , 6F
阿法狗
05/29 06:54, 6F

05/29 07:04, , 7F
除非圍棋這塊已經過度競爭,或者人類棋力又超出阿法狗一
05/29 07:04, 7F

05/29 07:04, , 8F
截,大概也要20年以上
05/29 07:04, 8F
確實做的太強會失去市場, 不過棋迷還是會想要看到兩個AlphaGo水準的AI的對決QQ 另外人類棋力不可能在20年超過AlphaGo, 因為根本沒有AlphaGo等級的AI在旁邊陪人類驗證觀念的話, 是不可能理解甚至超越的。 ※ 編輯: HeterCompute (118.169.163.112), 05/29/2017 07:09:31

05/29 08:00, , 9F
AlphaGo停止開發不等於停止訓練啊,照我理解,現在
05/29 08:00, 9F

05/29 08:01, , 10F
AlphaGO可以自己迭代更新,這個方法自動解決了之前計
05/29 08:01, 10F

05/29 08:02, , 11F
算上的bug,也沒遇到過度擬合問題,在遇到問題前開發
05/29 08:02, 11F

05/29 08:03, , 12F
新演算法完全沒意義。
05/29 08:03, 12F

05/29 09:23, , 13F
純噓馬雲,這傢伙只不過是想黑騰訊和絕藝而已啊!完全
05/29 09:23, 13F

05/29 09:23, , 14F
商業味的發言你跟他認真?
05/29 09:23, 14F

05/29 10:23, , 15F
演算法的世界不要輕易推斷有10年落差 有時一個漂亮的演
05/29 10:23, 15F

05/29 10:23, , 16F
進就瞬間速度暴漲N倍 只是卡住時成長也很慘就是了
05/29 10:23, 16F

05/29 10:26, , 17F
不用跟alphago一樣強啦。只要比人稍強,就可以拉著人類
05/29 10:26, 17F

05/29 10:26, , 18F
探索新世界,這也是deepmind所說的“工具”用途,多探索
05/29 10:26, 18F

05/29 10:26, , 19F
一步算一步。反而強如alphago的棋,一般棋迷確實欣賞不
05/29 10:26, 19F

05/29 10:26, , 20F
來,最多也就是說說哇塞、等級分4500嘴一下,然後就沒有
05/29 10:26, 20F

05/29 10:26, , 21F
然後了
05/29 10:26, 21F

05/29 10:39, , 22F
看看其他棋界就知道了、宿命差不多就那樣
05/29 10:39, 22F

05/29 11:25, , 23F
圍棋商業利益太小了 其他很多領域商業價值大的多 練完功就跑
05/29 11:25, 23F

05/29 11:26, , 24F
完全可以理解 等未來AI發展到很成熟 給一般人玩的基本AI模組
05/29 11:26, 24F

05/29 11:28, , 25F
都很強或成本很低的時候 有興趣的人或圍棋界自然會拿來用繼續
05/29 11:28, 25F

05/29 11:28, , 26F
追尋神之一手的境界
05/29 11:28, 26F

05/29 11:37, , 27F
靠抄襲的為本業的公司當然瞧不起創新
05/29 11:37, 27F

05/29 11:48, , 28F
我想問其他其他棋類的玩家,裝一個屌虐人類的超強AI在個
05/29 11:48, 28F

05/29 11:48, , 29F
人電腦的感覺如何?有滿滿的幸福感嗎?
05/29 11:48, 29F

05/29 12:09, , 30F
象棋的確是靠電腦訓練啊
05/29 12:09, 30F

05/29 12:09, , 31F
絕藝準備推出手機版本,和Crazy Stone一較高下
05/29 12:09, 31F

05/29 15:39, , 32F
比人稍強的定義是什麼?比世界第一名的棋力二勝一負,讓
05/29 15:39, 32F

05/29 15:39, , 33F
人類有輸有贏的感覺嗎?
05/29 15:39, 33F

05/29 15:45, , 34F
那阿法狗跟李世石比賽的強度,就剛好達到比人類強一點點
05/29 15:45, 34F

05/29 15:45, , 35F
的最佳均衡
05/29 15:45, 35F

05/29 18:19, , 36F
其他棋界AI也是一直有在進步啊,AI就是方便檢討不用找老師
05/29 18:19, 36F

05/29 18:23, , 37F
老師實力越強當然越好,可以走出更多的變化
05/29 18:23, 37F

05/29 22:50, , 38F
比v18 強一點比較好, 但是不用到v25 那麼難學 因為沒講解
05/29 22:50, 38F

05/29 23:36, , 39F
記得V18那個bug似乎也只是學習得盤數還不夠多
05/29 23:36, 39F

05/29 23:37, , 40F
往後幾代說不定只是優化學習過程, V25需要資源只要V18的10%
05/29 23:37, 40F

05/29 23:46, , 41F
另外這也牽扯到圍棋特化AI的目的, 要不要特意留洞給人類打
05/29 23:46, 41F

05/29 23:47, , 42F
還是盡量強化, 用讓子的方式調整所謂的"難度" ?
05/29 23:47, 42F

05/30 00:05, , 43F
馬雲的話 看看就好~市場不夠大當然部會無限度研發下去
05/30 00:05, 43F

05/30 00:06, , 44F
如果今天全球有10億人在下圍棋 早就繼續投入資源了
05/30 00:06, 44F

05/30 00:06, , 45F
跟技術超越人類太多根本無關
05/30 00:06, 45F

05/30 02:32, , 46F
全世界下西洋棋5億,圍棋人口應該沒破億吧
05/30 02:32, 46F

05/30 02:37, , 47F
日本圍棋人口從1000萬衰退到250萬,臺灣大概150萬,全世
05/30 02:37, 47F

05/30 02:37, , 48F
界圍棋人口加總有5千萬就很不錯了
05/30 02:37, 48F

05/30 15:33, , 49F
裝將棋軟體如elmo之類的在電腦裡不會有幸福感,因為太
05/30 15:33, 49F

05/30 15:33, , 50F
絕望,玩到後來還是用激指去選和自己實力相近等級好玩
05/30 15:33, 50F
我就是希望絕望一點才能練棋啊@@ 就是要夠強,他的思路才有參考價值啊! ※ 編輯: HeterCompute (118.169.163.112), 05/30/2017 17:50:28

05/30 20:24, , 51F
拿來跑檢討很有用,但不是很讓人想和它下 XD
05/30 20:24, 51F

06/01 17:02, , 52F
錯了,差距太大的話更沒有參考價值,他每一手你連後續應對
06/01 17:02, 52F

06/01 17:02, , 53F
都想不出來,根本無從學習
06/01 17:02, 53F
裝在自己電腦裡面,我不會哪一手就叫他下一下我不就學會了嗎? ※ 編輯: HeterCompute (118.169.163.112), 06/02/2017 03:04:49

06/03 07:43, , 54F
那你得把中盤攻殺後續無數種變化全背下來才叫學會
06/03 07:43, 54F

06/03 07:45, , 55F
而且全局只要有一些不同AlphaGo下法就又可能不一樣,你要
06/03 07:45, 55F

06/03 07:45, , 56F
連所有不同全局配置的不同應對都記下來
06/03 07:45, 56F

06/03 07:47, , 57F
不然你也只是學會某個特定盤面的一手,先不講後續應對,一
06/03 07:47, 57F

06/03 07:47, , 58F
輩子能不能再下到同一個完全相同的中盤盤面都是疑問XD
06/03 07:47, 58F

06/03 07:49, , 59F
如果還以為AlphaGo的中盤判斷還像是定石手筋一樣記一下就
06/03 07:49, 59F

06/03 07:49, , 60F
叫學會那可真是大錯特錯
06/03 07:49, 60F

06/03 07:55, , 61F
特別是如果AlphaGo下出他最愛的手拔,那你根本不能在全局
06/03 07:55, 61F

06/03 07:55, , 62F
配置不同的情況直接應用
06/03 07:55, 62F
手拔先暫且不提,攻殺我就把我認為正確的下給他看,看他怎麼應, 看看他應完我不好的點在哪裡, 我們就能看懂alphago的意圖了, 他這一手究竟是想要什麼跟好在哪裡, 但是現在我們是連我下在另外一個位置alphago會下哪我們一點也猜不出來, 只看的到alphago自認為的最佳解, 所以才困惑。

06/04 03:30, , 63F
可以看一下 #1PA_kQ1H 這篇我的推文,基於那篇的理由,我
06/04 03:30, 63F

06/04 03:30, , 64F
不認為你是可以因為AlphaGo的應手而去逆推前一手你的著手
06/04 03:30, 64F

06/04 03:31, , 65F
到底好或不好,沒有同樣計算為背景來分析的話你只會得到不
06/04 03:31, 65F

06/04 03:31, , 66F
完全正確的結論
06/04 03:31, 66F

06/04 03:32, , 67F
他一手拔你就以為不好,但其實可能他只是幾個差不多好的選
06/04 03:32, 67F

06/04 03:32, , 68F
點隨機選到了手拔那個,而你那手其實差不多好,你就誤解了
06/04 03:32, 68F

06/04 03:34, , 69F
或者他轉換、棄子都有後續利用,是全局總和有利,你卻以為
06/04 03:34, 69F

06/04 03:35, , 70F
就是他下的地方比不下的地方大,又是誤解了
06/04 03:35, 70F

06/04 03:36, , 71F
事實上卻是你如果沒學到他全套局勢判斷與利用,直接以為就
06/04 03:36, 71F

06/04 03:37, , 72F
是單純比大小,結果反而虧損
06/04 03:37, 72F
如果是家用版的,都會提供勝率吧, 如果他手拔,然後另外一手跟這一手勝率誤差不到1%, 我就知道那只是兩手差不多好。 當然我承認你說的狀況存在, 例如我現在跟rn下的時候, 明明我覺得我局部賺了, 結果rn也說他自己的勝率提高了。 由於rn的實力也就跟我差不多, 要是讓我可以悔棋,我肯定可以贏他, 這種狀況我就不知道到底是我形式判斷錯誤還是他的大局判斷比我好, 所以我才希望能夠有強一點等級的單機版。 ※ 編輯: HeterCompute (118.169.171.199), 06/04/2017 17:50:36

06/04 20:07, , 73F
其實我的重點在於知道你這手的判斷好壞,並不等於「學會」
06/04 20:07, 73F

06/04 20:07, , 74F
我覺得你把「學會」這兩個字定義得太寬鬆了
06/04 20:07, 74F

06/04 20:09, , 75F
以AlphaGo的大局觀下法而言,看看一手勝率判斷很簡單,可
06/04 20:09, 75F

06/04 20:10, , 76F
是要真正學會這一手,你要後續幾十手的所有不同應對都會
06/04 20:10, 76F

06/04 20:12, , 77F
如果只是人類的對局,你可能學會一下局部應對或兩處大小的
06/04 20:12, 77F

06/04 20:15, , 78F
判斷勉強算得上是有學到一些了,但AlphaGo的下法沒辦法只
06/04 20:15, 78F

06/04 20:16, , 79F
分解成局部判斷來「學會」
06/04 20:16, 79F
我不覺得有你說的這麼玄XD 不過還是要實際跟alphago下過才知道究竟可不可學, 至少我已經在某些局部上從rn學習到很多新想法了XD ※ 編輯: HeterCompute (118.169.171.199), 06/04/2017 21:45:46
文章代碼(AID): #1PAqjAjN (GO)
文章代碼(AID): #1PAqjAjN (GO)