[建議] 各AI分析、AlphaGo是300年後的人類

看板GO (圍棋)作者 (AirOctopus)時間9年前 (2017/01/03 11:33), 9年前編輯推噓20(20044)
留言64則, 13人參與, 最新討論串1/1
我要用我的理解來分析AlphaGo強度,主要借助工具是Elo,先看張圖: http://i.imgur.com/ylQTErVl.jpg
AlphaGo V13是3000分、V18是4500分,也就是每代會多300分。 (根據查到的Elo公式,「勝率= 1/(1+10^m) * 100%」,其中「m= 兩選手Elo差/400」, 所以差100勝率為64%、差200為76%、差300為85%,跟AlphaGo每代間80~90%勝率吻合。) 各個AI強度分析: 人類最高等級大概3600,也就是AlphaGo V15,不過AlphaGo自戰導致Elo通貨膨脹, 因此V15大概略弱於人類頂尖,斷定人類頂尖介於V15~V16之間。 而DeepZenGo跟趙治勳比賽版是3000,對網路9D以上勝率超過90%、贏過幾位前段棋手, 也就是V13快棋已有機會勝過前段棋手,如果V13快棋有機會勝過前段棋手, 那V14大概快棋等於、甚至略勝前段棋手。 而絕藝的升級版刑天,快棋對決前段棋手快90%勝率,所以估計實力比V14強、比V15弱, Elo 3400左右。雖然網路快棋對柯潔 5:2 領先,但正式賽對柯潔大概勝率只有24%, 也就是七番棋會2:5或1:6落敗(不過至少能贏柯潔一盤了)。 至於GodMoves或Master,由於沒輸過所以無法估計,不過要做到目前的超強41連勝, 以 AlphaGo V15 3600分的人類頂尖實力,加上快棋優勢即可輕鬆做到。 有人懷疑GodMoves或Master是AlphaGo,我認為很有可能,因為韓國網友都沒消息, 如果真的是韓國AI,韓國那邊應該多少會有風聲,至少謠傳比如誰做的之類。 (當然可能是因為沒人看得懂韓文,所以才沒人知道韓國當地的傳言。) 外加柯潔對AlPhaGo以幾成定局,從2016的直播來看,中國棋手會強烈要求先下測試棋, 因此不排除Aja或樊麾會讓Master先上線,所以我大膽推定Master就是AlphaGo! 至於到底是AlphaGo哪個版本,我認為應是V18或V19,(柯潔說最新是V25版), 因為沒道理放個比V18更低的版本,而且從DeepMind不斷保密AlphaGo實力、 覺得會讓大家嚇一跳來看,http://i.imgur.com/QLWVmNC.png
, 也沒道理放一個太新的版本(從0直接變100才有趣,先放個50的就破梗了。) 所以我大膽推定就是V18,Master = GodMoves = V18! (不過是V19或V20的可能性也不低,畢竟現在已經有V25了。) 心得: V18 4500分已經人類無法企及,快棋在人類看來可能更跟神仙一樣,根據上面分析, 可能快棋V16就已經跟神仙一樣,人類早已無法區別實力。 整體人類每年Elo大概多個8~9,AlphaGo現在每個月升一代、Elo+300, 成長速度是人類的400倍。現在的V25 AlphaGo預估6600分,比頂尖人類多了3000分, 相當對柯潔勝率高達99.9999968377%,也就是如果辦個「一億番棋」,柯潔可以贏3盤... AlphaGo V25,相當於333年後的未來人回來下棋,333年前大概是1680年, 相當本因坊秀策出生前150年、大清國棋聖范西屏出生前20年,如果柯潔穿梭回去那時候, 棋弈水準大概就是現在的AlphaGo。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.68.147 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1483414419.A.2FE.html

01/03 11:39, , 1F
人類棋手若能和數學家合作,開發新的理論,還是有機會贏
01/03 11:39, 1F

01/03 11:41, , 2F
此理論只要是解析解,就可擊敗近似解且人腦可以掌控
01/03 11:41, 2F

01/03 11:56, , 3F
人類還是能大躍進的
01/03 11:56, 3F

01/03 12:11, , 4F
請問您的文章能借轉yigo嗎? 謝謝!
01/03 12:11, 4F

01/03 12:15, , 5F
OK!
01/03 12:15, 5F

01/03 12:25, , 6F
數學家XDD
01/03 12:25, 6F

01/03 12:30, , 7F
哈哈哈哈,np-hard問題的解析解
01/03 12:30, 7F
※ 編輯: AirOctopus (118.165.68.147), 01/03/2017 12:43:10

01/03 12:39, , 8F
解析解...噗噗
01/03 12:39, 8F

01/03 12:49, , 9F
滿有趣的!
01/03 12:49, 9F

01/03 13:00, , 10F
看有沒有棋手要學李世石第四盤的下法和master下
01/03 13:00, 10F

01/03 13:23, , 11F
誤用解析解是我的錯,小弟的意思是藉由跨界合作
01/03 13:23, 11F

01/03 13:25, , 12F
讓圍棋理論能更加接近公理化的數學一樣清晰,比如手割理論
01/03 13:25, 12F

01/03 13:28, , 13F
目前還存在很多模糊不清之處,也是人未來進步的機會
01/03 13:28, 13F

01/03 13:34, , 14F
謝謝,轉文位置 https://goo.gl/e6Gbiy
01/03 13:34, 14F

01/03 17:09, , 15F
成長應該會是呈J曲線 到後面應該就不會這樣一千一千的加
01/03 17:09, 15F

01/03 17:09, , 16F
了 反正只要強一些就能贏了
01/03 17:09, 16F

01/03 18:09, , 17F
ELO算法不會讓分數無限線性成長
01/03 18:09, 17F

01/03 18:11, , 18F
基本上一個超強者把別人都殺爆會導致別人的ELO都不斷下降
01/03 18:11, 18F

01/03 18:14, , 19F
,因而他贏別人取得的分數會越來越低
01/03 18:14, 19F

01/03 18:17, , 20F
但輸給elo高很多的也不太會降,主要是elo差不多的人碰
01/03 18:17, 20F

01/03 18:18, , 21F
到較會有變化,AlphaGo新版可以利用電舊版狂升Elo
01/03 18:18, 21F

01/03 18:22, , 22F
如果能把舊版殺到剩20%勝率,elo基本上就比舊版高很多
01/03 18:22, 22F

01/03 18:23, , 23F
所以有更高的elo後,更新版再把原新版殺爆,又可狂升
01/03 18:23, 23F

01/03 18:29, , 24F
elo大概是輸強很多的沒事、贏弱很多的也沒事、贏高很
01/03 18:29, 24F

01/03 18:34, , 25F
多得升很多、輸弱很都得掉很多。所以我好像搞錯了,是
01/03 18:34, 25F

01/03 18:35, , 26F
算碰到差很多的人比較有變化(?)
01/03 18:35, 26F

01/03 19:33, , 27F
沒錯,新版一開始初始積分殺舊版高分會生很快,但是舊版就
01/03 19:33, 27F

01/03 19:34, , 28F
會跌很快,兩邊往中間靠攏後勢頭就會趨緩,不會因此新版就
01/03 19:34, 28F

01/03 19:34, , 29F
會相對舊版分數線性漲上去。所謂的暴升只有一開頭。
01/03 19:34, 29F

01/03 19:43, , 30F
但舊版elo就在那裡,新版確定elo後大概就多個300,再
01/03 19:43, 30F

01/03 19:44, , 31F
新版又可以靠原新版多個300,基本上就無限上升啦
01/03 19:44, 31F

01/03 19:45, , 32F
每代相對勝率80%就不斷無限上升啦
01/03 19:45, 32F

01/03 20:00, , 33F
新版一定會比舊版多加300的依據是什麼,這可不是例證法能
01/03 20:00, 33F

01/03 20:00, , 34F
證的東西XD
01/03 20:00, 34F

01/03 20:01, , 35F
每一版本之間的勝率就不一定相同了,而且目前你看到的ELO
01/03 20:01, 35F

01/03 20:02, , 36F
值都是宣稱出來的,並沒有丟到包括人類棋手的這個池裡面實
01/03 20:02, 36F

01/03 20:02, , 37F
際跑過,光是公開比賽過的那個版本之ELO值就已經不夠可信
01/03 20:02, 37F

01/03 20:03, , 38F
了,我認為要拿這個宣稱的ELO值來說後面的故事還太早
01/03 20:03, 38F

01/03 20:04, , 39F
deepmind說大概80~90%勝率就算一個新版本啊
01/03 20:04, 39F

01/03 20:08, , 40F
喔好,我知道你在說什麼了XD
01/03 20:08, 40F

01/03 20:08, , 41F
我不確定實際分數怎麼算,如果差300=85%勝率的話,差
01/03 20:08, 41F

01/03 20:09, , 42F
這篇本來就趣味導向,幹嘛看那麼仔細,那我來問一句,300年
01/03 20:09, 42F

01/03 20:09, , 43F
後有人類嗎?
01/03 20:09, 43F

01/03 20:09, , 44F
個300應該是正常
01/03 20:09, 44F

01/03 20:10, , 45F
不過ELO本身就不是一個用在單挑勝率評比的的東西,AlphaGo
01/03 20:10, 45F

01/03 20:10, , 46F
版本之間的高勝率差有可能是改善了前一版的某致命缺點(即
01/03 20:10, 46F

01/03 20:11, , 47F
便那個致命缺點也許人類也引發不了)
01/03 20:11, 47F

01/03 20:11, , 48F
我的確對elo不算很了解,我只是用查到的公式去算的
01/03 20:11, 48F

01/03 20:13, , 49F
也許真正的整體實力不見得是這樣飆升的,等待實戰吧
01/03 20:13, 49F

01/03 20:13, , 50F
趣味導向的文章就不能被仔細看是在侮辱寫文章的人嗎?XD
01/03 20:13, 50F

01/03 20:13, , 51F
可能會算出完全錯的東西也不一定XD
01/03 20:13, 51F

01/03 20:13, , 52F
贏的人elo會上升 輸的會下降 A大你這樣講等於是把輸的AI
01/03 20:13, 52F

01/03 20:14, , 53F
的elo訂死 這樣才能讓贏的AI的elo無限上升
01/03 20:14, 53F

01/03 20:15, , 54F
不,就單挑重複一直下的情況下他說的其實沒錯
01/03 20:15, 54F

01/03 20:16, , 55F
同樣兩人重複下無限盤,如果勝率很固定,分數差會收斂在他
01/03 20:16, 55F

01/03 20:16, , 56F
說的範圍附近這樣
01/03 20:16, 56F

01/03 20:20, , 57F
為了不侮辱人,我也來仔細看,把一隻AI 放到elo評比,分數
01/03 20:20, 57F

01/03 20:20, , 58F
絕對高不起來,要放超多AI,才能把地基夯實,墊高最強的那
01/03 20:20, 58F

01/03 20:20, , 59F
隻AI的elo,屆時需要的AI的數量可能比人還多
01/03 20:20, 59F

01/03 20:29, , 60F
其實主要原因也就是對局數不夠,就算理論上的ELO可以那麼
01/03 20:29, 60F

01/03 20:30, , 61F
高,但實戰沒那麼多場次就堆不到那個地步XD
01/03 20:30, 61F

01/03 20:30, , 62F
所以你說加AI數量也是沒錯,其實就是增加總對局數量
01/03 20:30, 62F

01/03 21:11, , 63F
說不定是單機版阿老師…
01/03 21:11, 63F

01/03 22:25, , 64F
01/03 22:25, 64F
文章代碼(AID): #1OQnkJB- (GO)
文章代碼(AID): #1OQnkJB- (GO)