[情報] Deepmind :與李世石對戰的版本已有4500分

看板GO (圍棋)作者 (winall)時間9年前 (2016/03/26 21:23), 編輯推噓17(20323)
留言46則, 22人參與, 最新討論串1/1
Deepmind :與李世石對戰的版本已有4500分的實力 (柯潔3615分) https://goo.gl/Wm8CZU 圖: https://goo.gl/LSGHWk David Silver 昨天在UCL 給了個講座,其中提到對AlphaGo 的ELO 評分,其中跟李世石下 棋的版本(v18)竟然已經高達4500 分能讓跟樊麾下棋的那款AlphaGo (v13)四個子。 ELO rating 也就是http://goratings.org 上的評分,目前世界圍棋第一人柯潔是3615 分 —— Elo rating 的分差表示相應的勝率,差800 分的話勝率就是100%,差677 分的話勝率 是99%. 得知這個評分後看李世石的第四盤,用不成立(?)的妙手把AlphaGo 打成bug 狀態 ,真是很不容易。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.115.128.22 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458998624.A.642.html

03/26 21:27, , 1F
柯潔來也不開胡的意思嗎?
03/26 21:27, 1F

03/26 21:29, , 2F
Zen 不到 2000分
03/26 21:29, 2F

03/26 21:30, , 3F
互相嗆蝦的意思
03/26 21:30, 3F

03/26 21:53, , 4F
原來是戰鬥力的概念...
03/26 21:53, 4F

03/26 22:02, , 5F
所以…人類對圍棋的理解還有很大的進步空間的意思
03/26 22:02, 5F

03/26 22:10, , 6F
換算成原子彈.營養午餐和醋昆布大概各是多少
03/26 22:10, 6F

03/26 22:12, , 7F
那要變身成賽亞人才行了
03/26 22:12, 7F

03/26 22:18, , 8F
說不定是讓四子的譜選不好吧......
03/26 22:18, 8F

03/26 22:22, , 9F
內文提到電腦持黑和持白的勝率判斷差異,
03/26 22:22, 9F

03/26 22:22, , 10F
值得讓人反思貼7.5目是否真的過多
03/26 22:22, 10F

03/26 22:57, , 11F
愈講愈高,反正比賽都贏了,愛講幾分就講幾分
03/26 22:57, 11F

03/26 23:03, , 12F
人機大戰時,還說4000分以上版本不穩定,所以不會用
03/26 23:03, 12F

03/26 23:04, , 13F
所以還是用了嗎?但從這五盤棋來看,不是無懈可擊呀?
03/26 23:04, 13F

03/27 00:07, , 14F
講屁話,有bug就是棋力還沒到那麼高ELO的程度
03/27 00:07, 14F

03/27 00:08, , 15F
不然也把李世石下錯、下差的棋扣掉不計,能這樣比嗎?
03/27 00:08, 15F

03/27 01:02, , 16F
哈哈 早就估狗狗讓李3顆好勝負 李讓樊2棵
03/27 01:02, 16F

03/27 01:04, , 17F
柯姐本來就不會開胡的
03/27 01:04, 17F

03/27 01:10, , 18F
古狗能讓李3顆??我怎覺得讓先就會輸了
03/27 01:10, 18F

03/27 01:32, , 19F
貼6.5目比較適當
03/27 01:32, 19F

03/27 03:16, , 20F
我實在很好奇這分數怎麼算的 又沒有放他去跟大量棋士下
03/27 03:16, 20F

03/27 03:16, , 21F
為啥就可以獲得這種比大多數棋士高的分數?難道跟小李下
03/27 03:16, 21F

03/27 03:17, , 22F
這五盤就有這成績了?
03/27 03:17, 22F

03/27 03:18, , 23F
所有
03/27 03:18, 23F

03/27 03:37, , 24F
裡面有說『警告:這是以自我對弈來計算的分數』
03/27 03:37, 24F

03/27 03:38, , 25F
可能就是跟舊版(對樊麾版)的對弈結果算勝率吧,
03/27 03:38, 25F

03/27 03:38, , 26F
這也支持了AlphaGo自己的風格不容易找出自己弱點?
03/27 03:38, 26F

03/27 03:43, , 27F
說跟舊版對弈結果不夠精確,應該說跟許多不同的中間版本
03/27 03:43, 27F

03/27 07:07, , 28F
反正某言論就是輸了直接推給商業演出、程式bug就好啦
03/27 07:07, 28F

03/27 12:08, , 29F
alphago的elo估計都建立在自我對弈(1秒1步)和對其他圍
03/27 12:08, 29F

03/27 12:09, , 30F
棋程式對弈(5秒1步)的比較,所以Elo值其實頗不準.唯一
03/27 12:09, 30F

03/27 12:09, , 31F
準的大概就是10月版Elo~3100與3月版Elo~3600,畢竟我們
03/27 12:09, 31F

03/27 12:10, , 32F
想討論的是慢棋的Elo~
03/27 12:10, 32F

03/27 12:11, , 33F
所有自我對弈或和Zen/CrazyStone比得到的Elo都不可信
03/27 12:11, 33F

03/27 12:23, , 34F
只要跟人的盤數夠多,被專挑弱點下,肯定會掉很多
03/27 12:23, 34F

03/27 12:25, , 35F
AI 跟 AI 下,不會挑弱點,等於雙方擲骰子
03/27 12:25, 35F

03/27 12:42, , 36F
真的會有弱點嗎@@,說不定再過一年電腦要讓頂尖職棋一
03/27 12:42, 36F

03/27 12:42, , 37F
先了
03/27 12:42, 37F

03/27 12:55, , 38F
alphago不是每個落子點都會考慮的策略 所以可能有弱點啊
03/27 12:55, 38F

03/27 13:09, , 39F
每個落子點都考慮就算不完了,所以SL策略網路很重要
03/27 13:09, 39F

03/27 13:42, , 40F
那個排名根本不準
03/27 13:42, 40F

03/27 13:47, , 41F
SL就是雙面刃 為了減少計算量 難保不會再出現瘋狗
03/27 13:47, 41F

03/27 19:51, , 42F
差800,勝率是99.0099%,差1200,勝率是99.9001%,沒辦
03/27 19:51, 42F

03/27 19:54, , 43F
法到100%
03/27 19:54, 43F

03/28 06:18, , 44F
即便每5局就瘋一局,多局賽要擋V18也難更何況是後面版本。
03/28 06:18, 44F

03/28 06:22, , 45F
如果要拼10局升降,半年後的阿法大師要比吳清源大師威猛了
03/28 06:22, 45F

03/28 06:23, , 46F
,頂尖棋手半先內能擋住就是勝利。
03/28 06:23, 46F
文章代碼(AID): #1MzerWP2 (GO)
文章代碼(AID): #1MzerWP2 (GO)