[新聞] 田淵棟:絕藝達到去年AlphaGo水準 Master是未知
田淵棟:絕藝達到去年AlphaGo水準 Master是未知
據AI科技評論報導。
為了徹底揭開人機大戰的奧秘,地平線大牛講堂有幸邀請到 UEC 曾經的打入決賽的
隊伍 —— Facebook 圍棋 AI 程式 DarkForest 的首席工程師及第一作者田淵棟博士為
我們一探究竟,本文由奕欣和亞萌整理,並由田老師做了審核和編輯,特此感謝。
嘉賓介紹
田淵棟,Facebook 人工智慧研究院研究員,Facebook 圍棋 AI 程式 DarkForest 首
席工程師及第一作者,卡耐基梅隆大學機器人研究所博士,曾擔任 Google 無人駕駛團隊
軟體工程師,並獲得國際電腦視覺大會(ICCV)瑪律獎榮譽提名。
本文是田淵棟演講關於騰訊絕藝的節選。
騰訊“絕藝”
最近“絕藝”打UEC杯,還贏了冠軍,我相信很多人都對此感興趣。我們去年也參加
了拿了第二名。當然,今年的水準高出去年非常多。我不知道他們是怎麼做的,文章也沒
有發出來,所以也不是特別清楚,但是我相信他們應該達到了AlphaGO 發文章時候的水準
。之後AlphaGO又做了很多改進,變成了Master,但那些改進到最近都沒發出來,這部分
還是未知的。
去年8月份我去美國圍棋大會(US Go Congress),見到了Aja Huang和Fan Hui,就
問他們AlphaGO現在做的怎麼樣?他們沒有透露,但是從言語中我感覺到之前Nature上發
的那篇文章,其實是有瓶頸的,就是說沿著這條路走下去,可能不一定能做的非常好。所
以,他們如果是要再往上走,比如走到Master這個層面,需要用一些其它的方法,要有更
進一步的創新。像我是聽說他們最近把訓練好的值網路單獨拿出來,根據它再從頭訓練一
個策略網路。我覺得這樣做的好處是會發現一些看起來很怪但其實是好棋的招法,畢竟人
類千百年下棋的師承形成了思維定式,有些棋在任何時候都不會走,所以按照人類棋譜訓
練出來的策略網路終究會有局限性;而從頭訓練一個策略網路的話,則會發現很多新招。
當然,我不知道現在騰訊是不是有特別好的新想法出來,或者用了更大量的對局資料
。不過看他們跟Zen對弈的棋局,我稍微點了一下步數,大概200步不到就可以讓Zen認輸
,所以還是非常厲害的。
http://sports.sina.com.cn/go/2017-03-27/doc-ifycstww1236497.shtml
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.71.30
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1490589957.A.279.html
→
03/27 12:54, , 1F
03/27 12:54, 1F
推
03/27 13:16, , 2F
03/27 13:16, 2F
推
03/27 13:52, , 3F
03/27 13:52, 3F
推
03/27 14:38, , 4F
03/27 14:38, 4F
推
03/27 16:04, , 5F
03/27 16:04, 5F
推
03/27 18:42, , 6F
03/27 18:42, 6F
→
03/27 18:43, , 7F
03/27 18:43, 7F
GO 近期熱門文章
PTT遊戲區 即時熱門文章
38
52
22
35