[新聞] 田淵棟:絕藝達到去年AlphaGo水準 Master是未知

看板GO (圍棋)作者 (逍遙山水憶秋年)時間8年前 (2017/03/27 12:45), 編輯推噓5(502)
留言7則, 6人參與, 最新討論串1/1
田淵棟:絕藝達到去年AlphaGo水準 Master是未知 據AI科技評論報導。   為了徹底揭開人機大戰的奧秘,地平線大牛講堂有幸邀請到 UEC 曾經的打入決賽的 隊伍 —— Facebook 圍棋 AI 程式 DarkForest 的首席工程師及第一作者田淵棟博士為 我們一探究竟,本文由奕欣和亞萌整理,並由田老師做了審核和編輯,特此感謝。   嘉賓介紹   田淵棟,Facebook 人工智慧研究院研究員,Facebook 圍棋 AI 程式 DarkForest 首 席工程師及第一作者,卡耐基梅隆大學機器人研究所博士,曾擔任 Google 無人駕駛團隊 軟體工程師,並獲得國際電腦視覺大會(ICCV)瑪律獎榮譽提名。   本文是田淵棟演講關於騰訊絕藝的節選。   騰訊“絕藝”   最近“絕藝”打UEC杯,還贏了冠軍,我相信很多人都對此感興趣。我們去年也參加 了拿了第二名。當然,今年的水準高出去年非常多。我不知道他們是怎麼做的,文章也沒 有發出來,所以也不是特別清楚,但是我相信他們應該達到了AlphaGO 發文章時候的水準 。之後AlphaGO又做了很多改進,變成了Master,但那些改進到最近都沒發出來,這部分 還是未知的。   去年8月份我去美國圍棋大會(US Go Congress),見到了Aja Huang和Fan Hui,就 問他們AlphaGO現在做的怎麼樣?他們沒有透露,但是從言語中我感覺到之前Nature上發 的那篇文章,其實是有瓶頸的,就是說沿著這條路走下去,可能不一定能做的非常好。所 以,他們如果是要再往上走,比如走到Master這個層面,需要用一些其它的方法,要有更 進一步的創新。像我是聽說他們最近把訓練好的值網路單獨拿出來,根據它再從頭訓練一 個策略網路。我覺得這樣做的好處是會發現一些看起來很怪但其實是好棋的招法,畢竟人 類千百年下棋的師承形成了思維定式,有些棋在任何時候都不會走,所以按照人類棋譜訓 練出來的策略網路終究會有局限性;而從頭訓練一個策略網路的話,則會發現很多新招。   當然,我不知道現在騰訊是不是有特別好的新想法出來,或者用了更大量的對局資料 。不過看他們跟Zen對弈的棋局,我稍微點了一下步數,大概200步不到就可以讓Zen認輸 ,所以還是非常厲害的。 http://sports.sina.com.cn/go/2017-03-27/doc-ifycstww1236497.shtml -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.71.30 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1490589957.A.279.html

03/27 12:54, , 1F
絕藝就算再強也應該不會出家用版,還是期待zen的進化
03/27 12:54, 1F

03/27 13:16, , 2F
其實DeepMind如果之後不發表Paper 絕藝怎麼追都追不上
03/27 13:16, 2F

03/27 13:52, , 3F
其實200步很多的說 官子沒什麼好翻盤了(除非像Zen那樣爆
03/27 13:52, 3F

03/27 14:38, , 4F
AlphaGo 單那個 TPU 就太 IMBA 了, 規模愈大省愈多錢
03/27 14:38, 4F

03/27 16:04, , 5F
華人統人工智慧半壁江山
03/27 16:04, 5F

03/27 18:42, , 6F
alphago也是Aja在才搞得 洋人還是對搞圍棋AI沒興趣
03/27 18:42, 6F

03/27 18:43, , 7F
畢竟沒市場 相比之下法國的crazystone顯得難能可貴
03/27 18:43, 7F
文章代碼(AID): #1Os9a59v (GO)
文章代碼(AID): #1Os9a59v (GO)