[閒聊] 黃士傑博士:AlphaZero團隊登上Science

看板GO (圍棋)作者 (skyhawk)時間7年前 (2018/12/07 16:34), 編輯推噓18(18082)
留言100則, 13人參與, 7年前最新討論串1/2 (看更多)
https://is.gd/Bw8fa1 AlphaZero: Shedding new light on the grand games of chess, shogi and Go 我們很高興向大家宣佈,AlphaZero團隊登上了頂尖的《科學》期刊(Science)。 AlphaZero完全自學,精通三種棋類遊戲:西洋棋(chess)、日本將棋(shogi)與圍棋(Go) ,特別是實力大幅超越頂尖的傳統西洋棋程式Stockfish(1000局的比數是155勝6敗,同時 Stockfish的實力遠超1997年戰勝世界冠軍的Deep Blue深藍)。恭喜團隊,也特別恭喜三 位第一作者David Silver, Thomas Hubert, Julian Schrittwieser,AlphaZero的成果實 在令人印象深刻。 ------------------------------------------------------------------------------ AlphaZero完全自學,精通三種棋類遊戲....O.M.G!!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.240.132.91 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1544171679.A.ADE.html

12/07 16:57, 7年前 , 1F
能攻克圍棋其他兩種就簡單了XD
12/07 16:57, 1F

12/07 18:01, 7年前 , 2F
again? AlphaGo一次;AlphaZero一次…
12/07 18:01, 2F

12/07 18:39, 7年前 , 3F
剛看了論文,相較於去年的論文,今年多了一些圖幫助
12/07 18:39, 3F

12/07 18:39, 7年前 , 4F
理解以及更多的西洋棋棋局,而將棋去年沒發布棋局,
12/07 18:39, 4F

12/07 18:39, 7年前 , 5F
今天發表之後估計將棋應該會有更多討論
12/07 18:39, 5F

12/08 13:29, 7年前 , 6F
結果贏了圍棋,卻哉在星海,所以星海最難?
12/08 13:29, 6F

12/08 16:54, 7年前 , 7F
圍棋是完全透明的,星海不是
12/08 16:54, 7F

12/08 17:46, 7年前 , 8F
其實,《星海爭霸》仍有地圖、區域、單位、操作等戰略考量
12/08 17:46, 8F

12/08 17:47, 7年前 , 9F
,複雜程度與比較「靜態」的圍棋相比,難度更顯一籌。
12/08 17:47, 9F

12/08 17:48, 7年前 , 10F
12/08 17:48, 10F

12/08 17:49, 7年前 , 11F
請參考以上網址,裡面提到與圍棋相比,難度更顯一籌
12/08 17:49, 11F

12/08 20:00, 7年前 , 12F
星海還好 世紀帝國更難
12/08 20:00, 12F

12/09 03:09, 7年前 , 13F
難度攻克應該都是早晚 以後ai非穩贏的大概只有像卡牌
12/09 03:09, 13F

12/09 03:09, 7年前 , 14F
之類的靠賽遊戲
12/09 03:09, 14F

12/09 04:10, 7年前 , 15F
樓上把星海這類非完全資訊的高難度遊戲給AI解想得太簡單了
12/09 04:10, 15F

12/09 04:11, 7年前 , 16F
以目前大多數卡牌遊戲都會有一定的環境內牌數限制來說,雖
12/09 04:11, 16F

12/09 04:12, 7年前 , 17F
然會因為運氣因素無法穩贏,但AI運作的難度是低很多的
12/09 04:12, 17F

12/09 04:14, 7年前 , 18F
回合制跟即時制、卡牌跟所有兵種建築的行為,簡單估計對比
12/09 04:14, 18F

12/09 04:15, 7年前 , 19F
一下,雖然同樣是無法知道完全資訊的遊戲類型,難度還是相
12/09 04:15, 19F

12/09 04:15, 7年前 , 20F
差甚遠的
12/09 04:15, 20F

12/09 04:16, 7年前 , 21F
況且以為星海就不用靠賽一定是弄錯了什麼,職業賽歷史中太
12/09 04:16, 21F

12/09 04:16, 7年前 , 22F
多開局戰術被剋或被開大招直接搞死的例子XD
12/09 04:16, 22F

12/09 04:18, 7年前 , 23F
就算給(在限制APM下)有完美操作的AI來互鬥,當雙方操作
12/09 04:18, 23F

12/09 04:18, 7年前 , 24F
都一樣盡量做到完美的情況下,開局戰術被剋死的情況可能更
12/09 04:18, 24F

12/09 04:18, 7年前 , 25F
明顯XD
12/09 04:18, 25F

12/09 04:21, 7年前 , 26F
況且現在AI連要正常開局都還自學不起來呢,要正常打完一局
12/09 04:21, 26F

12/09 04:22, 7年前 , 27F
的AI還很遠
12/09 04:22, 27F

12/09 10:21, 7年前 , 28F
樓上稍稍講的不嚴謹,如果要從零開始自學很難,但用
12/09 10:21, 28F

12/09 10:22, 7年前 , 29F
傳統算法要正常打完一局絕對不難
12/09 10:22, 29F

12/09 12:26, 7年前 , 30F
樓上說的是
12/09 12:26, 30F

12/09 21:51, 7年前 , 31F
傳統就給定劇本再填滿分支判斷行為啊
12/09 21:51, 31F

12/10 03:08, 7年前 , 32F
@HeterCompute 我是單純就卡牌遊戲跟星海來比,星海還是更
12/10 03:08, 32F

12/10 03:08, 7年前 , 33F
難一些
12/10 03:08, 33F

12/10 03:09, 7年前 , 34F
另外我上面說的沒在考慮傳統AI,不然就算星海也是有內建AI
12/10 03:09, 34F

12/10 03:09, 7年前 , 35F
可以還算正常的打完一局而且有一定威脅啊,這就不用提了
12/10 03:09, 35F

12/10 03:10, 7年前 , 36F
卡牌遊戲也一樣,像遊戲王出了那麼多代遊戲,裡面當然也都
12/10 03:10, 36F

12/10 03:10, 7年前 , 37F
是能正常打完遊戲的簡單AI
12/10 03:10, 37F

12/10 03:12, 7年前 , 38F
其實上面還有個可以補充的不嚴謹部分是,如果卡牌遊戲把組
12/10 03:12, 38F

12/10 03:12, 7年前 , 39F
套牌也考慮在內,要求AI自組套牌自己打,那麼難度會直線上
12/10 03:12, 39F
還有 21 則推文
12/12 03:57, 7年前 , 61F
的話
12/12 03:57, 61F

12/13 05:37, 7年前 , 62F
AI要自學星海,能不能 "學好" 我不知道,但要打敗人類為
12/13 05:37, 62F

12/13 05:38, 7年前 , 63F
目標的話,肯定是非常吃飯的,關鍵就在於apm的巨大差距。
12/13 05:38, 63F

12/13 05:38, 7年前 , 64F
很多戰術是否適宜,很多戰鬥的判斷,關鍵都還是被APM左右
12/13 05:38, 64F

12/13 05:39, 7年前 , 65F
著,就像有些高手的棋,就算攤著下給你看,你也學不來,
12/13 05:39, 65F

12/13 05:41, 7年前 , 66F
一模一樣的兵,正常理解是7隻打贏贏6隻,但如果APM有落差
12/13 05:41, 66F

12/13 05:42, 7年前 , 67F
的時候,就必須顛覆整個觀念與判斷了。至於電腦會不會於
12/13 05:42, 67F

12/13 05:42, 7年前 , 68F
戰鬥中判斷對手的操作能力,我想是可以合理判斷的,就像
12/13 05:42, 68F

12/13 05:43, 7年前 , 69F
人對人的時候,也會針對對手的操作不足上做一些戰術。
12/13 05:43, 69F

12/13 05:45, 7年前 , 70F
至於卡牌遊戲,我覺得就不要打擾人家頂尖團隊了,素人小
12/13 05:45, 70F

12/13 05:45, 7年前 , 71F
團隊甚至學生做報告大概都能做出來吧。
12/13 05:45, 71F

12/13 06:51, 7年前 , 72F
樓上,你好像不知道做星海AI的都會強迫限制APM上限吧XD
12/13 06:51, 72F

12/13 06:52, 7年前 , 73F
理由就是如果強迫靠超高操作硬壓人類,不算是理想的AI進展
12/13 06:52, 73F

12/13 06:54, 7年前 , 74F
另外星海的通用AI難度真的沒你想像中容易,在圍棋界大殺四
12/13 06:54, 74F

12/13 06:55, 7年前 , 75F
方的AlphaGo系列,搬到星海去連好好採礦開局都還沒搞定
12/13 06:55, 75F

12/13 06:56, 7年前 , 76F
而卡牌遊戲你也低估了,我上面雖然一直說認為卡牌遊戲比起
12/13 06:56, 76F

12/13 06:56, 7年前 , 77F
星海容易(指預先給定套牌的情況),但那是星海難度太高
12/13 06:56, 77F

12/13 06:57, 7年前 , 78F
如果你要用舊式AI概念寫卡牌那當然不難,問題現在就是要用
12/13 06:57, 78F

12/13 06:58, 7年前 , 79F
深度學習機制來學更通用的AI,那就完全不同一回事了
12/13 06:58, 79F

12/13 06:59, 7年前 , 80F
同樣的星海也老早就有人用舊式AI寫過純完美控兵AI了,也有
12/13 06:59, 80F

12/13 07:00, 7年前 , 81F
簡單實行固定戰術的AI,除了遊戲內建的AI以外也非常多人利
12/13 07:00, 81F

12/13 07:00, 7年前 , 82F
用1代2代的關卡編輯器內建邏輯來寫成這種AI,我自己也試過
12/13 07:00, 82F

12/13 07:01, 7年前 , 83F
。但是在深度學習架構下就完全不是同一回事。
12/13 07:01, 83F

12/13 16:11, 7年前 , 84F
AI為什麼不直接模擬滑鼠跟鍵盤按鍵?
12/13 16:11, 84F

12/13 17:01, 7年前 , 85F
回A大,是說做一個機器手臂,來按鍵盤跟滑鼠麼?
12/13 17:01, 85F

12/13 17:02, 7年前 , 86F
如果只是軟体模擬按鍵,電腦速度一定比人手速快
12/13 17:02, 86F

12/13 17:04, 7年前 , 87F
我是說讓AI用跟人類差不多的速度移動滑鼠、按按鍵
12/13 17:04, 87F

12/13 17:05, 7年前 , 88F
不是用機器手臂,只是模擬人能做到的按滑鼠等動作
12/13 17:05, 88F

12/18 02:13, 7年前 , 89F
我比較好奇APM不設限能不能贏人類,目前比過的比賽
12/18 02:13, 89F

12/18 02:13, 7年前 , 90F
都是慘輸,職業選手隨便一個戰術就屌虐
12/18 02:13, 90F

12/18 02:14, 7年前 , 91F
根本沒有給你APM發揮的空間,AI連怎麼end game都很有
12/18 02:14, 91F

12/18 02:15, 7年前 , 92F
問題
12/18 02:15, 92F

12/18 02:18, 7年前 , 93F
AI若學不會運用戰術或應對戰術,APM設限就只是遮羞布
12/18 02:18, 93F

12/18 05:20, 7年前 , 94F
目前的深度學習玩星海不是如何End Game的問題,是連Start
12/18 05:20, 94F

12/18 05:20, 7年前 , 95F
Game都有困難
12/18 05:20, 95F

12/18 05:21, 7年前 , 96F
如果你是把舊式AI也包括在內的話,舊式AI八成都是寫死特定
12/18 05:21, 96F

12/18 05:22, 7年前 , 97F
某些戰術,頂多判斷幾個戰術分支,所以當然會被職業選手出
12/18 05:22, 97F

12/18 05:23, 7年前 , 98F
個招就打倒。就算有完美的APM,兵種或地點配置有誤也是不
12/18 05:23, 98F

12/18 05:23, 7年前 , 99F
12/18 05:23, 99F

12/18 10:41, 7年前 , 100F
感覺AI要走的路還很長ˊ_>ˋ
12/18 10:41, 100F
文章代碼(AID): #1S2Z2VhU (GO)
文章代碼(AID): #1S2Z2VhU (GO)