Fw: [情報] AlphaZero戰勝將棋與西洋棋最強軟體

看板chess (棋類遊戲)作者 (收收收尾)時間7年前 (2017/12/07 00:15), 7年前編輯推噓4(4014)
留言18則, 5人參與, 7年前最新討論串1/1
※ [本文轉錄自 GO 看板 #1Q9-Ito- ] 作者: HeterCompute (異質運算) 看板: GO 標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體 時間: Wed Dec 6 20:38:11 2017 https://arxiv.org/pdf/1712.01815.pdf 這次論文的標題是: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm 從零學棋, 使用相似的神經網路架構, 一樣沒有使用任何人類知識, 4小時打敗西洋棋最強軟體Stockfish, 2小時打敗將棋最強軟體Elmo, 34小時打敗圍棋AlphaGoZero 20blocks 3天版本, (圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU), 以MCTS打倒傳統的alpha beta search, 通用於完全訊息遊戲, 又一偉大的突破。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.176.30 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1512563895.A.CBE.html

12/06 20:45, 7年前 , 1F
一個通用於下棋的AI?
12/06 20:45, 1F
沒錯

12/06 20:50, 7年前 , 2F
又達到新境界了
12/06 20:50, 2F

12/06 20:54, 7年前 , 3F
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的
12/06 20:54, 3F

12/06 20:54, 7年前 , 4F
(例如跳棋)不知道能否通用過去
12/06 20:54, 4F
暗棋這種非完全訊息遊戲很難說,跳棋這種只有多人應該沒什麼問題。 ※ 編輯: HeterCompute (118.169.176.30), 12/06/2017 20:56:17

12/06 20:55, 7年前 , 5F
力王:大家可以回家啦~
12/06 20:55, 5F

12/06 20:59, 7年前 , 6F
逆天啦 發展這麼快
12/06 20:59, 6F

12/06 21:01, 7年前 , 7F
暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類
12/06 21:01, 7F

12/06 21:02, 7年前 , 8F
棋手會有一定勝率
12/06 21:02, 8F

12/06 21:04, 7年前 , 9F
想看阿法零跟赤木茂打麻將
12/06 21:04, 9F

12/06 21:06, 7年前 , 10F
AlphaGO老師:我是說在座的各位都是__
12/06 21:06, 10F

12/06 21:15, 7年前 , 11F
已經征服完全訊息遊戲了,希望星海二也會有突破
12/06 21:15, 11F

12/06 21:41, 7年前 , 12F
真的是在座的各位都是哈哈,可以回家啦~~~
12/06 21:41, 12F

12/06 21:43, 7年前 , 13F
多人跟雙人是有很多不同,沒問題就有鬼囉.
12/06 21:43, 13F

12/06 22:22, 7年前 , 14F
這也終結了西洋棋的西西里防禦。
12/06 22:22, 14F

12/06 22:35, 7年前 , 15F
這世界變化太快好累啊
12/06 22:35, 15F

12/06 22:52, 7年前 , 16F
太強了 O o
12/06 22:52, 16F

12/07 00:11, 7年前 , 17F
借轉chess
12/07 00:11, 17F
※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: asglay (111.254.37.40), 12/07/2017 00:15:41

12/07 00:35, 7年前 , 18F
雖然演算法很強,但是真的有資源能玩更是關鍵...
12/07 00:35, 18F

12/07 00:40, 7年前 , 19F
不知道在電王的規則下多強就是了
12/07 00:40, 19F

12/07 01:43, 7年前 , 20F
應該差不多強 耗資源的部分是訓練
12/07 01:43, 20F

12/07 02:30, 7年前 , 21F
實戰用的是4TPU,先不說電王沒TPU,TPU是CPU的幾十倍吧?
12/07 02:30, 21F

12/07 02:39, 7年前 , 22F
64T vs 4TPU感覺不算公平,當然再多訓練下去一定是Alpha強
12/07 02:39, 22F

12/07 10:11, 7年前 , 23F
請他們明年到電王戰比一次就知道了,現在的elmo也不是
12/07 10:11, 23F

12/07 10:11, 7年前 , 24F
最強,而且大家有被限制統一硬體規格
12/07 10:11, 24F

12/07 12:25, 7年前 , 25F
跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k
12/07 12:25, 25F

12/07 12:25, 7年前 , 26F
感覺應該是沒什麼懸念了
12/07 12:25, 26F

12/07 12:58, 7年前 , 27F
在一個node上要做的evaluation不同,不能比NPS吧
12/07 12:58, 27F

12/07 13:01, 7年前 , 28F
AlphaZero比較強是一定的,只是好奇TPU優化的程式用4TPU跑
12/07 13:01, 28F

12/07 13:02, 7年前 , 29F
要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度
12/07 13:02, 29F

12/07 20:16, 7年前 , 30F
後來測試最新tanuki確實是比elmo強
12/07 20:16, 30F

12/08 13:10, 7年前 , 31F
新電王ぽんぽこ近日直播時正式上線 被日本觀眾嫌的要死xd
12/08 13:10, 31F

12/08 13:10, 7年前 , 32F
因為預測的太短視 剛上直播時常常只預測下一步 昨天看時
12/08 13:10, 32F

12/08 13:10, 7年前 , 33F
好一點 可是在畫面上有預測後9步的空間 却完美的只預設了
12/08 13:10, 33F

12/08 13:10, 7年前 , 34F
8步空一格...
12/08 13:10, 34F

12/08 13:52, 7年前 , 35F
那是UI和探索引擎配合的問題吧
12/08 13:52, 35F
文章代碼(AID): #1QA1UlAk (chess)
文章代碼(AID): #1QA1UlAk (chess)