[將棋] 第27回世界電腦將棋大賽

看板chess (棋類遊戲)作者 (23)時間7年前 (2017/05/04 21:53), 7年前編輯推噓6(6052)
留言58則, 5人參與, 最新討論串1/1
http://www2.computer-shogi.org/wcsc27/ 二次預選 決勝 elmo 8-1 7-0 Ponanza Chainer 8-1 6-1 (輸elmo) 技巧 6-3 4-3 (輸elmo、ponanza、読み太) 大合神クジラちゃん 6-3 4-3 (輸elmo、ponanza、技巧) 蒼天幻想ナイツ・オブ・タヌキ 5-4 3-4 読み太 6-3 2-5 HoneyWaffle 6-3 2-5 NineDayFever 5-3-1 0-7 === 晉級決勝 === 大将軍 5-4 Qhapaq 5-4 nozomi 5-4 Apery 5-4 這次Ponanza導入了deep learning、1092 CPU + 128 GPU的Cluster 號稱對去年電王戰版的Ponanza勝率超過80% 原本想說可能沒什麼好看的... 結果又有讓Ponanza拿到敗場的軟體出現 elmo是最近出現在floodgate上、rating超過4000的monkeymagic 參賽使用的硬體只用2 CPU的主機 預定賽後也會公開,又有新玩具可以用了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.46.137 ※ 文章網址: https://www.ptt.cc/bbs/chess/M.1493906013.A.E9E.html

05/04 23:25, , 1F
電腦賽為什麼會 連下兩手 理解不能
05/04 23:25, 1F

05/05 00:36, , 2F
在輪到對方下的時候,傳送不合法的指令到server,被判定為
05/05 00:36, 2F

05/05 00:38, , 3F
違規,其實不是真的送了下一手指令,只是規則上算二手指し
05/05 00:38, 3F
※ 編輯: ssccg (118.150.36.84), 05/05/2017 00:39:35

05/05 15:45, , 4F
elmo要2連勝ponanza了
05/05 15:45, 4F

05/05 16:00, , 5F
不知道是將棋跟DNN的相性問題,還是只是學習時間還不夠
05/05 16:00, 5F

05/05 16:53, , 6F
覺得圍棋只要機率過就好比較適合 DNN...
05/05 16:53, 6F

05/05 16:53, , 7F
將棋需要嚴格的將死才算數不太好用 DNN # 除非入玉.
05/05 16:53, 7F

05/05 16:54, , 8F
賽後... 只有棋譜和評價參數, 程式: Y王!!!!!
05/05 16:54, 8F

05/05 17:02, , 9F
やねうら王根本場外參戰了,在比賽中推出新版本
05/05 17:02, 9F
※ 編輯: ssccg (118.163.87.133), 05/05/2017 17:26:12

05/05 17:27, , 10F
有點橫空出世的味道…而且是免費的,看來千田可以好好
05/05 17:27, 10F

05/05 17:27, , 11F
利用一下了
05/05 17:27, 11F

05/05 17:31, , 12F
05/05 17:31, 12F

05/05 17:40, , 13F
他不負責寫 engine, 他的努力都在棋譜和評價參數上了.
05/05 17:40, 13F

05/05 17:40, , 14F
看了一下決賽,雙方用的是主流的換角48金37桂29飛,後
05/05 17:40, 14F

05/05 17:41, , 15F
來elmo爭取到入玉過程中大幅棋得,最後直接打趴pona
05/05 17:41, 15F


05/05 17:43, , 17F
從這邊到可以贏... 嗯
05/05 17:43, 17F

05/05 17:48, , 18F
相較於大合神集眾人之力還是被那兩個玩假的... 囧
05/05 17:48, 18F

05/05 17:51, , 19F
也許是因為去年Y王本尊有贏到Pona才會有人想這種可能 @@
05/05 17:51, 19F

05/05 17:53, , 20F
Y王本人覺得這個比賽沒錢賺所以不會自己下去拼吧 (X)
05/05 17:53, 20F

05/05 18:54, , 21F
應該說將棋不太適合直接把 DNN 丟上去用...
05/05 18:54, 21F

05/05 19:18, , 22F
クジラ好像用去年電王版本的Apery(這次參賽的Apery也是)
05/05 19:18, 22F

05/05 19:20, , 23F
眾人之力的效果還是看的出來啦...
05/05 19:20, 23F

05/05 21:11, , 24F
明年要拿到優勝可能至少要比クジラ+elmo強,可能要R4500+?
05/05 21:11, 24F

05/05 21:16, , 25F
elmo看說明是從Apery開始加上各家的學習方法,主要改善終盤
05/05 21:16, 25F

05/05 21:17, , 26F
的強度,從上面那局面可以守住ponanza的進攻可以看出這方面
05/05 21:17, 26F

05/05 21:18, , 27F
可能是目前最強的吧
05/05 21:18, 27F

05/06 10:00, , 28F
試驗一下炎之七番勝負第七局終盤, 用elmo評價參數之後...
05/06 10:00, 28F

05/06 10:00, , 29F
真的很快就在某一手看到... 28 手詰 (羽生已完蛋)
05/06 10:00, 29F

05/06 10:01, , 30F
Engine 終盤初測: Apery >= Y王 > silent_majority(魔女)
05/06 10:01, 30F

05/07 00:02, , 31F
初步亂來的終盤檢證: http://0rz.tw/lebXG (放巴哈...)
05/07 00:02, 31F

05/07 01:42, , 32F
差不多各家都公開了(差技巧),各家的特色好像是qhapaq序盤
05/07 01:42, 32F

05/07 01:44, , 33F
強,読み太是單機強化版的Y牌引擎(可是我試覺得沒Y4.41+強)
05/07 01:44, 33F

05/07 01:49, , 34F
pona跟alphago比了一下,DNN好像只有policy network,只用
05/07 01:49, 34F

05/07 01:50, , 35F
在決定各分枝探索的順序上,剩下的就是cluster化,評價值好
05/07 01:50, 35F

05/07 01:51, , 36F
像都沒提到,說不定就是都沒有動...評價準確度輸人的話找的
05/07 01:51, 36F

05/07 01:52, , 37F
快也沒用,2~4名都是NPS幾億的cluster但是輸千萬級的elmo
05/07 01:52, 37F

05/07 02:03, , 38F
alphago在評價用了rollout和value network,value network
05/07 02:03, 38F

05/07 02:14, , 39F
在攻王類的好像CP值不好,rollout在將棋這種不知道什麼時候
05/07 02:14, 39F

05/07 02:15, , 40F
結束的不知道效果如何...不過方法上應該還是有嘗試的空間
05/07 02:15, 40F

05/07 02:18, , 41F
pona的policy準確率55%跟alphago的57%已經差不多了,再來重
05/07 02:18, 41F

05/07 02:21, , 42F
點還是要放在改善評價方法,至於引擎跟ML比較沒關係,比較
05/07 02:21, 42F

05/07 02:21, , 43F
看寫程式的人最佳化的功力了
05/07 02:21, 43F

05/07 06:19, , 44F
deep learning 的正確用途目前可能是拿來練評價參數.
05/07 06:19, 44F

05/07 06:20, , 45F
但是現行的二三駒關係不排除可能也有所侷限 (思)
05/07 06:20, 45F

05/07 06:21, , 46F
攻王需要的是正確的手順, 用 value network 有其困難點.
05/07 06:21, 46F

05/07 06:23, , 47F
除了 kk/kpp/kkp 那套之外該有新的評價想法了
05/07 06:23, 47F

05/07 06:39, , 48F
新想法就技巧啊,只是這次沒練贏...
05/07 06:39, 48F

05/07 06:43, , 49F
現在學習用的局面是用傳統評價自我對戰生的,加上policy
05/07 06:43, 49F

05/07 06:45, , 50F
network也許能用比較少的時間生出這些資料?
05/07 06:45, 50F

05/07 07:01, , 51F
剛剛把 usapyon2 dash 丟進 elmo 的 kk/kpp/kkp...
05/07 07:01, 51F

05/07 07:01, , 52F
當機了wwwwww
05/07 07:01, 52F

05/08 02:10, , 53F
技巧2出了,可以調強度和戰型,這可以賣了吧...
05/08 02:10, 53F

05/10 16:13, , 54F
偷偷試一下檢討棋... 結果三種軟體套elmo檢討出來不一樣
05/10 16:13, 54F

05/10 16:14, , 55F
(著名實況台: 魔女 # 這邊根據之前測試使用 Apery/Y王)
05/10 16:14, 55F

05/10 16:19, , 56F
太難了先擺一邊... 囧
05/10 16:19, 56F

12/07 01:46, , 57F
有新的大魔王
12/07 01:46, 57F

12/07 01:47, , 58F
AlphaGO 太兇惡了
12/07 01:47, 58F
文章代碼(AID): #1P2p9TwU (chess)
文章代碼(AID): #1P2p9TwU (chess)