[閒聊] LeelaZero開始256x20訓練階段

看板GO (圍棋)作者 (hank93304)時間7年前 (2018/07/29 21:02), 編輯推噓17(17021)
留言38則, 8人參與, 7年前最新討論串1/1
昨天開始LeelaZero開始訓練256x20的網絡 但意外出師不利,只以45.54%勝率進一版 不知下次升版會不會看到質的飛躍 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.135.137 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1532869350.A.B2C.html

07/29 21:04, 7年前 , 1F
目前版本是dc011d01
07/29 21:04, 1F

07/29 22:30, 7年前 , 2F
master之路正式開始,我們的征途無窮無盡
07/29 22:30, 2F

07/29 22:32, 7年前 , 3F
master不是40b嗎XD
07/29 22:32, 3F

07/29 22:43, 7年前 , 4F
現在絕藝實力超越ELF,不知和master差多少
07/29 22:43, 4F

07/30 00:49, 7年前 , 5F
master是20b,不過突然升b我也有點措手不及
07/30 00:49, 5F

07/30 00:50, 7年前 , 6F
其實我不覺得絕藝的權重真的比elf強很多,但他的硬體真的
07/30 00:50, 6F

07/30 00:51, 7年前 , 7F
強,40張顯卡有誰擋的住
07/30 00:51, 7F

07/30 01:09, 7年前 , 8F
請問一下,拿現在的leelazero配絕藝的硬體,會有多強?
07/30 01:09, 8F

07/30 01:14, 7年前 , 9F
很弱,因為現在的lz對於非常高端的硬體幾乎沒有優化
07/30 01:14, 9F

07/30 01:14, 7年前 , 10F
以20b來說,6卡以上實力幾乎沒有區別
07/30 01:14, 10F

07/30 01:16, 7年前 , 11F
如果是以理想狀態下的話,如果我們用絕藝的硬體,這次拿第
07/30 01:16, 11F

07/30 01:16, 7年前 , 12F
2名(騰訊大賽)沒有問題
07/30 01:16, 12F

08/01 17:20, 7年前 , 13F
有點不懂為何新的權重對511034f4勝率都這麼低?
08/01 17:20, 13F

08/01 19:14, 7年前 , 14F
FaceBook ELF有新版本欸 d13c4099
08/01 19:14, 14F

08/01 19:15, 7年前 , 15F
對62b5417b竟然有64.63%的勝率
08/01 19:15, 15F

09/05 10:35, 7年前 , 16F
今天突然提升到40b了
09/05 10:35, 16F

09/05 13:34, 7年前 , 17F
我剛剛也發現了
09/05 13:34, 17F

09/05 13:45, 7年前 , 18F
我快可以休息了XD
09/05 13:45, 18F

09/05 13:49, 7年前 , 19F
請問目前#174的版本與貝瑞基因杯時的LZ實力差多少啊?
09/05 13:49, 19F

09/05 13:50, 7年前 , 20F
當時配備很強,現在用什麼等級的設備就能擊敗它了?
09/05 13:50, 20F

09/05 14:08, 7年前 , 21F
當時應該是拿7卡1080Ti,現在和當時棋力差滿遠的,沒做過
09/05 14:08, 21F

09/05 14:08, 7年前 , 22F
測試,但我想一卡1080Ti應該都能對當時7卡有80%勝率
09/05 14:08, 22F

09/05 14:10, 7年前 , 23F
應該說,當時的絕藝金毛應該頂多就和我們現在的權重55開,
09/05 14:10, 23F

09/05 14:10, 7年前 , 24F
或比現在的我們弱一些
09/05 14:10, 24F

09/05 16:05, 7年前 , 25F
謝謝說明
09/05 16:05, 25F

09/05 16:06, 7年前 , 26F
剛剛看了一下當時是#127,與#174的ELO差了快1900分XD
09/05 16:06, 26F

09/06 05:36, 7年前 , 27F
請問,"256x20的網絡"是什麼意思?是使用顯卡的運算量嗎?
09/06 05:36, 27F

09/06 11:30, 7年前 , 28F
256是filter,20是block,如果沒有要深究神經網路的話,
09/06 11:30, 28F

09/06 11:31, 7年前 , 29F
你可以把他比擬成長和寬,數字越大代表網路越大
09/06 11:31, 29F

09/06 11:31, 7年前 , 30F
通常越大的網路,能夠懂的東西越多,但相對的算的也越慢
09/06 11:31, 30F

09/06 11:32, 7年前 , 31F
256x20接近AlphaGo Master的網路結構,所以理論上最強至少
09/06 11:32, 31F

09/06 11:32, 7年前 , 32F
接近master的水準
09/06 11:32, 32F

09/10 10:41, 7年前 , 33F
9/5已經開始256X40的訓練,棋力大躍進,一般機器也跑得很
09/10 10:41, 33F

09/10 10:42, 7年前 , 34F
辛苦!單場的品質大幅提升,但訓練場數大幅減少。
09/10 10:42, 34F

09/20 16:40, 7年前 , 35F
我有個疑問 現在對局千篇一律是星位互掛, 是必然的嗎?
09/20 16:40, 35F

09/20 18:10, 7年前 , 36F
星位互掛是因為學了很多ELF的開局,但如果再模擬久一些,
09/20 18:10, 36F

09/20 18:11, 7年前 , 37F
基本上是不會走星位互掛,所以星位互掛並非必然
09/20 18:11, 37F

09/21 15:55, 7年前 , 38F
謝謝b大
09/21 15:55, 38F
文章代碼(AID): #1RNRhcii (GO)
文章代碼(AID): #1RNRhcii (GO)