[問題] 再和alphago重覆同一盤棋?

看板GO (圍棋)作者 (Chiquitia)時間9年前 (2016/03/15 22:38), 編輯推噓4(4012)
留言16則, 9人參與, 最新討論串1/3 (看更多)
不好意思,有個問題想了好一會兒,實在是不確定答案, 想來也只有這個板最合適問。 倘若重覆alphago第一盤和李世石的對奕內容, 那麼,alphago還會下出一樣的步數嗎? 我的直覺告訴我,應該是不一樣, 但,到底隨機的機轉及其比重占了多少,實在是不懂如何去思考, 請問有人能釋疑? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.107.173 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458052717.A.747.html

03/15 22:41, , 1F
他不會下一樣的棋步..有隨機的概念在裡面
03/15 22:41, 1F

03/15 22:50, , 2F
兩個network輸出不變 但快速走子那裡應該有隨機
03/15 22:50, 2F

03/15 22:53, , 3F
MCTS 演算的順序不會一樣, 所以結果肯定會有出入
03/15 22:53, 3F

03/15 22:54, , 4F
有人舉例是 第一次算 70/69, 第二次算 69/70 選擇就變了
03/15 22:54, 4F

03/15 22:59, , 5F
看看第二局跟第四局序盤 我覺得很高機率一樣
03/15 22:59, 5F

03/15 23:13, , 6F
百科大~~
03/15 23:13, 6F

03/15 23:31, , 7F
不會 他用蒙地卡羅搜尋
03/15 23:31, 7F

03/16 01:23, , 8F
如果是通用高勝率的好棋有機會一樣,但其他就未定
03/16 01:23, 8F

03/16 01:25, , 9F
像是有人在討論勝率流人類可能無法複製,其實如果可以多
03/16 01:25, 9F

03/16 01:26, , 10F
次比對電腦的佈局,應該就有辦法推導出勝率高的位置
03/16 01:26, 10F

03/16 01:29, , 11F
我猜實作在seed一樣情況下一定deterministic, 但跨場seed
03/16 01:29, 11F

03/16 01:30, , 12F
有沒有變就不知道 deterministic是要回去覆盤debug
03/16 01:30, 12F

03/16 11:58, , 13F
如果它一定是走盤面勝率最高的棋,那除非多點機率一樣
03/16 11:58, 13F

03/16 11:59, , 14F
不然AG沒理由改變下法,特別序盤佈局更沒理由亂下
03/16 11:59, 14F

03/16 12:00, , 15F
但如果讓AG自己再對下3個月,就有可能改變
03/16 12:00, 15F

03/16 12:01, , 16F
因為該手評估勝率有可能被升降....
03/16 12:01, 16F
文章代碼(AID): #1Mw1vjT7 (GO)
文章代碼(AID): #1Mw1vjT7 (GO)