[討論] 用AlphaGo研究貼目
小弟17級,各位高段前輩勿鞭。
根據我對圍棋粗淺的理解如下(如有錯請多包涵)
貼目是因為黑棋先手的優勢,因此必須給白子一定程度的補償達到公平。
目前大多為貼 6.5或7.5目為主。(也就是白方目數+6.5或7.5贏黑子即算贏)
然而"事先"了解貼目也是很重要的事情,
因為為了取得不同級別的優勢在對局中需採行的風險和報酬對應曲線也不一樣。
例如如果黑貼2.5目,對白子來說就必須採行相對積極的態度。
但如果黑貼15.5目,則白子可較為保守,幾乎比貼2.5目需要的地小了一大塊。
因此要AlphaGo去自行對弈一千萬場要求AlphaGo計算出最合邏輯的貼目是不太有意義的。
可是也許可以用反向邏輯從AlphaGo上取得資訊?
因為貼目數是離散的(0和自然數+0.5)
所以可以用貼目0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5等等一路測試
例如各打個200萬場之類的?
然後去計算勝率期望值,找出最接近雙方50%的那個貼目數,提供人類圍棋界做參考。
前面好幾篇推文討論過利用AlphaGo編修圍棋規則和勝利條件的可能性,
但是這個方法還沒有人提過,供大家討論。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.115.226
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457617956.A.8A9.html
推
03/10 21:54, , 1F
03/10 21:54, 1F
→
03/10 21:55, , 2F
03/10 21:55, 2F
→
03/10 21:55, , 3F
03/10 21:55, 3F
→
03/10 21:55, , 4F
03/10 21:55, 4F
→
03/10 21:56, , 5F
03/10 21:56, 5F
→
03/10 21:57, , 6F
03/10 21:57, 6F
→
03/10 21:58, , 7F
03/10 21:58, 7F
推
03/10 21:58, , 8F
03/10 21:58, 8F
推
03/10 21:59, , 9F
03/10 21:59, 9F
→
03/10 22:01, , 10F
03/10 22:01, 10F
推
03/10 22:01, , 11F
03/10 22:01, 11F
推
03/10 22:04, , 12F
03/10 22:04, 12F
→
03/10 22:07, , 13F
03/10 22:07, 13F
推
03/10 22:17, , 14F
03/10 22:17, 14F
推
03/10 22:19, , 15F
03/10 22:19, 15F
推
03/10 22:41, , 16F
03/10 22:41, 16F
→
03/10 22:41, , 17F
03/10 22:41, 17F
→
03/10 22:42, , 18F
03/10 22:42, 18F
→
03/10 22:43, , 19F
03/10 22:43, 19F
→
03/10 22:45, , 20F
03/10 22:45, 20F
推
03/10 22:46, , 21F
03/10 22:46, 21F
→
03/10 22:46, , 22F
03/10 22:46, 22F
推
03/10 23:02, , 23F
03/10 23:02, 23F
推
03/11 00:13, , 24F
03/11 00:13, 24F
→
03/11 05:41, , 25F
03/11 05:41, 25F
推
03/11 11:16, , 26F
03/11 11:16, 26F
推
03/11 21:42, , 27F
03/11 21:42, 27F
GO 近期熱門文章
PTT遊戲區 即時熱門文章