[討論] 用AlphaGo研究貼目

看板GO (圍棋)作者 (基隆金城武)時間9年前 (2016/03/10 21:52), 編輯推噓13(13014)
留言27則, 18人參與, 最新討論串1/1
小弟17級,各位高段前輩勿鞭。 根據我對圍棋粗淺的理解如下(如有錯請多包涵) 貼目是因為黑棋先手的優勢,因此必須給白子一定程度的補償達到公平。 目前大多為貼 6.5或7.5目為主。(也就是白方目數+6.5或7.5贏黑子即算贏) 然而"事先"了解貼目也是很重要的事情, 因為為了取得不同級別的優勢在對局中需採行的風險和報酬對應曲線也不一樣。 例如如果黑貼2.5目,對白子來說就必須採行相對積極的態度。 但如果黑貼15.5目,則白子可較為保守,幾乎比貼2.5目需要的地小了一大塊。 因此要AlphaGo去自行對弈一千萬場要求AlphaGo計算出最合邏輯的貼目是不太有意義的。 可是也許可以用反向邏輯從AlphaGo上取得資訊? 因為貼目數是離散的(0和自然數+0.5) 所以可以用貼目0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5等等一路測試 例如各打個200萬場之類的? 然後去計算勝率期望值,找出最接近雙方50%的那個貼目數,提供人類圍棋界做參考。 前面好幾篇推文討論過利用AlphaGo編修圍棋規則和勝利條件的可能性, 但是這個方法還沒有人提過,供大家討論。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.115.226 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457617956.A.8A9.html

03/10 21:54, , 1F
我覺得還不錯 我也是這麼想
03/10 21:54, 1F

03/10 21:55, , 2F
我上面也有忘記哪篇有推過 感覺可行
03/10 21:55, 2F

03/10 21:55, , 3F
不行,貼目是為了人類棋手公平,也許電腦執黑要貼10目以上
03/10 21:55, 3F

03/10 21:55, , 4F
五子棋印象中即使採取日規,也是黑先必勝
03/10 21:55, 4F

03/10 21:56, , 5F
電腦對電腦一樣也需要公平啊 這種測試法是可行的
03/10 21:56, 5F

03/10 21:57, , 6F
有一種可能就是貼目的標準會隨著對奕者強度改變
03/10 21:57, 6F

03/10 21:58, , 7F
這樣應該會有三種貼目準則 人人 人機 機機
03/10 21:58, 7F

03/10 21:58, , 8F
這是比較合理的 但是搞不好 沒有50% 附近的
03/10 21:58, 8F

03/10 21:59, , 9F
棋力愈高黑先優勢愈明顯,來看AG對弈小李能否驗證?
03/10 21:59, 9F

03/10 22:01, , 10F
目前只聽過六子棋(台灣發明,YA!)是最公平的
03/10 22:01, 10F

03/10 22:01, , 11F
萬一算出來是貼0.5怎辦? XD
03/10 22:01, 11F

03/10 22:04, , 12F
想看兩台alphago互相對戰,然後產生嶄新的定石
03/10 22:04, 12F

03/10 22:07, , 13F
對,搞不好很多現代定石都是錯的
03/10 22:07, 13F

03/10 22:17, , 14F
其實今天就有啦 尖後高拆 對某些狀況是合理的
03/10 22:17, 14F

03/10 22:19, , 15F
今天就有很多啦…
03/10 22:19, 15F

03/10 22:41, , 16F
如果alphaGO棋力遠高於人類,對它來說先手的優勢要貼
03/10 22:41, 16F

03/10 22:41, , 17F
10.5目,但是套用人類對戰卻變成先手必勝怎麼辦?
03/10 22:41, 17F

03/10 22:42, , 18F
貼目需要越來越多展現人類棋力的進步,但是靠機器去找
03/10 22:42, 18F

03/10 22:43, , 19F
到最佳解並不代表適用在人類對戰上
03/10 22:43, 19F

03/10 22:45, , 20F
實驗是機器對機器 雙方棋力可以視為一樣的
03/10 22:45, 20F

03/10 22:46, , 21F
應該說,也只有機器能夠模擬出兩人一模一樣強的情形
03/10 22:46, 21F

03/10 22:46, , 22F
在這個理想條件下才能真正找到先手的優勢有多少
03/10 22:46, 22F

03/10 23:02, , 23F
貼目本來就有參考職業棋士勝率 然後一直在修改調整
03/10 23:02, 23F

03/11 00:13, , 24F
思考模式不一樣
03/11 00:13, 24F

03/11 05:41, , 25F
聽起來合理 不過前提是人類跟電腦程度一樣
03/11 05:41, 25F

03/11 11:16, , 26F
都是電腦對電腦應該能很有效的取得較公平的貼目數
03/11 11:16, 26F

03/11 21:42, , 27F
人類先手可能沒辦法像電腦一樣發揮優勢
03/11 21:42, 27F
文章代碼(AID): #1MuNmaYf (GO)
文章代碼(AID): #1MuNmaYf (GO)