[閒聊] alphago和自己下百萬棋可能導致自我汙染?

看板GO (圍棋)作者 (Cloud)時間9年前 (2016/03/13 15:42), 9年前編輯推噓4(409)
留言13則, 9人參與, 最新討論串1/1
如題 大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的 那alphago和自己下個幾百萬盤 alphago會不會永遠都選擇變化少的呢? 或者說 變化少的他都下習慣了 變化少的一直打反而勝率一直提高 變化多的很少下反而勝率一直降低 他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢? 自己天生避開劫爭 自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.213.192 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457854937.A.F56.html ※ 編輯: hayuyang (220.136.213.192), 03/13/2016 15:43:12

03/13 15:43, , 1F
我是認為如果勝率低於50%,就會陷入只能選低於50%
03/13 15:43, 1F

03/13 15:44, , 2F
的循環,所以越下越糟
03/13 15:44, 2F

03/13 15:46, , 3F
這種問題誰知道,就等研發團隊測試出來再看看吧
03/13 15:46, 3F

03/13 15:47, , 4F
不會 除非你讓他認為輸的棋是贏
03/13 15:47, 4F

03/13 15:55, , 5F
training data 的 skew 是很基本的概念,不用替專家煩
03/13 15:55, 5F

03/13 15:55, , 6F
惱這個啦XD
03/13 15:55, 6F

03/13 16:03, , 7F
當汙染率達到400%,AlphaGo將跟人類一起變成柳橙汁
03/13 16:03, 7F

03/13 16:09, , 8F
只要勝率不是0,都有可能回升到50%以上
03/13 16:09, 8F

03/13 16:37, , 9F
這是有可能的 但不知道純淨的比較強還是棋譜比較強
03/13 16:37, 9F

03/13 16:37, , 10F
不過現在可能有大BUG
03/13 16:37, 10F

03/13 16:49, , 11F
機器學習的的overfitting是老問題了
03/13 16:49, 11F

03/13 16:50, , 12F
被提掉那八目是重點 就是因為阿發狗亂下一子
03/13 16:50, 12F

03/13 16:50, , 13F
導致八目死棋
03/13 16:50, 13F
文章代碼(AID): #1MvHdPzM (GO)
文章代碼(AID): #1MvHdPzM (GO)