Re: [心得] 圍棋AI AlphaGo 之我見

看板GO (圍棋)作者 (天堂的定義)時間9年前 (2016/03/14 16:18), 9年前編輯推噓4(4014)
留言18則, 10人參與, 最新討論串4/6 (看更多)
1. 據說 AlphaGo用到的Neuro Network深達13層 有任何穩定性的報告或是說明嗎? 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝 AlphaGo的設計應該是循著第一條路線 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜 反敗為勝的棋譜應該非常多用的是勝負手(或是無理手) 不曉得這會不會是AlphaGo昨天崩潰的原因? 3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開 重新訓練時只採用第一種壓著打或是完勝的棋譜 也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.12.82 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457943491.A.16B.html

03/14 16:19, , 1F
AG設計團隊的理念應該是要盡量消除人類的影響因素 (?
03/14 16:19, 1F

03/14 16:20, , 2F
好像有可能
03/14 16:20, 2F

03/14 16:21, , 3F
所謂的13層應該是指AG的神經網路中的隱藏層有13層吧
03/14 16:21, 3F

03/14 16:22, , 4F
2.3點不會有衝突嗎?
03/14 16:22, 4F

03/14 16:22, , 5F
我覺得很多人都想太多了, AlphaGO 根本不是在下圍棋
03/14 16:22, 5F

03/14 16:22, , 6F
中間的參數設定沒看到有人介紹過(多數人應該也沒興趣)
03/14 16:22, 6F

03/14 16:22, , 7F
它只是在進行"從過去棋譜和自我對奕學到的一種數學計算"
03/14 16:22, 7F

03/14 16:23, , 8F
像估值網路的訓練可以說是從白紙一張開始 沒人說的清楚
03/14 16:23, 8F

03/14 16:24, , 9F
怎麼訓練法結果會比較好(絕對不是亂倒棋譜進去)
03/14 16:24, 9F

03/14 16:29, , 10F
誰也不知道之後棋譜洗掉的alphaGO會變的如何?
03/14 16:29, 10F

03/14 16:31, , 11F
希望是成為以宇宙流為主的棋手,但人類就難以模仿
03/14 16:31, 11F

03/14 16:41, , 12F
如果演算法真的能創造出典範轉移 難以模仿也可以喲~~
03/14 16:41, 12F

03/14 16:42, , 13F
期待今後AlphaGo發展出宇宙流的死活題給大家解
03/14 16:42, 13F
※ 編輯: mathbug (180.177.12.82), 03/14/2016 16:46:16

03/14 17:02, , 14F
簡單來說昨天ag應該是沒有意識到出棋了 才會下ㄧ堆損棋
03/14 17:02, 14F

03/14 17:58, , 15F
3.的話誰來判斷呢?2.的話我覺得會有負面影響,但自我學習
03/14 17:58, 15F

03/14 17:58, , 16F
有機會把那些負面影響扳回來
03/14 17:58, 16F

03/14 20:00, , 17F
3的確是棘手的問題,大數據的labelling,可用value network
03/14 20:00, 17F

03/14 20:01, , 18F
試試
03/14 20:01, 18F
文章代碼(AID): #1MvdF35h (GO)
文章代碼(AID): #1MvdF35h (GO)