Re: [好文推薦] 這兩盤棋 沒人會比李世石做得好

看板GO (圍棋)作者 (笨魚)時間9年前 (2016/03/12 09:35), 9年前編輯推噓4(6222)
留言30則, 6人參與, 最新討論串7/8 (看更多)
※ 引述《nnlisalive (nnlisalive)》之銘言: : 我覺得要從程式碼方面下手了 : 首先就是阿發狗所謂的"勝率"是怎計算出來的? : 不外乎用盤面上所得到的資訊轉換成數據 : 再代入勝率函數得到每一點的勝率 : 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點? : 算出來的勝率沒有誤差? 如果有個點勝率是70% : 具體來說應該是下了這個點跑到結束N次 有0.7*N次會贏 : 但明明就還沒下完 也不知道對方會怎下 : 所以只要能騙過電腦 讓他一直下到誤判勝率的棋 : 阿發狗就會輸到怎死的都不知道了 : 問題是要怎騙過阿法狗? : 我 不 知 道 ! AlphaGO "勝率"計算大約是 最原始概念 假設現在盤面上AlphaGO有ABCDE五個地方值得下 就對ABCDE這個五位置後續各往後 快速隨機亂下1000盤 一直下到官子結束看最後贏幾盤 假設結果 A位置 贏830盤 輸170盤 B位置 贏750盤 輸250盤 C位置 贏640盤 輸360盤 D位置 贏912盤 輸 88盤 E位置 贏120盤 輸880盤 電腦不會管平均贏了幾目只看輸贏 最後就會選位置D ================================== 當然圍棋"隨機亂下"一千盤參價值可能有限 接下來做的就是讓 "隨機亂下1000盤"變成"快速下出1000盤有參考價值的棋" MCTS圍棋的棋力就建構在 "隨機亂下"階段 有意義的落子選擇還有快速下完那1000盤的棋局質量 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.48.185 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457746522.A.327.html ※ 編輯: saltfish (114.25.48.185), 03/12/2016 09:36:17

03/12 09:54, , 1F
原來如此 要有價值就是慢 而且夠多盤的機率越準
03/12 09:54, 1F

03/12 09:55, , 2F
這樣看來電腦還是在用窮舉法逼近圍棋之神
03/12 09:55, 2F

03/12 09:56, , 3F
只是這次的窮舉法比較聰明 加進了機率與統計
03/12 09:56, 3F

03/12 09:57, , 4F
圍棋就是變化複雜的特性 正好讓用機率來計算落子的
03/12 09:57, 4F

03/12 09:58, , 5F
AlphaGo變得超級強
03/12 09:58, 5F

03/12 09:58, , 6F
這種"窮舉"已經很像人了 是一種經驗累積 只是比較無腦的經
03/12 09:58, 6F

03/12 10:01, , 7F
這篇錯的 value network is used to reduce
03/12 10:01, 7F

03/12 10:02, , 8F
the depth of the search tree
03/12 10:02, 8F

03/12 10:09, , 9F
AlphaGo透過輸入的棋譜跟自我對戰 學習兩件事
03/12 10:09, 9F

03/12 10:10, , 10F
1.哪裡可能值得下 2.形勢判斷
03/12 10:10, 10F

03/12 10:12, , 11F
簡略化的概念的確如本篇所說
03/12 10:12, 11F

03/12 10:12, , 12F
AG強的地方在於,他有能力能判斷「哪些位置需要去測勝率
03/12 10:12, 12F

03/12 10:12, , 13F
他沒有把棋下到end game 而是用形勢判斷
03/12 10:12, 13F
傳統象棋人工智慧還有 GNUGO圍棋AI 確實是以形勢判斷 前幾天上網查黃士傑的博士論文ERICA的架構 才發現現在的圍棋MTCS "隨機亂下N盤"確實是做到end game

03/12 10:13, , 14F
」這件事,因此需要消耗大量資源與時間的全盤式隨機落子
03/12 10:13, 14F

03/12 10:14, , 15F
以及算完所有分支樹的狀況在AG的考量下不會發生。
03/12 10:14, 15F

03/12 10:20, , 16F
To clark78118: The second rollout phase of each
03/12 10:20, 16F

03/12 10:20, , 17F
simulation begins at leaf node sL and continues
03/12 10:20, 17F

03/12 10:20, , 18F
until the end of the game. 他有算完啦XD
03/12 10:20, 18F

03/12 10:21, , 19F
只是它不只快速算完,也用了你說的形勢判斷
03/12 10:21, 19F

03/12 10:22, , 20F
我之前po文的時候自己也沒看懂...剛才才去改@@
03/12 10:22, 20F

03/12 10:36, , 21F
原po說這是原始概念也對,paper分析說這部分影響最大
03/12 10:36, 21F

03/12 10:38, , 22F
我覺得深度學習帶來的新能力是: 可以在極短時間不計算而
03/12 10:38, 22F

03/12 10:38, , 23F
做出業餘初段等級的直覺判斷。想像如果人類可以用0.01秒
03/12 10:38, 23F

03/12 10:39, , 24F
做到業餘初段等級的判斷,那加上計算就不得了了。
03/12 10:39, 24F
※ 編輯: saltfish (114.25.48.185), 03/12/2016 10:48:03

03/12 10:48, , 25F
有講到是三段等級的
03/12 10:48, 25F

03/12 10:49, , 26F

03/12 10:52, , 27F
連結,搜 Table 7,剛好看到跑勝率圖
03/12 10:52, 27F

03/12 11:01, , 28F
感謝,我說業餘初段完全是個隨意估計,抱歉@@
03/12 11:01, 28F

03/12 11:02, , 29F
不過我覺得DarkForest在這點還是很難超出職業棋評?
03/12 11:02, 29F

03/12 11:08, , 30F
剛對了一下第二盤步數,6446開時,講評也是眾說紛紜
03/12 11:08, 30F
文章代碼(AID): #1Mut9QCd (GO)
討論串 (同標題文章)
文章代碼(AID): #1Mut9QCd (GO)