Re: [好文推薦] 這兩盤棋 沒人會比李世石做得好

看板GO (圍棋)作者 (nnlisalive)時間9年前 (2016/03/11 20:19), 9年前編輯推噓5(5016)
留言21則, 6人參與, 最新討論串2/8 (看更多)
※ 引述《raiderho (冷顏冷雨)》之銘言: : 依本文說法,AlphaGo的臭棋 (人類認定) 有三種可能性,而且都已經發生了: : 其一,在電腦判定的獲勝機率已經非常高時, : 不同下法對機率的影響會鈍化,可能只是99.9%與99.91%的差別而已, : 而算法設計可能會讓非最佳解更容易被隨機挑到。 : 這種非最佳解,就是真正的臭棋 (邏輯上為嚴格劣勢策略)。 : 然而,若以上敘述為真,當電腦下出明顯臭棋時,電腦應該已經大幅佔優了。 : 相反的,情勢還在膠著時,下錯會讓獲勝機率大幅降低, : 臭棋被挑中的機率近乎為零,這時,我們會看到非常緊繃的對局。 : 這一點呼應「遇強則強,遇弱則弱」。 : (最後一句不是指李和樊的差距,因為電腦棋力這幾個月增加不少); 我覺得要從程式碼方面下手了 首先就是阿發狗所謂的"勝率"是怎計算出來的? 不外乎用盤面上所得到的資訊轉換成數據 再代入勝率函數得到每一點的勝率 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點? 算出來的勝率沒有誤差? 如果有個點勝率是70% 具體來說應該是下了這個點跑到結束N次 有0.7*N次會贏 但明明就還沒下完 也不知道對方會怎下 所以只要能騙過電腦 讓他一直下到誤判勝率的棋 阿發狗就會輸到怎死的都不知道了 問題是要怎騙過阿法狗? 我 不 知 道 ! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.234.32 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457698770.A.68D.html

03/11 20:24, , 1F
問題是現在是電腦丟出讓人誤判局勢的子比較多吧
03/11 20:24, 1F

03/11 20:25, , 2F
你都判不出電腦的騙子 怎麼可能反騙
03/11 20:25, 2F

03/11 20:26, , 3F
你的內容剛好就是阿發最厲害的武器啊XD
03/11 20:26, 3F

03/11 20:33, , 4F
他的類神經網路太難分析了 只看程式碼沒用
03/11 20:33, 4F
我想表示的是 現在不是都說電腦會選擇90%勝 多贏1目 而不是70%勝 多贏5目的位置下嗎? 但是當電腦在做這麼選擇時 明明還沒下完 多5目勝率在邏輯上不是比較高嗎? 所以我覺得是這是程式上的漏洞也就是AlphaGo的失誤 源自於當時盤面給他的資訊代入勝率函數後 產生錯誤 但為何最後AlphaGo還是贏 因為電腦每一手之間並沒有邏輯上的連續 但是人類每一手都有承先啟後的想法 所以李應該是猜不透電腦的思考而造成自己思考混亂 電腦只會根據目前盤面去思考 用目前得到的資訊去跑分支 所以剛剛的錯誤判斷在下一回合會立即被修正回來 加上電腦跑分支這種局部運算能力很強 讓人類有種 說不定這不是誤手的錯覺 然而 電腦會在什麼時候產生誤判一定有共通性 這種共通性被找出來 AlphaGo大概要再回去閉關修練了 畢竟程式碼是死的 ※ 編輯: nnlisalive (1.172.234.32), 03/11/2016 20:50:55

03/11 20:34, , 5F
人類要把超級電腦運算的東西看過一遍,頭髮就白了
03/11 20:34, 5F

03/11 20:35, , 6F
AG的電腦運算速度估計有10^15浮點運算,你看得完嗎?
03/11 20:35, 6F

03/11 20:38, , 7F
由這種類神經網路弄出來的,通常都只能知道結果,而沒
03/11 20:38, 7F

03/11 20:38, , 8F
辦法準確了解為什麼
03/11 20:38, 8F

03/11 20:48, , 9F
其實承認電腦比人強也沒什麼 複雜的數學運算一但用電
03/11 20:48, 9F

03/11 20:48, , 10F
腦程式建立一樣比最強數學高手準確 也沒什
03/11 20:48, 10F

03/11 20:49, , 11F
但是這種對戰就顯得有點無趣 沒有心理素質
03/11 20:49, 11F

03/11 20:50, , 12F
好像葉問跟阿諾機械人對打...
03/11 20:50, 12F

03/11 21:43, , 13F
因為AG的演算法是選勝率最高,而不是選贏最多目的設定
03/11 21:43, 13F

03/11 23:12, , 14F
Deep Learning 需要有data來train參數 光看程式碼不一定
03/11 23:12, 14F

03/11 23:12, , 15F
調得好
03/11 23:12, 15F

03/11 23:32, , 16F
Alphago的邏輯沒錯,因為每一步棋後續還會有許多發展,不會
03/11 23:32, 16F

03/11 23:34, , 17F
只有百分之九十機率贏一目,百分之十輸棋兩種狀況。實際情
03/11 23:34, 17F

03/11 23:36, , 18F
況是贏半機率XXX,贏一目半XXX,贏兩目半XXX........,輸半
03/11 23:36, 18F

03/11 23:39, , 19F
目機率XXX,輸一目半XXX......。比較恰當的說法是這樣。當
03/11 23:39, 19F

03/11 23:41, , 20F
第一種情況是勝率90%,期望值贏一目。第二種是勝率70%,期
03/11 23:41, 20F

03/11 23:42, , 21F
望值贏五目。Alphago會選擇前者。
03/11 23:42, 21F
文章代碼(AID): #1MuhVIQD (GO)
討論串 (同標題文章)
文章代碼(AID): #1MuhVIQD (GO)