Re: [問題] 為什麼現在AlphaGO開始會"讓"呢?

看板GO (圍棋)作者 (woogee)時間8年前 (2017/05/24 06:48), 編輯推噓2(203)
留言5則, 3人參與, 最新討論串3/5 (看更多)
大家好,我是幾日棋迷,十年程式迷 我的理解和BBSealion大有點類似,不過稍做修正 ※ 引述《BBSealion (Peaceful Warrior)》之銘言: : 大家已經知道電腦看的是勝率了,這是根本原因沒錯 : 但這勝率是怎樣來的才是重點 : 簡單說AlphoGo有兩個系統 : 一個可以靠當下就猜出大概每步棋的價值(可以簡單想成勝率) : 另一個就是,反正我就選一步,然後自己左右互搏下他個上千盤,看勝率多少就好 : 電腦看到什麼呢?他只看到"我怎麼下勝率都接近100%" 這段部分稍做修正,直接打比喻是: 如果你現在突然手上有三個麵包,吃下三個麵包會讓你很爽 人類可能會選擇是,通通吃下去,潮爽der,我吃了三個你沒有~ 但電腦是基於長久、通盤考量(也就是對整體位來存活率最高)的選擇 所以會選擇把多出來的麵包冰起來,做為明天早、午餐 尤其在自我對弈上千、上萬次後,更加深這個神經網路的權重 所以對神經網路來說,在過去幾萬次對弈後,計算穩贏3目、但2目是多餘的 它會選擇在其他地方布局讓未來更穩 以至於看起來像是在"讓",實際上是為了整體的勝率 不知道這樣的比喻洽不洽當QQ 還請小力鞭 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.155.210 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495579738.A.CBA.html

05/24 07:58, , 1F
程式迷講什麼比喻,來個資料結構吼
05/24 07:58, 1F

05/24 09:42, , 2F
這比喻不太對,因為你沒去拿就是會被對方拿走
05/24 09:42, 2F

05/24 09:43, , 3F
BBS的說法比較正確
05/24 09:43, 3F

05/24 19:59, , 4F
這比喻不太恰當,因為下棋是你拿一個麵包,對方就會拿走另
05/24 19:59, 4F

05/24 20:00, , 5F
一個XD 你拿小了對面就會拿大的走
05/24 20:00, 5F
文章代碼(AID): #1P9BnQow (GO)
文章代碼(AID): #1P9BnQow (GO)