[問題] 可否更改alphago的設定

看板GO (圍棋)作者 (阿呆名)時間9年前 (2016/03/10 23:53), 編輯推噓25(26176)
留言103則, 20人參與, 最新討論串1/4 (看更多)
其實現在很明顯可以看出來 基本上alphago可以控制勝率最高的著法贏7目以上 但這樣我們無法知道alphago真正的實力 是不是可以改成讓兩顆或60%勝率以上的情況追求最大目數呢? 這樣會不會更有看頭 不然未來棋手都是被慢性屠殺 看了也挺難過唉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.106.128 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457625222.A.2A4.html

03/10 23:57, , 1F
這個的說法只是在問讓幾子而已阿...
03/10 23:57, 1F

03/10 23:57, , 2F
想太多 是小李下得臭 不是AI有多強
03/10 23:57, 2F

03/10 23:58, , 3F
讓兩顆XD
03/10 23:58, 3F

03/11 00:02, , 4F
我必須很客觀的說....兩邊棋手的內容完全是不是不同
03/11 00:02, 4F

03/11 00:02, , 5F
水平....
03/11 00:02, 5F

03/11 00:03, , 6F
棋城8d 不會下棋應該還是會看一些xD
03/11 00:03, 6F

03/11 00:06, , 7F
樓上我也棋城8d 很明顯這兩盤不是小李的水平呀
03/11 00:06, 7F

03/11 00:07, , 8F
AI的棋沒有到讓我看不懂 或 害怕的地步
03/11 00:07, 8F

03/11 00:09, , 9F
甚至有些是一看就 啥 這下得出手.....
03/11 00:09, 9F

03/11 00:10, , 10F
最可怕的就是它已經快贏了才下的出來你看的懂的啊
03/11 00:10, 10F

03/11 00:10, , 11F
03/11 00:10, 11F

03/11 00:11, , 12F
如果一開始就讓兩顆 下法就不一定一樣了
03/11 00:11, 12F

03/11 00:11, , 13F
如果今天alphago被讓兩顆或落後 中間白棋說不定就被
03/11 00:11, 13F

03/11 00:11, , 14F
屠了
03/11 00:11, 14F

03/11 00:12, , 15F
其實根本沒那麼神 棋聖也是一手一手下 反正我是放心了
03/11 00:12, 15F

03/11 00:12, , 16F
AI的棋力不可能超過我所認知的棋聖水平
03/11 00:12, 16F

03/11 00:14, , 17F
就像alphago有可能是已經勝定樊灰 才下臭棋
03/11 00:14, 17F

03/11 00:14, , 18F
另一版的電腦對上alphago勝率77%
03/11 00:14, 18F

03/11 00:16, , 19F
給世界頂尖棋士讓子,你要讓他們失業嗎?
03/11 00:16, 19F

03/11 00:18, , 20F
這版已經是分散式的了,不是單機版
03/11 00:18, 20F

03/11 00:18, , 21F
其實客觀說兩盤到中盤前李都有優勢或平局,電腦可怕的是後
03/11 00:18, 21F

03/11 00:19, , 22F
半幾乎不會有失誤
03/11 00:19, 22F

03/11 00:20, , 23F
平局是我們看的....轉播也是一堆錯誤
03/11 00:20, 23F

03/11 00:21, , 24F
說不定alphago早就判定贏10目提早收工了
03/11 00:21, 24F

03/11 00:25, , 25F
有些棋好壞很明顯的不能結果論,兩盤的左下角電腦選的變化
03/11 00:25, 25F

03/11 00:25, , 26F
都不會是好棋,不能說它最後因為李的其他失誤贏了所以就對
03/11 00:25, 26F

03/11 00:26, , 27F
不是好棋 但是不影響勝負 對AlphaGO 來說沒差的
03/11 00:26, 27F

03/11 00:28, , 28F
不影響勝負只是因為人類之後犯的錯更嚴重阿:D
03/11 00:28, 28F

03/11 00:29, , 29F
這件事就值得深思了。不影響勝負的臭棋真的臭嗎?
03/11 00:29, 29F

03/11 00:29, , 30F
對阿發狗來說,人類犯不犯錯都無關他「上一手」的運算啊
03/11 00:29, 30F

03/11 00:29, , 31F
阿發狗也算不出人類下一手會犯錯,因此人類犯錯是人類的
03/11 00:29, 31F

03/11 00:30, , 32F
事,阿發狗計算的只有當前「該怎麼下勝率最大」。
03/11 00:30, 32F

03/11 00:34, , 33F
我的意思是贏電腦不是沒機會,像昨天中盤李領先,不管人或
03/11 00:34, 33F

03/11 00:35, , 34F
電腦來判斷應該都一樣,所以電腦才需要打入那手
03/11 00:35, 34F

03/11 00:36, , 35F
不然若電腦覺得自己優勢應該要下些簡明棋更高機率邁向勝利
03/11 00:36, 35F

03/11 00:36, , 36F
沒歐 第一盤電腦一直都當102 是他的權利, 看看Zen的分數
03/11 00:36, 36F

03/11 00:37, , 37F
第一盤的80 應該就是準備 102 的下法
03/11 00:37, 37F

03/11 00:37, , 38F
別說zen了,兩個程式等級差多少:D zen判斷夠強就換他來打了
03/11 00:37, 38F

03/11 00:38, , 39F
102後如果李處理較好也還是優勢
03/11 00:38, 39F
還有 24 則推文
03/11 01:00, , 64F
後來才發現是假象
03/11 01:00, 64F

03/11 01:00, , 65F
呃,若是如此的話,那怎麼說102之後誰都看得出來黑棋大
03/11 01:00, 65F

03/11 01:00, , 66F
劣 = =
03/11 01:00, 66F

03/11 01:04, , 67F
Zen 下不了前段, 但是後段的valuation 應該很接近
03/11 01:04, 67F

03/11 01:04, , 68F
我認為大家對於102前的形勢判斷是錯的
03/11 01:04, 68F

03/11 01:04, , 69F
評論是說115有點緩 讓116占到形勢就歪過去了
03/11 01:04, 69F

03/11 01:04, , 70F
而白棋早就把102算進去了
03/11 01:04, 70F

03/11 01:05, , 71F
78, 102 應該很早就在AlphaGO 考慮的Tree 裡了
03/11 01:05, 71F

03/11 01:05, , 72F
123讓白活整個角也被評不佳
03/11 01:05, 72F

03/11 01:08, , 73F
72, 74, 76 時 大概就已經有算出來了
03/11 01:08, 73F

03/11 01:09, , 74F
同意lwei781大的觀點。
03/11 01:09, 74F

03/11 01:31, , 75F
好多鍵盤九段喔
03/11 01:31, 75F

03/11 02:39, , 76F
好多鍵盤十段
03/11 02:39, 76F

03/11 04:20, , 77F
高手看得更遠,結果被其他人當成沒下好
03/11 04:20, 77F

03/11 08:03, , 78F
讓幾子不需要額外的設定,這跟它的結構無關。
03/11 08:03, 78F

03/11 08:05, , 79F
追求贏最多子目前架構是沒有,只考慮輸或贏。要增加
03/11 08:05, 79F

03/11 08:05, , 80F
應該有辦法,
03/11 08:05, 80F

03/11 08:17, , 81F
想請問一下AlphaGo是追求勝率不是追求勝差這個的來源,
03/11 08:17, 81F

03/11 08:18, , 82F
沒有追新聞,不過稍微翻了一下論文沒有發現,感謝XD
03/11 08:18, 82F

03/11 09:05, , 83F
看接下來幾場阿法狗還有沒有下臭棋吧
03/11 09:05, 83F

03/11 09:07, , 84F
假如之後開局還是有表示有些理解可能要重新思考
03/11 09:07, 84F

03/11 09:51, , 85F
2nd page, Reinforcement Learning of policy networ
03/11 09:51, 85F

03/11 09:51, , 86F
ks
03/11 09:51, 86F

03/11 09:52, , 87F
We use a reward function r(s) that is zero for al
03/11 09:52, 87F

03/11 09:52, , 88F
l
03/11 09:52, 88F

03/11 09:52, , 89F
non-terminal time steps t < T. The outcome zt =
03/11 09:52, 89F

03/11 09:52, , 90F
넠r(sT) is the terminal
03/11 09:52, 90F

03/11 09:52, , 91F
reward at the end of the game from the perspectiv
03/11 09:52, 91F

03/11 09:52, , 92F
e of the current
03/11 09:52, 92F

03/11 09:52, , 93F
player at time step t: +1 for winning and for lo
03/11 09:52, 93F

03/11 09:53, , 94F
-1 for losing
03/11 09:53, 94F

03/11 09:57, , 95F
也不是追求勝率,看得懂Fig. 5?
03/11 09:57, 95F

03/11 09:58, , 96F
the algorithm chooses the most visited move from
03/11 09:58, 96F

03/11 09:58, , 97F
the root position
03/11 09:58, 97F

03/11 11:43, , 98F
很難相信棋城8d會講這種話
03/11 11:43, 98F

03/11 12:01, , 99F
我不認為李世石真的下的很糟
03/11 12:01, 99F

03/11 12:01, , 100F
我想知道alphago到底有沒有犯我們所謂的失誤
03/11 12:01, 100F

03/11 12:44, , 101F
等五番勝負比完再談也不遲
03/11 12:44, 101F

03/11 13:42, , 102F
推 sky0302: 想太多 是小李下得臭 不是AI有多強 wwwww
03/11 13:42, 102F

03/11 21:30, , 103F
地獄模式關掉換monkey嗎
03/11 21:30, 103F
文章代碼(AID): #1MuPY6Aa (GO)
文章代碼(AID): #1MuPY6Aa (GO)