[問題] 想問李世石alphago第四戰那一手

看板GO (圍棋)作者 (珊牛)時間7年前 (2018/07/20 15:21), 7年前編輯推噓11(11053)
留言64則, 8人參與, 7年前最新討論串1/1
本身很少在下圍棋但很想知道第四戰李世石對alphago那一場電腦到底是什麼缺陷? 第78手時alphago預判李世石下那手的機率是0.0007 結果下了以後電腦開始亂下 我的問題是: 1.電腦之所以會亂下是因為機率太低、alphago在那樣情況下的棋譜樣本不夠所以alphago不知道該下哪嗎? 2.所以第78手以棋手來看是很笨穩輸的一手嗎?如果是人類棋手對人類棋手李世石第78手會穩輸嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.9.160 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1532071310.A.FF5.html ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:23:24 ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:24:35 ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:27:07

07/20 16:41, 7年前 , 1F
電腦之所以亂下是因為他自認的前幾個選點都找不到
07/20 16:41, 1F

07/20 16:42, 7年前 , 2F
好方法,於是開始找一些對方必定得應的地方來維持
07/20 16:42, 2F

07/20 16:42, 7年前 , 3F
勝率,但是那幾手全部都是虧的,原來的問題還是無法
07/20 16:42, 3F

07/20 16:43, 7年前 , 4F
解決,所以電腦就看起來像是在亂下導致輸棋
07/20 16:43, 4F

07/20 16:43, 7年前 , 5F
而造成的原因確實是因為棋譜樣本不夠
07/20 16:43, 5F

07/20 16:44, 7年前 , 6F
以人類棋手來看,需要一些時間計算來下出正確著手
07/20 16:44, 6F

07/20 16:45, 7年前 , 7F
強職業可能10分鐘就把裡面全部看清了,但如果在時間
07/20 16:45, 7F

07/20 16:45, 7年前 , 8F
緊迫的情況下也有可能應對錯誤,但無論如何都不會像
07/20 16:45, 8F

07/20 16:45, 7年前 , 9F
實戰電腦發瘋那樣慘就是了
07/20 16:45, 9F

07/20 17:59, 7年前 , 10F
所以如果是面對人類棋手而不是電腦的話是不會下出那樣
07/20 17:59, 10F

07/20 17:59, 7年前 , 11F
的78手嗎?
07/20 17:59, 11F

07/20 18:05, 7年前 , 12F
所以這樣評論對嗎「這場本應是穩穩的由alphago勝出,但
07/20 18:05, 12F

07/20 18:05, 7年前 , 13F
李世石靠著人類不會犯的錯的電腦漏洞而產生逆轉」
07/20 18:05, 13F

07/20 19:07, 7年前 , 14F
不,不會因為對方是誰就下出怎樣的棋步,同樣的盤面,
07/20 19:07, 14F

07/20 19:07, 7年前 , 15F
不論對手是誰,自己想出的最佳解都是一樣的
07/20 19:07, 15F

07/20 19:07, 7年前 , 16F
面對人類棋手也會下78手,因為李世石也是選最複雜
07/20 19:07, 16F

07/20 19:07, 7年前 , 17F
對方如果是人類,小李不會這樣下
07/20 19:07, 17F

07/20 19:08, 7年前 , 18F
的下,這場也是應該由alphago穩穩勝出
07/20 19:08, 18F

07/20 19:08, 7年前 , 19F
看小李一直忍住不斷就覺得心裡有需影響
07/20 19:08, 19F

07/20 19:08, 7年前 , 20F
除非是實力有落差要故意退讓
07/20 19:08, 20F

07/20 19:09, 7年前 , 21F
否則對電腦來說,你從第一步就是不成立的
07/20 19:09, 21F

07/20 19:09, 7年前 , 22F
應該說第四盤一開始的策略就是刻意營造出來的,所以
07/20 19:09, 22F

07/20 19:09, 7年前 , 23F
前面對人類不會這樣下,不過78手對李世石應該是唯一
07/20 19:09, 23F

07/20 19:10, 7年前 , 24F
一手
07/20 19:10, 24F

07/20 19:10, 7年前 , 25F
靠BUG也是獲勝,不會有人去否定那一場的勝利
07/20 19:10, 25F

07/20 19:10, 7年前 , 26F
所以重點不在於是人還是電腦,而是你知道自己和對手的
07/20 19:10, 26F

07/20 19:10, 7年前 , 27F
棋力後擬出的策略
07/20 19:10, 27F

07/20 19:11, 7年前 , 28F
人類本來就會因為對手而選擇不一樣的下法
07/20 19:11, 28F

07/20 19:47, 7年前 , 29F
那時候的電腦就是還沒完全體,現在版的下幾手就會自己投了
07/20 19:47, 29F

07/20 19:50, 7年前 , 30F
李那手在電腦意料外原本就算得少,然後又算錯就開始崩了
07/20 19:50, 30F

07/21 05:30, 7年前 , 31F
用人類的說法就是,AlphaGo沒排過這個定石或手筋,臨場又
07/21 05:30, 31F

07/21 05:31, 7年前 , 32F
來不及算出來所以爆破了
07/21 05:31, 32F

07/21 05:34, 7年前 , 33F
至於為什麼爆破後會看起來亂下,我在 #1P_VopGM 有做比較
07/21 05:34, 33F

07/21 05:34, 7年前 , 34F
詳細的解釋
07/21 05:34, 34F

07/21 05:35, 7年前 , 35F
一樓說「找必應的地方來維持勝率」我個人覺得不算是最正確
07/21 05:35, 35F

07/21 05:37, 7年前 , 36F
的解釋,不過以人來解讀是一定程度可以那麼解釋
07/21 05:37, 36F

07/21 06:00, 7年前 , 37F
樓上是不是搞錯了?這篇專門討論第4局78手
07/21 06:00, 37F

07/21 19:42, 7年前 , 38F
我並沒有搞錯啊,那一挖造成的後續詭異下法本來就是這一類
07/21 19:42, 38F

07/21 19:42, 7年前 , 39F
的問題
07/21 19:42, 39F

07/21 19:42, 7年前 , 40F
「找必應的地方來維持勝率」這個說法是人為解讀過的加料,
07/21 19:42, 40F

07/21 19:42, 7年前 , 41F
事實上就是「維持勝率」而已,AI並不會特別去想什麼必應不
07/21 19:42, 41F

07/21 19:44, 7年前 , 42F
必應的,只不過在當下情況,飲鳩止渴的必應手剛好會是最能
07/21 19:44, 42F

07/21 19:44, 7年前 , 43F
帶來「維持現狀」假象的下法而已
07/21 19:44, 43F

07/21 19:46, 7年前 , 44F
勝率暫時掉最少就被視為是目前最佳著手而已
07/21 19:46, 44F

07/21 20:30, 7年前 , 45F
「找必應的地方來維持勝率」只是描述行為結果,也沒
07/21 20:30, 45F

07/21 20:31, 7年前 , 46F
加料
07/21 20:31, 46F

07/22 16:50, 7年前 , 47F
我不是說你真的講錯了,但是這句就是太過人為解讀後的結果
07/22 16:50, 47F

07/22 16:51, 7年前 , 48F
假設有一處著手對方沒有必應,但是剛好勝率就跟所謂必應之
07/22 16:51, 48F

07/22 16:52, 7年前 , 49F
處維持差不多,AI一樣會去選擇這個著手,它並沒有刻意去選
07/22 16:52, 49F

07/22 16:52, 7年前 , 50F
必應之處
07/22 16:52, 50F

07/22 16:52, 7年前 , 51F
只是因為下到這種局面很有可能「只剩」必應之處不會太快掉
07/22 16:52, 51F

07/22 16:54, 7年前 , 52F
勝率,所以才會表現出只下這些地方,因果是相反的
07/22 16:54, 52F

07/23 19:15, 7年前 , 53F
應該說電腦不會打亂局面這種下法,那時候就是被逼到沒
07/23 19:15, 53F

07/23 19:15, 7年前 , 54F
琪了卻不會認輸吧?
07/23 19:15, 54F

07/23 19:53, 7年前 , 55F
也是理由之一。AI其實並不知道什麼局面複不複雜,所以也沒
07/23 19:53, 55F

07/23 19:54, 7年前 , 56F
有什麼就算勝率低但是複雜亂戰的思考方向,它找不出那種人
07/23 19:54, 56F

07/23 19:55, 7年前 , 57F
類思維中雖然並非最佳著手但可以亂戰一拚的勝負手概念
07/23 19:55, 57F

07/24 09:28, 7年前 , 58F
3天版的AG Zero跟李世石版對奕已經100盤100連勝
07/24 09:28, 58F

07/24 09:29, 7年前 , 59F
是自己對奕而來,並非由李世石版本進化,無版本演進剋制問
07/24 09:29, 59F

07/24 09:30, 7年前 , 60F
題!是可以討論第78手,但那也只是曾勝過李世石版的指標!
07/24 09:30, 60F

07/24 09:32, 7年前 , 61F
真要研究,相信黃士傑博士早有答案,之前他也說過,Master
07/24 09:32, 61F

07/24 09:33, 7年前 , 62F
跟Zero版都已克服這一手的問題,接著下都不會有亂下的狀
07/24 09:33, 62F

07/24 09:34, 7年前 , 63F
況。真要研究的話,請dp用出變化棋譜可能有些麻煩,但LZ這
07/24 09:34, 63F

07/24 09:34, 7年前 , 64F
個免費軟體,不知道有沒有人拿來試過?
07/24 09:34, 64F
文章代碼(AID): #1RKOsE_r (GO)
文章代碼(AID): #1RKOsE_r (GO)