[情報] 樊麾+AlphaGo > AlphaGo

看板GO (圍棋)作者 (AirOctopus)時間8年前 (2017/03/08 18:10), 編輯推噓20(22258)
留言82則, 18人參與, 最新討論串1/1
四個月前 Demis Hassabis 在RSA Events演講,有聽眾問他: 「李世石 + AlphaGo能打贏AlphaGo嗎?」 Demis Hassabis說可以,而且他們有請樊麾測試過,樊麾 + V18 AlphaGO > V18 AlphaGO 當時狀況就是,樊麾大部分都下AlphaGO推薦的棋步,然後偶而覺得有更好棋步的時候, 就變招下樊麾覺得更好的棋步,結果是這樣可以贏AlphaGO。 https://soundcloud.com/the_rsa/artificial-intelligence-and-the-future#t=46m48s 就跟進藤光+塔矢名人 > Sai(近藤光有看到名人變招能贏的步數)一樣道理, 也跟近藤光 + Sai > Sai(近藤光常常下出讓Sai覺得意外的好棋)一樣道理, 可見樊麾 = 近藤光。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.78.25 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1488967829.A.5F1.html

03/08 19:01, , 1F
這結果不意外
03/08 19:01, 1F

03/08 19:10, , 2F
....
03/08 19:10, 2F

03/08 20:06, , 3F
這打臉了版上之前那些把AG當神 每一手都當正確的人
03/08 20:06, 3F

03/08 20:07, , 4F
頂多得到樊麾>0與近籐光>0,最後一個等式毫無邏輯
03/08 20:07, 4F

03/08 21:26, , 5F
合理,本來AlphaGo就並沒有達到圍棋之神,而人類累積的下
03/08 21:26, 5F

03/08 21:27, , 6F
法跟思考方向也並不是都錯的,其中必然還是有很多人類著手
03/08 21:27, 6F

03/08 21:27, , 7F
更好的情況,只不過全盤累積下來AlphaGo平均做得更好罷了
03/08 21:27, 7F

03/08 21:28, , 8F
AlphaGo的下法是「值得研究」而不是「他下的都對」
03/08 21:28, 8F

03/08 21:30, , 9F
覺得這個實驗超有意義
03/08 21:30, 9F

03/08 22:19, , 10F
原因就是算不準的時候 人類靠棋感下 alphago有利
03/08 22:19, 10F

03/08 22:19, , 11F
算得準的時候 人類經驗法則反而有利
03/08 22:19, 11F

03/09 03:33, , 12F
蠻有意思的 之前是不是柯潔還是古大力說用相談棋打AG 然後
03/09 03:33, 12F

03/09 03:34, , 13F
有九段說相談棋其實也沒強很多 主要是討論可以補足沒想到
03/09 03:34, 13F

03/09 03:35, , 14F
但樊麾和AG應該不能相談吧? 可是樊麾+AG依然比較強 可見AG
03/09 03:35, 14F

03/09 03:36, , 15F
應該還是錯誤百出處處漏洞 只是大家沒算出破法而已?
03/09 03:36, 15F

03/09 03:39, , 16F
可能你明明有比較好的一手 可是後面應對就是不如AG
03/09 03:39, 16F

03/09 03:50, , 17F
樓上可以用一下新版Leela,就知道電腦是可以告訴你
03/09 03:50, 17F

03/09 03:51, , 18F
他的應手的變化圖的,這幾乎就已經表達了AG的思維了
03/09 03:51, 18F

03/09 03:51, , 19F
但人類還是能確定他那些交換不便宜,所以才下的贏
03/09 03:51, 19F

03/09 05:56, , 20F
推,人的強項是邏輯,能找到電腦邏輯不連貫處做修正
03/09 05:56, 20F

03/09 05:58, , 21F
電腦用統計算法對於大方向虛的地方判斷超出人很多,但是
03/09 05:58, 21F

03/09 06:00, , 22F
局部的手法似乎還是有些破綻,是人可以算得出來的
03/09 06:00, 22F

03/09 06:03, , 23F
人跟AlphaGo不能直接溝通,但AlphaGo用他的著手提示了大局
03/09 06:03, 23F

03/09 06:04, , 24F
方向後,人類可以靠局部細算去檢討這個大局觀是否有更好的
03/09 06:04, 24F

03/09 06:04, , 25F
應用方向,類似這類的互相輔助吧
03/09 06:04, 25F

03/09 07:25, , 26F
好奇 V18 是什麼時候的版本?
03/09 07:25, 26F

03/09 11:27, , 27F
V18就是與小李下的那個版本
03/09 11:27, 27F

03/09 14:34, , 28F
感覺AlphaGo更像是一個想法獨立的人而不是神
03/09 14:34, 28F

03/09 15:26, , 29F
有點難理解,我的個人觀察是樊麾和 AlphaGo 的棋力差距
03/09 15:26, 29F

03/09 15:27, , 30F
極大,他加入應該沒什麼幫助,除非那時的 AlphaGo 和
03/09 15:27, 30F

03/09 15:27, , 31F
絕藝一樣官子有漏洞
03/09 15:27, 31F

03/09 16:36, , 32F
棋力有很多不同層面,整體AlphaGo強並不代表AlphaGo沒有一
03/09 16:36, 32F

03/09 16:37, , 33F
手是不可替換的
03/09 16:37, 33F

03/09 16:38, , 34F
至少就現況而言,這一類的AI通病較弱處會是在局部細算,
03/09 16:38, 34F

03/09 16:38, , 35F
AlphaGo相對稍強但很可能是因為大局觀就已經太過優秀,而
03/09 16:38, 35F

03/09 16:39, , 36F
且連勝時都是快棋,把人類的局部細算優點也減弱了
03/09 16:39, 36F

03/09 16:40, , 37F
導致不用拚到過度的局部細算就已經先壓制住對手,事實上可
03/09 16:40, 37F

03/09 16:41, , 38F
以看到AlphaGo有蠻多情況人類優先會覺得要開始拚細算時選
03/09 16:41, 38F

03/09 16:42, , 39F
擇了大轉換來處理,因為大局觀的優秀所以我們覺得轉換很妙
03/09 16:42, 39F

03/09 16:42, , 40F
,可是這不代表要是直接用細算拚下去不會賺得更多
03/09 16:42, 40F

03/09 16:44, , 41F
這也可以說是一種用自己的長處避開自己短處並攻對方短處吧
03/09 16:44, 41F

03/09 17:06, , 42F
重點是棋力差距有點大,例如我也不覺得樊麾 + 小李 >
03/09 17:06, 42F

03/09 17:06, , 43F
小李...
03/09 17:06, 43F

03/09 17:35, , 44F
但是AG不等於小李,程式只要寫出來一定有bug,只要
03/09 17:35, 44F

03/09 17:36, , 45F
一局棋有一處bug給樊輝利用就有可能獲勝,如果套到
03/09 17:36, 45F

03/09 17:37, , 46F
樊輝+小李應該反而會小於小李,樊輝只會拖累小李XD
03/09 17:37, 46F

03/09 18:30, , 47F
樊麾+小李是有可能贏小李的,只要樊麾不確定優劣時,
03/09 18:30, 47F

03/09 18:31, , 48F
就下小李的棋步,當樊麾確定有更好棋步時,就下更好的
03/09 18:31, 48F

03/09 18:35, , 49F
棋步,再強的人都有下錯的時候,樊麾好歹也是職業,一
03/09 18:35, 49F

03/09 18:38, , 50F
定可以看出昏招
03/09 18:38, 50F

03/09 19:15, , 51F
我不認為樊一定可以找出小李的昏招XD不過爭論這個就
03/09 19:15, 51F

03/09 19:15, , 52F
只能憑自己平常經驗XD
03/09 19:15, 52F

03/09 20:14, , 53F
@AirOctopus 當兩個人都覺得對方想的是昏招時怎麼決定XD
03/09 20:14, 53F

03/09 20:14, , 54F
人跟AlphaGo會感覺比較好配的原因是擅長的方面差別很大,
03/09 20:14, 54F

03/09 20:15, , 55F
而且優劣之處比較明確,到了細算由人享有最終決定權還算合
03/09 20:15, 55F

03/09 20:15, , 56F
03/09 20:15, 56F

03/09 20:17, , 57F
樊麾+小李的話可能會變成運氣好兩個人細算的方向有差異,
03/09 20:17, 57F

03/09 20:19, , 58F
且剛好樊麾先算到比較好的方向,小李看了採納之類的方式吧
03/09 20:19, 58F

03/09 23:17, , 59F
為什麼沒人發現"能贏"這件事很正常?! 十場贏一場也是
03/09 23:17, 59F

03/09 23:18, , 60F
能贏 我無腦幫AlphaGo落子終究也能贏另一個AlphaGo
03/09 23:18, 60F

03/09 23:18, , 61F
如果沒明確說明勝率有提升或能打贏新版本 就沒意義吧
03/09 23:18, 61F

03/10 00:10, , 62F
我比較贊同樓上,樊麾+AG終究還是AG在下,AG本就能贏自己
03/10 00:10, 62F

03/10 00:12, , 63F
如果本來AG對AG,20場約各勝10場(黑白互換),但AG+樊麾再
03/10 00:12, 63F

03/10 00:14, , 64F
跟AG下,20場連贏(像master碾各大高手一樣),那就奇了...
03/10 00:14, 64F

03/10 00:30, , 65F
記得沒錯的話,中國棋手對樊的棋力估計是業餘到職業之
03/10 00:30, 65F

03/10 00:31, , 66F
間,大約是衝段少年的程度…
03/10 00:31, 66F

03/10 01:36, , 67F
我不認為Hassabis會玩這種話術,並且肯定樊+AG能
03/10 01:36, 67F

03/10 01:37, , 68F
提升勝率,說實話以那種研討會然後玩話術實在太降低
03/10 01:37, 68F

03/10 01:38, , 69F
格調,另外對岸開賽前是說樊約大陸業五,大概相當於
03/10 01:38, 69F

03/10 01:38, , 70F
台灣的中間業七吧XD絕對不到對岸的衝段少年的
03/10 01:38, 70F

03/12 03:02, , 71F
個人對樊麾其實就是近藤光,感到更大的衝擊
03/12 03:02, 71F

03/14 00:53, , 72F
如果能歸納出 李世石+圍棋之神>圍棋之神 的結論
03/14 00:53, 72F

03/14 00:53, , 73F
或許能夠證明世界上根本沒有所謂完美一手
03/14 00:53, 73F

03/14 01:19, , 74F
樓上,圍棋已經是數學上證明有最佳解的遊戲
03/14 01:19, 74F

03/14 01:22, , 75F
而AlphaGo也不是圍棋之神
03/14 01:22, 75F

03/17 23:19, , 76F
想請問樓上 有相關的介紹或連結嗎?(關於圍棋在數學上
03/17 23:19, 76F

03/17 23:19, , 77F
被證明有最佳解
03/17 23:19, 77F

03/18 00:15, , 78F
其實就是能被窮舉、沒有運氣成份的遊戲必有最佳解
03/18 00:15, 78F

03/18 02:24, , 79F
wiki:策梅洛定理 https://goo.gl/8KCdC4
03/18 02:24, 79F

03/18 02:40, , 80F
事實上甚至還不用請出這個定理,若懂得對局AI中最粗淺的演
03/18 02:40, 80F

03/18 02:43, , 81F
算法之一Minimax演算法,套上可窮舉完成以及資訊完全公開
03/18 02:43, 81F

03/18 02:44, , 82F
這兩個條件,就可以直觀地推出有最佳解這個結果
03/18 02:44, 82F
文章代碼(AID): #1OlzYLNn (GO)
文章代碼(AID): #1OlzYLNn (GO)