Re: [心得] 這五局對AlphaGo的評價

看板GO (圍棋)作者 (冷面笑匠)時間9年前 (2016/03/15 21:08), 9年前編輯推噓21(21090)
留言111則, 21人參與, 最新討論串2/2 (看更多)
※ 引述《shehrevar (阿浩)》之銘言: : 1. 這五局質感 3>2>4>5>1 : 第三局的象飛,往上跳一手的大局觀,第二局的五路尖沖,相信可以給人類帶來新思想 : 2. AlphaGo的實力>>小李 : 第四局就不說了,電腦算不到這手整個就爛掉之外,其他四局從頭領先到尾 : 李世石完全無任何機會,以最後一局來說好了,AlphaGo官子並不出色 : 我想AlphaGo的"國際禮儀"應該表現得很好,有種不要贏太多的感覺,贏了就好 : 縱使事後研究應該要怎樣怎樣,對AlphaGo都一樣,世界第三實至名歸(暫時) : 3. AlphaGo先交換定型 : 初期來看真的是完全浪費劫財,(之前第二局小目下拖定石刺一個配合5路尖沖完美) : 右下角的交換在收官的時候卻派上用場,這或許之後下也一樣,但是對於之後戰鬥 : 我不覺得有那裡損失 : 4. AlphaGo打劫 : 就如眾高手說的,能不打則不打,減少變化,但好像真的要下出打劫是多麼難的事情 : 平常打劫隨處可見,對上AlphaGo就幾乎完全消失,值得研究,也呼應第三點 : 既然不打劫,何不趕快定型好,省得日後應手有變 : 5. AlphaGo進化 : 想知道如果拿出最佳勝率點以及最佳目數點的話,可以讓人類幾目,我猜可以兩子 我認為對手是電腦 能抓到演算法的破綻就很夠了 以電玩來說 玩家打電玩一開始會狂輸好幾場 但總是有些玩家一開始吃虧 後來抓到魔王AI的BUG 從這BUG衍伸出許多攻擊策略 過幾天開始就已經打倒魔王 到最後則是挑戰無損血K.O.魔王 另外有沒有聽過打不倒的空氣人這首歌? 為何該玩家打不倒空氣人 為何專版會有一堆人會說空氣人很弱 為何網路上有一堆無損血KO空氣人的play 有沒有針對電腦AI的BUG作攻擊策略 我想是人類戰勝AI的重要關鍵 這種通常要練習幾百場 一旦抓到攻擊策略 電腦就等著吃鱉 我認為李世石才玩五場就抓到AI之弱點 一旦玩個幾百場 阿發狗還用混嗎? 看程式設計者賽後心情有點不好 可能是該玩家玩五場就抓到弱點後 如果給其他玩家對奕 會衍伸出一些針對阿發狗的策略 到最後連普通玩家都能幹掉阿發狗 那就很不好了 題外話: 有跟星海爭霸2的AI打過 一開始打也都是絕望 正面根本不能贏電腦 後來嘗試用快攻與偷襲 並觀察電腦AI的習性 大約三十幾場後 殘酷的電腦就變肥料了 我認為要給李世石多玩幾場 說不定情況會大不相同 一點淺見 其實我看李輸 還蠻難過的 希望人類不會輸給電腦AI -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.165.255.87 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458047287.A.EBF.html

03/15 21:12, , 1F
深藍也只敢偷襲一次 而且是由人作最後決策 ( ′-`)y-~
03/15 21:12, 1F

03/15 21:12, , 2F
照你這樣講,人類會進步,電腦難道就不會自我學習進步嗎?
03/15 21:12, 2F

03/15 21:12, , 3F
但是AlphaGo還會再改進 進化
03/15 21:12, 3F

03/15 21:13, , 4F
幾個月後再來,阿爾發GO就更厲害了啊。
03/15 21:13, 4F
這真的要看當時改的是怎樣 但會不會產生另一種BUG 也是有可能的 人類就盡力吧 我記得SC2的AI也有學習能力 但我換進攻策略 又開始狂電它 接著此AI攻擊策略又變成以前的樣子 你真的認為AI有進步嗎? ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:14:18 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:16:45

03/15 21:16, , 5F
這樣分析的前提是阿法真有運算架構上的BUG
03/15 21:16, 5F

03/15 21:17, , 6F
李世石的格局顯然不只這樣而已, 不然 G5 不會自願拿黑棋
03/15 21:17, 6F
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:18:09

03/15 21:18, , 7F
請問,第五局不是本來就是李拿黑嗎?
03/15 21:18, 7F

03/15 21:19, , 8F
我一直搞不清楚自願拿黑是怎麼回事
03/15 21:19, 8F

03/15 21:19, , 9F
但是現在的消息來看,是演算資源限制它捨棄機率過小
03/15 21:19, 9F
李自己要求拿黑 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:19:31

03/15 21:19, , 10F
無傷過空氣人是運氣吧 那個龍捲風是隨機的
03/15 21:19, 10F

03/15 21:20, , 11F
的棋步,換句話說下快棋就是他的罩門
03/15 21:20, 11F
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:21:20

03/15 21:20, , 12F
是每次開始都會先猜子,但是第五局李表示想拿黑這樣嗎?
03/15 21:20, 12F

03/15 21:20, , 13F
還是照順序,李應該拿白,但是裡要求拿黑?
03/15 21:20, 13F

03/15 21:20, , 14F
按規則第五盤要重新猜先, 但是李世石想拿黑 雙方協調OK
03/15 21:20, 14F

03/15 21:21, , 15F
原來如此,了解了
03/15 21:21, 15F

03/15 21:22, , 16F
不是在棋盤上真劍勝負, 就沒有那種氣魄了
03/15 21:22, 16F

03/15 21:22, , 17F
當場猜對李不利啊
03/15 21:22, 17F

03/15 21:22, , 18F
這算抓到弱點嗎?google辦這比賽的目的就是要找到這bug
03/15 21:22, 18F
寫過演算法的程式 一旦為了解決一個BUG 有可能整個演算法整個改掉 也有可能讓整個電腦的AI變得不協調 總之這是個麻煩問題 看GOOGLE怎麼解決吧@@ 我也不敢說GOOGLE解決不了 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:25:43

03/15 21:24, , 19F
如果電腦有選到這手,第四局一樣GG~
03/15 21:24, 19F

03/15 21:24, , 20F
當然能讓電腦忽略這手小李也是威猛沒錯
03/15 21:24, 20F

03/15 21:31, , 21F
原PO提到星海有學習的能力是學玩家的而不是"自我學習"
03/15 21:31, 21F
已改 感謝 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:31:56

03/15 21:31, , 22F
Alphago的演算計往跟以往AI的窮舉方式都是有所不同的
03/15 21:31, 22F

03/15 21:32, , 23F
他是因應圍棋算不完那就在有限時間內盡可能算出最大勝率
03/15 21:32, 23F

03/15 21:33, , 24F
也就是說當然也會有他算不完而輸的可能,比方說Google自
03/15 21:33, 24F

03/15 21:33, , 25F
己就有提到連線的分散式Alphago對單機Alphago勝率約7成
03/15 21:33, 25F
如果你對付電腦有A、B、C、D招 其中A、B、C招都是對目前電腦AI策略有效 但D招無效 假如有一天AI發現一個對A、B、C招都有效的方法 而改變自己AI 偏偏此時D招剛好是目前電腦的破綻 此時電腦該如何適應? 這種例子 在人類的學習上也是常常遇到的 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:38:46

03/15 21:34, , 26F
你一定不是寫程式的,有人幫忙抓到bug有多爽
03/15 21:34, 26F

03/15 21:34, , 27F
觀察起來Google其實很有心測試Alphago的演算能力,除了
03/15 21:34, 27F

03/15 21:35, , 28F
比賽前就停掉Alphago的學習(也就是這五場都是同一版本)
03/15 21:35, 28F

03/15 21:36, , 29F
細心一點的人就會發現Alphago並沒有特別分配時間再把運
03/15 21:36, 29F

03/15 21:37, , 30F
算在時間明明還很充裕的情況下再多算一點
03/15 21:37, 30F

03/15 21:38, , 31F
Google花了錢當然希望有成效阿 贏了出名 輸了抓蟲
03/15 21:38, 31F

03/15 21:38, , 32F
怎樣都不虧阿
03/15 21:38, 32F
還有 42 則推文
還有 5 段內文
03/15 22:20, , 75F
的確是如此 下到一半交給其它人類九段關門 應該是穩贏的
03/15 22:20, 75F

03/15 22:20, , 76F
所以目前人類的確還是有比它強的地方 聶衛平的觀察蠻準
03/15 22:20, 76F

03/15 22:21, , 77F
要在中盤壓過它得表現完全才有可能, 一點錯誤都不能犯
03/15 22:21, 77F

03/15 22:21, , 78F
表現完"美"
03/15 22:21, 78F

03/15 22:37, , 79F
會只走同樣套路就不是頂尖工程師們打算構築出的AI
03/15 22:37, 79F
我還是想說 人類還是可以學電腦下法 電腦下三千萬盤的結果 人學個一千盤就了解大致上的方法也說不定 電腦深度學習技術我認為還是有瓶頸的一天 講的無窮無盡反而像是說大話

03/15 22:37, , 80F
官子是算目的世界, AlphaGo 還在算勝率下起來自然怪.
03/15 22:37, 80F

03/15 22:38, , 81F
還有一個可能是勝率 100% 的路太多, 但不知哪個贏得多
03/15 22:38, 81F

03/15 22:38, , 82F
看起來就不會是最佳手順, 而是隨便選一條走.
03/15 22:38, 82F

03/15 22:40, , 83F
AlphaGo 可能要稍微落後, 才看得出收官的實力.
03/15 22:40, 83F

03/15 22:40, , 84F
阿Go若改版成在N手後開始算局部的權重加重應該更猛?
03/15 22:40, 84F

03/15 22:44, , 85F
勝率 100% 的路太多 <= 這個蠻有可能的
03/15 22:44, 85F
※ 編輯: wnglon (115.165.255.87), 03/15/2016 22:59:19

03/15 23:08, , 86F
我覺得當人類必須開始去理解AI的思路並且從AI學習
03/15 23:08, 86F

03/15 23:10, , 87F
進步 新的紀元就已經開始了 而且學完後AI還是沒輸你
03/15 23:10, 87F

03/15 23:13, , 88F
第五局原訂猜先,是李在第四局後要求執黑挑戰
03/15 23:13, 88F

03/15 23:17, , 89F
覺得官子收不好 可能是因阿Go雖然損 但覺得後續對手
03/15 23:17, 89F

03/15 23:20, , 90F
能使對勝率的變化較少才那樣走 代表著白其實贏更多
03/15 23:20, 90F

03/15 23:22, , 91F
現在這個演算法 實質上靠的還是暴力運算 所謂的學習能力
03/15 23:22, 91F

03/15 23:23, , 92F
只是增強計算效率的輔助措施罷了, 學習可以做出"棋感"
03/15 23:23, 92F

03/15 23:24, , 93F
但是做不出計算能力...
03/15 23:24, 93F

03/15 23:42, , 94F
有一篇是Facebook研究員解析Alphago的文章可以看看
03/15 23:42, 94F

03/15 23:42, , 95F
03/15 23:42, 95F

03/15 23:45, , 96F
樓上那個連結已經出現過好多次啦
03/15 23:45, 96F

03/15 23:46, , 97F
但顯然還是有很多人沒看過啊(比方說原PO)XD
03/15 23:46, 97F

03/15 23:50, , 98F
facebook這篇文章有一個重點就是調整不同的演算比重是會
03/15 23:50, 98F

03/15 23:52, , 99F
影響下出來的品質或勝率,也就是越了解就越可以了解AI也
03/15 23:52, 99F

03/15 23:54, , 100F
是在有限運算下盡可能尋求勝利但還是有其極限的最佳化統
03/15 23:54, 100F

03/15 23:55, , 101F
合成果,只要電腦技術還是沒有能力完全算完圍棋,理論上
03/15 23:55, 101F

03/15 23:56, , 102F
就不會有完美解
03/15 23:56, 102F

03/15 23:57, , 103F
但他若能贏下多數棋局,這就是棋力的展現了,不是嗎?
03/15 23:57, 103F

03/16 01:08, , 104F
我也覺得很多人沒看懂那篇文章
03/16 01:08, 104F

03/16 03:18, , 105F
用個簡單比喻 電腦靠速算的三段網路勝率做了一個數值解的
03/16 03:18, 105F

03/16 03:19, , 106F
fit 人用各式各用不精確地棋理近似 做了一個理論解 你理論
03/16 03:19, 106F

03/16 03:20, , 107F
解要更優 棋理的精細度得提升 就可以贏了
03/16 03:20, 107F
你講得太理想 實際上沒能不能做到都是未知數 最後兩盤給我感覺 人類還是有戰勝的可能 就這樣 不要說我有沒有看文章 我有看過了 但沒看到阿發狗實際表現完美的一面 半年後人類是否還能戰勝ai 我還是持保留態度 ※ 編輯: wnglon (49.214.35.100), 03/16/2016 04:58:37 ※ 編輯: wnglon (49.214.35.100), 03/16/2016 05:30:44 ※ 編輯: wnglon (49.214.35.100), 03/16/2016 05:44:44

03/16 08:30, , 108F
因為我在第二場結束後 就對黃士偉提出了阿發狗的弱點
03/16 08:30, 108F

03/16 08:30, , 109F
啦 其實阿發狗弱在"一分鍾的情況下" 征子和收官
03/16 08:30, 109F

03/16 08:30, , 110F
電腦反而強在前.中期 因為佈局可以避開征子 大概是這
03/16 08:30, 110F

03/16 08:30, , 111F
個理由
03/16 08:30, 111F
文章代碼(AID): #1Mw0atw_ (GO)
討論串 (同標題文章)
文章代碼(AID): #1Mw0atw_ (GO)