[討論]去年的bug是不是根本沒修好

看板GO (圍棋)作者 (jaw)時間8年前 (2017/05/26 11:41), 編輯推噓13(17452)
留言73則, 24人參與, 最新討論串1/1
感覺AlphaGo最大的問題是用勝率去下每一子 成也勝率敗也勝率 領先時無法贏到最大 落後時無法輸到最小 人類棋手落後時會這裡挖一點那裏挖一點先縮小差距 ai落後時容易出現一些 你虛手我勝率飆漲 但人類棋手怎麼可能去虛手 去年黃博士說過bug修好了 但人類沒做任何事只是讓他自我對弈自己就修好了 看了配對賽後開始懷疑 AlphaGo在自我對弈中根本只是變得更強 沒有落後當然沒有再出現bug 但bug一直都存在 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.177.165 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495770067.A.0F0.html

05/26 11:43, , 1F
系統仍有崩潰 抓不完
05/26 11:43, 1F

05/26 11:44, , 2F
舊版的圍棋軟體在小官都可以算的很精了
05/26 11:44, 2F

05/26 11:45, , 3F
我不太懂 照理說 AG應該也算的出來
05/26 11:45, 3F

05/26 11:45, , 4F
最佳路徑應該也會是最高剩綠才對
05/26 11:45, 4F

05/26 11:45, , 5F
掌握bug掌握勝利
05/26 11:45, 5F

05/26 11:46, , 6F
下到後面勝率不是100%就是0%下哪都一樣怎麼決定?
05/26 11:46, 6F

05/26 11:46, , 7F
所以這次比賽就是為了試出bug呀,下午希望人類能贏
05/26 11:46, 7F

05/26 11:47, , 8F
對狗來說贏幾目都算贏 它可能為了萬分之一會輸的機率
05/26 11:47, 8F

05/26 11:47, , 9F
在複雜變化被人類抓到沒算到的棋才是bug
05/26 11:47, 9F

05/26 11:47, , 10F
下一手人類覺得莫名其妙的棋 只為了提高贏的機率
05/26 11:47, 10F

05/26 11:47, , 11F
我大膽推測 狗狗的自我對弈,每盤幾乎沒有大幅落後或領
05/26 11:47, 11F

05/26 11:48, , 12F
先的情況,贏都是贏一目 半目,輸也只是一目 半目
05/26 11:48, 12F

05/26 11:48, , 13F
就容易有這種配對賽的情況發生,所以才會想辦人機大戰
05/26 11:48, 13F

05/26 11:48, , 14F
找bug,這bug是用勝率來決定落子的必然bug
05/26 11:48, 14F

05/26 11:49, , 15F
人下的話,必定會擴大優勢
05/26 11:49, 15F

05/26 11:49, , 16F
AG的程式裏,可能沒辦法區別1目敗和10目敗的差別
05/26 11:49, 16F

05/26 11:49, , 17F
推樓上
05/26 11:49, 17F

05/26 11:50, , 18F
有個辦法是算出穩贏或穩輸時調整貼目再重算一遍
05/26 11:50, 18F

05/26 11:50, , 19F
狗狗仍然會繼續比賽不會被拆了
05/26 11:50, 19F

05/26 11:50, , 20F
反正AG目的也不是當圍棋之神 只是想驗證AI的可行性而已
05/26 11:50, 20F

05/26 11:50, , 21F
在細微差距中,人類可以期待對手犯錯而追回,AI無法判斷吧
05/26 11:50, 21F

05/26 11:50, , 22F
這次比賽完發完論文應該就收山了吧
05/26 11:50, 22F

05/26 11:52, , 23F
狗的問題仍在 論文繼續發 這個弱點顆顆明天掌握就贏
05/26 11:52, 23F

05/26 11:52, , 24F
其實就只是利用圍棋開發TPU而已吧
05/26 11:52, 24F

05/26 11:53, , 25F
如何至造陷阱給狗狗踩
05/26 11:53, 25F

05/26 11:53, , 26F
現階段狗還是超強
05/26 11:53, 26F

05/26 11:53, , 27F
加入PID控制回餽補償,也許可以改善(胡言亂語
05/26 11:53, 27F

05/26 11:54, , 28F
還可以調整增益(?)
05/26 11:54, 28F

05/26 11:54, , 29F
因為圍棋是極簡單規則下,最複雜的問題
05/26 11:54, 29F

05/26 11:55, , 30F
等好久 總算等到一篇一日棋迷文了~
05/26 11:55, 30F

05/26 11:56, , 31F
可以改善問題是拿捏 無法100%確認 棋路一開始到終點的
05/26 11:56, 31F

05/26 11:56, , 32F
路太多
05/26 11:56, 32F

05/26 11:57, , 33F
這版有改進沒修好
05/26 11:57, 33F

05/26 11:57, , 34F
而且這是配對賽耶 互扯後腿趣味賽
05/26 11:57, 34F

05/26 11:57, , 35F
你搞錯了,黃博士說修好是第4局78手,不是官子問題
05/26 11:57, 35F

05/26 11:57, , 36F
一人+一狗 跟 狗狗一個人根本不能類比
05/26 11:57, 36F

05/26 11:58, , 37F
官子問題只要沒有讓到輸都不算bug
05/26 11:58, 37F

05/26 11:58, , 38F
問題在於阿爾法為旗下的提高勝率的辦法人類看不懂
05/26 11:58, 38F

05/26 11:59, , 39F
它是以他最強的假想敵步數去應對
05/26 11:59, 39F

05/26 12:00, , 40F
對alphago沒有官子階段 每部都是全局考慮
05/26 12:00, 40F

05/26 12:00, , 41F
嗯,如果對手也下最強手的話,有時厚勢反而是正解
05/26 12:00, 41F

05/26 12:01, , 42F
上次78手是沒發現勝率下降 等發現落後時就崩潰
05/26 12:01, 42F

05/26 12:02, , 43F
講什麼東西啊,官子本身不就是全局考量
05/26 12:02, 43F

05/26 12:06, , 44F
狗離神的距離還很遠 解決這個bug又來一個bug
05/26 12:06, 44F

05/26 12:08, , 45F
圍棋之神到底長怎樣根本沒人知道,現在AG就是神的境界
05/26 12:08, 45F

05/26 12:10, , 46F
比如說,圍棋之神可以讓世界冠軍幾子,沒人可以回答
05/26 12:10, 46F

05/26 12:14, , 47F
我是只上次78挖 和這次官子階段崩潰對alphago是同一個事件
05/26 12:14, 47F

05/26 12:15, , 48F
自我對自時勝率過低就投了 所以沒看到崩潰的問題
05/26 12:15, 48F

05/26 12:16, , 49F
但古力今天沒投問題就出來了
05/26 12:16, 49F

05/26 12:16, , 50F
上次是alphago沒算到導致勝率爆炸, 這次算是外力干擾
05/26 12:16, 50F

05/26 12:20, , 51F
今天古連這盤白上面活就贏多了,連盤面勝負都有困難
05/26 12:20, 51F

05/26 12:20, , 52F
正常收怎麼可能會贏,就算是人類頂尖棋手那個狀況
05/26 12:20, 52F

05/26 12:20, , 53F
也不太願意繼續下下去,那把他正常收完有什麼意義?
05/26 12:20, 53F

05/26 12:25, , 54F
只有優勢變平局或平局變劣勢這種才叫做bug,
05/26 12:25, 54F

05/26 12:25, , 55F
劣勢拚搏(儘管很蠢)這種不能稱之為bug,對結果沒差
05/26 12:25, 55F

05/26 12:44, , 56F
照H大說法 去年第四盤也不能叫bug了
05/26 12:44, 56F

05/26 12:45, , 57F
去年崩潰也是發生在落後時
05/26 12:45, 57F

05/26 12:48, , 58F
去年的bug應該說是誤判勝率 沒有發現局勢不利
05/26 12:48, 58F

05/26 12:49, , 59F
還記得有報導 崩潰發生在第87手發現落後時
05/26 12:49, 59F

05/26 12:57, , 60F
去年第四盤當然是bug啊,78沒棋啊,有至少三種應對
05/26 12:57, 60F

05/26 12:57, , 61F
方法,後面那一串送到87手顯然就是bug的一部分
05/26 12:57, 61F

05/26 12:58, , 62F
你不能說等到他發現勝率下降了才能開始找bug吧
05/26 12:58, 62F

05/26 13:03, , 63F
演算法弱點不算bug吧
05/26 13:03, 63F

05/26 13:06, , 64F
我只的bug是像97手超扯的那種
05/26 13:06, 64F

05/26 15:47, , 65F
AlphaGo:劣勢假如有bug又怎樣?反正現在沒人能讓他劣勢(
05/26 15:47, 65F

05/26 15:47, , 66F
菸)XD
05/26 15:47, 66F

05/26 17:56, , 67F
用在自動駕駛, 前後左右的車輛算同行的隊友吧
05/26 17:56, 67F

05/26 18:46, , 68F
只有贏或是輸,沒有別的
05/26 18:46, 68F

05/26 18:51, , 69F
並不是bug, 只是行為不如你期望中的理想圍棋機器
05/26 18:51, 69F

05/26 18:52, , 70F
他常常下出圍棋熟手不會下的下法,這應該算常態了
05/26 18:52, 70F

05/26 18:52, , 71F
有時好,有時壞,好的時候多,壞的時候少,如此而已
05/26 18:52, 71F

05/26 18:53, , 72F
如果是程式邏輯漏洞,他們找了幾個月應該查出來修掉了
05/26 18:53, 72F

05/26 18:54, , 73F
但應該不是,只是訓練資料在特定組合時不夠多,所以才估錯
05/26 18:54, 73F
文章代碼(AID): #1P9wFJ3m (GO)
文章代碼(AID): #1P9wFJ3m (GO)