Re: [心情] 李世石 Go! Go! Go!

看板GO (圍棋)作者 (shantotto)時間9年前 (2016/03/12 16:57), 編輯推噓2(2012)
留言14則, 3人參與, 最新討論串6/6 (看更多)
※ 引述《bbbtri (cycling)》之銘言: : ※ 引述《yamiyodare (shantotto)》之銘言: : : AI 的做法是先盡量下的跟高手一樣, 因為高手可能的下法幾乎包含了最佳解. : : AI 從這些候選走法往下找可以節省大量時間空間. : : 透過大量的高手對戰譜訓練出一個迅速模仿高手次一手的 policy network. : AI 可以轉瞬學會所有定石 等於是到地球作戰的外星部隊一次掌握地球的全部地形 : 所以有大局觀可以理解 : 可是, 我不太懂死活要怎麼解?因為死活很複雜啊, 隱藏著豬羊變色的規則和劫活 : 還是其實死活的題型和變化在AlphaGo看來存在上限? 碰到一個死活問題, 如果有高手每一步都提點可能的幾個位置, 自己擺一擺所有的變化, 最後總是能下活吧. : : value network 是型勢判斷, 給予一個特定盤面就能夠迅速回報勝率. : : AI 開出千萬分身自我對練高手的棋路到終局 (最後誰贏電腦可以判斷的夠準) : : 然後回溯盤面, 訓練出一個可以估計任何盤面勝率的 value network. : (不好意思, 插問一下回溯的英文是什麼> <) : 在序盤就要計算到勝率看起來完全不可思議啊!!! : 假設AlphaGo vs AlphaGo'(比本體稍弱)的勝率比是51:49好了 : 那這個比值「從第幾手開始」才會跳動呢? : 感覺上, 答案根本上決定在對局兩造的實力 AlphaGo 先自我對弈三千萬盤出來知道最後的勝負 (電腦有能力自動判斷) 然後把 "中途的盤面" 跟 "最後的勝負" 當成一對丟進類神經網路強化連結. 有點像給人看幾萬張男人 (輸) 跟幾萬張女人 (贏) 的照片. 之後看到沒看過的人, 人可以推論是女人 (贏) 的機率有多高. : : 可以把它想像成很多高手提供次一手的下法, 那就來下下看, 看誰說得對. : : 但要留意, AI 的目標是勝率最高 (反擊手最少), 不是目數最多, 不是棋型最美. : 不太懂value network為什麼是重在反擊手最少呢?可以再說明一下嗎? : 說到反擊, 我是覺得任何反擊都可預期, 只差在「有沒有效率」而已 : 而效率除了涉及手數,目數,還關係到手順, 這點跟收官有最佳順序一樣 : 唯前提是死活的問題要先解決, 因為即使是官子也會受打劫影響 : 你說的反擊手最少, 指的是....? 我的用詞不當, 反擊手指的是可逆轉勝負 (翻盤) 的手段 : 如果目前的AI計算能力已經強到甚至能改變定石、爭奪手順, 那....lol : (定石真的是沒有破綻的嗎?還是只是地球人的破綻?) 定石會進化, 現在的定石跟古定石就不一樣, 秀策遇到貼目也不會尖... 吧 : 宇宙流的相關定石應該很少 : 如果AI要發展宇宙流派, 那也不錯呀~~ : 但那樣的圍棋就不會是我們目前以為的圍棋了而是一盤只有AI能下的棋局 : 看新聞說, Google DeepMind 的目光放在破解人類學習的密碼 : 嗯, 這個是認知科學的腦神經領域啊! : 而用只有電腦可以使用的方式(例如暴力歸納)來破解人腦的學習, 是矛盾不是嗎? 人類也是暴力歸納啊, 就好像我說的男女識別問題. 你沒看過多少人之前判斷錯誤的機會是很高的. 只是電腦更暴力, 很專心又不會累, 可能可以學得比人類更好. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.113.64 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457773033.A.14A.html

03/12 16:59, , 1F
這個時代 照樣尖的職業棋士很多啊 阿對不起該問阿法夠
03/12 16:59, 1F

03/12 18:02, , 2F
可是今天這盤就是劫活 而黑子劫材不夠 也就是死活不是一
03/12 18:02, 2F

03/12 18:02, , 3F
個封閉的題目 而是要放到盤面上 呼應盤面的情況來定死生
03/12 18:02, 3F

03/12 18:05, , 4F
男女適別對生物來說是天生的 不是習得的 所以不是歸納喔
03/12 18:05, 4F

03/12 18:07, , 5F
人如果要使用歸納法 是top-down的high level cognition
03/12 18:07, 5F

03/12 18:09, , 6F
但類神經元應該沒獨特性 沒有像神經元這樣專門性的演化
03/12 18:09, 6F

03/12 18:10, , 7F
AlphaGo 的 value network 看的就是整個盤面 解死活同
03/12 18:10, 7F

03/12 18:10, , 8F
時照顧大局 局部該死該活由整體勝算決定
03/12 18:10, 8F

03/12 18:12, , 9F
以視覺辨識來講 Hubel Wiesel發現的特化剛好啟發CNN研究
03/12 18:12, 9F

03/12 18:12, , 10F
這點我剛在看版友提供的CNN介紹時也嚇一跳.....
03/12 18:12, 10F

03/12 18:22, , 11F
男女識別舉例不佳的話 改成貓狗識別好了
03/12 18:22, 11F

03/12 18:31, , 12F
可是識別是識別 歸納是歸納 是不同的概念
03/12 18:31, 12F

03/12 18:32, , 13F
我只是想說AlphaGo跳過理解而直接下判斷 和人類的習慣不同
03/12 18:32, 13F

03/12 18:33, , 14F
所以是暴力歸納 但我還沒搞懂它到底是怎麼做出效率的啊
03/12 18:33, 14F
文章代碼(AID): #1Muzdf5A (GO)
文章代碼(AID): #1Muzdf5A (GO)