看板
[ GO ]
討論串[心情] 李世石 Go! Go! Go!
共 6 篇文章
內容預覽:
碰到一個死活問題, 如果有高手每一步都提點可能的幾個位置,. 自己擺一擺所有的變化, 最後總是能下活吧.. AlphaGo 先自我對弈三千萬盤出來知道最後的勝負 (電腦有能力自動判斷). 然後把 "中途的盤面" 跟 "最後的勝負" 當成一對丟進類神經網路強化連結.. 有點像給人看幾萬張男人 (輸)
(還有153個字)
內容預覽:
先狂亂打(暴力打法)再進行歸納, 以找到得高分的最佳途徑, 這好像是電腦必然的. 但卻是單一個人不可能去做的, 因為規模太大了, (而且....). AI 可以轉瞬學會所有定石 等於是到地球作戰的外星部隊一次掌握地球的全部地形. 所以有大局觀可以理解. 可是, 我不太懂死活要怎麼解?因為死活很複雜啊
(還有706個字)
內容預覽:
yamiyodare 在上篇已經講解清楚演算法了,. 我這篇以我理解的方式做個化簡,讓一般人更容易理解,有錯請指正。. 下一盤棋最重要的兩件事,. 一是盤面形勢判斷,AlphaGo 估計盤面勝率的套件稱為 value network,. 二是在當前盤面下,找出最佳落子。. 給出最佳落子的候選著手,此
(還有944個字)
內容預覽:
DeepMind 學習打磚塊的過程. https://www.youtube.com/watch?v=V1eYniJ0Rnk. 人類給予的提示只有把分數提高, 自我訓練幾個小時就可以達到專家的水準.. 一開始 AI 亂數決定移動的方法.. 後來它會發現到亂到特定的地方不漏接球能提高分數,. 給予的回
(還有1218個字)