Re: [閒聊] 人機大戰觀後雜感

看板GO (圍棋)作者 (真的不錯....)時間8年前 (2017/05/28 01:26), 8年前編輯推噓1(1018)
留言19則, 4人參與, 最新討論串2/8 (看更多)
※ 引述《hdjj (hdjj)》之銘言: : 然而,這也是我所看到的,AI最大的問題點。 : 古力和AI聯手對局的時候,當局勢明顯不利,AI選擇了投子,古力選擇了續 : 戰。之後的落子,我們看到了AI幾乎是無厘頭的著手,導致局面進一步的不可 : 挽回。 最簡單的概念 開局設定讓先 50手時設貼5目 100手貼10目 150手貼15目 200手貼20目 大概就能看到AlphaGO廝殺全場 最後贏21.5目回來 如果是在狗打狗的情況下 過低勝率下下出棋士們眼中無厘頭棋步 在"勝率"上其實才是合理的 今天最大的問題其實是AlphaGO在對戰棋力相當弱人類棋士時 沒有作最佳化 AlphaGO的AI是千千萬萬局狗打狗棋局中練出來的 就算對上了人類 AlphaGO也以為是在打狗 才會有無理棋 AlphaGO明顯是了解黑棋"貼目7目半"跟"勝負"的概念 如果擔心AI跟人類下棋在讓子或大貼目情況下會下出無理棋 就動態改變貼目設定 甚至更精細設定每10手多貼1目都有可能性 配對賽被隊友送頭 也是可以條件觸發 勝率突然大幅下降多少 對方就貼多少目來最佳化 其中也許需要一些測試拿捏 但應該不難 不過AlphaGO到底能多大程度殺翻人類棋士大概也不是Google的目的 Google也許比較想聚焦於AI發展 殺棋只是觀眾想看而已 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.252.33.34 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495905981.A.272.html ※ 編輯: notmuchmoney (111.252.33.34), 05/28/2017 01:37:47

05/28 01:31, , 1F
沒這麼容易,第一是你可能要訓練多個VN,第二是他
05/28 01:31, 1F

05/28 01:31, , 2F
可能下出非常絕望的無理手反而虧回去
05/28 01:31, 2F

05/28 01:52, , 3F
下讓子就好了 你的概念讓我懷疑你懂不懂圍棋規則
05/28 01:52, 3F

05/28 01:55, , 4F
你指的圍棋規則是?
05/28 01:55, 4F

05/28 01:59, , 5F
佈局的時候就要照讓目下了阿 還有到200手才改20目的喔
05/28 01:59, 5F

05/28 02:01, , 6F
你要不要算一下棋盤有幾目 前面就定型了 哪裡生目數追
05/28 02:01, 6F

05/28 02:06, , 7F
不好意思不太懂你的意思 如果是讓子也是相當的概念
05/28 02:06, 7F

05/28 02:06, , 8F
設定對方開始時貼多少目 然後逐步降低
05/28 02:06, 8F

05/28 02:07, , 9F
該如何設定也許需要一些測試 要做到應該不難
05/28 02:07, 9F

05/28 02:17, , 10F
就是說讓目要一開始設好 不可以隨便動的 中途變動問題很多
05/28 02:17, 10F

05/28 02:21, , 11F
你要測他強度多讓幾子就好
05/28 02:21, 11F

05/28 02:23, , 12F
人類的想法當然是問題很多 但AlphaGO的AI已經定型的
05/28 02:23, 12F

05/28 02:23, , 13F
情況下 改變設定求最佳解不為過 當然你可以讓人類讓
05/28 02:23, 13F

05/28 02:23, , 14F
子貼目千千萬萬局來訓練AI 只是不知道要訓練多久而
05/28 02:23, 14F

05/28 02:23, , 15F
05/28 02:23, 15F

05/28 02:29, , 16F
貼目不可能亂改,那是他整個訓練中基本判斷勝負的條件。讓
05/28 02:29, 16F

05/28 02:30, , 17F
子相對很簡單,反正他都是下完判斷,起始子數不影響
05/28 02:30, 17F

05/28 02:40, , 18F
VN不是你改個參數就能解決的,是當初就已經訓練好的
05/28 02:40, 18F

05/28 02:40, , 19F
所以我才說你要訓練多個VN,MCTS則隨便改沒差
05/28 02:40, 19F
文章代碼(AID): #1PARQz9o (GO)
文章代碼(AID): #1PARQz9o (GO)