Re: [閒聊] 伊隆馬AI應該會屌打T1

看板LoL (英雄聯盟)作者etu7912a48 (你好啊旅行者)時間5小時前 (2025/11/27 17:00)推噓4(4推 0噓 8→)

留言12則, 5人參與討論串7/7 (看更多)

※ 引述《york159 (解癮了)》之銘言： : 問個問題， : ai要怎麼訓練指向技的「施放」？講一些我目前理解的RLAI，以你的例子來說，機器人抓小火龍會選擇對全局來說勝率最高的位置，而非命中率最高的位置(雖然很可能重複)。對AI來說她做的決定會類似過去100 萬次機器人發Q抓小火龍的對局中，有沒有類似情況的pattern。假設有10萬個類似的，他就會統計出往哪裡Q會提升最高的全局勝率。雖然我們常常會認為說全局勝率就是抓到小火龍阿，抓到就贏會戰了然後推堡。以常理來說是，但是在某些時刻可能不是最優解，世界賽中T1打AL有一個畫面是AL贏會戰結果巴龍還沒出生，導致這次會戰雖然贏了但是收穫很少；如果他們當時選擇不打或是晚點打可能會好，這意味著現實最優解可能不是全局最優解。這是人類很難學習到的地方，因為我們精力有限而且很難量化指標。可是對AI來說，他可以對戰上千萬場並觀察到這些事情的發生序列進而得出結論。例如說在100萬場中獲得勝利的對局中，有87%吃了巴龍、有56%拿了首塔，他可以從量化的指標中知道真正重要的決策是甚麼。但是我們從沒有聽說過哪一位分析師說打贏這個會戰勝率+2%之類的，對吧那AI的缺點是甚麼？是它無法解釋或理解這麼做的原因，它會去打會戰、拿首塔或是搶龍是因為在它的對戰經驗中獲得勝利的對局中都有做這是些事情；但是它不會知道拿火龍後因為有加攻擊力，所以更好推線跟會戰勝率更好，AI只負責觀察並不解釋。最值得期待的是如果有一天，真的能訓練出如同alphago的AI，那很有可能推翻我們對遊戲的理解，某件裝備、某個地圖物件的價值可能會跟我們想像的完全不一樣，甚至連EU流可能都會被否定掉。 PS:我有點忘記是不是T1打AL了XD -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.125.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/LoL/M.1764234055.A.708.html