Re: [閒聊] 伊隆馬AI應該會屌打T1
※ 引述《york159 (解癮了)》之銘言:
: 問個問題,
: ai要怎麼訓練指向技的「施放」?
講一些我目前理解的RLAI,以你的例子來說,機器人抓小火龍會選擇對全局來說勝率最高
的位置,而非命中率最高的位置(雖然很可能重複)。 對AI來說她做的決定會類似過去100
萬次機器人發Q抓小火龍的對局中,有沒有類似情況的pattern。
假設有10萬個類似的,他就會統計出往哪裡Q會提升最高的全局勝率。雖然我們常常會認
為說全局勝率就是抓到小火龍阿,抓到就贏會戰了然後推堡。
以常理來說是,但是在某些時刻可能不是最優解,世界賽中T1打AL有一個畫面是AL贏會戰
結果巴龍還沒出生,導致這次會戰雖然贏了但是收穫很少;如果他們當時選擇不打或是晚
點打可能會好,這意味著現實最優解可能不是全局最優解。這是人類很難學習到的地方,
因為我們精力有限而且很難量化指標。可是對AI來說,他可以對戰上千萬場並觀察到這些
事情的發生序列進而得出結論。例如說在100萬場中獲得勝利的對局中,有87%吃了巴龍、
有56%拿了首塔,他可以從量化的指標中知道真正重要的決策是甚麼。但是我們從沒有聽說
過哪一位分析師說打贏這個會戰勝率+2%之類的,對吧
那AI的缺點是甚麼?是它無法解釋或理解這麼做的原因,它會去打會戰、拿首塔或是搶龍
是因為在它的對戰經驗中獲得勝利的對局中都有做這是些事情;但是它不會知道拿火龍後
因為有加攻擊力,所以更好推線跟會戰勝率更好,AI只負責觀察並不解釋。
最值得期待的是如果有一天,真的能訓練出如同alphago的AI,那很有可能推翻我們對遊戲
的理解,某件裝備、某個地圖物件的價值可能會跟我們想像的完全不一樣,甚至連EU流可
能都會被否定掉。
PS:我有點忘記是不是T1打AL了XD
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.125.82 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/LoL/M.1764234055.A.708.html
→
11/27 17:45,
4小時前
, 1F
11/27 17:45, 1F
→
11/27 17:46,
4小時前
, 2F
11/27 17:46, 2F
推
11/27 19:56,
2小時前
, 3F
11/27 19:56, 3F
→
11/27 19:56,
2小時前
, 4F
11/27 19:56, 4F
→
11/27 19:58,
2小時前
, 5F
11/27 19:58, 5F
→
11/27 19:59,
2小時前
, 6F
11/27 19:59, 6F
推
11/27 20:01,
2小時前
, 7F
11/27 20:01, 7F
→
11/27 20:01,
2小時前
, 8F
11/27 20:01, 8F
推
11/27 20:30,
1小時前
, 9F
11/27 20:30, 9F
→
11/27 20:30,
1小時前
, 10F
11/27 20:30, 10F
→
11/27 20:49,
1小時前
, 11F
11/27 20:49, 11F
推
11/27 22:06,
8分鐘前
, 12F
11/27 22:06, 12F
討論串 (同標題文章)
LoL 近期熱門文章
90
115
PTT遊戲區 即時熱門文章
25
33