[西洋] AI棋賽!馬斯克Grok決賽出包 OpenAI o3

看板chess (棋類遊戲)作者 (skyhawk)時間23小時前 (2025/08/13 01:15), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
AI棋賽!馬斯克Grok決賽出包 OpenAI o3直落四完封稱霸 ETtoday新聞雲> AI科技 https://tinyurl.com/24p5dklf https://tinyurl.com/2bqdzxv4 ▲西洋棋。(示意圖/pixabay) 圖文/CTWANT OpenAI與馬斯克(Elon Musk)旗下xAI的人工智慧模型Grok,首次在西洋棋賽場上正面交 鋒,最終由OpenAI的o3大型語言模型以4比0擊敗Grok 4,奪下由Google平台Kaggle舉辦的 AI Exhibition Tournament冠軍。這場為期三天的比賽於5日至7日舉行,參賽陣容包括 Anthropic、Google、DeepSeek、Moonshot AI等多家開發商的模型。 根據《獨立報》報導,Grok 4在決賽中多次出現重大失誤,包括關鍵時刻連續失去皇后, 最終被o3以四連勝的方式擊敗。 Chess.com撰稿人平哈塔(Pedro Pinhata)形容,Grok在準決賽前一直被視為奪冠熱門, 但最後一天完全失去節奏;反觀o3的平均準確率高達91%,在多數情況下毫不留情地抓住 對手失誤。 報導中也提到,這場冠軍對決其實帶有濃厚的個人色彩。OpenAI執行長阿特曼(Sam Altman)與馬斯克十年前共同創辦OpenAI,後者之後離開並成立xAI。 後續阿特曼曾指控馬斯克試圖收購ChatGPT開發公司未果,並稱他是「惡霸」。馬斯克則 在X平台發文淡化比賽結果,聲稱xAI幾乎未在西洋棋領域投入資源,並表示Grok 4的棋力 僅是「副產品」。 Google的Gemini模型在季軍戰中以3.5比0.5擊敗o4-mini,奪下第三名。DeepSeek與 Moonshot AI則在八強賽止步。本次比賽旨在檢驗大型語言模型於複雜策略遊戲中的推理 與決策能力,像西洋棋、圍棋等規則嚴謹的遊戲,被視為測試AI學習與完成目標的重要工 具。 馬斯克在賽前已對外發表評論,而西洋棋界人士同樣關注這場AI對決。現任世界排名第一 的棋手馬卡爾森(Magnus Carlsen)曾於7月的線上賽擊敗ChatGPT,且未損一子。他在賽 後評估,Grok的棋力等級分約800,o3約在1200左右,遠低於他巔峰時的2882分。當有X平 台用戶詢問時,Grok自評的等級分則在1600至1800之間。 自1997年IBM的深藍(Deep Blue)在六局比賽中擊敗世界冠軍卡斯帕洛夫(Garry Kasparov)以來,電腦戰勝人類頂尖棋手已非新鮮事。後續Google DeepMind等團隊更研 發出能以超人水準自我訓練的棋類AI。 這次Kaggle舉辦的比賽,是自2022年ChatGPT問世以來,首次專為通用型大型語言模型舉 行的大型西洋棋賽事。Take Take Take公司執行長克里斯蒂安森(Mats André Kristiansen)形容,此類比賽的價值在於深入觀察AI的推理與思考模式。 ---------------------------------------------------------- AI象棋大賽開戰!OpenAI o3奪冠 Grok 4遭輾壓敗北 鉅亨網新聞中心 2025年8月11日週一 上午11:50 [GMT+8] https://tinyurl.com/286b47q9 Kaggle 平台上舉辦的一場史無前例的 AI 象棋錦標賽中,八個頂級 AI 模型展開了激烈 的廝殺。參賽者包括 OpenAI 的 o3、馬斯克 xAI 的 Grok 4、Google的 Gemini,以及中 國 AI DeepSeek 等。這場競賽不僅考驗了 AI 的棋藝,更被視為各家科技公司展示其通 用模型在複雜邏輯與策略推理方面實力的一場「秀肌肉」之戰。 比賽初期,馬斯克旗下的 Grok 4 模型表現勢不可擋,以壓倒性優勢一路橫掃進決賽。專 家預言「沒有什麼能攔住它」。外界普遍看好 Grok 4 能輕鬆奪冠,馬斯克也似乎準備好 在社群媒體上慶祝勝利。 然而,決賽的戲劇性轉變令人大跌眼鏡。面對 OpenAI 的 o3 模型,Grok 4 的表現突然 判若兩「人」,竟在棋局中頻頻出現低級失誤,甚至連續失子,包括至關重要的皇后。這 出人意料的表現讓觀看直播的西洋棋大師也瞠目結舌。知名棋手 Hikaru Nakamura 在直 播中驚呼:「Grok 犯了太多錯誤,OpenAI 一個都沒犯!」 最終,OpenAI 的 o3 模型以零封 Grok 4 的戰績贏得了冠軍。面對慘敗,馬斯克在社群 媒體上發文表示:「我們壓根沒在象棋上花心思,這只是副產品。」這番話語被許多人解 讀為為敗北找藉口,但也帶有些許幽默的意味。 這場比賽再次引發了人們對 AI 發展的思考。雖然這些通用 AI 模型並非專為象棋設計, 但它們在棋盤上展現出的運算、策略規劃和學習適應能力,直接反映了當前 AI 技術的進 化水平。 如同 1997 年 IBM 深藍戰勝西洋棋大師卡斯帕羅夫一樣,這場 AI 大戰成為了衡量各家 AI 模型智慧與思考能力的試金石,預示著未來 AI 在更多領域的潛力。 這場跨界天才的對決也讓大眾看到,平常協助人們撰寫文案、製作 PPT 的 AI,也能在瞬 息萬變的棋局中展現強大的邏輯推理能力。AI 的未來發展充滿無限可能,這場象棋大戰 或許只是個開端,未來 AI 在各行各業中帶來的驚喜將會越來越多。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.14.128 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/chess/M.1755018946.A.91B.html
文章代碼(AID): #1ectR2aR (chess)
文章代碼(AID): #1ectR2aR (chess)