[閒聊] 中國棋手李喆對小申的稱讚(並偷臭柯潔)
李喆六段是中國職業棋手,巔峰時也算是中國頂尖,只是現在跑去做別的事了
這篇文章是他在農心盃之後發表的,主題是研究並稱讚小申對AI的理解
同時字裡行間又偶爾偷酸一下柯潔,導致現在中國柯粉狂怒、柯黑狂喜
非常熱鬧
我自己是覺得文章寫得蠻好的,尤其引用小申訪談的那段話堪稱經典。
--------------------以下原文-------------------------------------------------
申真諝在農心杯取得跨賽季的16連勝,超越當年李昌鎬14連勝的傳奇紀錄,作為主將憑一
己之力擊敗所有中國隊參賽棋手,連續四屆終結三國擂臺賽,再次證明了他是當前毫無爭
議的圍棋世界第一。
在這裡,我想談談對申真諝的印象,包括他的棋藝和品性。棋藝方面,主要想談談小
申的棋究竟領先在什麼地方,尤其是從AI訓練的方法以及圍棋技術領域的理論層面進行簡
要分析,這部分基於知識理論的分析或許能夠對我們的一線棋手乃至年輕新秀們有所助益
。之所以在棋藝之外也想談談品性,是因為仍有許多人相信棋如其人,相信絕頂高手的人
品風範一定與棋藝相通,這兩者幾乎不可分割——這種信念在前些年實際上遭到了嚴重的
質疑,不僅有來自社會的疑問(人們在問:棋下得好與電競打得好有什麼區別嗎?),許
多棋手自身也都對此產生懷疑(也包括學棋的小孩和家長們),但幸運的是,申真諝似乎
至少暫時挽回了這種信念。
很多棋手都喜歡用吳清源大師的摺扇,最常見的題字是“闇然而日章”,大家或許更
多是出於對吳清源卓越成就的欽佩,沒認真考慮過吳清源大師為什麼題這五個字在扇子上
。“闇然而日章”出自《中庸》:“君子之道,闇然而日章;小人之道,的然而日亡”,
“闇”在這里的意思與“暗”相通,這句話的意思大致是說,君子錦繡謹藏於中,初看闇
然無光彩,而其德性光明是日益彰顯出來;小人則相反,日夕用心於外,一心炫耀不知內
省,徇物欲而忘返,初看表面光鮮,而其內在空洞,“暴於外而無實以繼之”,於是日漸
衰亡。吳清源大師晚年暢想21世紀的圍棋,提出圍棋乃“中和”之道,推崇《中庸》,將
“闇然而日章”題於扇面傳世,顯然傳達了他的人生理念和圍棋觀。
申真諝,這位出生於21世紀第一年的棋手,在攀登棋藝高峰的路途中,展現出“闇然
而日章”的君子之道,逐漸成為一名大棋士的同時,也成為未來許多學棋小孩心中的榜樣
——對於整個棋界來說,這都是幸事一件。
首先,申真諝現象級的統治力至少證明了一個說法的謬誤。圍棋AI普及之後,曾有一
種論調說AI拉近了棋手之間的水平差距,大家都跟AI學,所以水平都差不多了。如今申真
諝連年接近90%勝率、幾乎比肩當年李昌鎬統治力的成績顯然證偽了這個說法。很明顯,
並非大家都學AI就會達到相近的水平。尤其我們國內的棋手們,不要再被這個說法欺騙了
,AI的確帶來了巨大的平等,但這平等主要是訓練條件的平等(在大家都有強AI用作日常
訓練之後),而不是訓練效果的平等。AI的出現實際上對棋手的能力提出了更高的要求,
這一點需要一線棋手和致力於競技的小棋手們認真對待,這也是我主要想談的部分。
幾無爭議的是申真諝達到了目前為止人類圍棋的最高水平(當然,人類圍棋的水平整
體上是不斷提升的,未來無疑會出現層級更高的棋手)。那麼,申真諝是如何達到這個高
度的?在攀登棋藝高峰的過程中,他經歷過什麼低谷與困境?他的技術主要領先在哪裡?
很多人都注意到了,申真諝近年的對局一改當年的戰鬥型風格,變成了控盤流,農心
杯的一串六,除了最後面對中國隊主將辜梓豪的一局有過一段比較大的波瀾(證明小申也
有足以導致敗局的明顯失誤),其它五局都是從頭控到尾,讓對手毫無勝機。
這裡我想先提出一個簡單的論點:在現代圍棋的職業競技中,統治力最強的棋手極大
概率會是控盤型棋手。這是一個通俗的說法,之後我會用圍棋技術領域的理論來解釋為什
麼這麼說。
當然小申的戰鬥力或者說計算力是很強的,當年他剛剛走進世界賽場,就是典型的戰
鬥風格,而他那段時期的輸棋很多都是優勢之下行棋過剛而折(還記得首屆新奧杯八強戰
,我和申真諝同場競技,抽籤儀式上我很想對上他,因為他是當時八強裡唯一的非中國隊
選手,而且如此年輕。那時我已多年不訓練、偶爾參賽,逐漸退出一線,而小申算得上初
出茅廬)。
圍棋AI出來之後(尤其是KataGo於2019年開源之後),小申通過向AI學習,逐漸彌補
了他的短板,風格變化為控盤型,勝率也達到了罕見的驚人高度。
其實圍棋裡各種“風格”的說法是可為趣談而不那麼精確的。所謂“控盤型”,無非
是指常常在不怎麼發生激烈戰鬥的情況下通向勝利,讓對手有力無處使,這種風格能避免
複雜計算中人類難免的波動,使局面平滑而有容錯率,由此保持極高勝率,但是並非所有
“控盤型”棋手都能達到那樣的高度。上一位控盤型的高峰當然就是李昌鎬,大李的巔峰
期就是那種看上去平平無奇,卻能把對手控制得找不到機會的下法。如今用AI來重新分析
,李昌鎬最強的地方還不是官子,而是局面的判斷,很多當年被認為是李昌鎬官子逆轉的
棋局,其實並非逆轉,而是大李更準確地判斷出了他實際占優的結果,對手和觀眾則誤判
了局面(至於怎麼做到的,以後有機會再展開來談)。而在李昌鎬職業生涯的末期,之所
以他一度被認為變換了風格,變成有些靠近“戰鬥型”,是因為在他的影響下,年輕棋手
們的判斷力和勝負感也都逐漸增強了,當判斷能力沒有顯著差距時,控盤流就很難輕易得
手,而常常需要戰鬥(雙方前景不明的多頭緒計算)來解決問題,到了那個階段,他的勝
率和統治力就下滑了(那也是我在國家隊參與集體研究二李的時期)。
也就是說,控盤的關鍵是“判斷力”。這裡我要提出一個論點:如今申真諝領先最多
的部分,就是“判斷”的能力,而這顯然是他用AI訓練來提升的。
職業棋手們常說:“判斷是圍棋裡最難的”,那麼判斷到底是指什麼,為什麼最難,
又怎樣提升呢?限於篇幅這裡也只能簡單談一下,以後有機會再展開全面論述。
在編《中英圍棋術語辭典》的時候,我發現圍棋裡的很多術語並沒有嚴謹的定義,而
不嚴謹的術語無法導向嚴謹無誤的知識。在說到圍棋技術領域的時候,“中盤能力”這類
詞的指涉就比較缺乏清晰性,而“判斷”的概念是比較清晰的。
七年前,我在“AlphaGo——未來的圍棋”這篇文章裡第一次提出圍棋技術的三要素
:棋感(直覺)、計算和判斷(這三者恰好對應著AlphaGo的演算法結構),人類下棋的
能力與技術可以全部涵蓋在這三個概念的框架之下。去年我寫了一篇論文“圍棋的知識結
構分析”,在論文的主題之外,文末順帶提到人類棋手通過使用AI學習,在這三個方面分
別能帶來多少進步及進步空間,結論是:在棋感方面會以累積經驗的方式持續進步,在計
算方面進步空間極小,而在判斷方面則有很大的進步空間,並且未來還有產生理論化的可
能。
所有定式的記憶,都可歸於棋感一類。在圍棋上學習AI的第一階段,就是學AI的棋感
,也就是多看AI的下法,產生相同或相近局面下的比原先更好的局面印象,而圍棋的佈局
階段最容易出現“相同或相近局面”,因此也是棋感部分最容易學到的,俗稱“背定式”
(不那麼準確)。這個階段,人類棋手重新學習定式,成為職業高手必備的功課,但這並
不是全部的學習。佈局下法之外,中盤轉換的棋感、局部好壞形狀的棋感、厚薄關係和何
時脫先的棋感等等,都有更新的空間。這部分的訓練是以經驗累積為主,見得多了就認識
了,當然從見得多到真正認識,也需要對不認識的、看不懂的下法進行仔細的理解分析,
才能真正地轉化為自己的棋感。
有些棋手和棋迷誤以為這就是跟AI學習的全部,由此認為有AI之後圍棋下得好就靠背
譜,這是顯然錯誤且很容易傳播的具有誤導性的觀點。淘汰舊定式,學習AI新定式,也就
是形成佈局的新棋感,這只是棋手們在AI時代提高棋藝的第一步,或者說第一階段而已。
在計算方面,AI的確幫不了我們太多忙,人類棋手的計算能力受限於人類大腦的容量
和效能,或者說人的有限性,在不做腦機介面的情況下,人類下棋的計算能力整體上是沒
有多少提升空間的,個體差異則仍然存在且與AI無關。
問題的關鍵就是“判斷”。實際上,在當年人機對決的過程中,我們就已經可以完全
理解人類棋手和AI最大的差距就在“判斷”領域(反而不是“計算”)。為什麼是AI教我
們下“點三三”,難道人類算不出點三三的基本變化?當然不是,而是對於地勢轉換的局
面,人類棋手從前的判斷是失準的。如果展開來講,就是在地與勢轉換的時候,人類所使
用的兩種認知方法(“邏輯”與“經驗”)所做出的判斷的精確度差別較大,導致了判斷
失準(而地與地對決的時候判斷就不會偏離太多,因為使用的是同一套判斷的認知方法)
。
圍棋中的判斷能力(對應AlphaGo的Value Network這部分),是人類可以通過向AI學
習來提升的,這部分人類差AI很多,並且遠沒有達到人類能力的極限,因此有很大的提升
空間。
AI的VN給出的是勝率,人類當然無法像AI那樣直接將局面轉化為勝率估值,因此人類
還是需要用人類自身的認知方法來獲得提升。人類的認知方法不外乎邏輯與經驗,在棋感
方面的提升,主要依靠的是經驗的累積;而判斷方面的提升,則是兩者都有發揮作用的空
間了。
人類棋手如今可以針對“判斷”來進行專項訓練,有AI這麼好的輔助工具,這類訓練
應該成為最重要的日常訓練方式之一。當然,由於一些高手的AI訓練方法仍是保密的,具
體怎麼練,這裡也不好談論太多,只是有必要先從圍棋的知識結構上把理論說清楚:為什
麼專門練習判斷力是可行且高效的。
用AI來訓練自己的局面判斷能力,最簡單的是用經驗累積的方法,也是目前最容易制
定的訓練方案。未來可能出現的邏輯的方法,則將依托於新的思維概念,用通俗的話來說
就是總結出更好的、更有效的棋理(淘汰掉以往一些錯誤或不精確的棋理觀念),當然這
大概不是短期能實現的。也就是從理論上來說,在目前的階段,制訂一些專門訓練判斷能
力的訓練方案,以累積局面判斷的正確經驗為主要目標,對於仍有志於一線的棋手而言,
是十分重要且可行的。這方面,很可能申真諝已經走在了前面,大部分棋手們都還處在向
AI學習的第一階段:積累棋感(還有一些厭學的),而小申同學已經進入了高級班。
申真諝面對眾多同樣是在每天認真訓練的高手,能夠發揮出控盤流的優勢,主要就是
因為他的判斷能力已經強出了至少一檔,而在進入復雜戰鬥的局面時,他的勝率就會顯著
下降了(近年戰勝過小申的棋手跟我說他的策略就是想方設法與小申戰鬥)。這裡的原理
如果用AI的勝率波動來說,所謂控盤流,就是使局面維持在有許多個選點出入不大、都能
保持勝率領先的狀態,此時的失誤也不會突然導致敗局;而所謂復雜戰鬥(或無論別的什
麼名字)的一個特點是,在計算分支較多的情況下,又要求幾乎每一步棋都精確,一步失
誤就可能勝率跳崖。現代棋手們從小都是苦練計算的死活題大師,在計算力方面是很難有
人超出別人太多的,因此戰鬥型棋手固然可能達到非常高的水準,但穩定度會低於控盤型
,這是棋藝原理與人類的能力限度所決定的。當然換個角度來說,如果大家的判斷能力都
接近了,那麼復雜戰鬥就成為了分勝負的主要方式(參考AI對決),此時所謂控盤型就不
存在了,也就沒有統治力極強的棋手了。
總結一下,申真諝現在超高的勝率依賴於他的控盤式下法,而這種下法之所以能獲得
巨大成功,是因為他的判斷能力在眾高手中顯著領先(就像當年李昌鎬一樣,能在對手還
覺得形勢難分優劣的時候預判出某些變化圖一方已經領先),判斷能力的大幅提升使他避
免了早期長時間處於戰鬥中容易被逆轉突然崩潰的情況,而判斷力的提升與使用AI訓練的
方法有非常大的關係。也就是說,目前要想擊敗小申,概率最高的方法是導入複雜戰鬥;
而要想在棋力上追趕小申,就需要找到新的訓練方法通過AI輔助來提升判斷能力。
小申能通過AI學到更高的水平,或許在理論上不是完全自覺的,但與他對圍棋AI的理
解認知與感受,相信有很深的關聯。
讓我印象很深的是2021年申真諝接受採訪談論對圍棋AI的看法,迄今我仍認為這是面
對AI時代人類棋手最有意味的回應。
申真諝說:“Bluespot(藍圈圈)是AI向人類推薦的,贏棋概率最高的一手棋。但是
之上,分明有什麼東西。”
“我最近終於領悟了勝負不是圍棋的一切。現在我更注重一盤棋的過程。對局前我的
狀態是否足夠集中於一盤棋?對局中我有沒有下輕率的一手棋?局面有利時,我有沒有自
滿?局面不利時,我有沒有早早放棄了?出現了失誤時,我有沒有努力扳轉局面?總之,
我對圍棋有了敬畏之心。”(參見訪談——申真諝:AI讓人類跳出藩籬,追求更深奧的圍
棋藝術)
我將這段話放在武大圍棋課第二學期第一節課的PPT上,用來展示一種人類對待AI的
真正積極的態度(不只是圍棋)。
AI所呈現出的“棋局的真實”,呼喚著棋手去不斷找尋新的理解和語言,這種找尋需
要謙卑的理智作為德性基礎,而自大者將會陷入矛盾和茫然。到這裡,棋與人的關系開始
顯露。
之所以說申真諝體現了“闇然而日章”的君子之道,一部分是因為他並非早早就鋒芒
畢露站在頂峰接受膜拜,而是經歷了很長一段時期的低谷,甚至在艱難攀登和追趕的路途
中被對手多次嘲諷,被命運之神的滑標捉弄到面壁落淚,被無端的污衊氣得睡不著覺,卻
始終保持了一名棋士的品格和氣度,不得不還擊時還能保持不卑不亢的腔調。從純競技的
功利角度來說,小申最大的弱點或許是責任感太強,他顯然不止肩負著取勝奪冠乃至打破
紀錄的責任,還肩負著維護棋士形象、為行業樹立榜樣的責任,這些責任感在比賽中有時
會化為重擔,使他難以在決賽中進入無我的澄明之境,又無法完全拋開所有責任感去只考
慮贏這一件事。當然,農心杯上的傳奇表現,證明如今申真諝已經能夠完全擔起這些責任
,證明並非放棄責任才能沒有負擔地去贏。
那年小申被無端污衊時,我過於生氣,拉黑了一些跟風污衊他的棋友,並通過韓國的
朋友告訴小申,中國棋手裡也有很多反對無端污衊,維護棋士榮譽的朋友。這麼做是不希
望集體的公開沉默帶來誤解。之前韓國棋界的黛安娜事件,我通過金承俊老師向黛安娜女
士表達了來自中國棋手的支持,也是出於同樣的想法。出於各種各樣的原因和理由,我們
為公正所做的太少了,這對於被塗污的人們來說是很糟糕的,至少我們也應跟隨內心去表
達支持,即便與他們所受到的傷害相比是微不足道的。
2020年新冠疫情爆發時,家人在醫院一線工作,我留在武漢遭遇封城,深感自身的無
力無用,於是提議發起了圍棋界對災區的捐助,意外的是很快收到了來自韓國的捐贈請求
,第一位提出捐贈武漢災區的韓國棋手就是當時還不滿二十歲的申真諝,後來又有李昌鎬
和崔精,他們每人捐出了1000萬韓元來支援武漢抗疫(同時,捐贈在國內棋界也得到大量
支持,但也引起了“拒絕道德綁架”的言論)。這讓我想起2008年汶川大地震,李世石和
趙漢乘在亞洲杯決賽前就共同決定捐出全部獎金,那屆亞洲杯我輸給趙漢乘半目,當時多
麼希望能和他們一起完成善舉啊,在這樣的時刻和事件中,我才能感到我們身處同一個行
業共同體,而好的榜樣對於更年輕的從業者們相當重要。棋手這個職業,本就不生產任何
社會經濟生活所需求的用品,卻得到了不少物質獎勵和一些社會關注,如果棋手們既不去
探求人類精神與思維的界限,又不懂得回饋社會而只知無度索取,不屑於關注弱者而只知
成王敗寇,那麼這個職業存在的合法性根基很快就會鬆動了。
好在有申真諝這樣的棋手啊。無論是棋藝、對棋和AI的理解、對圍棋的態度,還是棋
品人品、對行業的認知與責任感、對棋道的傳承,申真諝都堪為棋界表率,未滿二十四歲
的他已經漸漸展現出什麼叫做“君子之道,闇然而日章”。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 124.9.75.1 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1708958235.A.894.html
※ 編輯: saulesmeitas (124.9.75.1 臺灣), 02/26/2024 22:38:34
推
02/27 02:37,
8月前
, 1F
02/27 02:37, 1F
推
02/27 09:06,
8月前
, 2F
02/27 09:06, 2F
推
02/27 10:29,
8月前
, 3F
02/27 10:29, 3F
推
02/27 11:05,
8月前
, 4F
02/27 11:05, 4F
推
02/27 11:45,
8月前
, 5F
02/27 11:45, 5F
→
02/27 11:47,
8月前
, 6F
02/27 11:47, 6F
→
02/27 11:48,
8月前
, 7F
02/27 11:48, 7F
→
02/27 11:49,
8月前
, 8F
02/27 11:49, 8F
→
02/27 11:49,
8月前
, 9F
02/27 11:49, 9F
→
02/27 11:51,
8月前
, 10F
02/27 11:51, 10F
推
02/27 12:18,
8月前
, 11F
02/27 12:18, 11F
→
02/27 13:26,
8月前
, 12F
02/27 13:26, 12F
→
02/27 13:27,
8月前
, 13F
02/27 13:27, 13F
→
02/27 13:28,
8月前
, 14F
02/27 13:28, 14F
→
02/27 13:29,
8月前
, 15F
02/27 13:29, 15F
推
02/27 13:31,
8月前
, 16F
02/27 13:31, 16F
→
02/27 13:32,
8月前
, 17F
02/27 13:32, 17F
→
02/27 13:33,
8月前
, 18F
02/27 13:33, 18F
→
02/27 13:36,
8月前
, 19F
02/27 13:36, 19F
→
02/27 13:37,
8月前
, 20F
02/27 13:37, 20F
→
02/27 13:38,
8月前
, 21F
02/27 13:38, 21F
推
02/27 13:56,
8月前
, 22F
02/27 13:56, 22F
→
02/27 13:56,
8月前
, 23F
02/27 13:56, 23F
→
02/27 13:57,
8月前
, 24F
02/27 13:57, 24F
→
02/27 13:57,
8月前
, 25F
02/27 13:57, 25F
→
02/27 13:59,
8月前
, 26F
02/27 13:59, 26F
→
02/27 13:59,
8月前
, 27F
02/27 13:59, 27F
→
02/27 14:00,
8月前
, 28F
02/27 14:00, 28F
推
02/27 23:02,
8月前
, 29F
02/27 23:02, 29F
→
02/27 23:02,
8月前
, 30F
02/27 23:02, 30F
推
02/28 01:47,
8月前
, 31F
02/28 01:47, 31F
推
02/28 14:50,
8月前
, 32F
02/28 14:50, 32F
推
02/28 16:31,
8月前
, 33F
02/28 16:31, 33F
推
02/29 08:46,
8月前
, 34F
02/29 08:46, 34F
推
02/29 13:21,
8月前
, 35F
02/29 13:21, 35F
推
02/29 16:04,
8月前
, 36F
02/29 16:04, 36F
→
02/29 17:43,
8月前
, 37F
02/29 17:43, 37F
推
02/29 19:41,
8月前
, 38F
02/29 19:41, 38F
→
02/29 19:41,
8月前
, 39F
02/29 19:41, 39F
推
02/29 19:48,
8月前
, 40F
02/29 19:48, 40F
推
02/29 21:09,
8月前
, 41F
02/29 21:09, 41F
→
02/29 21:10,
8月前
, 42F
02/29 21:10, 42F
推
02/29 21:14,
8月前
, 43F
02/29 21:14, 43F
推
02/29 21:18,
8月前
, 44F
02/29 21:18, 44F
→
02/29 21:19,
8月前
, 45F
02/29 21:19, 45F
推
02/29 21:23,
8月前
, 46F
02/29 21:23, 46F
→
02/29 21:24,
8月前
, 47F
02/29 21:24, 47F
→
02/29 21:26,
8月前
, 48F
02/29 21:26, 48F
推
03/01 06:17,
8月前
, 49F
03/01 06:17, 49F
推
03/01 08:51,
8月前
, 50F
03/01 08:51, 50F
推
03/01 13:07,
8月前
, 51F
03/01 13:07, 51F
推
03/02 00:07,
8月前
, 52F
03/02 00:07, 52F
推
03/02 04:30,
8月前
, 53F
03/02 04:30, 53F
GO 近期熱門文章
21
44
PTT遊戲區 即時熱門文章
-9
30
-65
138
34
86
46
153
28
65
14
45