Re: [討論] alphago繼續發展下去
※ 引述《forgetta ( )》之銘言:
: 想請教問關於水平線效應的問題
: 之前會聽說哪個版本的AG可以讓哪個版本幾顆 這些對戰是怎麼來的?
: 因為王銘琬老師的書中有寫到水平線效應
: 如果AI勝率太低的時候會開始亂下追求翻盤的機會 例如對李世石的比賽就有出現
: 但如果是讓兩子開始下 為什麼不會一開局就出現水平線效應 而還可以授子獲勝?
: (例如讓兩子 會不會一開始計算出的勝率就只有1%?)
我解釋一下好了,其實我們看起來所謂的亂下追求翻盤,在AI自己看來其實它還
是很認真下,而且並沒有因為勝率低而改變思考方式,亂下是人類的解讀。
為什麼會出現人類覺得亂下的情況?
舉個例子,現在我持黑,盤面已經慘輸四十目而且快小收官了。現在我考慮兩手
棋:
A :穩穩收個官子,賺到個一目
B :亂下個奇怪的地方,對方就算不應我也沒賺還可能倒虧十目
如果是人類,不用多想也會選A。可是AI眼裡不是長這樣的:
A :勝率1%
B :勝率0.8%
AI完全不會考慮目數的差別,輸半目跟輸五十目都是輸,沒有高下之分。所以當
不同著手勝率接近時,事實上會帶有一定隨機性地選擇要下哪一手。所以假設只有這
兩手,則AI選A或B的機率很可能接近50-50。
它並沒有因為勝率很低了所以「特別去下怪手」,而是因為到很確定落後的情況
下,最佳的下法跟白癡下法勝率其實都差不了多少了。而我們知道,好的下法可能就
那一兩手,但爛下法可是遍布全盤啊。那麼在所有下法機率差不多的情況下,選到爛
手的可能性當然就明顯高很多了。
那麼為什麼不會前期讓兩子就開始亂下呢?主要可能有幾個原因:
1. 序盤其實不確定性還很高,在沒算清的情況下,勝率其實不會直接低到最佳著手
跟亂下差不多的情況。比如說好好下還是有個33%勝率,但亂下一手直接掉到26%,差
別大的情況就還是會從最佳著手之中來選取,而不會選到明顯亂下的部分。即便AI計
算能力很強,目前不至於有能力讓二子就算清到覺得勝率剩1%的程度。
2. 另外就是自從李世石的一勝後,這個問題應該也有被特別考慮,是有一些手段可
以減輕這種亂下情況的。
3. 再來就是計算力提升得更高的情況下,AI更有機會找到勝率更高的好手,也更能
算清下得不好會有多慘,因此好手跟劣手的勝率估計應該會更有機會拉開,同第一點
的理由,AI就更有機會去選到好手,即便在大幅落後的情況。
--
「如果你沒法給我個解釋的話,死一萬次也不能彌補你的過錯!」
「我沒辦法死一萬次賠妳啊。」
「可是你有辦法半死兩萬次,知道嗎,嗯?」
--蓮.席斯塔
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.164.12
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1509817523.A.416.html
推
11/05 01:52,
8年前
, 1F
11/05 01:52, 1F
推
11/05 07:15,
8年前
, 2F
11/05 07:15, 2F
→
11/05 07:15,
8年前
, 3F
11/05 07:15, 3F
→
11/05 07:15,
8年前
, 4F
11/05 07:15, 4F
→
11/05 07:15,
8年前
, 5F
11/05 07:15, 5F
推
11/05 09:06,
8年前
, 6F
11/05 09:06, 6F
→
11/05 09:07,
8年前
, 7F
11/05 09:07, 7F
推
11/05 12:06,
8年前
, 8F
11/05 12:06, 8F
→
11/05 12:06,
8年前
, 9F
11/05 12:06, 9F
→
11/05 12:06,
8年前
, 10F
11/05 12:06, 10F
推
11/05 13:54,
8年前
, 11F
11/05 13:54, 11F
推
11/05 14:30,
8年前
, 12F
11/05 14:30, 12F
推
11/06 01:38,
8年前
, 13F
11/06 01:38, 13F
→
11/06 01:38,
8年前
, 14F
11/06 01:38, 14F
推
11/06 02:28,
8年前
, 15F
11/06 02:28, 15F
→
11/06 10:16,
8年前
, 16F
11/06 10:16, 16F
→
11/06 10:19,
8年前
, 17F
11/06 10:19, 17F
→
11/06 10:32,
8年前
, 18F
11/06 10:32, 18F
推
11/06 10:36,
8年前
, 19F
11/06 10:36, 19F
討論串 (同標題文章)
GO 近期熱門文章
PTT遊戲區 即時熱門文章