Re: [討論] 一題機率遊戲中的策略設計
※ 引述《brains (不認識)》之銘言:
: 甲乙兩人在玩一個機率遊戲。
: 每一回合裡:
: 甲和乙各自從[0,1]取一個實數,
: 選好後一起公開, 並把自己選的x值輸入給隨機系統作評判.
: 隨機系統有x的機率回傳"Yes", 有(1-x)的機率回傳"No".
: 若甲乙都收到"Yes", 則x值較小的一方得1分.
: 若一方收到"Yes", 另一方收到"No", 則收到"Yes"的一方得1分.
: 若甲乙都收到"No", 則大家都不得分.
: 若剛好甲乙都收到"Yes"且彼此的x值相等, 則大家各得0.5分.
: 新的回合要取新的x, 不停的比下去, 累積比分,
: 在某一定回合(如10回合)後比總分, 分數多方獲勝.
: 假設甲乙都是絕對理性,
: 請問: 他們將採取什麼樣的策略才能讓自己不敗呢?
下有令人厭煩的數學計算,不喜勿入
和原題或許稍有不同,我方考慮最安全的策略,
即尋找我方在敵方最佳策略下的最高期望值
假設取x得1分的機率為y
考慮對方的策略:
a. 對方選擇無限趨近x而小於x的另一個實數
b. 對方選擇1
先解釋一下為什麼只有這兩個選項:
若存在一數字k使對方選擇另一此數字會同時勝過a,b兩項
則若k > x,則這個選擇必比選項b差
(若要選擇大於對方的數字,選擇1最大化己方yes機率)
若k <= x,則這個選擇必比選項a差
(若要選擇小於對方的數字,選則最接近對方的數字最大化己方Yes機率)
如果上面的解釋接受的話,那我們來考慮一下在x等於多少時,
應對這兩個策略有最高的最低期望值
小弟的數學都忘得差不多了,計算方法有比較繁瑣的地方請見諒
a策略中, y = x(1-x) / [1-(1-x)(1-x)]
解釋一下,得分的情況是我方回傳yes(機率為x)而敵方回傳no(機率無限趨近1-x)
樣本空間則是雙方間有人得分的情況,也就是1-(雙方都no的機率)
y = x(1-x) / [1-(1-x)^2]
b 策略中
y = x
接下來的推論要先屏除x = 1 和 0的情況,不過這不影響,因為這兩個選擇都是最糟的
選擇0時,我方永遠沒有得分的機會,
選擇1時,對方可以選擇無限趨近於1的值,造成我方得分機率無限小
選擇a策略的條件是:
x > x(1-x) / [1-(1-x)^2]
-> [1-(1-x)^2] > (1-x)
-> (1-x)^2 < x
-> x^2 - 3x + 1 < 0
-> (x - 3/2)^2 < 5/4
-> -根號(5/4) < x - 3/2 < 根號(5/4)
-> 3/2 - 根號(5/4) < x < 3/2 + 根號(5/4) 後項大於1,和題目要求的範圍不合
故可知當x > (3-根號5) / 2 時, 對方會選擇a策略,否則會選b策略
在敵方選擇b策略的區間,我方的最大期望值很單純,就是(3-根號5) / 2 (y=x)
若在敵方選擇a策略的區間有更好的結果,則
x(1-x) / [1-(1-x)^2] > (3-根號5) / 2
-> x(1-x) / (2x - x^2) > (3-根號5) / 2
-> (1-x) / (2-x) > (3-根號5) / 2
-> 2-2x > (3-根號5)(2-x)
-> 2*根號5 - 4 > (根號5-1)x
-> x < 2(根號5 - 2)/(根號5-1)
-> x < (根號5 - 2)(根號5 + 1) / 2
-> x < (3-根號5) / 2
這和前面的結果矛盾(請看前面我們得到的結論)
故我方沒辦法在敵方選擇a策略的區間中找到更佳的策略
故得結論,若我方選擇(3-根號5) / 2,則無論對方之策略,
我方的得分期望值皆可保持(3-根號5) / 2
是在這個遊戲中最安全的策略
若有錯誤請指正
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.166.249.166
推
02/07 11:26, , 1F
02/07 11:26, 1F
→
02/07 11:27, , 2F
02/07 11:27, 2F
→
02/07 11:28, , 3F
02/07 11:28, 3F
推
02/07 11:39, , 4F
02/07 11:39, 4F
→
02/07 11:40, , 5F
02/07 11:40, 5F
→
02/07 18:50, , 6F
02/07 18:50, 6F
→
02/07 18:51, , 7F
02/07 18:51, 7F
→
02/07 18:52, , 8F
02/07 18:52, 8F
→
02/07 18:52, , 9F
02/07 18:52, 9F
討論串 (同標題文章)
Inference 近期熱門文章
3
13
PTT遊戲區 即時熱門文章