Re: [討論] 一題機率遊戲中的策略設計

看板Inference (推理遊戲)作者 (完美駱駝)時間15年前 (2010/02/07 02:09), 編輯推噓2(207)
留言9則, 2人參與, 最新討論串2/5 (看更多)
※ 引述《brains (不認識)》之銘言: : 甲乙兩人在玩一個機率遊戲。 : 每一回合裡: : 甲和乙各自從[0,1]取一個實數, : 選好後一起公開, 並把自己選的x值輸入給隨機系統作評判. : 隨機系統有x的機率回傳"Yes", 有(1-x)的機率回傳"No". : 若甲乙都收到"Yes", 則x值較小的一方得1分. : 若一方收到"Yes", 另一方收到"No", 則收到"Yes"的一方得1分. : 若甲乙都收到"No", 則大家都不得分. : 若剛好甲乙都收到"Yes"且彼此的x值相等, 則大家各得0.5分. : 新的回合要取新的x, 不停的比下去, 累積比分, : 在某一定回合(如10回合)後比總分, 分數多方獲勝. : 假設甲乙都是絕對理性, : 請問: 他們將採取什麼樣的策略才能讓自己不敗呢? 下有令人厭煩的數學計算,不喜勿入 和原題或許稍有不同,我方考慮最安全的策略, 即尋找我方在敵方最佳策略下的最高期望值 假設取x得1分的機率為y 考慮對方的策略: a. 對方選擇無限趨近x而小於x的另一個實數 b. 對方選擇1 先解釋一下為什麼只有這兩個選項: 若存在一數字k使對方選擇另一此數字會同時勝過a,b兩項 則若k > x,則這個選擇必比選項b差 (若要選擇大於對方的數字,選擇1最大化己方yes機率) 若k <= x,則這個選擇必比選項a差 (若要選擇小於對方的數字,選則最接近對方的數字最大化己方Yes機率) 如果上面的解釋接受的話,那我們來考慮一下在x等於多少時, 應對這兩個策略有最高的最低期望值 小弟的數學都忘得差不多了,計算方法有比較繁瑣的地方請見諒 a策略中, y = x(1-x) / [1-(1-x)(1-x)] 解釋一下,得分的情況是我方回傳yes(機率為x)而敵方回傳no(機率無限趨近1-x) 樣本空間則是雙方間有人得分的情況,也就是1-(雙方都no的機率) y = x(1-x) / [1-(1-x)^2] b 策略中 y = x 接下來的推論要先屏除x = 1 和 0的情況,不過這不影響,因為這兩個選擇都是最糟的 選擇0時,我方永遠沒有得分的機會, 選擇1時,對方可以選擇無限趨近於1的值,造成我方得分機率無限小 選擇a策略的條件是: x > x(1-x) / [1-(1-x)^2] -> [1-(1-x)^2] > (1-x) -> (1-x)^2 < x -> x^2 - 3x + 1 < 0 -> (x - 3/2)^2 < 5/4 -> -根號(5/4) < x - 3/2 < 根號(5/4) -> 3/2 - 根號(5/4) < x < 3/2 + 根號(5/4) 後項大於1,和題目要求的範圍不合 故可知當x > (3-根號5) / 2 時, 對方會選擇a策略,否則會選b策略 在敵方選擇b策略的區間,我方的最大期望值很單純,就是(3-根號5) / 2 (y=x) 若在敵方選擇a策略的區間有更好的結果,則 x(1-x) / [1-(1-x)^2] > (3-根號5) / 2 -> x(1-x) / (2x - x^2) > (3-根號5) / 2 -> (1-x) / (2-x) > (3-根號5) / 2 -> 2-2x > (3-根號5)(2-x) -> 2*根號5 - 4 > (根號5-1)x -> x < 2(根號5 - 2)/(根號5-1) -> x < (根號5 - 2)(根號5 + 1) / 2 -> x < (3-根號5) / 2 這和前面的結果矛盾(請看前面我們得到的結論) 故我方沒辦法在敵方選擇a策略的區間中找到更佳的策略 故得結論,若我方選擇(3-根號5) / 2,則無論對方之策略, 我方的得分期望值皆可保持(3-根號5) / 2 是在這個遊戲中最安全的策略 若有錯誤請指正 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.166.249.166

02/07 11:26, , 1F
對方若選比 (3-sqrt(5))/2 略小就會勝
02/07 11:26, 1F

02/07 11:27, , 2F
我們要算的是雙方得分差, 不是己方得分
02/07 11:27, 2F

02/07 11:28, , 3F
這題的不敗策略是個混合策略, 不是純策略 :3
02/07 11:28, 3F

02/07 11:39, , 4F
又, 我發現我上次推的解有筆誤, 應該是
02/07 11:39, 4F

02/07 11:40, , 5F
P(x) = 0 when x < 1/3; 1/(4x^3) otherwise
02/07 11:40, 5F

02/07 18:50, , 6F
樓上誤會我的想法了,當對方永遠以最佳應法時,我方事
02/07 18:50, 6F

02/07 18:51, , 7F
實上沒有很好的策略能獲得大於1/2的勝績
02/07 18:51, 7F

02/07 18:52, , 8F
另外,我提出的只是最安全的純策略(上面也提到了,和原
02/07 18:52, 8F

02/07 18:52, , 9F
題稍有出入)
02/07 18:52, 9F
文章代碼(AID): #1BRR1o7x (Inference)
文章代碼(AID): #1BRR1o7x (Inference)