Re[5]: парадокс конвертов
От: Sealcon190 Соломоновы острова  
Дата: 25.08.09 04:04
Оценка: +2
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Но у меня самого не получается это воспроизвести. Наверное нужен генератор действительно случайных чисел,

ШЕ>а не псевдослучайных.

Тут дело не в генераторе Просто ты строишь эксперимент по условию задачи. Генерируешь два числа и с ними работаешь.

А чтобы что-то изменилось, надо его строить по ходу рассуждений. Генерировать сначала одно число (которое мы выбрали), потом второе.

Другими словами, ты только что доказал что источник парадокса — банальная ошибка в рассуждениях. Вера что при смене конвертов будет выигрыш — мракобесие (что кстати неудивительно, учитывая что направлено это всё на биржевых игроков).
Re[15]: Нифиа себе "гарантии"... ;)
От: D14  
Дата: 10.09.09 19:52
Оценка: -1 :)
Здравствуйте, Erop, Вы писали:

Смотри. Пускай у нас реализуется неупорядоченная пара чисел
{2^n,2^(n+1)} с вероятностью 2^n/3^(n+1) — пока все как в вики.
Пускай нам открывают ОБА (для наглядности, без потери общности) конверта.
Стратегия1 — выбираем большую сумму
Стратегия2 — выбираем меньшую сумму
Матожидание обоих стратегий — бесконечность, якобы поэтому по-твоему их сравнивать нельзя. Далее, ты пишешь
E>Если уж корректно считать, надо оценивать вероятность выигрыша при той или иной стратегии. Или вероятность выигрыша более такой-то суммы и т. п., а не некоторый кусок матожидания считать...
P{Стратегия1 приносит прибыль 2^n}=2^(n-1)/3^n
P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
Вероятность выиграть более такой суммы сам знаешь как подсчитать. Она меньше 1
Итак, согласно ТВОИМ аргументам в последней редакции сравнивать стратегии можно. И твои наезды на бесконечное м.о. пока никакой убедительной апологетикой не подкреплены.

E>А когда же он выходит-то? А когда мы привлекаем к делу условную вероятность! Типа говорим: "ну поиграем в эту игру 1000 раз, отберём те случаи, когда в первом вскрытом конверте было 100 рублей и посмотрим, стоило ли в этом случае менять конверт". И получаем что, стоило. Потом, говорим, что от суммы рублей этот вывод не зависит и выводим, что стоило всегда. При этом тут явно где-то есть ошибка в логике!

Где ошибка? Остальное все верно — парадокс в том, что менять надо строго всегда.

E>IMHO, это обозначает, что мы неверно суммировали. Если бы мы посмотрели верно, то заметили бы, что на этой конкретной 1000 опытов были такие суммы, которые выгодно менять и были такие, которые выгодно не менять, при этом одни в точности компенсировали другие, так что менять или не менять "не глядя" было всё равно. Так ведь?

Мы не проводим опыты. У нас есть абстракция — априорная совместная функция распределения. Собственно, для того и вводят абстракцию вероятности, чтобы рассуждать о результатах опытов, не проводя их. Согласно функции распределения мы считаем условные вероятности, не пользуясь предельным переходом вообще. В условном м.о. для второго конверта я насчитал всего 3 знака сложения.

E>Лучше ты почитай внимательно. Если чувак раорится с вероятностью 1е-10, то называется это верный доход, а не "проиграет почти наверняка"...

Ну, на самом-то деле при игре с бесконечно богатым противником, сиречь если мы не ограничиваем количество желающих сыграть в лотерею, чувак разорится почти всегда даже с конечным м.о. А с бесконечным м.о. возникнут еще большие сложности. Я сейчас не готов сказать, какие именно.
Re: Ещё добавлю для понимания.
От: Sealcon190 Соломоновы острова  
Дата: 25.08.09 07:25
Оценка: 2 (1)
Парадокс происходит из-за необоснованного обобщения. Достаточно стандартная логическая ошибка, которую в этом случае непросто заметить.

Из предположения ("предположим мы вытянули конверт с 10$") делается обобщение на всё решение.

Это всё равно что в задаче "какова вероятность что оба ребёнка в семье — мальчики" рассуждать следующим образом: предположим что один из детей — мальчик. Тогда вероятность того что второй тоже мальчик — 1/2. Следовательно вероятность того что оба мальчики — 1/2.
Re[3]: парадокс конвертов
От: Sealcon190 Соломоновы острова  
Дата: 25.08.09 08:01
Оценка: 2 (1)
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>И что? Какой вывод следует из это системы?

ШЕ>Я не спорю, просто не понимаю.
ШЕ>Можно ещё и вывод из этой системы на пальцах
ШЕ>Желательно тоже в числах.

В смысле, если будешь менять конверты — взвешенная сумма получается 45*n/2. Если не будешь — тоже 45*n/2. Можешь расширять на любое количество пар чисел, результат будет тот же. Ценность подхода в том что он наглядно показывает, откуда берётся ошибочное решение.
Re[4]: парадокс конвертов
От: gecko  
Дата: 26.08.09 13:53
Оценка: 1 (1)
Здравствуйте, Sealcon190, Вы писали:

S>Здравствуйте, Шебеко Евгений, Вы писали:


S>Я думаю на мембране при переводе просто чего-то недопоняли, и реальная задача над которой народ бьётся лишь похожа на парадокс конвертов.


Если бы допоняли, то было бы не о чем писать.

Объяснение парадокса очень простое: неявно предполагается, что сумма имеет равномерное распределение, но равномерное распределение может быть только на множестве конечной длины.
Re: парадокс конвертов
От: __kot2  
Дата: 26.08.09 14:01
Оценка: 1 (1)
>Допустим, вы увидели $10. Стало быть, в другом конверте лежат либо $5, либо $20 с вероятностью 50 х 50. По теории вероятности средневзвешенная сумма в конверте B равна: 0,5 х $5 + 0,5 х $20 = $12,5.
Весь "парадокс" тут в том, что формула для равномерного распределения применятся к неравномерному распределению.
Re[9]: Ещё добавлю для понимания.
От: Erop Россия  
Дата: 08.09.09 11:45
Оценка: 1 (1)
Здравствуйте, Serpenter_e, Вы писали:

S_>Для парадокса достаточно построить такую f(x) что ее площадь на [0, +бесконечность) равна 1 и при этом для любого x: f(x/2)=f(2*x).


Не поможет! Ты не сможешь сделать члены этой последовательности равновероятными!
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[6]: парадокс конвертов
От: komaz Россия  
Дата: 26.08.09 12:42
Оценка: +1
Здравствуйте, Sealcon190, Вы писали:

S>Здравствуйте, Шебеко Евгений, Вы писали:


ШЕ>>Но у меня самого не получается это воспроизвести. Наверное нужен генератор действительно случайных чисел,

ШЕ>>а не псевдослучайных.

S>Тут дело не в генераторе Просто ты строишь эксперимент по условию задачи. Генерируешь два числа и с ними работаешь.


S>А чтобы что-то изменилось, надо его строить по ходу рассуждений. Генерировать сначала одно число (которое мы выбрали), потом второе.


S>Другими словами, ты только что доказал что источник парадокса — банальная ошибка в рассуждениях. Вера что при смене конвертов будет выигрыш — мракобесие (что кстати неудивительно, учитывая что направлено это всё на биржевых игроков).


Если генерировать сначала одно число (выбирать первый конверт), потом с вероятностями .5 это число делить/умножать на 2, то честно вылезает 5/4 для второго конверта:
proc getAmount {} {
  return [expr {rand() * 1000}]
}

#Returns 1 if we took envelope with smaller amount
proc isLower {} {
  return [expr {rand() < 0.5}]
}

set s1 0
set s2 0

set repeatCount 100000

for {set i 0} {$i < $repeatCount} {incr i} {
  set amount [getAmount]
  set s1 [expr {$s1 + $amount}]
  if {[isLower]} {
    set amount [expr {$amount * 2}]
  } else {
    set amount [expr {$amount / 2}]
  }
  set s2 [expr {$s2 + $amount}]
}

puts "s1 = $s1"
puts "s2 = $s2"
puts "s1/s2 = [expr {$s1/$s2}]"
puts "(s1/s2) / (4/5) = [expr {$s1/$s2*5/4}]"


Результаты (на мильоне итераций):
ivan@ivan-desktop:~/temp$ tclsh envelopes.tcl
s1 = 500029203.69417316
s2 = 624746691.645451
s1/s2 = 0.800371111013332
(s1/s2) / (4/5) = 1.000463888766665
Re: ура у меня получилось
От: Шебеко Евгений  
Дата: 27.08.09 10:46
Оценка: :)
Если немного схитрить, и знать максимальное значение, что в реальной жизни не так уж сложно,
то можно получить результат.
Подводить теорию под полученый результат не берусь.

#include <windows.h>
#include <iostream>
#include <string>
#include <time.h>

void process()
{
    srand(GetTickCount());
    unsigned long long s1=0;
    unsigned long long s2=0;

    for(unsigned i=0;i<1000000;i++)
    {
        unsigned sum_in_konv=rand();
        bool k=rand()>(RAND_MAX/2);
        unsigned k1,k2;
        
        if(k)
        {
            k1=sum_in_konv;
            k2=2*sum_in_konv;
        }
        else
        {
            k1=2*sum_in_konv;
            k2=sum_in_konv;
        }

        
        s1+=k1;
        
        if(k1>RAND_MAX)s2+=k1;//RAND_MAX не весь интервал!!!, а его половина
        else s2+=k2;

    }

    std::cout<<"s1="<<s1<<" "<<"s2="<<s2<<"    s2/s1="<<(100.0*s2/s1)<<"%"<<std::endl;
}

int main(int argc, char **argv)
{
    for(unsigned i=0;i<100;i++)
        process();
}


Результаты впечатляют своей стабильностью:
s1=24546949139 s2=30694479460    s2/s1=125.044%
s1=24560893535 s2=30710488678    s2/s1=125.038%
s1=24585791976 s2=30742944797    s2/s1=125.044%
s1=24620524813 s2=30759645443    s2/s1=124.935%
s1=24579211830 s2=30707872876    s2/s1=124.934%
s1=24582054004 s2=30730283229    s2/s1=125.011%
s1=24607422121 s2=30741830560    s2/s1=124.929%
s1=24561927817 s2=30712296632    s2/s1=125.04%
s1=24559902073 s2=30698886099    s2/s1=124.996%
s1=24554223039 s2=30698041104    s2/s1=125.021%
s1=24567636393 s2=30705691273    s2/s1=124.984%
s1=24575286287 s2=30728637714    s2/s1=125.039%
s1=24551435312 s2=30691547196    s2/s1=125.009%
s1=24555606330 s2=30704422670    s2/s1=125.04%
s1=24577384258 s2=30711534174    s2/s1=124.959%
s1=24548978959 s2=30725324968    s2/s1=125.159%
s1=24574621487 s2=30706210161    s2/s1=124.951%
s1=24554292007 s2=30697540278    s2/s1=125.019%
s1=24582789909 s2=30732642987    s2/s1=125.017%
s1=24580177681 s2=30744013624    s2/s1=125.076%
s1=24576456028 s2=30721674398    s2/s1=125.004%
s1=24595916492 s2=30736019965    s2/s1=124.964%
s1=24596194075 s2=30749198954    s2/s1=125.016%
s1=24571307310 s2=30718048007    s2/s1=125.016%
s1=24568544816 s2=30708698131    s2/s1=124.992%
s1=24563260333 s2=30717879727    s2/s1=125.056%
s1=24589737228 s2=30734345214    s2/s1=124.989%
s1=24559990801 s2=30700910225    s2/s1=125.004%
s1=24566715224 s2=30713494796    s2/s1=125.021%
s1=24571715918 s2=30716988657    s2/s1=125.01%
s1=24584754414 s2=30735099610    s2/s1=125.017%
s1=24593936808 s2=30741224577    s2/s1=124.995%
s1=24591867373 s2=30747645426    s2/s1=125.032%
s1=24575439989 s2=30745472388    s2/s1=125.106%
s1=24585057508 s2=30738409985    s2/s1=125.029%
s1=24575085458 s2=30714543631    s2/s1=124.982%
s1=24570080911 s2=30721673047    s2/s1=125.037%
s1=24582771879 s2=30715127866    s2/s1=124.946%
s1=24550059418 s2=30697454146    s2/s1=125.04%
s1=24599338496 s2=30735947804    s2/s1=124.946%
s1=24574302161 s2=30721915306    s2/s1=125.016%
s1=24570063164 s2=30702752341    s2/s1=124.96%
s1=24561016466 s2=30709836827    s2/s1=125.035%
s1=24587454900 s2=30702753778    s2/s1=124.872%
s1=24560350145 s2=30724493237    s2/s1=125.098%
s1=24527007235 s2=30666353733    s2/s1=125.031%
s1=24596760730 s2=30731154561    s2/s1=124.94%
s1=24561095354 s2=30688153214    s2/s1=124.946%
s1=24610536780 s2=30728377951    s2/s1=124.859%
s1=24585487329 s2=30729690136    s2/s1=124.991%
s1=24553537584 s2=30690491714    s2/s1=124.994%
s1=24573517687 s2=30723710924    s2/s1=125.028%
s1=24551801878 s2=30697942852    s2/s1=125.033%
s1=24556187659 s2=30700120674    s2/s1=125.02%
s1=24568082266 s2=30718324583    s2/s1=125.033%
s1=24555348375 s2=30702485042    s2/s1=125.034%
s1=24553728242 s2=30703771700    s2/s1=125.047%
s1=24581908751 s2=30716957616    s2/s1=124.958%
s1=24577622068 s2=30682774985    s2/s1=124.84%
s1=24584992569 s2=30731091294    s2/s1=124.999%
s1=24580864275 s2=30714441934    s2/s1=124.953%
s1=24575506719 s2=30704054626    s2/s1=124.938%
s1=24585417685 s2=30718556604    s2/s1=124.946%
s1=24583324627 s2=30734677795    s2/s1=125.022%
s1=24555394279 s2=30705710659    s2/s1=125.047%
s1=24559022936 s2=30708583477    s2/s1=125.04%
s1=24589750781 s2=30723401895    s2/s1=124.944%
s1=24571638727 s2=30713879235    s2/s1=124.997%
s1=24575630658 s2=30712046246    s2/s1=124.97%
s1=24594090352 s2=30741712600    s2/s1=124.996%
s1=24587835905 s2=30736865711    s2/s1=125.008%
s1=24577145597 s2=30727776572    s2/s1=125.026%
s1=24587979752 s2=30741134282    s2/s1=125.025%
s1=24573420980 s2=30714309643    s2/s1=124.99%
s1=24587311181 s2=30724549139    s2/s1=124.961%
s1=24592205462 s2=30731974516    s2/s1=124.966%
s1=24621085756 s2=30801556601    s2/s1=125.102%
s1=24578836238 s2=30732908545    s2/s1=125.038%
s1=24577099194 s2=30726316189    s2/s1=125.02%
s1=24572211105 s2=30709723765    s2/s1=124.977%
s1=24572134900 s2=30716518714    s2/s1=125.005%
s1=24599174192 s2=30723920509    s2/s1=124.898%
s1=24577926164 s2=30719932288    s2/s1=124.99%
s1=24582842308 s2=30716818473    s2/s1=124.952%
s1=24548497626 s2=30693338715    s2/s1=125.031%
s1=24547843267 s2=30694329854    s2/s1=125.039%
s1=24567516593 s2=30706293485    s2/s1=124.987%
s1=24572938000 s2=30718176868    s2/s1=125.008%
s1=24549177461 s2=30696152534    s2/s1=125.039%
s1=24578885260 s2=30738461786    s2/s1=125.06%
s1=24573700517 s2=30731301247    s2/s1=125.058%
s1=24565321936 s2=30725915849    s2/s1=125.078%
s1=24572675396 s2=30713699988    s2/s1=124.991%
s1=24579858602 s2=30733465612    s2/s1=125.035%
s1=24562398452 s2=30710625770    s2/s1=125.031%
s1=24592598611 s2=30749487962    s2/s1=125.036%
s1=24531352672 s2=30683840810    s2/s1=125.08%
s1=24545429789 s2=30688615772    s2/s1=125.028%
s1=24578603179 s2=30726552900    s2/s1=125.013%
s1=24566544473 s2=30712968136    s2/s1=125.019%
Re[6]: Ещё добавлю для понимания.
От: Serpenter_e  
Дата: 08.09.09 09:12
Оценка: :)
Здравствуйте, Serpenter_e, Вы писали:

S_> Невозможно построить равномерное распределение на бесконечности


вот написал и понял что возможно
Re[7]: Что на самом деле надо решать.
От: D14  
Дата: 08.09.09 18:19
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>Вот смотри. Пусть мы знаем, как распределены суммы в конвертах.

E>Тогда мы можем написать условную вероятность того, что выбранный нами конверт содержит меньшую из сумм, при условии, что он содержит х рублей. Ну и тогда мы имеем простую задачку про то, что вот есть типа условная вероятность и то сё. И всё легко считается без всяких парадоксов.

Парадокс все равно остается
В http://en.wikipedia.org/wiki/Two_envelopes_problem рассмотрен вариант с априорно заданным корректным распределением появления чисел в конвертах. См. An even harder problem.
Re[9]: Что на самом деле надо решать.
От: D14  
Дата: 09.09.09 06:36
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, D14, Вы писали:


D14>>В http://en.wikipedia.org/wiki/Two_envelopes_problem рассмотрен вариант с априорно заданным корректным распределением появления чисел в конвертах. См. An even harder problem.


E>а в чём парадокс-то?


Парадокс тот же, что и в исходной задаче. Описанный в википедии вариант лишен недостатка исходной формулировки, в которой нельзя заформализовать функцию распределения исходов, чтобы условные вероятности равнялись бы 0.5. Но достигается это ценой усложнения формулировки математическими подробностями. А именно, в модифицированном варианте априори задана совместная функция распределения величин в конвертах такая, что

P{в другом конверте находится сумма x/2| в выбранном конверте находится x}=p(x)
P{в другом конверте находится сумма x*2| в выбранном конверте находится x}=1-p(x)
, где x=1,2,4,8,…. , P — вероятность, | — "при условии"
Тогда искомое матожидание

0.5*x*p(x)+2*x*(1-p(x)) = 1.1*x > x для любого x(кроме x=1,тогда в другом конверте всегда 2)
т.е. всегда выгодно открыть другой конверт.
Парадокс: если мы сразу выберем "другой" конверт, то согласно стратегии вроде бы должны выбрать исходный конверт.

В оригинале:
This means that the player should switch in all cases.
But once again, the player may go through this reasoning before opening either envelope, and deduce that the other envelope should always be chosen. This conclusion is just as clearly wrong as it was in the first and second cases. But now the flaws noted above don't apply; the x in the expected value calculation is a known constant (in every single case) and the probabilities in the formula are obtained from a specified and proper prior distribution.
Re[9]: Что на самом деле надо решать.
От: D14  
Дата: 10.09.09 20:09
Оценка: :)
Здравствуйте, Eugene Sh, Вы писали:

ES>Звучит довольно очевидно. Но это только до тех пор, пока мы не попытаемся объяснить это с математической точки зрения.

А в чем же до этого была нематематичность?
ES>А для этого надо будет научиться сравнивать 2 стратегии (чтобы объяснить, почему одна из них лучше).
ES>Попробуйте сделать это, увидите кое-что интересное.
Я так не играю.
ES>Абстрагируясь от конкретных описанных стратегий, рассмотрим просто Стратегию A и Стратегию B. Как определить, какая из них лучше?
У вас есть bubble sort и merge sort. Есть распределение встречающихся длин массивов. Как сравнить, какой алгоритм быстрее? Ведь можно же, не правда ли?
ES>В итоге, приведенный "even harder problem" парадокс более интересен, чем оригинальный, но он все равно не является парадоксом с математической точки зрения.
Возможно.
ES>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.
Другое Не менять конверт? Аргументы в студию.
Re[18]: да чего там мелочиться-то?
От: D14  
Дата: 11.09.09 05:58
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>Вот тебе игра "ещё лучше".

E>Пусть ведущий не морочит нам и себе голову, а просто кладёт в сейф какую-то сумму денег.
E>Сумма распределена, как в примере в вики.
E>Игра такая. Он кладёт, а мы открываем сейф и забираем бабки, или не открываем, а просим положить ещё раз, вынув предыдущую сумму.

E>Ну вот, в какой-то конкретный момент в сейфе сумма всего х рублёв. А матожидание от "следующего раза" бесконечно много. Так что всегда выгодно попросить "переположить ещё раз"


E>Что не так в этом рассуждении? Можешь сказать?


Все правильно. Ты выиграл 10 баксов. Тебе предлагают выиграть Форд. Ты выиграл Форд, тебе предлагают выиграть Бентли. и.т.д. Всегда выгодно.
Re[18]: да чего там мелочиться-то?
От: D14  
Дата: 11.09.09 09:11
Оценка: :)
Здравствуйте, Erop, Вы писали:

Продолжим

E>Вот тебе игра "ещё лучше".

E>Пусть ведущий не морочит нам и себе голову, а просто кладёт в сейф какую-то сумму денег.
E>Сумма распределена, как в примере в вики.
E>Игра такая. Он кладёт, а мы открываем сейф и забираем бабки, или не открываем, а просим положить ещё раз, вынув предыдущую сумму.

E>Ну вот, в какой-то конкретный момент в сейфе сумма всего х рублёв. А матожидание от "следующего раза" бесконечно много. Так что всегда выгодно попросить "переположить ещё раз"


E>Что не так в этом рассуждении? Можешь сказать?

Да, могу сказать. Все так. Ты получил вариант Санкт-петербургской лотереи. Ты выиграл сумму x. Должен ли ты еще раз сыграть в лотерею? Да. Кстати, что там м.о. = бесконечность тебя не смщало, когда ты кидал ссылки на тот топик. А вообще, я поймал себя на мысли, что тупо пересказываю тебе вики. Решил не тратить свое время, а просто процитировать фрагмент. Почитай плиз. последний абзац, прежде чем отвечать

Suppose that one has a ticket to the St. Petersburg lottery as stated in that problem. Should the player be willing to trade it for another ticket to the lottery? Since the St. Petersburg lottery has an infinite expected value, once the lottery ticket value is determined, no matter what (finite) value it is worth, the player should be willing to trade it for another ticket to a new, not yet drawn, lottery. However, even before the lottery ticket is drawn, the player could reason as follows: "My ticket has some finite value. No matter what it is, given my ticket's finite value I should switch to another ticket, which has an infinite expected value. Therefore I should keep switching tickets indefinitely." This is clearly absurd, and parallel to the envelope problem; conditioned on any particular finite value of a random variable with infinite expectation, the player should switch to another random variable with infinite expectation. The extra wrinkle in the envelope problem is that the second envelope's expectation appears to depend on the first. However, it is not clear that the player should truly prefer one infinite expected value to another.

However, Clark and Shackel argue that this blaming it all on "the strange behaviour of infinity" doesn't resolve the paradox at all; neither in the single case nor the averaged case. They provide a simple example of a pair of random variables both having infinite mean but where one is always better to choose than the other.[6] This is the best thing to do at every instant as well as on average, which shows that decision theory doesn't necessarily break down when confronted with infinite expectations.
Re[12]: Что на самом деле надо решать.
От: Eugene Sh Россия  
Дата: 11.09.09 20:10
Оценка: +1
Здравствуйте, D14, Вы писали:

D14>Например, м.о. дохода Стратегии2 на рубль дохода от Стратегии1.


D14>M[C2/C1]=sum(sum(y/x*P{C2=y,C1=x},y=2^(0,1...)),x=2^(0,1...))=

D14>sum(sum(y/x*P{C2=y|C1=x}*P{C1=x},y=2^(0,1...)),x=2^(0,1...))=
D14>sum((0.5*x*P{C2=0.5*x|C1=x}+2*x*P{C2=2*x|C1=x})/x*P{C1=x},x=2^(0,1...))
D14>пренебрегая случаем x=1
D14>sum(1.1*P{C1=x},x=2^(0,1...))=sum(1.1*P{C1=x},x=2^(0,1...))=1.1

Значения P{C2=0.5*x|C1=x} и P{C1=0.5*x|C2=x} равны между собой.
Также, равны между собой значения P{C2=2*x|C1=x} и P{C1=2*x|C2=x}.
Попробуем теперь вычислить "м.о. дохода Стратегии1 на рубль дохода от Стратегии2"
Выкладки будут те же самые, надо только поменять местами С1 и С2. С учетом только что описанных равенств получаем, что M[C1/C2] = 1.1
Таким образом, величина M не может служить хорошей характеристикой для сравнения стратегий, так как M[C1/C2] = M[C2/C1].

D14>Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

Я уже почти готов поверить, что есть способ сравнения, при котором Стратегия 2 оказывается лучше Стратегии 1. Но пока я его не видел.
Re[12]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 12.09.09 10:06
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>3) Усредняем по всем случаям и получаем общий результат.

E>Некорректным является третий шаг. Некорректен он сразу по двум причинам.
E>3а) В известных мне формулировках усреднений производится либо некорректно, либо путём написания слова "очевидно"
E>3б) На самом деле нам вообще нужно не усреднение, а переход от суммы как-то распределённых случайных величин, к распределению суммы.

Можно тут и условно сказать что усреднение не даст правильный результат, потому что здесь проигрыши будут на больших ставках происходить, выигрыши на меньших, а в усреднении это не учтется. При неизменном числе проигрышей, они смещаются в сторону больших ставок. (не сама сумма проигрыша а ставка на которой он случился). Если игроку скажут что будет 10 делений и 10 умножений но для разных ставок. Это ему ничего не скажет о прибыли. Если 10 делений на ставке 1000, а 10 умножений на ставке 100, то это убыток.И наоборот.

E>На самом деле тут нет ошибки. Ошибка состоит в том, что неверно применять МО, как оценку того, что будет "всегда".

E>В этой твоей "мультипликативной монетке" так всё и есть если повезёт, можно нереально наварится, но обычно не повезёт...

Вот говорили про обывательскую точку зрения (интерпретацию)... И с точки зрения обывателя,все-таки тоже хочется чтобы все сходилось, а не только по формулам. Но к счастью есть замечательное объяснение и закон. Который снимает полностью все вопросы, так что любой обыватель может спать спокойно.
Называется он "Закон подлости" (не шутка).
В случае с конвертами он активно работает.
Для игрока-обывателя это наблюдается как небольшая неприятность: На втором конверте прибыль +25% действительно есть, но она изчезает из-за того что выигрыши чаще случаются на маленьких ставках, а проигрыши на больших. Причем это действует ровно настолько чтобы убрать сомнительную прибыль. Он и на монетке работает, если не суммировать а умнажать к прибыли. Фокус в том что здесь конкретные размеры ставок не детерминированы в будущем, и закон подлости этим пользуется.

Но закон подлости не так плох. Он и в противоположную сторону работает, когда у игрока проблемы на пустом месте, в игре с суммированием.
Например выиграл игрок уже $1000 дальше предстоит на монетке либо +100,либо -100.
Значит здесь текущий капитал либо умножит на 1.1, либо разделит на 1.1111(1) .
Если постоянно равновероятно делить на большее число так и разориться недолго? Что делать,бросить все и бежать? Но закон подлости начнет уже помогать, компенсирует сомнительные убытки. Выигрыши будут чаще при игре на больший множитель, проигрыши на меньший. Фокус в том что здесь ставка-множитель не детерменирован в будущем, и закон подлости этим пользуется.

Так что это даже закон справедливости, а не подлости. Облегчающий жизнь обывателя
парадокс конвертов
От: Шебеко Евгений  
Дата: 24.08.09 11:05
Оценка:
Интересная статья почитать для общего развития.
Парадокс конвертов губит природную симметрию случая
Re: парадокс конвертов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 24.08.09 12:26
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Интересная статья почитать для общего развития.


Похоже, что я чего-то не понял. Попробовал изобразить простую игру с конвертами (ничего, что на lua?). И получаются всегда одинаковые суммы выигрыша.
Где я накосячил?
math.randomseed(os.time())

s1 = 0  --никогда не менять конверт
s2 = 0  --всегда менять конверт

for i = 1, 100000
do
    --генерация суммы в конверте
    --local sum_in_konv = math.random(1, 100)
    local sum_in_konv = 5 --Пусть даже сумма постоянная
    local k = math.random(1, 2)
    if
        k == 1
    then
        k1 = sum_in_konv
        k2 = 2 * sum_in_konv
    else
        k1 = 2 * sum_in_konv
        k2 = sum_in_konv
    end
    
    --выбор конверта
    local k = math.random(1, 2)
    if
        k == 1
    then  --выбран 1-й конверт
        s1 = s1 + k1
        s2 = s2 + k2
    else   --выбран 2-й конверт
        s1 = s1 + k2
        s2 = s2 + k1
    end
end
print(s1)
print(s2)
Re[2]: парадокс конвертов
От: Шебеко Евгений  
Дата: 24.08.09 12:58
Оценка:
N>Похоже, что я чего-то не понял. Попробовал изобразить простую игру с конвертами (ничего, что на lua?). И получаются всегда одинаковые суммы выигрыша.
Ну у меня не получаются во-первых. Наверное плохо генерируете случ. числа.
А во вторых статья немного не про это.

#include <iostream>
#include <string>
#include <time.h>


int main(int argc, char **argv)
{
    srand(time(0));
    unsigned long long s1=0;
    unsigned long long s2=0;

    for(unsigned i=0;i<100000;i++)
    {
        unsigned sum_in_konv=5;
        bool k=rand()>(RAND_MAX/2);
        unsigned k1,k2;
        
        if(k)
        {
            k1=sum_in_konv;
            k2=2*sum_in_konv;
        }
        else
        {
            k1=2*sum_in_konv;
            k2=sum_in_konv;
        }

        k=rand()>(RAND_MAX/2);

        if(k)
        {
            s1+=k1;
            s2+=k2;
        }
        else
        {
            s1+=k2;
            s2+=k1;
        }
    }

    std::cout<<"s1="<<s1<<std::endl;
    std::cout<<"s2="<<s2<<std::endl;
}


s1=748450
s2=751550
Re[3]: парадокс конвертов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 24.08.09 13:17
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

N>>Похоже, что я чего-то не понял. Попробовал изобразить простую игру с конвертами (ничего, что на lua?). И получаются всегда одинаковые суммы выигрыша.

ШЕ>Ну у меня не получаются во-первых. Наверное плохо генерируете случ. числа.

У тебя тоже, значит, не получилось. Начальная посылка статьи — при смене конверта должен увеличиться выигрыш:
sum_in_konv = 5
c = 3 * sum_in_konv / 2
print(c)
s2 = 0.5 * (c / 2) + 0.5 * (2 * c)
print(100000 * s2)

Т.е. в нашем случае C = 7.5, а s2 = 100000 * (5 / 4 * C) = 937500
Но этого не происходит ни у меня, ни у тебя.

ШЕ>А во вторых статья немного не про это.

Так я пытаюсь увидеть хотя бы проблему, о которой говорится в статье. Где она?
Re[4]: парадокс конвертов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 24.08.09 13:22
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>У тебя тоже, значит, не получилось. Начальная посылка статьи — при смене конверта должен увеличиться выигрыш:

N>
N>sum_in_konv = 5
N>c = 3 * sum_in_konv / 2
N>print(c)
N>s2 = 0.5 * (c / 2) + 0.5 * (2 * c)
N>print(100000 * s2)
N>

N>Т.е. в нашем случае C = 7.5, а s2 = 100000 * (5 / 4 * C) = 937500
N>Но этого не происходит ни у меня, ни у тебя.

Блин, туплю, туплю. Не смотрите на этот бред.
Re[4]: парадокс конвертов
От: Шебеко Евгений  
Дата: 24.08.09 13:32
Оценка:
N>Так я пытаюсь увидеть хотя бы проблему, о которой говорится в статье. Где она?
Если я правильно понял, то идея такая.
Но у меня самого не получается это воспроизвести. Наверное нужен генератор действительно случайных чисел,
а не псевдослучайных.


#include <iostream>
#include <string>
#include <time.h>


int main(int argc, char **argv)
{
    srand(time(0));
    unsigned long long s1=0;
    unsigned long long s2=0;

    for(unsigned i=0;i<1000000;i++)
    {
        unsigned sum_in_konv=rand();
        bool k=rand()>(RAND_MAX/2);
        unsigned k1,k2;
        
        if(k)
        {
            k1=sum_in_konv;
            k2=2*sum_in_konv;
        }
        else
        {
            k1=2*sum_in_konv;
            k2=sum_in_konv;
        }

        
        k=rand()>(RAND_MAX/2);
        if(k)s1+=k1;
        else s1+=k2;

        s2+=k2;
    }

    std::cout<<"s1="<<s1<<std::endl;
    std::cout<<"s2="<<s2<<std::endl;
}
Re[5]: парадокс конвертов
От: gecko  
Дата: 24.08.09 17:37
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

>Но у меня самого не получается это воспроизвести. Наверное нужен генератор действительно случайных чисел,

>а не псевдослучайных.

По условию сумма не ограничена сверху.
Re: парадокс конвертов
От: Sealcon190 Соломоновы острова  
Дата: 25.08.09 05:53
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Интересная статья почитать для общего развития.

ШЕ>Парадокс конвертов губит природную симметрию случая

В статье ход рассуждений неверный. "Если у нас в конверте 10$", и полетели обобщения. Между тем, вот это "если", оно просто обязано быть оформлено математически, поскольку имеет вероятностную основу.

Поясняю на пальцах. Вероятность выпадения любой пары чисел у нас одинакова, примем её за n.

Тогда фраза "если у нас в конверте 10$" означает следующее: с вероятностью n/2 у нас десятка из пары 10-5, и с вероятностью n/2 у нас десятка из пары 10-20.

Прекрасно, меняя конверт получаем взвешенную сумму: n/2 * 5 + n/2 * 20. Не меняя: n/2*10 + n/2*10. Всё по статье. Но обобщать это на все случаи категорически нельзя, потому как это условные вероятности, влияющие на соседние пары.

Для пояснения рассмотрим все пары конвертов, имеющие в составе десятку ( а не только те где десятка выбрана первой).

Вероятность конверт пара вс меняя вс не меняя

n/2 10 10-5 5*n/2 10*n/2

n/2 10 10-20 20*n/2 10*n/2

n/2 5 10-5 10*n/2 5*n/2

n/2 20 10-20 10*n/2 20*n/2

Статья для играющих на бирже лохов, имхо. Не верю что нормальный спец в тервере может такого не понимать.
Re[2]: парадокс конвертов
От: Шебеко Евгений  
Дата: 25.08.09 07:29
Оценка:
S>Вероятность конверт пара вс меняя вс не меняя
Насколько я понял всё же так
n/2 10   10-5   5*n/2     10*n/2
n/2 10   10-20  20*n/2    10*n/2
n/2 5    5-10   10*n/2    5*n/2
n/2 20   20-10  10*n/2    20*n/2

И что? Какой вывод следует из это системы?
Я не спорю, просто не понимаю.
Можно ещё и вывод из этой системы на пальцах
Желательно тоже в числах.

S>Статья для играющих на бирже лохов, имхо.

Статья общеобразовательная, к бирже вообще отношения не имеет.

Наоборот:

Понятно, что если игрок располагает информацией о приобретаемых финансовых инструментах (состояние компании, судебные дела против её менеджеров, урожай апельсинов в этом году или открытие нового месторождения нефти), он может составлять свой портфель осознанно. Но если ему не известно ничего, кроме текущей цены акции (или иного приобретения), и того, куда цена сейчас движется? Ни того, будет ли цена ещё падать, или позже начнётся рост? Ни того — является ли нынешняя цена максимальной, минимальной или позже будет огромный провал.


Но можно ли, допустим, применить следствие из парадокса Паррондо (или объяснения феномена конвертов) к фондовому рынку, то есть получить доход, комбинируя акции вроде игры АВВАВВ? Увы, парадокс требует, чтобы доходность по меньшей мере от одного инструмента зависела от величины текущего суммарного капитала (как выбор монеты от кратности уже выигранной суммы числу М), а это фикция. Или нет?




Мне вот интересно как они этого добились?

Ныне свыше 20 миллионов компьютерных симуляций, проведённых Макдоннелом и Эбботтом, показали, что стратегия Ковера позволяет получить больше денег в игре с конвертами, чем простой обмен. А ещё, открыли австралийские учёные, предопределённый обмен, когда игрок выбирает альтернативный конверт только в том случае, если увиденная в первом сумма меньше заранее и наугад выбранного им самим (игроком) значения, тоже работает.

Re[3]: парадокс конвертов
От: Sealcon190 Соломоновы острова  
Дата: 25.08.09 07:57
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>И что? Какой вывод следует из это системы?


Вывод следует простой — нет никакой разницы, будешь ты каждый раз менять конверт или нет.
Re[6]: парадокс конвертов
От: Шебеко Евгений  
Дата: 25.08.09 08:02
Оценка:
S>Тут дело не в генераторе Просто ты строишь эксперимент по условию задачи. Генерируешь два числа и с ними работаешь.
Меня смущает то, что нет какой-то чёткой зависимости между s1 и s2.
Как-бы по логике их стратегия может быть правильной, ошибочной или равнозначной.
И с большим к-вом итераций это должно быть видно.
Может получиться что s1>>s2 буквально во 2-3 старшем разряде, или
s1<<s2 точно так же, или s1~=s2.
Согласитесь, с большим к-вом итераций это не нормально. Поэтому и грешу на генератор.
Re[4]: парадокс конвертов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 25.08.09 10:31
Оценка:
Здравствуйте, Sealcon190, Вы писали:

S>В смысле, если будешь менять конверты — взвешенная сумма получается 45*n/2. Если не будешь — тоже 45*n/2. Можешь расширять на любое количество пар чисел, результат будет тот же. Ценность подхода в том что он наглядно показывает, откуда берётся ошибочное решение.


Да, исходная проблема у них явно надуманна. Однако, если делать выбор о смене конверта на основании какой-либо предопределённой суммы, стабильный выигрыш появляется. Но мне данный факт представляется очевидным и никак не сенсационным.

math.randomseed(os.time())

s1 = 0  --никогда не менять конверт
s2 = 0  --всегда менять конверт
change_cout = 0 --число смен конвертов

for i = 1, 100000
do
    --генерация суммы в конверте от 1 до 200 денежных единиц
    local sum_in_konv = math.random(1, 100)
    --local sum_in_konv = 5
    local k = math.random(1, 2)
    if
        k == 1
    then
        k1 = sum_in_konv
        k2 = 2 * sum_in_konv
    else
        k1 = 2 * sum_in_konv
        k2 = sum_in_konv
    end
    
    --выбор конверта
    local sum_change = 10 --Если сума в открытом конверте меньше данной, то меняем конверт
    local k = math.random(1, 2)
    if
        k == 1
    then  --выбран 1-й конверт
        s1 = s1 + k1
        if (k1 < sum_change)
        then
            s2 = s2 + k2
            change_cout = change_cout + 1
        else
            s2 = s2 + k1
        end
    else   --выбран 2-й конверт
        s1 = s1 + k2
        if (k2 < sum_change)
        then
            s2 = s2 + k1
            change_cout = change_cout + 1
        else
            s2 = s2 + k2
        end
    end
end
print(s1)
print(s2)
print(s2 - s1)
print(change_cout)


Результат:

7609414 — выигрыш в результате обычной стратегии
7627214 — выигрыш в результате новой стратегии
17800 — разница
6461 — число смен конвертов

Т.е. в случае выпадения суммы, которой игрок может пренебречь, он рискует и в перспективе выигрывает. Вполне логично, но не сенсационно.
Re: парадокс конвертов
От: frogkiller Россия  
Дата: 25.08.09 10:39
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Интересная статья почитать для общего развития.

ШЕ>Парадокс конвертов губит природную симметрию случая

К сказанному выше добавлю:
1) нарушение симметрии, о котором с таким восторгом писали авторы, имеет место лишь при оценке суммы выигрыша. На самом деле, вскрытие первого конверта и всего лишь влияет на сумму оценки в каждом опыте, а не на реально полученный выигрыш, ведь его можно получить и не вскрывая конверт

Ничего удивительного нет, вспомни, например, коэфициент 1/sqrt(n-1) при оценке дисперсии, а не 1/sqrt(n-1) — тут должна быть проведена такая же коррекция.

2) предложенные программы имеют существенный недостаток: ограничение сверху максимального числа, следовательно нарушается гипотеза о равномерном распределении чисел. И очевидно этим пользуются при проведении "опытов" авторы статьи. Ведь если число больше MAX/2, это значит, что оно будет большим в паре. Если же брать не MAX/2, а произвольное "задуманное авторами число", что это всего лишь немного изменит параметры распределения, но не его характер.

Так что да, статья написана в расчёте на биржевых лопухов
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re[5]: парадокс конвертов
От: Gadsky Россия  
Дата: 25.08.09 10:46
Оценка:
Здравствуйте, Nuzhny, Вы писали:


N>

N>7609414 — выигрыш в результате обычной стратегии
N>7627214 — выигрыш в результате новой стратегии
N>17800 — разница
N>6461 — число смен конвертов

N>Т.е. в случае выпадения суммы, которой игрок может пренебречь, он рискует и в перспективе выигрывает. Вполне логично, но не сенсационно.

Ваш опыт верен в предположении равномерного распределения базовой суммы в интервале (1, 100). Если взять границу решения > 190, то выигрыш при смене конверта будет меньше, не так ли? Так что оценкой тут будет не возможность пренебречь некоторой суммой, а априорное знание о распределении суммы.
Re[6]: парадокс конвертов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 25.08.09 11:55
Оценка:
Здравствуйте, Gadsky, Вы писали:

G>Ваш опыт верен в предположении равномерного распределения базовой суммы в интервале (1, 100). Если взять границу решения > 190, то выигрыш при смене конверта будет меньше, не так ли? Так что оценкой тут будет не возможность пренебречь некоторой суммой, а априорное знание о распределении суммы.


Мы же всё таки не в неизвестной вселенной играем в кости с местным богом. Даже на бирже можно примерно знать ограничение максимального разброса котировок.
Re: парадокс конвертов
От: Кодт Россия  
Дата: 25.08.09 12:34
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

Баян: Игра со шкатулками
Автор: nikov
Дата: 31.07.08
... << RSDN@Home 1.2.0 alpha 4 rev. 1237>>
Перекуём баги на фичи!
Re[3]: парадокс конвертов
От: Sealcon190 Соломоновы острова  
Дата: 26.08.09 13:16
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Мне вот интересно как они этого добились?

ШЕ>

ШЕ>Ныне свыше 20 миллионов компьютерных симуляций, проведённых Макдоннелом и Эбботтом, показали, что стратегия Ковера позволяет получить больше денег в игре с конвертами, чем простой обмен. А ещё, открыли австралийские учёные, предопределённый обмен, когда игрок выбирает альтернативный конверт только в том случае, если увиденная в первом сумма меньше заранее и наугад выбранного им самим (игроком) значения, тоже работает.


Я думаю на мембране при переводе просто чего-то недопоняли, и реальная задача над которой народ бьётся лишь похожа на парадокс конвертов.
Re[7]: парадокс конвертов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 26.08.09 13:56
Оценка:
Здравствуйте, komaz, Вы писали:

K>Если генерировать сначала одно число (выбирать первый конверт), потом с вероятностями .5 это число делить/умножать на 2, то честно вылезает 5/4 для второго конверта:

...
K>Результаты (на мильоне итераций):
K>
K>ivan@ivan-desktop:~/temp$ tclsh envelopes.tcl
K>s1 = 500029203.69417316
K>s2 = 624746691.645451
K>s1/s2 = 0.800371111013332
K>(s1/s2) / (4/5) = 1.000463888766665
K>


И сумма выигрыша после многих повторений имеет такое соотношение:
В твоём случае:
s1_ = x, s2_ = 5/4 x
Если генерировать сразу, то:
s1 = s2 = 9/8 x
Или:
s1_ + 1/8 x = s1 = s2 = s2_ — 1/8 x
Re[2]: парадокс конвертов
От: __kot2  
Дата: 26.08.09 14:08
Оценка:
Здравствуйте, __kot2, Вы писали:

>Заключается она в следующем. Нужно менять или не менять конверты в каждом заходе случайным образом, но с вероятностью, которая зависит от суммы, увиденной в первом конверте.

а мужичок, хоть и старый уже, а правильно допер, что, даже если мы ничего не знаем о распределении (если знаем — задачка элементарна) в большинстве выдаваемые конверты надо исследовать на матожидание и от него отталкиваться при принятии решения об отклонении или принятии. хотя, может он имел в виду угадать матожидание — тоже, в принципе, способ, особенно если знать лично того, кто конверты выдает
Re[2]: парадокс конвертов
От: __kot2  
Дата: 26.08.09 15:51
Оценка:
Здравствуйте, __kot2, Вы писали:

>>Допустим, вы увидели $10. Стало быть, в другом конверте лежат либо $5, либо $20 с вероятностью 50 х 50. По теории вероятности средневзвешенная сумма в конверте B равна: 0,5 х $5 + 0,5 х $20 = $12,5.

__>Весь "парадокс" тут в том, что формула для равномерного распределения применятся к неравномерному распределению.
поясню немного.
допустим, перед нами держат конверт, содерж х денег (назовем этот конверт "ведущим"), потом берут, подбрасывают монетку. орел — кладут в другой конверт (назовем его ведомый) х/2 денег, решка — крадут в него x*2. тогда всегда разумнее выбрать ведомый, в нем матожидание будет больше.
если же мы не знаем, какой конверт в руке — ведущий или ведомый, то стратегия отказа не даст ничего, хоть статья и утверждает обратно. гон, кароче, какой-то в статье. журналист просто по ходу не понял про че пишет и все переврал.
Re[3]: парадокс конвертов
От: Eugene Sh Россия  
Дата: 26.08.09 16:02
Оценка:
Здравствуйте, __kot2, Вы писали:

__>журналист просто по ходу не понял про че пишет и все переврал.


А, может, и не переврал.
Здесь статья этих самых ученых: http://rspa.royalsocietypublishing.org/content/early/2009/07/31/rspa.2009.0312.abstract
Но стоит это €36.80.

Здесь краткая аннотация: http://pda.physorg.com/envelope-strategy-player_news169811689.html

For example, say the first envelope you pick has $10, so that the other envelope has either $20 or $5. Then you can calculate the expected value (i.e. the probability-weighted sum of the possible values) of the second envelope, assuming that each possibility has a 50% chance: (0.5 x $5) + (0.5 x $20) = $12.50

Похоже, что эти ученые не особо то разбираются в математике.
Re: парадокс конвертов
От: Silver_s Ниоткуда  
Дата: 07.09.09 13:27
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Интересная статья почитать для общего развития.

ШЕ>Парадокс конвертов губит природную симметрию случая

Парадокс любопытный. Как в статье сказано, возникает из-за не учета зависимости испытаний, и неправильного использования матожидания.

Вот другой пример. Допустим нам предлагают сыграть в игру: ставим сумму, подбрасываем монетку и с вероятностью 50% на 50% нам эту сумму либо поделят пополам, либо удвоят. Матожидание (x*2 + x*0.5)/2=1.25*x
Получается на каждой игре +25% в среднем навариваемся.

Что теперь будет если сумма ставок меняется.
Например играем 2 миллиона раз по той же схеме, на каждую игру ставим весь текущий капитал.
Ожидаемая сумма после этих игр та же самая что и была в начале(с небольшой погрешностью). Т.е. с вероятностью 50% на 50% у нас либо уменьшится капитал, либо увеличится (хотя подсчитали что на каждой игре +25% в среднем капитал увеличивается).
Т.е. мильён раз X умножится на 2 и мильён раз на 0.5 в результате останемся при своих.
Но матожидание для 2 мильёнов игр будет фантастическое (на земле столько денег нету). Но матожидание нам никто не выплотит. Расчитывать можно только на медиану. А медиана показывает что останемся при своих.

А вот если бы ставка была фиксирована, например всегда равна 100. За мильён игр нам бы таки удалось получить эти +25% от 100 умноженные на мильён.

В этом парадоксе конвертов тоже ставки плавающие, так что вся ложная прибыль ликвидируется.
Re[2]: парадокс конвертов
От: Silver_s Ниоткуда  
Дата: 07.09.09 13:48
Оценка:
Здравствуйте, Silver_s, Вы писали:

Т.е. смысл прадокса в том что напрашивается ложная ассоциация с такой задачей(постановкой эксперимента):
В выбраном конверте всегда оказывается постоянная сумма, например 10 баксов.
И нужно выбрать либо оставить эту сумму, либо второй вариант где с вероятностью 50% на 50% либо сумма поделится на 2, либо умножится.
И есть возможность повторять это испытание много раз.

Тогда действительно выгоднее выбирать второй вариант.
Но это совсем не такой эксперимент как в описании парадокса.
Re[2]: Ещё добавлю для понимания.
От: Silver_s Ниоткуда  
Дата: 08.09.09 03:21
Оценка:
Здравствуйте, Sealcon190, Вы писали:

S>Парадокс происходит из-за необоснованного обобщения. Достаточно стандартная логическая ошибка, которую в этом случае непросто заметить.

S>Из предположения ("предположим мы вытянули конверт с 10$") делается обобщение на всё решение.
S>Это всё равно что в задаче "какова вероятность что оба ребёнка в семье — мальчики" рассуждать следующим образом: предположим что один из детей — мальчик. Тогда вероятность того что второй тоже мальчик — 1/2. Следовательно вероятность того что оба мальчики — 1/2.

Это все хорошо. Даже если авторы статьи где то намухлевали, но парадокс то остается. ИМХО, это вопрос довольно серьезный.
Если уйти от размазанности задачи и необоснованных обобщений. А поставить вопрос ребром.

Человека в принудительном порядке заставляют играть в игру, на конкретном алгоритме приведенном ниже.
Если кратко. Для суммы лежащей в первом конверте ГСЧ создает случайные числа в интервале $2 ... $1E5 (от двух баксов до ста тыщ).
Т.е. игроку не дается право выбирать первый конверт, а именно такой ГСЧ подсовывает сумму в первом конверте.
Для второго конверта, как и в оригинальном условии задачи, игрок сам выбирает брать или не брать. Соответственно, сумму из первого конверта умножит или разделит на два.
Проводится 1е7 игр, бабки накапливаются с каждой игрой.

Вопрос сколько бабок будет если никогда не брать второй конверт и сколько если брать его всегда?
Если брать второй конверт будет в 1.25 раз больше. Это для конкретного реального алгоритма, за указанное 1е7 число игр. Никакими объяснениями этот факт не изменить. Кто не будет брать второй конверт — окажется в пролете.
Остается только объяснить чем отличается приведенная схема генерации сумм в первом конверте, от реального случая где игрок сам выбирает первый конверт.
Сделать видимо это не просто.
На псевдослучайность ГСЧ свалить это не получится.

И еще вопрос, как объяснить результаты полученые на этом алгоритме, которые приведены ниже? В частности, как объяснить хак при помощи которого удалось выровнять прибыльность двух вариантов?



static class Envelopes
{
    static Random _Rnd=new Random();

    //игра заключается либо в делении на ProfitMultiplyer, 
    //либо в умножении на него. с вероятностью 50% на 50%
    const double ProfitMultiplyer = 2; 
    static double Game(double bet)
    {
        return (_Rnd.NextDouble() > 0.5 ? bet * ProfitMultiplyer : bet / ProfitMultiplyer);
    }

    // IsRandom==true, выбирать сумму в первом конверте случайно из диапазона.
    // IsRandom==false, не случайно, проходить диапазон равным шагом, от начала до конца
    // LimitProfits==true, если прибыль после взятия второго конверта превысит определенную величину,
    //  тогда отбросить это испытание.
    // Возвращает число - во сколько раз будет больше прибыль если всегда выбирать второй конверт (а не первый).
    //
    public static double PlaySeries(bool IsRandom,bool LimitProfits)
    {
        double sum1 = 0, sum2 = 0;
        int Count = (int)1e7;
        double LowerLimit = 2, UpperLimit = 1e5;
        for (double i = LowerLimit; i <= UpperLimit; i+=(UpperLimit-LowerLimit)/Count)
        {
            double bet= IsRandom ? 
                      (UpperLimit - LowerLimit ) * _Rnd.NextDouble() + LowerLimit :
                      i;
            double gameResult=Game(bet);
            if (!LimitProfits || gameResult < UpperLimit * Math.Sqrt(ProfitMultiplyer))
            {
                sum2 += gameResult;
                sum1 += bet;
            }
        }
        return sum2 / sum1;
    }
}


Испытания похожи на задачу с конвертами, но есть отличия. Какие именно отличия влияют на результат?
Суть испытаний:
Выбирается диапазон возможных ставок =(2...100000)
Затем из диапазона выбирается число (аналог выбора первого конверта), и на такой размер ставки происходит одна игра.
Игра заключается либо в делении на ProfitMultiplyer, либо в умножении на него с вероятностью 50% на 50%
(аналог операции выбора второго конверта).
Проводится 1E7 игр, после каждой суммируется результат в sum2.
А также суммируются ставки в sum1 — это покажет сколько было бы прибыли ,если бы не играли
(т.е. не выбирали бы второй конверт, а оставили первый).

------------
Тест:
ProfitMultiplyer=2 (при выборе второго конверта,либо умножится на 2, либо разделится 2)
PlaySeries(true,false) -> 1.2499 //делали случайный выбор из диапазона, для суммы в первом конверте
PlaySeries(false,false) -> 1.2502 //прохождение диапазона последовательно с равным шагом (не случайно)
Если всегда берем второй конверт, прибыль в 1.25 раз больше (как и ожидалось).
Естейственно, не имеет значения выбирать сумму в первом конверте случайно из диапазона,
или этот диапазон проходить в цикле равномерно с постоянным шагом.

Теперь сжульничаем — если сумма лежащая во втором конверте превысит верхнюю допустимую границу
для первого конверта, тогда испытание выбрасывается в мусорку(как будто его не было).
Т.е. должно выполняться gameResult < UpperLimit
В этом случае результат будет 0.8, (выгоднее второй конверт не брать никогда — иначе наоборот в 1.25 раз меньше).
Если разрешить диапазон побольше, брать второй конверт станет выгоднее.
И при ограничении gameResult < UpperLimit * Math.Sqrt(ProfitMultiplyer) прибыль сравняется
(т.е. расширили диапазон на корень из двух). И результат 1.0001 (очень точно)

Причем если ProfitMultiplyer=10(во втором конверте сумма либо в 10 раз больше, либо в 10 раз меньше).
Тогда надо границу домножать на корень из 10. И результат будет в районе 1.0001.
Аналогично и для любых ProfitMultiplyer.

Вопрос. Откуда взялся в таком ограничении UpperLimit * Math.Sqrt(ProfitMultiplyer)
множитель в виде корня из ProfitMultiplyer ???

Появился то он там чисто эмпирическим путем(методом тыка угадал), но какое может быть теоретическое объяснение,обоснование его присутствия?
Только при его наличии прибыль получается одинаковая как при взятии второго конверта, так и без взятия.

Суть парадокса то, видимо, именно в этом. Т.к. вместе с правильным выводом, всплывает еще такая
схема испытаний, как приведена выше.
Выбор через ГСЧ в первом конверте случайной суммы, затем игра на эту сумму со вторым конвертом.
При такой схеме так и есть. Если *2 против *0.5, и всегда брать второй конверт, прибыль в 1.25 раз больше чем если не брать.
Если *10 против *0.1, прибыль со вторым конвертом в 5 раз больше.
Единственное что ее может уравнять это ограничитель: gameResult < UpperLimit * Math.Sqrt(ProfitMultiplyer)
И еще вопрос на засыку: А как связано такое испытание с ограничением, и реальная ситуация выбора конвертов?
Через квадратный корень то в реальности ничто не ограничивает вроде?
Re[3]: Ещё добавлю для понимания.
От: Serpenter_e  
Дата: 08.09.09 05:57
Оценка:
Суть парадокса в том, что Пенроуз называет R-процедурой. В один конверт кладут случайно выбранное число от 0 до бесконечности. В другой либо в два раза меньше, либо в два раза больше. В любой компьютерной модели вы не сможете выбрать случайное число от 0 до бесконечности. Если пробовать делать какие то упрощенные модели то объяснение результата будет простым.

Например, если в первый конверт выбирать число N из конечного множества, а во второй либо N*2 либо N/2, то очевидно надо выбирать второй конверт сразу же. В парадоксе же существенно то, что вы сначала выбираете один конверт, смотрите что в нем (смотреть = реализовать R-процедуру), а потом выбираете другой.

Можно попробовать так выбирать числа: в первый конверт выбирать число N из конечного заданного множества, а во второй число M равное либо N*2 либо N/2 но так, чтобы M тоже было из множества. Тогда такое рассуждение — в втором конверте будет либо 5 либо 20 равновероятно — не правильное, например для чисел больших медианы заданного множества. Я уверен, что численный эксперимент покажет, что обе стратегии покажут одинаковое матожидание)

Хотя компьютер не может придумать случайное число из бесконечного множества, можно попробовать применить какой нибудь ленивый алгоритм. Что нибудь типа такого — написать функцию, которая придумывает число X от 0 до 1, но это число возвращает не сразу все целиком, а по одному числу после запятой. Например так:
IEnumerable<byte> GetDigits()
{
  while (true)
  {
    yield return rnd.Next(10); //не помню точный синтаксис
  }
}

Все вычисления придется корректировать так, чтоб учитывать такую ленивость, это будет непросто, строгие вычисления невозможны, но нам не нужны строгие вычисления, нам достаточно посчитать матожидание Далее в случайно выбранный конверт кладем 1/X, а в другой 2/X и проводим эксперимент точно так, как указано в парадоксе, т.е.: выбираем случайно конверт, смотрим что там, выбираем другой, увеличиваем капитал. Чтоб каждый эксперимент не сильно влиял на капитал, можно поступать так: если в первом конверте мы встретили N, а в другом M, то капитал надо увеличить на M/N-1. По парадоксу каждый эксперимент будет увеличивать капитал либо на -0.5 либо на 1. Попробую в свободное время написать программу. Еще нюанс что если мы добиваемся равномерного распределения чисел на отрезке [0, 1] (да, 0 и 1 входят в числа, которые будет выдавать GetDigits ) то какое будет распределение в диапазоне (0, +бесконечность) ?
Re[4]: Ещё добавлю для понимания.
От: Erop Россия  
Дата: 08.09.09 08:24
Оценка:
Здравствуйте, Serpenter_e, Вы писали:

S_>Все вычисления придется корректировать так, чтоб учитывать такую ленивость, это будет непросто, строгие вычисления невозможны, но нам не нужны строгие вычисления, нам достаточно посчитать матожидание Далее в случайно выбранный конверт кладем 1/X, а в другой 2/X и проводим эксперимент точно так, как указано в парадоксе, т.е.: выбираем случайно конверт, смотрим что там, выбираем другой, увеличиваем капитал. Чтоб каждый эксперимент не сильно влиял на капитал, можно поступать так: если в первом конверте мы встретили N, а в другом M, то капитал надо увеличить на M/N-1. По парадоксу каждый эксперимент будет увеличивать капитал либо на -0.5 либо на 1. Попробую в свободное время написать программу. Еще нюанс что если мы добиваемся равномерного распределения чисел на отрезке [0, 1] (да, 0 и 1 входят в числа, которые будет выдавать GetDigits ) то какое будет распределение в диапазоне (0, +бесконечность) ?


1) программу писать не надо. Матожмдание можно посчитать аналитически
2) 1/х будет распределён неравномерно...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[5]: Ещё добавлю для понимания.
От: Serpenter_e  
Дата: 08.09.09 08:59
Оценка:
Здравствуйте, Erop, Вы писали:

E>2) 1/х будет распределён неравномерно...


Согласен, но если все объяснение парадокса только в том, что распределение неравномерное, то это как то неинтересно. Невозможно построить равномерное распределение на бесконечности, но если в этом суть парадокса, то зачем же столько пафоса в статье на мембране и в этой платной статье за 40 евро? Другие части статьи — про стохастический эффект, про парадокс Паррондо и прочее — очень интересно
Re: парадокс конвертов
От: funikov  
Дата: 08.09.09 09:17
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Интересная статья почитать для общего развития.

ШЕ>Парадокс конвертов губит природную симметрию случая


не понял что тут что губит, ну ок, в конвертах суммы 0.5n и 2n.

выбираю первую стратегию, N раз всегда беру первый попавшийся конверт, и ничего не меняю. С большим N мне приблизительно одинаковое количество раз выпадает и 0.5n и 2n. Получаю средний выигрыш 2.5n/2.

Теперь всегда меняю конверт, хорошо, получаю то же самое — 2.5n/2.

Где тут парадокс?
Re[7]: Ещё добавлю для понимания.
От: cvetkov  
Дата: 08.09.09 10:26
Оценка:
Здравствуйте, Serpenter_e, Вы писали:

S_>> Невозможно построить равномерное распределение на бесконечности


S_>вот написал и понял что возможно

как?
... << RSDN@Home 1.2.0 alpha 4 rev. 1227>>
Re[8]: Ещё добавлю для понимания.
От: Serpenter_e  
Дата: 08.09.09 11:16
Оценка:
Здравствуйте, cvetkov, Вы писали:

C>Здравствуйте, Serpenter_e, Вы писали:


S_>>> Невозможно построить равномерное распределение на бесконечности


S_>>вот написал и понял что возможно

C>как?

Равномерное здесь означает что между числами которые мы можем встретить в конвертах нет разницы. Да это не очень хорошее определение

Например такая функция —
f(x) = { 1 если существует целое n такое что 2^n=x; 0 если не существует }
правда площадь f(x) получается равной 0, надо как то докрутить, но идея ясна. Везде где f(x) не нулевая она равна 1. Поэтому все числа которые мы можем встретить в конвертах встречаются нам с одинаковой вероятностью. Это можно назвать равномерностью в каком то смысле.

Для парадокса достаточно построить такую f(x) что ее площадь на [0, +бесконечность) равна 1 и при этом для любого x: f(x/2)=f(2*x).
Re[6]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 08.09.09 11:40
Оценка:
Здравствуйте, Serpenter_e, Вы писали:

S_>Согласен, но если все объяснение парадокса только в том, что распределение неравномерное, то это как то неинтересно. Невозможно построить равномерное распределение на бесконечности, но если в этом суть парадокса, то зачем же столько пафоса в статье на мембране и в этой платной статье за 40 евро? Другие части статьи — про стохастический эффект, про парадокс Паррондо и прочее — очень интересно


IMHO, тут есть какой-то недогон.

Вот смотри. Пусть мы знаем, как распределены суммы в конвертах.
Тогда мы можем написать условную вероятность того, что выбранный нами конверт содержит меньшую из сумм, при условии, что он содержит х рублей. Ну и тогда мы имеем простую задачку про то, что вот есть типа условная вероятность и то сё. И всё легко считается без всяких парадоксов.

А вот если мы начинаем строить всякие мутные предположения, типа того, что вероятность того, что во втором пакете больная из сумм -- 50%, то начинаются парадоксы.
Вот если взять какое-то реальное распределение, то там не 50% получается. Надо таки решить задачу:

При каком распределении сумм в конвертах условная вероятность того, что мы взяли меньший из конвертов при условии что в нём лежит Х рублей, не зависит от Х и равно 50%?

Что-то у меня постепенно созрело ощущение, что такого распределения сумм не существует...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[8]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 08.09.09 21:14
Оценка:
Здравствуйте, D14, Вы писали:

D14>В http://en.wikipedia.org/wiki/Two_envelopes_problem рассмотрен вариант с априорно заданным корректным распределением появления чисел в конвертах. См. An even harder problem.


а в чём парадокс-то?
Я тебе могу такой же "парадокс", только попроще нарисовать.

Пусть есть ряд An = (-1)^n. Покажем, что сумма этого ряда равна 5.

Ну так сложим 0-й, 2-й, 4-й, 6-й и 8-й элементы. Это будет 5
Теперь сложим 1-й с 10-м, 3-й с 12-м, 5-й с 14-м, 7-й с 16-м, 9-й с 18-м, 11-й с 20-м и т. д... Очевидна сумма всех этих пар -- 0. Итого, самма ряда An "равна" 5!

То, что она одновременно и в том же смысле "равна" и минус пяти -- докажешь сам
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[10]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 09.09.09 08:46
Оценка:
Здравствуйте, D14, Вы писали:

D14>Парадокс тот же, что и в исходной задаче. Описанный в википедии вариант лишен недостатка исходной формулировки, в которой нельзя заформализовать функцию распределения исходов, чтобы условные вероятности равнялись бы 0.5. Но достигается это ценой усложнения формулировки математическими подробностями. А именно, в модифицированном варианте априори задана совместная функция распределения величин в конвертах такая, что


там сумма растёт быстрее, чем падает её вероятность, так что матожидание посчитать нельзя. Соответственно и сравнить матожидания разных стратегий тоже. Увы. IMHO, это другой немного парадокс...

Смотри. Пусть у нас есть стратегия S( х ), которая по сумме в конверте говорит нам какой конверт брать

Тогда у нас элементарное событие такое: "в первый конверт положили х рублей, во второй 2х, потом случайно выбрали конверт номер А, предъявили стратегии, а она выбрала конверт номер В". Вот по этим трём параметрам (х, А, В) и надо просуммировать матожидание выигрыша. Если этот интеграл сходится, то пофиг в каком порядке суммировать, а вот если не сходится, то совсем и не пофиг

При этом на эту штуку накладывается ещё и другая
Автор: Erop
Дата: 26.01.06


На самом деле понятно, что события, вероятность которых меньше 1е-100, например, не играют роли, так что если мы распределение из твоего парадокса "обкусим", так, что сумма таки ограниченна, то суммы станут сразу же вычислимы, матожидания станут известны и "парадокс" саморассосётся...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[11]: Что на самом деле надо решать.
От: D14  
Дата: 09.09.09 09:19
Оценка:
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, D14, Вы писали:


D14>>Парадокс тот же, что и в исходной задаче. Описанный в википедии вариант лишен недостатка исходной формулировки, в которой нельзя заформализовать функцию распределения исходов, чтобы условные вероятности равнялись бы 0.5. Но достигается это ценой усложнения формулировки математическими подробностями. А именно, в модифицированном варианте априори задана совместная функция распределения величин в конвертах такая, что


E>там сумма растёт быстрее, чем падает её вероятность, так что матожидание посчитать нельзя. Соответственно и сравнить матожидания разных стратегий тоже. Увы. IMHO, это другой немного парадокс...


Те же рассуждения можно применить и к исходной формулировке. Пусть вероятность выигрыша суммы в интервале (x,x+dx)=c не равна нули и, по условию, не зависит от x. Матожидание тоже посчитать нельзя int(x*c*dx,x=0..+infinity)=infinity. Тут имеет место более корректная постановка, но которую человеку без знания основ теории вероятности так просто уже не объяснишь, либо праздный человек не поймет суть парадокса.

E>Тогда у нас элементарное событие такое: "в первый конверт положили х рублей, во второй 2х, потом случайно выбрали конверт номер А, предъявили стратегии, а она выбрала конверт номер В". Вот по этим трём параметрам (х, А, В) и надо просуммировать матожидание выигрыша. Если этот интеграл сходится, то пофиг в каком порядке суммировать, а вот если не сходится, то совсем и не пофиг


Сходится или расходится — вопрос прямо к парадоксу не относящийся. Отсутствие матожидания говорит лишь о том, что организатор такой лотерии за фиксированную плату, пускай и достаточно большую, гарантировано бы прогорел, если он не бесконечно богат.


E>На самом деле понятно, что события, вероятность которых меньше 1е-100, например, не играют роли, так что если мы распределение из твоего парадокса "обкусим", так, что сумма таки ограниченна, то суммы станут сразу же вычислимы, матожидания станут известны и "парадокс" саморассосётся...


Cумма чего? Матожидания? Ты отказываешь априорному распределению в праве его не иметь? Обоснуй. В википедии тоже изложены соображения по этому поводу. В любом случае, все твои возражения применимы к исходному парадоксу. А теперь попробуй объясни кому-нибудь — сумма не ограничена, — тебя не поймут.
Re[10]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 09.09.09 13:52
Оценка:
Здравствуйте, D14, Вы писали:

D14>>>В http://en.wikipedia.org/wiki/Two_envelopes_problem рассмотрен вариант с априорно заданным корректным распределением появления чисел в конвертах. См. An even harder problem.

E>>а в чём парадокс-то?
D14>Парадокс тот же, что и в исходной задаче. Описанный в википедии вариант лишен недостатка исходной формулировки, в которой нельзя заформализовать функцию распределения исходов, чтобы условные вероятности равнялись бы 0.5. Но достигается это ценой усложнения формулировки математическими подробностями. А именно, в модифицированном варианте априори задана совместная функция распределения величин в конвертах такая, что

Непонятно что нельзя заформализовать в исходной задаче? И в чем парадокс — в том что смена конвертов что то меняет?
Если дано множество упорядоченых пар конвертов . Игрок всегда сначала берет первый (из упорядоченой пары).
Если распределения вероятностей для первых конвертов не совпадают со вторыми. Тогда появляется разница.

Если гарантируется что в первых конвертах равномерное распределение, тогда во вторых конвертах уже другое. Это подсказка, на ней можно навариться.
Уравнять конверты в паре легко. Пройтись по всем парам и с вероятностью 0.5 поменять в паре конверты местами. Распределение станет одинаковым и для первого и второго (независимо от того что было до обмена — в первом равномерное или какое то другое).

На картинке случай — на верхнем графике когда первый был равномерным. На нижнем когда с вероятностью 0.5 их поменяли местами (графики перекрылись).


А что изменит распределение 2^n .... ? Все равно расклады будут — либо первый независимый, второй зависимый (оба разные)- либо равноправны но совсем с другим распределением. Какой из них считать зависимым дело вкуса,наверное
Для условий задачи вариантов распределений может быть много. Но из равноправных, видимо, самое простое и логичное это трехступенчатое с 3 равномерными участками. Оно порождается заменой с вероятностью 0.5 конвертов местами, для случая где первый конверт был равномерным.

Если это справедливо для границы 0...1e6 , и для 0... (1e1000)^1e1000 , и при этом ничего не меняется. То границу 0...inf можно в расчет не брать.
Re[12]: Нифиа себе "гарантии"... ;)
От: Erop Россия  
Дата: 09.09.09 14:36
Оценка:
Здравствуйте, D14, Вы писали:

D14>Cумма чего? Матожидания? Ты отказываешь априорному распределению в праве его не иметь? Обоснуй. В википедии тоже изложены соображения по этому поводу. В любом случае, все твои возражения применимы к исходному парадоксу.


Ну суть парадокса такая: "Вот у меня типа есть стратегия 1 и стратегия 2. При этом матожидание стратегии 1 -- это сумма некоторого ряда (Аn), а матожидание стратегии 2 это сумма (11/8 An)... ну и типа выносим 11/8 за скобку и видим, что стратегия 1 от стратегии 2 ничем не отличается на самом-то деле, а матожидания разные. Какойиз этого корректный вывод? Очевидно что такой, что "Надо бы проверить сходится ли ряд". А какой делают вывод авторы "парадокса"? Типа что это парадокс?

D14>А теперь попробуй объясни кому-нибудь — сумма не ограничена, — тебя не поймут.

Конечно не поймут. Чтобы "понять" этот парадокс, надо плохо знать математику. Это как с "парадоксами" СТО. Чтобы их "понять" надо плохо знать физику...

E>>там сумма растёт быстрее, чем падает её вероятность, так что матожидание посчитать нельзя. Соответственно и сравнить матожидания разных стратегий тоже нельзя. Увы. IMHO, это другой немного парадокс...


D14>Те же рассуждения можно применить и к исходной формулировке. Пусть вероятность выигрыша суммы в интервале (x,x+dx)=c не равна нули и, по условию, не зависит от x. Матожидание тоже посчитать нельзя int(x*c*dx,x=0..+infinity)=infinity.


Там всё разваливается ещё раньше... Там даже функции, которую предлагается интегрировать, не существует...

D14>Тут имеет место более корректная постановка, но которую человеку без знания основ теории вероятности так просто уже не объяснишь, либо праздный человек не поймет суть парадокса.


Фраза "более корректная" сама по себе некорректная.
Формулировка, в которой сравнивают бесконечность и 11/8 бесконечности является абсолютно бессмысленной...

E>>Тогда у нас элементарное событие такое: "в первый конверт положили х рублей, во второй 2х, потом случайно выбрали конверт номер А, предъявили стратегии, а она выбрала конверт номер В". Вот по этим трём параметрам (х, А, В) и надо просуммировать матожидание выигрыша. Если этот интеграл сходится, то пофиг в каком порядке суммировать, а вот если не сходится, то совсем и не пофиг


D14>Сходится или расходится — вопрос прямо к парадоксу не относящийся.

Если это так, то приведи формулировку, в которой всё корректно...
IMHO, этот "парадокс" возникает из-за того, что авторы "парадокса" слишком вольно оперируют каким-то несуществующим пределом... Во всяком случае во всех известных мне формулировках, было так...

D14>Отсутствие матожидания говорит лишь о том, что организатор такой лотерии за фиксированную плату, пускай и достаточно большую, гарантировано бы прогорел, если он не бесконечно богат.


Вовсе и нет! Ты зря сюда
Автор: Erop
Дата: 26.01.06
не сходил! Это скорее говорит о том, что ты не понимаешь смысла матожидания.
Положим проводящий лотерею решит, что суммы с вероятностью меньше 1е-10 не выпадут. И назначит фиксированную плату исходя из этого предположения. Тогда он проиграет с вероятностью менее 1е-10... Ты уверен, что слово "гарантировано" тут уместно?..
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[13]: Нифиа себе "гарантии"... ;)
От: D14  
Дата: 09.09.09 15:31
Оценка:
Здравствуйте, Erop, Вы писали:

E>Ну суть парадокса такая: "Вот у меня типа есть стратегия 1 и стратегия 2. При этом матожидание стратегии 1 -- это сумма некоторого ряда (Аn), а матожидание стратегии 2 это сумма (11/8 An)... ну и типа выносим 11/8 за скобку и видим, что стратегия 1 от стратегии 2 ничем не отличается на самом-то деле, а матожидания разные. Какойиз этого корректный вывод? Очевидно что такой, что "Надо бы проверить сходится ли ряд". А какой делают вывод авторы "парадокса"? Типа что это парадокс?

Цитирую As it seems more rational to open just any envelope than to swap indefinitely, the player is left with a paradox.
Перевод нужен?

E>Там всё разваливается ещё раньше... Там даже функции, которую предлагается интегрировать, не существует...

Я в курсе. Именно поэтому я и привел ссылку на вариант, где не разваливается, но словесно он сложнее формулируется. Я просто показал, что твои рассуждения применимы к обоим формулировкам, а не только к модифицированной.

E>Фраза "более корректная" сама по себе некорректная.

Ну, насчет более я погорячился.

E>Формулировка, в которой сравнивают бесконечность и 11/8 бесконечности является абсолютно бессмысленной...

Пусть вскрывают оба конверта. Стратегия выбора конверта с большей суммой является предпочтительней выбора конверта с меньшей или левого конверта. Хотя м.о. выигрыша в обоих случаях равно бесконечности. В чем по-твоему здесь абсолютная бессмысленность?

E>Если это так, то приведи формулировку, в которой всё корректно...

E>IMHO, этот "парадокс" возникает из-за того, что авторы "парадокса" слишком вольно оперируют каким-то несуществующим пределом... Во всяком случае во всех известных мне формулировках, было так...
См. английскую википедию. В формулировке парадокса несуществующим м.о. никак не оперируют. И опять же, в т.в. спокойно оперируют случайными величинами с бесконечным м.о. Если ты считаешь, что здесь они приводят к абсурду, обоснуй.

E>Это скорее говорит о том, что ты не понимаешь смысла матожидания.

E>Положим проводящий лотерею решит, что суммы с вероятностью меньше 1е-10 не выпадут. И назначит фиксированную плату исходя из этого предположения. Тогда он проиграет с вероятностью менее 1е-10... Ты уверен, что слово "гарантировано" тут уместно?..
Софистика. Замени гарантировано на почти наверное.
Re[11]: Что на самом деле надо решать.
От: D14  
Дата: 09.09.09 15:57
Оценка:
Здравствуйте, Silver_s, Вы писали:

S_>Непонятно что нельзя заформализовать в исходной задаче?


Нельзя задать вероятность на пространстве событий таким образом, чтобы условные вероятности равнялись 0.5. Иначе говоря, такое возможно только тогда, когда во втором конверте ведущий может поменять сумму после вскрытия первого.

S_>И в чем парадокс — в том что смена конвертов что то меняет?


The puzzle: The puzzle is to find the flaw, the erroneous step, in the switching argument above. This includes determining exactly why and under what conditions that step is not correct, in order to be sure not to make this mistake in a more complicated situation where the misstep may not be so obvious. In short, the problem is to solve the paradox.

S_>Если распределения вероятностей для первых конвертов не совпадают со вторыми. Тогда появляется разница.

Конверты равнозначны по условию.

S_>Если гарантируется что в первых конвертах равномерное распределение,

Не может быть равномерного распределения, если сумма ничем не ограничена сверху.

S_>А что изменит распределение 2^n .... ?


Если речь про пример из википедии, то сумма вероятностей элементарных исходов станет раной единицы, а не бесконечности.
Re[12]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 09.09.09 20:34
Оценка:
Здравствуйте, D14, Вы писали:

D14>Нельзя задать вероятность на пространстве событий таким образом, чтобы условные вероятности равнялись 0.5. Иначе говоря, такое возможно только тогда, когда во втором конверте ведущий может поменять сумму после вскрытия первого.

D14>Конверты равнозначны по условию.
Условная вероятность 0.5 — имеется ввиду открыв один конверт, невозможно сказать какая из двух сумм вероятнее в другом конверте?

Тогда что получается:
1)Конверты равнозначны. Насколько? Допустим настолько, что плотности вероятностей для них полностью совпадают.
2)Если бы усл.вер. была 0.5
Распределения полностью совпадают — значит играя в первый конверт мы можем строить экспериментальную кривую распределения первого. И в то же время она является и для второго конверта распределением. Значит получаем инсайдерскую информацию, о содержимом второго конверта. Единственная кривая которая не дала бы информации это прямая (равномерное распр.). Но она невозможна сразу для двух конвертов. Значит инсайдерская инфо будет. видимо вот куда делись 25% прибыли, трансформировались, но их всеравно можно забрать (хотя бы часть). Если распределение стабильно(не меняется), т.е. граница стабильна от игры к игре.

Если снова посмотреть на этот график. Где распределения равнозначны(трехступенчатая кривая). То для этого распределения инсайдерская информация есть для любой точки. Либо вдвое большее значение лежит на другой ступени, либо вдвое меньшее на другой ступени. И значит известно во сколько раз вероятнее *2 , чем /2, и не равны вероятности.
Пожалуй это единственное распределение из довольно прямолинейных(3 прямых участка) чтобы удовлетворялись условия задачи. А для более волнистых в точке x*2 и x/2 значения функции(вероятности) будут почти всегда разные, так что тем более...


S_>>Если гарантируется что в первых конвертах равномерное распределение,

D14>Не может быть равномерного распределения, если сумма ничем не ограничена сверху.

Когда сумма постепенно стремится к бесконечности, характер распределения вобще не шевелится (масштабируется только), (1E^100)^1E10 этого числа достаточно? Можно еще сто раз в такую же степень возвести, не изменится. Другое дело если тот кто формирует конверты постоянно меняет границу. Скажем 10000 игр с границей 0...10, потом столько же игр с границей 0..100, потом снова 0...10 Таким образом он запутает играющего, постоянно меняя распределение. В том числе бесконечно повышать может. Но и без бесконечного повышения, если будет дергать границу постоянно внутри какой то другой границы. Тогда тоже наверно создаст непросчитываемую кашу. Уничтожит инсайдерскую информацию
При генерации конкретного конверта не может быть бесконечной границы в принципе, но в одной серии игр граница может периодически меняться (часть игр по одной границе просчитано, часть по другой).

Если парадокс в том что граница всегда фиксированна, но в то же время может меняться. Тогда забавно.
Re[13]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 09.09.09 20:49
Оценка:
Здравствуйте, Silver_s, Вы писали:

S_>.. То для этого распределения инсайдерская информация есть для любой точки.

Точнее говоря, такие точки есть. Первая ступень заканчивается на 1/4 общего интервала. Для при попадании в первую половину первой ступени получаются одинаковые вероятности и для удвоенной и для деленной пополам. Это для сумм меньше 1/8 от максимума. Но они не сильно влияют на результат, т.к. мелкие.
А воспользоваться верхней абсолютной границей(там где 100% информация о втором конверте), тяжело. Потому что вся вторая половина интервала сильно опущена шанс 1 из 10 примерно, туда попасть.
Re[14]: Нифиа себе "гарантии"... ;)
От: Erop Россия  
Дата: 10.09.09 09:17
Оценка:
Здравствуйте, D14, Вы писали:

D14>Пусть вскрывают оба конверта. Стратегия выбора конверта с большей суммой является предпочтительней выбора конверта с меньшей или левого конверта. Хотя м.о. выигрыша в обоих случаях равно бесконечности. В чем по-твоему здесь абсолютная бессмысленность?


В методике сравнения стратегий. Если уж корректно считать, надо оценивать вероятность выигрыша при той или иной стратегии. Или вероятность выигрыша более такой-то суммы и т. п., а не некоторый кусок матожидания считать...
Тем более, что его (матожидания) не существует...

D14>См. английскую википедию. В формулировке парадокса несуществующим м.о. никак не оперируют. И опять же, в т.в. спокойно оперируют случайными величинами с бесконечным м.о. Если ты считаешь, что здесь они приводят к абсурду, обоснуй.


А что тут обосновывать? Вот положили в один конверт х рублей, в другой 2 х. Дали конверты тебе, ты выбираешь один из них. Пусть тот, где х. Тогда если ты поменяешь конверт, то выиграешь, если нет, то нет. Чтобы перейти к вероятностям, надо какую-то статистику сюда прикрутить. Например так. Тебе выдают два конверта х и 2х. И так 100 раз. Ты случайно выбираешь, поотом меняешь и вперёд. Опять парадокса не вышло...
А когда же он выходит-то? А когда мы привлекаем к делу условную вероятность! Типа говорим: "ну поиграем в эту игру 1000 раз, отберём те случаи, когда в первом вскрытом конверте было 100 рублей и посмотрим, стоило ли в этом случае менять конверт". И получаем что, стоило. Потом, говорим, что от суммы рублей этот вывод не зависит и выводим, что стоило всегда. При этом тут явно где-то есть ошибка в логике! Так как мы всего-то имеем 1000 испытаний типа "выбери случайно из 1 и 2 рублей", но как-то так хитро смогли всё просуммировать, что получили, что "во втором конверте всегда больше "
IMHO, это обозначает, что мы неверно суммировали. Если бы мы посмотрели верно, то заметили бы, что на этой конкретной 1000 опытов были такие суммы, которые выгодно менять и были такие, которые выгодно не менять, при этом одни в точности компенсировали другие, так что менять или не менять "не глядя" было всё равно. Так ведь?

Но мы же считали не эту статистику из 1000 опытов. Мы считали "устремив число опытов в бесконечность", ну типа по закону больших чисел все отношения заменятся пределами и мы перейдём к вероятностям. Но тут есть такая фигня, что окажется, что На любой серии будут такие граничные числа, при которых выгодно менять или не менять. Просто у этих границ нет предела. И вот тут-то и происходит ошибочный предельный переход... Предела нет, а мы рассуждаем так, словно он есть, просто нам не известен...

Если тебе кажется, что я тут неправ, то опиши этот предельный переход корректно. И покажи где там возникает то, что "второй брать выгоднее"?

Ещё раз приведу тебе пример полностью аналогичного "рассуждения"
Ты 1-го числа каждого месяца получаешь 10 000 рублей зарплаты, а 15-го отдаёшь их за квартиру.
Если ты "начнёшь отсчёт" с 1-го месяца, то у тебя "в среднем" будет 7 500 рублей на руках, а если с 15-го, то у тебя на руках, "в среднем" будет 7 500 рублей долга. Правда парадоксальный результат?

E>>Это скорее говорит о том, что ты не понимаешь смысла матожидания.

E>>Положим проводящий лотерею решит, что суммы с вероятностью меньше 1е-10 не выпадут. И назначит фиксированную плату исходя из этого предположения. Тогда он проиграет с вероятностью менее 1е-10... Ты уверен, что слово "гарантировано" тут уместно?..
D14>Софистика. Замени гарантировано на почти наверное.

Лучше ты почитай внимательно. Если чувак раорится с вероятностью 1е-10, то называется это верный доход, а не "проиграет почти наверняка"...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[8]: Что на самом деле надо решать.
От: Eugene Sh Россия  
Дата: 10.09.09 09:50
Оценка:
Здравствуйте, D14, Вы писали:

D14>Парадокс все равно остается

D14>В http://en.wikipedia.org/wiki/Two_envelopes_problem рассмотрен вариант с априорно заданным корректным распределением появления чисел в конвертах. См. An even harder problem.

Да, они привели интересное распределение. Выкладки не проверял, но готов поверить, что если увидели в первом конверте X, то мат. ожидание суммы во втором конверте равно 1.1*X. Отсюда авторы сделали вывод:

This means that the player should switch in all cases.


Звучит довольно очевидно. Но это только до тех пор, пока мы не попытаемся объяснить это с математической точки зрения. А для этого надо будет научиться сравнивать 2 стратегии (чтобы объяснить, почему одна из них лучше). Попробуйте сделать это, увидите кое-что интересное.

Абстрагируясь от конкретных описанных стратегий, рассмотрим просто Стратегию A и Стратегию B. Как определить, какая из них лучше?


В итоге, приведенный "even harder problem" парадокс более интересен, чем оригинальный, но он все равно не является парадоксом с математической точки зрения. Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.
Re[12]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 10.09.09 13:21
Оценка:
Здравствуйте, D14, Вы писали:

D14>The puzzle: The puzzle is to find the flaw, the erroneous step, in the switching argument above. This includes determining exactly why and under what conditions that step is not correct, in order to be sure not to make this mistake in a more complicated situation where the misstep may not be so obvious. In short, the problem is to solve the paradox.


ИМХО, в математических выкладках, нет смысла искать противоречия в теории вероятностей.
Как кто-то сказал по поводу другого парадокса.(Как то так было) противоречия есть только в том что придумали сами искатели противоречий,чего в самой теории не было. Что сами при думали то сами и опровергли.
Из словаря наиболее мягкое определение: Парадокс-"Нелепое стечение обстоятельств"

А здесь сконвертами, ИМХО, есть очень скользкое,нелепое правило игры. Все попытки осмыслено приблизить его к реальной игровой ситуации проваливаются. А кажется на первый взгляд что это возможно.
Объяснять надо не что противоречит каким то формальностям (таких противоречий нет). А в каком то философско-психологическом-обывательском плане, что за неувязки,нелепости возникают. Лучше пофилософствуем.

Например, неизбежно возникают такие пункты и нелепости, при попытке сделать игру на связи между конвертами 2 или 0.5:
1) Интересный вопрос дает ли какое то приемущество играющему правило о втором конверте. Если кто-то скажет нет,никогда — тогда рискнет ли он сыграть на стороне банкующего, против игрока. Все недостающие подробности разрешается в свою пользу реализовать, лишь бы осталось условие на пару конвертов.

2) Если на улице подойдет человек...скажет только два конверта, играем только один раз, правила-стандартные. Предварительно спросит, будешь проверять оба или только один? Теория-теорией а ответить прийдется либо-да, либо-нет. В момент задания вопроса, на первый взгляд, никакой разницы один или оба. Но разница и польза от второго конверта есть:
a)Если это первые игры с человеком, значит узнаем вдвое больше точек о распределении, из этих данных в следующих играх можно вероятно срубить прибыль.
б)Если уже много игр было, и известно распределение близкое к реальному. Тогда можно вероятность уточнить и уйти от 50% на 50%.
Если игра будет только одна. Значит человек ворует у нас потенциальную прибыль(от второго конверта из а),б) ). Но это не воровство, а наоборот см. пункт 3.

Когда первый взят с $40 (игра первая и последняя и а),б) не применимы). Возникает ощущение что появилась прибыль от второго конверта 1.25*$40, а ее вроде до первого конверта не было. Но это вобще то не прибыль, может и убытком закончиться -$20. Прибылью стало бы при нескольких попытках, каждая на $40 (а этого не будет).

Матожидание денег это не деньги.Что лучше матожидание $900 и вероятность 0.9 (выигрыш $1000, проигрыш 0) или матожидание $90000 и вероятность 0.0009 (выигрыш $1е8, проигрыш 0)? Для одной игры первый вариант дает больше прибыли. Т.к. во втором случае реально на руки получишь $0 вместо матожидания $90000

3) В пункте 2, это не игра вобще а одаривание подарками. За чей счет банкет? А как сделать чтоб предлагающий конверты не терял бабки гарантированно, а мог тоже и выиграть и проиграть . Чтобы вышла равноправная игра против игрока а не подарки. Игрок должен тогда перед игрой отдать банкующему бабки(компенсацию), потом пытаться их отыграть на конвертах.
А тут серьезные проблемы. Сколько он должен отдать? $10, $100000 ? Сколько захочет или сколько попросят? Или у банкующего спросить матожидание его раскладов?
Если банкующий назовет матожидание от своих раскладов и прогарантирует его устойчивость. Тогда игрок узнает заранее границы раскладов и распределение быстрее вычислит. Банкующий должен взять за это дополнительный штраф с игрока.
Банкующий прогарантировал матожидание, а если игрок подберет стратегию под его распределение, банкующий в дураках останется?
Кроме того такие связи между двумя конвертами порождают перекошенное распределение. Как следствие, среднее даже по многим сделкам нестабильно, плохо сходится. При случайном блуждании отклонение накапливается не как у монетки а менее предсказуемая болтанка.

В результате никакой интересной игры не получится, кто-то в дураках останется (а не просто проиграет).

Если принудительно заставят на свои бабки стать банкующим, раскладывать в конверты. Как быть? Как помешать игроку подобрать стратегию под свои расклады? Или какую фиксированную компенсацию затребовать с игрока, чтобы не пролететь? Интервал ограничить то прийдется — если игрок получит на руки бесконечный выигрыш, то конец света наступит.
Парадокс,что не захочется в такую игру играть, ни игроком ни банкующим, даже с небольшим плюсовым матожиданием (оно может слишком сильно отличаться от того что реально наруки получишь). А ограничение на пару конвертов, вроде безобидное было.
Re[16]: Нифиа себе "гарантии"... ;)
От: D14  
Дата: 10.09.09 20:20
Оценка:
Здравствуйте, D14, Вы писали:

D14>Смотри. Пускай у нас реализуется неупорядоченная пара чисел

D14>{2^n,2^(n+1)} с вероятностью 2^n/3^(n+1) — пока все как в вики.
D14>Пускай нам открывают ОБА (для наглядности, без потери общности) конверта.
D14>Стратегия1 — выбираем большую сумму
D14>Стратегия2 — выбираем меньшую сумму
D14>Матожидание обоих стратегий — бесконечность, якобы поэтому по-твоему их сравнивать нельзя. Далее, ты пишешь
E>>Если уж корректно считать, надо оценивать вероятность выигрыша при той или иной стратегии. Или вероятность выигрыша более такой-то суммы и т. п., а не некоторый кусок матожидания считать...
D14>P{Стратегия1 приносит прибыль 2^n}=2^(n-1)/3^n
D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)

Не,не,не. Не так.
Вот так проще и лучше.
{2^n,3^n} с вероятностью 2^n/3^(n+1)
P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)
P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
Re[16]: Короткий ответ...
От: Erop Россия  
Дата: 10.09.09 21:12
Оценка:
Здравствуйте, D14, Вы писали:

E>>Если уж корректно считать, надо оценивать вероятность выигрыша при той или иной стратегии. Или вероятность выигрыша более такой-то суммы и т. п., а не некоторый кусок матожидания считать...

D14>P{Стратегия1 приносит прибыль 2^n}=2^(n-1)/3^n
D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)


Все эти сложные рассуждения приводить совсем не обязательно! Если ты утверждаешь, что за этим "парадоксом" скрывается какое-то содержание, кроме умелого запудривания мозгов, путём некорректного использования несуществующих предельных переходов, то вполне достаточно привести версию парадокса, БЕЗ некорректных пределов
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[16]: Про сравнения стратегий...
От: Erop Россия  
Дата: 10.09.09 21:19
Оценка:
Здравствуйте, D14, Вы писали:

D14>Смотри. Пускай у нас реализуется неупорядоченная пара чисел

D14>{2^n,2^(n+1)} с вероятностью 2^n/3^(n+1) — пока все как в вики.
D14>Пускай нам открывают ОБА (для наглядности, без потери общности) конверта.
D14>Стратегия1 — выбираем большую сумму
D14>Стратегия2 — выбираем меньшую сумму
D14>Матожидание обоих стратегий — бесконечность, якобы поэтому по-твоему их сравнивать нельзя. Далее, ты пишешь


Нет! Я утверждаю совсем другое! "Нельзя сравнивать таким образом!!!", а вовсе и "нельзя сравнивать"
Давай твой способ рассуждения (зафиксировали пару, предъявили её стратегиям и посмотрели что будет в данном конкретном случае).

Итого, породили пару конвертов. В одном х, в другом 2х. Эти суммы уже зафиксированы и измениться до конца опыта не смогут. Теперь берём стратегию 1. "Взять случайный из двух конвертов и открыть его". И берём стратегию 2. "Взять случайный из двух, но открыть другой". Ну и ясно, что результаты у стратегий одинаковы. Или повезёт или нет. Где тут возникнет несимметричность?...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[10]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 10.09.09 21:32
Оценка:
Здравствуйте, D14, Вы писали:

D14>Другое Не менять конверт? Аргументы в студию.

Третье. Если не глядя, то пофиг...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[17]: да чего там мелочиться-то?
От: Erop Россия  
Дата: 10.09.09 21:38
Оценка:
Здравствуйте, D14, Вы писали:

D14>Не,не,не. Не так.

D14>Вот так проще и лучше.
D14>{2^n,3^n} с вероятностью 2^n/3^(n+1)
D14>P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)
D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)

Вот тебе игра "ещё лучше".
Пусть ведущий не морочит нам и себе голову, а просто кладёт в сейф какую-то сумму денег.
Сумма распределена, как в примере в вики.
Игра такая. Он кладёт, а мы открываем сейф и забираем бабки, или не открываем, а просим положить ещё раз, вынув предыдущую сумму.

Ну вот, в какой-то конкретный момент в сейфе сумма всего х рублёв. А матожидание от "следующего раза" бесконечно много. Так что всегда выгодно попросить "переположить ещё раз"

Что не так в этом рассуждении? Можешь сказать?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[16]: Про игры с бесконечным МО выигрыша.
От: Erop Россия  
Дата: 10.09.09 21:41
Оценка:
Здравствуйте, D14, Вы писали:

E>>Лучше ты почитай внимательно. Если чувак раорится с вероятностью 1е-10, то называется это верный доход, а не "проиграет почти наверняка"...

D14>Ну, на самом-то деле при игре с бесконечно богатым противником, сиречь если мы не ограничиваем количество желающих сыграть в лотерею, чувак разорится почти всегда даже с конечным м.о. А с бесконечным м.о. возникнут еще большие сложности. Я сейчас не готов сказать, какие именно.

Это другой "парадокс". Он тут офтоп. Заведи другую ветку, или прочитай что писали в ветке про игру с бесконечным МО выигрыша. Ты бы по какой ставке согласился бы играть, кстати?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[16]: Где ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ?
От: Erop Россия  
Дата: 10.09.09 21:55
Оценка:
Здравствуйте, D14, Вы писали:

Вот с этого места я перестал понимать что ты пишешь:
D14>P{Стратегия1 приносит прибыль 2^n}=2^(n-1)/3^n
D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
D14>Вероятность выиграть более такой суммы сам знаешь как подсчитать. Она меньше 1
D14>Итак, согласно ТВОИМ аргументам в последней редакции сравнивать стратегии можно. И твои наезды на бесконечное м.о. пока никакой убедительной апологетикой не подкреплены.

D14>Где ошибка? Остальное все верно — парадокс в том, что менять надо строго всегда.

Да нет, парадокс конечно не в этом. А в том, что пофиг менять не глядя или не менять, а у нас в результате "рассуждений" получилось, что есть разница... Очевидно, что ошибка в рассуждениях...

D14>Мы не проводим опыты. У нас есть абстракция — априорная совместная функция распределения. Собственно, для того и вводят абстракцию вероятности, чтобы рассуждать о результатах опытов, не проводя их. Согласно функции распределения мы считаем условные вероятности, не пользуясь предельным переходом вообще. В условном м.о. для второго конверта я насчитал всего 3 знака сложения.


Я как-то иначе воспринимаю эту ситуацию. Вот у нас есть процедура с положением денег в конверты. Вот их перемешали и выдают нам. Вот мы рассматриваем разные стратегии нашего дальнейшего поведения. И вот мы сами себя запутали и получили, что одна из стратегий выгоднее эквивалентной стратегии. При этом мы не можем формально описать что тут обозначает слово "выгоднее".

При этом, обрати внимание, мы производим опыты с конвертами и деньгами, хотя бы и умозрительными, а не с абстракцией имеем дело... Абстракция в этом деле появляется позже. Когда мы начинаем пытаться оценивать стратегии, применяя некоторые теории. Возникает вопрос, почему же мы можем применять их в этом случае? Ну по идее потому, что мы производим предельный переход, на который якобы имеем право, согласно центральной предельной теореме.

То есть, мы получаем, либо то, что наш критерий "выгоднее" бессмыслен, либо критерий хороший, но мы его как-то не так применяем, либо есть какой-то косяк в теорвере.

Ну давай разбираться. У нас есть куча опытов. Каждый опыт одинаково распределён, поэтому результат усреднения этих опытов будет якобы стремиться к их матожиданию, при стремлении числа опытов к бесконечности (в этом суть ЦПТ).

Обычно это работает, потому, что распределения в реальности все "хорошие", но тут есть целых две засады.
Во-первых, у нас распределение опытов имеет бесконечную дисперсию. Во-вторых, нет самого матожидания...

Попробуй выписать ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ...
Тогда и можно будет говорить о чём-то...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[17]: Где ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ?
От: D14  
Дата: 11.09.09 05:48
Оценка:
Здравствуйте, Erop, Вы писали:

Уф, ну ты и отжигаешь. Буду отвечать постепенно, а то тред разрастается лавинообразно — у меня не хватит сил.

E>Вот с этого места я перестал понимать что ты пишешь:


Ты до этого говорил, что сравнивать стратегии нельзя. На вопрос когда нельзя, ты отвечал, что когда М.О. = бесконечности.
Мой поинт:
1.ты не прав
2.ты это даже не пытался доказать, кроме "так нельзя потому, что это не корректно"
3.игнорируешь мои примеры.
Давай заново. Пускай
{2^n,3^n} реализуется с вероятностью 2^n/3^(n+1) n=0,1,2,3,...
Стратегия1 — выбираем большую сумму
Стратегия2 — выбираем меньшую сумму
М.О. Стратегия1 = бесконечность
М.О. Стратегия2 = бесконечность
Стратегия1 лучше, т.к. позволяет получать большую прибыль. Если тут есть некорректность, докажи.
E>Если уж корректно считать, надо оценивать вероятность выигрыша при той или иной стратегии. Или вероятность выигрыша более такой-то суммы и т. п., а не некоторый кусок матожидания считать...
P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)
P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
P{Стратегия1 приносит прибыль >= 3^n}=2^n/3^(n+1)+2^(n+1)/3^(n+2)+ 2^(n+2)/3^(n+3)+ 2^(n+3)/3^(n+4)+... <1
и.т.д.
Итак, я только что корректно сравнил две стратегии. Корректно согласно твоему определению.
E>Я как-то иначе воспринимаю эту ситуацию. Вот у нас есть процедура с положением денег в конверты. Вот их перемешали и выдают нам. Вот мы рассматриваем разные стратегии нашего дальнейшего поведения. И вот мы сами себя запутали и получили, что одна из стратегий выгоднее эквивалентной стратегии. При этом мы не можем формально описать что тут обозначает слово "выгоднее".
Можем. Например, среднее отношение прибыли от обоих стретегий.
Другой пример, пускай у нас есть случайный массив. Стратегия1 — отсортировать его bubble sort, Стратегия2 — отсортировать его merge sort. Мы МОЖЕМ сравнивать время работы обеих стратегий сортировки. Спроси любого коллегу-программера.

E>Обычно это работает, потому, что распределения в реальности все "хорошие", но тут есть целых две засады.

E>Во-первых, у нас распределение опытов имеет бесконечную дисперсию. Во-вторых, нет самого матожидания...
Это НОРМАЛЬНО.

E>Попробуй выписать ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ...

Укажи на некорректность, постараюсь исправить.
Re[10]: Что на самом деле надо решать.
От: Eugene Sh Россия  
Дата: 11.09.09 11:35
Оценка:
Здравствуйте, D14, Вы писали:

Итак, у нас есть Стратегия 1 "Выбирать конверт и никогда не менять его" и Стратегия 2 "Выбирать конверт и всегда менять его".
Поехали.

ES>>Звучит довольно очевидно. Но это только до тех пор, пока мы не попытаемся объяснить это с математической точки зрения.

D14>А в чем же до этого была нематематичность?
Было написано, что Стратегия 2 лучше Стратегии 1. Чтобы утверждать такое с точки зрения математики, надо описать, как мы сравниваем стратегии. Нигде алгоритма сравнения стратегий приведено не было.

ES>>А для этого надо будет научиться сравнивать 2 стратегии (чтобы объяснить, почему одна из них лучше).

ES>>Попробуйте сделать это, увидите кое-что интересное.
D14>Я так не играю.
Хорошо, игры в стороны
Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.
Есть ли другие способы сравнения стратегий? Возможно, не знаю.

ES>>Абстрагируясь от конкретных описанных стратегий, рассмотрим просто Стратегию A и Стратегию B. Как определить, какая из них лучше?

D14>У вас есть bubble sort и merge sort. Есть распределение встречающихся длин массивов. Как сравнить, какой алгоритм быстрее? Ведь можно же, не правда ли?
Не совсем понял. Вы утверждаете, что стратегии не всегда можно сравнивать? Так с этим я полностью согласен.
Но если вы утверждаете, что "merge sort" лучше, чем "bubble sort", то потрудитесь объяснить, чем он лучше. А вот этого как раз авторы статьи и не сделали.

ES>>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.

D14>Другое Не менять конверт? Аргументы в студию.
С точки зрения математики обе стратегии равнозначны. Если, конечно, для сравнения стратегий использовать мат. ожидание выигрыша.
Re[11]: Что на самом деле надо решать.
От: D14  
Дата: 11.09.09 17:47
Оценка:
Здравствуйте, Eugene Sh, Вы писали:


ES>Было написано, что Стратегия 2 лучше Стратегии 1. Чтобы утверждать такое с точки зрения математики, надо описать, как мы сравниваем стратегии. Нигде алгоритма сравнения стратегий приведено не было.

См вычисленную м.о. Стратегии2 при фиксированном результате Стратегии1.

ES>Хорошо, игры в стороны

ES>Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.
ES>Есть ли другие способы сравнения стратегий? Возможно, не знаю.
Например, м.о. дохода Стратегии2 на рубль дохода от Стратегии1.

M[C2/C1]=sum(sum(y/x*P{C2=y,C1=x},y=2^(0,1...)),x=2^(0,1...))=
sum(sum(y/x*P{C2=y|C1=x}*P{C1=x},y=2^(0,1...)),x=2^(0,1...))=
sum((0.5*x*P{C2=0.5*x|C1=x}+2*x*P{C2=2*x|C1=x})/x*P{C1=x},x=2^(0,1...))
пренебрегая случаем x=1
sum(1.1*P{C1=x},x=2^(0,1...))=sum(1.1*P{C1=x},x=2^(0,1...))=1.1

ES>>>Абстрагируясь от конкретных описанных стратегий, рассмотрим просто Стратегию A и Стратегию B. Как определить, какая из них лучше?

D14>>У вас есть bubble sort и merge sort. Есть распределение встречающихся длин массивов. Как сравнить, какой алгоритм быстрее? Ведь можно же, не правда ли?
ES>Не совсем понял. Вы утверждаете, что стратегии не всегда можно сравнивать? Так с этим я полностью согласен.
ES>Но если вы утверждаете, что "merge sort" лучше, чем "bubble sort", то потрудитесь объяснить, чем он лучше.
Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

ES>>>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.

D14>>Другое Не менять конверт? Аргументы в студию.
ES>С точки зрения математики обе стратегии равнозначны. Если, конечно, для сравнения стратегий использовать мат. ожидание выигрыша.
Софистика. Последовательности 1/n и 1/n^2 "с точки зрения математики" равнозначны, если для сравнения использовать предел, ага?
Re[12]: И все-таки причина парадокса такая :)
От: Silver_s Ниоткуда  
Дата: 11.09.09 18:35
Оценка:
D14>The puzzle: The puzzle is to find the flaw, the erroneous step, in the switching argument above. This includes determining exactly why and under what conditions that step is not correct, in order to be sure not to make this mistake in a more complicated situation where the misstep may not be so obvious. In short, the problem is to solve the paradox.

И последнее по этой теме что хотелось сказать. Это психологический аспект этого парадокса.
Без этого сложно понять почему это считают парадоксом. Поскольку к теории вероятности это почти не относится, то можно не читать (для себя больше написал).
В этом аспекте незибежно вырисовывается логарифмический масштаб, т.к. для человека он актуален наравне с обычным.
Парадокс в том что когда задача стоит для логарифмического масштаба. Все расчеты по правильным алгоритмам ошибочны, если для обычного масштаба делаются. Потому что решают совсем другую задачу. А в такой постановке задачи вопрос неоднозначный — какой масштаб более уместен.
В задаче о конвертах в том виде в котором она есть — для первой сделки более актуален логарифмический масштаб. Для последующих сделок, начинает появляться обычный масштаб, потому что они суммируются. И такая постановка конкретизируется в несколько актуальных задач, и правильные ответы получаются разные.


Чтобы лучше выявить этот аспект, можно сделать предельный переход. Разница в конвертах будет не в 2 раза, а в 1000000 раз. Что получится? Речь идет о денежных чеках в конвертах, другой информации нет.
Есть fuuzy(или вероятностное) ограничение на суммы сверху. Снизу нет ограничений.
Но ответ очевиден — если в первом конверте 15 центов — практически все возьмут второй. Потому что для игрока 15 центов это полный ноль. Если он его оставит то все его имущество увеличится на 0.00...01% ~=~ 0% . Если выберет второй то: либо снова ~=~0% либо какой то ощутимый процент P (все-таки $150000). Получим в первом случае 0, во втором P>0.
Но если в первом конверте $50000 , то только авантюристы возьмут второй. И дело не просто в fuzzy ограничении сверху. Надо текущий капитал(пожитки) игрока учитывать. Эта задача больше в логарифмическом масштабе, чем в обычном.

Поясню что имеется ввиду.
Если человеку пердложить два варианта на выбор:
1) Либо весь его капитал,пожитки,(все что накоплено непосильным трудом ) в денежном выражении умножаются на 5 гарантированно.
2) Либо весь его капитал ... с вероятностью 50% на 50%
либо останется неизменым, либо умножится на 25(два раза на 5).
Только авантюристы и игроманы могут выбрать второй вариант. Но думаю большинство все таки возьмет первый. Не подсчитывая никакое матожидание, и будут правы. Почему? В первую очередь из-за большей актуальности здесь логарифмического масштаба.

Здесь матожидание выйдет такое(Сначала было X — все что есть):
1) Прибавка 5*X — X = 4*X (прибавка адитивная,в обычном масштабе)
2) Прибавка (X+25*X)/2 — X = 12*X
Во втором случае в 3 раза больше, но этот вариант хуже. Почему?
Если все манипуляции с суммами мультипликативные, то среднее арифметическое(оно же матожидание) здесь вобще неуместно.
Чтобы принять решение, здесь не средние арифметические надо считать. Больше подходит среднее геометрическое. Тогда в первом случае 5*X/X=5 и во вторм тоже 5.
Т.е. это похоже на матожидание для логарифмического масштаба, с последующим приведением результатов в обычный.

Если же все цифры меньше 1$, то более уместно будет в обычном масштабе считать. Т.к. на текщий капитал они не влияют.
Но для человека нет только одного масштаба. Если зрительно кто-то сравнивает длину бревна, то здесь,как известно, дифференциальный порог логарифмический. Оценено и запомнено будет с точностью 10% . Как для маленького карандаша, так и для 3 метрового бревна. Но обнаружить разницу в длинах объектов в 1% все равно можно — если их рядом поставить, т.к. такая манипуляция в обычном масштабе.
Re[19]: Хватай деньги и беги!!!
От: Erop Россия  
Дата: 11.09.09 19:37
Оценка:
Здравствуйте, D14, Вы писали:

D14>Все правильно. Ты выиграл 10 баксов. Тебе предлагают выиграть Форд. Ты выиграл Форд, тебе предлагают выиграть Бентли. и.т.д. Всегда выгодно.


Вот так-то вот лохов и разводят. В двух случаях из трёх там лежит бакс, в восьми девятых не более 2-х баксов, в 26/27-х не более трёх...
Так что если там лежит денег на "Форд" (даже если речь о тачке, а не о предприятии), то правильная реакция -- забирать деньги и бежать, а не гадеяться на "Бентли" в следующей "раздаче"...

Короче, в рассуждении есть ошибка. Тебе надо её найти...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[19]: да чего там мелочиться-то?
От: Erop Россия  
Дата: 11.09.09 19:43
Оценка:
Здравствуйте, D14, Вы писали:

D14>я поймал себя на мысли, что тупо пересказываю тебе вики.


Не надо пересказывать мне вики, тем более тупо!

Ты просто ответь, по какой ставке ты ещё согласился бы играть в ту игру с орлами и решками?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[18]: Где ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ?
От: Erop Россия  
Дата: 11.09.09 20:03
Оценка:
Здравствуйте, D14, Вы писали:


D14>Стратегия1 лучше, т.к. позволяет получать большую прибыль. Если тут есть некорректность, докажи.

Не наблюдаю доказательств того, что стратегия1 лучше. Мало того, не совсем ясно, что значит "лучше", (что именно должно было доказать опущенное доказательство)
Мало того, я совсем не понимаю как твои рассуждения связаны с моими. Ты же, для того, чтобы оценить стратигии не использовал никаких матожиданий, вроде бы? Да? А вот в доказательстве "двухконвертного парадокса" МО используются, и используются некорректно. Тип некорректности такой же, как в доказательстве, что чётных чисел в два раза больше чем нечётных...

D14>P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)

D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
D14>P{Стратегия1 приносит прибыль >= 3^n}=2^n/3^(n+1)+2^(n+1)/3^(n+2)+ 2^(n+2)/3^(n+3)+ 2^(n+3)/3^(n+4)+... <1
D14>и.т.д.
1) Я не понимаю, кто такой n в этих формулах. Опиши понятно, какой эксперимент ты проводишь и что с чем сравниваешь.
2) Я так же не понимаю, как в этих рассуждениях используется распределение этих чисел. Если никак, то я не понимаю, почему это аналог рассуждений из "двухконвертного парадокса".

D14>Итак, я только что корректно сравнил две стратегии. Корректно согласно твоему определению.

Во-первых, ты не сравнил. Ну то есть формально доказательное рассуждение отсутствует. И даже определение чтои с чем и при каких условиях ты сравниваешь отсутствует...

Вот смотри, закончи, пожалуйста фразу: "Стратегий 1 лучше стратегии 2 потому, что позволяет игроку..."? Ы?

При этом я обращаю твоё внимание на
I) Я считаю, что описанные тобой стратегию 1 и стратегию 2 можно сравнить корректно, и можно выписать формальный критерий, почему стратегия 1 лучше стратегии 2. Например потому, что вероятность того, что игрок придерживающийся при тех же сдачах стратегии 1 получит больше денег, чем игрок придерживающийся стратегии 2 довольно велика. Так как составляет 100%
II) Я считаю что стратегии "выбери случайный конверт и возьми его" и "выбери случайный конверт, посмотри сколько в нём денег, но возьми другой" эквивалентны, в том смысле, что при игре на одних и тех же "раскладах" вероятность того, что первый игрок наварит больше, чем второй равна вероятности того, что второй наварит больше, чем первый...
III) У меня есть теория, что "двухконвертовый парадокс" возникает при неаккуратном выполнении предельного перехода. Насколько я тебя понял, ты считаешь, что это не так и всякие несходящиеся суммы, интегралы и пределы не существенны в структуре этого парадокса. Я предлагаю тебе это доказать: СФОРМУЛИРУЙ "ДВУХКОНВЕРТОВЫЙ ПАРАДОКС" ПОЛНОСТЬЮ КОРРЕКТНО!!!


D14>Можем. Например, среднее отношение прибыли от обоих стретегий.

IMHO, это совершенно бредовый параметр. Смотри пусть выигрыши одной стратегии будут в верхней строке, а второй в нижней:
10 100 1е100
5 50 2е100

Тогда отношение выигрыша первой ко второй в каждом случае будет
2 2 0.5

А среднее отношение будет 1.5, то есть первая стратегия якобы в полтора раза лучше. А тем не менее на тех конкретных данных, на которых мы получили это "в полтора раза лучше" худшая стратегия принесла денег примерно в два раза больше...


E>>Обычно это работает, потому, что распределения в реальности все "хорошие", но тут есть целых две засады.

E>>Во-первых, у нас распределение опытов имеет бесконечную дисперсию. Во-вторых, нет самого матожидания...
D14>Это НОРМАЛЬНО.
Что НОРМАЛЬНО? Конечность дисперсии распределений -- это требование ЦПТ! На основании какого факта ты производишь предельный переход к вероятностям в случае бесконечных дисперсий и отсутсвующего МО?...


E>>Попробуй выписать ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ...

D14>Укажи на некорректность, постараюсь исправить.

На некорректность в чём? В рассуждении из вики я указал. Протвои "две стратегии" я так и не нашёл собственно рассуждения... Напиши ФОРМАЛЬНО доказательство. С обоснованием всех переходов.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[12]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 11.09.09 20:21
Оценка:
Здравствуйте, D14, Вы писали:

D14>См вычисленную м.о. Стратегии2 при фиксированном результате Стратегии1.

А почему это обозначает, что стратегия 2 лучше или хуже?
Где логический переход от этого м. о. к сравнению стратегий?



ES>>Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.

ES>>Есть ли другие способы сравнения стратегий? Возможно, не знаю.
D14>Например, м.о. дохода Стратегии2 на рубль дохода от Стратегии1.

D14>M[C2/C1]=sum(sum(y/x*P{C2=y,C1=x},y=2^(0,1...)),x=2^(0,1...))=

Во-первых я не согласен считать матожидание отношений выигрышей матожиданием дохода Стр2 на рубль дохода Стр1...

D14>sum(sum(y/x*P{C2=y|C1=x}*P{C1=x},y=2^(0,1...)),x=2^(0,1...))=

D14>sum((0.5*x*P{C2=0.5*x|C1=x}+2*x*P{C2=2*x|C1=x})/x*P{C1=x},x=2^(0,1...))
D14>пренебрегая случаем x=1
D14>sum(1.1*P{C1=x},x=2^(0,1...))=sum(1.1*P{C1=x},x=2^(0,1...))=1.1

А теперь посчитай МО обратного отношения Тоже 1.1 получшь.

И вообще, зачем так всё сложно?
Вот у меня есть генератор конвертов. Он кладёт {1 2}, {2 1}, {1 2}, {2 1} и т. д.
И есть у меня две стратегии: "брать всегда первый" и "брать всегда второй".
Ну так вот, отношение выигрышей будет 0.5, 2, 0.5, 2,...
Ну а "среднее отношение выигрышей" будет 1.25
При этом что у стратегии 1 к стратегии 2, что у стратегии 2 к стратегии 1...


D14>Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

Вообще-то утверждение шире. "Их можно сравнить многими способами. Одни из способов покажут что одна лучше, другие, что другая, а некоторые способы вообще не позволяют сравнивать некоторые стратегии"...

D14>Софистика. Последовательности 1/n и 1/n^2 "с точки зрения математики" равнозначны, если для сравнения использовать предел, ага?


Выпиши корректный способ сравнения. Или хотя бы какой-то нормальный. Усреднённое отношение выигрышей -- фуфло. Отношение средних выигрышей неопределено, что ещё посоветуешь?

Если вернуться к "двухконвертному парадоксу", то я утверждаю следующее.

Если мы возьмём серию из N игр, и сравним результат на серии одинаковых раскладов стратегии 1 и стратегии 2, то вероятность того, что больше денег заработает стратегия 1 чем стратегия 2 будет равна вероятности, что наоборот стратегия 2 заработает больше, чем стратегия 1.

Ну а теперь надо провести рассуждения из "двухконвертного парадокса", которые показывают, что стратегия 2 лучше, и показывают по какому критерию...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[10]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 11.09.09 20:50
Оценка:
Здравствуйте, D14, Вы писали:

ES>>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.

D14>Другое Не менять конверт? Аргументы в студию.

И вобще эти конверты в задаче чтобы сбить столку. И пропихнуть,под шумок ложное утверждение — "Если 50% на 50% что сумма удвоится или поделится на два, то это всегда в среднем увеличение суммы в 1.25 раз"
Доказательство его ложности:
Играем в мультипликативную монетку. В начале 100руб. Если орел, то текущий игровой капитал умножаем на 2,если решка делим на 2.
Сколько будет матожидание прибыли за 1000 сделок.
На одной сделке: 0.5*X*2+0.5*X/2 = 1.25*X (навар 25%)
За 1000 сделок 1000*1.25*X — Итого капиталл увеличился в 1250 раз(или может 1.25^1000=8e96 ?), неплохой навар для халявщиков. На такое решение намекают.

Теперь выбрасываем эту чушь на помойку. И делаем все правильно. Матожидание от[число решек минус число орлов] равно нулю. Сколько орлов столько и решек ожидается. Сколько делений столько и умноженний, реально блуждания как в плюс так и в минус могут отклониться. Реальное мат ожидание, что капиталл вобще не изменится (только считать его надо правильно).

Так что утверждение — либо *2 либо *0.5 дает всегда +25% это чушь.

Если с монетками так, чем конверты то хуже?
Re[11]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 12.09.09 03:04
Оценка:
Здравствуйте, Silver_s, Вы писали:

S_>И вобще эти конверты в задаче чтобы сбить столку. И пропихнуть,под шумок ложное утверждение — "Если 50% на 50% что сумма удвоится или поделится на два, то это всегда в среднем увеличение суммы в 1.25 раз"


В чём ты, IMHO, не прав: там нет слова "всегда", там есть слово "в среднем".
В "двухконвертовом парадоксе" суть рассуждений такая:
1) разбиваем все случаи на взаимоисключающие события "в первом открытом конверте х рублей"
2) Считаем отношение выгод в каждом из этих случаев
3) Усредняем по всем случаям и получаем общий результат.

Некорректным является третий шаг. Некорректен он сразу по двум причинам.
3а) В известных мне формулировках усреднений производится либо некорректно, либо путём написания слова "очевидно"
3б) На самом деле нам вообще нужно не усреднение, а переход от суммы как-то распределённых случайных величин, к распределению суммы.


S_>Сколько будет матожидание прибыли за 1000 сделок.

S_>На одной сделке: 0.5*X*2+0.5*X/2 = 1.25*X (навар 25%)
S_>За 1000 сделок 1000*1.25*X — Итого капиталл увеличился в 1250 раз(или может 1.25^1000=8e96 ?), неплохой навар для халявщиков. На такое решение намекают.

На самом деле тут нет ошибки. Ошибка состоит в том, что неверно применять МО, как оценку того, что будет "всегда".
В этой твоей "мультипликативной монетке" так всё и есть если повезёт, можно нереально наварится, но обычно не повезёт...

S_>Так что утверждение — либо *2 либо *0.5 дает всегда +25% это чушь.

Да, слово "всегда" делает из этой штуки чушь.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[13]: Что на самом деле надо решать.
От: D14  
Дата: 12.09.09 11:59
Оценка:
Здравствуйте, Eugene Sh, Вы писали:

ES>Значения P{C2=0.5*x|C1=x} и P{C1=0.5*x|C2=x} равны между собой.

ES>Также, равны между собой значения P{C2=2*x|C1=x} и P{C1=2*x|C2=x}.
ES>Попробуем теперь вычислить "м.о. дохода Стратегии1 на рубль дохода от Стратегии2"
ES>Выкладки будут те же самые, надо только поменять местами С1 и С2. С учетом только что описанных равенств получаем, что M[C1/C2] = 1.1
ES>Таким образом, величина M не может служить хорошей характеристикой для сравнения стратегий, так как M[C1/C2] = M[C2/C1].

Во-первых, я не замечаю в этих рассуждениях использование бесконечной м.о., а без этого парадокса нет.
Во-вторых, распределение сумм X и Y в обоих конверах одинаково, по условию оба конверта неразличимы.
То, что P(X=x|Y=y)=P(Y=y|X=x) — ничего нового не говорит. Это следствие симметрии конвертов.
В-третьих, мне придется в таком случае усложнить выкладки.
Итак, мы открываем конверт с некоторой суммой x. Далее вычисляем условную среднюю полезность от смены конверта.
Если она положительна, то мы принимаем решение поменять конверт. Теперь рассмотрим пример.
Пускай у нас в одном конверте 4. Полезность равна 0.4.
То есть, при наступлении события {в открытом конверте находится 4}, мы применяем либо нет стратегии.
Сами же стратегии определены на новом пространстве возможных событий. Пары (2,4),(4,2),(4,8),(8,4), где четверка нам известна, теперь есть одно элементарное неделимое событие.
Когда мы считаем P(A|X=x) такая запись корректна только при условии X-измеримости события A.
Например, событие {в конвертах находится (2,4)} больше не X-измеримо.
M(S2/S1)=sum(S2(x)/S1(x)*P{мы увидели x},x=1,2,4,8...) приблизительно равно 1.1.


D14>>Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

ES>Я уже почти готов поверить, что есть способ сравнения, при котором Стратегия 2 оказывается лучше Стратегии 1. Но пока я его не видел.
Ваши с Егором трудности шерифа не волнуют. Если вы не можете сравнить стратегии, то это значит, что вы не можете сказать, какая лучше. Но утверждать, что они равнозначны — софистика.
Я повторяю пример.
Пусть матожидании X = бесконечность (результат Санкт-Петербургской лотереи).
Вам выносят две открытых шкатулки на выбор с суммами (X,2*X).
Статегия1: выбор левой шкатулки.
Статегия2: выбор правой шкатулки.
М Статегия1 = +бесконечность
М Статегия2 = +бесконечность
М Статегия1-Статегия2 = +бесконечность

Вы с Егором выберете левую. Что ж. Ваше право.
Re[11]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 12.09.09 12:32
Оценка:
Здравствуйте, Eugene Sh, Вы писали:

ES>Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.

ES>Есть ли другие способы сравнения стратегий? Возможно, не знаю.
Есть конечно. Сравнить медианы. Если интересует среднестатистический игрок то медиана даже более актуальна. А матожидание здесь для "избранных". Но манипуляции с медианами сложнее.
Re: Этюд.
От: Silver_s Ниоткуда  
Дата: 12.09.09 22:09
Оценка:
Не совсем о конвертах. Но закину сюда.

Дано: Начальный капитал 1. Игра в монетку. На каждом шаге либо умножение капитала на положительное число p, либо деление на p.
А можно на это смотреть как на игру с обычным суммированием, но с изменяющимися размерами ставок.
Получится исход либо X*(p-1) , либо X*(1/p — 1) . Размер ставки получился пропорционален X (текущему капиталу).
Надо доказать что всегда сумма всех ставок где произошел проигрыш в p раз больше, чем сумма всех ставок на которых был выигрыш. При условии что орлов и решек выпало одинаковое число.
Т.е. всегда в среднем на проигранные сделки ставятся в p раз большие ставки, чем на выигранные.
Или попытаться опровергнуть(но опровергнуть врядли возможно).

Доказать это видимо можно проще,в обход. Как?
Но все же можно ли это напрямую доказать?

Получается дана,например, такая последовательность: 1*p/p*p/p/p*p
Т.е. последовательность положительных чисел p разделенных делениями или умножениями.
Обозначим:
SM — сумма полных левых частей для каждой операции умножения.
SD — сумма полных левых частей для каждой операции деления.
Т.е. для каждой операции деления(или умножения) берется все что стоит слева от нее от начала строки и прибавляется к общей сумме для каждого типа операции.
Число операций каждого типа одинаково. У первоЙ операции в строке левая часть = 1 .

Доказать, что всегда SD/SM = p, и что это соотношение справедливо для всех перестановок операций местами (если число делений и умножений одинаковое).

Например для: 1*p/p*p/p/p*p
SM = 1 + p/p + p/p*p/p/p =2+1/p (для умножений)
SD = p + p/p*p + p/p*p/p=2*p+1 (для делений)
SD/SM=p

Как доказать что это справедливо для любых перестановок, для последовательностей любой длины, не проверяя каждую перестановку по отдельности?
Или рекурентно доказать как-то ?
Будут ли какие-то соотношения, когда число операций деления и умножения не совпадают?
Re: парадокс конвертов
От: BulatZiganshin  
Дата: 18.10.09 11:32
Оценка:
Здравствуйте, Шебеко Евгений, Вы писали:

ШЕ>Интересная статья почитать для общего развития.

ШЕ>Парадокс конвертов губит природную симметрию случая

а можно так на это ответить: да, средний доход при обмене конверта 1.25n, НО при этом если пользоваться одним генератором сл. чисел для всей серии экспериментов, то в ситуациях когда в первом конверте находится большая сумма, среднее этих сумм будет больше. поэтому суммировать всё в одну кучу нельзя. скажем средний выигрышный конверт — $10, проигрышный — $5. поэтому средний выигрыш в стратегии обмена — те же $7.5, как и без него

соответственно ошибка состоит в том, что вычисляется матожидание серии экспериментов "вы каждый раз видите *одинаковую* сумму, в соседнем может быть вдвое больше или вдвое меньше, хотите обменять конверт?", а не такой, где генерятся случайные суммы и затем человек видит один из конвертов
Люди, я люблю вас! Будьте бдительны!!!
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.