Re[17]: да чего там мелочиться-то?
От: Erop Россия  
Дата: 10.09.09 21:38
Оценка:
Здравствуйте, D14, Вы писали:

D14>Не,не,не. Не так.

D14>Вот так проще и лучше.
D14>{2^n,3^n} с вероятностью 2^n/3^(n+1)
D14>P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)
D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)

Вот тебе игра "ещё лучше".
Пусть ведущий не морочит нам и себе голову, а просто кладёт в сейф какую-то сумму денег.
Сумма распределена, как в примере в вики.
Игра такая. Он кладёт, а мы открываем сейф и забираем бабки, или не открываем, а просим положить ещё раз, вынув предыдущую сумму.

Ну вот, в какой-то конкретный момент в сейфе сумма всего х рублёв. А матожидание от "следующего раза" бесконечно много. Так что всегда выгодно попросить "переположить ещё раз"

Что не так в этом рассуждении? Можешь сказать?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[16]: Про игры с бесконечным МО выигрыша.
От: Erop Россия  
Дата: 10.09.09 21:41
Оценка:
Здравствуйте, D14, Вы писали:

E>>Лучше ты почитай внимательно. Если чувак раорится с вероятностью 1е-10, то называется это верный доход, а не "проиграет почти наверняка"...

D14>Ну, на самом-то деле при игре с бесконечно богатым противником, сиречь если мы не ограничиваем количество желающих сыграть в лотерею, чувак разорится почти всегда даже с конечным м.о. А с бесконечным м.о. возникнут еще большие сложности. Я сейчас не готов сказать, какие именно.

Это другой "парадокс". Он тут офтоп. Заведи другую ветку, или прочитай что писали в ветке про игру с бесконечным МО выигрыша. Ты бы по какой ставке согласился бы играть, кстати?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[16]: Где ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ?
От: Erop Россия  
Дата: 10.09.09 21:55
Оценка:
Здравствуйте, D14, Вы писали:

Вот с этого места я перестал понимать что ты пишешь:
D14>P{Стратегия1 приносит прибыль 2^n}=2^(n-1)/3^n
D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
D14>Вероятность выиграть более такой суммы сам знаешь как подсчитать. Она меньше 1
D14>Итак, согласно ТВОИМ аргументам в последней редакции сравнивать стратегии можно. И твои наезды на бесконечное м.о. пока никакой убедительной апологетикой не подкреплены.

D14>Где ошибка? Остальное все верно — парадокс в том, что менять надо строго всегда.

Да нет, парадокс конечно не в этом. А в том, что пофиг менять не глядя или не менять, а у нас в результате "рассуждений" получилось, что есть разница... Очевидно, что ошибка в рассуждениях...

D14>Мы не проводим опыты. У нас есть абстракция — априорная совместная функция распределения. Собственно, для того и вводят абстракцию вероятности, чтобы рассуждать о результатах опытов, не проводя их. Согласно функции распределения мы считаем условные вероятности, не пользуясь предельным переходом вообще. В условном м.о. для второго конверта я насчитал всего 3 знака сложения.


Я как-то иначе воспринимаю эту ситуацию. Вот у нас есть процедура с положением денег в конверты. Вот их перемешали и выдают нам. Вот мы рассматриваем разные стратегии нашего дальнейшего поведения. И вот мы сами себя запутали и получили, что одна из стратегий выгоднее эквивалентной стратегии. При этом мы не можем формально описать что тут обозначает слово "выгоднее".

При этом, обрати внимание, мы производим опыты с конвертами и деньгами, хотя бы и умозрительными, а не с абстракцией имеем дело... Абстракция в этом деле появляется позже. Когда мы начинаем пытаться оценивать стратегии, применяя некоторые теории. Возникает вопрос, почему же мы можем применять их в этом случае? Ну по идее потому, что мы производим предельный переход, на который якобы имеем право, согласно центральной предельной теореме.

То есть, мы получаем, либо то, что наш критерий "выгоднее" бессмыслен, либо критерий хороший, но мы его как-то не так применяем, либо есть какой-то косяк в теорвере.

Ну давай разбираться. У нас есть куча опытов. Каждый опыт одинаково распределён, поэтому результат усреднения этих опытов будет якобы стремиться к их матожиданию, при стремлении числа опытов к бесконечности (в этом суть ЦПТ).

Обычно это работает, потому, что распределения в реальности все "хорошие", но тут есть целых две засады.
Во-первых, у нас распределение опытов имеет бесконечную дисперсию. Во-вторых, нет самого матожидания...

Попробуй выписать ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ...
Тогда и можно будет говорить о чём-то...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[17]: Где ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ?
От: D14  
Дата: 11.09.09 05:48
Оценка:
Здравствуйте, Erop, Вы писали:

Уф, ну ты и отжигаешь. Буду отвечать постепенно, а то тред разрастается лавинообразно — у меня не хватит сил.

E>Вот с этого места я перестал понимать что ты пишешь:


Ты до этого говорил, что сравнивать стратегии нельзя. На вопрос когда нельзя, ты отвечал, что когда М.О. = бесконечности.
Мой поинт:
1.ты не прав
2.ты это даже не пытался доказать, кроме "так нельзя потому, что это не корректно"
3.игнорируешь мои примеры.
Давай заново. Пускай
{2^n,3^n} реализуется с вероятностью 2^n/3^(n+1) n=0,1,2,3,...
Стратегия1 — выбираем большую сумму
Стратегия2 — выбираем меньшую сумму
М.О. Стратегия1 = бесконечность
М.О. Стратегия2 = бесконечность
Стратегия1 лучше, т.к. позволяет получать большую прибыль. Если тут есть некорректность, докажи.
E>Если уж корректно считать, надо оценивать вероятность выигрыша при той или иной стратегии. Или вероятность выигрыша более такой-то суммы и т. п., а не некоторый кусок матожидания считать...
P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)
P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
P{Стратегия1 приносит прибыль >= 3^n}=2^n/3^(n+1)+2^(n+1)/3^(n+2)+ 2^(n+2)/3^(n+3)+ 2^(n+3)/3^(n+4)+... <1
и.т.д.
Итак, я только что корректно сравнил две стратегии. Корректно согласно твоему определению.
E>Я как-то иначе воспринимаю эту ситуацию. Вот у нас есть процедура с положением денег в конверты. Вот их перемешали и выдают нам. Вот мы рассматриваем разные стратегии нашего дальнейшего поведения. И вот мы сами себя запутали и получили, что одна из стратегий выгоднее эквивалентной стратегии. При этом мы не можем формально описать что тут обозначает слово "выгоднее".
Можем. Например, среднее отношение прибыли от обоих стретегий.
Другой пример, пускай у нас есть случайный массив. Стратегия1 — отсортировать его bubble sort, Стратегия2 — отсортировать его merge sort. Мы МОЖЕМ сравнивать время работы обеих стратегий сортировки. Спроси любого коллегу-программера.

E>Обычно это работает, потому, что распределения в реальности все "хорошие", но тут есть целых две засады.

E>Во-первых, у нас распределение опытов имеет бесконечную дисперсию. Во-вторых, нет самого матожидания...
Это НОРМАЛЬНО.

E>Попробуй выписать ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ...

Укажи на некорректность, постараюсь исправить.
Re[18]: да чего там мелочиться-то?
От: D14  
Дата: 11.09.09 05:58
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>Вот тебе игра "ещё лучше".

E>Пусть ведущий не морочит нам и себе голову, а просто кладёт в сейф какую-то сумму денег.
E>Сумма распределена, как в примере в вики.
E>Игра такая. Он кладёт, а мы открываем сейф и забираем бабки, или не открываем, а просим положить ещё раз, вынув предыдущую сумму.

E>Ну вот, в какой-то конкретный момент в сейфе сумма всего х рублёв. А матожидание от "следующего раза" бесконечно много. Так что всегда выгодно попросить "переположить ещё раз"


E>Что не так в этом рассуждении? Можешь сказать?


Все правильно. Ты выиграл 10 баксов. Тебе предлагают выиграть Форд. Ты выиграл Форд, тебе предлагают выиграть Бентли. и.т.д. Всегда выгодно.
Re[18]: да чего там мелочиться-то?
От: D14  
Дата: 11.09.09 09:11
Оценка: :)
Здравствуйте, Erop, Вы писали:

Продолжим

E>Вот тебе игра "ещё лучше".

E>Пусть ведущий не морочит нам и себе голову, а просто кладёт в сейф какую-то сумму денег.
E>Сумма распределена, как в примере в вики.
E>Игра такая. Он кладёт, а мы открываем сейф и забираем бабки, или не открываем, а просим положить ещё раз, вынув предыдущую сумму.

E>Ну вот, в какой-то конкретный момент в сейфе сумма всего х рублёв. А матожидание от "следующего раза" бесконечно много. Так что всегда выгодно попросить "переположить ещё раз"


E>Что не так в этом рассуждении? Можешь сказать?

Да, могу сказать. Все так. Ты получил вариант Санкт-петербургской лотереи. Ты выиграл сумму x. Должен ли ты еще раз сыграть в лотерею? Да. Кстати, что там м.о. = бесконечность тебя не смщало, когда ты кидал ссылки на тот топик. А вообще, я поймал себя на мысли, что тупо пересказываю тебе вики. Решил не тратить свое время, а просто процитировать фрагмент. Почитай плиз. последний абзац, прежде чем отвечать

Suppose that one has a ticket to the St. Petersburg lottery as stated in that problem. Should the player be willing to trade it for another ticket to the lottery? Since the St. Petersburg lottery has an infinite expected value, once the lottery ticket value is determined, no matter what (finite) value it is worth, the player should be willing to trade it for another ticket to a new, not yet drawn, lottery. However, even before the lottery ticket is drawn, the player could reason as follows: "My ticket has some finite value. No matter what it is, given my ticket's finite value I should switch to another ticket, which has an infinite expected value. Therefore I should keep switching tickets indefinitely." This is clearly absurd, and parallel to the envelope problem; conditioned on any particular finite value of a random variable with infinite expectation, the player should switch to another random variable with infinite expectation. The extra wrinkle in the envelope problem is that the second envelope's expectation appears to depend on the first. However, it is not clear that the player should truly prefer one infinite expected value to another.

However, Clark and Shackel argue that this blaming it all on "the strange behaviour of infinity" doesn't resolve the paradox at all; neither in the single case nor the averaged case. They provide a simple example of a pair of random variables both having infinite mean but where one is always better to choose than the other.[6] This is the best thing to do at every instant as well as on average, which shows that decision theory doesn't necessarily break down when confronted with infinite expectations.
Re[10]: Что на самом деле надо решать.
От: Eugene Sh Россия  
Дата: 11.09.09 11:35
Оценка:
Здравствуйте, D14, Вы писали:

Итак, у нас есть Стратегия 1 "Выбирать конверт и никогда не менять его" и Стратегия 2 "Выбирать конверт и всегда менять его".
Поехали.

ES>>Звучит довольно очевидно. Но это только до тех пор, пока мы не попытаемся объяснить это с математической точки зрения.

D14>А в чем же до этого была нематематичность?
Было написано, что Стратегия 2 лучше Стратегии 1. Чтобы утверждать такое с точки зрения математики, надо описать, как мы сравниваем стратегии. Нигде алгоритма сравнения стратегий приведено не было.

ES>>А для этого надо будет научиться сравнивать 2 стратегии (чтобы объяснить, почему одна из них лучше).

ES>>Попробуйте сделать это, увидите кое-что интересное.
D14>Я так не играю.
Хорошо, игры в стороны
Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.
Есть ли другие способы сравнения стратегий? Возможно, не знаю.

ES>>Абстрагируясь от конкретных описанных стратегий, рассмотрим просто Стратегию A и Стратегию B. Как определить, какая из них лучше?

D14>У вас есть bubble sort и merge sort. Есть распределение встречающихся длин массивов. Как сравнить, какой алгоритм быстрее? Ведь можно же, не правда ли?
Не совсем понял. Вы утверждаете, что стратегии не всегда можно сравнивать? Так с этим я полностью согласен.
Но если вы утверждаете, что "merge sort" лучше, чем "bubble sort", то потрудитесь объяснить, чем он лучше. А вот этого как раз авторы статьи и не сделали.

ES>>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.

D14>Другое Не менять конверт? Аргументы в студию.
С точки зрения математики обе стратегии равнозначны. Если, конечно, для сравнения стратегий использовать мат. ожидание выигрыша.
Re[11]: Что на самом деле надо решать.
От: D14  
Дата: 11.09.09 17:47
Оценка:
Здравствуйте, Eugene Sh, Вы писали:


ES>Было написано, что Стратегия 2 лучше Стратегии 1. Чтобы утверждать такое с точки зрения математики, надо описать, как мы сравниваем стратегии. Нигде алгоритма сравнения стратегий приведено не было.

См вычисленную м.о. Стратегии2 при фиксированном результате Стратегии1.

ES>Хорошо, игры в стороны

ES>Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.
ES>Есть ли другие способы сравнения стратегий? Возможно, не знаю.
Например, м.о. дохода Стратегии2 на рубль дохода от Стратегии1.

M[C2/C1]=sum(sum(y/x*P{C2=y,C1=x},y=2^(0,1...)),x=2^(0,1...))=
sum(sum(y/x*P{C2=y|C1=x}*P{C1=x},y=2^(0,1...)),x=2^(0,1...))=
sum((0.5*x*P{C2=0.5*x|C1=x}+2*x*P{C2=2*x|C1=x})/x*P{C1=x},x=2^(0,1...))
пренебрегая случаем x=1
sum(1.1*P{C1=x},x=2^(0,1...))=sum(1.1*P{C1=x},x=2^(0,1...))=1.1

ES>>>Абстрагируясь от конкретных описанных стратегий, рассмотрим просто Стратегию A и Стратегию B. Как определить, какая из них лучше?

D14>>У вас есть bubble sort и merge sort. Есть распределение встречающихся длин массивов. Как сравнить, какой алгоритм быстрее? Ведь можно же, не правда ли?
ES>Не совсем понял. Вы утверждаете, что стратегии не всегда можно сравнивать? Так с этим я полностью согласен.
ES>Но если вы утверждаете, что "merge sort" лучше, чем "bubble sort", то потрудитесь объяснить, чем он лучше.
Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

ES>>>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.

D14>>Другое Не менять конверт? Аргументы в студию.
ES>С точки зрения математики обе стратегии равнозначны. Если, конечно, для сравнения стратегий использовать мат. ожидание выигрыша.
Софистика. Последовательности 1/n и 1/n^2 "с точки зрения математики" равнозначны, если для сравнения использовать предел, ага?
Re[12]: И все-таки причина парадокса такая :)
От: Silver_s Ниоткуда  
Дата: 11.09.09 18:35
Оценка:
D14>The puzzle: The puzzle is to find the flaw, the erroneous step, in the switching argument above. This includes determining exactly why and under what conditions that step is not correct, in order to be sure not to make this mistake in a more complicated situation where the misstep may not be so obvious. In short, the problem is to solve the paradox.

И последнее по этой теме что хотелось сказать. Это психологический аспект этого парадокса.
Без этого сложно понять почему это считают парадоксом. Поскольку к теории вероятности это почти не относится, то можно не читать (для себя больше написал).
В этом аспекте незибежно вырисовывается логарифмический масштаб, т.к. для человека он актуален наравне с обычным.
Парадокс в том что когда задача стоит для логарифмического масштаба. Все расчеты по правильным алгоритмам ошибочны, если для обычного масштаба делаются. Потому что решают совсем другую задачу. А в такой постановке задачи вопрос неоднозначный — какой масштаб более уместен.
В задаче о конвертах в том виде в котором она есть — для первой сделки более актуален логарифмический масштаб. Для последующих сделок, начинает появляться обычный масштаб, потому что они суммируются. И такая постановка конкретизируется в несколько актуальных задач, и правильные ответы получаются разные.


Чтобы лучше выявить этот аспект, можно сделать предельный переход. Разница в конвертах будет не в 2 раза, а в 1000000 раз. Что получится? Речь идет о денежных чеках в конвертах, другой информации нет.
Есть fuuzy(или вероятностное) ограничение на суммы сверху. Снизу нет ограничений.
Но ответ очевиден — если в первом конверте 15 центов — практически все возьмут второй. Потому что для игрока 15 центов это полный ноль. Если он его оставит то все его имущество увеличится на 0.00...01% ~=~ 0% . Если выберет второй то: либо снова ~=~0% либо какой то ощутимый процент P (все-таки $150000). Получим в первом случае 0, во втором P>0.
Но если в первом конверте $50000 , то только авантюристы возьмут второй. И дело не просто в fuzzy ограничении сверху. Надо текущий капитал(пожитки) игрока учитывать. Эта задача больше в логарифмическом масштабе, чем в обычном.

Поясню что имеется ввиду.
Если человеку пердложить два варианта на выбор:
1) Либо весь его капитал,пожитки,(все что накоплено непосильным трудом ) в денежном выражении умножаются на 5 гарантированно.
2) Либо весь его капитал ... с вероятностью 50% на 50%
либо останется неизменым, либо умножится на 25(два раза на 5).
Только авантюристы и игроманы могут выбрать второй вариант. Но думаю большинство все таки возьмет первый. Не подсчитывая никакое матожидание, и будут правы. Почему? В первую очередь из-за большей актуальности здесь логарифмического масштаба.

Здесь матожидание выйдет такое(Сначала было X — все что есть):
1) Прибавка 5*X — X = 4*X (прибавка адитивная,в обычном масштабе)
2) Прибавка (X+25*X)/2 — X = 12*X
Во втором случае в 3 раза больше, но этот вариант хуже. Почему?
Если все манипуляции с суммами мультипликативные, то среднее арифметическое(оно же матожидание) здесь вобще неуместно.
Чтобы принять решение, здесь не средние арифметические надо считать. Больше подходит среднее геометрическое. Тогда в первом случае 5*X/X=5 и во вторм тоже 5.
Т.е. это похоже на матожидание для логарифмического масштаба, с последующим приведением результатов в обычный.

Если же все цифры меньше 1$, то более уместно будет в обычном масштабе считать. Т.к. на текщий капитал они не влияют.
Но для человека нет только одного масштаба. Если зрительно кто-то сравнивает длину бревна, то здесь,как известно, дифференциальный порог логарифмический. Оценено и запомнено будет с точностью 10% . Как для маленького карандаша, так и для 3 метрового бревна. Но обнаружить разницу в длинах объектов в 1% все равно можно — если их рядом поставить, т.к. такая манипуляция в обычном масштабе.
Re[19]: Хватай деньги и беги!!!
От: Erop Россия  
Дата: 11.09.09 19:37
Оценка:
Здравствуйте, D14, Вы писали:

D14>Все правильно. Ты выиграл 10 баксов. Тебе предлагают выиграть Форд. Ты выиграл Форд, тебе предлагают выиграть Бентли. и.т.д. Всегда выгодно.


Вот так-то вот лохов и разводят. В двух случаях из трёх там лежит бакс, в восьми девятых не более 2-х баксов, в 26/27-х не более трёх...
Так что если там лежит денег на "Форд" (даже если речь о тачке, а не о предприятии), то правильная реакция -- забирать деньги и бежать, а не гадеяться на "Бентли" в следующей "раздаче"...

Короче, в рассуждении есть ошибка. Тебе надо её найти...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[19]: да чего там мелочиться-то?
От: Erop Россия  
Дата: 11.09.09 19:43
Оценка:
Здравствуйте, D14, Вы писали:

D14>я поймал себя на мысли, что тупо пересказываю тебе вики.


Не надо пересказывать мне вики, тем более тупо!

Ты просто ответь, по какой ставке ты ещё согласился бы играть в ту игру с орлами и решками?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[18]: Где ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ?
От: Erop Россия  
Дата: 11.09.09 20:03
Оценка:
Здравствуйте, D14, Вы писали:


D14>Стратегия1 лучше, т.к. позволяет получать большую прибыль. Если тут есть некорректность, докажи.

Не наблюдаю доказательств того, что стратегия1 лучше. Мало того, не совсем ясно, что значит "лучше", (что именно должно было доказать опущенное доказательство)
Мало того, я совсем не понимаю как твои рассуждения связаны с моими. Ты же, для того, чтобы оценить стратигии не использовал никаких матожиданий, вроде бы? Да? А вот в доказательстве "двухконвертного парадокса" МО используются, и используются некорректно. Тип некорректности такой же, как в доказательстве, что чётных чисел в два раза больше чем нечётных...

D14>P{Стратегия1 приносит прибыль 3^n}=2^n/3^(n+1)

D14>P{Стратегия2 приносит прибыль 2^n}=2^n/3^(n+1)
D14>P{Стратегия1 приносит прибыль >= 3^n}=2^n/3^(n+1)+2^(n+1)/3^(n+2)+ 2^(n+2)/3^(n+3)+ 2^(n+3)/3^(n+4)+... <1
D14>и.т.д.
1) Я не понимаю, кто такой n в этих формулах. Опиши понятно, какой эксперимент ты проводишь и что с чем сравниваешь.
2) Я так же не понимаю, как в этих рассуждениях используется распределение этих чисел. Если никак, то я не понимаю, почему это аналог рассуждений из "двухконвертного парадокса".

D14>Итак, я только что корректно сравнил две стратегии. Корректно согласно твоему определению.

Во-первых, ты не сравнил. Ну то есть формально доказательное рассуждение отсутствует. И даже определение чтои с чем и при каких условиях ты сравниваешь отсутствует...

Вот смотри, закончи, пожалуйста фразу: "Стратегий 1 лучше стратегии 2 потому, что позволяет игроку..."? Ы?

При этом я обращаю твоё внимание на
I) Я считаю, что описанные тобой стратегию 1 и стратегию 2 можно сравнить корректно, и можно выписать формальный критерий, почему стратегия 1 лучше стратегии 2. Например потому, что вероятность того, что игрок придерживающийся при тех же сдачах стратегии 1 получит больше денег, чем игрок придерживающийся стратегии 2 довольно велика. Так как составляет 100%
II) Я считаю что стратегии "выбери случайный конверт и возьми его" и "выбери случайный конверт, посмотри сколько в нём денег, но возьми другой" эквивалентны, в том смысле, что при игре на одних и тех же "раскладах" вероятность того, что первый игрок наварит больше, чем второй равна вероятности того, что второй наварит больше, чем первый...
III) У меня есть теория, что "двухконвертовый парадокс" возникает при неаккуратном выполнении предельного перехода. Насколько я тебя понял, ты считаешь, что это не так и всякие несходящиеся суммы, интегралы и пределы не существенны в структуре этого парадокса. Я предлагаю тебе это доказать: СФОРМУЛИРУЙ "ДВУХКОНВЕРТОВЫЙ ПАРАДОКС" ПОЛНОСТЬЮ КОРРЕКТНО!!!


D14>Можем. Например, среднее отношение прибыли от обоих стретегий.

IMHO, это совершенно бредовый параметр. Смотри пусть выигрыши одной стратегии будут в верхней строке, а второй в нижней:
10 100 1е100
5 50 2е100

Тогда отношение выигрыша первой ко второй в каждом случае будет
2 2 0.5

А среднее отношение будет 1.5, то есть первая стратегия якобы в полтора раза лучше. А тем не менее на тех конкретных данных, на которых мы получили это "в полтора раза лучше" худшая стратегия принесла денег примерно в два раза больше...


E>>Обычно это работает, потому, что распределения в реальности все "хорошие", но тут есть целых две засады.

E>>Во-первых, у нас распределение опытов имеет бесконечную дисперсию. Во-вторых, нет самого матожидания...
D14>Это НОРМАЛЬНО.
Что НОРМАЛЬНО? Конечность дисперсии распределений -- это требование ЦПТ! На основании какого факта ты производишь предельный переход к вероятностям в случае бесконечных дисперсий и отсутсвующего МО?...


E>>Попробуй выписать ПОЛНОСТЬЮ КОРРЕКТНОЕ РАССУЖДЕНИЕ...

D14>Укажи на некорректность, постараюсь исправить.

На некорректность в чём? В рассуждении из вики я указал. Протвои "две стратегии" я так и не нашёл собственно рассуждения... Напиши ФОРМАЛЬНО доказательство. С обоснованием всех переходов.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[12]: Что на самом деле надо решать.
От: Eugene Sh Россия  
Дата: 11.09.09 20:10
Оценка: +1
Здравствуйте, D14, Вы писали:

D14>Например, м.о. дохода Стратегии2 на рубль дохода от Стратегии1.


D14>M[C2/C1]=sum(sum(y/x*P{C2=y,C1=x},y=2^(0,1...)),x=2^(0,1...))=

D14>sum(sum(y/x*P{C2=y|C1=x}*P{C1=x},y=2^(0,1...)),x=2^(0,1...))=
D14>sum((0.5*x*P{C2=0.5*x|C1=x}+2*x*P{C2=2*x|C1=x})/x*P{C1=x},x=2^(0,1...))
D14>пренебрегая случаем x=1
D14>sum(1.1*P{C1=x},x=2^(0,1...))=sum(1.1*P{C1=x},x=2^(0,1...))=1.1

Значения P{C2=0.5*x|C1=x} и P{C1=0.5*x|C2=x} равны между собой.
Также, равны между собой значения P{C2=2*x|C1=x} и P{C1=2*x|C2=x}.
Попробуем теперь вычислить "м.о. дохода Стратегии1 на рубль дохода от Стратегии2"
Выкладки будут те же самые, надо только поменять местами С1 и С2. С учетом только что описанных равенств получаем, что M[C1/C2] = 1.1
Таким образом, величина M не может служить хорошей характеристикой для сравнения стратегий, так как M[C1/C2] = M[C2/C1].

D14>Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

Я уже почти готов поверить, что есть способ сравнения, при котором Стратегия 2 оказывается лучше Стратегии 1. Но пока я его не видел.
Re[12]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 11.09.09 20:21
Оценка:
Здравствуйте, D14, Вы писали:

D14>См вычисленную м.о. Стратегии2 при фиксированном результате Стратегии1.

А почему это обозначает, что стратегия 2 лучше или хуже?
Где логический переход от этого м. о. к сравнению стратегий?



ES>>Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.

ES>>Есть ли другие способы сравнения стратегий? Возможно, не знаю.
D14>Например, м.о. дохода Стратегии2 на рубль дохода от Стратегии1.

D14>M[C2/C1]=sum(sum(y/x*P{C2=y,C1=x},y=2^(0,1...)),x=2^(0,1...))=

Во-первых я не согласен считать матожидание отношений выигрышей матожиданием дохода Стр2 на рубль дохода Стр1...

D14>sum(sum(y/x*P{C2=y|C1=x}*P{C1=x},y=2^(0,1...)),x=2^(0,1...))=

D14>sum((0.5*x*P{C2=0.5*x|C1=x}+2*x*P{C2=2*x|C1=x})/x*P{C1=x},x=2^(0,1...))
D14>пренебрегая случаем x=1
D14>sum(1.1*P{C1=x},x=2^(0,1...))=sum(1.1*P{C1=x},x=2^(0,1...))=1.1

А теперь посчитай МО обратного отношения Тоже 1.1 получшь.

И вообще, зачем так всё сложно?
Вот у меня есть генератор конвертов. Он кладёт {1 2}, {2 1}, {1 2}, {2 1} и т. д.
И есть у меня две стратегии: "брать всегда первый" и "брать всегда второй".
Ну так вот, отношение выигрышей будет 0.5, 2, 0.5, 2,...
Ну а "среднее отношение выигрышей" будет 1.25
При этом что у стратегии 1 к стратегии 2, что у стратегии 2 к стратегии 1...


D14>Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

Вообще-то утверждение шире. "Их можно сравнить многими способами. Одни из способов покажут что одна лучше, другие, что другая, а некоторые способы вообще не позволяют сравнивать некоторые стратегии"...

D14>Софистика. Последовательности 1/n и 1/n^2 "с точки зрения математики" равнозначны, если для сравнения использовать предел, ага?


Выпиши корректный способ сравнения. Или хотя бы какой-то нормальный. Усреднённое отношение выигрышей -- фуфло. Отношение средних выигрышей неопределено, что ещё посоветуешь?

Если вернуться к "двухконвертному парадоксу", то я утверждаю следующее.

Если мы возьмём серию из N игр, и сравним результат на серии одинаковых раскладов стратегии 1 и стратегии 2, то вероятность того, что больше денег заработает стратегия 1 чем стратегия 2 будет равна вероятности, что наоборот стратегия 2 заработает больше, чем стратегия 1.

Ну а теперь надо провести рассуждения из "двухконвертного парадокса", которые показывают, что стратегия 2 лучше, и показывают по какому критерию...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[10]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 11.09.09 20:50
Оценка:
Здравствуйте, D14, Вы писали:

ES>>Но с "обывательской" точки зрения это действительно парадокс. Ведь кажется очевидным, что "раз мат. ожидание во втором конверте равно 1.1 * X, то мы должны менять конверт". Но у математики на этот счет другое мнение.

D14>Другое Не менять конверт? Аргументы в студию.

И вобще эти конверты в задаче чтобы сбить столку. И пропихнуть,под шумок ложное утверждение — "Если 50% на 50% что сумма удвоится или поделится на два, то это всегда в среднем увеличение суммы в 1.25 раз"
Доказательство его ложности:
Играем в мультипликативную монетку. В начале 100руб. Если орел, то текущий игровой капитал умножаем на 2,если решка делим на 2.
Сколько будет матожидание прибыли за 1000 сделок.
На одной сделке: 0.5*X*2+0.5*X/2 = 1.25*X (навар 25%)
За 1000 сделок 1000*1.25*X — Итого капиталл увеличился в 1250 раз(или может 1.25^1000=8e96 ?), неплохой навар для халявщиков. На такое решение намекают.

Теперь выбрасываем эту чушь на помойку. И делаем все правильно. Матожидание от[число решек минус число орлов] равно нулю. Сколько орлов столько и решек ожидается. Сколько делений столько и умноженний, реально блуждания как в плюс так и в минус могут отклониться. Реальное мат ожидание, что капиталл вобще не изменится (только считать его надо правильно).

Так что утверждение — либо *2 либо *0.5 дает всегда +25% это чушь.

Если с монетками так, чем конверты то хуже?
Re[11]: Что на самом деле надо решать.
От: Erop Россия  
Дата: 12.09.09 03:04
Оценка:
Здравствуйте, Silver_s, Вы писали:

S_>И вобще эти конверты в задаче чтобы сбить столку. И пропихнуть,под шумок ложное утверждение — "Если 50% на 50% что сумма удвоится или поделится на два, то это всегда в среднем увеличение суммы в 1.25 раз"


В чём ты, IMHO, не прав: там нет слова "всегда", там есть слово "в среднем".
В "двухконвертовом парадоксе" суть рассуждений такая:
1) разбиваем все случаи на взаимоисключающие события "в первом открытом конверте х рублей"
2) Считаем отношение выгод в каждом из этих случаев
3) Усредняем по всем случаям и получаем общий результат.

Некорректным является третий шаг. Некорректен он сразу по двум причинам.
3а) В известных мне формулировках усреднений производится либо некорректно, либо путём написания слова "очевидно"
3б) На самом деле нам вообще нужно не усреднение, а переход от суммы как-то распределённых случайных величин, к распределению суммы.


S_>Сколько будет матожидание прибыли за 1000 сделок.

S_>На одной сделке: 0.5*X*2+0.5*X/2 = 1.25*X (навар 25%)
S_>За 1000 сделок 1000*1.25*X — Итого капиталл увеличился в 1250 раз(или может 1.25^1000=8e96 ?), неплохой навар для халявщиков. На такое решение намекают.

На самом деле тут нет ошибки. Ошибка состоит в том, что неверно применять МО, как оценку того, что будет "всегда".
В этой твоей "мультипликативной монетке" так всё и есть если повезёт, можно нереально наварится, но обычно не повезёт...

S_>Так что утверждение — либо *2 либо *0.5 дает всегда +25% это чушь.

Да, слово "всегда" делает из этой штуки чушь.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[12]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 12.09.09 10:06
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>3) Усредняем по всем случаям и получаем общий результат.

E>Некорректным является третий шаг. Некорректен он сразу по двум причинам.
E>3а) В известных мне формулировках усреднений производится либо некорректно, либо путём написания слова "очевидно"
E>3б) На самом деле нам вообще нужно не усреднение, а переход от суммы как-то распределённых случайных величин, к распределению суммы.

Можно тут и условно сказать что усреднение не даст правильный результат, потому что здесь проигрыши будут на больших ставках происходить, выигрыши на меньших, а в усреднении это не учтется. При неизменном числе проигрышей, они смещаются в сторону больших ставок. (не сама сумма проигрыша а ставка на которой он случился). Если игроку скажут что будет 10 делений и 10 умножений но для разных ставок. Это ему ничего не скажет о прибыли. Если 10 делений на ставке 1000, а 10 умножений на ставке 100, то это убыток.И наоборот.

E>На самом деле тут нет ошибки. Ошибка состоит в том, что неверно применять МО, как оценку того, что будет "всегда".

E>В этой твоей "мультипликативной монетке" так всё и есть если повезёт, можно нереально наварится, но обычно не повезёт...

Вот говорили про обывательскую точку зрения (интерпретацию)... И с точки зрения обывателя,все-таки тоже хочется чтобы все сходилось, а не только по формулам. Но к счастью есть замечательное объяснение и закон. Который снимает полностью все вопросы, так что любой обыватель может спать спокойно.
Называется он "Закон подлости" (не шутка).
В случае с конвертами он активно работает.
Для игрока-обывателя это наблюдается как небольшая неприятность: На втором конверте прибыль +25% действительно есть, но она изчезает из-за того что выигрыши чаще случаются на маленьких ставках, а проигрыши на больших. Причем это действует ровно настолько чтобы убрать сомнительную прибыль. Он и на монетке работает, если не суммировать а умнажать к прибыли. Фокус в том что здесь конкретные размеры ставок не детерминированы в будущем, и закон подлости этим пользуется.

Но закон подлости не так плох. Он и в противоположную сторону работает, когда у игрока проблемы на пустом месте, в игре с суммированием.
Например выиграл игрок уже $1000 дальше предстоит на монетке либо +100,либо -100.
Значит здесь текущий капитал либо умножит на 1.1, либо разделит на 1.1111(1) .
Если постоянно равновероятно делить на большее число так и разориться недолго? Что делать,бросить все и бежать? Но закон подлости начнет уже помогать, компенсирует сомнительные убытки. Выигрыши будут чаще при игре на больший множитель, проигрыши на меньший. Фокус в том что здесь ставка-множитель не детерменирован в будущем, и закон подлости этим пользуется.

Так что это даже закон справедливости, а не подлости. Облегчающий жизнь обывателя
Re[13]: Что на самом деле надо решать.
От: D14  
Дата: 12.09.09 11:59
Оценка:
Здравствуйте, Eugene Sh, Вы писали:

ES>Значения P{C2=0.5*x|C1=x} и P{C1=0.5*x|C2=x} равны между собой.

ES>Также, равны между собой значения P{C2=2*x|C1=x} и P{C1=2*x|C2=x}.
ES>Попробуем теперь вычислить "м.о. дохода Стратегии1 на рубль дохода от Стратегии2"
ES>Выкладки будут те же самые, надо только поменять местами С1 и С2. С учетом только что описанных равенств получаем, что M[C1/C2] = 1.1
ES>Таким образом, величина M не может служить хорошей характеристикой для сравнения стратегий, так как M[C1/C2] = M[C2/C1].

Во-первых, я не замечаю в этих рассуждениях использование бесконечной м.о., а без этого парадокса нет.
Во-вторых, распределение сумм X и Y в обоих конверах одинаково, по условию оба конверта неразличимы.
То, что P(X=x|Y=y)=P(Y=y|X=x) — ничего нового не говорит. Это следствие симметрии конвертов.
В-третьих, мне придется в таком случае усложнить выкладки.
Итак, мы открываем конверт с некоторой суммой x. Далее вычисляем условную среднюю полезность от смены конверта.
Если она положительна, то мы принимаем решение поменять конверт. Теперь рассмотрим пример.
Пускай у нас в одном конверте 4. Полезность равна 0.4.
То есть, при наступлении события {в открытом конверте находится 4}, мы применяем либо нет стратегии.
Сами же стратегии определены на новом пространстве возможных событий. Пары (2,4),(4,2),(4,8),(8,4), где четверка нам известна, теперь есть одно элементарное неделимое событие.
Когда мы считаем P(A|X=x) такая запись корректна только при условии X-измеримости события A.
Например, событие {в конвертах находится (2,4)} больше не X-измеримо.
M(S2/S1)=sum(S2(x)/S1(x)*P{мы увидели x},x=1,2,4,8...) приблизительно равно 1.1.


D14>>Я утверждаю, что их можно сравнивать. Вы — что они одинаковые, причем не потому, что они одинаковые , а потому, что вы их не умеете сравнивать при определенным образом подобранных данных.

ES>Я уже почти готов поверить, что есть способ сравнения, при котором Стратегия 2 оказывается лучше Стратегии 1. Но пока я его не видел.
Ваши с Егором трудности шерифа не волнуют. Если вы не можете сравнить стратегии, то это значит, что вы не можете сказать, какая лучше. Но утверждать, что они равнозначны — софистика.
Я повторяю пример.
Пусть матожидании X = бесконечность (результат Санкт-Петербургской лотереи).
Вам выносят две открытых шкатулки на выбор с суммами (X,2*X).
Статегия1: выбор левой шкатулки.
Статегия2: выбор правой шкатулки.
М Статегия1 = +бесконечность
М Статегия2 = +бесконечность
М Статегия1-Статегия2 = +бесконечность

Вы с Егором выберете левую. Что ж. Ваше право.
Re[11]: Что на самом деле надо решать.
От: Silver_s Ниоткуда  
Дата: 12.09.09 12:32
Оценка:
Здравствуйте, Eugene Sh, Вы писали:

ES>Довольно очевидный способ сравнить стратегии — это сравнить мат. ожидание выигрыша для каждой стратегии. Но с этой точки зрения Стратегия 1 и Стратегия 2 абсолютно равнозначны. Мат. ожидание выигрыша равно бесконечности.

ES>Есть ли другие способы сравнения стратегий? Возможно, не знаю.
Есть конечно. Сравнить медианы. Если интересует среднестатистический игрок то медиана даже более актуальна. А матожидание здесь для "избранных". Но манипуляции с медианами сложнее.
Re: Этюд.
От: Silver_s Ниоткуда  
Дата: 12.09.09 22:09
Оценка:
Не совсем о конвертах. Но закину сюда.

Дано: Начальный капитал 1. Игра в монетку. На каждом шаге либо умножение капитала на положительное число p, либо деление на p.
А можно на это смотреть как на игру с обычным суммированием, но с изменяющимися размерами ставок.
Получится исход либо X*(p-1) , либо X*(1/p — 1) . Размер ставки получился пропорционален X (текущему капиталу).
Надо доказать что всегда сумма всех ставок где произошел проигрыш в p раз больше, чем сумма всех ставок на которых был выигрыш. При условии что орлов и решек выпало одинаковое число.
Т.е. всегда в среднем на проигранные сделки ставятся в p раз большие ставки, чем на выигранные.
Или попытаться опровергнуть(но опровергнуть врядли возможно).

Доказать это видимо можно проще,в обход. Как?
Но все же можно ли это напрямую доказать?

Получается дана,например, такая последовательность: 1*p/p*p/p/p*p
Т.е. последовательность положительных чисел p разделенных делениями или умножениями.
Обозначим:
SM — сумма полных левых частей для каждой операции умножения.
SD — сумма полных левых частей для каждой операции деления.
Т.е. для каждой операции деления(или умножения) берется все что стоит слева от нее от начала строки и прибавляется к общей сумме для каждого типа операции.
Число операций каждого типа одинаково. У первоЙ операции в строке левая часть = 1 .

Доказать, что всегда SD/SM = p, и что это соотношение справедливо для всех перестановок операций местами (если число делений и умножений одинаковое).

Например для: 1*p/p*p/p/p*p
SM = 1 + p/p + p/p*p/p/p =2+1/p (для умножений)
SD = p + p/p*p + p/p*p/p=2*p+1 (для делений)
SD/SM=p

Как доказать что это справедливо для любых перестановок, для последовательностей любой длины, не проверяя каждую перестановку по отдельности?
Или рекурентно доказать как-то ?
Будут ли какие-то соотношения, когда число операций деления и умножения не совпадают?
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.