поговорим об объясненной дисперсии...

Господа!

приглашаю Вас обсудить вот какой вопрос:

Допустим, мы предсказываем значение некой величины на основании неких данных — читай некой информации. Допустим, что эту величину мы можем предсказывать двумя разными способами. Сами способы различаются как в части алгоритма, так и в части информации (набора переменных), используемой для предсказания. Соответственно каждый из способов наряду с предсказаниями дает нам и "свою" ошибку предсказания, со своей дисперсией.

Теперь мы сравнили ошибки двух методов и поняли, что как среднее значение так и дисперсия ошибки обоих методов значимо отличаются друг от друга. Тогда мы можем сделать вот такие выводы:

1) раз дисперсии ошибок двух конкуррирующих методов разные, то скорее всего быть каждый из методов объясняет соостветсвенно разную часть дисперсии в предсказываемой величине
2) а если так, то значит комбинация этих двух методов, должна объяснять больше дисперсии в предсказываемой величине, чем каждый из рассматриваемых методов в отдельности

Руководствуясь этой мыслью мы "комбинируем" два предсказания тупым подбором веса, т.е. примерно так:

R = r1 * w + r2 * (1 — w)

где
R — предсказываемая величина
r1 — предсказание методом 1
r2 — предсказание методом 2
w — вес метода 1 в комбинируемом предсказании [0..1]

Методом перебора w мы выясняем, что при значении w=0,65 ошибка комбинированного предсказания минимальна и значимо меньше ошибок, производимых, каждым из комбинируемых методов.

Вот теперь можно подумать о сути всего произошедшего и ответить на следующие вопросы:

во-превых:
на сколько логичны с научной точки зрения выводы из пунктов 1) и 2) озвученные выше? Или приведенная в них аргументация уязвима? Если уязвима — то в чем?

во-вторых:
если при w=0,65 ошибка "комбинированного" предсказания уменьшается, то следует ли из этого, что
— "изолированные" предсказания каждого из методов действительно объясняют разные части дисперсии предсказываемой величины R?
— медот 1 (тот что предсказывает r1) объясняет больше дисперсии в предсказываемой величине, чем метод 2 и по-этому важнее для предсказания, чем метод 2?
-- какие еще мы можем сделать выводы из этой ситуации?

в-трертих:
существуют-ли научные публикации на затронутые выше темы (особенно о "взвешанной" комбинации предсказаний двумя методами и об интерпретации веса)

Заранее благодарен за Ваш инпут!

От:	marx paul	Провести онлайн-опрос
Дата:	17.02.10 22:25
Оценка: