Re[4]: поговорим об объясненной дисперсии...

Здравствуйте, deniok, Вы писали:

D>Я не знаю такого понятия "предсказание". Экстраполяция имеется ввиду, или что?

предсказение — суть делание заключения о величине, которую еще не наблюдали.
можете понимать это как экстраполяцию, только экстраполяцию не известной функции.

D>>>Правильным подбором w мы можем сделать абсолютно точный вывод о среднем росте автомобилиста, по r1 --- среднему размеру пятна от насекомого, разбившегося об ветровое стекло, и r2 --- средней высоте деревьев вдоль трассы.

MP>>Честно говоря, не понял Вашей иронии. r1 и r2 — это две оценки R, полученные разными методами.
MP>>Скорее всего, Вы не до конца поняли о чем речь.

D>Я не понял, у нас есть априорное знание о значении R (тогда зачем оценки?) или нет (тогда откуда w?)

оценивать точность метода можно на имеющихся данных (in-sample forecasting) — т.е. на данных, которые сами по себе вовлечены в построение оценочной функции. Но тогда есть большая вероятность того, что полученная функция хорошо "работает" только на этих самых данных и совершенно непригодна для прогнозов (этот феномен еще называют overfitting).

Другой подход (out-of-sample forecastiong) состоит в том, чтобы часть имеющихся данных исключить из расчетов, ведущих к получению оценочной функции. Эти "свободные" данные (holdout) потом можно использовать для валидации метода.

Отвечая на Ваш вопрос:
да, значения R есть. Но они лежат в holdout'e — т.е. только для того, чтобы иметь возможность оценить ошибку out-of-sample. Назовем эти данные — R'. То есть мы с одной стороны рассчитываем R как бы полагая, что мы не знаем настоящих R'. А потом мы сравниваем рассчитанные R с их реальными значениями R', что и дает нам оценку ошибки. В контексте обсуждения r1, r2 и R суть три различные оценки одной и той же реальной (в момент оценки полагаемой неизвестной) величины R'.

От:	marx paul	Провести онлайн-опрос
Дата:	18.02.10 00:04
Оценка: