Re[3]: вопрос по kaggle

Здравствуйте, tdiff, Вы писали:

T>Как им приходит в голову делать именно такие комбинации фичей?
Error and trial, опыт в доменной области, стандартные практики по feature selection. На форуме очень много идей высыпают, иногда бывает решение из топа просто грамотно использует паблик идеи.
T>Как у них строится работа в команде (организовать 12 человек это само по себе не так просто)?
Обычно команды формируются ближе к концу когда у всех уже есть наработки из которых начинают крутить ансамбли и блэнды, ну и обмен фичами, и ретреин моделей. Популярно так же когда каждый сидит и крутит
свой тип модели — один lightgbm, другой conv net, третий rnn, препроцессинг данных и тюнинг параметров у них сильно отличается. Да даже если банально заблендить усреднением N достаточно разнообразных (diverse) моделей результат
практически всегда будет лучше самой топовой из набора.
T> Такое ощущение, что примерно так: каждый делает себе свои фичи + тренирует модели, а потом они начинают это всё как-то комбинировать. Но это скорее всего это очень наивное представление.
На самом деле так оно и есть, ретреин моделей по общему data split, out-of-fold predictions и ансамбли по ним.

	От:	Craig
	Дата:	05.11.18 15:37
	Оценка:	3 (1)