Re: задачка с множествами

Здравствуйте, D. Mon, Вы писали:

> Есть набор из 65000 множеств, в каждом множестве от 1 до 35000 элементов
> (элементы — 16-битные целые числа), причем распределение размеров весьма
> неравномерное: среднее число элементов около 50, медианное — 13, т.е.
> большая часть множеств имеет менее 20 элементов, но есть и содержащие
> десятки тысяч. Мне нужно уменьшить этот набор путем объединения
> "похожих" множеств так,
Я бы сначала определил меру похожести множеств, а затем какой алгоритм кластеризации (их море и разных) заюзал. А после, как по кластерам распихалось, уже объединял бы в кластерах.

	От:	Аноним
	Дата:	27.02.14 11:51
	Оценка:	+1