Здравствуйте, D. Mon, Вы писали:
> Есть набор из 65000 множеств, в каждом множестве от 1 до 35000 элементов > (элементы — 16-битные целые числа), причем распределение размеров весьма > неравномерное: среднее число элементов около 50, медианное — 13, т.е. > большая часть множеств имеет менее 20 элементов, но есть и содержащие > десятки тысяч. Мне нужно уменьшить этот набор путем объединения > "похожих" множеств так,
Я бы сначала определил меру похожести множеств, а затем какой алгоритм кластеризации (их море и разных) заюзал. А после, как по кластерам распихалось, уже объединял бы в кластерах.