Есть текстовый файл с персональными данными (ФИО ДР ИНН и тд).
Необходимо найти всех двойников по критерию ФИО ДР.
Алгоритм нужен однопроходный.
Есть идея считать хэш (int), и сохранять строки с ФИО ДР в std::multimap<int, std::string > hash;
Проблема в том, что на гигобайтных входных данных это даст огромный расход памяти.
Есть идея получше?
06.11.09 14:38: Перенесено модератором из 'C/C++' — Кодт