Подсчет двойников в файле.
От: Аноним  
Дата: 06.11.09 10:02
Оценка:
Есть текстовый файл с персональными данными (ФИО ДР ИНН и тд).

Необходимо найти всех двойников по критерию ФИО ДР.
Алгоритм нужен однопроходный.

Есть идея считать хэш (int), и сохранять строки с ФИО ДР в std::multimap<int, std::string > hash;

Проблема в том, что на гигобайтных входных данных это даст огромный расход памяти.

Есть идея получше?

06.11.09 14:38: Перенесено модератором из 'C/C++' — Кодт
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.