В продолжение темы:
https://rsdn.org/forum/job/8342543.flatАвтор: Shmj
Дата: 24.08.22
Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.
Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:
1.
https://rsdn.org/forum/dotnet/8335182.flatАвтор: Shmj
Дата: 14.08.22
2.
https://rsdn.org/forum/alg/8340088.flatАвтор: _FRED_
Дата: 21.08.22
Требования собраны, всем все понятно. Только абсурдировать не нужно, понятно что демагогическими приемами все можно свести к абсурду, любая фраза не формальна и не полна. По сути всем все понятно.
Вот мое видение на скорую руку:
https://rsdn.org/forum/dotnet/8338266.1Автор: Shmj
Дата: 18.08.22
Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.
Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).
Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?
Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.
Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.