Как бы вы делали эту задачу (переходим к конкретике)...

В продолжение темы: https://rsdn.org/forum/job/8342543.flat
Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.

Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:

1. https://rsdn.org/forum/dotnet/8335182.flat
2. https://rsdn.org/forum/alg/8340088.flat

Требования собраны, всем все понятно. Только абсурдировать не нужно, понятно что демагогическими приемами все можно свести к абсурду, любая фраза не формальна и не полна. По сути всем все понятно.

Вот мое видение на скорую руку: https://rsdn.org/forum/dotnet/8338266.1

Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.

Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).

Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?

Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.

Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.

	От:	Shmj
	Дата:	28.08.22 07:29
	Оценка: