Как бы вы делали эту задачу (переходим к конкретике)...
От: Shmj Ниоткуда  
Дата: 28.08.22 07:29
Оценка: :)
В продолжение темы: https://rsdn.org/forum/job/8342543.flat
Автор: Shmj
Дата: 24.08.22

Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.

Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:

1. https://rsdn.org/forum/dotnet/8335182.flat
Автор: Shmj
Дата: 14.08.22

2. https://rsdn.org/forum/alg/8340088.flat
Автор: _FRED_
Дата: 21.08.22


Требования собраны, всем все понятно. Только абсурдировать не нужно, понятно что демагогическими приемами все можно свести к абсурду, любая фраза не формальна и не полна. По сути всем все понятно.

Вот мое видение на скорую руку: https://rsdn.org/forum/dotnet/8338266.1
Автор: Shmj
Дата: 18.08.22


Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.

Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).

Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?

Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.

Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.
Отредактировано 28.08.2022 7:37 Shmj . Предыдущая версия . Еще …
Отредактировано 28.08.2022 7:31 Shmj . Предыдущая версия .
Отредактировано 28.08.2022 7:30 Shmj . Предыдущая версия .
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.