Сообщение Как бы вы делали эту задачу (переходим к конкретике)... от 28.08.2022 7:29
Изменено 28.08.2022 7:30 Shmj
Как бы вы делали эту задачу (переходим к конкретике)...
В продолжение темы: https://rsdn.org/forum/job/8342543.flat
Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.
Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:
1. https://rsdn.org/forum/dotnet/8335182.flat
2. https://rsdn.org/forum/alg/8340088.flat
Вот мое видение на скорую руку: https://rsdn.org/forum/dotnet/8338266.1
Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.
Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).
Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?
Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.
Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.
Автор: Shmj
Дата: 24.08.22
Дата: 24.08.22
Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.
Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:
1. https://rsdn.org/forum/dotnet/8335182.flat
Автор: Shmj
Дата: 14.08.22
Дата: 14.08.22
2. https://rsdn.org/forum/alg/8340088.flat
Автор: _FRED_
Дата: 21.08.22
Дата: 21.08.22
Вот мое видение на скорую руку: https://rsdn.org/forum/dotnet/8338266.1
Автор: Shmj
Дата: 18.08.22
Дата: 18.08.22
Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.
Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).
Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?
Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.
Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.
Как бы вы делали эту задачу (переходим к конкретике)...
В продолжение темы: https://rsdn.org/forum/job/8342543.flat
Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.
Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:
1. https://rsdn.org/forum/dotnet/8335182.flat
2. https://rsdn.org/forum/alg/8340088.flat
Требования собраны, всем все понятно.
Вот мое видение на скорую руку: https://rsdn.org/forum/dotnet/8338266.1
Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.
Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).
Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?
Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.
Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.
Автор: Shmj
Дата: 24.08.22
Дата: 24.08.22
Многие думают, что главное собрать требования а остальное легко — что требования собрать — это большая часть времени а разработка типа 15%.
Ну ок, чтобы далеко не ходить, давайте популярную задачу, которую уже дважды на днях поднимали:
1. https://rsdn.org/forum/dotnet/8335182.flat
Автор: Shmj
Дата: 14.08.22
Дата: 14.08.22
2. https://rsdn.org/forum/alg/8340088.flat
Автор: _FRED_
Дата: 21.08.22
Дата: 21.08.22
Требования собраны, всем все понятно.
Вот мое видение на скорую руку: https://rsdn.org/forum/dotnet/8338266.1
Автор: Shmj
Дата: 18.08.22
Дата: 18.08.22
Идея такая, что для такой задачи не оптимально писать все с нуля а правильнее найти готовое решение.
Но! Прав ли я? Во-первых, мое решение не доделано — там сортируется сначала по цифре, потом по строке (но это ладно, можно поменять местами). Второе — не учитываются дубликаты (можно прибавить к каждой записи счетчик или задействовать Berkeley DB, вроде там дубликаты разрешены, но это не точно).
Как бы вы это решали? Искали бы сначала готовую библиотеку или же писали бы с нуля?
Ну и как думаете — если мое решение с LevelDB довести до ума — будет ли быстрее чем предложенные самописные решения на сотнях гигабайт данных? Ведь больше 2-3 Гб. никто проверять не хочет, а это размер, который полностью вмещается в ОЗУ. Когда в ОЗУ перестанет влазить — цифры могут быть другими.
Вот я реально не знаю. Нужно только проверять. А проверить с 50 Гб. данных — уже час времени.