доброе утро.Я тут анализировал индусский код и начал бороться с масштабными копипастами.Я собрался написать утилиту, которая сканит исходники и ищет скопированные куски.Как вам идея,и будет ли кто тестить ?работать должно для всех языков, хоть javascript или brainfuck . опасаюсь только за скорость,но на ночь можно оставлять скан.
Гмм. Мне представляется, здесь главная проблема будет в определении "копипасты" (т.е.: какой код считать копипастой, а какой — нет?) Сильно упрощенный пример: куски кода
for(int i = 0; i < N; ++i)
{
}
for(int k = 0; k < N; k++)
{
}
Здравствуйте, oleggar, Вы писали:
O>доброе утро.Я тут анализировал индусский код и начал бороться с масштабными копипастами.Я собрался написать утилиту, которая сканит исходники и ищет скопированные куски.Как вам идея,и будет ли кто тестить ?работать должно для всех языков, хоть javascript или brainfuck . опасаюсь только за скорость,но на ночь можно оставлять скан.
Не больно ли крутая задумка — работа для всех языков? Или ты думаешь искать только точные копипасты?
Для популярных языков такие тулзы уже есть, чем твоя будет лучше существующих?
Здравствуйте, Nonmanual Worker, Вы писали:
NW>Здравствуйте, oleggar, Вы писали:
O>>доброе утро.Я тут анализировал индусский код и начал бороться с масштабными копипастами.Я собрался написать утилиту, которая сканит исходники и ищет скопированные куски.Как вам идея,и будет ли кто тестить ?работать должно для всех языков, хоть javascript или brainfuck . опасаюсь только за скорость,но на ночь можно оставлять скан. NW>Не больно ли крутая задумка — работа для всех языков? Или ты думаешь искать только точные копипасты? NW>Для популярных языков такие тулзы уже есть, чем твоя будет лучше существующих?
---
да, хочу искать точные копипасты универсально для всех языков
Re: борьба с копипастами
От:
Аноним
Дата:
19.03.14 07:08
Оценка:
Здравствуйте, oleggar, Вы писали:
O>доброе утро.Я тут анализировал индусский код и начал бороться с масштабными копипастами.Я собрался написать утилиту, которая сканит исходники и ищет скопированные куски.Как вам идея,и будет ли кто тестить ?
O>работать должно для всех языков, хоть javascript или brainfuck . опасаюсь только за скорость,но на ночь можно оставлять скан.
Умеет делать семантический анализ (хоть и не самый изощренный), поддерживается всеми системами сборки и интеграции.
На их странице утверждается, что поддерживают C++ и PHP.
O>Как вам идея,и будет ли кто тестить ?
Идея прекрасная, только такие инструменты уже есть и твои тестить будет смысл, если ты напишешь Maven плагин, чтобы люди могли подключить к интеграции, погонять и сравнить.
Re[2]: борьба с копипастами
От:
Аноним
Дата:
19.03.14 07:22
Оценка:
V_S>[/ccode]cчитаются копипастой или нет?
Конечно, считаются. Тул который "для начала будет искать 100% совпадения" нафиг не нужен, потому что уже существуют, которые умеют больше
Здравствуйте, oleggar, Вы писали:
O>доброе утро.Я тут анализировал индусский код и начал бороться с масштабными копипастами.Я собрался написать утилиту, которая сканит исходники и ищет скопированные куски.