Была такая программа от гугла которая индексирует все документы на компьютере и производит поиск по словосочетанию. Она еще создавала индекс-файл гигантских размеров.
Посоветуйте подобную актуальную программу — есть несколько сотен файлов в pdf, doc, djvu, rtf, нужно осуществлять поиск по некоторой фразе.
Что посоветуете?
Здравствуйте, Submitter, Вы писали:
S>Посоветуйте подобную актуальную программу — есть несколько сотен файлов в pdf, doc, djvu, rtf, нужно осуществлять поиск по некоторой фразе. S>Что посоветуете?
Залить все в Evernote — он же и картинки парсит и в них тоже ищет — то что нужно для djvu. Чтобы быстрее проиндексировал, купить подписку.
Здравствуйте, sambl4, Вы писали:
S>Залить все в Evernote — он же и картинки парсит и в них тоже ищет — то что нужно для djvu. Чтобы быстрее проиндексировал, купить подписку.
Здравствуйте, sambl4, Вы писали:
S>Залить все в Evernote — он же и картинки парсит и в них тоже ищет — то что нужно для djvu. Чтобы быстрее проиндексировал, купить подписку.
Парсит в смысле распознает текст на картинках?
Здравствуйте, Submitter, Вы писали:
S>Что посоветуете?
У меня обычно документы лежат в какой-нибудь системе а'ля СЭД, поэтому особой необходимости давно не было...
Но вообще я некоторое время пользовался встроенным Microsoft поисковиком
Одно время он поставлялся как отдельный компонент Windows Desktop Search, сейчас это часть ОС. Запросы ыыодите в обычной строке поиска в меню Start или в поисковом окошке Explorer.
Через эту службу, например, работает поиск в Office (как минимум Outlook и OneNote).
Для настройки открываете в панели управления Indexing Options.
Для добавления поддержки новых форматов ставите соответствующие IFilters. Из того, что вы перечислили:
1. Word/Excel — все форматы идут из коробки с Office (вроде даже можно было заполучить без Office — был некий Office Filter Pack)
2. PDF — ранее ставился вместе с Adobe Reader. Сейчас в свете того, что MS поддерживает свою PDF-читалку, возможно есть уже встроенный. Если этого не хватит можно посмотреть список здесь
3. DjVu — тут сложнее... Ранее был IFilter от LizardTech, но сейчас последние никаким боком не связаны с DjVu (на сколько я в курсе), поэтому придется искать. Впрочем я за свою жизнь видел не так и много DjVu с текстовым слоем, поэтому думаю все же не так это и актуально...
Ну и в принципе можно поискать прочие IFilter для других форматов. Например, в поставке с Windows идет OCR-фильтр, работающий с TIFF. Для простых документов и хорошем качестве сканирования даже дает приемлемые результаты.
Здравствуйте, Submitter, Вы писали:
S>Была такая программа от гугла которая индексирует все документы на компьютере и производит поиск по словосочетанию. Она еще создавала индекс-файл гигантских размеров. S>Посоветуйте подобную актуальную программу — есть несколько сотен файлов в pdf, doc, djvu, rtf, нужно осуществлять поиск по некоторой фразе. S>Что посоветуете?