А>Я возможно повторюсь, т.к. "ниасилил" весь топик
Да чего уж там "Посмотреть Google Desktop Search" не советуете — и на том спасибо
А>1. Поддержка файлов pdf, ps (причем в архивах тоже zip, rar, gz, tgz как минимум)
Да.
А>2. Индексирование файлов, отдельно учет заголовков статей, summary и авторов если есть
Да.
А>3. Синхронизация базы с папками, ведение учета добавления/удаления файлов, сортировка по дате внесения новых файлов.
Возможно, но как доп.фича (не то плагин, не то на след. версии)
А>4. А еще бы интеграцию с флешгетом, чтобы сразу говорил что типа такая статья уже скачена =) а то бывает что по нескольку раз одинаковые статьи скачиваю.
Хм. Забавная мысля! Спасибо!
А>Впрочем, нормального поиска по тайтлу наверное будет достаточно.
Факт. Но тем не менее... Есть о чем задуматься.
А>5. Насчет архивирования, разархивирования это вопрос — доступ к статьям должен обеспечиваться не только из вашей проги а из любого файл менеджера, поэтому лучше сделать как опцию.
Спорный вопрос. Спорить лень. Жизнь покажет
А>Кроме того архивы имеют тенденцию портиться и не хотелось бы терять всю базу из-за одной ошибки записи на диск.
Факт.
А>6. Поиск по одному или группе выбранных документов.
Да.
А>Составление статистики встечаемости слов (надоело ручками классифицировать доки и раскидывать по папкам).
Скорее всего.
Здравствуйте, Dimonka, Вы писали:
D>Здравствуйте, ironwit, Вы писали:
I>>3. Описание по ISBN с инета не выкачаешь.
D>А можно посмотреть ссылку на подобный сервис?
I>>4. Не нравится она мне
G>По моему любой рубрикатор — это лишняя забота для пользователя. G>В конце концов нормально вести каталог смогут только оччень трудолюбивые.
Очень разумная мысль. Именно поэтому онлайн-каталогизаторы в Сети практически вымерли, а поисковики развиваются стремительно.
G>А вот что-нибудь типа личного web-сервера с документацией, с возможностью G>полнотекстового поиска по различным форматам (pdf, html, txt) было бы G>иметь весьма удобно. В общем, чтобы из любой свалки можно было за G>приемлемое время вытянуть нужную вещь.
Google Desktop, Copernic, Yahoo — все они могут это делать. Скоро мы выпустим программу с поискам по любым форматам документов, которая поддерживает морфологию русского и английского языка. Пока использую в тестовом варианте — ребята, это ВЕЩЬ!
Когда задуманный мега-монст будет готов, это станет очевидно всем
H> Когда информации много, то удобней локальный поисковик, который все файлы проиндексирует и будет их выдергивать по мере необходимости.
Я за собой заметил, что куча информации лежит на винте мертвым грузом — если что-то нужно, просто иду в Гугл, пусть даже это где-то уже сохранял раньше. Все равно поиском быстрее получается.
Здравствуйте, Рома Мик, Вы писали:
РМ>Здравствуйте, Зверёк Харьковский, Вы писали:
РМ>ИМХО должно быть следующее РМ>1)Готовая страница из интернета с кратким описанием:
Здравствуйте, SergeyGotsulyak, Вы писали:
SG>Скоро мы выпустим программу с поискам по любым форматам документов, которая поддерживает морфологию русского и английского языка. Пока использую в тестовом варианте — ребята, это ВЕЩЬ!
Наш SearchGun (www.searchgun.com) уже больше года как это умеет делать
теперь по существу темы. задуманная весчь является архиполезной. но если не выработать четкую и лаконичную концепцию — все умрет на корню
теперь по поводу подводных камней. хош-не-хош а парсеры для форматов будут нужны. как минимум html, doc, rtf, pdf. я например знаю только один нормальный парсер для doc и pdf
с поиском тоже прийдется повозится. можно делать полнотекстовой индекс. можно не делать и просто искать.
создание abstract для документов. тут ктото говорил про первые предложения абзацев ... не получится прийдется стат анализ текста делать. выделять кейворды и ключевые фразы. а потом уже строить abstract.
автоматическая классификация. было бы неплохо чтобы она отрабатывала в виде подсказки. т.е. "Добавляемый документ рекомендуем поместить в рубрики 1,2,37"
ну и тп тд
в общем бету конечно можно за месяц сделать, но доводить ее до нормального состояния — еще несколько месяцев
ЗЫ кое какие либы для работы с текстами и тп можно найти у нас на www.textolution.com
А где можно пощупать сей чудесный продукт?
Или то что уже написано.
... << RSDN@Home 1.2.0 alpha rev. 576>>
Re[3]: Программа-библиотекарь
От:
Аноним
Дата:
17.07.05 10:17
Оценка:
Здравствуйте, SergeyGotsulyak, Вы писали:
ОГ>>Через несколько дней выкладываю подобный проект: Link Repository.
SG>У меня весь этот функционал — всего лишь один из модулей моего органайзера...
SG>Если интересно — http://www.AngelicSoftware.com
Сайт красивый, скриншоты — сакс!
Всё есть, и красивый дизайн, и описание, а вот скриншоты — только маленькие!
Сделай большие скриншоты, а то нифига непонятно, чтобы щёлкаешь на маленькие появляется большой.
Здравствуйте, Зверёк Харьковский, Вы писали:
ЗХ>День добрый, господа. ЗХ>Зародилась такая идея: ЗХ>у меня на винте валяется ок. 3 Гиг ОЧЕНЬ НУЖНОЙ И ПОЛЕЗНОЙ электронной документации. ЗХ>Её КПД близок к 0, поскольку даже если я знаю, что ЭТО ГДЕ-ТО БЫЛО, найти что-нибудь в этой груде все равно очень тяжело ЗХ>Все прошлое воскресенье я убил на то, чтобы хоть-как-то упорядочить это дело по папочкам. Немножко полегчало, но, прямо скажем, не сильно. это присказка. ЗХ>В связи с этим появилась МЫСЛЬ (и я ее думаю): сделать программу-библиотекарь, которая хранила бы все эти доки и инфу о них (автор, название и пр.), позволяла бы удобно структурировать, быстро (и, возможно, по нескольку сразу) добавлять. Хранила бы доки заархивированными с разархивированием "на лету" прозрачно для юзера. Позволяла бы выделять часть библиотеки в самостоятельную библиотеку (напр., выделить всю вету "РНР", сжать и отправить другу по почте). Разбирала бы наиболее известные форматы и сама доставала бы из них Заголовок, автора, ключевые слова. Дальше (в перспективе) неплохо бы иметь индексацию и крутой поиск, автоматическое составление рефератов и пр. радости жизни.
ЗХ>убедительная просьба высказаться по следующим вопросам: ЗХ>а) кому это надо? ЗХ>б) есть ли что-то похожее, с чем было бы правда УДОБНО работать? ЗХ>в) ваши требования к такой проге (если она вам, конечно, интересна) ЗХ>г) вольная тема
ЗХ>ЗЫ. задумывается как шаровара. всем высказавшим ценные идеи (в последствии — так же и принявшим участие в тестировании) — естессно, ключик.
ЗХ>Спасибо за внимание
Записывайте меня в тестеры (только когда?). Очень понравилась идея.
Здравствуйте, Зверёк Харьковский, Вы писали:
ЗХ>Здравствуйте, ironwit, Вы писали:
ЗХ>>>День добрый, господа.
I>>и вам добрый. Как идут успехи?
ЗХ>ТСССССС! релиз спугнешь...
все, даже в наушниках звук прикрутил ЗХ>
ЗХ>ЗЫ: а у вас?
у меня здорово
Здравствуйте, Amon-RA, Вы писали:
AR>А чё ты аську отключил?
Интернет-карточка закончилась, выхожу дайлапом на 5 минут почту подобрать.
Завтра буду снова онлайн.
Если что-то срочное — стучись мылом на vshepelev@computerra.ru
Здравствуйте, Олег Гашев, Вы писали:
ОГ>Через несколько дней выкладываю подобный проект: Link Repository.
А удалённое хранение этого самого Repository поддерживается? На каком-нибудь стороннем серваке? А то достало уже закладки в браузерах на домашнем и рабочем компе синхронизировать...
--
wbr, Peter Taran
Re: Программа-библиотекарь
От:
Аноним
Дата:
01.09.05 09:21
Оценка:
ЗХ>у меня на винте валяется ок. 3 Гиг ОЧЕНЬ НУЖНОЙ И ПОЛЕЗНОЙ электронной документации. ЗХ>Её КПД близок к 0, поскольку даже если я знаю, что ЭТО ГДЕ-ТО БЫЛО, найти что-нибудь в этой груде все равно очень тяжело
Если
1) с поиском и
2) инсталляция не левой ногой и
3) не дороже примерно штуки баксов
— то мы бы купили.