Re: Есть база терминов. Как в тексте документа найти вхождения всех терминов?
От: мыщъх США http://nezumi-lab.org
Дата: 23.05.12 15:12
Оценка:
Здравствуйте, VetalB, Вы писали:

VB>Всем привет!


VB>Я уверен, что задача решаема.

конечно, решаема. морфология это вообще ерунда по сравнению с тем, что вас ждет, когда вы столкнетесь с закисью азота, которую нужно выдать по запросу веселящий газ. или от вас такого не требуют? вы упомянули хлорид натрия, известный как "поваренная соль".

морфология может работать и без словаря, но с поправкой на ветер. перекись и диперикись ацетона -- это два разных вещества. тут главное, чтобы машина не сказала, что самые популярные термины это мыть и какать. кстати, не шутка. например, "лишая" — это от слова "лишать" (глагол) или от слова "лишай" (существительное)? как здорово будет если мы ищем документы на медицинскую тему, а нам выдают что-то совершенно левое, причем в огромных количествах. причем, таких "вредных" терминов слишком много, чтобы от них отмахиваться.

VB> Ведь гугл ищет же комбинации слов с учетом морфологии.

вы когда родились? когда гугл только появился он на русском искал без учета. да и по английски выдавал в основном точное соответствие.

VB>Вопрос точности тоже не критичный. Допускается пропуск некоторых слов, которые могли бы быть ссылкой. 80% терминов ссылками — это отличный результат.

VB>Вобщем, подскажите, пожалуйста, как правильно разработать такое решение?
как вы сами сказали -- 80% терминов можно найти и так. а вот что делать с остальными...
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.