Здравствуйте, <Аноним>, Вы писали:
А>а ты с переводчиками общался? Для них главное не алгоритм а перевод.
Конечная цель не в этом. Разрабатываемая система является
базой для того, чтобы те самые переводчики могли проверить свои предположения, алгоритмы, и вообще — что угодно
Представь что тебе пришла в голову идея как улучшить результат перевода.
1. Берем ПРОМТ... Плюем и выбрасываем — нет практически никакой возможности как-то повлиять на результат. То что есть — ну этого мало.
2. решаем писать свое — ну хотя бы чтобы посмотреть, а вдруг то что мы придумали работает?

Итак, надо написать:
1. Словарь (научиться работать с чужим или написать полностью свой)
— ну, естественно, интерфейс для ввода данных в словарь
2. Жизненно-необходимые алгоритмы:
а) лексический анализ
б) морфологический анализ
в) поиск фраз
г) синтаксический анализ
д) алгоритм склонения/спряжения слов
3. Ну, естественно — интерфейс для взаимодействия с пользователем. Хотя бы чтобы текст можно было ввести и получить результат
Это по-минимуму. Каждая из этих задач достаточно сложна. Каждая — требует времени на разработку хотя бы в самом черновом варианте, дико медленном и обладающем кучей недостатков.
Результат: ради того, чтобы реализовать интересную идею необходимо потратить раз в 200 больше времени на вещи, которые к этой самой идее отношения не имеют вообще, но без них ее реализовать невозможно!
Более приземленно: допустим мы решили писать хороший алгоритм, например, морфологического анализа. Лексер кто писать будет? А словарь, без которого морфоанализатор работать будет... Хм, а не будет он работать
Так вот, в данном прокете, все элементы алгоритма перевода/интерфейса пользователя (кроме совсем уж базовых) легко заменяемы. Тогда, для приведенного примера, все что нужно сделать — это реализовать
только алгоритм морфологического анализа, использовав стандартный интерфейс и встроив его в мою программу. Экономия времени, я думаю очевидна?
Тебе не нравится мой словарь? Да флаг тебе в руки! Напиши нечто вроде прокси между лингво и моим переводчиком — и будет у тебя крутой словарь
P.S.: пример из жизни: когда я только начинал писать алгоритм синтаксического анализа на основе правил, мне пришлось потратить почти месяц на написание парсера файла с данными (имеющими сильно разветвленную структуру). При этом
даже через год я ловил в нем ошибки (в то время xml еще не был так популярен, да и писал я тогда на С++, что тоже сыграло большую роль). Однако сам алгоритм я написал в течение
4-х часов (правда без этих самых правил, этот алгоритм работать не мог)
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>