Здравствуйте, LaptevVV, Вы писали:
LVV>Здравствуйте, alexeiz, Вы писали:
LVV>>>1. Компонентный паскаль — то, блэкбокс — сё... A>>Несерьезно, честное слово. Может быть вы и учите ему своих студентов, решаете на нём студенческие задачи. Но для профессионального применения он не пригоден. LVV>Да ладно... LVV>Смотря для какого применения. Не все же занимаются обработкой данных. LVV>
LVV>список проектов (сэм-восэм, где-то так)
Когда проектов мало, их все нужно аккуратно собрать и поместить в списочек: каждый из них на вес золота!
Здравствуйте, alexeiz, Вы писали:
A>PS: заходим посмотреть код одного из проектов на sourceforge: http://openbugs.svn.sourceforge.net/viewvc/openbugs/openbugs/trunk/Bugs/Mod/ A>И что-же там? Код в бинарных файлах!
Тако высококвалифицированный программист как вы, что исходные тексты находятся в папочке Code...
Хочешь быть счастливым — будь им!
Без булдырабыз!!!
Здравствуйте, VladD2, Вы писали:
VD>А что будет делать эта часть? В переводе в основном и есть лингвистическая сторона. ГУЁм можно пренебречь. Он там обычно очень прост (хотя и зря).
Переводить как правило нужно не тексты, а документы. То есть берем к примеру HTML, извлекаем из него предложения, которые нужно перевести, отдаем лингвистической части переводчика и вставляем полученный перевод обратно. Или имеем 3 HTML документа: 1) исходный S; 2) его перевод T; 3) модифицированный исходный S'. Нужно извлечь из S' только те предложения, которые еще не были переведены.
Здравствуйте, alexeiz, Вы писали:
A>Допустим есть набор языков+библиотек+шоеще, которые нужно оценить на предмет соответствия твоим требованиям. (Ни одно из которых не обозначенно конкретно. Производительность — на каких операциях? Если это regex, то может быть идеальным языком будет Perl ).
Требования действительно не обозначены конкретно, нужно сделать выбор, который с меньшей вероятностью заведет в тупик в будущем при возникновении конкретных требований.
Здравствуйте, igna, Вы писали:
I>Здравствуйте, jazzer, Вы писали:
J>>Для айфонов все можно оформить в виде веб-сервиса
I>Если у пользователя есть свой словарь, то его очевидно придется хранить на сервере, что серьезно усложняет задачу написания веб-сервиса.
Что-то у тебя список требований как на дрожжах растет
Если ты хочешь не просто потрепаться и/или поиграть в "да, но", а получить осмысленные ответы, то формулируй задачу четко.
Любой опытный разработчик знает, что внесение даже небольшой детали в требования может привести к перестройке всей архитектуры.
С постановкой задачи "на каком языке писать переводчик, чтоб денег заработать" может быть только треп под пиво.
Для пятницы нормально, но сегодня же понедельник
Понадобилось добавить в систему новую подсистему. Написал прототип на C# за неделю, потом 2 недели переписывал это на C++, затем еще несколько месяцев добавлял функциональнось. Оставь я написанное на C#, возможно месяцев этих понадобилось бы в 2 раза меньше. Но вот смотрим например здесь. Нет ни Java, ни C#.
Здравствуйте, igna, Вы писали:
I>Если у пользователя есть свой словарь, то его очевидно придется хранить на сервере, что серьезно усложняет задачу написания веб-сервиса.
Не особенно на самом деле. Для переводов словари, конечно нужны, но вот с TM-базами (Translation Memory) все же качественнее переводы получаются.
Здравствуйте, hardcase, Вы писали:
H>Не особенно на самом деле. Для переводов словари, конечно нужны, но вот с TM-базами (Translation Memory) все же качественнее переводы получаются.
Translation Memory переводит целые предложения, это так?
И потом какая разница, что хранить на сервере, словарь или TM-базу, проблемы-то одни.
Здравствуйте, igna, Вы писали:
I>Здравствуйте, hardcase, Вы писали:
H>>Не особенно на самом деле. Для переводов словари, конечно нужны, но вот с TM-базами (Translation Memory) все же качественнее переводы получаются.
I>Translation Memory переводит целые предложения, это так?
И словосочетания.
I>И потом какая разница, что хранить на сервере, словарь или TM-базу, проблемы-то одни.
Словари и TM-базы на сервере могут быть произвольных размеров. Подобный вебсервис вполне поддается горизонтальному масштабированию.
Здравствуйте, hardcase, Вы писали:
H>И словосочетания.
А остальная часть предложения потом переводится дополнительно?
H>Словари и TM-базы на сервере могут быть произвольных размеров. Подобный вебсервис вполне поддается горизонтальному масштабированию.
Тем не менее необходимость хранения пользовательских данных на сервере серьезно усложняет задачу написания веб-сервиса.
Тогда все просто.
В моей СуперПуперМегаКомпании скорее всего, лингвистическое ядро было бы написано на c/c++. Возможно на ocaml, но маловероятно. Надо еще подумать над базой данных: оптимизированный key-value, или рсубд с кешированием. Пользовательский интерфейс был бы скорее всего вэб-ориентирован (html, js). Cвязал бы их веб-сервером nginx + wsgi-python. Можно попробовать поэкспериментировать на erlang, но маловероятно.
Если все должно быть в одном локальном приложении, то все было бы написано на с++ c berkleydb или sqlite, с нативным для каждой платформы UI.
PS. Все выше сказанное никак не связано с облегчением и улучшением процесса написания приложения. Скорее всего связано с опытом работы с этими языками и технологиями и моим субъективным мнением.
PPS. Но раз дали мне роль Наполеона, идем на Москву. А надо было на юг, где тепло и хлеб. Но кто же знал? Знал бы прикуп...
PPPS. Вы до сих пор читаете этот бред? Надо было остановится после фразы "Тогда все просто".
Здравствуйте, LaptevVV, Вы писали:
LVV>Здравствуйте, alexeiz, Вы писали:
A>>PS: заходим посмотреть код одного из проектов на sourceforge: http://openbugs.svn.sourceforge.net/viewvc/openbugs/openbugs/trunk/Bugs/Mod/ A>>И что-же там? Код в бинарных файлах! LVV>Тако высококвалифицированный программист как вы, что исходные тексты находятся в папочке Code...
И где же эта папочка? Весь репозитарий забит бинарниками.
Единственное, что я смог найти похожее на код — вот такой файл.
Первая строчка позабавила:
libname out 'C:\Documents and Settings\ThomasN\My Documents\BUGS\SAS\SASDATA';
Я конечно не все просмотрел, но такого количества бинарников в репе я не встречал, в чем смысл? Это внешние зависимости проекта?
Здравствуйте, Ziaw, Вы писали:
A>>>PS: заходим посмотреть код одного из проектов на sourceforge: http://openbugs.svn.sourceforge.net/viewvc/openbugs/openbugs/trunk/Bugs/Mod/ A>>>И что-же там? Код в бинарных файлах! LVV>>Такой высококвалифицированный программист как вы, что исходные тексты находятся в папочке Code... Z>И где же эта папочка? Весь репозитарий забит бинарниками. Z>Единственное, что я смог найти похожее на код — вот такой файл.
Z>Первая строчка позабавила: Z>
Z>libname out 'C:\Documents and Settings\ThomasN\My Documents\BUGS\SAS\SASDATA';
Z>
Z>Я конечно не все просмотрел, но такого количества бинарников в репе я не встречал, в чем смысл? Это внешние зависимости проекта?
Понятно. "Не читал, но осуждаю" — классика.
И такой высококвалифицированный программер, как вы, ДОЛЖЕН ЗНАТЬ
1. Это не компонентный паскаль.
2. файлы типа odc не являются бинарными...
3. Чтобы их использовать в ББ наравне со всеми стандартными, достаточно скопировать их в папку с ББ.
4. Прежде, чем что-то отрицать, нужно ХОТЯ БЫ познакомиться с технологией.
Хочешь быть счастливым — будь им!
Без булдырабыз!!!
Здравствуйте, LaptevVV, Вы писали:
LVV>>>Такой высококвалифицированный программист как вы, что исходные тексты находятся в папочке Code... Z>>И где же эта папочка? Весь репозитарий забит бинарниками. Z>>Единственное, что я смог найти похожее на код — вот такой файл.
Z>>Первая строчка позабавила: Z>>
Z>>libname out 'C:\Documents and Settings\ThomasN\My Documents\BUGS\SAS\SASDATA';
Z>>
Z>>Я конечно не все просмотрел, но такого количества бинарников в репе я не встречал, в чем смысл? Это внешние зависимости проекта? LVV>Понятно. "Не читал, но осуждаю" — классика.
Именно эту строчку я прочитал и осуждаю.
LVV>И такой высококвалифицированный программер, как вы, ДОЛЖЕН ЗНАТЬ LVV>1. Это не компонентный паскаль.
Вот тут у меня вообще ступор, обсуждается репозитарий с кодом на компонентном паскале (или нет? так надо было сразу сказать об этом), репозитарий забит файлами .ods.
LVV>2. файлы типа odc не являются бинарными...
Специально скачал один, он является
LVV>3. Чтобы их использовать в ББ наравне со всеми стандартными, достаточно скопировать их в папку с ББ.
Как с ними работает контроль версий? Где посмотреть на стандартные?
LVV>4. Прежде, чем что-то отрицать, нужно ХОТЯ БЫ познакомиться с технологией.
Я ничего не отрицаю, все что я сделал, это поискал из любопытства папочку Code по вашему совету.
Здравствуйте, igna, Вы писали:
I>Переводить как правило нужно не тексты, а документы. То есть берем к примеру HTML, извлекаем из него предложения, которые нужно перевести, отдаем лингвистической части переводчика и вставляем полученный перевод обратно. Или имеем 3 HTML документа: 1) исходный S; 2) его перевод T; 3) модифицированный исходный S'. Нужно извлечь из S' только те предложения, которые еще не были переведены.
Ну, тогда вам нужен ЖабаСкрипт. Он как раз уже есть во всех броузерах и его за глаза хватит для вынимания и запихивания обратно текста. Гугль с Яндексом давно умеют переводить веб-страницы.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Здравствуйте, VladD2, Вы писали:
I>>Переводить как правило нужно не тексты, а документы. То есть берем к примеру HTML, ...
VD>Ну, тогда вам нужен ЖабаСкрипт. Он как раз уже есть во всех броузерах и его за глаза хватит для вынимания и запихивания обратно текста. Гугль с Яндексом давно умеют переводить веб-страницы.
HTML был для примера. А если это DOC, то его наверное не очень удобно обрабатывать JavaScript-ом из браузера.
Кроме того программу на JavaScript нужно передавать с исходниками.
Здравствуйте, igna, Вы писали:
I>HTML был для примера. А если это DOC, то его наверное не очень удобно обрабатывать JavaScript-ом из браузера.
Ага. Но в Ворде есть VBA, который как раз подходит для вынимания контента из доков.
I>Кроме того программу на JavaScript нужно передавать с исходниками.
В этих исходниках не будет ничего ценного. Так что это не проблема.
ЗЫ
Вообще, если речь идет об интеграции с каким-то продутом, то для него нужно выбирать инструмент отдельно. Для МС Офиса одно. Для броузеров, другое. Для чего-то еще, третье.
Могу поделиться собственным опытом создания конвертера для статей RSDN (из MS Word). Написана она на Nemerle. Исходники можно лицезреть здесь. Интеграция с самим Вордом написана на VBA и содержит всего несколько строк кода. Интеграция просто берет документ, сохраняет его в формате Word XML и вызывает (через COM) конвертер написанный на Nemerle. Тот читает файл и конвертирует его в RSDN ML (формат в котором отображаются статьи у нас на сайте).
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.