Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 15.10.04 05:53
Оценка:
Ищу программиста для помощи в написании переводчика с английского на русский (в идеале должен переводить художественный текст).
В общем-то переводчик уже подбирается к бете. Но на данный момент есть проблемы сбазами даный (нужна нормальная реализация доступа к БД).
Как пример, вот результат работы программы (словарь — 70 слов):

Оригинал:

The coffee that our secretary , Mary , had gotten for mister Harlan sat on the edge of my desk .
His mug was the one with the logo of Animators inc on it .
He had taken a minute sip of the coffee , when Mary had first handed it to him .
He had taken the coffee black , but he sipped it like he had not tasted it , or it did not really matter what it tasted like .
He had taken it out of politeness , not out of desire.

Перевод:

Кофе который+что наш секретарь , mary , получил для+на мистера harlan сидел на крае моего стола .
его кружка была тот с эмблемой animators корпорации на оно+это .
Он взял маленький глоток кофе , когда mary сначала вручил оно+это ему .
Он взял кофе черный , но он прихлебывал оно+это как он не ощутил вкус оно+это , или оно+это не действительно значило что+какой оно+это на вкус .
Он взял оно+это из вежливости , не из желания .

Проект shareware...
... << RSDN@Home 1.1.3 stable >>

01.09.05 19:12: Перенесено модератором из 'Открытые проекты' — AndrewVK
Re: Пишу переводчик...
От: vvvoloshin1 Канада  
Дата: 15.10.04 14:04
Оценка:
Какая используется база и что не устраивает ?
Re[2]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 16.10.04 08:55
Оценка:
Здравствуйте, vvvoloshin1, Вы писали:

V>Какая используется база и что не устраивает ?


Для базы используется XML. Загрузка осуществляется посредством десериализации. А не устраивает все , т.к.:
а) Медленно.
б) Надо сортировать базу.
в) Вся база грузится в память (сейчас она 300кб — это при 70 словах, а для нормальной работы нужно 1000 или 10000 или 30000 слов).
г) при добавлении слов в базу ее приходится сортировать, чтобы потом можно было осущ. быстрый поиск... А при большом количестве слов я сомневаюсь что это будет быстрый процесс .
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[3]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 16.10.04 09:23
Оценка:
Здравствуйте, Fahrain, Вы писали:

F>Здравствуйте, vvvoloshin1, Вы писали:


V>>Какая используется база и что не устраивает ?


F>Для базы используется XML. Загрузка осуществляется посредством десериализации. А не устраивает все , т.к.:

F> а) Медленно.
F> б) Надо сортировать базу.
F> в) Вся база грузится в память (сейчас она 300кб — это при 70 словах, а для нормальной работы нужно 1000 или 10000 или 30000 слов).
F> г) при добавлении слов в базу ее приходится сортировать, чтобы потом можно было осущ. быстрый поиск... А при большом количестве слов я сомневаюсь что это будет быстрый процесс .

В догонку: мне нужен не только специалист по БД, в принципе я не отказался бы и от разработчка GUI...
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[3]: Пишу переводчик...
От: Aquary Россия https://wmspanel.com/
Дата: 16.10.04 09:50
Оценка:
Здравствуйте, Fahrain, Вы писали:

F>Для базы используется XML. Загрузка осуществляется посредством десериализации.


и при этом ты удивляешься маленькой скорости?

почему изначально ты взял именно xml в качестве хранилища?
https://wmspanel.com/nimble — Nimble Streamer media server for live and VOD HLS, RTMP, HTTP streaming
https://wmspanel.com/ — Control and reporting panel for Wowza and Nimble Streamer
http://scm-notes.blogspot.com/ — Блог об управлении конфигурацией
Re[4]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 16.10.04 09:53
Оценка:
Здравствуйте, Aquary, Вы писали:

A>Здравствуйте, Fahrain, Вы писали:


F>>Для базы используется XML. Загрузка осуществляется посредством десериализации.


A>и при этом ты удивляешься маленькой скорости?


A>почему изначально ты взял именно xml в качестве хранилища?


Проще всего было, т.к. уже была разработана иерархия класов БД, т.е. все что нужно было сделать — это загрузить данные из старого формата (чистый текст) и сериализовать. Так и получился XML
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[4]: Пишу переводчик...
От: Valicchh Казахстан  
Дата: 16.10.04 11:07
Оценка:
Здравствуйте, Fahrain, Вы писали:

F>Здравствуйте, Fahrain, Вы писали:


F>>Здравствуйте, vvvoloshin1, Вы писали:


V>>>Какая используется база и что не устраивает ?


F>>Для базы используется XML. Загрузка осуществляется посредством десериализации. А не устраивает все , т.к.:

F>> а) Медленно.
F>> б) Надо сортировать базу.
F>> в) Вся база грузится в память (сейчас она 300кб — это при 70 словах, а для нормальной работы нужно 1000 или 10000 или 30000 слов).
F>> г) при добавлении слов в базу ее приходится сортировать, чтобы потом можно было осущ. быстрый поиск... А при большом количестве слов я сомневаюсь что это будет быстрый процесс .

F>В догонку: мне нужен не только специалист по БД, в принципе я не отказался бы и от разработчка GUI...


Это коммерческое предложение?
... << RSDN@Home 1.1.3 stable >>
v.
Re[5]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 16.10.04 11:21
Оценка:
Здравствуйте, Valicchh, Вы писали:

V>Это коммерческое предложение?


Программа пишется чтобы продаваться. На данный момент на рынке НЕТ программ-переводчиков сравнимых с ПРОМТ (вообще есть — только их не видно и не слышно ). Т.е. теоретически, если довести программу до ума, ее можно продавать.
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[6]: Пишу переводчик...
От: Valicchh Казахстан  
Дата: 16.10.04 11:52
Оценка:
Здравствуйте, Fahrain, Вы писали:

F>Здравствуйте, Valicchh, Вы писали:


V>>Это коммерческое предложение?


F> Программа пишется чтобы продаваться. На данный момент на рынке НЕТ программ-переводчиков сравнимых с ПРОМТ (вообще есть — только их не видно и не слышно ). Т.е. теоретически, если довести программу до ума, ее можно продавать.


Это более интересно -> mailto:vsrg@tengizchevroil.com
... << RSDN@Home 1.1.3 stable >>
v.
Re[7]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 16.10.04 12:07
Оценка:
Здравствуйте, Valicchh, Вы писали:

V>Это более интересно -> mailto:vsrg@tengizchevroil.com


Ага
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[5]: Пишу переводчик...
От: Aquary Россия https://wmspanel.com/
Дата: 16.10.04 12:07
Оценка:
Здравствуйте, Fahrain, Вы писали:

F> Проще всего было, т.к. уже была разработана иерархия класов БД, т.е. все что нужно было сделать — это загрузить данные из старого формата (чистый текст) и сериализовать.


эээ... а почему, имея иерархию БД, ты не стал использовать саму БД?
https://wmspanel.com/nimble — Nimble Streamer media server for live and VOD HLS, RTMP, HTTP streaming
https://wmspanel.com/ — Control and reporting panel for Wowza and Nimble Streamer
http://scm-notes.blogspot.com/ — Блог об управлении конфигурацией
Re[6]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 16.10.04 12:16
Оценка:
Здравствуйте, Aquary, Вы писали:

AA>эээ... а почему, имея иерархию БД, ты не стал использовать саму БД?


Дык с базами данных я практически не работал (максимум, что требовалось — это получить данные из готовой БД, кот. делает другая программа). Так что с ней надо было разбираться... Я попробовал, но там главная проблема — это то, что в базе получается 6-8 таблиц различной степени связанности... И вот тут-то все ивстало
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[7]: Пишу переводчик...
От: Aquary Россия https://wmspanel.com/
Дата: 17.10.04 09:04
Оценка:
Здравствуйте, Fahrain, Вы писали:

F> Дык с базами данных я практически не работал


Инструмент всегда выбирается исходя из задачи. Если требуется хранить десятки тысяч записей — ясен пень, что требуется БД... если ты с ними не работал, это повод для того, чтобы начать изучать эту облаcть, но никак не подстраивать под задачу то, что ты лучше всего знаешь.

А если бы ты с XML никогда не работал — что бы ты делал тогда с этой задачей?
https://wmspanel.com/nimble — Nimble Streamer media server for live and VOD HLS, RTMP, HTTP streaming
https://wmspanel.com/ — Control and reporting panel for Wowza and Nimble Streamer
http://scm-notes.blogspot.com/ — Блог об управлении конфигурацией
Re[8]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 18.10.04 07:52
Оценка:
Здравствуйте, Aquary, Вы писали:

A>Здравствуйте, Fahrain, Вы писали:


F>> Дык с базами данных я практически не работал


A>Инструмент всегда выбирается исходя из задачи. Если требуется хранить десятки тысяч записей — ясен пень, что требуется БД... если ты с ними не работал, это повод для того, чтобы начать изучать эту облаcть, но никак не подстраивать под задачу то, что ты лучше всего знаешь.


A>А если бы ты с XML никогда не работал — что бы ты делал тогда с этой задачей?


Писал бы по-другому . А насчет БД — с ней надо разбираться, на это нужно время => основной проект стоит. Что важнее СКОРОСТЬ или работоспособность ПРОЕКТА?
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[9]: Пишу переводчик...
От: soljen Интернет  
Дата: 19.10.04 09:00
Оценка: 5 (1)
Доброго времени суток, Fahrain!

F>Писал бы по-другому . А насчет БД — с ней надо разбираться, на это нужно время => основной проект стоит. Что важнее СКОРОСТЬ или работоспособность ПРОЕКТА?


РАБОТОСПОСОБНОСТЬ ПРОЕКТА!!!
Потому как ошибки дольше исправлять, и они многое могут за собой на дно потянуть (исхожу из собственного опыта)!
Так что бери доку, и впярёд!
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Тиха украинская ночь, но сало надо перепрятать!!!
Re[10]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 19.10.04 15:14
Оценка:
Здравствуйте, soljen, Вы писали:

S>Так что бери доку, и впярёд!


Что и делаю
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re: Пишу переводчик...
От: Кирилл Осенков Украина
Дата: 20.10.04 21:49
Оценка:
Здравствуйте, Fahrain, Вы писали:

F> В общем-то переводчик уже подбирается к бете.

Используешь ли ты синтаксический разбор предложений?
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re[2]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 21.10.04 08:19
Оценка:
Здравствуйте, Кирилл Осенков, Вы писали:

КО>Здравствуйте, Fahrain, Вы писали:


F>> В общем-то переводчик уже подбирается к бете.

КО>Используешь ли ты синтаксический разбор предложений?

В принципе, хотелось бы. В данный момент там примитивнейший алгоритм — простая разбивка на слова. Вообще, надо как-то определять гле начинается и кончается прямая речь. А так, на сложных предложениях вроде бы все работает правильно
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Re: Пишу переводчик...
От: dmrev  
Дата: 22.10.04 19:09
Оценка: 2 (1)
Думаю что здесь — http://www.garret.ru/~knizhnik — найдется подходящая база.
... << RSDN@Home 1.1.4 @@subversion >>
Re[2]: Пишу переводчик...
От: Fahrain Россия ertranslator.narod.ru
Дата: 25.10.04 09:13
Оценка:
Здравствуйте, dmrev, Вы писали:

D>Думаю что здесь — http://www.garret.ru/~knizhnik — найдется подходящая база.


Буду смотреть...
... << RSDN@Home 1.1.4 beta 3 rev. 185>>
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.