Ищу программиста для помощи в написании переводчика с английского на русский (в идеале должен переводить художественный текст).
В общем-то переводчик уже подбирается к бете. Но на данный момент есть проблемы сбазами даный (нужна нормальная реализация доступа к БД).
Как пример, вот результат работы программы (словарь — 70 слов):
Оригинал:
The coffee that our secretary , Mary , had gotten for mister Harlan sat on the edge of my desk .
His mug was the one with the logo of Animators inc on it .
He had taken a minute sip of the coffee , when Mary had first handed it to him .
He had taken the coffee black , but he sipped it like he had not tasted it , or it did not really matter what it tasted like .
He had taken it out of politeness , not out of desire.
Перевод:
Кофе который+что наш секретарь , mary , получил для+на мистера harlan сидел на крае моего стола .
его кружка была тот с эмблемой animators корпорации на оно+это .
Он взял маленький глоток кофе , когда mary сначала вручил оно+это ему .
Он взял кофе черный , но он прихлебывал оно+это как он не ощутил вкус оно+это , или оно+это не действительно значило что+какой оно+это на вкус .
Он взял оно+это из вежливости , не из желания .
Проект shareware...
... << RSDN@Home 1.1.3 stable >>
01.09.05 19:12: Перенесено модератором из 'Открытые проекты' — AndrewVK
Здравствуйте, vvvoloshin1, Вы писали:
V>Какая используется база и что не устраивает ?
Для базы используется XML. Загрузка осуществляется посредством десериализации. А не устраивает все , т.к.:
а) Медленно.
б) Надо сортировать базу.
в) Вся база грузится в память (сейчас она 300кб — это при 70 словах, а для нормальной работы нужно 1000 или 10000 или 30000 слов).
г) при добавлении слов в базу ее приходится сортировать, чтобы потом можно было осущ. быстрый поиск... А при большом количестве слов я сомневаюсь что это будет быстрый процесс .
Здравствуйте, Fahrain, Вы писали:
F>Здравствуйте, vvvoloshin1, Вы писали:
V>>Какая используется база и что не устраивает ?
F>Для базы используется XML. Загрузка осуществляется посредством десериализации. А не устраивает все , т.к.: F> а) Медленно. F> б) Надо сортировать базу. F> в) Вся база грузится в память (сейчас она 300кб — это при 70 словах, а для нормальной работы нужно 1000 или 10000 или 30000 слов). F> г) при добавлении слов в базу ее приходится сортировать, чтобы потом можно было осущ. быстрый поиск... А при большом количестве слов я сомневаюсь что это будет быстрый процесс .
В догонку: мне нужен не только специалист по БД, в принципе я не отказался бы и от разработчка GUI...
Здравствуйте, Aquary, Вы писали:
A>Здравствуйте, Fahrain, Вы писали:
F>>Для базы используется XML. Загрузка осуществляется посредством десериализации.
A>и при этом ты удивляешься маленькой скорости?
A>почему изначально ты взял именно xml в качестве хранилища?
Проще всего было, т.к. уже была разработана иерархия класов БД, т.е. все что нужно было сделать — это загрузить данные из старого формата (чистый текст) и сериализовать. Так и получился XML
Здравствуйте, Fahrain, Вы писали:
F>Здравствуйте, Fahrain, Вы писали:
F>>Здравствуйте, vvvoloshin1, Вы писали:
V>>>Какая используется база и что не устраивает ?
F>>Для базы используется XML. Загрузка осуществляется посредством десериализации. А не устраивает все , т.к.: F>> а) Медленно. F>> б) Надо сортировать базу. F>> в) Вся база грузится в память (сейчас она 300кб — это при 70 словах, а для нормальной работы нужно 1000 или 10000 или 30000 слов). F>> г) при добавлении слов в базу ее приходится сортировать, чтобы потом можно было осущ. быстрый поиск... А при большом количестве слов я сомневаюсь что это будет быстрый процесс .
F>В догонку: мне нужен не только специалист по БД, в принципе я не отказался бы и от разработчка GUI...
Здравствуйте, Valicchh, Вы писали:
V>Это коммерческое предложение?
Программа пишется чтобы продаваться. На данный момент на рынке НЕТ программ-переводчиков сравнимых с ПРОМТ (вообще есть — только их не видно и не слышно ). Т.е. теоретически, если довести программу до ума, ее можно продавать.
Здравствуйте, Fahrain, Вы писали:
F>Здравствуйте, Valicchh, Вы писали:
V>>Это коммерческое предложение?
F> Программа пишется чтобы продаваться. На данный момент на рынке НЕТ программ-переводчиков сравнимых с ПРОМТ (вообще есть — только их не видно и не слышно ). Т.е. теоретически, если довести программу до ума, ее можно продавать.
Здравствуйте, Fahrain, Вы писали:
F> Проще всего было, т.к. уже была разработана иерархия класов БД, т.е. все что нужно было сделать — это загрузить данные из старого формата (чистый текст) и сериализовать.
эээ... а почему, имея иерархию БД, ты не стал использовать саму БД?
Здравствуйте, Aquary, Вы писали:
AA>эээ... а почему, имея иерархию БД, ты не стал использовать саму БД?
Дык с базами данных я практически не работал (максимум, что требовалось — это получить данные из готовой БД, кот. делает другая программа). Так что с ней надо было разбираться... Я попробовал, но там главная проблема — это то, что в базе получается 6-8 таблиц различной степени связанности... И вот тут-то все ивстало
Здравствуйте, Fahrain, Вы писали:
F> Дык с базами данных я практически не работал
Инструмент всегда выбирается исходя из задачи. Если требуется хранить десятки тысяч записей — ясен пень, что требуется БД... если ты с ними не работал, это повод для того, чтобы начать изучать эту облаcть, но никак не подстраивать под задачу то, что ты лучше всего знаешь.
А если бы ты с XML никогда не работал — что бы ты делал тогда с этой задачей?
Здравствуйте, Aquary, Вы писали:
A>Здравствуйте, Fahrain, Вы писали:
F>> Дык с базами данных я практически не работал
A>Инструмент всегда выбирается исходя из задачи. Если требуется хранить десятки тысяч записей — ясен пень, что требуется БД... если ты с ними не работал, это повод для того, чтобы начать изучать эту облаcть, но никак не подстраивать под задачу то, что ты лучше всего знаешь.
A>А если бы ты с XML никогда не работал — что бы ты делал тогда с этой задачей?
Писал бы по-другому . А насчет БД — с ней надо разбираться, на это нужно время => основной проект стоит. Что важнее СКОРОСТЬ или работоспособность ПРОЕКТА?
Доброго времени суток, Fahrain!
F>Писал бы по-другому . А насчет БД — с ней надо разбираться, на это нужно время => основной проект стоит. Что важнее СКОРОСТЬ или работоспособность ПРОЕКТА?
РАБОТОСПОСОБНОСТЬ ПРОЕКТА!!!
Потому как ошибки дольше исправлять, и они многое могут за собой на дно потянуть (исхожу из собственного опыта)!
Так что бери доку, и впярёд!
Здравствуйте, Кирилл Осенков, Вы писали:
КО>Здравствуйте, Fahrain, Вы писали:
F>> В общем-то переводчик уже подбирается к бете. КО>Используешь ли ты синтаксический разбор предложений?
В принципе, хотелось бы. В данный момент там примитивнейший алгоритм — простая разбивка на слова. Вообще, надо как-то определять гле начинается и кончается прямая речь. А так, на сложных предложениях вроде бы все работает правильно