Здравствуйте, Mohnatiy, Вы писали:
M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
Нет. Но Вы можете придумать как решить такую сложную задачу.
Здравствуйте, Mohnatiy, Вы писали:
M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
На каком языке? Для английского я это делал с помощью Dragon Naturally Speaking. Правда, потом процентов 40 приходилось вручную исправлять, т.к. текст был довольно специфичный. Зато не понадобилась настройка на спикера, которую требуют почти все программы распознавания речи.
Здравствуйте, Mohnatiy, Вы писали:
M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
Здравствуйте, D. Mon, Вы писали:
DM>Здравствуйте, Mohnatiy, Вы писали:
M>>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
DM>На каком языке? Для английского я это делал с помощью Dragon Naturally Speaking. Правда, потом процентов 40 приходилось вручную исправлять, т.к. текст был довольно специфичный. Зато не понадобилась настройка на спикера, которую требуют почти все программы распознавания речи.
Для DNS чтобы нормально распознавало нужны соответствующе Language Models ну и конечно натренировать..
Здравствуйте, Mohnatiy, Вы писали:
M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
Даже из txt в mp3 будет тяжело перевести.
В windows есть такая возможность (правда не в mp3, но это дело поправимое), но слушать без смеха я не могу.
Mohnatiy пишет: > > > есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них > выдрать текст скажем в обычный текстовый файл?
Можно.
Открываете текстовый редактор и набираете в нем слова, которые слышите.
Из txt в mp3 — это синтез речи, задача давно решенная на приемлемом уровне качества.
Из mp3 в txt — это распознавание речи, до сих пор не решена и в ближайшее время надежного решения не предвидится.
Автору нужно второе, а не первое. Как вариант, можно нанять стенографистку, они умеют распознавать и записывать в реальном времени.
Здравствуйте, abibok, Вы писали:
A>>Даже из txt в mp3 будет тяжело перевести.
A>Из txt в mp3 — это синтез речи, задача давно решенная на приемлемом уровне качества. A>Из mp3 в txt — это распознавание речи, до сих пор не решена и в ближайшее время надежного решения не предвидится.
A>Автору нужно второе, а не первое. Как вариант, можно нанять стенографистку, они умеют распознавать и записывать в реальном времени.
Подкинь примеры хорошего синтеза речи.
Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.
Здравствуйте, alzt, Вы писали:
A>Подкинь примеры хорошего синтеза речи. A>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.
Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.
Здравствуйте, Mohnatiy, Вы писали:
M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
Здравствуйте, Рома Мик, Вы писали:
A>>Подкинь примеры хорошего синтеза речи. A>>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе. РМ>Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.
Здравствуйте, Рома Мик, Вы писали:
РМ>Здравствуйте, alzt, Вы писали:
РМ>Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.
В автонавигаторах, имхо, все-таки начитан типовой набор фраз нормальным диктором, а не синтезирован
Здравствуйте, Vzhyk, Вы писали:
V>Mohnatiy пишет: >> >> >> есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них >> выдрать текст скажем в обычный текстовый файл? V>Можно. V>Открываете текстовый редактор и набираете в нем слова, которые слышите.
Здравствуйте, Maniacal, Вы писали:
M>Здравствуйте, Mohnatiy, Вы писали:
M>>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
M>это не ваша цитата, случайно здесь?
я прекрасно осознаю сложность задачи, но я вроде и не просил безупречной работы. Я понимаю, большую часть текста прийдётся править, но это лучше, чем писать с нуля
Здравствуйте, alzt, Вы писали:
A>Здравствуйте, Рома Мик, Вы писали:
A>>>Подкинь примеры хорошего синтеза речи. A>>>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе. РМ>>Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.
A>В навигационных системах синтезируется речь?
Синтезируются названия населенных пунктов, улиц, но не везде реализовано и не для всех языков. Типовые фразы вроде "поверните налево через 100 метров" наговорены.
Здравствуйте, Mohnatiy, Вы писали:
M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?
Здравствуйте, alzt, Вы писали:
A>Подкинь примеры хорошего синтеза речи. A>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.
Голосовой движок "Аленка" дает вполне приемлимое качество. Но для этого после установки движка установить дополнительно отдельные лексиконы. Я где-то видел сайт с такими лексиконами, но адрес сейчас не помню.
UNIX way — это когда тебе вместо туалетной бумаги дают топор, рубанок и карту близлежащего леса
Sashaka wrote:
> В автонавигаторах, имхо, все-таки начитан типовой набор фраз нормальным > диктором, а не синтезирован
Позвольте не согласиться. В некоторых навигаторах использкется оба
подхода: как начитаный текст так и синтезатор — причем очень хорошо
слышно, когда и что используется. Первый случай приятнее для уха, второй
более гибкий и удобный в использовании. Для примера статические
инструкции всегда говорит диктор (поверните налево, поверните направо и
т.д,), а инструкции которые изменяются в зависимости от дорожных условий
говорит синтезатор (через 100-150 и т.д метров перестройтесь в правый,
левый).
Posted via RSDN NNTP Server 2.1 beta
Premature optimization is the root of all evil in programming. Donald Knuth