Re: выдереть текст из mp3 - О жизни

Здравствуйте, Mohnatiy, Вы писали:

M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

Нет. Но Вы можете придумать как решить такую сложную задачу.

Здравствуйте, Mohnatiy, Вы писали:

M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

На каком языке? Для английского я это делал с помощью Dragon Naturally Speaking. Правда, потом процентов 40 приходилось вручную исправлять, т.к. текст был довольно специфичный. Зато не понадобилась настройка на спикера, которую требуют почти все программы распознавания речи.

Здравствуйте, Mohnatiy, Вы писали:

M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

это не ваша цитата, случайно здесь?

Здравствуйте, D. Mon, Вы писали:

DM>Здравствуйте, Mohnatiy, Вы писали:

M>>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

DM>На каком языке? Для английского я это делал с помощью Dragon Naturally Speaking. Правда, потом процентов 40 приходилось вручную исправлять, т.к. текст был довольно специфичный. Зато не понадобилась настройка на спикера, которую требуют почти все программы распознавания речи.

Для DNS чтобы нормально распознавало нужны соответствующе Language Models ну и конечно натренировать..

Здравствуйте, Mohnatiy, Вы писали:

M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

Даже из txt в mp3 будет тяжело перевести.
В windows есть такая возможность (правда не в mp3, но это дело поправимое), но слушать без смеха я не могу.

Mohnatiy пишет:
>
>
> есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них
> выдрать текст скажем в обычный текстовый файл?
Можно.
Открываете текстовый редактор и набираете в нем слова, которые слышите.

Posted via RSDN NNTP Server 2.1 beta

Здравствуйте, alzt, Вы писали:

A>В windows есть такая возможность

Не только в windows.

A>Даже из txt в mp3 будет тяжело перевести.

Из txt в mp3 — это синтез речи, задача давно решенная на приемлемом уровне качества.
Из mp3 в txt — это распознавание речи, до сих пор не решена и в ближайшее время надежного решения не предвидится.

Автору нужно второе, а не первое. Как вариант, можно нанять стенографистку, они умеют распознавать и записывать в реальном времени.

Здравствуйте, abibok, Вы писали:

A>>Даже из txt в mp3 будет тяжело перевести.

A>Из txt в mp3 — это синтез речи, задача давно решенная на приемлемом уровне качества.
A>Из mp3 в txt — это распознавание речи, до сих пор не решена и в ближайшее время надежного решения не предвидится.

A>Автору нужно второе, а не первое. Как вариант, можно нанять стенографистку, они умеют распознавать и записывать в реальном времени.

Подкинь примеры хорошего синтеза речи.
Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.

Здравствуйте, alzt, Вы писали:

A>Подкинь примеры хорошего синтеза речи.
A>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.
Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.

Здравствуйте, Mohnatiy, Вы писали:

M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

Вот есть Google Audio Indexing, но они пока только предвыборные дебаты осилили.

Здравствуйте, Рома Мик, Вы писали:

A>>Подкинь примеры хорошего синтеза речи.
A>>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.
РМ>Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.

В навигационных системах синтезируется речь?

Здравствуйте, Рома Мик, Вы писали:

РМ>Здравствуйте, alzt, Вы писали:

РМ>Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.

В автонавигаторах, имхо, все-таки начитан типовой набор фраз нормальным диктором, а не синтезирован

Здравствуйте, Vzhyk, Вы писали:

V>Mohnatiy пишет:
>>
>>
>> есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них
>> выдрать текст скажем в обычный текстовый файл?
V>Можно.
V>Открываете текстовый редактор и набираете в нем слова, которые слышите.

Можно даже нанять стенографистку.

Здравствуйте, Maniacal, Вы писали:

M>Здравствуйте, Mohnatiy, Вы писали:

M>>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

M>это не ваша цитата, случайно здесь?

я прекрасно осознаю сложность задачи, но я вроде и не просил безупречной работы. Я понимаю, большую часть текста прийдётся править, но это лучше, чем писать с нуля

... << RSDN@Home 1.1.4 stable SR1 rev. 568>>

Здравствуйте, alzt, Вы писали:

A>Здравствуйте, Рома Мик, Вы писали:

A>>>Подкинь примеры хорошего синтеза речи.
A>>>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.
РМ>>Смотря что называть полным серьёзом. Вот есть например слепые, на полном серьезе слушают, что говорит им к примеру программа JAWS (зачитывает содержимое окон в Windows) с помощью например русскоязычного синтезатора "Говорящая мышь". На английском есть для MS Speech API синтезаторы от самой Microsoft, вполне себе говорят. Это всё пригодно не только для инвалидов, но и для случаев, когда глаза заняты чем-то еще и смотреть некогда, например водитель в автомобиле, слушающий указания навигационной системы.

A>В навигационных системах синтезируется речь?

Синтезируются названия населенных пунктов, улиц, но не везде реализовано и не для всех языков. Типовые фразы вроде "поверните налево через 100 метров" наговорены.

Здравствуйте, Mohnatiy, Вы писали:

M>есть mp3, в котором четко и ясно слышны слова (начитка). Можно ли с них выдрать текст скажем в обычный текстовый файл?

что означает глагол "выдереть" ?

Здравствуйте, alzt, Вы писали:

A>Подкинь примеры хорошего синтеза речи.
A>Даже не надо сходства с человеком, пусть я смогу различить, что звук синтезирован. Но хотя бы можно было слушать это на полном серьёзе.

Голосовой движок "Аленка" дает вполне приемлимое качество. Но для этого после установки движка установить дополнительно отдельные лексиконы. Я где-то видел сайт с такими лексиконами, но адрес сейчас не помню.

Sashaka wrote:

> В автонавигаторах, имхо, все-таки начитан типовой набор фраз нормальным
> диктором, а не синтезирован

Позвольте не согласиться. В некоторых навигаторах использкется оба
подхода: как начитаный текст так и синтезатор — причем очень хорошо
слышно, когда и что используется. Первый случай приятнее для уха, второй
более гибкий и удобный в использовании. Для примера статические
инструкции всегда говорит диктор (поверните налево, поверните направо и
т.д,), а инструкции которые изменяются в зависимости от дорожных условий
говорит синтезатор (через 100-150 и т.д метров перестройтесь в правый,
левый).

Posted via RSDN NNTP Server 2.1 beta

	От:	Mohnatiy
	Дата:	17.11.08 23:24
	Оценка:

	От:	nen777w
	Дата:	18.11.08 00:33
	Оценка:

От:	D. Mon	http://thedeemon.livejournal.com
Дата:	18.11.08 02:19
Оценка:

	От:	Maniacal
	Дата:	18.11.08 12:46
	Оценка:

	От:	Bear Hunter
	Дата:	18.11.08 12:59
	Оценка:

От:	ДимДимыч	http://klug.org.ua
Дата:	18.11.08 13:48
Оценка:

От:	Рома Мик	http://romamik.com
Дата:	19.11.08 07:50
Оценка:

От:	pigeon	http://www.twitter.com/dmytrogolub
Дата:	20.11.08 07:24
Оценка: