Есть ли реальный прогресс в распознавании речи?
От: Chrome  
Дата: 09.12.11 09:16
Оценка: 2 (1)
В последнее время много восторженых возгласов о программах распознавания речи.
Хочется понять — это результат маркетинга, ну просто потому что за раскрутку взялись крупные компании
или произошел реальный сдвиг?
Несколько лет назад писали, что технология в тупике, в речи человека много изменчивости, сокращений, пропущеных кусков
и не видно пути как с этим бороться.
Что то изменилось?
Re: Есть ли реальный прогресс в распознавании речи?
От: Кодёнок  
Дата: 09.12.11 17:30
Оценка:
Здравствуйте, Chrome, Вы писали:

C>В последнее время много восторженых возгласов о программах распознавания речи.


Например? Об одной единственной — Siri?

Siri это только маленький шажок вперед. Раньше надо было распознавалку настраивать, теперь можно диктовать СМС, взяв телефон из коробки. Но даже небольшой акцент уже значительно снижает качество. Отличный способ поправить себе произношение, кстати, вроде умения отличать sheet от shit
Re: Есть ли реальный прогресс в распознавании речи?
От: Шахтер Интернет  
Дата: 09.12.11 20:25
Оценка: 9 (4) +2
Здравствуйте, Chrome, Вы писали:

C>В последнее время много восторженых возгласов о программах распознавания речи.

C>Хочется понять — это результат маркетинга, ну просто потому что за раскрутку взялись крупные компании
C>или произошел реальный сдвиг?
C>Несколько лет назад писали, что технология в тупике, в речи человека много изменчивости, сокращений, пропущеных кусков
C>и не видно пути как с этим бороться.
C>Что то изменилось?

Я несколько лет назад видел интервью Гейтса. Майкрософт потратила на распознавание речи несколько миллиардов. Но результат -- посредственный, впрочем, как и у всех.
Так вот Гейтс доходчиво объяснил, почему проблема не решается.

На самом деле, человек тоже слышит плохо, как и комьпютер.
Но у него есть верхний уровень обработки речевого потока. Для которого нужно понимание смысла.
Сделать такой искуственный -- задача неподъёмная. Пока, и вероятно, надолго.
В XXI век с CCore.
Копай Нео, копай -- летать научишься. © Matrix. Парадоксы
Re: Есть ли реальный прогресс в распознавании речи?
От: gandjustas Россия http://blog.gandjustas.ru/
Дата: 10.12.11 01:20
Оценка:
Здравствуйте, Chrome, Вы писали:

C>В последнее время много восторженых возгласов о программах распознавания речи.

C>Хочется понять — это результат маркетинга, ну просто потому что за раскрутку взялись крупные компании
C>или произошел реальный сдвиг?
C>Несколько лет назад писали, что технология в тупике, в речи человека много изменчивости, сокращений, пропущеных кусков
C>и не видно пути как с этим бороться.
C>Что то изменилось?

Скорее всего тоже, что в свое время случилось с автоматическим переводом.

Для полноценного перевода нужно понимать смысл текста, но есть поисковики, индексирующие кучу текста и они могут делать "статистический" перевод.

В ту же самую проблему уперлось распознавание текста — надо понимать смысл того что говорят, но для звукового потока это еще сложнее, чем в простом тексте. Но есть статистика по произношению английских слов и машина тупо ищет в огромной базе слова, сопоставляя с образцом.

ЗЫ. точных сведений у меня нет, это на уровне предположения.
Re[2]: Есть ли реальный прогресс в распознавании речи?
От: KRT Украина  
Дата: 10.12.11 01:32
Оценка: :))
Здравствуйте, Кодёнок, Вы писали:

Кё>Здравствуйте, Chrome, Вы писали:


C>>В последнее время много восторженых возгласов о программах распознавания речи.


Кё>Например? Об одной единственной — Siri?


Прозреваю приход Ikemefula|Demandred|Mamut,которые быстро расскажут как Apple invented правильный voice recognition.
Re: Есть ли реальный прогресс в распознавании речи?
От: vladimir_i СССР  
Дата: 11.12.11 10:15
Оценка: :)
Здравствуйте, Chrome, Вы писали:

C>В последнее время много восторженых возгласов о программах распознавания речи.

C>Хочется понять — это результат маркетинга, ну просто потому что за раскрутку взялись крупные компании
C>или произошел реальный сдвиг?
C>Несколько лет назад писали, что технология в тупике, в речи человека много изменчивости, сокращений, пропущеных кусков
C>и не видно пути как с этим бороться.
C>Что то изменилось?

До 11 этажа уже доедете. На 12-й — лучше пешком.
Re: Есть ли реальный прогресс в распознавании речи?
От: neurofish Россия  
Дата: 13.12.11 03:25
Оценка: 4 (2)
Профессионально занимаюсь этим вопросом.

Технологии уперлись в предел своих возможностей. Объяснения Б.Гейтса и прочих, утверждающих, что прогресс невозможен без "верхних" уровней научно несостоятельны: распознавалки распознают произвольные слова хуже человека.
Существует постоянный незначительный прогресс в совершенствовании существующих методов (DBN, повышение качества и объема выборки, адаптация к диктору и т.п.).
Проблему текущих технологий (HMM и моделирования пл.вероятностей в состояниях, а также LM) можно сформулировать так: для линейного роста качества требуется экспоненциальный рост к-ва выборки (теоретический результат).
Прогресс возможен при резкой смене базовой технологии. ИМХО, это возможно и скоро.

Кстати, Siri использует движок Nuance (ваш, КО). Довольно остроумное техническое решение: распознавание на сервере, способное адаптироваться к каждому конкретному диктору.
Re[2]: Есть ли реальный прогресс в распознавании речи?
От: barn_czn  
Дата: 14.12.11 17:56
Оценка: 4 (1) +1
Здравствуйте, neurofish, Вы писали:

N>Профессионально занимаюсь этим вопросом.


N>Технологии уперлись в предел своих возможностей. Объяснения Б.Гейтса и прочих, утверждающих, что прогресс невозможен без "верхних" уровней научно несостоятельны: распознавалки распознают произвольные слова хуже человека.


Согласен. Гейтс явно не прав (если это действительно он говорил, в чем есть сомнения).
По молодости я тоже занимался этими делами и приведу другое объяснение проблемы.

Задача распознавания — это обратная задача. А решение обратных задач, даже для очень простых моделей, всегда на порядки сложнее.
Сложнее алгоритмически.

Приведу конкретный пример. HMM (Hiden Markov Model)- довольно изученный объект в математике. Смоделировать сигнал
описываемый такой моделью стоит O(N) на каждый отсчет сигнала. Решить обратную задачу, т.е. найти вероятности на каждое состояние
— O(N^2). Т.е. квадратичная сложность ставит крест на более менее интересных моделях явлений.

Поэтому в основном идут по пути эвристик. А эвристика вещь коварная — в одном случае даст прекрасный результат, а в другом ужасный.
Re[3]: Есть ли реальный прогресс в распознавании речи?
От: Ikemefula Беларусь http://blogs.rsdn.org/ikemefula
Дата: 15.12.11 15:52
Оценка: +1 :)))
Здравствуйте, KRT, Вы писали:

Кё>>Например? Об одной единственной — Siri?


KRT>Прозреваю приход Ikemefula|Demandred|Mamut,которые быстро расскажут как Apple invented правильный voice recognition.


Apple разработал первый массовый voice recognition который взлетел, т.е. решили инженерную задачу, как донести эту возможность до пользователей. А кто изобрел, invented и тд и тд — это всё дело десятое, это никому не интересно.
Re: Есть ли реальный прогресс в распознавании речи?
От: Neir0  
Дата: 15.12.11 16:11
Оценка:
Здравствуйте, Chrome, Вы писали:

C>В последнее время много восторженых возгласов о программах распознавания речи.

C>Хочется понять — это результат маркетинга, ну просто потому что за раскрутку взялись крупные компании
C>или произошел реальный сдвиг?
C>Несколько лет назад писали, что технология в тупике, в речи человека много изменчивости, сокращений, пропущеных кусков
C>и не видно пути как с этим бороться.
C>Что то изменилось?

Так вот же.
http://research.microsoft.com/en-us/news/features/speechrecognition-082911.aspx
Re[4]: Есть ли реальный прогресс в распознавании речи?
От: Кодёнок  
Дата: 10.01.12 11:52
Оценка: 1 (1) -1
Здравствуйте, Ikemefula, Вы писали:

Кё>>>Например? Об одной единственной — Siri?

KRT>>Прозреваю приход Ikemefula|Demandred|Mamut,которые быстро расскажут как Apple invented правильный voice recognition.
I>Apple разработал первый массовый voice recognition который взлетел, т.е. решили инженерную задачу, как донести эту возможность до пользователей. А кто изобрел, invented и тд и тд — это всё дело десятое, это никому не интересно.

Начнем с того, что Apple эту самую Siri купил. Инженерная задача была решена каким-то стартапом и до пользователей оно сначала было донесено как обычное приложение из аппстора. Продолжим тем, что Siri сделана из результатов многолетних исследований DARPA, и она не единственная, кто пользуется этими достижениями. Закончим на том, что посмеемся как точно ты подтвердил предсказание KRT.
Re: Есть ли реальный прогресс в распознавании речи?
От: minorlogic Украина  
Дата: 10.01.12 12:34
Оценка:
Здравствуйте, Chrome, Вы писали:

C>В последнее время много восторженых возгласов о программах распознавания речи.

C>Хочется понять — это результат маркетинга, ну просто потому что за раскрутку взялись крупные компании
C>или произошел реальный сдвиг?
C>Несколько лет назад писали, что технология в тупике, в речи человека много изменчивости, сокращений, пропущеных кусков
C>и не видно пути как с этим бороться.
C>Что то изменилось?

Кажется американскрое "поле чудес" выиграла программа отвечающая на вопросы с голоса. (могу ошибаться)
... << RSDN@Home 1.2.0 alpha 5 rev. 1539>>
Ищу работу, 3D, SLAM, computer graphics/vision.
Re[5]: Есть ли реальный прогресс в распознавании речи?
От: Ikemefula Беларусь http://blogs.rsdn.org/ikemefula
Дата: 11.01.12 10:10
Оценка: -1
Здравствуйте, Кодёнок, Вы писали:

KRT>>>Прозреваю приход Ikemefula|Demandred|Mamut,которые быстро расскажут как Apple invented правильный voice recognition.

I>>Apple разработал первый массовый voice recognition который взлетел, т.е. решили инженерную задачу, как донести эту возможность до пользователей. А кто изобрел, invented и тд и тд — это всё дело десятое, это никому не интересно.

Кё>Начнем с того, что Apple эту самую Siri купил.Инженерная задача была решена каким-то стартапом и до пользователей оно сначала было донесено как обычное приложение из аппстора.


"решили инженерную задачу, как донести эту возможность до пользователей"

Стартап действительно разработал чего то, но Эппл донес эту возможность до пользователей и это само по себе адски сложная инженерная задача.

>Продолжим тем, что Siri сделана из результатов многолетних исследований DARPA, и она не единственная, кто пользуется этими достижениями.


Это никому не интересно. Плевать, кто изобрёл, invented, разработал. Главное, кто доносит возможности до пользователей. Без delivery все твои invented это ноль без палочки.

>Закончим на том, что посмеемся как точно ты подтвердил предсказание KRT.


Я нигде не писал что Эппл "Apple invented правильный voice recognition". Более того, я написал, что неважно, кем же invented. Важно только delivery — Это что бы ты сравнил c invented. Не знаю, может у тебя delivery == invented.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.