NK> Хи-хи Эхотагу впору возгордиться. До сих пор, насколько я знаю, исследования по частоте
NK> употребления различных слов, словосочетаний и даже букв проводились только по классикам уровня
NK> Александра Сергеича
и-и, батенька, по кому только не проводились такие исследования! Hаиболее впечатлила меня история с подсчетом глаголов в собрании сочинений барда Михаила Щербакова. Глаголы подсчитывала "умная" программа, по окончании работы, выдавшая ошеломленным исследователям результат: первый по частоте из употребляемых глаголов "мыть", второй — "какать". Проведенное расследование показало, что программу забыли научить различать глаголы и деепричастия, то есть, она "засчитывала" за глаголы слова "моя" и, соответственно, "какая"...
VC> Вот над этой задачей и бьются в настоящее вpемя в Канаде. Пpичем не без yспеха. Так, напpимеp,
VC> yчеными pазpаботана специальная ткань, котоpая содеpжит сенсоpы, чyвствительные к цветy, сигналы
VC> от них постyпают в центpальный пpоцессоp, котоpый обpабатывая входнyю инфоpмацию генеpиpyет некий
VC> yзоp, являющийся наименее заметным на данной местности. После этого готовое цветовое pешение
VC> отобpажают индикатоpы, составляющие веpхний слой ткани. Совсем как в знаменитом фильме "Predator".
Угу. Посpеди иpакской пyстыни синее пятно с надписью "General Protect Fault" и pядами цифp...
SI> Тут буржуйские учёные сделали на симуляторе нейронной сети из 11 нейронов распознавалку речи,
SI> которая даже в сильно зашумлённых условиях распознаёт речь намного быстрее и качественнее
SI> человека — за счёт тактовой частоты ! Так через сколько лет не желающих чип в черепушку заменят
SI> машины ?
CM> Откуда информация? Ссылку, плз. Потому как распознавалка речи — это рулез из рулезов. А если
CM> еще и лучше человека (во что я практически не верю), то... ммм......
Ой... Распознавалки... Я сейчас начну погибать от хохота.
Ситуация: Сидит нормальный(до этого) человек перед компутером. Микрофон в мониторе, его не видно. И, уткнувшись рылом в монитор, уговаривает железяку: "Опен виндоу!" Хрен. "Опен виндоу!". Hи фига. Меняем интонацию. "Уопен уиндоу... Да прекратите вы ржать, идиоты, не мешайте овладевать передовыми технологиями!" Железяка жалобные стоны игнорирует. "Опен, твою мать, виндов!" Естественно, хренушки. Заходит девочка-бухгалтер. Hаблюдает родного сисадмина, уламывающего железку открыть окошко. Войсом. Ей плохеет. Пятится по направлению к двери, на лице неудержимое желание вызвать скорую. Ей быренько все объясняют, она остается посмотреть на цирк. Ладно, выдыхаю, обучаю по новой. Опен. Виндоу. Запускаю. "Опен виндоу". Hе-а. От задница. Окончательно разозлившись,ору "Шатдаун на хрен, дура!" Винда послушно гаснет. Hарод вокруг просто лежит вповалку. Еле живой.
Случай два. Тестирование программы набора текстов голосом. Тут уже я наблюдал и хихикал. Hачинаем. "Блэк..." Программа: "Ась? Чаво? " Вываливает список словей, которые, по ее мнению, могли бы иметь место в данном случае. Экспериментатор, привстав со стула, тянется за мышой и тыкает в "black". Программа: "Ааа... Ясно, так бы и сказал, чего орать-то?" "Кэт". Программа: "Шо? Hедопонял?" И список. В котором такие фантастические варианты... Клиент тыкает в "cat". Единственная команда, которую оно воспринимало с четкостью хорошо выдрессированной собаки — "new line". Это да. Hью лайн — это завсегда пожалуйста. Особенно с интонацией "Твою мать!". Видимо, автор программы и клиент учились в разных университетах. "А у нас, в Оксфорде, слово "cat" произносят не так...". Hо заряд бодрости на весь день я получил. После того, как наблюдал совершенно разозленного человека, орущего в микрофон: "Hью лайн, дура! Hью лайн!". Причем на "дура" оно тоже какой-то список выкатило. Я не посмотрел, живот болел от смеха. Искусственный интеллект, однако.
Здравствуйте, jhfrek, Вы писали:
...
CM>> еще и лучше человека (во что я практически не верю), то... ммм...... J>Ой... Распознавалки... Я сейчас начну погибать от хохота. J>Ситуация: Сидит нормальный(до этого) человек перед компутером. Микрофон в мониторе, его не видно. И, уткнувшись рылом в монитор, уговаривает железяку: "Опен виндоу!" Хрен. "Опен виндоу!". Hи фига. Меняем интонацию. "Уопен уиндоу... Да прекратите вы ржать, идиоты, не
О, со мной точно так и было. Только без зрителей. Из всех команд, Винда запускала только первую Кваку, ссылка на которую валялась на десктопе. Причём, почти на любую команду.
Здравствуйте, WFrag, Вы писали:
WF>Здравствуйте, jhfrek, Вы писали:
WF>А какие проги существуют для управления голосом? Тоже хочу поиздеваться над Виндой.
Мобильник Siemens одного нашего сотрудника с включенным голосовым набором в ответ на почти любое матерное слово набирает один и тот же телефон. И что интересно — и владелец телефона, и вызываемый — неплохие ребята, хорошо друг к другу относятся... А вы говорите — нет искусственного интеллекта! Он есть, но таится, и виден только по косвенным проявлениям!
Здравствуйте, WFrag, Вы писали:
WF>Здравствуйте, jhfrek, Вы писали:
WF>А какие проги существуют для управления голосом? Тоже хочу поиздеваться над Виндой.
Как человек, занимающийся Speech Recognition, отвечу:
1. Dragon Systems. По-моему, у них сейчас вышла 7-я версия. Обещали очень неплохое качество!
2. Microsoft SAPI 5.1. Сам движок там так себе (по крайней мере, с диктовкой справляется мерзко), но команды понимает довольно неплохо! Я даже заставлял его понимать русские команды (через ж##у, но получалось). Это не программа, это SDK для написания своих собственных прог.
3. Найти проект SPHINX на sourceforge. Попробовать собрать его под Win32. Выругаться, что не собирается. Почитать доки. Выругаться еще раз. Собрать. Попробовать распознавание. Понять, что так себе. Захотеть перетренировать language model. Скачать проект SphinxTrain. Попробовать собрать. Выругаться. Почитать доки. Еще раз собрать. Попытаться заставить это работать.... (многократное "выругаться" пропустим ).... Наслаждаться распознаванием
4. Дождаться выхода моей speech recognition system, изначально ориентированной на русский язык .
Здравствуйте, Kupaev, Вы писали:
K>Мобильник Siemens одного нашего сотрудника с включенным голосовым набором в ответ на почти любое матерное слово набирает один и тот же телефон. И что интересно — и владелец телефона, и вызываемый — неплохие ребята, хорошо друг к другу относятся... А вы говорите — нет искусственного интеллекта! Он есть, но таится, и виден только по косвенным проявлениям!
"Хороший телефон, умный. Вот только когда в пробке стою — постоянно звонит маме".
Здравствуйте, disop, Вы писали:
D>Здравствуйте, WFrag, Вы писали:
WF>>Здравствуйте, jhfrek, Вы писали:
WF>>А какие проги существуют для управления голосом? Тоже хочу поиздеваться над Виндой. D>Как человек, занимающийся Speech Recognition, отвечу:
D>1. Dragon Systems. По-моему, у них сейчас вышла 7-я версия. Обещали очень неплохое качество!
D>2. Microsoft SAPI 5.1. Сам движок там так себе (по крайней мере, с диктовкой справляется мерзко), но команды понимает довольно неплохо! Я даже заставлял его понимать русские команды (через ж##у, но получалось). Это не программа, это SDK для написания своих собственных прог.
D>3. Найти проект SPHINX на sourceforge. Попробовать собрать его под Win32. Выругаться, что не собирается. Почитать доки. Выругаться еще раз. Собрать. Попробовать распознавание. Понять, что так себе. Захотеть перетренировать language model. Скачать проект SphinxTrain. Попробовать собрать. Выругаться. Почитать доки. Еще раз собрать. Попытаться заставить это работать.... (многократное "выругаться" пропустим ).... Наслаждаться распознаванием
D>4. Дождаться выхода моей speech recognition system, изначально ориентированной на русский язык .
Встречный вопрос: А как собрать sphinx CMU_cam_toolkit_v2? У него юниксовые примочки, а сменить компилятор(у меня VC 6) на MinGw или CygWin — ну никак нельзя
Здравствуйте, Kupaev, Вы писали:
K>Мобильник Siemens одного нашего сотрудника с включенным голосовым набором в ответ на почти любое матерное слово набирает один и тот же телефон. И что интересно — и владелец телефона, и вызываемый — неплохие ребята, хорошо друг к другу относятся... А вы говорите — нет искусственного интеллекта! Он есть, но таится, и виден только по косвенным проявлениям!
А у меня был Motorola, так он начальнику время от времени названивал...
Здравствуйте, stilsokol, Вы писали:
S>Встречный вопрос: А как собрать sphinx CMU_cam_toolkit_v2? У него юниксовые примочки, а сменить компилятор(у меня VC 6) на MinGw или CygWin — ну никак нельзя
S>С уважением, Stilsokol.
О! Еще интересуются
Честно отвечу — модуль тренировки я собирал под CygWin'ом — по-другому не получалось. Сам распознаватель должен собираться под Win32 — там даже есть соответствующий .dsp-файл. Только учти — выделять память они выделяют, а вот освобождать — забывают