Мэри Микер (Mary Meeker), выступая на мероприятии Code Conference, заявила, что компания Google повысила точность распознавания английской речи до 95%.
Благодаря алгоритмам машинного обучения, теперь поисковик и голосовой помощник Google понимают англоязычную речь с такой же точностью, что и носители языка.
Стоит отметить, что еще четыре года назад точность распознавания английского языка составляла 75%.
Мэри Микер (Mary Meeker), выступая на мероприятии Code Conference, заявила, что компания Google повысила точность распознавания английской речи до 95%.
Они конечно молодцы. Но что значит 95%?
Это количество правильно распознанных слов, или это количество правильно распознанных букв?
Или они просто диктора попросили поразборчивее говорить?
xma>
Благодаря алгоритмам машинного обучения, теперь поисковик и голосовой помощник Google понимают англоязычную речь с такой же точностью, что и носители языка.
Но тут они привирают.
Во-первых, носители языка распознают 100%.
Во-вторых, я использую из сервис для распознавания русского.
По характерным ошибкам я вижу какие алгоритмы они используют.
Там всё довольно примитивно.
Здравствуйте, Kernighan, Вы писали:
K>Во-первых, носители языка распознают 100%.
Английского нет. У меня один коллега из Ньюкасла, другой из Саутгемптона. По-моему, они друг друга понимают процентов на 50.
Здравствуйте, El Camino Real, Вы писали:
ECR>Здравствуйте, Kernighan, Вы писали:
K>>Во-первых, носители языка распознают 100%. ECR>Английского нет. У меня один коллега из Ньюкасла, другой из Саутгемптона. По-моему, они друг друга понимают процентов на 50.
Кто-то из основоположников сказал:
Когда я говорил, что компьютеры сравняются с человеком,
я имел в виду, что компьютеры станут умнее, а не люди поглупеют.
количество распознанных в умеренно поганых по шуму условиях слов.
причем слова случайные, а не осмысленными предложениями.
и тут засада. дело в том, что человек довольно плохо слышит и часто не в состоянии корректно расслышать слова, но по контексту легко догадывается и восстанавливает. т.е. если в условиях шума тебе говорить осмысленные вещи, ты будешь все понимать, хотя обьективно каждое 20ое примерно слово не расслышишь. если же будет идти поток бессвязных слов, то попрут ошибки.
95% — это конечно круто, но без понимания (а без него невозможна коррекция по контексту) все это будет по прежнему не особо. надиктовывать тексты не получится — будет по-прежнему много ошибок.
По словам Татьяны Нестеренко, содержание бухгалтеров только в госсекторе составляет 1 триллион рублей в год. Число госслужащих, занятых бухгалтерским учетом, превышает 1,1 миллиона человек.
Минфин полагает, что не менее 500 тыс. человек могут быть сокращены в этом секторе в ближайшее время, чтобы его численность снизилась до 600 тысяч.
В общей сумме замена людей машинами и программными решениями обойдется в более чем $2 млрд.
xma>
В банке предполагают, что цифровая трансформация будет экономить €900 млн ежегодно.
А что тут удивительного?
Сначала будут всё постепенно автоматизировать и выгонять на улицу разных специалистов.
А потом выгонят на улицу и самих автоматизаторов. — Карма у них такая.
Как сказали в одной радиопередачке, ИИ умеет делать много потрясающих вещей, но он не умеет мыть сортиры.
Очень настораживает (далеко не только меня) то, что ИИ нацелен на упразднение видов деятельности среднего уровня. Общество держится на среднем классе, но именно этот самый средний класс попадает под удар. Некоторые смогут войти в состав 1%, владеющего 99% богатств, но остальные отправятся мыть сортиры.
По мнению 350 экспертов, ИИ обойдет человека по уровню интеллекта максимум через 40 с небольшим лет. Превосходства во всех сферах знаний он достигнет через 125 лет.
из описания от NVidia : реализовано с использованием глубоких сверточных нейросетей ("deep convolutional networks")
этот "шумодав" на нейронках выдает картинку еще ближе к референсу ..
We were able to achieve highly interactive performance on the latest GPUs. For a 720p image (1280×720 pixels), the reconstruction time was 54.9ms on NVIDIA (Pascal) Titan X.
Ну и чего такого? Повысили точность распознавания слов до 100%. Всё равно ничерта она не понимает в языке, потому что язык — это то как мозг думает, а то, что мы говорим и слышим — лишь вершина айсберга. Язык в основном это механизм человеческого мышления, коммуникация — это побочный эффект.
В местном полицейском участке задействовали технологию распознавания лиц, и обнаружение подозреваемой, запечатленной тысячами камер наблюдения, заняло лишь две секунды.
Спасению Сюаньхуаня помогла технология, за которой стоит компания IntelliFusion. Ее представители утверждают, что при распознавания лиц искусственный интеллект практически никогда не ошибается.
Для борьбы с преступными уловками разработчики обучают систему распознаванию одежды, формы тела и даже осанки.
кто там пердел что идея распознавания лиц (/людей) в потоке людей посредством ИИ — бесполезный (в силу низкой эффективности) понт и всегда таковым останется ? :D
LVE>Сначала будут всё постепенно автоматизировать и выгонять на улицу разных специалистов. LVE>А потом выгонят на улицу и самих автоматизаторов. — Карма у них такая.
И только техподдержка будет вечна
xma>кто там пердел что идея распознавания лиц (/людей) в потоке людей посредством ИИ — бесполезный (в силу низкой эффективности) понт и всегда таковым останется ? :D
Только вот к ИИ это ровно никакого отношения не имеет.
Это всего лишь FineReader на стероидах. И мыслить он не умеет. Даже примитивно, на уровне животных.
Несомненно, это шаг в направлении настоящего ИИ, как и все, что было создано после появления ламп и транзисторов.