немного о так называемом компьютерном зрении
От: LuciferSaratov Россия  
Дата: 02.06.15 08:27
Оценка: 15 (4) :))) :))) :)
недавно появился в сети мощный сервис от Вольфрама, который волшебным образом распознает картинки.
это https://www.imageidentify.com/, результаты и правда впечатляют.

но вот один товарищ с хабра решил подложить ему диван леопардовой расцветки, повернув его на 90 градусов.
в его случае мега-сервис назвал это дело ягуаром.

я решил повторить эксперимент, и получилось вот так:
http://i.imgur.com/Q9BA7ZL.png
http://i.imgur.com/kY1DnoG.png
http://i.imgur.com/uRh0sKa.png

- То-то же! — сказали суровые сибирские мужики и ушли рубить лес топорами.

Re[2]: немного о так называемом компьютерном зрении
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 02.07.15 12:22
Оценка: :))) :)
Здравствуйте, Mr.Delphist, Вы писали:

Гы, есть и забавные ошибки: Фотосервис Google снова опозорилcя: принял чернокожих людей за горилл.
https://elibrary.ru/author_counter.aspx?id=875549
Re: немного о так называемом компьютерном зрении
От: Mr.Delphist  
Дата: 02.06.15 10:40
Оценка: 69 (2)
Здравствуйте, LuciferSaratov, Вы писали:

LS>недавно появился в сети мощный сервис от Вольфрама, который волшебным образом распознает картинки.

LS>это https://www.imageidentify.com/, результаты и правда впечатляют.

LS>но вот один товарищ с хабра решил подложить ему диван леопардовой расцветки, повернув его на 90 градусов.

LS>в его случае мега-сервис назвал это дело ягуаром.

Как вы все понимаете, я не мог устоять против классики. Результаты распознавания и ссылки на картинки:

Bird http://traditio-ru.org/images/4/45/Duck-Rabbit_illusion.jpg
Paper clip http://bg.veselba.kafence.com/pix/cartoon/rabbit_duck.jpg
Film reel http://brainden.com/images/rabbitduck2.gif
Re: немного о так называемом компьютерном зрении
От: student__  
Дата: 21.07.15 19:08
Оценка: 6 (1)
Наверное, стоит разделять прикладные задачи в индустрии (многие из которых успешно решены, например, визуальная инспекция качества изготовленных деталей) и более сложные задачи, связанные с ИИ.

А что вы, собственно, хотели? Сильный ИИ прямо здесь и сейчас? Наука продвигается постепенно, шаг за шагом, иногда ползком, а иногда сваливается в "яму", из которой потом выбирается не одно десятилетие. Когда шла холодная война, даже американцы выделяли гранты на "бесполезные" для обывателя исследования, связанные с ИИ. Но в силу окончания противостояния и недальновидных прогнозов некоторых учёных, финансирование сократили, и, вместо изучения вопросов ИИ, учёные в большей степени стали заниматься более прикладными и менее концептуальными вещами вроде машинного обучения и робототехники. Этому также способствовал — я бы даже сказал, был необходимым условием и ускорителем неминуемости именно такого поворота в исследовательских интересах — прогресс в области вычислительной техники.

Когда машины были большими и медленными, учёные вроде Тьюринга в основном развивали теорию, а на практике — во всяком случае, из того, что касалось ИИ — можно было проверить только очень простенькие задачи. Математик и криптолог Макс Ньюман в радио-беседе с коллегами (в числе которых был Тьюринг) о потенциальных "мыслительных" возможностях компьютеров, проходившей в 1952г., заявил, что вряд ли когда либо инженеры построят компьютер, в 10000 раз быстрее имевшихся на тот момент манчестерских машин (тысячи операций в секунду, примерно такой порядок). Теперь давно уже ясно, на сколько ошибочным был данный прогноз. При появлении новых вычислительных возможностей, о которых и не мечтали в 1952г., и в условиях высокой степени коньюнктурности рыночной экономики, наука (которая не может быть оторвана от остального общества, а значит и от господствующей в обществе идеологии) пошла по пути наименьшего сопротивления — вместо решения принципиальных вопросов устройства человеческого разума и ИИ, учёные больше стали заниматься новыми методами в машинном обучении, стремясь с каждым новым методом количественно обогнать результаты предыдущих в конкретном приложении. Когда результаты очередного метода оказывались не хуже результатов человека, ставились новые, более сложные задачи. Так, например, от распознавания рукописных цифр перешли к распознаванию более сложных объектов.

Convolutional Neural Networks, которые сейчас считаются передним краем науки в области распознавания объектов — это метод, базирующийся на разработках времён холодной войны. Его новизна заключается в ряде трюков, позволяющих тренировать сеть за приемлемое время на относительно дешёвом железе с массовым распараллеливанием, а также позволяющих избежать некоторых традиционных проблем нейросетей с большим количеством слоёв. Плюс некоторые стандартные рецепты вроде локальной нормализации контраста, позволяющие улучшить результаты. Видно, что CNN показывает лучшие результаты по сравнению с другими методами. Ясно также, что это старые добрые нейросети, хоть и адаптированные для решения современных задач (распознавание объектов сложнее цифр и дорожных знаков), но не добавляющие ничего концептуально нового к пониманию разума и ИИ. Экстенсивный рост.

То же самое происходит с естественным языком. Критику IBM Watson можно почитать у того же Хомского. Но даже и без Хомского понятно, если посмотреть на некоторые варианты ответов IBM'овской системы в викторине, что у Watson отсутствует адекватное представление о смысле тех гигабайтов текста, которые он перелопатил. Во всяком случае, то, что человек считает очевидным бредом, Watson может считать правдоподобным ответом, пусть даже его правдоподобность ниже 100%. Просто IBM'у нужно как-то продвигать продажи своих новых систем, а ИИ — хоть и "запятнанная", но до сих пор модная для коммерсов тема. Вот смотрят люди на подобный маркетинг, что мол, свершилась очередная революция в области ИИ, а на поверку оказывается, что у новой "революции" по сравнению со старыми всего лишь труба повыше, и дым погуще, а по сути — всё та же старая холупа. И тогда появлаются темы со скептическими приписками "так называемый". Короче, не стоит полностью доверять рекламе.

Итого, резюме:

1) Новые методы в машинном обучении таки решают поставленные задачи (лучшие результаты на актуальных на сегодня наборах данных);
2) Новые методы ... не задумываются для решения задач принципиального характера в области ИИ. Во всяком случае, в научных публикациях по теме я не видел спекулятивных заявлений подобного рода. Есть устоявшиеся термины вроде "распознавание объектов" и другие частные прикладные аспекты компьютерного зрения, есть однозначные методики сравнения на основе давно принятых в области метрик. Грубо говоря, "метод X на наборе данных D показывает, по сравнению с методом Y, на 10% больше корректных распознаваний и на 10% меньше ложных срабатываний". Результат подобного рода можно воспроизвести, чтобы убедиться в том, что авторы не сжульничали. И серьёзные люди не мешают свои достижения в КЗ с понятием ИИ вообще, если предмет их исследований — конкретный метод машинного обучения.
Re[3]: немного о так называемом компьютерном зрении
От: vsb  
Дата: 11.07.15 18:52
Оценка: +1
Здравствуйте, senglory, Вы писали:

V>>В компьютерном зрении много различных методов распознавания, но эта область ещё развивается.


S>Развиваться может и развивается, но "гуртовщики мыши", похоже, никуда не делись. И непонятно, когда денутся.


В общем случае переводы, распознавание требуют полноценного мышления, поэтому надо только ждать появление ИИ человеческого уровня.

А в частных случаях в общем-то задачи же решаются и вполне успешно. Тем же google translate пользоваться для практических нужд получается. Классификатор фотографией процентов 80-90 автоматом классифицирует правильно.
Re: немного о так называемом компьютерном зрении
От: velkin Россия  
Дата: 02.06.15 08:46
Оценка:
Здравствуйте, LuciferSaratov, Вы писали:

LS>недавно появился в сети мощный сервис от Вольфрама, который волшебным образом распознает картинки.

LS>это https://www.imageidentify.com/, результаты и правда впечатляют.
LS>но вот один товарищ с хабра решил подложить ему диван леопардовой расцветки, повернув его на 90 градусов.
LS>в его случае мега-сервис назвал это дело ягуаром.
LS>я решил повторить эксперимент, и получилось вот так:

В компьютерном зрении много различных методов распознавания, но эта область ещё развивается.
Re: немного о так называемом компьютерном зрении
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 02.06.15 10:12
Оценка:
Здравствуйте, LuciferSaratov, Вы писали:

LS>недавно появился в сети мощный сервис от Вольфрама, который волшебным образом распознает картинки.

LS>это https://www.imageidentify.com/, результаты и правда впечатляют.
...
LS>

- То-то же! — сказали суровые сибирские мужики и ушли рубить лес топорами.


Ага, тоже смотрел. На том же хабре есть перевод статьи от создателя Вольфрама вообще и этого сервиса в частности. У них внутри там сейчас популярный deep learning — нейросети, короче. И об ошибках тоже сказано: вот оно.
Их обучают на обычных предметах, нет особой устойчивости к поворотам и другим искажениям. А распознавать во всех объекты позах будет уж слишком накладно по вычислительным ресурсам.
Раньше было модно использовать bag of words, где эти самые words являются, как правило, SIFT дескрипторами. Вот они уже инвариантны не только с скейлу и поворотам, но и к перспективным искажениям в целом. Думаю, что в будущем эти два метода скрестят или родят что-то похожее на них.
https://elibrary.ru/author_counter.aspx?id=875549
Re: немного о так называемом компьютерном зрении
От: Don Reba Канада https://stackoverflow.com/users/49329/don-reba
Дата: 02.06.15 14:45
Оценка:
А что это на картинке?
Ce n'est que pour vous dire ce que je vous dis.
Re: немного о так называемом компьютерном зрении
От: DreamMaker  
Дата: 02.06.15 15:02
Оценка:
Здравствуйте, LuciferSaratov, Вы писали:

LS>недавно появился в сети мощный сервис от Вольфрама, который волшебным образом распознает картинки.


лиха беда начало.
первые шахматные программы тоже позорно играли.
прогресс в AI вообще и в computer vision в частности идет нешуточный, сейчас сильно лучше чем было, а дальше будет еще лучше.
In P=NP we trust.
Re[2]: немного о так называемом компьютерном зрении
От: senglory  
Дата: 11.07.15 17:29
Оценка:
LS>>недавно появился в сети мощный сервис от Вольфрама, который волшебным образом распознает картинки.
LS>>это https://www.imageidentify.com/, результаты и правда впечатляют.
LS>>но вот один товарищ с хабра решил подложить ему диван леопардовой расцветки, повернув его на 90 градусов.
LS>>в его случае мега-сервис назвал это дело ягуаром.
LS>>я решил повторить эксперимент, и получилось вот так:

V>В компьютерном зрении много различных методов распознавания, но эта область ещё развивается.


Развиваться может и развивается, но "гуртовщики мыши", похоже, никуда не делись. И непонятно, когда денутся.
Re[4]: немного о так называемом компьютерном зрении
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 13.07.15 14:39
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>А в частных случаях в общем-то задачи же решаются и вполне успешно. Тем же google translate пользоваться для практических нужд получается. Классификатор фотографией процентов 80-90 автоматом классифицирует правильно.


Ну, на соревнованиях по распознаванию уже больше 96% и это лучше показателей, показываемых человеком. Но от "тупых" ошибок типа диван=леопард или негр=горилла это не спасает.
https://elibrary.ru/author_counter.aspx?id=875549
Re[3]: немного о так называемом компьютерном зрении
От: velkin Россия  
Дата: 19.07.15 18:15
Оценка:
Здравствуйте, senglory, Вы писали:

S>Развиваться может и развивается, но "гуртовщики мыши", похоже, никуда не делись. И непонятно, когда денутся.


http://lurkmore.to/Копипаста:Гуртовщики_мыши

Это про перевод, то есть можно пытаться решать задачу и без компьютерного зрения. Что касается мыши, то некоторые люди сейчас играют используя программу eviacam. Например, симулятор гонок в котором мышь водит камерой и не влияет на управление автомобилем типа ETS 2 и многих других можно использовать камеру как трекер, хотя и низкочастотный с рывками. А то, как создавали кинетик вообще поражает, это же надо так заморочиться.
Re[3]: немного о так называемом компьютерном зрении
От: Lazytech Ниоткуда  
Дата: 24.07.15 09:44
Оценка:
Здравствуйте, senglory, Вы писали:

V>>В компьютерном зрении много различных методов распознавания, но эта область ещё развивается.

S>Развиваться может и развивается, но "гуртовщики мыши", похоже, никуда не делись. И непонятно, когда денутся.

Когда появится искусственный интеллект, понимающий смысл сказанного, причем в контексте.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.