Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.
Го до последнего времени трудно поддавался компьютерному анализу из-за большого числа возможных ходов, длинных партий и трудности оценки позиции. AlphaGo использует для оценки позиции глубокие нейронные сети, натренированные на базе игр профессиональных игроков и на играх между копиями AlphaGo. При тренировке использовалось обучение с подкреплением, и на мой взгляд это самое выдающееся достижение этой технологии.
не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.
вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.
а так они просто в дереве поиска искали не по всем направлениям, а делали матчинг на то, нету ли чего-то похожего в базе как вот примерно в этом предполагаемом развитии парти.. я даже не уверен, что для этого нейросети нужны, можно матчить проще и эффективнее.
Здравствуйте, __kot2, Вы писали:
__>не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.
Естественно, перебор есть. Человек тоже перебирает комбинации.
Прорыв заключается в самом подходе к тренировке сетей. Эта работа — логическое продолжение их прошлых экспериментов с играми на Атари. Они показали, что обучением с подкреплением можно тренировать огромные сети. Теперь они продемонстрировали мощь этого подхода, получив результат, которого никаким другим способом получить сейчас нельзя. Сам алгоритм настолько общий, что применять его можно везде, о чем инженеры из DeepMind и говорят. Например, они мечтают применить это в медицине.
Здравствуйте, ineaugh, Вы писали: I>Прорыв заключается в самом подходе к тренировке сетей. Эта работа — логическое продолжение их прошлых экспериментов с играми на Атари. Они показали, что обучением с подкреплением можно тренировать огромные сети. Теперь они продемонстрировали мощь этого подхода, получив результат, которого никаким другим способом получить сейчас нельзя. Сам алгоритм настолько общий, что применять его можно везде, о чем инженеры из DeepMind и говорят. Например, они мечтают применить это в медицине.
как бы это делал школьник-страшеклассник? он бы для каждого возможного хода брал и искал похожее состояние доски в известных ему партиях и смотрел — выиграл в итоге чел или нет. потом бы стал проводить партии друг с другом и в некоторых случаях пересмотрел бы выигрышность одной позиции над другой.
чего того отличного от этого сделал Гугл? и каким образом этот мегауниверсальный алгоритм может быть применен еще где-то кроме Го-подобных игр? можно сказать, что конечно в лоб сравнение будет медленным и они провели большую работу по оптимизации, чтобы выдавать ответ за пару секунд. это хорошо, молодцы. но никакого алгоримического прорыва тут нет.
Здравствуйте, __kot2, Вы писали:
__>как бы это делал школьник-страшеклассник?
смотри. в 80-х годах ИИ был в моде, идея заключалась в том чтобы взять некоторые "симптомы" и по ним выдать диагноз. это называлось "эспертная система" и предполагалось что соответствие диагнозов и симптомов должны прописать опытные врачи. потом эта идея выдохлась — внезапно оказалось что эксперты действсуют интуитивно и саи не знают как они приняли то или иное решение
сейчас эта идея стала реализуемой на более глубоком уровне — укажите ИИ какие позиции являются выигрышными, от чего выигрыш вообще может зависеть и он сам найдёт корреляции между симптомом и диагнозом. но именно так и действует человеческое (и животное) подсознание!!! т.е. можно сказать что мы от уровня насекомых, в чьей психике всё жёстко запрограммировано от рождения, перешли к уровню бихевиористского обучения. является ли это аналогом научного мышления? нет, к этому пока даже не подступаются. но огромный шаг в развитии ИИ сделан, сейчас закрепляют этот успех.
Здравствуйте, BulatZiganshin, Вы писали:
BZ>Здравствуйте, __kot2, Вы писали:
__>>как бы это делал школьник-страшеклассник?
BZ> эксперты действсуют интуитивно и саи не знают как они приняли то или иное решение
сходите к пяти врачам и получили пять разных мнений. генератор случайный чисел?
у меня вот сейчас как раз возникли проблемы со здоровьем. вроде бы 21 век на дворе. и как раз был у пяти специалистов (не считая десятков тех, которые делали диагностику всего организма по запросу этих пяти). большими усилиями удалось сократить кол-во мнений до трех. точнее до двух. две гипотезы (даже не диагноза) и "хз. медицина вообще-то не точная наука, а помесь науки с черной магией".
у вас есть примеры, когда эксперт действительно действует интуитивно? вообще есть примеры подтвержения интуиции? ну кроме выигрышей в казино?
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Здравствуйте, ineaugh, Вы писали:
I>Они показали, что обучением с подкреплением можно тренировать огромные сети.
Вообще-то, это совсем не новость. Вычислительной мощности эквивалентной работе 50 современных GPU на протяжении целого месяца для тренировки этих сетей несколько лет назад просто не было доступно.
AlphaGo — это не универсальный ИИ, играющий в Го, а эволюция уже популярного подхода к игре в Го с грамотной реализацией и огромными вычислительными мощностями.
Здравствуйте, Don Reba, Вы писали:
I>>Они показали, что обучением с подкреплением можно тренировать огромные сети.
DR>Вообще-то, это совсем не новость. Вычислительной мощности эквивалентной работе 50 современных GPU на протяжении целого месяца для тренировки этих сетей несколько лет назад просто не было доступно.
с 2008-го года скорость gpu выросла всего в 5-10 раз
DR>AlphaGo — это не универсальный ИИ, играющий в Го, а эволюция уже популярного подхода к игре в Го с грамотной реализацией и огромными вычислительными мощностями.
глубокое обучение — это вообще новая технология, вот её как раз 5 лет назад и не было
Здравствуйте, BulatZiganshin, Вы писали:
BZ>с 2008-го года скорость gpu выросла всего в 5-10 раз
И прогресс в достижениях соответствующий.
BZ>глубокое обучение — это вообще новая технология, вот её как раз 5 лет назад и не было
Конволюционные сети — это технология из восьмидесятых, для их тренировки только недавно появились достаточные вычислительные способности. Глубокому обучению примерно 9 лет, если вести счёт от публикации статьи ЛеКуна Scaling Learning Algorithms towards AI. До конволюционных сетей для Го использовали MCTS с мелкими сетями, а ещё ранее другие методы RL.
Здравствуйте, __kot2, Вы писали:
__>не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв. __>вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв. __>а так они просто в дереве поиска искали не по всем направлениям, а делали матчинг на то, нету ли чего-то похожего в базе как вот примерно в этом предполагаемом развитии парти.. я даже не уверен, что для этого нейросети нужны, можно матчить проще и эффективнее.
Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан
Здравствуйте, __kot2, Вы писали:
__>вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.
Это был бы уже не просто прорыв, от подобной технологии общество не хило так бы всколыхнуло.
Здравствуйте, Evgeny.Panasyuk, Вы писали: EP>Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан
ну а что на самом деле делает нейронная сеть?
она считает скалярные произведения сигнала с паттернами. она практически и делает паттерн матчинг.
Здравствуйте, __kot2, Вы писали:
EP>>Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан __>ну а что на самом деле делает нейронная сеть?
Ещё раз, ты сказал что схема включает перебор. Я ответил что они проводили испытания в том числе схем без всякого перебора, в котором была только нейронная сеть, и эта нейронная сеть показала хороший результат — любительский уровень дан.
Это при том что перебор вариантов важен в Го — непреднамеренный тактический промах легко может обернуться проигрышем. Добавь сюда факт того что в средней игре сотни ходов и на многих из них происходят тактические схватки.
__>она считает скалярные произведения сигнала с паттернами. она практически и делает паттерн матчинг.
Да, там в основе свёрточная сеть, которая как раз хорошо распознаёт образы.
«Я думал, что я был близок к победе в середине игры, но AlphaGo думала по другому. Мне немного грустно и я сожалею, поскольку я думал, что играл очень хорошо», — заявил чемпион.
Цзе заявил о своем отказе играть с компьютером после завершения серии матчей с AlphaGo.
Здравствуйте, xma, Вы писали:
xma>AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе
Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах.
Здравствуйте, ineaugh, Вы писали:
I>Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.
Мне кажется, или игра Го изначально хорошо приспособлена к нейронным сетям?
Здравствуйте, alpha21264, Вы писали:
A>Здравствуйте, ineaugh, Вы писали:
I>>Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.
A>Мне кажется, или игра Го изначально хорошо приспособлена к нейронным сетям?
Когда этот ИИ напишет приложение которое всегда будет выигрывать у меня в го-бадук тогда и будем говорить интеллект это или как. А пока ещё самое сильное приложение человеков играет примерно как 3-й дан. И то на доске 9x9. А всё прочее сливает даже мне. (06.06.2011)
считалось, что программа, хорошо играющая в го, может быть создана только в далёком будущем и только с помощью накопленных к тому времени общих знаний в области искусственного интеллекта.
Здравствуйте, xma, Вы писали:
xma>>AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе
xma>
Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах.