Компьютер выиграл в го у чемпиона - Образование и наука

Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.

Го до последнего времени трудно поддавался компьютерному анализу из-за большого числа возможных ходов, длинных партий и трудности оценки позиции. AlphaGo использует для оценки позиции глубокие нейронные сети, натренированные на базе игр профессиональных игроков и на играх между копиями AlphaGo. При тренировке использовалось обучение с подкреплением, и на мой взгляд это самое выдающееся достижение этой технологии.

не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.
вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.
а так они просто в дереве поиска искали не по всем направлениям, а делали матчинг на то, нету ли чего-то похожего в базе как вот примерно в этом предполагаемом развитии парти.. я даже не уверен, что для этого нейросети нужны, можно матчить проще и эффективнее.

Здравствуйте, __kot2, Вы писали:

__>не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.
Естественно, перебор есть. Человек тоже перебирает комбинации.

Прорыв заключается в самом подходе к тренировке сетей. Эта работа — логическое продолжение их прошлых экспериментов с играми на Атари. Они показали, что обучением с подкреплением можно тренировать огромные сети. Теперь они продемонстрировали мощь этого подхода, получив результат, которого никаким другим способом получить сейчас нельзя. Сам алгоритм настолько общий, что применять его можно везде, о чем инженеры из DeepMind и говорят. Например, они мечтают применить это в медицине.

Здравствуйте, ineaugh, Вы писали:
I>Прорыв заключается в самом подходе к тренировке сетей. Эта работа — логическое продолжение их прошлых экспериментов с играми на Атари. Они показали, что обучением с подкреплением можно тренировать огромные сети. Теперь они продемонстрировали мощь этого подхода, получив результат, которого никаким другим способом получить сейчас нельзя. Сам алгоритм настолько общий, что применять его можно везде, о чем инженеры из DeepMind и говорят. Например, они мечтают применить это в медицине.

как бы это делал школьник-страшеклассник? он бы для каждого возможного хода брал и искал похожее состояние доски в известных ему партиях и смотрел — выиграл в итоге чел или нет. потом бы стал проводить партии друг с другом и в некоторых случаях пересмотрел бы выигрышность одной позиции над другой.

чего того отличного от этого сделал Гугл? и каким образом этот мегауниверсальный алгоритм может быть применен еще где-то кроме Го-подобных игр? можно сказать, что конечно в лоб сравнение будет медленным и они провели большую работу по оптимизации, чтобы выдавать ответ за пару секунд. это хорошо, молодцы. но никакого алгоримического прорыва тут нет.

Здравствуйте, ineaugh, Вы писали:

I>Здесь еще не было,
Вот тут родственная тема: http://rsdn.ru/forum/philosophy/6327590

Здравствуйте, __kot2, Вы писали:

__>как бы это делал школьник-страшеклассник?

смотри. в 80-х годах ИИ был в моде, идея заключалась в том чтобы взять некоторые "симптомы" и по ним выдать диагноз. это называлось "эспертная система" и предполагалось что соответствие диагнозов и симптомов должны прописать опытные врачи. потом эта идея выдохлась — внезапно оказалось что эксперты действсуют интуитивно и саи не знают как они приняли то или иное решение

сейчас эта идея стала реализуемой на более глубоком уровне — укажите ИИ какие позиции являются выигрышными, от чего выигрыш вообще может зависеть и он сам найдёт корреляции между симптомом и диагнозом. но именно так и действует человеческое (и животное) подсознание!!! т.е. можно сказать что мы от уровня насекомых, в чьей психике всё жёстко запрограммировано от рождения, перешли к уровню бихевиористского обучения. является ли это аналогом научного мышления? нет, к этому пока даже не подступаются. но огромный шаг в развитии ИИ сделан, сейчас закрепляют этот успех.

Здравствуйте, BulatZiganshin, Вы писали:

BZ>Здравствуйте, __kot2, Вы писали:

__>>как бы это делал школьник-страшеклассник?

BZ> эксперты действсуют интуитивно и саи не знают как они приняли то или иное решение
сходите к пяти врачам и получили пять разных мнений. генератор случайный чисел?
у меня вот сейчас как раз возникли проблемы со здоровьем. вроде бы 21 век на дворе. и как раз был у пяти специалистов (не считая десятков тех, которые делали диагностику всего организма по запросу этих пяти). большими усилиями удалось сократить кол-во мнений до трех. точнее до двух. две гипотезы (даже не диагноза) и "хз. медицина вообще-то не точная наука, а помесь науки с черной магией".

у вас есть примеры, когда эксперт действительно действует интуитивно? вообще есть примеры подтвержения интуиции? ну кроме выигрышей в казино?

Здравствуйте, ineaugh, Вы писали:

I>Они показали, что обучением с подкреплением можно тренировать огромные сети.

Вообще-то, это совсем не новость. Вычислительной мощности эквивалентной работе 50 современных GPU на протяжении целого месяца для тренировки этих сетей несколько лет назад просто не было доступно.

AlphaGo — это не универсальный ИИ, играющий в Го, а эволюция уже популярного подхода к игре в Го с грамотной реализацией и огромными вычислительными мощностями.

Здравствуйте, Don Reba, Вы писали:

I>>Они показали, что обучением с подкреплением можно тренировать огромные сети.

DR>Вообще-то, это совсем не новость. Вычислительной мощности эквивалентной работе 50 современных GPU на протяжении целого месяца для тренировки этих сетей несколько лет назад просто не было доступно.

с 2008-го года скорость gpu выросла всего в 5-10 раз

DR>AlphaGo — это не универсальный ИИ, играющий в Го, а эволюция уже популярного подхода к игре в Го с грамотной реализацией и огромными вычислительными мощностями.

глубокое обучение — это вообще новая технология, вот её как раз 5 лет назад и не было

Здравствуйте, BulatZiganshin, Вы писали:

BZ>с 2008-го года скорость gpu выросла всего в 5-10 раз

И прогресс в достижениях соответствующий.

BZ>глубокое обучение — это вообще новая технология, вот её как раз 5 лет назад и не было

Конволюционные сети — это технология из восьмидесятых, для их тренировки только недавно появились достаточные вычислительные способности. Глубокому обучению примерно 9 лет, если вести счёт от публикации статьи ЛеКуна Scaling Learning Algorithms towards AI. До конволюционных сетей для Го использовали MCTS с мелкими сетями, а ещё ранее другие методы RL.

Здравствуйте, __kot2, Вы писали:

__>не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.
__>вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.
__>а так они просто в дереве поиска искали не по всем направлениям, а делали матчинг на то, нету ли чего-то похожего в базе как вот примерно в этом предполагаемом развитии парти.. я даже не уверен, что для этого нейросети нужны, можно матчить проще и эффективнее.

Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан

Здравствуйте, __kot2, Вы писали:

__>вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.

Это был бы уже не просто прорыв, от подобной технологии общество не хило так бы всколыхнуло.

Здравствуйте, Evgeny.Panasyuk, Вы писали:
EP>Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан

ну а что на самом деле делает нейронная сеть?
она считает скалярные произведения сигнала с паттернами. она практически и делает паттерн матчинг.

Здравствуйте, __kot2, Вы писали:

EP>>Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан

__>ну а что на самом деле делает нейронная сеть?

Ещё раз, ты сказал что схема включает перебор. Я ответил что они проводили испытания в том числе схем без всякого перебора, в котором была только нейронная сеть, и эта нейронная сеть показала хороший результат — любительский уровень дан.
Это при том что перебор вариантов важен в Го — непреднамеренный тактический промах легко может обернуться проигрышем. Добавь сюда факт того что в средней игре сотни ходов и на многих из них происходят тактические схватки.

__>она считает скалярные произведения сигнала с паттернами. она практически и делает паттерн матчинг.

Да, там в основе свёрточная сеть, которая как раз хорошо распознаёт образы.

AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе

https://geektimes.ru/post/289479/

«Я думал, что я был близок к победе в середине игры, но AlphaGo думала по другому. Мне немного грустно и я сожалею, поскольку я думал, что играл очень хорошо», — заявил чемпион.

Цзе заявил о своем отказе играть с компьютером после завершения серии матчей с AlphaGo.

Здравствуйте, xma, Вы писали:

xma>AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах.

https://tjournal.ru/44665-kitai-zapretil-smi-oglashat-rezultati-turnira-po-igre-go-mezhdu-chelovekom-i-algoritmom-google

xma>[q]Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира

Всё правильно сделали. Когда их самый мощный компьютер обыграет западную версию — тогда и опубликуют.

Здравствуйте, ineaugh, Вы писали:

I>Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.

Мне кажется, или игра Го изначально хорошо приспособлена к нейронным сетям?

Здравствуйте, alpha21264, Вы писали:

A>Здравствуйте, ineaugh, Вы писали:

I>>Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.

A>Мне кажется, или игра Го изначально хорошо приспособлена к нейронным сетям?

Когда этот ИИ напишет приложение которое всегда будет выигрывать у меня в го-бадук тогда и будем говорить интеллект это или как. А пока ещё самое сильное приложение человеков играет примерно как 3-й дан. И то на доске 9x9. А всё прочее сливает даже мне. (06.06.2011)

http://forum.ixbt.com/topic.cgi?id=64:3071:12#12

считалось, что программа, хорошо играющая в го, может быть создана только в далёком будущем и только с помощью накопленных к тому времени общих знаний в области искусственного интеллекта.

Wikipedia : Компьютерное го

Здравствуйте, xma, Вы писали:

xma>>AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе

xma>

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах.

xma>https://tjournal.ru/44665-kitai-zapretil-smi-oglashat-rezultati-turnira-po-igre-go-mezhdu-chelovekom-i-algoritmom-google

Что за бред.

	От:	ineaugh
	Дата:	15.03.16 16:04
	Оценка:	30 (1)

	От:	__kot2
	Дата:	15.03.16 16:53
	Оценка:	+5

	От:	ineaugh
	Дата:	15.03.16 18:49
	Оценка:

	От:	__kot2
	Дата:	15.03.16 19:41
	Оценка:	+1

	От:	Venom
	Дата:	16.03.16 08:00
	Оценка:

От:	мыщъх	http://nezumi-lab.org
Дата:	22.03.16 04:20
Оценка:

От:	Don Reba	https://stackoverflow.com/users/49329/don-reba
Дата:	22.03.16 04:40
Оценка:

	От:	Evgeny.Panasyuk
	Дата:	24.03.16 17:20
	Оценка:

От:	velkin	http://blogs.rsdn.org/effective/
Дата:	24.03.16 17:28
Оценка:

	От:	Arsen.Shnurkov
	Дата:	26.05.17 12:04
	Оценка:	+1

	От:	BulatZiganshin
	Дата:	21.03.16 23:27
	Оценка: