Компьютер выиграл в го у чемпиона
От: ineaugh  
Дата: 15.03.16 16:04
Оценка: 30 (1)
Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.

Го до последнего времени трудно поддавался компьютерному анализу из-за большого числа возможных ходов, длинных партий и трудности оценки позиции. AlphaGo использует для оценки позиции глубокие нейронные сети, натренированные на базе игр профессиональных игроков и на играх между копиями AlphaGo. При тренировке использовалось обучение с подкреплением, и на мой взгляд это самое выдающееся достижение этой технологии.
Re: Компьютер выиграл в го у чемпиона
От: __kot2  
Дата: 15.03.16 16:53
Оценка: +5
не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.
вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.
а так они просто в дереве поиска искали не по всем направлениям, а делали матчинг на то, нету ли чего-то похожего в базе как вот примерно в этом предполагаемом развитии парти.. я даже не уверен, что для этого нейросети нужны, можно матчить проще и эффективнее.
Re[2]: Компьютер выиграл в го у чемпиона
От: ineaugh  
Дата: 15.03.16 18:49
Оценка:
Здравствуйте, __kot2, Вы писали:

__>не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.

Естественно, перебор есть. Человек тоже перебирает комбинации.

Прорыв заключается в самом подходе к тренировке сетей. Эта работа — логическое продолжение их прошлых экспериментов с играми на Атари. Они показали, что обучением с подкреплением можно тренировать огромные сети. Теперь они продемонстрировали мощь этого подхода, получив результат, которого никаким другим способом получить сейчас нельзя. Сам алгоритм настолько общий, что применять его можно везде, о чем инженеры из DeepMind и говорят. Например, они мечтают применить это в медицине.
Re[3]: Компьютер выиграл в го у чемпиона
От: __kot2  
Дата: 15.03.16 19:41
Оценка: +1 :))
Здравствуйте, ineaugh, Вы писали:
I>Прорыв заключается в самом подходе к тренировке сетей. Эта работа — логическое продолжение их прошлых экспериментов с играми на Атари. Они показали, что обучением с подкреплением можно тренировать огромные сети. Теперь они продемонстрировали мощь этого подхода, получив результат, которого никаким другим способом получить сейчас нельзя. Сам алгоритм настолько общий, что применять его можно везде, о чем инженеры из DeepMind и говорят. Например, они мечтают применить это в медицине.

как бы это делал школьник-страшеклассник? он бы для каждого возможного хода брал и искал похожее состояние доски в известных ему партиях и смотрел — выиграл в итоге чел или нет. потом бы стал проводить партии друг с другом и в некоторых случаях пересмотрел бы выигрышность одной позиции над другой.

чего того отличного от этого сделал Гугл? и каким образом этот мегауниверсальный алгоритм может быть применен еще где-то кроме Го-подобных игр? можно сказать, что конечно в лоб сравнение будет медленным и они провели большую работу по оптимизации, чтобы выдавать ответ за пару секунд. это хорошо, молодцы. но никакого алгоримического прорыва тут нет.
Re: Компьютер выиграл в го у чемпиона
От: Venom  
Дата: 16.03.16 08:00
Оценка:
Здравствуйте, ineaugh, Вы писали:

I>Здесь еще не было,

Вот тут родственная тема: http://rsdn.ru/forum/philosophy/6327590
Автор: jazzer
Дата: 28.01.16
Re[4]: Компьютер выиграл в го у чемпиона
От: BulatZiganshin  
Дата: 21.03.16 23:27
Оценка:
Здравствуйте, __kot2, Вы писали:

__>как бы это делал школьник-страшеклассник?


смотри. в 80-х годах ИИ был в моде, идея заключалась в том чтобы взять некоторые "симптомы" и по ним выдать диагноз. это называлось "эспертная система" и предполагалось что соответствие диагнозов и симптомов должны прописать опытные врачи. потом эта идея выдохлась — внезапно оказалось что эксперты действсуют интуитивно и саи не знают как они приняли то или иное решение

сейчас эта идея стала реализуемой на более глубоком уровне — укажите ИИ какие позиции являются выигрышными, от чего выигрыш вообще может зависеть и он сам найдёт корреляции между симптомом и диагнозом. но именно так и действует человеческое (и животное) подсознание!!! т.е. можно сказать что мы от уровня насекомых, в чьей психике всё жёстко запрограммировано от рождения, перешли к уровню бихевиористского обучения. является ли это аналогом научного мышления? нет, к этому пока даже не подступаются. но огромный шаг в развитии ИИ сделан, сейчас закрепляют этот успех.
Люди, я люблю вас! Будьте бдительны!!!
Re[5]: Компьютер выиграл в го у чемпиона
От: мыщъх США http://nezumi-lab.org
Дата: 22.03.16 04:20
Оценка:
Здравствуйте, BulatZiganshin, Вы писали:

BZ>Здравствуйте, __kot2, Вы писали:


__>>как бы это делал школьник-страшеклассник?


BZ> эксперты действсуют интуитивно и саи не знают как они приняли то или иное решение

сходите к пяти врачам и получили пять разных мнений. генератор случайный чисел?
у меня вот сейчас как раз возникли проблемы со здоровьем. вроде бы 21 век на дворе. и как раз был у пяти специалистов (не считая десятков тех, которые делали диагностику всего организма по запросу этих пяти). большими усилиями удалось сократить кол-во мнений до трех. точнее до двух. две гипотезы (даже не диагноза) и "хз. медицина вообще-то не точная наука, а помесь науки с черной магией".

у вас есть примеры, когда эксперт действительно действует интуитивно? вообще есть примеры подтвержения интуиции? ну кроме выигрышей в казино?
americans fought a war for a freedom. another one to end slavery. so, what do some of them choose to do with their freedom? become slaves.
Re[3]: Компьютер выиграл в го у чемпиона
От: Don Reba Канада https://stackoverflow.com/users/49329/don-reba
Дата: 22.03.16 04:40
Оценка:
Здравствуйте, ineaugh, Вы писали:

I>Они показали, что обучением с подкреплением можно тренировать огромные сети.


Вообще-то, это совсем не новость. Вычислительной мощности эквивалентной работе 50 современных GPU на протяжении целого месяца для тренировки этих сетей несколько лет назад просто не было доступно.

AlphaGo — это не универсальный ИИ, играющий в Го, а эволюция уже популярного подхода к игре в Го с грамотной реализацией и огромными вычислительными мощностями.
Ce n'est que pour vous dire ce que je vous dis.
Отредактировано 22.03.2016 4:51 Don Reba . Предыдущая версия . Еще …
Отредактировано 22.03.2016 4:44 Don Reba . Предыдущая версия .
Re[4]: Компьютер выиграл в го у чемпиона
От: BulatZiganshin  
Дата: 22.03.16 20:21
Оценка:
Здравствуйте, Don Reba, Вы писали:

I>>Они показали, что обучением с подкреплением можно тренировать огромные сети.


DR>Вообще-то, это совсем не новость. Вычислительной мощности эквивалентной работе 50 современных GPU на протяжении целого месяца для тренировки этих сетей несколько лет назад просто не было доступно.


с 2008-го года скорость gpu выросла всего в 5-10 раз

DR>AlphaGo — это не универсальный ИИ, играющий в Го, а эволюция уже популярного подхода к игре в Го с грамотной реализацией и огромными вычислительными мощностями.


глубокое обучение — это вообще новая технология, вот её как раз 5 лет назад и не было
Люди, я люблю вас! Будьте бдительны!!!
Re[5]: Компьютер выиграл в го у чемпиона
От: Don Reba Канада https://stackoverflow.com/users/49329/don-reba
Дата: 23.03.16 06:40
Оценка:
Здравствуйте, BulatZiganshin, Вы писали:

BZ>с 2008-го года скорость gpu выросла всего в 5-10 раз


И прогресс в достижениях соответствующий.

BZ>глубокое обучение — это вообще новая технология, вот её как раз 5 лет назад и не было


Конволюционные сети — это технология из восьмидесятых, для их тренировки только недавно появились достаточные вычислительные способности. Глубокому обучению примерно 9 лет, если вести счёт от публикации статьи ЛеКуна Scaling Learning Algorithms towards AI. До конволюционных сетей для Го использовали MCTS с мелкими сетями, а ещё ранее другие методы RL.
Ce n'est que pour vous dire ce que je vous dis.
Отредактировано 23.03.2016 7:05 Don Reba . Предыдущая версия . Еще …
Отредактировано 23.03.2016 6:42 Don Reba . Предыдущая версия .
Re[2]: Компьютер выиграл в го у чемпиона
От: Evgeny.Panasyuk Россия  
Дата: 24.03.16 17:20
Оценка:
Здравствуйте, __kot2, Вы писали:

__>не думаю, что это прорывов является. по крайней мере технически ничего нового они не сделали, да и сама схема все еще включает перебор. морально, да — прорыв.

__>вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.
__>а так они просто в дереве поиска искали не по всем направлениям, а делали матчинг на то, нету ли чего-то похожего в базе как вот примерно в этом предполагаемом развитии парти.. я даже не уверен, что для этого нейросети нужны, можно матчить проще и эффективнее.

Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан
Re[2]: Компьютер выиграл в го у чемпиона
От: velkin Удмуртия http://blogs.rsdn.org/effective/
Дата: 24.03.16 17:28
Оценка:
Здравствуйте, __kot2, Вы писали:

__>вот создание абстрактного интеллекта, который не заточен на Го и при этом выигрывает в Го, учась на партиях — это был бы прорыв.


Это был бы уже не просто прорыв, от подобной технологии общество не хило так бы всколыхнуло.
Re[3]: Компьютер выиграл в го у чемпиона
От: __kot2  
Дата: 25.03.16 21:35
Оценка:
Здравствуйте, Evgeny.Panasyuk, Вы писали:
EP>Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан
ну а что на самом деле делает нейронная сеть?
она считает скалярные произведения сигнала с паттернами. она практически и делает паттерн матчинг.
Re[4]: Компьютер выиграл в го у чемпиона
От: Evgeny.Panasyuk Россия  
Дата: 26.03.16 05:41
Оценка:
Здравствуйте, __kot2, Вы писали:

EP>>Во время матча рассказывали что только нейронная сеть, вообще без всякого перебора, выигрывала у любителей уровня дан

__>ну а что на самом деле делает нейронная сеть?

Ещё раз, ты сказал что схема включает перебор. Я ответил что они проводили испытания в том числе схем без всякого перебора, в котором была только нейронная сеть, и эта нейронная сеть показала хороший результат — любительский уровень дан.
Это при том что перебор вариантов важен в Го — непреднамеренный тактический промах легко может обернуться проигрышем. Добавь сюда факт того что в средней игре сотни ходов и на многих из них происходят тактические схватки.

__>она считает скалярные произведения сигнала с паттернами. она практически и делает паттерн матчинг.


Да, там в основе свёрточная сеть, которая как раз хорошо распознаёт образы.
Re: Компьютер выиграл в го у чемпиона
От: xma  
Дата: 26.05.17 08:56
Оценка:
AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе

https://geektimes.ru/post/289479/

«Я думал, что я был близок к победе в середине игры, но AlphaGo думала по другому. Мне немного грустно и я сожалею, поскольку я думал, что играл очень хорошо», — заявил чемпион.


Цзе заявил о своем отказе играть с компьютером после завершения серии матчей с AlphaGo.

Re[2]: Компьютер выиграл в го у чемпиона
От: xma  
Дата: 26.05.17 08:58
Оценка:
Здравствуйте, xma, Вы писали:

xma>AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе


Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах.


https://tjournal.ru/44665-kitai-zapretil-smi-oglashat-rezultati-turnira-po-igre-go-mezhdu-chelovekom-i-algoritmom-google
Re[3]: Компьютер выиграл в го у чемпиона
От: Arsen.Shnurkov  
Дата: 26.05.17 12:04
Оценка: +1
xma>[q]Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира

Всё правильно сделали. Когда их самый мощный компьютер обыграет западную версию — тогда и опубликуют.
Re: Компьютер выиграл в го у чемпиона
От: alpha21264 СССР  
Дата: 26.05.17 12:34
Оценка:
Здравствуйте, ineaugh, Вы писали:

I>Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.


Мне кажется, или игра Го изначально хорошо приспособлена к нейронным сетям?

Течёт вода Кубань-реки куда велят большевики.
Re[2]: Компьютер выиграл в го у чемпиона
От: xma  
Дата: 26.05.17 13:22
Оценка:
Здравствуйте, alpha21264, Вы писали:

A>Здравствуйте, ineaugh, Вы писали:


I>>Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.


A>Мне кажется, или игра Го изначально хорошо приспособлена к нейронным сетям?


Когда этот ИИ напишет приложение которое всегда будет выигрывать у меня в го-бадук тогда и будем говорить интеллект это или как. А пока ещё самое сильное приложение человеков играет примерно как 3-й дан. И то на доске 9x9. А всё прочее сливает даже мне. (06.06.2011)

http://forum.ixbt.com/topic.cgi?id=64:3071:12#12

считалось, что программа, хорошо играющая в го, может быть создана только в далёком будущем и только с помощью накопленных к тому времени общих знаний в области искусственного интеллекта.

Wikipedia : Компьютерное го
Отредактировано 26.05.2017 13:24 xma . Предыдущая версия .
Re[3]: Компьютер выиграл в го у чемпиона
От: vsb Казахстан  
Дата: 26.05.17 13:36
Оценка:
Здравствуйте, xma, Вы писали:

xma>>AlphaGo выиграл второй из трех матчей с чемпионом мира по го Кэ Цзе


xma>

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах.


xma>https://tjournal.ru/44665-kitai-zapretil-smi-oglashat-rezultati-turnira-po-igre-go-mezhdu-chelovekom-i-algoritmom-google


Что за бред.
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.