Здравствуйте, anonymouse2, Вы писали:
A>Может и ближе, но то что компьютеры выигрывают у людей в играх с четко формализованными правилами — вполне ожидаемый результат.
Ну... если брать японские правила, то они не очень и формальны
Здравствуйте, anonymouse2, Вы писали:
A>Это да. Думаю го менее популярная игра чем шахматы, ну и еще там вроде-бы количество переборов вариантов значительно больше.
Дело не в вариантах. Ситуация осложнялась отсутствием хорошей оценочной функции. В шахматах в любой момент можно остановиться, посчитать материал. Можно посчитать пешечную структуру, активность фигур, ... А в го так не сделаешь. Если остановился — считай территорию. А это процесс неформальный, требует оценки вариантов в йосе.
Здравствуйте, jazzer, Вы писали:
J>А может, это уже почти что тест Тьюринга? J>
J>I know AlphaGo is a computer, but if no one told me, maybe I would think the player was a little strange, but a very strong player, a real person.
Ну нейросети настраивали на партиях профи, ну и такое ощущение что по железу там должен быть большой кластер. В принципе мне было очевидно, что в го надо досчитывать до конца, остановиться в любой момент и посчитать оценку достаточно сложная задача. В принципе, человек должен адаптитоваться, если ему дать возможность поиграть достаточно количество партий. Можно будет нащупать слабые места, например, программа может себя неуютно чувствовать в тайся дзёсеси с большим обилием вариантов. Потом человек будет усиливать игру программы при игре по переписке. Потом когда-то наступит современная шахматная эра, когда человек почти не в состоянии улучшить игру программы.
'несу свет' @ Yoriсk
Y>Я не спрашивал, чем эта программа так засечательна, я спрашивал, какая разница, обыграла она вообще всех или она обыграла всех, но остался один мутант, которого она не смогла.
Это важный майлстон
1 для науки — остался не один человек, а собтсвенно профессиональные игроки. Тот, кого обыграла софтина, по факту сильный любитель, ибо турнир — любительский. Из профов там те, кто в важнейших турнирах не выступает.
То есть, принципиальный вопрос, а может ли комп убедительно порвать человека пока еще не решен.
2 для авторов программы. как только она обыграет в реальном турнире настоящего дейтсвующего профи, а не 'чемпиона европы', то авторы получат конскую премию
3 для сообщества игроков, коих очень много — минимум десятки миллионов по самой скромной оценке. Как только софтина обыграет настоящего профа, игровой бизнес резко изменится, как это произошло с шахматами
TD-Gammon was a computer backgammon program developed in 1992 by Gerald Tesauro at IBM's Thomas J. Watson Research Center. Its name comes from the fact that it is an artificial neural net trained by a form of temporal-difference learning, specifically TD-lambda.
TD-Gammon achieved a level of play just slightly below that of the top human backgammon players of the time. It explored strategies that humans had not pursued and led to advances in the theory of correct backgammon play.
Здравствуйте, Don Reba, Вы писали:
I>>Спасибо, капитан. И вот через 40 лет этот лёрнинг начал выдавать действительно внятные результаты.
DR>https://en.wikipedia.org/wiki/TD-Gammon
А еще комп в крестики-нолики не проигрывает, ога !
Здравствуйте, Ikemefula, Вы писали:
Y>>Вы с кем сейчас разговаривали? I>'несу свет' @ Yoriсk
А, сами с собой, я так и подумал.
I>То есть, принципиальный вопрос, а может ли комп убедительно порвать человека пока еще не решен.
Этот вопрос важен, потому что принципиален. А принципиален потому что важен.
Машина убедительно "рвёт" любого человека, за исключением одного(или даже десяти). Т.е. вопрос решен полностью, победа над этими полуторами небожителями имеет чисто эстетическое значение.
I>3 для сообщества игроков, коих очень много — минимум десятки миллионов по самой скромной оценке. Как только софтина обыграет настоящего профа, игровой бизнес резко изменится, как это произошло с шахматами
С шахматами ничего не произошло. И с Го ничего не произойдёт, т.к., как я сказал с самого начала, машина уже победила "сообщество".
Единственный эффект от Блу Дип — аршинные заголовки в газетах. Ну вот и тут так будет, только заголовки поменьше, потому как у Го пиар не тот.
Здравствуйте, Yoriсk, Вы писали:
I>>3 для сообщества игроков, коих очень много — минимум десятки миллионов по самой скромной оценке. Как только софтина обыграет настоящего профа, игровой бизнес резко изменится, как это произошло с шахматами
А что произошло с шахматами? Вроде люди как играли друг с другом, так и играют?
Y>Единственный эффект от Блу Дип — аршинные заголовки в газетах. Ну вот и тут так будет, только заголовки поменьше, потому как у Го пиар не тот.
Вот тут не могу согласиться. Блу Дип — действительно, слишком заточен под шахматы, фактически брутфорс, так что эффект от него для CS был околонулевой.
А здесь применены реально использующиеся в других областях подходы, и наверняка чего-нть нового интересного накопали именно в области применения и реализации и сопряжения (у них же несколько сетей работают вместе). Так что это вполне себе результат с последствиями, имхо.
Здравствуйте, jazzer, Вы писали:
J>А здесь применены реально использующиеся в других областях подходы, и наверняка чего-нть нового интересного накопали именно в области применения и реализации и сопряжения (у них же несколько сетей работают вместе). Так что это вполне себе результат с последствиями, имхо.
Если прочитать статью, там вcё те же приёмы использования MCTS с нейронными сетями, что применялись для Го на протяжении последнего десятилетия, только теперь с популярными нынче конволюционными сетями и месяцем обучения их на 50 GPU.
Здравствуйте, Yoriсk, Вы писали:
Y>Этот вопрос важен, потому что принципиален. А принципиален потому что важен. Y>Машина убедительно "рвёт" любого человека, за исключением одного(или даже десяти). Т.е. вопрос решен полностью, победа над этими полуторами небожителями имеет чисто эстетическое значение.
Эти люди играют классом другим сильнее чемпиона европы. В интернет-играх они таким чемпионам дают фору.
Это принциальный вопрос — может ли компьютнр заменить человека или нет. Готов ли заменить или нет.
Весь искусственный интеллект целиком про это.
I>>3 для сообщества игроков, коих очень много — минимум десятки миллионов по самой скромной оценке. Как только софтина обыграет настоящего профа, игровой бизнес резко изменится, как это произошло с шахматами
Y>С шахматами ничего не произошло. И с Го ничего не произойдёт, т.к., как я сказал с самого начала, машина уже победила "сообщество".
Наоборот. С шахматами произошло много всего — компьютер, а не человек стал эталоном. Отсюда ясно, что даже поход в туалет становится проблематичным.
Y>Единственный эффект от Блу Дип — аршинные заголовки в газетах. Ну вот и тут так будет, только заголовки поменьше, потому как у Го пиар не тот.
В азии игра го имеет столько поклонников, сколько шахматистам в лучшие годы не снилось
Здравствуйте, Don Reba, Вы писали:
DR>Здравствуйте, jazzer, Вы писали:
J>>А здесь применены реально использующиеся в других областях подходы, и наверняка чего-нть нового интересного накопали именно в области применения и реализации и сопряжения (у них же несколько сетей работают вместе). Так что это вполне себе результат с последствиями, имхо.
DR>Если прочитать статью, там вcё те же приёмы использования MCTS с нейронными сетями, что применялись для Го на протяжении последнего десятилетия, только теперь с популярными нынче конволюционными сетями и месяцем обучения их на 50 GPU.
Насколько я знаю, конволюционные сети не применялись раньше для игр.
Они применялись для распознавания картинок, и если бы мне кто-то сказал, что ее собираются применить для Го, я бы покрутил пальцем у виска — так как в картинке можно инвертировать пиксел или сдвинуть чть-нть и результат не изменится, в то время как в Го замена одного камня с черного на белый может перевернуть ситуацию на доске полностью.
Так что это довольно важный результат, имхо, и надо ждать новых неожиданных и при этом успешных применений конволюционных сетей.
Особенно если вспомнить слова Хинтона (которые до жути напоминают аналогичные слова Эйнштейна про квантовую механику):
The pooling operation used in convolutional neural networks is a big mistake and the fact that it works so well is a disaster.
PS Википедия уже приводит пример использования конволюционных сетей для поиска лекарств.
Здравствуйте, jazzer, Вы писали:
J>Насколько я знаю, конволюционные сети не применялись раньше для игр. J>Они применялись для распознавания картинок, и если бы мне кто-то сказал, что ее собираются применить для Го, я бы покрутил пальцем у виска — так как в картинке можно инвертировать пиксел или сдвинуть чть-нть и результат не изменится, в то время как в Го замена одного камня с черного на белый может перевернуть ситуацию на доске полностью.
В последние несколько лет их применяют для всего, для игр, распознавания речи, NLP, итд. В данном случае, сеть работает не над изображением игры, а над 19x19 матрице состоящей из флагов, как то: сколько степеней свободы у позиции: 1,2,...7,≥8, сколько ходов прошло, является ли позиция валидной и прочих.
J>Так что это довольно важный результат, имхо, и надо ждать новых неожиданных и при этом успешных применений конволюционных сетей. J>Особенно если вспомнить слова Хинтона (которые до жути напоминают аналогичные слова Эйнштейна про квантовую механику): J>
J>The pooling operation used in convolutional neural networks is a big mistake and the fact that it works so well is a disaster.
Здравствуйте, Don Reba, Вы писали:
DR>В последние несколько лет их применяют для всего, для игр, распознавания речи, NLP, итд. В данном случае, сеть работает не над изображением игры, а над 19x19 матрице состоящей из флагов, как то: сколько степеней свободы у позиции: 1,2,...7,≥8, сколько ходов прошло, является ли позиция валидной и прочих.
Для го это не сильно принципиально. Нет разницы, сколько ходов прошло, 100 или 200. Невалидные позиции детектятся до смешного простой логикой, их проще отфильтровать нежели тренировать сеть на такой фокус. Степени свободы у позиции тоже имеет мало смысла, в отличие от шахмат. Скажем, в конце возможных ходов почти так же много, как и в начале.
J>Сингулярность все ближе?
неизвестно.
J>А может, это уже почти что тест Тьюринга?
не понимаю, что на этот тест все так внимания обращают. софистика жеж , не более. я уверен, большая часть кывтовцев , включая меня , с треском проиграет в го, этим чемпионам. и что теперь, все мы машины? я кстати больше верю не в создание ИИ, а в создание усилителей интеллекта. в принципе такие уже есть. тот же интернет.
Здравствуйте, BrainSlug, Вы писали:
BS>не понимаю, что на этот тест все так внимания обращают. софистика жеж , не более. я уверен, большая часть кывтовцев , включая меня , с треском проиграет в го, этим чемпионам.
Не 'большая' а все поголовно. Разве что кто нибудь из азиатских профессионалов выучит русский язык, прочитает книгу по JavaScript и будет сидеть в форуме Политика
Здравствуйте, BrainSlug, Вы писали:
J>>А может, это уже почти что тест Тьюринга? BS>не понимаю, что на этот тест все так внимания обращают. софистика жеж , не более. я уверен, большая часть кывтовцев , включая меня , с треском проиграет в го, этим чемпионам. и что теперь, все мы машины?
Нет, тест Тьюринга тут не в том, что машина обыграла человека, а в том, что человек охарактеризовал игру машины как человеческую (см. цитату в самом начале).
BS>я кстати больше верю не в создание ИИ, а в создание усилителей интеллекта. в принципе такие уже есть. тот же интернет.
Интернет — это, скорее, усилитель памяти, да и то не очень (в этом смысле обычная бумажная энциклопедия — тоже усилитель интеллекта).
J>Нет, тест Тьюринга тут не в том, что машина обыграла человека, а в том, что человек охарактеризовал игру машины как человеческую (см. цитату в самом начале).
это я понимаю. поэтому и пишу, что тест Тьюринга довольно слабый аргумент был, есть и будет. я (и любой человек при желании) не пройти тест Тьюринга специально. тест Тьюринга это тест на симуляцию. есть некоторая разница все же между симуляцией(и то , довольно субъективной симуляцией, поскольку одному покажется одно, а другому покажется что-то иное) и моделированием. я уверен , (поскольку я слабый игрок, почти не игрок, в Го, я играл наверное пару раз в Го за всю жизнь от силы) что мою игру профи оценили бы как бессмысленную.
Насчет интернета. Не думаю, что только память. Тут опять же, что понимать под словом усилитель. С моей точки и калькулятор некий простейший усилитель. Т.е. нечто , что помогает решать задачи быстрее, эффективнее, а возможно и решать те задачи, которые ранее решить не мог. К примеру, обладая навыками программирования, но не зная предметов как например теор.вер. или комбинаторику, можно решать простейшие задачи, обычным перебором. Просто в уме это сделать не представляется возможным за приемлемое время. Это простейший пример. А если брать какие-нибудь научные работы по физике, так там давно уже используют мат. пакеты для расчетов там, где сделать это аналитически либо невозможно, либо невозможно за приемлемое время. Поэтому мне кажется эволюция таких вещей как программы , побеждающие в Го человека, это скорее эволюция инструментов, а не ИИ. Это программист этой программы + сама программа как инструмент победили мастеров. (что касается человеческого поведения. Человеческое поведение это послать своего владельца нафиг, поскольку побеждать за бесплатно профи в игре в Го, это довольно странно. Понятно, что мне возразят, что типа это все человеческие понятия, — “бесплатно”, “работа”. Ну так и в этом и состоит проблема. В создании некоего механизма, который обучался бы полю понятий, понимал бы поле понятий, перерабатывал и создавал производные поля понятий. Причем именно в контексте тех понятий, что способны понимать мы. В противном случае понимание является ли данный объект ИИ – разумным или нет, лежит вне нашей плоскости понимания. Камень тоже может быть разумным. Однако ж мы не способны это проверить, коль скоро производные его жизнедеятельности за пределами тех понятий, что нами принято считать разумными. )