Информация об изменениях

Сообщение Re[2]: Искусственный интеллект стал лучшим шахматистом мира от 07.12.2017 19:13

Изменено 09.12.2017 4:45 itmanager85

Re[2]: Искусственный интеллект стал лучшим шахматистом мира за 4 ч
Здравствуйте, namespace, Вы писали:

N>

N>В отличие от предыдущих программ DeepMind, AlphaZero создавался как алгоритм, способный научиться сразу нескольким задачам-играм, а не одной. Для этого алгоритм не обучали побеждать, а давали только базовые знания о правилах игры. AlphaZero затем играл сам с собой и самостоятельно вырабатывал тактику.

N>Перевожу на программерский язык: Они закодили правила, а затем запустили перебором найти все успешные варианты.
N>ИИ?
N>

действительно facepalm ты конечно же в курсе что перебрать все варианты в шахматах до конца — невозможно , и существует проблема объективной оценки "недоперебранных позиций" , с тем чтобы в отсутствии однозначной определённости сделать наиболее точную их оценку ?

так вот ,

AlphaZero searches just 80 thousand positions per second in chess and 40 thousand in shogi, compared to 70 million for Stockfish and 35 million for Elmo.


т.е. имея вычислительную производительность глубины ходов почти в 1000 раз меньше (у AlphaZero против Stockfish), ИИ тем не менее благодаря более точным своим оценкам "относительных позиций" выигрывает у более глубоко-переборного варианта в виде Stockfish ..

на некоторых форумах указывают что мол Stockfish играла не в полную силу , т.к.

"64 threads" — в два раза меньше от мощности. (хз чё это — прим.)
"with 40ms thinking time" — это в два раза больше от самого минимума Полная мощь — это thinking 5000!


а также что

Говорят и оперативки выделили мало (1ГБ) для такого количества потоков.

чтобы включить на заявленную эталонную мощность, там нужно терабайт


и что

Stockfish не мог пользоваться дебютной базой.

И без дебютной книги,эндшпильных баз,они вынуждены с нуля просчитывать позицию,в отличие от AlphaZero.


но так и AlphaZero училась всего 4 часа , а может ведь и месяц и если мощи не хватит даже после этого (в чём я сомневаюсь) — то можно было бы дополнительно также скормить "дебютной книги, эндшпильных баз"

но понятно конечно что тут фишка AlphaZero в том что она (за считанные часы) самостоятельно достигает результатов лучших чем всё человечество со всеми шахматными достижениями , в т.ч. написанными им самыми лучшими программами ..

ну и так к сведению ,

AlphaZero and the previous AlphaGo Zero used a single machine with 4 TPUs.


а при обучении ,

Training proceeded for 700,000 steps (mini-batches of size 4,096) starting from randomly initialised parameters, using 5,000 first-generation TPUs (15) to generate self-play games and 64 second-generation TPUs to train the neural networks.

Re[2]: Искусственный интеллект стал лучшим шахматистом мира
Здравствуйте, namespace, Вы писали:

N>

N>В отличие от предыдущих программ DeepMind, AlphaZero создавался как алгоритм, способный научиться сразу нескольким задачам-играм, а не одной. Для этого алгоритм не обучали побеждать, а давали только базовые знания о правилах игры. AlphaZero затем играл сам с собой и самостоятельно вырабатывал тактику.

N>Перевожу на программерский язык: Они закодили правила, а затем запустили перебором найти все успешные варианты.
N>ИИ?
N>

действительно facepalm ты конечно же в курсе что перебрать все варианты в шахматах до конца — невозможно , и существует проблема объективной оценки "недоперебранных позиций" , с тем чтобы в отсутствии однозначной определённости сделать наиболее точную их оценку ?

так вот ,

AlphaZero searches just 80 thousand positions per second in chess and 40 thousand in shogi, compared to 70 million for Stockfish and 35 million for Elmo.


т.е. имея вычислительную производительность глубины ходов почти в 1000 раз меньше (у AlphaZero против Stockfish), ИИ тем не менее благодаря более точным своим оценкам "относительных позиций" выигрывает у более глубоко-переборного варианта в виде Stockfish ..

на некоторых форумах указывают что мол Stockfish играла не в полную силу , т.к.

"64 threads" — в два раза меньше от мощности. (хз чё это — прим.)
"with 40ms thinking time" — это в два раза больше от самого минимума Полная мощь — это thinking 5000!


а также что

Говорят и оперативки выделили мало (1ГБ) для такого количества потоков.

чтобы включить на заявленную эталонную мощность, там нужно терабайт


и что

Stockfish не мог пользоваться дебютной базой.

И без дебютной книги,эндшпильных баз,они вынуждены с нуля просчитывать позицию,в отличие от AlphaZero.


но так и AlphaZero училась всего 4 часа , а может ведь и месяц и если мощи не хватит даже после этого (в чём я сомневаюсь) — то можно было бы дополнительно также скормить "дебютной книги, эндшпильных баз"

но понятно конечно что тут фишка AlphaZero в том что она (за считанные часы) самостоятельно достигает результатов лучших чем всё человечество со всеми шахматными достижениями , в т.ч. написанными им самыми лучшими программами ..

ну и так к сведению ,

AlphaZero and the previous AlphaGo Zero used a single machine with 4 TPUs.


а при обучении ,

Training proceeded for 700,000 steps (mini-batches of size 4,096) starting from randomly initialised parameters, using 5,000 first-generation TPUs (15) to generate self-play games and 64 second-generation TPUs to train the neural networks.