Здесь еще не было, а между тем это прорыв в ИИ-технологиях. AlphaGo, программа для игры в го, созданная в Google DeepMind, обыграла корейского чемпиона Ли Седола. Ли Седол — один из сильнейших игроков в мире. Сегодня была последняя игра в серии, итоговый счет 4:1.
Го до последнего времени трудно поддавался компьютерному анализу из-за большого числа возможных ходов, длинных партий и трудности оценки позиции. AlphaGo использует для оценки позиции глубокие нейронные сети, натренированные на базе игр профессиональных игроков и на играх между копиями AlphaGo. При тренировке использовалось обучение с подкреплением, и на мой взгляд это самое выдающееся достижение этой технологии.