От: | xma | ||
Дата: | 23.01.23 23:20 | ||
Оценка: |
подробнее | |
вообще, на английской википедии — больше информации про Leela Chess Zero, https://en.wikipedia.org/wiki/Leela_Chess_Zero
| |
идеи по оптимизации | |||||||
P.S.1: есть интересные идеи по оптимизации, короче интересная идея, чтобы Leela Chess Zero по мере самообучения впоследствии сама могла выбирать какие партии и с какой позиции тренировать доигрывание для своего усиления (чтобы сформировать максимально выигрышные стратегии глубокой игры, не тратя для этого лишнее время на "бесконечные" (условно) переборы начала партий) как вам идея ? вроде бы (но не точно) что то из этого в каком то виде даже реализовывалось (возможно частично) далее, комментарий revollwars:
думаю потому что как раз чего то вот такого и не хватает при самообучении, чтобы нейросеть могла скакать и перебирать (многократно переигрывая) наиболее опасные или выгодные участки (с её точки зрения) .. самообучение в AlphaZero LCZ на многократном переигрывании (доигрывании) эндшпилей вроде таки замутили — и тогда резко вырос рейтинг Elo у AI, но думаю что надо больше ковырять в эту сторону .. (а может и уже наковыряли, хз) P.S.2: ну и возможно есть резон с такой настройкой приоритетов — выбор стратегии на победу или на сдерживание (ничью), чтобы получать максимальный общий балл на соревнованиях (но возможно уже реализовано), чтобы лишний раз не рисковать ну и интересная идея, попробовать отдельно самообучать — игру белыми и чёрными .. всё таки там разный подход должен быть и чёрные во многом изначально в более проигрышной позиции чем белые (судя по результатам соревнований) P.S.3: вот кстате, возможно это и оно (изложенное в P.S.1) (начиная с предыдущей версии 0.29)
думаю что именно поэтому AlphaZero LCZ теперь и топчег из топчегов .. P.S.4: долго же до них доходила необходимость этого .. | |||||||