近期看到AlphaGo算法最清晰的解读

  • 时间:
  • 浏览:0

AlphaGo面对当前局面,会用四种 (下面会讲)策略,本人和本人下。其所含四种 策略:往后下几步(提前终止,将会AlphaGo有一定判断形势的能力);或

模拟而是AlphaGo本人和本人下棋,大概棋手在脑袋中的推演,而是棋手说的“计算”。

作者:西楼,USC神经科学的PHD & 围棋业余4段

AlphaGo在面对当前棋局时,她会模拟(推演棋局)N次,选取“模拟”次数最多的走法,这而是AlphaGo认为的最优走法。

1. 啥是模拟?

最近DeepMind团队(google旗下)的AlphaGo(另有另另一个围棋的AI)以4:1战胜顶尖人类职业棋手李世石。她到底是为社 下棋的?

类式于图中,所有那么落子的地方也有将会下子的,但在模拟中,右下那步走了79%次, 就选那一步了,就那么简单。上端不想发现,“模拟”次数“最多”的走法而是统计上“最优”的走法。