客服微信
13704817925
客服电话
新锐围棋网论坛 - Powered by Discuz!

 找回密码
 注册

微信扫码登录

QQ登录

只需一步,快速开始

购买新锐围棋网VIP大优惠!
查看: 3778|回复: 8

《AlphaGo-左右互搏50谱》(SGF版)

[复制链接]
发表于 2017-5-29 11:31:10 | 显示全部楼层 |阅读模式
新锐围棋网VIP购买限时大优惠
9090.jpg


AlphaGo用深度卷积神经网络(CNN)来训练价值网络和策略网络。棋盘规模是(19×19),棋盘每个位置编码48种经验特征。把这些特征输入模型进行训练,经过层层卷积,更多隐含特征会被利用。
基于类似的卷积神经网络结构,AlphaGo先做策略学习(学习如何下子),再做价值学习(学习评估局面)。策略学习也分为两步。第一步是有监督学习,即“打谱”,学习既往的人类棋谱。第二步是强化学习,即“左右互搏”,通过程序的自我博弈来发现能提高胜率的策略。
说“左右互搏”(强化学习)。这是在打谱的基础上,让不同下法的程序之间相互博弈。强化学习的策略网络和有监督学习(打谱)的网络结构一样,也同样利用梯度下降的学习方法。区别在于用一个“回报”(赢棋是1,输棋是-1)来奖励那些会导致最终获胜的策略。



AG vs AG 50局.zip (40.46 KB, 下载次数: 352, 售价: 9 枚锐币)

评分

参与人数 2威望 +40 锐币 +150 收起 理由
桔中仙 + 20
雪莲 + 20 + 150

查看全部评分

VIP栏目详细介绍(含资源下载)
发表于 2017-5-29 12:05:42 | 显示全部楼层
VIP栏目详细介绍(含资源下载)
为此贴配上图,漂亮!
回复

使用道具 举报

发表于 2017-5-29 17:34:05 | 显示全部楼层
不知道谁能认真分析讲解
回复

使用道具 举报

liuluo 该用户已被删除
发表于 2017-5-29 23:39:31 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2017-5-30 07:37:32 | 显示全部楼层
谢谢兄台,有心了
回复

使用道具 举报

发表于 2017-5-30 09:48:54 | 显示全部楼层
很多下法目前的棋手理解不了,怎么给你讲解!
回复

使用道具 举报

发表于 2017-5-30 20:35:43 | 显示全部楼层
感谢分享,纯属收藏。
回复

使用道具 举报

发表于 2017-6-23 10:44:02 | 显示全部楼层
感谢大家的分享。
回复

使用道具 举报

ocn500 该用户已被删除
发表于 2019-2-20 15:17:51 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表