请选择 进入手机版 | 继续访问电脑版

新锐围棋网

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

新锐围棋网VIP购买限时大优惠
查看: 1461|回复: 7

《AlphaGo-左右互搏50谱》(SGF版)

[复制链接]
发表于 2017-5-29 11:31:10 | 显示全部楼层 |阅读模式
新锐围棋网VIP购买限时大优惠
9090.jpg


AlphaGo用深度卷积神经网络(CNN)来训练价值网络和策略网络。棋盘规模是(19×19),棋盘每个位置编码48种经验特征。把这些特征输入模型进行训练,经过层层卷积,更多隐含特征会被利用。
基于类似的卷积神经网络结构,AlphaGo先做策略学习(学习如何下子),再做价值学习(学习评估局面)。策略学习也分为两步。第一步是有监督学习,即“打谱”,学习既往的人类棋谱。第二步是强化学习,即“左右互搏”,通过程序的自我博弈来发现能提高胜率的策略。
说“左右互搏”(强化学习)。这是在打谱的基础上,让不同下法的程序之间相互博弈。强化学习的策略网络和有监督学习(打谱)的网络结构一样,也同样利用梯度下降的学习方法。区别在于用一个“回报”(赢棋是1,输棋是-1)来奖励那些会导致最终获胜的策略。



AG vs AG 50局.zip (40.46 KB, 下载次数: 256, 售价: 9 枚锐币)

评分

参与人数 2威望 +40 锐币 +150 收起 理由
桔中仙 + 20
雪莲 + 20 + 150

查看全部评分

VIP栏目详细介绍(含资源下载)
发表于 2017-5-29 12:05:42 | 显示全部楼层
新锐围棋网VIP购买大优惠
为此贴配上图,漂亮!
回复 支持 反对

使用道具 举报

发表于 2017-5-29 17:34:05 | 显示全部楼层
不知道谁能认真分析讲解
回复 支持 反对

使用道具 举报

发表于 2017-5-29 23:39:31 | 显示全部楼层
这个也要锐币吗
回复 支持 反对

使用道具 举报

发表于 2017-5-30 07:37:32 | 显示全部楼层
谢谢兄台,有心了
回复 支持 反对

使用道具 举报

发表于 2017-5-30 09:48:54 | 显示全部楼层
很多下法目前的棋手理解不了,怎么给你讲解!
回复 支持 反对

使用道具 举报

发表于 2017-5-30 20:35:43 | 显示全部楼层
感谢分享,纯属收藏。
回复 支持 反对

使用道具 举报

发表于 2017-6-23 10:44:02 | 显示全部楼层
感谢大家的分享。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ通话
关闭
旺旺通话
客服中心
电话:13704817925
邮箱:点击此处
反馈:点击此处
客服中心
快速回复 返回顶部 返回列表