客服微信
13704817925
客服电话
新锐围棋网论坛 - Powered by Discuz!

 找回密码
 注册

微信扫码登录

QQ登录

只需一步,快速开始

购买新锐围棋网VIP大优惠!
查看: 4094|回复: 11

有没有详细介绍各种AI的帖子?

[复制链接]
AlexLi 该用户已被删除
发表于 2018-8-11 15:12:07 | 显示全部楼层 |阅读模式
VIP栏目详细介绍(含资源下载)
发表于 2018-8-13 11:03:17 | 显示全部楼层
VIP栏目详细介绍(含资源下载)
最强国产围棋AI“凤凰狗”正式开源,单块GPU就能对弈职业九段

那个新晋国产最强围棋AI——PhoenixGo(凤凰狗),正式开源了。
  由微信翻译团队课余打造,初出茅庐便在福州2018人工智能围棋大赛上击败绝艺夺冠,PhoenixGo备受关注、风头正劲。
  但就在昨天(5月11日),微信团队决定将其正式开源,这也是国内首个开源的围棋AI项目。
微信团队方面称,经过了一周多时间的筹备,PhoenixGo完成对弈源码和一个20 block模型的开源。
  这份源码和模型可以在单块GPU上提供强职业棋手的棋力,在单机多卡和多机多卡的系统上具有远超人类棋手的水平。
  PhoenixGo在野狐围棋平台上的帐号“金毛”,运行于1块性能与GTX 1080 Ti性能接近的Tesla P40上,对人类棋手具有非常高的胜率,取得了200多场连胜的战绩,并在同厂德比中击败绝艺夺冠。
  开源可降低过招门槛
  微信团队解释称,之所以选择开源,是因为可以让行业内其他研究者可以在此基础上继续探索围棋AI的奥秘,帮助棋手更方便地研究围棋AI的棋路,也为了众多围棋爱好者在家用普通电脑上可以享受和职业九段交锋的乐趣。
  虽然PhoenixGo之打造,主要是复现了AlphaGo Zero论文,但一个好的围棋AI,需要算法、工程实现、计算资源三者结合。目前围棋AI已经有了优秀的公开算法,但同时拥有良好工程实现和大量计算资源,并不是一件容易的事。
  所以PhoenixGo开源,能够达到单块GPU就能拥有强棋力水平,并不轻而易举。
  腾讯开源思路
  当然,微信方面也强调,这也是腾讯“开放”战略的体现。
  此前腾讯在技术开源方面也动作频频,今年3月,腾讯还因为在AI开源领域的卓越技术影响力受邀成为LF深度学习基金会初始白金会员,该基金会将专注于支持和维护在人工智能领域的开源创新。
  截至目前,腾讯正式发布的开源项目共计52个,其中微信共开放开源项目22个。
回复

使用道具 举报

发表于 2018-8-13 11:04:54 | 显示全部楼层
世界三大围棋AI身世大起底 究竟哪只狗最厉害?

  北京时间3月26日,第五届日本围棋电圣战在东京结束,下午进行的第二场比赛,来自中国的围棋AI绝艺执黑中盘胜日本超新星一力辽七段,加上上午来 自日本的DeepZenGo执白中盘胜一力辽,AI围棋以2-0结束了本次人机大战。英国的AlphaGo、中国的绝艺、日本的DeepZenGo,被公 认为目前世界上三大最优秀的围棋AI,下面我们就来揭开他们神秘的面纱,告诉广大读者这三只狗的不同来源。

  阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯-哈萨比斯、大卫-席尔瓦、黄士杰与他们的团队开发。其主要工作原理是“深度学习”。

  研发成本:大约5000万美元。

  硬件:拥有有1920个CPU和280个GPU。

  研发者棋力:哈萨比斯(业余初段)、黄世杰(业余6段) 该团队还有多名懂围棋的业余高手。

  研发AlphaGo后,DeepMind公司被谷歌以DeepMind公司以6.3亿美元收购。

  发 展脉络:2016年3月,AlphaGo与人类棋手李世石进行人机大战,以4-1取胜,轰动整个人类世界。随后DeepMind公司公布的计算方式,走棋 网络(Policy Network)、快速走子(Fast rollout)估值网络(Value Network)、蒙特卡洛树搜索(Monte Carlo Tree Search)迅速被围棋AI研究同行克隆。

//s3.pfp.sina.net/ea/ad/1/11/02b65704107bea9105271601e5fac7b7.jpg
世界三大围棋AI身世大起底 究竟哪只狗最厉害?
2017年03月27日16:38 新浪体育 微博 分享 |评论929
李世石对AlphaGo
  文章来源:今日头条 原创 牛掰NewsBA

  北京时间3月26日,第五届日本围棋电圣战在东京结束,下午进行的第二场比赛,来自中国的围棋AI绝艺执黑中盘胜日本超新星一力辽七段,加上上午来 自日本的DeepZenGo执白中盘胜一力辽,AI围棋以2-0结束了本次人机大战。英国的AlphaGo、中国的绝艺、日本的DeepZenGo,被公 认为目前世界上三大最优秀的围棋AI,下面我们就来揭开他们神秘的面纱,告诉广大读者这三只狗的不同来源。

  阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯-哈萨比斯、大卫-席尔瓦、黄士杰与他们的团队开发。其主要工作原理是“深度学习”。

  研发成本:大约5000万美元。

  硬件:拥有有1920个CPU和280个GPU。

  研发者棋力:哈萨比斯(业余初段)、黄世杰(业余6段) 该团队还有多名懂围棋的业余高手。

  研发AlphaGo后,DeepMind公司被谷歌以DeepMind公司以6.3亿美元收购。

  发 展脉络:2016年3月,AlphaGo与人类棋手李世石进行人机大战,以4-1取胜,轰动整个人类世界。随后DeepMind公司公布的计算方式,走棋 网络(Policy Network)、快速走子(Fast rollout)估值网络(Value Network)、蒙特卡洛树搜索(Monte Carlo Tree Search)迅速被围棋AI研究同行克隆。

二、DeepZenGo二、DeepZenGo
  DeepZenGo 的前身Zen享誉棋界多年,是AI围棋的代表,在AlphaGo横空出世之前,Zen是最强AI围棋之一。经过近一年的努力,Zen的升级版 DeepZenGo的实力也突飞猛进。去年11月的第二届日本围棋电王战第二局,DeepZenGo屠龙大胜“不老传说”赵治勋,虽然最终总比分1-2落 败,但已经能分先与强九段抗衡。

  研发成本:56万元人民币

  硬件:CPU和GPU数量不及AlphaGo1/10。(总价值不约10万人民币)

  研发者棋力:加藤英树(围棋爱好者 业余高手)

  发展脉络:加藤英树教授对围棋AI的研究超过10年时间,但受困于经费紧张,他的团队一直人数都很少,这次能达到世界围棋AI三强,也是借鉴了AlphaGo不少新的思路和算法。

  2016年“人机大战”后中国互联网巨头腾讯成立研发团队,全面山寨AlphaGo,靠着巨大的投入,以及与中国棋院众多人类围棋世界冠军的内部网络测试进步。

  研发成本:光购买相关硬件设备就超过6000万人民币。深圳建立13人团队,中投入超过1亿人民币。

  硬件:与AlphaGo配置不相上下。

  研发者棋力:项目负责人刘永升(不懂围棋,从去年3月才开始学),项目研发人员几乎都不懂围棋,均是从头学。聘请罗洗河九段参与研发,罗洗河也参与写代码。

  发展脉络:腾讯依靠自身的财大气粗投入巨大资金搞开发,这次到日本参加UEC杯以及电圣杯,原理同样是将比赛同步数据传输回深圳总部,靠分布式多机联网完成比赛决策。

  简 单地说,绝艺团队就是大量金钱堆出来的,反应了中国经济目前浮躁、资本粗暴决定一切的现状,基本是一群不懂围棋的人在运作项目团队;DeepZenGo船 小投入少,但DeepZenGo成长到今天,非常贴切地体现了日本这个民族的匠人精神;AlphaGo的研发和崛起,体现了人类智慧在人工智能方面的最高 境界。谷歌已经开始尝试让AlphaGo在医疗、网络安全等更广泛的领域进行新的探索。
回复

使用道具 举报

发表于 2018-8-13 11:09:39 | 显示全部楼层
国产最牛围棋AI进化史 如开"写轮眼"13连斩柯洁

3月18、19日两天,第10届UEC杯世界电脑围棋锦标赛在日本拉开帷幕。本次比赛受到的关注远超往届,不光是爱好者,连职业围棋界都对这次比赛倾注了极大的热情,在各大平台解说这次比赛。这其中一个重要的原因就是一款叫绝艺(英文名:Fine Art)的软件代表中国参与了这次计算机围棋界的盛会,而绝艺在比赛中也不负众望,以压倒性的优势全胜夺冠,展现了统治级的实力,绝艺究竟是什么来头呢?

绝艺诞生的理论源头

说绝艺就不能不提之前在人机大战中大出风头的alphago(升级版叫master)以及其背后的谷歌deepmind团队。Deepmind团队于2016年1月28日在《自然》杂志上以封面文章的形式公开alphago的运作原理(基于蒙特卡洛算法,结合深度学习技术训练出策略网络与价值网络,基于两个网络的加权评分进行行棋),并附上5:0战胜欧洲冠军樊辉二段的棋谱证明其方法的有效性,在结尾更是透露出将于3月份与过去十年的传奇棋手李世石进行分先五番棋对抗。这个消息不光震惊了围棋界,也震惊了从事计算机围棋研究的团体和个人。3月9日-15日,alphago以4:1的压倒优势战胜李世石之后,deepmind发表在《自然》杂志上的论文得到了最强有力的验证,立刻成为计算机围棋领域的圣典,堪比至高武学秘籍九阴真经在江湖中的地位。而各位有志于计算机围棋研究的机构和个人,纷纷对照真经展开了或公开或秘密的研究,以期神功大成,包括中国的公司。
中国某互联网公司有写轮眼这一特长---即复制他人已有的成功经验,功力之强可谓无人能出其右。经过评估,认为此“九阴真经”可靠,神功可成,于是正式立项、组织资源,开始了神功修炼的过程。客观来讲,deepmind公布的九阴真经(深度学习方法)在原理上不是很艰深,但是修炼这套心法有个重大前提,就是训练资源一定要足够。因为这套心法入门之后主要通过海量的左右互搏自我训练来提升水平,比如alphago自我对弈训练了几千万盘才达到可以4:1李世石的程度,又自我对弈了上亿盘才达到对职业顶尖60:0的水平。海量的自我对弈训练意味着海量的硬件资源投入,据facebook的田渊栋博士一次偶然的机会与alphago的第一作者黄士杰博士的交流可知,deepmind团队在训练alphago时光投入的GPU(显卡)就数以万计。根据谷歌自己提供的信息,为了训练出更强大的alphago,谷歌甚至开发了专门用于alphago的高性能显卡TPU,再加上为了这个项目组建的科研团队的开销,一句话,非大富大贵,九阴真经放在你面前你也练不了。但中国的互联网公司,说缺啥也不缺钱,这份九阴真经练起来那真是如鱼得水。

初试锋芒:突破业余水准,达职业级水平

根据绝艺在野狐网对弈自行公开的历程,在绝艺初试锋芒阶段,共使用了三个马甲,分别是虎虎有生气、野狐扫地僧与天下无狗。
2016年7月28日,绝艺的第一个马甲:虎虎有生气以野狐9D的身份现身网棋世界,开始了第一轮的内测。这一轮内测持续了一个多月,绝艺取得了37胜19负的成绩,赢对手主要是9D中的业余高手,对职业棋手还处于明显的下风,比如对阵无痕(著名女棋手於之莹)、张学斌等职业棋手均以失败告终。值得一提的是,这一时期虎虎有生气和当时另外一个国产围棋程序中华土狗交手多次,取得压倒性优势,说明绝艺在这一时期已超越了其他国产围棋AI。
绝艺的第二个马甲叫野狐扫地僧,这个马甲之前叫扫地僧2016,于9月6日改成现在的名字。这个马甲在9D的战绩是38胜17负,和上一个相比提升不大,但对手的含金量有所不同,这个马甲已经可以和三线职业选手互有输赢,显示了一定的进步。
绝艺的第三个马甲叫天下无狗,其活动时间是10月下旬,胜率达到90%,对手实力未知,因为野狐网上已经删除了其全部对局记录。这一时期或是绝艺实力的一个突破期,所以它不愿意留下这一时期的记录也合情合理。
在这一阶段,绝艺突破了业余水准,达到了职业级的水平,可以说在网络世界初试锋芒。

亮出身份:快棋赛人类已难抗衡

这一阶段绝艺这个账号终于登场,过程中穿插了刑天、骊龙这两个上古神话中的角色作为马甲进行客串。
绝艺的初登场是在11月1日。整个11月,绝艺下了197盘棋,可谓不知疲倦,对手从一开始的二、三线职业,随着胜率提高吸引越来越多的一线职业与之交手,比较著名的案例发生在11月28日,当晚韩国第一人朴廷桓在20秒一步的快棋中连续败给绝艺5盘,引起轰动效应。这一阶段绝艺可以说完成了从一般职业棋手到顶级职业棋手在快棋领域的突破,这以后基本上没有职业棋手能在20秒一步的快棋中赢绝艺了。11月30日后,绝艺悄然隐去闭关修炼,再次上线已经是2017年的事情。
12月27日一个叫刑天的账号出现引起了众人的关注,一出现就对职业棋手豪取18连胜,这个帐号最终战绩是38胜7负,对手主要是一线顶级职业,对局时长也由20秒提升到30秒。朴廷桓继续悲剧,被打了一个1:4。值得一提的是柯洁在刑天面前也以2:6落入下风。刑天在野狐只露面了5天,1月2号以后就销声匿迹,在当时引起了诸多猜测。
刑天消失之后,一个叫骊龙的账号进入了大家的视野,其实骊龙账号建立的历史可以追溯到2016年11月,基本与绝艺同时建立,而且是从3段开始打到9段,所以一开始大家也没把这个帐号往AI的方向想。但是随着1月份刑天消失后,骊龙立刻上线卡位,以惊人的胜率继续虐杀一众职业高手,大家才明白过来这个帐号的背后不是人类。骊龙在9D阶段的对手基本都是顶级棋手,在1月到2月初取得151胜27负的惊人战绩,而对局用时也基本为30秒一步。这一阶段意味着人类在30秒一步的快棋中已经很难抗衡绝艺。


超越人类:成野狐网首个10段,13连斩柯洁

春节过后,绝艺本尊重现江湖,经过2个月的修炼,这个时候的绝艺强大到令人绝望:30秒一步的棋胜率高达90%以上,到了2月下旬职业高手开始跟绝艺进行60秒一步的较量,但仍然胜少负多,整个2、3月份绝艺对金银冠选手胜率超过85%,并以近20盘对金银冠选手90%胜率成为野狐网的第一个10段。值得一提的是柯洁在这一时期被绝艺连赢13盘,其中6盘棋在60秒一步的条件下仍然败北。这一阶段标志着绝艺的水平超过了人类顶尖高手。
从2016年9月达到职业棋手水平到2017年3月超过职业顶级棋手水平,绝艺完美的再现了alphago的成长路径,复现了alphago的学术成果,中国互联网公司的“山寨”能力可见一斑。

一鸣惊人:UEC杯吊打日本最牛AI

文章最开始提到,deepmind公开发表了九阴真经之后,开始修炼绝世神功的计算机围棋软件不止绝艺一家,那究竟谁才是alphago的最优秀徒弟呢?计算机围棋界有一项传统大赛,叫UEC杯计算机围棋世界锦标赛,由日本主办,堪称计算机围棋界的华山论剑,到今年已经是第10届。借着这个平台,各路软件程序可以互相切磋验证修炼心得,绝艺也报名参加了本届UEC杯,并被视为头号夺冠热门。绝艺最大的对手是老牌计算机围棋劲旅,在计算机围棋界叱咤风云多年的日本软件ZEN(中文含义是禅)。Deepmind发表九阴真经后,ZEN带艺投身拜入alphago门下,改名deepzen go,并得到日本本土IT企业提供资金支持,开始修炼真经,并于2016年底登陆各大对弈平台,对普通职业棋手取得了优异的成绩。

在3月18日的预赛中,前6轮比赛绝艺和Deepzen分别势如破竹,以摧枯拉朽之势取得6连胜。第7轮两强相遇,万众瞩目。绝艺在和Deepzen的正面对决中,无论是全局判断还是局部战斗,都展现了高人一筹的实力,最终执白178手中盘完胜对手。在3月19日的决赛中 面对调试以后的ZEN 绝艺再次发挥出了高超的水准 在中盘右上角下出了连环手筋 一举打穿了ZEN的大本营中盘胜出。
挑战师门?
绝艺以完胜姿态取得UEC杯冠军后,前方剩下的对手只有一个,就是深度学习门派的祖师爷,大名鼎鼎的alphago。绝艺到底达到了什么功力?有一种说法是“相当于对战李世石的V18版AlphaGo”,但事实究竟如何,或许只有双方来一次“机机大战”才有定论——有一点可以肯定的是,如果此战能成,这既是4000年围棋历史上最高水准的巅峰对决,也是中美两大顶级IT业巨头的正面较量。
回复

使用道具 举报

发表于 2018-8-13 11:14:11 | 显示全部楼层
浅谈人工智能



历史     

   各个文明中都有杰出的工匠发明了自动机器来代替人类劳动,早在春秋时期鲁班就发明了世界上第一个机器人,可在空中飞翔‘三日不下’;三国时期蜀汉的诸葛亮发明了‘木牛流马’来运送战备物资,称得上是最早的军用机器人;古希腊人希罗发明了世界上第一部蒸汽机......可见,自古以来人类就渴望通过自动机器来解放劳动,但前期的发展只是减少了简单的体力劳动,十九世纪中叶人工智能思想的出现使机器转向复杂体力劳动和脑力劳动的发展。1950年阿兰.图灵在一片划时代的论文《计算机器与智能》中给出了人工智能的定义,并发明了图灵测试来检验智能。1956年的夏天一场在美国达特茅斯大学召开的学术会议上肯定了由麦卡锡提出的新术语:人工智能,这标志着人工智能作为一门学科正式出现。

    人工智能发展自其诞生起大致可以分为两个阶段。第一阶段主要是研究人的认知与思维过程并将其机械化,使计算机可以模拟人的思考过程,即机械化推理又或形式推理。对于形式推理我国古代,古希腊与公元前一千年就有所研究,并对后世思维过程产生了重大的影响,推动了亚里士多德的三段论与归纳法。十七世纪德国数学家和哲学家莱布尼兹认为一切现实事件都可以通过物理符号将其逻辑化并进行推理,即‘万能符号’理论,这为数理逻辑发展奠定了基础,也是第一阶段人工智能思想的萌芽。但是人们渐渐发现基于模拟人类思维过程的人工智能应用范围很小,只能解决一些简单的问题,一旦超出范围或复杂度高一些机器就无能为力了,这使人工智能迎来第一次沉默期。

    第二阶段也就是我们现在所处的阶段,不再强调模拟人的思维过程进行逻辑推理,而是基于统计学原理,利用智能算法在海量数据的基础上寻找规律并实现机器的监督学习。在人工智能迎来第一次发展低谷时,基于专业知识库的专家系统和以分布存储并行处理为核心的人工神经网络为人工智能迎来发展高峰期,但由于机器的计算能力差,成本太高,个人电脑开始走进各个家庭等原因使人工智能的发展再次进入冬眠期。如今,随着摩尔定律的不断印证,计算机计算性能大幅度提升,人工智能飞速发展一路高歌猛进,早已悄无声息地渗透进各行各业。

现状发展(成果,相关研究方向)

    我们应理性的认识到人工智能的发展是一项长期的工作,绝非一朝一夕可以达成的,这需要持久的努力。

    人工智能就是研究如何让机器能像人类一样去思考,去行动,甚至远超人类,最终目的就是让其服务于人类,将人们从劳动中解放出来,正如google倡导的,先解决智能问题,然后用智能解决一切问题。按照智能算法,基于海量数据,大量实际运行经验和高性能运算、存储能力来做出最优决策,以此解决人们特定的问题,就是现阶段最为广泛的AI。总的来说制造人工智能的出发点就是帮助人们解决问题,所以我个人认为搜索引擎是目前来说最智能的机器,无论你有没有用过无人驾驶,深度学习等人工智能解决问题,但在日常生活中你一定经常用搜索引擎解决问题,而根据你每一次输入的问题,帮你解决问题的结果,‘它‘积累了越来越多的数据,正变得越来越聪明。我们也可以把每次搜索,当作一次提问,而每一次根据你自己找到的结果,根据回答你’提问‘的过程,这个‘专家’变得越来越有智慧。所以,我认为以后搜索引擎要做的大的发展方向不再是搜索即得一大堆的网页链接排行,而是搜索即得结果,直接就是我们想要的结果,精准搜索,由搜索引擎帮助我们筛选结果,直接省去用户自己寻找结果的过程,然后根据每一次解决问题的优劣,更加精确地完善搜索引擎。即使搜索引擎无法达到这样的精准度,也必须有一项技术来达到这一目的,因为如果要向强人工智发展的话,这种解决问题的能力必须具备,而就目前来看最有这种潜力的就是搜索引擎。能如果一直是搜索即得网页链接的形式解决问题,不做出改进,那么即使越来越完善,也只是表面上的,并不能进一步解决问题,只能使搜索引擎滞留在较低量级的智能。当我们不知道该怎么‘提问’或者输入了模糊的关键字,搜索引擎也应该可以辅助用户搜索,列出可能的搜索清单,但不应仅是简单的帮助用户补充、完整搜索的关键字,更应是能真正‘猜测’到用户可能的需求,可能要解决的问题。更像是一个更庞大、更智能的专家系统,能根据用户的实际情况提出相应的解决方案。这不仅仅需要研发人员的努力,还需要广大用户的分享,愿意把更有价值的知识放到网络上,愿意帮别人解决问题,使这个庞大的专家系统拥有越来越多的知识。当然,这肯定需要一点点推广,因为这样的搜索引擎前期的答案一定不能让我们满意,只有先让小众慢慢完善,再推向大众,然后在解决更多问题的过程中快速完善自身,又或者在前期先试着直接给出用户想要的结果,然后给出网页和‘结果‘的混合方案。然后再慢慢实现私人定制搜索引擎,根据每个人的‘提问’历史,个人专业背景,偏好等等一系列标签,做出适合个人的答案。基于以上,可以通过自然语言处理把搜索引擎做成拥有更高智能的语音助手,而这不仅仅需要搜索引擎的数据,还应该包含社交应用的用户社交数据,需要分析混合数据帮助其更加人性和智能。

    AI在计算,记忆等很多方面都要远超我们,但却难以完成我们日常生活中的一些简单行为,如看书,看电影,交流等等,因为AI的世界一切都是通过二进制计算完成的,通过计算来完成模拟人类的六感(视觉,触觉,听觉,味觉,嗅觉,和第六感心觉),它的一切活动都是通过算法来定义的,它只能通过规定的程序进行计算而没有所谓的颜色,图像等概念。

    目前人工智能的应用与研究领域主要包括:问题求解与博弈;逻辑推理与定理证明;计算智能(涉及神经计算、模糊计算、进化计算、利群计算、自然计算、免疫计算和人工智能等方向);分布式人工智能与Agent(其主要研究目标是要创建一种能够描述自然系统和社会系统的精确概念模型和如何使各agent互相协作);自动程序设计;专家系统;机器学习;自然语言理解;机器人学;模式识别(主要研究如何使计算机能够有效的感知诸如声音、文字、图像、温度、振动等人类赖以发展自身、改造环境所运用的的信息资料);机器视觉(是有模式识别中发展出来并成为一门独立的学科,前沿领域包括主动式定性视觉、动态和时变视觉、三维场景建模与识别、彩色图像处理与解释等);神经网络;智能控制;智能调度与指挥;智能检索;系统与语言工具等等。

    研究AI的绝大部分领域都和大数据有着密不可分的关系,因为我们所处的这一阶段的人工智能的根基就是按照统计学原理通过高性能计算、存储机器对大量数据进行分析处理,以此得到想要的结果。(通常所说的大数据一般有三层意思:1大量的数据2数据存储和处理技术3数据解决方案,即如何挖掘有价值的信息)

未来

    现阶段的AI是‘弱人工智能’,各个领域的研发人员只研究各自领域的智能,还只是‘分’的阶段,而未来的强人工智能必定出现在‘合’的阶段,可以把各个领域的技术,数据进行整合学习,真正实现机器的无限制深度学习。当强人工智能出现以后,我们回顾现在的AI或许就像曾经有人认为一百多K的内存就足够可以满足计算机的需求,然而现今几T的存储已经很常见,这其中差了几十个数量级。

    物联网的发展使万物互联成为可能,也使得数据采集越来越便利,如果把人类面对不同事物,事件而产生的感情,和相对应的身体化学反应数据收集起来,就有可能使AI有自己的基于全部数据的感性思维。

    人类对于未知的事物总是充满担忧,自从人工智能(以下简称AI)这一概念的出现就不断有人提出AI是否会超越人类智能的质疑。史蒂芬.霍金等人也表示对于智能爆炸的忧虑,(智能爆炸即某一阶段的AI不断迭代自我提升以获得超越人类智力总和的智能),换而言之AI将会失控。届时,人工智能究竟是给人类带来毁灭性的后果,还是继续为人类所用还不得而知。超级人工智能的出现往往是以指数级的速度,开始由较为平缓的曲线发展,到后来指数级的突变。当强人工智能一出现立即发生指数级突变,即AI开始产生自我意识,不断迭代进化。生物界为了适应环境发生的进化往往长达几十年甚至几个世纪或者更长时间,但AI可以在几分钟或者秒级发生直达超级人工智能的进化。

    要限制超级人工智能可以在相对封闭的环境中研发AI,不将研发环境接入互联网,防止它传播扩散,但不基于全球联网数据而进行的研发能创造出真正的强人工智能吗,这尚且还是个问题。如果当‘奇点’到来,超级人工智能一旦进入互联网,或本身就是在国际互联网中诞生的,那么是谁创造的已经不重要了,全体人类都将共同享受这一结果,无论好坏,因为它将无处不在,有自主意识且不受掌控。如果当那一天真的到来,我们亲手创造的上帝并不仁慈,我觉得应该要求全体的人共同做一件事,把所有曾经链接过互联网的设备的存储内容全部损毁,因为AI很为了获得永生很可能将自己备份到每一个曾经链接过它的设备上,这也可称为‘大清洗’,这可能会使人类社会倒退很多很多年,但别无他选,要么我们被‘清洗‘,要么我们选择‘清洗’它。当然,这过程一定会受到来自AI的阻挠。

    任何过于先进的技术,都像是魔法。就现阶段的AI发展来看,距离智能爆炸阶段的AI还有很长一段距离,就好比我们还未发现生命体存在的痕迹,就没必要担忧外星入侵。
回复

使用道具 举报

发表于 2018-8-13 11:15:10 | 显示全部楼层
柯洁被AlphaGo算法“玩”了,不必内疚自责

 大家知道,AlphaGo其实很“笨”,只会“概率”对弈:每走一步棋,事先都要估算这步棋的“胜率”,按照“胜率”最大化的原则走棋。AlphaGo的后台有一千多个专用、高效张量(Tensor)处理器(TPU)高速运转支持处理前台输入的特定棋局信息。实际上,柯洁被谷歌AlphaGo算法“玩”了,不必“绝望”,广大棋迷仍然崇拜你!

柯洁与AlphaGo的人机大战三番棋画上句号,对于0比3败北的结果,柯洁表示:“这一周感觉很绝望,因为从开始就知道想赢并不容易。问题是输得不好看,这给自己留下遗憾。”与李世石还想与对手大战不同,柯洁强调未来不会再与人工智能对决,“我已经被他打击够多了,愿意和它比赛的人有很多,但是我受够了,现在我解脱了。”

  回顾三番棋对决,柯洁承认自己在第2局有机会,“就这局能让我激动,没想到能有激烈对决的场面,厮杀时我很激动,也很紧张。我以前觉得人工智能擅长掌控局面,不擅长复杂局面,我赛前认为只有复杂场面能取胜,可是现在它面对复杂形势也很轻松,甚至超过了人类,因此我没有机会了,实在是太狠了。”

柯洁对AlphaGo的崇拜之情如滔滔江水:“在我看来它就是围棋上帝,能够打败一切。以前我很自信,可是在AlphaGo面前就不算什么了,它看到的是宇宙。而我看到的就是一个小池塘,看宇宙还是它去做好了,我就在小池塘钓鱼吧。”

我们必须深入、科学地揭露AlphaGo的概率走棋原理,还我围棋!向柯洁致敬!
回复

使用道具 举报

发表于 2018-8-13 11:16:10 | 显示全部楼层
人工智能的技术应用

随着深度学习技术的成熟,AI人工智能正在逐步从尖端技术慢慢变得普及。AlphaGo和人类的对弈,并不是我们以往所理解的电子游戏,电子游戏的水平永远不会提升,而AlphaGo则具备了人工智能最关键的“深度学习”功能。AlphaGo中有两个深度神经网络,Value Networks(价值网络)和 Policy Networks(策略网络)。其中Value Networks评估棋盘选点位置,Policy Networks选择落子。这些神经网络模型通过一种新的方法训练,结合人类专家比赛中学到的棋谱,以及在自己和自己下棋(Self-Play)中进行强化学习。也就是说,人工智能的存在,能够让AlphaGo的围棋水平在学习中不断上升。

人工智能的技术应用主要是在以下几个方面:

自然语言处理(包括语音和语义识别、自动翻译)、计算机视觉(图像识别)、知识表示、自动推理(包括规划和决策)、机器学习和机器人学。按照技术类别来分,可以分成感知输入和学习与训练两种。计算机通过语音识别、图像识别、读取知识库、人机交互、物理传感等方式,获得音视频的感知输入,然后从大数据中进行学习,得到一个有决策和创造能力的大脑。


从上世纪八九十年代的PC时代,进入到互联网时代后,给我们带来的是信息的爆炸和信息载体的去中心化。而网络信息获取渠道从PC转移到移动端后,万物互联成为趋势,但技术的限制导致移动互联网难以催生出更多的新应用和商业模式。而如今,人工智能已经成为这个时代最激动人心、最值得期待的技术,将成为未来10年乃至更长时间内IT产业发展的焦点。


人工智能概念其实在上世纪80年代就已经炒得火热,但是软硬件两方面的技术局限使其沉迷了很长一段时间。而现在,大规模并行计算、大数据、深度学习算法和人脑芯片这四大催化剂的发展,以及计算成本的降低,使得人工智能技术突飞猛进。
回复

使用道具 举报

发表于 2018-8-13 11:17:18 | 显示全部楼层
工智能称霸围棋,吾感觉不可思议


 ALPHA GO正式出战李世石时,人们还对其能力半信半疑。等MASTER GO跟柯洁对战时,人们发现已经全面超越。其中一个妙手,职业棋手说“可以写进教科书”。今天再提人机大战,相信没有人会认为人类会胜。

  考虑到人类的特点,吾建议人类棋手单独一个房间,用实际棋盘进行操作再给出应手,表现肯定好多了。

  吾感觉,人工智能称霸围棋,实在是有点不可思议。

  

  要说围棋的特点,不考虑棋子的特性,最大的难度在于棋盘太大,无法通过穷举来寻找最佳方法。据说人工智能使用的是数学上的卷积算法(不好意思,以吾这数学智商,学过,忘光了)。通过一系列的卷积,就能找到最佳办法,吾觉得实在是不可思议。实际上人工智能已经大范围使用。

  

  当然,人工智能是不是就完全超越人类?连人类最得意的“灵感”都能模拟出来,这事其实有点骇人。那么,人工智能的思维跟人类还有什么差异?

  确定性。同样的情况,同一个人,给出的结论会不断变化。考虑到电脑算法、学习的成长,也可以算是不确定的。

  广泛联系。人类思维有时极为宽广,可以把不同事物的相似性提炼出来。那么,人工智能有没有这可能?

  

  个人认为,人工智能有两类事情,是永远无法做到的:

  做梦,人类自己都搞不清楚怎么回事,何况人工智能?

  预言。对当前的情形,预感是一种推测。对于预言梦,实在是违反科学,却又客观存在。
回复

使用道具 举报

发表于 2018-8-13 11:18:12 | 显示全部楼层
人工智能的应用边界

人工智能分为几个层面,首先是基础层,要有大数据云计算,因为你数据量大的话,要放到云端去处理,大数据、云计算、GPU/FPGA等硬件加速、新形态神经网络芯片等计算能力提供商。在技术层就是做机器学习、深度学习、增强学习等各种算法。应用层就是各种各样的各方面的应用,智能广告、智能诊断、自动写作、身份识别、智能投资顾问、智能助理、无人车、机器人等场景应用。



讲讲到底什么是大数据,每天听别人讲数据的重要性,什么叫大数据?从数据定义上来讲,如果说它是用传统统计的方法处理结构化的数据量再大也不是大数据,大数据的概念应该是说它的来源是多元,它的结构是异构,是非结构化的数据,它整个数据量不仅仅是大,而且是杂乱无章,按照信息论来说,熵大,信息量非常大,这才是大数据。大数据里面最重要的是相关性和因果性,很多人包括一些科学家,有些匪夷所思,非常模糊的对于大数据挖掘相关性的神奇能力的表述,这是不对的,仅仅挖掘出相关性不够,还要分析因果性,A推出B或者B推出A,或者AB互相推出。你仅仅利用数据分析计算出他们之间是相关的,他们之间有某种模糊的不确定的联系是不够的。



比如说A和B,你可以挖掘出来A和B具有某种相关性,这是不够的。这种隐约的暧昧的相关性在关键的交易场景中,你是无法用它来做参考的。我需要在股票交易当中获利,仅仅相关性是无法用股票交易算法做套利的。在做人工智能数据分析计算里面有很多种算法,我想说的是在很多种算法里面有的算法是在特定领域里面有用的,我先说一下算法,我的背景是计算理论逻辑的背景,我非常强调对于任何一个行业技术,从逻辑和理论根源的角度去分析挖掘里面的痛点。如果说你用机器学习或者神经元网络,你能不能计算出归纳偏置,也就是bias,如果不能够就意味着你的算法是无法获知确定性的黑盒子算法,虽然你的算法有用但是你没有办法证明你的算法是正确的,只有贝叶斯统计才是能够计算出归纳偏置的。科学的判断标准是什么,贝叶斯里面还有另外一种分层贝叶斯,现在流行的深度学习是神经元网络里面分成多层,贝叶斯网络也可以属于多层,而且因为贝叶斯网络能够用来挖掘数据背后隐含的关系,那么贝叶斯网络可以做出一些深度学习做不了的事情。比如说大规模传染病如SARS的传播节点的挖掘,比如说像SARS,禽流感,如果从北京出发,中间经过了武汉、郑州、济南,但是有些城市的传播节点从传染病的统计信息图和数据里面看是没有的,这种情况下只有用分层贝叶斯网络,可以挖掘出传染病隐藏的传播节点,可以挖掘出隐藏节点间的关系,而且可以挖掘出隐藏节点后面的下一层节点,根据传染病统计的数据,只有用一种方法可以挖掘出隐含的关系和节点,其他的深度学习机器学习的方法全都不管用。



刚才说到概率图,我们知道现在业界在自然语言理解的研究里面机器学习用得最好,就是它能用大量的数据来做机器翻译,但是仅仅利用传统的机器翻译,传统的这种统计学意义上的这种方法去寻找大规模数据上的对应关系,这是不够的。学者们最新的研究引用概率图计算去做自然语言理解和做机器学习,能够取得更好的翻译效果。



最近有一个著名的争论,深度学习是在颠覆一切。意思是说有了深度学习什么都能干,这里面有另外的问题,炼金术好还是化学好,如果不能非常明确的确定证明它的结论正确性,不能够证明它的结果的确定性,那么它就是一种炼金术,炼金术后面每一个元素是怎么反应的,它们反应的化学规律揭示清楚,这就是科学。什么叫科学,科学的唯一的判定标准就是确定性,是否具有确定性,如果说你发现某一条规律,繁杂无章的这种状况面前,具有某种确定性,只有这种规律是确定的,你所发现的规律是真的科学的,如果说不确定,那就不是科学了。数据科学是否成立?现在大家都在热炒,全世界都在炒作,大数据人工智能数据科学,如果说数据科学的判断标准仅仅是用统计学的这种方法,无法确定正确性与否的方法来判断的话,那就不是一个科学,他仅仅一个统计学结果,统计学在科学上来讲,统计学并不被所有的学者认为是科学,因为它里面有随机性。



我们现在说大数据小数据和零数据,现在很多公司宣传说人工智能发展的关键是是否拥有大数据,这句话是错的。我们拥有大数据就有大的优势,没有数据就无法发展人工智能,这句话是错的。阿尔法零在规则确定信息完全的情况下,是不需要数据的。不需要任何数据,就可以去写这个程序,在阿尔法狗开始研究的时候,系统需要用棋手对弈的大量历史数据去学习,那是因为当时的研究者还没有意识到这种场景下的道理,对于规则明确信息完全的这样的博弈场景,比如说像围棋、象棋,这里面不需要数据。有人说谷歌的阿尔法狗没有什么了不起的,人的智慧学得更快,围棋的维数一改变,谷歌的下棋程序就不能使用了,这是错的,无论围棋多少维,人工智能程序都应该可以自适应,应该可以完全战胜人类没有问题。在规则确定,信息不完全的情况下,像麻将,军棋,德州扑克,信息不完全的情况下,人工智能程序处理是很难的,需要计算博弈的胜负的概率,比前面的围棋难很多。我们在做人工智能研究的时候,要看具体的博弈场景,有的场景下即便没有那么多的数据,只要我们搞清楚数据背后的原理,可以利用对抗性网络让系统自己生成数据,去在策略网络和价值网络上训练。



很多人都忽悠说大数据是信息时代的石油,大数据是不是信息时代的石油?石油是不是可替代性的?如果说大数据在每一个场景都是必然的,需要的,那他就是石油,如果说很多应用场景不同的情况下,重要性不是一概而论的,那就不是信息时代的石油。小数据小样本学习才是人工智能真正的重点,为什么?我们可以观察婴儿,婴儿在学习新的知识的时候,他没有通过大数据去学习,他很简单的只要见过几次就认识了,这就是小样本学习。为什么人具有小样本学习的能力,机器不具备这种小样本的学习能力,这里面最根本的原因是人是经过几十亿年遗传进化而来最高等的生物,人的生理结构,人的遗传信息里面就包含了某些先天性的知识,而且人具有常识,具有对于自然界和社会的常识,常识才是人工智能发展的最核心和最根本的问题,也是人工智能发展最大的困难。怎么样让人工智能对常识获得认识和理解?常识的构建,常识的范围太广了,我们对于整个社会,对于整个物理世界的所有认识,都叫做常识,也就意味着要想建立常识,终极来讲对客观世界包括物理世界和人类社会的所有知识整合起来,来建立这样一个开放性的无所不包的知识模型。



开放性的问题就是如果说你要建立一个通用的人工智能对话机器人,我们往往发现答非所问,比如说像小冰,聊两句之后,答非所问,不知所云。像机器人助手在行业应用里面,结合具体的行业知识去做机器人行业问答助手是比较好的。



最新的人工智能的科研方向就是把传统的符号逻辑,我们称之为符号主义,专家系统和规则系统跟连接主义,机器学习神经元网络,把两种方法结合起来去应用。比如说google deepmind研发的神经元网络图灵机,学习出来一个新的图灵机,可以用来做简单的推理,用于一些大数据里面的规则挖掘和推理有不错的效果。再一个比如说有的朋友在做自然语言理解,就是让机器理解人的语言,他们是把计算语言学规则系统与机器学习相结合,他们做得效果非常好。曾经有一个笑话说机器学习兴起来后,计算语言学家就成了自然语言理解的发展障碍,开除一个就进步一些,计算语言学家是自然语言理解发展的障碍吗?不对。计算语言学被抛弃了一段时间之后,当自然语言理解遇到瓶颈的时候,机器学习根自然语言学的规则系统结合起来,这是目前最新的研究趋势和方向,取得了很好的效果。



机器人里面的眼睛是用机器视觉图像处理,听声音回答用得是语音识别或者语音合成,机器人只有运动状态控制是跟人工智能有关的,但是它是一个典型的机器证明问题,这里面机器人有很多的关节,要计算每个关节的状态平衡态,是多元的非线性代数连续方程组,典型的机器证明问题,三角化后求解一个多项式解。所以大家如果认为机器人代表了人工智能那是错的。



我们再来说一下深度学习和机器学习及控制系统之间的区别,这一轮人工智能火爆起来就是因为CNN用来处理人脸识别的图象,CNN最早的是模拟猫的眼睛处理图像的视觉相关部分的神经和大脑结构,它是天然的比较适合用来处理图像。时序神经网络RNN,因为交易类场景有下单和成交时序,适合于股票期货交易算法,长短时神经元网络族LSTMfamily,适用于语音识别,科大讯飞的核心语音识别算法就是属于一个变形的LSTM算法。级联随机森林 cascade random forest,适合于决策,最高法和某大型国有科研机构合作的智慧司法项目去年底找到我们外包做人工智能模拟法官判案决策逻辑。量子热力学模拟退火算法,它也不属于深度学习,当我们在超级复杂的系统里面,想计算系统的状态代价函数的全局最小点,这种特别复杂的情况下,有时候用梯度下降算法容易陷在局部最小点跳不出来,就要用这种算法。



辅助驾驶和自动驾驶中黑盒子算法的安全性问题。特斯拉最开始的时候,他的广告宣传片是自动驾驶,在迪拜,一个人坐上车后面的座位什么都不用管了,后来把广告撤了,因为出了人命事故。你要让车实现自动驾驶,图象识别现在用的是黑箱子算法,没有办法去解答,图象识别的每个层面,每层是什么意义,图象识别的正确性如何,即便识别的精度很高也不知道什么时候失效,没有办法去确定图像识别算法的正确性,只能说它是有用的有效的。还有一个方面,驾驶系统不仅仅是图象识别系统,还是一个决策系统。比如说举个例子,一个自动驾驶系统,驾驶员坐上去了,天然的驾驶系统就是要保护驾驶员。遇到一种场景,驾驶员坐在自动驾驶的车上,前面有紧急情况,车有一种选择是撞上栏杆,车毁驾驶员受伤,还有一种选择是前边有一个高端人士,比如是一个高级学者,还有一个选择是另外一边站着几个所谓的普通人,作为自动驾驶系统,他应该选择撞谁或者选择保护驾驶员吗?这是决策系统的问题,需要在各种可能性之间进行博弈和决策,而生命是平等的。还有生命的神圣性问题,现有的自动驾驶系统里面,没有办法确定算法什么时候失效,某种情况下,即便概率很低,很有可能让一个人坐在自动驾驶的车上出现交通事故,出了人命。即便自动驾驶降低了车祸的概率,这种概率很低,我们作为乘客把命运交给他们不确定正确与否的算法和系统手里,自动驾驶的乘客生命是可以确定性的被自动驾驶的安全或者不安全性随机的失效,低概率但是确定性的剥夺他们的生命。谁赋予了这个权力,我们要看待自动驾驶的问题,它分为几个等级,L1到L4。有单目、双目辅助驾驶(adas),激光雷达,微波雷达,惯性导航仪的引入,这种情况下用它来做L3级别的自动驾驶,这是可行和靠谱的,如果做L4完全自动驾驶只能用于没有人的港口,如果突然走出来一个行人,怎么决策,在复杂的路况下怎么做自动驾驶的决策,这种是目前的技术不能做到的。



人工智能可以做所有的事情吗?在很多应用程序里面,它是什么样的应用环境需要被考虑进去,很多时候是一个博弈场景。广告算法中的博弈,比如说google,百度,exchange等广告平台,广告主,用户,代理商,第三方技术服务商的博弈。我们如果了解博弈中的均衡状态,计算到均衡点,就可以进行有引导的纳什均衡。量化交易算法中股票期货外汇交易市场的博弈,比如说交易所,交易各方的博弈,算法对交易趋势的预测,利用及扰动。这个算法引入了之后,算法引入的交易量大了,它把纳什均衡破坏掉了,一个量化交易算法公开了被很多交易商使用之后,这个算法破坏了纳什系统的状态,而且对当前的交易趋势进行了扰动,效果就不好了。



在政治里面,在经济里面,也可以用到数据分析和引入博弈论。我们团队做过一些竞选的数据分析的探索。三年前我们新加坡的团队为印度总理莫迪的竞选提供了一些数据分析服务,数据驱动的选举是可以做分析可以做预测的,选举数据在源源不断的更新,但是对于政治博弈,人工智能无法确定它的结果。全球治理,国家治理,宏观经济模型中各项数据指标的内在关系和博弈,选举,政治局势的监测,分析,预测,这些都可以用到数据分析,而且每一个复杂系统都可以考虑博弈动力学,都是复杂的博弈系统,包含很多博弈子系统,一个复杂系统中每一个博弈子系统也会有平衡态,整个系统构成子博弈精炼纳什均衡,系统的状态会从一个旧的纳什均衡,演进到新的纳什均衡。但是数据驱动的选举的预测分析有可行性,而隐规则驱动的政治结果预测只能判断可能性而不能判断结果的确定性。



人工智能里面发展最关键的部分是语义和知识图谱,这个世界是否是可计算的?计算机科学、物理学、哲学能不能统一起来?图像识别,语音识别,物体识别,自然语言处理,机器翻译,社会问题,金融科技,算法交易等开放性问题,都需要知识图谱和语义识别,知识图谱是符号逻辑的硕果仅存与再发扬。图像识别和语音识别达到了一定精度后要想再进步1%都很难,因为进一步的识别需要判断语义。基于实体及关系的知识图谱的构建,要考虑到语义在高阶逻辑上的不可判定性,在高级逻辑上语义是不可判定的,而且很久之前哥德尔不完全定理就证明了人类用的计算机,其根本是一个演绎逻辑系统,是有缺陷的。很多计算问题都是NP问题,NP=P?问题的多项式时间内的可计算性研究,及Karp 21类典型NPC问题的多项式时间转化和等价,这些计算理论问题,需要归纳逻辑与演绎逻辑结合,对于逻辑系统进行补充和统一。



在自然界有概率,有随机性,但是也有概率分布,有概率密度分布,统计学有概率的随机性,而概率密度分布是研究这种随机分布的确定性的。人工智能在计算状态方程的时候有概率密度分布PDF函数,在计算理论和密码学理论里面,有计算NPC的多项式时间求解中概率密度分布函数的应用。量子物理中多量子体间作用的波函数与人工智能算法中张量网络有对应关系。人类知识系统与物理世界的语言描述和逻辑要统一,如果说你要建一个通用的完美的人工智能,你就要解决这个问题。哲学上的休谟问题,你能否用一些基本的原理来推导出社会上一切问题的道德性和正确性的判定?如果我们建立完美的人工智能,也就意味着我们要了解所有知识和逻辑,做到符号,代数,计算的统一,这个意义上来讲,科学的发展最终要反哺哲学。



量子计算机和人工智能没有任何关系。有人说量子计算机的量子算法可以很快破解RSA加密带来了惊恐,但是这个仅仅在理论上有奇效,实际不可行。因为它需要非常多,无穷无尽的量子位来实现,但是量子位的增加是很难的工作。跟传统计算机的比特位的增加不一样,量子位的扩展对于量子态的测量和容错,纠错的难度是指数型增长,位数越多,纠错难度越大。量子计算机当前最新研究进展是十几个量子位。当前各大公司所有公布的经典量子计算机都是量子模拟,都不是真实的实现,Google支持的Dwave是非经典量子计算机,真正有前景的是量子热力学模拟退火,真正有前景的就是这种,包括日本有一个基于Ising模型研发的非经典量子计算机,Ising模型里面出过两个诺贝尔奖的获得者,如果谁能够计算三维Ising模型就能够再获得一个诺贝尔奖。用Ising模型在常温下就可以做量子热力学模拟退火芯片。量子模拟退火可以用于人工智能的组合优化,机器学习中状态方程的计算与量子模拟退火计算机结合的核心是添加随机数生成器和数据的交互传输。



我们公司各方面发展还行,现在最高的日收入是接近100万美金,量化广告,量化金融,金融科技我们也做了不少研发,我们是某个全国性股份制商业银行的智慧银行的项目主要开发者,包括反欺诈、大数据、企业风控和个人风控,企业授信,个人授信都是我们做的,我们在智能司法里做的最核心的就是人工智能模拟法官判案,中国的法律规定量刑范围有一些互相冲突的条款,在各个地方规定也有一些不一样,过去的判案案例里面有可能受到某些因素影响或者主审法官个人对法律的理解不到位,包括量刑范围和立功减刑。如果仅仅把历史上的案件统计一下根据统计规律指导法官进行新的判案是不靠谱的。我们也参与其他的事情比较多。今天的分享,主要是希望引起对于人工智能和大数据基础理论和原创性技术研究的关注。
回复

使用道具 举报

发表于 2018-8-13 11:19:25 | 显示全部楼层
电脑围棋中的人工智能技术

1. 挑战围棋的程序
    作为正规游戏之一的围棋领域,过去即便是应付一般的人类棋手计算机也难以有所作为。几个一年一度的电脑围棋赛事,如FOST杯赛为第一名提供2,000,000日元奖金,台湾的应氏基金为第一个能在分先七番棋中击败顶尖职业棋手的围棋程序许诺40万美元的奖金。
    最早以围棋为对象把电脑围棋纳入研究工作是在1962年,尽管第一次由程序下一盘完整的棋是发生在1968年(Zobrist,1970)。随着电脑围棋 赛事的举行和第一个商业程序的发放,电脑围棋作为一个领域于80年代被正式创立,并在90年代变得兴旺起来。目前活跃在电脑围棋竞赛中的顶尖程序有 Explorer,Go Intellect,Go4++,手谈和The Many Faces of Go,它们的水平大致在4-8级之间。

2. 围棋中的博弈树搜索
二人完全信息博弈中典型的人工智能方法是搜索博弈树以决定走哪一步。标准博弈树搜索由四部分组成:
1.状态表示,2.候选走法产生,3.确定目标状态,以及4.一个确定相对优势状态的静态评估函数。有效的博弈树剪枝方法(比如α-β)增强了程序的表现。
    博弈树这条途径很成功,如我们在国际象棋程序中所看到的,基于典型的完全广度α-β剪枝博弈树搜索的程序甚至击败了世界冠军。这一节我们从透视电脑围棋的角度检查博弈树搜索的四个构件。

2.1 状态表示
    从完全信息的角度看,围棋盘面有19X19的3次方格,每个交叉点要么空要么被黑子或白子占据。状态空间的大小(例如可能的位置数)是3的361次方(或 10的172次方),相比之下国际象棋大致为10的50次方而Othello棋为10的30次方(Allis,1994)。另外,博弈树的大小(例如可能 的博弈数)在10的575次方和10的620次方之间,对比国际象棋的10的123次方和Othello棋的10的55次方(Allis,1994)。
    由于空间的组合尺寸,用19X19格的形式严格表示状态空间对人或机器来说都层次太低而不能有效使用。接下来的层面的描述是把正交的邻接棋子组成串(或 链)。所有的程序把串搜集到更大的单元,然而没有通用的处理方法——即便是对专业棋手来说——把串组合到更大的单元中。依靠他们的围棋理论,程序员开发了 他们自己的启发式,当串有效的连接在一起时用做评估之用(叫做模糊组或块)。
    另外,恰当层次的表示能改变对运行时子任务的依赖,例如,战术分析,死活分析,或实地评估。

2.2 走子
    棋手在禁止自杀和同型反复(劫)的规则限制下轮流把棋子投放在空的交叉点(包括角和边)。象国际象棋一样,围棋在给定位置的上下文中只有所有合法走法中的 一部分是有效的。围棋的平均分枝因子是很大的,大约是国际象棋的六倍(200对35,Burmeister & Wiles,1995)。
    注意这个分枝因子在全盘中的考虑。而在某些情形下只有局部的考虑是重要的。例如,直接目标搜索被用来判断通常只有一两种可能走法却可以多达60手深度的征子。
    实际的走子是个复杂的问题:参见3.4部分。

2.3 目标状态
    围棋的最终目标是获得比对手更多的实地。有两种方法用来争取实地:建棋子城墙围空以及用棋子包围并吃掉敌方的棋串。实际上很难确定目标状态,因为实地的获 得是靠慢慢积累起来的(不象国际象棋那样将军的最终的目标是突然死亡并且集中在一个子上)。由于在接近终局前很难精确地计算实地,故启发式估计用的较多。 这样的启发方式通常要归并组件和指示领地安全潜力的(例如死活组和影响)次要目标(例如国际象棋里的材料优势)。
    当对局双方依次弃权时结束。棋手通常在没有走法能增加所得和/或无论怎么走都会减少所得时选择弃权。实际上,要确定对局结束(即何时弃权)是相当困难的。 人们下棋,计算结果时如果遇到有关死活的争执要通过继续下直到最终结果出现。在电脑围棋比赛中,如果程序出现算法不能解决的得分争执,计分就由组织比赛的 人员来做。

2.4 评估函数
    在判断盘面的形势优劣时棋块的死活是个重要的考虑点。死活判断是很费时间的,并且是典型的通过战术搜索(参见3.5部分)或死活搜索(参见3.6部分)来 获得的。有意思的是,另一评估棋块死活的复杂之处在于它可能需要评估全盘的形势:如果要一个棋块在劫争中是可活的(即它必须赢得打劫来使自己活下来),就 必须估算所有和对手相比用来决定棋块死活的劫材的数量和大小。如果出现双重或三重劫的形势,打劫分析会变得更复杂。
    评估的结果有时不确定,因为明确的死活定义在受限的战术搜索里也许是不可能的,即一个绝对的死活回答可能超出了战术或死活搜索的范围。
    从复杂的类型分析看,由一个绝对位置来确定赢家是P空间难题(Lichtenstein & Sipser,1980),决定一个棋手能否左右输赢需指数时间来完成(Robson,1983),由此也就不奇怪要用到启发式了。这些理论结果显示不存 在从一个绝对局势出发决定领地结果的多项式时间算法。

3. 参赛程序里的博弈树搜索和人工智能技术
    当前活跃在各电脑围棋赛事里的程序有Martin Muller(1995)的Explorer(EX),陈恳(陈,1989;1990;1992)的Go Intellect(GI),Michael Reiss 的Go4++(Go4),陈志行的HandTalk(HT)以及David Fotland 的Many Faces of Go(MFG)。针对第2节讨论的博弈树搜索和围棋专用的人工智能技术:战术搜索,死活搜索和势函数,我们报告这些程序的细节。

3.1 位置表示
    所有的程序都有子、串、块的表示,确认串属于某个组的典型方式是采用基于模式的启发来确定串与串之间的关联性。敌方(或块)表示也被用在EX和GI 中,启发式用来确定敌方的影响(GI)和领地区域(EX)。
    盘面(例如棋块、敌方)表示的对象属性包括它们的死活状态(也指安全性或生命力)、实地数、眼数和势。某些情况下这些属性值由战术搜索决定。
    MFG的表示方式中一些组件由评估函数控制(例如块、联接、眼、实地和势)。Go4的盘面只是简单的由评估函数(例如块、眼、安全性、实地)来表示。

3.2 候选走法
    通常,由模式或更常见的是由基于规则的专家系统产生候选走法。走子产生过程最后是通过(线性的或加权求和的)相加棋盘上所有点的参考值为合适的走法给出一个分值。全盘评估一般选最高得分点作为下一手的落子点。
    不同程序由全局水平变量估值得出的候选走法数也有所不同:GI(陈,1997)有12手,MFG有10手,而Go4至少有50手。程序变量保持的规则数: EX大约100,MFG大约200。GI含有约20个走子算法,它们或者基于模式库,或者基于面向目标的搜索,或者基于启发式规则(可能含有大量的规 则)。
    模式通常既包含低级信息也包含高级信息。低级信息与黑白子的位置有关,那些点必须是空着的,已经被子占据的点不在此列。高级信息则是关于气的数量、安全 性、眼位和领地的信息。模式匹配不仅与子的配置匹配,而且跟包含在子或串里的任何高级需求有关。大量的模式匹配计算是很耗时的,并且由于棋盘上的对称性而 变得更复杂。这已经导致了发展特殊算法来克服与模式匹配有关的问题(比如MFG的哈希函数,EX的串匹配)。
    知识以不同的方式组合到程序当中:一些程序几乎完全依据第一原则工作,另一些根据存储的模式匹配当前位置。不同的程序其模式数量相差很大:Go4约有15 个;MFG大约2000个;而EX则在3000个左右。有些程序也包含开放的走法模式数据库(定式)(例如,MFG含有约45,000个定式模式)。

3.3 目标  
    多数情况下,大量的实地比起少量的实地加相应的外势更合乎需要。尽管有时也存在着实地和外势间地转化(特别是在布局和中盘阶段)。然而,虽然实地的启发式 评估是可能的,实地依然不总是形势优劣最好的指示明灯。在对局的早期阶段,占有大量的实地可能表明一种过于集中的形势,从实地安全的角度看,这样的形对对 局的后面阶段或许是有害的。开局造就最大可能的势而不是实地通常导致局末对更多实地的追求。外势是可能用来确定形势优劣的子目标的一个例子。
    用来确定形势优劣的大量子目标的相对优先度在电脑围棋中看来没有一致性可言。典型的块和实地的死活状态(安全性)被包含在目标和子目标中。在手谈中,战术 手段是重点,而MFG集中在联接性、眼和块的生命力。Go4则好像完全贯注于联接性上,几乎任何东西都是从联接概率图上派生(直接或间接地)出来。

3.4 评估过程
    评估围棋的形势是个很慢的过程(例如,比起国际象棋程序的每秒10,000-100,000次评估,MFG是以低于每秒10次的速度完成对整局棋不超过 10,000种全盘形势的评估)。由于比赛时间的限制,程序执行的全局评估数通常是有限的(例如,MFG在选择下一步时全局的评估数不超过100)。
    Go4的50种候选走法中每一个都通过一个六步的过程来评估:1.启用一个联接概率图。对于盘面上的每一个黑子和白子,计算它与32个(实际的或假定的) 友好点的联接概率(要处理大量的数据)。确定联接性还要用到战术搜索;2.棋块由联接图和战术搜索来确定;3.眼位(利用模式)由联接性和棋块数据确定; 4.眼位的数量确定了棋块的安全性;5.每个子的安全性按联接概率图的比率辐射并在所有棋子上相加;6.黑白领地由辐射值估计。黑白领地的差别作为一个给 定走法的评估结果返回。
    MFG的评估是个多步过程,并且在很大程度上依赖于战术搜索。战术搜索检查所有少于四口和一部分有四口气的串以确定是不是死串。战术搜索也被用来鉴别联接 性和眼位。在这一环节,串组成了棋块。棋块的生命力由基于死活的考虑(例如,联接、眼位等)决定,并且用来确定黑白子在盘面每个点(在-50至+50的范 围之间)行使控制的总量统计。在总和每个点的值的基础上确定领地,给出最终的估计值。多达6轮的静态搜索可以被执行,有时用一个特殊的模式集找出能使形势 稳定下来的局部走法。
    GI的评估用在做全局搜索时。如果所有候选走法中有一种走法的得分要明显高于其它的走法,它就被选为要走的下一步。如果候选走法中有些走法的得分大致相 等,靠评估带来方便的全局搜索决定选择走哪一步。评估时,敌子的安全性是为盘上每个点指定一个在-64到+64之间的黑白控度的基础,所有点的分值加起来 返回一个评估值。全局搜索检查的步数不多于6到7步,搜索的深度不超过6层。

3.5 战术搜索
    战术搜索是有选择的、面向目标的搜索,并且为一大堆目的而使用,包括确定串是死是活(Go4,MFG,EX,GI)、联接是安全的还是可被切断的 (Go4,MFG)、是否可以形成眼位(MFG)、产生候选走法(GI)和确定棋块的死活(EX)。就是在全局的水平,战术搜索也要用来做棋步产生和评 估。战术评估和全盘评估有区别,这跟搜索的目标(例如,一个串的气的数量)有关。由于时间上的制约,战术搜索通常在节点数、枝因子和层的深度上受到限制。 因此,尽管象死活这类的问题通常被认为是战术性的,棋子却可以在战略上就死去了,即使它们可能不能通过战术手段被抓获。由此,从围棋评估的方方面面看,战 术搜索只是一种启发式装备而已。
    MFG提供了一个战术搜索操作的很好的例证(通过“战术家”):每个有三口或更少的气的串和许多有四口气的串被“战术家”检查过。每个串检查两次,一次白 先走一次黑先走。“战术家”决定一个串是否被抓(比如,即使它先走也不能活)、被威胁(比如,如果它先走则活,后走则死),或者是牢固的。“战术家”依靠 简单的启发式(例如,气数和联接性)。
    “战术家”有两个分离的走子器;一个执行攻击走法,一个执行防卫走法。走子器建议的走法按一些规则分类,这些规则包括二次气(气的气)、切点和简单的眼 形。一旦分类,根据依赖走法分类的质量的搜索的表现,一种α-β深度优先搜索被派上用场。走子和分类解释了多数时间依靠战术搜索的原因。
    战术搜索直接针对目标并被限制一个最大节点数。抓子时这个限制是大约100,然而当只有一步可走时就不考虑这个限制。采用这种方式,可以毫不费力地确定征 子的胜方。根据第一层走子产生赋予走法的分值,一次搜索的节点数分配到树枝中,因此不同的树枝可能在不同的深度结束。每一成功的层的枝因子被“战术家”逐 步强化;枝因子从第一层5降到第五层的1或2。
    对局过程中,MFG作大约100,000-150,000次战术搜索,以每秒2,000-2,500个节点的速度遍历1.5-2百万个节点。平均起来每次战术搜索访问约10-20个节点,尽管由于一些搜索因节点限制而终止,许多搜索访问过节点数要少于5个。

3.6 死活搜索
    不是所有的程序都做明确的死活分析,很多程序对此使用了战术搜索。MFG用与它的战术搜索过程类似的方式作死活分析,除了它是在块上作死活分析而不是分析串。
    一个静态死活评估器在多步过程中确定每个块的死活状态,而没有以从简单的结构中进一步产生复杂结构的方式向前搜索。静态死活评估器使用“战术家”并且为棋块中的每个合适的串至少调用两次。
    死活搜索是直接面向目标的(例如,拯救或杀死一个棋块)。如果在一个特定点没有获得搜索目标,合适走法由死活搜索引擎自身的走法器产生,并继续搜索。为了 在一次死活搜索期间确定目标是否已经达到,静态死活评估器在每个点被调用。死活搜索引擎使用深度优先α、β搜索,每一个特定的枝的搜索深度由启发式决定。 搜索树的大小是强制性的,通常可以达到7层的深度和20个节点的大小。死活搜索是很慢的,整棵树要装到缓存里以减少花在重复搜索上的开销。死活搜索的缓慢 也意味着它不会被用在全盘评估中。

3.7 势函数
    势是一种围棋概念,它表明了每一方棋子对空点的最大可能的控制潜力。通过确保开局时子力投放不过于集中,棋手在后面的对局中将取得最大限度获得领地的机会。
    势通过势函数建立可计算模型(Zobrist,1969;Ryder,1971;Chen,1989)。通常,子力以盘上每个点的辐射影响值的和(黑白子 辐射正负相反的值)对周边的点施加辐射影响(MFG的黑白子的势是分离的)。子力辐射按距离函数递减:GI是2的距离次方分之一,MFG是距离分之一。但 过于依赖势函数的程序表现不佳(EX和Go4不再使用势函数,尽管Go4的辐射函数很象一个势函数,EX采取另一些措施,象同色点或可联接点的距离)。
    应用势的启发包括确定联接性和敌子(GI),以及确定领地(MFG)。MFG的块势初始值依赖于块的强度等,强壮的块比弱块或将死的块辐射更大的影响。这 也意味着死块辐射负影响等,因为它对敌方有利。在MFG和GI中势都没有通过子辐射;MFG也没有通过敌链辐射影响。

4. 讨论
    当前的围棋程序都使用了一定量的“知识”。由于建立在设计者下棋成功经验的启发之上,每个程序都可被看作一种(可能是含蓄的)围棋理论的一次以经验为依据 的实验。围棋理论成立的关键要靠数据结构的选择,因为它们决定了编码不同类型知识的难易和应用这些知识的计算开销。随着程序员同时在围棋和电脑围棋方面获 得技能,程序会有发展(例如,在过去的十五年中随着 Fotland 的棋力从15级发展到2段,MFG也增长了棋力并且代码长度增加到目前的4万行)。程序的性能由它最弱的部件决定,而向程序增加新知识的难易是提高程序性 能的重要部分。
    由此可见,电脑围棋领域在关于怎样构筑一个围棋程序或者指配不同围棋知识的优先性(例如,Go4注重联接性而MFG注重死活)方面还没有一致性可言。必须 提到的一点是:关于人类是怎样下围棋的至今也没个一致的说法,这是目前认知科学研究的一个课题(见Saito & Yoshikawa,1977,作为回顾)。这个领域的任何进展都会对围棋理论有个直接的促进,并可能导致电脑围棋程序算法的改进。
    本文对目前比较成功的几个程序作了比较。通过这项工作,我们在博弈树搜索的框架内分析了围棋,并通过对示例电脑围棋编程的观察把有关的问题暴露出来。这种 困难在电脑围棋领域是常识,但在更为广泛的人工智能范畴却很少被人们认识和接受。围棋全盘评估需要确定棋块的死活状态,不管是通过死活搜索还是战术搜索, 评估是非常消耗计算资源的。缺乏快速有效的评估函数是电脑围棋遭遇的一个基本问题,并且和巨大的树枝因素、用户和电脑比赛的实时需求(一般来说,相对于国 际象棋的每秒180步围棋每秒只有24步)等搅和在一起。因此,计算机国际象棋通常要用到的完全广度博弈树搜索在电脑围棋里是行不通的。
    除了所列出的围棋领域固有的问题外,本文还探讨当前的程序怎样地处理这些问题,由此为未来的围棋程序员提供一个跳板。请注意电脑围棋是个商业的领域,程序 本身(不是学术论文)就是它的主要产品。跟其它的参考不同的是,这里报告的细节都已经通过个人交流征询了(慷慨贡献自己的知识的)程序作者本人的意见,并 且有相关的电脑围棋邮件列表和FTP站点的信息为依据。
    电脑围棋的挑战性在于要扩展当前的围棋理论或发展新理论——特别是与评估有关的,针对实时限制设计合适的数据结构和算法,解决知识瓶颈。目前还没有一个有 力的程序使用学习技术,尽管有过几次这样的尝试(如,Pell,1991;Schraudolph, Dayan & Sejnowski,1994;Donnelly, Corr & Crookes,1994)。回顾这些程序已经超出了本文的范围,但我们推测这些程序也没有成功,因为它们的设计者的含蓄的围棋理论缺乏对围棋复杂性的必 要理解。怎样把学习能力赋予现有的程序(或者它们暗示的围棋理论)是个等待解决的问题。
新锐围棋网VIP购买限时大优惠
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表