中国科普博览
与科学同行
AlphaGoZero无师自通完爆AlphaGo
发布时间:2017-11-01
出品:科普中国
制作:中国科学院自动化研究所
监制:中国科学院计算机网络信息中心

  近日,DeepMind在Nature上公布了最新版AlphaGo论文,介绍了迄今为止最强的围棋AI——AlphaGoZero。去年,AlphaGo代表人工智能在围棋领域首次战胜了人类的世界冠军,但其棋艺的精进,是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上的,而AlphaGoZero则不需要人类的专业知识,只使用纯粹的深度强化学习技术和蒙特卡罗树搜索,经过3天自我对弈就实现了100:0击败阿法狗。     AlphaGoZero的成功证明了在没有人类指导和经验的前提下,深度强化学习方法在围棋领域里仍然能够出色的完成指定的任务,甚至于比有人类经验知识指导时,完成的更加出色。某种程度而言,AlphaGoZero展现出了机器“机智过人”的一面,因为它不再被人类认知所局限,而能够发现新知识,发展新策略,它也再度证明了深度强化学习的强大能力,这一成果也势必将推动该领域的进一步发展。

“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。
本文由科普中国融合创作出品,转载请注明出处。

中国科学院科普云平台技术支持,中国科学院计算机网络信息中心运行
文章内容仅为作者观点,不代表中国科普博览网、中国科普博览网运行单位、中国科普博览网主办单位的任何观点或立场。
科普中国系列品牌网站: 科普中国
关闭
中国科普博览版权所有 Copyright © All Rights Reserved
京ICP备09112257号-28,-43   京公网安备11010802031770号