请登录 免费注册
分享
  • 微信
  • 新浪微博
  • 人人网
  • QQ空间
  • 开心网
  • 豆瓣
会员服务
进取版 标准版 尊贵版
| 设为首页 | 收藏 | 导航 | 帮助 |
移动端 |
官方微信扫一扫
微信扫一扫
收获行业前沿信息
产品 资讯
请输入产品名称
噪声分析仪 纺织检测仪器 Toc分析仪 PT-303红外测温仪 转矩测试仪 继电保护试验仪 定氮仪
首页 产品 专题 品牌 资料 展会 成功案例 网上展会
词多 效果好 就选易搜宝!
东莞市塘厦欧诺谊电子仪器经营部
新增产品 | 公司简介
注册时间:2009-03-14
联系人:
电话:
Email:
首页 公司简介 产品目录 公司新闻 技术文章 资料下载 成功案例 人才招聘 荣誉证书 联系���们

产品目录

射频与微波仪器
信号发生器
频谱分析仪
网络分析仪
天馈线分析仪
接收/发射机
噪声系数分析仪
频率计/功率计
调制度分析仪
无线通信测试仪
蜂窝基站测试仪
蓝牙综测仪
wifi测试仪
无线电综合测试仪
光学仪器
光衰减器
光模块
光波万用表
光源
光功率计
光波长计
光示波器
光谱分析仪
通用仪器
函数信号发生器
高压/安规/耐压测试仪
视频/音频分析仪
交流微电阻计
电智能分析仪
静电放电发生器
其他仪器仪表
线材测试仪
多功能校准器
数据采集仪/采集卡
试验设备产品
万能试验机
弹簧试验机
破裂强度试验机
90度剥离强度试验机
标准光源箱
突拉试验机
耐燃烧试验机
线材测长率试验机
按键寿命试验机
手机滑盖/翻盖寿命试验机
附 件
电流放大器/电流探头
功率探头
示波器探头
GPIB卡/线
噪声源/头
校准盒
夹 具
校准件
功率传感器
衰减器
首页 >>> 技术文章 >

技术文章

击败了李世石九段的围棋人工智能“阿法狗”究竟是什么?

作为一种人工智能的 AlphaGo,和 IBM 在上个世纪打败国际象棋大师卡斯帕罗夫的深蓝超级计算机,以及当代的苹果 Siri、Google Now 有着显著的区别。


要了解 AlphaGo,首先我们需要了解 AlphaGo 背后到底是一个什么东西。


它背后是一套神经网络系统,由 Google 2014 年收购的英国人工智能公司 DeepMind 开发。这个系统和深蓝不同,不是一台超级计算机,而是一个由许多个数据中心作为节点相连,每个节点内有着多台超级计算机的神经网络系统。就像人脑,是由 50-100 亿个神经元所组成的,这也是为什么这种机器学习架构被称为神经网络。


你可以将 AlphaGo 理解为《超验骇客》(Transcendence) 里约翰尼·德普饰演的人工智能,而它所控制的超级计算机,就像影片里被人工智能心控的人类一样,共同为一种蜂群思维 (Hive Mind) 服务。


击败了李世石九段的围棋人工智能“阿法狗”究竟是什么?

《超验骇客》中,被人工智能控制的工人马丁。马丁没有所想,但他的所见将会被人工智能直接获取

 

AlphaGo 是在这个神经网络系统上,专为下围棋 (Go) 而开发出的一个实例。然而,虽然名字已经介绍了它的功能,AlphaGo 背后的神经网络系统却适合用于任何智力竞技类项目。


这个系统的基础名叫卷积神经网络 (Convolutional Neural Network, CNN) ,这是一种过去在大型图像处理上有着**表现的神经网络,经常被用于人工智能图像识别,比如 Google 的图片搜索、百度的识图功能都对卷积神经网络有所运用。这也解释了为什么 AlphaGo 是基于卷积神经网络的,毕竟围棋里胜利的原理是:

“对弈双方在棋盘网格的交叉点上交替放置黑色和白色的棋子。落子完毕后,棋子不能移动。对弈過程中围地吃子,以所围“地”的大小决定胜负。“


击败了李世石九段的围棋人工智能“阿法狗”究竟是什么?

AlphaGo Logo / DeepMind

 

AlphaGo 背后的系统还借鉴了一种名为深度强化学习 (Deep Q-Learning, DQN) 的技巧。强化学习的灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得*大利益的习惯性行为。不仅如此,AlphaGo 借鉴了蒙特卡洛树搜索算法 (Monte Carlo Tree Search) ,在判断当前局面的效用函数 (value function) 和决定下一步的策略函数 (policy function) 上有着非常好的表现,远超过上一个能够和人类棋手旗鼓相当的围棋程序。


击败了李世石九段的围棋人工智能“阿法狗”究竟是什么?

对战现场


AlphaGo 所采用的 DQN 是一种具有广泛适应性的强化学习模型,说白了就是不用修改代码,你让它下围棋它能下围棋,你让它在红白机上玩超级玛丽和太空侵略者,它也不会手生。作为一个基于卷积神经网络、采用了强化学习模型的人工智能,AlphaGo 的学习能力很强,往往新上手一个项目,玩上几局就能获得比世界上*厉害的选手还强的实力。


2014 年,已经被 Google 收购的 DeepMind,用五款雅达利 (Atari) 游戏 Pong、打砖块、太空侵略者、海底救人、Beam Rider 分别测试了自己开发的人工智能的性能,结果发现:在两三盘游戏后,神经网络的操控能力已经远超世界上任何一位已知的游戏高手。


DeepMind 用同样的一套人工智能,不调整代码就去测试各种各样的智力竞技项目,取得了优异的战绩,足以证明今天坐在李世石面前的 AlphaGo ,拥有多强的学习能力。


击败了李世石九段的围棋人工智能“阿法狗”究竟是什么?

李世石执���子,AlphaGo 执白子。大约进行了 85 分钟时进入休息阶段

 

在此之前,DeepMind 进行过的无数虚拟棋局训练,以及去年击败欧洲围棋**樊麾二段的经验让 AlphaGo 已经训练出了**的弈技,极有可能高于世界上任何已知的围棋高手。

 

尽管棋盘上风云变化,早在本次开战前,AlphaGo 跟李世石就已不在同一起跑线上了。至于李世石曾经做出 AlphaGo 和自己棋份在二子和让先之间的评论,恐怕**局足够让他反悔了。

 

AlphaGo 只是 DeepMind 证明自己的一个工具。你也可以将这次和李世石的对局理解为 Google 的公关策略。


2014 年,这家公司曾经在其官网上写道: DeepMind 致力于用研究深度学习的方式去真正了解智慧 (solve intelligence) 。但对于 DeepMind 和 Google 来说,打造 AlphaGo 以及其他人工智能神经网络不是终点。


击败了李世石九段的围棋人工智能“阿法狗”究竟是什么?

DeepMind 三位联合创始人

 

将机器学习和神经科学进行结合,打造出一种“一般用途的学习算法”。通过这种算法,DeepMind 和 Google 希望能够将智能“定型化”,理解智能是什么,进而更好的帮助人类理解大脑。DeepMind 联合创始人之一的 Demis Hassabis 曾经写道:

“用算法将智慧提炼出来,有可能成为理解人类思维*神秘原理的*佳方式。”

(”Attempting to distil intelligence into an algorithmic construct may prove to be the best path to understanding some of the enduring mysteries of our minds.”)


在 Google 收购 DeepMind 前,收购条款中的一项就是 Google 必须成立人工智能道德委员会。因此,在目前阶段人们不必担心这样的人工智能*终杀死或统治人类。但至少,人工智能在围棋这样的智力类竞技项目上击败人类,是已经注定的事情。

“作为一种决策树巨大的游戏,围棋本来适合人脑思考,不适合机器运算。但 DeepMind AI 的方向就是模仿人脑思考,用神经网络“重现”智慧。”

 

上一篇:使用基础频谱分析仪(BSA)进行反射测量
下一篇:用通用计数器实现更快的频率测量
              
若网站内容侵犯到您的权益,请通过网站上的联系方式及时联系我们修改或删除