关于作者

 一个毕业于北京大学数学力学系,在中国科学院计算所、计算中心和网络中心工作过,在澳大利亚科工组织DMS、香港浸会学院数学系和中国21世纪议程管理中心等处工作过,多次获国家和中科院科技奖并享受政府特殊津贴的退休老头。现在在【中国科普博览】网“科学新语林”栏目里开设一个《数学与计算机》的个人专栏,愿和爱好数学与计算机的各界网友和青少年朋友,谈谈对数学与计算机的看法、想法。

新器件神经突触芯片(下)

张建中
2015年01月19日

4.?? 计算机芯片

计算机芯片其实就是一个电子零配件,也叫集成电路,通常在一个计算机芯片中会包含千千万万的电阻、电容以及其他小的元件。在计算机主板上,通常看到的一些黑黑四方形长方形的有很多焊脚的东西就是计算机芯片。
计算机上有很多的芯片,内存条上一块一块的黑色长条是芯片,主板、硬盘、显卡等上也都有很多芯片,CPU也是块计算机芯片,只不过它比普通的计算机芯片更加复杂、更加精密。
芯片是主板的心脏,CPU是计算机的心脏。不过芯片分好多种,比如CPU也可说是芯片,还有显卡芯片、声卡芯片等等,他们大部分是计算作用,能完成几乎是计算机所有的工作,如运算、数据处理、数据传输、存贮、分析等等。
芯片组是主板的核心组成部分,可以比作CPU与周边设备沟通的桥梁。按照在主板上的排列位置的不同,通常分为北桥芯片(North Bridge Chipset)和南桥芯片(South Bridge Chipset)。北桥是电脑主板上的一块芯片,位于CPU插座边,起连接作用;南桥芯片用来处理低速信号,通过北桥与CPU联系。
北桥芯片提供对CPU的类型和主频、内存的类型和最大容量、ISA/PCI/AGP插槽、ECC纠错等支持。南桥芯片则提供对KBC(键盘控制器)、RTC(实时时钟控制器)、USB(通用串行总线)、Ultra DMA/33(66)EIDE数据传输方式和ACPI(高级能源管理)等的支持。其中北桥芯片起着主导性的作用,也称为主桥。对于不同的芯片组,在性能上的表现也存在差距。除了最通用的南北桥结构外,目前芯片组正向更高级的加速集线架构发展。

5.?? True North:IBM的百万神经元仿人脑芯片

邮票大小、重量只有几克,但却集成了54亿个硅晶体管,内置了4096个内核,100万个“神经元”、2.56亿个“突触”,能力相当于一台超级计算机,功耗却只有65毫瓦。这就是IBM公布的最新仿人脑芯片:True North。
[caption id="attachment_1214" align="aligncenter" width="505"]IBM集成16块True North芯片的电路板 IBM集成16块True North芯片的电路板[/caption]
自2008年以来,美国国防部研究机构DARPA给了IBM 5300万美元。True North是IBM参与DARPA的研究项目Sy Napse的最新成果。Sy Napse全称是Systems of Neuromorphic Adaptive Plastic Scalable Electronics(自适应可塑可伸缩电子神经系统,而SyNapse正好是突触的意思),其终极目标是开发出打破冯?诺依曼体系的硬件。
冯?诺依曼体系是传统计算机的基础。这种体系结构是基于数值计算应用的特长设计出来的,特点是存放信息和程序指令的内存与处理信息的处理器是分离的。由于处理器是按照线性序列执行指令,所以必须不断与内存通过总线反复交换信息-——而这个会成为拖慢速度和浪费能量的瓶颈。尽管后来采用了多核芯片和缓存技术,但是这些只能提高速度而不能降低太多能耗,而且没办法进行实时处理,因为通信是瓶颈——内存和CPU的大量通信要通过总线进行。因此,近几十年来研究人员一直在致力于寻找突破原有体系的技术。
模仿人类大脑是计算机科学家寻求突破的方向。人类大脑的神经元尽管传导信号的速度很慢,但是却拥有庞大的数量(千亿级),而且每个神经元都通过成千上万个突触与其他神经元相连,形成超级庞大的神经元回路,以分布式和并发式的方式传导信号,相当于超大规模的并行计算,从而弥补了单神经元处理速度的不足。人脑的另一个特点是部分神经元不使用时可以关闭,从而整体能耗很低。
在了解了人脑的这种机理之后,研究人员开始了在软硬件上对人脑进行模拟。在硬件方面,近年来主要是通过对大型神经网络进行仿真,如Google的深度学习系统Google Brain,微软的Adam等。但是这些网络需要大量传统计算机的集群。比方说Google Brain就采用了1000台各带16核处理器的计算机,这种架构尽管展现出了相当的能力,但是能耗依然巨大。而IBM则是在芯片上的模仿。
这种芯片把数字处理器当作神经元,把内存作为突触,跟传统冯?诺依曼结构不一样,它的内存、CPU和通信部件是完全集成在一起。因此信息的处理完全在本地进行,而且由于本地处理的数据量并不大,传统计算机内存与CPU之间的瓶颈不复存在了。同时神经元之间可以方便快捷地相互沟通,只要接收到其他神经元发过来的脉冲,这些神经元就会同时做动作。
[caption id="attachment_1215" align="aligncenter" width="480"]IBM的True North芯片结构、功能、物理形态示意图 IBM的True North芯片结构、功能、物理形态示意图[/caption]
这样的芯片能够做什么事情呢?IBM研究小组曾经利用DARPA 的NeoVision 2 Tower数据集做过演示。它能够实时识别出用30帧每秒的正常速度拍摄自斯坦福大学胡佛塔的十字路口视频中的人、自行车、公交车、卡车等,准确率达到了80%。相比之下,一台笔记本编程完成同样的任务用时要慢100倍,能耗却是IBM芯片的1万倍。
跟传统计算机用FLOPS(每秒浮点运算次数)衡量计算能力一样,IBM使用SOP(每秒突触运算数)来衡量这种计算机的能力和能效。其完成460亿SOP所需的能耗仅为1瓦,像这样的能力一台超级计算机、一块小小的助听器电池即可驱动。
通信效率极高,从而大大降低能耗是这款芯片最大的卖点。True North的每一内核均有256个神经元,每一个神经元分别都跟内外部的256个神经元连接。
但是相比之下,人脑有上千亿个神经元,每个神经元又有成千上万的突触,那样一个神经网络就更加无法想象了。IBM的最终目标就是希望建立一台包含 100 亿个神经元和 100 万亿个突触的计算机——这样的计算机要比人类大脑的功强大10 倍,而功耗只有一千瓦,且大小不到两升(人类大脑的大小)。
认知芯片可以执行感知、交互、识别等任务,就像演示中的识别对象一样。IBM预计这种认知能力可以用在物联网中、部署在传感器中,处理现实世界的感知问题。使用认知计算机通过传感器网络和微型电机网络不断记录和报告数据如温度、压力、波高、声学和海潮等来监测世界范围内的供水状况等。然后,它还可以在发生地震的情况下发出海啸警报,而这样的任务传统计算机根本不可能完成。或者这种芯片也可以部署在它的Watson上面,从而大大提升这台在智力竞赛中战胜人类冠军的超级计算机的能力和能效。因此,有人把IBM的芯片称为是计算机史上最伟大的发明之一,将会引发技术革命,颠覆从云计算到超级计算机乃至于智能手机等的一切。

6.??? 仿人脑神经突触芯片的未来

对仿人脑神经突触芯片,从短期来看,情况也许并没有人想象的那么乐观。
首先芯片的编程仍然是个大问题。芯片的编程要考虑选择哪一个神经元来连接,以及神经元之间相互影响的程度。比方说,为了识别视频中的汽车,编程人员首先要对芯片的仿真版进行必要的设置,然后再传给实际的芯片。这种芯片需要颠覆以往传统的编程思想,尽管IBM去年已经发布了一套工具,但是目前编程仍非常困难,IBM团队正在编制令该过程简单一点的开发库。
其次,在部分专业人士看来,这种芯片的能力仍有待进一步证实。
在神经网络和机器学习专家看来,DARPA的NeoVision 2 Tower的数据集相对比较简单,演示只是识别了5种对象,相对于Google和百度等图像识别使用的是有上百万图像种类上千的Image Net,芯片在这种测试集的表现如何尚不得而知。
再者,真正的认知计算应该能从经验中学习,寻找关联,提出假设、记忆,并基于结果学习,而IBM的演示里所有学习都是在线下的冯?诺依曼计算机上进行的。不过目前大多数的机器学习都是离线进行的,因为学习经常需要对算法进行调整,而IBM的硬件并不具备调整的灵活性,不擅长做这类事情。但是IBM并不排除硬件实现的可能性。但是从事同类研究的科技人员认为,应该开发能实现最新算法的芯片,那种芯片应该不是IBM芯片的样子,而是类似于改良版的GPU。
总体说来,研发仿脑电路已是必然趋势。2011年,IBM推出了SyNAPSE芯片原型,这枚单核芯片包含256个“神经元”和256 256个“突触”。时隔3年,邮票大小的升级版多核芯片“真北(True north)”问世,尺寸不到原型的1/15,内核却增加到4096个,方寸之间竟然集成了100万个“神经元”、2.56亿个“突触”,能耗不到70毫瓦,其运算能力可折合为每瓦每秒460亿次,而最节能的超级计算机每瓦每秒只能进行45亿次“浮点”运算。
如果说第一代单核仿脑芯片还只是“虫脑”水平,那么进阶版“真北”已经相当于“蜜蜂大脑”了。但显然,IBM的终极目标是人类的“灰脑”——大脑皮层灰质是数百亿神经元的聚集地。但是,IBM的芯片是否真如其名称True North所述、为计算机的未来找到了真正的方向,目前尚不得而知。但是,至少这款芯片超高集成度和超低能耗已经给人留下了深刻印象,发展前景值得期待。