模拟大脑:下一代计算机
【全球科技】
撰文:茱莉·格洛利耶(Julie Grollier),系法国科学研究中心-泰雷兹集团结合物理研究所研究员;达米安·科里奥兹(Damien Querlioz),系巴黎-萨克雷大学与CNRS纳米科学与纳米手艺研究中心研究员。
翻译:戚译引
引言
在过去几年中,人工智能算法获得了庞大的前进。它在我们日常生活中的应用越来越遍及,经常被用于阐发文本或图片的内容,理解语音指令,而且效率常常比人类还高。2016年,AlphaGo算法在围棋角逐中击败了来自韩国的世界冠军李世石,而在10年前,没有一个专家预见它能获得如许的成就。但是,为了到达让人注目的表示,那些算法需要消耗大量的电能,远远超越我们的大脑完成同类使命所需的能量。举例来说,BERT是一种处置人类语言的人工智能算法,它的训练过程需要消耗数千千瓦时的电能。那相当于人类大脑运行6年消耗的能量。在能耗层面上,大脑的记忆、计算和进修过程比计算机要高效得多。我们有没有可能从大脑中获得启发,造造出表示更超卓的设备?谜底是必定的,我们或答应以操纵电子的自旋做到那一点。
1、存算别离招致高能耗
目前比力流行的人工智能是一种基于深度神经收集的算法,它的设想灵感来自于大脑构造。但是为什么人类智能和人工智能在能耗上的表示差别如斯悬殊?那是因为现在的人工智能法式还在典范的计算机上,或者在与之类似的显卡上运行,它们的构造和运算原理都和大脑明显差别。
《全球科学》供图
为领会决高能耗问题,许多研究机构和企业都在研发新的电子器件,希望让它的运做原理完全模仿大脑。自旋电子学就是办法之一,那个学科研究若何开发操纵电子的某些量子性量。借助自旋电子学研发的硬件,我们或许可以模仿大脑中的神经元以及毗连神经元的突触的行为。也许我们在短期内还无法操纵自旋电子学开发出一套完好的处理计划,并实现财产化,但一些早期功效已经闪现出了优良的前景。
关于现实应用中的计算机,要想提拔能量的操纵效率和运算速度,更大的障碍来自如许一个根本事实:数据被贮存在存储器中,和处置器在物理上是彼此独立的。处置器是按照法式指令处置数据的设备。而人工智能算法包罗数百万以至数十亿个参数,当那套算法运行时,它必需一刻不断地在存储器中搜刮数据,然后在处置器中将其相加或相乘,最初将成果写入存储器。那就构成了一条通过通信线路持续传输的数据流,它消耗的能量非常惊人。
而在大脑中,数据处置的体例大不不异。存储器无处不在,信息被散布和保留在突触中。突触是神经元之间的毗连节点,它同时也负责处置数据。均匀而言,每个神经元都和1万个突触相连,而且具备停止并行计算的才能。那种将计算和存储并置的体例,再共同并行处置才能,具有非常惊人的能效。
计算自己的性量也在很大水平上决定了设备的能效。电脑处置的长短常切确的数据,用比特的形式编码信息,对那类数据的逻辑运算是以极其严谨的体例停止的。若是是处置将火箭送进太空的过程,那种切确性至关重要。但是,若是要识别一张熟悉的面目面貌,如许的切确性可能就没那么需要了。而让电路施行一个完美无缺的操做是很消耗能量的,因为它需要消弭所有的噪声,纠正所有的错误。
大脑的能源只要我们每天摄入的热量,非常有限,因而,在演化过程中,大脑接纳了另一种战略:在信息处置的可信度和能耗之间停止妥协。突触和神经元具备一些随机行为,它们允许必然的误差,所以即便领受到类似的信息,也纷歧定会输出不异的成果。
另一方面,为了确保信息处置的可靠,大脑利用了多种战略。例如,每个神经元零丁看来都不是非常可信,但是大脑中有时会有多个神经元同时放电,处置统一个信号。大脑基于神经元响应的总和,生成一个相关的不变成果。从成果看来,那种冗余系统的能耗要低于可以有组织地纠正错误的严苛系统。
此外,由突触贮存、由神经元处置的信号并非二进造形式的“0”或“1”,那点和目前的电子元件完全差别。那些信号是一种电信号,它们的取值范畴比力宽,每个信号非常附近但又各不不异。能够说,那种信号所包罗的信息量大大增加,但对干扰(或者说噪声)也愈加敏感。要晓得,在处置器中,每个构成元素都是以不异的时钟频次操做的,那确保了操做的同步,但限造了信息处置速度;而大脑的工做体例与之差别,它不以同步的体例运行,每个神经元都以本身的频次释放电信号,用于和其他的神经元高效沟通。有时那种沟通还要逾越差别的脑区。
2、从大脑获得灵感
大脑的种种特征进步了它操纵能量的效率。我们有没有可能从大脑中获得灵感,造造出一种可以用极低的能量就能处置数据的电子器件或者集成电路?
若是将电子神经元和突触安拆在相邻的位置,让存储和运算过程尽可能接近,我们或许可以造造出和神经收集类似的构造。那个设法其实不别致。在20世纪80年代末,美国加州理工学院的研究员、现代微电子学的奠定人之一卡弗·米德(CarverMead)就提出了神经拟态(neuromorphic)电路的概念,他的目的是模仿大脑的神经生物学构造。但是因为手艺上的重重障碍,那种办法被萧瑟了很长一段时间。
第一个障碍就是存储器。曲到如今,电子手艺仍无法实现大规模的存算一体化。现实上,独一可以被安拆在处置器中的存储回路就是静态随机存储器(SRAM),它的成本极高,因为需要大量占据处置器外表原来就非常有限的面积。因而,处置器中的数据存储容量很小,大部门数据被保留在存储器中,物理上处在处置器的外部。目前,科学家正在测验考试多种体例,希望让存储器和处置器靠得更近。在浩瀚研究中,自旋电子学在近年获得了重要的停顿。
自旋电子学手艺不只需要操纵电子照顾的电荷,还需要操纵它们的自旋。自旋是一种地道的量子特征,其性量与角动量类似,我们能够用一个小箭头来暗示电子的自旋。自旋与电子内在的磁矩有关,所以若是一种质料中大部门电子自旋标的目的一致,它就会具备磁性。自旋电子学恰是操纵了电流中电子的自旋和磁性质料之间的彼此感化。
详细来说,自旋电子学中的根底构成元件是一种曲径数十纳米的小圆柱体,即所谓的磁隧道结。磁隧道结包罗两层磁性质料(即纳米磁体),中间是绝缘层。当两个纳米磁体磁化标的目的一致的时候,电流就能借助隧道效应(一种量子效应),轻松穿过磁隧道结,那时它的电阻很小。若是纳米磁体磁化标的目的相反,电流就难以通过,也就是说它的电阻变大了。
因为如许的性量,磁隧道结能够贮存二进造信息,用差别的磁化标的目的记录“0”或“1”。基于那种原理的存储器被称为磁性随机存取存储器(MRAM),降生于20世纪80年代中期。但是,要想改动一个比特的数值,就需要对它施加外部磁场,以此改动纳米磁体的磁化标的目的。如许的过程障碍了设备的微型化。
1996年,IBM研究员约翰·斯隆泽乌斯基(JohnSlonczewski)和美国卡内基-梅隆大学的吕克·贝尔热(LucBerger)各自独立提出了一套计划,大幅改良了那类设备。他们证了然一种新的效应,就是自旋传递。
当电流中的电子穿过磁隧道结中的一个纳米磁体时,它们的自旋会和磁体中的电子的自旋发作彼此感化,招致电流中的电子自旋发作极化,变得与磁体中的电子自旋标的目的一致。在磁隧道结中,一个纳米磁体的磁化标的目的可变(称为自在层),而另一个磁体的磁化标的目的是连结稳定的(称为参考层)。当极化的电流流过自在层,它会改动磁体的磁化标的目的。因而,只要通过把持电流的标的目的,就能写入一个比特的“0”或“1”,而不需要借助外部磁场。那个发现催生了集成MRAM的概念。
从那以后,多个微电子系统消费商都起头操纵那种手艺造造存储器。要晓得,一个硅基集成电路上就能整合10亿个如许的元件。目前那类存储器已经被应用到日常利用的电子设备中了,因为它同时具备两大类存储器的长处:读写速度和动态存储器一样快,持久贮存信息的才能和大容量存储器一样强。
由此,我们正在不竭接近神经拟态集成电路的概念。在施行运算的硅基集成电路中,磁隧道结能够被安拆在最有用的处所,以比特的形式贮存数据。正如在大脑中突触和神经元相连,那些人造“突触”可以尽量靠近用硅造做的运算中心。若是要在如许的设备上运行神经收集算法,只需为那些突触设置装备摆设上准确数值,以定义法式使命。神经收集则能够按照响应的数值,识别出图像或声音中的元素。
通过大幅削减外部存储器和处置器之间的数据交换,我们有望削减人工智能算法消耗的能量。学术界和财产界都在积极摸索那种办法。但它目前仍然无法完全令人满意:要施行一个使命,需要事先晓得每个突触要记忆的准确数值。而那类元件不具备实正的大脑所拥有的可塑性。我们希望在抱负情况下,可以造造出能够通过进修施行差别运算的回路。
3、从“突触”起头
一般来说,神经收集算法的第一步是进修。在那个过程中,神经收集需要不竭调整突触的数值,以便改良运算表示,更好完成分配给它的使命。
不幸的是,算法用来识别神经收集中突触准确数值的手艺来自于一套复杂的数学办法,被称为“反向传布”。那个过程需要施行一系列高精度运算,会消耗大量能量。那种办法适用于计算机,但关于一个要模仿大脑的系统而言并非需要的,因为新系统运算的精度相对较低。
在那种情况下,与高精度高能耗的办法比拟,再次选择模仿大脑的运算体例会更明智。值得留意的是,生物学上的突触不只阐扬了记忆功用,也是进修机造的核心。现实上,它们是可塑的,能够按照本身表露的信息量调整本身的活动。例如,当通过一个突触相连的两个神经元同时活泼,使得那个突触的活动性增加,突触就会因而得到加强。但那种加强其实不必然是完全彻底的,不然每个新信号城市抹去神经元在过去的经历过程中成立起的微弱联络。
若是要将那个原则应用到自旋电子学器件中,就要按照器件收到的信号,调整人工突触的数值。现实上,用如许的系统实现必然的可塑性是有可能的。当电压被施加到一个磁隧道结上的时候,自旋传递效应就会使此中一个纳米磁体的磁化标的目的发作改动。若是电压足够高,持续时间足够长,就足以让纳米磁体的磁化标的目的反转,从而将数值保留在磁隧道结中。但是那种反转纷歧定是可预测的:若是电压持续时间不敷长,那么磁化标的目的有时会反转,有时候不会。而对磁隧道结施加的电压越高,磁化标的目的反转的概率也就越大,但不会到达100%。
4、进修才能
在通用存储器中,那种不确定的表示必需尽可能制止。但是神经拟态系统中,突触会按详细收到的信号逐步改动它所处的神经收集的功用,调整系统对新使命的响应,而且不需要借助反向传布如许的烦琐过程。
2015年,我和同事证明,一个由自旋电子学存储器构成的系统能够进修计算高速公路上的车辆数量(精度为95%),或者识别手写数字,其办法与通用人工智能算法不异。关于那些相对简单的使命,它的表示与更传统的神经收集进修手艺相当。(而且后者需要模仿更多的突触,消耗的能量更多。)但是关于复杂的使命,例如和围棋高手对局,那种新的体例还远远无法与传统手艺相匹敌。
别的,即便我们可以实现人造突触,将信息贮存在里面,并使它可以调整响应,以此模仿突触可塑性和进修过程,但一个完整的神经拟态系统还必需同时包罗施行运算的神经元。
人类大脑中有接近1000亿个神经元,而今天的人工智能算法最多只能模仿几万万个神经元。有没有可能用现有的硅基晶体管手艺模仿神经元?起首,用那种手艺造造一小我工神经元就需要几百个晶体管,若是我们要在一个拇指大小的芯片上安拆那么多元件,那么每个神经元的大小就要远远小于1毫米,那是不成能的。
例如,IBM在2014年发布的TrueNorth芯片就是一个神经拟态元件,它令人印象深入,而且没有运用自旋电子学。那个系统包罗50亿个晶体管(一个庞大的数字),可以模仿100万个神经元和数百万个突触。通过让运算和存储的区域彼此靠近,IBM证明如许一个芯片的功率远小于通俗的芯片,差距达几个数量级。
现实上,TrueNorth芯片的架构其实不包罗100万个神经元。不外TrueNorth芯片运行速度极快,因而一个数字电路能够模仿多小我工神经元(相当于在物理上聚集在一路的一组神经元),持续施行每个神经元负责的运算。那是一个细小却严重的改革,改动了造造人工神经元和人工突触的神经拟态的根本思惟。到2017年,英特尔也开发了一个类似的芯片,称为Loihi,但它略逊一筹,只要13万个神经元。那些器件仍然体积庞大,很难想象通过那种体例就能造造出和人类大脑相当的工具。
自旋电子学还指出了另一条道路。磁隧道结能够模仿大脑神经元的核心功用,尤其是神经元之间通过释放电脉冲信号交换的特征。电脉冲素质上都是一样的,但其数量取决于神经元的活动。若是一个神经元在短时间内收到多个电信号,那么接下来它释放信号的频次也会进步;若是它只收到少量的信号,那么它传出的信号也较少。
传统的电子元件很难在纳米标准上模仿神经激动。现实上,要造造具备必然频次的脉冲信号,需要在电子回路中造造反应轮回,那也会占据空间。但是,用磁隧道结来实现那种行为是可能的。
一种处理计划是将输入信号转换为相加的电流(那点与生物体内的神经元完全不异),然后再将其注入磁隧道结。接下来,我们选择元件的性量,让输入电流中的电子的自旋不敷以完全改动纳米磁体的磁化标的目的,而是能让它持续振动、扭转,就仿佛指南针的指针那样。当参考层和自在层磁化标的目的的相对朝向发作周期性变革,磁隧道结的电阻(称为磁电阻)就会发作变革,并表示为周期性的电流变革。输入电流越强,相对朝向的扭转速度就越快,输出信号的频次也就越高。那就得到了一个与神经元十分类似的行为。那种现象在室温下就能实现,而且关于纳米标准元件而言非常不变。因而,能够操纵那种原理造造功用更完美的设备。
5、准确率99.6%
2017年,我的团队通过尝试证明,一个磁隧道结就能模仿一个神经元。我们以至还走得更远:只用一个磁隧道结,就模仿了一个由400个神经元构成的神经收集。那个计划借助了一种名为“时分复用”的战略,磁隧道结轮流饰演每个神经元的角色。随后,我们还用那个自旋电子学建构的大脑识别了差别的人说出的数字。
为此,我们先将声学信号转换成电信号,使它能通过磁隧道结。为了让它的频次处在器件的波段之内,声学信号对应的电信号要加速1000倍。通过时,它们确实改动了一个纳米磁体的磁化标的目的。随后,因为磁电阻效应的存在,人造神经元将电流形式转换为两头的电压变革。我们记录了人造神经元的电压变革,然后将它传输到一台电脑中。如许我们就能按照突触函数模仿整个神经收集。颠末进修数字发音的阶段后,那些函数就完成了设置装备摆设。随后,用新的对话输入那套神经收集,就能识别此中的数字了,准确率能够高达99.6%,表示非常优良。那个尝试证明,磁隧道结可以可靠地模仿神经元。
在神经拟态计算方面,自旋电子学范畴的研究非常鼓励人心。将来我们需要面对的挑战,是用数百万个磁隧道结模仿神经元和突触,搭建一套完好的神经收集。现在,财产界已经能将几十亿个磁隧道结安拆在芯片上,让它们接入典范电路,以此阐扬存储器的感化了。那为后续的持久研究打下了坚实的根底。
自旋电子学带给我们的欣喜还不行于此。磁隧道结还能模仿大脑的其他性量,例如相距甚远的神经元之间的同步效应。因为在大脑中,神经脉冲信号有时候会引发远处神经元的同时应答。那种同步有许多优势。在处置信号的过程中,同时发送脉冲信号的神经元愈加重要。若是它们都和统一个神经元相连,那么后者将在短时间内收到大量的脉冲信号,而且可以高效地将信号发送进来。整个系统中的神经元都遭到那个现象的收配,那产生了脑波,可以高效影响位于其他脑区的神经元的行为,虽然那些神经元可能离得很远。
6、微型“囊泡”和“受体”
磁隧道结运行速度极快,它们产生的电磁脉冲信号的频次常常超越几十万赫兹。因而,它处置信息的速度比大脑要快几百万倍。但那带来了另一个问题,那些元件的行为就仿佛纳米级的无线电收发电台。而磁隧道结对情况中的电磁波极其敏感,那可能会影响它们产生的脉冲信号,它们是灵敏的收音机。通过调理磁隧道结组合发出和收到的信号,我们有可能调理它的特征,使此中的磁隧道结彼此同步。如许就能像生物体中的神经元一样了。
在人造神经收集中引入那种同步行为,能够高效训练出适用于差别使命的神经收集,那是令人心动的一条道路。2018年,我们和同事配合研究了一种包罗400个磁隧道结的系统,它的使命是识别语音中的元音。那个声学信号被缩减成两个频次(由傅里叶阐发实现),并加速了10万倍,然后传输到4个纳米振荡器构成的天线。非常有趣的是,在那个尝试中,我们证明磁隧道结协调本身频次的才能改善了识别声学信号的表示。
为了将研究推进一步,我们需要测验考试实现一种神经收集,能让神经元通过磁隧道结收到和发出的电磁波交换。那种收集为实现浓密神经收集中神经元的彼此毗连供给了一条可靠的路子,而浓密神经收集是完成复杂使命不成或缺的。为此,一个完整的系统要将磁隧道结造造的神经元和基于MRAM的人造突触相毗连,以让MRAM具备进修才能。
如许的系统能做什么呢?我们的目的并非得到一个和人类智力八两半斤的人工智能,我们对大脑的认识还远远不敷以实现如许的成就。但是,我们希望得到一个比目前能效更高、运算速度更快的人工智能。通过那种体例,我们能够大大削减运算中心在翻译文本或者转写语音时消耗的能量,或者把如许的器件安拆在手机或主动驾驶汽车中,为日常生活带来便当。
(图文由《全球科学》杂志社供稿)
《光亮日报》( 2021年03月18日14版)
来源: 光亮网-《光亮日报》
我来回答