一篇基础研究论文刷屏,曝光了高通未来布局的一角
允中 发自 凹非寺
量子位 报道 | 公众号 QbitAI
Qualcomm成功的秘诀是什么?
Qualcomm——高通,移动互联网时代最成功的公司。
一代代旗舰芯片和移动平台,更是安卓手机厂商核心竞争力和卖点之一。
但成功的花儿,外界更多看到花开时的艳丽,鲜能关注绽放前的艰辛。
所以最近一篇AI论文发布后,意外引起论文之外的讨论。
中国俗语:台上一分钟,台下十年功。
如果说移动时代的成功“秘诀”太难追,那这篇论文展示的,正是高通面向AI时代的“十年功”管窥。
一篇基础理论的AI论文
这篇引发思考的AI论文,全名:Gauge Equivariant Convolutional Networks and the Icosahedral CNN.
中文翻译:《规范等变卷积网络与二十面体CNN》。
主题高深,着力点又极其基础——把数学、物理方面的基础理论,用在卷积神经网络(CNN)攻坚中。
概括而言,之前的卷积神经网络主要被用于平面问题,而且不具有旋转不变性。
但高通的这项新研究,可以基于规范等变CNN的方法来实现一个尼曼三维任意曲面的旋转不变性,这不仅是CNN模型新突破,而且结果可以用在全球气候模式、医疗影像的研究上。
论文作者也非泛泛之辈。
Taco Cohen和Max Welling(韦灵思),均来自高通AI研发团队。其中,韦灵思教授是深度学习领域知名科学家、变分自动编码器(VAE)的提出者,还是诺贝尔物理学奖得主Gerardus’t Hooft和图灵奖Geoffrey Hinton的学生。
这篇论文,可以说是韦灵思教授等集师承之所长的结果。
于是从论文本身到作者背景,立马在AI科研圈引发反响:
推特上,转发超过300,点赞数1千2——作为这样一篇看懂标题都不易的论文,足见其影响了。
更主要的是,高通AI研究院展开如此基础的研究,令不少人感到震惊。
一般而言,企业内部的研究院,虽然也会偏向学术式推进,但会偏重企业的侧重所在。
比如高通这样的公司,或通信或芯片,或者移动基础架构。
但韦灵思等大牛的研究,更基础更理论,并看不出限制。
这还不是孤立事件,稍早之前,韦灵思教授等还将广义相对论和量子场论的数学原理应用到深度学习中,提供了3D物体识别的新思路。
更早之前,还在神经网络压缩、机器学习训练工具等基础方面展开攻坚。
所以也有人评价说,高通深厚的专利和技术壁垒背后,正是提前对上述看似无用的基础研究的持续投入。
而等到OEM厂商争相搭载骁龙芯片时,这些隐而不彰的基础成就,虽然无迹可寻,但实际早已春风化雨。
高通AI生态
高通内部支持上述基础理论研究,彰显着高通对AI变革趋势的判断,也是面向新时代的适者生存。
至少目前对外宣示的是这样:
除了优势所在的手机终端,还正在把势能延伸向物联网、汽车,渗透到更多的端、边缘,最终结合云端,让AI等新技术无处不在。
越来越多智能传感器,也正在让数据呈现大爆炸之势。
于是AI走向边缘、走向IoT终端,开始呼之欲出。目之所及,扫地机器人、安防摄像头、交通信号灯,包括汽车等等,都到了需要一颗“芯”的时候。
这不正是高通所长吗?
在今年的高通人工智能开放日上,高通也在IoT和汽车领域大秀肌肉,吸引众多目光。
在其发展战略中,把汽车视为智慧城市、智慧基础设施中的一环,包括道路在内就有无数传感器,都在为智能汽车服务。
高通希望车与车、车与智能交通设施完全连接,形成一张V2X的巨大信息网,所有联网共享的设备可以实时共享数据,而AI可以让这些数据得到最好的运用。
在开放日现场最吃香的是一个专为司机提供的智能数字座舱,第三代骁龙数字座舱平台为AI添加了人性化特色,不仅在用户看不见的智能驾驶芯片和算法中,在车内的增强现实抬头显示(HUD)、虚拟助理等方面,也能让用户直接感受到AI的强大,可以为驾乘人员打造突破性的全新体验。
实际上,智能数字座舱也最能体现AI时代的高通将往何处去。
在整个场景下,骁龙820A平台提供了技术基础,第三代骁龙汽车平台集成多核高通人工智能引擎AI Engine,拥有高通安全处理单元(SPU),以及高通视觉增强高精定位和计算机视觉处理能力,能够一系列AI基础能力,但进一步延展开来的还有语音交互、AI视觉等方面的诸多能力。
你可以将“数字座舱”与“手机”相类比,只是前者类似的场景,比手机多得多——甚至目前还难以穷尽,这是一个完全增量的市场。
所以回过头来看,高通在去年11月建立的1亿美元AI风险投资基金,所投方向涉及自动驾驶汽车、机器人、计算机视觉以及物联网等领域,野心也便再清晰不过。
手机依然是主战场
不过,手机依然最大智能终端。
或者说在AI时代,智能手机会真正被AI赋予“智能”能力。
2018年的骁龙820开始,高通的旗舰芯片就已经在全面集成高通自研人工智能引擎AI Engine。
今年的异构多核旗舰移动平台骁龙855集成了最新的高通第四代人工智能引擎AI Engine,所谓异构计算就是由CPU、GPU、Hexagon不同功能的核心发挥各自所长,而又相互协作,共同实现高效的AI处理。
高通骁龙855芯片中,Adreno 640 GPU、Hexagon 690处理器和Kryo 485 CPU相互协作,通过异构计算智能分配AI任务,相比前代实现了整体AI性能3倍的提升。
其中Hexagon 690新增的Hexagon张量加速器(Hexagon Tensor Accelerator,HTA)功不可没。
张量运算是AI算法中的基础操作,PC和云计算厂商近年来引入张量计算单元为AI加速。该张量加速器是Qualcomm自主设计、面向更多AI处理的硬件核心。
Hexagon张量加速器的加入对手机行业意义重大,它不仅使数字信号处理的功能得到扩展,还让开发者实现可编程的AI加速。AI如今已经成为高端智能手机的核心卖点。
时代也正在发生这样的变化:
仅有AI硬件的升级远远不够,还需要有软件开发商的支持,才能发挥出高通第四代人工智能引擎的运算潜能。
在软件框架层面,骁龙855底层硬件支持TensorFlow、PyTorch、ONNX等主流机器学习平台,以及Google NN API等运行软件框架,让开发者充分利用AI特性,围绕高通人工智能引擎AI Engine,打造覆盖范围最广的AI生态系统。
同样在高通AI开放日现场,去除噪点、实时翻译语音、手势识别等实际应用,都是AI带来的新变化。
曾经在PC上需要大量资源才能运行的图像、语音处理模型,如今在手机上也能轻松运行。
而且AI也让高通的生态空前庞大,商汤、旷视和虹软等AI独角兽也都纷纷参与到高通AI朋友圈中,基于芯片和软件支持平台,最后推出更丰富的AI应用和场景化落地。
基础研发启示录
所以归根结底,无论是手机方向上的努力,还是更宏大的AI生态蓝图。
这篇高通AI基础论文背后的启示,早已再清晰不过。
如果不在基础研发下苦功,任何领先和生态,都只会是窒息一场。
所谓台上一分钟,台下十年功。
之前太多羡慕高通移动时代的话语权之强大,但鲜有背后研发投入和基础苦功的阐释表达。
现在,这篇引起学界一番热议的论文,恰似一个注脚,能够解释高通之所以引领了一个时代的核心原因。
也是值得更多拥有宏图梦想的AI公司们学习的原因。
我来回答