用AI实现隔墙“透视”,准确率达97%,那家中国公司研究入选CVPR
晓查 发自 凹非寺
量子位 报导 | 公家号 QbitAI
试想一下,主动驾驶汽车行驶到了拐弯处,即便激光雷达再强大,也无法探测到建筑物后的有什么工作发作,若是是突然有行人冲出来,后果不胜想象。
其适用激光连系强大的AI算法,能够帮你看到墙后事实有没有人,以至还能看出他的姿势。
比来,一家来自中国的AI创业公司合刃科技与华中科技大学、斯坦福大学等合做,测验考试用墙壁散射的光往复原被遮挡数字,正确率更高能到达97%,整个过程不需要1秒,更适宜用在需要实时处置的主动驾驶。
他们的论文《Direct Object Recognition Without Line-of-Sight Using Optical Coherence》已被CVPR 2019收录。
之前,量子位介绍过一种能够用墙面反射的复原屏幕内容的 *** 。而合刃科技提出的 *** 不需要复杂的图像重建过程,不只能恢复简单的图像,以至还能揣测人体的姿势。
隔板猜物
研究人员给算法出了道难题,让它从拍摄白墙上的画面,揣测黑色挡板背后屏幕上的内容。因为被拍摄物体和相机之间有不通明的阻碍物,因而相机只能收罗到挡板上漫反射的光。
上面的规划太复杂,简化后的示企图如下:
除了那种比力简单的情形,研究人员还给算法出了两道附加题:让激光往返反射绕过两堵墙,以至还想象了一种“扭转的墙壁”。
由全息照片猜数字
激光与我们日常见到的日光、灯光区别,不只能笔录强度,还能笔录相位信息,通俗地说就是能笔录被拍物体的立体信息,与全息拍照类似。
当照顾MNIST数字信息的相关光颠末挡板漫反射后,构成散斑图。固然由散斑图复原物体有困难,但是能够用AI算法,对阻碍物后面的数字变革停止实时识别。
仅仅能识别数字图像还不可,研究人员还测验考试从散斑图找到中得到墙后面隐躲的人,已经他正处在什么姿势。
在处置图像时,AI算法用了两个收集:
1、SimpleNet,它用来对10个数字图像停止分类,包罗4个卷积层,完全毗连层中由1024个神经元。
因为全息图像的每个区域都包罗被拍摄物体的全数信息,为了减小计算量,研究人员只拔取照片中200×200的一小块区域,从拍摄的1万张照片中拔取95%做为练习集,5%做为数据集。
2、ResNet-18,它用来对人体姿势停止分类。输进图像被裁剪至224×224。
正确率更高97%
在识别MNIST手写数字的尝试中,算法的均匀识别正确率均在91%以上,更高可达97%。
通过深度进修的AI算法处置,研究人员对12小我不消的10种姿势停止识别,得到的均匀识别正确率为78.18%。
论文链接:
— 完 —
诚挚雇用
量子位正在招募编纂/记者,工做地点在北京中关村。等待有才华、有热情的同窗参与我们!相关细节,请在量子位公家号(QbitAI)对话界面,回复“雇用”两个字。
量子位 QbitAI · 头条号签约做者
վ'ᴗ' ի 逃踪AI手艺和产物新动态