增强现实(Augmented Reality,简称AR)技术是一种基于计算机实时计算和多传感器融合,将现实世界与虚拟信息结合起来的技术。该技术通过对人的视觉、听觉、嗅觉、触觉等感受进行模拟和再输出,并将虚拟信息叠加到真实信息上,给人提供超越真实世界感受的体验。目前广泛接受的一种定义是Azume在1997年提出的,他认为AR应该具有三个特征:
我们所要讨论的增强现实,主要是视觉增强现实技术,核心在于虚拟信息和真实世界在物理空间中的匹配以及可视化。增强现实是一个多学科交叉的研究领域,内容纷繁复杂,选取其中某个点深入下去都可以作为长久的研究课题。一个完整的AR系统至少有三个部分:跟踪、注册和显示。
Sutherland在1968年完成了第一台头盔显示器,堪称头盔显示器的开山祖师。不过由于当时技术限制,该设备非常笨重,需要悬挂在房顶上使用,于是被戏称为“达摩克利斯之剑”。
70年代、80年代也有很多研究者做了相关的研究工作,但是直到90年代初期,“Augmented Reality”这个词汇才首次诞生。渐渐地,增强现实脱去虚拟现实的外衣,成为一个独立的研究领域。
随着21世纪初期智能手机的兴起,增强现实有了天然的开发载体,视频式的增强现实迅速发展起来。这也得益于ARToolKit和Vuforia等基于图像的跟踪定位工具的相继推出。如下图,使用智能手机和平板电脑作为平台的增强现实应用,目前已经非常普遍。
但是,智能手机和平板电脑毕竟只是视频式的增强现实,相比于光学式的来说,还是少了一点科技感和刺激感。于是谷歌在2012年发布了Google Glass,为增强现实的发展注入了新的活力。它对于AR发展的作用应该就像是Facebook的Oculus Rift之于虚拟现实一般。2014年3月26日,Facebook宣布将以约20亿美元的总价收购沉浸式虚拟现实技术公司Oculus VR。这一事件极大地推动了虚拟现实的发展。
类似地,Google等商业巨头投身AR,也必将对AR起到巨大作用。尽管后来GoogleGlass停产,但是其作用不可忽视。之后,又有更多的公司推出了自己的光学式增强现实眼镜,最著名的是Microsoft Hololens和Maigc Leap。
1、显示技术
近眼式显示设备
近眼显示设备主要是指头盔显示器。头盔显示器主要分为两种:光学透射式头盔显示器和视频透射式头盔显示器。当然如果按照显示器件数量,也可以划分为单目头盔显示器和双目头盔显示器。这里主要讨论光学式(左)和视频式(右)的区别。
光学透射式头盔显示器是直接透射外界的光线,并且反射微投影器件产生的虚拟图像到人眼中,达到虚实融合的效果。优点是可以保证正确的视点和清晰的背景,缺点是虚拟信息和真实信息融合度低,且人眼标定比较复杂。目前市面上典型的光学透射式头盔显示器有Hololens和Meta2等。
而视频透射式头盔显示器,是将固定在头盔上的摄像头所捕获的图像,通过视点偏移来显示到眼前的显示器上。优点是虚实融合效果好,无需标定人眼,缺点是视点难以完全补偿到正确的位置,且与镜片范围外的环境不能完美衔接。将上面的光学透射式头盔显示器,加上摄像头,并且把带有增强信息的视频直接全屏显示,就成为了视频透射式设备了。很巧的是,很多光学透射式设备,确实在其上加装了这种摄像头,但是它们的本意是用摄像头来作为跟踪模块的。
小结与分析
增强现实中主要的显示设备就是以上这些。如果要开展关于显示技术的研究,从硬件方面来讲,就是显示材料、器件的研发。当然这与增强现实并没有高度相关性,只能说显示设备参数的提升,可以间接促进增强现实系统性能提升。但是显示方面,软件还是可以有些值得做的东西,并且与增强现实体验息息相关。那就是头盔显示器的显示畸变校正和投影机画面拼接融合,这些技术都直接影响着增强现实系统虚实融合精度和整体可用性。
研究增强现实技术的人,很多是侧重于系统集成和应用测评,或者是直接将AR系统应用在其他的研究领域。因此,这些人一般不会研究显示元器件的细节,而更加关注如何拿现有的材料或者设备来构建新型显示系统。如果能够做出新的AR系统,并且具有实用意义,也是非常有研究价值的。
2、跟踪技术
跟踪理论会涉及到一些空间坐标转换的基础知识,以摄像机跟踪为例,分为模型坐标空间、世界坐标空间、摄像机坐标空间和图像坐标空间。由于比较细节,这里不展开讨论,相关知识可以查阅计算机视觉书籍即可。这里以不同种类的跟踪系统为例来讨论跟踪技术。
电磁跟踪器是通过一个固定的发射源发射出三维正交的电磁场,接收端通过检测接收到的电磁场的方向和强度来确定位姿。
超声波跟踪器则是通过测量一个声音脉冲从发射源到传感器的飞行时间来测量距离。
无线网是通过检测移动设备接入点信息来粗略确定移动设备所处位置的。它可以配合GPS使用。
磁力计,也称电子罗盘,通过检测地球的磁场来确定方向。
陀螺仪和线性加速度计都是依靠惯性来进行测量的。陀螺仪测量三轴角度变化,线性加速度计测量位置变化。它们通常会配合使用,并且常以微机电系统(MEMS, Micro-Electro-Mechanical System)的形式存在。
里程计是通过轮式或者光电编码器来测量所走过路程的一种传感器,常用在机器人或者交通工具中。
(2)照明种类
跟踪的稳定性与环境光有关,尤其是基于视觉的跟踪。有些跟踪系统不需要自主添加光源,只是利用环境光,称为被动照明;有些跟踪需要主动发射某种照明光线,来实现其跟踪,称为主动照明。被动照明是比较常见的,例如平面标志跟踪就是在普通的环境照明下实现的。主动照明最典型的就是结构光照明,例如Kinect。还有一种主动发射红外光的OptiTrack系统,做姿态跟踪效果很好。
(3)人工标志与自然特征
人工标志指的是人造的用于跟踪的图像标志等。例如二维码、棋盘格等。自然特征指的是自然环境中本身就有的特征,不是人为放置用来跟踪的特征。普通的室内环境、街边的楼宇都可以认为是自然特征。人工标志根据其种类不同,需要特定针对性算法进行检测和跟踪,自然特征通常使用SIFT、SURF、ORB等特征描述子来进行特征提取和跟踪。
小结与分析
笔者认为,纯粹的跟踪技术研究,不仅可以服务于增强现实,也可以服务于虚拟现实,以及其他需要用到该技术的领域。研究跟踪技术,可以从多视图几何方向入手,通过几何的方式来估计位姿。也可以从特征角度入手,针对特定的问题,设计不同的特征表述方式,解决问题。
SLAM研究者们通常会考虑怎样建立更加稳健的SLAM系统,怎样对抗真实环境中的噪声,怎样进行更好的回环检测等。研究惯性测量单元(IMU)与视觉融合进行SLAM的也大有人在,多传感器数据融合对于SLAM来讲有重要的意义。
在研究基于视觉的跟踪技术时,会用到很多计算机视觉算法。计算机视觉本身就是一个很庞大的学科,感兴趣的读者可以根据自己的兴趣,选择相应的书籍进行展开阅读。这里推荐两本书,一本是《计算机视觉——算法与应用》,另一本是《计算机视觉中的多视图几何》。
3、标定和注册
跟踪、标定和注册是AR系统研究的三个核心问题。前面我们已经讲了跟踪技术,这里将对标定和注册进行叙述。
(2)校正镜头畸变
镜头畸变可以分为径向畸变和切向畸变两种。它们也都可以通过标定来确定畸变参数。镜头畸变是普遍存在的,所以在使用之前要记得先进行标定。
(2)使用瞄准转置
该方法需要将瞄准装置与显示器上的十字叉丝对准,而不是使用在SPAAM中用到的静止标定点。这种瞄准装置经常是作为AR设备的一部分,并且包括一个触发器来确认对准完成。瞄准装置有一个优势,用户不必再移动头部来完成对准,取而代之的是,可以通过移动手臂来完成。
小结与分析
摄像头标定本身已经是一个很成熟的领域了,除非有什么新的摄像头类型推出。光学透射式头盔显示器的标定也比较成熟,但是还是存在问题。比如标定程序复杂,不同用户之间通用性低。所以可以根据人眼与HMD之间的特殊性,研究提升标定效果的方法。另外,还可以考虑减小延迟,比如考虑视觉-IMU融合。这种方法已经在Hololens上获得成功应用。减小延迟的方法除了使用视觉-IMU融合,应当还有别的途径,这些都是值得研究的地方。
4、视觉一致性
小结与分析
视觉一致性分析实际上主要是对增强现实系统的表现进行评价。一旦涉及到用户研究,就有很多值得研究的工作。比如研究AR系统的几何一致性对用户使用头盔效率的影响,以及图像呈现与环境配合关系。尤其是光照研究,自然光照是非常复杂的,要想完全模拟自然光是非常难的。所以这个点上还是有很多值得研究的东西的。
5、交互技术
交互听起来有些陌生有些抽象,但是确是一个非常常见的过程。比如,我们日常使用鼠标键盘就是在与计算机进行交互。人机交互就是人与机器之间进行信息沟通的过程。按照交互方式的不同,增强现实中的人机交互技术可以分为多种,下面一一介绍。
小结与分析
人机交互是一个非常大的研究领域,在增强现实中涉及到的人机交互技术也有很多。我们可以针对某种交互形式展开研究,无论是建立人机交互接口,还是评测交互性能,都是一个不错的切入点。相信很多读者都会有兴趣构建一套属于自己的人机交互系统吧。
6、可视化
增强现实中的可视化,主要是对场景中的物体进行标注和解释。对于标注和解释的合理性和正确性,需要经过仔细探究。一个场景中可能有很多东西可以标注,也有很多来自数据库的信息可以呈现。但是如果不加选择全部显示出来,还是会发成数据冗余、屏幕混乱的情况。因此需要对数据进行过滤,考虑两个方面的问题:第一,标注的合理性;第二,数据推送智能性。
7、典型应用方式
根据一个系统中虚拟与现实的占比,可以将系统分为4类:真实现实、增强现实、增强虚拟、虚拟现实。而增强现实和增强虚拟又可以合称混合现实。
从上图可以看出,橙色代表虚拟成分,蓝色代表真实成分。当只有真实世界信息的时候,属于纯粹的真实现实,典型的就是我们带摄像功能的手机,以及我们佩戴的普通眼镜。当系统中既有真实信息又有虚拟信息的时候,叫做混合现实。此时,如果虚拟信息是服务于真实世界的,且数量较少,占次要地位,则归为增强现实,典型系统是手机导航系统;如果虚拟信息是主体,而真实信息是为虚拟信息服务的,那就叫增强虚拟。最后,如果信息全为虚拟,则是虚拟现实,典型系统是各类虚拟现实游戏。
增强现实技术的应用领域:
增强现实技术已经发展了几十年,但是还没有达到巅峰。增强现实的推广,还必须依赖于几个方面的进步:
可以预期,在五到十年的时间里,增强现实技术将会取得重大进步。各大科技巨头也将会重点布局这个新兴领域,随之极大推动该产业的发展。增强现实技术与虚拟现实技术、人工智能技术将会紧密结合,形成下一代科技革命的发力点,极大革新人类的生活方式与生产方式。也许十年、二十年后,增强现实设备就会完全取代智能手机,成为下一代智能计算平台、社交平台和支付平台,带领人类进入全新的发展阶段。
生产力的发展如此迅速,增强现实普及之日并不遥远——然而,当一切构想全部实现,进入“增强现实”时代,等待我们的下一个神奇又会是什么呢?
参考文献《Augmented Reality——Principles and Practice》作者:DieterSchmalstieg, Tobias Hollerer.
Copyright © 皮乐思 京ICP备18040450号-2