戴上AR眼镜,一个崭新的数字世界呈现在我们面前。
此刻,正在厨房做饭的你,将数字形态的菜谱固定在空间中,依靠眼镜、手势以及声音进行交互,跟着菜谱一步步进行备菜和制作。
你是否想过,未来的某一天,自己手里的智能手机变成了头上的AR眼镜,从“触屏时代”进入“无屏时代”。
这并非天方夜谭。空间计算的发展与进步,使这一切成为可能。
一位科学家在演讲中提到,机器在三维空间中的感知、理解与交互能力,赋予机器对空间的深度认知,使其能够像人类一样在复杂的三维世界中进行导航、操作和决策。
目前,市场上已经出现不少具有可穿戴显示屏的新型空间计算设备。这些设备拥有针对使用者的手、眼睛和声音设计的用户交互界面,能够感知周围的物理世界。
据悉,科研人员结合神经科学与计算机视觉的最新成果,正在开发能够模拟人类空间认知的算法模型,这或将推动空间计算进入“智能交互”的新发展阶段。
那么,什么是空间计算?“无屏时代”距离我们还有多远?请看本期关注。
空间计算将打破物理世界与数字世界的隔阂——
“无屏时代”离我们有多远
■蒋 杰 康 来 岳文洁
3月5日,人们在西班牙巴塞罗那举行的2025年世界移动通信大会爱立信展区体验AR设备。新华社发
从“二维屏幕”迈向“三维空间”
一天,小李和家人一起去一处知名历史景点旅游。
在景点内,借助景区为游客提供的实时AR导航服务,小李不仅形象生动地了解了地形地貌、建筑细节等景点信息,还在参观后,将自己的感受写进“AR小纸条”,留在了这片数字空间。
10年之后,小李再次来到这个景点前。打开“AR小纸条”,小李看到了自己当年写下的文字,心中感慨万千。
——这一场景,并不是没有依据的科学幻想。
通过空间计算,未来研发人员能够赋予机器“空间记忆”,将虚拟内容永久锚定在GPS、北斗等卫星导航系统的定位坐标上。
作为一种全新的计算范式,空间计算本质上是一种对空间数据进行智能解析和应用的革命性数字交互技术。
通俗地说,空间计算使计算机不再局限于二维屏幕,而能够感知、理解和交互三维空间中的物体、环境以及人的动作和位置。
最早提出“空间计算”这一概念的,是美国麻省理工学院的硕士西蒙·格林沃尔德。2003年,他在硕士论文中将空间计算定义为“人类与机器的交互”,指出空间计算的核心在于突破键盘和屏幕的传统界限,提升体验质量,让机器成为人类工作和娱乐中更全面的伙伴。
具体到计算机感知、理解和交互的过程中,激光雷达、摄像头阵列等设备和深度学习算法相当于计算机的“眼睛”和“大脑”,通过实时扫描周围环境,构建厘米级精度的三维数字模型,使虚拟物体或信息犹如真实存在一样,贴合在现实世界的桌面上、墙壁上甚至空气中。
想象一下,置身于虚拟三维场景中,你只要做几个简单的手势就能给计算机发出指令,计算机随即“看到”和“理解”我们所处的空间,并做出相应的反馈。
正如小李能够再次读到10年前写下的“AR小纸条”,空间计算能够保证信息跨越时空的连续和稳定,重构人类对数据存储与共享的认知。
纵观整个变化历程,从键盘输入、点击鼠标到滑动触摸屏,再到迈向可交互的“三维空间”,信息技术的每一次重大飞跃都极大提升了人们对于数字世界的认知和体验。
移动计算时代,智能手机打破了人类坐在电脑前访问数字世界的限制,人们可以随时随地在互联网冲浪。继而,移动互联网带来了人们在社交、购物等方面的新体验。
空间计算时代,参照现实物理世界,空间计算将逐步打破物理世界与数字世界的隔阂,将人与机器、人与人的交互方式从二维平面转向三维空间。例如,无论是简单的“控制房间灯光”,还是复杂的“使用3D摄像机对工厂某操作流程建模”,用户通过嵌入在物理设备上的屏幕,利用空间计算应用程序,将数据叠加到物理世界的视图之上。
创新技术驱动空间计算
借助空间计算,我们可以在三维空间与计算机进行更直观、更沉浸、更自然地交互,让设备更好地理解、映射我们的物理环境。
事实上,空间计算的实现,离不开其背后许多核心关键技术的支撑。
——传感器与空间感知技术。空间感知技术是指一种利用传感器和计算方法获取空间信息的技术,其核心在于通过传感器收集数据。
高精度的传感器,如激光雷达、立体摄像头和深度摄像头等,能够实时捕捉周围环境和人体动作的详细三维信息。
这些信息经过复杂的算法处理后,转化为机器或系统可以理解的模型,最终实现对周围环境的感知和理解,为后续决策和行动提供依据。
——三维建模与渲染技术。想要在数字世界中重现物理空间,这需要强大的三维建模和渲染能力。通过三维建模与渲染技术,系统可以将现实场景转化为虚拟的三维模型,并实时渲染出逼真的视觉效果。这不仅能让虚拟物体自然地融入到现实环境中,还能根据用户的视觉和动作进行动态调整。
反观景区历史景点提供的实时AR服务中,小李点击一个展览文物,就能在眼前的数字空间中,看到一个虚拟逼真的“同款”文物,沉浸式感受文物背后的故事。这正是三维建模与渲染技术的具体体现。
——人工智能与机器深度学习技术。空间计算离不开人工智能的助力。深度学习是人工智能的学习机制,通过模仿人脑的神经网络结构,使机器具有学习和推理能力。
通过深度学习,计算机可以识别和理解人体动作、语音指令,甚至预测用户的意图。特别是在三维视觉感知中,深度学习可以帮助机器更准确地识别物体和理解场景。例如,通过深度学习模型,计算机系统可以识别出用户的手势是“抓取”还是“推拉”,并做出相应的反馈。
有专家称,空间计算将是下一次人类与技术互动方式的重大转变。面向未来,不少国家已经在空间计算领域纷纷发力。
2024年2月,美国首次将空间计算纳入科技创新战略布局,强调空间计算对维系美国国家安全局势的重要性。空间计算与人工智能、云服务等核心技术并列,被共同列入《关键和新兴技术清单》。
日本也将空间计算列为重点发展领域,其科学技术厅提供专项资金,支持XR技术等基础研究和应用开发。
此外,韩国科学和信息通信技术部高度重视空间计算发展,牵头推进“XR融合技术开发项目”和研究中心建设,持续推动空间计算领域的创新和产业化。
从目前各国的发展进程来看,实现自然流畅的交互体验仍然是推进空间计算发展的核心难题之一。
一方面,空间计算应用对数据传输的实时性以及带宽的要求比较高,现有网络并发接入大量设备时,难以为空间计算提供持续稳定的低延迟和高带宽支持。
另一方面,尽管目前语音识别、手势控制、眼动追踪等技术不断进步,但在复杂场景中,现有XR眼镜等在处理复杂交互任务或高算力任务时响应迟缓,难以灵活适应多样化的用户应用需求。
总的来说,未来空间计算想要实现大规模普及,仍要在相关技术研发上持续发力。
日益广泛融入社会生活诸多领域
展望未来,作为融合数字空间与现实世界的关键技术,空间计算或将重塑人类与数字世界的交互方式,广泛融入社会生活的诸多领域,实现物理世界与数字世界“虚实共生”的发展前景。
在日常消费领域,一场“无屏化”的变革正悄然兴起。
前不久的一场国际消费电子展上,一款来自宝马公司的新世代智能座舱吸引了人们的注意。利用视平线全景显示技术,该座舱的挡风玻璃化身AR界面,为用户实时提供3D视觉效果的导航信息。
当数字信息与真实空间中的物体深度结合,人们将收获一种前所未有的新体验。
装修新家时戴上空间计算设备,你不仅可以直接测量房间的各项长度数据,还可以通过眼球注视、手势以及语音交互等,尝试将心仪的不同家具以3D模型的形态摆放在房间的不同位置,同时将各种“虚拟墙面漆”覆盖在真实的墙面上进行比较,最终选择一款真正满意的设计风格。
人们还能虚拟地在线试穿服装鞋帽。这些直接呈现在眼前的信息,不仅能帮助我们更直观地判断一家店、一款产品或者一项服务的好坏,还能减少退货的概率,为用户带来全新的在线购物体验。
在工业领域,空间计算突破了传统的时空限制,使远程协作和智能化决策成为可能。
例如,我国宁德核电站引入AR技术,戴上X-Craft工业AR头环后,现场工程师检修作业时可以与远程专家实时协作,同时记录上传工作过程的数据,为未来的维修管理提供支持。
又如,德国西门子公司利用数字孪生技术,将工厂的实时数据与虚拟模型同步,实现了从需求分析、规划设计到生产运营全过程的数字化,设备故障的预测准确率提高到92%。
在军事领域,空间计算可以帮助士兵增强在复杂环境中的态势感知能力。
例如,2022年,美军曾将一款综合视觉增强系统,投入到士兵中进行测试。在实战中,这款视觉增强系统能够为士兵提供夜视、热成像等功能,提高其态势感知能力。士兵可以通过该系统看到建筑物的全息图像,在复杂环境中更好地识别和应对威胁。
相信未来,随着网络基础设施的完善,AR眼镜等终端技术的成熟与普及,人们将拥有更智能的数字空间和更闭环的场景交互——到那时,人与人之间的网上社交不再只能隔屏交流。在三维空间中,人们会以虚拟的3D形象出现。在空间视频通话中,我们可以和远方的家人、朋友共同观看一场电影,分享感受,宛如身处在同一个房间。