一、政策法规
2、IDC预计,到2028年全球AI支出预计将达6320亿美元。
2、清华大学、商汤科技构建用于6DoF VR体验的密集空间定向光场数据集Den-SOFT;
3、研究员提出基于Focalpose改进单RGB图像关节6D姿态和camera焦距估计准确性。
2、AR光波导企业「灵犀微光」获数千万元融资。
2、重磅!PICO 4 Ultra发布,解码国产「空间计算」新三样;
3、Meta和Snap将于下个月公布各自的最新款AR眼镜。
1、谷东科技将于CIOE期间推出新型体全息材料,FOV最高可达70°;
2、苹果未来 Vision Pro可能会采用液体镜片来矫正视力。
获悉,2024世界机器人大会(WRC)于8月21日至8月25日在北京开幕。今年以“共育新质生产力,共享智能新未来”为主题,共邀请169家企业600余件创新产品参展,其中首发新品60余款,27款人形机器人集中亮相。
本届大会通过深入研讨、集中展示最新技术、最新产品、最新应用,为各方搭建国际交流合作平台。大会论坛共分为3天主论坛和26场专题论坛,博览会大赛分为4大赛事,共吸引十余个国家的7000余支队伍、13000余名选手现场竞技。

(图源:网络)
近日,国际数据公司(IDC)发布了最新的《全球人工智能及生成性人工智能支出指南》。根据报告,预计到2028年,全球在人工智能(AI)方面的支出将超过6320亿美元,增长速度非常迅猛。具体来看,这一期间的年均复合增长率将达到29.0%。
IDC的研究副总裁Ritu Jyoti 表示,AI 的广泛应用正在推动企业在员工体验、客户互动以及业务流程等多个方面进行转型。
虽然最近一年半,生成性人工智能(GenAI)引起了泛关注,但实际上,GenAI的支出仍然低于其他AI应用,比如机器学习、深度学习和自然语言处理等。然而,GenAI的投资增速却令人瞩目,预计未来五年内其年均增长率将达到59.2%。IDC预计到2028年,GenAI的支出将达到2020亿美元,占整体AI支出的32%。
IDC的研究经理Karen Massey表示,预计到8年,美国的支出将达到3360亿美元,成为全球AI投资的最大市。

(图源:网络)
二、行业聚焦
8月21日,AR Alliance联盟宣布,高通技术公司已加入该联盟,成为董事会的最后一位创始成员。
AR联盟为各种规模的组织提供了一个支持性和中立的环境,让他们在推进和加强增强现实硬件开发生态系统方面发挥积极作用。在不断扩大的全球AR生态系统中,多元化的组织正在通过AR联盟共同努力,加速突破性技术和流程的创新,以构建AR可穿戴设备和设备,为用户创造有意义和积极的体验。
高通产品管理高级总监Said Bakadir表示:“十多年来,我们一直致力于通过我们的Snapdragon® XR平台加速创新并实现XR生态系统,为当今可用的许多XR硬件提供动力。我们很高兴加入AR联盟,继续加强XR行业。我们期待与AR联盟的成员一起贡献我们的经验和专业知识,以帮助发展增强现实领域。”

(图源:网络)
为了帮助AR/VR的发展,清华大学和商汤科技构建了一个用于六自由度沉浸式体验的密集空间定向光场数据集Den-SOFT。
现有数据集不支持在VR中实现六自由度沉浸式体验。以Immersive Light Fields和Zip-NeRF为代表的作品,要么是定点捕获,要么受到捕获路径的限制,导致重建后的VR可探索空间范围非常有限(1立方米)。
为了解决所述问题,清华大学和商汤科技的研究人员提出了一个数据集Den-SOFT。
他们搭建了定制化的移动多摄像头大空间密集光场采集系统,为各种场景提供一系列高质量、足够密集的光场图像。团队的目标是为流行的3D场景重建算法的发展做出贡献,如IBRnet, NeRF和3D高斯分裂。更重要的是,收集到的数据集比现有数据集密集得多,可以激发面向空间的光场重建。这不同于以对象为中心的3D重建,可用于沉浸式VR/AR体验。
研究人员总共使用了40台GoPro 10相机,拍摄了5k分辨率的图像。每个场景拍摄的照片数量不少于1000张,平均密度为134.68。同样值得注意的是,系统能够有效地捕捉大型户外场景。

(图源:网络)
3、研究员提出基于Focalpose改进单RGB图像关节6D姿态和camera焦距估计准确性
随着增强现实从媒体和娱乐扩展到工业和医疗应用,6D姿势估计的进步变得越来越重要。然而,使用不受控制的“in the wild”图像的AR应用程序的兴起带来了新的挑战。这种图像通常缺乏关键的元数据(如焦距),从而对传统的姿态估计方法提出了重大挑战。
所以,韩国庆北国立大学从Focalpose的神经渲染和比较策略汲取灵感,提出了一种能够有效分解从焦距估计z轴平移的方法。团队指出,这种改进不仅简化了估计过程,而且能够在各种实际应用中确保鲁棒性和准确性。
在研究中,团队提出了一种基于Focalpose的方法,而它可以改进单个RGB图像的关节6D姿态和camera焦距估计的准确性。相关改进主要集中在优化神经渲染和比较策略,通过分解焦距和z轴平移的同时估计。
姿态估计的“渲染和比较”涉及到在各种姿势中生成对象的合成图像,然后将渲染与现实世界的图像进行比较。这种技术利用深度学习算法来改进姿态预测,通过最小化渲染合成图像与真实图像之间的差异来确保准确性。
三、融资并购
1、全息技术工作室VividQ完成750万A轮融资
全息技术工作室VividQ日前宣布完成750万美元的A轮融资,而公司的总融资额已超过3000万美元。本轮融资由Foresight Group LLP领投,而GameTech Ventures和Ruttenberg Gordon Investments等新投资者,以及现有投资者均有份参投。
成立于2017年的VividQ致力于实现真正的全息技术,并已经与一系列的厂商建立了合作关系。对于本轮融资,团队计划计在2025年聘请一名美国负责人并开设美国办事处,而他们同时计划将资金用故意加快VividQ的产品开发路线图。
VividQ表示:“空间计算作为一个消费类别正在迅速增长,原因包括Apple Vision Pro的发布以及Meta等巨头正在推动XR的普及,为游戏之外的体育、娱乐和驾驶等日常活动提供沉浸式体验。VividQ的技术提供了提供消费级沉浸式体验所需的解决方案,而且我们为全息显示技术的未来设定了标准。”
Foresight Group LLP则评价道:“VividQ已经加速了他们突破性的计算机生成全息技术的商业化,并且很好地利用了下一代AR/VR硬件。我们非常高兴能领投VividQ的A轮融资,并期待着支持他们的美国扩张计划。”

近日,视谷产业基金完成对国内AR光波导企业北京灵犀微光科技有限公司(简称「灵犀微光」)的数千万人民币投资。本次合作公司与视谷基金将共同打造AR产业链,打造视谷智能物联生态圈。
据介绍,灵犀微光成立于2014年,是一家专注于AR底层光学显示技术的厂商和服务商,主攻核心器件光学引擎,致力于为企业用户提供消费级AR核心显示技术和光学解决方案。
(图源:网络)
四、企业动态
1、罗永浩新AR公司细红线科技海外分公司正在招聘
罗永浩在社交平台发文称,其AR公司细红线科技因在新加坡和美国陆续开展业务,一些岗位急需招募人才。从招聘信息来看,细红线科技海外分公司正在招聘的岗位为公司总裁助理和产品售后客服主管。
其中,产品售后客服主管一职要求应聘者拥有5年以上产品客服相关管理经验,精通“智能硬件产品售前售后技术支持、区域现场交付、备件供应链”等整体服务体系搭建和运作管理。

又一台国产消费级「空间计算机」诞生。
千呼万唤始出来,8 月 20 日,PICO 以「出彩·入境」为主题,在北京举办 2024 新品沟通会,正式推出新一代混合现实一体机—PICO 4 Ultra 系列。
其中,PICO 4 Ultra 消费者版本售价 4299 元,企业版售价 7499 元。消费版将从 8 月 20 日开启预订,9 月 2 日正式发售。
相比于 PICO 4/4 Pro,新品在运算效能、混合现实、UI、生态系统等方面进行了全面升级,并带来了「空间影像」、「MR 游戏」等重要应用场景,进一步拥抱时代变化。
此外,PICO 4 Ultra 交互手柄也进行了重新设计。PICO 将「光学追踪算法」与「CV 模态裸手追踪算法」融合,砍掉了覆盖红外 LED 的大圆环。相比上一代手柄轻约 15g,高度同时减少 50%,优化了人体工学设计与追踪精度。
基于全新混合现实一体机,PICO 还带来了新款体感追踪器,在头手 6DoF 的基础上,进一步补充「定位捕捉」,实现全身追踪,打开更多应用交互的想象空间,售价 399 元。

据The Verge报道,Snapchat和Meta两家公司都将于下个月首次发布新款AR眼镜。
据消息人士透露,Snap首席执行官埃文·斯皮格尔将于9月17日在洛杉矶举行的年度合作伙伴峰会上发布第五代Spectacles。而之后的一周,也就是9月25日,Meta的CEO扎克伯格计划在Connect会议上首次推出Meta的第一款AR眼镜,代号为Orion。
尽管 Meta 和 Snap 在开发 AR 眼镜方面走上了不同的道路,但两家公司都面临着同样的挑战:这项技术仍未准备好被主流采用。据内部人士透露,这两家公司目前都不打算出售他们即将展示的智能眼镜。相反,Snap还将重复其2021年的战略,将这款升级版的Spectacles型号分发给选定的开发者和合作伙伴。据报道,Snap生产的眼镜不到10000 副,而Meta生产的Orion眼镜甚至更少。
五、 联盟动向
1、谷东科技将于CIOE期间推出新型体全息材料,FOV最高可达70°
在科研人员近3年潜心研发的基础上,近期,通过掺杂自研的树脂材料进行上百种配方研发,谷东科新技材料团队成功研发出了新型体全息材料。该材料由PE保护膜、光致聚合物、TAC基底三明治结构组成,经过反射或透射干涉光产生带有不同周期分布的多种体全息光栅结构,拥有极佳的抗温能力(-30℃ ~ 120℃)、高结构稳定性及紫外光抗性和抗湿能力,并具有以下核心优势:
遵循布拉格衍射,能量集中,衍射效率高,相比于SRG彩虹效应弱;
折射率调制度高达0.2,视场角最高可达70°;
透明度高达95%以上、结构轻薄;
相较于SRG方案漏光小,约为5%;
可波长、角度、偏振复用,设计灵活;
可大面积制备,可广泛用于抬头显示领域;
曝光工艺简单,成本低、良品率高达80%;
相较于其他体全息材料,谷东科技新型体全息材料显著提升了透光度、色度、雾度等多种光学性能。同时,在保证折射率条制度和凝胶态模量的情况下,将成膜时间从以往的几小时缩短至几分钟内,极大提升了材料的制备效率与制备良率。
得益于新型体全息材料,谷东科技推出了行业领先的体全息光波导产品,视场角最高可以达到70°,可极大提升产品的显示效果与沉浸式体验,将成为引领AR光学显示领域的“标杆”技术方案。”
六、 专利情报
近日,美国专利商标局公布了苹果的一项名为“在虚拟环境中定制和演示产品的方法”的专利申请,专利号为20240273594,专利文件中提到:根据本公开的实施例,显示扩展现实 (XR) 环境(例如,计算机生成的环境)的电子设备。在一些实施例中,电子设备是手持式或移动设备,例如平板电脑、笔记本电脑、智能手机或头戴式显示器......
物理环境可以包括物理特征,例如物理表面(例如,地板、墙壁)或物理对象(例如,桌子、灯等)。在一些实施例中,电子设备可以配置为捕获物理环境的区域,包括桌面、灯、台式计算机和输入设备。以下是专利中提到的部分用例:
头显用户站在虚拟山脉面前,可以使用里面的虚拟手机设备拍摄广角和长焦照片以比较两者的不同;
用户可以试用配备基本处理器和内存的Mac,然后换成更快的处理器和更大的内存,以查看性能的提升;
在虚拟环境中使用不同的组件配置Mac台式机,并以统计形式和实际使用屏幕演示的形式查看各自性能的差异。然后,用户可点击“购买”按钮购买刚刚配置的系统。
(图源:USPTO)
苹果正在研发一种技术,让用户可以摆脱Apple Vision Pro矫正视力问题所需的昂贵蔡司镜片,旨在使未来Vision Pro可以根据用户正在看的内容动态改变焦点。动态聚焦系统使用充满液体的镜片和电流来调整焦距以匹配处方,当电流施加到镜片上时,液体会改变光线穿过镜片到达眼睛的方式。
据悉,苹果新申请的专利“使用配对电子设备控制的电子设备可调节镜头”扩展了其最近申请的多项其他专利。凭借这项专利,Vision Pro未来型号将配备可即时对焦的镜片,以适应各种视力问题。苹果已经申请了多个领域的专利。不过,近期专利申请的数量以及之前专利的更新可能表明,自动校正视觉技术可能很快就会出现在新款头显中。