一、政策法规
2、北京将虚拟现实专业纳入职称评审。
2、Meta向第三方开放Quest OS,华硕联想等加入合作;
3、中美研究员利用GPT-4V为XR文生3D场景建立评估指标。
2、日东Nitto宣布收购这家AR全息光学元件开发商TLO部分股权。
2、中国首个Sora级视频大模型Vidu发布;
3、二季度营收超预期后,蒂姆·库克证实了苹果的人工智能计划公布在即。
1、新单位入会 | 浙江水晶光电科技股份有限公司正式加入VRMTA;
2、苹果专利提出用于开发/调试AR/VR环境内容的IDE。
近日,《加快北京市脑机接口产业发展行动方案(2024-2030)(征求意见稿)》在“脑机接口创新发展与应用论坛”发布。
方案指出:到2026年,脑机接口核心关键技术实现突破,培育5家全国引领龙头企业、100家专精特新“小巨人”单项冠军,推动5项脑机接口医疗器械启动临床试验。建成1个特色脑机接口体验和展示中心,形成产教融合平台并培养1000人次。
(图源:网络)
2、北京将虚拟现实专业纳入职称评审
近日,北京市人力资源和社会保障局发布《关于增设虚拟现实职称评审专业的通告》(以下简称《通告》)。《通告》指出,为推进虚拟现实产业高质量发展,拓展虚拟现实领域专业技术人才职业发展通道,助力北京“四个中心”建设,将在工程技术系列增设虚拟现实职称评审专业,并于今年下半年首次启动虚拟现实专业职称评价。通告自2024年5月1日起执行。
据了解,北京市工程技术系列虚拟现实专业包括三个专业技术方向:
一是软硬件研发方向。从事虚拟现实、增强现实、混合现实及扩展现实相关的软硬件工具研发、系统开发、二维/三维建模、算法研究和软件引擎创建,以及相应设备配套集成等工作。
二是数字资源设计制作方向。从事虚拟现实、增强现实、混合现实及扩展现实等设计工作并创建出拥有独立知识产权的数字资源。
三是应用场景建设方向。从事虚拟现实、增强现实、混合现实及扩展现实相关的项目路径规划设计、技术框架构建、软硬件适配、数字资源应用调试,以及系统的持续更新和内容迭代。
《通告》指出,虚拟现实专业职称设置初级、中级、副高级、正高级四个等级,名称分别为:助理工程师、工程师、高级工程师和正高级工程师。在北京市国有企业事业单位、非公有制经济组织、社会组织等机构中,上述专业技术领域人才均纳入评价范围。
二、行业聚焦
1、超过50%的财富100强企业已经在使用苹果Vision Pro
在苹果公司日前的财报电话会议上,苹果CEO蒂姆·库克(Tim Cook)透露,《财富》100强企业中有一半已经购买了苹果 Vision Pro设备。
虽然Vision Pro推出仅3个月,且行业对其的大部分焦点都集中在消费者领域,但由于昂贵的价格,苹果也非常重视其在企业端的应用。
苹果方面透露,包括荷兰皇家航空公司、SAP、保时捷、Lowe's 和 EnBW 在内的企业已公开确认将Vision Pro与自定义visionOS软件投入使用。
库克称:“人们在企业中将Vision Pro用于包括现场服务培训,医疗保健等在内的许多不同的事情,因此它涉及大量不同的垂直领域。我们的重点是发展Vision Pro的生态系统,让更多的应用程序和越来越多的企业参与进来。”
(图源:网络)
据外媒消息,近日,Meta公司宣布将其Quest操作系统向第三方开放,标志着混合现实行业的一大进步。此举类似于将Quest的生态系统从封闭的苹果模式转变为更开放的Android模式,鼓励其他硬件制造商利用Meta的平台开发自己的虚拟现实设备。
随着这一策略的转变,Quest操作系统也更名为“Meta Horizon OS”。目前,该系统已经吸引了华硕的玩家国度(ROG)品牌和联想等重量级合作伙伴。华硕正计划开发一款以“高性能游戏”为主打的耳机,而联想则着眼于“生产力、学习和娱乐”领域,推出新型虚拟现实设备。
同时,Meta还透露,他们正在与微软紧密合作,开发一款受Xbox启发的限量版Meta Quest耳机,旨在为用户提供更加丰富和沉浸式的游戏体验。此外,双方还计划将Xbox云游戏引入Meta Horizon OS,进一步拓展游戏内容的多样性。
Meta也向谷歌发出了合作邀请,希望将Google Play 2D应用商店引入Meta Horizon操作系统,从而为用户提供更多应用选择。同时,为了增强Horizon生态系统的内容,通过Quest应用实验室开发的软件也将在Horizon Store中亮相,为用户提供更多优质内容。
此外,Meta还在积极开发一个新的空间框架,以帮助移动开发者更轻松地创建混合现实应用程序,进一步推动混合现实技术的发展。
(图源:网络)
3、中美研究员利用GPT-4V为XR文生3D场景建立评估指标
文生图(Text to Image),文生视频(Text to Video)和文生3D(Text to 3D)等领域正在蓬勃发展。可以想象,所述的文生技术可以与XR结合,为XR快速生成各种逼真场景。
但技术的发展初期可能存在缺乏可靠评估指标的问题。在围绕文生3D的研究中,由香港中文大学、斯坦福大学、Adobe、南洋理工大学和上海人工智能实验室组成的团队表示,GPT-4V是一个能够与人类判断保持一致的评估指标,可以有效地提供针对文生3D模型的高效和全面评估。
三、融资并购
1、元宇宙平台STYLY获三菱商事新一轮融资
STYLY发布公告称,公司已经完成来自三菱商事株式会社的新一轮融资,融资金额暂未明确。
STYLY是一个日本元宇宙平台,平台主打低门槛使用,玩家可以在上面构建各种VR/AR体验。
官方信息指出,STYLY拥有基于十万余名创作者所构建的庞大的全球社区,发布的数字内容已经超过200000种。适配方面,平台支持智能手机、VR/AR等多种设备。
据了解,三菱商事旗下拥有多个国内外房地产和城市开发项目,未来STYLY将利用其XR技术为三菱商事提供更多有关音乐、视频、艺术、体育、娱乐等方面的内容。
近日,Nitto(日东电工株式会社)宣布收购TruLife Optics(后简称TLO)部分股权,TLO是一家英国企业,成立于1998年,员工数37人。公司主营业务为AR设备全息光学元件(HOE)的开发和制造,涉及光学设计、全息材料选择、原型制作、大规模复制和封装等流程。
据悉,Nitto也在开发材料,并通过利用企业在粘合剂、薄膜、片材技术以及光学设计技术方面的优势构建下一代AR眼镜产品。此次股份收购意味着Nitto正积极进入AR眼镜领域。值得一提的是,早些时候Nitto曾提出了“Nitto for Everyday 2025”计划,该计划也将AR列为重点关注领域之一。
(图源:网络)
四、企业动态
1、DigiLens和水晶光电升级产线,提高波导供应能力
波导技术厂商DigiLens及其合作代工厂水晶光电日前宣布,已完成波导生产线的升级,从而确保可以满足消费者和企业市场不断增长的波导需求,以及智能眼镜产品ARGO的产量。通过生产线升级,DigiLens的最新波导技术将能够支持未来项目的发展和更高的规模需求。
据介绍,DigiLens自2020年以来一直与水晶光电合作,共同将最先进、最具成本效益的波导推向市场。
水晶光电表示:“经过对数种波导解决方案的深入评估,我们选择了DigiLens的技术,因为它是大批量制造中最具吸引力的技术,并且具有出色的图像质量,而且其价格在行业中无与伦比。我们期待着继续与DigiLens合作,以满足市场对ARGO日益增长的需求,并与消费者和企业领域的一级客户共同寻求机会。”
DigiLens则评价道:“水晶光电是一家领先的大批量光学元件制造商,在光电薄膜制造方面拥有丰富的经验。他们是DigiLen在波导制造方面的转型合作伙伴。”
在4月27日举办的2024中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。
据了解,该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
在当天的论坛上,清华大学教授、生数科技首席科学家朱军表示,与Sora一致,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
日前,苹果公布2024年二季度财报,公司二季度总营收为907.53亿美元,同比下降4%,好于市场预期的903.3亿美元;净利润为236.36亿美元,同比下降2%,同样好于市场预期的231.7亿美元。
而在公司财务业绩电话会议期间,苹果首席执行官蒂姆·库克(Tim Cook)提到了苹果的人工智能计划。
虽然库克强调他对苹果人工智能的未来持乐观态度,但他并未透露苹果可能正在开发的特定功能或服务。库克表示,苹果正在对这项新兴技术进行大量投资,公司在充分利用人工智能方面具有独特的优势,因为苹果的硬件、软件和服务已经实现了无缝集成。“我们认为生成式人工智能是我们产品一个非常关键的机会,从理论上讲,苹果拥有与众不同的优势。我们将在未来几周内更多地讨论这个问题。
苹果首席财务官卢卡·马埃斯特里(Luca Maestri)表示,苹果在过去五年中在研发上花费了超过1亿美元。苹果对于人工智能模型和服务的开发将继续基于自身的数据中心和第三方提供商的数据中心。
库克还表示,配备苹果设计的M3芯片的MacBook Pro是市场上最适合使用AI模型的笔记本电脑。在谈到Apple Watch时,他强调了在Apple Watch上已经有两个功能使用了人工智能算法,包括心跳检测和跌倒检测。
五、 联盟动向
1、新单位入会 | 浙江水晶光电科技股份有限公司正式加入VRMTA
浙江水晶光电科技股份有限公司正式加入虚拟现实制造业技术创新战略联盟(VRMTA),成为联盟会员单位!
水晶光电致力于成为“全球卓越的一站式光学解决方案专家”提供从元器件到模组及解决方案的一站式专业服务。在“全球化、技术型、开放合作”三大战略方针的指导下,水晶光电与国内外终端客户建立了全面、深入且稳固的合作关系,在薄膜光学、半导体光学、精密制造等领域拥有强大的综合竞争优势。
六、 专利情报
1、索尼AR/VR专利提出用于云游戏和元宇宙的可扩展数据中心平台
在名为“Scalable data center platform for cloud gaming and metaverse”的专利申请中,索尼提出了一种用于云游戏和元宇宙的可扩展数据中心平台。团队指出,这个可扩展数据中心平台的优点包括增加了应用的处理能力。其中,当执行相应的应用程序时,可以基于相应的工作负载动态地向相应的基于云的游戏引擎添加计算资源或从相应的游戏引擎中移除计算资源。
换句话说,游戏引擎不再受计算资源的静态分配的限制,因为在执行相应的应用程序时,基于云的游戏引擎可以根据工作负载动态配置微服务。这允许动态分配执行相应应用程序所需的适当数量的资源。
所以,可以将应用程序设计为通过利用众多服务器甚至服务器机架的马力,而不是针对单个硬件来设计。以这种方式,云原生应用程序可以提供以前不可能的体验,因为计算资源的按需分配可以部分地提供增加的图像质量,而且即便与本地游戏体验相比都可以减少云游戏系统和客户端设备之间的延迟。
其他优点包括与数据中心的资源利用相关的效率提高。总体而言,数据中心可以最大限度地利用计算资源,并将计算资源闲置的时间降到最低。
(图源:USPTO)
在名为“Three-dimensional programming environment”的专利申请中,苹果提出了一种用于开发和/或调试扩展现实环境内容的IDE。
用于IDE的控件可以呈现为:第一组选项(如用于IDE的全套控件)或第二组选项(如具有用于IDE的缩减控件集的迷你播放器)。在一个实施例中,第一组选项可以锚定在3D环境内,而第二组选项可以可变地定位(例如基于用户的手)和/或基于情景(例如用户是否正在运行、编辑调试代码等)来提供。
在示例性用例中,锚定的用户界面可以为处理XR内容的用户提供一整套IDE功能。用户可能能够站起来四处走动以检查内容或在远离完整IDE功能集的3D位置播放内容。在远离完整的IDE功能集时,用户可以使用迷你播放器的第二组选项来访问特定IDE功能集,而不必返回到完整的IDE功能集所在的位置。