一、政策法规
2、国家发改委、国家数据局印发《数字经济 2024 年工作要点》。
2、福特、沃尔沃等主流汽车制造商已在车辆设计过程中全面采用MR技术;
3、OpenAI计划下周宣布其AI驱动的搜索产品,加大与谷歌的竞争。
2、OPTIX极溯光学完成Pre-A轮融资,向XR光学技术“无人区”加速推进。
2、水晶光电完成30°全彩体全息波导片的生产线升级;
3、VueReal宣布AR显示器ColourFusion微显示。
1、谷东科技与智谱AI签署首个AR+大模型战略合作,解锁AR新方向;
2、苹果眼镜专利申请:设备包含三套显示系统。
5月7日,武汉市人民政府办公厅印发《武汉市加快数字内容产业发展三年行动计划(2024-2026年)》,旨在加快推动大模型在数字内容生产中的商业化应用,着力构建文化跨界融合新格局。
《计划》总目标为:到2026年以数字内容为代表的文化新业态特征较为明显的行业领域营业收入突破2000亿元,相关文化新业态领域增加值占全市文化产业增加值比重超过60%,对地区GDP贡献率达到3%左右,初步建成国家数字内容产业高地。
(图源:网络)
2、国家发改委、国家数据局印发《数字经济 2024 年工作要点》
近日,国家发展改革委办公厅、国家数据局综合司印发《数字经济 2024 年工作要点》,对 2024年数字经济重点工作作出部署。《工作要点》提出 9 方面落实举措,适度超前布局数字基础设施,深入推进信息通信网络建设,加快建设全国一体化算力网,全面发展数据基础设施,加快打造智慧数字生活。
(图源:网络)
二、行业聚焦
1、阿里发布大模型通义千问2.5,性能超越GPT-4 Turbo
5月9日,阿里云正式发布其通义千问的最新2.5版本。据悉,通义千问2.5相比之前版本在理解能力、逻辑推理、指令遵从和代码能力等多个方面均有显著提升,其中文处理能力继续保持行业领先水平。
此次阿里还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。
据了解,通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,是国内用户规模第一的智能编码助手通义灵码的底座。除文字处理能力外,通义在视觉、代码等多模态领域产品性能同样处于领先水平。
(图源:网络)
MR技术正在改变传统的汽车设计方式。日前,在一段宣传视频中,福特、沃尔沃和Rivian等汽车企业表示,MR头显已经帮助公司减少了汽车设计的时间和成本。
福特设计公司可视化经理Andrew Dallan-Jones表示:“我们在设计过程中使用MR技术已经一年多了,这非常令人兴奋。”该公司的视觉设计团队称,混合现实可以改善协作方式,让团队成员在设计过程中能及时讨论问题、提交物理原型,有助于加快设计过程并减少变更,同时允许团队与分布在墨尔本、美国和欧洲的同事进行“高分辨率、面对面”的虚拟设计审查。
美国电动汽车公司Rivian表示,公司在使用Varjo的技术后,仅靠材料和物理模型需求的降低,就节省了每个车辆项目一百万美元的总成本。“混合现实助于加快设计迭代周期,让团队能够在与之前相同的时间内完成2-3倍的迭代次数。这帮助团队制造更好的汽车,并快速获得实际问题的答案,例如门板是否感觉很高,或者驾驶员座椅和方向盘是否放置在合适的高度等。”
(图源:网络)
3、OpenAI计划下周宣布其AI驱动的搜索产品,加大与谷歌的竞争
5月10日,据两位知情人士透露,OpenAI计划于下周一宣布其人工智能驱动的搜索产品,从而加大与谷歌的竞争。据此前彭博社和The Information报道,微软支持的OpenAI正在开发一款搜索产品,有可能与谷歌以及资金雄厚的人工智能搜索初创公司Perplexity竞争。据称,该公告可能会在谷歌年度I/O大会周二开始的前一天发布。
据彭博社报道,OpenAI的搜索产品是其旗舰ChatGPT产品的扩展,使ChatGPT能够从网络获取直接信息并包括引用。ChatGPT是OpenAI的聊天机器人产品,它能使用该公司的尖端人工智能模型对文本提示生成类似人类的响应。
行业观察人员长期以来一直将ChatGPT称为收集在线信息的替代方案,尽管它在提供准确、实时的网络信息方面一直存在困难。OpenAI早些时候为付费订阅者提供了与微软Bing的集成。与此同时,谷歌宣布为其自己的同名引擎提供生成人工智能功能。此次新产品的推出将进一步推动OpenAI的人工智能战略。
三、融资并购
1、纳境科技获数千万元Pre-A轮融资,专注超表面光学产品
5月10日消息,杭州纳境科技有限公司(以下简称「纳境科技」)宣布完成数千万元Pre-A轮融资,本轮融资由中国互联网投资基金和浙江新干世业投资管理有限公司领投,百大集团跟投,融资资金主要用于产品开发和量产能力建设。
据了解,「纳境科技」成立于2020年,是一家专注于超表面光学器件设计与制造的科技企业。公司以超表面光学与半导体工艺相结合为基础,为光学行业提供轻、薄、高效的新一代光学元件。目前产品主要有超透镜和光谱仪两类,应用于机器人、智能手机、XR、自动驾驶、安防监控等领域。
目前,「纳境科技」超透镜产品主要包括成像、DOE、光束整形等产品。公司透露称,其超透镜相关产品已经拿到订单并处于样品测试阶段,预计二季度可以实现量产;微型光谱仪产品预计在明年可以实现量产。
XR光学技术企业OPTIX极溯光学宣布完成由春华创投领投,老股东蓝驰创投持续加注的Pre-A轮融资,这是OPTIX成立不到两年时间的第三笔融资。上一轮天使轮由蓝驰创投领投,光跃投资跟投,公司累计融资额超一亿元。在新老股东的支持下,OPTIX将进一步加速光学核心技术研发创新,不断筑高优势壁垒,向技术“深水区”和“无人区”推进。
OPTIX于2022年8月在北京成立,是一家为全球客户提供ARVR光学显示核心技术与组件的公司,以光学相关硬件研发为主线,深入底层原理、材料、设备、工艺,突破技术瓶颈,打造全球顶尖且具有“断代”竞争力的ARVR光学方案。
ARVR行业爆发需要跨越软硬件关键技术瓶颈,产品体验需要达到用户对视觉穿戴产品严苛且极致的需求。现阶段大多数产品实现了“功能”,但在体验上“妥协”。出货更多来自于“尝鲜”,在衡量产品生命力和爆发势能的粘性、推荐率、复购率上表现不佳,硬件侧的瓶颈制约了软件和生态的发展速度。OPTIX在光学设计、工艺、生产等各项环节已建立起独特的技术优势和壁垒。
(图源:网络)
四、企业动态
1、日本NTT集团旗下子公司推出AR眼镜原型,支持6DoF和无线连接
NTT QonoQ成立于2021年10月,是日本NTT集团旗下的全资子公司。2023年3月,该公司与夏普成立了合资企业NTT QonooQ Devices,集结双方的人才自主研发XR设备。
在今年的MWC上,NTT QonooQ Devices展示了他们的AR眼镜概念原型“QonooQ Glass”,这是一款轻质、高性能的AR眼镜,配备6DoF传感器和摄像头,支持无线连接,芯片采用高通公司的Snapdragon AR2。在内容端,该公司也在硬件和软件两方面迅速扩展业务,包括收购了日本游戏公司Xeen。
近日,美国波导显示和智能眼镜技术开发商DigiLens发布公告称,已经完成了对水晶光电的30°全彩体全息波导片的生产线升级。
据悉, DigiLens是全球首家实现批量化生产的体全息技术方案商,而水晶光电则是DigiLens在国内的独家授权生产商。自2020年以来,DigiLens一直与水晶光电合作,以向市场推出先进和成本效益高的波导技术。
公告指出,本次水晶光电技术升级后,“将使DigiLens能够支持消费者和企业领域不断增长的需求,并增加ARGO的生产,而ARGO是专为企业和轻工业市场设计的第一款独立AR/XR设备。通过这次升级,DigiLens最新的波导技术将能够支持未来项目的开发和规模化的更高需求。”
Micro LED技术开发商VueRealVueReal日前宣布推出可以显著提高视觉清晰度和色彩精度的AR显示器ColourFusion microDisplay。
在VueReal的MicroSolid打印平台的支持下,ColourFusion microDisplay集成了全彩microLED技术、图像质量增强算法和LCOS系统,通过节能算法和可变帧速率提供高分辨率、高灰度和色深、高对比度,而其中的关键是低功耗。
团队表示,VueReal的MicroSolid打印平台解决了大规模采用microLED显示器的首要挑战,即将microLED从晶圆高效转移到背板。VueReal的专利工艺可以以无与伦比的吞吐量、可扩展性和高产量传输数百万微米大小的LED。
五、 联盟动向
1、谷东科技与智谱AI签署首个AR+大模型战略合作,解锁AR新方向
2024年4月29日,谷东科技有限公司(以下简称“谷东科技”)与北京智谱华章科技有限公司(以下简称“智谱AI”)就大模型在AR领域落地与应用,在北京签署战略合作协议,双方正式建立战略合作伙伴关系,合作推出首个AR+大模型行业解决方案,致力于打造AR+大模型应用的标杆案例,以构建全新的AR终端及行业应用生态,为AR行业发展解锁新方向。
本着优势互补、共同发展的原则,双方将共同为行业客户提供大模型技术产品等专业服务,共同开发AR+AI大模型产品市场。双方相信,通过本次战略合作,能够帮助双方进一步推动AR+AI大模型在千行百业的应用场景落地,提升双方产品技术在各自专业领域的品牌影响力等,通过前沿新技术的融合应用催生新产业新模式,为发展新质生产力贡献力量。
“谷东科技与智谱AI将各自处于行业领先的AR、大模型技术进行深度适配和融合,强强联手,希望为行业用户开创‘知百科、识万物’的数智时代。”谷东科技创始人崔海涛在会上表示。
六、 专利情报
1、高通公司申请用于虚拟现实系统的接近运动感测专利
近日,据国家知识产权局公告,高通股份有限公司申请了一项名为“用于虚拟现实系统的接近运动感测”的专利,公开号CN117957862A,申请日期为2022年7月。
专利摘要显示,该发明提供了用于警告虚拟现实(VR)系统的用户附近环境中的危险的技术。利用虚拟现实头戴装置进行接近感测的示例方法包括经由第一无线链路与站通信,在第二无线链路上使用射频感测来检测目标对象,确定与该目标对象相关联的接近速率,以及至少部分地基于该接近速率来生成警报。
这项专利技术的优点在于,它能够增强虚拟现实系统的安全性和互动性。通过提供实时的接近运动感测和警告,用户可以更加自信地探索虚拟环境,同时避免与真实世界中的障碍物发生碰撞。此外,这项技术还可以与其他虚拟现实技术相结合,例如空间音频处理、手势识别等,以提供更加沉浸式的体验。
(图源:国知局)
近期,美国专利商标局公布了苹果公司的一项专利申请,该专利涉及了苹果未来智能眼镜的一些设计理念。
有别于普通智能眼镜设备,专利文件所展示的眼镜采用了“主辅双屏幕+LED阵列”的设计。
苹果指出,HMD设备将包括一个以第一分辨率延伸至视野的主显示器,以及一个以物理和电子方式耦合到主显示器的辅助显示器,该辅助显示器具有低于主显示器的第二分辨率。平常显示虚拟对象时主要通过辅助显示器完成,当需要调用对象(例如应用程序)与之交互时则在主显示器中显示。而镜框周围的LED灯环则用于指示、提醒等用途。
专利文件中提到了这款眼镜的数个使用场景,当在用户寻找钥匙时,眼镜将点亮部分LED灯光以指引用户前往正确的地点。