news 2026/4/4 11:23:09

上海人工智能实验室等推出超广角裸眼3D显示系统,AI代替眼镜感受视觉深度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
上海人工智能实验室等推出超广角裸眼3D显示系统,AI代替眼镜感受视觉深度

来源:ScienceAI 本文约2000字,建议阅读5分钟 当设想真正普及,屏幕将不再是平板,而是一扇通往深度世界的窗口。

科幻片里,经常能看到这样的画面:主角伸手就能触碰到悬浮在空中的三维投影,提供装备或者地图设计。但如果,没有 3D 眼镜,没有头戴设备,只靠一个普通屏幕,你就能感受到深度呢?

这个画面,对很多人来说一直只是「科幻」。因为几十年来,裸眼 3D 技术都被一个叫做 「空间–带宽积 (Space-Bandwidth Product, SBP)」 的物理规律拖住——要么画面大,要么视角宽,从来无法同时满足。

但新系统 EyeReal,它的研究团队通过 AI 算法 + 多层 LCD 面板 + 实时眼动追踪,展示了历史上第一次:桌面级大小 + 超过 100° 宽视角 + 高画质 + 裸眼 3D

相关研究内容以「Glasses-free 3D display with ultrawide viewing range using deep learning」为题,于 2025 年 11 月 26 日发布在《Nature》。

论文链接:https://www.nature.com/articles/s41586-025-09752-y

现实可能比科幻来得更快

传统裸眼 3D 技术,无论是全息、光场还是多视点显示,都面临同一个基础制约:它们必须构造或传递足够密集、对应不同观察角度的光线,以确保当你头动、眼动时,画面仍能保持立体与连贯。光场本质是一个高度复杂的三维光线集合,信息量庞大。

但现实光学设备的制造能力、显示分辨率、带宽与光线发射密度,都极难同时覆盖「高清晰度 + 宽广视角 + 大尺寸显示」。因此,多年来市面上能够大规模普及的裸眼 3D 屈指可数,更多还停留在「需要精确视角、画面小、适合单人观看」的实验性玩法。

而在 EyeReal,上海人工智能实验室、上海创新研究院、复旦大学携手提出了新的思路:

  • 放弃试图一次性生成「适合所有观察角度」的全光场;

  • 而是通过实时追踪观看者眼睛与头部的位置,动态计算当前最佳光线分布;

  • 并通过LCD 面板「叠加」的方式,利用 AI 优化光线传播,将「正确的光束」精准送到双眼 —— 而不向其他方向 wasted 光能。

图示:EyeReal 方法用于光场生成。

实际观看几何中,双眼被视为平行于地面且朝向广场中心的针孔相机模型,通过针孔成像和透视变换推导六维(6D)位姿矩阵作为任何双目观看的眼部几何编码的物理建模基础。

而光场显示则采用多层结构,使用相位变化来编码光场不同深度区域的光学信息,与强度调制相比,由于其乘法衰减特性,具有更高的光学效率。

最后,团队训练了一个轻量级卷积神经网络,以基于平面变形高效计算光模式,并通过结构化光损失函数进行优化。

打开裸眼 3D 之门

理想的自动立体显示依赖于立体视觉、运动支持与调节等关键属性。这其中,运动支持对应连续的运动视差,使沉浸式 3D 感知实现无缝过渡。

对于这点,团队除开基本的双眼合成之外,还评估了 EyeReal 生成感知完整 3D 观看所需的立体视差维度完整空间范围的能力。EyeReal 并未牺牲某些视察维度,故而它能在各种运动方向和空间轨迹上保持持续稳定的输出。在多方向输入下,它展现出高度稳定、视差一致的预测,涵盖水平、垂直和径向维度。

图示:EyeReal 的全视差自动立体显示演示。

为了证明他们的原型机工作正常,研究团队使用详细的计算机生成场景和真实世界照片对其进行了测试。他们确认该系统提供了超过 100° 的观看角度和完整的 3D 体验,这意味着图像清晰,并且随着用户移动眼睛和改变焦点时能够完美适应。

EyeReal 确保了在眼睛周围的广阔区域内具有高质量的一致性和可变运动容忍度,为沉浸式 3D 观看提供了坚实的基础。它在未见过场景和新头部姿态上同样有着稳健发挥,能够在各种观察变化中保持稳定的渲染质量。

图示:EyeReal 和被动 SBP 利用模型在大规模显示器中的多级一致性性能评估。

通过精确的双目建模,EyeReal 在所有视场范围内都表现出优越的性能。此外,EyeReal 实现了实时运行时速度,同时保持高性能,在亚秒范围内与之前的代表相比,速度提高了一到两个数量级。

裸眼+智能

EyeReal 的方法论建立在物理原理与 AI 数字模型之上,利用具有眼球几何编码的神经网络,实时计算眼睛周围的理想光场,实现动态最优的 SBP 利用。其通过持续的计算最大化可用光信息的有效使用率,在现有物理限制中实现了大成像尺寸与宽观看角度的实用共存。

采用 AI 的驱动策略为下一代商业+学术的无眼镜 3D 应用提供了一条经济实用的途径。团队相信他们的策略仍有扩展的空间,比如说利用集成时分复用和定向背光等技术,实现多用户适应的可能。

当这个设想真正普及,屏幕将不再是平板,而是一扇通往深度世界的窗口。

相关报道:https://techxplore.com/news/2025-12-scientists-glasses-free-3d-ai.html

编辑:文婧

关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/1 22:43:24

Kotaemon负载均衡配置:Nginx反向代理设置说明

Kotaemon负载均衡配置:Nginx反向代理设置说明 在企业级智能对话系统日益普及的今天,用户对响应速度、服务可用性和系统稳定性的要求越来越高。特别是像Kotaemon这样基于检索增强生成(RAG)技术构建的智能代理框架,其典型…

作者头像 李华
网站建设 2026/3/31 18:39:31

如何通过Kotaemon实现问答结果的可视化展示?

如何通过Kotaemon实现问答结果的可视化展示? 在企业知识管理日益复杂的今天,一个常见的挑战是:用户问出一个问题后,系统虽然给出了答案,但没人能说清楚这个答案从何而来。尤其在金融、医疗或法务这类高合规性要求的领域…

作者头像 李华
网站建设 2026/4/1 1:37:39

Kotaemon背后的团队是谁?探访这个神秘开源组织

Kotaemon背后的团队是谁?探访这个神秘开源组织 在企业纷纷拥抱大语言模型的今天,一个现实问题摆在面前:如何让AI助手真正“靠谱”地干活? 我们见过太多聊天机器人上线即翻车——回答张冠李戴、重复提问、无法处理多步骤任务&#…

作者头像 李华
网站建设 2026/3/31 22:10:30

基于springboot的旅游出行指南 答辩PPT+毕业论文+项目源码及数据库文件

摘 要 随着社会的发展,旅游出行的管理形势越来越严峻。越来越多的用户利用互联网获得信息,但旅游出行信息鱼龙混杂,信息真假难以辨别。为了方便用户更好的获得本旅游出行信息,因此,设计一种安全高效的旅游出行指南极为…

作者头像 李华
网站建设 2026/4/4 5:55:36

Flutter在鸿蒙平台实现相机预览的技术实践

Flutter在鸿蒙平台实现相机预览的技术实践 大家好,今天我们一起来看一下使用相机调用这个案例,一起来看一下flutter代码运行到鸿蒙平台的效果 首先大家需要下载这个仓库 testcamera 1.下载代码 git clone gitgitcode.com:openharmony-tpc/flutter_s…

作者头像 李华
网站建设 2026/4/2 16:22:20

openEuler 下部署 Elasticsearch

Elasticsearch(简称 ES)是分布式搜索与分析引擎,广泛用于日志分析、全文检索等场景。本文基于 openEuler 22.03 LTS 系统,从环境准备、单节点部署、集群搭建、功能验证到运维优化,提供可落地的部署指南。 一、环境准备…

作者头像 李华