一块 H100，实时生成永不消失的 3D 世界：李飞飞团队 RTFM 模型实时“造世界”的新纪元

2025 年 10 月，World Labs 发布 RTFM（Real-Time Framework Model）： 仅在一块 H100 上，即可实时生成 4K@60Hz、无限延伸、永不遗忘的可交互 3D 世界。

🧠 RTFM（Real-Time Frame Model，实时帧模型）

它可以在单张 NVIDIA H100 GPU 上实现实时的三维世界生成。听起来像游戏引擎？其实它更像是一个会“思考”的世界。

这篇文章，将带你通俗地看懂 RTFM 是什么、它解决了什么问题、为什么重要，以及它可能如何改变未来游戏、影视、AI 智能体训练的方式。

一、问题的起点：AI 想做的不只是“画面”，而是“世界”

传统的视频生成模型，比如 Runway、Pika 或 Google Veo，看起来很厉害，但它们都有一个致命限制：

生成的视频是“短暂”的、一段就结束。 AI 并不知道视频里那个世界的“结构”，也不会记得你曾看过哪里。

想象一下：你让 AI 生成一个“森林小屋”场景，当你转动视角、走到小屋背后时，画面重新生成--树的位置变了，门没了，这说明模型根本不记得世界是什么样的。

部分内容已折叠，查看完整文章请先登录。登录后查看完整文章

它让 AI 从“生成一张图”迈向“理解并维护一个世界”。

如果说过去的生成模型是“摄影机”，那 RTFM 就是“世界引擎”--它在实时运行、记忆、思考。

当语言模型、物理模拟与 RTFM 融合的那一天到来，也许我们就能与 AI 一起“共同生活”在一个真正智能、持续存在的虚拟世界中。

在线 Demo https://rtfm.worldlabs.ai （支持上传单张图片，即刻生成可漫游 3D 场景）

微信扫描下方的二维码阅读更多精彩内容

声明：本站所有文章，如无特殊说明或标注，均为橙市播客原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。如果你是AI总结，务必加上此版权说明