
2025 年 10 月,World Labs 发布 RTFM(Real-Time Framework Model): 仅在一块 H100 上,即可实时生成 4K@60Hz、无限延伸、永不遗忘的可交互 3D 世界。
🧠 RTFM(Real-Time Frame Model,实时帧模型)
它可以在单张 NVIDIA H100 GPU 上实现实时的三维世界生成。 听起来像游戏引擎?其实它更像是一个会“思考”的世界。
这篇文章,将带你通俗地看懂 RTFM 是什么、它解决了什么问题、为什么重要, 以及它可能如何改变未来游戏、影视、AI 智能体训练的方式。
一、问题的起点:AI 想做的不只是“画面”,而是“世界”
传统的视频生成模型,比如 Runway、Pika 或 Google Veo,看起来很厉害,
但它们都有一个致命限制:
生成的视频是“短暂”的、一段就结束。 AI 并不知道视频里那个世界的“结构”,也不会记得你曾看过哪里。
想象一下: 你让 AI 生成一个“森林小屋”场景, 当你转动视角、走到小屋背后时,画面重新生成--树的位置变了,门没了, 这说明模型根本不记得世界是什么样的。
它让 AI 从“生成一张图”迈向“理解并维护一个世界”。
如果说过去的生成模型是“摄影机”, 那 RTFM 就是“世界引擎”--它在实时运行、记忆、思考。
当语言模型、物理模拟与 RTFM 融合的那一天到来, 也许我们就能与 AI 一起“共同生活”在一个真正智能、持续存在的虚拟世界中。
在线 Demo https://rtfm.worldlabs.ai (支持上传单张图片,即刻生成可漫游 3D 场景)
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明
