

一、核心爆料:OpenAI要做“AI版抖音”
多方权威信源(《连线》、IT之家、爱范儿)同步确认,OpenAI 正在内部测试一款独立短视频 App,预计最快 10 月向 ChatGPT Pro 用户优先开放。产品亮点一次看够:
- 零实拍、纯 AI:应用禁止上传任何相册素材,所有画面必须由即将发布的 Sora 2 视频模型即时生成。
- 10 秒时限:为降低算力消耗,单条视频上限仅 10 秒,但分辨率可达 1080p,支持竖屏全屏。
- TikTok 式交互:上下滑切换视频,右侧菜单可点赞、评论、Remix(二创)。
- 数字分身:完成人脸验证后,系统可在 AI 视频中调用你的肖像;他人使用你的肖像时,你会即时收到通知。
- 先审后放+“选择退出”版权机制:默认可拿受版权保护的内容训练或生成,除非权利方主动申请排除。
二、Sora 2 技术猜想:DiT 路线再进化
OpenAI 尚未公开 Sora 2 论文,但综合业内分析与上一代 Sora 的已披露资料,可勾勒出三大升级方向:
-
更深、更轻量的 DiT 架构 延续“潜空间扩散 + Transformer”路线,通过加深网络、稀疏注意力与多尺度特征融合,在保持 60 帧连贯性的同时,把推理成本砍至 Sora 1 的 30% 以下。
-
3D 感知与物理引擎耦合 引入 3D CNN 与 NeRF 先验,配合自研物理模拟算子(刚体/流体/柔体),使 10 秒短片在碰撞、光影、形变上更贴近真实世界。
-
多模态条件同步 支持“文本+音频+参考图”混合输入,可把一段 5 秒 BGM 节奏直接映射到镜头切换点,实现“节拍可视化”。
三、内部测试反响:员工“刷到停不下来”
七、展望:AI 视频的“ChatGPT 时刻”
从 GPT-1 到 ChatGPT,OpenAI 用五年让文本生成走进大众;从 Sora 1 到“AI 抖音”,OpenAI 似乎打算用一年让 AI 视频成为日常消费内容。CEO 阿尔特曼在 X 平台暗示:
“当创作门槛降到 5 秒、消费体验做到极致,下一个 10 亿级社交平台可能不再是人人生成,而是人人‘生’成。”
10 月优先向 Pro 用户放出的 Sora 2 App,将是 OpenAI 能否再次复刻“ChatGPT 现象”的第一块试金石。版权、伦理、监管战役已经打响,AI 社交的 Pandora 魔盒也正缓缓开启。
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明
