计算机视觉 - 橙市播客

首页
AI提示词
- 文字提示词
- 图片提示词
播客
- 商业科技
人物传记
科技动态
汽车
公告通知

搜索一下

首页
AI提示词
- 文字提示词
- 图片提示词
播客
- 商业科技
人物传记
科技动态
汽车
公告通知

登录

计算机视觉

视频生成三大行业痛点被逐一攻克：智谱发布 SCAIL / RealVideo / Kaleido / SSVAE

视频生成三大行业痛点被逐一攻克：智谱发布 SCAIL / RealVideo / Kaleido / SSVAE

一个模型，看懂图像、视频和 PDF：Qwen3-VL 到底强在哪里？

一个模型，看懂图像、视频和 PDF：Qwen3-VL 到底强在哪里？

腾讯混元HunyuanOCR开源：1B参数横扫SOTA，多模态端到端OCR技术新标杆

腾讯混元HunyuanOCR开源：1B参数横扫SOTA，多模态端到端OCR技术新标杆

Meta 推出 SAM 3D：只用几张照片，就能生成真实 3D 模型

Meta 推出 SAM 3D：只用几张照片，就能生成真实 3D 模型

李飞飞的「空间智能」Marble来了：一键生成 3D 世界，Marble 让想象成真

李飞飞的「空间智能」Marble来了：一键生成 3D 世界，Marble 让想象成真

AI空间智能奠基人李飞飞最新长文：Spatial Intelligence：AI发展的下一座高峰

AI空间智能奠基人李飞飞最新长文：Spatial Intelligence：AI发展的下一座高峰

秒变3D世界：腾讯混元WorldMirror让视频一键成

秒变3D世界：腾讯混元WorldMirror让视频一键成"景"

「LLM 并不懂图像」——Karpathy 的提醒与多模态真相

「LLM 并不懂图像」——Karpathy 的提醒与多模态真相

从“识别文字”到“压缩世界”：DeepSeek-OCR 把文档图像塞进 64 个 Token

从“识别文字”到“压缩世界”：DeepSeek-OCR 把文档图像塞进 64 个 Token

0.9B 参数刷新 SOTA！百度开源「PaddleOCR-VL」：一篇发票、一张手写笔记，甚至 109 种语言的论文都能秒转 Markdown

0.9B 参数刷新 SOTA！百度开源「PaddleOCR-VL」：一篇发票、一张手写笔记，甚至 109 种语言的论文都能秒转 Markdown

1 2 >

热门文章

星际访客3I/ATLAS：人类首次近距离观测
10-05
如何制作中秋节城市创意微缩海报
10-05
如何用AI文生图工具生成“万物拆解”风格爆炸图
10-13
0 基础用 Nano Banana 把女友/男友拍成「杂志封面」——超全风格提示词直接抄
09-25

© 2025 橙市播客 All Rights Reserved.
Theme by Mirage

需要登录后才能复制

用户名或邮箱地址

密码

记住我