橙市播客 橙市播客
  • 首页
  • AI提示词
    • 文字提示词
    • 图片提示词
  • 播客
    • 商业科技
  • 人物传记
  • 科技动态
  • 汽车
  • 公告通知
搜索一下
橙市播客 橙市播客
  • 首页
  • AI提示词
    • 文字提示词
    • 图片提示词
  • 播客
    • 商业科技
  • 人物传记
  • 科技动态
  • 汽车
  • 公告通知
登录
计算机视觉
一个模型,看懂图像、视频和 PDF:Qwen3-VL 到底强在哪里?
一个模型,看懂图像、视频和 PDF:Qwen3-VL 到底强在哪里?
腾讯混元HunyuanOCR开源:1B参数横扫SOTA,多模态端到端OCR技术新标杆
腾讯混元HunyuanOCR开源:1B参数横扫SOTA,多模态端到端OCR技术新标杆
Meta 推出 SAM 3D:只用几张照片,就能生成真实 3D 模型
Meta 推出 SAM 3D:只用几张照片,就能生成真实 3D 模型
李飞飞的「空间智能」Marble来了:一键生成 3D 世界,Marble 让想象成真
李飞飞的「空间智能」Marble来了:一键生成 3D 世界,Marble 让想象成真
AI空间智能奠基人李飞飞最新长文:Spatial Intelligence:AI发展的下一座高峰
AI空间智能奠基人李飞飞最新长文:Spatial Intelligence:AI发展的下一座高峰
秒变3D世界:腾讯混元WorldMirror让视频一键成
秒变3D世界:腾讯混元WorldMirror让视频一键成"景"
「LLM 并不懂图像」——Karpathy 的提醒与多模态真相
「LLM 并不懂图像」——Karpathy 的提醒与多模态真相
从“识别文字”到“压缩世界”:DeepSeek-OCR 把文档图像塞进 64 个 Token
从“识别文字”到“压缩世界”:DeepSeek-OCR 把文档图像塞进 64 个 Token
0.9B 参数刷新 SOTA!百度开源「PaddleOCR-VL」:一篇发票、一张手写笔记,甚至 109 种语言的论文都能秒转 Markdown
0.9B 参数刷新 SOTA!百度开源「PaddleOCR-VL」:一篇发票、一张手写笔记,甚至 109 种语言的论文都能秒转 Markdown
一块 H100,实时生成永不消失的 3D 世界:李飞飞团队 RTFM 模型实时“造世界”的新纪元
一块 H100,实时生成永不消失的 3D 世界:李飞飞团队 RTFM 模型实时“造世界”的新纪元
热门文章
  • 阿里开源 Wan2.2-Animate:AI 视频人物替换进入“超真实”时代,演员行业或将迎来巨变?
    09-20
  • 2025年苹果秋季发布会:iPhone17系列解读
    09-10
  • 从“人”到“巨偶”:一份可复制的「巨型手办同框」AI 创作全攻略
    09-26
  • 把"深度思考"做成四档旋钮——豆包 1.6 系列新品全景拆解
    10-17
© 2025 橙市播客 All Rights Reserved.
Theme by Mirage