橙市播客 橙市播客
  • 首页
  • AI提示词
    • 文字提示词
    • 图片提示词
  • 播客
    • 商业科技
  • 人物传记
  • 科技动态
  • 汽车
  • 公告通知
搜索一下
橙市播客 橙市播客
  • 首页
  • AI提示词
    • 文字提示词
    • 图片提示词
  • 播客
    • 商业科技
  • 人物传记
  • 科技动态
  • 汽车
  • 公告通知
登录
计算机视觉
视频生成三大行业痛点被逐一攻克:智谱发布 SCAIL / RealVideo / Kaleido / SSVAE
视频生成三大行业痛点被逐一攻克:智谱发布 SCAIL / RealVideo / Kaleido / SSVAE
一个模型,看懂图像、视频和 PDF:Qwen3-VL 到底强在哪里?
一个模型,看懂图像、视频和 PDF:Qwen3-VL 到底强在哪里?
腾讯混元HunyuanOCR开源:1B参数横扫SOTA,多模态端到端OCR技术新标杆
腾讯混元HunyuanOCR开源:1B参数横扫SOTA,多模态端到端OCR技术新标杆
Meta 推出 SAM 3D:只用几张照片,就能生成真实 3D 模型
Meta 推出 SAM 3D:只用几张照片,就能生成真实 3D 模型
李飞飞的「空间智能」Marble来了:一键生成 3D 世界,Marble 让想象成真
李飞飞的「空间智能」Marble来了:一键生成 3D 世界,Marble 让想象成真
AI空间智能奠基人李飞飞最新长文:Spatial Intelligence:AI发展的下一座高峰
AI空间智能奠基人李飞飞最新长文:Spatial Intelligence:AI发展的下一座高峰
秒变3D世界:腾讯混元WorldMirror让视频一键成
秒变3D世界:腾讯混元WorldMirror让视频一键成"景"
「LLM 并不懂图像」——Karpathy 的提醒与多模态真相
「LLM 并不懂图像」——Karpathy 的提醒与多模态真相
从“识别文字”到“压缩世界”:DeepSeek-OCR 把文档图像塞进 64 个 Token
从“识别文字”到“压缩世界”:DeepSeek-OCR 把文档图像塞进 64 个 Token
0.9B 参数刷新 SOTA!百度开源「PaddleOCR-VL」:一篇发票、一张手写笔记,甚至 109 种语言的论文都能秒转 Markdown
0.9B 参数刷新 SOTA!百度开源「PaddleOCR-VL」:一篇发票、一张手写笔记,甚至 109 种语言的论文都能秒转 Markdown

1 2 >
热门文章
  • 1分钟做出“设计师级”分享卡片,0基础也能刷屏小红书!
    09-17
  • 谷歌Veo 3.1紧急上线硬刚Sora 2:实测之后,差距依然明显?
    10-17
  • 买车新手面对销售砍价必备话术
    2024-11-01
  • ChatGPT引入Etsy与Shopify即时结账:AI超级应用的崛起,购物生态迎来重构时刻
    10-01
© 2025 橙市播客 All Rights Reserved.
Theme by Mirage
需要登录后才能复制