橙市播客 橙市播客
  • 首页
  • AI提示词
    • 文字提示词
    • 图片提示词
  • 播客
    • 商业科技
  • 人物传记
  • 科技动态
  • 汽车
  • 公告通知
搜索一下
橙市播客 橙市播客
  • 首页
  • AI提示词
    • 文字提示词
    • 图片提示词
  • 播客
    • 商业科技
  • 人物传记
  • 科技动态
  • 汽车
  • 公告通知
登录
计算机视觉
视频生成三大行业痛点被逐一攻克:智谱发布 SCAIL / RealVideo / Kaleido / SSVAE
视频生成三大行业痛点被逐一攻克:智谱发布 SCAIL / RealVideo / Kaleido / SSVAE
一个模型,看懂图像、视频和 PDF:Qwen3-VL 到底强在哪里?
一个模型,看懂图像、视频和 PDF:Qwen3-VL 到底强在哪里?
腾讯混元HunyuanOCR开源:1B参数横扫SOTA,多模态端到端OCR技术新标杆
腾讯混元HunyuanOCR开源:1B参数横扫SOTA,多模态端到端OCR技术新标杆
Meta 推出 SAM 3D:只用几张照片,就能生成真实 3D 模型
Meta 推出 SAM 3D:只用几张照片,就能生成真实 3D 模型
李飞飞的「空间智能」Marble来了:一键生成 3D 世界,Marble 让想象成真
李飞飞的「空间智能」Marble来了:一键生成 3D 世界,Marble 让想象成真
AI空间智能奠基人李飞飞最新长文:Spatial Intelligence:AI发展的下一座高峰
AI空间智能奠基人李飞飞最新长文:Spatial Intelligence:AI发展的下一座高峰
秒变3D世界:腾讯混元WorldMirror让视频一键成
秒变3D世界:腾讯混元WorldMirror让视频一键成"景"
「LLM 并不懂图像」——Karpathy 的提醒与多模态真相
「LLM 并不懂图像」——Karpathy 的提醒与多模态真相
从“识别文字”到“压缩世界”:DeepSeek-OCR 把文档图像塞进 64 个 Token
从“识别文字”到“压缩世界”:DeepSeek-OCR 把文档图像塞进 64 个 Token
0.9B 参数刷新 SOTA!百度开源「PaddleOCR-VL」:一篇发票、一张手写笔记,甚至 109 种语言的论文都能秒转 Markdown
0.9B 参数刷新 SOTA!百度开源「PaddleOCR-VL」:一篇发票、一张手写笔记,甚至 109 种语言的论文都能秒转 Markdown

1 2 >
热门文章
  • 星际访客3I/ATLAS:人类首次近距离观测
    10-05
  • 如何制作中秋节城市创意微缩海报
    10-05
  • 如何用AI文生图工具生成“万物拆解”风格爆炸图
    10-13
  • 0 基础用 Nano Banana 把女友/男友拍成「杂志封面」——超全风格提示词直接抄
    09-25
© 2025 橙市播客 All Rights Reserved.
Theme by Mirage
需要登录后才能复制