
智谱多模态开源周项目总结:智谱一周开源总结:从多模态到语音交互
2025年12月12日,智谱多模态开源周圆满结束!这一周里,智谱已经陆续放出了能“看图片”(GLM-4.6V)、“控设备”(AutoGLM)、“听声音”(GLM-ASR)、“会说话”(GLM-TTS)的AI模型。收官当天,他们又搞了个大动作--开源了四个超实用的视频生成核心技术!不管是想做动画、搞实时AI对话,还是拍多角色短视频,这些技术都能解决大问题,而且普通人也能看懂它们到底牛在哪~
部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章
从“能看、能听、能说”到“能做视频”,智谱正在一步步让AI变得更全能。相信随着这些技术的普及,不管是个人创作者、中小企业,还是大公司,都能在视频生成领域玩出更多新花样,AI离我们的生活也会越来越近~
原创文章,更多AI科技内容,微信搜索 橙 市 播 客 小程序

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明
