
智谱多模态开源周项目总结:智谱一周开源总结:从多模态到语音交互
在 AI 正以前所未有的速度重塑数字世界的当下,“手机是否能被 AI 真实地使用”正在成为一个越来越重要的问题。智谱 AI 则选择用一种非常直接的方式回答它:开源 AutoGLM -- 一个让 AI 学会真正使用手机的系统。
让 AI 不再停留在聊天框里,而是真正进入用户每天要用的 App 里,像一个真正的助手那样完成任务。
一、AI 能不能“使用手机”?智谱试图回答的问题
长期以来,AI 的交互方式主要停留在对话框、指令框中。但对智谱团队而言,真正的智能应该具备一个更接近人的能力:
AI 能不能像人一样,拿起手机,进入一个 App,从头到尾完成一件任务?
他们设想的场景是非常具体的:
- 在外卖 App 中帮用户完成从选择到下单的全过程
- 在云手机里自动完成点赞、回复、批量处理通知
- 在企业环境中处理客服、销售、考勤等重复任务
部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章
这不仅是 Agent 的元年, 更可能是 Agent 的十年 的开始。
未来,AutoGLM 团队仍将继续推动开源和研究,让那个人人身边的智能助理 -- 人们心中的“贾维斯”, 真正成为可能。
开源地址:https://github.com/zai-org/Open-AutoGLM
原创文章,更多AI科技内容,微信搜索 橙市 播客 小程序
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明