用 AI 玩游戏《宝可梦水晶版》:Gemini 3 Pro 如何击败 2.5 Pro
aikeji
2 天
6

用 AI 玩游戏《宝可梦水晶版》:Gemini 3 Pro 如何击败 2.5 Pro

当大模型的能力越来越强,如何真正验证它们在「长期任务」和「复杂决策」上的差异,成了一个绕不开的问题。 相比刷榜式的基准测试,有一种方式更直观也更残酷--让 AI 自己去玩一款需要数十小时才能通关的经典游戏

近期,开发者 JCZ 在其博客中分享了一次非常有代表性的实验: 让 Gemini 2.5 Pro 和 Gemini 3 Pro 分别独立通关《Pokémon Crystal(宝可梦 水晶版)》,并对两者的表现进行了系统对比。

部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章

如果说以前的大模型更像“聪明的助手”, 那么从 Gemini 3 Pro 开始,我们正在看到真正意义上的-- “长期自主行动者”

原 创文章,更多AI科技内容,微信搜索 橙 市 播 客 小程序

打赏
3秒克隆你的声音!阿里通义开源语音神器,方言、外语都能说,嘈杂环境也能听清
上一篇
AI 生成高端悬浮产品摄影图教程:零重力广告大片风格
下一篇
标签
#AI #AI生图 #Nano Banana #即梦 #可灵 #科技 #豆包 #人像 #chatgpt #产品设计 #模型 #OpenAI #开源 #Gemini #Google #城市名片 #马斯克 #写真 #AI视频 #3D #电商 #claude #计算机视觉 #UI #苹果 #谷歌 #DeepSeek #人工智能 #iPhone #播客 #智谱 #阿里 #AI设计 #腾讯 #特斯拉 #grok #IDE #sora #tesla #买车 #选车 #干货 #搜索 #通义 #汽车 #机器人 #工具 #Anthropic #自动化 #space #星舰 #英伟达 #NVIDIA #智慧城市 #OCR #Atlas #Agent #AI手机 #glm #微信 #AI手办 #混元 #宇宙 #Gemma #veo #百度 #浏览器 #地理空间 #工作流 #AI推理 #AI编码 #办公 #tts #iPhone17 #AI搜索 #手办 #小米 #具身智能 #火山引擎 #多模态 #古风美学 #kimi #Qwen #小鹏 #李飞飞 #芯片 #思维链 #Meta #摄影艺术 #商业思维 #桌面 #语音合成 #AGI #罗永浩 #西贝 #食品 #预制菜 #AI文字 #微软 #壁纸 #雷军 #星际 #彗星 #Figure #数码 #旅游 #Broadcom #MacBook #Vision Pro #iPad #抖音 #VR #RTFM #飞桨 #PaddlePaddle #Qoder #LLM #游戏 #海报 #卫星影像 #复古 #定格 #节日 #万圣节 #黄仁勋 #肖像 #Apple #金融 #量化 #炒股 #早报 #世界模型 #表情包 #百度世界 #文心 #萝卜快跑 #数字人 #千帆 #小程序 #群聊 #社交 #Optimus #擎天柱 #神经网络 #DeepMind #Antigravity #Cloudflare #bug #运维 #技术事故 #AI教育 #超级计算 #核能源 #AI数学 #小红书 #创业思维 #第一性原理 #问题拆解 #副业增长 #吴恩达 #行业洞察 #行业分析 #产业机遇 #投资方向 #安全对齐 #奖励机制 #插件 #Cursor #可穿戴 #AI硬件 #端侧 #数据中心 #交流 #攻略 #资料 #脑机
生成中...
点赞是美意,赞赏是鼓励