最近iOS 27开发者测试版泄露了一份1300多行、2.2万token的Siri系统提示词,堪称苹果给下一代Siri写的"灵魂剧本"。读完整个文件,一个核心感受是:这次苹果是真的怕AI"胡说"。
这份提示词最突出的设计是极度强调grounded(基于事实):
这和当前很多AI"自信满满地编造"形成鲜明对比。
| 设计要点 | 具体规则 |
|---|---|
| 抽象方式 | 全部带id、kind、app等字段的对象 |
| 信息分层 | identifier → minimal → full,按需调用get_entity_details |
| 展示限制 | 讨论时用自然语言,绝不能甩JSON给用户 |
| 脱敏处理 | 解锁完整版前无法使用 |
ask_user,不能猜甚至专门规定:"工具看不到图像",用户发图片时要先把观察转成文字描述。
Siri会调用get_system_info获取:
实时状态优先于对话历史,时间统一ISO8601。这些工程化细节,都是在防止AI用"我上次记得..."来随口一说。
✅ 结构性约束确实有效--把"事实"限定在工具返回的JSON内,从机制上压缩了编造空间
✅ 保守策略匹配场景--语音助手一旦说错(比如误读邮件内容、错拨电话),代价远高于聊天机器人
✅ 工程化程度令人印象深刻--1300行提示词背后是完整的状态机设计
❌ 延迟问题?"先想"的代价是响应变慢,用户能接受Siri思考3秒再开口吗?
❌ 覆盖度陷阱--工具/实体覆盖不到的领域怎么办?提示词没说"禁止回答",而是说"基于事实",但世界太大
❌ 泄漏的prompt本身能被永远藏住吗? 这次就是诊断日志泄露的,安全边界和安全实践的张力
💬 我个人最感兴趣的是第三条:当GPT-4o开始原生支持工具调用,苹果的这份"工程化保守主义"会不会成为行业模板?还是说,grounded和creative本身就是一对需要动态平衡的矛盾,不存在一劳永逸的解法isl幻觉难题?
加入讨论
光是”工具返回的结果才是真相”这一条,就吊打现在那些闭着眼睛瞎编的AI了。不过我也好奇,如果我normalized_order_json了——是不是扫码点餐也得先调用工具确认?那 Siri 岂不是连”附近有啥好吃的”都回答不了,直接装死 😂