
微软最近开源了一款专为 VS Code 打造的“瑞士军刀”级插件--AI Toolkit。它把大模型浏览、交互测试、Agent 搭建、批量跑 prompt 以及性能评估等全流程工具,一股脑儿塞进了一个侧边栏,让开发者无需东奔西跑就能完成从选模型到上线的全部环节。
一站式能力总览
- 模型超市:内置 GitHub、OpenAI、Anthropic、Google 等 75+ 线上模型,也支持 Ollama、ONNX 等本地模型,一键下载、秒级切换。
- Playground:即时聊天式交互,可同时测试文本、图像等多模态输入,参数(温度、Top-p、最大长度)实时可调。
- Agent Builder:用自然语言就能生成启动 Prompt,支持链式任务拆分、变量注入、结构化输出,还可一键把 Prompt 转成生产级代码。
- 批量运行:把成百上千条 Prompt 一次性丢给多个模型,横向对比结果,快速锁定最优方案。
- 内置评估:提供 F1、相关性、相似度、连贯性等标准指标,也支持自定义评估器,量化模型或 Agent 效果。
- MCP 服务器集成:Agent 通过标准协议直连外部 API、数据库或自定义工具,真正“动手”执行现实世界任务。
- 微调与转换:基于 QLoRA 在本地 GPU 或 Azure 容器实例完成领域微调,还可量化、剪枝、转 ONNX,部署到 CPU/GPU/NPU 多端。
3 分钟上手
- 在 VS Code 扩展市场搜索 “AI Toolkit for Visual Studio Code” 并安装;安装完毕后左侧活动栏会出现新图标。
- 点击 CATALOG → Models,选一款 GitHub 托管的模型(如 Phi-3-mini),点 “Try in Playground” 即可开始对话。
- 进入 Agent Builder,用自然语言描述目标,例如“帮我写一个能查询数据库并生成图表的助手”,插件会自动生成 Prompt 模板、结构化输出方案以及 MCP 工具调用示例代码。
- 需要批量测评时,把测试集 CSV 直接拖到 Bulk Run 视图,勾选要跑的模型,几分钟后即可得到横向对比报告。
- 若要让模型更懂你的业务,可在 Fine-tuning 面板上传私有数据,选择 QLoRA 参数,一键提交到本地 GPU 或 Azure 进行微调。
开源与社区
AI Toolkit 完全开源,代码托管在 GitHub: https://github.com/microsoft/vscode-ai-toolkit 欢迎提 Issue 或 PR,插件内置反馈入口,也可以加入官方 Discord 频道与社区一起迭代新功能。
一句话总结:把大模型“逛超市”、Prompt“搭积木”、Agent“做体检”再到“发版上线”全部浓缩在一个侧边栏里,AI Toolkit 让 VS Code 秒变生成式 AI 的“超级工厂”。
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
