Claude Coded 更新摘要
核心功能与技术亮点认知卡片
核心定位与性能
- 观点: 官方称其为 “全球最强的编程模型”。
- 编程能力: 在权威的 SWE-bench 验证测试中,取得了 77.2% 的领先分数。
- 长时任务稳定性: 经观察,模型能够持续专注于复杂任务超过 30 小时而保持聚焦。
综合能力提升
- 通用能力: 在推理、数学及计算机使用等多个维度均有显著提升。
- 智能体测试: 在模拟人类真实计算机操作的 OS-World 基准测试中,得分从四个月前的 42% 大幅跃升至超过 61%。
- 实际体验: 用户可通过 Claude for Chrome 扩展程序亲身体验这些能力,该扩展已向所有候补名单用户开放。
1. 原生 VS Code 扩展 (Beta)
- IDE 无缝集成: 将 Claude Code 直接带入 VS Code,通过专用侧边栏面板工作。
- 实时变更可视: 以内联差异 (inline diffs) 形式实时、清晰地展示 Claude 生成的代码修改。
- 获取途径: 可在 VS Code Marketplace 中搜索并安装。
2. 命令行工具 2.0 与“检查点”功能
- UI/UX 优化: 命令行界面更新至 2.0 版本,带来了全新的界面、改进的状态可见性和可搜索的提示历史。
- 革命性功能 - 检查点 (Checkpoints): 允许在执行大型、复杂任务时,随时将代码和/或对话安全地回滚到之前的某个状态。
- 激活方式: 输入 /re 命令或连续按两次 Esc 键。
- 重要限制: “检查点”功能仅对 Claude 所做的编辑生效,不包含用户的手动编辑或执行的 bash 命令。官方建议将其与版本控制系统 (如 Git) 结合使用以实现万无一失。
1. 上下文编辑 (Context Editing)
- 解决痛点: 智能体在长时间运行中因工具调用累积而导致的上下文窗口 (Token) 溢出问题。
- 工作机制: 当接近 Token 限制时,API 会自动识别并清除上下文中陈旧、过时的工具调用历史和结果。
- 核心优势: 在完整保留核心对话流程的前提下,极大地延长了智能体无需人工干预的自主运行时间。
2. 记忆工具 (Memory Tool)
- 核心功能: 赋予 Claude 在上下文窗口之外持久化存储和检索信息的能力,实现真正的长期记忆。
- 实现方式: 通过一个基于文件的系统,Claude 可对文件进行创建 (Create)、读取 (Read)、更新 (Update) 和删除 (Delete) 操作。
- 数据主权: 所有记忆文件都存储在用户自己的、完全客户端的基础设施上,确保了数据的安全与私密性,并且可以跨会话保留。
Claude Agent SDK
- 名称变更: 原“Claude Code SDK”已正式更名为“Claude Agent SDK”,以更好地反映其核心用途。
- 开放能力: 向开发者开放了驱动 Claude Code 的核心工具、上下文管理系统和权限框架,旨在帮助开发者更轻松地构建自己强大的 AI 智能体。
Claude App 文件处理能力 (预览版)
- 核心能力: Claude 现在可以在 App 内利用代码解释器来执行数据分析、内容创建和信息可视化任务。
- 用户交互: 只需使用自然语言下达指令,例如“帮我分析这份销售数据并生成一份PPT报告”。
- 支持格式: 能够直接生成并供用户下载多种常用文件格式,包括 Excel 表格, PowerPoint 演示文稿, Word 文档, 以及 PDF 文件。
- 可用范围: 该功能目前作为预览版,已向所有付费订阅计划的用户开放。