Claude Coded 更新摘要

核心功能与技术亮点认知卡片

🚀
Claude 4.5 模型发布:性能新标杆

核心定位与性能

  • 观点: 官方称其为 “全球最强的编程模型”
  • 编程能力: 在权威的 SWE-bench 验证测试中,取得了 77.2% 的领先分数。
  • 长时任务稳定性: 经观察,模型能够持续专注于复杂任务超过 30 小时而保持聚焦。

综合能力提升

  • 通用能力:推理、数学计算机使用等多个维度均有显著提升。
  • 智能体测试: 在模拟人类真实计算机操作的 OS-World 基准测试中,得分从四个月前的 42% 大幅跃升至超过 61%
  • 实际体验: 用户可通过 Claude for Chrome 扩展程序亲身体验这些能力,该扩展已向所有候补名单用户开放。
💻
开发者工具 (Claude Code) 全面升级

1. 原生 VS Code 扩展 (Beta)

  • IDE 无缝集成: 将 Claude Code 直接带入 VS Code,通过专用侧边栏面板工作。
  • 实时变更可视:内联差异 (inline diffs) 形式实时、清晰地展示 Claude 生成的代码修改。
  • 获取途径: 可在 VS Code Marketplace 中搜索并安装。

2. 命令行工具 2.0 与“检查点”功能

  • UI/UX 优化: 命令行界面更新至 2.0 版本,带来了全新的界面、改进的状态可见性可搜索的提示历史
  • 革命性功能 - 检查点 (Checkpoints): 允许在执行大型、复杂任务时,随时将代码和/或对话安全地回滚到之前的某个状态。
  • 激活方式: 输入 /re 命令或连续按两次 Esc 键
  • 重要限制: “检查点”功能仅对 Claude 所做的编辑生效,不包含用户的手动编辑或执行的 bash 命令。官方建议将其与版本控制系统 (如 Git) 结合使用以实现万无一失。
🔧
API 更新:赋能更长时、更智能的 AI 智能体

1. 上下文编辑 (Context Editing)

  • 解决痛点: 智能体在长时间运行中因工具调用累积而导致的上下文窗口 (Token) 溢出问题。
  • 工作机制: 当接近 Token 限制时,API 会自动识别并清除上下文中陈旧、过时的工具调用历史和结果
  • 核心优势: 在完整保留核心对话流程的前提下,极大地延长了智能体无需人工干预的自主运行时间

2. 记忆工具 (Memory Tool)

  • 核心功能: 赋予 Claude 在上下文窗口之外持久化存储和检索信息的能力,实现真正的长期记忆。
  • 实现方式: 通过一个基于文件的系统,Claude 可对文件进行创建 (Create)、读取 (Read)、更新 (Update) 和删除 (Delete) 操作。
  • 数据主权: 所有记忆文件都存储在用户自己的、完全客户端的基础设施上,确保了数据的安全与私密性,并且可以跨会话保留
📦
SDK 更名与 App 文件生成能力

Claude Agent SDK

  • 名称变更: 原“Claude Code SDK”已正式更名为“Claude Agent SDK”,以更好地反映其核心用途。
  • 开放能力: 向开发者开放了驱动 Claude Code 的核心工具、上下文管理系统和权限框架,旨在帮助开发者更轻松地构建自己强大的 AI 智能体。

Claude App 文件处理能力 (预览版)

  • 核心能力: Claude 现在可以在 App 内利用代码解释器来执行数据分析、内容创建和信息可视化任务。
  • 用户交互: 只需使用自然语言下达指令,例如“帮我分析这份销售数据并生成一份PPT报告”。
  • 支持格式: 能够直接生成并供用户下载多种常用文件格式,包括 Excel 表格, PowerPoint 演示文稿, Word 文档, 以及 PDF 文件
  • 可用范围: 该功能目前作为预览版,已向所有付费订阅计划的用户开放。

原文

源链接