Anthropic 开源「思维追踪」工具,可视化揭秘 AI 内部逻辑
2025 年 5 月 30 日

Anthropic 推出开源工具「思维追踪」(Circuit Tracer),以图形化方式展示 AI 大语言模型的内部思维过程。通过构建「归因图」,帮助研究者可视化模型运作并支持交互探索,提升 AI 安全性。该工具已在 GitHub 发布,用户可生成自定义归因图、标注和分享,并观察模型输出变化以验证假设。Anthropic 希望通过开源推动社区深入探究语言模型内部机制。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟