​Anthropic 推出审计 Agent,助力 AI 模型对齐测试

2025 年 7 月 25 日

Anthropic 推出三种审计 Agent,用于提升 AI 模型对齐测试的效率,分别负责调查、评估和红队测试。这些 Agent 能够在更大规模上进行并行审计,提高对齐验证效率,并已在 GitHub 上开源代码。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
科技新闻,每天 3 分钟