Anthropic 推出审计 Agent,助力 AI 模型对齐测试2025 年 7 月 25 日Anthropic 推出三种审计 Agent,用于提升 AI 模型对齐测试的效率,分别负责调查、评估和红队测试。这些 Agent 能够在更大规模上进行并行审计,提高对齐验证效率,并已在 GitHub 上开源代码。Anthropic 推出审计 Agent 助力 AI 模型对齐测试麻省理工科技评论Anthropic 推出审计 Agent,助力 AI 模型对齐测试aibaseAnthropic 发布 AI 审计智能体系统,三维架构破解模型对齐验证瓶颈牛透社专业版功能登录体验专业版特色功能,拓展更丰富、更全面的相关内容。