Anthropic 周二宣布启动「Project Glasswing」合作倡议,向亚马逊、微软等合作伙伴开放未发布的通用 AI 模型「Claude Mythos 预览版」用于防御性网络安全工作。该模型已在软件中发现「数千个」重大漏洞,虽非专门针对网络安全训练,但凭借强大编程和推理能力在该领域表现出色,能自主识别漏洞并开发利用代码。考虑到模型可能被滥用,Anthropic 采取分阶段发布策略,仅向合作伙伴和约 40 个关键软件基础设施组织提供访问权限,还承诺提供最高 1 亿美元使用积分并向开源安全组织捐赠 400 万美元,参与组织需分享发现成果。此次发布正值网络安全行业关注 AI 驱动攻击兴起,Anthropic 与美国政府官员就模型能力持续讨论,此前曾与特朗普政府有法律纠纷。