仅花 12 美元,工程师成功欺骗 AI 将虚构赛事奉为事实
上周一
普通搜索引擎需用户甄别信息可信度,而依托搜索能力的人工智能聊天机器人会将漏洞百出的网络素材包装成确凿答案。安全工程师斯托纳哄骗多款 AI 机器人,伪造《谁是牛头王》赛事及自己夺冠信息,AI 仍笃定称他为冠军。这是检索增强生成层面的信息投毒,暴露了三类失效模式:检索层漏洞易使 AI 输出错误信息。模型训练语料漏洞可能让虚假信息混入训练库且难以清理。智能体漏洞可能引发严重安全隐患。斯托纳认为大语言模型服务商应正视检索投毒问题,向用户作风险提示,AI 企业应将数据溯源纳入研发,筛查可疑内容。此次骗局凸显的信任逻辑漏洞是人工智能行业亟待解决的潜在隐患。
体验专业版特色功能,拓展更丰富、更全面的相关内容。