OpenAI 承认,通过隐藏的网络或电子邮件指令操纵 AI 代理的提示注入攻击仍然是其 ChatGPT Atlas 浏览器面临的一项持续性安全挑战,而且不太可能得到彻底解决。该公司正在部署一个基于 LLM(逻辑逻辑模型)的自动化攻击者,该攻击者使用强化学习进行训练,以在内部模拟和发现新的攻击策略。虽然安全更新已经改进了检测能力——例如,能够标记出之前诱骗代理发送辞职信的恶意电子邮件——但专家指出,像 Atlas 这样的智能浏览器兼具一定的自主性和对敏感数据的高度访问权限,其风险状况可能尚未达到足以证明其日常使用价值的程度。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
