每日推荐
早报
搜索
登录
所有主流模型均“中招”:研究人员提出策略木偶攻击技术,使用特殊字符让AI模型输出有害内容
DeepTech深科技
2025-04-26 18:01
仅需一个提示就能让模型生成明显违反AI 安全政策的有害指令或内容。
推荐阅读