所有主流模型均“中招”：研究人员提出策略木偶攻击技术，使用特殊字符让AI模型输出有害内容

DeepTech深科技 2025-04-26 18:01

仅需一个提示就能让模型生成明显违反AI 安全政策的有害指令或内容。