OpenClaw 内容风控:如何开启 NSFW 过滤防止 Agent 违规生成导致大模型账号被封?

如果你的 Agent 开放给第三方使用(如 Discord 社区),用户可能会恶意让其生成或识别违规内容,导致你的 Claude 或 OpenAI 开发者账号被封停。请安装拦截层插件 `@openclaw/plugin-safety-filter`。这会在请求发送给大模型前,先通过本地轻量级的模型(如预训练的文本分类器)检测 Prompt 和图像是否包含色情、暴力等 NSFW 元素,一旦匹配直接拒绝响应。

作加

类似文章