报错 `Model context length exceeded limit of 128k tokens`,如何强制安全截断?

即使是最顶尖的模型,其上下文窗口也有物理极限(如 128k 或 200k tokens)。当你试图让 OpenHuman 一次性读取一本几十万字的电子书并附带所有历史聊天时,就会触发 API 拒绝请求。为了防止整段任务直接崩溃,你必须开启安全截断护栏。进入“Settings > Advanced”,找到“Context Overflow Strategy(上下文溢出策略)”。将其从默认的“Abort Task(中止任务)”修改为“FIFO Truncation(先进先出截断)”。这样,当内容超载时,底层网关会自动扔掉最旧、最不重要的记忆片段,硬生生把请求塞进 128k 的限制里。

类似文章