为什么遇到长文本上下文,OpenHuman 会陷入死循环,不断重复回答同一句话?
这是一个典型的大模型“退化(Degeneration)”和“EOS(结束符)预测失败”问题。当上下文特别长且充满了重复的模式(例如长篇的代码或者日志)时,某些小参数本地模型会陷入自回归陷阱,像复读机一样永远停不下来。要打破这个死循环,请进入“Settings > AI Engine”,在模型的高级参数中,找到“Repetition Penalty(重复惩罚系数)”,将其从默认的 `1.0` 调高到 `1.1` 或 `1.15`。此外,适当增加一点“Temperature(温度,如 `0.3`)”也能有效促使模型跳出重复的词汇概率陷阱。
