用非官方推荐的便宜大模型(比如部分国产开源模型)接入 Hermes Agent 老是工具调用失败?

为了极致的省钱体验,很多用户会尝试在 Hermes Agent 的自定义配置中,强行接入一些极其便宜甚至是免费不知名的小参数开源模型。结果面临的就是代理在执行任务时疯狂地抛出解析错误、工具调用不生效,或者干脆把原本应该执行的 Python 代码当成普通聊天乱说一通。根源在于:Hermes Agent 这种级别的全能系统,高度依赖于大语言模型极其严密的“函数调用(Function Calling)”和“JSON 结构化输出”能力。很多小模型虽然闲聊很通顺,但在面对数百个复杂参数的工具定义时,它们的逻辑根本无法遵循严格的语法格式,少打一个括号或者弄错一个字段名,就会导致整个底层执行引擎崩溃。官方强烈建议,如果你要用 Hermes 干正经的复杂自动化工作,至少要保证它的核心大脑级别不低于 GPT-4o-mini、Claude 3.5 Haiku 或者 Llama 3 (70B) 这种经过深度工具微调的顶级模型,切勿在核心智商上贪小便宜。

作加

类似文章