把 90% 的“机械活”踢给本地小模型,省下 Claude Pro 配额干正事

你有没有过这种体验?
刚用 Claude Code 做完 3 次 git grep + sed 批量改名,就弹窗提醒:“本周配额已用完”——结果真正需要 Sonnet 深度推理的架构设计、跨模块调试,反而卡在排队里?

这不是玄学,是真实发生的配额浪费。
本文作者(一位每天用 Claude Code 10+ 次的全栈开发者)做了件特别实在的事:连续 30 天,给每一次 Claude Code 调用“记账”——记它是什么任务、用了哪个模型、花了多少时间、质量打几分、最后有没有被迫重跑 Sonnet……

结果很清晰:
约 90% 的日常终端操作(比如格式化、单文件重构、Lint 修复、批量替换)——Gemmma 7B 本地跑,又快又免费,质量稳在 4.5 分(满分 5)
真正需要多文件上下文、深层推理、工具链编排的任务(比如查清一个报错在 controller→service→repo 三层间的传导路径)——必须交还 Sonnet,本地模型真干不了

关键不是“换模型”,而是学会在敲回车前,先问自己一句:这是机械活,还是脑力活?
这个分类动作本身,就帮你把 Pro 配额从“填坑”转向“攻坚”。


🧰 他是怎么做的?(极简版,新手 5 分钟上手)

核心就两步:
1. 把系统里的 claude 命令,换成一个「智能路由脚本」——它会根据你提前选的任务类型(如 format / refactor),自动决定调本地 Gemma 还是云端 Sonnet;
2. 本地跑模型?靠 Ollama 一键拉起 gemma:7b(Mac M 系芯片实测秒启,内存占用不到 4GB)。

脚本本质就是一个带日志的 shell 包装器,核心逻辑如下(已加中文注释):

#!/bin/bash
# 读取用户预设的任务类型(如 format / lint),决定走哪条路
TASK_TYPE="$1"
shift  # 把第一个参数(任务类型)拿掉,剩下的是原始 claude 参数

if [[ "$TASK_TYPE" == "format" || "$TASK_TYPE" == "lint" || "$TASK_TYPE" == "batch_op" ]]; then
  # ✅ 机械类任务 → 本地 Gemma 7B(免费、低延迟)
  ollama run gemma:7b "$@"  # "$@" 是透传所有后续参数,比如 --file src/index.ts
else
  # ❌ 非机械类 → 原样交给 Claude Desktop 的官方 claude 二进制(走 Anthropic API)
  /opt/homebrew/bin/claude "$@"
fi

💡 小贴士:他没让模型“自动判断”,而是强制你在运行前手动选标签(比如 claude format --file xxx.ts)。这个“多按一次 Tab 补全”的小动作,恰恰训练了你的直觉:什么该本地干,什么必须上云。


📊 你最该关心的结论(不是数据,是判断标准)

别背表格,记住这 4 条「一眼法则」:

  • 可以本地干:只读 1 个文件、改命名/缩进/空行、正则批量替换、基础类型修正(如 anystring
  • 可以本地干:基于明确规则的重构(比如“把所有 var 换成 const”,不涉及逻辑推断)
  • 必须上云:要同时看 3 个以上文件、需要猜“改这里会不会影响那里”、要调用多个工具链(比如先 curl 再解析 JSON 再写 DB)
  • 必须上云:代码里有大量泛型、宏、DSL、或你正在写的语言 Gemma 训练数据极少(比如 Elixir / OCaml)

🔑 真正的收益,80% 来自「配额解放」,20% 来自「省钱」。Pro 用户月费固定,但配额有限——把机械活挪走,等于把 Sonnet 的黄金算力,留给真正值得它出手的时刻。


⚠️ 别踩的坑(坦诚版)

  • 别指望 Gemma 理解“跨文件隐含依赖”:它能读 3 个文件,但没法像 Sonnet 那样说:“你改了 A.service,B.controller 的注入方式也得同步更新”。
  • 别让它做复杂工具调度:能跑 lscat,但搞不定“如果 API 返回 404,就切到备用 endpoint,再重试并记录日志”这类分支逻辑。
  • 别硬塞冷门语言:TypeScript/Python/SQL 流畅,Rust 泛型/Elixir 宏就容易“一本正经胡说八道”。
  • 首次安装可能卡壳:Ollama + Gemma 7B 在 Mac 上通常 2 分钟搞定;Windows(WSL2)或 Linux 可能多花 5 分钟查权限问题——但只要跑起来,后续零维护

🚀 现在就能抄的作业

作者把全部配置开源了:
– 有自动适配 macOS/Windows/WSL2/Linux 的图文安装指南(21 页,每步带截图)
– 有开箱即用的 shell 脚本和日志 CSV 模板
– MIT 协议,不用注册、不收邮箱、不埋 analytics

直达网址:https://coherencedaddy.com/tutorials/use-ollama-to-enhance-claude

作加

类似文章