开源AI编程助手Continue.dev深度评测:省40%成本,但需要你亲自调教
如果你以为装个AI编程助手就是点几下鼠标,那Continue.dev会给你上一课。我花23分钟才搞出第一条有用补全——不是因为它烂,而是因为它把商业工具替你做的决定,全还给了你。用两个月后,我可以明确说:这是最“原则性”的开源AI编程助手,但你需要知道自己在签什么。
模型自由,真能省钱
最打动我的不是补全质量,而是费用透明。我用同一个50项重构任务,分别接GPT-4(OpenAI API)、Claude Sonnet(Anthropic API)和本地运行的Code Llama(M2 MacBook),对比GitHub Copilot的等效花费。
结果:用Continue通过Sonnet花4.67美元API额度。同样的任务在Copilot里消耗了约65%的月额度(月费19美元,折合12.35美元)。如果你重度使用AI辅助编程,Continue的直接对接提供商定价能让你比订阅制省40%到60%——前提是你愿意自己管API密钥、自己盯用量。
我不信,所以跨两周又测了一次。第二周数据类似:Continue花5.12美元,Copilot折合11至13美元。差距来自两点:API按实际token计费,订阅是均价加上平台利润;而且Continue允许你把廉价请求路由到廉价模型——我用本地小模型做自动补全,把Claude留给复杂重构——而Copilot所有任务用同一模型。
项目中途换模型的功能,我之前没当回事,结果成了最爱。有个客户项目要求代码全在内部网络,我把Continue指向他们自托管的Llama端点,改一行JSON配置就行。两周后项目结束,切回云模型,又是一行配置。三个月里我换了六次模型,每次不到30秒。这种低摩擦让它成了习惯,而不是仪式。
安装过程是对耐心的考验
我得说实话:安装过程会劝退很多人。扩展安装很简单,但首次启动你看到一个空聊天面板,让你添加模型提供商。没有默认模型,没有建议。只给你一个文档链接。
我本来就有OpenAI和Anthropic的API密钥,所以还算快。即便如此,我第一次配置花了23分钟读config.json文档,设置两个提供商(一个聊天、一个补全),验证它们都能响应。我推荐给一个同事——他对API提供商不太熟——他花了41分钟才搞定,中途还去两个模型提供商注册了账号。
~/.continue/config.json 是控制一切的核心。文档写得不错,但很冗长。配置三个模型——本地快速模型用于Tab补全、Claude Sonnet用于聊天、嵌入模型用于代码库索引——需要大约35行JSON,包含端点URL、API密钥引用、模型名称和上下文窗口参数。模板有,但前提是你知道模型名称怎么写、上下文窗口该设多大。如果你从没配置过LLM端点,第一次会非常吓人。
初始配置后,日常维护很少。我两个月里只改过三次配置文件:一次加新提供商,一次增大上下文窗口(模型更新支持了),一次把补全从云端模型切到Ollama(旅行时网络不稳定)。每次改动不到两分钟。
自动补全质量全靠你的模型选择
这就是Continue让你接受的交易:补全质量是你的责任。商业工具专门为自家推理栈调优了补全模型。Continue只是把你的光标位置和周围代码发给你配置的模型,然后祈祷。
我在TypeScript文件上做了100次编辑会话,对比Continue的自动补全和Copilot、Cursor。当我把Continue配置为本地Ollama上的Code Llama 7B时,采纳率(我保留建议的频率)是48%,平均延迟940ms。同样测试下,Cursor的托管Tab模型采纳率73%,延迟120ms。
然后我把Continue的补全切换到GPT-4(OpenAI API)。采纳率跃升到61%,但延迟升到1400ms(因为提示拼接更耗时,API往返也增加)。这种延迟下,建议经常在我已经打出下一行后才出现,对实时补全基本没用。
我找到的甜点是:把补全路由到中等大小的本地模型(Code Llama 13B或Mistral 7B),而把云模型留给聊天和重构。这样延迟约520ms,采纳率55%。比Cursor慢、准确度低,但零API费用,代码从来不离机。对于客户项目(代码保密很重要),这个交易值得。对于个人项目(速度更重要),我仍然用Cursor做补全,但保留Continue用于聊天和上下文功能。
@提及系统悄然优秀
Continue的@语法是我用得最多的功能,也是它和其他助手最大的区别。当我让Continue重构一个涉及三个文件的函数时,可以在聊天中输入 @src/database/schema.ts 和 @src/utils/auth.ts,Continue会把这些文件的完整内容注入到模型上下文后再生成响应。
这很重要,因为AI编程助手猜文件的水平很差。它们要么拉太多上下文浪费token,要么拉太少导致代码和其他部分不兼容。@提及让我明确控制模型看到什么,我发现5到10个精心选择的文件引用效果比让工具自己决定好得多。
我比较了Continue带@提及和Copilot自动上下文选择在十个多文件重构任务上的表现。用Continue时,我明确标记了我知道相关的文件,10次中有8次生成的解决方案一次性编译通过。用Copilot(利用打开标签和语义搜索构建上下文)时,10次中有6次一次通过。差异最明显的是那些语义搜索没找到的文件——工具模块、类型定义文件、配置常量——它们在语义上不太像要重构的函数,但在结构上是必需的。
我希望Continue更强的地方
自动补全延迟仍然是最大的实用限制。即使优化到520ms,建议的出现时间仍然明显晚于Cursor的120ms幽灵文本。你的大脑会适应这种节奏——学会在行尾短暂停顿——但体验没有商业选择那么流畅。我尝试了文档建议的所有优化:更小的模型、更短的上下文窗口、低精度推理。差距缩小了,但没有消失。
JetBrains扩展的更新力度明显不如VS Code扩展。我在IntelliJ上测试了Continue(一个Java项目),补全延迟大约是VS Code的两倍,@提及的文件解析可靠性更差——嵌套模块目录中约15%的概率找不到文件。如果你主力IDE是JetBrains,我建议VS Code+Continue做AI任务,IntelliJ做手动编码——这不是Continue营销暗示的工作流。
文档质量参差不齐。核心配置指南很详尽,但故障排查部分很薄弱。有一次macOS更新后本地Ollama停止工作,文档只给了两个通用建议(重启Ollama、检查端口),没用。最终我在四个月前的一个GitHub issue里找到了修复方法——模型目录的权限变更。社区很活跃,但依赖GitHub issue来排错,对于一款要求你自我配置的工具来说很不理想。
谁该安装Continue
如果你在这样一个环境工作:模型选择不仅是偏好,更是要求,那么Continue就是正确选择。如果客户合同规定代码不能离开VPN,Continue+Ollama是目前最强大的自包含方案。如果你的组织与某个提供商谈好了批量API价格,Continue让你直接使用那个价格,无需付平台中间商。如果你维护多个副项目,每个需要不同模型——Python代码库用Claude好,React项目GPT-4更准,本地项目零API成本——Continue让你无需换工具,直接按项目切换。
如果你想装个扩展后30秒内就开始编码,那它不适合你。安装税是真实的。如果你分不清API密钥和端点URL,或从没配置过LLM提供商,初次体验会令你沮丧。先用商业工具几个月了解基线,再评估节省的成本和模型灵活性是否值得你花时间配置。对于我来说,算完自己实际API消耗后,答案是肯定的。
