【GenericAgent】一个会自己长大的 AI 助手,从 3000 行代码开始进化
GenericAgent 是一个极简但极具生长力的自主智能体框架,它不靠预装大量技能,而是让 AI 在真实系统中边做边学,把每一次成功操作自动沉淀为可复用的“技能”,最终长成完全属于你自己的个性化自动化助手。
核心特性包括:
– ✅ 自我进化能力:每完成一个新任务(如读微信消息、监控股票),自动将完整执行流程固化为 Skill,后续直接调用,无需重复摸索;
– ✅ 极简可靠架构:仅约 3000 行核心代码,核心 Agent Loop 不到 100 行,无复杂依赖,开箱即用;
– ✅ 真实系统控制力:直接注入本地浏览器(保留登录态)、操作文件系统、执行终端命令、驱动键鼠与屏幕视觉,甚至通过 ADB 控制安卓手机;
– ✅ 多模型 & 多平台兼容:支持 Claude、Gemini、Kimi、MiniMax 等主流大模型,Windows/macOS/Linux 均可运行;
– ✅ 分层记忆系统:包含 L0–L4 五级记忆(从元规则到会话归档),让关键经验长期可用、噪声更少、成功率更高;
– ✅ 丰富前端接入:除默认 Streamlit Web UI 外,原生支持微信、QQ、飞书、企业微信、钉钉及 Qt 桌面应用等多种交互入口。
快速上手只需四步:
# 1. 克隆项目
git clone https://github.com/lsdefine/GenericAgent.git
cd GenericAgent
# 2. 安装最小依赖
pip install streamlit pywebview
# 3. 配置 API 密钥
cp mykey_template.py mykey.py
# 编辑 mykey.py,填入你的 LLM API Key(如 Claude / Gemini)
# 4. 启动
python launch.pyw
首次使用还可选择微信扫码登录(python frontends/wechatapp.py),零配置即可开始对话。
这个项目最适合以下场景:
– 个人效率提升者:希望自动化日常重复操作(如查账单、发邮件、订外卖、批量发消息);
– 技术爱好者与轻量开发者:想在本地运行可控、透明、可调试的 AI Agent,而非黑盒 SaaS;
– 垂直任务探索者:需要 AI 深度介入真实操作系统(如用 Python 脚本分析本地数据、调用 ADB 控制手机、写 JS 自动化网页);
– 教育与研究者:关注 Agent 记忆机制、技能演化路径、最小可行自主系统的设计哲学。
总结:GenericAgent 不是一个功能堆砌的“全能工具箱”,而是一颗能自我生长的“智能种子”——它用极致的简洁性换来真实的系统掌控力,用自动化的技能沉淀替代手动脚本编写。如果你期待一个越用越懂你、越用越强、且始终运行在你设备上的 AI 助手,GenericAgent 值得认真试试。建议访问其主页获取更详细信息。
