【hermes-webui】给你的AI Agent装个浏览器窗口——零构建、自托管的智能助手图形界面

Hermes WebUI 是 Hermes Agent 的配套浏览器界面。它用最轻量的技术栈,把原本只能在终端里操作的自托管 AI Agent,搬到了浏览器中。整个项目没有复杂的前端构建流程,仅靠 Python 和原生 JavaScript 就能运行,却能提供与命令行几乎完全一致的功能体验。

核心特性

  • 纯原生技术栈,零构建即开即用:不需要 Node.js、Webpack 或任何前端框架,后端就是 Python,前端就是 vanilla JS。单条命令即可启动,部署门槛极低。
  • 经典三栏式布局:左侧是会话列表与导航,中间是聊天主界面,右侧是工作区文件浏览器。底部始终固定着 Composer 工具栏,方便随时调整模型、配置文件和上下文。还有圆形上下文圆环直观显示 Token 占用。
  • 与 CLI 体验高度对等:README 宣称实现了“1:1 对等”,你在终端里能做的事——切换模型、管理配置文件、调用工具、查看会话——在 WebUI 里几乎都能完成。
  • 强大的会话管理能力:支持创建、重命名、归档、置顶、搜索会话;可以用项目(Project)和标签(Tag)对会话分组;还能将历史记录导出为 Markdown 或 JSON,或从 JSON 导入。
  • 内置工作区文件浏览器:右侧边栏可直接浏览目录树、查看文件内容(支持代码、Markdown、图片预览)、编辑文件,甚至能检测 Git 分支和变更状态。
  • 丰富的交互细节:支持 SSE 流式输出、消息发送队列、历史消息编辑与重新生成、工具调用卡片展开/折叠、Mermaid 图表渲染、代码块一键复制、语音输入,以及 / 斜杠命令快捷操作。
  • 多模型支持:依托 Hermes Agent 本身,可对接 OpenAI、Anthropic、Google、DeepSeek、OpenRouter 等众多提供商。
  • 可选的安全与认证:默认本地无密码,但可通过环境变量开启密码保护,并支持 WebAuthn/Passkey 无密码登录。
  • 多种部署方式:除了直接运行,还支持 Docker 单容器、双容器、三容器部署;配合 SSH 隧道或 Tailscale,可安全地在远程服务器甚至手机上使用。

快速上手

最快捷的启动方式是使用项目自带的引导脚本:

git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
python3 bootstrap.py

如果你更习惯使用守护进程管理,也可以用:

./ctl.sh start              # 后台启动
./ctl.sh status             # 查看运行状态
./ctl.sh logs --lines 100   # 查看日志
./ctl.sh stop               # 停止服务

Docker 用户则可以复制示例环境文件后直接拉起:

cp .env.docker.example .env
docker compose up -d

默认服务运行在 http://localhost:8787。如果你在远程服务器上部署,建议通过 SSH 隧道访问,或者使用 Tailscale 组建私有网络,同时记得设置 HERMES_WEBUI_PASSWORD 开启密码保护。

适合谁用

这款界面非常适合那些已经在使用 Hermes Agent、希望摆脱纯终端操作的用户。如果你是喜欢自托管的开发者或技术爱好者,希望数据完全留在本地,同时又能通过图形界面管理会话、浏览文件、切换模型,那么 Hermes WebUI 是一个相当实用的选择。此外,由于它支持响应式布局和 Tailscale 访问,经常需要在手机或平板上临时调用 Agent 的用户也能获得不错的体验。

总结

Hermes WebUI 的最大亮点在于“轻量”与“实用”的平衡。它没有盲目追求前端技术栈的复杂度,而是用最小的依赖实现了对 CLI 体验的高度还原。三栏布局、文件内联预览、完善的项目/标签会话管理、以及流式输出等细节,都让日常使用变得顺畅。当然,项目目前原生不支持 Windows(需借助 WSL2),且多容器部署时存在一些工具调用隔离的注意事项。如果你正在寻找一个能自托管、轻量化且功能全面的 AI Agent Web 入口,这个项目值得一试。

类似文章