【omi】你的第二大脑:一个能听、能看、能记、还能主动提醒的开源 AI 助手
Omi 是一个开源的“第二大脑”工具,它通过实时捕获屏幕、录音和对话,自动转录、生成摘要与待办事项,并提供一个长期记忆的 AI 聊天界面——让你不再依赖临时笔记或零散截图,真正把注意力从“记下来”解放到“做事情”上。
主要功能与特性:
– ✅ 实时屏幕与音频捕获(支持桌面、手机、可穿戴设备)
– ✅ 多端同步的语音转文字(STT),集成 Deepgram 等服务
– ✅ 自动生成会议/对话摘要与结构化行动项(action items)
– ✅ 具备长期记忆的 AI 聊天系统,可回溯你“看过和听过的一切”
– ✅ 全栈开源:涵盖 macOS(Swift + Rust)、移动端(Flutter)、Python 后端、嵌入式固件(nRF/Zephyr/C)及 AI 眼镜(ESP32-S3)
– ✅ 支持 BLE 协议连接硬件设备,实现 24 小时连续感知
快速上手方式:
在 macOS 上试用浏览器版(无需配置后端):
git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh --yolo
要求:macOS 14+、已安装 Xcode(含 Swift 工具链)、Node.js。
如需完整本地开发(含 Rust 后端与 Python 服务),请按 README 步骤安装 Rust、配置.env并运行./run.sh;移动端则进入app/目录执行bash setup.sh ios或bash setup.sh android。
适用场景与目标用户:
– 需要高效整理会议、访谈、学习视频等音画内容的知识工作者(如产品经理、研究员、咨询顾问);
– 希望构建私有化 AI 记忆系统的开发者与技术爱好者(全栈代码开放,支持深度定制);
– 探索 AI+可穿戴设备融合应用的硬件创客(Omi Glass 开发套件与固件完全开源);
– 注重数据主权的团队——所有组件均可本地部署,不强制依赖云端服务。
总结:
Omi 不只是一个“录音+总结”工具,而是一套面向真实工作流设计的开源认知增强系统。它把多模态输入、边缘采集、云端智能与跨端协同整合在一个统一架构中,且从 App 到芯片全部开放。尽管当前文档较分散、新手入门需一定技术基础,但其架构清晰、模块解耦,对希望掌控自己数字记忆的用户而言,是目前少有的、真正可信赖又可演进的“第二大脑”实践。建议访问其主页获取更详细信息。
