【omi】你的第二大脑：一个能听、能看、能记、还能主动提醒的开源 AI 助手

🚀 工具网址： https://github.com/BasedHardware/omi

Omi 是一个开源的“第二大脑”工具，它通过实时捕获屏幕、录音和对话，自动转录、生成摘要与待办事项，并提供一个长期记忆的 AI 聊天界面——让你不再依赖临时笔记或零散截图，真正把注意力从“记下来”解放到“做事情”上。

主要功能与特性：
– ✅ 实时屏幕与音频捕获（支持桌面、手机、可穿戴设备）
– ✅ 多端同步的语音转文字（STT），集成 Deepgram 等服务
– ✅ 自动生成会议/对话摘要与结构化行动项（action items）
– ✅ 具备长期记忆的 AI 聊天系统，可回溯你“看过和听过的一切”
– ✅ 全栈开源：涵盖 macOS（Swift + Rust）、移动端（Flutter）、Python 后端、嵌入式固件（nRF/Zephyr/C）及 AI 眼镜（ESP32-S3）
– ✅ 支持 BLE 协议连接硬件设备，实现 24 小时连续感知

快速上手方式：
在 macOS 上试用浏览器版（无需配置后端）：

git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh --yolo

要求：macOS 14+、已安装 Xcode（含 Swift 工具链）、Node.js。
如需完整本地开发（含 Rust 后端与 Python 服务），请按 README 步骤安装 Rust、配置 .env 并运行 ./run.sh；移动端则进入 app/ 目录执行 bash setup.sh ios 或 bash setup.sh android。

适用场景与目标用户：
– 需要高效整理会议、访谈、学习视频等音画内容的知识工作者（如产品经理、研究员、咨询顾问）；
– 希望构建私有化 AI 记忆系统的开发者与技术爱好者（全栈代码开放，支持深度定制）；
– 探索 AI+可穿戴设备融合应用的硬件创客（Omi Glass 开发套件与固件完全开源）；
– 注重数据主权的团队——所有组件均可本地部署，不强制依赖云端服务。

总结：
Omi 不只是一个“录音+总结”工具，而是一套面向真实工作流设计的开源认知增强系统。它把多模态输入、边缘采集、云端智能与跨端协同整合在一个统一架构中，且从 App 到芯片全部开放。尽管当前文档较分散、新手入门需一定技术基础，但其架构清晰、模块解耦，对希望掌控自己数字记忆的用户而言，是目前少有的、真正可信赖又可演进的“第二大脑”实践。建议访问其主页获取更详细信息。

【omi】你的第二大脑：一个能听、能看、能记、还能主动提醒的开源 AI 助手

【DeepTutor】一个能记住你学习轨迹、还能分身当多个AI家教的智能学习系统

【open-notebook】把AI研究笔记和播客生成权，重新握在自己手中

【daily_stock_analysis】告别手动盯盘，让 AI 自动生成每日股票决策看板

【open-webui】一个开箱即用、完全离线运行的自托管AI聊天平台

【FlClash】多设备代理配置不发愁？试试这款跨平台开源客户端

【abseil-cpp】补齐C++标准库短板的实战利器

类似文章