OpenClaw 文本提取：如何让 Agent 具备 OCR 能力读取扫描版 PDF 或图片？

作者提米哥 2026年3月7日

发送包含不可选中文本的 PDF 给大模型，它通常会提示看不懂。你需要为它安装 OCR（光学字符识别）技能插件。安装 `@openclaw/plugin-ocr-tesseract` 并确保系统环境已安装 Tesseract 依赖（如 `apt-get install tesseract-ocr`）。安装后，当 Agent 收到图片或扫描件时，会先调用该技能提取文字，再对提取出的文本进行理解和总结。

提米哥

微信联系：timidamen

OpenClaw 文本提取：如何让 Agent 具备 OCR 能力读取扫描版 PDF 或图片？

OpenClaw 语音压缩：手机发长语音消耗流量大，如何利用 FFmpeg 在上传前压缩音频？

内存占用率居高不下怎么办？

OpenClaw 界面美化：Live Canvas 生成的 UI 组件配色太丑如何自定义 CSS 主题？

OpenClaw 外网配置：怎么给 Web Control UI 绑定一个炫酷的自定义域名（如 ai.xxx.com）？

OpenClaw 道德审查：大模型拒绝帮我写渗透测试等黑客代码 (Ethical Refusal) 怎么办？

OpenClaw 环境报错：npm 全局安装时提示 cb() never called 怎么清除缓存修复？

类似文章