OpenClaw 文本提取:如何让 Agent 具备 OCR 能力读取扫描版 PDF 或图片?

发送包含不可选中文本的 PDF 给大模型,它通常会提示看不懂。你需要为它安装 OCR(光学字符识别)技能插件。安装 `@openclaw/plugin-ocr-tesseract` 并确保系统环境已安装 Tesseract 依赖(如 `apt-get install tesseract-ocr`)。安装后,当 Agent 收到图片或扫描件时,会先调用该技能提取文字,再对提取出的文本进行理解和总结。

作加

类似文章