电脑技巧 OpenClaw 语音交互:如何在 WhatsApp 或 Telegram 中让 Agent 听懂语音消息? 作者提米哥 2026年3月7日 支持。OpenClaw 内置了多模态通道支持。如果配置了支持音频的底层模型(如 GPT-4o-audio),或者接入了 Whisper API 作为语音转文本的中转代理,Agent 能够直接听懂你发送的语音,并通过 TTS(文本转语音)模块回复你音频。在 “Config” 面板中确认 “Enable Media Processing” 选项已打开,并配置好相应的 STT/TTS 引擎 API 即可。