OpenClaw 终极指南:自托管 AI 网关安装、配置与架构原理解析
打造您的私有数字副驾驶 | 支持 Telegram/Discord/飞书 + 国产大模型接入
1. 原理
OpenClaw 是一个自托管网关,可将您最喜欢的聊天应用程序(WhatsApp、Telegram、Discord、iMessage 等)连接到像 Pi 这样的 AI 编码代理。,您只需在自己的机器(或服务器)上运行一个 Gateway 进程,它就会成为您的消息应用程序和始终可用的 AI 助手之间的桥梁。
Pi Ai是由由 Inflection AI 开发的一款对话式人工智能助手

OpenClaw 支持多种接入路径,具体取决于网关的运行位置以及您希望如何配置提供商。
1.1 神经中枢:Gateway网关
Gateway是OpenClaw系统的核心心脏,是一个基于Node.js(要求v22+)构建的长运行守护进程。它充当了所有外部通信与内部逻辑之间的总线
Gateway属于:控制平面(Control Plane)
- 所有的外部聊天链接都是它统一处理
Gateway默认绑定在本地环回地址(127.0.0.1:18789),这意味着它不直接向公网暴露端口。这种“环回优先”的网络模型强制要求所有外部访问——无论是来自移动端的Node连接,还是远程管理——必须通过安全的隧道技术(如SSH Tunnel或Tailscale)进行。
Loopback-First设计原则
1.2 感知触手:Nodes(节点)
如果说Gateway是OpenClaw的大脑,那么Nodes就是它的手脚和感官。Node是运行在iOS、Android或macOS等终端设备上的轻量级客户端程序,它们通过WebSocket连接回Gateway,将设备的物理能力虚拟化为可供Agent调用的工具
Agent无需运行在手机上,却能通过Gateway远程调用手机的硬件能力:
视觉能力 (camera.*):Agent可以调用camera.snap指令,触发Android或iOS Node拍摄照片;或调用camera.clip录制短视频
地理感知 (location.get):Node能够获取设备的GPS坐标,使得Agent能够提供基于位置的服务(LBS),如“我现在的坐标天气如何?”或“帮我记录停车位置”
屏幕交互 (screen.record):在Android端,Node甚至支持屏幕录制,为未来的UI自动化操作奠定了基础
1.4 记忆系统
记忆是OpenClaw区别与普通Chatbot的核心能力,四层记忆从不可变的身份内核到实时对话,构建了完整的上下文连续性
- SOUL.md 不可变内核
- TOOLS:动态工具
- User:语义长期记忆
- Session:短期对话记忆
- SOUL.md