第 1 章 · 为什么是 OpenClaw？

AI 正在从"你问它答"走向"它替你做"。OpenClaw 是这条路上的一个岔路口——不是最快的，但可能是最诚实的那个。

本章你将学到

ChatBot 与 Agent 的本质区别，以及为什么这个区别比你想象的更重要
OpenClaw 在 AI Agent 框架生态中的独特定位和设计哲学
OpenClaw 与 Dify、Coze、AutoGPT 等主流方案的深度对比
一份从零开始的学习路线图

1.1 从 ChatBot 到 Agent：一场静悄悄的范式迁移

1.1.1 你每天都在用的"假 Agent"

打开任何一个聊天应用——微信、WhatsApp、Telegram——跟"AI 助手"聊两句，你会发现一件事：它能回答问题，能翻译文本，能写一封邮件。但你让它"帮我把这个文件整理到桌面上那个文件夹里"，它就沉默了。

这不是模型不够聪明。GPT-4、Claude、Gemini——它们的推理能力早已超出"回答问题"的范畴。问题出在连接层：模型的能力被锁在一个网页或一个 App 里，无法触达你的文件系统、你的消息通道、你的日历、你的家居设备。

这就是 ChatBot 的天花板——一个只能"说"不能"做"的 AI，本质上就是一个更聪明的搜索引擎。

1.1.2 Agent 的核心：行动而非对话

Agent 和 ChatBot 的分界线不在模型大小，不在参数量，而在于一个简单的问题：它能执行操作吗？

一个真正的 Agent 具备三个特征：

感知——它不只在对话窗口里等你输入。它能监听 WhatsApp 群组消息、接收 Discord 频道通知、读取邮件 webhook、感知系统状态。它知道外面发生了什么。

决策——它不只是"你说什么它做什么"。它能根据 HEARTBEAT.md 里的定时任务主动检查日历、预判你需要什么、在合适的时机推送信息。它有自己的判断逻辑。

执行——它能调用工具。读文件、写文件、运行命令、操控浏览器、发送消息、调用 API。它的输出不只是文本，而是真实世界中的动作。

用一句话概括：ChatBot 是一个被动的应答器，Agent 是一个主动的行动者。

┌─────────────────────────────────────────────────────────┐
│                    ChatBot vs Agent                      │
├─────────────────────────┬───────────────────────────────┤
│                         │                               │
│   ChatBot               │   Agent                       │
│   ┌─────────┐           │   ┌─────────────────────┐     │
│   │ 用户输入 │──→ 模型 ──→│   │ 用户输入/外部事件   │     │
│   └─────────┘  ┌──┐     │   └─────────┬───────────┘     │
│                │  │     │             │                  │
│                ▼  │     │             ▼                  │
│           ┌────────┐    │        ┌──────────┐           │
│           │ 文本回复 │    │        │ 决策引擎  │           │
│           └────────┘    │        └────┬─────┘           │
│                         │             │                  │
│   范围：对话窗口内       │             ▼                  │
│                         │   ┌─────────────────┐         │
│                         │   │ 工具调用 + 文本  │         │
│                         │   └─────────────────┘         │
│                         │                               │
│   范围：你的整个数字生活 │                               │
└─────────────────────────┴───────────────────────────────┘

1.1.3 为什么现在这个转变如此重要

2024 年底到 2025 年初，AI 行业发生了一个微妙但关键的变化：模型的"智商"已经不再是瓶颈。

Claude 可以写一个完整的后端服务。GPT-4 可以分析一份财报并给出投资建议。Gemini 可以处理多模态输入——图片、视频、音频。但这些能力大多被关在各自的"花园"里：你要打开 Claude.ai，上传文件，等它处理完，再手动把结果复制到你需要的地方。

这种"人工搬运数据"的模式，在模型能力飞速提升的背景下，变得越来越荒谬。

想象一下：你的 AI 助手能读你的邮件、能看你的日历、能操作你的电脑——但它被封在一个浏览器标签页里，每次你都得手动复制粘贴。这就像雇了一个顶级的私人助理，但把他锁在一间没有电话、没有电脑的办公室里，只能通过门缝递纸条交流。

Agent 框架要做的事，就是推倒这面墙。

1.1.4 Agent 框架解决了什么问题

一个合格的 Agent 框架需要解决三个核心问题：

连接——让 AI 能触达外部世界。消息通道（WhatsApp、Telegram、Discord）、文件系统、浏览器、API。没有连接，Agent 就是个孤儿。

记忆——让 AI 能记住上下文。不只是当前对话的上下文，还有长期记忆：你的偏好、你说过的话、过去的决策。没有记忆，Agent 就是个失忆症患者。

自主性——让 AI 能在没有人类干预的情况下行动。定时任务、事件驱动、主动推送。没有自主性，Agent 就只是个更快的搜索引擎。

OpenClaw 的设计就是围绕这三个问题展开的。我们先不急着看技术细节——在第二章我们会深入架构——但先要理解它在解决什么问题，才能判断它解决得好不好。

1.2 OpenClaw 的定位：一个"不完美但诚实"的选择

1.2.1 OpenClaw 是什么

OpenClaw 是一个开源的、自托管的 AI Agent 网关。它做的事情用一句话就能说清楚：把多个消息通道（WhatsApp、Telegram、Discord、iMessage 等）连接到一个 AI Agent 上，让这个 Agent 能在你的日常通信中为你工作。

"网关"这个词很关键。OpenClaw 本身不是模型——它不训练也不托管 LLM。它是一个中间层，一端连着消息通道，一端连着 AI 模型（Anthropic、OpenAI、Google 等 35+ 提供商），中间是 Agent 的"大脑"：工作空间、工具、记忆、会话。

┌──────────┐  ┌──────────┐  ┌──────────┐
│ WhatsApp  │  │ Telegram  │  │ Discord  │
└────┬─────┘  └────┬─────┘  └────┬─────┘
     │              │              │
     └──────────────┼──────────────┘
                    │
              ┌─────▼─────┐
              │  Gateway  │  ← OpenClaw 核心
              │  (网关)   │
              └─────┬─────┘
                    │
        ┌───────────┼───────────┐
        │           │           │
   ┌────▼────┐ ┌───▼────┐ ┌───▼────┐
   │ Agent   │ │ Tools  │ │ Memory │
   │ Runtime │ │ (工具) │ │ (记忆) │
   └────┬────┘ └────────┘ └────────┘
        │
   ┌────▼────────────────────┐
   │  AI 模型 (35+ 提供商)   │
   │  Anthropic / OpenAI /   │
   │  Google / Ollama / ...  │
   └─────────────────────────┘

1.2.2 OpenClaw 不是什么

了解一个工具"不是什么"往往比了解"是什么"更有价值。

OpenClaw 不是一个低代码平台。 你不会在 OpenClaw 里拖拽节点、画流程图来构建 Agent。它的配置方式是写 JSON5 配置文件 + Markdown 文本文件。如果你想要一个可视化编排工具，Dify 或 Coze 更合适。

OpenClaw 不是一个 ChatBot SDK。 它不提供"在 5 分钟内给你的网站加一个 AI 聊天窗口"的功能。它的核心场景是个人助手——一个长期运行、有记忆、有自主性的 AI，而不是一个嵌入网页的一次性对话框。

OpenClaw 不是一个模型训练平台。 它不训练、微调或托管模型。它调用模型的 API。你把 API Key 给它，它负责把消息送到模型、把结果送回来。

OpenClaw 不是一个企业级 SaaS。 它是自托管的——跑在你自己的机器上（Mac、Linux 服务器、Docker 容器），数据留在你自己手里。没有云服务订阅，没有按使用量计费（模型 API 的费用除外）。

1.2.3 OpenClaw 的设计哲学

OpenClaw 的设计中有几个值得注意的决策，它们共同构成了一个鲜明的哲学立场：

自托管优先。 你的消息历史、你的文件、你的 API Key——全都存在你自己的机器上。OpenClaw 不会把你的数据送到第三方服务器（除了模型 API 调用）。这在"AI 即服务"的时代是一个反潮流的选择，但它意味着你对自己的数据有完全的控制权。

通道即界面。 OpenClaw 没有自己的 App 作为主要交互界面（虽然它有 Web 控制面板和 macOS 菜单栏应用）。它的设计假设是：你已经有一个每天都在用的消息应用，为什么不直接在那里跟 AI 对话？ 你在 WhatsApp 上跟朋友聊天，顺便让 AI 帮你查个航班；你在 Telegram 上跟同事讨论项目，让 AI 帮你审查一下代码。不需要切换到另一个 App。

文本即配置。 OpenClaw 的 Agent 人格不是通过 UI 面板设定的，而是通过 Markdown 文件。SOUL.md 定义 Agent 的性格，AGENTS.md 定义它的行为规则，USER.md 告诉它你是谁。这种方式看起来"原始"，但它有几个好处：版本控制友好、可读性强、可以随时用任何文本编辑器修改。

渐进式复杂度。 OpenClaw 可以在 5 分钟内以默认配置跑起来（一行安装命令 + 一个引导向导）。但它的天花板很高——多 Agent 路由、沙箱隔离、Webhook 集成、Cron 定时任务、插件系统——这些高级功能在你需要时才出现，不会在第一天就给你造成认知负担。

1.3 竞品深度对比

理解 OpenClaw 的最佳方式不是看它有什么功能，而是看它选择了不做什么。下面这张对比表，不是简单罗列功能清单，而是从"你要解决什么问题"的角度出发。

1.3.1 主流方案全景

维度	OpenClaw	Dify	Coze	AutoGPT
核心定位	自托管个人 Agent 网关	开源 LLM 应用开发平台	字节跳动的 AI Bot 构建平台	自主 Agent 实验项目
部署方式	本地 / Docker / VPS	自托管 / 云服务	仅云服务（扣子）	本地运行
数据所有权	完全自有	自托管版自有，云版归 Dify	归字节跳动	完全自有
消息通道	WhatsApp/Telegram/Discord/iMessage 等	Web SDK/API 集成	微信/飞书/Telegram/Discord	无（纯终端/浏览器）
模型支持	35+ 提供商，含本地模型	多提供商	多提供商（国内为主）	OpenAI/本地模型
Agent 自主性	高（心跳、Cron、Webhook）	中（工作流触发）	中（定时触发）	高（自主循环）
配置方式	JSON5 + Markdown 文件	可视化 + YAML	可视化拖拽	Python 脚本
多 Agent	原生支持，隔离路由	工作流编排	多 Bot 独立	插件式
工具生态	内置 + Skills + Plugins	工具市场	插件市场	插件式
学习曲线	中等（需理解 CLI 和配置）	低（可视化）	低（可视化）	高（需编程能力）
适合场景	个人助手、多通道自动化	企业 AI 应用、知识库 Bot	快速原型、社交 Bot	研究、自动化实验

1.3.2 为什么不选 Dify

Dify 是一个优秀的开源 LLM 应用平台。如果你需要做的是：

为公司构建一个客服 ChatBot
搭建一个 RAG 知识库问答系统
用可视化工作流编排一个数据处理管道

那 Dify 是更好的选择。它的可视化编排界面、丰富的预置组件、完善的团队协作功能，都是 OpenClaw 不具备的。

但 Dify 的"通道"概念是面向 Web 的——它更擅长做一个"嵌入到网站里的对话框"或一个"API 驱动的后端服务"，而不是一个"活在你的 WhatsApp 里的私人助手"。Dify 的 Agent 自主性也有限——它更多是"事件触发 → 工作流执行"的模式，而不是 OpenClaw 的"心跳驱动的持续存在"模式。

1.3.3 为什么不选 Coze

Coze（扣子）是字节跳动推出的 AI Bot 平台，最大的优势是上手极快。拖拽组件、选个模型、发布到飞书或 Telegram——整个过程不需要写一行代码。

但 Coze 是纯云服务。你的 Bot 的所有对话历史、知识库、配置都存在字节跳动的服务器上。对于个人助手这种需要处理敏感信息（私人消息、文件、日程）的场景，这是一个不可忽视的隐患。

另外，Coze 的 Bot 主要是"被动响应"模式——用户发消息，Bot 回复。它缺乏 OpenClaw 的主动能力：心跳检查、定时任务、事件驱动的自主行动。

1.3.4 为什么不选 AutoGPT

AutoGPT 是 AI Agent 领域的先驱项目。它的野心最大——让 AI 完全自主地完成复杂任务，不需要人类的持续干预。它的影响力不可估量，整个 Agent 框架品类的兴起都和它有关。

但 AutoGPT 的问题也很明显：它太"学术"了。配置复杂、运行不稳定、没有消息通道集成、缺乏生产级的运维工具。它更适合研究者和极客，而不是想要一个"能用"的日常助手的人。

OpenClaw 可以看作是 AutoGPT 理念的一个"工程化落地"——保留了 Agent 的自主性和工具调用能力，但补齐了 AutoGPT 缺失的：消息通道、会话管理、多 Agent 路由、运维监控。

1.3.5 OpenClaw 的独特价值

总结一下，OpenClaw 在竞品中的独特位置：

唯一一个把消息通道作为一等公民的开源 Agent 框架。 不是"可以集成 WhatsApp"，而是"WhatsApp 是核心界面"。
唯一一个同时支持多通道 + 多 Agent + 隔离路由的开源方案。 你可以用一个网关管理多个 Agent，每个 Agent 有自己的人格、记忆、工具权限。
唯一一个以"个人助手"而非"企业应用"为核心场景的开源 Agent 框架。 它的设计假设是：一台机器、一个人（或一个家庭/小团队）、多个消息通道。
自托管 + 数据自有。 在 AI 服务纷纷走向云端订阅的 2025 年，这是一个越来越稀缺的属性。

1.4 OpenClaw 能做什么：真实场景速览

理论对比之后，让我们看看 OpenClaw 在真实世界中实际被用来做什么。以下是来自社区的真实案例（来源于 OpenClaw 官方 Showcase 页面），我按类别整理了最有代表性的几个。

1.4.1 全天候个人助理

最常见的使用场景：一个 24 小时在线的 AI 助手，通过你常用的消息通道为你服务。

有人用 OpenClaw 在 WhatsApp 上搭建了一个"早晨简报 Agent"——每天早上自动生成一张图片，上面有天气、待办事项、日期和一句格言，然后发送到 Telegram。这不是什么高深的技术，但它展示了一个关键特征：Agent 可以主动行动，不需要你先开口。

另一个案例更极端：一位开发者在看 Netflix 的时候，完全通过 Telegram 消息重构了自己的个人网站。从 Notion 迁移到 Astro、迁移了 18 篇文章、把 DNS 切到 Cloudflare——全程没有打开过笔记本电脑。

1.4.2 开发者工作流

OpenClaw 在开发者社区有一个出人意料的活跃度。

有人用它做 PR 审查：代码变更完成 → 自动开 PR → OpenClaw 审查 diff → 在 Telegram 里回复"有几点小建议"加上是否可以合并的结论。

有人用它生成技能（Skill）：在 Telegram 里说"帮我做一个本地酒窖管理的 Skill"，Agent 会问你有没有样本 CSV 数据、存在哪里，然后几分钟内就构建并测试好了一个能管理 962 瓶酒的 Skill。

有人甚至通过 Telegram 聊天完成了一个完整的 iOS App 开发并部署到 TestFlight——包含地图和录音功能。

1.4.3 家庭自动化

OpenClaw 与 Home Assistant 的集成是一个亮点。有人在树莓派上运行 OpenClaw + Home Assistant，通过自然语言控制空气净化器、扫地机器人、灯光和温度。

更实用的案例：英国有家长用 OpenClaw 自动在学校订餐系统（ParentPay）上帮孩子订餐。没有 API，就是纯浏览器自动化——点击表格、选择日期、确认订单。

1.4.4 知识管理与记忆

有人把完整的 WhatsApp 导出数据（包含 1000+ 条语音消息）喂给 OpenClaw，让它转录所有语音笔记、与 Git 日志交叉比对、输出带有链接的 Markdown 报告。这个案例特别能说明 OpenClaw 的"记忆"能力——它不只是处理单次对话，而是能处理大量的历史数据。

还有人做了一个更"科幻"的应用：把 OpenClaw 的会话文件转化成"记忆" → "信念" → "自我模型"，让 Agent 逐步建立一个不断演化的自我认知。

1.5 OpenClaw 的核心特性深度解析

在进入架构细节（第二章）之前，让我们先建立一个对 OpenClaw 特性的全局认识。

1.5.1 多通道网关

OpenClaw 的 Gateway 是整个系统的核心。它同时管理所有消息通道的连接——WhatsApp、Telegram、Discord、iMessage——通过一个统一的 WebSocket 协议向上层客户端暴露。

这意味着什么？意味着你可以：

在 WhatsApp 上问 Agent 一件事，然后切换到 Telegram 继续同一个话题（取决于会话配置）
在 Discord 群里 @Agent 让它帮忙查资料，同时你的朋友在 WhatsApp 上跟同一个 Agent 聊别的事
所有消息通道共享同一个 Agent 大脑、同一套记忆、同一套工具

内置通道包括 WhatsApp、Telegram、Discord、iMessage。通过插件系统，还支持 Mattermost、Matrix、Microsoft Teams、Nostr 等。

1.5.2 多 Agent 路由

这不是简单的"多个 Bot"。OpenClaw 的多 Agent 是完全隔离的：

每个 Agent 有自己的工作空间（Workspace）——独立的 SOUL.md、AGENTS.md、USER.md
每个 Agent 有自己的认证配置（Auth Profile）——可以用不同的模型、不同的 API Key
每个 Agent 有自己的会话存储——对话历史互不可见
每个 Agent 有自己的工具权限——可以限制某些 Agent 不能执行危险操作

路由规则是确定性的：一条消息进来，Gateway 根据通道、账号、发送者 ID 等条件，把它分配给对应的 Agent。分配规则支持"最具体匹配优先"——peer 级别的匹配优先于通道级别的匹配。

实际场景：你可以给"工作"和"生活"分别设置一个 Agent。工作 Agent 用 GPT-4，连接工作 WhatsApp 号码，有严格的工具限制；生活 Agent 用 Claude Opus，连接个人 Telegram，有完整的工具权限。两个 Agent 运行在同一个 Gateway 进程里，但完全隔离。

1.5.3 模型无关性

OpenClaw 支持 35+ 模型提供商，包括：

主流商业模型：Anthropic（Claude 系列）、OpenAI（GPT 系列）、Google（Gemini 系列）
本地/自托管模型：Ollama、vLLM、SGLang
兼容 API：任何 OpenAI 兼容或 Anthropic 兼容的端点

模型引用使用 provider/model 格式，例如 anthropic/claude-opus-4-6。你可以在不同 Agent 上使用不同模型，也可以配置 fallback 模型链——主模型不可用时自动切换到备用模型。

更实际的做法是：日常聊天用便宜快速的模型（如 Claude Sonnet），需要深度思考时手动切换到强力模型（如 Claude Opus）。OpenClaw 支持在对话中通过 /model 命令动态切换。

1.5.4 工具与技能系统

OpenClaw 的"工具"分为三个层次：

内置工具——文件读写、命令执行、浏览器自动化、会话管理。这些工具始终可用，但可以通过工具策略（Tool Policy）控制权限。

技能（Skills）——可安装的功能包。从 ClawHub 社区市场获取，也可以自己编写。技能本质上是一组预设的指令和工具使用方式，让 Agent 知道"怎么做某件特定的事"。例如：Home Assistant 技能让 Agent 知道如何控制智能家居设备；酒窖管理技能让 Agent 知道如何查询和管理你的藏酒。

插件（Plugins）——更深层次的扩展。插件可以注册新的工具、修改 Agent 生命周期、添加新的消息通道。插件系统有完整的钩子（Hook）机制，允许在 Agent 循环的各个阶段插入自定义逻辑。

1.5.5 安全模型

OpenClaw 的安全设计基于一个清晰的信任边界：你（机器的所有者）是唯一受信任的操作者。

这意味着：

消息通道默认使用 allowlist 或 pairing 模式——不是任何人都能跟你的 Agent 对话
工具执行有权限控制——可以限制 Agent 不能写文件、不能执行命令
Agent 沙箱——可以把 Agent 的工具执行隔离在 Docker 容器里
Gateway 认证——所有 WebSocket 连接都需要认证，包括本地连接

这个安全模型适合个人使用场景。如果你要把 Agent 开放给不可信的用户（比如一个公共 Discord 机器人），就需要额外的安全加固——第三章会详细讲。

1.6 学习路线图

如果你决定深入 OpenClaw，这里是我建议的学习路径。这不是官方的路线图，而是基于实际使用经验总结的。

1.6.1 第一阶段：跑起来（1-2 天）

目标：安装 OpenClaw，完成基本配置，在 Web 控制面板里跟 Agent 聊第一句话。

安装 OpenClaw（第三章会手把手教你）
运行引导向导（openclaw onboard）
在 Web 控制面板发送第一条消息
理解配置文件结构（~/.openclaw/openclaw.json）

在这个阶段，你不需要理解架构细节。只要能跑起来、能对话，就足够了。

1.6.2 第二阶段：接入通道（2-3 天）

目标：把 OpenClaw 连接到你常用的消息应用，开始在日常通信中使用 Agent。

选择一个通道接入（推荐从 Telegram 开始，配置最简单）
配置 allowlist 和安全策略
理解会话（Session）的概念——什么时候重置、什么时候保持
尝试多通道同时使用

1.6.3 第三阶段：塑造人格（3-5 天）

目标：让 Agent 变成"你的"Agent，有你的偏好、你的风格。

编写 SOUL.md——定义 Agent 的性格和边界
编写 AGENTS.md——定义 Agent 的行为规则
编写 USER.md——告诉 Agent 你是谁
配置心跳（Heartbeat）——让 Agent 定期检查任务
尝试记忆（Memory）功能——让 Agent 记住重要信息

1.6.4 第四阶段：扩展能力（1-2 周）

目标：让 Agent 能做更多事——调用 API、操作浏览器、连接外部服务。

安装和使用 Skills
配置 Cron 定时任务
设置 Webhook 接收外部事件
尝试浏览器自动化
编写自己的 Skill

1.6.5 第五阶段：多 Agent 与高级配置（2-4 周）

目标：构建多 Agent 系统，实现复杂的工作流。

配置多 Agent 路由
理解 Agent 隔离和权限控制
配置沙箱（Sandbox）
编写插件（Plugin）
设置 CI/CD 和监控

1.6.6 路线图总结

时间线    第一阶段    第二阶段    第三阶段    第四阶段    第五阶段
         ┌─────┐   ┌─────┐   ┌─────┐   ┌──────┐   ┌──────┐
深度     │ 安装 │ → │ 通道 │ → │ 人格 │ → │ 工具  │ → │ 多Agent│
         │ 跑通 │   │ 接入 │   │ 塑造 │   │ 扩展  │   │ 高级   │
         └─────┘   └─────┘   └─────┘   └──────┘   └──────┘
         1-2天      2-3天      3-5天      1-2周       2-4周

💡 经验之谈

不需要按顺序走完所有阶段。很多人的实际路径是：跑起来 → 接入 Telegram → 开始用 → 遇到需要 → 再学对应的技能。OpenClaw 的渐进式设计允许你"按需学习"。

1.7 谁适合用 OpenClaw

1.7.1 适合的人

开发者——你熟悉命令行、能写 JSON 配置、愿意读文档。OpenClaw 的最佳用户群体。
技术爱好者——你对 AI 感兴趣，但不想用云服务把数据交出去。自托管对你很重要。
效率极客——你想要一个真正能"做事情"的 AI 助手，而不只是聊天。
小团队——你们需要一个共享的 AI 助手，但不想为 SaaS 订阅付费。

1.7.2 不适合的人

完全不想碰命令行的人——OpenClaw 的配置和排错都需要命令行操作。
需要一个快速原型的人——如果你只是想"试试 AI Agent 是什么感觉"，Coze 或 Dify 的可视化界面更适合。
企业级多租户需求——OpenClaw 的安全模型是为个人/小团队设计的，不适合作为面向公众的服务。
只需要一个网页聊天机器人的人——这用 ChatGPT API + 一个前端框架就能搞定，不需要 Agent 框架。

本章小结

AI 正在从 ChatBot（被动应答）向 Agent（主动行动）迁移，连接层是这个迁移的关键瓶颈
OpenClaw 是一个自托管的、开源的多通道 AI Agent 网关，核心价值在于把消息通道作为 Agent 的一等界面
与 Dify（企业应用平台）、Coze（云服务 Bot 平台）、AutoGPT（研究项目）相比，OpenClaw 独特定位在"个人助手 + 自托管 + 多通道"
OpenClaw 的设计哲学是：自托管优先、通道即界面、文本即配置、渐进式复杂度
社区中已有丰富的真实使用案例：个人助理、开发者工作流、家庭自动化、知识管理

下一步

你已经理解了 OpenClaw 是什么、为什么它值得学。下一章，我们会打开 OpenClaw 的"引擎盖"，看看它的内部架构是什么样的——Gateway 如何工作、Agent Loop 如何运转、消息如何在系统中流动。理解架构是做出正确配置决策的基础。

⚠️ 踩坑记录

问题：很多人第一次接触 OpenClaw 时会把它和 Dify/Coze 对比，然后困惑于"为什么它没有可视化界面"。

原因：OpenClaw 的设计哲学是"文本即配置"——用 Markdown 文件定义人格、用 JSON5 文件定义配置。这不是技术限制，而是有意的取舍。文本文件的好处是版本控制友好、可读性强、可以脚本化修改。

解决：接受这个设计哲学。如果你真的需要可视化配置，可以用 Control UI 的表单界面——它渲染一个表单，底层操作的还是同一份配置文件。