Part 2: 技术架构
设计哲学
Design Philosophy
OpenClaw 的技术选择背后有一套清晰的设计哲学。理解这些理念,才能理解它为什么「不做」某些事情。
Unix 哲学 Small Tools, Composable, Text Streams
OpenClaw 的核心理念直接继承自 Unix:小工具、可组合、文本流。创始人 Peter Steinberger 的观点很明确:
「CLI 才是智能体连接世界的终极接口。」 不需要为每个服务写一个集成,Agent 只要能运行命令行,就能操作一切。
极简设计 Minimalism
OpenClaw 的 system prompt 可能是所有 AI Agent 框架中最短的。核心工具只有 4 个:
| 工具 | 用途 |
|---|---|
| Read | 读取文件 |
| Write | 写入文件 |
| Edit | 编辑文件 |
| Bash | 执行命令 |
这不是功能缺失,而是刻意为之。4 个工具足以覆盖几乎所有操作系统级别的任务。更少的工具意味着更短的 system prompt、更少的 token 消耗、更快的响应。
为什么不内置 MCP The Anti-MCP Stance
MCP(Model Context Protocol)是 Anthropic 提出的工具协议标准。几乎所有 AI Agent 框架都在集成 MCP,但 OpenClaw 故意不支持。Peter 的原话:
「我的前提是 MCP 是垃圾,不能 scale。你知道什么能 scale?CLI。Unix。」
OpenClaw 的替代方案:
- Agent 通过 Bash 工具直接调用 CLI 程序,不需要中间协议层
- 对于确实需要 MCP 的场景,通过内置的
mcporter技能桥接 - 强制 Agent 自己扩展能力,而非消费预构建的 MCP 工具集
自我扩展能力 Self-Extending Agent
OpenClaw Agent 可以在运行时写、重载、测试自己的扩展。这是它看起来比其他 Agent「更聪明」的关键原因之一:
- 遇到不会的操作 → 写一个 skill 来完成
- 发现 skill 有 bug → 修改并重载
- 在循环中持续改进自己的工具链
核心建议 不依赖外部预构建工具是有代价的:Agent 需要更强的模型能力来「从零写工具」。这也是 OpenClaw 推荐使用 Claude Opus 等高能力模型的原因。
Session 树形结构 Branching & Side-Quests
OpenClaw 的 Session 不是线性的聊天记录,而是树形结构:
- Agent 在执行主任务时,可以分支出一个 side-quest(比如修复一个工具)
- Side-quest 不消耗主 Session 的上下文窗口
- 完成后可以回滚到主分支,只带回一句总结
- 这让 Agent 可以做深度探索而不「污染」主对话
代码规模与性能 Scale & Performance
| 指标 | 数值 |
|---|---|
| 代码规模 | 约 43 万行 TypeScript |
| 内存占用 | 约 1GB(运行时) |
| 启动时间 | 3-5 秒 |
| 扩展数量 | 40+ 个官方扩展 |
| 内置技能 | 55 个 |
| 社区技能 | 13,729 个(ClawHub 注册) |
43 万行代码、1GB 内存,这并不「轻量」。但对于一个 24/7 运行的个人 AI 助手来说,在现代硬件上完全可接受。3-5 秒的启动时间保证了 Gateway 重启或更新后能快速恢复服务。