Part 7: 安全与成本
成本控制
Cost Control
API费用是OpenClaw运营的最大成本。不做控制,真的会一觉醒来收到$1,100的账单。
理解 Token
在深入成本控制策略之前,先理解 Token 是什么。Token 是 AI 模型处理文本的最小单位,也是计费的基本单位。
Token 换算
- 1 个英文单词 ≈ 1-2 tokens
- 1 个中文字 ≈ 1.5-2.5 tokens
- 1000 字中文 ≈ 2000-2500 tokens
费用结构
AI 模型按输入和输出分别计费。以 Claude Sonnet 4 为例:
| 类型 | 价格(每百万 tokens) |
|---|---|
| 输入(你发给 AI 的内容) | $3 |
| 输出(AI 回复的内容) | $15 |
实际花费举例
| 操作 | 大约 Token | 大约费用(Claude Sonnet) |
|---|---|---|
| 简单问答(一轮) | 500 输入 + 200 输出 | $0.004 |
| 写一篇 1000 字文章 | 1000 输入 + 2500 输出 | $0.04 |
| 让 Agent 分析一个项目 | 5000 输入 + 3000 输出 | $0.06 |
| 一天正常使用(3-5小时) | ~50K 输入 + ~20K 输出 | $0.45 |
月费估算:正常使用(每天 3-5 小时),使用 Claude Sonnet 大约 $10-30/月。如果优化得当(Fallback 链 + 国产模型),OpenClaw 可以比 ChatGPT Plus 的 $20/月更便宜,而且功能更强大。
为什么成本会失控
OpenClaw的Token消耗远超普通聊天场景。原因有几个:
- 每次Agent思考都是多轮推理:一个简单的任务可能触发5-10次API调用
- Skills的描述会注入system prompt,增加每次请求的输入token
- 记忆系统(MEMORY.md + Daily Logs)会在每次请求中附带上下文
- Agent 24/7运行,定时任务(cron)不断触发API调用
- 多轮思考 + 多工具调用的Token消耗可能是传统聊天的几十甚至上百倍
Token 消耗的隐形杀手
很多人不知道,以下操作会大量消耗 Token:
- 系统提示词(System Prompt):每次对话都会发送,占 10-30% 的 Token
- 文件读取:Agent 读取大文件时,整个内容计入输入 Token
- 对话历史:对话越长,每次发送的历史越多
- 工具调用:Agent 使用工具时,工具描述占额外 Token
这就是为什么 Token 优化非常重要——你以为只花了一条消息的钱,实际上背后有大量隐性消耗。
真实案例:社区中频繁出现的恐怖故事:用户设置了Agent处理邮件的cron任务,晚上睡觉前一切正常,第二天早上发现API账单暴涨到$1,100。原因是Agent在处理邮件时进入了循环推理,整晚不停调用API。
Token优化策略:Fallback链
Fallback链是OpenClaw最核心的省钱策略。原理很简单:主模型不可用时自动降级到更便宜的模型。但更聪明的用法是主动利用它来控制成本。
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4-6",
"fallbacks": [
"anthropic/claude-haiku-4-5",
"deepseek/deepseek-chat"
]
}
}
}
}不同方案的成本对比
| 策略 | 主力模型 | 输入价格/百万token | 相对成本 |
|---|---|---|---|
| 全用Claude Sonnet | Claude Sonnet 4.6 | $3.00 | 100%(基准) |
| Sonnet + Haiku Fallback | Sonnet → Haiku | $3.00 / $1.00 | 约50-60% |
| Sonnet → Haiku → DeepSeek | 三级Fallback | $3.00 / $1.00 / $0.14 | 约5-20% |
| 纯DeepSeek | DeepSeek-V3 | $0.14 | 约5% |
| 本地Ollama | Qwen3-Coder等 | $0 | 0%(仅电费) |
从Claude Sonnet切换到「Sonnet → Haiku → DeepSeek」三级Fallback链,可以降低80-95%的API成本。大部分简单任务(问候、查天气、简单查询)会自动走最便宜的模型,只有复杂任务才会用到主力模型。
预算限制设置
OpenClaw支持在配置中设置预算上限:
{
"agents": {
"defaults": {
"budget": {
"maxTokensPerDay": 500000,
"maxCostPerDay": 5.00
}
}
}
}核心建议
强烈建议所有用户都设置日预算上限。哪怕你不差钱,一个每日$5的上限也能在Agent进入循环推理时保护你的钱包。
本地模型:完全免费方案
通过Ollama或LM Studio运行本地模型,可以实现零API成本:
| 方案 | 推荐模型 | 硬件要求 | 适合场景 |
|---|---|---|---|
| Ollama | Qwen3-Coder:32B / Devstral-24B | 32GB RAM | 代码任务、Agent工具调用 |
| Ollama(轻量) | Llama 3.3 / DeepSeek-R1:14B | 16GB RAM | 简单对话、心跳任务 |
| LM Studio | MiniMax M2.5 / Devstral-24B | 32GB RAM | 需要GUI管理的用户 |
# Ollama安装和配置
ollama pull qwen3-coder:32b
# OpenClaw自动发现本地模型,只需设置环境变量
# OLLAMA_API_KEY可以是任意值{
"env": { "OLLAMA_API_KEY": "ollama-local" }
}注意
使用Ollama时不要用 /v1 OpenAI兼容URL,会导致工具调用异常。让OpenClaw使用原生Ollama API即可自动发现模型。
服务器成本
相比API费用,服务器成本已经不是主要开销:
| 方案 | 月费 | 说明 |
|---|---|---|
| 阿里云轻量服务器 | 约¥6-9/月 | 新用户优惠,2vCPU+2GB即可运行 |
| 腾讯云Lighthouse | 约¥8-12/月 | 类似方案,社区支持好 |
| Fly.io | 免费起步 | 有免费额度,适合轻度使用 |
| 本地电脑运行 | ¥0 | 利用现有设备,但需要保持开机 |
成本优化推荐方案
推荐:混合模型策略
- 主力:Claude Sonnet
- 日常:DeepSeek-V3
- 心跳:Gemini Flash(免费额度)或本地Ollama
- Fallback:Sonnet → Haiku → DeepSeek
- 月均 $5-20
不推荐:单一贵价模型
- 所有任务都用Claude Opus
- 不设预算上限
- 不配置Fallback
- cron任务高频运行
- 月均 $100-1,000+
成本控制核心原则:用对的模型做对的事。简单问答用$0.14/M的DeepSeek-V3,复杂推理用$3.00/M的Claude Sonnet,免费的Gemini Flash或Ollama跑心跳和定时任务。三级Fallback链 + 日预算上限,两招就能把月成本从三位数压到两位数甚至个位数。