Skip to content

Part 7: 安全与成本

成本控制

Cost Control

API费用是OpenClaw运营的最大成本。不做控制,真的会一觉醒来收到$1,100的账单。

理解 Token

在深入成本控制策略之前,先理解 Token 是什么。Token 是 AI 模型处理文本的最小单位,也是计费的基本单位。

Token 换算

  • 1 个英文单词 ≈ 1-2 tokens
  • 1 个中文字 ≈ 1.5-2.5 tokens
  • 1000 字中文 ≈ 2000-2500 tokens

费用结构

AI 模型按输入和输出分别计费。以 Claude Sonnet 4 为例:

类型价格(每百万 tokens)
输入(你发给 AI 的内容)$3
输出(AI 回复的内容)$15

实际花费举例

操作大约 Token大约费用(Claude Sonnet)
简单问答(一轮)500 输入 + 200 输出$0.004
写一篇 1000 字文章1000 输入 + 2500 输出$0.04
让 Agent 分析一个项目5000 输入 + 3000 输出$0.06
一天正常使用(3-5小时)~50K 输入 + ~20K 输出$0.45

月费估算:正常使用(每天 3-5 小时),使用 Claude Sonnet 大约 $10-30/月。如果优化得当(Fallback 链 + 国产模型),OpenClaw 可以比 ChatGPT Plus 的 $20/月更便宜,而且功能更强大。

为什么成本会失控

OpenClaw的Token消耗远超普通聊天场景。原因有几个:

  • 每次Agent思考都是多轮推理:一个简单的任务可能触发5-10次API调用
  • Skills的描述会注入system prompt,增加每次请求的输入token
  • 记忆系统(MEMORY.md + Daily Logs)会在每次请求中附带上下文
  • Agent 24/7运行,定时任务(cron)不断触发API调用
  • 多轮思考 + 多工具调用的Token消耗可能是传统聊天的几十甚至上百倍

Token 消耗的隐形杀手

很多人不知道,以下操作会大量消耗 Token:

  1. 系统提示词(System Prompt):每次对话都会发送,占 10-30% 的 Token
  2. 文件读取:Agent 读取大文件时,整个内容计入输入 Token
  3. 对话历史:对话越长,每次发送的历史越多
  4. 工具调用:Agent 使用工具时,工具描述占额外 Token

这就是为什么 Token 优化非常重要——你以为只花了一条消息的钱,实际上背后有大量隐性消耗。

真实案例:社区中频繁出现的恐怖故事:用户设置了Agent处理邮件的cron任务,晚上睡觉前一切正常,第二天早上发现API账单暴涨到$1,100。原因是Agent在处理邮件时进入了循环推理,整晚不停调用API。

Token优化策略:Fallback链

Fallback链是OpenClaw最核心的省钱策略。原理很简单:主模型不可用时自动降级到更便宜的模型。但更聪明的用法是主动利用它来控制成本。

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4-6",
        "fallbacks": [
          "anthropic/claude-haiku-4-5",
          "deepseek/deepseek-chat"
        ]
      }
    }
  }
}

不同方案的成本对比

策略主力模型输入价格/百万token相对成本
全用Claude SonnetClaude Sonnet 4.6$3.00100%(基准)
Sonnet + Haiku FallbackSonnet → Haiku$3.00 / $1.00约50-60%
Sonnet → Haiku → DeepSeek三级Fallback$3.00 / $1.00 / $0.14约5-20%
纯DeepSeekDeepSeek-V3$0.14约5%
本地OllamaQwen3-Coder等$00%(仅电费)

从Claude Sonnet切换到「Sonnet → Haiku → DeepSeek」三级Fallback链,可以降低80-95%的API成本。大部分简单任务(问候、查天气、简单查询)会自动走最便宜的模型,只有复杂任务才会用到主力模型。

预算限制设置

OpenClaw支持在配置中设置预算上限:

json
{
  "agents": {
    "defaults": {
      "budget": {
        "maxTokensPerDay": 500000,
        "maxCostPerDay": 5.00
      }
    }
  }
}

核心建议

强烈建议所有用户都设置日预算上限。哪怕你不差钱,一个每日$5的上限也能在Agent进入循环推理时保护你的钱包。

本地模型:完全免费方案

通过Ollama或LM Studio运行本地模型,可以实现零API成本:

方案推荐模型硬件要求适合场景
OllamaQwen3-Coder:32B / Devstral-24B32GB RAM代码任务、Agent工具调用
Ollama(轻量)Llama 3.3 / DeepSeek-R1:14B16GB RAM简单对话、心跳任务
LM StudioMiniMax M2.5 / Devstral-24B32GB RAM需要GUI管理的用户
bash
# Ollama安装和配置
ollama pull qwen3-coder:32b
# OpenClaw自动发现本地模型,只需设置环境变量
# OLLAMA_API_KEY可以是任意值
json
{
  "env": { "OLLAMA_API_KEY": "ollama-local" }
}

注意

使用Ollama时不要用 /v1 OpenAI兼容URL,会导致工具调用异常。让OpenClaw使用原生Ollama API即可自动发现模型。

服务器成本

相比API费用,服务器成本已经不是主要开销:

方案月费说明
阿里云轻量服务器约¥6-9/月新用户优惠,2vCPU+2GB即可运行
腾讯云Lighthouse约¥8-12/月类似方案,社区支持好
Fly.io免费起步有免费额度,适合轻度使用
本地电脑运行¥0利用现有设备,但需要保持开机

成本优化推荐方案

推荐:混合模型策略

  • 主力:Claude Sonnet
  • 日常:DeepSeek-V3
  • 心跳:Gemini Flash(免费额度)或本地Ollama
  • Fallback:Sonnet → Haiku → DeepSeek
  • 月均 $5-20

不推荐:单一贵价模型

  • 所有任务都用Claude Opus
  • 不设预算上限
  • 不配置Fallback
  • cron任务高频运行
  • 月均 $100-1,000+

成本控制核心原则:用对的模型做对的事。简单问答用$0.14/M的DeepSeek-V3,复杂推理用$3.00/M的Claude Sonnet,免费的Gemini Flash或Ollama跑心跳和定时任务。三级Fallback链 + 日预算上限,两招就能把月成本从三位数压到两位数甚至个位数。

基于 MIT 许可发布 | OpenClaw 入门到精通 | 内容自动更新