
从0到AI,每天为你拆解 AI 工具的实战用法和部署技巧。全文约 3200 字,建议收藏慢读。
“主力模型限流了,怎么办?” “每次切换模型都要改配置文件,太麻烦了。” “用了一个月,根本不知道花了多少钱。”
如果你用过 AI 工具,这几个问题你大概都遇到过。
今天聊一个我觉得 OpenClaw 做得很好但很少有人讲清楚的功能——多模型配置体系。
AI 助手为什么会”突然不好用”?
我用 AI 助手最怕的不是它回答得不好,而是它突然消失。
限流(429 Too Many Requests)、账号余额不足、API 服务抖动……这些情况你碰到过吗?在最需要的时候,AI 消失了,整个工作流就断了。
OpenClaw 的解法很朴实:主力模型 + 备用模型,一个失败了自动换下一个,用户完全无感。
理解 OpenClaw 的模型选择顺序
OpenClaw 选模型的逻辑很清晰,分三层:
第一层:主力模型(Primary) 你日常用的主要模型,比如 anthropic/claude-opus-4-6。
第二层:备用模型(Fallbacks) 主力失败了才用,可以配多个,按顺序尝试。
第三层:Auth 轮换(Profile Rotation) 同一个 Provider,有多个 API Key 的话,内部自动轮换,不算模型切换。
三层下来,一个请求才算真正失败。日常使用,99% 的情况你感知不到任何切换。
基础配置:设定主力模型
最简单的配置,在 openclaw.json 里写:
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(line{agents: {defaults: {model: {primary: "anthropic/claude-opus-4-6"}}}}
或者用命令行直接设置:
ounter(lineopenclaw models set anthropic/claude-opus-4-6
查看当前配置:
ounter(lineopenclaw models status
这会显示:主力模型是什么、备用列表、各 Provider 的 Auth 状态、有没有即将过期的 OAuth Token。
加上备用模型:不再害怕限流
主力模型加备用,配置是这样的:
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(line{agents: {defaults: {model: {primary: "anthropic/claude-opus-4-6",fallbacks: ["openai/gpt-5.4","google/gemini-3.1-pro-preview"]}}}}
命令行操作也很简单:
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(line# 添加备用openclaw models fallbacks add openai/gpt-5.4openclaw models fallbacks add google/gemini-3.1-pro-preview# 查看备用列表openclaw models fallbacks list# 删除某个备用openclaw models fallbacks remove openai/gpt-5.4
触发时机: 主力模型的所有 API Key 都限流了,或者账户余额不足,才会走到备用。普通对话不会触发——OpenClaw 不会随便乱切换。
用免费模型做兜底:零成本备份
这是我个人比较喜欢的一个用法。
OpenClaw 支持 OpenRouter,里面有不少完全免费的开源模型。虽然能力比不上 Claude 或 GPT-5,但做紧急兜底完全够用。
用法:
ounter(lineounter(lineounter(lineounter(lineounter(line# 先扫描 OpenRouter 免费模型openclaw models scan --no-probe# 或者带探针,测试工具调用能力(需要 OpenRouter API Key)openclaw models scan --min-params 7 --max-candidates 3
扫描结果会按能力排序(图片支持、工具调用延迟、上下文长度、参数量),你可以交互式选择要加入备用列表的模型。
然后把选中的免费模型加到备用列表最后:
ounter(lineopenclaw models fallbacks add openrouter/meta-llama/llama-3.3-70b-instruct:free
这样,付费模型挂了的时候,免费模型顶上来,不至于完全断线。
实时切换模型:不重启,不改配置
这是我最喜欢的一个功能。
在聊天里直接发 /model,会弹出一个模型列表。你可以:
/model——打开模型选择器(Discord 上有交互式下拉菜单)/model list——显示编号列表/model 3——直接选第 3 个/model openai/gpt-5.4——直接指定/model status——查看详细状态和 Auth 候选
切换后,这个会话就用新模型了。不影响其他会话,也不用重启 Gateway。
适用场景:
当前模型回答质量不好,想试试另一个 写代码用 Claude,生成图片描述换个便宜模型 临时测试某个新模型的效果
多账号 Key 轮换:不用手动管
如果你有多个 API Key(比如公司账号 + 个人账号),OpenClaw 支持自动轮换。
在环境变量里配置多个:
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(line# 方法一:逗号分隔ANTHROPIC_API_KEYS="sk-key1,sk-key2,sk-key3"# 方法二:编号变量ANTHROPIC_API_KEY_1="sk-key1"ANTHROPIC_API_KEY_2="sk-key2"
轮换规则:
正常情况: 每个 Session 固定用一个 Key,不乱转(对 Provider 的缓存友好) 限流时: 自动切到下一个 Key,有冷却时间(1分钟 → 5分钟 → 25分钟 → 1小时) 欠费时: 标记为 disabled,等 5-24 小时后重试
这个设计挺贴心的:不是傻乎乎地每次请求都轮换,而是等真的出问题了再动。
费用追踪:终于知道花了多少钱
用 AI 工具最怕的就是账单爆炸却毫不知情。OpenClaw 有几个方式查费用:
方式一:实时状态
在聊天里发 /status,会显示这个 Session 用了多少 Token、估算费用,以及当前 Provider 的余量(如果 Provider 支持的话)。
方式二:每次回复显示用量
ounter(lineounter(line/usage on # 显示 token 数量/usage off # 关闭
开启后,每条回复下面会附上本次的 Token 消耗。
方式三:本地费用汇总
ounter(line/usage cost # 查看当前 Session 的累计费用
方式四:CLI 全局查询
ounter(lineopenclaw status --usage
这会显示所有 Provider 的用量快照,包括 API 配额剩余(支持的 Provider:Anthropic、OpenAI Codex、GitHub Copilot、Gemini CLI 等)。
给不同 Agent 配不同模型
如果你用了多 Agent 体系(比如内容 Agent、代码 Agent、数据 Agent),可以给每个 Agent 单独配模型。
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(line{agents: {defaults: {model: { primary: "anthropic/claude-sonnet-4-6" } // 默认},list: [{id: "content",model: { primary: "anthropic/claude-opus-4-6" } // 内容用最强的},{id: "monitor",model: { primary: "google/gemini-3.1-flash-lite-preview" } // 监控任务用便宜快的}]}}
逻辑很直接:贵的模型给重要的 Agent,便宜的模型给高频低价值任务(比如定时检查、日志监控)。
实用配置参考
场景 A:个人用户,预算有限
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(line{agents: {defaults: {model: {primary: "google/gemini-3.1-flash-lite-preview", // 便宜快fallbacks: ["openrouter/meta-llama/llama-3.3-70b-instruct:free" // 免费兜底]}}}}
场景 B:正式使用,稳定性优先
ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(line{agents: {defaults: {model: {primary: "anthropic/claude-opus-4-6",fallbacks: ["openai/gpt-5.4","google/gemini-3.1-pro-preview"]}}}}
场景 C:多 Agent,分级配置
核心 Agent(内容、决策)→ Claude Opus 执行 Agent(监控、定时任务)→ Gemini Flash Lite 备用兜底 → OpenRouter 免费模型
写在最后
多模型这个功能,用之前感觉没必要,用过之后就离不开。
不是每个人都需要把三四个 Provider 都配上,但至少加一个备用模型这件事,值得每个用 AI 做自动化的人认真对待。
凌晨两点 AI 突然限流,你的任务还在跑——这时候有备用和没备用,体验是完全不同的。
几个实用建议:
主力选当前最好的模型,不用省这点钱 备用至少一个,哪怕只是便宜模型或免费模型 开 /usage养成习惯,知道自己每天花多少多 Agent 分级配置,贵的用在刀刃上 有多个 API Key 的,用环境变量做轮换,不要只靠一个
模型会越来越便宜,但配置合理的系统永远更省心。