OpenClaw 原理与实践 — 两个月 25 万 Star 的 Agent OS 是如何炼成的

2026 年 1 月,一个名为 OpenClaw 的项目在 GitHub 上更名并开源。短短两个月内,它的 Star 数突破 25 万,增速超越 React 和 Linux,国内云厂商争相上门合作。它凭什么?

定位很简单:本地数字管家 / Agent OS——发条消息就能让 AI 替你在本地干活。


一、OpenClaw 是什么

OpenClaw 是一个开源的本地 AI 网关,核心价值主张:

特性 说明
本地运行 运行在个人硬件上,数据不出本地,更多权限、更多能力
多通道 连接 WhatsApp、Telegram、飞书、Slack 等即时通讯工具作为控制终端
Agent 原生 集成编码 Agent(Pi Agent),支持工具调用、会话管理、跨会话持久记忆
开源社区 Peter Steinberger(后加入 OpenAI)主导,社区驱动敏捷迭代

目标用户很精准:想拥有个人 AI 助手、重视数据隐私、不愿放弃控制权的技术爱好者。


二、为什么两个月就爆了

三个维度合力引爆:

维度 分析
时机到位 大模型的推理、工具调用、长上下文能力趋于成熟;个人办公市场(十万亿级)远大于代码助手(千亿级)
产品形态精准 发消息就让 AI 干活,用户延时容忍度高;本地执行保护隐私;浏览器、邮件、日历、笔记全平台打通
环境助推 创始人的社区影响力 + 敏捷迭代节奏 + 媒体与云厂商合力宣传

三、架构:Channel → Gateway → Persistence

三层架构,各司其职:

1
2
3
4
5
6
7
┌──────────────────────────────────────────────┐
│ Channels │ WhatsApp · TG · 飞书 · Slack │
├──────────────────────────────────────────────┤
│ Gateway │ 路由 · Agent运行时 · 工具调用 │
├──────────────────────────────────────────────┤
│ Persistence│ Local-First · JSON/SQLite │
└──────────────────────────────────────────────┘

3.1 通信层(Channels)

可组合、可扩展的能力组件:安全认证 → 消息解析 → 访问控制 → 输出格式化。支持 WebSocket、RPC+JSON、流式输出。

3.2 网关(Gateway)— 最核心的部分

Agent 运行时:Pi Agent 四阶段 ReAct Loop

1
2
3
初始化 ──→ 推理 ──→ 行动 ──→ 反馈 ──→ 循环
Prompt LLM调用 工具执行 结果回传
Builder 产生决策 本地运行 下一轮

Session 管理

消息按 ID 和频道独立隔离,支持跨平台身份映射。内置每日/闲置/多维度自动重置机制,实时修剪 + 压缩刷新内存,关键信息持久化。

工具调用

标准化声明协议,动态渐进式加载。网关统一编排和路由,权限审计保证安全。

3.3 持久化层:多级记忆体系

层级 存储形式 作用
短期记忆 会话转录 JSON 当前对话事实,定期压缩刷新
长期记忆 Markdown 向量检索 (RAG) 语义记忆,跨会话复用
MEMORY.md 动态学习文件 用户偏好、任务进度
SOUL.md Agent 人格文件 性格、价值观、长期目标

四、安全机制

机制 说明
网关权限审计 工具调用权限准入控制
安全 DM 模式 会话隔离,防止跨会话泄露
工具执行沙箱 隔离执行环境
Human-in-the-loop Skill Vetter 审核 + 最小权限原则

⚠️ 使用建议:不要无脑安装 Skills,禁止访问敏感路径,做好模型调用限额——Token 消耗巨大。


五、实战:快速安装

1
2
3
4
5
6
7
8
# 1. 确保安装了 Node.js
# 2. 一键安装
curl -fsSL https://openclaw.ai/install.sh | bash

# 3. Quickstart 模式启动

# 4. 配置模型(如阿里云百炼)
# 5. 配置 Channel(飞书 / WhatsApp / Telegram)

安装完成后,发一条消息给绑定的 IM 账号,AI 就会开始干活。


六、应用场景与商业案例

典型场景

  • 定时任务:天气预报、每日新闻摘要
  • 自动化办公:调研并生成 PPT、文档
  • 金融投研:自动抓取 PDF 研报 → 解析逻辑 → 拉行情 → 生成回测报告
  • Vibe-Coding:个人脚本快速开发
  • 个人知识库:笔记管理、RSS 订阅、网页抓取

真实商业案例

案例 效果
“零人类 CEO”公司 Agent CEO 调度多 Agent,成本 1500 元,营收 20 万
全自动保险律师 Agent 全自动处理保险法律事务
社媒运营 14 天养成 8 个 Agent,自动化涨粉
量化投研 AlphaClaw 项目,Agent 驱动全流程

七、Skill 生态

OpenClaw 的 Skill 市场(clawhub.ai)覆盖从基础设施到生产应用的全链路:

类别 代表性 Skill
基础设施 Skill Vetter(安全审计)、Tavily Search(LLM 搜索)、Mcporter(MCP 管理)、Self-Improving Agent
开发 GitHub Skill、Coding Agent
知识管理 Obsidian、Notion、Google Workspace
信息获取 RSS Reader、Firecrawl(网页抓取)、PDF
浏览器 Agent Browser

八、同类工具对比

维度 OpenClaw NanoClaw Claude Code
定位 全能数字管家 安全轻量助理 专业编程专家
代码量 ~40w 行 ~5k 行 闭源
安全 应用级权限 OS 级隔离 官方沙箱
交互 IM 聊天 IM 聊天 终端 CLI
记忆 强大跨会话 群组/文件级 Session 级
适合 生活/商务全自动 个人安全自动化 深度代码工作

选型建议:全自动化生活 → OpenClaw;安全优先 + 小团队 → NanoClaw;专注代码 → Claude Code。


九、实践心得

买龙虾易,养龙虾难

OpenClaw 功能强大但配置繁琐,类似安装一台个人操作系统。每条 Channel 的配置都可能踩坑,耗时远超预期。

Token 像喝水

长时间运行的 Agent 会话,token 持续膨胀。建议每 5-8 轮重启会话,用 MEMORY.md 保存跨会话状态,训练日志不全量贴入上下文。

安全不能偷懒

遵循最小权限原则,安装 Skill Vetter 审核每个 Skill,不要为了省事跳过安全检查。


十、总结

优势 瑞士军刀级能力、7×24 跨端在线、Skill 生态丰富
劣势 40w 行代码臃肿、配置困难、应用级权限安全风险、架构仍在频繁更新

未来方向:更轻量安全、更低部署门槛、Agent 自主进化、多 Agent 协作——Agentic AI 的时代才刚刚开始。