Skip to content

KongFangXun/sofagent

sofagent

中文 | English

License Version Last Updated 定位 OpenClaw 兼容 GitHub stars

sofagent

sofa + agent = 沙发特工——希望有一天,我们能躺在沙发上,Agent 就把活干完了。 v0.86 · 2026-06-23

📄 License:MIT。代码、文档、模板——随便用,保留版权声明就行。

我叫孔放勋,一个完全不懂代码的产品经理。所有设计决策来自大半年的真实使用经验,文档由 DeepSeek V4 ProGLM-5.2 配合生成。欢迎大佬进来改。


这是什么

当你的 Agent 改代码不看上下文、做完了不验证、同一个坑反复踩——sofagent 能约束其工作习惯、从错误中沉淀教训。

给 Agent 配了个「纪律委员」:不是让它更聪明,是让它守规矩。

⚠️ 平台生效范围:OpenClaw 上完整生效(编排 + Hook + 断路器);WorkBuddy / Codex / Claude Code / Hermes Agent 上仅宪法层约束生效(先读后写/验证再干/谨慎修改),治理加固(编排引擎/Hook/断路器)全部降级或失效——非 OpenClaw 平台价值约完整版的 30%。其他平台建议用 --lite 安装。详见 平台能力表

v0.85 定位校准:v0.84 的 5 组 A/B 数据告诉我们,sofagent 的真正价值不在安全约束(模型和平台已覆盖 90%),而在纪律——先读后写、验证再干、谨慎修改。独立测试者报告纪律性 +2、首次通过率 +40%。但这份数据有方法论局限(知识传递效应未排除),我们在 v0.85 设计了严格实验来证实或证伪(详见 v0.85 开发日志)。

从「治理层」改为「纪律层」,不是因为治理层错了——治理层是长期目标。是因为当前被验证的差异化在纪律层,我们不想用一个大词掩盖一个还没证实的小结果。如果你是老用户,加载链、宪法、反思区全部不变——变的是我们怎么定位自己。

效果证据状态(v0.85)

⚠️ 这是一个正在收集证据的早期项目,不是生产就绪的工具。

维度 数据 状态
约束层增量 1/10(WorkBuddy 对话),0/16(CLI 一击) 天花板低,被模型安全训练+用户配置文件覆盖
纪律层增量 独立测试者报告 +2/10,首次通过率 +40% promising 但未排除方法论局限,待反转验证
非 OpenClaw 平台 全功能价值约 30%,4 项治理加固全部降级或失效 架构宿命,非 bug
持续使用数据 0 个 ≥1 周样本 待社区补充
角色 怎么干
Skill(判断) MD 文件当规则书,Agent 加载后照做——三层加载链、复杂度预判、反思沉淀
脚本(执行) bash 脚本处理机械活——读写文件、调 API,Agent 调 shell 跑(非 bash 平台降级为 Read/Edit 工具)
平台兜底 加载链 + 断路器 + 死循环检测——OpenClaw 系由 Hook 和配置层兜底,其他平台依赖自身安全机制

⚠️ sofagent 是软约束层——靠 Agent 读取并自觉遵守,不是硬编码强制执行。执行率受上下文长度、模型能力影响。详见 LIMITATIONS.md


三份文档

你是谁 看哪个 一句话
普通用户 HANDBOOK.md(443 行) 怎么装、怎么用、什么是铁律
开发者 DEVELOPMENT.md(599 行) Skill 怎么协同、编排怎么跑、反思怎么闭环
设计爱好者 ARCHITECTURE.md(596 行) 为什么选这些设计、已知局限
技术 VP 推广 docs/team-deploy.md(3 页) 装、试、回顾三阶段落地指南

怎么工作

做什么 怎么做
地基 三层加载链——宪法(4底线+10铁律)→ 反思区(自动错题本)→ 你的规则。整个会话期间永远在线
引擎 任务编排引擎——🔴 复杂任务时点火,智能拆解 + Loop 检查 + 闭环反思
进化 渐进减薄——同类任务根据历史成功率调整编排深度,跑崩了恢复完整编排

💡 核心理念:厚在治理,薄在复用。 约束自己定,模板和 Skills 从社区取。当前被验证的差异化在纪律层(先读后写/验证再干/谨慎修改),不在约束层。 为 AI Agent 提供纪律层与反思循环(效果待社区验证)。 💰 安装成本:约 3,000 token 地基常驻(128K 窗口的 2.5%)。编排引擎仅 🔴 复杂任务时额外 ~800 token。详见 Token 预算

概念分层:哪些是核心,哪些是增强

sofagent 聚合了很多概念——宪法、铁律、加载链、编排引擎、断路器、daemon……新用户容易晕。v0.85 把它们拆成两列(来自 DeepSeek 评审「架构概念过载」洞察):

🔧 纪律层核心(所有平台) 🚀 治理层增强(OpenClaw 专属)
4 底线 + 10 铁律(SKILL.md 宪法) 编排引擎(ao compose,需 npm)
三层加载链(SKILL → think → rules) 加载链 Hook 自动注入(非 OpenClaw 靠 Agent 自觉)
反思区(think.md 自动错题本) 断路器(session 隔离 + circuit breaker)
规则定制(rules.md 你的规则) 步数闸(MAX+GRACE 两段式)
Loop Agent 三节点(全平台通用) 渐进减薄(orchestrator/ 目录)
文件系统审计(task/logs) Skill 信任五级 + 引擎自动抓取安全审查(正则+LLM)

左侧是 sofagent 的差异化所在——纪律层(先读后写/验证再干/谨慎修改),不依赖任何平台,所有平台都生效。

右侧是治理层增强——让约束自动化、让治理更严密,但只在 OpenClaw 上全绿。非 OpenClaw 平台价值约 30%(只有左侧生效)。详见 LIMITATIONS.md 平台依赖

不用 OpenClaw?看左侧就够了。用 OpenClaw?左侧是基础,右侧让基础更牢。

架构总览

graph TB
    subgraph Foundation["🏗️ 地基 Foundation(常驻 ~3,100 token)"]
        L1["L1: SKILL.md<br/>4 底线 + 10 铁律<br/>宪法 Contract"] --> L2["L2: think.md<br/>反思区<br/>错题本"]
        L2 --> L3["L3: rules.md<br/>你的规则<br/>最高优先级"]
    end

    subgraph Engine["🚀 引擎 Engine(🔴点火 ~800 token)"]
        EG["entry-gate<br/>任务准入"] --> TA["task-aware<br/>复杂度预判"]
        TA --> TO["task-closure<br/>任务闭环"]
        TO --> LC["loop-check<br/>Loop 检查"]
    end

    Foundation -->|"🔴 复杂任务触发"| Engine
    Engine -->|"反思沉淀"| L2

    style Foundation fill:#e8f5e9,stroke:#2e7d32,color:#1b5e20
    style Engine fill:#e3f2fd,stroke:#1565c0,color:#0d47a1
Loading

⚠️ 已知局限:核心效果尚无第三方实测数据;复盘是 LLM 自评,无客观基准;Loop Agent 非独立进程;纯文件约束依赖 Agent 配合;数据明文存储(task/logs + think.md 含任务记录,v0.90 不加密,age 加密计划 v1.0+——详见 LIMITATIONS);不是多用户系统(共享 .sofagent/ 会交叉污染经验)。详见 LIMITATIONS.md

平台能力

"兼容"不等于"支持"。核心约束(MD 文件)所有平台可读——这叫兼容。完整治理(编排引擎 + Hook + 断路器 + daemon)只在 OpenClaw 上生效——这叫支持。

平台 核心约束生效 完整治理生效 实际价值
OpenClaw ✅ 宪法+反思+规则(Hook 自动注入) ✅ 编排+Hook+断路器+daemon ~100%
WorkBuddy ✅ 宪法+反思+规则(@skill 加载) ⚠️ 编排可装但需 npm,Hook/断路器降级 ~40%
Codex / Hermes / Claude Code ⚠️ 宪法(种子指令手动贴),反思/规则靠 Agent 自觉 ❌ 全部缺失 ~30%

⚠️ CLI one-shot 场景(非交互式):加载链 0% 生效(Agent 跳过 Read 直接执行),包括 OpenClaw。这是架构宿命,不是 bug。详见 LIMITATIONS.md

⚠️ 治理加固约束级别:步数闸 / 熔断闸 / 幂等检查均为 prompt 级软提醒,非进程级硬拦截——Agent 可能跳过。OpenClaw 上 Hook 可升级为硬拦截。各平台实测数据见 platform-matrix.md

⚠️ 非 OpenClaw 平台预期管理:编排引擎 / Hook / 断路器三项核心能力仅 OpenClaw 全绿。如果你不用 OpenClaw,sofagent 对你的价值约为完整版的 30%(只有宪法层约束生效)。这不是 bug,是架构宿命——v0.8 daemon 会改善加载链,但编排和 Hook 仍是 OpenClaw 专属。详见 LIMITATIONS.md 平台依赖

📎 「种子指令」是什么:写在 Agent 记忆文件(如 CLAUDE.md / AGENTS.md / SOUL.md)里的一句话,告诉 Agent 启动时先读 sofagent 约束文件。这不是自动化——是人手动贴的纸条。 OpenClaw 和 WorkBuddy 通过各自的 skill 机制自动加载,不需要种子指令。

实际效果

效果?我们诚实地说:方向有了,证据还在补。 v0.84 跑了 5 组 A/B(WorkBuddy 对话 + CLI 一击两轮 + 独立测试者代码重构),约束层增量天花板低(被三层压缩),纪律层有 promising 信号但存在方法论局限。v0.85 设计了 45 组对照实验来证实或证伪——详见 开发日志

详见 EVIDENCE.md——社区用户的实际使用数据。


新方向:提交时审计

v0.85 确立的新主线方向——从运行时治理(预防)转向提交时审计(检测)

当前架构依赖 Agent 配合读取 MD 文件——不配合就全失效(CLI 0/16)。审计方向不依赖 Agent 配合,看的是已经发生的 git diff:

# v0.9 MVP 设计(v0.85 只确立方向)
sofagent-audit --diff HEAD~1..HEAD --task "任务描述"

❌ 铁律 #1 先读再用:handler.ts 被修改,但修改前无 Read 记录
✅ 铁律 #3 验证再干:package.json 修改后有 npm test 记录
⚠️ 铁律 #7 谨慎修改:本次 diff 修改了 3 个不在任务范围内的文件

为什么这个方向杀手级:(1) 不依赖 Agent 配合(看 diff,Agent 没法绕过);(2) 跨平台(任何 git 仓库);(3) 确定性输出(exit code,不是 LLM 评分)。详见 v0.85 开发日志

这不意味着放弃运行时治理——两者互补。运行时治理减少问题发生,提交时审计兜底检测漏网之鱼。


不是什么

  • ❌ 不是 AI 框架——不管模型 API、不写 prompt,那是 Model 层的事
  • ❌ 不是 Skills 商店——不维护可复用 Skills(内置 task-aware 等核心治理 Skill 除外),外部 Skills 从社区获取
  • ✅ 是一套跨平台纪律标准——像 .editorconfig 之于编辑器,不是最强大的,但是唯一跨平台的。靠 Skill + 脚本 + 配置三层落地,告诉 Agent 什么能做、什么不能做、什么时候该收手。OpenClaw first,其他平台仅宪法层约束

Quick Start

选你的平台,5 步,10 分钟。

⚡ 快速体验(仅宪法层,30 秒)

只想试试 sofagent 的核心约束?不需要完整安装:

bash sofagent/scripts/install.sh --lite

装完你会得到:宪法(4 底线 + 10 铁律)+ 反思区模板(think.md)+ 规则模板(rules.md)。编排引擎、daemon、脚本工具都不装——降 80% 复杂度,保 60% 价值。非 OpenClaw 平台推荐先用 Lite。

🚀 完整安装(两步)

git clone https://github.com/KongFangXun/sofagent.git
cd sofagent && bash sofagent/scripts/install.sh

自动探测平台。也可以用一行命令(curl -fsSL ... | bash),但企业环境推荐 git clone——代码可审计。

如果你已安装 ClawHub CLI 或 SkillHub CLI,一行命令即可:

# ClawHub
clawhub skill install KongFangXun/sofagent

# SkillHub
skillhub install sofagent

💡 没有 ClawHub CLI?继续往下走 git clone 安装流程,一样简单。

1. 前置依赖

依赖 版本要求 为什么需要 检查命令
bash ≥4 install.sh / task-record.sh bash --version
git 任意 clone 仓库、task/logs 追溯、worktree 隔离 git --version
node ≥18 ao compose 编排引擎(agency-orchestrator) node --version
npm ≥9 全局安装 agency-orchestrator npm --version

⚠️ WorkBuddy 用户若不跑编排引擎(只用宪法层约束),node/npm 可不带——v0.85 起 --no-ao 升为非 OpenClaw 平台的推荐默认路径。OpenClaw 跑复杂任务(🔴)需 node + npm。

⚠️ 编排引擎是可选增强,不是核心依赖。核心约束层(宪法 + 反思 + 规则)零外部依赖。编排引擎依赖第三方 npm 包 agency-orchestrator——v0.84 A/B 数据表明编排不是当前差异化所在,v0.85 将其从"核心功能"降级为"OpenClaw 增强项"。详见 v0.85 开发日志

2. 安装

bash sofagent/scripts/install.sh --platform 你的平台
平台 命令 说明
OpenClaw bash sofagent/scripts/install.sh 自动探测,完整部署(宪法 + Hook + 断路器)
WorkBuddy bash sofagent/scripts/install.sh --platform workbuddy 或通过技能市场安装 部署 SKILL.md 到 ~/.workbuddy/skills/sofagent/
Claude Code bash sofagent/scripts/install.sh --platform claude 部署宪法 + 输出种子指令(需手动粘贴到 CLAUDE.md)
Codex bash sofagent/scripts/install.sh --platform codex 部署宪法 + 输出种子指令(需手动粘贴到 AGENTS.md)
Hermes Agent bash sofagent/scripts/install.sh --platform hermes 部署宪法 + 输出种子指令(需手动粘贴到 SOUL.md)

未指定 --platform 时自动探测。install.sh 会根据平台写入对应目录(OpenClaw→~/.openclaw/skills/,WorkBuddy→~/.workbuddy/skills/,其他平台输出种子指令)。

3. 30 秒 smoke test

bash sofagent/scripts/verify.sh

预期:9 类 24+ 检查项全 pass。加 --json 可集成到 CI/CD。如果 fail,看 Handbook §六 排查。

4. 跑第一个任务

打开你的 Agent 客户端,试一个需要多步拆解的任务(这样才能看出 sofagent 的编排能力):

/goal 是 Claude Code 的自主执行命令;OpenClaw 用户可直接描述复杂任务,Agent 会自动触发编排引擎。详见 Handbook §四

/goal 帮我分析一下这个项目的代码质量,生成一份改进建议报告

Agent 会自动拆解任务 → 匹配 Skill → 执行 → 反思沉淀。在 OpenClaw 上全程自动;在其他平台部分能力需手动触发(详见 LIMITATIONS.md 平台依赖 能力表)。

跑完看结果:

ls .sofagent/task/logs/        # 按「年-月」分目录的执行日志
cat .sofagent/think.md         # Agent 自动提炼的反思摘要

OpenClaw 上全自动,其他平台需手动触发闭环。


跑通了? HANDBOOK.md 教你怎么调,DEVELOPMENT.md 讲内部怎么跑,ARCHITECTURE.md 说为什么这么设计。想看这个项目怎么开发的?开发日志 是作者的 dogfooding 实录。


项目结构

sofagent/                  ← 核心部署文件(SKILL.md 主入口 + 5 子 Skill + 脚本 + hook)
├── README / HANDBOOK / DEVELOPMENT / ARCHITECTURE / ROADMAP.md  ← 文档
├── docs/                  ← EVIDENCE / TESTING / changelog / cases

安装后自动生成 .sofagent/(think.md 反思 + task/logs 审计 + orchestrator/ 配置),每次任务自动记录,跨任务反思沉淀。


用了哪些外部项目

依赖 干什么
OpenClaw Agent 运行时——加载链、Hook、Session 管理
agency-orchestrator(Apache-2.0) 任务编排引擎——ao compose 一行拆任务、匹配角色
agency-agents-zh 215 个中文岗位模板
ClawHub / 各平台技能市场 外部 Skills 的发现来源——不内置,按需从社区获取

贡献

欢迎提 Issue 和 PR,尤其是挑刺的那种。详见 CONTRIBUTING.md

🧑‍💻 我们在寻找 Co-maintainer——特别是熟悉 bash BSD/macOS 兼容性、OpenClaw hook(TS)、安全审计或英文文档的人。从第一个 PR 开始,贡献自然累积,作者主动邀请。详见 CONTRIBUTING.md § Seeking Co-maintainers


致谢

About

给你的 Agent 配个「纪律委员」—— 约束工作习惯(先读后写/验证再干/谨慎修改),从错误中沉淀教训;核心层纯 bash 零依赖,编排引擎可选;OpenClaw first,兼容 4 平台。

Topics

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Packages

 
 
 

Contributors