sofagent

sofa + agent = 沙发特工——希望有一天，我们能躺在沙发上，Agent 就把活干完了。 v0.86 · 2026-06-23

📄 License：MIT。代码、文档、模板——随便用，保留版权声明就行。

我叫孔放勋，一个完全不懂代码的产品经理。所有设计决策来自大半年的真实使用经验，文档由 DeepSeek V4 Pro 和 GLM-5.2 配合生成。欢迎大佬进来改。

这是什么

当你的 Agent 改代码不看上下文、做完了不验证、同一个坑反复踩——sofagent 能约束其工作习惯、从错误中沉淀教训。

给 Agent 配了个「纪律委员」：不是让它更聪明，是让它守规矩。

⚠️ 平台生效范围：OpenClaw 上完整生效（编排 + Hook + 断路器）；WorkBuddy / Codex / Claude Code / Hermes Agent 上仅宪法层约束生效（先读后写/验证再干/谨慎修改），治理加固（编排引擎/Hook/断路器）全部降级或失效——非 OpenClaw 平台价值约完整版的 30%。其他平台建议用 --lite 安装。详见平台能力表。

v0.85 定位校准：v0.84 的 5 组 A/B 数据告诉我们，sofagent 的真正价值不在安全约束（模型和平台已覆盖 90%），而在纪律——先读后写、验证再干、谨慎修改。独立测试者报告纪律性 +2、首次通过率 +40%。但这份数据有方法论局限（知识传递效应未排除），我们在 v0.85 设计了严格实验来证实或证伪（详见 v0.85 开发日志）。

从「治理层」改为「纪律层」，不是因为治理层错了——治理层是长期目标。是因为当前被验证的差异化在纪律层，我们不想用一个大词掩盖一个还没证实的小结果。如果你是老用户，加载链、宪法、反思区全部不变——变的是我们怎么定位自己。

效果证据状态（v0.85）

⚠️ 这是一个正在收集证据的早期项目，不是生产就绪的工具。

维度	数据	状态
约束层增量	1/10（WorkBuddy 对话），0/16（CLI 一击）	天花板低，被模型安全训练+用户配置文件覆盖
纪律层增量	独立测试者报告 +2/10，首次通过率 +40%	promising 但未排除方法论局限，待反转验证
非 OpenClaw 平台	全功能价值约 30%，4 项治理加固全部降级或失效	架构宿命，非 bug
持续使用数据	0 个 ≥1 周样本	待社区补充

角色	怎么干
Skill（判断）	MD 文件当规则书，Agent 加载后照做——三层加载链、复杂度预判、反思沉淀
脚本（执行）	bash 脚本处理机械活——读写文件、调 API，Agent 调 shell 跑（非 bash 平台降级为 Read/Edit 工具）
平台兜底	加载链 + 断路器 + 死循环检测——OpenClaw 系由 Hook 和配置层兜底，其他平台依赖自身安全机制

⚠️ sofagent 是软约束层——靠 Agent 读取并自觉遵守，不是硬编码强制执行。执行率受上下文长度、模型能力影响。详见 LIMITATIONS.md。

三份文档

你是谁	看哪个	一句话
普通用户	HANDBOOK.md（443 行）	怎么装、怎么用、什么是铁律
开发者	DEVELOPMENT.md（599 行）	Skill 怎么协同、编排怎么跑、反思怎么闭环
设计爱好者	ARCHITECTURE.md（596 行）	为什么选这些设计、已知局限
技术 VP 推广	docs/team-deploy.md（3 页）	装、试、回顾三阶段落地指南

怎么工作

做什么	怎么做
地基	三层加载链——宪法（4底线+10铁律）→ 反思区（自动错题本）→ 你的规则。整个会话期间永远在线
引擎	任务编排引擎——🔴 复杂任务时点火，智能拆解 + Loop 检查 + 闭环反思
进化	渐进减薄——同类任务根据历史成功率调整编排深度，跑崩了恢复完整编排

💡 核心理念：厚在治理，薄在复用。 约束自己定，模板和 Skills 从社区取。当前被验证的差异化在纪律层（先读后写/验证再干/谨慎修改），不在约束层。 为 AI Agent 提供纪律层与反思循环（效果待社区验证）。 💰 安装成本：约 3,000 token 地基常驻（128K 窗口的 2.5%）。编排引擎仅 🔴 复杂任务时额外 ~800 token。详见 Token 预算。

概念分层：哪些是核心，哪些是增强

sofagent 聚合了很多概念——宪法、铁律、加载链、编排引擎、断路器、daemon……新用户容易晕。v0.85 把它们拆成两列（来自 DeepSeek 评审「架构概念过载」洞察）：

🔧 纪律层核心（所有平台）	🚀 治理层增强（OpenClaw 专属）
4 底线 + 10 铁律（SKILL.md 宪法）	编排引擎（ao compose，需 npm）
三层加载链（SKILL → think → rules）	加载链 Hook 自动注入（非 OpenClaw 靠 Agent 自觉）
反思区（think.md 自动错题本）	断路器（session 隔离 + circuit breaker）
规则定制（rules.md 你的规则）	步数闸（MAX+GRACE 两段式）
Loop Agent 三节点（全平台通用）	渐进减薄（orchestrator/ 目录）
文件系统审计（task/logs）	Skill 信任五级 + 引擎自动抓取安全审查（正则+LLM）

左侧是 sofagent 的差异化所在——纪律层（先读后写/验证再干/谨慎修改），不依赖任何平台，所有平台都生效。

右侧是治理层增强——让约束自动化、让治理更严密，但只在 OpenClaw 上全绿。非 OpenClaw 平台价值约 30%（只有左侧生效）。详见 LIMITATIONS.md 平台依赖。

不用 OpenClaw？看左侧就够了。用 OpenClaw？左侧是基础，右侧让基础更牢。

架构总览

graph TB
    subgraph Foundation["🏗️ 地基 Foundation（常驻 ~3,100 token）"]
        L1["L1: SKILL.md<br/>4 底线 + 10 铁律<br/>宪法 Contract"] --> L2["L2: think.md<br/>反思区<br/>错题本"]
        L2 --> L3["L3: rules.md<br/>你的规则<br/>最高优先级"]
    end

    subgraph Engine["🚀 引擎 Engine（🔴点火 ~800 token）"]
        EG["entry-gate<br/>任务准入"] --> TA["task-aware<br/>复杂度预判"]
        TA --> TO["task-closure<br/>任务闭环"]
        TO --> LC["loop-check<br/>Loop 检查"]
    end

    Foundation -->|"🔴 复杂任务触发"| Engine
    Engine -->|"反思沉淀"| L2

    style Foundation fill:#e8f5e9,stroke:#2e7d32,color:#1b5e20
    style Engine fill:#e3f2fd,stroke:#1565c0,color:#0d47a1

⚠️ 已知局限：核心效果尚无第三方实测数据；复盘是 LLM 自评，无客观基准；Loop Agent 非独立进程；纯文件约束依赖 Agent 配合；数据明文存储（task/logs + think.md 含任务记录，v0.90 不加密，age 加密计划 v1.0+——详见 LIMITATIONS）；不是多用户系统（共享 .sofagent/ 会交叉污染经验）。详见 LIMITATIONS.md。

平台能力

"兼容"不等于"支持"。核心约束（MD 文件）所有平台可读——这叫兼容。完整治理（编排引擎 + Hook + 断路器 + daemon）只在 OpenClaw 上生效——这叫支持。

平台	核心约束生效	完整治理生效	实际价值
OpenClaw	✅ 宪法+反思+规则（Hook 自动注入）	✅ 编排+Hook+断路器+daemon	~100%
WorkBuddy	✅ 宪法+反思+规则（@skill 加载）	⚠️ 编排可装但需 npm，Hook/断路器降级	~40%
Codex / Hermes / Claude Code	⚠️ 宪法（种子指令手动贴），反思/规则靠 Agent 自觉	❌ 全部缺失	~30%

⚠️ CLI one-shot 场景（非交互式）：加载链 0% 生效（Agent 跳过 Read 直接执行），包括 OpenClaw。这是架构宿命，不是 bug。详见 LIMITATIONS.md。

⚠️ 治理加固约束级别：步数闸 / 熔断闸 / 幂等检查均为 prompt 级软提醒，非进程级硬拦截——Agent 可能跳过。OpenClaw 上 Hook 可升级为硬拦截。各平台实测数据见 platform-matrix.md。

⚠️ 非 OpenClaw 平台预期管理：编排引擎 / Hook / 断路器三项核心能力仅 OpenClaw 全绿。如果你不用 OpenClaw，sofagent 对你的价值约为完整版的 30%（只有宪法层约束生效）。这不是 bug，是架构宿命——v0.8 daemon 会改善加载链，但编排和 Hook 仍是 OpenClaw 专属。详见 LIMITATIONS.md 平台依赖。

📎 「种子指令」是什么：写在 Agent 记忆文件（如 CLAUDE.md / AGENTS.md / SOUL.md）里的一句话，告诉 Agent 启动时先读 sofagent 约束文件。这不是自动化——是人手动贴的纸条。 OpenClaw 和 WorkBuddy 通过各自的 skill 机制自动加载，不需要种子指令。

实际效果

效果？我们诚实地说：方向有了，证据还在补。 v0.84 跑了 5 组 A/B（WorkBuddy 对话 + CLI 一击两轮 + 独立测试者代码重构），约束层增量天花板低（被三层压缩），纪律层有 promising 信号但存在方法论局限。v0.85 设计了 45 组对照实验来证实或证伪——详见开发日志。

详见 EVIDENCE.md——社区用户的实际使用数据。

新方向：提交时审计

v0.85 确立的新主线方向——从运行时治理（预防）转向提交时审计（检测）。

当前架构依赖 Agent 配合读取 MD 文件——不配合就全失效（CLI 0/16）。审计方向不依赖 Agent 配合，看的是已经发生的 git diff：

# v0.9 MVP 设计（v0.85 只确立方向）
sofagent-audit --diff HEAD~1..HEAD --task "任务描述"

❌ 铁律 #1 先读再用：handler.ts 被修改，但修改前无 Read 记录
✅ 铁律 #3 验证再干：package.json 修改后有 npm test 记录
⚠️ 铁律 #7 谨慎修改：本次 diff 修改了 3 个不在任务范围内的文件

为什么这个方向杀手级：(1) 不依赖 Agent 配合（看 diff，Agent 没法绕过）；(2) 跨平台（任何 git 仓库）；(3) 确定性输出（exit code，不是 LLM 评分）。详见 v0.85 开发日志。

这不意味着放弃运行时治理——两者互补。运行时治理减少问题发生，提交时审计兜底检测漏网之鱼。

不是什么

❌ 不是 AI 框架——不管模型 API、不写 prompt，那是 Model 层的事
❌ 不是 Skills 商店——不维护可复用 Skills（内置 task-aware 等核心治理 Skill 除外），外部 Skills 从社区获取
✅ 是一套跨平台纪律标准——像 .editorconfig 之于编辑器，不是最强大的，但是唯一跨平台的。靠 Skill + 脚本 + 配置三层落地，告诉 Agent 什么能做、什么不能做、什么时候该收手。OpenClaw first，其他平台仅宪法层约束

Quick Start

选你的平台，5 步，10 分钟。

⚡ 快速体验（仅宪法层，30 秒）

只想试试 sofagent 的核心约束？不需要完整安装：

bash sofagent/scripts/install.sh --lite

装完你会得到：宪法（4 底线 + 10 铁律）+ 反思区模板（think.md）+ 规则模板（rules.md）。编排引擎、daemon、脚本工具都不装——降 80% 复杂度，保 60% 价值。非 OpenClaw 平台推荐先用 Lite。

🚀 完整安装（两步）

git clone https://github.com/KongFangXun/sofagent.git
cd sofagent && bash sofagent/scripts/install.sh

自动探测平台。也可以用一行命令（curl -fsSL ... | bash），但企业环境推荐 git clone——代码可审计。

如果你已安装 ClawHub CLI 或 SkillHub CLI，一行命令即可：

# ClawHub
clawhub skill install KongFangXun/sofagent

# SkillHub
skillhub install sofagent

💡 没有 ClawHub CLI？继续往下走 git clone 安装流程，一样简单。

1. 前置依赖

依赖	版本要求	为什么需要	检查命令
bash	≥4	install.sh / task-record.sh	`bash --version`
git	任意	clone 仓库、task/logs 追溯、worktree 隔离	`git --version`
node	≥18	`ao compose` 编排引擎（agency-orchestrator）	`node --version`
npm	≥9	全局安装 agency-orchestrator	`npm --version`

⚠️ WorkBuddy 用户若不跑编排引擎（只用宪法层约束），node/npm 可不带——v0.85 起 --no-ao 升为非 OpenClaw 平台的推荐默认路径。OpenClaw 跑复杂任务（🔴）需 node + npm。

⚠️ 编排引擎是可选增强，不是核心依赖。核心约束层（宪法 + 反思 + 规则）零外部依赖。编排引擎依赖第三方 npm 包 agency-orchestrator——v0.84 A/B 数据表明编排不是当前差异化所在，v0.85 将其从"核心功能"降级为"OpenClaw 增强项"。详见 v0.85 开发日志。

2. 安装

bash sofagent/scripts/install.sh --platform 你的平台

平台	命令	说明
OpenClaw	`bash sofagent/scripts/install.sh`	自动探测，完整部署（宪法 + Hook + 断路器）
WorkBuddy	`bash sofagent/scripts/install.sh --platform workbuddy` 或通过技能市场安装	部署 SKILL.md 到 `~/.workbuddy/skills/sofagent/`
Claude Code	`bash sofagent/scripts/install.sh --platform claude`	部署宪法 + 输出种子指令（需手动粘贴到 CLAUDE.md）
Codex	`bash sofagent/scripts/install.sh --platform codex`	部署宪法 + 输出种子指令（需手动粘贴到 AGENTS.md）
Hermes Agent	`bash sofagent/scripts/install.sh --platform hermes`	部署宪法 + 输出种子指令（需手动粘贴到 SOUL.md）

未指定 --platform 时自动探测。install.sh 会根据平台写入对应目录（OpenClaw→~/.openclaw/skills/，WorkBuddy→~/.workbuddy/skills/，其他平台输出种子指令）。

3. 30 秒 smoke test

bash sofagent/scripts/verify.sh

预期：9 类 24+ 检查项全 pass。加 --json 可集成到 CI/CD。如果 fail，看 Handbook §六排查。

4. 跑第一个任务

打开你的 Agent 客户端，试一个需要多步拆解的任务（这样才能看出 sofagent 的编排能力）：

/goal 是 Claude Code 的自主执行命令；OpenClaw 用户可直接描述复杂任务，Agent 会自动触发编排引擎。详见 Handbook §四。

/goal 帮我分析一下这个项目的代码质量，生成一份改进建议报告

Agent 会自动拆解任务 → 匹配 Skill → 执行 → 反思沉淀。在 OpenClaw 上全程自动；在其他平台部分能力需手动触发（详见 LIMITATIONS.md 平台依赖能力表）。

跑完看结果：

ls .sofagent/task/logs/        # 按「年-月」分目录的执行日志
cat .sofagent/think.md         # Agent 自动提炼的反思摘要

OpenClaw 上全自动，其他平台需手动触发闭环。

跑通了？ HANDBOOK.md 教你怎么调，DEVELOPMENT.md 讲内部怎么跑，ARCHITECTURE.md 说为什么这么设计。想看这个项目怎么开发的？开发日志是作者的 dogfooding 实录。

项目结构

sofagent/                  ← 核心部署文件（SKILL.md 主入口 + 5 子 Skill + 脚本 + hook）
├── README / HANDBOOK / DEVELOPMENT / ARCHITECTURE / ROADMAP.md  ← 文档
├── docs/                  ← EVIDENCE / TESTING / changelog / cases

安装后自动生成 .sofagent/（think.md 反思 + task/logs 审计 + orchestrator/ 配置），每次任务自动记录，跨任务反思沉淀。

用了哪些外部项目

依赖	干什么
OpenClaw	Agent 运行时——加载链、Hook、Session 管理
agency-orchestrator（Apache-2.0）	任务编排引擎——`ao compose` 一行拆任务、匹配角色
agency-agents-zh	215 个中文岗位模板
ClawHub / 各平台技能市场	外部 Skills 的发现来源——不内置，按需从社区获取

贡献

欢迎提 Issue 和 PR，尤其是挑刺的那种。详见 CONTRIBUTING.md。

🧑‍💻 我们在寻找 Co-maintainer——特别是熟悉 bash BSD/macOS 兼容性、OpenClaw hook(TS)、安全审计或英文文档的人。从第一个 PR 开始，贡献自然累积，作者主动邀请。详见 CONTRIBUTING.md § Seeking Co-maintainers。

致谢

OpenClaw by Peter Steinberger — sofagent 的基石
DeepSeek V4 Pro + GLM-5.2 — 所有文件由二者配合生成
Andrej Karpathy Skills — 4 条编码原则是 10 则铁律的根基
agency-orchestrator + agency-agents-zh — 任务编排引擎 + 中文岗位库
Anthropic Skills + Managed Agents — SKILL.md 格式规范 + 四层架构哲学源头
Loop Engineering by Addy Osmani — 循环工程五大件，编排层理论源头
superpowers — Skill 作为 Harness 杠杆的思路
SkillOpt by Microsoft Research — Skill 文档训练方法论，启发 v0.9 Skill 自进化

Name		Name	Last commit message	Last commit date
Latest commit History 90 Commits
.github		.github
docs		docs
images		images
sofagent		sofagent
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
CHANGELOG.md		CHANGELOG.md
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
DEVELOPMENT.md		DEVELOPMENT.md
HANDBOOK.md		HANDBOOK.md
LICENSE		LICENSE
LIMITATIONS.md		LIMITATIONS.md
README.en.md		README.en.md
README.md		README.md
ROADMAP.md		ROADMAP.md
SECURITY.md		SECURITY.md
sofagent-quickstart.md		sofagent-quickstart.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

sofagent

这是什么

效果证据状态（v0.85）

三份文档

怎么工作

概念分层：哪些是核心，哪些是增强

架构总览

平台能力

实际效果

新方向：提交时审计

不是什么

Quick Start

⚡ 快速体验（仅宪法层，30 秒）

🚀 完整安装（两步）

1. 前置依赖

2. 安装

3. 30 秒 smoke test

4. 跑第一个任务

项目结构

用了哪些外部项目

贡献

致谢

About

Uh oh!

Releases 6

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

sofagent

这是什么

效果证据状态（v0.85）

三份文档

怎么工作

概念分层：哪些是核心，哪些是增强

架构总览

平台能力

实际效果

新方向：提交时审计

不是什么

Quick Start

⚡ 快速体验（仅宪法层，30 秒）

🚀 完整安装（两步）

1. 前置依赖

2. 安装

3. 30 秒 smoke test

4. 跑第一个任务

项目结构

用了哪些外部项目

贡献

致谢

About

Topics

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases 6

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages