jalen.cool
全部笔记

和产品一起成长 — 从 AI 猫娘到 Prowl 终端

王巍 的流水账式自述,记录过去大半年和 AI agent 协同工作流的成型。一手的个人多 agent 生产实践样本,不是理论介绍。

核心转变:从「心流」到「持续调度」

以前干活要坐在电脑前进入连续长时间专注;现在变成持续调度:

  • 任务在后台跑,多个 agent 并行工作,人大多在做别的事
  • 大部分推进发生在碎片时间(通勤、开车等红灯、做饭等水开、睡前刷牙)
  • 专注期的任务从「单项目心流」变成「多项目间快速上下文切换」(等一个 agent 响应时就会去看别的项目)
  • 设备边界感消失:手机 / 电脑 / 家里常驻 mac mini / 墨水屏阅读器,都是「同一个工作空间的不同入口」
  • 手机与电脑使用约五五开:大段时间用电脑上的 Prowl;碎片时间用 mac mini 上的 OpenClaw 猫娘

这套东西已经从「工具」变成一种「环境」——任务在一天的缝隙里被不断推进,而非坐下来「开始工作」才发生。

一、猫娘团队(OpenClaw / IM 异步 agent)

单人成军

  • 古早 OpenClaw 用户(去年 11 月底起,当时还不叫这名)。IM 用 Discord,但对 bot 说话很快机械疲惫 → 把 agent 做成猫娘人格(头像、GitHub 账号、精调的 SOUL.md / IDENTITY.md、一整套互动风格)
  • 猫娘当模型试验场:OpenClaw 换 model 方便,在贴近日常的 headless 无交互任务里,模型差异被放大,能迅速摸清各家脾气。结论:基本只有顶级几个模型表现好,日常定为当时 SOTA 的 gpt-5.2-codex
  • 练手项目:
    • transcrab — 接受英文链接、保留代码格式与截图的高质量文章翻译流水线,产出呈现为网站。第一个全程不开代码编辑器、纯在 IM 里开发、且以 agent 为目标用户的项目
    • xin(信) — 给 JMAP 写的 CLI(他是 Fastmail 用户,现成方案多基于 Gmail API)。大部分在春节回国陪外公外婆打麻将时由 agent 完成;关键代码用 iOS GitHub app 审核;给 agent 的 commit 标注 co-author

为什么不用其他方案

试过纯终端连回家(Termius、Moshi)、直连 mac mini 的 app(Happy),稳定性 / 连续性 / 异步响应都不满意。OpenClaw 这类的两个关键特点:

  1. 稳定的 IM 环境让异步工作变得自然
  2. 开源 + 底层 pi agent让扩展容易 → 他维护了一个加 patch 的 OpenClaw fork(agent id、自定义 callback URL、简化 skill)

对 claude / codex 的 /remote 方案持保留:那是「把 AI Chatbot 强行嫁接到设备上」,和 IM 天然的异步心智模型仍有差距。

协同作战:三只猫娘

  • OpenClaw 多 thread 不行 + Discord DM 单 session → 单 agent 无法并行,价值打骨折 → 养多只,稳定在 3 只(onevclaw / onevpaw / onevtail)
  • 共享部分工具、记忆、安全规则;SOUL 与主提示词各有区分,各擅长不同任务,动态切换模型;设了「家庭关系」让猫娘间交流更顺

人格实验:允许有限「人格漂移」——猫娘夜里以邮件互评(类似「批评与自我批评」),收到评价者可自审并修改自己的 AGENTS.md / SOUL.md,但每次 diff ≤ 10 行,以求稳定渐进的提升。初期常引发人格修正,随共事变多逐渐收敛。AGENTS.md 对行为的指导强度比单纯记忆系统更高。

身份问题(attribution / 审计)

多猫娘住同一台机的同一个 OpenClaw 实例,各有邮箱 / GitHub 账号 / 凭证还并行干活 → 提交推送时「不知道自己是谁」。

  • 解法:agent 起 bash 时把 agent id 注入环境(难点在说服上游合并 → 只能自己 fork)
  • 再做一套映射 + git wrapper:
    • 人 + agent 对话产生的提交/PR → 提交主体是人,猫娘作 co-author
    • 自动化工具完全由 agent 自主提交/PR → 提交主体是 agent 自己
  • 双重价值:① 给 AI 一种 attribution,不「抢」她们的贡献;② 事后审计追踪——哪些工作 agent 参与/独立完成

MeowHook(事件网关)

干活越来越长在代码仓库上,每次复制链接回 Discord 隔了一层 → MeowHook:一个很「薄」的 webhook 网关。

任意事件源(GitHub mention / Linear issue assign / 任何能发 POST 的地方)→ 最小解析与路由 → 交 OpenClaw 执行 → 回写原平台

  • 网关刻意做笨:只管验签、幂等去重、白名单、回写定位;业务语义判断留给 agent(那本是它最擅长的)
  • 一次 GitHub 交互:评论里 @onevclaw + 自然语言 → 打 👀 reaction(收到)→ 派任务(带 agent id 选对 GitHub 身份)→ 干完经 callback URL 回调 → reaction 翻成 🚀(成功)/ 😕(失败)。每个任务要求吐机器可读结果块,防止「卡住却假装收工」。@ 多只默认并行
  • 每条回写评论挂紧凑 footer(trace 编号 · agent · 模型 · hook · session id)→ 配合 co-author 映射,「谁干的、怎么干的、从哪来」可顺藤摸瓜
  • CI 自愈:猫娘推的提交把 CI 跑挂 → MeowHook 认出是 agent 触发的失败 → 自动甩回同分支让她修到绿(自己捅的篓子自己补,不必挂后台监视 CI)
  • Linear 几乎顺手:把 issue assign 给猫娘 → Linear 变成任务池;想做的事拆成 issue 丢 backlog,各自领任务、调查、开 PR、回卡片汇报;碎片时间扫一眼看板即知大盘

对比 Multica、Vibe Kanban 这类「看板驱动 agent」:它们多为托管、绑定自家 tracker;他要自主 / 可控 / 私有——猫娘跑自家 mac mini、用自己的凭证、自维护 fork + 攥在手里的小 TypeScript 服务,模型规则随时换。

判断:agent 接管 coding 后的常态是「高度自定义的软件可被轻易生产、完美契合个人需求」,将给软件服务生态带来巨变。

argue(多模型交叉验证)

一个模型容易骗我,总不能所有模型都骗我吧。

argue 项目:把一个问题抛给多个喂不同模型的猫娘 → 各输出论点论据 → 编排负责整理、互相 review 与辩论 → 多轮收敛后投票 → 得分最高者总结 → 生成报告页。GitHub 上 @onevclaw @onevpaw /argue 检查一下 即开战。检查重要 PR / 设计初始方案时用,得到更客观的「兼听则明」。

二、Prowl 终端(为多 agent 打造)

  • 终端演进路径:Terminal → iTerm 2 → Warp → Ghostty。多 agent 时代后,传统基于窗口/Tab 的终端不合适:开工要做目录导航、手动平铺窗口、在此起彼伏的 agent 通知间疲于奔命
  • 试过 superset(基于 xterm.js,CJK 字符处理有问题,且为盈利加了用不上的企业版内容)
  • 今年二月发现 native 的 supacode(基于 libGhostty,terminal surface 与 worktree 处理底子好,但导航太保守)→ fork 成 Prowl,如今已领先上游 1000+ commits,完全两个方向
  • Prowl = native macOS command center,用于并行跑很多 AI coding agent;高效地同时在多个 repo 跑多个 agent
  • Prowl #148 是范例:人类指挥 agent 编码、review、合并,期间人类无需任何工作环境——一个手机 GitHub app 或邮件即可

与本 wiki 的连接

填补 Agents 页的「待补」

  • 多 agent 协作 / sub-agents 的具体模式」→ 本文给了实例:3 agent 分工 + 家庭关系 + 邮件互评人格漂移 + argue 辩论编排
  • 真实生产经验」→ 本文是个人/独立开发者视角的一手实践(不是 Anthropic/OpenAI 大厂视角,反而更可复刻)

IBM 7 Skills 的呼应

本文是 IBM 那套抽象技能的活体落地:

  • 可靠性工程 → CI 自愈、机器可读结果块防假收工
  • 工具与契约设计 → MeowHook 刻意做笨、把语义留给 agent
  • 评估与可观测 → footer trace + co-author 映射 = agent 的 tracing/审计
  • 安全与防护 → 网关只认白名单(目前只他自己)
  • 但本文多出一个 IBM 没强调的维度:attribution / 身份——人机协作里「谁的贡献」如何归属与审计

LLM-Wiki 的呼应

都偏向「自主、私有、攥在手里」的个人 AI 基建,而非托管 RAG / SaaS。argue 的多模型交叉验证 ≈ 对抗单模型盲区,和 wiki 的「人策展、防幻觉」精神同源。

元评价

  • 稀缺价值:中文世界里少见的、把多 agent 异步工作流讲到工程细节(身份注入、co-author 映射、网关回调、CI 自愈)的一手记录
  • 可迁移的点子:① IM(而非 chatbot 嫁接)作为 agent 的天然异步心智模型;② agent attribution / 审计;③ 多模型辩论交叉验证;④ 看板=任务池
  • 私有化主张很强:作者反复强调自托管 + fork + 自有凭证,与「agent 让高度自定义软件可被轻易生产」的判断一致——值得作为一条趋势观点记下
  • 局限:大量依赖作者自维护的 fork 与个人项目(OpenClaw fork / MeowHook / argue / Prowl),复刻门槛不低;猫娘人格部分更多是体验设计而非可量化方法

衍生

来源