Skills Producer/Reviewer QA 計劃
Created: 2026-04-07
原則
- 凡係「生產」出嚟嘅嘢 → 一律要 QA
- Producer 同 Reviewer 必須係兩個獨立 Agent(唔同 context)
- Research 類唔需要(內部參考,Steven 自己會睇)
判斷維度
- 對外 vs 對內(邊個睇到 output)
- 自動化程度(幾多人工介入)
- 出錯成本(錯咗幾大鑊)
- 可逆性(錯咗可唔可以 undo)
需要加 Producer/Reviewer 嘅 Skills(7 個)
文案類
| Skill | 原因 |
|---|---|
| landing-page-copy | 銷售文案,影響轉化率 |
| ads-copy-meta | 花真錢推,錯咗燒錢 |
| webinar-script | 公開演講,不可逆 |
設計類
| Skill | 原因 |
|---|---|
| landing-page-design | 網頁設計,公眾見到(已有 UI QA hook 但加 Reviewer 更全面) |
| nano-banana | AI 圖片,用喺廣告/社媒 |
| presentation-builder | 提案 deck,客戶會睇 |
Technical
| Skill | 原因 |
|---|---|
| salesbot-client-setup | 客戶 bot setup,4/4 維度全中 |
唔需要嘅 Skills
- yt-summary / yt-research / reddit / ig / x / fb / xiaohongshu — 內部研究
- ads-spy-* — 爬資料
- research — 綜合研究
實現方式
每個 skill 加 agents/ 目錄:
skill-name/
├── agents/
│ ├── producer.md ← 生產指令
│ └── reviewer.md ← 獨立 QA checklist
Reviewer 用 eval-criteria.md 做 binary check,喺獨立 Agent context 跑。
優先順序
- salesbot-client-setup(最高,直接影響付費客戶)
- ads-copy-meta + landing-page-copy(花錢/轉化)
- webinar-script
- landing-page-design + nano-banana + presentation-builder
QA Loop 設計(2026-04-07 confirmed)
Producer(主 Agent)做完
→ Spawn Reviewer(background, timeout 5min)
→ Reviewer 用 eval-criteria.md 逐條 check
→ PASS → Done ✅
→ FAIL → append Learnings.md + 返回 report
→ 主 Agent 改 → retry(max 3-5 次)
→ 超過 limit → 停 + TG 通知 Steven
Reviewer 權限(Policy Islands)
- Read、Glob、Grep → auto-approve(read-only)
- Bash → 只限 Playwright 截圖 script
- Write → 只限 Learnings.md
- 唔需要 —dangerously-skip-permissions
Learnings.md 自動寫入
- 由 Reviewer agent 做(唔係 hook,因為冇 task-failure event type)
- Reviewer prompt 寫死:FAIL 時 append Learnings.md
- 格式:日期 + 邊條 fail + 點解 + 修復方法
- 每週 cron job review → 固化入 SKILL.md
Retry Limits
- 簡單任務:max 3 次
- 複雜任務:max 5 次
- 每次 timeout:5 分鐘
- 超過 → 停止 + Telegram 通知
唔會阻住你
- Reviewer 係 background agent
- 主 Agent 繼續回覆你
- 做完先 report
蒸餾機制(Distillation)
Learnings.md = 工作枱(案例,會越嚟越多)
SKILL.md = SOP 手冊(蒸餾後嘅 rule,精煉)
claude-mem = 書櫃(完整歷史記錄,語義搜尋)
蒸餾流程
- 錯誤發生 → Reviewer 寫入 Learnings.md
- 同時 claude-mem 自動記錄(hook 已有)
- 每週 cron review → 重複 pattern(出現 2-3 次)→ 蒸餾入 SKILL.md
- 蒸餾完 → 清走 Learnings.md 已蒸餾 entries
- 日後需要翻案例 → claude-mem search
蒸餾判斷標準
- 同一類錯誤 2-3 次 → 蒸餾成 rule
- 只出現 1 次 → 留喺 Learnings.md
- 已過時(code 改咗)→ 刪除
蒸餾前 vs 蒸餾後例子
Before(3 條 learning):
- FAQ Q3 fail: 「你哋幾點開門」6 個字搵唔到
- FAQ Q11 fail: 「邊度上堂」4 個字搵唔到
- FAQ Q7 fail: 「幾錢」2 個字搵唔到
After(1 條 rule in SKILL.md):
FAQ 問題少於 8 個字 → 自動加 context 再搜
唔需要另開 archive
claude-mem 本身就係案例書櫃,語義搜尋搵得返完整 context。
狀態
- 架構設計完成
- 等實際 production 需求時逐個加
- 優先:salesbot-client-setup → ads-copy-meta → landing-page-copy