Skills Producer/Reviewer QA 計劃

Created: 2026-04-07

原則

凡係「生產」出嚟嘅嘢 → 一律要 QA
Producer 同 Reviewer 必須係兩個獨立 Agent（唔同 context）
Research 類唔需要（內部參考，Steven 自己會睇）

判斷維度

對外 vs 對內（邊個睇到 output）
自動化程度（幾多人工介入）
出錯成本（錯咗幾大鑊）
可逆性（錯咗可唔可以 undo）

需要加 Producer/Reviewer 嘅 Skills（7 個）

文案類

Skill	原因
landing-page-copy	銷售文案，影響轉化率
ads-copy-meta	花真錢推，錯咗燒錢
webinar-script	公開演講，不可逆

設計類

Skill	原因
landing-page-design	網頁設計，公眾見到（已有 UI QA hook 但加 Reviewer 更全面）
nano-banana	AI 圖片，用喺廣告/社媒
presentation-builder	提案 deck，客戶會睇

Technical

Skill	原因
salesbot-client-setup	客戶 bot setup，4/4 維度全中

唔需要嘅 Skills

yt-summary / yt-research / reddit / ig / x / fb / xiaohongshu — 內部研究
ads-spy-* — 爬資料
research — 綜合研究

實現方式

每個 skill 加 agents/ 目錄：

skill-name/
├── agents/
│   ├── producer.md    ← 生產指令
│   └── reviewer.md    ← 獨立 QA checklist

Reviewer 用 eval-criteria.md 做 binary check，喺獨立 Agent context 跑。

優先順序

salesbot-client-setup（最高，直接影響付費客戶）
ads-copy-meta + landing-page-copy（花錢/轉化）
webinar-script
landing-page-design + nano-banana + presentation-builder

QA Loop 設計（2026-04-07 confirmed）

Producer（主 Agent）做完
  → Spawn Reviewer（background, timeout 5min）
  → Reviewer 用 eval-criteria.md 逐條 check
  → PASS → Done ✅
  → FAIL → append Learnings.md + 返回 report
  → 主 Agent 改 → retry（max 3-5 次）
  → 超過 limit → 停 + TG 通知 Steven

Reviewer 權限（Policy Islands）

Read、Glob、Grep → auto-approve（read-only）
Bash → 只限 Playwright 截圖 script
Write → 只限 Learnings.md
唔需要 —dangerously-skip-permissions

Learnings.md 自動寫入

由 Reviewer agent 做（唔係 hook，因為冇 task-failure event type）
Reviewer prompt 寫死：FAIL 時 append Learnings.md
格式：日期 + 邊條 fail + 點解 + 修復方法
每週 cron job review → 固化入 SKILL.md

Retry Limits

簡單任務：max 3 次
複雜任務：max 5 次
每次 timeout：5 分鐘
超過 → 停止 + Telegram 通知

唔會阻住你

Reviewer 係 background agent
主 Agent 繼續回覆你
做完先 report

蒸餾機制（Distillation）

Learnings.md = 工作枱（案例，會越嚟越多）
SKILL.md = SOP 手冊（蒸餾後嘅 rule，精煉）
claude-mem = 書櫃（完整歷史記錄，語義搜尋）

蒸餾流程

錯誤發生 → Reviewer 寫入 Learnings.md
同時 claude-mem 自動記錄（hook 已有）
每週 cron review → 重複 pattern（出現 2-3 次）→ 蒸餾入 SKILL.md
蒸餾完 → 清走 Learnings.md 已蒸餾 entries
日後需要翻案例 → claude-mem search

蒸餾判斷標準

同一類錯誤 2-3 次 → 蒸餾成 rule
只出現 1 次 → 留喺 Learnings.md
已過時（code 改咗）→ 刪除

蒸餾前 vs 蒸餾後例子

Before（3 條 learning）：
  - FAQ Q3 fail: 「你哋幾點開門」6 個字搵唔到
  - FAQ Q11 fail: 「邊度上堂」4 個字搵唔到
  - FAQ Q7 fail: 「幾錢」2 個字搵唔到

After（1 條 rule in SKILL.md）：
  FAQ 問題少於 8 個字 → 自動加 context 再搜

唔需要另開 archive

claude-mem 本身就係案例書櫃，語義搜尋搵得返完整 context。

狀態

架構設計完成
等實際 production 需求時逐個加
優先：salesbot-client-setup → ads-copy-meta → landing-page-copy

Steven's Knowledge Base

Explorer

Skills Producer-Reviewer QA 計劃

Skills Producer/Reviewer QA 計劃

原則

判斷維度

需要加 Producer/Reviewer 嘅 Skills（7 個）

文案類

設計類

Technical

唔需要嘅 Skills

實現方式

優先順序

QA Loop 設計（2026-04-07 confirmed）

Reviewer 權限（Policy Islands）

Learnings.md 自動寫入

Retry Limits

唔會阻住你

蒸餾機制（Distillation）

蒸餾流程

蒸餾判斷標準

蒸餾前 vs 蒸餾後例子

唔需要另開 archive

狀態

Graph View

Table of Contents