Browser Automation 技術比較
三種技術對比
| Playwright (scripted) | Browser Use 舊方法 | Browser Use 新 CDP |
|---|
| 速度 | 最快(直接 DOM,無 AI) | 最慢(截圖 + Vision AI) | 中(仍需 AI 決策) |
| 準確度 | 最高(~100%,deterministic) | 中(AI 估座標) | 70-85%(AI 判斷) |
| 成本 | 最平(近乎零) | 貴 | 貴(每步 call LLM) |
| 靈活性 | 低(要寫死步驟) | 高 | 高 |
工作原理
Playwright
- 直接用 CSS selector / text / role 搵 DOM element
- 唔需要截圖搵 button,截圖只係用嚟做 QA 確認
- 底層係 CDP,但加咗抽象層
Browser Use 舊方法
- Playwright + AI Vision
- 截圖 → Vision AI 分析圖片 → 估座標 → click
- 慢係因為截圖大 + Vision model 分析慢
Browser Use 新方法(直接 CDP)
- 繞過 Playwright 抽象層,直接問 Chrome 內部
- 返回輕量 JSON element 資料(唔係大圖片)
- AI 讀 JSON 決定點 click,比讀圖片快好多
- BU 1.0 平均 68 秒/任務 vs OpenAI CUA 330 秒
- Chrome 自己嘅內部 API
- F12 開發者工具背後都係用 CDP
- 可以直接查詢頁面所有 element 資料、執行 JS、控制網絡等
選擇原則
- 固定、重複嘅任務(截圖 QA、自動化測試)→ Playwright,完勝
- 唔知幾多步、要 AI 判斷(複雜網頁任務)→ Browser Use
- 最佳實踐(2026):固定步驟用 Playwright(80%)+ 需要 AI 判斷用 Browser Use(20%)
速度參考數據
- Playwright per-action:~290ms
- Browser Use 1.0 完成一個任務:平均 68 秒
- OpenAI Computer Use 同類任務:330 秒(慢 5 倍)