Browser Automation 技術比較

三種技術對比

Playwright (scripted)Browser Use 舊方法Browser Use 新 CDP
速度最快(直接 DOM,無 AI)最慢(截圖 + Vision AI)中(仍需 AI 決策)
準確度最高(~100%,deterministic)中(AI 估座標)70-85%(AI 判斷)
成本最平(近乎零)貴(每步 call LLM)
靈活性低(要寫死步驟)

工作原理

Playwright

  • 直接用 CSS selector / text / role 搵 DOM element
  • 唔需要截圖搵 button,截圖只係用嚟做 QA 確認
  • 底層係 CDP,但加咗抽象層

Browser Use 舊方法

  • Playwright + AI Vision
  • 截圖 → Vision AI 分析圖片 → 估座標 → click
  • 慢係因為截圖大 + Vision model 分析慢

Browser Use 新方法(直接 CDP)

  • 繞過 Playwright 抽象層,直接問 Chrome 內部
  • 返回輕量 JSON element 資料(唔係大圖片)
  • AI 讀 JSON 決定點 click,比讀圖片快好多
  • BU 1.0 平均 68 秒/任務 vs OpenAI CUA 330 秒

CDP(Chrome DevTools Protocol)係咩

  • Chrome 自己嘅內部 API
  • F12 開發者工具背後都係用 CDP
  • 可以直接查詢頁面所有 element 資料、執行 JS、控制網絡等

選擇原則

  • 固定、重複嘅任務(截圖 QA、自動化測試)→ Playwright,完勝
  • 唔知幾多步、要 AI 判斷(複雜網頁任務)→ Browser Use
  • 最佳實踐(2026):固定步驟用 Playwright(80%)+ 需要 AI 判斷用 Browser Use(20%)

速度參考數據

  • Playwright per-action:~290ms
  • Browser Use 1.0 完成一個任務:平均 68 秒
  • OpenAI Computer Use 同類任務:330 秒(慢 5 倍)