Browser Automation 技術比較

三種技術對比

	Playwright (scripted)	Browser Use 舊方法	Browser Use 新 CDP
速度	最快（直接 DOM，無 AI）	最慢（截圖 + Vision AI）	中（仍需 AI 決策）
準確度	最高（~100%，deterministic）	中（AI 估座標）	70-85%（AI 判斷）
成本	最平（近乎零）	貴	貴（每步 call LLM）
靈活性	低（要寫死步驟）	高	高

工作原理

Playwright

直接用 CSS selector / text / role 搵 DOM element
唔需要截圖搵 button，截圖只係用嚟做 QA 確認
底層係 CDP，但加咗抽象層

Browser Use 舊方法

Playwright + AI Vision
截圖 → Vision AI 分析圖片 → 估座標 → click
慢係因為截圖大 + Vision model 分析慢

Browser Use 新方法（直接 CDP）

繞過 Playwright 抽象層，直接問 Chrome 內部
返回輕量 JSON element 資料（唔係大圖片）
AI 讀 JSON 決定點 click，比讀圖片快好多
BU 1.0 平均 68 秒/任務 vs OpenAI CUA 330 秒

CDP（Chrome DevTools Protocol）係咩

Chrome 自己嘅內部 API
F12 開發者工具背後都係用 CDP
可以直接查詢頁面所有 element 資料、執行 JS、控制網絡等

選擇原則

固定、重複嘅任務（截圖 QA、自動化測試）→ Playwright，完勝
唔知幾多步、要 AI 判斷（複雜網頁任務）→ Browser Use
最佳實踐（2026）：固定步驟用 Playwright（80%）+ 需要 AI 判斷用 Browser Use（20%）

速度參考數據

Playwright per-action：~290ms
Browser Use 1.0 完成一個任務：平均 68 秒
OpenAI Computer Use 同類任務：330 秒（慢 5 倍）