IG Carousel 風格複製 — Reddit 研究報告
分析咗 28 條 thread / post + comments | 2026-04-13
研究問題: 點樣用 AI(尤其 Claude Code)睇到一個靚嘅外國 IG carousel,抄佢風格,翻譯成中文,高效率完成?
🧠 社群主要共識
1. Reddit 上呢個具體 use case(Claude Code + IG carousel 風格複製)基本上係空白
搜尋咗 9 個 keyword combinations,發現 Reddit 社群尚未有人系統討論「用 Claude Code 睇截圖→複製 carousel 風格」呢個確切流程。呢個反映:
- 呢個需求係新興的、進階嘅
- 大多數人仲停留係 Canva template 層面
- 有能力做呢件事嘅人係 technical minority,通常唔係係 Reddit 討論
2. 最接近嘅社群行為:AI 工具生成 carousel
Reddit r/SideProject 有人 (u/ComfortableSevere597) 分享咗一個 Free AI Carousel Generator,workflow 如下:
1. 揀 topic
2. 揀 template(或自訂)
3. 用 ChatGPT/Gemini 生成 JSON
4. 調整顏色、字體、layout
5. Download slides
工具係用 Next.js + Canvas API + html2canvas。佢話「可以 save styles 返用」,話省咗 2+ 小時設計時間。
3. Claude 用於 image-to-design 的社群唯一直接案例
Reddit r/AIToolBench (u/Puzzled-Anything-637) 用緊 Claude Code + Google API 做設計 pipeline:
搜尋 reference → 揀 reference → AI 生成 poster
痛點係: AI 輸出唔夠似 reference。評論 (u/katoss88) 指出最佳解法:
「先叫 Claude analyze reference(顏色、形狀、排版、字體),turn it into a prompt,再 create。」 即係「analyze first → describe → generate」而唔係「直接 image-to-image」
4. Claude Code 同 store screenshots 有相通邏輯
Reddit r/ClaudeCode 有人 (u/TomyCatt) 建咗一個 Claude Code skill /store-screenshots:
- 讀 codebase → 提取品牌色、字體、logo
- 生成 editorial-style slides(大排版、gradient、glassmorphism)
- 內置 Discord/Bumble/Spotify 等 top apps 嘅設計規則
- Multi-language 支援(預設 EN + ES,可改)
- 用 Puppeteer export 高清 PNG
評論 (u/dennisplucinik):「May or may not repurpose that for generating social media posts…」— 呢個係 carousel 用途嘅直接橋樑
5. IG 內容創作自動化嘅社群主流工具
r/InstagramMarketing 上 2026 年嘅討論顯示:
- Canva Pro + brand templates 係主流(batch 製作)
- Later / Planoly / Meta Business Suite 排期
- Claude 寫 caption(有人明確提到)
- Lightroom presets 批量 photo 處理
- CapCut templates 短片
一位 8 年 IG growth 老手 (u/famefacer) 警告:
「唔存在真正嘅全自動化。全自動內容通常 100 views 都無。觀眾分得出 AI 內容。」
😤 真實痛點
設計層面:
- AI 生成嘅設計「顏色、比例用咗,但最重要嘅部分(設計感)冇到」(展覽 curator 的原話)
- Claude 無法自動識別「設計嘅精髓」,需要人手介入描述
- Carousel spacing、text overflow 仍係痛點(Claude Code store-screenshot skill 話有 30% 輸出有問題)
- html2canvas 慢且唔準確(有人建議改用 snapdom)
內容層面:
- 從 reference 到新內容嘅「意義轉化」AI 做得唔好
- 自動化工具多,但整合唔到一起,「我仲係 middle layer」
- 翻譯唔等於本地化,語氣、文化 reference 要手動調整
工作流程層面:
- 多工具之間 context 唔共享
- 每個工具有自己嘅 brain,要人手 copy-paste 銜接
- Canva 夠用但「重複設計時開始覺得慢」
👍 推薦工作流程
根據 Reddit 社群嘅討論整合出 Steven 適用嘅最佳工作流程:
核心 4 步法(由 Reddit 洞察推導)
Step 1 — 解剖 Reference(Claude Vision 分析)
截圖 → 餵俾 Claude
Prompt: "分析呢個 carousel 嘅設計 DNA:
- 顏色(主色、輔色、背景色 hex)
- 字體風格(大小、粗細、line-height)
- 排版結構(每頁 layout 幾多 columns,text/image 比例)
- 間距規則(padding、margin 估算)
- 設計風格(gradient/flat/glassmorphism/minimal)
- Slide 結構(hook slide、content slides、CTA slide)"
輸出:一份 design spec JSON
Step 2 — 提取內容 + 翻譯(Claude 翻譯 + 本地化)
用 Claude 翻譯原文 → 要求廣東話口語化
明確 prompt: "唔係逐字翻譯,係本地化:
- 用香港人 2026 年嘅網絡語
- 保留原有資訊密度
- Hook slide 要有力(用問句或驚嘆)
- 每頁字數限制(例如每頁最多 3 個 bullet)"
Step 3 — 生成 HTML Carousel(Claude Code)
餵入 design spec JSON + 中文內容
要求生成:
- 1080x1080px 每張 slide(IG 正方形)
- 用 HTML/CSS 實現(唔係 Canva)
- Puppeteer 或 Playwright export PNG
Step 4 — QA + 微調
用 Playwright 截圖對比 reference
調整字體、顏色、間距直到符合
工具建議(Reddit 社群認可)
| 需求 | 工具 | 評價 |
|---|---|---|
| 設計分析 | Claude Vision(multimodal) | 最強,需要好 prompt |
| 翻譯 + 本地化 | Claude | 社群認可 |
| 生成 slide HTML | Claude Code | 直接 |
| Export PNG | Puppeteer / Playwright | 成熟方案 |
| 快速修改 | Canva(後備) | 唔需要 code |
| 排期 | Later / Meta Business Suite | 免費夠用 |
🔥 爭議討論
爭議 1:AI carousel 有冇效?
r/InstagramMarketing 資深創作者認為「全自動 AI 內容通常冇 engagement」,觀眾分得出。但另一邊 AI carousel generator creator 話靠呢個工具贏得 400+ followers(唔靠 paid)。
分析: 爭議源於「全自動」vs「AI 輔助人工」。Steven 嘅 use case 係後者:AI 做設計苦差,人負責創意判斷,呢個係較有效嘅平衡點。
爭議 2:直接 image-to-image 生成 vs analyze-first
部分人覺得直接丟 reference 圖比例已夠,但 Claude 佢自己講「apply 咗 color、proportion,但呢唔係設計最重要嘅部分」。
社群建議更有效方式:先分析 → 轉成文字描述 → 再生成,比直接 image-to-image 準確。
爭議 3:snapdom vs html2canvas
有 dev 明確指出 html2canvas 有 accuracy 問題,snapdom 更快更準,但知名度低。
🔍 跨 Thread 洞察
洞察 1:「Design DNA 提取」係關鍵缺口
Reddit 幾乎無人討論「從 image 提取 design spec」呢個步驟,但呢個係整個 workflow 最關鍵嘅一環。Claude Vision 嘅 multimodal 能力係呢個缺口嘅答案,但需要精心設計嘅 prompt(問得越具體,輸出越準確)。
洞察 2:Claude Code skill 架構係最優路線
r/ClaudeCode 嘅 store-screenshots skill 案例顯示,將整個 pipeline 包裝成一個 skill(/ig-carousel)係最高效嘅做法。一次建立,重複使用,可傳遞 design spec 作為 context。
洞察 3:JSON 作為 design spec 中間層
AI Carousel Generator 用 JSON 做「內容↔設計」嘅橋樑呢個方式值得借鑒:
{
"design": { "primary_color": "#1A1A2E", "font": "Inter Bold", ... },
"slides": [
{ "type": "hook", "headline": "..." },
{ "type": "content", "bullets": [...] }
]
}呢個 JSON 可以俾 Claude 填充(中文內容),再由 Claude Code render 成 HTML/PNG。
洞察 4:本地化 ≠ 翻譯
Reddit 上冇人討論中文本地化,但根據 Steve 嘅 use case,翻譯僅係第一步。廣東話口語化、香港文化 reference、emoji 用法都需要額外 prompt 指引。
洞察 5:Multi-tool 整合係痛點
r/ArtificialInteligence 有帖提到「AI 工具唔 share context,我仍然係 middle layer」。Steven 嘅 Claude Code + Claude 一體化方案正好解決呢個問題——唔需要 hop between tools。
🏆 Top 3 最值得睇嘅 Thread
1. r/AIToolBench — “How to Generate new design from references” URL: https://www.reddit.com/r/AIToolBench/comments/1sfdyrr/how_to_generate_new_design_from_references/ 核心洞察: Claude 做 design generation 嘅痛點 + 社群建議嘅「analyze first」解法。最直接對應 Steven 嘅問題。 Quote: “Before creating, ask Claude to analyze the reference (colors, shapes, textures, typography) and then turn that into a prompt, then you create.”
2. r/ClaudeCode — “I built a skill that generates Store screenshots automatically” URL: https://www.reddit.com/r/ClaudeCode/comments/1shbzcc/i_built_a_skill_that_generates_store_screenshots/ 核心洞察: Claude Code skill 做視覺 slide 生成嘅完整架構,內置設計規則 + multi-language。Steven 可以直接 fork 呢個思路。 Quote: “May or may not repurpose that for generating social media posts…”
3. r/SideProject — “My Free AI Carousel Generator got me 400 followers” URL: https://www.reddit.com/r/SideProject/comments/1sf0yia/my_free_ai_carousel_generator_got_me_400/ 核心洞察: JSON-driven carousel generation workflow,ChatGPT/Gemini 生成 JSON → Canvas API render。Steven 可以用 Claude 替代 ChatGPT,做法相通。 Tool link: rubixscript.com/tools/carouselGenerator
💡 Steven 嘅最終建議工作流
基於以上研究,呢個係最有效嘅流程:
睇到靚 carousel
↓
截圖 → Claude (Vision)
"幫我分析呢個 carousel 嘅 design DNA,輸出 JSON"
↓
[Design Spec JSON]
↓
Claude
"根據呢個 design spec + 以下英文內容,
用廣東話重新撰寫,本地化,唔係直譯,
輸出每頁嘅中文內容"
↓
[Chinese Content JSON]
↓
Claude Code
"根據 design spec + Chinese content,
生成 1080x1080 HTML slides,
用 Playwright export PNG"
↓
[Carousel PNGs ready to post]
預計時間: 15-20 分鐘(vs 手動 2+ 小時) 最大風險: Claude 解讀 design spec 時字體/間距有偏差,需要 1-2 輪微調
研究方法:用 Apify Reddit Scraper 爬取 9 個 keyword searches,總計分析 28 個相關 posts/comments。由於呢個 use case 係新興 niche,大量洞察係由相關 thread 推導而來,而非直接引用。