Stable Diffusion 完整指南 2026|本地部署、模型、ControlNet 實戰
Stable Diffusion 是「開源免費的 AI 圖像生成」——可在自己電腦運行、完全控制、無生成限制。技術門檻高,但「極致控制 + 免月費」是核心優勢。
本文整理 2026 年 Stable Diffusion 的本地部署、主流模型、ControlNet、LoRA、台灣顯卡需求。
Stable Diffusion 3 大運作方式
| 方式 |
費用 |
適合 |
| 「本地部署」 |
一次性顯卡 |
重度創作者 |
| 「雲端服務」 |
月費 / 按量 |
一般使用 |
| 「Stability AI 官方」 |
訂閱 |
入門 |
1. 本地部署
「Automatic1111」(最熱門)
| 項目 |
細節 |
| 「開源」 |
免費 |
| 「Web UI」 |
完整 |
| 「擴充功能」 |
1000+ |
| 「ControlNet」 |
完整 |
| 「LoRA」 |
完整 |
| 「模型管理」 |
完整 |
「ComfyUI」(進階)
| 項目 |
細節 |
| 「節點式介面」 |
工作流程視覺化 |
| 「完整控制」 |
是 |
| 「進階用戶」 |
強 |
| 「性能最佳」 |
是 |
「Fooocus」(簡化)
| 項目 |
細節 |
| 「極簡介面」 |
是 |
| 「新手友善」 |
強 |
| 「自動優化」 |
是 |
| 「功能受限」 |
是 |
2. 雲端服務
| 服務 |
月費 |
| Stability AI(官方) |
$10-49/月 |
| RunwayML |
$15-95/月 |
| ThinkDiffusion |
$19-49/月 |
| RunPod(GPU 雲) |
按用量 |
| Replicate(API) |
按用量 |
顯卡需求(本地部署)
「入門級」
| GPU |
影響 |
適合 |
| RTX 3060(8GB / 12GB) |
較慢 |
SD 1.5 / SDXL |
| RTX 4060 Ti(8GB / 16GB) |
中等 |
SDXL |
「主流級」
| GPU |
適合 |
| RTX 4070 / Super |
SDXL 流暢 |
| RTX 4070 Ti / Super |
SD 3.5 |
「高階」
| GPU |
適合 |
| RTX 4080 / 5080 |
Flux、長時間批次 |
| RTX 4090 / 5090(24GB) |
「所有模型 + ControlNet 多 LoRA」 |
「蘋果 Mac」
| Mac |
適合 |
| M2 / M3(16GB) |
SD 1.5 / SDXL(慢) |
| M4(32GB+) |
SDXL(合理速度) |
| Mac Studio M4 Ultra |
完整 |
主流模型
「Stable Diffusion 3.5」(Stability AI 最新)
| 規格 |
細節 |
| 「寫實 / 藝術」 |
強 |
| 「Prompt 友善」 |
強 |
| 「訓練自訂」 |
是 |
| 「商用授權」 |
「$1M+ 公司需付費」 |
「Flux」(Black Forest Labs)
| 規格 |
細節 |
| 「最高品質」 |
是 |
| 「文字渲染」 |
強 |
| 「寫實照片」 |
「最強」 |
| 「商用授權」 |
看版本 |
| 「Flux Schnell」 |
開源 |
| 「Flux Pro」 |
商用 |
「SDXL」(穩定主流)
| 規格 |
細節 |
| 「穩定」 |
是 |
| 「LoRA 多」 |
1000+ |
| 「ControlNet 完整」 |
是 |
| 「商用授權」 |
寬鬆 |
「社群微調模型」
| 模型 |
風格 |
| 「Realistic Vision」 |
寫實照片 |
| 「Anything V5」 |
動漫 |
| 「DreamShaper」 |
通用 |
| 「Juggernaut」 |
寫實 / 藝術 |
| 「Counterfeit」 |
動漫 |
5 大核心功能
1. 「Text-to-Image」
- 同 Midjourney / DALL-E
- 「Prompt + Negative Prompt」(避免 elements)
- 「參數設定」(CFG Scale、Sampling Steps、Seed)
2. 「Image-to-Image」
- 上傳「參考圖」
- 「Denoising Strength」決定變化程度
- 「Inpainting」局部修改
3. 「ControlNet」
「最強大的控制工具」:
| ControlNet |
用途 |
| 「Canny」 |
邊緣偵測 |
| 「Depth」 |
深度 |
| 「OpenPose」 |
姿勢 |
| 「Scribble」 |
草圖 |
| 「Segmentation」 |
分割 |
| 「Reference」 |
風格參考 |
真實案例:
- 上傳「人物姿勢圖」
- OpenPose 抓出骨架
- 「生成同姿勢」不同角色 / 風格
4. 「LoRA(Low-Rank Adaptation)」
自訂風格 / 角色:
- 「少量訓練」即可
- 「特定風格 / 角色 / 物件」
- 「Civitai 社群」幾千個免費 LoRA
真實案例:
- 「訓練 20 張自己照片」生 LoRA
- 「生成自己」在不同場景 / 風格
5. 「Inpainting / Outpainting」
- Inpainting:「修改局部」
- Outpainting:「延伸畫布」
- 「完美控制」修改範圍
ComfyUI 工作流程
「節點式編輯」
| 節點 |
角色 |
| 「模型載入」 |
Checkpoint |
| 「Prompt」 |
正面 + 負面 |
| 「取樣器」 |
Sampler |
| 「VAE」 |
圖像解碼 |
| 「輸出」 |
儲存 |
「進階工作流程」
- 「多 ControlNet」並用
- 「多模型」混合
- 「自動化批次」
- 「API 整合」
5 大實戰技巧
1. 「選對模型」
- 「寫實人物」→ Realistic Vision / Flux
- 「動漫」→ Anything V5 / Counterfeit
- 「藝術風格」→ DreamShaper
- 「通用」→ SDXL / SD 3.5
2. 「Negative Prompt」**
- 「避免」元素
- 「lowres, blurry, deformed, extra fingers」標準負面
- 「節省手指 / 比例」問題
3. 「Sampling Steps + CFG」**
- Sampling Steps:20-40(高 = 品質好 + 慢)
- CFG Scale:5-10(低 = 自由 / 高 = 嚴格遵循 Prompt)
4. 「Seed 控制」
- 「固定 Seed」相同 Prompt 出相同圖
- 「變化 Prompt + 同 Seed」看影響
- 「好的 Seed」可保留迭代
5. 「ControlNet 多重」**
- 「OpenPose + Depth」雙重控制
- 「姿勢 + 構圖」精準
- 「極致控制」可能
Stable Diffusion vs Midjourney vs DALL-E
| 項目 |
Stable Diffusion |
Midjourney |
DALL-E 3 |
| 「費用」 |
免費(顯卡一次性) |
$10-120/月 |
$20/月(含 ChatGPT) |
| 「控制度」 |
最高 |
中 |
中 |
| 「Prompt 友善」 |
中 |
高 |
最高 |
| 「藝術品質」 |
高(看模型) |
最高 |
高 |
| 「自訂風格」 |
LoRA 訓練 |
sref / cref |
弱 |
| 「離線」 |
是 |
否 |
否 |
| 「技術門檻」 |
高 |
低 |
「最低」 |
| 「生成速度」 |
看顯卡 |
30 秒 |
10-30 秒 |
真實使用案例
1. 「插畫家輔助」
- 「ControlNet 控制構圖」
- 「LoRA 保持角色一致」
- 「Inpainting 局部修改」
- 「取代部分繪畫工作」
2. 「設計師工作流」
- 「ComfyUI 自動化」
- 「批次生成 mockup」
- 「多版本同時測試」
3. 「遊戲美術」
- 「角色設計」(LoRA)
- 「場景概念」(Image-to-Image)
- 「材質紋理」(ControlNet)
4. 「內容創作者」
- 「部落格配圖」(免費)
- 「YouTube 縮圖」
- 「社群內容」
5. 「研究 / 實驗」
- 「AI 圖像研究」
- 「創新工作流程」
- 「個人化模型訓練」
商用授權
「Stable Diffusion 3.5」
| 公司規模 |
商用 |
| 個人 / 小公司(< $1M 年收) |
「免費商用」 |
| 中型公司($1M-$10M) |
Stability AI 訂閱 |
| 大型公司(> $10M) |
Enterprise License |
「SDXL / SD 1.5」
「Flux」
- 「Flux Schnell」開源、商用 OK
- 「Flux Pro」需授權
「社群 LoRA / 模型」
- 「Civitai」上每個模型有「Usage Rights」
- 「確認」是否可商用
- 「部分 LoRA」僅個人 / 學習用
5 大常見問題
1. 「完全免費嗎」
- 「模型 + 軟體」免費
- 「顯卡硬體」一次性投資 NT$ 15,000-100,000
- 「雲端」按用量 / 月費
2. 「沒顯卡可以用嗎」
- 「雲端服務」可:(a) Replicate;(b) RunPod;(c) Stability AI;(d) ThinkDiffusion
- 「Colab」免費版有限額
- 「雲端 GPU」按小時 $0.50-2.00
3. 「Civitai 安全嗎」
- 「主流 LoRA / 模型」安全
- 但「惡意檔案」偶有
- 「社群評價高」優先
- 「ClamAV」掃毒
4. 「LoRA 自訓練」難嗎
- 「Kohya_ss」工具
- 「20-50 張訓練圖」
- 「1-3 小時訓練」(4090)
- 「門檻中等」
5. 「SD 還是 Midjourney」
- 「完全控制 + 免費 + 技術」→ SD
- 「易用 + 高品質」→ Midjourney
- 「整合 ChatGPT」→ DALL-E
常見問題
Q:「台灣顯卡」推薦?
A:(1) 「入門」RTX 3060 12GB(NT$ 10,000-15,000);(2) 「主流」RTX 4070 / 4070 Super(NT$ 20,000-25,000);(3) 「高階」RTX 4080 / 5080(NT$ 35,000-45,000);(4) 「頂級」RTX 4090(NT$ 50,000-60,000)/ RTX 5090(NT$ 80,000+);(5) 「Mac」M4 / M4 Pro Mac Studio:NT$ 70,000+;(6) 結論:「4070 / Super」最 CP 值。
Q:「Automatic1111 vs ComfyUI vs Fooocus」?
A:(1) Automatic1111:(a) 「Web UI 親民」;(b) 「擴充多」;(c) 「新手 - 中階」;(2) ComfyUI:(a) 「節點式視覺化」;(b) 「最高彈性」;(c) 「進階用戶」;(3) Fooocus:(a) 「極簡」;(b) 「自動優化」;(c) 「完全新手」;(4) 「順序」:Fooocus → Automatic1111 → ComfyUI。
Q:「LoRA 在哪下載」?
A:(1) 「Civitai」最大社群(civitai.com);(2) 「Hugging Face」開源模型;(3) 「RunDiffusion」精選;(4) 「個別藝術家」Twitter / X 分享;(5) 「注意版權」:(a) 「個人使用 OK」;(b) 「商用前確認」每個 LoRA 政策。
Q:「ControlNet 真的有用嗎」?
A:(1) 是——「改變遊戲規則」;(2) 場景:(a) 「控制人物姿勢」(OpenPose);(b) 「保持構圖」(Depth / Canny);(c) 「從草圖生成」(Scribble);(d) 「風格參考」(Reference);(3) 「多 ControlNet 並用」更強;(4) 「Photoshop 對比」:ControlNet = AI 圖像的 layers + masks。
Q:「Stable Diffusion 學習曲線」?
A:(1) 「第 1 週」:基本生成;(2) 「第 1 個月」:(a) Prompt 技巧;(b) 模型選擇;(c) LoRA 使用;(3) 「第 3 個月」:(a) ControlNet;(b) Inpainting;(c) 工作流程優化;(4) 「第 6 個月」:(a) ComfyUI;(b) LoRA 自訓;(c) API 整合;(5) 「1 年+」:精通;(6) 結論:(a) 學習曲線陡;(b) 但「回報極高」(完全控制 + 免費)。
立即行動
資料來源
- Stability AI / Hugging Face / Civitai 2026 年公開資料
- PTT AI / 顯卡板 2024-2025 年實戰
- Automatic1111 / ComfyUI GitHub 2026
延伸閱讀