「Automatic1111」（最熱門）項目細節「開源」免費「Web UI」完整「擴充功能」 1000+ 「ControlNet」完整「LoRA」完整「模型管理」完整「ComfyUI」（進階）項目細節「節點式介面」工作流程視覺化「完整控制」是「進階用戶」強「性能最佳」是「Fooocus」（簡化）項目細節「極簡介面」是「新手友善」強「自動優化」是「功能受限」是

服務月費 Stability AI（官方） $10-49/月 RunwayML $15-95/月 ThinkDiffusion $19-49/月 RunPod（GPU 雲）按用量 Replicate（API）按用量

「Stable Diffusion 3.5」（Stability AI 最新）規格細節「寫實 / 藝術」強「Prompt 友善」強「訓練自訂」是「商用授權」「$1M+ 公司需付費」「Flux」（Black Forest Labs）規格細節「最高品質」是「文字渲染」強「寫實照片」「最強」「商用授權」看版本「Flux Schnell」開源「Flux Pro」商用「SDXL」（穩定主流）規格細節「穩定」是「LoRA 多」 1000+ 「ControlNet 完整」是「商用授權」寬鬆「社群微調模型」模型風格「Realistic Vision」寫實照片「Anything V5」動漫「DreamShaper」通用「Juggernaut」寫實 / 藝術「Counterfeit」動漫

1. 「Text-to-Image」同 Midjourney / DALL-E 「Prompt + Negative Prompt」（避免 elements）「參數設定」（CFG Scale、Sampling Steps、Seed） 2. 「Image-to-Image」上傳「參考圖」「Denoising Strength」決定變化程度「Inpainting」局部修改 3. 「ControlNet」「最強大的控制工具」： ControlNet 用途「Canny」邊緣偵測「Depth」深度「OpenPose」姿勢「Scribble」草圖「Segmentation」分割「Reference」風格參考真實案例：上傳「人物姿勢圖」 OpenPose 抓出骨架「生成同姿勢」不同角色 / 風格 4. 「LoRA（Low-Rank Adaptation）」自訂風格 / 角色：「少量訓練」即可「特定風格 / 角色 / 物件」「Civitai 社群」幾千個免費 LoRA 真實案例：「訓練 20 張自己照片」生 LoRA 「生成自己」在不同場景 / 風格 5. 「Inpainting / Outpainting」 Inpainting：「修改局部」 Outpainting：「延伸畫布」「完美控制」修改範圍

「節點式編輯」節點角色「模型載入」 Checkpoint 「Prompt」正面 + 負面「取樣器」 Sampler 「VAE」圖像解碼「輸出」儲存「進階工作流程」「多 ControlNet」並用「多模型」混合「自動化批次」「API 整合」

1. 「選對模型」「寫實人物」→ Realistic Vision / Flux 「動漫」→ Anything V5 / Counterfeit 「藝術風格」→ DreamShaper 「通用」→ SDXL / SD 3.5 2. 「Negative Prompt」「避免」元素「lowres, blurry, deformed, extra fingers」標準負面「節省手指 / 比例」問題 3. 「Sampling Steps + CFG」 Sampling Steps：20-40（高 = 品質好 + 慢） CFG Scale：5-10（低 = 自由 / 高 = 嚴格遵循 Prompt） 4. 「Seed 控制」「固定 Seed」相同 Prompt 出相同圖「變化 Prompt + 同 Seed」看影響「好的 Seed」可保留迭代 5. 「ControlNet 多重」「OpenPose + Depth」雙重控制「姿勢 + 構圖」精準「極致控制」可能

1. 「插畫家輔助」「ControlNet 控制構圖」「LoRA 保持角色一致」「Inpainting 局部修改」「取代部分繪畫工作」 2. 「設計師工作流」「ComfyUI 自動化」「批次生成 mockup」「多版本同時測試」 3. 「遊戲美術」「角色設計」（LoRA）「場景概念」（Image-to-Image）「材質紋理」（ControlNet） 4. 「內容創作者」「部落格配圖」（免費）「YouTube 縮圖」「社群內容」 5. 「研究 / 實驗」「AI 圖像研究」「創新工作流程」「個人化模型訓練」

「Stable Diffusion 3.5」公司規模商用個人 / 小公司（< $1M 年收）「免費商用」中型公司（$1M-$10M） Stability AI 訂閱大型公司（> $10M） Enterprise License 「SDXL / SD 1.5」「寬鬆商用」「個人 + 大多公司」皆可用「Flux」「Flux Schnell」開源、商用 OK 「Flux Pro」需授權「社群 LoRA / 模型」「Civitai」上每個模型有「Usage Rights」「確認」是否可商用「部分 LoRA」僅個人 / 學習用

1. 「完全免費嗎」「模型 + 軟體」免費「顯卡硬體」一次性投資 NT$ 15,000-100,000 「雲端」按用量 / 月費 2. 「沒顯卡可以用嗎」「雲端服務」可：(a) Replicate；(b) RunPod；(c) Stability AI；(d) ThinkDiffusion 「Colab」免費版有限額「雲端 GPU」按小時 $0.50-2.00 3. 「Civitai 安全嗎」「主流 LoRA / 模型」安全但「惡意檔案」偶有「社群評價高」優先「ClamAV」掃毒 4. 「LoRA 自訓練」難嗎「Kohya_ss」工具「20-50 張訓練圖」「1-3 小時訓練」（4090）「門檻中等」 5. 「SD 還是 Midjourney」「完全控制 + 免費 + 技術」→ SD 「易用 + 高品質」→ Midjourney 「整合 ChatGPT」→ DALL-E

Stability AI / Hugging Face / Civitai 2026 年公開資料 PTT AI / 顯卡板 2024-2025 年實戰 Automatic1111 / ComfyUI GitHub 2026

Midjourney 完整指南 DALL-E 完整指南 Sora 影片生成完整

Stable Diffusion 完整指南 2026｜本地部署、模型、ControlNet 實戰

Q: Stable Diffusion 3 大運作方式

方式 費用 適合 「本地部署」 一次性顯卡 重度創作者 「雲端服務」 月費 / 按量 一般使用 「Stability AI 官方」 訂閱 入門

Q: 1. 本地部署

「Automatic1111」（最熱門） 項目 細節 「開源」 免費 「Web UI」 完整 「擴充功能」 1000+ 「ControlNet」 完整 「LoRA」 完整 「模型管理」 完整 「ComfyUI」（進階） 項目 細節 「節點式介面」 工作流程視覺化 「完整控制」 是 「進階用戶」 強 「性能最佳」 是 「Fooocus」（簡化） 項目 細節 「極簡介面」 是 「新手友善」 強 「自動優化」 是 「功能受限」 是

Q: 主流模型

「Stable Diffusion 3.5」（Stability AI 最新） 規格 細節 「寫實 / 藝術」 強 「Prompt 友善」 強 「訓練自訂」 是 「商用授權」 「$1M+ 公司需付費」 「Flux」（Black Forest Labs） 規格 細節 「最高品質」 是 「文字渲染」 強 「寫實照片」 「最強」 「商用授權」 看版本 「Flux Schnell」 開源 「Flux Pro」 商用 「SDXL」（穩定主流） 規格 細節 「穩定」 是 「LoRA 多」 1000+ 「ControlNet 完整」 是 「商用授權」 寬鬆 「社群微調模型」 模型 風格 「Realistic Vision」 寫實照片 「Anything V5」 動漫 「DreamShaper」 通用 「Juggernaut」 寫實 / 藝術 「Counterfeit」 動漫

Q: 5 大核心功能

1. 「Text-to-Image」 同 Midjourney / DALL-E 「Prompt + Negative Prompt」（避免 elements） 「參數設定」（CFG Scale、Sampling Steps、Seed） 2. 「Image-to-Image」 上傳「參考圖」 「Denoising Strength」決定變化程度 「Inpainting」局部修改 3. 「ControlNet」 「最強大的控制工具」： ControlNet 用途 「Canny」 邊緣偵測 「Depth」 深度 「OpenPose」 姿勢 「Scribble」 草圖 「Segmentation」 分割 「Reference」 風格參考 真實案例： 上傳「人物姿勢圖」 OpenPose 抓出骨架 「生成同姿勢」不同角色 / 風格 4. 「LoRA（Low-Rank Adaptation）」 自訂風格 / 角色： 「少量訓練」即可 「特定風格 / 角色 / 物件」 「Civitai 社群」幾千個免費 LoRA 真實案例： 「訓練 20 張自己照片」生 LoRA 「生成自己」在不同場景 / 風格 5. 「Inpainting / Outpainting」 Inpainting：「修改局部」 Outpainting：「延伸畫布」 「完美控制」修改範圍

Q: ComfyUI 工作流程

「節點式編輯」 節點 角色 「模型載入」 Checkpoint 「Prompt」 正面 + 負面 「取樣器」 Sampler 「VAE」 圖像解碼 「輸出」 儲存 「進階工作流程」 「多 ControlNet」並用 「多模型」混合 「自動化批次」 「API 整合」

Q: 5 大實戰技巧

1. 「選對模型」 「寫實人物」→ Realistic Vision / Flux 「動漫」→ Anything V5 / Counterfeit 「藝術風格」→ DreamShaper 「通用」→ SDXL / SD 3.5 2. 「Negative Prompt」 「避免」元素 「lowres, blurry, deformed, extra fingers」標準負面 「節省手指 / 比例」問題 3. 「Sampling Steps + CFG」 Sampling Steps：20-40（高 = 品質好 + 慢） CFG Scale：5-10（低 = 自由 / 高 = 嚴格遵循 Prompt） 4. 「Seed 控制」 「固定 Seed」相同 Prompt 出相同圖 「變化 Prompt + 同 Seed」看影響 「好的 Seed」可保留迭代 5. 「ControlNet 多重」 「OpenPose + Depth」雙重控制 「姿勢 + 構圖」精準 「極致控制」可能

Q: 真實使用案例

1. 「插畫家輔助」 「ControlNet 控制構圖」 「LoRA 保持角色一致」 「Inpainting 局部修改」 「取代部分繪畫工作」 2. 「設計師工作流」 「ComfyUI 自動化」 「批次生成 mockup」 「多版本同時測試」 3. 「遊戲美術」 「角色設計」（LoRA） 「場景概念」（Image-to-Image） 「材質紋理」（ControlNet） 4. 「內容創作者」 「部落格配圖」（免費） 「YouTube 縮圖」 「社群內容」 5. 「研究 / 實驗」 「AI 圖像研究」 「創新工作流程」 「個人化模型訓練」

Stable Diffusion 是「開源免費的 AI 圖像生成」——可在自己電腦運行、完全控制、無生成限制。技術門檻高，但「極致控制 + 免月費」是核心優勢。

本文整理 2026 年 Stable Diffusion 的本地部署、主流模型、ControlNet、LoRA、台灣顯卡需求。

Stable Diffusion 3 大運作方式

方式	費用	適合
「本地部署」	一次性顯卡	重度創作者
「雲端服務」	月費 / 按量	一般使用
「Stability AI 官方」	訂閱	入門

1. 本地部署

「Automatic1111」（最熱門）

項目	細節
「開源」	免費
「Web UI」	完整
「擴充功能」	1000+
「ControlNet」	完整
「LoRA」	完整
「模型管理」	完整

「ComfyUI」（進階）

項目	細節
「節點式介面」	工作流程視覺化
「完整控制」	是
「進階用戶」	強
「性能最佳」	是

「Fooocus」（簡化）

項目	細節
「極簡介面」	是
「新手友善」	強
「自動優化」	是
「功能受限」	是

2. 雲端服務

服務	月費
Stability AI（官方）	$10-49/月
RunwayML	$15-95/月
ThinkDiffusion	$19-49/月
RunPod（GPU 雲）	按用量
Replicate（API）	按用量

顯卡需求（本地部署）

「入門級」

GPU	影響	適合
RTX 3060（8GB / 12GB）	較慢	SD 1.5 / SDXL
RTX 4060 Ti（8GB / 16GB）	中等	SDXL

「主流級」

GPU	適合
RTX 4070 / Super	SDXL 流暢
RTX 4070 Ti / Super	SD 3.5

「高階」

GPU	適合
RTX 4080 / 5080	Flux、長時間批次
RTX 4090 / 5090（24GB）	「所有模型 + ControlNet 多 LoRA」

「蘋果 Mac」

Mac	適合
M2 / M3（16GB）	SD 1.5 / SDXL（慢）
M4（32GB+）	SDXL（合理速度）
Mac Studio M4 Ultra	完整

主流模型

「Stable Diffusion 3.5」（Stability AI 最新）

規格	細節
「寫實 / 藝術」	強
「Prompt 友善」	強
「訓練自訂」	是
「商用授權」	「$1M+ 公司需付費」

「Flux」（Black Forest Labs）

規格	細節
「最高品質」	是
「文字渲染」	強
「寫實照片」	「最強」
「商用授權」	看版本
「Flux Schnell」	開源
「Flux Pro」	商用

「SDXL」（穩定主流）

規格	細節
「穩定」	是
「LoRA 多」	1000+
「ControlNet 完整」	是
「商用授權」	寬鬆

「社群微調模型」

模型	風格
「Realistic Vision」	寫實照片
「Anything V5」	動漫
「DreamShaper」	通用
「Juggernaut」	寫實 / 藝術
「Counterfeit」	動漫

5 大核心功能

1. 「Text-to-Image」

同 Midjourney / DALL-E
「Prompt + Negative Prompt」（避免 elements）
「參數設定」（CFG Scale、Sampling Steps、Seed）

2. 「Image-to-Image」

上傳「參考圖」
「Denoising Strength」決定變化程度
「Inpainting」局部修改

3. 「ControlNet」

「最強大的控制工具」：

ControlNet	用途
「Canny」	邊緣偵測
「Depth」	深度
「OpenPose」	姿勢
「Scribble」	草圖
「Segmentation」	分割
「Reference」	風格參考

真實案例：

上傳「人物姿勢圖」
OpenPose 抓出骨架
「生成同姿勢」不同角色 / 風格

4. 「LoRA（Low-Rank Adaptation）」

自訂風格 / 角色：

「少量訓練」即可
「特定風格 / 角色 / 物件」
「Civitai 社群」幾千個免費 LoRA

真實案例：

「訓練 20 張自己照片」生 LoRA
「生成自己」在不同場景 / 風格

5. 「Inpainting / Outpainting」

Inpainting：「修改局部」
Outpainting：「延伸畫布」
「完美控制」修改範圍

ComfyUI 工作流程

「節點式編輯」

節點	角色
「模型載入」	Checkpoint
「Prompt」	正面 + 負面
「取樣器」	Sampler
「VAE」	圖像解碼
「輸出」	儲存

「進階工作流程」

「多 ControlNet」並用
「多模型」混合
「自動化批次」
「API 整合」

5 大實戰技巧

1. 「選對模型」

「寫實人物」→ Realistic Vision / Flux
「動漫」→ Anything V5 / Counterfeit
「藝術風格」→ DreamShaper
「通用」→ SDXL / SD 3.5

2. 「Negative Prompt」

「避免」元素
「lowres, blurry, deformed, extra fingers」標準負面
「節省手指 / 比例」問題

3. 「Sampling Steps + CFG」

Sampling Steps：20-40（高 = 品質好 + 慢）
CFG Scale：5-10（低 = 自由 / 高 = 嚴格遵循 Prompt）

4. 「Seed 控制」

「固定 Seed」相同 Prompt 出相同圖
「變化 Prompt + 同 Seed」看影響
「好的 Seed」可保留迭代

5. 「ControlNet 多重」

「OpenPose + Depth」雙重控制
「姿勢 + 構圖」精準
「極致控制」可能

Stable Diffusion vs Midjourney vs DALL-E

項目	Stable Diffusion	Midjourney	DALL-E 3
「費用」	免費（顯卡一次性）	$10-120/月	$20/月（含 ChatGPT）
「控制度」	最高	中	中
「Prompt 友善」	中	高	最高
「藝術品質」	高（看模型）	最高	高
「自訂風格」	LoRA 訓練	sref / cref	弱
「離線」	是	否	否
「技術門檻」	高	低	「最低」
「生成速度」	看顯卡	30 秒	10-30 秒

真實使用案例

1. 「插畫家輔助」

「ControlNet 控制構圖」
「LoRA 保持角色一致」
「Inpainting 局部修改」
「取代部分繪畫工作」

2. 「設計師工作流」

「ComfyUI 自動化」
「批次生成 mockup」
「多版本同時測試」

3. 「遊戲美術」

「角色設計」（LoRA）
「場景概念」（Image-to-Image）
「材質紋理」（ControlNet）

4. 「內容創作者」

「部落格配圖」（免費）
「YouTube 縮圖」
「社群內容」

5. 「研究 / 實驗」

「AI 圖像研究」
「創新工作流程」
「個人化模型訓練」

商用授權

「Stable Diffusion 3.5」

公司規模	商用
個人 / 小公司（< $1M 年收）	「免費商用」
中型公司（$1M-$10M）	Stability AI 訂閱
大型公司（> $10M）	Enterprise License

「SDXL / SD 1.5」

「寬鬆商用」
「個人 + 大多公司」皆可用

「Flux」

「Flux Schnell」開源、商用 OK
「Flux Pro」需授權

「社群 LoRA / 模型」

「Civitai」上每個模型有「Usage Rights」
「確認」是否可商用
「部分 LoRA」僅個人 / 學習用

5 大常見問題

1. 「完全免費嗎」

「模型 + 軟體」免費
「顯卡硬體」一次性投資 NT$ 15,000-100,000
「雲端」按用量 / 月費

2. 「沒顯卡可以用嗎」

「雲端服務」可：(a) Replicate；(b) RunPod；(c) Stability AI；(d) ThinkDiffusion
「Colab」免費版有限額
「雲端 GPU」按小時 $0.50-2.00

3. 「Civitai 安全嗎」

「主流 LoRA / 模型」安全
但「惡意檔案」偶有
「社群評價高」優先
「ClamAV」掃毒

4. 「LoRA 自訓練」難嗎

「Kohya_ss」工具
「20-50 張訓練圖」
「1-3 小時訓練」（4090）
「門檻中等」

5. 「SD 還是 Midjourney」

「完全控制 + 免費 + 技術」→ SD
「易用 + 高品質」→ Midjourney
「整合 ChatGPT」→ DALL-E

常見問題

Q：「台灣顯卡」推薦？ A：(1) 「入門」RTX 3060 12GB（NT$ 10,000-15,000）；(2) 「主流」RTX 4070 / 4070 Super（NT$ 20,000-25,000）；(3) 「高階」RTX 4080 / 5080（NT$ 35,000-45,000）；(4) 「頂級」RTX 4090（NT$ 50,000-60,000）/ RTX 5090（NT$ 80,000+）；(5) 「Mac」M4 / M4 Pro Mac Studio：NT$ 70,000+；(6) 結論：「4070 / Super」最 CP 值。

Q：「Automatic1111 vs ComfyUI vs Fooocus」？ A：(1) Automatic1111：(a) 「Web UI 親民」；(b) 「擴充多」；(c) 「新手 - 中階」；(2) ComfyUI：(a) 「節點式視覺化」；(b) 「最高彈性」；(c) 「進階用戶」；(3) Fooocus：(a) 「極簡」；(b) 「自動優化」；(c) 「完全新手」；(4) 「順序」：Fooocus → Automatic1111 → ComfyUI。

Q：「LoRA 在哪下載」？ A：(1) 「Civitai」最大社群（civitai.com）；(2) 「Hugging Face」開源模型；(3) 「RunDiffusion」精選；(4) 「個別藝術家」Twitter / X 分享；(5) 「注意版權」：(a) 「個人使用 OK」；(b) 「商用前確認」每個 LoRA 政策。

Q：「ControlNet 真的有用嗎」？ A：(1) 是——「改變遊戲規則」；(2) 場景：(a) 「控制人物姿勢」（OpenPose）；(b) 「保持構圖」（Depth / Canny）；(c) 「從草圖生成」（Scribble）；(d) 「風格參考」（Reference）；(3) 「多 ControlNet 並用」更強；(4) 「Photoshop 對比」：ControlNet = AI 圖像的 layers + masks。

Q：「Stable Diffusion 學習曲線」？ A：(1) 「第 1 週」：基本生成；(2) 「第 1 個月」：(a) Prompt 技巧；(b) 模型選擇；(c) LoRA 使用；(3) 「第 3 個月」：(a) ControlNet；(b) Inpainting；(c) 工作流程優化；(4) 「第 6 個月」：(a) ComfyUI；(b) LoRA 自訓；(c) API 整合；(5) 「1 年+」：精通；(6) 結論：(a) 學習曲線陡；(b) 但「回報極高」（完全控制 + 免費）。

資料來源

Stability AI / Hugging Face / Civitai 2026 年公開資料
PTT AI / 顯卡板 2024-2025 年實戰
Automatic1111 / ComfyUI GitHub 2026