Stable Diffusion AI 圖像生成本地部署與 API 完全指南
Stability AI 推出的開源 AI 圖像生成模型 — SD 3.5 Large(8.1B 參數)、SDXL、ControlNet。支援本地部署(ComfyUI / Automatic1111 / Forge)和 API 呼叫。社區許可證免費商用,消費級顯卡即可運行。
Stable Diffusion 是什麼?
Stability AI 推出的開源 AI 圖像生成模型
開源 AI 繪畫的絕對王者
Stable Diffusion 是 Stability AI 的開源 AI 圖像生成模型系列。最新 SD 3.5 採用 MMDiT 架構,8.1B 參數。
模型家族
| 模型 | 參數量 | 特點 |
|---|---|---|
| SD 3.5 Large | 8.1B | 旗艦,最高質量 |
| SD 3.5 Large Turbo | 8.1B | 4 步快速生成 |
| SD 3.5 Medium | 2.5B | 消費級硬件優化 |
| SDXL | 3.5B | 社區生態最豐富 |
競品對比
| 特性 | SD 3.5 | FLUX.1 | Midjourney |
|---|---|---|---|
| 開源 | 是 | 部分 | 否 |
| 本地 | 是 | 是 | 否 |
| VRAM | 8GB | 8GB | N/A |
| ControlNet | 完整 | 社區 | 無 |
透過 Neuronicx 取得 Stability AI API 充值。
本地部署與 API 接入
三種主流客戶端 + API
第一步:確認硬件
最低:RTX 3060(8GB),16GB 記憶體。推薦:RTX 4070(12GB),32GB。
第二步:安裝 Python + Git
Python 3.10.6(⚠️ 3.11+ 會失敗),Git。Windows 勾選 Add to PATH。
第三步:安裝客戶端
ComfyUI(推薦):快 40%。A1111:適合新手。Forge:6GB 提速 75%。
第四步:下載模型
HuggingFace / CivitAI 下載 .safetensors。放入 models/ 資料夾。
第五步:啟動生成
瀏覽器存取 localhost。輸入 Prompt,設定參數,點擊生成。
第六步:API 接入
Stability AI REST API,$10/月起(6,500 積分)。
部署與 API 程式碼
複製即用
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
# 安裝 Manager
cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git
cd ..
# 啟動
python main.py # 12GB+ VRAM
python main.py --lowvram # 4-6GBStable Diffusion 核心能力
基於官方發佈和社區生態
文生圖 (T2I)
Prompt 文字描述生成圖片,三重文本編碼器精準理解語義。
圖生圖 (I2I)
參考圖片風格轉換、修改、增強,可控變化強度。
圖片放大
放大到 8K/16K,Creative 和 Conservative 兩種模式。
ControlNet
Blur、Canny、Depth 三種精確控制構圖和姿態。
LoRA 微調
CivitAI 數十萬社區模型,輕量級風格/人物訓練。
修復與編輯
Inpainting 局部重繪、Outpainting 外擴、背景移除。
消費級硬件
8GB VRAM 即可,ComfyUI 比 A1111 快 40%。
開源免費商用
社區許可證免費商用,HuggingFace 和 GitHub 開源。
介面與效果
客戶端介面和生成效果
ComfyUI
節點工作流
AI 繪畫
Prompt 驅動生成
ControlNet
精確控制構圖
LoRA
社區微調模型
圖片放大
8K/16K 放大
局部重繪
Inpainting
影片教程
跟著影片上手
ComfyUI 完整新手指南
ComfyUI + SD3 安裝教程
常見問題
關於 Stable Diffusion 的常見問題