2024年3月7日星期四

Stable Diffusion 基本環境安裝

講到繪圖 AI，在初期最有名的應該就是 Midjourney (MJ) 和 Stable Diffusion (SD) 了。後來雖然有不少其他名字陸續冒出來，不過最開始的這兩個，還是依然維持著它們的名氣。因為 side project 的關係，想要試試看繪圖 AI，所以就簡單研究了一下這兩個，發現 Stable Diffusion 可以在自己電腦上面跑，不用買訂閱制的服務！所以就決定嘗試它了！

說是這麼說，但簡單嘗試後發現一個很大的問題，Stable Diffusion 對非 nVidia 顯示卡的使用者相當不友善 😓。雖然不是完全不能用，但就圖片產生速度非常慢，而且環境準備也很麻煩。因為我的顯示卡是 AMD 的大概七年前的中階顯卡，搜尋了一下發現要用 AMD 算圖的環境設定超麻煩，所以立刻就放棄了 😆。試完了一下用 CPU 算圖，不過使用經驗是很多 model 都會有問題，而能用的又很慢，跑一張圖要跑 10 幾分鐘，所以試玩一下後就決定還是要去買新的顯示卡了。於是這篇就會簡單紀錄一下在 Windows 10 的 nVidia 顯卡以及 Stable Diffusion 的基本準備。

準備 NVIDIA 環境

NVIDIA 環境具體來說，就是顯示卡的驅動程式跟 CUDA 相關的東西。這個步驟不算太難，主要要安裝的是以下幾個東西：

NVIDIA Geforece Experience（2025 更新：後來改名叫 Nvidia App）
CUDA Toolkit
NVIDIA cuDNN

其中 Geforece Experience 其實本來不是必要的，不過因為顯示卡驅動程式好像都跟在這裡面，所以多半會一起裝進去。至於 cuDNN 真的就是非必要的，我自己的實際實驗是沒裝它也可以正常使用 Stable Diffusion，不過看官方的說明，感覺這個應該是對計算會有加速的效果之類的，所以還是裝一裝會比較好（但我現在還沒裝 😆）。

CUDA Toolkit 跟 cuDNN 安裝的版本都應該要參考自己的顯示卡和驅動程式對應的版本，可以分別參考官方網站的 CUDA GPU 和 CUDA Driver。舉例來說，在 CUDA Driver 頁面中有寫到 nVidia 驅動程式對應的 CUDA Driver 版本，所以要去看自己的驅動程式應該對應哪一個版本的 CUDA Driver。我的顯示卡有支援最新版，而在寫這篇文章的時候，CUDA Toolkit 最新版是 12.3 (最新版的下載位置) ，不過有個超級重要的經驗是，不要安裝 12.3 版 😆。我試過各種方法都沒辦法成功把 12.3 裝進去，安裝程式會一直顯示安裝失敗，但又不明確提示為什麼失敗。查了 NVIDIA 官方論壇以及 Reddit 的文章後，最後發現改安裝 12.2 (下載位置) 就可以順利安裝完成。

至於 cuDNN，因為我自己沒裝，所以如果之後有裝了再回來補充，可以先參考官方網站的說明。

準備 Stable Diffusion 環境

Stable Diffusion 環境有超多文章和影片在教了，例如這篇，這裡就簡單紀錄了 😆。也可以參考這個影片。

安裝 Windows Store 的 Python 3.7。
下載 Stable Diffusion webui。
在 webui-user.bat 裡面設定 Python 位置。
執行 webui-user.bat，它會在 venv 資料夾裡建出環境。因為要下載不少東西，會需要一段時間。

到這裡其實 Stable Diffusion 就弄好了。不過聽說 Stable Diffusion 還有必裝外掛，裝了以後它才有實用價值。所以下面還會再紀錄一些外掛的基本資訊。

Stable Diffusion 外掛

外掛們據說是 Stable Diffusion 非常重要的東西，有些外掛沒裝，會讓 Stable Diffusion 很難控制，所以會有常見的一些必裝外掛。這裡逐步紀錄一些我自己找到的資訊，不過使用細節等到我有更多經驗後，再看要不要寫點文章紀錄吧～。

翻譯
- stable-diffusion-webui-localization-zh_TW - 繁體中文翻譯，推薦再搭配雙語外掛
- sd-webui-bilingual-localization - 雙語外掛。對入門來說，可以同時看到翻譯的中文和原文的英文，方便對照和熟悉用詞。
提示詞
- sd-webui-prompt-all-in-one - 可以直接從 webui 介面裡安裝。主要功能是提供不少類型的正向和負向提示詞，另外也可以自動幫忙將提示詞翻譯成英文。對於英文詞彙沒那麼熟悉的話，會非常有幫助。
ControlNet - 可以直接從 webui 介面裡安裝。主要用來提昇對圖的控制，必裝，否則 Stable Diffusion 產生的圖太隨機了很難控制。

另外紀錄有討論到各種外掛以及提示詞的文章：

沒有留言:

張貼留言

2024年3月7日 星期四