스테이블 디퓨전은 대표적인 Txt-2-Img, 즉 텍스트에 기반한 이미지 생성 플랫폼입니다. 미드저니나 DALL-E 대비 설치, 실행 및 프롬프트 작성 방법이 다소 복잡합니다. 스테이블 디퓨전은 로컬(자신의 PC)에 직접 설치·실행하는 방법과 구글 클라우드 서버의 GPU/TPU를 이용하는 코랩 사용으로 나누어집니다. 로컬은 별도의 비용이 발생하지 않지만, 고사양의 PC가 요구됩니다. 최소 8GB(12GB 권장)의 VRAM, 최소 16GB(32GB 권장)의 RAM을 요구하고 있습니다. 이번 포스팅에서는 스테이블 디퓨전의 로컬 설치 및 실행 방법을 먼저 살펴보겠습니다.
스테이블 디퓨전의 설치
파이썬의 설치
스테이블 디퓨전을 로컬로 실행하려면, 파이썬을 우선 설치해야 합니다. 다음 링크에서 파이썬을 설치합니다. 최신 버전인 3.12.X를 설치하면, 스테이블 디퓨전 설치 과정에서 오류가 발생합니다. 3.11.8 버전의 설치를 권장합니다.
3.11.8를 선택하고 다음 화면에서 화면 하단의 Windows installer (64-bit)를 다운로드 받습니다.
팝업창 하단의 2가지 옵션 항목을 모두 체크하고 설치합니다.
Git 설치
Github에 있는 스테이블 디퓨전을 다운로드 받으려면, 먼저 GIt을 받아서 설치해야 합니다. (링크) 링크에 접속하여 standalone 버전의 64bit Git for Windows setup을 다운로드 받습니다. 설치 과정에서 다른 옵션은 건드리지 않습니다. Git의 설치가 완료되면, 이제 Github에서 스테이블 디퓨전을 다운로드 받을 준비가 되었습니다.
스테이블 디퓨전 다운로드
이제 Window의 명령 프롬프트를 통해 스테이블 디퓨전을 다운로드 받습니다. 컴퓨터 좌측 하단의 window 아이콘을 누르고, ‘명령 프롬프트’ 또는 ‘CMD’를 입력하여 명령 프롬프트를 실행합니다.
‘C:\users\사용자 이름’을 확인할 수 있습니다. 여기서 CD..을 입력하고 엔터를 누르면 상위 폴더로 이동합니다. 한 번 더 CD..를 입력하고 엔터를 누르면 최종적으로 C 폴더로 이동합니다. 다음 명령어를 입력합니다. 스테이블 디퓨전의 다운로드가 시작됩니다.
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
스테이블 디퓨전 설치
이제 C 드라이브의 C:\stable-diffusion-webui 폴더에서 Webui.bat 파일을 실행하여 스테이블 디퓨전을 설치합니다. 설치에는 상당히 긴 시간이 소요됩니다. 설치가 완료되면 우측 하단에서 IP 주소를 확인할 수 있습니다.
IP 주소를 복사하여, 웹 브라우저의 주소창에 붙여 넣거나, Ctrl을 누른 상태에서 클릭하면 스테이블 디퓨전이 실행됩니다. 스테이블 디퓨전의 UI는 다음과 같습니다. 명령 프롬프트, 네거티브 프롬프트, 각종 옵션과 이미지 생성 창으로 나누어져 있습니다. 한 가지 주의할 점은 스테이블 디퓨전을 실행하는 동안 실행 중인 명령 프롬프트 화면은 종료하지 않아야 합니다.
모델 다운로드 및 적용
모델(Model), 일종의 플러그인을 별도로 적용하지 않으면, 스테이블 디퓨전은 빈 깡통 상태입니다. 주로 적용하는 세 가지 모델은 다음과 같습니다. 모델 다운로드는 CivitAI 사이트를 활용하겠습니다. Checkpoint, VAE, Lora 외에 다양한 모델을 다운로드 받고, 관련 이미지 및 프롬프트를 열람할 수 있습니다. (링크)
- Checkpoint: 이미지의 전반적인 화풍을 결정하는 베이스 모델입니다. (2D/반 실사/실사 모델)
- VAE: 이미지의 질감, 색상 보정, 조명 등에 관여합니다.
- Lora: 특정 동작, 얼굴, 스타일을 이미지에 적용합니다. (ex. 특정 화가의 작화 등)
정리
이번 포스팅에서는 스테이블 디퓨전의 로컬 설치 및 실행에 관해 알아보았습니다. 다음 포스팅에서는 구글 코랩을 활용한 실행 방법을 설명하겠습니다. 두 개의 포스팅을 열람하시고 본인의 PC 사양을 고려하여, 로컬과 코랩 중 한 가지 방법을 선택하시면 됩니다.