이번 포스팅에서는 그동안 작성한 스테이블 디퓨전 관련 포스팅을 총정리하겠습니다. 개별 글의 소제목을 클릭하면, 해당 글로 이동할 수 있습니다. 이후에 스테이블 디퓨전 관련 글을 작성하면 본문 내용을 업데이트하겠습니다.
스테이블 디퓨전의 사용법 총정리
설치 및 실행 (로컬)
로컬은 PC에 스테이블 디퓨전을 설치하고 실행하는 방법입니다. 별도의 비용이 들지 않지만, 어느 정도 컴퓨터의 사양이 요구됩니다. 최소 8GB(12GB 권장)의 VRAM, 최소 16GB(32GB 권장)의 RAM을 요구하고 있습니다.
코랩 실행 방법
구글 클라우드 서버인 코랩을 활용한 스테이블 디퓨전의 실행 방법을 정리하였습니다. 구글 코랩과 구글 드라이브 사용을 위한 비용이 발생합니다.
모델의 적용
스테이블 디퓨전의 이미지에 다양한 화풍/동작/자세/조명 등을 부여하는 모델을 적용하는 방법을 설명하였습니다. 일종의 플러그인이라고 생각하시면 됩니다.
이미지 생성
세 가지 주요 모델(Checkpoint, Lora, VAE)을 적용하고, 이미지를 생성하는 방법을 설명하였습니다. 우선 플러그인 공유 사이트인 CvitiAI의 갤러리에서 프롬프트를 참조하여 이미지를 생성하는 것을 추천합니다.
각종 옵션의 설정
이미지를 생성할 때 사용하는 각종 옵션의 설정을 설명하였습니다. 옵션 항목에는 sampling method(이미지 생성 알고리즘), 이미지의 크기, 동시에 생성하는 이미지의 숫자, seed 번호 등이 있습니다.
프롬프트 문법
동일한 프롬프트라도 문법에 따라 이미지가 크게 변하기 때문에, 프롬프트 문법은 프롬프트 작성에 있어서 매우 중요합니다. 표현(태그)의 배치 순서, 괄호 사용, 가중치 부여 등의 내용을 설명하였습니다.
Img-2-Img 기능의 활용
Img-2-Img는 기존의 이미지를 토대로 새로운 이미지를 생성하는 기능입니다. 원본 이미지를 활용하여 새로운 이미지를 생성할 때 유용합니다.
이미지의 업스케일링
총 세 가지(extras, Img-2-Img, Txt-2-Img)의 이미지 업스케일링 방법이 있습니다. 각각을 설명하고, 개인적으로 생각하는 최적의 업스케일링 방법을 추천하였습니다.
프롬프트 표현(품질/매체/스타일/시점)
이미지의 품질을 결정하는 표현, 사용된 매체 및 도구, 스타일 및 대상을 바라보는 시점 표현을 정리하겠습니다. 각각의 항목은 스테이블 디퓨전에서 이미지를 묘사하는 중요한 표현(태그)입니다.
프롬프트 표현(대상의 세부 묘사)
이번 포스팅에서는 이미지에 등장하는 대상 및 사물을 세부 묘사하는 프롬프트 표현을 설명하였습니다. 인종, 체형, 피부, 머리카락, 눈에 관련된 표현입니다.
프롬프트 표현(표정과 동작)
이번 포스팅에서는 대상의 표정과 손과 팔 / 발과 다리 동작을 묘사하는 프롬프트 표현을 설명하였습니다.
프롬프트 표현(복장)
복장(상의), 복장(하의)을 묘사하기 위한 표현을 정리하였습니다.
복장(기타 항목)
모자, 각종 장식, 신발 등의 표현을 설명하겠습니다. 유용하다고 생각되는 표현 위주로 정리하였습니다.
네거티브 프롬프트의 사용 방법
스테이블 디퓨전으로 이미지를 생성할 때, 예상치 않은 여러 가지 오류가 발생합니다. 두 개 이상의 팔다리가 생성되거나, 6개 이상의 손가락이 생성되는 등 원치 않는 이미지가 생성되는 경우가 빈번합니다. 이런 오류를 방지 및 수정하기 위해 사용하는 것이 네거티브 프롬프트입니다.
정리
앞에서 언급한 것처럼 스테이블 디퓨전 관련 글을 추가로 작성하면, 본문 내용을 업데이트하겠습니다.