Chat GPT의 유료 구독, 즉 GPT-4를 이용하면 이미지 생성 AI인 DALL-E 3를 무료로 이용할 수 있습니다. 미드저니나 스테이블 디퓨전같이 사전 지식이나 복잡한 프롬프트 작성 규칙은 필요하지 않습니다. 이번 포스팅에서는 DALL-E 3로 이미지를 생성하는 방법을 알아보겠습니다.
DALL-E의 사용 방법
DALL-E 3의 이미지 크기는 3가지로 나누어집니다. 1,792 x 1,024, 1,024 x 1,792, 1,024 x 1,024의 크기로 이미지를 생성할 수 있습니다. 각각 풍경화, 초상화, 기본 크기입니다. 더불어 DALL-E의 특징으로 텍스트를 구현하는 능력이 좋다고 알려져 있습니다. 지금부터 세 가지 방법으로 이미지를 생성하고 텍스트도 삽입해 보겠습니다.
이미지 생성(프롬프트 작성)
우선 간단하게 프롬프트를 작성하여 이미지를 생성할 수 있습니다. 슈퍼 히어로를 하나 그려 보겠습니다. 프롬프트는 다음과 같습니다.
그래픽 노블 형식의 슈퍼 히어로를 하나 그려줄래, 어두운 색상의 복장을 하고 도심에 서 있는 모습이면 좋겠어. 전신 이미지로 그려주고 이미지 크기는 1,024 x 1,792로 해 줘.
다음과 같은 이미지가 생성되었습니다. 좌측 이미지는 첫 번째 이미지입니다. 이미지의 품질이나 디테일이 다소 아쉽다고 생각되어, 좀 더 사실적이고 섬세한 고품질의 이미지를 요청하였습니다. 우측 이미지는 요청을 반영한 두 번째 이미지입니다.
이미지 생성(업로드)
Chat GPT-4는 파일 첨부 기능을 가지고 있습니다. 첨부 기능은 각종 문서 파일의 분석 및 이미지 업로드에 사용합니다. 상기 이미지를 참조하여 이미지의 생성을 요청하겠습니다. 추가 변경/수정 사항이 있다면, 이미지를 첨부하고 프롬프트에 반영하시면 됩니다. 좌측 이미지를 첨부하고, 망토와 마스크를 요청해 보겠습니다.
이미지 생성(프롬프트 추출)
기존 이미지에서 프롬프트를 추출하여, 이미지를 생성할 수도 있습니다. 참조할 이미지를 첨부하고 프롬프트 작성을 요청합니다. 추출된 프롬프트는 다음과 같습니다.
프롬프트를 사용하여 생성한 이미지는 다음과 같습니다.
이미지 생성(텍스트 삽입)
이제 텍스트를 넣겠습니다. 검은 복장에 어울리게 Dark Messenger라는 텍스트를 이미지에 삽입하겠습니다. 여러 번 시도했지만, 생각보다 텍스트가 잘 구현되지 않습니다. 이미지는 다음과 같습니다.
후기
전반적으로 DALL-E 3의 이미지 품질은 미드저니나 스테이블 디퓨전에 미치지 못합니다. 다만 간단한 프롬프트로 쉽게 이미지를 생성할 수 있다는 장점이 있습니다. 더불어 Chat GPT를 구독하면, 별도의 비용 없이 이용할 수 있습니다. 이런 점들을 감안하면 가볍게 이미지를 생성하는 용도로 활용하기에는 충분한 것 같습니다.