지난 12월 말, 새로운 미드저니의 모델 버전인 V6의 알파 버전이 소개되었습니다. 알파 버전은 일종의 테스트 버전을 말합니다. 그렇기 때문에 최종 버전이 나오기 전까지 업데이트나 수정이 있을 수 있습니다. 이번 포스팅에서는 기존 버전(V5.2)과 V6가 어떤 차이점이 있는지 알아보겠습니다.
미드저니 V6의 주요 변경 사항
V6의 주요 변경 사항은 디스코드 화면에서 미드저니 서버를 클릭합니다. 그리고 announcements를 선택합니다. 2023. 12. 21일 기준으로 공지가 V6에 관한 공지가 올라와 있습니다. 주요 내용을 요약해 보겠습니다.
- 길게 작성된 프롬프트도 잘 이해함
- 향상된 그림의 일관성 및 모델의 지식 개선
- 이미지 내에 텍스트를 구현하는 능력이 개선
- 이미지의 업스케일링 기능에 subtle, creative 기능이 추가
- V6에서는 프롬프트 작성을 다시 배워야 할 수도 있다.
- 프롬프트에 대한 이미지 생성의 민감성이 높아졌다.
- 사실적인 이미지를 생성하려면, 미학적인 표현의 강도인 style을 낮춰야 한다.
- style 강도를 낮추는 옵션인 style raw를 활용한다.
- stylize 옵션을 낮추면 프롬프트에 충실한 이미지가 생성됨 / 높이면 미학적인 표현이 강화됨
- 현재 V6는 알파버전이기 때문에 별도의 공지 없이 수정될 수 있다.
- V6는 기존 버전 대비 다소 느린 이미지 생성 속도를 보이지만, 이후 최적화를 통해 개선될 예정
미드저니 V6 이미지 생성
이미지 생성(인물 사진)
V6는 사실적인 이미지 생성에 강점에 있다고 합니다. 우선 V5.2를 사용하여 이미지를 생성하고, V6로 이미지를 생성하여 비교해 보겠습니다. 프롬프트는 photorealistic, a marathon runner running hard, close-up입니다. 생성한 이미지는 다음과 같습니다.
이제 V6에서 동일한 프롬프트로 이미지를 생성하겠습니다. V6로 변경하려면 설정에서 옵션을 변경해야 합니다. 상단의 버전을 V6로 수정하고, Raw mode를 선택합니다. 마지막으로 stylize low를 선택합니다.
생성된 이미지는 다음과 같습니다. 다소 만족스럽지 못한 부분도 있지만, 땀, 주름, 피부 질감 등 전반적으로 V5.2 대비 사실적인 이미지가 생성되었습니다.
이미지 생성(풍경 사진)
이제 V5.2의 풍경 사진을 생성하겠습니다. 프롬프트는 photorealistic, an image of white cliff, a few boats ‐‐ar 3:2입니다. 개인적으로 생각하기에 상당히 준수한 이미지가 생성되었습니다.
다음으로 V6에서 생성한 풍경 사진입니다. V5.2에서 생성한 이미지도 상당히 품질이 좋다고 생각했지만, 구름의 표현, 절벽의 세부 묘사에서 V6가 훨씬 압도적인 것을 확인할 수 있습니다.
이미지 생성(텍스트 구현)
이번에는 공지에서 언급한 텍스트 구현 능력을 살펴보겠습니다. V5.2의 텍스트 구현 능력은 그다지 평이 좋지 않기 때문에, V6의 이미지만 생성하겠습니다. 사용 방법은 이미지에 표현하고자 하는 텍스트를 큰따옴표로 감싸서 표현하면 됩니다. 프롬프트는 photorealistic, an NBA player attempting to dunk, wearing a jersey with “clippers” on the chest ‐‐ar 2:3입니다. 생성된 4장의 이미지가 모두 완벽하지는 않지만, 텍스트 구현 능력은 상당히 만족스럽습니다.
후기
인물 사진, 풍경 사진을 생성해 본 결과는 이미지의 품질 및 디테일에서 V6가 V5.2 대비 압도적이라고 생각합니다. 특히 이미지의 세부 묘사가 매우 뛰어납니다. 텍스트 구현 능력도 여러 번의 시행착오가 필요 없을 정도로 잘 반영됩니다. 아직 알파 버전이기 때문에 정식 버전이 출시되면 추가적인 개선의 여지가 있습니다. 다만 이미지의 생성 속도에 약간 아쉬움이 있습니다. 이미지 생성 속도는 요금과 관련이 있기 때문에 이후 최적화를 기대해 보겠습니다.