미드저니란?
미드저니(Midjourney)는 텍스트 프롬프트를 시각 예술로 변환하는 생성형 AI 도구다. DALL-E와 스테이블 디퓨전(Stable Diffusion)과 같은 유명한 도구들과 함께 머신러닝 기반 이미지 생성 분야에서 인정을 받고 있다.
미드저니는 사용자 친화적인 접근 방식을 통해 차별화된다. 디스코드(Discord) 채팅 앱 내에서 작동하며 최소한의 설정만이 필요하기 때문에 광범위한 사용자층이 이용할 수 있다.
자체적으로 자금을 조달한 이 프로젝트는, 간단한 텍스트 입력만으로도 매력적인 이미지를 생성하는 능력을 보여주며 크리에이티브 산업에서 AI의 성장 잠재력을 보여주고 있다.
미드저니 모델 설명
미드저니는 여러 버전의 모델을 제공해왔다. 최신 모델인 버전 5.2는 2023년 6월에 출시되었으며 이미지 품질이 개선되고 이해도가 높아진 것으로 알려져 있다.
2023년 5월에 출시된 모델 버전 5.1은 일관성을 개선하고 아티팩트를 줄였다.
또한 사실적인 결과에 중점을 둔 모델 버전 5.0과 생물, 장소, 객체 지식에 중점을 둔 모델 버전 4도 있다.
더불어 미드저니와 스펠브러시(Spellbrush)의 협업으로 탄생한 니지(Niji) 모델 5는 애니메이션과 일러스트레이션 스타일에 특화된 모델이다. 사용자는 이 두 모델을 전환하여 다양한 예술적 결과물을 얻을 수 있다.
미드저니의 작동 방식
미드저니는 인공지능(AI)과 창의적 표현의 교차점에서 작동하며, 고급 기술을 활용하여 텍스트 프롬프트를 시각적 예술 작품으로 변환한다.
기술적 관점에서 보면 미드저니는 텍스트 프롬프트를 시각 데이터로 변환하는 확산 프로세스를 사용한다. 이 과정은 머신러닝(ML)과 생성형 AI 기술을 기반으로 하며, 이미지의 해상도와 품질을 점진적으로 향상시켜 예술가와 창작자에게 유용한 도구가 된다.
미드저니로 아트 창작하기
미드저니를 효과적으로 활용하려면 다음 단계를 따라야 한다:
- 가입: 웹 및 데스크톱 애플리케이션으로 제공되는 다용도 커뮤니케이션 플랫폼인 디스코드(Discord)에 가입한다.
- 미드저니 참여: 디스코드에서 미드저니 서버에 접속하고, “초보자(newbies)” 방 중 하나에 들어간다.
- 프롬프트 작성: “/imagine” 명령을 사용하여 생성고자 하는 이미지를 설명하는 텍스트 프롬프트를 입력한다.
- 이미지 생성: 미드저니는 입력한 프롬프트를 기반으로 네 개의 고유한 이미지를 생성한다.
- 옵션 탐색: 선택한 이미지를 업스케일하거나 변형을 탐색할 수 있는 옵션이 있어, 창의적인 실험을 할 수 있다.
미드저니 플랫폼은 이미지 생성 경험을 향상시키기 위해 두 가지 기능을 제공한다:
- 업스케일: 미드저니에서 생성된 각 이미지를 더 높은 해상도로 업스케일링하여 더 세밀한 디테일을 포착할 수 있다.
- 변형: 프롬프트에 대한 다른 해석을 탐색할 수 있는 변형 기능을 통해 창의적 탐색과 다양한 결과를 얻을 수 있다.
미드저니 V5
위에서 언급한 바와 같이, 미드저니는 최근 V5 버전을 출시하여 기능과 사용자 경험을 향상시켰다. 이 버전은 다음과 같은 기능을 제공한다:
- 자연어 프롬프트에 대한 이해력 향상
- 더 높은 해상도 및 품질 출력
- 더 다양한 스타일 범위
- 두 가지 활용 방법: 프롬프트에 V5 명령 추가 또는 디스코드에서 “/settings” 명령 사용
저작권 문제
미드저니에서 제작한 이미지를 포함하여 AI가 생성한 이미지와 관련하여 저작권 문제가 발생했다. 미국 저작권청은 AI 이미지 생성기로 생성된 저작물에 대한 저작권 보호를 재평가했다.
주목할 만한 사례로, 미국 저작권청은 미드저니를 사용하여 생성된 이미지가 등장하는 “Zarya of the Dawn”이라는 만화책에 대한 저작권 등록을 부분적으로 취소했다.
논란의 핵심은 인간의 저작물이 아닌 AI 생성 이미지가 저작권을 가질 수 있는지 여부였다. 이번 저작권청의 결정은 AI가 생성한 예술의 법적 지위와 저작권법에 미칠 잠재적 영향에 대한 질문을 제기한다.
결론
미드저니는 아티스트와 크리에이터 지망생에게 접근 가능한 출발점을 제공한다. 하지만 무료 평가판을 제공하는 일부 이미지 생성기와 달리, 이 앱은 등록 시 결제가 필요하다.
또한 미드저니가 이미지 생성이 가능한 유일한 AI 모델도 아니다. 각기 고유한 기능과 강점을 가진 다른 여러 AI 기반 이미지 생성기가 존재한다.
미드저니의 주요 경쟁사는 다음과 같다:
- 스테이블 디퓨전(Stable Diffusion)
- 달리2(DALL-E 2)
- 레오나르도 AI(Leonardo.Ai)
- 빙 이미지 크리에이터(Bing Image Creator)