본문 바로가기
AI/실무

미드저니 외 3가지 AI 비교분석

by heesangs 2023. 6. 26.

다양한 이미지 생성 AI툴

 

테스트 항목

1. 사진 : 실제와 동일한 이미지를 얼마나 자연스럽게 생성하는가?

2. 캐릭터 : 상상하는 대상을 얼마나 창의적이며 구체적으로 생성하는가?

3. 로고 : 상징성을 가진 이미지 작업도 가능한가? 

4. 추상화 : 특정 작가의 스타일을 얼마나 잘 모방하고 개성있게 생성하는가?

5. 포스터 : 텍스트 + 이미지를 얼마나 잘 구현해 내는가? 

AI별 이미지 생성하기

1) 사진

주제 : 공부하는 학생과 선생님 (A Korean girl high school student studying with a male teacher in the classroom)

평가항목 : 형태, 빛, 표현력, 언어 이해

 

(이미지를 클릭하면 확대해서 볼 수 있어요)

  이미지 형태 표현력 언어 이해 실무 적용
firefly
(Adobe)
  일그러짐 자연스러움 어색함 중.하 사용 고려
뤼튼
(wrtn)

일그러짐 어색함 어색함 사용 고려
달리
(OpenAI)
일그러짐 어색함 어색함 사용 고려
미드저니
(midjourney)
실제 사진 느낌 자연스러움 자연스러움 중.상 사용 권장

 

2) 캐릭터

주제 : 숲속에 바나나를 먹고있는 공 모양의 귀여운 동물 (a cute fluffy orange and green ball animal eating banana in a misty magical forest)

평가항목 : 창의성, 표현력, 언어 이해

  이미지 창의성 표현력 언어 이해 실무 적용
firefly
중.상
(디테일한 묘사 가능)
중.상 사용 권장
wrtn

(낮은 완성도)
사용 고려
Dall-E
중.하
(묘사력 보다는 주제를 잘 반영)
중.상 사용 권장
미드저니
(midjourney)
중.상
(묘사력 및 형태감 이 정확한 편)

(바나나를 인식하지 못함)
사용 권장

 

3) 로고

주제 : water라는 단어를 이용해서 세모 물방울 로고 만들기. (A triangle drop logo using the word water.)

평가항목 : 창의성, 의미 전달력, 언어 이해

  이미지 창의성 의미 전달력 언어 이해 실무적용
firefly

(일반적인 표현력)

(텍스트를 생성해 명확하게 의미를 전달하지만 그래픽 표현력이 낮음)
사용 고려
wrtn

(로고를 실제 오브와 결합)
중.하
(이미지 요소가 무엇을 의미하는지 알기 어려움)
사용 고려
Dall-E

(물방울의 형태와 로고를 합셩켜서 제작)
중.상
(가장 자연스럽게 세모와 물방울을 상징성 있게 표현)
중.상 사용 권장
midjourney
중.하
(일반적인 형태)
중.하
(상대적으로 높은 디테일을 가지지만 너무 직접적인 표현.)

사용 권장

 

 

4) 추상화

주제 : 칸딘스키(추상화 작가) 스타일, 나무로 시간의 흐름을 표현. (Kandinsky style, the flow of time with tree.)

(참고) 칸딘스키 작품

 

 

 

 

 

  이미지 표현력 실무적용
firefly
부분적을 시계의 모양이 표현되어 주제를 반영함.

디테일이 떨어짐. 
사용 고려
wrtn
시간의 표현이 없음.

시간의 흐름이라는 내용이 없이 강렬한 색채를 가진 칸딘스키의 특징만 표현
사용 고려
Dall-E
시간에 대한 표현이 없음.  사용 고려
midjourney
시간의 흐름에 대한 표현과 강렬한 색감표현. 사용 권장

 

5) 포스터디자인

주제 : peaceful 이라는 단어가 들어간 포스터, 풀밭에 모여있는 양들, 푸른산에 걸려있는 구름들, 평화로운 느낌. 

(Posters with the word peaceful, sheep gathering in the grass, clouds hanging in the green mountains, a sense of peace.)

  이미지 표현력 언어 이해도 실무적용
firefly
문자를 그릴 줄 아는 능력이 있지만 그림을 그리는 능력이 떨어짐.  텍스트를 배치해 포스터 사용 고려
wrtn   정확하지 않은 형태와 잘못된 톤조절.  포스터라는 단어를 사진으로 인식하여 표현.  사용 고려
Dall-E
2단 혹은 3단 구성을 통해 포스터를 만들려함. 하지만
객체들의 완성도가 낮음
텍스트를 배치해 포스터 느낌 사용 고려
midjourney
상대적으로 깔끔하고 완성도 있는 형태의 포스터 peaceful 이라는 단어가 없음.
(문자를 그리지 못함)
사용 권장

정리

  사진 캐릭터 로고 추상화 포스터
firefly 사용 고려 사용 권장 사용 고려 사용 고려 사용 고려
wrtn 사용 고려 사용 고려 사용 고려 사용 고려 사용 고려
Dall-E 사용 고려 사용 권장 사용 권장 사용 고려 사용 고려
midjourney 사용 권장 사용 권 사용 권장 사용 권장 사용 권장

 

AI별 장·단점

  장점 단점
firefly
(Adobe)
 - 기능의 다양성 (이미지생성, 스타일변환, 이미지 +텍스트)
 - 사용자 친화적이고 직관적인 UI
 - 포토샵을 활용하면 유용성 최적화 가능.
 - 단어 및 문장의 이해능력이 낮음
 - 완성도 및 다양성이 떨어짐. 
뤼튼
(wrtn)
 - 단순하여 사용하기 편리함. 
 - 빠른편.
 - 완성도 측면에서 실무 사용이 어려움
 - "그려줘"라는 명확한 단어를 사용해야 이미지를 생성.
달리
(OpenAI)
 - 상대적으로 언어인식 능력이 좋음. 
 - 빠른편. 
 - 이미지의 완성도가 낮음.
midjourney  - 작업물의 완성도가 높다. 
 - 세부적인 요구가 가능하다.
 - 느리다.
 - 사용방법에 난이도가 있다. 

 

 

여러 인공지능들이 동일한 프롬프트일때 어떤 결과물을 보여주는지 알아봤다.

특히 미드저니의 결과물은 다른 AI들을 압도하는듯 하다. 

그리고 제작시에 가장 유리한 컨텐츠는 캐릭터 디자인이라 볼 수 있다. 

 

다음엔 가장 성능이 좋은 미드저니로 캐릭터 디자인을 테스트 해보고자 한다. 

목표는 "프로토타입" 이므로 최대한 다양하게 제작해보고, 그에 맞는 스토리를 만들어 보는것이다.

 

먼저 미드저니의 사용법은 다음과 같다. 

파라미터

  • --ar <any> : 비율
  • --chaos <0-100> : 결과값의 다양성
  • --iw : 이미지 프롬프트 가중치를 텍스트 가중치에 상대적 설정.
  • --no : 이미지에서 특정 대상 삭제. 
  • --quality <.25, .5, 1>: 퀄리티를 얼마나 높일지. 높을수록 GPU minute 늘어남.
  • --repeat, --r <1-40>: 단일 프롬프트에서 여러 작업 생성.
  • --seed
  • --stop<10-100>
  • --style <5.1, 5.2> 모델의 버전간의 전환.
  • --stylize, --s : <0 ~ 1000>기본적인 미적 스타일의 작업 영향도. (스케일이 작아지는 영향?)
  • --tile : 반복타일로 사용할  있는 이미지 생성. 
  • --niji : 애니메이션 스타일로 제작.
  • --v <1~5, 5.1, 5.1>

프롬프트 입력방법.

 - 대상, 스타일, 장소(배경), 빛, 분위기(느낌), 카메라(close up), 구체적 행동 및 상황.

 

캐릭터 제작에 필요한 요소들.

  1. 타겟 및 목표 설정
  2. 캐릭터의 형태, 성격, 능력 및 특징, 소유 아이템
  3. 캐릭터들간의 관계 및 스토리

https://heesangs.tistory.com/59

 

디자인 실무 미드저니 캐릭터디자인

소마사고력 수학의 캐릭터디자인을 미드저니를 활용해 만들어봤다. 소마수학은 초등학생들을 대상으로 하는 수학 교육 서비스이다. 학년별로 다양한 캐릭터를 제작했다. 1. 퍼즐 (1~2학년) 2. 수

heesangs.com

 

 

댓글