테스트 항목
1. 사진 : 실제와 동일한 이미지를 얼마나 자연스럽게 생성하는가?
2. 캐릭터 : 상상하는 대상을 얼마나 창의적이며 구체적으로 생성하는가?
3. 로고 : 상징성을 가진 이미지 작업도 가능한가?
4. 추상화 : 특정 작가의 스타일을 얼마나 잘 모방하고 개성있게 생성하는가?
5. 포스터 : 텍스트 + 이미지를 얼마나 잘 구현해 내는가?
AI별 이미지 생성하기
1) 사진
주제 : 공부하는 학생과 선생님 (A Korean girl high school student studying with a male teacher in the classroom)
평가항목 : 형태, 빛, 표현력, 언어 이해
(이미지를 클릭하면 확대해서 볼 수 있어요)
이미지 | 형태 | 빛 | 표현력 | 언어 이해 | 실무 적용 | |
firefly (Adobe) |
일그러짐 | 자연스러움 | 어색함 | 중.하 | 사용 고려 | |
뤼튼 (wrtn) |
일그러짐 | 어색함 | 어색함 | 중 | 사용 고려 | |
달리 (OpenAI) |
일그러짐 | 어색함 | 어색함 | 중 | 사용 고려 | |
미드저니 (midjourney) |
실제 사진 느낌 | 자연스러움 | 자연스러움 | 중.상 | 사용 권장 |
2) 캐릭터
주제 : 숲속에 바나나를 먹고있는 공 모양의 귀여운 동물 (a cute fluffy orange and green ball animal eating banana in a misty magical forest)
평가항목 : 창의성, 표현력, 언어 이해
이미지 | 창의성 | 표현력 | 언어 이해 | 실무 적용 | |
firefly | 중.상 | 상 (디테일한 묘사 가능) |
중.상 | 사용 권장 | |
wrtn | 상 | 하 (낮은 완성도) |
하 | 사용 고려 | |
Dall-E | 중 | 중.하 (묘사력 보다는 주제를 잘 반영) |
중.상 | 사용 권장 | |
미드저니 (midjourney) |
중.상 | 상 (묘사력 및 형태감 이 정확한 편) |
중 (바나나를 인식하지 못함) |
사용 권장 |
3) 로고
주제 : water라는 단어를 이용해서 세모 물방울 로고 만들기. (A triangle drop logo using the word water.)
평가항목 : 창의성, 의미 전달력, 언어 이해
이미지 | 창의성 | 의미 전달력 | 언어 이해 | 실무적용 | |
firefly | 하 (일반적인 표현력) |
중 (텍스트를 생성해 명확하게 의미를 전달하지만 그래픽 표현력이 낮음) |
중 | 사용 고려 | |
wrtn | 중 (로고를 실제 오브와 결합) |
중.하 (이미지 요소가 무엇을 의미하는지 알기 어려움) |
하 | 사용 고려 | |
Dall-E | 상 (물방울의 형태와 로고를 합셩켜서 제작) |
중.상 (가장 자연스럽게 세모와 물방울을 상징성 있게 표현) |
중.상 | 사용 권장 | |
midjourney | 중.하 (일반적인 형태) |
중.하 (상대적으로 높은 디테일을 가지지만 너무 직접적인 표현.) |
중 | 사용 권장 |
4) 추상화
주제 : 칸딘스키(추상화 작가) 스타일, 나무로 시간의 흐름을 표현. (Kandinsky style, the flow of time with tree.)
(참고) 칸딘스키 작품
이미지 | 표현력 | 실무적용 | |
firefly | 부분적을 시계의 모양이 표현되어 주제를 반영함. 디테일이 떨어짐. |
사용 고려 | |
wrtn | 시간의 표현이 없음. 시간의 흐름이라는 내용이 없이 강렬한 색채를 가진 칸딘스키의 특징만 표현 |
사용 고려 | |
Dall-E | 시간에 대한 표현이 없음. | 사용 고려 | |
midjourney | 시간의 흐름에 대한 표현과 강렬한 색감표현. | 사용 권장 |
5) 포스터디자인
주제 : peaceful 이라는 단어가 들어간 포스터, 풀밭에 모여있는 양들, 푸른산에 걸려있는 구름들, 평화로운 느낌.
(Posters with the word peaceful, sheep gathering in the grass, clouds hanging in the green mountains, a sense of peace.)
이미지 | 표현력 | 언어 이해도 | 실무적용 | |
firefly | 문자를 그릴 줄 아는 능력이 있지만 그림을 그리는 능력이 떨어짐. | 텍스트를 배치해 포스터 | 사용 고려 | |
wrtn | 정확하지 않은 형태와 잘못된 톤조절. | 포스터라는 단어를 사진으로 인식하여 표현. | 사용 고려 | |
Dall-E | 2단 혹은 3단 구성을 통해 포스터를 만들려함. 하지만 객체들의 완성도가 낮음 |
텍스트를 배치해 포스터 느낌 | 사용 고려 | |
midjourney | 상대적으로 깔끔하고 완성도 있는 형태의 포스터 | peaceful 이라는 단어가 없음. (문자를 그리지 못함) |
사용 권장 |
정리
사진 | 캐릭터 | 로고 | 추상화 | 포스터 | |
firefly | 사용 고려 | 사용 권장 | 사용 고려 | 사용 고려 | 사용 고려 |
wrtn | 사용 고려 | 사용 고려 | 사용 고려 | 사용 고려 | 사용 고려 |
Dall-E | 사용 고려 | 사용 권장 | 사용 권장 | 사용 고려 | 사용 고려 |
midjourney | 사용 권장 | 사용 권장 | 사용 권장 | 사용 권장 | 사용 권장 |
AI별 장·단점
장점 | 단점 | |
firefly (Adobe) |
- 기능의 다양성 (이미지생성, 스타일변환, 이미지 +텍스트) - 사용자 친화적이고 직관적인 UI - 포토샵을 활용하면 유용성 최적화 가능. |
- 단어 및 문장의 이해능력이 낮음 - 완성도 및 다양성이 떨어짐. |
뤼튼 (wrtn) |
- 단순하여 사용하기 편리함. - 빠른편. |
- 완성도 측면에서 실무 사용이 어려움 - "그려줘"라는 명확한 단어를 사용해야 이미지를 생성. |
달리 (OpenAI) |
- 상대적으로 언어인식 능력이 좋음. - 빠른편. |
- 이미지의 완성도가 낮음. |
midjourney | - 작업물의 완성도가 높다. - 세부적인 요구가 가능하다. |
- 느리다. - 사용방법에 난이도가 있다. |
여러 인공지능들이 동일한 프롬프트일때 어떤 결과물을 보여주는지 알아봤다.
특히 미드저니의 결과물은 다른 AI들을 압도하는듯 하다.
그리고 제작시에 가장 유리한 컨텐츠는 캐릭터 디자인이라 볼 수 있다.
다음엔 가장 성능이 좋은 미드저니로 캐릭터 디자인을 테스트 해보고자 한다.
목표는 "프로토타입" 이므로 최대한 다양하게 제작해보고, 그에 맞는 스토리를 만들어 보는것이다.
먼저 미드저니의 사용법은 다음과 같다.
파라미터
- --ar <any> : 비율
- --chaos <0-100> : 결과값의 다양성
- --iw : 이미지 프롬프트 가중치를 텍스트 가중치에 상대적 설정.
- --no : 이미지에서 특정 대상 삭제.
- --quality <.25, .5, 1>: 퀄리티를 얼마나 높일지. 높을수록 GPU minute 늘어남.
- --repeat, --r <1-40>: 단일 프롬프트에서 여러 작업 생성.
- --seed
- --stop<10-100>
- --style <5.1, 5.2> 모델의 버전간의 전환.
- --stylize, --s : <0 ~ 1000>기본적인 미적 스타일의 작업 영향도. (스케일이 작아지는 영향?)
- --tile : 반복타일로 사용할 수 있는 이미지 생성.
- --niji : 애니메이션 스타일로 제작.
- --v <1~5, 5.1, 5.1>
프롬프트 입력방법.
- 대상, 스타일, 장소(배경), 빛, 분위기(느낌), 카메라(close up), 구체적 행동 및 상황.
캐릭터 제작에 필요한 요소들.
- 타겟 및 목표 설정
- 캐릭터의 형태, 성격, 능력 및 특징, 소유 아이템
- 캐릭터들간의 관계 및 스토리
https://heesangs.tistory.com/59
'AI > 실무' 카테고리의 다른 글
AI로 인한 디자이너의 직군 변화 (1) | 2024.11.12 |
---|---|
미드저니 프롬프트 v6 (0) | 2024.01.12 |
chat GPT 전문가처럼 활용하기 :: (0) | 2023.12.22 |
디자인 실무 미드저니 캐릭터디자인 (0) | 2023.08.05 |
댓글