바야흐로 생성형 AI의 전성시대다. 글로벌 컨설팅 업체 프리시던스 리서치는 전 세계 생성형 AI 시장 규모가 2022년 107억 9천만 달러(한화 약 14조 3,722억 원)에서 2032년에는 1180억 6천만 달러(한화 약 157조 2,559억 원)에 달할 것으로 전망하고 있다. 특히 2023년부터 2032년까지 생성형 AI 시장은 연평균 27.02% 성장할 것으로 예측했다.

회원가입을 하면 원하는 문장을
저장할 수 있어요!

서비스 기획자는 ‘미드저니’ 이렇게 활용합니다

여행하는 기획자

10분

2024.02.27.

DALL-E2, 미드저니의 차이점은?

미드저니 활용법을 살펴보기에 앞서, 대표적인 이미지 생성형 AI ‘DALL-E2’와 ‘미드저니(Midjourney)’의 특징을 살펴보고자 한다. 먼저 DALL-E2는 높은 해상도와 사실적인 이미지를 도출한다. 1024*1024의 해상도를 지원하면서 기존 DALL-E 초기 모델에 비해 뛰어난 화질을 보여주고 있다. 또한 ‘인페인팅’과 ‘아웃페인팅’ 기능으로 생성된 이미지를 유연하게 편집할 수 있다.

인페인팅 기능은 기존 이미지에 그림자나 반사, 텍스쳐 등의 시각적 요소를 추가할 수 있는 것이고, 추가적으로 아웃페인팅 기능을 구현하여 원본에 그려지지 않은 부분에 요소를 넣거나, 캔버스를 추가해 확장된 형태로 이미지를 생성할 수 있다. 주로 사진처럼 사실적인 이미지를 생성할 수 있어, 해상도 좋은 사진 작업을 할 때 활용하면 편리하다.

미드저니 역시 텍스트 투 이미지 인공지능 모델을 활용한 언어로, 어떤 이미지를 생성하고 싶은지 입력하면 문자를 해석해 이미지로 변환한다. 미드저니는 타 이미지 생성형 AI 대비 디지털 아트워크 제작에 특화되어 있다. 최대 해상도는 1664*1664으로, 일러스트, 카툰부터 특정 도표, 인포그래픽, 지도, 사진까지 다양하게 생성할 수 있다. 특히 명령어만 잘 입력하면 앱, 웹, 차량 대시보드 등 다양한 디바이스의 UI도 콘셉트적으로 쉽게 도출할 수 있어, 아이디어 구상할 때 도움을 받을 수 있다.

서비스 기획자에게 적합한 이미지 생성형 AI 툴은?

나는 작업할 때 주로 미드저니를 사용한다. UI를 만드는 데 있어 다른 도구 대비 뛰어난 결과물을 보여주기 때문이다. 사실 어떤 생성형 AI를 사용할지는 본인의 취향, 그리고 만들고자 하는 작업물 형태에 따라 달라진다. 사실적이고 폭넓은 이미지 편집이 필요하다면 DALL-E2가 더 괜찮은 선택일 수 있다. 예를 들어, 주로 실사와 같은 퍼소나를 제작할 때만 필요하다면 DALL-E2를 사용하거나, 그 외 움보(Wombo), 아트브리더(Artbreeder)와 같이 더 간단하게 사용할 수 있는 툴을 적용해 볼 수도 있다.

만약 고해상도 이미지보다는 무료로 빠르게 다양한 서비스 시나리오를 도출해야 한다면, 크래용(Craiyon)과 같은 생성형 AI가 적합하다. 즉, 어떤 작업을 하느냐에 따라 사용하는 생성형 AI는 달라질 수 있다.

무료로 빠르게 이미지를 생성할 수 있는 Craiyon 사이트 <출처: Craiyon>

이미지 생성형 AI는 어떻게 활용할 수 있을까?

우선 서비스를 기획할 때 필요한 시각화의 거의 모든 과정에서 이미지 생성형 AI 툴을 활용할 수 있다. 기획한 서비스가 필요한 대상 즉, 퍼소나를 가상으로 그려볼 수도 있고, 구체적인 사용 씬을 만들어 볼 수도 있다. 아직 디자인 작업이 되지 않은 상태에서 UI 콘셉트를 도출하는 것도 가능하다. 보고서를 만들 때 심미적으로 유려한 그래프를 제작할 수도 있고, 프레젠테이션 디자인 초안을 만들 수도 있다.

이렇게 시각화를 할 수 있는 전 영역에 걸쳐 이미지 생성형 AI를 활용할 수 있는데, 그중에서 가장 자주 사용하는 프로세스는 ‘퍼소나 제작’과 ‘서비스 시나리오 제작’, ‘앱 UI 제작’에 대한 부분이다. 미드저니를 예로 들면, 아래와 같은 프로세스로 프롬프트를 입력해 사용할 수 있다.

미드저니는 다음과 같은 5단계를 거쳐 사용할 수 있다.

먼저 midjourney.com에 접속한다.
로그인을 해 Discord 계정을 만든다. 미드저니는 다른 생성형 AI와 다르게 Discord 사이트에서 명령어를 입력하는 방식으로 운영하고 있다.
가이드에 따라 Discord 안에서 Midjourney Discord 서버에 가입한다.
가입 후 Newbies 채널을 클릭한다.
'/'를 입력한 뒤 imagine 명령어를 선택해 원하는 프롬프트를 입력한다. (프롬프트는 영어로 입력해야 함)

1) 퍼소나 제작

이제 본격적으로 기획자로서 미드저니를 활용할 수 있는 방법에 대해 살펴보자. 가장 쉽게 접근할 수 있는 방법은 가상의 인물을 제작해 보는 것이다. 내가 기획하고자 하는 서비스를 과연 어떤 사람이 사용할 수 있을까? 생각하는 타깃 고객을 ‘이미지 생성형 AI’에서 생생하게 그려볼 수 있다. 연령층, 직업, 인종, 성별은 물론이고 어떤 옷을 주로 입는지까지 설정해 이미지를 제작할 수 있다.

예를 들어, 베이비시터 매칭 서비스를 만든다고 가정을 해보자. 주 타깃은 30대이고, 아이 돌봄이 절실히 필요한 20, 30대 여성을 위한 시터 매칭 서비스라고 가정해 보았다. 이때 먼저 서비스를 영문으로 소개하는 것이 필요하다. 다음으로 어떤 사람이 주로 사용하는지 입력하면, 머릿속으로 그린 막연한 이미지를 구체적으로 시각화하여 볼 수 있다.

첫 번째 명령어는 서비스 요약 설명을 입력했고, 다음과 같은 결과가 나왔다.

There is a woman in her 30s, in her 20s and 30s, who desperately needs child care.

가사에 치여있다는 맥락은 잘 이해하고 있으나, 대부분 외국 여성 위주로 생성이 되었음을 알 수 있다. 게다가 지쳐있는 얼굴을 보여주고 싶었는데, 4번째 이미지의 경우 지쳐있는 게 아니라 행복한 표정을 보여주고 있다. 그래서 구체적으로 ‘아시아 여성이면서 지쳐 보이는 표정’이라는 명령어를 추가했다.

아까보다는 좀 더 자연스러운 퍼소나가 완성됐다. 이외에도 명령어를 더 추가하면 정면을 바라보게 만들거나, 집안일이 잔뜩 쌓여있는 한가운데 서있게 하거나, 연필 스케치로 변환하는 등의 작업을 진행할 수 있다.

2) 서비스 시나리오 제작

이미지 생성형 AI의 효율을 극대화할 수 있는 또 하나의 방법은 바로 ‘서비스 시나리오 제작’이다. 서비스를 어떤 상황에서, 어떻게 활용할지를 보여줄 때 글로만 설명하던 것을 생성형 AI 모델로 쉽게 제작할 수 있다. 모바일 앱 사용에서는 시나리오를 만들 일이 자주 있진 않지만, 자율주행차, 키오스크, 자율주행 로봇 등 다양한 디바이스에 들어가는 서비스를 기획할 때는 유용하다.

만약 이동 중 차 안에서 갑자기 심장질환 문제가 발생했을 때 긴급 대응할 수 있는 서비스를 만든다고 가정해 보자. 어떻게 서비스가 동작하는지 보여줄 때, 기존에는 서비스를 이해시키기 위해 이미지를 모두 구글링을 통해 수집해 보여주는 형태였다. 그래도 마땅한 자료가 나오지 않을 땐 콘티를 직접 손으로 그려서 보여줬다. 그러나 이제 이미지 생성형 AI를 통해 각 상황별로 쪼개 시각화할 수 있어, 서비스 사용 예시를 훨씬 빠르게 이해시킬 수 있다는 장점이 있다.

3) UI 컨셉 제작

다음 활용 방법은 UI 컨셉 제작이다. 미리 UI 컨셉을 고민한 뒤 디자이너와 소통한다면 훨씬 더 많은 시간과 노력을 아낄 수 있다. 내가 원하는 앱 또는 웹 인터페이스 디자인을 만드는 방법은 크게 2가지다. 먼저 여러 사이트를 둘러보며 관심 있는 디자인을 수집하는 것이다. 벤치마킹하고 싶은 자료를 수집해 놓고, 미드저니에 해당 디자인과 유사한 형태의 디자인을 만들어달라고 할 수 있다. 이때 시각적 참고 자료와 추가 명령어를 함께 제공하면 더욱 정확한 UI를 구현할 수 있다.

이때 명령어는 최대한 구체적으로 작성해야 한다. 사람마다 명령어를 사용하는 방식이 모두 다르겠지만, 나는 OS의 종류, 각도, 분위기, 색상은 명확히 입력하는 편이다. 가급적 생성형 AI가 자체적으로 해석해서 의외의 결과를 얻기보다는, 내가 세세히 옵션을 설정해 원하는 형태로 도출한다.

예를 들어, 아래와 같이 명령어를 입력해 볼 수 있다.

/imagine 내가 벤치마킹하고 싶은 이미지 주소, high-quality UI design, Pharmacy Delivery mobile app, frontview, trending on figma, Behance

나는 dribble.com에서 벤치마킹한 이미지를 찾았고 위 명령어를 활용해 이미지를 생성했다.

https://s.mj.run/6CgkheDPfOo high-quality UI design, Pharmacy Delivery mobile app, frontview, trending on figma, Behance

또 다른 방법은 텍스트로 명령어를 입력하는 것이다. 미드저니의 경우 AI가 상상력을 발휘해 의외의 결과물을 만들도록 하는 세부 설정은 제공하지 않는다. ChatGPT의 경우 ‘플레이그라운드’ 페이지에서 세부적인 설정을 통해 사실적으로 표현할 것인지, 상상력을 발휘할지 등을 미세하게 조정할 수 있다.

그러나 미드저니는 전적으로 텍스트 명령어에 의존한다. AI의 상상력을 발휘하길 원한다면 추상적인 단어를 사용하거나, 텍스트를 최소화하여 사용하고 내가 원하는 결과 형태가 뚜렷하다면 텍스트로 머릿속의 이미지를 세세하게 알려줘야 한다.

미드저니의 경우 쉼표로 구분되는 짧은 문장 형태로 명령하면 효과적이다. 불필요한 단어나 문법이 생략되어 텍스트 이해가 명확해진다. 예를 들어, 헬스케어 앱을 만든다면 짧은 문장 형태로 표현할 수 있다. 헬스케어도 분야가 무척 광범위해서 세분화시키는 것이 중요한데, 아래 예시는 약을 배달해 주는 앱으로 가정했다. 여기에 벤치마킹할 수 있는 사이트까지 추가로 입력해 주면, 다양한 스타일의 앱 콘셉트 화면을 볼 수 있다.

/imagine high-quality UI design, Pharmacy Delivery mobile app, trending on figma, Behance

미드저니에서는 4가지 컨셉 화면을 보여준다. 여기서 옵션을 선택해 원하는 디자인의 화면을 더 확대시켜 품질을 올릴 수 있다. 추가로 디자인을 더 만들어 볼 수도 있다. 원하는 디자인을 도출할 때까지 여러 번 명령어를 입력하여, 최적의 디자인을 만들어내는 과정이 필요하다.

프롬프트 사용 시 주의 사항은?

대부분의 이미지 생성형 AI에서 명령어(프롬프트)를 사용할 때 주의해야 할 점이 있다. 바로 명령어가 구체적이지 않으면 엉뚱한 결과물이 나온다는 것이다. 첫 명령어를 입력한 후, 내가 원하는 결과물이 바로 나올 확률은 매우 적다. 다양한 명령어의 조합과 실행이 필요하다.

명령어는 AI가 해석할 수 있는 여지를 최소화하면 할수록 좋다. 예를 들어, ‘매력적인’, ‘아름다운’, ‘상큼한’처럼 주관적인 표현을 쓰면 해석의 여지가 많아, 인공지능과 명령어를 입력하는 사람과의 괴리가 느껴질 수 있다. 이처럼 주관적인 해석은 최소화하고, 사실적인 명령어를 입력해야 원하는 결과물에 가까워질 수 있다. 예를 들어, 연령대와 인종은 어떤지, 위에서 본 이미지인지, 정면에서 본 이미지인지 같은 내용을 자세히 설명하는 것이다.

한편 연령층의 경우 중년층, 노인 이런 식으로 기술하면 엉뚱한 결과물이 나올 확률이 높다. 요즘엔 노년층이라 할지라도 노인으로 보이지 않는 경우도 있다. 노년층도 스펙트럼이 다양하기 때문에 구체적인 연령층을 명시하거나, 어떤 노인을 지칭하는지 형용사를 함께 붙이는 것도 좋다.

만약 최종 퍼소나가 실사 형태로 나오길 바란다면 DALL-E2를 추천하고, 캐릭터나 일러스트, 판타지스러운 느낌을 원한다면 미드저니로 생성해 보자. 나는 여러 툴을 번갈아 쓰기 귀찮아서 미드저니로 정착해 사용하고 있다.

마치며

이처럼 구체적인 타깃을 떠올리는 과정은 서비스 기획자에게 큰 도움이 된다. 기존에는 구체적인 대상을 시각화하기 위해 이미지를 찾느라 시간을 썼다면, 이제는 다양한 AI 툴을 활용해 누구나 쉽게 제작할 수 있다. 이를 통해 앞으로 더욱 다양한 방식의 제작과 협업이 가능해질 것이다.

다만 아쉬운 점은 2023년 4월부터 미드저니가 유료화되었다는 점이다. 잠시 베타버전을 무료로 활용할 수 있었지만, 이젠 베타버전이 종료되어 무료로 사용할 수 있는 방법은 없다. 아무래도 이미지를 생성하는데 많은 그래픽 처리 장치(GPU)가 필요하므로 유료화는 필수적이었을 것이다. 비록 구독 비용은 들지만 미드저니는 이미지 생성형 AI 중 성능이 뛰어난 편이라, 여전히 많은 사람들에게 사랑받고 있다. 간단히 텍스트를 입력해 원하는 이미지를 제작할 수 있으니 활용 가능성이 매우 높기 때문이다.

또한 미드저니를 활용하면 서비스 기획자와 디자이너의 업무 효율을 높일 수 있다. 그렇다면 생성형 AI가 언젠가 디자이너나 서비스 기획자를 대체할 수도 있을까? 분명 도움은 줄 수 있지만, 사람을 대체하기는 어렵다고 생각한다. 모든 기술과 서비스는 사람을 향해야 하는데 인공지능이 사람의 감수성을 이해하기엔 아직 발전해야 할 것이 더 많기 때문이다.

게다가 때론 답변이나 결과물이 내 뜻대로 도출되지 않는 경우도 있으니, 아직은 시기상조라고 본다. 그러나 인공지능을 잘 활용하는 사람과 그렇지 않은 사람의 격차는 더욱 커질 수도 있다. 비록 AI가 완벽하진 않더라도, 다양한 관점에서 수많은 작업을 빠르게 처리할 수 있기 때문이다. 그러니 서비스 기획자로서 내게 맞는 AI 툴을 찾아, 업무에 틈틈이 활용할 수 있도록 노력해 보자.