Midjourney vs DALL-E: 6년차 PM이 1000장 생성하며 발견한 진실

6 min read0 viewsBy Colemearchy
AI 이미지MidjourneyDALL-E프로덕트 매니지먼트AI 도구

1000장의 이미지, 그리고 하나의 깨달음

지난 6개월간 우리 프로덕트의 마케팅 에셋을 만들기 위해 Midjourney로 약 700장, DALL-E로 300장 정도의 이미지를 생성했다. 디자이너 출신으로서 처음엔 "AI가 뭘 안다고"라는 오만함이 있었지만, 지금은 매일 이 도구들 없이는 일하기 힘들어졌다. PM으로서 프로덕트 목업을 만들 때도, 투자 덱을 준비할 때도, 심지어 팀 내부 커뮤니케이션용 비주얼을 만들 때도.

근데 솔직히 말하면, 처음 3주는 완전 재앙이었다. Midjourney로 만든 이미지는 너무 예뻐서 우리 브랜드와 안 맞았고, DALL-E로 만든 건 너무 평범해서 쓸 수가 없었다. 200시간의 시행착오 끝에 내린 결론: 도구의 문제가 아니라 내가 잘못 쓰고 있었다.

이 글은 그 실패의 기록이자, 두 도구를 제대로 이해하게 된 과정에 대한 솔직한 분석이다.

Midjourney: 예술가 vs DALL-E: 디자이너

가장 큰 차이는 이거다. Midjourney는 예술가고, DALL-E는 디자이너다.

디자이너 출신으로서 이 차이가 뭔지 정확히 안다. 예술가는 자기 해석을 넣는다. 디자이너는 클라이언트 요구를 정확히 구현한다. Midjourney에게 "심플한 로고"를 요청하면 자기만의 '심플함'을 해석해서 만들어낸다. 반면 DALL-E는 내가 "빨간 원 안에 검은 글씨"라고 하면 정말 그대로 만든다.

구체적인 수치로 보면:

  • Midjourney: 첫 결과물 만족도 40%, 하지만 예상 밖의 놀라움 80%
  • DALL-E: 첫 결과물 만족도 75%, 하지만 예상 밖의 놀라움 15%

내가 정확히 뭘 원하는지 알 때는 DALL-E가 압도적으로 빠르다. 평균 2.3번의 프롬프트 수정으로 원하는 걸 얻는다. Midjourney는 평균 7.8번. 하지만 그 7.8번의 과정에서 내가 생각하지 못한 방향을 발견할 확률이 높다.

실패 사례: 우리 제품의 히어로 이미지가 필요했다. DALL-E로 정확한 스펙을 주고 만들었는데, 너무 평범해서 CTR이 1.2%밖에 안 나왔다. Midjourney로 "feeling of breakthrough, tech startup energy, blue and purple gradient"라는 추상적 프롬프트로 만든 이미지는 CTR 3.8%. 3배 차이다.

프롬프트 철학의 근본적 차이

PM으로서 가장 흥미로웠던 건 두 도구의 프롬프트 처리 방식이다.

Midjourney:

  • 키워드 중심 사고
  • 순서가 중요함 (앞쪽 키워드에 더 높은 가중치)
  • 스타일 파라미터(--style, --chaos)로 변수 조정
  • 이미지 레퍼런스 믹싱 가능

DALL-E:

  • 자연어 문장 선호
  • 위치 관계 정확도 높음 ("왼쪽에 A, 오른쪽에 B")
  • 수정 기능(inpainting/outpainting) 강력
  • GPT-4와 통합으로 맥락 이해도 상승

디자이너 출신으로서 차이를 체감한 건 '수정' 과정이었다. DALL-E는 "저 부분만 파란색으로 바꿔줘"가 가능하다. Midjourney는 전체를 다시 생성해야 한다. 이건 워크플로우에 엄청난 차이를 만든다.

내가 발견한 최적 프롬프트 패턴:

Midjourney 골든 포뮬러:

[주제] + [스타일 키워드 2-3개] + [분위기 형용사] + [기술적 파라미터] --v 6 --ar 16:9 --style raw

예: "startup office, neon lighting, cyberpunk aesthetic, professional photography, depth of field --v 6 --ar 16:9 --style raw --chaos 20"

DALL-E 골든 포뮬러:

[정확한 장면 설명] + [구체적 위치 관계] + [색상/재질] + [조명/분위기]

예: "A modern startup office interior. In the foreground, a wooden desk with a MacBook on the left and a coffee cup on the right. Soft natural light from large windows. Minimalist style with green plants."

비용과 속도: 현실적인 비교

PM으로서 가장 신경 쓰이는 부분. 실제 사용 데이터 기반 분석:

Midjourney:

  • 월 $30 (스탠다드 플랜) - 무제한 생성 (Relaxed 모드)
  • Fast 모드: 월 15시간
  • 평균 생성 시간: 60초 (Fast), 10분 (Relaxed)
  • GPU 시간당 실질 비용: $2/hr 수준

DALL-E:

  • 크레딧 기반: 115 크레딧에 $15
  • 1024x1024 이미지 1장 = 1 크레딧
  • 평균 생성 시간: 10-15초
  • 이미지당 실질 비용: $0.13

계산해보면 재미있다. 내가 한 달에 약 200장의 최종 이미지를 얻기 위해:

  • Midjourney: 약 700장 생성 (재시도 포함) = $30
  • DALL-E: 약 300장 생성 (재시도 포함) = $39

하지만 시간 비용을 넣으면:

  • Midjourney: 약 25시간 소요
  • DALL-E: 약 8시간 소요

스타트업 PM의 시급을 최저 $50으로 잡아도, Midjourney는 $1,280의 시간 비용, DALL-E는 $439. 여기에 월 구독료를 더하면 실질 비용은 Midjourney가 훨씬 비싸다.

근데 왜 나는 여전히 Midjourney를 더 많이 쓸까? 그 700장 중에 예상 못 한 결과물이 나오는 '세렌디피티' 때문이다. 이건 돈으로 환산할 수 없는 가치다.

실전 사용 가이드: 언제 무엇을 쓸 것인가

6개월간의 시행착오를 정리한 실전 매트릭스:

DALL-E를 써야 하는 경우:

  1. 정확한 레이아웃이 필요할 때 - 프레젠테이션 슬라이드, 목업, 다이어그램
  2. 빠른 반복이 중요할 때 - 데드라인 촉박한 마케팅 에셋
  3. 텍스트가 포함될 때 - DALL-E 3의 텍스트 렌더링이 압도적으로 우수
  4. 일관성이 중요한 시리즈물 - 같은 스타일 유지가 상대적으로 쉬움
  5. 부분 수정이 필요할 때 - Inpainting 기능 활용

Midjourney를 써야 하는 경우:

  1. 브랜드 이미지/히어로 이미지 - 예술적 퀄리티 필요
  2. 컨셉 탐색 단계 - 다양한 방향성 실험
  3. 분위기가 중요한 이미지 - 감성적 임팩트
  4. 대량 생성이 필요할 때 - 무제한 Relaxed 모드
  5. 레퍼런스 믹싱 - 여러 이미지 스타일 결합

내가 실제로 하는 방식:

  1. 컨셉 단계: Midjourney로 20-30개 방향 탐색
  2. 방향 확정: DALL-E로 정확한 실행
  3. 최종 디테일: Photoshop으로 손봄 (여전히 필요함)

디자이너 출신이 보는 AI 도구의 미래

솔직히 고백하면, 처음 이 도구들을 접했을 때 위협을 느꼈다. 6년간 디자인 감각을 갈고닦았는데, AI가 10초 만에 더 나은 결과를 내는 걸 보면서.

하지만 200시간을 쓰고 나니 깨달았다. 이건 디자이너를 대체하는 게 아니라, 디자인 리터러시의 민주화다. PM으로서 이제 디자이너에게 "이런 느낌"이라고 말하는 대신, 직접 만들어서 "이런 거요"라고 보여줄 수 있다. 커뮤니케이션 비용이 80% 줄었다.

예상하는 6개월 후:

  • Midjourney와 DALL-E의 품질 격차는 더 좁혀질 것
  • 하지만 철학적 차이는 유지될 것 (그래야 각자 존재 이유가 있음)
  • 진짜 경쟁자는 Adobe Firefly 같은 '기존 워크플로우 통합형' 도구

디자이너 출신으로서 조언: AI 도구를 배우는 건 Photoshop 배우는 것과 같다. 도구를 안다고 디자이너가 되는 게 아니라, 디자인 센스가 있는 사람이 도구를 만나면 더 강력해지는 것. PM이든 개발자든 마케터든, 이 도구들을 배워야 한다. 선택이 아니라 필수다.

지금 당장 시작하는 법

이론은 여기까지. 실천 가이드:

Week 1: DALL-E부터 시작

  • ChatGPT Plus 구독 ($20, DALL-E 포함)
  • 매일 5개씩 간단한 이미지 생성 연습
  • 목표: 자연어 프롬프트 감 잡기

Week 2-3: Midjourney 탐험

  • 베이직 플랜 ($10)
  • Discord 들어가서 다른 사람들 프롬프트 관찰 (이게 진짜 학습법)
  • /describe 커맨드로 기존 이미지 역공학

Week 4: 실전 프로젝트

  • 실제 업무에서 필요한 이미지 1개 선택
  • 두 도구로 각각 10번씩 시도
  • 결과 비교하고 왜 차이가 나는지 분석

내가 즐겨쓰는 리소스:

  • Midjourney 프롬프트 북: prompthero.com
  • DALL-E 가이드: platform.openai.com/docs
  • 스타일 레퍼런스: reddit.com/r/midjourney

핵심은 이거다: 100개 만들어봐야 감이 온다. 처음 50개는 쓰레기일 거다. 나도 그랬다. 하지만 51번째부터 뭔가 보이기 시작한다.

결론: 둘 다 구독하는 이유

지금 내 지갑에서 매달 나가는 돈: Midjourney $30 + ChatGPT Plus(DALL-E 포함) $20 = $50.

6개월 전의 나는 "둘 중 하나만 쓰면 되지 않나?"라고 생각했다. 지금의 나는 "둘 다 없으면 일을 못 한다"고 말한다.

PM으로서, 디자이너 출신으로서, 그리고 AI 스타트업에서 일하는 사람으로서 - 이 도구들은 이제 Figma나 Notion처럼 기본 스택이 됐다. 선택의 문제가 아니라 언제 무엇을 쓰느냐의 문제다.

당신이 오늘 해야 할 일:

  1. 두 도구 중 하나 구독하기 (추천: 먼저 ChatGPT Plus)
  2. 이 글에서 언급한 프롬프트 포뮬러 하나 복사하기
  3. 지금 당장 이미지 10개 만들어보기

실패할 거다. 처음 10개는 형편없을 거다. 괜찮다. 11번째부터 당신은 다른 사람이 될 테니까.


이 글의 모든 수치는 2024년 1월 기준, 실제 사용 데이터 기반입니다. 썸네일 이미지는 Midjourney v6로 제작했고, 프롬프트 예시 이미지는 DALL-E 3로 만들었습니다. 아이러니하게도, 둘 다 첫 시도에서 나온 게 아니라 각각 4번, 2번째 시도였습니다.

Midjourney vs DALL-E 비교: 6년차 PM의 200시간 실사용 후기