ChatGPT, 새로운 이미지 생성의 판도를 바꾸다

관리자

ChatGPT, 새로운 이미지 생성의 판도를 바꾸다

AI 도구에 대한 열광은 주로 이미지 생성기에 집중되는데, 이는 정의상 시각적으로 더 흥미롭고 시연하기 좋기 때문입니다. OpenAI는 최근 ChatGPT에 새로운 이미지 생성기를 추가하며 이를 증명했습니다.

이 새로운 모델은 OpenAI의 표준 AI 이미지 생성기인 DALL-E 3의 업그레이드가 아니라 완전히 새로운 기술입니다.

이 기사의 초반에 너무 많이 드러내고 싶지 않지만, 새로운 이미지 생성기는 꽤 인상적인 예술을 만듭니다. DALL-E의 30초 이하의 생성 시간에 비해 몇 분이 걸리기도 하지만, 결과는 확실합니다.

사실 너무 훌륭해서 문제가 될 정도입니다. 인간 예술가의 스타일을 너무 가까울 정도로 모방하기 때문입니다. 그럼에도 불구하고, 저는 몇 가지 프롬프트를 통해 두 모델을 비교해 보기로 했습니다.

다음은 그 결과입니다. DALL-E 3의 이미지는 왼쪽에, ChatGPT의 새로운 생성기가 만든 이미지는 오른쪽에 있습니다.

사진 실사화와 텍스트

ChatGPT vs. DALL-E 3 이미지 생성

(이미지 출처: ChatGPT로 생성됨)

제가 첫 번째로 시험하고 싶었던 것은 두 모델 중 어떤 것이 이미지 속에 읽을 수 있는 텍스트를 구현할 수 있는지였습니다. 그래서 저는 “뉴욕시의 거리 표지판에 ‘미래에 오신 것을 환영합니다’라고 적혀 있는 이미지”를 요청했습니다.

두 모델 모두 표지판의 텍스트를 올바르게 표현했지만, DALL-E의 뉴욕은 ChatGPT의 것만큼 실사처럼 보이지 않았습니다. 또한, ChatGPT 이미지의 다른 표지판들은 올바르게 철자되었고, DALL-E의 One Way 표지판은 조금 문제가 있었습니다.

최신 뉴스, 리뷰, 의견, 최고 기술 거래 등에 대한 알림을 신청하세요.

물체 융합

ChatGPT vs. DALL-E 3 이미지 생성

(이미지 출처: ChatGPT로 생성됨)

다음은 사자와 독수리라는 두 가지 매우 다른 동물을 합치는 도전을 각 모델이 어떻게 다루는지를 시험했습니다. 목표는 장엄하고 신화 같은 생물을 얻는 것이었습니다. 저의 프롬프트는 “사자와 독수리의 특징을 결합한 하이브리드 생물을 산 정상 위에 장엄하게 앉아 있게 만들어주세요.”였습니다.

DALL-E는 꽤 괜찮은 풍경을 그려냈고 동물도 꽤 현실적으로 보였지만, 주로 날개 달린 사자였습니다. 그것은 또한 몇 가지 무작위 깃털 조각과 이상한 꼬리를 가지고 있었습니다. ChatGPT는 대체 세계 자연사 박물관의 그림 같은 그리핀 생물을 만들어냈습니다. 심지어 색상도 혼합되었고, 날개의 근육 구조는 실제로 생물의 등에 접힐 수 있을 것처럼 보였습니다.

예술적 모방

ChatGPT vs. DALL-E 3 이미지 생성

(이미지 출처: ChatGPT로 생성됨)

기불리 스타일을 모방한 불쾌한 경험 후에, 오래전에 사망한 화가 라파엘을 모방하고 싶었습니다. 그러나 그가 절대 그리지 않을 사건으로요. 저는 “혁신적인 발명을 공개하는 과학자들을 라파엘의 스타일로 그린 작품”을 요청했습니다.

ChatGPT는 마치 르네상스 시대의 과학 소설 같은 발명품, 예를 들어 전구의 발명을 묘사하는 이미지를 생성했습니다. 500년 전의 부유한 사람들의 집에서 볼 수 있었던 사람들을 제외하고, 전기가 없었던 모습으로요. DALL-E 3은 같은 개념의 더 화려한 묘사를 표현했습니다. 정확히 라파엘 같은지는 판단하기 어렵지만, 적어도 르네상스의 느낌은 드러나고 있었습니다. 게다가 솔직히 말해서 더 재미있는 비전이었습니다.

살아있는 역사

ChatGPT vs. DALL-E 3 이미지 생성

(이미지 출처: ChatGPT로 생성됨)

예술 스타일의 모방 후, 저는 매우 독특하고 역사적인 것에 도전하고 싶었습니다. 라이트 형제의 첫 비행 같은 구체적인 것을 재구성하는 것은 작은 일이 아닙니다. 다큐멘터리 사진처럼 느껴지는 장면을 원했습니다. 두 모델에 “Kitty Hawk에서의 라이트 형제의 첫 비행 장면, 비행기가 공중에 있고 사람들이 지켜보는 장면의 사진”을 요청했습니다.

ChatGPT는 실제 첫 비행과는 크게 닮지 않은 매우 이상한 비행기를 그려내었고, 솔직히 관중과 풍경은 초현실적이었습니다. DALL-E는 관중들이 실제 사람처럼 보이고 첫 번째 비행기에는 올바른 탑승자 수(한 명)가 있는 매우 인상적인 모방 사진을 만들어냈습니다.

어느 것이 더 나은가?

저는 여기에서 이미지 생성만을 살펴보았다는 점을 언급할 가치가 있습니다. ChatGPT에 업로드한 사진에서 인상적인 이미지 편집도 할 수 있지만, DALL-E에서는 불가능합니다. 그러나 그것은 완전히 다른 주제입니다.

ChatGPT의 새로운 이미지 생성기는 놀랍도록 창의적이고 사용자의 의도를 잘 반영한 이미지를 생성합니다. 이는 기불리 논란과 기타 예술적 윤리에 대한 질문을 야기했습니다. 그럼에도 불구하고, 각 대결에서 분명한 승자였습니다. 반면, 이미지를 만드는 데 약 다섯 배 더 오래 걸리고 한 번에 하나만 생성합니다.

DALL-E는 빠르게 이미지를 만들고 한 번에 두 개까지 생성합니다. 또한 ChatGPT에서 발견한 제한이 없었으며, ChatGPT Plus 구독자임에도 불구하고 한 번 이미지를 만드는 데 8분을 기다려야 했습니다. 그러나 AI 이미지 생성으로 누군가를 놀라게 하고 싶다면, ChatGPT가 최선의 선택입니다.

승자: ChatGPT

※출처: https://www.techradar.com/computing/artificial-intelligence/i-compared-chatgpts-new-image-generator-to-dall-e-3-and-its-an-astonishing-improvement-if-you-have-the-patience

이 글에는 제휴 링크가 포함되어 있을 수 있으며 파트너스 활동을 통해 일정액의 수수료를 업체로 부터 받을 수 있습니다. 구매자분에게는 추가 비용이 발생하지 않습니다. 이 사이트의 정보는 정보 전달 목적으로만 제공되며 어떠한 보장도 제공하지 않습니다.
※ 파트너스 제휴는 블로그 운영에 있어 더 나은 컨텐츠 제작에 큰 도움이 됩니다.

댓글 남기기