화요일 라이브 스트림 중, OpenAI 의 CEO인 Sam Altman은 ChatGPT의 이미지 생성 기능에 대한 첫 번째 주요 업그레이드를 발표했습니다.
ChatGPT는 이제 회사의 GPT-4o 모델을 활용하여 본래적으로 이미지와 사진을 생성하고 수정할 수 있게 되었습니다. GPT-4o는 오랫동안 AI 기반 챗봇 플랫폼의 기초 역할을 해왔지만, 지금까지 이 모델은 텍스트 생성 및 편집만 가능했습니다 — 이미지가 아닌.
Altman은 GPT-4o 네이티브 이미지 생성이 오늘부터 회사의 월 200달러 Pro 플랜 구독자를 위한 ChatGPT와 OpenAI의 AI 비디오 생성 제품인 Sora에서 사용할 수 있다고 밝혔습니다. OpenAI는 또한 이 기능이 Plus와 무료 ChatGPT 사용자, 그리고 회사의 API 서비스를 사용하는 개발자에게 곧 제공될 것이라고 합니다.
이미지 출력을 갖춘 GPT-4o는 OpenAI가 더 정확하고 상세한 이미지로 설명하는 바와 같이, 효과적으로 대체하는 이미지 생성 모델인 DALL-E 3보다 “생각”하는 시간이 약간 더 깁니다. GPT-4o는 사람을 포함한 기존 이미지를 편집할 수 있으며, 이를 변형하거나 전경 및 배경 객체와 같은 세부 사항을 “인페인팅”합니다.
OpenAI는 새로운 이미지 생성 기능을 가능하게 하기 위해 어떤 이미지 데이터를 사용했는지 밝히지 않았습니다. 많은 생성형 AI 벤더는 학습 데이터를 경쟁 우위로 보고, 이를 통해 얻은 정보를 매우 신중하게 다룹니다. 그러나 학습 데이터의 세부 사항은 IP 관련 소송의 잠재적 원천이기도 하여, 기업이 많은 것을 공개하지 않으려는 또 다른 이유가 됩니다.
OpenAI는 창작자가 자신의 작품이 학습 데이터 세트에서 제거되도록 요청할 수 있는 옵트아웃 양식을 제공합니다. 회사는 또한 웹 스크래핑 봇이 웹사이트에서 이미지 등 학습 데이터를 수집하는 것을 허용하지 않겠다는 요청을 존중한다고 합니다.
ChatGPT의 업그레이드된 이미지 생성 기능은 회사의 대표 모델 중 하나인 Gemini 2.0 Flash의 실험적 네이티브 이미지 출력 발표에 발맞춘 것입니다. 이 강력한 기능은 소셜 미디어에서 대유행했지만, 반드시 긍정적인 이유만은 아니었습니다. Gemini 2.0 Flash의 이미지 구성 요소는 몇 가지 안전장치가 없어 사람들에게 워터마크를 제거하고 저작권이 있는 캐릭터를 묘사한 이미지를 생성할 수 있게 했기 때문입니다.
※출처: https://techcrunch.com/2025/03/25/chatgpts-image-generation-feature-gets-an-upgrade/