OpenAI는 곧 모든 사용자가 ChatGPT 내에서 직접 이미지를 생성할 수 있게 될 것이라고 발표했습니다. 이 기능은 ChatGPT Plus, Pro, Team 사용자 뿐만 아니라, 무엇보다 중요한 무료 사용자에게도 제공될 예정입니다. 따라서 이제 우주에서 라자냐를 먹고 있는 고양이의 그림과 같은 이미지를 만들기 위해 Dall-E를 열 필요가 없으며, 이는 4o의 기본 이미지 생성 도구가 될 것입니다. 또한 이 기능은 Sora에도 도입됩니다.
회사는 플랫폼이 “사용자의 프롬프트, 대화 및 업로드된 파일을 바탕으로 고품질 이미지를 생성할 것”이라고 말합니다. 특히 이전에 존재하던 이미지를 프롬프트에 따라 변형할 수 있는 기능도 포함됩니다. OpenAI는 텍스트 표현력과 맥락 이해에 있어서 상당한 개선이 이루어졌다고 자랑하고 있습니다.
이 새로운 도구들은 개인 및 전문적인 용도를 위해 설계되었습니다. 이에 따라 OpenAI는 인포그래픽, 소셜 미디어 홍보 그래픽 및 텍스트가 많은 이미지 제작 등 다양한 활용 예시를 제시하고 있습니다.
이 도구는 또한 고급 비주얼 처리가 가능합니다. 회사는 “조명, 그림자 및 질감의 정확성을 포함한 사진 실사 현실감에 대한 강력한 능력”을 제공한다고 설명합니다. 맥락을 이해하는 능력은 또한 유용할 수 있어, OpenAI는 이를 통해 “센트럴 파크에서 발견된 새들의 포스터”나 “이전에 대화에서 논의된 예술 역사 시대의 시각화”를 생성할 수 있다고 합니다.
오늘부터 API와 ChatGPT에서 텍스트 및 이미지 입력이 가능하며, 몇 주 내에는 음성 및 비디오 처리가 제공될 예정입니다.
이는 작년에 처음 출시된 AI 모델인 GPT-4o를 기반으로 하고 있습니다. “o”는 모델의 다중 모드 기능을 나타내는 “omni”를 의미합니다. 이는 업로드된 파일을 반복적으로 작업할 수 있는 등 앞서 언급된 많은 기능을 가능하게 합니다. 오늘의 발표는 몇 주 전 샘 알트먼이 암시했던 “대단한 AI 기능에 대한 오랜 여정”의 또 다른 단계로 보입니다.
※출처: https://www.engadget.com/ai/now-you-can-generate-images-directly-from-chatgpt-and-sora-180047905.html