OpenAI는 AI 혁신을 가속화하기 위해 o3와 o4-mini를 공개했습니다. o3는 코딩과 과학 과제에서 뛰어난 성능을 제공하며, o4-mini는 저렴한 대안입니다. 두 모델은 웹 브라우징과 이미지 생성 기능을 통합해 문제 해결 능력을 강화했습니다. ChatGPT Plus 및 Pro 사용자들은 즉시 사용 가능하며, 곧 o3-pro도 출시될 예정입니다.
OpenAI가 GPT-4.1을 발표한 지 불과 이틀 만에 두 가지 새로운 모델을 공개했습니다. 오늘 회사는 o3와 o4-mini의 공개 사용 가능성을 발표했습니다. OpenAI에 따르면 o3는 코딩, 수학 및 과학 과제에서 “강력한 성능”을 보이며, 지금까지 개발된 가장 진보된 추론 모델입니다. o4-mini는 이러한 동일한 분야에서 “인상적인 결과”를 제공하면서도 비용이 저렴한 대안으로 소개됩니다.
특히, 두 모델은 OpenAI의 이전 시스템에는 없던 새로운 기능을 제공합니다. 처음으로, 회사의 추론 모델이 웹 브라우징 및 이미지 생성 같은 ChatGPT에서 사용 가능한 모든 도구를 사용할 수 있으며 이를 결합할 수 있게 되었습니다. 이 기능을 통해 o3와 o4-mini는 도전적인 다단계 문제를 보다 효과적으로 해결하고 “독립적으로 행동하는 방향으로 실질적인 진전을 이룰 수 있다”고 회사 측은 설명합니다.
동시에, o3와 o4-mini는 단순히 이미지를 보는 것에 그치지 않고, 이를 해석하고 “사고”함으로써 시각적 처리 능력을 대폭 확장합니다. 예를 들어, 화이트보드, 다이어그램 또는 스케치의 이미지를 업로드하면, 품질이 낮은 이미지라도 새로운 모델이 이를 이해할 수 있습니다. 또한, 이미지를 조정하여 추론의 일환으로 사용할 수 있습니다.
“최신 추론 기술과 전체 도구 접근성을 결합한 힘은 학문적 기준과 실제 과제에서 훨씬 더 강력한 성능을 발휘하며, 지능과 유용성 모두에서 새로운 표준을 세웠습니다.”라고 OpenAI는 언급합니다.
한편, OpenAI는 새로운 코딩 에이전트인 Codex CLI를 출시하고 있습니다. 이 에이전트는 OpenAI의 모델을 로컬 코드를 통해 연결할 수 있는 최소한의 인터페이스를 개발자에게 제공합니다. 이 모델은 기본적으로 o3와 o4-mini와 함께 작동하며 곧 GPT-4.1에 대한 지원도 제공될 예정입니다.
오늘 발표는 OpenAI의 CEO Sam Altman이 지난 2월에 상세히 설명한 로드맵의 방향 전환에 따라 진행되었습니다. 당시 Altman은 OpenAI가 지난해 말 처음으로 공개한 o3를 독립적인 제품으로 출시하지 않을 것이라고 언급했지만, 4월 초에 “계획 변경”을 발표하며 o3와 o4-mini의 출시를 진행한다고 밝혔습니다.
“이 결정에는 여러 가지 이유가 있지만, 가장 기대되는 것은 GPT-5를 처음 예상했던 것보다 훨씬 더 개선할 수 있을 것이라는 점입니다.”라고 Altman은 X에 글을 썼습니다. “우리는 모든 것을 매끄럽게 통합하는 것이 생각보다 더 어려운 일이었고, 전례 없는 수요를 지원할 수 있는 충분한 역량을 갖추고자 합니다.”
이는 Altman이 2월에 약속한 프로세스 간소화가 GPT-5 출시까지는 대기해야 할 가능성이 있음을 의미합니다. 그는 GPT-5가 향후 몇 달 내에 출시될 것이라고 언급했습니다.
그 사이에, ChatGPT Plus, Pro, Team 사용자들은 오늘부터 o3와 o4-mini를 사용할 수 있습니다. 몇 주 안에, OpenAI는 o3-pro라는 더욱 강력한 플래그십 추론 모델의 버전을 온라인으로 제공하고 Pro 구독자들을 대상으로 출시할 예정입니다. 현재로써는, 이러한 사용자들은 o1-pro를 계속 사용할 수 있습니다.
※출처: Engadget