GPT-4o의 ‘o’는 하나의 통합된 AI 모델을 의미하는 ‘옴니모델(omnimodel)’에 뜻한다. 텍스트, 오디오, 이미지를 넘나들며 추론할 수 있다. 주로 텍스트를 통해 대화할 수 있었던 기존 모델과 달리 이용자와 음성 대 음성 대화가 가능하다.
특히 GPT-4o를 이용하면 지금까지 AI 음성 챗봇에는 없었던 사실적인 대화를 할 수 있다. 사용자가 챗GPT에 말을 걸고 지연없이 실시간 응답을 받을 수 있다.
오픈AI의 최고기술책임자(CTO)인 미라 무라티는 “챗GPT가 이제 메모리 기능도 갖추게 돼 사용자와 이전 대화를 통해 학습하고 실시간 번역을 할 수 있게 됐다”며 “사용 편의성 측면에서 큰 진전을 이룬 것은 이번이 처음이다”고 말했다.
미라 CTO는 “챗GPT는 현재 1억 명이 사용하는 AI 솔루션이며, 97%의 세계 시민을 커버하는 50개 언어로 제공된다”며 “이번에 추가된 15개 언어를 통해 더욱 많은 사람들이 AI 기술을 활용할 수 있을 것”이라고 강조했다.
오픈AI는 무료 버전의 챗GPT를 사용하는 사용자를 포함한 모든 사용자에게 GPT-4o를 쓸 수 있도록 했다. 오픈AI는 앞으로 몇 주에 걸쳐 GPT-4o를 출시할 계획이다.