오픈AI의 새로운 모델 GPT-4o(omni, also good gpt2)의 성능은?

오픈AI의 새로운 모델 GPT-4o(omni, also good gpt2)의 성능은?

부루퉁의AI

5월 14일 오전 2시(한국 시간) 오픈AI가 봄 업데이트를 발표했습니다. 이번 업데이트는 UI를 단순화하고 GPTs스토어와 앱을 개선했다는 내용과 함께 새로운 모델 GPT-4o(GPT-4 omni)와 향상된 음성모드를 선보였습니다.

이번에 공개한 GPT-4o는 인간과 컴퓨터의 자연스러운 상호작용을 목표한 모델로, 텍스트, 오디오, 이미지 등의 모든 조합을 입력으로 받고, 출력 생산한다고 합니다. GPT-4o는 평균 0.3초 안으로 입력에 대해 응답할 수 있습니다.

게다가 Chatbot Arena에 등장했던 정체불명의 im-also-good-gpt2 모델이 바로 GPT-4o였습니다. 아래 이미지를 보면 종합 밴치마크와 코딩 밴치마크의 점수가 타 모델과 비교했을때 압도적인 것을 확인할 수 있습니다.

종합 밴치마크
코딩 밴치마크

GPT-4o(omni)의 성능

오픈AI 공식홈페이지에 올라온 GPT-4o 페이지를 살펴보면 위와 같은 결과물 샘플을 확인할 수 있습니다. 3D 오브젝트 생성부터 타이포그래피까지 만들어냅니다. 공식홈페이지 주소는 하단에 첨부해 놓겠습니다.

텍스트 평가

텍스트 평가 점수입니다. 몇 몇 부분에서 클로드 오푸스와 라마3 400B 모델과 큰차이가 없지만, DROP을 제외하면 압도적인 성능차이를 보여주고 있습니다. (DROP은 문단을 이해하고 문단 안에 있는 정보를 기반으로 복잡한 질문에 대답하는 능력을 평가하는 것입니다.)

오디오 성능

오디오 ASR 성능도 기존 Whisper-V3와 비교해 큰 폭으로 향상되었습니다.

최종 종합 벤치 결과
한국어 토큰의 감소
GPT-4o API 가격

이번 업데이트로 한국어 토큰이 1.7배 감소했으며, GPT-4o API의 가격은 기존 GPT-4의 1/6 수준입니다. 오픈AI는 GPT-4o를 무료로 사용할 수 있도록할 예정이며, 플러스 사용자에게는 최대 5배 더 많은 메세지를 제공할 것이라 밝혔습니다. 음성 모드는 몇 주 안으로 출시 예정이라 합니다. (GPT-4o는 오늘부터 사용할 수 있습니다.)

이번 업데이트 영상은 꼭 챙겨보시길 바랍니다. GPT-4o 음성모드의 뛰어난 감정표현과 사람과 대화하는 듯한 실시간 응답, 중간에 말 끊기 등 놀라운 장면을 확인할 수 있습니다. (카메라 영상을 통한 실시간 대화 및 수학 방정식 풀이 시연도 있습니다.)

OpenAI GPT-4O 소개 페이지: https://openai.com/index/hello-gpt-4o/

부루퉁의AI 네이버 블로그: https://blog.naver.com/ldlquddnr

부루퉁의 업데이트되는 챗GPT 전자책: https://vo.la/blbLY (4월: 챗GPT 인페인팅 기능 및 효과적인 답변을 받는 26가지 팁 업데이트 완료)


GPT-4O 핵심 기능 4가지 소개 영상

GPT-4o 핵심 기능 4가지 소개 영상 풀버전

Introduce your service here!

For newsletter banner advertising inquiries, please contact: Bopyo@aikoreacommunity.com

이곳에 서비스를 소개하세요!

뉴스레터 배너 광고 문의: Bopyo@aikoreacommunity.com

Comments