GPT-4급 AI가 공짜로?!
self discover agent

GPT-4급 AI가 공짜로?!

Cinnamomo di Moscata

다시 한 번 날아 오르려는 OpenAI

마침내, OpenAI는 AI가 알아서 일하는 자율 에이전트 소프트웨어를 개발하고 있다고 해요. 예를 들어, 고객은 ChatGPT에게 문서에서 데이터를 스프레드시트로 옮기거나, 경비 보고서를 작성하여 회계 소프트웨어에 입력하도록 요청할 수 있어요. 이러한 요청은 에이전트가 다른 앱과 작업할 때 사람들이 하는 클릭, 커서 이동, 텍스트 입력 등 지루하고 복잡한 행동을 인간 대신 수행하도록 해요.

한편, 샘 알트만(Sam Altman)은 세계 반도체 산업을 재편하려는 거대한 계획을 세우고 있어요. 그는 UAE 정부를 비롯한 투자자들과 수조 달러의 자금을 모으는 협상을 진행하고 있으며, 이 프로젝트의 총 비용은 5조~7조 달러에 달할 수 있다고 해요.

이러한 매우 큰 자금 조달 계획은 OpenAI의 성장을 위한 것인데, 그 중 하나는 AGI로 인류에 기여하는데 필요한 AI칩이 부족하기 때문이에요. 문제는, 지난해 전 세계 반도체 매출은 5270억 달러였던 반면, 알트만이 말한 규모는 그의 10배는 되기 때문이에요. 과연 투자자들도 막대한 돈이 드는 투자를 통해서 AGI로 인류에 기여할 수 있게 도와줄 수 있을까요?

GPT-4만큼 좋은 오픈소스가 드디어?!

이번 2월 7일, AI 연구자인 앨리스(Alice)가 깜짝 놀랄만한 소식을 발표했어요. 자신들이 연구하는 AI인 Senku-70B가 지표상에서 GPT-4를 능가하는 성능을 가지고 있다고 자랑했기 때문이에요.

실제로, AI의 똑똑함을 측정하는 지표인 EQ-벤치 v2(EQ-Bench v2)에서, Senku-70B는 84.89를 얻었고, GPT-4의 23년 6월 13일 버전은 84.79를 얻었다고 해요.

물론 아쉽게도 모든 분야에서 GPT-4를 능가하지는 못했는데, GPT-4가 워낙 똑똑해서 모든 것을 잘하는 것은 아직까지는 어렵다고 해요. 하지만 적어도 한가지만큼은 GPT-4만큼 똑똑하니까, 조만간 누구나가 GPT-4보다 우수한 AI를 공짜로 사용할 수 있을거라고 추측해요.

Image
84.79~86.05를 찍은 GPT-4의 EQ-벤치 v2 점수(높을수록 좋음)
Image
84.89를 찍은 Senku-70B의 EQ-벤치 v2 점수

음악도 AI가 오마카세

구글 딥마인드(Google DeepMind)는 최근에 MusicRL이라는 AI와 논문을 새로 발표했어요. 이 논문은 음악 AI의 훈련과 개선에 인간의 참여가 필수적이라고 주장하는데, 왜냐하면, 인간만의 까다롭고 섬세한 음악 취향을 맞춰주기 위해서는 AI가 인간의 의견을 들어봐야 하기 때문이라네요. MusicRL은 4가지 모델이 있고, 취향에 따라서 골라 쓸 수 있다고 해요.

  1. MusicLM: MusicLM은 텍스트로 음악을 만들 수 있는 기본 모델이에요.
  2. MusicRL-R: MusicRL-R은 강화 학습으로 미세 조정된 MusicLM의 변형이에요.
  3. MusicRL-U: MusicRL-U는 인간의 피드백을 사용해서 강화 학습을 수행한 MusicLM의 변형이에요.
  4. MusicRL-RU: MusicRL-RU는 MusicRL-R과 MusicRL-U의 접근 방식을 결합한 모델로, 인간의 취향을 가장 잘 반영하는 모델이에요.

인간처럼 생각하며

SELF-DISCOVER(이하 셀프 디스커버)는 AI가 스스로 추론 문제에 적합한 추론 구조를 찾아내고 구성하는 방법을 제안한다고 해요. 추론 구조란, AI가 문제를 정의하고 답을 찾아낼 때 따라야 할 일련의 규칙이나 절차인데, 예를 들어, 수학 문제를 풀 때는 단계별 사고, 오류를 찾을 때는 비판적 사고와 같이 다양한 방식을 사용할 수 있어요.

셀프 디스커버는 AI가 이러한 추론 방식을 선택하고, 적절한 순서와 조건으로 연결하여 추론 구조를 만들 수 있게 도와줘요. 이렇게 하면, AI는 인간만의 전유물로 여겨지는 추론 능력을 향상시킬 수 있어요.

셀프 디스커버의 장점은 다음과 같다고 해요.

  1. 기존의 방법보다 훨씬 높은 성능을 자랑해요. 성능을 알아내기 위한 벤치마크에서, 셀프 디스커버 기술 덕에 GPT-4와 PaLM 2의 성능이 기존보다 최대 32%까지 더 똑똑해졌다고 해요.
  2. 매우 적은 사양을 요구해요. 기존 방법보다 10~40배 가벼우면서, 20% 이상 더 좋은 성능을 보여주었어요.
  3. 다양한 AI에 적용할 수 있어요. PaLM 2-L에서 GPT-4로, GPT-4에서 Llama2로 모델을 바꾸어도, 셀프 디스커버는 여전히 잘 작동해요. 또한, 셀프 디스커버는 AI가 인간과 비슷한 방식으로 추론할 수 있도록 돕는다고 해요.

인간을 돕기 위해 인간을 흉내내다

그동안 말로만 들어왔던 자율 에이전트가 개발에 들어서면서 AI는 인류에 더욱 더 기여할 길이 열리고 있고, 셀프 디스커버를 통해서 AI는 인간처럼 생각하는 근육을 길러 나가고 있어요.

AI가 이처럼 엄청난 속도로 발전하면서 인간이 하기 힘들어 하는 일, 싫어하는 일을 척척 대신 해주고, 인간은 재미있고 창의적인 일에 집중하는 식으로 바뀌어 가고 있고, 노동은 고통이 아니라 원하는 꿈을 이루어 주는 수단으로 바뀌고 있어요.

에코 멤버님들도 AI 덕분에 곧 다가올 '재미있는 일터'에 대비해서 어떻게 하면 AI가 인간의 걱정과 지루한 일을 덜어 줄 수 있는지 매일 AI를 사용하면서 분석하고 적응하셨으면 좋겠어요.

같이 읽어보면 좋은 글

신년 스페셜! 2024년 이후의 AI는?
폭풍과도 같았던 2023년 벌써 2023년도 끝나고 2024년 새해가 찾아왔어요. 돌이켜 보면 올해에만 GPT-4, 스테이블 디퓨젼 XL, 구글 바드/제미나이, 샘 알트만의 퇴사와 복귀, EU의 AI 규제 법안 등 다사다난한 소식들로 가득찼어요. 2023년에도 이랬는데 과연 2024년과 그 이후에는 어떤 일들이 펼쳐질까요? 신년 스페셜로 AI 분야 인플루언서들의 예상을 모아봤어요! 1. 아쉽지만 AGI는
AI가 또 주는 새해 선물! 과연 무엇이길래?
서프라이즈 파티 2024년의 시작되고 첫주가 막 끝났을 뿐인데도, 벌써부터 AI는 우리에게 신년맞이 선물을 주고 있어요. 과연 연시에 AI가 준 선물은 무엇이고, 어떤 혜택을 누리게 될 수 있을까요? AI영화도 이제는 저작권 시대! 나라지식정보 산하 나라AI필름이 제작한 ‘AI수로부인’이 AI영화로는 세계에서 2번째로 편집저작물로 등록되어 국내외 AI 창작물 분야에서 중요한 사례가 되었다고 해요.

Cinnamomo di Moscata (글쓴이) 소개

게임 기획자를 준비중입니다. AI 아티스트로도 활동하고 있습니다. Stable Diffusion을 주로 사용합니다. https://www.instagram.com/cinnamomo_di_moscata/

(1) Stephanie Palazzolo and Amir Efrati. (2024). OpenAI Shifts AI Battleground to Software That Operates Devices, Automates Tasks. The Information. https://www.theinformation.com/articles/openai-shifts-ai-battleground-to-software-that-operates-devices-automates-tasks

(2) Keach Hagey and Asa Fitch. (2024). Sam Altman Seeks Trillions of Dollars to Reshape Business of Chips and AI. Wall Street Journal. https://www.wsj.com/tech/ai/sam-altman-seeks-trillions-of-dollars-to-reshape-business-of-chips-and-ai-89ab3db0

(3) Alice. (2024). "Ok so this is one benchmark, but Senku-70B (leaked mistral finetune) beats GPT-4 in EQ Bench. Not sure how I go about getting this added on the website. Senku-70B is available here. https://t.co/FE2ZExcNnR https://t.co/LU4riTW7KJ". X. https://twitter.com/Alice_comfy/status/1754965801147490418

(4) Geoffrey Cideron, Sertan Girgin, Mauro Verzetti, Damien Vincent, Matej Kastelic, Zalán Borsos, Brian McWilliams, Victor Ungureanu, Olivier Bachem, Olivier Pietquin, Matthieu Geist, Léonard Hussenot, Neil Zeghidour and Andrea Agostinelli. (2024). MusicRL: Aligning Music Generation to Human Preferences. Google DeepMind. https://google-research.github.io/seanet/musiclm/rlhf/

(5) Pei Zhou,Jay Pujara,Xiang Ren,Xinyun Chen,Heng-Tze Cheng,Quoc V. Le,Ed H. Chi,Denny Zhou,Swaroop Mishra,Huaixiu Steven Zheng. (2024). Self-Discover: Large Language Models Self-Compose Reasoning Structures. arXiv. https://arxiv.org/abs/2402.03620

Comments