지금까지의 GPT는 최약체일 뿐이었다고?!
OpenAI의 새 모델 Q*
알트만의 짧고도 긴 복귀를 반가워하기에 앞서서, OpenAI가 새로 개발했다는 모델인 Q*(이하 큐스타)에 관심이 쏠리고 있다고 해요. 이 AI는 정식으로 공개되지는 않았지만 알트만의 복귀 과정에서 언론들이 조사하던 중에 우연하게 유출된 정보, 그리고 알트만과의 연관성을 찾아냈다고 해요1. 과연 이 AI는 무엇일까요? 그리고 왜 알트만의 사임과도 관련이 있는 것일까요?
스스로 알아서
큐스타는, 울프람 알파 등 여러 플러그인을 사용해야 겨우 수학 문제를 풀 수 있었고, 정확도도 떨어졌던 기존 AI들과는 다르게, 정말로 인간처럼 스스로 차근차근 생각하면서 수학 문제를 정확하게 풀 수 있는 AI라고 해요.
물론, 그 수준은 아직까지는 초등학교 수준에 불과하지만 일단 성공한 이상 앞으로 중학교, 고등학교, 대학교, 대학원 수준까지 스텝을 밟아 가면서 금방 실력이 늘어날 수 있기 때문에 연구자들은 큐스타의 실력에 대해서 낙관하고 있다고 해요.
또, 만약 큐스타에 적용된 기술을 GPT나 다른 AI에도 적용한다면 AGI(인간만큼 똑똑한 범용 AI) 수준은 아니더라도 기존보다 훨씬 똑똑하게 만들 수 있을 것이라고 해요2 3.
지나친 경계심
물론 이를 AI의 발전을 막아야 한다는 근거로 삼고 경계한 이들도 있어요. 다름아닌 OpenAI의 이사회에요. 알트만이 큐스타에 대한 보고를 하자, 이사회는 큐스타가 머지 않아 수학에서도 인간을 능가한다면 재해로 이어질 것이라고 믿고 있었고, 또한 큐스타에 대한 깊은 이해를 우선시했기 때문에 직원들의 반대를 예상했음에도 그를 사임시키기로 결심했다고 해요4.
하지만 알트만의 관심사는 AGI를 통해서 '우주의 비밀을 밝혀내는 것'이나 과학 발전에 우선하고 있고, 평소에도 안전 문제와 자율 규제를 강조해왔기 때문에 큐스타의 프로젝트 일시중지나 안전 재검토 요청이 아니라 알트만의 사임으로 이어진 것은 과도한 경계심이 아니었을까 생각해요.
일례로, 한 업계 관계자는 큐스타의 성능을 고평가하면서도, AGI에는 못미치므로 무해하다고 평가했기 때문이에요5.
인간보다도 더 인간처럼
AI를 통해서 인류에게 공헌하겠다는 연구자들의 열정이 모여서 이번에는 정말로 인간과 같이 단계적으로 접근하고 스스로 피드백을 하면서 문제를 풀려고 시도하는 AI를 만들어 냈어요.
인간답게 문제를 푼다는 특징 때문에 유해하다고 생각할 수도 있지만 무해하다는 전문가들의 의견을 고려해보면 AI가 장애물을 없애주고 날개가 되어주는 것을 넘어서서 진정으로 인간의 로켓이 되어줄 날이 코 앞으로 다가왔다고 느껴져요.
에코 멤버님들도 이런 트렌드에 맞추기 위해 꾸준히 AI를 사용해 보면서 AI라는 날개를 다는 것 뿐만 아니라 로켓을 달고 우주 멀리로 도약을 할 준비를 하셨으면 좋겠어요.
같이 읽어보면 좋은 글
Cinnamomo di Moscata (글쓴이) 소개
게임 기획자를 준비중입니다. AI 아티스트로도 활동하고 있습니다. Stable Diffusion을 주로 사용합니다. https://www.instagram.com/cinnamomo_di_moscata/
(1) Anna Tong, Jeffrey Dastin, Krystal Hu. (2023). OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say. Reuters. https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/
(2) Bindu Reddy. (2023). "Q* appears to apply a RL technique that uses AI generated data and teaches LLMs how to solve multi step logic problems Q* techniques can be applied to GPT-5 endowing it with excellent reasoning and retrieval skills This may not be AGI but it is an extremely powerful LLM". X. https://twitter.com/bindureddy/status/1727674494141989291
(3) Cameron R. Wolfe. (2023). "Q-Learning is probably not the secret to unlocking AGI. But, combining synthetic data generation (RLAIF, self-instruct, etc.) and data efficient reinforcement learning algorithms is likely the key to advancing the current paradigm of AI research…". X. https://twitter.com/cwolferesearch/status/1727727148859797600?s=46
(4) Alex Heath. (2023). A recent OpenAI breakthrough on the path to AGI has caused a stir. The Verge. https://www.theverge.com/2023/11/22/23973354/a-recent-openai-breakthrough-on-the-path-to-agi-has-caused-a-stir
(5) Bindu Reddy. (2023). "The doomsday scenario for GPT-5 and OAI So Q* is generalizing and is pretty good at high school-level math. Q* is harmless, but GPT-5 will be way more powerful at logical reasoning, problem-solving, and code generation. It is being trained and evaluated on OAI…". X. https://twitter.com/bindureddy/status/1728000021100945833