AI도 사내정치는 괴로워
AI 로봇들이 격렬하게 논쟁하면서 사내정치를 하는 모습, 아니메풍, 카툰풍, 플랫 셰이딩

AI도 사내정치는 괴로워

Cinnamomo di Moscata

천재를 향한 시기심들

구글(Google)의 AI 연구를 이끄는 데미스 하사비스(Demis Hassabis)는 구글 안팎의 적들 때문에 힘겨워하고 있어요. 구글은 ChatGPT 열풍에 놀란 나머지, '바드’ 등을 서둘러 출시했는데, 하사비스는 이런 상황에서 딥마인드(DeepMind)와 구글 브레인(Google Brain)을 합쳐서 태어난 구글 딥마인드(Google DeepMind)를 이끌게 되었어요.

그러나 하사비스는 최근에 오픈AI의 텍스트-비디오 생성기 '소라(Sora)'와의 경쟁에서 구글이 뒤처질 수 있다는 우려를 표명했어요. 소라는 엄청 사실적이고 최대 1분 길이의 비디오를 생성할 수 있는 반면, 구글의 '루미에르(Lumiere)'는 고작 5초짜리 비디오를 만들 뿐이에요.

엎친데 덮친 격으로, 하사비스는 구글 딥마인드가 구글의 AI를 리드한다는 의지가 있었지만, 최근의 조직 개편으로 인해 딥마인드의 힘이 약해졌다고 해요.

이로 인해 아무리 좋은 AI를 만들어도 일반인들이 쓸 수 있는 서비스로 만드는 결정은 다른 부서가 하게 되면서 사내 정치의 희생양이 되었다고 해요. 실제로, 최근 논란이 되었던 제미나이(Gemini)의 인종차별적인 이미지 생성 등도 이런 사내 정치에 엮이게 되면서 벌어진 것으로 추정된다고 해요.

머스크의 진지한 쇼앤프루브

일론 머스크(Elon Musk)가 AI에 대한 열정을 다시 진지하게 불태우고 있어요. xAI가 최근에 그록 1.5(Grok-1.5) 출시를 예고한 것도 모자라서 GPT-4를 본격적으로 능가하는 '그록2.0(Grok-2.0)’의 훈련을 오는 5월까지 완료할 계획이기 때문이에요. GPU 부족이라는 문제가 있지만 머스크는 이를 잘 극복하고 있다고 말했고, 앞으로의 AI에는 GPU라는 칩보다 전기 부족이 훨씬 중요한 문제가 될 것이라고 예견했어요.

또한, 머스크는 인간 전문가 만큼 똑똑한 AGI 개발에 대한 자신의 비전을 공유했어요. 그는 AGI가 수많은 천재들보다 더 똑똑해질 수 있을 것이라고 예측했고, 2025년이나 2026년 안에 가능할 것이라고 밝혔어요. 이러한 발언은 메타(Meta)의 AI 리더인 얀 르쿤(Yann LeCun)과의 논쟁을 불러일으켰는데, 얀 르쿤은 머스크의 자율주행 기술에 대한 낙관적인 전망을 '그렇게 잘난 테슬라가 왜 아직도 완전자율주행이 불가능한지 이해가 안된다'라​며 비꼬았다고 해요.

AI의 새 지평, 제파(JEPA)가 현실로

메타의 수석 AI 과학자 얀 르쿤이 새로운 AI 아키텍처 '제파(JEPA)’를 개발 중이라고 발표했어요. 이는 ChatGPT가 쓰는 기존의 트랜스포머 방식을 넘어서, 사람처럼 생각하고 직접 행동하는 AGI를 향한 또 한 걸음이에요. 사실, 제파는 예전부터 얀 르쿤이 여러차례 이론을 소개한 적이 있지만, 이론에 그치지 않고 실제로 만들게 된 것은 최근의 일이라고 해요.

얀 르쿤은 예전부터 말해왔듯, AGI 개발을 위해 트랜스포머를 넘어서는 새로운 접근이 필요하다고 강조했어요. 메타와 OpenAI 모두 이러한 추론 능력을 AGI의 핵심으로 보고 있고, 가까운 미래의 AI는 단순한 생성이 아닌, 진정한 '생각하는 기계’가 될 것이라고 해요.

이미지 AI의 또다른 도약

이번에 VAR(Visual Autoregressive Modeling)라는 신기술이 발표되었어요. 이 VAR는 이미지의 학습 방식을 기존의 디퓨전 방식에서 ChatGPT에 훨씬 가까운 새로운 방식으로 변경해서 이미지를 만드는 속도를 끌어올린다고 해요. 물론, 스테이블 디퓨전 3(Stable Diffusion 3; 이하 SD3)에서 사용된 DiT도 있지만, VAR에서는 처음으로 GPT에 훨씬 가까운 이미지 모델이 SDXL이나 SD3같은 디퓨전 계열 모델을 아득히 뛰어넘는 성능을 입증했어요.

특히 학습 과정이 좋아져서 VAR는 다양한 프롬프트를 스스로 이해하는 성능도 좋아졌고, 설령 자신이 배운 것이 아니더라도 자기가 알아서 인간이 상상한 것과 가깝게 이미지를 만들어줘요. 결정적으로, 만약 이 VAR를 스테이블 디퓨전(Stable Diffusion)이나 미드저니(Midjourney)에 적용한다면, 만드는 속도는 몇십배 빠르면서 이미지 퀄리티는 더 올라가는 효과를 누릴 수 있다고 해요.

VAR가 만들었다는 아이스크림 이미지(데모)

또 다른 도약

구글과 OpenAI, 메타, 그리고 xAI 등 여러 기업들이 매일매일 순위를 바꾸어 가면서 서로 경쟁적으로 발전하고 있어요. 구글의 데미스 하사비스는 자신과 AI를 방해하는 사내 정치와 맞서 싸워야 하고, 일론 머스크는 진지한 모습으로 그록 2.0을 개발하고 있고, 얀 르쿤은 완전한 신기술로 자신이 가장 뛰어난 AI의 구루(Guru)가 되려고 하고 있어요. 이러한 기술들이 서로 경쟁하고 협력하면서 AI는 인간보다 인간다워지고 있고, 더 나아가서 인간이 못하는 것을 대신 이루어 주는 지니가 되려고 준비하고 있어요. 에코 멤버님들도 이런 희망찬 미래를 내다보고, AI의 손을 잡고 폭발적으로 도약하셨으면 좋겠어요.


같이 읽어보면 좋은 글

AI가 주는 2월의 선물!
OpenAI의 Sora OpenAI가 이번에는 텍스트로 현실적이고 상상력 풍부한 영상을 생성하는 AI 모델 Sora(소라)를 발표했어요. 소라는 최대 1분까지 영상을 만들 수 있는데, 기술적으로는 DALL E-3(달리 3)의 기술인 확산 트랜스포머(diffusion transformer)라고 부르는 모델을 사용했다고 해요. 소라의 발표에는 많은 사람들이 반응했어요. 샘 알트만(Sam Altman)은 트위터에서
Stable Diffusion 3 등장! 초고속으로 진화하는 AI!
아직 Stable Cascade가 나온지 얼마 안되었는데도 Stable Diffusion 3는 스태빌리티 AI(Stability AI)가 개발한 최신 AI 모델이에요. 이 모델에 대해 알려진 것은 아직까지 많지 않지만, 디퓨전 트랜스포머 아키텍처라고 불리는 여러 신기술들을 사용하여 다중 주제 프롬프트, 이미지 품질, 철자 능력 등의 성능을 크게 향상시켰다고 해요. 새로운 모델의 사이즈는 그 성능만큼이나
AI에게도 맨인블랙이 필요할 때!
미드저니의 열성적인 안티팬?! 미드저니(Midjourney)의 공식 소식에 따르면, 지난 3월 2일에 미드저니 서버가 통째로 다운되는(!) 사고가 있었다고 해요. 범인이 누구인지 정확히 밝혀지지는 않았지만, 미드저니 측은 스태빌리티 AI(Stability AI)가 미드저니의 성능을 질투한 나머지, 이미지를 빼오려고 시도한 정황이 있다면서 스태빌리티 AI 직원들의 미드저니 계정을 전부 정지시켰다고 해요. 하지만, 정작
일론 머스크가 뿔났다? Grok 업그레이드!
일론 머스크의 재빠른 추격 저번 주에 Grok 1.0을 오픈소스로 모두에게 공개한 일론 머스크가 이번에는 Grok-1.5 AI를 출시할 예정이라고 해요. 특히 그록(Grok) 1.5는 특히, 128,000 토큰에 달하는 아주 긴 문장들을 이해할 수 있다고 해요. 그록 1.5는 코딩 및 수학 관련 작업에서 뛰어난 성능을 보여주고, 구체적으로는

Cinnamomo di Moscata (글쓴이) 소개

게임 기획자를 준비중입니다. AI 아티스트로도 활동하고 있습니다. Stable Diffusion을 주로 사용합니다. https://www.instagram.com/cinnamomo_di_moscata/


(1) Jon Victor. (2024). Google’s Demis Hassabis Chafes Under New AI Push. The Information. https://www.theinformation.com/articles/googles-demis-hassabis-chafes-under-new-ai-push

(2) Jyoti Mann. (2024). Google DeepMind's CEO reportedly thinks it'll be tough to catch up with OpenAI's Sora. Business Insider. https://www.businessinsider.com/google-deepmind-ceo-demis-hassabis-tough-catch-up-openai-sora-2024-4

(3) 박찬. (2024). 머스크 "그록-2.0 다음달까지 훈련...GPU가 부족해". AI타임스. https://www.aitimes.com/news/articleView.html?idxno=158676

(4) 임대준. (2024). 메타 "AGI 도약 방법 발견...'트랜스포머'와 다른 아키텍처 개발 중". AI타임스. https://www.aitimes.com/news/articleView.html?idxno=158694

(5) Keyu Tian, Yi Jiang, Zehuan Yuan, Bingyue Peng, Liwei Wang. (2024). Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction. arXiv. https://github.com/FoundationVision/VAR


Introduce your service here!

For newsletter banner advertising inquiries, please contact: Bopyo@aikoreacommunity.com

이곳에 서비스를 소개하세요!

Comments