게임 AI가 코앞으로!
gamedev

게임 AI가 코앞으로!

Cinnamomo di Moscata

비디오 검색도 이젠 AI!

최근 윈도우 11(Windows) 인사이더 카나리 채널 빌드 27695에서 새로운 ‘지능형 미디어 검색’ 기능이 언급되었어요. 이 기능은 로컬 AI 모델을 통해 로컬 오디오 파일과 비디오의 단어를 검색할 수 있게 해주는데, 회의 녹음 파일이나 오디오북에서 필요한 정보를 쉽게 찾을 수 있게 해주는 혁신적인 도구라고 해요.

지능형 미디어 검색은 모든 오디오 파일과 비디오를 전사하여, 해당 파일 내의 단어를 검색할 수 있게 해요. 사용자가 ‘동의’ 버튼을 클릭하면, 미디어 파일을 스캔하고 필요한 모델을 백그라운드에서 다운로드 및 설치한 뒤, 모델이 설정되면 미디어 파일을 전사하고 인덱싱하여 문장으로 입력해도 알아서 척척 콘텐츠 기반 검색을 가능하게 한다고 해요.

이 기능은 과거 프라이버시 문제로 연기된 ‘리콜(Recall)’ 기능과 유사해요. 리콜은 사용자 활동을 몇 초마다 기록하여 모든 것을 쉽게 검색할 수 있게 해주는 기능이었지만, 프라이버시 우려로 인해 연기되었어요. 지능형 미디어 검색도 유사한 AI 모델을 기반으로 하므로, 프라이버시 문제에 대한 논의가 필요할 것으로 보여져요.

마이크로소프트는 아직 이 새로운 기능에 대해 공식적으로 언급하지 않았어요. 그러나 이 기능이 도입되면, 사용자들은 더 효율적으로 정보를 검색하고 활용할 수 있을 거에요.

미호요 창업자도 AI를 인정?!

최근 미호요(MiHoYo)의 공동 창업자 차이 하오위(Cai Haoyu)가 인공지능(AI)의 급속한 도입이 비디오 게임 개발 산업에 큰 변화를 가져올 것이라고 예고했어요. 그는 링크드인(LinkedIn) 포스트를 통해 "평범한 개발자부터 전문가까지, 우리는 직업을 바꿔야 할지도 모른다"고 언급했어요.

차이 하오위는 AI 생성 콘텐츠(AIGC)의 도입으로 인해 게임 개발자들이 두 가지 유형으로 나뉠 것이라고 주장해요. 첫 번째는 가장 통찰력 있는 천재들로, 이들은 깊은 이해와 뛰어난 디자인 능력을 바탕으로 엘리트 팀을 구성해 전례 없는 게임을 창조할 거에요. 두 번째는 취미로 게임을 만드는 사람들로, 이들은 자신의 아이디어를 만족시키기 위해 게임을 만드는 99%의 사람들이에요.

차이 하오위의 이러한 평가는 금융부터 의료까지 다양한 산업에서 AI가 미칠 영향을 경고하는 기존의 예측과 일맥상통해요. AI의 도입은 이제 게임 산업에도 여러 흥미진진한 변화를 불러 일으킬 거에요.

게임 엔진의 새로운 패러다임

최근 구글 딥마인드(Google DeepMind)와 텔아비브 대학교(Tel Aviv University)의 연구팀이 발표한 GameNGen(이하 엔젠)은 신경망 모델을 통해 실시간으로 복잡한 게임 환경을 시뮬레이션하는 최초의 AI 게임 엔진이에요. 이 엔진은 고전 게임 둠(DOOM)을 단일 TPU에서 초당 20프레임 이상으로 시뮬레이션할 수 있고, 시각적 품질은 원본 게임과 비교할 만해요.

엔젠은 강화 학습 에이전트를 통해 게임을 학습하고, 이후 확산 모델을 사용해 다음 프레임을 예측한다고 해요. 이를 통해 게임 상태 업데이트와 렌더링을 자동으로 수행해요. 인간 평가자들은 짧은 클립에서 실제 게임과 시뮬레이션을 구별하는 데 어려움을 겪을 정도로 높은 품질을 자랑해요. 또한 엔젠은 실시간으로 복잡한 게임 상태를 업데이트하며, 건강 및 탄약 집계, 적 공격, 문 열기 등의 작업을 수행할 수 있어요.

엔젠은 게임 엔진의 새로운 패러다임을 제시해요. 앞으로 게임 개발 과정이 텍스트 설명이나 예제 이미지를 통해 더욱 저렴하고 노코딩으로 접근 가능해질 수 있어요. 또한, 기존 게임의 수정이나 새로운 캐릭터 생성 등도 코드 작성 없이 가능해질 전망이에요.

엔젠으로 만든 둠(Doom)

마리오도 AI로

최근 AI 기술의 발전은 텍스트, 이미지, 오디오 생성에서 놀라운 성과를 보여주고 있어요. 그러나 비디오 생성 모델은 여전히 많은 도전 과제를 안고 있어요. 특히, 비디오 게임 생성에 있어서는 더욱 그렇습니다. 이번 연구에서는 슈퍼 마리오 브라더스(Super Mario Bros) 게임을 기반으로 한 텍스트-비디오 확산 모델인 MarioVGG(이하 VGG)를 소개했어요. VGG는 다음과 같은 3가지 특징이 있다고 해요.

  • 연속성과 일관성: MarioVGG는 텍스트 명령을 통해 일관되고 의미 있는 장면과 레벨을 지속적으로 생성할 수 있어요. 이는 기존의 비디오 생성 모델들이 가지는 제약을 극복하는 중요한 특징이에요.
  • 물리 시뮬레이션: 이 모델은 플레이어의 움직임과 게임 내 물리 법칙을 시뮬레이션할 수 있어요. 예를 들어, 점프나 달리기와 같은 동작을 텍스트로 입력하면, 해당 동작을 비디오로 생성한다고 해요.
  • 단일 게임 도메인 집중: 현재 MarioVGG는 Super Mario Bros 게임에 집중하여 훈련되었어요. 이는 모델의 신뢰성과 제어 가능성을 높이는 데 중요한 역할을 해요.

MarioVGG는 비디오 게임 생성의 새로운 가능성을 열어줘요. 게임 엔진의 제약을 넘어, 누구나 쉽게 텍스트 인터페이스를 통해 노코딩 비디오 게임을 만들 수 있는 시대가 다가오고 있어요. 비록 아직 해결해야 할 과제가 많지만, 이 연구는 그 가능성을 보여주는 중요한 첫 걸음 중 하나에요.

GPT-Next가 온다!

최근 KDDI가 주최한 "KDDI SUMMIT 2024"에서 OpenAI Japan의 대표, 나가사키 타다오(長崎忠雄) 씨가 등장하여 OpenAI의 최신 동향과 미래 전망을 공유했어요. 나가사키 대표에 따르면, 2023년 8월 말 기준으로 ChatGPT의 활성 사용자 수는 2억 명을 돌파했어요. 이는 소프트웨어 역사상 가장 빠른 속도로 1억, 2억 명의 사용자를 달성한 사례로 기록되었어요.

특히 기업용 서비스인 "ChatGPT Enterprise"는 출시 1주년을 맞아 기업들 사이에서 빠르게 채택되고 있어요. OpenAI는 현재 전 세계적으로 2000명 미만의 직원을 보유하고 있으며, 그 중 절반은 AI 개발에 전념하고 있어요.

나가사키 대표는 또한 가장 중요한 주제인 GPT 시리즈의 성능 향상에 대해서도 언급했엉. GPT-3와 GPT-4를 비교했을 때 성능이 약 100배 향상되었으며, GPT-4o는 멀티모달 기능을 지원해요. 앞으로 출시될 “GPT Next” 모델은 이전 모델들보다 100배 가까이 진화할 것으로 예상되며, AI 기술은 지수적으로 성장할 것이라고 전망했어요.

이를 뒷받침하듯, 공신력있는 루머 유출자 지미 애플(Jimmy Apples)는 삼성전자의 이정배 사장이 세미콘 타이완 2024(SEMICON Taiwan 2024)에서 발표한 프레젠테이션 사진을 올렸어요. 프레젠테이션에 따르면, GPT-5의 사이즈는 GPT-4의 약 2-3배에 달하는 파라미터 3-5조개라고 해요.

물론 GPT-Next가 GPT-5인지 혹은 다른 모델인지에 대해서는 아직은 불명확해요. 하지만 적어도 샘 알트만(Sam Altman)이 GPT-5의 성능을 침이 마르도록 극찬한 이유가 있어 보여요.

GPT-Next의 예상 성능 그래프
이정배 삼성전자 사장이 발표한 GPT-5의 모델 사이즈(파라미터 약 3~5조개)

이제 모두가 노코딩

AI 기술의 발전은 우리의 일상과 산업 전반에 걸쳐 혁신을 불러일으키고 있어요. 윈도우 11의 지능형 미디어 검색 기능은 사용자들이 오디오와 비디오 파일에서 필요한 정보를 손쉽게 찾을 수 있게 해주며, 미호요의 차이 하오위가 예고한 AI의 도입은 게임 개발 산업에 큰 변화를 가져올 거에요. 또한, 구글 딥마인드와 텔아비브 대학교의 GameNGen은 게임 엔진의 새로운 패러다임을 제시하며, MarioVGG는 비디오 게임 생성의 새로운 가능성을 열어줬어요.

특히, OpenAI의 GPT-Next는 AI 기술의 지수적 성장을 예고하며, 앞으로의 AI 발전 방향을 제시해요. 이러한 기술들은 우리의 삶을 더욱 편리하고 풍요롭게 만들어 줄 거에요. 그러나 동시에 프라이버시와 윤리적 문제에 대한 논의도 필요해요. 에코 멤버님들은 그동안 해오셨듯 다가오는 AI 시대를 위해서 AI의 책임과 윤리적 고려를 계속해 나가셨으면 좋겠어요.


같이 읽어보면 좋은 글

코딩의 종말!
AI가 AI를 평가하는 시대, 인간의 개입 없이도 성능을 개선하는 자기 학습 모델이 도래했습니다. 혁신적 접근이 AI의 미래를 바꿀 것입니다
딸기가 정말로 다가온다!
xAI의 ‘그록-2’가 코드 전면 수정을 통해 속도가 2배 빨라졌습니다! SG랭을 활용한 새로운 추론 스택 덕분에, 이 AI 모델은 대형 AI에서도 최대 6.4배 빠른 처리량을 달성하며 정확성도 향상되었습니다

Cinnamomo di Moscata (글쓴이) 소개

게임 기획자입니다. https://www.instagram.com/cinnamomo_di_moscata/


(1) Dallin Grimm. (2024). Windows preview build teases searching your audio and video content — 'intelligent media search' referenced in newest build. Tom's Hardware. https://www.tomshardware.com/software/windows/windows-preview-build-teases-searching-your-audio-and-video-content-intelligent-media-search-referenced-in-newest-build

(2) 임대준. (2024). MS, PC에 저장된 오디오·비디오 '내용'으로 찾아주는 AI 기능 공개. AI타임스. https://www.aitimes.com/news/articleView.html?idxno=163020

(3) Ann Cao. (2024). Genshin Impact creator miHoYo’s co-founder sees AI revolution upending video-gaming jobs. South China Morning Post. https://www.scmp.com/tech/tech-trends/article/3276624/genshin-impact-creator-mihoyos-co-founder-sees-ai-revolution-upending-video-gaming-jobs

(4) 임대준. (2024). 게임 '원신' 제작자 "AI로 인해 개발자는 전직 고려하는 게 좋을 것". AI타임스. https://www.aitimes.com/news/articleView.html?idxno=163035

(5) arXiv:2408.14837 [cs.LG]

(6) Shlomi Frutcher. (2024). GameNGen. YouTube. https://www.youtube.com/watch?v=O3616ZFGpqw

(7) Virtuals Protocol. (2024). Video Game Generation: A Practical Study using Mario. GitHub. https://virtual-protocol.github.io/mario-videogamegen/

(8) Virtuals Protocol. (2024). virtuals-protocol/mario-videogamegen. Hugging Face. https://huggingface.co/virtuals-protocol/mario-videogamegen

(9) 松浦立樹. (2024). 「ChatGPTのアクティブユーザー数は2億人に」──OpenAI Japan代表が公表 次世代モデル「GPT Next」にも言及. ITMedia. https://www.itmedia.co.jp/aiplus/articles/2409/03/news165.html

(10) Jimmy Apples. (2024). "Gpt-5 and a Samsung exec. The noise is getting louder. https://t.co/LoTag3iWy1". X. https://x.com/apples_jimmy/status/1831221448935100482


GenAI Innovation Korea 2024 컨퍼런스!

  • 일정: 10월 4일
  • 장소: 서울 양재 aT 센터
  • 해외 기업(프리픽, 매그니픽AI) 국내 AI 유명 연사들 강연 예정, 참가형 컨퍼런스로서 뮤직 비디오, 이미지 생성 대회
  • 자세한 내용은 아래 페이지 참고하세요!
  • 해외 AI 트렌드 및 앞으로의 방향 어려운 기술 컨퍼런스가 아닌 정말 대중적인 컨퍼런스로서 실질적인 정보를 원하시면 꼭 참여하세요!
AI 컨퍼런스 | Generative AI Innovation Korea | GenAI 참여형 컨퍼런스!
AI 코리아 커뮤니티와 국제 인공지능 윤리 협회 IAAE에서 개최하는 Generative AI Innovation Korea 는 생성형 AI 컨퍼런스로서 챗GPT, Claude, 미드저니, 스테이블디퓨전, AI 아트 영상등 다양한 생성형 AI 회사들과 네트워킹 및 즐기는 행사입니다

뉴스레터 광고 공간 (광고주를 모집합니다)

For newsletter banner advertising inquiries, please contact: Bopyo@aikoreacommunity.com

이곳에 서비스를 소개하세요!

뉴스레터 배너 광고 문의: Bopyo@aikoreacommunity.com


뉴스레터 편집장 소개

Comments