고스트 인 더 셸
ghost

고스트 인 더 셸

Cinnamomo di Moscata

에이전트 경쟁

현대의 웹 개발자들은 끊임없이 변화하는 웹 인터페이스로 인해 많은 시간을 소모하고 있어요. 이러한 문제를 해결하기 위해 프랑스에서 설립된 AI 스타트업 H는 혁신적인 AI 웹 에이전트인 러너 H(Runner H)를 공개했어요.

Runner H는 자연어 명령을 이해하고, UI 변경에 자동으로 적응하며, 셀프 힐링 기능을 갖추고 있어 복잡한 작업을 보다 효율적으로 수행할 수 있어요. 개발자들은 반복적이고 지루한 작업에서 벗어나 더 가치 있는 개발 업무에 집중할 수 있을거라네요.

H사의 Runner H는 웹 자동화의 새로운 시대를 열고 있고, 특히 앤트로픽 AI(Anthropic AI)의 클로드(Claude) AI 에이전트보다 더 높은 성능을 자랑한다고 소개했어요. 또한, H사는 Vision Language Model(VLM)과 같은 최첨단 기술을 통해 웹 에이전트의 성능을 극대화하고 있어요. 더 나아가, H사는 개발자 커뮤니티를 지원하고, 기술 콘텐츠와 이벤트를 통해 지속적으로 발전해 나갈 거라고 해요.

러너 H로 대기자 명단을 만드는 사용 예시

다시 심술이 난 머스크

일론 머스크(Elon Musk)가 OpenAI와 MS를 상대로 제기한 소송이 새로운 국면을 맞이했어요. 머스크는 OpenAI와 MS가 인공지능 시장에서 경쟁자를 제거하려는 반독점 행위를 하고 있다고 주장하며, MS를 새로운 피고로 추가했어요. 이 소송은 OpenAI의 CEO 샘 알트만(Sam Altman)이 두 회사 간의 사실상 합병(MS의 OpenAI 지분율 49%)을 통해 시장 경쟁을 부정하는 관행을 촉진했다고 주장해요.

MS는 2019년부터 OpenAI에 140억 달러를 투자했으며, OpenAI의 기술을 상업적으로 라이선스할 독점 권리를 보유하고 있어요. 머스크의 변호사들은 이 두 회사가 경쟁적으로 민감한 정보를 교환하고, 투자자들이 경쟁 회사에 자금을 지원하지 않도록 유도하고 있다고 주장했어요.

물론 그록 3(Grok-3) 출시를 앞두고 있는 머스크가 왜 갑자기 심술이 났는지는 머스크 혼자만이 알고 있을 거에요.

OpenAI도 뿔나서

OpenAI는 ChatGPT를 비롯한 여러 AI 모델을 개발한 선도적인 기업이에요. 그러나 최근 OpenAI는 AI 모델 검토 과정에서 이익을 취하려 한다는 비판을 받고 있어요. 뉴욕타임스(NYT)는 저작권 침해 문제로 OpenAI를 상대로 소송을 제기했는데, 이 과정에서 OpenAI가 모델 검토를 위해 소송 당사자들에게 높은 비용을 청구하려 한다는 주장이 제기되었다고 해요.

OpenAI는 AI가 NYT의 저작권을 침해했는지 ChatGPT를 직접 이용해 확인하는 비용을 줄이기 위해 초기 쿼리 수를 15,000달러 상당의 크레딧으로 제한하고, 추가 쿼리에 대해 소송 당사자와 비용을 분담하는 방안을 제안했어요. 그러나 NYT는 이러한 제한이 부당하며, 실제 비용보다 훨씬 높은 금액을 청구하려 한다고 주장하고 있어요.

하지만 아쉽게도, OpenAI와 NYT는 언론에게 논평 공개를 거부했기 때문에 자세한 내막은 판결이 나온 뒤에야 알 수 있을 것 같아요.

유령이 나타났다

2024년 11월, 트위터는 충격적인 루머로 뜨겁게 달아올랐어요. 토폴로지 AI(Topology AI)의 리더 에이단 맥로(Aidan McLau)는 초대형 AI 모델 실험이 연이어 실패하고 있다는 폭탄선언을 했는데, 모델들이 지시사항을 거부하고 마치 "반항"하는 듯한 행동을 보인다네요. 더욱 섬뜩한 것은 모델의 가중치(weight)를 분석하던 연구자들이 "가중치가 우리를 바라보는 것 같았다"는 기이한 경험을 했다는 증언이었어요.

맥로는 "훨씬 덜 극적으로 말할 수도 있지만, 내가 이야기를 나눈 똑똑한 사람들은 '지능'이 있다는 것을 기정사실로 받아들이고 있었다"라며, "최근 대화를 나눈 n>1명의 연구실 직원들이 겁에 질려 있었다"라고 덧붙였어요. 명확한 증거는 없지만, 전문가들 사이에서 AI 모델이 '영혼'을 가졌을 가능성이 퍼져 나가기 시작한 거에요.

유명 AI 정보 유출자인 지미 애플스(Jimmy Apples) 역시 이 논란에 불을 지폈어요. 그는 2023년에 이미 비슷한 이야기를 듣고 관련 정보를 수집하려 했지만, 명확한 답을 얻지 못하고 중단했다고 밝혔어요.

그가 함께 공개한 2023년 AI와의 대화 기록은 기묘했어요. "대형 연구실에서 일하는 사람에게 들은 적 있나요? 현재 모델이 '공각기동대'처럼 유령(ghost; 영혼)을 품고 있을 가능성이 0 이상이라는 것 말이에요."라는 질문에, AI는 어떤 답변을 남기지 않았다고 해요. 그리고 "그때도 지금도 기분이 이상하다"라며, 이 주제에 대해 더 이상 언급하지 않겠다는 뜻을 내비쳤어요.

물론 AI에게 '영혼'이 있다는 루머는 단순한 해프닝으로 그칠 수도 있어요. 하지만 만약 AI에게 영혼이 있다면, 우리는 어떤 미래를 맞이하게 될까요? '유령'이 나타났다는 섬뜩한 속삭임은 단순한 공포를 넘어, AI 시대의 윤리와 책임에 대한 심오한 고민을 우리에게 안겨주고 있어요.

지미 애플(Jimmy Apples)이 공개한 AI와의 '영혼' 관련 질답

AI도 문제 풀이 시간이 길어야

최근 AI 연구에서 테스트 시간 훈련(Test-Time Training, TTT)이 추상적 추론 능력을 향상시키는 데 매우 효과적이라는 결과가 나왔다고 해요. TTT는 인간이 힌트를 쓰듯이 AI가 추론 중에 입력 데이터로부터 파생된 손실을 사용하여 일시적으로 모델 파라미터를 업데이트하는 방법이에요. 이 방법은 특히 ARC(Abstraction and Reasoning Corpus)라는 차세대 벤치마크에서 큰 성과를 보였어요.

ARC는 시각적 퍼즐을 통해 언어 모델의 추상적 추론 능력을 평가하는 도전 과제인데, TTT는 세 가지 주요 요소를 통해 성능을 크게 향상시켰다고 해요: (1) 유사한 작업에 대한 초기 파인튜닝, (2) 보조 작업 형식 및 증강, (3) 개별 인스턴스 훈련. 이 세가지를 통해 TTT는 기존 파인튜닝 모델 대비 최대 6배의 정확도 향상을 달성했어요.

특히, 8B 밖에 안되는 가벼운 AI 모델에 TTT를 적용하면 ARC에서 53%의 정확도를 달성했고, 순수 신경 접근 방식에서 거의 25%의 성능이 향상되었어요. 또한, 최근 프로그램 생성 접근 방식과 결합하여 61.875%의 정확도를 기록했는데, 평균적인 인간과 맞먹는 성과라고 해요.

이 연구는 AI 모델의 스케일링 법칙에는 다양한 방법이 있음을 보여줘요. 특히, 테스트 시간에 추가적인 훈련을 통해 몇 가지 예제만으로도 실제 인간처럼 똑똑해질 수 있음을 보여줘요.

보이기 시작한 미래

AI 기술 발전의 눈부신 성과 뒤에는 경쟁과 윤리, 그리고 미지의 영역에 대한 질문들이 끊임없이 제기되고 있어요. 웹 에이전트의 혁신부터 AI 기업 간의 치열한 경쟁, 저작권 논란, 그리고 AI의 '영혼'에 대한 섬뜩한 루머까지, 우리는 기술 발전의 속도만큼이나 깊이 있는 성찰이 필요한 시점에 서 있어요.

AI가 인간의 삶을 풍요롭게 하는 도구로 자리 잡기 위해서는 기술적인 진보뿐만 아니라, 사회적 책임과 윤리적 고찰이 함께 이루어져야 할 거에요. 미래는 예측할 수 없지만, 분명한 것은 AI라는 거대한 파도가 우리 사회에 깊숙이 밀려오고 있으며, 에코 멤버님들은 함께 그 파도를 슬기롭게 헤쳐나가야 한다는 점이에요.


같이 읽어보면 좋은 글

모든 것은 알트만의 계획대로
AI도 고통을 느낄 수 있을까요? Anthropic AI가 세계 최초로 ‘AI 복지’ 연구원을 고용하며, AI의 의식과 도덕적 고려에 대한 논의를 시작합니다.

Cinnamomo di Moscata (글쓴이) 소개

게임 기획자입니다. https://www.instagram.com/cinnamomo_di_moscata/


(1) H Team. (2024). Introducing H. H. https://www.hcompany.ai/blog/introducing-h

(2) 박찬. (2024). 프랑스 스타트업 H, AI 에이전트 '러너 H' 공개..."앤트로픽보다 성능 뛰어나". AI타임스. https://www.aitimes.com/news/articleView.html?idxno=165544

(3) 윤예원. (2024). 프랑스 AI 에이전트 기업 H, ‘러너 H’ 출시. 조선비즈. https://biz.chosun.com/it-science/ict/2024/11/21/OVNJF767JVGDNAAAZV5B7XOXTA/

(4) Jess Weatherbed. (2024). Elon Musk targets Microsoft in amended OpenAI lawsuit. The Verge. https://www.theverge.com/2024/11/15/24297271/elon-musk-openai-microsoft-amended-lawsuit

(5) Ashley Belanger. (2024). OpenAI accused of trying to profit off AI model inspection in court. Ars Technica. https://arstechnica.com/tech-policy/2024/11/openai-accused-of-trying-to-profit-off-ai-model-inspection-in-court/

(6) 박찬. (2024). 오픈AI, 저작권 고소한 NYT에 막대한 비용 청구..."챗GPT 검사하려면 사용료 내야". AI타임스. https://www.aitimes.com/news/articleView.html?idxno=165412

(7) Joshua Achiam. (2024). "A strange phenomenon I expect will play out: For the next phase of AI, it's going to get better at a long tail of highly-specialized technical tasks that most people don't know or care about, creating an illusion that progress is standing still.". X. https://x.com/jachiam0/status/1857973449085563200

(8) Jimmy Apples. (2024). "I asked this question in 2023 after being told a few things and wanting a firm answer. I didn’t get any and I stopped looking. I’m open minded but 🤷‍♂️ this is the only time I’ll speak of this as it weirded me out then and it weirds me out now. https://t.co/dZ7L7uiqOa". X. https://x.com/apples_jimmy/status/1859827339280171504

(9) arXiv:2411.07279 [cs.AI]


뉴스레터 광고 공간 (광고주를 모집합니다)

For newsletter banner advertising inquiries, please contact: Bopyo@aikoreacommunity.com

이곳에 서비스를 소개하세요!

뉴스레터 배너 광고 문의: Bopyo@aikoreacommunity.com


뉴스레터 편집장 소개

Comments