the end of the programming

코딩의 종말!

Cinnamomo di Moscata 25 Aug 2024

AI 평가도 AI가 스스로

최근 메타(Meta)의 FAIR 연구팀은 인간의 평가 없이도 AI 모델이 스스로 개선할 수 있는 혁신적인 방법을 제안했어요. 이 방법은 자기 학습 평가자(Self-Taught Evaluator)라고 불리는데, 인간의 선호 데이터를 사용하지 않고도 모델의 성능을 향상시킬 수 있다고 해요.

대조적 모델 출력 생성: 우선 AI 모델한테 프롬프트를 입력시켜서 대조적인 모델 출력을 생성하고, 이를 통해 평가자를 훈련해요.
반복적 자기 개선: 여러번 반복하여 개선된 예측을 사용해 평가자를 지속적으로 훈련시켜요.

이 방법을 통해 라마3 70B(Llama3-70B-Instruct) 모델의 정확도 성능을 75.4%에서 88.3%으로 향상시켰는데, 이는 기존의 인간 평가 데이터를 사용한 방법보다 뛰어난 결과라고 해요. 이 연구는 AI 개발 과정에서 인간 평가의 필요성을 줄이고, AI가 스스로 성장하는 커리큘럼을 구축하는 데 큰 기여를 할거에요.

또다른 루트

커맨드 R+(Command R+) AI로 유명한 코히어 AI(Cohere AI)의 CEO 에이단 고메즈(AIdan Gomez)가 최근 유튜브 채널에서 AI의 미래에 관한 인터뷰를 했어요.

그의 말에 따르면, AI의 발전과 도전 AI 모델의 성능은 컴퓨팅 파워와 데이터 품질에 크게 의존해요. 더 많은 연산력을 투입하면 모델이 더 좋아지지만, 이는 매우 비효율적이고 비용이 많이 들어요. 따라서 데이터 혁신과 모델 아키텍처 개선이 중요한 역할을 한다고 해요.

미래의 AI 모델의 경우, 앞으로는 특정 목적에 맞게 파인튜닝된 작은 모델들과 몇 개의 지배적인 큰 모델들이 공존할 것이라고 해요. 특히, AI 모델이 스스로 문제를 해결하고 피드백을 받아 개선하는 능력이 중요해질 거에요.

경제적 제약과 기회 AI 모델의 지속적인 발전에는 막대한 비용이 들지만, 이는 클라우드 업체와의 협력을 통해 해결될 수 있어요. 또한, 데이터의 품질 향상이 AI 성능 향상의 핵심이 될 것이라고 거듭 강조했어요.

에이단 고메즈(Aidan Gomez)의 인터뷰 영상

AI는 아직도 헬렐레한 상태?!

최근 연구에 따르면, 구글의 Gemini, Anthropic의 Claude, OpenAI의 GPT-4o 등 모든 생성 AI 모델이 여전히 환각 문제를 겪고 있어요. 이 모델들은 때때로 사실과 다른 정보를 생성하며, 이는 때로는 웃음을 자아내지만, 때로는 문제를 일으킬 수 있어요.

코넬 대학(Cornell University)과 워싱턴(Washington University), 워털루 대학(Universit of Waterloo), AI2 연구소의 연구진은 다양한 AI 모델을 평가한 결과, 어떤 모델도 모든 주제에서 뛰어난 성과를 보이지 못했다고 밝혔어요. 특히, 법률, 건강, 역사, 지리 등 다양한 주제에서 모델들이 환각을 일으키는 빈도가 높았다고 해요.

연구진은 GPT-4o와 GPT-3.5가 비교적 적은 환각을 일으켰지만, 여전히 많은 질문에 대해 정확한 답변을 제공하지 못했다고 지적했엉. 특히, 유명인과 금융 관련 질문에서 모델들이 가장 큰 어려움을 겪다고 덧붙였어요.

연구진은 환각 문제를 완전히 해결하는 것은 어려울 것이라고 전망하면서도, 인간 전문가의 검증과 사실 확인 도구의 개발을 통해 개선할 수 있다고 강조했어요. AI 모델이 더 신뢰할 수 있는 정보를 제공하기 위해서는 지속적인 연구와 노력이 필요해요.

노코딩 시대로 한발짝 더

최근 유출된 녹음에서 아마존 웹 서비스(AWS)의 CEO는 대부분의 개발자가 곧 코딩을 멈출 수 있을 것이라고 언급했어요. 이는 인공지능(AI)이 코딩 작업을 점점 더 많이 대체할 수 있게 되면서 가능해진 일이에요.

AI 기술의 발전은 놀라운 속도로 진행되고 있는데, 특히, 아마존 웹 서비스(AWS)와 같은 대형 클라우드 서비스 제공업체들은 AI를 활용해 더 효율적이고 자동화된 솔루션을 제공하고 있거든요. 이러한 변화는 개발자들이 반복적이고 단순한 작업에서 벗어나 더 창의적이고 복잡한 문제 해결에 집중할 수 있게 만들어 줘요.

만약 AI가 코딩을 대체하게 되면, 개발자의 역할도 크게 변화할 거에요. 단순한 코딩 작업보다는 AI를 활용한 시스템 설계, 데이터 분석, 문제 해결 등의 고차원적인 작업이 주를 이루게 될 것이고, 개발자들에게 새로운 기회와 도전을 제공할 거에요.

이러한 변화에 대비하기 위해 개발자들은 AI와 관련된 기술을 습득하고, 새로운 도전에 대비하는 자세가 필요해요. AI와 협력하여 더 나은 솔루션을 만들어내는 능력이 중요해진다는 소리죠.

세일즈포스도 멀티모달!

xGen-MM(BLIP-3; 이하 엑스젠)은 세일즈포스 AI 연구팀(Salesforce AI Research)과 워싱턴 대학교의 공동 연구로 개발된 프레임워크에요. 이 프레임워크는 대규모 데이터셋, 훈련 레시피, 모델 아키텍처 등을 포함하여 다양한 멀티모달 모델을 개발하는 데 중점을 두어요. 특히, 이 모델은 다음과 같은 특징을 가지고 있다고 해요.

데이터의 풍부함과 다양성: 기존의 BLIP-2와 비교하여 더 풍부하고 다양한 데이터셋을 사용하여 훈련되었어요.

비전 토큰 샘플러: Q-Former 레이어를 대체하여 더 많은 데이터에 확장이 가능한 '비전 토큰 샘플러'를 도입했어요.

단순화된 훈련 과정: 훈련 목표를 단일 손실로 통합하여 훈련 과정을 더 쉽게 다듬었어요.

엑스젠은 다양한 벤치마크에서 강력한 성능을 보여주며, 특히 인스트럭션 튜닝된 모델은 유사한 크기의 오픈소스 모델 중 경쟁력 있는 성능을 자랑한다고 해요. 또한, DPO를 통해 안전성을 강화하여 환각과 같은 유해한 행동을 줄이는 데 중점을 두었다고 해요.

이 모델은 오픈소스로 공개되어 연구자들이 자유롭게 사용하고 발전시킬 수 있도록 지원해줘요. 이를 통해 멀티모달 AI 연구의 접근성을 높이고, 더 많은 사람들이 멀티모달을 통해서 혁신을 누릴 수 있을 거에요.

여름이 끝난다고 해도

AI 기술의 발전은 이제 인간의 평가를 넘어서는 새로운 국면에 접어들고 있어요. 메타의 자기 학습 평가자와 코히어 AI의 데이터 혁신, 그리고 세일즈포스의 멀티모달 모델 등은 AI가 스스로 학습하고 개선할 수 있는 가능성을 열어주고 있어요. 이러한 기술들은 AI가 더 신뢰할 수 있고, 효율적이며, 창의적인 방식으로 발전할 수 있도록 도와줄 거에요.

그러나 여전히 해결해야 할 과제들이 남아 있어요. GPT-4o에서도 여전한 환각 문제와 데이터 품질의 중요성, 그리고 AI와 인간의 협력은 앞으로도 중요한 이슈로 남을 거에요. AI가 코딩을 대체하고, 더 나은 솔루션을 제공하는 시대가 다가오고 있지만, 이는 에코 멤버님들의 창의성과 지혜가 결합될 때 비로소 완전한 혁신으로 이어질 거에요.

피드백을 부탁드려요! (어떤 작가님의 글을 좋아하시나요?)

같이 읽어보면 좋은 글

Cinnamomo di Moscata (글쓴이) 소개

게임 기획자입니다. AI 아티스트로도 활동 중입니다. https://www.instagram.com/cinnamomo_di_moscata/

(1) arXiv:2408.02666 [cs.CL]

(2) 박찬. (2024). 메타, 인간 평가자 필요 없는 LLM 평가 도구 출시. AI타임스. (2024). https://www.aitimes.com/news/articleView.html?idxno=162635

(3) 20VC with Harry Stebbings. (2024). Aidan Gomez: What No One Understands About Foundation Models | E1191. YouTube. https://www.youtube.com/watch?v=FUGosOgiTeI&t=11s

(4) MinasAnor. (2024). Cohere CEO 에이단 고메즈 인터뷰 (08.20). 디시인사이드. https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=514330

(5) Kyle Wiggers. (2024). Study suggests that even the best AI models hallucinate a bunch. TechCrnch. https://techcrunch.com/2024/08/14/study-suggests-that-even-the-best-ai-models-hallucinate-a-bunch/

(6) Eugene Kim. (2024). In a leaked recording, Amazon cloud chief tells employees that most developers could stop coding soon as AI takes over. Business Insider. https://www.businessinsider.com/aws-ceo-developers-stop-coding-ai-takes-over-2024-8

(7) arXiv:2408.08872 [cs.CV]

(8) 박찬. (2024). 세일즈포스, 오픈 소스 LMM 출시..."동시에 다수 이미지 읽어내는 능력 탁월". AI타임스. https://www.aitimes.com/news/articleView.html?idxno=162646

뉴스레터 광고 공간 (광고주를 모집합니다)

For newsletter banner advertising inquiries, please contact: Bopyo@aikoreacommunity.com

이곳에 서비스를 소개하세요!

뉴스레터 배너 광고 문의: Bopyo@aikoreacommunity.com

뉴스레터 편집장 소개

보표 홈페이지
https://amzbopyo.com/
보표 SNS
보표 레터: https://www.bopyoletters.com/
X(트위터): https://twitter.com/AIBopyo
스레드: https://www.threads.net/@bopyo.amz
링크드인: https://www.linkedin.com/in/bopyo-park-848631231/
인스타그램: https://www.instagram.com/bopyo.amz/
AI 코리아 커뮤니티 아카데미
https://app.aikoreacommunity.com/collections/932400

News

Comments

Join the newsletter to receive the latest updates in your inbox.

You might also like

ChatGPT 뉴스·기사 요약 프롬프트 활용법

자연어로 데이터와 대화하는 시대: Text-to-SQL과 AI 데이터 분석의 현재