GPT-4의 등장부터 Claude3, Gemini, LLaMa3까지 다양한 생성형 언어모델이 등장할 때마다 MMLU, GPQA, DROP 등 알기어려운 용어의 항목에 점수가 매겨집니다. 이 점수를 통해 LLM(언어모델)이 어떻게 뛰어난지, 어떤 LLM을 능가했는지, 어떤부분에서 강점을 보여주는지 알 수 있습니다. 컴퓨터의 CPU, GPU 성능에 대한 벤치마크 랭킹을 확인하듯, 앞으로는 인공지능에 대한 벤치마크도 더 자주
현재 메타의 수석 AI 과학자 얀 르쿤이 AI를 도약시킬 아키텍쳐 '제파'를 개발 중이라고 밝혔습니다. 얀 르쿤은 인공지능 분야, 딥 러닝과 컴퓨터 비전 분야의 선구자로, GPT 모델과 같은 대규모 언어 모델은 '지능을 가진 것처럼 보이는 단순한 패턴 인식기'라고 비판했던 인물입니다. 얀 르쿤은 '현재 LLM
Arc2Face 소개 얼굴 사진을 한 장 넣으면 비슷한 얼굴 사진을 생성해주는 모델이 등장했습니다. Arc2Face는 사람의 얼굴 특징을 정확하게 알아내고, 그 정보를 바탕으로 새로운 얼굴 사진을 만들어냅니다. 마치 사람의 얼굴을 그리는 화가가 얼굴의 모든 세부사항을 잘 파악해서 그리는 것처럼 Arc2Face도 사람의 얼굴을 잘 그려낼 수 있습니다. 이 프로그램은 사진 데이터베이스인 WebFace42M을
24년 3월 25일 OpenAI가 영상 아티스트들을 통해 완성한 영상 작품과 제작 후기를 블로그에 공유했습니다. shy kids, Paul Trillo 등 총 7명의 아티스트와 작품을 공개했습니다. OpenAI는 소라 AI와 현직 아티스트의 협업을 통해 새로운 예술의 이정표를 제시했습니다. 이번 뉴스레터에서는 개인적으로 제 눈에 띄었던 영상 3가지와 OpenAI 소라 모델의 작동 원리에 대해 자세히
3월 18일 샘 올트먼이 Lex Fridman 팟캐스트에 다시 나와 인터뷰를 진행했습니다. 이번 인터뷰에서 샘 올트먼은 GPT-4, GPT-5, AGI에 대한 답변을 내놓았는데요. 어떤 내용을 언급했는지 하나씩 자세하게 살펴보겠습니다. GPT-4 Lex Fridman의 "GPT-4와 GPT-4 Turbo에서 가장 인상 깊었던 능력은 무엇인가요?"라는 질문에 샘 올트먼은 "솔직히 구리다."라고 답변했습니다.
이미지를 입력해 3D 모델링을 생성해 주는 AI 모델은 기존에 많이 개발되었습니다. 하지만 이번에 Stability AI에서 공개한 TripoSR은 준수한 성능과 더불어 생성 속도도 빠른데요. 이 모델이 무려 오픈소스로 공개되었습니다. Stability AI가 공개한 예시 이미지를 확인해 보면, 이전 어도비가 공개했던 3D 모델링 AI LRM보다 안보이는 면을 오브젝트의 특징을 살려 잘 표현한 것을
2월 29일 일론 머스크가 미국 샌프란시코 법원에 오픈AI와 샘 알트만을 계약 위반, 신의성실 의무 위반, 불공정 사업 관행 등의 혐의로 소장을 제출했습니다. 오픈AI가 MS와 계약한 수 십억 달러의 파트너십이 오픈AI 초기 창립 공약을 깼다는 주장입니다. 일론 머스크는 과거 2015년에 샘 알트먼과 오픈AI를 공동 창립했으나, 샘 알트먼이 영리를 추구하면서 둘 사이에
미국 반도체 스타트업 기업 그로크(Groq)가 챗GPT와 같은 실시간 채팅 모델의 새로운 인공지능(AI) 추론 칩을 공개했습니다. 이 AI 추론 칩은 '언어 처리 장치(LPU)'라고 부르는데 AI 연산을 매우 빠르고 효율적으로 처리할 수 있는 작은 컴퓨터 부품입니다. Groq LPU의 성능 먼저 LPU는 챗GPT, 그록, LLaMa, 제미나이
OpenAI가 Sora를 공개하고, 수많은 생성형 AI가 끊임없이 출시되고 있는 상황 속에 HBM 반도체에 대한 관심도 뜨거워지고 있습니다. 최근 SK하이닉스는 엔비디아에 HBM 공급 계약으로 선수금을 받았으며, 삼성전자는 엔비디아와 제품 적합성 테스트를 마치고 HBM 제품 공급 계약을 체결했습니다. HBM 반도체가 도대체 무엇이길래 선수금까지 주면서 공급 계약을 맺는 것일까요? HBM 반도체란? HBM이란 "
최근 어도비와 스탠포드 대학 연구진이 영상 배경 생성 AI ActAnywhere의 논문 자료를 공개했습니다. ActAnywhere은 영상 속 피사체의 움직임에 알맞는 영상 배경과 연출 효과를 생성하는 AI입니다. ActAnywhere은 현재 연구 결과에 대한 논문만 공개된 상태로 테스트할 수 없습니다. 대신 저와 함께 새로운 생성AI 기술에 대한 내용을 쉽게 살펴보시죠. ActAnywhere 소개 ActAnywhere은 위
최근 정말 다양한 AI 모델이 끊임없이 개발, 공개되고 있습니다. 새로운 모델과 기술의 발전 속도가 말이 안되게 빠른데요. 작년 9월 제 블로그에서 이미지를 사용해 음악을 생성하는 image to musicgen을 소개한 적이 있습니다. 생성된 음악의 퀄리티가 뛰어나진 않아도 상당히 놀라운 기술이었습니다. 그 뒤 6개월이 지나 이번엔 이미지를 넣으면 이미지에 맞는 '소리&
한국전자통신연구원(ETRI)이 이미지 생성 AI와 시각지능 기술을 결합해 프롬프트 입력 후 2초 만에 이미지를 생성하는 모델을 공개했습니다. ETRI는 OpenAI의 DALL-E3보다 이미지 생성 속도가 5배 빠른 '코알라(KOALA)'를 26일 허깅페이스에 공유했습니다. ETRI의 코알라(KOALA) 모델 소개 이미지 생성 AI로 유명한 DALL-E와 Stable Diffusion이 모델 성능과 해상도가 크게