부루퉁의AI

부루퉁의AI

네이버 상위 1% AI 전문 블로그를 운영하고 있는 부루퉁입니다. 챗GPT, 미드저니 등 다양한 생성형 AI에 대한 정보와 경험을 공유하고 있습니다.

부루퉁의AI
Members Public

LLM(언어모델) Benchmark 항목, 용어 정리

GPT-4의 등장부터 Claude3, Gemini, LLaMa3까지 다양한 생성형 언어모델이 등장할 때마다 MMLU, GPQA, DROP 등 알기어려운 용어의 항목에 점수가 매겨집니다. 이 점수를 통해 LLM(언어모델)이 어떻게 뛰어난지, 어떤 LLM을 능가했는지, 어떤부분에서 강점을 보여주는지 알 수 있습니다. 컴퓨터의 CPU, GPU 성능에 대한 벤치마크 랭킹을 확인하듯, 앞으로는 인공지능에 대한 벤치마크도 더 자주

부루퉁의AI
Members Public

메타 얀 르쿤 "AGI 도약 아키텍처 '제파(JEPA)' 개발 중" 트랜스포머와 제파의 차이점

현재 메타의 수석 AI 과학자 얀 르쿤이 AI를 도약시킬 아키텍쳐 '제파'를 개발 중이라고 밝혔습니다. 얀 르쿤은 인공지능 분야, 딥 러닝과 컴퓨터 비전 분야의 선구자로, GPT 모델과 같은 대규모 언어 모델은 '지능을 가진 것처럼 보이는 단순한 패턴 인식기'라고 비판했던 인물입니다. 얀 르쿤은 '현재 LLM

부루퉁의AI
Members Public

얼굴 사진을 생성해 주는 Arc2Face 모델 등장

Arc2Face 소개 얼굴 사진을 한 장 넣으면 비슷한 얼굴 사진을 생성해주는 모델이 등장했습니다. Arc2Face는 사람의 얼굴 특징을 정확하게 알아내고, 그 정보를 바탕으로 새로운 얼굴 사진을 만들어냅니다. 마치 사람의 얼굴을 그리는 화가가 얼굴의 모든 세부사항을 잘 파악해서 그리는 것처럼 Arc2Face도 사람의 얼굴을 잘 그려낼 수 있습니다. 이 프로그램은 사진 데이터베이스인 WebFace42M을

부루퉁의AI
Members Public

OpenAI 소라 영상 아티스트가 만든 영상과 소라 모델의 작동 원리

24년 3월 25일 OpenAI가 영상 아티스트들을 통해 완성한 영상 작품과 제작 후기를 블로그에 공유했습니다. shy kids, Paul Trillo 등 총 7명의 아티스트와 작품을 공개했습니다. OpenAI는 소라 AI와 현직 아티스트의 협업을 통해 새로운 예술의 이정표를 제시했습니다. 이번 뉴스레터에서는 개인적으로 제 눈에 띄었던 영상 3가지와 OpenAI 소라 모델의 작동 원리에 대해 자세히

부루퉁의AI
Members Public

샘 올트먼 팟캐스트 인터뷰 내용 정리 및 AI 기술 로드맵 공개

3월 18일 샘 올트먼이 Lex Fridman 팟캐스트에 다시 나와 인터뷰를 진행했습니다. 이번 인터뷰에서 샘 올트먼은 GPT-4, GPT-5, AGI에 대한 답변을 내놓았는데요. 어떤 내용을 언급했는지 하나씩 자세하게 살펴보겠습니다. GPT-4 Lex Fridman의 "GPT-4와 GPT-4 Turbo에서 가장 인상 깊었던 능력은 무엇인가요?"라는 질문에 샘 올트먼은 "솔직히 구리다."라고 답변했습니다.

부루퉁의AI
Members Public

Stability AI, 3D 모델링 AI TripoSR 오픈소스 공개

이미지를 입력해 3D 모델링을 생성해 주는 AI 모델은 기존에 많이 개발되었습니다. 하지만 이번에 Stability AI에서 공개한 TripoSR은 준수한 성능과 더불어 생성 속도도 빠른데요. 이 모델이 무려 오픈소스로 공개되었습니다. Stability AI가 공개한 예시 이미지를 확인해 보면, 이전 어도비가 공개했던 3D 모델링 AI LRM보다 안보이는 면을 오브젝트의 특징을 살려 잘 표현한 것을

부루퉁의AI
Members Public

샘 알트먼을 고소한 일론 머스크, 이유는?

2월 29일 일론 머스크가 미국 샌프란시코 법원에 오픈AI와 샘 알트만을 계약 위반, 신의성실 의무 위반, 불공정 사업 관행 등의 혐의로 소장을 제출했습니다. 오픈AI가 MS와 계약한 수 십억 달러의 파트너십이 오픈AI 초기 창립 공약을 깼다는 주장입니다. 일론 머스크는 과거 2015년에 샘 알트먼과 오픈AI를 공동 창립했으나, 샘 알트먼이 영리를 추구하면서 둘 사이에

부루퉁의AI
Members Public

스타트업 그로크(groq) 차세대 추론 엔진 인공지능(AI)칩 공개

미국 반도체 스타트업 기업 그로크(Groq)가 챗GPT와 같은 실시간 채팅 모델의 새로운 인공지능(AI) 추론 칩을 공개했습니다. 이 AI 추론 칩은 '언어 처리 장치(LPU)'라고 부르는데 AI 연산을 매우 빠르고 효율적으로 처리할 수 있는 작은 컴퓨터 부품입니다. Groq LPU의 성능 먼저 LPU는 챗GPT, 그록, LLaMa, 제미나이

부루퉁의AI
Members Public

생성형 AI의 뜨거운 감자 AI 반도체 HBM이란?

OpenAI가 Sora를 공개하고, 수많은 생성형 AI가 끊임없이 출시되고 있는 상황 속에 HBM 반도체에 대한 관심도 뜨거워지고 있습니다. 최근 SK하이닉스는 엔비디아에 HBM 공급 계약으로 선수금을 받았으며, 삼성전자는 엔비디아와 제품 적합성 테스트를 마치고 HBM 제품 공급 계약을 체결했습니다. HBM 반도체가 도대체 무엇이길래 선수금까지 주면서 공급 계약을 맺는 것일까요? HBM 반도체란? HBM이란 "

부루퉁의AI
Members Public

어도비 배경 생성AI ActAnywhere

최근 어도비와 스탠포드 대학 연구진이 영상 배경 생성 AI ActAnywhere의 논문 자료를 공개했습니다. ActAnywhere은 영상 속 피사체의 움직임에 알맞는 영상 배경과 연출 효과를 생성하는 AI입니다. ActAnywhere은 현재 연구 결과에 대한 논문만 공개된 상태로 테스트할 수 없습니다. 대신 저와 함께 새로운 생성AI 기술에 대한 내용을 쉽게 살펴보시죠. ActAnywhere 소개 ActAnywhere은 위

부루퉁의AI
Members Public

소리를 생성하는 AI 모델 Image to SFX 소개

최근 정말 다양한 AI 모델이 끊임없이 개발, 공개되고 있습니다. 새로운 모델과 기술의 발전 속도가 말이 안되게 빠른데요. 작년 9월 제 블로그에서 이미지를 사용해 음악을 생성하는 image to musicgen을 소개한 적이 있습니다. 생성된 음악의 퀄리티가 뛰어나진 않아도 상당히 놀라운 기술이었습니다. 그 뒤 6개월이 지나 이번엔 이미지를 넣으면 이미지에 맞는 '소리&

부루퉁의AI
Members Public

한국 ETRI 2초만에 이미지 생성하는 코알라AI(Koala AI) 공개!

한국전자통신연구원(ETRI)이 이미지 생성 AI와 시각지능 기술을 결합해 프롬프트 입력 후 2초 만에 이미지를 생성하는 모델을 공개했습니다. ETRI는 OpenAI의 DALL-E3보다 이미지 생성 속도가 5배 빠른 '코알라(KOALA)'를 26일 허깅페이스에 공유했습니다. ETRI의 코알라(KOALA) 모델 소개 이미지 생성 AI로 유명한 DALL-E와 Stable Diffusion이 모델 성능과 해상도가 크게