OpenAI가 챗GPT의 코드 출력에서 오류를 식별하기 위해 GPT-4 모델을 기반으로 훈련한 CriticGPT를 공개했습니다. CriticGPT는 GPT-4 모델이 작성한 응답을 검토하고, 사람을 대신해서 AI의 오류를 찾아준다고 합니다. 즉, AI가 AI를 보조해 서로 피드백을 주면서 발전할 수 있게 되었습니다. CriticGPT도 챗GPT와 비슷하게 RLHF로 훈련되었는데요. 앞서 설명한 것처럼 CriticGPT는 실수(오류)가 포함된 입력(
구글이 새로운 생성 모델 Generating audio for video를 공개했습니다. 이 모델은 업로드된 비디오 영상에 알맞은 사운드트랙을 생성해 줍니다. 현재 영상 생성 모델의 발전 속도에 비해 무음 영상만 출력하고 있어 구글 딥마인드가 나서서 만들었다고 합니다. 먼저 구글 딥마인드가 공개한 영상을 함께 확인하시죠. 영상과 함께 입력한 프롬프트로 생성된 사운드입니다. 영상 길이에 따라
안녕하세요. 부루퉁입니다. 급성 요추 염좌와 밀린 일정으로 인해 이제서야 에코 회원 여러분을 다시 만나 뵙게 되었습니다. 걱정 끼쳐드려 죄송합니다. 그동안 뉴스레터를 전달하지 못한 만큼 양질의 소식으로 만회하도록 하겠습니다. 오늘은 제 블로그에 2편으로 나눠 소개했던 글을 집중 요약해서 여러분과 함께 자연스러운 애니메이션 영상을 만들어 보도록 하겠습니다. 2가지 생성형 모델 중 비상업용
Anthropic이 LLM의 내부 작동 방식 해석에 대한 흥미로운 논문을 발표했습니다. 기존의 AI는 입력과 출력만 확인되는 블랙박스 방식으로 작동하기 때문에 특정한 응답이 왜, 어떻게 나오는지 이해하기 어렵습니다. 그래서 모델이 해롭거나, 편향되거나, 거짓된 응답을 하는지 하지 않는지 신뢰하기 어렵습니다. 하지만 엔트로픽은 Claude Sonnet 모델의 내부에서 수백만 개의 개념이 어떻게 표현되는지 확인하는 데
5월 14일 구글 I/O 2024에서 최신 AI 기술과 개발자 기회를 강조하는 다양한 발표가 진행되었습니다. 특히 제미나이 1.5와 Astra 프로젝트 시연을 통해 실시간 상호작용 기능과 안드로이드 업데이트를 중점적으로 소개했습니다. 제미나이 1.5: 고급 AI 텍스트 생성 및 AI Overvews 이번 행사에서 가장 주목받은 발표 중 하나는 제미나이 1.5의
5월 14일 오전 2시(한국 시간) 오픈AI가 봄 업데이트를 발표했습니다. 이번 업데이트는 UI를 단순화하고 GPTs스토어와 앱을 개선했다는 내용과 함께 새로운 모델 GPT-4o(GPT-4 omni)와 향상된 음성모드를 선보였습니다. 이번에 공개한 GPT-4o는 인간과 컴퓨터의 자연스러운 상호작용을 목표한 모델로, 텍스트, 오디오, 이미지 등의 모든 조합을 입력으로 받고, 출력 생산한다고 합니다. GPT-4o는 평균
24년 4월 말에 출시된 im a good gpt2 chatbot과 also a good gpt2 chatbot이 최근 성능이 좋다는 평가가 퍼지면서 이슈가 되었습니다. 웹사이트 LMSYS에 갑자기 등장한 GPT2 chatbot. 국내 커뮤니티와 해외 커뮤니티 모두 GPT-4.5 모델이 아닌지, GPT-5 공개전 리허설 테스트인지 의심하고 있는 상황입니다. 현재 오픈AI는 GPT2 모델에 대해 공식적인 입장을
2024년 5월 1일부터 3일까지 삼성동 코엑스에서 열린 AI 엑스포 2024는 올해로 7회를 맞이했습니다. 각종 생성형 AI 모델이 등장한지 1년이 조금 지난 현재, 이번 AI 행사는 세계 5대 인공지능 전시회로 많은 인파와 관심으로 위상을 드높였습니다. 전시회에 참여한 기업들은 챗GPT, 라마, 솔라 등 오픈소스 LLM 모델을 활용해 AI비서, AI상담, AI 안전 시스템,
GPT-4의 등장부터 Claude3, Gemini, LLaMa3까지 다양한 생성형 언어모델이 등장할 때마다 MMLU, GPQA, DROP 등 알기어려운 용어의 항목에 점수가 매겨집니다. 이 점수를 통해 LLM(언어모델)이 어떻게 뛰어난지, 어떤 LLM을 능가했는지, 어떤부분에서 강점을 보여주는지 알 수 있습니다. 컴퓨터의 CPU, GPU 성능에 대한 벤치마크 랭킹을 확인하듯, 앞으로는 인공지능에 대한 벤치마크도 더 자주
현재 메타의 수석 AI 과학자 얀 르쿤이 AI를 도약시킬 아키텍쳐 '제파'를 개발 중이라고 밝혔습니다. 얀 르쿤은 인공지능 분야, 딥 러닝과 컴퓨터 비전 분야의 선구자로, GPT 모델과 같은 대규모 언어 모델은 '지능을 가진 것처럼 보이는 단순한 패턴 인식기'라고 비판했던 인물입니다. 얀 르쿤은 '현재 LLM
Arc2Face 소개 얼굴 사진을 한 장 넣으면 비슷한 얼굴 사진을 생성해주는 모델이 등장했습니다. Arc2Face는 사람의 얼굴 특징을 정확하게 알아내고, 그 정보를 바탕으로 새로운 얼굴 사진을 만들어냅니다. 마치 사람의 얼굴을 그리는 화가가 얼굴의 모든 세부사항을 잘 파악해서 그리는 것처럼 Arc2Face도 사람의 얼굴을 잘 그려낼 수 있습니다. 이 프로그램은 사진 데이터베이스인 WebFace42M을
24년 3월 25일 OpenAI가 영상 아티스트들을 통해 완성한 영상 작품과 제작 후기를 블로그에 공유했습니다. shy kids, Paul Trillo 등 총 7명의 아티스트와 작품을 공개했습니다. OpenAI는 소라 AI와 현직 아티스트의 협업을 통해 새로운 예술의 이정표를 제시했습니다. 이번 뉴스레터에서는 개인적으로 제 눈에 띄었던 영상 3가지와 OpenAI 소라 모델의 작동 원리에 대해 자세히