스태빌리티 AI 폭주! 업그레이드된 SDXL 예고!
casual, simple thin line, grey hedgehog in the grass

스태빌리티 AI 폭주! 업그레이드된 SDXL 예고!

Cinnamomo di Moscata

무한 전력질주

지난 7월 6일, Stability AI(스태빌리티 AI)의 CEO인 에마드 모스타크(Emad Mostaque)가 스테이블 디퓨전 XL(Stable Diffusion XL; 이하 SDXL)의 연구 보고서와 출시 날짜를(7월 18일 예정이었음) 공개했는데요1 2, 과연 기존 스테이블 디퓨전(이하 SD)와 무엇이 같고 무엇이 달라졌을까요?

1. 섬세한 묘사 성능

좌: 기존 SD 이미지 / 우: SDXL 이미지

SDXL에서는 기존의 SD 모델들처럼 오픈소스인 것은 동일하지만, 기존 모델들과 달리 학습량이 대폭 늘어났고, 특히 새로 도입된 Refiner(리파이너; 정제기) 기술 덕에 AI 이미지 특유의 디테일 뭉게짐이 대폭 해결되었다고 하네요.

2. 더 높아진 용량과 복잡한 구조

SDXL과 기존 모델의 차이점
SDXL의 전체 구조

그 때문에 파라미터(데이터의 양)는 기존 SD의 865M(8.65억)의 약 3배에 달하는 2.6B(26억)개에 달하고, 용량도 이에 맞춰서 14GB로 훌쩍 뛰어 올랐다고 해요.

당연하게도 사양도 많이 올랐기 때문에 사용하기 위해서는 RTX 40시리즈와 RAM 용량 추가 같은 컴퓨터 업그레이드가 추천된다고 해요.

3. 훨씬 다양해진 화풍

데이터의 양이 늘어난 만큼 다양한 화풍을 그릴 수 있게 되었는데요, 특히 아니메풍이나 캐주얼풍, 수채화풍 등 기존에는 따로 학습할 필요가 있었던 스타일도 이제는 기본 모델에서 프롬프트만 잘쳐도 몇 분 안에 바로 뽑아낼 수 있게 되었습니다!

4. 사용자 친화적

SDXL은 제작 초기부터 손쉬운 UI로 이미지 생성 AI의 대중화에 기여한 AUTOMATIC1111(이하 오토매틱)과3 kohya-ss(이하 코히야)4 등과 적극적으로 협력했기 때문에 프로그래머들이 일일히 정보를 반영해야 했던 기존 SD 모델과는 달리 누구나 더 쉽게 다룰 수 있게 되었다고 해요.

학습한 이미지가 잘리거나 사이즈가 맞지 않아도 알아서 배우도록 개선된 SDXL
crop 조건으로 물체를 원하는 위치에 배치할 수 있도록 개선된 SDXL

그 뿐만 아니라, 파인 튜닝을 위한 학습 방식도 똑똑해져서, 이제는 이미지를 자르거나 수정할 필요 없이 간단한 조건만 설정해주면 SDXL이 알아서 원하는 데이터만 배우도록 개선되었다고 해요.

하지만 잠시 연기

불행하게도, SDXL은 원래 7월 18일 정식 공개 예정이었지만 어떤 모델이 가장 좋은지 심사숙고하느라 계획된 일정에서 1주일 정도 뒤로 출시를 미루었다고 해요5. 빨리 만나 볼 수 없다는 것이 아쉽지만, 인류에게 더 우수한 AI를 제공하기 위한 그들의 노력을 생각하면 참아볼만한 것 같아요.

배우는 속도보다 빠르게

이처럼 AI는 적응할 듯 싶으면 SDXL과 같이 훨씬 업그레이드 된 모델이 나오고, 다시 배우기를 반복하는 무한 성장을 계속하고 있어요, 지금 당장은 끊임없이 배우느라 힘겨울 수도 있겠지만, 에코와 함께 차근차근 준비한다면 지루하고 반복적인 루틴에서 벗어나 언제나 재미있고 창의적인 일만 하는 새로운 나날이 찾아올 것이라고 믿어요.

Cinnamomo di Moscata (글쓴이) 소개

게임 기획자를 준비중입니다. AI 아티스트로도 활동하고 있습니다. Stable Diffusion을 주로 사용합니다. https://www.instagram.com/cinnamomo_di_moscata/

(1) Mostaque, E. (2023). "Paper up on Arxiv for #SDXL 0.9! Target open (CreativeML) #SDXL release date (touch 🪵) 18th July 🎯 Team looking at different, more advanced, variants to pick release candidate Research access for 0.9 will widen shortly please apply here if interested https://t.co/gIUX9s46CZ". Twitter. https://twitter.com/EMostaque/status/1676923097159712768

(2) arXiv:2307.01952

(3) AUTOMATIC1111. (2023). stable-diffusion-webui/CHANGELOG.md at dev. GitHub. https://github.com/AUTOMATIC1111/stable-diffusion-webui/blob/dev/CHANGELOG.md

(4) kohya-ss. (2023). sd-scripts at sdxl. GitHub. https://github.com/kohya-ss/sd-scripts/tree/sdxl

(5) Lanz, J. (2023). Hold Your Horses: Stability AI Delays Stable Diffusion XL v1.0 Release. Yahoo!finance. https://finance.yahoo.com/news/hold-horses-stability-ai-delays-172210023.html

Comments