AI 그림을 생성할 때 가장 고질적인 문제가 무엇이였다고 생각하시나요? 아마도 가장 많은 사람들이 해결되기를 원했던 부분은 AI 이미지 캐릭터의 일관성이였습니다. 어떤 사람들은 캐릭터 일관성 문제가 해결이 되면 동화책을 만드는 것, 혹은 AI 인플루언서를 제작하는 것, AI 필름을 제작하는 것 여러가지 활용 할 수 있기 때문에 나름의 게임 체인저라고 생각했습니다.
그러나 그것을 해결하는 것이 쉽지 않았는데요. 스테이블 디퓨전을 활용한 사례들은 있었지만 언제나 뒤따르는 상업적인 활용에서 100% 자유로울 수 없었기 때문에 어려움이 많았습니다. 그러나 이제 이 부분을 미드저니에서 어느정도 해결했습니다. 미드저니의 캐릭터 일관성 업데이트가 화제입니다. --CREF 를 활용하여 생성한 AI 인플루언서 2명을 아래 소개해드립니다. (직접 보시고 일관성이 얼마나 잘 유지되는지 확인해보세요)
위 이미지를 보면 어떻게 생각하시나요? 캐릭터 일관성이 생각보다 잘 지켜진다고 생각하실 수 있으실것이라 생각합니다. 솔직히 제가 기대한 것보다 생각보다 잘 나왔습니다. 저는 솔직히 설마 애들 장난 수준이겠지라고 생각했거든요. 그러나 이제 장난이 아닌 수준으로 정말 비슷하게 보입니다.
실제 사람도 여러 각도에서, 다른 장소에서, 컨디션에 따라서, 조명에 따라서 조금씩은 다르게 보이는데 그정도를 생각한다면 정말 캐릭터 일관성을 많이 유지하게 되었고 AI 그림에 새로운 게임 체인저가 되었다고 생각합니다.
해외 커뮤니티에서도 많이 화제가 되고 있습니다.
그러니까 어떻게 하는 걸까?
캐릭터 일관성 프롬프트 구성은 간단합니다.
미드저니로 캐릭터를 생성
위와 같은 프롬프트 구성
프롬프트가 끝나는 곳에 --cref 를 입력하고 그 뒤에 1번에서 생성한 이미지의 url을 입력
그 이후에 --cw 50 (설정할 수 있는 옵션, 0에서 100까지 가능 쉽게 생각해서 0은 얼굴만 비슷 나머지는 창적, 100은 얼굴, 옷, 그외 헤어 등) 을 설정할 수 있습니다.
이런식으로 구성하여 장소와 배경만 다르게 하면 됩니다. 만약 정말 왕초보 분들은 이미지의 url 이라던지 실제로 어떻게 하는지 보고 싶으신 분들도 계실텐데 그런 경우 아래 영상을 확인하시면 자세하게 아실 수 있습니다.
AI 이미지가 일관성을 갖을 때 생각할 부분들은 무엇일까?
레나와 소현의 이미지는 미드저니를 통해 모두 제가 생성한 이미지입니다. 가상의 AI 인플루언서라고 볼 수 있는데 여러장의 이미지가 동일 인물처럼 보인다는것은 정말 많은 발전이라고 생각합니다.
이렇게 캐릭터가 일관성있게 생성 될 때 우리는 무엇을 생각해볼 수 있을까요? (기존의 스테이블 디퓨전에서도 가능했지만 상업적 이용의 한계 등)
AI 인플루언서 활용 사례!
1. 소셜 미디어 계정 운영
캐릭터가 일관성있게 나온다는 것은 포스팅을 하여 AI 인플루언서 계정을 운영할 수 있다는 것을 의미합니다. 단순히 선정적인 것이 아닌 실제로 제품을 홍보 할 수 있는 모델을 추후 더 완벽하게 만들어낼 수 있을것으로 예상됩니다.
2. 이커머스에 활용
이커머스에 종사하는 사람들은 추후 AI 인플루언서를 활용하여 브랜드 제품을 홍보할 수 있을것입니다. 아직 완벽하지 않지만 서서히 보이기 시작합니다.
간단한 사례들을 생각해볼 때도 캐릭터 일관성이 유지된다는 것은 큰 의미입니다. 미드저니는 이외에도 추가적인 업데이트를 예고했습니다.
모델 개인화가 어떻게 가능할지 궁금해지는데 실제로 나와보면 알겠습니다. 스테이블 디퓨전의 이점중에 강력한 부분들에 미드저니가 선을 넘어오고 있는듯한 느낌입니다.
에이전트는 오늘도 인류를 위해
인공지능 기술의 선두주자 OpenAI가 최근 소수의 투자자들을 대상으로 한 비공개 발표를 통해 미래 AI 개발 로드맵을 공개하면서 업계의 이목을 집중시키고 있어요. 이번 발표는 단순히 기술적 진보를 넘어, 우리 삶의 방식을 근본적으로 뒤바꿀 가능성을 내포하고 있다는 점에서 더욱 주목할 만한데, 핵심은 바로 인간처럼 생각하고 행동하는 'AI
안녕하세요. AI Korea 뉴스레터 구독자 여러분 Solo AI Lab의 Sai 입니다. 오늘은 특별한 뉴스레터를 써보려고 하는데요. 데이터 분석 및 연구자, 완전히 바꿔놓은 놀라운 경험에 대해 이야기해보려고 해요. 바로 여러 개의 AI 언어 모델을 동시에 활용하는 '멀티 LLM' 사용기예요.
"LLM이 뭐예요?" 하고 궁금해하시는 분들이 계실 것 같네요.