불붙은 이미지 생성 AI 전쟁
메인 이미지
© Unsplash

불붙은 이미지 생성 AI 전쟁

🔎 핵심만 콕콕

  • 이미지 생성 AI 시장의 경쟁이 치열합니다.
  • xAI의 그록-2를 중심으로 딥페이크 관련 논란도 커지는데요.
  • 구글 등 AI 기업은 이미지 생성 AI의 안전장치를 강화하고 나섰습니다.

이미지 생성 AI 춘추전국시대

🖼 이미지 생성형 AI 열풍: 말만 하면 인공지능(AI)이 원하는 이미지를 생성해주는 시대가 왔습니다. AI 챗봇인 챗GPT의 등장과 함께 AI 산업이 급속도로 발전하며 이미지 생성형 AI 시장의 성장도 빨라졌는데요. 주요 빅테크 기업의 경쟁도 치열합니다.

1️⃣ 달리(Dall-E): 챗GPT 개발사 오픈AI가 2021년 출시한 이미지 생성 AI로, 다양한 프롬프트(명령)를 입력해 원하는 이미지를 생성할 수 있습니다. 챗GPT와 연결돼 전체 맥락에 대한 이해가 뛰어나다는 장점이 있죠. 특히 지난 15일부터는 챗GPT 유료 이용자만 사용할 수 있던 달리3을 무료 이용자에게도 일부 개방했습니다.

2️⃣ V6: 미드저니의 이미지 생성 AI로, 편집 옵션이 다양해 일러스트레이션과 디자인 분야에 특화돼 있습니다. 하지만 커뮤니티 디스코드(Discord)를 통한 접속만 가능하고 영어에 최적화돼 있다는 단점도 있죠.

3️⃣ 스테이블 디퓨전: 스태빌리티 AI의 인공지능 모델로, 달리, 미드저니와 함께 3대 이미지 생성형 AI 모델로 떠오른 스테이블 디퓨전은 커스터마이징이 쉽고, 비용이 저렴하다는 장점이 있습니다.

4️⃣ 파이어플라이: 어도비가 작년 9월 출시한 이미지 생성 AI입니다. 100개 이상의 언어로 텍스트 프롬프트를 지원하는데요. 파이어플라이로 생성한 이미지는 저작권 문제 없이 상업적으로도 안전하게 사용할 수 있다는 것이 장점입니다.

5️⃣ 그록: 일론 머스크가 작년 7월 설립한 xAI에서 선보인 AI 챗봇입니다. 이미지 생성 AI가 탑재된 그록-2는 대학원 수준의 과학 지식을 평가하는 GP QA 벤치마크에서 56점을 기록해 챗GPT-4 터보(48점)와 구글의 제미나이 프로5(46.2)보다 높은 수준을 자랑했죠.

 

머스크의 그록-2, 논란의 중심에 서다

🤷 진짜야, 가짜야?: AI의 이미지 생성 능력이 발전하면서 딥페이크로 인한 위협도 늘어납니다. AI 기술을 이용해 이미지나 영상을 합성하는 딥페이크가 오용되며 사회적 문제로 떠오르는데요. 유명인을 합성한 그럴듯한 이미지를 만들어 사회적 혼란을 일으키거나 개인의 명예를 훼손하는 사례가 더 빈번해졌죠.

🔎 딥페이크: 인공지능의 딥러닝(Deep Learning)과 가짜(Fake)를 합친 단어로, 인공지능을 이용해 사람의 이미지나 영상, 음성 등을 합성하는 기술입니다. 딥페이크가 여러 분야에 악용되면서 부정적인 뉘앙스를 내포한 단어라고 착각할 수 있지만, 딥페이크라는 용어 자체는 가치중립적입니다.

💣 논란의 주인공, 그록-2: 특히 일론 머스크의 xAI가 출시한 그록-2의 이미지 생성 기능이 출시 초기부터 논란의 중심에 섰습니다. 그록-2에 선정적이거나 혐오 논란을 야기할 수 있는 프롬프트를 입력해도 그대로 이미지를 제작해주기 때문입니다. 머스크가 총기를 난사하고, 트럼프 전 대통령이 9.11 테러를 일으키는 듯한 이미지도 생성돼 인터넷상에서 유포됩니다.

🤔 머스크, 노린 거야?: 그록-2의 가장 큰 특징은 콘텐츠 생성에 있어 제한이 거의 없다는 점입니다. 자체적인 수위 조절이 전혀 되지 않는 셈인데요. 일론 머스크 CEO는 이번 딥페이크 논란이 화두에 오르자, 그록을 “세계에서 가장 재미있는 AI”라고 말해 논란을 키웠죠.

 

'안전한 모델' 만드는 빅테크

🗨 안전성 강조하는 구글: 딥페이크 관련 안전성 우려가 지속되는 가운데, 구글은 지난 15일 안전성을 강화한 이미지 생성 AI ‘이마젠3’를 출시했습니다. 작년 12월 ‘이마젠2’를 출시한 지 8개월 만인데요. 구글은 이마젠3가 원하는 이미지를 언어로 설명하면 그에 맞는 이미지를 생산하는 텍스트 투 이미지(text-to-image) 생성에서 최고의 성능을 보이는 모델이라 자부했습니다.

⛑ 이번에는 뭐가 다른데?: 구글의 이마젠3는 특히 안전성에 초점을 둔 모델입니다. 유해한 이미지 생성은 사전에 차단하고, 유명인의 이미지는 생성 자체가 불가하도록 설정됐죠. 또, 이마젠3로 생성한 이미지에는 디지털 워터마크가 표시되는데요. 이를 통해 실제 이미지로 착각하는 것을 방지해 이미지 오남용을 막을 수 있습니다.

🔒 AI에 요구되는 안전장치: AI의 안전성 논란이 불거지면서, 다른 기업도 하나둘 안전장치를 추가하는 모습입니다. 가령, 달리3는 공인의 이름을 포함해 이미지를 요청하거나 살아있는 예술가의 모습을 모방해달라고 요청할 경우, 이를 거부하도록 설정돼 있죠.

하루 10분, 경제를 읽는 가장 쉬운 방법
하루 10분,
경제를 읽는 가장 쉬운 방법
지금 뉴스레터를 구독하고 월~금 아침 6시, 최신 경제 뉴스를 받아 보세요!
지금 구독하고 월~금 아침 6시,
최신 경제 뉴스를 받아보세요!
(필수) 에 동의합니다.