초거대 AI에 도전하는 카카오

초거대 AI에 도전하는 카카오

카카오가 초거대 AI ‘KoGPT’를 선보였는데요. 네이버의 '하이퍼클로바'와 어떤 점이 다른지 알아볼까요?

🐹 BONA
🐹 BONA

ⓒ Flickr

카카오의 초거대 AI KoGPT 공개

‘초거대AI’를 선점하기 위한 네이버와 카카오의 AI 기술 확보 경쟁이 치열해지고 있습니다. 네이버가 국내 최초로 초거대 AI ‘하이퍼클로바’를 공개한 후 반년 만에 카카오도 초거대 AI ‘KoGPT’를 선보였는데요. AI 기술의 자립도를 높이고 미래의 AI 생태계에서 우위를 점하기 위해 초거대AI 기술 확보가 기업의 중심 과제가 되고 있습니다.


우리나라는 KoGPT를 통해 한국어 특화 초거대 AI를 총 2개 확보하게 되었습니다. 초거대 AI는 슈퍼컴퓨터를 기반으로 대용량 데이터를 빠르게 처리할 수 있고, 적은 데이터만으로도 빠른 학습이 가능한데요. 데이터 분석과 학습을 넘어 인간의 뇌처럼 스스로 추론하고 창작할 수 있다는 점에서 수많은 분야로 활용 가능한 초거대 AI는 IT업계 시장의 흐름을 바꿀 것으로 예상됩니다.


하이퍼클로바와 맞붙는 KoGPT

전 세계적인 초거대 AI 개발 경쟁에서의 핵심은 큰 모델을 구현하는 것입니다. 보통 매개변수의 규모가 커질수록 AI 성능이 높아지기 때문이죠. 다만, KoGPT의 매개변수는 60억개로 하이퍼클로바가 2,040억개, 일론 머스크가 설립한 오픈AI의 GPT-3가 1,750억개임을 고려하면 모델 규모가 훨씬 작습니다.


또, 학습 데이터를 살펴봐도 기존 모델들에 비해 규모가 작은데요. KoGPT는 2,000억개 토큰, 하이퍼클로바는 5,600억개 토큰의 한국어 데이터를 기반으로 개발됐습니다. 하이퍼클로바는 학습 데이터 중 한국어 비중이 97%에 달해 세계에서 가장 큰 한국어 거대 언어모델을 구축했죠. 네이버는 이미 검색어 교정, 쇼핑 기획전 생성, 쇼핑 리뷰 요약 등 다양한 서비스에 이를 적용하고 있습니다.


규모는 조금 작지만 KoGPT도 하이퍼클로바와 같이 한국어 특화 모델로 다양한 기능을 제공합니다. KoGPT는 문장의 긍정과 부정 판단, 긴 문장 한 줄 요약, 결론 예측, 문맥을 이해하고 질문에 답하기 등 다양한 언어 과제를 처리할 수 있는데요. 맥락에 따라 자동으로 글을 쓸 수도 있어 향후 상품 소개 글 작성, 감정 분석, 기계 독해, 기계 번역 등에 활용될 수 있을 것으로 보입니다.


하이퍼클로바와 다른 KoGPT 만의 특징은 대중성입니다. KoGPT 사용 대상은 사회적 기업, 소셜 벤처, 스타트업 등입니다. 모델을 최초 공개하는 동시에 KoGPT를 최대 오픈소스 커뮤니티 깃허브에 오픈 소스로 무료 개방한 점도 대중성에 부합하는데요. 네이버는 하이퍼클로바의 대중화를 강조했지만, 모델을 깃허브에서 공개하지 않았습니다.


앞으로 KoGPT 개발 방향은?

카카오브레인은 향후 언어모델 규모 100배 이상 확대, 단점을 극복하기 위한 알고리즘 재설계, 대규모 언어 데이터셋 구축 등을 추진하겠다고 밝혔습니다. 특히 한국어뿐만 아니라 영어, 일본어, 베트남어 등 동남아시아 언어까지 확장해서 더 많은 곳에서 AI 기술의 혜택을 누릴 수 있게 할 예정이죠.


특히 향후 초거대 AI에 블록체인 기술을 더하는 것을 검토한다는 점에서 기존 모델들과 다릅니다. 블록체인 위에서 언어모델은 추가되는 데이터를 반영해서 학습되고 모델 규모도 지속해서 커지는데요. 언어모델 학습 연산을 도와주거나 데이터를 제공하는 등 기여한 사람들은 모델의 지분 일부를 갖게 되고, 누군가 모델을 사용했을 때 사용료를 지분만큼 지급받는 생태계를 구상하고 있습니다.

🐹 BONA

카카오는 컨퍼런스에서 KoGPT를 공개한 것 외에도 수수료 제로 개방형 거래 플랫폼 구축 계획, 카카오톡 신분증을 이용한 디지털 사원증과 디지털 명함인 톡명함 성과 등을 발표했는데요. 네이버의 컨퍼런스 데뷰는 오는 24일 열릴 예정입니다.

1 이달에 읽은
무료 콘텐츠의 수

BYTE의 프리미엄 콘텐츠 구독 서비스, BYTE+⭐️

월 9,900원으로 BYTE의 모든 콘텐츠를 자유롭게 이용하세요!

Powered by Bluedot, Partner of Mediasphere
닫기