불붙은 K-AI 전쟁…카카오·엔씨 ‘중소형’으로 승부수

517
엔씨소프트가 오는 11월 사내 런칭 후 외부 공개할 예정인 AI 플랫폼 스튜디오 '바르코 스튜디오'의 디지털 휴먼 생성 및 편집, 운영 툴 소개 영상 / 사진=엔씨소프트 유튜브 채널 갈무리

엔씨소프트가 오는 11월 사내 런칭 후 외부 공개할 예정인 AI 플랫폼 스튜디오 ‘바르코 스튜디오’의 디지털 휴먼 생성 및 편집, 운영 툴 소개 영상 / 사진=엔씨소프트 유튜브 채널 갈무리

엔씨소프트가 오는 11월 사내 런칭 후 외부 공개할 예정인 AI 플랫폼 스튜디오 '바르코 스튜디오'의 디지털 휴먼 생성 및 편집, 운영 툴 소개 영상 / 사진=엔씨소프트 유튜브 채널 갈무리

불붙은 K-AI 전쟁…카카오·엔씨 ‘중소형’으로 승부수

이미지 확대보기

[한국금융신문 이주은 기자] 글로벌 굴지의 빅테크 기업들이 불러온 AI 열풍에 올 하반기 국내 기업들이 대거 가세한다. LG, KT, 네이버 등 대기업들이 수천억 개 매개변수(파라미터)를 활용한 대규모언어모델(LLM)을 선보이는 가운데 카카오와 엔씨소프트는 중소형 언어모델을 앞세워 시장에 출사표를 던지는 모습이다.

카카오와 엔씨소프트는 타사의 범용 LLM에 비해 적은 매개변수(13억개~1000억개)를 활용하는 중소형 언어모델 출시를 예고했다. LG의 엑사원2.0이 3000억개, 네이버의 하이퍼클로바 2040억개, 오픈AI의 챗GPT-3.5 1750억개, 구글의 팜 5400억개 매개변수를 사용한 데 비해 훨씬 작은 규모다. 서비스 맞춤형 AI 언어모델을 제공, 비용 효율성으로 승부를 보겠다는 구상이다.

일반적으로 매개변수 규모와 성능은 비례한다. 매개변수가 많을수록 어휘 구사 능력이 풍부해지기 때문이다. 다만 언어모델 크기와 학습 데이터셋이 많을수록 고사양 컴퓨터가 필요하고 GPU(그래픽처리장치), 전기 등 운영 비용이 많이 든다. 이런 측면에서 중소형 언어모델은 고사양 컴퓨터를 사용하지 않아도 머신러닝이 가능해 비용과 시간을 모두 절감할 수 있다는 장점이 있다. 데이터센터 가동 전력 비용도 비교적 낮다.

엔씨소프트의 바르코 LLM 출시 로드맵. / 사진=엔씨소프트 홈페이지 갈무리

엔씨소프트의 바르코 LLM 출시 로드맵. / 사진=엔씨소프트 홈페이지 갈무리

엔씨소프트의 바르코 LLM 출시 로드맵. / 사진=엔씨소프트 홈페이지 갈무리

불붙은 K-AI 전쟁…카카오·엔씨 ‘중소형’으로 승부수

이미지 확대보기

엔씨소프트는 지난 16일 자체적으로 개발한 AI 언어모델 ‘바르코 LLM’을 공개했다. 국내 게임업계 최초다.

엔씨의 자체 언어모델은 ▲기초 모델 ▲인스트럭션 모델 ▲대화형 모델 ▲생성형 모델 등 총 네 가지로 나뉜다. 각각 매개변수 규모에 따라 성능이 구분된다.

우선 엔씨는 소형·중형 규모의 한국어 전용 언어모델을 공개했다. 각각 매개변수 13억개, 64억개, 130억개를 활용했는데, 개인과 기업이 쉽게 활용할 수 있다는 점을 내세우고 있다. 모델의 종류는 기본 모델인 기초 모델과 지시문으로 튜닝해 원하는 목적으로 사용할 수 있는 인스트럭션 모델 두 가지로 구성된다.

이용자는 LLM을 활용해 간단한 일상 대화용 챗봇부터 문서요약이나 정보추출 등 AI 서비스 개발을 할 수 있을 것으로 보인다. 학습 데이터로는 AI 허브, 국립국어원, Common crawl(커먼크롤) 등에 공개된 자료를 활용했다.

엔씨는 이달 말 한국어와 영어를 모두 하는 이중언어 모델을 잇달아 출시한다. 또 ▲9월 창작 특화 언어모델 ▲11월 바로코 스튜디오(이미지, 텍스트, 디지털 휴먼 등 AI 플랫폼 서비스) 사내 런칭 ▲11월 대형 모델(매개변수 520억개) ▲내년 3월 멀티 모달 모델(매개변수 1000억개) ▲내년 상반기 바로코 스튜디오 외부 공개 등을 목표로 하고 있다.

향후 엔씨는 게임 콘텐츠 외에도 교육, 금융, 바이오 등 전문성 있는 분야와 협업을 이어간다는 방침이다.

카카오의 AI 개발 자회사인 카카오브레인이 지난 2021년 공개했던 언어모델 코GPT. 이보다 매개변수와 데이터 토큰 규모를 확장한 ‘코GPT 2.0’을 오는 10월 공개한다. / 사진제공=카카오브레인

카카오의 AI 개발 자회사인 카카오브레인이 지난 2021년 공개했던 언어모델 코GPT. 이보다 매개변수와 데이터 토큰 규모를 확장한 ‘코GPT 2.0’을 오는 10월 공개한다. / 사진제공=카카오브레인

카카오의 AI 개발 자회사인 카카오브레인이 지난 2021년 공개했던 언어모델 코GPT. 이보다 매개변수와 데이터 토큰 규모를 확장한 ‘코GPT 2.0’을 오는 10월 공개한다. / 사진제공=카카오브레인

불붙은 K-AI 전쟁…카카오·엔씨 ‘중소형’으로 승부수

이미지 확대보기

카카오(대표 홍은택닫기홍은택기사 모아보기)도 오는 10월 AI 언어모델 ‘코GPT 2.0’ 출시를 앞두고 한창 사내 테스트를 진행하며 모델을 고도화시키고 있다.

카카오는 합리적으로 적정 크기의 모델을 만들어 서비스에 적용한다는 계획이다. 비용과 퍼포먼스가 적절한 균형을 이룰 수 있도록 해 투자 효율을 높인다는 구상이다.

예를 들어 카카오톡 메시지 요약 등 비교적으로 난이도가 낮은 서비스에는 작은 파라미터 규모의 경량형 모델을 적용하는 식이다.

현재 내부에서 매개변수 60억개, 130억개, 250억개, 650억개 등 다양한 규모의 모델을 테스트하면서 비용 합리적인 AI 모델을 만드는 중인 것으로 알려졌다.

특히 카카오는 자회사 카카오엔터프라이즈에서 제공하는 AI 학습·추론 관련 클라우드 인프라 활용을 확대해 투자 비용을 내재화할 예정이다.

AI와 결합할 여러 서비스 중 카카오톡 비즈니스 커뮤니케이션에서 가장 먼저 성과가 날 전망이다. 배달이나 여행 등 업종에서 제공하는 주문·예약·상담·결제 등 서비스에 AI를 접목하면 일대일 양방향 커뮤니케이션이 가능해져 유의미한 성과가 날 수 있다는 거다.

홍은택 카카오 대표는 지난 2분기 실적 발표 컨퍼런스콜에서 “누가 먼저 초거대 언어모델을 구축하는지가 아니라 누가 비용 합리적으로 적정 모델을 만들어 서비스에 적용하느냐가 핵심”이라고 말했다.

이주은 기자 nbjesus@fntimes.com

+1
0
+1
0
+1
0
+1
0
+1
0