성능·수행능력 검증하는 평가모델 공개
“서비스 품질 향상과 개발 효율화 선도”
엔씨소프트(이하 엔씨)는 국내 최초로 거대언어모델(LLM)의 성능과 수행능력을 검증하는 평가모델 ‘바르코 저지 LLM’을 출시했다고 23일 밝혔다.
바르코 저지 LLM은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 평가모델이다.
엔씨는 바르코 저지 LLM의 장점으로 우수한 LLM 편향 문제해결 능력과 한국어 성능을 꼽았다. 동급 모델 중 가장 높은 성능을 갖췄다고 분석했다. 올해 세계적인 권위를 갖는 NLP 학회 ‘EMNLP(Empirical Methods in Natural Language Processing)’에 LLM 평가모델 논문을 게재하기도 했다.
엔씨는 바르코 저지 LLM을 활용하면 AI(인공지능) 기반 서비스를 만드는 기업은 각종 LLM의 품질을 빠르게 비교 평가해 자사 서비스에 최적화한 모델을 채택할 수 있다고 설명했다.
AI 모델 연구개발 기업은 자사 LLM의 성능 수준을 평가모델로 검증해 타 모델 대비 성능 우위를 증명하거나, 약점을 빠르게 파악해 보강할 수 있다. 모델 허브(Model Hub) 사업자는 LLM을 선택, 최적화 및 배포하는 프로세스를 가속화해 효과적으로 모델을 제공할 수 있다.
엔씨는 게임 개발 과정과 사내 업무 효율화 전반에 AI 기술을 활용하고 있다. 이번 평가모델 출시를 통해 자체 LLM ‘바르코(VARCO)’의 품질 향상과 함께 LLM 모델 평가 분야에서 선도적 위치를 확보한다는 목표다.
엔씨 리서치 이연수 본부장은 “빠르게 진화하는 AI 시장에서 각자 산업에 맞는 최적의 모델을 선별하고 적용하는 서비스가 더욱 중요해지고 있다”며 “VARCO Judge LLM은 기존 LLM 기반 서비스의 품질 향상을 넘어 AI 비즈니스에서 없어서는 안 될 중요한 도구로 자리매김할 것”이라고 말했다.
©(주) 데일리안 무단전재 및 재배포 금지
- 한동훈의 엄중경고…”이재명, 조용히 결과 기다리고 재판 불복 말라”
- “직장서 쉬는시간 활용해 성관계 해라” 지시 내린 푸틴
- “모텔서 즐긴 남편, 상간녀는 ‘애 친구 엄마’였습니다”
- 김미애 “윤 대통령~한동훈 독대, 건강한 소통 위해 꼭 필요”
- 임종석 ‘두 국가론’ 일파만파…”북한 핵 쏠 명분 높일 수 있다”
- 추경호, 국회 찾은 오세훈 만나 “서울에 국고 지원 제대로…뜻 모으자”
- 경기도의회 민주 소통협력부대표단 9월 정책회의 개최
- [속보] 대통령실, 尹·한동훈 독대 여부에 “별도 협의할 사안”
- ‘정조대왕능행차’ 등 수원화성 일원 ‘가을 축제’ 열려
- TS, 미래 모빌리티 시대 이끌 신입 104명 선발