언어모델 0.4초 만에 처리…국산 온디바이스AI 반도체 개발

2024.03.06

254

국내 연구진이 전력 소모와 처리 시간을 크게 줄인 새로운 인공지능(AI) 반도체를 개발했다. 정부는 생성형 AI 산업의 경쟁력 강화를 위해 핵심 인프라인 AI반도체 개발을 적극 지원해나갈 방침이다.

과학기술정보통신부는 유회준 한국과학기술원(KAIST) 프로세싱인메모리(PIM)반도체연구센터 및 AI반도체대학원 교수 연구팀이 전력 소모가 400mW에 불과하고 0.4초 만에 상용 언어모델을 처리할 수 있는 새로운 AI반도체 ‘상보형 트랜스포머’를 세계 최초로 개발했다고 6일 밝혔다. 연구성과는 지난달 미국 샌프란시스코에서 열린 국제고체회로설계학회(ISSCC)에서 발표됐다.

상보형 트랜스포머는 ‘스파이킹 신경망(SNN)’와 ‘심층 인공신경망(DNN)이라는 서로 다른 신경망을 선택적으로 활용하는 반도체다. 사람이 생각을 많이 할 때는 뇌의 에너지 소모가 크고 적게 할 때는 에너지 소모가 작은 것처럼 반도체도 연산량에 따라 전력 소모를 줄일 수 있는 방향으로 두 신경망 중 하나를 선택해 연산할 수 있다는 것이다.

AI반도체 발전 방향. 사진 제공=과기정통부

연구팀은 이 같은 효율화를 통해 기존 GTP 모델을 돌리는 데 250W가 들었던 전력 소모량을 400mW 수준의 초전력으로, 동시에 가로·세로 4.5mm의 반도체 칩에서 연산하는 데 성공했다. 엔비디아의 구형 그래픽처리장치(GPU) A100과 비교하면 전력 소모는 625분의 1, 칩 면적은 41분의 1에 불과하다. 연산속도 역시 GPT-2 모델 기준 0.4초 만에 처리 가능했다. GPT-2는 AI모델의 성능지표인 파라미터(매개변수) 7억 800만 개를 가진다. 수천억 파라미터 규모의 초거대AI 모델보다는 작지만 최근 주목받는 온디바이스AI, 즉 엣지(말단) 기기에 들어가는 AI 연산에 주로 쓰인다. 연구팀은 “이번 연구 성과는 모바일 장치 등 에너지 제약이 높은 환경에서도 정확하게 거대 언어모델을 구동할 수 있어 온디바이스AI 구현을 위한 최적의 기술”이라고 강조했다.

연구팀은 향후 이 같은 뉴로모픽(신경) 컴퓨팅을 언어모델을 넘어 다양한 응용 분야로 연구범위를 확장할 계획이다. 유 교수는 “기존 AI반도체가 가진 전력 소모 문제를 해소했을 뿐만 아니라, GPT-2와 같은 실제 AI모델 응용을 성공적으로 구동했다는데 큰 의의가 있다”며 “뉴로모픽 컴퓨팅은 인공지능시대에 필수적인 초저전력·고성능 온디바이스AI의 핵심기술인만큼 앞으로도 관련 연구를 지속할 것”이라고 설명했다. 전영수 과기정통부 정보통신산업정책관은 “앞으로도 이러한 세계적인 연구성과를 지속적으로 낼 수 있도록 적극적으로 지원하겠다”고 했다.

원문링크 바로가기

언어모델 0.4초 만에 처리…국산 온디바이스AI 반도체 개발

경제 랭킹 인기글

아키스케치, 말레이시아 사라왁 디자인 센터와 소프트웨어 공급 계약 체결

버섯고기 위미트, 채식급식 트렌드 이끌어

아산나눔재단, ‘2024 아산 유스프러너 데모데이’ 성료 대상팀에 ‘교육부장관상’ 수여

뉴아인, 보듬음악심리발달센터에 눈 건강관리 기기 ’셀리나’ 100대 기부

“전자인계서 등록, 1분 만에 가능해요” 업박스, 올바로 시스템 ‘전자인계서 자동 연동’ 기능 오픈

젠엑시스, 농식품 · 바이오 분야 창업기업 투자유치 활성화를 위한 ‘젠엑시스 Value-up 배치 5기 2024 Closed IR Day’ 성료

경제 최신 인기글

“2024년 하반기 주목할 스타트업 트렌드… 반도체부터 AI 투자까지”

뮤즈블라썸, ICT R&D 혁신바우처 사업 ‘AI 영상콘텐츠 맞춤형 배경음악 솔루션’ 개발

테슬라의 인공지능 스타트업 ‘xAI’ 50억 달러 투자, 주주들과 이사회 투표로 결정될 전망

니어스랩 ‘카이든’, 60km 고정익 드론 격추 성공

모두싸인, 공공용 전자서명 서비스 GS 인증 1등급 획득

김용 전 세계은행 총재와 전 국민 마음 SOS 듣는다… 마인드풀커넥트, ‘마음구조챌린지’ 참가자 모집