초당 5천 조 연산하는 AI 개발... 연산성능 4배·전력효율 7배 ↑

2021.12.02 10:09:32

자율차, 클라우드, 데이터 센터 등 대규모 AI 서비스에 활용

헬로티 함수미 기자 |
 

 

한국전자통신연구원(ETRI)은 학습과 추론을 가속할 수 있는 시스템을 개발했다. 자체 개발한 AI 반도체를 활용한 결과이기에 더욱 의미 있는 결과다.

 

국내연구진은 고성능 AI 반도체 칩을 활용하여 낮은 전력으로 초당 약 5천조 회 연산이 가능한 인공지능 시스템을 개발했다.

 

사회 전반에 AI가 빠르게 도입됨에 따라 복잡하고 정교한 대규모 연산 처리의 필요성이 높아지고 있다. 하지만 기존 컴퓨터와 모바일에서 주로 활용된 중앙처리장치는 단순 계산에 최적화되어 있다는 한계가 있다.

 

이에 GPU가 주로 활용되고 있으나 구조적으로 인공지능 연산 처리에 최적화되어 있지 않아 데이터 지연 및 전력 낭비가 발생한다. NPU 기반 AI 반도체가 차세대 AI 두뇌로 떠오르는 이유다.

 

ETRI는 작년 NPU 기반 AI 반도체 칩, AB9을 공개한 데 이어 올해 AB9 기반 보드와 인공지능 시스템을 개발하는 데 성공했다. 자율주행차, 클라우드, 데이터센터, 사람·사물·음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 위함이다.

 

연구진이 개발한 NPU 보드 ‘ABrain-S’는 AB9을 기반으로 독자적인 설계를 이뤄 부피가 작으면서도 전력 소모가 낮다. 인공지능 알고리즘 처리를 위해 입출력 데이터를 16GB까지 저장할 수 있는 메모리와 데이터 이동 속도를 빠르게 하기 위한 인터페이스도 적용했다.

 

고성능·고효율 서버를 구현하기 위해서는 NPU 보드를 최대치로 고집적화하는 것이 핵심이라고 연구진은 전했다.

 

현재 AI 알고리즘 처리 가속기로 많이 활용되는 GPU 보드는 부피가 커서 1개 서버 노드에 6~7대밖에 장착할 수 없고 전력 소모도 높다. GPU의 구조적 한계 때문이다.

 

AB9이 내장된 NPU 보드는 한 서버 노드에 최대 20개씩 장착 가능하다. 기존 시스템 대비 공간·전력효율을 개선하면서 가격도 낮췄다. AB9이 동전 크기의 작은 면적에 초당 40조 회 연산 성능을 내면서도 전력 소모가 15W 수준으로 매우 낮기 때문이다.

 

이를 바탕으로 ETRI는 서버 노드 8개를 쌓아 랙 서버 형태로 구성된 인공지능 시스템, 아트브레인을 만들었다. 개발된 시스템은 최대 5페타플롭스 성능을 발휘한다.

 

서버 1개당 1초에 약 5천조 회 연산이 가능한 셈이다. 기존 GPU 기반 인공지능 서버 대비 약 4배의 연산 성능과 7배의 전력효율이다.

 

아트브레인이 데이터센터 등에 적용되면 처리 용량과 속도가 대폭 개선된다. 따라서 트랜스포머 계열 인공지능 알고리즘 등 초거대 인공신경망과 같이 데이터 처리와 학습에 엄청난 컴퓨팅 자원이 필요한 곳에 활용될 전망이다.

함수미 기자 etech@hellot.net
Copyright ⓒ 첨단 & automationasia.net



상호명(명칭) : ㈜첨단 | 등록번호 : 서울,아54000 | 등록일자 : 2021년 11월 1일 | 제호 : 오토메이션월드 | 발행인 : 이종춘 | 편집인 : 임근난 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2021년 00월00일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c)오토메이션월드 all right reserved