헬로티 서재창 기자 | 그래프코어가 최신 MLPerf 1.1 벤치마크 테스트에서 자사의 IPU(Intelligence Processing Unit) 시스템이 기록적인 성능을 달성했다고 밝혔다. 이를 통해 그 규모가 점차 확대되면서 효율성과 성능, 소프트웨어 성숙도는 물론 사용 편의성이 꾸준히 향상되는 그래프코어 IPU 시스템의 경쟁력을 다시 한 번 입증했다. 9일인 오늘 온라인 기자간담회를 연 그래프코어는 최신 IPU-POD 시스템과 MLPerf 벤치마크 테스트 결과를 발표하고, 국내 AI 혁신 가속화를 위한 그래프코어의 계획과 국내 사업 성과 및 방향성 등에 대해 소개했다. 그래프코어 IPU 시스템은 지속적인 소프트웨어 최적화를 통해 향상된 성능을 제공하고 있다. 특히, 이번 MLPerf 벤치마크에서 그래프코어 IPU-POD16은 컴퓨터 비전 모델 ResNet-50 훈련에 있어 엔비디아의 DGX A100을 능가하는 성능을 보였다. ResNet-50을 훈련하는데 엔비디아 DGX A100은 29.1분이 걸린데 반해, 그래프코어의 IPU-POD16은 28.3분을 기록했다. 이는 소프트웨어만으로 첫 MLPerf 테스트 결과 대비 24%의 성능 향상을 이룬 것으로,
헬로티 서재창 기자 | 그래프코어가 최신 AI 연산 시스템 IPU-POD128과 IPU-POD256을 출시했다고 밝혔다. 각각 32페타플롭스(PFlops, 초당 3만2000조 번 연산), 64페타플롭스의 AI 연산속도를 지원하는 IPU-POD128과 IPU-POD256은 그래프코어가 지금까지 선보인 IPU-POD 시리즈 중 가장 높은 성능을 제공한다. 머신 인텔리전스 확장을 위해 특별 설계된 아키텍처로서 혁신적인 기능을 제공하는 해당 제품을 통해 그래프코어는 AI 슈퍼컴퓨팅에 대한 기술 역량을 한층 확대하게 됐다. 새로운 IPU-POD 시리즈는 시스템 전반에 걸쳐 대형 트랜스포머 기반 언어 모델을 빠르게 훈련시키고, 프로덕션 환경에서 대규모 상용 AI 추론 애플리케이션을 구동하는 것이 특징이다. 이뿐 아니라, 시스템을 더 작고 유연한 vPOD로 분할해 개발자의 IPU 활용도를 높이고, GPT 및 그래프신경망(GNN) 같은 새로운 모델을 활용해 과학적 발견을 가속화하도록 지원한다. IPU-POD128과 IPU-POD256은 BERT, ResNet-50과 같이 광범위하게 사용되는 언어 및 비전 모델을 활용한 벤치마크 테스트 결과에서 인상적인 훈련 성능과 효율적인
[헬로티] 인공지능 반도체 기업 그래프코어가 IT 기업 NHN과 기술적 협력을 위한 업무협약(MOU)을 7일 체결했다. 이번 협약은 차세대 AI 시스템에 특화된 그래프코어의 IPU-POD 시스템을 NHN의 AI 전략에 도입, 빠르게 성장하고 있는 국내 AI 생태계에 기여할 것으로 기대된다. 양사는 이번 업무협약을 통해 ▲오픈스택 등 주요 개발 기술 요소에 대한 공동 개발 협력 ▲NHN Cloud(클라우드)의 공공(Public) 시스템 공동 개발 협력 ▲공인된 AI 및 머신러닝 기관에 개발된 AI 클라우드의 연산 능력을 등재하기 위한 상호 협력 ▲다양한 AI 및 머신러닝 개발 생태계를 지원할 수 있는 마케팅 활동 상호 추진 등, 기술적 협력에 초점을 맞추며 시너지 효과를 극대화한다는 계획이다. 강민우 그래프코어 한국지사장은 “이번 협약은 국내 클라우드 업계를 선도하고 있는 NHN이 그래프코어 IPU의 장래성을 높이 평가했다는 점에서 유의미하다”며 “그래프코어는 앞으로도 AI 반도체 업계에서 독보적인 성능을 자랑하는 IPU를 앞세워 유수의 국내 공공 및 민간 기업들의 사업 수요를 충족하는 기술력을 선보일 예정”이라고 소감을 밝혔다. NHN 클라우드사업그룹 김동훈
[헬로티] AI 반도체 전문 기업인 그래프코어(Graphcore)는 그래프코어의 2세대 IPU(지능 처리 장치: Intelligence Processing Unit) 플랫폼인 ‘IPU-머신 M2000(IPU-Machine M2000)’을 출시했다. 해당 솔루션은 보다 큰 처리 능력과 메모리, 내장된 확장성을 바탕으로 극도의 머신 인텔리전스 워크로드를 처리 가능하며, 데이터센터급 연산 성능을 구현할 수 있다. IPU-머신 M2000은 플러그 앤 플레이 방식의 머신 인텔리전스 컴퓨팅 블레이드로, 간편한 구축을 위해 설계되었으며 대규모 확장이 가능한 시스템을 지원한다. 슬림한 블레이드 유닛 하나로 1 페타플롭(PetaFlop)에 달하는 머신 인텔리전스 컴퓨팅 성능을 구현하며, 인공지능(AI)의 스케일아웃(scale-out)에 최적화된 통합 네트워킹 기술을 탑재했다. ▲ IPU-머신 M2000 각각의 IPU-머신 M2000은 그래프코어의 새로운7나노미터(nm) 콜로서스 Mk2 GC200 IPU(Colossus Mk2 GC200 IPU) 프로세서 4개에 의해 구동되며, 그래프코어의 포플러(Poplar) 소프트웨어 스택의 완벽한 지원을 받는다. 기
[첨단 헬로티] 하드웨어를 통해 소프트웨어 성능의 한계를 보완하고 극복하며 소프트웨어와 하드웨어의 영역을 구분하는 것이 모호해졌다. 하드웨어로 시장의 성능 문제를 해결하며, 혁신을 주도해 나가는 스타트업들도 등장했다. 머신러닝, 딥러닝, 인공지능(AI)에 필요한 고속의 컴퓨팅 연산 ‘병렬처리’에 최적화된 GPU가 각광받고 있다. 이에 구글은 이 고속 컴퓨팅에 최적화된 칩을 만들어 공개했다. TPU(Tensor Processing Unit)이다. 이 알고리즘 성능을 올리기 위해서는 당연히 소스코드를 개선해야하지만, 구글의 TPU는 이를 하드웨어적으로 구현해 냈다. 성능을 올리기 위해선 간단히 칩 성능만 올리면 된다. 소프트웨어 알고리즘의 업그레이드와 하드웨어 칩 업그레이드가 맞붙게 된 것이다. 영국의 인공지능 반도체 스타트업 ‘그래프코어’은 마이크로소프트(이하 MS)에 AI 전용 반도체를 납품하기로 했다고 발표했다. MS는 이를 자사 클라우드 컴퓨팅 플랫폼 ‘애저(Azure)’에 탑재해 고객에 좀 더 편리한 AI 개발 환경을 제공할 계획이라 밝혔다. 그래프코어의 AI 반도체는 머신러닝에 특화된 I