[닥터몰라의 IT이야기]'빅3'의 시행착오: 슈퍼컴과 AI라는 '두 마리 토끼'

인텔·AMD·엔비디아, 제각각의 방법 모색
병렬성 바탕 고성능 제품 개발 뒷 이야기

등록 2017-07-29 오전 6:10:00

수정 2017-07-29 오전 6:10:00
가 가

[IT 벤치마크 팀 닥터몰라] 인텔을 CPU 제조사로만 보는 시선이 많지만 사실 이들의 제품 포트폴리오는 대단히 다양화되어 있다. 그 중에는 AMD나 엔비디아가 먼저 진출해 높은 점유율을 보이고 있는 GPU 기반 연산 가속장치도 있다. 개별 코어의 성능이 상대적으로 높지만 이를 1~32개 집적한 CPU와, 개별 코어의 성능은 떨어지지만 이를 4000~5000여개 집적한 GPU의 접근법 중 후자가 점증하는 기계학습·인공지능 시장의 덕목과 맞아떨어지기 때문이다. 이를 한 마디로 줄이면 ‘병렬성’이 된다.

인간이 모방할 수 없는 ‘고도로 정밀한’ 계산을 수행하는 전통적 슈퍼컴퓨터, 즉 계산기로서의 기대역할은 어느 순간 ‘덜 정밀하더라도 동시다발적인’ 막대한 연산을 누적해 인간 두뇌의 학습을 모방하는 기계학습으로 바뀐 바 있다.

◇인텔, 아톰 CPU 기반 ‘제온파이’ 가격 대대적 인하

CPU에 뿌리를 둔 인텔답게 ‘GPU형’ 연산 가속장치에도 그들만의 색채를 가미했다. 통상적인 CPU보다는 개별 코어의 성능이 떨어지지만 GPU보다는 높고, 소비전력이 낮은 장점을 가진 ‘아톰’ 코어를 60-70개 집적해 전통적인 CPU와 전통적인 GPU 그 중간쯤 어딘가를 겨냥한 것이다. 이 제품을 우리는 ‘제온 파이’라고 부른다.

최근 인텔은 제온 파이의 가격을 대폭 인하했다. 최상위 모델의 가격이 6500~6700달러에서 3200~3300달러로 인하폭은 무려 절반을 상회한다. 이외에도 3800달러 모델이 1900달러로, 2500달러인 최하위 모델이 1800달러로 인하되는 등 라인업 전반에 걸쳐 가격 조정이 있었는데, 재미있는 사실은 이 모든 과정이 소리소문없이 ‘전격적’으로 단행되었다는 것이다.

한 기업이 아무런 이유 없이 잘 팔리는 제품의 가격을 내릴 이유는 없다. 연내 출시 예정인 차세대 제온 파이 ‘나이츠 밀’이 이번 가격인하의 배후일 가능성이 점쳐지는 이유다. 마침 상후하박의 인하폭과 조용한 가격 조정은 전형적인 신제품 출시 직전의 징후이다.

나이츠 밀은 기계학습·인공지능 시장을 겨냥해 16비트 반정밀도(Half Precision, FP16), 8비트 정수(INT8) 연산성능을 강화한 것이 특징이다. 반면 현세대 제온 파이는 전통적 슈퍼컴퓨터 시장을 겨냥해 64비트 배정밀도(Double Precision, FP64) 연산성능이 좋다. 이들은 통상적인 세대교체와 달리, 서로 다른 시장을 겨냥하는 것이 뚜렷하기에 당분간 상호보완적 라인업을 구축해 공존할 것으로 예상된다.

앞서 인텔은 현세대 제온 파이를 출시하며, 진정한 차세대 칩셋 ‘나이츠 힐’을 예고한 바 있으나 이후 한동안 로드맵에서 찾아볼 수 없었다. 주된 이유는 역시 10nm 제조공정으로의 이전이 순탄치 않았기 때문일 것이다. 이름이 비슷해서일까, 나이츠 힐의 공백기에 갑자기 툭 튀어나온 나이츠 밀이 그 대체재라 오인하기 쉽지만 나이츠 힐은 슈퍼컴퓨터와 기계학습·인공지능 시장을 동시에 겨냥하는 전혀 다른 제품이다.

반면 나이츠 밀은 슈퍼컴퓨터 시장을 겨냥하지 않고, 현세대와 같은 14nm(나노미터) 제조공정을 사용하는 차이가 있다. 즉 인텔은 전면적인 세대교체에 수반되는 비용을 절감하기 위해, 현세대 제온 파이와 나이츠 힐의 중간 단계로 현세대 제조공정을 재활용한 나이츠 밀을 투입함으로써 뜨고 있는 기계학습·인공지능 시장의 수요에 임시 대응하려는 것이다.

제조공정을 진화시키지 않으면서 더 낮은 정밀도의 연산성능을 발전시키는 방향은 두 세대 전 엔비디아가 추구한 것과 같다. 당시 엔비디아는 TSMC의 28nm 제조공정에 발목잡힌 채 두 세대의 GPU 개발을 끌었는데, 배정밀도 성능을 중시한 ‘케플러’의 후속으로 이를 제거한 ‘맥스웰’을 투입한 한편 요구되는 정밀도가 낮은 모바일용 맥스웰에 반정밀도 가속 기능을 파일럿으로 도입해본 경험이 있다.

◇인텔 나이츠밀과 비슷한 결을 가진 AMD ‘베가’

흥미롭게도, 조만간 등장이 예정된 AMD의 새 GPU ‘베가’ 역시 나이츠 밀과 비슷한 의의를 갖는 것으로 보인다. 지난 1월 공개된 개요에 따르면 베가는 반정밀도 및 8비트 정수연산 가속에 최적화되어 있음이 강조되었으나 어떤 이유에선지 전통적으로 AMD GPU의 강점이던 배정밀도 연산성능에 대해서는 언급이 없었다. 반면 차세대 GPU ‘나비’가 슈퍼컴퓨터 및 기계학습·인공지능 시장에 모두 대응한다고 밝힌 것에 미루어 베가는 슈퍼컴퓨터 시장을 겨냥하지 않았다는 행간의 의미를 유추해볼 수 있다.

전후의 맥락을 종합할 때 베가가 전통적 슈퍼컴퓨터 시장에 적합하지 않은 단 하나의 이유가 배정밀도 연산성능의 부재 이외의 무엇이라고는 생각하기 어렵다. 그리고 그 후속작 나비는 높은 정밀도와 낮은 정밀도를 모두 지원할 것임을 엿볼 수도 있다. 정확히 나이츠 밀-나이츠 힐로 이어지는 인텔의 행보와 닮은꼴을 그리는 것이다.

이렇듯 인텔과 AMD는 특정 정밀도의 연산성능에 특화된 칩을 먼저 내놓고, 높은 정밀도와 낮은 정밀도 양쪽 모두에 대응하는 칩을 후속으로 내놓는 단계별 접근을 취하는 점에서 닮아 있다. 제조공정이 두 세대 지연된 끝에 차차기 제품(나이츠 힐, 나비)이 도래할 시기에나 신공정을 도입하는 것도 우연의 일치이겠지만 같다.

한편, 오늘날 엔비디아는 이들과 대조적인 접근법을 취하고 있다. 지난달 공개된 차세대 GPU ‘볼타’는 반정밀도 및 8비트 정수연산 가속을 지원할 뿐만 아니라 칩 내부에 일종의 행렬연산용 고정기능 하드웨어인 ‘텐서 코어’를 내장해 행렬연산을 더욱 빨리 수행하는 것이 특징이다.

기계학습에 다량의 행렬연산이 요구되는 점에 착안, 칩셋의 설계 자체를 이제까지와 전혀 다른 방향으로 개조한 것이다. 그러면서도 뛰어난 배정밀도 연산성능을 유지해 현존하는 GPU 중 전통적 슈퍼컴퓨팅에도, 기계학습·인공지능용으로도 최고의 성능을 갖게 되었다.

이는 앞서 케플러-맥스웰 과도기에 배정밀도 연산성능을 들어내버린 것과는 전혀 다른 움직임이다. 현세대 ‘파스칼’ GPU의 경우 엔비디아는 아예 설계노선이 전혀 다른 두 칩 GP100과 GP102를 투 톱으로 내세우며 GP100은 배정밀도와 반정밀도 연산에 특화시키고, GP102는 8비트 정수연산에 특화시키는 대신 반정밀도 성능을 의도적으로 제한하는 쌍봉형 라인업을 구축한 바 있다. 그러나 볼타에서는 어떤 수준의 정밀도에서도 연산성능을 희생시키지 않은 것이다.

다만 이러한 접근법의 차이를 단순히 서로 반대되는 것이라고만은 볼 수 없기도 하다. 앞서 언급했듯 엔비디아 역시 두 세대 전에는 인텔, AMD와 같은 시행착오를 겪은 바 있고 그로부터 도출된 것이 지금의 행보일 것이니 말이다. 지금 당장의 단면으로 보아 대척점에 선듯한 인텔·AMD와 엔비디아의 접근법 차이는 단지 시간차를 두고 반복되는 역사의 흐름이었을 뿐일지 모른다.