화웨이, SMIC 등 중국 기업들은 미국의 강력한 제재에도 불구하고 반도체 개발에서 괄목할만한 진전을 보이고 있습니다. 중국이 보여주고 있는 AI 칩 생산 능력의 발전은 ‘중국에 대한 기술 고립 정책’의 한계를 보여주고 있습니다.
2022년 10월 미국 바이든 행정부는 중국의 첨단 반도체 및 슈퍼컴퓨터 기술 개발을 억제하기 위해 포괄적인 수출 통제 조치를 발표했습니다. 중국 통제 조치의 핵심은 아래 두 가지입니다.
- 엔비디아 H100 등 첨단 반도체 및 슈퍼컴퓨터 관련 기술 수출 제한
- 네덜란드 ASML의 반도체 제조 장비 및 기술 수출 제한
지난 2년 6개월동안 미국의 중국 반도체 억제 정책으로 인해 반도체 분야에서 중국의 기술 야망이 수년 후퇴할 것이라는 것은 자연스러운 결론으로 여겨졌습니다. 그러나 이 결론은 뒤집혀졌습니다. 중국이 반도체 일부 분야에서 뒤처지고 있는 것은 사실이지만, 특히 전략적으로 중요한 AI 칩 분야에서는 놀라울 정도로 빠르게 따라잡고 있습니다. 가장 놀라운 사실은 엔비디아 H100과 경쟁할 수 있는 화웨이 Ascend 910D 발표입니다(참고로 아직 양산 단계는 아닙니다).
이 글에서는 중국 반도체 산업이 어떻게 발전하는지 살펴보면서, 한국 경제가 얻을 수 있는 시사점을 분석하겠습니다.
Ascend 910D외에도 놀라운 사건은 2025년 4월 화웨이가 384개 Ascend 910C 칩을 16개 랙에 배치한 AI 시스템인 “CloudMatrix 384”입니다.
CloudMatrix 384에는 HBM2E 메모리가 탑재되어 있으며, 이를 통해 CloudMatrix 384는 총 49.2TB의 메모리를 자랑합니다.
파이낸셜 타임스의 보도와 SemyAnalysis의 분석에 따르면 CloundMatrix 384는 부분적으로 엔비디아의 블랙웰 200(GB 200)의 성능을 뛰어넘습니다.
위 표에서 ‘연산 성능’을 보십시요. 엔비디아 GB200 NVL 72 대비 무려 2배에 달합니다. 이렇게 뛰어난 성능의 비결은 확장에 있습니다. 개별 Acend 칩의 성능은 엔비디아 블랙웰 대비 약 1/3에 불과합니다. 이를 연결된 칩의 수를 통해 보완하고 있습니다. 무려 384개를 연결하고 있으니까요. 여기에는 화웨이의 뛰어난 통신 기술이 적용되고 있습니다. 고속 광학 네트워크로 칩 사이의 통신 효율이 극대화되고 있습니다.
단점도 뚜렷합니다. 위 표의 ‘전력 소비’에서 확인할 수 있는 것처럼 화웨이의 CloudMatrix 384는 엔비디아 GB200 대비 2배 이상의 전력을 소비합니다. 하지만 중국은 세계 최대 규모의 태양광 네트워크와 신규 원자력 발전소까지 방대한 에너지 자원을 보유하고 있습니다. 따라서 전력 소비는 중국에게 장애물이 아닙니다.
참고로 2024년 중국에서 태양광과 원자력 발전이 크게 성장했습니다. 중국의 태양광 발전 용량은 277GW를 기록했으며, 원자력은 중국 전체 전력의 4%를 생산하여 444 TWh에 달했습니다. 태양광과 풍력 등 새로운 에너지 발전은 중국의 전력 수요 증가를 상쇄는 역할을 했습니다. 물론 아래 그림에서 확인할 수 있는 것처럼 중국 에너지는 절대량 기준 석탄 발전에 의존하고 있습니다. 그러나 그 의존도는 빠르게 줄고 있습니다.
참고로 중국에 2024년 새롭게 추가된 태양광 에너지 생산량은 전 세계에 추가된 태양광 에너지의 55%를 차지합니다.
AI 학습과 AI 서비스 운영과 관련된 데이터 센터 신축 및 가동에서 있어 고성능 AI 칩보다 전기 또는 전력이 더 강력한 병목 요인입니다. 중국은 상대적으로 높은 전력 가용성을 보여주고 있습니다. 따라서 중국은 데이터센터를 쉽게 확장할 수 있고 앞으로 계속 확장할 것입니다.
화웨이에서 칩 설계를 담당하는 사업부는 하이실리콘(HiSilicon)입니다. 하이실리콘은 2023년 11월 자사의 Ascend 910B가 특정 부문 테스트에서 엔비디아의 A100보다 뛰어나다고 주장했습니다(로이터 보도). 2024년 6월 미국 조지타운대학교 보안 및 신흥 기술 센터(CSET)의 분석가들은 이 두 칩이 거의 유사한 수준이다라는 보고서를 공개했습니다. 엔비디아 A100은 2020년 기준 세계 최고로 평가받은 칩입니다. 중국이 이를 추격하는데 3년이 걸리지 않았습니다. 이제 중국이 H100, GB200가 경쟁하고 있습니다. 이러한 맥락에서 엔비디아 젠슨 황은 2025년 5월 21일 미국 정부의 중국 반도체 규제 정책은 실패(failure)했다고 강하게 비판하고 있습니다.
반도체 생산 설비 기술, 여전히 뒤처져
반도체 설계와 달리 반도체 생산에서 중국과 타이완 및 한국의 격차는 여전히 크며, 그 격차는 더디게 좁혀지고 있습니다. 중국 반도체 생산기업(파운드리) SMIC는 7나노 칩을 생산할 수 있습니다. 파이낸셜 타임스의 보도에 따르면, SMIC는 화웨이와 함께 5나노 생산설비를 개발하고 있습니다. 이에 비해 삼성전자와 TSMC는 2나도 칩 양산을 준비하고 있습니다. 따라서 반도체 생산에서 기술 격차는 여전히 작지 않습니다.
중국의 가장 큰 약점은 첨단 반도체 생산에서 핵심인 리소그래피 기술 부재에 있습니다. 리소그래피는 반도체를 만들 때 회로 모양을 웨이퍼 위에 빛으로 새기는 기술입니다. 7나도 보다 작은 칩 생산에는 네덜란드 ASML의 극자외선 노광(EUV) 장비가 반드시 필요합니다. 미국 정부는 2019년부터 ASML이 이러한 첨단 장비를 중국에 공급하는 것을 차단했습니다.
리소그래피 기술에서 중국 자체의 진전은 아직 불분명합니다. ASML의 중국 경쟁사는 SMEE입니다. SMEE는 9나노 칩을 생산할 수 있는 노광 장비를 판매하고 있으며, 2024년 9월 5나노 노광 장비 관련 특허를 출원한 상태입니다. 물론 2024년 9월에 공개된 중국 투자기업 지우팡 인베스트먼트의 분석에 따르면, SMEE는 ASML보다 여전히 15년에서 20년 뒤처져 있습니다.
미국 제재 우회: TSMC 웨이퍼 및 삼성전자 HBM 구매
그렇다면 화웨이, SMIC, SMEE 등이 미국 정부의 제재를 어떻게 우회할 수 있었을까요? 중국 정부 및 중국 기업들이 기초 과학 기술에 대한 막대한 투자를 오랜 기간 진행해 온 것을 별도로 두겠습니다. SemiAnalysis의 보도에 따르면, 미국 정부의 수출 금지에도 불구하고 화웨이가 TSMC로부터 7나노 웨이퍼를 계속 공급받아 이를 화웨이 칩 생산에 사용해 왔습니다. 화웨이는 소프고(Sophgo)라는 (우회) 기업을 통해 약 5억 달러 상당의 7나노 웨이퍼를 구매했습니다. 이 사실이 밝혀진 이후 TSMC는 스프고에 대한 납품을 중단했고, 미국 정부는 2025년 4월 TSMC에 10억 달러의 벌금을 부과했습니다(로이터 보도).
화웨이는 또한 AI 칩의 핵심 구성요소인 HBM(고대역폭 메모리) 역시 우회경로로 구매하고 있습니다. 화웨이는 CoAsia 및 Faraday와 같은 기업을 통해 삼성전자로부터 HBM을 공급받고 있습니다.
엔비디아 CUDA와 경쟁하는 화웨이 CANN
중국의 가장 큰 과제는 아마도 하드웨어가 아닐 것입니다. 소프트웨어가 가장 큰 도전입니다. 첨단 칩으로 AI 데이터센터를 구축하고 효율적으로 운영하는데 있어 엔비디아 CUDA 플랫폼은 강력한 필요조건입니다. 엔비디아가 가지고 있는 막강한 GPU 시장 지배력에서 CUDA는 핵심 역할을 담당하고 있습니다. CUDA는 개발자들이 현재 가장 많이 사용하는 머신러닝 또는 딥러닝 프레임워크인 파이토치(PyTorch)와 AI 모델을 훈련시킬 때 필요한 수학 계산을 자동으로 처리하는 잭스(JAX)가 작동할 수 있도록 해 주는 핵심 엔진입니다. 쉽게 이야기하면 CUDA는 엔비디아 AI 칩이라는 하드웨어와 파이토치, 잭스 등 소프트웨어를 연결하는 소프트웨어입니다. 약 500만명 이상의 개발자가 사용하고 있는 CUDA는 데이터센터를 구축 및 운영하는 기업이 엔비디아 칩에서 벗어나기 어렵게 만드는 해자(moat)입니다.
화웨이는 CUDA와 경쟁할 수 있는 CANN(Compute Architecture for Neural Networks)을 선보이고 있습니다. CANN 플랫폼은 중국 개발자들의 CUDA 의존도를 낮추기 위해 특별히 개발되었습니다. ChinTalk의 타이완 특파원 릴리 오팅거(Lily Ottinger)에 따르면, 화웨이는 가장 널리 사용되는 딥러닝 프레임워크 파이토치(PyTorch)와 CANN의 통합을 가장 중요한 전략 중 하나로 설정하고 있습니다. 화웨이는 자사 칩에서 파이토치 모델을 실행할 수 있도록 지원할 뿐아니라, 2023년 10월부터 파이토치 재단의 주요 회원사로 활동하며 프레임워크 추가 개발에 영향을 미치기 위해 노력하고 있습니다. 그러나 다수 중국 개발자들은 CANN에 심각한 문제가 있다고 지적하고 있습니다. 파이낸셜 타임스에 따르면, 화웨이 자사 연구원 중 한 명은 CANN이 Ascend 칩을 (오히려) “사용하기 어렵고 불안정하게 만든다”고 비판하고 있습니다.
CANN의 불안정성 그리고 작은 CANN 개발자 커뮤니티 규모 등의 문제에도 불구하고 화웨이는 CANN을 포기하지 않을 겁니다. 중국 반도체 독립(?)의 완성은 하드웨어와 함께 소프트웨어에 있기 때문입니다.
한국에 주는 교훈
- 중국 기술 수준을 인정해야 합니다: AI 칩 분야에서 중국 기업이 이룬 진전은 실제적이고 중요합니다. 중국이 미국 정부의 제재로 인해 기술적으로 고립되어 있으며 기술 격차가 커지고 있다는 가정은 이제 성립하지 않습니다.
- AI 훈련과 AI 실행을 분리하다: 중국 기업의 중요한 전략 중 하나는 AI 모델 훈련과 AI 모델 실행을 분리하는 것입니다. 중국 정부는 ONNX(Open Neural Network Exchange)라는 방법론을 통해 엔비디아 하드웨어에서 훈련된 AI 모델을 중국 화웨이 AI 칩에서 실행시키는 전략을 구현하는데 성공하고 있습니다. 이러한 ONNX 기반 훈련과 실행 분리 전략은, 엔비디아 칩의 높은 가격과 공급 부족으로 인해 AI 실행마저 못하고 있는 세계 각 국과 기업에게 하나의 대안이 될 수 있습니다.
- 지정학적 위험은 높지만…: 그렇다고 한국 기업이 화웨이 AI 칩을 적극 사용하는 것은 미국 정부의 반대라는 큰 위험을 가져올 수 있습니다. 그러나 아프리카나 동남아시아 등의 상황은 어떨까요? 이들 국가가 오픈소스로 제공되는 AI 모델을 화웨이 칩 기반 데이터센터에서 적극 운영한다면 빠르게 AI 서비스를 각 국가에 확산시킬 수 있습니다.
- 개발자 생태계 문제: 중급 AI 칩을 둘러싼 소프트웨어 환경(CANN)과 개발자 생태계는 엔비디아 CUDA 대비 훨씬 덜 성숙한 상태입니다. 이는 중국 AI 칩 확산에 학습 비용 및 호환 문제 등 추가적인 비용을 의미합니다. 중국 AI 칩 적용을 고려할 때 이 비용 또한 함께 고려되어야 합니다.
한국 정부 및 한국 기업의 의사 결정권자들은, 이후 반도체 및 AI 정책 결정에서 중국이 반도체 분야에서 예상보다 빠르게 움직이고 있다는 점을 인정하는 것부터 시작해야 합니다. 특히 AI 애플리케이션 또는 AI 서비스 분야에서 중국 기술과 서구 기술과의 격차가 예상보다 훨씬 빠르게 좁혀지고 있습니다. 딥시크, 알리바바의 Qwen 모델, 마누스 등 중국은 세계 최고 수준의 거대언어모델과 AI 응용 서비스를 보여주고 있습니다.
물론 첨단 리소그래피와 CUDA와 같은 소프트웨어 개발환경에서 중국은 근본적인 약점을 아직 가지고 있습니다. 이러한 약점은 미국과 중국 사이의 기술 격차가 앞으로도 몇 년 동안 지속될 것임을 시사합니다. 그러나 수 십년은 아닙니다.
한국은, AI 인프라가 무엇을 의미하고 AI 인프라가 왜 중요한지 긴급하게 논의할 필요가 있습니다. 단순한 AI 칩 보급을 넘어 중국처럼 전체 AI 생태계를 고려한 현실적인 AI 인프라 전략이 시급히 필요합니다. 기술 주권 또는 AI 주권, 이른바 소버린 AI는 AI 인프라 전략의 결과이지 목표가 아닙니다.
AI 관련, 이미 많은 곳에서 기차는 역을 떠났습니다. 전 세계 많은 곳에서 값비싼 엔비디아 칩 대신 상대적으로 저렴한 화웨이 기반 솔루션을 선택하는 경우도 점점 더 많아질 것입니다. 한국을 앞서는 곳이 미국과 중국만은 아닐 것이라는 뜻입니다. 그렇다면 한국의 대안은 무엇일까요?