미국 빅테크의 우선순위가 바뀌고 있습니다. 구글은 인공지능 연구를 로봇공학과 신체화된 시스템 중심으로 개편하고 있습니다. 엔비디아 CEO 젠슨 황은 더 이상 컴퓨팅 파워만 언급하지 않고 피지컬 AI—신체를 가진 AI—에 대해 이야기하고 있습니다. 테슬라는 2026년 피지컬 AI로 대규모 시장을 열 준비를 서두르고 있습니다. 이렇게 피지컬 AI(Physical AI)는 다음 성장 동력으로 자리매김하고 있습니다.
ChatGPT 등 거대언어모델(LLM)은 “다음에 올 단어”를 (확률적으로) 예측 및 생성합니다. 반면 피지컬 AI의 월드 모델(World Foundation Model)은 “다음에 올 세계의 상태”를 예측 및 생성합니다. 이는 미묘한 차이로 들릴 수 있지만, 경제적으로는 새로운 차원을 의미합니다. ChatGPT 등 거대언어모델의 시장은 아직 디지털 경제에 제한되어 있습니다. 공장, 물류, 농업, 건설 등을 포함하는 물리적 경제는 디지털 경제보다 훨씬 더 큰 규모를 차지합니다. 이러한 배경에서 피지컬 AI는 아직 초기 단계지만 이미 시작된 산업혁명이며 메가 트렌드가 될 것이라는 전망들이 쏟아지고 있습니다. 현재는 본격적인 상용화 직전에 있는 연구 및 시범 단계입니다. 피지컬 AI는 기술적 진전이 빠르지만, 아직 상용화 문턱을 넘었다고 보기는 어렵습니다.
이 글은 월드 모델과 피지컬 AI의 개념, 초기 적용 사례, 해결되지 않은 과제 그리고 왜 당분간 실험실 및 파일럿 단계에 머물 가능성이 높은지를 분석합니다.
말에서 세계로: 단어 예측 vs 세계 예측
현재의 거대언어모델(LLM), 예를 들어 ChatGPT는 수십억 개의 문장을 학습해서, “이 다음에는 어떤 단어가 올 확률이 높을까?”를 계산합니다. 월드 모델은 질문 자체가 다릅니다.
- “컵을 책상 끝에서 밀면 어떻게 될까?”
- “공을 던지면 어디로 날아갈까?”
- “로봇 팔이 이 물체를 이렇게 잡으면, 미끄러질까? 깨질까? 잘 옮겨질까?”