어쩌면 올해의 마지막 글이 될 수도 있겠군요. 저희가 전망하는 커머스 산업 그리고 그 변화를 추동하고 있는 대규모실행모델(Large Actioin Model), 그리고 최적화의 과제를 포괄적으로 담고 있는 글로 2025년 마무리하고자 합니다.
AI 분야에서 대규모언어모델(LLM)이 텍스트 생성을 자동화하고, 멀티모달 형태로 다양한 미디어를 다룰 수 있게 된 것처럼, 이제 대규모실행모델(Large Action Model)은 복잡한 업무 프로세스 전체를 자동화할 가능성을 열고 있습니다. LAM은 언어 구사 능력을 바탕으로 사람과 소통하고, 변화하는 상황에 적응하며, 다른 LAM과 협력하는 등 지능적으로 세상과 상호작용할 수 있습니다. Agentic Commerce 시대의 실행 주체라고도 말할 수 있을 겁니다.
최근 LLM에 '에이전트'(Agent) 기능을 결합해 스스로 작업을 수행하고 목표를 달성하는 AI 트렌드가 주목을 받고 있습니다. 이는 단순히 질문에 응답하는 것을 넘어, LLM의 언어적 유창성과 독립적인 작업 수행 및 의사 결정 능력을 결합하여 생성 AI를 수동적 도구에서 능동적 업무 파트너로 격상시켰습니다.
LAM은 사용자의 질의에 따라 특정 행동을 수행하는 생성 AI의 한 유형입니다. 이 모델들은 데이터를 분석할 뿐만 아니라, 분석 결과를 바탕으로 실제 행동을 취하도록 설계되었습니다. LLM이 질의에 대한 텍스트 응답을 생성하는 데 그친다면, LAM은 쇼핑객의 반품 처리를 돕는 것과 같이 실제 행동을 수행합니다.
LAM은 인간의 능력을 보강하는 자동화를 추구하며, 반복적이거나 가치 창출이 낮은 업무를 대신 수행함으로써 사람들이 더 중요하고 고부가가치 활동에 집중할 수 있도록 돕는 것을 목표로 합니다. LAM을 강력히 주도하고 있는 세일즈포스는 LAM이 변화할 산업의 모습을 아래와 같이 묘사합니다.
- 마케팅 워크플로우 개선 사례: LAM은 마케팅 분야에서 캠페인 구상부터 결과 도출까지 복잡한 과정을 자동화할 수 있습니다. 예를 들어, "새로운 초코 초콜릿의 가치를 알리는 마케팅 이메일을 발송하고, 구매자 선착순 100명에게 무료 배송 쿠폰을 제공하며, 모든 수신자에게 개인화된 메시지를 전달하라"는 요청을 처리할 수 있습니다. 이를 위해 LAM은 LLM 인터페이스를 통해 데이터, 도구, 도메인별 에이전트를 연결하여 이전 마케팅 자료, 고객 데이터, 제품 개발 정보 등을 활용해 맞춤형 이메일을 생성하고 발송하는 전 과정을 수행합니다.
- 자동차 구매 간소화 사례: 개인적인 구매 결정 과정에서도 LAM의 활용이 기대됩니다. 안전 등급이 높고 공간이 넓으며 어두운 색상의 2014년 이후 모델 중 3천 만 원 미만, 주행 거리 5,000km 미만의 세단을 찾는다는 요청이 있다고 가정해 봅시다. LAM은 방대한 양의 자동차 리뷰를 분석하여 사용자의 요구 사항을 충족하는 후보 목록을 생성하고, 잠재적인 문제점(예: 특정 연식 모델의 고질적인 결함)을 파악하여 사용자에게 알릴 수 있습니다. 또한, 개인 판매자나 딜러와 이메일 또는 SMS를 통해 소통하며 구매 과정을 지원하고, 사용자의 최종 승인을 거쳐 대출 서류 초안 작성까지 도울 수 있습니다.
- 보험사 고객 응대 지원 사례: 보험사 상담원은 LAM을 통해 고객 응대 업무를 효율화할 수 있습니다. 고객과의 Zoom 상담 내용을 자동으로 녹취 및 요약하고, 통화 내용을 바탕으로 후속 조치(예: 추가 정보 제공, 관련 문서 첨부)를 위한 이메일 초안을 작성합니다. 또한, 고객의 불만 징후를 감지하여 고객 만족 전문가에게 연결하는 등 고객 관계 관리 전반을 지원합니다. 이러한 LAM의 확장성은 기업 전체의 생산성을 향상시키고 비용을 절감하는 데 기여할 수 있습니다.
LAM, 신뢰성 확보 위해 '인간 승인' 절차 도입
LAM은 개별 사용자뿐만 아니라 그룹, 나아가 조직 전체를 지원하는 형태로 발전할 수 잠재력을 갖고 있습니다. 또한, 여러 LAM이 각기 다른 목표를 위해 협력하고, 이를 조율하는 또 다른 LAM이 사용자 또는 조직과 소통하는 형태도 가능합니다. 마치 개인 비서에서 '비서실장'이 이끄는 팀으로의 업그레이드와 같은 상태입니다.
물론 허들이 없는 것은 아닙니다. LAM의 핵심 과제 중 하나는 변화하는 외부조건에 유연하게 적응하는 능력입니다. 예를 들어, 자동차 구매 과정에서 원하는 차량이 판매되었거나 리콜이 발생했을 때 이를 즉시 반영할 수 있어야 합니다. 또한, LAM은 인간 사용자와의 상호작용을 통해 학습하고 피드백을 받아 행동을 개선하며, 고객 서비스 기록 등 방대한 데이터를 분석하여 최적의 결과 도출을 위한 절차를 파악해야 하기도 합니다.
LAM은 요청을 일련의 단계로 변환하는 것을 넘어, 각 단계의 논리적 연결성과 상황 변화에 따른 계획 수정 능력을 갖추어야 합니다. 달걀이 부족할 때 요리 대신 장보기부터 시작하는 인간의 문제 해결 능력과 같다고 할 수 있죠. LAM의 신뢰성 확보도 중요한 과제입니다. 특히 여러 LAM이 협력할 경우 안전성과 신뢰성 확보의 중요도는 더욱 커집니다. 따라서 LAM은 독립적으로 작동하더라도 중요한 결정 전에는 반드시 인간의 개입을 거치도록 설계되어야 합니다.
LAM의 대표 사례 : GPT Action

혹시 GPT Action이라고 들어보셨나요? OpenAI의 GPT Actions는 사용자가 별도의 복잡한 절차 없이 자연어만으로 외부 애플리케이션과 상호작용할 수 있게 하는 핵심 기술입니다. LAM이라는 개념을 가장 대중적으로 구현한 대표적인 사례라고도 할 수 있고요. 일단 GPT Action이 할 수 있는 기능을 쉽게 설명하면 다음과 같습니다.
ChatGPT의 데이터 분석 기능(파이썬 코드를 생성한 다음 실행하는 기능)과 유사하게, 함수 호출을 활용하여 (1) 사용자의 질문과 관련된 API 호출을 결정하고 (2) API 호출에 필요한 JSON 입력을 생성합니다. 마지막으로 GPT 액션은 해당 JSON 입력을 사용하여 API 호출을 실행합니다.
GPT Actions는 RESTful API 호출을 통해 작동하며, 사용자의 자연어 질문을 API 호출에 필요한 JSON 스키마로 변환하는 역할을 합니다. 이를 통해 ChatGPT는 외부 데이터베이스에서 정보를 검색하거나, JIRA 티켓을 생성하는 등의 작업을 수행할 수 있습니다. 이 과정은 앞서 언급했다시피, ChatGPT의 데이터 분석 기능과 유사하게, Function Calling을 활용하여 사용자의 질문에 가장 적합한 API 호출을 결정하고 필요한 JSON 입력을 생성합니다.
개발자는 GPT Action에 API의 스키마와 인증 방식을 명시하기만 하면 됩니다. 그러면 Custom GPT가 해당 API 호출을 대신 실행하며, 사용자는 복잡한 API 연동 과정을 전혀 인지하지 못한 채 자연어로 질문하고 자연어 형태의 답변을 받을 수 있습니다.
GPT Actions는 API를 통한 상호운용성을 강화하여 조직이 다양한 외부 애플리케이션에 접근할 수 있도록 돕습니다. 기존에는 개발자가 직접 API 연동을 구현해야 하는 부담이 컸지만, GPT Actions는 개발자가 API 스키마를 설명하고 인증을 설정한 후 GPT에 지침을 추가하는 것만으로도 사용자의 자연어 질문과 API 계층 간의 다리 역할을 수행합니다.
간단한 예로, 날씨 정보를 제공하는 weather.gov API를 활용하는 경우를 들 수 있습니다. /points API는 위도와 경도를 입력받아 예보 사무소 및 좌표를 반환하고, /gridpoints API는 이 정보를 바탕으로 상세 예보를 제공합니다. 개발자가 이 두 API 호출에 필요한 JSON 스키마를 GPT Action으로 구성하면, 사용자는 "이번 주말 워싱턴 DC 여행 시 무엇을 챙겨야 할까?"와 같은 질문만으로 주말 날씨 예보를 기반으로 한 맞춤형 짐 목록을 얻을 수 있습니다.

GPT Actions는 API 호출에 필요한 두 가지 입력값을 생성합니다. 예를 들어, /points API 호출 시에는 위도와 경도 정보가, /forecast API 호출 시에는 예보 사무소, x, y 좌표가 JSON 형식으로 전달됩니다.
LAM-커머스가 정보 교환하는 표준으로서 Agent Action Schema
LAM이 작동하려면, Agent가 이해할 수 있는 형태로 정보 등이 API화 돼 있어야 합니다. 이를 Agent Action Schema라고 부르겠습니다. 말 그대로 Agent의 실행 용이성을 위해 설계된 스키마라고 보시면 됩니다. 현재까지 소개되고 있는 커머스용 Agent Action Schema는 프로토콜의 형태가 많습니다. 표준 전쟁이 진행되고 있어서일 겁니다. 이미 많이 들어봤다시피 MCP(Model Context Protocol)와 ACP(Agent Commerce Protocol), AP2(Agent Payment Protocol) 등이 그것입니다.
아래 글은 이 개념을 이해하는데 도움이 될 것입니다.


- MCP, 시스템 접속의 통일 언어 : 모델 컨텍스트 프로토콜(MCP)은 대규모실행모델(LAM)이 외부 시스템과 소통하는 기반 인터페이스입니다. 클로드 개발사인 엔스로픽이 2024년 처음으로 제안을 했습니다. 지금은 the Agentic AI Foundation (AAIF)에 기부된 상태입니다. 쇼핑몰 서버나 재고 관리 시스템에 접속할 수 있게 해주는 표준 규격으로, 'read_resource'(자원 읽기)나 'call_tool'(도구 호출) 같은 기본 행동을 정의합니다.
- ACP, 비즈니스 로직의 설계도 : 에이전트 커머스 프로토콜(ACP)은 연결된 시스템 위에서 실제 상거래를 수행하는 규칙 체계입니다. 제품 검색부터 장바구니 담기, 주문서 생성까지 전자상거래 특화 행동을 담당합니다. 'search_product'(상품 검색), 'add_to_cart'(장바구니 추가), 'create_invoice'(송장 생성) 등의 액션 스키마를 통해 MCP가 제공한 파이프라인에 비즈니스적 의미를 부여합니다. 프로덕트 피드 API가 이 영역의 핵심 구현 사례로 꼽힙니다.
- AP2, 안전한 결제의 마지막 퍼즐 : 에이전트 페이먼트(AP2) 프로토콜은 금융 거래의 보안과 승인을 책임집니다. 신용카드 번호를 직접 노출하지 않고 결제 토큰을 활용해 거래를 완료하는 방식입니다. 'authorize_payment'(결제 승인), 'capture_transaction'(거래 포착) 같은 액션으로 ACP가 생성한 주문서에 대해 실제 금전 이동과 소유권 이전을 처리합니다.
3가지 프로토콜은 각자의 역할을 명확히 구분하면서도 긴밀히 연계될 수 있습니다.(물론 각 프로토콜의 제안 주체는 모두 다릅니다.) MCP가 시스템 접속 통로를 열면, ACP가 상품 탐색과 주문 로직을 실행하고, AP2가 결제 승인으로 거래를 종결짓는 구조입니다. 이 계층적 아키텍처는 AI 에이전트가 사람의 개입 없이 복잡한 구매 프로세스를 처리할 수 있는 기술적 토대로 작용하고 있습니다.
| 프로토콜 | 역할 | 핵심 액션 스키마 | 비유 |
|---|---|---|---|
| MCP | 시스템 연결 기반 | read_resource, call_tool | USB 포트 |
| ACP | 상거래 로직 실행 | search_product, add_to_cart, create_invoice | 비즈니스 규칙 |
| AP2 | 결제 처리 및 보안 | authorize_payment, capture_transaction | 결제 단말기 |
현재 오픈소스로 공개된 ACP(Agentic Commerce Protocol)는 전 세계에서 가장 널리 사용되는 결제 솔루션인 Stripe를 기본 결제 방식으로 채택하고 있습니다. ACP 개발진은 이를 통해 초기 시장 진입 속도를 높이고 있다고 밝혔습니다. 하지만 ACP는 장기 전략으로 특정 결제 업체에 종속되지 않는 구조를 구축할 가능성이 높습니다. 모든 전자상거래 플랫폼이 Stripe를 사용하는 것은 아니기 때문입니다.(예를 들어 국내는 토스나 카카오페이 등이 있습니다.) 이에 따라 ACP는 구글의 AP2(Agent Payment Protocol)와 같은 결제 표준 프로토콜을 시스템에 통합하는 방향으로 나아갈 수도 있습니다. 현재까지의 전망이 그렇다는 얘기입니다.
이러한 새로운 구조가 만들어지면 ACP는 주문서 생성을 담당하고, 실제 결제 처리는 AP2라는 보안 프로토콜을 통해 이뤄지게 될 것입니다. 이를 통해 Stripe, PayPal 등 어떤 결제 서비스를 사용하더라도 AI가 안전하게 거래를 처리할 수 있는 범용성을 확보하게 됩니다.
AI의 '손과 발'과 '업무 규칙'을 갖추는 3단계 전략

대규모실행모델(Large Action Model, LAM)의 등장은 생성형 AI가 단순한 정보 생성을 넘어 실제 업무를 수행하는 '실행하는 AI' 시대로의 전환을 의미합니다. 이러한 LAM이 기업 현장에서 실질적인 성과를 창출하기 위해서는 AI에게 '손과 발'에 해당하는 API와 '업무 규칙'에 해당하는 워크플로우를 제공하는 것이 필수적입니다. 기업이 LAM 시대를 성공적으로 맞이하기 위한 구체적인 준비 단계는 다음과 같이 세 가지로 요약할 수 있습니다.
첫째, 기업 내부의 데이터와 기능을 AI가 접근하고 조작할 수 있도록 'API화'하는 작업이 선행되어야 합니다. LAM은 결국 API를 통해 외부 세계와 상호작용하며 업무를 수행합니다. 아무리 뛰어난 AI라 할지라도, 기업의 제품 재고 관리 시스템이나 고객 데이터베이스에 접근할 수 있는 '연결 통로'인 API가 없다면 그 효용은 제한적일 수밖에 없습니다. 따라서 기업은 엑셀 파일로 관리되던 재고 목록을 실시간으로 호출 가능한 API로 변환하는 등, 내부 데이터와 기능을 API 형태로 표준화하는 노력을 기울여야 합니다. 이는 LAM 도입의 가장 기초적인 첫걸음이라 할 수 있습니다.
둘째, 업무 프로세스를 AI가 이해할 수 있는 '원자 단위(Atomic Task)'로 분해하고 정의하는 과정이 필요합니다. LAM은 "마케팅을 잘 해보라"와 같이 모호하고 포괄적인 지시를 수행하는 데 한계가 있습니다. 대신 '이메일 초안 작성 → 승인 요청 → 발송 → 결과 분석'과 같이 더 이상 쪼갤 수 없는 명확한 단위 작업으로 업무를 세분화해야 합니다. 이를 위해 기업은 내부 업무 매뉴얼(SOP)을 AI가 이해할 수 있는 논리적인 순서도 형태로 재정비하고, 어떤 상황에서 어떤 API를 호출해야 하는지에 대한 명확한 규칙을 수립해야 합니다. 이러한 과정은 LAM이 '환각(Hallucination)' 없이 정확하게 행동하도록 돕는 핵심 요소입니다.
셋째, LAM이 능동적으로 행동하더라도 통제 가능한 위임을 위한 '휴먼 인 더 루프(Human-in-the-loop)' 시스템을 설계해야 합니다. AI가 모든 업무를 전적으로 수행하도록 맡겨두는 것은 결제, 계약 체결, 외부 발송 등 되돌릴 수 없는 행동에 대한 위험을 내포합니다. 따라서 이러한 결정적인 순간에는 반드시 인간의 '승인' 단계를 거치도록 시스템을 구축해야 합니다. AI를 단순히 업무를 대체하는 존재가 아닌, 초안 작성자이자 실행 대기자로 설정하고, AI가 90%의 준비를 마치면 인간이 마지막 10%의 검토와 승인을 담당하는 협업 구조를 시스템적으로 강제하는 것이 중요합니다.
결론적으로, 대규모 행동 모델(LAM)의 등장은 생성형 AI가 '채팅창'을 넘어 '실물 경제' 영역으로 진입했음을 의미합니다. 이제 AI는 보고서 요약을 넘어 실제 물류를 움직이고 고객과 계약을 맺는 실무 파트너로 진화하고 있습니다. 이러한 변화에 대응하기 위해 커머스 기업은 내부 데이터의 API 연결성 확보와 업무 프로세스의 논리적 정립이라는 '디지털 기초체력'을 강화해야 합니다.
이제 커머스 기업은 "우리 회사의 데이터는 AI가 실행할 수 있도록 준비되어 있는가?"라는 질문을 스스로에게 던져야 할 때입니다.

블루닷에이아이의 공동창업자 겸 대표이자, 더코어의 미디어 전담 필자입니다. 고려대를 나와 서울과학기술대에서 박사과정을 수료했습니다. 언론사와 다음커뮤니케이션을 거쳐, 미디어스타트업 엑셀러레이터 '메디아티'에서 이사로 근무했고 구글에서 티칭펠로, 뉴스생태계 파트너십 경험도 쌓았습니다. '트위터 140자의 매직', '혁신저널리즘'(공동저작), '사라진 독자를 찾아서', 'AI와 스타트업', 'AI, 빅테크, 저널리즘' 등을 집필했습니다.

