인터넷의 역사는 레이어 표준화의 역사입니다. TCP/IP가 전송 레이어를 정의했고, HTTP가 콘텐츠 전달 레이어를 정의했으며, REST API가 서비스 간 통신을 정의했습니다. 각 표준화 순간에 새로운 카테고리 승자가 결정됐습니다. Stripe는 결제 API를 표준화했고, Shopify는 커머스 운영 레이어를 표준화했습니다. 표준을 가진 인프라 레이어는 그 위에 구축되는 모든 서비스로부터 세금을 받습니다.
2024-2025년, 다음 레이어의 표준화가 시작됐습니다. AI 에이전트와 외부 시스템 간의 통신 레이어입니다. Anthropic의 Model Context Protocol이 2024년 11월 오픈소스로 공개됐고, Google이 Agent-to-Agent(A2A) 프로토콜을 발표했습니다. OpenAI Operator가 실제 웹서비스를 자율적으로 조작하기 시작했습니다. ChatGPT에 Shopping 기능이 추가됐습니다.
이것은 UX 개선이 아닙니다. 커머스 트래픽이 흐르는 파이프의 교체입니다.
핵심 질문: Buyer-side AI(GPT, Claude, Gemini)가 상품을 검색하고 추천하고 구매를 실행하는 에이전트가 됐을 때, 그 AI가 연결하는 공급 사이드 인프라는 무엇이 됩니까? 지금 그 자리가 비어 있습니다 - 패션 커머스에 한해서는.
01 · Protocol Layer MCP는 AI의 REST API입니다
Model Context Protocol(MCP)을 정확하게 이해하려면, 어떤 문제를 해결하는지부터 봐야 합니다.
언어 모델의 근본적인 제약은 컨텍스트 경계입니다. 모델이 아는 것은 학습 데이터와 현재 입력 컨텍스트가 전부입니다. 실시간 재고, 사용자 주문 이력, 외부 서비스 호출 - 이것들은 모델이 자체적으로 접근할 수 없습니다. 이 문제를 해결하는 방법은 크게 두 가지였습니다: Function Calling(OpenAI 방식)과 Tool Use(Anthropic 방식). 그러나 두 방식 모두 플랫폼 종속적이었고, 각 서비스가 각 AI 플랫폼과 독자적인 통합을 구축해야 했습니다. 통합 비용이 O(n×m)으로 증가하는 구조였습니다.
MCP는 이 문제에 대한 표준 프로토콜 해법입니다. JSON-RPC 2.0 기반의 클라이언트-서버 아키텍처로, 세 가지 핵심 primitive를 정의합니다:
Tools - AI가 호출할 수 있는 실행 가능 함수. 사이드 이펙트가 있으며, AI가 능동적으로 시스템 상태를 변경하거나 외부 연산을 트리거할 수 있습니다. 예: generate_fitting_image(garment_url, avatar_id)
Resources - AI가 읽을 수 있는 구조화된 데이터. URI로 식별되는 읽기 전용 컨텍스트 소스입니다. 예: styleroom://avatars/{id}/profile, styleroom://backgrounds/themes
Prompts - 재사용 가능한 프롬프트 템플릿. 복잡한 워크플로우를 단일 인터페이스로 패키징합니다. 예: "이 브랜드의 신상품 콘텐츠 생성" 프롬프트가 내부적으로 여러 Tool 호출을 조율합니다.
MCP 서버를 한 번 구현하면, MCP를 지원하는 모든 AI 클라이언트 - 현재의 Claude Desktop, Cursor, Windsurf, 그리고 앞으로 등장할 모든 AI 에이전트 - 가 추가 통합 작업 없이 연결됩니다. 이것이 표준의 힘입니다. REST API가 웹 서비스 간 통합의 방식을 결정했듯이, MCP는 AI와 서비스 간 통합의 방식을 결정하게 됩니다.
Buyer-side AI의 부상과 Agent Protocol 경쟁
MCP가 공급 사이드(서비스)의 표준이라면, 수요 사이드(AI 에이전트)에서도 병렬적인 변화가 일어나고 있습니다. 2024-2025년 사이 다음 제품들이 출시됐거나 주요 업데이트를 받았습니다:
| Product / Protocol | 주체 | 커머스 관련성 |
|---|---|---|
| ChatGPT Shopping | OpenAI | 대화형 상품 검색 및 추천. 파트너 커머스 사이트 연결. |
| Operator | OpenAI | 웹브라우저를 자율 조작하는 에이전트. 장바구니 추가, 결제까지 수행. |
| Computer Use | Anthropic | 화면을 보고 UI를 직접 조작. Operator와 유사한 자율 웹 조작 능력. |
| Agent-to-Agent (A2A) | 에이전트 간 표준 통신 프로토콜. 복수의 전문 에이전트가 협력하는 멀티-에이전트 아키텍처를 지원. | |
| Model Context Protocol | Anthropic | 공급 사이드 서비스가 AI에게 capabilities를 노출하는 표준. 스타일룸이 구현한 프로토콜. |
이 흐름의 방향은 명확합니다. 소비자가 앱이나 검색 엔진을 직접 조작하는 대신, AI 에이전트에게 의도를 전달하고 에이전트가 대신 실행합니다. 구매 여정에서 UI 레이어가 점진적으로 AI 에이전트 레이어로 교체되고 있습니다. 이 전환에서 공급 사이드가 직면하는 질문은 하나입니다: "우리 서비스는 에이전트가 호출할 수 있는 형태인가?"
02 · The Hard Case 패션이 다른 이유 - 생성형 컴퓨팅을 요구합니다
대부분의 커머스 카테고리에서 MCP 서버를 구현하는 것은 본질적으로 기존 REST API를 MCP Tool/Resource로 래핑하는 작업입니다. 재고 조회, 가격 확인, 주문 생성 - 이것들은 단순한 CRUD 연산이고, 입출력은 텍스트나 구조화된 JSON입니다.
패션 커머스는 다릅니다. 패션의 핵심 가치 제안은 단순 데이터 반환으로 해결되지 않습니다. "이 옷을 입으면 어떻게 보일까" - 이 질문은 텍스트가 아닌 이미지로만 답할 수 있습니다. AI 에이전트가 패션 상품을 추천할 때 실제로 필요한 것들을 레이어별로 분해하면:
레벨 1 - 데이터 조회: 상품 SKU, 소재 스펙, 사이즈 테이블, 재고 수량. 일반적인 MCP Resource로 충분합니다.
레벨 2 - 시각적 표현: "이 옷이 실제로 어떻게 보이는가." 다양한 각도, 다양한 착용 상태. 기존 촬영 이미지로 부분 커버 가능하지만, 개인화 요청에는 대응 불가합니다.
레벨 3 - 개인화된 피팅: "이 소비자의 체형과 스타일 선호에 맞는 착용 이미지." 이것은 실시간 생성을 요구합니다. 미리 촬영해둘 수 없습니다.
레벨 4 - 브랜드 일관성: AI가 생성하는 이미지가 브랜드의 visual identity와 일관되어야 합니다. 동일 아바타, 동일 배경 톤, 동일 스타일링 감성. 에이전트가 10개 상품의 이미지를 요청할 때 10개 모두 같은 브랜드처럼 보여야 합니다.
레벨 3과 4는 MCP Tool이 생성형 AI 파이프라인을 내부적으로 호출해야만 해결됩니다. 단순한 데이터 래핑으로는 불가능합니다. 이것이 다른 커머스 플랫폼이 패션 MCP를 쉽게 구현하지 못하는 이유이고, 동시에 이 문제를 먼저 해결한 서비스가 가지는 구조적 우위입니다.
이미지 생성 모델을 가지고 있다고 해서 레벨 4가 해결되는 것도 아닙니다. 확산 모델(Diffusion Model)은 근본적으로 확률적입니다 - 같은 입력, 같은 모델이라도 랜덤 시드에 의해 결과가 달라집니다. Vol.01에서 설명한 것처럼, 이 일관성 문제는 ARIA 파이프라인의 파라미터 고정 없이는 해결되지 않습니다. 스타일룸 MCP는 일관성 레이어가 이미 내장된 상태로 Tool을 노출합니다.
03 · Architecture 스타일룸 MCP 서버 설계
스타일룸 MCP 서버가 노출하는 capabilities를 세 영역으로 정리하면:
생성형 Tools
generate_fitting_shot- 의류 이미지 URL과 아바타 ID를 받아 AI 피팅샷을 생성합니다. ARIA 파이프라인이 내부적으로 실행됩니다. 동일 아바타에 대한 반복 호출은 일관된 visual identity를 유지합니다.apply_background- 피팅샷에 배경 프리셋을 합성합니다. 실내/야외/스튜디오 등 3,800+ 배경 라이브러리에서 선택하거나, 브랜드 전용 배경을 지정할 수 있습니다.generate_pose_variation- 단일 피팅샷에서 포즈만 변경한 베리에이션을 생성합니다. 동일 의류, 동일 배경, 다양한 포즈.
카탈로그 Resources
styleroom://avatars- 1,500+ AI 아바타 라이브러리. 성별, 연령대, 체형, 스타일 속성으로 필터링 가능. 브랜드 전용 아바타는 해당 브랜드 컨텍스트에서만 접근됩니다.styleroom://backgrounds/themes- 테마별로 분류된 배경 라이브러리. ARIA가 추출한 30개 비정형 속성 태그로 의미론적 검색이 가능합니다.styleroom://brand/{id}/presets- 브랜드별 스타일 프리셋. 특정 브랜드의 visual identity 파라미터 세트. 이 Resource를 컨텍스트로 사용하면 해당 브랜드 고유의 이미지 생성 결과를 얻습니다.
Consistency Layer - Tool 호출 전반에 적용
MCP Tool이 노출하는 인터페이스 아래에는 ARIA 파이프라인이 실행됩니다. 에이전트가 generate_fitting_shot을 반복 호출할 때, 아바타 임베딩과 배경 파라미터 세트가 세션 간에 유지됩니다. 에이전트가 브랜드 A의 상품 50개를 순차적으로 처리할 때, 결과물 전체가 동일한 아바타와 동일한 배경 톤으로 유지됩니다.
이것은 단순한 캐싱이 아닙니다. 확산 모델의 확률적 특성을 파이프라인 레벨에서 제어하는 것입니다. 에이전트가 의도하지 않은 시드 변동으로 visual identity가 깨지는 문제를 MCP Tool 인터페이스 내부에서 처리합니다.
04 · Market Timing 왜 지금입니까 - 표준이 만들어지는 순간
인프라 레이어의 표준화는 빠르게 하나의 표준으로 수렴합니다. HTTP가 1991년 공개된 후 웹 브라우저와 웹 서버 생태계가 수년 안에 구축됐습니다. REST API 스타일이 2000년대 초 확산된 이후 SOAP와의 경쟁은 10년 안에 사실상 종결됐습니다. MCP의 경우, Anthropic이 2024년 11월에 오픈소스로 공개한 이후 Cursor, Windsurf, Zed 등 주요 AI 코딩 환경들이 수개월 안에 MCP를 채택했습니다.
Shopify가 증명한 패턴이 있습니다. Shopify가 위대해진 이유는 좋은 쇼핑몰 빌더여서가 아닙니다. 새로운 판매 채널이 등장할 때마다 - Facebook Shop, Instagram Checkout, Google Shopping, TikTok Shop - Shopify가 자동으로 그 채널에 연결됐기 때문입니다. 인프라 레이어는 새 채널이 추가될수록 가치가 증가합니다.
Agentic Commerce에서 이 패턴이 반복됩니다. 새로운 AI 쇼핑 에이전트 = 새로운 채널. MCP = 연결 프로토콜. 공급 사이드 MCP 서버 = Shopify 포지션. 지금 패션 커머스에서 이 포지션은 비어 있습니다.
K-Fashion의 구조적 기회
한국 패션 온라인 거래액은 연간 약 33조원 규모입니다. 이 시장의 SMB 셀러는 평균적으로 신상품 월 10~20개를 출시하고, 상품당 전문 모델 착용 이미지 생성 비용은 수십만원에서 백만원 이상입니다. 패션 AI 도구의 시장 침투율은 여전히 낮습니다. 디지털 전환이 완료되지 않은 상태에서 Agentic Commerce 전환이 시작되고 있는 것입니다.
동시에 K-Fashion은 글로벌 수요가 증가하는 카테고리입니다. Buyer-side AI가 "한국 스타일 니트 추천해줘"라는 요청을 처리할 때, 그 AI가 연결하는 공급 인프라가 무엇인지가 K-Fashion의 글로벌 가시성을 결정합니다. 이것은 SEO의 다음 버전입니다 - 검색 알고리즘이 아니라 AI 에이전트가 상품을 발견하는 시대의 공급 사이드 최적화.
05 · Roadmap 3단계 전환 - Agent-assisted에서 Agentic Commerce까지
우리는 Agentic Commerce를 선형적인 전환이 아니라 레이어가 누적되는 구조로 봅니다. 각 단계는 이전 단계를 대체하지 않고 그 위에 추가됩니다.
Stage 3의 시나리오를 구체화하면: 소비자 A가 쇼핑 에이전트에게 "키 168cm, 마른 편, 요즘 K-감성 캐주얼 원피스 찾아줘"라고 요청합니다. 에이전트는 MCP를 통해 패션 공급 인프라에 접근합니다. 스타일룸 MCP 서버가 소비자 A의 체형과 스타일 선호에 맞는 아바타를 선택하고, 적합한 상품의 맞춤 피팅샷을 실시간으로 생성해서 반환합니다. 에이전트는 이 시각적 결과를 컨텍스트로 최종 추천과 구매 링크를 제시합니다.
이 플로우에서 소비자는 어떤 쇼핑몰 앱도 열지 않습니다. 에이전트가 스타일룸을 호출한다는 사실도 알지 못합니다. 인프라는 보이지 않습니다.
06 · Moat 공급 사이드를 선점하는 것이 왜 지속 가능한 우위인가
MCP 서버를 구현하는 것 자체는 진입 장벽이 낮습니다. 코드는 오픈소스이고, 스펙은 공개되어 있습니다. 경쟁자가 내일 패션 MCP 서버를 만들 수 있습니다. 그렇다면 왜 선점이 중요합니까?
답은 MCP 서버의 코드가 아니라 MCP Tool이 호출하는 파이프라인에 있습니다.
경쟁자가 패션 MCP 서버를 만든다고 해도, 그 Tool이 반환하는 이미지의 품질은 내부 생성 파이프라인에 의존합니다. 스타일룸의 경우, 그 파이프라인은 ARIA입니다 - 4만여건의 실제 의류 데이터와 12,000여건의 셀러·MD 교정 라벨로 학습된 시스템. 이 데이터는 공개 데이터셋으로 대체 불가능하고, 동일한 데이터를 구축하려면 실제 셀러들과의 수년간 운영 이력이 필요합니다. Cold start가 불가능한 이유입니다.
인프라 레이어에는 추가적인 네트워크 효과도 존재합니다. AI 에이전트가 스타일룸 MCP를 통해 생성한 이미지에 대한 소비자 반응 - 클릭률, 구매 전환, A/B 선택 - 이 다시 ARIA 파이프라인의 선호 데이터로 누적됩니다. 에이전트가 많이 호출할수록 데이터가 쌓이고, 데이터가 쌓일수록 Tool 출력 품질이 향상되고, 품질이 높을수록 에이전트가 더 많이 호출합니다. Vol.01에서 설명한 Preference Learning Flywheel이 MCP Tool 레이어에서도 동작합니다.
패션 커머스 서비스
Stage 1 Live
AI 아바타
07 · For Developers 스타일룸 MCP 서버 연결하기
스타일룸 MCP는 현재 Claude Desktop을 포함한 MCP 지원 클라이언트에서 사용할 수 있습니다. 서버 설정은 표준 MCP 구성 방식을 따릅니다.
MCP 서버 연결 설정은 style-room.ai/my/integrations에서 확인할 수 있습니다. 계정의 API 키와 서버 엔드포인트가 자동으로 생성됩니다.
스타일룸 MCP 기반 대표 에이전트 워크플로우:
- 신상품 이미지 자동화: 셀러의 의류 누끼 이미지 URL을 입력받아 → 아바타 자동 선택 → 다양한 배경에서 피팅샷 배치 생성 → 플랫폼 등록용 최종 이미지 패키지 반환
- 브랜드 일관성 유지 자동화: 브랜드 전용 아바타 + 배경 프리셋을 고정한 상태에서 시즌 전체 상품 이미지를 일관된 visual identity로 생성
- 쇼핑 어시스턴트 구현: 소비자 선호 정보를 기반으로 아바타 추천 → 상품 피팅샷 실시간 생성 → 개인화된 쇼핑 경험 제공
MCP Tool 호출은 비동기로 처리됩니다. 배치 생성 요청의 경우 job ID를 반환하고, 에이전트가 폴링하거나 webhook을 통해 완료 통지를 받습니다. 대용량 카탈로그 처리에 적합한 구조입니다.
결론 인프라는 보이지 않을 때 가장 잘 작동합니다
Stripe를 사용하면서 Stripe를 의식하는 사람은 없습니다. AWS를 사용하면서 AWS의 데이터센터를 생각하는 사람도 없습니다. 인프라가 충분히 깊이 내재화되면, 그것은 존재하지 않는 것처럼 작동합니다. 그것이 인프라의 목표입니다.
Agentic Commerce에서 스타일룸의 목표는 동일합니다. Buyer-side AI 에이전트가 K-Fashion 상품의 시각화를 필요로 할 때, 스타일룸 MCP가 그 연산을 처리합니다. 소비자는 알지 못합니다. 셀러는 결과물만 받습니다. 에이전트는 다음 요청으로 넘어갑니다.
표준이 결정되는 시점에 공급 사이드 인프라를 구축하는 것 - 패션이라는 가장 복잡한 카테고리에서, 생성형 비주얼 컴퓨팅을 callable primitive로 만드는 것 - 이것이 지금 우리가 하고 있는 일입니다.
기술 해부 시리즈