반응형
반응형
반응형

 

🚀 A2A Protocol이란?

A2A = Agent-to-Agent Protocol

AI 에이전트(Agent) 들이 서로 통신하고 협력하기 위해 사용되는 표준적·구조화된 의사소통 규약을 뜻한다.

즉,

여러 AI 에이전트가 서로 메시지를 주고받고, 역할을 분담하고, 협력 작업을 수행할 수 있게 해주는 프로토콜

이다.

이 개념은 최근 OpenAI, Anthropic, Google 등 빅테크의 연구 방향 중 하나이며,
에이전트 기반 시스템(Agentic System)이 확산되면서 점점 더 중요해지고 있다.


📌 A2A Protocol이 필요한 이유

과거의 AI는 “모델 하나가 사용자의 질문에 답하는 구조”였지만,
이제는 다음과 같은 시스템이 등장하고 있다:

  • 검색 에이전트
  • 코드 생성 에이전트
  • 분석 에이전트
  • 검증 에이전트
  • 요약 에이전트
  • 특정 업무 도구만 전담하는 에이전트

문제는 각 에이전트가 서로 통신하는 방식이 제각각이었다는 점이다.

A2A Protocol은 이 비효율을 제거하기 위한 표준으로 등장했다.


📌 A2A Protocol의 특징

✔ 1) 에이전트 간 메시지 형식 표준화

예:

{
  "sender": "search_agent",
  "receiver": "summarizer_agent",
  "intent": "REQUEST",
  "task": "Summarize search results",
  "payload": { ... }
}

✔ 2) 에이전트 간 역할(Role) 정의

  • Planner
  • Executor
  • Verifier
  • Tool specialist
  • Memory manager

✔ 3) 코디네이션(조율) 메커니즘

에이전트들이 서로 어떤 순서로 협력할지 결정하기 위한 규칙.

✔ 4) 상태 관리(State Management)

여러 에이전트가 공유하는 상태(working memory)를 유지.

✔ 5) 확장 가능한 구조

하나의 에이전트가 아니라 멀티에이전트로 구성된 시스템을 만들기 쉬움.


📌 A2A Protocol의 실제 동작 예시 (시나리오)

사용자 요청:

“AWS 비용을 분석하고 과금 이슈가 있으면 보고서 만들어줘.”

에이전트 간 협업:

  1. Planner Agent
    • 작업을 분석하고 필요한 역할 분담
  2. AWS Query Agent
    • Cloud 비용 API를 호출해 데이터 수집
  3. Analyzer Agent
    • 비용 이상 징후(anomaly) 분석
  4. Writer Agent
    • 보고서 문서 작성
  5. Reviewer Agent
    • 결과 검증 & 품질 체크
  6. Messenger Agent
    • 사용자에게 결과 전달

이 과정에서 에이전트들은 A2A 규격에 맞춰 서로 메시지를 교환한다.


📌 A2A Protocol과 MCP의 관계

둘은 완전히 다른 목적을 가진 프로토콜이며, 상호보완적 관계다.

프로토콜 목적

MCP (Model Context Protocol) LLM ↔ 외부 도구/데이터 연결
A2A (Agent-to-Agent Protocol) 에이전트 ↔ 에이전트 협력/통신

즉:

  • MCP = 모델과 도구를 연결하는 레이어
  • A2A = 에이전트끼리 협력하는 레이어

예를 들어:

  • A2A로 여러 에이전트가 협업하고
  • 각 에이전트는 MCP를 통해 실제 도구를 호출

→ 이런 구조를 만들 수 있다.


📌 A2A Protocol이 중요한 이유

1) 복잡한 업무 자동화가 가능

단일 LLM보다 여러 에이전트가 더 높은 정확도·안정성을 제공함.

2) 시스템 안전성 증가

역할별로 책임 분리가 가능(Verifier, Approver 등)

3) 확장성

새로운 에이전트를 추가해 기능 확장 가능.

4) 기업 환경에서의 적합성

  • 데이터 분석
  • 승인 프로세스
  • DevOps 자동화
  • 보안 점검
    등을 Multi-Agent로 처리하기 용이.

5) OpenAI / Google / Anthropic의 연구 방향

최근 공개된 LLM 로드맵을 보면
단일 모델 → 다중 에이전트 시스템(Agentic Computing)
으로 방향성을 이동 중이다.

A2A는 이 방향성의 핵심 기술이다.


📌 A2A Protocol은 표준인가?

아직 RFC 같은 공식 단일 표준은 없다.
하지만 공통 개념·공통 패턴으로 자리잡은 사실상 표준(defacto) 형태.

현재 형태:

  • Anthropic: Agent-to-Agent 협업 연구
  • OpenAI: Swarm, AutoGen에서 A2A 시스템 채택
  • Microsoft: Multi-Agent 오케스트레이션 프레임워크
  • Google: Gemini 기반 Multi-Agent framework 발표
  • OSS: AutoGen, CrewAI, LangGraph 등

여러 기업과 오픈소스 생태계가 유사한 형태의 A2A 규약을 적용하고 있어
빠르게 표준화될 가능성이 크다.


📌 요약

A2A Protocol은:

  • 에이전트 간 통신을 위한 구조화된 메시지 규약
  • 여러 AI 에이전트가 협력해서 복잡한 업무를 처리할 수 있게 하는 기반 기술
  • LLM 시대의 다음 단계인 “Agentic Computing”의 핵심
  • MCP와는 다른 계층이며, 함께 사용될 수 있음

LLM이 “똑똑한 비서”라면,
A2A는 여러 비서들이 협력하는 팀 조직을 만드는 기술이라고 보면 된다.

반응형
반응형

🚀 MCP(Model Context Protocol) 소개

— Anthropic이 제안한 LLM 도구 연동 표준 프로토콜

AI 모델이 점점 더 복잡한 작업을 수행하면서,
“모델이 외부 리소스(도구, 파일, DB, API)와 어떻게 상호작용할 것인가?”라는 문제가 핵심 이슈로 떠올랐다.

이 문제를 해결하기 위해 Anthropic(Claude 개발사)가 제안한 것이
MCP(Model Context Protocol) 이다.

MCP는 이후 OpenAI, Google 등 주요 기업이 빠르게 채택하면서
LLM 생태계의 새로운 표준으로 자리잡고 있다.

이 글에서는 MCP가 무엇인지, 왜 중요한지, 그리고 Gemini 같은 모델에서 어떻게 활용될 수 있는지 설명한다.


1. MCP란 무엇인가?

MCP(Model Context Protocol)은

LLM이 외부 도구, 데이터, 서비스와 표준화된 방식으로 상호작용하기 위한 애플리케이션 계층 프로토콜이다.

정확히 말하면:

  • LLM이 사용할 수 있는 능력(capabilities) 목록을 제공하고
  • LLM이 특정 도구를 호출할 수 있게 하며
  • 그 결과를 다시 모델에 반환하는 구조를
    JSON-RPC 기반으로 표준화한 프로토콜이다.

즉, LLM이 “텍스트만 생성하는 모델”을 넘어서,
실제 작업을 수행하는 에이전트로 확장되기 위한 기반 규격이다.

https://modelcontextprotocol.io/docs/getting-started/intro

 


2. 누가 왜 MCP를 만들었는가?

✔ Anthropic이 MCP를 제안한 이유

Anthropic은 Claude 모델을 개발하면서 다음 문제를 직면했다:

  1. LLM이 외부 도구에 접근하는 방식이 벤더마다 다름
  2. 기업이 LLM을 업무에 적용할 때 도구 연결 비용이 과도하게 큼
  3. 보안·권한·제어가 일관적이지 않음
  4. 에이전트형 LLM이 복잡한 시스템을 다루기엔 구조적 표준이 부족함

그래서 Anthropic은 “LLM과 도구를 연결하는 표준 프로토콜”을 만들기로 했고,
그 결과가 MCP다.

이후:

  • OpenAI(ChatGPT)
  • Google(Gemini)
  • Meta(Llama)
  • AI IDE들(Cursor, Windsurf, VS Code 확장)

등이 MCP를 지원하면서 빠르게 생태계가 확장되고 있다.


3. MCP의 구성 요소

MCP는 다음 세 가지 요소로 이루어진다.


✔ 1) MCP Server

LLM이 사용할 기능을 제공하는 서버(또는 프로세스).

예:

  • 파일 읽기/쓰기
  • 검색 엔진
  • 내부 API
  • 데이터베이스 쿼리
  • 클라우드 리소스 제어
  • 사내 시스템(ERP, CMS 등)

서버는 "도구 목록(capabilities)"을 LLM에게 제공한다.


✔ 2) MCP Client

LLM 또는 LLM 기반 애플리케이션.

예:

  • Claude Desktop
  • ChatGPT Desktop
  • Google Gemini API 기반 앱
  • IDE의 AI 기능(VSCode, Cursor)
  • 회사 내부 AI 에이전트 애플리케이션

✔ 3) Tools (Capabilities)

서버가 제공하는 실제 기능.

예:

  • searchArticles(query)
  • runSQL(query)
  • getDocument(id)
  • listFiles(path)

LLM은 이 도구를 호출해 작업을 수행하고, 결과를 답변에 반영한다.


4. MCP는 어떻게 동작하는가?

MCP는 JSON-RPC 기반 인터페이스로 동작하며 단계는 다음과 같다.

  1. 클라이언트(LLM)가 MCP 서버에 연결
  2. 서버가 사용 가능한 도구 목록 제공
  3. LLM이 적절한 도구를 선택해 호출
  4. MCP 서버가 도구를 실행해 결과 전달
  5. LLM이 그 결과를 바탕으로 답변 생성

핵심은 “LLM이 도구 사용을 스스로 판단할 수 있다”는 점이다.


5. Gemini에서의 MCP 활용

Google도 MCP를 공식적으로 지원하기 시작했고,
Gemini는 MCP를 다음과 같은 방식으로 활용할 수 있다.


✔ 1) Gemini 애플리케이션이 MCP 서버와 직접 통신

Gemini API 기반 앱은 MCP 클라이언트를 구현해
다음과 같은 구조로 동작할 수 있다.

사용자 질문
 → Gemini 처리
   → 필요 판단 시 MCP 도구 호출
     → 결과 반환
       → Gemini가 자연어 응답 생성

예:
“지난주 Cloud 로그에서 ERROR 문구가 포함된 항목만 보여줘.”

  • Gemini → MCP 서버의 logSearch 도구 호출
  • MCP 서버 → GCP 로그 API 호출
  • 반환된 로그를 Gemini가 요약

✔ 2) Gemini Extensions와 MCP는 정확히 역할이 다름

  • Gemini Extensions
    • Gmail, Drive, YouTube, Calendar 같은 Google 제품군과 연결되는 확장 기능
  • MCP
    • 특정 벤더에 종속되지 않는 표준화된 도구 연동 방식

따라서 Gemini는 다음과 같이 활용 가능:

  • Google 서비스 사용 → Extensions
  • 외부 시스템 / 사내 시스템 / 맞춤형 도구 → MCP

이 점을 모르는 경우가 많아서 강조할 가치가 있다.


6. MCP의 실제 활용 분야

🏢 기업 시스템 연동

  • ERP / CRM / 내부 API
  • 프로젝트 관리 시스템
  • 보안 로그, 모니터링 데이터
  • 사내 문서 검색 시스템

🧑‍💻 개발 자동화

  • Git 작업(커밋, diff, PR 생성)
  • 테스트 실행
  • 서버 배포
  • 로그 분석

📂 파일 기반 작업

  • 사내 문서 읽기 / 편집
  • PDF 요약
  • Excel 생성

🧠 AI Agents

  • 여러 도구를 조합해서 하나의 복잡한 워크플로우 실행
  • 자동 알림 → 분석 → 요약 → 보고서 생성

7. MCP의 기술적 위치

MCP는 다음과 같이 이해하는 것이 가장 정확하다:

  • 네트워크 스택을 새로 정의하는 기술이 아니다
  • 기존 TCP/Unix Socket/WebSocket 위에서 동작하는
  • LLM-도구 연결을 위한 애플리케이션 계층 프로토콜이다
  • 목적은 표준화이며,
  • Function Calling/Extensions/Plugins의 중복된 문제를 해결하는 공통 규약이다

따라서 비유하자면:

  • HTTP → 웹 서비스 의사소통 규약
  • OpenAPI → 서비스 문서화 표준
  • MCP → LLM과 외부 도구의 상호작용 표준

이 정도가 기술적으로 가장 정확한 위치다.


8. 결론

MCP는 다음과 같은 가치를 제공한다.

  • LLM이 외부 도구에 안전하고 일관된 방식으로 접근하도록 하는 표준
  • Anthropic이 제안하고 주요 AI 기업들이 빠르게 채택
  • Gemini·Claude·ChatGPT 등 다양한 모델에서 활용 가능
  • 기업의 AI 도입 비용을 크게 줄여주는 실용적 프로토콜
  • 에이전트 시대의 필수 기반 기술로 자리잡는 중

“모델을 더 똑똑하게 만드는 것이 아니라,
모델이 세상과 상호작용할 수 있도록 확장하는 기술”이라는 점이 핵심이다.

반응형

'인공지능' 카테고리의 다른 글

CUDA(Compute Unified Device Architecture)  (0) 2025.12.03
AI 강의  (0) 2025.11.24
A2A(Agent2Agent) protocol  (0) 2025.11.19
RAG(Retrieval-Augmented Generation)  (0) 2025.11.18
LLM(Large Language Model)  (0) 2025.11.18

+ Recent posts