“AI 에이전트” 라는 단어 가 *너무 가볍게 *남발 된다. 채팅 봇 하나 만들고 “에이전트 만들었어요”, RAG 한 번 붙이고 *“에이전트 시스템”.

진짜 *AI 에이전트 운영그런 게 아니다. 16 가지 의 *핵심 용어유기 적 으로 *맞물려야 * 돈을 받을 만한 *시스템 이 된다. 외우는 게 아니라 *운영 구조 로 이해 해야 제대로 동작.

AI 에이전트 의 16 가지 용어 — 외우는 게 아니라 운영 구조로 이해하기

위 그림 의 16 가지Agent / Agentic Workflow / LLM / Router / Prompt / Meta-prompt / Context / RAG / Tool / MCP / Multi-Agent / Memory / Goldenset / Quality Gate / HITL / Escalation. 맨 아래 의 *“검증 없으면 예쁜 쓰레기”글 전체 의 *결론.

Claude Code + 텔레그램 봇 운영 + Lemuel 클러스터 자동화 + Settlement 의 *AI 기반 코드 리뷰실전 경험 으로 각 용어 의 *진짜 의미 를 정리. 추상 적 정의 가 아니라 *운영 의 시야.


TL;DR — 한 줄 결론

AI 에이전트 의 *진짜 구조4 가지 그룹 의 *16 용어 의 *유기적 결합. 기본 (Agent/Workflow/LLM/Router) + 프롬프트 (Prompt/Meta/Context) + 지식·도구 (RAG/Tool/MCP) + 시스템 (Multi-Agent/Memory) + 검증 (Goldenset/Quality Gate/HITL/Escalation). 마지막 4 가지 (검증)없으면 *예쁜 쓰레기. demo 와 *프로덕션 의 *차이 가 *검증 의 깊이. 내 *Claude Code 봇 운영18 개월 의 *학습 된 결론.


1. 전체 그림 *— *16 가지 의 *5 그룹**

flowchart TD
    subgraph G1["1. 기본 (Foundation)"]
        A[01. Agent]
        AW[02. Agentic Workflow]
        L[03. LLM]
        R[04. Router]
    end
    subgraph G2["2. 프롬프트 (Prompting)"]
        P[05. Prompt]
        MP[06. Meta-prompt]
        C[07. Context]
    end
    subgraph G3["3. 지식·도구 (Knowledge & Tools)"]
        RAG[08. RAG]
        T[09. Tool]
        MCP[10. MCP]
    end
    subgraph G4["4. 시스템 (System)"]
        MA[11. Multi-Agent]
        M[12. Memory]
    end
    subgraph G5["5. 검증 (Validation) — *예쁜 쓰레기 방지*"]
        GS[13. Goldenset]
        QG[14. Quality Gate]
        H[15. HITL]
        E[16. Escalation]
    end

    G1 --> G2 --> G3 --> G4 --> G5

    classDef foundation fill:#1e3a5f,stroke:#3b82f6,color:#fff
    classDef prompt fill:#3f2f1f,stroke:#f59e0b,color:#fff
    classDef knowledge fill:#3f1e3f,stroke:#a855f7,color:#fff
    classDef system fill:#1f3f1f,stroke:#22c55e,color:#fff
    classDef validation fill:#5f1e1e,stroke:#ef4444,color:#fff
    class A,AW,L,R foundation
    class P,MP,C prompt
    class RAG,T,MCP knowledge
    class MA,M system
    class GS,QG,H,E validation

아래 부터 위로 갈수록 *추상 적. 위 부터 아래로 갈수록 *구체 적. 그러나 *진짜 가치그룹 5 (검증) 에 있다.


Part 1. 기본 (Foundation) — *4 가지**

2. Agent (01) — *“무엇 을 *할 수 있는가”**

2.1 정의

Agent = LLM + 도구 + 목표 + 의사 결정 의 반복 루프.

flowchart LR
    G[목표] --> O[관찰]
    O --> T[생각<br/>LLM]
    T --> A[행동<br/>도구 사용]
    A --> O

    classDef agent fill:#1f3f1f,stroke:#22c55e,color:#fff
    class G,O,T,A agent

ReAct 패턴 — Reasoning + Acting 의 반복. 현재 *Claude · GPT 의 *agent mode기본 동작.

2.2 Agent ≠ Chatbot

구분 Chatbot Agent
사용자 입력 1 회 응답 목표 달성 까지 반복
도구 사용 없음 적극 적 사용
상태 메모리 보유
자율성 0 부분 자율

Claude Code내가 *“jabis 의 ImagePullBackOff 진단해줘” 하면 kubectl 호출 → describe → 로그 분석 → 결론 까지 반복 자율 수행. 그게 *agent.

2.3 내 *Claude Code 봇 의 *agent 정의**

agent:
  name: claude-code-telegram-bot
  goal: 텔레그램 메시지 의 요청 을 자율 적 으로 수행
  loop:
    - 메시지 수신
    - 의도 분석
    - 필요한 도구 선택 (Bash / Read / kubectl / git)
    - 도구 실행
    - 결과 평가
    - 응답 전송
  tools:
    - Bash (shell 명령)
    - Read (파일 읽기)
    - kubectl (클러스터 조회)
    - mcp__plugin_telegram_telegram__reply (응답)

3. Agentic Workflow (02) — *“어떤 *흐름 으로 하는가”***

3.1 정의

Workflow = Agent 의 *작업 의 *조립 패턴. 어떤 단계 가 *어떤 순서 로 *어떤 분기 로 흐르는가*.

3.2 5 가지 표준 패턴 (Anthropic 문서 기준)

flowchart TD
    subgraph P1[Prompt Chaining]
        A1[Step 1] --> A2[Step 2] --> A3[Step 3]
    end
    subgraph P2[Routing]
        I[Input] --> J{Router}
        J --> B1[Path A]
        J --> B2[Path B]
        J --> B3[Path C]
    end
    subgraph P3[Parallelization]
        S[Start] --> W1[Worker 1]
        S --> W2[Worker 2]
        S --> W3[Worker 3]
        W1 --> M[Merge]
        W2 --> M
        W3 --> M
    end
    subgraph P4[Orchestrator-Workers]
        O[Orchestrator<br/>분해 + 위임] --> X1[Worker 1]
        O --> X2[Worker 2]
        X1 --> O
        X2 --> O
    end
    subgraph P5[Evaluator-Optimizer]
        G[Generator] --> E[Evaluator]
        E -->|"Improve"| G
        E -->|"Pass"| F[Final]
    end

    classDef pattern fill:#3f2f1f,stroke:#f59e0b,color:#fff
    class A1,A2,A3,I,J,B1,B2,B3,S,W1,W2,W3,M,O,X1,X2,G,E,F pattern

오늘 새벽 의 *5 사고 진단Routing + Orchestrator-Workers조합. 알람 종류 별 *다른 진단 워크플로 *분기.


4. LLM (03) — *“뇌”**

4.1 Agent 의 *추론 엔진**

Claude / GPT / Gemini / Llama뇌 의 자리. agent 의 *모든 *판단 과 *생성원천.

4.2 모델 선택 의 *3 가지 기준

기준 의미
성능 문제 복잡도 에 따라 — Opus (복잡) / Sonnet (균형) / Haiku (단순)
비용 토큰 단가 + 응답 속도
컨텍스트 Claude 4.7 1M 컨텍스트 vs 200k vs 32k

4.3 내 *운영 의 *모델 매핑**

  • Settlement 코드 리뷰 — Opus 4.7 1M (전체 컨텍스트 필요)
  • 텔레그램 알람 응답 — Sonnet 4.6 (속도 + 비용)
  • 간단 분류 (의도 파악) — Haiku 4.5 (저비용)

5. Router (04) — *“어디로 보낼 것 인가”**

5.1 Routing 의 *진짜 역할**

입력 을 *어떤 *처리 경로 로 보낼지 결정. *서비스 의 LB 와 동일 한 추상.

5.2 Routing 의 3 가지 단계

flowchart TD
    I[입력 메시지] --> C[분류 LLM<br/>Haiku — 저비용]
    C --> J{의도}
    J -->|코드 리뷰| O[Opus 4.7 + 큰 컨텍스트]
    J -->|간단 질문| H[Haiku 4.5]
    J -->|이미지 분석| V[Vision-capable 모델]
    J -->|운영 명령| AG[Bash + kubectl agent]

    classDef router fill:#3f1e3f,stroke:#a855f7,color:#fff
    class C,J router

Router 가 *비용 의 핵심. 모든 요청 을 Opus 로 보내면 *예산 폭발. Haiku 로 *분류 만 한 후 적절 한 모델 로 분기.

5.3 내 봇 의 *라우터 구현 (의사 코드)**

def route(message):
    intent = haiku_classify(message)  # 저비용 분류
    if intent == "code-review":
        return opus_agent(message, context_size="1M")
    elif intent == "operational-query":
        return bash_agent(message)
    elif intent == "image":
        return vision_agent(message)
    else:
        return sonnet_chat(message)

Part 2. 프롬프트 (Prompting) — *3 가지**

6. Prompt (05) — *“무엇 을 시키는가”**

6.1 프롬프트 의 *6 가지 구성 요소

어제 글 — *AI 프롬프트 의 *7 가지 기호*직접 적 후속.

# 역할
당신 은 senior Spring Boot reviewer.

# 컨텍스트
<repository>...</repository>

# 작업
N+1 query 식별 + 수정 제안

# 제약
- Java 25 호환
- ArchUnit 규칙 준수

# 출력
[markdown / diff]

# 예시
<example>...</example>

6 가지 의 *모두 가 있어야 *고품질 응답.

6.2 Few-shot vs Zero-shot

  • Zero-shot예시 없음
  • One-shot예시 1 개
  • Few-shot예시 N 개 (보통 3~5)

복잡 한 작업 일수록 Few-shot 의 효과 큼.


7. Meta-prompt (06) — *“프롬프트 를 *프롬프트 하는 *프롬프트”**

7.1 정의

LLM 에게 *프롬프트 자체 를 *작성 시키는 *프롬프트. 재귀 적.

# Meta-prompt
다음 작업 을 위한 *최적 의 프롬프트* 를 작성 해주세요:
- 작업: Spring Boot 의 N+1 query 식별
- 대상: senior backend developer
- 출력 형식: markdown

7.2 왜 유용한가

복잡 한 작업프롬프트내가 직접 짜는 *비용 보다 LLM 에게 시키는 게 *효율. LLM 이 *자신 의 *내부 표현최적 화 된 *프롬프트 를 자동 생성.

7.3 내 *Settlement 운영 의 *Meta-prompt 활용**

"내일 부터 *주 1 회* 자동 정산 체크 봇 운영. 다음 메타 정보 로 *체크 봇 의 시스템 프롬프트* 를 작성해줘:
- 도메인: 정산 (Settlement)
- 점검 대상: outbox 처리율, 정산 완료율, 차지백 발생
- 알람 임계치: ...
- 출력 형식: Slack 메시지"

Claude 가 *완성 된 *시스템 프롬프트생성. 내가 직접 짜는 시간 의 *1/10.


8. Context (07) — *“무엇을 *알고 있나”**

8.1 컨텍스트 의 *3 종류

flowchart LR
    S[System Prompt<br/>역할·정책·제약] --> A[Agent]
    U[User Input<br/>현재 요청] --> A
    H[History<br/>이전 대화 / 메모리] --> A
    R[Retrieved Context<br/>RAG] --> A
    T[Tool Output<br/>도구 결과] --> A
    A --> O[응답]

    classDef ctx fill:#3f1e3f,stroke:#a855f7,color:#fff
    classDef agent fill:#1f3f1f,stroke:#22c55e,color:#fff
    class S,U,H,R,T ctx
    class A agent

8.2 Context Window 의 *물리적 한계

  • Claude 4.7 — 1M 토큰 (약 75 만 단어)
  • GPT-4o — 128k
  • Gemini 1.5 Pro — 2M

컨텍스트 의 *진짜 비용Input 토큰 의 *가격 + 처리 시간 (latency). 1M 의 전체 사용 = *비용 폭증.

8.3 Context 의 *핵심 관리 기법

  1. Compaction대화 가 길어지면 *과거 를 *요약재 주입
  2. Cache반복 적 사용 의 *prefix 캐싱 (Anthropic 의 prompt caching)
  3. Selective inclusionRAG 로 *필요 한 것 만 가져옴

Claude Code 의 *1M 컨텍스트settlement 의 전체 코드 베이스 를 *한 번에 적재 가능. 그래도 *내가 *주의 필요 한 부분 만 집중 시키는 *프롬프트 의 *기교.


Part 3. 지식·도구 (Knowledge & Tools) — *3 가지**

9. RAG (08) — *Retrieval Augmented Generation**

9.1 RAG 의 *4 단계

flowchart LR
    Q[Query] --> E[임베딩<br/>Embedding model]
    E --> S[Vector DB 검색<br/>top-k]
    S --> R[Retrieved chunks]
    R --> P[프롬프트 + chunks]
    P --> L[LLM 생성]
    L --> A[Answer]

    classDef rag fill:#3f1e3f,stroke:#a855f7,color:#fff
    class E,S,R,P,L rag

9.2 왜 필요한가

LLM 의 *학습 데이터 의 *cutoff + 모르는 지식 (사내 문서, 최신 정보) 의 *주입.

9.3 Vector DB 의 *선택지

  • Postgres + pgvector기존 DB 활용. 추천 (내 settlement 도 이 선택)
  • Pinecone / Weaviate — 전용 서비스
  • Chroma / Qdrant — 오픈소스

9.4 RAG 의 *함정 — *“문서 가 *최신 인지”**

Vector DB 의 *embedding 이 *오래 되면 *오답 생성. 문서 변경 시 *embedding 재 생성파이프 라인진짜 어려운 부분.


10. Tool (09) — *“손과 발”**

10.1 Tool Use 의 *기본 흐름

sequenceDiagram
    participant U as User
    participant A as Agent (LLM)
    participant T as Tool
    
    U->>A: 요청
    A->>A: 도구 선택 판단
    A->>T: tool_call (Bash / API / DB)
    T-->>A: tool_result
    A->>A: 결과 평가
    A-->>U: 최종 응답

10.2 내 *Claude Code 의 *Tool 카탈로그**

Bash      — shell 명령 (kubectl / git / curl)
Read      — 파일 읽기
Edit      — 파일 수정
Write     — 파일 생성
Grep      — 코드 검색
WebFetch  — URL 가져오기
WebSearch — 인터넷 검색
TaskCreate — 진행 추적
mcp__*    — MCP 서버 의 모든 도구

각 도구 가 *명확 한 *입력 / 출력 의 schema. agent 가 *상황 에 맞게 *선택.

10.3 Tool 의 *위험 — *destructive vs safe**

  • Read안전. 임의 호출 OK
  • Bash위험. 사전 승인 또는 dry-run 필요
  • Write변경. 백업 가능 한 영역 만

오늘 새벽 의 *kubectl applyproduction 변경제가 자율 적 으로 해서 자기 반성 한 *바로 그 부분.


11. MCP (10) — *Model Context Protocol**

11.1 Anthropic 의 *2024 표준

MCP = LLM 과 *외부 도구 / 데이터 의 *연결 의 *통신 프로토콜. USB-C 같은 *표준 connector.

11.2 왜 중요한가

[ MCP 이전 ]
각 도구 마다 *개별 connector 작성*. *N 개 도구 × M 개 LLM = *N×M 의 *연결*.

[ MCP 이후 ]
MCP 표준 한 번 만. *모든 MCP server 가 *모든 MCP client (Claude/GPT/etc) 와 *호환*.

11.3 내 *MCP 서버 들**

Claude Code연결 된 MCP :

  • Telegram — 채팅 메시지 송수신
  • Notion — 페이지 검색 / 작성
  • Slack — 메시지 / 검색
  • Supabase — DB 조회
  • Gmail / Google Drive — 메일 / 파일
  • Figma / Canva / Gamma — 디자인 / 프레젠테이션
  • Vercel / Linear — 배포 / 이슈

16 가지 이상 의 MCP 서버모두 *동일 한 프로토콜. Claude 가 *어느 MCP 든 자동 으로 *발견 + 호출.


Part 4. 시스템 (System) — *2 가지**

12. Multi-Agent (11) — *“여러 명 의 *전문가”**

12.1 Multi-Agent 의 *진짜 이유

단일 LLM 에게 모든 일 을 시키는 게 비효율. 전문화 된 sub-agent 들 이 각자 의 일 을 하고 조율자 (orchestrator)통합.

12.2 Anthropic 의 *Multi-agent Research 시스템**

Settlement 의 *코드 리뷰 시스템같은 패턴:

flowchart TD
    O[Orchestrator] --> S1[Security Agent]
    O --> S2[Performance Agent]
    O --> S3[Architecture Agent]
    O --> S4[Test Coverage Agent]
    S1 --> R[Review Reporter]
    S2 --> R
    S3 --> R
    S4 --> R

    classDef orch fill:#3f2f1f,stroke:#f59e0b,color:#fff
    classDef sub fill:#1f3f1f,stroke:#22c55e,color:#fff
    classDef rep fill:#3f1e3f,stroke:#a855f7,color:#fff
    class O orch
    class S1,S2,S3,S4 sub
    class R rep

12.3 Multi-agent 의 *진짜 어려움

  • 통신 오버헤드agent 간 *메시지 전달 의 비용
  • 합의 (consensus)서로 의 답이 다르면 *누구를 믿나
  • 디버깅어느 agent 에서 *실수 했는지 추적

13. Memory (12) — *“기억”**

13.1 Memory 의 *3 가지 종류

종류 의미 예시
Short-term 현재 대화 의 context window 안 이전 메시지
Long-term 세션 간 *영속 “사용자 는 Java 전문가
Episodic 특정 사건 의 *기록 “어제 louise 다운 사고”

13.2 Claude 의 *Memory 시스템

세션 에서 지속 적 으로 *축적 된 *메모리 :

  • ~/.claude/projects/-Users-lms-settlement/memory/
  • user.md — 사용자 의 역할 / 선호 / 지식
  • feedback.md어떻게 협업 해야 하는지
  • project.md진행 중 인 *작업 / 결정
  • reference.md외부 시스템 의 *위치

시스템 프롬프트전체 메모리 가 *주입 됨. 새 세션 도 *어제 의 사고 를 기억.

13.3 Memory 의 *어려움 — *언제 *기억 / 잊을 까**

모든 것 을 기억 하면 *시야 가 *흐려짐. 중요 한 것 만 선별 적 으로 남기는 *판단 력 의 *학습.


Part 5. 검증 (Validation) — *4 가지 — *“예쁜 쓰레기 방지”**

14. Goldenset (13) — *“정답 의 집합”**

14.1 정의

Goldenset = 내 시스템 이 *반드시 *정답 을 *내야 하는 *테스트 케이스 의 *모음. AI 시스템 의 *regression test.

14.2 내 *Settlement 의 *Goldenset**

goldenset:
  - input: "주문 100   정산 금액 계산"
    expected_output:
      total: 1234567
      commission: 43210
      payable: 1191357
    tolerance: 0  # 정확 한 일치

  - input: "수수료 변경  정산 재계산"
    expected_output:
      preserves_original_rate: true  # 이력 보존

매 *모델 변경 / 프롬프트 변경Goldenset 자동 검증. 돈 의 도메인 에서는 필수.

14.3 Goldenset 없는 *AI 시스템 의 *결말

프롬프트 한 줄 변경 으로 모든 정산 금액이 *5% 잘못 계산. 알아 채는데 *2 주. 그동안 의 *돈 의 손실. Goldenset 이 있으면 *변경 즉시 *검증 실패 → 배포 차단.


15. Quality Gate (14) — *“통과 기준”**

15.1 정의

Quality Gate = AI 출력 이 *프로덕션 으로 *나가기 전 *통과 해야 할 *자동 검증 체크 리스트.

15.2 Quality Gate 의 *4 층

flowchart TD
    AI[AI 응답] --> G1{형식 검증}
    G1 -->|fail| F[차단]
    G1 -->|pass| G2{내용 검증<br/>키워드 / 길이}
    G2 -->|fail| F
    G2 -->|pass| G3{Goldenset 비교}
    G3 -->|fail| F
    G3 -->|pass| G4{사실 검증<br/>RAG cross-check}
    G4 -->|fail| F
    G4 -->|pass| OK[배포 / 응답]

    classDef gate fill:#3f2f1f,stroke:#f59e0b,color:#fff
    classDef pass fill:#1f3f1f,stroke:#22c55e,color:#fff
    classDef fail fill:#5f1e1e,stroke:#ef4444,color:#fff
    class G1,G2,G3,G4 gate
    class OK pass
    class F fail

15.3 내 *Claude Code 봇 의 *Quality Gate 예시

  • 형식: 응답 길이 50 ~ 4000 자
  • 내용: PAT / 토큰 등 *민감 정보 포함 X
  • 안전: production 변경 명령 의 *사전 확인
  • 사실: 외부 도메인 응답 의 *실제 확인

Quality Gate 통과 안 한 응답 은 *전송 안 함. 예쁜 쓰레기 방지.


16. HITL (15) — *Human In The Loop**

16.1 정의

HITL = AI 의 *판단 의 *결정 적 분기점 에 *사람 의 승인 단계*.

16.2 언제 HITL 이 필요 한가

  • 비가역 적 변경DB 삭제 / production 배포 / 결제
  • 높은 비용수십 만 원 의 API 호출
  • 법적 / 윤리적 판단의료 / 법률 / 금융 자문
  • 불확실 한 경계AI 의 *confidence 가 낮을 때

16.3 내 *오늘 새벽 의 *HITL 부족 의 자기 반성**

3 일 전 *프로덕션 자기 반성 글 에서 내가 *42 namespace 의 *Secret 일괄 갱신 한 게 HITL 없이 진행* 했다고 솔직히 *인정. 진짜 프로덕션 이라면 *각 단계 마다 *사람 승인 필수.

hitl_policy:
  read_only: [auto]                        # 자동
  single_namespace_change: [auto]          # 자동
  multi_namespace_change: [confirm]        # *사람 승인 필수*
  production_db_migration: [confirm]       # *사람 승인 필수*
  irreversible_delete: [confirm + dry-run] # *2 단계 승인*

17. Escalation (16) — *“상위 로 *올리기”**

17.1 정의

Escalation = Agent 가 *처리 못 하는 *경계 에서 상위 (LLM 의 *더 큰 모델 / 사람) 으로 *이관 하는 프로토콜.

17.2 Escalation 의 *3 가지 단계

flowchart TD
    R[요청] --> L1[Haiku<br/>저비용]
    L1 -->|confidence < 0.7| L2[Sonnet<br/>균형]
    L2 -->|confidence < 0.6| L3[Opus<br/>최고]
    L3 -->|confidence < 0.5| H[Human]
    L1 -->|confidence ≥ 0.7| OK[응답]
    L2 -->|confidence ≥ 0.6| OK
    L3 -->|confidence ≥ 0.5| OK

    classDef low fill:#1e3a5f,stroke:#3b82f6,color:#fff
    classDef mid fill:#3f2f1f,stroke:#f59e0b,color:#fff
    classDef high fill:#3f1e3f,stroke:#a855f7,color:#fff
    classDef human fill:#5f1e1e,stroke:#ef4444,color:#fff
    class L1 low
    class L2 mid
    class L3 high
    class H human

17.3 Escalation 의 *비용 의 *최적화

  • 간단 요청 — Haiku 만 으로 0.001 달러
  • 복잡 분석 — Opus 까지 0.05 달러
  • 모든 요청 을 Opus50 배 비용

Escalation 의 *진짜 가치적정 모델 의 *적정 비용경제 적 분기.


18. 맺음 *— *“검증 없으면 *예쁜 쓰레기”**

위 그림 의 맨 아래 의 문장 — “검증 없으면 예쁜 쓰레기”. 오늘 글 전체 의 *결론.

18.1 Demo 와 *프로덕션 의 *차이

항목 Demo Production
Agent / LLM / Tool
RAG / Memory
Quality Gate
Goldenset
HITL
Escalation

Demo 에서는 *Part 1~4 만 으로 충분. 그러나 *프로덕션 에서는 Part 5 의 *4 가지 검증없으면 *돈 의 손실 / 신뢰 의 파괴함정.

18.2 내 *3 일 전 *프로덕션 자기 반성진짜 의미**

3 일 전 글 — *프로덕션 운영 의 *10 가지 위험*. 제가 *42 namespace 변경 할 때 *없었던 것바로 *Part 5. HITL / Quality Gate / Escalation / Goldenset 의 *전 부재. 다행히 *no-op 였지만 *진짜 사고 가 났으면 *복구 불가.

18.3 내일 *내가 *AI agent 만들 때**

  • 시작 — Part 1~3 (기본 + 프롬프트 + 도구)
  • 동작 한다 → *Demo 완성
  • 그러나 *프로덕션 으로 *가기 전 — *Part 5 (검증) 의 *4 가지 구축
  • 그제서야 *진짜 *에이전트. 그 전 까지 는 *demo.

경계AI 엔지니어 의 *진짜 차별화. 모델 을 잘 호출 하는 게 아니라 *시스템 적 검증디자인 하는 게 *진짜 일.


부록 — 오늘 *3 분 안 에 할 수 있는 *3 가지**

  • 내 *AI 시스템Goldenset 이 *존재 하는가3 개 라도 시작
  • 내 *Quality Gate 가 *형식 / 내용 / 사실각각 의 검증포함 하는가
  • 내 *HITL 의 *경계 가 *정책 으로 *문서화 되어 있는가

세 가지 중 하나 라도 없으면내 AI 시스템 은 *demo. 프로덕션 으로 가기 전 *반드시 구축.


원작자 Credit

위 그림 의 원작자Ethan Kim · AI Agent PM. 16 가지 의 *분류 와 *시각화 의 *원형 의 출처. 내 글 은 *그 16 가지 를 *내 운영 경험 으로 *깊이 풀이해설.


관련 글