📘 1부: 프롬프트는 질문, 엔지니어링은 설계입니다

부제: 더 좋은 응답을 쉽게 얻는 법

LLM을 쓰다 보면 누구나 한 번쯤 이런 경험을 합니다.

“어제는 잘하더니 오늘은 왜 이렇게 엉뚱하게 답하지?”
“GPT가 작업 중간에 뭔가 잃어버린 것 같은데?”
“이렇게 스펙을 정리했는데 왜 다른 걸 이해하지…?”

이 차이를 만드는 핵심 원인은 프롬프트를 어떻게 입력 혹은 설계했느냐입니다.
같은 모델에게 요청해도 결과가 다르게 나오는 이유죠.

이 글에서는 ‘프롬프트 vs 프롬프트 엔지니어링’의 차이를
가장 쉽고 실용적인 관점에서 정리해보겠습니다.

🧩 1. 프롬프트란 무엇일까요?

프롬프트는 AI에게 주는 요청(Instruction)입니다.
즉, “이걸 해달라”고 전달하는 단순 명령입니다.

예를 들면:

“이 문서를 요약해 주세요.”
“서비스 기획서를 작성해 주세요.”
“아이온2 전투 시스템을 설명해 주세요.”

이렇게 단순하게 입력해도 모델은 꽤 많은 일을 해냅니다.
하지만 문제는 결과가 일정하지 않다는 점입니다.
바로 이 지점에서 엔지니어링이 필요해집니다.

🏗️ 2. 프롬프트 엔지니어링이란?

프롬프트 엔지니어링은
AI가 더 좋은 결과를 안정적으로 내도록 입력을 설계하는 기술입니다.

단순히 길게 쓰거나 어렵게 쓰는 게 아니라,

목적
구조
맥락
데이터
출력 형식

등을 명확하게 설계해 모델이 헤매지 않도록 안내하는 작업입니다.

그리고 중요한 사실이 있습니다.

프롬프트 엔지니어링은 개발자 기술이 아닙니다.
언어로 ‘설계’를 하는 모든 사람에게 필요한 스킬입니다.

PM·마케터·기획자·에디터·컨설턴트…
LLM을 쓰는 누구나 매일 부딪히는 실용 기술입니다.

🎯 3. 왜 굳이 프롬프트 엔지니어링을 해야 할까요?

저도 초기에는 이렇게 생각했습니다.

“GPT가 똑똑한데 굳이 복잡하게 설계할 필요가 있나?”

하지만 실제 업무에서 깊게 활용해보니 명확한 이유가 있습니다.

✔ 결과 품질이 매번 다르다

작은 표현·순서 차이만으로도 큰 품질 차이가 납니다.

✔ 모델은 부정문·복잡한 문장·중간부 누락에 취약

Lost in the Middle(중간 내용 삭제)은 LLM의 고질적 문제입니다.

✔ 엔지니어링을 하면

더 정확하고
더 빠르고
더 저렴하고
재사용 가능한 자동화 도구가 됩니다.

결국 목적은 하나입니다.

더 좋은 결과를 얻기 위해서.
더 쉽게, 더 안정적으로.

🧱 4. 프롬프트 엔지니어링의 핵심 4요소

이 4요소는 Anthropic Claude Prompt Engineering Guide,
OpenAI Prompting Overview,
Google Cloud Prompt Engineering Guide에서 공통적으로 사용하는 구조입니다.

각 요소의 의미를 1줄로 정리하면 다음과 같습니다.

① Instructions (지시)

모델에게 “무슨 작업을 해야 하는지” 명확히 전달하는 부분.

예)

“아래 문서를 3줄로 요약해 주세요.”

② Input Data (데이터)

모델이 실제로 처리해야 하는 텍스트·표·코드 등 입력 데이터.

예)

분석할 문서 본문
사용자 로그
텍스트 조각

③ Context (맥락)

작업이 수행되는 배경·조건·관점을 설명하는 부분.

예)

“PM 관점에서 설명해 주세요.”
“전문가 톤을 유지해주세요.”

④ Output Indicator (출력 지시문)

모델이 어떤 형태로 결과를 내야 하는지 구조·형식을 명시.

예)

“표 형식으로 작성해 주세요.”
“JSON으로 출력해 주세요.”
“한 줄당 20자 이하로 써 주세요.”

…

이 네 가지를 포함해 프롬프트를 작성하면 품질과 재현성이 크게 향상됩니다.

✏️ 5. 엔지니어링 팁 — 이것만 기억해도 반은 성공합니다

(각 항목에 좋은 예시(O) / 나쁜 예시(X) 포함)

✅ 1) 부정문 최소화

LLM은 부정문을 자주 오해합니다.

(X) 나쁜 예시

“문체는 절대 변형하지 말고 요약해 주세요.”
→ ‘변형하지 말고’를 무시하거나 반대로 이해할 위험↑

(O) 좋은 예시

“문체는 그대로 유지하고, 핵심 내용만 요약해 주세요.”
→ 긍정문 기반 → 오해 없음

✅ 2) 구조화된 프롬프트 사용

모델은 구조를 좋아합니다.

(X) 나쁜 예시

“전투, 경제, 보상을 포함해서 게임 시스템을 자세히 설명해 주세요.”
→ 누락 or 순서 혼란 가능

(O) 좋은 예시

출력 구조:

전투 시스템(3줄)
경제 구조(표)
보상 구조(장점/리스크 2줄씩)
→ 모델이 “틀”대로 작성 → 안정적 출력

✅ 3) 출력 형식을 먼저 정하기

(X) 나쁜 예시

“이 글의 핵심 내용을 알려주세요.”
→ 모델이 임의 판단 → 길이·형식·순서 불안정

(O) 좋은 예시

“아래 문서를

3줄 요약
불렛 포인트
한 문장 20자 이하
형식으로 정리해 주세요.”
→ 품질·일관성 급상승

✅ 4) 짧고 명확하게

긴 설명은 사람도 AI도 이해하기 어렵습니다.

(X) 나쁜 예시

“배경이 이런데, 그래서 제가 원하는 건 이런 거고… 아무튼 잘 정리해 주세요.”

(O) 좋은 예시

“아래 기사를 PM 관점에서 3줄로 요약해 주세요.”
→ 명확·간결·정확

🔮 6. 앞으로는 GPT에게 ‘설계’까지 맡기는 시대

프롬프트 엔지니어링의 최신 방향은
“프롬프트를 사람이 직접 설계하는 시대가 끝나가고 있다”입니다.

이제는 이렇게 요청하는 것이 더 효율적입니다.

“GPT, 이 작업을 위한 최적의 프롬프트를 먼저 설계해 주세요.”

사람은 요구사항만 제시하고,
프롬프트의 구조·형식·샘플·맥락은 모델이 설계하는 시대입니다.

🧭 7. 마무리

프롬프트 엔지니어링은 어렵지 않습니다.
본질은 “좋은 질문을 구조적으로 만드는 기술”이며,
이를 통해 더 좋은 응답을 쉽게 얻을 수 있습니다.

이번 1부에서는 개념을 정리했습니다.
2부에서는 실전 Before/After 비교를 공개하겠습니다.

📘 다음 글 예고

2부: 프롬프트 엔지니어링은 GPT에게 맡기세요 — 실전 Before/After 3선

내용 구성:

AI/RAG 평가 기준 자동 생성
데이터 정제 + 시각화 레포트 생성
서비스 기획 문서 자동 생성
세 가지 실무 예제를 통해 프롬프트 엔지니어링의 효과를 보여드립니다.

🚗 현대차 LLM 챗봇 데모 (Hybrid: Rule + RAG)

추석 연휴 간,
개인 프로젝트로 진행한 하이브리드 챗봇 데모를 공개합니다.

Rule의 안정성과 LLM의 확장성을 결합하여,
연휴 기간 동안 바이브코딩 방식으로 직접 구축하고 다듬어 보았습니다.
(※ 현대자동차 공식 챗봇과 무관합니다.)

🎬 Hook: 1분 데모 + 최종 평가 표

👉 Demo: hyundai-chatbot-demo.vercel.app

※ 참고: Vercel 빌드 환경에서는 일부 RAG 질의(띄어쓰기·유사명칭·오탈자 등)의 인식률이 Stackblitz 실험 환경보다 낮게 나타날 수 있습니다.
본 영상은 Stackblitz 기준으로 촬영되었으며, 동일 코드 기반으로 Vercel에서도 대부분 정상적으로 작동합니다.

1️⃣ 왜 만들었나 (Why)

이번 데모는 바이브코딩을 통한 챗봇 구현 프로젝트의 일환으로, 차량 구매 목적의 실제 사용자 시나리오에서 출발했습니다.

기존 챗봇의 경우 기본 정보 제공은 충분했지만, 구매·시승·상담 등 다음 행동으로 자연스럽게 이어지는 흐름은 더 보완될 여지가 있었습니다.

목표는 기존 시스템을 비판하는 것이 아닌, “정보 전달 → 행동 전환” 간격을 줄이는 플로우 설계였습니다.

구매 목적 사용자 시나리오의 개선 포인트
- 견적/시승 문의까지 이동 단계가 비교적 길어지는 구간
- 외부 페이지 이동 시 대화 맥락이 단절되는 지점
- 동일 메뉴/버튼 반복 노출로 인한 탐색 피로

이에 따라 데모는 “FAQ 요약 + 공식 링크(CTA) + 최소 단계 전환”을 원칙으로, 사용자가 질문하면 필요 행동까지 즉시 연결되고 순환되는 경험을 지향했습니다.

2️⃣ 어떻게 만들었나 (How)

Part 1. 분석 & 전략

가설
1. 목표 행동(구매·시승·AS)까지 경로 단축과 링크/CTA 무결성이 사용자 만족도와 목표(KPI) 전환에 결정적이라고 가정
2. 또한 LLM 측면에서 유사 발화 대응력(띄어쓰기·별칭·오탈자)이 실사용성에 큰 영향을 준다고 가정
분석
1. 실제 공식 사이트 캡처·메뉴 트리 분석
2. Top FAQ 및 유사 발화 수집&정규화
3. 링크 유효성 및 도메인 점검
전략
1. 플로우 단순화(Simplify Flow) → 메뉴 통합, CTA 중심 설계, 1~2단계 내 해결
2. 지속적인 연결(Connect Experience) → 핵심 정보는 대화 내 제공, 필요 시에만 외부 링크
3. 데이터 최신화(Keep Data Fresh) → 공식 FAQ 247 + 추가 Top 50 정비하여 반영 ( 지식 강화로 RAG 품질 안정화/고도화에 기여)

Part 2. 설계 & 개발

아키텍처(Front-only Hybrid)
- Rule Layer: 가격·보증·리콜·EV 추천 등 고정 의도 우선 처리
- RAG Layer: faq.json + BM25 검색 → LLM 요약
- UX Layer: 칩(Chips), 바텀시트, Sticky CTA(공식 링크/전화)

R1 → R2 → R3 개선 사이클
- R1 (Prototype): Rule 70~80% + RAG 기본(가능성/흐름 우선)
- R2 (Tuning): Rule 100% + 현대차 공식 FAQ 크롤링 반영 + BM25 교체, 유사 발화 정규화, 자동 테스트 루틴 구축
- R3 (QA/Deploy): 자동/수동 라벨 교차검증, CTA·Fallback 보강 → 최종 평가 표 기준 전 항목 Pass

Part 3. 자동 테스트 & QA

테스트 루틴
- 콘솔 기반 runBatch() 자동 테스트 → 수동 라벨링으로 최종 판정
라벨 분포 보정(R1을 예시)
- 자동: Good 40 / Fair 120 / Bad 136
- 수동(최종): Good 183 / Fair 2 / Bad 111
- “자동–수동 일치율: 45.6%” → 임계값·가중치 보정 후 상향
보정 정책(R3 반영)
- Retrieval TopScore 임계값 조정(예: ≥20=Good 후보)
- Retrieval 성공 시 CTA 필수 부착, Fallback에도 고객센터 CTA 제공
- 부분매칭 Good는 Gold 데이터 보강하여 업데이트
  → 위 보정 이후, 본문 상단 최종 평가 표의 기준으로 품질을 점검·정리했습니다.

Part 4. RAG + Rule 하이브리드

현업에서는 Rule-first를 반영했으나, 본 프로젝트에서는 RAG-first를 도입하여 실험
Retrieval 신뢰도(TopScore/Threshold)에 따라 FAQ → OpenDomain → Fallback으로 분기 처리
역할 분리: “Rule = 안정성”, “RAG = 커버리지·설명력”
※ Vercel 배포 환경에서는 런타임(Edge vs Node) 및 경로 처리 차이로 인해 일부 질의(띄어쓰기, 유사명칭 등)의 검색 인식률이 Stackblitz 실험 환경 대비 다소 낮게 나타났습니다. 코드 구조와 데이터는 동일하며, 이는 환경 특성에서 비롯된 결과로 판단됩니다.

Part 5. 배포 트러블슈팅

Vercel 환경: OpenAI 직접 호출 지양 → /api/chat.ts 에지 프록시
인덱싱 race 방지: ensureRagReady() 싱글톤 초기화 + 임베디드 코퍼스
dev/prod 코퍼스 동기화: assets 임베드 + 런타임 /faq.json 덮어쓰기
재할당 경고 해결: const → let
공식 FAQ URL 변경: 리다이렉트 미지원 건은 외부 이슈로 Skip

3️⃣ 결과 & 배운 점 (What / Lessons)

🎯 핵심 성과

최상단 최종 평가 표 기준으로 정확도·라우팅/폴백·링크/CTA·성능·스타일/안전·UI/UX 전 항목 Pass를 달성했습니다.
Rule + RAG 결합 구조를 구축하고, 자동 QA 루틴(runBatch)을 적용했습니다.
R1→R2→R3 개선 사이클을 통해 품질을 확보하고 프로덕션 레디 수준으로 정비하였습니다.

🧩 진행 중 어려움

마지막 5% 완성 구간에서 시간 소요가 집중되었습니다. (체감상 전체 소요 시간의 20% 이상)
공식 사이트 URL 변경(리다이렉트 미지원)로 일부 항목은 Skip 처리했습니다.
바이브 코딩 시, 프롬프트 반복 입력 시 맥락을 벗어나 필요 이상으로 수정 발생하는 케이스가 많았습니다.
배포 환경(Vercel)에서 RAG 검색 성능이 Stackblitz 대비 약하게 나타났습니다. 이는 런타임 및 빌드 환경 차이로 인한 현상으로, 실 서비스 영향 범위는 RAG 한정으로 나타났습니다.

💡 교훈

작업 단위는 최대한 작게 쪼개고, 문맥은 명확하게 가져가야 합니다. (챗방 최대한 쪼개기 + 상세한 프롬프트 필요)
제안 코드는 그대로 적용하기보다 구조를 확인하고 최소 수정으로 해결해야 합니다.
바이브 코딩은 개발 도구에 가깝습니다(기본 문법·구조 이해가 효율을 좌우).
Agent 로 자동 검수 + 수동 QA 조합으로 효율적으로 시간을 아끼고 품질을 높여줍니다.
초기 목표는 50% 범위로 설정해야 합니다. 최초 예상보다 2~3배의 시간과 노력이 소요되기 쉬워, 단계별 확장이 현명합니다.
RAG 보정은 생각보다 어렵습니다. (예: 유사 발화·띄어쓰기·별칭 대응 등)

P.S. 추석 연휴 내내 작업하여 마지막 보정 작업과 글 작업을 진행하니 어느덧 1주일이 금방이네요. 처음 해보는 바이브코딩은 생각보다 어렵고 힘들었지만, 생각보다 재미있고 많은 걸 배울 수 있었습니다. 더 재미나고 쉬운 바이브코딩 2탄으로 찾아오겠습니다 😊🤩

AI 챗봇, RAG 파이프라인 속 기획자의 역할

1. 서문

앞선 글에서는 Safety 정책과 폴백·쿠션멘트 설계를 다뤘습니다.
이번에는 이 요소들이 RAG 파이프라인 속에서 어떻게 연결되는지를 이야기하려 합니다.

먼저 간단히 복습하자면:

LLM (Large Language Model): 대규모 언어 모델. 질문을 이해하고 답변을 생성하는 엔진
RAG (Retrieval-Augmented Generation): LLM이 답변을 생성하기 전, 검색으로 근거 자료를 찾아 활용하는 최신화 프레임워크
→ 즉, “검색 기반 + 생성형”을 결합해 답변의 신뢰도를 높이는 방식입니다.

파이프라인 자체는 개발팀이 주도적으로 설계·구현했지만,
제가 맡은 역할은 그 흐름이 사용자 경험 차원에서 안정적으로 작동할 수 있도록 기준과 필요사항을 정의하는 것이었습니다.

2. RAG 파이프라인 개요

RAG는 보통 다음 단계를 거칩니다:

Input 처리 – 사용자 발화 전처리
Retriever – 검색 및 문서 매칭
Augment – 검색 결과 정제 및 후보 선택
Generator – LLM 응답 생성
Output Post-processing – 응답 후처리 및 검증

이 중 기획자의 역할은 각 단계에서 “어떤 경우를 어떻게 처리할지” 기준을 제공하는 것입니다.

3. 단계별 기획자의 터치포인트

각 단계는 개발팀이 주도적으로 구현했지만,
기획자는 사용자 경험 관점에서 기준을 정의하는 역할을 했습니다.

단순 요약이 아니라, 실제로 어떤 일이 일어나는지를 예시와 함께 풀어보겠습니다.

① Input (전처리 & Safety 1)

개발팀: 언어 탐지, 금칙어/개인정보(PII) 검출, 입력 포맷 정규화
기획:
- 미지원 언어 → “현재 한국어만 지원합니다. 다시 입력해 주세요.”
- 특수문자/형식 오류 → “입력하신 문구를 확인해 주세요.”
- 금칙어/불법 발화/개인정보 → “안전한 서비스 제공을 위해 해당 내용은 안내드릴 수 없습니다.”
- 계정/결제 등 사람 개입 필요 → 상담사 이관

👉 핵심은 차단/재시도/이관 플로우를 정의하는 것입니다. 이렇게 해야 사용자 경험을 보호하고 시스템 자원도 절약할 수 있습니다.

② Retriever (검색/매칭)

개발팀: 쿼리 빌드, 인덱스 검색, 스코어링, Top-K 후보 산출
기획:
- IDK (도메인 안인데 답 없음) vs OOD (도메인 밖 질문) 구분
- 검색 신뢰도 임계치(Threshold) → 기준 이상 = 답변 생성, 기준 이하 = 추천 리스트 제공
- 소스 우선순위 = 공식 문서 > 공지 > 커뮤니티

👉 임계치는 초기엔 개발팀이 임의로 정했지만, 실제 운영에서는 “언제 답변을 막고 언제 추천으로 돌릴지”가 사용자 경험에 직결됩니다.

📦 Top-K & Score Threshold란?

Top-K Retrieval: 검색 결과 중 상위 K개만 가져오는 방식.
예: 200개 검색 → 상위 5개만 선택 = Top-5. (보통 K=3~10)
Score Threshold(임계치): 검색 결과의 유사도 점수(score)가 기준 T 이상일 때만 “신뢰 가능”으로 간주.
예: 0.85 ≥ 0.8 → 답변 생성
예: 0.55 < 0.8 → “정확한 답변을 찾지 못했습니다. 대신 [추천 리스트]를 확인해 주세요.”
왜 기획자가 알아야 할까? 이 값들은 사용자 경험에 직접 영향을 주는 값이기 때문입니다.
예: T가 너무 높으면 → 답변이 자주 막힘
예: T가 너무 낮으면 → 엉뚱한 답변까지 노출

③ Augment (컨텍스트 구성)

개발팀: Top-K 결과 중 프롬프트에 넣을 자료 정제
기획:
- 최신 자료/공식 자료 우선 순위 설정 (이번 달 공지 > 작년 글, 공식 FAQ > 커뮤니티)
- 중복 제거 (비슷한 문서 여러 개일 경우 1개만 남김)
- 신뢰도 낮음 → 다운그레이드 응답 (“정확한 답변은 제공되지 않습니다. 대신 [공식 문서]를 참고하세요.”)

👉 즉, 어떤 자료를 남기고/빼고, 불충분할 때 어떻게 보여줄지를 정하는 단계입니다.

④ Generator (LLM 생성)

개발팀: 프롬프트 구성 및 LLM 호출
기획:
- 브랜드 톤·쿠션멘트 정의
  - 게임 = 친근/재밌게 (“이 부분은 아직 준비되지 않았어요 😅”)
  - 금융 = 단정/공식 (“현재 해당 정보는 제공되지 않습니다.”)
- 신뢰도 낮음 → 정중 거절 + 대체 링크 안내
- 프롬프트 가드레일
  - 범위 벗어난 질문은 거절
  - 모르면 IDK
  - 출처 없이 단정 금지

👉 답변 자체는 모델이 생성하지만, “어떤 톤과 규칙 안에서 말하게 할지”는 기획이 정합니다.

⑤ Output (후처리 & Safety 2)

개발팀: 최종 응답 필터링, 금칙어/민감정보 제거, 마스킹 처리
기획:
- 차단 발생 시 대체 문구 정의
  - “안전한 서비스 제공을 위해 일부 내용은 표시되지 않습니다.”
- 필요 시 공식 링크/상담 버튼 제공
- 책임 문구/출처 표기 여부 결정

👉 Output은 마지막 안전망입니다. Input에서 걸러지지 않은 리스크가 여기서 최종적으로 검수됩니다.

5. 경험담 & 마무리

처음엔 “개발팀이 기술적으로 잘 만들겠지”라고 생각했습니다.
하지만 막상 업무를 진행하다 보니, 사용자 안내 기준이 빠진 채로는 파이프라인이 온전히 작동하지 않는다는 걸 알게 되었습니다.

결국 기획자의 역할은 직접 파이프라인을 설계하는 것이 아니라,
각 단계가 사용자 경험 차원에서 일관되게 동작하도록 기준과 필요사항을 정의하고 정리하는 것이었습니다.

겉으로 보면 RAG 파이프라인은 기술 중심 프로세스처럼 보입니다.
그러나 실제로는 Safety 정책, 폴백, 쿠션멘트 같은 사용자 경험 설계가 파이프라인 속에 녹아 있어야 비로소 서비스가 제대로 굴러갑니다.

결국 기획자는 기술의 빈 공간을 채우는 사람이 아니라,
서비스 전체가 일관된 경험을 주도록 연결해주는 역할을 맡습니다.

P.S.

RAG 2.0이 아직 일반화되지도 않았는데, 벌써 RAG 3.0이 논의될 정도로
AI는 지금도 하루가 다르게 발전하고 있습니다.

따라서 지금의 RAG 파이프라인 구축은 어디까지나 하나의 프레임워크이자 레퍼런스일 뿐입니다.
앞으로 새로운 기술 트렌드에 맞춰 계속 진화할 것이고,
기획자는 급변하는 흐름 속에서 유연하게 기준과 해결책을 설계하는 태도를 가져야 할 것입니다.

🧩 1. 프롬프트란 무엇일까요?

🏗️ 2. 프롬프트 엔지니어링이란?

🎯 3. 왜 굳이 프롬프트 엔지니어링을 해야 할까요?

✔ 결과 품질이 매번 다르다

✔ 모델은 부정문·복잡한 문장·중간부 누락에 취약

✔ 엔지니어링을 하면

🧱 4. 프롬프트 엔지니어링의 핵심 4요소

① Instructions (지시)

② Input Data (데이터)

③ Context (맥락)

④ Output Indicator (출력 지시문)

✏️ 5. 엔지니어링 팁 — 이것만 기억해도 반은 성공합니다

✅ 1) 부정문 최소화

(X) 나쁜 예시

(O) 좋은 예시

✅ 2) 구조화된 프롬프트 사용

(X) 나쁜 예시

(O) 좋은 예시

✅ 3) 출력 형식을 먼저 정하기

(X) 나쁜 예시

(O) 좋은 예시

✅ 4) 짧고 명확하게

(X) 나쁜 예시

(O) 좋은 예시

🔮 6. 앞으로는 GPT에게 ‘설계’까지 맡기는 시대

🧭 7. 마무리

📘 다음 글 예고

이 글 공유하기:

🎬 Hook: 1분 데모 + 최종 평가 표

1️⃣ 왜 만들었나 (Why)

2️⃣ 어떻게 만들었나 (How)

Part 1. 분석 & 전략

Part 2. 설계 & 개발

Part 3. 자동 테스트 & QA

Part 4. RAG + Rule 하이브리드

Part 5. 배포 트러블슈팅

3️⃣ 결과 & 배운 점 (What / Lessons)

🎯 핵심 성과

🧩 진행 중 어려움

💡 교훈

이 글 공유하기:

1. 서문

2. RAG 파이프라인 개요

3. 단계별 기획자의 터치포인트

① Input (전처리 & Safety 1)

② Retriever (검색/매칭)

📦 Top-K & Score Threshold란?

③ Augment (컨텍스트 구성)

④ Generator (LLM 생성)

⑤ Output (후처리 & Safety 2)

5. 경험담 & 마무리

P.S. <img decoding="async" class="emoji" role="img" draggable="false" src="https://s.w.org/images/core/emoji/16.0.1/svg/1f642.svg" alt="&#x1f642;" />

이 글 공유하기:

P.S.