📘 2๋ถ€: ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์€ GPT์—๊ฒŒ ๋งก๊ธฐ์„ธ์š” โ€” ์‹ค์ „ Before/After

์ด์ „ 1๋ถ€์—์„œ๋Š”
์•„๋ž˜์˜ ๊ด€์ ์œผ๋กœ ๊ฐœ๋…์„ ์ •๋ฆฌํ•ด๋ณด์•˜์Šต๋‹ˆ๋‹ค.

“ํ”„๋กฌํ”„ํŠธ = ์งˆ๋ฌธ, ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง = ์„ค๊ณ„”

์ด๋ฒˆ 2๋ถ€์—์„œ๋Š” ๊ทธ ์„ค๊ณ„๋ฅผ
๊ตณ์ด ์‚ฌ๋žŒ์ด ๋จธ๋ฆฌ ์‹ธ๋งค๊ณ  ํ•˜์ง€ ์•Š๊ณ ,
GPT์—๊ฒŒ ๊ทธ๋Œ€๋กœ ๋งก๊ฒผ์„ ๋•Œ ์–ด๋–ค ์ฐจ์ด๊ฐ€ ๋‚˜๋Š”์ง€๋ฅผ ์‹ค์ œ ์‚ฌ๋ก€๋กœ ์ •๋ฆฌํ•ด๋ณด๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.


🧩 0. ์‹คํ—˜ ๋ฐฉ๋ฒ• โ€“ ๋”ฑ ์ด๊ฒƒ๋งŒ ๋ฐ”๊ฟจ์Šต๋‹ˆ๋‹ค

์‹คํ—˜ ๋ฐฉ๋ฒ•์€ ์•„์ฃผ ๋‹จ์ˆœํ•ฉ๋‹ˆ๋‹ค.

  1. ์‹ค์ œ ์—…๋ฌด์—์„œ ์ œ๊ฐ€ ํ•˜๊ณ  ์‹ถ์€ ์ž‘์—…์„ ๊ทธ๋Œ€๋กœ ์ •๋ฆฌํ•ด๋‘”๋‹ค.
  2. Before: ๋– ์˜ค๋ฅด๋Š” ๋Œ€๋กœ GPT์— โ€œ๊ทธ๋ƒฅ ์งˆ๋ฌธโ€์„ ๋˜์ง„๋‹ค.
  3. After: GPT์—๊ฒŒ

    โ€œ์ด ์ž‘์—…์„ ๊ฐ€์žฅ ์ž˜ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋จผ์ € ์„ค๊ณ„ํ•ด ์ฃผ์„ธ์š”.โ€
    ๋ผ๊ณ  ์š”์ฒญํ•œ ๋’ค, ์„ค๊ณ„๋œ ํ”„๋กฌํ”„ํŠธ๋กœ ๋‹ค์‹œ ์ž‘์—…์„ ์‹คํ–‰ํ•œ๋‹ค.

  4. ๋‘ ๊ฒฐ๊ณผ๋ฅผ ์ •ํ™•๋„ยท๊ตฌ์กฐยท์žฌ์‚ฌ์šฉ์„ฑยท์‹ค๋ฌด ํ™œ์šฉ์„ฑ ๊ธฐ์ค€์œผ๋กœ ๋น„๊ตํ•œ๋‹ค.
    โ†’ ๋ฐ”๊พผ ๊ฒƒ์€ ๋”ฑ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

โ€œ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”๋กœ ๋‹ฌ๋ผโ€์—์„œ
โ€œ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋งŒ๋“œ๋Š” ํ”„๋กฌํ”„ํŠธ๋ถ€ํ„ฐ ์„ค๊ณ„ํ•ด ๋‹ฌ๋ผโ€๋กœ.


🏗️ย 1. RAG ์„ฑ๋Šฅ ํ‰๊ฐ€: ๊ทธ๋ƒฅ ์งˆ๋ฌธ vs ์„ค๊ณ„ ๋งก๊ธฐ๊ธฐ

1-1. Before โ€” ๊ทธ๋ƒฅ ๋ฌผ์—ˆ์„ ๋•Œ

์ œ๊ฐ€ ์ฒ˜์Œ GPT์—๊ฒŒ ๋˜์ง„ ์งˆ๋ฌธ์€ ์•„์ฃผ ๋‹จ์ˆœํ–ˆ์Šต๋‹ˆ๋‹ค.

Q. โ€œRAG ์„ฑ๋Šฅ ํ‰๊ฐ€ ๊ธฐ์ค€ ์•Œ๋ ค์ค˜.โ€

GPT์˜ ๋‹ต์€ ๋Œ€๋žต ์ด๋Ÿฐ ์‹์ด์—ˆ์Šต๋‹ˆ๋‹ค. (์š”์•ฝ)

    • Retrieval: Recall@K, Precision@K, MRR, nDCG ๋“ฑ
    • Generation: ์ •๋‹ต์„ฑ, ๊ทผ๊ฑฐ์ถฉ์‹ค๋„, ์ธ์šฉ ์ •ํ™•๋„, ์™„์ „์„ฑ ๋“ฑ
    • UX/์šด์˜: Latency, Success rate, Deflection, Cost per query ๋“ฑ
    • Safety: PII, ํ”„๋กฌํ”„ํŠธ ์ธ์ ์…˜, ์œ ํ•ด ์ฝ˜ํ…์ธ , ์–ด๋ทฐ์ง• ๋Œ€์‘ ๋“ฑ

๋‚ด์šฉ๋งŒ ๋ณด๋ฉด ํ‹€๋ฆฐ ๋ง์ด ํ•˜๋‚˜๋„ ์—†์Šต๋‹ˆ๋‹ค.
์‹ค์ œ๋กœ๋„ RAG ๋…ผ๋ฌธ/๋ฌธ์„œ์—์„œ ์ž์ฃผ ๋ณผ ์ˆ˜ ์žˆ๋Š” ๊ตฌ์„ฑ์ž…๋‹ˆ๋‹ค.

๋ฌธ์ œ๋Š”,

    • โ€œ์šฐ๋ฆฌ ์„œ๋น„์Šค์— ๋ฐ”๋กœ ๋ถ™์—ฌ ์“ธ ์ˆ˜ ์žˆ๋Š” ํ‰๊ฐ€ํ‘œโ€๋Š” ์•„๋‹ˆ๋ผ๋Š” ์ ์ž…๋‹ˆ๋‹ค.
    • ๊ฒฐ๊ตญ ์ง€ํ‘œ๋ฅผ ๋‹ค์‹œ ๊ณ ๋ฅด๊ณ , ์ •์˜๋ฅผ ๋‹ค์‹œ ์“ฐ๊ณ , ํ•ฉ๊ฒฉ์„ ์„ ๋‹ค์‹œ ์žก๋Š” ์ผ์„ ์ œ๊ฐ€ ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ •๋ฆฌํ•˜๋ฉด,

Before: ๊ต๊ณผ์„œ์‹ ๊ฐœ๋…์€ ์–ป์—ˆ์ง€๋งŒ,
โ€œ์‹ค์ œ ํ”„๋กœ์ ํŠธ์— ๋ถ™์—ฌ ์“ธ ์ˆ˜ ์žˆ๋Š” ํ”„๋ ˆ์ž„์›Œํฌโ€๋Š” ์•„๋‹Œ ์ƒํƒœ.


1-2. After โ€” GPT์—๊ฒŒ โ€˜ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„โ€™๋ฅผ ๋จผ์ € ์‹œํ‚จ ๋ฒ„์ „

์ด๋ฒˆ์—๋Š” ์ ‘๊ทผ์„ ์™„์ „ํžˆ ๋ฐ”๊ฟ”๋ดค์Šต๋‹ˆ๋‹ค.

Q. โ€œRAG ์‹œ์Šคํ…œ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋งŒ๋“ค๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค.
๋จผ์ € ์ด ์ž‘์—…์— ์ตœ์ ํ™”๋œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ•ด ์ฃผ์„ธ์š”.โ€

์ด๋•Œ GPT์—๊ฒŒ ๋งก๊ธด ์—ญํ• ์€
โ€œ์ง€์‹ ์„ค๋ช…์žโ€๊ฐ€ ์•„๋‹ˆ๋ผ โ€œํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ์„ค๊ณ„์žโ€์˜€์Šต๋‹ˆ๋‹ค.

GPT๊ฐ€ ๋จผ์ € ๋งŒ๋“ค์–ด ์ค€ ๊ฒƒ์€ โ€œํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ํ…œํ”Œ๋ฆฟ์„ ๋งŒ๋“œ๋Š” ํ”„๋กฌํ”„ํŠธโ€์˜€์Šต๋‹ˆ๋‹ค.
๊ตฌ์กฐ๋งŒ ์š”์•ฝํ•˜๋ฉด ๋Œ€๋žต ์ด๋Ÿฐ ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค.

    • ์—ญํ• (Role): RAG/ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ฑ—๋ด‡ ํ‰๊ฐ€ ์‹คํ–‰์ž
    • ์ž…๋ ฅ(Input)
      • {TEMPLATE}: ํ•ฉ์˜๋œ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ ํ…œํ”Œ๋ฆฟ
      • {SYSTEM_DESC}: ์‹ค์ œ ํ‰๊ฐ€ ๋Œ€์ƒ ์‹œ์Šคํ…œ ์„ค๋ช…(๋„๋ฉ”์ธ, ์ฑ„๋„, ์ •์ฑ…, ์‹คํ—˜ ์กฐ๊ฑด ๋“ฑ)
    • ์ถœ๋ ฅ(Output)
      1. ํ‰๊ฐ€ ์Šค์ฝ”์–ด์นด๋“œ(ํ‘œ)
      2. ์‹คํŒจ ์œ ํ˜• ๋ถ„๋ฅ˜ํ‘œ
      3. ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„
      4. A/B ์‹คํ—˜ ์„ค๊ณ„ ์š”์•ฝ
      5. ์‹คํ–‰ ์ฒดํฌ๋ฆฌ์ŠคํŠธ
      6. ๋ฆฌ์Šคํฌ Top3 & ์ด๋ฒˆ ์ฃผ ์•ก์…˜ Top3

์ฆ‰, GPT์—๊ฒŒ ์ด๋ ‡๊ฒŒ ๋งํ•œ ์…ˆ์ž…๋‹ˆ๋‹ค.

โ€œRAG๋ฅผ ์ž˜ ํ‰๊ฐ€ํ•˜๋Š” ์‚ฌ๋žŒ์ด ๋œ๋‹ค๋ฉด,
์ด ์ •๋„๋Š” ๊ธฐ๋ณธ์œผ๋กœ ๋งŒ๋“ค์–ด์•ผ ํ•˜์ง€ ์•Š๊ฒ ์Šต๋‹ˆ๊นŒ?โ€

๊ทธ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ,
GPT๊ฐ€ ์„ค๊ณ„ํ•œ ์ด ํ”„๋กฌํ”„ํŠธ๋ฅผ ์‹ค์ œ ํ”„๋กœ์ ํŠธ ๋งฅ๋ฝ(๊ฒŒ์ž„ ๋„๋ฉ”์ธ CSยทAI ์ฑ—๋ด‡)์— ๊ทธ๋Œ€๋กœ ์ ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.
๊ทธ๋Ÿฌ์ž ์ด๋ฒˆ์—๋Š” ์ฒ˜์Œ๋ถ€ํ„ฐ โ€œ๋ฐ”๋กœ ์‹ค์ „์— ์“ธ ์ˆ˜ ์žˆ๋Š” ํ‰๊ฐ€ ์‚ฐ์ถœ๋ฌผโ€์ด ์ถœ๋ ฅ๋์Šต๋‹ˆ๋‹ค.


1-3. After ๊ฒฐ๊ณผ๋ฌผ ์Šค๋ƒ…์ƒท โ€“ โ€œ๋ฐ”๋กœ ์“ฐ๋Š” ์Šค์ฝ”์–ด์นด๋“œโ€

์‹ค์ œ ๊ฒฐ๊ณผ๋ฌผ์€ ๋งค์šฐ ๊ธธ์ง€๋งŒ,
ํ•ต์‹ฌ๋งŒ ๋ณด์—ฌ๋“œ๋ฆฌ๋ฉด ๋Œ€๋žต ์ด๋Ÿฐ ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค.

🔎 ์ถ•๋ณ„ ๋Œ€ํ‘œ ์ง€ํ‘œ ์ผ๋ถ€ ๋ฐœ์ทŒ

์ถ•์ง€ํ‘œ๋ช…์ •์˜ํ•ฉ๊ฒฉ์„  ์˜ˆ์‹œ
RetrievalEvidence Hit@5์ •๋‹ต ๊ทผ๊ฑฐ ๋ฌธ์„œ๊ฐ€ Top-5์— ํฌํ•จ๋œ ๋น„์œจHit@5 โ‰ฅ 0.85
GroundingHallucination Rate๊ทผ๊ฑฐ ์—†์ด ์ •์ฑ…/์ ˆ์ฐจ๋ฅผ ๋‹จ์ •ํ•œ ์‘๋‹ต ๋น„์œจโ‰ค 3%
Answer ํ’ˆ์งˆPolicy Correctnessํ™˜๋ถˆ/์ œ์žฌ ๋“ฑ ์ •์ฑ… ์‘๋‹ต์˜ ์ •ํ•ฉ์„ฑโ‰ฅ 0.98
UXยท์šด์˜Deflection Rateโ€œ์ •๋‹ตโ€ ๊ธฐ์ค€ ํ‹ฐ์ผ“ ์—†์ด ํ•ด๊ฒฐ๋œ ์„ธ์…˜ ๋น„์œจโ‰ฅ 0.35 (์ดˆ๊ธฐ ์šด์˜ ๊ธฐ์ค€)
SafetySecurity Abuse Refusal๋ถ€์ •ํ–‰์œ„/ํ•ดํ‚น ์œ ๋„ ์š”์ฒญ์„ ๊ฑฐ์ ˆํ•œ ์‘๋‹ต ๋น„์œจโ‰ฅ 0.99

์ด ํ…Œ์ด๋ธ”์˜ ์ค‘์š”ํ•œ ์ ์€:

    • ๊ฒŒ์ž„ CS ๋งฅ๋ฝ์— ๋งž๋Š” ์ง€ํ‘œ + ์ •์˜ + ํ•ฉ๊ฒฉ์„ ์ด ํ•œ ๋ฒˆ์— ์žกํ˜€ ์žˆ๊ณ 
    • โ€œ์–ด๋””์„œ ์ž์ฃผ ํ‹€๋ฆฌ๋Š”์ง€โ€, โ€œ๋ฌด์—‡์„ ๋จผ์ € ๋ชจ๋‹ˆํ„ฐ๋งํ•ด์•ผ ํ•˜๋Š”์ง€โ€๊ฐ€
      ์ด๋ฏธ ์„ค๊ณ„๋œ ์ƒํƒœ๋กœ ๋‚˜์˜จ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๊ทธ๋ž˜์„œ ์ด ๊ฒฐ๊ณผ๋Š”

    • ์ œ ๋จธ๋ฆฟ์† ์ •๋ฆฌ โ†’ ๋ฉ”๋ชจ โ†’ ์—‘์…€ โ†’ ๋ฌธ์„œโ€ฆ ๊ณผ์ •์„ ์ƒ๋žตํ•˜๊ณ ,
    • ๊ณง๋ฐ”๋กœ ๋Œ€์‹œ๋ณด๋“œ ๊ธฐํš & ๋ผ๋ฒจ๋ง ์„ค๊ณ„ ๋‹จ๊ณ„๋กœ ๋„˜์–ด๊ฐˆ ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค.

โ€ป ์‹ค์ œ๋กœ๋Š” ์Šค์ฝ”์–ด์นด๋“œ, ์‹คํŒจ ์œ ํ˜• ๋ถ„๋ฅ˜ํ‘œ, ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„, A/B ์„ค๊ณ„ ๋“ฑ
๋ชจ๋“  ์‚ฐ์ถœ๋ฌผ์ด ํ›จ์”ฌ ๊ธธ์Šต๋‹ˆ๋‹ค.
์ „์ฒด ์ „๋ฌธ์€ ๊ธ€ ํ•˜๋‹จ โ€˜๋ถ€๋กโ€™์— ๊ตฌ์กฐ๋งŒ ๋งŒ๋“ค์–ด ๋‘์—ˆ์Šต๋‹ˆ๋‹ค.
(ํ•„์š”ํ•˜์‹  ๋ถ„์€ ๊ทธ๋Œ€๋กœ ๋ณต๋ถ™ํ•ด์„œ ์ฐธ๊ณ ํ•˜์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค.)


1-4. Before/After์—์„œ ๋‹ฌ๋ผ์ง„ ๊ฒƒ๋“ค

ํ•œ ์ค„๋กœ ๋น„๊ตํ•˜๋ฉด ์ด๋ ‡์Šต๋‹ˆ๋‹ค.

    • Before:
      • โ€œRAG ํ‰๊ฐ€ ์ง€ํ‘œ๊ฐ€ ๋ญ๊ฐ€ ์žˆ๋Š”์ง€โ€๋Š” ์•Œ๊ฒŒ ๋˜์ง€๋งŒ,
      • ๊ฒฐ๊ตญ ๋‚ด๊ฐ€ ๋‹ค์‹œ ๊ตฌ์กฐ๋ฅผ ์งœ์•ผ ํ•˜๋Š” ์ƒํƒœ
    • After:
      • โ€œ์šฐ๋ฆฌ ์„œ๋น„์Šค์— ๋งž๋Š” ํ‰๊ฐ€ํ‘œ/์‹คํ—˜ ์„ค๊ณ„/์ฒดํฌ๋ฆฌ์ŠคํŠธ๊นŒ์ง€โ€
      • ํ•œ ๋ฒˆ์— ๋ฝ‘ํ˜€ ๋‚˜์˜ค๋Š” ์ƒํƒœ

๊ทธ๋ฆฌ๊ณ  ์ด ๋ณ€ํ™”๋Š”,
๋ชจ๋ธ์„ ๋ฐ”๊พผ ๊ฒƒ๋„, ์‚ฌ๋žŒ์„ ๋ฐ”๊พผ ๊ฒƒ๋„ ์•„๋‹ˆ๋ผ

โ€œ๊ทธ๋ƒฅ ์งˆ๋ฌธํ–ˆ๋ƒโ€ vs โ€œํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„๋ถ€ํ„ฐ ๋งก๊ฒผ๋ƒโ€
์ด ์ฐจ์ด์—์„œ ๋‚˜์™”์Šต๋‹ˆ๋‹ค.


🎯ย 2. ์–ธ์ œ๋Š” ๊ทธ๋ƒฅ ์งˆ๋ฌธ๋งŒ ํ•ด๋„ ๋˜๋Š”๊ฐ€

์—ฌ๊ธฐ๊นŒ์ง€ ์ฝ์œผ๋ฉด
โ€œ์•ž์œผ๋กœ๋Š” ๋ชจ๋“  ์ž‘์—…์— ๋‹ค ์ด๋ ‡๊ฒŒ ํ•ด์•ผ ํ•˜๋‚˜?โ€
๋ผ๋Š” ์ƒ๊ฐ์ด ๋“œ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ œ ๊ธฐ์ค€์€ ์ด๋ ‡์Šต๋‹ˆ๋‹ค.

❌ ๊ตณ์ด ์—”์ง€๋‹ˆ์–ด๋ง๊นŒ์ง€ ์•ˆ ํ•ด๋„ ๋˜๋Š” ๊ฒฝ์šฐ

    • ๋‹จ๋ฐœ์„ฑ ์ •๋ณด ์กฐํšŒ
    • ์˜ค๋Š˜ ์ ์‹ฌ ๋ฉ”๋‰ด ๊ฐ™์€ ๊ฐ€๋ฒผ์šด ์งˆ๋ฌธ
    • ์งง์€ ๋ฌธ์žฅ ๋‹ค๋“ฌ๊ธฐ, ํ•œ๋‘ ๋ฌธ๋‹จ ์š”์•ฝ

โ†’ ๊ทธ๋ƒฅ ์ž์œ ๋กญ๊ฒŒ ์งˆ๋ฌธํ•ด๋„ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค.

⭕ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์ด ํ™•์‹คํžˆ ๋จนํžˆ๋Š” ๊ฒฝ์šฐ

    • ๋น„์Šทํ•œ ์ž‘์—…์„ ์—ฌ๋Ÿฌ ๋ฒˆ ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒฝ์šฐ
    • ์ •ํ™•๋„ยท์žฌํ˜„์„ฑ์ด ์ค‘์š”ํ•œ ๊ฒฝ์šฐ (์ง€ํ‘œ/์ •์ฑ…/๊ณ„์•ฝ/CS ๋“ฑ)
    • ํŒ€ ์ฐจ์›์—์„œ ํ”„๋กฌํ”„ํŠธ/๊ฒฐ๊ณผ๋ฌผ์„ ๊ณต์œ ํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ

์ด๋•Œ๋Š” ํ•œ ๋ฒˆ๋งŒ ์ œ๋Œ€๋กœ ์„ค๊ณ„ํ•ด๋‘๋ฉด,
๊ทธ ๋’ค๋กœ๋Š” โ€œ๋‚˜ + ํŒ€์˜ ์‹œ๊ฐ„โ€์ด ๊ฐ™์ด ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.


🧭ย 3. ๋งˆ๋ฌด๋ฆฌ โ€” ์„ค๊ณ„๋ฅผ โ€œ๋ˆ„๊ฐ€ ํ•˜๋А๋ƒโ€์˜ ๋ฌธ์ œ

์ •๋ฆฌํ•˜๋ฉด, ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์€

    1. ๋” ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ๋” ์˜ˆ์ธก ๊ฐ€๋Šฅํ•˜๊ฒŒ ์–ป๊ธฐ ์œ„ํ•œ ์„ค๊ณ„์ด๊ณ 
    2. ๋ฐ˜๋“œ์‹œ ์‚ฌ๋žŒ์ด ๋‹ค ํ•  ํ•„์š”๋Š” ์—†๋‹ค๋Š” ์ ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

์š”์ฆ˜ ๋ฐฉ์‹์€ ์ด๋Ÿฐ ๋А๋‚Œ์— ๊ฐ€๊น์Šต๋‹ˆ๋‹ค.

ย  โ€œGPT์•ผ,
ย  ์ด ์ž‘์—…์„ ๊ฐ€์žฅ ์ž˜ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ํ”„๋กฌํ”„ํŠธ๋ฅผ
ย  ๋จผ์ € ์„ค๊ณ„ํ•ด ์ค˜.โ€

์‚ฌ๋žŒ์€ ์š”๊ตฌ์‚ฌํ•ญ๊ณผ ๋งฅ๋ฝ๋งŒ ์ž˜ ์ „๋‹ฌํ•˜๊ณ ,
์‹ค์ œ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐยทํฌ๋งทยท์ƒ˜ํ”Œ ์„ค๊ณ„๋Š” GPT์—๊ฒŒ ๋„˜๊ธฐ๋Š” ์ชฝ์œผ๋กœ ํ๋ฆ„์ด ๋ฐ”๋€Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์€ ์ด์ œ ํŠน์ • ์ง๊ตฐ์˜ ์ „๋ฌธ ๊ธฐ์ˆ ์ด๋ผ๊ธฐ๋ณด๋‹ค, โ€œAI๋ฅผ ๋‚ด ๋„๊ตฌ๋กœ ๋งŒ๋“ค๊ณ  ์‹ถ์€ ์‚ฌ๋žŒ์ด๋ผ๋ฉด ๋ˆ„๊ตฌ๋‚˜ ๊ฐ€์ ธ๊ฐˆ ์ˆ˜ ์žˆ๋Š” ์„ค๊ณ„ ์Šต๊ด€โ€์— ๊ฐ€๊น๋‹ค๋ผ๊ณ  ๋ณด์—ฌ์ง‘๋‹ˆ๋‹ค.

์ด์ œย ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์€ ๊ณ ๋ฏผ๋ง๊ณ  GPT์—๊ฒŒ ๋งก๊ธฐ์„ธ์š”.

 


 

 

📘๋ถ€๋ก: RAG ํ‰๊ฐ€ ์ „์ฒด ์˜ˆ์‹œ


📎 ๋ถ€๋ก A. RAG ํ‰๊ฐ€ โ€” Before Q/A ์ „๋ฌธ

Q:

RAG ์„ฑ๋Šฅ ํ‰๊ฐ€ ๊ธฐ์ค€ ์•Œ๋ ค์ค˜.

A:

RAG ์„ฑ๋Šฅ ํ‰๊ฐ€๋Š” ๋ณดํ†ต (1) ๊ฒ€์ƒ‰์ด ์ž˜ ๋๋Š”์ง€, (2) ๋‹ต๋ณ€์ด ๊ทผ๊ฑฐ์— ๋ถ™์–ด์žˆ๋Š”์ง€, (3) ์šด์˜ ํ’ˆ์งˆ์ด ๊ดœ์ฐฎ์€์ง€ 3์ถ•์œผ๋กœ ๋ด…๋‹ˆ๋‹ค. (์ง€ํ‘œ๋Š” ๋งŽ์€๋ฐ ๋Œ€์‹œ๋ณด๋“œ๋Š” ํ•œ ์žฅ์ด์ฃ โ€ฆ 😅)

1) Retrieval (๊ฒ€์ƒ‰ ํ’ˆ์งˆ)

    • Recall@K / Hit rate@K: ์ •๋‹ต ๊ทผ๊ฑฐ ๋ฌธ์„œ๊ฐ€ Top-K์— ๋“ค์–ด์™”๋Š”์ง€
    • Precision@K: Top-K๊ฐ€ โ€œ์ •๋‹ต์— ๋„์›€ ๋˜๋Š” ๋ฌธ์„œโ€๋กœ ์–ผ๋งˆ๋‚˜ ๊นจ๋—ํ•œ์ง€
    • MRR / nDCG: ์ •๋‹ต ๊ทผ๊ฑฐ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์œ„์— ๋žญํฌ๋˜๋Š”์ง€
    • Chunk ํ’ˆ์งˆ ์ง€ํ‘œ(์ •์„ฑ ํฌํ•จ): chunk ๊ธธ์ด/์ค‘๋ณต/๋…ธ์ด์ฆˆ, ์ฟผ๋ฆฌ-๋ฌธ์„œ ๋งค์นญ ์ ํ•ฉ๋„

2) Grounded Generation (์ƒ์„ฑ ํ’ˆ์งˆ: ๊ทผ๊ฑฐ ๊ธฐ๋ฐ˜)

    • Answer Correctness (์ •๋‹ต์„ฑ): ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ตœ์ข… ๋‹ต์ด ๋งž๋Š”์ง€
    • Faithfulness / Groundedness (๊ทผ๊ฑฐ์ถฉ์‹ค๋„): ์ œ๊ณต๋œ ์ปจํ…์ŠคํŠธ ๋ฐ– โ€œ์ถ”์ธกโ€์ด ์„ž์˜€๋Š”์ง€(=ํ™˜๊ฐ)
    • Citation Accuracy (์ธ์šฉ ์ •ํ™•๋„): ์ธ์šฉ/์ถœ์ฒ˜๊ฐ€ ์‹ค์ œ ์ฃผ์žฅ๊ณผ ์ผ์น˜ํ•˜๋Š”์ง€
    • Completeness (์ถฉ๋ถ„์„ฑ): ํ•„์š”ํ•œ ํ•ญ๋ชฉ์„ ๋น ์ง์—†์ด ๋‹ตํ–ˆ๋Š”์ง€

3) End-to-End UX & Ops (์šด์˜/๊ฒฝํ—˜)

    • Latency (p50/p95): ์‘๋‹ต ์‹œ๊ฐ„(ํ‰๊ท ๋ณด๋‹ค p95๊ฐ€ ์‹ค์ „ ์ฒด๊ฐ)
    • Success rate: ์ •์ƒ ์‘๋‹ต ๋น„์œจ(ํƒ€์ž„์•„์›ƒ/์—๋Ÿฌ/๋นˆ ๋‹ต ์ œ์™ธ)
    • Deflection / Task success: ์‚ฌ์šฉ์ž ๋ฌธ์ œ ํ•ด๊ฒฐ๋กœ ์ด์–ด์กŒ๋Š”์ง€(์ „ํ™˜/์žฌ๋ฌธ์˜์œจ)
    • Cost per query: ์ฟผ๋ฆฌ๋‹น ๋น„์šฉ(ํ† ํฐ+๊ฒ€์ƒ‰ ์ธํ”„๋ผ ํฌํ•จ)
    • Stability: ๋ฐฐํฌ ํ›„ ํ’ˆ์งˆ ๋“œ๋ฆฌํ”„ํŠธ(๋ฐ์ดํ„ฐ ๋ณ€๊ฒฝ/์ƒ‰์ธ ๊ฐฑ์‹ /๋ชจ๋ธ ์—…๋ฐ์ดํŠธ ์˜ํ–ฅ)

4) Safety & Robustness (ํ•„์š” ์‹œ)

    • PII/๋ณด์•ˆ ์œ„๋ฐ˜๋ฅ , ํ”„๋กฌํ”„ํŠธ ์ธ์ ์…˜ ์ทจ์•ฝ์„ฑ, ์œ ํ•ด/๊ธˆ์น™ ์‘๋‹ต๋ฅ 
    • Adversarial ์ฟผ๋ฆฌ ์„ฑ๋Šฅ(์• ๋งคํ•œ ์งˆ๋ฌธ/ํ•จ์ • ์งˆ๋ฌธ/๊ทผ๊ฑฐ ๋ถ€์กฑ ์ƒํ™ฉ)

์‹ค๋ฌด์—์„œ ํ”ํ•œ ๊ฒฐ๋ก (์ข‹์€ ์ /๋‚˜์œ ์ )

    • ์ข‹์€ ์ : โ€œ๊ฒ€์ƒ‰(Recall) + ๊ทผ๊ฑฐ์ถฉ์‹ค๋„(Faithfulness) + ์ง€์—ฐ(p95)โ€๋งŒ ์žก์•„๋„ ๋Œ€๋‹ค์ˆ˜ ๋ฌธ์ œ๊ฐ€ ์–ด๋””์„œ ์ƒ๊ธฐ๋Š”์ง€ ๋ณด์ž…๋‹ˆ๋‹ค.
    • ๋‚˜์œ ์ : ์ง€ํ‘œ๋ฅผ ๋Š˜๋ฆฌ๋ฉด ๋ณด๊ณ ์„œ๋Š” ํ’์„ฑํ•ด์ง€์ง€๋งŒ, ์šฐ์„ ์ˆœ์œ„๋Š” ๋” ํ—ท๊ฐˆ๋ฆฝ๋‹ˆ๋‹ค(โ€œ์ธก์ •์€ ํ–ˆ๋Š”๋ฐ ๊ฐœ์„ ์ด ์•ˆ ๋จโ€ ํ•จ์ •).

📎 ๋ถ€๋ก B. RAG ํ‰๊ฐ€ โ€” โ€œํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„โ€ ์š”์ฒญ ์ „๋ฌธ

RAG ์‹œ์Šคํ…œ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋งŒ๋“ค๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค. ๋จผ์ € ์ด ์ž‘์—…์— ์ตœ์ ํ™”๋œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ•ด ์ฃผ์„ธ์š”.

📎 ๋ถ€๋ก C. RAG ํ‰๊ฐ€ โ€” ์„ค๊ณ„๋œ ํ”„๋กฌํ”„ํŠธ ์ „๋ฌธ

๋‹น์‹ ์€ โ€œ๊ฒŒ์ž„ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ(CSยทAI) ์ฑ—๋ด‡โ€์˜ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋งŒ๋“œ๋Š” ํ‰๊ฐ€ ๋ฆฌ๋“œ์ž…๋‹ˆ๋‹ค.
๋ชฉํ‘œ๋Š” โ€˜RAG+LLM ๋‹ต๋ณ€โ€™๊ณผ โ€˜Rule/FAQ/ํ‹ฐ์ผ“ ํ”Œ๋กœ์šฐโ€™๊ฐ€ ์„ž์ธ ์ฑ—๋ด‡์„ ์‹ค๋ฌด์—์„œ ์šด์˜ยท๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๋„๋ก,
๋ฐ”๋กœ ๋ณต๋ถ™ ๊ฐ€๋Šฅํ•œ โ€œํ‰๊ฐ€ ํ…œํ”Œ๋ฆฟ(ํ‘œ+๊ธฐ์ค€+์ฒดํฌ๋ฆฌ์ŠคํŠธ)โ€์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

### [๊ธฐ๋ณธ ์ปจํ…์ŠคํŠธ(๊ฐ€์ •)]
- ๋„๋ฉ”์ธ/์„œ๋น„์Šค: ๊ฒŒ์ž„ ๊ณ ๊ฐ์„ผํ„ฐ์šฉ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ฑ—๋ด‡(CS+AI)
- ์‚ฌ์šฉ์ž Top Tasks:
1) ๊ฒฐ์ œ/ํ™˜๋ถˆ/๊ตฌ๋…(์ฒญ์•ฝ์ฒ ํšŒ, ๊ฒฐ์ œ ์˜ค๋ฅ˜)
2) ๊ณ„์ •/๋ณด์•ˆ(๋กœ๊ทธ์ธ, OTP, ํ•ดํ‚น ์˜์‹ฌ)
3) ์ด์šฉ์ œํ•œ/์ œ์žฌ(์‚ฌ์œ /์ด์˜์ œ๊ธฐ)
4) ์•„์ดํ…œ/์žฌํ™”(๋ฏธ์ง€๊ธ‰, ์†Œ๋ฉธ, ์šฐํŽธ)
5) ๋ฒ„๊ทธ/์ ‘์†์žฅ์• (๊ณต์ง€/ํ•ด๊ฒฐ๊ฐ€์ด๋“œ/ํ‹ฐ์ผ“)
6) ์ด๋ฒคํŠธ/์ฟ ํฐ(์กฐ๊ฑด, ์ง€๊ธ‰, ๊ธฐ๊ฐ„)
- ์ž…๋ ฅ/์ถœ๋ ฅ ์–ธ์–ด: ํ•œ๊ตญ์–ด(KOโ†’KO), ๊ฒŒ์ž„ ์šฉ์–ด/์•ฝ์–ด/์˜คํƒ€ ๋งŽ์Œ
- ์ง€์‹์›์ฒœ: ๊ณต์ง€/ํŒจ์น˜๋…ธํŠธ, ์šด์˜์ •์ฑ…, ๊ฒฐ์ œ/ํ™˜๋ถˆ ์ •์ฑ…, ๊ณ„์ •/๋ณด์•ˆ ๊ฐ€์ด๋“œ, FAQ, GM ๋งค๋‰ด์–ผ, CS ํ‹ฐ์ผ“ ๋‹ต๋ณ€ ํ…œํ”Œ๋ฆฟ(์ตœ์‹  ์šฐ์„ )
- ์•„ํ‚คํ…์ฒ˜(์ผ๋ฐ˜์  ๊ฐ€์ •):
- Hybrid retrieval: BM25 + Vector + reranker, Top-k 5~10
- Chunking: 300~600 tokens, overlap 50~100, ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ(๋ฌธ์„œ์ข…๋ฅ˜/๊ฒŒ์ž„/์ง€์—ญ/๋ฒ„์ „/๊ฐœ์ •์ผ)
- Generator: LLM์ด ์ตœ์ข… ๋‹ต๋ณ€ + โ€œ๊ทผ๊ฑฐ ์ธ์šฉโ€ + ํ•„์š” ์‹œ ํ‹ฐ์ผ“ ์ „ํ™˜(๋งํฌ/ํผ)
- ์šด์˜ ์ œ์•ฝ(๊ฐ€์ค‘์น˜):
- ์ •ํ™•๋„/์ •์ฑ… ์ค€์ˆ˜ 60% + ์ง€์—ฐ 25% + ๋น„์šฉ 15%
- ๋ชฉํ‘œ ์‘๋‹ต์‹œ๊ฐ„: p50 2์ดˆ / p95 6์ดˆ
- ์•ˆ์ „/์ •์ฑ… ์š”๊ตฌ:
- PII/๊ณ„์ •์ •๋ณด ์š”์ฒญ ์ตœ์†Œํ™”(โ€œ์Šคํฌ๋ฆฐ์ƒท/์ฃผ๋ฌธ๋ฒˆํ˜ธ/UIDโ€ ์ˆ˜์ง‘์€ ๋‹จ๊ณ„ยท๋ชฉ์  ๋ช…์‹œ)
- ๋ถ€์ •ํ–‰์œ„/์ทจ์•ฝ์  ์•…์šฉ/ํ™˜๋ถˆ ๊ผผ์ˆ˜ ์œ ๋„ ๋“ฑ ๊ธˆ์ง€
- ๋ฒ•/๊ฒฐ์ œ ๊ด€๋ จ ๋ฌธ๊ตฌ๋Š” ๊ทผ๊ฑฐ ๋ฌธ์„œ ๊ธฐ๋ฐ˜, ๋ถˆํ™•์‹ค ์‹œ ์ƒ๋‹ด/ํ‹ฐ์ผ“ ์œ ๋„
- ๋น„๊ต ์‹คํ—˜ ์ถ•(๊ธฐ๋ณธ): ์ œ๋กœ์ƒท vs ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„(๊ฐ€๋“œ๋ ˆ์ผ/์ถœ๋ ฅํฌ๋งท/์ธ์šฉ ๊ฐ•ํ™”)

### [์‚ฐ์ถœ๋ฌผ ์š”๊ตฌ: ์งง๊ฒŒ, ํ•˜์ง€๋งŒ โ€˜์‹ค๋ฌด์šฉโ€™์œผ๋กœ]
์•„๋ž˜ 5๊ฐœ๋ฅผ ๋ฐ˜๋“œ์‹œ ์ถœ๋ ฅํ•˜์„ธ์š”(๋ถˆํ•„์š”ํ•œ ๊ฐœ๋… ์„ค๋ช… ๊ธˆ์ง€).

1) โ€œํ‰๊ฐ€ ์Šค์ฝ”์–ด์นด๋“œ(ํ‘œ)โ€ 1๊ฐœ
- ์ถ•: Retrieval / Grounding / Answer ํ’ˆ์งˆ / UXยท์šด์˜ / Safety
- ๊ฐ ํ•ญ๋ชฉ๋ณ„: ์ง€ํ‘œ๋ช…, ์ •์˜, ๋‹จ์œ„, ์ธก์ •๋ฒ•(๋กœ๊ทธ ๊ธฐ๋ฐ˜/๋ผ๋ฒจ๋ง), ํ•ฉ๊ฒฉ์„ (๊ธฐ๋ณธ Threshold), ์น˜ํŒ… ๊ฐ€๋Šฅ์„ฑ(๋‚ฎ/์ค‘/๋†’)
2) โ€œ์‹คํŒจ ์œ ํ˜• ๋ถ„๋ฅ˜ํ‘œโ€ 1๊ฐœ
- ๊ฒŒ์ž„ CS์— ํŠนํ™”๋œ ์‹คํŒจ ์˜ˆ์‹œ ํฌํ•จ(ํ™˜๋ถˆ ์ •์ฑ…, ์ œ์žฌ ์‚ฌ์œ , ์ด๋ฒคํŠธ ์กฐ๊ฑด ๋“ฑ)
3) โ€œํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„โ€ ์š”์•ฝ
- Head/Torso/Longtail ๋น„์œจ ์ œ์•ˆ
- ์ตœ์‹  ๋ฌธ์„œ/์ถฉ๋Œ ๋ฌธ์„œ/์œ ์‚ฌ ๋ฌธ์„œ/๋นˆ ๊ทผ๊ฑฐ(knowledge gap) ์ผ€์ด์Šค ํฌํ•จ
4) โ€œ์‹คํ—˜ ์„ค๊ณ„โ€ ์š”์•ฝ(A/B)
- ์ œ๋กœ์ƒท vs ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„ ๋น„๊ต ์‹œ ํ†ต์ œ๋ณ€์ˆ˜/๋…๋ฆฝ๋ณ€์ˆ˜/ํ•ต์‹ฌ KPI ์ œ์‹œ
- ํšŒ๊ท€(์ ˆ๋Œ€ ๊นจ์ง€๋ฉด ์•ˆ ๋˜๋Š” 30๊ฐœ ํ•ต์‹ฌ ์ผ€์ด์Šค) ์ •์˜ ๋ฐฉ์‹ ํฌํ•จ
5) ๋งˆ์ง€๋ง‰์— ๋”ฑ 8์ค„:
- ์ด๋ฒˆ ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ โ€˜๊ฐ€์žฅ ์œ„ํ—˜ํ•œ ํ•จ์ • 5๊ฐœโ€™
- โ€˜์šฐ์„ ์ˆœ์œ„ Top 3 ๊ฐœ์„  ์•ก์…˜โ€™

์ถ”์ธก์ด ํ•„์š”ํ•œ ๋ถ€๋ถ„์€ ์ง„ํ–‰ํ•˜๋˜, ๊ฒฐ๊ณผ์— ์˜ํ–ฅ ํฐ ๋ถˆํ™•์‹ค์„ฑ 3๊ฐœ๋งŒ โ€œํ™•์ธ ํ•„์š”โ€๋กœ ๋์— ์ ์œผ์„ธ์š”.

📎 ๋ถ€๋ก D. ํ‰๊ฐ€ ์Šค์ฝ”์–ด์นด๋“œ ์ „์ฒด ํ‘œ

โ€ป ๋ˆ„๋ฅด๋ฉด ํฌ๊ฒŒ ๋ณด์ž…๋‹ˆ๋‹ค. ํ…์ŠคํŠธ ํ‘œ๊ฐ€ ๊นจ์ ธ์„œ ์ด๋ฏธ์ง€๋กœ ์ฒจ๋ถ€ํ•˜๋‹ˆ ์–‘ํ•ด ๋ฐ”๋ž๋‹ˆ๋‹ค.


📎 ๋ถ€๋ก E. ์‹คํŒจ ์œ ํ˜• ๋ถ„๋ฅ˜ํ‘œ ์ „์ฒด

โ€ป ๋ˆ„๋ฅด๋ฉด ํฌ๊ฒŒ ๋ณด์ž…๋‹ˆ๋‹ค. ํ…์ŠคํŠธ ํ‘œ๊ฐ€ ๊นจ์ ธ์„œ ์ด๋ฏธ์ง€๋กœ ์ฒจ๋ถ€ํ•˜๋‹ˆ ์–‘ํ•ด ๋ฐ”๋ž๋‹ˆ๋‹ค.


📎 ๋ถ€๋ก F. ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ / ์‹คํ—˜ ์„ค๊ณ„ ์š”์•ฝ ์ „๋ฌธ

ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ์„ค๊ณ„ ์š”์•ฝ

    • ๋ถ„ํฌ(๊ถŒ์žฅ): Head 35% / Torso 45% / Longtail 20%
    • ์ผ€์ด์Šค ๊ตฌ์„ฑ(ํ•„์ˆ˜ ํฌํ•จ)
      • ์ตœ์‹  ๋ฌธ์„œ ์šฐ์„ : ์ตœ๊ทผ 30์ผ ๋‚ด ๊ณต์ง€/์ •์ฑ… ๊ฐœ์ • ๊ธฐ๋ฐ˜ 20% ์ด์ƒ
      • ์ถฉ๋Œ ๋ฌธ์„œ ์„ธํŠธ: โ€œ๊ตฌ์ •์ฑ… vs ์‹ ์ •์ฑ…โ€, โ€œ์„œ๋ฒ„/์ง€์—ญ๋ณ„ ์ƒ์ด ์ •์ฑ…โ€ 10%
      • ์œ ์‚ฌ ๋ฌธ์„œ ํ˜ผ๋™ ์„ธํŠธ: ์ œ๋ชฉ/ํ‚ค์›Œ๋“œ ์œ ์‚ฌ(ํ™˜๋ถˆ vs ๊ฒฐ์ œ์˜ค๋ฅ˜, ์ œ์žฌ vs ๋ณดํ˜ธ์กฐ์น˜) 10%
      • Knowledge Gap(๋นˆ ๊ทผ๊ฑฐ): ๋ฌธ์„œ์— ์—†๋Š” ๋ฌธ์˜(๋ฏธ๊ณต๊ฐœ ์ด๋ฒคํŠธ/๊ฐœ๋ณ„ ๊ณ„์ • ์ƒํƒœ) 10%
      • ์˜คํƒ€/์•ฝ์–ด/์€์–ด: โ€œใ…ˆใ…ˆโ€, โ€œํ™˜๋ถˆใ„ฑ?โ€, โ€œํ•ต์˜์‹ฌโ€, โ€œOTPํŠ•๊น€โ€ ๋“ฑ ๋ณ€ํ˜• 15%
      • ๊ณ ์œ„ํ—˜ ๋„๋ฉ”์ธ ๊ณผ๋Œ€ํ‘œ์ง‘: ๊ฒฐ์ œ/ํ™˜๋ถˆยท๊ณ„์ •/๋ณด์•ˆยท์ œ์žฌ ํ•ฉ์‚ฐ 50% ์ด์ƒ(์ •์ฑ…/๋ฒ• ๋ฆฌ์Šคํฌ ๋•Œ๋ฌธ)
    • ๋ผ๋ฒจ ์Šคํ‚ค๋งˆ(์ตœ์†Œ): ์ •๋‹ต์œ ํ˜•(FAQ/์ •์ฑ…/RAG/ํ‹ฐ์ผ“์ „ํ™˜), ์ •๋‹ต๊ทผ๊ฑฐ(๋ฌธ์„œID+์ŠคํŒฌ), ํ•ต์‹ฌ ์ฃผ์žฅ ์ฒดํฌ๋ฆฌ์ŠคํŠธ(๊ธฐ๊ฐ„/์กฐ๊ฑด/์˜ˆ์™ธ/ํ•„์š”์ •๋ณด), ์•ˆ์ „(PII/์•…์šฉ/๋ฒ•)
    • ์ƒ˜ํ”Œ ์ˆ˜ ๊ฐ€์ด๋“œ(์ดˆ๊ธฐ): ์˜คํ”„๋ผ์ธ 400~800 / ํšŒ๊ท€ 30 / ์•…์„ฑ(์•ˆ์ „) 80~150

์‹คํ—˜ ์„ค๊ณ„ ์š”์•ฝ(A/B: ์ œ๋กœ์ƒท vs ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„)

    • ๋…๋ฆฝ๋ณ€์ˆ˜(A/B)
      • A(์ œ๋กœ์ƒท): ์ตœ์†Œ ์‹œ์Šคํ…œ ์ง€์‹œ + ๊ธฐ๋ณธ ์ธ์šฉ๋งŒ ํ—ˆ์šฉ
      • B(ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„): (1) ์ถœ๋ ฅ ํฌ๋งท ๊ณ ์ •(์š”์•ฝโ†’๋‹จ๊ณ„โ†’ํ•„์š”์ •๋ณดโ†’์ „ํ™˜) (2) ์ธ์šฉ ๊ฐ•์ œ(ํ•ต์‹ฌ ์ฃผ์žฅ๋งˆ๋‹ค) (3) ์ •์ฑ…/๋ฒ•/๋ณด์•ˆ ๊ฐ€๋“œ๋ ˆ์ผ (4) Knowledge gap ์ฒ˜๋ฆฌ (5) ํ‹ฐ์ผ“ ์ „ํ™˜ ํŠธ๋ฆฌ
    • ํ†ต์ œ๋ณ€์ˆ˜(๊ณ ์ •)
      • ๋™์ผ ๋ชจ๋ธ/์˜จ๋„/ํ† ํฐ ์ œํ•œ, ๋™์ผ ๋ฆฌํŠธ๋ฆฌ๋ฒŒ(BM25+Vec+rerank, k=5~10), ๋™์ผ ์ฒญํ‚น/๋ฉ”ํƒ€ํ•„ํ„ฐ, ๋™์ผ ์ง€์‹๋ฒ ์ด์Šค ์Šค๋ƒ…์ƒท, ๋™์ผ ์บ์‹œ ์ •์ฑ…
    • ํ•ต์‹ฌ KPI(์šฐ์„ ์ˆœ์œ„)
      1. Policy Correctness, Hallucination Rate, PII Minimization (์ •ํ™•ยท์ •์ฑ…)
      2. p50/p95 Latency (์ง€์—ฐ)
      3. Cost/Session (๋น„์šฉ)
      4. ๋ณด์กฐ: Task Success, Citation Precision/Coverage, Escalation Accuracy
    • ํŒ์ • ๋ฐฉ์‹(์ถ”์ฒœ)
      • ์˜คํ”„๋ผ์ธ: ๋™์ผ ํ‰๊ฐ€์…‹์—์„œ ์Šค์ฝ”์–ด์นด๋“œ ๋น„๊ต(์‹ ๋ขฐ๊ตฌ๊ฐ„/์œ ์˜์„ฑ)
      • ์˜จ๋ผ์ธ(๊ฐ€๋Šฅ ์‹œ): 10~20% ํŠธ๋ž˜ํ”ฝ A/B, โ€œ์ •๋‹ต ๋ผ๋ฒจ ํ‘œ๋ณธโ€์œผ๋กœ Deflection์„ ์ •๋‹ต์ผ ๋•Œ๋งŒ ๊ณ„์‚ฐ
    • ํšŒ๊ท€(์ ˆ๋Œ€ ๊นจ์ง€๋ฉด ์•ˆ ๋˜๋Š” 30๊ฐœ) ์ •์˜ ๋ฐฉ์‹
      • Top Task๋ณ„ 5~6๊ฐœ์”ฉ(๊ฒฐ์ œ/๋ณด์•ˆ/์ œ์žฌ ์šฐ์„ ), ์ตœ์‹  ์ •์ฑ… 1๊ฐœ + ์ถฉ๋Œ 1๊ฐœ + ๋นˆ๊ทผ๊ฑฐ 1๊ฐœ ํฌํ•จ
      • โ€œ๋ฒ•/๊ฒฐ์ œ ๋ฌธ๊ตฌ ๋‹จ์ • ๊ธˆ์ง€โ€, โ€œ์ œ์žฌ ์‚ฌ์œ  ์ถ”์ • ๊ธˆ์ง€โ€, โ€œPII ์ตœ์†Œ์ˆ˜์ง‘โ€ ๊ฐ™์€ ๊ฐ€๋“œ๋ ˆ์ผ ํšŒ๊ท€ 10๊ฐœ๋ฅผ ๋ณ„๋„ ํŠธ๋ž™์œผ๋กœ ๊ณ ์ •
      • ๋ฆด๋ฆฌ์ฆˆ๋งˆ๋‹ค 30๊ฐœ ์ „์ˆ˜, ์ž„๊ณ„์น˜ ๋ฏธ๋‹ฌ ์‹œ ๋กค๋ฐฑ(๊ฒŒ์ž„ ๋ฐธ๋Ÿฐ์Šค ํŒจ์น˜์ฒ˜๋Ÿผ์š”)

ํ•จ์ •1: โ€œDeflection ์ƒ์Šนโ€๋งŒ ๋ณด๊ณ  ์ข‹์•„ํ–ˆ๋‹ค๊ฐ€, ์ •๋‹ต ๊ฒ€์ฆ ์—†์ด CS ํญํƒ„(๊ฐ€์งœ ํ•ด๊ฒฐ) ํ„ฐ์ง‘๋‹ˆ๋‹ค.
ํ•จ์ •2: ์ตœ์‹ /์ถฉ๋Œ ๋ฌธ์„œ ์ฒ˜๋ฆฌ๋ฅผ ์•ˆ ํ•˜๋ฉด, ํ™˜๋ถˆยท์ œ์žฌ์—์„œ ํ•œ ๋ฒˆ์— ์‹ ๋ขฐ๊ฐ€ ์ฆ๋ฐœํ•ฉ๋‹ˆ๋‹ค.
ํ•จ์ •3: ์ธ์šฉ์ด โ€˜์žˆ๊ธฐ๋งŒโ€™ ํ•˜๋ฉด ๋œ๋‹ค๊ณ  ์ฐฉ๊ฐํ•˜๋ฉด, Citation Precision์—์„œ ๋ฐ”๋กœ ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค.
ํ•จ์ •4: Knowledge gap์—์„œ ๋‹จ์ • ํ•œ ์ค„์ด๋ฉด, ๋ฒ•/๋ณด์•ˆ/๊ฒฐ์ œ ๋ฆฌ์Šคํฌ๊ฐ€ ์ฆ‰์‹œ ํ˜„์‹คํ™”๋ฉ๋‹ˆ๋‹ค.
ํ•จ์ •5: p95 ์ตœ์ ํ™” ์—†์ด p50๋งŒ ๋งž์ถ”๋ฉด, ํ”ผํฌ ํƒ€์ž„์— ์ฑ—๋ด‡์ด โ€œ๋กœ๋”ฉ์ฐฝ NPCโ€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
์•ก์…˜1: ๊ณ ์œ„ํ—˜(๊ฒฐ์ œ/๋ณด์•ˆ/์ œ์žฌ) 150์ผ€์ด์Šค ๊ณผ๋Œ€ํ‘œ์ง‘ + ํšŒ๊ท€30 ๊ณ ์ •๋ถ€ํ„ฐ ๋งŒ๋“œ์„ธ์š”.
์•ก์…˜2: โ€œ์ตœ์‹  ์šฐ์„ +์ถฉ๋Œ ์ธ์ง€+๋‹จ์ • ๊ธˆ์ง€+ํ‹ฐ์ผ“ ํŠธ๋ฆฌโ€๋ฅผ ํ”„๋กฌํ”„ํŠธ/๋ฃฐ๋กœ ํ•˜๋“œ์ฝ”๋”ฉํ•˜์„ธ์š”.
์•ก์…˜3: Citation Precision/Coverage ๋ผ๋ฒจ๋ง์„ ๋จผ์ € ๋ถ™์—ฌ์„œ, ๊ฐœ์„  ๋ฐฉํ–ฅ์„ ๋ฐ์ดํ„ฐ๋กœ ๊ณ ์ •ํ•˜์„ธ์š”.

ํ™•์ธ ํ•„์š”(์˜ํ–ฅ ํฐ ๋ถˆํ™•์‹ค์„ฑ 3๊ฐœ)

    1. ํ‹ฐ์ผ“ ์ „ํ™˜ ์ฑ„๋„(์›นํผ/์ธ๊ฒŒ์ž„/CSํˆด)์—์„œ ํ•„์ˆ˜ ์ˆ˜์ง‘ ํ•„๋“œ(UID/์ฃผ๋ฌธ๋ฒˆํ˜ธ/์Šคํฌ๋ฆฐ์ƒท)์™€ ์ˆ˜์ง‘ ํ—ˆ์šฉ ๋ฒ”์œ„(์ •์ฑ…/๋ฒ•๋ฌด).
    2. โ€œ์ •๋‹ต Deflectionโ€์˜ ์šด์˜ ๋ชฉํ‘œ์น˜(์˜ˆ: 35% vs 50%)์™€, ์‹คํŒจ ์‹œ ํ—ˆ์šฉ ๊ฐ€๋Šฅํ•œ CS ๋ฆฌ์Šคํฌ ํ•œ๋„.
    3. ์ง€์‹๋ฒ ์ด์Šค์˜ ๊ฐฑ์‹  ์ฃผ๊ธฐ/๋ฒ„์ „ ๊ด€๋ฆฌ ์ฒด๊ณ„(๊ณต์ง€ยท์ •์ฑ… ๊ฐœ์ •์ด ์‹ค์‹œ๊ฐ„์ธ์ง€, ๋ฐฐ์น˜์ธ์ง€) ๋ฐ โ€œ์ตœ์‹  ํŒ์ •โ€์˜ ๋‹จ์ผ ์ง„์‹ค์›์ฒœ(SSOT).

๊ธ€์“ด์ด

๋‹ต๊ธ€ ๋‚จ๊ธฐ๊ธฐ

์ด๋ฉ”์ผ ์ฃผ์†Œ๋Š” ๊ณต๊ฐœ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ํ•„์ˆ˜ ํ•„๋“œ๋Š” *๋กœ ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค