CannotBeHidden

비개발자를 위한 AI 개발 구조: IDE, MCP, Agent가 왜 중요한가

IDE, MCP, Agent를 어떻게 이해하고 설계할까

최근 AI 코딩 도구와 모델이 빠르게 좋아지면서 개발 방식도 크게 바뀌고 있습니다.
하지만 여기서 단순히 “모델이 얼마나 똑똑한가”만 보면 핵심을 놓치기 쉽습니다.

실제로 서비스를 만들 때 더 중요한 건, 이 강력한 AI를 어떤 구조로 연결하고 굴릴 것인가입니다.
즉, 이제 AI 개발은 점점 지능의 싸움이 아니라 구조의 싸움에 가까워지고 있습니다.

오늘은 AI 서비스를 이해할 때 꼭 알아두면 좋은 4가지 개념과, 어떤 구조로 시작하는 것이 현실적인지 간단히 정리해보겠습니다.

1. 헷갈리는 AI 용어, ‘주방’ 비유로 이해하기

AI 개발 환경은 하나의 주방으로 생각하면 이해가 쉽습니다.

IDE(통합개발환경): 요리가 이뤄지는 주방 그 자체입니다.
칼, 도마, 가스레인지가 갖춰진 작업 공간이라고 보시면 됩니다.
Cursor처럼 IDE 안에서 쓰는 방식도 있고, Claude Code나 Codex처럼 터미널(CLI) 기반으로 많이 활용되는 에이전트형 코딩 도구도 있습니다.
Agent(에이전트): 무엇을 만들지 판단하고 실제로 움직이는 셰프입니다.
질문을 이해하고, 필요한 도구를 고르고, 결과를 정리하는 역할을 맡습니다.
MCP (Model Context Protocol): 주방 밖에서 재료를 가져오는 표준 연결 통로입니다.
날씨, 항공권, DB, 파일 등 외부 데이터와 도구를 AI에 연결해주는 방식입니다.
Data / Tools(데이터 / 도구): 실제 요리에 쓰이는 식재료입니다.
예를 들어 실시간 날씨 정보, 사용자 예약 기록, 사내 문서 등이 여기에 해당합니다.

이렇게 나눠보면 조금 명확해집니다.
IDE는 작업 공간, Agent는 실행 주체, MCP는 연결 방식, Data/Tools는 실제 재료입니다.

2. MCP가 중요한 이유: ‘매번 새로 붙이지 않기’ 위해서

예전에는 AI가 외부 정보를 쓰게 하려면, 서비스마다 연결 코드를 제각각 붙여야 하는 경우가 많았습니다.
처음에는 빨라 보여도, 도구가 늘어나면 관리가 금방 복잡해집니다.

MCP의 핵심은 이 지점을 정리해준다는 데 있습니다.
한마디로 말하면, AI와 외부 데이터/도구를 연결하는 방식을 표준화하는 것입니다.

쉽게 말해, 매번 전용 어댑터를 새로 만드는 대신 공용 규격을 만드는 느낌에 가깝습니다.
이렇게 해두면 프로젝트가 바뀌어도 연결 구조를 재사용하기 쉬워지고, Agent를 바꾸더라도 전체 구조가 덜 흔들립니다.

결국 MCP의 장점은 기술 이름 자체보다도 재사용성과 유지보수성에 있습니다.
한 번 잘 분리해두면, 다음 프로젝트에서 그대로 자산이 됩니다.

3. 한 명의 에이전트로 갈까, 여러 명의 에이전트로 갈까

AI 서비스를 설계할 때 자주 나오는 고민이 있습니다.

“에이전트를 한 명만 둘까, 여러 명으로 나눌까?”

예를 들어 여행 가이드 서비스를 만든다고 가정해보겠습니다.

A. Single Agent + 필요한 도구 연결

한 명의 유능한 에이전트가 항공권 조회, 맛집 검색, 날씨 확인 같은 도구를 필요할 때 직접 호출하는 방식입니다.

특징: 한 에이전트가 전체 맥락을 쥐고 있어 답변이 일관적입니다.
장점: 구조가 단순하고, 비용과 속도 면에서 유리합니다.
추천 대상: 대부분의 MVP, 개인 프로젝트, 초기 서비스

B. Multi-Agent

항공 전문가, 호텔 전문가, 일정 조정 전문가처럼 여러 에이전트가 역할을 나눠 협업하는 방식입니다.

특징: 역할 분리가 명확할수록 강력합니다.
장점: 복잡한 다단계 업무나 검토/검증이 중요한 구조에 적합합니다.
단점: 구조가 복잡해지고, 비용과 응답 시간이 늘어날 수 있습니다.

겉으로는 Multi-Agent가 더 고급스러워 보일 수 있습니다.
하지만 실제로는 작은 문제에 너무 큰 구조를 올리는 경우도 많습니다.
사람 조직도 회의 참석자가 많아질수록 느려지듯, 에이전트도 비슷합니다.

4. 그래서 어떤 구조로 시작하는 게 좋을까

제 기준에서는, 처음부터 복잡하게 가기보다 아래 순서가 가장 현실적입니다.

먼저 한 명의 에이전트로 시작합니다.
전체 흐름이 실제로 어떻게 돌아가는지 먼저 보는 편이 빠릅니다.
재사용할 도구와 데이터는 분리합니다.
날씨, DB, 문서 조회처럼 반복 활용할 요소는 처음부터 연결 구조를 나눠두는 게 좋습니다.
정말 필요할 때만 Multi-Agent로 확장합니다.
검증 단계가 따로 필요하거나, 역할 분리가 분명할 때만 늘려도 늦지 않습니다.

즉, 처음부터 “멋진 구조”를 만드는 것보다
작게 시작해서, 필요한 만큼만 구조를 키우는 것이 더 실용적입니다.

마치며

AI 기술은 계속 바뀌겠지만, 그 안에서도 비교적 오래 남는 역량이 하나 있습니다.
바로 복잡한 문제를 단순한 구조로 바꾸는 능력입니다.

좋은 AI 서비스는 단순히 똑똑한 모델 하나로 완성되지 않습니다.
어떤 Agent가 어떤 Tools를 어떻게 쓰고, 그 연결을 얼마나 재사용 가능하게 설계했는지가 결과를 많이 좌우합니다.

결국 중요한 건 “최신 기술을 많이 붙이는 것”이 아니라,
내 문제에 맞는 구조를 설계하는 것입니다.

기술에 끌려가기보다, 기술을 구조적으로 다루는 쪽이 오래 갑니다.

Next…
다음 글에서는 이번 글과 이어서 “나에게 맞는 AI 바이브 코딩 하기”라는 주제로,
툴보다 더 중요한 것은 무엇인지 정리해보겠습니다.

사진 한 장으로 퍼스널 컬러와 날씨를 읽다: LangGraph 코디 에이전트 StyleSense

서비스 링크: https://stylesense-khaki.vercel.app/
(※ 첫 접속 시 서버 기동으로 잠시 지연될 수 있습니다.)

📌 세 줄 요약

사진 한 장을 업로드하면 퍼스널 컬러를 진단하고, 실시간 날씨 맥락까지 결합해 오늘 입기 좋은 2가지 룩(Daily/Special)을 룩북 이미지로 추천해주는 서비스 “StyleSense”를 만들었습니다. 목표는 ‘그럴듯한 데모’가 아니라, 배포 링크로 실제 동작하는 제품까지 완성하는 것이었습니다.

그리고 이 프로젝트의 핵심은, 프롬프트를 길게 쓰는 것보다 확률적으로 흔들리는 AI 결과를 ‘아키텍처와 시스템’으로 통제하는 방법을 실제로 구현하고 검증하는 것이었습니다.

1) 배경: “오늘 뭐 입지?”를 AI로 풀어보고 싶었습니다

아이디어는 일상에서 출발했습니다. 옷을 좋아하든 싫어하든, 출근 전에는 늘 비슷한 고민을 합니다.

오늘 날씨가 애매한데… 뭘 입지?
톤에 맞게 입고 싶은데… 막상 고르기 어렵네?
코디 추천은 많은데… 내 사진/내 톤까지 반영되면 좋겠다.

그래서 생각했습니다.

“사진 한 장만 올리면, 퍼스널 컬러와 날씨를 같이 반영해서 코디를 추천해주면 꽤 쓸모 있지 않을까?”

2) 시작은 빠르게: Gems → AI Studio → Cursor로 넘어간 이유

처음에는 속도가 중요하다고 생각해서, 가볍게 프로토타이핑부터 했습니다.

Gems: 30분 안에 결과는 나왔지만, 제가 원하는 방향으로 세부 튜닝하기가 어려웠습니다.
AI Studio: 빠르게 만들 수 있었지만, 제품 수준으로 “통제 가능한 형태”를 만들기에는 제한이 있었습니다.

결국 결론은 하나였습니다.

“내가 원하는 방향으로 ‘요리’하려면 자유도가 필요하다. 그럼 Cursor로 가자.”

다만 이 선택은 장점만 있진 않았습니다.
AI Studio는 플랫폼이 깔아둔 인프라/가드레일 위에서 달리지만, Cursor는 제가 하나씩 설계하고 통제해야 했습니다.
(덕분에 배포/의존성/CORS 같은 현실 이슈도 직접 밟고 해결했습니다. 힘들었지만… 성장(?) 😇)

3) 목표: 프로토타입이 아니라 ‘작동하는 제품’으로 끝내기

이번 목표는 단순히 기능 구현이 아니라, 사용자가 실제로 쓸 수 있는 흐름을 갖추는 것이었습니다.

사진 1장 업로드 → 퍼스널 컬러 분석
실시간 날씨 결합
오늘의 코디 2가지 룩북(Daily/Special) 생성
이미지 다운로드
링크로 공유해도 동작하는 프로덕션 배포

4) 진행 방식: Strategist(Gemini/ChatGPT) × Executor(Cursor)

작업 방식도 의도적으로 설계했습니다.

전략가: Gemini/ChatGPT
문제 정의, 우선순위, “무엇을 통제해야 제품이 되는지” 결정
실행가: Cursor
Ask/Plan/Agent 모드를 활용해 코드 반영 → 빌드 → 배포 → 검증까지 밀어붙이기

중간에 재미있는 깨달음도 있었는데요. 처음엔 “전략은 밖에서 세우고 Cursor는 실행만”이라고 생각했는데, 진행하다 보니 Cursor도 Ask/Plan/Agent를 잘 쓰면 전략까지 상당 부분 흡수할 수 있었습니다. 결국 도구보다 “어떻게 지시하고 검증하느냐”가 더 중요했습니다.

5) 제품 구조: ‘에이전트 워크플로우’로 만들기 (LangGraph + Tool calling/MCP)

StyleSense는 단일 프롬프트 앱이 아니라, LangGraph 기반 워크플로우로 구성했습니다.
입력 검증 → 비전 분석 → 외부 데이터(날씨) 조회 → 추천 생성 → 검증/보정까지를 노드 단위로 분리해 연결했습니다.

특히 날씨처럼 모델이 “추측”하면 안 되는 데이터는 Tool calling/MCP 방식으로 분리했습니다.
여기서 MCP를 쓴 이유는 단순합니다: 도구 인터페이스를 표준화해두면, 데이터 공급자(Tavily 등)가 바뀌어도 워크플로우를 안정적으로 유지할 수 있기 때문입니다.

요약하면, “AI가 잘하길 기대”하기보다 어느 단계가 흔들리는지 측정하고 필요한 곳만 최소 수정으로 개선할 수 있게 만드는 구조를 목표로 했습니다.

(도식) LangGraph 워크플로우 개요

6) AI의 흔들림을 ‘시스템’으로 통제하기⭐

6-1) “측정 도구가 먼저다”: 회귀 테스트 자동화 게이트(QA-Lite)

AI 결과는 눈으로만 보면 착각하기 쉽습니다. 그래서 품질을 올리기 전에, 먼저 품질을 측정할 수 있는 게이트부터 만들었습니다.

회귀 테스트 자동화 게이트(이미지 생성 없는 Regression Gate)
시나리오 + 시드(seed) 고정으로 자동 실행
결과는 JSONL로 남겨 통과/실패로 판단

팩트: seed 42 고정 / 12개 시나리오 100% 통과, error_count 0

시나리오 ID	지역 (기온 맥락)	스타일	성별	퍼스널 컬러	검증 결과 (Pass/Fail)
male-sexy-seoul	서울 (-2.6°C)	섹시	남성	여름 뮤트	PASS
female-sexy-seoul	서울 (-2.6°C)	섹시	여성	봄 브라이트	PASS
male-chic-helsinki	헬싱키 (-8.4°C)	시크	남성	여름 트루	PASS
female-elegant-dubai	두바이 (24.1°C)	우아	여성	봄 라이트	PASS
male-minimal-seoul	서울 (-2.6°C)	미니멀	남성	가을 딥	PASS
… 외 7종	글로벌 랜덤	혼합	혼합	혼합	PASS

PM 관점 한 줄: “운 좋게 잘 됐다”가 아니라, 가드레일(게이트)을 세워서 품질을 유지하는 방식이었습니다.

6-2) 경량형 Self-correction 루프(Mini A): “딱 한 번만” 보정하기

이미지 생성은 확률적으로 흔들립니다(크롭/중복 인물/비율 등).
하지만 마음에 들 때까지 무한 재시도하면 비용과 지연이 폭주합니다. 그래서 Mini A는 이렇게 설계했습니다.

실패를 감지하면
LLM을 다시 불러 프롬프트를 새로 쓰지 않고(추가 판단/리라이트 없이)
미리 정의한 짧은 패치 토큰(Patch Token)을 프롬프트 끝에 append-only로 덧붙인 뒤
이미지 생성만 최대 1회 재시도합니다. (Max Retry = 1)

예를 들어 크롭 이슈가 나면 CROP_STABILITY, 인물 중복이 보이면 SINGLE_PERSON, 남성 비율이 무너지면 MALE_PHYSIQUE_STABILITY 같은 처방 토큰을 추가하는 방식입니다.
핵심은 “더 똑똑하게 다시 쓰는 것”보다, 가이드라인을 빠르고 확실하게 강화해 1회 안에 정답률을 높이는 실무형 구조를 택한 점이었습니다.

그리고 “루프가 실제로 동작했는지”는 말로 끝내지 않기 위해, 강제 실패 시나리오를 넣어 JSONL에 review_attempt=2가 찍히는 것으로 증명했습니다.
(중요 포인트는 ‘재시도 자체’가 아니라, 재시도가 발생했음을 기록으로 남기는 구조였습니다.)

6-3) 가장 치명적인 문제: 같은 사진인데 퍼스널 컬러가 바뀜 → ‘일관성’부터 해결

수동 테스트 중 가장 치명적인 문제는 이거였습니다.

“같은 사진을 올렸는데, 퍼스널 컬러 진단이 매번 바뀐다.”

사용자가 자기 퍼스널 컬러를 어느 정도 알고 있는 경우가 많기 때문에, 이 문제는 신뢰를 바로 무너뜨립니다.
원인은 Vision LLM의 확률적 변동성이었고, 저는 “정확도를 당장 100점으로 만들기”보다 일관성(Consistency)부터 확보하는 쪽을 택했습니다.

이미지 콘텐츠 SHA256 해시 기반 캐싱(.pc_cache.json)
동일 이미지면 동일 퍼스널 컬러 결과 고정

그리고 UX적으로 기술적 한계를 숨기지 않고, 결과 영역에 아래 문구를 배치했습니다.

ⓘ 사진의 조명·해상도 등에 따라 퍼스널 컬러 결과가 달라질 수 있습니다.

7) 배포: Vercel + Render로 ‘진짜 링크’를 만들기

배포는 늘 마지막 관문입니다. 이번 프로젝트는 프론트/백엔드를 분리했습니다.

Front: Vercel
Backend(FastAPI): Render

배포 과정에서 가장 크게 부딪힌 건 크게 두 갈래였습니다.
(1) 의존성 충돌로 인한 빌드 실패, 그리고 (2) 도메인 분리로 인한 통신(CORS) 차단입니다.
결과적으로 “코드가 돌아간다”와 “프로덕션에서 돌아간다”는 정말 다른 이야기였습니다.

최종적으로는:

NEXT_PUBLIC_API_BASE_URL 환경변수로 백엔드 URL 주입
FastAPI CORS에 allow_origin_regex=r"^https://.*\.vercel\.app$" 적용
PC/모바일에서 업로드→결과→다운로드까지 동작 확인

8) Tech Stack

프론트: 초기 1회 v0로 빠르게 뼈대를 잡고, 이후 Next.js 구조를 Cursor에서 정리해 진행했습니다.
백엔드/오케스트레이션: FastAPI + LangGraph
날씨: Weather MCP (Tavily API)
이미지 생성: FAL AI
배포: Vercel(Front) + Render(Backend)

9) 결과: 스모크 테스트로 ‘제품 완성’ 확인

프로덕션 배포 후, PC/모바일에서 최소 스모크 테스트를 진행했습니다.

남/여 + 스타일 조합 테스트(스트릿/섹시/댄디 등)
업로드 필터링: 강아지/꽃/다인물 → Alert으로 정상 차단
이미지 다운로드 정상 동작

서비스 링크: https://stylesense-khaki.vercel.app/

10) 교훈(Lessons): Cursor의 자유도 vs AI Studio의 편의성

이번 프로젝트에서 얻은 교훈은 현실적으로 이렇습니다.

AI Studio/Gems는 빠릅니다. 하지만 내가 원하는 디테일로 통제하기엔 한계가 있습니다.
Cursor는 자유도가 높습니다. 대신 모든 걸 내가 설계하고 운영 가능한 형태로 통제해야 합니다.
특히 이미지 생성은 같은 코드라도 표현/순서가 바뀌면 결과가 흔들릴 수 있어, “시스템적 통제(측정/보정/증명)”가 꼭 필요했습니다.

처음엔 “AI Studio에서 만든 것처럼 Cursor에서도 쉽게 되겠지”라고 생각했는데, 이게 착각이었습니다.
AI Studio는 이미 잘 깔린 인프라 위에서 돌아가고, Cursor는 내가 하나씩 시스템을 세워야 했습니다.

결국 “AI를 잘 쓰는 것”과 “AI 제품을 출시 가능한 형태로 만드는 것”은 다른 문제였고, 이번 프로젝트는 그 차이를 몸으로 배운 경험이었습니다.

11) 남은 과제(Backlog)

퍼스널 컬러 정확도(Accuracy) 정량 평가(일관성은 확보했으니 다음 단계)
React 19 의존성 지뢰 제거(우회 플래그 제거)
CORS 허용 범위를 프로덕션 도메인 리스트로 축소 + /health 엔드포인트 추가

마치며

AI를 ‘코딩’하는 시대를 넘어, ‘오케스트레이션’하는 시대로...

StyleSense 프로젝트를 마무리하며 가장 크게 느낀 점은, AI 제품의 본질이 모델의 지능 그 자체보다 시스템의 예측 가능성과 검증 가능성에 있다는 사실이었습니다.

이번 작업은 단순한 기능 구현이 아니라, AI PM으로서 불확실성이 큰 생성형 AI를 어떻게 시스템 아키텍처인 LangGraph 안에서 관리하고, QA-Lite와 Self-correction 같은 품질 장치로 통제 가능한 형태로 설계할 것인지 고민한 과정이었습니다.

결국 중요한 것은 AI가 한 번 그럴듯한 결과를 내는지가 아니라, 흔들릴 수 있는 결과를 서비스 수준의 신뢰로 끌어올릴 수 있는가였습니다. 이번 프로젝트를 통해 그 신뢰는 모델 하나가 아니라, 구조와 검증, 운영의 조합으로 만들어진다는 점을 다시 확인했습니다.

무엇보다 이번 프로젝트는 전략가(Gemini/ChatGPT)와 실행가(Cursor)를 오케스트레이션하며, AI를 단순한 도구가 아니라 운영 가능한 제품으로 빌드해본 실전 경험이었습니다. 앞으로도 AI의 화려함 자체보다, 실제 서비스 안에서 안정적으로 작동하는 구조와 품질 체계를 설계하는 일에 더 집중해보려 합니다.

서비스 링크: https://stylesense-khaki.vercel.app/
(※ 첫 접속 시 서버 기동으로 잠시 지연될 수 있습니다.)

AI Studio로 10분 만에 ‘직장인 멘탈 서바이벌’ 게임 만들기

최근 여러 바이브코딩 툴을 익히는 과정에서,
Google AI Studio로 가볍게 미니게임을 하나 만들어봤습니다.
코딩 없이 프롬프트만으로
직장인 멘탈 생존 게임 “운명의 데스크탑”을 프로토타이핑한 실험입니다.

총 2시간 정도 소요되었고, 대략적인 타임라인은 아래와 같습니다.

- 최초 구축: 프롬프트 설계 약 20분 + 프롬프트 전송/구축 약 10분 → 프로토타이핑 완성
- 상세 튜닝: 약 90분
- 총 소요: 약 2시간

즉, “10분”은 프롬프트를 통해 프로토타이핑이 최초로 완성된 시간이고,
프롬프트 설계와 완성도 튜닝까지 포함하면 별도 시간이 꽤 들어갔습니다.
아마 다른 프로젝트들도 유사하지 않을까 싶습니다.
(실행 비용은 낮고, 판단/검증 비용은 높음)

👉 [ ‘운명의 데스크탑’ 게임 플레이 ]

🤔 무엇을 만들었나: 텍스트 대시보드형 미니게임

<운명의 데스크탑>은 한 주를 버티는 구조의 선택형 게임입니다. 화면은 “시스템 진단 대시보드”처럼 고정된 UI로 보여주고, 각 단계에서 A/B 선택을 하면 멘탈 지수가 변합니다.

- 목표: 월요일부터 금요일 18:00까지 멘탈 0% 초과로 버티기
- 진행: 월~금 흐름 + 중간에 보너스(회복) 구간 1회
- 출력 규칙: 스크롤을 줄이기 위해 3~5줄 중심, 대시보드 포맷 유지
- 엔딩: 멘탈이 0%가 되면 즉시 [사직서 제출] 엔딩으로 종료
  - 참고로 현재 캡처는 lose 엔딩 흐름입니다. (win/lose 모두 “월요일 엔딩”으로 수렴하게 설계해 둔 건… 현실 반영입니다.)

1️⃣ 최초 구축(약 30분): 뼈대는 정말 빨리 나온다

AI Studio에서 가장 인상적이었던 지점은, “게임이 돌아가는 형태”까지 도달하는 속도였습니다.
역할/목표/턴/출력 포맷 같은 핵심 규칙을 프롬프트로 고정해 주면, 짧은 시간 안에 기본 흐름이 바로 작동합니다.

제가 처음 고정한 요소는 단순했습니다.

- 역할: “운명의 데스크탑” (상황을 제시하고 결과를 출력하는 시스템)
- 목표: 금요일 18:00까지 멘탈 유지
- 입력: A/B 선택
- 출력: 대시보드 형태 고정 + 짧은 문장 + 다음 단계 진행 안내

이 단계까지는 “정말 빠르게” 나옵니다. 문제는 그다음이었습니다.

2️⃣ 상세 튜닝(약 90분): ‘돌아감’과 ‘재밌음/읽힘’은 다르다

프로토타입이 돌아간다고 해서, 곧바로 “게임처럼 느껴지진” 않습니다. 제가 시간을 쓴 지점은 대부분 여기였습니다.

1. 템포 조정: 길면 피로해진다
  초기 버전은 단계가 길어지면서 금방 읽기 부담이 생겼습니다.
  그래서 한 주 시나리오를 핵심 국면 중심으로 압축하고, 각 단계에서 “즉시 선택하고 넘어갈 수 있게” 문장을 줄였습니다.
2. 콘텐츠 범위: 특정 직군 밈에 치우치지 않기
  처음엔 IT/개발자 맥락에 치우친 표현이 섞여 있었습니다.
  일반 직장인도 공감할 수 있도록 보고/급한 수정/회의/런치/퇴근 직전 이벤트처럼 범용적인 상황을 섞어 톤을 정리했습니다.
3. 진행감: 텍스트지만 ‘UI처럼’ 보이게
  텍스트 게임이라도 “진행 중”이라는 느낌이 있어야 합니다.
  아이콘, 상태 라벨(STRESSED 등), 경고 문구, 멘탈 바(게이지)처럼 시각적 힌트가 되는 요소를 넣어 대시보드 감도를 올렸습니다.
4. 밸런스: 회복 구간 하나로 난이도가 급변한다
  보너스(회복) 스테이지를 넣으면 난이도가 확 바뀝니다.
  그래서 멘탈 감소/회복 폭을 다시 맞추며 “너무 쉽지도, 너무 불가능하지도 않게” 조정했습니다.

✅ AI Studio가 특히 좋았던 지점

정리하면, AI Studio는 “프로토타이핑” 관점에서 강점이 뚜렷했습니다.

1. 초안 품질이 안정적
  문장/구조가 비교적 정돈되어 나와서, 초반 QA 부담이 낮았습니다.
2. 튜닝 루프가 빠름
  제약(포맷 고정, 출력 길이 제한, A/B 규격)을 걸어도 수정-재실행이 매끄러웠습니다.
3. 배포까지 원스톱으로 이어지기 쉬움
  비개발자에게 가장 부담되는 구간이 보통 백엔드/배포인데, 이 부분을 크게 신경 쓰지 않아도 끝까지 가져갈 수 있다는 점이 인상적이었습니다.

⚠️ 아쉬운 점: 디테일 튜닝은 생각보다 어렵다

다만 한계도 분명했습니다.
프롬프트만으로도 형태는 빠르게 만들 수 있지만, 의도한 결과물을 100% 재현하는 디테일 튜닝에는 한계가 있었습니다. 특히 인터랙션, 밸런스, 예외 케이스까지 정밀하게 잡으려면 프롬프트만으로는 어렵습니다.

그래서 최종 완성도를 목표로 할 때는 Cursor나 Claude Code처럼 코드 수정이 가능한 도구가 필요하다고 느꼈고, 저도 현재는 Cursor AI로 다른 프로젝트를 병행하며 “프로토타입 → 코드 기반 완성” 흐름을 함께 가져가고 있습니다.

🧾마치며…

이번 실험으로 확실히 느낀 건 하나입니다.
AI Studio는 ‘퀄리티 있는 프로토타입을 빠르게 만들고, 배포까지 한 번에 처리’하는 데 강합니다.
반면, 완성도를 끝까지 밀어붙여 원하는 결과물을 정확히 구현하려면 코딩 기반 도구가 더 적합합니다.

저는 이번엔 AI Studio의 강점을 확인하는 목적이었기 때문에, 이 정도 결과물만으로도 충분히 의미가 있었습니다.

👉 [ ‘운명의 데스크탑’ 게임 플레이 ]

IDE, MCP, Agent를 어떻게 이해하고 설계할까

1. 헷갈리는 AI 용어, ‘주방’ 비유로 이해하기

2. MCP가 중요한 이유: ‘매번 새로 붙이지 않기’ 위해서

3. 한 명의 에이전트로 갈까, 여러 명의 에이전트로 갈까

A. Single Agent + 필요한 도구 연결

B. Multi-Agent

4. 그래서 어떤 구조로 시작하는 게 좋을까

마치며

이 글 공유하기:

📌 세 줄 요약

1) 배경: “오늘 뭐 입지?”를 AI로 풀어보고 싶었습니다

2) 시작은 빠르게: Gems → AI Studio → Cursor로 넘어간 이유

3) 목표: 프로토타입이 아니라 ‘작동하는 제품’으로 끝내기

4) 진행 방식: Strategist(Gemini/ChatGPT) × Executor(Cursor)

5) 제품 구조: ‘에이전트 워크플로우’로 만들기 (LangGraph + Tool calling/MCP)

(도식) LangGraph 워크플로우 개요

6) AI의 흔들림을 ‘시스템’으로 통제하기⭐

6-1) “측정 도구가 먼저다”: 회귀 테스트 자동화 게이트(QA-Lite)

6-2) 경량형 Self-correction 루프(Mini A): “딱 한 번만” 보정하기

6-3) 가장 치명적인 문제: 같은 사진인데 퍼스널 컬러가 바뀜 → ‘일관성’부터 해결

7) 배포: Vercel + Render로 ‘진짜 링크’를 만들기

8) Tech Stack

9) 결과: 스모크 테스트로 ‘제품 완성’ 확인

10) 교훈(Lessons): Cursor의 자유도 vs AI Studio의 편의성

11) 남은 과제(Backlog)

마치며

이 글 공유하기:

🤔 무엇을 만들었나: 텍스트 대시보드형 미니게임

1️⃣ 최초 구축(약 30분): 뼈대는 정말 빨리 나온다

2️⃣ 상세 튜닝(약 90분): ‘돌아감’과 ‘재밌음/읽힘’은 다르다

✅ AI Studio가 특히 좋았던 지점

⚠️ 아쉬운 점: 디테일 튜닝은 생각보다 어렵다

🧾마치며…

이 글 공유하기: