안정적인 AI 에이전트 서비스 운영을 위한 평가(Evaluation) 방법

Name: 안정적인 AI 에이전트 서비스 운영을 위한 평가(Evaluation) 방법
Price: 69300 KRW
Rating: 5 (7 reviews)

AI 에이전트, 배포할 때마다 불안하신가요? 국내 대기업/해외 빅테크 경험을 바탕으로, LangSmith를 활용해 에이전트 품질을 체계적으로 측정하고 개선하는 방법을 알려드립니다.

(5.0) 수강평 7개

수강생 156명

난이도 중급이상

수강기한 무제한

제이쓴

AI 활용법

실습 중심

Python

LangChain

LangGraph

AI 활용법

실습 중심

Python

LangChain

LangGraph

현대오토에버

임직원들도 이 강의를 듣고 있어요!

현대오토에버

임직원들도 이 강의를 듣고 있어요!

수강 후 이런걸 얻을 수 있어요

AI 에이전트 특화 평가 방법론과 실무 노하우
"감"이 아닌 "데이터" 기반의 의사결정 체계 구축
개발 및 테스트 비용의 획기적인 절감
실제 서비스 운영 시 발생하는 에러 해결 및 디버깅 기술

수강 전 참고 사항

실습 환경

Python 3.13 이상 버전 설치가 필요합니다.

선수 지식 및 유의사항

Python 프로그래밍 기본 문법에 익숙해야 합니다.
LangChain + LangGraph 활용 에이전트 개발 경험이 있으신 분들께 적합합니다
- LangChain 문법에 익숙하지 않으시다면 한시간으로 끝내는 LangChain 기본기↗️ 를 먼저 수강해주세요
- LangGraph 문법에 익숙하지 않으시다면 LangGraph를 활용한 AI Agent 개발↗️ 을 먼저 수강해주세요

학습 자료

강의 자료가 노션 페이지↗️ 로 제공됩니다
실습 코드 및 예제 데이터셋을 GitHub↗️ 을 통해 제공됩니다

이런 분들께
추천드려요

학습 대상은
누구일까요?

프롬프트를 한 줄 고칠 때마다, 다른 기능이 망가질까 봐 불안한 개발자
개발 팀과 소통할 때 '느낌'이 아닌 데이터와 지표를 바탕으로 의사결정을 내리고 싶은 기획자
기초를 넘어 실무 수준의 AI 에이전트를 개발하고 싶은 개발자

선수 지식,
필요할까요?

Python 필수
LangGraph 필수

안녕하세요
제이쓴입니다.

인프런인증

커리어인증

19,089

명

수강생

1,511

개

수강평

529

개

답변

4.9

점

강의 평점

개

강의

FAANG Senior Software Engineer
(전) GS 그룹 AI Agent 플랫폼 개발/운영
(전) GS 그룹 DX BootCamp 멘토/코칭
(전) 시리즈 C AI 스타트업 테크리드
Stanford University Code in Place Python Instructor
네이버 부스트캠프 웹/모바일 멘토
네이버 클라우드 YouTube Channel presenter
혼자서도 척척 해내는 AI 에이전트 만들기 with 랭체인 & 랭그래프 저자
원티드 프리온보딩 프론트엔드/백엔드 챌린지 진행 (누적 6000+)
항해 AI 플러스코스 1기 코치

커리큘럼

전체

18개 ∙ (3시간 16분)

섹션 1. Intro: 강의 내용 소개 (수강 신청 전 꼭 시청해주세요!)

1개 ∙ (9분)

1. 이 강의에서 다루는 것과 다루지 않는 것
09:49

섹션 2. AI 에이전트 평가(Evaluation)를 해야하는 이유

2개 ∙ (19분)

섹션 3. Golden Dataset 생성

6개 ∙ (1시간 4분)

4. Golden Dataset이란?
07:16
5. RAGAS 라이브러리를 활용한 Golden Dataset 생성
15:16
6. LangSmith 계정에서 프로젝트와 API 설정
02:40
7. 커스텀 에이전트 + FAQ 를 활용한 Golden Dataset 생성
11:59
8. 커스텀 에이전트 + 일반 문서를 활용한 Golden Dataset 생성
17:28
9. Claude Code Agent Skill을 활용한 Golden Dataset 생성
09:25

섹션 4. [기초] AI 에이전트 평가 설계: 무엇을 어떻게 측정할 것인가

5개 ∙ (1시간 15분)

섹션 5. [심화] 에이전트 성능을 수치로 읽는 법

3개 ∙ (22분)

섹션 6. Outro: 전체 내용 복습 + 서비스에 특성에 맞는 평가 전략

1개 ∙ (5분)

강의 게시일:

마지막 업데이트일:

수강평

전체

7개

5.0

7개의 수강평

이성규
수강평 8
∙
평균 평점 5.0
수정됨
5
33% 수강 후 작성
항상 믿고 신청하는 제이쓴 강의입니다. 강사님의 모든 Langchain 관련 강의를 수강하였고 덕분에 현재 주니어 AI Engineer로 업무를 진행하고있습니다. 현업에서 평가 관련으로 많이 고민을 하고 있었는데, 마침 딱 타이밍 좋게 강의가 나와서 빠르게 학습하고 적용하려 하고 있습니다. 언제나 좋은 퀄리티의 강의를 내주셔서 감사합니다. 추가적으로 별개의 질문이지만 이번에 책을 내신것을 이제서야 알았습니다. 아직 책은 구입하지 않았는데, 강의를 모두 들었음에도 책으로 학습할만한지 여쭈고싶습니다. 항상 수강생의 입장에서 설명하고 공유해주셔서 좋은 사수같은 느낌의 강의입니다. 다시한번, 항상 좋은 강의 감사합니다. :)
- 제이쓴
  지식공유자
  안녕하세요 성규님! 좋은 피드백 감사합니다. 강의를 수강하신게 AI 엔지니어 커리어에 도움이 됐다고 하시니 강의의 효과가 증명된 것 같아서 뿌듯하네요. 공유해주셔서 감사합니다 강의보다 책에서 책에서는 조금 더 다양한 평가 전략과 방법을 다루긴 합니다.그렇긴 하지만 강의에서도 충분히 평가 이론을 다루기 때문에 강의를 모두 수강하셨으면 책은 굳이 구입하지 않으셔도 될 것 같습니다 ( 도서를 판매하는 입장에서 이런 말을 하면 안되겠지만 😅)또 좋은 강의로 인사 드리도록 하겠습니다!
- 이성규
  아. 오히려 솔직히 말씀해주셔서 너무 믿음가고 감사합니다..!! :) 앞으로도 바로 얼리버드로 제일 먼저 수강하도록하겠습니다. 잘부탁드리겠습니다!
이재현
수강평 1
∙
평균 평점 5.0
5
33% 수강 후 작성
양희찬
수강평 1
∙
평균 평점 5.0
5
33% 수강 후 작성
윤성재 윤
수강평 4
∙
평균 평점 5.0
5
61% 수강 후 작성
홍삼
수강평 8
∙
평균 평점 5.0
5
33% 수강 후 작성

제이쓴님의 다른 강의

지식공유자님의 다른 강의를 만나보세요!

RAG를 활용한 LLM Application 개발 (feat. LangChain)

제이쓴

실리콘밸리 GenAI 해커톤 우승자에게 배우는 RAG. 현업 노하우를 가득 담았습니다

Cơ bản

LLM, RAG, LangChain

RAG를 활용한 LLM Application 개발 (feat. LangChain)

제이쓴

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

제이쓴

대기업 AI Agent 담당자의 노하우를 가득 담은 LangGraph. 현업에서 얻어맞으면서 습득한 지식을 전달드립니다

Cơ bản

프롬프트엔지니어링, LLM, AI Agent

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

제이쓴

한시간으로 끝내는 LangChain 기본기

제이쓴

커피 한잔 가격으로 즐기는(?) 공식문서에서 핵심만 뽑아온 LangChain 기본 강의입니다. 본격적인 개발에 들어가기 전 LangChain 문법과 친해지세요!

Cơ bản

프롬프트엔지니어링, LLM, LangChain

한시간으로 끝내는 LangChain 기본기

제이쓴

회사에서 바로 쓰는 업무자동화 AI 에이전트 (w. n8n, LangGraph)

제이쓴

인공지능, AI, 에이전트… 뭔가 대단해 보이지만, 막상 해보면 생각보다 별 거 아닙니다. 그래서 간단한 기능을 직접 구현해보는 것이 중요합니다. 회사에서 실제로 쓸 수 있는 실용적인 프로젝트를 통해, 다양한 유즈케이스를 직접 경험하고, AI 에이전트를 활용하고 응용하는 방법까지 배워봅니다.

Cơ bản

n8n, 인공지능(AI), LangChain

회사에서 바로 쓰는 업무자동화 AI 에이전트 (w. n8n, LangGraph)

제이쓴

2시간으로 끝내는 프론트엔드 테스트 기본기

제이쓴

테스트코드! 어디서부터 시작해야할지 막막한 분들을 위해 준비했어요. 테스트 작성부터, 자동화를 통한 배포까지 한번에!

Cơ bản

React, Cypress, Jest

2시간으로 끝내는 프론트엔드 테스트 기본기

제이쓴

Flutter로 만드는 LLM 챗봇 (feat. Gemini)

제이쓴

Flutter가 처음이신가요? Flutter Contributor가 처음부터 하나씩 소개해드립니다! Gemini를 활용한 AI 프로젝트로 Flutter 개발을 시작해보세요

Cơ bản

Flutter, 챗봇, gemini

Flutter로 만드는 LLM 챗봇 (feat. Gemini)

제이쓴

실무에 바로 적용하는 AWS 배포

제이쓴

AWS로 서비스를 배포/운영하고싶은 분들을 위해 준비했습니다. 도메인 설정부터 도커와 서버리스까지!

Cơ bản

AWS, Docker, aws-ecs

실무에 바로 적용하는 AWS 배포

제이쓴

실무에 바로 적용하는 스토리북과 UI 테스트

제이쓴

스토리북 활용법 A to Z. 스토리북의 모든것을 보여드립니다

Cơ bản

storybook, ui-testing, React

실무에 바로 적용하는 스토리북과 UI 테스트

제이쓴

비슷한 강의

같은 분야의 다른 강의를 만나보세요!

회사에서 바로 쓰는 업무자동화 AI 에이전트 (w. n8n, LangGraph)

제이쓴

Cơ bản

n8n, 인공지능(AI), LangChain

회사에서 바로 쓰는 업무자동화 AI 에이전트 (w. n8n, LangGraph)

제이쓴

AI 엔지니어 입문자를 위한 강의

Sungmin Kim

AI 엔지니어 입문자를 위한 강의는 데이터 처리부터 모델 개발, 클라우드와 MLOps, 그리고 윤리적 고려까지 전 과정을 짧게 체험할 수 있도록 구성되었습니다. 단순히 모델을 만드는 데서 그치지 않고, 실제 서비스로 연결하는 과정을 이해해 실무 감각을 익히는 데 중점을 둡니다. AI를 처음 배우는 분들도 쉽게 따라올 수 있도록 실습과 예제를 곁들여 진행합니다.

Nhập môn

Python, 머신러닝, FastAPI

AI 엔지니어 입문자를 위한 강의

Sungmin Kim

DDPM 부터 DDIM 까지, 구현하며 배우는 Diffusion 완전정복 I

Sotaaz

이 강의는 확산모델(Diffusion Model)의 진화 과정을 논문과 코드로 완전 정복하는 실전 중심 마스터클래스입니다. DDPM(Denoising Diffusion Probabilistic Model)과 DDIM 등, 생성 AI의 핵심 모델들을 논문 원리부터 직접 구현하며 학습합니다. 각 모델의 등장 배경, 수식, 네트워크 구조(U-Net, VAE, Transformer), 학습 과정(Noise Schedule, Denoising Step), 그리고 성능 향상을 이끈 아이디어들을 단계별로 분석합니다.수강생은 모든 모델을 PyTorch 기반으로 직접 코딩하며, 논문을 이해하는 것에 그치지 않고 ‘재현하고 응용할 수 있는 실무 능력’을 얻게 됩니다. 또한, 모델 간의 차이와 발전 흐름을 비교하며, 어떻게 확장되는지를 명확히 이해하게 됩니다. 이 강의는 이론·코드·실습을 하나로, 연구자·개발자·창작자 모두에게 생성모델의 진화를 체계적으로 익힐 수 있는 여정을 제공합니다. 논문을 ‘읽는 것’을 넘어, 직접 구현하며 ‘이해하고 재창조’하는 경험을 지금 시작하세요.

Cơ bản

Python, 딥러닝, 인공지능(AI)

DDPM 부터 DDIM 까지, 구현하며 배우는 Diffusion 완전정복 I

Sotaaz

실리콘밸리 엔지니어와 함께하는 Codex

미쿡엔지니어

ChatGPT만 쓰던 개발자에서 AI 에이전트를 다루는 개발자로. Codex의 Rules, Hooks, Skills, MCP를 활용해 코딩 생산성을 극대화하는 실전 활용법을 배웁니다.

Nhập môn

인공지능(AI), Python, codex

실리콘밸리 엔지니어와 함께하는 Codex

미쿡엔지니어

[AICE] 파이썬으로 배우는 데이터 분석과 AI모델링

AICE

1. 국내 유일 공인 AI 국가공인자격증, AICE Associate 합격을 위한 실습 중심의 강의 2. 파이썬 기반으로 데이터분석과 AI 모델링을 할 수 있는 단계까지 학습.

Cơ bản

Python, 인공지능(AI), 딥러닝

[AICE] 파이썬으로 배우는 데이터 분석과 AI모델링

AICE

파이썬으로 해보는 인공지능

멋진

딥러닝은 복잡한 함수의 조합으로 이루어진 신경망을 통해 데이터를 학습하는 기술입니다. 이 강의에서는 딥러닝의 핵심 개념을 수학적으로 이해하고, 이를 행렬 연산 관점에서 분석해봅니다. 특히 Python의 NumPy 라이브러리를 활용하여, 딥러닝의 순전파와 역전파 과정을 직접 구현해보며 파라미터가 어떻게 업데이트되는지 시각적으로 살펴봅니다. 복잡해 보이던 신경망 구조도 행렬 연산으로 풀어내면 명확해집니다. 이 강의는 코딩보다 개념 이해에 중점을 두고, 딥러닝의 원리를 수학적으로 직관적으로 익히고자 하는 학생들에게 적합합니다.

Cơ bản

Python, Numpy, Tensorflow

파이썬으로 해보는 인공지능

멋진

AI활용 디지털전환 (Digital Transformation Using AI)

부산대학교 AI융합교육원

파이썬을 활용해 기계학습 기술을 학습하고, 실제 데이터 정보 추출 방법 및 예측 모델 개발 능력을 향상해보자!

Nhập môn

인공지능(AI), RPA, Python

AI활용 디지털전환 (Digital Transformation Using AI)

부산대학교 AI융합교육원

진짜 현장에서 통하는 OCR, 이렇게 만듭니다.

데이비드최

현업에서 진짜 쓰이는 OCR 기술, 제대로 배워보고 싶다면 이 강의 하나로 끝! 비정형 문서와 복잡한 레이아웃에서도 98% 이상의 정확도를 목표로, 최신 SOTA 모델과 실전 노하우를 바탕으로 기업 수준의 OCR 프로젝트를 함께 만들어갑니다.

Cơ bản

Python, 인공지능(AI), openai

진짜 현장에서 통하는 OCR, 이렇게 만듭니다.

데이비드최

파이썬으로 해보는 자율주행

멋진

이 강의가 특별한 이유: 핵심 장점 • 직관적인 시각화: Pygame 2D 시뮬레이션으로 알고리즘 동작을 실시간으로 직접 확인 • 실제 구현 경험: 이론을 넘어 직접 코딩하며 자율 주행 알고리즘 체득 • 핵심 알고리즘 마스터: 다익스트라, 퓨어 퍼슈트, ICP 등 필수 알고리즘 집중 학습 • 단계별 심화 학습: 기초부터 SLAM까지 체계적인 난이도 구성 • Lidar 기반 SLAM: 미지 환경에서의 맵 구축 및 위치 추정 실습

Cơ bản

Python, 자율주행, slam

파이썬으로 해보는 자율주행

멋진

[AICE] Associate 자격증 취득을 위한 적중 모의고사 문제풀이

AICE

1. 국내 유일 국가공인 AI 자격증, AICE Associate 합격을 위한 모의고사 문제풀이 2. 실제 AICE Associate 출제 문제와 동일한 유형의 모의고사 12회 풀이 강좌

Cơ bản

AICE, Python, 인공지능(AI)

[AICE] Associate 자격증 취득을 위한 적중 모의고사 문제풀이

AICE

챗GPT와 파이썬으로 유튜브 AI 직원 만들기

SungYong Lee

GPT API를 활용한 프로그램을 만들고, 이미지 생성과 동영상 생성까지!

Cơ bản

ChatGPT, gpt, Python

챗GPT와 파이썬으로 유튜브 AI 직원 만들기

SungYong Lee

[실전 AIoT] 스마트미러 메이커톤 완벽 대비: LLM, CV, 하드웨어 설계까지

KodeKorea 코드코리아

메이커톤에서 80%가 막히는 포인트, 이제 해결하세요. 라즈베리파이 · 컴퓨터비전 · LLM · 3D 설계까지 4주 완성! 시연 가능한 스마트미러 PoC로 메이커톤 상위권 달성!

Cơ bản

Python, Raspberry Pi, Arduino

[실전 AIoT] 스마트미러 메이커톤 완벽 대비: LLM, CV, 하드웨어 설계까지

KodeKorea 코드코리아

2시간으로 완성하는 실전 하네스 엔지니어링

AI 오케스트레이터

AI로 MVP를 만드는 건 이제 어렵지 않습니다. 하지만 대부분의 프로젝트는 그 다음 단계에서 멈춥니다. 👉 기능은 만들었는데 👉 개발이 계속 이어지지 않습니다 왜 이런 일이 생길까요? 문제는 코드가 아니라, 👉 AI가 지속적으로 일할 수 있는 구조가 없기 때문입니다. --- 이 강의에서는 이미 만들어진 프로젝트를 기반으로, 👉 AI가 계속 개발을 이어갈 수 있는 구조를 👉 직접 구축하는 과정을 다룹니다 --- 단순히 AI 툴을 사용하는 것이 아니라, * docs 구조를 만들고 * SSOT를 정의하고 * 티켓 단위로 개발을 실행하고 * QA와 반복 구조까지 연결하여 👉 하나의 “AI 개발 시스템”으로 완성합니다 --- 이 과정을 통해 👉 사람이 직접 코딩하지 않아도 👉 개발이 계속 이어지는 구조 즉, 👉 AI를 팀처럼 운영하는 개발 시스템을 👉 직접 만들고 이해할 수 있습니다 --- 이 강의는 👉 내 프로젝트에 바로 적용할 수 있는 구조를 만들고 싶은 분 👉 AI로 개발을 시작했지만, 지속이 어려웠던 분 👉 바이브 코딩 이후, 다음 단계로 넘어가고 싶은 분 을 위해 구성되었습니다. --- 단순히 배우는 것이 아니라, 👉 실행해보고 👉 실제로 동작하는 구조를 만들고 👉 자신의 프로젝트에 적용할 수 있는 형태로 가져가는 경험 을 제공합니다.

Cơ bản

Python, cursor, ChatGPT

2시간으로 완성하는 실전 하네스 엔지니어링

AI 오케스트레이터

AI 댓글 자동화 프로그램 개발 강의 (네이버 블로그)

김지유

Chatgpt가 내 이웃이 쓴 글을 읽고 댓글을 달아주는 프로그램 마케팅 자동화, 이웃 관리 프로그램 개발 강의

Cơ bản

Python, 네이버 키워드 검색, 블로그

AI 댓글 자동화 프로그램 개발 강의 (네이버 블로그)

김지유

2026 인공지능 시작하기 : 학생/대학원생/개발자는 인공지능을 어떻게 시작해야하는가?

재주 (AI 엔지니어 및 PM)

- 저는 4년차 AI 스타트업을 운영하는 Research Engineer/AI PM 입니다. - 이 영상은 인공지능을 "지금", "2026년"에 공부를 시작하려는 분들을 위한 강의입니다. - 대학생 친구들을 보다보면 인공지능을 어떻게 시작해야하는지 감도 못잡는 친구들이 많습니다. - 본 강의를 듣고나서 인공지능을 공부하기 시작할 수 있다면 좋겠습니다. - 참고로, 본 강의는 "내 업무에 AI 활용" 혹은 "GPT를 이용한 수익화 방법 시작하기" 이런 강의가 아닙니다. - 학생, 대학원생, 혹은 개발자 분들이 인공지능을 공부하고싶을 때 어떻게 시작하면 좋을지에 대한 영상입니다.

Nhập môn

Python, 인공지능(AI), 머신러닝

2026 인공지능 시작하기 : 학생/대학원생/개발자는 인공지능을 어떻게 시작해야하는가?

재주 (AI 엔지니어 및 PM)

(라즈베리파이를 이용한) AI 인공지능 자율주행 자동차 만들기

유용한IT학습

라즈베리파이와 다양한 센서를 활용해 AI 기반 자율주행 자동차를 직접 제작해보는 실습형 강좌입니다.

Nhập môn

Python, Raspberry Pi

(라즈베리파이를 이용한) AI 인공지능 자율주행 자동차 만들기

유용한IT학습

딱 1시간! 내 컴퓨터에 심는 '나만의 AI 사수' 만들기 (Antigravity 바이브코딩) [소스코드 제공]

코드브릿지

[소스코드 제공] 코딩 몰라도 OK. 구글 최신 툴(IDX)로 설치 없이 브라우저에서 뚝딱 완성! 코딩 문법 공부는 이제 그만! AI와 대화하며(Vibe Coding) 구글 IDX 환경에서 사내 문서를 완벽히 이해하는 RAG 챗봇을 구축하고 웹으로 실시간 배포하는 초고속 실전 과정입니다.

Nhập môn

Python, 인공지능(AI), LLM

딱 1시간! 내 컴퓨터에 심는 '나만의 AI 사수' 만들기 (Antigravity 바이브코딩) [소스코드 제공]

코드브릿지

[무료] Python을 배우기 전에 배워야 할 Python 쌩기초

CODEXPERT

Python을 배우려고 한다면 이 강의에 주목!!! 무려 공짜~ 정식 과목 수강이나 개인 학습 이전에 꼭 선행 학습 용도로 권장 드립니다.

Nhập môn

Python

[무료] Python을 배우기 전에 배워야 할 Python 쌩기초

CODEXPERT

원클릭으로 AI가 생성해주는 Youtube 쇼츠 만들기 자동화(with n8n)

밤낮 코딩

AI로 유튜브 쇼츠 만들기 자동화!! n8n으로 유튜브 쇼츠를 자동으로 만드는 방법을 처음부터 배웁니다. 글→이미지/음악→영상 만들기→업로드까지 한 번에 돌아가는 흐름을 직접 만들어 봅니다. 테스트 모드/실전 모드 구분, 비용 아끼는 팁까지 실습합니다. 강의 끝나면 바로 쓸 수 있는 자동화 템플릿 3개를 완성합니다. 코딩 몰라도 따라올 수 있게 노드 배치부터 차근차근 배웁니다. AI 유튜브 쇼츠 제작 자동화 함께 해보세요!

Nhập môn

Python, youtube-api, n8n

원클릭으로 AI가 생성해주는 Youtube 쇼츠 만들기 자동화(with n8n)

밤낮 코딩

원고 생성기 프로그램 개발 강의 (Chatgpt api)

김지유

Gold Rush 시대에는 금을 직접 캐는 것보단 금 캐는 도구를 파는게 더 부자가 되기 쉽다고 하네요. ChatGPT 대항해 시대에 프로그램 판매해보시는건 어떤가요?

Cơ bản

ChatGPT, AIPRM, REST API

원고 생성기 프로그램 개발 강의 (Chatgpt api)

김지유

안정적인 AI 에이전트 서비스 운영을 위한 평가(Evaluation) 방법

수강 후 이런걸 얻을 수 있어요

공들여 만든 AI 에이전트배포해도 괜찮을까요?

🤯

😢

🤔

😳

확신이 필요한 순간 필요한 것?바로, 'AI 에이전트 평가' 입니다.

안정적인 서비스의 시작AI 에이전트 평가

기존 소프트웨어와 다른 AI 에이전트의 특성

AI의 비결정성

비정형 문제

동적 시스템

AI 에이전트의 변화를 제대로 확인하지 못하면서비스는 언제든 무너질 수 있습니다.

실무에 바로 적용 가능한AI 에이전트 평가 방법

01.

비용과 시간을 아끼는골든 데이터셋 구축

RAGAS

Custom Agent

Claude Code Skill

02.

빅테크에서 채택한에이전트 평가 방법

E2E + Component 평가

03.

Anthropic이 알려주는에이전트 성능을 숫자로 표현하는 법

pass@k

pass^k

📚

학습 커리큘럼 소개

AI 에이전트 평가의 필요성

Golden Dataset 구축 전략

AI 에이전트 평가 지표 설계

에이전트 성능 정량 분석 심화

이런 분들의 고민을해결할 수 있어요!

📌

AI 에이전트 개발자

📌

AI 서비스 운영 담당자

📌

LLM 기반 서비스 기획자

수강 전 참고 사항

이런 분들께 추천드려요

안녕하세요 제이쓴입니다.

커리큘럼

수강평

제이쓴님의 다른 강의

비슷한 강의

공들여 만든 AI 에이전트
배포해도 괜찮을까요?

확신이 필요한 순간 필요한 것?
바로, 'AI 에이전트 평가' 입니다.

안정적인 서비스의 시작
AI 에이전트 평가

AI 에이전트의 변화를 제대로 확인하지 못하면
서비스는 언제든 무너질 수 있습니다.

실무에 바로 적용 가능한
AI 에이전트 평가 방법

비용과 시간을 아끼는
골든 데이터셋 구축

빅테크에서 채택한
에이전트 평가 방법

Anthropic이 알려주는
에이전트 성능을 숫자로 표현하는 법

이런 분들의 고민을
해결할 수 있어요!

이런 분들께
추천드려요

안녕하세요
제이쓴입니다.