클라우드101(Cloud101)
/
밋업, 웨비나, 컨퍼런스 자료
/
WOOWACON 2025
/
AI 데이터 분석가 '물어보새', 그다음: 더 넓고 깊은 지식 공유하기
Search
Share
🎙️
AI 데이터 분석가 '물어보새', 그다음: 더 넓고 깊은 지식 공유하기
직전 3개 대화 사용
G-Eval
•
인력: 데이터 과학자 4명+엔지니어 1명 (5명)
•
모델: Claude, GPT(별도의 튜닝 X)
•
현재는 LangGraph 기반으로 진행중인데, 걷어내면 레이턴시가 줄지 않을까 고민중..
•
Window 3개로 설정한 이유는 테스트를 통해서 정함.
•
평가
◦
TISTORY
G-EVAL: NLG Evaluation using GPT-4 with Better Human Alignment