Search

MemAware – AI 에이전트가 "내가 뭘 알고 있는지"를 아는지 측정하는 벤치마크

URL
날짜
2026/03/27
생성 일시
2026/03/27 12:20
태그
GeekNews
AI 에이전트 메모리 시스템을 만들면서 기존 벤치마크들의 공통적인 한계를 발견했습니다. LoCoMo, LongMemEval, MemoryAgentBench 등 기존 메모리 벤치마크는 전부 같은 걸 테스트합니다: "과거 대화에서 답을 찾을 수 있는가?" 이건 검색 엔진 성능 테스트이지, 메모리 시스템 테스트가 아닙니다. ||