1. 회사 및 서비스 소개 글로지(GloZ Inc.) 글로지(GloZ Inc.)는 OTT, 게임, 웹툰·웹소설, 더빙 등 콘텐츠 로컬라이제이션을 전문으로 하는 기업으로, 70개 이상의 언어와 190여 개국에 콘텐츠를 전달하고 있습니다. 서울, 캘리포니아, 싱가포르, 도쿄 4개 거점과 전 세계 210여 개 도시에 분포한 언어 전문가 네트워크를 기반으로, 글로벌 OTT 파트너 품질 평가에서 4년 연속 1위를 기록해 왔습니다. 글로지는 번역 […] || 1. 회사 및 서비스 소개
글로지(GloZ Inc.)
글로지(GloZ Inc.)는 OTT, 게임, 웹툰·웹소설, 더빙 등 콘텐츠 로컬라이제이션을 전문으로 하는 기업으로, 70개 이상의 언어와 190여 개국에 콘텐츠를 전달하고 있습니다. 서울, 캘리포니아, 싱가포르, 도쿄 4개 거점과 전 세계 210여 개 도시에 분포한 언어 전문가 네트워크를 기반으로, 글로벌 OTT 파트너 품질 평가에서 4년 연속 1위를 기록해 왔습니다.
글로지는 번역 관리 플랫폼 E’nuff, 영상 번역도구 WowSub, AI 기반 로컬라이제이션 워크스페이스 LABS를 자체 개발해 운영하고 있습니다. 이번 프로젝트는 이 중 E’nuff 플랫폼에 등록된 약 10만 명의 전문 번역가 풀을 대상으로, 기존 이력서 검색 시스템을 Amazon OpenSearch Service 기반으로 재설계·고도화한 것입니다.
2. 프로젝트 배경
비즈니스 요구사항
글로지는 글로벌 콘텐츠 제작사로부터 매주 수백 건의 번역 프로젝트를 수주합니다. 각 프로젝트는 단순한 언어쌍·도메인 외에도 CAT 도구 사용 경험, 특정 콘텐츠 작업 이력, 번역가의 거주 시간대(time zone), 희귀 언어 보유 여부 등 다양한 조건이 결합됩니다. 시간대는 특히 해외 콘텐츠 제작사와의 실시간 커뮤니케이션이 필요한 프로젝트에서 중요한 매칭 조건으로 작용합니다. 또한 일반 독자 시각의 번역물 평가처럼 특정 분야의 번역 경험이 오히려 없어야 하는 특수한 요건이 필요한 경우도 있습니다.
번역 프로젝트에서는 최종 투입 인원의 수 배수에 해당하는 후보군을 초기에 확보해야 합니다. 따라서 등록된 약 10만 명의 번역가 중에서 다양한 요건을 만족하는 후보를 충분한 규모로 빠르게 추려내는 것이 프로젝트 진행 속도를 결정하는 핵심 요소이며, 이를 위한 검색 시스템이 필요합니다.
기존 워크로드의 한계점
초기에는 PostgreSQL 기반 메타데이터 필터링과 자체 구축한 벡터 검색 라이브러리를 조합한 PoC 시스템을 운영했습니다. 하지만 다음과 같은 한계로 인해 프로덕션 환경에서 확장하기 어려웠습니다.
자체 구축 벡터 라이브러리 운영의 한계
PoC 단계에서 사용한 자체 벡터 검색 라이브러리는 프로토타입 검증에는 적합했지만 프로덕션 워크로드에는 다음과 같은 문제가 있었습니다.
벡터 검색에는 특화되어 있으나 키워드 검색(BM25)을 함께 처리할 수 없어, 하이브리드 검색을 구현하기 위해서는 별도의 검색 엔진이 필요합니다.
인덱스 갱신·모니터링·확장이 표준화되어 있지 않아 운영 부담이 큽니다.
다국어·한국어 처리 미흡
이력서는 한국어, 영어를 비롯해 일본어·중국어·프랑스어 등 30여 개 언어로 작성된 다국어 문서가 혼재되어 있습니다. 한국어 이력서는 형태소 분석 부재로 동의어·조사·어미 처리가 어려웠고, 다국어 임베딩 모델만으로는 의미 유사도는 잡아내더라도 CAT Tools 이름, 플랫폼명(Netflix, Disney+), 약어(MTPE, SDH) 등의 정확 매칭이 약하다는 한계가 있었습니다. 이 때문에 키워드 검색(BM25)과 의미 기반 검색을 결합한 하이브리드 검색이 필수적이었습니다.
해결하고자 한 구체적 과제
이러한 한계를 종합하여, 본 프로젝트는 다음과 같은 과제를 해결하는 것을 목표로 삼았습니다.
검색 정확도: 자연어 검색 시 nDCG@10 지표(Normalized Discounted Cumulative Gain — 상위 10개 검색 결과의 관련도를 정규화한 평가 지표)에 대해 0.90 이상을 확보합니다.
하이브리드 검색: