🕚

코끼리를 냉장고에 집어넣기: PG_VECTOR — 윤명식

•

벡터를 분리해야한다. 일반적으로 CLOB,BLOB 도 동일

◦

검색할 때 불필요한 컬럼까지 조회하기 때문에..

•

성능이 좋으면 느리다.

◦

halfvec 또는 bit 사용

•

벡터도 인덱스를 생성해야한다.

•

요즘은 계층적 탐색 그래프 사용!!

◦

파셜 인덱스 + 파티션까지 사용하면 성능 향상

•

차원이 클수록 느리니…

•

pg_textsearch(BM25) extension

•

몇십억건 이상되면 전문 VectorDB 좋지 않나..

◦

But, 메모리를 늘려주면 PG도 가능하다. (Vector관련 데이터가 메모리에 로딩됨.)