•
벡터를 분리해야한다. 일반적으로 CLOB,BLOB 도 동일
◦
검색할 때 불필요한 컬럼까지 조회하기 때문에..
•
성능이 좋으면 느리다.
◦
halfvec 또는 bit 사용
•
벡터도 인덱스를 생성해야한다.
•
요즘은 계층적 탐색 그래프 사용!!
◦
파셜 인덱스 + 파티션까지 사용하면 성능 향상
•
차원이 클수록 느리니…
•
pg_textsearch(BM25) extension
•
몇십억건 이상되면 전문 VectorDB 좋지 않나..
◦
But, 메모리를 늘려주면 PG도 가능하다. (Vector관련 데이터가 메모리에 로딩됨.)













