///
Search
📿

온톨로지 개념 및 Amazon Neptune 소개, 그래프 DB 아키텍처, 온톨로지 개발 프로세스 5단계

Why Ontology?

고객 측면

형식적 시맨틱 & 추론 능력
데이터 리니지 추적 → 규제 대응 용이
데이터 사일로 해소
URI기반 식별로 조인 없이 데이터 요소 통합
경쟁 우위
시맨틱 레이어 부재 시 에이전틱 AI가 잘못된 의도를 전파할 위험(HFS Research)

업체 측면

도메인에 대한 온톨로지 구축시 Asset으로 가져간다…?
AI 주도 개발 라이프사이클(AI-Driven Development Lifecycle (AI-DLC)) : 소프트웨어 엔지니어링의 재구상

용어 정의

온톨로지는 도구, 도구를 통한 산출물 → 지식 그래프
지식 그래프는 “시맨틱 웹”의 현대적 형태

지식 그래프의 역할

주요 목적은 조직의 집단 지식을 수집하고 유지하가는 것입니다.
지식 그래프를 구축하려면 정보를 모델링해야 합니다. → 온톨로지 가 필요합니다.
저장하고 조작하려면 그래프 데이터베이스가 필요합니다. → Amazon Neptune(?)

온톨로지 다루기

1.
사용: 기존 온톨로지를 사용하여 데이터 모델링 적합성을 신중히 평가 → 기존 온톨로지를 사용하면 좋겠으나 현실은….
2.
확장: 기존 온톨로지 확장
3.
정의: 자체 온톨로지 정의 더 많은 작업을 준비하세요.
→ 가급적이면 1,2번으로 진행하면 좋겠다…. 많은 삽질로 인해…

공유 공개 온톨로지 예시

상위
특수 목적
도메인 특화
Basic Formal Ontology(BFO) 매우 추상적
Dublic Core(DC) 문서 메타데이터
FIBO 금윤 개념
gist 실용적, 범용
PROV-O 출처와 계보
SNOMED CT 임상 용어
schema.org for annotating Web content
DCAT 카탈로그와 데이터셋 공유
CIDOC-CRM 문화유산
SKOC 분류 체계와 시소러스

주요 그래프 모델 및 프레임워크

Property Graph vs. RDF
→ 주로 속성 그래프(Property Graph) 기반으로 진행중…
→ Property Graph노드내 속성을 가지는 반면, RDF는 속성을 엣지로 빼놓는다. 그래서 RDF가 복잡.
→ RDF 장점은? 주로 관공서에서 만들어지고 있고 RDF로 구성시 RDF간 연계 가능.

프레임워크 선택

1.
쿼리에서 대상뿐만 아니라 경로도 알아야 합니까?
경로를 알아야 하는경우 → Property Graph
2.
두개 노드 사이에 엣지가 여러개 있어야 하나?
Property Graph
3.
데이터베이스 간에 그래프 데이터를 분할해야 하나?
RDF
4.
다른 사람들이 사용하거나 통합할 수 있도록 데이터 게시?
RDF
→ Wiki 사이트 백엔드에는 RDF로 구성되어있다.
→ 일반적인 기업에는 1,2번 항목에 해당되어 Property Graph기반으로…
→ 질의 응답은 Property Graph, 깊은 사고는 RDF

모델 구축

…..

일반 지침: 특정 라벨과 일반 라벨

좌측 같은경우는 라벨이 일반화 되어있어 4방향으로 찾아야 하고
우측 같은 경우는 특정 라벨만 찾으면 된다.

일반 지침: 노드 및 속성(공유 속성)

조회 vs.수정.

RAG vector DB 관련

RAG → 확률적, 온톨로지 → 확정적
Ontology RAG 장점
설명 가능성 → Explainable AI 가능
환각 가능성 현저히 낮아짐
Ontology RAG 단점
모델링 비용 높다.

별첨

질의에 대한 유사어에 대한 모델링을 할지 아니면 LLM에게 맡긴다.
일반명사에 대해 찾지 못하면 노드,엣지를 추가해줘야한다.