Why Ontology?
고객 측면
•
형식적 시맨틱 & 추론 능력
•
데이터 리니지 추적 → 규제 대응 용이
•
데이터 사일로 해소
◦
URI기반 식별로 조인 없이 데이터 요소 통합
•
경쟁 우위
◦
시맨틱 레이어 부재 시 에이전틱 AI가 잘못된 의도를 전파할 위험(HFS Research)
업체 측면
•
도메인에 대한 온톨로지 구축시 Asset으로 가져간다…?
•
AI 주도 개발 라이프사이클(AI-Driven Development Lifecycle (AI-DLC))
: 소프트웨어 엔지니어링의 재구상
용어 정의
•
온톨로지는 도구, 도구를 통한 산출물 → 지식 그래프
•
지식 그래프는 “시맨틱 웹”의 현대적 형태
지식 그래프의 역할
•
주요 목적은 조직의 집단 지식을 수집하고 유지하가는 것입니다.
•
지식 그래프를 구축하려면 정보를 모델링해야 합니다.
→ 온톨로지 가 필요합니다.
•
저장하고 조작하려면 그래프 데이터베이스가 필요합니다.
→ Amazon Neptune(?)
온톨로지 다루기
1.
사용: 기존 온톨로지를 사용하여 데이터 모델링 적합성을 신중히 평가
→ 기존 온톨로지를 사용하면 좋겠으나 현실은….
2.
확장: 기존 온톨로지 확장
3.
정의: 자체 온톨로지 정의 더 많은 작업을 준비하세요.
→ 가급적이면 1,2번으로 진행하면 좋겠다…. 많은 삽질로 인해…
공유 공개 온톨로지 예시
상위 | 특수 목적 | 도메인 특화 |
Basic Formal Ontology(BFO)
매우 추상적 | Dublic Core(DC)
문서 메타데이터 | FIBO
금윤 개념 |
gist
실용적, 범용 | PROV-O
출처와 계보 | SNOMED CT
임상 용어 |
schema.org
for annotating Web content | DCAT
카탈로그와 데이터셋 공유 | CIDOC-CRM
문화유산 |
SKOC
분류 체계와 시소러스 | SCOR
물류
blog.naver.com | |
주요 그래프 모델 및 프레임워크
Property Graph vs. RDF
→ 주로 속성 그래프(Property Graph) 기반으로 진행중…
→ Property Graph노드내 속성을 가지는 반면, RDF는 속성을 엣지로 빼놓는다. 그래서 RDF가 복잡.
→ RDF 장점은? 주로 관공서에서 만들어지고 있고 RDF로 구성시 RDF간 연계 가능.
프레임워크 선택
1.
쿼리에서 대상뿐만 아니라 경로도 알아야 합니까?
•
경로를 알아야 하는경우
→ Property Graph
2.
두개 노드 사이에 엣지가 여러개 있어야 하나?
•
Property Graph
3.
데이터베이스 간에 그래프 데이터를 분할해야 하나?
•
RDF
4.
다른 사람들이 사용하거나 통합할 수 있도록 데이터 게시?
•
RDF
→ Wiki 사이트 백엔드에는 RDF로 구성되어있다.
→ 일반적인 기업에는 1,2번 항목에 해당되어 Property Graph기반으로…
→ 질의 응답은 Property Graph, 깊은 사고는 RDF
모델 구축
…..
일반 지침: 특정 라벨과 일반 라벨
•
좌측 같은경우는 라벨이 일반화 되어있어 4방향으로 찾아야 하고
•
우측 같은 경우는 특정 라벨만 찾으면 된다.
일반 지침: 노드 및 속성(공유 속성)
•
조회 vs.수정.
RAG vector DB 관련
•
RAG → 확률적, 온톨로지 → 확정적
•
Ontology RAG 장점
◦
설명 가능성 → Explainable AI 가능
◦
환각 가능성 현저히 낮아짐
•
Ontology RAG 단점
◦
모델링 비용 높다.
별첨
•
질의에 대한 유사어에 대한 모델링을 할지 아니면 LLM에게 맡긴다.
•
일반명사에 대해 찾지 못하면 노드,엣지를 추가해줘야한다.




