YouTube2026-03-03

기업이 꼭 알아야 할 ''온톨로지''의 모든 것 (김학래 중앙대 교수)

링크: https://youtu.be/W0MBC6in4Q4?si=bL0T5RcinLysRkF7

원문/원본: https://youtu.be/W0MBC6in4Q4기존 공개 버전: pogovet.com

🎬 기업이 꼭 알아야 할 '온톨로지'의 모든 것 (김학래 중앙대 교수)

▶️ 유튜브

원본 링크: https://youtu.be/W0MBC6in4Q4?si=bL0T5RcinLysRkF7

🖼️ 4컷 인포그래픽

💡 한 줄 결론

온톨로지는 LLM 성능을 조금 더 높이는 부가 기능이 아니라, 기업이 AI를 의사결정·실행 시스템에 붙일 때 맥락·판단 기준·행동 규칙을 명시해 대형 오류를 막는 가드레일에 가깝다. 에이전틱 AI와 피지컬 AI로 갈수록 투자 포인트는 평균 답변 품질보다 잘못된 판단의 비용을 얼마나 통제하느냐에 있다.

📌 핵심 요점

온톨로지는 엔터티의 의미, 속성, 관계를 명시적으로 정의해 LLM의 확률적 응답을 기업용 판단 기준으로 고정하는 역할을 한다.
기업 AI 성능이 기대에 못 미치는 이유는 데이터 부족만이 아니라 ‘재고 부족’, ‘위험’, ‘우선순위’ 같은 핵심 용어와 액션 조건이 구조화돼 있지 않기 때문이다.
그래프 RAG와 지식 그래프는 온톨로지를 검색·그라운딩 단계에 연결하는 유력한 방식이지만, 기반 그래프를 LLM이 부정확하게 자동 생성하면 환각 억제 장치가 오히려 환각 재주입 경로가 될 수 있다.
팔란티어는 온톨로지를 의미 정의에 그치지 않고 행동 실행과 피드백 수정까지 연결된 운영 시스템으로 확장해, 데이터 통합과 의사결정 자동화를 함께 다룬다.
에이전틱 AI와 피지컬 AI 환경에서는 잘못된 데이터와 누락된 우선순위가 연쇄 실행으로 증폭되므로, 온톨로지는 정확도 개선 툴보다 리스크 헤지와 사고 방지 인프라로 보는 편이 맞다.

🧠 상세 요약

1) 배경과 문제 정의

LLM은 문장을 잘 만들지만, 기업이 실제 의사결정과 실행에 붙이려면 “무엇을 같은 것으로 볼지”, “어떤 상태를 위험으로 정의할지”, “어떤 경우에 어떤 행동을 금지할지”가 먼저 구조화돼 있어야 한다. 이 영상은 바로 그 빈자리를 메우는 장치로서 온톨로지를 다루며, 검색·RAG·기업 시스템·에이전트·피지컬 AI까지 연결했을 때 왜 이것이 선택적 고급 기능이 아니라 운영 가드레일이 되는지를 짚는다.

2) 섹션별 상세 정리

온톨로지를 다시 꺼내야 하는 이유 [00:00]

영상은 AX의 출발점으로 AI 리터러시를 언급하지만, 실제 완성은 조직이 AI와 함께 일하는 방식의 재구성에 있다고 본다.
온톨로지는 종종 할루시네이션 개선이나 성능 향상 맥락에서 언급되지만 개념 장벽이 높아 실무자들이 접근을 포기하기 쉽다는 문제를 먼저 깐다.

데이터 체계화의 역사와 온톨로지의 출발점 [01:35]

문헌정보학은 책을 다루는 학문이 아니라, 오래전부터 데이터를 분류·표준화·연결해 온 정보 시스템의 전통과 맞닿아 있다고 설명한다.
그래서 온톨로지는 철학 용어를 빌려왔어도, 실무에서는 “세상을 기계가 처리할 수 있게 구조화하는 데이터 기술”로 이해하는 편이 훨씬 유효하다고 본다.

LLM의 확률과 온톨로지의 기준은 다르다 [03:05]

LLM은 단어와 문장 사이의 연관 확률을 바탕으로 답하지만, 온톨로지는 ‘서울은 도시’, ‘도시는 어떤 속성을 가진다’처럼 개념과 속성을 명시적으로 정의한다.
이 차이 때문에 LLM은 관점에 따라 답이 흔들릴 수 있지만, 온톨로지는 어떤 판단을 어떤 틀에서 해야 하는지 기준 자체를 고정할 수 있다.

상위 개념과 속성이 맥락을 만든다 [04:33]

‘서울’, ‘인천’, ‘용인’을 각각 따로 다루는 것이 아니라 모두 ‘도시’라는 클래스 아래 묶고, 도시가 가지는 공통 속성을 함께 정의해야 기계가 일관되게 해석할 수 있다.
결국 온톨로지는 단어 사전이 아니라 “무엇이 무엇인지, 무엇과 어떤 관계인지, 무엇을 같은 규칙으로 봐야 하는지”를 정리하는 맥락 프레임이다.

웹·검색·지식 그래프의 역사 속에서 본 온톨로지 [07:17]

팀 버너스리의 웹은 정보 간 연결이 핵심이었고, 이후 검색은 문자열 매칭에서 엔터티와 의미를 해석하는 방향으로 진화했다.
구글의 지식 패널은 검색어를 텍스트 덩어리로 보는 대신 사람·도시·제품 같은 엔터티 유형으로 먼저 해석한 뒤 구조화된 정보를 붙여주는 대표 사례로 제시된다.

온톨로지는 틀이고, 지식 그래프는 그 틀에 채워진 데이터다 [12:50]

전통적으로 온톨로지 구축은 도메인 전문가가 개념 구조를 정의하고, 구축 전문가가 이를 엔터티·속성·관계로 옮기는 수작업 비중이 큰 프로젝트였다.
실제 데이터가 그 틀에 들어가 작동하기 시작한 결과물이 지식 그래프이며, 즉 온톨로지는 빵 틀이고 지식 그래프는 그 틀에서 나온 빵이라는 비유가 나온다.

LLM 결합은 직접 연결보다 그래프 RAG가 현실적이다 [16:14]

온톨로지 DB를 LLM에 직접 붙이는 방식도 가능하지만, 현실에서는 문서 RAG보다 한 단계 더 구조화된 그래프 RAG나 지식 그래프 기반 접근이 더 유력하게 다뤄진다.
다만 그래프 RAG의 품질은 결국 기반 온톨로지와 지식 그래프의 신뢰도에 달려 있고, 이 부분이 부실하면 그라운딩도 겉보기 안정감만 줄 수 있다.

기업 AI의 병목은 데이터 양보다 판단 기준의 부재다 [22:51]

기업마다 ‘재고 부족’, ‘우선 처리’, ‘위험 고객’의 의미가 다르고, 같은 신호를 받아도 후속 액션이 달라지는데 이런 기준을 LLM 확률에 맡기면 운영 일관성이 무너진다.
그래서 기업용 AI는 데이터를 더 넣는 것만으로 해결되지 않고, 용어 정의·임계값·허용 행동·금지 조건을 온톨로지 형태로 구조화해야 실전 성능이 나온다고 본다.

팔란티어는 온톨로지를 실행 시스템으로 확장했다 [24:15]

팔란티어는 시멘틱 레이어로 의미를 정의하고, 키네틱 레이어로 실제 행동을 연결하며, 다이나믹 레이어로 실행 결과와 피드백을 다시 구조 수정에 반영하는 3계층을 제시한다.
이 관점에서 온톨로지는 정적인 데이터 모델이 아니라 SCM·CRM·ERP 같은 시스템을 묶어 의사결정과 실행을 잇는 운영 인터페이스에 가깝다.

진짜 투자 포인트는 성능 향상이 아니라 사고 방지다 [27:21]

온톨로지는 구축과 유지 비용이 크기 때문에 “답변 품질이 몇 퍼센트 좋아지나”로만 보면 투자 명분이 약할 수 있다.
그러나 기업 시스템에서 잘못된 판단이 대규모 운영 손실로 이어질 수 있다면, 온톨로지는 수익 증대 툴보다 대형 사고를 막는 보험·헤지 수단으로 봐야 한다는 논리가 나온다.

그래프 RAG도 자동 생성 환각 문제를 피하지 못한다 [29:35]

문서 기반 RAG보다 그래프 기반 접근이 더 정교할 수 있지만, 최근에는 지식 그래프나 온톨로지 초안 자체를 LLM이 자동 생성하는 사례가 많아졌다.
이 경우 환각을 줄이기 위해 붙인 장치의 근거층이 다시 환각일 수 있으므로, 생성 방법·검수 체계·도메인 전문가 개입 정도를 함께 검토해야 한다.

에이전틱 AI에서는 오류가 재앙으로 증폭된다 [31:49]

단순 질의응답 단계에서는 잘못된 답 하나로 끝날 수 있지만, 에이전틱 AI에서는 잘못된 데이터가 후속 액션과 다른 에이전트 호출을 거치며 연쇄적으로 확대될 수 있다.
타깃 캐나다 사례처럼 입력 데이터의 단위와 규격이 뒤틀리면 ERP가 있어도 재고 판단이 무너질 수 있고, 이런 상태에서 자동 실행까지 붙으면 “Garbage in, disaster out”이 된다는 경고가 나온다.

피지컬 AI는 우선순위 규칙의 부재를 더 위험하게 만든다 [37:01]

크루즈 자율주행 사례는 시스템이 사고 후 차량 이동이라는 절차를 수행했지만, 사람 생명 보호라는 최우선 규칙이 명시적으로 반영되지 않았을 때 어떤 문제가 생기는지 보여준다.
물리 세계에서는 평균 정확도보다 금지 조건, 우선순위, 예외 처리 규칙이 훨씬 중요해지며, 온톨로지적 접근은 이런 명시적 가드레일 설계와 맞닿아 있다.

도입은 전면 통합보다 골든 데이터 중심으로 가야 한다 [39:51]

기업 데이터는 대개 사일로로 나뉘어 있고, 처음부터 전사 통합 온톨로지를 설계하려 하면 POC에서 끝나기 쉽다.
따라서 여러 부서가 반복 참조하고, 잘못되면 손실이 크며, 재사용 가치가 높은 골든 데이터를 하나 골라 작게 시작한 뒤 점진적으로 확장하는 접근이 현실적이라는 제안으로 마무리된다.

✅ 액션 아이템

자사에서 LLM이 실제 판단에 개입하는 업무 1개를 골라, ‘재고 부족’, ‘위험 고객’, ‘이상 거래’처럼 애매한 핵심 용어 10개와 각 용어의 임계값·예외 규칙·후속 액션을 한 장짜리 정의서로 먼저 고정하라.
현재 운영 중인 문서 RAG 파일럿이 있다면, 동일한 질문셋으로 엔터티·관계 중심의 소규모 그래프 RAG를 병행 구축하고 답변 정확도보다 판단 일관성, 근거 추적성, 금지 규칙 위반률을 비교 측정하라.
SCM·CRM·ERP 중 두 시스템 이상에서 공통 참조하는 골든 데이터 1개를 선정해 클래스, 속성, 관계, 허용값, 금지값, 갱신 주체까지 포함한 온톨로지 초안을 설계하라.
LLM이 자동 생성한 분류 체계나 지식 그래프를 바로 운영계에 올리지 말고, 도메인 전문가 승인 필드와 자동 승인 가능 필드를 분리한 검수 워크플로를 설계하라.
에이전트가 실제 액션을 실행하는 프로세스에는 ‘실행 전 필수 확인 규칙’과 ‘절대 실행 금지 조건’을 별도 테이블로 만들어, 확률적 응답이 바로 발주·차단·이동 같은 행동으로 연결되지 않게 차단하라.

❓ 열린 질문

우리 조직에서 가장 먼저 온톨로지화해야 할 대상은 데이터가 가장 많은 영역이 아니라, 오판 시 손실이 가장 크고 여러 시스템이 반복 참조하는 골든 데이터일 텐데 그 후보를 지금 명확히 특정할 수 있는가?
그래프 RAG의 기반 그래프를 LLM이 자동 생성했다면, 우리는 어떤 샘플링 기준과 검수 지표로 그 그래프가 실제 환각 억제 장치인지 검증할 수 있는가?
팔란티어식으로 의미 정의를 행동 실행과 피드백 루프까지 연결하려면, 우리 시스템은 어떤 업무부터 ‘조회·추천’ 단계를 넘어 ‘실행 가능한 의사결정 체계’로 전환할 준비가 돼 있는가?
피지컬 AI나 에이전틱 AI로 갈수록 평균 정확도보다 우선순위 오류가 더 치명적이라면, 현재 우리 AI 시스템에는 사람이 반드시 우선해야 하는 금지 규칙과 예외 규칙이 명시적으로 존재하는가?