← 홈으로
YouTube2026-03-03
기업이 꼭 알아야 할 ''온톨로지''의 모든 것 (김학래 중앙대 교수)
링크: https://youtu.be/W0MBC6in4Q4?si=bL0T5RcinLysRkF7
원문/원본: https://youtu.be/W0MBC6in4Q4기존 공개 버전: pogovet.com
🎬 기업이 꼭 알아야 할 '온톨로지'의 모든 것 (김학래 중앙대 교수)
▶️ 유튜브
🖼️ 4컷 인포그래픽

💡 한 줄 결론
온톨로지는 LLM 성능을 조금 더 높이는 부가 기능이 아니라, 기업이 AI를 의사결정·실행 시스템에 붙일 때 맥락·판단 기준·행동 규칙을 명시해 대형 오류를 막는 가드레일에 가깝다. 에이전틱 AI와 피지컬 AI로 갈수록 투자 포인트는 평균 답변 품질보다 잘못된 판단의 비용을 얼마나 통제하느냐에 있다.
📌 핵심 요점
- 온톨로지는 엔터티의 의미, 속성, 관계를 명시적으로 정의해 LLM의 확률적 응답을 기업용 판단 기준으로 고정하는 역할을 한다.
- 기업 AI 성능이 기대에 못 미치는 이유는 데이터 부족만이 아니라 ‘재고 부족’, ‘위험’, ‘우선순위’ 같은 핵심 용어와 액션 조건이 구조화돼 있지 않기 때문이다.
- 그래프 RAG와 지식 그래프는 온톨로지를 검색·그라운딩 단계에 연결하는 유력한 방식이지만, 기반 그래프를 LLM이 부정확하게 자동 생성하면 환각 억제 장치가 오히려 환각 재주입 경로가 될 수 있다.
- 팔란티어는 온톨로지를 의미 정의에 그치지 않고 행동 실행과 피드백 수정까지 연결된 운영 시스템으로 확장해, 데이터 통합과 의사결정 자동화를 함께 다룬다.
- 에이전틱 AI와 피지컬 AI 환경에서는 잘못된 데이터와 누락된 우선순위가 연쇄 실행으로 증폭되므로, 온톨로지는 정확도 개선 툴보다 리스크 헤지와 사고 방지 인프라로 보는 편이 맞다.
🧠 상세 요약
1) 배경과 문제 정의
LLM은 문장을 잘 만들지만, 기업이 실제 의사결정과 실행에 붙이려면 “무엇을 같은 것으로 볼지”, “어떤 상태를 위험으로 정의할지”, “어떤 경우에 어떤 행동을 금지할지”가 먼저 구조화돼 있어야 한다. 이 영상은 바로 그 빈자리를 메우는 장치로서 온톨로지를 다루며, 검색·RAG·기업 시스템·에이전트·피지컬 AI까지 연결했을 때 왜 이것이 선택적 고급 기능이 아니라 운영 가드레일이 되는지를 짚는다.
2) 섹션별 상세 정리
- 온톨로지를 다시 꺼내야 하는 이유 [00:00]
- 영상은 AX의 출발점으로 AI 리터러시를 언급하지만, 실제 완성은 조직이 AI와 함께 일하는 방식의 재구성에 있다고 본다.
- 온톨로지는 종종 할루시네이션 개선이나 성능 향상 맥락에서 언급되지만 개념 장벽이 높아 실무자들이 접근을 포기하기 쉽다는 문제를 먼저 깐다.
- 데이터 체계화의 역사와 온톨로지의 출발점 [01:35]
- 문헌정보학은 책을 다루는 학문이 아니라, 오래전부터 데이터를 분류·표준화·연결해 온 정보 시스템의 전통과 맞닿아 있다고 설명한다.
- 그래서 온톨로지는 철학 용어를 빌려왔어도, 실무에서는 “세상을 기계가 처리할 수 있게 구조화하는 데이터 기술”로 이해하는 편이 훨씬 유효하다고 본다.
- LLM의 확률과 온톨로지의 기준은 다르다 [03:05]
- LLM은 단어와 문장 사이의 연관 확률을 바탕으로 답하지만, 온톨로지는 ‘서울은 도시’, ‘도시는 어떤 속성을 가진다’처럼 개념과 속성을 명시적으로 정의한다.
- 이 차이 때문에 LLM은 관점에 따라 답이 흔들릴 수 있지만, 온톨로지는 어떤 판단을 어떤 틀에서 해야 하는지 기준 자체를 고정할 수 있다.
- 상위 개념과 속성이 맥락을 만든다 [04:33]
- ‘서울’, ‘인천’, ‘용인’을 각각 따로 다루는 것이 아니라 모두 ‘도시’라는 클래스 아래 묶고, 도시가 가지는 공통 속성을 함께 정의해야 기계가 일관되게 해석할 수 있다.
- 결국 온톨로지는 단어 사전이 아니라 “무엇이 무엇인지, 무엇과 어떤 관계인지, 무엇을 같은 규칙으로 봐야 하는지”를 정리하는 맥락 프레임이다.
- 웹·검색·지식 그래프의 역사 속에서 본 온톨로지 [07:17]
- 팀 버너스리의 웹은 정보 간 연결이 핵심이었고, 이후 검색은 문자열 매칭에서 엔터티와 의미를 해석하는 방향으로 진화했다.
- 구글의 지식 패널은 검색어를 텍스트 덩어리로 보는 대신 사람·도시·제품 같은 엔터티 유형으로 먼저 해석한 뒤 구조화된 정보를 붙여주는 대표 사례로 제시된다.
- 온톨로지는 틀이고, 지식 그래프는 그 틀에 채워진 데이터다 [12:50]
- 전통적으로 온톨로지 구축은 도메인 전문가가 개념 구조를 정의하고, 구축 전문가가 이를 엔터티·속성·관계로 옮기는 수작업 비중이 큰 프로젝트였다.
- 실제 데이터가 그 틀에 들어가 작동하기 시작한 결과물이 지식 그래프이며, 즉 온톨로지는 빵 틀이고 지식 그래프는 그 틀에서 나온 빵이라는 비유가 나온다.
- LLM 결합은 직접 연결보다 그래프 RAG가 현실적이다 [16:14]
- 온톨로지 DB를 LLM에 직접 붙이는 방식도 가능하지만, 현실에서는 문서 RAG보다 한 단계 더 구조화된 그래프 RAG나 지식 그래프 기반 접근이 더 유력하게 다뤄진다.
- 다만 그래프 RAG의 품질은 결국 기반 온톨로지와 지식 그래프의 신뢰도에 달려 있고, 이 부분이 부실하면 그라운딩도 겉보기 안정감만 줄 수 있다.
- 기업 AI의 병목은 데이터 양보다 판단 기준의 부재다 [22:51]
- 기업마다 ‘재고 부족’, ‘우선 처리’, ‘위험 고객’의 의미가 다르고, 같은 신호를 받아도 후속 액션이 달라지는데 이런 기준을 LLM 확률에 맡기면 운영 일관성이 무너진다.
- 그래서 기업용 AI는 데이터를 더 넣는 것만으로 해결되지 않고, 용어 정의·임계값·허용 행동·금지 조건을 온톨로지 형태로 구조화해야 실전 성능이 나온다고 본다.
- 팔란티어는 온톨로지를 실행 시스템으로 확장했다 [24:15]
- 팔란티어는 시멘틱 레이어로 의미를 정의하고, 키네틱 레이어로 실제 행동을 연결하며, 다이나믹 레이어로 실행 결과와 피드백을 다시 구조 수정에 반영하는 3계층을 제시한다.
- 이 관점에서 온톨로지는 정적인 데이터 모델이 아니라 SCM·CRM·ERP 같은 시스템을 묶어 의사결정과 실행을 잇는 운영 인터페이스에 가깝다.
- 진짜 투자 포인트는 성능 향상이 아니라 사고 방지다 [27:21]
- 온톨로지는 구축과 유지 비용이 크기 때문에 “답변 품질이 몇 퍼센트 좋아지나”로만 보면 투자 명분이 약할 수 있다.
- 그러나 기업 시스템에서 잘못된 판단이 대규모 운영 손실로 이어질 수 있다면, 온톨로지는 수익 증대 툴보다 대형 사고를 막는 보험·헤지 수단으로 봐야 한다는 논리가 나온다.
- 그래프 RAG도 자동 생성 환각 문제를 피하지 못한다 [29:35]
- 문서 기반 RAG보다 그래프 기반 접근이 더 정교할 수 있지만, 최근에는 지식 그래프나 온톨로지 초안 자체를 LLM이 자동 생성하는 사례가 많아졌다.
- 이 경우 환각을 줄이기 위해 붙인 장치의 근거층이 다시 환각일 수 있으므로, 생성 방법·검수 체계·도메인 전문가 개입 정도를 함께 검토해야 한다.
- 에이전틱 AI에서는 오류가 재앙으로 증폭된다 [31:49]
- 단순 질의응답 단계에서는 잘못된 답 하나로 끝날 수 있지만, 에이전틱 AI에서는 잘못된 데이터가 후속 액션과 다른 에이전트 호출을 거치며 연쇄적으로 확대될 수 있다.
- 타깃 캐나다 사례처럼 입력 데이터의 단위와 규격이 뒤틀리면 ERP가 있어도 재고 판단이 무너질 수 있고, 이런 상태에서 자동 실행까지 붙으면 “Garbage in, disaster out”이 된다는 경고가 나온다.
- 피지컬 AI는 우선순위 규칙의 부재를 더 위험하게 만든다 [37:01]
- 크루즈 자율주행 사례는 시스템이 사고 후 차량 이동이라는 절차를 수행했지만, 사람 생명 보호라는 최우선 규칙이 명시적으로 반영되지 않았을 때 어떤 문제가 생기는지 보여준다.
- 물리 세계에서는 평균 정확도보다 금지 조건, 우선순위, 예외 처리 규칙이 훨씬 중요해지며, 온톨로지적 접근은 이런 명시적 가드레일 설계와 맞닿아 있다.
- 도입은 전면 통합보다 골든 데이터 중심으로 가야 한다 [39:51]
- 기업 데이터는 대개 사일로로 나뉘어 있고, 처음부터 전사 통합 온톨로지를 설계하려 하면 POC에서 끝나기 쉽다.
- 따라서 여러 부서가 반복 참조하고, 잘못되면 손실이 크며, 재사용 가치가 높은 골든 데이터를 하나 골라 작게 시작한 뒤 점진적으로 확장하는 접근이 현실적이라는 제안으로 마무리된다.
✅ 액션 아이템
- 자사에서 LLM이 실제 판단에 개입하는 업무 1개를 골라, ‘재고 부족’, ‘위험 고객’, ‘이상 거래’처럼 애매한 핵심 용어 10개와 각 용어의 임계값·예외 규칙·후속 액션을 한 장짜리 정의서로 먼저 고정하라.
- 현재 운영 중인 문서 RAG 파일럿이 있다면, 동일한 질문셋으로 엔터티·관계 중심의 소규모 그래프 RAG를 병행 구축하고 답변 정확도보다 판단 일관성, 근거 추적성, 금지 규칙 위반률을 비교 측정하라.
- SCM·CRM·ERP 중 두 시스템 이상에서 공통 참조하는 골든 데이터 1개를 선정해 클래스, 속성, 관계, 허용값, 금지값, 갱신 주체까지 포함한 온톨로지 초안을 설계하라.
- LLM이 자동 생성한 분류 체계나 지식 그래프를 바로 운영계에 올리지 말고, 도메인 전문가 승인 필드와 자동 승인 가능 필드를 분리한 검수 워크플로를 설계하라.
- 에이전트가 실제 액션을 실행하는 프로세스에는 ‘실행 전 필수 확인 규칙’과 ‘절대 실행 금지 조건’을 별도 테이블로 만들어, 확률적 응답이 바로 발주·차단·이동 같은 행동으로 연결되지 않게 차단하라.
❓ 열린 질문
- 우리 조직에서 가장 먼저 온톨로지화해야 할 대상은 데이터가 가장 많은 영역이 아니라, 오판 시 손실이 가장 크고 여러 시스템이 반복 참조하는 골든 데이터일 텐데 그 후보를 지금 명확히 특정할 수 있는가?
- 그래프 RAG의 기반 그래프를 LLM이 자동 생성했다면, 우리는 어떤 샘플링 기준과 검수 지표로 그 그래프가 실제 환각 억제 장치인지 검증할 수 있는가?
- 팔란티어식으로 의미 정의를 행동 실행과 피드백 루프까지 연결하려면, 우리 시스템은 어떤 업무부터 ‘조회·추천’ 단계를 넘어 ‘실행 가능한 의사결정 체계’로 전환할 준비가 돼 있는가?
- 피지컬 AI나 에이전틱 AI로 갈수록 평균 정확도보다 우선순위 오류가 더 치명적이라면, 현재 우리 AI 시스템에는 사람이 반드시 우선해야 하는 금지 규칙과 예외 규칙이 명시적으로 존재하는가?
