RDBMS는 사실을 저장하고, 지식 그래프는 의미와 이유를 설명한다.

박종영

#온톨로지

AI 시대 - 제조 데이터의 새로운 구조

RDBMS는 사실을 저장하고, 지식 그래프는 의미와 이유를 설명한다.

AI 시대에 데이터의 양은 폭발적으로 증가하고 있다.
ERP, MES, PLM, IoT 시스템은 매일 수많은 데이터를 생성한다.

하지만 많은 기업이 같은 질문을 한다.

데이터는 많은데 왜 지식은 만들어지지 않을까?

이 질문의 핵심에는 데이터 구조의 한계가 있다.

지금까지 대부분의 산업 시스템은
RDBMS(관계형 데이터베이스) 기반으로 만들어졌다.

하지만 AI 시대에는 점점 지식 그래프(Knowledge Graph) 가 중요한 역할을 하게 된다.

그 이유를 이해하기 위해
먼저 두 데이터 구조의 차이를 살펴보자.

 


지식 그래프란 무엇인가

지식 그래프는 정보를 개체(Entity)와 관계(Relationship) 의 네트워크로 표현한다.

데이터를 행과 열로 저장하는 대신
다음과 같은 트리플 구조로 저장한다.

주어 → 관계 → 목적어

예를 들어 제조 데이터를 표현하면 다음과 같다.

CNC_3호기 → hasComponent → 스핀들
스핀들 → hasSignal → 진동
진동 → exceeds → 허용기준
허용기준초과 → indicatesRisk → 베어링마모
베어링마모 → requires → 스핀들점검

이 구조는 자연스럽게 그래프를 형성한다.

  • 노드(Node) = 설비, 부품, 센서, 공정
     
  • 엣지(Edge) = 관계
     
  • 의미(Semantics) = 구조 자체에 포함
     

즉,

데이터 구조 자체가 의미를 담는다.


RDBMS란 무엇인가

관계형 데이터베이스(RDBMS)는 데이터를 테이블 구조로 저장한다.

  • 행(Row) = 레코드
     
  • 컬럼(Column) = 속성
     
  • 외래키(Foreign Key) = 테이블 연결
     

여러 데이터를 연결하려면 JOIN이 필요하다.


제조 데이터 예시

예를 들어 제조 공장에서 다음과 같은 데이터가 있다고 가정해 보자.

  • 작업지시
     
  • 설비
     
  • 공정
     

이 데이터는 RDBMS에서 보통 다음과 같이 저장된다.


1) 작업지시 테이블 (WorkOrders)

작업지시ID제품명 
1001PumpBody 
1002PumpCover 

2) 설비 테이블 (Machines)

설비ID설비명 
M01CNC_3호기 
M02CNC_5호기 

3) 공정 테이블 (Processes)

공정ID공정명 
P01Milling 
P02Drilling 

4) 생산이력 테이블 (ProductionHistory)

작업지시ID설비ID공정ID 
1001M01P01 
1002M02P02 

이 구조에서 데이터는 테이블 간 외래키로 연결된다.


문제점: 관계의 의미는 숨겨져 있다

RDBMS에서는 관계의 의미가 다음 요소에 숨어 있다.

  • 테이블 이름
     
  • 컬럼 이름
     
  • 외래키 제약
     
  • 애플리케이션 코드
     
  • 개발자 문서
     

예를 들어 데이터베이스는 다음 사실을 알지 못한다.

  • CNC_3호기가 밀링 공정을 수행한다는 의미
     
  • 특정 공정이 특정 설비 능력과 연결된다는 의미
     
  • 특정 설비 상태가 어떤 위험을 의미하는지
     

데이터베이스가 아는 것은 단 하나다.

machine_id 값이 machines 테이블에 존재해야 한다.

즉,

데이터는 연결되어 있지만
그 연결의 의미는 없다.


RDBMS에서의 관계 (암묵적 관계)

예를 들어 CNC 설비에서 진동이 증가한 상황을 보자.

sensor_log

log_idmachine_idsensorvalue 
101M01vibration3.2 
102M01vibration5.1 

maintenance_log

work_idmachine_idaction 
9001M01spindle_check 

사람은 이렇게 해석한다.

  • 진동이 증가했다
     
  • 같은 설비다
     
  • 이후 점검이 진행됐다
     

하지만 이 관계는 모두 사람의 머릿속에서 만들어진다.

데이터베이스에는

  • 진동 증가 → 스핀들 이상
     
  • 이상 → 점검 필요
     

라는 의미가 존재하지 않는다.


지식 그래프에서는 관계가 명시된다

지식 그래프에서는 같은 상황을 이렇게 표현한다.

CNC_3호기
└ hasComponent → 스핀들
└ hasSignal → 진동
└ RMSIncrease → +35%
└ exceeds → 허용기준
└ indicatesRisk → 베어링마모
└ requires → 스핀들점검

여기서 관계는 모두 명시적인 의미를 가진다.

  • hasComponent
     
  • hasSignal
     
  • indicatesRisk
     
  • requires
     

즉,

관계 자체가 데이터다.


AI가 이해할 수 있는 데이터

이 구조에서는 AI가 다음을 이해할 수 있다.

  • 진동 증가
     
  • 위험 발생
     
  • 원인 가능성
     
  • 필요한 조치
     

따라서 시스템은 다음 질문에 답할 수 있다.

  • 왜 CNC 3호기를 점검해야 하는가
     
  • 어떤 부품이 문제일 가능성이 있는가
     
  • 어떤 조치를 해야 하는가
     

이것이 AI 친화적 데이터 구조다.


한 줄 비교

구분RDBMS지식 그래프
관계암묵적명시적
의미사람이 해석데이터 자체
추론불가능가능
AI 활용제한적매우 높음

핵심 메시지

RDBMS는 사실을 저장하고,
지식 그래프는 의미와 이유를 설명한다.

또는

RDBMS는 데이터를 연결하지만
지식 그래프는 왜 그렇게 연결되는지 설명한다.

AI 시대의 데이터 경쟁력은
단순히 데이터를 많이 모으는 것이 아니다.

데이터를 의미 있는 지식으로 구조화하는 것이다.

그리고 그 구조의 핵심이 바로
지식 그래프다.


 #MES, #ERP, #PLM, #Ontology, #온톨로지, #KG, #'Knowledge Graph'

기업 홍보를 위한 확실한 방법
협회 홈페이지에 회사정보를 보강해 보세요.