우리 공장의 AI, 왜 자꾸 엉뚱한 답을 할까?

박종영

우리 공장의 AI, 왜 자꾸 엉뚱한 답을 할까?

현장에서 마주한 불편한 진실

품질 불량이 발생했습니다. 원인을 찾기 위해 최신 AI 시스템에 물어봅니다:

"Lot A-2024-1127에서 표면 거칠기 불량이 발생했는데, 원인이 뭐지?"

AI가 그럴듯한 답변을 내놓습니다:

  • "과거 유사 사례를 보면 온도 조건이 문제였습니다"
  • "작년 B 라인에서 비슷한 증상이 있었습니다"

하지만 막상 확인해보니 전혀 다른 문제였습니다. 실제 원인은 새로 교체한 공구의 마모 상태였고, 온도와는 무관했습니다.

수백만 원을 들여 구축한 스마트팩토리 AI가 왜 이렇게 엉뚱한 답을 할까요?


제조 데이터의 특수성: 단순한 "문서"가 아니다

많은 제조 기업들이 AI를 도입하면서 범하는 실수가 있습니다. 제조 데이터를 "그냥 문서" 처럼 취급하는 것입니다.

제조 현장은 복잡한 관계망이다

한 개의 제품이 만들어지기까지:

설계 데이터 ←→ BOM (자재 명세서)
    ↓
공정 계획 ←→ 작업 표준서
    ↓
설비 가동 ←→ 작업자 스킬
    ↓
공정 파라미터 ←→ 환경 조건 (온도, 습도, 압력)
    ↓
품질 검사 ←→ 계측 데이터
    ↓
LOT 추적 ←→ 원자재 이력
    ↓
출하 ←→ 고객 클레임
    ↓
AS 이력 ←→ 재발 방지 대책

이 모든 단계가 유기적으로 연결되어 있습니다. 한 단계의 문제는 다음 단계로 전파되고, 때로는 3~4단계를 거슬러 올라가야 근본 원인을 찾을 수 있습니다.

그런데 현재 대부분의 제조 AI는 이 "관계"를 무시합니다.


Vector 검색: "비슷한 불량 사례" 찾기의 함정

현재 많은 스마트팩토리 솔루션들이 사용하는 방식입니다.

- 실제 사례: 용접 불량 원인 분석

상황:

  • 자동차 부품 용접부에 기공(porosity) 발생
  • AI 시스템에 원인 분석 요청

Vector 검색 방식의 동작:

1. "기공", "용접", "불량" 키워드로 과거 문서 검색
2. 의미적으로 "비슷한" 100개 문서 발견
   - 2년 전 A라인 용접 불량 보고서
   - 3개월 전 외주 업체 품질 이슈
   - 작년 용접 교육 자료
   - 경쟁사 기술 동향 보고서
   - ...

3. AI가 이 중에서 "그럴싸한" 답변 생성
   "실드가스 유량이 부족했을 가능성이 높습니다"

결과:

  • 실드가스는 정상이었음
  • 실제 원인은 새로 입고된 모재의 표면 수분이었음
  • 하지만 AI는 모재 LOT과 용접 불량의 인과관계를 추적하지 못함

왜 실패했을까?

Vector 검색은:

  • - "언제" 생산되었는지 모름
  • - "어떤 설비"에서 만들어졌는지 모름
  • - "어떤 원자재 LOT"를 썼는지 모름
  • - "누가" 작업했는지 모름
  • - "어떤 공정 조건"이었는지 모름

그냥 "기공이라는 단어가 들어간 비슷한 문서"만 찾을 뿐입니다.


Knowledge Graph: 제조 DNA를 추적한다

이제 완전히 다른 접근을 봅시다. 지식 그래프 기반 제조 온톨로지입니다.

같은 사례, 다른 접근

Knowledge Graph 방식의 동작:

1. 불량품 식별: 제품 Serial No. P-2024-1127-0042

2. 시스템이 자동으로 관계망 추적:

   제품 P-2024-1127-0042는
   ├─ 생산일시: 2024-11-27 14:23
   ├─ 생산 설비: 용접 로봇 WR-05
   ├─ 작업자: 김철수 (경력 5년)
   ├─ 용접 공정 파라미터:
   │   ├─ 전류: 180A (정상)
   │   ├─ 전압: 25V (정상)
   │   └─ 실드가스 유량: 15L/min (정상)
   ├─ 사용 모재 LOT: M-2024-1125-03
   │   ├─ 입고일: 2024-11-25
   │   ├─ 공급사: B사
   │   ├─ 입고 검사: 합격
   │   └─ 표면 처리: ⚠️ 전처리 공정 변경됨 (11/25부터)
   └─ 환경 조건:
       ├─ 온도: 23°C
       └─ 습도: 65% ⚠️ (전날 대비 15% 상승)

3. 시스템이 인과관계 추론:
   
   "LOT M-2024-1125-03 + 습도 65% 
    → 모재 표면 수분 흡착 가능성"

4. 검증:
   
   같은 LOT를 사용한 다른 제품 확인
   → 10개 중 7개에서 동일 기공 발생
   → 원인 특정 완료

5. 자동 조치:
   
   - 해당 LOT 사용 전체 제품 격리
   - 전처리 공정 복원 지시
   - 습도 관리 기준 업데이트

결과:

  • 정확한 원인 특정: 30분
  • 동일 위험 제품 식별: 32개
  • 재발 방지 대책 수립: 즉시
  • 품질 비용 절감: 약 3,000만원

제조 온톨로지: 공장의 DNA 지도

Knowledge Graph가 강력한 이유는 제조 도메인 온톨로지 때문입니다.

온톨로지란?

쉽게 말해 "제조 현장의 모든 개념과 관계를 정의한 지식 체계"입니다.

turtle

# 제조 온톨로지 예시 (간단 버전)

제품(Product)
 ├─ 생산된_곳(producedAt) → 설비(Equipment)
 ├─ 생산한_사람(producedBy) → 작업자(Operator)  
 ├─ 사용한_자재(usedMaterial) → 원자재(RawMaterial)
 ├─ 적용된_공정(appliedProcess) → 공정(Process)
 └─ 품질_결과(hasQuality) → 품질데이터(QualityData)

공정(Process)
 ├─ 필요한_파라미터(requiresParameter) → 공정파라미터(Parameter)
 ├─ 사용하는_설비(usesEquipment) → 설비(Equipment)
 └─ 영향받는_환경(affectedByEnvironment) → 환경조건(Environment)

불량(Defect)
 ├─ 발생한_제품(occurredIn) → 제품(Product)
 ├─ 불량_유형(defectType) → 불량코드(DefectCode)
 ├─ 원인(causedBy) → 원인(RootCause)
 └─ 조치사항(correctedBy) → 시정조치(CorrectiveAction)

추론(Inference)의 힘

온톨로지의 진짜 위력은 자동 추론입니다.

규칙 예시:

IF 제품에 표면_불량 발생
AND 해당 제품의 모재_LOT = X
AND 동일 시간대 생산된 다른 제품들도 동일 불량 발생
THEN 원인은 "모재 품질 이슈"일 가능성 95%

시스템이 스스로 논리적으로 추론합니다. 사람이 일일이 지정하지 않아도 됩니다.


실전 적용: 페인트 도장 공정 AI

제가 실제 설계한 시스템 사례를 소개합니다.

배경

  • 자동차 부품 도장 공정
  • 도장 불량률 약 3.5%
  • 목표: 1.5% 이하로 감소

Vector 기반 접근의 실패 (1차 시도)

AI에게 과거 3년치 도장 불량 보고서 학습
→ "습도가 높으면 불량률 증가" 같은 뻔한 답변
→ 실제 불량률 개선: 0.2%p (미미)
→ 투자 대비 효과 없음

Knowledge Graph 기반 재설계 (2차 시도)

온톨로지 구축:

도장_작업
 ├─ 스프레이건(SprayGun)
 │   ├─ 노즐_직경
 │   ├─ 분사_압력
 │   ├─ 분사_패턴
 │   └─ 유지보수_이력
 ├─ 도료(Paint)
 │   ├─ LOT 번호
 │   ├─ 점도
 │   ├─ 온도
 │   └─ 개봉_후_경과시간
 ├─ 작업자(Operator)
 │   ├─ 숙련도
 │   ├─ 교육_이력
 │   └─ 최근_작업_품질
 ├─ 환경(Environment)
 │   ├─ 부스_온도
 │   ├─ 부스_습도
 │   └─ 에어플로우
 └─ 제품(Product)
     ├─ 표면_전처리_상태
     └─ 형상_복잡도

실시간 추론 시스템:

# 작업 시작 전 AI 판단 예시

작업 시작 시점:
 - 도료 LOT: P-2024-1127 (개봉 후 3.5시간)
 - 작업자: 이영희 (숙련도 A, 최근 품질 우수)
 - 습도: 68% ⚠️
 - 스프레이건 WR-05: 마지막 세척 후 50시간 경과 ⚠️

시스템 추론:
 → "습도 68% + 건 세척 미흡" 조합은
 → 과거 데이터상 불량률 12% 초과 이력 있음
 
자동 조치:
 ✓ 작업 대기 지시
 ✓ 스프레이건 긴급 세척 요청 발송
 ✓ 제습 시스템 가동
 ✓ 작업자에게 상황 설명 + 대안 작업 할당

결과:

  • - 불량률: 3.5% → 0.9% (목표 초과 달성)
  • - 도료 낭비: 30% 감소
  • - 재작업 비용: 월 1,200만원 절감
  • - 작업자 만족도: 향상 (불필요한 재작업 감소)

전 생명주기 트레이서빌리티: 설계부터 AS까지

제조의 진짜 경쟁력은 전체 데이터 흐름 통합에서 나옵니다.

데이터 흐름 시나리오

[설계 단계]
3D CAD 설계 → 공차 정보 → BOM 생성
         ↓
      온톨로지에 등록
         ↓
[생산 계획]
생산 계획 시스템 ← 설계 제약 조건 자동 반영
"이 부품은 열처리 후 48시간 이내 조립 필수"
         ↓
[제조 실행]
MES 시스템 ← 실시간 공정 파라미터 수집
온톨로지 ← 설비, 자재, 작업자, 환경 데이터 통합
         ↓
[품질 검사]
불량 발생 → 온톨로지 자동 분석 
→ 근본 원인 추적 (설계 단계까지)
         ↓
[출하]
제품 Serial No. ← 전체 제조 이력 연결
         ↓
[AS 서비스]
고객 클레임 → Serial No. 조회
→ 생산 당시 모든 조건 확인
→ 동일 조건 제품 예방 조치
         ↓
[피드백]
설계 개선 ← AS 데이터 자동 반영

Vector만 쓰면?

각 단계가 고립된 섬처럼 동작합니다:

  • - 설계팀은 현장 불량을 모름
  • - 생산팀은 설계 의도를 모름
  • - 품질팀은 AS 데이터를 활용 못 함
  • - AS팀은 생산 조건을 확인 못 함

Knowledge Graph를 쓰면?

모든 단계가 하나의 지식망으로 연결됩니다:

  • -  설계 변경 → 즉시 생산 계획 반영
  • -  품질 불량 → 설계 단계까지 추적
  • -  AS 클레임 → 동일 위험 제품 즉시 식별
  • -  지속적 개선 → 자동화된 피드백 루프

비용과 효과: 실전 ROI

"그래서 얼마나 들고, 얼마나 효과 있나요?"

초기 투자 (중소 제조기업 기준)

1. 온톨로지 설계: 2~3개월, 약 5,000만원
2. 시스템 구축: 3~4개월, 약 1.5억원
3. 데이터 연동: 2개월, 약 3,000만원
-----------------------------------
총 7~9개월, 약 2.3억원

연간 효과 (실제 사례 기반)

절감 효과:
 ✓ 불량 비용 감소: 연 1.2억원
 ✓ 재작업 비용 감소: 연 8,000만원
 ✓ 원자재 낭비 감소: 연 4,000만원
 ✓ 클레임 대응 비용: 연 3,000만원
-----------------------------------
총 연 2.7억원

ROI: 1년 이내 회수

Vector만 쓰면?

초기 투자: 약 8,000만원 (저렴함)

효과:
 ✓ 불량 예측 정확도: 60~70%
 ✓ 실질적 불량 감소: 10~15%
 ✓ 연간 절감: 약 5,000만원

문제:
 ✗ 근본 원인 파악 불가
 ✗ 재발 방지 어려움
 ✗ 지속적 개선 한계

시작하는 방법: 단계별 로드맵

Phase 1: 파일럿 (3개월)

목표: 핵심 공정 1개 적용

1단계: 도메인 온톨로지 설계
 - 작업 표준서 분석
 - 핵심 개념 정의
 - 관계 모델링

2단계: 데이터 수집 자동화
 - 설비 센서 연동
 - MES 데이터 연계
 - 수작업 데이터 최소화

3단계: 추론 엔진 구축
 - 규칙 정의 (10~20개)
 - 실시간 모니터링
 - 알람 시스템

Phase 2: 확장 (6개월)

목표: 전 공정 확대 + 타 시스템 연동

- 설계 PLM 연동
- 품질 QMS 연동  
- 출하 WMS 연동
- AS CRM 연동

Phase 3: 고도화 (지속)

목표: AI 기반 자율 최적화

- 공정 파라미터 자동 튜닝
- 예지 보전 고도화
- 에너지 최적화
- 자율 의사결정 지원

마치며: 제조의 미래는 "관계"를 이해하는 AI

40년 넘게 지식 관리 분야를 이끌어온 마이클 이안토스카의 경고는 명확합니다:

"Vector 검색만으로는 제조 혁신이 불가능하다. 제조 현장은 복잡한 관계망이고, 그 관계를 이해하는 시스템만이 진짜 가치를 만든다."

제조업의 특수성:

  • - 인과관계가 명확해야 함 (재발 방지)
  • - 추적성이 필수 (규제 대응)
  • - 실시간 판단이 중요 (불량 예방)
  • - 정확성이 생명 (비용 직결)

이 모든 것은 "관계"를 이해하는 Knowledge Graph에서만 가능합니다.


당신의 공장은 어느 단계인가요?

Level 1: 데이터 수집

  • "일단 데이터는 모으고 있어요"
  • → Vector 검색도 아직 이름

Level 2: AI 도입

  • "AI 챗봇 만들었는데 자꾸 틀려요"
  • → Vector 검색 단계

Level 3: 지능화

  • "원인 분석하고 예방까지 자동으로 돼요"
  • → Knowledge Graph 단계

Level 4: 자율화

  • "시스템이 스스로 최적화해요"
  • → AI + KG 통합 단계

다음 단계로 가고 싶으신가요?

제조 온톨로지 구축은 어렵지 않습니다. 다만 제대로 이해하고 시작해야 합니다.

그럴싸한 AI 에서 "정말 똑똑한 AI" 누구와 같이 하시겠습니까?

기업 홍보를 위한 확실한 방법
협회 홈페이지에 회사정보를 보강해 보세요.