1이상 탐지의 설명 가능성 문제
딥러닝 기반 이상 탐지 모델은 높은 정확도를 보이지만, "왜 이것이 이상인가?"를 설명하지 못하는 블랙박스 문제가 있습니다. 제조 현장에서는 이상 탐지보다 원인 파악과 조치 방안이 더 중요합니다.
| 현장 질문 | 기존 ML 모델 | LLM 통합 시스템 |
|---|---|---|
| "왜 이상으로 판정?" | 이상 점수만 제공 | 기여 요인 자연어 설명 |
| "원인이 뭐야?" | 제공 불가 | 과거 사례 기반 원인 추론 |
| "뭘 해야 해?" | 제공 불가 | 조치 가이드 자동 생성 |
| "비슷한 사례 있어?" | 검색 어려움 | 유사 이력 RAG 검색 |
| "언제부터 이상?" | 탐지 시점만 제공 | 시계열 추이 해석 |
2XAI + LLM 통합 아키텍처
Explainable AI(XAI) 기법과 LLM을 결합하여 이상 탐지 결과를 사람이 이해할 수 있는 설명으로 변환합니다.
XAI + LLM 이상 설명 시스템
센서 데이터
온도, 진동, 전류, 압력
→
이상 탐지
Autoencoder, Isolation Forest
→
XAI 분석
SHAP, LIME, Attention
이상 점수
0.87
기여도
온도:35%, 진동:28%, 전류:22%
LLM 설명 생성
과거 이력 (RAG), 설비 매뉴얼, 도메인 지식
자연어 설명 + 조치
3SHAP/LIME 결과의 LLM 해석
SHAP(SHapley Additive exPlanations)이나 LIME은 특성별 기여도를 제공하지만, 숫자만으로는 현장에서 활용하기 어렵습니다. LLM이 이를 해석합니다.
XAI 결과 → LLM 프롬프트
# System Prompt
당신은 제조 설비 이상 분석 전문가입니다.
XAI 분석 결과를 현장 엔지니어가 이해할 수 있게 설명하세요.
# User Prompt
[이상 탐지 결과]
- 설비: CNC 선반 #3
- 이상 점수: 0.87 (임계값: 0.65)
- 탐지 시간: 2024-01-15 14:32:15
[SHAP 기여도 분석]
- 스핀들 진동 (X축): +0.32 (정상 대비 2.1배)
- 스핀들 온도: +0.28 (78°C, 정상 65°C)
- 가공 전류: +0.18 (정상 범위 초과)
- 이송 속도: +0.09
- 윤활유 압력: -0.02 (정상)
[과거 유사 사례] (RAG 검색 결과)
- 2023-08: 스핀들 베어링 마모로 진동 증가
- 2023-11: 공구 마모로 전류/진동 동시 상승
[요청]
1. 이상 원인 추정 (가능성 높은 순)
2. 즉시 조치 사항
3. 추가 확인 필요 항목
LLM 생성 설명
## 이상 분석 결과
### 1. 추정 원인 (가능성순)
1순위: 스핀들 베어링 마모/손상 (70%)
- 근거: X축 진동이 정상 대비 2.1배 상승
- 온도 상승(78°C)이 마찰열 증가 시사
- 2023-08 유사 사례와 패턴 일치
2순위: 공구 마모/파손 (20%)
- 근거: 가공 전류 상승
- 그러나 2023-11 사례 대비 전류 상승폭 작음
3순위: 척킹 불량 (10%)
- 진동 패턴이 회전 동기 성분 확인 필요
### 2. 즉시 조치 사항
⚠️ 가공 중단 권고 (설비 손상 방지)
1. 스핀들 정지 후 수동 회전 점검
- 이상 소음/진동 유무 확인
2. 공구 상태 육안 검사
- 마모/치핑 여부
3. 베어링 윤활 상태 확인
### 3. 추가 확인 항목
- [ ] 진동 스펙트럼 분석 (베어링 결함 주파수)
- [ ] 열화상 카메라로 스핀들 온도 분포 확인
- [ ] 최근 공구 교체 이력 확인
- [ ] 가공 프로그램 변경 여부
4조치 가이드 자동 생성
LLM은 설비 매뉴얼, 과거 정비 이력, 도메인 지식을 종합하여 상황별 맞춤 조치 가이드를 생성합니다.
| 이상 유형 | 자동 생성 조치 | 참조 소스 |
|---|---|---|
| 베어링 이상 | 윤활 점검 → 진동 측정 → 교체 판단 | 정비 매뉴얼, 과거 이력 |
| 온도 이상 | 냉각 시스템 점검 → 부하 감소 → 정지 | 설비 사양, 안전 규정 |
| 전류 이상 | 부하 확인 → 공구 점검 → 모터 진단 | 전기 도면, 정비 이력 |
| 압력 이상 | 누설 점검 → 밸브 확인 → 펌프 진단 | 배관도, P&ID |
주의: LLM 생성 조치 가이드는 참고용입니다. 안전 관련 작업(전기, 고압, 회전체)은 반드시 자격을 갖춘 인원이 수행해야 하며, 작업 전 LOTO(잠금/꼬리표) 절차를 준수하세요.
5피드백 루프와 지속적 개선
LLM의 설명과 조치 권고에 대한 현장 피드백을 수집하여 시스템을 지속적으로 개선합니다.
피드백 기반 개선 사이클
이상 발생
LLM 설명 생성
현장 조치
실제 원인 확인
피드백 기록
LLM 예측 정확도, 조치 유효성, 개선 제안
지식 베이스 업데이트
새로운 이상 패턴, 원인-증상 매핑
피드백 항목 예시:
이상 ID: ANM-2024-0115-001
LLM 예측: 베어링 마모 (70%)
실제 원인: 베어링 마모 (일치)
조치 효과: 베어링 교체 후 정상 복구
개선 제안: 진동 임계값 2.0배에서 1.8배로 조정
LLM 예측: 베어링 마모 (70%)
실제 원인: 베어링 마모 (일치)
조치 효과: 베어링 교체 후 정상 복구
개선 제안: 진동 임계값 2.0배에서 1.8배로 조정
6실시간 알림과 대시보드 통합
이상 탐지 시 LLM 설명과 함께 실시간 알림을 발송하고, 대시보드에서 상세 분석 결과를 확인할 수 있습니다.
Slack 알림 메시지 예시
🚨 이상 탐지 알림
설비: CNC 선반 #3 (Line-A)
시간: 2024-01-15 14:32:15
이상 점수: 0.87 (임계값: 0.65)
📊 주요 이상 요인
1. 스핀들 진동 (X축) - 정상 대비 2.1배
2. 스핀들 온도 - 78°C (정상 65°C)
3. 가공 전류 - 범위 초과
🔍 추정 원인
스핀들 베어링 마모/손상 가능성 높음
⚡ 권장 조치
가공 중단 후 스핀들 수동 점검 권고
[상세 분석 보기] [이력 확인] [담당자 호출]
효과: 이상 탐지 설명 AI 도입으로 이상 대응 시간 40% 단축, 오경보(False Positive) 대응 비용 60% 감소, 신규 엔지니어 온보딩 기간 단축 효과를 기대할 수 있습니다.