1예측 정비 KPI 프레임워크
예측 정비 AI의 성과를 측정하기 위한 핵심 KPI(Key Performance Indicator)를 정의합니다. 기술적 KPI(모델 정확도)와 비즈니스 KPI(비용 절감)를 모두 추적해야 합니다. 좋은 KPI는 측정 가능하고, 행동으로 연결되며, 비즈니스 목표와 정렬되어야 합니다.
# ============================================
# 예측 정비 KPI 프레임워크
# ============================================
# KPI 범주
범주 = {기술, 운영, 재무, 신뢰성}
# KPI 정의 목록
KPI_정의 = {
# 기술적 KPI
정밀도: {공식: TP/(TP+FP), 목표: >85%, 높을수록좋음},
재현율: {공식: TP/(TP+FN), 목표: >90%, 높을수록좋음},
RUL_오차: {공식: mean(|예측-실제|), 목표: <3일, 낮을수록좋음},
# 운영 KPI
비계획_가동중단: {목표: <4시간/월, 낮을수록좋음},
MTBF: {공식: 가동시간/고장수, 목표: >2000시간, 높을수록좋음},
MTTR: {공식: 수리시간/수리수, 목표: <2시간, 낮을수록좋음},
# 재무 KPI
정비비용_절감률: {공식: (기준-현재)/기준, 목표: >25%},
예방된_생산손실: {목표: >5천만원/월}
}
# --------------------------------------------
# 정밀도/재현율 계산
# --------------------------------------------
함수 정밀도_재현율_계산(예측들, 실제들):
TP = FP = FN = TN = 0
각 (예측, 실제) 쌍에 대해:
만약 예측=고장 AND 실제=고장: TP += 1
만약 예측=고장 AND 실제=정상: FP += 1
만약 예측=정상 AND 실제=고장: FN += 1
아니면: TN += 1
정밀도 = TP / (TP + FP)
재현율 = TP / (TP + FN)
F1 = 2 × 정밀도 × 재현율 / (정밀도 + 재현율)
반환 {정밀도, 재현율, F1, TP, FP, FN}
| KPI 범주 | KPI 명 | 목표 | 측정 주기 |
|---|---|---|---|
| 기술 | 고장 예측 정밀도 | >85% | 월간 |
| 기술 | RUL 예측 오차(MAE) | <3일 | 월간 |
| 운영 | 비계획 가동중단 | <4시간/월 | 주간 |
| 신뢰성 | MTBF | >2000시간 | 분기 |
| 재무 | 정비 비용 절감 | >25% | 연간 |
2비용 절감 측정
예측 정비 AI의 실제 비용 절감 효과를 정량화합니다. 비계획 가동중단 감소, 부품 재고 최적화, 정비 인력 효율화, 에너지 절감 등 다양한 영역에서 절감 효과가 발생합니다. 베이스라인 대비 개선을 측정하여 ROI를 산출합니다.
# ============================================
# 예측 정비 비용 절감 계산기
# ============================================
# 비용 파라미터
파라미터 = {
시간당_생산가치: 500만원,
시간당_인건비: 5만원,
긴급수리_배수: 2.5배,
재고유지_비용률: 25%/년
}
# --------------------------------------------
# 가동중단 절감 계산
# --------------------------------------------
함수 가동중단_절감(기준_시간, 현재_시간):
절감_시간 = 기준 - 현재
생산손실_방지 = 절감_시간 × 시간당_생산가치
긴급수리_절감 = 절감_시간 × 인건비 × (배수-1)
반환 {절감_시간, 생산손실_방지, 긴급수리_절감, 총합}
# --------------------------------------------
# 재고 최적화 절감
# --------------------------------------------
함수 재고_절감(기준_재고가치, 최적화_재고가치):
재고_감소 = 기준 - 최적화
연간_유지비_절감 = 재고_감소 × 유지_비용률
반환 {재고_감소, 연간_유지비_절감}
# --------------------------------------------
# 총 ROI 계산
# --------------------------------------------
함수 ROI_계산(연간_절감액, 도입비용, 연간_운영비):
순_연간_이익 = 절감액 - 운영비
ROI% = (순_이익 / 도입비용) × 100
회수기간 = 도입비용 / 순_이익
# 5년 NPV (할인율 10%)
NPV = -도입비용
각 연도(1~5)에 대해:
NPV += 순_이익 / (1.1 ^ 연도)
반환 {연간절감, 운영비, 순이익, ROI%, 회수기간, NPV}
ROI 벤치마크: 산업 평균 데이터에 따르면, 예측 정비 도입 기업은 평균적으로 정비 비용 25-30% 절감, 비계획 가동중단 70-75% 감소, 설비 수명 20-25% 연장 효과를 달성합니다.
3모델 성능 모니터링
ML 모델의 성능은 시간이 지남에 따라 저하(Model Drift)될 수 있습니다. 운영 조건 변화, 설비 노후화, 센서 교체 등이 원인입니다. 지속적인 모니터링과 재학습 파이프라인이 필요합니다.
# ============================================
# 예측 정비 모델 성능 모니터링
# ============================================
# 설정
알람_임계값 = 10% # 성능 저하 시 알람
# 성능 스냅샷 구조
스냅샷 = {모델ID, 버전, 타임스탬프, 메트릭들, 샘플수, 드리프트점수}
# --------------------------------------------
# 기준 성능 설정
# --------------------------------------------
함수 기준_설정(모델ID, 메트릭):
기준_메트릭[모델ID] = {메트릭, 타임스탬프}
# --------------------------------------------
# 현재 성능 평가
# --------------------------------------------
함수 성능_평가(모델ID, 예측들, 실제들):
# 모델 유형에 따른 메트릭 계산
만약 분류모델(0/1):
메트릭 = 분류_메트릭(예측, 실제)
아니면 (회귀모델):
메트릭 = 회귀_메트릭(예측, 실제)
# 드리프트 감지
드리프트 = 드리프트_감지(모델ID, 메트릭)
# 성능 저하 알람
만약 드리프트 > 임계값:
알람 = "모델 {ID} 성능 {X}% 저하 - 재학습 권장"
반환 {메트릭, 드리프트점수, 알람}
# --------------------------------------------
# 드리프트 감지
# --------------------------------------------
함수 드리프트_감지(모델ID, 현재_메트릭):
기준 = 기준_메트릭[모델ID]
주요_메트릭 = f1_score 또는 mae
만약 f1_score (높을수록 좋음):
드리프트 = (기준 - 현재) / 기준
만약 mae (낮을수록 좋음):
드리프트 = (현재 - 기준) / 기준
반환 max(0, 드리프트)
4지속적 개선 프로세스
예측 정비 시스템의 성과를 지속적으로 개선하기 위한 PDCA(Plan-Do-Check-Act) 사이클을 구현합니다. 정기적인 성과 리뷰, 모델 재학습, 프로세스 최적화를 통해 ROI를 극대화합니다.
# ============================================
# 예측 정비 지속적 개선 프레임워크 (PDCA)
# ============================================
# 개선 범주
범주 = {모델, 데이터, 프로세스, 통합}
# 개선 활동 구조
개선활동 = {ID, 범주, 설명, 예상효과, 우선순위(1-5),
상태, 담당자, 기한, 실제효과}
# --------------------------------------------
# 정기 성과 리뷰
# --------------------------------------------
함수 성과_리뷰(기간, KPI_결과, 목표):
갭_분석 = {}
개선_기회 = []
각 KPI에 대해:
갭 = 목표 - 실적
갭_분석[KPI명] = {목표, 실적, 갭, 달성률}
만약 갭 > 0: # 목표 미달
개선기회 = 개선활동_식별(KPI명, 갭)
개선_기회.추가(개선기회)
리뷰 저장
반환 {기간, 갭_분석, 개선_기회}
# --------------------------------------------
# KPI별 개선 활동 매핑
# --------------------------------------------
KPI별_개선 = {
정밀도: {범주: 모델, 설명: "FP 분석 및 임계값 조정"},
재현율: {범주: 모델, 설명: "놓친 고장 분석 및 피처 추가"},
가동중단: {범주: 프로세스, 설명: "근본 원인 분석"}
}
# --------------------------------------------
# 개선 활동 보고서
# --------------------------------------------
함수 보고서_생성():
반환 {
총_활동수,
상태별_집계,
범주별_집계,
고우선순위_활동 (우선순위 >= 4),
기한초과_활동
}
5성과 대시보드
예측 정비 성과를 실시간으로 시각화하는 대시보드 설계입니다. 경영진, 정비 관리자, 데이터 과학자 등 역할별로 다른 뷰를 제공합니다. KPI 트렌드, 알람 현황, 비용 절감 누적 효과 등을 한눈에 파악할 수 있습니다.
# ============================================
# 예측 정비 성과 대시보드
# (역할별 뷰 제공)
# ============================================
# --------------------------------------------
# 경영진 뷰 - 핵심 재무 KPI
# --------------------------------------------
함수 경영진_뷰():
반환 {
요약: {
연간_누적절감: 8.5억원,
ROI: 245%,
회수달성: True,
모니터링_설비수: 1250대
},
트렌드: {
월별_절감: [65, 72, 68, 75, 82, 79] 백만원,
가동중단: [12, 8, 6, 5, 4, 3] 시간
},
비교: {
기준대비: {가동중단 -72%, 비용 -28%},
전년대비: {가동중단 -45%, 비용 -18%}
}
}
# --------------------------------------------
# 정비 관리자 뷰 - 운영 KPI
# --------------------------------------------
함수 정비관리자_뷰():
반환 {
활성_알람: {critical: 2, warning: 8, info: 15},
위험_설비: [{id, RUL, HI}, ...],
예정_정비: 12건 (7일내),
작업지시_백로그: 5건,
MTBF_트렌드: [1800, 1950, 2100, ...]시간
}
# --------------------------------------------
# 데이터 과학자 뷰 - 모델 성능
# --------------------------------------------
함수 데이터과학자_뷰():
반환 {
모델_성능: {
이상탐지기: {정밀도, 재현율, F1, 드리프트, 상태},
RUL예측기: {MAE, RMSE, MAPE, 드리프트, 상태},
HI모델: {상관계수, 단조성, 드리프트, 상태}
},
재학습_대기열: [모델명들],
피처_중요도_변화: {진동_rms: +0.02, ...}
}
6성공 사례와 교훈
예측 정비 AI 프로젝트의 성공과 실패 사례에서 얻은 핵심 교훈입니다. 기술적 완성도보다 비즈니스 가치 창출에 집중하고, 작은 범위에서 빠르게 검증한 후 확대하는 것이 중요합니다.
| 성공 요인 | 설명 | 권장 사항 |
|---|---|---|
| 명확한 비즈니스 목표 | 기술이 아닌 비용 절감/안전에 집중 | 도입 전 ROI 목표 합의 |
| 데이터 품질 우선 | 모델보다 데이터가 중요 | 센서 점검, 레이블링 투자 |
| 현장 협업 | 정비팀 참여와 신뢰 구축 | 파일럿 단계부터 협업 |
| 점진적 확대 | 작게 시작, 성공 후 확대 | 1-2개 설비로 PoC 시작 |
| 지속적 운영 | 배포 후 모니터링/개선 | 전담 팀 구성 |
흔한 실패 원인: 1) 데이터 품질 문제 무시 2) 현장 정비팀 배제 3) 과도한 초기 범위 4) 배포 후 방치 5) 비현실적 ROI 기대. 파일럿 프로젝트에서 이러한 문제를 조기에 발견하고 해결하세요.
Chapter 5 완료: 예측 정비와 설비 AI의 전체 파이프라인을 학습했습니다. 진동/음향/온도 분석부터 RUL 예측, CMMS 통합, ROI 측정까지 - 이제 실제 프로젝트에 적용할 준비가 되었습니다. 다음 챕터에서는 로봇과 자율 시스템 AI를 다룹니다.