※ 기업체와의 비밀유지동의서에 의한 비밀유지 의무로 인하여 개략적인 내용만 서술하였습니다.
1. 기업소개
- 2019년 현재 부산광역시 전 지역 약 143만 세대의 도시가스를 공급하고 있으며, 고객만족 경영에 중점을 두어 2003년부터 2018년까지 16년 연속 고객만족도 조사 도시가스 부문 1위를 수상
2. 산업문제
- 매월 가스 사용량을 검침/청구를 시행하는 가운데 계량기 고장 또는 고객 미검침에 따른 청구오류 등 현재 운영 중인 검침 기반 방법에 대한 고객 불만이 지속적으로 발생
- 과거 데이터 분석을 통해 검침 오류 및 이상 세대를 판별하고 미래의 사용량을 예측하여 미검침 세대에 대한 신뢰도 높은 추정 값을 얻는 문제를 해결하기 위해 연구소에 의뢰함
- 산업문제를 아래와 같이 2가지로 나누어 분석을 시도함
- 딥러닝 모델을 활용한 도시가스 사용량 예측 알고리즘 개발
- 규칙 기반의 도시가스 검침 검증 및 이상 세대 분류
3. 제시된 해결 방안
- 예측 알고리즘 개발을 위한 데이터 전처리 과정에서 사용값 표준편차가 크거나 결측 값이 존재하는 세대를 제외하고 확률분포의 거리를 계산하여 평균과 유사한 확률 분포를 가진 세대를 추출하여 분석을 진행하였음
- 세대마다 개별 모델을 만들어 예측하는 것은 거의 불가능하고 또한 1개의 모델로 전체 세대의 12개월을 모두 예측하는 것은 신뢰도가 낮을 것으로 예상되어, 시간과 온도를 고려한 월별 모델을 개발하여 미래 사용량을 예측함
- 사용량이 급격히 증가하는 세대, 2년동안 사용량이 동일하거나 ±10% 범위 내인 세대, 평균 사용량과 사용량 거리가 먼 세대, 전반적으로 높은 사용량을 유지하는 세대 등 규칙기반 알고리즘 적용을 통한 이상 데이터 분류 모델 개발
4. 활용 계획 및 기타 성과
- 기존 전년 동월 방법 같은 통합적인 사용량 예측 방법이 아닌 각 세대의 과거 데이터 패턴분석을 통해 신뢰도 높은 사용량 예측 알고리즘을 개발하여 고객들의 불만이 감소할 것으로 기대
- 1D CNN 딥러닝을 활용한 신규 추정검침값 선정 Logic 개발. 기존 전년동월 방법 대비 28% 정확도 향상 및 LSTM 등 타 시계열 딥러닝 모델 대비 빠른 처리 속도를 얻음
- 이상세대를 분류하는 규칙기반 알고리즘은 기업 관계자가 쉽게 parameter를 조절할 수 있어 상황에 맞는 분류 작업이 가능함
- 데이터 전처리 과정에서 발견된 이상 데이터의 일부는 실제 이상여부 확인 후 개선 예정
- 개발된 1D CNN Deep Learning 모델 / 규칙기반 알고리즘은 추후 업무 시스템 반영 예정