본문 바로가기 주메뉴 바로가기

수학기반 딥러닝을 활용한 이상데이터 자동 검출 알고리즘 개발 및 활용

구글로 퍼가기 프린트하기

수학기반 딥러닝을 활용한 이상데이터 자동 검출 알고리즘 개발 및 활용은

4차 산업시대의 우리는 과거 아날로그 환경에서 생성되던 데이터에 비교할 수 없을 정도로 방대하고 다양한 데이터 환경에 살고 있다. 센싱(sensing) 기술의 발달로 데이터의 수집이 용이해지고 수집할 수 있는 데이터의 종류가 다양해졌다. 게다가 컴퓨터의 계산능력의 발전으로 우리가 처리할 수 있는 데이터의 양도 방대해졌다. 빅데이터 환경에서 수학과 딥러닝은 산업 및 공공 등 여러 다양한 분야에 걸쳐 데이터를 분석하고 산업문제를 해결하고 있다.

연구소개

수학기반 딥러닝을 활용한 이상데이터 자동 검출 알고리즘 개발 및 활용의 배경

배경

4차 산업시대의 우리는 과거 아날로그 환경에서 생성되던 데이터에 비교할 수 없을 정도로 방대하고 다양한 데이터 환경에 살고 있다. 센싱(sensing) 기술의 발달로 데이터의 수집이 용이해지고 수집할 수 있는 데이터의 종류가 다양해졌다. 게다가 컴퓨터의 계산능력의 발전으로 우리가 처리할 수 있는 데이터의 양도 방대해졌다. 빅데이터 환경에서 수학과 딥러닝은 산업 및 공공 등 여러 다양한 분야에 걸쳐 데이터를 분석하고 산업문제를 해결하고 있다.

연구의 필요성

  • 4차 산업혁명의 키워드인 생산 자율화(autonomous)를 구현. 스마트 팩토리(smart factory) 구축을 통해 제조업 생산 효율과 국가 경쟁력 향상

    -주어진 데이터에서 경향이 다른 이상데이터를 자동으로 검출하는 딥러닝 알고리즘을 개발하고자 한다. 이 알고리즘의 첫 번째 적용분야는 CNC(computerized numeric control) 공작기계에서 발생한 데이터이다. 컴퓨터 수치 제어 방식의 자동 생산 공장에서 생산품을 생산 할 때 로드 데이터가 생성된다. 이 데이터를 바탕으로 정상 생산품의 데이터와 확연하게 차이가 나는 불량 생산품의 데이터, 이상데이터를 자동으로 감지하여 불량이나 기계의 이상 여부를 자동으로 감지할 수 있는 생산 자율화 기술을 구축하려고 한다.

  • 이상데이터 자동 검출 알고리즘을 적용할 수 있는 다른 분야를 조사, 범용적으로 일반화 및 고도화

    -본 연구로부터 데이터의 가치를 확대하고 4차 산업시대의 데이터 경쟁력을 갖추고자 한다. 여러 산업분야의 센싱데이터에 알고리즘을 적용하여 타당성을 조사하고 이를 바탕으로 이상데이터 검출 기법의 활용 범위를 확장한다. 그뿐만 아니라 이 과정에서 필요한 이론 연구를 병행, 기존 모델을 모방하는 것만이 아닌 새로운 수리 확률 모델 딥러닝 알고리즘 이론 개발을 목표로 한다.

연구의 필요성

4차 산업시대 ICT 생태계 구축에 필수 불가결한 기술: 실제 산업현장이나 현실에서 발생하는 데이터는 대부분 라벨이 되어있지 않고 라벨을 붙이기 위해 큰 비용이 발생한다. 또한, 각 그룹의 데이터 비율이 유사하지 않다. 실제 산업에 알고리즘을 적용하고 응용하기 위해서는 이렇게 편중된 데이터에서 이상데이터를 찾아야 한다. 또한 정상 생산품의 데이터 패턴은 비교적 일정한 데 반해 불량 생산품의 데이터(이상데이터)의 패턴은 일정하지 않다. 기존의 지도학습을 통한 학습을 통해서는 학습된 이상데이터는 찾을 수 있지만 다른 형태의 이상데이터는 검출하기 어렵다. 그래서 라벨이 되어있지 않은 데이터와 비율이 일정하지 않은 데이터에서 데이터를 클러스터링(군집화)하는 비지도학습에 대한 연구, 즉 정상데이터에서 이상데이터를 검출하는 알고리즘에 대한 연구가 필요하다. 

연구내용

첫 번째 연구 목표인 CNC 공정 데이터를 이용하여 일반데이터와 경향이 다른 이상데이터 검출 알고리즘을 개발하기 위해 세운 추진 전략은 다음과 같다.

  • 알려진 비지도학습 중 클러스터링 기법 이론 연구, 적용
  • 적용결과를 바탕으로 장&단점 및 특성 분석
  • 다양한 공정에 적용 가능한 이상데이터 검출 딥러닝 알고리즘 개발
  • 딥러닝 알고리즘 수학적 검증 및 체계화

비지도학습 중 K-means, 병합군집, DBSCAN 등 여러 클러스터링 알고리즘이 존재하고 많은 데이터 과학자들이 이를 사용하고 있다. 하지만 정상데이터가 불량보다 훨씬 많은 본 연구에는 적용하기가 쉽지 않다(하나의 클러스터링 방법으로 여러 공정데이터를 적용하기 어렵다). 알려진 클러스터링 알고리즘을 적용하면서 어떠한 요인이 실질적으로 작용한 것인지 확인하여 개발하려는 모델에 참조할 계획이다.

두 번째 목표인 이상데이터 검출 알고리즘의 범용 적용을 위한 고도화 작업 세부 추진 방법은 다음과 같다.

  • 개발한 알고리즘이 사용 가능한 산업 분야 조사 및 적용
  • 범용 알고리즘으로의 확장을 위한 일반화 및 고도화 작업

산업수학혁신센터에서 기업과의 업무를 통해서 배운 산업 지식(domain knowledge)을 바탕으로 이상데이터 검출 알고리즘이 필요한 분야를 조사하고 이를 적용하기 위한 고도화 작업을 진행할 예정이다.

기대효과

CNC 공작기계와 ICT 기술 융합을 통해 공정 및 품질의 실시간 관리 시스템을 구축하여 실질적인 스마트 팩토리 실현: 국·내외를 포함해서 CNC 공정에 특화된 불량감지 및 예측 솔루션을 개발해서 운영해 제조 공장의 생산성에 기여하고 있는 기업들은 여럿 존재한다. 하지만 취합한 데이터를 빅데이터 플랫폼에 저장하여 분석하거나 자율적으로 이상데이터를 감지하는 시스템은 구축되어 있지 않다. 본 연구목표인 자동으로 이상데이터를 검출하는 기법은 자동화를 넘어선 자율화 시스템 구축에 있다는 점에서 연구개발의 중요성이 강조된다. 본 연구개발의 결과를 바탕으로 데이터로부터 경향이 다른 이상데이터를 공정과 무관하게 찾는다면 불량 생산품의 데이터를 자동 추출 및 검출함으로써 생산 효율성을 향상할 수 있다. 이상데이터 자동 검출 알고리즘의 확장 가능성: 단일공정이 아닌 여러 공정에 적용 가능한 알고리즘의 개발이기 때문에 본 연구자는 연구결과를 다른 산업 분야에도 적용할 수 있을 것으로 본다.

산업수학혁신센터 pin김민중 (선임연구원)
연락처 031-5171-5203
camp - Center for Applications of Mathematical Principles

이 페이지에서 제공하는 정보에 대해 만족하십니까?

컨텐츠담당자         최종수정일 2018-06-05
QUICK MENU
공지사항
NIMS 소식
채용공고
보도자료
입찰공고
IMAGINARY 체험
TOP