수학기반 딥러닝을 활용한 이상데이터 자동 검출 알고리즘 개발 및 활용

한국연구재단 2017년 전략과제(4차 산업혁명과 수학)

  • 기간: 2017년 9월 ~ 2021년 8월 (총 48개월)
  • 연구비: 2.2억원

배경

  • 4차 산업시대의 우리는 과거 아날로그 환경에서 생성되던 데이터에 비교할 수 없을 정도로 방대하고 다양한 데이터 환경에 살고 있다. 센싱(sensing) 기술의 발달로 데이터의 수집이 용이해지고 수집할 수 있는 데이터의 종류가 다양해졌다. 게다가 컴퓨터 계산 능력의 발전으로 우리가 처리할 수 있는 데이터의 양도 방대해졌다. 빅데이터 환경에서 수학과 딥러닝은 산업 및 공공 등 여러 다양한 분야에 걸쳐 데이터를 분석하고 산업문제를 해결하고 있다. 본 연구를 통해 4차 산업혁명의 키워드인 생산 자율화(autonomous)를 구현하고 스마트 팩토리(smart factory) 기술 개발을 통해 제조업 생산 효율과 국가 경쟁력 향상을 목표로 한다.

연구 목표

  • 주어진 데이터에서 경향이 다른 이상데이터를 자동으로 검출하는 딥러닝 알고리즘 개발
    • 이 알고리즘의 첫 번째 적용분야는 CNC(computerized numeric control) 공작기계에서 발생한 데이터이다. CNC 공정에서 생산품을 생산 할 때 로드 데이터가 생성된다. 이 데이터를 바탕으로 정상 생산품의 데이터와 확연하게 차이가 나는 불량 생산품의 데이터, 이상데이터를 자동으로 감지하여 불량이나 기계의 이상 여부를 자동으로 감지할 수 있는 기술을 구축하려고 한다.
  • 이상데이터 자동 검출 알고리즘을 적용할 수 있는 다른 분야를 조사, 범용적으로 일반화 및 고도화
    • 본 연구로부터 데이터의 가치를 확대하고 4차 산업시대의 데이터 경쟁력을 갖추고자 한다. 여러 산업분야의 센싱데이터에 알고리즘을 적용하여 타당성을 조사하고 이를 바탕으로 이상데이터 검출 기법의 활용 범위를 확장한다. 그뿐만 아니라 이 과정에서 필요한 이론 연구를 병행, 기존 모델을 모방하는 것만이 아닌 새로운 수리 확률 모델 딥러닝 알고리즘 이론 개발을 목표로 한다.

연구의 필요성

  • 4차 산업시대 ICT 생태계 구축에 필수 불가결한 기술: 실제 산업현장이나 현실에서 발생하는 데이터는 대부분 라벨이 되어있지 않고 라벨을 붙이기 위해 큰 비용이 발생한다. 또한, 각 그룹의 데이터 비율이 유사하지 않다. 실제 산업에 알고리즘을 적용하고 응용하기 위해서는 이렇게 편중된 데이터에서 이상데이터를 찾아야 한다. 또한 정상 생산품의 데이터 패턴은 비교적 일정한 데 반해 불량 생산품의 데이터(이상데이터)의 패턴은 일정하지 않다. 기존의 지도학습을 통한 학습을 통해서는 학습된 이상데이터는 찾을 수 있지만 다른 형태의 이상데이터는 검출하기 어렵다. 그래서 라벨이 되어있지 않은 데이터와 비율이 일정하지 않은 데이터에서 데이터를 클러스터링(군집화)하는 비지도학습에 대한 연구, 즉 정상데이터에서 이상데이터를 검출하는 알고리즘에 대한 연구가 필요하다.

연구내용

  • 첫 번째 연구 목표인 CNC 공정 데이터를 이용하여 일반데이터와 경향이 다른 이상데이터 검출 알고리즘을 개발하기 위해 세운 추진 전략은 다음과 같다.

    • 알려진 비지도학습 중 클러스터링 기법 이론 연구, 적용
    • 적용결과를 바탕으로 장&단점 및 특성 분석
    • 다양한 공정에 적용 가능한 이상데이터 검출 딥러닝 알고리즘 개발
    • 딥러닝 알고리즘 수학적 검증 및 체계화
  • 두 번째 목표인 이상데이터 검출 알고리즘의 범용 적용을 위한 고도화 작업 세부 추진 방법은 다음과 같다.

    • 개발한 알고리즘이 사용 가능한 산업 분야 조사 및 적용
    • 범용 알고리즘으로의 확장을 위한 일반화 및 고도화 작업
    • 이상데이터 검출 알고리즘이 필요한 분야를 조사하고 이를 적용하기 위한 고도화 작업을 진행

기대효과

  • CNC 공작기계와 ICT 기술 융합을 통해 공정 및 품질의 실시간 관리 시스템을 구축하여 실질적인 스마트 팩토리 실현: 국·내외를 포함해서 CNC 공정에 특화된 불량감지 및 예측 솔루션을 개발해서 운영해 제조 공장의 생산성에 기여하고 있는 기업들은 여럿 존재한다. 하지만 취합한 데이터를 빅데이터 플랫폼에 저장하여 분석하거나 자율적으로 이상데이터를 감지하는 시스템은 구축되어 있지 않다. 본 연구목표인 자동으로 이상데이터를 검출하는 기법은 자동화를 넘어선 자율화 시스템 구축에 있다는 점에서 연구개발의 중요성이 강조된다.
  • 본 연구개발의 결과를 바탕으로 데이터로부터 경향이 다른 이상데이터를 공정과 무관하게 찾는다면 불량 생산품의 데이터를 자동 추출 및 검출함으로써 생산 효율성을 향상할 수 있다. 이상데이터 자동 검출 알고리즘의 확장 가능성: 단일공정이 아닌 여러 공정에 적용 가능한 알고리즘의 개발이기 때문에 본 연구자는 연구결과를 다른 산업 분야에도 적용할 수 있을 것으로 본다.