KR20230111831A - 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법 - Google Patents

인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법 Download PDF

Info

Publication number
KR20230111831A
KR20230111831A KR1020220007772A KR20220007772A KR20230111831A KR 20230111831 A KR20230111831 A KR 20230111831A KR 1020220007772 A KR1020220007772 A KR 1020220007772A KR 20220007772 A KR20220007772 A KR 20220007772A KR 20230111831 A KR20230111831 A KR 20230111831A
Authority
KR
South Korea
Prior art keywords
data
anomaly detection
test data
clone
detector
Prior art date
Application number
KR1020220007772A
Other languages
English (en)
Inventor
이종수
김윤지
홍수근
Original Assignee
연세대학교 산학협력단
주식회사 에이드팜
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단, 주식회사 에이드팜 filed Critical 연세대학교 산학협력단
Priority to KR1020220007772A priority Critical patent/KR20230111831A/ko
Publication of KR20230111831A publication Critical patent/KR20230111831A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4183Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by data acquisition, e.g. workpiece identification
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34342Matching closest patterns stored in database with actual components
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Manufacturing & Machinery (AREA)
  • Evolutionary Computation (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

본 발명은 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에 관한 것으로서, 인공면역 알고리즘 중 선택 제어 알고리즘(NSA)과 클론 선택 알고리즘을 융합하여, 비지도 또는 반지고 학습의 방법으로 센싱 데이터의 다중 분류의 이상 감지를 수행할 수 있는 기술에 관한 것이다.

Description

인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법 {Multiclass anomaly data detection system and method based on artificial immune algorithm}
본 발명은 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 충분한 비정상 신호를 확보하기 어려운 산업 현장에서, 고장 진단 이상 감지를 위해 확보한 정상 신호 데이터들 기반으로 인공면역 알고리즘의 적용을 통한 고장 진단 이상 감지를 수행할 수 있는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에 관한 것이다.
고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야는 고가의 제품이나 최근 개발된 장치와 시스템들이 있다.
이들을 운영하는 시스템으로 센싱되는 신호 데이터들은 대부분 정상 신호인 것이 당연하다.
인공지능 알고리즘을 적용하여, 이상 탐지를 할 경우, 보다 정확하면서도 신속하게 결과를 도출할 수 있으나, 인공지능 알고리즘의 학습 처리를 위한 충분한 데이터가 요구된다. 그렇지만, 산업 분야에 따라, 충분한 데이터(정상 데이터/비정상 데이터)가 확보될 수도 있으나, 통상적으로 정상 데이터(정상 신호 데이터)는 충분하지만 비정상 데이터(이상 신호 데이터)의 수는 정상 데이터에 비해 현저히 적거나, 정상 데이터와 비정상 데이터로 라벨링 작업을 통한 데이터 가공이 이루어져야 하는 한계가 있다.
이러한 문제점, 다시 말하자면, 다양한 이상 감지에 대응할 수 있는 충분한 데이터의 수집이 부족한 문제점을 해결하기 위한 방안으로, 종래에는 정상 신호만으로 이상 신호를 감지할 수 있는 인공면역 알고리즘 개발 연구가 진행 중이다.
그렇지만, 현재의 연구 결과는 기존의 알고리즘과 정확도가 비슷한 수준에 머물거나 또는, 오탐지율이 높다는 문제점이 있다.
국내등록특허 제10-2091076호(등록일자 2020.03.13.)
본 발명은 상기한 바와 같은 종래 기술의 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 선택 제거 알고리즘(NSA, Negative Selection Algorithm)의 원리와 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)의 원리를 융합하여 보다 높은 성능으로 입력되는 데이터의 이상 감지를 수행할 수 있는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법을 제공하는 것이다.
본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템에 있어서, 입력되는 데이터를 수집하여 학습 처리를 통해 유클리드 거리(Euclidean distance) 기반의 이상 감지 검출기를 생성하는 초기 검출부(100), 새롭게 입력되는 테스트 데이터를 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기에 입력하여, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하는 제1 클론 선택부(200), 상기 제1 클론 선택부(200)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하고, 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기의 업데이트를 수행하는 제1 클론 처리부(300), 새롭게 입력되는 테스트 데이터를 상기 제1 클론 처리부(300)에 의해 업데이트한 상기 이상 감지 검출기에 입력하여, 출력 결과를 토대로 새로운 이상 감지 검출기를 소정 횟수 반복 생성하는 후기 검출부(400), 새롭게 입력되는 테스트 데이터를 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기에 입력하여, 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하는 제2 클론 선택부(500) 및 상기 제2 클론 선택부(500)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하고, 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하는 제2 클론 처리부(600)를 포함하는 것이 바람직하다.
더 나아가, 상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템은 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 센싱 신호 데이터를 전달받아 수행하는 것이 바람직하다.
더 나아가, 상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템은 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터, 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아, 상기 제2 클론 처리부(600)에 의해 업데이트한 다수의 이상 감지 검출기 모두에 입력하여, 모든 이상 감지 검출기로부터 감지되지 않을 경우, 정상 데이터로 판별하는 이상감지부(700)를 더 포함하는 것이 바람직하다.
더 나아가, 상기 제2 클론 처리부(600)는 상기 이상감지부(700)의 판별 결과에 따라, 비정상 데이터로 판별된 데이터를 이용하여, 다수의 이상 감지 검출기 중 선택되는 어느 하나의 업데이트를 수행하는 것이 바람직하다.
더 나아가, 상기 초기 검출부(100)와 상기 후기 검출부(400)는 NSA(Negative Selection Algorithm) 기법을 이용하는 것이 바람직하다.
더 나아가, 상기 제1 클론 선택부(200), 제1 클론 처리부(300), 제2 클론 선택부(500)와 제2 클론 처리부(600)는 CSA(Clonal Selection Algorithm) 기법을 이용하는 것이 바람직하다.
더 나아가, 상기 후기 검출부(400)는 새롭게 입력되는 테스트 데이터를 상기 이상 감지 검출기에 순차적으로 입력하여, 최초로 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 이상 감지 검출기를 생성하고, 이 후, 테스트 데이터를 기존 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에 입력하여, 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 또다른 이상 감지 검출기를 생성하되, 기입력되는 소정 횟수만큼 새로운 이상 감지 검출기의 생성을 반복하는 것이 바람직하다.
본 발명의 또 다른 일 실시예에 따른 컴퓨터로 구현되는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템에 의해 각 단계가 수행되는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법에 있어서, 초기 검출부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 정상 상태로 판별된 데이터를 입력받는 정상 데이터 입력 단계(S100), 초기 검출부에서, 상기 정상 데이터 입력 단계(S100)에 의한 상기 데이터에 대한 학습 처리를 수행하여, 유클리드 거리(Euclidean distance) 기반의 이상 감지 검출기를 출력하는 초기 검출 생성 단계(S200), 제1 클론 선택부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 초기 검출 생성 단계(S200)에 의한 상기 이상 감지 검출기에 입력하여, 각 테스트 데이터 별 근접도 연산 값을 출력받는 초기 출력 단계(S300), 제1 클론 선택부에서, 상기 초기 출력 단계(S300)에 의한 각 테스트 데이터 별 근접도 연산 값을 이용하여, 소정 기준에 따라 입력되는 상기 테스트 데이터 중 특정 테스트 데이터를 선택하는 제1 클론 선택 단계(S400), 제1 클론 처리부에서, 상기 제1 클론 선택 단계(S400)에 의해 선택된 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하는 제1 클론 생성 단계(S500), 제1 클론 처리부에서, 상기 제1 클론 생성 단계(S500)에 의해 생성한 상기 복제 테스트 데이터를 정상 상태로 판별된 데이터로 적용하여, 상기 초기 검출 생성 단계(S200)에 의해 출력한 상기 이상 감지 검출기의 업데이트를 수행하는 제1 클론 처리 단계(S600), 후기 검출부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 제1 클론 처리 단계(S600)에 의해 업데이트한 상기 이상 감지 검출기에 입력하여, 출력 결과를 토대로 새로운 이상 감지 검출기를 소정 횟수 반복 생성하는 후기 검출 생성 단계(S700), 제2 클론 선택부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 후기 검출 생성 단계(S700)에 의한 다수의 이상 감지 검출기에 입력하여, 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산값을 출력받는 후기 출력 단계(S800), 제2 클론 선택부에서, 상기 후기 출력 단계(S800)에 의한 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 이용하여, 소정 기준에 따라 상기 입력되는 상기 테스트 데이터 중 특정 테스트 데이터를 선택하는 제2 클론 선택 단계(S900), 제2 클론 처리부에서, 상기 제2 클론 선택 단계(S900)에 의해 선택된 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하는 제2 클론 생성 단계(S1000) 및 제2 클론 처리부에서, 상기 제2 클론 생성 단계(S1000)에 의해 생성한 상기 복제 테스트 데이터를 정상 상태로 판별된 데이터로 적용하여, 상기 후기 출력 단계(S800)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하는 제2 클론 처리 단계(S1100)를 포함하는 것이 바람직하다.
더 나아가, 상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법은 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터, 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아, 상기 제2 클론 처리 단계(S1100)에 의해 업데이트한 다수의 이상 감지 검출기 모두에 입력하여, 모든 이상 감지 검출기로부터 감지되지 않을 경우, 정상 데이터로 판별하는 이상감지 단계(S1200)를 더 포함하는 것이 바람직하다.
더 나아가, 상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법은 상기 이상감지 단계(S1200)의 판별 결과에 따라, 비정상 데이터로 판별된 데이터를 이용하여, 제2 클론 처리 단계(S1100)에 의해 업데이트한 다수의 이상 감지 검출기 중 선택되는 어느 하나의 추가 업데이트를 수행하는 이상감지 적용단계(S1300)를 더 포함하는 것이 바람직하다.
더 나아가, 초기 검출부와 후기 검출부에서, NSA(Negative Selection Algorithm) 기법을 이용하는 것이 바람직하다.
더 나아가, 제1 클론 선택부, 제1 클론 처리부, 제2 클론 선택부와 제2 클론 처리부에서, CSA(Clonal Selection Algorithm) 기법을 이용하는 것이 바람직하다.
더 나아가, 상기 후기 검출 생성 단계(S700)는 새롭게 입력되는 테스트 데이터를 상기 이상 감지 검출기에 순차적으로 입력하여, 최초로 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 이상 감지 검출기를 생성하고, 이 후, 테스트 데이터를 기존 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에 입력하여, 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 또다른 이상 감지 검출기를 생성하되, 기입력되는 소정 횟수만큼 새로운 이상 감지 검출기의 생성을 반복하는 것이 바람직하다.
상기와 같은 구성에 의한 본 발명의 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법은 라벨링 작업이 된 데이터가 충분하지 않거나 또는, 정상 신호 데이터 수에 비해 이상 신호 데이터의 수가 현저히 적을 경우에도, 높은 정확도로 그리고, 낮은 오분류율로 데이터의 이상 감지가 가능한 장점이 있다.
즉, 실제 산업 현장에서의 이상 감지의 편의성을 향상시키기 위하여, 다분류 이상 감지 검출기를 생성할 수 있는 장점이 있다.
이를 통해서, 다중 분류가 가능한 이상 감지 검출기를 통해서 다중 뷴류가 가능하며, 더 나아가 이상 감지를 여러 번 필터링하는 효과가 나타나, 오분류율을 감소시킬 수 있다.
또한, 설비 및 시스템에 대한 정확한 이상 감지로 부품 파손 및 경제적 손실을 방지할 수 있으며, 제품의 강건성 확보를 위해 불필요한 과도설계 방지 가능 및 설계 비용 절감의 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에서 활용한 선택 제어 알고리즘의 원리를 나타낸 예시도이다.
도 2는 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에서 활용한 클론 선택 알고리즘의 원리를 나타낸 예시도이다.
도 3 및 도 4는 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템을 나타낸 구성 예시도이다.
도 5는 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법을 나타낸 순서 예시도이다.
이하 첨부한 도면들을 참조하여 본 발명의 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법을 상세히 설명한다. 다음에 소개되는 도면들은 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 예로서 제공되는 것이다. 따라서, 본 발명은 이하 제시되는 도면들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 또한, 명세서 전반에 걸쳐서 동일한 참조번호들은 동일한 구성요소들을 나타낸다.
이때, 사용되는 기술 용어 및 과학 용어에 있어서 다른 정의가 없다면, 이 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 가지며, 하기의 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 설명은 생략한다.
더불어, 시스템은 필요한 기능을 수행하기 위하여 조직화되고 규칙적으로 상호 작용하는 장치, 기구 및 수단 등을 포함하는 구성 요소들의 집합을 의미한다.
상술한 바와 같이, 고장 진단 이상 감지를 위해 확보한 신호 데이터들은 정상 신호(정상 신호 데이터)들이 대부분이며, 이상 신호는 정상 신호에 비해 확연히 적다는 문제점이 있다.
이를 해결하고자 정상 신호 데이터만을 이용하여 이상을 감지하는 기술이 연구되고 있으며, 대표적으로는 인공면역 시스템 중 선택 제어 알고리즘이 있다.
선택 제어 알고리즘(NSA, Negative Selection Algorithm)은 정상 신호만을 활용하여 데이터를 분류하고 이상을 감지하는 알고리즘으로, 자기 자신의 세포와 외부의 세포를 구분하는 인간의 면역 원리를 모방한 알고리즘이다. 그렇지만, 이러한 선택 제어 알고리즘은 두 분류의 이상 감지에 최적화 되어 있다는 문제점이 있다.
이러한 점을 고려하여 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에서는, 선택 제어 알고리즘의 원리와 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)의 원리를 하이브리드하여, 다분류 이상 감지기를 생성하고자 하며, 실제 산업 현장에서의 이상 감지의 편의성을 향상시키기 위해, 반지도/비지도 학습의 알고리즘으로 개선한 다분류 이상 감지기를 제공할 수 있다.
본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법에서는, 데이터 기반의 이상 감지 알고리즘의 진화로 성능이 개선됨에 따라, 고장 진단 이상 감지를 위한 인공면역 시스템(인공면역 알고리즘)의 적용 프로세스를 제시한다.
용어에 대해서 먼저 설명하자면, 비지도 학습(Unsupervised Learning)이란, 알고리즘이 레이블링이 되어 있지 않은 데이터로부터 특징을 추출하고, 어떠한 명시적인 명령 없이 기저의 패턴을 식별한다. 그렇기 때문에, 비지도 학습은 그룹화(클러스터링)를 통해서 특징이나 속성들 사이의 관련성을 판단하기 위한 작업에 유용하다. 일 예를 들자면, 이러한 관련성을 이해함으로써 고객이 이전에 구매한 리스트를 바탕으로 해당 고객이 어떤 다른 상품들을 좋아할지 예측할 수 있다. 비지도 학습은 주어지는 질문에 따라서 데이터를 다르게 그룹화할 수 있어, 비지도 학습을 위해서는 적절한 질문을 하는 것이 또는, 질문을 적절하게 하는 것이 다른 유형의 학습들에서 보다 중요하다.
반지도 학습(Semi-Supervised Learning)이란, 알고리즘이 부분적으로 레이블링이 되어 있는 데이터를 사용하여 학습하는 것을 의미한다. 일 예를 들자면, CT 스캔이나 MRI 사진을 학습하여 종양 유무를 분석하는 것을 들 수 있으며, 숙련된 방사선학자가 소량의 종양 데이터를 레이블링 하여, 비지도 작업에 비해서 알고리즘의 정확도를 상당히 향상시킬 수 있으며, 당연히 진단 정확도를 향상시킬 수 있다.
인공면역 알고리즘의 한 종류인 선택 제어 알고리즘은 인간 면역 체계 특징 중 자기(self)와 비자기(nonself)를 구분하는 원리로 동작한다.
즉, 우리 몸의 면역 작용에서 흉선에 있는 T 림프구가 흉선 혈관 장벽(Blood thymic barrier)을 통해서 외부 물질과는 단절되어 오직 자기를 구성하는 요소들만 존재하는 공간에서 자기 요소들과 반응하지 않는 세포만을 선택하여 면역 반응을 수행할 수 있는 면역 담당 세포로 성장시키는 원리를 이용한 알고리즘이다.
림프계의 대표적인 세포인 B 림프구와 T 림프구는 다양한 형태의 수용체를 가짐으로써, 다양한 종류의 항원에 대항한다. 이렇게 다양한 종류의 분자와 반응할 수 있는 능력은 자기 자신을 구성하는 분자와도 쉽게 반응할 가능성도 가진다는 위험을 내포하고 있다. 그렇기 때문에, 면역계가 올바로 동작하기 위해서는, 림프구들이 자기 자신을 이루는 분자(self)와 외부 물질(nonself)을 구별할 수 있는 능력이 필수적이다. 이러한 구별이 제대로 이루어지지 않을 경우, 면역 시스템이 자기 항체에 대해 동작되는 '자기 면역 질환'을 일으키게 된다. 따라서 림프구가 자기와 비자기를 올바르게 구분해 내기 위해서는 이들을 생성 과정에서 도 1에 도시된 바와 같은 음성 선택 과정을 겪게 된다.
즉, 음성 선택 과정은 T 림프구의 생성 과정을 모사한 연산 방법으로 흉선에서 T 림프구가 만들어질 때, 자기 자신과 반응하는 T 림프구들이 제거되는 과정을 모사한다. 도 1의 a)에 도시된 바와 같이, 주어진 자기 자신의 데이터를 이용하여 자기 집합(self data set)을 정의하고, 임의로 생성된 값(random candidate detector)들을 자기 집합의 요소들과 비교(match)함으로써, 자기 집합(reject, self)과 유사하지 않은 비자기 집합(detector set, nonself)을 정의한다. 다시 말하자면, 랜덤하게 생성된 예비 항원들을 기존에 정의된 자기 자신과 모두 반응시킨 후, 이중 하나와도 반응한다면 예비 항원은 제거(reject, self)되고, 모든 자기 자신 요소와 다른 항원에 대해서만 항원으로서 올바른 역할(detector set, nonself)을 할 수 있다고 판단된다.
이러한 과정을 반복적으로 수행하여 다수의 항원을 생성한 이 후, 도 1의 b)에 도시된 바와 같이, 생성된 비자기 집합을 이용하여, 새로 들어오는 데이터를 모니터링(match)하고, 이 데이터가 비자기 집합과 유사하다고 판단될 경우, 주어진 데이터가 비정상적인 경우인 것으로 간주하게 된다. 다시 말하자면, 임의의 입력 값이나 자기 자신의 변화가 발생할 때마다 정의된 항원들과의 유사성을 계산함으로써, 이를 토대로 자기 또는 비자기를 구별한다.
이러한 선택 제거 알고리즘은 구현이 용이하고 계산 비용이 낮으며 특히, 정상 상태 조건에서만 속하는 데이터 세트에 기초하여 분류를 수행할 수 있기 때문에 편리한 장점이 있다. 그렇지만, 두 분류를 위한 알고리즘에 해당하며, 오탐지율이 높은 단점이 있다.
인공면역 알고리즘의 또다른 한 종류인 클론 선택 알고리즘은 인간 면역 체계가 어떻게 감염에 대응하고, 어떻게 B 림프구, T 림프구 중 몸에 침입한 항원을 파괴하는 종류만 선택적으로 증식되는지 설명하는 원리로 동작한다.
거의 무제한의 다양한 침입자에 대하여 대항하기 위해, 서로 다른 모양의 항원 수용체를 가지는 다양한 수용체를 가지고 있는 림프구가 존재하기 때문에, 자연히 동일한 수용체를 가지고 있는 림프의 개체수는 제한될 수 밖에 없다. 또한 특정한 감염에 효과적으로 대응하기 위해서는, 해당 항원에 반응한 림프구가 빠른 증식을 거듭하여 세포의 수를 증가시키는 과정이 존재한다. 이러한 과정은 클론 선택 과정으로 불리며, 면역계의 주요한 특징 중 하나이다.
이러한 클론 선택 알고리즘의 기본 원리는 도 2에 도시된 바와 같다.
몇 번의 세대(generation)를 반복할지 사전에 정한 후, 항원으로 들어온 데이터를 항체로 생성된 검출기에 제시한다. 항원과 항체 사이의 유사도(affinity)를 비교하여, 가장 높은 유사도를 가지는 항원을 선택하여 유사도에 비례해서 복제 항원(클론)들을 생성한다. 클론들의 유사도에 반비례하게 친화도 증진(affinity maturation)을 진행한다. 클론들에서 가장 친화도가 높은 클론은 후보 항체로 선택한 후, 기존 항체보다 친화도가 높을 경우, 후보 항체로 대체하게 된다. 이를 통한 항체 업데이트를 진행하게 된다.
도 3 및 도 4는 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템을 나타낸 구성 예시도이다. 도 3 및 도 4를 참조로 하여 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템을 상세히 설명한다.
본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템은 도 3에 도시된 바와 같이, 초기 검출부(100), 제1 클론 선택부(200), 제1 클론 처리부(300), 후기 검출부(400), 제2 클론 선택부(500), 제2 클론 처리부(600)를 포함하여 구성되는 것이 바람직하다. 각 구성들은 컴퓨터를 포함하는 연산처리수단에 구비되어 동작을 수행하는 것이 바람직하다.
또한, 각 구성들은 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 센싱 신호 데이터를 전달받아 수행하는 것이 바람직하다.
보다 상세하게는, IMS 베어링 데이터 셋과 진공 증착 장비 데이터 셋을 활용하여 검증을 진행하였다.
각 구성에 대해서 자세히 알아보자면,
상기 초기 검출부(100), 제1 클론 선택부(200) 및 제1 클론 처리부(300)는 도 4의 anomaly detection phase의 동작에 해당한다.
상기 초기 검출부(100)는 입력되는 데이터를 수집하여 학습 처리를 통해 유클리드 거리(Euclidean distance) 기반의 이상 감지 검출기를 생성하는 것이 바람직하다. 이 때, 입력되는 데이터는 초기 데이터인 정상 신호 데이터인 것이 바람직하다. 여기서, 상기 초기 검출부(100)는 입력되는 데이터의 학습 처리에 있어서, 선택 제어 알고리즘(NSA, Negative Selection Algorithm)을 이용하는 것이 바람직하다.
즉, 정상 상태 데이터만을 이용하여 데이터 셋(self data set)을 구성하여, 상기 데이터 셋의 학습 처리를 통해서 유클리드 거리 기반의 이상 감지 검출기(antibody)를 생성하는 것이 바람직하다.
이 때, 상기 초기 검출부(100)는 오분류율 감소를 위해 moving window filter를 적용하는 것이 바람직하다. 즉, 생성한 상기 이상 감지 검출기에 검출 범우의 축소 등의 추가적인 필터링 기능을 통해 재작업을 수행하여 필터링함으로써, 분류 성능을 향상시킬 수 있다.
moving window filter를 통해서 선택 제어 알고리즘을 통한 분류의 정확도를 향상시키기 위하여, detector들의 분류에 있어 각종 노이즈들을 필터링해 주는 것이 바람직하다. 일 예를 들자면, 10개의 데이터를 입력받아 10으로 나누어 평균을 취하면 10개마다 데이터 입력을 받는 의미가 되어, 데이터의 변화에 10개의 데이터를 입력받는 시간만큼 느리게 된다. 이러한 문제점을 개선하기 위하여, moving window filter를 적용할 경우, 최초 10개의 값을 평균한 뒤 11번째 데이터가 들어올 때 제일 먼저 들어온 데이터를 버리고 현재 데이터를 합한 다음에 평균을 한다. 이 경우, 1개의 데이터가 들어올 때마다 10개의 데이터에 대한 평균을 취하게 되는데 이를 moving window filter라 한다.
moving window filter의 연산 식은 하기의 수학식 1과 같으며, 여기서 n은 평균값을 연산하기 위해 요구되는 데이터 개수이다.
상기 제1 클론 선택부(200)는 새롭게 입력되는 테스트 데이터를 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기에 입력하여, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하는 것이 바람직하다.
이 때, 상기 제1 클론 선택부(200)는 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제1 클론 선택부(200)는 동작을 수행하기 앞서서, 몇 번의 세대(generation)을 반복할지 사전에 설정하는 것이 바람직하며, 신규 테스트 데이터(항원 데이터)를 이상 감지 검출기(항체 데이터)에 제시하여, 유클리드 거리 비교를 통한 근접도 평가가 이루어지게 바람직하다.
이 때, 하기의 수학식 2를 적용하는 것이 바람직하다.
(여기서, DAgi-Abj는 항원과 항체 사이의 유클리드 거리를 나타내며, 거리가 짧을수록 친화력이 커짐을 의미함.
Agin, Abjn은 L 개의 속성을 갖는 항원 및 항체의 샘플을 의미함.)
즉, 신규 테스트 데이터와 기존 이상 감지 검출기의 근접도를 비교하는 것이 바람직하며, 기존 이상 감지 검출기는 상술한 바와 같이, 유클리드 거리 기반으로서, 중심점과 반지름의 값으로 이루어진 원 모양의 디텍터이기 때문에, 신규 테스트 데이터에 대한 근접도 연산 값을 연산할 수 있다.
상기 제1 클론 처리부(300)는 상기 제1 클론 선택부(200)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하고, 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기의 업데이트를 수행하는 것이 바람직하다.
이 때, 상기 제1 클론 처리부(300) 역시도 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제1 클론 처리부(300)는 가장 높은 근접도를 가지는 테스트 데이터를 선택하고, 근접도에 비례해서 복제 테스트 데이터들을 생성하는 것이 바람직하다. 이 후, 생성한 복제 테스트 데이터들의 근접도에 반비례하게 친화도 증진(affinity maturation)을 진행하게 된다. 복제 테스트 데이터들에서 클론들에서 가장 친화도가 높은 복제 테스트 데이터를 선택하여, 이를 반영하여 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기의 업데이트를 수행하게 된다.
이 때, 상기 제1 클론 처리부(300)는 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기의 업데이트를 수행하기 앞서서, generalized cell이 될 수 있도록 average affinity을 선택하는 것이 바람직하다. 즉, 너무 한 종류의 이상 감지에만 반응하지 않고, 골고루 많이 잡아낼 수 있는 검출기를 선택하고자 평균 유사도를 판정 변수로 선택하는 것이 바람직하다.
또한, average affinity가 너무 낮거나 하나의 특정 이상(항원)에만 잘 감지할 경우, 해당 복제 테스트 데이터를 삭제하는 것이 바람직하다.
상기 후기 검출부(400), 제2 클론 선택부(500), 제2 클론 처리부(600)는 도 4의 Generalizing/Developing/Updating detector phase의 동작에 해당한다.
상기 후기 검출부(400)는 새롭게 입력되는 테스트 데이터를 상기 제1 클론 처리부(300)에 의해 업데이트한 상기 이상 감지 검출기에 입력하여, 출력 결과를 토대로 새로운 이상 감지 검출기를 소정 횟수 반복 생성하는 것이 바람직하다. 이 때, 상기 후기 검출부(400)는 선택 제어 알고리즘(NSA, Negative Selection Algorithm)을 이용하는 것이 바람직하다.
상기 후기 검출부(400)는 새롭게 입력되는 테스트 데이터를 상기 이상 감지 검출기에 순차적으로 입력하여, 최초로 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 이상 감지 검출기를 생성하고, 이 후, 테스트 데이터를 기존 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에 입력하여, 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 또다른 이상 감지 검출기를 생성하되, 미리 입력되는 소정 횟수만큼 새로운 이상 감지 검출기의 생성을 반복 수행하는 것이 바람직하다.
상세하게는, 상기 후기 검출부(400)는 상기 제1 클론 처리부(300)에 의해 업데이트한 상기 이상 감지 검출기, 다시 말하자면 최적화된 detector의 중심 좌표, 반지름 크기를 반영하여, 분류하고자 하는 데이터인 테스트 데이터를 입력받아 새로운 이상 감지 검출기를 생성하는 것이 바람직하다.
이 때, 상기 후기 검출부(400)는 최초, 이상 데이터로 판단된 테스트 데이터를 이용하여 또다른 이상 감지를 위한 이상 감지 검출기를 생성하게 된다.
이 때, 이상 감지 검출기는 이상(nonself)을 판별하게 된다. 상술한 바와 같이, 정상(self)은 제거되게 된다.
이를 통해서, 상기 제1 클론 처리부(300)에 의해 업데이트한 상기 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에서 이상으로 감지될 경우, 또다른 이상 감지를 위한 또다른 이상 감지 검출기를 생성하게 된다.
이 후, 상기 제1 클론 처리부(300)에 의해 업데이트한 상기 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기, 새롭게 생성한 또다른 이상 감지 검출기 모두에서 이상으로 감지될 경우, 또다른 이상 감지를 위한 다른 이상 감지 검출기를 생성하게 된다.
이상 감지 검출기의 생성은 미리 입력되는 소정 횟수만큼 반복되며, 생성한 이상 감지 검출기들은 상기 moving window filter를 적용하는 것이 바람직하다.
상기 제2 클론 선택부(500)는 새롭게 입력되는 테스트 데이터를 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기에 입력하여, 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하는 것이 바람직하다.
이 때, 상기 제2 클론 선택부(500)는 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제2 클론 선택부(500)는 동작을 수행하기 앞서서, 몇 번의 세대(generation)를 반복할지 사전에 설정하는 것이 바람직하며, 신규 테스트 데이터(항원 데이터)를 이상 감지 검출기(항체 데이터)에 제시하여, 유클리드 거리 비교를 통한 근접도 평가가 이루어지게 바람직하다. 이 때, 상기의 수학식 2를 적용하는 것이 바람직하다.
즉, 신규 테스트 데이터와 기존 이상 감지 검출기의 근접도를 비교하는 것이 바람직하며, 기존 이상 감지 검출기는 상술한 바와 같이, 유클리드 거리 기반으로서, 중심점과 반지름의 값으로 이루어진 원 모양의 디텍터이기 때문에, 신규 테스트 데이터에 대한 근접도 연산 값을 연산할 수 있다.
상기 제2 클론 처리부(600)는 상기 제2 클론 선택부(500)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하고, 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하는 것이 바람직하다.
이 때, 상기 제2 클론 처리부(600) 역시도 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제2 클론 처리부(600)는 가장 높은 근접도를 가지는 테스트 데이터를 선택하고, 근접도에 비례해서 복제 테스트 데이터들을 생성하는 것이 바람직하다. 이 후, 생성한 복제 테스트 데이터들의 근접도에 반비례하게 친화도 증진(affinity maturation)을 진행하게 된다. 복제 테스트 데이터들에서 클론들에서 가장 친화도가 높은 복제 테스트 데이터를 선택하여, 이를 반영하여 상기 후기 검출부(400)에 의한 상기 이상 감지 검출기의 업데이트를 수행하게 된다.
이 때, 상기 제2 클론 처리부(600)는 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하기 앞서서, generalized cell이 될 수 있도록 average affinity을 선택하는 것이 바람직하다. 즉, 너무 한 종류의 이상 감지에만 반응하지 않고, 골고루 많이 잡아낼 수 있는 검출기를 선택하고자 평균 유사도를 판정 변수로 선택하는 것이 바람직하다.
또한, average affinity가 너무 낮거나 하나의 특정 이상(항원)에만 잘 감지할 경우, 해당 복제 테스트 데이터를 삭제하는 것이 바람직하다.
본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템은 도 3에 도시된 바와 같이, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터, 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아 동작을 수행하는 이상감지부(700)를 더 포함하여 구성되는 것이 바람직하다.
상기 이상감지부(700)는 상기 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아, 상기 제2 클론 처리부(600)에 의해 업데이트한 다수의 이상 감지 검출기 모두에 입력하여, 모든 이상 감지 검출기에 대해 어디에도 감지되지 않을 경우, 정상 데이터로 판별하는 것이 바람직하다.
이외 달리, 다수의 이상 감지 검출기에 대해 감지될 경우, 맨 마지막의 감지 데이터를 새로운 이상 데이터로 판별하여 정의하는 것이 바람직하며, 이상으로 감지되는 가장 나중에 업데이트된 이상 감지 검출기에서 검출된 이상 데이터로 라벨링하여 이상 감지 검출기의 업데이트를 수행하는 것이 바람직하다.
선택 제거 알고리즘의 작동 과정에 대한 예를 들자면, 기존의 2중 분류에 강점을 다중 분류에 효과적으로 활용하기 위하여, 분류하고자 하는 class의 개수가 n개 일 경우, n-1개의 layer의 이상 감지 검출기를 생성하여 분류하게 된다. 이를 통해서 다중 분류가 가능하면서도 각 layer의 이상 감지 검출기를 통해서 여러 번의 필터링 효과를 주어 정확도까지 향상시킬 수 있는 장점이 있다.
더불어, 클론 선택 알고리즘의 작동 과정에 대한 예를 들자면, 진공 증착 장비 데이터 셋의 경우, 정상/이상의 2 분류를 진행하게 된다. 각각의 2 분류를 감지하는 detector가 생성되고, 생성된 detector 중 분류 정확도가 가장 높은 detector를 이용하여 70개의 클론을 생성하게 된다. 생성된 클론들은 정확도에 반비례한 정도로 변형시키게 된다. 즉, 이상을 잘 잡아내는 좋은 성능의 검출기일수록 검출기의 중심과 반지름을 작게 변형시키고, 이상을 잘 잡아내지 못하는 검출기일수록 검출기의 중심과 반지름을 크게 변형시킨다. 70개의 변형된 클론들 중 30개의 가장 정확도가 높은 detector들은 memory set으로 구성할 후보로 선택한다. 이 때, 최초의 memory set은 초기 생성된 detector 중 가장 성능이 좋은 30개의 detector로 구성되게 된다. 후보로 선택된 30 개의 detector 중에서 기존 memory set 보다 더 정확도(성능)가 높을 경우, 기존 memory set에서 후보로 있던 클론들로 대체하면서 업데이트하게 된다. 이를 통해서 클론 선택 알고리즘의 1 세대(generation)가 마무리되고 설정된 횟수만큼 상술한 과정을 반복하여 detector의 성능이 업데이트된다.
도 5는 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법을 나타낸 순서 예시도이다. 도 5를 참조로 하여 본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법을 상세히 설명한다.
본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법을 도 5에 도시된 바와 같이, 정상 데이터 입력 단계(S100), 초기 검출 생성 단계(S200), 초기 출력 단계(S300), 제1 클론 선택 단계(S400), 제1 클론 생성 단계(S500), 제1 클론 처리 단계(S600), 후기 검출 생성 단계(S700), 후기 출력 단계(S800), 제2 클론 선택 단계(S900), 제2 클론 생성 단계(S1000), 제2 클론 처리 단계(S1100)를 포함하여 구성되는 것이 바람직하다. 각 단계들은 컴퓨터로 구현되는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템에 의해 수행되게 된다.
각 단계에 대해서 자세히 알아보자면,
상기 정상 데이터 입력 단계(S100)는 상기 초기 검출부(100)에서, 정상 신호 데이터를 입력받는 것이 바람직하다. 즉, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 정상 상태로 판별된 데이터를 입력받게 된다.
상기 초기 검출 생성 단계(S200)는 상기 초기 검출부(100)에서, 상기 정상 데이터 입력 단계(S100)에 의한 데이터에 대한 학습 처리를 수행하여, 유클리드 거리(Euclidean distance) 기반의 이상 감지 검출기를 생성하게 된다.
데이터의 학습 처리에 있어서, 선택 제어 알고리즘(NSA, Negative Selection Algorithm)을 이용하게 된다.
즉, 상기 초기 검출 생성 단계(S200)는 정상 상태 데이터만을 이용하여 데이터 셋(self data set)을 구성하여, 상기 데이터 셋의 학습 처리를 통해서 유클리드 거리 기반의 이상 감지 검출기(antibody)를 생성하게 된다.
이 때, 상기 초기 검출 생성 단계(S200)는 오분류율 감소를 위해 moving window filter를 적용함으로써, 생성한 상기 이상 감지 검출기에 검출 범우의 축소 등의 추가적인 필터링 기능을 통해 재작업을 수행하여 필터링함으로써, 분류 성능을 향상시킬 수 있다.
상기 초기 출력 단계(S300)는 상기 제1 클론 선택부(200)에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 초기 검출 생성 단계(S200)에 의한 상기 이상 감지 검출기에 입력하여, 각 테스트 데이터 별 근접도 연산 값을 출력받게 된다.
신규 테스트 데이터와 기존 이상 감지 검출기의 근접도를 비교하는 것이 바람직하며, 기존 이상 감지 검출기는 상술한 바와 같이, 유클리드 거리 기반으로서, 중심점과 반지름의 값으로 이루어진 원 모양의 디텍터이기 때문에, 신규 테스트 데이터에 대한 근접도 연산 값을 연산할 수 있다.
상기 제1 클론 선택 단계(S400)는 상기 제1 클론 선택부(200)에서, 상기 초기 출력 단계(S300)에 의한 각 테스트 데이터 별 근접도 연산 값을 이용하여, 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하게 된다. 상세하게는, 가장 높은 근접도를 가지는 테스트 데이터를 선택하게 된다. 이 때, 상기 제1 클론 선택 단계(S400)는 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제1 클론 선택 단계(S400)는 동작을 수행하기 앞서서, 몇 번의 세대(generation)를 반복할지 사전에 설정하는 것이 바람직하며, 신규 테스트 데이터(항원 데이터)를 이상 감지 검출기(항체 데이터)에 제시하여, 유클리드 거리 비교를 통한 근접도 평가가 이루어지게 바람직하다.
상기 제1 클론 생성 단계(S500)는 상기 제1 클론 처리부(300)에서, 상기 제1 클론 선택 단계(S400)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하게 된다. 근접도에 비례해서 복제 테스트 데이터들을 생성하며, 이 후, 생성한 복제 테스트 데이터들의 근접도에 반비례하게 친화도 증진(affinity maturation)을 진행하게 된다. 복제 테스트 데이터들에서 클론들에서 가장 친화도가 높은 복제 테스트 데이터를 선택하게 된다.
이 때, 상기 제1 클론 생성 단계(S500) 역시도 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제1 클론 처리 단계(S600)는 상기 제1 클론 처리부(300)에서, 상기 제1 클론 생성 단계(S500)에 의해 생성한 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 초기 검출 생성 단계(S200)에 의해 출력한 상기 이상 감지 검출기의 업데이트를 수행하게 된다.
이 때, 상기 제1 클론 처리 단계(S600)는 상기 이상 감지 검출기의 업데이트를 수행하기 앞서서, generalized cell이 될 수 있도록 average affinity을 선택하는 것이 바람직하다. 즉, 너무 한 종류의 이상 감지에만 반응하지 않고, 골고루 많이 잡아낼 수 있는 검출기를 선택하고자 평균 유사도를 판정 변수로 선택하는 것이 바람직하다.
또한, average affinity가 너무 낮거나 하나의 특정 이상(항원)에만 잘 감지할 경우, 해당 복제 테스트 데이터를 삭제하는 것이 바람직하다.
상기 후기 검출 생성 단계(S700)는 상기 후기 검출부(400)에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 제1 클론 처리 단계(S600)에 의해 업데이트한 상기 이상 감지 검출기에 입력하여, 출력 결과를 토대로 새로운 이상 감지 검출기를 소정 횟수 반복 생성하게 된다. 이 때, 상기 후기 검출 생성 단계(S700)는 선택 제어 알고리즘(NSA, Negative Selection Algorithm)을 이용하는 것이 바람직하다.
상기 후기 검출 생성 단계(S700)는 새롭게 입력되는 테스트 데이터를 상기 이상 감지 검출기에 순차적으로 입력하여, 최초로 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 이상 감지 검출기를 생성하고, 이 후, 테스트 데이터를 기존 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에 입력하여, 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 또다른 이상 감지 검출기를 생성하되, 미리 입력되는 소정 횟수만큼 새로운 이상 감지 검출기의 생성을 반복 수행하는 것이 바람직하다.
상세하게는, 상기 후기 검출 생성 단계(S700)는 상기 제1 클론 처리 단계(S600)에 의해 업데이트한 상기 이상 감지 검출기, 다시 말하자면 최적화된 detector의 중심 좌표, 반지름 크기를 반영하여, 분류하고자 하는 데이터인 테스트 데이터를 입력받아 새로운 이상 감지 검출기를 생성하는 것이 바람직하다.
상기 후기 검출 생성 단계(S700)는 최초, 이상 데이터로 판단된 테스트 데이터를 이용하여 또다른 이상 감지를 위한 이상 감지 검출기를 생성하게 된다.
이 때, 이상 감지 검출기는 이상(nonself)을 판별하게 된다. 상술한 바와 같이, 정상(self)은 제거되게 된다.
이를 통해서, 상기 제1 클론 처리 단계(S600)에 의해 업데이트한 상기 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에서 이상으로 감지될 경우, 또다른 이상 감지를 위한 또다른 이상 감지 검출기를 생성하게 된다.
이 후, 상기 제1 클론 처리 단계(S600)에 의해 업데이트한 상기 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기, 새롭게 생성한 또다른 이상 감지 검출기 모두에서 이상으로 감지될 경우, 또다른 이상 감지를 위한 다른 이상 감지 검출기를 생성하게 된다.
이상 감지 검출기의 생성은 미리 입력되는 소정 횟수만큼 반복되며, 생성한 이상 감지 검출기들은 상기 moving window filter를 적용하는 것이 바람직하다.
상기 후기 출력 단계(S800)는 상기 제2 클론 선택부(500)에서, 장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 후기 검출 생성 단계(S700)에 의한 다수의 이상 감지 검출기에 입력하여, 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 출력받게 된다. 상기 후기 출력 단계(S800)는 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 후기 출력 단계(S800)는 동작을 수행하기 앞서서, 몇 번의 세대(generation)를 반복할지 사전에 설정하는 것이 바람직하며, 신규 테스트 데이터(항원 데이터)를 이상 감지 검출기(항체 데이터)에 제시하여, 유클리드 거리 비교를 통한 근접도 평가가 이루어지게 바람직하다. 이 때, 상기의 수학식 2를 적용하는 것이 바람직하다.
즉, 신규 테스트 데이터와 기존 이상 감지 검출기의 근접도를 비교하는 것이 바람직하며, 기존 이상 감지 검출기는 상술한 바와 같이, 유클리드 거리 기반으로서, 중심점과 반지름의 값으로 이루어진 원 모양의 디텍터이기 때문에, 신규 테스트 데이터에 대한 근접도 연산 값을 연산할 수 있다.
상기 제2 클론 선택 단계(S900)는 상기 제2 클론 선택부(500)에서, 상기 후기 출력 단계(S800)에 의한 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하게 된다.
상기 제2 클론 생성 단계(S1000)는 상기 제2 클론 처리부(600)에서, 상기 제2 클론 선택 단계(S900)에 의해 선택된 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하게 된다. 이 때, 상기 제2 클론 생성 단계(S1000)는 클론 선택 알고리즘(CSA, Clonal Selection Algorithm)을 통해 동작이 수행되는 것이 바람직하다.
상기 제2 클론 생성 단계(S1000)는 가장 높은 근접도를 가지는 테스트 데이터를 선택하고, 근접도에 비례해서 복제 테스트 데이터들을 생성하는 것이 바람직하다. 이 후, 생성한 복제 테스트 데이터들의 근접도에 반비례하게 친화도 증진(affinity maturation)을 진행하게 된다. 복제 테스트 데이터들에서 클론들에서 가장 친화도가 높은 복제 테스트 데이터를 선택하게 된다.
상기 제2 클론 처리 단계(S1100)는 상기 제2 클론 처리부(600)에서, 상기 제2 클론 생성 단계(S1000)에 의해 생성한 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 후기 출력 단계(S800)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하게 된다.
이 때, 상기 제2 클론 처리 단계(S1100)는 상기 후기 출력 단계(S800)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하기 앞서서, generalized cell이 될 수 있도록 average affinity을 선택하는 것이 바람직하다. 즉, 너무 한 종류의 이상 감지에만 반응하지 않고, 골고루 많이 잡아낼 수 있는 검출기를 선택하고자 평균 유사도를 판정 변수로 선택하는 것이 바람직하다.
또한, average affinity가 너무 낮거나 하나의 특정 이상(항원)에만 잘 감지할 경우, 해당 복제 테스트 데이터를 삭제하는 것이 바람직하다.
본 발명의 일 실시예에 따른 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법은, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터, 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아 동작을 수행하는 이상감지 단계(S1200)를 더 수행하는 것이 바람직하다.
상기 이상감지 단계(S1200)는 상기 이상감지부(700)에서, 상기 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아, 상기 제2 클론 처리 단계(S1100)에 의해 업데이트한 다수의 이상 감지 검출기 모두에 입력하여, 모든 이상 감지 검출기에 대해 어디에도 감지되지 않을 경우, 정상 데이터로 판별하는 것이 바람직하다.
이와 달리 상기 이상감지 단계(S120)의 판별 결과에 따라, 다수의 이상 감지 검출기에 대해 감지될 경우, 즉, 비정상 데이터로 판별될 경우, 이상감지 적용단계(S1300)를 더 수행하게 된다.
상기 이상감지 적용단계(S1300)는 상기 제2 클론 처리 단계(S1100)에 의해 업데이트한 다수의 이상 감지 검출기 중 선택되는 어느 하나의 이상 감지 검출기의 추가 업데이트를 수행하게 된다.
다수의 이상 감지 검출기에 대해 감지될 경우, 맨 마지막의 감지 데이터를 새로운 이상 데이터로 판별하여 정의하는 것이 바람직하며, 이상으로 감지되는 가장 나중에 업데이트된 이상 감지 검출기에서 검출된 이상 데이터로 라벨링하여 이상 감지 검출기의 업데이트를 수행하는 것이 바람직하다.
선택 제거 알고리즘의 작동 과정에 대한 예를 들자면, 기존의 2중 분류에 강점을 다중 분류에 효과적으로 활용하기 위하여, 분류하고자 하는 class의 개수가 n개 일 경우, n-1개의 layer의 이상 감지 검출기를 생성하여 분류하게 된다. 이를 통해서 다중 분류가 가능하면서도 각 layer의 이상 감지 검출기를 통해서 여러 번의 필터링 효과를 주어 정확도까지 향상시킬 수 있는 장점이 있다.
더불어, 클론 선택 알고리즘의 작동 과정에 대한 예를 들자면, 진공 증착 장비 데이터 셋의 경우, 정상/이상의 2 분류를 진행하게 된다. 각각의 2 분류를 감지하는 detector가 생성되고, 생성된 detector 중 분류 정확도가 가장 높은 detector를 이용하여 70개의 클론을 생성하게 된다. 생성된 클론들은 정확도에 반비례한 정도로 변형시키게 된다. 즉, 이상을 잘 잡아내는 좋은 성능의 검출기일수록 검출기의 중심과 반지름을 작게 변형시키고, 이상을 잘 잡아내지 못하는 검출기일수록 검출기의 중심과 반지름을 크게 변형시킨다. 70개의 변형된 클론들 중 30개의 가장 정확도가 높은 detector들은 memory set으로 구성할 후보로 선택한다. 이 때, 최초의 memory set은 초기 생성된 detector 중 가장 성능이 좋은 30개의 detector로 구성되게 된다. 후보로 선택된 30 개의 detector 중에서 기존 memory set 보다 더 정확도(성능)가 높을 경우, 기존 memory set에서 후보로 있던 클론들로 대체하면서 업데이트하게 된다. 이를 통해서 클론 선택 알고리즘의 1 세대(generation)가 마무리되고 설정된 횟수만큼 상술한 과정을 반복하여 detector의 성능이 업데이트된다.
이상과 같이 본 발명에서는 구체적인 구성 소자 등과 같은 특정 사항들과 한정된 실시예 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것 일 뿐, 본 발명은 상기의 일 실시예에 한정되는 것이 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허 청구 범위뿐 아니라 이 특허 청구 범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
100 : 초기 검출부
200 : 제1 클론 선택부
300 : 제1 클론 처리부
400 : 후기 검출부
500 : 제2 클론 선택부
600 : 제2 클론 처리부
700 :이상감지부

Claims (13)

  1. 입력되는 데이터를 수집하여 학습 처리를 통해 유클리드 거리(Euclidean distance) 기반의 이상 감지 검출기를 생성하는 초기 검출부(100);
    새롭게 입력되는 테스트 데이터를 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기에 입력하여, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하는 제1 클론 선택부(200);
    상기 제1 클론 선택부(200)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하고, 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 초기 검출부(100)에 의한 상기 이상 감지 검출기의 업데이트를 수행하는 제1 클론 처리부(300);
    새롭게 입력되는 테스트 데이터를 상기 제1 클론 처리부(300)에 의해 업데이트한 상기 이상 감지 검출기에 입력하여, 출력 결과를 토대로 새로운 이상 감지 검출기를 소정 횟수 반복 생성하는 후기 검출부(400);
    새롭게 입력되는 테스트 데이터를 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기에 입력하여, 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 출력받아, 상기 근접도 연산 값을 이용하여 소정 기준에 따라 상기 입력되는 테스트 데이터 중 특정 테스트 데이터를 선택하는 제2 클론 선택부(500); 및
    상기 제2 클론 선택부(500)에 의해 선택된 상기 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하고, 상기 복제 테스트 데이터를 정상 상태 판별 데이터로 적용하여, 상기 후기 검출부(400)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하는 제2 클론 처리부(600);
    를 포함하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  2. 제 1항에 있어서,
    상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템은
    고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 센싱 신호 데이터를 전달받아 수행하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  3. 제 2항에 있어서,
    상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템은
    고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터, 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아, 상기 제2 클론 처리부(600)에 의해 업데이트한 다수의 이상 감지 검출기 모두에 입력하여, 모든 이상 감지 검출기로부터 감지되지 않을 경우, 정상 데이터로 판별하는 이상감지부(700);
    를 더 포함하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  4. 제 3항에 있어서,
    상기 제2 클론 처리부(600)는
    상기 이상감지부(700)의 판별 결과에 따라, 비정상 데이터로 판별된 데이터를 이용하여, 다수의 이상 감지 검출기 중 선택되는 어느 하나의 업데이트를 수행하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  5. 제 2항에 있어서,
    상기 초기 검출부(100)와 상기 후기 검출부(400)는
    NSA(Negative Selection Algorithm) 기법을 이용하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  6. 제 5항에 있어서,
    상기 제1 클론 선택부(200), 제1 클론 처리부(300), 제2 클론 선택부(500)와 제2 클론 처리부(600)는
    CSA(Clonal Selection Algorithm) 기법을 이용하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  7. 제 5항에 있어서,
    상기 후기 검출부(400)는
    새롭게 입력되는 테스트 데이터를 상기 이상 감지 검출기에 순차적으로 입력하여, 최초로 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 이상 감지 검출기를 생성하고,
    이 후, 테스트 데이터를 기존 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에 입력하여, 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 또다른 이상 감지 검출기를 생성하되,
    기입력되는 소정 횟수만큼 새로운 이상 감지 검출기의 생성을 반복하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템.
  8. 컴퓨터로 구현되는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템에 의해 각 단계가 수행되는 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법에 있어서,
    초기 검출부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 정상 상태로 판별된 데이터를 입력받는 정상 데이터 입력 단계(S100);
    초기 검출부에서, 상기 정상 데이터 입력 단계(S100)에 의한 상기 데이터에 대한 학습 처리를 수행하여, 유클리드 거리(Euclidean distance) 기반의 이상 감지 검출기를 출력하는 초기 검출 생성 단계(S200);
    제1 클론 선택부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 초기 검출 생성 단계(S200)에 의한 상기 이상 감지 검출기에 입력하여, 각 테스트 데이터 별 근접도 연산 값을 출력받는 초기 출력 단계(S300);
    제1 클론 선택부에서, 상기 초기 출력 단계(S300)에 의한 각 테스트 데이터 별 근접도 연산 값을 이용하여, 소정 기준에 따라 입력되는 상기 테스트 데이터 중 특정 테스트 데이터를 선택하는 제1 클론 선택 단계(S400);
    제1 클론 처리부에서, 상기 제1 클론 선택 단계(S400)에 의해 선택된 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하는 제1 클론 생성 단계(S500);
    제1 클론 처리부에서, 상기 제1 클론 생성 단계(S500)에 의해 생성한 상기 복제 테스트 데이터를 정상 상태로 판별된 데이터로 적용하여, 상기 초기 검출 생성 단계(S200)에 의해 출력한 상기 이상 감지 검출기의 업데이트를 수행하는 제1 클론 처리 단계(S600);
    후기 검출부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 제1 클론 처리 단계(S600)에 의해 업데이트한 상기 이상 감지 검출기에 입력하여, 출력 결과를 토대로 새로운 이상 감지 검출기를 소정 횟수 반복 생성하는 후기 검출 생성 단계(S700);
    제2 클론 선택부에서, 고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터 새롭게 입력되는 테스트 데이터를 입력받아, 상기 후기 검출 생성 단계(S700)에 의한 다수의 이상 감지 검출기에 입력하여, 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산값을 출력받는 후기 출력 단계(S800);
    제2 클론 선택부에서, 상기 후기 출력 단계(S800)에 의한 각 이상 감지 검출기 별, 각 테스트 데이터 별 근접도 연산 값을 이용하여, 소정 기준에 따라 상기 입력되는 상기 테스트 데이터 중 특정 테스트 데이터를 선택하는 제2 클론 선택 단계(S900);
    제2 클론 처리부에서, 상기 제2 클론 선택 단계(S900)에 의해 선택된 특정 테스트 데이터에 대한 복제 테스트 데이터를 생성하는 제2 클론 생성 단계(S1000); 및
    제2 클론 처리부에서, 상기 제2 클론 생성 단계(S1000)에 의해 생성한 상기 복제 테스트 데이터를 정상 상태로 판별된 데이터로 적용하여, 상기 후기 출력 단계(S800)에 의한 다수의 이상 감지 검출기의 업데이트를 수행하는 제2 클론 처리 단계(S1100);
    를 포함하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법.
  9. 제 8항에 있어서,
    상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법은
    고장 진단을 위한 이상 감지를 적용하고자 하는 산업 분야에서의 운영 시스템으로부터, 다중분류 이상감지를 수행하고자 하는 데이터를 입력받아, 상기 제2 클론 처리 단계(S1100)에 의해 업데이트한 다수의 이상 감지 검출기 모두에 입력하여, 모든 이상 감지 검출기로부터 감지되지 않을 경우, 정상 데이터로 판별하는 이상감지 단계(S1200);
    를 더 포함하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법.
  10. 제 9항에 있어서,
    상기 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법은
    상기 이상감지 단계(S1200)의 판별 결과에 따라, 비정상 데이터로 판별된 데이터를 이용하여, 제2 클론 처리 단계(S1100)에 의해 업데이트한 다수의 이상 감지 검출기 중 선택되는 어느 하나의 추가 업데이트를 수행하는 이상감지 적용단계(S1300);
    를 더 포함하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법.
  11. 제 8항에 있어서,
    초기 검출부와 후기 검출부에서, NSA(Negative Selection Algorithm) 기법을 이용하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법.
  12. 제 11항에 있어서,
    제1 클론 선택부, 제1 클론 처리부, 제2 클론 선택부와 제2 클론 처리부에서, CSA(Clonal Selection Algorithm) 기법을 이용하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법.
  13. 제 11항에 있어서,
    상기 후기 검출 생성 단계(S700)는
    새롭게 입력되는 테스트 데이터를 상기 이상 감지 검출기에 순차적으로 입력하여, 최초로 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 이상 감지 검출기를 생성하고,
    이 후, 테스트 데이터를 기존 이상 감지 검출기와 새롭게 생성한 이상 감지 검출기 모두에 입력하여, 이상 데이터로 판단될 경우, 해당하는 테스트 데이터를 적용하여 새로운 또다른 이상 감지 검출기를 생성하되,
    기입력되는 소정 횟수만큼 새로운 이상 감지 검출기의 생성을 반복하는, 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 방법.
KR1020220007772A 2022-01-19 2022-01-19 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법 KR20230111831A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220007772A KR20230111831A (ko) 2022-01-19 2022-01-19 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220007772A KR20230111831A (ko) 2022-01-19 2022-01-19 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR20230111831A true KR20230111831A (ko) 2023-07-26

Family

ID=87427590

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220007772A KR20230111831A (ko) 2022-01-19 2022-01-19 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR20230111831A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102091076B1 (ko) 2019-04-16 2020-03-20 주식회사 이글루시큐리티 지도학습기반의 경보분석과 비지도학습기반의 이상행위탐지 기법을 혼용한 지능형 보안관제 시스템 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102091076B1 (ko) 2019-04-16 2020-03-20 주식회사 이글루시큐리티 지도학습기반의 경보분석과 비지도학습기반의 이상행위탐지 기법을 혼용한 지능형 보안관제 시스템 및 그 방법

Similar Documents

Publication Publication Date Title
US10970650B1 (en) AUC-maximized high-accuracy classifier for imbalanced datasets
Mirza et al. Weighted online sequential extreme learning machine for class imbalance learning
Mohammed et al. Peripheral blood smear image analysis: A comprehensive review
Kunakorntum et al. A synthetic minority based on probabilistic distribution (SyMProD) oversampling for imbalanced datasets
Khan et al. Improving Multi-Organ Cancer Diagnosis through a Machine Learning Ensemble Approach
Ibrahim et al. Intelligent breast cancer diagnosis based on enhanced Pareto optimal and multilayer perceptron neural network
Garćia et al. Noisy data set identification
Kim et al. Multiclass anomaly detection for unsupervised and semi-supervised data based on a combination of negative selection and clonal selection algorithms
Chelly et al. Hybridization schemes of the fuzzy dendritic cell immune binary classifier based on different fuzzy clustering techniques
Zhao et al. EGDCL: An adaptive curriculum learning framework for unbiased glaucoma diagnosis
Essa et al. Toward cognitive support for automated defect detection
Polat et al. Medical decision support system based on artificial immune recognition immune system (AIRS), fuzzy weighted pre-processing and feature selection
Zhu et al. Severity detection of COVID-19 infection with machine learning of clinical records and CT images
Kumar et al. Imbalanced classification in diabetics using ensembled machine learning
Abuhaija et al. A comprehensive study of machine learning for predicting cardiovascular disease using Weka and SPSS tools
Sun et al. SMOTE-kTLNN: A hybrid re-sampling method based on SMOTE and a two-layer nearest neighbor classifier
Sowkarthika et al. Data complexity-based dynamic ensembling of svms in classification
MS et al. A survey on detecting healthcare concept drift in AI/ML models from a finance perspective
KR20230111831A (ko) 인공면역 알고리즘을 활용한 데이터의 다중분류 이상감지 시스템 및 그 방법
Tripathi et al. A novel adaptive minority oversampling technique for improved classification in data imbalanced scenarios
Mary et al. Investigating of classification algorithms for heart disease risk prediction
US20230237371A1 (en) Systems and methods for providing predictions with supervised and unsupervised data in industrial systems
KR20220132804A (ko) 메타데이터셋을 이용한 샘플링 방법 및 분류 알고리즘 추천 장치 및 방법
Lango et al. Imweights: classifying imbalanced data using local and neighborhood information
Sotiropoulos et al. Artificial immune system-based classification in extremely imbalanced classification problems

Legal Events

Date Code Title Description
E902 Notification of reason for refusal