KR20230075259A - 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법 - Google Patents

클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법 Download PDF

Info

Publication number
KR20230075259A
KR20230075259A KR1020210161700A KR20210161700A KR20230075259A KR 20230075259 A KR20230075259 A KR 20230075259A KR 1020210161700 A KR1020210161700 A KR 1020210161700A KR 20210161700 A KR20210161700 A KR 20210161700A KR 20230075259 A KR20230075259 A KR 20230075259A
Authority
KR
South Korea
Prior art keywords
connected component
label
nodes
cluster
processing unit
Prior art date
Application number
KR1020210161700A
Other languages
English (en)
Inventor
박영현
정성욱
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020210161700A priority Critical patent/KR20230075259A/ko
Priority to PCT/KR2022/017411 priority patent/WO2023085717A1/ko
Publication of KR20230075259A publication Critical patent/KR20230075259A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19107Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection

Abstract

본 발명의 레이블링을 수행하기 위한 방법은 클러스터부가 복수의 데이터가 입력되면, 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성하는 단계와, 상기 클러스터부가 상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 단계와, 레이블처리부가 상기 생성된 클러스터에 대해 연결 성분 분석(Connected Component Analysis)을 수행하여 하나 이상의 연결 성분을 도출하는 단계와, 상기 레이블처리부가 상기 연결 성분에 대해 레이블링을 수행하는 단계를 포함한다.

Description

클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법{Apparatus for anomaly detection based on clustering and method therefor}
본 발명은 레이블링 기술에 관한 것으로, 더욱 상세하게는, 클러스터링을 기반으로 하는 자동으로 레이블링을 수행하기 위한 장치 및 이를 위한 방법에 관한 것이다.
스마트팩토리 분야에서, 작업 효율화를 위해 기계학습 (machine learning) 또는 심층기계학습 (deep learning) 기법을 도입하는 사례가 늘고있다. 대표적인 예로 제조업체에서는 생산품에 대한 양품/불량품 판정을 고속화, 자동화하기 위한 목적으로 상기 방법을 도입하기도 한다. 이때 종래의 방법은 양품/불량품 판정을 수행할 기계학습 모델을 구축하기 위해 레이블이 포함된 데이터 세트가 필요하다는 한계점이 있다. 이상 탐지 범주의 모델을 구축한다고 가정할 때에도 정상 범주의 데이터를 탐색, 레이블링을 수행하여야 한다. 제조업체 입장에서 생산되는 제품의 양과 속도로 인해 생산품에 대해 전수검사 방식의 수동 레이블링 작업은 큰 부담이 될 수 있다.
한국등록특허 제2297232호 (2021년 08월 27일 등록)
본 발명의 목적은 클러스터링을 기반의 레이블링을 수행함으로써 레이블링 시간 및 비용을 최소화할 수 있는 장치 및 이를 위한 방법을 제공함에 있다.
본 발명의 실시예에 따른 레이블링을 수행하기 위한 방법은 클러스터부가 복수의 데이터가 입력되면, 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성하는 단계와, 상기 클러스터부가 상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 단계와, 레이블처리부가 상기 생성된 클러스터에 대해 연결 성분 분석(Connected Component Analysis)을 수행하여 하나 이상의 연결 성분을 도출하는 단계와, 상기 레이블처리부가 상기 연결 성분에 대해 레이블링을 수행하는 단계를 포함한다.
상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 단계는 상기 클러스터부가 상기 클러스터 내의 노드의 노드값과, 어느 하나의 노드와 다른 노드 간의 거리 혹은 상관관계를 나타내는 에지값을 산출하는 단계를 포함한다.
상기 연결 성분에 대해 레이블을 부여하는 단계는 상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드 간 에지값의 평균에 따라 상기 연결 성분에 대한 레이블을 결정하는 단계를 포함한다.
일 실시예에 따르면, 상기 레이블을 결정하는 단계는 상기 에지값이 상기 벡터공간 상에서의 노드 간 거리를 나타내는 경우, 상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 낮은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 한다.
다른 실시예에 따르면, 상기 레이블을 결정하는 단계는 상기 에지값이 상기 벡터공간 상에서의 노드 간 상관 관계를 나타내는 경우, 상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 높은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 한다.
본 발명의 실시예에 따른 레이블링을 수행하기 위한 장치는 복수의 데이터가 입력되면, 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성하고, 상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 클러스터부와, 상기 생성된 클러스터에 대해 연결 성분 분석(Connected Component Analysis)을 수행하여 하나 이상의 연결 성분을 도출하고, 도출된 연결 성분에 대해 레이블링을 수행하는 레이블처리부를 포함한다.
상기 클러스터부는 상기 클러스터 내의 노드의 노드값과, 어느 하나의 노드와 다른 노드 간의 거리 혹은 상관관계를 나타내는 에지값을 산출하는 것을 특징으로 한다.
상기 레이블처리부는 상기 연결 성분에 포함된 복수의 노드 간 에지값의 평균에 따라 상기 연결 성분에 대한 레이블을 결정하는 것을 특징으로 한다.
일 실시예에 따르면, 상기 레이블처리부는 상기 에지값이 상기 벡터공간 상에서의 노드 간 거리를 나타내는 경우, 상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 낮은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 한다.
다른 실시예에 따르면, 상기 레이블처리부는 상기 에지값이 상기 벡터공간 상에서의 노드 간 상관 관계를 나타내는 경우, 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 높은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 한다.
본 발명에 따르면, 클러스터링을 기반으로 자동 혹은 반자동으로 레이블링을 수행할 수 있다. 이에 따라, 양품 및 불량품을 분류하거나, 양품 및 불량품 생산 조건을 분류해주는 모델 생성 시, 레이블링 비용 및 시간에 대한 부담을 경감시킬 수 있다.
도 1은 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 장치의 구성을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 장치의 세부적인 구성을 설명하기 위한 도면이다.
도 3은 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 방법을 설명하기 위한 도면이다.
본 발명의 과제 해결 수단의 특징 및 이점을 보다 명확히 하기 위하여, 첨부된 도면에 도시된 본 발명의 특정 실시 예를 참조하여 본 발명을 더 상세하게 설명한다.
다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.
이하의 설명 및 도면에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.
더하여, 어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급할 경우, 이는 논리적 또는 물리적으로 연결되거나, 접속될 수 있음을 의미한다. 다시 말해, 구성요소가 다른 구성요소에 직접적으로 연결되거나 접속되어 있을 수 있지만, 중간에 다른 구성요소가 존재할 수도 있으며, 간접적으로 연결되거나 접속될 수도 있다고 이해되어야 할 것이다.
또한, 본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 본 명세서에서 기술되는 "포함 한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
아울러, 본 발명의 범위 내의 실시 예들은 컴퓨터 실행가능 명령어 또는 컴퓨터 판독가능 매체에 저장된 데이터 구조를 가지거나 전달하는 컴퓨터 판독가능 매체를 포함한다. 이러한 컴퓨터 판독가능 매체는, 범용 또는 특수 목적의 컴퓨터 시스템에 의해 액세스 가능한 임의의 이용 가능한 매체일 수 있다. 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EPROM, CD-ROM 또는 기타 광 디스크 저장장치, 자기 디스크 저장장치 또는 기타 자기 저장장치, 또는 컴퓨터 실행가능 명령어, 컴퓨터 판독가능 명령어 또는 데이터 구조의 형태로 된 소정의 프로그램 코드 수단을 저장하거나 전달하는 데에 이용될 수 있고, 범용 또는 특수 목적 컴퓨터 시스템에 의해 액세스 될 수 있는 임의의 기타 매체와 같은 물리적 저장 매체를 포함할 수 있지만, 이에 한정되지 않는다.
아울러, 본 발명은 퍼스널 컴퓨터, 랩탑 컴퓨터, 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서-기반 또는 프로그램 가능한 가전제품(programmable consumer electronics), 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 모바일 전화, PDA, 페이저(pager) 등을 포함하는 다양한 유형의 컴퓨터 시스템 구성을 가지는 네트워크 컴퓨팅 환경에서 적용될 수 있다. 본 발명은 또한 네트워크를 통해 유선 데이터 링크, 무선 데이터 링크, 또는 유선 및 무선 데이터 링크의 조합으로 링크된 로컬 및 원격 컴퓨터 시스템 모두가 태스크를 수행하는 분산형 시스템 환경에서 실행될 수 있다. 분산형 시스템 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치에 위치될 수 있다.
먼저, 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 장치에 대해서 설명하기로 한다. 도 1은 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 장치의 구성을 설명하기 위한 도면이다. 도 2는 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 장치의 세부적인 구성을 설명하기 위한 도면이다.
먼저, 도 1을 참조하면, 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 장치(10: 이하, '레이블링장치'로 칭함)는 데이터수집부(11), 입력부(12), 표시부(13), 저장부(14) 및 제어부(15)를 포함한다.
데이터수집부(11)는 데이터를 수집하기 위한 것이다. 여기서, 데이터는 스마트팩토리 등의 생산 시설에서 생산된 제품에 대한 양품 혹은 불량품 판정을 위해 소정의 센서를 통해 생산된 제품을 측정한 측정값이 될 수 있다. 이러한 데이터는 예컨대, 길이, 무게, 모양, 꺾임 또는 충격을 견디는 정도, 압력을 견디는 정도, 탄성 등이 될 수 있다. 데이터수집부(11)는 제어부(15)의 제어에 따라 수집된 데이터를 저장부(14)에 저장할 수 있다.
입력부(12)는 레이블링장치(10)를 제어하기 위한 사용자의 키 조작을 입력 받고 입력 신호를 생성하여 제어부(15)로 전달한다. 특히, 입력부(12)는 사용자의 연결 성분에 대한 레이블, 색 등을 지정하는 입력을 감지하여 제어부(15)로 전달할 수 있다. 입력부(12)는 전원 on/off를 위한 전원 키, 숫자 키, 방향키 중 어느 하나를 포함할 수 있으며, 레이블링장치(10)의 일면에 소정의 기능키로 형성될 수 있다. 표시부(13)가 터치스크린으로 이루어진 경우, 입력부(12)의 각 종 키들의 기능이 표시부(13)에서 이루어질 수 있으며, 터치스크린만으로 모든 기능을 수행할 수 있는 경우, 입력부(12)는 생략될 수도 있다.
표시부(13)는 화면 표시를 위한 것으로, 레이블링장치(10)의 메뉴, 입력된 데이터, 기능 설정 정보 및 기타 다양한 정보를 사용자에게 시각적으로 제공할 수 있다. 특히, 표시부(13)는 제어부(15)의 제어에 따라 복수의 데이터에 대응하는 복수의 노드를 포함하는 클러스터를 화면으로 표시할 수 있다. 표시부(13)는 액정표시장치(LCD, Liquid Crystal Display), 유기 발광 다이오드(OLED, Organic Light Emitting Diodes), 능동형 유기 발광 다이오드(AMOLED, Active Matrix Organic Light Emitting Diodes) 등으로 형성될 수 있다. 한편, 표시부(13)는 터치스크린으로 구현될 수 있다. 이러한 경우, 표시부(13)는 터치센서를 포함한다. 터치센서는 사용자의 터치 입력을 감지한다. 터치센서는 정전용량 방식(capacitive overlay), 압력식, 저항막 방식(resistive overlay), 적외선 감지 방식(infrared beam) 등의 터치 감지 센서로 구성되거나, 압력 감지 센서(pressure sensor)로 구성될 수도 있다. 상기 센서들 이외에도 물체의 접촉 또는 압력을 감지할 수 있는 모든 종류의 센서 기기가 본 발명의 터치센서로 이용될 수 있다. 터치센서는 사용자의 터치 입력을 감지하고, 터치된 위치를 나타내는 입력 좌표를 포함하는 감지 신호를 발생시켜 제어부(15)로 전송할 수 있다. 이러한 경우, 표시부(13)는 사용자의 연결 성분에 대한 레이블, 색 등을 지정하는 입력을 감지하여 제어부(15)로 전달할 수 있다.
저장부(14)는 레이블링장치(10)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행하며, 프로그램 영역과 데이터 영역으로 구분될 수 있다. 프로그램 영역은 레이블링장치(10)의 전반적인 동작을 제어하는 프로그램 및 레이블링장치(10)를 부팅시키는 운영체제(OS, Operating System), 응용 프로그램 등을 저장할 수 있다. 데이터 영역은 레이블링장치(10)의 사용 및 동작에 따라 발생하는 데이터가 저장되는 영역이다. 특히, 데이터수집부(11)가 수집한 데이터를 저장할 수 있다. 저장부(14)에 저장되는 각 종 데이터는 삭제, 변경, 추가될 수 있다.
제어부(15)는 레이블링장치(10)의 전반적인 동작 및 레이블링장치(10)의 내부 블록들 간 신호 흐름을 제어하고, 데이터를 처리하는 데이터 처리 기능을 수행할 수 있다. 또한, 제어부(15)는 기본적으로, 레이블링장치(10)의 각 종 기능을 제어하는 역할을 수행한다. 제어부(15)는 중앙처리장치(CPU: Central Processing Unit), 디지털신호처리기(DSP: Digital Signal Processor) 등을 예시할 수 있다. 도 2를 참조하면, 제어부(15)는 클러스터부(100) 및 레이블처리부(200)를 포함한다.
클러스터부(100)는 데이터를 클러스터링하여 데이터 클러스터를 생성하기 위한 것이다. 이를 위하여, 클러스터부(100)는 복수의 데이터가 입력되면, 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성한다. 그런 다음, 클러스터부(100)는 소정의 클러스터링 알고리즘에 따라 복수의 노드를 클러스터링하여 클러스터를 생성한다. 여기서, 클러스터링 알고리즘은 K-means clustering, Mean-shift clustering, DBSCAN, Expectation-maximization clustering, Agglomerative Hierarchical Clustering 등을 예시할 수 있다.
레이블처리부(200)는 클러스터부(100)가 생성한 클러스터에 대해 연결 성분 분석(Connected Component Analysis)을 수행하여 하나 이상의 연결 성분(CC: Connected Component)을 도출한다. 그리고 레이블처리부(200)는 연결 성분에 대해 레이블링을 수행한다.
전술한 클러스터부(100) 및 레이블처리부(200)를 포함하는 제어부(15)의 동작에 대해서는 아래에서 더 상세하게 설명될 것이다.
다음으로, 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 방법에 대해서 설명하기로 한다. 도 3은 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 방법을 설명하기 위한 흐름도이다. 도 4는 본 발명의 실시예에 따른 클러스터링을 기반의 레이블링을 수행하기 위한 방법을 설명하기 위한 도면이다.
도 3을 참조하면, 클러스터부(100)는 S110 단계에서 지속적으로 복수의 데이터를 입력 받는다. 이때, 데이터는 데이터수집부(11)를 통해 수집되는 데이터이거나, 저장부(14)에 저장된 데이터가 될 수 있다. 이러한 데이터는 제품에 대한 양품 혹은 불량품 판정을 위해 소정의 센서를 통해 생산된 제품을 측정한 측정값이 될 수 있다.
복수의 데이터가 입력되면, 클러스터부(100)는 S120 단계에서 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성한다. 일례로, 벡터 공간은 제품의 길이와 탄성을 축으로 하는 2차원의 벡터 공간이 될 수 있다. 그 밖에 벡터 공간을 구성하는 축은 제품의 양부를 판정하기 위해 생산된 제품을 소정의 센서로 측정한 측정값으로 구성될 수 있다. 이러한 축은 예컨대, 길이, 무게, 모양, 꺾임 또는 충격을 견디는 정도, 압력을 견디는 정도, 탄성 등이 될 수 있다.
다음으로, 클러스터부(100)는 S130 단계에서 복수의 노드를 클러스터링하여 클러스터를 생성한다. 생성된 클러스터의 일 예가 도 4의 (A)에 도시되었다. 도시된 바와 같이, 복수의 노드가 하나의 클러스터에 포함된다. 이러한 클러스터링에 따라 클러스터부(100)는 클러스터 내의 복수의 노드 각각의 노드값과, 복수의 노드 간의 에지값을 도출할 수 있다. 여기서, 노드값은 해당 노드의 벡터공간 상에서의 값을 의미하며, 에지값은 노드와 노드 간 거리 혹은 상관관계를 나타낸다.
다음으로, 레이블처리부(200)는 생성된 클러스터에 대해 연결 성분 분석(Connected component analysis)을 수행하여 하나 이상의 연결 성분(CC)을 도출한다. 도 4의 (A)에 도시된 클러스터의 경우, 2개의 연결 성분, 즉, 제1 연결 성분(CC1) 및 제2 연결 성분(CC2)를 도출할 수 있다.
이어서, 레이블처리부(200)는 S150 단계에서 레이블 모드가 자동 혹은 반자동으로 레이블링을 수행하는 자동 모드인지 혹은 수동으로 레이블링을 수행하는 수동 모드인지 여부를 확인한다.
S150 단계의 확인 결과, 자동 모드의 경우, S160 단계로 진행하고, 수동 모드의 경우, S170 단계로 진행한다.
자동 모드의 경우, 레이블처리부(200)는 S160 단계에서 연결 성분(CC)에 포함된 복수의 노드 간 에지값의 평균에 따라 연결 성분(CC)에 대한 레이블을 결정하고, 결정된 레이블을 부여한다. 이때, 에지값이 벡터공간 상에서의 노드 간 거리를 나타내는 경우, 레이블처리부(200)는 연결 성분(CC)에 포함된 복수의 노드 간 에지값의 평균이 가장 낮은 연결 성분(CC)의 레이블을 정상으로 부여한다. 그리고, 나머지 연결 성분(CC)은 모두 레이블을 이상으로 부여한다. 도 4를 예로 들면, 에지값이 벡터공간 상에서의 노드 간 거리인 경우, 제1 연결 성분(CC1)의 에지값의 평균이 제2 연결 성분(CC2)의 에지값의 평균 보다 낮다. 따라서 제1 연결 성분(CC1)에 정상 레이블이 부여되며, 제2 연결 성분(CC2)에 이상 레이블이 부여된다. 즉, 제1 연결 성분(CC)에 포함된 복수의 노드에 대응하는 복수의 데이터에 대한 레이블이 '정상 데이터'으로 부여된다. 또한, 제2 연결 성분(CC)에 포함된 복수의 노드에 대응하는 복수의 데이터에 대한 레이블이 '이상 데이터'로 부여된다.
또한, 에지값이 벡터공간 상에서의 노드 간 상관 관계(상관도)를 나타내는 경우, 레이블처리부(200)는 연결 성분(CC)에 포함된 복수의 노드 간 에지값의 평균이 가장 높은 연결 성분(CC)의 레이블을 정상으로 부여한다. 이에 따라, 해당 연결 성분(CC)에 포함된 노드에 대응하는 데이터에 대한 레이블이 '정상'으로 부여된다. 그리고, 나머지 연결 성분(CC)은 모두 레이블을 이상으로 부여한다. 도 4를 예로 들면, 에지값이 벡터공간 상에서의 노드 간 거리인 경우, 제1 연결 성분(CC1)의 에지값의 평균이 제2 연결 성분(CC2)의 에지값의 평균 보다 높다. 따라서 제1 연결 성분(CC1)에 정상 레이블이 부여되며, 제2 연결 성분(CC2)에 이상 레이블이 부여된다. 즉, 제1 연결 성분(CC)에 포함된 복수의 노드에 대응하는 복수의 데이터에 대한 레이블이 '정상 데이터'으로 부여된다. 또한, 제2 연결 성분(CC)에 포함된 복수의 노드에 대응하는 복수의 데이터에 대한 레이블이 '이상 데이터'로 부여된다.
한편, 전술한 S160 단계는 반자동 모드로 실행될 수 있다. 자동 모드와 반자동 모드는 모두 동일한 프로세스로 수행되지만, 반자동 모드의 경우, 레이블처리부(200)는 레이블을 부여하기 전, 표시부(13)를 통해 레이블 부여 대상 연결 성분 및 해당 연결 성분에 부여되는 레이블을 표시하고, 사용자의 확인 입력에 따라 레이블링을 수행한다.
수동 모드의 경우, 레이블처리부(200)는 S170 단계에서 연결 성분, 노드값 및 에지값을 표시부(13)를 통해 표시한다. 예컨대, 도 4의 (A)와 같은 화면을 표시할 수 있다. 사용자는 표시된 연결 성분, 노드값 및 에지값을 열람하고, 입력부(12) 혹은 표시부(13)를 통해 자신이 원하는 바에 따라 레이블을 부여하고자 하는 대상 및 레이블(정상/이상)을 입력할 수 있다. 이에 따라, 레이블처리부(200)는 S180 단계에서 입력부(12) 혹은 표시부(13)를 통해 감지된 사용자의 입력에 따라 레이블을 부여하고자 하는 대상을 한정하고, 한정된 대상에 대해 사용자가 입력한 레이블을 부여한다.
전술한 S160 및 S180 단계와 같이 레이블이 부여되면, 레이블처리부(200)는 S190 단계에서 서로 다른 레이블이 부여된 노드를 구분하여 표시한다. 예컨대, 도 4의 (B)에 도시된 바와 같이, 정상 데이터로 레이블이 부여된 제1 연결 성분(CC1)에 포함된 노드는 제1 색(예컨대, 파란색)으로 표시하고, 이상 데이터로 레이블이 부여된 제2 연결 성분(CC2)에 포함된 노드는 제2 색(예컨대, 빨간색)으로 표시할 수 있다.
추가적인 실시예에 따르면, 연결 성분(CC)에 포함된 복수의 노드의 에지값의 평균에 비례하여 대응하는 복수의 색을 포함하는 색상표를 마련하고, 마련된 색상표에서 연결 성분(CC)에 포함된 복수의 노드의 에지값의 평균에 대응하는 색을 선택하여 연결 성분(CC)에 포함된 복수의 노드에 대한 색으로 표시할 수 있다. 예를 들면, 색상표에 따르면, 에지값이 벡터공간 상에서의 노드 간 상관 관계를 나타내는 경우, 에지값의 평균이 높을수록 제1 색(예컨대, 파란색)에 가까운 색이 매핑 되며, 에지값의 평균이 낮을수록 제2 색(예컨대, 빨간색)에 가까운 색이 매핑 될 수 있다.
스마트팩토리 등을 도입한 제조업의 제조 단계에서, 수율 향상을 위한 노력으로 생산 조건 혹은 생산 조건에 따른 생산품에 대한 분석이 요구된다. 양품 및 불량품을 분류하거나, 양품 및 불량품 생산 조건을 분류해주는 모델이 있다면 불량품 생산 조건이 발생한 상황에서 생산을 중단, 장비 또는 환경 정비가 가능하다. 다만, 이러한 모델을 구축하기 위해선 생산 조건에 대한 전수 검사 및 레이블링을 수행하여야 하는 번거로움이 있다. 본 발명은 이러한 문제를 해결하여 생산 조건 혹은 생산품에 대한 데이터를 자동으로 수집, 레이블링을 반자동으로 수행함으로써 양품 및 불량품을 분류하거나, 양품 및 불량품 생산 조건을 분류해주는 모델 생성 시, 레이블링 비용 및 시간에 대한 부담을 경감시킬 수 있다.
본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안 되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.
마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다.
본 명세서에서 설명한 주제의 특정한 실시형태를 설명하였다. 기타의 실시형태들은 이하의 청구항의 범위 내에 속한다. 예컨대, 청구항에서 인용된 동작들은 상이한 순서로 수행되면서도 여전히 바람직한 결과를 성취할 수 있다. 일 예로서, 첨부도면에 도시한 프로세스는 바람직한 결과를 얻기 위하여 반드시 그 특정한 도시된 순서나 순차적인 순서를 요구하지 않는다. 특정한 구현예에서, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다.
본 기술한 설명은 본 발명의 최상의 모드를 제시하고 있으며, 본 발명을 설명하기 위하여, 그리고 당업자가 본 발명을 제작 및 이용할 수 있도록 하기 위한 예를 제공하고 있다. 이렇게 작성된 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하는 것이 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다.
따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.
본 발명은 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법에 관한 것이다. 이러한 본 발명은 클러스터링을 기반으로 자동 혹은 반자동으로 레이블링을 수행할 수 있다. 이에 따라, 양품 및 불량품을 분류하거나, 양품 및 불량품 생산 조건을 분류해주는 모델 생성 시, 레이블링 비용 및 시간에 대한 부담을 경감시킬 수 있다. 따라서 본 발명은 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있다.
10: 레이블링장치 11: 데이터수집부
12: 입력부 13: 표시부
14: 저장부 15: 제어부
100: 클러스터부 200: 레이블처리부

Claims (10)

  1. 클러스터부가 복수의 데이터가 입력되면, 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성하는 단계;
    상기 클러스터부가 상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 단계;
    레이블처리부가 상기 생성된 클러스터에 대해 연결 성분 분석(Connected Component Analysis)을 수행하여 하나 이상의 연결 성분을 도출하는 단계;
    상기 레이블처리부가 상기 연결 성분에 대해 레이블링을 수행하는 단계;
    를 포함하는 것을 특징으로 하는
    레이블링을 수행하기 위한 방법.
  2. 제1항에 있어서,
    상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 단계는
    상기 클러스터부가 상기 클러스터 내의 노드의 노드값과, 어느 하나의 노드와 다른 노드 간의 거리 혹은 상관관계를 나타내는 에지값을 산출하는 단계를 포함하는 것을 특징으로 하는
    레이블링을 수행하기 위한 방법.
  3. 제1항에 있어서,
    상기 연결 성분에 대해 레이블을 부여하는 단계는
    상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드 간 에지값의 평균에 따라 상기 연결 성분에 대한 레이블을 결정하는 단계를 포함하는 것을 특징으로 하는
    레이블링을 수행하기 위한 방법.
  4. 제3항에 있어서,
    상기 레이블을 결정하는 단계는
    상기 에지값이 상기 벡터공간 상에서의 노드 간 거리를 나타내는 경우,
    상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 낮은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 하는
    레이블링을 수행하기 위한 방법.
  5. 제3항에 있어서,
    상기 레이블을 결정하는 단계는
    상기 에지값이 상기 벡터공간 상에서의 노드 간 상관 관계를 나타내는 경우,
    상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 높은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 하는
    레이블링을 수행하기 위한 방법.
  6. 복수의 데이터가 입력되면, 입력되는 복수의 데이터를 소정의 벡터 공간에 사상하여 복수의 노드를 형성하고, 상기 복수의 노드를 클러스터링하여 클러스터를 생성하는 클러스터부; 및
    상기 생성된 클러스터에 대해 연결 성분 분석(Connected Component Analysis)을 수행하여 하나 이상의 연결 성분을 도출하고, 도출된 연결 성분에 대해 레이블링을 수행하는 레이블처리부;
    를 포함하는 것을 특징으로 하는
    레이블링을 수행하기 위한 장치.
  7. 제6항에 있어서,
    상기 클러스터부는
    상기 클러스터 내의 노드의 노드값과, 어느 하나의 노드와 다른 노드 간의 거리 혹은 상관관계를 나타내는 에지값을 산출하는 것을 특징으로 하는
    레이블링을 수행하기 위한 장치.
  8. 제6항에 있어서,
    상기 레이블처리부는
    상기 연결 성분에 포함된 복수의 노드 간 에지값의 평균에 따라 상기 연결 성분에 대한 레이블을 결정하는 것을 특징으로 하는
    레이블링을 수행하기 위한 장치.
  9. 제8항에 있어서,
    상기 레이블처리부는
    상기 에지값이 상기 벡터공간 상에서의 노드 간 거리를 나타내는 경우,
    상기 레이블처리부가 상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 낮은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 하는
    레이블링을 수행하기 위한 장치.
  10. 제8항에 있어서,
    상기 레이블처리부는
    상기 에지값이 상기 벡터공간 상에서의 노드 간 상관 관계를 나타내는 경우,
    상기 연결 성분에 포함된 복수의 노드의 에지값의 평균이 가장 높은 연결 성분의 레이블을 정상으로 부여하는 것을 특징으로 하는
    레이블링을 수행하기 위한 장치.
KR1020210161700A 2021-11-09 2021-11-22 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법 KR20230075259A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210161700A KR20230075259A (ko) 2021-11-22 2021-11-22 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법
PCT/KR2022/017411 WO2023085717A1 (ko) 2021-11-09 2022-11-08 클러스터링을 기반으로 하는 레이블링을 수행하기 위한 장치, 이상 탐지를 위한 장치 및 이를 위한 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210161700A KR20230075259A (ko) 2021-11-22 2021-11-22 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법

Publications (1)

Publication Number Publication Date
KR20230075259A true KR20230075259A (ko) 2023-05-31

Family

ID=86543697

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210161700A KR20230075259A (ko) 2021-11-09 2021-11-22 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법

Country Status (1)

Country Link
KR (1) KR20230075259A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102297232B1 (ko) 2020-11-18 2021-09-03 주식회사 파인브이티 형태학적 영상처리를 활용한 이상 탐지 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102297232B1 (ko) 2020-11-18 2021-09-03 주식회사 파인브이티 형태학적 영상처리를 활용한 이상 탐지 방법

Similar Documents

Publication Publication Date Title
US11954300B2 (en) User interface based variable machine modeling
JP2019016209A (ja) 診断装置、診断方法およびコンピュータプログラム
KR102151683B1 (ko) 그래픽 키보드 내에서의 도형 심볼 검색
JP6137913B2 (ja) タッチ・スクリーン・デバイスに表示されたコンテンツをドリルする方法、コンピュータ・プログラム、およびコンピュータ
JP6555061B2 (ja) クラスタリングプログラム、クラスタリング方法、および情報処理装置
US10108296B2 (en) Method and apparatus for data processing method
CN105164616A (zh) 一致文本建议输出
US10679060B2 (en) Automatic generation of user interfaces using image recognition
US20180018084A1 (en) Display device, display method and computer-readable recording medium
US20190250975A1 (en) Tree-based anomaly detection
JP2020035039A (ja) 更新支援装置、更新支援方法およびプログラム
CN111210071A (zh) 业务对象预测方法、装置、设备及可读存储介质
CN108701123A (zh) 图形键盘的动态键映射
WO2019088223A1 (ja) 検出装置及び検出プログラム
KR20230075259A (ko) 클러스터링을 기반의 레이블링을 수행하기 위한 장치 및 이를 위한 방법
US11846933B2 (en) Apparatus, system and method for developing industrial process solutions using artificial intelligence
US9557823B1 (en) Keyboard customization according to finger positions
US20180101300A1 (en) Electronic apparatus, method of controlling the same, and display apparatus
US20130201161A1 (en) Methods, Systems and Apparatus for Digital-Marking-Surface Content-Unit Manipulation
CN109582084A (zh) 电脑系统及其输入方法
CN104335153A (zh) 用于控制物理系统的基于上下文的桌面环境
US20170285796A1 (en) Likelihood detection of pressing finger in two-finger touch
EP3312704B1 (en) Input device, and object detection device and method
KR20230067360A (ko) 클러스터링을 기반으로 하는 이상 탐지를 위한 장치 및 이를 위한 방법
CN114895836B (zh) 基于智能全流程数据触摸屏触控方法、装置及电子设备