KR20210050168A - Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning - Google Patents
Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning Download PDFInfo
- Publication number
- KR20210050168A KR20210050168A KR1020190134464A KR20190134464A KR20210050168A KR 20210050168 A KR20210050168 A KR 20210050168A KR 1020190134464 A KR1020190134464 A KR 1020190134464A KR 20190134464 A KR20190134464 A KR 20190134464A KR 20210050168 A KR20210050168 A KR 20210050168A
- Authority
- KR
- South Korea
- Prior art keywords
- kernel
- image
- deep learning
- learning
- filter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000013135 deep learning Methods 0.000 title claims abstract description 56
- 238000013136 deep learning model Methods 0.000 title claims abstract description 51
- 230000008569 process Effects 0.000 claims abstract description 14
- 230000008859 change Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 116
- 230000006870 function Effects 0.000 claims description 61
- 238000003860 storage Methods 0.000 claims description 23
- 238000013461 design Methods 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 9
- 230000007547 defect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- FGRBYDKOBBBPOI-UHFFFAOYSA-N 10,10-dioxo-2-[4-(N-phenylanilino)phenyl]thioxanthen-9-one Chemical compound O=C1c2ccccc2S(=O)(=O)c2ccc(cc12)-c1ccc(cc1)N(c1ccccc1)c1ccccc1 FGRBYDKOBBBPOI-UHFFFAOYSA-N 0.000 description 2
- TVEXGJYMHHTVKP-UHFFFAOYSA-N 6-oxabicyclo[3.2.1]oct-3-en-7-one Chemical compound C1C2C(=O)OC1C=CC2 TVEXGJYMHHTVKP-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G06K9/627—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06T5/002—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
Description
본 발명은 딥러닝 기반 영상 처리를 위한 학습 데이터가 부족하더라도 가보필터를 이용하여 제한된 학습 데이터를 확장함으로써 충분한 학습 데이터를 확보할 수 있는 학습 데이터 확장 방법을 제시하고, 이 학습 데이터 확장 방법을 이용하여 제조산업의 머신 비젼에서 실행되고 있는 이미지 분류 프로세스에 적용할 수 있는 이미지 분류장치 및 그 방법에 관한 것이다.The present invention proposes a learning data expansion method capable of securing sufficient learning data by expanding limited learning data using a Gabor filter even if training data for deep learning-based image processing is insufficient. It relates to an image classification apparatus and a method applicable to the image classification process executed in the machine vision of the manufacturing industry.
인공지능 기계학습의 발달은 지적 활동의 자동화에 대한 가능성을 열고 있다는 점에서 그 파급 효과가 매우 크고 광범위할 것으로 전망된다. 최근 딥러닝을 중심으로 급격히 발전한 기계학습 기술은 실용화를 위한 요구 수준과 실제 인공지능 기술 간의 격차를 크게 좁히며 다양한 지능형 시스템의 출현을 예고하고 있다.The development of artificial intelligence machine learning is expected to have a very large and widespread ripple effect in that it opens the possibility for automation of intellectual activities. Machine learning technology, which has recently developed rapidly around deep learning, greatly narrows the gap between the level of demand for practical use and actual artificial intelligence technology, predicting the emergence of various intelligent systems.
딥러닝은 데이터로부터 고수준의 정보를 학습하는 기술로 주로 깊은 신경망(deep neural network)에 기반한다. 딥러닝의 핵심 방법론으로는 사전학습(pre-training) 알고리즘, 컨볼루션 네트워크(CNN), 순환신경망(RNN) 등이 있다.Deep learning is a technology that learns high-level information from data and is mainly based on deep neural networks. The core methodologies of deep learning include pre-training algorithms, convolutional networks (CNNs), and cyclic neural networks (RNNs).
딥러닝은 컴퓨터비젼, 음성인식, 자율주행차, 로보틱스, 자연어 처리 등 다양한 분야에 적용되어 기존 방법을 압도하는 탁월한 성능을 보이며, 컴퓨터비젼(computer vision)과 패턴인식(pattern recognition)에서 두각을 나타내고 있다.Deep learning is applied to various fields such as computer vision, speech recognition, autonomous vehicles, robotics, natural language processing, and so on, showing excellent performance overcoming existing methods, and outstanding in computer vision and pattern recognition. have.
[특허문헌 1] 내지 [특허문헌 4]에서 딥러닝을 이용한 어플리케이션의 성능을 높이기 위해서 제한된 학습 데이터를 임의로 가공해서 늘리는 여러 기법들이 개발되고 있다.In [Patent Literature 1] to [Patent Literature 4], in order to increase the performance of an application using deep learning, various techniques for arbitrarily processing and increasing limited learning data have been developed.
그러나 상기 특허문헌들에서는 머신 비젼(machine vision)에 최적화된 학습 데이터를 확장하는 기법을 제시하고 있지 않다.However, the above patent documents do not propose a technique for extending learning data optimized for machine vision.
머신 비젼은 다양한 제조 산업의 최종 제품을 검사하기 위하여 사용되는데, 예를 들어 자동화 설비를 이용하여 생산품의 표면 결함을 검사하는 분야에서는 딥러닝 모델을 적용하기에 충분한 학습 데이터를 확보하기 어려운 경우가 많다. 이 경우 딥러닝을 이용한 어플리케이션의 성능을 보장할 수 없기 때문에, 머신 비젼 분야에 최적화된 학습 데이터를 확보하는 기법과, 이러한 학습 데이터를 바탕으로 이미지를 분류하는 기술이 개발될 필요가 있다.Machine vision is used to inspect final products in various manufacturing industries.For example, in the field of inspecting surface defects of products using automated facilities, it is often difficult to obtain sufficient training data to apply deep learning models. . In this case, since the performance of an application using deep learning cannot be guaranteed, a technique for securing training data optimized for the machine vision field and a technique for classifying images based on the training data need to be developed.
본 발명의 목적은 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 원본의 단일 이미지와 유사성을 가지도록 변화된 다수의 확장 이미지를 만들어내는 딥러닝 모델에 적용하기 위한 학습 데이터 확장 방법을 제공함에 있다. An object of the present invention is to provide a learning data extension method for applying to a deep learning model that generates a plurality of extended images changed to have similarity to a single image of the original by using a filter characteristic change technique that changes the filter parameters of the Gabor filter. have.
본 발명의 다른 목적은 준비된 학습 데이터세트에 속하는 모든 단일 이미지를 대상으로 필터특성 변경 기법을 적용하여 충분한 학습 데이터를 확보하고, 확보된 학습 데이터를 가지고 학습 프로세스를 수행하여 딥러닝 모델에 적용하기 위한 가중치를 생성하며, 이 가중치가 적용된 딥러닝 모델을 이용하여 이미지를 분류하는 이미지 분류 장치 및 방법을 제공함에 있다.Another object of the present invention is to secure sufficient training data by applying a filter characteristic change technique to all single images belonging to a prepared training dataset, and to apply to a deep learning model by performing a training process with the secured training data. It is to provide an image classification apparatus and method for generating weights and classifying images using a deep learning model to which the weights are applied.
상기 목적을 달성하기 위한 본 발명에 따른 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법은, 학습 데이터세트를 사전에 준비하는 준비 단계; 상기 학습 데이터세트의 단일 이미지를 대상으로 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 확장된 이미지를 생성하는 확장 단계; 및 상기 확장 단계에서 생성된 확장된 이미지를 바탕으로 딥러닝 모델을 학습시키는 학습 단계를 포함하는 것을 특징으로 한다.A training data extension method for applying to a deep learning model according to the present invention for achieving the above object includes: a preparation step of preparing a training dataset in advance; An extension step of generating an extended image using a filter characteristic change technique for changing a filter parameter of a Gabor filter for a single image of the training dataset; And a learning step of training a deep learning model based on the expanded image generated in the expansion step.
또한 상기 확장 단계에서 필터특성 변경 기법은 커널의 모양, 방향, 중심 주파수, 대역폭 중 적어도 어느 하나에 대응하는 필터파라미터를 변경하는 것을 특징으로 한다.In addition, in the expansion step, the filter characteristic changing method is characterized in that a filter parameter corresponding to at least one of a shape, a direction, a center frequency, and a bandwidth of a kernel is changed.
또한 상기 확장 단계에서 노말 가보필터를 이용하여 학습 데이터를 확장하는 제1 확장모드와 변형된 가보필터를 이용하여 학습 데이터를 확장하는 제2 확장모드 중 어느 하나의 확장모드에 따라 학습 데이터를 확장하는 것을 특징으로 한다.In addition, in the expansion step, learning data is expanded according to one of a first expansion mode in which training data is expanded using a normal Gabor filter and a second expansion mode in which training data is expanded using a modified Gabor filter. It is characterized by that.
또한 상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 한다.In addition, the normal Gabor filter applied to the first extended mode is characterized by defined by
[수학식 1][Equation 1]
[수학식 2][Equation 2]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.
또한 상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 한다.In addition, the modified Gabor filter applied to the second extended mode is defined by
[수학식 3][Equation 3]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
상기 목적을 달성하기 위한 본 발명에 따른 딥러닝을 이용한 이미지 분류 장치는, 학습 데이터세트를 저장하는 학습 데이터세트 저장부, 가중치 정보를 저장하는 가중치 저장부를 구비한 메모리; 상기 학습 데이터세트의 단일 이미지를 입력받고 가보필터의 필터파라미터를 바꾸어 확장 이미지를 생성하고 생성된 확장 이미지를 바탕으로 딥러닝 모델을 학습한 결과로부터 도출된 가중치 정보를 상기 가중치 저장부에 저장하는 데이터 학습모듈, 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 입력 이미지에 대해 딥러닝 기반 진단 프로그램이 상기 가중치 정보에 저장된 가중치 정보를 이용하여 이미지 분류 프로세싱을 수행하는 이미지 분류모듈을 구비한 프로세서;를 포함하는 것을 특징으로 한다.An image classification apparatus using deep learning according to the present invention for achieving the above object includes: a memory having a training data set storage unit for storing a training data set and a weight storage unit for storing weight information; Data for receiving a single image of the training dataset, generating an extended image by changing a filter parameter of a Gabor filter, and storing weight information derived from the result of training a deep learning model based on the generated extended image in the weight storage unit A processor having an image classification module for performing image classification processing by a deep learning-based diagnostic program on the input image acquired by the learning module and the image acquisition device and provided through the user interface using the weight information stored in the weight information; It characterized in that it comprises a.
또한 상기 데이터 학습모듈은 가보필터의 필터파라미터의 설계값을 설정하여 커널을 특정하고, 특정된 커널의 필터링 연산에 의해 확장 이미지를 생성하는 학습 데이터 확장부, 상기 확장 이미지가 포함된 학습 데이터세트를 가지고 딥러닝 모델을 학습시키는 학습부를 포함하는 것을 특징으로 한다.In addition, the data learning module specifies a kernel by setting a design value of a filter parameter of a gabor filter, and generates an extended image by a filtering operation of the specified kernel, and a training dataset including the extended image. It characterized in that it comprises a learning unit for training a deep learning model.
또한 상기 학습 데이터 확장부는 노말 가보필터를 이용한 제1 확장모드에 따라 학습 데이터를 확장하기 위한 노말 커널 설정기 및 노말 커널 생성기, 변형 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하기 위한 변형 커널 설정기 및 변형 커널 생성기를 포함하는 것을 특징으로 한다.In addition, the learning data extension unit is a normal kernel setter and a normal kernel generator for extending learning data according to a first expansion mode using a normal Gabor filter, and a modification for expanding learning data according to a second expansion mode using a modified Gabor filter. It characterized in that it includes a kernel configurator and a modified kernel generator.
또한 상기 노말 커널 설정기는 노말 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ 중 적어도 어느 하나를 설정하고, 상기 노말 커널 생성기는 상기 노말 커널 설정기에 의해 설정된 노말 가보필터의 필터파라미터 설계값에 따라 노말 커널을 생성하며, 생성된 노말 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 한다.In addition, the normal kernel configurator sets at least one of a kernel size, a directionality θ of a kernel function, and a standard deviation σ of a Gaussian function as a filter parameter design value of a normal gabor filter, and the normal kernel generator A normal kernel is generated according to a filter parameter design value of a normal gabor filter, and a plurality of extended images are generated by filtering a single image received from the generated normal kernel.
또한 상기 변형 커널 설정기는 변형 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ, 커널함수의 x축방향 회전각 θx, 커널함수의 y축방향 회전각 θy, 커널 주파수의 진폭을 결정하는 scale factor Sa 및 Sb, 상수 C 및 D 중 적어도 어느 하나를 설정하고, 상기 변형 커널 생성기는 상기 변형 커널 설정기에 의해 설정된 변형 가보필터의 필터파라미터 설계값에 따라 변형 커널을 생성하며, 생성된 변형 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 한다.In addition, the modified kernel setting group transformation Gabor filters filter parameter design value as a kernel size, kernel functions direction θ, the rotational angle standard deviation σ, y-axis direction of the kernel x axis of the function the rotation angle θ x, the kernel functions of the Gaussian function of the θ y , scale factors Sa and Sb for determining the amplitude of the kernel frequency, and at least one of constants C and D are set, and the modified kernel generator is based on a design value of a filter parameter of a modified Gabor filter set by the modified kernel setter. A modified kernel is generated, and a plurality of extended images are generated by filtering a single image input from the generated modified kernel.
또한 상기 이미지 분류모듈은 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 분류 대상의 이미지를 공급하는 이미지 공급부, 상기 이미지 공급부로부터 공급받은 이미지에 대하여 상기 가중치 저장부에 저장된 가중치가 반영된 딥러닝 모델에 기반한 진단 프로그램을 이용하여 이미지를 분류하는 딥러닝 실행부, 상기 딥러닝 실행부에 의해 분류된 이미지와 분류 정보를 출력하는 이미지 출력부를 포함하는 것을 특징으로 한다.In addition, the image classification module is an image supply unit that supplies an image to be classified obtained by an image acquisition device and provided through a user interface, and a deep learning model in which the weight stored in the weight storage unit is reflected with respect to the image supplied from the image supply unit. And a deep learning execution unit for classifying an image using a diagnostic program based on and an image output unit for outputting the images classified by the deep learning execution unit and classification information.
또한 상기 딥러닝 실행부가 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 한다.In addition, it is characterized in that the deep learning execution unit uses any one of LeNet-5, Alex-Net, and Google-Net as a deep learning model.
상기 목적을 달성하기 위한 본 발명에 따른 딥러닝을 이용한 이미지 분류 방법은, 사전에 준비된 학습 데이터세트를 준비하는 준비단계; 준비된 학습 데이터세트에 속하는 제한된 학습 데이터를 확장하기 위하여 노말 가보필터를 이용한 제1 확장모드 또는 변형된 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하는 확장단계; 확장된 학습 데이터를 대상으로 딥러닝 모델에서 학습 프로세스를 수행하는 학습단계; 학습 프로세스의 학습 결과 도출된 가중치 정보를 저장하는 저장단계; 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 입력받은 분류 대상의 이미지에 대해 학습 과정에서 얻은 가중치 정보를 반영한 딥러닝 기반 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행단계; 딥러닝 실행에 의해 분류된 이미지와 분류 정보를 출력하는 출력단계;를 포함하는 것을 특징으로 한다.An image classification method using deep learning according to the present invention for achieving the above object comprises: a preparation step of preparing a training dataset prepared in advance; An expansion step of expanding the learning data according to a first expansion mode using a normal Gabor filter or a second expansion mode using a modified Gabor filter in order to expand limited training data belonging to the prepared training data set; A learning step of performing a learning process in a deep learning model for the extended training data; A storage step of storing weight information derived from a learning result of the learning process; A deep learning execution step of classifying an image using a deep learning-based diagnostic program that reflects weight information obtained in a learning process with respect to the image to be classified that is acquired by the image acquisition device and input through a user interface; And an output step of outputting the image and classification information classified by the deep learning execution.
또한 상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 한다.In addition, the normal Gabor filter applied to the first extended mode is characterized by defined by
[수학식 1][Equation 1]
[수학식 2][Equation 2]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.
또한 상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 한다.In addition, the modified Gabor filter applied to the second extended mode is defined by
[수학식 3][Equation 3]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
또한 상기 학습 단계에서 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 한다.In addition, it is characterized in that any one of LeNet-5, Alex-Net, and Google-Net is used as a deep learning model in the learning step.
이상과 같은 본 발명은 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 학습 데이터를 쉽고 간편하게 확장하여 충분한 학습 데이터를 확보할 수 있다.According to the present invention as described above, it is possible to secure sufficient learning data by easily and simply expanding the learning data by using a filter characteristic changing technique for changing the filter parameter of the Gabor filter.
또한 본 발명은 가보필터의 필터특성 변경 기법에 의해 충분히 확보된 학습 데이터를 바탕으로 딥러닝 모델을 학습하여 딥러닝 모델의 신뢰성을 향상시킴으로써 이미지 분류 성공률을 개선할 수 있다.In addition, the present invention can improve the success rate of image classification by improving the reliability of the deep learning model by learning a deep learning model based on training data sufficiently secured by a filter characteristic change method of a Gabor filter.
또한 본 발명은 제조산업의 생산품 불량을 검사하는 검사 시스템의 진단 프로그램에 적용할 수 있고, 딥러닝 모델을 기반으로 한 진단 프로그램에서 실행되는 이미지 분류 프로세싱에 의한 불량 검사의 정확도를 향상시킬 수 있다. In addition, the present invention can be applied to a diagnostic program of an inspection system that inspects product defects in the manufacturing industry, and can improve the accuracy of defect inspection by image classification processing executed in a diagnostic program based on a deep learning model.
도 1은 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류방법을 나타내는 흐름도,
도 2는 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류장치의 블록도,
도 3은 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류장치의 주요부에 대한 상세한 블록도,
도 4는 도 3의 학습 데이터 확장부에 대한 상세 블록도,
도 5는 도 3의 학습 데이터 확장부가 노말 가보필터를 이용하여 제1 확장모드에서 숫자 '0'의 이미지를 확장하는 동작을 설명하기 위한 도면,
도 6은 도 3의 학습 데이터 확장부가 노말 가보필터를 이용한 제1 확장모드에서 단일 이미지로부터 복수개의 확장 이미지를 생성하는 원리를 설명하는 도면,
도 7은 도 3의 학습 데이터 확장부가 변형된 가보필터를 이용한 제2 확장모드에서 단일 이미지로부터 복수개 확장 이미지를 생성하는 원리를 설명하는 도면,
도 8은 본 발명의 실시예에 따른 동일한 입력 이미지에 대해 제1 확장모드와 제2 확장모드를 적용시 얻어지는 복수개의 확장 이미지를 나타내는 도면이다. 1 is a flowchart showing an image classification method using deep learning according to an embodiment of the present invention;
2 is a block diagram of an image classification apparatus using deep learning according to an embodiment of the present invention.
3 is a detailed block diagram of a main part of an image classification apparatus using deep learning according to an embodiment of the present invention;
4 is a detailed block diagram of the learning data expansion unit of FIG. 3;
FIG. 5 is a diagram for explaining an operation of expanding an image of a number '0' in a first expansion mode by using a normal Gabor filter by the learning data expansion unit of FIG. 3;
FIG. 6 is a diagram illustrating a principle of generating a plurality of extended images from a single image in a first extended mode using a normal Gabor filter by the training data extension of FIG. 3; FIG.
FIG. 7 is a diagram illustrating a principle of generating a plurality of extended images from a single image in a second extended mode using a modified Gabor filter by the learning data extension part of FIG. 3; FIG.
8 is a diagram illustrating a plurality of extended images obtained when a first extended mode and a second extended mode are applied to the same input image according to an embodiment of the present invention.
이하 첨부한 도면을 참조하여 본 발명의 실시 예를 설명함으로써 본 발명을 설명한다. Hereinafter, the present invention will be described by describing embodiments of the present invention with reference to the accompanying drawings.
각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 또한 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.The same reference numerals shown in each drawing indicate the same members. In addition, in describing the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, a detailed description thereof will be omitted. In addition, when a part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.
머신 비젼은 생산 라인 상에 장착된 카메라, 광학계, 조명 등의 하드웨어를 통해 제품의 이미지를 획득하고, 획득된 이미지를 분석하고 검사하는 진단 프로그램을 통해 이미지 프로세싱을 수행한다. Machine Vision acquires an image of a product through hardware such as cameras, optical systems, and lighting installed on a production line, and performs image processing through a diagnostic program that analyzes and inspects the acquired image.
본 발명은 가보필터의 필터파라마터의 설계값을 가변하여 딥러닝 모델에 적용하기 위한 학습 데이터를 만들어 확장시키는 것을 기술적 특징으로 한다. The present invention is characterized in that the design value of a filter parameter of a Gabor filter is varied to create and expand training data for application to a deep learning model.
또한 본 발명은 제조산업의 생산품 불량을 검사하는 검사 시스템의 진단 프로그램에 적용할 수 있고, 딥러닝 모델의 신뢰성을 높일 수 있도록 충분한 학습 데이터를 제공함으로써 딥러닝 모델을 기반으로 한 진단 프로그램에서 실행되는 이미지 분류 프로세싱에 의한 불량 검사의 정확도를 향상시킬 수 있다. In addition, the present invention can be applied to a diagnostic program of an inspection system that inspects product defects in the manufacturing industry, and by providing sufficient training data to increase the reliability of the deep learning model, the diagnostic program based on the deep learning model can be applied. It is possible to improve the accuracy of defect inspection by image classification processing.
가보필터는 공간 영역과 주파수 영역에서 동조 가능한 방향과 중심 주파수(tunable orientation and center frequency), 그리고 반경 주파수 대역폭(radial frequency bandwidth)과 관련된 필터파라메터들을 가진다. 필터파라메터들을 어떻게 설정하느냐에 따라 커널의 모양(shape), 방향(orientation), 중심 주파수(center frequency), 대역폭(bandwidth) 등이 변화되어, 가보필터에 대한 커널함수의 특징이 결정되기 때문에 각각의 커널함수에서 이루어지는 필터링 연산을 거치게 되면 유사한 이미지들을 얻을 수 있다.The Gabor filter has filter parameters related to a tunable orientation and center frequency, and a radial frequency bandwidth in the spatial and frequency domains. Depending on how the filter parameters are set, the shape, orientation, center frequency, and bandwidth of the kernel are changed, and the characteristics of the kernel function for the Gabor filter are determined. Similar images can be obtained by passing through the filtering operation performed in the function.
본 발명에서 필터파라메터의 설계값을 가변함으로써 설정된 제각각 다른 커널함수를 이용하여 입력된 단일 이미지에 대해 유사성을 가진 다수의 새로운 이미지를 만들고, 사전 준비된 학습 데이터세트에 가보필터를 이용한 데이터 확장을 통해 확보된 새로운 이미지를 학습 데이터로 포함시킨다. 본 발명은 가보필터의 필터 특성을 나타내는 커널함수를 다양하게 변화시켜 원본 이미지와 유사한 이미지들을 만들고, 딥러닝 모델의 학습 데이터에 새롭게 만든 이미지들을 포함시켜 보강할 수 있다.In the present invention, by varying the design value of the filter parameter, a number of new images with similarity to the input single image are created using different kernel functions set, and secured through data expansion using a Gabor filter in a pre-prepared training dataset. The new image is included as training data. In the present invention, images similar to the original image may be created by variously changing a kernel function representing the filter characteristics of a Gabor filter, and the newly created images may be included in the training data of the deep learning model to be reinforced.
본 발명은 보강된 학습 데이터세트를 바탕으로 딥러닝을 실행하여 이미지 분류 프로세싱에 적용하기 위한 가중치를 연산하고, 실행 결과로부터 얻은 가중치 정보를 저장한다. 이와 같이 가중치 정보는 새로운 학습 데이터를 추가시 가중치 정보를 갱신하게 된다.The present invention performs deep learning based on the reinforced training dataset, calculates weights for application to image classification processing, and stores weight information obtained from the execution result. In this way, the weight information is updated when new training data is added.
도 1을 참고하면, 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류 방법은 사전에 준비된 학습 데이터세트를 준비하는 준비단계(10), 준비된 학습 데이터세트에 속하는 제한된 학습 데이터를 확장하기 위하여 노말 가보필터를 이용한 제1 확장모드 또는 변형된 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하는 확장단계(20), 확장된 학습 데이터를 대상으로 딥러닝 모델에서 학습 프로세스를 수행하는 학습단계(30), 학습 프로세스의 결과 도출된 가중치 정보를 저장하는 저장단계(40), 학습 과정으로 얻은 가중치를 이용하여 분류 대상의 이미지에 대해 딥러닝에 기반한 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행단계(50), 딥러닝 실행에 의해 분류된 이미지와 분류 정보를 출력하는 출력단계(60)를 포함한다. Referring to FIG. 1, the image classification method using deep learning according to an embodiment of the present invention includes a
도 2 및 도 3을 참고하여, 본 발명에 따른 딥러닝을 이용한 이미지 분류장치는 사용자 인터페이스(100), 프로세서(101), 메모리(104)가 포함된 컴퓨팅 장치로 구현될 수 있다.2 and 3, the image classification apparatus using deep learning according to the present invention may be implemented as a computing device including a
사용자는 사용자 인터페이스(100)를 통해 데이터 학습 실행 여부, 확장 모드의 선택, 딥러닝 모델의 선택, 대상 이미지 입력 등 이미지 분류에 관련된 전반적인 사용자 명령을 입력한다.Through the
메모리(104)는 딥러닝 기반 진단프로그램을 저장하는 딥러닝 솔루션(105), 딥러닝 모델을 학습시키기 위한 학습 데이터를 저장하는 학습 데이터세트 저장부(110), 딥러닝 모델에 의한 학습 결과 얻어진 가중치 정보를 저장하는 가중치 저장부(140)를 포함한다.The
프로세서(101)는 학습 데이터세트 저장부(110)로부터 사전 준비된 학습 데이터를 제공받고, 학습 결과로 얻어진 가중치 정보를 가중치 저장부(140)에 저장한다. 프로세서(101)는 데이터 학습모듈(102)과 이미지 분류모듈(103)을 포함한다.The
데이터 학습모듈(102)은 학습 데이터를 확장하는 학습 데이터 확장부(120), 확장된 학습 데이터를 바탕으로 학습하는 학습부(130)를 포함한다.The
이미지 분류모듈(103)은 이미지 획득장치에서 획득되고 사용자 인터페이스(100)를 통해 제공받은 분류 대상의 이미지를 공급하는 이미지 공급부(150), 이미지 공급부(150)로부터 공급받은 이미지에 대하여 가중치 저장부(140)에 저장된 가중치가 반영된 딥러닝 모델에 기반한 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행부(160), 딥러닝 실행부(160)에 의해 분류된 이미지와 분류 정보를 출력하는 이미지 출력부(170)를 포함한다.The
도 4를 참고하면, 데이터 학습모듈(120)은 노말 커널 설정기(121), 노말 커널 생성기(122), 변형 커널 설정기(123), 변형 커널 생성기(124)를 포함한다.Referring to FIG. 4, the
데이터 학습모듈(120)은 사용자 인터페이스부(100)로부터 확장모드 선택명령을 입력받아 제1 확장모드 또는 제2 확장모드에 따라 학습 데이터를 확장한다.The
데이터 학습모듈(120)은 크게 노말 가보필터를 이용한 제1 확장모드에 의한 학습 데이터 확장과 변형된 가보필터를 이용한 제2 확장모드에 의한 학습 데이터 확장으로 구분할 수 있다. 제1 확장모드는 노말 커널 설정기(121)와 노말 커널 생성기(122)를 이용하여 학습 데이터를 확장한다.The
노말 커널 설정기(121)는 노말 가보필터의 커널을 특정하기 위한 필터파라미터를 가변한다.The
노말 가보필터는 다음의 [수학식 1]과 같이 나타낼 수 있다.The normal Gabor filter can be expressed as the following [Equation 1].
[수학식 1]에서 x'와 y'는 다음의 [수학식 2]와 같이 나타낼 수 있다.In [Equation 1], x'and y'can be expressed as the following [Equation 2].
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.
노말 커널 설정기(121)는 적어도 하나의 노말 가보필터의 필터파라미터에 대한 설계값들을 노말 커널 생성기(122)에 제공한다. 필터파라미터의 개수가 제한되는 것은 아니다. 실시예에서 노말 가보필터의 필터파라미터로서 커널 사이즈(kernel size), σ, θ에 대한 설계값을 제공하였으나, 분류 대상의 이미지 특성과 이미지 획득장치의 성능 등을 고려하여 필터파라미터의 개수와 대상을 변경할 수 있다.The
노말 커널 생성기(122)는 제공받은 필터파라미터의 설계값에 기초하여 노말 가보필터의 커널인 노말 커널을 생성한다. 예를 들어 커널 사이즈(kernel size)가 11X11, σ=2, θ=π/6에 의해 제1 노말커널(GK1)이 생성되고, 커널 사이즈(kernel size)가 11 X 11(pixel), σ=2, θ=π/3에 의해 제2 노말커널(GK2)이 생성되며, 이와 같은 방식으로 n개 노말커널이 생성될 수 있다.The
노말 커널 생성기(122)는 학습 데이터세트 저장부(110)로부터 사전 준비된 학습 데이터세트를 제공받는데, 원본의 단일 이미지를 개별적으로 입력받는다. 노말 커널 생성기(122)는 개별 입력되는 단일 이미지를 대상으로 하여 생성된 n개 노말커널에서 필터링 연산하여 원본 이미지와 유사한 n개의 확장 이미지(확장 이미지1, 확장 이미지2, ..., 확장 이미지n)를 생성한다. 생성된 n개의 확장 이미지는 학습부(130)에 제공된다.The
제2 확장모드는 변형 커널 설정기(123)와 변형 커널 생성기(124)를 이용하여 학습 데이터를 확장한다.In the second extended mode, training data is extended using the modified
변형 커널 설정기(123)는 변형 가보필터의 커널을 특정하기 위한 필터파라미터를 가변한다.The modified
변형 가보필터는 입력 이미지에 대해 부분적으로 휘어지게 하거나 커널 중심으로부터 떨어진 주변에 축소된 이미지가 반복되어 나타나도록 변형시킬 수 있다.The transformed Gabor filter can be transformed so that the input image is partially warped or a reduced image is repeatedly displayed around the center away from the kernel.
실시예에서 변형 가보필터는 다음의 [수학식 3]과 같이 나타낼 수 있다.In an embodiment, the modified Gabor filter can be expressed as the following [Equation 3].
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
변형 커널 설계값 설정기(123)는 적어도 하나의 변형 가보필터의 필터파라미터에 대한 설계값들을 노말 커널 생성기(122)에 제공한다. 필터파라미터의 개수가 제한되는 것은 아니다. 실시예에서 변형 가보필터의 필터파라미터로서 커널 사이즈(kernel size), σ, θ, θx, θy, Sa, Sb, C, D 대한 설계값을 제공하였으나, 분류 대상의 이미지 특성과 이미지 획득장치의 성능 등을 고려하여 필터파라미터의 개수와 대상을 변경할 수 있다.The modified kernel
변형 커널 생성기(124)는 제공받은 필터파라미터의 설계값에 기초하여 변형 가보필터의 커널인 변형 커널을 생성한다. 예를 들어, σ=5, θ=π/4, θx=π/30 ,θy=0, C=1.4, D=15로 주어진 경우에 의해 제1 변형커널(MK1)이 생성되고, σ=5, θ=π/4, θx=0 ,θy=π/30, C=1.4, D=15로 주어진 경우에 의해 제2 변형커널(MK2)이 생성되며, 이와 같은 방식으로 n개 변형커널이 생성될 수 있다.The modified kernel generator 124 generates a modified kernel, which is a kernel of the modified Gabor filter, based on the design values of the provided filter parameters. For example, given as σ=5, θ=π/4, θ x =π/30, θ y =0, C=1.4, D=15, the first transformation kernel (MK1) is generated, and σ =5, θ=π/4, θ x =0, θ y =π/30, C=1.4, D=15 The second transforming kernel (MK2) is generated by the same method, and n A transform kernel can be created.
변형 커널 생성기(124)는 학습 데이터세트 저장부(110)로부터 사전 준비된 학습 데이터세트에 해당하는 원본의 단일 이미지를 개별적으로 입력받는다. 변형 커널 생성기(124)는 개별 입력되는 단일 이미지를 대상으로 하여 생성된 n개 변형커널에서 필터링 연산하여 원본 이미지와 유사한 n개의 확장 이미지(확장 이미지1, 확장 이미지2, ..., 확장 이미지n)를 생성한다. 생성된 n개의 확장 이미지는 학습부(130)에 제공된다.The modified kernel generator 124 individually receives an original single image corresponding to a pre-prepared training dataset from the training
학습부(130)는 제1 확장모드에서 노말 가보필터를 이용하여 확장된 학습 데이터를 바탕으로 딥러닝 모델에 대한 학습을 수행하거나 제2 확장모드에서 변형 가보필터를 이용하여 확장된 학습 데이터를 바탕으로 딥러닝 모델에 대한 학습을 수행하게 된다. 이렇게 학습부(130)가 딥러닝 모델의 학습프로세스를 수행하여 얻은 가중치 정보는 가중치 저장부(140)에 저장함으로써 딥러닝 실행부(160)에 적용된다. The
실시예에서 학습부(130) 및 딥러닝 실행부(160)가 사용하는 딥러닝 모델로서 LeNet-5를 적용하였으나, 딥러닝 모델이 특정되는 것은 아니며, 다른 딥러닝 모델로서 알렉스넷(Alex Net), 구글넷(Google Net) 등을 적용할 수도 있다.In the embodiment, LeNet-5 is applied as a deep learning model used by the
학습 데이터세트 저장부(110)에서 제공하는 학습 데이터세트는 딥러닝을 학습시키기 위한 정보 집합체이다.The training dataset provided by the training
일반적으로 머신 러닝(machine learning)에서 폭 넓게 쓰이고 있는 MNIST(Modifified National Institute of Standards and Technology database) 데이터세트를 채택할 수 있다. MNIST 데이터세트는 60,000개 학습 이미지(train image)와 10,000개 테스트 이미지(test image)를 포함한다. 학습 이미지의 절반과 테스트 이미지의 절반은 NIST(National Institute of Standards and Technology)의 학습 데이터세트(train dataset)에서 취합하였으며, 나머지 학습 이미지의 절반과 테스트 이미지의 절반은 NIST의 테스트 데이터세트(test dataset)에서 취합하였다.In general, a dataset of the Modified National Institute of Standards and Technology database (MNIST), which is widely used in machine learning, can be adopted. The MNIST dataset contains 60,000 train images and 10,000 test images. Half of the training images and half of the test images were collected from the National Institute of Standards and Technology (NIST) train dataset, and half of the remaining training images and half of the test images were collected from NIST's test dataset. ).
MNIST 데이터세트는 Size-normalized 및 Certered 되어 있고, 28×28 크기의 Gray Image 이다. 아래의 [표 1]은 MNIST 데이터세트의 각 숫자의 샘플 이미지와 수량을 보여준다.The MNIST dataset is size-normalized and certered, and is a 28×28 gray image. [Table 1] below shows sample images and quantities of each number in the MNIST dataset.
도 5를 참고하여, 제1 확장모드에서 학습 데이터 확장부(120)가 학습 데이터를 확장하는 경우, 숫자 '0'의 입력 이미지에 대해 제1 내지 제4 커널함수(GK1, GK2, GK3, GK4)을 이용하여 제1 내지 제4 확장 이미지(A1, A2, A3, A4)를 만들 수 있다.Referring to FIG. 5, when the learning
다른 예로서 도 6을 참고하여, 학습 데이터세트로서, 숫자 0 내지 9의 학습 데이터를 각각 50장씩 총 500장을 가지고, 제1 확장모드에서 학습 데이터 확장부(120)가 학습 데이터를 확장하는 경우를 예시하여 설명한다. 여기서 σ를 일정하게 설정하고 커널 사이즈와 θ를 가변하여 각 숫자의 학습 데이터에 대해 8장의 확장 이미지를 만들 수 있다. 즉, 숫자 '0'에 대한 학습 데이터 총 50장에 대해 각각 8장씩 확장 이미지를 만들어 총 400장의 확장 이미지를 생성하게 되며, 원본 이미지 50장을 포함하여 숫자 '0'에 대한 학습 이미지로서 450장을 확보할 수 있다.As another example, referring to FIG. 6, as a training data set, when the training data of
학습 데이터세트 저장부(110)가 제한된 학습 데이터를 가지고 있어 절대적으로 학습 데이터가 부족한 경우, 제2 확장모드를 이용하여 충분한 확장 데이터를 확보하는 동작을 설명한다.When the training data
도 7은 도 3의 학습 데이터 확장부가 변형된 가보필터를 이용한 제2 확장모드에서 단일 이미지로부터 복수개의 확장 이미지를 생성하는 원리를 설명하는 도면이다.FIG. 7 is a diagram for explaining a principle of generating a plurality of expanded images from a single image in a second expansion mode using a modified Gabor filter by the learning data expansion unit of FIG. 3.
도 7에서, 임의의 가보필터의 커널(K1)에 적용하는 필터파라미터가 σ=5, θ=π/4인 경우, 커널함수의 x축방향 회전각 θx =π/30 및 커널함수의 y축방향 회전각 θy=0로 설정시 변형된 커널(K21)이 만들어지고, 유사하게 커널함수의 x축방향 회전각 θx=0 및 커널함수의 y축방향 회전각 θy =π/30로 설정시 변형된 커널(K22)이 만들어진다. 또한 임의의 가보필터의 커널(K1)에 적용하는 필터파라미터가 σ=5, θ=π/4인 경우, C=1.4 및 D=15로 설정시 변형된 커널(K3)이 만들어진다. 여기서 D는 커널 중심에서 떨어져 반복된 모양의 4개 영역(H) 사이의 거리를 나타낸다.In FIG. 7, when the filter parameters applied to the kernel K1 of an arbitrary Gabor filter are σ=5 and θ=π/4, the rotation angle θ x =π/30 in the x-axis direction of the kernel function and y of the kernel function When the axial rotation angle θ y = 0 is set, a modified kernel (K21) is created, and similarly, the rotation angle in the x-axis direction of the kernel function θ x = 0 and the rotation angle in the y-axis direction of the kernel function θ y =π/30 When set to, a modified kernel (K22) is created. In addition, when the filter parameters applied to the kernel K1 of an arbitrary Gabor filter are σ=5 and θ=π/4, a modified kernel K3 is created when C=1.4 and D=15 are set. Here, D denotes the distance between the four regions (H) of the repeated shape apart from the center of the kernel.
변형된 커널(K21)과 커널(K3)의 조합에 의해 새로운 커널(K41)이 생성되고, 변형된 커널(K22)과 커널(K3)의 조합에 의해 새로운 커널(K42)이 생성될 수 있다.A new kernel K41 may be generated by a combination of the modified kernel K21 and the kernel K3, and a new kernel K42 may be generated by a combination of the modified kernel K22 and the kernel K3.
도 8은 본 발명의 실시예에 따른 동일한 입력 이미지에 대해 제1 확장모드와 제2 확장모드를 적용시 얻어지는 복수개의 확장 이미지를 나타내는 도면이다. 8 is a diagram illustrating a plurality of extended images obtained when a first extended mode and a second extended mode are applied to the same input image according to an embodiment of the present invention.
입력 이미지(A0)에 대해 제1 확장모드에서 노말 가보필터의 필터파라미터로서 σ=2로 일정하게 설정한 후 θ=π/6, θ=π/3, θ=2π/3로 설정된 각각의 경우 변형된 3개의 확장 이미지(NA1, NA2, N3)가 생성된다.For the input image (A0), in the first extended mode, the filter parameter of the normal Gabor filter is set constant as σ=2, and then θ=π/6, θ=π/3, θ=2π/3, respectively. Three modified expanded images (NA1, NA2, and N3) are generated.
또한 입력 이미지(A0)에 대해 제2 확장모드에서 변형 가보필터의 필터파라미터로서 σ=2, θx =π/6, θy=0, C=0, D=0로 일정하게 설정한 후 θ=π/6, θ=π/3, θ=2π/3로 설정된 각각의 경우 변형된 3개의 확장 이미지(MA1, MA2, M3)가 생성된다. 제2 확장모드에서는 변형 가보필터의 필터파라미터의 개수가 많기 때문에 제1 확장모드보다 월등하게 많은 학습 데이터를 확장할 수 있다.In addition, in the second extended mode for the input image (A0), σ=2, θ x =π/6, θ y =0, C=0, D=0 as filter parameters of the modified Gabor filter are set constant and then θ In each case set to =π/6, θ=π/3, and θ=2π/3, three modified expanded images (MA1, MA2, M3) are generated. In the second extended mode, since the number of filter parameters of the modified Gabor filter is large, much more training data can be extended than in the first extended mode.
이하에서는 본 발명에 따른 노말 가보필터와 변형 가보필터를 이용하여 학습 데이터를 확장하는 과정을 검증하고, 이를 설명하기로 한다.Hereinafter, a process of expanding learning data using a normal Gabor filter and a modified Gabor filter according to the present invention will be verified, and this will be described.
[시험예 1][Test Example 1]
- 사용한 학습 데이터세트 : MNIST dataset-Training dataset used: MNIST dataset
- 학습 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 500장씩 선정-Number of training images: 500 each for numbers 0-9 in the MNIST dataset
- 테스트 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 in the MNIST dataset
- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5
- 이미지 분류 성공률 : 97% -Image classification success rate: 97%
평균 이미지 분류 성공률
Average image
출력
분류
성공률(%)image
Classification
Success rate (%)
96.4
96.4
98.8
98.8
98.2
98.2
99.6
99.6
97.2
97.2
97.6
97.6
97.0
97.0
95.2
95.2
94.8
94.8
96.6
96.6
97
97
[표 2]는 MNIST dataset에서 숫자 0 내지 9에 대해 학습 이미지 각 500장씩 총 5000장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 482장, '1'/'4'로 판정된 이미지는 각 0장, '7'로 판정된 이미지는 1장, '2'/'3'/'8'로 판정된 이미지는 각 2장, '6'으로 판정된 이미지는 3장, '5'/'9'로 판정된 이미지는 각 4장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 97% 이다.[Table 2] shows a total of 5000 pieces of 500 training images for each of the
[시험예 2][Test Example 2]
- 사용한 학습 데이터세트 : MNIST dataset-Training dataset used: MNIST dataset
- 학습 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 50장씩 선정-Number of training images: 50 each for numbers 0-9 in the MNIST dataset
- 테스트 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 in the MNIST dataset
- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5
- 이미지 분류 성공률 : 89% -Image classification success rate: 89%
평균 이미지 분류 성공률
Average image
출력
분류
성공률(%)image
Classification
Success rate (%)
95.6
95.6
99.2
99.2
84.6
84.6
84.2
84.2
89.6
89.6
92.8
92.8
92.4
92.4
95.4
95.4
71.0
71.0
87.0
87.0
89
89
[표 3]은 MNIST dataset에서 숫자 0 내지 9에 대해 학습 이미지 각 50장씩 총 500장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 478장, '3'/'4'/'8'로 판정된 이미지는 각 0장, '9'로 판정된 이미지는 1장, '1'/'2'로 판정된 이미지는 각 2장, '7'로 판정된 이미지는 3장, '6'으로 판정된 이미지는 4장, '5'로 판정된 이미지는 10장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 89% 이다.[Table 3] shows a total of 500 pieces of 50 training images for each of the
[시험예 2]는 [시험예 1]과 대비하여 상대적으로 학습 이미지가 휠씬 적기 때문에 이미지 분류 성공률이 현저히 저하된 것을 알 수 있다.It can be seen that [Test Example 2] has a relatively small number of learning images compared to [Test Example 1], so that the success rate of image classification is significantly lowered.
[시험예 3][Test Example 3]
- 사용한 학습 데이터세트 : 노말 가보필터를 이용하여 확장된 학습 이미지-Used training dataset: expanded training image using normal heirloom filter
- 학습 이미지 개수 : 확장된 학습이미지 데이터세트에서 숫자 0~9에 대해 450장씩 선정-Number of training images: 450 each for numbers 0-9 from the expanded training image dataset
- 테스트 이미지 개수 : 확장된 학습 이미지 데이터세트에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 from the expanded training image dataset
- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5
- 이미지 분류 성공률 : 92% -Image classification success rate: 92%
평균 이미지 분류 성공률
Average image
출력
분류
성공률(%)image
Classification
Success rate (%)
96.2
96.2
97.2
97.2
92.0
92.0
87.0
87.0
94.8
94.8
94.4
94.4
95.6
95.6
92.0
92.0
86.0
86.0
88.8
88.8
92
92
[표 4]는 노말 가보필터를 이용하여 확장한 학습 데이터세트에서 숫자 0 내지 9에 대해 학습 이미지 각 450장씩 총 4500장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 481장, '1'/'4'/'7'로 판정된 이미지는 각 0장, '2'/'3'로 판정된 이미지는 각 2장, '5'/'8'/'9'로 판정된 이미지는 각 3장, '6'로 판정된 이미지는 6장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 92%를 나타내었다.[Table 4] shows a total of 4500 training images, each 450 training images for
[시험예 4][Test Example 4]
- 사용한 학습 데이터세트 : 변형 가보필터를 이용하여 확장된 학습 이미지-Used training dataset: expanded training image using transformed heirloom filter
- 학습 이미지 개수 : 확장된 학습이미지 데이터세트에서 숫자 0~9에 대해 450장씩 선정-Number of training images: 450 each for numbers 0-9 from the expanded training image dataset
- 테스트 이미지 개수 : 확장된 학습 이미지 데이터세트에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 from the expanded training image dataset
- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5
- 이미지 분류 성공률 : 94% -Image classification success rate: 94%
평균 이미지 분류 성공률
Average image
출력
분류
성공률(%)image
Classification
Success rate (%)
96.8
96.8
99.6
99.6
92.0
92.0
92.8
92.8
90.6
90.6
96.4
96.4
95.4
95.4
92.4
92.4
86.4
86.4
92.4
92.4
94
94
[표 5]는 변형 가보필터를 이용하여 확장한 학습 데이터세트에서 숫자 0 내지 9에 대해 학습 이미지 각 450장씩 총 4500장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 484장, '1'/'7'로 판정된 이미지는 각 0장, '3'/'4'로 판정된 이미지는 각 1장, '5'/'8'로 판정된 이미지는 각 2장, '2'/'9'로 판정된 이미지는 각 3장, '6'으로 판정된 이미지는 4장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 94% 이다. [시험예 4]는 변형 가보필터를 이용하여 학습 데이터를 확장한 경우로서 [시험예 3]과 대비하여 동일 조건에서 이미지 분류 성공률이 2% 높게 나타났다.[Table 5] shows a total of 4500 training images, each 450 training images for
머신 비젼에서 학습 데이터를 충분히 확보하기 어렵고, 현실적으로 제한된 학습 데이터를 이용하여 딥러닝을 수행할 수 밖에 없는 상황에서는 학습 데이터를 충분히 확보하는 것이 이미지 분류 성공률을 높이는 결정적인 요소가 된다. 앞서 설명한 바와 같이 이미지 분류 성공률은 [시험예 1]에서 97%이고 [시험예 2]에서 89%로 현저하게 떨어졌는데, 이는 [시험예 2]에서 딥러닝 학습에 쓰이는 학습 데이터가 부족한 것이 주요한 요인이다. In a situation where it is difficult to secure enough training data in machine vision, and in a situation where deep learning can only be performed using limited training data in reality, securing sufficient training data becomes a decisive factor in increasing the success rate of image classification. As described above, the image classification success rate was 97% in [Test Example 1] and significantly dropped to 89% in [Test Example 2], which is the main factor due to lack of training data used for deep learning learning in [Test Example 2]. to be.
노말 가보필터를 이용한 학습 데이터 확장 방법을 적용한 [시험예 3]와 변형 가보필터를 이용한 학습 데이터 확장 방법을 사용한 [시험예 4]는 [시험예 2]와 대비하여 상대적으로 높은 이미지 분류 성공률을 나타내었다.[Test Example 3] applying the learning data expansion method using a normal Gabor filter and [Test Example 4] using the learning data expansion method using a modified Gabor filter exhibited relatively high image classification success rates compared to [Test Example 2]. I got it.
본 발명은 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 학습 데이터를 쉽고 간편하게 확장하여 충분한 학습 데이터를 확보할 수 있고, 확보된 학습 데이터를 바탕으로 딥러닝 모델을 학습하여 딥러닝 모델의 신뢰성을 향상시킴으로써 이미지 분류 성공률을 개선할 수 있다.The present invention uses a filter characteristic change method that changes the filter parameter of the Gabor filter to easily and conveniently expand the training data to secure sufficient training data, and learns a deep learning model based on the acquired training data to learn a deep learning model. By improving the reliability, the success rate of image classification can be improved.
이 점에서 볼 때 머신 비젼에서 제한된 학습 데이터를 가지고 있는 상황에서는 충분한 학습 데이터를 확보하는 것이 무엇보다 중요하고, 이를 충족하기 위한 방안으로 본 발명이 유용하게 활용될 수 있다.From this point of view, securing sufficient learning data is of paramount importance in a situation in which machine vision has limited learning data, and the present invention can be usefully utilized as a method to satisfy this.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다.The above description of the present invention is for illustrative purposes only, and those of ordinary skill in the art to which the present invention pertains will be able to understand that other specific forms can be easily modified without changing the technical spirit or essential features of the present invention. will be.
100 : 사용자 인터페이스 101 : 프로세서
102 : 데이터 학습모듈 103 : 이미지 분류모듈
104 : 메모리 105 : 딥러닝 솔루션
110 : 학습 데이터세트 저장부 120 : 학습 데이터 확장부
130 : 학습부 140 : 가중치 저장부
150 : 이미지 공급부 160 : 딥러닝 실행부
170 : 이미지 출력부100: user interface 101: processor
102: data learning module 103: image classification module
104: memory 105: deep learning solution
110: training data set storage unit 120: training data expansion unit
130: learning unit 140: weight storage unit
150: image supply unit 160: deep learning execution unit
170: image output unit
Claims (16)
상기 학습 데이터세트의 단일 이미지를 대상으로 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 확장된 이미지를 생성하는 확장 단계; 및
상기 확장 단계에서 생성된 확장된 이미지를 바탕으로 딥러닝 모델을 학습시키는 학습 단계를 포함하는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.A preparation step of preparing a training dataset in advance;
An extension step of generating an extended image using a filter characteristic change technique for changing a filter parameter of a Gabor filter for a single image of the training dataset; And
And a learning step of training a deep learning model based on the expanded image generated in the expansion step.
상기 확장 단계에서 필터특성 변경 기법은 커널의 모양, 방향, 중심 주파수, 대역폭 중 적어도 어느 하나에 대응하는 필터파라미터를 변경하는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.The method of claim 1,
In the expansion step, the filter characteristic change method changes a filter parameter corresponding to at least one of a shape, a direction, a center frequency, and a bandwidth of a kernel.
상기 확장 단계에서 노말 가보필터를 이용하여 학습 데이터를 확장하는 제1 확장모드와 변형된 가보필터를 이용하여 학습 데이터를 확장하는 제2 확장모드 중 어느 하나의 확장모드에 따라 학습 데이터를 확장하는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.The method of claim 1,
In the expansion step, expanding the learning data according to any one of a first expansion mode for expanding training data using a normal Gabor filter and a second expansion mode for expanding training data using a modified Gabor filter. Learning data extension method for application to a deep learning model characterized by.
상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
[수학식 1]
[수학식 2]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. The method of claim 3,
The normal Gabor filter applied to the first extended mode is defined by Equation 1 and Equation 2 below.
[Equation 1]
[Equation 2]
Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.
상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
[수학식 3]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. The method of claim 3,
The modified Gabor filter applied to the second extended mode is defined by Equation 3 below.
[Equation 3]
Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
상기 학습 데이터세트의 단일 이미지를 입력받고 가보필터의 필터파라미터를 바꾸어 확장 이미지를 생성하고 생성된 확장 이미지를 바탕으로 딥러닝 모델을 학습한 결과로부터 도출된 가중치 정보를 상기 가중치 저장부에 저장하는 데이터 학습모듈, 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 입력 이미지에 대해 딥러닝 기반 진단 프로그램이 상기 가중치 정보에 저장된 가중치 정보를 이용하여 이미지 분류 프로세싱을 수행하는 이미지 분류모듈을 구비한 프로세서;를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.A memory having a training data set storage unit for storing a training data set and a weight storage unit for storing weight information;
Data for receiving a single image of the training dataset, generating an extended image by changing a filter parameter of a Gabor filter, and storing weight information derived from the result of training a deep learning model based on the generated extended image in the weight storage unit A processor having an image classification module for performing image classification processing by a deep learning-based diagnostic program on the input image acquired by the learning module and the image acquisition device and provided through the user interface using the weight information stored in the weight information; Image classification apparatus using deep learning, characterized in that it comprises a.
상기 데이터 학습모듈은 가보필터의 필터파라미터의 설계값을 설정하여 커널을 특정하고, 특정된 커널의 필터링 연산에 의해 확장 이미지를 생성하는 학습 데이터 확장부, 상기 확장 이미지가 포함된 학습 데이터세트를 가지고 딥러닝 모델을 학습시키는 학습부를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.The method of claim 6,
The data learning module has a learning data expansion unit configured to specify a kernel by setting a design value of a filter parameter of a Gabor filter, and to generate an expanded image by a filtering operation of the specified kernel, and a training dataset including the expanded image. An image classification apparatus using deep learning, comprising a learning unit that trains a deep learning model.
상기 학습 데이터 확장부는 노말 가보필터를 이용한 제1 확장모드에 따라 학습 데이터를 확장하기 위한 노말 커널 설정기 및 노말 커널 생성기, 변형 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하기 위한 변형 커널 설정기 및 변형 커널 생성기를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.The method of claim 6,
The learning data extension unit is a normal kernel setter and a normal kernel generator for extending learning data according to a first expansion mode using a normal Gabor filter, and a modified kernel for expanding learning data according to a second expansion mode using a modified Gabor filter. An image classification apparatus using deep learning, comprising: a setter and a modified kernel generator.
상기 노말 커널 설정기는 노말 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ 중 적어도 어느 하나를 설정하고,
상기 노말 커널 생성기는 상기 노말 커널 설정기에 의해 설정된 노말 가보필터의 필터파라미터 설계값에 따라 노말 커널을 생성하며,
생성된 노말 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.The method of claim 8,
The normal kernel configurator sets at least one of a kernel size, a directionality θ of a kernel function, and a standard deviation σ of a Gaussian function as a design value of a filter parameter of a normal Gabor filter,
The normal kernel generator generates a normal kernel according to a filter parameter design value of a normal Gabor filter set by the normal kernel configurator,
An image classification apparatus using deep learning, characterized in that for generating a plurality of extended images by filtering a single image received from the generated normal kernel.
상기 변형 커널 설정기는 변형 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ, 커널함수의 x축방향 회전각 θx, 커널함수의 y축방향 회전각 θy, 커널 주파수의 진폭을 결정하는 scale factor Sa 및 Sb, 상수 C 및 D 중 적어도 어느 하나를 설정하고,
상기 변형 커널 생성기는 상기 변형 커널 설정기에 의해 설정된 변형 가보필터의 필터파라미터 설계값에 따라 변형 커널을 생성하며,
생성된 변형 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.The method of claim 8,
The modified kernel setting group filter parameters of the modified Gabor filter design value as a kernel size, kernel functions direction θ, a Gaussian function by a standard deviation σ, rotating the x axis of the kernel functions each θ x, the rotation angle θ y-axis direction of the kernel functions of the y , scale factors Sa and Sb for determining the amplitude of the kernel frequency, and at least one of constants C and D are set,
The modified kernel generator generates a modified kernel according to a filter parameter design value of a modified Gabor filter set by the modified kernel setter,
An image classification apparatus using deep learning, characterized in that filtering a single image received from the generated modified kernel to generate a plurality of extended images.
상기 이미지 분류모듈은 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 분류 대상의 이미지를 공급하는 이미지 공급부, 상기 이미지 공급부로부터 공급받은 이미지에 대하여 상기 가중치 저장부에 저장된 가중치가 반영된 딥러닝 모델에 기반한 진단 프로그램을 이용하여 이미지를 분류하는 딥러닝 실행부, 상기 딥러닝 실행부에 의해 분류된 이미지와 분류 정보를 출력하는 이미지 출력부를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.The method of claim 6,
The image classification module includes an image supply unit that supplies an image to be classified obtained by an image acquisition device and provided through a user interface, and a deep learning model in which a weight stored in the weight storage unit is reflected with respect to the image supplied from the image supply unit. An image classification apparatus using deep learning, comprising: a deep learning execution unit for classifying images using a diagnostic program based on the deep learning program, and an image output unit for outputting the images classified by the deep learning execution unit and classification information.
상기 딥러닝 실행부가 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.The method of claim 11,
An image classification apparatus using deep learning, characterized in that the deep learning execution unit uses any one of LeNet-5, Alex-Net, and Google-Net as a deep learning model.
준비된 학습 데이터세트에 속하는 제한된 학습 데이터를 확장하기 위하여 노말 가보필터를 이용한 제1 확장모드 또는 변형된 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하는 확장단계;
확장된 학습 데이터를 대상으로 딥러닝 모델에서 학습 프로세스를 수행하는 학습단계;
학습 프로세스의 학습 결과 도출된 가중치 정보를 저장하는 저장단계;
이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 입력받은 분류 대상의 이미지에 대해 학습 과정에서 얻은 가중치 정보를 반영한 딥러닝 기반 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행단계;
딥러닝 실행에 의해 분류된 이미지와 분류 정보를 출력하는 출력단계;를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.A preparation step of preparing a training dataset prepared in advance;
An expansion step of expanding the learning data according to a first expansion mode using a normal Gabor filter or a second expansion mode using a modified Gabor filter in order to expand limited training data belonging to the prepared training data set;
A learning step of performing a learning process in a deep learning model for the extended training data;
A storage step of storing weight information derived as a result of learning in the learning process;
A deep learning execution step of classifying an image using a deep learning-based diagnostic program that reflects weight information obtained in a learning process with respect to the image to be classified, which is acquired by the image acquisition device and input through a user interface;
An image classification method using deep learning comprising; an output step of outputting the image classified by the deep learning execution and the classification information.
상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
[수학식 1]
[수학식 2]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. The method of claim 13,
An image classification method using deep learning, characterized in that the normal Gabor filter applied to the first extended mode is defined by Equations 1 and 2 below.
[Equation 1]
[Equation 2]
Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength that adjusts the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is It is a factor that determines the shape of the filter.
상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
[수학식 3]
여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. The method of claim 13,
An image classification method using deep learning, characterized in that the modified Gabor filter applied to the second extended mode is defined by Equation 3 below.
[Equation 3]
Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
상기 학습 단계에서 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
The method of claim 13,
Image classification method using deep learning, characterized in that any one of LeNet-5, Alex-Net, and Google-Net is used as a deep learning model in the learning step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190134464A KR102282087B1 (en) | 2019-10-28 | 2019-10-28 | Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190134464A KR102282087B1 (en) | 2019-10-28 | 2019-10-28 | Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210050168A true KR20210050168A (en) | 2021-05-07 |
KR102282087B1 KR102282087B1 (en) | 2021-07-27 |
Family
ID=75916949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190134464A KR102282087B1 (en) | 2019-10-28 | 2019-10-28 | Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102282087B1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102358235B1 (en) | 2021-07-12 | 2022-02-08 | 주식회사 몰팩바이오 | Apparatus of generating pathology data included segmentation module based on gan |
KR20230071967A (en) | 2021-11-17 | 2023-05-24 | 부산대학교 산학협력단 | Data Augmentation System and Method for Object Classification of Small Training Data based on Deep Learning |
WO2023128421A1 (en) * | 2021-12-29 | 2023-07-06 | 삼성전자 주식회사 | Image processing method and apparatus using convolutional neural network |
KR102647337B1 (en) * | 2023-07-24 | 2024-03-13 | 주식회사 아임토리 | Apparatus and Method for Data augmentation and Data Analysis |
KR20240077302A (en) | 2022-11-24 | 2024-05-31 | 부산대학교 산학협력단 | Apparatus and Method for Detecting Defect Using Deep Learning-based Surface Inspection |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011150626A (en) * | 2010-01-25 | 2011-08-04 | Ihi Corp | Method, device, and program for classifying image |
JP2016062524A (en) * | 2014-09-22 | 2016-04-25 | 日本電気株式会社 | Data processing system, data processing method and data processing program |
KR101828011B1 (en) | 2016-08-11 | 2018-02-21 | 서울대학교산학협력단 | Method and apparatus for classifying state of object included in image |
KR101843066B1 (en) | 2017-08-23 | 2018-05-15 | 주식회사 뷰노 | Method for classifying data via data augmentation of the data for machine-learning and apparatus using the same |
KR20180130925A (en) | 2017-05-30 | 2018-12-10 | 국방과학연구소 | Artificial intelligent device generating a learning image for machine running and control method thereof |
KR20190021095A (en) | 2017-08-22 | 2019-03-05 | 주식회사 넥시스 | Apparatus and method for classifying images, and apparatus for training images for classification of images |
-
2019
- 2019-10-28 KR KR1020190134464A patent/KR102282087B1/en active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011150626A (en) * | 2010-01-25 | 2011-08-04 | Ihi Corp | Method, device, and program for classifying image |
JP2016062524A (en) * | 2014-09-22 | 2016-04-25 | 日本電気株式会社 | Data processing system, data processing method and data processing program |
KR101828011B1 (en) | 2016-08-11 | 2018-02-21 | 서울대학교산학협력단 | Method and apparatus for classifying state of object included in image |
KR20180130925A (en) | 2017-05-30 | 2018-12-10 | 국방과학연구소 | Artificial intelligent device generating a learning image for machine running and control method thereof |
KR20190021095A (en) | 2017-08-22 | 2019-03-05 | 주식회사 넥시스 | Apparatus and method for classifying images, and apparatus for training images for classification of images |
KR101843066B1 (en) | 2017-08-23 | 2018-05-15 | 주식회사 뷰노 | Method for classifying data via data augmentation of the data for machine-learning and apparatus using the same |
Non-Patent Citations (1)
Title |
---|
없음 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102358235B1 (en) | 2021-07-12 | 2022-02-08 | 주식회사 몰팩바이오 | Apparatus of generating pathology data included segmentation module based on gan |
KR20230071967A (en) | 2021-11-17 | 2023-05-24 | 부산대학교 산학협력단 | Data Augmentation System and Method for Object Classification of Small Training Data based on Deep Learning |
WO2023128421A1 (en) * | 2021-12-29 | 2023-07-06 | 삼성전자 주식회사 | Image processing method and apparatus using convolutional neural network |
KR20240077302A (en) | 2022-11-24 | 2024-05-31 | 부산대학교 산학협력단 | Apparatus and Method for Detecting Defect Using Deep Learning-based Surface Inspection |
KR102647337B1 (en) * | 2023-07-24 | 2024-03-13 | 주식회사 아임토리 | Apparatus and Method for Data augmentation and Data Analysis |
Also Published As
Publication number | Publication date |
---|---|
KR102282087B1 (en) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102282087B1 (en) | Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning | |
US9031317B2 (en) | Method and apparatus for improved training of object detecting system | |
WO2020055490A1 (en) | Generating synthetic digital assets for a virtual scene including a model of a real-world object | |
JP2019091249A (en) | Defect inspection device, defect inspecting method, and program thereof | |
KR20210039927A (en) | System and method of classifying manufactured products | |
JP2019087181A (en) | Device and method for image inspection | |
JP2015087903A (en) | Apparatus and method for information processing | |
CN111401472B (en) | Infrared target classification method and device based on deep convolutional neural network | |
KR102402194B1 (en) | Deep learning based end-to-end o-ring defect inspection method | |
Orts-Escolano et al. | 3d surface reconstruction of noisy point clouds using growing neural gas: 3d object/scene reconstruction | |
US12013918B2 (en) | Method and apparatus for clustering images | |
KR101905000B1 (en) | Method, apparatus and computer program stored in computer readable medium for correction of image data | |
Nousias et al. | Fast mesh denoising with data driven normal filtering using deep variational autoencoders | |
US11501037B2 (en) | Microstructures using generative adversarial networks | |
Singh et al. | CNN based approach for traffic sign recognition system | |
Kumaresan et al. | Deep learning based Simple CNN weld defects classification using optimization technique | |
Ugolotti et al. | GPU-based point cloud recognition using evolutionary algorithms | |
JP7070308B2 (en) | Estimator generator, inspection device, estimator generator method, and estimator generator | |
Bolotov et al. | Surface recognition of machine parts based on the results of optical scanning | |
US20220012551A1 (en) | Machine learning apparatus, machine learning method, and computer-readable recording medium | |
Geng et al. | Simplification method for 3D Terracotta Warrior fragments based on local structure and deep neural networks | |
US20240161263A1 (en) | Method for inspecting defects of product by using 2d image information | |
US12035041B2 (en) | System and edge device | |
US20240112151A1 (en) | System and method for managing end-of-life products | |
Manamasa | Domain Adaptation from 3D synthetic images to real images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |