KR20210050168A - Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning - Google Patents

Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning Download PDF

Info

Publication number
KR20210050168A
KR20210050168A KR1020190134464A KR20190134464A KR20210050168A KR 20210050168 A KR20210050168 A KR 20210050168A KR 1020190134464 A KR1020190134464 A KR 1020190134464A KR 20190134464 A KR20190134464 A KR 20190134464A KR 20210050168 A KR20210050168 A KR 20210050168A
Authority
KR
South Korea
Prior art keywords
kernel
image
deep learning
learning
filter
Prior art date
Application number
KR1020190134464A
Other languages
Korean (ko)
Other versions
KR102282087B1 (en
Inventor
박세혁
Original Assignee
주식회사 뷰온
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 뷰온 filed Critical 주식회사 뷰온
Priority to KR1020190134464A priority Critical patent/KR102282087B1/en
Publication of KR20210050168A publication Critical patent/KR20210050168A/en
Application granted granted Critical
Publication of KR102282087B1 publication Critical patent/KR102282087B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06K9/627
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06T5/002
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

The present invention relates to an image classification apparatus and a method thereof, which use a Gabor filter to suggest a learning data extension method for extending limited learning data even if learning data for deep learning-based image processing are insufficient, and can be applied to an image classification process which is executed in machine vision of the manufacturing industry. The image classification apparatus comprises a memory and a processor. The present invention can secure sufficient learning data by easily and conveniently extending learning data by using a filter property change technique for changing filter parameters of a Gabor filter. The present invention can also improve image classification success rates by improving the reliability of a deep learning model by learning the deep learning model based on learning data sufficiently secured by the filter property change technique of the Gabor filter.

Description

딥러닝 모델에 적용하기 위한 학습 데이터 확장방법, 딥러닝을 이용한 이미지 분류장치 및 그 방법{Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning}Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning}

본 발명은 딥러닝 기반 영상 처리를 위한 학습 데이터가 부족하더라도 가보필터를 이용하여 제한된 학습 데이터를 확장함으로써 충분한 학습 데이터를 확보할 수 있는 학습 데이터 확장 방법을 제시하고, 이 학습 데이터 확장 방법을 이용하여 제조산업의 머신 비젼에서 실행되고 있는 이미지 분류 프로세스에 적용할 수 있는 이미지 분류장치 및 그 방법에 관한 것이다.The present invention proposes a learning data expansion method capable of securing sufficient learning data by expanding limited learning data using a Gabor filter even if training data for deep learning-based image processing is insufficient. It relates to an image classification apparatus and a method applicable to the image classification process executed in the machine vision of the manufacturing industry.

인공지능 기계학습의 발달은 지적 활동의 자동화에 대한 가능성을 열고 있다는 점에서 그 파급 효과가 매우 크고 광범위할 것으로 전망된다. 최근 딥러닝을 중심으로 급격히 발전한 기계학습 기술은 실용화를 위한 요구 수준과 실제 인공지능 기술 간의 격차를 크게 좁히며 다양한 지능형 시스템의 출현을 예고하고 있다.The development of artificial intelligence machine learning is expected to have a very large and widespread ripple effect in that it opens the possibility for automation of intellectual activities. Machine learning technology, which has recently developed rapidly around deep learning, greatly narrows the gap between the level of demand for practical use and actual artificial intelligence technology, predicting the emergence of various intelligent systems.

딥러닝은 데이터로부터 고수준의 정보를 학습하는 기술로 주로 깊은 신경망(deep neural network)에 기반한다. 딥러닝의 핵심 방법론으로는 사전학습(pre-training) 알고리즘, 컨볼루션 네트워크(CNN), 순환신경망(RNN) 등이 있다.Deep learning is a technology that learns high-level information from data and is mainly based on deep neural networks. The core methodologies of deep learning include pre-training algorithms, convolutional networks (CNNs), and cyclic neural networks (RNNs).

딥러닝은 컴퓨터비젼, 음성인식, 자율주행차, 로보틱스, 자연어 처리 등 다양한 분야에 적용되어 기존 방법을 압도하는 탁월한 성능을 보이며, 컴퓨터비젼(computer vision)과 패턴인식(pattern recognition)에서 두각을 나타내고 있다.Deep learning is applied to various fields such as computer vision, speech recognition, autonomous vehicles, robotics, natural language processing, and so on, showing excellent performance overcoming existing methods, and outstanding in computer vision and pattern recognition. have.

[특허문헌 1] 내지 [특허문헌 4]에서 딥러닝을 이용한 어플리케이션의 성능을 높이기 위해서 제한된 학습 데이터를 임의로 가공해서 늘리는 여러 기법들이 개발되고 있다.In [Patent Literature 1] to [Patent Literature 4], in order to increase the performance of an application using deep learning, various techniques for arbitrarily processing and increasing limited learning data have been developed.

그러나 상기 특허문헌들에서는 머신 비젼(machine vision)에 최적화된 학습 데이터를 확장하는 기법을 제시하고 있지 않다.However, the above patent documents do not propose a technique for extending learning data optimized for machine vision.

머신 비젼은 다양한 제조 산업의 최종 제품을 검사하기 위하여 사용되는데, 예를 들어 자동화 설비를 이용하여 생산품의 표면 결함을 검사하는 분야에서는 딥러닝 모델을 적용하기에 충분한 학습 데이터를 확보하기 어려운 경우가 많다. 이 경우 딥러닝을 이용한 어플리케이션의 성능을 보장할 수 없기 때문에, 머신 비젼 분야에 최적화된 학습 데이터를 확보하는 기법과, 이러한 학습 데이터를 바탕으로 이미지를 분류하는 기술이 개발될 필요가 있다.Machine vision is used to inspect final products in various manufacturing industries.For example, in the field of inspecting surface defects of products using automated facilities, it is often difficult to obtain sufficient training data to apply deep learning models. . In this case, since the performance of an application using deep learning cannot be guaranteed, a technique for securing training data optimized for the machine vision field and a technique for classifying images based on the training data need to be developed.

[특허문헌 1] 한국등록특허 제10-1843066호(발명의 명칭 "기계 학습에 있어서 데이터 확대를 이용하여 데이터의 분류를 수행하는 방법 및 이를 이용한 장치", 2018.03.22 등록)[Patent Document 1] Korean Patent Registration No. 10-1843066 (registered in the title of the invention "Method and device for classifying data using data expansion in machine learning", 2018.03.22) [특허문헌 2] 한국등록특허 제10-1828011호(발명의 명칭 "이미지에 포함된 객체의 상태를 분류하는 방법 및 분류장치", 2018.02.13 등록)[Patent Document 2] Korean Patent Registration No. 10-1828011 (the title of the invention, "Method and Classification Device for Classifying the State of Objects Included in Images", registered on February 13, 2018) [특허문헌 3] 한국공개특허 제10-2018-0130925호(발명의 명칭 "머신 러닝을 위한 학습 이미지를 자동 생성하는 인공 지능 장치 및 그의 제어 방법", 2018.12.10 공개)[Patent Document 3] Korean Patent Laid-Open Patent No. 10-2018-0130925 (the title of the invention "Artificial intelligence device for automatically generating learning images for machine learning and its control method", published on Dec. 10, 2018) [특허문헌 4] 한국공개특허 제10-2019-0021095호(발명의 명칭 "이미지 분류 장치와 방법 및 이미지 분류를 위한 이미지 학습 장치", 2019.03.05 공개)[Patent Document 4] Korean Patent Laid-Open Patent No. 10-2019-0021095 (the title of the invention "Image Classification Device and Method, and Image Learning Device for Image Classification", published on Mar. 5, 2019)

없음none

본 발명의 목적은 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 원본의 단일 이미지와 유사성을 가지도록 변화된 다수의 확장 이미지를 만들어내는 딥러닝 모델에 적용하기 위한 학습 데이터 확장 방법을 제공함에 있다. An object of the present invention is to provide a learning data extension method for applying to a deep learning model that generates a plurality of extended images changed to have similarity to a single image of the original by using a filter characteristic change technique that changes the filter parameters of the Gabor filter. have.

본 발명의 다른 목적은 준비된 학습 데이터세트에 속하는 모든 단일 이미지를 대상으로 필터특성 변경 기법을 적용하여 충분한 학습 데이터를 확보하고, 확보된 학습 데이터를 가지고 학습 프로세스를 수행하여 딥러닝 모델에 적용하기 위한 가중치를 생성하며, 이 가중치가 적용된 딥러닝 모델을 이용하여 이미지를 분류하는 이미지 분류 장치 및 방법을 제공함에 있다.Another object of the present invention is to secure sufficient training data by applying a filter characteristic change technique to all single images belonging to a prepared training dataset, and to apply to a deep learning model by performing a training process with the secured training data. It is to provide an image classification apparatus and method for generating weights and classifying images using a deep learning model to which the weights are applied.

상기 목적을 달성하기 위한 본 발명에 따른 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법은, 학습 데이터세트를 사전에 준비하는 준비 단계; 상기 학습 데이터세트의 단일 이미지를 대상으로 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 확장된 이미지를 생성하는 확장 단계; 및 상기 확장 단계에서 생성된 확장된 이미지를 바탕으로 딥러닝 모델을 학습시키는 학습 단계를 포함하는 것을 특징으로 한다.A training data extension method for applying to a deep learning model according to the present invention for achieving the above object includes: a preparation step of preparing a training dataset in advance; An extension step of generating an extended image using a filter characteristic change technique for changing a filter parameter of a Gabor filter for a single image of the training dataset; And a learning step of training a deep learning model based on the expanded image generated in the expansion step.

또한 상기 확장 단계에서 필터특성 변경 기법은 커널의 모양, 방향, 중심 주파수, 대역폭 중 적어도 어느 하나에 대응하는 필터파라미터를 변경하는 것을 특징으로 한다.In addition, in the expansion step, the filter characteristic changing method is characterized in that a filter parameter corresponding to at least one of a shape, a direction, a center frequency, and a bandwidth of a kernel is changed.

또한 상기 확장 단계에서 노말 가보필터를 이용하여 학습 데이터를 확장하는 제1 확장모드와 변형된 가보필터를 이용하여 학습 데이터를 확장하는 제2 확장모드 중 어느 하나의 확장모드에 따라 학습 데이터를 확장하는 것을 특징으로 한다.In addition, in the expansion step, learning data is expanded according to one of a first expansion mode in which training data is expanded using a normal Gabor filter and a second expansion mode in which training data is expanded using a modified Gabor filter. It is characterized by that.

또한 상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 한다.In addition, the normal Gabor filter applied to the first extended mode is characterized by defined by Equations 1 and 2 below.

[수학식 1][Equation 1]

Figure pat00001
Figure pat00001

[수학식 2][Equation 2]

Figure pat00002
Figure pat00002

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.

또한 상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 한다.In addition, the modified Gabor filter applied to the second extended mode is defined by Equation 3 below.

[수학식 3][Equation 3]

Figure pat00003
Figure pat00003

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.

상기 목적을 달성하기 위한 본 발명에 따른 딥러닝을 이용한 이미지 분류 장치는, 학습 데이터세트를 저장하는 학습 데이터세트 저장부, 가중치 정보를 저장하는 가중치 저장부를 구비한 메모리; 상기 학습 데이터세트의 단일 이미지를 입력받고 가보필터의 필터파라미터를 바꾸어 확장 이미지를 생성하고 생성된 확장 이미지를 바탕으로 딥러닝 모델을 학습한 결과로부터 도출된 가중치 정보를 상기 가중치 저장부에 저장하는 데이터 학습모듈, 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 입력 이미지에 대해 딥러닝 기반 진단 프로그램이 상기 가중치 정보에 저장된 가중치 정보를 이용하여 이미지 분류 프로세싱을 수행하는 이미지 분류모듈을 구비한 프로세서;를 포함하는 것을 특징으로 한다.An image classification apparatus using deep learning according to the present invention for achieving the above object includes: a memory having a training data set storage unit for storing a training data set and a weight storage unit for storing weight information; Data for receiving a single image of the training dataset, generating an extended image by changing a filter parameter of a Gabor filter, and storing weight information derived from the result of training a deep learning model based on the generated extended image in the weight storage unit A processor having an image classification module for performing image classification processing by a deep learning-based diagnostic program on the input image acquired by the learning module and the image acquisition device and provided through the user interface using the weight information stored in the weight information; It characterized in that it comprises a.

또한 상기 데이터 학습모듈은 가보필터의 필터파라미터의 설계값을 설정하여 커널을 특정하고, 특정된 커널의 필터링 연산에 의해 확장 이미지를 생성하는 학습 데이터 확장부, 상기 확장 이미지가 포함된 학습 데이터세트를 가지고 딥러닝 모델을 학습시키는 학습부를 포함하는 것을 특징으로 한다.In addition, the data learning module specifies a kernel by setting a design value of a filter parameter of a gabor filter, and generates an extended image by a filtering operation of the specified kernel, and a training dataset including the extended image. It characterized in that it comprises a learning unit for training a deep learning model.

또한 상기 학습 데이터 확장부는 노말 가보필터를 이용한 제1 확장모드에 따라 학습 데이터를 확장하기 위한 노말 커널 설정기 및 노말 커널 생성기, 변형 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하기 위한 변형 커널 설정기 및 변형 커널 생성기를 포함하는 것을 특징으로 한다.In addition, the learning data extension unit is a normal kernel setter and a normal kernel generator for extending learning data according to a first expansion mode using a normal Gabor filter, and a modification for expanding learning data according to a second expansion mode using a modified Gabor filter. It characterized in that it includes a kernel configurator and a modified kernel generator.

또한 상기 노말 커널 설정기는 노말 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ 중 적어도 어느 하나를 설정하고, 상기 노말 커널 생성기는 상기 노말 커널 설정기에 의해 설정된 노말 가보필터의 필터파라미터 설계값에 따라 노말 커널을 생성하며, 생성된 노말 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 한다.In addition, the normal kernel configurator sets at least one of a kernel size, a directionality θ of a kernel function, and a standard deviation σ of a Gaussian function as a filter parameter design value of a normal gabor filter, and the normal kernel generator A normal kernel is generated according to a filter parameter design value of a normal gabor filter, and a plurality of extended images are generated by filtering a single image received from the generated normal kernel.

또한 상기 변형 커널 설정기는 변형 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ, 커널함수의 x축방향 회전각 θx, 커널함수의 y축방향 회전각 θy, 커널 주파수의 진폭을 결정하는 scale factor Sa 및 Sb, 상수 C 및 D 중 적어도 어느 하나를 설정하고, 상기 변형 커널 생성기는 상기 변형 커널 설정기에 의해 설정된 변형 가보필터의 필터파라미터 설계값에 따라 변형 커널을 생성하며, 생성된 변형 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 한다.In addition, the modified kernel setting group transformation Gabor filters filter parameter design value as a kernel size, kernel functions direction θ, the rotational angle standard deviation σ, y-axis direction of the kernel x axis of the function the rotation angle θ x, the kernel functions of the Gaussian function of the θ y , scale factors Sa and Sb for determining the amplitude of the kernel frequency, and at least one of constants C and D are set, and the modified kernel generator is based on a design value of a filter parameter of a modified Gabor filter set by the modified kernel setter. A modified kernel is generated, and a plurality of extended images are generated by filtering a single image input from the generated modified kernel.

또한 상기 이미지 분류모듈은 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 분류 대상의 이미지를 공급하는 이미지 공급부, 상기 이미지 공급부로부터 공급받은 이미지에 대하여 상기 가중치 저장부에 저장된 가중치가 반영된 딥러닝 모델에 기반한 진단 프로그램을 이용하여 이미지를 분류하는 딥러닝 실행부, 상기 딥러닝 실행부에 의해 분류된 이미지와 분류 정보를 출력하는 이미지 출력부를 포함하는 것을 특징으로 한다.In addition, the image classification module is an image supply unit that supplies an image to be classified obtained by an image acquisition device and provided through a user interface, and a deep learning model in which the weight stored in the weight storage unit is reflected with respect to the image supplied from the image supply unit. And a deep learning execution unit for classifying an image using a diagnostic program based on and an image output unit for outputting the images classified by the deep learning execution unit and classification information.

또한 상기 딥러닝 실행부가 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 한다.In addition, it is characterized in that the deep learning execution unit uses any one of LeNet-5, Alex-Net, and Google-Net as a deep learning model.

상기 목적을 달성하기 위한 본 발명에 따른 딥러닝을 이용한 이미지 분류 방법은, 사전에 준비된 학습 데이터세트를 준비하는 준비단계; 준비된 학습 데이터세트에 속하는 제한된 학습 데이터를 확장하기 위하여 노말 가보필터를 이용한 제1 확장모드 또는 변형된 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하는 확장단계; 확장된 학습 데이터를 대상으로 딥러닝 모델에서 학습 프로세스를 수행하는 학습단계; 학습 프로세스의 학습 결과 도출된 가중치 정보를 저장하는 저장단계; 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 입력받은 분류 대상의 이미지에 대해 학습 과정에서 얻은 가중치 정보를 반영한 딥러닝 기반 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행단계; 딥러닝 실행에 의해 분류된 이미지와 분류 정보를 출력하는 출력단계;를 포함하는 것을 특징으로 한다.An image classification method using deep learning according to the present invention for achieving the above object comprises: a preparation step of preparing a training dataset prepared in advance; An expansion step of expanding the learning data according to a first expansion mode using a normal Gabor filter or a second expansion mode using a modified Gabor filter in order to expand limited training data belonging to the prepared training data set; A learning step of performing a learning process in a deep learning model for the extended training data; A storage step of storing weight information derived from a learning result of the learning process; A deep learning execution step of classifying an image using a deep learning-based diagnostic program that reflects weight information obtained in a learning process with respect to the image to be classified that is acquired by the image acquisition device and input through a user interface; And an output step of outputting the image and classification information classified by the deep learning execution.

또한 상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 한다.In addition, the normal Gabor filter applied to the first extended mode is characterized by defined by Equations 1 and 2 below.

[수학식 1][Equation 1]

Figure pat00004
Figure pat00004

[수학식 2][Equation 2]

Figure pat00005
Figure pat00005

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.

또한 상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 한다.In addition, the modified Gabor filter applied to the second extended mode is defined by Equation 3 below.

[수학식 3][Equation 3]

Figure pat00006
Figure pat00006

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.

또한 상기 학습 단계에서 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 한다.In addition, it is characterized in that any one of LeNet-5, Alex-Net, and Google-Net is used as a deep learning model in the learning step.

이상과 같은 본 발명은 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 학습 데이터를 쉽고 간편하게 확장하여 충분한 학습 데이터를 확보할 수 있다.According to the present invention as described above, it is possible to secure sufficient learning data by easily and simply expanding the learning data by using a filter characteristic changing technique for changing the filter parameter of the Gabor filter.

또한 본 발명은 가보필터의 필터특성 변경 기법에 의해 충분히 확보된 학습 데이터를 바탕으로 딥러닝 모델을 학습하여 딥러닝 모델의 신뢰성을 향상시킴으로써 이미지 분류 성공률을 개선할 수 있다.In addition, the present invention can improve the success rate of image classification by improving the reliability of the deep learning model by learning a deep learning model based on training data sufficiently secured by a filter characteristic change method of a Gabor filter.

또한 본 발명은 제조산업의 생산품 불량을 검사하는 검사 시스템의 진단 프로그램에 적용할 수 있고, 딥러닝 모델을 기반으로 한 진단 프로그램에서 실행되는 이미지 분류 프로세싱에 의한 불량 검사의 정확도를 향상시킬 수 있다. In addition, the present invention can be applied to a diagnostic program of an inspection system that inspects product defects in the manufacturing industry, and can improve the accuracy of defect inspection by image classification processing executed in a diagnostic program based on a deep learning model.

도 1은 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류방법을 나타내는 흐름도,
도 2는 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류장치의 블록도,
도 3은 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류장치의 주요부에 대한 상세한 블록도,
도 4는 도 3의 학습 데이터 확장부에 대한 상세 블록도,
도 5는 도 3의 학습 데이터 확장부가 노말 가보필터를 이용하여 제1 확장모드에서 숫자 '0'의 이미지를 확장하는 동작을 설명하기 위한 도면,
도 6은 도 3의 학습 데이터 확장부가 노말 가보필터를 이용한 제1 확장모드에서 단일 이미지로부터 복수개의 확장 이미지를 생성하는 원리를 설명하는 도면,
도 7은 도 3의 학습 데이터 확장부가 변형된 가보필터를 이용한 제2 확장모드에서 단일 이미지로부터 복수개 확장 이미지를 생성하는 원리를 설명하는 도면,
도 8은 본 발명의 실시예에 따른 동일한 입력 이미지에 대해 제1 확장모드와 제2 확장모드를 적용시 얻어지는 복수개의 확장 이미지를 나타내는 도면이다.
1 is a flowchart showing an image classification method using deep learning according to an embodiment of the present invention;
2 is a block diagram of an image classification apparatus using deep learning according to an embodiment of the present invention.
3 is a detailed block diagram of a main part of an image classification apparatus using deep learning according to an embodiment of the present invention;
4 is a detailed block diagram of the learning data expansion unit of FIG. 3;
FIG. 5 is a diagram for explaining an operation of expanding an image of a number '0' in a first expansion mode by using a normal Gabor filter by the learning data expansion unit of FIG. 3;
FIG. 6 is a diagram illustrating a principle of generating a plurality of extended images from a single image in a first extended mode using a normal Gabor filter by the training data extension of FIG. 3; FIG.
FIG. 7 is a diagram illustrating a principle of generating a plurality of extended images from a single image in a second extended mode using a modified Gabor filter by the learning data extension part of FIG. 3; FIG.
8 is a diagram illustrating a plurality of extended images obtained when a first extended mode and a second extended mode are applied to the same input image according to an embodiment of the present invention.

이하 첨부한 도면을 참조하여 본 발명의 실시 예를 설명함으로써 본 발명을 설명한다. Hereinafter, the present invention will be described by describing embodiments of the present invention with reference to the accompanying drawings.

각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 또한 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.The same reference numerals shown in each drawing indicate the same members. In addition, in describing the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, a detailed description thereof will be omitted. In addition, when a part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.

머신 비젼은 생산 라인 상에 장착된 카메라, 광학계, 조명 등의 하드웨어를 통해 제품의 이미지를 획득하고, 획득된 이미지를 분석하고 검사하는 진단 프로그램을 통해 이미지 프로세싱을 수행한다. Machine Vision acquires an image of a product through hardware such as cameras, optical systems, and lighting installed on a production line, and performs image processing through a diagnostic program that analyzes and inspects the acquired image.

본 발명은 가보필터의 필터파라마터의 설계값을 가변하여 딥러닝 모델에 적용하기 위한 학습 데이터를 만들어 확장시키는 것을 기술적 특징으로 한다. The present invention is characterized in that the design value of a filter parameter of a Gabor filter is varied to create and expand training data for application to a deep learning model.

또한 본 발명은 제조산업의 생산품 불량을 검사하는 검사 시스템의 진단 프로그램에 적용할 수 있고, 딥러닝 모델의 신뢰성을 높일 수 있도록 충분한 학습 데이터를 제공함으로써 딥러닝 모델을 기반으로 한 진단 프로그램에서 실행되는 이미지 분류 프로세싱에 의한 불량 검사의 정확도를 향상시킬 수 있다. In addition, the present invention can be applied to a diagnostic program of an inspection system that inspects product defects in the manufacturing industry, and by providing sufficient training data to increase the reliability of the deep learning model, the diagnostic program based on the deep learning model can be applied. It is possible to improve the accuracy of defect inspection by image classification processing.

가보필터는 공간 영역과 주파수 영역에서 동조 가능한 방향과 중심 주파수(tunable orientation and center frequency), 그리고 반경 주파수 대역폭(radial frequency bandwidth)과 관련된 필터파라메터들을 가진다. 필터파라메터들을 어떻게 설정하느냐에 따라 커널의 모양(shape), 방향(orientation), 중심 주파수(center frequency), 대역폭(bandwidth) 등이 변화되어, 가보필터에 대한 커널함수의 특징이 결정되기 때문에 각각의 커널함수에서 이루어지는 필터링 연산을 거치게 되면 유사한 이미지들을 얻을 수 있다.The Gabor filter has filter parameters related to a tunable orientation and center frequency, and a radial frequency bandwidth in the spatial and frequency domains. Depending on how the filter parameters are set, the shape, orientation, center frequency, and bandwidth of the kernel are changed, and the characteristics of the kernel function for the Gabor filter are determined. Similar images can be obtained by passing through the filtering operation performed in the function.

본 발명에서 필터파라메터의 설계값을 가변함으로써 설정된 제각각 다른 커널함수를 이용하여 입력된 단일 이미지에 대해 유사성을 가진 다수의 새로운 이미지를 만들고, 사전 준비된 학습 데이터세트에 가보필터를 이용한 데이터 확장을 통해 확보된 새로운 이미지를 학습 데이터로 포함시킨다. 본 발명은 가보필터의 필터 특성을 나타내는 커널함수를 다양하게 변화시켜 원본 이미지와 유사한 이미지들을 만들고, 딥러닝 모델의 학습 데이터에 새롭게 만든 이미지들을 포함시켜 보강할 수 있다.In the present invention, by varying the design value of the filter parameter, a number of new images with similarity to the input single image are created using different kernel functions set, and secured through data expansion using a Gabor filter in a pre-prepared training dataset. The new image is included as training data. In the present invention, images similar to the original image may be created by variously changing a kernel function representing the filter characteristics of a Gabor filter, and the newly created images may be included in the training data of the deep learning model to be reinforced.

본 발명은 보강된 학습 데이터세트를 바탕으로 딥러닝을 실행하여 이미지 분류 프로세싱에 적용하기 위한 가중치를 연산하고, 실행 결과로부터 얻은 가중치 정보를 저장한다. 이와 같이 가중치 정보는 새로운 학습 데이터를 추가시 가중치 정보를 갱신하게 된다.The present invention performs deep learning based on the reinforced training dataset, calculates weights for application to image classification processing, and stores weight information obtained from the execution result. In this way, the weight information is updated when new training data is added.

도 1을 참고하면, 본 발명의 실시예에 따른 딥러닝을 이용한 이미지 분류 방법은 사전에 준비된 학습 데이터세트를 준비하는 준비단계(10), 준비된 학습 데이터세트에 속하는 제한된 학습 데이터를 확장하기 위하여 노말 가보필터를 이용한 제1 확장모드 또는 변형된 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하는 확장단계(20), 확장된 학습 데이터를 대상으로 딥러닝 모델에서 학습 프로세스를 수행하는 학습단계(30), 학습 프로세스의 결과 도출된 가중치 정보를 저장하는 저장단계(40), 학습 과정으로 얻은 가중치를 이용하여 분류 대상의 이미지에 대해 딥러닝에 기반한 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행단계(50), 딥러닝 실행에 의해 분류된 이미지와 분류 정보를 출력하는 출력단계(60)를 포함한다. Referring to FIG. 1, the image classification method using deep learning according to an embodiment of the present invention includes a preparation step 10 of preparing a training dataset prepared in advance, and normal to expand limited training data belonging to the prepared training dataset. Expansion step 20 of expanding training data according to a first expansion mode using a Gabor filter or a second expansion mode using a modified Gabor filter, a learning step of performing a learning process in a deep learning model targeting the expanded training data (30), a storage step of storing weight information derived as a result of the learning process (40), deep learning that classifies the image using a diagnostic program based on deep learning for the image to be classified using the weight obtained from the learning process An execution step 50, and an output step 60 of outputting images and classification information classified by deep learning execution.

도 2 및 도 3을 참고하여, 본 발명에 따른 딥러닝을 이용한 이미지 분류장치는 사용자 인터페이스(100), 프로세서(101), 메모리(104)가 포함된 컴퓨팅 장치로 구현될 수 있다.2 and 3, the image classification apparatus using deep learning according to the present invention may be implemented as a computing device including a user interface 100, a processor 101, and a memory 104.

사용자는 사용자 인터페이스(100)를 통해 데이터 학습 실행 여부, 확장 모드의 선택, 딥러닝 모델의 선택, 대상 이미지 입력 등 이미지 분류에 관련된 전반적인 사용자 명령을 입력한다.Through the user interface 100, the user inputs overall user commands related to image classification, such as whether to execute data learning, select an extension mode, select a deep learning model, and input a target image.

메모리(104)는 딥러닝 기반 진단프로그램을 저장하는 딥러닝 솔루션(105), 딥러닝 모델을 학습시키기 위한 학습 데이터를 저장하는 학습 데이터세트 저장부(110), 딥러닝 모델에 의한 학습 결과 얻어진 가중치 정보를 저장하는 가중치 저장부(140)를 포함한다.The memory 104 includes a deep learning solution 105 that stores a deep learning-based diagnostic program, a training dataset storage unit 110 that stores training data for training a deep learning model, and a weight obtained as a result of learning by the deep learning model. It includes a weight storage unit 140 for storing information.

프로세서(101)는 학습 데이터세트 저장부(110)로부터 사전 준비된 학습 데이터를 제공받고, 학습 결과로 얻어진 가중치 정보를 가중치 저장부(140)에 저장한다. 프로세서(101)는 데이터 학습모듈(102)과 이미지 분류모듈(103)을 포함한다.The processor 101 receives training data prepared in advance from the training data set storage unit 110 and stores weight information obtained as a result of the training in the weight storage unit 140. The processor 101 includes a data learning module 102 and an image classification module 103.

데이터 학습모듈(102)은 학습 데이터를 확장하는 학습 데이터 확장부(120), 확장된 학습 데이터를 바탕으로 학습하는 학습부(130)를 포함한다.The data learning module 102 includes a learning data expansion unit 120 for expanding learning data, and a learning unit 130 for learning based on the expanded learning data.

이미지 분류모듈(103)은 이미지 획득장치에서 획득되고 사용자 인터페이스(100)를 통해 제공받은 분류 대상의 이미지를 공급하는 이미지 공급부(150), 이미지 공급부(150)로부터 공급받은 이미지에 대하여 가중치 저장부(140)에 저장된 가중치가 반영된 딥러닝 모델에 기반한 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행부(160), 딥러닝 실행부(160)에 의해 분류된 이미지와 분류 정보를 출력하는 이미지 출력부(170)를 포함한다.The image classification module 103 includes an image supply unit 150 for supplying an image to be classified obtained from an image acquisition device and provided through the user interface 100, and a weight storage unit for the image supplied from the image supply unit 150 ( 140) a deep learning execution unit 160 that classifies images using a diagnostic program based on a deep learning model reflecting the weights stored in), an image output unit that outputs images and classification information classified by the deep learning execution unit 160 Includes 170.

도 4를 참고하면, 데이터 학습모듈(120)은 노말 커널 설정기(121), 노말 커널 생성기(122), 변형 커널 설정기(123), 변형 커널 생성기(124)를 포함한다.Referring to FIG. 4, the data learning module 120 includes a normal kernel setter 121, a normal kernel generator 122, a modified kernel setter 123, and a modified kernel generator 124.

데이터 학습모듈(120)은 사용자 인터페이스부(100)로부터 확장모드 선택명령을 입력받아 제1 확장모드 또는 제2 확장모드에 따라 학습 데이터를 확장한다.The data learning module 120 receives an extended mode selection command from the user interface unit 100 and expands the learning data according to the first extended mode or the second extended mode.

데이터 학습모듈(120)은 크게 노말 가보필터를 이용한 제1 확장모드에 의한 학습 데이터 확장과 변형된 가보필터를 이용한 제2 확장모드에 의한 학습 데이터 확장으로 구분할 수 있다. 제1 확장모드는 노말 커널 설정기(121)와 노말 커널 생성기(122)를 이용하여 학습 데이터를 확장한다.The data learning module 120 can be broadly divided into learning data expansion by a first expansion mode using a normal Gabor filter and expansion of learning data by a second expansion mode using a modified Gabor filter. In the first extended mode, training data is extended using the normal kernel configurator 121 and the normal kernel generator 122.

노말 커널 설정기(121)는 노말 가보필터의 커널을 특정하기 위한 필터파라미터를 가변한다.The normal kernel configurator 121 changes filter parameters for specifying the kernel of the normal gabor filter.

노말 가보필터는 다음의 [수학식 1]과 같이 나타낼 수 있다.The normal Gabor filter can be expressed as the following [Equation 1].

Figure pat00007
Figure pat00007

[수학식 1]에서 x'와 y'는 다음의 [수학식 2]와 같이 나타낼 수 있다.In [Equation 1], x'and y'can be expressed as the following [Equation 2].

Figure pat00008
Figure pat00008

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.

노말 커널 설정기(121)는 적어도 하나의 노말 가보필터의 필터파라미터에 대한 설계값들을 노말 커널 생성기(122)에 제공한다. 필터파라미터의 개수가 제한되는 것은 아니다. 실시예에서 노말 가보필터의 필터파라미터로서 커널 사이즈(kernel size), σ, θ에 대한 설계값을 제공하였으나, 분류 대상의 이미지 특성과 이미지 획득장치의 성능 등을 고려하여 필터파라미터의 개수와 대상을 변경할 수 있다.The normal kernel configurator 121 provides design values for filter parameters of at least one normal gabor filter to the normal kernel generator 122. The number of filter parameters is not limited. In the embodiment, design values for kernel size, σ, and θ are provided as filter parameters of the normal Gabor filter, but the number and targets of filter parameters are determined in consideration of the image characteristics of the classification target and the performance of the image acquisition device. You can change it.

노말 커널 생성기(122)는 제공받은 필터파라미터의 설계값에 기초하여 노말 가보필터의 커널인 노말 커널을 생성한다. 예를 들어 커널 사이즈(kernel size)가 11X11, σ=2, θ=π/6에 의해 제1 노말커널(GK1)이 생성되고, 커널 사이즈(kernel size)가 11 X 11(pixel), σ=2, θ=π/3에 의해 제2 노말커널(GK2)이 생성되며, 이와 같은 방식으로 n개 노말커널이 생성될 수 있다.The normal kernel generator 122 generates a normal kernel, which is a kernel of a normal heirloom filter, based on the design values of the supplied filter parameters. For example, the first normal kernel (GK1) is generated by the kernel size of 11X11, σ=2, θ=π/6, and the kernel size is 11 X 11 (pixel), σ= 2, the second normal kernel GK2 is generated by θ=π/3, and n normal kernels may be generated in this manner.

노말 커널 생성기(122)는 학습 데이터세트 저장부(110)로부터 사전 준비된 학습 데이터세트를 제공받는데, 원본의 단일 이미지를 개별적으로 입력받는다. 노말 커널 생성기(122)는 개별 입력되는 단일 이미지를 대상으로 하여 생성된 n개 노말커널에서 필터링 연산하여 원본 이미지와 유사한 n개의 확장 이미지(확장 이미지1, 확장 이미지2, ..., 확장 이미지n)를 생성한다. 생성된 n개의 확장 이미지는 학습부(130)에 제공된다.The normal kernel generator 122 receives a training dataset prepared in advance from the training dataset storage unit 110, and receives a single image of the original individually. The normal kernel generator 122 performs filtering operations on n normal kernels generated for a single image that is individually input, and performs a filtering operation on n extended images (extended image 1, extended image 2, ..., extended image n) similar to the original image. ). The generated n expanded images are provided to the learning unit 130.

제2 확장모드는 변형 커널 설정기(123)와 변형 커널 생성기(124)를 이용하여 학습 데이터를 확장한다.In the second extended mode, training data is extended using the modified kernel setter 123 and the modified kernel generator 124.

변형 커널 설정기(123)는 변형 가보필터의 커널을 특정하기 위한 필터파라미터를 가변한다.The modified kernel configurator 123 changes filter parameters for specifying the kernel of the modified gabor filter.

변형 가보필터는 입력 이미지에 대해 부분적으로 휘어지게 하거나 커널 중심으로부터 떨어진 주변에 축소된 이미지가 반복되어 나타나도록 변형시킬 수 있다.The transformed Gabor filter can be transformed so that the input image is partially warped or a reduced image is repeatedly displayed around the center away from the kernel.

실시예에서 변형 가보필터는 다음의 [수학식 3]과 같이 나타낼 수 있다.In an embodiment, the modified Gabor filter can be expressed as the following [Equation 3].

Figure pat00009
Figure pat00009

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다. Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.

변형 커널 설계값 설정기(123)는 적어도 하나의 변형 가보필터의 필터파라미터에 대한 설계값들을 노말 커널 생성기(122)에 제공한다. 필터파라미터의 개수가 제한되는 것은 아니다. 실시예에서 변형 가보필터의 필터파라미터로서 커널 사이즈(kernel size), σ, θ, θx, θy, Sa, Sb, C, D 대한 설계값을 제공하였으나, 분류 대상의 이미지 특성과 이미지 획득장치의 성능 등을 고려하여 필터파라미터의 개수와 대상을 변경할 수 있다.The modified kernel design value setter 123 provides design values for filter parameters of at least one modified Gabor filter to the normal kernel generator 122. The number of filter parameters is not limited. In the embodiment, design values for kernel size, σ, θ, θ x , θ y , Sa, Sb, C, D were provided as filter parameters of the modified Gabor filter, but image characteristics and image acquisition devices to be classified The number and target of filter parameters can be changed in consideration of the performance of the filter.

변형 커널 생성기(124)는 제공받은 필터파라미터의 설계값에 기초하여 변형 가보필터의 커널인 변형 커널을 생성한다. 예를 들어, σ=5, θ=π/4, θx=π/30 ,θy=0, C=1.4, D=15로 주어진 경우에 의해 제1 변형커널(MK1)이 생성되고, σ=5, θ=π/4, θx=0 ,θy=π/30, C=1.4, D=15로 주어진 경우에 의해 제2 변형커널(MK2)이 생성되며, 이와 같은 방식으로 n개 변형커널이 생성될 수 있다.The modified kernel generator 124 generates a modified kernel, which is a kernel of the modified Gabor filter, based on the design values of the provided filter parameters. For example, given as σ=5, θ=π/4, θ x =π/30, θ y =0, C=1.4, D=15, the first transformation kernel (MK1) is generated, and σ =5, θ=π/4, θ x =0, θ y =π/30, C=1.4, D=15 The second transforming kernel (MK2) is generated by the same method, and n A transform kernel can be created.

변형 커널 생성기(124)는 학습 데이터세트 저장부(110)로부터 사전 준비된 학습 데이터세트에 해당하는 원본의 단일 이미지를 개별적으로 입력받는다. 변형 커널 생성기(124)는 개별 입력되는 단일 이미지를 대상으로 하여 생성된 n개 변형커널에서 필터링 연산하여 원본 이미지와 유사한 n개의 확장 이미지(확장 이미지1, 확장 이미지2, ..., 확장 이미지n)를 생성한다. 생성된 n개의 확장 이미지는 학습부(130)에 제공된다.The modified kernel generator 124 individually receives an original single image corresponding to a pre-prepared training dataset from the training dataset storage unit 110. The transformed kernel generator 124 performs filtering operations on n transformed kernels generated targeting a single image that is individually input to generate n extended images similar to the original image (extended image 1, extended image 2, ..., extended image n). ). The generated n expanded images are provided to the learning unit 130.

학습부(130)는 제1 확장모드에서 노말 가보필터를 이용하여 확장된 학습 데이터를 바탕으로 딥러닝 모델에 대한 학습을 수행하거나 제2 확장모드에서 변형 가보필터를 이용하여 확장된 학습 데이터를 바탕으로 딥러닝 모델에 대한 학습을 수행하게 된다. 이렇게 학습부(130)가 딥러닝 모델의 학습프로세스를 수행하여 얻은 가중치 정보는 가중치 저장부(140)에 저장함으로써 딥러닝 실행부(160)에 적용된다. The learning unit 130 performs training on the deep learning model based on the extended training data using the normal Gabor filter in the first extended mode, or based on the extended training data using the modified Gabor filter in the second extended mode. As a result, deep learning models are trained. In this way, the weight information obtained by performing the learning process of the deep learning model by the learning unit 130 is stored in the weight storage unit 140 and applied to the deep learning execution unit 160.

실시예에서 학습부(130) 및 딥러닝 실행부(160)가 사용하는 딥러닝 모델로서 LeNet-5를 적용하였으나, 딥러닝 모델이 특정되는 것은 아니며, 다른 딥러닝 모델로서 알렉스넷(Alex Net), 구글넷(Google Net) 등을 적용할 수도 있다.In the embodiment, LeNet-5 is applied as a deep learning model used by the learning unit 130 and the deep learning execution unit 160, but the deep learning model is not specified, and as another deep learning model, Alex Net , Google Net, etc. can also be applied.

학습 데이터세트 저장부(110)에서 제공하는 학습 데이터세트는 딥러닝을 학습시키기 위한 정보 집합체이다.The training dataset provided by the training dataset storage unit 110 is a collection of information for learning deep learning.

일반적으로 머신 러닝(machine learning)에서 폭 넓게 쓰이고 있는 MNIST(Modifified National Institute of Standards and Technology database) 데이터세트를 채택할 수 있다. MNIST 데이터세트는 60,000개 학습 이미지(train image)와 10,000개 테스트 이미지(test image)를 포함한다. 학습 이미지의 절반과 테스트 이미지의 절반은 NIST(National Institute of Standards and Technology)의 학습 데이터세트(train dataset)에서 취합하였으며, 나머지 학습 이미지의 절반과 테스트 이미지의 절반은 NIST의 테스트 데이터세트(test dataset)에서 취합하였다.In general, a dataset of the Modified National Institute of Standards and Technology database (MNIST), which is widely used in machine learning, can be adopted. The MNIST dataset contains 60,000 train images and 10,000 test images. Half of the training images and half of the test images were collected from the National Institute of Standards and Technology (NIST) train dataset, and half of the remaining training images and half of the test images were collected from NIST's test dataset. ).

MNIST 데이터세트는 Size-normalized 및 Certered 되어 있고, 28×28 크기의 Gray Image 이다. 아래의 [표 1]은 MNIST 데이터세트의 각 숫자의 샘플 이미지와 수량을 보여준다.The MNIST dataset is size-normalized and certered, and is a 28×28 gray image. [Table 1] below shows sample images and quantities of each number in the MNIST dataset.

학습 데이터세트(train dataset)Train dataset 테스트 데이터세트(teat dateset)Test dataset (teat dateset) 번호number example imageexample image 수량Quantity example imageexample image 수량Quantity 00

Figure pat00010
Figure pat00010
5,923장5,923 pieces
Figure pat00011
Figure pat00011
980장Chapter 980 1One
Figure pat00012
Figure pat00012
6,742장6,742 pieces
Figure pat00013
Figure pat00013
1,135장1,135 pieces
22
Figure pat00014
Figure pat00014
5,958장5,958 pieces
Figure pat00015
Figure pat00015
1,032장1,032 pieces
33
Figure pat00016
Figure pat00016
6,131장6,131 pieces
Figure pat00017
Figure pat00017
1,010장1,010 pieces
44
Figure pat00018
Figure pat00018
5,842장5,842 pieces
Figure pat00019
Figure pat00019
982장Chapter 982
55
Figure pat00020
Figure pat00020
5,421장5,421 pieces
Figure pat00021
Figure pat00021
892장Chapter 892
66
Figure pat00022
Figure pat00022
5,918장5,918 pieces
Figure pat00023
Figure pat00023
958장Chapter 958
77
Figure pat00024
Figure pat00024
6,265장6,265 pieces
Figure pat00025
Figure pat00025
1,028장1,028 pieces
88
Figure pat00026
Figure pat00026
5,851장5,851 pieces
Figure pat00027
Figure pat00027
974장Chapter 974
99
Figure pat00028
Figure pat00028
5,949장5,949 pieces
Figure pat00029
Figure pat00029
1,009장1,009 pieces
총계sum 60,000장60,000 sheets 10,000장10,000 sheets

도 5를 참고하여, 제1 확장모드에서 학습 데이터 확장부(120)가 학습 데이터를 확장하는 경우, 숫자 '0'의 입력 이미지에 대해 제1 내지 제4 커널함수(GK1, GK2, GK3, GK4)을 이용하여 제1 내지 제4 확장 이미지(A1, A2, A3, A4)를 만들 수 있다.Referring to FIG. 5, when the learning data expansion unit 120 expands the learning data in the first expansion mode, the first to fourth kernel functions (GK1, GK2, GK3, GK4) for the input image of the number '0' ) Can be used to create the first to fourth extended images A1, A2, A3, A4.

다른 예로서 도 6을 참고하여, 학습 데이터세트로서, 숫자 0 내지 9의 학습 데이터를 각각 50장씩 총 500장을 가지고, 제1 확장모드에서 학습 데이터 확장부(120)가 학습 데이터를 확장하는 경우를 예시하여 설명한다. 여기서 σ를 일정하게 설정하고 커널 사이즈와 θ를 가변하여 각 숫자의 학습 데이터에 대해 8장의 확장 이미지를 만들 수 있다. 즉, 숫자 '0'에 대한 학습 데이터 총 50장에 대해 각각 8장씩 확장 이미지를 만들어 총 400장의 확장 이미지를 생성하게 되며, 원본 이미지 50장을 포함하여 숫자 '0'에 대한 학습 이미지로서 450장을 확보할 수 있다.As another example, referring to FIG. 6, as a training data set, when the training data of numbers 0 to 9 has a total of 500 pieces of 50 pieces each, and the training data expansion unit 120 expands the training data in the first expansion mode It will be described by way of example. Here, by setting σ constant and varying the kernel size and θ, you can create 8 extended images for each number of training data. In other words, for a total of 50 training data for the number '0', 8 extended images are created each to create a total of 400 extended images, and 450 pieces of training images for the number '0' including 50 original images. Can be secured.

학습 데이터세트 저장부(110)가 제한된 학습 데이터를 가지고 있어 절대적으로 학습 데이터가 부족한 경우, 제2 확장모드를 이용하여 충분한 확장 데이터를 확보하는 동작을 설명한다.When the training data set storage unit 110 has limited training data and therefore absolutely lacks training data, an operation of securing sufficient extended data using the second extended mode will be described.

도 7은 도 3의 학습 데이터 확장부가 변형된 가보필터를 이용한 제2 확장모드에서 단일 이미지로부터 복수개의 확장 이미지를 생성하는 원리를 설명하는 도면이다.FIG. 7 is a diagram for explaining a principle of generating a plurality of expanded images from a single image in a second expansion mode using a modified Gabor filter by the learning data expansion unit of FIG. 3.

도 7에서, 임의의 가보필터의 커널(K1)에 적용하는 필터파라미터가 σ=5, θ=π/4인 경우, 커널함수의 x축방향 회전각 θx =π/30 및 커널함수의 y축방향 회전각 θy=0로 설정시 변형된 커널(K21)이 만들어지고, 유사하게 커널함수의 x축방향 회전각 θx=0 및 커널함수의 y축방향 회전각 θy =π/30로 설정시 변형된 커널(K22)이 만들어진다. 또한 임의의 가보필터의 커널(K1)에 적용하는 필터파라미터가 σ=5, θ=π/4인 경우, C=1.4 및 D=15로 설정시 변형된 커널(K3)이 만들어진다. 여기서 D는 커널 중심에서 떨어져 반복된 모양의 4개 영역(H) 사이의 거리를 나타낸다.In FIG. 7, when the filter parameters applied to the kernel K1 of an arbitrary Gabor filter are σ=5 and θ=π/4, the rotation angle θ x =π/30 in the x-axis direction of the kernel function and y of the kernel function When the axial rotation angle θ y = 0 is set, a modified kernel (K21) is created, and similarly, the rotation angle in the x-axis direction of the kernel function θ x = 0 and the rotation angle in the y-axis direction of the kernel function θ y =π/30 When set to, a modified kernel (K22) is created. In addition, when the filter parameters applied to the kernel K1 of an arbitrary Gabor filter are σ=5 and θ=π/4, a modified kernel K3 is created when C=1.4 and D=15 are set. Here, D denotes the distance between the four regions (H) of the repeated shape apart from the center of the kernel.

변형된 커널(K21)과 커널(K3)의 조합에 의해 새로운 커널(K41)이 생성되고, 변형된 커널(K22)과 커널(K3)의 조합에 의해 새로운 커널(K42)이 생성될 수 있다.A new kernel K41 may be generated by a combination of the modified kernel K21 and the kernel K3, and a new kernel K42 may be generated by a combination of the modified kernel K22 and the kernel K3.

도 8은 본 발명의 실시예에 따른 동일한 입력 이미지에 대해 제1 확장모드와 제2 확장모드를 적용시 얻어지는 복수개의 확장 이미지를 나타내는 도면이다. 8 is a diagram illustrating a plurality of extended images obtained when a first extended mode and a second extended mode are applied to the same input image according to an embodiment of the present invention.

입력 이미지(A0)에 대해 제1 확장모드에서 노말 가보필터의 필터파라미터로서 σ=2로 일정하게 설정한 후 θ=π/6, θ=π/3, θ=2π/3로 설정된 각각의 경우 변형된 3개의 확장 이미지(NA1, NA2, N3)가 생성된다.For the input image (A0), in the first extended mode, the filter parameter of the normal Gabor filter is set constant as σ=2, and then θ=π/6, θ=π/3, θ=2π/3, respectively. Three modified expanded images (NA1, NA2, and N3) are generated.

또한 입력 이미지(A0)에 대해 제2 확장모드에서 변형 가보필터의 필터파라미터로서 σ=2, θx =π/6, θy=0, C=0, D=0로 일정하게 설정한 후 θ=π/6, θ=π/3, θ=2π/3로 설정된 각각의 경우 변형된 3개의 확장 이미지(MA1, MA2, M3)가 생성된다. 제2 확장모드에서는 변형 가보필터의 필터파라미터의 개수가 많기 때문에 제1 확장모드보다 월등하게 많은 학습 데이터를 확장할 수 있다.In addition, in the second extended mode for the input image (A0), σ=2, θ x =π/6, θ y =0, C=0, D=0 as filter parameters of the modified Gabor filter are set constant and then θ In each case set to =π/6, θ=π/3, and θ=2π/3, three modified expanded images (MA1, MA2, M3) are generated. In the second extended mode, since the number of filter parameters of the modified Gabor filter is large, much more training data can be extended than in the first extended mode.

이하에서는 본 발명에 따른 노말 가보필터와 변형 가보필터를 이용하여 학습 데이터를 확장하는 과정을 검증하고, 이를 설명하기로 한다.Hereinafter, a process of expanding learning data using a normal Gabor filter and a modified Gabor filter according to the present invention will be verified, and this will be described.

[시험예 1][Test Example 1]

- 사용한 학습 데이터세트 : MNIST dataset-Training dataset used: MNIST dataset

- 학습 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 500장씩 선정-Number of training images: 500 each for numbers 0-9 in the MNIST dataset

- 테스트 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 in the MNIST dataset

- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5

- 이미지 분류 성공률 : 97% -Image classification success rate: 97%

입력input




평균 이미지 분류 성공률





Average image classification success rate
00 1One 22 33 44 55 66 77 88 99

출력


Print
00 482482 00 22 00 00 1One 55 1One 1One 00
1One 00 494494 33 00 00 00 22 1One 00 33 22 22 22 491491 00 1One 00 1One 55 00 00 33 22 22 00 498498 00 1010 00 1212 1010 1One 44 00 00 00 00 486486 00 22 22 1One 00 55 44 1One 00 00 00 488488 55 00 55 77 66 33 00 1One 00 00 00 485485 00 00 00 77 1One 1One 33 1One 00 00 00 476476 77 66 88 22 00 00 1One 1One 1One 00 1One 474474 00 99 44 00 00 00 1212 00 00 22 22 483483 합계Sum 500500 500500 500500 500500 500500 500500 500500 500500 500500 500500 이미지
분류
성공률(%)
image
Classification
Success rate (%)

96.4

96.4

98.8

98.8

98.2

98.2

99.6

99.6

97.2

97.2

97.6

97.6

97.0

97.0

95.2

95.2

94.8

94.8

96.6

96.6

97

97

[표 2]는 MNIST dataset에서 숫자 0 내지 9에 대해 학습 이미지 각 500장씩 총 5000장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 482장, '1'/'4'로 판정된 이미지는 각 0장, '7'로 판정된 이미지는 1장, '2'/'3'/'8'로 판정된 이미지는 각 2장, '6'으로 판정된 이미지는 3장, '5'/'9'로 판정된 이미지는 각 4장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 97% 이다.[Table 2] shows a total of 5000 pieces of 500 training images for each of the numbers 0 to 9 in the MNIST dataset, and training in the deep learning model LeNet-5, and a total of 5000 pieces of 500 test images for each of the numbers 0 to 9 are categorized. The images were classified as. For example, as a result of image classification for 500 test images with the number '0', 482 images judged as '0', images judged as '1'/'4' are judged as 0 and '7'. 1 image, 2 images determined as '2'/'3'/'8', 3 images determined as '6', 3 images determined as '5'/'9' It appeared in four chapters. As a result of classifying images from 0 to 9, the average image classification success rate is 97%.

[시험예 2][Test Example 2]

- 사용한 학습 데이터세트 : MNIST dataset-Training dataset used: MNIST dataset

- 학습 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 50장씩 선정-Number of training images: 50 each for numbers 0-9 in the MNIST dataset

- 테스트 이미지 개수 : MNIST dataset에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 in the MNIST dataset

- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5

- 이미지 분류 성공률 : 89% -Image classification success rate: 89%

입력input




평균 이미지 분류 성공률





Average image classification success rate
00 1One 22 33 44 55 66 77 88 99

출력


Print
00 478478 00 22 00 22 1One 1010 00 55 1One
1One 22 496496 2222 88 66 66 55 66 2828 1111 22 22 22 423423 22 22 66 00 88 1One 1One 33 00 00 1414 421421 1One 55 1One 33 1212 1One 44 00 00 1010 00 448448 33 1212 00 1010 1010 55 1010 00 33 2121 00 464464 99 1One 3232 77 66 44 00 66 22 66 55 462462 00 1010 00 77 33 22 2020 3232 33 77 00 477477 2525 3434 88 00 00 00 44 00 33 1One 00 355355 00 99 1One 00 00 1010 3232 00 00 55 2222 435435 합계Sum 500500 500500 500500 500500 500500 500500 500500 500500 500500 500500 이미지
분류
성공률(%)
image
Classification
Success rate (%)

95.6

95.6

99.2

99.2

84.6

84.6

84.2

84.2

89.6

89.6

92.8

92.8

92.4

92.4

95.4

95.4

71.0

71.0

87.0

87.0

89

89

[표 3]은 MNIST dataset에서 숫자 0 내지 9에 대해 학습 이미지 각 50장씩 총 500장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 478장, '3'/'4'/'8'로 판정된 이미지는 각 0장, '9'로 판정된 이미지는 1장, '1'/'2'로 판정된 이미지는 각 2장, '7'로 판정된 이미지는 3장, '6'으로 판정된 이미지는 4장, '5'로 판정된 이미지는 10장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 89% 이다.[Table 3] shows a total of 500 pieces of 50 training images for each of the numbers 0 to 9 in the MNIST dataset, and training in the deep learning model LeNet-5, and a total of 5000 pieces of 500 test images for each of the numbers 0 to 9 are categorized. The images were classified as. For example, as a result of image classification for 500 test images with the number '0', 478 images judged as '0', 0 images were judged as '3'/'4'/'8', and ' 1 image is determined as '9', 2 images are determined as '1'/'2', 3 images are determined as '7', 4 images are determined as '6', and '5' The number of images judged as' appeared as 10. As a result of classifying images from 0 to 9, the average image classification success rate is 89%.

[시험예 2]는 [시험예 1]과 대비하여 상대적으로 학습 이미지가 휠씬 적기 때문에 이미지 분류 성공률이 현저히 저하된 것을 알 수 있다.It can be seen that [Test Example 2] has a relatively small number of learning images compared to [Test Example 1], so that the success rate of image classification is significantly lowered.

[시험예 3][Test Example 3]

- 사용한 학습 데이터세트 : 노말 가보필터를 이용하여 확장된 학습 이미지-Used training dataset: expanded training image using normal heirloom filter

- 학습 이미지 개수 : 확장된 학습이미지 데이터세트에서 숫자 0~9에 대해 450장씩 선정-Number of training images: 450 each for numbers 0-9 from the expanded training image dataset

- 테스트 이미지 개수 : 확장된 학습 이미지 데이터세트에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 from the expanded training image dataset

- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5

- 이미지 분류 성공률 : 92% -Image classification success rate: 92%

입력input




평균 이미지 분류 성공률





Average image classification success rate
00 1One 22 33 44 55 66 77 88 99

출력


Print
00 481481 00 1One 00 00 44 33 1One 1One 1One
1One 00 486486 00 00 1One 00 1One 22 44 55 22 22 44 460460 1One 22 33 00 99 22 33 33 22 00 1515 435435 00 88 22 55 88 22 44 00 22 1010 00 474474 00 44 00 22 1111 55 33 22 22 3939 33 472472 1111 66 2626 1919 66 66 44 22 00 1One 44 478478 1One 88 00 77 00 1One 33 88 1One 22 00 460460 1111 1313 88 33 1One 66 1313 1One 77 1One 22 430430 22 99 33 00 1One 44 1717 00 00 1414 88 444444 합계Sum 500500 500500 500500 500500 500500 500500 500500 500500 500500 500500 이미지
분류
성공률(%)
image
Classification
Success rate (%)

96.2

96.2

97.2

97.2

92.0

92.0

87.0

87.0

94.8

94.8

94.4

94.4

95.6

95.6

92.0

92.0

86.0

86.0

88.8

88.8

92

92

[표 4]는 노말 가보필터를 이용하여 확장한 학습 데이터세트에서 숫자 0 내지 9에 대해 학습 이미지 각 450장씩 총 4500장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 481장, '1'/'4'/'7'로 판정된 이미지는 각 0장, '2'/'3'로 판정된 이미지는 각 2장, '5'/'8'/'9'로 판정된 이미지는 각 3장, '6'로 판정된 이미지는 6장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 92%를 나타내었다.[Table 4] shows a total of 4500 training images, each 450 training images for numbers 0 to 9, selected from the training dataset expanded using the normal heirloom filter, and trained on the deep learning model LeNet-5, and test images from the numbers 0 to 9 The images were classified with a total of 5000 sheets of 500 sheets each. For example, as a result of image classification for 500 test images with the number '0', 481 images were determined as '0', 0 images were determined as '1'/'4'/'7', and ' 2 images were determined as 2'/'3', 3 images were determined as '5'/'8'/'9', and 6 images were determined as '6'. As a result of classifying images from 0 to 9, the average image classification success rate was 92%.

[시험예 4][Test Example 4]

- 사용한 학습 데이터세트 : 변형 가보필터를 이용하여 확장된 학습 이미지-Used training dataset: expanded training image using transformed heirloom filter

- 학습 이미지 개수 : 확장된 학습이미지 데이터세트에서 숫자 0~9에 대해 450장씩 선정-Number of training images: 450 each for numbers 0-9 from the expanded training image dataset

- 테스트 이미지 개수 : 확장된 학습 이미지 데이터세트에서 숫자 0~9에 대해 500장씩 선정-Number of test images: 500 each for numbers 0-9 from the expanded training image dataset

- 딥러닝 모델 : LeNet-5-Deep Learning Model: LeNet-5

- 이미지 분류 성공률 : 94% -Image classification success rate: 94%

입력input




평균 이미지 분류 성공률





Average image classification success rate
00 1One 22 33 44 55 66 77 88 99

출력


Print
00 484484 00 22 00 1One 1One 88 1One 44 1One
1One 00 498498 22 1One 1One 00 33 66 88 66 22 33 22 460460 00 00 1One 00 88 1One 1One 33 1One 00 1818 464464 00 77 22 1One 66 22 44 1One 00 1One 00 453453 00 1One 1One 00 33 55 22 00 22 1818 00 482482 88 22 1111 88 66 44 00 44 00 99 55 477477 00 1010 00 77 00 00 88 1212 44 00 00 462462 1414 1616 88 22 00 22 33 00 33 1One 22 432432 1One 99 33 00 1One 22 3232 1One 00 1717 1414 462462 합계Sum 500500 500500 500500 500500 500500 500500 500500 500500 500500 500500 이미지
분류
성공률(%)
image
Classification
Success rate (%)

96.8

96.8

99.6

99.6

92.0

92.0

92.8

92.8

90.6

90.6

96.4

96.4

95.4

95.4

92.4

92.4

86.4

86.4

92.4

92.4

94

94

[표 5]는 변형 가보필터를 이용하여 확장한 학습 데이터세트에서 숫자 0 내지 9에 대해 학습 이미지 각 450장씩 총 4500장을 선정하여 딥러닝 모델 LeNet-5에서 학습하고 숫자 0 내지 9에서 테스트 이미지 각 500장씩 총 5000장을 분류 대상으로 하여 이미지를 분류하였다. 예를 들어 숫자 '0'의 테스트 이미지 500장에 대해 이미지 분류한 결과 '0'으로 판정된 이미지는 484장, '1'/'7'로 판정된 이미지는 각 0장, '3'/'4'로 판정된 이미지는 각 1장, '5'/'8'로 판정된 이미지는 각 2장, '2'/'9'로 판정된 이미지는 각 3장, '6'으로 판정된 이미지는 4장으로 나타났다. 이와 같이 숫자 0 내지 9까지 이미지 분류를 진행한 결과 평균 이미지 분류 성공률이 94% 이다. [시험예 4]는 변형 가보필터를 이용하여 학습 데이터를 확장한 경우로서 [시험예 3]과 대비하여 동일 조건에서 이미지 분류 성공률이 2% 높게 나타났다.[Table 5] shows a total of 4500 training images, each 450 training images for numbers 0 to 9, selected from the training dataset expanded using the transformed Gabor filter, and trained in the deep learning model LeNet-5, and test images from numbers 0 to 9 The images were classified with a total of 5000 sheets of 500 sheets each as the target of classification. For example, as a result of image classification for 500 test images with the number '0', 484 images determined as '0', 0 images determined as '1'/'7', and '3'/' One image for each of 4', two for each of '5'/'8', three for each of '2'/'9', and one for each of '6' Appeared in 4 chapters. As a result of classifying images from 0 to 9, the average image classification success rate is 94%. [Test Example 4] was a case in which the learning data was expanded using a modified Gabor filter, and the image classification success rate was 2% higher under the same conditions as in [Test Example 3].

머신 비젼에서 학습 데이터를 충분히 확보하기 어렵고, 현실적으로 제한된 학습 데이터를 이용하여 딥러닝을 수행할 수 밖에 없는 상황에서는 학습 데이터를 충분히 확보하는 것이 이미지 분류 성공률을 높이는 결정적인 요소가 된다. 앞서 설명한 바와 같이 이미지 분류 성공률은 [시험예 1]에서 97%이고 [시험예 2]에서 89%로 현저하게 떨어졌는데, 이는 [시험예 2]에서 딥러닝 학습에 쓰이는 학습 데이터가 부족한 것이 주요한 요인이다. In a situation where it is difficult to secure enough training data in machine vision, and in a situation where deep learning can only be performed using limited training data in reality, securing sufficient training data becomes a decisive factor in increasing the success rate of image classification. As described above, the image classification success rate was 97% in [Test Example 1] and significantly dropped to 89% in [Test Example 2], which is the main factor due to lack of training data used for deep learning learning in [Test Example 2]. to be.

노말 가보필터를 이용한 학습 데이터 확장 방법을 적용한 [시험예 3]와 변형 가보필터를 이용한 학습 데이터 확장 방법을 사용한 [시험예 4]는 [시험예 2]와 대비하여 상대적으로 높은 이미지 분류 성공률을 나타내었다.[Test Example 3] applying the learning data expansion method using a normal Gabor filter and [Test Example 4] using the learning data expansion method using a modified Gabor filter exhibited relatively high image classification success rates compared to [Test Example 2]. I got it.

본 발명은 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 학습 데이터를 쉽고 간편하게 확장하여 충분한 학습 데이터를 확보할 수 있고, 확보된 학습 데이터를 바탕으로 딥러닝 모델을 학습하여 딥러닝 모델의 신뢰성을 향상시킴으로써 이미지 분류 성공률을 개선할 수 있다.The present invention uses a filter characteristic change method that changes the filter parameter of the Gabor filter to easily and conveniently expand the training data to secure sufficient training data, and learns a deep learning model based on the acquired training data to learn a deep learning model. By improving the reliability, the success rate of image classification can be improved.

이 점에서 볼 때 머신 비젼에서 제한된 학습 데이터를 가지고 있는 상황에서는 충분한 학습 데이터를 확보하는 것이 무엇보다 중요하고, 이를 충족하기 위한 방안으로 본 발명이 유용하게 활용될 수 있다.From this point of view, securing sufficient learning data is of paramount importance in a situation in which machine vision has limited learning data, and the present invention can be usefully utilized as a method to satisfy this.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다.The above description of the present invention is for illustrative purposes only, and those of ordinary skill in the art to which the present invention pertains will be able to understand that other specific forms can be easily modified without changing the technical spirit or essential features of the present invention. will be.

100 : 사용자 인터페이스 101 : 프로세서
102 : 데이터 학습모듈 103 : 이미지 분류모듈
104 : 메모리 105 : 딥러닝 솔루션
110 : 학습 데이터세트 저장부 120 : 학습 데이터 확장부
130 : 학습부 140 : 가중치 저장부
150 : 이미지 공급부 160 : 딥러닝 실행부
170 : 이미지 출력부
100: user interface 101: processor
102: data learning module 103: image classification module
104: memory 105: deep learning solution
110: training data set storage unit 120: training data expansion unit
130: learning unit 140: weight storage unit
150: image supply unit 160: deep learning execution unit
170: image output unit

Claims (16)

학습 데이터세트를 사전에 준비하는 준비 단계;
상기 학습 데이터세트의 단일 이미지를 대상으로 가보필터의 필터파라미터를 바꾸는 필터특성 변경 기법을 이용하여 확장된 이미지를 생성하는 확장 단계; 및
상기 확장 단계에서 생성된 확장된 이미지를 바탕으로 딥러닝 모델을 학습시키는 학습 단계를 포함하는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
A preparation step of preparing a training dataset in advance;
An extension step of generating an extended image using a filter characteristic change technique for changing a filter parameter of a Gabor filter for a single image of the training dataset; And
And a learning step of training a deep learning model based on the expanded image generated in the expansion step.
제1항에 있어서,
상기 확장 단계에서 필터특성 변경 기법은 커널의 모양, 방향, 중심 주파수, 대역폭 중 적어도 어느 하나에 대응하는 필터파라미터를 변경하는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
The method of claim 1,
In the expansion step, the filter characteristic change method changes a filter parameter corresponding to at least one of a shape, a direction, a center frequency, and a bandwidth of a kernel.
제1항에 있어서,
상기 확장 단계에서 노말 가보필터를 이용하여 학습 데이터를 확장하는 제1 확장모드와 변형된 가보필터를 이용하여 학습 데이터를 확장하는 제2 확장모드 중 어느 하나의 확장모드에 따라 학습 데이터를 확장하는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
The method of claim 1,
In the expansion step, expanding the learning data according to any one of a first expansion mode for expanding training data using a normal Gabor filter and a second expansion mode for expanding training data using a modified Gabor filter. Learning data extension method for application to a deep learning model characterized by.
제3항에 있어서,
상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
[수학식 1]
Figure pat00030

[수학식 2]
Figure pat00031

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다.
The method of claim 3,
The normal Gabor filter applied to the first extended mode is defined by Equation 1 and Equation 2 below.
[Equation 1]
Figure pat00030

[Equation 2]
Figure pat00031

Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength controlling the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is the Gaussian function. It is a factor that determines the shape of the filter.
제3항에 있어서,
상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 하는 딥러닝 모델에 적용하기 위한 학습 데이터 확장방법.
[수학식 3]
Figure pat00032

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다.
The method of claim 3,
The modified Gabor filter applied to the second extended mode is defined by Equation 3 below.
[Equation 3]
Figure pat00032

Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
학습 데이터세트를 저장하는 학습 데이터세트 저장부, 가중치 정보를 저장하는 가중치 저장부를 구비한 메모리;
상기 학습 데이터세트의 단일 이미지를 입력받고 가보필터의 필터파라미터를 바꾸어 확장 이미지를 생성하고 생성된 확장 이미지를 바탕으로 딥러닝 모델을 학습한 결과로부터 도출된 가중치 정보를 상기 가중치 저장부에 저장하는 데이터 학습모듈, 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 입력 이미지에 대해 딥러닝 기반 진단 프로그램이 상기 가중치 정보에 저장된 가중치 정보를 이용하여 이미지 분류 프로세싱을 수행하는 이미지 분류모듈을 구비한 프로세서;를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
A memory having a training data set storage unit for storing a training data set and a weight storage unit for storing weight information;
Data for receiving a single image of the training dataset, generating an extended image by changing a filter parameter of a Gabor filter, and storing weight information derived from the result of training a deep learning model based on the generated extended image in the weight storage unit A processor having an image classification module for performing image classification processing by a deep learning-based diagnostic program on the input image acquired by the learning module and the image acquisition device and provided through the user interface using the weight information stored in the weight information; Image classification apparatus using deep learning, characterized in that it comprises a.
제6항에 있어서,
상기 데이터 학습모듈은 가보필터의 필터파라미터의 설계값을 설정하여 커널을 특정하고, 특정된 커널의 필터링 연산에 의해 확장 이미지를 생성하는 학습 데이터 확장부, 상기 확장 이미지가 포함된 학습 데이터세트를 가지고 딥러닝 모델을 학습시키는 학습부를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
The method of claim 6,
The data learning module has a learning data expansion unit configured to specify a kernel by setting a design value of a filter parameter of a Gabor filter, and to generate an expanded image by a filtering operation of the specified kernel, and a training dataset including the expanded image. An image classification apparatus using deep learning, comprising a learning unit that trains a deep learning model.
제6항에 있어서,
상기 학습 데이터 확장부는 노말 가보필터를 이용한 제1 확장모드에 따라 학습 데이터를 확장하기 위한 노말 커널 설정기 및 노말 커널 생성기, 변형 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하기 위한 변형 커널 설정기 및 변형 커널 생성기를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
The method of claim 6,
The learning data extension unit is a normal kernel setter and a normal kernel generator for extending learning data according to a first expansion mode using a normal Gabor filter, and a modified kernel for expanding learning data according to a second expansion mode using a modified Gabor filter. An image classification apparatus using deep learning, comprising: a setter and a modified kernel generator.
제8항에 있어서,
상기 노말 커널 설정기는 노말 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ 중 적어도 어느 하나를 설정하고,
상기 노말 커널 생성기는 상기 노말 커널 설정기에 의해 설정된 노말 가보필터의 필터파라미터 설계값에 따라 노말 커널을 생성하며,
생성된 노말 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
The method of claim 8,
The normal kernel configurator sets at least one of a kernel size, a directionality θ of a kernel function, and a standard deviation σ of a Gaussian function as a design value of a filter parameter of a normal Gabor filter,
The normal kernel generator generates a normal kernel according to a filter parameter design value of a normal Gabor filter set by the normal kernel configurator,
An image classification apparatus using deep learning, characterized in that for generating a plurality of extended images by filtering a single image received from the generated normal kernel.
제8항에 있어서,
상기 변형 커널 설정기는 변형 가보필터의 필터파라미터 설계값으로서 커널 사이즈, 커널함수의 방향성 θ, 가우시안 함수의 표준편차 σ, 커널함수의 x축방향 회전각 θx, 커널함수의 y축방향 회전각 θy, 커널 주파수의 진폭을 결정하는 scale factor Sa 및 Sb, 상수 C 및 D 중 적어도 어느 하나를 설정하고,
상기 변형 커널 생성기는 상기 변형 커널 설정기에 의해 설정된 변형 가보필터의 필터파라미터 설계값에 따라 변형 커널을 생성하며,
생성된 변형 커널에서 입력받은 단일 이미지를 필터링 연산하여 복수개 확장 이미지를 생성하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
The method of claim 8,
The modified kernel setting group filter parameters of the modified Gabor filter design value as a kernel size, kernel functions direction θ, a Gaussian function by a standard deviation σ, rotating the x axis of the kernel functions each θ x, the rotation angle θ y-axis direction of the kernel functions of the y , scale factors Sa and Sb for determining the amplitude of the kernel frequency, and at least one of constants C and D are set,
The modified kernel generator generates a modified kernel according to a filter parameter design value of a modified Gabor filter set by the modified kernel setter,
An image classification apparatus using deep learning, characterized in that filtering a single image received from the generated modified kernel to generate a plurality of extended images.
제6항에 있어서,
상기 이미지 분류모듈은 이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 제공받은 분류 대상의 이미지를 공급하는 이미지 공급부, 상기 이미지 공급부로부터 공급받은 이미지에 대하여 상기 가중치 저장부에 저장된 가중치가 반영된 딥러닝 모델에 기반한 진단 프로그램을 이용하여 이미지를 분류하는 딥러닝 실행부, 상기 딥러닝 실행부에 의해 분류된 이미지와 분류 정보를 출력하는 이미지 출력부를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
The method of claim 6,
The image classification module includes an image supply unit that supplies an image to be classified obtained by an image acquisition device and provided through a user interface, and a deep learning model in which a weight stored in the weight storage unit is reflected with respect to the image supplied from the image supply unit. An image classification apparatus using deep learning, comprising: a deep learning execution unit for classifying images using a diagnostic program based on the deep learning program, and an image output unit for outputting the images classified by the deep learning execution unit and classification information.
제11항에 있어서,
상기 딥러닝 실행부가 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 장치.
The method of claim 11,
An image classification apparatus using deep learning, characterized in that the deep learning execution unit uses any one of LeNet-5, Alex-Net, and Google-Net as a deep learning model.
사전에 준비된 학습 데이터세트를 준비하는 준비단계;
준비된 학습 데이터세트에 속하는 제한된 학습 데이터를 확장하기 위하여 노말 가보필터를 이용한 제1 확장모드 또는 변형된 가보필터를 이용한 제2 확장모드에 따라 학습 데이터를 확장하는 확장단계;
확장된 학습 데이터를 대상으로 딥러닝 모델에서 학습 프로세스를 수행하는 학습단계;
학습 프로세스의 학습 결과 도출된 가중치 정보를 저장하는 저장단계;
이미지 획득장치에 의해 획득되고 사용자 인터페이스를 통해 입력받은 분류 대상의 이미지에 대해 학습 과정에서 얻은 가중치 정보를 반영한 딥러닝 기반 진단프로그램을 이용하여 이미지를 분류하는 딥러닝 실행단계;
딥러닝 실행에 의해 분류된 이미지와 분류 정보를 출력하는 출력단계;를 포함하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
A preparation step of preparing a training dataset prepared in advance;
An expansion step of expanding the learning data according to a first expansion mode using a normal Gabor filter or a second expansion mode using a modified Gabor filter in order to expand limited training data belonging to the prepared training data set;
A learning step of performing a learning process in a deep learning model for the extended training data;
A storage step of storing weight information derived as a result of learning in the learning process;
A deep learning execution step of classifying an image using a deep learning-based diagnostic program that reflects weight information obtained in a learning process with respect to the image to be classified, which is acquired by the image acquisition device and input through a user interface;
An image classification method using deep learning comprising; an output step of outputting the image classified by the deep learning execution and the classification information.
제13항에 있어서,
상기 제1 확장모드에 적용하는 노말 가보필터는 다음의 수학식 1 및 수학식 2에 의해 정의되는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
[수학식 1]
Figure pat00033

[수학식 2]
Figure pat00034

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, λ는 가보필터 커널의 사인함수를 조절하는 파장, θ는 커널함수의 방향성, ψ는 위상차, σ는 가우시안 함수의 표준편차, γ는 가보필터의 모양을 결정하는 요소이다.
The method of claim 13,
An image classification method using deep learning, characterized in that the normal Gabor filter applied to the first extended mode is defined by Equations 1 and 2 below.
[Equation 1]
Figure pat00033

[Equation 2]
Figure pat00034

Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, λ is the wavelength that adjusts the sine function of the Gabor filter kernel, θ is the directionality of the kernel function, ψ is the phase difference, σ is the standard deviation of the Gaussian function, and γ is It is a factor that determines the shape of the filter.
제13항에 있어서,
상기 제2 확장모드에 적용하는 변형 가보필터는 다음의 수학식 3에 의해 정의되는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
[수학식 3]
Figure pat00035

여기서, x와 y는 이차원 이미지의 직각 좌표계에서 좌표값, θ는 커널함수의 방향성, θx는 커널함수의 x축방향 회전각,θy는 커널함수의 y축방향 회전각, σ는 가우시안 함수의 표준편차, Sa 및 Sb는 커널 주파수의 진폭을 결정하는 scale factor로서 Sa는 1~50의 상수, Sb는 6~300의 상수, C는 0~2의 상수, D는 중심에서 떨어진 거리를 나타내는 0~50의 상수이다.
The method of claim 13,
An image classification method using deep learning, characterized in that the modified Gabor filter applied to the second extended mode is defined by Equation 3 below.
[Equation 3]
Figure pat00035

Where x and y are the coordinate values in the rectangular coordinate system of the two-dimensional image, θ is the direction of the kernel function, θ x is the rotation angle in the x-axis direction of the kernel function, θ y is the rotation angle in the y-axis direction of the kernel function, and σ is the Gaussian function. The standard deviation of, Sa and Sb are scale factors that determine the amplitude of the kernel frequency, where Sa is a constant from 1 to 50, Sb is a constant from 6 to 300, C is a constant from 0 to 2, and D is the distance away from the center. It is a constant from 0 to 50.
제13항에 있어서,
상기 학습 단계에서 딥러닝 모델로서 LeNet-5, Alex-Net, Google-Net 중 어느 하나를 사용하는 것을 특징으로 하는 딥러닝을 이용한 이미지 분류 방법.
The method of claim 13,
Image classification method using deep learning, characterized in that any one of LeNet-5, Alex-Net, and Google-Net is used as a deep learning model in the learning step.
KR1020190134464A 2019-10-28 2019-10-28 Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning KR102282087B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190134464A KR102282087B1 (en) 2019-10-28 2019-10-28 Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190134464A KR102282087B1 (en) 2019-10-28 2019-10-28 Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning

Publications (2)

Publication Number Publication Date
KR20210050168A true KR20210050168A (en) 2021-05-07
KR102282087B1 KR102282087B1 (en) 2021-07-27

Family

ID=75916949

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190134464A KR102282087B1 (en) 2019-10-28 2019-10-28 Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning

Country Status (1)

Country Link
KR (1) KR102282087B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102358235B1 (en) 2021-07-12 2022-02-08 주식회사 몰팩바이오 Apparatus of generating pathology data included segmentation module based on gan
KR20230071967A (en) 2021-11-17 2023-05-24 부산대학교 산학협력단 Data Augmentation System and Method for Object Classification of Small Training Data based on Deep Learning
WO2023128421A1 (en) * 2021-12-29 2023-07-06 삼성전자 주식회사 Image processing method and apparatus using convolutional neural network
KR102647337B1 (en) * 2023-07-24 2024-03-13 주식회사 아임토리 Apparatus and Method for Data augmentation and Data Analysis
KR20240077302A (en) 2022-11-24 2024-05-31 부산대학교 산학협력단 Apparatus and Method for Detecting Defect Using Deep Learning-based Surface Inspection

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011150626A (en) * 2010-01-25 2011-08-04 Ihi Corp Method, device, and program for classifying image
JP2016062524A (en) * 2014-09-22 2016-04-25 日本電気株式会社 Data processing system, data processing method and data processing program
KR101828011B1 (en) 2016-08-11 2018-02-21 서울대학교산학협력단 Method and apparatus for classifying state of object included in image
KR101843066B1 (en) 2017-08-23 2018-05-15 주식회사 뷰노 Method for classifying data via data augmentation of the data for machine-learning and apparatus using the same
KR20180130925A (en) 2017-05-30 2018-12-10 국방과학연구소 Artificial intelligent device generating a learning image for machine running and control method thereof
KR20190021095A (en) 2017-08-22 2019-03-05 주식회사 넥시스 Apparatus and method for classifying images, and apparatus for training images for classification of images

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011150626A (en) * 2010-01-25 2011-08-04 Ihi Corp Method, device, and program for classifying image
JP2016062524A (en) * 2014-09-22 2016-04-25 日本電気株式会社 Data processing system, data processing method and data processing program
KR101828011B1 (en) 2016-08-11 2018-02-21 서울대학교산학협력단 Method and apparatus for classifying state of object included in image
KR20180130925A (en) 2017-05-30 2018-12-10 국방과학연구소 Artificial intelligent device generating a learning image for machine running and control method thereof
KR20190021095A (en) 2017-08-22 2019-03-05 주식회사 넥시스 Apparatus and method for classifying images, and apparatus for training images for classification of images
KR101843066B1 (en) 2017-08-23 2018-05-15 주식회사 뷰노 Method for classifying data via data augmentation of the data for machine-learning and apparatus using the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
없음

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102358235B1 (en) 2021-07-12 2022-02-08 주식회사 몰팩바이오 Apparatus of generating pathology data included segmentation module based on gan
KR20230071967A (en) 2021-11-17 2023-05-24 부산대학교 산학협력단 Data Augmentation System and Method for Object Classification of Small Training Data based on Deep Learning
WO2023128421A1 (en) * 2021-12-29 2023-07-06 삼성전자 주식회사 Image processing method and apparatus using convolutional neural network
KR20240077302A (en) 2022-11-24 2024-05-31 부산대학교 산학협력단 Apparatus and Method for Detecting Defect Using Deep Learning-based Surface Inspection
KR102647337B1 (en) * 2023-07-24 2024-03-13 주식회사 아임토리 Apparatus and Method for Data augmentation and Data Analysis

Also Published As

Publication number Publication date
KR102282087B1 (en) 2021-07-27

Similar Documents

Publication Publication Date Title
KR102282087B1 (en) Method For Applying Learning Data Augmentaion To Deep Learning Model, Apparatus And Method For Classifying Images Using Deep Learning
JP7074460B2 (en) Image inspection equipment and methods
US20140079314A1 (en) Method and Apparatus for Improved Training of Object Detecting System
WO2020055490A1 (en) Generating synthetic digital assets for a virtual scene including a model of a real-world object
JP2019091249A (en) Defect inspection device, defect inspecting method, and program thereof
CN111199531A (en) Interactive data expansion method based on Poisson image fusion and image stylization
KR20210039927A (en) System and method of classifying manufactured products
JP2015087903A (en) Apparatus and method for information processing
CN111401472B (en) Infrared target classification method and device based on deep convolutional neural network
Orts-Escolano et al. 3d surface reconstruction of noisy point clouds using growing neural gas: 3d object/scene reconstruction
US12013918B2 (en) Method and apparatus for clustering images
Nousias et al. Fast mesh denoising with data driven normal filtering using deep variational autoencoders
US11501037B2 (en) Microstructures using generative adversarial networks
KR101905000B1 (en) Method, apparatus and computer program stored in computer readable medium for correction of image data
US20230410465A1 (en) Real time salient object detection in images and videos
Bründl et al. Semantic part segmentation of spatial features via geometric deep learning for automated control cabinet assembly
US20200202225A1 (en) Image inspection apparatus, image inspection learning method, and non-transitory computer-readable storage medium for storing image inspection program
Ugolotti et al. GPU-based point cloud recognition using evolutionary algorithms
Kumaresan et al. Deep learning based Simple CNN weld defects classification using optimization technique
JP7070308B2 (en) Estimator generator, inspection device, estimator generator method, and estimator generator
Bolotov et al. Surface recognition of machine parts based on the results of optical scanning
US20220012551A1 (en) Machine learning apparatus, machine learning method, and computer-readable recording medium
Geng et al. Simplification method for 3D Terracotta Warrior fragments based on local structure and deep neural networks
US20240161263A1 (en) Method for inspecting defects of product by using 2d image information
US12035041B2 (en) System and edge device

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant