KR20220019432A - Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program - Google Patents

Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program Download PDF

Info

Publication number
KR20220019432A
KR20220019432A KR1020200099837A KR20200099837A KR20220019432A KR 20220019432 A KR20220019432 A KR 20220019432A KR 1020200099837 A KR1020200099837 A KR 1020200099837A KR 20200099837 A KR20200099837 A KR 20200099837A KR 20220019432 A KR20220019432 A KR 20220019432A
Authority
KR
South Korea
Prior art keywords
image
data
region
bounding box
probability distribution
Prior art date
Application number
KR1020200099837A
Other languages
Korean (ko)
Other versions
KR102490044B1 (en
Inventor
허지성
박지훈
Original Assignee
국방과학연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국방과학연구소 filed Critical 국방과학연구소
Priority to KR1020200099837A priority Critical patent/KR102490044B1/en
Publication of KR20220019432A publication Critical patent/KR20220019432A/en
Application granted granted Critical
Publication of KR102490044B1 publication Critical patent/KR102490044B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

According to an embodiment of the present invention, an image data augmentation method for object recognition learning comprises: a step of selecting an image; a step of selecting an object region in the image; a step of generating augmented data in any area that obscures at least a portion of the object area; and a step of adjusting a bounding box based on probability distribution. The embodiment has an effect of obtaining a dataset capable of learning an object recognizer capable of recognizing a partially occluded object through data augmentation with high accuracy.

Description

물체인식 학습용 이미지 데이터 증강 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램{METHOD OF IMAGE DATA AUGMENTATION FOR LEARNING OF OBJECTS DETECTING, COMPUTER-READABLE STORAGE MEDIUM AND COMPUTER PROGRAM}Image data augmentation method for object recognition learning, computer readable recording medium and computer program

실시예는 물체를 높은 정확도로 인식하기 위한 데이터를 획득하기 위한 물체인식 학습용 이미지 데이터 증강 방법에 관한 것이다.The embodiment relates to an image data augmentation method for object recognition learning for acquiring data for recognizing an object with high accuracy.

일반적으로, 딥 콘볼루션 뉴럴네트워크를 이용한 물체 인식 알고리즘의 속도와 정확도가 매우 높아지고 있다.In general, the speed and accuracy of object recognition algorithms using deep convolutional neural networks are increasing.

딥 콘볼루션 뉴럴네트워크를 활용한 물체 인식 알고리즘을 실제 적용할 때, 학습데이터에 포함되지 않은 데이터가 입력으로 들어올 경우의 정확도가 낮아질 수밖에 없으며, 그에 따라 학습 데이터를 최대한 많이 확보하는 것이 중요하다.When an object recognition algorithm using a deep convolutional neural network is actually applied, when data that is not included in the training data is input, the accuracy is inevitably lowered, and accordingly, it is important to secure as much training data as possible.

그러나, 학습데이터를 무한히 확보하는 것이 불가능하므로 주어진 학습데이터가 있을 때 데이터 증강 (Data augmentation) 방법을 통해 데이터의 양을 늘리는 방법이 보편적이다.However, since it is impossible to secure training data indefinitely, a method of increasing the amount of data through data augmentation when there is given training data is common.

일반적으로 이미지 분류 (Image classification)을 적용하기 위해 다양한 방법이 제안되었으나, 물체 인식 (Object detection) 데이터의 증강방법에 대해서는 구체적인 방안이 제시되어 있지 않고 있다.In general, various methods have been proposed to apply image classification, but a specific method has not been proposed for a method for augmenting object detection data.

물체 인식 데이터의 실 적용 시 가장 큰 문제점 중에 하나는, 물체의 일부가 다른 사물에 가려져 있는 경우에 대한 대응이 어렵다. 대부분의 데이터셋이 목표 물체가 모두 보이는 상황에서 수집이 되고, 레이블 되었다면 이를 실제 적용할 때 다른 물체에 가려진 물체는 인식 정확도가 매우 떨어진다.One of the biggest problems in the practical application of object recognition data is that it is difficult to respond to a case where a part of an object is obscured by another object. If most of the datasets are collected in a situation where all the target objects are visible and labeled, the recognition accuracy of objects obscured by other objects is very poor when applied in practice.

상술한 문제점을 해결하기 위해, 실시예는 물체 인식기의 물체 인식 정확도를 향상시키기 위한 물체인식 학습용 이미지 데이터 증강 방법을 제공하는 것을 그 목적으로 한다.In order to solve the above-mentioned problem, the embodiment aims to provide an image data augmentation method for object recognition learning for improving object recognition accuracy of an object recognizer.

실시예에 따른 물체인식 학습용 이미지 데이터 증강 방법은 이미지를 선택하는 단계와, 상기 이미지에서 물체 영역을 선택하는 단계와, 상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계와, 확률 분포를 기반으로 바운딩 박스를 조정하는 단계를 포함할 수 있다.An image data augmentation method for object recognition learning according to an embodiment comprises the steps of selecting an image, selecting an object area from the image, and generating augmented data in an arbitrary area covering at least a part of the object area; adjusting the bounding box based on the probability distribution.

상기 임의의 영역에 증강 데이터를 생성하는 단계는, 상기 임의의 영역에 검정 색상의 이미지를 채워 상기 증강 데이터를 생성할 수 있다.In the generating of the augmented data in the arbitrary region, the augmented data may be generated by filling the arbitrary region with an image of a black color.

상기 임의의 영역에 증강 데이터를 생성하는 단계는, 상기 임의의 영역에 상기 이미지의 배경 영역에 대응되는 이미지를 채워 상기 증강 데이터를 생성할 수 있다.The generating of the augmented data in the arbitrary region may include generating the augmented data by filling the arbitrary region with an image corresponding to a background region of the image.

상기 임의의 영역에 증강 데이터를 생성하는 단계는, 상기 임의의 영역에 랜덤 노이즈 값을 채워 상기 증강 데이터를 생성할 수 있다.The generating of the augmented data in the arbitrary region may include generating the augmented data by filling a random noise value in the arbitrary region.

상기 임의의 영역에 증강 데이터를 생성하는 단계는, 상기 임의의 영역에 상기 이미지의 색상 분포를 고려한 노이즈 값을 채워 상기 증강 데이터를 생성할 수 있다.In the generating of the augmented data in the arbitrary region, the augmented data may be generated by filling the arbitrary region with a noise value in consideration of a color distribution of the image.

상기 확률 분포를 기반으로 바운딩 박스를 조정하는 단계에서, 좌측,우측,상측 및 하측의 바운딩 박스를 조정할 때 상기 바운딩 박스 내에 포함되는 영역의 누적 확률 값은 특정 임계치 이상일 수 있다.In the step of adjusting the bounding box based on the probability distribution, when the left, right, upper, and lower bounding boxes are adjusted, the cumulative probability value of an area included in the bounding box may be greater than or equal to a specific threshold.

상기 바운딩 박스를 조정하는 확률 분포를 이변량 정규분포 기반으로 수행될 수 있다. A probability distribution for adjusting the bounding box may be performed based on a bivariate normal distribution.

상기 바운딩 박스를 조정하는 확률 분포를 실제 데이터 셋의 물체 확률 분포를 기반으로 수행될 수 있다.The probability distribution for adjusting the bounding box may be performed based on the object probability distribution of the actual data set.

실시예는 데이터 증강을 통해 부분적으로 가려진 물체를 인식 할 때에도 강건하게 높은 정확도로 인식할 수 있는 물체 인식기를 학습할 수 있는 데이터셋을 획득할 수 있는 효과가 있다.The embodiment has the effect of obtaining a dataset capable of learning an object recognizer that can be robustly recognized with high accuracy even when recognizing a partially occluded object through data augmentation.

도 1은 실시예에 따른 물체인식 학습용 이미지 데이터 증강 방법을 나타낸 순서도이다.
도 2 내지 도 11은 실시예에 따른 물체인식 학습용 이미지 데이터 증강 방법을 설명하기 위한 도면이다.
1 is a flowchart illustrating an image data augmentation method for object recognition learning according to an embodiment.
2 to 11 are diagrams for explaining an image data augmentation method for object recognition learning according to an embodiment.

이하, 도면을 참조하여 실시예를 상세히 설명하기로 한다.Hereinafter, the embodiment will be described in detail with reference to the drawings.

도 1은 실시예에 따른 물체인식 학습용 이미지 데이터 증강 방법을 나타낸 순서도이고, 도 2 내지 도 11은 실시예에 따른 물체인식 학습용 이미지 데이터 증강 방법을 설명하기 위한 도면이다.1 is a flowchart illustrating an image data augmentation method for object recognition learning according to an embodiment, and FIGS. 2 to 11 are diagrams for explaining an image data augmentation method for object recognition learning according to an embodiment.

도 1을 참조하면, 실시예에 따른 이미지 데이터 증강 방법은 이미지를 선택하는 단계(S100)와, 상기 이미지에서 물체 영역을 선택하는 단계(S200)와, 상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계(S300)와, 확률 분포를 기반으로 바운딩 박스를 조정하는 단계(S400)를 포함할 수 있다. 1 , the image data augmentation method according to the embodiment includes the steps of selecting an image ( S100 ), selecting an object area from the image ( S200 ), and an arbitrary area covering at least a part of the object area. It may include the step of generating the augmented data (S300) and adjusting the bounding box based on the probability distribution (S400).

이미지를 선택하는 단계(S100)는 먼저, 복수의 이미지를 수집할 수 있다. 도 2에 도시된 바와 같이, 수집된 복수의 이미지 중 증강에 활용할 이미지(100)를 선택할 수 있다.In the step of selecting an image ( S100 ), first, a plurality of images may be collected. As shown in FIG. 2 , an image 100 to be used for augmentation may be selected from among a plurality of collected images.

이미지를 선택하는 단계(S100)를 마치면, 이미지에서 물체 영역을 선택하는 단계(S200)를 수행할 수 있다. 이미지(10)에는 하나 또는 복수의 물체 영역을 포함할 수 있다. 따라서, 상기 단계(S100)에서는 인식할 대상 물체를 포함하는 물체 영역을 선택할 수 있다.When the step of selecting the image ( S100 ) is finished, the step of selecting the object region from the image ( S200 ) may be performed. The image 10 may include one or more object regions. Accordingly, in step S100 , an object area including a target object to be recognized may be selected.

이미지에서 물체 영역을 선택하는 단계(S200)를 마치면, 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계(S300)를 수행할 수 있다.After selecting the object region from the image ( S200 ), generating augmented data in an arbitrary region that covers at least a part of the object region ( S300 ) may be performed.

물체 영역은 인식되어야 할 특정 물체 영역과 특정 물체 영역을 일부 또는 전체를 가리는 다른 물체 영역을 포함할 수 있다. 다른 물체 영역이 특정 물체 영역을 가릴 경우, 잘못된 데이터를 포함하게 되어 인식 정확도가 떨어질 수 있다.The object region may include a specific object region to be recognized and other object regions that partially or entirely cover the specific object region. When other object areas cover a specific object area, incorrect data may be included and recognition accuracy may be reduced.

따라서, 특정 물체 영역을 가리는 다른 물체 영역(이하 '임의의 영역'이라 칭함)에 대해 데이터 처리가 필요하다.Accordingly, data processing is required for another object area (hereinafter referred to as an 'arbitrary area') that covers a specific object area.

도 3에 도시된 바와 같이, 먼저, 임의의 영역(20)을 선택할 수 있다. 임의의 영역(20)에는 도 4 내지 도 7과 같이, 증강 데이터를 생성할 수 있다.As shown in FIG. 3 , first, an arbitrary region 20 may be selected. Augmented data may be generated in an arbitrary region 20 as shown in FIGS. 4 to 7 .

도 4에 도시된 바와 같이, 일 실시예로 임의의 영역(20)에 이미지 상 검정 색상의 이미지(22)를 채워 증강 데이터를 생성할 수 있다. 여기서, 검정 색상은 '0' 값일 수 있다.As shown in FIG. 4 , according to an embodiment, augmented data may be generated by filling an arbitrary region 20 with an image 22 of a black color on the image. Here, the black color may be a value of '0'.

도 5에 도시된 바와 같이, 다른 실시예로 임의의 영역(20)에 이미지의 배경 영역에 대응되는 이미지(24)를 채워 증강 데이터를 생성할 수 있다.5 , as another embodiment, augmented data may be generated by filling an arbitrary area 20 with an image 24 corresponding to a background area of the image.

도 6에 도시된 바와 같이, 또 다른 실시예로 임의의 영역(20)에 노이즈 값(26)을 채워 증강 데이터를 생성할 수 있다. 노이즈는 랜덤한 값일 수 있다.As shown in FIG. 6 , in another embodiment, the augmented data may be generated by filling the random region 20 with a noise value 26 . The noise may be a random value.

도 7에 도시된 바와 같이, 또 다른 실시예로 임의의 영역(20)에 노이즈 값(28)을 채워 증강 데이터를 생성할 수 있다. 노이즈는 이미지의 색상 분포를 고려한 값일 수 있다.As shown in FIG. 7 , in another embodiment, the augmented data may be generated by filling the random region 20 with a noise value 28 . The noise may be a value in consideration of color distribution of an image.

임의의 영역에 증강 데이터를 생성하는 단계(S300)를 마치면, 확률 분포를 기반으로 바운딩 박스를 조정하는 단계(S400)를 수행할 수 있다.After the step of generating the augmented data in an arbitrary area (S300) is finished, the step of adjusting the bounding box based on the probability distribution (S400) may be performed.

상기와 같이, 임의의 영역은 실제 물체로 레이블링할 경우, 물체 인식기가 잘못된 데이터를 포함하여 학습할 가능성이 있으므로, 실제 영역에 맞는 바운딩 박스로 조정이 필요하다. 이에 바운딩 박스에 해당하는 영역을 해당 공간에 물체가 존재할 확률에 대한 확률 분포로 나타낼 수 있는데, 만약 표준 이변량 정규 분포를 가정한다면 수학식 1과 같이 표현할 수 있다.As described above, when an arbitrary area is labeled with a real object, there is a possibility that the object recognizer may learn including incorrect data, so it is necessary to adjust the bounding box suitable for the real area. Accordingly, the region corresponding to the bounding box can be expressed as a probability distribution for the probability that an object exists in the corresponding space. If a standard bivariate normal distribution is assumed, it can be expressed as Equation (1).

[수학식 1][Equation 1]

Figure pat00001
Figure pat00001

이 때, 이미지의 영역을 특정 확률 분포에 맞는 영역에 대응할 수 있다. 예를 들어, 이변량 정규 분포에서의 x, y 의 -3 ~ +3 까지의 영역에 대해 정사각형 영역의 확률분포를 가정할 수 있다. 이 때 가려진 영역

Figure pat00002
를 같은 크기의 박스에서의 가려짐이 적용된 영역으로 정의하고, 이 영역을 0으로 치환한 새로운
Figure pat00003
을 수학식 2와 같이 정의할 수 있다.In this case, the region of the image may correspond to a region that fits a specific probability distribution. For example, the probability distribution of a square region can be assumed for the region from -3 to +3 of x and y in the bivariate normal distribution. this time the hidden area
Figure pat00002
is defined as an area to which occlusion is applied in a box of the same size, and a new
Figure pat00003
can be defined as in Equation 2.

[수학식 2][Equation 2]

Figure pat00004
Figure pat00004

이 때, 가려진 영역에 해당하는 변수를 조정한다. 가려진 영역이 물체의 상측을 포함한다면 ymin, 하측을 포함한다면 ymax, 좌측을 포함한다면 xmin, 우측을 포함한다면 xmax를 조정한다. 조정하는 방법은 각 축을 줄인 나머지 영역에 대하여 확률 분포 상의 누적 확률 값이 특정 임계치 (Threshold) 이상이 되게 하는 것으로, 조정식은 수학식 3과 같다.At this time, the variable corresponding to the hidden area is adjusted. Adjust ymin if the occluded area includes the top side of the object, ymax if it includes the bottom side, xmin if it includes the left side, and xmax if it includes the right side. The adjustment method is such that the cumulative probability value on the probability distribution is greater than or equal to a specific threshold for the remaining regions in which each axis is reduced, and the adjustment equation is as shown in Equation (3).

[수학식 3][Equation 3]

Figure pat00005
Figure pat00005

필요시, 도 10에 도시된 바와 같이, 임의의 영역을 가린 후 원본 이미지 크기로 리사이즈를 진행하여 확률 분포 기반 바운딩 박스 조정을 수행할 수 있다.If necessary, as shown in FIG. 10 , a probability distribution-based bounding box adjustment may be performed by masking an arbitrary area and then resizing to the original image size.

다시 말해, 도 8에 도시된 바와 같이, 예컨대, 1:1 비율로 리사이즈 하고, 도 9에 도시된 바와 같이, 확률 분포 기반 바운딩 박스를 조정하고, 도 10에 도시된 바와 같이, 조정된 바운딩 박스를 도 11에 도시된 바와 같이, 원본 그림 크기로 리사이즈를 진행할 수 있다.In other words, as shown in FIG. 8, for example, resizing in a 1:1 ratio, as shown in FIG. 9, adjusting the probability distribution-based bounding box, and as shown in FIG. 10, the adjusted bounding box 11 , resizing may be performed to the original picture size.

분포 중 표준 이변량 정규 분포는 실제 데이터셋의 분포에 따라 다른 분포로 대체될 수 있다. 예를 들어, 자동차 입장에서의 보행자를 검출하기 위한 데이터셋이라면 사람의 일반적인 보행 시 형상에 따른 확률 분포를 사용할 수 있다.Among the distributions, the standard bivariate normal distribution can be replaced with another distribution depending on the distribution of the actual data set. For example, if it is a data set for detecting a pedestrian in a car position, a probability distribution according to the shape of a person's general walking can be used.

확률 분포를 기반으로 바운딩 박스를 조정하는 단계(S400)에 의해 생성된 새로운 데이터는 물체 인식기의 학습 데이터로 활용될 수 있다.New data generated by adjusting the bounding box based on the probability distribution ( S400 ) may be utilized as learning data of the object recognizer.

상기와 같이, 증강된 데이터를 학습 데이터로 활용함으로써, 물체 인식의 정확도를 향상시킬 수 있는 효과가 있다.As described above, by using the augmented data as learning data, there is an effect of improving the accuracy of object recognition.

실시예에 따른 물체인식 학습용 이미지 데이터 증강 방법은 물체인식 학습용 이미지 데이터 증강 장치에 의해 수행될 수 있으며, 물체인식 학습용 이미지 데이터 증강 장치는 이미지 선택부, 물체영역 선택부, 증강데이터 생성부, 바운딩 박스 조정부를 포함할 수 있다.The image data augmentation method for object recognition learning according to an embodiment may be performed by an image data augmentation apparatus for object recognition learning, and the image data augmentation apparatus for object recognition learning includes an image selection unit, an object region selection unit, an augmented data generation unit, and a bounding box. It may include a coordinator.

이미지 선택부 이미지를 선택할 수 있다. 물체영역 선택부는 이미지에서 물체 영역을 선택할 수 있다. 증강데이터 생성부는 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성할 수 있다. 증강 데이터는 도 4 내지 도 7과 같은 방법으로 수행될 수 있다. 바운딩 박스 조정부는 확률 분포를 기반으로 바운딩 박스를 조정할 수 있다.Image selector You can select an image. The object region selector may select an object region from the image. The augmented data generating unit may generate augmented data in an arbitrary area that covers at least a part of the object area. Augmented data may be performed in the same manner as in FIGS. 4 to 7 . The bounding box adjuster may adjust the bounding box based on the probability distribution.

본 문서의 다양한 실시예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media)(예: 메모리(내장 메모리 또는 외장 메모리))에 저장된 명령어를 포함하는 소프트웨어(예: 프로그램)로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시예들에 따른 전자 장치를 포함할 수 있다. 상기 명령이 제어부에 의해 실행될 경우, 제어부가 직접, 또는 상기 제어부의 제어하에 다른 구성요소들을 이용하여 상기 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, 비일시적은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.Various embodiments of the present document provide software (eg, a machine-readable storage media) (eg, a memory (internal memory or external memory)) including instructions stored in a machine-readable storage medium (eg, a computer). : program) can be implemented. The device is a device capable of calling a stored command from a storage medium and operating according to the called command, and may include the electronic device according to the disclosed embodiments. When the command is executed by the control unit, the control unit may perform a function corresponding to the command directly or by using other components under the control of the control unit. Instructions may include code generated or executed by a compiler or interpreter. The device-readable storage medium may be provided in the form of a non-transitory storage medium. Here, non-transitory means that the storage medium does not include a signal and is tangible, and does not distinguish that data is semi-permanently or temporarily stored in the storage medium.

실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다.According to an embodiment, the method according to various embodiments disclosed in the present document may be included and provided in a computer program product.

일 실시예에 따르면, 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서, 이미지를 선택하는 단계와, 상기 이미지에서 물체 영역을 선택하는 단계와, 상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계와, 확률 분포를 기반으로 바운딩 박스를 조정하는 단계를 수행하기 위한 동작을 포함하는 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함할 수 있다.According to one embodiment, there is provided a computer-readable recording medium storing a computer program, comprising the steps of: selecting an image; selecting an object area from the image; and instructions for causing the processor to perform a method comprising generating data and performing operations for performing the steps of adjusting a bounding box based on the probability distribution.

일 실시예에 따르면, 컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서, 이미지를 선택하는 단계와, 상기 이미지에서 물체 영역을 선택하는 단계와, 상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계와, 확률 분포를 기반으로 바운딩 박스를 조정하는 단계를 수행하기 위한 동작을 포함하는 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함할 수 있다.According to an embodiment, there is provided a computer program stored in a computer-readable recording medium, comprising the steps of: selecting an image; selecting an object area from the image; and instructions for causing the processor to perform a method comprising generating data and performing operations for performing the steps of adjusting a bounding box based on the probability distribution.

상기에서는 도면 및 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 실시예의 기술적 사상으로부터 벗어나지 않는 범위 내에서 실시예는 다양하게 수정 및 변경시킬 수 있음은 이해할 수 있을 것이다.Although the above has been described with reference to the drawings and embodiments, it will be understood by those skilled in the art that various modifications and changes can be made to the embodiments without departing from the spirit of the embodiments described in the claims below. will be able

10: 이미지
20: 임의의 영역
10: image
20: random area

Claims (10)

이미지를 선택하는 단계;
상기 이미지에서 물체 영역을 선택하는 단계;
상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계; 및
확률 분포를 기반으로 바운딩 박스를 조정하는 단계;
를 포함하는 물체인식 학습용 이미지 데이터 증강 방법.
selecting an image;
selecting an object region in the image;
generating augmented data in an arbitrary area that obscures at least a portion of the object area; and
adjusting the bounding box based on the probability distribution;
Image data augmentation method for object recognition learning, including.
제1항에 있어서,
상기 임의의 영역에 증강 데이터를 생성하는 단계는,
상기 임의의 영역에 검정 색상의 이미지를 채워 상기 증강 데이터를 생성하는 물체인식 학습용 이미지 데이터 증강 방법.
According to claim 1,
The step of generating augmented data in the arbitrary area comprises:
An image data augmentation method for object recognition learning to generate the augmented data by filling the arbitrary region with an image of a black color.
제1항에 있어서,
상기 임의의 영역에 증강 데이터를 생성하는 단계는,
상기 임의의 영역에 상기 이미지의 배경 영역에 대응되는 이미지를 채워 상기 증강 데이터를 생성하는 물체인식 학습용 이미지 데이터 증강 방법.
According to claim 1,
The step of generating augmented data in the arbitrary area comprises:
An image data augmentation method for object recognition learning to generate the augmented data by filling the arbitrary region with an image corresponding to a background region of the image.
제1항에 있어서,
상기 임의의 영역에 증강 데이터를 생성하는 단계는,
상기 임의의 영역에 랜덤 노이즈 값을 채워 상기 증강 데이터를 생성하는 물체인식 학습용 이미지 데이터 증강 방법.
According to claim 1,
The step of generating augmented data in the arbitrary area comprises:
An image data augmentation method for object recognition learning to generate the augmented data by filling the random region with a random noise value.
제1항에 있어서,
상기 임의의 영역에 증강 데이터를 생성하는 단계는,
상기 임의의 영역에 상기 이미지의 색상 분포를 고려한 노이즈 값을 채워 상기 증강 데이터를 생성하는 물체인식 학습용 이미지 데이터 증강 방법.
According to claim 1,
The step of generating augmented data in the arbitrary area comprises:
An image data augmentation method for object recognition learning to generate the augmented data by filling the arbitrary region with a noise value in consideration of the color distribution of the image.
제1항에 있어서,
상기 확률 분포를 기반으로 바운딩 박스를 조정하는 단계에서,
좌측, 우측, 상측 및 하측의 바운딩 박스를 조정할 때 상기 바운딩 박스 내에 포함되는 영역의 누적 확률 값은 임계치 이상인 물체인식 학습용 이미지 데이터 증강 방법.
According to claim 1,
In the step of adjusting the bounding box based on the probability distribution,
When adjusting the left, right, upper and lower bounding boxes, the cumulative probability value of the region included in the bounding box is greater than or equal to a threshold value.
제6항에 있어서,
상기 바운딩 박스를 조정하는 확률 분포를 이변량 정규분포 기반으로 수행되는 물체인식 학습용 이미지 데이터 증강 방법.
7. The method of claim 6,
An image data augmentation method for object recognition learning performed based on a bivariate normal distribution on a probability distribution for adjusting the bounding box.
제6항에 있어서,
상기 바운딩 박스를 조정하는 확률 분포를 실제 데이터 셋의 물체 확률 분포를 기반으로 수행되는 물체인식 학습용 이미지 데이터 증강 방법.
7. The method of claim 6,
An image data augmentation method for object recognition learning in which the probability distribution for adjusting the bounding box is performed based on the object probability distribution of an actual data set.
컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,
상기 컴퓨터 프로그램은,
이미지를 선택하는 단계;
상기 이미지에서 물체 영역을 선택하는 단계;
상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계; 및
확률 분포를 기반으로 바운딩 박스를 조정하는 단계;
를 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 판독 가능한 기록매체.
As a computer-readable recording medium storing a computer program,
The computer program is
selecting an image;
selecting an object region in the image;
generating augmented data in an arbitrary area that obscures at least a portion of the object area; and
adjusting the bounding box based on the probability distribution;
A computer-readable recording medium containing instructions for causing a processor to perform
컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,
상기 컴퓨터 프로그램은,
이미지를 선택하는 단계;
상기 이미지에서 물체 영역을 선택하는 단계;
상기 물체 영역의 적어도 일부를 가리는 임의의 영역에 증강 데이터를 생성하는 단계; 및
확률 분포를 기반으로 바운딩 박스를 조정하는 단계;
를 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 프로그램.
As a computer program stored in a computer-readable recording medium,
The computer program is
selecting an image;
selecting an object region in the image;
generating augmented data in an arbitrary area that obscures at least a portion of the object area; and
adjusting the bounding box based on the probability distribution;
A computer program comprising instructions for causing a processor to perform
KR1020200099837A 2020-08-10 2020-08-10 Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program KR102490044B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200099837A KR102490044B1 (en) 2020-08-10 2020-08-10 Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200099837A KR102490044B1 (en) 2020-08-10 2020-08-10 Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program

Publications (2)

Publication Number Publication Date
KR20220019432A true KR20220019432A (en) 2022-02-17
KR102490044B1 KR102490044B1 (en) 2023-01-18

Family

ID=80493312

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200099837A KR102490044B1 (en) 2020-08-10 2020-08-10 Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program

Country Status (1)

Country Link
KR (1) KR102490044B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102568482B1 (en) * 2023-03-02 2023-08-23 (주) 씨이랩 System for providing data augmentation service for military video analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190354817A1 (en) * 2018-05-18 2019-11-21 Google Llc Learning Data Augmentation Strategies for Object Detection
KR20200087310A (en) * 2018-12-28 2020-07-21 소프트온넷(주) System and method for generation and augmentation of annotation learning data for deep learning in artificial intelligence picture reading

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190354817A1 (en) * 2018-05-18 2019-11-21 Google Llc Learning Data Augmentation Strategies for Object Detection
KR20200087310A (en) * 2018-12-28 2020-07-21 소프트온넷(주) System and method for generation and augmentation of annotation learning data for deep learning in artificial intelligence picture reading

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Barret Zoph 등, Learning Data Augmentation Strategies for Object Detection, arXiv:1906.11172v1(2019.06.26.)* *
Zhun Zhong 등, Random Erasing Data Augmentation, arXiv:1708.04896v2(2017.11.16.)* *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102568482B1 (en) * 2023-03-02 2023-08-23 (주) 씨이랩 System for providing data augmentation service for military video analysis

Also Published As

Publication number Publication date
KR102490044B1 (en) 2023-01-18

Similar Documents

Publication Publication Date Title
CN111028213B (en) Image defect detection method, device, electronic equipment and storage medium
US20210271917A1 (en) Image processing method and apparatus, electronic device, and storage medium
KR101896357B1 (en) Method, device and program for detecting an object
CN112506342A (en) Man-machine interaction method and system based on dynamic gesture recognition
JP4628882B2 (en) Classifier learning method, face discrimination method and apparatus, and program
CN110956171A (en) Automatic nameplate identification method and device, computer equipment and storage medium
TWI649698B (en) Object detection device, object detection method, and computer readable medium
CN109325532A (en) The image processing method of EDS extended data set under a kind of small sample
CN110135446B (en) Text detection method and computer storage medium
KR20200039043A (en) Object recognition device and operating method for the same
CN111695554A (en) Text correction method and device, electronic equipment and storage medium
CN111784624A (en) Target detection method, device, equipment and computer readable storage medium
KR102285269B1 (en) Image analysis apparatus and method for utilizing the big data base GEO AI
KR102490044B1 (en) Method of image data augmentation for learning of objects detecting, computer-readable storage medium and computer program
CN113436222A (en) Image processing method, image processing apparatus, electronic device, and storage medium
CN107368832A (en) Target detection and sorting technique based on image
CN117649694A (en) Face detection method, system and device based on image enhancement
JP2011170890A (en) Face detecting method, face detection device, and program
JP5051671B2 (en) Information processing apparatus, information processing method, and program
CN116740375A (en) Image feature extraction method, system and medium
JP4795737B2 (en) Face detection method, apparatus, and program
US9536137B2 (en) Object detection apparatus
CN108255298B (en) Infrared gesture recognition method and device in projection interaction system
CN110909819A (en) Electromagnetic information leakage detection method based on time domain, terminal equipment and storage medium
CN113724237B (en) Tooth trace identification method, device, computer equipment and storage medium

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right