KR20190131366A - 영상 처리에서의 데이터 확장 방법 및 그 장치 - Google Patents

영상 처리에서의 데이터 확장 방법 및 그 장치 Download PDF

Info

Publication number
KR20190131366A
KR20190131366A KR1020180056143A KR20180056143A KR20190131366A KR 20190131366 A KR20190131366 A KR 20190131366A KR 1020180056143 A KR1020180056143 A KR 1020180056143A KR 20180056143 A KR20180056143 A KR 20180056143A KR 20190131366 A KR20190131366 A KR 20190131366A
Authority
KR
South Korea
Prior art keywords
image
conversion
data
transformation
shape
Prior art date
Application number
KR1020180056143A
Other languages
English (en)
Other versions
KR102117563B1 (ko
Inventor
한동일
우현준
김미선
권혜정
Original Assignee
세종대학교산학협력단
에스엠티정보기술(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세종대학교산학협력단, 에스엠티정보기술(주) filed Critical 세종대학교산학협력단
Priority to KR1020180056143A priority Critical patent/KR102117563B1/ko
Publication of KR20190131366A publication Critical patent/KR20190131366A/ko
Application granted granted Critical
Publication of KR102117563B1 publication Critical patent/KR102117563B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

영상 처리에서의 데이터 확장 방법 및 그 장치를 제공하되, 데이터 확장 방법은 입력된 원본 영상에 대해 하나 이상의 영상 형태 변환 처리를 수행하여 복수의 형태 변환 영상을 생성하는 단계, 형태 변환 영상 별로 하나 이상의 선택 영역에 대한 정보를 추출하고 추출된 정보에 대응하는 선택 영역 영상들을 생성하는 단계, 선택 영역 영상 별로 하나 이상의 영상 특성 변환 처리를 수행하여 복수의 특성 변환 영상을 생성하는 단계, 및 형태 변환 영상, 선택 영역 역상 및 특성 변환 영상을 기계학습용 데이터로서 저장하는 단계를 포함한다.

Description

영상 처리에서의 데이터 확장 방법 및 그 장치{METHOD FOR DATA EXTENSIONS IN IMAGE PROCESSING AND APPARATUS THEREOF}
본 발명은 영상 처리에서의 데이터 확장 방법 및 이를 처리하는 장치에 관한 것이다.
기존에는 인식 또는 분류를 수행하는 처리기를 만들기 위해서 전문가가 데이터 처리 기법이나 알고리즘을 조합하여 새로운 처리기를 생성하였다. 따라서, 인식 또는 분류를 수행하는 처리기의 성능은, 전문가가 인식 또는 분류 대상의 특징을 얼마나 잘 파악하고 해당 특징에 최적화된 알고리즘을 선택 또는 만들어 내는지에 크게 좌우된다.
한편, 기계학습 분야에서는 학습시킬 데이터(즉, 학습 데이터(training data))에 따라서 처리기의 알고리즘이나 가중치를 변화시켜서 스스로 최적화 과정을 거친다. 즉, 전문가가 개입하는 기존의 기법과는 다르게, 기계학습에서는 학습 데이터가 처리기를 결정시킨다고 할 수 있다. 이에 따라, 기계학습은 알고리즘도 중요하지만, 데이터의 질과 양이 성능에 큰 영향을 끼친다.
이처럼, 기계학습 분야는 비전문가도 처리기를 제작할 수 있는 장점이 있으나, 양질의 기계학습을 위해서는 많은 양의 데이터가 필요하다. 즉, 기계학습 시 학습시킬 데이터가 많을수록 성능은 향상되지만, 반대로 데이터가 너무 적을 경우 학습 자체가 제대로 되지 않을 수 있다는 문제점이 있다. 이러한 문제점은 학습시킬 데이터의 양이 절대적으로 적은 특수한 분야일수록 두드러진다. 특수한 분야에서는 데이터 자체가 희귀하므로 양이 적은데다 다양한 환경을 고려하고 있는 경우는 더욱 드물다. 따라서, 전문가가 환경을 고려하여 직접 알고리즘을 구현하는 방식과는 다르게, 기계학습 시 인위적으로 특정 환경을 가정하여 데이터를 확장하는 과정이 필요하다.
기계학습 분야에서 학습을 수행하기 위한 알고리즘은 데이터의 특징을 잘 추려내는 방법을 의미한다. 이때, 학습 데이터는 기계학습의 방향을 바로잡는 역할을 하며, 아무리 좋은 알고리즘도 데이터 없이는 학습을 진행할 수가 없다. 이처럼, 기계학습 분야에서 데이터는 가중치의 학습이 원활하게 이뤄지도록 길을 알려주는 이정표이며, 데이터의 양이 많을수록 학습의 정확도가 향상될 수 있다. 그러므로 원본 데이터의 특징을 살리면서도 다양한 환경에 대한 변수를 반영하여 다양한 파생 데이터를 함으로써, 한정된 데이터를 보다 확장할 수 있는 데이터 확장 방법이 필요하다.
그러나 종래의 데이터를 확장하는 방식으로는 단순히 데이터의 양을 늘릴 수는 있으나 데이터의 질까지는 향상시킬 수가 없었다. 따라서, 데이터의 양을 증가시켜 성능을 향상시키는 과정에서 대상의 특징뿐만 아니라 학습을 수행한 환경 또한 늘어나도록 처리해야 한다. 즉, 데이터의 단순한 확장보다는 여러 상황을 모사할 수 있는 형태로 데이터를 확장하여 기계학습 알고리즘의 진단 정확도 및 유연성을 보다 향상시킬 수 있는 데이터 확장 방법이 필요하다.
대한민국 공개특허 제10-2015-0140644호(발명의 명칭: 표정 인식을 위한 기계 학습 훈련 데이터의 수집)
본 발명의 일 실시예는 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 영상에 대한 학습 시 데이터 부족 현상을 극복하기 위해 다양한 환경 변수를 적용하여 한정된 원본 데이터를 보다 확장시킬 수 있는 데이터 확장 방법 및 그 장치를 제공하고자 한다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 측면에 따른 영상 처리에서의 데이터 확장 방법은, 입력된 원본 영상에 대해 하나 이상의 영상 형태 변환 처리를 수행하여 복수의 형태 변환 영상을 생성하는 단계; 상기 형태 변환 영상 별로 하나 이상의 선택 영역에 대한 정보를 추출하고, 추출된 정보에 대응하는 선택 영역 영상들을 생성하는 단계; 상기 선택 영역 영상 별로 하나 이상의 영상 특성 변환 처리를 수행하여 복수의 특성 변환 영상을 생성하는 단계; 및 상기 형태 변환 영상, 선택 영역 역상 및 특성 변환 영상을 기계학습용 데이터로서 저장하는 단계를 포함한다.
또한, 본 발명의 다른 측면에 따른 영상 처리에서의 데이터 확장 장치는, 영상 처리에서의 데이터 확장 프로그램이 저장된 메모리; 및 상기 메모리에 저장된 프로그램을 실행하는 프로세서를 포함한다. 이때, 상기 프로세서는 상기 데이터 확장 프로그램의 실행에 따라, 입력된 원본 영상에 대해 하나 이상의 영상 형태 변환 처리를 수행하여 복수의 형태 변환 영상을 생성하고, 상기 형태 변환 영상 별로 하나 이상의 선택 영역에 대한 정보를 추출하고, 추출된 정보에 대응하는 선택 영역 영상들을 생성하고, 상기 선택 영역 영상 별로 하나 이상의 영상 특성 변환 처리를 수행하여 복수의 특성 변환 영상을 생성하며, 상기 형태 변환 영상, 선택 영역 역상 및 특성 변환 영상을 기계학습용 데이터로서 저장한다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 한정된 데이터를 효과적으로 증가시켜, 학습시킬 데이터가 부족하여 기계 학습이 실패하는 현상을 방지할 수 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 영상 처리 시 원본 데이터에서 특정 대상 및 영역에 대한 데이터를 추출함으로써, 기존 데이터에 대한 강조 또는 보완을 위한 데이터 확장을 수행할 수 있다. 이에 따라, 다양한 환경적 변수가 반영된 데이터를 사용한, 보다 유연한 기계 학습을 유도할 수 있다. 구체적으로, 사용자가 지정한 데이터의 특정 영역에 대해서 다양한 파생 데이터를 생성하므로, 사용자가 기계학습 알고리즘으로 학습시키고자 하는 영역이나 대상을 데이터로 강조할 수 있게 된다. 이는 기계학습을 진행하는 과정에서 보다 특징을 잘 찾을 수 있도록 하며 결과적으로 알고리즘의 성능을 향상시킨다.
도 1은 본 발명의 일 실시예에 따른 영상 처리에서의 데이터 확장 장치의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 영상 형태 변환 과정을 설명하기 위한 순서도이다.
도 3은 본 발명의 일 실시예에 따른 영상 형태 변환을 수행한 결과의 일례이다.
도 4는 본 발명의 일 실시예에 따른 영역 선택을 통한 영상 추출 과정을 설명하기 위한 순서도이다.
도 5는 본 발명의 일 실시예에 따른 영상 추출을 수행한 결과의 일례이다.
도 6은 본 발명의 일 실시예에 따른 영상 특성 변환 과정을 설명하기 위한 순서도이다.
도 7은 본 발명의 일 실시예에 따른 영상 특성 변환을 수행한 결과의 일례이다.
도 8은 본 발명의 일 실시예에 따른 영상 데이터 확장의 결과를 설명하기 위한 순서도이다.
도 9는 본 발명의 일 실시예에 따른 영상 처리에서의 데이터 확장 방법을 설명하기 위한 순서도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 본 발명을 명확하게 설명하기 위해 도면에서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. 또한, 도면을 참고하여 설명하면서, 같은 명칭으로 나타낸 구성일지라도 도면에 따라 도면 번호가 달라질 수 있고, 도면 번호는 설명의 편의를 위해 기재된 것에 불과하고 해당 도면 번호에 의해 각 구성의 개념, 특징, 기능 또는 효과가 제한 해석되는 것은 아니다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 명세서에 있어서 '부(部)' 또는 '모듈'이란, 하드웨어 또는 소프트웨어에 의해 실현되는 유닛(unit), 양방을 이용하여 실현되는 유닛을 포함하며, 하나의 유닛이 둘 이상의 하드웨어를 이용하여 실현되어도 되고, 둘 이상의 유닛이 하나의 하드웨어에 의해 실현되어도 된다.
이하, 도면을 참조하여 본 발명의 일 실시예에 따른 영상 처리에서 학습용 데이터를 확장하는 데이터 확장 방법 및 이를 수행하는 장치에 대해서 상세히 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 데이터 확장 장치의 구성도이다.
도 1에 도시한 바와 같이, 데이터 확장 장치(100)는 데이터 입출력모듈(110), 메모리(120), 프로세서(130)를 포함한다.
데이터 입출력모듈(110)은 통신 모듈을 통해 데이터를 수신 또는 송신한다. 이때, 데이터 입출력 모듈(110)은 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치일 수 있다.
또한, 데이터 입출력 모듈(110)은 프로세서(130)의 제어에 따라, 사용자가 입력 영상 데이터 상에서 임의의 영역을 선택할 수 있도록 하는 사용자 인터페이스를 제공한다. 그리고 데이터 입출력 모듈(110)은 사용자에 의해 선택된 영역에 대한 정보를 프로세서(130)로 전달한다.
메모리(120)에는 데이터 확장 프로그램이 저장된다. 해당 프로그램은 프로세서(130)에 의하여 구동되어, 영상 처리에서 학습 시 사용될 데이터를 확장시키는 처리를 수행한다.
또한, 메모리(120)는 프로세서(130)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행한다. 여기서, 메모리(120)는 저장된 정보를 유지하기 위하여 전력이 필요한 휘발성 저장장치 외에 자기 저장 매체(magnetic storage media) 또는 플래시 저장 매체(flash storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
프로세서(130)는 메모리(120)에 저장된 학습 데이터 확장 프로그램을 실행한다. 프로세서(130)는 일종의 중앙처리장치로서 영상 처리에서의 기계학습용 학습 데이터 확장 처리를 수행하는 전체 과정을 제어한다. 프로세서(130)가 수행하는 각 단계에 대해서는 후술하기로 한다.
프로세서(130)는 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
프로세서(130)는 데이터 확장 프로그램의 실행에 따라 다음의 처리들을 수행한다.
참고로, 영상 처리에서 객체 인지에 영향을 주는 요소는 크게 밝기, 회전, 크기 등으로 나눌 수 있다. 같은 대상이라도 밝기에 따라 보이는 색이 달라지게 되며, 예를 들어 그림자로 인하여 같은 면이 서로 다른 면으로 보일 수도 있다. 때문에, 인식 또는 분류 처리 시 영상에 대한 다양한 밝기를 학습시켜 빛에 대해 민감하게 반응하지 않도록 하는 것이 중요하다. 또한, 영상을 회전하는 것은 아날로그의 관점에서는 차이가 미미할 수 있으나, 디지털의 관점에서는 큰 변화를 보인다. 영상 처리를 통해서 회전을 되돌릴 수 있으나, 디지털 상에서의 회전은 그 자체만으로 데이터의 손실이 발생하므로 완벽한 원본으로 재현은 사실상 불가능하다. 특히, 템플릿 매칭 기반으로 인지하는 알고리즘일 경우 회전으로 인하여 템플릿이 맞지 않는 현상이 발생할 수도 있다. 때문에 객체 인지에서 회전 또한 영향을 줄 수 있는 요소 중의 하나이다. 또한, 영상을 확대하거나 축소할 때에는 데이터를 압축하거나 없는 데이터를 예상해서 생성하는 과정이 포함된다. 이를 인지 관점에서 보면, 너무 작은 크기로 축소할 경우 인지에 필요한 정보가 너무 적어지며, 확대시킬 경우에도 존재하지 않는 데이터를 예상해서 데이터를 생성하게 되므로 부정확하거나 불필요한 정보에 해당할 가능성이 높아진다. 또한, 영상을 너무 큰 크기로 확대할 경우, 필요 이상의 정보를 포함하고 있기 때문에 인지에 필요한 정보를 추출하는 과정이 필수적이다. 이는 영상을 축소시킬 때와 마찬가지로 어떤 데이터를 유지할 것인지가 중요한 문제이므로, 크기 또한 인지에 영향을 끼치는 요소에 해당한다.
이러한 영상 처리에서의 인식 또는 분류를 위한 중요 영향 요소에 따른 데이터들을 확보하기 위하여, 프로세서(130)는 입력된 영상(이하, "입력 영상"이라고 지칭함)을 크로핑(cropping) 처리하고, 크로핑 처리된 결과 영상(이하, "출력 영상 리스트"라고 지칭함)을 출력한다.
또한, 프로세서(130)는 크로핑 처리를 통해 확장된 데이터들을 임의의 인식 또는 분류를 처리하는 기계학습 알고리즘의 학습 데이터로서 저장 및 출력할 수 있다.
이하, 도 2 내지 도 8을 참조하여, 프로세서(130)가 크로핑 처리를 수행하는 과정에 대해서 상세히 설명하도록 한다. 이때, 프로세서(130)가 처리하는 크로핑은, 아래에서 설명할 영상 변환 처리, 영상 추출 처리 및 특성 변환 처리를 포함한다.
영상 변환 처리는 입력 영상의 물리적 형태를 변형시켜 원본과는 다른 형태로 변환된 영상을 생성하는 과정이다.
영역 추출 처리는 다른 형태로 변환된 영상에서 선택된 영역을 추출하는 과정이다. 이때, 영상 내의 범위를 유지하도록 영역의 범위를 교정하고, 교정된 범위를 선택하여 추출한다. 여기서, 선택된 영역이란 사용자가 선택한 영역을 의미할 수 있으며, 이를 위해 프로세서(130)는 데이터 입출력 모듈(110)을 통해 사용자가 영상(즉, "다른 형태로 변환된 영상") 상에서 원하는 영역을 선택할 수 있도록 하는 사용자 인터페이스를 제공한다. 사용자가 선택하는 영역은 해당 영상 내 임의의 객체 또는 목표 대상이 포함된 일정 범위일 수 있다.
특성 변환 처리는 추출된 영상의 밝기를 변형시켜 기존과는 다른 색상의 영상을 생성하는 과정이다. 이때, 추출된 영상에서 기준 조건(예: 밝기, 채도, 및 색상 등)에 대응하는 각각의 값을 변환한다.
먼저, 도 2 및 도 3을 참조하여, 프로세서(130)를 통해 수행되는 영상 변환 처리에 대해서 좀 더 구체적으로 설명하도록 한다.
도 2에 도시한 바와 같이, 변환 대상 영상이 입력되면(S110), 변환 대상 영상에 대해 복수의 변환 기능 중 어느 변환 기능을 적용할지 여부를 결정하고(S120), 변환 대상 영상에 대해 결정된 변환 기능을 적용하여 순차적인 영상 형태 변환을 적용한다(S130). 그리고 순차적인 영상 변환의 결과로서 변환 영상 리스트를 출력한다(S140).
여기서, 변환 대상 영상은 영상 변환을 적용하고자 하는 대상(즉, 입력 영상)이며, 하나의 영상 또는 영상의 리스트를 입력받아 메모리(120)에 저장하는 과정을 수행할 수 있다. 예를 들어, 도 3을 참조하면, 어느 하나의 원본 영상(즉, 변환 대상 영상)(P110)이 입력되면, 영상 변환 처리를 통해 다양한 환경 변수에 따라 변환된 다수의 영상(즉, 변환 영상 리스트)(P140)이 출력되는 것을 알 수 있다.
구체적으로, 변환 적용 여부 결정 시(S120), 영상 변환에 사용할 변환 기능의 종류를 결정하기 위한 환경 변수를 선택한다. 이때, 환경 변수로서, 사전에 사용자가 지정한 변환 기능을 사용할 수 있다. 이러한 환경 변수 설정 시 사용자가 환경 변수의 종류를 설정할 수 있도록 하는 사용자 인터페이스를 제공한다. 또한, 프로세서(130)가 사전에 설정된 순서 또는 랜덤한 순서에 따라 자동으로 하나 이상의 변환 기능의 종류를 선택하여 적용하는 것도 가능하다.
순차적인 영상 형태 변환 적용 처리는, 이동 변환 처리(S131), 크기 변환 처리(S132), 회전 변환 처리(S133) 및 왜곡 변환 처리(S134)를 포함할 수 있다. 이러한 각각의 변환 기능은 사용자가 입력한 조건 정보(예를 들어, 영상 내 변환 기준 위치 선택, 변환 정도 값, 변환 횟수 등)에 기초하여 처리될 수 있으며, 이를 위해 프로세서(130)는 사용자가 각각의 변환 기능을 제어할 수 있도록하는 사용자 인터페이스를 제공할 수 있다. 또한, 프로세서(130)가 사전에 설정된 조건 정보(예를 들어, 영상 내 변환 기준 위치 설정, 변환 정도 값 및 변환 횟수 등)에 따라 자동으로 변환 횟수 및 정도를 변경하여 적용하는 것도 가능하다.
구체적으로, 이동 변환 처리(S131)는 입력 영상의 좌표를 하나 이상의 방향, 각도 및 거리를 적용하여 이동시킨다. 이는, 영상 촬영 시 임의의 대상(즉, 객체)을 영상의 중앙에 위치시키기못한 경우를 가정하여 영상을 변환하는 기능이다.
크기 변환 처리(S132)는 입력 영상의 크기를 하나 이상의 크기로 확대시키거나 축소시킨다. 이는, 영상 촬영 시에 확대 및 축소가 적용된 경우를 가정하여 영상을 변환하는 기능이다. 크기 변환 기능은, 원본 영상에 대해 복수의 방향 별로 각각 크기를 확대 또는 축소시킬 수 있으며, 이에 한정되지 않는다.
회전 변환 처리(S133)는 입력 영상의 좌표를 하나 이상의 각도로 회전시킨다. 이는, 영상 촬영 시에 촬영 장치(즉, 카메라 등)의 각도가 기울어진 경우를 가정하여 영상을 변환하는 기능이다. 회전 변환 기능은, 원본 영상 내 중심점을 계산하고, 중심점을 기준으로 기설정된 복수의 각도 별로 영상을 회전시킬 수 있으며, 이에 한정되지 않는다.
왜곡 변환 처리(S134)는 영상의 외형을 하나 이상의 형태로 변형시킨다. 이는, 영상 촬영 시에 대상에 대해 임의의 각도(예: 측면)에서 촬영된 경우를 가정하여 영상을 변환하는 기능이다. 왜곡 변환 기능은, 영상의 일부 영역은 축소시키고 다른 일부 영역은 확대시키되, 최대 크기로 축소 또는 확대된 영역에서 시작하여 임의의 방향을 향하여 최대 크기로 확대 또는 축소된 영역까지 점진적으로 변화시킬 수 있으며, 이에 한정되지 않는다.
순차적인 영상 변환 적용 처리(S130)는, 사용하고자 하는 형태 변환 기능을 순차적으로 적용하여 변환된 영상을 축적시키는 과정을 의미한다. 이때, 사용하고자 하는 변환 기능을 모두 적용할 때까지 해당 변환 대상 영상을 이용하여 새로운 변환 영상을 생성하는 과정을 수행할 수 있다. 즉, 순차적인 영상 변환 적용 처리(S130)는 하나의 변환 대상 영상에 대해 하나 이상의 영상 변환 기능(즉, 이동 변환 처리(S131), 크기 변환 처리(S132), 회전 변환 처리(S133) 및 왜곡 변환 처리(S134) 중 적어도 하나)을 순차적으로 모두 적용할 수 있다. 이처럼 이미 생성된 변환 영상에 대해서도 변환 대상으로서 다시 포함할 수 있으며, 이에 따라 하나 이상의 형태 변환 기능을 적용하여 변환된 영상들이 기하급수적으로 확장될 수 있다.
이러한 순차적인 영상 변환 적용 처리(S130)의 결과로서, 변환 영상 리스트가 출력된다(S140). 변환 영상 리스트는 기하급수적으로 확장된 영상을 저장해놓은 정보이다.
프로세서(130)는 영상 형태 변환 처리를 통해 축적된 영상을 순차적으로 쌓아 놓고, 다음 단계의 처리 모듈로 전달한다.
다음으로, 도 4 및 도 5를 참조하여, 프로세서(130)를 통해 수행되는 영역 추출 처리에 대해서 좀 더 구체적으로 설명하도록 한다.
도 4에 도시한 바와 같이, 영역 추출 대상 영상이 입력되면(S210), 추출할 영역 정보를 확인하여(S221), 범위 교정 처리(S222), 영역 선택 처리(S223) 및 정보 추출 처리(S224)를 수행한다. 이러한 영역 추출 처리의 결과로서, 추출 영상 리스트를 출력한다(S230).
여기서, 추출 대상 영상은 임의의 영역을 추출하고자 하는 대상으로서, 영상 변환 처리의 결과로서 출력된 변환 영상 리스트이다.
도 5를 참조하면, 다수의 변환된 영상들(즉, 영역 추출 대상 영상)(P210)이 입력되면, 영역 추출 처리(범위 교정, 영역 선택 및 정보 추출)를 통해 각각의 추출된 영상(즉, 추출 영상 리스트)(P230)가 출력되는 것을 알 수 있다.
구체적으로, 영역 정보 확인 시(S221), 변환된 영상 내에서 사용자가 추출하고자 선택한 영역에 대응하는 정보를 확인하며, 추출 영역은 복수 개의 영역을 포함할 수 있다. 이러한 영역 정보 확인 시 사용자가 추출할 영역을 선택할 수 있도록 하는 사용자 인터페이스를 제공한다. 즉, 데이터 입출력 모듈(110)을 통해 해당 영상(즉, 변환된 영상)을 화면에 출력한 후, 사용자가 임의의 영역(예를 들어, 대상 또는 객체를 포함하는 범위)을 설정하고 선택할 수 있도록 하는 도구를 제공할 수 있다. 이때, 프로세서(130)가 해당 영상 내 하나 이상의 객체들을 식별하고, 식별된 객체 별로 소정의 범위를 자동으로 선택하는 것도 가능하다.
범위 교정 처리 시(S222), 앞선 영상 변환 처리를 통해 형태가 변경됨에 따라 변환된 영상이 원본의 영역을 벗어난 경우를 교정한다. 이때, 원본의 영역을 벗어난 영역을 삭제할 수 있으며, 범위 교정 방식은 이에 한정되지 않는다.
영역 선택 처리 시(S223), 교정된 영역 내에서 하나 이상의 선택된 영역에 해당하는 영상 정보를 획득한다. 이때, 선택된 영역이 완전히 같지 않을 경우 중복되는 일부 영역이 존재하더라도 개별적인 정보로 취급한다.
정보 추출 처리 시(S224), 선택된 영상 정보 별로 각각 하나의 영상 형태로 추출한다. 이에 따라, 전체 영역의 중복을 제외한 개별적인 정보의 개수만큼 선택된 영상 정보를 추출하여 각각의 영역 별로 새로운 영상을 생성한다.
이러한 영역 추출 처리의 결과로서, 추출 영상 리스트가 출력된다(S230). 추출 영상 리스트는 산술급수적으로 확장된 영상을 저장해놓은 정보이다.
프로세서(130)는 영역 추출 처리를 통해 축적된 영상을 순차적으로 쌓아놓고, 다음 단계의 처리 모듈로 전달한다.
다음으로, 도 6 및 도 7을 참조하여, 프로세서(130)를 통해 수행되는 특성 변환 처리에 대해서 좀 더 구체적으로 설명하도록 한다.
도 6에 도시한 바와 같이, 변환 대상 영상(즉, 추출 영상)이 입력되면(S310), 변환 대상 영상에 대해 특성 변환 중 어느 특성 변환을 적용할지 여부를 결정하고(S320), 변환 대상 영상에 대해 결정된 특성 변환을 적용하여 순차적인 특성 변환을 적용한다(S330). 이때, 순차적인 특성 변환 처리의 전후로 변환 대상 영상에 대한 제 1 및 제 2 색상 공간 변경 처리를 더 처리할 수 있다(S340, S350). 또한, 순차적인 영상 특성 변환의 결과로서 특성 변환 영상 리스트를 출력한다(S360).
여기서, 변환 대상 영상은 특성 값을 변환하고자 하는 대상(즉, 추출된 영상)이며, 영역 추출 처리를 통해 출력된 추출 영상 리스트이다.
그리고 특성 변환 영상 리스트는 기하급수적으로 확장된 영상을 저장해놓은 정보이며, 이는 순차적인 특성 변환 처리에 의해 축적된다. 또한, 제 2 색상 공간 변경 처리(S350)를 통해 원본 영상의 색상 공간으로 재변경된 영상을 리스트 형태로 저장하는 과정을 수행할 수 있다.
도 7을 참조하면, 각각의 추출된 영상(즉, 변환 대상 영상)(P310)이 입력되면, 특성 변환 처리를 통해 다양한 특성이 변환된 다수의 영상(즉, 특성 변환 영상 리스트)(P360)이 출력되는 것을 알 수 있다.
구체적으로, 특성 변환 적용 여부 결정 시(S320), 특성 변환에 사용할 변환 기능의 종류를 결정하기 위한 환경 변수를 선택한다. 이때, 환경 변수로서, 사전에 사용자가 지정한 특성 변환 기능의 종류를 사용할 수 있다. 이러한 환경 변수 설정 시 사용자가 환경 변수를 설정할 수 있도록 하는 사용자 인터페이스를 제공한다. 또한, 프로세서(130)가 자체적으로 사전에 설정된 순서 또는 랜덤한 순서에 따라 자동으로 특성 변환 기능의 종류를 선택하여 적용하는 것도 가능하다.
또한, 순차적인 특성 변환 적용 처리는, 밝기 변환 처리(S331), 채도 변환(S332) 및 색상 변환(S333)을 포함한다. 이러한 각각의 특성 변환 기능은 사용자가 입력한 정보(예를 들어, 영상 내 변환 위치 선택, 변환 정도 값 및 변환 횟수 등)에 기초하여 처리될 수 있으며, 이를 위해 프로세서(130)는 사용자가 각각의 특성 변환 기능을 제어할 수 있도록하는 사용자 인터페이스를 제공할 수 있다. 또한, 프로세서(130)가 사전에 설정된 조건 정보(예를 들어, 영상 내 변환 위치 선택, 변환 정도 값 및 변환 횟수 등)에 따라 자동으로 변환 횟수 및 정도를 변경하여 적용하는 것도 가능하다.
밝기 변환 처리(S331) 시, 해당 영상의 밝기를 조절한다. 이는, 영상 촬영 시에 배경이 밝거나 또는 어두운 경우를 가정하여 영상을 변환하는 기능이다.
채도 변환 처리(S332) 시, 해당 영상의 채도를 조절한다. 이는, 영상 촬영 시에 영상이 보정되어 색상이 뿌옇게 보이거나 색채가 강한 경우를 가정하여 영상을 변환하는 기능이다.
이러한, 밝기 변환 및 채도 변환 기능은 각각, 밝기 및 채도의 정도를 복수의 레벨 또는 단계로 구분하여 레벨 또는 단계의 변화에 따라 점진적으로 조절할 수 있다. 또한, 밝기 변환 및 채도 변환 기능은 영상의 적어도 일부 영역에 대해 적용될 수 있으며, 전체 영역에 대해 상이한 정도가 적용될 수도 있다. 이러한 밝기 변환 및 채도 변환 처리 방식은 한정되지 않는다.
색상 변환 처리(S333) 시, 해당 영상의 색상을 조절한다. 이때, 색상의 스펙트럼을 변화시켜 다른 색상으로 보이도록 변환할 수 있다. 이는, 촬영 환경(즉, 카메라 환경)과는 관련되지 않으며, 해당 색상이 특정 대상의 고유한 특징이라고 할 수 없는 경우에 활용될 수 있다.
순차적인 특성 변환 적용 처리(S330)는, 사용하고자 하는 특성 변환 기능을 순차적으로 적용하여 변환된 영상을 축적시키는 과정을 의미한다. 이때, 사용하고자 하는 변환 기능을 모두 적용할 때까지 해당 변환 대상 영상을 이용하여 새로운 변환 영상을 생성하는 과정을 수행할 수 있다. 즉, 순차적인 특성 변환 적용 처리(S330)는 하나의 변환 대상 영상에 대해 하나 이상의 특성 변환 기능(즉, 밝기 변환 처리(S331), 채도 변환 처리(S332) 및 색상 변환 처리(S333) 중 적어도 하나)을 순차적으로 모두 적용할 수 있다. 이처럼, 이미 생성된 변환 영상에 대해서도 변환 대상으로서 다시 포함할 수 있으며, 이에 따라 하나 이상의 특성 변환 기능을 적용하여 변환된 영상들이 기하급수적으로 확장될 수 있다.
한편, 순차적인 특성 변환 처리(S330)를 수행하기 이전에, 제 1 색상 공간 변환을 수행할 수 있다(S340). 색상 공간 변환 처리 시, 변환 대상 영상에 대해 RGB 코드를 HSV 코드로 변환하는 색상 공간 변경을 수행할 수 있다. 이는, 빨강, 초록, 파랑을 축으로 하는 RGB 색상 공간에서 색상, 채도, 밝기를 축으로 하는 HSV공간으로 색상 정보를 수정하는 과정이다.
또한, 순차적인 특성 변환 처리(S330)를 수행한 이후에, 다시 원래의 색상 공간으로 변환(즉, 제 2 색상 공간 변환)을 수행할 수 있다(S350). 이때, 특성 변환 처리가 완료된 영상의 HSV 코드를 RGB 코드로 변환할 수 있다.
프로세서(130)는 원본 영상에 대해서 형태 변환한 결과들, 및 형태가 변환된 영상에서 선택된 영역에 대해 특성 변화 처리를 수행한 결과들을 각각 파생 데이터로서 저장하여 관리한다.
이상, 도 2 내지 도 7을 통해 설명한 바와 같이, 프로세서(130)는 영상에 대해 2 종류의 변환 즉, 영상의 적어도 일부에 대해서 외형이 변형되는 형태 변환과 값이 조절되는 특성 변환을 처리한다.
이때, 각 변환에 포함되는 변환 기능들의 순서는 예시에 해당하며, 영상 변환 결과는 변환 기능들의 순서에 상관없이 동일하되 어떤 기능을 우선 적용하였는가의 차이만 존재한다.
다만, 프로세서(130)는 우선적으로 물리적 형태 변환에 해당하는 형태 변환 처리를 수행한 이후 특성 값 변환에 해당하는 특성 변환 처리를 수행한다. 이는, 특성 변환 처리에 앞서 수행되는 영역 추출 처리가 형태 변환 이후에 수행되어야 하기 때문이다.
이처럼 형태 변환 처리가 영역 추출 처리보다 우선적으로 처리된 경우와 그렇지 않은 경우의 결과를 확인하기 위하여, 도 8을 참조하여 형태 변환 및 특성 변환의 순서가 서로 바뀐 경우를 비교하도록 한다.
도 8에서와 같이, 입력 영상(즉, 원본 영상)이 입력되면(S410), 임의의 영역 추출 후 영상 형태 변환 방식(S420)과, 영상 형태 변환 후 영역 추출 방식(S430)을 수행할 수 있다.
추출 후 변환 방식(S420)에서는 우선적으로 선택된 영역에서 영상 정보를 추출한 후(S421), 추출된 영상에 대해 형태 변환을 수행하여 새로운 영상을 생성한다(S422). 따라서, 도 8에 도시된 바와 같이, 이미 영역 추출된 영상에서 형태 변환이 수행되므로 추출된 영역 밖의 정보는 얻을 수가 없어, 원본과는 다른 잘못된 정보(예, 흑색)가 채워지게 된다. 이는 기계학습 시 일종의 노이즈로서 잘못된 학습을 유도할 수 있다.
반면에, 변환 후 추출 방식(S430)에서는 영상의 형태 변환을 우선 수행하여 변환된 영상을 생성한 후(S431), 변환된 영상에 선택된 영역을 적용하여 영상 정보를 추출한다(S432). 따라서, 도 8에 도시된 바와 같이, 변환된 영상은 원본을 최대한 유지하며, 이러한 영상에 대해 추출 과정을 수행하므로 잘리거나 잘못된 영역없이 노이즈 없는 연속적인 영상을 획득할 수 있다.
이하, 도 9를 참조하며 본 발명의 일 실시예에 따른 영상 처리에서 데이터 확장 방법을 설명하도록 한다. 이때, 데이터 확장 방법은 앞서 설명한 프로세서(130)를 통해 수행될 수 있다.
먼저, 데이터 확장을 처리하고자 하는 영상(즉, 원본 영상)을 입력받는다(S910).
이때, 입력된 원본 영상은 사전에 저장되어 있던 영상 중 사용자가 선택한 영상 또는 사용자에 의해 데이터 확장 장치(100)에 새롭게 입력된 영상일 수 있다. 예를 들어, 원본 영상은 하나의 프레임의 영상이거나 또는 복수의 프레임이 연속적으로 구성된 영상이 순차적으로 입력될 수 있다.
그런 다음, 원본 영상에 대해 기설정된 형태 변환 처리를 수행한다(S920).
이때, 형태 변환 처리는 이동 변환, 크기 변환, 회전 변환 및 왜곡 변환 중 적어도 하나의 변환 처리를 수행할 수 있다. 이러한 형태 변환 기능들은 앞서 도 2 및 도 3을 참조하여 설명한 것과 동일 또는 유사하므로 상세한 설명은 생략하도록 한다.
또한, 둘 이상의 형태 변환 기능을 수행할 경우 각각의 변환을 순서에 상관없이 순차적으로 처리할 수 있다. 예를 들어, 원본 영상에 대해 제 1 변환 기능을 적용한 후, 제 1 변환이 완료된 영상에 대해 상이한 변환 기능인 제 2 변환 기능을 다시 적용하는 방식으로 순차적인 영상 변환 처리를 수행할 수 있다.
이에 따라, 복수의 변환 기능에 대응하여, 하나의 변환 기능이 적용된 영상과, 둘 이상의 변환 기능이 누적 적용된 각각의 영상들이 누적 단계마다 파생 데이터로서 생성되어, 기하급수적인 데이터 확장이 가능하다. 이러한 파생 데이터는 자체적으로 학습용 데이터로서 저장되며, 추가적인 데이터 확장 처리를 위한 영상으로서 다음 처리 단계로 제공된다.
영상 형태 변환 처리에 앞서, 사용자가 형태 변환의 환경을 설정할 수 있도록 사용자 인터페이스를 제공하는 단계를 더 수행할 수 있다. 이러한 사용자 인터페이스를 통해 사용자는 이동 변환, 크기 변환, 회전 변환 및 왜곡 변환 중 하나 이상의 변환 기능을 선택할 수 있으며, 각 변환 기능을 제어할 수 있는 정보를 입력할 수 있다. 또한, 형태 변환 처리를 위한 환경 설정을 데이터 확장 장치(100)가 자체적으로 자동 설정하는 것도 가능하다.
그런 다음, 형태가 변환된 각각의 영상들(즉, 변환 영상 리스트)에 대해 영역 추출 처리를 수행한다(S930).
이때, 변환 영상 별로 선택된 영역의 정보를 추출하고, 추출된 정보 별로 영상을 생성한다. 이에 따라, 변환 영상 별로 선택된 영역 별 영상이 파생 데이터로서 생성되어, 산술급수적인 데이터 확장이 가능하다. 이러한 파생 데이터는 자체적으로 학습용 데이터로서 저장되며, 추가적인 데이터 확장 처리를 위한 영상으로서 다음 처리 단계로 제공된다.
구체적으로, 선택된 영역에 대한 정보 추출 시, 변환 영상에 대한 범위 교정을 처리하고, 교정된 영상 내에서 임의의 영역을 선택한 후, 선택된 영역에 대응하는 정보를 추출하여 대응하는 영상을 생성할 수 있다. 이러한 영역 추출 처리 방식은 앞서 도 4 및 도 5를 통해 설명한 것과 동일 또는 유사하므로 상세한 설명은 생략하도록 한다.
또한, 변환 영상 별로 사용자가 임의의 영역을 선택할 수 있도록 하는 사용자 인터페이스를 제공하는 단계를 더 수행할 수 있다. 이때, 사용자에 의해 선택된 영역은 하나의 변환 영상에 대해 복수 개일 수 있으며, 대상 또는 객체를 포함하는 일정 범위일 수 있다. 이러한 영역 선택을 데이터 확장 장치(100)가 자체적으로 자동으로 설정하는 것도 가능하다.
다음으로, 복수의 추출된 영상(즉, 선택된 영역에 따른 영상) 별로 기설정된 특성 변환 처리를 수행한다(S940).
이때, 특성 변환 처리는 밝기 변환, 채도 변환 및 색상 변환 중 적어도 하나의 변환 처리를 수행할 수 있다. 이러한 특성 변환 기능들은 앞서 도 6 및 도 7을 참조하여 설명한 것과 동일 또는 유사하므로 상세한 설명은 생략하도록 한다.
또한, 둘 이상의 특성 변환 기능을 수행할 경우 각각의 변환을 순서에 상관없이 순차적으로 처리할 수 있다. 예를 들어, 원본 영상에 대해 제 1 변환 기능을 적용한 후, 제 1 변환이 완료된 영상에 대해 상이한 변환 기능인 제 2 변환 기능을 다시 적용하는 방식으로 순차적인 영상 변환 처리를 수행할 수 있다.
이에 따라, 복수의 변환 기능에 대응하여, 하나의 변환 기능이 적용된 영상과 둘 이상의 변환 기능이 누적 적용된 각각의 영상들이 누적 단계마다 파생 데이터로서 생성되어, 기하급수적인 데이터 확장이 가능하다. 이러한 파생 데이터는 자체적으로 학습용 데이터로서 저장된다.
영상 특성 변환 처리에 앞서, 사용자가 특성 변환의 환경을 설정할 수 있도록 사용자 인터페이스를 제공하는 단계를 더 수행할 수 있다. 이러한 사용자 인터페이스를 통해 사용자는 밝기 변환, 채도 변환 및 색상 변환 중 하나 이상의 변환 기능을 선택할 수 있으며, 각 변환 기능을 제어할 수 있는 정보를 입력할 수 있다. 또한, 특성 변환 처리를 위한 환경 설정을 데이터 확장 장치(100)가 자체적으로 자동 설정하는 것도 가능하다.
한편, 특성 변환 처리의 전후에 각각 색상 공간 변환을 처리하는 단계를 더 포함할 수 있다. 즉, 추출된 영상을 RGB 코드에서 HSV 코드로 변환한 후 특성 변환 처리를 수행할 수 있으며, 특성 변환 처리가 완료된 영상에 대해 HSV 코드에서 RGB 코드로 재변환하는 처리를 수행할 수 있다.
그런 다음, 특성 변환이 완료된 복수의 영상들을 저장하되, 학습을 위한 데이터로서 출력한다(S950).
즉, 이상의 단계들을 통해 확장된 모든 데이터들은 임의의 인식 또는 분류를 처리하는 기계학습 알고리즘을 학습시키기 위한 학습 데이터로서 제공될 수 있다.
이상에서 설명한 본 발명의 실시예에 따른 영상 처리에서의 데이터 확장 방법은, 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 이러한 기록 매체는 컴퓨터 판독 가능 매체를 포함하며, 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함하며, 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
또한, 본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수도 있다.
본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 학습 모델 선택 장치 110: 데이터 입출력 모듈
120: 메모리 130: 프로세서

Claims (14)

  1. 데이터 확장 장치를 통한 영상 처리에서의 데이터 확장 방법에 있어서,
    입력된 원본 영상에 대해 하나 이상의 영상 형태 변환 처리를 수행하여 복수의 형태 변환 영상을 생성하는 단계;
    상기 형태 변환 영상 별로 하나 이상의 선택 영역에 대한 정보를 추출하고, 추출된 정보에 대응하는 선택 영역 영상들을 생성하는 단계;
    상기 선택 영역 영상 별로 하나 이상의 영상 특성 변환 처리를 수행하여 복수의 특성 변환 영상을 생성하는 단계; 및
    상기 형태 변환 영상, 선택 영역 역상 및 특성 변환 영상을 기계학습용 데이터로서 저장하는 단계를 포함하는, 데이터 확장 방법.
  2. 제 1 항에 있어서,
    상기 형태 변환 영상을 생성하는 단계는,
    상기 원본 영상의 좌표를 하나 이상의 방향, 각도 및 거리를 각각 적용하여 이동시키는 이동 변환, 상기 원본 영상의 크기를 하나 이상의 크기에 따라 확대 및 축소시키는 크기 변환, 상기 원본 영상의 좌표를 하나 이상의 각도의 기울기를 적용하여 회전시키는 회전 변환, 및 상기 원본 영상의 외형을 하나 이상의 형태로 변형시키는 왜곡 변환 중 적어도 하나의 변환 기능을 적용하는 것인, 데이터 확장 방법.
  3. 제 2 항에 있어서,
    상기 형태 변환 영상을 생성하는 단계는,
    사용자가 상기 이동 변환, 크기 변환, 회전 변환 및 왜곡 변환 중 적어도 하나의 변환 기능을 선택할 수 있도록 하는 사용자 인터페이스를 제공하는 단계;
    상기 사용자 인터페이스를 통해 선택된 하나 이상의 변환 기능을 순차적으로 상기 원본 영상에 적용하는 단계; 및
    단일 변환 기능이 적용된 형태 변환 영상 및 둘 이상의 변환 기능이 누적 적용된 형태 변환 영상을 각각 학습용 데이터로 저장하는 단계를 포함하며,
    상기 둘 이상의 변환 기능이 누적 적용된 형태 변환 영상은 누적 단계마다 학습용 데이터로서 저장되는 것인, 데이터 확장 방법.
  4. 제 1 항에 있어서,
    상기 선택 영역 영상을 생성하는 단계는,
    상기 형태 변환 영상을 상기 원본 영상의 영역에 기준하여 범위를 교정 처리하는 단계;
    상기 교정 처리된 영상에 대해 하나 이상의 영역을 선택하는 단계;
    상기 선택된 영역에 대응하는 정보를 추출하여 대응하는 영상을 생성하는 단계를 포함하는, 데이터 확장 방법.
  5. 제 4 항에 있어서,
    상기 하나 이상의 영역을 선택하는 단계는,
    사용자가 상기 교정 처리된 영상들을 확인할 수 있도록 출력하고, 출력된 영상 내에서 하나 이상의 영역을 선택할 수 있도록 하는 사용자 인터페이스를 제공하는 단계; 및
    상기 사용자 인터페이스를 통해 선택된 영역의 정보를 입력받는 단계를 포함하는, 데이터 확장 방법.
  6. 제 1 항에 있어서,
    상기 특성 변환 영상을 생성하는 단계는,
    상기 선택 영역 영상의 적어도 일부 영역에 대해 밝기의 정도를 조절하는 밝기 변환, 상기 선택 영역 영상의 적어도 일부 영역에 대해 채도의 정도를 조절하는 채도 변환, 및 상기 선택 영역 영상의 적어도 일부 영역에 대해 색상의 스펙트럼을 변화시키는 색상 변환 중 적어도 하나의 변환 기능을 적용하는 것인, 데이터 확장 방법.
  7. 제 6 항에 있어서,
    상기 특성 변환 영상을 생성하는 단계는,
    사용자가 상기 밝기 변환, 채도 변환 및 색상 변환 중 적어도 하나의 변환 기능을 선택할 수 있으며, 각 변환 기능을 제어할 수 있도록 하는 사용자 인터페이스를 제공하는 단계; 및
    상기 사용자 인터페이스를 통해 선택된 하나 이상의 변환 기능을 순차적으로 상기 선택 영역 영상에 적용하는 단계; 및
    단일 변환 기능이 적용된 특성 변환 영상 및 둘 이상의 변환 기능이 누적 적용된 특성 변환 영상을 각각 학습용 데이터로서 저장하는 단계를 포함하며,
    상기 둘 이상의 변환 기능이 누적 적용된 특성 변환 영상은 누적 단계마다 학습용 데이터로서 저장되는 것인, 데이터 확장 방법.
  8. 제 6 항에 있어서,
    상기 특성 변환 영상을 생성하는 단계는,
    상기 변환 기능을 순차적으로 적용하기에 앞서 상기 선택 영역 영상을 제 1 색상 코드에서 제 2 색상 코드로 변환하는 제 1 색상 공간 변환을 수행하고,
    상기 제 1 색상 공간 변환된 영상에 대해 상기 변환 기능을 순차적으로 적용한 후 상기 제 2 색상 코드에서 상기 제 1 색상 코드로 재변환하는 제 2 색상 공간 변환을 수행하며,
    상기 제 2 색상 코드는 색상, 채도 및 밝기를 기준 축으로 하는 HSV공간의 코드인 것인 데이터 확장 방법.
  9. 영상 처리에서의 데이터 확장 장치에 있어서,
    영상 처리에서의 데이터 확장 프로그램이 저장된 메모리; 및
    상기 메모리에 저장된 프로그램을 실행하는 프로세서를 포함하며,
    상기 프로세서는 상기 데이터 확장 프로그램의 실행에 따라, 입력된 원본 영상에 대해 하나 이상의 영상 형태 변환 처리를 수행하여 복수의 형태 변환 영상을 생성하고, 상기 형태 변환 영상 별로 하나 이상의 선택 영역에 대한 정보를 추출하고, 추출된 정보에 대응하는 선택 영역 영상들을 생성하고, 상기 선택 영역 영상 별로 하나 이상의 영상 특성 변환 처리를 수행하여 복수의 특성 변환 영상을 생성하며, 상기 형태 변환 영상, 선택 영역 역상 및 특성 변환 영상을 기계학습용 데이터로서 저장하는, 데이터 확장 장치.
  10. 제 9 항에 있어서,
    상기 프로세서는,
    상기 영상 형태 변환 처리 시, 상기 원본 영상의 좌표를 하나 이상의 방향, 각도 및 거리를 각각 적용하여 이동시키는 이동 변환, 상기 원본 영상의 크기를 하나 이상의 크기에 따라 확대 및 축소시키는 크기 변환, 상기 원본 영상의 좌표를 하나 이상의 각도의 기울기를 적용하여 회전시키는 회전 변환, 및 상기 원본 영상의 외형을 하나 이상의 형태로 변형시키는 왜곡 변환 중 적어도 하나의 변환 기능을 적용하는, 데이터 확장 장치.
  11. 제 9 항에 있어서,
    상기 프로세서는,
    상기 선택 영역에 대한 정보를 추출 시, 상기 형태 변환 영상을 상기 원본 영상의 영역에 기준하여 범위를 교정 처리하고, 상기 교정 처리된 영상에 대해 하나 이상의 영역을 선택하고, 상기 선택된 영역에 대응하는 정보를 추출하여 대응하는 영상을 생성하는, 데이터 확장 장치.
  12. 제 9 항에 있어서,
    상기 프로세서는,
    상기 특성 변환 처리 시, 상기 선택 영역 영상의 적어도 일부 영역에 대해 밝기의 정도를 조절하는 밝기 변환, 상기 선택 영역 영상의 적어도 일부 영역에 대해 채도의 정도를 조절하는 채도 변환, 및 상기 선택 영역 영상의 적어도 일부 영역에 대해 색상의 스펙트럼을 변화시키는 색상 변환 중 적어도 하나의 변환 기능을 적용하는, 데이터 확장 장치.
  13. 제 9 항에 있어서,
    상기 프로세서는,
    상기 영상 형태 변환 처리 및 특성 변환 처리 별로, 단일 변환 기능이 적용된 특성 변환 영상 및 둘 이상의 변환 기능이 누적 적용된 특성 변환 영상을 각각 학습용 데이터로서 저장하되,
    상기 둘 이상의 변환 기능이 누적 적용된 특성 변환 영상은 누적 단계마다 학습용 데이터로서 저장되는 것인, 데이터 확장 장치.
  14. 제 1 항 내지 제 8 항 중 어느 하나에 포함된 방법을 실행하는 컴퓨터 프로그램이 기록된 기록 매체.
KR1020180056143A 2018-05-16 2018-05-16 영상 처리에서의 데이터 확장 방법 및 그 장치 KR102117563B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180056143A KR102117563B1 (ko) 2018-05-16 2018-05-16 영상 처리에서의 데이터 확장 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180056143A KR102117563B1 (ko) 2018-05-16 2018-05-16 영상 처리에서의 데이터 확장 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20190131366A true KR20190131366A (ko) 2019-11-26
KR102117563B1 KR102117563B1 (ko) 2020-06-02

Family

ID=68731584

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180056143A KR102117563B1 (ko) 2018-05-16 2018-05-16 영상 처리에서의 데이터 확장 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR102117563B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210080055A (ko) * 2019-12-20 2021-06-30 순천대학교 산학협력단 버섯 병해충 검출 시스템
KR20210116913A (ko) * 2020-03-18 2021-09-28 라온피플 주식회사 불량 이미지 생성 장치 및 방법
KR20230071967A (ko) 2021-11-17 2023-05-24 부산대학교 산학협력단 소규모 학습 데이터의 딥러닝 기반 물체 분류를 위한 데이터 확장을 위한 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100082683A (ko) * 2009-01-09 2010-07-19 삼정데이타서비스 주식회사 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법
KR20130073724A (ko) * 2011-12-23 2013-07-03 삼성전자주식회사 선택 영역을 변화시키는 결과 영상을 생성 또는 저장하는 장치 및 방법
KR20150140644A (ko) 2013-02-08 2015-12-16 이모션트 표정 인식을 위한 기계 학습 훈련 데이터의 수집

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100082683A (ko) * 2009-01-09 2010-07-19 삼정데이타서비스 주식회사 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법
KR20130073724A (ko) * 2011-12-23 2013-07-03 삼성전자주식회사 선택 영역을 변화시키는 결과 영상을 생성 또는 저장하는 장치 및 방법
KR20150140644A (ko) 2013-02-08 2015-12-16 이모션트 표정 인식을 위한 기계 학습 훈련 데이터의 수집

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210080055A (ko) * 2019-12-20 2021-06-30 순천대학교 산학협력단 버섯 병해충 검출 시스템
KR20210116913A (ko) * 2020-03-18 2021-09-28 라온피플 주식회사 불량 이미지 생성 장치 및 방법
KR20230071967A (ko) 2021-11-17 2023-05-24 부산대학교 산학협력단 소규모 학습 데이터의 딥러닝 기반 물체 분류를 위한 데이터 확장을 위한 장치 및 방법

Also Published As

Publication number Publication date
KR102117563B1 (ko) 2020-06-02

Similar Documents

Publication Publication Date Title
EP3350767B1 (en) Exposure-related intensity transformation
US11948279B2 (en) Method and device for joint denoising and demosaicing using neural network
CN108668093B (zh) Hdr图像的生成方法及装置
US7605847B2 (en) Digital camera having subject judgment function
US8086072B2 (en) System and method for capturing adjacent images by utilizing a panorama mode
US11508038B2 (en) Image processing method, storage medium, image processing apparatus, learned model manufacturing method, and image processing system
US20190335077A1 (en) Systems and methods for image capture and processing
US7580566B2 (en) Image processing device, image processing method, storage medium, and program
EP3487162B1 (en) Method, device and camera for blending a first and a second image having overlapping fields of view
US8050514B2 (en) Image processing apparatus and image processing method
US20050190986A1 (en) Image processing device, image projection apparatus, image processing method, recording medium, and computer data signal
JP2005141527A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
KR102117563B1 (ko) 영상 처리에서의 데이터 확장 방법 및 그 장치
US11336834B2 (en) Device, control method, and storage medium, with setting exposure condition for each area based on exposure value map
CN109495693A (zh) 摄像设备和方法、图像处理设备和方法、以及存储介质
CN116957948A (zh) 图像处理方法、电子产品和存储介质
KR20110138162A (ko) 화상 처리 장치, 화상 처리 방법 및 프로그램을 기록한 기록 매체
US20220318967A1 (en) Method and device for image processing, and storage medium
KR20230166870A (ko) 신경망 모델을 이용한 영상 신호 처리 방법 및 이를 수행하기 위한 컴퓨팅 장치
JP2006093757A (ja) 画像処理装置と撮像装置、および画像処理プログラム
US20220261970A1 (en) Methods, systems and computer program products for generating high dynamic range image frames
JP2019033470A (ja) 画像処理システム、撮像装置、画像処理装置、制御方法およびプログラム
JP2005142745A (ja) 画像処理プログラム、画像処理方法及び記録媒体
KR102195279B1 (ko) 리져널 와핑을 이용한 이미지 정합 방법 및 그 시스템
JP2006067155A (ja) 画像補正装置と撮像装置、および画像補正プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant