KR101890538B1

KR101890538B1 - 영상 변환 방법 및 장치

Info

Publication number: KR101890538B1
Application number: KR1020170183859A
Authority: KR
Inventors: 김원태; 강신욱; 이명재; 김동민; 김필수; 김종열; 노병필
Original assignee: (주)제이엘케이인스펙션; 대한민국(관세청장)
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2018-08-30
Also published as: WO2019132590A1

Abstract

영상에 포함된 객체의 분류 결과에 기초하여 선택된 참조 영상을 이용하여 영상을 변환하는 방법 및 장치가 개시된다. 본 개시의 일 실시 예에 따른 영상 변환 방법은 영상을 입력받는 영상 입력 단계, 상기 입력 영상에 포함된 객체를 분류하는 객체 분류 단계, 상기 객체 분류 단계의 분류 결과에 기초하여 참조 영상을 선택하는 참조 영상 선택 단계, 및 상기 선택된 참조 영상을 이용하여 상기 입력 영상 및 상기 객체에 관한 영상 중 적어도 하나를 변환하여 변환 영상을 생성하는 영상 변환 단계를 포함할 수 있다.

Description

영상 변환 방법 및 장치{METHOD AND APPARATUS FOR TRANSFORMING IMAGE}

본 개시는 영상 변환 방법 및 장치에 관한 것이다. 보다 구체적으로, 본 개시는 영상 특성 분류 기반의 영상 변환 방법 및 장치에 대한 것이다.

X-ray 영상은 CCD 카메라와 같은 일반적인 촬상 기기로 촬영하여 취득된 영상으로는 식별 및 검출이 불가능한 은닉된 제품 등을 촬영할 수 있으므로, 통관 시스템 또는 기업의 정보 보안 시스템 등에 활용되고 있다.

X-ray 영상을 통한 보안 검사는 검사자가 X-ray 영상을 일일이 확인하고, 부적합하거나 위험한 객체가 포함되어 있는지 여부를 판단하는 방식으로 수행된다. 따라서, X-ray 영상을 통한 보안 검사는 X-ray 영상을 판독하는 검사자의 숙련도에 따라 검사 결과에 있어 큰 차이를 보이게 된다.

한편, X-ray 영상의 경우, 사람이 일반적으로 보게 되는 이미지와 판이하게 다른 이미지를 보이므로, 검사자가 X-ray 영상을 통한 보안 검사 과정에 숙달되기까지는 많은 시간과 어려움이 수반된다.

본 개시의 기술적 과제는 영상 변환 방법 및 장치를 제공하는 것이다.

본 개시의 다른 기술적 과제는 X-ray 영상과 시각적으로 유사하게 보이도록 입력 영상을 변환하는 방법 및 장치를 제공하는 것이다.

본 개시에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 개시의 일 양상에 따르면 영상 변환 방법이 제공될 수 있다. 상기 방법은 영상을 입력받는 영상 입력 단계, 상기 입력 영상에 포함된 객체를 분류하는 객체 분류 단계, 상기 객체 분류 단계의 분류 결과에 기초하여 참조 영상을 선택하는 참조 영상 선택 단계, 및 상기 선택된 참조 영상을 이용하여 상기 입력 영상 및 상기 객체에 관한 영상 중 적어도 하나를 변환하여 변환 영상을 생성하는 영상 변환 단계를 포함할 수 있다.

본 개시의 다른 양상에 따르면 영상 변환 장치가 제공될 수 있다. 상기 장치는 영상을 입력받는 영상 입력부, 상기 입력 영상에 포함된 객체를 분류하는 객체 분류부, 상기 객체 분류부의 분류 결과에 기초하여 참조 영상을 선택하는 참조 영상 선택부, 및 상기 선택된 참조 영상을 이용하여 상기 입력 영상 및 상기 객체에 관한 영상 중 적어도 하나를 변환하여 변환 영상을 생성하는 영상 변환부를 포함할 수 있다.

본 개시의 또 다른 양상에 따르면 본 개시의 영상 변환 방법을 수행하기 위해 실행가능한 명령들(executable instructions)을 가지는 소프트웨어 또는 컴퓨터-판독가능한 매체(computer-readable medium)가 제공될 수 있다.

본 개시에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 개시의 상세한 설명의 예시적인 양상일 뿐이며, 본 개시의 범위를 제한하는 것은 아니다.

본 개시에 따르면, 영상 변환 방법 및 장치가 제공될 수 있다.

또한, 본 개시에 따르면, X-ray 영상과 시각적으로 유사하게 보이도록 입력 영상을 변환하는 방법 및 장치가 제공될 수 있다.

본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

도 1은 본 개시의 일 실시 예에 따른 영상 변환 장치의 구조를 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 영상 변환 장치의 동작을 설명하기 위한 도면이다.
도 3은 본 개시의 일 실시 예에 따른 영상 변환 방법을 설명하기 위한 도면이다.

이하에서는 첨부한 도면을 참고로 하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나, 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.

본 개시의 실시 예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 개시에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 개시에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 개시에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 개시의 범위 내에서 일 실시 예에서의 제1 구성요소는 다른 실시 예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 일 실시 예에서의 제2 구성요소를 다른 실시 예에서 제1 구성요소라고 칭할 수도 있다.

본 개시에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시 예도 본 개시의 범위에 포함된다.

본 개시에 있어서, 다양한 실시 예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 일 실시 예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시 예도 본 개시의 범위에 포함된다. 또한, 다양한 실시 예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시 예도 본 개시의 범위에 포함된다.

이하, 첨부한 도면을 참조하여 본 개시의 실시 예들에 대해서 설명한다.

도 1은 본 개시의 일 실시 예에 따른 영상 변환 장치의 구조를 설명하기 위한 도면이다.

영상 변환 장치(100)는 영상(110)을 입력 받아 변환 영상(160)을 출력할 수 있다. 이를 위해, 영상 변환 장치(100)는 데이터 전처리부(120), 객체 분류부(130), 참조 영상 선택부(140) 및/또는 영상 변환부(150)를 포함할 수 있다. 영상 변환 장치(100)가 포함하는 상기 각 구성부 중 일부는 생략되거나 그 기능이 다른 구성부에 통합되어 수행될 수 있다. 또는 하나의 구성부의 동작으로 설명된 둘 이상의 동작이 별개의 구성부에서 수행될 수도 있다.

데이터 전처리부(120)는 입력 영상(110)의 품질을 개선하기 위해 전처리(pre-processing)를 수행할 수 있다. 상기 전처리를 위해 고속 푸리에 변환 (Fast Fourier Transform, FFT), 히스토그램 평활화 (histogram equalization), 모션 아티팩트(motion artifact) 제거 및/또는 잡음(noise) 제거 등을 처리할 수 있는 영상 필터링 기술이 적용될 수 있다. 예컨대, 미디언 필터(median filter)를 적용하여 영상 촬영 중 발생할 수 있는 작은 크기의 잡음들을 제거할 수 있다. 또는 예컨대, FFT를 수행을 통해 특정 주파수 영역에 해당하는 성분을 강조함으로써 영상(110)의 품질을 개선할 수 있다. 구체적으로, FFT를 수행하여 고주파수 성분의 가중치를 높게 설정함으로써 영상(110)에 포함된 에지 성분을 강조할 수 있다.

데이터 전처리부(120)는 객체 영역 분할 기술을 적용함으로써 영상(110)에 포함된 객체들을 단일 객체로 분리할 수 있다. 상기 객체 영역 분할 기술은 객체의 영상 특성을 이용하는 분할 기술로서, 신경망 구조 학습을 통한 인공지능 기반의 영상 분할 기술(segmentation)을 포함할 수 있다. 데이터 전처리부(120)의 처리 결과로서, 영상(110)에 포함된 객체별로 단일 객체 영상이 생성될 수 있다.

영상 변환 장치(100)에 입력되는 영상(110)이 단일 객체 영상일 경우, 데이터 전처리부(120)는 생략될 수 있다. 즉, 영상 변환 장치(100)는 객체 분류부(130), 참조 영상 선택부(140) 및 영상 변환부(150)로 구성될 수 있다.

객체 분류부(130)는 단일 객체 영상을 입력받아 객체의 종류를 분류(classification)할 수 있다. 상기 분류를 위해 객체의 형태적 특징이 이용될 수 있다. 상기 분류를 위해 기계학습 기반의 분류 기술이 적용될 수 있다. 예를 들어, 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 및 합성곱 신경망 구조(Convolutional Neural Network, CNN) 중 적어도 하나를 이용하여 객체를 분류할 수 있다.

SVM은 기계 학습의 분야 중 하나로 패턴 인식 또는 자료 분석을 위한 지도 학습 모델이다. SVM은 주로 분류와 회귀 분석을 위해 사용될 수 있다. 두 카테고리 중 어느 하나에 속한 데이터의 집합이 주어졌을 때, SVM 알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 비확률적 이진 선형 분류 모델을 생성할 수 있다. 만들어진 분류 모델은 데이터가 사상된 공간에서 경계로 표현될 수 있으며, SVM 알고리즘은 그 중 가장 큰 폭을 가진 경계를 찾는 알고리즘이다.

에이다부스트는 기계 학습 메타 알고리즘의 하나로서, 성능을 향상시키기 위하여 다른 형태의 학습 알고리즘과 결합하여 사용될 수 있다. 다른 학습 알고리즘(약한 학습기, weak learner)의 결과물들에 가중치를 두어 더하는 방법으로 분류기의 최종 결과물을 표현할 수 있으며, 개별 학습기들의 성능이 떨어지더라도, 각각의 성능이 무작위 추정보다 조금이라도 우수한 경우, 최종 모델은 강한 학습기로 수렴될 수 있다.

합성곱 신경망 구조는 입력 데이터(영상)로부터 테두리, 선 색 등과 같은 “특징들(features)”을 추출하기 위해 이용될 수 있으며, 복수의 계층들(layers)을 포함할 수 있다. 각각의 계층은 입력 데이터를 수신하고, 해당 계층의 입력 데이터를 처리하여 출력 데이터를 생성할 수 있다. 합성곱 신경망은 입력된 영상 또는 입력된 특징맵(feature map)을 필터 커널들(filter kernels)과 컨볼루션하여 생성한 특징맵을 출력 데이터로서 출력할 수 있다. 합성곱 신경망의 초기 계층들은 입력으로부터 에지들 또는 그레디언트들과 같은 낮은 레벨의 특징들을 추출하도록 동작될 수 있다. 신경망의 다음 계층들은 눈, 코 등과 같은 점진적으로 더 복잡한 특징들을 추출할 수 있다. 합성곱 신경망은 컨볼루션 연산이 수행되는 합성곱 계층 외에도 풀링 연산이 수행되는 풀링 계층도 포함할 수 있다. 풀링 기법은 풀링 계층에서 데이터의 공간적 크기를 축소하는데 사용되는 기법이다. 구체적으로, 풀링 기법에는 해당 영역에서 최대값을 선택하는 맥스 풀링(max pooling) 기법과 해당 영역의 평균값을 선택하는 평균 풀링(average pooling) 기법이 있으며, 이미지 인식 분야에서는 일반적으로 맥스 풀링 기법이 사용된다. 풀링 기법에서는 일반적으로 풀링의 윈도우 크기와 간격(스트라이드, stride)을 같은 값으로 설정한다. 여기서, 스트라이드란 입력 데이터에 필터를 적용할 때 이동할 간격을 조절하는 것, 즉 필터가 이동할 간격을 의미하며, 스트라이드 또한 출력 데이터의 크기를 조절하기 위해 사용될 수 있다. 본 개시의 일 실시 예에 따라, 단일 객체 영상을 분류하기 위해 합성곱 신경망 구조를 학습할 수 있다. 상기 합성곱 신경망 구조에 대한 학습은 영상에 포함된 객체의 형태적 특징을 보다 명확히 학습하도록 수행될 수 있다.

참조 영상 선택부(140)는 객체 분류부(130)의 분류 결과에 기초하여 미도시의 참조 영상 저장부에 저장된 하나 이상의 참조 영상들로부터 하나의 참조 영상을 선택할 수 있다. 상기 참조 영상은 X-ray 영상일 수 있다. 상기 참조 영상은 X-Ray 영상 기기가 촬영한 로(raw) 이미지이거나 상기 로 이미지를 저장 또는 전송하기 위한 임의의 형태(포맷)의 이미지일 수 있다. 상기 영상은 X-Ray 판독 기기가 촬영하여 모니터와 같은 출력 장치로 전송하는 영상 정보를 캡쳐하여 데이터화함으로써 획득될 수도 있다. 참조 영상 저장부에 저장된 참조 영상들은 범주화(categorization)되거나 데이터 베이스화되어 저장될 수 있다. 상기 객체 분류부(130)로부터 객체의 분류 결과를 입력 받으면, 참조 영상 선택부(140)는 객체의 분류 결과를 범주화함으로써 해당 객체와 관련된 참조 영상을 선택할 수 있다.

영상 변환부(150)는 선택된 참조 영상과 단일 객체 영상을 이용하여 변환 영상을 생성할 수 있다. 객체의 형태적 특징은 X-ray 참조 영상을 따르도록 점진적으로 업데이트될 수 있다. 이를 위해, 최적화 함수를 설계할 수 있다. 상기 함수는 단일 객체 영상 내 객체의 형태를 표현하는 항과 X-ray 참조 영상의 특징을 표현하는 항의 가중합으로 설계할 수 있다.

형태를 표현하는 항의 경우, 합성곱 신경망의 필터 응답 간의 차이를 이용하여 구성할 수 있다. 이때, 단일 객체 영상과 최종 변환 영상의 합성곱 신경망 필터 응답의 차이를 최소화할 수 있도록 해당 loss를 최소화하는 방향으로 항을 설계할 수 있다. loss가 최소화되도록 설계된 항은 영상을 최대한 잘 복원할 수 있도록 설계된 항이라고 볼 수 있다.

X-ray 참조 영상의 특징을 표현하는 항의 경우, 합성곱 신경망의 각 레이어의 필터 간 코릴레이션(correlation)을 최소화하는 loss로 항을 설계할 수 있다. 이렇게 설계된 X-ray 참조 영상의 특징을 표현하는 항은 영상의 디테일한 특징이 아닌 X-ray 영상의 전반적인 특징을 표현할 수 있는 항이라고 볼 수 있다.

상기 두 loss의 가중합을 이용하여 최종 loss 함수를 설계하고, 이를 최소화하는 영상을 최종 변환 영상으로 획득할 수 있다.

도 2는 본 개시의 일 실시 예에 따른 영상 변환 장치의 동작을 설명하기 위한 도면이다.

입력 영상(210)은 객체로서 예컨대, 비타민 병과 치약 튜브를 포함할 수 있다. 본 개시의 영상 변환 장치의 데이터 전처리부(120)는 입력 영상(210)에 대해 데이터 전처리를 수행함으로써, 단일 객체 영상(220, 260)을 생성할 수 있다. 객체 분류부(130)는 단일 객체 영상(220, 260)에 포함된 객체에 대해 분류를 수행함으로써 각 객체에 대해 “Vitamin”(230)과 “Toothpaste”(270)라는 분류 결과를 출력할 수 있다. 참조 영상 선택부(140)는 객체 분류부(130)의 분류 결과(230, 270)에 기초하여 참조 영상 저장부로부터 참조 영상(240, 280)을 선택할 수 있다. 참조 영상(240, 280)은 X-ray 영상일 수 있다. 영상 변환부(150)는 단일 객체 영상(220, 260)과 참조 영상(240, 280)을 이용하여 영상 변환을 수행함으로써 변환 영상(250, 290)을 생성할 수 있다. 변환 영상(250, 290)은 X-ray 영상과 시각적으로 유사하게 보이도록 단일 객체 영상(220, 260)을 변환한 영상일 수 있다.

도 3은 본 개시의 일 실시 예에 따른 영상 변환 방법을 설명하기 위한 도면이다.

S310 단계에서, 영상 변환의 대상이 되는 영상이 입력될 수 있다. 입력 영상은 S320 단계의 데이터 전처리 과정을 거칠 수 있다. 데이터 전처리 과정에서는 영상의 품질을 개선하기 위한 전처리가 수행될 수 있다. 또한, 객체 영역 분할 기술을 적용함으로써, 입력 영상에 포함된 객체들을 단일 객체로 분리할 수 있다. S320 단계의 결과로서, 단일 객체를 포함하는 단일 객체 영상이 생성될 수 있다. S310 단계의 입력 영상이 단일 객체 영상인 경우, S320 단계의 데이터 전처리 과정은 수행되지 않을 수 있다. S330 단계에서, 단일 객체 영상에 포함된 객체의 종류를 분류할 수 있다. 상기 분류를 위해 객체의 형태적 특징을 이용한 기계학습 기반의 분류 기술이 적용될 수 있다. S340 단계에서, S330 단계의 분류 결과에 기초하여, 참조 영상을 선택할 수 있다. S350 단계에서, 선택된 참조 영상을 이용하여 단일 객체 영상을 변환함으로써 변환 영상을 생성할 수 있다.

본 개시에 따르면, 검사자가 보다 직관적으로 판독 업무를 수행할 수 있도록 기계 학습 기반으로 영상을 변환해 줌으로써 작업 효율성이 제고될 수 있고, 숙련된 검사자의 부족으로 인해 발생하였던 기존 업무의 난이도를 낮추어 인력 부족 문제를 해소시킬 수 있다.

본 개시에 따르면, 딥러닝 기반의 모델은 완전 합성곱 신경망(완전 컨볼루션 뉴럴 네트워크, fully convolutional neural network), 합성곱 신경망(컨볼루션 뉴럴 네트워크, convolutional neural network), 순환 신경망(회귀 뉴럴 네트워크, recurrent neural network), 제한 볼츠만 머신(restricted Boltzmann machine, RBM) 및 심층 신뢰 신경망(deep belief neural network, DBN) 중 적어도 하나를 포함할 수 있으나, 이에 제한되지 않는다. 또는, 딥러닝 이외의 머신 러닝 방법도 포함할 수 있다. 또는 딥러닝과 머신 러닝을 결합한 하이브리드 형태의 모델도 포함할 수 있다. 예컨대, 딥러닝 기반의 모델을 적용하여 영상의 특징을 추출하고, 상기 추출된 특징에 기초하여 영상을 분류하거나 인식할 때는 머신 러닝 기반의 모델을 적용할 수도 있다. 머신 러닝 기반의 모델은 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 등을 포함할 수 있으나, 이에 한정되지 않는다.

본 개시의 예시적인 방법들은 설명의 명확성을 위해서 동작의 시리즈로 표현되어 있지만, 이는 단계가 수행되는 순서를 제한하기 위한 것은 아니며, 필요한 경우에는 각각의 단계가 동시에 또는 상이한 순서로 수행될 수도 있다. 본 개시에 따른 방법을 구현하기 위해서, 예시하는 단계에 추가적으로 다른 단계를 포함하거나, 일부의 단계를 제외하고 나머지 단계를 포함하거나, 또는 일부의 단계를 제외하고 추가적인 다른 단계를 포함할 수도 있다.

본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.

또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.

본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.

100 : 영상 변환 장치
120 : 데이터 전처리부
130 : 객체 분류부
140 : 참조 영상 선택부
150 : 영상 변환부

Claims

영상을 입력받는 영상 입력부;
상기 입력 영상에 포함된 객체를 분류하는 객체 분류부;
상기 객체 분류부의 분류 결과에 기초하여 상기 분류된 객체에 관한 참조 영상을 선택하는 참조 영상 선택부; 및
상기 선택된 참조 영상을 이용하여 상기 입력 영상 및 상기 객체에 관한 영상 중 적어도 하나를 변환하여 변환 영상을 생성하는 영상 변환부를 포함하는 영상 변환 장치.
제1항에 있어서,
상기 객체 분류부는 데이터 전처리부를 포함하고,
상기 데이터 전처리부는,
상기 입력 영상에 필터링 및 영상 분할(segmentation) 중 적어도 하나를 수행하여 하나의 객체를 포함하는 단일 객체 영상을 출력하고,
상기 영상 분할은 인공지능 기반 영상 분할 기법을 이용하여 상기 입력 영상에 포함된 단일 객체를 분리함으로써 상기 단일 객체 영상을 생성하는 영상 변환 장치.
제2항에 있어서,
상기 객체 분류부는,
상기 단일 객체 영상에 포함된 객체를 분류하기 위해 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 및 합성곱 신경망 구조(Convolutional Neural Network, CNN) 중 적어도 하나를 이용하는 영상 변환 장치.
영상을 입력받는 영상 입력 단계;
상기 입력 영상에 포함된 객체를 분류하는 객체 분류 단계;
상기 객체 분류 단계의 분류 결과에 기초하여 상기 분류된 객체에 관한 참조 영상을 선택하는 참조 영상 선택 단계; 및
상기 선택된 참조 영상을 이용하여 상기 입력 영상 및 상기 객체에 관한 영상 중 적어도 하나를 변환하여 변환 영상을 생성하는 영상 변환 단계를 포함하는 영상 변환 방법.
제4항에 있어서,
상기 객체 분류 단계는 데이터 전처리 단계를 포함하고,
상기 데이터 전처리 단계는,
상기 입력 영상에 필터링 및 영상 분할(segmentation) 중 적어도 하나를 수행하여 하나의 객체를 포함하는 단일 객체 영상을 출력하는 단계를 포함하고,
상기 영상 분할은 인공지능 기반 영상 분할 기법을 이용하여 상기 입력 영상에 포함된 단일 객체를 분리함으로써 상기 단일 객체 영상을 생성하는 영상 변환 방법.
제5항에 있어서,
상기 객체 분류 단계는,
상기 단일 객체 영상에 포함된 객체를 분류하기 위해 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 및 합성곱 신경망 구조(Convolutional Neural Network, CNN) 중 적어도 하나를 이용하는 영상 변환 방법.
프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체로서,
상기 프로그램은,
영상을 입력받는 영상 입력 단계;
상기 입력 영상에 포함된 객체를 분류하는 객체 분류 단계;
상기 객체 분류 단계의 분류 결과에 기초하여 상기 분류된 객체에 관한 참조 영상을 선택하는 참조 영상 선택 단계; 및
상기 선택된 참조 영상을 이용하여 상기 입력 영상 및 상기 객체에 관한 영상 중 적어도 하나를 변환하여 변환 영상을 생성하는 영상 변환 단계를 수행하는 컴퓨터로 판독 가능한 기록 매체.