KR20190117841A - 검출 반복성을 최대화 하는 특징점 선별방법 - Google Patents

검출 반복성을 최대화 하는 특징점 선별방법 Download PDF

Info

Publication number
KR20190117841A
KR20190117841A KR1020180034870A KR20180034870A KR20190117841A KR 20190117841 A KR20190117841 A KR 20190117841A KR 1020180034870 A KR1020180034870 A KR 1020180034870A KR 20180034870 A KR20180034870 A KR 20180034870A KR 20190117841 A KR20190117841 A KR 20190117841A
Authority
KR
South Korea
Prior art keywords
feature point
feature
feature points
point detection
detected
Prior art date
Application number
KR1020180034870A
Other languages
English (en)
Other versions
KR102127855B1 (ko
Inventor
이상철
김희수
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020180034870A priority Critical patent/KR102127855B1/ko
Publication of KR20190117841A publication Critical patent/KR20190117841A/ko
Application granted granted Critical
Publication of KR102127855B1 publication Critical patent/KR102127855B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • G06K9/4671
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Image Analysis (AREA)

Abstract

일 실시예에 따른 특징점 검출 방법은, 각각의 프레임으로부터 적어도 하나 이상의 특징점을 검출하는 단계; 및 상기 검출된 특징점에 대하여 딥러닝을 이용하여 기 설정된 기준 이상의 반복적 검출율을 갖는 특징점을 선별하는 단계를 포함할 수 있다.

Description

검출 반복성을 최대화 하는 특징점 선별방법{FEATURE SELECTION METHOD WITH MAXIMUM REPEATABILITY}
아래의 설명은 이미지에서 특징점을 검출하는 기술에 관한 것이다.
영상에서 특징점은 이미지 정합, 3D 모델링 등 다양한 기술의 기본이 되는 요소이다. 특징점의 차원이 높으면 연산량이 증가하지만 보다 정확하게 특징점을 나타낼 수 있는 반면 특징점의 차원이 낮으면 정확도는 비교적 감소하지만 빠른 결과 도출이 가능하다.
HOG(Histogram of Oriented Gradient)는 이미지의 그래디언트를 계산한 후 로컬 히스토그램을 이용하여 얻은 벡터 값으로 특징점을 기술하는 알고리즘으로 정적 이미지에서 보행자 인식에 뛰어난 성능을 보인다. Viola-jones얼굴 검출 알고리즘은 적분 이미지(integral image)를 이용하여 특징점 영역의 값을 빠르게 계산함으로써 특징점 기술에 필요한 시간을 크게 단축시켰다. 이렇듯 각 어플리케이션에 적합한 특징이 다르게 존재하며 여전히 모든 어플리케이션에 적합한 이상적인 특징점은 존재하지 않는다.
특징점의 성능을 판별할 수 있는 요소로서 지역성(locality), 차별성(distinctiveness), 정확성(accuracy), 특징점의 수(quantity)와 반복성(repeatability) 등이 있다. 지역성은 두 프레임의 시점 변화로 인해 특징점이 가려지지 않는 것이다. 차별성은 다른 특징점과 구별되기 위하여 특징점 벡터 값의 차이가 충분히 큰 것이며 정확성은 특징점이 위치, 크기, 모양에 따라 알맞게 검출되는 것이다. 특징점의 수는 각 프레임에서 충분히 많은 양의 특징점이 검출되어 매칭 등의 작업이 적절히 진행되도록 하는 것이다. 마지막으로 반복성은 한번 검출된 특징점이 다른 프레임에서도 계속해서 나타나는 특성이다.
SIFT(Scale Invariant Feature Transform)는 가장 널리 쓰이는 특징점 검출 및 기술 알고리즘 중 하나로 DoG(Difference of Gaussian) 옥타브를 생성하여 크기에 불변하는 관심점을 찾고 히스토그램을 토대로 회전에 불변하는128차원 벡터를 기술하는 특징점이다. 또한 반복성(repeatability) 측면에서도 우수한 성능을 보이는 알고리즘이다. 그러나 연산 시간이 많이 소요되어 효율성이 떨어지기 때문에 다양한 파생 알고리즘이 제안되었다. SURF는 적분 이미지를 사용하고 이미지 대신 필터의 크기를 변화시켜 속도를 향상시켰다. PCA-SIFT는 PCA를 사 용하여 벡터의 차원을 상당량 감소시켜 효율성을 증대시켰다. N-SIFT는 3차원과 4차원의 이미지에서 기존의 SIFT보다 효율적으로 동작하는 알고리즘을 제안하였다.
그러나 대부분의 제시된 방법은 각 특징점 벡터를 효율적으로 표현하는 방법만을 제안하였으며 특징점이 다량 검출되는 경우 여전히 연산 비용이 높기 때문에 근본적인 연산의 효율성 문제를 해결하였다고 보기 어렵다.
참고자료: KR10-1657495, KR10-2017-0070715
복수의 특징점이 검출되는 상황에서 딥러닝을 이용하여 반복성이 우수한 특징점만을 선별하는 방법을 제공할 수 있다.
특징점 검출 시스템에서 수행되는 특징점 검출 방법은, 각각의 프레임으로부터 적어도 하나 이상의 특징점을 검출하는 단계; 및 상기 검출된 특징점에 대하여 딥러닝을 이용하여 학습함에 따라 기 설정된 기준 이상의 반복적 검출율을 갖는 특징점을 선별하는 단계를 포함할 수 있다.
상기 특징점을 선별하는 단계는, 상기 검출된 특징점의 크기를 이용하여 추출한 패치를 CNN에 학습시키는 단계를 포함할 수 있다.
상기 특징점을 선별하는 단계는, 상기 각각의 프레임을 조합함에 따라 각각의 프레임에 존재하는 특징점들을 매칭하고, 상기 특징점이 매칭된 횟수를 레이블로 하여 상기 특징점에 대하여 매칭되지 않은 특징점 그룹 또는 기 설정된 횟수 이상 매칭된 특징점 그룹으로 분류하는 단계를 포함할 수 있다.
상기 특징점을 선별하는 단계는, 상기 검출된 특징점에 대하여 SIFT 계산을 수행함에 따라 획득된 벡터값을 RNN을 이용하여 학습시키는 단계를 포함할 수 있다.
상기 특징점을 검출하는 단계는, 각각의 프레임에 대하여 SIFT 알고리즘을 이용하여 적어도 하나 이상의 특징점을 검출하는 단계를 포함할 수 있다.
상기 CNN은, 두 개의 컨볼루션 레이어(convolution layer)와 네 개의 완전 연결 레이어(fullyconnected layer)로 구성되고, 상기 컨볼루션 레이어는,
Figure pat00001
의 컨볼루션 레이어 및
Figure pat00002
의 컨볼루션 레이어를 포함하고, 상기 완전 연결 레이어는, 1X1X128의 완전 연결 레이어, 1X1X256의 완전 연결 레이어, 1X1X512의 완전 연결 레이어 및 소프트 맥스 레이어를 포함할 수 있다.
일 실시예에 따른 특징점 검출 시스템은 반복성이 우수한 소수의 특징점에 대하여 딥러닝을 이용하여 선별함으로써 이미지 정합 등 다량의 특징점이 검출되는 경우 비효율적으로 실행되는 어플리케이션에서의 효율성을 높일 수 있다.
또한, 특징점 검출 시스템은 딥러닝을 이용하여 반복적 검출율이 높은 특징점을 선별하기 때문에 계산량을 감소시킬 수 있다.
도 1은 일 실시예에 따른 특징점 검출 시스템의 구성을 설명하기 위한 블록도이다.
도 2는 일 실시예에 따른 특징점 검출 시스템의 특징점 검출 방법을 설명하기 위한 흐름도이다.
도 3은 일 실시예에 따른 특징점 검출 시스템에서 CNN을 수행하여 특징점을 선별하는 방법을 설명하기 위한 예이다.
도 4는 일 실시예에 따른 특징점 검출 시스템에서 매칭 횟수에 대한 특징점의 수를 나타낸 그래프이다.
도 5는 일 실시예에 따른 특징점 검출 시스템의 특징점 선별의 예를 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 특징점 검출 시스템의 교차 검증 결과를 나타낸 그래프이다.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.
아래의 실시예에서는 효과적인 특징점 선별을 통해 다양한 어플리케이션의 효율성을 높이기 위하여 딥러닝을 사용한 반복적 검출율이 높은 특징점을 선별하는 방법을 설명하기로 한다. 특히, 종래에 특징점을 검출하는데 초점이 맞추어져 있던 것에 반해, 반복적 검출율이 높은 특징점을 선별하는 방법에 대하여 상세히 설명하기로 한다.
도 1은 일 실시예에 따른 특징점 검출 시스템의 구성을 설명하기 위한 블록도이고, 도 2는 일 실시예에 따른 특징점 검출 시스템의 특징점 검출 방법을 설명하기 위한 흐름도이다.
특징점 검출 시스템(100)의 프로세서는 검출부(110) 및 선별부(120)를 포함할 수 있다. 이러한 프로세서의 구성요소들은 특징점 검출 시스템에 저장된 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 프로세서 및 프로세서의 구성요소들은 도 2의 특징점 검출 방법이 포함하는 단계들(210 내지 220)을 수행하도록 특징점 검출 시스템을 제어할 수 있다. 이때, 프로세서 및 프로세서의 구성요소들은 메모리가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.
프로세서는 특징점 검출 방법을 위한 프로그램의 파일에 저장된 프로그램 코드를 메모리에 로딩할 수 있다. 예를 들면, 특징점 검출 시스템에서 프로그램이 실행되면, 프로세서는 운영체제의 제어에 따라 프로그램의 파일로부터 프로그램 코드를 메모리에 로딩하도록 특징점 검출 시스템을 제어할 수 있다. 이때, 프로세서 및 프로세서가 포함하는 검출부(110) 및 선별부(120) 각각은 메모리에 로딩된 프로그램 코드 중 대응하는 부분의 명령을 실행하여 이후 단계들(210 내지 220)을 실행하기 위한 프로세서의 서로 다른 기능적 표현들일 수 있다.
단계(210)에서 검출부(110)는 각각의 프레임으로부터 적어도 하나 이상의 특징점을 검출할 수 있다. 예를 들면, 검출부(110)는 이미지에 존재하는 각각의 프레임에 대하여 SIFT 알고리즘을 이용하여 적어도 하나 이상의 특징점을 검출할 수 있다. 이때, 검출부(110)는 SIFT뿐만 아니라 ORB 등 다양한 특징 추출 알고리즘을 통하여 특징점을 검출할 수 있다.
단계(220)에서 선별부(120)는 검출된 특징점에 대하여 딥러닝을 이용하여 학습함에 따라 기 설정된 기준 이상의 반복적 검출율을 갖는 특징점을 선별할 수 있다. 이때, 반복적 검출율이란 각각의 프레임으로부터 추출되는 특징점이 기 설정된 기준 이상인 것을 의미할 수 있다. 더욱 구체적으로, 일례로, 선별부(120)는 검출된 특징점의 크기를 이용하여 추출한 이미지 패치를 CNN에 학습시킬 수 있다. 선별부(120)는 각각의 프레임을 조합함에 따라 각각의 프레임에 존재하는 특징점들을 매칭하고, 특징점이 매칭된 횟수를 레이블로 하여 특징점에 대하여 매칭되지 않은 특징점 그룹 또는 기 설정된 횟수 이상 매칭된 특징점 그룹으로 분류할 수 있다. 또는, 선별부(120)는 검출된 특징점에 대하여 SIFT 계산을 수행함에 따라 획득된 벡터값을 RNN을 이용하여 학습시킬 수 있다. 또는, 선별부(120)는 검출된 특징점에 대하여 DBN을 이용하여 학습시킬 수도 있다. 이와 같이, 선별부(120)는 검출된 특징점에 대하여 딥러닝 학습을 수행함으로써 반복적 검출율이 높은 특징점을 선출할 수 있다.
도 3은 일 실시예에 따른 특징점 검출 시스템에서 CNN을 수행하여 특징점을 선별하는 방법을 설명하기 위한 예이다.
특징점 검출 시스템은 이미지의 각 프레임에 대해 특징 추출 알고리즘을 적용하여 특징점을 검출하고, 검출된 특징점에 대한 딥러닝을 수행함으로써 매칭되지 않은 특징점 그룹과 특정 횟수 이상 매칭된 특징점 그룹으로 분류할 수 있다.
특징점 검출 시스템은 SIFT를 통하여 이미지로부터 특징점을 검출할 수 있다. 다시 말해서, 특징점 검출 시스템은 이미지에 포함된 각각의 이미지로부터 SIFT에 기반하여 특징점을 검출할 수 있다. 특징점 검출 시스템은 검출된 특징점을 딥러닝을 이용하여 반복적 검출율이 높은 특징점을 선별할 수 있다. 딥러닝이란 컴퓨터가 여러 데이터를 이용하여 마치 사람처럼 스스로 학습할 수 있게 하기 위해 인공 신경망(ANN: Artificial Neural Network)을 기반으로 하는 기계 학습 기술을 의미한다. 딥러닝은 인간의 두뇌를 모델로 하는 인공 신경망(ANN)을 기반으로 한다. 이에 따라 컴퓨터가 특정 업무를 수행할 때 정형화된 데이터를 입력받지 않고 스스로 필요한 데이터를 수집/분석하게 하여 고속으로 처리할 수 있도록 한다.
특징점 검출 시스템은 CNN(Convolutional Neural Network), RNN(Deep Neural Network) 등 다양한 방식의 딥러닝을 이용하여 반복적 검출율이 높은 특징점을 선별할 수 있다. 이때, 반복적 검출율이란 특징점이 기 설정된 횟수 이상 반복적으로 검출되는 것을 의미할 수 있다. 다시 말해서, 특징점 검출 시스템은 기 설정된 횟수 이상 검출되는 특징점을 선별하게 된다. 도 3에서는 CNN을 이용하여 특정점을 반복성에 따라 분류하기 위하여 각 특징점의 반복성에 따라 레이블하고 CNN의 입력값으로 사용하기 위한 이미지 패치 검출 방법을 제안한다.
우선적으로, 이미지가 입력될 수 있다(310). 이미지의 각각의 프레임으로부터 SIFT에 기반하여 특징점을 검출할 수 있다. 이때, m(m은 자연수)개의 이미지에 대하여 총
Figure pat00003
번의 비교를 통해 모든 이미지의 조합의 특징점을 비교한 후 각 특징점이 매칭된 총 횟수 n(n은 자연수)를 정의할 수 있다.
SIFT에 기반하여 검출된 특징점을 1차원 벡터로 기술하는 과정에서 정보의 손실이 발생하기 때문에 더 많은 정보를 가지는 이미지 패치를 CNN의 입력으로 하여 학습의 신뢰성을 높일 수 있다. 특징점 검출 시스템은 특징점의 좌표 정보, 크기 정보 등을 이용하여 주어진 좌표를 중심으로 관련된 크기 정보에 따라 이미지 패치를 획득할 수 있다. 이때, 크기 정보를 CNN의 학습을 위하여 정규화하고 매칭 횟수를 n으로 레이블할 수 있다.
특징점 검출 시스템은 SIFT에 기반하여 검출된 특징점의 크기를 이용하여 추출한 이미지 패치를 입력으로 CNN 모델을 학습할 수 있다. 특징점 검출 시스템은 한번도 매칭되지 않았던 특징점들로부터 이루어진 기 설정된 기준 이하의 낮은 반복성을 갖는 그룹과 기 설정된 기준(예를 들면, x(x는 자연수)번) 이상 매칭된 특징점의 그룹인 높은 반복성을 갖는 그룹으로 분류할 수 있다.
실시예에서 제안하는 CNN은 두 개의 컨볼루션 레이어(convolution layer)(320)와 네 개의 완전 연결 레이어(fullyconnected layer)(330)로 구성될 수 있다. 효과적인 이미지 분류를 위해 AlexNet을 기반으로 도 3과 같이 크게 6개의 레이어로 구성할 수 있다. 먼저,
Figure pat00004
의 크기가 정규화된 이미지 패치가 입력될 수 있다(310).
이미지 패치가 입력됨에 따라
Figure pat00005
의 컨볼루션 레이어(convolution layer)를 구성할 수 있다. 그리고
Figure pat00006
의 max pooling 레이어를 거쳐 ReLu 레이어를 적용시킨다. 두 번째 컨볼루션 레이어(convolution 레이어)에서는 첫 번째 컨볼루션 레이어와 동일하나 필터를 256개 적용하며 마지막에 과적합 방지를 위한dropout레이어를 추가할 수 있다.
또한, 세 층의 완전 연결 레이어(fullyconnected layer)는 각각 출력 크기를 1X1X128, 1X1X256, 1X1X512로 설정하고, 각각의 세 층의 완전 연결 레이어에 ReLu 레이어와 dropout 레이어를 함께 사용할 수 있다. 마지막 단계에 소프트 맥스(soft max)레이어를 통해 두 개의 그룹으로 분류하도록 설계될 수 있다. 이와 같이, 입력된 이미지에 대하여 CNN을 이용하여 학습시킴으로써 반복성이 높은 특징을 선별할 수 있게 된다.
또는, 이미지로부터 특징점을 추출하고, 추출된 특징점에 대하여 SIFT 계산을 수행함에 따라 벡터값을 획득하고, 획득된 벡터값을 RNN(RNN: Recurrent Neural Network)에 기반한 학습을 수행함에 따라 반복성이 높은 특징을 선별할 수 있다.
또는, 이미지로부터 추출된 특징점에 대하여 DBN(Deep Belief Nets)를 이용하여 학습을 수행함에 따라 반복성이 높은 특징을 선별할 수 있다.
또한, 앞서 설명한 딥러닝에 한정되는 것은 아니며, 이외에도 다양한 딥러닝을 적용하여 특징점으로부터 반복성이 높은 특징점을 선별할 수 있다. 다시 말해서, 오래 살아남는 특징점, 즉, 의미있는 특징점을 추출하게 된다.
일 실시예에 따른 특징점 검출 시스템은 전체의 프레임의 조합에 대해 특징점을 매칭하고 각 특징점이 매칭된 횟수를 레이블로 하여 한번도 매칭되지 않은 그룹과 특정 횟수 이상 매칭된 그룹으로 분류할 수 있다. 이때, 특징점 검출 시스템은 두 특징점 그룹의 이미지 패치를 딥러닝으로 학습하여 교차 검증한 결과 두 그룹을 보다 정확하고 빠르게 분류할 수 있다. 또한, 특징점 검출 시스템은 특징점에 대하여 딥러닝을 수행함으로써 계산량을 감소시킬 수 있다. 또한, 이러한 특징점 검출 시스템은 자율주행 차량, 카메라 등 다양한 분야에 적용될 수 있다.
도 4는 일 실시예에 따른 특징점 검출 시스템에서 매칭 횟수에 대한 특징점의 수를 나타낸 그래프이다. 일례로, parrot사의 bebop2 드론으로 촬영한
Figure pat00007
해상도의 비디오를 데이터 셋으로 사용할 수 있다. 이미지 간의 구별되는 차이를 두기 위하여 프레임 비율은 2fps로 설정하여 총 100장의 연속된 이미지를 사용할 수 있다. VLFeat 라이브러리를 이용하여 SIFT에 기반한 특징점을 검출한 결과 각 이미지 프레임에서는 평균적으로 9,000개가 검출되었다고 가정하자.
이와 같이 검출된 특징점을 매칭시킨 매칭 결과는 도 4의 그래프와 같이 나타낼 수 있다. 이때, 총 1,340,532개의 특징점이 검출되었으며 그 중 단 한번도 매칭되지 않은 특징점의 개수는 전체의 34.65%에 해당하는 464,607개임을 확인할 수 있다. 그리고 매칭 횟수가 늘어날수록 그에 해당하는 특징점의 개수는 감소하는 것을 확인할 수 있다. 이때, 40번 이상 매칭된 반복성이 우수한 특징점은 57,149개이며 전체의 5%미만으로 상당히 적은 것을 확인할 수 있다.
특징점 검출 시스템은 기 설정된 횟수 이상의 반복성, 즉, 높은 반복성을 가지는 그룹은 매칭 수
Figure pat00008
이 40번 이상인 특징점으로 구성할 수 있다. 한 번도 매칭이 되지 않았던 특징점 그룹과 40번 이상 매칭된 우수한 반복성을 보인 특징점 그룹으로 분류할 수 있다. 그리고 신경망을 학습시키기 위하여 총 10,000개의 이미지 패치를 임의로 선정할 수 있다. 그 결과 도 4에서 도시된 바와 같이 이미지 특징점의 개수를 10,455개에서 2,024개로 80% 가량 감소되었음을 확인할 수 있다. 또한, 도 6을 참고하면, 결과의 신뢰도를 위하여 30번의 실험 수행을 통하여 평균적으로 89%의 정확도를 보인 것을 확인할 수 있다. 이것을 통해 반복성이 높은 특징점의 이미지 패치와 반복성이 낮은 특징점의 이미지 패치는 CNN을 이용해서 학습이 가능한 차이를 가지는 것을 확인할 수 있다.
도 5는 일 실시예에 따른 특징점 검출 시스템의 특징점 선별의 예를 설명하기 위한 도면이다. 도 5(a)는 종래의 SIFT 알고리즘을 이용하여 검출한 특징점을 시각화한 것이고, 도5(b)는 딥러닝을 이용하여 선별한 반복성이 높은 특징점을 시각화한 것이다. 예를 들면, 복수의 프레임에 대하여 하나의 이미지를 제작함에 있어서, 각각의 프레임의 특징점에 기초하여 특징점을 매칭함에 따라 프레임을 조합함으로써 하나의 이미지를 생성할 수 있다. 이때, 프레임에서 컴퓨터가 인지할 수 있는 눈에 띄는 특징점끼리 매칭시키고 이동하는 방식을 수행함으로써 이미지를 생성할 수 있다. 이러한 방식을 수행할 때, 특징점 검출 시스템은 각각의 프레임에 반복적으로 추출되는 특징점에 대하여 강건한 특징점으로 예측할 수 있다. 다시 말해서, 도 5(a)와 도 5(b)를 비교해볼 때, 도 5(b)에 존재하는 특징점들이 의미있는 특징점임을 예측할 수 있다. 이에 따라, 특징점 검출 시스템은 특징점의 수명, 즉, 오래 남아있는 특징점을 예측할 수 있게 된다.
일 실시예에 따른 특징점 검출 시스템은 반복성이 우수한 소수의 특징점에 대하여 딥러닝(예를 들면, CNN)을 이용하여 선별함으로써 이미지 정합 등 다량의 특징점이 검출되는 경우 비효율적으로 실행되는 어플리케이션에서 효율성을 높일 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (6)

  1. 특징점 검출 시스템에서 수행되는 특징점 검출 방법에 있어서,
    각각의 프레임으로부터 적어도 하나 이상의 특징점을 검출하는 단계; 및
    상기 검출된 특징점에 대하여 딥러닝을 이용하여 학습함에 따라 기 설정된 기준 이상의 반복적 검출율을 갖는 특징점을 선별하는 단계
    를 포함하는 특징점 검출 방법.
  2. 제1항에 있어서,
    상기 특징점을 선별하는 단계는,
    상기 검출된 특징점의 크기를 이용하여 추출한 패치를 CNN에 학습시키는 단계
    를 포함하는 특징점 검출 방법.
  3. 제2항에 있어서,
    상기 특징점을 선별하는 단계는,
    상기 각각의 프레임을 조합함에 따라 각각의 프레임에 존재하는 특징점들을 매칭하고, 상기 특징점이 매칭된 횟수를 레이블로 하여 상기 특징점에 대하여 매칭되지 않은 특징점 그룹 또는 기 설정된 횟수 이상 매칭된 특징점 그룹으로 분류하는 단계
    를 포함하는 특징점 검출 방법.
  4. 제1항에 있어서,
    상기 특징점을 선별하는 단계는,
    상기 검출된 특징점에 대하여 SIFT 계산을 수행함에 따라 획득된 벡터값을 RNN을 이용하여 학습시키는 단계
    를 포함하는 특징점 검출 방법.
  5. 제1항에 있어서,
    상기 특징점을 검출하는 단계는,
    각각의 프레임에 대하여 SIFT 알고리즘을 이용하여 적어도 하나 이상의 특징점을 검출하는 단계
    를 포함하는 특징점 검출 방법.
  6. 제2항에 있어서,
    상기 CNN은,
    두 개의 컨볼루션 레이어(convolution layer)와 네 개의 완전 연결 레이어(fullyconnected layer)로 구성되고,
    상기 컨볼루션 레이어는,
    Figure pat00009
    의 컨볼루션 레이어 및
    Figure pat00010
    의 컨볼루션 레이어를 포함하고,
    상기 완전 연결 레이어는, 1X1X128의 완전 연결 레이어, 1X1X256의 완전 연결 레이어, 1X1X512의 완전 연결 레이어 및 소프트 맥스 레이어를 포함하는
    특징점 검출 방법.
KR1020180034870A 2018-03-27 2018-03-27 검출 반복성을 최대화 하는 특징점 선별방법 KR102127855B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180034870A KR102127855B1 (ko) 2018-03-27 2018-03-27 검출 반복성을 최대화 하는 특징점 선별방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180034870A KR102127855B1 (ko) 2018-03-27 2018-03-27 검출 반복성을 최대화 하는 특징점 선별방법

Publications (2)

Publication Number Publication Date
KR20190117841A true KR20190117841A (ko) 2019-10-17
KR102127855B1 KR102127855B1 (ko) 2020-06-29

Family

ID=68424388

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180034870A KR102127855B1 (ko) 2018-03-27 2018-03-27 검출 반복성을 최대화 하는 특징점 선별방법

Country Status (1)

Country Link
KR (1) KR102127855B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102323607B1 (ko) * 2020-05-19 2021-11-08 부산대학교 산학협력단 아노말리 영상 검사 방법 및 아노말리 영상 검사 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160066926A (ko) * 2014-12-03 2016-06-13 삼성전자주식회사 데이터 분류 방법 및 장치와 관심영역 세그멘테이션 방법 및 장치
KR20170070715A (ko) * 2015-12-14 2017-06-22 삼성전자주식회사 딥러닝 기반 영상 처리 장치 및 방법, 학습 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160066926A (ko) * 2014-12-03 2016-06-13 삼성전자주식회사 데이터 분류 방법 및 장치와 관심영역 세그멘테이션 방법 및 장치
KR20170070715A (ko) * 2015-12-14 2017-06-22 삼성전자주식회사 딥러닝 기반 영상 처리 장치 및 방법, 학습 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ImageNet classification with deep convolutional neural networks. In NIPS, pp.1106-1114, (2012. 12. 04: 인용발명 3) 1부. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102323607B1 (ko) * 2020-05-19 2021-11-08 부산대학교 산학협력단 아노말리 영상 검사 방법 및 아노말리 영상 검사 장치

Also Published As

Publication number Publication date
KR102127855B1 (ko) 2020-06-29

Similar Documents

Publication Publication Date Title
KR102595399B1 (ko) 미지의 클래스들의 검출 및 미지의 클래스들에 대한 분류기들의 초기화
US10515304B2 (en) Filter specificity as training criterion for neural networks
US11334789B2 (en) Feature selection for retraining classifiers
US11423323B2 (en) Generating a sparse feature vector for classification
Simon et al. Part detector discovery in deep convolutional neural networks
US20170262995A1 (en) Video analysis with convolutional attention recurrent neural networks
KR102073162B1 (ko) 딥러닝 기반의 소형 물체 검출 기법
US20160283864A1 (en) Sequential image sampling and storage of fine-tuned features
US20160321542A1 (en) Incorporating top-down information in deep neural networks via the bias term
KR20190119863A (ko) 반 지도 학습과 여러 개의 멀티 모달 네트워크를 이용한 비디오 기반 인물 감정 인식 기법
EP3329425A1 (en) Media classification
CN110892409B (zh) 用于分析图像的方法和装置
EP3937076A1 (en) Activity detection device, activity detection system, and activity detection method
KR102476022B1 (ko) 얼굴검출 방법 및 그 장치
KR102167011B1 (ko) 샘플링 및 적응적으로 변경되는 임계치에 기초하여 뉴럴 네트워크를 학습하는데 이용되는 하드 네거티브 샘플을 추출하는 영상 학습 장치 및 상기 장치가 수행하는 방법
US10002136B2 (en) Media label propagation in an ad hoc network
KR102210404B1 (ko) 위치 정보 추출 장치 및 방법
KR102369413B1 (ko) 영상 처리 장치 및 방법
İmamoğlu et al. Saliency detection by forward and backward cues in deep-CNN
JP2019023801A (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
KR102127855B1 (ko) 검출 반복성을 최대화 하는 특징점 선별방법
KR102399673B1 (ko) 어휘 트리에 기반하여 객체를 인식하는 방법 및 장치
KR102580131B1 (ko) 순환 생성 적대 네트워크 조건부 생성 적대 네트워크
KR102224218B1 (ko) 비디오 시간 정보를 활용하는 딥러닝 기반 물체 검출 방법 및 장치
KR102605708B1 (ko) 조정 가능한 Grad-CAM을 기반으로 한 이미지 분류 작업에 시각적 설명

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant