KR101853211B1 - 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법 - Google Patents

모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법 Download PDF

Info

Publication number
KR101853211B1
KR101853211B1 KR1020160178817A KR20160178817A KR101853211B1 KR 101853211 B1 KR101853211 B1 KR 101853211B1 KR 1020160178817 A KR1020160178817 A KR 1020160178817A KR 20160178817 A KR20160178817 A KR 20160178817A KR 101853211 B1 KR101853211 B1 KR 101853211B1
Authority
KR
South Korea
Prior art keywords
frame
gaussian
filtering
tag information
pixel
Prior art date
Application number
KR1020160178817A
Other languages
English (en)
Inventor
이채은
조형래
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020160178817A priority Critical patent/KR101853211B1/ko
Application granted granted Critical
Publication of KR101853211B1 publication Critical patent/KR101853211B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 방법 및 장치가 제시된다. 본 발명에서 제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 방법은 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 단계, 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 단계, 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계, 가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 단계, 현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터를 이용하여 현재 프레임의 디스크립터를 생성하는 단계를 포함한다.

Description

모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 기법{Complexity Reduction of SIFT for Video based on Frame Difference in the Mobile GPU environment}
본 발명은 SIFT 알고리즘의 복잡도 감소 기법에 관한 것으로, 더욱 상세하게는 모바일 GPU 환경에서의 프레임 차이에 기반한 스케일-불변 특성 변환(Scale-Invariant Feature Transform; SIFT)의 복잡도 감소 방법 및 장치에 관한 것이다.
최근에는, 모바일 환경에서도 다양한 이미지 및 비디오 어플리케이션들이 널리 사용되고 있다. 객체 인식 및 얼굴 인식과 같은 어플리케이션들은 매우 높은 계산 복잡성을 필요로 한다. 서버나 개인용 컴퓨터와 비교할 때, 모바일 기기는 계산 성능이 낮아 실시간으로 객체 인식 알고리즘을 실행하기가 쉽지 않다. 스케일-불변 특성 변환(Scale-Invariant Feature Transform; SIFT)와 같은 일반적인 객체 인식 알고리즘은 이미지를 입력으로 받아들인다. 많은 연속적인 이미지로 구성된 비디오 입력의 경우, 모든 프레임에 대해 인식 작업을 수행하는 것이 손쉬운 방법이다. 이러한 접근 방식은 모바일 장치에서의 실시간 처리를 지원할 수 없다. SIFT는 가장 정확한 인식 알고리즘 중 하나이다. 그러나, 계산상의 복잡성과 메모리 액세스 요구 사항이 매우 높다. 모바일 장치에서 비디오 어플리케이션용 SIFT와 같은 고성능 알고리즘을 적용하려면, 비디오 특성을 활용해야 한다. 높은 프레임 속도의 비디오에서는, 연속적인 프레임간에 많은 시간적 중복성이 존재한다. 프레임 간의 유사성은 제한된 계산 리소스를 사용하여 실시간으로 객체 인식을 실행하는 중요한 키가 될 수 있다.
본 발명이 이루고자 하는 기술적 과제는 SIFT의 계산 복잡도를 줄이기 위해 프레임 차이를 사용하는 방법 및 장치를 제공하는데 있다. 간단한 계산을 통해, 이전 프레임과 현재 프레임의 차이를 계산하고, 현재 프레임의 일부 영역이 이전 프레임의 영역과 거의 동일할 경우, 픽셀 값 변경이 없기 때문에 SIFT 알고리즘은 해당 영역에서 새로운 수행을 할 필요가 없게 된다. 또한, SIFT 수행 중 많은 중간 결과를 다시 사용하여 최종 매칭 결과를 얻는다.
일 측면에 있어서, 본 발명에서 제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 방법은 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 단계, 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 단계, 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계, 가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 단계, 현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터를 이용하여 현재 프레임의 디스크립터를 생성하는 단계를 포함한다.
상기 계산된 프레임 차이로부터, 각 픽셀은 변화의 발생 여부를 나타내는 태그 정보를 갖는다.
상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계는 가우시안 피라미드를 구성하기 위해 미리 정해진 커널 크기를 가우시안 필터에 사용하고, 현재 필터의 커널 범위에 해당하는 태그 정보를 갖는 픽셀이 있는 경우 필터링을 수행한다.
상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계는 상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 가우시안 필터링의 범위를 결정하고, 가우시안 필터는 변경된 픽셀에만 적용되고, 변경되지 않은 픽셀의 경우 이전 프레임의 필터링된 값이 다시 사용된다.
또 다른 일 측면에 있어서, 본 발명에서 제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 장치는 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 이미지 변환부, 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 계산부, 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 필터링부, 가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 특성 추출부, 현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터를 이용하여 현재 프레임의 디스크립터를 생성하는 디스크립터 생성부를 포함한다.
상기 필터링부는 가우시안 피라미드를 구성하기 위해 미리 정해진 커널 크기를 가우시안 필터에 사용하고, 현재 필터의 커널 범위에 해당하는 태그 정보를 갖는 픽셀이 있는 경우 필터링을 수행한다.
상기 필터링부는 상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 가우시안 필터링의 범위를 결정하고, 가우시안 필터는 변경된 픽셀에만 적용되고, 변경되지 않은 픽셀의 경우 이전 프레임의 필터링된 값이 다시 사용된다.
본 발명의 실시예들에 따르면 SIFT의 계산 복잡도를 줄이기 위해 프레임 차이를 사용한다. 연속 프레임간에 차이가 없으면, SIFT에서의 많은 양의 계산을 건너 뛸 수 있으므로 처리 속도가 크게 향상된다. 또한, SIFT 수행 중 많은 중간 결과를 다시 사용하여 최종 매칭 결과를 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 SIFT 알고리즘의 복잡도 감소 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 가우시안 필터링을 통해 변경된 픽셀과 변경되지 않은 픽셀을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른 SIFT 알고리즘의 복잡도 감소 장치의 구성을 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 프레임 차이에 기반하여 수정된 알고리즘의 성능을 테스트 하기 위한 영상이다.
최근, 모바일 기기에서의 비디오에 대한 객체(object) 인식이 강하게 요구되고 있다. 그러나, 종래기술의 객체 매칭 알고리즘들은 이미지에 기반을 두고 있다. 제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 기법에서는 프레임 차이를 실시간 비디오 어플리케이션을 위한 스케일-불변 특성 변환(Scale-Invariant Feature Transform; SIFT) 알고리즘을 실행하는데 이용한다. 연속 프레임간에 차이가 없을 경우, SIFT에서의 많은 양의 계산을 생략할 수 있으므로 처리 속도가 크게 향상될 수 있다.
본 발명에서는 SIFT의 계산 복잡도를 줄이기 위해 프레임 차이를 사용한다. 간단한 계산을 통해, 이전 프레임과 현재 프레임의 차이가 계산된다. 현재 프레임의 일부 영역이 이전 프레임의 영역과 거의 동일할 경우, 픽셀 값 변경이 없기 때문에 SIFT 알고리즘은 해당 영역에서 새로운 수행을 할 필요가 없게 된다. SIFT 수행 중 많은 중간 결과를 다시 사용하여 최종 매칭 결과를 얻을 수 있다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 SIFT 알고리즘의 복잡도 감소 방법을 설명하기 위한 흐름도이다.
제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 방법은 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 단계(110), 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 단계(120), 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계(130), 가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 단계(140), 현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터(descriptor)를 이용하여 현재 프레임의 디스크립터를 생성하는 단계(150)를 포함한다.
단계(110)에서, 카메라의 현재 입력 프레임(111)을 그레이 이미지(112)로 변경한다.
이후 단계(120)에서, 현재 프레임(112) 및 이전 프레임(121) 간의 프레임 차이(122)를 계산한다.
이 계산을 위해, 이전 그레이 이미지를 저장하기 위한 공간이 필요하다. 일반적으로, 픽셀 강도가 8 비트로 표시되므로 강도 값의 범위는 0에서 255까지 이다. 객체 이동뿐만 아니라 약간의 조명(illumination) 변화로 인해서도 프레임 별로 강도 값이 변경 될 수 있다. 따라서, 제안하는 방법에서는, 예를 들어 7 비트로만 프레임 차이를 계산한다. 여기서, 강도 값은 128 레벨이다. 이것은 조명 변화 또는 잡음 효과에 의해 야기되는 불필요한 프레임 차이의 가능성을 감소시킨다.
계산된 프레임 차이로부터, 각 픽셀은 변화의 발생 여부를 나타내는 태그 정보를 갖는다. 다시 말해 프레임 차이로부터, 각 픽셀은 변화가 발생했는지 아닌지를 보여주는 태그 정보, diff_tag를 가진다. 제안하는 방법에서, 예를 들어 diff_tag = 1은 픽셀 변화를 나타내지만, diff_tag = 0은 같은 픽셀을 나타낸다.
단계(130)에서, 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행한다.
픽셀 좌표 및 태그 정보에 기초하여, 스케일 공간 생성 프로세스에서 가우시안 필터링(Gaussian filtering)의 범위가 결정된다. 가우스 필터는 변경된 픽셀에만 적용된다. 변경되지 않은 픽셀의 경우, 이전 프레임의 필터링 된 값이 다시 사용된다. 나머지 프로세스는 변경된 픽셀에 대해서도 수행된다.
가우시안 필터링을 수행하는 단계에서, 상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 가우시안 필터링의 범위를 결정하고, 가우시안 필터는 변경된 픽셀에만 적용되고, 변경되지 않은 픽셀의 경우 이전 프레임의 필터링된 값이 다시 사용된다.
또한, 가우시안 피라미드(131)를 구성하기 위해 미리 정해진 커널 크기를 가우시안 필터에 사용하고, 현재 필터의 커널 범위에 해당하는 태그 정보를 갖는 픽셀이 있는 경우 필터링을 수행한다.
더욱 상세하게는, 프레임 차이의 데이터에 기초하여, 스케일 공간 생성의 계산 복잡도는 배경(background)과 같은 정적 영역에 대해 상당히 감소된다. 스케일 공간 생성 프로세스는 가장 복잡한 부분이며 정확한 특성 추출에서 중요한 역할을 한다. 따라서, 이 프로세스에서의 복잡도 감소는 매우 조심히 수행되어야 한다. 가우시안 피라미드를 구성하기 위해, 본 발명의 실시예에 따르면, 7x7, 9x9, 11x11, 13x13, 15x15의 5가지 커널 크기가 가우시안 필터에 사용될 수 있다. 그리고, 현재 필터의 커널 범위에 diff_tag = 1인 픽셀이 있는 경우, 가우시안 필터링이 수행된다. 도 2를 참조하여 가우시안 필터링 수행 과정에 대하여 더욱 상세히 설명한다.
가우시안 필터링을 수행하여 Gaussian(DoG)(132)의 차이를 계산한 후, 단계(140)에서 현재 프레임의 특성을 추출(141)한다. 그리고, 현재 프레임의 특성을 추출한 후, 단계(150)에서 이전 프레임의 디스크립터(descriptor)(152)를 이용하여 현재 프레임의 디스크립터(151)를 생성한다.
도 2는 본 발명의 일 실시예에 따른 가우시안 필터링을 통해 변경된 픽셀과 변경되지 않은 픽셀을 나타내는 도면이다.
작은 정사각형(210)은 픽셀을 나타낸다. 화이트 픽셀(211)은 diff_tag = 0을 가지며, 그레이 픽셀(212)은 diff_tag = 1을 갖는다. 5x5 크기의 커널이 사용되는 경우, 모든 인접한 픽셀들이 이전 프레임의 픽셀들과 동일하기 때문에 픽셀 1(221)은 필터링 되지 않는다. 픽셀 2(222)에 대해, 이전 프레임에 비해 변화가 검출되지 않는다. 중심 필터가 diff_tag = 0를 가지고 있더라도, 해당 커널 범위에는 diff_tag = 1인 픽셀이 존재한다. 따라서, 픽셀 2(222)는 필터링 된다. 픽셀 3(223)은 diff_tag = 1이므로, 이 픽셀은 항상 필터링 된다. 화이트 영역에 대해, 필터링 되고 저장된 데이터가 로드된다. 모든 픽셀에 대해 스케일 공간 생성, DoG, 특성 추출, 설명자 생성 및 정규화가 수행된 후 15x15 가우스 필터인 가장 큰 커널 크기 필터로 처리된다.
도 3은 본 발명의 일 실시예에 따른 SIFT 알고리즘의 복잡도 감소 장치(300)의 구성을 나타내는 도면이다.
제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 장치(300)는 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 이미지 변환부(310), 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 계산부(320), 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 필터링부(330), 가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 특성 추출부(340), 현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터를 이용하여 현재 프레임의 디스크립터를 생성하는 디스크립터 생성부(350)를 포함한다.
이미지 변환부(310)는 카메라의 현재 입력 프레임을 그레이 이미지로 변경한다.
이후 계산부(320)는, 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산한다.
이 계산을 위해, 이전 그레이 이미지를 저장하기 위한 공간이 필요하다. 일반적으로, 픽셀 강도가 8 비트로 표시되므로 강도 값의 범위는 0에서 255까지 이다. 객체 이동뿐만 아니라 약간의 조명(illumination) 변화로 인해서도 프레임 별로 강도 값이 변경 될 수 있다. 따라서, 제안하는 장치에서는, 예를 들어 7 비트로만 프레임 차이를 계산한다. 여기서, 강도 값은 128 레벨이다. 이것은 조명 변화 또는 잡음 효과에 의해 야기되는 불필요한 프레임 차이의 가능성을 감소시킨다.
계산된 프레임 차이로부터, 각 픽셀은 변화의 발생 여부를 나타내는 태그 정보를 갖는다. 다시 말해 프레임 차이로부터, 각 픽셀은 변화가 발생했는지 아닌지를 보여주는 태그 정보, diff_tag를 가진다. 제안하는 장치에서, 예를 들어 diff_tag = 1은 픽셀 변화를 나타내지만, diff_tag = 0은 같은 픽셀을 나타낸다.
필터링부(330)는, 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행한다.
픽셀 좌표 및 태그 정보에 기초하여, 스케일 공간 생성 프로세스에서 가우시안 필터링(Gaussian filtering)의 범위가 결정된다. 가우스 필터는 변경된 픽셀에만 적용된다. 변경되지 않은 픽셀의 경우, 이전 프레임의 필터링 된 값이 다시 사용된다. 나머지 프로세스는 변경된 픽셀에 대해서도 수행된다.
가우시안 필터링을 수행하는 단계에서, 상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 가우시안 필터링의 범위를 결정하고, 가우시안 필터는 변경된 픽셀에만 적용되고, 변경되지 않은 픽셀의 경우 이전 프레임의 필터링된 값이 다시 사용된다.
또한, 가우시안 피라미드를 구성하기 위해 미리 정해진 커널 크기를 가우시안 필터에 사용하고, 현재 필터의 커널 범위에 해당하는 태그 정보를 갖는 픽셀이 있는 경우 필터링을 수행한다.
더욱 상세하게는, 프레임 차이의 데이터에 기초하여, 스케일 공간 생성의 계산 복잡도는 배경(background)과 같은 정적 영역에 대해 상당히 감소된다. 스케일 공간 생성 프로세스는 가장 복잡한 부분이며 정확한 특성 추출에서 중요한 역할을 한다. 따라서, 이 프로세스에서의 복잡도 감소는 매우 조심히 수행되어야 한다. 가우시안 피라미드를 구성하기 위해, 본 발명의 실시예에 따르면, 7x7, 9x9, 11x11, 13x13, 15x15의 5가지 커널 크기가 가우시안 필터에 사용될 수 있다. 그리고, 현재 필터의 커널 범위에 diff_tag = 1인 픽셀이 있는 경우, 가우시안 필터링이 수행된다. 도 2를 참조하여 가우시안 필터링 수행 과정에 대하여 더욱 상세히 설명한다.
가우시안 필터링을 수행하여 Gaussian(DoG)의 차이를 계산한 후, 특성 추출부(340)는 현재 프레임의 특성을 추출한다. 그리고, 현재 프레임의 특성을 추출한 후, 디스크립터 생성부(350)는 이전 프레임의 디스크립터(descriptor)를 이용하여 현재 프레임의 디스크립터를 생성한다.
도 4는 본 발명의 일 실시예에 따른 프레임 차이에 기반하여 수정된 알고리즘의 성능을 테스트 하기 위한 영상이다.
제안하는 모바일 GPU 환경에서 차영상 정보를 이용한 SIFT 알고리즘의 복잡도 감소 방법 및 장치의 개선된 성능에 대하여 표 1 및 표 2를 참조하여 설명한다.
본 발명의 실시예에 따른, 프레임 차이에 기반하여 수정된 알고리즘의 성능을 명확하게 테스트하기 위해, 장치의 카메라는 고정되어 있는 반면, 대상 객체는 도 4와 같이 10초 동안 왼쪽에서 오른쪽으로 이동한 것을 가정한다. 표 1은 프레임에 대한 평균 SIFT 처리 시간을 나타낸다.
<표 1>
Figure 112016127150120-pat00001
첫 번째 열은 SIFT의 프로세스를 나타낸다. 두 번째 열과 세 번째 열은 종래의 SIFT와 제안된 프레임 차이 기반 SIFT가 각각 사용된 경우의 처리 시간이다. 네 번째 열은 개선된 처리 시간을 보여준다. 도 4에서, 약 55 % 영역은 변경되지 않은 픽셀이다. 변경되지 않은 픽셀 또한 최소한의 계산을 필요로 하므로, 실험 결과는 제안된 기법이 33%의 속도 증가를 보임을 보여준다.
<표 2>
Figure 112016127150120-pat00002
표 2는 특성 검출 및 매칭의 성능을 보여준다. 검출되고 매칭된 특성의 수는 약간 감소하지만, 매칭 스코어는 거의 같다. 여기서, 매칭 스코어를 얻기 위해, 매칭된 특성의 수를 검출된 특성의 수로 나눈다. 제안된 방법은 미미한(marginal) 성능 저하로 상당한 프로세스 속도 향상을 달성한다.
이와 같이, SIFT의 계산 복잡도를 줄이기 위해 프레임 차이를 사용하고, 간단한 계산을 통해, 이전 프레임과 현재 프레임의 차이가 계산된다. 현재 프레임의 일부 영역이 이전 프레임의 영역과 거의 동일하면, 픽셀 값 변경이 없기 때문에 SIFT 알고리즘은 해당 영역에서 새로운 수행을 할 필요가 없게 된다. 또한, SIFT 수행 중 많은 중간 결과를 다시 사용하여 최종 매칭 결과를 얻을 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (7)

  1. 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 단계;
    조명 변화 또는 잡음 효과에 의해 야기되는 불필요한 프레임 차이의 가능성을 감소시키기 위해 픽셀 강도를 나타내는 비트보다 작은 비트로 현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 단계;
    계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계;
    가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 단계; 및
    현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터를 이용하여 현재 프레임의 디스크립터를 생성하는 단계
    를 포함하고,
    상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계는,
    가우시안 피라미드를 구성하기 위해 복수의 미리 정해진 커널 크기를 가우시안 필터에 사용하고, 현재 필터의 커널 범위에 해당하는 태그 정보를 갖는 픽셀이 있는 경우 필터링을 수행하고, 모든 픽셀에 대해 스케일 공간 생성, DoG, 특성 추출, 설명자 생성 및 정규화가 수행된 후 가장 큰 커널 크기의 가우시안 필터로 처리하는
    SIFT 알고리즘의 복잡도 감소 방법.
  2. 제1항에 있어서,
    상기 계산된 프레임 차이로부터, 각 픽셀은 변화의 발생 여부를 나타내는 태그 정보를 갖는
    SIFT 알고리즘의 복잡도 감소 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 단계는,
    상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 가우시안 필터링의 범위를 결정하고, 가우시안 필터는 변경된 픽셀에만 적용되고, 변경되지 않은 픽셀의 경우 이전 프레임의 필터링된 값이 다시 사용되는
    SIFT 알고리즘의 복잡도 감소 방법.
  5. 카메라의 현재 입력 프레임을 그레이 이미지로 변경하는 이미지 변환부;
    현재 프레임 및 이전 프레임 간의 프레임 차이를 계산하는 계산부;
    계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 스케일 공간 생성 프로세스에서 가우시안 필터링을 수행하는 필터링부;
    가우시안 필터링을 수행한 후, 현재 프레임의 특성을 추출하는 특성 추출부; 및
    현재 프레임의 특성을 추출한 후, 이전 프레임의 디스크립터를 이용하여 현재 프레임의 디스크립터를 생성하는 디스크립터 생성부
    를 포함하고,
    상기 필터링부는,
    가우시안 피라미드를 구성하기 위해 복수의 미리 정해진 커널 크기를 가우시안 필터에 사용하고, 현재 필터의 커널 범위에 해당하는 태그 정보를 갖는 픽셀이 있는 경우 필터링을 수행하고, 모든 픽셀에 대해 스케일 공간 생성, DoG, 특성 추출, 설명자 생성 및 정규화가 수행된 후 가장 큰 커널 크기의 가우시안 필터로 처리하는
    SIFT 알고리즘의 복잡도 감소 장치.
  6. 삭제
  7. 제5항에 있어서,
    상기 필터링부는,
    상기 계산된 프레임 차이에 따른 픽셀 좌표 및 태그 정보에 기초하여 가우시안 필터링의 범위를 결정하고, 가우시안 필터는 변경된 픽셀에만 적용되고, 변경되지 않은 픽셀의 경우 이전 프레임의 필터링된 값이 다시 사용되는
    SIFT 알고리즘의 복잡도 감소 장치.
KR1020160178817A 2016-12-26 2016-12-26 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법 KR101853211B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160178817A KR101853211B1 (ko) 2016-12-26 2016-12-26 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160178817A KR101853211B1 (ko) 2016-12-26 2016-12-26 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법

Publications (1)

Publication Number Publication Date
KR101853211B1 true KR101853211B1 (ko) 2018-04-27

Family

ID=62081656

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160178817A KR101853211B1 (ko) 2016-12-26 2016-12-26 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법

Country Status (1)

Country Link
KR (1) KR101853211B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688849A (zh) * 2021-08-30 2021-11-23 中国空空导弹研究院 一种用于卷积神经网络的灰度图像序列特征提取方法
WO2023008671A1 (ko) * 2021-07-28 2023-02-02 주식회사 넥스트칩 특징점에 대한 기술자를 생성하기 위한 전자 장치 및 그 동작 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023008671A1 (ko) * 2021-07-28 2023-02-02 주식회사 넥스트칩 특징점에 대한 기술자를 생성하기 위한 전자 장치 및 그 동작 방법
CN113688849A (zh) * 2021-08-30 2021-11-23 中国空空导弹研究院 一种用于卷积神经网络的灰度图像序列特征提取方法
CN113688849B (zh) * 2021-08-30 2023-10-24 中国空空导弹研究院 一种用于卷积神经网络的灰度图像序列特征提取方法

Similar Documents

Publication Publication Date Title
EP2927873B1 (en) Image processing apparatus and image processing method
Li et al. Finding the secret of image saliency in the frequency domain
JP6866889B2 (ja) 画像処理装置、画像処理方法およびプログラム
US9269025B1 (en) Object detection in images
CN109063776B (zh) 图像再识别网络训练方法、装置和图像再识别方法及装置
JP6756406B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
KR20160032466A (ko) 영상 특징 추출 방법 및 장치
KR20140028809A (ko) 이미지 피라미드의 적응적 이미지 처리 장치 및 방법
US20160224864A1 (en) Object detecting method and apparatus based on frame image and motion vector
US20230095568A1 (en) Object tracking device, object tracking method, and program
JP2019512821A (ja) 画像処理装置、画像処理方法、及びプログラム
KR20180109658A (ko) 영상 처리 방법과 장치
KR101853211B1 (ko) 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
KR102516366B1 (ko) 특징 데이터 획득 방법 및 장치
JP7220062B2 (ja) 学習データ生成プログラム、学習データ生成装置、及び学習データ生成方法
KR20190078890A (ko) 그리드 기반의 평면 추정 방법 및 장치
Junayed et al. HiMODE: A hybrid monocular omnidirectional depth estimation model
JP7014005B2 (ja) 画像処理装置及び方法、電子機器
US11869196B2 (en) Image processing apparatus, image processing method, and storage medium
US20180089529A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US10872423B2 (en) Image detection device, image detection method and storage medium storing program
KR101617551B1 (ko) 얼굴 검출 능력 향상을 위한 이미지 처리 방법 및 시스템
JP2019504430A (ja) 画像処理方法及びデバイス
WO2019150649A1 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant