KR101756605B1 - 특징 추출 방법 및 장치 - Google Patents

특징 추출 방법 및 장치 Download PDF

Info

Publication number
KR101756605B1
KR101756605B1 KR1020167005594A KR20167005594A KR101756605B1 KR 101756605 B1 KR101756605 B1 KR 101756605B1 KR 1020167005594 A KR1020167005594 A KR 1020167005594A KR 20167005594 A KR20167005594 A KR 20167005594A KR 101756605 B1 KR101756605 B1 KR 101756605B1
Authority
KR
South Korea
Prior art keywords
image
vector
lean
cell
hog
Prior art date
Application number
KR1020167005594A
Other languages
English (en)
Other versions
KR20170074215A (ko
Inventor
페이 롱
지준 첸
타오 장
Original Assignee
시아오미 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시아오미 아이엔씨. filed Critical 시아오미 아이엔씨.
Publication of KR20170074215A publication Critical patent/KR20170074215A/ko
Application granted granted Critical
Publication of KR101756605B1 publication Critical patent/KR101756605B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/469Contour-based spatial representations, e.g. vector-coding
    • G06V10/473Contour-based spatial representations, e.g. vector-coding using gradient analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

본 발명은 특징 추출 방법 및 장치를 개시하며, 영상 처리 기술 분야에 속한다. 상기 특징 추출 방법은, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하는 단계; 각 셀에 대한 희박 신호 분해를 실행하여, 각 셀에 대응하는 희박 벡터를 얻는 단계; 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG)의 특징을 추출하는 단계;를 포함한다. 희박 신호 분해 후의 영상에 대해 HOG 특징을 추출하므로, HOG 특징을 추출하는 과정에서 영상의 공간 영역을 직접 계산하여 얻음으로 인한 패턴 인식에서의 검출율과 정확도가 낮은 문제를 해결하고, 주파수 영역에서 영상의 HOG 특징을 추출함으로써, 패턴 인식에서의 검출율과 정확도를 향상시키는 효과를 달성할 수 있다.

Description

특징 추출 방법 및 장치{METHOD AND DEVICE FOR CHARACTERISTIC EXTRACTION}
본 출원은 출원번호가 201510827753.4이고, 출원일이 2015년 11월 25일인 중국 특허 출원에 기초하여 제출되고, 상기 중국 특허 출원의 우선권을 주장하며, 상기 중국 특허 출원의 모든 내용은 참고로 본 출원에 인용된다.
본 발명은 영상 처리 기술 분야에 관한 것이고, 구체적으로는 특징 추출 방법 및 장치에 관한 것이다.
영상 검출 및 인식은 컴퓨터 비전에 있어서의 중요한 연구 분야이다. 영상 검출과 인식 기술에서, 통상적인 방법은 영상 중의 어떤 특징을 추출함으로써, 영상에 대해 검출과 인식을 실시하는 것이다.
기존 기술에 있어서, 영상의 방향 그라데이션 히스토그램(HOG, Histogram of Oriented Gradient)의 특징을 추출함으로써 영상에 대한 검출과 인식을 실시한다. HOG 특징 추출 방법은, 영상 중 각 픽셀의 그라데이션을 계산하는 단계; 영상을 복수 개의 픽셀을 포함하는 복수 개의 셀로 구획하고, 각 인접하는 n개의 셀을 한 개의 블록으로 형성하는 단계; 각 셀에서의 모든 픽셀의 그라데이션 히스토그램을 통계하고, 각 블록에서의 모든 셀의 그라데이션 히스토그램에 의해 각 블록의 HOG 특징을 얻는 단계; 영상 중 모든 블록의 HOG 특징을 통계하여 영상의 HOG 특징을 얻는 단계;를 포함한다.
기존 기술에 존재하는 문제점을 해결하기 위하여, 본 발명은 특징 추출 방법 및 장치를 제공한다.
본 발명의 실시예의 제1측면에 의하면,
영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하는 단계;
각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻는 단계;
희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하는 단계;를 포함하는 특징 추출 방법을 제공한다.
바람직한 일 실시예에 있어서, 각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻는 단계는,
각 셀의 픽셀을 n*1차원의 벡터로 조절하는 단계;
아래의 공식을 이용하여, 각 셀의 벡터에 대한 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻는 단계;를 포함하고,
min (x)∥x∥ 1 subject to y= Dx
y는 상기 각 셀의 벡터이고, D는 미리 설정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전D에서 희박화하여 얻은 희박 벡터이고, ∥x 1 는 희박 벡터x의 각 열의 절대값에 대한 합을 표시하며, 각 희박 벡터는 m*1차원의 벡터이고, 과완전 사전D는 n*m매트릭스이다.
바람직한 일 실시예에 있어서, 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하는 단계는,
희박 벡터에 의해 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 각 셀의 서술인자를 얻는 단계;
블록 내의 각 서술인자를 통계하여, 각 블록의 HOG 특징을 얻는 단계;
영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻는 단계;를 포함한다.
바람직한 일 실시예에 있어서, 영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻는 단계는,
영상에서의 각 블록의 HOG 특징을 한 개의 매트릭스로 직렬 연결하여, 영상의 HOG 특징을 얻는 단계;를 포함하고, 매트릭스의 각 열은 한 개 블록의 HOG 특징이다.
바람직한 일 실시예에 있어서, 영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻는 단계는,
영상에서의 M*N개의 픽셀을 포함한 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하는 단계;
각 블록의 조절 후의 HOG 특징 및 각 블록의 영상에서의 대응 위치에 의해, 영상의 HOG 특징을 얻는 단계;를 포함한다.
바람직한 일 실시예에 있어서, 상기 방법은,
영상을 정규화 처리하여, 소정 크기의 영상을 얻는 단계;를 더 포함한다.
본 발명의 실시예의 제2측면에 의하면,
영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하는 구획 모듈;
각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻는 분해 모듈;
희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하는 추출 모듈;을 포함하는 특징 추출 장치를 제공한다.
바람직한 일 실시예에 있어서, 분해 모듈은,
각 셀의 픽셀을 n*1차원의 벡터로 조절하는 제1조절 서브 모듈;
아래의 공식을 이용하여, 각 셀의 벡터에 대한 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻는 신호 분해 서브 모듈;을 포함하고,
min (x)∥x∥ 1 subject to y= Dx
y는 상기 각 셀의 벡터이고, D는 미리 설정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전 D에서 희박화하여 얻은 희박 벡터이고, ∥x∥ 1 는 희박 벡터x의 각 열의 절대값에 대한 합을 표시하며, 각 희박 벡터는 m*1차원의 벡터이고, 과완전 사전 D는 n*m 매트릭스이다.
바람직한 일 실시예에 있어서, 추출 모듈은,
희박 벡터에 의해 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 각 셀의 서술인자를 얻는 계산 서브 모듈;
블록 내의 각 서술인자를 통계하여, 각 블록의 HOG 특징을 얻도록 구성된 제1통계 서브 모듈;
영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻도록 구성된 제2통계 서브 모듈;을 포함한다.
바람직한 일 실시예에 있어서, 제2통계 서브 모듈은, 영상에서의 각 블록의 HOG 특징을 한 개의 매트릭스로 직렬 연결하여, 영상의 HOG 특징을 얻도록 구성되고, 매트릭스의 각 열은 한 개 블록의 HOG 특징이다.
바람직한 일 실시예에 있어서, 제2통계 서브 모듈은,
영상에서의 M*N개의 픽셀을 포함하는 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하도록 구성된 제2조절 서브 모듈;
각 블록의 조절 후의 HOG 특징 및 각 블록의 영상에서의 대응 위치에 의해, 영상의 HOG 특징을 얻도록 구성된 특징 추출 서브 모듈;을 포함한다.
바람직한 일 실시예에 있어서, 상기 장치는,
영상을 정규화 처리하여, 소정 크기의 영상을 얻도록 구성된 처리 모듈;을 더 포함한다.
본 발명의 실시예의 제3측면에 의하면,
프로세서;
프로세서의 실행 가능한 명령을 기억하는 메모리;를 포함하고,
상기 프로세서는,
영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고;
각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻으며;
희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하도록 구성되는 특징 추출 장치를 제공한다.
본 발명의 실시예에 의한 기술안은 아래의 유리한 효과를 포함할 수 있다.
영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고; 각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻으며; 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출함으로써, HOG 특징을 추출하는 과정에서 영상의 공간 영역을 직접 계산하여 얻음으로 인한 패턴 인식에서의 검출율과 정확도가 낮은 문제점을 해결하고, 주파수 영역에서 영상의 HOG 특징을 추출함으로써, 패턴 인식에서의 검출율과 정확도를 향상시키는 효과를 달성할 수 있다.
상기 일반적인 설명과 아래의 상세한 설명은 예시적인 것에 불과하고, 본 발명을 한정할 수 없음을 이해하여야 할 것이다.
여기서 도면은 명세서에 편입되어 본 명세서의 일부를 구성하고, 본 발명에 적합한 실시예를 나타내고 있으며, 명세서와 함께 본 발명의 원리를 해석하는데 사용된다.
도1은 예시적 일 실시예에 따른 특징 추출 방법의 플로우차트이다.
도2a는 다른 예시적 일 실시예에 따른 특징 추출 방법의 플로우차트이다.
도2b는 예시적 일 실시예에 따른 영상 구획을 도시한 도면이다.
도2c는 다른 예시적 일 실시예에 따른 영상 구획을 도시한 도면이다.
도2d는 예시적 일 실시예에 따른 셀의 픽셀 조절의 설명도이다.
도2e는 예시적 일 실시예에 따른 블록 내의 HOG 특징에 대한 통계를 도시하는 도면이다.
도3a는 예시적 일 실시예에 따른 특징 추출 방법의 플로우차트이다.
도3b는 예시적 일 실시예에 따른 영상의 HOG 특징에 대한 통계를 도시하는 도면이다.
도4는 예시적 일 실시예에 따른 특징 추출 장치의 블록도이다.
도5는 다른 예시적 일 실시예에 따른 특징 추출 장치의 블록도이다.
도6은 예시적 일 실시예에 따른 특징 추출 장치의 서브 모듈의 블록도이다.
도7은 다른 예시적 일 실시예에 따른 특징 추출 장치의 블록도이다.
이하, 첨부된 도면을 참조하여 예시적 실시예에 대하여 상세히 설명한다. 아래의 설명이 도면에 관계되는 경우, 별도의 표시가 없는 한, 서로 다른 도면 중의 동일한 숫자는 동일 또는 유사한 요소를 표시한다. 아래의 예시적 실시예에서 설명되는 실시 형태는 본 발명과 일치한 모든 실시 형태를 대표하지 않는다. 반대로, 그들은 첨부된 특허청구범위에서 상세히 설명된 본 발명의 일부 측면과 일치한 장치 및 방법의 예일 뿐이다.
도1은 예시적 일 실시예에 따른 특징 추출 방법의 플로우차트이고, 도1에 도시한 바와 같이, 본 실시예는 상기 방법을 패턴 인식의 하드웨어에 사용한 예를 들어 설명하며, 상기 방법은 아래의 단계를 포함할 수 있다.
단계102에 있어서, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획한다.
단계104에 있어서, 각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻는다.
희박 신호 분해는 지정한 관측 신호를 분해 규칙에 따라 희박 벡터로 변경시키는 것을 가리키고, 상기 희박 벡터에서 복수 개의 요소의 값이 영이다. 본 실시예에 있어서, 각 셀에서의 픽셀을 지정된 관측 신호로 하여, 각 셀에 대응하는 희박 벡터를 얻는다.
단계106에 있어서, 희박 벡터에 의해 영상의 HOG 특징을 추출한다.
단말기는 희박 신호 분해 후에 얻은 희박 벡터에 의해, 영상의 HOG 특징을 추출한다.
상기한 바와 같이, 본 발명의 실시예에 따른 특징 추출 방법은, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고; 각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻으며; 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출함으로써, HOG 특징을 추출하는 과정에서 영상의 공간 영역을 직접 계산하여 얻음으로 인한 패턴 인식에서의 검출율과 정확도가 낮은 문제점를 해결하고, 주파수 영역에서 영상의 HOG 특징을 추출함으로써, 패턴 인식에서의 검출율과 정확도를 향상시키는 효과를 달성할 수 있다.
도2a는 다른 예시적 일 실시예에 따른 특징 추출 방법의 플로우차트이고, 도2a에 도시한 바와 같이, 본 실시예는 상기 방법을 패턴 인식의 하드웨어에 응용한 예를 들어 설명하며, 상기 방법은 아래의 단계를 포함할 수 있다.
단계201에 있어서, 영상을 정규화 처리하여, 소정 크기의 영상을 얻는다.
패턴 인식은, 일반적으로 복수 개의 영상의 특징 추출에 관계되며, 단말기가 영상에 대해 특징을 추출하기 전에, 단말기는 먼저 영상을 정규화 처리하여, 영상이 통일 처리되도록, 크기가 다른 영상을 소정 크기의 영상으로 처리한다.
단계202에 있어서, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획한다.
정규화 처리를 실시한 후의 영상을 구획하는 단계는, 영상을 복수 개의 블록으로 구획하고, 각 블록을 복수 개의 셀로 구획하는 단계를 포함하는 것이 바람직하다.
정규화 처리를 실시한 후의 영상을 구획하는 단계는, 영상을 복수 개의 셀로 구획하고, 서로 인접되는 셀을 한 개의 블록으로 구성하며, 각 블록에는 복수 개의 셀을 포함하는 것이 바람직하고, 예를 들면 둘둘씩 인접한 4개의 전(田)자형으로 배열된 셀로 한 개의 블록을 구성한다.
본 실시예에 있어서, 영상을 구획하는 과정에서, 블록과 셀을 구획하는 순서에 대하여 구체적으로 한정하지 않고, 먼저 블록을 구획한 다음 셀을 구획할 수도 있고, 먼저 셀을 구획한 다음 블록으로 구성할 수도 있다.
본 실시예에 있어서, 영상을 구획한 블록과 블록 사이에 중첩 영역이 존재하는지에 대해서는 구체적으로 한정하지 않고, 블록과 블록 사이에는 중첩 영역이 존재할 수도 있고 존재하지 않을 수도 있다.
예를 들면, 도2b에 도시한 바와 같이, 128픽셀*128픽셀의 영상(20)을 먼저 16픽셀*16픽셀의 서로 중첩되지 않는 블록(21)로 구획하고, 다음으로 각 16픽셀*16픽셀의 블록(21)을 8픽셀*8픽셀의 셀(22)로 구획하면, 영상에는 8개*8개=64개의 서로 중첩되지 않는 블록(21)이 포함되고, 각 블록에는 2개*2개=4개의 셀이 포함된다.
예를 들면, 도2c에 도시한 바와 같이, 128픽셀*128픽셀의 영상(20)을 먼저 16픽셀*16픽셀의 중첩 영역이 존재하는 블록(23)으로 구획하고, 다음 각 16픽셀*16픽셀의 블록(23)을 8픽셀*8픽셀의 셀(24)로 구획하면, 영상에는 16개*16개=256개의 중첩되는 영역이 존재하는 블록(23)이 포함되고, 각 블록에는 2개*2개=4개의 셀이 포함된다.
단계 203에 있어서, 상기 각 셀의 픽셀을 n*1차원의 벡터로 조절한다.
영상을 구획한 후, 각 셀에서의 픽셀을 한 매트릭스로 볼 수 있고, 각 셀에서의 픽셀에 대응하는 매트릭스를 n*1차원의 벡터로 조절한다.
매트릭스의 조절 과정에 있어서, 도2d에 도시한 바와 같이, 픽셀에 대응하는 매트릭스(25)의 제2열(K227)을 제1열(K126)의 아래에 직렬 연결하고, 픽셀에 대응하는 매트릭스(25)의 제3열(도면 미도시)을 직렬 연결된 제2열(K227)의 아래에 직렬 연결하며, 마찬가지로, 각 셀에서의 픽셀에 대응하는 매트릭스(25)를 n*1차원의 벡터(28)로 조절한다.
단계204에 있어서, 아래의 공식을 이용하여, 각 셀의 벡터에 대한 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻고;
min (x)∥x∥ 1 subject to y= Dx
y는 상기 각 셀의 벡터이고, D는 미리 설정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전D에서 희박화하여 얻은 희박 벡터이고, ∥x 1 는 희박 벡터x의 각 열의 절대값에 대한 합을 표시하며, 각 희박 벡터는 m*1차원의 벡터이고, 과완전 사전D는 n*m매트릭스이다.
영상에서의 각 셀에 대하여, 단말기는 먼저 과완전 사전D를 설정하고, 각 셀에서의 벡터를 지정된 관측 신호y로 하면, 상기 공식에 의해 각 셀에서의 벡터가 미리 지정된 과완전 사전D에서의 희박 벡터x를 계산할 수 있다. 각 셀에서 조절한 후의 벡터가 n*1차원이기 때문에, 단말기가 미리 지정된 과완전 사전D는 n*m매트릭스이고, 상기 공식에 의해 산출한 각 셀에서의 벡터에 대응하는 희박 벡터는 m*1차원이다.
단계205에 있어서, 희박 벡터에 의해 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 각 셀의 서술인자(descriptor)를 얻는다.
그라데이션 연산자에 의해 희박 신호 분해 후의 각 셀에서의 각 픽셀의 가로 그라데이션 및 세로 그라데이션을 계산한다.
즉, 그라데이션 연산자에 의해 각 셀에 대응하는 희박 벡터에서의 각 요소에 대해 가로 그라데이션 및 세로 그라데이션을 계산한다.
예시적으로, 상용하는 그라데이션 연산자는 아래의 표1에 표시한 바와 같다.
마스크의 유형 중앙 벡터 비중앙 벡터 릿쇼 정정벡터 대각 소블 연산자
연산자 [1 0 -1] [1 -1] [1 8 0 -8 -1]
Figure 112016020028586-pct00001

Figure 112016020028586-pct00002
Figure 112016020028586-pct00003
본 실시예에 있어서, 각 셀에서 픽셀의 그라데이션 크기를 계산할 때 표1에서의 임의의 그라데이션 연산자를 선택할 수 있고, 기타의 그라데이션 연산자를 선택할 수도 있으며, 본 실시예는 그라데이션 연산자의 선택에 대해 구체적으로 한정하지 않는다.
희박 벡터에서 요소의 가로 그라데이션이 H(x,y)이고, 세로 그라데이션이 V(x,y)인 경우, 상기 요소에 대응하는 그라데이션 방향과 그라데이션 크기은 각각 아래의 공식(1) 및 공식(2)에 의하여 계산한다.
θ( x,y ) = tan - 1 [V(x,y)/H(x,y)] ( 1)
m( x,y ) = {H( x,y ) 2 + V( x,y ) 2 ] 1/2 ( 2)
여기서, θ( x,y )는 희박 벡터에서의 요소( x,y )의 그라데이션 방향이고, m(x,y)는 요소(x,y)의 그라데이션 크기이다.
그라데이션 방향 θ( x,y )의 적용 범위는 -90도~90도이고, 그라데이션 방향θ(x,y)을 평균 z부분으로 나누고, 각 셀에 대응하는 희박 벡터에서의 모든 요소를 가중치 m( x,y )에 따라 그라데이션 방향에서 구획한 각 부분을 통계하고, 마지막으로 각 셀은 하나의 z차원의 벡터를 얻게 되며, 즉, 각 셀에 대응하는 서술인자를 얻게 된다.
예를 들면, 그라데이션 방향 θ( x,y )을 평균 9부분으로 나눌 때, 각 부분에 대응하는 각도는 20도이고, 각 셀에 대응하는 희박 벡터에서의 모든 요소를 가중치 m(x,y)에 따라 각 20도에서 통계하고, 마지막으로 각 셀에 대응하여 하나의 9차원의 벡터를 얻는다.
본 실시예에 있어서, 그라데이션 방향을 몇부분으로 나누는가에 대해서는 구체적으로 한정하지 않는다.
단계206에 있어서, 각 블록 내의 각 서술인자를 통계하여, 각 블록의 HOG 특징을 얻는다.
단말기가 각 블록 내에 포함된 각 셀에서 계산된 서술인자를 통계하여, 각 블록의 HOG 특징을 얻는다.
각 셀에서 계산해 낸 서술인자를 통계하는 경우, 단말기는 각 셀에 대응하는 서술인자를 직렬 연결하여, 각 블록의 HOG 특징을 하나의 벡터로 하고, 상기 벡터의 차원 수는 상기 블록 내에 포함된 셀에 대응하는 서술인자의 차원 수의 k배이다.
예를 들면, 각 셀에서의 서술인자는 9차원의 벡터이고, 각 블록은 4개의 셀을 포함하며, 4개의 셀에서의 9차원의 서술인자를 직렬 연결하여, 한 개의 36차원의 벡터를 형성하며, 상기 36차원의 벡터를 대응하는 블록의 HOG 특징으로 한다.
단계207에 있어서, 영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻는다.
단말기는 영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻는다. 단말기는 영상에서의 각 블록의 HOG 특징을 한 개의 매트릭스로 직렬 연결하여, 영상의 HOG 특징을 얻고, 매트릭스의 각 열은 한 개 블록의 HOG 특징이다.
예를 들면, 영상에 k개의 블록이 포함되고, 각 블록의 HOG 특징이 ki이면, ki개의 HOG 특징을 한 개의 매트릭스(250)으로 직렬 연결하고, k1을 직렬 연결된 매트릭스의 제1열(260)에 두고, k2를 직렬 연결된 매트릭스의 제2열(270)에 두며, 이 후 마찬가지이다. 도2e에 도시한 바와 같다.
상술한 바와 같이, 본 발명의 실시예에 따른 특징 추출 방법은, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고; 각 셀에서의 픽셀을 n*1차원의 벡터로 조절하며; 공식을 이용하여, 각 셀에서의 벡터에 대한 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻으며; 희박 벡터에 의해 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 각 셀의 서술인자를 얻고; 각 블록 내의 각 서술인자를 통계하여, 각 블록의 HOG 특징을 얻으며; 영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻음으로써, HOG 특징을 추출하는 과정에서 영상의 공간 영역을 직접 계산하여 얻음으로 인한 패턴 인식에서의 검출율과 정확도가 낮은 문제점을 해결하고, 주파수 영역에서 영상의 HOG 특징을 추출함으로써, 패턴 인식에서의 검출율과 정확도를 향상시키는 효과를 달성할 수 있다.
도2a에 도시된 바람직한 실시예에 있어서, 영상에서의 각 블록의 HOG 특징을 통계하여 영상의 HOG 특징을 얻는 과정에서, 영상의 대응 위치에 배열하는 형태로 배열할 수 있다. 도3a에 도시한 바와 같이, 단계207은 아래의 단계207a 및 단계207b로 교체할 수 있다.
단계 207a에 있어서, 영상에서의 M*N개의 픽셀을 포함하는 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절한다.
각 블록의 HOG 특징은 각 셀에 대응하는 서술인자를 직렬 연결하여 얻게 되는 L*1차원의 벡터이고, L*1차원의 벡터를 M*N의 매트릭스로 조절하고, 즉, 각 블록의 L*1차원의 벡터를 포함되는 셀에 의해 대응하는 매트릭스로 조절하며, 상기 대응하는 매트릭스의 각 열은 한 셀의 서술인자고, 각 셀의 서술인자를 대응하는 픽셀에 따라 조절하고, 조절 후에 얻게 되는 매트릭스의 각 열은 대응하는 블록에서의 대응 열의 픽셀에 대응하는 HOG 특징이다.
단계 207b에 있어서, 각 블록의 조절 후의 HOG 특징 및 각 블록의 영상에서의 대응 위치에 의해, 영상의 HOG 특징을 얻는다.
각 블록의 조절 후의 HOG 특징 및 각 블록의 영상에서의 대응 위치에 의해, 영상에서의 대응 픽셀 위치의 HOG 특징을 얻는다.
예를 들면, 영상에 k개의 블록이 포함되고, 각 블록의 HOG 특징이 ki이면, ki개의 HOG 특징을 M*N의 매트릭스로 조절하고, k1 즉 조절한 후의 매트릭스(31)을 제1블록(32)의 영상에서의 대응 위치에 두고, k2즉 조절 후의 매트릭스(33)을 제2블록(34)의 영상에서의 대응 위치에 두며, 이와 같이, 마지막 한 개의 매트릭스(MN)을 마지막 한개의 블록(MN)의 영상에서의 대응하는 위치에 둔다. 도3b에 도시한 바와 같다.
상술한 바와 같이, 본 발명의 실시예에 따른 특징 추출 방법은, 영상에서의 M*N개의 픽셀을 포함하는 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하고; 각 블록의 조절 후의 HOG 특징 및 각 블록의 영상에서의 대응 위치에 의해, 영상의 HOG 특징을 얻음으로써, 추출 후의 영상의 HOG 특징과 영상에서의 각 셀의 대응 위치가 대응하게 하고, 영상에서의 각 블록의 특징을 더욱 뚜렷하게 할 수 있다.
아래 설명은 본 발명에 따른 장치의 실시예이고, 본 발명에 따른 방법의 실시예를 실행하는데 사용할 수 있다. 본 발명의 장치 실시예에서 개시되지 않은 세부 사항은, 본 발명의 방법 실시예를 참조한다.
도4는 예시적 일 실시예에 따른 특징 추출 장치의 블록도이고, 도4에 도시한 바와 같이, 상기 특징 추출 장치는,
영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하도록 구성된 구획 모듈(420);
상기 각 셀에 대한 희박 신호 분해를 실시하여, 상기 각 셀에 대응하는 희박 벡터를 얻도록 구성된 분해 모듈(440);을 포함하나 이에 한정되지 않는다.
희박 신호 분해는 지정한 관측 신호를 분해 규칙에 따라 희박 벡터로 변경시키는 것을 가리키며, 상기 희박 벡터에서 복수 개의 요소의 값이 영이다. 본 실시예에 있어서, 각 셀에서의 픽셀을 지정된 관측 신호로 하여, 각 셀에 대응하는 희박 벡터를 얻는다.
추출 모듈(460)은, 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하도록 구성된다.
본 발명의 실시예에 따른 특징 추출 장치는, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고; 각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻으며; 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출함으로써, HOG 특징을 추출하는 과정에서 영상의 공간 영역을 직접 계산하여 얻음으로 인한 패턴 인식에서의 검출율과 정확도가 낮은 문제점을 해결하고, 주파수 영역에서 영상의HOG 특징을 추출함으로써, 패턴 인식에서의 검출율과 정확도를 향상시키는 효과를 달성할 수 있다.
도5는 다른 예시적 일 실시예에 따른 특징 추출 장치의 블록도이고, 도5에 도시한 바와 같이, 상기 특징 추출 장치는 아래의 모듈을 포함하나 그에 한정되지 않는다.
처리 모듈(410)는, 영상을 정규화 처리하여, 소정 크기의 영상을 얻도록 구성된다.
패턴 인식은, 일반적으로 복수 개의 영상의 특징 추출에 관계된다.
영상에 대한 특징 추출을 실시하기 전에, 처리 모듈(410)은 영상을 정규화 처리하고, 영상이 통일 처리되도록, 크기가 다른 영상을 소정 크기의 영상으로 처리한다.
구획 모듈(420)은 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하도록 구성된다.
구획 모듈(420)의 정규화 처리 후의 영상에 대한 구획 단계는, 영상을 복수 개의 블록으로 구획한 다음, 각 블록을 복수 개의 셀로 구획하는 단계를 포함하는 것이 바람직하다.
구획 모듈(420)의 정규화 처리 후의 영상에 대한 구획 단계는, 영상을 복수 개의 셀로 구획하고, 서로 인접된 셀을 한 개의 블록으로 구성하는 단계를 포함하는 것이 바람직하고, 각 블록에는 복수 개의 셀이 포함되며, 예를 들면, 둘둘씩 인접하는 4개의 전자형으로 배열된 셀로 한 개의 블록을 구성한다.
본 실시예에 있어서, 구획 모듈(420)의 영상 구획 과정에 있어서, 블록으로 구획과 셀로 구획의 순서를 구체적으로 한정하지 않고, 먼저 블록으로 구획한 다음 셀로 구획할 수도 있고, 먼저 셀로 구획한 다음 블록으로 구성할 수도 있다.
본 실시예에 있어서, 구획 모듈(420)에 의해 영상을 구획하는 블록과 블록 사이에 중첩 영역이 존재하는지 여부에 대해서는 구체적으로 한정하지 않고, 블록과 블록 사이에는 중첩 영역이 존재할 수도 있고, 존재하지 않을 수도 있다.
분해 모듈(440)은, 상기 각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻도록 구성된다.
희박 신호 분해는 지정한 관측 신호를 분해 규칙에 따라 희박 벡터로 변경시키는 것을 가리키며, 상기 희박 벡터에서 복수 개의 요소의 값이 영이다.
본 실시예에 있어서, 분해 모듈(440)은 아래의 서브 모듈을 포함할 수 있다.
제1조절 서브 모듈(441)은, 각 셀의 픽셀을 n*1차원의 벡터로 조절하도록 구성된다.
영상을 구획한 후, 각 셀에서의 픽셀을 한 개의 매트릭스로 볼 수 있고, 제1조절 서브 모듈(441)은 각 셀에서의 픽셀에 대응하는 매트릭스를 n*1차원의 벡터로 조절한다.
신호 분해 서브 모듈(442)는, 아래의 공식에 의해, 각 셀의 벡터에 대한 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻도록 구성되어 있다.
min (x)∥x∥ 1 subject to y= Dx
y는 상기 각 셀의 벡터이고, D는 미리 설정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전D에서 희박화하여 얻은 희박 벡터이고, ∥x 1 는 희박 벡터 x의 각 열의 절대값에 대한 합을 표시하며, 각 희박 벡터는 m*1차원의 벡터이고, 과완전 사전D는 n*m의 매트릭스이다.
영상에서의 각 셀에 대하여, 단말기는 과완전 사전D에 대해 미리 설정하고, 각 셀에서의 벡터를 지정된 관측 신호y로 하면, 신호 분해 서브 모듈(442)는 상기 공식에 의해 각 셀에서의 벡터의 미리 지정된 과완전 사전D에서의 희박 벡터x를 계산한다. 각 셀에서의 조절 후의 벡터가 n*1차원이기 때문에, 단말기에 의해 미리 설정된 과완전 사전D는 n*m의 매트릭스이고, 상기 공식에 의해 산출한 각 셀에서의 벡터에 대응하는 희박 벡터는 m*1차원이다.
추출 모듈(460)은, 희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하도록 구성된다.
본 실시예에 있어서, 추출 모듈(460)은 아래의 서브 모듈을 포함할 수 있다.
계산 서브 모듈(461)은, 주파수 영역에서의 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 각 셀의 서술인자를 얻도록 구성되어 있다.
그라데이션 연산자의 계산 서브 모듈(461)에 의해 DCT변환 또는 DFT변환 후의 각 셀에서의 각 픽셀의 가로 그라데이션 및 세로 그라데이션을 계산한다.
본 실시예에서는 그라데이션 연산자의 선택에 대해 구체적으로 한정하지 않는다.
픽셀의 가로 그라데이션이 이고, 세로 그라데이션이 인 경우, 각 픽셀의 그라데이션 방향 및 그라데이션 크기의 계산은 각각 아래의 공식(1) 및 공식(2)에 의해 얻는다.
θ(x,y) = tan -1 [V(x,y)/H(x,y)] (1)
m( x,y ) = {H( x,y ) 2 + V( x,y ) 2 ] 1/2 ( 2)
여기서, θ( x,y )는 픽셀 ( x,y )의 그라데이션 방향이고, m( x,y )는 픽셀 ( x,y )의 그라데이션 크기이다.
그라데이션 방향 θ( x,y )의 적용 범위는 -90도~90도이고, 그라데이션 방향 θ(x,y)을 평균 z부분으로 나누며, 각 셀에서의 모든 픽셀을 가중치 m( x,y )에 의해 그라데이션 방향에서 구획된 각 부분를 통계하고, 마지막으로 각 셀에서 하나의 z차원의 벡터를 얻으며, 즉 각 셀에 대응하는 서술인자를 얻는다.
본 실시예에 있어서, 그라데이션 방향을 몇 개의 부분으로 나누는가에 대해서는 구체적으로 한정하지 않는다.
제1통계 서브 모듈(462)는, 주파수 영역에서 각 블록 내의 각 서술인자를 통계하여, 각 블록의 HOG 특징을 얻도록 구성되어 있다.
제1통계 서브 모듈(462)는 각 블록 내에 포함되는 각 셀에서 계산한 서술인자를 통계하여, 각 블록의 HOG 특징을 얻는다.
각 셀에서 계산한 서술인자를 통계하는 경우, 제1통계 서브 모듈(462)는 각 셀에 대응하는 서술인자를 직렬 연결하여, 각 블록의 HOG 특징을 하나의 벡터로 하고, 상기 벡터의 차원 수는 상기 블록 내에 포함된 셀에 대응하는 서술인자의 차원 수의 k배이다.
제2통계 서브 모듈(463)은, 영상의 주파수 영역에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻도록 구성되어 있다.
제2통계 서브 모듈(463)은 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻는다.
제2통계 서브 모듈(463)은, 영상에서의 각 블록의 HOG 특징을 한 개의 매트릭스로 직렬 연결하여, 영상의 HOG 특징을 얻도록 구성되고, 매트릭스의 각 열은 한 개 블록의 HOG 특징인 것이 바람직하다.
상술한 바와 같이, 본 발명의 실시예에 따른 특징 추출 장치는, 영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고; 각 셀에서의 픽셀을 n*1차원의 벡터로 조절하며; 공식을 이용하여, 각 셀에서의 벡터에 대한 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻고; 희박 벡터에 의해 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 각 셀의 서술인자를 얻으며; 각 블록 내의 각 서술인자를 통계하여, 각 블록의 HOG 특징을 얻고; 영상에서의 각 블록의 HOG 특징을 통계하여, 영상의 HOG 특징을 얻음으로써, HOG 특징을 추출하는 과정에서 영상의 공간 영역을 직접 계산하여 얻음으로 인한 패턴 인식에서의 검출율과 정확도가 낮은 문제점을 해결하고, 주파수 영역에서 영상의HOG 특징을 추출함으로써 패턴 인식에서의 검출율과 정확도를 향상시키는 효과를 달성할 수 있다.
도5에 도시된 바람직한 실시예에 있어서, 도6에 도시한 바와 같이, 제2통계 서브 모듈(463)은 아래의 서브 모듈을 포함할 수 있다.
제2조절 서브 모듈(610)은, 영상에서의 M*N개의 픽셀을 포함하는 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하도록 구성되어 있다.
각 블록의 HOG 특징은 각 셀에 대응하는 서술인자를 직렬 연결하여 얻게 되는 L*1차원의 벡터이고, 조절 서브 모듈(610)은 L*1차원의 벡터를 M*N의 매트릭스로 조절하며, 즉, 각 블록의 L*1차원의 벡터를 포함되는 셀에 의해 대응하는 매트릭스로 조절하고, 상기 대응하는 매트릭스의 각 열을 한 셀의 서술인자로 하며, 각 셀의 서술인자를 대응하는 픽셀에 따라 조절하고, 조절한 후에 얻은 매트릭스의 각 열을 대응하는 블록에서의 대응하는 열의 픽셀에 대응하는 HOG 특징으로 한다.
특징 추출 서브 모듈(620)은, 각 블록의 조절 후의 HOG 특징과 각 블록이 영상에서의 대응 위치에 의해, 영상의 HOG 특징을 얻도록 구성되어 있다.
특징 추출 서브 모듈(620)은 각 블록의 조절 후의 HOG 특징과 각 블록의 영상에서의 대응 위치에 의해, 영상에서의 대응하는 픽셀 위치의 HOG 특징을 얻는다.
상술한 바와 같이, 본 발명의 실시예에 따른 특징 추출 장치는, 영상에서의 M*N개의 픽셀을 포함하는 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하고; 각 블록의 조절 후의 HOG 특징 및 각 블록의 영상에서의 대응 위치에 의해, 영상의 HOG 특징을 얻음으로써, 추출 후의 영상의 HOG 특징과 영상에서의 각 블록의 대응 위치가 대응하게 하고, 영상에서의 각 블록의 특징을 더욱 뚜렷하게 할 수 있다.
상기 실시예에 있어서의 장치에 대하여, 각 모듈이 동작을 실행하는 구체적 형태에 대해서는 이미 상기 방법에 관계되는 실시예에서 상세히 설명하였으므로, 여기서 더 이상 상세한 설명을 하지 않는다.
본 발명의 예시적 일 실시예에 의한 특징 추출 장치는, 본 발명에 의한 특징 추출 방법을 구현할 수 있고, 상기 특징 추출 장치는,
프로세서와 프로세서의 실행 가능한 명령을 기억하는 메모리를 포함하고,
상기 프로세서는,
영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고;
각 셀에 대한 희박 신호 분해를 실시하여, 각 셀에 대응하는 희박 벡터를 얻으며;
희박 벡터에 의해 영상의 방향 그라데이션 히스토그램(HOG) 특징을 추출하도록 구성된다.
도7은 예시적 일 실시예에 따른 특징 추출 장치의 블록도이다. 예를 들면, 장치(700)은 휴대폰, 컴퓨터, 디지털 방송 단말기, 메시지 송수신 장치, 게임 콘솔, 태블릿 장치, 의료 설비, 운동 기구, 개인 휴대 정보 단말기기 등일 수 있다.
도7에 도시한 바와 같이, 장치(700)는, 프로세서 부품(702), 메모리(704), 전원 부품(706), 멀티미디어 부품(708), 오디오 부품(710), 입력/출력(I/O) 인터페이스(712), 센서 부품(714), 및 통신 부품(716) 중 한 개 또는 복수 개의 부품을 포함할 수 있다.
프로세서 부품(702)은, 일반적으로 장치(700)의 전체 동작, 예를 들면, 표시, 전화 호출, 데이터 통신, 카메라 동작 및 기록 동작에 관계되는 동작을 제어한다. 프로세서 부품(702)는, 상기 방법의 전부 또는 부분적 단계를 완성하기 위하여, 명령을 실행하는 한 개 또는 복수 개의 프로세서(718)를 포함할 수 있다. 또한, 프로세서 부품(702)은, 프로세서 부품(702)과 기타 부품 사이의 연동를 위해 한 개 또는 복수 개의 모듈을 포함할 수 있다. 예를 들면, 멀티미디어 부품(708)과 프로세서 부품(702) 사이의 연동를 위해, 프로세서 부품(702)는 멀티미디어 모듈을 포함할 수 있다.
메모리(704)는, 장치(700)에 있어서의 동작을 지원하기 위하여, 다양한 유형의 데이터를 기억하도록 구성되어 있다. 이러한 데이터의 사례는, 장치(700)에서 동작하는 모든 응용 프로그램 또는 방법의 명령, 연락자 데이터, 전화 번호부 데이터, 메시지, 사진, 비디오 등을 포함한다. 메모리(704)는 임의의 유형의 휘발성 또는 비휘발성 기억 장치 또는 그들의 조합, 예를 들면 정적 램(SRAM), 전기적 재기록 가능 롬(EEPROM), 이피롬(EPROM), 피롬(PROM), 읽기 전용 메모리(ROM), 자기 메모리, 플래쉬 메모리, 자기 디스크 또는 콤팩트 디스크에 의하여 달성할 수 있다.
전원 부품(706)은 장치(700)의 각 부품에 전력을 공급한다. 전원 부품(706)은 전원 관리 시스템, 한 개 또는 복수 개의 전원, 및 기타의 장치(700)을 위해 전력을 생성, 관리 및 배치하는데 관계되는 부품을 포함할 수 있다.
멀티미디어 부품(708)은 상기 장치(700)과 사용자 사이에서 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 실시예에 있어서, 스크린은 액정 디스플레이(LCD) 및 터치 패널(TP)을 포함할 수 있다. 스크린이 터치 패널을 포함하는 경우, 스크린은 터치 스크린으로 구현될 수 있고, 사용자가 전송하는 입력 신호를 수신한다. 터치 페널은 터치, 스와이핑 및 터치 패널에서의 제스처를 감지하는 한 개 또는 복수 개의 터치 센서를 포함한다. 터치 센서는 터치 또는 스와이핑 동작의 한계를 감지할 수 있을 뿐만 아니라, 또한 상기 터치 또는 스와이핑 동작의 지속 시간과 압력을 검출할 수 있다. 일부 실시예에 있어서, 멀티미디어 부품(708)은, 전면 카메라 및/또는 후면 카메라를 포함한다. 장치(700)이 동작 모드, 예를 들면 촬영 모드 또는 비디오 모드일 때, 전면 카메라 및/또는 후면 카메라는 외부의 멀티미디어 데이터를 수신할 수 있다. 각 전면 카메라와 후면 카메라는 고정된 광학 렌즈 시스템일 수도 있고, 또는 초점 거리와 광학 줌 능력을 갖고 있다
오디오 부품(710)은 오디오 신호를 출력 및/또는 입력하도록 구성되어 있다. 예를 들면, 오디오 부품(710)은 마이크(MIC)를 포함하고, 장치(700)이 동작 상태, 예를 들면, 호출 상태, 기록 상태 및 음성 인식 상태일 때, 마이크는 외부 오디오 신호를 수신하도록 구성되어 있다. 상기 수신한 오디오 신호는 메모리(704)에 기억되거나 또는 통신 부품(716)에 의하여 송신될 수 있다. 일부 실시예에 있어서, 오디오 부품(710)은 오디에 신호를 출력하는 스피커를 더 포함한다.
I/O 인터페이스(712)는 프로세서 부품(702)와 주변 인터페이스 모듈 사이에 인터페이스를 제공하고, 상기 주변 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 음량 버튼, 시작 버튼 및 잠금 버튼을 포함할 수 있으나 이에 한정되지 않는다.
센서 부품(714)는 한 개 또는 복수 개의 센서를 포함하고, 장치(700)에 각 측면의 상태 평가를 제공하는데 사용된다. 예를 들면, 센서 부품(714)는 장치(700)의 ON/OFF 상태, 부품의 상대 위치 결정, 예를 들면, 부품이 장치(700)의 모니터와 숫자판임을 검출할 수 있고, 센서 부품(714)는 또한 장치(700) 또는 장치(700)의 한 부품의 위치 변경, 사용자와 장치(700) 사이의 접촉의 유무, 장치(700)의 방위 또는 가속도/감속도 및 장치(700)의 온도 변화를 검출할 수 있다. 센서 부품(714)는 근접 센서를 포함할 수 있고, 그 어떤 물리적 접촉도 없을 때 주변 물체의 존재를 검출하도록 구성되어 있다. 센서 부품(714)는 또한 광 센서, 예를 들면, CMOS 또는 CCD 영상 센서를 포함할 수 있고, 이미지화 응용에서 사용된다. 일부 실시예에 있어서, 상기 센서 부품(714)는 또한 가속도 센서, 자이로 센서, 자기 센서, 압력 센서 또는 온도 센서를 포함할 수 있다.
통신 부품(716)은 장치(700)와 기타 장치 사이의 유선 또는 무선 형태의 통신에 편리하도록 구성되어 있다. 장치(700)는 통신 기준에 따른 무선 네트워크, 예를 들면, Wi-Fi, 2G 또는 3G, 또는 그들의 조합에 접속할 수 있다. 일 예시적 실시예에 있어서, 통신 부품(716)은 방송 채널을 통해 외부 방송 관리 시스템으로부터의 방송 신호 또는 방송의 관련 정보를 수신한다. 일 예시적 실시예에 있어서, 통신 부품(716)은 단거리 통신을 추진하기 위한 근거리 무선 통신 (NFC) 모듈을 더 포함한다. 예를 들면, NFC모듈은 무선주파수 인식(RFID) 기술, 적외선 무선 통신(lrDA) 기술, 초광대역(UWB) 기술, 블루투스(BT) 기술과 기타 기술에 의해 구현할 수 있다.
예시적 실시예에 있어서, 장치(700)는 한 개 또는 복수 개의 응용 주문형 직접회로(ASIC), 디지털 신호 처리기(DSP), 디지털 신호 처리 장치(DSPD), 프로그램 가능 논리 소자(PLD), 필드 프로그래머블 게이트 어레이(FPGA), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 기타 전자 부품에 의해 구현될 수 있고, 특징 추출 방법을 실행하는데 사용된다.
예시적 실시예에 있어서, 또한 명령을 포함하는 비일시적 컴퓨터 판독가능한 매체, 예를 들면, 명령을 포함하는 메모리(704)를 제공하고, 특징 추출 방법을 수행하기 위하여, 상기 명령은 장치(700)의 프로세서(718)에 의하여 실행할 수 있다. 예를 들면, 비일시적 컴퓨터 판독가능한 매체는 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 자기 테이프, 플로피 디스크 및 광 데이터 저장 장치 등일 수도 있다.
당업자라면, 명세서를 고려하고 여기에 개시된 발명을 실천한 후, 본 발명의 기타 실시형태를 쉽게 생각하게 될 것이다. 본 출원은 본 발명의 모든 변형, 용도 또는 적응성 변화를 포함하도록 하고, 이러한 변형, 용도 또는 적응성 변화는 본 발명의 일반적 원리에 따르고, 본 발명에 개시되지 않은 당해 기술분야의 일반 지식 또는 관용적 기술 수단을 포함한다. 명세서와 실시예는 예시적인 것에 불과하고, 본 발명의 실질적 범위와 주지는 아래의 청구범위에 의해 결정된다.
본 발명은 위와 같이 설명되고 도면에서 도시된 정확한 구조에 한정되지 않으며, 그 범위를 벗어나지 않는다면 다양한 수정 및 변경을 실시할 수 있다는 것을 이해하여야 할 것이다. 본 발명의 범위는 첨부된 청구 범위에 의해 한정된다.

Claims (13)

  1. 특징 추출 방법에 있어서,
    영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하는 단계;
    상기 각 셀에 대한 희박 신호 분해를 실시하여, 상기 각 셀에 대응하는 희박 벡터를 얻는 단계;
    상기 희박 벡터에 의해 상기 영상의 방향 그라데이션 히스토그램(HOG)의 특징을 추출하는 단계;를 포함하고,
    상기 각 셀에 대한 희박 신호 분해를 실시하여, 상기 각 셀에 대응하는 희박 벡터를 얻는 단계는,
    상기 각 셀의 픽셀을 n*1차원의 벡터로 조절하는 단계;
    아래의 공식을 이용하여, 상기 각 셀의 상기 벡터에 대해 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻는 단계;를 포함하고,
    min(x)∥x∥1 subject to y=Dx
    y는 상기 각 셀의 상기 벡터이고, D는 미리 지정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전D에서 희박화하여 얻은 희박 벡터이고, ∥x∥1 는 상기 희박 벡터x의 각 열의 절대값에 대한 합을 표시하고, 상기 각 희박 벡터는 m*1차원의 벡터이며, 상기 과완전 사전D는 n*m의 매트릭스인 것을 특징으로 하는 방법.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 희박 벡터에 의해 상기 영상의 방향 그라데이션 히스토그램(HOG)의 특징을 추출하는 단계는,
    상기 희박 벡터에 의해 상기 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 상기 각 셀의 서술인자를 얻는 단계;
    각 블록 내의 각 서술인자를 통계하여, 상기 각 블록의 HOG 특징을 얻는 단계;
    상기 영상에서의 상기 각 블록의 HOG 특징을 통계하여, 상기 영상의 HOG 특징을 얻는 단계;를 포함하는 것을 특징으로 하는 방법.
  4. 제 3 항에 있어서,
    상기 영상에서의 상기 각 블록의 HOG 특징을 통계하여, 상기 영상의 HOG 특징을 얻는 단계는,
    상기 영상에서의 상기 각 블록의 HOG 특징을 한 개의 매트릭스로 직렬 연결하여, 상기 영상의 HOG 특징을 얻는 단계;
    를 포함하고,
    상기 매트릭스의 각 열은 한 개 블록의 HOG 특징인 것을 특징으로 하는 방법.
  5. 제 3 항에 있어서,
    상기 영상에서의 상기 각 블록의 HOG 특징을 통계하여, 상기 영상의 HOG 특징을 얻는 단계는,
    상기 영상에서의 M*N개의 픽셀을 포함하는 상기 각 블록의 HOG 특징을 초기의 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하는 단계;
    상기 각 블록의 조절 후의 상기 HOG 특징 및 상기 각 블록의 상기 영상에서의 대응 위치에 의해, 상기 영상의 HOG 특징을 얻는 단계;를 포함하는 것을 특징으로 하는 방법.
  6. 제 1 항 및 제 3 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 영상을 정규화 처리하여, 소정 크기의 영상을 얻는 단계;를 더 포함하는 것을 특징으로 하는 방법.
  7. 특징 추출 장치에 있어서,
    영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하는 구획 모듈;
    상기 각 셀에 대한 희박 신호 분해를 실시하여, 상기 각 셀에 대응하는 희박 벡터를 얻는 분해 모듈;
    상기 희박 벡터에 의해 상기 영상의 방향 그라데이션 히스토그램(HOG)의 특징을 추출하는 추출 모듈;을 포함하고,
    상기 분해 모듈은,
    상기 각 셀의 픽셀을 n*1차원의 벡터로 조절하는 제1조절 서브 모듈;
    아래의 공식을 이용하여, 상기 각 셀의 상기 벡터에 대해 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻는 신호 분해 서브 모듈;을 포함하고,
    min(x)∥x∥1 subject to y=Dx
    y는 상기 각 셀의 상기 벡터이고, D는 미리 설정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전D에서 희박화하여 얻은 희박 벡터이고, ∥x∥1 는 상기 희박 벡터x의 각 열의 절대값에 대한 합을 표시하고, 상기 각 희박 벡터는 m*1차원의 벡터이며, 상기 과완전 사전D는 n*m의 매트릭스인 것을 특징으로 하는 장치.
  8. 삭제
  9. 제 7 항에 있어서,
    상기 추출 모듈은,
    상기 희박 벡터에 의해 상기 각 셀의 그라데이션 크기 및 그라데이션 방향을 계산하여, 상기 각 셀의 서술인자를 얻는 계산 서브 모듈;
    각 블록 내의 각 서술인자를 통계하여, 상기 각 블록의 HOG 특징을 얻는 제1통계 서브 모듈;
    상기 영상에서의 상기 각 블록의 HOG 특징을 통계하여, 상기 영상의 HOG 특징을 얻는 제2통계 서브 모듈;을 포함하는 것을 특징으로 하는 장치.
  10. 제 9 항에 있어서,
    상기 제2통계 서브 모듈은, 상기 영상에서의 상기 각 블록의 HOG 특징을 한 개의 매트릭스로 직렬 연결하여, 상기 영상의 HOG 특징을 얻고,
    상기 매트릭스의 각 열은 한 개 블록의 HOG 특징인 것을 특징으로 하는 장치.
  11. 제 9 항에 있어서,
    상기 제2통계 서브 모듈은,
    상기 영상에서의 M*N개의 픽셀을 포함하는 상기 각 블록의 HOG 특징을 초기 L*1(L=M*N)차원의 벡터에서 M*N의 매트릭스로 조절하는 제2조절 서브 모듈;
    상기 각 블록의 조절 후의 상기 HOG 특징 및 상기 각 블록의 상기 영상에서의 대응 위치에 의해, 상기 영상의 HOG 특징을 얻는 특징 추출 서브 모듈;을 포함하는 것을 특징으로 하는 장치.
  12. 제 7 항 및 제 9 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 영상을 정규화 처리하여, 소정 크기의 상기 영상을 얻는 처리 모듈;을 더 포함하는 것을 특징으로 하는 장치.
  13. 특징 추출 장치에 있어서,
    프로세서;
    프로세서의 실행 가능한 명령을 기억하는 메모리를 포함하고,
    상기 프로세서는,
    영상을 복수 개의 셀을 포함하는 복수 개의 블록으로 구획하고;
    상기 각 셀에 대한 희박 신호 분해를 실시하여, 상기 각 셀에 대응하는 희박 벡터를 얻으며;
    상기 희박 벡터에 의해 상기 영상의 방향 그라데이션 히스토그램(HOG)의 특징을 추출하고,
    상기 각 셀에 대한 희박 신호 분해를 실시하여, 상기 각 셀에 대응하는 희박 벡터를 얻는 것은,
    상기 각 셀의 픽셀을 n*1차원의 벡터로 조절하는 것;
    아래의 공식을 이용하여, 상기 각 셀의 상기 벡터에 대해 희박 신호 분해를 실시하여, 대응하는 희박 벡터를 얻는 단계;를 포함하고,
    min(x)∥x∥1 subject to y=Dx
    y는 상기 각 셀의 상기 벡터이고, D는 미리 지정한 과완전 사전(Overcomplete Dictionary)이며, x는 y가 상기 과완전 사전D에서 희박화하여 얻은 희박 벡터이고, ∥x∥1 는 상기 희박 벡터x의 각 열의 절대값에 대한 합을 표시하고, 상기 각 희박 벡터는 m*1차원의 벡터이며, 상기 과완전 사전D는 n*m의 매트릭스인 것을 특징으로 하는 장치.
KR1020167005594A 2015-11-25 2015-12-29 특징 추출 방법 및 장치 KR101756605B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510827753.4A CN105654092B (zh) 2015-11-25 2015-11-25 特征提取方法及装置
CN201510827753.4 2015-11-25
PCT/CN2015/099312 WO2017088250A1 (zh) 2015-11-25 2015-12-29 特征提取方法及装置

Publications (2)

Publication Number Publication Date
KR20170074215A KR20170074215A (ko) 2017-06-29
KR101756605B1 true KR101756605B1 (ko) 2017-07-10

Family

ID=56481853

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167005594A KR101756605B1 (ko) 2015-11-25 2015-12-29 특징 추출 방법 및 장치

Country Status (8)

Country Link
US (1) US10282637B2 (ko)
EP (1) EP3173978A1 (ko)
JP (1) JP2018507495A (ko)
KR (1) KR101756605B1 (ko)
CN (1) CN105654092B (ko)
MX (1) MX360590B (ko)
RU (1) RU2635267C2 (ko)
WO (1) WO2017088250A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及系统
CN108460899A (zh) * 2017-02-20 2018-08-28 深圳怡化电脑股份有限公司 一种图像特征识别方法和装置
CN108182442B (zh) * 2017-12-29 2022-03-15 惠州华阳通用电子有限公司 一种图像特征提取方法
CN109522910B (zh) * 2018-12-25 2020-12-11 浙江商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN111167731B (zh) * 2019-10-23 2022-11-08 武汉库柏特科技有限公司 一种产品分拣方法、产品分拣系统和智能分拣机器人
CN111914741B (zh) * 2020-07-30 2024-04-19 云知声智能科技股份有限公司 房产证识别方法、装置和设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011521355A (ja) * 2008-05-15 2011-07-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 勾配ヒストグラムを用いた指紋表現

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0757077A (ja) 1993-08-13 1995-03-03 Ricoh Co Ltd 画像処理装置
WO2007050680A2 (en) * 2005-10-25 2007-05-03 William Marsh Rice University Method and apparatus for on-line compressed sensing
US8184915B2 (en) * 2006-12-04 2012-05-22 Lockheed Martin Corporation Device and method for fast computation of region based image features
US8457414B2 (en) * 2009-08-03 2013-06-04 National Instruments Corporation Detection of textural defects using a one class support vector machine
US8855190B2 (en) * 2009-10-21 2014-10-07 Futurewei Technologies, Inc. Communication system with compressive sensing
WO2011061709A1 (en) * 2009-11-19 2011-05-26 Nokia Corporation Method and apparatus for tracking and recognition with rotation invariant feature descriptors
US20110142335A1 (en) * 2009-12-11 2011-06-16 Bernard Ghanem Image Comparison System and Method
US8774499B2 (en) * 2011-02-28 2014-07-08 Seiko Epson Corporation Embedded optical flow features
US8494305B2 (en) * 2011-12-20 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Image filtering by sparse reconstruction on affinity net
JP2014016710A (ja) * 2012-07-06 2014-01-30 Toyota Central R&D Labs Inc 対象物検出装置及びプログラム
JP2015529365A (ja) 2012-09-05 2015-10-05 エレメント,インク. カメラ付きデバイスに関連する生体認証のためのシステム及び方法
GB201313125D0 (en) * 2013-07-23 2013-09-04 Univ Singapore Technology & Design Method and system for classifying images
TWI513291B (zh) * 2013-12-12 2015-12-11 Ind Tech Res Inst 影像處理的方法、裝置及電腦可讀取媒體
JP2015125662A (ja) * 2013-12-27 2015-07-06 株式会社リコー 物体識別プログラム及び装置
KR101791518B1 (ko) 2014-01-23 2017-10-30 삼성전자주식회사 사용자 인증 방법 및 장치
CN103761537B (zh) * 2014-02-07 2017-02-15 重庆市国土资源和房屋勘测规划院 基于低秩优化特征字典模型的图像分类方法
CN104239872A (zh) * 2014-09-26 2014-12-24 南开大学 异态汉字识别方法
CN104657717B (zh) * 2015-02-12 2018-02-02 合肥工业大学 一种基于分层核稀疏表示的行人检测方法
CN104850852B (zh) * 2015-04-27 2018-06-12 小米科技有限责任公司 特征向量计算方法和装置
US9727785B2 (en) * 2015-06-18 2017-08-08 The Boeing Company Method and apparatus for tracking targets
US9875213B2 (en) * 2015-06-26 2018-01-23 Intel Corporation Methods, apparatus, instructions and logic to provide vector packed histogram functionality
CN105654094B (zh) * 2015-11-25 2019-11-29 小米科技有限责任公司 特征提取方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011521355A (ja) * 2008-05-15 2011-07-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 勾配ヒストグラムを用いた指紋表現

Also Published As

Publication number Publication date
EP3173978A1 (en) 2017-05-31
US10282637B2 (en) 2019-05-07
CN105654092A (zh) 2016-06-08
RU2635267C2 (ru) 2017-11-09
RU2016110719A (ru) 2017-09-28
KR20170074215A (ko) 2017-06-29
MX360590B (es) 2018-11-08
WO2017088250A1 (zh) 2017-06-01
US20170147899A1 (en) 2017-05-25
CN105654092B (zh) 2019-08-30
JP2018507495A (ja) 2018-03-15
MX2016003767A (es) 2017-07-31

Similar Documents

Publication Publication Date Title
KR101756605B1 (ko) 특징 추출 방법 및 장치
KR101754046B1 (ko) 특징 추출 방법 및 장치
CN107944367B (zh) 人脸关键点检测方法及装置
CN109034150B (zh) 图像处理方法及装置
CN108009563B (zh) 图像处理方法、装置及终端
KR101792961B1 (ko) 특징 추출 방법 및 장치
EP3040912A1 (en) Method and device for classifying pictures
CN107025441B (zh) 肤色检测方法及装置
CN112219224A (zh) 图像处理方法及装置、电子设备和存储介质
CN105208284A (zh) 拍摄提醒方法及装置
US9665925B2 (en) Method and terminal device for retargeting images
CN107292901B (zh) 边缘检测方法及装置
CN104539846A (zh) 拍摄图片的方法、装置及终端
CN105635573A (zh) 摄像头视角调整方法和装置
CN106131403B (zh) 触摸对焦方法及装置
CN111985280B (zh) 图像处理方法及装置
CN112070681B (zh) 图像处理方法及装置
EP4064180A1 (en) Depth of field based creation of a blurred image
CN109376588B (zh) 一种人脸测光点选取方法、装置和拍摄设备
US20140301651A1 (en) Method and device for performing spatial filtering process on image
CN116563563A (zh) 图像异常检测方法、装置、终端及存储介质
CN116524286A (zh) 图像特征检测方法、装置、电子设备及存储介质
CN111986097A (zh) 图像处理方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant