KR100949893B1 - 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치 - Google Patents

텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치 Download PDF

Info

Publication number
KR100949893B1
KR100949893B1 KR1020080039219A KR20080039219A KR100949893B1 KR 100949893 B1 KR100949893 B1 KR 100949893B1 KR 1020080039219 A KR1020080039219 A KR 1020080039219A KR 20080039219 A KR20080039219 A KR 20080039219A KR 100949893 B1 KR100949893 B1 KR 100949893B1
Authority
KR
South Korea
Prior art keywords
image data
data
tensor
low
similarity
Prior art date
Application number
KR1020080039219A
Other languages
English (en)
Other versions
KR20090113481A (ko
Inventor
박혜영
윤동우
Original Assignee
경북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경북대학교 산학협력단 filed Critical 경북대학교 산학협력단
Priority to KR1020080039219A priority Critical patent/KR100949893B1/ko
Publication of KR20090113481A publication Critical patent/KR20090113481A/ko
Application granted granted Critical
Publication of KR100949893B1 publication Critical patent/KR100949893B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/35Determination of transform parameters for the alignment of images, i.e. image registration using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 고차원의 영상 데이터에 텐서 개념을 적용하여 저차원 텐서 데이터로 표현하고, 이를 바탕으로 핵심 정보를 추출함으로써 고차원의 영상 데이터를 효율적으로 분류할 수 있는 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치에 관한 것으로서, 2차 텐서로 표현된 동일 클래스에 속한 저차원 텐서 데이터간의 차의 확률 밀도 함수를 이용하여 두 영상 데이터 간의 유사도 함수를 정의하고, 상기 정의한 유사도 함수를 이용하여 입력되는 영상 데이터를 분류한다.
영상 데이터, 텐서, 유사도 함수, 텐서 PCA(Principal Component Analysis)

Description

텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치{Method and Apparatus for Classificating Image-data Using Tensor Data}
본 발명은 생체 데이터를 포함하는 영상 데이터를 특정 목적에 맞추어 분류하기 위한 영상 데이터 분류에 관한 것으로서, 더욱 상세하게는 텐서 개념을 적용하여 고차원의 영상 데이터를 저차원 텐서 데이터로 변환하고 이로부터 분류에 필요한 핵심 정보를 효율적으로 추출하여 유사도함수를 정의함으로써 영상 데이터를 분류하는 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치에 관한 것이다.
생체 데이터란 생명체로부터 얻을 수 있는 고유의 생체 신호를 일컫는 것으로서, 생체 인식을 이용한 보안 산업, 생물 정보 산업, 의료 산업 등 다양한 분야에서 사용되고 있으며, 대표적인 생체 데이터로서 지문, 홍채, 얼굴 표정 등을 들 수 있는데 이들은 영상 데이터로 제공된다.
이러한 영상 데이터는 개개인의 클래스로부터 얻을 수 있는 데이터의 수가 제한적이고 차원이 높다는 특성이 있으며, 이러한 특성은 생체 데이터 처리 시스템의 성능을 떨어뜨리는 주요한 원인이 된다.
따라서 고 차원의 영상 데이터로부터 핵심 정보를 안정적으로 추출하여, 효율적으로 분류할 수 있는 데이터 처리 기술이 요구된다.
한편, 최근 고차원의 영상 데이터에 대한 새로운 접근 방법으로서 벡터의 개념을 확장한 텐서(Tensor) 개념을 적용한 연구가 활발히 수행되고 있다.
여기서, 텐서는 벡터를 일반화한 기하하적인 물리량을 말하는 것으로, 1차 텐서는 벡터, 2차 텐서는 행렬이 되고 그 이상의 차원을 n차 텐서라 한다.
본 발명은 고차원의 영상 데이터를 효율적으로 처리하기 위하여 제안된 것으로서, 고차원 영상 데이터에 텐서 개념을 적용하여 저차원 텐서 데이터로 표현하고, 이를 바탕으로 핵심 정보를 추출함으로써 고차원의 영상 데이터를 효율적으로 분류할 수 있는 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치를 제공하고자 한다.
상기 과제를 해결하기 위한 수단으로서, 본 발명은, 분류할 영상 데이터가 입력되면, 텐서 PCA를 이용하여 상기 입력된 영상 데이터를 저차원 텐서 데이터로 변환하는 단계; 동일 클래스에 속하는 학습용 영상의 저차원 텐서 데이터 간 차의 확률 밀도에 비례하여 정의된 유사도 함수를 통해 상기 분류할 영상 데이터와 학습용 영상데이터 간의 유사도를 산출하는 단계; 및 상기 산출된 유사도를 이용하여 상기 분류할 영상 데이터를 분류하는 단계;를 포함하는 텐서 데이터를 이용한 영상 데이터 분류 방법을 제공한다.
바람직하게는 상기 분류할 영상 데이터가 입력되기 전, 학습용 영상 데이터를 이용하여, 동일 클래스에 속하는 학습용 영상 데이터로부터 얻어지는 저차원 텐서 데이터들 간의 차에 대한 확률모델을 형성하고, 상기 확률모델에 따른 확률 밀도를 추정하여 데이터 간의 유사도 함수를 정의하는 단계를 더 포함할 수 있다.
바람직하게는 텐서 PCA를 이용하여 학습용 영상 데이터를 저차원 텐서 데이터로 변환하는 단계; 동일 클래스에 속하는 학습용 영상 데이터들의 저차원 텐서 데이터 차를 구하는 단계; 및 상기 학습용 영상 데이터의 저차원 텐서 데이터 차에 대한 확률모델을 형성하고, 상기 확률모델에 따른 확률 밀도 함수를 추정하여, 상기 확률 밀도 함수에 비례하도록 저차원 텐서데이터 간의 유사도 함수를 산출하는 단계를 포함하는 유사도 함수를 정의하는 단계를 포함할 수 있다.
삭제
특히 영상 데이터를 클래스에 의존하여 고유하게 정해지는 클래스 요인과, 클래스에 의존하지 않고 영상 데이터를 획득할 때 가해지는 노이즈를 결정하는 환경 요인을 가지는 2차 텐서로 표현하는 단계인 저차원의 텐서 데이터로 변환하는 단계를 포함할 수 있다.
특히 상기 유사도 함수는
Figure 112009072607937-pat00040

(여기서, X,X'는 영상 데이터의 2차 텐서, S(X,X')는 두 2차 텐서 X,X' 간의 유사도 함수, Uy, Vy는 두 저차원 텐서 데이터 차(Y=X-X')에 대한 직교 변환 행렬로 이에 의한 Y의 변환 값은
Figure 112009072607937-pat00041
이고,
Figure 112009072607937-pat00042
Figure 112009072607937-pat00043
는 상기 Z의 공분산 행렬이고, M은 두 영상 데이터 텐서 차의 평균 행렬이며, G는 평균 M과 공분산
Figure 112009072607937-pat00044
Figure 112009072607937-pat00045
를 가지는 행렬 정규 분포의 확률밀도함수이다.)
에 의해 산출되는 유사도 함수를 포함할 수 있다.
삭제
더하여, 본 발명은 상기 과제를 해결하기 위한 다른 수단으로서, 영상 데이터를 입력받는 입력부; 상기 입력부로 입력된 영상 데이터를 텐서 PCA를 이용하여 저차원 텐서 데이터로 변환하고, 동일 클래스에 속하는 학습용 영상데이터의 저차원 텐서 데이터 간의 확률 밀도에 비례하여 정의된 유사도 함수를 통해 상기 영상데이터와 학습용 영상 간의 유사도를 산출하고, 산출된 유사도에 근거하여 입력된 상기 영상데이터를 분류하는 제어부; 상기 제어부의 영상 데이터 분류 결과를 출력하는 출력부를 포함하는 텐서 데이터를 이용한 영상 데이터 분류 장치를 제공한다.
특히 상기 제어부의 영상 데이터 분류 결과에 따라서 영상 데이터를 저장하는 저장부를 더 포함할 수 있다.
바람직하게는 텐서 PCA를 이용하여 영상 데이터를 저차원 텐서 데이터로 변환하는 텐서 기반 데이터 변환 모듈; 상기 유사도 함수에 상기 텐서 기반 데이터 변환 모듈에서 변환된 저차원 텐서 데이터를 대입하여 상기 영상데이터와 학습용 영상데이터 간에 유사도를 구하고, 상기 유사도에 따라서 상기 영상 데이터를 분류하는 데이터 분류 모듈을 포함하는 제어부를 포함할 수 있다.
바람직하게는 동일 클래스에 속하는 두 학습용 영상 데이터의 저차원 텐서 데이터의 차를 이용하여 유사도 함수를 정의하는 유사도 함수 산출모듈을 더 포함하고, 학습용 영상 데이터를 상기 입력부로 입력받아, 상기 텐서 기반 데이터 변환 모듈을 이용하여 저차원 텐서 데이터로 변환한 후, 상기 저차원 텐서 데이터를 유사도 함수 산출모듈로 인가하여 상기 유사도 함수를 산출하는 제어부를 포함할 수 있다.
특히 영상 데이터를 클래스에 의존하여 고유하게 정해지는 클래스 요인과, 클래스에 의존하지 않고 영상 데이터를 획득할 때 가해지는 노이즈를 결정하는 환경 요인을 가지는 2차 텐서로 변환하는 텐서 기반 데이터 변환모듈을 포함할 수 있다.
특히
Figure 112009072607937-pat00046

(여기서, X,X'는 영상 데이터의 2차 텐서, S(X,X')는 두 2차 텐서 X,X' 간의 유사도 함수, Uy, Vy는 두 2차 텐서의 차(Y=X-X')에 대한 직교 변환 행렬로 이에 의한 Y의 변환 값은
Figure 112009072607937-pat00047
이고,
Figure 112009072607937-pat00048
Figure 112009072607937-pat00049
는 상기 Z의 공분산 행렬이고, M은 두 영상 데이터 텐서 차의 평균 행렬이며, G는 평균 M과 공분산
Figure 112009072607937-pat00050
Figure 112009072607937-pat00051
를 가지는 행렬 정규 분포의 확률밀도함수이다.)
로 산출하는 유사도 함수를 포함할 수 있다.
상술한 구성에 의하면, 본 발명은, 고차원의 영상 데이터를 텐서 개념을 이용하여 저차원 텐서 데이터로 변환함으로써 시스템 성능 저하를 방지할 수 있으며, 더하여, 상기 저차원 텐서 데이터를 이용하여 분류에 필요한 핵심 정보를 정확하고 안정적으로 추출하여 분류 결과의 신뢰성을 높일 수 있다.
이하 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있는 바람직한 실시 예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시 예에 대한 동작 원리를 상세하게 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
또한, 도면 전체에 걸쳐 유사한 기능 및 작용을 하는 부분에 대해서는 동일한 도면 부호를 사용한다.
덧붙여, 명세서 전체에서, 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 '직접적으로 연결'되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 '간접적으로 연결'되어 있는 경우도 포함한다. 또한 어떤 구성 요소를 '포함'한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
또한, '모듈'이란 용어는 특정한 기능이나 동작을 처리하는 하나의 단위를 의미하며, 이는 하드웨어 또는 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
본 발명은 텐서 데이터를 이용하여 고차원의 영상 데이터를 저차원 텐서 데이터로 차원을 축소하고, 이를 바탕으로 유사도 함수를 만들어 영상 데이터를 분류한다. 이하, 이러한 본 발명에 따른 영상 데이터 분류 방법을 단계별로 상세히 설명한다.
도 1은 본 발명의 바람직한 실시 예에 따른 텐서 데이터를 이용한 영상 데이터 분류 방법을 나타낸 흐름도이다.
도 1을 참조하면, 본 발명은 단계 S110에서, 하나 이상의 학습용 영상 데이터를 입력받는다. 그리고, 단계 S120에서, 상기 입력된 학습용 영상 데이터를 저차원 텐서 데이터로 변환한다. 이때, 상기 저차원 텐서 데이터로의 변환을 위해 텐서 PCA((Principal Component Analysis)을 사용한다.
본 발명의 일 실시 예에서는, 환경 요인과 클래스 요인을 가지는 데이터 생성 모델을 텐서 형태로 확장하여, 고차원의 영상 데이터를 저차원 텐서 데이터로 만든다. 특히, 본 발명에서는 영상 데이터가 가지는 지역적 특성을 표현하기 위하여 2차 텐서를 사용한다.
클래스 요인과 환경 요인을 가지는 영상 데이터의 2차 텐서는 수학식 1과 같이 표현할 수 있다.
Figure 112008030247402-pat00009
상기에서, Xk는 클래스 Ck에 속하는 하나의 영상 데이터를 2차원 입력 형태 그대로 두고 2차 텐서로 나타낸 것을 의미하고,
Figure 112008030247402-pat00010
Figure 112008030247402-pat00011
는 각각 2차 텐서로 표현된 클래스 요인과 환경 요인이다. 그리고, V 및 UT는 원래의 영상 데이터를 2차 텐서로 변환하기 위한 변환 행렬을 나타낸다.
상기에서, 클래스 요인
Figure 112008030247402-pat00012
은 클래스에 의존하여 고유하게 정해지는 값이며, 환경 요인
Figure 112008030247402-pat00013
는 클래스에 의존하지 않고 데이터를 획득할 때 가해지는 다양한 노이즈를 결정하는 것으로, 모든 클래스에 공통적인 분포 특성을 가진다고 가정할 수 있다.
다음으로 단계 S130에서, 동일 클래스에 속하는 두 학습용 저차원 텐서 데이터의 차를 계산하고, 단계 S140에서 상기 계산된 텐서 데이터 차의 확률 밀도 함수를 추정하여 유사도 함수를 구한다.
상기 단계 S130에서 구해지는 동일 클래스에 속하는 두 저차원 텐서 데이터의 차로 만들어지는 랜덤 변수 Y는 수학식 2와 같이 나타낼 수 있다.
Figure 112008030247402-pat00014
상기 수학식 2를 참조하면, 같은 클래스의 경우, 하나의 고유한 값으로 정해진다고 가정할 수 있는 클래스 요인이 상쇄되어 환경 요인만 남게 됨을 알 수 있다. 따라서, 이러한 환경 요인의 분포를 추정함으로써 동일 클래스에 속하는 학습용 영상간의 유사도 함수를 얻어낼 수 있다. 본 발명에서는 이와 같이 동일 클래스에 속하는 학습용 영상의 저차원 텐서 데이터의 차 Y의 확률 밀도 함수 p(Y)를 추정하여 유사도 함수를 정의한다.
더 구체적으로 설명하면, 추정된 p(Y)는 동일한 클래스에 속하는 저차원 텐서 데이터의 차에 대한 분포를 나타내므로, p(X-X')의 값이 클수록 두 저차원 텐서 데이터 X, X'가 같은 클래스에 속할 확률이 높다고 볼 수 있다. 따라서 두 저차원 텐서 데이터 간의 유사 관계를 나타내는 유사도 함수 S(X,X')는 p(X-X')에 비례하는 값으로 정의할 수 있다.
이하 본 발명의 일 실시 예로서, 환경 요인
Figure 112008030247402-pat00015
가 정규분포를 가지는 경우에 유사도 함수를 구하는 방법을 설명한다. 환경 요인
Figure 112008030247402-pat00016
가 정규분포를 따르는 경우, 상기 환경요인의 차로 이루어진 확률 변수 Y도 정규분포를 따른다. 본 발명의 실시 예에서는, 유사도 함수를 구하기 위하여 2차 텐서 형태의 확률 변수 Y를 사용하므로, 아래의 수학식 3과 같은 행렬 정규 분포(matrix normal distribution)로 나타낼 수 있다.
Figure 112008030247402-pat00017
여기서, M은 Y의 평균 행렬이고,
Figure 112008030247402-pat00018
는 Y의 각 행을 하나의 데이터로 보았을 때의 공분산행렬이고,
Figure 112008030247402-pat00019
는 Y의 각 열을 하나의 데이터로 보았을 때의 공분산 행렬이고, n과 p는 각각 확률 변수 Y의 열과 행의 크기를 나타낸다. 그리고, tr은 행렬의 모든 대각선 성분들의 합으로 구해진다. 상기 수학식 3에서 추정해 주어야 하는 파라미터는 M,
Figure 112008030247402-pat00020
,
Figure 112008030247402-pat00021
이다.
상기에서 평균 행렬 M은 단순히 Y의 데이터 집합으로부터 계산되는 표본 평균으로 추정할 수 있다. 그리고, 공분산 행렬에 있어서, Y의 각 열 yi를 하나의 데이터로 보았을 때의 표본 분산과, 각 행 yi을 하나의 데이터로 보았을 때의 표본 분산은 다음의 수학식 4와 같이 계산할 수 있다.
Figure 112008030247402-pat00022
본 발명에서는 상기 수학식 4를 그대로 이용하지 않고, Y에 대한 직교변환 행렬 Uy와 Vy를 각각 구하여 이에 의해 변환된 값
Figure 112008030247402-pat00023
를 얻어 사용한다. 이와 같이 추정된 파라미터를 이용하면, 두 저차원 텐서 데이터 X와 X'의 유사도 함수는 다음의 수학식 5와 같이 정의될 수 있다.
Figure 112008030247402-pat00024
상기 Z의 공분산 행렬
Figure 112008030247402-pat00025
Figure 112008030247402-pat00026
는 각각 표본 분산
Figure 112008030247402-pat00027
Figure 112008030247402-pat00028
의 공유치를 대각 원소로 가지는 대각 행렬로 얻어지므로, 역행렬의 계산이 간단해지고 또한 추정 파라미터의 수가 줄어들어 데이터에 대한 오버피팅을 피하는 효과를 얻을 수 있다.
상술한 단계 S110~S140은 실제 영상 데이터 분류가 이루어지기 전에 수행되며, 이후 상기 수학식 5와 같이 구해진 유사도 함수를 이용하여 입력된 영상 데이터를 분류한다.
더 구체적으로는, 단계 S150에서 분류할 영상 데이터가 입력되면, 단계 S160에서, 상기 분류할 영상 데이터를 저차원 텐서 데이터로 변환한 후, 단계 S170에서 상기 저차원 텐서 데이터를 앞서 구해진 유사도 함수에 대입하여 상기 입력된 영상 데이터와 학습용 영상 데이터 간의 유사도를 계산하고, 단계 S180에서 상기 계산된 유사도에 기초하여 상기 입력된 영상 데이터를 분류한다. 여기서, 유사도 함수를 이용한 분류를 위하여 K-근접이웃 분류기를 사용할 수 있다.
도 2는 본 발명에 의한 텐서 데이터를 이용한 영상 데이터 분류 장치의 개략적인 구성을 나타낸 블록도이다.
도 2를 참조하면, 본 발명에 의한 데이터 분류 장치는, 영상 데이터를 입력받는 입력부(210)와, 상기 입력부(210)로부터 입력된 영상 데이터를 본 발명에 따라 분류하는 제어부(220)와, 상기 제어부(220)에 의한 분류 결과를 저장하는 저장부(230)와, 상기 제어부(220)의 분류 결과를 출력하는 출력부(240)를 포함한다.
상기에서 제어부(220)는 도 1에 설명한 데이터 분류 방법에 따라서 동작하는데, 학습용 영상 데이터를 클래스 요인과 환경 요인을 갖는 저차원 텐서 데이터로 변환하고, 상기 저차원 텐서 데이터를 이용하여 유사도 함수를 산출하여 설정한 후, 이후 입력된 분류할 영상 데이터를 저차원 텐서 데이터로 변환한 후 이를 상기 유사도 함수에 대입하여 유사도를 구하고 상기 유사도에 따라서 상기 영상 데이터를 분류한다.
도 3은 본 발명에 의한 데이터 분류 장치에 있어서, 상기 제어부(220)의 상 세 구성을 나타낸 블록도로서, 이를 참조하면, 상기 제어부(220)는, 텐서 개념을 적용하여 입력된 영상 데이터를 저차원 텐서 데이터로 변환하는 텐서 기반 데이터 변환 모듈(310)과, 상기 텐서 기반 데이터 변환 모듈(310)에서 변환된 동일 클래스에 속하는 두 저차원 텐서 데이터의 차의 확률 밀도에 비례한 유사도 함수를 정의하는 유사도 함수 산출 모듈(320)와, 상기 유사도 함수 산출모듈(320)에서 산출된 유사도 함수에 상기 텐서 기반 데이터 변환 모듈(310)로부터 변환된 분류할 영상에 대한 저차원 텐서 데이터를 대입하여 유사도를 구하고 상기 유사도에 근거하여 영상 데이터를 분류하는 데이터 분류 모듈(330)을 포함하여 이루어진다. 상기 유사 함수 산출 모듈(320)은 필요에 따라 제외될 수 있다.
상기와 같이 구성된 제어부(220)는 학습 과정시, 상기 텐서 기반 데이터 변환 모듈(310)을 이용하여 학습용 영상 데이터를 저차원 텐서 데이터로 변환한 후, 이를 상기 유사도 함수 산출 모듈(320)에 제공하여 수학식 5와 같이 유사도 함수를 산출하여 설정한다. 이후의 분류 과정을 수행하는데 있어서, 상기 제어부(220)는 분류할 영상 데이터가 입력되면 이를 텐서 기반 데이터 변환 모듈(310)을 통해 저차원 텐서 데이터로 변환한 후, 상기 변환된 저차원 텐서 데이터를 분류 모듈(330)로 제공하여 상기 분류 모듈(330)이 상기 설정된 유사도 함수에 상기 저차원 텐서 데이터를 대입하여 유사도를 구한 후, 영상 데이터를 유사도에 기초하여 분류하도록 한다.
상술한 텐서 기반 데이터 변환 모듈(310)과 유사도 함수 산출 모듈(320)와 분류 모듈(330)의 동작은 앞서 설명한 도 1의 데이터 분류 방법을 참조함에 의해 더 쉽게 이해될 수 있다.
본 발명에 따른 영상 데이터 분류 방법의 성능을 평가하기 위하여, 기존의 방법과 본 발명에서 제안된 방법을 비교 실험하였다. 기존의 방법으로는, 일반적인 PCA 방법, 텐서 PCA 방법 그리고 2007년 정보과확회논문지:소프트웨어 및 응용 34(7)의 667~680 페이지의 "변형된 펙터 분석 모델을 이용한 생체데이터 분류 시스템"에서 사용된 DataPair 방법을 사용하였다.
실험 1에서는, 50명의 서로 다른 사람으로부터 각각 서로 다른 9개의 각도에서 획득한 70×50 크기의 영상 데이터를 이용하여 사람을 인식하도록 하는데, 개인당 3개의 영상 데이터를 학습용으로 사용한 후 나머지 6개의 영상 데이터로 테스트를 수행하였다. 그리고, 실험 2에서는 실험 1에서와 동일한 영상 데이터를 이용하여 포즈를 인식하도록 하며, 25명에 대한 영상 데이터를 학습용으로 사용하고 나머지 영상 데이터로 테스트를 수행하였다. 마지막으로 실험 3에서는, 69명의 서로 다른 사람의 4 가지 표정에 대한 90×80 크기의 영상 데이터를 이용하여 표정 인식을 수행하였으며, 상기 영상 데이터 중에서 20명에 대한 영상 데이터(총 80개)를 학습용으로 사용하고, 나머지 49명에 대한 영상 데이터로 테스트를 수행하였다.
상기 실험 1~3의 테스트 수행 결과는 다음의 표 1과 같다.
PCA DataPair 텐서 PCA 본 발명
실험 1 97.0(117) 96.7(14) 99.0(14×3) 99.7(15×1)
실험 2 36.4(65) 40.0(27) 36.4(21×4) 48.0(7×11)
실험 3 35.7(65) 37.6(79) 37.8(15×1) 56.6(25×1)
상기 표 1에 나타낸 값은 인식 성공률을 나타내고, 그 옆의 괄호안에 표시한 값은 영상 데이터의 축소된 차원을 나타낸다.
이상의 실험 결과를 참조하여 보면, 본 발명에 의한 데이터 분류 방법은, 기존에 제안된 다른 방법과 대비하여 볼 때, 더 나은 인식 성공률을 나타내는 것을 알 수 있다. 즉, 본 발명은 영상 데이터의 처리에 있어서 기존과 대비하여 성능 향상을 가져올 수 있으며, 특히 분류 대상이 되는 클래스에 나타난 특징이 지역적인 특성을 가지는 포즈 인식(실험 2)과 표정 인식(실험 3)의 경우 성능 향상의 효과가 훨씬 두드러짐을 알 수 있다.
이상에서 설명한 본 발명은 전술한 실시 예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경할 수 있다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 당업자에게 있어 명백할 것이다.
본 발명은 영상 데이터의 분류 및 특징 추출 분야에 적용되어, 영상 데이터를 안정적으로 분류하고, 시스템의 성능을 향상시킬 수 있다.
도 1은 본 발명에 의한 텐서 데이터를 이용한 영상 데이터 분류 방법을 나타낸 흐름도이다.
도 2는 본 발명에 의한 텐서 데이터를 이용한 영상 데이터 분류 장치의 기본 구성을 나타낸 블록도이다.
도 3은 본 발명에 의한 영상 데이터 분류 장치에 있어서, 제어부의 상세 구성을 나타낸 블록도이다.

Claims (11)

  1. 분류할 영상 데이터가 입력되면, 텐서 PCA를 이용하여 상기 입력된 영상 데이터를 저차원 텐서 데이터로 변환하는 단계;
    동일 클래스에 속하는 학습용 영상 간의 저차원 텐서 데이터 간 차의 확률 밀도에 비례하여 정의된 유사도 함수를 통해 상기 분류할 영상 데이터와 학습용 영상데이터 간의 유사도를 산출하는 단계; 및
    상기 산출된 유사도를 이용하여 상기 분류할 영상 데이터를 분류하는 단계를 포함하는 텐서 데이터를 이용한 영상 데이터 분류 방법.
  2. 제1항에 있어서,
    상기 분류할 영상 데이터가 입력되기 전, 학습용 영상 데이터를 이용하여, 동일 클래스에 속하는 학습용 영상 데이터로부터 얻어지는 저차원 텐서 데이터들 간의 차에 대한 확률모델을 형성하고, 상기 확률모델에 따른 확률 밀도를 추정하여 데이터 간의 유사도 함수를 정의하는 단계를 더 포함하는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 방법.
  3. 제2항에 있어서, 상기 유사도 함수를 정의하는 단계는,
    텐서 PCA를 이용하여 학습용 영상 데이터를 저차원 텐서 데이터로 변환하는 단계;
    동일 클래스에 속하는 학습용 영상 데이터들의 저차원 텐서 데이터 차를 구하는 단계; 및
    상기 학습용 영상 데이터의 저차원 텐서 데이터 차에 대한 확률모델을 형성하고, 상기 확률모델에 따른 확률 밀도 함수를 추정하여, 상기 확률 밀도 함수에 비례하도록 저차원 텐서데이터 간의 유사도 함수를 산출하는 단계를 포함하는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 방법.
  4. 제1항 또는 제3항에 있어서, 상기 저차원 텐서 데이터로 변환하는 단계는
    영상 데이터를 클래스에 의존하여 고유하게 정해지는 클래스 요인과, 클래스에 의존하지 않고 영상 데이터를 획득할 때 가해지는 노이즈를 결정하는 환경 요인을 가지는 2차 텐서로 표현하는 단계임을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 방법.
  5. 제4항에 있어서, 상기 유사도 함수는
    Figure 112009072607937-pat00029
    (여기서, X,X'는 영상 데이터의 2차 텐서, S(X,X')는 두 2차 텐서 X,X' 간의 유사도 함수, Uy, Vy는 두 저차원 텐서 데이터 차(Y=X-X')에 대한 직교 변환 행렬로 이에 의한 Y의 변환 값은
    Figure 112009072607937-pat00030
    이고,
    Figure 112009072607937-pat00031
    Figure 112009072607937-pat00032
    는 상기 Z의 공분산 행렬이고, M은 두 영상 데이터 텐서 차의 평균 행렬이며, G는 평균 M과 공분산
    Figure 112009072607937-pat00052
    Figure 112009072607937-pat00053
    를 가지는 행렬 정규 분포의 확률밀도함수이다.)
    에 의해 산출되는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 방법.
  6. 영상 데이터를 입력받는 입력부;
    상기 입력부로 입력된 영상 데이터를 텐서 PCA를 이용하여 저차원 텐서 데이터로 변환하고, 동일 클래스에 속하는 학습용 영상데이터의 저차원 텐서 데이터 간의 확률 밀도에 비례하여 정의된 유사도 함수를 통해 상기 영상 데이터와 학습용 영상데이터 간의 유사도를 산출하고, 산출된 유사도에 근거하여 입력된 상기 영상데이터를 분류하는 제어부;
    상기 제어부의 영상 데이터 분류 결과를 출력하는 출력부를 포함하는 텐서 데이터를 이용한 영상 데이터 분류 장치.
  7. 제6항에 있어서,
    상기 제어부의 영상 데이터 분류 결과에 따라서 영상 데이터를 저장하는 저장부를 더 포함하는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 장치.
  8. 제6항에 있어서, 상기 제어부는
    텐서 PCA를 이용하여 영상 데이터를 저차원 텐서 데이터로 변환하는 텐서 기반 데이터 변환 모듈;
    상기 유사도 함수에 상기 텐서 기반 데이터 변환 모듈에서 변환된 저차원 텐서 데이터를 대입하여 상기 영상 데이터와 학습용 영상데이터 간에 유사도를 구하고, 상기 유사도에 따라서 상기 영상 데이터를 분류하는 데이터 분류 모듈을 포함하는 텐서 데이터를 이용한 영상 데이터 분류 장치.
  9. 제8항에 있어서, 상기 제어부는
    동일 클래스에 속하는 두 학습용 영상 데이터의 저차원 텐서 데이터의 차를 이용하여 유사도 함수를 정의하는 유사도 함수 산출모듈을 더 포함하고,
    학습용 영상 데이터를 상기 입력부로 입력받아, 상기 텐서 기반 데이터 변환 모듈을 이용하여 저차원 텐서 데이터로 변환한 후, 상기 저차원 텐서 데이터를 유사도 함수 산출모듈로 인가하여 상기 유사도 함수를 산출하는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 장치.
  10. 제8항에 있어서, 상기 텐서 기반 데이터 변환 모듈은,
    영상 데이터를 클래스에 의존하여 고유하게 정해지는 클래스 요인과, 클래스에 의존하지 않고 영상 데이터를 획득할 때 가해지는 노이즈를 결정하는 환경 요인을 가지는 2차 텐서로 변환하는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 장치.
  11. 제8항에 있어서, 상기 유사도 함수는
    Figure 112009072607937-pat00033
    (여기서, X,X'는 영상 데이터의 2차 텐서, S(X,X')는 두 2차 텐서 X,X' 간의 유사도 함수, Uy, Vy는 두 2차 텐서의 차(Y=X-X')에 대한 직교 변환 행렬로 이에 의한 Y의 변환 값은
    Figure 112009072607937-pat00034
    이고,
    Figure 112009072607937-pat00035
    Figure 112009072607937-pat00036
    는 상기 Z의 공분산 행렬이고, M은 두 영상 데이터 텐서 차의 평균 행렬이며, G는 평균 M과 공분산
    Figure 112009072607937-pat00054
    를 가지는 행렬 정규 분포의 확률밀도함수이다.)
    로 산출하는 것을 특징으로 하는 텐서 데이터를 이용한 영상 데이터 분류 장치.
KR1020080039219A 2008-04-28 2008-04-28 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치 KR100949893B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080039219A KR100949893B1 (ko) 2008-04-28 2008-04-28 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080039219A KR100949893B1 (ko) 2008-04-28 2008-04-28 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090113481A KR20090113481A (ko) 2009-11-02
KR100949893B1 true KR100949893B1 (ko) 2010-03-25

Family

ID=41554805

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080039219A KR100949893B1 (ko) 2008-04-28 2008-04-28 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100949893B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996327A (zh) * 2010-09-02 2011-03-30 西安电子科技大学 基于加权张量子空间背景建模的视频异常检测方法
CN110262457A (zh) * 2019-06-27 2019-09-20 大连海事大学 一种基于张量主元分析的不等长批次数据实时监测方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10657396B1 (en) * 2019-01-30 2020-05-19 StradVision, Inc. Method and device for estimating passenger statuses in 2 dimension image shot by using 2 dimension camera with fisheye lens
KR102053036B1 (ko) * 2019-02-28 2019-12-06 엘아이지넥스원 주식회사 딥 러닝 분석을 통한 표적 분류 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11213005A (ja) * 1998-01-30 1999-08-06 Canon Inc データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JPH11213004A (ja) * 1998-01-30 1999-08-06 Canon Inc データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2000112944A (ja) * 1998-09-30 2000-04-21 Canon Inc データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2006039658A (ja) * 2004-07-22 2006-02-09 Hitachi Software Eng Co Ltd 画像分類学習処理システム及び画像識別処理システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11213005A (ja) * 1998-01-30 1999-08-06 Canon Inc データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JPH11213004A (ja) * 1998-01-30 1999-08-06 Canon Inc データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2000112944A (ja) * 1998-09-30 2000-04-21 Canon Inc データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2006039658A (ja) * 2004-07-22 2006-02-09 Hitachi Software Eng Co Ltd 画像分類学習処理システム及び画像識別処理システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996327A (zh) * 2010-09-02 2011-03-30 西安电子科技大学 基于加权张量子空间背景建模的视频异常检测方法
CN110262457A (zh) * 2019-06-27 2019-09-20 大连海事大学 一种基于张量主元分析的不等长批次数据实时监测方法
CN110262457B (zh) * 2019-06-27 2021-08-03 大连海事大学 一种基于张量主元分析的不等长批次数据实时监测方法

Also Published As

Publication number Publication date
KR20090113481A (ko) 2009-11-02

Similar Documents

Publication Publication Date Title
JP6843086B2 (ja) 画像処理システム、画像においてマルチラベル意味エッジ検出を行う方法、および、非一時的コンピューター可読記憶媒体
JP4483334B2 (ja) 画像処理装置
US20110135167A1 (en) Personal authentication system and personal authentication method
Sufyanu et al. Enhanced Face Recognition Using Discrete Cosine Transform.
CN107784288A (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
TW200529093A (en) Face image detection method, face image detection system, and face image detection program
JP2022553779A (ja) キャビン内の環境の調整方法及び装置
KR100949893B1 (ko) 텐서 데이터를 이용한 영상 데이터 분류 방법 및 장치
CN113255557A (zh) 一种基于深度学习的视频人群情绪分析方法及系统
Sarath Human emotions recognition from thermal images using Yolo algorithm
Omaia et al. 2D-DCT distance based face recognition using a reduced number of coefficients
Al-agha et al. Geometric-based feature extraction and classification for emotion expressions of 3D video film
Smacki Latent lip print identification using fast normalized cross-correlation
CN115512424A (zh) 基于计算机视觉的室内人员痛苦表情识别方法及系统
CN110443255B (zh) 用于图像特征提取的图像识别方法
RU2490710C1 (ru) Способ распознавания изображений лиц и система для его осуществления
Salah et al. Hidden Markov Model-based face recognition using selective attention
Atallah et al. NEURAL NETWORK WITH AGNOSTIC META-LEARNING MODEL FOR FACE-AGING RECOGNITION
CN115720664A (zh) 物体位置估计设备、物体位置估计方法和记录介质
Yarasca et al. Intelligent system based on wavelets for automatic facial emotion recognition
Eltrabelsi et al. Offline Handwritten Signature Recognition based on Discrete Cosine Transform and Artificial Neural Network
Moghaddasi et al. Image splicing detection using singular value decomposition
Isnanto et al. Comparison Analysis between implementation of Principal Components Analysis and Haar wavelet as feature extractors in palmprint recognition system
Padala et al. Image Processing: Human Facial Expression Identification using Convolutional Neural Networks.
Majidpour et al. Unreadable offline handwriting signature verification based on generative adversarial network using lightweight deep learning architectures

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130222

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140228

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150217

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160318

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee