KR101021044B1 - 유사도 산출 방법 및 장치 및 컴퓨터 판독가능한 기록 매체 - Google Patents
유사도 산출 방법 및 장치 및 컴퓨터 판독가능한 기록 매체 Download PDFInfo
- Publication number
- KR101021044B1 KR101021044B1 KR1020047003337A KR20047003337A KR101021044B1 KR 101021044 B1 KR101021044 B1 KR 101021044B1 KR 1020047003337 A KR1020047003337 A KR 1020047003337A KR 20047003337 A KR20047003337 A KR 20047003337A KR 101021044 B1 KR101021044 B1 KR 101021044B1
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- distance
- distance calculation
- hierarchical
- calculating
- Prior art date
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 76
- 239000013598 vector Substances 0.000 claims abstract description 338
- 238000006243 chemical reaction Methods 0.000 claims abstract description 37
- 230000009466 transformation Effects 0.000 claims abstract description 30
- 239000006185 dispersion Substances 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 64
- 230000010354 integration Effects 0.000 claims description 15
- 230000005236 sound signal Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 abstract description 21
- 230000008569 process Effects 0.000 description 30
- 238000001514 detection method Methods 0.000 description 28
- 238000012545 processing Methods 0.000 description 28
- 238000009826 distribution Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 240000006829 Ficus sundaica Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000003121 nonmonotonic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2131—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
- Complex Calculations (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
유사 벡터 검색장치(2)에 있어서, 벡터 변환부(20, 21)는 등록 벡터(g) 및 입력 벡터(f)에 대해서, 순서 행렬에 의한 변환, 이산 코사인 변환, 이산 푸리에 변환, 월시 아다마르 변환, 또는 카르넨 레베 변환을 실시한다. 계층적 거리 연산부(23)는 2개의 벡터간의 거리 연산을 유의성이 높은 벡터 성분, 즉, 상술한 변환으로 분산이나 고유 값이 큰 성분, 또는 저주파 성분으로부터 차례로 계층적으로 행한다. 그리고 어떤 계층까지 계산된 거리의 적산치가 임계치 판정부(24)에 있어서 거리의 임계치(S)를 상회하였다고 판정된 경우, 임계치(S)를 상회한 것만을 출력하고 거리 계산을 한다.
유사 벡터 검색장치, 벡터 변환부, 입력 벡터, 변환, 거리 연산부
Description
본 발명은 2개의 벡터간의 패턴 매칭을 고속으로 행하는 유사도 산출 방법 및 장치, 및 프로그램 및 기록 매체에 관한 것이다.
본 출원은 일본에서 2002년 7월 9일에 출원된 일본특허출원번호2002-200481을 기초로 하여 우선권을 주장하는 것으로, 이 출원은 참조함으로써, 본 출원에 원용된다.
종래부터 기지의 패턴과 약간 같은 패턴을 미지의 입력신호로부터 검출하거나 2개의 신호간의 유사성을 평가하거나 하기 위해서, 음향 처리기술, 화상 처리기술, 통신기술, 레이더기술 등, 신호 처리가 관계하는 모든 기술분야에서 데이터의 유사성이나 일치성의 판정이 행하여지고 있다. 일반적으로, 유사 데이터의 검출에는 데이터를 특징 벡터화하고, 그 거리 또는 각도(상관)의 크기에 의해서 유사성을 판정하는 수법이 사용되고 있다.
특히, 입력치와 모든 후보 각각과의 유사도를 구한 뒤에 가장 거리가 가까운 것을 결정하는, 소위 전체 탐색(full search)이 가장 심플하고 또한 검출 누락이 없는 수법이며, 데이터량이 적은 경우에 자주 사용되고 있다. 그렇지만, 예를 들면 대량으로 축적된 영상이나 음성으로부터 입력 영상이나 입력 음성과 유사한 부 분을 검색하는 경우에는 매초당 특징 벡터의 차원이 크고, 또한, 그것들이 수십 내지 수백 시간분 축적된 것에 대한 검색이 행하여지기 때문에, 이러한 단순한 전체 탐색을 하면, 검색 시간이 방대해지는 문제가 있다.
한편, 대량의 데이터를 검색하기 위해서는 예를 들면 문서 검색 등의 기호화된 데이터의 완전 일치 검색을 행하는 경우 등에, 이분목법(binary tree search)이나 해시법 등의 고속화 기술이 사용된다. 이것은 미리 데이터를 순서대로 격납하고, 검색시에는 입력 데이터와 다른 것 또는 테이블의 비교를 생략하는 것으로 고속화하는 것이다. 그렇지만, 예를 들면 영상이나 음성 등의 물리신호를 대상으로 하는 경우, 데이터에는 본질적으로 왜곡이나 노이즈가 있기 때문에, 기호화된 데이터가 완전히 일치하는 것은 드물고, 이러한 고속화 기술을 사용한 경우에는 다수의 검출 누락이 발생하여 버린다. 또한, 데이터가 본질적으로 다차원이기 때문에, 미리 데이터에 일의의 순서 부여를 실시하여 두는 것이 곤란하다는 문제가 있다.
그래서, 일본특허공개공보평8-123460호에는 데이터 등록시에 거리가 가까운 복수의 벡터를 그룹화하여 1개의 대표 벡터로 대표시키는 처리를 행하고, 검색시에 우선 입력 벡터와 대표 벡터 사이의 거리를 계산하고, 그 거리가 가까운 그룹의 벡터에 대해서만 그룹 내의 모든 벡터와의 비교를 행하는 것으로, 유사 벡터 검색을 고속화하고, 또한, 다차원으로 벡터의 왜곡을 반영시킬 수 있는 기술이 제안되어 있다.
또한, 일본특허공개공보 2001-134573호에는 벡터를 부호화하여 짧은 부호에 의해 색인 부여하는 것으로, 거리 계산 회수의 증가를 억제하여, 고속의 유사 데이 터 검색을 가능하게 하는 기술이 제안되어 있다.
그렇지만, 상술한 일본특허공개공보평8-123460호에 기재된 기술에서는 등록시에 적절한 그룹 분류와 대표 벡터의 선택이 필요하게 되어, 등록 조작이 번잡해진다는 문제가 있었다. 또한, 검색시에 있어서도, 예를 들면 입력 벡터와 최소 거리에 있는 등록 벡터가 입력 벡터와 최소 거리에 있는 대표 벡터가 대표하는 그룹에 속해 있는 것에 한하지 않기 때문에, 검색해야 할 그룹을 결정하는 조작이 번잡해진다는 문제가 있었다.
또한, 상술한 일본특허공개공보 2001-134573호에 기재된 기술에서는 부호화할 때 벡터간의 거리 관계가 없어지거나 또는 비가산적 또는 비단조롭고 복잡한 거리 관계가 되어, 등록이나 검색 기구가 번잡해진다는 문제가 있었다.
여기서, 영상이나 음성은 본질적으로 시계열이기 때문에, 등록은 실시간으로 행하여지는 것이 바람직하고, 또한, 검색시에는 시간 순서를 반영할 수 있는 것이 바람직하다. 다시 말하면, 상술한 일본특허공개공보평8-123460호나 일본특허공개공보 2001-134573호에 기재된 기술과 같이 시계열을 바꾸는 등록 조작을 필요로 하거나 갱신시에 기등록의 데이터나 색인에 대한 배치 교체를 필요로 하는 수법은 시계열 데이터의 검색에는 적절하지 않은 경우가 있다.
즉, (a) 전체 탐색의 구조적 심플함, 왜곡에 대한 완건함을 잃지 않고,
(b) 등록이나 삭제가 실시간 이내로 행하여지며,
(c) 등록이나 삭제에 의해서 다른 기등록 데이터에 대한 조작을 필요로 하지 않는다.
와 같은 조건을 만족하면서, 전체 탐색보다도 상당히 단시간에 검색이 행하여지는 기구가 요구되고 있다.
본 발명은 이러한 종래의 실정을 감안하여 제안된 것으로, 상술한 조건을 만족하면서, 2개의 벡터간의 패턴 매칭을 고속으로 행하는 유사도 산출 방법 및 장치, 및 그 유사도 산출 처리를 컴퓨터에 실행시키는 프로그램 및 그와 같은 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체를 제공하는 것을 목적으로 한다.
상술한 바와 같은 목적을 달성하기 위해서, 본 발명에 관계되는 유사도 산출 방법은 2개의 입력 벡터간의 유사도를 구하는 유사도 산출 방법으로서, 상기 2개의 입력 벡터간의 거리 산출을 계층적으로 행하는 계층적 거리 산출공정과, 상기 계층적 거리 산출공정의 각 계층에서 산출된 거리의 적산치를 미리 설정된 임계치와 비교하는 임계치 비교공정과, 상기 임계치 비교공정에서의 비교 결과에 따라서, 상기 계층적 거리 산출공정에서의 거리 산출을 제어하는 제어공정과, 마지막 계층까지 산출된 거리의 적산치를 상기 유사도로서 출력하는 출력공정을 갖고, 상기 제어공정에서는 상기 임계치 비교공정에 있어서, 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 상회한 경우, 거리 산출을 중단하도록 제어한다.
이러한 유사도 산출 방법은 2개의 벡터간의 거리 산출을 계층적으로 행하고, 어떤 계층까지 산출된 거리의 적산치가 소정의 임계치를 상회하는 것에 대해서는 임계치 이상인 것만을 검출하여 실제의 거리를 산출하지 않음으로써, 연산을 고속화한다.
또한, 이 유사도 산출 방법은 상기 2개의 입력 데이터에 대하여 소정의 변환을 실시하는 변환공정을 부가로 같고 있어도 좋고, 이 경우, 상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 상기 소정의 변환에 근거하는 소정의 순서로 행하여진다. 여기서, 상기 소정의 변환은 예를 들면, 입력 벡터를 구성하는 각 성분의 순서를 해당 각 성분의 분산의 크기에 따라서 다시 배열하는 변환, 이산 코사인 변환, 이산 푸리에(Fourier) 변환, 월시 아다마르(walsh-Hadamard) 변환, 또는 카르넨 레베(Karhunen-Loeve) 변환이다.
또한, 이 유사도 산출 방법은 상기 변환공정에서 변환된 상기 2개의 입력 벡터의 각각에 대해서, 상기 입력 벡터를 구성하는 각 성분을 상기 소정의 순서로 추출하여 계층적인 복수의 부분 벡터로 분할하는 분할공정을 갖고 있어도 좋고, 이 경우, 상기 계층적 거리 산출공정에서는 최상위 계층의 부분 벡터부터 차례로 부분 벡터를 구성하는 각 성분간의 거리 산출이 계층적으로 행하여지고, 어떤 계층까지의 부분 벡터를 구성하는 전체 성분간에 대해서 산출된 거리의 적산치가 상기 임계치를 하회한 경우, 1계층 하위의 부분 벡터를 구성하는 각 성분간의 거리 산출이 행하여진다.
또한, 상술한 목적을 달성하기 위해서, 본 발명에 관계되는 유사도 산출 장치는 2개의 입력 벡터간의 유사도를 구하는 유사도 산출 장치로서, 상기 2개의 입력 벡터간의 거리 산출을 계층적으로 행하는 계층적 거리 산출수단과, 상기 계층적 거리 산출수단에 의해서 각 계층에서 산출된 거리의 적산치를 미리 설정된 임계치와 비교하는 임계치 비교수단과, 상기 임계치 비교수단에 의한 비교 결과에 따라서, 상기 계층적 거리 산출수단에 의한 거리 산출을 제어하는 제어수단과, 마지막 계층까지 산출된 거리의 적산치를 상기 유사도로서 출력하는 출력수단을 구비하고, 상기 제어수단은 상기 임계치 비교공정에 의한 비교의 결과 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 상회한 경우, 거리 산출을 중단하도록 제어한다.
이러한 유사도 산출 장치는 2개의 벡터간의 거리 산출을 계층적으로 행하고, 어떤 계층까지 산출된 거리의 적산치가 소정의 임계치를 상회하는 것에 대해서는 임계치 이상인 것만을 검출하여 실제의 거리를 산출하지 않음으로써, 연산을 고속화한다.
또한, 이 유사도 산출 장치는 상기 2개의 입력 벡터에 대하여 소정의 변환을 실시하는 변환수단을 부가로 구비하고 있어도 좋고, 이 경우, 상기 계층적 거리 산출수단은 상기 변환수단에 의해서 변환된 상기 2개의 입력 벡터간의 거리 산출을 상기 소정의 변환에 근거하는 소정의 순서로 행한다. 여기서, 상기 소정의 변환은 예를 들면, 입력 벡터를 구성하는 각 성분의 순서를 해당 각 성분의 분산의 크기에 따라서 다시 배열하는 변환, 이산 코사인 변환, 이산 푸리에 변환, 월시 아다마르 변환, 또는 카르넨 레베 변환이다.
또한, 이 유사도 산출 장치는 상기 변환수단에 의해서 변환된 상기 2개의 입력 벡터의 각각에 대해서, 상기 입력 벡터를 구성하는 각 성분을 상기 소정의 순서로 추출하여 계층적인 복수의 부분 벡터로 분할하는 분할수단을 구비하고 있어도 좋고, 이 경우, 상기 계층적 거리 산출수단은 최상위 계층의 부분 벡터부터 차례로 부분 벡터를 구성하는 각 성분간의 거리 산출을 계층적으로 행하고, 어떤 계층까지의 부분 벡터를 구성하는 전체 성분간에 대해서 산출한 거리의 적산치가 상기 임계치를 하회한 경우, 1계층 하위의 부분 벡터를 구성하는 각 성분간의 거리 산출을 행한다.
또한, 본 발명에 관한 프로그램은 상술한 유사도 산출 처리를 컴퓨터에 실행시키는 것으로, 본 발명에 관한 기록 매체는 그와 같은 프로그램이 기록된 컴퓨터 판독 가능한 것이다.
본 발명의 또 다른 목적, 본 발명에 의해서 얻어지는 구체적인 이점은 이하에서 설명되는 실시예의 설명으로부터 한층 더 분명해질 것이다.
도 1은 제 1 실시예에 있어서의 유사 벡터 검출장치의 개략 구성을 설명하는 도면.
도 2는 동 유사 벡터 검출장치에 있어서의 벡터 등록시의 처리를 설명하는 플로차트.
도 3은 동 유사 벡터 검출장치에 있어서의 벡터 검색시의 처리를 설명하는 플로차트.
도 4는 제 1 실시예에 있어서의 처리를 직관적으로 설명하기 위한 도면.
도 5는 특징 공간 내의 벡터의 분포에 편차가 있는 예를 도시하는 도면.
도 6은 제 2 실시예에 있어서의 유사 벡터 검출장치의 개략 구성을 설명하는 도면.
도 7은 동 유사 벡터 검출장치에 있어서의 벡터 등록시의 처리를 설명하는 플로차트.
도 8은 동 유사 벡터 검출장치에 있어서의 벡터 검색시의 처리를 설명하는 플로차트.
도 9는 제 3 실시예에 있어서의 유사 벡터 검출장치의 개략 구성을 설명하는 도면.
도 10은 동 유사 벡터 검출장치에 있어서의 벡터 등록시의 처리를 설명하는 플로차트.
도 11은 동 유사 벡터 검출장치에 있어서의 벡터 검색시의 처리를 설명하는 플로차트.
도 12는 음향신호로부터 음향 특징 벡터를 추출하는 처리의 일례를 설명하는 플로차트.
도 13은 음향신호로부터 음향 특징 벡터를 추출하는 처리의 일례를 설명하는 도면.
도 14는 음향신호에 있어서의 변환 부호화를 설명하는 도면.
도 15는 부호화 음향신호로부터 음향 특징 벡터를 추출하는 처리의 일례를 설명하는 플로차트.
도 16은 부호화 음향신호로부터 음향 특징 벡터를 추출하는 처리의 일례를 설명하는 도면.
도 17은 영상신호로부터 영상 특징 벡터를 추출하는 처리의 일례를 설명하는 플로차트.
도 18은 영상신호로부터 영상 특징 벡터를 추출하는 처리의 일례를 설명하는 도면.
도 19는 영상신호로부터 영상 특징 벡터를 추출하는 처리의 다른 예를 설명하는 플로차트.
도 20은 영상신호로부터 영상 특징 벡터를 추출하는 처리의 다른 예를 설명하는 도면.
도 21은 부호화 영상신호로부터 영상 특징 벡터를 추출하는 처리의 다른 예를 설명하는 플로차트.
도 22는 부호화 영상신호로부터 영상 특징 벡터를 추출하는 처리의 다른 예를 설명하는 도면.
이하, 본 발명을 적용한 구체적인 실시예에 대해서, 도면을 참조하면서 상세하게 설명한다. 이 실시예는 본 발명을 복수의 등록 벡터 중에서 입력 벡터와 유사한 벡터를 고속으로 검출하는 유사 벡터 검출방법 및 그 장치에 적용한 것이다.
구체적으로는 본 실시예에 있어서의 유사 벡터 검출방법 및 그 장치에서는 2개의 벡터간의 거리를 산출하는데 있어서, 그 거리가 소정의 임계치를 하회하는 것에 대해서는 그 거리를 산출하고, 소정의 임계치를 상회하는 것에 대해서는 임계치 이상인 것만을 검출하여 실제의 거리를 산출하지 않음으로써, 유사 벡터 검출의 연산을 고속화한다. 또한, 본 실시예에 있어서의 유사 벡터 검출장치에서는 거리가 임계치를 상회하는 경우에는 편의상 -1을 출력하는 것으로 한다.
이하, 거리를 산출하는 2개의 벡터(f) 및 벡터(g)를, 이하의 식 (1), (2)와 같이 표기한다.
f=(f[1], f[2], …, f[N])t ···(1)
g=(g[1], g[2], …, g[N])t ···(2)
여기서, 식 (1)에 있어서, f[1], f[2], …는 벡터(f)의 각 성분을 나타내고, 식 (2)에 있어서 g[1], g[2], …은 벡터(g)의 각 성분을 나타낸다. 또한, t는 전치(轉置)를 나타내고, N은 벡터의 차원을 나타낸다.
(1) 제 1 실시예
제 1 실시예에 있어서의 유사 벡터 검출장치의 개략 구성을 도 1에 도시한다. 도 1에 도시하는 바와 같이, 유사 벡터 검출장치(1)는 벡터(f), 벡터(g)를 입력하고 그 벡터간의 제곱 거리(또는 -1)를 출력하는 것이며, 기록부(10)와 계층적 거리 연산부(11)와 임계치 판정부(12)로 구성된다.
이 유사 벡터 검출장치(1)에 있어서의 등록시의 처리를 도 2의 플로차트를 참조하여 설명한다. 우선 스텝 S1에 있어서, 기록부(10; 도 1)는 미리 등록 벡터(g)를 입력한다. 일반적으로 벡터(g)는 복수이고, 방대한 수가 되는 경우가 많다. 그리고, 계속되는 스텝 S2에 있어서, 기록부(10)는 입력한 벡터(g)를 기록한다.
이와 같이 제 1 실시예에서는 등록시에 특별한 조작을 할 필요가 없기 때문 에 간편하고, 실시간에서의 처리에 적합하다. 또한, 기록부(10)는 예를 들면 자기디스크, 광디스크, 또는 반도체 메모리 등이다.
계속해서, 유사 벡터 검출장치(1)에 있어서의 검색시의 처리를 도 3의 플로차트를 참조하여 설명한다. 우선 스텝 S10에 있어서, 임계치 판정부(12; 도 1)는 거리의 임계치(S)를 설정하고, 계속되는 스텝 S11에 있어서, 계층적 거리 연산부(11)는 벡터(f)를 입력하는 동시에 기록부(10)에 기록되어 있는 벡터(g)를 1개 취득한다.
계속해서 스텝 S12에 있어서, 계층적 거리 연산부(11)는 내부 변수인 성분번호(i)를 1로, 거리의 적산치(sum)를 0으로 각각 세트하고, 스텝 S13에 있어서, 벡터(f)의 제 i 성분 f[i]와 벡터(g)의 제 i 성분 g[i] 사이에서, 이하의 식 (3)으로 나타내는 바와 같은 적산 연산을 행한다.
sum=sum+(f[i]-g[i])2 ···(3)
스텝 S14에 있어서, 임계치 판정부(12)는 적산치(sum)가 임계치(S)미만인지의 여부를 판별한다. 적산치(sum)가 임계치(S)미만인 경우(Yes)에는 스텝 S16으로 진행하고, 적산치(sum)가 임계치(S) 이상인 경우(No)에는 스텝 S15에서 임계치 판정부(12)가 -1을 출력하고 처리를 종료한다. 여기서, 출력되는 -1은 상술한 바와 같이, 입력된 벡터(f)와 취득된 벡터(g)의 거리가 임계치(S)를 상회하고, 이 벡터(g)가 기각된 것을 나타내는 편의적인 수치이다. 이와 같이 임계치 판정부(12)는 임계치(S)를 형성하고, 적산 연산 도중의 계층에서 적산치(sum)가 임 계치(S)를 상회한 경우에 계층적 거리 연산부(11)에서의 적산 연산을 중단하는 것으로, 처리의 고속화를 도모하고 있다.
스텝 S16에서는 성분번호(i)가 벡터(f), 벡터(g)의 차원수(N) 이하인지의 여부가 판별된다. 성분번호(i)가 N 이하인 경우(Yes)에는 스텝 S17에서 i를 인크리먼트(increment)하고 스텝 S13으로 되돌아간다. 한편, 성분번호(i)가 N보다도 큰 경우(No)에는 벡터(f), 벡터(g)의 마지막 성분까지 적산 연산이 종료하였기 때문에, 스텝 S18에서 임계치 판정부(12)가 적산치(sum)를 출력하고 처리를 종료한다. 또한, 이 때의 적산치(sum)는 벡터간 거리의 제곱이 된다.
이상, 도 3의 플로차트에서는 1개의 등록 벡터(g)에 대한 처리를 도시하였지만, 실제로는 등록되어 있는 모든 벡터(g)에 대해서 같은 처리를 행하고, 벡터(f)와의 거리의 적산치(sum)가 임계치(S)를 하회한 모든 벡터(g)를, 벡터(f)와 유사한 벡터로서 출력한다.
이상 설명한 제 1 실시예에 있어서의 처리를 직관적으로 설명하면, 도 4에 검정색 원으로 도시하는 다수의 등록 벡터에 대해서, 도면 중 ×로 도시하는 입력 벡터로부터의 거리가 반경 √S의 초구(超球)의 범위 내의 등록 벡터에 대해서만 정확한 거리를 산출하고, 범위 외의 등록 벡터에 대해서는 각 축마다의 거리의 적산치가 반경을 상회한 시점에서 기각하는 처리를 행하고 있는 것에 상당한다.
또한, 상술한 설명에서는 벡터간의 제곱 거리를 사용하였지만, 제곱 거리에 한하지 않고, 임의의 거리 척도에 대하여 같은 수법을 사용할 수 있다. 단지, 제곱 거리를 사용하는 경우에는 적산치(sum)가 각 성분간 거리의 적산치에 대하여 단 조롭게 증가하기 때문에, 오류 기간을 발생시키지 않는다. 또한, 각 성분간의 거리의 총합은 벡터간의 거리에 일치하기 때문에, 거리가 임계치 √S 이하인 벡터(f), 벡터(g)에 대해서는 단순한 전체 탐색법과 완전히 같은 거리가 출력되어, 오차가 발생하지 않는다.
또한, 이 수법에서는 시계열 관계를 무너뜨리는 참조 테이블 등을 작성할 필요가 없기 때문에, 데이터의 갱신이나 삭제를 시계열 순서에 따라서 행할 수 있고, 처리나 관리가 용이하다. 또한, 시계열 순서에 따라서 검색을 행하는 것이나 검색하는 시계열 범위를 지정하는 것도 용이하게 가능하다.
(2) 제 2 실시예
상술한 제 1 실시예에서는 거리의 임계치(S)를 설정하는 것으로, 전체 검색과 동동한 검색을 고속으로 행할 수 있었지만, 이 수법에서는 어떤 벡터 성분부터 검색을 할지는 벡터의 배열순에 의존하기 때문에, 이 배열순에 의하여 검색 속도에 차가 생긴다. 예를 들면, 도 5와 같이 특징 공간 내의 벡터의 분포에 편차가 있는 경우에는 f[1]축과 f[2]축 중 어느 쪽을 먼저 적산하는지에 따라서 검색 속도가 크게 다르다. 이 예에서는 f[2]축을 먼저 평가하는 쪽이 불필요한 적산이 적어지고 고속화할 수 있다.
그래서, 이하에 설명하는 제 2 실시예에서는 이하의 식 (4), 및 식 (5)에 나타낸 바와 같이, 입력 벡터(f), 등록 벡터(g)에 대해서 정규 직교 변환 행렬(U)을 승산하여 직교 변환을 행하고, 이 직교 변환 후의 벡터(f'), 벡터(g')를 사용하여 유의성이 높은 순서로 검색을 행하는 것으로, 더욱 검색을 고속화한다.
f'=Uf ···(4)
g'=Ug ···(5)
또한, 이하의 식 (6)에 나타낸 바와 같이, 정규 직교 변환 행렬(U)에 의해서는 2개의 벡터(g), 벡터(f) 간의 제곱 거리 d2는 변하지 않는다.
d2=∥f'-g'∥2=∥U(f-g)∥2=(f-g)tUtU(f-g)=(f-g)t(f-g)=∥f-g∥
2 ···(6)
제 2 실시예에 있어서의 유사 벡터 검출장치의 개략 구성을 도 6에 도시한다. 도 6에 도시한 바와 같이, 유사 벡터 검출장치(2)는 벡터(f), 벡터(g)를 입력하고 그 벡터간의 거리(또는 -1)를 출력하는 것이며, 벡터 변환부(20, 21)와 기록부(22)와 계층적 거리 연산부(23)와 임계치 판정부(24)로 구성된다. 여기서, 벡터 변환부(20, 21)는 각각 벡터(g), 벡터(f)에 대하여 같은 변환을 실시하는 것이다. 또한, 기록부(22)는 예를 들면 자기디스크, 광디스크, 또는 반도체 메모리 등이다.
이 유사 벡터 검출장치(2)에 있어서의 등록시의 처리를 도 7의 플로차트를 참조하여 설명한다. 우선 스텝 S20에 있어서, 벡터 변환부(20; 도 6)는 미리 등록 벡터(g)를 입력하고, 계속되는 스텝 S21에 있어서, 상술한 식 (5)와 같이 벡터(g)를 변환하여, 벡터(g')를 생성한다. 그리고, 스텝 S2에 있어서, 기록부(10)는 변환된 벡터(g')를 기록한다.
계속해서, 유사 벡터 검출장치(2)에 있어서의 검색시의 처리를 도 8의 플로차트를 참조하여 설명한다. 우선 스텝 S30에 있어서, 임계치 판정부(24; 도 6)는 거리의 임계치(S)를 설정하고, 계속되는 스텝 S31에 있어서, 벡터 변환부(21)가 벡 터(f)를 입력하는 동시에 계층적 거리 연산부(23)가 기록부(22)에 기록되어 있는 벡터(g')를 1개 취득한다.
계속해서 스텝 S32에 있어서, 벡터 변환부(21)는 상술한 식 (4)와 같이 벡터(f)를 변환하여, 벡터(f')를 생성한다.
스텝 S33에 있어서, 계층적 거리 연산부(23)는 내부 변수인 성분번호(i)를 1로, 거리의 적산치(sum)를 0으로 각각 세트하고, 스텝 S34에 있어서, 벡터(f')의 제 i 성분 f'[i]와 벡터(g')의 제 i 성분 g'[i] 사이에서, 이하의 식 (7)에 나타낸 바와 같은 적산 연산을 행한다.
sum=sum+(f'[i]-g'[i])2 ···(7)
스텝 S35에 있어서, 임계치 판정부(24)는 적산치(sum)가 임계치(S)미만인지의 여부를 판별한다. 적산치(sum)가 임계치(S)미만인 경우(Yes)에는 스텝 S37로 진행하고, 적산치(sum)가 임계치(S) 이상인 경우(No)에는 스텝 S36에서 임계치 판정부(24)가 -1을 출력하고 처리를 종료한다.
스텝 S37에서는 성분번호(i)가 벡터(f'), 벡터(g')의 차원수 N 이하인지의 여부가 판별된다. 성분번호(i)가 N이하인 경우(Yes)에는 스텝 S38에서 i를 인크리먼트하고 스텝 S34로 되돌아간다. 한편, 성분번호(i)가 N보다도 큰 경우(No)에는 벡터(f'), 벡터(g')의 마지막 성분까지 적산 연산이 종료하였기 때문에, 스텝 S39에서 임계치 판정부(24)가 적산치(sum)를 출력하고 처리를 종료한다. 또, 이 때의 적산치(sum)는 벡터간 거리의 제곱이 된다.
이상, 도 8의 플로차트에서는 1개의 등록 벡터(g')에 대한 처리를 도시하였지만, 실제로는 등록되어 있는 모든 벡터(g')에 대해서 같은 처리를 행하고, 벡터(f')와의 거리의 적산치(sum)가 임계치(S)를 하회한 모든 벡터(g')를, 벡터(f')와 유사한 벡터로서 출력한다.
여기서, 상술한 정규 직교 변환 행렬(U)로서는 여러 가지의 것을 사용할 수 있지만, 이하에서는 구체적으로 4개의 예를 들어 설명한다.
(2-1) 직교 변환의 구체적인 예
(2-1-1)
직교 변환의 가장 간단한 것으로서 순서 행렬을 들 수 있다. 이것은 단순히 벡터 성분의 순서를 다시 배열하는 것으로, 예를 들면 8차의 순서 행렬 P는 이하의 식 (8)에 도시하는 바와 같은 형태로 표시된다.
상술한 도 5와 같이 벡터의 각 성분의 분포가 다른 경우, 분명하게 분산이 큰 성분일수록 거리에 대한 기여가 크다. 따라서, 배열 교체의 순서를 결정할 때에는 미리 충분한 수(I개)의 샘플 벡터(gi)를 준비하고, 이하의 식 (9)에서 계산되 는 분산 벡터(V)가 큰 순서로 배열하는 순서 행렬을 설정하는 것이 최적이다.
또한, 이 순서 행렬을 사용한 직교 변환은 각 벡터 성분의 확대 쪽이 다른 경우에 유효하며, 배열 교체만으로 충분하고 승제산이나 조건 분기가 필요하지 않기 때문에 고속이다.
(2-1-2)
영상 특징량이나 음향 특징량 등, 인접 성분간의 상관 관계가 큰 특징량에서는 특징 벡터를 이산신호로 간주한 경우의 에너지가 저주파 성분으로 기운다.
그래서, 직교 변환으로서, 이하의 식 (10), 및 식 (11)로 표시되는 이산 코사인 변환(Discrete Cosine Transform : DCT)이나, 이하의 식 (12), 및 식 (13)으로 표시되는 이산 푸리에 변환(Discrete Fourier Transform : DFT)을 사용하여, 저주파 성분부터 차례로 적산을 행하는 것으로, 유의성이 높은 성분부터 차례로 적산할 수 있어, 거리 계산이 고속화된다.
여기서, 이산 코사인 변환이나 이산 푸리에 변환에는 고속 변환법을 사용할 수 있고, 또한 변환 행렬도 전부를 보유할 필요가 없기 때문에, 계산기로 실현하는 경우의 메모리 사용량이나 연산 속도는 행렬의 전체 계산을 행하는 경우보다도 상당히 유리하다.
(2-1-3)
월시 아다마르 변환은 변환 행렬의 각 요소가 ±1만으로 구성되는 직교 변환이며, 변환시에 승산이 필요하지 않기 때문에, 고속의 변환에 적합하다. 여기서, 주파수에 가까운 개념으로서 교번수(sequency)를 사용하고, 저교번수의 성분부터 차례로 배열하는 것으로, 상술한 이산 코사인 변환이나 이산 푸리에 변환과 같이 인접 성분간의 상관 관계가 큰 벡터에 대하여 거리 계산의 고속화를 도모할 수 있다.
월시 아다마르 변환 행렬은 푸리에 변환 행렬의 부호에 따라서 구성하거나, 또는 행렬의 재귀환적 확대 연산에 의해서 구성한다. 일례로서, 교번수 순으로 배열한 8차의 월시 아다마르 변환 행렬(W)을 이하의 식 (14)에 나타낸다.
(2-1-4)
미리 충분한 수의 샘플 벡터가 수집되고, 또한, 변환 연산에 다소의 코스트를 들여도 좋은 경우에는 직교 변환으로서 최적의 카르넨 레베(Karhunen-Loeve) 변환(이하, KL 변환이라고 함)을 사용하는 것이 유효하다.
KL 변환 행렬(T)은 샘플 벡터의 분산 행렬(V)을 고유치 분해하는 고유 행렬이고, 고유치를 λ1, …, λN으로 한 경우에, 이하의 식 (15)와 같이 정의된다.
V=TtΛT, Λ=diag{λ1, λ2, …, λN} ···(15)
여기서, KL 변환은 각 성분간의 상관 관계를 완전히 제거하는 직교 변환 행렬이며, 변환된 벡터 성분의 분산이 고유치 λi가 된다. 따라서, 고유치 λi를 큰 순서로 배열하도록 KL 변환 행렬(T)을 구성하는 것으로, 모든 성분을 통합하여 중복하는 정보를 제거한 다음, 가장 분산이 큰 축으로부터 거리의 적산을 행할 수 있다.
또, 이 KL 변환을 사용한 수법에서는 연산시에 KL 변환 행렬(T)을 원칙으로 하여 전차원에 걸쳐 보유할 필요가 있고, 또한, 모든 벡터에 대하여 전체 차수의 행렬 연산을 할 필요가 있기 때문에, 연산 코스트가 든다. 그렇지만, 이 연산은 등록시에 행하는 것이기 때문에, 특히 고속화가 요구되는 검색 처리에 요하는 시간을 증가시키는 것은 아니다.
또한, 약간의 정밀도의 열화는 수반되지만, 고유치가 큰 벡터 성분만을 추출하여 보유하고, 고유치가 작은 벡터 성분은 보유하지 않도록 하는 것이며, 벡터 자체를 압축하고, 기록부(22; 도 6)의 기억영역이나 데이터 판독 시간을 저감할 수도 있다.
(3) 제 3 실시예
상술한 제 1, 제 2 실시예에서는 거리 계산의 고속화에 의해 검색 연산을 고속화하였지만, 검색할 때에는 예를 들면 하드디스크 등의 기록부로부터의 데이터 판독 시간이나 큰 오버헤드의 요인이 된다.
여기서, 상술한 제 2 실시예에 있어서의 KL 변환은 다변량 해석 분야에서 주 성분 분석이라고 불리는 분석법에 있어서, 벡터를 구성하는 주요한 성분을 추출하는 연산으로 되어 있다. 그래서, 이하에 설명하는 제 3 실시예에서는 제 2 실시예 에서 얻어진 변환 후의 벡터(g')의 주요 성분을 색인 벡터(g1), 나머지의 성분을 상세 벡터(g2)로서 기록한다. 검색시에는 우선 색인 벡터(g1)를 참조하여 거리 계산을 하고, 그 결과가 임계치(S) 미만인 경우에만 상세 벡터(g2)를 취득하여 더욱 거리 계산을 행하는 것으로, 데이터 판독 시간의 단축화를 도모할 수 있다.
제 3 실시예에 있어서의 유사 벡터 검출장치의 개략 구성을 도 9에 도시한다. 도 9에 도시하는 바와 같이, 유사 벡터 검출장치(3)는 벡터(f), 벡터(g)를 입력하고 그 벡터간의 제곱 거리(또는 -1)를 출력하는 것이며, 벡터 변환부(30, 31)와 색인 기록부(32)와 상세 기록부(33)와 계층적 거리 연산부(34)와 임계치 판정부(35)로 구성된다. 여기서, 벡터 변환부(30, 31)는 각각 벡터(g), 벡터(f)에 대하여 상술한 제 2 실시예와 같은 변환을 실시하는 것이다. 또한, 색인 기록부(32), 상세 기록부(33)는 예를 들면 자기디스크, 광디스크, 또는 반도체 메모리 등이다.
이 유사 벡터 검출장치(3)에 있어서의 등록시의 처리를 도 10의 플로차트를 참조하여 설명한다. 우선 스텝 S40에 있어서, 벡터 변환부(30; 도 9)는 미리 등록 벡터(g)를 입력하고, 계속되는 스텝 S41에 있어서, 상술한 식 (5)와 같이 벡터(g)를 변환하여, 벡터(g')를 생성한다. 또한 벡터 변환부(30)는 성분번호가 작은 것, 즉 상술한 변환으로 분산이나 고유치가 큰 성분, 또는 저주파 성분부터 차례로, 소정수 M(1≤M<N)의 성분을 갖는 색인 벡터(g1)와 나머지의 성분을 갖는 상세 벡터(g2)로 분할한다. 그리고 스텝 S42에 있어서, 색인 기록부(32)가 색인 벡터(g1)를 기록하고, 스텝 S43에 있어서, 상세 기록부(33)가 상세 벡터(g2)를 기록한다.
계속해서, 유사 벡터 검출장치(3)에 있어서의 검색시의 처리를 도 11의 플로차트를 참조하여 설명한다. 우선 스텝 S50에 있어서, 임계치 판정부(35; 도 9)는 거리의 임계치(S)를 설정하고, 계속되는 스텝 S51에 있어서, 벡터 변환부(31)가 벡터(f)를 입력하는 동시에 계층적 거리 연산부(34)가 색인 기록부(32)에 기록되어 있는 색인 벡터(g1)를 1개 취득한다.
계속해서 스텝 S52에 있어서, 벡터 변환부(31)는 상술한 식 (4)와 같이 벡터(f)를 변환하여, 벡터(f')를 생성한다. 또한 벡터 변환부(31)는 성분번호가 작은 것부터 차례로, 소정수 M(1≤M<N)의 성분을 갖는 색인 벡터(f1)와 나머지 성분을 갖는 상세 벡터(f2)로 분할한다.
스텝 S53에 있어서, 계층적 거리 연산부(34)는 내부 변수인 성분번호(i)를 1로, 거리의 적산치(sum)를 0으로 각각 세트하고, 스텝 S54에 있어서, 벡터(f')의 제 i 성분 i'[i]와 벡터(g')의 제 i 성분 g'[i] 사이에서, 이하의 식 (16)으로 나타낸 바와 같은 적산 연산을 행한다.
sum=sum+(f'[i]-g'[i]2 ···(16)
스텝 S55에 있어서, 임계치 판정부(35)는 적산치(sum)가 임계치(S)미만인지 의 여부를 판별한다. 적산치(sum)가 임계치(S)미만인 경우(Yes)에는 스텝 S57로 진행하고, 적산치(sum)가 임계치(S) 이상인 경우(No)에는 스텝 S56에서 임계치 판정부(35)가 -1을 출력하고 처리를 종료한다. 여기서, 출력되는 -1은 상술한 바와 같이, 거리가 임계치를 상회하여 기각된 것을 나타내는 편의적인 수치이다.
스텝 S57에서는 성분번호(i)가 색인 벡터(f1), 색인 벡터(g1)의 차원수 M 이하인지의 여부가 판별된다. 성분번호(i)가 M이하인 경우(Yes)에는 스텝 S58에서 i를 인크리먼트하고 스텝 S54로 되돌아간다. 한편, 성분번호(i)가 M보다도 큰 경우(No)에는 계층적 거리 연산부(34)는 상세 기록부(33)에 기록되어 있는 상세 벡터(g2)를 1개 취득한다.
스텝 S60에 있어서, 계층적 거리 연산부(34)는 벡터(f')의 제 i 성분 f'[i]과 벡터(g')의 제 i 성분 g'[i] 사이에서, 상술한 식 (16)으로 도시하는 바와 같은 적산 연산을 행한다.
스텝 S61에 있어서, 임계치 판정부(35)는 적산치(sum)가 임계치(S)미만인지의 여부를 판별한다. 적산치(sum)가 임계치(S)미만인 경우(Yes)에는 스텝 S63으로 진행하고, 적산치(sum)가 임계치(S)이상인 경우(No)에는 스텝 S62에서 임계치 판정부(35)가 -1을 출력하고 처리를 종료한다.
스텝 S63에서는 성분번호(i)가 벡터(f'), 벡터(g')의 차원수 N이하인지의 여부가 판별된다. 성분번호(i)가 N이하인 경우(Yes)에는 스텝 S64에서 i를 인크리먼트하고 스텝 S60으로 되돌아간다. 한편, 성분번호(i)가 N보다도 큰 경우(No)에는 벡터(f'), 벡터(g')의 마지막 성분까지 적산이 종료하였기 때문에, 스텝 S65에서 임계치 판정부(35)가 적산치(sum)를 출력하고, 처리를 종료한다. 이때 적산치(sum)는 벡터간 거리의 제곱이 된다.
이상, 도 11의 플로차트에서는 1개의 등록 벡터(g')에 대한 처리를 도시하였지만, 실제로는 등록되어 있는 모든 벡터(g')에 대해서 같은 처리를 행하고, 벡터(f')와의 거리의 적산치(sum)가 임계치(S)를 하회한 모든 벡터(g')를, 벡터(f')와 유사한 벡터로서 출력한다.
상술한 제 3 실시예에서는 제1, 제 2 실시예와 비교하여 기억 용량이나 정밀도는 변하지 않고, 연산 속도도 거의 변하지 않지만, 대부분의 비교가 색인 벡터(g1)의 단계에서 기각되어 상세 벡터(g2)를 취득할 필요가 적은 경우에, 데이터 액세스에 의한 오버헤드가 해소된다.
또한, 상술한 설명에서는 벡터를 색인 벡터와 상세 벡터의 2단계로 분할하는 것으로 하였지만, 마찬가지로 색인 벡터를 더욱 상위의 색인 벡터와 상세한 색인 벡터로 분할하여 3단 구성으로 하는 등, 다단화로의 확장이 가능한 것은 물론이다.
(4) 특징 벡터의 추출
이하에서는 음향신호나 영상신호로부터 특징 벡터를 추출하는 수법에 대해서 설명한다. 후술하는 바와 같이 하여 음향 특징 벡터 및/또는 영상 특징 벡터를 추출하고, 이것을 상술한 벡터(f), 벡터(g)로서 사용하는 것으로, 음향신호나 영상신호가 입력된 경우에, 상술한 제 1 내지 제 3 실시예의 수법을 사용하여, 등록된 음 향신호나 영상신호로부터 유사한 음향신호나 영상신호를 고속으로 검색할 수 있다.
(4-1) 음향 특징 벡터의 추출
(4-1-1)
음향신호에 관한 특징량으로서 파워 스펙트럼 계수를 사용하는 경우의 예에 대해서, 도 12의 플로차트와 도 13을 참조하여 설명한다. 우선 스텝 S70에 있어서, 도 13에 도시하는 바와 같이, 대상 시구간 내의 음향신호로부터 시간구간(T) 마다의 음향신호를 취득한다.
다음에 스텝 S71에서는 취득한 음향신호에 대하여 예를 들면 고속 푸리에 변환 등의 스펙트럼 연산을 실시하고, 단시간 구간마다 파워 스펙트럼 계수 Sq(q=0, 1, …, Q-1)를 구한다. 여기서, q는 이산 주파수를 나타내는 인덱스이고, Q는 최대 이산 주파수이다.
계속해서 스텝 S72에서는 대상 시구간 내의 계산을 종료하였는지의 여부가 판별되고, 종료한 경우(Yes)에는 스텝 S73으로 진행하고, 종료하지 않은 경우(No)에는 스텝 S70으로 되돌아간다.
스텝 S73에서는 구한 파워 스펙트럼 계수(Sq)의 평균 스펙트럼(S'q)을 계산하고, 스텝 S74에 있어서 이 평균 스펙트럼(S'q)을 벡터화하고, 음향 특징 벡터(a)를 생성한다. 이 음향 특징 벡터(a)는 예를 들면 이하의 식 (17)과 같이 표시된다.
a=(S0, …, SQ-1) ···(17)
또한, 상술한 예에서는 대상 시구간 내의 음향신호를 시간구간(T)마다 구분하는 것으로서 설명하였지만, 대상 시구간이 짧은 경우에는 시간구간(T)마다 구분하지 않고 스펙트럼 연산을 실시하도록 하여도 상관없다.
또한, 상술한 예에서는 파워 스펙트럼 계수를 사용한 예에 대해서 설명하였지만, 이것에 한정되는 것이 아니라, 예를 들면 등가의 정보를 갖는 켑스트럼 계수 등을 사용할 수도 있다. 또한, 푸리에 변환이 아니라 AR(Auto-Regressive) 모델을 사용하는 선형 예측 계수에 의해서도 같은 효과를 얻을 수 있다.
(4-1-2)
음향신호는 방대하기 때문에, 압축 부호화되어 기록, 또는 전송되는 경우가 많다. 부호화된 음향신호를 복호하여 베이스밴드로 되돌린 후, 상술한 수법을 사용하여 음향 특징 벡터(a)를 추출하는 것도 가능하지만, 부분적인 복호만으로 음향 특징 벡터(a)를 추출할 수 있으면, 추출 처리를 효율화, 고속화할 수 있다.
여기서, 일반적으로 사용되는 부호화법인 변환 부호화에서는 도 14에 도시하는 바와 같이, 원음이 되는 음향신호가 시간구간(T)마다 프레임으로 구분된다. 그리고, 그 프레임마다의 음향신호에 대하여 변경 이산 코사인 변환(Modified Discrete Cosine Transform : MDCT) 등의 직교 변환이 실시되고, 그 계수가 양자화되어 부호화된다. 이때, 주파수 대역마다, 크기가 정규화 계수인 스케일 팩터(factor)가 추출되어, 별도 부호화된다. 그래서, 이 스케일 팩터만을 복호함으로써, 음향 특징 벡터(a)로서 사용할 수 있다.
이와 같이 음향신호에 관한 특징량으로서 스케일 팩터를 사용하는 경우의 예 에 대해서, 도 15의 플로차트와 도 16을 참조하여 설명한다. 우선 스텝 S80에 있어서, 대상 시구간에서의 시간 구간(T) 내의 부호화 음향신호가 취득되고, 스텝 S81에 있어서, 프레임마다의 스케일 팩터가 부분적으로 복호된다.
계속해서 스텝 S82에서는 대상 시구간 내의 복호를 종료하였는지의 여부가 판별되고, 종료한 경우(Yes)에는 스텝 S83으로 진행하고, 종료하지 않은 경우(No)에는 스텝 S80으로 되돌아간다.
스텝 S83에서는 대상 시구간 내의 스케일 팩터 중에서 각 대역마다 최대의 스케일 팩터를 검출하고, 스텝 S84에 있어서 그것들을 벡터화하여, 음향 특징 벡터(a)를 생성한다.
이와 같이 하여, 부호화 음향신호를 완전히 복호하지 않고, 상술과 등가의 음향 특징 벡터(a)를 고속으로 추출할 수 있다.
(4-2) 영상 특징 벡터의 추출
(4-2-1)
영상신호에 관한 특징량으로서 휘도 정보 및 색 정보를 사용하는 경우의 예에 대해서, 도 17의 플로차트 및 도 18을 참조하여 설명한다. 우선 스텝 S90에 있어서, 도 18에 도시하는 바와 같이, 대상 시구간(T)내의 영상신호로부터 영상 프레임을 취득한다.
다음에 스텝 S91에서는 취득한 모든 영상 프레임에 근거하여, 시간 평균 화상(100)을 작성한다.
계속해서 스텝 S92에서는 작성된 시간 평균 화상(100)을 종횡 X×Y개의 소 블록으로 분할하고, 각 블록 내의 화소치를 평균한 블록 평균 화상(110)을 작성한다.
그리고, 스텝 S93에서는 이들을 예를 들면 좌측 위로부터 우측 아래를 향해서 R, G, B의 순서로 배열하여, 1차원의 영상 특징 벡터(V)를 생성한다. 이 영상 특징 벡터(V)는 예를 들면 이하의 식 (18)과 같이 표시된다.
v=(R00, …, RX-1,Y-1, G00, …, GX-1,Y-1, B00, BX-1,Y-1) ···(18)
또한, 상술한 예에서는 시간 평균 화상(100)을 분할한 블록 평균 화상(110)의 화소치를 교체 배열하여 1차원의 영상 특징 벡터(V)를 생성하는 예에 대해서 설명하였지만, 이것에 한정되는 것이 아니라, 블록 평균 화상(110)을 작성하지 않고, 시간 평균 화상(100)의 화소치를 교체 배열하여 1차원의 영상 특징 벡터(V)를 생성하도록 하여도 상관없다.
또한, 통상, 영상신호의 시간 변화는 그다지 심하지 않기 때문에, 시간 평균 화상(100)을 작성하지 않고, 대상 시구간 내의 1프레임을 대표 화상으로서 선택하여 대용하여도, 거의 같은 효과를 얻을 수 있다.
(4-2-2)
완전히 동일한 영상신호가 아니더라도, 예를 들면 뉴스 영상과 같은 앵글로 촬영된 스튜디오 영상 등, 전체 화상에 대한 색의 분포가 유사한 영상에는 어떠한 관련이 있는 것이 많고, 이들을 동일시하여 검색하는 요구도 있다. 이러한 경우에는 화상의 공간 의존성을 배제하고, 색 분포의 히스토그램을 작성하여 비교하면 효 과적이다.
그래서, 이와 같이 색 분포의 히스토그램을 특징량으로서 사용하는 경우의 예에 대해서, 도 19의 플로차트 및 도 20을 참조하여 설명한다. 우선 스텝 S100에 있어서, 도 20으로 도시하는 바와 같이, 대상 시구간(T) 내의 영상신호로부터 영상 프레임을 취득한다.
다음에 스텝 S101에서는 각 영상 프레임의 신호치로부터 각 색, 예를 들면 R, G, B의 신호치에 대한 히스토그램을 작성한다.
그리고 스텝 S102에서는 이들을 예를 들면 R, G, B의 순서로 배열하고, 1차원의 영상 특징 벡터(V)를 생성한다. 이 영상 특징 벡터(V)는 예를 들면 이하의 식 (19)와 같이 표시된다.
v=(R0, …, RN-1, G0, …, GN-1, B0, …, BN-1
) ···(19)
또한, 상술한 예에서는 R, G, B의 신호치에 대한 히스토그램을 작성하는 것으로 하고 설명하였지만, 휘도(Y), 색차(Cb, Cr)의 신호치에 대한 히스토그램을 작성하도록 하여도, 같은 효과를 얻을 수 있다.
(4-2-3)
영상신호는 방대하기 때문에, 압축 부호화되어 기록, 또는 전송되는 경우가 많다. 부호화된 영상신호를 복호하여 베이스밴드로 되돌린 후, 상술한 수법을 사용하여 영상 특징 벡터(V)를 추출하는 것도 가능하지만, 부분적인 복호만으로 영상 특징 벡터(V)를 추출할 수 있으면, 추출 처리를 효율화, 고속화할 수 있다.
MPEG1(Moving Picture Experts Group1)또는 MPEG2로 압축 부호화된 영상신호로부터 영상 특징 벡터(V)를 추출하는 경우의 예에 대해서, 도 21의 플로차트와 도 22를 참조하여 설명한다. 우선 스텝 S110에 있어서, 벡터화하는 대상 시구간 T에 대하여, 그 바로 근처의 부호화 그룹(Group of Pictures G0P)의 부호화 영상신호를 취득하고, 그 GOP 내의 프레임 내 부호화 픽쳐(120; I픽쳐)를 취득한다.
여기서, 프레임 화상은 매크로 블록 MB(16×16화소, 또는 8×8화소)를 단위로 하여 부호화되어 있고, 또한, 이산 코사인 변환(DCT)이 사용되고 있다. 이 DCT 변환된 DC 계수는 매크로 블록 내 화상의 화소치의 평균치에 대응한다.
그래서, 스텝 S111에서는 이 DC 계수를 취득하고, 계속되는 스텝 S112에서는 이들을 예를 들면 Y, Cb, Cr의 순서로 모두, 1차원의 영상 특징 벡터(V)를 생성한다. 이 영상 특징 벡터(V)는 예를 들면 이하의 식 (20)과 같이 표시된다.
v=(Y00, …, YX-1,Y-1, Cb00, …, CbX-1,Y-1, Cr00, …, CrX-1,Y-1) ···(20)
이와 같이 하여, 부호화 영상신호를 완전히 복호하지 않고, 영상 특징 벡터(V)를 고속으로 추출할 수 있다.
또한, 상술한 예에서는 MPEG1 또는 MPEG2로 압축 부호화된 영상신호를 사용하는 것으로서 설명하였지만, 다른 압축 부호화방식에도 적용 가능하다.
(5) 기타
이상 설명한 바와 같이, 본 실시예에 의하면, 벡터간의 거리에 근거하여 유사 벡터를 검출할 때, 계층적인 거리 적산 연산을 행하고, 미리 설정된 거리에 대 한 임계치를 상회한 시점에서 중단하는 것으로, 유사 벡터를 고속으로 검출할 수 있다. 특히, 대량의 등록 벡터 중에서, 입력 벡터와 유사한 벡터를 검출하는 경우에는 대부분의 등록 벡터는 비유사이고 임계치를 상회하여 버리기 때문에, 거리 계산을 빠른 시기에 중단할 수 있고, 검출 시간을 대폭 단축할 수 있다.
또한, 미리 벡터에 대하여 순서 변환, 이산 코사인 변환, 이산 푸리에 변환, 월시 아다마르 변환, 또는 KL 변환을 실시하고, 유의성이 높은 벡터 성분, 즉, 상술한 변환으로 분산이나 고유치가 큰 성분, 또는 저주파 성분부터 차례로 적산 연산을 행하도록 하는 것이며, 벡터 성분의 분포를 고려하여, 효율적 또한 고속으로 유사한 벡터를 검출할 수 있다.
따라서, 음향신호나 영상신호의 검색을 행할 때에도, 미리 음향 특징 벡터 및/또는 영상 특징 벡터를 추출하여 등록하여 두는 것으로, 임의의 음향신호나 영상신호가 입력된 경우에, 전체 검색과 같은 구조적 심플함이나 검색 정밀도를 유지한 채로, 유사한 음향신호나 영상신호를 고속으로 검색할 수 있다.
또한, 본 발명은 도면을 참조하여 설명한 상술한 실시예에 한정되는 것은 아니고, 첨부한 청구범위 및 그 주지를 일탈하지 않고, 여러 가지 변경, 치환 또는 그 동동한 것을 행할 수 있는 것은 당업자에게 있어서 분명하다.
예를 들면, 상술한 실시예에서는 하드웨어의 구성으로서 설명하였지만, 이것에 한정되는 것이 아니라, 임의의 처리를 CPU(Central Processing Unit)에 컴퓨터 프로그램을 실행시킴으로써 실현하는 것도 가능하다. 이 경우, 컴퓨터 프로그램은 기록 매체에 기록하여 제공하는 것도 가능하고, 또한, 인터넷 외의 전송매체를 통해서 전송함으로써 제공하는 것도 가능하다.
상술한 본 발명에 의하면, 2개의 벡터간의 거리 산출을 계층적으로 행하고, 어떤 계층까지 산출된 거리의 적산치가 소정의 임계치를 상회하는 것에 대해서는 임계치 이상인 것만을 검출하여 실제의 거리를 산출하지 않음으로써, 연산을 고속화할 수 있다. 특히, 대량의 등록 벡터 중에서 입력 벡터와 유사한 벡터를 검출하는 경우에는 대부분의 등록 벡터는 비유사이며 임계치를 상회하여 버리기 때문에, 거리 산출을 빠른 시기에 중단할 수 있고, 검출 시간을 대폭 단축할 수 있다.
Claims (26)
- 2개의 입력 벡터간의 유사도를 구하는 유사도 산출 방법으로서,상기 2개의 입력 벡터간의 거리 산출을 계층적으로 행하는 계층적 거리 산출공정과,상기 계층적 거리 산출공정의 각 계층에서 산출된 거리의 적산치를 미리 설정된 임계치와 비교하는 임계치 비교공정과,상기 임계치 비교공정에서의 비교 결과에 따라, 상기 계층적 거리 산출공정에서의 거리 산출을 제어하는 제어공정과,마지막 계층까지 산출된 거리의 적산치를 상기 유사도로서 출력하는 출력공정을 갖고,상기 제어공정에서는 상기 임계치 비교공정에 있어서, 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 상회한 경우, 거리 산출을 중단하도록 제어하고,상기 계층적 거리 산출공정에서는 상기 2개의 입력 벡터를 구성하는 각 성분간의 거리 산출이 계층적으로 행하여지고, 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 하회한 경우, 다음의 성분간의 거리 산출이 행하여지고,상기 2개의 입력 벡터에 대하여 소정의 변환을 실시하는 변환공정을 부가로 갖고,상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 상기 소정의 변환에 근거하는 소정의 순서로 행하여지고,상기 변환공정에서 변환된 상기 2개의 입력 벡터의 각각에 대해서, 상기 입력 벡터를 구성하는 각 성분을 상기 소정의 순서로 추출하여 계층적인 복수의 부분 벡터로 분할하는 분할공정을 부가로 갖고,상기 계층적 거리 산출공정에서는 최상위 계층의 부분 벡터부터 차례로 부분 벡터를 구성하는 각 성분간의 거리 산출이 계층적으로 행하여지며, 어떤 계층까지의 부분 벡터를 구성하는 전체 성분간에 대해서 산출된 거리의 적산치가 상기 임계치를 하회한 경우, 1계층 하위의 부분 벡터를 구성하는 각 성분간의 거리 산출이 행하여지는 것을 특징으로 하는 유사도 산출 방법.
- 삭제
- 삭제
- 제 1 항에 있어서, 상기 소정의 변환은 상기 2개의 입력 벡터를 구성하는 각 성분의 순서를 해당 각 성분의 분산의 크기에 따라서 다시 배열하는 변환이고,상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 분산이 큰 성분부터 차례로 행하여지는 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 소정의 변환은 이산 코사인 변환 또는 이산 푸리에 변환이며,상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 저주파 성분부터 차례로 행하여지는 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 소정의 변환은 월시 아다마르 변환이며,상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 저교번수 성분부터 차례로 행하여지는 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 소정의 변환은 카르넨 레베 변환이며,상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 고유치가 큰 성분부터 차례로 행하여지는 것을 특징으로 하는 유사도 산출 방법.
- 삭제
- 제 1 항에 있어서, 상기 입력 벡터는 음향신호를 특징 벡터화한 것이며,상기 특징 벡터는 상기 음향신호의 소정의 시구간 내의 파워 스펙트럼 계수를 벡터화한 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 입력 벡터는 음향신호를 특징 벡터화한 것이며,상기 특징 벡터는 상기 음향신호의 소정의 시구간 내의 선형 예측 계수를 벡터화한 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 입력 벡터는 부호화 음향신호를 특징 벡터화한 것이며,상기 특징 벡터는 상기 부호화 음향신호의 각 프레임 내의 주파수 성분의 강도를 나타내는 파라미터를 벡터화한 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 입력 벡터는 영상신호를 특징 벡터화한 것이며,상기 특징 벡터는 상기 영상신호의 소정의 시구간 내의 대표 화상, 상기 소정의 시구간 내의 프레임 화상의 평균 화상, 또는 상기 대표 화상 또는 상기 평균 화상을 소정의 블록 단위로 분할한 소화상의 신호치를 벡터화한 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 입력 벡터는 영상신호를 특징 벡터화한 것이며,상기 특징 벡터는 상기 영상신호의 소정의 시구간 내의 프레임 화상의, 휘도 및/또는 색에 대한 히스토그램을 벡터화한 것을 특징으로 하는 유사도 산출 방법.
- 제 1 항에 있어서, 상기 입력 벡터는 부호화 영상신호를 특징 벡터화한 것이며,상기 특징 벡터는 상기 부호화 영상신호의 소정의 시구간에 가장 가까운 프레임내 부호화 화상의 부호화 단위가 되는 각 블록의 DC 성분의 신호치를 벡터화한 것을 특징으로 하는 유사도 산출 방법.
- 2개의 입력 벡터간의 유사도를 구하는 유사도 산출 장치로서,상기 2개의 입력 벡터간의 거리 산출을 계층적으로 행하는 계층적 거리 산출수단과,상기 계층적 거리 산출수단에 의해서 각 계층에서 산출된 거리의 적산치를 미리 설정된 임계치와 비교하는 임계치 비교수단과,상기 임계치 비교수단에 의한 비교 결과에 따라서, 상기 계층적 거리 산출수단에 의한 거리 산출을 제어하는 제어수단과,마지막 계층까지 산출된 거리의 적산치를 상기 유사도로서 출력하는 출력수단을 구비하고,상기 제어수단은 상기 임계치 비교수단에 의한 비교의 결과, 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 상회한 경우, 거리 산출을 중단하도록 제어하고,상기 계층적 거리 산출수단은 상기 2개의 입력 벡터를 구성하는 각 성분간의 거리 산출을 계층적으로 행하고, 어떤 계층까지 산출한 거리의 적산치가 상기 임계치를 하회한 경우, 다음의 성분간의 거리를 산출하고,상기 2개의 입력 벡터에 대하여 소정의 변환을 실시하는 변환수단을 부가로 구비하고,상기 계층적 거리 산출수단은 상기 변환수단에 의해서 변환된 상기 2개의 입력 벡터간의 거리 산출을 상기 소정의 변환에 근거하는 소정의 순서로 행하고,상기 변환수단에 의해서 변환된 상기 2개의 입력 벡터의 각각에 대해서, 상기 입력 벡터를 구성하는 각 성분을 상기 소정의 순서로 추출하여 계층적인 복수의 부분 벡터로 분할하는 분할수단을 구비하고,상기 계층적 거리 산출수단은 최상위 계층의 부분 벡터부터 차례로 부분 벡터를 구성하는 각 성분간의 거리 산출을 계층적으로 행하여, 어떤 계층까지의 부분 벡터를 구성하는 전체 성분간에 대해서 산출한 거리의 적산치가 상기 임계치를 하회한 경우, 1계층 하위의 부분 벡터를 구성하는 각 성분간의 거리를 산출하는 것을 특징으로 하는 유사도 산출 장치.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 2개의 입력 벡터간의 유사도를 구하는 유사도 산출 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체로서, 상기 유사도 산출 방법은,상기 2개의 입력 벡터간의 거리 산출을 계층적으로 행하는 계층적 거리 산출공정과,상기 계층적 거리 산출공정의 각 계층에서 산출된 거리의 적산치를 미리 설정된 임계치와 비교하는 임계치 비교공정과,상기 임계치 비교공정에서의 비교 결과에 따라, 상기 계층적 거리 산출공정에서의 거리 산출을 제어하는 제어공정과,마지막 계층까지 산출된 거리의 적산치를 상기 유사도로서 출력하는 출력공정을 갖고,상기 제어공정에서는 상기 임계치 비교공정에 있어서, 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 상회한 경우, 거리 산출을 중단하도록 제어하고,상기 계층적 거리 산출공정에서는 상기 2개의 입력 벡터를 구성하는 각 성분간의 거리 산출이 계층적으로 행하여지고, 어떤 계층까지 산출된 거리의 적산치가 상기 임계치를 하회한 경우, 다음의 성분간의 거리 산출이 행하여지고,상기 프로그램은 상기 2개의 입력 벡터에 대하여 소정의 변환을 실시하는 변환공정을 갖고,상기 계층적 거리 산출공정에서는 상기 변환공정에서 변환된 상기 2개의 입력 벡터간의 거리 산출이 상기 소정의 변환에 근거하는 소정의 순서로 행하여지고,상기 프로그램은 상기 변환공정에서 변환된 상기 2개의 입력 벡터의 각각에 대해서, 상기 입력 벡터를 구성하는 각 성분을 상기 소정의 순서로 추출하여 계층적인 복수의 부분 벡터로 분할하는 분할공정을 갖고,상기 계층적 거리 산출공정에서는 최상위 계층의 부분 벡터부터 차례로 부분 벡터를 구성하는 각 성분간의 거리 산출이 계층적으로 행하여지고, 어떤 계층까지의 부분 벡터를 구성하는 전체의 성분간에 대해서 산출된 거리의 적산치가 상기 임계치를 하회한 경우, 1계층 하위의 부분 벡터를 구성하는 각 성분간의 거리 산출이 행하여지는 것을 특징으로 하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002200481A JP4623920B2 (ja) | 2002-07-09 | 2002-07-09 | 類似度算出方法及び装置、並びにプログラム及び記録媒体 |
JPJP-P-2002-00200481 | 2002-07-09 | ||
PCT/JP2003/008142 WO2004006185A1 (ja) | 2002-07-09 | 2003-06-26 | 類似度算出方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050016278A KR20050016278A (ko) | 2005-02-21 |
KR101021044B1 true KR101021044B1 (ko) | 2011-03-14 |
Family
ID=30112514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047003337A KR101021044B1 (ko) | 2002-07-09 | 2003-06-26 | 유사도 산출 방법 및 장치 및 컴퓨터 판독가능한 기록 매체 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7260488B2 (ko) |
EP (1) | EP1521210B9 (ko) |
JP (1) | JP4623920B2 (ko) |
KR (1) | KR101021044B1 (ko) |
CN (1) | CN1324509C (ko) |
DE (1) | DE60330147D1 (ko) |
WO (1) | WO2004006185A1 (ko) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7539870B2 (en) * | 2004-02-10 | 2009-05-26 | Microsoft Corporation | Media watermarking by biasing randomized statistics |
JP4220449B2 (ja) * | 2004-09-16 | 2009-02-04 | 株式会社東芝 | インデキシング装置、インデキシング方法およびインデキシングプログラム |
JP2006101462A (ja) * | 2004-09-30 | 2006-04-13 | Sanyo Electric Co Ltd | 画像信号処理装置 |
US7552303B2 (en) * | 2004-12-14 | 2009-06-23 | International Business Machines Corporation | Memory pacing |
KR100687207B1 (ko) * | 2005-09-16 | 2007-02-26 | 주식회사 문화방송 | 이미지 전송 장치 및 이미지 수신 장치 |
IL179582A0 (en) * | 2006-11-26 | 2007-05-15 | Algotec Systems Ltd | Comparison workflow automation by registration |
US8738633B1 (en) | 2012-01-31 | 2014-05-27 | Google Inc. | Transformation invariant media matching |
US20170206202A1 (en) * | 2014-07-23 | 2017-07-20 | Hewlett Packard Enterprise Development Lp | Proximity of data terms based on walsh-hadamard transforms |
US9568591B2 (en) * | 2014-11-10 | 2017-02-14 | Peter Dan Morley | Method for search radar processing using random matrix theory |
US9503747B2 (en) * | 2015-01-28 | 2016-11-22 | Intel Corporation | Threshold filtering of compressed domain data using steering vector |
US10783268B2 (en) | 2015-11-10 | 2020-09-22 | Hewlett Packard Enterprise Development Lp | Data allocation based on secure information retrieval |
US11080301B2 (en) | 2016-09-28 | 2021-08-03 | Hewlett Packard Enterprise Development Lp | Storage allocation based on secure data comparisons via multiple intermediaries |
KR102359556B1 (ko) | 2016-11-11 | 2022-02-08 | 삼성전자주식회사 | 지문 영상을 이용한 사용자 인증 방법 및 사용자 인증을 위한 부호화 모델 생성 방법 |
JP6922556B2 (ja) | 2017-08-29 | 2021-08-18 | 富士通株式会社 | 生成プログラム、生成方法、生成装置、及び剽窃検知プログラム |
CN108960537B (zh) * | 2018-08-17 | 2020-10-13 | 安吉汽车物流股份有限公司 | 物流订单的预测方法及装置、可读介质 |
CN112861260B (zh) * | 2021-02-01 | 2022-03-11 | 中国人民解放军国防科技大学 | 固体火箭发动机装药性能匹配方法、装置和设备 |
CN114225361A (zh) * | 2021-12-09 | 2022-03-25 | 栾金源 | 一种网球测速方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02273880A (ja) * | 1989-04-15 | 1990-11-08 | Toshiba Corp | パターン認識装置 |
EP0575815A1 (en) * | 1992-06-25 | 1993-12-29 | Atr Auditory And Visual Perception Research Laboratories | Speech recognition method |
JP2002008027A (ja) | 2000-06-20 | 2002-01-11 | Ricoh Co Ltd | パターン認識方法、パターン認識装置およびパターン認識プログラムを記録した記録媒体 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4934246A (ko) * | 1972-07-28 | 1974-03-29 | ||
JPS6227878A (ja) * | 1985-07-29 | 1987-02-05 | Ricoh Co Ltd | マツチング方法 |
JPH0711819B2 (ja) * | 1986-06-20 | 1995-02-08 | 株式会社リコー | パターン認識方法 |
JPS6339092A (ja) * | 1986-08-04 | 1988-02-19 | Ricoh Co Ltd | 辞書検索方式 |
JPS6339093A (ja) * | 1986-08-04 | 1988-02-19 | Ricoh Co Ltd | 辞書検索方式 |
JP2700440B2 (ja) * | 1994-04-19 | 1998-01-21 | エヌ・ティ・ティ・データ通信株式会社 | 物品識別システム |
JP3224955B2 (ja) * | 1994-05-27 | 2001-11-05 | 株式会社東芝 | ベクトル量子化装置およびベクトル量子化方法 |
TW293227B (ko) * | 1994-11-24 | 1996-12-11 | Victor Company Of Japan | |
KR0165497B1 (ko) * | 1995-01-20 | 1999-03-20 | 김광호 | 블럭화현상 제거를 위한 후처리장치 및 그 방법 |
JPH1013832A (ja) * | 1996-06-25 | 1998-01-16 | Nippon Telegr & Teleph Corp <Ntt> | 動画像認識方法および動画像認識検索方法 |
KR100247969B1 (ko) * | 1997-07-15 | 2000-03-15 | 윤종용 | 대용량패턴정합장치및방법 |
US6253201B1 (en) * | 1998-06-23 | 2001-06-26 | Philips Electronics North America Corporation | Scalable solution for image retrieval |
JP3252802B2 (ja) * | 1998-07-17 | 2002-02-04 | 日本電気株式会社 | 音声認識装置 |
US6535617B1 (en) * | 2000-02-14 | 2003-03-18 | Digimarc Corporation | Removal of fixed pattern noise and other fixed patterns from media signals |
JP3816309B2 (ja) | 2000-06-26 | 2006-08-30 | アマノ株式会社 | 駐車場管理装置 |
JP2002191050A (ja) * | 2000-12-22 | 2002-07-05 | Fuji Xerox Co Ltd | 画像符号化装置および方法 |
US6963667B2 (en) * | 2001-01-12 | 2005-11-08 | National Instruments Corporation | System and method for signal matching and characterization |
US6807305B2 (en) * | 2001-01-12 | 2004-10-19 | National Instruments Corporation | System and method for image pattern matching using a unified signal transform |
-
2002
- 2002-07-09 JP JP2002200481A patent/JP4623920B2/ja not_active Expired - Fee Related
-
2003
- 2003-06-26 CN CNB038009765A patent/CN1324509C/zh not_active Expired - Fee Related
- 2003-06-26 DE DE60330147T patent/DE60330147D1/de not_active Expired - Lifetime
- 2003-06-26 WO PCT/JP2003/008142 patent/WO2004006185A1/ja active Application Filing
- 2003-06-26 EP EP03736281A patent/EP1521210B9/en not_active Expired - Lifetime
- 2003-06-26 KR KR1020047003337A patent/KR101021044B1/ko active IP Right Grant
- 2003-06-26 US US10/489,012 patent/US7260488B2/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02273880A (ja) * | 1989-04-15 | 1990-11-08 | Toshiba Corp | パターン認識装置 |
EP0575815A1 (en) * | 1992-06-25 | 1993-12-29 | Atr Auditory And Visual Perception Research Laboratories | Speech recognition method |
JP2002008027A (ja) | 2000-06-20 | 2002-01-11 | Ricoh Co Ltd | パターン認識方法、パターン認識装置およびパターン認識プログラムを記録した記録媒体 |
Non-Patent Citations (1)
Title |
---|
James McNAMES, "Rotated Partial Distance Search for Faster Vector Quantization Encoding", IEEE SIGNAL PROCESSING LETTERS, vol. 7, no. 9, pp. 244-246, September 2000.* |
Also Published As
Publication number | Publication date |
---|---|
US7260488B2 (en) | 2007-08-21 |
EP1521210A1 (en) | 2005-04-06 |
CN1324509C (zh) | 2007-07-04 |
CN1552042A (zh) | 2004-12-01 |
JP4623920B2 (ja) | 2011-02-02 |
EP1521210B9 (en) | 2010-09-15 |
EP1521210A4 (en) | 2007-07-04 |
KR20050016278A (ko) | 2005-02-21 |
WO2004006185A1 (ja) | 2004-01-15 |
US20050033523A1 (en) | 2005-02-10 |
DE60330147D1 (de) | 2009-12-31 |
EP1521210B1 (en) | 2009-11-18 |
JP2004046370A (ja) | 2004-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101021044B1 (ko) | 유사도 산출 방법 및 장치 및 컴퓨터 판독가능한 기록 매체 | |
CA2364798C (en) | Image search system and image search method thereof | |
JP3550681B2 (ja) | 画像検索装置及び方法、並びに類似画像検索プログラムを格納した記憶媒体 | |
KR100556832B1 (ko) | 영상정보 검색을 위한 비선형 양자화 및 유사도 매칭 방법 | |
KR100452064B1 (ko) | 디지털 영상 처리 장치 | |
JP3960151B2 (ja) | 類似時系列検出方法及び装置、並びにプログラム | |
US6961736B1 (en) | Compact color feature vector representation | |
EP1233374A2 (en) | Apparatus and method for extracting objects based on feature matching between segmented regions in images | |
US7702152B2 (en) | Non-linear quantization and similarity matching methods for retrieving video sequence having a set of image frames | |
JP5097280B2 (ja) | 画像及び画像群を表現、比較及び検索する方法及び装置、プログラム、コンピュータ読み取り可能な記憶媒体 | |
US7142602B2 (en) | Method for segmenting 3D objects from compressed videos | |
Seetharaman et al. | Statistical framework for image retrieval based on multiresolution features and similarity method | |
KR100788642B1 (ko) | 디지털 영상 텍스쳐 분석 방법 | |
JP5155210B2 (ja) | 画像比較装置及びその方法、画像検索装置、並びにプログラム及び記録媒体 | |
KR100333744B1 (ko) | 영상 압축이미지를 이용한 유사이미지 검색시스템 및 그 방법과 기록매체 | |
Sha et al. | Low-complexity and high-coding-efficiency image deletion for compressed image sets in cloud servers | |
KR100454914B1 (ko) | 디지털 영상 처리 방법, 그 장치 및 그 기록매체 | |
EP1065877A1 (en) | Segment identification for compressed video bit-streams | |
Athisayamani et al. | A Novel Video Coding Framework with Tensor Representation for Efficient Video Streaming | |
JP4002212B2 (ja) | 動画像符号化方法,装置,プログラムおよびプログラムの記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140221 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150223 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160222 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170224 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180223 Year of fee payment: 8 |