KR100282608B1 - 유사성 검색을 지원하는 공간 인덱스 구성방법 - Google Patents

유사성 검색을 지원하는 공간 인덱스 구성방법 Download PDF

Info

Publication number
KR100282608B1
KR100282608B1 KR1019980049332A KR19980049332A KR100282608B1 KR 100282608 B1 KR100282608 B1 KR 100282608B1 KR 1019980049332 A KR1019980049332 A KR 1019980049332A KR 19980049332 A KR19980049332 A KR 19980049332A KR 100282608 B1 KR100282608 B1 KR 100282608B1
Authority
KR
South Korea
Prior art keywords
spatial index
dft
coefficients
query
search cost
Prior art date
Application number
KR1019980049332A
Other languages
English (en)
Other versions
KR20000032772A (ko
Inventor
최완
이병선
김상욱
김진호
한병일
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019980049332A priority Critical patent/KR100282608B1/ko
Publication of KR20000032772A publication Critical patent/KR20000032772A/ko
Application granted granted Critical
Publication of KR100282608B1 publication Critical patent/KR100282608B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

유사성 검색을 지원하는 공간 인덱스 구성방법에 관한 것으로서, 공간 인덱스 구성의 대상이 되는 시계열 데이터 베이스에 대한 이산 퓨리에 변환(DFT) 계수들의 표준 편차를 구하여 내림차순으로 정렬하고, 상기 시계열 데이터 베이스의 특성을 사전에 분석하는 제 1 과정과, 상기 시계열 데이터 베이스의 특성을 참조하여 임의의 DFT 계수들에 의해 생성 가능한 모든 경우에 대한 다차원 공간 인덱스의 생성을 가정한 후, 그 공간 인덱스에 대한 질의 집합의 검색 비용을 계산하는 제 2 과정과, 상기 검색 비용이 최소가 되는 공간 인덱스에 적용된 DFT 계수들을 선택하여 다차원 공간 인덱스의 인덱싱 애트리로 선정하는 제 3 과정으로 구성되어, 주어진 데이타 및 질의 집합에 대한 최적의 공간 인덱스를 효과적으로 구성할 수 있으며, 이로인해, 공간 인덱스를 이용하여 유사성 검색을 처리하게 되는 경우 검색 비용을 최소화 할 수 있고 그 결과 전체 시스템 응답 시간이 향상된다는 장점이 있다.

Description

유사성 검색을 지원하는 공간 인덱스 구성방법
본 발명은 데이터 시퀀스들의 집합으로 구성된 시계열 데이터 베이스에서 효율적인 유사성 검색을 지원하기 위한 공간 인덱스 구성방법에 관한 것으로서, 특히, 대상이 되는 시계열 데이타베이스의 특성을 분석함으로써 공간 인덱스 검색 비용과 후보 객체 검색 비용으로 구성되는 전체 검색 비용을 최소화하도록 하는 공간 인덱스 구성방법에 관한 것이다.
두 개의 서로 다른 데이타 시퀀스 X(=<x1, x2, ..., xn>)와 Y(=<y1, y2, ..., yn>)간의 유사성을 측정하는 척도로서 가장 일반적으로 사용하는 것은 (수학식 1)과 같이 정의되는 유클리드 거리(Euclidian distance) D(X,Y)이다.
즉, 유사성 검색이란 주어진 질의 시퀀스(query sequence)로부터 지정된 ε이하의 유클리드 거리내에 있는 데이타 시퀀스들을 데이타베이스로부터 찾아내는 연산으로 정의된다.
전통적인 유사성 검색 기법에서는 이러한 연산을 효과적으로 지원하기 위하여 다차원 공간 인덱스(multidimensional spatial index)를 사용하며, 시간 도메인(time domain)상에서 n개의 실수값으로 구성된 데이타 시퀀스 T(=<t1,t2,...,tn>s)를 이산 퓨리에 변환(DFT:Discrete Fourier Transform)하여 주파수 도메인(frequency domain)상의 n개의 복소수값(DFT 계수라 부름)으로 구성되는 새로운 데이타 시퀀스 F(=<f1, f2, ... , fn>)로 변환한다. 그런 후, 변환된 n개의 DFT 계수들 중 k(<<n)개만을 이용하여 2k차원의 공간 인덱스를 구성한다. 이 때, 공간 인덱스가 2k차원이 되는 이유는 주파수 도메인에서의 값이 실수부와 허수부로 구성되는 복소수이기 때문이다.
이와 같이 n과 비교하여 훨씬 작은 k값을 사용하여 공간 인덱스를 구성하게 되면, 그 공간 인덱스의 차원 수가 크게 줄어들게 되며, 공간 인덱스를 위한 오버헤드와 검색 비용을 줄일 수 있다는 장점이 있다.
반면, k개 이외의 DFT 계수들은 무시되므로 공간 인덱스를 통하여 검색된 객체들 중에서는 질의 시퀀스와의 유클리드 거리가 ε이내에 있지 않는 폴스 매치(false match)가 존재하게 된다. 따라서, 공간 인덱스를 통하여 검색한 후보 객체들을 실제로 액세스함으로써 폴스 매치들을 제거하는 과정이 추가된다.
즉, k개의 DFT 계수만을 활용하여 공간 인덱스를 구성하는 기존 기법의 유용성은 DFT의 특성에 기반을 두고 있는데, 상기 DFT는 유사성 검색 대상인 대부분의 데이타 시퀀스에 대하여 시간 도메인 내의 원 데이타 시퀀스가 가지는 에너지(다차원 공간상의 원점으로부터의 유클리드 거리)가 주파수 도메인으로 변환된 이후에도 그대로 유지되며, 에너지의 대부분이 변환된 데이타 시퀀스의 앞쪽 DFT 계수들에 집중되는 특성을 가진다.
따라서, k값을 크게 하는 경우에는 공간 인덱스의 차원수가 커지므로 저장 공간 및 인덱스 검색 비용이 커지게 되며, k값을 작게 하는 경우에는 공간 인덱스 검색 비용 측면에서는 상당히 유리하지만, 에너지 손실로 인하여 공간 인덱스 검색후의 후보 객체들의 수가 증가하므로 폴스 매치의 해결을 위하여 많은 후보 객체를 디스크로부터 액세스해야 하는 오버헤드를 초래한다.
기존 기법에서는 이러한 단점을 해소하기 위해 k값을 단지 2 혹은 3으로 사용하는 것을 추천하고 있으나 적합한 k값은 해당 응용에서 관리하는 데이타 시퀀스 집합의 특징에 따라 상이하며, 더욱이 무조건 앞쪽의 DFT 계수를 일방적으로 선택하는 것도 최적의 공간 인덱스를 구성하는 데에 장애가 된다.
따라서, 본 발명에서는 상기와 같은 문제점을 해결하고 유사성 검색을 효율적으로 지원하기 위해, 공간 인덱스 구성의 대상이 되는 시계열 데이터 베이스의 특성을 사전에 분석함으로써 공간 인덱스 검색 비용과 후보 객체 검색 비용으로 구성되는 전체 검색 비용을 추정하고, 이를 기반으로 전체적인 비용을 최소화하도록 하는 공간 인덱스의 차원 수를 도출해 내는 체계적인 방법을 제공하고자 한다.
상기와 같은 목적을 달성하기 위해 본 발명에서는 공간 인덱스에 참여하는 DFT 계수를 선정하는 기준으로서 기존의 방법에서와 같이 단순한 에너지의 크기를 사용하지 않고, 이들의 표준 편차값을 이용하는 것을 특징으로 한다. 즉, 각 DFT 계수 값을 실수부와 허수부로 분리하고, 2n개의 계수들에 대하여 데이타베이스내의 모든 데이타 시퀀스들을 대상으로 각각의 표준 편차를 구하며, 이들 중 큰 표준 편차값을 갖는 계수일수록 데이타베이스내의 데이타 시퀀스를 잘 분별할 수 있으므로 이들을 대상으로 공간 인덱스를 구성한다.
도 1은 본 발명의 일 실시예에 따른 공간 인덱스 구성방법에 대한 처리 흐름도.
이하, 첨부된 도면을 참조하여 본 발명의 공간 인덱스 구성방법을 좀 더 상세히 설명하고자 한다.
도 1은 본 발명의 일 실시예에 따른 공간 인덱스 구성방법에 대한 처리 흐름도로서, 도 1을 참조하면, 먼저, 주어진 N개의 데이타 시퀀스 집합내에서 길이 n인 하나의 데이타 시퀀스 S(i)를 선택(1≤i≤N)(101)한 후, 그 데이터 시퀀스 S(i)에 대한 이산 퓨리에 변환(DFT:Discrete Fourier Transform)을 수행하여 실수부 R(i, j)와 허수부 I(i, j)로 구성되는 DFT 계수들을 생성(1≤j≤n)(102)하며, 그 생성된 DFT 계수중 DFT의 대칭적인 특징에 의하여 앞의 n/2 개의 DFT 계수만을 취하여(103), 그 DFT 계수들을 배열 c(k)(1≤k≤n)에 저장(104)한다.
이 때, 상기 상기 과정(101 내지 104)을 선택된 데이터 시퀀스 S(i)가 마지막 데이터 시퀀스가 될 때까지(105) 반복 수행한다.
그리고, 상기와 같이 생성된 배열 c(k)에 저장된 모든 DFT 계수들에 대한 표준 편차를 구하여(106 내지 108), 그 표준 편차의 크기에 의해 배열 c(k)를 내림 차순으로 정렬하여 해당 번지(k값)를 정렬된 순서에 의해 배열 D(p)(1≤p≤n)에 저장(109)한다. 즉, D(3)에 5가 존재한다면, c(5)에 저장된 DFT 계수의 표준 편차는 3번째로 큰 것임을 의미한다.
상기와 같은 일련의 과정을 처리하였으면, 데이타 집합내의 모든 데이타 시퀀스들을 액세스하여 프랙탈 차원(D0)과 상관 프랙탈 차원(D2)을 계산(110)하는데, 이 프랙탈 차원과 상관 프랙탈 차원은 추후 가정된 공간 인덱스의 질의에 대한 검색 시간 계산을 위해 사용된다.
상기 상기 프랙탈 차원(D0)과 상관 프랙탈 차원(D2)을 구하는 공식은 (수학식 2)와 같으며, 상기 (수학식 2)에서 q=0이면 프랙탈 차원을 나타내고, q=2이면 상관 프랙탈 차원을 나타낸다.
여기서, r=전체 다차원 공간내의 한 셀이 가지는 각 차원에서의 변의 길이,
Pi=각 차원을 r로 나눔으로써 생성된 다차원 공간내의 i번째 셀내의 객체 수
이와 같이 프랙탈 차원(D0)과 상관 프랙탈 차원(D2)을 계산하였으면, 상기 D(p)의 내용을 순서대로 하나씩 선택하여 해당되는 질의에 대한 전체 비용(TotalCost(p,m)) 및 평균 비용(TotalCost(p))을 계산한다.
이 때, 상기 D(1)에는 표준 편차가 가장 큰 DFT 계수가 저장된 배열 c(k)의 번지가 저장되고, D(2)에는 표준 편차가 두번째로 큰 DFT 계수가 저장된 배열 c(k)의 번지가 저장되며, D(n)에는 표준 편차가 가장 작은 DFT 계수가 저장된 배열 c(k)의 번지가 저장된다.
한편, 큰 표준 편차값을 갖는 DFT 계수일수록 데이터베이스내의 데이터 시퀀스를 잘 분별할 수 있는 특성이 있으므로, 다차원 공간 인덱스의 생성을 가정할 때, 표준 편차가 큰 DFT의 계수를 우선적으로 공간 인덱스에 참여시키는데, 이를 위해 먼저, D(1)에서 가리키는 번지에 저장된 DFT 계수를 선택(111)하여 다차원 공간 인덱스의 생성을 가정(112)한 후, 질의 집합에 포함된 질의별로 그 공간 인덱스에 대한 전체 검색 비용(TotalCost(1,m))(이 때, m은 질의 집합에서 m번째의 질의를 가리킴.)을 계산(113 내지 117)하고, 상기 질의 집합에 포함된 모든 질의에 대하여 해당 공간 인덱스에서의 검색 비용을 계산하였으면, 그 검색 비용들의 평균(TotalCost(1))을 구한다.
이와 같이하여 D(1)에서 가리키는 번지에 저장된 DFT계수에 의한 공간 인덱스의 검색 비용 계산이 완료되었으면, D(2)에서 가리키는 번지에 저장된 DFT 계수를 선택하여 상기 D(1)에서 가리키는 번지에 저장된 DFT와 D(2)에서 가리키는 번지에 저장된 DFT 계수에 의해 다차원 공간 인덱스의 생성을 가정(112)한 후, 상기 검색 비용 계산(TotalCost(2)) 과정(113 내지 118)을 반복 수행한다.
이러한 과정을 D(n)이 될 때까지 반복하며, n개의 검색 비용에 대한 평균값(TotalCost(1),…,TotalCost(n))이 모두 계산되었으면, 그 평균값이 최소가 되는 경우(TotalCost(w))를 선택(120)하여, D(1),D(2),…,D(w)내에 나타난 w개의 DFT 계수를 다차원 공간 인덱스의 인덱싱 애트리뷰트로 선정(121)한다.
이 때, 상기 검색 비용 계산(TotalCost(p)) 과정(113 내지 119)을 도면을 참조하여 구체적으로 설명하면, 주어진 q개의 질의 집합내에서 하나의 질의 Q(m)(1≤m≤q)를 선택(113)하여 해당 질의에 의한 그 공간 인덱스의 검색 비용(TreeSearchCost(p,m))을 계산(114)하고, 상기 선택된 질의에 의해 후보 객체 검색 비용(CandidateAccessCost(p,m))을 계산(115)하며, 상기 공간 인덱스 검색 비용과 후보 객체 검색 비용을 합하여 전체 검색 비용(TotalCost(p,m))을 계산(116)한다. 이러한 과정을 질의 집합내에 포함된 모든 질의에 대하여(117) 수행하여, 질의별 전체 검색 비용(TotalCost(p,m))을 질의 집합에 포함된 질의수(m)에 대한 평균값(TotalCost(p))를 계산(118)하며, 이러한 과정을 D(p)가 마지막(119)이 될 때까지 반복한다.
이 때, 해당 질의에 대한 공간 인덱스 검색 비용(TreeSearchCost(p,m))은 다음에 나타난 (수학식 3)을 이용하여 구하며, 후보 객체 검색 비용(CandidateAccessCost(p,m))은 (수학식 4)를 이용하여 구한다.
여기서, N는 전체 데이타 집합내의 시퀀스의 수,
D는 공간 인덱스에 사용된 계수 수(즉, 차원수),
Ceff는 R*-트리의 각 노드가 가지는 엔트리의 평균 수용량,
ε는 유사도를 나타내는 질의 영역의 반지름,
h는 R*-트리의 높이 (=logCeffN),
j는 R*-트리의 j 번째 단계에서의 각 엔트리가 표현하는 영역의 각 차원에서의 변의 길이로서,
여기서, D2는 상관 프랙탈 차원,
E는 시퀀스의 원래 차원 수 n,
ε는 유사도를 나타내는 질의 영역의 반지름,
α는 다차원 공간인덱스에 참여하지 않는 계수들의 표준 편차의 합,
Vol(ε,□)는 한변의 길이가 ε인 정방형 객체의 체적,
Vol(ε,○)는 반지름이 ε인 구형 객체의 체적
이와 같은 본 발명의 방법은 공간 인덱스 구성의 대상이 되는 시계열 데이타베이스의 특성을 사전에 분석함으로써 주어진 데이타 및 질의 집합에 대한 최적의 공간 인덱스를 효과적으로 구성할 수 있으며, 이로인해, 공간 인덱스를 이용하여 유사성 검색을 처리하게 되는 경우 검색 비용을 최소화 할 수 있고 그 결과 전체 시스템 응답 시간이 향상된다는 장점이 있다.

Claims (4)

  1. 공간 인덱스 구성의 대상이 되는 시계열 데이터 베이스에 대한 이산 퓨리에 변환(DFT) 계수들의 표준 편차를 구하여 내림차순으로 정렬하고, 상기 시계열 데이터 베이스의 특성을 사전에 분석하는 제 1 과정과,
    상기 시계열 데이터 베이스의 특성을 참조하여 임의의 DFT 계수들에 의해 생성 가능한 모든 경우에 대한 다차원 공간 인덱스의 생성을 가정한 후, 그 공간 인덱스에 대한 질의 집합의 검색 비용을 계산하는 제 2 과정과,
    상기 검색 비용이 최소가 되는 공간 인덱스에 적용된 DFT 계수들을 선택하여 다차원 공간 인덱스의 인덱싱 애트리로 선정하는 제 3 과정으로 구성된 것을 특징으로 하는 유사성 검색을 지원하는 공간 인덱스 구성방법.
  2. 제 1 항에 있어서, 상기 제 1 과정은
    상기 시계열 데이터 베이스의 모든 데이터 시퀀스에 대한 이산 퓨리에 변환(DFT)을 수행하여 실수부와 허수부로 구성되는 이산 퓨리에 변환(DFT) 계수들을 생성하여 그들 중 앞의 n/2 개의 DFT 계수만을 선택하는 제 1 단계와,
    상기 시계열 데이터 베이스의 모든 데이터 시퀀스를 대상으로 그 선택된 DFT에 대한 표준 편차를 구하여 내림차순으로 정렬하고, 상기 모든 데이터 시퀀스들을 액세스하여 프랙탈 차원(D0)과 상관 프랙탈 차원(D2)를 계산하는 제 2 단계로 구성된 것을 특징으로 하는 유사성 검색을 지원하는 공간 인덱스 구성방법.
  3. 제 1 항에 있어서, 상기 제 2 과정은
    상기 내림차순으로 정렬된 DFT 계수들 중 가장 앞선 DFT 계수부터 하나씩 선택하여 그 DFT들이 적용된 다차원 공간 인덱스의 생성을 가정하는 제 1 단계와,
    임의의 질의 집합에 포함된 질의별로 상기 가정된 다차원 공간 인덱스들에 대한 전체 검색 비용을 계산하여, 상기 다차원 공간 인덱스별로 각 질의 들에 대한 전체 검색 비용의 평균값을 구하는 제 2 단계로 구성된 것을 특징으로 하는 유사성 검색을 지원하는 공간 인덱스 구성방법.
  4. 제 3 항에 있어서, 상기 제 2 단계는
    다음 (수학식 1)을 이용하여 해당 질의에 대한 공간 인덱스 검색 비용을 구하고,
    다음 (수학식 2)를 이용하여 해당 질의에 대한 후보 객체 검색 비용을 구한 후,
    상기 공간 인덱스 검색 비용 및 후보 객체 검색 비용을 합하여 가정된 공간 인덱스에 대한 해당 질의의 전체 검색 비용을 구하는 것을 특징으로 하는 유사성 검색을 지원하는 공간 인덱스 구성방법.
    (수학식 1)
    여기서, N는 전체 데이타 집합내의 시퀀스의 수,
    D는 공간 인덱스에 사용된 계수 수(즉, 차원수),
    Ceff는 R*-트리의 각 노드가 가지는 엔트리의 평균 수용량,
    ε는 유사도를 나타내는 질의 영역의 반지름,
    h는 R*-트리의 높이 (= logCeffN),
    j는 R*-트리의 j 번째 단계에서의 각 엔트리가 표현하는 영역의 각 차원에서의 변의 길이로서,
    (수학식 2)
    여기서, D2는 상관 프랙탈 차원,
    E는 시퀀스의 원래 차원 수 n,
    ε는 유사도를 나타내는 질의 영역의 반지름,
    α는 다차원 공간인덱스에 참여하지 않는 계수들의 표준 편차의 합,
    Vol(ε,□)는 한변의 길이가 ε인 정방형 객체의 체적,
    Vol(ε,○)는 반지름이 ε인 구형 객체의 체적
KR1019980049332A 1998-11-17 1998-11-17 유사성 검색을 지원하는 공간 인덱스 구성방법 KR100282608B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980049332A KR100282608B1 (ko) 1998-11-17 1998-11-17 유사성 검색을 지원하는 공간 인덱스 구성방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980049332A KR100282608B1 (ko) 1998-11-17 1998-11-17 유사성 검색을 지원하는 공간 인덱스 구성방법

Publications (2)

Publication Number Publication Date
KR20000032772A KR20000032772A (ko) 2000-06-15
KR100282608B1 true KR100282608B1 (ko) 2001-02-15

Family

ID=19558707

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980049332A KR100282608B1 (ko) 1998-11-17 1998-11-17 유사성 검색을 지원하는 공간 인덱스 구성방법

Country Status (1)

Country Link
KR (1) KR100282608B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100429792B1 (ko) * 2000-11-15 2004-05-03 삼성전자주식회사 특징 벡터 공간의 인덱싱 방법 및 검색 방법
KR100472948B1 (ko) * 2001-10-11 2005-03-08 한국전자통신연구원 시계열 데이터베이스에서 서브 시퀀스 매칭의 후처리최적화 방법
KR100472949B1 (ko) * 2001-10-18 2005-03-08 한국전자통신연구원 시계열 데이터베이스에서 서브시퀀스 매칭의 인덱스검색방법
KR101833996B1 (ko) 2017-08-18 2018-04-13 주식회사 마크베이스 데이터 검색 시스템 및 방법

Also Published As

Publication number Publication date
KR20000032772A (ko) 2000-06-15

Similar Documents

Publication Publication Date Title
KR100545477B1 (ko) 거리 측정기를 사용한 이미지 검색법
US6122628A (en) Multidimensional data clustering and dimension reduction for indexing and searching
US6134541A (en) Searching multidimensional indexes using associated clustering and dimension reduction information
Van Rijsbergen et al. Document clustering: An evaluation of some experiments with the Cranfield 1400 collection
Raptopoulou et al. Fast nearest-neighbor query processing in moving-object databases
Yagoubi et al. Dpisax: Massively distributed partitioned isax
JP2002519748A (ja) 像検索システム
Zhang et al. TARDIS: Distributed indexing framework for big time series data
Cui et al. Indexing high-dimensional data for efficient in-memory similarity search
CN110909197A (zh) 一种高维特征的处理方法和装置
Willett A fast procedure for the calculation of similarity coefficients in automatic classification
KR100282608B1 (ko) 유사성 검색을 지원하는 공간 인덱스 구성방법
Morrison et al. Improving hybrid MDS with pivot-based searching
CN113792709B (zh) 快速大规模人脸识别方法及系统
CN112199461B (zh) 基于块索引结构的文档检索方法、装置、介质和设备
WO2017027007A1 (en) Using a shared priority queue for multi-threaded searching
King et al. Non-hierarchical clustering with rival penalized competitive learning for information retrieval
Herath et al. Em-k indexing for approximate query matching in large-scale er
Dmitry et al. Indexing and retrieval scheme for content-based multimedia applications
Song et al. A novel join technique for similar-trend searches supporting normalization on time-series databases
Wang et al. Non-uniform partition strategies for indexing high-dimensional data with different distributions
Brito et al. Empirical Evaluation of Strategies to Process Range Queries of Numeric Sequences in Batch-Mode
Zhang et al. Skyline: Stacking Optimal Solutions in Exact and Uncertain Worlds.
Harnsomburana et al. A hybrid tree approach for efficient image database retrieval with dynamic feedback
Kim et al. Performance bottleneck in time-series subsequence matching

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091029

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee