KR101081459B1 - 고차원 이진 데이터 검색 장치 및 방법 - Google Patents

고차원 이진 데이터 검색 장치 및 방법 Download PDF

Info

Publication number
KR101081459B1
KR101081459B1 KR1020100013892A KR20100013892A KR101081459B1 KR 101081459 B1 KR101081459 B1 KR 101081459B1 KR 1020100013892 A KR1020100013892 A KR 1020100013892A KR 20100013892 A KR20100013892 A KR 20100013892A KR 101081459 B1 KR101081459 B1 KR 101081459B1
Authority
KR
South Korea
Prior art keywords
binary data
reliability
real vector
data
binary
Prior art date
Application number
KR1020100013892A
Other languages
English (en)
Other versions
KR20110094490A (ko
Inventor
유창동
진민호
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020100013892A priority Critical patent/KR101081459B1/ko
Publication of KR20110094490A publication Critical patent/KR20110094490A/ko
Application granted granted Critical
Publication of KR101081459B1 publication Critical patent/KR101081459B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 입력 정보를 분석하여 실수 벡터를 추출하는 실수 벡터 추출부, 상기 추출된 실수 벡터에 양자화 기법을 적용하여 이진 데이터로 변환하는 이진화부, 상기 변환된 이진 데이터의 신뢰도를 구하고, 그 신뢰도를 기반으로 하나 이상의 후보점을 생성하는 후보점 생성부, 상기 생성된 후보점 중에서 최근접 데이터를 선택하는 검색부로 구성되어, 이진 데이터를 추출하는 과정에서 손실되는 정보를 양자 비트로 표현하고, 이러한 양자 비트 표현에서 신뢰도를 계산함으로써 검색에 수반되는 연산량을 줄이며 정확도를 향상시키는 효과가 있다.

Description

고차원 이진 데이터 검색 장치 및 방법{Apparatus and Method for high-dimensional binary data search}
본 발명은 고차원 이진 데이터 검색 장치 및 방법에 관한 것으로, 더욱 상세하게는 입력 정보에서 추출된 실수 벡터에 양자화 기법을 적용하여 이진 데이터로 변환하고, 상기 변환된 이진 데이터의 신뢰도를 구하여 그 신뢰도를 기반으로 하나 이상의 후보점을 생성하고, 각 후보점과 상기 이진 데이터와의 비유사성을 근거로 최근접 데이터를 선택하는 고차원 이진 데이터 검색 장치 및 방법에 관한 것이다.
정보 처리 기술의 발전에 따라 멀티미디어 인식 및 생체 신호 인식에 관한 요구가 증대하고 있다. 이러한 인식 기술은 입력된 멀티미디어 및 생체 신호가 어느 멀티미디어 콘텐츠(contents) 및 사람(person)에게서 획득된 것인지를 확인하기 위해, 등록된 콘텐츠 및 사람에게서 획득된 신호들을 이용하여 데이터베이스를 구축한 후, 임의의 입력이 들어왔을 때 이 입력에서 추출한 이진 데이터가 미리 구축된 데이터베이스의 이진 데이터 중 어느 데이터와 가장 유사한지를 확인해야 한다.
정보 기술의 발전에 따라 인식해야할 데이터의 양은 기하급수적으로 증대하고 있기에 이러한 이진 데이터를 빠르고 정확하게 검색할 수 있는 기술에 대한 요구가 대두되고 있다.
도 1은 종래의 이진 데이터 검색 장치의 구성을 개략적으로 나타낸 블럭도, 도 2는 블라스트 알고리즘의 작동방법을 나타낸 도면이다.
도 1을 참조하면, 이진 데이터 검색 장치는 실수 벡터 추출부(100), 이진화부(110), 이진 데이터 검색부(120), 이진 데이터 데이터베이스(130)를 포함한다.
상기 실수 벡터 추출부(100)는 입력된 정보에서 실수 벡터를 추출하여 상기 이진화부(110)에 제공한다.
상기 이진화부(110)는 양자화 기법을 적용하여 상기 실수 벡터를 이진 데이터로 변환한다.
상기 이진 데이터 검색부(120)는 상기 이진화부(110)에서 변환된 이진 데이터와 가장 유사한 이진 데이터를 상기 이진 데이터 데이터베이스(130)를 검색하여 추출한다. 이때, 상기 이진 데이터 검색부(120)는 도 2와 같은 블라스트 알고리즘을 적용하여 이진 데이터를 검색한다.
도 2를 참조하면, 입력된 정보에서 추출된 k개의 D차원 이진 데이터에 대해 같은 차원의 데이터들을 근접 후보점(candidate nearest neighbors)으로 설정한다.
즉, 이진 데이터 검색 장치는 상기 k개의 D차원 이진 데이터에 대해 이진 데이터베이스(130)를 검색하여 같은 차원의 데이터(k개의 D차원 후보점)를 추출하고, 그것을 근접 후보점으로 설정한다.
그런 다음 상기 이진 데이터 검색 장치는 상기 설정된 근접 후보점 중에서 입력 데이터에서 추출한 이진 데이터와 가장 유사한 데이터를 검색 결과로 출력한다. 상기 출력된 이진 데이터가 상기 입력된 정보와 같은 멀티미디어 또는 같은 사람의 생체 정보에 해당한다고 파악한다.
이진화된 데이터의 검색은 상기와 같은 블라스트 기반 방식 외에도 나무 구조(tree structure)를 이용하는 경우도 있지만, 입력 데이터의 차수(KD)가 수백이 넘어가는 경우, 이러한 자료 구조 자체가 너무 많은 메모리를 차지하기 때문에 사용하는데 문제가 따른다.
또한, 블라스트를 이용할 경우, 고차원의 이진 데이터에 포함된 모든 저차원 데이터를 이용하면 너무 많은 후보점을 회수하게 되는 단점이 있다.
본 발명의 목적은 고차원 이진 데이터 검색 시 검증해야할 후보 점들의 수를 효율적으로 줄여주면서 동시에 검색의 정확도를 높일 수 있는 고차원 이진 데이터 검색 장치 및 방법을 제공하는데 있다.
본 발명의 다른 목적은 고차원 이진 데이터 검색시 검색에 수반되는 연산량을 줄이며 정확도를 향상시키는 고차원 이진 데이터 검색 장치 및 방법을 제공하는데 있다.
상기 목적들을 달성하기 위하여 본 발명에 따르면, 입력 정보를 분석하여 실수 벡터를 추출하는 실수 벡터 추출부, 상기 추출된 실수 벡터에 양자화 기법을 적용하여 이진 데이터로 변환하는 이진화부, 상기 변환된 이진 데이터의 신뢰도를 구하고, 그 신뢰도를 기반으로 하나 이상의 후보점을 생성하는 후보점 생성부, 상기 생성된 각 후보점과 상기 이진 데이터와의 비유사성을 근거로 최근접 데이터를 선택하는 검색부를 포함하는 고차원 이진 데이터 검색 장치가 제공된다.
상기 이진화부는
Figure 112010010074210-pat00001
를 이용하여 상기 실수 벡터를 이진 데이터로 변환하되, 상기
Figure 112010010074210-pat00002
는 입력에서 추출한 k번째 실수 벡터의 d번째 원소이고,
Figure 112010010074210-pat00003
는 이로부터 변환된 이진 데이터이다.
상기 후보점 생성부는 상기 변환된 이진 데이터에 대한 비트당 신뢰도(
Figure 112010010074210-pat00004
)를 계산하여 이진 데이터의 신뢰도를 구하고, 상기 구해진 신뢰도를 기반으로 이진 데이터를 선별하여 하나 이상의 후보점을 생성한다.
상기 비트당 신뢰도(
Figure 112010010074210-pat00005
)는
Figure 112010010074210-pat00006
를 이용하여 구하되, 상기
Figure 112010010074210-pat00007
로 구하고,
Figure 112010010074210-pat00008
로 구하고, 상기
Figure 112010010074210-pat00009
Figure 112010010074210-pat00010
는 기저대역 벡터들의 가중치이다.
상기 이진 데이터의 신뢰도(R[k])는
Figure 112010010074210-pat00011
를 이용하여 구한다.
상기 고차원 이진 데이터 검색 장치는 상기 입력 정보에 대한 이진 데이터가 저장된 이진 데이터 데이터베이스를 더 포함한다.
상기 후보점 생성부는 상기 구해진 신뢰도를 내림차순으로 정렬하여 신뢰도가 높은 순으로 일정 개수의 지수 집합을 구하고, 상기 구해진 지수 집합 각각의 원소에 대해 상기 데이터베이스에 저장된 이진 데이터와의 거리가 임계치 이하인 원소의 집합을 후보점으로 검출한다.
상기 검색부는 상기 생성된 각 후보점과 상기 이진 데이터와의 비유사성을 각각 구하고, 상기 구해진 비유사성을 내림차순으로 정렬하여 최하위의 값을 가진 후보점을 최근접 데이터로 선택한다.
상기 비유사성(
Figure 112010010074210-pat00012
)은
Figure 112010010074210-pat00013
Figure 112010010074210-pat00014
를 이용하여 구하되,
Figure 112010010074210-pat00015
이고,
Figure 112010010074210-pat00016
는 비유사성을 계산하고자하는 이진 데이터에 존재하는 k번째 이진 벡터이다.
또한, 본 발명에 따르면, (a)입력 정보를 분석하여 실수 벡터를 추출하는 단계, (b)상기 추출된 실수 벡터에 양자화 기법을 적용하여 이진 데이터로 변환하는 단계, (c)상기 변환된 이진 데이터의 신뢰도를 구하고, 그 신뢰도를 기반으로 하나 이상의 후보점을 생성하는 단계, (d)상기 생성된 각 후보점에 대해 상기 이진 데이터와의 비유사성을 구하고, 상기 비유사성을 근거로 최근접 데이터를 선택하는 단계를 포함하는 고차원 이진 데이터 검색 방법이 제공된다.
상기 (c)단계는, 상기 변환된 이진 데이터에 대한 비트당 신뢰도를 계산하여 이진 데이터의 신뢰도를 구하는 단계, 상기 구해진 신뢰도를 내림차순으로 정렬하여 신뢰도가 높은 순으로 일정 개수의 지수 집합을 구하는 단계, 상기 구해진 지수 집합 각각의 원소에 대해 이진데이터 데이터베이스에 저장된 이진 데이터와의 거리가 임계치 이하인 원소의 집합을 후보점으로 검출하는 단계를 포함한다.
상기 최근접 데이터는 상기 구해진 비유사성을 내림차순으로 정렬하여 최하위의 값을 가진 후보점을 말한다.
상술한 바와 같이 본 발명에 따르면, 고차원 이진 데이터 검색 시 검증해야할 후보 점들의 수를 효율적으로 줄여주면서 동시에 검색의 정확도를 향상시키는 효과가 있다.
또한, 고차원 이진 데이터 검색시 이진 데이터의 신뢰도를 양자 비트 개념을 도입하여 계산하므로, 검색에 수반되는 연산량을 줄이며 정확도를 향상시키는 효과가 있다.
또한, 고차원 이진 데이터 검색은 이진 데이터를 추출하는 과정에서 손실되는 정보를 양자 비트로 표현하고, 이러한 양자 비트 표현에서 신뢰도를 계산함으로써 기존의 블라스트(BLAST) 검색 기법에 비해 적은 연산량으로 정확한 검색을 가능케 한다.
도 1은 종래의 이진 데이터 검색 장치의 구성을 개략적으로 나타낸 블럭도.
도 2는 종래의 블라스트 알고리즘의 작동방법을 나타낸 도면.
도 3은 본 발명에 따른 고차원 이진 데이터 검색 장치의 구성을 개략적으로 나타낸 블럭도.
도 4는 본 발명에 따른 신뢰도 기반 고차원 검색 방법을 설명하기 위한 도면.
도 5는 본 발명에 따른 고차원 이진 데이터 검색 방법을 나타낸 흐름도.
도 6은 본 발명에 따른 신뢰도 기반 후보점 생성 방법을 나타낸 흐름도.
도 7 내지 도 10은 본 발명에 따른 오디오 및 비디오 인식 시스템에서의 고차원 이진 데이터 검색 성능을 나타낸 예시도.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.
도 3은 본 발명에 따른 고차원 이진 데이터 검색 장치의 구성을 개략적으로 나타낸 블럭도이다.
도 3을 참조하면, 고차원 이진 데이터 검색 장치는 실수 벡터 추출부(300), 이진화부(310), 후보점 생성부(320), 검색부(330), 이진 데이터 데이터베이스(340)를 포함하다.
상기 실수 벡터 추출부(300)는 입력 정보를 분석하여 실수 벡터(v[k])를 추출한다. 여기서, 상기 입력 정보는 멀티미디어 정보, 사람의 생체 정보 등을 말하고, 상기 실수 벡터는 오디오의 경우 정규화된 스펙트럼 부밴드 중심점에 기반한 핑거프린트일 수 있고, 비디오의 경우 영상 기울기 방향 중심점에 기반한 핑거프린트일 수 있다.
예를 들어, 입력 정보가 오디오인 경우 상기 실수 벡터 추출부(300)는 오디오 신호의 스펙트럼을 이용하여 실수 벡터를 추출한다.
상기 이진 데이터 데이터베이스(340)에는 전체 I개의 이진 데이터(
Figure 112010010074210-pat00017
)가 수학식 1과 같은 형태로 등록되어 있다. 여기서, 상기 이진 데이터는 멀티미디어 또는 생체 정보에서 추출된 데이터이다.
Figure 112010010074210-pat00018
상기 수학식 1에서 한 개의 이진 데이터(
Figure 112010010074210-pat00019
)는 K개의 D비트 벡터들로 구성되어 있으며, 위첨자 i는 해당 이진 데이터가 i번째 데이터에서 추출되어 이진 데이터 데이터베이스(340)에 저장된 이진 벡터임을 의미한다.
상기 이진화부(310)는 양자화 기법을 적용하여 상기 실수 벡터 추출부(300)에서 추출된 실수 벡터를 이진 데이터로 변환한다.
본 발명에서는 같은 원본을 가지는(예를 들어 같은 비디오 또는 같은 사람의 생체정보에서 추출된) 정보들이 신호를 취득할 때마다 잡음 또는 왜곡에 의해서 원래의 형태와 다르게 추출된다. 이를 보다 자세히 설명하기 위해 이진 데이터 데이터베이스(340)를 만들기 위해 사용된 i번째 데이터가 현재 입력부(미도시)에 들어오는 입력과 같은 원본을 가진다고 가정하고, 이를 수학식 2와 같이 서술한다.
Figure 112010010074210-pat00020
여기서, 상기
Figure 112010010074210-pat00021
는 i번째 데이터에 대해 상기 실수 벡터 추출부(300)에서 추출한 k번째 실수 벡터를 말한다.
따라서, 상기 이진화부(310)는 수학식 1의 이진 데이터들을 수학식 2와 같은 K개의 D차 실수 벡터들로부터 수학식 3과 같은 양자화 기법을 이용하여 이진 데이터로 변환한다.
Figure 112010010074210-pat00022
여기서, 상기
Figure 112010010074210-pat00023
는 i번째 데이터에서 추출한 k번째 실수 벡터의 d번째 원소이고, 상기
Figure 112010010074210-pat00024
는 이로부터 변환된 이진 데이터이다.
이때, 상기 입력 정보에서 추출된 실수 벡터값
Figure 112010010074210-pat00025
는 이진 데이터베이스(340)에 있는 i번째 이진 데이터를 추출하는데 사용된 실수 벡터
Figure 112010010074210-pat00026
와는 다르게 된다. 이 차이를 가산 잡음
Figure 112010010074210-pat00027
로 표현하면 v[k]는 수학식 4와 같이 표현된다.
Figure 112010010074210-pat00028
상기 이진 데이터베이스(340)는 이진화된 데이터
Figure 112010010074210-pat00029
만을 저장하고 있기 때문에 수학식 4에서 i번째 데이터
Figure 112010010074210-pat00030
는 알 수가 없다.
또한, I개의 이진화된 데이터 중에서 어떤 이진화된 데이터가 i에 해당하는지를 알 수 없다.
따라서, 상기 이진화부(310)은
Figure 112010010074210-pat00031
의 이진화하기 전의 실수 값 입력에 대해, 이에 해당하는 정답의 이진 데이터가 0 또는 1일 확률을 추정하여 입력에서 추출한 이진화된 데이터
Figure 112010010074210-pat00032
의 신뢰도를 계산하기 위해 양자비트 개념을 이용한다.
즉, 상기 이진화부는 일반적으로 수학식 5를 이용하여 실수 벡터를 이진 데이터로 변환한다.
Figure 112010010074210-pat00033
여기서, 상기
Figure 112010010074210-pat00034
는 입력에서 추출한 k번째 실수 벡터의 d번째 원소이고,
Figure 112010010074210-pat00035
는 이로부터 변환된 이진 데이터이다.
양자 비트는 비트가 0 또는 1의 값 중 하나를 배타적으로 갖는 것이 아니라 0과 1의 중첩(superposition)된 상태를 가정하여, 이 비트 값이 0 또는 1이 되는 경우를 확률적으로 생각한다.
상기 수학식 5와 같은 이진화 기법을 이용한 경우, e[k]의 분포를 이용하면 양자 비트 형태의 수학식 6을 얻을 수 있다.
Figure 112010010074210-pat00036
여기서, 상기 q[k]는 두 가지 값,
Figure 112010010074210-pat00037
Figure 112010010074210-pat00038
를 가지고 있는데, 이 두 값은 각각 왜곡이 가해진 입력이 주어졌을 때, 이 입력의 왜곡 없는 원본에서 추출한 이진 데이터가 0 또는 1일 확률에 관련된 값이다. 이러한 확률 값들을 하나의 기호로 표시하기 위해서 힐버트 공간(Hilbert space)의 두 직교 정규(orthonormal) 기저 벡터(bases vector)인 |0>,과 |1>을 이용하여 표현한 값이 q[k]이다.
즉, |0>,과 |1>은 각각 힐버트 공간인
Figure 112010010074210-pat00039
에서 정의된 직교 정규 기저 벡터들이다. 이 기저 벡터들의 가중치인
Figure 112010010074210-pat00040
Figure 112010010074210-pat00041
의 절대값의 제곱은 수학식 7과 같다.
Figure 112010010074210-pat00042
Figure 112010010074210-pat00043
상기 수학식 7을 계산함에 있어서
Figure 112010010074210-pat00044
의 확률 밀도 함수를 입력에서 추정하거나 시스템 구축시 임의로 설정할 수 있다.
상기 후보점 생성부(320)는 상기 이진화부(310)에서 변환된 이진 데이터에 대해 신뢰도를 구하고, 그 신뢰도를 기반으로 후보점을 생성한다.
즉, 상기 후보점 생성부(320)는 상기 변환된 이진 데이터에 대한 비트당 신뢰도(
Figure 112010010074210-pat00045
)를 수학식 8을 이용하여 계산한다.
Figure 112010010074210-pat00046
그런 다음 상기 후보점 생성부(320)는 상기 계산된 비트당 신뢰도를 이용한 이용하여 이진 데이터
Figure 112010010074210-pat00047
에 대한 신뢰도(R[k])를 수학식 9를 이용하여 구한다.
Figure 112010010074210-pat00048
그럼 다음 상기 후보점 생성부(320)는 상기 구해진 신뢰도를 내림차순으로 정렬하여 가장 신뢰도가 큰 W개의 지수 집합(index set) P = {k/R[k]가 가장 큰 W개에 해당}를 구한다.
그런 다음 상기 후보점 생성부(320)는 상기 구해진 지수 집합 각각의 원소에 대해 상기 이진 데이터 데이터베이스에 저장된
Figure 112010010074210-pat00049
중에서 b[p]와의 거리가 임계치 이하인 i의 집합을 후보점 집합으로 검출한다.
상기와 같이 후보점 생성부(320)는 K개의 D차원 이진 벡터 모두를 가지고 후보점을 생성하는 것이 아니라 신뢰도에 기반하여 신뢰도가 높은 순서대로 W<K개의 D차 이진 벡터를 이용하여 후보점을 생성한다.
상기 검색부(330)는 상기 후보점 생성부(320)에서 생성된 후보점 중에서 상기 입력 정보에서 추출한 실수 벡터에 대한 이진 데이터와의 비유사성을 계산하고, 상기 비유사성을 근거로 최근접 데이터를 선택한다.
즉, 상기 검색부(330)는 상기 후보점 생성부(320)에서 생성된 임의의 후보점 중에서 입력에서 추출한 양자비트 표현
Figure 112010010074210-pat00050
들과의 비유사성을 수학식 10을 이용하여 계산한다.
Figure 112010010074210-pat00051
여기서,
Figure 112010010074210-pat00052
이고,
Figure 112010010074210-pat00053
는 비유사성을 계산하고자하는 이진 데이터에 존재하는 k번째 이진 벡터이다.
그런 다음 상기 검색부(330)는 비유사성이 가장 작은 후보점을 최근접 데이터로 선택하여 출력한다.
상기와 같은 장치에 의해 블라스트 알고리즘을 적용할 때 K개 D차원의 이진 벡터
Figure 112010010074210-pat00054
를 모두 이용하여 상기 이진 데이터 데이터베이스(340)에서 각각의 b[k]를 포함하는 KD차원의 이진 벡터들을 추출할 경우, 너무 많은 후보점들을 생성하는 문제점을 해결할 수 있다.
또한, 신뢰도를 기반으로 후보점을 생성하므로, 데이터 검색시 검증해야 할 후보점들의 수를 효율적으로 줄일 수 있다.
도 4는 본 발명에 따른 신뢰도 기반 고차원 검색 방법을 설명하기 위한 도면이다.
도 4를 참조하면, 입력 정보로부터 K개의 D차원 실수 벡터가 추출되면, 이진 데이터 검색 장치는 상기 추출된 실수 벡터를 양자화 기법을 적용하여 이진 데이터로 변환한다(S400).
그런 다음 상기 이진 데이터 검색 장치는 상기 변환된 이진 데이터의 신뢰도를 구하고, 상기 신뢰도를 기반으로 일정 개수의 지수 집합을 구한다(S402). 그런 다음 상기 이진 데이터 검색 장치는 상기 지수 집합 각각의 원소에 대해 이진 데이터 데이터베이스(340)에 저장된 이진 데이터와의 거리를 구하여, 그 거리가 임계치 이하인 이진 데이터를 후보점으로 검출한다(S404).
상기와 같은 방법에 의해 데이터 검색시 검증해야 할 후보점의 수가 줄어들게 된다.
도 5는 본 발명에 따른 고차원 이진 데이터 검색 방법을 나타낸 흐름도이다.
도 5를 참조하면, 이진 데이터 검색 장치는 멀티미디어 또는 생체 정보와 같은 정보가 입력되면(S500), 상기 입력된 정보를 분석하여 실수 벡터를 추출한다(S502).
상기 S502의 수행 후, 상기 이진 데이터 검색 장치는 양자화 기법을 이용하여 상기 추출된 실수 벡터를 이진 데이터로 변환한다(S504).
그런 다음 상기 이진 데이터 검색 장치는 상기 변환된 이진 데이터에 대해 신뢰도를 구하고, 그 신뢰도를 기반으로 후보점을 생성한다(S506).
이때, 상기 이진 데이터 검색 장치는
Figure 112010010074210-pat00055
의 이진화하기 전의 실수 값 입력에 대해, 이에 해당하는 정답의 이진 데이터가 0 또는 1일 확률을 추정하여 입력에서 추출한 이진화된 데이터
Figure 112010010074210-pat00056
의 신뢰도를 계산하기 위해 양자비트 개념을 이용한다. 상기 이진 데이터 검색 장치가 후보점을 생성하는 방법에 대한 상세한 설명은 도 6을 참조하기로 한다.
상기 S506의 수행 후, 상기 이진 데이터 검색 장치는 상기 생성된 각 후보점중에서 최근접 데이터를 추출한다(S508). 즉, 상기 이진 데이터 검색 장치는 각 후보점에 대해 입력 이진 데이터와의 비유사성을 구하고, 비유사성이 가장 작은 후보점을 최근접 데이터로 추출한다.
도 6은 본 발명에 따른 신뢰도 기반 후보점 생성 방법을 나타낸 흐름도이다.
도 6을 참조하면, 이진 데이터 검색 장치는 변환된 이진 데이터에 대한 비트당 신뢰도를 계산하고(S600), 상기 비트당 신뢰도를 이용하여 이진 데이터의 신뢰도를 구한다(S602). 즉, 상기 이진 데이터 검색 장치는 수학식 7을 이용하여 비트당 신뢰도를 계산하고, 수학식 8을 이용하여 이진 데이터의 신뢰도를 구한다.
그런 다음 상기 이진 데이터 검색 장치는 상기 구해진 신뢰도를 내림차순으로 정렬하여 신뢰도가 높은 순으로 일정 개수의 지수 집합을 구한다(S604).
상기 S604의 수행 후, 상기 이진 데이터 검색 장치는 상기 구해진 지수 집합 각각의 원소에 대해 이진 데이터 데이터베이스에 저장된 이진 데이터와의 거리를 구하고(S606), 상기 구해진 거리가 미리 정해진 임계치 이하인지의 여부를 판단한다(S608).
상기 S608의 판단결과 그 거리가 임계치 이하이면, 상기 이진 데이터 검색 장치는 그 원소에 해당하는 이진 데이터를 후보점 집합으로 검출한다(S610).
도 7 내지 도 10은 본 발명에 따른 오디오 및 비디오 인식 시스템에서의 고차원 이진 데이터 검색 성능을 나타낸 예시도이다.
오디오 및 비디오 인식 시스템이 오디오 및 비디오에서 추출한 특징은 각각 정규화된 스펙트럼 부밴드 중심점에 기반한 핑거프린트 및 영상 기울기 방향 중심점에 기반한 핑거프린트를 이용하여 이진화하고, 그 이진화된 데이터를 이진 데이터베이스에 등록한다. 본 발명에서 신뢰도 기반 고차원 이진 데이터 검색 기법을 총합 62시간의 오디오에서 생성한 1,210,368개의 10초 단위 오디오 클립에서 추출한 이진 데이터로 구축된 이진 데이터 데이터베이스를 이용하여 검증한다. 각각의 10초 단위 오디오 클립에서 각 50개의 16차원 이진 데이터를 추출하고, 이러한 10초 단위 오디오 클립의 왜곡된 형태를 검색 시스템의 입력으로 사용하여 본 발명의 검색 성능을 평가한다.
도 7은 10초 단위의 입력 오디오 클립에 복합적 왜곡(10개의 주파수 대역에 대한 +-3dB 내의 무작위 증감, 25dB의 가산 잡음, 울림 필터 통과)을 가한 경우의 실시예이고, 도 8은 10초 단위의 입력 오디오 클립에 반향을 가한 경우 본 발명을 적용한 경우의 실시예이다.
본 발명에서 제안된 신뢰도 기반 고차원 검색 기법을 이용한 결과를 (RBLAST)로 표시, 이 알고리즘과 동일한 수의 후보점들을 생성하기 위해 기존의 블라스트 알고리즘에서 k=50개의 모든 16차원 이진 데이터를 이용하지 않고, 앞에서부터 몇 개의 이진 데이터를 취하던가(Beginning) 아니면 전체에서 임의로 (Random) 몇 개의 이진 데이터를 취한 경우의 성능을 표시하고 있다.
도 7과 도 8에서 보듯이 본 발명에 따른 신뢰도 기반 이진 데이터 검색 기법이 다른 방식의 이진 데이터 선택 기법보다 더 정확하게 검색을 수행하는 것을 확인할 수 있다.
도 9는 10초 단위의 입력 비디오 클립에 밝기 변화 왜곡을 가한 경우의 실시예, 도 10은 10초 단위의 입력 비디오 클립을 투사기로 투영한 후 캠코더로 촬영하는 방법으로 왜곡을 가한 경우에 적용한 실시예이다.
오디오 실험과 마찬가지로 본 발명에서 제안된 신뢰도 기반 고차원 검색 기법을 이용한 결과를 RBLAST로 표시하였고, 이 알고리즘과 동일한 수의 후보점들을 생성하기 위해 기존의 블라스트 알고리즘에서 개의 모든 8차원 이진 데이터를 이용하지 않고, 앞에서부터 몇 개의 이진 데이터를 취하던가 (beginning) 아니면 전체에서 임의로 (random) 몇 개의 이진 데이터를 취한 경우의 성능을 도시하고 있다.
도 9와 도 10에서 보듯이 비디오 검색 시스템에서도 본 발명에 따른 신뢰도 기반 이진 데이터 검색 기법이 다른 방식의 이진 데이터 선택 기법보다 더 정확하게 검색을 수행하는 것을 확인할 수 있다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100, 300 : 실수 벡터 추출부 110, 310 : 이진화부
120 : 이진 데이터 검색부 130, 340 : 이진 데이터 데이터베이스
320 : 후보점 생성부 330 : 검색부

Claims (12)

  1. 입력 정보를 분석하여 실수 벡터를 추출하는 실수 벡터 추출부;
    상기 추출된 실수 벡터에 양자화 기법을 적용하여 이진 데이터로 변환하는 이진화부;
    상기 변환된 이진 데이터의 신뢰도를 구하고, 그 신뢰도를 기반으로 하나 이상의 후보점을 생성하는 후보점 생성부;
    상기 입력 정보에 대한 이진 데이터가 기저장된 이진 데이터 데이터베이스; 및
    상기 생성된 각 후보점과 상기 저장된 이진 데이터와의 비유사성을 근거로 최근접 데이터를 선택하는 검색부;를 포함하고,
    상기 후보점 생성부는 상기 변환된 이진 데이터에 대한 비트당 신뢰도(
    Figure 112011057777313-pat00083
    )를 계산하여 이진 데이터의 신뢰도를 구하고, 상기 구해진 신뢰도를 기반으로 이진 데이터를 선별하여 하나 이상의 후보점을 생성하는 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  2. 제1항에 있어서,
    상기 이진화부는
    Figure 112010010074210-pat00057
    를 이용하여 상기 실수 벡터를 이진 데이터로 변환하되, 상기
    Figure 112010010074210-pat00058
    는 입력에서 추출한 k번째 실수 벡터의 d번째 원소이고,
    Figure 112010010074210-pat00059
    는 이로부터 변환된 이진 데이터인 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  3. 삭제
  4. 제1항에 있어서,
    상기 비트당 신뢰도(
    Figure 112011057777313-pat00061
    )는
    Figure 112011057777313-pat00062
    를 이용하여 구하되,
    상기
    Figure 112011057777313-pat00063
    로 구하고,
    Figure 112011057777313-pat00064
    로 구하고, 상기
    Figure 112011057777313-pat00065
    Figure 112011057777313-pat00066
    는 기저대역 벡터들의 가중치인 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  5. 제1항에 있어서,
    상기 이진 데이터의 신뢰도(R[k])는
    Figure 112011057777313-pat00067
    를 이용하여 구하는 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  6. 삭제
  7. 제1항에 있어서,
    상기 후보점 생성부는 상기 구해진 신뢰도를 내림차순으로 정렬하여 신뢰도가 높은 순으로 일정 개수의 지수 집합을 구하고, 상기 구해진 지수 집합 각각의 원소에 대해 상기 데이터베이스에 저장된 이진 데이터와의 거리가 임계치 이하인 원소의 집합을 후보점으로 검출하는 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  8. 제1항에 있어서,
    상기 검색부는 상기 생성된 각 후보점과 상기 이진 데이터와의 비유사성을 각각 구하고, 상기 구해진 비유사성을 내림차순으로 정렬하여 최하위의 값을 가진 후보점을 최근접 데이터로 선택하는 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  9. 제8항에 있어서,
    상기 비유사성(
    Figure 112010010074210-pat00068
    )은
    Figure 112010010074210-pat00069
    Figure 112010010074210-pat00070
    를 이용하여 구하되,
    Figure 112010010074210-pat00071
    이고,
    Figure 112010010074210-pat00072
    는 비유사성을 계산하고자하는 이진 데이터에 존재하는 k번째 이진 벡터인 것을 특징으로 하는 고차원 이진 데이터 검색 장치.
  10. 삭제
  11. 삭제
  12. 삭제
KR1020100013892A 2010-02-16 2010-02-16 고차원 이진 데이터 검색 장치 및 방법 KR101081459B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100013892A KR101081459B1 (ko) 2010-02-16 2010-02-16 고차원 이진 데이터 검색 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100013892A KR101081459B1 (ko) 2010-02-16 2010-02-16 고차원 이진 데이터 검색 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110094490A KR20110094490A (ko) 2011-08-24
KR101081459B1 true KR101081459B1 (ko) 2011-11-08

Family

ID=44930478

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100013892A KR101081459B1 (ko) 2010-02-16 2010-02-16 고차원 이진 데이터 검색 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101081459B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254902A (ja) * 1997-03-14 1998-09-25 Nippon Telegr & Teleph Corp <Ntt> オブジェクトの類似度算出方法および類似オブジェクト検索装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254902A (ja) * 1997-03-14 1998-09-25 Nippon Telegr & Teleph Corp <Ntt> オブジェクトの類似度算出方法および類似オブジェクト検索装置

Also Published As

Publication number Publication date
KR20110094490A (ko) 2011-08-24

Similar Documents

Publication Publication Date Title
US11675903B2 (en) Apparatus for detecting variants of malicious code based on neural network learning, method therefor and computer readable recording medium storing program for performing the method
JP5813221B2 (ja) オーディオ信号を用いたコンテンツ認識装置及び方法
EP1650683A1 (en) Search of similar features representing objects in a large reference database
CN111126396A (zh) 图像识别方法、装置、计算机设备以及存储介质
WO2006051792A1 (ja) マッチング装置及び画像検索システム並びにヒストグラム近似復元装置、並びにマッチング方法及び画像検索方法並びにヒストグラム近似復元方法
CN111368867B (zh) 档案归类方法及系统、计算机可读存储介质
KR102111858B1 (ko) 기계학습을 이용한 획 기반 수기 서명 인증 방법 및 시스템
JP5634075B2 (ja) 画像のシーケンスを処理する方法および装置、画像データを処理する装置、ならびにコンピュータプログラム製品
CN108615006B (zh) 用于输出信息的方法和装置
De Souza et al. Detection of violent events in video sequences based on census transform histogram
Duan et al. Video shot boundary detection based on feature fusion and clustering technique
JP6462111B2 (ja) 情報信号の指紋を生成するための方法及び装置
KR101515308B1 (ko) 얼굴 자세 추정 장치 및 그 방법
Yu et al. Contrastive unsupervised learning for audio fingerprinting
JPWO2006009035A1 (ja) 信号検出方法,信号検出システム,信号検出処理プログラム及びそのプログラムを記録した記録媒体
Khare et al. Keyframe extraction using binary robust invariant scalable keypoint features
KR101081459B1 (ko) 고차원 이진 데이터 검색 장치 및 방법
CN104166855B (zh) 视觉语音识别方法
CN104166837B (zh) 采用最相关的兴趣点的各组的选择的视觉语音识别方法
CN113792167B (zh) 一种基于注意力机制和模态依赖的跨媒体交叉检索方法
Essa et al. High order volumetric directional pattern for video-based face recognition
KR101400928B1 (ko) 히스토그램을 이용한 고속 유사도 측정 방법 및 장치
KR101367821B1 (ko) 계층적 영상블록의 대칭정보를 이용한 비디오 식별 방법 및 장치
CN113628089A (zh) 图像处理方法、装置、存储介质及计算机设备
CN111785296B (zh) 基于重复旋律的音乐分段边界识别方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee