KR20120100171A - 가중치 합을 이용한 거리 함수 생성 방법 및 시스템 - Google Patents
가중치 합을 이용한 거리 함수 생성 방법 및 시스템 Download PDFInfo
- Publication number
- KR20120100171A KR20120100171A KR1020110018892A KR20110018892A KR20120100171A KR 20120100171 A KR20120100171 A KR 20120100171A KR 1020110018892 A KR1020110018892 A KR 1020110018892A KR 20110018892 A KR20110018892 A KR 20110018892A KR 20120100171 A KR20120100171 A KR 20120100171A
- Authority
- KR
- South Korea
- Prior art keywords
- distance
- distance function
- training data
- feature
- function
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
이를 위해 본 발명의 거리 함수 생성 방법은 유클리디안 거리 함수, 맨하탄 거리 함수를 포함하는 복수의 거리 함수 중에서 적어도 2개의 거리 함수를 선택하는 단계, 학습 데이터로부터 추출한 특징을 메타데이터로 관리하며, 선택된 상기 거리 함수들을 이용하여 추출한 상기 학습 데이터의 특징과 데이터베이스에 저장된 상기 학습 데이터의 특징을 비교하여 두 특징 사이의 거리를 산출하는 단계, 상기 메타데이터에 기반하여 산출된 적어도 두 개의 거리 각각에 가중치를 산출하는 단계, 산출한 상기 가중치가 곱해진 선택된 각 거리 함수들을 합산하여 하나의 거리 함수를 생성하는 단계를 포함한다.
Description
본 발명은 복수의 거리 함수에 가중치를 부여하여 하나의 거리 함수를 생성하는 방법 및 시스템에 관한 것으로, 더욱 상세하게는 음악 정보 검색, 영상 검출 등 다양한 분야에서 활용되는 거리 함수를 생성하는 방법 및 시스템에 관한 것이다.
디지털 콘텐츠에 대한 검색, 인덱싱, 보호 및 관리에 대한 수요가 증대하고 있으며, 이를 실현하기 위해서 콘텐츠로부터 원하는 용도에 맞는 특징을 추출해서, 그것을 미리 구성된 데이터베이스에 있는 특징들과 비교해서 결과는 얻는 시스템이 많이 사용된다. 이 때 비교하는 과정을 흔히 정합(matching)이라고 한다. 이와 같은 정합 과정은 digital fingerprinting, query by humming, query by singing, image retrieval, music information retrieval 등 다양한 분야에서 응용되고 있다.
여기에서 정합 과정을 위해서 거리 함수 (distance metric)가 많이 사용되고 있다. 유사도 (similarity)도 많이 사용되지만, 그것은 거리 함수의 반대의 개념이라고 생각하면 된다. 이 거리 함수는 두 개의 서로 다른 특징이 정합되어야 할 경우에는 작은 값이 나오고, 두 개의 서로 다른 특징이 정합되지 않아야 할 경우에는 큰 값이 나와야 한다. 즉 거리의 크기 값에 따라서 정합 여부를 결정하는 것이다. 어떤 경우가 정합되고, 어떤 경우가 정합되지 않느냐는 용도에 따라서 달라지며 각 용도에 맞는 실례로써 정할 수 있다.
이런 정합 과정에서 많이 사용되는 거리 함수는 유클리디안 거리 함수(Euclidean distance metric)이다. 유클리디안 거리 함수는 자료의 분포가 가우시안(Gaussian) 분포일 때 좋은 성능을 보이게 된다. 하지만 실제 콘텐츠 데이터에서 추출한 특징은 가우시안 분포를 가지지 않는 경우가 일반적이다. 또한, 많이 사용되는 맨하탄 거리 함수(Manhattan distance metric) 역시 비슷한 한계를 가지고 있다.
이러한 한계를 극복하기 위해서 특정 용도에 따라서 학습을 통해 거리 함수를 결정하도록 하는 방법들이 많이 고안되고 있는 상황이다. 이러한 방법들은 거리 함수를 하나의 매트릭스로 파라미터화할 수 있는 마할라노비스 거리(Mahalanobis distance)의 일반형으로 변환한 후, 파라미터인 매트릭스를 학습을 통해서 결정하도록 한다. 하지만 이와 같은 방법 역시 비슷한 한계를 가지게 된다. 마할라노비스 거리의 일반형 역시 특정한 자료 분포에서만 정합과 정합 아닌 것의 분별 성능이 향상되며, 그렇지 못 할 경우에는 성능이 기대에 미치지 못하게 된다.
이와 같이 종래 기술은 크게 두 가지로 구분된다. 첫째는 정합과정에서 일반적인 거리함수를 사용하는 것이고, 둘째는 거리 함수를 마할라노비스 형태로 구성하여 학습하는 것이다. 일반적인 거리 함수라 하면 유클리디안 거리 함수, 맨하탄 거리 함수 등이 있다. 정합 과정에서 사용하는 거리 함수는 특정한 자료 분포에 따라 좋은 성능을 낼 수 있도록 결정되어야 한다. 하지만, 이미 형태가 정해져 있는 일반적인 거리 함수는 실제 사용하는 정합 과정에서 좋은 성능을 내기가 어렵다. 일반적으로 유클리디안 거리 함수는 가우시안 분포를 가지는 특징을 사용할 때 좋은 성능을 낼 수 있다. 하지만, 오디오, 비디오 등 다양한 콘텐츠에서 특정한 목적을 위해서 추출한 특징이 가우시안 분포와 같은 특정 거리 함수에서 좋은 성능을 보이는 분포를 따르지 않을 가능성이 크다. 이를 보완하기 위해서 마할라노비스 형태로 구성된 거리 함수를 학습하는 방법 등이 사용되고 있지만, 이 역시 특정한 형태의 자료 분포에서만 좋은 성능을 발휘할 수 있다.
본 발명이 해결하려는 과제는 기존의 유클리디안 거리 함수 또는 맨하탄 거리 함수를 사용하는 것처럼 미리 정해진 거리 함수를 사용하는 대신 훈련을 통해서 용도에 적합한 거리 함수를 생성하는 방안을 제안함에 있다.
본 발명이 해결하려는 다른 과제는 특정한 형태를 가지면 성능 증가의 정도가 크지 않았던 종래의 거리 함수 대신 높은 자유도에 기반하여 높은 성능 향상을 기대할 수 있는 거리 함수를 생성하는 방안을 제안함에 있다.
본 발명이 해결하려는 또 다른 과제는 다양한 거리 함수를 결합하여 높은 성능을 갖는 거리 함수를 생성하는 방안을 제안함에 있다.
이를 위해 본 발명의 거리 함수 생성 방법은 유클리디안 거리 함수, 맨하탄 거리 함수를 포함하는 복수의 거리 함수 중에서 적어도 2개의 거리 함수를 선택하는 단계, 학습 데이터로부터 추출한 특징을 메타데이터로 관리하며, 선택된 상기 거리 함수들을 이용하여 추출한 상기 학습 데이터의 특징과 데이터베이스에 저장된 상기 학습 데이터의 특징을 비교하여 두 특징 사이의 거리를 산출하는 단계, 상기 메타데이터에 기반하여 산출된 적어도 두 개의 거리 각각에 가중치를 산출하는 단계, 산출한 상기 가중치가 곱해진 선택된 각 거리 함수들을 합산하여 하나의 거리 함수를 생성하는 단계를 포함한다.
이를 위해 본 발명의 정보 검출 시스템은 학습 데이터를 포함하는 복수의 데이터와 각 데이터에 대한 특징을 저장하고 있는 데이터베이스, 유클리디안 거리 함수, 맨하탄 거리 함수를 포함하는 복수의 거리 함수 중에서 적어도 2개의 거리 함수를 선택하며, 학습 데이터로부터 추출한 특징을 메타데이터로 관리하며, 선택된 상기 거리 함수들을 이용하여 추출한 상기 학습 데이터의 특징과 데이터베이스에 저장된 상기 학습 데이터의 특징을 비교하여 두 특징 사이의 거리를 산출하며, 상기 메타데이터에 기반하여 산출된 적어도 두 개의 거리 각각에 가중치를 산출하며, 산출한 상기 가중치가 곱해진 선택된 각 거리 함수들을 합산하여 하나의 거리 함수를 생성하며, 생성된 거리 함수를 이용하여 상기 특징 추출부에서 추출한 특징과 상기 데이터베이스에 저장되어 있는 데이터에 대한 특징을 비교하는 정합부를 포함한다.
본 발명에 따른 가중치가 부여된 복수 거리 함수를 이용하여 생성된 하나의 거리 함수에 인해 정합 시스템의 성능을 향상시킬 수 있다. 여기서 성능이라 함은 입력된 컨텐츠에서 추출한 특징과 데이터베이스에 저장된 특징의 정합 결과를 의미한다. 이와 같은 본 발명에 따른 정합 시스템은 정합 성능이 향상됨으로 인해 이를 이용한 응용 프로그램의 신뢰도 역시 증가된다는 장점이 있다.
도 1은 본 발명의 일실시 예에 따른 정합 시스템을 도시하고 있으며,
도 2는 본 발명의 일실시 예에 따른 가중치 합을 이용한 거리 함수 생성 방법을 도시하고 있으며,
도 3은 본 발명의 일실시 예에 따른 복수 개의 거리 함수를 이용하여 하나의 거리 함수를 생성하기 위한 과정을 도시한 블록도이며,
도 4는 y=[x]+ 함수의 그래프를 도시하고 있다.
도 2는 본 발명의 일실시 예에 따른 가중치 합을 이용한 거리 함수 생성 방법을 도시하고 있으며,
도 3은 본 발명의 일실시 예에 따른 복수 개의 거리 함수를 이용하여 하나의 거리 함수를 생성하기 위한 과정을 도시한 블록도이며,
도 4는 y=[x]+ 함수의 그래프를 도시하고 있다.
전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시 예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명의 이러한 실시 예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
본 발명은 하나의 거리 함수를 사용하는 대신 복수의 거리 함수를 사용하는 방안을 제안한다.
도 1은 본 발명의 일실시 예에 따른 정합 시스템을 도시하고 있다. 이하 도 1을 이용하여 본 발명의 일실시 예에 따른 정합 시스템에 대해 상세하게 알아보기로 한다.
도 1에 의하면, 정합 시스템은 특징 추출부(100), 정합부(104), 데이터베이스(102)를 포함한다. 물론 상술한 구성 이외에 다른 구성이 정합 시스템에 포함될 수 있음은 자명하다.
특징 추출부(100)는 입력된 컨텐츠에서 원하는 용도에 맞는 특징을 추출한다. 특징 추출부(100)에서 추출되는 특징은 어떤 목적을 가진 시스템인지, 어떤 데이터가 입력되는 지에 따라 달라진다.
데이터베이스(102)는 컨텐츠와 각 컨텐츠에 대한 특징 정보를 저장하고 있다. 정합부(104)는 특징 추출부(100)에서 추출한 특징과 데이터베이스(102)에 저장되어 있는 각 컨텐츠에 대한 특징 정보를 비교하여 유사도가 높은 컨텐츠를 획득한다.
이하에서는 입력되는 데이터에 따라 추출되는 특징에 대해 알아보기로 한다.
음성 인식의 경우, 음성이라는 1차원적 신호가 특징 추출부로 입력된다. 즉, 특징 추출부는 사용자가 발음한 ‘강’이라는 음성이 입력되며, 데이터베이스는 ‘강’을 포함한 복수 개의 단어들에 대한 특징이 저장되어 있다. 입력된 음성을 검출 위해서는 데이터베이스에 저장되어 있는 ‘강’의 특징과 특징 추출부로 입력된 ‘강’의 특징이 동일 또는 유사해야 한다. 즉, 데이터베이스 저장되어 있는 ‘강’의 특징과 특징 추출부로 입력된 ‘강’의 특징 간의 거리가 가까워야 하며, 데이터베이스에 저장되어 있는 ‘강’ 이외의 다른 단어들의 특징과 특징 추출부로 입력된 ‘강’의 특징간의 거리는 멀어야 한다.
그런데 특징 추출부로 입력되는 ‘강’의 특징은 발음하는 사람마다 조금씩 상이한 경우가 일반적이며, 이런 경우까지 고려되어야 한다. 따라서 특징 추출부는 입력되는 1차원 신호인 음성에 대해 수학적 처리 과정을 거쳐 상술한 고려대상을 만족시키는 특징을 추출한다. 특징 추출은 MFCC 계수, LP 계수 등을 사용한다. MFCC(Mel-frequency cepstrum coefficient)는 입력되는 신호의 주파수적 특성을 mel-frequency scale라는 척도에 맞추고 그것의 크기 값을 추출한다. 즉 MFCC는 입력되는 1차원 신호에 푸리에 트랜스폼을 하고, 삼각형 모양의 윈도우를 mel-frequency scale에 맞춰서 각 윈도우마다 크기(파워) 값을 계산하고, 이후 로그 연산과 DCT를 과정을 수행한다. 특징 추출부에서 추출되는 특징은 이와 같은 수학적 과정을 통해 추출된다.
얼굴 인식은 특정 사람의 얼굴과 다른 사람의 얼굴간의 다른 특징을 추출해야 하며, 일반적으로 얼굴에서의 밝기의 변화도 또는 밝기의 기울기 등과 같은 특징을 추출한다. 또한, 허밍을 통한 음악식별은 음의 높낮이와 관련된 변화값을 특징으로 추출한다.
상술한 바와 같이 본 발명은 하나의 거리 함수를 사용하는 대신 복수의 거리 함수를 사용하는 방안을 제안한다. 즉, 본 발명은 두 가지 종류의 특징 x와 x' 사이의 거리를 비교하는 데 있어서, 하나의 거리 함수(distance metric)를 사용하는 대신, 복수개의 거리 함수를 사용하여 하나의 거리 함수를 생성한다. 하나의 거리 함수는 가중치가 부여된 복수 개의 거리 함수를 결합하여 생성한다.
이를 위해 복수 개의 거리 함수는 미리 특정하는 것이 바람직하며, 거리 함수를 결합하는 방법은 가중치합(weighted sum) 방법을 사용한다. 가중치합 방법은 각 거리 함수값에 대해서 가중치를 부여하고, 가중치가 부여된 각 거리 함수를 합산하는 방법이다. M개의 거리 함수를 결합하여 하나의 거리 함수를 생성하기 위해서는 학습을 통해 M차원의 벡터값을 결정해야 한다. 학습은 복수 개의 거리 함수를 이용하여 하나의 거리 함수를 생성함에 있어 양호한 정합 성능을 갖는 파라미터를 결정한다.
도 2는 본 발명의 일실시 예에 따른 가중치 합을 이용한 거리 함수 생성 방법을 도시한 도면이다. 이하 도 2를 이용하여 본 발명의 일실시 예에 따른 가중치 합을 이용한 거리 함수 생성 방법에 대해 상세하게 알아보기로 한다.
거리 함수 생성 방법의 S200단계는 최종적으로 사용하기 위한 거리 함수를 생성하기 위한 다수의 거리 함수를 결정한다.
거리 함수 생성 방법의 S202단계는 훈련 데이터를 수집한다. 훈련데이터는 특징들의 쌍으로 이루어져 있으며, 해당 특징들의 거리 정보를 메타데이터 형태로 갖는다.
거리 함수 생성 방법의 S204단계는 훈련 데이터에 대한 거리를 계산하며, S206단계는 S204단계에서 계산한 거리를 이용해서 가중치를 부여된 복수 개의 거리 함수가 훈련 데이터의 메타데이터와 상응하도록 가중치들을 결정한다.
거리 함수 생성 방법의 S208단계는 입력된 데이터(컨텐츠)에 대한 각 거리함수에 대한 거리를 계산하며, S210단계는 계산한 거리에 S206단계에서 결정한 가중치를 부여하여 최종적으로 거리를 계산한다. 물론 S208단계와 S210단계는 하나의 과정으로 수행할 수 있다.
상술한 바와 같이 본 발명은 두 가지 종류의 특징 x와 x' 사이의 거리를 비교하는 데 있어서, 하나의 거리 함수를 사용하는 게 아니고, 다수개의 거리 함수를 사용하고 그것들을 결합하여 하나의 거리 함수를 생성한다. 여기에서는 x는 입력 컨텐츠에서 추출한 특징을 의미하며, x'를 데이터베이스에서 추출한 특징을 의미한다. 두 특징 사이의 거리를 측정하여 정합 여부를 확인하기 위해서는 거리 함수가 미리 정의되어 있어야 한다.
본 발명에서 복수 개의 거리 함수로부터 출력된 출력값은 실수값을 가지며, 그 실수값들의 결합으로 하나의 실수값을 갖는 거리 함수를 만든다. 상술한 바와 같이 본 발명은 복수 개의 거리 함수를 사용하며, 사용되는 거리 함수는 용도 또는 해당 용도로 많이 사용한 응용 프로그램의 특징에 따라 선택하는 것이 바람직하다.
이하에서는 각 거리 함수에 부여되는 가중치를 산출하는 과정에 대해 알아보기로 한다.
도 3은 본 발명의 일실시 예에 따른 복수 개의 거리 함수를 이용하여 하나의 거리 함수를 생성하기 위한 과정을 도시한 블록도이다. 이하 도 3을 이용하여 복수 개의 거리 함수를 이용하여 하나의 거리 함수를 생성하는 과정에 대해 상세하게 알아보기로 한다.
도 3에 의하면, 제1 거리함수부(300) 내지 제M 거리함수부(304)를 포함하는 M개의 거리 함수부와 결합부(310)에서 복수 개의 거리 함수를 이용하여 하나의 거리 함수를 생성함을 알 수 있다. 도 3에 기재되어 있는 거리 함수부와 결합부는 정합부에 포함될 수 있다.
상술한 바와 같이 M개의 거리 함수의 결합을 위해서는 M차원의 벡터값을 결정해야 한다. 즉, M개의 실수값을 결정해야 한다. 이 때 새로 생성되는 거리 함수 하기 수학식 1과 같이 정의된다.
[수학식 1]
여기서 zi는 (x,x')와 같은 하나의 쌍을 나타내며, am은 m번째 거리함수의 가중치를 나타낸다. 또한 Dm은 m번째 거리 함수를 나타낸다. 수학식 1은 zi라는 쌍에 대해서 D1부터 DM까지 거리 함수에 가중치 am1 내지 aM를 곱한 후 합산한다. 여기서 am은 A라는 하나의 벡터로 표현할 수 있다.
수학식 2는 하나의 벡터로 표현되는 가중치를 나타내고 있다.
[수학식 2]
수학식 2에서 A벡터를 구하면 D1부터 DM에 대해서 하나의 거리 함수가 결정된다. 상술한 바와 같이 학습을 이용하여 거리 함수를 결정하기 위해서는 학습 데이터를 미리 생성해야 하며, off-line으로 미리 진행되는 것이 바람직하다. 학습 과정은 입력된 학습 데이터를 이용하여 결합과 관련된 파라미터를 출력하는 과정으로 이해될 수 있다.
수학식 3은 학습 데이터를 나타내고 있다.
[수학식 3]
이 때 yi는 쌍 zi가 어떠한 쌍인지를 나타내며, zi가 정합되어야 할 쌍인 경우에는 1의 값을 가지며, zi가 정합되어야 할 쌍이 아닌 경우에는 0의 값을 가진다. 또한, I는 훈련 데이터에서 추출한 특징의 개수를 의미한다. 부가하여 수학식 3에서 yi=1인 쌍의 개수를 I1, yi=0인 쌍의 개수를 I2로 나타낸다.
이 때 함수 f(A)는 수학식 4와 같이 나타낼 수 있다.
[수학식 4]
수학식 4에서 나타내고 있는 f(A)를 최소로 만드는 벡터 A를 찾는다. 이 때 [.]+는 [z]+ = max(z, 0)로 정의된다. 여기서 α와 τ1, τ2는 상수이며, cross-validation(근사모델의 정확도 평가방법) 등 다양한 학습 방법을 통해서 결정한다. cross-validation의 개념은 근사모델 생성을 위한 사용한 전체 실험점 중 특정 개수의 실험점을 제거한 실험점 셋(set)을 사용하여 근사모델을 재구성하고, 이렇게 재구성한 모델을 사용하여 제거된 실험점에서의 예측값을 구한 후 이 예측값의 차이를 구하는 것이다. 따라서 cross-validation을 통해 구한 에러값이 작을수록 실제 모델을 잘 표현하는 근사모델이다.
이하에서는 수학식에 언급되어 있는 [z]+ 에 대해 알아보기로 한다. 도 4는 y=[x]+ 라는 함수의 그래프를 도시하고 있다.
도 4에 의하면, x가 0보다 작은 값들에 대해서 y는 0이 되며, 상술한 바와 같이 본 발명은 f(A)를 최소로 하는 방안을 제안하고 있으므로, 도 4에서 y를 최소로 하는 x는 0보다 작거나 0인 모든 값을 포함된다. 즉, x가 -0.1, -10 또는 0에 상관없이 y는 최소값은 0을 갖는다.
이하에서 수학식 4의 f(A)가 최소값을 가지기 위한 전단부와 후단부의 조건에 대해 알아보기로 한다. 전단부는 인 경우이며, 전단부가 최소값을 가지려면 모든 가 보다 작거나 같아야 한다. 즉, 모든 가 τ1보다 작거나 같으면 전단부는 0이라는 최소값이 산출된다. 즉, 인 경우, 를 τ1 까지만 줄이면 된다.
후단부는 반대로 를 τ2까지만 늘리면 된다. 이와 같이 하면 최종적으로 함수 f(A)의 값은 최소값인 0을 가질 수 있게 되며, 이는 정합되어야 할 쌍에 대한 거리는 모두 τ1 보다 작고, 정합되지 말아야 할 쌍은 모두 τ2보다 크게 된다. 또한, τ1 <τ2 으로 조건을 제한하면, 정합시스템은 오류없이 정합되어야 할 쌍을 찾을 수 있다.
본 발명은 도면에 도시된 일실시 예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.
100: 특징 추출부 102: 정합부
104: 데이터베이스 300: 제1 거리 함수부
310: 결합부
104: 데이터베이스 300: 제1 거리 함수부
310: 결합부
Claims (8)
- 유클리디안 거리 함수, 맨하탄 거리 함수를 포함하는 복수의 거리 함수 중에서 적어도 2개의 거리 함수를 선택하는 단계;
학습 데이터로부터 추출한 특징을 메타데이터로 관리하며, 선택된 상기 거리 함수들을 이용하여 추출한 상기 학습 데이터의 특징과 데이터베이스에 저장된 상기 학습 데이터의 특징을 비교하여 두 특징 사이의 거리를 산출하는 단계;
상기 메타데이터에 기반하여 산출된 적어도 두 개의 거리 각각에 가중치를 산출하는 단계;
산출한 상기 가중치가 곱해진 선택된 각 거리 함수들을 합산하여 하나의 거리 함수를 생성하는 단계;를 포함함을 특징으로 하는 거리 함수 생성 방법.
- 학습 데이터를 포함하는 복수의 데이터와 각 데이터에 대한 특징을 저장하고 있는 데이터베이스;
유클리디안 거리 함수, 맨하탄 거리 함수를 포함하는 복수의 거리 함수 중에서 적어도 2개의 거리 함수를 선택하며, 학습 데이터로부터 추출한 특징을 메타데이터로 관리하며, 선택된 상기 거리 함수들을 이용하여 추출한 상기 학습 데이터의 특징과 데이터베이스에 저장된 상기 학습 데이터의 특징을 비교하여 두 특징 사이의 거리를 산출하며, 상기 메타데이터에 기반하여 산출된 적어도 두 개의 거리 각각에 가중치를 산출하며, 산출한 상기 가중치가 곱해진 선택된 각 거리 함수들을 합산하여 하나의 거리 함수를 생성하며, 생성된 거리 함수를 이용하여 상기 특징 추출부에서 추출한 특징과 상기 데이터베이스에 저장되어 있는 데이터에 대한 특징을 비교하는 정합부를 포함함을 특징으로 하는 정보 검출 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110018892A KR101233296B1 (ko) | 2011-03-03 | 2011-03-03 | 가중치 합을 이용한 거리 함수 생성 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110018892A KR101233296B1 (ko) | 2011-03-03 | 2011-03-03 | 가중치 합을 이용한 거리 함수 생성 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120100171A true KR20120100171A (ko) | 2012-09-12 |
KR101233296B1 KR101233296B1 (ko) | 2013-02-14 |
Family
ID=47109958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110018892A KR101233296B1 (ko) | 2011-03-03 | 2011-03-03 | 가중치 합을 이용한 거리 함수 생성 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101233296B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140135125A (ko) * | 2013-05-15 | 2014-11-25 | 국립대학법인 울산과학기술대학교 산학협력단 | 질의 할당 방법 |
CN111914997A (zh) * | 2020-06-30 | 2020-11-10 | 华为技术有限公司 | 训练神经网络的方法、图像处理方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024206A (ja) | 2000-07-04 | 2002-01-25 | Hitachi Ltd | データ群内類似度の幾何学化方法 |
KR100581673B1 (ko) * | 2004-07-07 | 2006-05-22 | 학교법인 울산공업학원 | 데이터 분류방법 |
KR101543621B1 (ko) * | 2008-10-07 | 2015-08-12 | 삼성전자주식회사 | 다중 입력 다중 출력 시스템의 신호 검출 장치 및 방법 |
-
2011
- 2011-03-03 KR KR1020110018892A patent/KR101233296B1/ko not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140135125A (ko) * | 2013-05-15 | 2014-11-25 | 국립대학법인 울산과학기술대학교 산학협력단 | 질의 할당 방법 |
CN111914997A (zh) * | 2020-06-30 | 2020-11-10 | 华为技术有限公司 | 训练神经网络的方法、图像处理方法及装置 |
CN111914997B (zh) * | 2020-06-30 | 2024-04-02 | 华为技术有限公司 | 训练神经网络的方法、图像处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
KR101233296B1 (ko) | 2013-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8165877B2 (en) | Confidence measure generation for speech related searching | |
JP5346279B2 (ja) | 検索による注釈付与 | |
CN111309965B (zh) | 音频匹配方法、装置、计算机设备及存储介质 | |
KR20140082157A (ko) | 다중 음향 모델을 이용하여 음성을 인식하기 위한 장치 및 그 방법 | |
Kiktova-Vozarikova et al. | Feature selection for acoustic events detection | |
KR20080030922A (ko) | 정보처리 장치 및 방법, 프로그램, 및 기록 매체 | |
WO2016102737A1 (en) | Tagging audio data | |
KR100978913B1 (ko) | Svm기반 복 수의 매칭 알고리즘을 결합한 음원 검색 시스템 및 방법 | |
CN105679324A (zh) | 一种声纹识别相似度评分的方法和装置 | |
Benetos et al. | Characterisation of acoustic scenes using a temporally-constrained shift-invariant model | |
CN114003682A (zh) | 一种文本分类方法、装置、设备及存储介质 | |
CN103488782A (zh) | 一种利用歌词识别音乐情感的方法 | |
KR101233296B1 (ko) | 가중치 합을 이용한 거리 함수 생성 방법 및 시스템 | |
CN106663110B (zh) | 音频序列对准的概率评分的导出 | |
Zhu et al. | Emotion recognition from speech to improve human-robot interaction | |
CN113366567A (zh) | 一种声纹识别方法、歌手认证方法、电子设备及存储介质 | |
JP2013105393A (ja) | 映像付加情報関係性学習装置、方法、及びプログラム | |
CN112528646A (zh) | 词向量生成方法、终端设备及计算机可读存储介质 | |
JP6728083B2 (ja) | 中間特徴量計算装置、音響モデル学習装置、音声認識装置、中間特徴量計算方法、音響モデル学習方法、音声認識方法、プログラム | |
Doğan et al. | A flexible and scalable audio information retrieval system for mixed‐type audio signals | |
Kiktova et al. | Comparison of feature selection algorithms for acoustic event detection system | |
Maršík et al. | Improving music classification using harmonic complexity | |
KR101203183B1 (ko) | 정보 검출 시스템을 위한 선형 결합 방법 및 시스템 | |
Qin et al. | Audio retrieval based on manifold ranking and relevance feedback | |
CN118094176B (zh) | 多模态智能模型系统化安全防护方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |