KR102306332B1

KR102306332B1 - 유사성 정보를 결정하기 위한 장치, 유사성 정보를 결정하기 위한 방법, 자기 상관 정보를 결정하기 위한 장치, 교차 상관 정보를 결정하기 위한 장치 및 컴퓨터 프로그램

Info

Publication number: KR102306332B1
Application number: KR1020187036689A
Authority: KR
Inventors: 미카엘 크라츠; 크리스티안 울레; 파울 클로제; 티모시 레오날드; 피터 프로케인; 세바스찬 쉐아르러
Original assignee: 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date: 2016-05-20
Filing date: 2017-05-18
Publication date: 2021-09-29
Also published as: JP7317888B2; US10565284B2; AU2017266384A1; CA3024772A1; CN109478198B; BR112018073889B1; JP6962664B2; RU2018145032A; RU2747442C2; BR112018073889A2; KR20190008925A; JP2021157180A; CN109478198A; CA3024772C; WO2017198794A1; AU2017266384B2; MX2018014113A; RU2018145032A3; EP3458973A1; EP3246824A1

Abstract

하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 장치는 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 부분들에 대한 각각의 부분에서의 제로 크로싱들의 수를 기술하는 제로 크로싱 정보를 결정하도록 구성된다. 이 장치는 유사성 정보를 결정하기 위해, 제로 크로싱 정보에 기초하여 비교를 수행하도록 구성된다. 유사성 정보를 결정하기 위한 방법 및 컴퓨터 프로그램이 또한 설명된다. 더욱이, 자기 상관 정보를 결정하기 위한 장치 및 교차 상관 정보를 결정하기 위한 장치는 유사한 고려 사항들에 기초한다.

Description

유사성 정보를 결정하기 위한 장치, 유사성 정보를 결정하기 위한 방법, 자기 상관 정보를 결정하기 위한 장치, 교차 상관 정보를 결정하기 위한 장치 및 컴퓨터 프로그램

본 발명에 따른 일 실시예는 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 장치에 관한 것이다.

본 발명에 따른 다른 실시예는 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 방법에 관한 것이다.

본 발명에 따른 일 실시예는 상기 방법을 수행하기 위한 컴퓨터 프로그램에 관한 것이다.

본 발명에 따른 다른 실시예는 자기 상관 정보를 결정하기 위한 장치에 관한 것이다.

본 발명에 따른 다른 실시예는 교차 상관 정보를 결정하기 위한 장치에 관한 것이다.

일부 실시예들은 낮은 계산 복잡도를 갖는 매우 견고한 상관 방법에 관한 것이다.

예를 들어, 오디오 처리, 비디오 처리 또는 신호 처리 분야의 많은 기술적 애플리케이션들은 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 얻는 것을 요구한다. 예를 들어, 신호 입력 신호의 주기성에 관한 정보를 얻기 위해, 예를 들어 단일 입력 신호의 2개의 시간 시프트된 섹션들을 비교하는 것이 간혹 바람직하다. 이러한 개념은 오디오 처리(오디오 조작) 동작들을 준비하는 데 또는 오디오 신호의 특성들을 결정하는 데 사용될 수 있다. 예를 들어, 이 개념을 사용하여 오디오 신호로부터 기본 주파수가 추출될 수 있다. 또한, 오디오 신호의 시간 연장 또는 시간 단축이 요구되는 상황들에서 동일한 오디오 신호의 서로 다른 부분들 사이의 유사성에 관한 정보가 사용될 수 있다.

다른 한편으로는, 2개의 서로 다른 입력 신호들을 비교하고 입력 신호들의 유사성에 관한 정보를 얻는 것이 또한 바람직할 수 있다. 예를 들어, 입력 신호들 중 하나에 시간 시프트를 적용하지 않고, 또는 입력 신호들 간의 단일 시간 시프트에 대해, 또는 입력 신호들의 시간 시프트의 다수의 값들에 대해 유사성 정보가 얻어질 수 있다. 예를 들어, 오디오 신호들일 수 있는 2개의 입력 신호들을 비교함으로써, 오디오 신호들 중 적어도 하나를 분류하는 것이 가능할 수 있다. 대안으로, 오디오 신호들 사이의 중첩-및-가산(overlap-and-add)을 수행하기 위한 적절한 시간을 발견하는 것이 가능할 수 있다.

그러나 서로 다른 2개의 입력 신호들(오디오 신호들) 사이의 유사성 또는 단일 입력 신호(오디오 신호)의 시간 시프트된 서로 다른 부분들 사이의 유사성을 기술하는 유사성 정보에 기초하여 오디오 처리, 또는 보다 일반적으로는 신호 처리 분야의 많은 서로 다른 애플리케이션들이 가능하다.

디지털 신호 프로세서(DSP: digital signal processor)들과 같은 임베디드 시스템들에서는, 당연히 제한된 메모리 자원들과 프로세서 사이클들만이 이용 가능하다. 원하는 알고리즘들을 실시간으로 계산할 수 있도록, 각각의 플랫폼에 대한 최적화를 수행하는 것이 바람직할 수 있다. 이러한 최적화들은 크게 두 가지 범주들로 나뉠 수 있다. 첫 번째 범주는 특정 프로세서 아키텍처를 활용하는 최적화들을 포함한다. 이는 예를 들어, 삼각 함수들의 근사화들, 또는 고속 FFT들 또는 소위 단일 명령 다중 데이터 연산들의 사용을 포함한다.

두 번째 범주는 예를 들어, 알고리즘들 자체의 최적화에 관한 것이다. 예를 들어, 2개의 오디오 신호들 사이의 시간 오프셋을 결정하기 위한 교차 상관이 계산되어야 한다면, 저장 공간뿐만 아니라 두 프로세서 사이클들도 최대 검출 가능한 레이턴시를 제한할 것이라고 밝혀졌다.

다음에, 종래의 일부 개념들이 설명될 것이다. 메모리 및 계산 부하를 줄이기 위해, 다운샘플링이 자주 사용될 수 있다고 밝혀졌다. 4 배수에 의한 다운샘플링을 사용하면, 필요한 메모리의 3/4(즉, 75%)이 절약될 것이고, 또는 검출 가능한 레이턴시가 4배 증가될 것이라고 밝혀졌다. 이러한 절약들이 단점들에 의해 상쇄된다고 또한 밝혀졌다. 예를 들어, 정확도의 감소가 있다. 이전에 샘플이 정확했던 결과들은 이제, n이 다운샘플링 인자(factor)를 기술할 때 n개의 샘플들의 최대 정확도로 얻어질 수 있다.

게다가, 다운샘플링 인자의 증가에 따라 견고성이 감소한다. 오디오 송신 중에 발생할 수 있는 간섭들은 결과를 상당히 저하시킨다. 이는 잡음, 동적 범위 압축, 오디오 인코딩, 제한기 및 필터링(예컨대, 등화기)을 포함한다.

다운샘플링은 또한 다음과 같이 이해될 수 있는데: 오디오 샘플은 오디오 스트림으로부터 등거리 간격들로 사용되며, 말하자면, 그 주변 샘플들의 대표라고 밝혀졌다. 주변 샘플들의 수는 블록 크기로도 또한 지칭될 수 있다. 위의 예에서, 블록 크기(n)는 4와 같을 것이다. 오디오 스트림으로부터의 매 네 번째(every fourth) 샘플이 이 블록에 대한 대표로서 기능하는 데 사용된다. 다운샘플링에 대한 설명을 위해, 업스트림 다운샘플링 필터가 가장 높은 발생 주파수를 인자 n에 의해 감소시켜 나이퀴스트 기준을 만족시키는 것으로 가정된다.

더욱이, 종래의 다운샘플링은 예를 들어, 견고성 면에서 상당한 단점들을 가져온다고 밝혀졌다.

이러한 상황을 고려하여, 견고성과 계산 복잡도 사이의 개선된 절충을 가져오는, 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 얻기 위한 개념이 필요하다.

본 발명에 따른 일 실시예는 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성(similarity) 정보를 결정하기 위한 장치를 생성한다. 이 장치는 하나 또는 그보다 많은 입력 오디오 신호들 중 적어도 하나의 입력 오디오 신호의 복수의 부분들에 대한 각각의 부분(블록 또는 신호 블록으로도 지정되는)에서의 제로 크로싱(zero crossing)들의 수를 기술하는(describing) 제로 크로싱 정보를 결정하도록 구성된다. 이 장치는 유사성 정보를 결정하기 위해 제로 크로싱 정보에 기초하여 비교를 수행하도록 구성된다.

이 실시예는, 복수의 부분들에 대한 각각의 부분에서의 제로 크로싱들의 수를 기술하는 제로 크로싱 정보가 중간 정도의 계산 노력으로 계산될 수 있는 매우 견고한 양이지만, 단일 입력 신호의 서로 다른 섹션들 사이의 또는 비교될 2개의 입력 신호들의 서로 다른 섹션들 사이의 유사성을 기술하는 유사성 정보의 신뢰성 있는 결정을 여전히 가능하게 한다는 결론을 기반으로 한다. 제로 크로싱 정보는 예를 들어, 제로 크로싱들의 수를 카운트함으로써 얻어질 수 있고, 제로 크로싱 정보는 입력 신호들 중 하나 이상에 적용될 수 있는 다양한 처리 동작들에 의해 심각하게 수정되지는 않는다. 또한, 제로 크로싱 정보는 하나 또는 그보다 많은 입력 신호들의 후속 부분들과 (개별적으로) 연관될 수 있는 단일 정수들의 시퀀스의 형태를 취할 수 있다. 따라서 하나 또는 그보다 많은 입력 신호들의 각각의 부분이 하나 또는 그보다 많은 입력 신호들의 복수의 샘플들을 포함할 수 있는, 하나 또는 그보다 많은 입력 신호들의 부분마다 예를 들어, 단일 제로 크로싱 정보 값(또는 대안으로 2개의 제로 크로싱 정보 값들)을 제공함으로써, 정보의 양이 현저하게 감소될 수 있고, 제로 크로싱 정보(제로 크로싱 값)는 하나 또는 그보다 많은 입력 신호들의 각각의 부분의 "대표(representative)"로서 작용할 수 있다. 결과적으로, 제로 크로싱 정보의 값들 또는 제로 크로싱 정보의 값들의 세트들 또는 시퀀스들을 비교하는 것은 일반적으로, 하나 또는 그보다 많은 입력 신호들의 전체 섹션들을 비교하는 것보다 계산상 훨씬 더 효율적이다. 따라서 유사성 정보를 결정하기 위해 제로 크로싱 정보에 기초하여 비교를 수행하는 것은 계산상 효율적이지만 여전히 하나 또는 그보다 많은 입력 신호들의 서로 다른 섹션들의 유사성에 관한 의미 있는 정보를 제공한다(여기서 상기 섹션들은 일반적으로 각각, 적어도 하나 또는 그보다 많은 입력 신호들의 복수의 부분들을 포함하고, 결과적으로 각각 제로 크로싱 정보의 복수의 값들에 매핑된다).
섹션은 복수의 신호 블록들을 포함한다는 것이 인지되어야 한다.

바람직한 실시예에서, 이 장치는 제로 크로싱 정보로서, 하나 또는 그보다 많은 입력 신호들의 복수의 부분들에 대한 총 제로 크로싱들의 수 또는 상승(rising) 제로 크로싱들의 수 또는 하강(falling) 제로 크로싱들의 수를 결정하도록 구성된다. 총 제로 크로싱들의 수, 상승 제로 크로싱들의 수 및 하강 제로 크로싱들의 수는 모두 의미 있는 정보인데, 이는 하나 또는 그보다 많은 입력 신호들의 각각의 부분들을 "나타내기 위해" 개별적으로 또는 결합하여 사용될 수 있는 것으로 밝혀졌다. 또한, 제로 크로싱들의 수는 하나 또는 그보다 많은 입력 신호들의 부호가 양에서 음으로 그리고/또는 그 반대로 얼마나 자주 변하는지를 카운트함으로써 쉽게 계산될 수 있다는 점이 주목되어야 한다.

바람직한 실시예에서, 이 장치는 제로 크로싱 정보로서, 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 부분들에 대한 제로 크로싱 레이트를 결정하도록 구성된다. 제로 크로싱 레이트가 특별한 의미 있는 정보라는 점이 밝혀졌다. 예를 들어, 제로 크로싱 레이트는 심지어 입력 오디오 신호들의 부분들의 길이의 변화를 고려할 수 있다. 다른 한편으로는, 제로 크로싱 레이트를 사용하면, 심지어 서로 다른 샘플링 레이트들로 샘플링된 신호들을 비교하는 것이 가능하다(예를 들어, 다운샘플링 인자와 샘플 레이트의 곱이 두 신호들 모두에 대해 동일한 결과를 제공하는 경우, 이는 예를 들어, 대표 값들이 동일한 시간 단위들과 연관됨을 의미함). 따라서 제로 크로싱 레이트 값은 입력 신호들 중 하나 또는 그보다 많은 입력 신호들의 각각의 부분의 매우 의미 있는 대표인 것으로 밝혀졌다.

바람직한 실시예에서, 이 장치는 적어도 하나의 제로 크로싱 값이 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 부분들 중 각각의 부분과 연관되게 제로 크로싱 정보를 결정하도록 구성된다. 따라서 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 섹션의 신뢰성 있는 표현이 존재하며, 상기 섹션은 일반적으로 복수의 부분들을 포함한다.

바람직한 실시예에서, 이 장치는 제1 신호 섹션에 대한 제1 제로 크로싱 값 시퀀스를 결정하도록 구성되며, 제1 신호 섹션은 복수의 신호 블록들(또는 신호 "부분들")을 포함하고, 제1 제로 크로싱 값 시퀀스는 제1 신호 섹션의 신호 블록들(또는 신호 부분들) 각각과 연관된 하나의 제로 크로싱 값(또는 어떤 경우들에는, 하나보다 많은 제로 크로싱 값들)을 포함한다. 게다가, 이 장치는 바람직하게는, 제2 신호 섹션에 대한 제2 제로 크로싱 값 시퀀스를 결정하도록 구성되며, 제2 신호 섹션은 복수의 신호 블록들(또는 신호 부분들)을 포함하고, 제2 제로 크로싱 값 시퀀스는 제2 신호 섹션의 신호 블록들(또는 신호 부분들) 각각과 연관된 하나의 제로 크로싱 값(또는 어떤 경우들에는, 하나보다 많은 제로 크로싱 값들)을 포함한다. 따라서 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스를 비교하여 유사성 정보를 결정하는 것이 가능하다. 각각의 제로 크로싱 값 시퀀스가 각각의 신호 섹션을 나타내는 복수의 "대표 값들"을 포함하므로, 제로 크로싱 값 시퀀스들을 비교하는 것은 매우 의미 있는 결과를 제공한다. 이에 따라, 비교에서 제로 크로싱 값 시퀀스들을 평가함으로써, 신뢰도(reliability)가 향상될 수 있다.

바람직한 실시예에서, 이 장치는 복수의 제로 크로싱 값들을 포함하는 제1 제로 크로싱 값 시퀀스와 복수의 제로 크로싱 값들을 포함하는 제2 제로 크로싱 값 시퀀스를 비교하여, 제1 신호 섹션과 제2 신호 섹션 사이의 유사성을 기술하는 유사성 정보를 얻도록 구성되며, 제1 제로 크로싱 값 시퀀스는 제1 신호 섹션에 대응하고, 제2 제로 크로싱 값 시퀀스는 제2 신호 섹션에 대응하며, 제로 크로싱 값들은 제로 크로싱 정보를 구성한다. 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스를 비교함으로써, 의미 있는 비교 결과를 얻는 것이 가능하다. 또한, 제1 제로 크로싱 값 시퀀스는 일반적으로, 제1 제로 크로싱 값 시퀀스에 의해 표현되는 제1 신호 섹션보다 훨씬 더 적은 개별 값들을 포함하고, 제2 제로 크로싱 값 시퀀스는 일반적으로, 제2 제로 크로싱 값 시퀀스에 의해 표현되는 제2 신호 섹션보다 훨씬 더 적은 개별 값들을 포함한다. 일부 실시예들에서, 제1 제로 크로싱 값 시퀀스의 개별 값들의 수는 제1 신호 섹션의 개별(샘플) 값들의 수보다 적어도 10배만큼 더 적을 수 있다. 제2 제로 크로싱 값 시퀀스의 개별 값들의 수 및 제2 신호 섹션의 개별(샘플) 값들의 수에 대해서도 동일한 관계가 또한 유지될 수 있다. 따라서 제1 신호 섹션과 제2 신호 섹션의 샘플 값들 간의 비교와 비교할 때, 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스 간의 비교는 매우 효율적인 방식으로 수행될 수 있다. 게다가, 제로 크로싱 값 시퀀스들은 장치의 유연한 구현을 가능하게 하는 값들의 시퀀스들의 비교에 매우 적합한 임의의 종래의 알고리즘들 중 임의의 알고리즘에 의해 비교될 수 있다는 점이 주목되어야 한다.

바람직한 실시예에서, 이 장치는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스를 사용해 상관 값을 계산하여 유사성 정보를 얻도록 구성된다. 대안으로, 이 장치는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스를 사용해 평균 크기 차이 값을 계산하여 유사성 정보를 얻도록 구성될 수 있다. 다른 대안으로서, 이 장치는 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스 간의 차이의 노름(norm)을 계산하여 유사성 정보를 얻도록 구성될 수 있다. 또 다른 대안으로서, 이 장치는 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스 간의 유클리드 거리를 계산하여 유사성 정보를 얻도록 구성될 수 있다. 유사성 정보의 결정을 위한 앞서 언급한 계산상 효율적인 개념들은 양호한 비교 결과들을 야기한다는 것이 밝혀졌다.

바람직한 실시예에서, 이 장치는 제1 제로 크로싱 값 시퀀스 또는 그 일부와 제2 제로 크로싱 값 시퀀스의 복수의 시간 시프트된 버전들, 또는 그 시간 시프트된 부분들 사이의 복수의 차이 측정 값들을 계산하여, 제1 제로 크로싱 값 시퀀스 또는 그 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보를 얻도록 구성될 수 있다. 이에 따라, 제1 제로 크로싱 값 시퀀스에 의해 표현되는 제1 신호 섹션과 제2 제로 크로싱 값 시퀀스에 의해 표현되는 제2 신호 섹션 사이의 어떤 시간 정렬이 최대 유사성을 가져오는지를 결정하는 것이 가능하다. 결과적으로, 제1 신호 섹션과 제2 신호 섹션이 단일 입력 신호로부터 취해진다면, 자기 상관 정보와 등가인 정보를 얻는 것이 가능하거나, 또는 제1 신호 섹션과 제2 신호 섹션이 서로 다른 입력 신호들로부터 취해진다면, 교차 상관 정보와 등가인 정보를 얻는 것이 가능하다. 결과적으로 서로 다른 자기 상관 래그(lag) 값들 또는 교차 상관 래그 값들에 대해 자기 상관 정보 또는 교차 상관 정보가 얻어지며, 여기서 자기 상관 래그 값들 또는 교차 상관 래그 값들은 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전의(또는 그것의 시간 시프트된 부분의) 각각의 시간 시프트들에 대응한다. 따라서 제로 크로싱 값 시퀀스들은 서로 다른 자기 상관 래그 값들 또는 교차 상관 래그 값들에 대한 자기 상관 함수의 또는 교차 상관 함수의 결과 값들을 얻는 데 실제로 사용될 수 있다.

바람직한 실시예에서, 이 장치는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스를 사용해 상관 함수를 계산하여, 제1 제로 크로싱 값 시퀀스 또는 그 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보를 얻도록 구성된다. 대안으로, 이 장치는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스를 사용해 평균 크기 차이 함수를 계산하여, 제1 제로 크로싱 값 시퀀스의 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 부분들을 비교하도록, 그리고 제1 제로 크로싱 값 시퀀스 또는 그 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보를 얻도록 구성될 수 있다. 이에 따라, 신뢰성 있고 효율적인 방식으로, 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스의 기반이 되는 어떤 시간 시프트 신호 섹션들이 최대 유사성을 포함하는지를 결정하는 것이 가능하다. 또한, 중간 정도의 노력으로 제1 제로 크로싱 값 시퀀스 및/또는 제2 제로 크로싱 값 시퀀스의 기반이 되는 신호 섹션들의 주기성을 식별하는 것이 가능할 수 있다.

바람직한 실시예에서, 이 장치는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스를 사용해 상관 함수를 계산하여, 제1 제로 크로싱 값 시퀀스 또는 그 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보를 얻도록 구성된다. 대안으로, 이 장치는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스를 사용해 평균 크기 차이 함수를 계산하여, 제1 제로 크로싱 값 시퀀스의 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 부분들을 비교하도록, 그리고 제1 제로 크로싱 값 시퀀스 또는 그 일부와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보를 얻도록 구성될 수 있다. (일반적으로 제로 크로싱 값 시퀀스들의 서로 다른 시간 시프트들에 대한 상관 값들을 기술하는) 상관 함수의 계산은 제1 제로 크로싱 값 시퀀스(또는 그 일부)와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전(또는 그 일부) 사이의 최대 유사성을 제공하는 시간 시프트들에 관한 정보를 결정하기 위한 효율적인 방법을 구성하는데, 이는 결국, 제1 신호 섹션과 제2 신호 섹션(의 시간 시프트된 버전) 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보로 결론을 내릴 수 있게 한다고 밝혀졌다. 마찬가지로, 통상적으로 서로 다른 시간 시프트들에 대한 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스 간의 평균 크기 차이를 기술하는 평균 크기 차이 함수의 계산은 제1 제로 크로싱 값 시퀀스(또는 그 일부)와 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전(또는 그 일부) 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보를 얻을 수 있게 한다. 이 정보는 결국, 제1 신호 섹션과 제2 신호 섹션 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보로 결론을 내릴 수 있게 한다.

따라서 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스는 그에 기초하여 상관 함수 또는 평균 크기 차이 함수를 계산하기에 매우 적합하다는 것이 밝혀졌다.

바람직한 실시예에서, 이 장치는 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스를 비교하기 전에 제1 제로 크로싱 값 시퀀스로부터 그리고 제2 제로 크로싱 값 시퀀스로부터 상수 성분을 제거하도록 구성된다. 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스로부터 상수 성분(예를 들어, 평균값 등)을 제거하는 것이 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스를 평가하고 비교하는 것을 더 쉽게 만든다고 밝혀졌다.

바람직한 실시예에서, 이 장치는 하나 또는 그보다 많은 입력 신호들로부터 상수 성분(예를 들어, "DC 값" 또는 평균값)을 제거하도록 그리고/또는 제로 크로싱 정보를 결정하기 전에 하나 또는 그보다 많은 입력 신호들에 고역 통과 필터링을 적용하도록 구성된다. 이러한 "상수 성분"을 제거하는 것은 제로 크로싱 정보가 양호하게 또는 심지어 최대 정확도로 얻어지는 것이 보장되는 것으로 밝혀졌다.

일 실시예에서, 이 장치는 복수의 신호 블록들에 대한 신호 블록당 2개 또는 그보다 많은 대표 값들을 결정하도록 구성되며, 2개 또는 그보다 많은 대표 값들은 신호 블록의 특징(feature)들을 기술하고, 2개 또는 그보다 많은 대표 값들은 (제로 크로싱 정보인) 제로 크로싱 값을 포함한다. 이 경우, 이 장치는 유사성 정보를 결정하기 위해 신호 블록당 2개 또는 그보다 많은 대표 값들에 기초하여 비교를 수행하도록 구성된다. 이 실시예는 ("제로 크로싱 정보"로 간주되는) 제로 크로싱 값이 신호 블록들의 다른 특징을 기술하는 다른 대표적인 양(값)에 의해 보완된다면 개념의 신뢰도가 향상될 수 있다는 결론에 기초한다.

바람직한 실시예에서, 대표 값들은 신호 블록마다, 각각의 신호 블록에서의 상승 제로 크로싱들의 수를 기술하는 "양의 제로 크로싱 값"과, 각각의 신호 블록에서의 하강 제로 크로싱들의 수를 기술하는 "음의 제로 크로싱 값"을 포함한다. 이러한 대표 값들을 사용함으로써, 신뢰도 검사가 수행될 수 있다. 특히, 하강 제로 크로싱들의 수와 상승 제로 크로싱들의 수가 매우 유사해야 하기 때문에, 상승 제로 크로싱들 또는 하강 제로 크로싱들이 누락되었는지 여부가 검사될 수 있다.

바람직한 실시예에서, 이 장치는 복수의 신호 블록들에 대한 제1 타입의 대표 값들의 시퀀스에 기초하여 제1 비교를 수행하도록, 그리고 복수의 신호 블록들에 대한 제2 타입의 대표 값들의 시퀀스에 기초하여 제2 비교를 수행하도록 구성된다. 이 경우, 이 장치는 신뢰도 정보를 얻기 위해 제1 비교 결과와 제2 비교 결과를 비교하도록 구성된다. 따라서 두 가지 서로 다른 타입들의 대표 값들을 사용함으로써, 그리고 두 가지 서로 다른 타입들의 대표 값들을 사용하여 얻어진 결과들을 비교함으로써, 방법의 신뢰도가 검사될 수 있다. 특히, 특정 (임계) 값을 초과하는 제1 타입의 대표 값들을 사용하여 얻어진 결과들 간에 불일치가 있다면, 제1 타입의 대표 값들 또는 제2 타입의 대표 값들 또는 두 타입들 모두의 대표 값들은 신뢰할 수 없다. 이 경우, 경고가 생성되어, 비교가 신뢰할 수 없음을 나타낼 수 있다.

바람직한 실시예에서, 이 장치는 각각의 신호 블록의 주파수 도메인 표현을 사용하여 각각의 신호 블록에 대해 결정된 2개의 대표 값들 중 하나를 결정하도록 구성된다. 일부 타입들의 처리 및 왜곡이 (예를 들어, 오디오 신호의) 입력 신호의 시간 도메인 표현에만 영향을 미치지만 주파수 도메인 표현에는 거의 영향을 미치지 않기 때문에, 대표 값을 얻기 위해 각각의 신호 블록의 주파수 도메인 표현을 사용하는 것은 신뢰도를 향상시킬 수 있는 것으로 밝혀졌다.

바람직한 실시예에서, 이 장치는 신호 블록마다 결정되는 2개의 대표 값들 중 하나로서 스펙트럼 평탄도(flatness) 측정치들을 결정하도록 구성된다. 스펙트럼 평탄도 측정치들은 일부 타입들의 입력 신호들에 대한(예컨대, 오디오 신호들에 대한) 양호한 표현을 구성하는 것으로 밝혀졌다.

바람직한 실시예에서, 이 장치는 신호 블록마다 결정되는 2개의 대표 값들 중 하나로서 각각의 신호 블록의 스펙트럼의 평탄도를 기술하는 스펙트럼 평탄도 값들을 결정하도록 구성된다. 각각의 신호 블록의 스펙트럼의 평탄도를 기술하는 스펙트럼 평탄도 값들은 유사성 정보의 양호한 신뢰도를 가져오는 것으로 밝혀졌다.

바람직한 실시예에서, 이 장치는 신호 블록마다 결정되는 2개의(또는 그보다 많은) 대표 값들 중 하나로서 (예를 들어, 신호의 전력 스펙트럼이 얼마나 빠르게 변화하고 있는지를 기술하는) 스펙트럼 플럭스 값들을 결정하도록 구성되며, 여기서 스펙트럼 플럭스 값은 단일 정량 값의 형태로 2개의 각각의 연속 신호 블록들의 스펙트럼들 사이의 변화를 기술한다. 스펙트럼 플럭스 값들의 사용은 예를 들어, 오디오 신호들에 대해서와 같은 일부 타입들의 입력 신호들에 대해 특히 의미 있는 유사성 정보를 얻을 수 있게 한다고 밝혀졌다.

바람직한 실시예에서, 이 장치는 신호 블록마다 결정되는 2개의(또는 그보다 많은) 대표 값들 중 하나로서 각각의 신호 블록에 대한 선형 예측 계수들을 결정하도록 구성된다. 선형 예측 계수들은 적어도, 일부 타입들의 입력 신호들에 대해(예를 들어, 오디오 신호에 대해) 의미 있는 유사성 정보를 야기하는 양들인 것으로 밝혀졌다.

바람직한 실시예에서, 이 장치는 하나 또는 그보다 많은 오디오 신호들 또는 하나 또는 그보다 많은 비디오 신호들 또는 하나 또는 그보다 많은 센서 신호들을 하나 또는 그보다 많은 입력 신호들로서 수신하도록 구성된다. 이 경우, 이 장치는 하나 또는 그보다 많은 오디오 신호들에 기초하여 또는 하나 또는 그보다 많은 비디오 신호들에 기초하여 또는 하나 또는 그보다 많은 센서 신호들에 기초하여 제로 크로싱 정보를 결정하도록 구성된다. 제로 크로싱 레이트는 예를 들어, 오디오 신호들 및 비디오 신호들 및 센서 신호들과 같은 "기술적 신호들"의 부분들에 대해 특히 의미 있는 대표적인 양을 구성하는 것으로 밝혀졌다. 오디오 신호들과 비디오 신호들 모두는 일반적으로, 이들의 부호를 규칙적으로 변화시키는 신호들이며, 제로 크로싱 레이트는 상기 오디오 신호들 또는 비디오 신호들에 의해 표현되는 오디오 콘텐츠 또는 비디오 콘텐츠에 대한 양호한 상관을 갖는다. 또한, 많은 센서 신호들은 이러한 특성들을 갖는다. 따라서 본 명세서에서 설명되는 장치는 또한, 예를 들어 서로 다른 타입들의 물리적 센서들로부터의 센서 신호들과 같은 다른 기술적으로 의미 있는 신호들에 적용될 수 있다는 점이 주목되어야 한다. 입력 신호 벡터가 처리 전에 DC 성분으로부터(예컨대, 평균값으로부터) "제거"될 때(즉, DC 성분이 제거될 때), 이러한 신호들은 본 명세서에서 논의된 개념을 사용하여 평가될 수 있는 제로 크로싱들을 또한 가질 것이다.

추가 언급으로서, DC 성분(예를 들어, 상수 성분 또는 평균값)이 일부 실시예들에서 입력 신호로부터 그리고 대표 값들의 벡터로부터 제거될 것이라는 점이 주목되어야 한다.

바람직한 실시예에서, 이 장치는 오디오 신호 또는 비디오 신호에 관한 자기 상관 정보를 얻기 위해 유사성 정보를 사용하도록 구성된다. 대안으로, 이 장치는 2개의 오디오 신호들에 대한 또는 2개의 비디오 신호들에 대한 교차 상관 정보를 얻기 위해 유사성 정보를 사용하도록 구성될 수 있다. 대안으로, 이 장치는 2개의 오디오 신호들 간의 최선의 가능한 정렬을 얻기 위한 시간 시프트를 결정하기 위해, 또는 2개의 비디오 신호들 간의 최선의 가능한 정렬을 얻기 위한 시간 시프트를 결정하기 위해 유사성 정보를 사용하도록 구성될 수 있다. 입력 신호의 일부를 나타내는 대표 값으로서 제로 크로싱 정보의 사용은 두 오디오 신호들 간의 또는 두 비디오 신호들 간의 최선의 가능한 정렬을 얻기 위한 시간 시프트 또는 자기 상관 정보나 교차 상관 정보를 결정하기 위한 계산상 매우 효율적인 개념을 제공하는 것으로 밝혀졌다. 제로 크로싱 정보(또는 제로 크로싱 값들)에 의해 하나 또는 그보다 많은 입력 신호들의 부분들을 나타내는 것은 최선의 가능한 정렬을 얻기 위한 시간 시프트, 자기 상관 정보 또는 교차 상관 정보를 결정하기 위한 데이터의 양(즉, 계산 부하)을 감소시키는 것으로 밝혀졌다.

본 발명에 따른 일 실시예는 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 방법을 생성한다. 이 방법은 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 부분들에 대한 각각의 부분에서의 제로 크로싱들의 수를 기술하는 제로 크로싱 정보를 결정하는 단계를 포함한다. 이 방법은 유사성 정보를 결정하기 위해 제로 크로싱 정보에 기초하여 비교를 수행하는 단계를 더 포함한다. 이 방법은 각각의 장치에 대해 앞서 논의한 것과 동일한 고려 사항들에 기초한다.

본 발명에 따른 다른 실시예는 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 이 방법을 수행하기 위한 컴퓨터 프로그램을 생성한다.

본 발명에 따른 일 실시예는 오디오 신호 또는 비디오 신호인 단일 신호의 서로 다른 섹션들 사이의 유사성을 기술하는 자기 상관 정보를 결정하기 위한 장치를 생성한다. 이 장치는 신호의 복수의 블록들에 대해, 신호의 (부분으로도 또한 표기된) 블록당 적어도 하나의 제로 크로싱 값을 포함하는 제로 크로싱 정보를 결정하도록 구성된 제로 크로싱 분석기를 포함한다. 제로 크로싱 값들은 신호의 각각의 블록(또는 부분)에 대한 제로 크로싱들의 수를 기술한다. 제로 크로싱 값 시퀀스 비교기는 자기 상관 정보를 얻기 위해, 신호의 제1 신호 섹션과 연관된 제로 크로싱 값들의 제1 제로 크로싱 값 시퀀스와 신호의 제2 신호 섹션과 연관된 제로 크로싱 값들의 제2 제로 크로싱 값 시퀀스를 비교하도록 구성된다. 자기 상관 정보를 결정하기 위한 이 장치는 이미 앞서 언급한 것과 동일한 고려 사항들에 기초한다.

본 발명에 따른 다른 실시예는 제1 신호와 제2 신호 사이의 유사성을 기술하는 교차 상관 정보를 결정하기 위한 장치를 생성하는데, 여기서 신호들은 오디오 신호들 또는 비디오 신호들이다. 이 장치는 제1 신호의 복수의 블록들(또는 부분들)에 대해, 제1 신호의 블록당 적어도 하나의 제로 크로싱 값을 포함하는 제로 크로싱 정보를 결정하도록, 그리고 제2 신호의 복수의 블록들에 대해, 제2 신호의 블록당 적어도 하나의 제로 크로싱 값을 포함하는 제로 크로싱 정보를 결정하도록 구성된 제로 크로싱 분석기를 포함한다. 제로 크로싱 값들은 각각의 신호의 각각의 블록에 대한 제로 크로싱들의 수를 기술한다. 이 장치는 또한, 교차 상관 정보를 얻기 위해, 제1 신호의 신호 섹션과 연관된 제로 크로싱 값들의 제로 크로싱 값 시퀀스를 제2 신호의 신호 섹션과 연관된 제로 크로싱 값들의 제로 크로싱 값 시퀀스와 비교하도록 구성된 제로 크로싱 값 시퀀스 비교기를 포함한다. 이 장치는 2개의 오디오 신호들 또는 2개의 비디오 신호들에 기초하여 교차 상관 정보를 얻는 데 매우 적합하며, 여기서 신호들의 블록들(또는 부분들)에 대한 대표 값들로서 제로 크로싱 값들을 사용함으로써 계산 복잡도가 감소될 수 있다.

다음에, 본 발명에 따른 실시예들이 첨부된 도면들을 참조하여 설명될 것이다.
도 1은 본 발명의 일 실시예에 따른 유사성 정보를 결정하기 위한 장치의 개략적인 블록도를 도시한다.
도 2는 본 발명의 일 실시예에 따른 유사성 정보를 결정하기 위한 장치의 개략적인 블록도를 도시한다.
도 3은 본 발명의 다른 실시예에 따른 유사성 정보를 결정하기 위한 장치의 개략적인 블록도를 도시한다.
도 4는 자기 상관이 계산되는 경우에 대한 유사성 정보의 결정의 개략적인 표현을 도시한다.
도 5는 교차 상관이 사용되는 경우에 대한 유사성 정보의 결정의 개략적인 표현을 도시한다.
도 6은 제로 크로싱 값 시퀀스의 결정의 상세한 개략적인 표현을 도시한다.
도 7은 본 발명의 일 실시예에 따른 유사성 정보를 결정하기 위한 방법의 흐름도를 도시한다.

1. 도 1에 따른 유사성 정보를 결정하기 위한 장치

도 1은 본 발명의 일 실시예에 따라, 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 장치의 개략적인 블록도를 도시한다.

도 1에 따른 장치는 그 전체가 100으로 표기된다.

이 장치(100)는 적어도 하나의 입력 신호(112)를 수신하도록 그리고 적어도 하나의 입력 신호에 기초하여 제로 크로싱 정보(114)를 제공하도록 구성된 제로 크로싱 정보 결정부(110)를 포함한다. 예를 들어, 제로 크로싱 정보 결정부(또는 결정기)(110)는, 제로 크로싱 정보(114)가 하나 또는 그보다 많은 입력 신호들(112) 중 적어도 하나의 입력 신호의 복수의 부분들에 대한 각각의 부분에서의 제로 크로싱들의 수를 기술하게 제로 크로싱 정보(114)를 결정하도록 구성될 수 있다. 이 장치는 제로 크로싱 정보(114)를 수신하고 그에 기초하여 유사성 정보(122)를 제공하는 비교부(또는 비교기)(120)를 더 포함한다. 예를 들어, 비교부(또는 비교기)(120)는 유사성 정보(122)를 결정하기 위해 제로 크로싱 정보(114)에 기초하여 비교를 수행하도록 구성될 수 있다. 예를 들어, 비교부(120)는 제로 크로싱 정보(114)에 기초하여 상관 연산(예를 들어, 자기 상관 연산 또는 교차 상관 연산)을 수행하도록 구성될 수 있다. 대안으로, 비교부(120)는 제로 크로싱 정보의 서로 다른 값들(또는 값들의 세트들)에 기초하여 평균 크기 차이 값 또는 차이의 노름 또는 유클리드 거리를 계산할 수 있다. 이에 따라, 유사성 정보(122)가 얻어질 수 있다.

장치(100)의 기능과 관련하여, 적어도 하나의 입력 신호(112)의 복수의 부분들에 대해 얻어진 제로 크로싱 정보가 "대표 정보"로서 사용된다고 할 수 있으며, 여기서 예를 들어, 제로 크로싱 정보(114)의 각각의 값은 입력 신호(112)의 부분(예를 들어, 샘플들의 블록)을 나타낸다. 다르게 말하면, 입력 신호(112)의 시간 연속 또는 시간 이산 (샘플링된) 부분은 예를 들어, 상기 부분에서의 제로 크로싱들의 수를 단일 정수 값의 형태로 나타내는 단일 값에 "매핑"된다. 따라서 다수의(예컨대, 10개 또는 그보다 많은) 샘플 값들을 포함하는 입력 신호(112)의 전체 부분이 단일 제로 크로싱 정보 값에(또는 일부 실시예들에서는, 하나는 상승 제로 크로싱들의 수를 나타내고 다른 하나는 하강 제로 크로싱들의 수를 나타내는 2개의 제로 크로싱 정보 값들에) 매핑된다. 그러나 제로 크로싱 정보는 매우 압축적이지만 의미 있는 대표 정보여서, 입력 신호(112)의 부분들로부터의 제로 크로싱 정보(114)의 도출은 비교적 적은 양의 정보만이 비교부(120)에 의해 처리될 필요가 있다는 효과를 갖는 것으로 밝혀졌다.

비교부(120)는 제로 크로싱 정보(114)의 대응하는 제로 크로싱 값들을 비교하여 유사성 정보를 얻는다. 즉, 입력 신호(112)의 2개의 섹션들이 장치(100)에 의해 비교된다면, 이러한 2개의 섹션들에 대응하는 제로 크로싱 값들은 예를 들어, 상관 연산, 평균 크기 차이 값 계산 연산, 차이의 노름의 계산, 또는 유클리드 거리의 계산을 사용하여 비교부(120)에 의해 효과적으로 비교된다. 마찬가지로, 서로 다른 입력 신호들의 2개의 섹션들이 장치(100)에 의해 비교된다면, 이러한 섹션들과 연관된 제로 크로싱 값들이 비교부(120)에 의해 비교된다.

결과적으로, 비교될 하나 또는 그보다 많은 입력 신호들의 섹션들의 비교적 많은 수의 샘플 값들을 비교하는 것과 비교할 때, 입력 신호로부터 제로 크로싱 값들(제로 크로싱 정보(114))을 도출하고, 그런 다음 비교부(120)를 사용하여 비교적 적은 수의 제로 크로싱 값들을 비교하는 것이 계산상 실질적으로 더 효율적이라고 밝혀졌다.

그러나 도 1에 따른 장치(100)는 개별적으로 또는 결합하여 취한, 본 명세서에서 설명되는 특징들 및 기능들 중 임의의 것으로 보완될 수 있다는 점이 주목되어야 한다.

2. 도 2에 따른 장치

도 2는 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 장치(200)의 개략적인 블록도를 도시한다. 이 장치(200)는 입력 신호(212)를 수신하도록, 그리고 이를 기초로 유사성 정보(222) 및/또는 시간 시프트 정보(232)를 제공하도록 구성된다. 이 장치(200)는 제로 크로싱 값 결정기(210)를 포함하는데, 이는 제로 크로싱 값 계산기로도 또한 간주될 수 있고, 예를 들어 제로 크로싱 정보 결정부(110)의 기능을 취할 수 있다. 제로 크로싱 값 결정기(210)는 예를 들어, 입력 신호를 수신할 수 있다. 그러나 선택적으로, "DC 제거" 또는 고역 통과 필터링이 입력 신호(212)에 적용되어(블록(216)) 제로 평균 입력 신호(218)를 얻을 수 있다. 즉, 제로 크로싱 값 결정기(210)는 바람직하게는 제로 평균 입력 신호를 수신하는데, 이는 제로 크로싱들의 수가 그러한 제로 평균 입력 신호에 대해 가장 의미가 있기 때문이다. 입력 신호(212)가 반드시 제로 평균을 포함하는 것은 아니라고 가정되어야 한다면, 제로 크로싱 값 결정기(210)에 신호를 입력하기 전에 DC 제거/고역 통과 필터링(216)을 적용하는 것이 권장된다.

제로 크로싱 값 결정기(210)는 고려될 입력 신호(212)의(또는 제로 평균 입력 신호(218)의) 각각의 부분에 대해 일반적으로 하나의(일부 실시예들에서는 심지어 2개의) 제로 크로싱 값을 제공한다. 이에 따라, 제로 크로싱 값 결정기(210)는 사실상 제로 크로싱 값 시퀀스(214)를 제공하는데, 이는 제로 크로싱 정보로서 간주될 수 있다. 제로 크로싱 값 시퀀스(214)는 예를 들어, 입력 신호(212, 218)의 부분과 각각 연관되며, 입력 신호의 연관된 부분에서의 제로 크로싱들(상승 제로 크로싱들, 또는 하강 제로 크로싱들, 또는 상승 및 하강 제로 크로싱들)의 수를 각각 기술하는 제로 크로싱 값들의 시퀀스를 포함할 수 있다.

이 장치(200)는 또한, 제로 크로싱 값 시퀀스 비교부(또는 비교기)(220)를 포함하는데, 그 기능은 비교부(120)의 기능과 유사하다. 제로 크로싱 값 시퀀스 비교부(220)는 제로 크로싱 값 결정기(210)에 의해 제공된 제로 크로싱 값 시퀀스(214), 또는 제로 크로싱 값 시퀀스(214)의 제로 평균 버전(228)을 수신한다. 예를 들어, 제로 크로싱 값 시퀀스(214)는 입력 신호(212, 218)의 각각의 부분에 대한 하나의 음이 아닌 정수 값을 포함할 수 있다. 그러나 어떤 경우들에는, 제로 크로싱 값 시퀀스 비교부(220)가 제로 평균 입력 시퀀스를 수신한다면, 제로 크로싱 값 시퀀스 비교가 보다 쉽게 구현될 수 있다. 이러한 목적으로, 제로 크로싱 값 시퀀스(214)를 수신하고 그에 기초하여 제로 크로싱 값 시퀀스의 제로 평균 버전(228)을 제공하는 DC 제거 또는 고역 통과 필터(226)가 선택적으로 존재할 수 있다. 예를 들어, DC 제거/고역 통과 필터링(226)은 제로 크로싱 값 시퀀스 비교부(220)에 대한 입력량으로서 사용되는 제로 크로싱 값 시퀀스의 제로 평균 버전(228)의 개별 값들을 얻기 위해, 제로 크로싱 값 시퀀스(214)의 값들의 평균값을 결정하고 제로 크로싱 값 시퀀스(214)의 개별 값들로부터 평균값을 감산할 수 있다. 제로 크로싱 값 시퀀스 비교부(220)는 비교될 입력 신호(212)의 섹션들과 연관된 2개의 제로 크로싱 값 시퀀스들(또는 서브시퀀스들)을 사용하거나 평가할 수 있다. 예를 들어, 제로 크로싱 값 시퀀스 비교부(220)는 2개의 제로 크로싱 값 시퀀스들(또는 서브시퀀스들)에 기초하여 "자기 상관" 값을 계산하도록 구성될 수 있다. 상기 자기 상관 값 계산의 결과가 유사성 정보(222)를 구성할 수 있다.

그러나 제로 크로싱 값 시퀀스들 또는 제로 크로싱 값 서브시퀀스들의 비교를 위한 다른 접근 방식들이 제로 크로싱 값 시퀀스 비교에 의해 사용될 수 있다. 이러한 비교 개념들 중 일부는 DC 제거/고역 통과 필터링(226)을 필요로 하지 않을 수 있지만, (예를 들어, 자기 상관 값의 계산과 같은) 다른 비교 기술들이 DC 제거/고역 통과 필터링(226)으로부터 이익을 얻을 수 있다.

제로 크로싱 값 시퀀스 비교부(220)는 선택적으로, 다수 쌍들의 제로 크로싱 값 시퀀스들 또는 제로 크로싱 값 서브시퀀스들을 비교할 수 있으며, 따라서 입력 신호들의 서로 다른 쌍들의 섹션들 사이의 유사성들을 나타내는 복수의 유사성 정보 값들을 제공할 수 있다.

선택적으로, 이 장치는 시간 시프트 계산부(230)를 더 포함한다. 시간 시프트 계산부(230)는 예를 들어, 입력 신호(212, 218)의 복수의 쌍들의 섹션들 사이의 유사성들을 기술하는 유사성 정보(222)를 수신하도록 구성될 수 있다. 더욱이, 시간 시프트 계산부(230)는 복수의 상기 유사성 정보 중에서 최대 유사성을 나타내는 또는 시그널링하는 유사성 정보 값을 식별하여, 이로써 입력 신호(212, 218)의 어느 쌍의 섹션들이 최대 유사성을 포함하는지 결론을 내리도록 구성될 수 있다. 이에 따라, 시간 시프트 정보(232)는 최대 유사성을 포함하는 입력 신호(212, 218)의 두 섹션들 사이의 시간 시프트를 기술하도록 시간 시프트 계산부(230)에 의해 결정될 수 있다. 이에 따라, 이 장치(200)는 자기 상관 정보가 피크를 포함하는 시간 래그와 의미가 유사한 시간 시프트 정보(232)를 효과적으로 얻을 수 있다.

따라서 장치(200)에 의해 제공되는 시간 시프트 정보(232)는 예를 들어, 입력 신호(212, 218) 내의 주기성을 검출하고 주기성 간격을 나타내는 데 사용될 수 있다.

그러나 도 2에 따른 장치(200)는 개별적으로 또는 결합하여, 본 명세서에서 설명되는 특징들 또는 기능들 중 임의의 것으로 보완될 수 있다.

3. 도 3에 따른 장치

도 3은 유사성 정보를 결정하기 위한 장치(300)의 개략적인 블록도를 도시한다. 이 장치(300)는 제1 신호 섹션("신호 섹션 1")(312) 및 제2 신호 섹션("신호 섹션 2")(314)을 수신하도록 구성된다. 제1 신호 섹션(312) 및 제2 신호 섹션(314)은 비교될 신호 섹션들이고, 동일한 신호의 2개의 신호 섹션들일 수 있다. 대안으로, 제1 신호 섹션(312)은 제1 신호의 섹션일 수 있고, 제2 신호 섹션(314)은 제2 신호의 신호 섹션일 수 있다. 신호 섹션들(312, 314)은 시간상 중첩할 수도 또는 시간상 중첩하지 않을 수도 있다. 선택적으로, 제1 DC 제거 또는 고역 통과 필터링(316)이 제1 신호 섹션에 적용될 수 있다. 마찬가지로, DC 제거 또는 고역 통과 필터링(318)이 제2 신호 섹션(314)에 선택적으로 적용될 수 있다. DC 제거/고역 통과 필터링(316, 318)의 기능은 DC 제거/고역 통과 필터링(216)의 기능과 유사하다.

이 장치(300)는 또한 (제로 크로싱 값 계산기로도 또한 표기된) 제로 크로싱 값 결정기를 포함하는데, 이는 제1 신호 섹션(312) 및 제2 신호 섹션(314), 또는 DC 제거들(316, 318)에 의해 제공된 이들의 제로 평균 버전들을 수신하도록 구성된다. 제로 크로싱 값 결정기는 예를 들어, 제1 신호 섹션(312)의 복수의 부분들(또는 블록들) 각각에 대한 상승 제로 크로싱들(음에서 양으로의 제로 크로싱들)의 수 또는 하강 제로 크로싱들(양에서 음으로의 제로 크로싱들)의 수 또는 상승 및 하강 제로 크로싱들의 수를 결정할 수 있다. 마찬가지로, 제로 크로싱 값 결정기(320)는 제2 신호 섹션(314)의 복수의 부분들(또는 블록들) 각각에 대한 상승 제로 크로싱들의 수 또는 하강 제로 크로싱들의 수 또는 상승 및 하강 제로 크로싱들의 수를 결정 또는 계산하도록 구성될 수 있다. 이에 따라, 제로 크로싱 값 결정기는 제1 신호 섹션(312)에 대한(즉, 이와 연관된) 제로 크로싱 값 시퀀스(322)를 제공하도록 구성될 수 있으며, 상기 제로 크로싱 값 시퀀스(322)는 제1 신호 섹션(312)의 부분들(또는 블록들)과 연관된 제로 크로싱 값들(예를 들어, 제1 신호 섹션(312)의 각각의 부분 또는 블록에 대한 정확히 하나 또는 정확히 2개의 음이 아닌 정수 값들)을 포함한다. 마찬가지로, 제2 신호 섹션(314)에 대해 제로 크로싱 값 결정기(320)에 의해 제공되는 제2 제로 크로싱 값 시퀀스(324)는 제2 신호 섹션(314)의 각각의 부분 또는 블록에 대해 정확히 하나 또는 정확히 2개의 음이 아닌 정수 값들(개별 값들 각각은 각각의 개별 값이 연관되는 각각의 부분 내의 상승 제로 크로싱들의 수 또는 하강 제로 크로싱들의 수, 또는 총 제로 크로싱들의 수를 나타냄)을 포함할 수 있다.

이 장치(300)는 제1 제로 크로싱 값 시퀀스(322)로부터 평균값을 제거할 수 있는 또는 제1 제로 크로싱 값 시퀀스(322)를 고역 통과 필터링할 수 있는 DC 제거 또는 고역 통과 필터링(326)을 선택적으로 더 포함할 수 있다. 마찬가지로, 이 장치는 제로 크로싱 값 시퀀스(324)로부터 평균값을 제거하거나 제로 크로싱 값 시퀀스(324)를 고역 통과 필터링하는 DC 제거 또는 고역 통과 필터링(328)을 포함할 수 있다.

이 장치(300)는 또한, DC 제거/고역 통과 필터(326)에 의해 제공되는 제1 제로 크로싱 값 시퀀스(322) 또는 이것의 제로 평균 버전, 그리고 DC 제거/고역 통과 필터(328)에 의해 제공되는 제2 제로 크로싱 값 시퀀스(324) 또는 이것의 제로 평균 버전을 수신하도록 구성된 제로 크로싱 값 시퀀스 비교부(또는 제로 크로싱 값 비교기)(330)를 포함한다. 제로 크로싱 값 시퀀스 비교부는 제1 제로 크로싱 값 시퀀스(222)(또는 이것의 제로 평균 버전)와 제2 제로 크로싱 값 시퀀스(324)(또는 이것의 제로 평균 버전)를 비교하여 (단일 유사성 값의 형태를 취할 수 있는) 유사성 정보를 얻도록 구성된다. 예를 들어, 제로 크로싱 값 시퀀스 비교부(330)는 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스에 기초하여 교차 상관 값, 평균 크기 차이 함수 값, L1-노름 또는 유클리드 거리를 계산함으로써, 제1 제로 크로싱 값 시퀀스(322)가 제2 제로 크로싱 값 시퀀스(324)와 비교되도록 구성될 수 있다. 따라서 예를 들어, 2개의 제로 크로싱 값 시퀀스들(322, 324) 사이의 비교와 연관된 단일 값에 의해 표현될 수 있는 유사성 정보(332)가 제로 크로싱 값 시퀀스 비교에 기초하여 제공될 수 있다. 그러나 유사성 정보는 또한, 서로 다른 쌍들의 제로 크로싱 값 시퀀스들의 비교들을 위해 또는 2개의 제로 크로싱 값 시퀀스들의 서로 다른 서브시퀀스들의 비교들을 위해 제공된 값들의 시퀀스를 포함할 수 있다. 예를 들어, 유사성 정보(332)는 교차 상관 값, 교차 상관 함수(즉, 복수의 교차 상관 래그 값들에 대한 교차 상관 값들) 또는 평균 크기 차이 함수 값을 포함할 수 있다.

선택적으로, 이 장치(300)는 또한, 예를 들어 서로 다른 쌍들의 제로 크로싱 값 시퀀스들 또는 제로 크로싱 값 서브시퀀스들의 비교와 연관된 다수의 유사성 정보 값들을 수신할 수 있는 시간 시프트 계산부(340)를 포함할 수 있다. 예를 들어, 시간 시프트 계산부(340)는 어떤 쌍의 제로 크로싱 값 시퀀스들 또는 어떤 쌍의 제로 크로싱 값 서브시퀀스들에 대해 최대 유사성이 발생하는지를 결정할 수 있다. 즉, 시간 시프트 계산부는 다수의 신호 섹션들에 대해 또는 다수의 제로 크로싱 값 시퀀스들에 대해 유사성 정보를 사용할 수 있다.

선택적으로, 이 장치(300)는 또한 하나 또는 그보다 많은 추가 특징 값들을 결정 또는 계산하도록 구성될 수 있는 특징 값 결정기/특징 값 계산기(350)를 포함할 수 있다. 하나 또는 그보다 많은 추가 특징 값들은 각각 제1 신호 섹션의 또는 제2 신호 섹션의 하나의 부분(또는 블록)을 기술 또는 표현할 수 있다. 예를 들어, 제1 제로 크로싱 값 시퀀스(322) 및 제2 제로 크로싱 값 시퀀스(324)의 각각의 제로 크로싱 값과 연관된 하나의 추가 특징 값일 수 있다.

따라서 제로 크로싱 값 시퀀스들의 비교에 부가하여, 유사성 정보(332)를 획득하기 위해 하나 또는 그보다 많은 추가 특징 값 시퀀스들이 비교될 수 있다. 예를 들어, 각각 n개의 값들을 포함하는 제1 제로 크로싱 값 시퀀스(322)와 제2 제로 크로싱 값 시퀀스(324) 간의 비교가 제로 크로싱 값 시퀀스 비교부(330)에 의해 계산되어 제1 부분 유사성 정보를 얻을 수 있다. 또한, 각각 n개의 특징 값들을 포함하는 제1 특징 값 시퀀스 및 제2 특징 값 시퀀스가 비교되어 제2 부분 비교 결과를 얻을 수 있다. 마지막으로, 제2 부분 비교 결과(또는 부분 유사성 정보)에서의 제1 부분 비교 결과(또는 제1 부분 유사성 정보)가 결합되어 유사성 정보(332)를 얻을 수 있다. 따라서 특정한 제1 신호 섹션과 특정한 제2 신호 섹션의 비교를 위해, 특정한 제1 신호 섹션과 연관된 제로 크로싱 값 시퀀스 및 추가 특징 값 시퀀스가 비교에 사용될 수 있고, 제2 제로 크로싱 값 시퀀스 및 제2 추가 특징 값 시퀀스가 역시 비교에 사용될 수 있다. 따라서 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스 간의 비교 결과가 제1 추가 특징 값 시퀀스와 제2 추가 특징 값 시퀀스 간의 비교 결과와 결합되어 유사성 정보를 얻을 수 있다. 결과적으로, 제1 신호 섹션의 각각의 부분 또는 블록은 제로 크로싱 값 및 추가 특징 값인 2개의 대표 값들로 표현되고, 제2 신호 섹션의 각각의 블록은 또한 적어도 2개의 대표 값들, 즉 제로 크로싱 값 및 추가 특징 값으로 표현된다. 두 가지 타입들의 대표들(제로 크로싱 값 및 추가 특징 값)을 사용함으로써, 비교의 신뢰도가 개선될 수 있어, 유사성 정보(322)가 보다 신뢰성 있는 것으로 간주될 수 있다. 유사성 정보(332)는 제1 부분 비교 결과와 제2 부분 비교 결과의 다양한 타입들의 결합에 의해 도출될 수 있다. 예를 들어, 제1 부분 비교 결과의 그리고 제2 부분 비교 결과의 평균 및/또는 가중 평균이 계산될 수 있다. 대안으로, 제1 부분 비교 결과의 그리고 제2 부분 비교 결과의 최소값이 유사성 정보(332)를 얻는 데 사용될 수 있다. 그러나 제1 부분 비교 결과 및 제2 부분 비교 결과로부터 유사성 정보(332)를 도출하기 위해 다른 선형 또는 비선형 결합 접근 방식들이 사용될 수 있다.

4. 도 4에 따른 예

다음에, 도 4를 참조하여 유사성 정보의 결정에 대한 예가 설명될 것이다.

도 4는 제1 라인(410)에서 제1 신호의 표시를 도시한다. 가로 좌표(412)는 시간을 기술한다. 확인될 수 있는 바와 같이, 신호는 2개의 연속된 비중첩 섹션들(420, 430)("섹션 1", "섹션 2")로 세분된다. 제1 섹션(420)은 (부분들로 또한 표기된) n = 3개의 비중첩 블록들(422, 424, 426)로 시간상 세분된다. 블록들(422, 424, 426) 각각은 시간 축을 가로지르는 수직선들로 표시되는 한 세트의 샘플 값들을 포함한다.

시간상 제1 블록(422) 내에 놓여 있는 "신호 1"의 샘플 값들에 기초하여 제1 제로 크로싱 값인 "제로 크로싱 값 1"이 결정 또는 계산된다. 마찬가지로, 시간상 제2 블록(424) 내에 놓여 있는 샘플 값들에 기초하여 제2 제로 크로싱 값인 "제로 크로싱 값 2"가 결정 또는 계산된다. 게다가, 시간상 제3 블록(426) 내에 놓여 있는 샘플 값들에 기초하여 제3 제로 크로싱 값인 "제로 크로싱 값 3"이 결정 또는 계산된다.

마찬가지로, 제4 블록(432)에, 제5 블록(434)에, 또는 제6 블록(436)에 놓여 있는 "신호 1"의 샘플들에 기초하여 추가 제로 크로싱 값들("제로 크로싱 값 4", "제로 크로싱 값 5", "제로 크로싱 값 6")이 계산된다. 따라서 제로 크로싱 값들 각각은 해당 값이 계산된 신호 값들 또는 신호 샘플들의 각각의 블록의 대표 값으로 고려될 수 있다.

더욱이, 제1 제로 크로싱 값 시퀀스는 제1 신호(신호 1)의 제1 섹션(420)과 연관되고, 제2 제로 크로싱 값 시퀀스는 제1 신호(신호 1)의 제2 섹션(430)과 연관된다고 할 수 있다. 예를 들어, 제1 제로 크로싱 값 시퀀스는 제1 블록(422)과 연관된 제로 크로싱 값, 제2 블록(424)과 연관된 제로 크로싱 값 및 제3 블록(426)과 연관된 제로 크로싱 값을 포함한다. 제2 제로 크로싱 값 시퀀스는 제4 블록(432)과 연관된 제로 크로싱 값, 제5 블록(434)과 연관된 제로 크로싱 값 및 제6 블록(436)과 연관된 제로 크로싱 값을 포함한다. 제1 제로 크로싱 값 시퀀스는 참조 번호(450)로 예시되고, 제2 제로 크로싱 값 시퀀스는 참조 번호(456)로 예시된다. 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스는 제로 크로싱 정보(114)에 또는 제로 크로싱 값 시퀀스(214)에, 또는 제1 및 제로 크로싱 값 시퀀스(322, 324)에 대응할 수 있다는 점이 주목되어야 한다. 따라서 제1 제로 크로싱 값 시퀀스 및 제2 제로 크로싱 값 시퀀스는 제로 크로싱 정보 결정부(110)에 의해 또는 제로 크로싱 값 결정기(210, 320)에 의해 제공될 수 있다. 더욱이, 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스는 비교부(120)에 의해 또는 제로 크로싱 값 시퀀스 비교(220, 330)에 의해 비교될 수 있다. 예를 들어, 상관 계산을 사용하여 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스가 비교될 수 있다. 대안으로, 값들의 2개의 시퀀스들의 비교를 위한 다른 개념들이 본 명세서에서 설명되는 바와 같이 사용될 수 있다.

따라서 (제1 제로 크로싱 값 시퀀스가 기초를 두는) 제1 섹션(420)과 (제2 제로 크로싱 값 시퀀스가 기초를 두는) 제2 섹션(430) 사이의 유사성을 나타내는(또는 기술하는) 유사성 값이 얻어진다. 즉, 유사성 값은 비교된 제로 크로싱 값 시퀀스가 기초를 두는 입력 신호의 섹션들의 유사성을 나타낸다.

다른 예로서, 제1 신호(신호 1)의 중첩 섹션의 비교가 참조 번호(440)에서 도시된다. 확인될 수 있듯이, 신호 블록들 또는 신호 섹션들인 "블록 1", "블록 2", "블록 3" 및 "블록 4"를 포함하는 제3 섹션이 제4 섹션인 "섹션 4"와 비교되는데, 이는 신호 블록들 또는 신호 부분들인 "블록 4", "블록 5", "블록 6" 및 "블록 7"을 포함한다. 앞서 언급한 경우와 유사하게, 하나의 제로 크로싱 값은 상기 블록들인 "블록 1" 내지 "블록 7" 각각과 연관되며, 여기서 제로 크로싱 값은 "제로 크로싱 값 1a" 내지 "제로 크로싱 값 7a"로 표기된다.

이에 따라, 제3 제로 크로싱 값 시퀀스는 제로 크로싱 값 1a 내지 제로 크로싱 값 4a를 포함하고, 제4 제로 크로싱 값 시퀀스는 제로 크로싱 값 4a 내지 제로 크로싱 값 7a를 포함한다. 이에 따라, 제3 제로 크로싱 값 시퀀스와 제4 제로 크로싱 값 시퀀스가 비교될 수 있는데, 여기서는 제로 크로싱 값 1a는 제로 크로싱 값 4a와 비교되고, 제로 크로싱 값 2a는 제로 크로싱 값 5a와 비교되는 식이다. 단일 신호의 중첩하는 섹션들(섹션 3 및 섹션 4)을 비교하는 것이 가능하며, 여기서 섹션들은 "중첩하는" 제로 크로싱 값 시퀀스들로 표현된다. 당연히, 2개의(또는 그보다 많은) 제로 크로싱 값 시퀀스들에 공통인 그러한 제로 크로싱 값들을 여러 번 계산할 필요는 없다. 오히려, 각각의 제로 크로싱 값을 단지 한 번만 계산하고, 비교를 위해 비교될 신호 섹션들에 대응하는 제로 크로싱 값들의 그러한 서브세트들을 선택하는 것이 당연히 충분하다.

5. 도 5에 따른 예

신호들(또는 그 부분들)의 비교의 실행이 도 5를 참조하여 다음에 설명될 것이다. 비교는 예를 들어, 교차 상관에 대응할 수 있으며, 비교될 신호 섹션들의 블록들(또는 부분들)은 제로 크로싱 값들에 의해 표현된다.

참조 번호(510)에서의 표현은 제1 신호의 섹션(520)을 도시하며, 이 섹션은 제1 블록(522), 제2 블록(524) 및 제3 블록(526)을 포함하고, 여기서 블록들(522, 524, 526)은 예를 들어, 신호 섹션(520)의 중첩하지 않는 바로 다음 시간 부분들이다. 블록들(522, 524, 526) 각각은 신호가 시간 이산인 경우에 다수의 신호 샘플들을 포함할 수 있으며, 신호 샘플들은 시간 축(512)(가로 좌표)을 가로지르는 수직선들로 표현된다. 제1 신호의 제1 제로 크로싱 값(제로 크로싱 값들 1, 1)은 제1 블록(522)과 연관되고, 제1 신호의 제2 제로 크로싱 값(제로 크로싱 값 1, 2)은 제2 블록(524)에 연관되며, 제3 제로 크로싱 값(제로 크로싱 값 1, 3)은 제3 블록(526)과 연관된다.

마찬가지로, 제1 신호와 다르고 참조 번호(530)로 표현되는 제2 신호가 있다. 가로 좌표(532)는 시간을 기술한다. 비교를 위해 제2 신호의 (여기서는 "제2 신호 섹션"(540)으로 표기된) 신호 섹션이 선택된다. 제2 신호(540)는 "제로 크로싱 값 2, 3", "제로 크로싱 값 2, 4" 및 "제로 크로싱 값 2, 5"로도 또한 표기되는 블록들(542, 544, 546)을 포함한다. 따라서 "제로 크로싱 값들 1, 1", "제로 크로싱 값 1, 2" 및 "제로 크로싱 값 1, 3"의 제로 크로싱 값들을 포함하는 제1 제로 크로싱 값 시퀀스는 비교를 위해 선택된 제1 신호의 (제1) 신호 섹션(520)과 연관된다. 마찬가지로, "제로 크로싱 값 2, 3", "제로 크로싱 값 2, 4" 및 "제로 크로싱 값 2, 5"의 제로 크로싱 값들을 포함하는 제2 제로 크로싱 값 시퀀스는 제2 신호의 (제2) 신호 섹션(540)과 연관되며, 상기 (제2) 섹션(540)은 비교를 위해 선택되었다. 이에 따라, 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스가 비교되어, 제1 신호 섹션(520)과 제2 신호 섹션(540) 사이의 유사성을 기술하는 유사성 정보를 얻는다. 다시, 제1 신호 섹션(520)의 블록들 또는 부분들은 제1 제로 크로싱 값 시퀀스의 개별 값들에 의해 표현되고, 제2 신호 섹션(540)의 블록들 또는 부분들은 제2 제로 크로싱 값 시퀀스의 개별 값들에 의해 표현된다.

추가 결론을 내자면, 제1 신호 및 제2 신호의 상당수의 개별 샘플 값들을 각각 포함하는 전체 신호 섹션들(520, 540)의 비교가 제로 크로싱 값 시퀀스들의 비교로 대체된다. 그러나 제로 크로싱 값 시퀀스의 값들의 수는 일반적으로 제로 크로싱 값 시퀀스에 의해 표현된 신호 섹션의 신호 샘플 값들의 수보다 훨씬 더 작다. 예를 들어, 신호 섹션을 표현하는 데 필요한 제로 크로싱 값들의 수는 신호 섹션의 시간 이산 표현의 신호 샘플들의 수보다 10배 또는 심지어 더 큰 배수만큼 더 작을 수 있다. 따라서 제로 크로싱 값 시퀀스들의 비교는 신호 샘플 값들에 의해 표현된 신호 섹션들의 비교보다 훨씬 더 적은 시간이 걸린다.

6. 도 6에 따른 예

도 6은 예를 들어, 오디오 신호 또는 비디오 신호와 같은 신호로부터 제로 크로싱 값들을 어떻게 도출하는지의 개략적인 표현을 도시한다.

신호의 섹션은 참조 번호(610)로 표현된다. 가로 좌표(612)는 시간을 기술하고, 세로 좌표(614)는 신호 값들을 기술한다. 신호의 시간 전개는 곡선(620)에 의해 기술된다.

곡선이 시간 연속 곡선(620)으로 도시되더라도, 신호는 당연히 충분한 시간 분해능을 갖는 시간 이산 샘플들로도 또한 표현될 수 있다. 그러나 신호 섹션(630)은 비교를 위해 (임의로) 정의된다. 시작 시간(t₀)에 의해 그리고 종료 시간(t₃)에 의해 정의된 이 신호 섹션(630)은 t₀ 시간에 시작하여 t₁ 시간에 끝나는 제1 블록(632), t₁ 시간에 시작하여 t₂ 시간에 끝나는 제2 블록(634), 그리고 t₂ 시간에 시작하여 t₃ 시간에 끝나는 제3 블록(636)인 3개의 시간 부분들 또는 블록들로 세분된다. 확인될 수 있듯이, 제로 크로싱들은 쉽게 식별될 수 있다. 제로 크로싱들은 고려 중인 신호의 값이 "제로 라인", 즉 세로 좌표(612)를 가로지르는 지점들이다. 상승 제로 크로싱들은 하강 제로 크로싱들과 구별될 수 있다. 예를 들어, 상승 제로 크로싱은 신호 값이 제로인 지점이며, 여기서 신호 값은 상기 제로 크로싱 직전에 음이고, 신호 값은 제로 크로싱 직후에 양이므로 시간 연속 신호들에 대해 쉽게 결정될 수 있다. 그러나 시간 이산 신호들의 경우, 제1 샘플이 음의 값을 취하고 바로 다음 샘플 값이 양의 값을 취한다면 제로 크로싱이 식별될 수 있다. 제1 샘플 값이 음의 값을 취하고, 직후 샘플 값이 제로 값을 취하며, 다른 바로 다음 샘플 값이 양의 값을 취한다면 상승 제로 크로싱이 또한 식별될 수 있다.

신호 값이 제로 크로싱 직전에 양이고 신호 값이 제로 크로싱 직후에 음인 경우에 신호 값이 제로 값을 취하는 지점에 하강 제로 크로싱이 있다. 이것은 시간 연속 신호들에 대해 쉽게 식별될 수 있다. 시간 이산 신호들의 경우, 제1 샘플 값이 양의 값을 취하고 바로 다음 제2 샘플 값이 음의 값을 취한다고 확인된다면 하강 제로 크로싱이 식별될 수 있다. 또한, 특별한 경우로서, 제1 샘플 값이 양의 값을 취하고, 바로 다음의 제2 샘플 값이 제로 값을 취하며, 다른 바로 다음의 제3 샘플 값이 음의 값을 취한다면, 하강 제로 크로싱이 식별될 수 있다.

예를 들어, 제1 블록(632)을 참조하면, ("x"로 표시된) 3개의 상승 제로 크로싱이 식별될 수 있다. 또한, ("·"로 표시된) 3개의 하강 제로 크로싱이 식별될 수 있다. 앞서 언급한 바와 같이, (예를 들어, 아날로그 회로를 사용하는) 시간 연속 신호들에 대해 그리고 (예를 들어, 앞서 논의한 바와 같이, 디지털 평가를 사용하는) 시간 이산 신호들에 대해 모두 식별이 가능하다.

제2 블록(634)을 참조하면, 6개의 상승 제로 크로싱들 및 5개의 하강 제로 크로싱들이 식별될 수 있다고 확인될 수 있다. 제3 블록(636)에서, 4개의 상승 제로 크로싱들 및 5개의 하강 제로 크로싱들이 식별될 수 있다.

제로 크로싱 값 결정기 및 제로 크로싱 값 시퀀스 비교부의 실제 구현에 따라, 서로 다른 블록들 내의 상승 제로 크로싱들의 수 및/또는 개별 블록들 내의 하강 제로 크로싱들의 수가 개별 특징들로 간주될 수 있다. 일부 실시예들에서, 서로 다른 블록들에서의 상승 제로 크로싱들의 수만이 평가된다. 다른 실시예들에서는, 개별 블록들에서의 하강 제로 크로싱들의 수만이 평가된다. 일부 실시예들에서는, 개별 블록들 내의 상승 제로 크로싱들의 수와 개별 블록들에서의 하강 제로 크로싱들의 수 모두가 평가된다. 그러나 일부 다른 실시예들에서는, (서로 다른 블록들 내의 총 제로 크로싱들의 수는 제로 크로싱 값 시퀀스를 구성한다는 점에서) 개별 블록들에서의 총 제로 크로싱들의 수가 평가된다.

(숫자들 6, 11 및 9의 시퀀스의 형태로) 제로 크로싱 값 시퀀스의 일례가 참조 번호(650)에서 도시된다.

따라서 제로 크로싱 값 시퀀스(6, 11, 9)는 예를 들어, "섹션 1"(630)과 연관될 수 있다. 신호의 또는 다른 신호의 다른 섹션은 다른 제로 크로싱 값 시퀀스에 의해(예를 들어, 시퀀스(7, 12, 8)에 의해) 표현될 수 있다. 당연히, 제로 크로싱 값 시퀀스들은 서로 다른 길이들을 취할 수도 있다.

결과적으로, 제로 크로싱 값 시퀀스 비교부에 의해 수행되는 비교는 단일 신호의 서로 다른 섹션들과 연관된 또는 비교될 서로 다른 신호들의 섹션들과 연관된 제로 크로싱 값 시퀀스들에 기초하여 수행될 수 있다.

7. 도 7에 따른 방법

도 7은 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 방법의 개략적인 블록도를 도시한다. 이 방법(700)은 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 부분들에 대한 입력 신호의 각각의 부분에서의 제로 크로싱들의 수를 기술하는 제로 크로싱 정보를 결정하는 단계(710)를 포함한다. 이 방법(700)은 또한, 유사성 정보를 결정하기 위해 제로 크로싱 정보에 기초하여 비교를 수행하는 단계(720)를 포함한다.

이 방법(700)은 장치들(100, 200, 300)과 관련하여 앞서 논의한 것과 동일한 고려 사항들에 기초한다는 점이 주목되어야 한다. 또한, 이 방법(700)은 예를 들어, 각각의 장치들과 관련하여 본 명세서에서 설명한 특징들 및 기능들 중 임의의 것으로 보완될 수 있다.

8. 애플리케이션들

본 발명에 따른 실시예들은 다양한 기술 장치들에 적용될 수 있다. 예를 들어, 앞서 설명한 장치들은 오디오 신호, 비디오 신호, 물리적 센서로부터의 센서 신호, 또는 임의의 다른 전기 또는 광 신호들을 분석하기 위한 신호 분석기에서 사용될 수 있다. 마찬가지로, 본 명세서에서 설명한 장치들은 오디오 신호, 비디오 신호, 물리적 양을 감지하는 물리적 센서로부터의 센서 신호, 또는 다른 전기 신호 또는 광 신호를 처리하기 위한 신호 프로세서에 사용될 수 있다.

일례로, 본 명세서에서 설명한 장치는 오디오 신호들을 정렬하기 위한 오디오 프로세서에서 사용될 수 있다. 대안으로, 본 명세서에서 설명한 장치는 피치 결정에 사용될 수 있으며, 본 명세서에서 설명한 장치는 서로 다른 신호 섹션들을 비교하는 것을 포함하는 "자기 상관" 기능을 수행할 수 있다.

그러나 오디오 인코더 또는 오디오 디코더와 함께 본 명세서에서 설명한 장치의 많은 다른 애플리케이션들이 구현될 수 있다.

9. 추가 양상들 및 결론들

본 발명에 따른 실시예들은 블록 내에서의 (예를 들어, 부호 변화로서 정의된) 제로 크로싱들의 수가 매우 견고한 추정들을 위한 대표 값으로서 식별되었다는 결론에 기초한다. 예를 들어, 블록 내의 상기 제로 크로싱들의 수를 나타내는 값은 "주변" 샘플들(예를 들어, 각각의 블록의 샘플들)의 수를 나타낼 수 있다. 기호의 모든 변경들(또는 모든 제로 크로싱들)이 사용되는지, 아니면 단지 음에서 양으로(상승 제로 크로싱들), 또는 양에서 음으로(하강 제로 크로싱들) 변경되는지가 단지 부수적으로 중요한 것으로 밝혀졌다. 따라서 대표(예를 들어, 입력 신호의 블록의 샘플들을 나타내는 값)는 (입력 신호의) 그 블록에서의 부호의 변화들의 수를 포함한다. 이 방법이 기능하기 위해서는, 카운팅(예를 들어, 제로 크로싱들을 카운팅)하기 전에 신호로부터(예를 들어, 입력 신호로부터 또는 다수의 입력 신호들로부터) 상수 성분(DC 성분)이 제거되는 것이 바람직하다. 상수 성분의 이러한 제거는 "DC 제거" 또는 "DC 필터링"으로 간주될 수 있다.

대표들의 데이터 스트림들(즉, 예를 들어, 제로 크로싱 값 시퀀스들과 같은 하나 또는 그보다 많은 신호들의 서로 다른 블록들에서의 제로 크로싱들의 수를 나타내는 값들을 포함하는 데이터 스트림들)이 교차 상관에(예를 들어, 비교부(120)에 또는 제로 크로싱 값 시퀀스 비교부(220, 330)에) 공급되어, 스트림들 사이의 레이턴시(예를 들어, 서로 다른 제로 크로싱 값 시퀀스들 사이의 레이턴시)를 계산할 수 있다. 이어서, 결과들이 (예를 들어, 샘플에서의 입력 신호의 블록 크기를 나타내는) 블록 크기(n)와 곱해져 실제 오프셋(예를 들어, 샘플들의 관점에서 2개의 입력 신호들 사이의 시간 시프트)에 도달할 수 있다.

교차 상관이 유효한 결과를 제공할 수 있도록, 상수 성분(예를 들어, "DC 성분") 또는 평균 또한 두 데이터 스트림들로부터(예컨대, 두 제로 크로싱 값 시퀀스들 모두로부터) 제거되어야 한다. 이는 예를 들어, DC 제거/필터링(226)에 의해 또는 DC 제거/필터링(326, 328)에 의해 수행될 수 있다. 총 제로 크로싱들의 수가 사용된다면, 모든 값들이 양수(또는 일부 예외적인 경우들에는 제로)일 수 있다. 그러나 일련의 양수 값들을 사용하는 경우, 어떤 경우들에는 상관으로부터 의미 있는 결과가 얻어질 수 없다.

그러나 본 명세서에서 설명한 방법은 교차 상관에 한정되지 않는다. 이는 또한 자기 상관을 사용하는 애플리케이션들에 사용될 수도 있다. 예를 들어, 제로 크로싱 값 시퀀스 비교부(220)가 참조되는데, 이는 예를 들어 그러한 자기 상관을 이용할 수 있다.

방법의 선택적 확장으로서, 블록당 2개의 대표들이 사용될 수 있다. 예를 들어, 하나의 대표는 양에서 음으로의 변화들의 수(예를 들어, 블록 내에서의 하강 제로 크로싱들의 수)를 개별적으로 저장(또는 표현)할 수 있고, 하나의 대표는 음에서 양으로의 변화들의 수(예를 들어, 상승 제로 크로싱들)를 개별적으로 저장(또는 표현)할 수 있다. 동시에 상관들을 실행하기에 추가 처리 능력이 이용 가능하다면(여기서 하나의 상관은 상승 제로 크로싱들의 수를 나타내는 제로 크로싱 값 시퀀스들에 대해 동작할 수 있고, 하나의 상관은 하강 제로 크로싱들의 수를 나타내는 제로 크로싱 값 시퀀스에 대해 동작할 수 있음), 견고성이 더 증가되는데, 이는 두 결과들이 비교될 수 있고 신뢰도 측정치가 얻어질 수 있기 때문이다. 어떤 경우들에는, 두 값들이 거의 동일하다는 점이 주목되어야 한다. 그러나 어떤 경우들에는, 이 개념이 도움이 된다. 따라서 추가 특징들이 사용된다면, 다음에 설명되는 바와 같이, 특징들이 다른 것이 간혹 바람직하다.

테스트 결과들은 이러한 방법들에서, 블록 크기가 견고성과 관련하여 뒷전으로 물러남을 보여주었다. 그러므로 주요(또는 때로는 유일한) 결정 요인은 각각의 애플리케이션에 대해 어떤 정확도가 달성되는지이다.

본 명세서에서 설명된 장치들 및 방법들은 상관될 모든 신호 타입들에 대해 사용될 수 있다는 점이 또한 주목되어야 한다. 본 명세서에서 설명된 개념은 오디오 신호들에 사용될 때 특히 유리한 결과들을 가져오지만, 이러한 개념은 오디오 애플리케이션들에만 국한되지 않는다.

다음에, 일부 선택적인 확장들이 설명될 것이다.

특히, 하나 또는 그보다 많은 추가 특징들이 본 명세서에 설명된 실시예들에서 선택적으로 사용될 수 있다.

본 명세서에 설명된 방법은 서로 다른 특징들을 사용함으로써 변경 및 확장될 수 있다. 예를 들어, 오디오 신호 처리에서, 신호를 기술하는 데 사용될 수 있는 신호로부터 계산된 값들은 특징들로서 식별된다. 이는 제로 크로싱들의 수 또는 제로 크로싱 레이트를 포함한다. 둘 다 본 발명의 실시예들에서 등가적으로 사용될 수 있다. 다르게 말하면, 본 명세서에서 언급된 제로 크로싱 값들은 입력 신호의 각각의 부분에서의 제로 크로싱들의 수 또는 입력 신호의 블록에서 시간 단위당 제로 크로싱들의 (평균) 개수를 기술할 수 있다.

더욱이, (시간 도메인에서의) 제로 크로싱들의 수로부터 계산될 수 있는 특징들 외에도, 다른 특징들이 또한 시간 도메인에서 또는 주파수 도메인에서 계산될 수 있다. 추가 특징들 또는 특징 값들의 이러한 결정은 예를 들어, 도 3의 참조 번호(350)에서 도시된다. 주파수 도메인에서의 계산을 위해, 샘플들의 각각의 블록은 이산 푸리에 변환(또는 다른 주파수 도메인 변환 또는 시간 도메인 대 주파수 도메인 변환)을 사용함으로써 주파수 도메인으로 전달될 수 있고, 특징들 또는 특징 값들은 계산된 스펙트럼으로부터 결정된다. 이러한 특징들은 예를 들어, 스펙트럼 평탄도 측정치 및/또는 스펙트럼 플럭스(또는 스펙트럼 플럭스 값들)를 포함한다. 스펙트럼 플럭스는 2개의 후속 스펙트럼들 사이의(예를 들어, 입력 신호의 후속 블록들과 연관된 스펙트럼들 사이의) 변화의 측정치이고, 두 스펙트럼들의 차이의 벡터 노름(예컨대, L2 노름)으로부터 또는 두 스펙트럼 벡터들 간의 거리 측정치로부터 계산된다. 추가 가능한 특징들은 LPC 계수들(선형 예측 코딩 계수들)을 포함한다.

더욱이, 하나 또는 그보다 많은 입력 신호들을 다운샘플링함으로써 얻어진 값들은 (제로 크로싱 값들에 부가하여) 추가 특징들로서 사용될 수 있다. 간단한 다운샘플링과는 별도로, 다른 대표 값들이 사용될 수 있다. 예들은 블록의 에너지, 샘플들의 평균값들 또는 파고율(crest factor)을 포함한다. 블록들의 이러한 표현들이 테스트 데이터의 광범위한 세트에 대해 단독으로 취할 때 신뢰할 수 있는 결과들을 제공하지 않더라도, 이들은 제로 크로싱 값들을 추가 특징 값들로 보완할 수 있다.

그러나 하나 또는 그보다 많은 입력 신호들에 기초하여 블록(또는 부분)의 주파수 도메인 표현으로부터 다른 특징 값들이 또한 추출될 수 있다는 점이 주목되어야 한다. 예를 들어, 스펙트럼 최대 값의 위치는 특징 값으로 표현될 수 있다. 대안으로, 스펙트럼 피크들의 수가 특징 값에 의해 표현될 수 있다. 다른 옵션으로서, 스펙트럼이 주파수 상에서 어떻게 변하는지를 기술하는 스펙트럼 기울기가 특징 값에 의해 표현될 수 있다.

제로 크로싱 값 시퀀스 그리고 제로 크로싱 값들과는 다른 특징들을 나타내는 추가 특징 값들을 포함하는 특징 값 시퀀스가 비교에 사용된다는 점에서 특징 값 시퀀스 비교에서(예를 들어, 특징 값 시퀀스 비교부(220)에 또는 특징 값 시퀀스 비교부(330)에서) 이러한 추가 특징들 또는 특징 값들이 사용될 수 있다.

추가 기능들이 선택적으로 시간 오프셋을 계산하기 위해 사용될 수 있다는 점이 주목되어야 한다. 이러한 추가 기능들은 자기 상관 또는 교차 상관에 추가로, 또는 자기 상관 또는 교차 상관에 대한 대체로서 사용될 수 있다. (예를 들어, 2개의 입력 신호들 사이의) 시간 오프셋을 결정하기 위해, 상관 함수가 계산될 수 있다.

대안으로, "평균 크기 차이 함수"(AMDF: average magnitude difference function)가 결정될 수 있다.

원칙적으로, 시간 오프셋은 신호의(또는 신호의 섹션의) 표현인 x(t)를 시간 시프트된 표현인 x(t + d)와 비교함으로써 결정될 수 있으며, 여기서 변수 d는 시간 오프셋이다. 예를 들어, x₁(t)는 x₁(t+d) 또는 x₂(t+d)와 비교될 수 있으며, 여기서 x₁은 제1 신호이고 x₂는 제2 신호이다. 표현(x)은 본 명세서에 설명된 본 발명에 따라 신호(또는 2개 또는 그보다 많은 신호들 중 하나) 또는 다운샘플링된 신호 또는 특징 기반 표현일 수 있다. 시간 오프셋은 d에 대응하는데, 이는 x(t)와 x(t+d) 사이의(또는 x₁(t)와 x₂(t+d) 사이의) 유사성을 최대화한다.

블록으로부터의 각각의 샘플을 시간 시프트된 블록으로부터의 각각의 샘플과 곱함으로써 그리고 이어서 모든 곱들을 합산함으로써 상관이 계산될 수 있다. 이는 두 블록들을 벡터들로 간주할 때 이러한 스칼라 곱(내적)에 대응한다.

대안적인 유사성 측정치들, 예를 들어 L1 노름 또는 유클리드 거리가 사용될 수 있다. L1 노름을 사용할 때, x(t)와 x(t+d) 사이의 또는 x₁(t)와 x₁(t+d) 사이의 또는 x₁(t)와 x₂(t+d) 사이의 엘리먼트별 차이의 평균값이 계산된다.

즉, 입력 신호(x₁)를 기초로 자기 상관을 수행하기 위해, "자기 상관 래그" d의 서로 다른 값들에 대해 신호 부분들 x₁(t)와 x₁(t+d) 사이의 유사성이 결정되어야 하며, 어떤 d에 대해 결과적인 유사성 값이 최대 값을 취하는지가 결정되어야 한다. x₁(t)는 제1 제로 크로싱 값 시퀀스에 의해 표현되고, x₁(t+d)는 제2 제로 크로싱 값 시퀀스에 의해 표현되며, 제2 제로 크로싱 값 시퀀스는 선택된 d로부터 의존적이다. 서로 다른 값들의 d에 대해 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 값 시퀀스를 비교함으로써, 어떤 d 값에 대해 (단지 서로 다른 값들(d)에 대해 신호(x₁)에 모두 속하는) 제1 제로 크로싱 값 시퀀스와 제2 제로 크로싱 시퀀스가 가장 유사한지가 결정될 수 있다. 결과적으로, 유사성을 최대화하는 d의 값이 결정될 수 있다.

대안으로, x₁(t) 및 x₂(t)의 2개의 입력 신호들 간의 교차 상관이 결정될 수 있다. 예를 들어, x₁(t) 및 x₂(t+d)와 연관된 제로 크로싱 값 시퀀스들을 비교함으로써 서로 다른 d 값들에 대해 x₁(t) 및 x₂(t+d)와 연관된 신호 섹션들이 비교될 수 있다. 각각의 제로 크로싱 값 시퀀스들의 비교 결과는 각각의 신호들(x₁(t) 및 x₂(t+d))의 유사성에 대해 양호한 결론을 가능하게 한다.

따라서 (예를 들어, 자기 상관, 교차 상관 또는 임의의 다른 비교 함수를 사용하여) 제로 크로싱 값 시퀀스들을 비교함으로써, 기반이 되는 신호 부분들 x₁(t)와 x₁(t+d) 또는 x₁(t)와 x₂(t+d) 사이의 직접 비교의 양호한 추정치인 수치 결과가 얻어질 수 있다.

다음에는, 몇 가지 추가 설명들이 제공될 것이며, 일부 추가 선택적인 확장들이 간략하게 논의될 것이다.

샘플 정확도의 상관도 샘플 데이터에 사용될 때 오검출들(잘못된 검출들)을 초래했다는 점이 주목되어야 한다. 본 명세서에서 논의된 제로 크로싱 방법을 사용하면 이러한 잘못된 검출들은 나타나지 않는다. 따라서 초기에 제로 크로싱 방법을 사용하는 것에 기반하는 반복 개념 또는 방법을 사용함으로써, 샘플 정확도의 상관 결과가 개선될 수 있다. 예를 들어, 본 명세서에서 설명된 제로 크로싱 접근 방식을 사용하여 보다 대략적인 결과가 얻어졌다면, 샘플 정확도의 상관이 사용될 수 있다. 따라서 본 명세서에서 설명된 개념은 또한 계산 노력을 최적화하는 것 이상의 이점, 즉 알고리즘 이점을 포함할 수 있다.

더욱이, 본 명세서에 개시된 실시예들은 상관 결과에 대한 신뢰도 정보를 결정하는 신뢰도 검사 블록(또는 단계)에 의해 선택적으로 보완될 수 있다. 예를 들어, 스펙트럼 평탄도 또는 스펙트럼 평탄도 측정치가 상관 결과에 대해(예를 들어, 자기 상관 함수에 대해 또는 교차 상관 함수에 대해) 계산될 수 있다. 스펙트럼 평탄도의 측정치는 상관 결과들의 품질에 대한 품질 측정치로서의 역할을 한다. 피크가 그 주변 이상으로 상승할수록 결과가 더 안정적이다. 즉, 신뢰성 검사 블록은 자기 상관 함수(예컨대, 자기 상관 함수(222))의 또는 교차 상관 함수(예컨대, 교차 상관 함수(332))의 스펙트럼 평탄도의 측정치를 계산할 수 있고, (각각의 상관 함수의 신뢰도를 기술하는) 신뢰도 정보를 스펙트럼 평탄도의 측정치로부터 도출할 수 있다.

더욱이, 본 명세서에 개시된 실시예들은 반복 탐색을 수행하도록 선택적으로 확장될 수 있다. 예를 들어, (예를 들어, 적어도 하나의 입력 신호의 부분들의) 비교적 큰 블록 크기가 제1 단계에서 사용될 수 있어, 제로 크로싱 값들 각각이 그러한 비교적 큰 블록을 나타낸다. 이에 따라, (예를 들어, 유사성 정보의) 대략적 결과가 얻어질 수 있는데, 이는 작은 시간 시프트들에 별로 민감하지 않다. 후속하여, 정제된(refined) 유사성 정보를 얻기 위해 (예를 들어, 적어도 하나의 입력 오디오 신호의 부분들의) 비교적 더 작은 블록 크기가 (예를 들어, 제2 단계에서) 사용될 수 있다. 제2 단계에서 사용되는 탐색 범위(예를 들어, 제로 크로싱 값 시퀀스가 계산되는 범위)는 제1 단계의 결과에 좌우될 수 있다. 이에 따라, (각각의 제로 크로싱 값이 연관되는) 비교적 큰 블록들 및 이에 따라 비교적 큰 탐색 범위를 사용하는 제1 단계는 제2 단계에서 사용된 탐색 범위를 결정하는 데 사용될 수 있으며, 제2 단계에서의 탐색 범위는 (예를 들어, 제2 단계에서 사용되는 더 작은 블록 크기로 인해) 제1 단계에서의 탐색 범위보다 더 작을 수 있다.

결론적으로, 제로 크로싱 값들 또는 제로 크로싱 값 시퀀스들의 사용이 하나 또는 그보다 많은 기술적으로 의미 있는 신호들(예를 들어, 오디오 신호들, 비디오 신호들 등)의 자기 상관 또는 교차 상관의 결과를 근사화할 수 있게 하는 여러 실시예들이 설명되었으며, 복잡도는 작게 유지될 수 있고, 결과들의 품질은 일반적으로 매우 우수하다.

본 발명에 따른 실시예들은 앞서 언급한 바와 같이, 레이턴시의 측정을 위해 사용될 수 있다는 점이 또한 주목되어야 한다.

10. 구현 대안들

일부 양상들은 장치와 관련하여 설명되었지만, 이러한 양상들은 또한 대응하는 방법의 설명을 나타내며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다는 점이 명백하다. 비슷하게, 방법 단계와 관련하여 설명한 양상들은 또한 대응하는 장치의 대응하는 블록 또는 항목 또는 특징의 설명을 나타낸다. 방법 단계들의 일부 또는 전부가 예를 들어, 마이크로프로세서, 프로그래밍 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해(또는 사용하여) 실행될 수도 있다. 일부 실시예들에서, 가장 중요한 방법 단계들 중 하나 또는 그보다 많은 단계가 이러한 장치에 의해 실행될 수도 있다.

특정 구현 요건들에 따라, 본 발명의 실시예들은 하드웨어로 또는 소프트웨어로 구현될 수 있다. 구현은 각각의 방법이 수행되도록 프로그래밍 가능 컴퓨터 시스템과 협력하는(또는 협력할 수 있는) 전자적으로 판독 가능 제어 신호들이 저장된 디지털 저장 매체, 예를 들어 플로피 디스크, DVD, 블루레이, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리를 사용하여 수행될 수 있다. 따라서 디지털 저장 매체는 컴퓨터 판독 가능할 수도 있다.

본 발명에 따른 일부 실시예들은 본 명세서에서 설명한 방법들 중 하나가 수행되도록, 프로그래밍 가능 컴퓨터 시스템과 협력할 수 있는 전자적으로 판독 가능 제어 신호들을 갖는 데이터 반송파를 포함한다.

일반적으로, 본 발명의 실시예들은 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때, 방법들 중 하나를 수행하기 위해 작동하는 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 프로그램 코드는 예를 들어, 기계 판독 가능 반송파 상에 저장될 수 있다.

다른 실시예들은 기계 판독 가능 반송파 상에 저장된, 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.

즉, 본 발명의 방법의 한 실시예는 이에 따라, 컴퓨터 상에서 컴퓨터 프로그램이 실행될 때 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.

따라서 본 발명의 방법들의 추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함하여 그 위에 기록된 데이터 반송파(또는 디지털 저장 매체, 또는 컴퓨터 판독 가능 매체)이다. 데이터 반송파, 디지털 저장 매체 또는 레코딩된 매체는 통상적으로 유형적이고 그리고/또는 비-일시적이다.

따라서 본 발명의 방법의 추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 신호들의 데이터 스트림 또는 시퀀스이다. 신호들의 데이터 스트림 또는 시퀀스는 예를 들어, 데이터 통신 접속을 통해, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.

추가 실시예는 처리 수단, 예를 들어 본 명세서에서 설명한 방법들 중 하나를 수행하도록 구성 또는 적응된 컴퓨터 또는 프로그래밍 가능 로직 디바이스를 포함한다.

추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.

본 발명에 따른 추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기에(예를 들어, 전자적으로 또는 광학적으로) 전송하도록 구성된 장치 또는 시스템을 포함한다. 수신기는 예를 들어, 컴퓨터, 모바일 디바이스, 메모리 디바이스 등일 수도 있다. 장치 또는 시스템은 예를 들어, 컴퓨터 프로그램을 수신기에 전송하기 위한 파일 서버를 포함할 수도 있다.

일부 실시예들에서, 프로그래밍 가능 로직 디바이스(예를 들어, 필드 프로그래밍 가능 게이트 어레이)는 본 명세서에서 설명한 방법들의 기능들 중 일부 또는 전부를 수행하는 데 사용될 수 있다. 일부 실시예들에서, 필드 프로그래밍 가능 게이트 어레이는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위해 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법들은 바람직하게 임의의 하드웨어 장치에 의해 수행된다.

본 명세서에서 설명한 장치는 하드웨어 장치를 사용하여, 또는 컴퓨터를 사용하여, 또는 하드웨어 장치와 컴퓨터의 결합을 사용하여 구현될 수도 있다.

본 명세서에서 설명된 장치 또는 본 명세서에서 설명된 장치의 임의의 컴포넌트들은 적어도 부분적으로는 하드웨어로 그리고/또는 소프트웨어로 구현될 수 있다.

본 명세서에서 설명한 방법들은 하드웨어 장치를 사용하여, 또는 컴퓨터를 사용하여, 또는 하드웨어 장치와 컴퓨터의 결합을 사용하여 수행될 수도 있다.

본 명세서에서 설명한 방법들 또는 본 명세서에서 설명한 장치의 임의의 컴포넌트들은 적어도 부분적으로는 하드웨어에 의해 그리고/또는 소프트웨어에 의해 수행될 수 있다.

일 실시예는 본 명세서에서 설명한 바와 같이, 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 장치를 생성한다.

다른 실시예는 본 명세서에서 설명한 또는 청구한 장치의 기능 중 임의의 기능을 수행하기 위한 방법을 생성한다.

다른 실시예는 상기 방법을 수행하기 위한 컴퓨터 프로그램을 생성한다.

앞서 설명한 실시예들은 단지 본 발명의 원리들에 대한 예시일 뿐이다. 본 명세서에서 설명한 배열들 및 세부사항들의 수정들 및 변형들이 다른 당업자들에게 명백할 것이라고 이해된다. 따라서 이는 본 명세서의 실시예들의 묘사 및 설명에 의해 제시된 특정 세부사항들로가 아닌, 첨부된 특허청구범위로만 한정되는 것을 취지로 한다.

Claims

오디오 신호들 또는 비디오 신호들인 하나 또는 그보다 많은 입력 신호들(112; 212; 312, 314)에 기초하여 유사성(similarity) 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300)로서,
상기 장치는 상기 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 신호 블록들에 대한 각각의 신호 블록(422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546)에서의 제로 크로싱(zero crossing)들의 수를 기술하는(describing) 제로 크로싱 정보(114; 214; 322, 324)를 결정하도록 구성되고,
상기 장치는 단일 입력 신호의 서로 다른 섹션들 사이의 또는 비교될 2개의 신호들의 서로 다른 섹션들 사이의 유사성을 기술하는 유사성 정보를 결정하기 위해 상기 제로 크로싱 정보에 기초하여 비교를 수행하도록 구성되며,
섹션은 복수의 신호 블록들을 포함하고,
상기 장치는 복수의 신호 블록들에 대한 신호 블록당 2개 또는 그보다 많은 대표 값들을 결정하도록 구성되고,
상기 2개 또는 그보다 많은 대표 값들은 상기 신호 블록들의 특징(feature)들을 기술하고,
상기 2개 또는 그보다 많은 대표 값들은 제로 크로싱 정보인 제로 크로싱 값을 포함하며; 그리고
상기 장치는 신호 블록마다 결정되는 2개의 대표 값들 중 하나로서 스펙트럼 평탄도(flatness) 측정치를 결정하도록 구성되고, 그리고/또는
상기 장치는 신호 블록마다 결정되는 2개의 대표 값들 중 하나로서 스펙트럼 플럭스 값들을 결정하도록 구성되고,
상기 스펙트럼 플럭스 값들은 단일 정량 값(single quantitative value)의 형태로 2개의 각각의 연속 신호 블록들의 스펙트럼들 사이의 변화를 기술하며;
상기 장치는 상기 유사성 정보를 결정하기 위해 상기 2개 또는 그보다 많은 대표 값들에 기초하여 상기 비교를 수행하도록 구성되고,
상기 장치는 복수의 신호 블록들에 대한 제1 타입의 대표 값들의 시퀀스에 기초하여 제1 비교를 수행하도록, 그리고 상기 복수의 신호 블록들에 대한 제2 타입의 대표 값들의 시퀀스에 기초하여 제2 비교를 수행하도록 구성되며,
상기 장치는 복수의 제로 크로싱 값들을 포함하는 제1 제로 크로싱 값 시퀀스(322; 450)와 복수의 제로 크로싱 값들을 포함하는 제2 제로 크로싱 값 시퀀스(324; 456)를 비교하여, 제1 신호 섹션(420)과 제2 신호 섹션(430) 사이의 유사성을 기술하는 유사성 정보를 얻도록 구성되며,
상기 제1 제로 크로싱 값 시퀀스는 상기 제1 신호 섹션에 대응하고, 상기 제2 제로 크로싱 값 시퀀스는 상기 제2 신호 섹션에 대응하며,
상기 제로 크로싱 값들은 상기 제로 크로싱 정보를 구성하고;
상기 장치는 신뢰도(reliability) 정보를 얻기 위해 상기 제1 비교의 결과와 상기 제2 비교의 결과를 비교하도록 구성되고;
상기 장치는 상기 하나 또는 그보다 많은 입력 신호들(112; 212; 312, 314)로서 하나 또는 그보다 많은 오디오 신호들 또는 하나 또는 그보다 많은 비디오 신호들을 수신하도록 그리고 상기 하나 또는 그보다 많은 오디오 신호들에 기초하여 또는 상기 하나 또는 그보다 많은 비디오 신호들에 기초하여 상기 제로 크로싱 정보(114; 214; 322, 324)를 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 제로 크로싱 정보(114; 214; 322, 324)로서, 상기 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 신호 블록들(422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546)에 대한 총 제로 크로싱들의 수 또는 상승(rising) 제로 크로싱들의 수 또는 하강(falling) 제로 크로싱들의 수를 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 제로 크로싱 정보(114; 214; 322, 324)로서, 상기 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 신호 블록들(422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546)에 대한 제로 크로싱 레이트를 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치(100; 200; 300)는 적어도 하나의 제로 크로싱 값이 상기 하나 또는 그보다 많은 입력 신호들 중 적어도 하나의 입력 신호의 복수의 신호 블록들의 각각의 신호 블록(422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546)과 연관되게 상기 제로 크로싱 정보(114; 214; 322, 324)를 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 제1 신호 섹션(420; 520)에 대한 제1 제로 크로싱 값 시퀀스(114, 214, 322, 450)를 결정하도록 구성되며, 상기 제1 신호 섹션은 복수의 신호 블록들(422, 424, 426; 522, 524, 526)을 포함하고, 상기 제1 제로 크로싱 값 시퀀스는 상기 제1 신호 섹션의 신호 블록들 각각과 연관된 하나 또는 그보다 많은 제로 크로싱 값들을 포함하고; 그리고
상기 장치는 제2 신호 섹션(430: 540)에 대한 제2 제로 크로싱 값 시퀀스(114, 214, 324, 456)를 결정하도록 구성되며, 상기 제2 신호 섹션은 복수의 신호 블록들(432, 434, 436; 542, 544, 546)을 포함하고, 상기 제2 제로 크로싱 값 시퀀스는 상기 제2 신호 섹션의 신호 블록들 각각과 연관된 하나 또는 그보다 많은 제로 크로싱 값들을 포함하는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 제1 제로 크로싱 값 시퀀스(322; 450) 및 상기 제2 제로 크로싱 값 시퀀스(324; 456)를 사용해 상관 값을 계산하여 상기 유사성 정보(122; 222; 332)를 얻도록 구성되거나; 또는
상기 장치는 상기 제1 제로 크로싱 값 시퀀스 및 상기 제2 제로 크로싱 값 시퀀스를 사용해 평균 크기 차이 값을 계산하여 상기 유사성 정보를 얻도록 구성되거나; 또는
상기 장치는 상기 제1 제로 크로싱 값 시퀀스와 상기 제2 제로 크로싱 값 시퀀스 간의 차이의 노름(norm)을 계산하여 상기 유사성 정보를 얻도록 구성되거나; 또는
상기 장치는 상기 제1 제로 크로싱 값 시퀀스와 상기 제2 제로 크로싱 값 시퀀스 간의 유클리드 거리를 계산하여 상기 유사성 정보를 얻도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 제1 제로 크로싱 값 시퀀스 또는 그 일부와 상기 제2 제로 크로싱 값 시퀀스의 복수의 시간 시프트된 버전들 또는 그 시간 시프트된 부분들 사이의 복수의 차이 측정 값들을 계산하여, 상기 제1 제로 크로싱 값 시퀀스 또는 그 일부와 상기 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보(232; 342)를 얻도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 제1 제로 크로싱 값 시퀀스(322; 450) 및 상기 제2 제로 크로싱 값 시퀀스(324; 456)를 사용해 상관 함수를 계산하여, 상기 제1 제로 크로싱 값 시퀀스 또는 그 일부와 상기 제2 제로 크로싱 값 시퀀스의 시간 시프트된 버전 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트에 관한 정보(232; 342)를 얻도록 구성되거나; 또는
상기 장치는 상기 제1 제로 크로싱 값 시퀀스 및 상기 제2 제로 크로싱 값 시퀀스를 사용해 평균 크기 차이 함수를 계산하여, 상기 제1 제로 크로싱 값 시퀀스의 일부와 상기 제2 제로 크로싱 값 시퀀스의 시간 시프트된 부분들을 비교하도록, 그리고 상기 제1 제로 크로싱 값 시퀀스(x1(t); 322; 450)) 또는 그 일부와, 상기 제2 제로 크로싱 값 시퀀스(x2(t); 32; 456)의 시간 시프트된 버전(x2(t+d)) 또는 그 일부 사이의 최대 유사성을 제공하는 시간 시프트(d)에 관한 정보를 얻도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 제1 제로 크로싱 값 시퀀스와 상기 제2 제로 크로싱 값 시퀀스를 비교하기 전에 상기 제1 제로 크로싱 값 시퀀스(114; 214; 322)로부터 그리고/또는 상기 제2 제로 크로싱 값 시퀀스(324)로부터 상수 성분을 제거하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 하나 또는 그보다 많은 입력 신호들(112; 212; 312, 314)로부터 상수 성분을 제거하도록, 그리고/또는 상기 제로 크로싱 정보를 결정하기 전에 상기 하나 또는 그보다 많은 입력 신호들에 고역 통과 필터링을 적용하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
대표 값들은 신호 블록마다, 각각의 신호 블록에서의 상승 제로 크로싱들의 수를 기술하는 양의 제로 크로싱 값과, 각각의 신호 블록에서의 하강 제로 크로싱들의 수를 기술하는 음의 제로 크로싱 값을 포함하는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 각각의 신호 블록의 주파수 도메인 표현을 사용하여 신호 블록마다 결정되는 2개의 대표 값들 중 하나를 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 신호 블록마다 결정되는 2개의 대표 값들 중 하나로서 각각의 신호 블록의 스펙트럼의 평탄도를 기술하는 스펙트럼 평탄도 값들을 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 신호 블록마다 결정되는 2개의 대표 값들 중 하나로서 각각의 신호 블록에 대한 선형 예측 계수(LPC: linear prediction coefficient)들을 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 상기 하나 또는 그보다 많은 입력 신호들(112; 212; 312, 314)로서 하나 또는 그보다 많은 오디오 신호들 또는 하나 또는 그보다 많은 비디오 신호들을 수신하도록 그리고 상기 하나 또는 그보다 많은 오디오 신호들에 기초하여 또는 상기 하나 또는 그보다 많은 비디오 신호들에 기초하여 상기 제로 크로싱 정보(114; 214; 322, 324)를 결정하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는 오디오 신호 또는 비디오 신호에 관한 자기 상관 정보를 얻기 위해 상기 유사성 정보(122; 222; 332)를 사용하도록 구성되거나; 또는
상기 장치는 2개의 오디오 신호들에 대한 또는 2개의 비디오 신호들에 대한 교차 상관 정보를 얻기 위해 상기 유사성 정보를 사용하도록 구성되거나; 또는
상기 장치는 2개의 오디오 신호들 간의 최선의 가능한 정렬을 얻기 위한 시간 시프트(232; 342)를 결정하기 위해, 또는 2개의 비디오 신호들 간의 최선의 가능한 정렬을 얻기 위한 시간 시프트(232; 342)를 결정하기 위해 상기 유사성 정보를 사용하도록 구성되는,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
제1 항에 있어서,
상기 장치는, 상기 하나 또는 그보다 많은 입력 신호들의 유사 영역들 사이의 시간 시프트를 나타내는 정보를 얻기 위해, 제1 단계에서 제1 블록 크기를 사용하여 제1 제로 크로싱 정보를 결정하고 상기 제1 제로 크로싱 정보를 기초로 상기 비교를 수행하도록 구성되고,
상기 장치는, 상기 하나 또는 그보다 많은 입력 신호들의 유사 영역들 사이의 시간 시프트를 나타내는 정제된(refined) 정보를 얻기 위해, 제2 단계에서 제2 블록 크기를 사용하여 제2 제로 크로싱 정보를 결정하도록 구성되며,
상기 제2 제로 크로싱 정보가 결정되는 범위는 상기 제1 단계에서 얻어진 하나 또는 그보다 많은 입력 신호들의 유사 영역들 사이의 시간 시프트를 나타내는 정보에 의존하고, 상기 제2 블록 크기는 상기 제1 블록 크기보다 더 작은,
유사성 정보(122; 222; 332)를 결정하기 위한 장치(100; 200; 300).
오디오 신호들 또는 비디오 신호들인 오디오 신호들 또는 비디오 신호들인 하나 또는 그보다 많은 입력 신호들에 기초하여 유사성 정보를 결정하기 위한 방법(700)으로서,
상기 방법은 하나 이상의 오디오 신호들 또는 하나 이상의 비디오 신호들을 상기 하나 이상의 입력 신호들(112; 212; 312, 314)로서 수신하는 단계를 포함하고;
상기 방법은 상기 하나 이상의 입력 신호들 중 적어도 하나의 복수의 신호 블록들에 대한 신호 블록당 2개 또는 그보다 많은 대표 값들을 결정하는 단계를 포함하고,
상기 2개 또는 그보다 많은 대표 값들은 상기 신호 블록들의 특징들을 기술하고,
상기 2개 또는 그보다 많은 대표 값들은 각각의 신호 블록 내의 복수의 제로 크로싱들을 나타내는 제로 크로싱 정보인 제로 크로싱 값을 포함하며; 그리고
상기 방법은 신호 블록마다 결정되는 2개 또는 그보다 많은 대표 값들 중 하나로서 스펙트럼 평탄도 측정치들을 결정하는 단계를 포함하고, 그리고/또는
상기 방법은 신호 블록마다 결정되는 2개 또는 그보다 많은 대표 값들 중 하나로서 스펙트럼 플럭스 값들을 결정하는 단계를 포함하며,
상기 스펙트럼 플럭스 값은 단일 정량 값의 형태로 2개의 각각의 연속 신호 블록들의 스펙트럼들 사이의 변화를 기술하며;
상기 방법은 상기 유사성 정보를 결정하기 위해 상기 2개 또는 그보다 많은 대표 값들에 기초하여 비교를 수행하는 단계를 포함하고,
상기 방법은 단일 입력 신호의 서로 다른 섹션들 사이의 또는 비교될 2개의 신호들의 서로 다른 섹션들 사이의 유사성을 기술하는 유사성 정보를 결정하기 위해 상기 제로 크로싱 정보에 기초하여 비교를 수행하는 단계(720)를 포함하고;
섹션은 복수의 신호 블록들을 포함하고;
복수의 제로 크로싱 값들을 포함하는 제1 제로 크로싱 값 시퀀스(322; 450)와 복수의 제로 크로싱 값들을 포함하는 제2 제로 크로싱 값 시퀀스(324; 456)가 비교되어, 제1 신호 섹션(420)과 제2 신호 섹션(430) 사이의 유사성을 기술하는 유사성 정보를 얻고,
상기 제1 제로 크로싱 값 시퀀스는 상기 제1 신호 섹션에 대응하고, 상기 제2 제로 크로싱 값 시퀀스는 상기 제2 신호 섹션에 대응하며,
상기 제로 크로싱 값들은 상기 제로 크로싱 정보를 구성하며,
상기 제로 크로싱 정보(114; 214; 322, 324)는 상기 하나 이상의 오디오 신호들 또는 상기 하나 이상의 비디오 신호들에 기초하여 결정되고;
상기 방법은 복수의 신호 블록들에 대한 제1 타입의 대표 값들의 시퀀스에 기초하여 제1 비교를 수행하는 단계를 포함하고, 상기 방법은 상기 복수의 신호 블록들에 대한 제2 타입의 대표 값들의 시퀀스에 기초하여 제2 비교를 수행하는 단계를 포함하며,
상기 방법은 신뢰도 정보를 얻기 위해 상기 제1 비교의 결과와 상기 제2 비교의 결과를 비교하는 단계를 포함하는,
유사성 정보를 결정하기 위한 방법(700).
컴퓨터 프로그램으로서,
상기 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 제18 항에 따른 방법을 수행하기 위한,
컴퓨터 프로그램.
삭제
삭제
삭제
삭제
삭제
삭제
삭제