KR100959050B1

KR100959050B1 - 분리된 신호를 생성하는 시스템 및 방법

Info

Publication number: KR100959050B1
Application number: KR1020087024092A
Authority: KR
Inventors: ?o렁 챈; 에리크 비저
Original assignee: 소프트맥스 인코퍼레이티드
Priority date: 2006-03-01
Filing date: 2007-02-27
Publication date: 2010-05-20
Also published as: JP2009529699A; WO2007103037A3; US20090254338A1; EP1989777A4; US8898056B2; WO2007103037A2; KR20090007304A; EP1989777A2

Abstract

본 발명은 블라인드 신호 분리에 관한 것이다. 더 상세하게, 본 발명은 주파수 도메인 프로세스들을 사용하는 블라인드 소스 분리에 관한 것이다.

분리된 신호, 블라인드 소스 분리

Description

분리된 신호를 생성하는 시스템 및 방법{SYSTEM AND METHOD FOR GENERATING A SEPARATED SIGNAL}

관련 출원에 대한 상호-참조

본 특허 출원은, 2006년 3월 1일자로 출원된 미국 가특허출원 제 60/777,900 호를 우선권 주장하고, 2006년 3월 1일자로 출원된 미국 가특허출원 제 60/777,920 호를 또한 우선권 주장하며, 이들 모두는 여기서 참조로서 그 전체가 포함된다.

발명의 배경

발명의 기술분야

본 발명은 블라인드 (blind) 소스 분리에 관한 것이다. 더 상세하게는, 주파수 도메인 프로세스들을 사용하는 신호들의 블라인드 소스 분리에 관한 것이다.

관련 기술의 설명

어쿠스틱 혼합물들은, 시간-도메인 방법 또는 주파수-도메인 방법 중 어느 하나를 포함할 수도 있는 블라인드 소스 분리 (BSS) 방법을 사용하여 분리될 수 있다. 시간-도메인 방법은 더 양호한 분리 성능을 달성할 수도 있지만, 비교가능한 주파수-도메인 방법보다 더 많은 계산을 요구할 수도 있다. 또한, 시간-도메인 방법에서 모든 필터 탭 적응성이 모든 다른 탭들에 의존하므로, 수렴 (convergence) 이 느려지고 로컬 최소값 (local minima) 으로 되는 경향이 있을 수 도 있으며, 따라서, 양호한 초기화에 매우 의존할 수도 있다.

따라서, 계산 시간을 감소시키고 및/또는 솔루션 수렴을 개선시키면서, 개선된 신호 분리를 초래할 수 있는 디바이스 및 방법에 대한 필요성이 존재한다.

발명의 요약

몇몇 실시형태에서, 본 발명은 신호 분리 방법에 관한 것이며, 그 방법은, 주파수-도메인 제 1 신호들의 세트를 수신하는 단계로서, 그 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 그 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 그 수신하는 단계; 그 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 단계로서, 그 주파수-도메인 제 2 신호들의 세트는 그 복수의 주파수들의 개별 주파수들에 대응하는 분리된 주파수-도메인 제 2 신호 엘리먼트들의 세트를 포함하고, 그 주파수-도메인 제 2 신호 엘리먼트들 각각은, 주파수-도메인 제 2 신호들의 어떤 세트가 주파수-도메인 제 2 신호 엘리먼트를 포함하는지를 나타내는 식별자를 할당받는, 그 분리하는 단계; 및 주파수-도메인 제 3 신호들의 세트를 생성하기 위해 그 주파수-도메인 제 2 신호들의 코히런스 (coherence) 를 개선시키도록 적어도 하나의 주파수에 대응하는 식별자들을 재순서화하는 단계를 포함한다.

그 주파수-도메인 제 1 신호들의 세트를 분리하는 단계는 블라인드-소스 분리 방법을 포함할 수도 있다. 그 블라인드-소스 분리 방법은 개별 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들에 적용될 수도 있다. 그 코히런 스는 상이한 주파수들에서의 공동-활성도 (co-activity) 를 반영하는 함수를 포함할 수도 있다. 그 주파수-도메인 제 2 신호들의 코히런스를 개선시키는 것은 그 주파수-도메인 제 2 신호들의 코히런스를 최적화하는 것을 포함할 수도 있다. 그 주파수-도메인 제 2 신호들의 코히런스를 개선시키는 것은 인접한 주파수-도메인 제 2 신호 엘리먼트들의 쌍의 코히런스를 개선시키는 것을 포함할 수도 있다. 그 식별자들을 재순서화하는 단계는 복수의 주파수들에 대응하는 식별자들을 재순서화하는 단계를 포함할 수도 있다. 그 식별자들을 재순서화하는 단계는, 그 복수의 주파수들 중 낮은 주파수로부터 그 복수의 주파수들 중 높은 주파수로 그 식별자들을 순차적으로 재순서화하는 단계를 더 포함할 수도 있다. 그 식별자들을 재순서화하는 단계는 복수의 주파수들에 대응하는 식별자들을 재순서화하는 단계를 포함할 수도 있다. 그 식별자들을 재순서화하는 단계는 주파수-도메인 제 2 신호 엘리먼트들의 비-중첩 쌍들 사이의 코히런스를 개선시키는 단계를 더 포함할 수도 있다. 그 주파수-도메인 제 2 신호들의 코히런스를 개선시키는 것은, 주파수들의 제 1 서브세트에 대응하는 주파수-도메인 제 2 신호 엘리먼트들의 코히런스를 최적화하는 것, 및 주파수들의 제 2 서브세트에 대응하는 주파수-도메인 제 2 신호 엘리먼트들의 코히런스를 최적화하는 것을 포함할 수도 있으며, 여기서, 그 주파수들의 제 2 서브세트는 그 주파수들의 제 1 서브세트보다 크고, 그 주파수들의 제 2 서브세트는 그 주파수들의 제 1 서브세트를 포함한다. 몇몇 실시형태에서, 여기에 개시된 방법은 시간-도메인 입력 신호들의 세트를 변환하여 주파수-도메인 제 1 신호들의 세트를 생성하는 단계를 더 포함할 수도 있다. 그 시간-도메인 입력 신호들은 어쿠스틱 신호 혼합물들일 수도 있다. 그 어쿠스틱 신호 혼합물은 스피치 신호를 포함할 수도 있다. 몇몇 실시형태에서, 여기에 개시된 방법은 주파수-도메인 제 3 신호들의 세트의 주파수-도메인 제 3 신호를 역변환하여 원하는 신호를 생성하는 단계를 더 포함할 수도 있다.

몇몇 실시형태에서, 본 발명은 신호 분리 방법에 관한 것이며, 그 방법은, 주파수-도메인 제 1 신호들의 세트를 수신하는 단계로서, 그 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 그 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 그 수신하는 단계; 학습 법칙 (learning rule) 을 포함하는 독립적인 벡터 분석 (IVA) 방법을 사용하여, 그 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 단계; 및 하나 이상의 제약들을 그 학습 법칙에 적용하는 단계를 포함한다.

그 하나 이상의 제약들은 그 주파수-도메인 제 2 신호들의 세트로부터 유도될 수도 있다. 그 학습 법칙에 하나 이상의 제약들을 적용하는 단계는 로컬 최소값 또는 최대값으로 수렴하는 확률을 감소시킬 수도 있다. 여기에 개시된 방법은, 주파수-도메인 제 1 신호들의 제 2 세트를 수신하는 단계, 및 제약된 신호 분리 방법을 사용하여 그 주파수-도메인 제 1 신호들의 제 2 세트를 분리하는 단계를 더 포함할 수도 있다. 그 하나 이상의 제약들은 기하학적 제약들을 포함할 수도 있다. 그 기하학적 제약들은 추정된 도달 방향 정보를 포함할 수도 있으며, 여기서, 그 도달 방향 정보는 공지된 센서 위치를 사용하여 히스토그램 및/또 는 다른 통계 기술들로부터의 출력 신호 서브대역들을 계산함으로써 추정된다. 하나 이상의 제약들은 신호의 스펙트럼 특성 또는 에너지 특성에 관한 정보를 포함할 수도 있다. 그 신호는, 주파수-도메인 제 1 신호, 원하는 출력 신호, 및 원치않는 출력 신호로부터 선택될 수도 있다. 하나 이상의 제약들은 비-유도된 제약들을 포함할 수도 있다.

몇몇 실시형태에서, 본 발명은 신호들을 분리하는 시스템에 관한 것이며, 그 시스템은, 시간-도메인 입력 신호들의 세트를 수신하는 수신기; 그 시간-도메인 입력 신호들의 세트를 주파수-도메인 제 1 신호들의 세트로 변환하는 변환기 모듈로서, 그 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 그 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 그 변환기 모듈; 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 주파수-도메인 신호 분리기 모듈로서, 그 주파수-도메인 제 2 신호들의 세트는 그 복수의 주파수들의 개별 주파수들에 대응하는 분리된 주파수-도메인 제 2 신호 엘리먼트들의 세트를 포함하고, 각각의 주파수-도메인 제 2 신호 엘리먼트는, 주파수-도메인 제 2 신호들의 어떤 세트가 주파수-도메인 제 2 신호 엘리먼트를 포함하는지를 나타내는 식별자를 할당받는, 그 주파수-도메인 신호 분리기 모듈; 및 주파수-도메인 제 3 신호들의 세트를 생성하기 위해 그 주파수-도메인 제 2 신호들의 코히런스를 개선시키도록 적어도 하나의 주파수에 대응하는 식별자들을 재순서화하는 재순서화 모듈을 포함한다.

그 주파수-도메인 신호 분리기 모듈은, 독립적인 컴포넌트 분석 방법 및/또 는 독립적인 벡터 분석 방법을 사용함으로써 주파수-도메인 제 1 신호들의 세트를 분리할 수도 있다. 재순서화 모듈은, 대응하는 주파수를 결정함으로써 재순서화되는 제 1 의 주파수-도메인 제 2 신호 엘리먼트를 결정하는 초기 파라미터 서브-모듈; 미리-결정된 주파수에 인접한 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과, 미리-결정된 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과의 코히런스를 개선시키는 코히런스 개선 서브-모듈; 및 재순서화될 후속 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 주파수-전진 서브-모듈을 포함하며, 여기서, 그 주파수-전진 서브-모듈은, 가장-최근에 재순서화된 주파수-도메인 제 2 신호 엘리먼트들에 대응하는 주파수에 인접한 주파수에 대응하는 엘리먼트들로서 후속 주파수-도메인 제 2 신호 엘리먼트들을 결정한다.

그 재순서화 모듈은, 대응하는 주파수를 결정함으로써 재순서화될 제 1 의 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 초기 파라미터 서브-모듈; 미리-결정된 주파수에 인접한 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과, 그 미리-결정된 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과의 코히런스를 개선시키는 코히런스 개선 서브-모듈; 및 재순서화될 후속 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 주파수-전진 서브-모듈을 포함할 수도 있으며, 여기서, 그 주파수-전진 서브-모듈은, 그 코히런스 개선 서브-모듈에 의해 이전에 분석되지 않은 엘리먼트들로서 후속 주파수-도메인 제 2 신호 엘리먼트들을 결정한다. 재순서화 모듈은, 적어도 하나의 주파수에 대응하는 제 1 의 주파수-도메인 제 2 신호 엘리먼트들로서 재순서화한 엘리먼트들의 그룹의 초기 상태를 결정하는 초기 파라미터 서브-모듈; 그 재순서화한 엘리먼트들의 그룹내의 주파수-도메인 제 2 신호 엘리먼트들의 코히런스를 개선시키는 코히런스 개선 서브-모듈; 및 그 재순서화한 엘리먼트들의 그룹에 부가될 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 주파수-전진 서브-모듈을 포함할 수도 있다. 여기에 설명된 시스템은, 주파수-도메인 제 3 신호들의 세트의 주파수-도메인 제 3 신호를 역변환하여 원하는 신호를 생성하는 역변환기 모듈을 포함할 수도 있다. 그 시스템은 헤드셋 및/또는 전화기를 포함할 수도 있다.

몇몇 실시형태에서, 본 발명은 신호를 분리하는 시스템에 관한 것이며, 그 시스템은, 시간-도메인 입력 신호들의 세트를 수신하는 수신기; 그 시간-도메인 입력 신호들의 세트를 주파수-도메인 제 1 신호들의 세트로 변환하는 변환기 모듈로서, 그 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 그 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 그 변환기 모듈; 학습 법칙을 포함하는 독립적인 벡터 분석 (IVA) 방법을 사용하여, 그 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 주파수-도메인 신호 분리기 모듈; 및 하나 이상의 제약들을 그 학습 법칙에 부과하는 제약 부과기 모듈을 포함한다.

여기에 설명된 시스템은, 주파수-도메인 제 2 신호들의 세트로부터 하나 이상의 제약들을 유도하는 제약 유도기 모듈을 더 포함할 수도 있다. 그 하나 이상의 제약들은 기하학적 제약들을 포함할 수도 있다. 그 기하학적 제약들은 추정된 도달 방향 정보를 포함할 수도 있다. 도달 방향 정보는, 공지된 센서 위 치를 사용하여 히스토그램 및/또는 다른 통계 기술로부터의 출력 신호 서브대역들을 계산함으로써 추정될 수도 있다. 그 하나 이상의 제약들은 비-유도된 제약들을 포함할 수도 있다. 그 하나 이상의 제약들은 주파수-도메인 신호 분리기 모듈에서의 신호의 스펙트럼 특성 또는 에너지 특성에 관한 정보를 포함할 수도 있다. 여기에 설명된 시스템은 헤드셋 및/또는 전화기를 포함할 수도 있다.

도면의 간단한 설명

도 1은 사전 (a priori) 제약들을 포함하는 신호 분리 시스템의 일 실시형태의 도면이다.

도 2는 사전 제약들을 학습 법칙에 적용하는 모듈들을 포함하는 신호 분리 시스템의 일 실시형태의 도면이다.

도 3은 신호 분리 시스템의 일 실시형태의 도면이다.

도 4는 신호 분리 프로세스의 일 실시형태의 흐름도이다.

도 5는 신호 분리 시스템의 일 실시형태의 도면이다.

도 6은 예시적인 어쿠스틱 시나리오의 개략도이다.

도 7은, 도 6에 의해 도시된 예에 적용된 종래 기술의 프로세스를 사용하는 IVA 출력에 대한 도달 방향 히스토그램들을 도시한다.

도 8은, 도 6에 의해 도시된 예에 적용되는, 여기에 설명된 바와 같은 신호 분리 프로세스를 사용하는 IVA 출력에 대한 도달 방향 히스토그램들을 도시한다.

도 9는, 도 6에 의해 도시된 예에 적용되는 상이한 프로세스들의 공간 필터 특성들의 도면이다.

도 10은 신호 분리 프로세스의 일 실시형태의 도면이다.

도 11은 분리 프로세스의 일 실시형태의 흐름도이다.

도 12는 신호 분리 프로세스의 일 실시형태에 대한 치환 테이블의 도면이다.

도 13a 및 도 13b는 신호 분리 프로세스의 일 실시형태에 따라 치환 테이블을 재순서화하는 도면들이다.

도 14는 신호 분리 프로세스의 일 실시형태에 따라 치환 테이블을 재순서화하는 프로세스의 흐름도이다.

도 15a 및 도 15b는 신호 분리 프로세스의 일 실시형태에 따라 치환 테이블을 재순서화하는 도면들이다.

도 16은 신호 분리 프로세스에 따라 치환 테이블을 재순서화하는 프로세스의 일 실시형태의 흐름도이다.

도 17은 신호 분리 프로세스에 따라 치환 테이블을 재순서화하는 일 실시형태의 도면이다.

도 18은 신호 분리 프로세스에 따라 치환 테이블을 재순서화하는 프로세스의 일 실시형태의 흐름도이다.

도 19a 내지 도 19c는 신호 분리 프로세스에 따라 치환 테이블을 재순서화하는 일 실시형태의 도면들이다.

도 20은 신호 분리 프로세스에 따라 치환 테이블을 재순서화하는 프로세스의 일 실시형태의 흐름도이다.

도 21은 신호 분리 프로세스에 따라 치환 테이블을 재순서화하는 프로세스의 일 실시형태의 흐름도이다.

바람직한 실시형태의 상세한 설명

독립적인 벡터 분석 (IVA) 은 신호 분리 방법 및 시스템에서 사용된다. IVA 방법은, 먼저 시간-도메인 신호 혼합물들이 주파수 도메인으로 변환되도록, 주파수 도메인에서 구현될 수도 있다. 그 후, 신호 분리 방법은, 출력 신호 혼합물들을 분리하기 위해 신호 혼합물들의 각각의 주파수 컴포넌트에 적용될 수도 있다. IVA와 관련된 학습 법칙들은, 임의의 소정의 주파수와 관련되는 분리된 출력 신호 엘리먼트들이 독립적이도록 유지할 수도 있지만, 주파수에 걸쳐 상관이 존재할 수도 있다. 따라서, IVA 방법은 완전한 적응성 필터를 포함할 수도 있다. 그러나, 그러한 방법은, 로컬 최소값 및 최대값으로 수렴하는 경향이 있을 수도 있다. 또한, 학습 법칙들이 출력 신호내에서 서브대역들에 대해 제공될 수도 있지만, 정확한 소스에 대한 모든 신호 엘리먼트들을 적절히 식별하는데 불충분할 수도 있다.

몇몇 실시형태에서, 본 발명은, 독립적인 벡터 분석 (IVA) 단계들 및/또는 모듈들을 포함하는 개선 방법 및 개선 시스템에 관한 것이다. 몇몇 실시형태에서, 여기에 개시된 방법 및 시스템은, 예를 들어, 로컬 최소값 또는 최대값으로 수렴하는 확률을 감소시키고 및/또는 속도 및/또는 강인성을 개선시킴으로써 성능을 개선시킨다.

몇몇 실시형태에서, 본 발명은 신호 분리 프로세스에 적용되는 제약들을 포함하는 방법 및/또는 시스템에 관한 것이다. 그 제약들은 신호 분리 프로세스 의 학습 법칙에 적용될 수도 있다. 그 학습 법칙은 일정한 시간 간격으로 변형될 수도 있다. 그 제약들은 사전에 공지되어 있거나 유도될 수도 있고, 기하학적 제약들을 포함할 수도 있다. 그 제약들은 신호 분리 프로세스가 로컬 최소값 또는 최대값으로 수렴하는 확률을 감소시킬 수도 있다.

몇몇 실시형태에서, 본 발명은, 각각의 소스에 할당된 상이한 주파수들의 소스 엘리먼트들 사이에서 코히런스를 개선시키기 위해, 상이한 주파수들에 대응하는 분리된 소스 엘리먼트들을 상이한 출력 소스들에 재할당하는 것에 관한 것이다. 그러한 재할당은, 예를 들어, 최적의 재할당을 식별하기 위해, 선형, 상향식 (bottom-up), 또는 하향식 (top-down) 기술들을 포함할 수도 있다.

입력 신호들

몇몇 실시형태에서, 본 발명은 신호들을 분리하는 방법 또는 시스템에 관한 것이다. 그 신호들은 2개 이상의 신호들일 수도 있다. 그 신호들은 어쿠스틱 신호들일 수도 있다. 다른 방법으로, 그 신호들은, 생명의학 (biomedical) 신호, 스펙트럼 신호, 데이터 신호 또는 다른 데이터 소스 신호일 수도 있다.

신호들은 1개, 2개, 또는 그 이상의 마이크로폰들로부터 생성될 수도 있다. 그 마이크로폰들은, 헤드셋 또는 무선 이동 핸드셋과 같은 스피치 부속품 또는 스피치 디바이스에 탑재될 수도 있다. 그 마이크로폰들은, 사람 강연자와 같은 타겟 소스를 포함할 수도 있는 다수의 사운드 소스들로부터 어쿠스틱 신호들을 수신하도록 위치될 수도 있다. 마이크로폰은, 어쿠스틱 신호를 전기 신호로 변환하기 위해 트랜스듀서 (transducer) 기술을 사용할 수도 있다.

여기에 설명된 방법 또는 시스템은, 예를 들어, 배경 잡음으로부터 스피치 신호를 분리하도록 기능할 수도 있다. 개시된 시스템이 광범위한 어쿠스틱 제품에서 사용되는 것이 바람직할 수도 있다는 것을 인식할 것이다.

제약들을 포함하는 주파수-도메인 신호 분리

몇몇 실시형태에서, 본 발명은, 주파수 도메인에서 수행되는 신호 분리를 포함하고 그 신호 분리에 제약들을 부과하는 방법 및/또는 시스템에 관한 것이다. 그 제약들은 신호 분리에 의해 이전에 생성되어 있는 분리된 신호로부터 유도될 수도 있다. 그 제약들은 이전의 분리 경험에 기초하여 사전에 공지되어 있을 수도 있다. 일 실시형태에서, 그 제약들은 기하학적 제약들, 또는 소스들의 스펙트럼 특성에 관련된 제약들을 포함할 수도 있다. 또한, 그 제약들은 학습 법칙을 통해 적용될 수도 있다. 몇몇 실시형태에서는, 시스템 및 디바이스가 시간-도메인 신호들을 스펙트럼 입력 신호들로 변환하는 것을 포함할 수도 있지만, 다른 실시형태에서, 그 변환 프로세스는 시스템 및 디바이스의 일부가 아니다.

몇몇 실시형태에서, 시스템 및 디바이스는 적어도 하나의 분리된 주파수-도메인 신호를 적어도 하나의 시간-도메인 신호로 역변환하는 것을 포함하지만, 다른 실시형태에서는, 역변환하지 않는다. 몇몇 실시형태에서, 신호 분리는 블라인드-소스 분리를 포함한다. 몇몇 실시형태에서, 신호 분리는 독립적인 벡터 분석 (IVA) 또는 독립적인 컴포넌트 분석 (ICA) 을 포함한다.

도 1을 참조하면, 시스템 (10) 은 신호들을 분리하는 일 프로세스 및 시스템을 제공한다. 마이크로폰 (12) 및 마이크로폰 (16) 과 같은 다수의 마이크로폰 들은 신호들을 수신한다. 2개의 마이크로폰들만이 도시되어 있지만, 부가적인 실시형태에서는 상이한 수의 마이크로폰들이 포함될 수도 있다는 것을 인식할 것이다. 마이크로폰들 (12 및 16) 은, 각각, 어쿠스틱 신호들 (미도시) 을 전기 신호들 (14 및 18) 로 변환하도록 기능할 수도 있다.

몇몇 실시형태에서, 전기 신호들 (14 및 18) 은 시간-도메인 신호들이다. 전기 신호들 (14 및 18) 은, 각각, 샘플링 윈도우 세트들 (20 및 22) 로 샘플링될 수도 있다. 예를 들어, 샘플링 윈도우 세트들 (20 및 22) 의 각각의 샘플링 윈도우는 약 8kHz로 획득될 수도 있고, 약 200 시간 샘플링 유닛 동안 연장할 수도 있다. 다른 샘플링 윈도우 길이 및 샘플링 레이트가 사용될 수도 있으며, 특정한 애플리케이션 및 시간 도메인 신호의 타입에 의존할 수도 있다는 것을 인식할 것이다.

그 후, 고속 푸리에 변환 (FFT) 프로세스들 (24 및 26) 에 의해 샘플링 윈도우 세트들 (20 및 22) 의 각각의 샘플링 윈도우에 대해 FFT가 각각 수행될 수도 있다. 이러한 방식으로, 각각의 FFT 프로세스 (24 및 26) 는, 신호 분리 프로세스 (28) 로의 입력들로서 사용되는 주파수 도메인 정보를 생성한다.

신호 분리 프로세스 (28) 는, ICA (독립적인 컴포넌트 분석) 프로세스와 같은 블라인드 신호 분리 프로세스, 또는 다른 분리 프로세스인 것이 바람직할 수도 있다. 신호 분리 프로세스 (28) 는, 출력 주파수 도메인 데이터를 독립적인 신호 소스들로 분리하는 것을 시도할 수도 있다. 독립적인 신호 소스들은, 도 1에 도시된 바와 같이 2개의 신호 소스들, 또는 그 이상의 신호 소스들을 포함할 수 도 있다. 더 상세하게, 출력 데이터는 주파수 빈들에 위치되고, 분리된 주파수 빈 데이터 (29) 에 임시적으로 저장된다. 몇몇 종류의 주파수 의존 서브-대역 구조를 산출하는 웨이블릿 필터뱅크 (wavelet filterbank) 와 같은 다른 서브-대역 변환들이 사용될 수 있음을 인식할 것이다.

분리된 주파수 빈 데이터 (29) 는 고속 푸리에 역변환기 (IFFT) 프로세스 (35) 에 입력될 수도 있다. 그 후, 분리된 주파수 빈 데이터 (29) 의 각각의 분리된 컴포넌트는 IFFT 프로세스 (35) 에 의해 변환되어, 시간-도메인 출력들 (37 및 39) 와 같은 시간-도메인 출력에 대응할 수도 있다. 몇몇 예시에서, 3개 이상의 시간-도메인 출력들이 존재할 것이다. 그 시간 도메인 출력들 중 하나의 출력은 소스 신호의 추정치일 수도 있고, 그 출력들 중 하나 이상의 출력은 하나 이상의 잡음 신호들의 추정치일 수도 있다. 몇몇 예시에서, 분리된 주파수 빈 데이터 (29) 의 모든 분리된 컴포넌트들이 IFFT 프로세스 (35) 에 의해 변환되지는 않는다. 예를 들어, 소스 신호에 대응하는 분리된 컴포넌트만이 IFFT 프로세스 (35) 에 의해 변환될 수도 있다.

신호 분리 프로세스 (28) 는 학습 법칙 (27) 을 사용하여, 주파수 도메인 입력들을 분리된 소스 할당으로 분리할 수도 있다. 그 학습 법칙 (27) 은, 부가적인 조건을 필터 학습 법칙에 부가함으로써, 개선된 분리 성능을 위해 제약될 수도 있는 것이 바람직하다. 학습 법칙 (27) 을 제약함으로써, 더 효율적이고 강인한 분리 프로세스가 가능할 수도 있다. 학습 법칙 (27) 은 사전 제약 (31) 에 의해 제약될 수도 있다. 이러한 사전 제약 (31) 은, 예를 들어, 기대된 소 스 위치 또는 위치의 범위, 기대된 분리 신호 스펙트럼 특성, 또는 또 다른 기대된 신호 품질에 관한 것일 수도 있다. 특정 예에서, 소스가 특정 위치에 있다고 공지되면, 학습 법칙 (27) 은, 그 소스를 제한된 위치 범위에서 발견하도록 사전 제약될 수도 있다. 이러한 방식으로, 소스는 더 신속하고 정확하게 식별될 수도 있다. 다른 사전 제약 (31) 이 학습 법칙을 더 효율적으로 하기 위해 사용될 수도 있다는 것을 인식할 것이다. 예를 들어, 사전 제약 (31) 은, 예를 들어, 잡음 신호의 기대된 위치 또는 스펙트럼 특성에 관한 것일 수도 있다. 사전 제약은, 사용자에 의해 특정된 신호 스펙트럼 제약을 포함할 수도 있다. 예를 들어, 레이더 및 수중 음파 탐지기와 같은 몇몇 애플리케이션에서, 시뮬레이션 신호들의 양호한 추정이 일반적으로 이용가능하다.

또한, 학습 법칙 (27) 은 유도된 제약 (30) 에 의해 제약될 수도 있다. 이러한 유도된 제약 (30) 은 분리된 주파수 빈 데이터 (29) 를 사용하여, 학습 법칙 (27) 에서의 분리된 신호들의 타겟 특성을 조정 또는 셋팅한다. 예를 들어, 소스가 특정 위치 범위에 있다는 것을 분리된 주파수 빈 데이터 (29) 가 나타내면, 유도된 제약 (30) 은, 그 위치 또는 적어도, 유도된 위치 주변의 일반적인 영역에 학습 법칙 (27) 의 "뷰 (view)" 를 제한하도록 셋팅될 수도 있다. 이러한 위치는, 예를 들어, 도달 방향 (DOA) 정보를 포함할 수도 있다. 또한, 유도된 제약 (30) 은, 실제 동작 조건에 따라 디폴트 사전 제약 (31) 을 적응시킬 수 있을 수도 있다. 필터 학습 프로세스가 시작하기 전에 이용가능한 사전 제약 (31) 과는 대조적으로, 부분적으로 분리된 솔루션에 "온 더 플라이 (on the fly)" 방식으로 수렴하는 동안, 유도된 제약 (30) 이 획득되고 적응된다는 것을 유의해야 한다. 몇몇 실시형태에서, 유도된 제약 (30) 및 사전 제약 (31) 양자가 학습 법칙 (27) 에 적용된다. 다른 실시형태에서, 유도된 제약 (30) 만이 학습 법칙 (27) 에 적용된다. 또 다른 실시형태에서, 사전 제약 (31) 만이 학습 법칙 (27) 에 적용된다. 또한, 사전 제약 (31) 은 유도된 제약 (30) 에 영향을 주도록 구성될 수도 있고, 및/또는 유도된 제약 (30) 은 사전 제약 (31) 에 영향을 주도록 구성될 수도 있다. 예를 들어, 사전 제약 (31) 은 유도된 제약 (30) 의 초기 조건에 영향을 줄 수도 있다.

몇몇 실시형태에서, 본 발명은 도 2에 도시된 바와 같은 분리 시스템 (50) 에 관한 것이다. 신호 분리 모듈 (54) 은, 도 2의 입력 채널들 (51 및 52) 에 대응하는 하나 이상의 입력 채널들로부터 입력 신호들을 수신할 수도 있다. 신호 분리 모듈 (54) 은, 독립적인 컴포넌트 분석 (ICA) 프로세스를 포함할 수도 있는 블라인드 신호 분리 프로세스일 수도 있지만, 다른 프로세스들이 사용될 수도 있다.

신호 분리 모듈 (54) 은 학습 법칙 (58) 에 영향을 줄 수도 있고, 그 학습 법칙 (58) 에 의해 영향을 받을 수도 있다. 학습 법칙 (58) 은, 학습 법칙 (58) 의 동작을 제약하는 하나 이상의 제약 조건들 (60) 을 포함할 수도 있다. 이러한 하나 이상의 제약 조건들 (60) 은 지향성 매트릭스를 포함할 수도 있거나, 널 (null) 빔 및 기하학적 정보를 포함할 수도 있다. 제약 조건들 (60) 은 디폴트 셋팅들을 포함할 수도 있거나, 사전 제약 (62) 을 포함할 수도 있다. 사 전 제약 (62) 은, 예를 들어, 디바이스 또는 시스템의 또 다른 양태에 의해 획득된, 예를 들어, 소스 위치, 소스 에너지, 또는 소스의 스펙트럼 정보에 관한 정보를 포함할 수도 있다. 더 상세히 후술된 바와 같이, 제약 조건들 (60) 은 또한 유도된 제약들 (64) 을 포함할 수도 있다.

또한, 학습 법칙 (58) 은 가중 인자들 (61) 을 포함할 수도 있으며, 그 가중 인자들 (61) 은 하나 이상의 제약 조건들 (60) 을 승산할 수도 있고, 사전 제약 (62) 및 유도된 제약 (64) 의 시행에 대한 BSS 최적화 목적을 트레이드 오프하는데 사용될 수도 있다. BSS 목적에 관한 하나 이상의 제약 조건 (60) 에 대한 가중 인자들 (61) 은, 더 신뢰가능하고 더 신속하며 더 최적인 분리를 위해 너무 미리 셋팅되거나 조정될 수도 있다. 가중 인자들이 동작 조건들에 따라 구성될 수도 있다는 것을 인식할 것이다. 또한, 몇몇 제약들은 고정되거나 적응가능하지 않을 수도 있지만, 다른 제약들은 적응성에 대해 의도된 디폴트 시작 포인트라는 것을 인식할 것이다. 더 상세히 후술된 바와 같이, 가중 인자들은 유도된 제약 (64) 에 의해 적응될 수도 있다.

동작 동안, 신호 분리 모듈 (54) 은, 할당된 신호 소스에 따라 주파수 빈들에서 구성되는 분리된 주파수 빈 출력 데이터 (56) 를 생성할 수도 있다. 분리된 주파수 빈 출력 데이터 (56) 의 분리된 컴포넌트는 분리된 주파수 비닝 (binned) 소스 컴포넌트 (59) 를 포함할 수도 있다. 일 실시형태에서, 분리된 주파수 비닝 소스 컴포넌트 (59) 는, 분리된 시간 도메인 소스 신호가 생성되는 IFFT 프로세스로 출력될 수도 있다. 또 다른 실시형태에서, 주파수 도메인 분 리 가중치들만이 IFFT를 통해 전송되며, 시간 도메인 혼합 신호들은 획득된 시간 도메인 분리 필터들로 필터링된다.

또한, 분리된 주파수 빈 출력 데이터 (56) 는 하나 이상의 유도된 제약 (64) 을 결정하는데 사용될 수도 있다. 통상적으로, 이러한 유도된 제약 (64) 은 기하학적 정보 또는 위치 정보이지만, 또한 스펙트럼 또는 에너지 정보를 포함할 수도 있다. 또한, 유도된 제약 (64) 은 기대된 특성 (69) 또는 전체 시스템의 또 다른 부분으로부터의 정보에 따라 동적으로 조정될 수도 있다. 예를 들어, 무선 핸드셋은, 유도된 제약 (64) 을 추가적으로 조정하거나 셋팅하는데 유용한 정보를 제공할 수도 있는 라디오를 가질 수도 있다. 유도된 제약 (64) 은, 학습 법칙 (58) 내의 제약 가중 인자들 (61) 을 통하여, 분리된 주파수 빈 출력 데이터 (56) 을 적절하게 순서화하는 것을 돕기 위해 암묵적으로 사용된다.

예를 들어, 위상 관계들은 도달 방향 (DOA) 정보를 결정하는데 사용될 수도 있으며, 이러한 위상 관계들을 결정하는 프로세스에서, 몇몇 출력 데이터가 상이한 소스와 더 적절하게 관련된다는 것을 나타내는 정보가 생성될 수도 있다. 특정 예로서, 샤프한 위상 차이가 인접한 주파수 빈들 사이에서 관측될 수도 있으며, 이는 일반적으로 스피치 신호들에 대해 기대되지 않을 것이다. 이러한 경우, 위상 불연속은 출력 데이터의 몇몇 주파수 범위가 잘못 할당되었다는 것을 나타낼 수도 있으며, 따라서, 그 주파수 빈 범위에 대한 출력들은, 예를 들어, 빈 사이의 위상 변화를 최소화하기 위해, 가중된 제약 학습 조건들을 사용함으로써 재배열되어야 한다. 특정 BSS 출력에서의 신흥 DOA의 선택은, 몇몇 관리 방법, 즉, BSS 출력 DOA들의 함수로서 그래프에서의 부분적으로 리졸빙 (resolve) 된 분리들을 평가함으로써, 또는 관리되지 않은 방식으로 결정될 수 있다. 예를 들어, 칼만 필터 (Kalman filter) 는, 낮은 주파수로부터 높은 주파수를 향해 시작하는 위상 정보를 사용함으로써 특정 BSS 출력에서의 평균 DOA, 및 빈 사이의 DOA 변동들의 통상적인 분산을 추정할 수도 있다. DOA 위상 시프트가 통상적인 빈 사이의 분산을 통계적으로 상당하고 가능하지 않은 양만큼 초과하자마자, 이러한 강한 DOA 시프트가 발생하는 주파수 빈은 분리된 소스들 사이의 주파수 빈 범위들의 치환 이벤트를 마킹할 수도 있다. 낮은 주파수 빈들로부터 시작하는 칼만 필터에 의해 훨씬 더 제공된 DOA 추정치는 유도된 DOA 제약 파라미터로서 사용되어, 이러한 BSS 출력에 대한 나머지 높은 주파수 DOA가 BSS 출력의 낮은 주파수 분리된 부분으로 할당되게 할 수도 있다.

몇몇 실시형태에서, 본 발명은 도 3에 도시된 바와 같은 분리 시스템 (100) 에 관한 것이다. 시스템 (100) 은, 입력 채널들 (102 및 104) 와 같은 하나 이상의 입력 채널들로부터 주파수 데이터를 수신하고, 생성 분리된 주파수 빈 출력 데이터 (109) 를 생성하는 신호 분리 모듈 (106) 을 포함한다. 그 생성 분리된 주파수 빈 출력 데이터 (109) 는 주파수 빈들 (110) 의 세트를 특정한 독립적인 신호 소스들 (112) 과 관련시킨다. 각각의 주파수 빈은, 관련된 간단한 윈도우들에 대한 복소 주파수 데이터를 나타내는 출력 데이터 (114) 를 갖는다. 출력 데이터 (114) 는 유도 프로세스에 의해 사용되어, 하나 이상의 소스들에 대한 도달 방향 (DOA) 정보와 같은 유도된 제약 (121) 을 유도할 수도 있다. 예를 들어, 소스 1에 대한 DOA는 출력 데이터 D1-1, D1-2, D1-3 내지 D1-n 의 분석에 의해 결정될 수도 있다. 유도 프로세스는 소스를 더 정확하게 위치결정하기 위해 출력 데이터의 세트에 걸쳐 DOA 정보를 평균할 수도 있으며, 몇몇 출력 데이터가 잘못 할당되었다는 것을 나타낼 수도 있는, 주파수 빈들 사이의 위상 정보에서의 비정상적으로 큰 변화들을 모니터링할 수도 있다. 다른 필터 및 선택 프로세스들이 DOA 정보를 결정하는데 사용될 수도 있다는 것을 인식할 것이다.

또한, 모니터링된 위상 이벤트들은 분리된 주파수 빈 출력 데이터 (109) 에서 출력 데이터를 재배열하는데 사용될 수도 있다. 예를 들어, 샤프한 위상 차이가 인접한 주파수 빈들 사이에서 관측될 수도 있으며, 이는 일반적으로 스피치 신호들에 대해 기대되지 않을 것이다. 이러한 경우, 위상 불연속은 몇몇 출력 데이터가 잘못 할당되었다는 것을 나타낼 수도 있으며, 따라서, 그 주파수에 대한 출력들은, 예를 들어, 빈 사이의 위상 변화를 최소화하기 위해 재배열되어야 한다. 출력 데이터를 재배열하는 것을 돕는데 사용될 수도 있는 다른 정보가 유도될 수도 있다는 것을 인식할 것이다. 도시된 바와 같이, 잘못된 할당을 정정하기 위하여 신호 분리 프로세스를 조정하도록 학습 법칙을 조정하는데 모니터링된 이벤트들이 사용될 수도 있다. 대안적으로, 모니터링된 위상 이벤트들은, 하나 이상의 주파수 빈들내에서 BSS 출력 데이터를 재순서화하는 재-순서화 프로세스에 의해 사용될 수도 있다.

유도된 제약 (121) 은, 학습 법칙 (125) 이 더 효율적이고 강인하게 신호들을 분리할 수 있게 할 수도 있는 기하학적 제약들 (123) 을 정의하는데 사용될 수 도 있다. 예를 들어, 하나 이상의 소스들에 대한 유도된 DOA 정보는, 특정한 기하학적 또는 위치 솔루션에 학습 법칙을 포커싱 (focus) 하는데 사용될 수도 있다. 또한, 기하학적 제약들 (123) 은 디폴트 조건들 또는 다른 사전 제약들 (127) 을 포함할 수도 있다. 이러한 사전 제약들 (127) 은, 예를 들어, 마이크로폰이 타겟 소스와의 고정된 관계를 가지면 정적일 수도 있거나, 디바이스의 다른 양태들에 의해 동적으로 조정될 수도 있다.

몇몇 실시형태에서, 본 발명은 도 4에 도시된 바와 같은 분리 프로세스 (150) 에 관한 것이다. 프로세스 (150) 의 단계 152에서, 롤링 윈도우에서 어쿠스틱 신호들이 획득된다. 프로세스 (150) 의 단계 154에서, 고속 푸리에 변환 (FFT) 이 시간 도메인 롤링 윈도우들에 적용되어 주파수 도메인 데이터를 생성한다. 프로세스 (150) 의 단계 156에서, FFT 데이터로서 또한 지칭되는 결과적인 주파수 도메인 데이터는 신호 분리 프로세스로의 채널 입력들로서 사용된다. 사전 제약들 (155) 이 신호 분리 프로세스를 더 효율적이고 강인하게 하기 위해 사용될 수도 있다. 이러한 사전 제약들 (155) 은 정적일 수도 있거나, 전체 시스템의 또 다른 양태에 의해 조정될 수도 있다. 프로세스 (150) 의 단계 158에서, 신호 분리 프로세스로부터의 출력은, 신호 소스에 따라 분리되는 분리된 BSS 출력 데이터를 제공한다. 프로세스 (150) 의 단계 161에서, 분리된 출력 데이터는 프로세스의 단계들을 조정하기 위해 분석될 수도 있다. 예를 들어, 분리된 출력 데이터는, 분리 프로세스에 대한 학습 법칙에서의 적응가능한 제약들 또는 가중 인자들을 조정하는데 사용될 수도 있다. 또한, 출력 데이터는, 주파수 빈 들에서의 출력 데이터에 대한 소스 할당들을 재순서화 또는 정정하는데 유용한 정보를 제공하기 위해 분석될 수도 있다. 프로세스 (150) 의 단계 163에서, 주파수 도메인 데이터가 IFFT에 의해 프로세싱될 수도 있다. 그 후, 프로세스 (150) 의 단계 165에서, IFFT는 분리된 시간 도메인 신호를 생성할 수도 있다. 다른 방법으로, 주파수 도메인 분리 가중치들만이 IFFT를 통해 전송될 수도 있으며, 시간 도메인 혼합 신호들은 획득된 시간 도메인 분리 필터들로 필터링될 수도 있다.

다-변량 (multi-variate) 활성도 함수들 및 기하학적 제약들

몇몇 실시형태에서, 여기에 설명된 방법 및/또는 시스템의 제약들은 기하학적 제약들을 포함하며, 그 제약들은 IVA 방법과 관련된 학습 법칙에 부과될 수도 있다. 임의의 프로세스 또는 방법은, 그 제약들을 유도하고 그 제약들을 신호 분리 프로세스 또는 방법에 적용하는데 사용될 수도 있다. 그러나, 하나의 특정 수학식이 일 예로서 후속한다.

주파수 도메인에서, 복소 ICA는, 디믹싱된 (demixed) 출력들

이 서로 독립적이도록, 각각의 주파수 ω에 대한 혼합되지 않은 매트릭스

를 구하는 것과 관련되며, 여기서, (시간 윈도우 l, 혼합물들의 수 M 인)

는 시간 도메인 혼합물

의 DFT 이다.

에 대한 업데이트 법칙은,

로 주어지며, 여기서,

이고,

는 시간 l＝1, ..., L 에서의 평균화 연산자를 나타내고, μ는 학습 레이트이다. 통상의 Infomax 활성도 함수는, 업데이트 법칙 (1) 과 함께, ICA 문제가 각각의 주파수 빈에 대해 독립적으로 풀어진다는 것을 내포하며, 치환 문제로 유도하는

로서 주어진다. 그러나, 다-차원 프라이오 (prior) 에 의해 모델링될 수 있는 주파수 도메인에서 관심 신호들이 특정한 의존성을 갖는다고 가정함으로써, 본래의 의존성 소스들은 그러한 프라이오를 사용하는 그룹으로서 추출될 수 있다. 그 결과로서, 다-변량 활성도 함수는,

와 같이 획득되며, 여기서, 분모의 항은 모든 주파수들에 걸친 분리된 소스 스펙트럼 전력에 관한 것이다. 여기에 사용된 다-변량 활성도 함수는 일반적인 통계 분포로부터 유도된 더 일반적인 학습 법칙의 특수한 경우임을 유의해야 한다. 2006년 3월 1일자 미국 특허 출원인 Kim, T,. Lee, T.-W 의 "Systems and Methods for Blind Source Signal Separation", 및 Kim, T., Eltoft, T., Lee, T.-W 의 IVA (Independent Vector Analysis), 즉, 2006년 3월자 ICA 및 BSS에 대한 6번째 Conf., An Extension of ICA to Multivariate Components, Proc. 을 참조하며, 이들 양자는 그 전체가 참조로서 포함된다.

의 스케일링 모호성은 최소 왜곡 원리로 설계된 스케일링 매트릭스에 의해 리졸빙된다.

수학식 (2) 에서와 같은 다-변량 활성도 함수의 사용은, 필터 학습 프로세스 동안, 개별 주파수 빈 필터 가중치들 사이에 명시적인 의존성을 도입함으로써 치환 문제를 회피한다. 실제로, 필터 가중치들의 이러한 동시적인 접속 적응성은, 시간 도메인 알고리즘에서 관측되는 것과 유사한 초기 필터 조건들에 대한 증가된 수렴 의존성을 도입한다. 따라서, 이러한 사실상의 제한들을 극복하기 위해, 기하학적 제약들이 여기에 사용된다.

임의의 기하학적 제약들이 여기에서 방법 및/또는 시스템에 적용될 수도 있다. 또한, 여기에 설명된 사전 제약들 또는 유도된 제약들은 기하학적 제약들만을 포함하거나, 다른 제약들과 함께 기하학적 제약들을 포함하거나, 임의의 기하학적 제약들을 포함하지 않을 수도 있다.

기하학적 제약들은, 특정 출력 채널의 공간 응답을 특정 배향으로 제약하는데 사용될 수 있으며, 널 빔들을 다른 배향에 배치한다. 이는, 선형적으로 제약된 적응성 빔포밍, 특히, GSC (generalized sidelobe canceller) 에 내재하는 통상적인 개념이다. 여기에 제출된 아이디어는, 간섭하는 소스 방향으로 공간 널들을 배치함으로써 특정 소스 방향에 포커싱하는 목적을 지원하는, 독립적인 벡터 분석 (IVA, 2006년 3월 1일자 미국 특허 출원인 Kim 등의, "Systems and Methods for Blind Source Signal Separation" 을 참조) 비용 함수에 조정항 (regularization term) 을 부가하는 것이다. 다음의 조정항은,

로 제안되며, 여기서, M×M 매트릭스

는,

로 주어진다.

지향성 매트릭스

는,

와 같은 벡터들 d_j로 구성되며, 여기서,

는 센서 위치이고, c는 공기중에서의 음속이며, i는 -1의 제곱근이다.

θ_estj 들은, 사전 정보로부터 이용가능하거나 다음의 방식에서 반복적으로 결정될 필요가 있는 R＜＝M 소스들에 대한 소스 도달 방향 (DOA) 추정치들이다. 혼합되지 않은 매트릭스

의 역을 사용하여, 분리된 출력들 Y_j 의 DOA가,

로 추정될 수 있다는 것을 이전에 나타내었으며, 여기서,

는 센서 쌍 m 및 n에 대한 소스 j의 DOA 이고, p_m 및 p_n 은, 각각, mic m 및 n 의 위치이며, c＝340 m/s 는 음속이다 (여기에 그 전체가 참조로서 포함되는, Mukai, R., Sawada, H., Araki, S., Makino, S., 의 Frequency domain blind source separation for many speech signals, Proc. ICA 2004, pp. 461-649, 2004 를 참조). 수 개의 마이크로폰 쌍들이 사용될 경우, 특정한 IVA 출력 Y_j 에 대한 DOA θ_estj 는 선택된 서브대역들에서 모든 마이크로폰 쌍들 및 주파수들에 걸쳐 수학식 (5) 으로부터의

의 히스토그램을 플로팅 (plot) 함으로써 계산될 수 있다 (예를 들어, 도 7를 참조). 그 후, 평균 θ_estj 는 결과적인 히스토그램

의 최대값 또는 무게 중심

이며, 여기서,

는 각도

에서의 DOA 추정치들의 수이다. 그러한 히스토그램으로부터의 신뢰가능한 DOA 추정치들은, 다수의 반복 이후 평균 소스 방향이 나타날 경우, 단지 추후의 학습 스테이지에서 이용가능하게 될 수도 있다. 수학식 (5) 의 추정치들은, (2~4)*D²/λ 를 초과하는 마이크로폰 어레이로부터의 소스 거리들에 대해 유효한 파 필드 모델 (far field model) 에 기초하며, 여기서, D는 고려되는 가장 큰 어레이 차원이고, λ는 고려되는 가장 짧은 파장이다.

목적 (3) 은,

와 같이 업데이트 법칙을 사용함으로써 최소화될 수 있으며, 여기서, α는 동조 파라미터이다. 업데이트 수학식 (6) 이 IVA 업데이트 수학식 (1) 에 부가되어, 제약된 IVA 가중치 업데이트

를 결정할 경우, 동조 α는, 어쿠스틱 시나리오의 공간 분리가능성 및 다른 고려사항들에 의존하여 조정 제약 (3) 을 적절히 시행하도록 허용한다.

소스들의 수 R 이 혼합물들의 수 M 과 동일하면, 원하는 빔 패턴의 선택은,

로 셋팅되며, 따라서, 각각의 반복에서 제약된 IVA 알고리즘에 의해 결정된 원하는 배향으로 빔 강도를 보존하면서, 간섭하는 배향으로부터 소스들을 널링 (nulling) 한다. R＜M 이면, DOA 가 식별되지 않는

의 k번째 행은,

에서의 0 엔트리들의 대응하는 행을 요구할 것이며, 따라서, 모든 소스들은 이러한 출력 채널에서 널링되며, 배경 잡음만이 남아 있게 된다. 다른 방법으로, R＜M 이면, 먼저, 차원 감소가 PCA 를 사용하여 수행되고, 그 후, 감소된 차원 서브공간 상에서 IVA 를 수행할 수 있다. 감소된 차원 제약 그라디언트는,

를 판독하며, 여기서,

이고,

는 R*M PCA 차원 감소 매트릭스를 나타낸다.

빔포밍 기술들이 이용될 수도 있고 일반적으로 스피치가 광대역 신호이므로, 양호한 성능이 중요한 주파수 범위들에 대해 획득된다는 것이 보장될 수도 있다. 수학식 (5) 에 내재하는 파 필드 모델이 유효하지 않으면, 빔 패턴에 대한 근접한 필드 정정들이 행해지게 할 수도 있다. 또한, 2개 이상의 마이크로폰들 사이의 거리가 충분히 작게 (가장 높은 주파수의 파장의 절반보다 작게) 선택될 수도 있으므로, 공간 에일리어싱 (aliasing) 이 회피된다. 이러한 경우, 매우 낮은 주파수에서 샤프한 빔들을 시행하는 것이 가능하지 않다.

도 5는, 로컬 최소값을 회피하고 수렴의 속도를 증가시키기 위해, 기하학적 제약들과 결합된 IVA에 기초한 일 시스템의 개관을 도시한다. 복수의 입력 혼합물들 (X₁, X₂, ..., X_M)(180) 이 적응 프로세스 (185) 로 입력된다. 적응 프로세스 (185) 는, IVA 프로세스 (187) 및 기하학적 제약 프로세스 (184) 양자를 포함한다. 예를 들어, 소스 또는 또 다른 예로서 잡음의 사전 정보 (191) 는 기하학적 제약들 (184) 에 제공될 수도 있다. 다른 방법으로 또는 추가적으로, 더 상세히 후술되는 유도된 정보가 기하학적 제약들 (184) 에 제공될 수도 있다. 적응 프로세스 (185) 는 혼합되지 않은 매트릭스 W (193) 를 적응시킨다. 혼합되지 않은 매트릭스

(193) 은 복수의 입력 혼합물들 (X₁, X₂, ..., X_M) (180) 을 수신하고, 그 입력 혼합물들 (180) 을 복수의 분리된 신호들 (Y₁, Y₂, ..., Y_M)(195) 로 변환시킨다. 복수의 분리된 신호들 (Y₁, Y₂, ..., Y_M)(195) 은 하나 이상의 소스 신호들을 포함할 수도 있다. 유도된 제약들은, 혼합되지 않은 매트릭스

의 역을 사용하여, 부분적으로 분리된 신호들의 주파수 서브대역들을 반복적으로 계산함으로써 유도될 수도 있다.

도 6은 3개의 스피커 및 4개의 마이크로폰의 어쿠스틱 시나리오에서의 접근법을 도시한다. 소스 1, 소스 2 및 소스 3은, 각각, 마이크로폰 어레이로부터 130cm, 130cm, 및 160cm 이격되어 있다. 마이크로폰 어레이는, 4개의 마이크로폰들이 인접한 마이크로폰으로부터 4cm 이격하여 위치되도록, 라인에 위치된 그 4개의 마이크로폰들을 포함한다. 소스 1, 소스 2 및 소스 3은, 각각, 마이크로폰들의 라인을 따른 축으로부터 70°, 95°, 및 135°에 위치된다.

도 7에서, 학습 법칙 (1) 및 활성도 함수 (2) 를 사용하여, 각각의 IVA 분리된 출력에 대한 [0 kHz 내지 4kHz] 대역에서 모든 주파수들에 걸쳐 마이크로폰 쌍들 (1, 2), (2, 3), 및 (3, 4) 에 대해 수학식 (5) 으로 추정된 DOA들의 히스토그램들이 도시된다. IVA 출력 1 및 IVA 출력 2는, 소스 1 및 소스 2의 위치에 대응하여 약 70°및 약 95°에서 히스토그램이 피크하도록, 소스 1 및 소스 2에 각각 대응한다 (도 6과 비교). IVA 출력 3 및 IVA 출력 4는 유사하게 샤프한 피크를 나타내지 않으며, 그에 의해, 정의된 DOA가 출력 3 및 출력 4에서 인지되지 않다는 것을 나타낸다. 따라서, 제약되지 않은 IVA 알고리즘은 소스 3을 분리하는 것 을 실패하고, 따라서, 로컬 최소값으로 수렴한다.

한편, 도 8은, 제약된 IVA의 수렴된 솔루션 (업데이트 수학식 (1) 및 (4), α＝0.1) 으로 초기화된 IVA 혼합되지 않은 솔루션 (업데이트 법칙 (1), 활성도 함수 (2)) 에 대응하는 모든 마이크로폰 쌍들 및 주파수들에 걸친 수학식 (5) 으로부터의 DOA 추정치들의 히스토그램을 도시한다. 도 7과는 대조적으로, 히스토그램의 피크가 약 135°에 위치되는 바와 같이, IVA 출력 3은 소스 3에 명확히 대응한다. 따라서, 블라인드 소스 분리를 수행하기 위해, 제약된 IVA 법칙을 사용함으로써, 로컬 최소값으로의 수렴이 회피되고, 모든 3개의 본래 소스들이 레코딩된 혼합 신호들로부터 분리된다.

표 1은, 양호한 신호 대 간섭 비 (SIR) 가 제약된 접근법을 사용하여 획득될 수 있다는 것을 나타낸다. 상이한 제약된 IVA 접근법들은 상이한 값들의 α를 통해 평가되었다. 약칭들은 다음과 같이 설명된다, 즉, IVA＝업데이트 법칙 (1) 을 사용하는 함수 (1) 를 갖는 IVA, conIVA＝α의 상이한 셋팅들에 대해 수학식 (5) 에 부가된 수학식 (1) 으로 구성된 업데이트 법칙을 사용하는 제약된 IVA, IVAopt＝conIVA (α＝0.1) 로 획득된 최종 솔루션으로 초기화된 IVA.

기하학적 제약들을 시행하는 물리적인 영향을 예시하기 위해, 도 9는, ω＝2kHz 에서 제약된 IVA (활성도 함수 (2) 와 함께 수학식 (5) 에 부가된 업데이트 법칙 (1)) 를 사용하여 획득되는 분리된 출력 빔 패턴들

을 도시하며, 널 빔들은 DOA 76, 96, 134 도에 위치되고, α (수학식 (5)) 를 사용하는 제약 시행의 상이한 적극성 (aggressiveness) 은 결과적인 널 빔들의 깊이를 조정하도록 허용한다 (α＝2에 대한 파선; α＝0.1에 대한 일점-쇄선 라인). 실선은, α＝0.1 를 사용하는 제약된 IVA 로부터 획득된 수렴 필터들로 초기화되는 제약되지 않은 IVA (함수 (2) 를 갖는 업데이트 법칙 (1)) 의 최적 솔루션에 대응한다. 동조 α가 선택 각에서 빔패턴의 깊이 및 폭을 조정하도록 허용하며, 따라서, BSS 솔루션을 초기화하거나 그 솔루션을 특정한 솔루션으로 안내하는 직접적인 수단을 허용한다.

주파수-도메인 신호 분리 및 재순서화 프로세싱

몇몇 실시형태에서, 본 발명은, 주파수 도메인에서 수행되는 신호 분리를 포함하고, 그 분리된 신호들의 소스 할당들을 재할당하는 시스템 및/또는 디바이스에 관한 것이다. 재할당하는 것은, 특정 주파수 및/또는 주파수들의 특정 그룹에 대응하는 신호 데이터내의 할당들을 재할당하는 것을 포함할 수도 있다. "재순서화", "재할당", 및 "재배열" 이라는 용어가 동의어로 사용될 수도 있다는 것을 이해할 것이다. 몇몇 실시형태에서, 여기에 설명된 바와 같이, 재순서화는 하향식, 상향식, 또는 선형 프로세스들을 포함할 수도 있다. 몇몇 실시형태에서는, 시스템 및 디바이스가 시간-도메인 신호들을 스펙트럼 입력 신호들로 변환하는 것을 포함할 수도 있지만, 다른 실시형태에서는, 그 변환은 시스템 및 디바이스의 일부가 아니다. 몇몇 실시형태에서는, 시스템 및 디바이스가 적어도 하나의 분리된 주파수-도메인 신호를 적어도 하나의 시간-도메인 신호로 역변환하는 것을 포함하지만, 다른 실시형태에서는, 시스템 및 디바이스가 역변환하지 않는다. 몇몇 실시형태에서, 신호 분리는 블라인드-소스 분리를 포함한다. 몇몇 실시형태에서, 신호 분리는 독립적인 벡터 분석 (IVA) 또는 독립적인 컴포넌트 분석 (ICA) 을 포함한다.

특정한 재순서화 방법이 여기에 설명되었지만, 임의의 재순서화 프로세스가 사용될 수도 있음을 이해할 것이다. 또한, 특정 주파수 및/또는 주파수들의 특정 그룹에 대응하는 데이터에 대한 재순서화를 고려하는 동안, 또 다른 주파수 및/또는 주파수들의 그룹으로 진행하기 전에, 재순서화된 할당은 고정될 필요가 없다는 것을 이해할 것이다.

도 10에 도시된 바와 같이, 시스템 (500) 은 신호들을 분리하기 위한 하나의 프로세스 및 시스템을 제공하며, 도 1에 도시된 바와 같은 시스템 (10) 과 같이 시작한다. 마이크로폰 (12) 및 마이크로폰 (16) 과 같은 다수의 마이크로폰들은 신호들을 수신한다. 마이크로폰들 (12 및 16) 에 의해 생성된 마이크로폰들 (12 및 16) 의 특성들 및 어쿠스틱 신호들 (14 및 18) 의 특성들은 시스템 (10) 에서 설명된 바와 같다. 시스템 (10) 에 대해 상술된 바와 같이, 시간-도메인 전기 신호들 (14 및 18) 은, 각각, 샘플링 윈도우 세트들 (20 및 22) 로 샘플링될 수도 있다.

시스템 (10) 에 대해 설명된 바와 같이, 그 후, 고속 푸리에 변환 (FFT) 은, FFT 프로세스들 (24 및 26) 에 의해 각각 샘플링 윈도우 세트들 (20 및 22) 의 각각의 샘플링 윈도우에 대해 수행될 수도 있다. 이러한 방식으로, 각각의 FFT 프로세스들 (24 및 26) 은, 신호 분리 프로세스 (28) 로의 입력으로서 사용되는 주파수 도메인 신호를 생성한다.

신호 분리 프로세스 (28) 는, ICA (독립적인 컴포넌트 분석) 와 같은 블라인드 신호 분리 프로세스, 또는 또 다른 분리 프로세스인 것이 바람직할 수도 있다. 신호 분리 프로세스 (28) 는, 출력 주파수 도메인 데이터를 독립적인 신호 소스들로 분리하는 것을 시도할 수도 있다. 독립적인 신호 소스들은, 도 10에 도시된 바와 같이, 2개의 신호 소스들 또는 그 이상의 신호 소스들을 포함할 수도 있다.

더 상세하게, 출력 데이터는 주파수 빈들에 배치되거나, 치환 테이블 (532) 에 임시로 저장된다. 치환 테이블 (532) 은 분리된 주파수 도메인 데이터를 보유한다.

그러나, 신호 분리 프로세스 (28) 는 특정한 출력 데이터 엘리먼트를 정확한 신호 소스로 정확하게 할당하는 것을 종종 실패한다. 주파수 빈은 통상적으로 각각의 기대된 독립적인 소스에 대한 데이터 출력 엘리먼트들을 가지며, 또한 통상적으로, 사용된 마이크로폰들의 수이다. 예를 들어, 디바이스가 3개의 마이크로폰들을 가질 수도 있으므로, 각각의 주파수 빈은 3개의 출력 데이터 엘리먼트들을 가질 것이다. 신호들을 정확히 분리하기 위해, 각각의 출력 데이터는 정확한 신호 소스와 관련되어야 한다. 몇몇 경우에서, 출력 데이터는 신호 소스와 부정확하게 관련될 수도 있다. 주파수 데이터의 이러한 잘못된 할당은 통상적으로 치환 문제로서 공지되어 있으며, 왜곡, 분리 실패, 또는 다른 원치않는 효과를 초래한다. 따라서, 시스템 (500) 은, 치환 테이블 (532) 에서 각각의 주파수 빈에 대한 출력 데이터를 재순서화하는 재순서화 프로세스 (530) 를 포함할 수도 있다. 따라서, 치환 테이블 (532) 은 복수의 분리된 컴포넌트들을 포함하도록 재순서화되며, 각각의 컴포넌트는 복수의 데이터 포인트들을 포함하고, 각각의 데이터 포인트는 그 컴포넌트에 할당된 주파수 빈의 신호 분리 결과에 대응한다.

일단 치환 테이블 (532) 이 적절하게 순서화되면, 정정된 주파수 도메인 데이터는 고속 푸리에 역변환 프로세스 (IFFT; 35) 에 전달된다. 그 후, 재순서화된 치환 테이블의 각각의 분리된 컴포넌트는 IFFT 프로세스 (35) 에 의해 변환되어, 시간-도메인 출력들 (37 및 39) 와 같은 시간-도메인 출력에 대응할 수도 있다. 몇몇 예시에서, 3개 이상의 시간-도메인 출력들이 존재할 것이다. 시간 도메인 출력들 중 하나의 출력은 소스 신호의 추정치일 수도 있으며, 출력들 중 하나 이상의 출력들은 하나 이상의 잡음 신호들의 추정치일 수도 있다. 몇몇 예시에서, 분리된 주파수 빈 데이터 (29) 의 모든 분리된 컴포넌트들은 IFFT 프로세스 (35) 에 의해 변환되지는 않는다. 예를 들어, 소스 신호에 대응하는 분리된 컴포넌트만이 IFFT 프로세스 (35) 에 의해 변환될 수도 있다.

몇몇 실시형태에서, 본 발명은, 도 11에 도시된 바와 같은 분리 프로세스 (550) 에 관한 것이다. 프로세스 (550) 의 단계 552에서, 롤링 윈도우에서 어쿠스틱 신호들이 획득된다. 프로세스 (550) 의 단계 554에서, 고속 푸리에 변환 (FFT) 은 시간 도메인 롤링 윈도우들에 적용되어, 주파수 도메인 데이터를 생성한다. 프로세스 (550) 의 단계 556에서, FFT 데이터로서 지칭되는 결과적인 주파수 도메인 데이터는 신호 분리 프로세스로의 채널 입력들로서 사용된다. 프로세스 (550) 의 단계 558에서, 독립적인 소스들에 따라 주파수 빈들내에서 신호 분리 프로세스의 출력들을 배열하는 치환 테이블이 생성될 수도 있다. 프로세스 (550) 의 단계 561에서, 치환 테이블에 적용된 프로세스는, 각각의 주파수 빈내에서 소스들의 할당이 재순서화되어 신호 분리 프로세스로부터 출력된 데이터와 대응할 수도 있도록, 주파수 빈들 내에서 출력 데이터를 재순서화할 수도 있다. 프로세스 (550) 의 단계 563에서, 주파수 도메인 재순서화된 데이터는 IFFT에 의해 프로세싱될 수도 있다. 그 후, 프로세스 (550) 의 단계 565에서, IFFT는 분리된 시간 도메인 신호를 생성할 수도 있다. 다른 방법으로, 주파수 도메인 분리 가중치만이 IFFT를 통해 전송될 수도 있으며, 시간 도메인 혼합 신호들은 획득된 시간 도메인 분리 필터들로 필터링될 수도 있다.

치환 테이블의 일 예가 도 12에 도시된다. 치환 테이블 (600) 은, 독립적인 신호 소스들의 식별 (602) 및 이용가능한 주파수 빈들의 표시 (604) 를 포함한다. 통상적으로, 신호 소스들의 수는 시스템에서 마이크로폰들의 수에 관련된다. 예를 들어, 디바이스가 3개의 마이크로폰들을 가지면, 3개의 독립적인 소스들까지 식별할 수 있을 수도 있다. 주파수 빈들 (604) 의 수는, 수행된 고속 푸리에 변환의 타입뿐만 아니라, FFT 샘플 블록 및 샘플링 윈도우에서의 데이터 포인트들의 수에 의존할 수도 있다. 주파수 빈 (608) 과 같은 각각의 주파수 빈은 출력 (609) 및 출력 (610) 과 같은 출력 데이터의 세트를 포함한다. 각각의 출력은, 모든 샘플 윈도우들을 나타내는 복소값 데이터의 세트를 포함한다. 예를 들어, 주파수 빈 (608) 은 복수 출력들 (609 및 610) 을 가지며, 출력 (609) 은 첫번째 3개의 샘플 윈도우들에 대한 "FREQ3" 주파수 콘텐츠를 나타내는 복소값 데이터 Q1, Q2, Q3 를 갖는다. 예를 들어, 240개의 샘플 윈도우들이 일 주기 동안 취해지면, 출력 (109) 과 같은 각각의 출력은 240개의 복소값들을 가질 것이며, 각각의 값은 하나의 샘플 윈도우에 대한 하나의 주파수에서의 데이터 엘리먼트를 나타낸다.

치환 재순서 결과들을 개선시키기 위해, 샘플 데이터의 최소의 특정된 길이가 요구될 수도 있다. 예를 들어, 시간 도메인 데이터의 3초가 바람직한 분리 결과들을 제공한다는 것이 발견되었다. 8kHz 로 샘플링하고, 샘플 윈도우가 200 포인트로 셋팅되면, 각각의 샘플 윈도우는 길이가 약 25ms 이다. 샘플 윈도우들이 중첩할 수도 있으므로, 부가적인 샘플 윈도우들이 3초의 시간을 소비하는데 사용될 수도 있다. 예를 들어, 각각의 샘플 윈도우가 약 100 포인트만큼 중첩하면, 약 240개의 샘플 윈도우들이 3초의 시간을 소비할 것이다. 시간의 전체 길이, 샘플 윈도우들의 수, 중첩, 윈도우들의 길이 및 샘플 레이트가 조정될 수도 있다는 것을 인식할 것이다.

테이블 (625) 은 하나의 축상에 리스트된 소스들 및 또 다른 축상에 리스트된 주파수 빈들을 갖는 치환 테이블을 나타낸다. 주파수 빈들에서의 각각의 출력은 문자, 즉, A, B, 또는 N 중 어느 하나를 할당받는다. 설명의 목적을 위해, 문자들 A, B, 및 N은 각각의 신호 소스로부터의 신호들을 나타낸다. 이러한 방식으로, 완전하게 분리된 신호는 소스들 중 하나로 정렬된 모든 "A" 를 가질 것이고, 또 다른 소스로 정렬된 모든 "B" 를 가질 것이며, 또 다른 소스와 관련된 모든 'N' 을 가질 것이다. 그러나, 사실상 그러한 완벽은 발생할 가능성이 없으며, 몇몇 잘못된 할당이 일반적으로 수용가능하다는 것을 인식할 것이다. 그러나, 여기에 설명된 재순서화 프로세스를 사용하여 개선된 명확성 및 분리 효율성이 관측된다.

다음으로, 도 13a를 참조하면, 치환 테이블을 재순서화하는 시스템이 도시된다. 시스템 (650) 은 소스 (652) 및 소스 (654) 와 같은 소스들을 갖는 치환 테이블을 갖는다. 치환 테이블은, 신호 분리 프로세스가 각각의 주파수 빈들내에 분리된 출력 데이터를 할당한다는 것을 나타내며, 각각의 출력은 특정한 소스에 할당된다. 문자 라벨들에 의해 도시된 바 같이, 분리 프로세스는 다수의 주파수 빈들에서 특정 소스들을 정확한 출력 데이터와 정확히 관련시키는 것을 실패한다. 따라서, 재순서화 프로세스가 적용되는 것이 바람직할 수도 있다. 재순서화 시스템 (650) 은, 주파수 빈 (656) 과 같은 소정의 주파수 빈으로 시작하는 선형 접근법이다. 그 선형 접근법에서, 선택된 주파수 빈에서의 출력들은, 글로벌 비용 함수 (global cost function) 가 최소화될 때까지 재배열된다. 더 상세하게, 각각의 주파수 빈에 대한 출력들은 모든 이용가능한 조합들로 재순서화되며, 각각의 치환에 있어서, 각각의 소스에 대한 비용 함수가 계산된다.

시스템 (650) 에서, 본래, 주파수 빈 1은 A-B-N 으로 배열되었다. 3개의 소스들이 도시되므로, 6개의 상이한 치환들이 주파수 빈내에서 배열될 수도 있다. 이러한 이용가능한 배열 (658) 은 순차적으로 적용된다. 각각의 배열에 있어서, 각각의 소스에 대한 비용값이 계산된다. 예를 들어, 주파수 1이 A-N-B 로 셋팅될 경우, 소스 1 (652), 및 소스 2 (654) 뿐만 아니라 소스 s에 대해 비용이 계산된다. 이러한 비용 함수는 글로벌 상관 특성 (665) 일 수도 있다. 다른 타입의 비용 함수가 사용될 수도 있거나, 다른 타입의 알고리즘이 최상의 피트를 결정하기 위해 사용될 수도 있다는 것을 인식할 것이다. 비교들에 의존하여, 최상의 피트를 갖는 배열이 선택된다. 시스템 (650) 에 도시된 바와 같이, 배열 B-A-N 이 최상의 피트를 갖는 것으로 선택된다.

따라서, 배열 B-A-N 은 주파수 1로 고정되며, 시스템 (650) 은, 도 13b에서의 블록 (657) 에 의해 나타낸 바와 같이 주파수 2를 재배열하도록 진행한다. 다시 한번, 선형 접근법은 주파수 빈내에서 출력들을 재배열하고, 각각의 소스에 대한 비용 함수들을 계산하며, 그 후, 가장 낮은 전체 비용 함수 또는 최상의 피트를 갖는 배열을 선택한다. 도 13b에 도시된 바와 같이, 배열 B-A-N 은 f2에 대해 최상의 피트를 갖는다. 따라서, B-A-N 은 f2 에 고정될 것이며, 선형 접근법은 f3 으로 진행할 것이다. 이러한 프로세스는, 모든 주파수들이 완료될 때까지 계속된다. 다중 전달이 사용될 수도 있다는 것을 인식할 것이다.

몇몇 실시형태에서, 본 발명은, 도 14에 도시된 바와 같은 치환 테이블을 재배열하는 프로세스에 관한 것이다. 프로세스 (700) 는 단계 702에서 시작하며, 여기서, 주파수 빈들내에서 출력들을 관련시키는 테이블이 신호 소스들에 제공된다. 프로세스 (700) 의 단계 704에서, 주파수 빈들 중 하나가 선택된다. 일 예에서, 주파수 빈은 제 1 주파수 빈일 수도 있지만, 시작 빈을 선택하는 다른 방식들이 사용될 수도 있다. 프로세스 (700) 의 단계 706에서, 출력 할당들이 주파수 빈내에서 재배열되며, 프로세스 (700) 의 단계 708에서, 글로벌 비용 함수가 각각의 소스에 대해 계산된다. 프로세스 (700) 의 단계 712에서, 모든 가능한 할당들이 시도되었는지를 확인한다. 모든 가능한 할당 조합들이 시도되지 않았다면, 프로세스 (700) 는 단계들 706, 708, 및 712 를 반복함으로써 계속된다. 그렇지 않으면, 프로세스 (700) 는 단계 715로 계속되며, 여기서, 최상의 전체 피트를 갖는 할당이 그 주파수 빈에 대한 출력 할당으로서 고정된다. 단계 715는 단계 708에서 계산된 결과적인 글로벌 비용 함수들을 비교하는 것을 포함할 수도 있다. 프로세스 (700) 의 단계 717에서, 모든 주파수 빈들이 테스트되고 고정되었는지를 확인한다. 모든 주파수 빈들이 테스트되었다면, 프로세스 (700) 는 단계들 704, 706, 708, 712, 715 및 717 을 반복함으로써 계속될 수도 있다. 그렇지 않으면, 프로세스 (700) 는 단계 719로 계속되며, 여기서, IFFT가 재순서화된 주파수 도메인 데이터에 적용된다. 프로세스 (700) 의 단계 723에서, 시간-도메인 신호가 생성된다.

몇몇 실시형태에서, 본 발명은, 도 15a에 도시된 바와 같은 다수의 그룹 재순서화 시스템에 관한 것이다. 재순서화 시스템 (750) 은, 하나의 축을 따라 할당된 다수의 소스들 및 다른 축들을 따라 할당된 주파수 빈들을 갖는다. 주파수 빈들의 그룹은 블록 (752) 에 도시된 바와 같이 선택된다. 단일 주파수 빈에 대해 동작하는 것 대신에, 시스템 (750) 은 다수의 빈들에 대해 동시에 동작한다. 더 상세하게, 본래 다수의 빈들 (752) 은 A-A, B-N 및 N-B 의 조합을 갖고 있었다. 재배열의 목적을 위해, 주파수 빈 1 및 주파수 빈 2에서의 출력들이 단일 엘리먼트로서 동시에 처리된다. 이러한 방식으로, 대안적인 배열들 (756) 에 의해 도시된 바와 같이 6개의 상이한 배열들이 이용가능하다. 대안적인 배열들 각각은 순차적으로 테스트되며, 소스 (754) 와 같은 각각의 소스에 대해 비용 함수가 계산된다. 글로벌 상관 또는 비용 함수 (758) 가 각각의 배열에 대해 적용되며, 최상의 피트를 제공하는 배열이 선택된다. 일단 선택되면, 최상의 피트 배열이 테이블에 삽입된다. 도 15a에 도시된 바와 같이, 배열 B-N, A-A, 및 N-B 가 최상의 피트를 제공하였다. 따라서, 그 배열은 도 15b에 도시된 바와 같이 f1 및 f2에 삽입된다.

프로세스 (750) 는 주파수 빈들의 또 다른 그룹 (761) 을 선택함으로써 진행한다. 도시된 바와 같이, 그 그룹은 이전의 그룹과 중첩할 수도 있다. 또한, 그룹들을 선택하는 임의의 방식이 사용될 수도 있다는 것을 인식할 것이다. 프로세스 (750) 는 이전에 설명된 바와 같이 진행한다. 예를 들어, f2 및 f3 가 동일 엘리먼트로서 동시에 처리되며, 그러한 선택 배열들 (756) 은 6개의 대안적인 배열들이 이용가능하다는 것을 나타낸다. 그 배열들 각각이 시도되며, 글로벌 비용 함수들이 각각의 배열에 대해 계산된다. 최상의 상관을 갖는 배열이 선택되며, 그 후, 그 배열은 치환 테이블에 삽입된다. 주파수 빈 그룹들의 전진은, 모든 주파수들이 사용될 때까지 계속된다. 다중 전달이 사용될 수도 있다는 것을 인식할 것이다. 또한, 다수의 그룹 프로세스 (750) 가 단일 세트 프로세스 (700) 와 결합되어 재순서화의 다중 전달을 제공할 수도 있다는 것을 인식할 것이다. 예를 들어, 제 1 전달은 단일 세트 재순서화를 사용할 수도 있고, 그 후, 하나 이상의 전달들은 다수의 세트 재순서화로 행해질 수도 있다. 또한, 다수의 세트 재순서화가 일 세트에서 2 또는 또 다른 수의 주파수 빈들을 사용할 수도 있다는 것을 인식할 것이다.

몇몇 실시형태에서, 도 16에 도시된 바와 같이, 본 발명은 치환 테이블을 재순서화하는 프로세스에 관한 것이다. 프로세스 (775) 는 단계 777에서 시작하며, 여기서, 주파수 빈들내에서 출력들을 관련시키는 테이블이 신호 소스들에 제공된다. 프로세스 (775) 의 단계 779에서, 다수의 주파수 빈들이 일 그룹으로서 함께 선택된다. 설명된 예에서, 그룹화된 주파수 빈들의 수는 2이지만, 상이한 수의 빈들이 선택될 수도 있다. 프로세스 (775) 의 단계 781에서, 출력 할당들이 동시에 재배열될 수도 있다. 프로세스 (775) 의 단계 783에서, 각각의 배열에 있어서, 글로벌 비용 함수가 각각의 소스에 대해 계산될 수도 있다. 프로세스 (775) 의 단계 785에서, 3개의 신호 소스들에 대해 6개의 서로 다른 이용가능한 배열들일 모든 배열들이 테스트되었는지의 여부가 판정될 수도 있다. 모든 배열들이 테스트되지 않았다면, 프로세스 (775) 는 단계들 781, 783 및 785를 반복한다. 그렇지 않으면, 프로세스 (775) 는, 최상의 피트 할당들이 고정되는 단계 787로 계속된다. 단계 787은, 모든 글로벌 비용 함수들을 비교하는 것, 및 최소의 글로벌 비용과 관련된 최상의-피트 할당을 식별하는 것을 포함할 수도 있다. 프로세스 (775) 의 단계 789에서, 모든 주파수 그룹들이 테스트되었는지의 여부가 판정될 수도 있다. 모든 주파수 그룹들이 테스트되지 않았다면, 프로세스 (775) 는, 단계들 779, 781, 783, 785, 787 및 789를 반복함으로써 다음의 주파수 블록으로 전진한다. 이러한 전진은 단번의 단일 빈일 수도 있거나, 상이한 스케줄에 따라 행해질 수도 있다. 일단 모든 주파수들이 재순서화되면, 다른 전달들은 다수의 그룹 프로세스, 또는 또 다른 재순서화 프로세스로 행해질 수도 있다. 프로세스 (775) 의 단계 791에서, IFFT가 재순서화된 출력들에 적용될 수도 있으며, 프로세스 (775) 의 단계 793에서, 분리된 시간 도메인 신호가 생성될 수도 있다.

몇몇 실시형태에서, 도 17에 도시된 바와 같이, 본 발명은 치환 테이블을 재배열하는 상향식 시스템에 관한 것이다. 재순서화 프로세스 (800) 는 소스들 (802) 과 관련된 주파수 빈들을 갖는다. 방법 (800) 을 사용할 시에, 주파수 빈들은 라인 (803) 에 의해 나타낸 바와 같이 쌍들로 그룹화된다. 예를 들어, 주파수 빈들 f1 및 f2가 쌍이 되고, 주파수 빈들 f3 및 f4가 쌍이 되며, 주파수 빈들 f5 및 f6이 쌍이 된다. 각각의 쌍에 있어서, 그 쌍의 하나의 멤버는 고정되지만, 그 쌍의 다른 멤버에 대한 출력들은 재배열된다. 예를 들어, 주파수 빈들 f1 및 f2를 나타내는 쌍 (803) 을 취한다. 주파수 빈 f2가 고정되므로, 세트 (805) 에서의 제 2 엘리먼트가 A-N-B 로 고정된다. 고정된 쌍의 제 2 멤버로, 쌍 (f1) 의 제 1 멤버가 재배열되며, 각각의 재배열에 대한 각각의 그룹내에서 비용 함수가 계산된다. 그 후, 최상의 피트를 갖는 출력들의 배열이 선택 및 고정된다. 이러한 방식으로, 세트 (805) 는 AA, NN, 및 BB 로 배열된다. 방법 (800) 은 주파수 빈들 각각을 쌍으로 하고, 제 1 레벨 (804) 에서 각각의 쌍에 대한 최상의 피트 할당을 생성한다. 세트 (805) 와 같은, 제 2 레벨 (801) 에서의 결과적인 세트들 각각은 그룹들로 유사하게 쌍으로 되고 그 쌍의 제 2 멤버의 출력 값들은 고정되지만, 그 쌍의 제 1 멤버에 대한 출력 값들은 재배열된다. 예를 들어, 레벨 3 (806) 에서의 제 1 세트는 출력들 AA, BB 및 NN이 고정된다는 것을 나타내며, 그 후, 쌍 (805) 의 제 1 멤버에 대한 출력들은 최상의 피트를 식별하도록 재배열된다. 일단 최상의 피트가 발견되면, 신규한 조합 세트가 생성된다. 유사한 방식으로, 레벨 3 (806) 에서의 세트들이 그룹들로 쌍이 되며, 프로세스는 레벨 4 (808) 에서 세트를 생성하도록 계속된다. 최종적으로, 최종 출력 (810) 을 생성하기 위해, 세트들은 쌍이 되고 결합된다.

몇몇 실시형태에서, 도 18에 도시된 바와 같이, 본 발명은 치환 테이블을 재배열하는 상향식 프로세스에 관한 것이다. 프로세스 (850) 는 단계 852에서 시작하며, 여기서, 주파수 빈들내에서 출력들을 관련시키는 테이플이 신호 소스들에 제공된다. 프로세스 (850) 의 단계 854에서, 세트들 중 2개의 세트가 선택되고 동일한 레벨로 쌍이 된다. 제 1 선택에 있어서, 각각의 세트는 개별 주파수 빈들에 대응할 수도 있지만, 더 높은 레벨에서는, 각각의 세트가 주파수 빈들의 그룹에 대응할 수도 있다. 프로세스 (850) 의 단계 856에서, 출력들 또는 엘리먼트들이 재배열된다. 더 상세하게, 단계 857에 나타낸 바와 같이, 세드들 중 하나의 세트의 값들은 고정되지만, 쌍의 다른 멤버의 값들은 재배열된다. 프로세스 (850) 의 단계 859에서, 각각의 그룹내에서 비용 함수가 계산된다. 프로세스 (850) 의 단계 861에서, 모든 배열들이 시도되었는지의 여부가 판정된다. 모든 배열들이 시도되지 않았다면, 프로세스 (850) 는 단계들 856, 857 및 859를 반복함으로써 계속된다. 그렇지 않으면, 프로세스 (850) 는 단계 863으로 계속되며, 여기서, 최상의 배열의 값들을 사용하여 고정된 다음 레벨에서 세트가 생성된다. 프로세스 (850) 의 단계 865에서, 그룹이 현재 레벨에서 최종 그룹인지의 여부가 판정된다. 최종 그룹이 아니라면, 프로세스 (850) 는 단계들 854, 856, 857, 859, 861, 863 및 865를 반복함으로써 계속된다. 그렇지 않다면, 프로세스 (850) 는 단계 868으로 계속되며, 여기서, 다음 레벨로 진행할지의 여부가 판정된다. 프로세스 (850) 는 다수의 레벨들을 통해 계속될 수도 있으며, 점진적으로 더욱 많은 빈들을 갖는 세트들을 생성할 수도 있다. 프로세스 (850) 가 다음 레벨로 진행하는 각각의 시간 동안, 단계들 854, 856, 857, 859, 861, 863, 865 및 868이 반복된다. 일단 최종 레벨에 도달하면, 프로세스 (850) 는 단계 871으로 계속되며, 여기서, IFFT가 출력 데이터에 적용된다. 프로세스 (850) 의 단계 873에서, 시간 도메인 신호가 생성될 수도 있다.

몇몇 실시형태에서, 도 19a 내지 도 19c에 도시된 바와 같이, 본 발명은 치환 테이블을 재배열하는 시스템에 관한 것이다. 도 19a에 도시된 바와 같이, 순서화 프로세스 (900) 는 하나의 축상에 리스트된 소스들을 갖지만, 주파수 빈들은 또 다른 축상에 리스트된다. 방법 (900) 에서, 주파수들 (902 및 904) 와 같은 2개의 초기 주파수들이 비교를 위해 선택된다. 더 상세하게, 중앙 주파수 (902) 에 대한 값들은 고정되고, 주파수 (904) 에 대한 출력 값들은, 풀 (901) 에서의 빈들의 비용 함수들이 최소화될 때까지 재배열된다. 이러한 방식으로, 주파수 빈 (904) 에 대한 출력은, 최상의 피트가 출력 (902) 에 관해 발견될 때까지 재배열된다. 예에서, 출력 (902) 은 주파수 빈들의 중앙 주파수로서 선택되지만, 주파수 (904) 는 1/4 주파수이다. 2개의 초기 주파수들을 선택하기 위해 다른 메커니즘들이 사용될 수도 있다는 것을 인식할 것이다. 다음으로, 또한 1/4 주파수 (906) 인 제 3 주파수가 풀에 부가되도록 선택된다. 주파수들 (902 및 904) 에 대한 값들이 고정되고, 주파수 빈 (906) 에 대한 출력들은, 최상의 피트가 발견될 때까지 재배열되며, 그 후, 최상의 피트 값들이 풀 (907) 로 삽입된다. 유사한 방식으로, 1/8 주파수가 다음에 적용되지만, 주파수들 (902, 904, 및 906) 은 풀에서 고정된다. 이러한 방식으로, 주파수 빈 (908) 에 대한 주파수 출력들은, 최상의 피트가 발견될 때까지 재배열되며, 도 19b에 도시된 바와 같이, 최상의 피트 값들은 주파수 풀 (909) 에 삽입된다. 도 19c에 도시된 바와 같이, 방법 (900) 은 다른 1/8 주파수들을 부가하는 것을 계속하고, 그 후, 전체 풀 (901) 이 블록 (915) 에 의해 나타낸 바와 같이 채워질 때까지 1/16 주파수들 (및 존재한다면, 1/32 주파수들, 1/64 주파수 등) 로 전진한다. 주파수 비교들을 선택하고 순서화하는 다른 프로세스들이 사용될 수도 있다는 것을 인식할 것이다.

몇몇 실시형태에서, 도 20에 도시된 바와 같이, 본 발명은 치환 테이블을 재배열하는 프로세스에 관한 것이다. 프로세스 (950) 는 단계 952에서 시작하며, 여기서, 주파수 빈들내에서 출력들을 관련시키는 테이블이 신호 소스들에 제공된다. 프로세스 (950) 의 단계 954에서, 시작 주파수 빈이 선택되고 재순서 풀에 부가된다. 일 예에서, 프로세스 (950) 는 단계 955를 포함하며, 여기서, 시작 주파수가 중앙으로 선택된다. 프로세스 (950) 의 단계 957에서, 1/2 주파수, 후속하여 1/4 주파수들, 후속하여 1/8 주파수 등 (958) 일 수도 있는 또 다른 주파수 빈이 선택된다. 프로세스 (950) 의 단계 961에서, 출력들에 대한 소스 할당이 선택된 주파수 빈에서 재배열되며, 프로세스 (950) 의 단계 963에서, 각각의 배열에 대한 풀내에서 비용 함수가 계산된다. 프로세스 (950) 의 단계 967에서, 모든 배열들이 시도되었는지의 여부가 판정된다. 모든 배열들이 시도되지 않았다면, 프로세스 (950) 는 단계들 961, 963 및 965를 반복함으로써 계속된다. 그렇지 않으면, 프로세스 (950) 는 단계 967로 계속되며, 여기서, 최상의 피트를 갖는 배열이 재순서 풀에 부가된다. 프로세스 (950) 의 단계 969에서, 모든 주파수들이 재순서 풀에 부가되었는지의 여부가 판정된다. 모든 주파수들이 부가되지 않았다면, 프로세스 (950) 는 단계들 957, 961, 963, 965, 967 및 969를 반복함으로써 계속된다. 그렇지 않으면, 프로세스 (950) 는 단계 972로 계속되며, 여기서, 재순서화된 풀은 IFFT로 전송된다. 프로세스 (950) 는 단계 973으로 계속될 수도 있으며, 여기서, 시간 도메인 신호들이 생성된다.

몇몇 실시형태에서, 도 21에 도시된 바와 같이, 본 발명은 치환 테이블을 재배열하는 프로세스에 관한 것이다. 프로세스 (975) 는 단계 977에서 시작하며, 여기서, 롤링 윈도우에서 어쿠스틱 신호들이 획득될 수도 있다. 프로세스 (975) 의 단계 979에서, FFT가 그 윈도우들에 적용될 수도 있으며, 프로세스 (975) 의 단계 981에서, FFT 결과들이 신호 분리 프로세스로의 입력으로서 사용된다. 프로세스 (975) 의 단계 983에서, 소스들에 따라 주파수 빈들내에서 출력들을 배열하는 테이블이 생성된다. 그 테이블은 도면부호 (985) 에 도시된 바와 같이 재순서화될 수도 있다. 더 상세하게, 하향식 프로세스가 블록 986에서 나타낸 바와 같이 적용될 수도 있고, 상향식 프로세스가 블록 987에서 나타낸 바와 같이 적용될 수도 있고, 선형 단일 세트가 블록 988에서 나타낸 바와 같이 적용될 수도 있으며, 및/또는 선형 다수 세트가 블록 989에서 나타낸 바와 같이 적용될 수도 있다. 재순서화 프로세스 각각의 세부사항들은 이전에 설명되었으므로, 더 상세히 설명되지 않을 것이다. 프로세스 (975) 는 단계 992로 계속되며, 여기서, 또 다른 재순서 전달이 행해지는지 여부가 판정된다. 그 전달이 행해진다면, 프로세스 (975) 는 블록 985에서 반복한다. 예를 들어, 다수의 선형 단일 세트 프로세스 (988), 또는 다수의 선형 다수 세트들 (989) 을 수행하는 것이 바람직할 수도 있다. 단일 및 다수의 세트 선형 프로세스들의 상이한 조합들이 사용될 수도 있다는 것을 이해할 것이다. 또 다른 예에서, 하향식 (986) 또는 상향식 (987) 프로세스가 먼저 적용되고, 그 후, 선형 프로세스가 적용될 수도 있다. 그러나, 통상적으로 하향식 (986) 및 상향식 (987) 프로세스가 서로 배타적이며, 통상적으로 하향식 (986) 또는 상향식 (987) 프로세스들이 선형 프로세스를 사용한 이후에 적용된다는 것을 인식할 것이다. 단계 992에서, 부가적인 재순서 전달이 수행되지 않는다면, 프로세스 (975) 는 단계 994로 계속되며, 여기서, IFFT가 재순서화된 주파수 도메인 데이터에 적용된다. 프로세스 (975) 의 단계 996에서, 분리된 시간 도메인 신호가 생성된다.

상기 섹션에서, 도 13a의 도면부호 (656) 와 같은 주파수 빈의 소정의 치환, 또는 도 15a의 블록 752와 같은 주파수 빈들의 그룹은, 치환이 선택된 경우, 모든 소스들에 대한 "글로벌 상관" 비용 함수의 결과적인 합산에 기초하여 평가된다는 것을 언급하였다. 이러한 합산은, "전체 (grand) 글로벌 상관 비용 함수" 로서 지칭된다. 도 12를 참조하면, 이러한 글로벌 상관 비용 함수는, 시간에 걸쳐 하나의 소스, 즉, 소스 2 내에서, 주파수들 사이의 코히런스를 샘플 윈도우 롤 포워드 (roll forward) 로서 측정한다. 일 주파수로부터의 복소값 Q들 (블록 609) 이 또 다른 주파수로부터의 복소값 Q들과 공동-활성화될 경우, 이러한 2개의 주파수들은 높은 상관도를 가질 것이며, 코히런스하다고 지칭된다. 주파수들의 세트에 대한 글로벌 상관 비용 함수는 세트내의 모든 주파수 쌍들에 대한 코히런스 측정치들의 합산일 수 있다. 또한, 이것은, 세트내의 모든 주파수 트리플렛 (triplet) 에 대한 코히런스 측정치의 합산일 수 있다. 주파수들 사이의 코히런스를 반영하는 비용 함수의 임의의 형태가 프로세스들 (700, 775, 850 및 950) 에 의해 사용되어, 주파수 빈 또는 주파수 빈들의 그룹의 최상의 피트 치환을 결정할 수 있다는 것을 인식할 것이다. 예를 들어, (여기에 그 전체가 참조로서 포함되는, Taesu Kim, Hagai Attias, Soo-Young Lee, 및 Te-Won Lee의 "Blind source separation exploiting higher-order frequency dependencies", IEEE Trans. Speech Audio Processing, vol. 14, no. 1, 2006) 에 설명된 바와 같은 독립적인 벡터 분석 비용 함수는 치환 최적화를 위한 코히런스를 측정하는데 사용될 수도 있다. 글로벌 상관 비용 함수가 소스 내의 모든 주파수들에 대해 정의될 필요가 없다는 것을 유의해야 한다. 비용 함수는 주파수들의 임의의 세트에 적용될 수 있다. 이러한 세트는 도 12의 소스내의 모든 주파수들 (604) 을 참조할 수도 있다. 또한, 이러한 세트는 블록 805와 같은 2개의 주파수들의 그룹, 또는 블록 806 또는 이와 유사한 블록과 같은 4개의 주파수들의 그룹일 수도 있다.

주파수 도메인에서 입력 신호를

로서 나타낸다. 여기에서,

는 복소값 벡터이며, 각각의 엘리먼트는 M개의 채널들의 각각의 입력을 나타낸다. ω는 주파수를 나타내고, l은 윈도우 인덱스이다. 신호 분리 이후, 출력은, N개의 출력 채널들이 존재한다는 것을 의미하는,

로서 나타낸다.

일 실시형태에서, 주파수들의 그룹 ω_a 에 대한 코히런스 함수는,

이다. 주파수들의 2개의 그룹들 ω_a, ω_b 에 대한 코히런스 함수는,

이다. 주파수들의 그룹 ω_a 에 대한 전체 코히런스 함수는 전체 출력 채널들에 걸친 코히런스 함수의 정확한 합산이다.

글로벌 코히런스 함수는,

이며, 여기서, Ω는 주파수 빈들의 총 수이고, 전체 글로벌 코히런스 함수는,

이다.

또 다른 실시형태에서, 하나의 출력 채널 n에 대한 2개의 주파수들 ω₁, ω₂ 사이의 상관 함수는 다음과 같이 정의된다.

주파수들의 2개의 그룹들 ω_a, ω_b 사이의 상관 비용 함수는,

이며, 주파수들의 2개의 그룹들 ω_a, ω_b에 대하여 모든 출력 채널들에 대한 전체 글로벌 상관은,

이다.

2개의 그룹들 각각이 주파수들의 전체 세트를 포함할 경우, 상관 함수는 하나의 채널의 글로벌 상관이 되고,

모든 출력 채널들 및 모든 주파수들에 대한 전체 글로벌 상관은,

이다.

선형 접근법, 즉, 주파수 치환 정정을 위한 선형 접근법에서, 주파수들은 스캐닝될 수도 있으며, 각각의 주파수에 대하여, 벡터

의 엘리먼트들은 K 또는 C를 최적화하도록 치환된다. g개의 이웃 주파수들을 스캐닝할 경우, 그 주파수들을 함께 치환하여, K 또는 C를 최적화할 수도 있다. 선형 접근법에 대한 의사 코드는 다음과 같다.

주파수 치환 정정을 위한 상향식 접근법은,

또는

를 최적화하기 위해 이웃 주파수들의 쌍

을 치환하는 것을 포함할 수도 있다. 이는 다른 쌍들에 대해 반복될 수도 있다. 다음으로, 쌍 ω_a, ω_b의 이웃 쌍은

또는

를 최적화하도록 치환될 수도 있 다. 이러한 프로세스는 쌍의 다른 쌍들에 대해 반복될 수도 있다. 다음으로, 쌍의 쌍의 이웃 쌍은 그들의 K 또는 C를 최적화하도록 치환된다. 이것은, 쌍의 쌍의...쌍이 더 이상 형성될 수 없을 때까지 반복된다. 의사 코드는 아래와 같이 주어진다.

하향식 접근법은 중앙 주파수만을 갖는 풀로 시작될 수도 있으며, 그 후, 단번에 하나의 1/4 주파수를 그 풀에 부가한다. 신규하게 부가된 주파수는, 그 풀에서의 주파수들의 그룹 ω_a 에 대한 K(ω_a) 또는 C(ω_a) 를 최적화하기 위해 치환될 수도 있다. 의사 코드는 아래와 같이 주어진다.

디바이스

여기에서의 임의의 방법 또는 프로세스는 디바이스에 포함될 수도 있다. 프로세스들의 단계들은 그 디바이스의 모듈들 또는 서브-모듈들로서 포함될 수도 있다. 몇몇 실시형태에서, 디바이스는 스피치 디바이스이다. 그 스피치 디바이스는 헤드셋, 무선 이동 핸드셋 또는 전화기일 수도 있다. 디바이스는 하나 이상의 마이크로폰을 포함할 수도 있다. 디바이스는 마이크로폰들의 어레이를 포함할 수도 있다.

또한, 디바이스는 의료 디바이스일 수도 있다. 예를 들어, 그 디바이스는 EKG 또는 EEG 데이터를 분리하는데 사용될 수도 있다.

여기에 설명된 방법, 프로세스, 또는 시스템은 실시간으로 데이터를 프로세싱하는데 사용될 수도 있거나, 데이터를 사후-프로세싱하는데 사용될 수도 있다.

몇몇 실시형태에서, 본 발명은, 여기에 설명된 프로세스 또는 방법을 수행하기 위한 모듈들을 포함하는 컴퓨터 또는 소프트웨어에 관한 것이다. 컴퓨터는 메모리, 프로세서, 및/또는 디스플레이를 포함할 수도 있다. 컴퓨터는 여기에 설명된 또 다른 디바이스, 예를 들어, 헤드셋에 접속될 수도 있다.

본 발명의 실시형태들이 여기에 설명된 프로세스들을 포함하며, 그 프로세스에서, 단계들은 생략, 부가, 또는 재배열된다는 것을 이해할 것이다.

Claims

주파수-도메인 제 1 신호들의 세트를 수신하는 단계로서, 상기 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 상기 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 상기 수신하는 단계,

상기 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 단계로서, 상기 주파수-도메인 제 2 신호들의 세트는 상기 복수의 주파수들의 개별 주파수들에 대응하는 분리된 주파수-도메인 제 2 신호 엘리먼트들의 세트를 포함하고, 상기 주파수-도메인 제 2 신호 엘리먼트 각각은, 상기 주파수-도메인 제 2 신호들의 어느 세트가 상기 주파수-도메인 제 2 신호 엘리먼트를 포함하는지를 나타내는 식별자를 할당받는, 상기 주파수-도메인 제 1 신호들의 세트를 분리하는 단계, 및

주파수-도메인 제 3 신호들의 세트를 생성하기 위하여, 상기 주파수-도메인 제 2 신호들의 코히런스 (coherence) 를 개선시키도록 적어도 하나의 주파수에 대응하는 식별자들을 재순서화하는 단계를 포함하는, 신호 분리 방법.
제 1 항에 있어서,

상기 주파수-도메인 제 1 신호들의 세트를 분리하는 단계는 블라인드-소스 분리 방법을 포함하는, 신호 분리 방법.
제 2 항에 있어서,

상기 블라인드-소스 분리 방법은, 개별 주파수들에 대응하는 상기 주파수-도메인 제 1 신호 엘리먼트들에 적용되는, 신호 분리 방법.
제 1 항에 있어서,

상기 코히런스는 상이한 주파수의 신호들의 공동-활성도 (co-activity) 를 반영하는 함수를 포함하는, 신호 분리 방법.
제 1 항에 있어서,

상기 주파수-도메인 제 2 신호들의 코히런스를 개선시키는 것은 상기 주파수-도메인 제 2 신호들의 코히런스를 최적화하는 것을 포함하는, 신호 분리 방법.
제 1 항에 있어서,

상기 주파수-도메인 제 2 신호들의 코히런스를 개선시키는 것은 인접한 주파수-도메인 제 2 신호 엘리먼트들의 쌍의 코히런스를 개선시키는 것을 포함하는, 신호 분리 방법.
제 6 항에 있어서,

상기 식별자들을 재순서화하는 단계는 복수의 주파수들에 대응하는 식별자들 을 재순서화하는 단계를 포함하며,

상기 식별자들을 재순서화하는 단계는, 상기 복수의 주파수들의 낮은 주파수로부터 상기 복수의 주파수들의 높은 주파수로 상기 식별자들을 순차적으로 재순서화하는 단계를 더 포함하는, 신호 분리 방법.
제 6 항에 있어서,

상기 식별자들을 재순서화하는 단계는 복수의 주파수들에 대응하는 식별자들을 재순서화하는 단계를 포함하며,

상기 식별자들을 재순서화하는 단계는, 상기 주파수-도메인 제 2 신호 엘리먼트들의 비-중첩 쌍들 사이의 코히런스를 개선시키는 단계를 더 포함하는, 신호 분리 방법.
제 1 항에 있어서,

상기 주파수-도메인 제 2 신호들의 코히런스를 개선시키는 것은,

주파수들의 제 1 서브세트에 대응하는 주파수-도메인 제 2 신호 엘리먼트들의 코히런스를 최적화하는 것; 및

주파수들의 제 2 서브세트에 대응하는 주파수-도메인 제 2 신호 엘리먼트들의 코히런스를 최적화하는 것을 포함하며,

상기 주파수들의 제 2 서브세트는 상기 주파수들의 제 1 서브세트보다 크고,

상기 주파수들의 제 2 서브세트는 상기 주파수들의 제 1 서브세트를 포함하 는, 신호 분리 방법.
제 1 항에 있어서,

상기 주파수-도메인 제 1 신호들의 세트를 생성하기 위해, 시간-도메인 입력 신호들의 세트를 변환하는 단계를 더 포함하는, 신호 분리 방법.
제 10 항에 있어서,

상기 시간-도메인 입력 신호들은 어쿠스틱 신호 혼합물인, 신호 분리 방법.
제 11 항에 있어서,

상기 어쿠스틱 신호 혼합물은 스피치 신호를 포함하는, 신호 분리 방법.
제 1 항에 있어서,

상기 주파수-도메인 제 3 신호들의 세트의 주파수-도메인 제 3 신호를 역변환하여 원하는 신호를 생성하는 단계를 더 포함하는, 신호 분리 방법.
주파수-도메인 제 1 신호들의 세트를 수신하는 단계로서, 상기 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 상기 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 상기 수신하는 단계;

학습 법칙 (learning rule) 을 포함하는 독립적인 벡터 분석 (IVA) 방법을 사용하여, 상기 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 단계; 및

상기 학습 법칙에 하나 이상의 제약들을 적용하는 단계를 포함하는, 신호 분리 방법.
제 14 항에 있어서,

상기 하나 이상의 제약들은 상기 주파수-도메인 제 2 신호들의 세트로부터 유도되는, 신호 분리 방법.
제 14 항에 있어서,

상기 학습 법칙에 하나 이상의 제약들을 적용하는 단계는, 로컬 최소값 또는 최대값으로 수렴할 확률을 감소시키는, 신호 분리 방법.
제 14 항에 있어서,

주파수-도메인 제 1 신호들의 제 2 세트를 수신하는 단계; 및

제약된 신호 분리 방법을 사용하여 상기 주파수-도메인 제 1 신호들의 제 2 세트를 분리하는 단계를 더 포함하는, 신호 분리 방법.
제 14 항에 있어서,

상기 하나 이상의 제약들은 기하학적 제약들을 포함하는, 신호 분리 방법.
제 18 항에 있어서,

상기 기하학적 제약들은 추정된 도달 방향 정보를 포함하며,

상기 도달 방향 정보는, 공지된 센서 위치들을 사용하여 히스토그램 및/또는 다른 통계적 기술들로부터 출력 신호 서브대역들을 계산함으로써 추정되는, 신호 분리 방법.
제 14 항에 있어서,

상기 하나 이상의 제약들은 신호의 스펙트럼 특성 또는 에너지 특성에 관한 정보를 포함하는, 신호 분리 방법.
제 20 항에 있어서,

상기 신호는, 주파수-도메인 제 1 신호, 원하는 출력 신호, 및 원치않는 출력 신호로부터 선택되는, 신호 분리 방법.
제 14 항에 있어서,

상기 하나 이상의 제약들은 비-유도된 제약들을 포함하는, 신호 분리 방법.
시간-도메인 입력 신호들의 세트를 수신하는 수신기;

상기 시간-도메인 입력 신호들의 세트를 주파수-도메인 제 1 신호들의 세트로 변환하는 변환기 모듈로서, 상기 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 상기 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 상기 변환기 모듈;

상기 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 주파수-도메인 신호 분리기 모듈로서, 상기 주파수-도메인 제 2 신호들의 세트는 상기 복수의 주파수들의 개별 주파수들에 대응하는 분리된 주파수-도메인 제 2 신호 엘리먼트들의 세트를 포함하고, 상기 주파수-도메인 제 2 신호 엘리먼트 각각은, 상기 주파수-도메인 제 2 신호들의 어느 세트가 상기 주파수-도메인 제 2 신호 엘리먼트를 포함하는지를 나타내는 식별자를 할당받는, 상기 주파수-도메인 신호 분리기 모듈; 및

주파수-도메인 제 3 신호들의 세트를 생성하기 위해, 상기 주파수-도메인 제 2 신호들의 코히런스를 개선시키도록 적어도 하나의 주파수에 대응하는 식별자들을 재순서화하는 재순서화 모듈을 포함하는, 신호 분리 시스템.
제 23 항에 있어서,

상기 주파수-도메인 신호 분리기 모듈은, 독립적인 컴포넌트 분석 방법 또는 독립적인 벡터 분석 방법을 사용함으로써, 상기 주파수-도메인 제 1 신호들의 세트를 분리하는, 신호 분리 시스템.
제 23 항에 있어서,

상기 재순서화 모듈은,

대응하는 주파수를 결정함으로써 재순서화될 제 1 의 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 초기 파라미터 서브-모듈;

미리-결정된 주파수에 인접한 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과 상기 미리-결정된 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과의 코히런스를 개선시키는 코히런스 개선 서브-모듈; 및

재순서화될 후속 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 주파수-전진 서브-모듈을 포함하며,

상기 주파수-전진 서브-모듈은, 상기 후속 주파수-도메인 제 2 신호 엘리먼트들을, 가장-최근에 재순서화된 주파수-도메인 제 2 신호 엘리먼트들에 대응하는 주파수에 인접한 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들로서 결정하는, 신호 분리 시스템.
제 23 항에 있어서,

상기 재순서화 모듈은,

대응하는 주파수를 결정함으로써 재순서화될 제 1 의 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 초기 파라미터 서브-모듈;

미리-결정된 주파수에 인접한 주파수에 대응하는 주파수-도메인 제 2 신호 엘리먼트들과 상기 미리-결정된 주파수에 대응하는 주파수-도메인 제 2 신호 엘리 먼트들과의 코히런스를 개선시키는 코히런스 개선 서브-모듈; 및

재순서화될 후속 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 주파수-전진 서브-모듈을 포함하며,

상기 주파수-전진 서브-모듈은, 상기 후속 주파수-도메인 제 2 신호 엘리먼트들을, 상기 코히런스 개선 서브-모듈에 의해 이전에 분석되지 않은 주파수-도메인 제 2 신호 엘리먼트들로서 결정하는, 신호 분리 시스템.
제 23 항에 있어서,

상기 재순서화 모듈은,

재순서화 엘리먼트들의 그룹의 초기 상태를, 적어도 하나의 주파수에 대응하는 제 1 의 주파수-도메인 제 2 신호 엘리먼트들로서 결정하는 초기 파라미터 서브-모듈;

상기 재순서화 엘리먼트들의 그룹내에서 주파수-도메인 제 2 신호 엘리먼트들의 코히런스를 개선시키는 코히런스 개선 서브-모듈; 및

상기 재순서화 엘리먼트들에 부가될 주파수-도메인 제 2 신호 엘리먼트들을 결정하는 주파수-전진 서브-모듈을 포함하는, 신호 분리 시스템.
제 23 항에 있어서,

상기 주파수-도메인 제 3 신호들의 세트의 주파수-도메인 제 3 신호를 역변환하여 원하는 신호를 생성하는 역변환기 모듈을 더 포함하는, 신호 분리 시스템.
제 27 항에 있어서,

상기 신호 분리 시스템은 헤드셋을 포함하는, 신호 분리 시스템.
제 27 항에 있어서,

상기 신호 분리 시스템은 전화기를 포함하는, 신호 분리 시스템.
시간-도메인 입력 신호들의 세트를 수신하는 수신기;

상기 시간-도메인 입력 신호들의 세트를 주파수-도메인 제 1 신호들의 세트로 변환하는 변환기 모듈로서, 상기 주파수-도메인 제 1 신호들 각각은 복수의 주파수들에 대응하는 주파수-도메인 제 1 신호 엘리먼트들을 포함하고, 상기 주파수-도메인 제 1 신호들의 세트는 복수의 신호 소스들을 포함하는, 상기 변환기 모듈;

학습 법칙을 포함하는 독립적인 벡터 분석 (IVA) 방법을 사용하여, 상기 주파수-도메인 제 1 신호들의 세트를 주파수-도메인 제 2 신호들의 세트로 분리하는 주파수-도메인 신호 분리기 모듈; 및

하나 이상의 제약들을 상기 학습 법칙에 부과하는 제약 부과기 모듈을 포함하는, 신호 분리 시스템.
제 31 항에 있어서,

상기 주파수-도메인 제 2 신호들의 세트로부터 상기 하나 이상의 제약들을 유도하는 제약 유도기 모듈을 더 포함하는, 신호 분리 시스템.
제 31 항에 있어서,

상기 하나 이상의 제약들은 기하학적 제약들을 포함하는, 신호 분리 시스템.
제 33 항에 있어서,

상기 기하학적 제약들은 추정된 도달 방향 정보를 포함하는, 신호 분리 시스템.
제 34 항에 있어서,

상기 도달 방향 정보는, 공지된 센서 위치들을 사용하여 히스토그램 및/또는 다른 통계적인 기술들로부터 출력 신호 서브대역들을 계산함으로써 추정되는, 신호 분리 시스템.
제 31 항에 있어서,

상기 하나 이상의 제약들은 비-유도된 제약들을 포함하는, 신호 분리 시스템.
제 31 항에 있어서,

상기 하나 이상의 제약들은 상기 주파수-도메인 신호 분리기 모듈에서의 신호의 스펙트럼 특성 또는 에너지 특성에 관한 정보를 포함하는, 신호 분리 시스템.
제 31 항에 있어서,

상기 신호 분리 시스템은 헤드셋을 포함하는, 신호 분리 시스템.
제 31 항에 있어서,

상기 신호 분리 시스템은 전화기를 포함하는, 신호 분리 시스템.