KR20020093873A - 음성 신호 추출 방법 및 장치 - Google Patents

음성 신호 추출 방법 및 장치 Download PDF

Info

Publication number
KR20020093873A
KR20020093873A KR1020027013033A KR20027013033A KR20020093873A KR 20020093873 A KR20020093873 A KR 20020093873A KR 1020027013033 A KR1020027013033 A KR 1020027013033A KR 20027013033 A KR20027013033 A KR 20027013033A KR 20020093873 A KR20020093873 A KR 20020093873A
Authority
KR
South Korea
Prior art keywords
microphone
signal
receiver
array
receiver element
Prior art date
Application number
KR1020027013033A
Other languages
English (en)
Inventor
겜즈 에르텐
Original Assignee
클라리티 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 클라리티 엘엘씨 filed Critical 클라리티 엘엘씨
Publication of KR20020093873A publication Critical patent/KR20020093873A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/405Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

적어도 2개 엘리먼트를 포함하는 마이크로폰 배열의 개별 엘리먼트들을 위치시키기 위한 방법이 제공된다. 마이크로폰 엘리먼트들간의 간격은 관련 시호와 간섭 소스의 합의 다수의 결합의 발생을 지원한다. 마이크로폰 엘리먼트 배치 방법의 사용은 적어도 2개 마이크로폰 엘리먼트로 이루어진는 다수 유형의 마이크로폰 배열의 형성을 유도하며 입력 데이터를 사운드 식별을 위한 신호 처리 시스템으로 제공한다. 이러한 마이크로폰 배열의 수많은 예들이 제공되며, 그 일부는 일상적인 물체와 함께 통합된다. 또한 인핸스먼트와 확장은 사운드 식별을 위한 신호 분리-기반 처리 시스템에 제공되며, 이는 마이크로폰 배열을 감지 전단부로서 사용한다.

Description

음성 신호 추출 방법 및 장치{METHOD AND APPARATUS FOR VOICE SIGNAL EXTRACTION}
음성-기반 시스템과 기술은 점점 더 평범해지고 있다. 더 대중적인 디플로이먼트(deployment)의 일부중에는 셀룰러 텔레폰, 휴대용 컴퓨팅 디바이스, 및 음성(speech) 인식 기능성에 의존하는 시스템이 있다. 따라서, 음성 기반 기술이 점점 더 평범해짐에 따라, 그러한 음성-기반 기술의 확산과 사용자 채택에 대한 1차적인 장애는 음성 신호를 훼손시키며 음성 처리 결과의 성능과 품질을 저하시키는 잡음원 또는 간섭원이다. 잡음 소거 필터 및 잡음 소거 마이크로폰과 같은 현재 상업적인 교정책은 다양한 현실 세계 상황을 처리하기에 부적절하여, 기껏해야 제한된 개선을 제공하며, 때때로 더욱더 악화시킨다.
음성 신호의 잡음 훼손은 다른 음성 소스를 포함하는 환경에 제공된 대상으로부터 발산하는 음파(sound wave)가 관련 음성 소스에 의해 생성된 음파와 혼합 및 간섭할 때 발생한다. 간섭은 3차원을 따라 발생한다. 이들 차원은 시간, 주파수, 및 도달 방향이다. 시간 중첩은 수신 트랜스듀서 또는 디바이스에서 동시에 레지스트(register)되는 다중 음파의 결과로서 발생한다. 주파수 또는 스펙트럼 중첩은 혼합되는 음원(sound source)들이 공통 주파수 성분을 가질 때 발생하며 특히 다루기 힘들다. 도달 방향의 중첩은 음원들이 수신 디바이스 주위에서 임의의 위치를 차지하며 해당 음파의 전달에서 유사한 방향 속성을 나타내기 때문에 발생한다.
시간 중첩은 음향 트랜스듀서 또는 마이크로폰에서 혼합된 신호 수신의 결과이다. 혼합된 신호는 음원 속성의 조합을 포함하여, 음질 이외에 신호의 후속적인 처리의 결과를 저하시킨다. 시간 중첩에 대한 통상의 해결책은 주파수, 콘텐트(content), 또는 도달 방향에서 특징적인 신호 속성을 기초로 하여 시간 중첩하는 신호들간을 식별한다. 그러나, 통상의 해결책은 동시에 시간, 스펙트럼, 또는 도달 방향에서 중첩하는 신호들을 식별할 수는 없다.
통상의 기술은 2가지 일반 그룹: 공간 필터 그룹과, 주파수 필터 그룹으로 분류된다. 공간 필터 그룹은 각각의 신호 도달 방향을 기초로 하여 신호들을 식별하는 공간 필터를 사용한다. 부합하여, 주파수 필터 그룹은 각각의 신호 주파수 특성을 기초로 하여 신호들을 식별하는 주파수 필터를 사용한다.
주파수 필터에 관하여, 다중원(multiple source)으로부터 발생하는 신호들이 스펙트럼에서 중첩하지 않으며, 신호들의 주파수 콘텐트가 공지되어 있을 때, 저역필터, 대역필터, 고역필터, 또는 이들의 조합과 같은 주파수 필터 세트가 사용되어 문제점을 해결할 수 있다. 주파수 필터들은 바람직한 신호의 성분이 아닌 주파수 성분들을 필터링하는데 사용된다. 그러므로, 주파수 필터들은 수반하는 주변 간섭오디오 신호들을 업압시킴으로써 특히 바람직한 신호들을 아이솔레이팅(isolating)시 제한된 개선점을 제공한다. 그러나, 또한, 통상의 주파수 필터-기반 해결책은 주파수 콘텐트, 즉 스펙트럼에서 중첩하는 신호들을 구별할 수는 없다.
잡음 억압의 예시적인 주파수 기반 방법은 스펙트럼 삭제(subtraction)이며, 이는 화자(speaker)가 무성일 때의 주기동안 잡음 내용을 기록하며 화자가 활성일 때 기록된 신호로부터 이 잡음 내용의 스펙트럼을 삭제한다. 이는 부자연스러운 효과를 생성시키며 잡음 신호와 함께 음성 신호의 일부를 불가피하게 제거한다.
다중원으로부터 발생하는 신호들은 도달 방향에서 약간 또는 전혀 중첩을 갖지 않으며 관련 신호의 도달 방향이 공지되어 있을 때, 문제점은 대개 공간 필터의 사용으로 해결될 수 있다. 수많은 어레이 마이크로폰들은 공간 필터링 기술을 사용한다. 방향성 마이크로폰 또한 마이크로폰의 바람직하지 않은 방향으로부터 도달하는 신호들의 일부 감쇄를 제공한다. 예를 들면, 지향성 마이크로폰을 입에 대고 있음로써, 화자(speaker)는 지향성 마이크로폰이 우선적으로 그/그녀의 음성을 포착하게 보장할 수 있다. 그러나, 방향성 마이크로폰은 시간 및 스펙트럼에서의 중첩으로부터 야기하는 문제점들을 해결할 수는 없다.
따라서, 현재 기술들은 수많은 다른 경쟁적인 잡음 소거 기술들처럼 잡음을 억압시키는데, 이는, 바람직한 신호의 일정 부분이 필터링 과정중에 실질적으로 필터링되거나 또는 와전될 수 있기 때문에, 반드시 바람직한 신호를 아이솔레이션(isolation)시키는 것은 아니다. 게다가, 설계 매개변수내에서 움직이도록 하기 위해서, 통상 기술은 일반적으로 간섭 사운드가 서로 다른 방향으로부터도달하거나, 또는 서로 다른 주파수 성분을 함유하는 것을 필요로 한다. 따라서, 현재 기술은 음향과 환경 조건의 규정된 범위로 제한된다.
결국, 순수한 오디오 신호를 생성시키기 위해 사용된 통상의 기술은 모든 환경의 동시 고려를 요구하는 다양한 현실 세계 상황(예를 들면, 시간 중첩, 도달 방향의 중첩, 스펙트럼의 중첩)을 처리하지 못하는 단점을 갖고 있다. 따라서, 모든 유형의 신호 간섭을 고려하는 다양한 현실 세계 잡음 상황을 처리하는 장치 및 방법이 필요하다.
개요
적어도 2개 마이크로폰 엘리먼트(element)를 포함하는 마이크로폰 배열의 개별 엘리먼트를 위치시키는 방법이 제공된다. 관련 신호원의 잠재적인 위치 이외에 간섭 신호원의 잠재적인 위치를 추정시, 기준 세트는 신호 처리 시스템의 채택가능한 성능에 대해 규정된다. 신호 처리 시스템은 관련 신호와 관련 신호를 간섭하는 신호를 구별한다. 기준을 규정한 이후, 마이크로폰 배열의 제 1 엘리먼트가 편리한 위치에 위치된다. 규정된 기준은 후속 마이크로폰 엘리먼트들의 배치에 대한 제약의 장소를 정한다. 2개 마이크로폰 배열에 대해, 기준은 2개 마이크로폰 엘리먼트들에 의해 레지스트되는 동일 신호를 초래하는 마이크로폰 배치의 회피와, 2개 마이크로폰 엘리먼트들에서 레지스트되는 간섭 음원이 유사 특성을 갖도록 마이크로폰 엘리먼트들을 위치시키는 것을 포함한다. 2개 마이크로폰 엘리먼트 이상을 포함하는 마이크로폰 배열에 대해, 일부 기준은 완화되거나, 부가적인 제약이 부가된다. 마이크로폰 배열에서 마이크로폰 엘리먼트들의 수에 관계 없이, 마이크로폰 배열의 후속 엘리먼트들은 마이크로폰의 특정 수에 대한 규정된 기준의 세트에 충실을 보장하는 방식으로 위치된다.
위치지정 방법은 다수의 마이크로폰 어레이 또는 배열을 제공하는데 사용된다. 그러한 마이크로폰 배열의 수많은 예들이 제공되며, 그 일부는 일상적인 물체와 함께 통합된다. 게다가, 이들 방법은 입력 데이터를 사운드 식별을 위한 신호 처리 시스템 또는 언어 처리 시스템으로 제공하는데 사용된다. 게다가, 인핸스먼트와 확장은 마이크로폰 배열을 감지 전단부로서 사용하는 사운드 식별을 위한 신호 처리 시스템 또는 음성 처리 시스템에 제공된다. 마이크로폰 어레이는 수많은 전자 디바이스로 집적된다.
본문에 제공된 설명은 예시 및 설명적인 것이며 첨부된 발명의 예를 제공하기 위한 것이다.
본 발명은 음성-기반 시스템(speech-based system)에서 잡음 감소의 분야에 관한 것이다. 상세하게는, 본 발명은 신호 환경으로부터 타겟 음향 신호의 추출에 관한 것이다
첨부된 도면들은 청구되는 발명의 실시예들을 예시한다.
도 1은 음성 추출 시스템의 실시예와 사용하기 위해 마이크로폰 배치를 결정하기 위한 방법의 순서도를 나타낸다.
도 2는 배치 기준을 만족시키는 실시예의 2개 마이크로폰 배열을 나타낸다.
도 3은 2개 마이크로폰 배열의 실시예의 상세도이다.
도 4A와 4B는 음성 추출 시스템 실시예의 2개 마이크로폰 배열을 나타낸다.
도 5A와 5B는 음성 추출 시스템 실시예의 다른 2개 마이크로폰 배열을 나타낸다.
도 6A와 6B는 음성 추출 시스템 실시예의 또 다른 2개 마이크로폰 배열을 나타낸다.
도 7A와 7B는 음성 추출 시스템 실시예의 또 다른 2개 마이크로폰 배열을 나타낸다.
도 8은 마이크로폰에 관하여 다중 소스 배치를 나타내는 실시예의 2개 마이크로폰 배열의 평면도이다.
도 9는 다양한 휴대용 디바이스에 대한 실시예의 마이크로폰 어레이 배치를 나타낸다.
도 10은 차량 텔레마틱(telematic) 시스템의 실시예의 마이크로폰 어레이 배치를 나타낸다.
도 11은 안경 또는 고글에 장착되는 음성 추출 시스템 실시예의 2개 마이크로폰 배열을 나타낸다.
도 12는 코드(cord)에 장착되는 음성 추출 시스템 실시예의 2개 마이크로폰 배열을 나타낸다.
도 13A-C는 펜 또는 다른 라이팅 또는 포인팅 도구에 장착되는 음성 추출 시스템 실시예의 3가지 2개 마이크로폰 배열을 나타낸다.
도 14는 음성 추출 시스템 실시예의 다양한 2개 마이크로폰 배열을 나타낸다.
도 15는 2개 이상의 마이크로폰을 포함하는 실시예의 마이크로폰 어레이를 나타낸다.
도 16은 2개 이상의 마이크로폰을 포함하는 실시예의 다른 마이크로폰 어레이를 나타낸다.
도 17은 2개 이상의 마이크로폰을 포함하는 실시예의 변형된 마이크로폰 어레이를 나타낸다.
도 18은 2개 이상의 마이크로폰을 포함하는 실시예의 다른 변형된 마이크로폰 어레이를 나타낸다.
도 19A-C는 2개 이상의 마이크로폰을 포함하는 실시예의 또 다른 변형된 마이크로폰 어레이를 나타낸다.
도 20A와 20B는 통상의 피드포워드 및 피드백 신호 선별(separation) 아키텍쳐를 나타낸다.
도 21A는 2개 입력을 수신하며 2개 출력을 제공하는 대표적인 음성 추출 아키텍쳐 실시예의 블럭도를 나타낸다.
도 21B는 2개 입력을 수신하며 2개 출력을 제공하는 음성 추출 아키텍쳐 실시예의 블럭도를 나타낸다.
도 21A-D는 실시예에 사용되는 4가지 유형의 마이크로폰 지향성 패턴을 나타낸다.
신호 처리 시스템에서 블라인드(blind) 신호 분리(separation)을 수행하는 방법 및 시스템은 참조로 본문에 채용된 미국 특허 출원 제09/445,778호, "Method and Apparatus for Blind Signal Separation"에 기술되어 있다. 게다가, 이러한 신호 처리 시스템 및 방법은 참조로 본문에 채용된 미국 특허 출원 제09/701,920호, "Adaptive State Space Signal Separation, Discrimination and Recovery Architecture and Their Adaptations for Use in Dynamic Environments"에서 상태 공간 어프로치에 관한 피드백 아키텍쳐로 확대된다. 이러한 계류중인 특허출원들은 수신된 신호 유형을 레지스터할 수 있는 센서들에 의해 수신된 다양한 유형의 신호들에 적용될 수 있는 신호 분리, 식별, 및 복원을 위한 일반적인 기술을 개시하고 있다. 또한 이들 신호 처리 기술을 사용하는 사운드(sound) 분리 시스템, 또는 음성 추출 시스템이 개시되어 있다. 다른 사운드들중에 적어도 부분적으로, 또는 다른 사운드들중에 덜 방해받는 또는 마스크된 관련 단일 음성 신호를 분리 및 획득하는 과정은 "음성 추출(voice extraction)"로서 본문에 언급된다.
실시예의 음성 추출 시스템은 순수한 음성 신호들을, 예를 들면, 언어 압축, 전송, 및 인식 시스템을 포함하는 언어 처리 시스템으로 제공하기 위해서 혼합 또는 합성 환경의 간섭 음원으로부터 관련 단일 음성 신호를 아이솔레이트시킨다. 아이솔레이션(isolation)은 특히 환경에 제공된 및/또는 1개 이상의 사운드 감지 디바이스에 의해 레지스트된 모든 사운드의 합으로부터 타겟 음성 신호의 분리 및 이이솔레이션을 포함한다. 제공된 사운드들은 배경음, 잡음, 다수의 화자 음성, 및 관련 음성을 포함하며, 이 모두는 시간, 공간, 및 주파수에서 중첩한다.
관련 단일 음성 신호는 임의의 방향으로부터 도달하며, 그 방향은 공지 또는 비공지되어 있다. 게다가, 임의의 주어진 시간에 활성인 관련 음원이 1개 이상일 수 있다. 사운드 또는 신호 수신 디바이스, 또는 마이크로폰의 배치는 현실 세계의음향 환경에서 블라인드 신호 분리 및 적응형 상태 공간 신호 분리, 식별, 및 복원 기술을 음향 신호 처리에 적용하는 것과 관련하여 특히 음성 추출 시스템의 성능에 영향을 끼칠 수 있다. 그렇기 때문에, 마이크로폰 배열 또는 배치가 음성 추출 시스템의 중요한 측면이다.
특히, 실시예의 음성 추출 시스템은 시간, 주파수, 및 도달 방향에서 중첩하는 간섭 신호들을 구별한다. 이러한 아이솔레이션은 신호 진폭과 독립된 신호원의 통계적 특성에서의 마이크로폰 상호간 미분을 기초로 하며, 간섭 신호들을 식별하는 통상의 기술에 대비하는 기술은 도달 방향 또는 스펙트럼 내용을 기초로 한다. 음성 추출 시스템은 단일의 음원 신호들에 대한 것이 아니라 다중 딜레이된 각각의 사운드 신호에 대해 신호 추출을 수행함으로써 역할을 한다. 이러한 시스템은 어떠한 스펙트럼 또는 위상 왜곡도 도입시키지 않는다.
음성 추출을 위한 음성 분리 방법은 몇가지 구현 문제점(issue)이 수신 마이크로폰 배열 또는 어레이의 설계와 관련있음을 나타낸다. 한가지 문제점(issue)은 단독으로, 또는 음성 추출과 관련하여, 또는 신호 처리 방법에 관련하여 단일의 관련 음성 신호(이외에 간선 소리들)를 감지하는데 사용되는 마이크로폰의 유형과 배열을 포함한다. 다른 문제점(issue)은 최적 성능이 달성되도록 음성 추출을 위해 2개 이상의 마이크로폰을 배열하는 방법을 포함한다. 다른 문제점(issue)은 신호를 버퍼링 및 딜레이시키거나, 또는 달리 인과성을 유지하기 위해서 수신된 신호를 처리하기 위한 방법을 결정하는 것이다. 또 다른 문제점(issue)은 불완전한(underdetermined) 시스템을 처리하기 위해서 코어 신호 처리 아키텍쳐의연장을 도출하기 위한 방법을 결정하는 것이며, 다른 실호들로부터 식별될 수 있는 신호원의 수는 수신기의 수보다 더 많다. 예시는 관련 단일 소스가 단지 2개 사운드 센서를 사용하여 3개 이상의 신호들의 합으로부터 추출될 수 있을 때를 나타낸다.
도 1은 음성 추출 시스템의 실시예와 함께 사용하기 위해 마이크로폰 배치를 결정하기 위한 방법의 순서도를 나타낸다. 작동은 102와 관련하여 관련 음성 소스(voice source) 또는 소스들이 위치할 수 있는 모든 위치를 고려하면서 시작한다. 104와 관련하여 간섭 음원(sound source) 또는 음원들이 위치할 수 있는 모든 가능한 위치들이 또한 고려된다. 중요 장비 및 세팅에는 채택가능한 음성 추출 수행을 위한 기준이 규정되어 있다(106). 마이크로폰 배열이 전개되며, 상기 마이크로폰이 배열된다(108). 상기 마이크로폰 배열은 그후 임의의 기준이 위배되었는지를 결정하도록 기준과 비교된다(110). 임의의 기준이 위배되었다면, 그후 새로운 배열이 전개된다(108). 어떠한 기준도 위배되지 않았다면, 그후 프로토타입 마이크로폰 배열이 형성되며, 그 배열의 성능이 테스트된다(114). 만일 프로토타입 배열이 채택가능한 성능을 입증한다면, 그후 그 프로토타입 배열이 최종적으로 결정된다(116). 채택할 수 없는 프로토타입 성능은 다른 마이크로폰 배열의 전개를 초래한다(108).
단일 음원을 추출하기 위한 2개-마이크로폰 시스템은 실시예의 음성 추출 시스템을 포함하는 수많은 오디오 처리 시스템들이 적어도 2개 마이크로폰 또는 2개 마이크로폰 엘리먼트를 사용하는 것처럼 특히 중요하다. 게다가, 수많은 오디오 처리 시스템들은 단지 2개 마이크로폰까지 수용할 수 있다. 그렇기 때문에, 2개 마이크로폰 배치 모델이 현재 기술되고 있다.
2개 마이크로폰은 임의의 주어진 시간에 기껏해야 2개의 관련 소스 신호의 아이솔레이션을 제공한다. 즉, 2개 센서, 또는 마이크로폰 엘리먼트로부터의 2개 입력은 신호 분리를 기초로 하여 일반 음성 추출 시스템이 2개 출력을 발생시킬 수 있음을 의미한다. 본문에 기술된 연장 기술은 출력의 점점 더 크거나 혹은 적은 수의 발생을 제공한다.
수많은 경우에, 수많은 간섭 소스와 관련 단일 신호가 있으므로, 본 발명은 모든 다른 간섭 소스로부터 단일 음원(예를 들면, 셀룰로 폰과 같은 디바이스에서 유저의 음성)을 아이솔레이트시키는 것에 관심이 있다. 이러한 특정 경우에, 또한 매우 넓은 적응성을 갖는다면, 수많은 배치 기준이 고려된다. 이러한 배치 기준은 배열에는 2개 마이크로폰이 있으며 음원과 간섭 소스가 수많은 가능한 위치 조합을 가질 수 있다는 사실로부터 도출된다. 첫번째 고려사항은 관련 단일 소스와, 모든 간섭 소스의 합(sum)의 서로 다른 1차 결합(linear combination)을 가질 필요성이다. 다른 고려사항은 가능한한 유사하게 간섭 소스들의 합을 레지스트할 필요성이므로, 하나의 마이크로폰에 의해 레지스트된 합이 다른 마이크로폰에 의해 레지스트된 합에 매우 유사하다. 세번째 고려사항은 관련 소스를 가장 근접하게 획득하는 출력으로서 2개 출력 채널중 하나를 지정할 필요성이다.
첫번째 배치 기준은 시스템들의 단일성 제약(singularity constraint)의 결과로서 발생한다. 상기 시스템은 2개 마이크로폰이 과다한 정보를 제공할 때 작동하지 않는다. 진정한 단일성(singularity)은 현실 세계에서 달성하기 어려우므로, 다수의 평가는 더 다루기 어려우며, 관련 음성 신호와 모든 다른 사운드의 결합을 레지스트하며 특성 포인트에 어프로치하는 2개 센서로부터 입력으로서 요구한다. 따라서, 최적 성능을 위해, 마이크로폰 배열은 단일성 영역과, 출력의 단일 세트가 2개 음향 센서에 의해 생성될 수 있다는 가능성을 최소화시킴으로서 가능한 한 단일성으로부터 멀리 이격하여 향해야한다. 단일성 제약은 훨씬 더 복잡한 무수한 처리로 극복될 수 있음에 유의한다.
두번째 배치 기준은 관련 단일 소스로부터의 사운드 신호를 훼손시키는 수많은 간섭 음원의 존재의 결과로서 발생한다. 이러한 문제점은 2개의 별개 소스만이 2개 마이크로폰으로 서로 구별될 수 있는, 제약된 프레임워크(framework)를 제공하는, 신호 식별 문제의 고전적 제시의 재-공식화를 요한다. 수많은 현실 세계 상황에서, 부차적인 단일 간섭 소스보다는, 수많은 간섭 소스들의 합계가 존재한다. 만일 수많은 소스의 합계가 양쪽 마이크로폰에 대해 단일 소스로서 작용한다면, 고전적 문제 진술로의 전환이 이루어질 수 있다. 만일 간섭 소스가 있을 것으로 추정되는 위치보다도 관련 소스의 위치가 훨씬 더 가깝다면, 이것이 합리적인 어프로치이다. 간섭 소스는 관련 단일 소스보다도 더 멀리 있으므로, 진폭에 있어서 마이크로폰 상호간의 차이는 마이크로폰에 훨씬 더 근접한 것으로 추정되는 관련 단일 소스에 의해 발생된 진폭에 있어서 마이크로폰 상호간의 차이보다도 더 낮을 수 있다.
세번째 배치 기준은 하기와 같이 설명된다. 수많은 어플리케이션의 관계에서, 음성 추출은 유한 임펄스 응답(FIR) 및/또는 무한 임펄스 응답(IIR) 필터로 이루어진 신호 처리 시스템으로 구현되어야 한다. FIR 또는 IIF 필터로 이루어진 아날로그 또는 디지털 신호 처리 시스템으로 실현될 수 있기 위해서, 시스템은 인과성을 따라야 한다. 인과성의 제약들중 하나는 신호값들, 즉, 순간 시간(t) 이외의 신호값들의 추정치가 획득되지 않게 방지한다는 것이다. 즉, 필터들은 순간 시간(t-δ)에 대한 소스값들을 단지 추정할 수 있으며, δ는 음수가 아니다. 결국, "관련 소스(source of interest)" 마이크로폰은 항상 우선 관련 소스 신호를 수신하도록 시간과 관련하여 설계된다. 이러한 마이크로폰은 순간 시간(t)의 관련 소스 신호를 수신할 것이지만; 두번째 마이크로폰은 딜레이된 순간 시간(t- δ) 신호를 수신할 것이다. 이러한 경우에, δ는 2개 마이크로폰간의 간격, 관련 소스의 위치 및 전달 음파의 속도에 의해 결정된다. 이러한 요건은 피드백 아키텍쳐로 더 보강되며, 소스 신호는 간섭 신호를 뺌으로써 구하여진다.
게다가, 특정 마이크로폰 유형 및 방향성 패턴, 배치 위치, 경향(attitude)의 분석 및 실험은 지정 매개변수와 음성 추출의 분리 또는 달성의 정도간에 관계 세트의 설정을 뒷받침한다. 이러한 3가지 기준은 이러한 간격를 탐색하는 가이드로서 사용된다.
도 2는 배치 기준을 만족시키는 실시예의 2개 마이크로폰의 배열(200)을 나타낸다. 도 3은 실시예의 2개 마이크로폰 배열의 상세도(300)이다. 단일 음성 소스는 S로 표시되어 있다. 잡음원으로부터 도달하는 신호들은 N으로 표시되어 있다. 배치 기준을 따르는 배열이 도시된 분석이 제공되어 있다.
1차 관련 신호원(S)은 제 1 마이크로폰(m1)으로부터 r 유니트에 그리고 제 2 마이크로폰(m2)로부터 r+d 유니트에 위치되어 있다. 상기 마이크로폰으로부터 다양한 거리에 위치된 다중 잡음원들, 예를 들면, N0과 Nθ는 상기 소스(S)와 간섭을 한다. 간섭 잡음원은 제 2 마이크로폰(m2)에서 그 중심과 반경(R)의 원에 각각 위치된 더미(dummy) 잡음원(Nθ)에 의해 개별적으로 접근되어 있다. 잡음원의 아래첨자는 그 각도 위치(θ), 즉 잡음원으로부터 2개 마이크로폰을 접합시키는 라인의 중간지점까지의 가시거리(line of sight)와 2개 마이크로폰을 접합시키는 상기 거리(line)사이의 각을 가리킨다.
제 2 마이크로폰을 그 중심으로 선택하는 것은 제 2 마이크로폰을 간섭 잡음원의 합으로 선정하는 편리함과 방식의 문제이다. 이러한 선정은 엄격하지 않으며, 관련 소스의 경우에 따라, 잡음원에 의해 발생된 신호들이 제 1 마이크로폰에 도달하기 이전에 제 2 마이크로폰에 도달함을 의미하지 않음에 유의한다. 게다가, 각각의 더미 잡음원은 실제 잡음원의 거리로 인하여 접근하는 정면에 평면파를 발생시키는 것으로 추정된다. 각각의 간섭 더미 잡음원은 제 2 마이크로폰으로부터 R 유니트이며 제 1 마이크로폰으로부터 R+d sin(θ) 유니트에 있다.
이러한 어프로치라면, 각각의 마이크로폰에 입사하는 실제 신호들은 다음과같이 추정된다:
ν는 전달 음파의 속도이다. 2개 마이크로폰은 단일 관련 소스와 모든 간섭 소스의 합의 서로 다른 1차 결합을 가짐은 이들 방정식으로부터 알수 있다. 제 1 출력 채널은 제 1 마이크로폰을 "관련 소스 마이크로폰(the source of interest microphone)"으로 선정함으로써 관련 소스를 가장 가깝게 획득하는 출력부로서 선정된다. 그러므로, 제 1 및 제 3 배치 기준은 쉽게 만족된다. 제 2 기준, 즉 가능한한 유사하게 간섭 잡음원의 합을 레지스터링하는 것이 만족되는 정도가 2개 마이크로폰 사이의 거리(d)의 함수이다. d를 작게 만드는 것이 제 2 기준에 도움을 줄 수 있지만, 제 1 및 제 3 기준을 손상시킬 수 있다. 그러므로, d 값의 선택이 이러한 상반되는 제약들간의 균형을 취하는 일이다. 사실상, 대체로 0.5인치 내지 4인치 범위의 거리는 만족스러운 성능을 야기시키는 것으로 발견되었다.
2개 이상의 마이크로폰 배치 기준간의 어플리케이션은 다중의 관련 소스들과 2개 이상의 마이크로폰에 대한 배열에 대해 수정된 기준을 요구한다. 제 1 기준은 다중의 관련 소스와 모든 간섭 소스들의 합의 서로 다른 1차 결합을 가질 필요성을 포함하도록 수정된다. 제 2 기준은 하나의 합이 다른것과 매우 유사하도록 가능한한 유사하게 간섭 소스들의 합을 레지스트할 필요성을 포함하도록 수정된다. 제 3 기준은 다중 출력 채널들의 세트를 다중의 관련 소스를 매우 가깝게 획득하고 그 해당 관련 소스 당 각 채널을 분류시키는 출력부로 선정할 필요성을 포함하도록 수정된다. 게다가, 신호 전달과 타겟 음향 환경에 관한 특정 마이크로폰 유형과 방향성 패턴, 배치 위치, 경향(attitude)의 분석 및 실험은 2개 이상의 마이크로폰을 사용하여 음성 추출하기에 적합하거나 최적인 특정 배열 및 간격의 결정을 뒷받침한다.
수많은 어플리케이션에 관하여, 음성 추출은 FIR 및/또는 IIR 필터들로 이루어진 신호 처리 시스템으로서 구현된다. FIR 또는 IIR 필터들로 이루어진 아날로그 또는 디지털 신호 처리 시스템으로 실현될 수 있기 위해서, 시스템은 인과성을 따라야 한다. 인과성을 유지시키기 위한 기술이 계속 기술된다.
도 3을 참조하면, 간섭 잡음원(Nθ)에 대해, 180<θ<360, 음량은 d sin(θ)<0이다. 이 경우에, 합계된 엘리먼트(Nθ)는 제 1 마이크로폰 방정식에서 앞으로 순간 시간을 기준으로하며, 그러므로 아직 이용가능하지 않다. 이러한 인과성 위반은 제 1 마이크로폰 신호를 적절하게 딜레이시킴으로써 교정될 수 있다. 만일 제 1 마니크로폰이 d/ν만큼 딜레이된다면, 마이크로폰 방정식은 다음과 같이 작성된다:
음성 소스와 제 1 마이크로폰의 2개 시간 딜레이 방정식이 다음과 같이 규정된다:
이러한 규정에 따라 마이크포론 신호에 대한 새로운 방정식이 다음과 같이 작성될 수 있다:
(1+sin(θ))는 항상 제로보다 크거나 제로이므로, 딜레이 보완 수정에 따라, 모든 항들은 현재 또는 과거의 순간 시간을 기준으로 하므로 인과성 제약을 유지시킨다. 이러한 방법에 따라 추출될 수 있는 음성(또는 다른 사운드) 소스의 수에 있어서 증가가 있을 수 있다.
실시예의 음성 추출 시스템은, 블라인드 신호 분리를 사용하며, 적어도 2개 신호로부터 정보를 처리한다. 수많은 음성 신호 처리 시스템들은 2개 마이크로폰까지 수용할 수 있으므로, 분문에 제시된 기술에 따라 수많은 2개 마이크로폰 배치가 제공된다.
본문에 제시된 2개 마이크로폰 배열은 단일 화자의 음성과 환경에 공제되는 모든 다른 음원의 합 사이에서, 환경 잡음, 기계 소리, 바람 소리, 다른 음성, 및 다른 음원인지를 식별한다. 유저(user)의 위치는 위치 범위내에 있는 것으로 예상된다.
마이크로폰 엘리먼트들은 휴대용 마이크로폰 기호를 사용하여 묘사되었음에 유의한다. 이는 단지 도시적인 목적이기 때문이며, 그것은 마이크로폰의 묘사를 쉽게 뒷받침한다. 실제 마이크로폰 엘리먼트들은 다양한 사이즈 및 형상의 엘리먼트들을 포함하여 당 기술에서 발견되는 수많은 구성들중 하나이다.
도 4A와 4B는 실시예의 음성 추출 시스템의 2개 마이크로폰 배열(402)을 나타낸다. 도 4A는 2개 마이크로폰 배열(402)의 측면도이며, 도 4B는 2개 마이크포론 배열(402)의 평면도이다. 이 배열(402)은 2개 마이크로폰을 나타내며, 양쪽 모두 하이퍼카디오이드(hypercardioid) 감지 패턴(404)을 갖지만, 실시예는 그렇게 제한되지 않으므로, 상기 마이크로폰중 하나 또는 모두는 전방향성, 카디오이드(cardioid), 또는 8자형 감지 패턴을 포함하는 다수의 감지 패턴중 하나 또는 조합을 가질 수 있다. 그 간격은 대략 3.5cm인 것으로 지시되어 있다. 사실상, 대체로 1.0cm 내지 10.0cm 범위의 간격들이 입증되었다.
도 5A와 5B는 실시예의 음성 추출 시스템의 다른 2개 마이크로폰 배열(502-508)을 나타낸다. 도 5A는 마이크로폰 배열(502-508)의 측면도이며, 도 5B는 마이크로폰 배열(502-508)의 평면도이다. 각각의 이러한 마이크로폰 배열(502-508)들은 마이크로폰 축을 음파 전달 방향(510)에 수직 또는 거의 수직으로 위치시킨다. 게다가, 각각의 4개 마이크로폰 쌍 배열(502-508)은 1개 마이크로폰이 신호원(599)에 더 근접한 옵션(option)을 제공한다. 따라서, 더 근접한 마이크로폰은 먼 마이크로폰이 감소된 파워의 음성 신호를 수신하는 것보다 더 일찍 더 큰 파워의 음성 신호를 수신한다. 이러한 배열을 사용하면, 음원(599)은 마이크로폰(502-508) 주위를 180도로 걸쳐있는 아크(arc)(512)를 따라 광역의 포지션을 차지한다.
도 6A와 6B는 실시예의 음성 추출 시스템의 또 다른 2개 마이크로폰 배열(602-604)을 나타낸다. 도 6A는 마이크로폰 배열(602-604)의 측면도이며, 도6B는 마이크로폰 배열(602-604)의 평면도이다. 이러한 2개 마이크로폰 배열(602-604)은 2개의 관련 음성원(698과 699)의 대략 동시 추출을 지원한다. 2개 음성이 모두 동시에 활성일 때 어느 하나의 음성이 획득될 수 있다; 게다가, 두 음성 모두가 동시에 획득될 수 있다.
이러한 마이크로폰 배열(602-604)은 또한 마이크로폰 축을 음파 전달 방향(610)에 수직 또는 거의 수직으로 배치시킨다. 게다가, 각각의 마이크로폰 쌍 배열(602-604)은 제 1 마이크로폰이 제 1 신호원(698)에 더 근접하며 제 2 마이크로폰이 제 2 신호원(699)에 더 근접한 옵션을 제공한다. 이는 제 2 마이크로폰이 제 1 신호원에 대해 더 먼 마이크로폰으로서 역할을 하며 제 1 마이크로폰이 제 2 신호원에 대해 더 먼 마이크로폰으로서 역할을 하게 한다. 따라서, 각각의 신호원에 더 근접한 마이크로폰은 더 먼 마이크로폰이 감소된 파워의 동일 신호를 수신하는 것보다 더 빨리 더 큰 파워의 신호를 수신한다. 이러한 배열(602-604)을 사용하면, 상기 음원(698과 699)은 마이크로폰(602-604) 주위에 180도에 걸쳐 각각의 2개 아크(612과 614)를 따라 광역의 포지션을 차지한다. 그러나, 최고의 성능을 위해서, 상기 음원(698과 699)은 동시에 단일성 영역(singularity zone)(616)에 모두 있지 말아야 한다.
도 7A와 7B는 실시예의 음성 추출 시스템의 또 다른 2-마이크로폰 배열(702-714)를 나타낸다. 도 7A는 7개 마이크로폰 배열(702-714)의 측면도이며, 도 7B는 상기 마이크로폰 배열(702-714)의 평면도이다. 이들 마이크로폰 배열(702-714)은 마이크로폰 축을 음파 전달 방향(716)에 평행하게 또는 거의 평행하게 배치시킨다. 게다가, 각각의 7개 마이크로폰 쌍 배열(702-714)은 하나의 마이크로폰이 신호원(799)에 더 가깝운 옵션을 제공한다. 따라서, 더 근접한 마이크로폰은 더 먼 마이크로폰이 감소된 파워의 음성 신호를 수신하는 것보다 더 일찍 더 큰 파워의 음성 신호를 수신한다. 이러한 배열(702-714)을 사용하면, 음원(799)는 상기 마이크로폰(702-714) 주위에 대략 90 내지 120도의 범우에 걸쳐 아크(718)를 따라 광역의 포지션을 차지할 수 있다.
이러한 마이크로폰 배열(702∼714)은, 관련한 2개의 음성원의 대략 동시 추출을 추가 지원한다. 양쪽 음성이 동시에 활성화될 때 어느 하나의 음성이 포획되고, 또 양쪽 음성이 동시에 포획된다. 도 8은, 상기 마이크로폰(802)에 관련한 소스 배치(source placement, 898, 899)를 나타내는 일 실시예에 대한 이러한 마이크로폰 배열(702~714)중 하나의 마이크로폰(802)의 평면도이다. 이러한 7개의배열(702~714)중 어느 하나의 마이크로폰(802)을 사용하면, 하나의 사운드 소스(899)은 마이크로폰 어레이(802)를 중심으로 270도 스패닝(spanning)하는 아크(arc, 804)를 따르는 광역의 포지션을 취한다. 제2 음원(898)은 마이크로폰 어레이(802) 전방으로 90도 정도 스패닝하는 아크(806)를 따르는 위치의 영역에 획정된다. 2개의 음성원(898, 899)의 각 분리(angular separation)는 2개의 마이크로폰(802) 사이에서 증가하는 간격보다 더 작게 된다.
일 실시예의 음성 추출 시스템은, 휴대장치, 차량의 텔레마틱 시스템, 컴퓨터, 셀룰러 폰, PDA, 개인 통신장치, 카메라, 헬멧-장착형 통신 시스템, 보청기 및 여타의 착용 가능한 사운드 인헨스먼트, 통신 및 음성-기반 커맨드 장치 및 이에 국한되지 않고 모든 장치를 포함한 수많은 스피치 처리 시스템 및 장치에 채용된다. 도 9는 다양한 휴대용 장치(902~910)에 대한 일 실시예의 마이크로폰 어레이 배치(999)를 도시하고 있다.
도 10은, 자동차 텔레마틱(telematics) 시스템의 일 실시예의 마이크로폰 어레이(1099) 배치를 도시하고 있다. 차량 내의 마이크로폰 어레이 배치는 포획될 소스에 의해 점유된 위치에 따라 변경된다. 또한, 다중 마이크로폰 어레이는 차량에서의 특정 탑승자 위치에서 지향된 배치와 함께 차량에 채용된다. 자동차의 마이크로폰 어레이는 필러(pillar), 바이저 장치(1002), 천정 또는 헤드라이너(1004), 오버헤드 콘솔, 후방가시경(1006), 대시보드 및 계기판 클러스터를 포함한 자동차 내에 위치된다. 유사 위치는 타종의 차량 예를 들어, 항공기, 트럭, 보트 및 열차에 채용될 수 있다.
도 11은 한 쌍의 안경(1106)이나 고글 상에 탑재된 일 실시예의 음성 추출 시스템에서의 2-마이크로폰 장치(1100)을 나타내고 있다. 이 2-마이크로폰 장치(1100)는 마이크로폰 엘리먼트(1102, 1104)를 포함하고, 이러한 마이크로폰 어레이(1100)는 안경(1106)을 착용하는 사용자에 직면하는 방향으로부터 도달하는 음성 신호나 음향 신호를 증대하는 보정기의 일부일 수 있다.
도 12는 코드(1202) 상에 탑재된 일 실시예의 음성 추출 시스템의 2-마이크로폰 배열(1200)을 도시하고 있다. 수회구(1204, earpiece)는 장치(1206)에 의해 녹음 또는 수신된 가청신호를 사용자의 귀로 통신한다. 이 2개의 마이크로폰(1208, 1210)은 상기 장치(1206)에 입력된 사용자의 음성 신호를 증대하는 음성 추출 시스템의 2개의 입력이다.
도 13A, B 및 C는 펜(1302) 또는 기록이나 포인팅 기구 상에 탑재된 일 실시예의 음성 추출 시스템의 3개의 2-마이크로폰 장치를 나타내고 있다. 상기 펜(1302)은 프리젠테이션 도중에 사용되는 레이저 포인터와 같은 포인팅 디바이스로 될 수 있다.
도 14는 일 실시예의 음성 추출 시스템의 다수의 2-마이크로폰 배열을 나타내고 있다. 하나의 장치(1410)는 지원 아티클(1416)의 축에 수직하는 축선들을 가지는 마이크로폰(1412, 1414)을 포함한다. 다른 장치(1420)는 지원 아티클(1426)의 축선에 평행하는 축선들을 가지는 마이크로폰(1422, 1424)을 포함한다. 상기 장치는 관련된 사운드 소스에 대하여 지원 아티클의 위치에 근거하여 결정된다. 상기 지원 아티클은 바디(1430) 또는 의류의 아티클(1432, 1434)에 착용되는 다수의 핀을 포함하지만, 이에 한정되지는 않는다. 상기 핀이 착용되는 방식은, 헤어핀(1430)과 같이 셔츠 칼라(1432), 및 셔츠 슬리브(1434)에 착용되는 방식을 포함하나, 이에 한정되지는 않는다.
또한, 상기 2개의 마이크로폰 배치 기준의 확장은, 2개의 마이크로폰 이상을 구비하는 마이크로폰 어레이를 위한 다수의 마이크로폰 배치 장치를 제공한다. 2개의 마이크로폰 배열를 구비함에 따라, 2개 이상의 마이크로폰을 위한 배열은, 환경 소음, 기계 음향, 윈드 잡음 여타의 음성이든지 간에 상기 환경에서 제공하는 모든 다른 음향원의 합계와 단일 사용자의 음성 사이를 식별하는 데 사용될 수 있게 된다.
도 15 및 도 16은 2개 이상의 마이크로폰을 구비하는 일 실시예의 마이크로폰 어레이(1500, 1600)를 도시하고 있다. 이들 어레이(1500, 1600)는 다중의 2-마이크로폰 요소(1502, 1602)를 이용하여 구성된다. 상호 직후방에 위치된 마이크로폰 요소들은 상기 어레이 주위의 연합 영역으로부터 발산하는 음성원에 전용되는 2-마이크로폰 엘리먼트로서의 기능을 수행한다. 이들 실시예(1500, 1600)는 9개의 2-마이크로폰 엘리먼트를 포함하지만, 이에 한정되는 것은 아니다. 9개의 스피커(영역 당 하나)로부터의 음성은 이들 어레이(1500, 1600)를 이용하여 동시 추출된다. 추출된 음성의 수는 인과성(causality)이 유지될 때 18로 추가 증가된다. 또한, 9개 이하의 스피커 세트는 영역 사이에서 이동된다.
도 17은 2개 이상의 마이크로폰을 구비하는 일 실시예의 다른 마이크로폰 어레이(1700)를 도시하고 있다. 또, 이러한 어레이(1700)는 원형으로 마이크로폰을배치하여 구성된다. 상기 어레이의 중앙 마이크로폰(1702)과 쌍으로 되면, 상기 어레이 주변(1704) 상의 하나의 마이크로폰은 2-마이크로폰 엘리먼트로서 기능한다. 이러한 실시예는 8개의 영역(1706)을 지원하는 마이크로폰 엘리머트(1799)를 포함하지만, 이에 한정되는 것은 아니다. 8개의 스피커(영역 당 하나)로부터의 음성은 이러한 어레이(1700)를 사용하여 동시에 추출된다. 추출된 음성의 수는 인과성이 유지될 때 16(영역 당 하나)으로 추가 증대된다. 또한, 8개 이하의 스피커 세트는 영역 사이에서 이동된다.
도 18은 2개 이상의 마이크로폰을 갖는 일 구현예의 상호 다른 마이크로폰 어레이(1800)를 도시하고 있다. 이러한 어레이(1800)는 도 17에 도시된 배열과 유사한 방식으로 구성되지만, 마이크로폰들은 원을 따라서 상기 원의 중심으로부터 이격된 방향으로 지시하는 그 축선들을 구비한다. 상기 마이크로폰 엘리머트(1802/1804)는 상기 어레이(1800)에 대하여 연합한 영역(1820)으로부터 발산하는 음성원에 전용되는 2-마이크로폰 엘리먼트로서 기능한다. 이러한 배열에서, 도 17에 도시된 배열에서 처럼, 중앙 마이크로폰(1802)은 중앙 마이크로폰이 써라운드 마이크로폰 엘리먼트들과 작용하는 쌍에 대하여 공통이다. 여기에는 다음의, 1804/1802, 1806/1802, 1808/1802, 1810/1802, 1812/1802, 1814/1802, 1816/1802, 및 1818/1802와 같은 8개의 2-마이크로폰 엘리먼트 쌍이 있다. 본 구현예는 9개의 영역을 지원하도록, 9개의 엘리먼트들(1802, 1804, 1806, 1808, 1810, 1812, 1814, 1816 및 1818)을 사용하지만, 이에 국한하는 것은 아니다. 예를 들어, 마이크로폰 엘리먼트(1802/1804)는 영역(1820)으로부터의 음성 추출을 지원하고,마이크로폰 엘리먼트(1802/1808)는 영역(1824)으로부터의 음성 추출을 지원하며, 마이크로폰 엘리먼트(1802/1812)는 영역(1822)으로부터의 음성 추출을 지원하고, 마이크로폰 엘리먼트(1802/1816)는 영역(1826)으로부터의 음성 추출을 지원하는 것 등을 들 수 있다. 따라서, 8개의 스피커(영역 당 하나)로부터의 음성은 이러한 어레이(1800)을 사용하여 동시 추출된다. 추출된 수많은 음성은 인과성이 유지될 때 16으로 추가 증대된다. 또한, 8개 이상의 스피커 세트가 영역 사이에서 이동된다.
여기서, 상기 어레이(1800)가 사용되는 것과 다른 방식이 있다. 하나는 영역(1820, 1822)을 커버하기 위해 마이크로폰(1812)과 함께 마이크로폰(1804)을 쌍으로 하는 것으로, 이것은 도 19A 내지 도 19C에 도시된 배열을 유도하는 상기 중앙에서의 마이크로폰에 대한 필요성을 삭제시킨다.
도 19A 내지 도 19C는 2개 이상의 마이크로폰을 구비하는 실시예의 다른 마이크로폰 어레이들을 도시하고 있다. 이 장치(19A-19C)는 본문에 설명된 다른 것과 유사하지만, 중앙 마이크로폰이나 마이크로폰의 중앙 링(ring)을 삭제하였다. 따라서, 대부분의 환경 하에서, 상기 마이크로폰 엘리먼트의 개수 이하의 음성 세트가 이러한 어레이를 사용하여 동시 추출된다. 이는, 3개 배열(19A-19C)의 가장 실용적인 사용에서, 관련한 단일 사운드 소스가 한 쌍의 마이크로폰 보다는 오히려 단일의 마이크로폰에 할당되기 때문이다.
배열(19A)은 상기 원의 중심으로 이격되어 지시하는 그의 축선 들을 갖는 반원형 아크를 따라 배열된 4개의 마이크로폰을 포함한다. 이 마이크로폰 배열(19A)의 후방측은 평탄면에 대하여 착접된다. 각각의 마이크로폰은 반원형 부위나 부분의 45도를 커버한다. 마이크로폰의 수는 고 분해능을 산출하도록 증대된다. 각각의 마이크로폰 엘리먼트는 연합 영역의 주된 마이크로폰으로서 지정된다. 2, 3 또는 모든 마이크로폰들은 2, 3 또는 4개의 입력 음성 추출 시스템에 대한 입력으로서 채용된다. 만일, 마이크로폰의 개수가 4개 이상의 개수(N)일 경우, 재차 임의의 2, 3 또는 그 이상의 N개의 입력 음성 추출 시스템에 대하여 입력으로서 채용된다. 배열(19A)은 영역 당 하나, 4개의 음성을 추출할 수 있다. 만일, 마이크로폰의 개수가 N개로 증대되면, 180/N 도에 각각 걸쳐(span)있는 N개의 영역이 커버되고, N개의 음성이 추출된다.
배열(19B)은 19A와 유사하지만, 반원형을 따르는 4개 대신에 원형을 따르는 8개의 마이크로폰을 포함하고 있다. 배열(19B)은 각각 45도에 걸쳐있는 8개의 영역을 커버한다.
배열(19C)은 상향 지시하는 축선을 갖는 마이크로폰을 구비한다. 배열(19C)은, 마이크로폰 배열이 돌출부가 없는 평탄면과 동일 평면으로 되어야만 할 때 채용된다. 일 실시예의 배열(19C)은 55 방향에서 쌍으로 되며 2개의 입력 음성 추출 시스템으로 입력되는 11개의 마이크로폰을 포함한다. 이것은, 상기 어레이에서의 마이크로폰 엘리먼트의 개수보다 더 많은 음성을 추출하는 방식으로 되어도 된다. N개의 마이크로폰으로부터 추출된 음성의 개수는 (N)으로 더 증가될 수 있다. (N-1)개 음성은 인과성이 유지될 때, N개의 마이크로폰이 Nx(N-1)/2 방향에서 쌍으로 되고, 각각의 쌍은 2개의 음성간을 식별할 수 있다. 일부의 쌍은 특히 상기 쌍에서 2개의 마이크로폰이 상호 근접하여 있다면, 사용되지 않아도 된다. 또한, 모든 마이크로폰은 11-입력 음성 추출 시스템에 입력으로서 채용될 수 있다.
2개 이상의 마이크로폰을 포함하는 상기 마이크로폰은, 단일 사용자를 위한 위치의 확장 영역을 제공하는 점과, 관련한 다중 음성을 동시 추출할 수 있는 능력을 제공한다는 점에서 추가의 이점을 제공한다. 음성원 포지션의 범위(range)는, 상기 추가의 마이크로폰이 2개의 마이크로폰 어레이 내에 구축된 음성원 포지션 상에서 리무브 또는 릴렉스 리미테이션되기 때문에, 확장된다.
2-마이크로폰 어레이에서, 사용자의 위치는 특정 위치 범위 내에 위치될 것이 요구된다. 상기 범위는 특정 장치 및 사용된 마이크로폰의 지향 패턴(directivity pattern)에 다라 다소 다르다. 예를 들면, 상기 마이크로폰이 음파 전달에 평행하게 위치되면, 양호한 음성 추출 성능을 유도하는 사용자 위치 범위는 음파 전달에 수직하여 위치된 마이크로폰을 갖는 어레이에서의 양호한 성능을 도출하는 사용자 위치 영역보다 더 협소하다. 이것은 도 5와 도 7 사이에서의 비교로부터 추론된다. 다시 말해서, 불쾌한 사운드 소스가 관련한 음성원에 당접할 수 있다. 이것은, 도 6 및 도 8을 비교함으로써 추론된다. 반면에, 2개 이상의 마이크로폰을 갖는 상기 마이크로폰 어레이는, 관련한 음성원으로 하여금 상기 마이크로폰 배열을 둘러싸는 아크(arc)를 따라 임의의 지점에 위치되게끔 한다.
관련한 다중 음성을 동시 추출하기 위한 능력에 있어, 관련한 단일의 음성원이 현존하는 2개의 마이크로폰 어레이를 사용한다는 가정이 있었다. 2-마이크로폰 어레이가 관련한 2개의 음성원으로 확장되지만, 상기 추출의 품질과 효율은 상기 소스의 적합한 위치설정에 따라 달라진다. 반면에, 2개 이상의 마이크로폰 엘리먼트를 구비하는 상기 마이크로폰 어레이는 상기 소스 위치 제약을 감소 또는 삭제시킨다.
본문에 설명된 2-마이크로폰 배열를 사용하면, 아키텍쳐 변동은 음성 추출 시스템을 위해 공식화될 수 있다. 이들 확장은 간섭에 자유로운 관련한 음향 신호나 다른 신호 또는 음성 신호를 획득하기 위한 절차를 교대하도록 직접적으로 변환한다. 더욱이, 이러한 아키텍쳐 변동은, 센서들에 의해 레지스트되기 이전에 믹싱된 신호 소스의 개수가 그들을 레지스트하는 센서나 센서 엘리먼트의 개수보다 더 많은, 불충분하게 설정된 시스템에 특히 유용하다. 이들 아키텍쳐 확장은 음성 신호 및 사운드 신호 이외의 신호에 적용 가능하다. 의미로서, 상기 신호 분리 아키텍쳐 확장의 상기 어플리케이션 도메인들은 음성 추출 이상에 이르는 많은 어플리케이션을 구비한다.
상기 확장은 전형적인 신호 분리 아키텍쳐의 간단한 리프리젠테이션으로부터 취득된다. 도 20A는 전형적인 피드포워드(feedforward) 신호 분리 아키텍쳐를 나타내고 있다. 도 20B는 전형적인 피드백 신호 분리 아키텍쳐를 나타내고 있다. 이들 시스템에서, M(t)은 다중 센서로부터 레지스트된 신호로부터 구성된 벡터이다. 또한, Y(t)는 출력 신호들을 사용하여 구성된 벡터이다. 대칭적 아키텍쳐에 있어, M(t) 및 Y(t)는 동일한 개수의 엘리먼트들을 구비한다.
도 21A는 2개의 입력을 수신하고 2개의 출력을 제공하는 일 실시예의 음성 추출 아키텍쳐의 블록도이다. 이러한 음성 추출 아키텍쳐와 그의 방법 및 시스템은 관련한 음성 예를 들어, 도 2에 예시된 시나리오(scenario)를 포획하는 데 사용된다. 센서(m1)는 마이크로폰(1)을 나타내고, 센서(m2)는 마이크로폰(2)를 나타낸다. 이 경우, 상기 음성 추출 시스템(2102)의 제1 출력은 관련한 추출 음성 신호이고, 상기 제2 출력(2104)는 모든 간섭 잡은 소스의 합에 근사하다.
도 21B는 2개의 입력을 수신하여 5개의 출력을 제공하는 구현예의 음성 추출 아키텍쳐를 나타내는 블록도이다. 이러한 확장은 관련한 추출 음성 신호를 연산하는 3개의 교대(alternate) 방법을 제공한다. 이러한 절차 중 하나인, 방법(2a)은 상기 제2 마이크로폰(다시 말해서, 마이크로폰 2-추출 잡음)으로부터 상기 제2 출력 또는 추출된 잡음을 감산하는 것이다. 이것은 마이크로폰(2)에서의 컨텐트, 관련한 신호나 스피치 신호에 근사하다. 이러한 방법을 사용하면, 상기 제2 마이크로폰은 화자의 입으로부터 추가로 간격져 배치되어, 관련한 음향 신호를 위한 더 낮은 신호 대 잡음비(SNR)를 제공한다. 이러한 어프로치를 사용하여 수행된 실험에서, 다중 소스들이 단일의 음성 신호와 간섭하는 경우, 더 나은 SNR을 제공한 방법(2a)을 사용하는 상기 스피치 출력이 제공된다.
방법(2b)은 상기 추출 잡음의 필터링된 버전이 상기 제2 마이크로폰의 잡음 성분을 보다 정밀하게 정합하도록 상기 제2 마이크로폰으로부터 감산되는 점을 제하고는 방법(2a)과 아주 유사하다. 많은 잡음 환경에서, 이러한 방법은 방법(2a)의 간단한 감산 어프로치 보다 더 나은 관련한 신호에 근사하다. 방법(2b)에 사용된 이러한 타입의 필터는 다양하다. 일예로, 하나의 필터 타입은 최소자승법(LMS) 채용 필터를 들 수 있지만, 이에 한정되는 것은 아니다. 이러한 필터는, 상기 필터링된 추출 잡음과 상기 제2 마이크로폰 입력 사이의 차분(difference) 신호와 같은,하나 이상의 에러 신호의 파워(autocorrelation)를 최대로 저감하기 위한 필터 계수를 채택함으로써 추출된 잡음을 적정하게 필터링한다. 통상, 상기 제2 마이크로폰의 상기 스피치(관련 신호) 성분은 그 마이크로폰 신호에서의 잡음과 비상관(uncorrelated)된다. 따라서, 상기 필터는 상기 방법(2b)의 추출 스피치 출력 신호에서의 잔류 또는 잔여 잡음을 최소화하는 데에서만 채택된다.
방법(2c)은 상기 필터링된 추출 잡음이 상기 제2 마이크로폰 대신에 제1 마이크로폰으로부터 추출된다는 점만 제하고는 방법(2b)과 유사하다. 이러한 방법은 상기 제1 마이크로폰이 화자의 입에 더 근접하여 현재 사용 중에 있는 관계로, 보다 높은 개시 SNR의 잇점을 갖는다. 이러한 어프로치의 하나의 결점은 상기 제2 마이크로폰으로부터 도출된 추출 잡음이 마이크로폰 하나에 구축된 것과 그리 유사하지 않아, 보다 복잡한 필터링을 요한다는 점이다.
모든 마이크로폰 또는 사운드 감지 장치는 다양한 방향으로부터 사운드 신호를 상기 마이크로폰이 수신하는 방식을 기재하는 하나 이상의 폴라 패턴(polar patterns)을 구비함은 물론이다. 도 22A 내지 도 22D는 일 실시예에 사용된 4가지 유형의 마이크로폰 지향 패턴을 나타내고 있다. 일 실시예의 상기 마이크로폰 어레이는 지향 패턴의 수많은 유형과 조합을 수용한다.
도 22A는 전방향 마이크로폰 신호 감지 패턴을 나타내고 있다. 전방향 마이크로폰은, 상기 마이크로폰 주위의 임의의 방향으로부터 대체로 균등하게 음향 신호들을 수신한다. 상기 감지 패턴은 상기 마이크포폰 주위의 모든 방향으로부터 대체로 균등 증폭 수신된 신호 파워를 나타낸다. 따라서, 상기 마이크로폰으로부터의전기적 출력은 상기 사운드가 마이크로폰에 도달하는 방향에 관계없이 동일하다.
도 22B는 카디오이드형(cardioid) 마이크로폰 신호 감지 패턴을 나타내고 있다. 상기 신장형(kidney-shaped) 카디오이드형(cardioid) 감지 패턴은 상기 소스 소리가 상기 마이크로폰의 전방에 있을 때, 풀 감지능(상기 마이크로폰으로부터의 최고 출력)을 제공하는 지향성이다. 상기 마이크로폰(상기 전방으로부터 ±90 도)의 측방에서 수신된 음향은 대략 출력의 절반 정도이고, 상기 마이크로폰의 후방(상기 전방으로부터 180도)에서 출현하는 음향은 대략 70 내지 90% 까지 감쇠된다. 카디오이드형 패턴의 마이크로폰은 상기 직접적 사운드에 대한 주변환경(일예로, 룸(room)) 사운드의 총량을 최소화하는 데 사용된다.
도 22C는 8자형 마이크로폰 신호 감지 패턴을 나타내고 있다. 상기 8자형 감지 패턴은 백투백으로 연속 위치된 2개의 카디오이드형 패턴과 다소 유사하다. 8자형 패턴을 갖는 마이크로폰은 상기 측방에서 수신된 음향들을 제거하면서, 상기 전후방에서 균등하게 사운드를 수신한다.
도 22D는 하이퍼카디오드(hypercardioid) 마이크로폰 신호 감지 패턴을 나타내고 있다. 상기 하이퍼카디오드 감지 패턴은 상기 마이크로폰의 전방으로부터 풀 출력을 제공하고, 상기 카디오이드형(cardioid) 패턴에 비해 보다 더 협소한 각의 주된 감도(sensitivity)를 제공하는, 상기 전방 위치로부터 ±9O에서 더 낮은 출력을 제공한다. 더욱이, 상기 하이퍼카디오드 패턴은, 상기 전방으로부터 대략 ±140 도에 위치한, 최소 감도의 2개의 포인트를 구비한다. 이와 같이, 상기 하이퍼카디오드 패턴은 상기 마이크로폰의 측방과 후방 양쪽으로부터 수신된 음향을 억제한다. 따라서, 하이퍼카디오드 패턴은 룸 환경 및 상호 양자로부터의 보컬리스트 및 인스트루먼트를 아이솔레이트하기에 가장 적합하다.
상기 일 실시예의 음성 추출 시스템의 기법이나 방식은, 컴퓨터 지령코드와 같은 기계-실행가능 명령에 직접적으로 통하는 인스트럭션(instructions)에서 구현된다. 상기 인스트럭션은 수신된 신호들에 대하여 음성 추출을 수행하도록 상기 인스트럭션을 가지고 프로그램화되어있다. 또한, 일 실시예의 방법은 실행된 방법을 위한, 또는 프로그램화된 컴퓨터 구성요소와 상용 하드웨어 구성요소의 조합에 의한, 적절한 로직을 포함하는 특정 하드웨어 구성요소에 의해 수행될 수 있다. 더욱이, 일 실시예의 음성 추출 시스템은 분산 컴퓨팅 환경에서 채용될 수 있다.
본 발명의 본문 기재의 다양한 실시예가 예시 및 기재를 목적으로 제공되어 있다. 이는 물론 기재된 바와 같은 정확한 구성에만 한정되는 것은 아니다. 많은 변형과 균등한 장치가 가능하고 이 또한 본 발명에 포함됨은 물론이다.

Claims (57)

  1. 적어도 두개의 입력들을 신호처리 시스템에 제공하는 적어도 두개의 수신기 요소들을 포함하는 장치의 개별적인 수신기 요소들을 위치지정하기 위한 방법에 있어서,
    적어도 하나의 관련 신호의 소스에 대한 적어도 하나의 위치를 식별하는 단계;
    적어도 하나의 제1 수신기 요소에 대한 위치를 결정하는 단계;
    상기 적어도 하나의 관련신호의 특성에 응답하여, 상기 신호처리 시스템의 만족한 성능을 제공하는 표준 세트를 발생시키는 단계; 및
    상기 표준 세트에 응답하여 상기 적어도 하나의 제1수신기 요소에 대한 적어도 하나의 추가적인 수신기 요소의 위치를 결정하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서, 상기 표준 세트는 규정된 수의 상기 개별적인 수신기 요소들 보다 많이 등록되는 동일한 신호들을 유도하는 수신기 요소 배치의 실격사유(disqualification)를 포함하는 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 신호처리 시스템은 상기 적어도 두 개의 수신기 요소들에 의해 등록된 적어도 하나의 입력 신호를 사용하여 상기 적어도 하나의 관련신호 및 적어도 하나의 간섭 신호를 구분하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서, 상기 표준 세트는 상기 적어도 두 개의 수신기 요소들에 의해 등록되는 간섭신호들의 합이 유사한 특성들을 가지도록 상기 개별적인 수신기 요소들을 위치지정하는 단계를 포함하는 것을 특징으로 하는 방법.
  5. 제3항에 있어서, 상기 적어도 두 개의 수신기 요소들 사이의 공간은 약 0.5 내지 5 인치 범위인 것을 특징으로 하는 방법.
  6. 제3항에 있어서, 상기 적어도 두 개의 수신기 요소들은 적어도 두 개의 마이크로폰 요소들을 포함하는 것을 특징으로 하는 방법.
  7. 제6항에 있어서, 각각의 상기 적어도 두 개의 마이크로폰 요소들의 1차축은 상기 적어도 하나의 관련 신호로부터의 음파의 방향에 대해 거의 수직한 것을 특징으로 하는 방법.
  8. 제6항에 있어서, 각각의 상기 적어도 두 개의 마이크로폰 요소들의 1차축은 상기 적어도 하나의 관련 신호로부터의 음파 전파 방향에 대해 거의 평행한 것을 특징으로 하는 방법.
  9. 제6항에 있어서, 상기 적어도 두 개의 마이크로폰 요소들 중 하나의 1차축은 상기 적어도 하나의 관련 신호로부터의 음파 전파 방향에 대해 거의 수직이며 상기 적어도 두 개의 마이크로폰 요소들 중 다른것의 1차축은 상기 적어도 하나의 관련 신호로부터의 음파 전파의 방향에 대해 거의 평행인 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 개별적인 수신기 요소들은 컴퓨터, 모니터, 휴대용 컴퓨팅 장치, 보청기, 차량 텔레마틱 시스템, 휴대폰, PDA, 및 통신장치들로 구성된 그룹으로부터 선택된 적어도 하나의 장치에 결합되는 것을 특징으로 하는 방법.
  11. 제1항에 있어서, 상기 차량 텔레마틱 시스템에 결합된 상기 개별적인 수신기 요소들은 필러, 차양판, 헤드라이너, 오버헤드 콘솔, 백미러, 대시보드 및 인스트루먼트 클러스터로 구성된 그룹으로부터 선택된 적어도 하나의 차량 구성요소에 위치되는 것을 특징으로 하는 방법.
  12. 제1항에 있어서, 상기 개별적인 수신기 요소들은 볼펜, 필기도구, 오디오 재생 및 녹음 장치, 청취장치, 헤드셋, 귀마개, 의류품, 안경, 헤어 액세서리, 시계, 팔치, 귀고리, 보석, 몸에 착용할 수 있는 품목, 및 의류품 상에 착용할 수 있는 품목으로 구성된 그룹으로부터 선택된 적어도 하나의 품목상에 위치되는 것을 특징으로 하는 방법.
  13. 제1항에 있어서, 상기 개별적인 수신기 요소들은 귀관에 삽입된 장치에 결합되는 것을 특징으로 하는 방법.
  14. 신호처리 시스템의 수신기 어레이를 위치지정하기 위한 방법에 있어서,
    적어도 하나의 관련 신호의 소스들의 적어도 하나의 위치를 식별하는 단계;
    상기 적어도 하나의 위치에 대한 수신기 어레이의, 적시에 상기 적어도 하나의 관련 신호를 첫번째로 수신하는, 적어도 하나의 제1수신기 요소의 위치를 결정하는 단계; 및
    상기 적어도 하나의 제1수신기 요소에 대한 상기 수신기 어레이의 적어도 하나의 제2수신기 요소의 상응하는 위치를 결정하는 단계로서, 상기 적어도 하나의 제2수신기 요소는 적시에 상기 적어도 하나의 관련신호를 두번째로 수신하고, 상기 적어도 하나의 제1수신기 요소와 제2수신기 요소 사이의 공간은 상기 적어도 하나의 관련 신호 및 간섭 소스들의 합의 다수의 선형 조합들의 발생, 및 제1합이 제2합을 닮도록 간섭 소스들의 합의 등록을 지원하는 적어도 하나의 시간 지연을 제공하는, 단계;를 포함하는 것을 특징으로 하는 방법.
  15. 제14항에 있어서, 상기 공간은 적어도 하나의 수신된 신호의 다수의 지연된 버전상에서의 신호추출을 이행하는 것을 지원하는 것을 특징으로 하는 방법.
  16. 제14항에 있어서, 상기 적어도 하나의 제1수신기 요소는 적어도 하나의 제1마이크로폰을 포함하고 상기 적어도 하나의 제2수신기 요소는 적어도 하나의 제2 마이크로폰을 포함하는 것을 특징으로 하는 방법.
  17. 제16항에 있어서, 각각의 상기 적어도 하나의 제1마이크로폰 및 상기 적어도 하나의 제2마이크로폰의 신호 진폭이 상이한 적어도 하나의 내부-마이크로폰을 사용하여 상기 적어도 하나의 관련 신호를 분리하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  18. 제14항에 있어서, 각각의 다수의 소스들에 상응하는 적어도 하나의 제1수신기 요소 및 적어도 하나의 제2수신기 요소를 더 포함하는 것을 특징으로 하는 방법.
  19. 제14항에 있어서, 각각의 다수의 소스들에 상응하는 적어도 하나의 제1 수신기 요소를 더 포함하며, 상기 적어도 하나의 제2수신기 요소는 상기 다수의 소스들에 대해 공통인 하나의 마이크로폰 요소를 포함하는 것을 특징으로 하는 방법.
  20. 제14항에 있어서, 상기 적어도 하나의 제1수신기 요소는 적시에 제1 소스로부터 첫번째로 적어도 하나의 신호를, 그리고 적시에 제2소스로부터 두번째로 적어도 하나의 신호를 수신하고, 상기 적어도 하나의 제2수신기 요소는 적시에 제2소스로부터 첫번째로 상기 적어도 하나의 신호를, 그리고 적시에 제1소스로부터 두번째로 적어도 상기 하나의 신호를 수신하는 것을 특징으로 하는 방법.
  21. 복합 오디오 신호로부터 적어도 하나의 관련 신호를 추출하기 위한 방법에 있어서,
    적어도 하나의 관련 신호의 소스에 대한 적어도 하나의 위치를 식별하는 단계;
    적어도 하나의 위치에 대해 마이크로폰 장치의 적어도 하나의 제1마이크로폰 요소를 위한 상응하는 위치를 결정하는 단계;
    상기 복합 오디오 신호의 특성들에 대해 응답하여, 상기 복합 오디오 신호로부터 상기 관련신호의 만족한 추출을 제공하는 표준 세트를 발생시키는 단계; 및
    상기 표준 세트에 응답하여 상기 적어도 하나의 제1마이크로폰 요소에 대한 마이크로폰 장치의 적어도 하나의 추가적인 마이크로폰 요소의 상응하는 위치를 결정하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  22. 제21항에 있어서, 상기 표준 세트는, 상기 복합 오디오 신호로부터 상기 관련 신호의 만족스런 제거를 제공하는 제2표준 세트로 교체되는 것을 특징으로 하는 방법.
  23. 제22항에 있어서, 상기 표준 세트는 상기 제2표준 세트에 의해 보완되는 것을 특징으로 하는 방법.
  24. 제21항에 있어서, 상기 표준 세트는 신호 추출동안 인과관계를 유지하는 단계를 포함하는 것을 특징으로 하는 방법.
  25. 제24항에 있어서, 상기 마이크로폰 장치의 적어도 하나의 마이크로폰 요소로 등록된 적어도 하나의 입력 신호를 지연시켜 인과관계를 유지시키는 단계를 더 포함하는 것을 특징으로 하는 방법.
  26. 복합 오디오 신호로부터 적어도 하나의 관련 신호를 추출하기 위한 방법에 있어서,
    상기 적어도 하나의 관련 신호의 소스의 적어도 하나의 위치에 대한 수신기 어레이의, 적시에 상기 적어도 하나의 관련 신호를 첫번째로 수신하는, 적어도 하나의 제1수신기 요소의 위치를 결정하는 단계;
    상기 적어도 하나의 제1수신기 요소에 대한 상기 수신기 어레이의 적어도 하나의 제2수신기 요소의 위치를 결정하는 단계로서, 상기 적어도 하나의 제2수신기 요소는 적시에 상기 적어도 하나의 관련신호를 두번째로 수신하고, 상기 적어도 하나의 제1수신기 요소와 제2수신기 요소 사이의 공간은 상기 적어도 하나의 소스 신호 및 간섭 소스들의 합의 다수의 선형 조합들의 발생, 및 제1합이 제2합을 닮도록 간섭 소스들의 합의 등록을 허용하는, 단계;
    상기 수신기 어레이를 사용하여 상기 복합 오디오 신호를 수신하는 단계; 및
    신호 진폭이 상이한 적어도 하나의 내부-수신기 요소를 사용하여 상기 적어도 하나의 관련신호를 추출하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  27. 제26항에 있어서, 상기 공간은 적어도 하나의 수신된 신호의 다수의 지연된 버전상에서의 신호의 추출을 이행하는 단계를 지원하는 것을 특징으로 하는 방법.
  28. 제26항에 있어서, 각각의 다수의 소스들에 상응하는 적어도 하나의 제1수신기 요소를 더 포함하며, 상기 적어도 하나의 제2수신기 요소는 상기 다수의 소스들에 공통인 하나의 마이크로폰 요소를 포함하는 것을 특징으로 하는 방법.
  29. 음성 처리 시스템과 사용하기 위한 마이크로폰 어레이에 있어서,
    적어도 하나의 소스로부터 적시에 적어도 하나의 관련 신호를 첫번째로 수신하기 위해 위치된 적어도 하나의 제1마이크로폰 요소; 및
    상기 적어도 하나의 제1마이크로폰 요소에 대해 적시에 상기 적어도 하나의 관련 신호를 두번째로 수신하기 위해 위치된 적어도 하나의 제2마이크로폰 요소로서, 상기 적어도 하나의 제1마이크로폰 요소와 상기 적어도 하나의 제2마이크로폰 요소 사이의 공간은 상기 적어도 하나의 소스 신호와 간섭 소스들의 합의 다수의 조합의 생성을 허용하는, 적어도 하나의 제2마이크로폰 요소;
    를 포함하는 것을 특징으로 하는 마이크로폰 어레이.
  30. 제29항에 있어서, 상기 공간은 적어도 하나의 마이크로폰 요소에 의해 등록된 상기 합이 적어도 하나의 다른 마이크로폰 요소에 의해 등록된 합을 닮도록 간섭 소스들의 합의 등록을 지원하는 것을 특징으로 하는 마이크로폰 어레이.
  31. 제29항에 있어서, 적어도 두 개의 마이크로폰 요소들은 미지의 횟수로 상기 적어도 하나의 관련 신호를 수신하고, 지연은 신호 처리 이전에 적어도 하나의 수신된 마이크로폰 신호에 도입되는 것을 특징으로 하는 마이크로폰 어레이.
  32. 제31항에 있어서, 제1 길이의 지연은 제1 마이크로폰 요소의 수신 신호에 적용되고 제2길이의 딜레이는 제2마이크로폰 요소의 수신 신호에 적용되는 것을 특징으로 하는 마이크로폰 어레이.
  33. 제29항에 있어서, 상기 공간은 약 0.5 내지 5인치 범위인 것을 특징으로 하는 마이크로폰 어레이.
  34. 제29항에 있어서, 각각 관련 신호 소스들의 세트 중 하나에 상응하는 적어도 하나의 제1마이크로폰 요소 및 적어도 하나의 제2마이크로폰 요소를 더 포함하는 것을 특징으로 하는 마이크로폰 어레이.
  35. 제29항에 있어서, 적어도 한 쌍의 마이크로폰 요소들을 더 포함하며, 각 쌍의 마이크로폰 요소들은 적어도 하나의 관련 신호 소스에 상응하는 것을 특징으로 하는 마이크로폰 어레이.
  36. 제29항에 있어서, 적어도 하나의 마이크로폰 요소는 적어도 두 개의 마이크로폰 쌍들에 대해 공통인 것을 특징으로 하는 마이크로폰 어레이.
  37. 제29항에 있어서, 각각 다수의 소스들에 상응하는 적어도 하나의 제1 마이크로폰 요소를 더 포함하며, 상기 적어도 하나의 제2마이크로폰 요소는 상기 다수의 소스들에 공통인 하나의 마이크로폰 요소를 포함하는 것을 특징으로 하는 마이크로폰 어레이.
  38. 제29항에 있어서, 상기 마이크로폰 어레이는 휴대용 컴퓨팅 장치, 보청기, 차량 텔레마틱 시스템, 휴대폰, PDA, 및 통신장치들로 구성된 그룹으로부터 선택된 적어도 하나의 장치에 결합되는 것을 특징으로 하는 마이크로폰 어레이.
  39. 제38항에 있어서, 상기 차량 텔레마틱 시스템에 결합된 상기 마이크로폰 어레이는 필러, 차양판, 헤드라이너, 오버헤드 콘솔, 백미러, 대시보드 및 인스트루먼트 클러스터로 구성된 그룹으로부터 선택된 적어도 하나의 차량 구성요소에 위치되는 것을 특징으로 하는 마이크로폰 어레이.
  40. 제29항에 있어서, 상기 마이크로폰 어레이는 볼펜, 필기도구, 오디오 재생 및 녹음 장치, 청취장치, 헤드셋, 귀마개, 의류품, 안경, 헤어 액세서리, 시계, 팔치, 귀고리, 보석, 몸에 착용할 수 있는 품목, 및 의류품 상에 착용할 수 있는 품목으로 구성된 그룹으로부터 선택된 적어도 하나의 품목상에 위치되는 것을 특징으로 하는 마이크로폰 어레이.
  41. 오디오 신호 처리 시스템에 있어서,
    적어도 하나의 신호 처리기; 및
    적어도 하나의 환경 및 상기 적어도 하나의 신호 처리기 사이에서 결합된 적어도 하나의 마이크로폰 어레이;를 포함하며,
    상기 적어도 하나의 신호 처리기는 복합 오디오 신호로부터 적어도 하나의 관련 신호를 추출하는 것을 특징으로 하는 오디오 신호 처리 시스템.
  42. 오디오 신호처리 시스템에 있어서,
    적어도 하나의 신호 처리기;
    적어도 하나의 환경 및 상기 적어도 하나의 신호 처리기 사이에서 결합된 적어도 하나의 마이크로폰 어레이를 포함하며,
    상기 적어도 하나의 마이크로폰 어레이는,
    적어도 하나의 환경에서 적어도 하나의 소스로부터 적어도 하나의 관련 신호를 첫번째로 수신하도록 위치된 적어도 하나의 제1마이크로폰 요소; 및
    상기 적어도 하나의 제1마이크로폰 요소에 대해 적시에 상기 적어도 하나의 관련 신호를 두번째로 수신하도록 위치된 적어도 하나의 제2마이크로폰 요소;를 포함하며,
    상기 적어도 하나의 제1마이크로폰 요소와 제2마이크로폰 요소 사이의 공간은 상기 적어도 하나의 소스 신호 및 간섭 소스들의 합의 다수의 선형 조합들의 발생, 및 제1합이 제2합을 닮도록 간섭 소스들의 합의 등록을 허용하는 것을 특징으로 하는 오디오 신호 처리 시스템.
  43. 입력 채널에 각각 상응하는 적어도 두 개의 마이크로폰 요소들을 사용하여 복합 오디오 신호로부터 적어도 하나의 관련 신호를 추출하기 위한 방법에 있어서,
    적어도 두 개의 출력 채널들 사이에서 적어도 하나의 입력 채널의 콘텐츠들을 할당하는 단계를 포함하며, 상기 적어도 두개의 출력 채널들 중 적어도 하나의 출력 채널은 상기 적어도 하나의 입력 채널 보다 큰 비율의 상기 적어도 하나의 관련 신호를 포함하는 것을 특징으로 하는 방법.
  44. 제43항에 있어서, 상기 적어도 하나의 출력 채널은 상기 적어도 하나의 입력 채널 보다 낮은 비율의 상기 적어도 하나의 관련 신호를 포함하는 것을 특징으로 하는 방법.
  45. 제43항에 있어서, 할당은 적어도 하나의 블라인드 신호 분리 방법을 포함하는 것을 특징으로 하는 방법.
  46. 제43항에 있어서, 사용된 다수의 입력 채널들은 상기 적어도 하나의 입력 채널의 특성들에 응답하여 변하는 것을 특징으로 하는 방법.
  47. 제43항에 있어서, 사용된 다수의 출력 채널들은 상기 적어도 하나의 입력 채널 또는 상기 적어도 하나의 출력 채널의 특성들에 응답하여 변하는 것을 특징으로 하는 방법.
  48. 제43항에 있어서, 할당은 적어도 하나의 입력 채널 및 적어도 하나의 다른 입력 채널 사이에서의 적어도 하나의 작동을 포함하는 것을 특징으로 하는 방법.
  49. 제43항에 있어서, 할당은 다수의 출력 채널들 사이에서의 적어도 하나의 작동을 포함하는 것을 특징으로 하는 방법.
  50. 제43항에 있어서, 할당은 상기 적어도 하나의 입력 채널 및 상기 적어도 하나의 출력 채널 사이의 적어도 하나의 작동을 포함하는 것을 특징으로 하는 방법.
  51. 처리시스템에서 실행될 때 포지셔닝 정보를 신호처리 시스템의 수신기 장치에 제공하는 실행가능한 명령어들을 포함하는 컴퓨터 판독가능한 매체에 있어서,
    상기 포지셔닝 정보는,
    적어도 하나의 관련 신호의 소스에 대한 적어도 하나의 위치를 식별하는 단계;
    적어도 하나의 제1 수신기 요소에 대한 위치를 결정하는 단계;
    상기 적어도 하나의 관련신호의 특성에 응답하여, 상기 신호처리 시스템의 만족한 성능을 제공하는 표준 세트를 발생시키는 단계; 및
    상기 표준 세트에 응답하여 상기 적어도 하나의 제1수신기 요소에 대한 적어도 하나의 추가적인 수신기 요소의 상응하는 위치를 결정하는 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능한 매체.
  52. 처리시스템에서 실행될 때 포지셔닝 정보를 신호처리 시스템의 수신기 어레이에 제공하는 실행가능한 명령어들을 포함하는 컴퓨터 판독가능한 매체에 있어서,
    상기 포지셔닝 정보는,
    적어도 하나의 관련 신호의 소스들의 적어도 하나의 위치를 식별하는 단계;
    상기 적어도 하나의 위치에 대한 수신기 어레이의, 적시에 상기 적어도 하나의 관련 신호를 첫번째로 수신하는, 적어도 하나의 제1수신기 요소의 위치를 결정하는 단계; 및
    상기 적어도 하나의 제1수신기 요소에 대한 상기 수신기 어레이의 적어도 하나의 제2수신기 요소의 위치를 결정하는 단계로서, 상기 적어도 하나의 제2수신기 요소는 적시에 상기 적어도 하나의 관련신호를 두번째로 수신하고, 상기 적어도 하나의 제1수신기 요소와 제2수신기 요소 사이의 공간은 상기 적어도 하나의 관련 신호 및 간섭 소스들의 합의 다수의 선형 조합들의 발생, 및 제1합이 제2합을 닮도록 간섭 소스들의 합의 등록을 허용하는, 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능한 매체.
  53. 처리 시스템에서 수행될 때, 복합 오디오 신호로부터 적어도 하나의 관련 신호를 분리시키는 실행가능한 명령어들을 포함하는 컴퓨터 판독가능한 매체에 있어서, 상기 분리는,
    상기 적어도 하나의 관련 신호의 소스의 적어도 하나의 위치에 대한 수신기 어레이의, 적시에 상기 적어도 하나의 관련 신호를 첫번째로 수신하는, 적어도 하나의 제1수신기 요소의 상응하는 위치를 결정하는 단계;
    상기 적어도 하나의 제1수신기 요소에 대한 상기 수신기 어레이의 적어도 하나의 제2수신기 요소의 상응하는 위치를 결정하는 단계로서, 상기 적어도 하나의 제2수신기 요소는 적시에 상기 적어도 하나의 관련신호를 두번째로 수신하고, 상기 적어도 하나의 제1수신기 요소와 제2수신기 요소 사이의 공간은 상기 적어도 하나의 소스 신호 및 간섭 소스들의 합의 다수의 선형 조합들의 발생, 및 제1합이 제2합을 닮도록 간섭 소스들의 합의 등록을 허용하는, 단계;
    상기 수신기 어레이를 사용하여 상기 복합 오디오 신호를 수신하는 단계; 및
    신호 진폭이 상이한 적어도 하나의 내부-수신기 요소를 사용하여 상기 적어도 하나의 관련신호를 분리하는 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능한 매체.
  54. 처리 시스템에서 수행될 때, 복합 오디오 신호로부터 적어도 하나의 관련 신호를 분리시키는 실행가능한 명령어들을 포함하는 컴퓨터 판독가능한 매체에 있어서, 상기 분리는,
    적어도 두개의 마이크로폰 요소들을 적어도 하나의 입력 채널에 결합시키는 단계; 및
    적어도 두 개의 출력 채널들 사이에 상기 적어도 하나의 입력 채널의 콘텐츠를 할당하는 단계;를 포함하며,
    적어도 하나의 출력 채널은 상기 적어도 하나의 입력 채널 보다 큰 비율의 상기 적어도 하나의 관련 신호를 포함하는 것을 특징으로 하는 컴퓨터 판독가능한 매체.
  55. 제54항에 있어서, 상기 적어도 하나의 출력 채널은 상기 적어도 하나의 입력 채널 보다 작은 비율의 상기 적어도 하나의 관련 신호를 포함하는 것을 특징으로 하는 컴퓨터 판독가능한 매체.
  56. 제54항에 있어서, 마이크로폰 장치의 적어도 하나의 마이크로폰 요소에 대해적어도 하나의 관련신호의 소스의 적어도 하나의 위치의 근접 위치를 결정하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능한 매체.
  57. 처리시스템에서 수행될 때 위치지정 정보를 신호처리 시스템의 수신기 장치에 제공하는 실행가능한 명령어들을 포함하는 전자기 매체에 있어서,
    상기 위치지정 정보는,
    적어도 하나의 관련 신호의 소스에 대한 적어도 하나의 위치를 식별하는 단계;
    적어도 하나의 제1 수신기 요소에 대한 위치를 결정하는 단계;
    상기 적어도 하나의 관련신호의 특성에 응답하여, 상기 신호처리 시스템의 만족한 성능을 제공하는 특성 표준을 발생시키는 단계; 및
    상기 표준 세트에 응답하여 상기 적어도 하나의 제1수신기 요소에 대한 적어도 하나의 추가적인 수신기 요소의 상대적 위치를 결정하는 단계;
    를 포함하는 것을 특징으로 하는 전자기 매체.
KR1020027013033A 2000-03-31 2001-03-30 음성 신호 추출 방법 및 장치 KR20020093873A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US19377900P 2000-03-31 2000-03-31
US60/193,779 2000-03-31
PCT/US2001/010550 WO2001076319A2 (en) 2000-03-31 2001-03-30 Method and apparatus for voice signal extraction

Publications (1)

Publication Number Publication Date
KR20020093873A true KR20020093873A (ko) 2002-12-16

Family

ID=22714965

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027013033A KR20020093873A (ko) 2000-03-31 2001-03-30 음성 신호 추출 방법 및 장치

Country Status (8)

Country Link
US (1) US20020009203A1 (ko)
EP (1) EP1295507A2 (ko)
JP (1) JP2003530051A (ko)
KR (1) KR20020093873A (ko)
CN (1) CN1436436A (ko)
AU (1) AU2001251213A1 (ko)
CA (1) CA2404071A1 (ko)
WO (1) WO2001076319A2 (ko)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7206418B2 (en) * 2001-02-12 2007-04-17 Fortemedia, Inc. Noise suppression for a wireless communication device
US7142677B2 (en) * 2001-07-17 2006-11-28 Clarity Technologies, Inc. Directional sound acquisition
AUPR647501A0 (en) * 2001-07-19 2001-08-09 Vast Audio Pty Ltd Recording a three dimensional auditory scene and reproducing it for the individual listener
US7068796B2 (en) * 2001-07-31 2006-06-27 Moorer James A Ultra-directional microphones
US6978010B1 (en) 2002-03-21 2005-12-20 Bellsouth Intellectual Property Corp. Ambient noise cancellation for voice communication device
KR100499124B1 (ko) * 2002-03-27 2005-07-04 삼성전자주식회사 직교 원형 마이크 어레이 시스템 및 이를 이용한 음원의3차원 방향을 검출하는 방법
KR100491530B1 (ko) 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
US7613310B2 (en) * 2003-08-27 2009-11-03 Sony Computer Entertainment Inc. Audio input system
US6917688B2 (en) * 2002-09-11 2005-07-12 Nanyang Technological University Adaptive noise cancelling microphone system
US6934397B2 (en) 2002-09-23 2005-08-23 Motorola, Inc. Method and device for signal separation of a mixed signal
JP4348706B2 (ja) 2002-10-08 2009-10-21 日本電気株式会社 アレイ装置および携帯端末
CA2522896A1 (en) * 2003-04-23 2004-11-04 Rh Lyon Corp Method and apparatus for sound transduction with minimal interference from background noise and minimal local acoustic radiation
EP1489596B1 (en) * 2003-06-17 2006-09-13 Sony Ericsson Mobile Communications AB Device and method for voice activity detection
US20050085185A1 (en) * 2003-10-06 2005-04-21 Patterson Steven C. Method and apparatus for focusing sound
EP1581026B1 (en) 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
WO2009009568A2 (en) * 2007-07-09 2009-01-15 Mh Acoustics, Llc Augmented elliptical microphone array
FR2874781B1 (fr) * 2004-08-25 2009-03-20 Cit Alcatel Appareil electronique portatif stereo
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8180067B2 (en) 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
JP4951067B2 (ja) * 2006-07-25 2012-06-13 アナログ デバイシス, インコーポレイテッド 複数のマイクロホンシステム
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
CN100505837C (zh) 2007-05-10 2009-06-24 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
KR20080111290A (ko) * 2007-06-18 2008-12-23 삼성전자주식회사 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
NO332961B1 (no) * 2008-12-23 2013-02-11 Cisco Systems Int Sarl Forhoyet toroidmikrofonapparat
WO2010121916A1 (en) * 2009-04-23 2010-10-28 Phonic Ear A/S Cross-barrier communication system and method
KR101253610B1 (ko) * 2009-09-28 2013-04-11 한국전자통신연구원 사용자 음성을 이용한 위치 추적 장치 및 그 방법
KR20140010468A (ko) 2009-10-05 2014-01-24 하만인터내셔날인더스트리스인코포레이티드 오디오 신호의 공간 추출 시스템
NO20093511A1 (no) * 2009-12-14 2011-06-15 Tandberg Telecom As Toroidemikrofon
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
WO2011105003A1 (ja) 2010-02-25 2011-09-01 パナソニック株式会社 信号処理装置及び信号処理方法
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
JP5545676B2 (ja) * 2011-11-07 2014-07-09 株式会社ホンダアクセス 車室内のマイクアレイ配置構造
US9107001B2 (en) 2012-10-02 2015-08-11 Mh Acoustics, Llc Earphones having configurable microphone arrays
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9905243B2 (en) * 2013-05-23 2018-02-27 Nec Corporation Speech processing system, speech processing method, speech processing program, vehicle including speech processing system on board, and microphone placing method
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
DE112016007079T5 (de) * 2016-07-21 2019-04-04 Mitsubishi Electric Corporation Störgeräuschbeseitigungseinrichtung, echolöscheinrichtung, anormales-geräusch-detektionseinrichtung und störgeräuschbeseitigungsverfahren
MC200185B1 (fr) * 2016-09-16 2017-10-04 Coronal Audio Dispositif et procédé de captation et traitement d'un champ acoustique tridimensionnel
MC200186B1 (fr) 2016-09-30 2017-10-18 Coronal Encoding Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel
CN108975114B (zh) * 2017-06-05 2021-05-11 奥的斯电梯公司 用于电梯中的故障检测的系统和方法
CN110610718B (zh) * 2018-06-15 2021-10-08 炬芯科技股份有限公司 一种提取期望声源语音信号的方法及装置
WO2020194717A1 (ja) * 2019-03-28 2020-10-01 日本電気株式会社 音響認識装置、音響認識方法、及び、プログラムが格納された非一時的なコンピュータ可読媒体
US11937056B2 (en) * 2019-08-22 2024-03-19 Rensselaer Polytechnic Institute Multi-talker separation using 3-tuple coprime microphone array
CN113345399A (zh) * 2021-04-30 2021-09-03 桂林理工大学 一种强噪声环境下的机器设备声音监测方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5952996A (ja) * 1982-09-20 1984-03-27 Nippon Telegr & Teleph Corp <Ntt> 可変指向性音響装置
DE8529458U1 (de) * 1985-10-16 1987-05-07 Siemens AG, 1000 Berlin und 8000 München Hörgerät
US5140670A (en) * 1989-10-05 1992-08-18 Regents Of The University Of California Cellular neural network
CH681411A5 (ko) * 1991-02-20 1993-03-15 Phonak Ag
US5208786A (en) * 1991-08-28 1993-05-04 Massachusetts Institute Of Technology Multi-channel signal separation
IL101556A (en) * 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
US5355528A (en) * 1992-10-13 1994-10-11 The Regents Of The University Of California Reprogrammable CNN and supercomputer
AU6792194A (en) * 1993-05-03 1994-11-21 University Of British Columbia, The Tracking platform system
DE4315000A1 (de) * 1993-05-06 1994-11-10 Opel Adam Ag Geräuschkompensierte Freisprechanlage in Kraftfahrzeugen
US5383164A (en) * 1993-06-10 1995-01-17 The Salk Institute For Biological Studies Adaptive system for broadband multisignal discrimination in a channel with reverberation
US5473701A (en) * 1993-11-05 1995-12-05 At&T Corp. Adaptive microphone array
US5706402A (en) * 1994-11-29 1998-01-06 The Salk Institute For Biological Studies Blind signal processing system employing information maximization to recover unknown signals through unsupervised minimization of output redundancy
US6978159B2 (en) * 1996-06-19 2005-12-20 Board Of Trustees Of The University Of Illinois Binaural signal processing using multiple acoustic sensors and digital filtering
AU740617C (en) * 1997-06-18 2002-08-08 Clarity, L.L.C. Methods and apparatus for blind signal separation

Also Published As

Publication number Publication date
CN1436436A (zh) 2003-08-13
EP1295507A2 (en) 2003-03-26
WO2001076319A2 (en) 2001-10-11
US20020009203A1 (en) 2002-01-24
AU2001251213A1 (en) 2001-10-15
JP2003530051A (ja) 2003-10-07
WO2001076319A3 (en) 2002-12-27
CA2404071A1 (en) 2001-10-11

Similar Documents

Publication Publication Date Title
KR20020093873A (ko) 음성 신호 추출 방법 및 장치
US10535362B2 (en) Speech enhancement for an electronic device
US8467543B2 (en) Microphone and voice activity detection (VAD) configurations for use with communication systems
CN104883636B (zh) 仿生听力耳麦
JP4348706B2 (ja) アレイ装置および携帯端末
US10269369B2 (en) System and method of noise reduction for a mobile device
US8180067B2 (en) System for selectively extracting components of an audio input signal
EP3593349B1 (en) System and method for relative enhancement of vocal utterances in an acoustically cluttered environment
CN113544775B (zh) 用于头戴式音频设备的音频信号增强
US11638092B2 (en) Advanced speech encoding dual microphone configuration (DMC)
US11019414B2 (en) Wearable directional microphone array system and audio processing method
US20140372113A1 (en) Microphone and voice activity detection (vad) configurations for use with communication systems
CN113038318B (zh) 一种语音信号处理方法及装置
CN116343808A (zh) 柔性麦克风阵列语音增强方法及装置、电子设备、介质
US20090285422A1 (en) Method for operating a hearing device and hearing device
JP7040198B2 (ja) 収音装置、プログラム及び方法
JP7176316B2 (ja) 収音装置、プログラム及び方法
JP7350092B2 (ja) 眼鏡デバイス、システム、装置、および方法のためのマイク配置
JP7176291B2 (ja) 収音装置、プログラム及び方法
JP6973224B2 (ja) 収音装置、プログラム及び方法
Yermeche Soft-constrained subband beamforming for speech enhancement
Amin et al. Impact of microphone orientation and distance on BSS quality within interaction devices
Elko Future directions for microphone arrays

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid