KR20180036778A

KR20180036778A - 오디오 디바이스에서 재생 관리를 위한 사건 검출

Info

Publication number: KR20180036778A
Application number: KR1020187006440A
Authority: KR
Inventors: 사무엘 본 파르마 에버니저
Original assignee: 시러스 로직 인터내셔널 세미컨덕터 리미티드
Priority date: 2015-08-07
Filing date: 2016-08-05
Publication date: 2018-04-09
Also published as: WO2017027397A3; JP6959917B2; JP2018527857A; KR102409536B1; WO2017027397A2; US11621017B2; US20170040029A1

Abstract

본 발명의 실시예에 따라, 오디오 디바이스에서 오디오 정보를 프로세싱하기 위한 방법은 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하는 단계, 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하는 단계, 적어도 하나의 입력 신호로부터 주위 사운드에서의 근거리 사운드(near-field sound)를 검출하는 단계, 및 근거리 사운드의 검출에 응답하여 하나 이상의 트랜스듀서로 재생된 오디오 정보의 특성을 수정하는 단계를 포함할 수 있다.

Description

오디오 디바이스에서 재생 관리를 위한 사건 검출

관련 출원

본 발명은 2015년 8월 7일에 출원된 미국 가 특허 출원 번호 제 62/202,303 호, 2015년 10월 6일에 출원된 미국 가 특허 출원 번호 제 62/237,868 호, 및 2016년 6월 17일자로 출원된 미국 가 출원 번호 제 62/351,499 호에 대한 우선권을 주장하는 2016년 8월 5일에 출원된 미국 본 특허 출원 번호 제 15/229,429 호에 대한 우선권을 주장하며, 이들 각각은 전체적으로 본 명세서에 참조로서 통합된다.

본 발명의 대표적인 실시예의 분야는 오디오 디바이스에서의 재생 관리에 관련되거나 그에 관한 방법, 장치, 또는 구현에 관한 것이다. 적용은 특정 주위 사건(ambient event)의 검출을 포함하지만, 다수의 마이크로폰으로부터 수신된 신호에 기초한 공간 프로세싱을 이용하는 근거리 사운드(near-field sound)의 검출, 근접 사운드 및 토널 알람 검출(tonal alarm detection)에 관한 것들을 포함하지만 이에 제한되는 것은 아니다.

개인용 오디오 디바이스가 보급되고 그들은 다양한 주위 환경에서 이용된다. 이러한 오디오 디바이스에 이용되는 헤드폰은 수동 또는 능동 방법으로 발생하는 오클루전(occlusion)으로 인해 이용자가 오디오 디바이스 외부의 주위 음장을 추적하지 못하도록 증진되었다. 증가된 격리 및 방해받지 않는 청취가 대부분의 경우에 바람직할지라도, 때로는 안전성 또는 증진된 이용자 경험을 위해, 일부 특정 주위 사건이 이용자에 의해 청취되고 그 사건에 응답하여 적절한 조치가 취해지는 것이 필수적이다. 예를 들면, 이용자가 헤드셋을 통해 음악을 듣고 있고 다른 사람과 대화를 시작하려고 시도하는 누군가에 의해 방해되면, 이용자가 재생 신호를 일시 중단하거나 재생 신호의 볼륨을 줄이지 않는 한 대화를 유지하기가 어려울 수 있다. 예를 들면, 미국 특허 번호 제 7,903,825 호는 재생 신호가 주위 음장에 따라 수정되는 오디오 디바이스를 제안한다. 또 다른 예로서, 미국 특허 번호 제 8,804,974 호는 그 다음, 재생 오디오 콘텐츠의 사건 기반 수정을 구현하기 위해 이용될 수 있는 개인용 오디오 디바이스에서의 주위 사건 검출을 교시한다. 상기 언급된 참조 문헌은 또한 다양한 음향 사건을 검출하기 위해 마이크로폰의 이용을 교시한다. 또 다른 예로서, 2014년 7월 7일에 출원된 미국 출원 일련 번호 제 14/324,286 호는 대화 도중 재생 신호를 조정하기 위한 사건 검출기로서 음성 검출기를 이용하는 것을 교시한다. 일 부가적인 예로서, 미국 특허 번호 제 8,565,446 호는 비 정상(non-stationary) 배경 잡음이 존재할 때 원하는 음성을 검출하여 잡음 감소 반향 제거(NREC) 시스템에서 음성 증진 알고리즘을 제어하기 위해 복수의 마이크로폰 세트로부터 도달 방향(DOA) 추정치 및 간섭 대 원하는(근거리) 음성 신호 비 추정치의 이용을 교시한다. 유사하게, 미국 출원 일련 번호 제 13/199,593 호는 복수의 마이크로폰의 교차 상관 분석을 통해 얻어지는 정규화된 상호-상관 통계의 최대치가 근거리 음성을 검출하기 위한 효과적인 판별자일 수 있음을 교시한다. 배경 음악과 배경 잡음의 존재를 구별하기 위해 NREC 시스템에 대한 스펙트럼 평탄도 측정-기반 음악 검출기가 미국 특허 번호 제 8,126,706 호에 제안되어 있다. 미국 특허 번호 제 7,903,825 호; 제 8,804,974호; 미국 출원 일련 번호 제 14/324,286 호; 미국 특허 번호 제 8,565,446 호; 미국 출원 일련 번호 제 13/199,593 호; 및 미국 특허 번호 제 8,126,706 호는 본 명세서에 참조로서 통합된다.

본 발명의 목적은 오디오 디바이스에서 오디오 정보를 프로세싱하기 위한 방법, 및 상기 오디오 디바이스의 적어도 일부를 구현하기 위한 집적 회로를 제공하는 것이다.

본 발명의 교시에 따라, 개인용 오디오 디바이스에서 재생 관리를 위한 사건 검출에 대한 기존의 접근법과 연관된 하나 이상의 단점 및 문제점이 감소되거나 제거되었다.

본 발명의 실시예에 따르면, 오디오 디바이스에서 오디오 정보를 프로세싱하기 위한 방법은 오디오 디바이스의 적어도 하나의 트랜스듀서(transducer)로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하는 단계, 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하는 단계, 적어도 하나의 입력 신호로부터 주위 사운드에서의 근거리 사운드를 검출하는 단계, 및 근거리 사운드의 검출에 응답하여 적어도 하나의 트랜스듀서로 재생된 오디오 정보의 특성을 수정하는 단계를 포함할 수 있다.

본 발명의 이들 및 다른 실시예에 따르면, 오디오 디바이스의 적어도 일부를 구현하기 위한 집적 회로는 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하도록 구성된 오디오 출력부, 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하도록 구성된 마이크로폰 입력부, 및 입력 신호로부터 주위 사운드에서의 근거리 사운드를 검출하고 근거리 사운드의 검출에 응답하여 오디오 정보의 특성을 수정하도록 구성된 프로세서를 포함할 수 있다.

본 발명의 이들 및 다른 실시예에 따르면, 오디오 디바이스에서 오디오 정보를 프로세싱하기 위한 방법은 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하는 단계, 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하는 단계, 적어도 하나의 입력 신호로부터 오디오 사건을 검출하는 단계, 및 적어도 미리 결정된 시간 동안 지속되는 오디오 사건의 검출에 응답하여 적어도 하나의 트랜스듀서로 재생된 오디오 정보의 특성을 수정하는 단계를 포함할 수 있다.

본 발명의 이들 및 다른 실시예에 따르면, 오디오 디바이스의 적어도 일부를 구현하기 위한 집적 회로는 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하도록 구성된 오디오 출력부, 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하도록 구성된 마이크로폰 입력부, 및 입력 신호로부터 오디오 사건을 검출하고 적어도 미리 결정된 시간 동안 지속되는 오디오 사건의 검출에 응답하여 적어도 하나의 트랜스듀서로 재생된 오디오 정보의 특성을 수정하도록 구성된 프로세서를 포함할 수 있다.

본 발명의 기술적 장점은 본 명세서에 포함된 도면, 설명 및 청구항으로부터 당업자에게 용이하게 명백할 수 있다. 실시예들의 목적 및 장점은 요소, 특징, 및 청구항에 특히 언급된 조합에 의해 적어도 실현되고 성취될 것이다.

상기 일반 설명 및 다음의 상세한 설명 둘 모두가 예 및 예시적이고 본 발명에서 제시된 청구항을 제한하지 않음이 이해될 것이다.

본 실시예 및 그의 특정 장점의 더 완전한 이해는 첨부된 도면과 결부하여 취해진 다음 설명을 참조함으로써 획득될 수 있고, 상기 첨부된 도면에서 유사한 참조 부호는 유사한 피쳐(features)를 나타낸다.

도 1은 본 발명의 실시예에 따라, 이러한 검출기가 재생 관리 시스템과 결부하여 이용되어 이용자 경험을 증진할 수 있는 이용 사례 시나리오의 일례를 도시한 도면.
도 2는 본 발명의 실시예에 따라, 사건 검출기로부터의 결정에 기초하여 재생 신호를 수정하는 일 예시적인 재생 관리 시스템을 도시한 도면.
도 3은 본 발명의 실시예에 따른 일 예시적인 사건 검출기를 도시한 도면.
도 4는 본 발명의 실시예들에 따라, 오디오 사건을 검출하기 위해 이용될 수 있는 근거리 공간 통계를 얻기 위한 시스템의 기능 블록을 도시한 도면.
도 5는 본 발명의 실시예에 따라, 근거리 사운드를 검출하기 위한 예시적인 결합 로직(fusion logic)을 도시한 도면.
도 6은 본 발명의 실시예에 따라, 근접 사운드를 검출하기 위한 예시적인 결합 로직을 도시한 도면.
도 7은 본 발명의 실시예에 따른 근접 음성 검출기의 일 실시예를 도시한 도면.
도 8은 본 발명의 실시예들에 따른 토널 알람 사건을 검출하기 위한 예시적인 결합 로직을 도시한 도면.
도 9는 본 발명의 실시예에 따라, 입증된 오디오 사건 신호를 생성하기 위해 순간 오디오 사건 검출 신호에 적용될 수 있는 홀드 오프(hold-off) 및 행 오버(hang-over) 로직을 도시하는 일 예시적인 타이밍도.
도 10은 본 발명의 실시예들에 따른 홀드 오프 및 행 오버 로직을 갖는 상이한 오디오 사건 검출기를 도시한 도면.

본 발명의 실시예에 따라, 시스템 및 방법은 자동 재생 관리 프레임워크에서 이용될 수 있는 적어도 3개의 상이한 오디오 사건 검출기를 이용할 수 있다. 오디오 디바이스에 대한 그러한 오디오 사건 검출기는 오디오 디바이스의 이용자(예로서, 착용중인 또는 그렇지 않으면 오디오 디바이스를 이용하는 이용자)가 말하는 것과 같은, 오디오 디바이스의 근거리에서 사운드의 소리가 검출될 때를 검출할 수 있는 근거리 검출기, 오디오 디바이스의 이용자에게 근접한 또 다른 사람이 말했을 때와 같은, 오디오 디바이스에 근접한 소리가 검출될 때를 검출할 수 있는 근접성 검출기, 및 오디오 디바이스의 근처에서 발생될 수 있는 음향 알람를 검출하는 토널 알람 검출기를 포함할 수 있다. 도 1은 본 발명의 실시예에 따라, 이러한 검출기가 재생 관리 시스템과 결부하여 이용되어 이용자 경험을 증진할 수 있는 이용 사례 시나리오의 일례를 도시한다.

도 2는 본 발명의 실시예에 따라, 사건 검출기(2)로부터의 결정에 기초하여 재생 신호를 수정하는 일 예시적인 재생 관리 시스템을 도시한다. 프로세서(50)의 신호 프로세싱 기능은 출력 오디오 트랜스듀서(51)(예로서, 확성기)와 마이크로폰(52) 사이의 반향 결합으로 인해 마이크로폰(52)에서 수신되는 음향 반향을 제거할 수 있는 음향 반향 제거기(1)를 포함할 수 있다. 제한 없이, 근거리 검출기(3)에 의해 검출된 근거리 사건(예로서, 오디오 디바이스의 이용자로부터의 음성을 포함하나 이에 제한되지는 않음), 근접성 검출기(4)에 의해 검출된 근접 사건(예로서, 근거리 사운드 이외의 음성 또는 다른 주위 사운드를 포함하지만 이에 제한되지 않음), 및/또는 알람 검출기(5)에 의해 검출된 토널 알람 사건을 포함하는 하나 이상의 다양한 주위 사건을 검출할 수 있는 사건 검출기(2)로 전달될 수 있다. 오디오 사건의 검출되면, 사건 기반 재생 제어부(6)는 출력 오디오 트랜스듀서(51)로 재생된 오디오 정보(도 2에서 "재생 콘텐트"로 도시됨)의 특성을 수정할 수 있다. 오디오 정보는 제한 없이, 통신 네트워크(예로서, 셀룰러 네트워크) 및/또는 내부 오디오 소스로부터의 내부 오디오(예로서, 음악 파일, 비디오 파일, 등)를 통해 수신된 전화 대화와 연관된 다운링크 음성을 포함하는 출력 오디오 트랜스듀서(51)에서 재생될 수 있는 임의의 정보를 포함할 수 있다.

도 3은 본 발명의 실시예에 따른 일 예시적인 사건 검출기를 도시한다. 도 3에 도시된 바와 같이, 예시적인 사건 검출기는 음성 액티비티 검출기(10), 음악 검출기(9), 도달 방향 추정기(7), 근거리 공간 정보 추출기(8), 배경 잡음 레벨 추정기(11), 및 제한 없이, 근거리 사운드, 근거리 사운드 이외의 근접 사운드, 및 토널 알람를 포함하는 오디오 사건을 검출하기 위해, 음성 액티비티 검출기(10), 음악 검출기(9), 도달 방향 추정기(7), 근거리 공간 정보 추출기(8), 및 배경 잡음 레벨 추정기(11)로부터의 정보를 이용하는 결정 결합 로직(12)을 포함할 수 있다.

근거리 검출기(3)는 음성을 포함하는 근거리 사운드를 검출할 수 있다. 이러한 근거리 사운드가 검출될 때, 근거리 사운드의 검출은 이용자가 대화에 참여하고 있음을 나타낼 수 있으므로, 오디오 트랜스듀서(51)로 재생된 오디오 정보를 수정하는 것이 바람직할 수 있다. 이러한 근거리 사운드 검출은 음향적으로 잡음이 많은 조건에서 근거리 사운드를 감지할 수 있어야 하고 매우 다양한 배경 잡음 조건(예로서, 레스토랑의 배경 소음, 운전시 음향 잡음, 등)에서 근거리 사운드의 잘못된 검출에 대해 회복성 있어야 한다. 하기에 더 상세하게 설명된 바와 같이, 근거리 검출은 복수의 마이크로폰(51)을 이용한 공간적 사운드 프로세싱을 요구할 수 있다. 일부 실시예에서, 이러한 근거리 사운드 검출은 미국 특허 번호 제 8,565,446 호 및/또는 미국 특허 일련 번호 제 13/199,593 호에서 설명된 것과 동일하거나 유사한 방식으로 구현될 수 있다.

근접성 검출기(4)는 근거리 사운드 이외의 주위 사운드(예로서, 이용자에 근접한 사람으로부터의 음성, 배경 음악, 등)를 검출할 수 있다. 하기에 더 상세히 설명되는 바와 같이, 근접 사운드를 비 정상 배경 잡음 및 배경 음악과 구별하기가 어려울 수 있기 때문에, 근접성 검출기는 근접 사운드의 잘못된 검출로 인한 불량한 이용자 경험을 회피하기 위해 음악 검출기 및 잡음 레벨 추정을 이용하여 근접성 검출기(4)의 근접 검출을 디스에이블링(disabling)할 수 있다. 일부 실시예에서, 그러한 근접 사운드 검출은 미국 특허 번호 제 8,126,706 호, 미국 특허 번호 제 8,565,446 호, 및/또는 미국 출원 일련 번호 제 13,199,593 호에 설명된 것과 동일하거나 유사한 방식으로 구현될 수 있다.

토널 알람 검출기(5)는 오디오 디바이스에 근접한 토널 알람(예로서, 사이렌)를 검출할 수 있다. 최대한의 이용자 경험을 제공하기 위해, 토널 알람 검출기(5)가 특정 알람(예로서, 아주 약한 알람 또는 낮은 볼륨의 알람)를 무시하는 것이 바람직할 수 있다. 하기에 더 상세하게 설명된 바와 같이, 토널 알람 검출은 복수의 마이크로폰(51)을 이용한 공간적 사운드 프로세싱을 요구할 수 있다. 일부 실시예에서, 그러한 근접 사운드 검출은 미국 특허 번호 제 8,126,706 호 및/또는 미국 출원 일련 번호 제 13,199,593 호에 설명된 것과 동일하거나 유사한 방식으로 구현될 수 있다.

도 4는 본 발명의 실시예들에 따라, 오디오 사건들을 검출하기 위해 이용될 수 있는 근거리 공간 통계를 얻기 위한 시스템의 기능 블록을 도시한다. 레벨 분석(41)은 근거리 마이크로폰과 원거리 마이크로폰 사이의 마이크로폰 간 레벨 차이(imd)를 추정함으로써 마이크로폰(52) 상에서 수행될 수 있다(예로서, 미국 출원 일련 번호 제 13/199,593 호에 설명된 바와 같이). 교차 상관 분석(13)은 마이크로폰(52)에 의해 수신된 신호에 대해 수행되어 마이크로폰(52)에 나쁜 영향을 미치는 주위 사운드의 도달 방향 정보(DOA)를 얻을 수 있다(예로서, 미국 특허 제 8,565,446 호에 설명된 바와 같이). 교차 상관 분석(13)에서, 최대 정규화 상관 값(normMaxCorr)이 또한 얻어질 수 있다(예로서, 미국 출원 일련 번호 제 13/199,593 호에 기술된 바와 같이). 음성 액티비티 검출기(10)는 음성의 존재를 검출하고 주위 사운드에서 음성의 존재 또는 부재를 나타내는 신호(speechDet)를 생성할 수 있다(예로서, 미국 특허 번호 제 7,492,889 호의 확률 기반 음성 존재/부재 기반 접근법에 설명된 바와 같이). 빔 형성기(15)는 마이크로폰(52)으로부터의 신호에 기초하여, 주위 사운드에서의 잡음 레벨(noiseLevel) 및 간섭 대 근거리 신호 비(idr)를 결정하기 위해 잡음 분석(14)에 의해 이용될 수 있는 근거리 신호 추정치 및 간섭 신호 추정치를 생성할 수 있다. 미국 특허 번호 제 8,565,446 호는 한 쌍의 빔 형성기(15)를 이용하여 간섭 대 근거리 신호 비(idr)를 추정하기 위한 일 예시적인 접근법을 설명한다. 음성 액티비티 검출기(36)는 원하는 신호 검출로부터 발생하지 않은 임의의 음성 신호를 검출하기 위해 간섭 추정치(proxSpeechDet)를 이용할 수 있다. 잡음 분석(14)은 주위 사운드의 도달 방향 추정치(DOA)가 근거리 사운드의 수용 각도 밖에 있을 때마다 간섭 신호 에너지를 업데이트함으로써 도달 방향 추정치(DOA)에 기초하여 수행될 수 있다. 근거리 사운드의 도달 방향은 개인용 오디오 디바이스의 산업 디자인에서 주어진 마이크로폰 배열 구성에 선험적으로 알려져 있을 수 있다.

도 4의 시스템에 의해 생성된 다양한 통계는 그 다음, 근거리 사운드의 존재를 검출하기 위해 이용될 수 있다. 도 5는 본 발명의 실시예에 따라 근거리 사운드를 검출하기 위한 예시적인 결합 로직을 도시한다. 도 5에 도시된 바와 같이, 다음의 모든 기준이 만족될 때 근거리 음성이 검출될 수 있다:

주위 사운드의 도달 방향 추정치(DOA)는 근거리 사운드의 수용 각도 이내이다(블록 16);

최대 정규화 교차 상관 통계(normMaxCorr)는 임계치(normMaxCorrThres1)보다 크다(블록 17);

간섭 대 원하는 근거리 신호 비(idr)는 임계치(idrThres1)보다 작다(블록 18);

신호 액티비티는 신호(speechDet)에 의해 표시된 바와 같이 검출된다(블록 19); 및

마이크로폰 간 레벨 차이 통계(imd)는 임계치(imdTh)보다 크다(블록 42).

일부 실시예에서, 임계치(idrThres 및 imdTh)는 배경 잡음 레벨 추정치에 기초하여 동적으로 조정될 수 있다.

근접성 검출기(4)의 근접성 검출은 근거리 검출기(3)의 근거리 사운드 검출과 다를 수 있는데, 이는 근접 음성의 신호 특성이 음악 및 잡음과 같은 주위 신호와 매우 유사할 수 있기 때문이다. 그에 따라, 근접성 검출기(4)는 수용가능한 이용자 경험을 성취하기 위해 근접 음성의 잘못된 검출을 회피해야 한다. 그에 따라, 음악 검출기(9)는 배경에 음악이 존재할 때마다 근접성 검출을 디스에이블링하기 위해 이용될 수 있다. 유사하게, 배경 잡음 레벨이 특정 임계치 이상일 때마다 근접성 검출기(4)는 디스에이블링될 수 있다. 배경 잡음에 대한 임계값은 임계 레벨 미만의 잘못된 검출의 가능성이 매우 낮도록 선험적으로 결정될 수 있다. 도 6은 본 발명의 실시예들에 따라 근접 사운드(예로서, 음성)를 검출하기 위한 예시적인 결합 로직을 도시한다. 게다가, 현실적으로 일시적인 음향 자극을 생성하는 많은 환경 잡음 소스가 존재할 수 있다. 이러한 잡음 유형은 음성 검출기에 의해 음성 신호로서 잘못 검출될 수 있다. 잘못된 검출의 가능성을 줄이기 위해, 음악 검출기(9)로부터의 스펙트럼 평탄도 측정(spectral flatness measure; SFM) 통계는 음성을 일시적인 잡음과 구별하기 위해 이용될 수 있다. 예를 들면, SFM은 시간 기간에 걸쳐 추적될 수 있고 sfmSwing으로 정의되는 동일한 지속기간에 결쳐 최대 및 최소 SFM 값 간의 차이가 산출될 수 있다. sfmSwing의 값은 일반적으로 이러한 신호의 스펙트럼 콘텐트가 현실적으로 광대역이기 때문에 일시적인 잡음 신호에 대해 작을 수 있으며 그들은 짧은 시간 간격(300-500ms) 동안 정상적인 경향이 있다. 음성 신호의 스펙트럼 콘텐트가 일시적인 신호보다 빠르게 변할 수 있기 때문에 sfmSwing의 값은 음성 신호에 대해 더 높을 수 있다. 도 6에 도시된 바와 같이, 근접 사운드(예로서, 음성)는 다음의 모든 기준들이 만족될 때 검출될 수 있다:

음악이 배경에서 감지되지 않는다(블록 20);

도달 방향 추정치(DOA)는 근접 사운드의 수용 각도 내에 있다(블록 21);

최대 정규화 교차 상관 통계(normMaxCorr)는 임계치(normMaxCorrThres2)보다 크다(블록 22);

배경 잡음 레벨(noiseLevel)은 임계치(noiseLevelTh) 미만이다(블록 23); 및

근접 음성 액티비티는 신호(proxSpeechDet)에 의해 표시된 바와 같이 검출된다(블록19);

SFM 변동 통계(sfmSwing)는 임계치(sfmSwingTh)보다 크다(블록 37);

간섭 대 원하는 근거리 신호 비(idr)는 임계치(idrThres2)보다 크다(블록 40); 및

마이크로폰 간 레벨 차이 통계(imd)는 0dB에 가깝다(블록 43).

일부 실시예에서, 미국 특허 번호 제 8,126,706 호에서 교시된 음악 검출기는 음악 검출기(9)를 구현하여 배경 음악의 존재를 검출하기 위해 이용될 수 있다. 근접 음성 검출기의 또 다른 실시예는 본 발명의 실시예에 따라 도 7에 도시된다. 이 실시예에 따르면, 근접 음성은 다음 조건들이 충족되면 검출될 수 있다:

간섭 대 원하는 근거리 신호 비(idr)는 임계치(idrThres2)보다 크다(블록 39);

근접 음성 액티비티가 검출된다(블록 27);

최대 정규화 교차 상관 통계(normMaxCorr)는 임계치(normMaxCorrThres3)보다 크다(블록 28);

도달 방향 추정치(DOA)는 근접 사운드의 수용 각도 내에 있다(블록 29);

음악이 배경에서 감지되지 않는다(블록 30);

배경 잡음이 낮거나 중간이거나 어떠한 배경 잡음도 존재하지 않는다(블록 31). 이 조건은 추정된 배경 잡음 레벨을 임계치(noiseLevelThLo)와 비교함으로써 검증된다. 낮은 잡음 레벨이 검출되면, 근접 음성의 존재를 확인하기 위해 다음의 두 조건이 또한 테스트된다;

SFM 변동 통계(sfmSwing)는 임계치(sfmSwingTh)보다 크다(블록 38);

마이크로폰 간 레벨 차이 통계(imd)는 0dB에 더 가깝다(블록 44).

블록(31)에서 전술한 배경 잡음 레벨 조건이 만족되지 않으면, 거짓 알람의 발생을 증가시키지 않고(예로서, 배경 잡음 조건으로 인해) 근접 음성의 검출 속도를 향상시키기 위해, 다음 조건이 근접 음성을 나타낼 수 있다:

정상 배경 잡음이 존재한다(블록 32). 정상 배경 잡음은 시간 기간에 걸쳐 음악 검출기(블록 9)에 의해 생성된 SFM의 피크 대 평균 제곱 값의 비를 산출함으로써 검출될 수 있다. 특히, 상기 언급된 비가 더 높으면, 비 정상 잡음의 스펙트럼 평탄도 측정치가 정상 잡음보다 빠르게 변화하는 경향이 있으므로, 비 정상 잡음이 존재할 수 있다.

높은 잡음 레벨이 존재한다(블록 32). 추정된 배경 잡음이 임계치(noiseLevelLo)보다 크고 임계치(noiseLevelHi)보다 작으면 높은 잡음 조건이 검출될 수 있다.

블록(32)에서 상기 정상 잡음 및 도착 방향 조건이 만족되지 않으면, 다음의 세트의 조건 중 둘 모두의 존재는 근접 음성의 존재를 나타낼 수 있다:

클로즈 토킹(close-talking) 근접 화자가 존재한다(블록 33). 클로즈 토킹 근접 화자는 최대 정규화 교차 상관 통계(normMaxCorr)가 임계치(normMaxCorrThres4)보다 클 때 검출될 수 있다(임계치(normMaxCorrThres4)는 가까운 화자의 존재를 나타내기 위해 normMaxCorrThres3보다 클 수 있다);

저 또는 중 또는 고 레벨의 배경 잡음이 존재하거나 어떠한 배경 잡음도 존재하지 않는다(블록 34). 추정된 배경 잡음 레벨이 임계치(noiseLevelThHi) 미만이면, 이 조건이 검출될 수 있다.

블록 29에서 전술한 도달 방향 조건이 만족되지 않으면, 다음 조건의 존재는 근접 음성을 나타낼 수 있다:

음악의 부재(블록 35);

클로즈 토킹 근접 화자가 존재한다(블록 33). 클로즈 토킹 근접 화자는 최대 정규화 교차 상관 통계(normMaxCorr)가 임계치(normMaxCorrThres4)보다 클 때 검출될 수 있다(임계치(normMaxCorrThres4)는 가까운 화자의 존재를 나타내기 위해 normMaxCorrThres3보다 클 수 있다);

토널 알람 검출기(5)는 그러한 알람 신호의 음파 대역폭이 또한 협소한 현실적으로 토널인 알람 신호(예로서, 사이렌, 버저)를 검출하도록 구성될 수 있다. 일부 실시예에서, 주위 사운드의 조성(tonality)은 시간 도메인 신호를 시간 대 주파수 도메인 변환을 통해 다수의 서브 대역들로 분할함으로써 측정될 수 있으며, 도 6에서 음악 검출기(9)에 의해 생성된 신호(sfm[])로서 도시된 스펙트럼 평탄도 측정치는 각각의 서브 대역에서 계산될 수 있다. 모든 서브 대역으로부터 스펙트럼 평탄도 측정치(sfm[])가 평가될 수 있으며, 스펙트럼이 대부분의 서브 대역에서는 평탄하지만 모든 서브 대역에서는 평탄하지 않은 경우 토널 알람 사건이 검출될 수 있다. 게다가, 재생 관리 시스템에서, 원거리 알람 신호를 검출할 필요가 없을 수 있다. 그에 따라, 도 3의 근거리 공간 통계(8)는 원거리 알람 신호를 근거리 신호와 구별하기 위해 이용될 수 있다. 도 8은 본 발명의 실시예들에 따라 토널 알람 사건(예로서, 사이렌, 버저)를 검출하기 위한 예시적인 결합 로직을 도시한다. 도 8에 도시된 바와 같이, 다음의 모든 기준이 만족되면 토널 알람 사건이 검출될 수 있다:

도달 방향 추정치(DOA)는 알람 신호의 수용 각도 내에 있다(블록 24);

최대 정규화 교차 상관 통계(normMaxCorr)는 임계치(normMaxCorrThres5)보다 크다(블록 25); 및

스펙트럼 평탄도 측정치(sfm[])는 잡음 스펙트럼이 대부분의 서브 대역에서는 평탄하지만 모든 대역에서 평탄하지 않음을 나타낸다(블록 26).

실제로, 도 5, 도 6, 도 7, 및 도 8에 도시된 바와 같이 근거리 검출기(3), 근접성 검출기(4), 및 토널 알람 검출기(5)의 순간적인 오디오 사건 검출은 거짓 오디오 사건을 나타낼 수 있다. 그에 따라, 사건 검출 신호를 재생 제어 블록(6)으로 전달하기 전에 순간적인 오디오 사건 검출 신호를 입증하는 것이 바람직할 수 있다. 도 9는 본 발명의 실시예에 따라, 순간적인 오디오 사건 검출 신호에 적용되어 입증된 오디오 사건 신호를 생성할 수 있는 홀드 오프 및 행 오버 로직을 도시하는 일 예시적인 타이밍도를 도시한다. 도 9에 도시된 바와 같이, 홀드 오프 로직은 적어도 미리 결정된 시간 동안 지속되는 오디오 사건(예로서, 근거리 사운드, 근접 사운드, 토널 알람 사건)의 순간적인 검출에 응답하여 입증된 오디오 사건 신호를 생성할 수 있는 반면에, 행 오버 로직은 오디오 사건의 순간적인 검출이 제 2 미리 결정된 시간 동안 중단될 때까지 입증된 오디오 사건 신호를 계속 어서팅(asserting)할 수 있다.

다음의 의사-코드는 본 발명의 실시예들에 따라, 오디오 사건의 거짓 검출을 줄이기 위한 홀드 오프 및 행 오버 로직의 적용을 설명할 수 있다.

입증된 사건은 재생 모드 전환 제어를 생성하기 전에 또한 입증될 수 있다. 예를 들면, 다음의 의사 코드는 대화형 모드(예로서, 출력 오디오 트랜스듀서(51)로 재생된 오디오 정보가 오디오 사건에 응답하여 수정될 수 있음)와 정상 재생 모드(예로서, 출력 오디오 트랜스듀서(51)로 재생된 오디오 정보가 수정되지 않음) 사이의 완곡한(gracefully) 스위칭을 위한 홀드 오프 및 행 오버 로직의 적용을 설명할 수 있다.

도 10은 본 발명의 실시예들에 따른 홀드 오프 및 행 오버 로직을 갖는 상이한 오디오 사건 검출기를 도시한다. 각각의 검출기에 대한 홀드 오프 기간 및/또는 행 오버 기간은 다르게 설정될 수 있다. 게다가, 일부 실시예에서, 재생 관리는 검출된 사건의 유형에 기초하여 다르게 제어될 수 있다. 이들 및 다른 실시예에서, 도 9에 도시된 바와 같이, 재생 이득(따라서, 출력 오디오 트랜스듀서(51)에서 재생된 오디오 정보)은 오디오 사건 중 하나 이상이 검출될 때마다 감쇠될 수 있다. 이들 및 다른 실시예에서, 평활한(smooth) 이득 전이를 제공하기 위해, 재생 이득은 다음의 의사 코드에 의해 표현되는 1차 지수 평균 필터를 이용하여 평활화될 수 있다:

평활화 파라미터(alpha 및 beta)는 상이한 값으로 설정되어 이득 램핑 레이트(gain ramping rate)를 조정할 수 있다.

특히, 도면과 관련하여 본 명세서에 설명된 다양한 동작이 다른 회로 또는 다른 하드웨어 구성요소에 의해 구현될 수 있음이 이해되어야 한다 - 특히, 본 발명의 이점을 갖는 당업자에 의해. 주어진 방법의 각 동작이 수행되는 순서는 변경될 수 있으며, 본 명세서에서 도시된 시스템의 다양한 요소가 추가, 재정렬, 조합, 생략, 수정, 등이 될 수 있다. 본 발명이 그러한 모든 변경 및 수정을 포괄하고, 그에 따라 상기 설명은 제한적인 의미라기보다는 예시적인 것으로 간주되어야 함이 의도된다.

유사하게, 본 발명이 특정 실시예를 참조할지라도, 본 발명의 범위 및 커버리지(coverage)를 벗어나지 않고 이들 실시예에 대해 특정 변경 및 수정이 이루어질 수 있다. 게다가, 특정 실시예와 관련하여 본 명세서에 설명되는 문제점에 대한 임의의 이점, 장점, 또는 해결책은 중요하거나, 요구되거나, 필수적인 특징 또는 요소로서 해석되도록 의도되지 않는다.

마찬가지로, 본 발명의 이점을 갖는 또 다른 실시예는 당업자에게 명백할 것이고, 그러한 실시예는 본 명세서에 포함되는 것으로서 간주되어야 한다.

Claims

오디오 디바이스에서 오디오 정보를 프로세싱하기 위한 방법에 있어서:
상기 오디오 디바이스의 적어도 하나의 트랜스듀서(transducer)로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하는 단계;
상기 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 근거리 사운드(near-field sound)를 검출하는 단계; 및
상기 근거리 사운드의 검출에 응답하여 상기 하나 이상의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 결정하고 상기 주위 사운드가 상기 오디오 디바이스의 이용자로부터의 사운드임을 나타내는 상기 주위 사운드의 방향에 응답하여, 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 결정하고 상기 주위 사운드가 상기 오디오 디바이스의 이용자로부터의 음성임을 나타내는 상기 주위 사운드의 방향에 응답하여, 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
상기 오디오 정보의 특성을 수정하는 단계는 상기 오디오 정보를 감쇠시키는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
적어도 미리 결정된 시간 동안 지속되는 상기 근거리 사운드의 검출에 응답하여 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 5 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 근거리 사운드의 부재를 검출하는 단계; 및
적어도 제 2 미리 결정된 시간 동안 상기 근거리 사운드의 부재에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 것을 중단하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
상기 근거리 사운드를 검출하는 단계 외에, 상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 상기 근거리 사운드 이외의 주위 사운드를 검출하는 단계; 및
상기 주위 사운드의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 7 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 결정하고 상기 주위 사운드가 상기 근거리 사운드 이외의 사운드임을 나타내는 상기 주위 사운드의 방향에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 7 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드가 배경 잡음을 포함하는지의 여부를 검출하는 단계; 및
상기 주위 사운드에서의 상기 배경 잡음의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 7 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드가 토널 알람(tonal alarm)를 포함하는지의 여부를 검출하는 단계; 및
상기 주위 사운드에서의 상기 토널 알람의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 10 항에 있어서,
상기 주위 사운드에서의 상기 토널 알람를 검출하는 단계는:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 스펙트럼 평탄도 측정치(spectral flatness measure)를 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 근거리 공간 통계를 검출하는 단계; 및
상기 주위 사운드의 방향, 상기 배경 잡음의 존재 또는 부재, 및 상기 근거리 공간 통계에 기초하여 상기 토널 알람를 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 11 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 상관을 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 11 항에 있어서,
상기 주위 사운드의 방향을 검출하는 단계는 상기 주위 사운드의 방향이 근거리 사운드의 수용 각도 이내인지의 여부를 결정하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 11 항에 있어서,
상기 주위 사운드의 근거리 공간 통계를 검출하는 단계는 정규화된 교차 상관 통계가 임계치보다 큰지의 여부를 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 11 항에 있어서,
상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하는 단계는 상기 잡음 스펙트럼이 상기 주위 잡음의 대부분의 서브 대역에서 평탄하지만, 상기 주위 사운드의 모든 서브 대역에서 평탄하지 않은지의 여부를 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
상기 주위 사운드에서의 상기 근거리 사운드를 검출하는 단계는:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 음성의 존재를 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 근거리 공간 통계를 검출하는 단계; 및
상기 방향, 음성의 존재 또는 부재, 및 상기 주위 사운드의 근거리 공간 통계에 기초하여 상기 근거리 사운드를 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 16 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 상관을 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 16 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 근거리 사운드와 연관된 간섭 대 신호 비를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 16 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 마이크로폰 간 레벨 차이를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 16 항에 있어서,
상기 주위 사운드의 방향을 검출하는 단계는 상기 주위 사운드의 방향이 근거리 사운드의 수용 각도 이내인지의 여부를 결정하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 16 항에 있어서,
상기 주위 사운드의 근거리 공간 통계를 검출하는 단계는:
정규화된 교차 상관 통계가 제 1 임계치보다 큰지의 여부를 검출하는 단계;
간섭 대 원하는 근거리 사운드 신호 비가 제 2 임계치 미만인지의 여부를 검출하는 단계; 및
마이크로폰 간 레벨 차이가 제 3 임계치보다 큰지의 여부를 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 21 항에 있어서,
상기 제 2 임계치는 상기 주위 사운드에서의 배경 잡음의 추정치에 기초하여 조정되는, 오디오 정보를 프로세싱하기 위한 방법.
제 21 항에 있어서,
상기 제 3 임계치는 상기 주위 사운드에서의 배경 잡음의 추정치에 기초하여 조정되는, 오디오 정보를 프로세싱하기 위한 방법.
제 1 항에 있어서,
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 배경 잡음의 존재를 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 근접 음성의 존재를 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 볼륨을 검출하는 단계;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 근거리 공간 통계를 검출하는 단계;
상기 방향, 배경 잡음의 존재 또는 부재, 상기 음성의 존재 또는 부재, 상기 볼륨, 및 상기 주위 사운드의 근거리 공간 통계에 기초하여, 근접 사운드 사건을 포함하는 오디오 사건의 존재를 검출하는 단계; 및
상기 오디오 사건의 존재에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 24 항에 있어서,
상기 주위 사운드의 스펙트럼 콘텐트의 변동을 검출하는 단계; 및
상기 방향, 배경 잡음의 존재 또는 부재, 상기 음성의 존재 또는 부재, 상기 볼륨, 상기 주위 사운드의 근거리 공간 통계, 및 상기 주위 사운드의 스펙트럼 콘텐트에 기초하여, 근접 사운드 사건을 포함하는 오디오 사건의 존재를 검출하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 25 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 상관을 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 25 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 근거리 사운드와 연관된 간섭 대 신호 비를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 25 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 마이크로폰 간 레벨 차이를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 25 항에 있어서,
상기 주위 사운드에서의 근접 음성의 존재를 검출하는 단계는 정상 배경 잡음을 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 25 항에 있어서,
상기 주위 사운드에서의 근접 음성의 존재를 검출하는 단계는 클로즈 토킹(close-talking) 근접 화자로부터 음성을 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 25 항에 있어서,
상기 주위 사운드에서의 근접 음성의 존재를 검출하는 단계는 상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하는 단계를 포함하고, 상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하는 단계는 상기 주위 사운드의 스펙트럼 콘텐트의 변동을 검출하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
오디오 디바이스의 적어도 일부를 구현하기 위한 집적 회로에 있어서:
상기 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하도록 구성된 오디오 출력부;
상기 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하도록 구성된 마이크로폰 입력부; 및
프로세서를 포함하고, 상기 프로세서는:
상기 입력 신호로부터 상기 주위 사운드에서의 근거리 사운드를 검출하고;
상기 근거리 사운드의 검출에 응답하여 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 32 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 결정하고; 상기 주위 사운드가 상기 오디오 디바이스의 이용자로부터의 사운드임을 나타내는 상기 주위 사운드의 방향에 응답하여, 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 32 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 결정하고;
상기 주위 사운드가 상기 오디오 디바이스의 이용자로부터의 음성임을 나타내는 상기 주위 사운드의 방향에 응답하여, 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 32 항에 있어서,
상기 오디오 정보의 특성을 수정하는 것은 상기 오디오 정보를 감쇠시키는 것을 포함하는, 집적 회로.
제 32 항에 있어서,
상기 프로세서는 또한, 적어도 미리 결정된 시간 동안 지속되는 상기 근거리 사운드의 검출에 응답하여 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 36 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 근거리 사운드의 부재를 검출하고;
적어도 제 2 미리 결정된 시간 동안 상기 근거리 사운드의 부재에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 것을 중단하도록 구성되는, 집적 회로.
제 36 항에 있어서,
상기 프로세서는 또한:
상기 근거리 사운드를 검출하는 것 외에, 상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 상기 근거리 사운드 이외의 주위 사운드를 검출하고;
상기 주위 사운드의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 38 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 결정하고;
상기 주위 사운드가 상기 근거리 사운드 이외의 사운드임을 나타내는 상기 주위 사운드의 방향에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 38 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드가 배경 잡음을 포함하는지의 여부를 검출하고;
상기 주위 사운드에서의 상기 배경 잡음의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 38 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드가 토널 알람를 포함하는지의 여부를 검출하고;
상기 주위 사운드에서의 상기 토널 알람의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 41 항에 있어서,
상기 주위 사운드에서의 상기 토널 알람를 검출하는 것은:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 근거리 공간 통계를 검출하며;
상기 주위 사운드의 방향, 상기 배경 잡음의 존재 또는 부재, 및 상기 근거리 공간 통계에 기초하여 상기 토널 알람를 검출하는 것을 포함하는, 집적 회로.
제 41 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 상관을 포함하는, 집적 회로.
제 42 항에 있어서,
상기 주위 사운드의 방향을 검출하는 것은 상기 주위 사운드의 방향이 근거리 사운드의 수용 각도 이내인지의 여부를 결정하는 것을 포함하는, 집적 회로.
제 42 항에 있어서,
상기 주위 사운드의 근거리 공간 통계를 검출하는 것은 정규화된 교차 상관 통계가 임계치보다 큰지의 여부를 검출하는 것을 포함하는, 집적 회로.
제 42 항에 있어서,
상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하는 것은 상기 잡음 스펙트럼이 상기 주위 잡음의 대부분의 서브 대역에서 평탄하지만, 상기 주위 사운드의 모든 서브 대역에서 평탄하지 않은지의 여부를 검출하는 것을 포함하는, 집적 회로.
제 32 항에 있어서,
상기 주위 사운드에서의 상기 근거리 사운드를 검출하는 것은:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 음성의 존재를 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 근거리 공간 통계를 검출하며;
상기 방향, 음성의 존재 또는 부재, 및 상기 주위 사운드의 근거리 공간 통계에 기초하여 상기 근거리 사운드를 검출하는 것을 포함하는, 집적 회로.
제 47 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 상관을 포함하는, 집적 회로.
제 47 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 근거리 사운드와 연관된 간섭 대 신호 비를 포함하는, 집적 회로.
제 47 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 마이크로폰 간 레벨 차이를 포함하는, 집적 회로.
제 47 항에 있어서,
상기 주위 사운드의 방향을 검출하는 것은 상기 주위 사운드의 방향이 근거리 사운드의 수용 각도 이내인지의 여부를 결정하는 것을 포함하는, 집적 회로.
제 47 항에 있어서,
상기 주위 사운드의 근거리 공간 통계를 검출하는 것은:
정규화된 교차 상관 통계가 제 1 임계치보다 큰지의 여부를 검출하고;
간섭 대 원하는 근거리 사운드 신호 비가 제 2 임계치 미만인지의 여부를 검출하며;
마이크로폰 간 레벨 차이가 제 3 임계치보다 큰지의 여부를 검출하는 것을 포함하는, 집적 회로.
제 52 항에 있어서,
상기 제 2 임계치는 상기 주위 사운드에서의 배경 잡음의 추정치에 기초하여 조정되는, 집적 회로.
제 52 항에 있어서,
상기 제 2 임계치는 상기 주위 사운드에서의 배경 잡음의 추정치에 기초하여 조정되는, 집적 회로.
제 32 항에 있어서,
상기 프로세서는 또한:
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 방향을 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 배경 잡음의 존재를 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드에서의 근접 음성의 존재를 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 볼륨을 검출하고;
상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 근거리 공간 통계를 검출하고;
상기 방향, 배경 잡음의 존재 또는 부재, 상기 음성의 존재 또는 부재, 상기 볼륨, 및 상기 주위 사운드의 근거리 공간 통계에 기초하여, 근접 사운드 사건을 포함하는 오디오 사건의 존재를 검출하며;
상기 오디오 사건의 존재에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 32 항에 있어서,
상기 프로세서는 또한:
상기 주위 사운드의 스펙트럼 콘텐트의 변동을 검출하고;
상기 방향, 배경 잡음의 존재 또는 부재, 상기 음성의 존재 또는 부재, 상기 볼륨, 상기 주위 사운드의 근거리 공간 통계, 및 상기 주위 사운드의 스펙트럼 콘텐트에 기초하여, 근접 사운드 사건을 포함하는 오디오 사건의 존재를 검출하도록 구성되는, 집적 회로.
제 56 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 상관을 포함하는, 집적 회로.
제 56 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 근거리 사운드와 연관된 간섭 대 신호 비를 포함하는, 집적 회로.
제 56 항에 있어서,
상기 적어도 하나의 입력 신호는 제 1 마이크로폰에서 주위 사운드를 나타내는 제 1 마이크로폰 신호 및 제 2 마이크로폰에서 주위 사운드를 나타내는 제 2 마이크로폰 신호를 포함하고;
상기 근거리 공간 통계는 상기 제 1 마이크로폰 신호와 상기 제 2 마이크로폰 신호 사이의 마이크로폰 간 레벨 차이를 포함하는, 집적 회로.
제 56 항에 있어서,
상기 주위 사운드에서의 근접 음성의 존재를 검출하는 것은 정상 배경 잡음을 검출하는 것을 포함하는, 집적 회로.
제 56 항에 있어서,
상기 주위 사운드에서의 근접 음성의 존재를 검출하는 것은 클로즈 토킹 근접 화자로부터 음성을 검출하는 것을 포함하는, 집적 회로.
제 56 항에 있어서,
상기 주위 사운드에서의 근접 음성의 존재를 검출하는 것은 상기 적어도 하나의 입력 신호로부터 상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하는 것을 포함하고, 상기 주위 사운드의 스펙트럼 평탄도 측정치를 검출하는 것은 상기 주위 사운드의 스펙트럼 콘텐트의 변동을 검출하는 것을 포함하는, 집적 회로.
오디오 디바이스에서 오디오 정보를 프로세싱하기 위한 방법에 있어서:
상기 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하는 단계;
상기 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하는 단계;
상기 적어도 하나의 입력 신호로부터 오디오 사건을 검출하는 단계; 및
적어도 미리 결정된 시간 동안 지속되는 상기 오디오 사건의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 단계를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 63 항에 있어서,
적어도 제 2 미리 결정된 시간 동안 상기 오디오 사건의 부재에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 것을 중단하는 단계를 더 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
제 63 항에 있어서,
상기 오디오 사건은 근거리 사건, 근접 사건, 및 알람 사건 중 적어도 하나를 포함하는, 오디오 정보를 프로세싱하기 위한 방법.
오디오 디바이스의 적어도 일부를 구현하기 위한 집적 회로에 있어서:
상기 오디오 디바이스의 적어도 하나의 트랜스듀서로 전달하기 위한 오디오 출력 신호를 생성함으로써 오디오 정보를 재생하도록 구성된 오디오 출력부;
상기 오디오 디바이스 외부의 주위 사운드를 나타내는 적어도 하나의 입력 신호를 수신하도록 구성된 마이크로폰 입력부; 및
프로세서를 포함하고, 상기 프로세서는:
상기 입력 신호로부터 오디오 사건을 검출하고;
적어도 미리 결정된 시간 동안 지속되는 상기 오디오 사건의 검출에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하도록 구성되는, 집적 회로.
제 66 항에 있어서,
상기 프로세서는 또한, 적어도 제 2 미리 결정된 시간 동안 상기 오디오 사건의 부재에 응답하여 상기 적어도 하나의 트랜스듀서로 재생된 상기 오디오 정보의 특성을 수정하는 것을 중단하도록 구성되는, 집적 회로.
제 66 항에 있어서,
상기 오디오 사건은 근거리 사건, 근접 사건, 및 알람 사건 중 적어도 하나를 포함하는, 집적 회로.