KR20230123472A

KR20230123472A - 공간 오디오 윈드 노이즈 검출

Info

Publication number: KR20230123472A
Application number: KR1020237020151A
Authority: KR
Inventors: 에스 엠 아크라무스 살레힌; 래훈 김; 하네스 페센티너; 슈화 장; 상현 지; 에릭 비제르; 쉬바파 샨카르 타가두르
Original assignee: 퀄컴 인코포레이티드
Priority date: 2020-12-21
Filing date: 2021-12-15
Publication date: 2023-08-23
Also published as: EP4264605A1; CN116569563A; US20220199100A1; US11721353B2; WO2022140737A1

Abstract

디바이스는 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하고 그 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하도록 구성된 하나 이상의 프로세서들을 포함한다. 그 하나 이상의 프로세서들은 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하도록 추가로 구성된다. 메트릭은 제 1 값과 제 2 값의 비교에 기초한다. 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

Description

공간 오디오 윈드 노이즈 검출

I. 관련 출원들에 대한 상호 참조

본 출원은 2020년 12월 21일자로 출원된 공동 소유의 미국 정규 특허출원 제 17/128,544 호로부터의 우선권의 이익을 주장하며, 그 내용들은 전부가 본원에 원용에 의해 명시적으로 통합된다.

II. 분야

본 개시는 일반적으로 사운드 이벤트 분류에 관한 것이고, 보다 구체적으로는 공간 오디오에서 윈드 노이즈를 검출하는 것에 관한 것이다.

III. 관련 기술의 설명

기술에서의 진보들은 더 소형이고 더 강력한 컴퓨팅 디바이스들을 발생시켰다. 예를 들어, 소형이고 경량이며 사용자들에 의해 용이하게 휴대되는 모바일 및 스마트 폰들과 같은 무선 전화기들, 태블릿들 및 랩톱 컴퓨터들을 포함하는 다양한 휴대용 개인 컴퓨팅 디바이스들이 현재 존재한다. 이들 디바이스들은 무선 네트워크들을 통해 음성 및 데이터 패킷들을 통신할 수 있다. 또한, 많은 이러한 디바이스들은 디지털 스틸 카메라, 디지털 비디오 카메라, 디지털 레코더, 오디오 레코딩, 오디오 및/또는 비디오 회의, 및 오디오 파일 플레이어와 같은 추가적인 기능을 통합한다. 또한, 그러한 디바이스들은, 인터넷에 액세스하는데 사용될 수도 있는 웹 브라우저 애플리케이션과 같은 소프트웨어 애플리케이션들을 포함한 실행가능 명령들을 프로세싱할 수 있다. 이와 같이, 이들 디바이스들은 예를 들어, 오디오 신호 프로세싱을 포함하는 상당한 컴퓨팅 능력들을 포함할 수 있다. 그러한 디바이스들의 경우, 윈드 노이즈는 실외에서 캡처된 오디오에 대해 문제가 될 수 있다.

IV. 요약

특정 양태에서, 디바이스는 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하고 그 오디오 신호들에 기초하여 공간 오디오 데이터(spatial audio data)를 결정하도록 구성된 하나 이상의 프로세서들을 포함한다. 그 하나 이상의 프로세서들은 오디오 신호들에서의 윈드 노이즈(wind noise)를 나타내는 메트릭(metric)을 결정하도록 추가로 구성된다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호(aggregate signal)에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호(differential signal)에 대응한다.

특정 양태에서, 방법은 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계 및 그 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 단계를 포함한다. 방법은 또한 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계를 포함한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

특정 양태에서, 디바이스는 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 수단을 포함한다. 디바이스는 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 수단을 더 포함한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

특정 양태에서, 비일시적 컴퓨터 판독가능 저장 매체는 하나 이상의 프로세서들로 하여금 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하게 하도록 그 하나 이상의 프로세서들에 의해 실행가능한 명령들을 저장한다. 그 명령들은 또한 하나 이상의 프로세서들로 하여금 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하게 한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

본 개시의 다른 양태들, 이점들, 및 특징들은 다음의 섹션들: 즉, 도면의 간단한 설명, 상세한 설명, 및 청구항들을 포함하여 전체 출원의 검토 후 자명하게 될 것이다.

V. 도면들의 간단한 설명
도 1 은 공간 오디오 데이터에서 윈드 노이즈를 검출하고 감소시키도록 구성되는 디바이스의 예의 블록도이다.
도 2 는 특정 예에 따라 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키기 위한 디바이스의 특정 양태들을 예시하는 블록도이다.
도 3 은 다른 특정 예에 따라 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키기 위한 디바이스의 특정 양태들을 예시하는 블록도이다.
도 4 는 특정 예에 따른, 윈드 노이즈 소거가 없고 윈드 노이즈 소거가 있는 여러 풍속에 대한 사운드 레벨들을 예시하는 그래프들의 세트이다.
도 5 는 다른 특정 예에 따른, 윈드 노이즈 제거가 없고 윈드 노이즈 제거가 있는 여러 풍속에 대한 사운드 레벨들을 예시하는 그래프들의 세트이다.
도 6 은 본 개시의 일부 예들에 따른, 윈드 노이즈 검출 및 감소의 양태들을 수행하도록 동작가능한 집적 회로의 일 예를 예시한다.
도 7 은 본 개시의 일부 예들에 따른, 윈드 노이즈 검출 및 감소의 양태들을 수행하도록 동작가능한 집적 회로의 다른 예를 예시한다.
도 8 은 도 1의 디바이스의 양태들을 통합하는 모바일 디바이스를 예시한다.
도 9 는 도 1의 디바이스의 양태들을 통합하는 이어버드를 예시한다.
도 10 은 도 1의 디바이스의 양태들을 통합하는 헤드셋을 예시한다.
도 11 은 도 1의 디바이스의 양태들을 통합하는 웨어러블 디바이스를 예시한다.
도 12 는 도 1의 디바이스의 양태들을 통합하는 음성 제어 스피커 시스템을 예시한다.
도 13 은 도 1의 디바이스의 양태들을 통합하는 카메라를 예시한다.
도 14 는 도 1의 디바이스의 양태들을 통합하는 헤드셋을 예시한다.
도 15 는 도 1의 디바이스의 양태들을 통합하는 공중 디바이스를 예시한다.
도 16 은 도 1의 디바이스의 양태들을 통합하는 차량을 예시한다.
도 17 은 도 1 의 디바이스를 사용하여 공간 오디오 데이터에서 윈드 노이즈를 검출하는 방법의 예의 양태들을 예시하는 플로우 차트이다.
도 18 은 도 1 의 디바이스를 사용하여 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키는 방법의 예의 양태들을 예시하는 플로우 차트이다.
도 19 는 도 1 의 디바이스를 사용하여 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키는 방법의 예의 양태들을 예시하는 플로우 차트이다.
도 20 은 도 1 의 디바이스를 사용하여 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키는 방법의 예의 양태들을 예시하는 플로우 차트이다.
도 21 은 특정 양태에 따라 윈드 노이즈 검출 및 감소를 수행하도록 동작가능한 디바이스의 특정 예시적인 예의 블록도이다.

VI. 상세한 설명

윈드 노이즈는 실외에서 캡처된 오디오에 대해 문제가 될 수 있다. 본 명세서에 개시된 양태들은 공간 오디오 데이터와 같은 오디오 데이터에서 윈드 노이즈의 검출 및 윈드 노이즈의 감소를 가능하게 한다. 일부 양태들에서, 윈드 노이즈는 공간 오디오 데이터의 분석에 기초하여 검출된다. 일부 양태들에서, 검출된 윈드 노이즈는 공간 오디오 데이터를 프로세싱함으로써 완화되거나 감소된다. 예를 들어, 공간 오디오 데이터의 특정 채널들은 강조해제될 수도 있다. 다른 예로서, 공간 오디오 데이터의 저주파수 성분들은 오디오 및 캡처의 공간 품질을 저하시키지 않고 필터링될 수도 있다.

특정 양태에서, 윈드 노이즈 메트릭은 공간 오디오 데이터에 기초한 집성 신호에 대응하는 제 1 값 및 공간 오디오 데이터에 기초한 차동 신호에 대응하는 제 2 값을 포함하는 2 개의 값들의 비교에 기초하여 결정된다. 일부 구현들에서, 공간 오디오 데이터는 앰비소닉스 데이터(ambisonics data)를 포함한다. 예를 들어, 앰비소닉스 데이터가 1차 앰비소닉을 포함하는 경우, 앰비소닉스 데이터는 W-채널(전방향성 사운드 정보를 포함함), X-채널(전방/후방 사운드를 나타내는 차동 사운드 정보를 포함함), Y-채널(좌측/우측 사운드를 나타내는 차동 사운드 정보를 포함함) 및 Z-채널(상/하 사운드를 나타내는 차동 사운드 정보를 포함함)로 인코딩될 수도 있다. 이 예에서, 집성 신호는 전방향성(omnidirectional) 사운드 정보(예를 들어, W-채널)에 대응하고, 차동 신호는 방향성(directional) 채널들 중 하나(예를 들어, X-채널, Y-채널 또는 Z-채널)에 대응한다.

일부 구현들에서, 공간 오디오 데이터는 적어도 임계 각도(예를 들어, 90 내지 180도)만큼 오프셋된 빔들에 대응하는 둘 이상의 빔포밍된 오디오 채널들을 포함한다. 이러한 구현들에서, 집성 신호는 2개의 빔들에 기초한 합에 대응하고, 차동 신호는 2개의 빔들에 기초한 차이에 대응한다.

메트릭의 값은 윈드 노이즈의 존재 및 존재하는 경우 윈드 노이즈의 정도를 나타낸다. 일부 구현들에서, 특정 주파수들 또는 주파수 대역들에서의 메트릭의 값들은 윈드 노이즈를 감소시키는 데 사용되는 응답 액션들을 결정하는 데 사용될 수 있다. 예를 들어, 메트릭의 대역 특정 값들은 윈드 노이즈를 감소시키기 위해 사용되는 대역 특정 필터 파라미터들을 결정하는데 사용될 수도 있다. 다른 예로서, 메트릭의 주파수 특정 값이 임계치를 초과할 때, 오디오 데이터의 하나 이상의 채널들에 적용되는 이득은 윈드 노이즈를 제한하기 위해 감소될 수도 있다.

본 개시의 특정 양태들은 도면들을 참조하여 이하에 설명된다. 설명에서, 공통 피처들 (features) 은 공통 참조 번호들로 지정된다. 본 명세서에서 사용된 바와 같이, 다양한 용어가 단지 특정 구현들을 설명할 목적으로 사용되고 구현들을 한정하는 것으로 의도되지 않는다. 예를 들어, 단수 형태들 "a", "an", 및 "the" 는, 문맥이 분명히 달리 표시하지 않는 한, 복수 형태들을 물론 포함하도록 의도된다. 추가로, 본 명세서에서 설명된 일부 피처들은 일부 구현들에서 단수이고 다른 구현들에서는 복수이다. 예시하기 위해, 도 1은 하나 이상의 스피커들(도 1의 "스피커(들)(126)")을 포함하는 디바이스(100)를 도시하며, 이는 일부 구현들에서 디바이스(100)가 단일 스피커(126)를 포함하고 다른 구현들에서 디바이스(100)가 다수의 스피커들(126)을 포함한다는 것을 표시한다.　 본 명세서에서의 참조의 용이함을 위해, 이러한 피처들은 일반적으로 "하나 이상의" 피처들로서 도입되고, 후속하여, 그 피처들 중 다수의 피처들과 관련된 양태들이 설명되지 않는 한, 단수 또는 선택적인 복수형(일반적으로 "(들)"로 끝나는 용어들에 의해 표시됨)으로 지칭된다.

용어 "comprise", "comprises" 및 "comprising"은 본 명세서에서 "include", "includes" 또는 "including"과 상호교환적으로 사용된다. 또한, "wherein"이라는 용어는 "where"와 상호교환적으로 사용된다. 본 명세서에서 사용된 바와 같이, "예시적인” 은 예, 구현, 및/또는 양태를 나타내며, 제한하는 것으로서 또는 선호도 또는 선호된 구현을 나타내는 것으로서 해석되지 않아야 한다. 본 명세서에서 사용된 바와 같이, 구조, 컴포넌트, 동작 등과 같은 엘리먼트를 수정하는데 사용되는 서수 용어 (예를 들어, "제 1", "제 2", "제 3" 등) 는 홀로 다른 엘리먼트에 관하여 엘리먼트의 임의의 우선순위 또는 순서를 표시하는 것이 아니라, 오히려 단지 엘리먼트를 (서수 용어의 사용이 없다면) 동일한 명칭을 갖는 다른 엘리먼트로부터 구별할 뿐이다. 본 명세서에서 사용된 바와 같이, 용어 "세트" 는 특정 엘리먼트의 하나 이상을 지칭하고, 용어 "복수" 는 특정 엘리먼트의 배수 (예컨대, 2 이상) 를 지칭한다.

본 명세서에서 사용된 바와 같이, "결합된” 은 "통신가능하게 결합된", "전기적으로 결합된", 또는 "물리적으로 결합된” 을 포함할 수도 있으며, 또한 (또는 대안적으로) 이들의 임의의 조합들을 포함할 수도 있다. 2 개의 디바이스들 (또는 컴포넌트들) 은 하나 이상의 다른 디바이스, 컴포넌트, 와이어, 버스, 네트워크 (예를 들어, 유선 네트워크, 무선 네트워크, 또는 이들의 조합) 등을 통해 직접적으로 또는 간접적으로 결합될 (예를 들어, 통신적으로 결합될, 전기적으로 결합될, 또는 물리적으로 결합될) 수도 있다. 전기적으로 결합된 2 개의 디바이스들 (또는 컴포넌트들) 은 동일한 디바이스 또는 상이한 디바이스에 포함될 수도 있고, 예시적인, 비-제한적인 예들로서 전자기기들, 하나 이상의 커넥터들 또는 유도 결합을 통해 접속될 수도 있다. 일부 구현들에서, 전기 통신에서와 같이, 통신가능하게 결합되는 2 개의 디바이스들 (또는 컴포넌트들) 은 하나 이상의 와이어들, 버스들, 네트워크들 등을 통해서와 같이, 직접 또는 간접적으로 전기 신호들 (디지털 신호들 또는 아날로그 신호들) 을 전송 및 수신할 수도 있다. 본 명세서에서 사용된 바와 같이, "직접 결합된" 은 컴포넌트들을 개재함 없이 결합 (예를 들어, 통신가능하게 결합, 전기적으로 결합, 또는 물리적으로 결합) 되는 2 개의 디바이스들을 지칭할 수도 있다.

본 개시에 있어서, "결정하는 것", "계산하는 것, “추정하는 것", "시프팅하는 것", "조정하는 것" 등과 같은 용어들은 하나 이상의 동작들이 어떻게 수행되는지를 설명하기 위해 사용될 수도 있다. 그러한 용어들은 한정하는 것으로서 해석되지 않아야 하고 다른 기법들이 유사한 동작들을 수행하는데 활용될 수도 있음을 유의해야 한다. 부가적으로, 본 명세서에서 지칭되는 바와 같이, "생성하는 것", "계산하는 것", “추정하는 것”, "사용하는 것", "선택하는 것", "액세스하는 것" 및 "결정하는 것" 은 상호교환가능하게 사용될 수도 있다. 예를 들어, 파라미터 (또는 신호) 를 "생성하는 것", "계산하는 것”, “추정하는 것”, 또는 "결정하는 것" 은 파라미터 (또는 신호) 를 능동적으로 생성하는 것, 추정하는 것, 계산하는 것, 또는 결정하는 것을 지칭할 수도 있거나, 또는 예컨대, 다른 컴포넌트 또는 디바이스에 의해 이미 생성된 파라미터 (또는 신호) 를 사용하는 것, 선택하는 것, 또는 액세스하는 것을 지칭할 수도 있다.

도 1 은 공간 오디오 데이터에서 윈드 노이즈를 검출하고 감소시키도록 구성되는 디바이스 (100) 의 일 예의 블록도이다. 도 1에 예시된 예에서, 디바이스 (100) 는 오디오 데이터 (104) 를 생성하도록 구성된 마이크로폰 (102A), 마이크로폰 (102B), 및 마이크로폰 (102N) 을 포함하는 3 개의 마이크로폰들 (102) 을 포함한다. 다른 구현들에서, 디바이스(100)는 3개 초과의 마이크로폰들을 포함한다. 또 다른 예들에서, 디바이스(100)는 3개 미만의 마이크로폰들을 포함한다. 예시하자면, 일부 예들에서, 디바이스(100)는 인터페이스(예를 들어, 오디오 입력 포트)를 통해 또는 중개 디바이스(예를 들어, 컴퓨팅 디바이스, 사운드 보드 등)를 통해 다수의 원격 마이크로폰들에 의해 캡처된 오디오 데이터(104)를 획득하도록 구성되며, 이 경우 디바이스(100)는 임의의 마이크로폰들(102)을 포함하지 않을 수도 있다.

도 1에 도시된 예에서, 오디오 데이터(104)는 윈드 터뷸런스(wind turbulence)와 연관된 고주파 윈드 노이즈를 제거하거나 감소시키기 위해 윈드 터뷸런스 노이즈 감소 엔진(106)에서 프로세싱된다. 도 1에서, 윈드 터뷸런스 노이즈 감소 엔진(106)은 윈드 터뷸런스 노이즈의 완화 후에 오디오 데이터(104)에 대응하는 출력 신호들(108)을 생성한다. 특정 양태에서, 윈드 터뷸런스 노이즈 감소 엔진 (106) 은 오디오 데이터 (104) 의 개별 스트림들에 대해 동작한다. 예시를 위해, 오디오 데이터(104)가 윈드 터뷸런스 노이즈 감소 엔진(106)에 입력되는 오디오 정보의 N 개의 스트림들(여기서, N은 양의 정수)을 나타내면, 출력 신호들(108)은 오디오 정보의 N 개의 스트림들을 포함하고, 이들 각각은 윈드 터뷸런스로 인해 감소된 고주파 윈드 노이즈를 갖는 윈드 터뷸런스 노이즈 감소 엔진(106)에 입력되는 오디오 데이터의 N 개의 스트림들(104) 중 각각의 하나에 대응한다. 일 예로서, 윈드 터뷸런스 노이즈 감소 엔진 (106) 은 동일한 오디오 (104) 신호의 제 2 신호 성분보다 더 많은 윈드 터뷸런스 노이즈를 갖는 오디오 데이터 (104) 신호들 중 하나의 제 1 신호 성분을 식별할 수도 있고, 대응하는 출력 신호 (108) 를 생성하기 위해 제 1 신호 성분을 대체할 제 3 신호 성분을 합성할 수도 있다. 이 예에서, 제 3 신호 성분은 제 1 신호 성분보다 더 적은 윈드 터뷸런스 노이즈를 갖고, 이 예에서 출력 신호(108)는 대응하는 오디오 데이터(104) 신호와 동일한 주파수 응답을 갖도록 생성될 수도 있다. 다른 양태에서, 윈드 터뷸런스 노이즈 감소 엔진 (106) 은 윈드 터뷸런스 노이즈를 식별 및/또는 제거하기 위해 오디오 데이터 (104) 의 2 개 이상의 스트림들에 대해 함께 동작한다. 예시하자면, 윈드 터뷸런스 노이즈 감소 엔진(106)은 오디오 데이터(104) 신호들 중 2개 이상 사이의 채널간 위상차를 조정함으로써 출력 신호들(108) 중 하나 이상을 생성할 수도 있다.

도 1에서, 윈드 터뷸런스 노이즈 감소 엔진(106)의 출력 신호들(108)은 공간 오디오 데이터(112)를 생성하기 위해 공간 오디오 변환기(110)에 제공된다. 특정 양태에서, 공간 오디오 데이터 (112) 는 1차 앰비소닉스 데이터 또는 더 고차의 앰비소닉스 데이터와 같은 앰비소닉스 데이터를 포함한다. 예시하기 위해, 공간 오디오 변환기(110)는 앰비소닉스 계수들을 생성하기 위해 출력 신호들(108)에 의해 표현되는 음장의 3차원 구면 조화 분해를 수행할 수도 있다. 특정 양태에서, 공간 오디오 데이터 (112) 는 2 개 이상의 오디오 빔들을 나타낸다. 예시하기 위해, 공간 오디오 변환기 (110) 는 2 개 이상의 오디오 빔들을 생성하기 위해 출력 신호들 (108)에 의해 표현된 음장을 사용하여 빔포밍 (예를 들어, 공간 필터링) 을 수행할 수도 있다.

도 1 은 1차 앰비소닉스를 사용하는 공간 오디오 인코딩을 예시하기 위한 제 1 예 (150) 를 도시한다. 제 1 예 (150)에서, 공간 오디오 데이터는 X-축 (156) 을 따른 차동 사운드를 나타내는 X-채널 또는 X-계수들을 포함한다. 제 1 예(150)에서, X-축(156)은 관찰자에 대한 전후 방향을 지칭하고, X-채널은 관찰자 앞의 사운드와 관찰자 뒤의 사운드 사이의 차이를 인코딩한다. 제 1 예(150)는 또한 Y-축(154)을 따른 차동 사운드를 나타내는 Y-채널 또는 Y-계수들을 예시한다. 제 1 예(150)에서, Y-축(154)은 관찰자에 대한 좌우 방향을 지칭하고, Y-채널은 관찰자의 우측으로의 사운드와 관찰자의 좌측으로의 사운드 사이의 차이를 인코딩한다. 제 1 예(150)는 또한 Z-축(152)을 따른 차동 사운드를 나타내는 Z-채널 또는 Z-계수들을 예시한다. 제 1 예(150)에서, Z-축(152)은 관찰자에 대한 상하 방향을 지칭하고, Z-채널은 관찰자 위의 사운드와 관찰자 아래의 사운드 사이의 차이를 인코딩한다. 제 1 예 (150) 는 또한 관찰자 주위의 영역 W (158)에서 전방향성 사운드를 나타내는 W-채널 또는 W-계수들을 예시한다. 제 1 예 (150)에서, W-채널은 관찰자 주위의 사운드의 집합을 인코딩한다.

도 1 은 빔포밍을 사용하는 공간 오디오 인코딩을 예시하기 위한 제 2 예 (160) 를 도시한다. 제 2 예(160)에서, 2개의 빔들(164 및 166)은 X-축, Y-축 및 Z-축을 포함하는 데카르트 좌표계에 의해 제 2 예(160)에서 표현되는 3차원 공간 내의 특정 방향들로부터의 사운드를 표현하도록 생성된다. 제 2 예(160)에서, 빔들(164 및 166)은 각도(168)만큼 각도 오프셋된 상이한 방향들에 대응한다.

제 1 예(150)의 앰비소닉스 계수들 및 제 2 예(160)의 축들 각각이 X-, Y-, 및 Z- 라벨들을 사용하지만, 라벨들은 라벨링 규약들로 인해 동일하며, 제 1 예(150) 및 제 2 예(160)에서 동일한 것을 반드시 의미하는 것은 아님에 유의한다. 예를 들어, 위에서 언급된 바와 같이, 1차 앰비소닉스에 대한 B-포맷 표기에서, X-계수는 관찰자 앞의 사운드와 관찰자 뒤의 사운드 사이의 차이를 나타내는 반면; 데카르트 좌표 표기에서, X-축은 단지 방향을 나타내고 관찰자 독립적이다. 따라서, 제 1 및 제 2 예들(150, 160)의 X-, Y-, 및 Z- 라벨들은 구별되고 혼동되어서는 안된다.

도 1에서, 공간 오디오 데이터 (112) 는 공간-오디오 윈드 노이즈 감소 프로세서 (114)에 제공된다. 공간-오디오 윈드 노이즈 감소 프로세서(114)는 공간 오디오 데이터(112)에서의 윈드 노이즈를 나타내는 메트릭을 결정하도록 구성된다. 예를 들어, 공간-오디오 윈드 노이즈 감소 프로세서 (114) 는 공간 오디오 데이터 (112) 로부터 도출된 제 1 값과 제 2 값의 비교에 기초하여 메트릭의 값을 결정할 수도 있다. 이 예에서, 제 1 값은 공간 오디오 데이터(112)에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터(112)에 기초한 차동 신호에 대응한다. 이 예에서, 메트릭의 값은 (예를 들어, 과도한 윈드 노이즈가 존재한다는 것을 표시하기 위해) 사용자에게 출력되고, 다른 프로세싱을 트리거하기 위해 사용될 수도 있는 등이다.

공간 오디오 데이터 (112) 가 2 개 이상의 오디오 빔들 (164, 166) 을 포함할 때, 집성 신호는 2 개의 오디오 빔들의 합으로서 결정될 수도 있고, 차동 신호는 2 개의 오디오 빔들의 차이로서 결정될 수도 있다. 집성 신호 및 차동 신호를 생성하는 데 사용되는 2개의 오디오 빔은 서로로부터, 예컨대 90도 내지 180도만큼 각도 오프셋된다. 제 2 양태의 특정 예로서, 공간 오디오 데이터 (112) 가 2 개의 오디오 빔들 (164, 166) 을 포함할 때, 메트릭의 값은 2 개의 오디오 빔들 (164, 166) 의 값들의 차이에 대한 2 개의 오디오 빔들 (164, 166) 의 값들의 합의 비율로서 결정될 수도 있다.

특정 양태에서, 공간-오디오 윈드 노이즈 감소 프로세서 (114) 는 감소된 윈드 노이즈 오디오 데이터 (116) 를 생성하기 위해 윈드 노이즈의 적어도 일부를 제거하도록 필터 파라미터들을 구성하기 위해 메트릭의 하나 이상의 값들을 사용한다. 추가적으로 또는 대안적으로, 일부 구현들에서, 공간-오디오 윈드 노이즈 감소 프로세서 (114) 는 메트릭의 값들을 하나 이상의 윈드 검출 임계치들과 비교함으로써 윈드 노이즈를 검출한다. 일부 이러한 구현들에서, 공간 오디오 데이터(112)의 하나 이상의 채널들에 적용되는 이득은 메트릭의 특정 값들에 의해 표현되는 상당한 윈드 노이즈가 검출될 때 감소된다.

도 1의 예에서, 감소된 윈드 노이즈 오디오 데이터(116)는 감소된 윈드 노이즈 오디오 데이터(116)에 기초하여 바이노럴(binaural) 또는 모노럴(monaural) 오디오 데이터(120)를 생성하기 위해 공간 오디오 변환기(118)에 제공된다. 일부 구현들에서, 바이노럴 또는 모노럴 오디오 데이터(120)는 주변 노이즈 억제기(ambient noise suppressor)(122)에 제공된다. 주변 노이즈 억제기(122)는 감소된 윈드 노이즈 오디오 데이터(124)를 생성하기 위해 정적 고주파 윈드 노이즈를 감소시키도록 구성된다. 도 1의 예에서, 감소된 윈드 노이즈 오디오 데이터(124)는 사운드 출력을 생성하기 위해 하나 이상의 스피커(126)에 제공될 수 있다.

일부 구현들에서, 도 1에 예시된 컴포넌트들 또는 동작들 중 하나 이상은 생략된다. 예를 들어, 윈드 터뷸런스 노이즈 감소 엔진(106), 주변 노이즈 억제기(122), 또는 양자 모두는 일부 구현들에서 생략될 수도 있다. 이러한 구현들에서, 오디오 데이터(104)에서의 윈드 노이즈는 여전히 공간-오디오 윈드 노이즈 감소 프로세서(114)에 의해 검출 및/또는 감소될 수도 있다. 다른 예로서, 공간 오디오 변환기(110), 공간 오디오 변환기(118), 또는 양자 모두는 생략될 수도 있다. 예시를 위해, 이러한 구현들에서, 공간 오디오 데이터(112)는 다른 디바이스에 의해 생성되고, 다른 디바이스로부터, 중간 디바이스로부터, 또는 메모리 디바이스로부터 공간-오디오 윈드 노이즈 감소 프로세서(114)에 의해 획득된다. 추가적으로 또는 대안적으로, 이러한 구현들에서, 감소된 윈드 노이즈 오디오 데이터 (116) 는 바이노럴 또는 모노럴 오디오 데이터 (120), 감소된 윈드 노이즈 오디오 데이터 (124), 또는 양자 모두를 생성하기 위해 다른 디바이스에 제공된다. 다른 예로서, 스피커(들)(126)는 생략될 수도 있으며, 이 경우, 감소된 윈드 노이즈 오디오 데이터(124)는 재생을 위해 다른 디바이스에 또는 외부 스피커들에 전송될 수도 있거나 또는 나중의 재생을 위해 (예를 들어, 메모리 디바이스에) 저장될 수도 있다.

도 1에 예시된 예에서, 디바이스 (100) 는 공간 오디오 변환을 가능하게 하기 위해 적절히 이격된 적어도 3 개의 마이크로폰들 (102) 을 포함한다. 예를 들어, 특정 구현에서, 마이크로폰들 중 적어도 2개(예를 들어, 마이크로폰(102A) 및 마이크로폰(102N))는 적어도 0.5 센티미터만큼 이격된다. 다른 구현들에서, 마이크로폰들 중 적어도 2개(예를 들어, 마이크로폰(102A) 및 마이크로폰(102N))는 적어도 2.0 센티미터만큼 이격된다. 교차 상관(cross correlation)과 같은 다른 윈드 노이즈 감소 기법들은 마이크로폰들 (102) 이 0.5 센티미터보다 함께 더 가까울 때 윈드 노이즈를 제거하는데 효과적일 수 있다. 따라서, 일부 양태들에서, 도 1 의 디바이스 (100) 는 0.5 센티미터보다 더 적게 떨어져 있거나 또는 0.5 센티미터와 2.0 센티미터 사이에 떨어져 있는 마이크로폰들로부터의 윈드 노이즈를 제거하기 위해 교차 상관을 사용할 수도 있고, 0.5 센티미터보다 더 많이 떨어져 있거나 또는 2.0 센티미터보다 더 많이 떨어져 있는 마이크로폰들로부터의 윈드 노이즈를 제거하기 위해 공간-오디오 윈드 노이즈 감소 프로세서 (114) 를 사용할 수도 있다. 일부 구현들에서, 디바이스 (100) 는 교차 상관 윈드 노이즈 감소와 공간-오디오 윈드 노이즈 감소 사이에서 스위칭하도록 구성될 수도 있다. 예를 들어, 마이크로폰들 (102) 의 제 1 세트가 오디오 데이터 (104) 를 제공할 때, 디바이스 (100) 는 마이크로폰들 (102) 의 제 1 세트가 임계치 미만만큼 이격된다는 것을 나타내는 구성 설정들 또는 정보에 기초하여 교차 상관 윈드 노이즈 감소를 사용한다. 이 예에서, 마이크로폰들 (102) 의 제 2 세트가 오디오 데이터 (104) 를 제공할 때, 디바이스 (100) 는 공간-오디오 윈드 노이즈 감소 프로세서 (114) 를 사용하여, 마이크로폰들 (102) 의 제 2 세트가 임계치 초과만큼 이격된다는 것을 나타내는 구성 설정들 또는 정보에 기초하여 윈드 노이즈를 감소시킨다.

도 2 는 특정 예에 따라 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키기 위한 디바이스 (200) 의 특정 양태들을 예시하는 블록도이다. 도 2 의 예의 디바이스 (200) 는 공간 오디오 데이터 (112) 가 앰비소닉스 데이터를 포함하는 구현에서 도 1 의 공간-오디오 윈드 노이즈 감소 프로세서 (114) 를 포함하거나, 그 내에 포함되거나, 또는 그에 대응할 수도 있다. 예를 들어, 도 2에서, 공간 오디오 데이터(112)는 Z-채널(Z-계수들을 나타냄), X-채널(X-계수들을 나타냄), Y-채널(Y-계수들을 나타냄), 및 W-채널(W-계수들을 나타냄)을 포함한다. 다른 예들에서, 공간 오디오 데이터 (112) 는 고차 앰비소닉스 데이터를 포함한다.

도 2에서, 공간 오디오 데이터(112)는 고속 푸리에 변환(FFT)(202) 또는 다른 시간 도메인 대 주파수 도메인 변환 동작을 사용하여 주파수 도메인 공간 오디오 데이터(204)를 생성하기 위해 주파수 도메인으로 변환된다. 주파수-도메인 공간 오디오 데이터 (204) 는, 공간 오디오 데이터 (112) 의 시간-윈도잉된 샘플에 대해, 다양한 주파수들 또는 주파수 빈들과 연관된 진폭들을 표시한다.

메트릭 계산 블록(206)에서, 주파수-도메인 공간 오디오 데이터(204)의 적어도 2개의 채널들은 메트릭의 주파수 특정 값들(도 2의 "주파수 특정 메트릭 값들"(210))을 계산하는 데 사용된다. 예를 들어, 각각의 주파수에서 각각의 시간-윈도잉된 샘플의 신호 전력이 결정된다. 예시하기 위해, 각각의 주파수 (f) 및 시간-윈도잉된 샘플 (t) 에서의 신호 전력 (P) 은 식 1 을 사용하여 결정될 수도 있다:

P_t(f)= α*S(f)*conj(S(f))+(1-α)*P_t- ₁(f) 식 1

여기서, P_t(f) 는 시간 t 및 주파수 f 에서의 신호 전력이고, α 는 평활화 팩터이고, S(f)는 주파수 f 에서의 복소 전력이고, P_t-1(f) 는 이전 시간 t-1 에서의 주파수의 신호 전력이다. 특정 주파수 및 시간 샘플에 대해, 주파수-특정 메트릭 값 (210) 은 특정 주파수 및 시간 샘플에서의 차동 채널들 (예를 들어, Y-채널, X-채널, 또는 Z-채널) 중 하나의 전력에 대한 특정 주파수 및 시간 샘플에서의 W-채널의 전력의 비로서 결정된다. 예를 들어, 앰비소닉스 계수들이 공간 오디오 데이터 (112) 를 표현하기 위해 사용될 때, 메트릭의 각각의 주파수 특정 값은 특정 주파수에서의 차동 (예를 들어, Y-채널) 신호 전력에 의해 나누어진 특정 주파수에서의 전방향성 (예를 들어, W-채널) 신호 전력을 표현할 수도 있다. 특정 양태에서, 주파수-특정 메트릭 값들 (210) 은 임계 주파수 (208) 미만인 각각의 주파수에 대해 결정된다. 이 예에서, 메트릭은 윈드 노이즈를 제거하기 위해 주파수에서 적용될 이득에 대응하는 윈드 노이즈 감소를 위한 전력을 나타낸다. 따라서, 이 예에서, 메트릭의 더 높은 값들은 신호의 더 적은 것이 윈드 노이즈에 기인한다는 것을 나타내고, 메트릭의 더 낮은 값은 신호의 더 많은 것이 윈드 노이즈에 기인한다는 것을 나타낸다.

특정 양태에서, 주파수-특정 메트릭 값들 (210) 은 조건적 이득 감소 블록 (212)에서 하나 이상의 윈드 검출 임계치들 (214) 과 비교된다. 이 양태에서, 오디오 데이터의 하나 이상의 채널들에 적용되는 이득 (216) 은 윈드 검출 임계치(들) (214) 를 만족시키는 (예를 들어, 그 이하인) 주파수 특정 메트릭 값들 (210) 중 임의의 것에 응답하여 윈드 노이즈를 감소시키도록 조정될 수도 있다. 윈드 검출 임계치(들)(214)는 0과 1 사이의 정적 또는 튜닝가능한 값이다.

도 2에 도시된 예에서, 조건적 이득 감소 블록(212)에 의해 조정되는 이득(들)(216)은 X-채널 이득 및 Z-채널 이득을 포함한다. 일부 오디오 캡처 디바이스들 및/또는 오디오 프로세싱 디바이스들은 윈드 노이즈를 증가시킬 수 있는 방식으로 공간 오디오 데이터의 X- 및 Z- 계수들의 저주파수 성분들을 부스팅하는 경향이 있다. 따라서, X-채널, Z-채널, 또는 양자 모두에 적용되는 이득을 감소시키는 것은 출력 오디오에서 윈드 노이즈를 감소시킬 수 있다. 추가적으로, 인간의 인식은 X-채널 및 Z-채널에 대해서보다 공간적 큐들에 대해 Y-채널 및 W-채널에 더 의존하는 경향이 있다. 따라서, X-채널, Z-채널, 또는 양자 모두에 적용되는 이득의 감소는 Y-채널 및 W-채널의 감소보다 더 양호한 사용자 경험을 초래한다. 다른 예들에서, X-채널 이득만 또는 Z-채널 이득만이 조정된다. 또 다른 예들에서, Y-채널 이득은 X-채널 이득 및 Z-채널 이득 중 하나 또는 양자 모두에 추가하여 또는 그 대신에 조정된다.

특정 양태에서, 주파수 특정 메트릭 값들 (210) 은 대역 특정 메트릭 계산 블록 (230)에서 대역 특정 메트릭 값들 (238) 을 계산하는데 사용된다. 예를 들어, 주파수-특정 메트릭 값들 (210) 은 주파수 대역들 (232)에 의해 그룹화되고 가중된 합은 각각의 주파수 대역 (232)에 대한 대역 특정 메트릭 값을 계산하는데 사용된다. 특정 구현에서, 주파수 대역들 (232) 은 500 헤르츠 (Hz) 의 대역폭을 갖는다. 다른 구현들에서, 주파수 대역들 (232) 은 더 크거나 (예를 들어, 1000 Hz) 또는 더 작다 (예를 들어, 250 Hz). 또 다른 구현들에서, 상이한 주파수 대역들(232)은 상이한 대역폭들을 가질 수도 있다.

특정 구현에서, 특정 주파수 대역에 대한 대역 특정 메트릭 값(238)은 식 2 를 사용하여 계산될 수도 있다:

Metric_band= 식 2

여기서, Metric_band 은 상위 주파수 값 (f_upper) 과 하위 주파수 값 (f_lower) 사이의 주파수 대역에 대한 대역 특정 메트릭 값 (238) 이고, Metric(f) 는 주파수 대역 내의 메트릭의 주파수 특정 값이고, wr_parameter 는 노이즈 감소 파라미터 (234) 의 값이다. 노이즈 감소 파라미터 (234) 는, 디바이스 (200) 가 특히 더 낮은 주파수 대역들에서 윈드 노이즈를 얼마나 적극적으로 감소시키는지에 영향을 미치는 미리 구성된 또는 튜닝가능한 값이다. 예를 들어, 노이즈 감소 파라미터 (234) 의 더 큰 값들은 저 주파수 윈드 노이즈에서의 더 많은 감소를 초래하고 노이즈 감소 파라미터 (234) 의 더 작은 값들은 저 주파수 윈드 노이즈에서의 더 적은 감소를 초래한다. 일 예로서, 0.5의 디폴트 값이 노이즈 감소 파라미터(234)에 대해 사용될 수도 있지만; 노이즈 감소 파라미터(234)의 값은 특정 비-제한적인 예에서 0.1 내지 4와 같은 값들의 범위에 걸쳐 튜닝가능할 수도 있다.

특정 양태에서, 대역 특정 메트릭 계산 블록 (230) 은 대역 특정 메트릭 값들 (238) 을 결정하기 전에 주파수-특정 메트릭 값들 (210) 중 하나 이상을 수정할 수도 있다. 예를 들어, 대역 특정 메트릭 계산 블록 (230) 은 주파수-특정 메트릭 값들 (210) 의 각각을 수용 기준(acceptance criterion) (236)에 비교할 수도 있다. 이 예에서, 특정한 주파수-특정 메트릭 값 (210) 이 수용 기준 (236) 을 만족하면, 그 특정한 주파수-특정 메트릭 값 (210) 은 윈드 노이즈를 나타내지 않는 것으로 결정된다. 이 상황에서, 특정한 주파수-특정 메트릭 값 (210) 은 윈드 노이즈가 존재하지 않는다는 것을 표시하기 위해 1 의 값이 할당될 수도 있다. 수용 기준(236)은 0과 1 사이의 미리 설정된 또는 튜닝가능한 값이다. 특정한 비-제한적인 예에서, 수용 기준(236)은 0.6 내지 0.9이고, 수용 기준(236)은 특정한 주파수-특정 메트릭 값들(210)이 수용 기준(236) 이상일 때 충족된다. 예시하기 위해, 수용 기준 (236) 이 0.8 의 값을 갖고, 특정한 주파수 특정 메트릭 값 (210) 의 값이 0.82 이면, 주파수 특정 메트릭 값들 (210) 은 대역 특정 메트릭 값들 (238) 을 결정하기 위해 1 의 주파수 특정 메트릭 값이 할당된다.

대역 특정 메트릭 값들(238)은 전력 성형(power shaping) 블록(240)에서 성형된다. 성현은 주파수 대역들의 세트의 더 높은 주파수 대역의 이득 조정된 전력이 주파수 대역들의 세트의 더 낮은 주파수 대역의 이득 조정된 에너지를 초과하는 것을 방지한다. 예를 들어, 전력 성형 블록(240)은 다음과 같은 로직을 사용할 수도 있다:

If Metric_band(Band_k)*E(Band_k, W)<Metric_band(Band_k+1)*E(Band_k+1,W);

then Metric_band(Band_k)= Metric_band(Band_k+1)*E(Band_k+1,W) / E(Band_k,W)

여기서, Band_k 는 특정 주파수 대역을 나타내고, Bank_k ₊₁ 은 다음 더 높은 주파수 대역을 나타내고, E(Band_k, W) 는 W-채널에서의 k 번째 주파수 대역의 에너지이고, E(Band_k+1, W) 는 W-채널에서의 k+1 번째 주파수 대역의 에너지이며, 여기서, W-채널에서의 각각의 대역의 에너지는 주파수-도메인 공간 오디오 데이터 (204)에 기초하여 결정된다.

전력 성형된 대역 특정 메트릭 값들(238)은 필터 뱅크(244)에 대한 필터 파라미터들(242)로서 사용된다. 필터 뱅크 (244) 는 필터링된 주파수 도메인 공간 오디오 데이터 (246) 를 생성하기 위해 주파수 도메인 공간 오디오 데이터 (204) 를 수정한다. 예를 들어, 필터 뱅크 (244) 는 식 3 을 사용하여 각각의 주파수 및 채널에 대한 주파수 도메인 공간 오디오 데이터 (246) 를 결정할 수도 있다:

식 3

여기서, Output(f)는 특정 주파수(f) 및 채널에 대한 주파수-도메인 공간 오디오 데이터(246)이고, S(f)는 특정 주파수(f) 및 채널에 대한 주파수-도메인 공간 오디오 데이터(204)이고, Band_n 은 특정 주파수(f)가 속하는 주파수 대역들(232)의 특정 대역이고, Metric(Band_n)은 특정 채널의 Band_n 에 대한 전력 성형된 대역 특정적 메트릭이고, H_n(f)는 특정 주파수(f) 및 채널에 대한 전달 함수이다.

도 2에서, 주파수 도메인 공간 오디오 데이터 (246) 는 역 고속 푸리에 변환 (IFFT) (248) 을 사용하여 주파수 도메인으로부터 시간 도메인으로 변환되어 감소된 윈드 노이즈 오디오 데이터 (116) 의 하나 이상의 채널들을 생성한다. 예를 들어, IFFT(248)는 역 고속 푸리에 변환 또는 다른 시간 도메인 대 주파수 도메인 변환 동작을 수행할 수도 있다. 도 2의 IFFT(248)는 저주파수 윈드 노이즈 성분이 제거되거나 감소된 FFT(202)로의 W-채널 입력에 대응하는 W'-채널(252)을 출력한다. 부가적으로, 도 2의 IFFT(248)는 저-주파수 윈드 노이즈 성분들이 제거되거나 감소된 FFT(202)로의 Y-채널 입력에 대응하는 Y'-채널(250)을 출력한다. 도 2의 IFFT(248)는 또한 저주파수 윈드 노이즈 성분이 제거되거나 감소된 FFT(202)로의 X-채널 입력에 대응하는 X'-채널(224), 및 저주파수 윈드 노이즈 성분이 제거되거나 감소된 FFT(202)로의 Z-채널 입력에 대응하는 Z'-채널(218)을 출력한다. 도 2에 예시된 예에서, 이득(들) (216) 은 감소된 윈드 노이즈 오디오 데이터 (116)에서 윈드 노이즈를 추가로 감소시키기 위해, 출력 X'-채널 (228) 을 생성하기 위해 증폭기 (226) 를 통해 X'-채널 (224)에, 출력 Z'-채널 (222) 을 생성하기 위해 증폭기 (220) 를 통해 Z'-채널 (218)에, 또는 양자 모두에 적용될 수도 있다. 일부 구현에서, 이득(들)(216)은 인지가능한 팝들(pops) 또는 다른 아티팩트들(artifacts)을 야기할 수 있는 갑작스런 변화들을 제한하기 위해 다수의 프레임들에 걸쳐 점진적으로 적용된다. 일부 구현들에서, 이득(들)(216)은 0의 값으로 설정될 수도 있으며, 이는 이득(들)(216)이 적용되는 대응하는 채널들로부터 모든 오디오가 제거됨을 나타낸다.

일부 구현들에서, 감소된 윈드 노이즈 오디오 데이터 (116) 는 추가적인 프로세싱을 위해 그리고 사운드 출력을 생성하기 위해 (예를 들어, 도 1 의 스피커(들) (126) 를 통해) 도 1 의 공간 오디오 변환기 (118) 와 같은 다른 컴포넌트들에 제공된다.

도 3 는 특정 예에 따라 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키기 위한 디바이스 (300) 의 특정 양태들을 예시하는 블록도이다. 도 3 의 예의 디바이스 (300) 는 공간 오디오 데이터 (112) 가 2 개 이상의 빔들 (164, 166) 을 포함하는 구현에서 도 1 의 공간-오디오 윈드 노이즈 감소 프로세서 (114) 를 포함하거나, 그 안에 포함되거나, 또는 그에 대응할 수도 있다. 예를 들어, 도 3에서, 공간 오디오 데이터(112)는 θ-채널(도 1의 빔(164)으로부터의 데이터를 나타냄) 및 π-채널(도 1의 빔(166)으로부터의 데이터를 나타냄)을 포함한다. 다른 예들에서, 공간 오디오 데이터(112)는 2개 초과의 빔들로부터의 데이터를 포함한다.

도 3에서, 공간 오디오 데이터 (112) 는 FFT (302) 또는 다른 시간 도메인 대 주파수 도메인 변환 동작을 사용하여 주파수 도메인 공간 오디오 데이터 (304) 를 생성하기 위해 주파수 도메인으로 변환된다. 주파수-도메인 공간 오디오 데이터 (304) 는, 공간 오디오 데이터 (112) 의 시간-윈도잉된 샘플에 대해, 다양한 주파수들 또는 주파수 빈들과 연관된 진폭들을 표시한다.

메트릭 계산 블록(306)에서, 주파수-도메인 공간 오디오 데이터(304)의 적어도 2개의 채널들은 메트릭의 주파수 특정 값들(도 3의 "주파수 특정 메트릭 값들"(310))을 계산하는 데 사용된다. 예를 들어, 각각의 주파수에서 각각의 시간-윈도잉된 샘플의 신호 전력이 결정된다. 예시하기 위해, 각각의 주파수 및 시간-윈도잉된 샘플에서의 신호 전력은 상기 식 1을 사용하여 결정될 수도 있다. 특정 주파수 및 시간 샘플에 대해, 주파수-특정 메트릭 값 (310) 은 2 개의 채널들의 합의 전력 대 2 개의 채널들의 차이의 비로서 결정된다. 예시하기 위해, 주파수-특정 메트릭 값 (310) 은 식 4 를 사용하여 결정될 수도 있다:

식 4

여기서, P_t 는 특정 빔에 대한 시간 샘플 t의 신호 전력이고, B(θ, f)는 주파수 f에 대응하는 빔(164)의 성분들을 나타내고, B(π, f)는 주파수 f에 대응하는 빔(166)의 성분들을 나타낸다.

특정 양태에서, 주파수-특정 메트릭 값들 (310) 은 임계 주파수 (308) 미만인 각각의 주파수에 대해 결정된다. 도 2에서와 같이, 메트릭은 윈드 노이즈를 제거하기 위해 주파수에서 적용될 이득에 대응하는 윈드 노이즈 감소를 위한 전력을 나타낸다. 따라서, 메트릭의 더 높은 값들은 신호의 더 적은 것이 윈드 노이즈에 기인한다는 것을 나타내고, 메트릭의 더 낮은 값은 신호의 더 많은 것이 윈드 노이즈에 기인한다는 것을 나타낸다.

특정 양태에서, 주파수-특정 메트릭 값들 (310) 은 조건적 이득 감소 블록 (312)에서 하나 이상의 윈드 검출 임계치들 (314) 과 비교된다. 이 양태에서, 오디오 데이터의 하나 이상의 채널들에 적용되는 이득 (316) 은 윈드 검출 임계치(들) (314) 를 만족시키는 (예를 들어, 그 이하인) 주파수 특정 메트릭 값들 (310) 중 임의의 것에 응답하여 윈드 노이즈를 감소시키도록 조정될 수도 있다. 윈드 검출 임계치(들)(314)는 0 과 1 사이의 정적 또는 튜닝가능한 값이다.

도 3에 예시된 예에서, 조건적 이득 감소 블록(312)에 의해 조정되는 이득(들)(316)은 θ-채널 이득, π-채널 이득, 또는 양자 모두를 포함한다. 다른 예들에서, 공간 오디오 데이터 (112) 가 빔포밍에 기초할 때, 조건적 이득 감소 블록 (312) 은 생략되고, 이득(들) (316) 은 윈드 검출 임계치(들) (314) 를 만족시키는 주파수 특정 메트릭 값들 (310)에 기초하여 임의의 채널에 적용되지 않는다.

특정 양태에서, 주파수 특정 메트릭 값들 (310) 은 대역 특정 메트릭 계산 블록 (330)에서 대역 특정 메트릭 값들 (338) 을 계산하는데 사용된다. 예를 들어, 주파수-특정 메트릭 값들 (310) 은 주파수 대역들 (332)에 의해 그룹화되고 가중된 합은 각각의 주파수 대역 (332)에 대한 대역 특정 메트릭 값을 계산하는데 사용된다. 특정 구현에서, 주파수 대역들 (332) 은 500 Hz 의 대역폭을 갖는다. 다른 구현들에서, 주파수 대역들 (232) 은 더 크거나 (예를 들어, 1000 Hz) 또는 더 작다 (예를 들어, 250 Hz). 또 다른 구현들에서, 상이한 주파수 대역들(332)은 상이한 대역폭들을 가질 수도 있다.

특정 구현에서, 특정 주파수 대역에 대한 대역 특정 메트릭 값(338)은 상기 식 2 를 사용하여 계산될 수도 있다: 노이즈 감소 파라미터 (334) 는, 디바이스 (300) 가 특히 더 낮은 주파수 대역들에서 윈드 노이즈를 얼마나 적극적으로 감소시켰는지에 영향을 미치는 미리 구성된 또는 튜닝가능한 값이다. 예를 들어, 노이즈 감소 파라미터 (334) 의 더 큰 값들은 저 주파수 윈드 노이즈에서의 더 많은 감소를 초래할 것이고 노이즈 감소 파라미터 (334) 의 더 작은 값들은 저 주파수 윈드 노이즈에서의 더 적은 감소를 초래할 것이다. 일 예로서, 0.5의 디폴트 값이 노이즈 감소 파라미터(334)에 대해 사용될 수도 있지만; 노이즈 감소 파라미터(334)의 값은 특정 비-제한적인 예에서 0.1 내지 4와 같은 값들의 범위에 걸쳐 튜닝가능할 수도 있다.

특정 양태에서, 대역 특정 메트릭 계산 블록 (330) 은 대역 특정 메트릭 값들 (338) 을 결정하기 전에 주파수-특정 메트릭 값들 (310) 중 하나 이상을 수정할 수도 있다. 예를 들어, 대역 특정 메트릭 계산 블록 (330) 은 주파수-특정 메트릭 값들 (310) 의 각각을 수용 기준(336)에 비교할 수도 있다. 이 예에서, 특정한 주파수-특정 메트릭 값 (310) 이 수용 기준 (336) 을 만족하면, 그 특정한 주파수-특정 메트릭 값 (210) 은 윈드 노이즈를 나타내지 않는 것으로 결정된다. 이 상황에서, 특정한 주파수-특정 메트릭 값 (310) 은 윈드 노이즈가 존재하지 않는다는 것을 표시하기 위해 1 의 값이 할당될 수도 있다. 수용 기준(336)은 0 과 1 사이의 미리 설정된 또는 튜닝가능한 값이다. 특정한 비-제한적인 예에서, 수용 기준(336)은 0.6 내지 0.9이고, 수용 기준(336)은 특정한 주파수-특정 메트릭 값들(310)이 수용 기준(336) 이상일 때 충족된다. 예시하기 위해, 수용 기준 (336) 이 0.8 의 값을 갖고, 특정한 주파수 특정 메트릭 값 (310) 의 값이 0.82 이면, 주파수 특정 메트릭 값들 (310) 은 대역 특정 메트릭 값들 (338) 을 결정하기 위해 1 의 주파수 특정 메트릭 값이 할당된다.

대역 특정 메트릭 값들(338)은 전력 성형 블록(340)에서 성형된다. 성형은, 주파수 대역과 연관된 대역 특정 메트릭 값(338)에 기초하여 각각의 주파수 대역의 수정 후에 더 낮은 주파수 대역들에서의 전력이 더 높은 주파수 대역들에서의 전력보다 크거나 같다는 것을 보장한다. 예를 들어, 전력 성형 블록(340)은 다음과 같은 로직을 포함할 수도 있다.

If Metric_band(Band_k)*E(Band_k, (B(θ)+B(π)))<Metric_band(Band_k+1)*E(Band_k+1,(B(θ)+B(π)));

then Metric_band(Band_k)= Metric_band(Band_k ₊₁)*E(Band_k ₊ ₁,(B(θ)+B(π))) / E(Band_k,(B(θ)+B(π)))

여기서, Band_k 는 특정 주파수 대역을 나타내고, Bank_k ₊₁ 는 다음 더 높은 주파수 대역을 나타내며, E(Band_k, (B(θ)+B(π))) 는 θ 및 π 빔들의 k번째 주파수 대역의 에너지의 합이고, E(Band_k ₊₁, W) 는 θ 및 π 빔들의 k+1번째 주파수 대역의 에너지의 합이며, 여기서, 각 빔의 에너지는 주파수 도메인 공간 오디오 데이터 (304) 에 기초하여 결정된다.

전력 성형된 대역 특정 메트릭 값들(338)은 필터 뱅크(344)에 대한 필터 파라미터들(342)로서 사용된다. 필터 뱅크 (344) 는 필터링된 주파수 도메인 공간 오디오 데이터 (346) 를 생성하기 위해 주파수 도메인 공간 오디오 데이터 (304) 를 수정한다. 예를 들어, 필터 뱅크 (344) 는 상기 식 3 을 사용하여 각각의 주파수 및 채널에 대한 주파수 도메인 공간 오디오 데이터 (346) 를 결정할 수도 있다:

도 3에서, 주파수-도메인 공간 오디오 데이터 (346) 는 IFFT (348) 를 사용하여 주파수 도메인으로부터 시간 도메인으로 변환되어 감소된 윈드 노이즈 오디오 데이터 (116) 의 하나 이상의 채널들을 생성한다. 예를 들어, 도 3 의 IFFT (348) 는 저-주파수 윈드 노이즈 성분들이 제거되거나 감소된 FFT (302) 에 대한 θ-채널 (164) 입력에 대응하는 θ’-채널 (318), 및 저-주파수 윈드 노이즈 성분들이 제거되거나 감소된 FFT (302) 에 대한 π-채널 (166) 입력에 대응하는 π’-채널 (324) 을 출력한다. 도 3에 예시된 예에서, 이득(들) (316) 은 감소된 윈드 노이즈 오디오 데이터 (116)에서 윈드 노이즈를 추가로 감소시키기 위해, 출력 θ'-채널 (322) 을 생성하기 위해 증폭기 (320) 를 통해 θ'-채널 (318)에, 출력 π'-채널 (328) 을 생성하기 위해 증폭기 (326) 를 통해 π'-채널 (324)에, 또는 양자 모두에 적용될 수도 있다. 일부 구현들에서, 이득(들)(316)은 인지가능한 팝들 또는 다른 아티팩트들을 야기할 수 있는 갑작스런 변화들을 제한하기 위해 다수의 프레임들에 걸쳐 점진적으로 적용된다.

도 4 는 특정 예에 따른, 윈드 노이즈 소거가 없고 윈드 노이즈 소거가 있는 여러 풍속에 대한 사운드 레벨들을 예시하는 그래프들의 세트이다. 특히, 도 4의 그래프(400)는 윈드 노이즈 감소가 사용되지 않을 때 다양한 윈드 조건들에 대한 다수의 앰비소닉스 채널들에서의 윈드 노이즈를 예시한다. 도 4의 그래프(450)는 본 명세서에 설명된 윈드 노이즈 감소 동작들이 사용될 때 동일한 윈드 조건들에 대한 다수의 앰비소닉스 채널들에서의 윈드 노이즈를 예시한다.

그래프(400)에서, 앰비소닉스 채널은 W-채널(402), Y-채널(404), Z-채널(406), 및 X-채널(408)을 포함하고, 윈드 조건들은 바람 없음, 시간당 3 마일(mph) 바람, 6 mph 바람, 및 12 mph 바람을 포함한다. 그래프(400)는 6mph 바람을 갖는 모든 채널에서의 검출가능한 사운드 레벨들 및 12mph 바람을 갖는 사운드 레벨의 상당한 증가를 보여준다. 그래프(400)에 도시된 바와 같이, Z-채널(406) 및 X-채널(408)에서의 사운드 레벨은 W-채널(402) 및 Y-채널(404)에 대한 사운드 레벨보다 6 mph 바람과 12 mph 바람 사이에서 증가한다.

그래프 (450) 는 그래프 (400)에 예시된 바와 동일한 윈드 조건들에 대해 W-채널 (452), Y-채널 (454), Z-채널 (456), 및 X-채널 (458) 을 포함하지만 윈드 노이즈 감소가 적용된 앰비소닉스 채널들을 도시한다. 그래프 (450)에 대해, 윈드 감소는 (예를 들어, 도 2의 필터 뱅크 (244) 를 사용하여) 필터링하는 것 및 (예를 들어, 도 2의 증폭기들 (220, 226) 을 통해) 앰비소닉스 채널들 중 일부에 이득들을 선택적으로 적용하는 것 모두를 포함한다. 그래프(450)에 도시된 바와 같이, 윈드 노이즈가 증가함에 따라, Z-채널(456) 및 X-채널(458)에 적용되는 이득이 감소(또는 제로 아웃)되어, 6mph 바람 및 12mph 바람의 경우, Z-채널(456) 및 X-채널(458)이 턴 오프되고, 이는 윈드 노이즈로 인한 사운드 레벨을 상당히 감소시킨다. 추가적으로, W-채널(452) 및 Y-채널(454)은 윈드 노이즈를 추가로 감소시키기 위해 필터링된다.

도 5 는 특정 예에 따른, 윈드 노이즈 소거가 없고 윈드 노이즈 소거가 있는 여러 풍속에 대한 사운드 레벨들을 예시하는 그래프들의 세트이다. 특히, 도 5의 그래프(500)는 윈드 노이즈 감소가 사용되지 않을 때 다양한 윈드 조건들에 대한 다수의 빔들에서의 윈드 노이즈를 예시한다. 도 5의 그래프(550)는 본 명세서에 설명된 윈드 노이즈 감소 동작들이 사용될 때 동일한 윈드 조건들에 대한 다수의 빔들에서의 윈드 노이즈를 예시한다.

그래프(500)에서, 제 1 채널(502)은 제 1 빔에 대응하고, 제 2 채널(504)은 제 2 빔에 대응한다. 그래프(500)를 생성하기 위해, 2개의 빔은 서로 180도 이격되어 설정되었다. 예시를 위해, 빔들 사이의 도 1의 각도(168)는 180도였다. 그래프(500)는 6 mph 바람을 갖는 양쪽 채널에서의 검출가능한 사운드 레벨 및 12 mph 바람을 갖는 사운드 레벨에서의 상당한 증가를 보여준다.

그래프(550)는 윈드 노이즈 감소가 적용된 제 1 채널(502)에 대응하는 제 1 채널(552), 및 윈드 노이즈 감소가 적용된 제 2 채널(504)에 대응하는 제 2 채널(554)을 도시한다. 그래프 (450)에 대해, 윈드 감소는 (예를 들어, 도 3의 필터 뱅크 (344) 를 사용하여) 채널들을 필터링하여 저주파수 윈드 노이즈를 제거하는 것을 포함한다. 그래프(500)의 영역들(506 및 508)과 그래프(550)의 대응하는 영역들(556 및 558)의 비교는 필터링이 윈드 노이즈로 인한 사운드 레벨들을 상당히 감소시킨다는 것을 보여준다.

도 6은 하나 이상의 프로세서들(608)을 포함하는 집적 회로(602)로서 디바이스(100)의 구현(600)을 도시한다. 집적 회로(602)는 또한 오디오 데이터(104) 또는 다른 신호들이 프로세싱을 위해 마이크로폰들(102)로부터 수신될 수 있게 하는 하나 이상의 버스 인터페이스와 같은 입력(604)을 포함한다. 집적 회로(602)는 또한 감소된 윈드 노이즈 오디오 데이터(124)와 같은 출력 신호의 전송을 가능하게 하는 버스 인터페이스와 같은 출력(606)을 포함한다. 도 6에서, 프로세서(들)(608)는 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함한다. 다른 구현들에서, 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간 오디오 변환기(118), 및 주변 노이즈 억제기 (122) 중 하나 이상은 생략된다. 집적 회로(602)는 도 8에 도시된 바와 같은 모바일 폰 또는 태블릿, 도 9에 도시된 바와 같은 이어버드, 도 10에 도시된 바와 같은 헤드셋, 도 11에 도시된 바와 같은 웨어러블 전자 디바이스, 도 12에 도시된 바와 같은 음성 제어 스피커 시스템, 도 13에 도시된 바와 같은 카메라, 도 14에 도시된 바와 같은 가상 현실 헤드셋, 혼합 현실 헤드셋 또는 증강 현실 헤드셋, 또는 도 15 또는 도 16에 도시된 바와 같은 차량과 같은, 마이크로폰들(102)을 포함하는 시스템에서의 윈드 노이즈 감소의 구현을 가능하게 한다.

도 7은 하나 이상의 프로세서들(708)을 포함하는 집적 회로(702)로서의 디바이스(200) 또는 디바이스(300)의 구현(700)을 도시한다. 집적 회로(702)는 또한 공간 오디오 데이터(112) 또는 다른 신호들이 프로세싱을 위해 수신될 수 있게 하기 위해 하나 이상의 버스 인터페이스들과 같은 입력(704)을 포함한다. 집적 회로(702)는 또한 감소된 윈드 노이즈 오디오 데이터(116)와 같은 출력 신호의 전송을 가능하게 하는 버스 인터페이스와 같은 출력(706)을 포함한다. 도 7에서, 프로세서(들)(708)는 공간-오디오 윈드 노이즈 감소 프로세서(114)를 포함한다. 다른 구현들에서, 프로세서(들)(708)는 또한 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간 오디오 변환기(118), 또는 주변 노이즈 억제기(122) 중 하나 이상을 포함한다. 집적 회로(602)는 도 8에 도시된 바와 같은 모바일 폰 또는 태블릿, 도 9에 도시된 바와 같은 이어버드, 도 10에 도시된 바와 같은 헤드셋, 도 11에 도시된 바와 같은 웨어러블 전자 디바이스, 도 12에 도시된 바와 같은 음성 제어 스피커 시스템, 도 13에 도시된 바와 같은 카메라, 도 14에 도시된 바와 같은 가상 현실 헤드셋, 혼합 현실 헤드셋 또는 증강 현실 헤드셋, 또는 도 15 또는 도 16에 도시된 바와 같은 차량과 같은, 공간 오디오 데이터를 프로세싱하는 시스템에 의한 윈드 노이즈 감소의 구현을 가능하게 한다.

도 8은 도 1의 디바이스(100)의 양태들을 통합하는 모바일 디바이스(800)를 예시한다. 도 8에서, 모바일 디바이스 (800) 는 도 1 의 디바이스 (100), 도 6 의 집적 회로 (602), 도 7 의 집적 회로 (702), 또는 이들의 조합을 포함하거나 또는 이들에 결합된다. 예를 들어, 도 8에서, 모바일 디바이스(800)는 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 모바일 디바이스(800)는 예시적인, 비제한적인 예로서 전화 또는 태블릿을 포함한다. 모바일 디바이스(800)는 디스플레이 스크린(804) 및 도 1의 마이크로폰(들)(102A, 102B 및 102N)과 같은 하나 이상의 센서를 포함한다.

동작 동안, 모바일 디바이스(800)는 윈드 노이즈를 검출하는 것에 응답하여 특정 액션들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 9는 도 1의 디바이스(100)의 양태들을 포함하는 이어버드들(900)을 예시한다. 도 9에서, 이어버드들(900)은 도 1의 디바이스(100)를 포함하거나 그에 결합된다. 예를 들어, 도 9에서, 이어버드들(900)의 제 1 이어버드(902)는 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간 오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자에게 일반적으로 보이지 않는다는 것을 나타내기 위해 점선들로 예시된다. 일부 구현들에서, 제 2 이어버드(904)는 또한 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함한다.

이어버드들(900)은 마이크로폰들(102A, 102B, 102N)을 포함하고, 이들 중 적어도 하나는 사용자의 음성을 주로 캡처하도록 위치된다. 이어버드들(900)은 또한 (예를 들어, 노이즈 소거 동작들을 위해) 환경 사운드들을 주로 캡처하도록 위치된 하나 이상의 추가적인 마이크로폰들을 포함할 수도 있다.

특정 양태에서, 동작 동안, 이어버드들(900)은 윈드 노이즈를 검출하는 것에 응답하여 특정 동작들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 10은 도 1의 디바이스(100)의 양태들을 통합하는 헤드셋(1000)을 예시한다. 예를 들어, 도 10에서, 헤드셋(1000)은 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 헤드셋(1000)은 사용자의 음성을 주로 캡처하도록 위치된 마이크로폰(102A), 및 (예를 들어, 노이즈 제거 동작들을 위해) 환경 사운드들을 주로 캡처하도록 위치된 하나 이상의 추가 마이크로폰(예를 들어, 마이크로폰들(102B 및 102N))을 포함한다.

특정 양태에서, 동작 동안, 헤드셋((1000)은 윈드 노이즈를 검출하는 것에 응답하여 특정 동작들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 11은 디스플레이(1104) 및 마이크로폰들(102A, 102B, 및 102N)과 같은 센서(들)를 포함하는, "스마트 시계"로서 예시된 웨어러블 전자 디바이스(1100)에 통합된 디바이스(100)의 예를 도시한다. 예를 들어, 도 11에서, 웨어러블 전자 디바이스(1100)는 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다.

특정 양태에서, 동작 동안, 웨어러블 전자 디바이스 (1100) 는 윈드 노이즈를 검출하는 것에 응답하여 특정 액션들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 12는 음성 제어 스피커 시스템(1200)의 예시적인 예이다. 음성 제어 스피커 시스템(1200)은 무선 네트워크 연결성을 가질 수 있고 어시스턴트 동작을 실행하도록 구성된다. 도 12에서, 도 1의 디바이스(100)의 양태들은 음성 제어 스피커 시스템(1200)에 포함된다. 예를 들어, 도 12에서, 음성 제어 스피커 시스템(1200)은 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 음성 제어 스피커 시스템(1200)은 또한 스피커(들)(126) 및 센서들을 포함한다. 센서들은 음성 입력 또는 다른 오디오 입력을 수신하기 위해 도 1의 마이크로폰(들)(102)을 포함할 수 있다.

특정 양태에서, 동작 동안, 음성 제어 스피커 시스템(1200)은 윈드 노이즈를 검출하는 것에 응답하여 특정 액션들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 13은 도 1의 디바이스(100)의 양태들을 통합하는 카메라(1300)를 예시한다. 도 13에서, 디바이스(100)는 카메라(1300)에 통합되거나 그에 결합된다. 예를 들어, 도 13에서, 카메라(1300)는 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 카메라(1300)는 또한 이미지 센서(1302) 및 도 1의 마이크로폰(들)(102)과 같은 하나 이상의 다른 센서를 포함한다.

특정 양태에서, 동작 동안, 카메라(1300)는 윈드 노이즈를 검출하는 것에 응답하여 특정 동작들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 14는 가상 현실 헤드셋, 증강 현실 헤드셋, 혼합 현실 헤드셋, 확장 현실 헤드셋, 헤드-마운트 디스플레이, 또는 이들의 조합과 같은 헤드셋(1400)에 결합되거나 그 내에 통합된 디바이스(100)의 예를 도시한다. 디스플레이 (1404) 와 같은 시각적 인터페이스 디바이스는, 헤드셋 (1400) 이 착용되는 동안 사용자로의 증강 현실 또는 가상 현실 이미지들 또는 장면들의 디스플레이를 가능케 하기 위해 사용자의 눈 앞에 포지셔닝된다. 예를 들어, 도 14에서, 헤드셋 (1400)은 또한, 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 헤드셋(1402)은 또한 도 1의 마이크로폰(들)(102)과 같은 하나 이상의 센서(들), 카메라들, 다른 센서들, 또는 이들의 조합을 포함한다.

특정 양태에서, 동작 동안, 헤드셋((1400)은 윈드 노이즈를 검출하는 것에 응답하여 특정 동작들을 수행할 수도 있다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 15는 도 1의 디바이스(100)의 양태들을 포함하는 차량(vehicle)(예를 들어, 비행 디바이스(1500))을 도시한다. 도 15에서, 비행 디바이스(1500)는 도 1의 디바이스(100)를 포함하거나 이에 결합된다. 예를 들어, 도 15에서, 비행 디바이스(1500)는 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 비행 디바이스(1500)는 유인, 무인 또는 원격 조종되는 비행 디바이스(예를 들어, 패키지 배달 드론)이다. 비행 디바이스(1500)는 제어 시스템(1502) 및 도 1의 마이크로폰(들)(102)과 같은 하나 이상의 센서를 포함한다.

제어 시스템(1502)은 화물 해제, 센서 활성화, 이륙, 항법, 착륙, 또는 이들의 조합과 같은 비행 디바이스(1500)의 다양한 동작들을 제어한다. 예를 들어, 제어 시스템(1502)은 특정 지점들과 특정 위치에서의 화물의 전개 사이에서 비행 디바이스(1500)의 비행을 제어할 수도 있다. 특정 양태에서, 제어 시스템 (1502) 은 윈드 노이즈를 검출하는 것에 응답하여 하나 이상의 액션을 수행한다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 16은 도 1의 디바이스(100)의 양태들을 통합하는 차량(1600)의 예시적인 예이다. 일 구현에 따르면, 차량 (1600) 은 자율 주행 자동차이다. 다른 구현들에 따르면, 차량(1600)은 자동차, 트럭, 오토바이, 항공기, 수상 차량 등이다. 도 16 에서, 차량 (1600) 은 스크린 (1602), 센서(들) (예컨대, 도 1 의 마이크로폰들 (102)), 및 디바이스 (100) 의 양태들을 포함한다. 예를 들어, 도 16에서, 차량(1600)은 윈드 터뷸런스 노이즈 감소 엔진(106), 공간 오디오 변환기(110), 공간-오디오 윈드 노이즈 감소 프로세서(114), 공간 오디오 변환기(118), 및 주변 노이즈 억제기(122)를 포함하며, 이들 각각은 사용자가 일반적으로 볼 수 없음을 나타내기 위해 점선들로 예시된다. 디바이스(100)는 차량(1600)에 통합되거나 차량(1600)에 결합될 수 있다.

특정 구현들에서, 센서(들)는 또한 차량 점유 센서들, 눈 추적 센서, 또는 외부 환경 센서들(예를 들어, 라이다 센서들 또는 카메라들)을 포함한다. 특정 양태에서, 하나 이상의 센서들로부터의 센서 데이터는 사용자의 위치를 나타낸다. 예를 들어, 센서들은 차량(1600) 내의 다양한 위치들과 연관된다.

특정 양태에서, 차량 (1600) 은 윈드 노이즈를 검출하는 것에 응답하여 하나 이상의 액션을 수행한다. 예를 들어, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 필터링하는 것을 포함할 수 있다. 다른 예로서, 액션들은 캡처된 오디오에서 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득을 조정하는 것을 포함할 수 있다.

도 17 은 공간 오디오 데이터에서 윈드 노이즈를 검출하는 방법 (1700) 의 예의 양태들을 예시하는 플로우차트이다. 방법(1700)은 도 1의 디바이스(100)에 의해, 도 2의 디바이스(200)에 의해, 도 3의 디바이스(300)에 의해, 또는 이들의 조합에 의해 개시, 제어, 또는 수행될 수 있다. 특정 양태에서, 하나 이상의 프로세서(들)는 방법 (1700) 을 수행하기 위해 메모리로부터의 명령들을 실행할 수 있다.

방법 (1700) 은 블록 (1702)에서, 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계를 포함한다. 예를 들어, 도 1 의 디바이스 (100) 는 마이크로폰들 (102) 로부터 오디오 데이터 (104) 를 획득할 수도 있다. 다른 예에서, 오디오 데이터(104)는 메모리로부터 판독되거나 (예를 들어, 네트워크 연결 또는 피어-투-피어 애드 혹 연결을 통해) 원격 컴퓨팅 디바이스로부터 수신될 수도 있다.

방법 (1700) 은 블록 (1704)에서, 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 단계를 포함한다. 예를 들어, 공간 오디오 변환기 (110) 는 앰비소닉스 프로세싱 또는 빔포밍을 사용하여 오디오 데이터 (104)에 기초하여 공간 오디오 데이터 (112) 를 생성할 수도 있다.

방법 (1700) 은 블록 (1706)에서, 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계를 포함한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다. 예를 들어, 공간 오디오 데이터 (112) 가 앰비소닉스 계수들을 포함할 때, 메트릭은 특정 주파수 및 시간 프레임에 대한 차동 채널들 (예를 들어, X-, Y-, 또는 Z- 채널) 중 하나의 신호 전력에 대한 특정 주파수 및 시간 프레임에 대한 W-채널의 신호 전력의 비로서 결정될 수도 있다. 다른 예로, 공간 오디오 데이터가 2개 이상의 빔들을 포함하는 경우, 메트릭은 특정 주파수 및 시간 프레임에 대한 2개의 빔들의 신호 전력의 합과 특정 주파수 및 시간 프레임에 대한 2개의 빔들의 신호 전력의 차이의 비율로 결정될 수도 있다.

도 18 은 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키는 방법 (1800) 의 예의 양태들을 예시하는 플로우 차트이다. 방법(1800)은 도 1의 디바이스(100)에 의해, 도 2의 디바이스(200)에 의해, 도 3의 디바이스(300)에 의해, 또는 이들의 조합에 의해 개시, 제어, 또는 수행될 수 있다. 특정 양태에서, 하나 이상의 프로세서(들)는 방법 (1800) 을 수행하기 위해 메모리로부터의 명령들을 실행할 수 있다.

방법 (1800) 은 블록 (1802)에서, 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계를 포함한다. 예를 들어, 도 1 의 디바이스 (100) 는 마이크로폰들 (102) 로부터 오디오 데이터 (104) 를 획득할 수도 있다. 다른 예에서, 오디오 데이터(104)는 메모리로부터 판독되거나 (예를 들어, 네트워크 연결 또는 피어-투-피어 애드 혹 연결을 통해) 원격 컴퓨팅 디바이스로부터 수신될 수도 있다.

방법 (1800) 은 블록 (1804)에서, 오디오 신호에 기초하여 공간 오디오 데이터를 결정하는 단계를 포함한다. 예를 들어, 공간 오디오 변환기 (110) 는 앰비소닉스 프로세싱 또는 빔포밍을 사용하여 오디오 데이터 (104)에 기초하여 공간 오디오 데이터 (112) 를 생성할 수도 있다.

방법 (1800) 은 블록 (1806)에서, 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계를 포함한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다. 예를 들어, 공간 오디오 데이터 (112) 가 앰비소닉스 계수들을 포함할 때, 메트릭은 특정 주파수 및 시간 프레임에 대한 차동 채널들 (예를 들어, X-, Y-, 또는 Z- 채널) 중 하나의 신호 전력에 대한 특정 주파수 및 시간 프레임에 대한 W-채널의 신호 전력의 비로서 결정될 수도 있다. 다른 예로, 공간 오디오 데이터가 2개 이상의 빔들을 포함하는 경우, 메트릭은 특정 주파수 및 시간 프레임에 대한 2개의 빔들의 신호 전력의 합과 특정 주파수 및 시간 프레임에 대한 2개의 빔들의 신호 전력의 차이의 비율로 결정될 수도 있다.

방법 (1800) 은 블록 (1808)에서, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 단계를 포함한다. 예를 들어, 필터 파라미터들 (예컨대, 도 2 의 필터 파라미터들 (242) 또는 도 3 의 필터 파라미터들 (342)) 은 감소된 윈드 노이즈 오디오 데이터 (116) 를 생성하기 위해 (예컨대, 주파수 도메인에서) 공간 오디오 데이터를 필터링하는데 사용될 수도 있다. 다른 예로서, 공간 오디오 데이터의 하나 이상의 채널들에 적용되는 이득 (예를 들어, 이득(들) (216) 또는 이득(들) (316)) 은 감소된 윈드 노이즈 오디오 데이터 (116) 를 생성하기 위해 변경 (예를 들어, 감소) 될 수도 있다.

도 19 는 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키는 방법 (1900) 의 예의 양태들을 예시하는 플로우 차트이다. 방법(1900)은 도 1의 디바이스(100)에 의해, 도 2의 디바이스(200)에 의해, 도 3의 디바이스(300)에 의해, 또는 이들의 조합에 의해 개시, 제어, 또는 수행될 수 있다. 특정 양태에서, 하나 이상의 프로세서(들)는 방법 (1900) 을 수행하기 위해 메모리로부터의 명령들을 실행할 수 있다.

방법 (1900) 은 블록 (1902)에서, 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계를 포함한다. 예를 들어, 도 1 의 디바이스 (100) 는 마이크로폰들 (102) 로부터 오디오 데이터 (104) 를 획득할 수도 있다. 다른 예에서, 오디오 데이터(104)는 메모리로부터 판독되거나 (예를 들어, 네트워크 연결 또는 피어-투-피어 애드 혹 연결을 통해) 원격 컴퓨팅 디바이스로부터 수신될 수도 있다.

방법 (1900) 은 블록 (1904)에서, 오디오 신호에 기초하여 공간 오디오 데이터를 결정하는 단계를 포함한다. 예를 들어, 공간 오디오 변환기 (110) 는 앰비소닉스 프로세싱 또는 빔포밍을 사용하여 오디오 데이터 (104)에 기초하여 공간 오디오 데이터 (112) 를 생성할 수도 있다.

방법 (1900) 은 블록 (1906)에서, 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계를 포함한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다. 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다. 예를 들어, 공간 오디오 데이터 (112) 가 앰비소닉스 계수들을 포함할 때, 메트릭은 특정 주파수 및 시간 프레임에 대한 차동 채널들 (예를 들어, X-, Y-, 또는 Z- 채널) 중 하나의 신호 전력에 대한 특정 주파수 및 시간 프레임에 대한 W-채널의 신호 전력의 비로서 결정될 수도 있다. 다른 예로, 공간 오디오 데이터가 2개 이상의 빔들을 포함하는 경우, 메트릭은 특정 주파수 및 시간 프레임에 대한 2개의 빔들의 신호 전력의 합과 특정 주파수 및 시간 프레임에 대한 2개의 빔들의 신호 전력의 차이의 비율로 결정될 수도 있다.

방법 (1900) 은 블록 (1908)에서, 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 단계를 포함한다. 예를 들어, 도 2의 조건적 이득 감소 블록(212)은 윈드 노이즈에 대한 앰비소닉스 데이터의 세트의 X-채널, Z-채널, 또는 양자 모두에 적용되는 이득(들)(216)을 출력할 수 있다. 다른 예로서, 도 3의 조건적 이득 감소 블록(312)은 공간 오디오 데이터의 하나 이상의 빔들에 적용되는 이득(들)(316)을 출력할 수 있다.

도 20 은 공간 오디오 데이터에서 윈드 노이즈를 검출 및 감소시키는 방법 (2000) 의 예의 양태들을 예시하는 플로우 차트이다. 방법(2000)은 도 1의 디바이스(100)에 의해, 도 2의 디바이스(200)에 의해, 도 3의 디바이스(300)에 의해, 또는 이들의 조합에 의해 개시, 제어, 또는 수행될 수 있다. 특정 양태에서, 하나 이상의 프로세서(들)는 방법 (2000) 을 수행하기 위해 메모리로부터의 명령들을 실행할 수 있다.

방법 (2000) 은 블록 (2002)에서, 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계를 포함한다. 예를 들어, 도 1 의 디바이스 (100) 는 마이크로폰들 (102) 로부터 오디오 데이터 (104) 를 획득할 수도 있다. 다른 예에서, 오디오 데이터(104)는 메모리로부터 판독되거나 (예를 들어, 네트워크 연결 또는 피어-투-피어 애드 혹 연결을 통해) 원격 컴퓨팅 디바이스로부터 수신될 수도 있다.

방법 (2000) 은, 블록 (2004)에서, 고주파수 윈드 노이즈를 제거하기 위해 오디오 신호들을 프로세싱하는 단계를 포함한다. 예를 들어, 도 1의 윈드 터뷸런스 노이즈 감소 엔진(106)은 윈드 터뷸런스와 연관된 고주파 윈드 노이즈를 제거하거나 감소시키기 위해 오디오 데이터(104)를 프로세싱한다.

방법 (2000) 은 블록 (2006)에서, 오디오 신호에 기초하여 공간 오디오 데이터를 결정하는 단계를 포함한다. 예를 들어, 도 1 의 공간 오디오 변환기 (110) 는 앰비소닉스 프로세싱 또는 빔포밍을 사용하여 오디오 데이터 (104)에 기초하여 공간 오디오 데이터 (112) 를 생성할 수도 있다.

방법 (2000) 은, 블록 (2008)에서, 주파수들의 세트에 대해, 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭의 주파수 특정 값들을 결정하는 단계를 포함한다. 예를 들어, 주파수 특정 메트릭 값들(210)은 도 2의 메트릭 계산 블록(206)에 의해 계산될 수도 있거나, 또는 주파수 특정 메트릭 값들(310)은 도 3의 메트릭 계산 블록(306)에 의해 계산될 수도 있다.

방법(2000)은 블록(2010)에서, 주파수 대역들의 세트의 각각의 주파수 대역에 대해, 메트릭의 대역 특정 값을 결정하는 단계를 포함한다. 예를 들어, 대역 특정 메트릭 값들(238)은 도 2의 대역 특정 메트릭 계산 블록(230)에 의해 계산될 수도 있거나, 또는 대역 특정 메트릭 값들(338)은 도 3의 대역 특정 메트릭 계산 블록(330)에 의해 계산될 수도 있다.

방법(2000)은 블록(2012)에서, 수용 기준을 만족시키는 메트릭의 대역 특정 값을 수정하는 단계를 포함한다. 예를 들어, 도 2 의 대역 특정 메트릭 계산 블록 (230) 은 각각의 대역 특정 메트릭 값 (238) 을 수용 기준 (236) 과 비교하고 수용 기준 (236) 을 만족시키는 대역 특정 메트릭 값들 (238) 을 수정할 수도 있다. 다른 예로서, 도 3 의 대역 특정 메트릭 계산 블록 (330) 은 각각의 대역 특정 메트릭 값 (338) 을 수용 기준 (336) 과 비교하고 수용 기준 (336) 을 만족시키는 대역 특정 메트릭 값들 (338) 을 수정할 수도 있다.

방법 (2000) 은 블록 2014에서, 메트릭의 대역 특정 값들에 전력 성형을 적용하는 단계를 포함한다. 예를 들어, 도 2 의 전력 성형 블록 (240) 은 대역 특정 메트릭 값들 (238) 및 주파수-도메인 공간 오디오 데이터 (204)에 기초하여 전력 성형을 적용할 수도 있다. 다른 예로서, 도 3 의 전력 성형 블록 (340) 은 대역 특정 메트릭 값들 (338) 및 주파수-도메인 공간 오디오 데이터 (304)에 기초하여 전력 성형을 적용할 수도 있다.

방법 (2000) 은 블록 2016에서, 메트릭의 대역 특정 값들에 기초하여 필터 파라미터들을 결정하는 단계를 포함한다. 예를 들어, 도 2 의 필터 파라미터들 (242) 은 전력 시프트된 대역 특정 메트릭 값들 (238)에 기초하여 생성될 수도 있다. 다른 예로서, 도 3 의 필터 파라미터들 (342) 은 전력 시프트된 대역 특정 메트릭 값들 (338)에 기초하여 생성될 수도 있다.

방법 (2000) 은 블록 (2018)에서, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하는 단계를 포함한다. 예를 들어, 도 2의 필터 뱅크 (244) 는 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 수정하도록 필터 파라미터들 (242) 을 적용한다. 다른 예로서, 도 3의 필터 뱅크 (344) 는 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들을 수정하도록 필터 파라미터들 (342) 을 적용한다.

방법 (2000) 은 블록 2020에서, 메트릭의 임의의 주파수 특정 값들이 윈드 검출 기준을 만족시키는지 여부를 결정하는 단계를 포함한다. 예를 들어, 조건적 이득 감소 블록 (212) 은 주파수 특정 메트릭 값들 (210) 의 각각을 윈드 검출 임계치 (214) 와 비교할 수도 있거나, 또는 조건적 이득 감소 블록 (312) 은 주파수 특정 메트릭 값들 (310) 의 각각을 윈드 검출 임계치 (314) 와 비교할 수도 있다.

방법 (2000) 은 블록 2022에서, 메트릭의 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여, 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 단계를 포함한다. 예를 들어, 증폭기들 (220, 226) 은 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 이득(들) (216) 을 적용할 수도 있다. 다른 예로서, 증폭기들 (320, 326) 은 윈드 노이즈를 감소시키기 위해 공간 오디오 데이터의 하나 이상의 채널들에 이득(들) (316) 을 적용할 수도 있다.

방법(2000)은 블록(2024)에서, 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성하는 단계 및 바이노럴 오디오 출력의 주변 노이즈 억제를 수행하는 단계를 포함한다. 도 20에 예시된 구현에서, 블록(2022)에서, 바이노럴 오디오 출력이 생성되고, 블록(2020)에서, 감소된 이득이 적용된 후에, 또는 메트릭의 주파수 특정 값들 중 어느 것도 윈드 검출 기준을 충족시키지 않는다는 결정에 기초하여, 주변 노이즈 억제가 수행된다. 특정 예들에서, 도 1의 공간 오디오 변환기(118)는 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성할 수도 있고, 주변 노이즈 억제기(122)는 바이노럴 오디오 출력의 주변 노이즈 억제를 수행할 수도 있다.

도 21 을 참조하면, 디바이스의 특정한 예시적인 예의 블록도가 도시되고 일반적으로 2100으로 지정된다. 다양한 양태들에서, 디바이스 (2100) 는 도 21 에 도시된 것보다 더 적거나 더 많은 컴포넌트들을 가질 수도 있다. 예시적인 양태에서, 디바이스 (2100) 는 도 1 의 디바이스 (100), 도 2 의 디바이스 (200), 도 3 의 디바이스 (300), 또는 이들의 조합에 대응할 수도 있다. 예시적인 양태에 있어서, 디바이스 (2100) 는 도 1 내지 도 20 의 시스템들 및 방법들을 참조하여 설명된 하나 이상의 동작들을 수행할 수도 있다.

특정 양태에서, 디바이스 (2100) 는 프로세서 (2104) (예컨대, 중앙 프로세싱 유닛 (CPU)) 를 포함한다. 디바이스 (2100) 는 하나 이상의 추가적인 프로세서들 (2106)(예를 들어, 하나 이상의 디지털 신호 프로세서 (DSP)들) 을 포함할 수도 있다. 프로세서 (2104) 또는 프로세서들 (2106) 은 윈드 터뷸런스 노이즈 감소 엔진 (106), 공간 오디오 변환기 (110), 공간-오디오 윈드 노이즈 감소 프로세서 (114), 공간 오디오 변환기 (118), 주변 노이즈 억제기 (122), 또는 이들의 조합의 동작들을 개시, 제어 또는 수행하기 위해 메모리 (2114) 로부터의 명령들 (2116) 을 포함 또는 실행할 수도 있다.

디바이스 (2100) 는 트랜시버 (2132) 및 안테나 (2122)에 결합된 모뎀 (2130) 을 포함할 수도 있다. 트랜시버(2132)는 수신기, 송신기, 또는 양자 모두를 포함할 수도 있다. 프로세서 (2104), 프로세서들 (2106), 또는 양자 모두는 모뎀 (2130) 을 통해 트랜시버 (2132)에 결합된다.

디바이스 (2100) 는 디스플레이 제어기 (2118) 에 결합된 디스플레이 (2140) 를 포함할 수도 있다. 스피커(들) (126) 및 마이크로폰들 (102) 은 하나 이상의 인터페이스들을 통해 CODEC (2108)에 결합될 수도 있다. 코덱 (2108) 은 디지털-대-아날로그 컨버터 (DAC) (2110) 및 아날로그-대-디지털 컨버터 (ADC) (2112) 를 포함할 수도 있다.

메모리 (2114) 는 도 1 내지 도 20 을 참조하여 설명된 하나 이상의 동작들을 수행하기 위해 프로세서 (2104), 프로세서들 (2106), 디바이스 (2100) 의 다른 프로세싱 유닛, 또는 이들의 조합에 의해 실행가능한 명령들 (2116) 을 저장할 수도 있다. 메모리 (2114) 는 도 1 내지 도 20 을 참조하여 설명된 데이터, 하나 이상의 신호들, 하나 이상의 파라미터들, 하나 이상의 임계치들, 하나 이상의 표시자들, 또는 이들의 조합을 저장할 수도 있다.

디바이스 (2100) 의 하나 이상의 컴포넌트들은 전용 하드웨어 (예를 들어, 회로부) 를 통해, 하나 이상의 태스크들을 수행하기 위해 명령들 (2116) 을 실행하는 프로세서 (예를 들어, 프로세서 (2104) 또는 프로세서들 (2106))에 의해, 또는 이들의 조합으로 구현될 수도 있다. 예로서, 메모리 (2114) 는 랜덤 액세스 메모리 (RAM), 자기 저항 랜덤 액세스 메모리 (MRAM), 스핀 토크 전달 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거 가능 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거 가능 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈식 디스크, 또는 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은 메모리 디바이스 (예를 들어, 컴퓨터 판독가능 저장 디바이스) 를 포함하거나 또는 이에 대응할 수도 있다. 메모리 디바이스는 컴퓨터 (예를 들어, 프로세서 (2104) 및/또는 프로세서들 (2106) 과 같은 하나 이상의 프로세서들)에 의해 실행될 때, 컴퓨터로 하여금 도 1 내지 도 20 을 참조하여 설명된 하나 이상의 동작들을 수행하게 할 수도 있는 명령들 (예를 들어, 명령들 (2116)) 을 포함 (예를 들어, 저장) 할 수도 있다. 일 예로서, 메모리 (2114) 또는 프로세서 (2104) 및/또는 프로세서들 (2106) 의 하나 이상의 컴포넌트들은, 컴퓨터 (예를 들어, 프로세서 (2104) 및/또는 프로세서들 (2106) 과 같은 하나 이상의 프로세서들)에 의해 실행될 때, 컴퓨터로 하여금, 도 1 내지 도 20 을 참조하여 설명된 하나 이상의 동작들을 수행하게 하는 명령들 (예를 들어, 명령들 (2116)) 을 포함하는 비일시적 컴퓨터 판독가능 매체일 수도 있다.

특정 양태에서, 디바이스 (2100) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (2102)에 포함될 수도 있다. 특정 양태에서, 프로세서 (2104), 프로세서들 (2106), 디스플레이 제어기 (2118), 메모리 (2114), 코덱 (2108), 모뎀 (2130), 및 트랜시버 (2132) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (2102)에 포함된다. 특정 양태에서, 터치스크린 및/또는 키패드와 같은 입력 디바이스 (2124), 및 전력 공급기 (2120) 가 시스템-인-패키지 또는 시스템-온-칩 디바이스(2102)에 결합된다. 더욱이, 특정 구현에서, 도 21 에 예시된 바와 같이, 디스플레이 (2140), 입력 디바이스 (2124), 스피커(들) (126), 마이크로폰들 (102), 안테나 (2122), 및 전력 공급기 (2120) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (2102) 외부에 있다. 그러나, 디스플레이 (2140), 입력 디바이스 (2124), 스피커(들) (126), 마이크로폰들 (102), 안테나 (2122), 및 전력 공급기 (2120) 의 각각은 인터페이스 또는 제어기와 같은 시스템-인-패키지 또는 시스템-온-칩 디바이스 (2102) 의 컴포넌트에 결합될 수 있다.

디바이스(2100)는 무선 전화기, 모바일 통신 디바이스, 모바일 디바이스, 모바일 폰, 스마트폰, 셀룰러 폰, 가상 현실 헤드셋, 증강 현실 헤드셋, 혼합 현실 헤드셋, 차량(예를 들어, 자동차), 랩톱 컴퓨터, 데스크톱 컴퓨터, 컴퓨터, 태블릿 컴퓨터, 셋톱 박스, 개인 휴대 정보 단말기(PDA), 디스플레이 디바이스, 텔레비전, 게임 콘솔, 뮤직 플레이어, 라디오, 비디오 플레이어, 엔터테인먼트 유닛, 통신 디바이스, 고정 위치 데이터 유닛, 개인 미디어 플레이어, 디지털 비디오 플레이어, 디지털 비디오 디스크(DVD) 플레이어, 튜너, 카메라, 내비게이션 디바이스, 이어버드, 오디오 헤드셋(예를 들어, 헤드폰), 또는 이들의 임의의 조합을 포함할 수도 있다.

도 1 내지 도 20 을 참조하여 설명된 시스템들 및 디바이스 (2100) 의 하나 이상의 컴포넌트들에 의해 수행된 다양한 기능들은 특정 컴포넌트들 또는 모듈들에 의해 수행되는 것으로서 설명됨에 유의해야 한다. 컴포넌트들 및 모듈들의 이러한 분할은 단지 예시를 위한 것이다. 대안적인 양태에서, 특정의 컴포넌트 또는 모듈에 의해 수행되는 기능은 다수의 컴포넌트들 또는 모듈들 간에 분할될 수도 있다. 더욱이, 대안적인 양태에서, 도 1 내지 도 21 을 참조하여 설명된 2 이상의 컴포넌트들 또는 모듈들은 단일 컴포넌트 또는 모듈로 통합될 수도 있다. 도 1 내지 도 21 을 참조하여 설명된 각각의 컴포넌트 또는 모듈은 하드웨어 (예컨대, 필드-프로그래밍가능 게이트 어레이 (FPGA) 디바이스, 애플리케이션 특정 집적 회로 (ASIC), DSP, 제어기, 등등), 소프트웨어 (예컨대, 프로세서에 의해 실행가능한 명령들), 또는 이들의 임의의 조합을 사용하여 구현될 수도 있다.

설명된 구현들과 함께, 장치는 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하기 위한 수단을 포함한다. 예를 들어, 공간 오디오 데이터를 결정하기 위한 수단은 디바이스 (100), 공간 오디오 변환기 (110), 집적 회로 (602), 프로세서(들) (608), 디바이스 (2100), 프로세서 (2104), 프로세서(들) (2106), 공간 오디오 데이터를 결정하도록 구성된 하나 이상의 다른 회로들 또는 컴포넌트들, 또는 이들의 임의의 조합을 포함한다.

장치는 또한 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하기 위한 수단을 포함하고, 여기서 메트릭은 제 1 값과 제 2 값의 비교에 기초하고, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다. 예를 들어, 메트릭을 결정하기 위한 수단은 디바이스 (100), 공간-오디오 윈드 노이즈 감소 프로세서 (114), 디바이스 (200), 디바이스 (300), 집적 회로 (602), 프로세서(들) (608), 집적 회로 (702), 프로세서(들) (708), 디바이스 (2100), 프로세서 (2104), 프로세서(들) (2106), 메트릭을 결정하도록 구성된 하나 이상의 다른 회로들 또는 컴포넌트들, 또는 이들의 임의의 조합을 포함한다.

일부 구현들에서, 장치는 또한 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하기 위한 수단을 포함한다. 예를 들어, 공간 오디오 데이터를 수정하기 위한 수단은 디바이스 (100), 공간-오디오 윈드 노이즈 감소 프로세서 (114), 디바이스 (200), 디바이스 (300), 집적 회로 (602), 프로세서(들) (608), 집적 회로 (702), 프로세서(들) (708), 디바이스 (2100), 프로세서 (2104), 프로세서(들) (2106), 공간 오디오 데이터를 수정하도록 구성된 하나 이상의 다른 회로들 또는 컴포넌트들, 또는 이들의 임의의 조합을 포함한다.

당업자는 또한, 본원에 개시된 구현들과 관련하여 설명된 다양한 예시적인 논리 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 프로세서에 의해 실행되는 컴퓨터 소프트웨어, 또는 이 양자의 조합으로 구현될 수도 있음을 인식할 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들, 및 단계들이 일반적으로 그들의 기능성의 관점에서 위에서 설명되었다. 그러한 기능성이 하드웨어 또는 프로세서 실행가능한 명령들로 구현될지 여부는, 전체 시스템에 부과된 설계 제약 및 특정 애플리케이션에 의존한다. 당업자들은 각각의 특정 애플리케이션에 대해 다양한 방식들로 설명된 기능성을 구현할 수도 있으며, 이러한 구현 판정들은 본 개시의 범위로부터 벗어남을 야기하는 것으로서 해석되어서는 안된다.

본 명세서에 개시된 구현들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어에서, 프로세서에 의해 실행되는 소프트웨어 모듈에서, 또는 이들 양자의 조합에서 직접 구현될 수도 있다. 소프트웨어 모듈은 랜덤 액세스 메모리 (RAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터, 하드디스크, 착탈형 디스크, 콤팩트 디스크 판독 전용 메모리 (CD-ROM), 또는 당업계에 알려져 있는 임의의 다른 형태의 비일시적 저장 매체에 상주할 수도 있다. 예시적인 저장 매체는, 프로세서가 저장 매체로부터 정보를 판독할 수도 있고 저장 매체에 정보를 기입할 수도 있도록 프로세서에 결합된다. 다르게는, 저장 매체는 프로세서에 통합될 수도 있다. 프로세서 및 저장 매체는 ASIC (application-specific integrated circuit) 에 상주할 수도 있다. ASIC 은 컴퓨팅 디바이스 또는 사용자 단말기에 상주할 수도 있다. 대안으로, 프로세서 및 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에 별개의 컴포넌트들로서 상주할 수도 있다.

본 개시의 특정 양태들은 상호관련된 조항들의 제 1 세트에서 아래에서 설명된다:

조항 1에 따르면, 디바이스는, 적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하고; 그 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하고; 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하도록 구성된 하나 이상의 프로세서들을 포함하고, 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하고, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

조항 2는 조항 1의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하도록 추가로 구성된다.

조항 3은 조항 2의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성하고 바이노럴 오디오 출력의 주변 노이즈 억제(ambient noise suppression)를 수행하도록 추가로 구성된다.

조항 4는 조항 2의 디바이스를 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것은 윈드와 연관된 저주파수 노이즈를 감소시키기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하는 것을 포함한다.

조항 5는 조항 2의 디바이스를 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것은 공간 오디오 데이터의 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 것을 포함한다.

조항 6은 조항 1 내지 조항 5 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 것은 다수의 빔포밍된 오디오 채널들을 생성하기 위해 오디오 신호들을 공간적으로 필터링하는 것을 포함한다.

조항 7은 조항 6의 디바이스를 포함하고, 여기서 집성 신호는 다수의 빔포밍된 오디오 채널들 중 다수의 각도 오프셋 빔포밍된 오디오 채널들의 합의 신호 전력에 기초하고, 차동 신호는 다수의 각도 오프셋 빔포밍된 오디오 채널들의 차이의 신호 전력에 기초한다.

조항 8은 조항 7의 디바이스를 포함하고, 여기서 다수의 각도 오프셋 빔포밍된 오디오 채널들이 적어도 90도만큼 각도 오프셋된다.

조항 9는 조항 1 내지 조항 8 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 것은 다수의 앰비소닉스 채널들을 생성하기 위해 오디오 신호들에 기초하여 앰비소닉스 계수들을 결정하는 것을 포함한다.

조항 10은 조항 9의 디바이스를 포함하고, 여기서, 집성 신호는 다수의 앰비소닉스 채널들 중 전방향성 앰비소닉스 채널의 신호 전력에 기초하고, 차동 신호는 다수의 앰비소닉스 채널들 중 방향성 앰비소닉스 채널의 신호 전력에 기초한다.

조항 11은 조항 1 내지 조항 10 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭은 임계 주파수보다 작은 하나 이상의 주파수 대역들에 대해 결정된다.

조항 12는 조항 1 내지 조항 11 중 어느 것의 디바이스를 포함하며, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 것은 주파수들의 세트에 대한 메트릭의 주파수 특정 값들을 결정하는 것을 포함하고, 여기서 하나 이상의 프로세서들은, 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득이 감소되게 하도록 추가로 구성된다.

조항 13은 조항 12의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 이득이 하나 이상의 공간 오디오 채널들과 연관된 공간 오디오 데이터의 다수의 프레임들에 걸쳐 점진적으로 감소되게 하도록 구성된다.

조항 14는 조항 12의 디바이스를 포함하고, 여기서 이득이 적용되는 하나 이상의 공간 오디오 채널들은 전후 방향 및 상하 방향에 대응하고, 이득을 적용하는 것은 재생 동안 전후 방향 및 상하 방향에 대응하는 저대역 오디오를 감소시킨다.

조항 15는 조항 1 내지 조항 14 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 것은, 주파수 대역들의 세트의 각각의 주파수 대역에 대해, 메트릭의 대역 특정 값을 결정하는 것을 포함한다.

조항 16은 조항 15의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 메트릭의 특정한 대역 특정 값이 수용 기준을 만족시킨다는 결정에 기초하여 특정 주파수 대역에 대한 메트릭의 특정한 대역 특정 값을 수정하도록 추가로 구성된다.

조항 17은 조항 15의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 메트릭의 대역 특정 값을 결정하기 위해 메트릭의 다수의 주파수 특정 값들에 노이즈 감소 파라미터를 적용하도록 추가로 구성된다.

조항 18은 조항 15의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 주파수 대역들의 세트의 더 높은 주파수 대역의 이득 조정된 전력이 주파수 대역들의 세트의 더 낮은 주파수 대역의 이득 조정된 에너지를 초과하는 것을 방지하기 위해 메트릭의 대역 특정 값들 중 하나 이상을 조정하도록 추가로 구성된다.

조항 19는 조항 15의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하도록 추가로 구성된다.

조항 20은 조항 1 내지 조항 19 중 어느 것의 디바이스를 포함하고, 여기서 하나 이상의 프로세서들은, 공간 오디오 데이터를 결정하기 전에, 고주파 윈드 노이즈를 제거하기 위해 오디오 신호들을 프로세싱하도록 추가로 구성된다.

조항 21은 조항 1 내지 조항 20 중 어느 것의 디바이스를 포함하고, 적어도 3개의 마이크로폰을 추가로 포함하며, 여기서 적어도 3개의 마이크로폰 중 적어도 2개의 마이크로폰은 적어도 0.5 센티미터 이격된다.

조항 22는 조항 1 내지 조항 21 중 어느 것의 디바이스를 포함하고, 적어도 3개의 마이크로폰을 추가로 포함하며, 여기서 적어도 3개의 마이크로폰 중 적어도 2개의 마이크로폰은 적어도 2 센티미터 이격된다.

조항 23은 조항 1 내지 조항 22 중 어느 것의 디바이스를 포함하고, 하나 이상의 프로세서들은 모바일 통신 디바이스 내에 통합된다.

조항 24는 조항 1 내지 조항 23 중 어느 것의 디바이스를 포함하고, 하나 이상의 프로세서들은 차량 내에 통합된다.

조항 25는 조항 1 내지 조항 24 중 어느 것의 디바이스를 포함하고, 하나 이상의 프로세서들은 증강 현실 헤드셋, 혼합 현실 헤드셋, 가상 현실 헤드셋, 또는 웨어러블 디바이스 중 하나 이상 내에 통합된다.

조항 26은 조항 1 내지 조항 25 중 어느 것의 디바이스를 포함하고, 하나 이상의 프로세서들은 집적 회로에 포함된다.

조항 27에 따르면, 방법은 적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계; 그 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 단계; 및 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계를 포함하고, 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하고, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

조항 28은 조항 27의 방법을 포함하고, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 단계를 더 포함한다.

조항 29는 조항 28의 방법을 포함하고, 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성하는 단계 및 바이노럴 오디오 출력의 주변 노이즈 억제를 수행하는 단계를 더 포함한다.

조항 30은 조항 28의 방법을 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 단계는 윈드와 연관된 저주파수 노이즈를 감소시키기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하는 단계를 포함한다.

조항 31은 조항 28의 방법을 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것이 공간 오디오 데이터의 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 것을 포함한다.

조항 32는 조항 27 내지 조항 31 중 어느 것의 방법을 포함하며, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 단계는 다수의 빔포밍된 오디오 채널들을 생성하기 위해 오디오 신호들을 공간적으로 필터링하는 단계를 포함한다.

조항 33은 조항 32의 방법을 포함하고, 여기서 집성 신호는 다수의 빔포밍된 오디오 채널들 중 다수의 각도 오프셋 빔포밍된 오디오 채널들의 합의 신호 전력에 기초하고, 차동 신호는 다수의 각도 오프셋 빔포밍된 오디오 채널들의 차이의 신호 전력에 기초한다.

조항 34는 항 33의 방법을 포함하고, 여기서 다수의 각도 오프셋 빔포밍된 오디오 채널들은 적어도 90도만큼 각도 오프셋된다.

조항 35는 조항 27 내지 조항 34 중 어느 것의 방법을 포함하고, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 단계는 다수의 앰비소닉스 채널들을 생성하기 위해 오디오 신호들에 기초하여 앰비소닉스 계수들을 결정하는 단계를 포함한다.

조항 36은 조항 35의 방법을 포함하고, 여기서, 집성 신호는 다수의 앰비소닉스 채널들 중 전방향성 앰비소닉스 채널의 신호 전력에 기초하고, 차동 신호는 다수의 앰비소닉스 채널들 중 방향성 앰비소닉스 채널의 신호 전력에 기초한다.

조항 37은 조항 27 내지 조항 36 중 어느 것의 방법을 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭은 임계 주파수보다 작은 하나 이상의 주파수 대역들에 대해 결정된다.

조항 38은 조항 27 내지 조항 37 중 어느 것의 방법을 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계는 주파수들의 세트에 대한 메트릭의 주파수 특정 값들을 결정하는 단계를 포함하고, 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 단계를 더 포함한다.

조항 39는 조항 38의 방법을 포함하고, 여기서 이득은 하나 이상의 공간 오디오 채널들과 연관된 공간 오디오 데이터의 다수의 프레임들에 걸쳐 점진적으로 감소된다.

조항 40은 조항 38의 방법을 포함하고, 여기서 이득이 적용되는 하나 이상의 공간 오디오 채널들은 전후 방향 및 상하 방향에 대응하고, 이득을 적용하는 것은 재생 동안 전후 방향 및 상하 방향에 대응하는 저대역 오디오를 감소시킨다.

조항 41은 조항 27 내지 조항 40 중 어느 것의 방법을 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계는, 주파수 대역들의 세트의 각각의 주파수 대역에 대해, 메트릭의 대역 특정 값을 결정하는 단계를 포함한다.

조항 42는 조항 41의 방법을 포함하고, 메트릭의 특정한 대역 특정 값이 수용 기준을 만족시킨다고 결정하는 것에 기초하여 특정 주파수 대역에 대한 메트릭의 특정한 대역 특정 값을 수정하는 단계를 더 포함한다.

조항 43은 조항 41의 방법을 포함하고, 메트릭의 대역 특정 값을 결정하기 위해 노이즈 감소 파라미터를 메트릭의 다수의 주파수 특정 값들에 적용하는 단계를 더 포함한다.

조항 44는 조항 41의 방법을 포함하고, 주파수 대역들의 세트의 더 높은 주파수 대역의 이득 조정된 전력이 주파수 대역들의 세트의 더 낮은 주파수 대역의 이득 조정된 에너지를 초과하는 것을 방지하기 위해 메트릭의 대역 특정 값들 중 하나 이상을 조정하는 단계를 더 포함한다.

조항 45는 조항 41의 방법을 포함하고, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하는 단계를 더 포함한다.

조항 46은 조항 27 내지 조항 45 중 어느 것의 방법을 포함하고, 공간 오디오 데이터를 결정하기 전에, 고주파 윈드 노이즈를 제거하기 위해 오디오 신호들을 프로세싱하는 단계를 더 포함한다.

조항 47은 조항 27 내지 조항 46 중 어느 것의 방법을 포함하고, 여기서 적어도 3개의 마이크로폰 중 적어도 2개의 마이크로폰은 적어도 0.5 센티미터로 이격된다.

조항 48은 조항 27 내지 조항 47 중 어느 것의 방법을 포함하고, 여기서 적어도 3개의 마이크로폰 중 적어도 2개의 마이크로폰은 적어도 2 센티미터로 이격된다.

조항 49에 따르면, 디바이스는 적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하기 위한 수단, 및 그 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하기 위한 수단을 포함하고, 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하고, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

조항 50은 조항 49의 디바이스를 포함하고, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하기 위한 수단을 더 포함한다.

조항 51은 조항 50의 디바이스를 포함하고, 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성하기 위한 수단을 더 포함하고, 바이노럴 오디오 출력의 주변 노이즈 억제를 수행하기 위한 수단을 더 포함한다.

조항 52는 조항 50의 디바이스를 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것은 윈드와 연관된 저주파수 노이즈를 감소시키기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하는 것을 포함한다.

조항 53은 조항 50의 디바이스를 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것은 공간 오디오 데이터의 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 것을 포함한다.

조항 54는 조항 49 내지 조항 53 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 것은 다수의 빔포밍된 오디오 채널들을 생성하기 위해 오디오 신호들을 공간적으로 필터링하는 것을 포함한다.

조항 55는 조항 54의 디바이스를 포함하고, 여기서 집성 신호는 다수의 빔포밍된 오디오 채널들 중 다수의 각도 오프셋 빔포밍된 오디오 채널들의 합의 신호 전력에 기초하고, 차동 신호는 다수의 각도 오프셋 빔포밍된 오디오 채널들의 차이의 신호 전력에 기초한다.

조항 56은 조항 55의 디바이스를 포함하고, 여기서 다수의 각도 오프셋 빔포밍된 오디오 채널들이 적어도 90도만큼 각도 오프셋된다.

조항 57은 조항 49 내지 조항 56 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 것은 다수의 앰비소닉스 채널들을 생성하기 위해 오디오 신호들에 기초하여 앰비소닉스 계수들을 결정하는 것을 포함한다.

조항 58은 조항 57의 디바이스를 포함하고, 여기서, 집성 신호는 다수의 앰비소닉스 채널들 중 전방향성 앰비소닉스 채널의 신호 전력에 기초하고, 차동 신호는 다수의 앰비소닉스 채널들 중 방향성 앰비소닉스 채널의 신호 전력에 기초한다.

조항 59는 조항 49 내지 조항 58 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭은 임계 주파수보다 작은 하나 이상의 주파수 대역들에 대해 결정된다.

조항 60은 조항 49 내지 조항 59 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 것은 주파수들의 세트에 대한 메트릭의 주파수 특정 값들을 결정하는 것을 포함하고, 그리고 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키기 위한 수단을 더 포함한다.

조항 61은 조항 60의 디바이스를 포함하고, 여기서 이득을 감소시키기 위한 수단은 하나 이상의 공간 오디오 채널들과 연관된 공간 오디오 데이터의 다수의 프레임들에 걸쳐 이득을 점진적으로 감소시키도록 구성된다.

조항 62는 조항 60의 디바이스를 포함하고, 여기서 이득이 적용되는 하나 이상의 공간 오디오 채널들은 전후 방향 및 상하 방향에 대응하고, 이득을 적용하는 것은 재생 동안 전후 방향 및 상하 방향에 대응하는 저대역 오디오를 감소시킨다.

조항 63은 조항 49 내지 조항 62 중 어느 것의 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 것은, 주파수 대역들의 세트의 각각의 주파수 대역에 대해, 메트릭의 대역 특정 값을 결정하는 것을 포함한다.

조항 64는 조항 63의 디바이스를 포함하고, 메트릭의 특정한 대역 특정 값이 수용 기준을 만족시킨다고 결정하는 것에 기초하여 특정 주파수 대역에 대한 메트릭의 특정한 대역 특정 값을 수정하기 위한 수단을 더 포함한다.

조항 65는 조항 63의 디바이스를 포함하고, 메트릭의 대역 특정적 값을 결정하기 위해 노이즈 감소 파라미터를 메트릭의 다수의 주파수 특정적 값들에 적용하기 위한 수단을 더 포함한다.

조항 66은 조항 63의 디바이스를 포함하고, 주파수 대역들의 세트의 더 높은 주파수 대역의 이득 조정된 전력이 주파수 대역들의 세트의 더 낮은 주파수 대역의 이득 조정된 에너지를 초과하는 것을 방지하기 위해 메트릭의 대역 특정 값들 중 하나 이상을 조정하기 위한 수단을 더 포함한다.

조항 67은 조항 63의 디바이스를 포함하고, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하기 위한 수단을 더 포함한다.

조항 68은 조항 49 내지 조항 67 중 어느 것의 디바이스를 포함하고, 공간 오디오 데이터를 결정하기 전에 고주파 윈드 노이즈를 제거하기 위해 오디오 신호들을 프로세싱하기 위한 수단을 더 포함한다.

조항 69는 조항 49 내지 조항 68 중 어느 것의 디바이스를 포함하고, 적어도 3개의 마이크로폰을 추가로 포함하며, 여기서 적어도 3개의 마이크로폰 중 적어도 2개의 마이크로폰은 적어도 0.5 센티미터 이격된다.

조항 70은 조항 49 내지 조항 69 중 어느 것의 디바이스를 포함하고, 적어도 3개의 마이크로폰을 추가로 포함하며, 여기서 적어도 3개의 마이크로폰 중 적어도 2개의 마이크로폰은 적어도 2 센티미터 이격된다.

조항 71은 조항 49 내지 조항 70 중 어느 것의 디바이스를 포함하며, 여기서 공간 오디오 데이터를 결정하기 위한 수단 및 메트릭을 결정하기 위한 수단은 모바일 컴퓨팅 디바이스 내에 통합된다.

조항 72는 조항 49 내지 조항 71 중 어느 것의 디바이스를 포함하고, 여기서 공간 오디오 데이터를 결정하기 위한 수단 및 메트릭을 결정하기 위한 수단은 차량 내에 통합된다.

조항 73은 조항 49 내지 조항 72 중 어느 것의 디바이스를 포함하며, 여기서 공간 오디오 데이터를 결정하기 위한 수단 및 메트릭을 결정하기 위한 수단은 증강 현실 헤드셋, 혼합 현실 헤드셋, 가상 현실 헤드셋, 또는 웨어러블 디바이스 중 하나 이상 내에 통합된다.

조항 74는 조항 49 내지 조항 73 중 어느 것의 디바이스를 포함하며, 여기서 공간 오디오 데이터를 결정하기 위한 수단 및 메트릭을 결정하기 위한 수단은 집적 회로에 포함된다.

조항 75에 따르면, 컴퓨터 판독가능 저장 디바이스는 하나 이상의 프로세서들로 하여금, 적어도 3 개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하게 하고, 그 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하게 하도록 하나 이상의 프로세서들에 의해 실행가능한 명령들을 저장하고, 그 메트릭은 제 1 값과 제 2 값의 비교에 기초하고, 여기서 제 1 값은 공간 오디오 데이터에 기초한 집성 신호에 대응하고, 제 2 값은 공간 오디오 데이터에 기초한 차동 신호에 대응한다.

조항 76은 조항 75의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하도록 추가로 실행가능하다.

조항 77은 조항 76의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성하고 바이노럴 오디오 출력의 주변 노이즈 억제를 수행하도록 추가로 실행가능하다.

조항 78은 조항 76의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것은 윈드와 연관된 저주파수 노이즈를 감소시키기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하는 것을 포함한다.

조항 79는 조항 76의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 공간 오디오 데이터를 수정하는 것은 공간 오디오 데이터의 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 것을 포함한다.

조항 80은 조항 75 내지 조항 79 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하며, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 것은 다수의 빔포밍된 오디오 채널들을 생성하기 위해 오디오 신호들을 공간적으로 필터링하는 것을 포함한다.

조항 81은 조항 80의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 집성 신호는 다수의 빔포밍된 오디오 채널들 중 다수의 각도 오프셋 빔포밍된 오디오 채널들의 합의 신호 전력에 기초하고, 차동 신호는 다수의 각도 오프셋 빔포밍된 오디오 채널들의 차이의 신호 전력에 기초한다.

조항 82는 조항 81의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 다수의 각도 오프셋 빔포밍된 오디오 채널들은 적어도 90도만큼 각도 오프셋된다.

조항 83은 조항 75 내지 조항 82 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 것은 다수의 앰비소닉스 채널들을 생성하기 위해 오디오 신호들에 기초하여 앰비소닉스 계수들을 결정하는 것을 포함한다.

조항 84는 조항 83의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서, 집성 신호는 다중 앰비소닉스 채널들 중 전방향성 앰비소닉스 채널의 신호 전력에 기초하고, 차동 신호는 다중 앰비소닉스 채널들 중 방향성 앰비소닉스 채널의 신호 전력에 기초한다.

조항 85는 조항 75 내지 조항 84 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭은 임계 주파수보다 작은 하나 이상의 주파수 대역들에 대해 결정된다.

조항 86은 조항 75 내지 조항 85 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 것은 주파수들의 세트에 대한 메트릭의 주파수 특정 값들을 결정하는 것을 포함하고, 여기서 명령들은 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키도록 추가로 실행가능하다.

조항 87은 조항 86의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 이득은 하나 이상의 공간 오디오 채널들과 연관된 공간 오디오 데이터의 다수의 프레임들에 걸쳐 점진적으로 감소된다.

조항 88은 조항 86의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 이득이 적용되는 하나 이상의 공간 오디오 채널들은 전후 방향 및 상하 방향에 대응하고, 이득을 적용하는 것은 재생 동안 전후 방향 및 상하 방향에 대응하는 저대역 오디오를 감소시킨다.

조항 89는 조항 75 내지 조항 88 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 것은, 주파수 대역들의 세트의 각각의 주파수 대역에 대해, 메트릭의 대역 특정 값을 결정하는 것을 포함한다.

조항 90은 조항 89의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은 메트릭의 특정한 대역 특정 값이 수용 기준을 만족한다는 결정에 기초하여 특정 주파수 대역에 대한 메트릭의 특정한 대역 특정 값을 수정하도록 추가로 실행가능하다.

조항 91은 조항 89의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은 메트릭의 대역 특정 값을 결정하기 위해 노이즈 감소 파라미터를 메트릭의 다수의 주파수 특정 값들에 적용하도록 추가로 실행가능하다.

조항 92는 조항 89의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은 주파수 대역들의 세트의 더 높은 주파수 대역의 이득 조정된 전력이 주파수 대역들의 세트의 더 낮은 주파수 대역의 이득 조정된 전력을 초과하는 것을 방지하기 위해 메트릭의 대역 특정 값들 중 하나 이상을 조정하도록 추가로 실행가능하다.

조항 93은 조항 89의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 메트릭에 기초하여 필터 파라미터들을 사용하여 공간 오디오 데이터를 필터링하도록 추가로 실행가능하다.

조항 94는 조항 75 내지 조항 93 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하고, 여기서 명령들은, 공간 오디오 데이터를 결정하기 전에, 고주파 윈드 노이즈를 제거하기 위해 오디오 신호들을 프로세싱하도록 추가로 실행가능하다.

조항 95는 조항 75 내지 조항 94 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하며, 여기서 적어도 3개의 마이크로폰들 중 적어도 2개의 마이크로폰들은 적어도 0.5 센티미터로 이격된다.

조항 96는 조항 75 내지 조항 95 중 어느 것의 컴퓨터 판독가능 저장 디바이스를 포함하며, 여기서 적어도 3개의 마이크로폰들 중 적어도 2개의 마이크로폰들은 적어도 2 센티미터로 이격된다.

개시된 실시양태들의 상기 설명은 당업자로 하여금 개시된 실시양태들을 실시 또는 이용할 수 있게 하기 위해 제공된다. 이들 양태들에 대한 다양한 변형들은 당업자들에게 명백할 것이며, 본원에서 정의된 원리들은 본 개시의 범위로부터 일탈함이 없이 다른 양태들에 적용될 수도 있다. 따라서, 본 개시는 본원에서 나타낸 양태들에 한정하려는 것이 아니라, 다음 청구항들에 의해 정의되는 바와 같은 원리들 및 신규한 특징들과 가능한 부합하는 최광의의 범위를 부여하려는 것이다.

Claims

디바이스로서,
하나 이상의 프로세서들을 포함하고,
상기 하나 이상의 프로세서들은:
적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하고;
상기 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하며; 그리고
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하도록
구성되고,
상기 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 상기 제 1 값은 상기 공간 오디오 데이터에 기초한 집성 신호에 대응하고 상기 제 2 값은 상기 공간 오디오 데이터에 기초한 차동 신호에 대응하는, 디바이스.
제 1 항에 있어서,
상기 하나 이상의 프로세서들은 또한, 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하도록 구성되는, 디바이스.
제 2 항에 있어서,
상기 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하는 것은, 윈드와 연관된 저주파수 노이즈를 감소시키기 위해 상기 메트릭에 기초하여 필터 파라미터들을 사용하여 상기 공간 오디오 데이터를 필터링하는 것을 포함하는, 디바이스.
제 2 항에 있어서,
상기 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하는 것은, 상기 공간 오디오 데이터의 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 것을 포함하는, 디바이스.
제 1 항에 있어서,
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 상기 메트릭을 결정하는 것은, 주파수들의 세트에 대한 상기 메트릭의 주파수 특정 값들을 결정하는 것을 포함하고,
상기 하나 이상의 프로세서들은 또한, 상기 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득이 감소되게 하도록 구성되는, 디바이스.
제 5 항에 있어서,
상기 이득이 적용되는 상기 하나 이상의 공간 오디오 채널들은 전후 방향 및 상하 방향에 대응하고, 상기 이득을 적용하는 것은 상기 전후 방향 및 상기 상하 방향에 대응하는 오디오 출력을 감소시키는, 디바이스.
제 1 항에 있어서,
상기 적어도 3개의 마이크로폰들을 추가로 포함하고, 상기 적어도 3개의 마이크로폰들 중 적어도 2개의 마이크로폰들은 적어도 0.5 센티미터로 이격되는, 디바이스.
제 1 항에 있어서,
상기 적어도 3개의 마이크로폰들을 추가로 포함하고, 상기 적어도 3개의 마이크로폰들 중 적어도 2개의 마이크로폰들은 적어도 2 센티미터로 이격되는, 디바이스.
제 1 항에 있어서,
상기 하나 이상의 프로세서들은 모바일 컴퓨팅 디바이스 내에 통합되는, 디바이스.
제 1 항에 있어서,
상기 하나 이상의 프로세서들은 차량 내에 통합되는, 디바이스.
제 1 항에 있어서,
상기 하나 이상의 프로세서들은 증강 현실 헤드셋, 혼합 현실 헤드셋, 가상 현실 헤드셋, 또는 웨어러블 디바이스 중 하나 이상 내에 통합되는, 디바이스.
제 1 항에 있어서,
상기 하나 이상의 프로세서들은 집적 회로에 포함되는, 디바이스.
방법으로서,
적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들을 획득하는 단계;
상기 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하는 단계; 및
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하는 단계를 포함하고,
상기 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 상기 제 1 값은 상기 공간 오디오 데이터에 기초한 집성 신호에 대응하고 상기 제 2 값은 상기 공간 오디오 데이터에 기초한 차동 신호에 대응하는, 방법.
제 13 항에 있어서,
감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하는 단계를 더 포함하는, 방법.
제 14 항에 있어서,
상기 감소된 윈드 노이즈 오디오 데이터에 기초하여 바이노럴 오디오 출력을 생성하는 단계 및 상기 바이노럴 오디오 출력의 주변 노이즈 억제를 수행하는 단계를 더 포함하는, 방법.
제 14 항에 있어서,
상기 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하는 단계는, 윈드와 연관된 저주파수 노이즈를 감소시키기 위해 상기 메트릭에 기초하여 필터 파라미터들을 사용하여 상기 공간 오디오 데이터를 필터링하는 단계를 포함하는, 방법.
제 14 항에 있어서,
상기 감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하는 단계는, 상기 공간 오디오 데이터의 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 단계를 포함하는, 방법.
제 13 항에 있어서,
상기 오디오 신호들에 기초하여 상기 공간 오디오 데이터를 결정하는 단계는, 다수의 빔포밍된 오디오 채널들을 생성하기 위해 상기 오디오 신호들을 공간적으로 필터링하는 단계를 포함하는, 방법.
제 18 항에 있어서,
상기 집성 신호는 상기 다수의 빔포밍된 오디오 채널들 중 다수의 각도 오프셋 빔포밍된 오디오 채널들의 합의 신호 전력에 기초하고, 상기 차동 신호는 상기 다수의 각도 오프셋 빔포밍된 오디오 채널들의 차이의 신호 전력에 기초하는, 방법.
제 19 항에 있어서,
상기 다수의 각도 오프셋 빔포밍된 오디오 채널들은 적어도 90도만큼 각도 오프셋되는, 방법.
제 13 항에 있어서,
상기 오디오 신호들에 기초하여 상기 공간 오디오 데이터를 결정하는 단계는, 다수의 앰비소닉스 채널들을 생성하기 위해 상기 오디오 신호들에 기초하여 앰비소닉스 계수들을 결정하는 단계를 포함하는, 방법.
제 21 항에 있어서,
상기 집성 신호는 상기 다수의 앰비소닉스 채널들 중 전방향성 앰비소닉스 채널의 신호 전력에 기초하고, 상기 차동 신호는 상기 다수의 앰비소닉스 채널들 중 방향성 앰비소닉스 채널의 신호 전력에 기초하는, 방법.
제 13 항에 있어서,
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 상기 메트릭을 결정하는 단계는, 주파수들의 세트에 대한 상기 메트릭의 주파수 특정 값들을 결정하는 단계를 포함하고,
상기 방법은, 상기 주파수 특정 값들 중 적어도 하나가 윈드 검출 기준을 만족시킨다는 결정에 기초하여 하나 이상의 공간 오디오 채널들에 적용되는 이득을 감소시키는 단계를 더 포함하는, 방법.
제 13 항에 있어서,
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 상기 메트릭을 결정하는 단계는, 주파수 대역들의 세트의 각각의 주파수 대역에 대해, 상기 메트릭의 대역 특정 값을 결정하는 단계를 포함하는, 방법.
제 24 항에 있어서,
상기 메트릭의 특정한 대역 특정 값이 수용 기준을 만족시킨다는 결정에 기초하여 특정 주파수 대역에 대한 상기 메트릭의 상기 특정한 대역 특정 값을 수정하는 단계; 및
상기 주파수 대역들의 세트의 더 높은 주파수 대역의 이득 조정된 전력이 상기 주파수 대역들의 세트의 더 낮은 주파수 대역의 이득 조정된 에너지를 초과하는 것을 방지하기 위해 상기 메트릭의 상기 대역 특정 값들 중 하나 이상을 조정하는 단계를 더 포함하는, 방법.
제 24 항에 있어서,
감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 필터 파라미터들을 사용하여 상기 공간 오디오 데이터를 필터링하는 단계를 더 포함하는, 방법.
제 13 항에 있어서,
상기 공간 오디오 데이터를 결정하기 전에, 고주파수 윈드 노이즈를 제거하기 위해 상기 오디오 신호들을 프로세싱하는 단계를 더 포함하는, 방법.
디바이스로서,
적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하기 위한 수단; 및
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하기 위한 수단을 포함하고,
상기 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 상기 제 1 값은 상기 공간 오디오 데이터에 기초한 집성 신호에 대응하고 상기 제 2 값은 상기 공간 오디오 데이터에 기초한 차동 신호에 대응하는, 디바이스.
제 28 항에 있어서,
감소된 윈드 노이즈 오디오 데이터를 생성하기 위해 상기 메트릭에 기초하여 상기 공간 오디오 데이터를 수정하기 위한 수단을 더 포함하는, 디바이스.
명령들을 저장한 컴퓨터 판독가능 저장 디바이스로서,
상기 명령들은, 하나 이상의 프로세서들로 하여금:
적어도 3개의 마이크로폰들에 의해 캡처된 사운드를 나타내는 오디오 신호들에 기초하여 공간 오디오 데이터를 결정하게 하고; 그리고
상기 오디오 신호들에서의 윈드 노이즈를 나타내는 메트릭을 결정하게 하도록
상기 하나 이상의 프로세서들에 의해 실행가능하고,
상기 메트릭은 제 1 값과 제 2 값의 비교에 기초하며, 상기 제 1 값은 상기 공간 오디오 데이터에 기초한 집성 신호에 대응하고 상기 제 2 값은 상기 공간 오디오 데이터에 기초한 차동 신호에 대응하는, 컴퓨터 판독가능 저장 디바이스.