KR20200099093A - 비선형 잡음 감소 시스템 - Google Patents

비선형 잡음 감소 시스템 Download PDF

Info

Publication number
KR20200099093A
KR20200099093A KR1020200015907A KR20200015907A KR20200099093A KR 20200099093 A KR20200099093 A KR 20200099093A KR 1020200015907 A KR1020200015907 A KR 1020200015907A KR 20200015907 A KR20200015907 A KR 20200015907A KR 20200099093 A KR20200099093 A KR 20200099093A
Authority
KR
South Korea
Prior art keywords
signal
subband
noise reduction
energy
signals
Prior art date
Application number
KR1020200015907A
Other languages
English (en)
Inventor
제임스 램브릭
Original Assignee
하만인터내셔날인더스트리스인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 하만인터내셔날인더스트리스인코포레이티드 filed Critical 하만인터내셔날인더스트리스인코포레이티드
Publication of KR20200099093A publication Critical patent/KR20200099093A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Abstract

본 개시의 실시예들은 오디오 신호를 서브 대역 신호들의 세트로 분해시키는 단계의 방법을 제시하며, 각 신호 에너지 값은 서브 대역 신호와 관련된다. 상기 방법은 또한 적어도 하나의 서브 대역 신호에 기초하여 잡음 감소 임계치를 생성하는 단계, 및 각 서브 대역 신호에 대해, 관련된 신호 에너지 값가 잡음 감소 임계치를 비교하는 단계를 포함한다. 적어도 하나의 서브 대역 신호가 잡음 감소 임계치 미만의 신호 에너지 값과 관련된다는 결정에 기초하여, 상기 방법은 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 적어도 하나의 서브 대역 신호를 감쇠시키는 단계를 포함한다. 상기 방법은 또한 출력 오디오 신호를 생성하기 위해 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키는 단계를 포함한다.

Description

비선형 잡음 감소 시스템{NONLINEAR NOISE REDUCTION SYSTEM}
본 개시의 실시예들은 일반적으로 오디오 시스템에 관한 것으로, 보다 구체적으로 비선형 잡음 감소 시스템에 관한 것이다.
다양한 자동 음성 인식(automatic speech recognition; ASR) 시스템들은 시스템이 오디오 신호에 포함된 언어 콘텐트를 인식하는데 사용할 수 있는 오디오 신호의 컴포넌트들을 식별하기 위해 여러 필터링 및 추출 기술들을 사용한다. ASR 시스템들은 오디오 신호에 하나 이상의 필터들을 적용하여 수신된 오디오 신호로부터 특징들을 추출한다. 그런 다음, ASR 시스템들은 말했을 것으로 예상되는 후보 단어들을 결정하기 위해 추출된 특징들에 다양한 모델들(예를 들어, 음향 모델, 언어 모델 등)을 적용한다. 일반적으로, ASR 시스템은 입력 오디오 신호로부터 환경 잡음을 제거하기 위해 잡음 감소 시스템들을 사용할 수 있으며, 이는 입력 오디오 신호로부터 후보 단어들을 식별할 때 정확성을 증가시킨다.
음성 인식 기술들과 함께 종래 잡음 감소 시스템들을 사용하는 한 가지 단점은 잡음 감소 시스템을 통해 오디오 신호들을 처리하는 것은 일반적으로 오디오 신호에 포함된 단어들을 식별하는 것의 정확성을 저하시키다는 점이다. 예를 들어, 종래 잡음 감소 기술들을 통해 생성된 처리된 오디오 신호는 아티팩트(artifacts)를 포함할 수 있을 것이며, 이는 ASR 시스템이 "거짓 긍정(false positive)" 후보 단어들을 표현할 수 있게 할 수 있을 것이다. 추가로 또는 대안으로, 처리된 오디오 신호는 오디오 스펙트럼의 일부들을 제거할 수 있을 것이다. 오디오 스펙트럼의 일부분들의 제거는 ASR 시스템이 처리된 오디오 신호의 적용 가능한 일부분들을 음성(speech)으로 식별하는 것을 방지할 수 있을 것이다. 두 경우 모두에서, ASR 시스템은 처리된 오디오 신호에 포함된 단어들을 정확하게 식별할 수 없다.
상기의 측면에서, 음성 인식 시스템에 의해 처리된 오디오 신호에서 잡음을 감소시키기 위한 보다 효율적인 기술들이 유용할 것이다.
본 개시의 실시예들은 오디오 신호에서 잡음을 감소시키기 위한 방법을 제시한다. 상기 방법은 제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키는 단계, 및 제1 신호 에너지 값들의 세트를 검출하는 단계를 포함하며, 제1 신호 에너지 값들의 세트에 포함된 각 신호 에너지 값은 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련된다. 상기 방법은 또한 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감속 임계치를 생성하는 단계를 포함한다. 상기 방법은 또한 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 신호 에너지 값을 제1 잡음 감소 임계치와 비교하는 단계를 포함한다. 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 제1 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 상기 방법은 또한 제1 감쇠 서브 대역 신호들의 세트를 생성하기 위해 적어도 하나의 서브 대역 신호를 감쇠시키는 단계를 포함한다. 상기 방법은 또한 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호와 결합시키는 단계를 포함한다.
추가 실시예들은, 다른 것들 중에서도, 상기 제시된 방법들의 양태들을 구현하는 시스템 및 컴퓨터 판독 가능 저장 매체를 제공한다.
개시된 기술들의 적어도 하나의 기술적 이점은 잡음 감소 시스템이 다른 오디오 처리 시스템들에 의해 또한 사용되는 하나 이상의 필터들을 사용하여 오디오 신호에 포함된 잡음 요소들(noise elements)을 줄일 수 있다는 점이다. 잡음 감소 시스템은 따라서 다른 오디오 처리 시스템들이 오디오 신호의 다른 부분들을 저하시키지 않고 오디오 신호를 보다 효율적으로 처리할 수 있도록 오디오 신호로부터 효율적으로 잡음 요소들을 제거할 수 있다.
다양한 실시예들의 상기 언급된 특징들이 상세하게 이해될 수 있는 방식으로, 상기에 간단히 요약된 발명 컨셉들의 보다 특정한 설명은 다양한 실시예들에 참조하여 이루어질 수 있으며, 그 일부는 첨부된 도면들에서 예시된다. 그러나, 첨부된 도면들은 본 발명 컨셉들의 일반적인 실시예들만을 예시하므로, 어떠한 방식으로도 범위를 제한하는 것으로 간주하여서는 안되며, 다른 동등하게 효과적인 실시예들이 있다는 것에 유의해야 한다.
도 1은 본 개시의 하나 이상의 양태들을 구형하도록 구성된 잡음 감소 시스템의 블록도를 예시한다.
도 2는 본 개시의 다양한 실시예들에 따른, 도 1의 잡음 감소 시스템을 통해 합성 출력 오디오 신호를 생성하는 잡음 감소 어플리케이션의 블록도를 예시한다.
도 3은 본 개시의 다양한 실시예들에 따른, 입력 오디오 신호를 필터링하기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다.
도 4는 본 개시의 다양한 실시예들에 따른, 필터링된 오디오 신호 일부의 에너지를 결정하기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다.
도 5는 본 개시의 다양한 실시예들에 따른, 필터링된 오디오 신호를 감쇠시키기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다.
도 6은 본 개시의 다양한 실시예들에 따른, 합성 출력 오디오 신호를 생성하기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다.
도 7은 본 개시의 다양한 실시예들에 따른, 도 1의 잡음 감소 시스템을 통해 합성 출력 오디오 신호를 생성하는 방법 단계들의 흐름도이다.
다음의 설명에서, 많은 특정 세부사항들이 다양한 실시예들의 보다 완전한 이해를 제공하기 위해 제시된다. 그러나, 하나 이상의 이러한 특정 세부사항들 없이 본 발명 컨셉들이 실시될 수 있다는 것은 당업자들에게 명백할 것이다.
도 1은 본 개시의 하나 이상의 양태들을 구현하도록 구성된 잡음 감소 시스템의 블록도를 예시한다. 잡음 감소 시스템(100)은 컴퓨팅 장치(110) 및 하나 이상의 입력/출력(I/O) 장치들(114)를 포함한다. 컴퓨팅 장치(110)는 처리 유닛(112) 및 메모리(116)를 포함한다. 메모리(116)는 잡음 감소 어플리케이션(162) 및 데이터 저장 저장소(164)를 저장한다.
동작 시, 처리 유닛(112)은 입력 오디오 신호(130)를 수신한다. 처리 유닛(112)은 입력 오디오 신호(130)에 포함된 잡음 요소들을 제거하고 출력 오디오 신호(140)를 합성하기 위해 잡음 감소 어플리케이션(162)을 실행시킨다. 예를 들어, 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)의 일부를 필터링된 신호들의 세트로 분해시키는 필터 뱅크를 사용할 수 있을 것이다. 필터링된 신호들의 세트는 입력 오디오 신호(130)의 하나 이상의 컴포넌트들과 관련된 서브 대역 신호들의 세트를 포함한다. 그런 다음, 잡음 감소 어플리케이션(162)은 필터링된 신호들의 세트를 분석하고 잡음 요소들을 가지는 필터링된 신호들의 서브셋을 감쇠시킬 수 있을 것이다. 잡음 감소 어플리케이션(162)은 감쇠된 필터링된 신호들의 서브셋을 포함하는 출력 오디오 신호(140)를 합성할 때, 잡음 요소들은 출력 오디오 신호(140)에서 감소되고/되거나 또는 제거된다. 일부 실시예들에서, 필터 뱅크는 하나 이상의 음성 인식 시스템들에 의해 사용된 필터 뱅크에 대응될 수 있다. 이러한 경우, 입력 오디오 신호(130)에 포함된 하나 이상의 음성 요소들은 상당한 변경 및/또는 감쇠 없이 출력 오디오 신호(140)에 포함될 수 있다.
상기에 언급된 바와 같이, 컴퓨팅 장치(110)는 처리 유닛(112) 및 메모리(116)를 포함할 수 있다. 컴퓨팅 장치(110)는 시스템-온-칩(SoC)과 같은 하나 이상의 처리 유닛들(112), 또는 태블릿 컴퓨터, 모바일 폰, 미디어 플레이어 등과 같은 모바일 컴퓨팅 장치를 포함하는 장치일 수 있다. 일반적으로, 컴퓨팅 장치(110)는 잡음 감소 시스템(100)의 전체 동작을 조정하도록 구성될 수 있다. 본원에 개시된 실시예들은 컴퓨팅 장치(110)를 통해 잡음 감소 시스템(100)의 기능성을 구현하도록 구성된 임의의 기술적으로 실현 가능한 시스템을 고려한다.
메모리(116)는 메모리 모듈 또는 메모리 모듈들의 집합을 포함할 수 있다. 메모리(116) 내의 잡음 감소 어플리케이션(162)은 컴퓨팅 장치(110)의 전체 기능을 구현하고, 이에 따라 잡음 감소 시스템(100)을 전체적으로 조정하기 위해 처리 유닛(112)에 의해 실행될 수 있다.
처리 유닛(112)은 중앙 처리 유닛(CPU), 디지털 신호 처리 유닛(DSP), 마이크로프로세서, 주문형 집적 회로(ASIC), 신경망 처리 유닛(NPU), 그래픽 처리 유닛(GPU), 필드 프로그램 가능 게이트 어레이(FPGA) 등을 포함할 수 있다. 일부 실시예들에서, 처리 유닛(112)은 출력 오디오 신호(140)와 하나 이상의 잡음 요소들을 합성하기 위해 잡음 감소 어플리케이션(162)을 실행하도록 구성될 수 있다.
다양한 실시예들에서, 잡음 감소 어플리케이션(162)은 입력 오디오 신호를 필터링된 신호들의 세트로 분해시킬 수 있다. 잡음 감소 어플리케이션(162)은 각 필터링된 신호와 관련된 신호 에너지를 분석하고 검출된 신호 에너지들에 기초하여 잡음 임계치를 조정할 수 있다. 그런 다음, 잡음 감소 어플리케이션(162)은 조정된 잡음 임계치 미만의 신호 에너지들을 갖는 필터링된 신호들의 서브셋을 감쇠시킬 수 있다. 이러한 필터링된 신호들의 서브셋은 잡음 요소들과 관련된 신호 에너지를 갖는다. 잡음 감소 어플리케이션(162)이 출력 오디오 신호(140)를 합성할 때, 잡음 요소들은 감쇠로 인해 제거된다. 일부 실시예들에서, 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)를 연속적으로 수신 및 처리할 수 있다. 예를 들어, 잡음 감소 어플리케이션(162)은 실시간으로 입력 오디오 신호(130)을 수신하고 실시간으로 입력 오디오 신호를 처리할 수 있다. 이러한 경우, 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)를 개별 시간 슬라이스들(separate time slices)로 분리하고 입력 오디오 신호(130)의 하나 이상의 시간 슬라이스들을 연속적으로 처리할 수 있다.
데이터 저장소(164)는 잡음 감소 시스템(100)의 동작을 조정하기 위해 처리 유닛(112)에 의해 검색된 값들 및 다른 데이터를 저장할 수 있다. 동작 동안, 처리 유닛(112)은 데이터 저장소(164)에 값들을 저장하고/하거나 데이터 저장소(164)에 저장된 값들을 검색하도록 구성될 수 있다. 예를 들어, 데이터 저장소(164)는 잡음 임계치들, 검출된 에너지 값들, 필터링된 신호들, 감쇠된 필터링된 신호들, 에너지 차이들, 임계 표시들 등을 저장할 수 있을 것이다.
I/O 장치(들)(114)은 디스플레이 스크린, 라우드스피커들 등과 같은 출력을 제공할 수 있는 장치들 외에, 키보드, 마우스, 터치-감지 스크린, 마이크로폰 등과 같은 입력을 수신할 수 있는 장치들을 포함할 수 있다. I/O 장치들(114) 중 하나 이상은 컴퓨팅 장치(110)에 통합될 수 있거나, 컴퓨팅 장치(110) 외부에 있을 수 있다. 다양한 실시예들에서, I/O 장치(들)(114)은 잡음 감소 어플리케이션(162)으로부터 수신된 출력 오디오 신호(140)를 재생하는 오디오 출력 장치를 포함한다.
일부 실시예들에서, I/O 장치(114)는 출력 오디오 신호(140)를 다른 시스템으로 전송할 수 있다. 예를 들어, I/O 장치(114)는 출력 오디오 신호(140)를 자동 음성 인식(ARS) 시스템, 등화 시스템(equalization system) 및/또는 오디오 압축 시스템과 같은 보조 시스템(secondary system)에 의해 사용된 필터 뱅크로 전송할 수 있다. 이런 경우, 보조 시스템은 잡음 요소들이 제거되어 출력 오디오 신호(140)를 보다 효과적으로 및/또는 보다 정확하게 처리할 수 있다.
도 2는 본 개시의 다양한 실시예들에 따른, 도 1의 잡음 감소 시스템을 통해 합성 출력 오디오 신호를 생성하는 잡음 감소 어플리케이션(162)의 블록도를 예시한다. 도시된 바와 같이, 잡음 감소 어플리케이션(162)은 오디오 필터링 컴포넌트(210), 신호 에너지 검출 컴포넌트(222), 에너지 차이 검출 컴포넌트(224), 잡음 임계치 구성 컴포넌트(230), 에너지 임계치 결정 컴포넌트(236), 신호 감쇠 컴포넌트(240) 및 신호 결합기 컴포넌트(250)를 포함한다.
동작 동안, 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)를 수신한다. 입력 오디오 신호(130)는 하나 이상의 음성 요소들 및 하나 이상의 잡음 요소들을 포함한다. 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)를 분석하고 출력 오디오 신호(140)를 합성한다. 출력 오디오 신호(140)에는 하나 이상의 잡음 요소들이 제거 및/또는 감쇠되어 있다. 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)의 음성 부분들과 관련된 에너지 값들을 계산하고 계산된 에너지 값들에 기초하여 출력 오디오 신호(140)를 합성하는 하드웨어 및/또는 소프트웨어를 포함한다.
오디오 필터링 컴포넌트(210)는 잡음 감소 시스템(100)을 위한 프론트-엔드를 포함한다. 오디오 필터링 컴포넌트(210)는 필터링된 신호들(212)(예를 들어, 212-1, 212-2 등)의 세트를 생성하기 위해 입력 오디오 신호(130)를 수신 및 분해한다. 필터링된 신호들(212)의 세트는 입력 오디오 신호(130)의 컴포넌트들과 관련된 서브 대역 신호들의 세트를 포함한다. 일부 실시예들에서, 오디오 필터링 컴포넌트(210)는 하나 이상의 아날로그-대-디지털(A/D) 컨버터들, 하나 이상의 변환들 및 둘 이상의 필터 뱅크를 포함한다. 예를 들어, 입력 오디오 신호(130)는 시간 도메인 신호일 수 있을 것이다. 이런 경우, 오디오 필터링 컴포넌트(210)에 포함된 하나 이상의 변환들은 입력 오디오 신호(130)를 주파수-도메인 신호로 변환할 것이다. 추가로 또는 대안으로, 입력 오디오 신호(130)가 아날로그 신호일 때, 하나 이상의 A/D 변환기들은 입력 오디오 신호(130)를 디지털 신호로 변환할 수 있다. 일부 실시예들에서, 입력 오디오 신호(130)는 연속적인 오디오 신호일 수 있다. 이런 경우, 잡음 감소 어플리케이션(162)은 특정 시간 슬라이스에 대응하는 입력 오디오 신호(130)의 부분들을 수신할 수 있다. 예를 들어, 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)의 2초 시간 슬라이스들을 연속적으로 수신할 수 있을 것이다. 그런 다음, 잡음 감소 어플리케이션(162)은 출력 오디오 신호(140)를 각각이 고정된 지속시간(예를 들어, 2초 길이)을 갖는 일련의 오디오 신호들로 합성할 수 있을 것이다.
오디오 필터링 컴포넌트(210)는 입력 오디오 신호(130)를 필터링된 신호들(212)의 세트로 분해시키는 필터 뱅크를 포함한다. 필터링된 신호들(212)의 세트는 입력 오디오 신호(130)의 컴포넌트들과 관련된 서브 대역 신호들의 세트를 포함한다. 예를 들어, 오디오 필터링 컴포넌트(210)는 3 개의 필터들의 필터 뱅크를 포함할 수 있을 것이다. 필터 뱅크는 입력 오디오 신호(130)를 입력 오디오 신호(130)의 주파수 서브 대역들에 대응되는 필터링된 신호들(212-1, 212-2, 212-3)의 세트로 분해시킬 수 있을 것이다. 예를 들어, 필터 뱅크는 20개의 4차 대역통과 필터 세트와 같은 정해진 수의 n차 필터들을 포함할 수 있다.
추가로 또는 대안으로, 필터 뱅크에 포함된 정해진 수의 필터들은 하나 이상의 다른 오디오 처리 시스템들에 의해 사용된 정해진 수의 필터들에 대응될 수 있다. 예를 들어, 오디오 필터링 컴포넌트(210)에 포함된 필터 뱅크는 자동 음성 인식 시스템, 등가 시스템 및/또는 오디오 압축 시스템에 의해 사용된 필터 뱅크에 대응될 수 있을 것이다. 오디오 필터링 컴포넌트(210)에 포함된 필터 뱅크가 다른 시스템에 의해 사용될 필터 뱅크에 대응될 때, 오디오 필터링 컴포넌트(210)는 하나 이상의 다른 시스템들로부터 필터 동작 특성들(예를 들어, 중심 주파수, 이득, Q 팩터 등)을 검색할 수 있다. 예를 들어, ASR 시스템 및 잡음 감소 시스템(100)이 각각 멜(mel) 필터 뱅크를 사용할 때, 잡음 감소 어플리케이션(162)은 ASR 시스템으로부터 각 필터들의 주파수 범위들을 정의하는 MFCC(mel-frequency cepstral coefficient)와 같은 필터 특성들을 검색할 수 있을 것이다. 잡음 감소 어플리케이션(162)은 그런 다음 검색된 특성들을 포함하는 필터 뱅크를 구성할 수 있을 것이다.
신호 에너지 검출 컴포넌트(222)는 필터링된 신호들(212)의 세트에 포함된 각 필터링된 신호(212-1)에 대한 신호 에너지 값을 계산한다. 신호 에너지 검출 컴포넌트(222)는 오디오 필터링 컴포넌트(210)으로부터 필터링된 신호들(212)의 세트를 수신하고 검출된 에너지 값들(223)(예를 들어, 223-1, 223-2 등)의 해당 세트를 결정한다. 예를 들어, 신호 에너지 검출 컴포넌트(222)는 소정의 시간 스플라이스(time splice)에 대해 필터링된 신호(212-1)를 수신하고, 평균 전력과 같은 신호 에너지 값을 계산할 수 있을 것이다. 다른 예에서, 신호 에너지 검출 컴포넌트(222)는 소정의 시간 슬라이스 내에서 필터링된 신호(212-1)에 대한 제곱 평균 제곱근(root-mean-square; RMS) 값을 계산할 수 있을 것이다.
일부 실시예들에서, 신호 에너지 검출 컴포넌트(222)는 상이한 주파수 범위들에 대한 상이한 시간 상수를 사용할 수 있다. 예를 들어, 신호 에너지 검출 컴포넌트(222)는 오디오 필터링 컴포넌트(210)의 필터 뱅크의 각 필터와 관련된 상이한 시간 상수를 사용할 수 있을 것이다. 추가로 또는 대안으로, 신호 에너지 검출 컴포넌트(222)는 필터링된 신호(212-1)에 대한 복수의 에너지 값들(223)을 검출할 수 있다. 예를 들어, 신호 에너지 검출 컴포넌트(222)는 다양한 시간 범위들 동안 필터링된 신호(212-1)에 대한 복수의 RMS 값들을 연속적으로 계산할 수 있을 것이다. 이런 경우, 신호 에너지 검출 컴포넌트(222)는 최하위 RMS 값을 저장하고, 검출된 에너지 값(223-1)으로서 최하위 RMS 값을 에너지 차이 검출 컴포넌트(224)로 전송한다.
에너지 차이 검출 컴포넌트(224)는 신호 에너지 검출 컴포넌트(222)로부터 검출된 에너지 값들(223)의 세트를 수신하고, 검출된 에너지 값들(223)의 세트를 비교하는 것에 기초하여 하나 이상의 에너지 차이들(225)(예를 들어, 225-1, 225-2 등)을 생성한다. 예를 들어, 에너지 차이 검출 컴포넌트(224)는 필터링된 신호(212-1)에 대응되는 검출된 에너지 값(223-1)과 필터링된 신호(212-2)에 대응되는 검출된 에너지 값(223-2)을 비교하여 에너지 차이(225-1)를 계산할 수 있다. 추가로 또는 대안으로, 에너지 차이 검출 컴포넌트(224)는 에너지 차이들(225)의 세트로부터 단일 에너지 차이(225-1)를 선택하고, 선택된 에너지 차이(225-1)를 잡음 임계치 구성 컴포넌트(230)로 전송할 수 있다.
다양한 실시예들에서, 에너지 차이 검출 컴포넌트(224)는 복수의 에너지 차이들(225)을 계산할 수 있는 반면, 각 에너지 차이(225-1)는 한 쌍의 인접되는 필터링된 신호들(212-1, 212-2)에 대응될 수 있다. 이런 경우, 에너지 차이 검출 컴포넌트(224)는 계산된 에너지 차이들(225)의 세트로부터 가장 큰 계산된 에너지 차이를 선택될 에너지 차이(225-1)로 결정할 수 있다. 예를 들어, 표 1은 오디오 필터링 컴포넌트(210)에 포함된 필터 뱅크에 의해 분해된 필터링된 신호들(212)의 세트에 대응되는 에너지 차이들(225)의 예시적인 세트를 나타낸다.
필터 신호 에너지 값 신호 에너지 값 차이
필터 1 0.803 N/A
필터 2 0.720 0.083
필터 3 0.105 0.615
필터 4 0.630 0.525
필터 5 0.422 0.208
표 1: 인접 필터들에서의 신호들에 대한 에너지 차이들
상기 예에서, 에너지 차이 검출 컴포넌트(224)는 가장 큰 신호 에너지 값 차이(0.615)를 선택된 에너지 차이(225-1)로 결정할 수 있을 것이다. 에너지 차이 검출 컴포넌트(224)는 선택된 에너지 차이(225-1)를 잡음 임계치 구성 컴포넌트(230)로 전송할 수 있을 것이다.
잡음 임계치 구성 컴포넌트(230)는 에너지 차이 검출 컴포넌트(224)로부터 선택된 에너지 차이(225-1)를 수신한다. 잡음 임계치 구성 컴포넌트(230)는 또한 초기 잡음 임계치(232)를 수신한다. 잡음 임계치 구성 컴포넌트(230)는 선택된 에너지 차이(225-1)의 값에 기초하여 초기 잡음 임계치(232)를 수정하여 조정된 잡음 임계치(234)를 생성한다. 예를 들어, 잡음 임계치 구성 컴포넌트(230)는 스케일링된 차이를 생성하기 위해 선택된 에너지 차이(225-1)의 절대값에 스케일링 팩터를 곱할 수 있을 것을 이다. 잡음 임계치 구성 컴포넌트(230)는 그런 다음 초기 잡음 임계치(232)에 스케일링된 차이를 추가할 수 있을 것이다. 이런 경우, 조정된 잡음 임계치(234)의 값은 필터링된 신호들(212)의 세트와 관련된 계산된 에너지 차이들의 세트에 기초하여 상승된다.
일부 실시예들에서, 잡음 임계치 구성 컴포넌트(230)는 하나 이상의 초기 잡음 임계치들(232)를 설정할 수 있다. 예를 들어, 잡음 임계치 구성 컴포넌트(230)는 각각이 필터 뱅크의 특정 필터 및 특정 필터링된 신호(212-1)에 대응되는 별개의 초기 잡음 임계치들(232)(예를 들어, 232-1, 232-2 등)을 설정할 수 있을 것이다. 이런 경우, 잡음 임계치 구성 컴포넌트(230)는 각 특정 필터 및/또는 필터링된 신호들(212)의 세트와 관련된 최소 에너지 값(233-1)을 수신할 수 있을 것이다. 잡음 임계치 구성 컴포넌트(230)는 별개의 초기 잡음 임계치들(232)을 설정할 수 있을 것이다. 각 별개의 초기 잡음 임계치(232)에 대해, 잡음 임계치 구성 컴포넌트(230)는 선택된 에너지 차이(225-1)에 기초하는 스케일링된 차이를 추가하여 조정된 잡음 임계치(234)를 생성한다.
에너지 임계치 결정 컴포넌트(236)는 조정된 잡음 임계치(234) 및 신호 에너지 검출 컴포넌트(222)에 의해 계산된 검출된 에너지 값들(223)의 세트를 수신한다. 에너지 임계치 결정 컴포넌트(236)는 조정된 잡음 임계치(234)에 대해 검출된 에너지 값들(223)의 세트에 포함된 검출된 에너지 값(223-1)을 평가한다. 일부 실시예들에서, 에너지 임계치 결정 컴포넌트(236)는 검출된 에너지 값(223-1)을 필터링된 신호(212-1)에 대응되는 조정된 잡음 임계치(234-1)와 비교한다.
에너지 임계치 결정 컴포넌트(236)는 결정된 에너지 값(223-1)이 조정된 잡음 임계치(234) 미만인 것으로 결정할 때, 에너지 임계치 결정 컴포넌트(236)는 필터링된 신호(212-1)에 대응되는 임계치 표시(237)를 생성한다. 그렇지 않으면, 에너지 임계치 결정 컴포넌트(236)는 필터링된 신호(212-1)에 대응되는 어떠한 임계치 표시도 생성하지 않는다. 이런 경우, 잡음 감소 어플리케이션(162)은 필터링된 신호(212-1)를 변경하지 않는다.
신호 감쇠 컴포넌트(240)는 필터링된 신호들(212)의 세트에 포함된 필터링된 신호들의 서브셋을 변경하는 하나 이상의 필터들을 포함한다. 신호 감쇠 컴포넌트(240)는 하나 이상의 임계치 표시들(237)(예를 들어, 237-1, 237-2 등)을 수신하며, 각 임계치 표시(237-2)는 특정 필터링된 신호(212-2)에 대응된다. 특정 필터링된 신호(212-2)에 대한 임계치 표시(237-2)는 필터링된 신호(212-2)가 조정된 잡음 임계치(234) 미만의 검출된 에너지 값(233-2)를 갖는다는 것을 나타낸다. 신호 감쇠 컴포넌트(240)는 필터링된 신호(212-2)를 변경하여 소정의 필터링된 신호(212-2)에 대한 임계치 표시(237-2)에 응답한다. 신호 감쇠 컴포넌트(240)는 입력 오디오 신호(130)의 컴포넌트들과 관련된 감쇠된 서브 대역 신호들인 감쇠된 필터링된 신호들(242)의 세트를 생성한다.
일부 실시예들에서, 신호 감쇠 컴포넌트(240)는 필터링된 신호(212-2)의 에너지를 감소시키기 위해 신호에 필터를 적용하여 필터링된 신호(212-2)를 감쇠시킬 수 있다. 추가로 또는 대안으로, 신호 감시 컴포넌트(240)는 필터링된 신호에 감쇠 인자(attenuation factor)를 적용할 수 있다. 예를 들어, 신호 감쇠 컴포넌트(240)는 결과적으로 감쇠된 필터링된 신호(242)가 무시할 수 있는 에너지를 갖도록 필터링된 신호(212-2)에 0을 곱할 수 있을 것이다. 다른 예에서, 신호 감쇠 컴포넌트(240)는 일정한 값으로 필터링된 신호(212-2)의 에너지 레벨을 낮추기 위해 필터링된 신호에 특정 상수(예를 들어, 0.25)를 곱할 수 있을 것이다.
신호 결합기 컴포넌트(250)는 설정된 필터링된 신호들(212, 242)을 결합한다. 신호 결합기 컴포넌트(250)는 출력 오디오 신호(140)를 생성하기 위해 신호들(212, 242)의 세트를 합성하는 필터 뱅크를 포함한다. 일부 실시예들에서, 신호 결합기 컴포넌트(250)는 오디오 필터링 컴포넌트(210)에 포함된 필터 뱅크와 동일한 필터 뱅크를 포함한다. 신호 결합기 컴포넌트(250)는 오디오 필터링 컴포넌트(210)으로부터 변경되지 않은 필터링된 신호들(212)의 서브셋을 수신하고, 신호 감쇠 컴포넌트(240)로부터 감쇠된 필터링된 신호들(242)(예를 들어, 242-1, 242-2 등)의 서브셋을 수신한다. 신호 결합기 컴포넌트(250)는 출력 오디오 신호(140)를 합성하기 위해 필터링된 신호들(212, 242)의 서브셋들을 결합한다. 예를 들어, 신호 결합기 컴포넌트(250)는 출력 오디오 신호(140)가 소정의 시간 슬라이스 동안 완전한 오디오 스펙트럼을 포함하도록 변경되지 않은 필터링된 신호들(212)의 서브셋 및/또는 소정의 시간 슬라이스 동안 감쇠된 필터링된 신호들(242)의 서브셋에 포함된 개별 필터링된 신호들을 결합할 수 있다.
일부 실시예들에서, 서브셋들(212, 242)에 포함된 필터링된 신호들 중 하나 이상은 중첩되는 주파수 범위들을 갖는다. 이런 경우, 신호 결합기 컴포넌트(250)는, 특정 중첩되는 주파수 범위에 대해, 가장 큰 검출된 에너지 값(233-1, 233-2)을 갖는 필터링된 신호(212-1, 242-2)를 선택할 수 있다. 추가로 또는 대안으로, 신호 결합기 컴포넌트(250)는 감쇠된 필터링된 신호(242-2) 대신에 변경되지 않은 필터링된 신호(212-1)를 선택할 수 있다.
도 3은 본 개시의 다양한 실시예들에 따른, 입력 오디오 신호를 필터링하기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다. 도시된 바와 같이, 그래프(300)는 멜 필터 뱅크(mel filter bank)(310)(예를 들어, 310-1, 310-2 등)에 대한 진폭 구성을 도시한다. 주파수 값들은 x축에 따르며 진폭 값들은 y축에 따른다.
동작 시, 멜 필터 뱅크(310)에 포함된 필터들(310-1, 310-2)은 필터링된 신호들(212)의 세트를 생성하기 위해 입력 오디오 신호(130)를 분해 및 필터링한다. 다양한 실시예들에서, 멜 필터 뱅크(310)는 오디오 필터링 컴포넌트(210)에 포함된다. 예를 들어, 필터 뱅크(310)는 60 Hz 내지 8 kHz의 주파수 범위 내에서 입력 오디오 신호(130)의 일부를 핸들링하는 21 개 이상의 멜 필터들의 세트를 포함할 수 있을 것이다. 추가로 또는 대안으로, 멜 필터 뱅크(310)에 포함된 필터들 중 하나 이상은 중첩될 수 있다. 이런 경우, 필터들 모두는 입력 오디오 신호(130)의 중첩되는 주파수 범위를 처리 및 필터링할 수 있다. 일부 실시예들에서, 필터들 중 나머지 세트들은 오디오 필터링 컴포넌트(210)에 대한 필터 뱅크로 사용될 수 있다. 예를 들어, 오디오 필터링 컴포넌트(210)는 0 Hz 내지 16 kHz의 주파수 범위를 핸들링하는 30개의 바크 필터들(Bark filters)의 세트를 포함하는 바크 필터 뱅크를 사용할 수 있을 것이다. 일부에서
그래프(300)는 멜 필터 뱅크(310)에 포함된 두 개의 멜 필터들(310-1, 310-2)를 예시한다. 멜 필터 뱅크(310)의 각 멜 필터(310-1, 310-2)는 대역폭들(314, 324)에 대응되는 입력 오디오 신호(130)의 특정 주파수 범위를 처리한다. 다양한 실시예들에서, 각 멜 필터(310-1, 310-2)는 별개의 대역폭을 가질 수 있다. 예를 들어, 더 높은 주파수들을 처리하는 멜 필터(310-2)는 더 낮은 주파수들을 처리하는 멜 필터(310-1)의 대역폭(314)보다 더 큰 대역폭(324)을 가질 수 있다. 도시된 바와 같이, 멜 필터(310-1)는 300 Hz의 중심 주파수(312) 및 65 Hz의 대역폭(314)을 갖는다. 따라서, 멜 필터(310-1)는 267-333 Hz 주파수 범위 내에 있는 입력 오디오 신호(130)의 일부들을 처리한다. 마찬가지로, 멜 필터(310-2)는 2000 Hz의 중심 주파수(322) 및 520 Hz의 대역폭(324)을 갖는다. 따라서, 멜 필터(310-2)는 1478-2260 Hz 주파수 범위 내에 있는 입력 오디오 신호(130)의 일부들을 처리한다.
다양한 실시예들에서, 멜 필터 뱅크(310)는 또한 잡음 감소 시스템(100) 외에 다른 시스템들에 의해 사용될 수 있다. 예를 들어, 자동 음성 인식 시스템은 필터링되는 오디오 신호로부터 특징들을 추출하기 위해 입력 오디오 신호(130) 및/또는 출력 오디오 신호(140)에 멜 필터 뱅크(310)를 사용할 수 있다.
도 4는 본 개시의 다양한 실시예들에 따른, 필터링된 오디오 신호 일부의 에너지를 결정하기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다. 도시된 바와 같이, 그래프(400)는 필터링된 신호들(212)의 세트에 포함된 필터링된 신호(410)에 대한 진폭 구성을 도시한다. 주파수 값들은 x축에 따르며 진폭 값들은 y축에 따른다.
동작 시, 신호 에너지 검출 컴포넌트(222)는 오디오 필터링 컴포넌트(210)로부터 필터링된 신호(410)를 수신하고, 하나 이상의 신호 에너지 값들(422-426)을 결정한다. 다양한 실시예들에서, 신호 에너지 검출 컴포넌트(222)는 필터링된 신호(410)과 관련된 복수의 신호 에너지 값들(422-426)을 결정할 수 있다. 각각의 신호 에너지 값들(422-426)은 다른 시간 범위에 대응될 수 있다. 예를 들어, 신호 에너지 검출 컴포넌트(222)는 시간이 지남에 따라 더 많은 입력 오디오 신호(130)가 수신됨에 따라 실행되는 신호 에너지 값을 계산할 수 있다.
신호 에너지 검출 컴포넌트(222)는 필터링된 신호(410)과 관련된, 최소 신호 에너지 값(426), 최대 신호 에너지 값(422) 및/또는 총 평균 신호 에너지 값(424)과 같은 특정 신호 에너지 값들을 저장할 수 있다. 일부 실시예들에서, 신호 에너지 검출 컴포넌트(222)는 필터링된 신호(410)과 관련된 시간 범위가 변경됨에 따라 신호 에너지 값들(422-426) 중 하나 이상을 업데이트할 수 있다. 추가로 또는 대안으로, 신호 에너지 검출 컴포넌트(222)는 신호 에너지 값들(422-426) 중 하나 이상을 검출된 에너지 값들(223)로서 전송할 수 있다. 예를 들어, 신호 에너지 검출 컴포넌트(222)는 최소 에너지 값(426)을 에너지 다른 검출 컴포넌트(224)로 전송할 수 있으며, 최대 신호 에너지 값(422) 및/또는 총 평균 신호 에너지 값(424)을 에너지 임계치 결정 컴포넌트(236)로 전송할 수 있다.
도 5는 본 개시의 다양한 실시예들에 따른, 필터링된 오디오 신호를 감쇠시키기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다. 도시된 바와 같이, 그래프(300)는 조정된 잡음 임계치(234)와 비교된 필터링된 신호(510)에 대한 진폭 구성을 도시한다. 주파수 값들은 x축에 따르며 진폭 값들은 y축에 따른다.
동작 시, 에너지 임계치 결정 컴포넌트(236)는 필터링된 신호(510)과 관련된 하나 이상의 신호 에너지 값들을 조정된 잡음 임계치(234)와 비교할 수 있다. 일부 실시예들에서, 조정된 잡음 임계치(234)는 필터링된 신호(510)와 관련된 별개의 조정된 잡음 임계치(234-2)일 수 있다. 예를 들어, 잡음 임계치 구성 컴포넌트(230)는 최소 에너지 값(524)에 기초하는 초기 잡음 임계치(232-2)를 먼저 생성함으로써 조정된 잡음 임계치(234-2)를 생성할 수 있다.
에너지 임계치 결정 컴포넌트(236)는 필터링된 신호의 신호 에너지 값과 조정된 잡음 임계치(234)를 비교한다. 예를 들어, 에너지 임계치 결정 컴포넌트(236)는 총 평균 신호 에너지 값(522)와 조정된 잡음 임계치(234)를 비교할 수 있을 것이다. 도시된 바와 같이, 총 평균 신호 에너지 값(522)은 조정된 잡음 임계치(234) 미만이다. 이 경우, 에너지 임계치 결정 컴포넌트(236)는 임계치 표시(237-2)를 생성하고 임계치 표시(237-2)를 신호 감쇠 컴포넌트(240)로 전송함으로써 결정에 응답한다.
도 6은 본 개시의 다양한 실시예들에 따른, 합성 출력 오디오 신호를 생성하기 위해 도 1의 잡음 감소 시스템에 의해 구현될 수 있는 그래프를 예시한다. 도시된 바와 같이, 그래프(600)는 소정의 시간 슬라이스 동안 입력 오디오 신호(130)의 일부(610)("입력 부분(610)") 및 출력 오디오 신호(140)의 해당 부분(620)("출력 부분(620)")에 대한 진폭 구성을 도시한다. 주파수 값들은 x축에 따르며 진폭 값들은 y축에 따른다.
동작 시, 잡음 감소 어플리케이션(162)은 입력 부분(610)을 분석하고 입력 부분(610)에 포함된 하나 이상의 잡음 요소들을 줄임으로써 출력 부분(620)을 생성한다. 다양한 실시예들에서, 신호 결합기 컴포넌트(250)는 필터링된 신호들(212)의 세트로부터 감쇠된 필터링된 신호들(242)의 세트 및 변경되지 않은 신호들의 세트를 수신함으로써 출력 오디오 신호(140)를 합성한다. 신호 결합기 컴포넌트(250)는 출력 오디오 신호(140)를 생성하기 위해 신호들(212, 242)의 세트를 합성하는 필터 뱅크를 포함한다.
도시된 바와 같이, 예를 들어, 입력 부분(610)은 필터링된 신호들(212)의 세트에 포함된 하나 이상의 필터링된 신호들에 대응되는 하나 이상의 서브 대역들을 포함한다. 하나 이상의 서브 대역들은 다양한 잡음 요소들을 포함할 수 있을 것이다. 에너지 임계치 결정 컴포넌트(236)는 입력 부분(610)과 조정된 노이즈 임계치(234)를 비교하고 신호 감쇠 컴포넌트(240)가 감시된 필터링된 신호들(242)의 세트를 생성하기 위해 하나 이상의 서브 대역들이 서브셋을 감쇠시킬 수 있도록 할 수 있을 것이다. 신호 결합기 컴포넌트(250)는 그런 다음 출력 부분(620)을 생성하기 위해 감쇠된 필터링된 신호들(242)의 세트 및 변경되지 않은 필터링된 신호들(212)의 세트를 합성할 수 있다. 특정 서브 대역들의 감쇠로 인해, 입력 부분(610)의 스펙트럼에 포함된 하나 이상의 잡음 요소들은 출력 부분(620)의 스펙트럼에 존재하지 않는다.
도 7은 본 개시의 다양한 실시예들에 따른, 도 1의 잡음 감소 시스템을 통해 합성 출력 오디오 신호를 생성하는 방법 단계들의 흐름도이다. 상기 방법은 도 1-6의 시스템에 대해 설명되어 있지만, 당업자들은 상기 방법 단계들을 어떠한 순서로든 수행하도록 구성된 어떠한 시스템도 다양한 실시예들의 범위 내에 있음을 이해할 것이다. 일부 실시예들에서, 잡음 감소 어플리케이션(162)은 입력 오디오 신호(130)에 대해 실시간으로 연속적으로 방법(700)을 실행할 수 있다.
도시된 바와 같이, 방법(700)은 단계(701)에서 시작하며, 잡음 감소 어플리케이션(162)은 필터 뱅크를 사용하여 입력 오디오 신호(130)을 필터링한다. 잡음 감소 어플리케이션(162)에 포함된 오디오 필터링 컴포넌트(210)는 입력 오디오 신호(130)를 수신한다. 일부 실시예들에서, 입력 오디오 신호(130)는 특정 시간 슬라이스에 대응되는 입력 오디오 신호의 일부이다. 추가로 또는 대안으로, 잡음 감소 어플리케이션(162)은 추가 시간 슬라이스들에 대응되는 입력 오디오 신호의 일부들을 연속적으로 수신 및 필터링할 수 있다. 일부 실시예들에서, 오디오 필터링 컴포넌트(210)는 입력 오디오 신호(130)의 주파수 도메인 버전을 생성하기 위해 하나 이상의 변환 컴포넌트들을 포함한다. 오디오 필터링 컴포넌트(210)는 입력 오디오 신호(130)를 필터링된 신호들(212)의 세트로 분해시키는 하나 이상의 필터들을 포함한다. 일부 실시예들에서, 오디오 필터링 컴포넌트(210)는 멜 필터 뱅크(310)를 포함하며, 멜 필터 뱅크(310)의 각 멜 필터(310-1)는 입력 오디오 신호(130)의 특정 주파수 범위를 처리한다.
단계(703)에서, 잡음 감소 어플리케이션(162)은 오디오 필터링 컴포넌트(210)에 의해 생성된 필터링된 신호들(212)의 세트에 대한 에너지 값들(223)을 결정한다. 잡음 감소 어플리케이션(162)에 포함된 신호 에너지 검출 컴포넌트(222)는 오디오 필터링 컴포넌트(210)로부터 필터링된 신호들(212)의 세트를 수신한다. 각 필터링된 신호(212-1)에 대해, 신호 에너지 검출 컴포넌트(222)는 대응되는 검출된 에너지 값(223-1)을 결정한다. 예를 들어, 신호 에너지 검출 컴포넌트(222)는 검출된 에너지 값(223-1)으로서 필터링된 신호(212-1)의 신호 에너지에 대한 RMS 값을 계산할 수 있을 것이다.
단계(705)에서, 잡음 감소 어플리케이션(162)은 필터링된 신호에 대한 에너지 값들에 기초하여 잡음 임계치를 설정한다. 잡음 감소 어플리케이션(162)은 신호 에너지 검출 컴포넌트(222)에 의해 제공된 검출된 에너지 값들(223)의 세트에 기초하여 하나 이상의 조정된 잡음 임계치들(234)을 생성한다. 일부 실시예들에서, 잡음 감소 어플리케이션은 필터링된 신호들(212)의 세트에 대해 하나 이상의 초기 잡음 임계치들(232)를 계산한다. 다양한 실시예들에서, 잡음 감소 어플리케이션(162)은 검출된 에너지 값들(223)의 세트와 관련된 에너지 차이들(225)의 세트를 계산한다. 잡음 감소 어플리케이션(162)은 그런 다음 조정된 잡음 임계치(234)를 생성하기 위해 적어도 선택된 에너지 차이(225-1)를 사용한다.
잡음 감소 어플리케이션(162)에 포함된 에너지 차이 검출 컴포넌트(224)는 검출된 에너지 값들(223)의 세트를 수신하고 에너지 차이들(225)의 세트를 생성한다. 예를 들어, 에너지 차이 검출 컴포넌트(224)는 필터링된 신호(212-1)에 대응되는 제1 검출된 에너지 값(223-1)과 필터링된 신호(212-2)에 대응되는 제2 검출된 에너지 값(223-2)을 비교하여 에너지 차이(225-2)를 계산할 수 있다. 일부 실시예들에서, 에너지 차이 검출 컴포넌트(224)는 인접되는 필터링된 신호들(212)와 관련된 검출된 에너지 값들(223)의 세트들을 비교하는 것에 기초하여(예를 들어, 필터 뱅크의 인접 필터들에 의해 생성된 필터링된 신호들(212-3, 212-4)를 비교하여) 에너지 차이들(225)의 세트를 계산할 수 있다. 이런 경우, 에너지 차이 검출 컴포넌트(224)는 에너지 차이들(225)의 세트에서 가장 큰 계산된 에너지 차이(225-3)에 대응되는 선택된 에너지 차이(225-1)를 출력할 수 있을 것이다.
잡음 임계치 구성 컴포넌트(230)는 선택된 에너지 차이(225-1) 및 초기 잡음 임계치(232)를 수신한다. 잡음 임계치 구성 컴포넌트(230)는 선택된 에너지 차이(225-1)의 값에 기초하여 초기 잡음 임계치(232)를 수정하여 조정된 잡음 임계치(234)를 생성한다. 예를 들어, 잡음 임계치 구성 컴포넌트(230)는 스케일링된 차이를 생성하기 위해 선택된 에너지 차이(225-1)에 스케일링 팩터를 곱한 다음, 스케일링된 차이를 초기 잡음 임계치(232)에 추가할 수 있을 것이다. 일부 실시예들에서, 잡음 임계치 구성 컴포넌트(230)는 초기 잡음 임계치(232)의 세트를 생성할 수 있다. 이런 경우, 잡음 임계치 구성 컴포넌트(230)는 각각이 별개의 초기 잡음 임계치(232)에 대응되는 조정된 잡음 임계치들(234)의 세트를 생성할 수 있다.
단계(707)에서, 잡음 감소 어플리케이션(162)은 필터의 오디오 신호의 에너지가 잡음 임계치 미만인지를 결정한다. 잡음 감소 어플리케이션(162)에 포함된 에너지 임계치 결정 컴포넌트(236)는 조정된 잡음 임계치(234) 및 신호 에너지 검출 컴포넌트(222)에 의해 계산된 검출된 에너지 값들(223)의 세트를 수신한다. 에너지 임계치 결정 컴포넌트(236)는 조정된 잡음 임계치(234)로 검출된 에너지 값들(223)의 세트에 포함된 각 검출된 에너지 값(223-2)를 평가한다. 일부 실시예들에서, 잡음 임계치 구성 컴포넌트(230)가 조정된 잡음 임계치들(234)의 세트를 생성할 때, 에너지 임계치 결정 컴포넌트(236)는 각 검출된 에너지 값(223-2)과 그의 대응되는 조정된 잡음 임계치(234-2)를 비교할 수 있다.
에너지 임계치 결정 컴포넌트(236)가 검출된 에너지 값(223-2)이 조정된 잡음 임계치(234) 미만인 것으로 결정할 때, 에너지 임계치 결정 컴포넌트(236)는 필터링된 신호(212-2)에 대응되는 임계치 표시(237)를 생성한다. 에너지 임계치 결정 컴포넌트(236)가 임계치 표시(237)를 신호 감쇠 컴포넌트(240)으로 전송한 후, 잡음 감소 어플리케이션(162)은 단계(709)로 진행한다. 그렇지 않으면, 잡음 감소 어플리케이션(162)은 단계(711)로 진행하며, 잡음 감소 어플리케이션(162)이 조정된 잡음 임계치(234) 이상인 검출된 에너지 값(223-1)에 대응되는 필터링된 신호(212-1)를 변경하지 않는다.
단계(709)에서, 잡음 감소 어플리케이션(162)은 필터링된 신호를 변경한다. 잡음 감소 어플리케이션(162)에 포함된 신호 감쇠 컴포넌트(240)는 에너지 임계치 결정 컴포넌트(236)로부터 특정 필터링된 신호(212-2)가 조정된 잡음 임계치(234) 미만의 검출된 에너지 값(233-2)을 가진다는 임계치 표시(237)를 수신한다. 신호 감쇠 컴포넌트(240)는 대응되는 필터링된 신호(212-2)를 변경함으로써 임계치 표시(237)에 응답한다. 일부 실시예들에서, 신호 감쇠 컴포넌트(240)는 필터링된 신호(212-2)의 에너지를 감소시키기 위해 신호에 필터를 적용하여 필터링된 신호를 감쇠시킬 수 있다. 추가로 또는 대안으로, 신호 감시 컴포넌트(240)는 필터링된 신호에 감쇠 인자를 적용할 수 있다. 예를 들어, 신호 감쇠 컴포넌트(240)는 결과적으로 감쇠된 필터링된 신호(242)가 무시할 수 있는 에너지를 갖도록 필터링된 신호(212-2)에 0을 곱할 수 있다. 다른 예에서, 신호 감쇠 컴포넌트(240)는 일정한 값으로 필터링된 신호(212-2)의 에너지 레벨을 낮추기 위해 필터링된 신호에 특정 상수(예를 들어, 0.25)를 곱할 수 있다.
단계(713)에서, 잡음 감소 어플리케이션(162)은 필터링된 오디오 신호를 결합한다. 잡음 감소 어플리케이션(162)에 포함된 신호 결합기 컴포넌트(250)는 오디오 필터링 컴포넌트(210)로부터의 변경되지 않은 필터링된 신호들(212)의 서브셋 및 신호 감쇠 컴포넌트(240)로부터의 감쇠된 필터링된 신호들(242)의 서브셋을 수신한다. 신호 결합기 컴포넌트(250)는 출력 오디오 신호(140)를 합성하기 위해 필터링된 신호들(212, 242)의 서브셋들을 결합한다. 예를 들어, 신호 결합기 컴포넌트(250)는 소정의 시간 동안 출력 오디오 신호(140)가 완전한 오디오 스펙트럼을 포함하도록 필터링된 신호들(212, 242)을 합성할 수 있다. 일부 실시예들에서, 하나 이상의 필터링된 신호들(212, 242)은 중첩되는 주파수 범위들을 갖는다. 이런 경우, 신호 결합기 컴포넌트(250)는, 특정 중첩되는 주파수 범위에 대해, 가장 큰 검출된 에너지를 갖는 필터링된 신호(212, 242)를 선택할 수 있을 것이다. 추가로 또는 대안으로, 신호 결합기 컴포넌트(250)는 감쇠된 필터링된 신호(242) 대신에 변경되지 않은 필터링된 신호(212)를 선택할 수 있다.
요약하면, 잡음 감소 시스템은 입력 오디오 신호를 수신하고 오디오 신호의 일부를 분해하며, 필터링된 신호들의 세트를 생성한다. 일부 실시예들에서, 잡음 감소 시스템은 멜 필터들의 뱅크와 같은, 음성(speech)에 대한 오디오 신호를 처리하는데 사용된 필터 뱅크를 사용할 수 있다. 잡음 감소 시스템은 각각의 필터링된 신호들과 관련된 신호 에너지들의 세트를 검출한다. 잡음 감소 시스템은 에너지 차이들의 세트를 계산하기 위해 인접되는 필터링된 신호들의 검출된 신호 에너지들의 세트를 비교한다. 잡음 감소 시스템은 계산된 에너지 차이들 중 적어도 하나에 기초하여 잡음 임계치를 수정한다. 일부 실시예들에서, 잡음 감소 시스템은 먼저 임의의 인접되는 필터링된 신호들 간 가장 큰 에너지 차이를 결정한 다음, 조정된 잡음 임계치를 생성하기 위해 가장 큰 에너지 차이에 기초하여 초기 잡음 임계치를 증가시킨다.
잡음 감소 시스템은 검출된 신호 에너지들의 세트와 조정된 잡음 임계치를 비교한다. 상기 비교에 기초하여, 잡음 감소 시스템은 검출된 신호 에너지에 대응되는 필터링된 신호를 변경한다. 일부 실시예들에서, 잡음 감소 시스템은 필터링된 신호에 대한 검출된 에너지가 조정된 잡음 임계치 미만일 때 필터링된 신호를 감쇠시킨다. 잡음 감소 시스템은 출력 오디오 신호를 합성하기 위해 하나 이상의 감쇠된 필터링된 신호들을 포함하는 신호들의 세트를 결합한다.
개시된 기술들의 적어도 하나의 기술적 이점은 잡음 감소 시스템이 다른 오디오 처리 시스템들에 의해 또한 사용되는 하나 이상의 필터들을 사용하여 오디오 신호에 포함된 잡음 요소들을 줄일 수 있다는 점이다. 잡음 감소 시스템은 따라서 다른 오디오 처리 시스템들이 오디오 신호의 다른 부분들을 저하시키지 않고 오디오 신호를 보다 효율적으로 처리할 수 있도록 오디오 신호로부터 효율적으로 잡음 요소들을 제거할 수 있다.
1. 일부 실시예들에서, 오디오 신호의 잡음을 줄이기 위한 방법은 제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키는 단계; 제1 신호 에너지 값들의 세트를 검출하는 단계로서, 제1 신호 에너지 값들의 세트에 포함된 각 신호 에너지 값은 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련되는, 상기 검출하는 단계, 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감소 임계치를 생성하는 단계, 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 신호 에너지 값과 제1 잡음 감소 임계치를 비교하는 단계, 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 제1 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 적어도 하나의 서브 대역 신호를 감쇠시키는 단계, 및 출력 오디오 신호를 생성하기 위해 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키는 단계를 포함한다.
2. 항목 1의 방법에 있어서, 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이를 결정하는 단계를 더 포함하며, 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감소 임계치를 생성하는 단계는 제1 에너지 차이에 기초하여 제1 잡음 감소 임계치를 생성하는 단계를 포함한다.
3. 항목 1 또는 2의 방법에 있어서, 제1 에너지 차이에 기초하여 제1 잡음 감소 임계치를 생성하는 단계는 제1 에너지 차이와 초기 잡음 감소 임계치를 결합시키는 단계를 포함한다.
4. 항목 1 내지 3중 어느 한 항목의 방법에 있어서, 제1 잡음 감소 임계치를 생성하는 단계는 제1 신호 에너지 값들의 세트로부터 신호 에너지 값들의 쌍들을 비교하는 단계로서, 각 쌍의 신호 에너지 값들은 제1 서브 대역 신호들이 세트에 포함되고 인접 필터들에 의해 생성되는 서브 대역 신호들과 관련되는, 상기 비교하는 단계, 각 비교 마다, 에너지 차이를 계산하는 단계로서, 각 에너지 차이는 제1 에너지 차이들의 세트에 포함되는, 상기 계산하는 단계, 및 제1 에너지 차이들의 세트로부터, 가장 큰 에너지 차이를 선택하는 단계로서, 제1 잡음 감소 임계치는 가장 큰 에너지 차이에 기초하는, 상기 선택하는 단계를 포함한다.
5. 항목 1 내지 4 중 어느 한 항목의 방법에 있어서, 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 초기 잡음 감소 임계치를 생성하는 단계, 각 초기 잡음 감소 임계치에 대해, 서브 대역 신호와 관련된 조정된 잡음 감소 임계치를 생성하는 단계로서, 조정된 잡음 감소 임계치는 초기 잡음 감소 임계치 및 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이에 기초하는, 상기 생성하는 단계, 제1 서브 대역 신호들에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 신호 에너지 값과 서브 대역 신호와 관련된 조정된 잡음 감소 임계치를 비교하는 단계, 및 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 적어도 하나의 서브 대역 신호와 관련된 조정된 잡음 감소 임계치 미만의 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 적어도 하나의 서브 대역 신호를 감쇠시키는 단계를 더 포함한다.
6. 항목 1 내지 5 중 어느 한 항목의 방법에 있어서, 초기 입력 신호를 수신하는 단계로서, 초기 입력 신호는 연속적인 시간 도메인 오디오 신호인, 상기 수신하는 단계 및 제1 오디오 입력 신호를 생성하기 위해 초기 입력 신호를 변환하는 단계로서, 제1 오디오 입력 신호는 초기 입력 신호의 주파수 도메인 표현인, 상기 변환하는 단계를 더 포함한다.
7. 항목 1 내지 6 중 어느 한 항목의 방법에 있어서, 제1 신호 에너지 값들의 세트에 포함된 제1 신호 에너지 값은 제1 서브 대역 신호의 제곱 평균 제곱근(RMS) 값이다.
8. 항목 1 내지 7 중 어느 한 항목의 방법에 있어서, 제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키는 단계는 제1 필터 뱅크로 제1 입력 오디오 신호를 분해시키는 단계를 포함하며, 제1 필터 뱅크에 포함된 적어도 필터들의 서브셋은 중첩된다.
9. 항목 1 내지 8 중 어느 한 항목의 방법에 있어서, 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 시간 상수를 서브 대역 신호와 관련시키는 단계 및 관련된 시간 상수에 기초하여 서브 대역 신호와 관련된 신호 에너지 값을 결정하는 단계를 더 포함한다.
10. 일부 실시예들에서, 잡음 감소 시스템은 메모리 및 메모리에 결합된 프로세서를 포함하며, 프로세서는 제1 필터 뱅크를 통해, 제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키고, 제1 신호 에너지 값들의 세트를 검출하되, 제1 신호 에너지 값들의 세트에 포함된 각 신호 에너지 값은 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련되며, 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감소 임계치를 생성하고, 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 신호 에너지 값과 제1 잡음 감소 임계치를 비교하고, 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 제1 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 적어도 하나의 서브 대역 신호를 감쇠시키고, 제1 필터 뱅크 또는 제2 필터 뱅크 중 적어도 하나를 통해, 출력 오디오 신호를 생성하기 위해 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키도록 구성된다.
11. 항목 10의 잡음 감소 시스템에 있어서, 제1 필터 뱅크 또는 제2 필터 뱅크 중 적어도 하나는 제1 멜 필터들의 세트를 포함한다.
12. 항목 10 또는 11의 잡음 감소 시스템에 있어서, 프로세서는 출력 오디오 신호를 음성 인식 시스템으로 전송하도록 더 구성되며, 음성 인식 시스템은 제1 필터 뱅크를 사용한다.
13. 항목 10 내지 12 중 어느 한 항목의 잡음 감소 시스템에 있어서, 프로세스는 제1 MFCC(mel-frequency cepstral coefficient)의 세트를 수신하고, 제1 MFCC의 세트에 기초하여 제1 멜 필터들의 세트를 수정하도록 더 구성된다.
14. 항목 10 내지 13 중 어느 한 항목의 잡음 감소 시스템에 있어서, 프로세서는 음성 인식 시스템으로부터 제1 MFCC(mel-frequency cepstral coefficient)의 세트를 수신하되, 음성 인식 시스템은 제1 MFCC의 세트로 구성된 제1 필터 뱅크를 사용하고, 제1 MFCC의 세트에 기초하여 제1 멜 필터들의 세트를 수정하고, 출력 오디오 신호를 음성 인식 시스템으로 전송하되, 음성 인식 시스템은 출력 오디오 신호로부터 특징들의 세트를 추출하도록 더 구성된다.
15. 항목 10 내지 14 중 어느 한 항목의 잡음 감소 시스템에 있어서, 프로세서는 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이를 결정하도록 더 구성되며, 프로세서는 제1 에너지 차이에 기초하여 제1 잡음 감소 임계치를 생성함으로써 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감소 임계치를 생성하도록 구성된다.
16. 항목 10 내지 15 중 한 항목의 잡음 감소 시스템에 있어서, 프로세서는 제1 에너지 차이와 초기 잡음 감소 임계치를 비교함으로써 제1 에너지 차이에 기초하여 제1 잡음 감소 임계치를 생성하도록 구성된다.
17. 항목 10 내지 16 중 어느 한 항목의 잡음 감소 시스템에 있어서, 프로세서는 제1 신호 에너지 값들의 세트로부터 신호 에너지 값들의 쌍들을 비교함으로써 제1 잡음 감소 임계치를 생성하되, 각 쌍의 신호 에너지 값들은 제1 서브 대역 신호들이 세트에 포함되고 제1 필터 뱅크에 포함된 인접 필터들에 의해 생성되는 서브 대역 신호들과 관련되며, 각 비교 마다, 에너지 차이를 계산하되, 각 에너지 차이는 제1 에너지 차이들의 세트에 포함되며, 제1 에너지 차이들의 세트로부터, 가장 큰 에너지 차이를 선택하되, 제1 잡음 감소 임계치는 가장 큰 에너지 차이에 기초하도록 구성된다.
18. 일부 실시예들에서, 하나 이상의 비-일시적 컴퓨터 판독 가능 매체는 하나 이상의 프로세서들에 의해 실행 시, 하나 이상의 프로세서들이 제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키는 단계, 제1 신호 에너지 값들의 세트를 검출하는 단계로서, 제1 신호 에너지 값들에 포함된 각 신호 에너지 값은 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련되는, 상기 검출하는 단계, 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 초기 잡음 감소 임계치를 생성하는 단계, 각 초기 잡음 감소 임계치에 대해, 서브 대역 신호와 관련된 조정된 잡음 감소 임계치를 생성하는 단계로서, 조정된 잡음 감소 임계치는 초기 잡음 감소 임계치 및 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이에 기초하는, 상기 생성하는 단계, 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 서브 대역 신호와 관련된 신호 에너지 값과 서브 대역 신호와 관련된 조정된 잡음 감소 임계치를 비교하는 단계, 및 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 적어도 하나의 서브 대역 신호와 관련된 조정된 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 적어도 하나의 서브 대역 신호를 감쇠시키는 단계, 및 출력 오디오 신호를 생성하기 위해 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키는 단계를 수행하도록 하는 인스트럭션들을 포함한다.
19. 항목 18의 하나 이상의 비-일시적 컴퓨터 판독 가능 매체에 있어서, 하나 이상의 프로세서들에 의해 실행 시, 하나 이상의 프로세서들이 제1 신호 에너지 값들이 세트로부터 신호 에너지 값들의 쌍들을 비교하는 단계로서, 각 쌍의 신호 에너지 값들은 제1 서브 대역 신호들의 세트에 포함되고 인접 필터들에 의해 생성되는 서브 대역 신호들과 관련되는, 상기 비교하는 단계, 각 비교 마다, 에너지 차이를 계산하는 단계로서, 각 에너지 차이는 제1 에너지 차이들의 세트에 포함되는, 상기 계산하는 단계, 및 제1 에너지 차이들의 세트로부터 가장 큰 에너지 차이를 선택하는 단계로서, 제1 에너지 차이는 가장 큰 에너지 차이에 기초하는, 상기 선택하는 단계를 수행하도록 하는 인스트럭션들을 더 포함한다.
20. 항목 18 또는 19의 하나 이상의 비-일시적 컴퓨터 판독 가능 매체에 있어서, 인접 필터들은 제1 필터 뱅크에 포함된 멜 필터들이다.
어떠한 방식으로든, 본 출원에 기재된 임의의 청구항들 및/또는 임의의 엘리먼트들에 인용된 임의의 청구항 엘리먼트들의 임의의 및 모든 조합들이 본 개시 및 보호의 고려된 범위 내에 포함된다.
다양한 실시예들의 설명들은 예시의 목적으로 제시되었지만, 개시된 실시예들에 대해 배제하거나 제한하는 것으로 의도된 것은 아니다. 기술된 실시예들의 범위 및 사상을 벗어나지 않고 많은 수정들 및 변형들이 당업자에게 명백할 것이다.
본 실시예들의 양태들은 시스템, 방법 또는 컴퓨터 프로그램 제품으로 구현될 수 있다. 따라서, 본 개시의 양태들은 전체 하드웨어 실시예, (펌웨어, 상주 소프트웨어, 마이크로 코드 등을 포함하는) 전체 소프트웨어 실시예 또는 본 명세서에서 "모듈"또는 "시스템"으로 모두 일반적으로 지칭될 수 있는 소프트웨어 및 하드웨어 양태들을 조합하는 실시예 형태를 취할 수 있다. 추가로, 본 개시에 기술된 임의의 하드웨어 및/또는 소프트웨어 기술, 프로세스, 기능, 컴포넌트, 엔진, 모듈 또는 시스템은 회로 또는 회로 세트로 구현될 수 있다. 게다가, 본 개시의 양태들은 그에 임베디드된 컴퓨터 판독 가능 프로그램 코드를 갖는 하나 이상의 컴퓨터 판독 가능 매체(들)에 구현된 컴퓨터 프로그램 제품의 형태를 취할 수 있다.
하나 이상의 컴퓨터 판독 가능 매체(들)의 임의의 조합이 이용될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터 판독 가능 신호 매체 또는 컴퓨터 판독 가능 저장 매체일 수 있다. 컴퓨터 판독 가능 저장 매체는, 예를 들어, 제한하는 것은 아니나, 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 디바이스, 또는 이들의 임의의 적절한 조합일 수 있다. 컴퓨터 판독 가능 저장 매체의 보다 구체적인 예들(비-제한 리스트)로는 다음을 포함할 수 있을 것이다: 하나 이상의 와이어, 휴대용 컴퓨터 디스켓, 하드 디스크, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 소거 가능한 프로그램 가능 읽기 전용 메모리(EPROM 또는 플래시 메모리), 광섬유, 휴대용 컴팩트 디스크 판독 전용 메모리(CD-ROM), 광학 저장 장치, 자기 저장 장치, 또는 이들의 임의의 적절한 조합을 갖는 전기 연결부. 이 문서의 맥락에서, 컴퓨터 판독 가능 저장 매체는 인스트럭션 실행 시스템, 장치 또는 디바이스에 의해 또는 이와 관련하여 사용하기 위한 프로그램을 포함하거나 저장할 수 있는 임의의 유형(tangible) 매체일 수 있다.
본 개시의 양태들은 본 개시의 실시예들에 따른 방법들, 장치들(시스템들) 및 컴퓨터 프로그램 제품들의 흐름도들 및/또는 블록도들을 참조하여 상기에 설명된다. 흐름도들 및/또는 블록도들의 각 블록, 및 흐름도들 및/또는 블록도들의 블록들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 구현될 수 있음이 이해될 것이다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수 목적 컴퓨터 또는 기계를 생성하기 위한 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 제공될 수 있다. 인스트럭션들은, 컴퓨터의 프로세서 또는 다른 프로그램 가능한 데이터 처리 장치를 통해 실행 시, 흐름도 및/또는 블록도 블록 또는 블록들에 지정된 기능들/동작들의 구현을 가능하게 한다. 이러한 프로세서들은, 제한하는 것은 아니나, 범용 프로세서들, 특수 목적 프로세서들, 애플리케이션 특정 프로세서들 또는 필드 프로그래밍 가능 게이트 어레이들일 수 있다.
도면들의 흐름도 및 블록도는 본 개시의 다양한 실시예들에 따른 시스템들, 방법들 및 컴퓨터 프로그램 제품들의 가능한 구현예들의 아키텍처, 기능 및 동작을 예시한다. 이와 관련하여, 흐름도 또는 블록도의 각 블록은 지정된 논리 기능(들)을 구현하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 일부 대안적인 구현예들에서, 블록에 언급된 기능들은 도면들에 언급된 순서를 벗어나서 발생할 수 있음에 유의해야 한다. 예를 들어, 연속으로 도시된 2 개의 블록들은 실제로 실질적으로 동시에 실행될 수 있으며, 또는 수반되는 기능들에 따라 상기 블록들이 때때로 역순으로 실행될 수 있다. 또한, 블록도들 및/또는 흐름도의 각 블록 및 블록도들 및/또는 흐름도의 블록들의 조합은 특정 기능들 또는 동작들을 수행하는 특수 목적의 하드웨어 기반 시스템들, 또는 특수 목적 하드웨어와 컴퓨터 명령의 조합에 의해 구현될 수 있음이 언급될 것이다.
전술한 내용은 본 개시의 실시예들에 관한 것이지만, 본 개시의 기본 범위를 벗어나지 않고 본 개시의 다른 실시예 및 추가 실시예들이 고안될 수 있으며, 그 범위는 다음의 청구들에 의해 결정된다.

Claims (14)

  1. 오디오 신호에서 잡음을 줄이기 위한 방법에 있어서, 상기 방법은,
    제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키는 단계;
    제1 신호 에너지 값들의 세트를 검출하는 단계로서, 상기 제1 신호 에너지 값들의 세트에 포함된 각 신호 에너지 값은 상기 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련되는, 상기 검출하는 단계,
    상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감소 임계치를 생성하는 단계;
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 상기 서브 대역 신호와 관련된 상기 신호 에너지 값과 상기 제1 잡음 감소 임계치를 비교하는 단계;
    상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 상기 제1 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 상기 적어도 하나의 서브 대역 신호를 감쇠시키는 단계; 및
    출력 오디오 신호를 생성하기 위해 상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 상기 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이를 결정하는 단계를 더 포함하며, 상기 적어도 하나의 서브 대역 신호에 기초하여 상기 제1 잡음 감소 임계치를 생성하는 단계는 상기 제1 에너지 차이에 기초하여 상기 제1 잡음 감소 임계치를 생성하는 단계를 포함하는, 방법.
  3. 제2항에 있어서, 상기 제1 에너지 차이에 기초하여 상기 제1 잡음 감소 임계치를 생성하는 단계는 상기 제1 에너지 차이와 초기 잡음 감소 임계치를 결합시키는 단계를 포함하는, 방법.
  4. 제1항에 있어서, 상기 제1 잡음 감소 임계치를 생성하는 단계는,
    상기 제1 신호 에너지 값들의 세트로부터 신호 에너지 값들의 쌍들을 비교하는 단계로서, 각 쌍의 신호 에너지 값들은 상기 제1 서브 대역 신호들의 세트에 포함되고 인접 필터들에 의해 생성되는 서브 대역 신호들과 관련되는, 상기 비교하는 단계;
    각 비교 마다, 에너지 차이를 계산하는 단계로서, 각 에너지 차이는 제1 에너지 차이들의 세트에 포함되는, 상기 계산하는 단계; 및
    상기 제1 에너지 차이들의 세트로부터, 가장 큰 에너지 차이를 선택하는 단계로서, 상기 제1 잡음 감소 임계치는 상기 가장 큰 에너지 차이에 기초하는, 상기 선택하는 단계를 포함하는, 방법.
  5. 제1항에 있어서,
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 상기 서브 대역 신호와 관련된 초기 잡음 감소 임계치를 생성하는 단계;
    각 초기 잡음 감소 임계치에 대해, 상기 서브 대역 신호와 관련된 조정된 잡음 감소 임계치를 생성하는 단계로서, 상기 조정된 잡음 감소 임계치는 상기 초기 잡음 감소 임계치 및 상기 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이에 기초하는, 상기 생성하는 단계,
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 상기 서브 대역 신호와 관련된 상기 신호 에너지 값과 상기 서브 대역 신호와 관련된 상기 조정된 잡음 감소 임계치를 비교하는 단계; 및
    상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 상기 적어도 하나의 서브 대역 신호와 관련된 조정된 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 상기 적어도 하나의 서브 대역 신호를 감쇠시키는 단계를 더 포함하는, 방법.
  6. 제1항에 있어서,
    초기 입력 신호를 수신하는 단계로서, 상기 초기 입력 신호는 연속적인 시간 도메인 오디오 신호인, 상기 수신하는 단계; 및
    상기 제1 오디오 입력 신호를 생성하기 위해 상기 초기 입력 신호를 변환시키는 단계로서, 상기 제1 오디오 입력 신호는 상기 초기 입력 신호의 주파수 도메인 표현인, 상기 변환시키는 단계를 더 포함하는, 방법.
  7. 제1항에 있어서, 상기 제1 신호 에너지 값들의 세트에 포함된 제1 신호 에너지 값은 제1 서브 대역 신호의 제곱 평균 제곱근(RMS) 값인, 방법.
  8. 제1항에 있어서, 상기 제1 입력 오디오 신호를 상기 제1 서브 대역 신호들의 세트로 분해시키는 단계는 제1 필터 뱅크로 상기 제1 입력 오디오 신호를 분해시키는 단계를 포함하며, 적어도 상기 제1 필터 뱅크에 포함된 필터들의 서브셋은 중첩되는, 방법.
  9. 제1항에 있어서,
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 시간 상수와 상기 서브 대역 신호를 관련시키는 단계, 및
    상기 관련된 시간 상수에 기초하여 상기 서브 대역 신호와 관련된 상기 신호 에너지 값을 결정하는 단계를 더 포함하는, 방법.
  10. 잡음 감소 시스템에 있어서,
    메모리; 및
    상기 메모리에 결합된 프로세서를 포함하며, 상기 프로세서는,
    제1 필터 뱅크를 통해, 제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키고;
    제1 신호 에너지 값들의 세트를 검출하되, 상기 제1 신호 에너지 값들의 세트에 포함된 각 신호 에너지 값은 상기 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련되며,
    상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호에 기초하여 제1 잡음 감소 임계치를 생성하고;
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 상기 서브 대역 신호와 관련된 상기 신호 에너지 값과 상기 제1 잡음 감소 임계치를 비교하는 단계;
    상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 상기 제1 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 상기 적어도 하나의 서브 대역 신호를 감쇠시키는 단계; 및
    상기 제1 필터 뱅크 또는 제2 필터 뱅크 중 적어도 하나를 통해, 출력 오디오 신호를 생성하기 위해 상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 상기 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키도록 구성된, 잡음 감소 시스템.
  11. 제10항에 있어서, 상기 제1 필터 뱅크 또는 상기 제2 필터 뱅크 중 적어도 하나는 제1 멜(mel) 필터들의 세트를 포함하는, 잡음 감소 시스템.
  12. 하나 이상의 비-일시적 컴퓨터 판독 가능 매체로서, 하나 이상의 프로세서들에 의해 실행 시, 상기 하나 이상의 프로세서들이,
    제1 입력 오디오 신호를 제1 서브 대역 신호들의 세트로 분해시키는 단계;
    제1 신호 에너지 값들의 세트를 검출하는 단계로서, 상기 제1 신호 에너지 값들의 세트에 포함된 각 신호 에너지 값은 상기 제1 서브 대역 신호들의 세트에 포함된 서브 대역 신호와 관련되는, 상기 검출하는 단계,
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 상기 서브 대역 신호와 관련된 초기 잡음 감소 임계치를 생성하는 단계;
    각 초기 잡음 감소 임계치에 대해, 상기 서브 대역 신호와 관련된 조정된 잡음 감소 임계치를 생성하는 단계로서, 상기 조정된 잡음 감소 임계치는 상기 초기 잡음 감소 임계치 및 상기 제1 신호 에너지 값들의 세트에 포함된 두 신호 에너지 값들 사이의 적어도 제1 에너지 차이에 기초하는, 상기 생성하는 단계,
    상기 제1 서브 대역 신호들의 세트에 포함된 각 서브 대역 신호에 대해, 상기 서브 대역 신호와 관련된 상기 신호 에너지 값과 상기 서브 대역 신호와 관련된 상기 조정된 잡음 감소 임계치를 비교하는 단계; 및
    상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호가 상기 적어도 하나의 서브 대역 신호와 관련된 조정된 잡음 감소 임계치 미만인 신호 에너지 값과 관련된다는 결정에 기초하여, 제1 감쇠된 서브 대역 신호들의 세트를 생성하기 위해 상기 적어도 하나의 서브 대역 신호를 감쇠시키는 단계; 및
    출력 오디오 신호를 생성하기 위해 상기 제1 서브 대역 신호들의 세트에 포함된 적어도 하나의 서브 대역 신호와 상기 제1 감쇠된 서브 대역 신호들의 세트에 포함된 적어도 하나의 감쇠된 서브 대역 신호를 결합시키는 단계를 수행하도록 하는 인스트럭션들을 포함하는, 하나 이상의 비-일시적 컴퓨터 판독 가능 매체.
  13. 제12항에 있어서, 하나 이상의 프로세서들에 의해 실행 시, 상기 하나 이상의 프로세서들이,
    상기 제1 신호 에너지 값들의 세트로부터 신호 에너지 값들의 쌍들을 비교하는 단계로서, 각 쌍의 신호 에너지 값들은 상기 제1 서브 대역 신호들의 세트에 포함되고 인접 필터들에 의해 생성되는 서브 대역 신호들과 관련되는, 상기 비교하는 단계;
    각 비교 마다, 에너지 차이를 계산하는 단계로서, 각 에너지 차이는 제1 에너지 차이들의 세트에 포함되는, 상기 계산하는 단계; 및
    상기 제1 에너지 차이들의 세트로부터, 가장 큰 에너지 차이를 선택하는 단계로서, 상기 제1 에너지 차이는 상기 가장 큰 에너지 차이에 기초하는, 상기 선택하는 단계를 수행하도록 하는 인스트럭션들을 더 포함하는, 하나 이상의 비-일시적 컴퓨터 판독 가능 매체.
  14. 제13항에 있어서, 상기 인접 필터들은 제1 필터 뱅크에 포함된 멜 필터들인, 하나 이상의 비-일시적 컴퓨터 판독 가능 매체.
KR1020200015907A 2019-02-13 2020-02-10 비선형 잡음 감소 시스템 KR20200099093A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/275,126 US11170799B2 (en) 2019-02-13 2019-02-13 Nonlinear noise reduction system
US16/275,126 2019-02-13

Publications (1)

Publication Number Publication Date
KR20200099093A true KR20200099093A (ko) 2020-08-21

Family

ID=69571810

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200015907A KR20200099093A (ko) 2019-02-13 2020-02-10 비선형 잡음 감소 시스템

Country Status (4)

Country Link
US (1) US11170799B2 (ko)
EP (1) EP3696815B1 (ko)
KR (1) KR20200099093A (ko)
CN (1) CN111564159A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170799B2 (en) * 2019-02-13 2021-11-09 Harman International Industries, Incorporated Nonlinear noise reduction system
US11418901B1 (en) 2021-02-01 2022-08-16 Harman International Industries, Incorporated System and method for providing three-dimensional immersive sound

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8801014D0 (en) * 1988-01-18 1988-02-17 British Telecomm Noise reduction
WO1995013660A1 (fr) * 1993-11-09 1995-05-18 Sony Corporation Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
US6678656B2 (en) * 2002-01-30 2004-01-13 Motorola, Inc. Noise reduced speech recognition parameters
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
US7260272B2 (en) * 2003-07-10 2007-08-21 Samsung Electronics Co.. Ltd. Method and apparatus for noise reduction using discrete wavelet transform
JP4232032B2 (ja) * 2004-05-17 2009-03-04 ソニー株式会社 音響装置および音響装置を用いた監視方法
DE112010003461B4 (de) * 2009-08-28 2019-09-05 International Business Machines Corporation Vorrichtung zur Extraktion von Sprachmerkmalen, Verfahren zur Extraktion von Sprachmerkmalen und Programm zur Extraktion von Sprachmerkmalen
US8473287B2 (en) * 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8924204B2 (en) * 2010-11-12 2014-12-30 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones
US9047878B2 (en) * 2010-11-24 2015-06-02 JVC Kenwood Corporation Speech determination apparatus and speech determination method
US9524729B2 (en) * 2012-02-16 2016-12-20 2236008 Ontario Inc. System and method for noise estimation with music detection
JP5862349B2 (ja) * 2012-02-16 2016-02-16 株式会社Jvcケンウッド ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
CN104221079B (zh) * 2012-02-21 2017-03-01 塔塔顾问服务有限公司 利用频谱特性进行声音分析的改进的梅尔滤波器组结构
US9275642B2 (en) * 2012-11-13 2016-03-01 Unified Computer Intelligence Corporation Voice-operated internet-ready ubiquitous computing device and method thereof
DK3155618T3 (da) * 2014-06-13 2022-07-04 Oticon As Flerbånds støjreduktionssystem og metodologi til digitale audiosignaler
US9467569B2 (en) * 2015-03-05 2016-10-11 Raytheon Company Methods and apparatus for reducing audio conference noise using voice quality measures
US10026399B2 (en) * 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
US9769607B2 (en) * 2015-09-24 2017-09-19 Cisco Technology, Inc. Determining proximity of computing devices using ultrasonic audio signatures
US9898882B1 (en) * 2016-08-19 2018-02-20 Sony Corporation System and method for customized message playback
US10148912B1 (en) * 2017-06-26 2018-12-04 Amazon Technologies, Inc. User interface for communications systems
US10475454B2 (en) * 2017-09-18 2019-11-12 Motorola Mobility Llc Directional display and audio broadcast
CN108847208B (zh) * 2018-05-04 2020-11-27 歌尔科技有限公司 一种降噪处理方法、装置和耳机
US11170799B2 (en) * 2019-02-13 2021-11-09 Harman International Industries, Incorporated Nonlinear noise reduction system

Also Published As

Publication number Publication date
US20200258537A1 (en) 2020-08-13
US11170799B2 (en) 2021-11-09
CN111564159A (zh) 2020-08-21
EP3696815B1 (en) 2024-03-27
EP3696815A1 (en) 2020-08-19

Similar Documents

Publication Publication Date Title
US9548063B2 (en) Method and apparatus for acoustic echo control
WO2019113130A1 (en) Voice activity detection systems and methods
JP6493889B2 (ja) 音声信号を検出するための方法および装置
WO2020065257A1 (en) Sound event detection
KR20200099093A (ko) 비선형 잡음 감소 시스템
US9749741B1 (en) Systems and methods for reducing intermodulation distortion
US20230267947A1 (en) Noise reduction using machine learning
TWI523006B (zh) 利用聲紋識別進行語音辨識的方法及其電子裝置
CN110111811A (zh) 音频信号检测方法、装置和存储介质
Vuong et al. Learnable spectro-temporal receptive fields for robust voice type discrimination
EP3847642B1 (en) Methods and apparatus to fingerprint an audio signal via normalization
KR102270954B1 (ko) 심층 신경망 및 순환 신경망의 복층 구조에 기반한 음성 검출 장치 및 방법.
CN112992190B (zh) 音频信号的处理方法、装置、电子设备和存储介质
EP3066842B1 (en) Multi-band harmonic discrimination for feedback suppression
CN115223584B (zh) 音频数据处理方法、装置、设备及存储介质
CN111477246B (zh) 语音处理方法、装置及智能终端
CN116840743A (zh) 电力变压器故障处理方法、装置、电子设备及存储介质
US9978393B1 (en) System and method for automatically removing noise defects from sound recordings
US20230116052A1 (en) Array geometry agnostic multi-channel personalized speech enhancement
CN114996489A (zh) 新闻数据的违规检测方法、装置、设备及存储介质
Mendes et al. Defending against imperceptible audio adversarial examples using proportional additive gaussian noise
CN113593604A (zh) 检测音频质量方法、装置及存储介质
Ravuri et al. Using spectro-temporal features to improve AFE feature extraction for ASR.
CN112118511A (zh) 耳机降噪方法、装置、耳机及计算机可读存储介质
CN113012710A (zh) 一种音频降噪方法及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal