KR20030040399A - 음성 강화 시스템 - Google Patents

음성 강화 시스템 Download PDF

Info

Publication number
KR20030040399A
KR20030040399A KR10-2003-7002127A KR20037002127A KR20030040399A KR 20030040399 A KR20030040399 A KR 20030040399A KR 20037002127 A KR20037002127 A KR 20037002127A KR 20030040399 A KR20030040399 A KR 20030040399A
Authority
KR
South Korea
Prior art keywords
acoustic signal
noise
signal
gain
frequency component
Prior art date
Application number
KR10-2003-7002127A
Other languages
English (en)
Other versions
KR100860805B1 (ko
Inventor
리크트찌비
Original Assignee
클리어 오디오 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 클리어 오디오 리미티드 filed Critical 클리어 오디오 리미티드
Publication of KR20030040399A publication Critical patent/KR20030040399A/ko
Application granted granted Critical
Publication of KR100860805B1 publication Critical patent/KR100860805B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems

Abstract

본 발명은 음향 신호 외부의 주변 잡음을 극복하기 위하여 음향 신호를 처리하는 방법이다. 본 발명의 방법은 음향 신호의 주파수 성분내의 음향 신호 크기와 주변 잡음의 주파수 신호의 주파수 성분내의 잡음 크기를 비교하는 단계와, 위 비교에 응답하여 이득을 결정하는 단계와, 위 결정된 이득으로써, 음향 신호의 주파수 성분을 포함하지 않는 주파수 성분을 적어도 하나 포함하는, 위 음향 신호의 적어도 일부를 증폭하는 단계를 포함한다.

Description

음성 강화 시스템{VOICE ENHANCEMENT SYSTEM}
전화기 세트는 종종 잡음 영역에서 사용되며, 주변 잡음(background noise)이 전화기 세트를 통해 수신되는 음향 신호를 파악하는 데 간섭을 줄 수 있다. 골드버그(Goldberg)의 미국 특허 제4,829,565호는 본 명세서에서 참조로 포함되며, 주변 잡음에 반응하에 사용자에게 들리는 원래 신호의 음량을 조절하는 자동 음량 조절 시스템을 포함하는 전화기를 개시하고 있다. 그러나, 이 시스템은 부정확한 변화와 더불어 음량의 너무 많은 변화로 인하여 사람의 귀를 불편하게 할 수 있다.
밀러(Miller) 씨 등의 미국 특허 제5,615,270호는 본 명세서에서 참조로 포함되며, 자동차용 잡음 보상 시스템을 개시하고 있다. 이 시스템은 자동차에서 감지된 신호로부터 요구되는 음악 신호를 걸러내어 생성된 잡음 신호에 기초하여 요구되는 증폭량을 결정한다.
알렌(Allen) 씨 등의 미국 특허 제5,524,148호 및 제5,526,419호는 본 명세서에서 참조로 포함되며, 원격단 신호의 주변 잡음과 평균 음성 세기(speech power)에 등압하여 결정되는 이득으로써 전화기 세트에 제공되는 원격단 신호를 증폭한다. 하나의 실시예에서, 주변 잡음 수준과 평균 음성 세기는 원격단 신호의 모든 주파수 대역에서 계산되고, 동일한 이득이 원격단 신호의 모든 주파수 대역에 대해 적용된다. 이득 결정에 이용되는 방법에 기인하여, 이득이 충분하지 않거나 과도할 수 있다.
알렌의 특허의 또 다른 실시예에서, 원격단 신호는 복수의 주파수 성분으로 분할되고, 각 주파수 성분은 각각의 이득으로 증폭된다. 각 주파수 성분의 이득은 해당 주파수 성분의 주변 잡음과 해당 주파수 성분의 평균 음성 세기 또는 전반적인 평균 음성 세기에 응답하여 결정된다. 이 실시예에서, 전달된 신호가 신호 내의 다른 주파수 성분의 상이하고 무관한 증폭에 의하여 왜곡될 수 있다. 더욱이, 많은 진폭 조정이 불필요하게 수행될 수 있고, 이로 인하여 동작 성능의 낭비가 있을 수 있으며 특히 배터리 타입의 시스템에서 낭비가 크다.
1999년 1월 14일 공개된 PCT 공보 WO 99/01863는 본 명세서에 참조로 포함되며, 잡음 환경에서의 음량 강화 시스템을 기술하고 있다. WO 99/018693의 시스템은 음성 및 주변 잡음의 스펙트럼 분석치를 비교하여 하나 또는 그 이상의 음향 주파수가 주변 잡음에 의하여 마스크되었는지를 결정한다. 마스크되었다면, 음향에 대한 하나 또는 그 이상의 선 스펙트럼 쌍(Line Spectrual Pairs; LSPs)이 그 LSP에 대한 음향 마스킹을 제거하기 위해 변형된다. LSP의 변형은 주파수 이동, 대역폭 증까 또는 진폭 증가를 포함한다.
라스무손(Rasmusson)의 미국 특허 제5,636,272호는 본 명세서에 참조로 포함되며, 주변 잡음의 함수가 아닌 보정 방법을 이용하여 음향을 더욱 파악하기 어렵게 하는 시스템을 개시하고 있다.
본 발명은 음성을 포함하는 음향을 강화하는 시스템에 관한 것이다.
본 발명의 예시적인 실시예들은 아래의 도면과 더불어 상세히 기술될 것이다. 두 도면 이상에서의 동일한 구조, 요소 또는 부분들은 이것들이 도시된 모든 도면에서 동일한 참조 부호가 부여된다.
도 1은 본 발명의 일 실시예에 따른 잡음 보상 시스템의 개략도.
도 2A는 본 발명의 일 실시예에 따른 잡음 보상 시스템의 제어기의 블록도.
도 2B는 본 발명의 일 실시예에 따른 잡음 보상 시스템의 제어기의 블록도.
도 3은 본 발명의 일 실시예에 따른 도 2A 및 도 2B의 제어기의 논리 유닛의 개략도.
도 4는 본 발명의 일 실시예에 따른 도 3의 논리 유닛의 이득 결정기의 개략도.
도 5A 및 도 5B는 본 발명의 일 실시예에 따른 포만트 유닛에 의해 생성된 이득으로 보정되기 전과 후의 예시적 음향 신호의 그래프.
도 6은 본 발명의 일 실시예에 따른 증강 필터의 이득에 대한 개략적 그래프.
도 7은 본 발명의 일 실시예에 따른 예시적 잡음 세기 스펙트럼 및 마스크된 잡음 세기 스펙트럼에 대한 개략적 그래프.
도 8은 본 발명의 일 실시예에 따른 음성 검출기의 개략적 블록도.
본 발명의 몇 실시예는 주변 잡음을 극복하기 위하여 요구되는 음향 신호를 조정하는 잡음 보상 시스템에 관한 것이다. 이 시스템은 신호의 주파수 성분에 대해 음향 및 잡음 신호의 분석에 기초하여 음향 신호 또는/및 그 이득을 증폭할 지를 결정한다. 그러나, 결정된 증폭 이득은 전체 음향 신호에 적용되거나 복수의 주파수 성분을 포함하는 음향 신호의 일부에 적용된다. 주파수 성분에 기초한 증폭 이득의 결정은 요구되는 이득을 더 정확하게 결정할 수 있고, 전체 음향 신호에 대한 이득 적용은 신호에 대한 왜곡의 개입을 방지할 수 있다.
본 발명의 몇 실시예에서, 하나 또는 그 이상의 주파수 성분에 대해 음향 신호 세기과 잡음 신호 세기를 비교하고 그 비교에 따라 이득을 결정한다. 본 발명의 다른 몇 실시예에서는, 음향 신호 및 잡음 신호가 신호의 실질적인 전체 음향 스펙트럼을 선택적으로 커버할 수 있는 복수의 주파수 성분으로 분할되고, 실질적으로 모든 주파수 성분에 대해 비교가 수행된다. 대안으로서 또는 부가적으로, 전체 주파수 성분 보다 적은 대상에 대해 비교가 수행될 수 있는데, 예컨대 음향 신호의 포만트(formant), 즉 스펙트럼 최고치의 엔벨로프(envelope)를 포함하는 주파수 성분에 대해서만 비교될 수 있다. 본 발명의 일부 실시예에서, 음향 신호의 포만트를 포함하는 모든 주파수 성분 보다 적은 대상에 대해 비교가 수행된다. 본 발명의 예시적 실시예에서는 미리 정해진 수의 상이한 포만트, 즉 3개 포만트가 음향 신호에 대해 조사된다. 이 검사에서 발견된 포만트를 포함하는 주파수 성분에 대해 비교가 수행된다.
본 발명의 일부 실시예에서, 비교에 관계된 주파수 성분의 신호대잡음비(SNR)에 기초하여 최소 SNR을 가지는 증폭 이득이 선택된다. 선택적으로 이득은 전체 음향 신호에 적용된다. 대안으로서, 음향 신호를 포함하는 것으로 알려진 음향 신호의 실질적으로 모든 스펙트럼에 대해 적용된다. 본 발명의 일부 실시예에서, 증폭 이득으로 신호가 증폭된 후 허용된 동적 범위를 초과하는 증폭 신호에 따른 왜곡을 피하기 위하여 신호를 압축한다
본 발명의 일부 실시예는 음향 신호의 하나 이상의 제1 주파수 성분을 증폭하는 잡음 보상 시스템에 관한 것인데, 위 증폭은 제1 주파수 성분과는 다른 하나 이상의 제2 주파수 성분에서 음향 신호의 증폭이 필요한지에 대한 결정에 따라 이루어 진다. 시스템은 음향 신호를 복수의 주파수 성분으로 분할하고 적어도 하나의 주파수 성분에 대해 주파수 성분의 진폭이 충분한지 여부를 결정한다. 제1 주파수 성분의 진폭이 부족하다고 결정되면, 적어도 하나의 제2 주파수 성분의 진폭이 조정된다. 본 발명의 일 실시예에서는, 위 결정에 따라 대부분 또는 전부의 주파수 성분의 진폭이 조정되며, 이때 동일한 조정 인자(factor)가 이용될 수 있다.
본 발명의 또 다른 실시예는 주변 잡음을 극복하기 위하여 요구되는 음향 신호를 조정하는 잡음 보상 시스템에 관한 것이다. 음향 신호는 복수의 주파수 성분으로 분할되고 각 주파수 성분은 잡음 종속적 이득 및 잡음 독립적 이득에 의하여 증강된다. 잡음 종속적 이득 및 잡음 독립적 이득 모두를 동일 분할에 의해 생성된 주파수 성분에 적용하면, 중복 비용이 안들고 신호 불할에 대한 지연이 없이 두 이득 적용에 대한 이점을 얻을 수 있다. 본 발명의 일 실시예에서, 잡음 독립적 이득의 적어도 일부는 신호에 대해서도 독립적인 미리 고정된 이득을 포함한다. 본 발명의 일 실시예에서, 잡음 종속적 이득은 실질적으로 모든 주파수 성분에 대해 동일하다.
본 발명의 일부 실시예에서, 잡음 종속적 이득 및 잡음 독립적 이득이 하나의 증폭 유닛에 의하여 음향 신호에 적용된다. 대안으로서, 음향 신호에 대한 이득의 각 부분을 적용하는 복수의 증폭 유닛이 이용될 수 있다. 선택적으로, 제1 증폭 유닛은 오로지 잡음 독립적 이득에 적용되고, 제2 증폭 유닛은 잡음 종속적 이득 및 잡음 독립적 이득 모두에 적용된다. 대안으로서 또는 부가적으로, 제1 증폭 유닛은 신호 독립적 이득만을 공급하고, 제2 증폭 유닛은 신호 종속적 이득만을 공급할 수 있다.
"이득(gain)"이라는 용어는 본 명세서에서 감쇄의 경우에도 이용되므로, 이득 인자가 1보다 작을 수 있다.
본 발명의 일부 실시예는 주변 잡음을 극복하기 위하여 요구되는 음향 신호를 조정하는 잡음 보상 시스템에 관한 것이다. 잡음 보상 시스템은 주변 잡음에 기초하여 보정된 음향 신호를 계산한다. 시스템의 출력은 원래 음향 신호와 보상된 신호의 가중된 합과 동일하다. 단지 보상된 신호 대신에 가중된 합으로 소리를 냄으로써 원래신호(원 신호의 이점을 가짐)과 증강된 신호(증강된 이점을 가짐)의 절충이 이루어진다.
본 발명의 일부 실시예에서, 가중된 합이 원래의 음향 신호 및 보상된 신호에 대하여 미리 정해진 가중치를 제공한다. 선택적으로, 원래의 음향 신호 및 보상된 신호에 대등한 가중치가 주어질 수 있다. 대안으로서 또는 부가적으로, 가중된 합의 가중치가 보정된 음향 신호에 적용되는 이득의 확장 및/또는 주변 잡음 신호의 확장에 반응하여 조정될 수 있다.
본 발명의 또 다른 면은 음향 신호의 포만트를 식별하는 방법에 관한 것이다. 이 방법은 음향 신호의 복수의 주파수 성분에 대한 세기값(power value)를 결정하는 단계와, 주파수 성분의 세기값를 저역 통과 필터링하여 각 주파수 성분과 그 인접 주파수 성분의 세기값를 평균하는 단계와, 필터된 세기의 피크치를 구하는 단계를 포함한다.
선택적으로, 주파수 성분이 복수의 필터를 이용하여 얻어질 수 있다. 대안으로서, 복수의 주파수 성분이 푸리에 변환을 이용하여 생성될 수 있다. 본 발명의 일 실시예에서, 복수의 주파수 성분은 10 내지 24 주파수 성분, 선택적으로 12 내지 15 주파수 성분으로 이루어진다. 대안으로서, 복수의 주파수 성분의 수는 FFT 가 이용되는 경우 FFT 빈(bin)의 수로 이루어진다. 본 발명의 모범적 실시예에서, 복수의 주파수 성분의 값은 FFT를 수행하고 복수의 인접 빈의 값을 하나의 주파수 성분값으로 결합함으로써 계산된다.
본 발명의 다른 실시예는 근거리단(near end)의 사용자가 이야기 하지 않는다고 결정되는 것에 응답하여 원격단으로부터 수신된 신호의 잡음 보상을 수행하는, 양방향 통신 핸드셋, 즉 전화용 노이즈 보상 시스템에 관한 것이다. 따라서, 잡음 보상 시스템의 전력 소비가 감소된다. 일반적으로, 원격단 사용자가 침묵하고 근거리단 사용자가 이야기할 때는, 근거리단 사용자는 원격단으로부터 수신된 신호를 듣지 않거나 잡음 보상이 비효율적이다.
본 발명의 일부 실시예는 주변 잡음을 극복하기 위하여 요망되는 음향 신호를 증강하기 위한 이득을 결정하는 방법에 관한 것이다. 이 방법은 상이한 시간 구간에 걸친 음향 신호의 진폭치의 적어도 두개의 고점(high-point)을 결정하는 단계를 포함한다. 고점치는 평균화되고 잡음 지시자와 비교된다. 선택적으로, 이 비교에 응답하여 이득이 결정된다. 본 발명의 일 실시예는 음향 신호의 고점치 평규의 계산과 유사한 방식으로 주변 잡음 신호로부터 잡음 식별자가 계산된다.
본 발명의 일 실시예에서, 고점치를 평균하는 단계는 기하 평균 또는 산술 평균을 계산하는 단계를 포함한다. 대안으로서 또는 부가적으로, 임의의 그 외 평균화 방법이 이용딜 수 있다.
선택적으로, 고점치는 각 시간 구간의 최고치를 포함한다. 대안으로서 또는 부가적으로, 하나 또는 그 이상의 고점치는 감소하는 최고치를 포함한다. 즉, 최고치는 저장되고 저장된 값은 미리 정해진 함수에 따라 시간이 지나면서 감소한다. 감소하는 최고치는 새로운 값과 비교되고, 새로운 값이 감소하는 최고치의 현재값보다 크면 이로 대체된다. 대안으로서 또는 부가적으로, 고점치는 더 새로운 값에 더 큰 가중치를 부여하여 가중된 음향 신호의 최고치를 포함한다.
본 발명의 일 실시예는 에코 제거(echo cancellation)를 수행하는 방법에 관한 것이다. 이 방법은 에코를 발생하는 신화와 에코 제거를 수행하는 신호 사이의 상관(correlation)을 구하는 단계와 에코를 발생하는 신호의 하나의 복사본 말을 제거하는 단계를 포함한다. 이 방법은 비록 성능은 떨어지지만 종래 기술에 비하여매우 간단하다. 이 방법은 음향 조건에 따른 직접적인 에코일 때 더욱 뛰어나다.
따라서 본 발명의 실시예에 따라, 음향 신호와 무관한 주변 잡음을 극복하기 위하여 음향 신호를 처리하는 방법은, 음향 신호의 주파수 성분의 음향 크기와 주변 잡음의 주파수 성분의 잡음 크기를 비교하는 단계와, 위 비교에 따라 이득을 결정하는 단계와, 음향 신호의 주파수 성분에 포함되지 아니한 적어도 하나의 주파수 세그먼트를 포함하는 음향 신호의 적어도 일부분을 결정된 이득으로써 증폭하는 단계를 포함한다.
선택적으로, 음향 신호의 크기는 음향 신호의 세기을 포함한다. 선택적으로 주변 잡음의 주파수 성분의 잡음 크기는 마스킹된 잡음의 세기로 이루어진다. 적어도 일부의 신호를 증폭하는 단계는 음향 신호의 비교된 주파수 성분을 포함하는 부분을 증폭하는 단계를 포함할 수 있다.
선택적으로, 음향 신호의 적어도 일부를 증폭하는 단계는 정해진 이득으로 전체 음향 신호를 증폭하는 단계로 이루어진다. 본 발명의 일 실시예에서, 적용될 이득을 결정하는 단계는 음향 신호의 주파수 성분의 주파수 대력의 신호대잡음비를 임계치 이상으로 하는 이득을 결정하는 단계를 포함한다.
선택적으로, 임계치는 시간에 따른 신호 및/또는 잡음 크기의 변화에 따라 동적으로 조절된다. 대안으로서, 임계치는 미리 결정된 값이다. 선택적으로, 음샹 신호의 주파수 성분내의 음향 신호의 크기를 비교하는 단계는 음향 신호의 포만트를 포함하는 주파수 성분을 비교하는 단계를 포함한다. 선택적으로, 음향 신호의 포만트를 포함하는 주파수 성분을 비교하는 단계는 음향 신호의 복수의 주파수 성분 중에서 최소 신호대잡음비를 가지는 주파수 대역의 주파수 성분을 비교하는 단계를 포함한다.
선택적으로, 이 방법은 음향 신호를 복수의 주파수 성분으로 분할하는 단계와, 전체 주파수 성분보다 적게 선택하는 단계를 포함한다. 전체 주파수 성분보다 적게 선택하는 단계는 음향 신호의 포만트를 포함하는 주파수 성분을 선택하는 단계를 포함할 수 있다. 선택적으로, 음향 신호의 포만트를 포함하는 주파수 성분을 선택하는 단계는 포만트를 포함하는 주파수 성분을 미리 정해진 수만큼 선택하는 단계를 포함한다.
선택적으로 이 방법은 선택된 주파수 성분으로부터 음향 신호의 주파수 성분을 선택하는 단계를 포함한다. 음향 신호 중 적어도 일부분을 증폭하는 단계는 비교에 응답하여 정해진 이득을 포함하는 복수의 이득으로부터 결합된 이득에 의하여 증폭되는 단계를 포함한다. 선택적으로, 이 방법은 주변 잡음의 현존시 증폭된 신호를 소리나게 하는 단계를 포함한다.
음향 신호의 주파수 성분과 잡음의 주파수 성분은 실질적으로 동일한 주파수 대역에 걸쳐있을 수 있다. 선택적으로, 음향 신호의 주파수 성분은 주파수들의 대역으로 이루어진다.
본 발명의 실시예에 따라, 음향 신호와 무관한 주변 잡음을 극복하기 위한 음향 신호의 처리 방법이 제공되는데, 이 방법은 음향 신호를 복수의 주파수 성분으로 분할하는 단계와, 각 주파수 성분의 잡음 독립적 이득으로써 주파수 성분을 증강하는 단계와, 각 주파수 성분의 잡음 종속적 이득으로써 각 주파수 성분을 곱하는 단계를 포함한다.
이 방법은 복수의 주파수 성분을 증강된 음향 신호로 재결합하는 단계를 포함할 수 있다.
선택적으로, 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 10개 내지 24개의 주파수 성분 또는 100개 이상의 주파수 성분으로 분할하는 단계를 포함한다. 선택적으로, 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 중첩되지 않도록 복수의 주파수를 분할하는 단계를 포함한다. 각각의 잡음 독립적 이득으로 각 주파수 성분을 증강하는 단계는 미리 정해진 신호 독립적 이득으로써 증강시키는 단계를 포함한다.
각 잡음 종속적 이득으로 각 주파수 성분을 곱하는 단계는 동일한 잡음 종속적 이득으로 실질적으로 전체 주파수 성분을 곱하는 단계를 포함할 수 있다. 증강 및 곱은 하나의 기능적 요소(functional element)에 의하여 수행될 수 있다. 선택적으로, 증강 및 곱은 별개의 기능적 요소에 의하여 수행될 수 있다.
선택적으로, 잡음 독립적 이득은 음향 신호가 음성을 포함한다는 음성 증강 인자를 포함한다. 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 음향 신호에 푸리에 변환을 가하는 것을 포함한다. 대안으로서 또는 부가적으로, 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 음향 신호를 대역 통과 필터군을 통과시키는 단계를 포함한다.
본 발명에 따른 실시예에서, 음향 신호와 무관한 주변 잡음을 극복하기 위해 음향 신호를 처리하는 방법을 제공하며, 이 방법은 음향 신호를 수신하는 단계와,주변 잡음의 크기에 반응하여 음향 신호를 증강하는 단계와, 증강된 음향 신호와 수신된 음향 신호의 가중된 합을 출력하는 단계를 포함한다.
선택적으로, 음향 신호를 증강하는 단계는 음향 신호의 복수의 주파수 성분을 각각의 이득으로 곱하는 단계를 포함한다. 선택적으로, 가중된 합을 제공하는 단계는 가중된 합을 동적으로 조정되는 가중치에 의하여 생성하는 단계를 포함한다. 선택적으로 동적으로 조정된 가중치는 증강된 음향 신호의 확장 정도에 반응하여 결정된다. 본 발명의 일 실시예에서, 음향 신호를 증강하는 단계는 상이한 복수의 이득 인자를 계산하는 단계와 복수의 이득 인자로 음향 신호를 곱하는 단계를 포함하고, 동적으로 조정되는 가중치는 복수의 이득 인자들 중의 하나에 반응하여 결정된다.
선택적으로, 상이한 이득 인자중 적어도 하나는 이력 종속적 이득 인자(history dependent gain factor)로 이루어진다. 선택적으로, 가중된 합을 제공하는 단계는 미리 결정된 가중치로써 생성된 가중된 합을 제공하는 단계를 포함한다. 선택적으로, 가중된 합을 제공하는 단계는 제공된 가중된 합에 대한 수화자가 말하고 있는 경우라는 결정에 응답하여 지배적인 수신 음향 신호의 가중된 합을 제공하는 단계를 포함한다. 선택적으로, 가중된 합을 제공하는 단계는 음향 신호가 음성 신호를 포함하지 않는다는 결정에 응답하여 지배적인 수신 음향 신호의 가중된 합을 제공하는 단계를 포함한다.
본 발명에 따른 실시예의 잡음 보상 시스템은 음향 신호를 수신에 적합한 입력 인터페이스, 증강된 음향 신호를 소리내기에 적합한 스피커, 증강된 신호를 듣는 수화자를 방해할 수 있는 주변 잡음을 수집하기에 적합한 마이크로폰, 음향 신호의 주파수 성분 내의 음향 신호의 크기와 동일 주파수 성분의 주변 잡음의 크기를 비교하고, 비교에 따라 이득을 결정하고, 증강된 음향 신호를 제공하기 위하여 결정된 이득으로 주파수 성분 이외의 부분을 포함하는 음향 신호의 적어도 일부를 증폭하기에 적합한 콘트롤러를 포함한다.
선택적으로, 스피커와 마이크로폰은 전화기 핸드셋의 일부이다. 선택적으로, 주변 잡음으로부터 증강된 음향 신호의 적어도 하나의 에코를 제거하는 에코 제거기를 포함한다. 선택적으로, 에코 제거기는 주변 잡음으로부터 증강된 음향 신호의 단 하나의 에코를 제거한다.
본 발명의 실시예에 따른, 음향 신호와 무관한 주변 잡음을 극복하기 위하여 음향 신호를 증강하기 위하여 이득을 결정하는 방법은, 음향 신호의 측정 중에 복수의 고점치(high-point value)를 결정하는 단계와, 고점치를 평균하는 단계와, 그 평균을 잡음 크기와 비교하는 단계와, 비교에 응답하여 음향 신호를 증강할 이득을 결정하는 단계를 포함한다.
선택적으로, 복수의 고점치를 결정하는 방법은 음향 신호의 상이한 시간 구간 중의 고점치를 결정하는 단계를 포함한다. 선택적으로, 복수의 고점치를 결정하는 방법은 상이한 길이를 가지는 음향 신호의 시간 구간의 고점치를 결정하는 단계를 포함한다. 선택적으로, 복수의 고점치를 결정하는 단계는 최고값들을 결정하는 단계를 포함한다. 대안으로서 또는 부가적으로, 복수의 고점치를 결정하는 단계는 최근 값이 더 큰 가중치를 가지도록 자중된 음향 신호의 최고치들을 결정하는 단계를 포함한다. 선택적으로 고점치를 평균하는 단계는 기하 평균을 계산하는 단계를 포함한다.
도 1은 본 발명의 일 실시예에 따른 잡음 보상 시스템(30)의 개략도이다. 시스템(30)은 스피커(32)를 통해 소리나게 되는 입력 음향 신호[Sinput(t)]를 수신한다. 예컨대, Sinput(t)는 전화 대화의 원격단으로부터 수신된다. 제어기(40)는 입력 음향 신호 Sinput(t)를 수신하고 스피커(32) 근처의 잡음 N(t)를 추정하여, 잡음 보상된 음성 입력 신호 Sinput(t)인 잡음 보상 입력 신호 S'(t)를 공급한다.
본 발명의 일 실시예에서, 입력 음향 신호 Sinput(t)는 잡음이 필터된 입력 음향 신호인 S(t)를 공급하는 잡음 제거기(95)를 통과한다. 잡음 제거기(95)는 스피커(32) 주변의 잡음 수준과 무관한게 동작한다. 잡음 제거기(95)는 음향 신호가 없을 때 선택적으로 잡음을 측정하여 잡음의 스텍트럼을 결정한다. 그 다음, 잡음 제거기(95)는 선택적으로 음성을 포함하는 신호부의 스펙트럼형에서 잡음의 스펙트럼형을 제거한다. 대안으로서 또는 부가적으로, 임의의 다른 종래의 잡음 제거기, 예컨대 본 명세서에 참조로 포함된 헬프(Helf) 씨 등의 미국 특허 제5,550,924호에 개시된 것 및/또는 유(Yoo)씨의 "잡음성 음성의 정적 시간-주파수 영역 모델링을 위한 중간 대역 음향 정보의 활용(Utilizing Interband Acoustical Information For Modeling Stationary Time-Frequency Regions of Noisy Speech),[Acousting, Speech, and Signal processing, 1999, IEEE proceedings pages 809-812, Vol 2]"에 개시된 것이 이용될 수 있다. 대안으로서 또는 부가적으로, 잡음 제거기는 주파수 성분이 결정된 후 제어기(40)에 구현될 수 있다. 따라서, 제어기(40)에 의해 수행되는 스펙트럼 추출은 잡음 제거기를 위해서도 이용될 수 있다.
본 발명의 일 실시예에서, 추정 잡음(noise estimate) N(t)는 스피커(32) 주변의 마이크로폰(34)에 의해 수집된 입력 잡음 신호 n(t)에 응답하여 생성된다. 선택적으로, 입력 잡음 신호 n(t)는 증폭기(36)에 의해 증폭되어 에코 제거기(EC)(96)를 통과하여 추정 잡음 N(t)를 공급한다. 에코 제거기(96)는 입력 잡음 신호 n(t)로부터, 마이크로폰(34)에 의해 수집되거나 음향 결합(acoustic coupling)에 기인하여 n(t)로 흘러들어간 출력 신호 S'(t)의 에코를 제거한다.
본 발명의 일 실시예에서, 에코 제거기(96)는 잡음 신호 n(t)의 최대 상관 세그먼트인 출력 신호 S'(t)의 미리 결정된 크기(예컨대, 수 밀리초)의 최근의 세그먼트를 찾는다. 에코 제거기(96)는 선택적으로 세그먼트의 상관값(correlation value)과 그들의 시간차(time difference)를 결정한다. 본 발명의 일 실시예에서, 에코 제거기(96)는 음향 신호 S'(t)를 세그먼트들 간의 시간차만큼 지연시키고 결정된 자동 상관값으로 지연된 음향 신호를 승산한다. 추정 잡음 N(t)는 승산되고 지연된 음향 신호가 감지된 잡음 신호 n(t)로부터 차감될 때 선택적으로 계산된다. 따라서, 에코 제거기(96)는 비록 정확도 면에서는 떨어지지만 종래의 다른 에코 제거기 보다 간단하다. 대안으로서 또는 부가적으로, 임의의 다른 에코 제거기, 예컨대 정응형 필터를 활용하는 에코 제거기가 이용될 수 있다.
대안으로서 또는 부가적으로, 잡음 n(t)가 에코 제거기를 통과하지 않는다. 본 발명의 모범적 실시예에서, 에코 제거기는 마이크로폰(34)이 스피커(32) 근처에 있지 않을 때, 예컨대 마이크로폰이 스피커 근처가 아니라 잡음원 근처에 있을 때는 이용되지 않는다. 예컨대, 주 잡음원, 예컨대 자동차의 모터가 알려지면, 마이크로폰(34)는 모터 근처에 장착된다. 본 발명의 모범적 실시예에서, 스피커(32)와 마이크로폰(34)은 상호 90°로 벌어져서, 예컨대 수직 또는 대향하도록 전화기에 장착된다. 이 모범적 실시예에서, 시스템(30)은 에코 제거기를 포함하지 않는다.
본 발명의 일 실시예에서, 잡음 보상 시스템(30)은 유선 또는 셀룰라 전화기셋트의 근처의 잡음을 보상한다. 선택적으로, 시스템(30)은 전화기 안에 위치할 수 있다. 대안으로서 또는 부가적으로, 시스템(30) 또는 그 일부가 전화기를 지원하는 전화기 네트워크에 포함될 수 있다. 마이크로폰(34)은 본래의 용도에 부가하여 입력 잡음 신호 n(t)를 수집하기 위해 선택적으로 통상의 전화기가 이용될 수 있다. 대안으로서 또는 부가적으로, 마이크로폰(34)은 전화기 세트에 부착된 핸즈 프리 마이크로폰이다. 더 대안으로서 또는 부가적으로, 마이크로폰(34)는 전화기 세트의 정규의 마이크로폰과는 독립적이다.
본 발명의 다른 실시예에서, 시스템(30)은 음악 시스템, 화상 회의 시스템, 라디오 및/또는 텔레비젼과 같은 다른 음성 및/또는 음향 시스템과 함께 이용된다. 본 발명의 일 실시예에서, 잡음 N(t)를 추정하는데 이용되는 잡음 신호를 수집하는데 복수의 마이크로폰이 이용된다. 하나 또는 그 이상의 마이크로폰(34)이 보상될 잡음 수준을 결정하기 위하여 잡음원, 청취자 근처 및/또는 임의의 다른 적당한 장소의 근처에 위치할 수 있다. 본 발명의 일 실시예에서, 단일의 입력 신호 Sinput(t)는 복수의 스피커(32)를 통해 울려퍼진다. 따라서, 시스템(30)은 각 추정 잡음 N(t)에 응답하여 각 스피커(32)를 위하여 입력 신호를 상이하게 보정한다.
도 2A는 본 발명의 실시예에 따르는 제어기(40)의 개략적인 블록도이다. 제어기(40)는 선택적으로 입력 신호 S(t)와 추정 잡음 신호 N(t)를 미리 정해진 비율로 (예컨대 매 10밀리초 또는 12.5밀리초) 디지털 샘플 스트림으로서 수신한다. 대안으로서 또는 부가적으로, 입력 신호 S(t) 및/또는 잡음 신호 N(t)는 아날로그 신호로 공급되어 적절한 D/A 변환기(도시되지 않음)를 이용하여 디지털 스트림으로 변환된다. 본 발명의 일 실시예에서, 음향 신호 S(t) 및 잡음 신호 N(t)의 미리 정해진 수의 샘플은 버퍼(110, 116)에 각각 축적된다. 선택적으로 축적된 샘플은 각각 FFT 유닛(111, 115)를 통과하여 입력 신호 S(t)의 복수의 주파수 성분에 대한 값 S1, S2,..., Sn)과 잡음 신호 N(t)에 대한 복수의 복수의 각 주파수 성분에 대한 값(N1, N2,...,Mm)을 공급한다. 대안으로서 또는 부가적으로, 다른 푸리에 변환 방법이 이용될 수 있으며 FFT가 필수적이지 않다.
본 발명의 일 실시예에서, FFT의 각 빈(bin)은 각 주파수 성분에 대응한다. 대안으로서, 각 주파수 성분은 각 빈의 그룹으로 이루어진다. 본 발명의 일 실시예에서, 예컨대 극한값을 제외한 실질적으로 모든 주파수 성분은 동일한 수의 빈으로 형성된다. 대안으로서 또는 부가적으로, 주파수 성분의 대역은 미리 정해지고, 이하에서 도 2B를 참조하여 설명되는 바와 같이, 각 주파수 대역에 포함되는 빈의 값은 주파수 성분의 값을 결정하는 데 이용한다.
주파수 성분값(S1, S2,...Sn)은 음향 신호 S(t)의 명료성을 높이기 위하여 미리 정해진 강화 체계에 따라 특정 주파수 성분을 강화하는 증강 필터(112)에 의하여 필터될 수 있다. 증강 필터(112)는 음향 신호를 강화하기 위하여 주된 음성 주파수를 포함하는 주파수 성분들의 크기를 증강할 수 있다. 증강 필터(112)의 모범적 실시예가 도 6을 참조하여 이하에서 설명된다. 증강된 주파수 성분값이 잡음 N(t) 및 음향 신호 S(t)에 반응하여 논리 유닛(77)에 의해 결정된 각각의 이득 인자로써 (gi)승산 유닛(117)에서 승산된다. 따라서, 각각의 주파수 성분은 증강 필터(117)에 의해 잡음 독립적인 값으로 승산되고, 승산 유닛(117)에 의해 잡음 종속적 값으로 승산된다.
잡음 종속적 보정을 수행하기 전에 증강 필터(112)에 의하여 음향 신호를 강화함으로써, 잡은 종속적 보정은 음향 신호 S(t)의 음성 성분을 주로 다루게된다. 이하에서 설명되는 바와 같이, 잡은 종속적 보정은 음향 신호의 왜곡을 야기하지 않도록 일반적으로 모든 주파수 성분에 대해 동일하다. 반면에, 잡음 독립적 보정은 각 주파수 성분에 대해 상이한 이득을 이용할 수 있다. 비록 상이한 주파수 성분에 상이한 이득을 적용하는 것이 음향 신호를 왜곡시킬 수 있지만, 이러한 왜곡의 영향은 알려져있고 보정된 신호, 즉 잡음 외부의 값에 종속적이지 않다. 이하에 기술되는 본 발명의 일 실시예에서, 승산 유닛(117)의 이득 {gi}은 잡음 종속적 및 독립적 보정의 결합이다.
대안으로서 또는 부가적으로 승산 유닛(117) 앞에 증강 필터(112)를 위치시키기 위하여, 증강 필터(112)(또는 제2 증강 필터)는 승산 유닛(117)의 출력단에서 동작할 수 있어야한다. 주파수 성분의 단일 추출에 기초하여 잡음 종속적 및 잡음 독립적 보정을 수행하는 것은 잡음 보상 시스템(30)의 복잡도를 감소시킬 수 있다.
승산된 주파수 성분값은 보정된 음향 신호 S''(t)를 제공하기 위하여 역FFT(IFFT)에 의해 시간 영역으로 역변환될 수 있다. 본 발명의 일 실시예에서,가중된 평균 유닛(133)은 이하에서 기술되는 것처럼, 논리 유닛(77)에 의해 성성된 각각의 가중치(b1, b2; b1 + b2 = 1)에 기초하여 조정된 음향 신호 S''(t)와 입력 음향 신호 S(t)의 가중된 합 SW(t)을 생성한다. 가중된 합은 필요하다면 소프트 제한기(100)에 공급되어 조정되어 가중된 합이 스피커(32)의 동작 범위를 초과하지 않도록 할 수 있다. 제한기(100)로부터의 신호는 D/A 변환기(31)에 의하여 아날로그 신호로 변환되어 세기 증폭기(power amplifier)(52)에 의하여 증폭되고 스피커를 통해 울려퍼질 수 있다. 대안으로서, D/A 변환기(31)는 가중된 평균 유닛(133) 앞이나 제한기(100) 앞에 위치할 수 있다.
본 발명에 따른 일 실시예에서, 제한기(100)는 가중된 합 SW(t)을 미리 정해진 증폭기(52)의 동작 범위내로 제한될 수 있다. 대안으로서 또는 부가적으로, 가중된 합 SW(t)의 범위는 제한기(100)에 의해 제한되고, 이는 증폭기(52)의 현 동적 범위에 기초하여 주기적으로 결정된다. 선택적으로, 제한기(100)는 대칭 한계, 즉 -한계 < SW(t) < +한계사이로 제한될 수 있다. 본 발명의 모범적인 실시예에서, 제한기(100)는 아래의 함수를 수행한다.
여기서, A는 0 과 1사이의 임의의 값이고, x는 제한된 신호이고, F(x)는 제한된 신호이다.
대안으로서 또는 부가적으로, 제한기(100)를 사용함에 있어서, 세기증폭기(52)의 동적 범위가 제어기(40)로 인입되는 신호의 동적 범위보다 커서, 제어기(40)는 세기 증폭기(52)의 동적 범위 이상의 신호를 실질적으로 생성할 수 없다. 이하에서 설명되는 것처럼, 더 대안으로서 또는 부가적으로, 논리 유닛(77)에서 생성되는 이득은 제한기(100)의 필요성을 실질적으로 제거하는 압축 인자를 포함한다. 그러나, 본 발명의 몇 실시예에서, 제한기(100)는 왜곡을 방지하기 위하여 논리 유닛(77)에서 생성되는 이득이 압축 인자를 포함하는 경우에도 이용될 수 있다.
본 발명의 일 실시예에서, 논리 유닛(77)은 세기 수준(ESi)의 음향 신호 S(t)의 각 주파수 성분과, 세기 수준(ENi)의 잡음 신호 N(t)의 각 주파수 성분에 대해 수신한다. 선택적으로, 절대값의 제곱(ABS2)을 생성하는 세기 결정 유닛(113)이 증강 필터(112)로부터의 S(t)의 주파수 성분의 증강된 값을 수신하고, 그로부터 각 주파수 성분의 세기(ESi)를 결정한다. 본 발명의 일 실시예에서, FFT 유닛(15)에서 생성되는 잡음 신호 N(t)의 주파수 성분은 세기 결정 유닛(114)(ABS2)를 통과하여 각 주파수 성분에서 잡음 신호 N(t)의 세기(ENi)를 계산한다. 선택적으로, 잡음 세기 신호(ENi)는 마스킹 유닛(119)를 통과하여 이하에서 도 7을 참조하여 설명되는 것처럼, 사람의 청력을 고려하여 조정된다.
본 발명의 일 실시에에서, 음향 신호 S(t)와 잡음 신호 N(t)는 동일 수(즉, n = m) 및 동일 구간의 주파수 성분으로 분할된다. 대안으로서, 음향 신호 S(t)와 잡음 신호 N(t)는 상이한 수의 주파수 성분으로 분할된다. 본 발명의 일 실시예에서, 잡음 신호 N(t)는 더 큰 대역폭을 포함하는 스펙트럼으로 변환된다. 선택적으로, 이 실시예에서, 잡음 신호 N(t)는 음향 신호 S(t)보다 더 주파수가 높은 성분으로 분할되며, 선택적으로 하나 또는 둘의 주파수 성분이 더 많다. 본 발명의 일 실시예에서, 잡음 신호 N(t)의 부가적인 주파수 성분은 마스킹 유닛(119)에 의하여 이용되어 저대역에 영향을 주는 고대역 잡음 주파수를 참작하게 된다. 선택적으로, 논리 유닛(77)에 공급되는 잡음 및 음향 신호는 동일 수의 주파수 성분을 포함한다.
본 발명의 몇 실시예에서, 음향 신호 S(t) 및 잡음 신호 N(t)는 충분히 높은 공통의 샘플 추출률로 추출되어, 잡음 신호의 더 많은 수의 주파수 성분의 생성을 허용한다. 대안으로서, 잡음 신호 N(t)는 음향 신호 S(t)보다 더 높은 주파수에서 추출되어 추출된 신호 n(t)로부터 더 많은 수의 주파수 성분이 생성될 수 있다. 선택적으로, 신호의 용이한 비교를 위하여 잡음 신호 N(t)는 음향 신호 S(t)의 샘플 추출률로 하향된다. 대안으로서, 음향 신호 S(t)는 0값이 부가되어 더 높은 주파수로 패드(pad)된다.
본 발명의 일 실시예에서, 음성 활동 검출(VAD) 유닛(250)은 음향 신호 S(t)가 음향 신호를 포함하지 않을 때(즉, 음절 사이의 침묵기)를 결정하고 논리 유닛(77)을 비활성화시킨다. 따라서, 음절 사이의 음향 신호 S(t)에 포함된 잡음 주변 잡음 n(t)를 극복하기 위하여 증폭되지 않는다. 선택적으로, VAD 유닛(250)이 음향 신호를 포함하지 않는 입력을 결정할 때, 논리 유닛(77)은 음향 신호 S(t)가 음성을 포함하지 않은 이전의 시간에서 출력 이득 {gi}를 공급한다. 선택적으로 또는 대안적으로, 논리 유닛(77)의 하나 또는 그 이상의 요소는 전력 소비를 줄이기 위하여 출력단에 제공되지 않는다. 선택적으로, 음향 신호 S(t)가 음성을 포함하지 않는다고 결정될 때, 음향 신호 S(t)가 실질적으로 변경없이 스피커(32)에 공급된다. 대안으로서, 음향 신호가 포함되지 않을 때는 음향 신호 S(t)가 절단되고 아무런 신호도 소리나지 않는다.
본 발명의 일 실시예에서, VAD 유닛(250)은 음성 임계치와 신호의 진폭을 비교하는 것에 기초하여 음향 신호 S(t)가 음향 신호를 포함하고 있는지의 여부를 결정한다. 선택적으로, 음성 임계치는 시작 잡음 수준, 즉 전화 통화 시작시의 잡음 크기의 수준에 응답하여 설정된다. 대안으로서, 음성 임계치는 공장에서 보정되거나 미리 결정된다. 추가의 대안으로서, 음성 임계치는 계속적 및/또는 주기적으로 획득된 잡음 크기에 응답하여 적응적으로 조정된다. 본 발명의 일 실시예에서, 임계치는 측정된 잡음의 정수배, 예컨대 잡음의 3-5배로 설정된다. 대안으로서 또는 부가적으로, 임의의 다른 종래의 VAD 동작 방법이 이용될 수 있다.
본 발명의 일 실시예에서, 제어기(40)의 반복(iteration) 처리가 미리 정해진 수의 샘플, 예컨대 100-1000 샘플에 적용되고, 이는 선택적으로 샘플 추출률에 의한다. 선택적으로, 제어기(40) 반복 처리는 2의 급수, 즉 128, 256 또는 512의 수의 샘플에 적용되어 FFT를 이용하는 푸리에 변환을 수행토록 할 수 있다. 본 발명의 일 실시예에서, 각 반복에 이용되는 샘플의 수는 요구되는 정확도(많은 수의 샘플을 요구함)와 지연 시간의 단축(적은 샘플이 필수적임) 사이에서 타협하도록 조정된다. 선택적으로, 사용자는 특정 시간의 반복 처리에 이용될 심플 수를 조정할 수 있다. 본 발명의 일 실시예에서, 지연 시간은 스피커(32)로의 그들의 원래 신호로부터의 총 신호 지연 시간에 따라 설정된다. 예컨대, 시스템(30)이 전화기에서 이용되면, 신호의 라운드 트립 지연(RTD)은 상대적으로 낮고, 상대적으로 많은 지연(예컨대, 20 밀리초)을 야기하는 많은 수의 샘플이 이용될 것이다. 그러나, RTD가 상대적으로 높으면, 시스템의 지연은 5 내지 10 밀리초로 제한되어 FFT가 수행되는 샘플의 수가 감소될 것이다.
선택적으로, 각 반복 처리가 샘플의 비중첩 그룹에 대해 수행된다. 대안으로서, 각 반복 처리가 하나 또는 그 이상의 이전의 반복 처리에 사용된 샘플을 부분적으로 중첩하는 샘플 그룹에 대해 수행된다. 본 발명의 모범적 실시예에서, 매 128개의 샘플이 수집될 때마다 최근에 수집된 256 개의 샘플 그룹에 대해 반복 처리가 수행된다. 본 발명의 일 실시예에서, 중첩되는 샘플량은 음성 품질대 전력 소비의 함수로서 조정된다. 전력 소비를 최소화하는 것이 바람직할 때는, 적은 반복 중첩이 적게되거나 또는 중첩되지 않고 반복 처리가 수행된다. 높은 음성 품질이 요구될 때는, 높은 중첩도로써 반복 처리를 더 자주 수행한다. 선택적으로, 사용자는 바람직한 반복 처리를 선택할 수 있다.
푸리에 변환을 이용하여 주파수 성분을 생성하는 대안으로서, 도 2B를 참조하여 이하에서 설명하는 바와 같이 대역 통과 필터군을 이용하여 음향 신호 및 잡음 신호의 주파수 성분을 생성한다. 필터군을 이용하면 시스템(30)이 실질적으로 지연 발생없이 동작할 수 있게 한다.
도 2B는 본 발명의 일 실시예에 따른 제어기(40')의 개략적인 블록도이다.제어기(40')는 제어기(40)와 유사하고 제어기(40) 대신에 시스템(30)에 이용될 수 있다. 다음의 설명에서, 제어기(40')의 일부 요소만이 제어기(40)와 다르다. 제어기(40')에서는, 음향 신호 S(t) 및 잡음 신호 N(t)이 각각의 대역 통과 필터(BPF)군(62, 64)를 통과하여, 이로써 복수의 음향 신호의 주파수 성분[S1(t), S2(t),...,Sn(t)] 및 잡음 신호의 주파수 성분[N1(t), N2(t),...,Nm(t)]이 생성된다.
음성 및 잡음 신호의 주파수 성분의 수는 제어기(40)와 관련하여 위에 설명한 임의의 실시예에 따라 결정된다. 본 발명의 일 실시예에서, 필터군(62)의 수는 요구되는 품질에 따라 10개 내지 60개이고, 주파수 범위는 제어기(40)의 경우와 같다. 선택적으로, 제어기(40)의 주파수 범위는 음향 주파수 범위, 예컨대 20 Hz 내지 20 Khz를 포함한다. 대안으로서, 제어기(40)의 주파수 범위는 사람의 가청 주파수 영역, 예컨대 4 내지 7 kHz를 포함한다. 추가의 대안으로써 또는 부가적으로, 주파수 범위는 가령 시스템(30)이 애완 동물용이면 더 높거나 낮아질 수 있다.
본 발명의 일 실시예에서, 1 kHz까지의 주파수 성분은 약 100 Hz의 대역폭을 가지며, 더 높은 범위의 주파수 성분은 주파수에 대수적으로 관계되는 대역폭을 가진다. 선택적으로, 주파수 성분의 주파수는 음향 및/또는 사람 귀의 다른 특성에 따라 선택된다. 예컨대, 사람 귀에 감지되는 실질적으로 상이한 주파수가 주파수 성분에 포함될 수 있다.
본 발명의 몇몇의 모범적인 실시예에서, 주파수 성분으로의 분할은 공지의 방식으로 임계 음성 대역(critical voice band)에 따라 수행된다. 이 실시예에 이용되는 주파수 성분의 수는 중요하다고 인정되는 주파수 범위에 의존한다. 0 내지 20 kHz의 범위에 대하여, 이 모범적 실시예는 선택적으로 24개의 주파수 성분을 이용한다. 300 내지 4000 kHz의 범위에서는 이 실시예는 450, 570, 630, 700, 840, 1000, 1170, 1370, 1600, 1850, 2150, 2500 및 2900 Hz의 주파수가 중심이 되는 주파수 성분을 선택적으로 이용한다. 선택적으로, 350 Hz 및/또는 3400 Hz 부근이 중심이 되는 하나 또는 둘의 추가의 주파수 성분이 이용될 수 있다.
본 발명의 다른 모범적 실시예에서, 주파수 성분은 400-510, 510-630, 630-770, 770-920, 920-1080, 1080-1270, 1270-1480, 1480-1720, 1720-2000, 2000-2320, 2320-2700 및 2700-3150 Hz의 주파수 범위를 포함한다. 400 Hz 이하의 주파수와 3150 Hz 이상의 주파수는, 비록 위 주파수 성분 범위의 주파수보다 의미가 적지만, 처음 주파수 성분 및 마지막 주파수 성분에 의해 포함된다.
위 실시예는 임의의 다른 주파수 성분의 세트가 이용하는 것을 제한하지 않는다. 특히, 많은 수의 주파수 성분, 예컨대 32, 48 또는 심지어 65개의 주파수 성분이 이용될 수 있다. 대안으로서 또는 선택적으로, 주파수 성분의 범위는 일부 중첩되거나 음향 신호의 전 주파수 범위보다 적은 부분을 포함할 수 있다.
본 발명의 일 실시예에서, 필터군(62, 64)는 선택적으로 2, 3, 4, 5 또는 6단의 버터워쓰(Butterworth) 필터로 이루어진다. 본 발명의 모범적 실시예에서, 시스템(30)의 저전력 소모가 요구되면, 2단 또는 3단이 이용된다. 높은 정확도가 요구되면, 적어도 5단 또는 6단 이상이 선택적으로 이용된다. 본 발명의 일 실시예에서, 단의 수는 필터가 사람 귀 내부에서 음성을 넘는 잡음 효과의 마스킹을 개시하도록 선택된다.
선택적으로, 주파수 성분의 한계는 필터의 3-dB 점이다. 본 발명의 일 실시예에서, 필터의 최대 증폭치는 약 1이다. 대안으로서 또는 부가적으로 필터군(62) 및/또는 필터군(64)의 일부 또는 모든 필터는 체비세프(Chebyshev), 베셀(Bessel) 또는 엘립틱(Elliptic) 필터와 같은 상이한 필터이다. 선택적으로, 대응하는 주파수 성분의 잡음 또는 음성 필터는 동일 특성을 가진다. 대안으로서 또는 부가적으로 대응하는 주파수 성분의 잡음 및 음성 필터의 적어도 일부는 상이한 특성을 가진다. 예컨대, 본 발명의 몇 실시예에서, 필터군(62)의 필터는 일부 또는 전부가 증강 필터(112)(선택적으로 이 실시예에서는 증강 필터가 제거된다)의 증강 처리를 수행한다. 이 실시예에서, 증강 처리를 수행하는 필터군(62)은 필터군(64)와 상이할 수 있다.
본 발명의 일 실시예에서, 제어기(40')는 각 음성 주파수 성분 신호 Si(t)를 제곱하는 승산기군(70)을 포함하여 세기 신호 ESi(t)를 유도한다. 세기 신호 ESi(t)은 각 저역 통과 필터(LPF)(76)에 의해 선택적으로 필터되고 그 다음 샘플러(도시되지 않음)에 의해 추출되어 주파수 성분 세기값 ESi를 생성한다. 샘플러 이용의 대안으로서, 논리 유닛(77)이 자신의 입력단에서 값이 판독될 때 이를 추출할 수 있다. 저역 통과 필터(76)는 샘플 추출전 선택적으로 세기 신호 ESi(t)을 완만하게 하여 추출 과정에서 대표성 없은 요동 값이 선택되지 않도록 한다. 유사하게, 잡음 주파수 성분 Ni(t)가 승산기군(68)의 각 승산기를 통과하여 각 신호가 제곱된다. 제곱된 신호는 저역 통과 필터군(73)에 의해 선택적으로 필터되고 추출되어 주파수 성분 세기 신호 ESi(t)을 생성한다.
본 발명의 일 실시예에서, LPF(73 및/또는 76)는 1차 또는 2차 필터로 이루어진다. 선택적으로, 저역 통과 필터는 각 주파수 성분의 저주파 경계 Fmin에 의존하는 -3 dB 점을 가진다. 본 발명의 모범적 실시예에서, -3 dB 점은 약 Fmin/k이며, 여기서 k는 약 1.5 내지 2 사이의 값으로서, 세기 신호의 직류 성분을 포획하도록 한다. 대안으로서 또는 부가적으로, 하나 이상의 저역 통과 필터는 가 주파수 성분의 고주파 경계에 의존하는 -3 dB 점을 가진다. 추가의 대안으로서 또는 부가적으로, 임의의 다른 적절한 저역 통과 필터가 이용될 수 있다. 더 대안으로서 도는 부가적으로, 세기 신호(통상 평균 세기와 동일함)의 직류 성분을 동적으로 추출하기 위한 임의의 적절한 방법 및/또는 필터가 이용될 수 있다.
승산 유닛(117) 다음에, 주파수 성분 신호 S1(t), S2(t),...,Sn(t)가 예컨대 신호 가산기(65)에 의해 선택적으로 결합된다.
도 3은 본 발명의 일 실시예에 따른 논리 유닛(77)의 개략적 도면이다. 논리 유닛(77)은 복수의 이득 결정 유닛으로 이루어지고, 이득 결정 유닛은 이득 인자를 결정하고, 이득은 세기 벡터 {ESi}로 표현되는 음향 신호 S(t)의 다양한 평가치에 따라 음향 신호 S(t)의 주파수 성분을 승산하는데 이용된다. 도 3의 실시예에서, 복수의 이득 결정 유닛은 발성된 음성의 증강 유닛(91), 자동 이득 유닛(92), 포만트 유닛(93) 및 압축 유닛(94)를 포함한다. 그러나, 논리 유닛(77)은 본 발명의 각 실시예에서 더 적은 유닛 및/또는 추가의 유닛을 포함할 수 있다. 승산기(99)는 이득 결정 유닛에 의해 결정된 이득 인자를 선택적으로 수신하여 이득 인자 {gi}를승산 유닛(117)(도 2A 또는 도 2B에 도시됨)에 공급한다. 대안으로서, 각 유닛(91, 92, 93, 94)는 이전 유닛의 이득을 수신하여 누적 계산된 이득을 제공한다.
논리 유닛(77)은 현재 세기 벡터 {ESi}로 표현되는 음향 신호 S(t)이 발성된 음성과 발성안된 음성을 포함하는 지의 여부를 결정하여 발성 음성 식별 유닛(89)을 선택적으로 포함한다. 종래 기술에서 알려진 바와 같이, 성문(聲門) 펄스의 스펙트럼 형상에 의해 생성되는 소리(sound)는 발성된 음성 소리(voiced speech sound)로 칭해지고, 반면에 성대(vocal cord)의 지원없이 발음되는 소리는 비발성된 음성 소리(unvoiced speech sound)로 칭해진다.
본 발명의 일 실시예에서, 식별 유닛(89)은 음향 신호 S(t)의 포만트를 식별하고, 따라서 음향 신호가 발성된 음성을 포함하는지를 결정한다. 선택적으로, 음향 신호 S(t)가 지배적인 피치(pitch), 예컨대 다른 모든 피치보다 실질적으로 큰 진폭이 진폭을 가지는 피치를 포함하면, 신호는 발성된 음성을 포함하고 있다고 여겨진다. 대안으로서 또는 부가적으로, 식별 유닛(89)은 음향 신호 S(t)의 낮은 주파수의 에너지를 높은 주파수의 에너지와 비교한다. 선택적으로, 낮은 주파수의 에너지가 높은 주파수의 에너지보다 미리 결정된 임계값보다 더 크다면, 음향 신호 S(t)는 발성된 음성을 포함하는 것으로 고려된다. 본 발명의 모범적인 실시예에서, 음향 신호 S(t)의 주파수 대역은 높은 주파수와 낮은 주파수로 실질적으로 평등하게 분할된다. 대안으로서, 높은 주파수와 낮은 주파수사이의 분할은 음향적 고려에 따라 임의의 다른 점이 될 수 있다.
본 발명의 일 실시예에서, 식별 유닛(89)은 신호가 발성된 음성의 명백한 특성을 가질 때에만 신호가 발성된 음성을 포함하는 것으로 결정한다. 이 이유는 발상된 음성 증강 유닛(91)이 신호가 발성된 음성을 포함하는 것으로 결정될 때에만 신호를 변경하는 이득을 생성하기 때문이다.
대안으로서 또는 부가적으로, 발성된 음성을 식별하는 임의의 다른 방법, 예컨대 전술한 유의 논문 및/또는 케이트씨 등의 미국 특허제4,468,804호에 기재된 방법이 이용될 수 있다.
발성된 음성 증강 유닛(91)은 식별 유닛(89)로부터 음향 신호 S(t)가 발성된 음성을 포함하는지의 여부의 식별자를 수신한다. 본 발명의 일 실시예에서, 음향 신호 S(t)가 발성된 음성을 포함하면, 증강 유닛(91)은 발성된 음성을 이송하는 음향 신호 S(t)의 주파수 성분을 강화하는 데 적합한 발성된 음성 강화 벡터(p1, p2,...,pn)를 선택한다. 선택적으로, 발성된 음성 강화 벡터(p1, p2,...,pn)는 실질적으로 모든 발성된 음향 신호에 이용되는 미리 결정된 벡터를 포함한다. 대안으로서, 음성 강화 벡터(p1, p2,...,pn)는 세기 벡터 {ESi}의 함수이다.
본 발명의 일 실시에에서, 음성 강화 벡터(p1, p2,...,pn)는 낮은 주파수의 세기를 강화하거나 및/또는 높은 주파수의 세기를 낮춘다. 예컨대, 음성 강조 벡터(p1, p2,...,pn)는 증가하지 않는 비변화 함수(non-increasing monotonous function)이다. 본 발명의 일 실시예에서, 식별 유닛(89)이 비발성된 음성을 식별하면, 음성 강화 벡터(p1, p2,...,pn)는 음향 신호 S(t)의 진폭을 변화시키지 않는유닛 벡터와 동일하다.
본 발명의 일 실시예에서, 증강 유닛(91)은 세기 벡터 {ESi}에 음성 강화 벡터(p1, p2,...,pn)가 곱해진 것인 변형된 세기 벡터 {ESMi}도 제공한다. 선택적으로, 변형된 세기 벡터 {ESMi}는 자동 이득 유닛(92)에 의해 음향 신호 S(t)의 세기를 나타내는 데 이용된다.
본 발명의 일 실시예에서, 자동 이득 유닛(92)는 음향 신호 S(t)의 통상 세기와 잡음 신호 N(t)의 통상 세기를 비교한 것에 기초하여 음향 신호 S(t)에 대한 제1 이득 인자(Gain 1)를 결정한다. 선택적으로 통상의 세기는 최근 구간에 걸친 신호의 이력에 기초하여 결정된다. 제1 이득 인자는 음향 신호 S(t)가 일반적으로 잡음 신호 N(t)보다 위에 있도록 선택적으로 결정되고, 포만트 유닛(93)은 현 시점의 음향 신호 및 잡음 신호에 대한 특정한 비교를 수행한다. 본 발명의 일 실시예에서, 자동 이득 유닛(92)은 도 4를 참조하여 이하에서 설명된다. 선택적으로, 자동 이득 유닛(92)은 포만트 유닛(93)이 음향 신호 S(t)를 표현하는 데 이용하는 증폭된 세기 벡터 {Gain 1 x ESMi}도 공급한다.
본 발명의 일 실시예에서, 포만트 유닛(93)은 음향 신호 S(t)의 하나 이상의 포만트를 식별하고, 따라서 제2 이득 인자(Gain 2)를 생성한다. 제2 이득 인자(Gain 2)는 음향 신호 S(t)의 미리 정해진 포만트 그룹에 대응하는 주파수 성분의 세기가 잡음 신호 N(t)의 주파수 성분에 대응하는 세기보다 적어도 미리 정해진 마진 이상의 값을 가지는 것을 보장하는 데 요구되는 최소 이득으로서 선택적으로 선택된다. 선택적으로, 미리 정해진 마진은 모든 주파수 성분에 대해 동일하다. 대안으로서, 상이한 주파수 성분에 대해 상이한 마진이 적용될 수 있다. 본 발명의 일 실시예에서, 미리 정해진 마진은 3 내지 10 dB이고, 바람직하게는 6 dB이다. 본 발명의 일 실시예에서, 포만트 유닛(93)은 도 5A 및 도 5B를 참조하여 아래에 설명된다. 선택적으로, 포만트 유닛(93)은 음향 신호 S(t)를 나타내는 압축 유닛(94)에 의해 이용되는 증폭된 세기 벡터 {Gain 2 x Gain 1 x ESMi}도 공급한다.
본 발명의 일 실시예에서, 자동 이득 유닛(92)로부터의 증폭된 세기 벡터 {Gain 1 x ESMi}는 사전 포만트 평활기(pre-formant smoother)(97)을 통과하여 증폭된 세기 벡터를 완만하게 한다. 평활은 선택적으로 수행되는데, 포만트에 대한 검색은 음향 신호 S(t)의 엔벨로프에 대해 수행되는 것이고 중요하지 않은 많은 피크를 포함하는 음향 신호 자체에 대해 수행되는 것이 아니기 때문이다.
평활된 벡터 {ESMi'}내의 각 주파수 성분값은 인근의 주파수 성분과의 가중된 평균값과 선택적으로 동일하다. 본 발명의 일 실시예에서, 사전 포만트 평활기(97)는 아래의 수식에 따라 수행된다.
대안으로서, 임의의 다른 평활 함수, 예컨대 인근의 주파수 성분의 많은 수를 고려하는 함수 및/또는 다른 가중 인자를 이용하는 함수를 이용할 수 있다.
본 발명의 일 실시예에서, 포만트 유닛(93)은 평활된 잡음 세기 벡터 {ENi}를 수신하고, 이를 본 명세서에서 {ENi'}라 칭한다. 선택적으로, 평활된 잡음 세기 벡터 {ENi'}는 사전 포만트 평활기(97)과 동일한 기능을 수행하는 잡음 평활기(98)에 의해 생성된다. 대안으로서, 잡음 평활기는 포만트 평활기(97)과 상이한 기능을 수행하는 것일 수 있으며, 선택적으로 덜 평활된 신호를 생성하는 것일 수 있다. 잡음 세기 벡터 {ENi}는 평활된 {Gain 1 x ESMi}에 부합하도록 평활될 수 있다.
본 발명의 일 실시예에서, 압축 유닛(94)은 조정된 음향 신호 S(t)의 세기를 감소시키는 데 적합한 압축 벡터(c1, c2,..., cn)을 생성한다. 선택적으로, 압축 벡터(c1, c2,..., cn)는 조정된 음향 신호 S(t)의 세기를 세기 증폭기(52) 및/또는 스피커(32)의 동작 범위내로 제한되도록 하는데 적합하다. 대안으로서 또는 부가적으로, 압축 벡터(c1, c2,..., cn)는 조정된 음향 신호 S(t)의 세기를 원래의 음향 신호 S(t)와 실질적으로 동일한 수준 또는 임의의 다른 요망되는 수준까지로 감소시키는데 적합하다.
선택적으로, 압축 유닛(94)은 각 주파수 성분에 대해 주파수 성분내의 신호대잡음비(SNR)를 결정한다. 선택적으로, 주파수 성분의 SNR이 6 dB보다 크면, 벡터 ci의 압축 이득은 SNR의 함수인 감쇄값(음의 이득)에 의해 대역내 음향 신호를 감쇄시키도록 설정된다. 본 발명의 일 실시예에서, 음의 이득의 크기는 SNR이 6 dB 일 때 0 dB(비감쇄)의 값을 가지고, SNR이 약 24 dB 일 때, 5 dB 의 값을 가지는 비변화 함수에 따른다. 선택적으로, 음의 이득의 최대값은 5 dB 이다. 본 발명의 일 실시예에서, 음의 이득(Y)의 크기는 아래의 함수에 따라 정해진다.
대안으로서 또는 선택적으로, 압축 유닛(94)은 {ESi}로 나타나는 음향 신호 S(t) 내의 피크 주파수 성분을 검색하는데, 피크 주파수 성분은 자신의 부근 주파수 성분 또는 모든 다른 주파수 성분보다 실질적으로 큰(예컨대, 8 내지 10 dB 큼) 진폭을 가진다. 선택적으로, 압축 벡터(c1, c2,..., cn)는 피크 주파수 성분의 진폭을 5 dB 정도 감소시키거나 피크 주파수 성분의 진폭이 다른 그 외의 주파수 성분보다 큰 정도의 비율만큼 감소시킨다.
추가의 대안으로서 또는 부가적으로, 압축 벡터(c1, c2,..., cn)는 잡음에 의해 마스크되는 주파수 성분도 감쇄시킨다. 선택적으로, 잡음보다 실질적으로 낮은(예컨대, 적어도 6 dB) 진폭을 가지는 음향 신호 S(t)내의 주파수 성분을 실질적으로 소멸시키도록 0을 곱한다.
추가의 대안으로서 또는 부가적으로, 출력 신호를 실질적으로 왜곡시키지 않을 다른 압축 함수가 이용된다. 더 추가의 대안으로서 또는 부가적으로, 압축 유닛(94)이 이용되지 않고 제한기(100)이 압축을 수행하는 책임을 진다. 더 추가의 대안으로서 또는 부가적으로, 제한기(100) 및 압축 유닛(94)이 이용되지 않고 압축도 수행되지 않는다. 선택적으로, 위 대체례에서, 세기 증폭기(52)는 입력 음향 신호의 신호 범위보다 더 큰 동작 범위를 가짐으로써, 스피커(32)에 의해 소리나게되는 입력 신호의 증폭을 허용한다.
본 발명의 일 실시예에서, 포만트 유닛(93)에 의해 제공되는 증폭된 세기 벡터 {Gain 2 x Gain 1 x ESMi}는 압축 유닛(94)에 제공되기 전에 사전 압축 평활기(107)에 의해 평활화된다. 선택적으로, 사전 압축 평활기(107)은 사전 포만트 평활기(97)이 수행하는 것과 동일하거나 유사한 평활 기능을 수행한다. 평활기(107)의 대안으로서, 압축 유닛(94)이 사전 포만트 평활기(97)의 평활된 출력을 수신하고, 선택적으로 Gain 2를 승산하여 음향 신호 S(t)을 표현한다. 본 발명의 일 실시예에서, 압축 유닛(94)는 평활된 잡음 세기 벡터 {ENi'}를 잡음 신호 N(t)를 표현하는데 이용한다. 대안으로서 또는 부가적으로, 압축 유닛(94)은 평활된 잡음 세기 벡터 {ENi} 이외의 것을 이용할 수 있다. 추가의 대안으로서 또는 부가적으로, 압축 유닛(94)은 평활되지 않은 잡음 세기 벡터 {ENi}를 이용한다.
본 발명의 일 실시예에서, 승산기(99)는 출력 인자, 예컨대 강화 벡터 {pi}, Gain 1, Gain 2 및 압축 벡터 {ci}를 수신하고, 수신된 값의 곱인 이득 벡터, 예컨대 gi- pi* Gain 1 * Gain 2 * ci를 생성한다. 승산기(99)를 포함하는 논리 유닛(77)의 대안으로서 또는 그에 부가하여, 하나 또는 그 이상의 자동 이득 유닛(92), 포만트 유닛(93) 및 압축 유닛(94)이 하나 또는 그 이상의 전단게 유닛의 출력 인자를 수신한다. 본 발명의 일 실시예에서, 포만트 유닛(93)은 Gain 1을 수신하여 Gain 1과 Gain 2의 곱을 제공하며, 압축 유닛(94)은 강화 벡터, Gain 1 및 Gain 2를 수신하여 압축 벡터(c1, c2,..., cn)을 생성하고 이에 따라 이득벡터(g1, g2,..., gn)을 생성한다.
보정된 세기 벡터 {ESi}에 대해 동작하는 유닛(92, 93, 94)의 대안으로서 또는 부가하여, 하나 또는 그 이상의 유닛이 원래의 세기 벡터 {ESi}에 대해 동작하거나 부분적으로 보정된 세기 벡터에 대해 동작한다.
본 발명의 일 실시예에서, 논리 유닛(77)은 가중된 평균 유닛(133)에 의해 이용되는 가중치(b1, b2)를 동적으로 결정하는 가중치 결정 유닛(138)을 포함한다. 선택적으로, 주변의 잡음이 상대적으로 크면, 즉 Gain 1이 상대적으로 높으면, 변형된 음향 신호 S''(t)에게 주어지는 가중치(b1)는 상대적으로 높다. 즉 0.5 보다 크다. 선택적으로, 변형된 음향 신호 S''(t)에게 주어지는 가중치(b1)는 Gain 1의 비감소 함수이다. 즉, Gain 1이 증가함에 따라, 변형된 음향 신호 S''(t)에 더 큰 가중치가 주어진다. 본 발명의 일 실시예에서, 기중치(b1)는 Gain 1/max 이며, max 는 Gain 1의 가능한 최대값이다. 대안으로서 또는 부가적으로, Gian 1이 미리 정해진 값, 예컨대 0.3 보다 작으면 가중치(b1)는 0으로 설정된다. 추가의 대안으로서 또는 부가적으로, Gain 1이 미리 정해진 값, 즉 3 이상이면, 가중치(b1)는 1로 설정된다.
대안으로서, 가중치(b1, b2)는 잡음 {ENi}의 함수이거나 미리 정해진 값, 예컨대 0.5의 값을 가진다. 대안으로서 또는 부가적으로, 사용자는 가중치(b1, b2)의 값을 사용자의 기호대로 조정할 수 있다.
본 발명의 일 실시예에서, b1 및 b2는 저역 통과 필터를 통과한 후에 가중된평균 유닛(133)에 공급되어, 가중치의 빈번한 요동을 방지한다. 대안으로서 또는 부가적으로 가중치 결정 유닛(138)에서 수행되는 함수는 시간 평활 효과를 포함한다.
도 4는 본 발명의 일 실시예에 따른 자동 이득 유닛(92)의 개략 블록도이다. 자동 이득 유닛(92)은 변형된 세기 벡터 {ESMi}로 표현되는 음향 신호 S(t)에 대한 대표적이고 전형적인 세기 Hs 를 결정하는 신호 이력 유닛(406)을 포함할 수 있다. 부가하여, 자동 이득 유닛(92)은 잡음 세기 벡터 {ENi}에 의해 표시되는 잡음 신호 N(t)에 대한 대표적인 통상의 세기 Hn 을 결정하는 잡음 이력 유닛(411)을 포함한다. 대표적인 전형적 값은 상이한 시간 구간에 걸쳐 복수의 최대값의 평균으로서 계산될 수 있다. 본 발명의 일 실시예에서, 신호 이력 유닛(406)과 잡음 이력 유닛(411)은 실질적으로 동일하다. 대체안으로서, 이력 유닛(406)과 잡음 이력 유닛(411)이 상이할 수 있다. 예컨대, 음성의 전형적 세기 Hs는 잡음의 전형적 세기 Hn보다 이전의 신호에 더 높은 가중치를 줄 수 있다.
본 발명의 일 실시예에서, 각 이력 유닛(406)은 가산기(408)로 이루어지며, 가산기는 주파수 성분의 수신된 모든 세기의 합을 생성한다. 대안으로서, 가산기(408)는 필터(62)로부터의 주파수 성분 신호의 합을 생성하고 그 합의 세기 및/또는 원래의 음향 신호 S(t)의 세기를 계산한다. 그 합은 단기간 최대값 레지스터(410) 또는 장기간 최대값 레지스터(412)에 공급될 수 있다. 본 발명의 일 실시예에서, 각 레지스터(410, 412)은 다음과 같이 자신의 새로운 값을 결정한다. 수신된 값이 내부적으로 보유된 값보다 크면, 새로운 값은 저장값과 동등하다. 그렇지않으면, 단기간 레지스터(410) 내의 값의 감소가 장기간 레지스터(412)내의 값의 감소보다 빠른 상황에서, 새로운 값이 감소된 내부적으로 저장된 값과 동등하게 된다. 본 발명의 일 실시예에서, 단기간 레지스터(410)내 값은 한 단어 시간안에 감소하여 레지스터(410)내 값이 한 단어에 걸친 최대 세기와 관련된다. 본 발명의 일 실시예에서, 장기간 레지스터(412)내 값은 한 문장 또는 약간의 여러 문장 시간동안 감소하여, 레지스터(412)내 값은 상대적으로 긴 시간 구간에 걸친 최대값과 관련된다.
본 발명의 일 실시예에서, 이력 유닛(406)의 레지스터(410, 412)는 이력 유닛(411)의 각 레지스터(410, 412)와 각각 동일한 값을 가진다. 대안으로서, 이력 유닛(406)의 레지스터(410, 412)는 이력 유닛(411)의 레지스터(410, 412)의 감소값과 상이한 감소값을 가진다. 본 발명의 일 실시예에서, 단일 이력 유닛(406)의 장기간 레지스터(412)내 값은 약 256 ms 동안에 걸쳐, 단일 이력 유닛(406)의 단기간 레지스터(410)내 값은 약 64 ms 동안에 걸쳐 약 10-30% 감소한다. 선택적으로, 잡음 이력 유닛(411)의 장기간 레지스터(412)는 1초 정도의 구간에 걸쳐, 잡음 이력 유닛(411)의 단기간 레지스터(410)은 25-100 ms 동안에 걸쳐 약 10-30% 감소한다.
본 발명의 일 실시예에서, VAD 유닛(250)이 음향 신호가 음성을 포함하지 않는다는 식별자를 제공할 때, 신호 이력 유닛(406)의 레지스터(410, 412)내 값은 감소하지 않는다. 선택적으로, 음향 신호가 음성을 포함하지 않을 때, 레지스터(410)는 내부값보다 입력값이 더 큰 세기를 가지는 경우에도 갱신되지 않는다. 대안으로서 또는 부가적으로, 단기간 레지스터(410)내 값은 음향 신호가 음성을 포함하지않는다고 판단되면 0 이 된다. 본 발명의 일 실시예에서, 유사한 행태가 잡음 이력 유닛(411)에서 이루어진다.
본 발명의 일 실시예에서, 수신 값이 레지스터 내부값보다 큰 경우 하나 이상의 레지스터(410, 412)내의 값에 대한 즉각적 갱신 대신에, 갱신이 단계적으로 이루어져 급격한 갱신을 야기하지 않도록 한다. 선택적으로, 갱신은 감소 경사보다는 가파른 미리 정해진 경사에 제한된다.
세기 신호 {ESMi} 및/또는 {ENi}에 기초하여 동작하는 자동 이득 유닛(92)의 대안으로서, 자동 이득 유닛(92)이 주파수 성분의 샘플에 기초하여 동작한다. 선택적으로, 주파수 성분의 값이 가산되고 그 제곱이 취해지고, 이 제곱이 자동 이득 유닛(92)에 이용된다.
본 발명의 일 실시예에서, 평군 유닛(414)은 단기간 레지스터(410) 및 장기간 레지스터(412)내 값의 평균을 계산하여, 전형적인 세기값 Hs 또는 Hn 을 계산한다. 본 발명의 일 실시예에서, 평균 유닛(414)는 기하 평균을 구한다. 대안으로서, 평균 유닛(414)는 산술 평균 또는 메디안(median)과 같은 임의의 다른 평균을 계산한다. 선택적으로, 자동 이득 유닛(92)은 분할기(108) 및 제곱근 유닛(109)를 더 포함하며, 제곱근 유닛은 이력값의 비율의 제곱근, 즉을 계산하여, 세기의 비율로부터 이득값을 제공한다.
레지스터(410, 412)만을 포함하는 이외에, 이력 유닛(406 및/또는 411)은 다른 감소 시간을 가지는 추가의 레지스터를 포함할 수 있다. 대안으로서 또는 부가적으로, 하나 이상의 대표적인 통상의 세기값을 결정하는 데 이용될 수 있는 임의의 다른 방법이 이용될 수 있다.
본 발명의 일 실시예에서, 자동 이득 유닛(92)은 잡음 신호 N(t)의 주파수 확장에 대한 평탄화(또는 밀도) 식별값(FLAT)를 제공하는 잡음 평탄화 유닛(noise flatness unit)(407)를 포함한다. 인자 Gain 1 의 증폭은 평탄화 식별값으로 선형적으로 증가할 수 있는데, 예컨대 잡음이 더 넓은 스펙트럼을 가지면 증폭이 더 커진다. 선택적으로, 잡음 신호 N(t)가 백색 잡음과 유사하면, Gain 1 은 1에 가까운 값을 가지고, 잡음이 특정 주파수에서 구형파와 유사하면, Gain 1은 낮은 값, 예컨대 0.2가 된다.
본 발명의 일 실시예에서, 잡음 평탄화 유닛(407)은 잡음 세기값 {ENi}의 주파수 성분의 정규화된 평균값(NA)를 계산한다. 선택적으로, 평균은 정규화되고 최대 세기값, 즉 maxi{ENi}로써 분할 된다. 본 발명의 일 실시예에서, 평탄화 식별값(FLAT)은 다음 수식에 의하여 정규화된 평균(NA)으로부터 계산된다.
본 발명의 일 실시예에서, 평탄화 식별값(FLAT)은 FLAT의 이전 값과 더불어 적시에 평균화되어, 그 값의 강한 요동을 방지한다. 선택적으로, 평탄화 식별값은 1차 또는 2차 저역 통과 필터를 이용하여 이전 시간의 값으로써 필터된다. 대안으로서 또는 부가적으로, 강한 요동을 방지하기 위하여 임의의 다른 적절한 방법이이용될 수 있다.
선택적으로, 승산기(405)는 Gain 1은 FLAT, 이력값 비율의 제곱근(), 및 미리 정해진 고정 증폭값(min_gain)의 곱으로서 생성된다. 본 발명의 일 실시예에서, 미리 정해진 증폭값(min_gain)은 약 1이다. 대안으로서, 미리 정해진 증폭값(min_gain)은 약 2 내지 2.5이다.
도 5A 및 도 5B는 본 발명의 일 실시예에 따르는, 포만트 유닛(93)에 의해 생성된 이득에 의한 보정의 전과 후의 모범적인 음향 신호(209)에 관한 그래프이다. 선택적으로, 포만트 유닛(93)은 음향 신호 S(t)의 미리 정해진 수(예컨대 3)의 포만트, 즉 엔벨로프 피크를 식별한다. 미리 정해진 수의 포만트를 선택하는 것은 저주파 대역에서 시작하여 더이상의 포만트가 선택되지 않을 때까지 하거나, 미리 정해진 수만큼의 포만트가 선택될 까찌 수행될 수 있다. 본 발명의 일 실시예에서, 포만트 유닛(93)은 세기 신호 {ESMi}에 기초하여 포만트가 위치한 주파수 성분을 식별한다. 예컨대, 신호(209)에서, 포만트 유닛(93)은 처음의 세 포만트로서, 주파수 성분 3(S3), 주파수 성분 8(S8) 및 주파수 성분 12(S12)를 식별한다.
미리 정해진 수의 포만트가 위치한 각 주파수 성분에 대해, 포만트 유닛(93)은 주파수 성분의 SNR, 즉 주파수 성분의 잡음 신호 N(t)의 세기와 주파수 성분의 음향 신호 S(t)의 세기의 차이를 결정할 수 있다. 선택적으로, 포만트 유닛(93)은 SNR이 최소인(음수 포함) 주파수 성분을 선택할 수 있다. 신호(209)에서는 주파수 성분 8의 SNR이 가장 작다. 본 발명의 일 실시예에서, 포만트 유닛(93)의 출력 이득(Gain 2)은 최소 SNR을 미리 정해진 값, 예컨대 약 3-6 dB이 되게 하는 데 요구되는 이득과 동일하다. 대안으로서 또는 부가적으로, 포만트 유닛(93)의 출력 이득(Gain 2)은 SNR을 동적으로 조정된 수준이 되게 한다. 선택적으로, 동적으로 저정된 수준은 잡음 수준, 음향 신호 S(t)의 수준 및/또는 Gain 1의 값에 반응하여 조정된다. 선택적으로, 출력 이득(Gain 2)은 잡음 및 신호의 세기 비율의 제곱근을 취하고 약 2-4(3-6 dB과 등가임)사이의 고정 마진을 곱하여 계산된다.
신호(209)에 Gain 2를 곱한 후, 신호(209)의 스펙트럼은 도 5B에 도시된 바와 같다. 선택적으로, 최소 SNR이 미리 정해진 임계치보다 크면, 즉 3 - 6 dB 보다 크면, Gain 2는 1로 설정된다. 본 발명의 일 실시예에서, 증폭이 요구되면, 미리 정해진 임계치는 Gain 2가 최소 SNR로 유도하도록 하는 수준과 같아진다. 대안으로서, 증폭이 요구되면, 미리 정해진 임계치는 Gain 2가 최소 SNR로 유도하도록 하는 수준과 다를 수 있으며, 예컨대 더 낮을 수 있다. 더 낮은 미리 결정된 임계치를 이용하면 증폭 변화의 경우를 그것이 진정으로 요구되는 선까지 제한할 수 있다.
본 발명의 일 실시예에서, 포만트의 미리 정해진 수는 음향 신호 S(t)내 포만트의 수보다 적다. 선택적으로, 포만트의 미리 정해진 수는 2 내지 4를 포함하며, 3일 수 있다. 음향 신호 S(t)는 미리 정해진 수의 포만트보다 적은 포만트를 가질 수 있다. 이러한 경우, 미리 정해진 수보다 적은 포만트가 발견되더라도 최소 SNR의 결정은 발견된 포만트로부터 수행된다.
포만트 유닛(93)은 시스템(30)이 음성을 포함하지 않는 음향 신호, 예컨대 음악 신호를 처리하는 경우에도 이용될 수 있다.
도 6은 본 발명의 일 실시예에 따르는 증강 필터(112)의 이득 그래프이다. 선택적으로, 도시된 바와 같이, 낮은 주파수와 높은 주파수가 증강 플터(112)에 의해 감쇄되고, 반면에 중심 주파수는 증폭된다. 본 발명의 일 실시예에서, 음향 신호 S(t)의 총 세기는 증강 필터(112)에 의해 변경되지는 않는다. 선택적으로, 증강 필터(112)은 각 주파수 성분 Si(t)에 대해 각 이득을 곱하는 승산기를 포함한다. 대안으로서, 복수의 주파수 성분의 적어도 한 그룹을 증강 필터(112)의 하나의 이득 인자로서 곱할 수 있다.
도 6에 도시된 이득을 가지는 증강 필터(112)의 대안으로서, 증강 필터(112)의 이득은 음향 신호를 증강시키거나 및/또는 잡음을 감소시키는 임의의 다른 함수에 따를 수 있다. 본 발명의 일 실시예에서, 증강 필터(112)의 이득은 시뮬레이션에 기초하여 결정된다. 대안으로서 또는 부가적으로, 증강 필터(112)의 이득은 공장에서의 보정시 조정될 수 있다. 또한, 증강 필터(112)의 이득은 현장 테스트의 결과에 따라 주기적으로 조정될 수 있으며, 사용자에 의해 조정될 수도 있다. 마지막 대안은 특히 청력 감퇴자에게 유용하다.
도 7은 본 발명의 일 실시에에 따르는, 잡음 세기 신호 스펙트럼(122) 및 마스크된 잡음 세기 신호 스펙트럼(123)의 예시적인 그래프이다. 마스킹 유닛(119)은 신호 스펙트럼(122)의 스펙트럼 피크(251)을 찾고, 각 피크(251)에 대해 미리 결정된 경사로써 피크(251)로부터 서로 반대방향으로 하향하는 선(301, 302)쌍을 계산한다. 선택적으로, 미리 결정된 경사는 약 40-60 dB/decade 이다. 대안으로서 또는 부가적으로, 상이한 피크(251)로부터의 선(301, 302)은 음향적 고려에 따라 상이한경사를 가질 수 있다. 또한, 선(301, 302)는 동일 피크에 대해, 예컨대 음향적 고려에 따라 상이한 경사를 가질 수 있다. 마스크된 잡음 세기 신호 스펙트럼(123)은 각 점에 대해 그 점에서의 선(301, 302)의 최대값과 동일할 수 있다. 선택적으로, 마스킹 유닛(119)은 실시간으로 동작하며, 원래의 잡음 세기값 대신에 각 주파수 성분에 대한 마스크된 값을 제공한다.
대안으로서, 사람 귀에 대한 주파수의 상호 작용을 고려하여 임의의 다른 마스킹 유닛이 이용될 수 있다. 또한, 예컨대 주파수 성분의 수가 상대적으로 적고 또는 도 2B에 도시된 필터(64)가 주파수 성분값을 생성하기 위해 이용될 때는, 마스킹 유닛(119)이 이용되지 않을 수 있다. 필터(64)가 주파수 성분값의 생성을 위해 이용되면, 필터는 마스킹 작업을 수행하도록 설계될 수 있다.
본 발명의 일 실시예에서, 예컨대 전화기에 속하는 마이크로폰(34) 및 스피커(32)에서, 시스템(30)은 전화기 사용자가 말하는 때를 결정하는 음성 검출기를 포함한다. 선택적으로, 사용자가 말하고 있을 대는, 시스템(30)은 원격 음향 신호 S(t)를 보정하는 일을 멈춘다. 따라서, 시스템(30)이 사용자의 말을 잡음과 관련시키지는 않으며, 사용자의 음성보다 원격지로부터 수신된 음향 신호의 진폭을 강화하지 않는다.
도 8은 본 발명의 일 실시예에 따른 음성 검출기(81)의 개략 블록도이다. 음성 검출기(81)는 선택적으로 마이크로폰(34)으로부터 신호를 수신하고, 수신된 신호가 언제 음향 신호를 포함하는지를 결정한다. 본 발명의 일 실시예에서, 수신 신호가 언제 음향 신호를 포함하는지를 결정하는 음성 검출기(81)는 피크 검출기(82)및/또는 경사 검출기(slope detector)(84)를 포함한다. 선택적으로, 피크 검출기(82)는 수신 신호를 임계치와 비교하고 수신 신호가 위 임계치보다 클 경우 음성 표시자(speech indentification)를 제공한다. 경사 검출기(84)는 수신 신호의 진폭의 경사를 추종할 수도 있다. 본 발명의 일 실시예에서, 경사 검출기(84)는 경사가 미리 정해진 증가하는 방향의 경사를 초과할 때 음성 개시 표시자를 제공하고, 경사가 미리 정해진 감소하는 방향의 경사 미만일 때 음성 종료 표시자를 제공한다.
선택적으로, 음성 논리 유닛(86)은 지시자를 수신한다. 본 발명의 일 실시예에서, 음성 개시 표시자 및 음성 표시자 모두가 수신되면, 논리 유닛(86)은 시스템(30)의 신호 보정을 중단한다. 선택적으로, 음성 종료 표시자가 수신되고 음성 표시자가 수신되지 않으면, 논리 유닛(86)은 시스템(30)의 신호 보정이 활성화된 후, 약 0.5 내지 1.2 초, 예컨대 1초의 계수 구간(count period)를 개시한다. 선택적으로, 시스템(30)의 신호 보정은 계수 기간 동안에 음성 개시 표시자와 음성 표시자 모두가 수신되지 않을 때, 활성된다. 따라서, 사용자가 말하고 있으면, 원격단으로부터의 음향 신호 S(t)는 사용자의 말을 넘지 않도록 증강되지 않는다.
본 발명의 일 실시예에서, 시스템(30)에 의한 신호 보정이 비활성화는 것은 원격 음향 신호 S(t)가 실제로 음향 신호를 포함하는지와 무관하게 원격 음향 신호 S(t)의 VAD 신호를 무음으로 설정하는 것을 포함한다. 대안으로서 또는 부가적으로, 시스템(30)에 의한 신호 보정을 비활성화하는 것은 b1 을 0 으로 설정하는 것을 포함한다.
본 발명의 일 실시예에서, 피크 검출기(83)에 의해 이용되는 임계치는 수신 신호에 음성이 없을 경우 수신 신호의 크기에 적응적으로 반응하여 조정된다. 선택적으로, 잡음 평균화 유닛(87)은 논리 유닛(86)이 마이크로폰(34)으로부터의 수신 신호가 음성을 포함하지 않는다고 결정한 최근의 구간 동안 수신된 신호의 크기를 평균낸다. 본 발명의 일 실시예에서, 평균은 적분기(integrator)에 의해 구해진다. 선택적으로, 피크 검출기(82)에 이용되는 임계치는 잡음 평균화 유닛(87)으로부터의 평균 잡음 수준을 상회하는 미리 정해진 갭이된다. 적응형 임계치를 이용하면 사용자의 발성과 주변 잡음이 큰 경우와 사용자의 발성과 주변 잡음이 작은 경우에 유용하다.
본 발명의 일 실시예에서, 피크 검출기(82)에 인입된 신호는 저역 통과 필터(88)을 통과하여 수신 신호내의 천이 변화가 논리 유닛(86)의 출력에 영향을 주는 것을 방지한다. 대안으로서 또는 부가적으로, 피크 검출기(82) 및/또는 경사 검출기(84)에 인입된 신호는 천이 신호가 출력에 영향을 주는 것을 방지하기 위하여 히스테리시스 기능부를 통과한다.
본 발명의 일 실시예에서, 증가 경사 및 감소 경사는 미리 정해진 동일 크기, 예컨대 0.5 * Max_amplitude / 200 ms를 가지는데, 여기서 Max_amplitude는 마이크로폰에 의해 수신된 음향 신호의 미리 정해진 최대값이거나 스피커에 대한 최대 진폭이다. 대안으로서 또는 부가적으로, 미리 정해진 증가 경사 및 감소 경사는 상이한 크기를 가진다.
음성 검출기(81)의 대안으로서 또는 부가적으로, VAD(250)과 유사한 검출기및/또는 전술한 미국 특허 제5,524,148에 개시된 검출기와 같은 임의의 음성 검출기 또는 VAD가 이용될 수 있다. 또는, 음성 검출기(81) 또는 그것의 변형물이 VAD(250) 대신에 이용될 수 있다. 또한, 음성 검출기(81)가 사용되지 않을 수도 있다. 스피커(32)가 마이크로폰(34)에 인접하게 위치하면, 시스템(30)이 사용자의 말을 보상하여 사용자가 말하는 중에도 수신 신호를 증강하는 경우가 야기될 수 있다.
본 발명의 일 실시예에서, 시스템(30)은 7개의 유닛을 포함하는 것으로 설명되었는데, 즉 증강 유닛(91), 자동 이득 유닛(92), 포만트 유닛(93), 압축 유닛(94) 제한기(100), 증강 필터(112) 및 가중치 결정 유닛(138)로서, 이것들은 음향 신호 S(t)에 대한 이득을 계산하여 직접적 또는 간접적으로 음향 신호 S(t)에 영향을 준다. 본 발명의 일 실시예에서, 증강 유닛(91), 증강 필터(112) 및 제한기(100)는 입력 잡음에 무관하게 동작하고, 자동 이득 유닛(92) 가중치 결정 유닛(138), 포만트 유닛(93) 및 압축 유닛(94)은 잡음에 종속하여 이득값을 제공한다.
따라서, 본 발명의 이러한 실시예들에서, 입력 잡음에 반응하여 음향 신호 S(t)를 변화하는 유닛들은 동일한 이득이로 음향 신호 S(t) 전체를 변경하거나[예컨대, 유닛(92, 93)], 음향 신호의 피크의 상대 위치를 변화하지 않도록 한다[예컨대, 유닛(94)]. 그러므로, 잡음 종속적 보정은 신호 왜곡을 방지한다. 본발명의 몇몇 실시예에서, 압축 유닛(94)이 이용되지 않고, 따라서 모든 잡음 종속적 보정이 동일한 이득이로 실질적으로 전체 신호를 증폭한다.
일반적으로, 유닛(92, 93)은 이득 인자를 결정하고, 증강 유닛(91) 및 증강 필터(112)는 입력 잡음에 독립적인 사전 왜곡을 수행하고 압축 유닛(94), 제한기(100) 및 가중치 결정 유닛(138)은 에너지를 절감한다.
잡음 종속적 인자와 잡음 독립적 인자 모두를 가지는 승산 유닛(117)의 이득 {gi}의 대안으로서, 본 발명의 몇 실시예에서는, 승산 유닛(117)의 이득은 잡음 종속적 인자만을 가진다. 증강 유닛(91)에 의해 생성된 것과 같은 잡음 독립적 인자는 증강 필터(112) 및/또는 별개의 승산기에 의해 선택적으로 적용될 수 있다. 대안으로서 또는 부가적으로, 증강 유닛(91)이 이용되지 아니할 수 있다. 예컨대 압축 유닛(94)이 이용되지 않는 본 발명의 몇 실시예에서, 승산 유닛(117)의 이득은 실질적으로 모든 주파수 성분에 대해 동일하다.
본 발명의 몇 실시예에서, 본 발명의 잡음 보상은 적극적 잡음 억제 방법과 결합된다. 선택적으로, 본 발명의 구체례에 따라 음향 신호 S(t)의 보정에 이용되는 잡음 추정은 적극적으로 억제된 잡음에 기초한다. 대안으로서, 잡음 추정은 보정전 원래의 잡음에 기초한다.
전술한 구체적 실시예들은 하드웨어, 소프트웨어 또는 이들의 결합으로 구현될 수 있다. 처리는 디지털 처리, 아날로그 처리 또는 이들의 결합을 포함할 수 있다. 특히, 전술한 필터는 아날로그 또는 디지털 필터이다.
전술한 방법들은 복수의 단계가 병행되어 수행되거나, 단계의 순처를 가꾸거나 구현례를 다소 변형하는 것을 포함하는 다양한 방식으로 변형될 수 있다는 것은 잘 알 수 있을 것이다. 예컨대, FFT가 주파수 성분값을 생성하기 위해 이용될 때,더 작은 수의 주파수 성분의 주파수 성분 값을 생성할 수 있도록, 약간의 인접 FFT 값이 부가될 수 있다. 전술한 방법 및 장치에 대한 기술은 방법을 수행하는 장치 및 장치에 이용되는 방법을 포함한다는 것도 잘 알 수 있는 것이다.
본 발명은 실시예에 제한되지 않는 방식으로 자세히 설명되었으며, 이들 설명이 본 발명의 범위를 제한하는 것은 아니다. 한 실시예에 관하여 기술된 특징 및/또는 방법은 다른 실시예에 적용될 수 있으며, 본 발명의 모든 실시예가 어떤 한 실시예에 관한 특정 도면 또는 설명에 개시된 모든 특징 및/또는 방법을 다 포함하는 것은 아니라는 것을 이해하라. 본 발명의 기술 분야에 통상의 지식을 자진 자라면 본 명세서의 기재로부터 변형례를 도출할 수 있을 것이다.
전술한 몇 실시예는 발명자의 숙고하에 최고 양태를 기술한 것이며, 따라서 본 발명에 필수적이지 않은 구성 요소, 구성 요소의 작용 또는 세부 사항 및 구성이 포함될 수 있다. 본 명세서에 기술된 구성 및 작용은 구성 및 작용이 상이하지만 동일 기능을 수행하는 당업계 공지의 등가물로 대체될 수 있다. 따라서, 본 발명의 범위는 청구항에 기재된 구성 요소 및 제한에 의하여만 결정된다.
본 발명의 시스템 또는 방법을 이용하면 잡음 환경하에서도 필요한 소리를 보다 명확하게 잘 들을 수 있도록 하는 잡음 보정 시스템의 제공과 잡음 보정이 가능하다.

Claims (49)

  1. 음향 신호 외부의 주변 잡음을 극복하기 위하여 음향 신호를 처리하는 방법에 있어서,
    상기 음향 신호의 주파수 성분내의 음향 신호의 크기와 상기 주변 잡음의 주파수 성분내의 주변 잡음의 크기를 비교하는 단계와,
    상기 비교에 응답하여 이득을 결정하는 단계와,
    상기 결정된 이득으로써, 상기 음향 신호의 주파수 성분내에 포함되지 않는 주파수 성분을 적어도 하나 포함하여 상기 음향 신호의 적어도 일부를 증폭하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 음향 신호의 크기는 음향 신호의 세기(power)를 포함하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 상기 주변 잡음의 주파수 성분내의 잡음의 크기는 마스크된 잡음의 세기를 포함하는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 신호의 적어도 일부를 증폭하는 상기 증폭 단계는 음향 신호의 비교된 주파수 성분을 포함하는 일부를 증폭하는 것인 방법.
  5. 제4항에 있어서, 신호의 적어도 일부를 증폭하는 상기 증폭 단계는 상기 결정된 이득으로써 신호를 전체를 증폭하는 단계를 포함하는 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 적용될 이득을 결정하는 단계는 상기 음향 신호의 주파수 성분의 주파수 대역 내의 신호대잡음비가 임계치(threshold value)를 넘도록 만드는 이득을 결정하는 단계를 포함하는 것인 방법.
  7. 제6항에 있어서, 상기 임계치는 상기 신호 및/또는 잡음의 시간에 따른 크기 변화에 따라 동적으로 조정되는 것인 방법.
  8. 제6항에 있어서, 상기 임계치는 미리 정해진 값인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 음향 신호의 주파수 성분 내의 음향 신호의 크기를 비교하는 단계는 상기 음향 신호의 포만트(formant)를 포함하는 주파수 성분을 비교하는 단계를 포함하는 것인 방법.
  10. 제9항에 있어서, 상기 음향 신호의 포만트를 포함하는 주파수 성분을 비교하는 단계는 상기 음향 신호의 복수의 주파수 성분 중 최소 신호대잡음비를 가지는 주파수 대역의 주파수 성분을 비교하는 단계를 포함하는 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계와 모든 주파수 성분보다 적게 선택하는 단계를 더 포함하는 방법.
  12. 제11항에 있어서, 상기 모든 주파수 성분보다 적게 선택하는 단계는 상기 음향 신호의 상기 포만트를 포함하는 주파수 성분을 선택하는 단계를 포함하는 것인 방법.
  13. 제12항에 있어서, 상기 음향 신호의 포만트를 포함하는 주파수 성분을 선택하는 단게는 포만트를 포함하는 주파수 성분을 미리 결정된 수만큼 선택하는 단계를 포함하는 것인 방법.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서, 상기 선택된 주파수 성분으로부터 상기 음향 신호의 주파수 성분을 재선택하는 단계를 더 포함하는 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 음향 신호의 적어도 일부를 증폭하는 단계는 상기 비교에 응답하여 결정된 상기 이득을 포함하는 복수의 이득으로부터 결합된 이득에 의하여 증폭하는 단계를 포함하는 것인 방법.
  16. 제1항 내지 제15항에 있어서, 주변 잡음이 있는 상태에서 증폭된 신호를 소리나게 하는 단계를 더 포함하는 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 음향 신호의 주파수 성분 및 상기 잡음의 주파수 성분은 실질적으로 동일한 주파수 대역에 걸쳐 확장되는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 음향 신호의 주파수 성분은 주파수들의 대역을 포함하는 것인 방법.
  19. 음향 신호 외부의 주변 잡음을 극복하기 위하여 음향 신호를 처리하는 방법에 있어서,
    상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계와,
    상기 각 주파수 성분의 각각의 잡음 독립적 이득으로 상기 각 주파수를 증강시키는 단계와,
    상기 각 주파수 성분의 각각의 잡음 종속적 이득으로 상기 각 주파수를 승산하는 단계
    를 포함하는 방법.
  20. 제19항에 있어서, 상기 복수의 주파수 성분을 증강된 음향 신호로 재결합하는 단계를 더 포함하는 방법.
  21. 제19항 또는 제20항에 있어서, 상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 10 내지 24개의 주파수 성분으로 분할하는 단계를 포함하는 것인 방법.
  22. 제19항 또는 제20항에 있어서, 상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 100개 이상의 주파수 성분으로 분할하는 단계를 포함하는 것인 방법.
  23. 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 복수의 주파수 성분이 실질적으로 상호 겹치지 않도록 분할하는 단계를 포함하는 것인 방법.
  24. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 각 잡음 독립적 이득으로써 상기 각 주파수 성분을 증강시키는 단계는 미리 정해진 신호 독립적 이득(signal-independent gain)으로써 증강시키는 단계를 포함하는 것인 방법.
  25. 제19항 내지 제24항 중 어느 한 항에 있어서, 상기 각 잡음 종속적 이득으로써 상기 각 주파수 성분을 승산하는 단계는 동일한 잡음 종속적 이득으로써 실질적으로 모든 주파수 성분을 승산하는 단계를 포함하는 것인 방법.
  26. 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 증강 단계와 승산 단계는 하나의 기능 요소에 의하여 수행되는 것인 방법.
  27. 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 증강 및 승산은 별개의 기능 요소에 의하여 수행되는 것인 방법.
  28. 제19항 내지 제27항 중 어느 한 항에 있어서, 상기 잡음 독립적 이득은, 상기 음향 신호가 발성된 음성(voiced speech)을 포함하고 있으면, 발성된 음성 증강 인자를 포함하는 것인 방법.
  29. 제19항 내지 제28항 중 어느 한 항에 있어서, 상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 상기 음향 신호에 대해 푸리에 변환을 적용하는 단계를 포함하는 것인 방법.
  30. 제19항 내지 제28항 중 어느 한 항에 있어서, 상기 음향 신호를 복수의 주파수 성분으로 분할하는 단계는 상기 음향 신호를 대역 통과 필터군에 통과시키는 단계를 포함하는 것인 방법.
  31. 음향 신호 외부의 주변 잡음을 극복하기 위하여 음향 신호를 처리하는 방법에 있어서,
    상기 음향 신호를 수신하는 단계와,
    상기 주변 잡음의 크기에 따라 상기 음향 신호를 증강시키는 단계와,
    상기 증강된 음향 신호와, 상기 수신된 음향 신호의 가중된 합(weighted sum)을 출력으로 제공하는 단계
    를 포함하는 방법.
  32. 제31항에 있어서, 상기 음향 신호를 증강시키는 단계는 상기 음향 신호의 복수의 주파수 성분을 각각의 이득으로 승산하는 단계를 포함하는 것인 방법.
  33. 제31항 또는 제32항에 있어서, 상기 가중된 합을 제공하는 단계는 동적으로 조정된 가중치에 의해 생성된 가중된 합을 제공하는 단계를 포함하는 것인 방법.
  34. 제33항에 있어서, 상기 동적으로 조정된 가중치는 상기 음향 신호가 증강된 정도에 응답하여 결정되는 것인 방법.
  35. 제33항 또는 제34항에 있어서, 상기 음향 신호를 증강시키는 단계는 복수의상이한 이득 인자를 계산하는 단계와, 상기 복수의 이득 인자로써 상기 음향 신호를 승산하는 단계를 포함하는 것이고, 상기 동적으로 조정된 가중치는 상기 이득 인자 중 하나에 응답하여 결정되는 것인 방법.
  36. 제35항에 있어서, 상기 복수의 상이한 인자 중 적어도 하나는 이력 종속적 이득 인자인 것인 방법.
  37. 제31항 내지 제36항 중 어느 한 항에 있어서, 상기 가중된 합을 제공하는 단계는 미리 정해진 가중치에 의해 생성된 가중된 합을 제공하는 단계를 포함하는 것인 방법.
  38. 제31항 내지 제37 중 어느 한 항에 있어서, 상기 가중된 합을 제공하는 단계는, 제공된 가중된 합에 대한 수화자(listener)가 말하고 있는 중이라는 결정에 응답하여, 수신된 음향 신호가 지배적이 되는 가중된 합을 제공하는 단계를 포함하는 것인 방법.
  39. 제31항 내지 제37항 중 어느 한 항에 있어서, 상기 가중된 합을 제공하는 단계는, 음향 신호가 음성 신호(speech signal)을 포함하고 있지 않다는 결정에 응답하여, 수신된 음향 신호가 지배적이 되는 가중된 합을 제공하는 단계를 포함하는 것인 방법.
  40. 잡음 보상 시스템에 있어서,
    음향 신호를 수신하기에 적합한 입력 인터페이스와,
    증강된 음향 신호로 소리내기에 적합한 스피커와,
    상기 증강된 신호를 듣는 수화자를 간섭할 수 있는 주변 잡음을 수집하기에 적합한 마이크로폰과,
    상기 음향 신호의 주파수 성분내의 음향 신호 크기와 동일한 주파수 성분내의 주변 잡음의 크기를 비교하고, 상기 비교에 따라 이득을 결정하고, 상기 결정된 이득이로써, 상기 음향 신호의 적어도 일부 -상기 주파수 성분 이외의 적어도 하나의 세그먼트를 포함함- 를 증폭하여, 증강된 음향 신호를 제공하기에 적합한 제어기
    를 포함하는 시스템.
  41. 제40항에 있어서, 스피커와 마이크로폰은 전화기 핸드셋의 일부인 것인 시스템.
  42. 제40항 또는 제41항에 있어서, 상기 증강된 음향 신호의 적어도 하나의 에코를 주변 잡음으로부터 제거하는 에코 제거기(echo cancellation)을 더 포함하는 시스템.
  43. 제42항에 있어서, 상기 에코 제거기는 상기 증강된 음향 신호의 단 하나의 에코를 주변 잡음으로부터 제거하는 것인 시스템.
  44. 음향 신호 외부의 주변 잡음을 극복하기 위하여 음향 신호를 증강하기 위한 이득을 결정하는 방법에 있어서,
    음향 신호의 크기의 시간에 경과에 따른 복수의 고점치(high-point value)를 결정하는 단계와,
    상기 고점치들의 평균을 구하는 단계와,
    상기 평균을 상기 잡음의 크기와 비교하는 단계와,
    상기 비교에 응답하여 상기 음향 신호를 증강시킬 이득을 결정하는 단계
    를 포함하는 방법.
  45. 제44항에 있어서, 상기 복수의 고점치를 결정하는 단계는 상기 음향 신호의 상이한 시간 세그먼트에 대해 고점치를 결정하는 단계를 포함하는 것인 방법.
  46. 제45항에 있어서, 상기 복수의 고점치를 결정하는 단계는 상이한 길이를 가지는 상기 음향 신호의 시간 세그먼트에 대해 고점치를 결정하는 단계를 포함하는 것인 방법.
  47. 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 복수의 고점치를 결정하는 단계는 최대값을 결정하는 단계를 포함하는 것인 방법.
  48. 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 복수의 고점치를 결정하는 단계는, 더욱 최근의 값일수록 더 높은 가중치가 주어지는 방식으로 가중된 음향 신호의 최대값을 결정하는 단계를 포함하는 것인 방법.
  49. 제44항 내지 제48항 중 어느 한 항에 있어서, 상기 복수의 고점치의 평균을 구하는 단계는 기하 평균을 계산하는 단계를 포함하는 것인 방법.
KR1020037002127A 2000-08-14 2001-08-14 음성 강화 시스템 KR100860805B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US22451300P 2000-08-14 2000-08-14
US60/224,513 2000-08-14
US23672100P 2000-10-02 2000-10-02
US60/236,721 2000-10-02
PCT/IL2001/000759 WO2002015395A1 (en) 2000-07-27 2001-08-14 Voice enhancement system

Publications (2)

Publication Number Publication Date
KR20030040399A true KR20030040399A (ko) 2003-05-22
KR100860805B1 KR100860805B1 (ko) 2008-09-30

Family

ID=26918789

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037002127A KR100860805B1 (ko) 2000-08-14 2001-08-14 음성 강화 시스템

Country Status (10)

Country Link
US (1) US20040057586A1 (ko)
EP (2) EP1312162B1 (ko)
JP (1) JP2004507141A (ko)
KR (1) KR100860805B1 (ko)
CN (1) CN100397781C (ko)
AT (1) ATE287141T1 (ko)
AU (1) AU2001282454A1 (ko)
DE (1) DE60108401T2 (ko)
IL (1) IL154397A0 (ko)
WO (1) WO2002015395A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100911610B1 (ko) * 2007-07-20 2009-08-07 에스케이 텔레콤주식회사 수신 음성 인지율 향상을 위한 음성 처리 장치 및 방법
KR101424327B1 (ko) * 2012-05-15 2014-07-31 고려대학교 산학협력단 잡음 제거 장치 및 방법
KR20190120570A (ko) * 2018-04-16 2019-10-24 주식회사 이엠텍 음성 지문을 이용한 음성 증폭 장치

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
DE10232645A1 (de) 2002-07-18 2004-02-05 Harman/Becker Automotive Systems Gmbh (Straubing Division) Schaltungsanordnung zur Verringerung des Dynamikbereichs von Audiosignalen
US7613310B2 (en) * 2003-08-27 2009-11-03 Sony Computer Entertainment Inc. Audio input system
EP1833163B1 (en) 2004-07-20 2019-12-18 Harman Becker Automotive Systems GmbH Audio enhancement system and method
JP4381291B2 (ja) * 2004-12-08 2009-12-09 アルパイン株式会社 車載用オーディオ装置
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US20060135085A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone with uni-directional and omni-directional microphones
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20060147063A1 (en) * 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
US8170221B2 (en) 2005-03-21 2012-05-01 Harman Becker Automotive Systems Gmbh Audio enhancement system and method
US7835773B2 (en) * 2005-03-23 2010-11-16 Kyocera Corporation Systems and methods for adjustable audio operation in a mobile communication device
EP1720249B1 (en) 2005-05-04 2009-07-15 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US20070112563A1 (en) * 2005-11-17 2007-05-17 Microsoft Corporation Determination of audio device quality
GB2433849B (en) * 2005-12-29 2008-05-21 Motorola Inc Telecommunications terminal and method of operation of the terminal
JP4738213B2 (ja) * 2006-03-09 2011-08-03 富士通株式会社 利得調整方法及び利得調整装置
JP4306708B2 (ja) * 2006-09-25 2009-08-05 ヤマハ株式会社 オーディオ信号処理装置
CN101627428A (zh) * 2007-03-06 2010-01-13 日本电气株式会社 抑制杂音的方法、装置以及程序
JP5034595B2 (ja) * 2007-03-27 2012-09-26 ソニー株式会社 音響再生装置および音響再生方法
JP4580409B2 (ja) 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
JP4926005B2 (ja) 2007-11-13 2012-05-09 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 音声信号処理装置及び音声信号処理方法、通信端末
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
US20090281803A1 (en) * 2008-05-12 2009-11-12 Broadcom Corporation Dispersion filtering for speech intelligibility enhancement
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
CN101789797A (zh) * 2009-01-22 2010-07-28 浙江安迪信信息技术有限公司 无线通信抗干扰系统
US8626516B2 (en) * 2009-02-09 2014-01-07 Broadcom Corporation Method and system for dynamic range control in an audio processing system
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
JP5149991B2 (ja) * 2009-05-29 2013-02-20 シャープ株式会社 音声再生装置、音声再生方法及びプログラム
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8204742B2 (en) * 2009-09-14 2012-06-19 Srs Labs, Inc. System for processing an audio signal to enhance speech intelligibility
JP5551254B2 (ja) * 2009-09-14 2014-07-16 ディーティーエス・エルエルシー 適応音声了解度処理のためのシステム
CN102576562B (zh) 2009-10-09 2015-07-08 杜比实验室特许公司 自动生成用于音频占优性效果的元数据
WO2011048741A1 (ja) * 2009-10-20 2011-04-28 日本電気株式会社 マルチバンドコンプレッサ
JP5331901B2 (ja) * 2009-12-21 2013-10-30 富士通株式会社 音声制御装置
US20120020483A1 (en) * 2010-07-23 2012-01-26 Deshpande Sachin G System and method for robust audio spatialization using frequency separation
US8798278B2 (en) 2010-09-28 2014-08-05 Bose Corporation Dynamic gain adjustment based on signal to ambient noise level
KR101115559B1 (ko) * 2010-11-17 2012-03-06 연세대학교 산학협력단 통화 품질 향상 방법 및 장치
WO2012094827A1 (en) 2011-01-14 2012-07-19 Huawei Technologies Co., Ltd. A method and an apparatus for voice quality enhancement
US8761674B2 (en) * 2011-02-25 2014-06-24 Timothy R. Beevers Electronic communication system that mimics natural range and orientation dependence
KR102060208B1 (ko) 2011-07-29 2019-12-27 디티에스 엘엘씨 적응적 음성 명료도 처리기
TWI451405B (zh) * 2011-10-20 2014-09-01 Kuo Ping Yang 增進語音即時輸出之方法及助聽器
US9167361B2 (en) * 2011-11-22 2015-10-20 Cochlear Limited Smoothing power consumption of an active medical device
US20130148811A1 (en) * 2011-12-08 2013-06-13 Sony Ericsson Mobile Communications Ab Electronic Devices, Methods, and Computer Program Products for Determining Position Deviations in an Electronic Device and Generating a Binaural Audio Signal Based on the Position Deviations
US20130336497A1 (en) * 2012-04-04 2013-12-19 Clinkle Corporation Dynamic sonic signal intensity adjustment
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN102779527B (zh) * 2012-08-07 2014-05-28 无锡成电科大科技发展有限公司 基于窗函数共振峰增强的语音增强方法
US9299333B2 (en) * 2012-09-02 2016-03-29 Qosound, Inc System for adaptive audio signal shaping for improved playback in a noisy environment
US9270801B2 (en) * 2013-03-15 2016-02-23 Intel Corporation Low power audio trigger via intermittent sampling
US9684087B2 (en) * 2013-09-12 2017-06-20 Saudi Arabian Oil Company Dynamic threshold methods for filtering noise and restoring attenuated high-frequency components of acoustic signals
CN104155644B (zh) * 2014-08-20 2017-01-25 西安电子科技大学 一种基于声音传感器的测距方法及系统
US10013997B2 (en) * 2014-11-12 2018-07-03 Cirrus Logic, Inc. Adaptive interchannel discriminative rescaling filter
KR101935183B1 (ko) * 2014-12-12 2019-01-03 후아웨이 테크놀러지 컴퍼니 리미티드 멀티-채널 오디오 신호 내의 음성 성분을 향상시키는 신호 처리 장치
US9479650B1 (en) * 2015-05-04 2016-10-25 Captioncall, Llc Methods and devices for updating filter coefficients during echo cancellation
US9847093B2 (en) 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
CN105872884B (zh) * 2016-05-24 2019-09-06 Tcl通力电子(惠州)有限公司 耳机、耳机的下行降噪电路及方法
KR102478951B1 (ko) 2017-09-04 2022-12-20 삼성전자주식회사 비선형 특성을 갖는 오디오 필터를 이용하여 오디오 신호를 처리하는 방법 및 장치
CN107799122B (zh) * 2017-09-08 2020-10-23 中国科学院深圳先进技术研究院 一种高生物拟真性语音处理滤波器与语音识别设备
CN111201569B (zh) 2017-10-25 2023-10-20 三星电子株式会社 电子装置及其控制方法
CN108369805B (zh) * 2017-12-27 2019-08-13 深圳前海达闼云端智能科技有限公司 一种语音交互方法、装置和智能终端
JP7186375B2 (ja) * 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
EP3776008B1 (en) * 2018-06-05 2022-07-27 Google LLC Method and electronic device for ultrasonic sensing in smart devices
US20210072378A1 (en) * 2018-06-05 2021-03-11 Google Llc Systems and methods of ultrasonic sensing in smart devices
US10859691B2 (en) * 2018-08-22 2020-12-08 Infineon Technologies Ag Radar range accuracy improvement method
CN110931028B (zh) * 2018-09-19 2024-04-26 北京搜狗科技发展有限公司 一种语音处理方法、装置和电子设备
US11393460B2 (en) * 2020-11-09 2022-07-19 Gulfstream Aerospace Corporation Aircraft speech amplitude compensation
US20230412727A1 (en) * 2022-06-20 2023-12-21 Motorola Mobility Llc Adjusting Transmit Audio at Near-end Device Based on Background Noise at Far-end Device

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4061874A (en) * 1976-06-03 1977-12-06 Fricke J P System for reproducing sound information
US4381488A (en) * 1981-02-18 1983-04-26 Fricke Jobst P Dynamic volume expander varying as a function of ambient noise level
US4476571A (en) * 1981-06-15 1984-10-09 Pioneer Electronic Corporation Automatic sound volume control device
US4468804A (en) * 1982-02-26 1984-08-28 Signatron, Inc. Speech enhancement techniques
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630302A (en) 1985-08-02 1986-12-16 Acousis Company Hearing aid method and apparatus
DE3730763A1 (de) * 1987-09-12 1989-03-30 Blaupunkt Werke Gmbh Schaltung zur stoergeraeuschkompensation
US4829565A (en) * 1987-10-20 1989-05-09 Goldberg Robert M Telephone with background volume control
US5212764A (en) * 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
US5050217A (en) * 1990-02-16 1991-09-17 Akg Acoustics, Inc. Dynamic noise reduction and spectral restoration system
JP2541062B2 (ja) * 1991-11-28 1996-10-09 ヤマハ株式会社 音響再生装置
FR2688371B1 (fr) * 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
JP3306600B2 (ja) * 1992-08-05 2002-07-24 三菱電機株式会社 自動音量調整装置
JPH06289897A (ja) * 1993-03-31 1994-10-18 Sony Corp 音声信号処理装置
US5434922A (en) * 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp Verringerung des hintergrundrauschens zur sprachverbesserung
JP3309008B2 (ja) * 1993-08-24 2002-07-29 アルパイン株式会社 オーディオ装置
US5485515A (en) * 1993-12-29 1996-01-16 At&T Corp. Background noise compensation in a telephone network
US5526419A (en) * 1993-12-29 1996-06-11 At&T Corp. Background noise compensation in a telephone set
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
US5636272A (en) * 1995-05-30 1997-06-03 Ericsson Inc. Apparatus amd method for increasing the intelligibility of a loudspeaker output and for echo cancellation in telephones
JPH09116362A (ja) * 1995-10-19 1997-05-02 Matsushita Electric Ind Co Ltd 自動音量制御装置
JPH1070600A (ja) * 1996-08-26 1998-03-10 Kokusai Electric Co Ltd 電話機
US6141415A (en) * 1996-10-11 2000-10-31 Texas Instruments Incorporated Method and apparatus for detecting speech at a near-end of a communications system, a speaker-phone system, or the like
JP2874679B2 (ja) * 1997-01-29 1999-03-24 日本電気株式会社 雑音消去方法及びその装置
FR2762746B1 (fr) * 1997-04-25 1999-07-09 France Telecom Procede et systeme de radio telephone mobile numerique et terminal utilisable dans un tel systeme
US6035048A (en) * 1997-06-18 2000-03-07 Lucent Technologies Inc. Method and apparatus for reducing noise in speech and audio signals
JP2000069127A (ja) * 1998-08-20 2000-03-03 Matsushita Electric Ind Co Ltd 音響センサー付携帯電話装置
AU6748600A (en) * 1999-07-28 2001-02-19 Clear Audio Ltd. Filter banked gain control of audio in a noisy environment
JP3981223B2 (ja) * 1999-11-08 2007-09-26 アルパイン株式会社 オーディオ音補正装置
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US7578131B2 (en) * 2005-06-30 2009-08-25 United Technologies Corporation Augmentor spray bar mounting
JP2007096002A (ja) * 2005-09-29 2007-04-12 Matsushita Electric Ind Co Ltd 半導体装置の製造方法および半導体装置
JP4794262B2 (ja) * 2005-09-30 2011-10-19 株式会社ジェイテクト トルク検出装置及びこれを用いた電動パワーステアリング装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100911610B1 (ko) * 2007-07-20 2009-08-07 에스케이 텔레콤주식회사 수신 음성 인지율 향상을 위한 음성 처리 장치 및 방법
KR101424327B1 (ko) * 2012-05-15 2014-07-31 고려대학교 산학협력단 잡음 제거 장치 및 방법
KR20190120570A (ko) * 2018-04-16 2019-10-24 주식회사 이엠텍 음성 지문을 이용한 음성 증폭 장치

Also Published As

Publication number Publication date
DE60108401T2 (de) 2006-04-06
EP1526639A2 (en) 2005-04-27
JP2004507141A (ja) 2004-03-04
EP1312162A1 (en) 2003-05-21
EP1526639A3 (en) 2006-03-01
IL154397A0 (en) 2003-09-17
CN100397781C (zh) 2008-06-25
EP1312162B1 (en) 2005-01-12
ATE287141T1 (de) 2005-01-15
US20040057586A1 (en) 2004-03-25
DE60108401D1 (de) 2005-02-17
KR100860805B1 (ko) 2008-09-30
WO2002015395A1 (en) 2002-02-21
AU2001282454A1 (en) 2002-02-25
CN1620751A (zh) 2005-05-25

Similar Documents

Publication Publication Date Title
KR100860805B1 (ko) 음성 강화 시스템
US8015002B2 (en) Dynamic noise reduction using linear model fitting
US8249861B2 (en) High frequency compression integration
JP4279357B2 (ja) 特に補聴器における雑音を低減する装置および方法
US11017798B2 (en) Dynamic noise suppression and operations for noisy speech signals
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
US8521530B1 (en) System and method for enhancing a monaural audio signal
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
EP2265039B1 (en) Hearing aid
JP2002501337A (ja) 通信システムのコンフォートノイズ提供方法及び装置
JP2000347688A (ja) 雑音抑圧装置
JP2004341339A (ja) 雑音抑圧装置
KR20240007168A (ko) 소음 환경에서 음성 최적화
JPH09311696A (ja) 自動利得調整装置
JP2002541529A (ja) 時間領域スペクトラル減算による信号雑音の低減
US20220165287A1 (en) Context-aware voice intelligibility enhancement

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee