KR100843522B1 - 노이즈 억제를 위한 방법 및 장치 - Google Patents

노이즈 억제를 위한 방법 및 장치 Download PDF

Info

Publication number
KR100843522B1
KR100843522B1 KR1020060049097A KR20060049097A KR100843522B1 KR 100843522 B1 KR100843522 B1 KR 100843522B1 KR 1020060049097 A KR1020060049097 A KR 1020060049097A KR 20060049097 A KR20060049097 A KR 20060049097A KR 100843522 B1 KR100843522 B1 KR 100843522B1
Authority
KR
South Korea
Prior art keywords
vector
speech
noise
components
correction factor
Prior art date
Application number
KR1020060049097A
Other languages
English (en)
Other versions
KR20060125572A (ko
Inventor
마사노리 가토우
아키히코 스기야마
Original Assignee
닛본 덴끼 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 닛본 덴끼 가부시끼가이샤 filed Critical 닛본 덴끼 가부시끼가이샤
Publication of KR20060125572A publication Critical patent/KR20060125572A/ko
Application granted granted Critical
Publication of KR100843522B1 publication Critical patent/KR100843522B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

스피치 신호에 포함되는 노이즈를 억제하는 노이즈 억제 장치에서, 스피치 신호는, 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 그 제 1 벡터와 동일한 스펙트럼 스피치 컴포넌트의 제 2 벡터로 변환된다. 노이즈 억제 계수의 벡터는 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 결정된다. 추정된 노이즈 컴포넌트의 벡터는, 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 결정되고, 스피치 섹션 보정 팩터 및 넌스피치 섹션 보정 팩터는, 결합된 보정 팩터를 생성하도록 추정된 노이즈 컴포넌트 및 스펙트럼 스피치 컴포넌트의 제 1 벡터로부터 계산된다. 노이즈 억제 계수는, 사후-억제 계수의 벡터를 생성하도록 그 결합된 보정 팩터에 의해 웨이팅된다. 스펙트럼 스피치 컴포넌트의 제 2 벡터는, 강화된 스피치 컴포넌트의 벡터를 생성하도록 사후-억제 계수에 의해 웨이팅된다.
노이즈 억제, 노이즈 억제기

Description

노이즈 억제를 위한 방법 및 장치{METHOD AND APPARATUS FOR NOISE SUPPRESSION}
도 1은 스피치 신호용 종래 노이즈 억제기의 블록도.
도 2는, 도 1의 종래 파워 스펙트럼 웨이팅 회로의 블록도.
도 3은, 도 1의 종래 노이즈 추정 회로의 블록도.
도 4는, 도 1의 종래 사전 SNR 계산기의 블록도.
도 5는, 도 1의 종래 노이즈 억제 계수 계산기의 블록도.
도 6은, 도 1의 종래 노이즈 억제 계수 보정기의 블록도.
도 7은 스피치 신호용 노이즈 억제기의 블록도.
도 8은, 도 7의 진폭 스펙트럼 보정기의 블록도.
도 9는, 도 8의 웨이팅 계산기 특징의 그래픽 표현.
도 10은 본 발명의 제 1 실시형태의 변형의 블록도.
도 11은 본 발명의 제 2 실시형태의 노이즈 억제기의 블록도.
도 12는 본 발명의 제 2 실시형태의 제 1 변형의 블록도.
도 13은 제 2 실시형태의 제 2 변형의 블록도.
도 14는 본 발명의 제 3 실시형태에 따른 스피치 신호용 노이즈 억제기의 블록도.
도 15는, 도 14의 사전 SNR 계산기의 블록도.
도 16은, 도 14의 노이즈 억제 계수 보정기의 블록도.
도 17은 본 발명의 제 3 실시형태의 변형의 블록도.
도 18은, 도 17의 사전 SNR 계산기의 블록도.
도 19는, 도 17의 노이즈 억제 계수 보정기의 블록도.
도 20은, 본 발명의 제 1 실시형태의 추가적인 변형의 블록도.
도 21은, 도 20의 진폭 스펙트럼 보정기의 블록도.
도 22는 본 발명의 제 1 실시형태의 더 추가적인 변형의 블록도.
도 23은, 도 22의 스피치 존재 확률 계산기의 블록도.
도 24는, 도 23의 진폭 스펙트럼 보정기의 블록도.
도 25는, 도 22의 실시형태의 변형의 블록도.
도 26은, 도 25의 스피치 존재 확률 계산기의 블록도.
* 도면의 주요부분에 대한 부호의 설명 *
1: 프레임 분해 및 윈도우잉 2: 퓨리에 변환 3: 스퀘어링
4: 파워 스펙트럼 웨이팅 5: 노이즈 추정 6: 사후 SNR 계산기
7: 사전 SNR 계산기 8: 억제 계수 계산기 9: 억제 계수 보정기
10, 11: 승산기 12: 인버스 퓨리에 변환 13: 프레임 분해
본 발명은 노이즈 있는 스피치 신호에서 노이즈를 억제하는 방법 및 장치에 관한 것이다.
노이즈 억제는, 주파수-영역 신호를 사용하여 노이즈 있는 입력 스피치 신호에 도입된 노이즈 컴포넌트의 파워 스펙트럼을 추정하고, 노이즈 있는 스피치 신호로부터 추정된 파워 스펙트럼을 제거하는 단계를 포함하는 기술이다. 지속적으로 노이즈 컴포넌트를 추정함으로써, 노이즈 억제 기술은 또한 넌스테이션너리 (nonstationary) 노이즈를 억제하는데 유용하다. 이 타입의 노이즈 억제기는 일본 특허 공보 제 2002-204175 호에서 설명된다. 도 1은 이 특허 공보의 노이즈 억제기를 도시한 것이다. 도시된 바와 같이, 노이즈 있는 스피치 신호의 샘플들은 프레임 분해 및 윈도우잉 회로 (1) 에 제공되고, 이 회로 (1) 는 K/2 샘플들을 갖는 프레임으로 신호를 분리하며, 여기서 K는 짝수를 나타낸다. 프레임은 윈도우 함수 w(t) 와 승산된다. 신호
Figure 112007064408205-pat00001
는 스피치 신호
Figure 112007064408205-pat00002
의 n번째-프레임을 윈도우잉함으로써 생성된다. 실수에 대해, 대칭적 윈도우 함수가 이용된다. 윈도우 함수는, 노이즈 억제 계수가 1인 경우, 입력 및 출력 신호가 서로 일치하도록 설계된다 (즉,
Figure 112007064408205-pat00222
). 2개의 연속하는 프레임이 이와 같이 윈도우잉된다면, 널리 알려진 해닝 (Hanning) 윈도우 w(t) 가 사용된다.
Figure 112006038651418-pat00004
윈도우잉된 스피치 프레임
Figure 112007064408205-pat00005
은, 스피치 프레임이 K개의 주파수 스펙트럼 스피치 컴포넌트
Figure 112007064408205-pat00006
의 벡터로 변환되는 퓨리에 변환 컨버터 (2) 에 제공된다. 스펙트럼 스피치 컴포넌트의 이 벡터는, K개의 위상 컴포넌트
Figure 112007064408205-pat00007
의 벡터 및 K개의 진폭 컴포넌트
Figure 112007064408205-pat00008
의 벡터로 분리되며, 전자는 승산기 (multiplier; 11) 에 제공되고, 후자는, K개의 진폭 스펙트럼 스피치 컴포넌트들이 K개의 승산기 (30 내지 3K-1) 에서 서로 스퀘어링되는 스퀘어링 (squaring) 회로 (3) 에 제공된다. 스퀘어링된 값
Figure 112007064408205-pat00009
은 노이즈 있는 스피치의 파워 스펙트럼을 나타낸다. 스퀘어링 회로 (3) 의 결과는, 웨이팅이 K개의 스펙트럼 스피치 컴포넌트 상에서 수행되는 파워 스펙트럼 웨이팅 (weighting) 회로 (4; 도2) 에 제공된다.
도 2에서, 이 파워 스펙트럼 웨이팅은, 먼저 노이즈 추정 회로 (5) 에서 이전 프레임 동안에 추정되고 메모리 (42) 에 저장된 K개의 노이즈 파워 스펙트럼 컴포넌트
Figure 112007064408205-pat00010
로 K개의 스피치 파워 컴포넌트
Figure 112007064408205-pat00011
를 제산하는 제산기 (divider; 410 내지 41k-1) 의 어레이를 사용하여 스펙트럼 신호-대-노이즈 비를 계산함으로써 즉, SNR 값
Figure 112007064408205-pat00223
의 벡터를 생성함으로써 달성된다. 그 후, 이들 SNR 값들은, 비선형 웨이팅 회로 (430 내지 43K-1) 의 벡터를 통해 비선형 프로세싱에 제공되며, 각각의 비선형 웨이팅 회로는,
Figure 112006038651418-pat00013
와 같은 비선형 함수를 갖고, 여기서 "a" 및 "b" 는 임의의 실수이다. 각각의 비선형 웨이팅 회로 (43) 는, 입력 SNR값이 "b" 보다 큰 경우, 0이 되고 SNR이 "a" 보다 작은 경우 1이 되는 웨이팅 값을 생성하고, SNR 값에 반비례하여 가변하는 0과 1 사이의 임의의 값으로 가정한다. 마지막으로, K개의 입력 스펙트럼 스피치 파워 컴포넌트들
Figure 112007064408205-pat00014
은, 웨이팅된 파워 스펙트럼 스피치 컴포넌트의 벡터를 생성하기 위해, 스펙트럼 승산기 (44) 를 사용하여 K개의 웨이팅 팩터와 각각 승산된다. 웨이팅된 파워 스펙트럼 스피치 컴포넌트의 이 벡터는, 스퀘어링 회로 (3) 로부터 스펙트럼 파워 스피치 컴포넌트
Figure 112007064408205-pat00015
가 또한 제공되는 노이즈 추정 회로 (5; 도 3) 에 제공된다. 회로 (43) 에 의한 비선형 웨이팅은, 노이즈 있는 스피치 파워 스펙트럼의 노이즈 컴포넌트를 추정하는 동안에, 그것의 음성화된 컴포넌트의 악영향을 감소시킨다.
도 3에서, 파워 스펙트럼 웨이팅 회로 (4) 로부터의 K개의 웨이팅된 스펙트럼 파워 스피치 컴포넌트들 및 스퀘어링 회로 (3) 로부터의 K개의 웨이팅되지 않은 스펙트럼 파워 스피치 컴포넌트들은 각각, 노이즈 계산기들 (500 내지 50K-1) 을 통해 프로세스된다. 각각의 노이즈 계산기 (50) 에서, 게이트 (54) 가 OR 게이트 (511) 로부터의 "1" 에 응답하여 ON 으로 되는 경우, 웨이팅된 컴포넌트는 레지스터 업데이트 판정 회로 (51) 의 게이트 (54) 를 통해 시프트 레지스터 (55) 로 전달된다. 이것은 시프트 레지스터 (55) 가 신규한 스펙트럼 컴포넌트로 업데이트되도록 한다. 노이즈 억제기의 초기 개시 시간중에 초기 주기 검출기 (detector; 512) 가 "1" 을 OR 게이트 (511) 에 제공할 경우, 또는 스피치 부재 (absence) 신호 또는 음성화된 저-레벨 신호를 표시하는, 웨이팅되지 않은 파워 스펙트럼 컴포넌트의 크기가 작을 경우에, 이 시프트-레지스터 업데이트가 발생한다. 후자의 경우, 비교기 (comparator; 515) 는, 임계값 계산기 (513) 에 의한 이전 프레임 간격동안 메모리 (514) 에 저장된 판정 임계값과 비교한 후, "1" 을 OR 게이트 (511) 에 제공한다. 샘플 카운터 (counter; 59) 는, 각각의 프레임 간격중에, 시프트 레지스터 (55) 에 저장된 웨이팅된 파워 스펙트럼 컴포넌트의 수를 결정하기 위해, OR 게이트 (511) 로부터의 로직-1 출력에 응답하여 그것의 카운트 값을 증가시킨다. 그 카운터 값이 시프트 레지스터 (55) 의 길이와 동일하게 될 경우, 카운터는 0으로 리셋된다. 최소 선택기 (57) 에서, 카운터 (59) 의 출력은 시프트 레지스터 (55) 의 길이와 비교된다. 최소 선택기 (57) 는 2개 중 더 작은 것을 M 값으로서 선택한다.
Figure 112007064408205-pat00016
와 같은 출력
Figure 112007064408205-pat00017
을 생성하기 위해, "n" 프레임 동안에 시프트 레지스터 (55) 에 저장된 M개의 컴포넌트
Figure 112007064408205-pat00018
의 총합은, 가산기 (adder; 56) 에 의해 계산되고, 제산 회로 (58) 에서 값 M 에 의해 제산된다.
샘플 카운터 (59) 의 출력은 노이즈 억제기가 시작하는 순간으로부터 단조 증가하기 때문에, 제산 동작은 샘플 카운터 출력을 처음 사용하여 진행한다. 프로세스가 지속함에 따라, 샘플 카운터 (59) 는 그것의 출력을 증가시키고, 결국, 레지스터 길이보다 높아지며, 그 때, 제산 동작은 젯수 (divisor) 로서 레지스터 길이를 사용하여 진행한다. 그 레지스터 길이가 사용되는 경우, 제산 출력
Figure 112007064408205-pat00019
은 웨이팅된 파워 스펙트럼 스피치 컴포넌트의 총합의 평균 파워를 나타낸다. 제산 동작의 몫 값
Figure 112007064408205-pat00020
은 임계값 계산기(513) 에 제공되고, 이는 이후의 프레임 동안에 비교기 (515) 에서 사용되는 판정 임계값을 생성하기 위해, 소정의 수와 또는 고-차 다항식 또는 비-선형 함수와 입력 값을 승산한다. 몫
Figure 112007064408205-pat00021
은, 피드백 신호로서 파워 스펙트럼 웨이팅 회로 (4) 에 제공되고, 이후의 프레임에 대해 웨이팅된 파워 스펙트럼 노이즈 컴포넌트들을 업데이트하도록 그것의 메모리 (42) 에 저장된, 추정 노이즈이다.
도 1을 다시 참조하면, 사후 SNR (신호-대-노이즈 비) 계산기 (6) 에서, 스퀘어링 회로 (3) 의 스피치 파워 스펙트럼 컴포넌트들
Figure 112007064408205-pat00022
은, 각각, 사후 (a-posteriori) SNR 값
Figure 112007064408205-pat00023
의 벡터를 생성하기 위해 노이즈 추정 회로 (5) 의 추정된 노이즈 파워 스펙트럼 컴포넌트
Figure 112007064408205-pat00024
로 제산되며, 그 사후 SNR 값은 차례로 사전 (a priori) SNR 추정 회로 (7; 도 4) 에 제공된다.
도 4에서, 사후 (a posteriori) SNR 값들
Figure 112007064408205-pat00025
은, 각각 가산기 (70) 에서 "-1" 과 합산되고, 최대 선택기들 (710 내지 71K-1) 를 사용하여 범위 제한 회로 (71) 의 범위로 제한된
Figure 112007064408205-pat00026
의 벡터를 생성한다. 최대 선택기는 그들의 입력을 "0" 값과 비교하여, x>0 일 경우, P[x] = x 이고, x≤0 면 P[x] = 0 인 관계에 따라 둘 중 더 큰 것을 선택하며, 출력
Figure 112007064408205-pat00027
을 승산-및-가산 회로 (770 내지 77K-1) 에 전달한다. 또한, 사후 SNR 계산기 (6) 로부터의 사후 SNR 값
Figure 112007064408205-pat00028
은 프레임 간격 동안 메모리 (72) 에 저장되고, 그 후, 이전-프레임 사후 SNR 값들
Figure 112007064408205-pat00029
내지
Figure 112007064408205-pat00030
로서 승산기 (75) 에 제공된다. 이들 이전 프레임 사후 SNR 값은, 스퀘어링 회로 (74) 로부터 제공된 이전 프레임의 스퀘어링된 보정 노이즈 억제 계수의 벡터
Figure 112007064408205-pat00224
에 의해 승산되어, 이전 프레임의 추정된 SNR 값의 벡터로서 값
Figure 112007064408205-pat00031
의 벡터를 생성하여 승산-및-가산 회로 (770 내지 77K-1) 에 제공한다.
Figure 112007064408205-pat00033
을 발생시키기 위해, 보정 노이즈 억제 계수의 벡터
Figure 112007064408205-pat00225
는 노이즈 억제 계수 보정기 (9) 로부터 수신되고, 프레임 간격 동안 메모리 (73) 에 저장되며,
Figure 112007064408205-pat00035
을 생성하기 위해 스퀘어링 회로 (74) 에서 스퀘어링된다. 각각의 승산-및-가산 회로 (77) 에서, 대응하는 최대 선택기 (71) 로부터의 입력 신호
Figure 112007064408205-pat00036
는 승산기 (771) 에서 팩터 (1-α) (여기서, α는 웨이트 값) 와 승산되고, 이전-프레임 추정된 SNR 값
Figure 112007064408205-pat00037
은 승산기 (772) 에서 웨이트 값 α와 승산되며, 추정된 사전 SNR 값
Figure 112007064408205-pat00038
(여기서
Figure 112007064408205-pat00039
= 1 임) 을 생성하기 위해 승산기 (771) 의 출력과 합산된다. 추정된 사전 SNR 값
Figure 112007064408205-pat00040
내지
Figure 112007064408205-pat00041
은 노이즈 억제 계수 계산기 (8; 도 5) 및 노이즈 억제 계수 보정기 (9; 도 6) 에 제공된다.
도 5에서, 사전 SNR 계산기 (7) 로부터의 추정된 사전 SNR 벡터
Figure 112007064408205-pat00042
에 부가하여, 노이즈 억제 계수 계산기 (8) 는 사후 SNR 계산기 (6) 로부터 사후 SNR 벡터
Figure 112007064408205-pat00043
내지
Figure 112007064408205-pat00044
를 수신한다. 노이즈 억제 계수 계산기 (8) 는 MMSE-STSA (최소 평균 시퀀스 에러 짧은 시간 스펙트럼 진폭; Minimum Mean Sequence Error Short Time Spectral Amplitude) 이득 함수 값 계산기 (81) 및 GLR (일반화 가능도 비; Generalized Likelihood Ratio) 계산기 (82) 를 포함한다. 각각의 스펙트럼 컴포넌트에 대해, MMSE-STSA 이득 함수 계산기 (81) 는, 사후 SNR 값
Figure 112007064408205-pat00045
및 사전 SNR 값
Figure 112007064408205-pat00046
및 스피치 부재 확률 "q" 를 사용하여,
Figure 112006038651418-pat00047
과 같은 MMSE-STSA 이득 함수
Figure 112007064408205-pat00226
을 계산하며, 여기서, I0는 0차 변형된 베셀 함수이고, I1은 1차 변형된 베셀 함수이며,
Figure 112007064408205-pat00048
이고,
Figure 112007064408205-pat00049
이다. 계산기 (81) 에서 사용된 것과 같은, 사후 및 사전 SNR 및 스피치 부재 확률의 동일한 값을 사용하여, GLR 계산기 (82) 는 K개의 일반화 가능도 비
Figure 112007064408205-pat00051
Figure 112006038651418-pat00052
를 계산한다. 이득 함수
Figure 112006038651418-pat00053
및 GLR 값
Figure 112006038651418-pat00054
은 계산 회로 (83) 에서
Figure 112006038651418-pat00055
인 노이즈 억제 계수의 벡터
Figure 112007064408205-pat00227
를 노이즈 억제 계수 보정기 (9; 도 6) 에게 제공한다.
도 6에서, 노이즈 억제 계수
Figure 112007064408205-pat00057
및 사전 SNR 값
Figure 112007064408205-pat00058
은 노이즈 억제 계수 보정 회로 (910 내지 91K-1) 에 제공된다. 각각의 사전 SNR 값은, 선택기 (912) 용 제어 신호를 생성하기 위해 비교기 (911) 에서 임계값과 비교되며, 그 선택기 (912) 를 통해 노이즈 억제 계수는, 임계값과 관련된 사전 SNR 값의 크기에 의존하여 승산기 (913) 또는 관통-연결을 통해 최대 선택기 (914) 와 선택적으로 커플링된다. 사전 SNR 값이 임계값보다 낮은 경우, 선택기 (912) 는 하위 위치로 스위칭되어, 보정 값에 의해 스케일링되는 승산기 (913) 에 노이즈 억제 계수를 커플링시킨다. 그렇지 않으면, 선택기 (912) 는 상위 위치에 스위칭되며, 최대 선택기 (914) 에 노이즈 억제 계수를 직접 커플링시킨다. 최대 선택기 (914) 는 보정의 하한값과 입력 신호를 비교하고 둘중 더 큰 것을 승산기 (10) 에 전달한다.
도 1을 다시 참조하면, 승산기 (10) 는, 강화된 스피치 진폭 스펙트럼 컴포넌트
Figure 112007064408205-pat00059
를 생성하기 위해 퓨리에 변환 컨버터 (2) 로부터 제공된 스피치 진폭 스펙트럼 컴포넌트
Figure 112007064408205-pat00060
에 보정된 노이즈 억제 계수
Figure 112007064408205-pat00061
를 승산한다.
Figure 112007064408205-pat00062
는, 강화된 스피치 스펙트럼 컴포넌트
Figure 112007064408205-pat00063
를 생성하기 위해 승산기 (11) 에서 위상 컴포넌트
Figure 112007064408205-pat00064
와 승산된다. 인버스 퓨리에 변환은, 일련의 K개의 시간-영역 컴포넌트들
Figure 112007064408205-pat00065
(여기서, t = 0, 1, ...., K-1) 을 포함하는 스피치 프레임을 생성하기 위해, 인버스 퓨리에 변환 컨버터 (12) 에서 강화된 스피치 컴포넌트에 대해 수행된다. 연속하는 2개 스피치 프레임의 K/2 시간-영역 컴포넌트는 프레임 합성 (13) 에서 결합되어,
Figure 112007064408205-pat00066
형태의 강화된 스피치 샘플이 된다.
그러나, 종래 기술의 노이즈 억제기의 노이즈 억제 계수는, 스피치 섹션과 노이즈 섹션 사이에 구별없이 동일한 알고리즘을 사용하여 계산된다. 그 결과, 스피치 왜곡이 스피치 섹션에서 발생할 수 있으며, 동시에 노이즈 섹션에서의 억제는 불충분하다.
따라서, 스피치 섹션에서 스피치의 왜곡을 감소시키면서 동시에 노이즈 섹션에서 충분한 노이즈 억제를 제공할 수 있는 노이즈 억제 방법 및 장치를 제공하는 것이 본 발명의 목적이다.
본 발명의 제 1 양태에 의하면, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터로 스피치 신호를 변환하는 단계, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터를 결정하는 단계, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 스피치-대-노이즈 관계를 결정하는 단계, 결정된 스피치-대-노이즈 관계, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 노이즈 억제 계수에 기초하여 사후-억제 계수의 벡터를 결정하는 단계, 및 사후-억제 계수의 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터를 웨이팅하는 단계를 포함하는, 스피치 신호에서 노이즈를 억제하는 방법이 제공된다.
본 발명의 제 2 양태에 의하면, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터로 스피치 신호를 변환하는 단계, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터를 결정하는 단계, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 스피치-대-노이즈 관계를 결정하는 단계, 결정된 스피치-대-노이즈 관계에 기초하여 노이즈 억제 계수의 복수의 하한값을 결정하는 단계, 노이즈 억제 계수의 하한값과 노이즈 억제 계수와 비교하여 그 비교 결과에 의존하여 사후-억제 계수의 벡터를 발생시키는 단계, 및 사후-억제 계수의 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터를 웨이팅하는 단계를 포함하는, 스피치신호에서 노이즈를 억제하는 방법을 본 발명은 제공한다.
제 3 양태에 의하면, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터로 스피치 신호를 변환하는 단계, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터를 결정하는 단계, 노이즈 억제 계수의 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터를 웨이팅하는 단계, 주파수 스펙트럼 스피치 컴포넌트의 웨이팅된 제 1 벡터 및 노이즈 억제 계수의 벡터에 기초하여 보정 팩터의 벡터를 결정하고 보정 팩터의 그 벡터에 의해 노이즈 억제 계수의 벡터를 웨이팅하는 단계, 및 노이즈 억제 계수의 그 웨이팅된 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터를 웨이팅하는 단계를 포함하는, 스피치 신호에서 노이즈를 억제하는 방법을 본 발명은 제공한다.
제 4 양태에 의하면, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터로 스피치 신호를 변환하는 컨버터, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터를 결정하는 노이즈 억제 계수 계산기, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 스피치-대-노이즈 관계를 결정하는 스피치-대-노이즈 관계 계산기, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터와 노이즈 억제 계수의 벡터인, 스피치-대-노이즈 관계에 기초하여 사후-억제 계수의 벡터를 결정하는 사후-억제 계수 계산기, 및 사후-억제 계수의 그 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터를 웨이팅하는 웨이팅 회로를 포함하는, 스피치 신호에서 노이즈를 억제하는 장치를 본 발명은 제공한다.
제 5 양태에 의하면, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터로 스피치 신호를 변환하는 컨버터, 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터를 결정하는 노이즈 억제 계수 계산기, 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터에 기초하여 스피치-대-노이즈 관계를 결정하는 스피치-대-노이즈 관계 계산기, 그 스피치-대-노이즈 관계에 기초하여 노이즈 억제 계수의 복수의 하한값을 결정하고, 노이즈 억제 계수의 그 하한값과 노이즈 억제 계수의 벡터를 비교하며, 그 비교의 결과에 의존하여 사후-억제 계수의 벡터를 생성하는 사후-억제 계수 계산기, 및 사수-억제 계수의 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터를 웨이팅하는 웨이팅 회로를 포함하는, 스피치 신호에서 노이즈를 억제하는 장치를 본 발명은 제공한다.
제 6 양태에 의하면, 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터 및 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터로 스피치 신호를 변환하는 컨버터; 주파수 스펙트럼 스피치 컴포넌트의 그 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터를 결정하는 노이즈 억제 계수 계산기; 노이즈 억제 계수의 벡터에 의해 주파수 스펙트럼 컴포넌트의 제 1 벡터를 웨이팅하는 계산기; 주파수 스펙트럼 컴포넌트의 웨이팅된 제 1 벡터에 따라 제 1 섹션 보정 팩터의 벡터를 계산하고, 결합된 보정 팩터의 벡터를 생성하기 위해 제 2 섹션 보정 팩터의 벡터와 제 1 섹션 보정 팩터를 결합하여, 억제 보정 팩터의 벡터를 생성하기 위해 결합된 보정 팩터에 의해 노이즈 억제 계수의 벡터를 웨이팅하는 억제 계수 보정기; 및 억제 보정 팩터의 벡터에 의해 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터를 웨이팅하는 웨이팅 회로를 포함하는, 스피치 신호에서 노이즈를 억제하는 장치를 본 발명은 제공한다.
본 발명은 도면을 참조하여 상세히 설명될 것이다.
이제, 도 7을 참조하면, 본 발명의 제 1 실시형태에 따른 노이즈 억제기가 도시된다. 도 7에서, 도 1에서 그것들과 대응하는 엘리먼트는 동일한 참조 부호로 표시되고 그의 설명은 생략된다. 본 발명의 노이즈 억제기는 스피치 진폭 스펙트럼 보정기 (20) 의 제공에 의해 종래의 기술과는 상이하다. 진폭 스펙트럼 보정기 (20) 은 노이즈 억제 계수 보정기 (9) 와 승산기 (11) 에 연결되고 승산기 (10) 로부터 강화된 스피치 진폭 스펙트럼 컴포넌트
Figure 112007064408205-pat00067
및 노이즈 추정 회로 (5) 로부터 노이즈 컴포넌트
Figure 112007064408205-pat00068
를 수신한다. 이들 입력 컴포넌트들은, 아래에 상술된 바와 같이, 결합 계수 F를 생성하기 위해 넌스피치 (nonspeech) 섹션용 보정 계수 및 스피치 섹션용 보정 계수를 발생시키기 위한 스피치 진폭 스펙트럼 보정기 (20) 의 주요한 신호이다. 결합 계수 F는, 사후-억제 계수의 벡터
Figure 112007064408205-pat00228
를 생성하기 위해 노이즈 억제 계수
Figure 112007064408205-pat00070
를 변형하도록 사용된다. 스피치 진폭 컴포넌트
Figure 112007064408205-pat00071
는, 노이즈 억제의 양이 스피치 섹션에서는 낮고 노이즈 섹션에서는 높도록 사후-억제 계수와 승산된다. 그 결과는 스피치 섹션에서의 작은 스피치 왜곡이고 노이즈 섹션에서의 작은 잔류 노이즈이다. 스피치 진폭 스펙트럼 보정기 (20) 의 세부사항은 도 8에서 도시된다.
도 8에서 도시된 바와 같이, 스피치 진폭 스펙트럼 보정기 (20) 는, K개의 강화된 스피치 파워 스펙트럼 컴포넌트의 벡터
Figure 112007064408205-pat00229
를 생성하기 위해 승산기 (10) 로부터의 강화된 스피치 진폭 스펙트럼 컴포넌트
Figure 112007064408205-pat00073
를 스퀘어링하기 위한 스퀘어링 회로 (21) 를 포함한다. 이들 파워 스펙트럼 컴포넌트들은, 정수 K로 스펙트럼 컴포넌트 크기의 총합을 제산함으로써 평균화 회로 (22) 에서 평균되고, 스피치 존재 확률 계산기 (24) 및 사후-억제 계수 계산기 (25) 에 제공된다. 또한, 노이즈 추정 회로 (5) 로부터의 노이즈 컴포넌트
Figure 112007064408205-pat00074
는, 평균화 회로 (23) 에서 정수 K로 그들의 총합을 제산함으로써 평균되고, 계산기 (24 및 25) 에 제공된다.
스피치 존재 확률 계산기 (24) 는, 스피치와 노이즈 사이의 상호 관계를 표시하는 출력을 생성하기 위해, 평균화 회로 (22) 로부터의 강화된 스피치 파워 및 평균화 회로 (23) 로부터의 추정된 노이즈 파워를 사용한다. 바람직하게, 이 스피치-대-노이즈 관계는 스피치 존재의 확률에 의해 표현된다.
스피치 존재 확률 계산기 (24) 는, 평균된 스피치 파워를 로그로 변환하기 위해 평균화 회로 (22) 의 출력을 변환하는 로그 컨버터 (240) 를 포함하며, 그 로그는 10배-승산 회로 (241) 에서 정수 10과 스케일된다. 이 방식에서, n번째 프레임의 강화된 스피치 파워 En
삭제
Figure 112006038651418-pat00075
로서 표현된다.
반대로, 평균화 회로 (23) 의 출력은,
Figure 112006038651418-pat00076
으로서, n번째 프레임의 추정된 노이즈 파워 Nn을 표현하는 출력을 생성하기 위해 로그 컨버터 (243) 에서 로그로 변환되고, 10배-승산 회로 (244) 에서 정수 10과 스케일된다.
강화된 스피치 파워 En 와 추정된 노이즈 파워 Nn 사이의 관계가 결정되고, 이 관계에 기초하여, 입력 신호에 포함된 스피치 파워의 양을 표현하는 인덱스가 결정된다. 스피치 파워 En 가 노이즈 파워 Nn 보다 크다면, 인덱스는 스피치 존재의 확률 "p" 이 높다는 것을 표시하는 값이라 가정한다. 추정된 노이즈 파워 Nn 및 추정된 스피치 파워 En 가, 대부분의 경우, 넌스테이션너리 신호이므로, 노이즈 파워 Nn 가 스피치 파워 En 보다 큰 인스턴스 (instance) 가, 스피치 섹션에서 발생하는 것이 가능하다. 또한, 이러한 예시가 노이즈 섹션에서 발생할 수도 있다. 따라서, 그 En Nn 값이 인덱스 계산에 있어서 직접 사용된다면, 스피치 섹션의 확률 "p" 은 에러를 포함할 가능성이 있다. 정확한 인덱스 계산을 수행하기 위해, En 및 Nn 을 적절한 방식으로 변형하는 것이 바람직하다.
이 목적을 위해, 강화된 스피치 파워 En 는, 유사한 구성의 평활화 회로 (242a 및 242b) 의 쌍에 제공된다. 평활화 회로 (242a) 에서, 강화된 스피치 파워 En 는, 승산기 (24a) 에서 스케일 팩터
Figure 112007064408205-pat00077
와 승산됨으로써 평활화되고, 출력
Figure 112007064408205-pat00078
을 생성하며, 여기서,
Figure 112007064408205-pat00079
는 제 1 평활 계수를 나타낸다. 후자는, 평활 강화된 스피치 파워를 평활 계수
Figure 112007064408205-pat00080
와 승산하는 승산기 (24c) 의 출력과 가산기 (24b) 에서 합산되며, 이 강화된 스피치 파워는 가산기 (24b) 에 의해 생성되었고 지연 엘리먼트 (24d) 에 의해 프레임 간격 지연되는 것이다. 그에 따라, 평활화 회로 (242a) 는 가산기 (24b) 로부터의 결과
Figure 112006038651418-pat00081
를 생성한다. 유사한 방식으로, 평활화 회로 (242b) 는 결과
Figure 112006038651418-pat00082
를 생성하며, 여기서
Figure 112007064408205-pat00083
는, 제 1 평활 계수
Figure 112007064408205-pat00084
보다 큰 제 2 평활 계수이다. 평활 계수
Figure 112007064408205-pat00085
의 값이
Figure 112007064408205-pat00086
보다 작기 때문에, 스피치 파워 En 에 대한 평활화 회로 (242a) 의 평활 효과는 평활화 회로 (242b) 의 것보다 작다. 평활화 회로 (242a 및 242b) 의 출력은, 각각, 순시 인덱스 계산기 (246a) 및 평균 인덱스 계산기 (246b) 에 제공된다.
한편, 추정된 노이즈 파워 Nn 은, 각각, 동적 범위 압축 또는 확장용으로 사용되는 선형 또는 비선형 함수 또는 분산을 감소시키도록 사용되는 평활함수에 기초하여, 제 1 함수값
Figure 112007064408205-pat00087
및 제 2 함수값
Figure 112007064408205-pat00088
을 생성하도록 함수값 계산기 (245a 및 245b) 의 쌍에 제공된다. 함수값 계산은, 계산의 양을 감소시키기 위해 필요하지 않을 수 있다. 계산기 (245a 및 245b) 에서 사용되는 함수의 전형적인 예는
Figure 112006038651418-pat00089
Figure 112006038651418-pat00090
이고, 여기서 afc, bfc, cfc, dfc 는 실수이다.
함수값 계산기 (245a 및 245b) 의 출력들은, 각각, 순시 인덱스 계산기 (246a) 및 평균 인덱스 계산기 (246b) 에 제공되며, 또한 평활 강화된 스피치 파워
Figure 112007064408205-pat00091
Figure 112007064408205-pat00092
도, 평활화 회로 (242a 및 242b) 로부터 제공되어,
Figure 112006038651418-pat00095
Figure 112006038651418-pat00096
인 관계에 따라 인덱스들
Figure 112007064408205-pat00230
Figure 112007064408205-pat00231
를 생성하며, 여기서 aidx, bidx, θidx 는 실수이고, aidx 는 bidx 보다 크다. 일부 상수 값을 상기 식의 분모에 가산함으로써, 분산이 회피될 수 있다. 다른 방법으로, 또한, En 과 Nn 사이의 차이 또는 차이의 정규화된 (normalized) 값이 사용될 수 있다. 상술된 바와 같이, 스피치 파워 En 에 대한 평활화 회로 (242a) 의 평활효과가 평활화 회로 (242b) 의 것보다 작으므로, 평활화 회로 (242a) 의 덜 평활된 출력
Figure 112007064408205-pat00097
이 순시 인덱스
Figure 112007064408205-pat00098
를 계산하는데 적합하며, 평활화 회로 (242b) 의 더 평활된 출력
Figure 112007064408205-pat00099
이 평균 인덱스
Figure 112007064408205-pat00100
를 계산하는데 적합하다.
인덱스 계산기 (246a 및 246b) 의 출력들은, 스피치 존재의 확률 "p" 로서 출력을 생성하도록 가산기 (247) 에서 합산된다. 가산기 (247) 를 사용하는 것 대신, 웨이팅된 합산 또는 승산이 동일하게 사용될 수 있다.
사후-억제 계수 계산기 (25) 의 기능은, 계산기 (24) 로부터 제공된 스피치 존재의 확률 "p" 에 따라 사후-억제 계수의 벡터를 계산하는 것이다. 아래에 설명되는 바와 같이, 확률 "p" 가 낮은 경우, 사후-억제 계수 계산기 (25) 는, 낮은 사후-억제 계수의 벡터를 생성하기 위해 넌스피치-섹션 보정 팩터의 더 높은 비를 포함하는 웨이팅 팩터를 사용한다. 그 결과, 노이즈 섹션에서의 잔류 노이즈는 더 감소될 수 있다. 반면, 확률 "p" 가 높은 경우, 사후-억제 계수 계산기 (25) 는, 억제 계수 보정기 (9) 로부터 제공되는 보정된 노이즈-억제 계수의 벡터
Figure 112007064408205-pat00101
와 동일 또는 약간 더 큰 높은 사후-억제 계수의 벡터를 생성하기 위해 스피치-섹션 보정 팩터의 더 높은 비를 포함하는 웨이팅 팩터를 사용한다. 이러한 방식으로, 스피치 존재 확률 "p" 이 높은 경우, 스피치의 초과-억제는 피할 수 있다.
상세하게, 사후-억제 계수 계산기 (25) 는, 평균화 회로 (22 및 23) 의 출력 및 스피치 존재 확률 계산기 (24) 로부터 제공된 스피치 존재 확률 "p" 을 사용하여 넌스피치 섹션 보정 팩터
Figure 112007064408205-pat00102
를 생성하는 넌스피치 섹션 보정 팩터 계산기 (250) 를 포함한다.
넌스피치 섹션 보정 팩터 계산기 (250) 는, 스피치 존재 확률 "p" 에 의해 결정된 비율로, 평균화 회로 (22) 로부터의 강화된 스피치 파워를 메모리 (25b) 에 저장된 평균된 스피치 파워와 혼합하는 혼합기 (25a) 를 포함한다. 저장된 스피치 파워는 이전 프레임의 혼합기 (25a) 의 출력이고, 외부적으로 적용된 평활 계수를 사용하여 평활화 회로 (25c) 에서 평활화된다.
혼합기 (25a) 에서, 스피치 존재 확률 "p" 이 비교적 높다면, 더 큰 비율의 평균화된 스피치의 현재 프레임은, 더 작은 비율의 평활화된 스피치의 이전 프레임과 혼합된다. 스피치 존재 확률 "p" 이 비교적 낮다면, 더 큰 비율의 평활화된 스피치의 이전 플레임은, 더 작은 비율의 평균된 스피치의 현재 플레임과 혼합기 (25a) 에서 혼합된다.
따라서, 확률 "p" 가 비교적 낮다면, 평활화 회로 (25c) 의 입력 신호는 평활화된 이전 프레임의 더 높은 콘텐츠를 갖고, 따라서, 그것의 출력 신호는 실질적으로 업데이트되지 않는다. 그 결과, 평활화 회로 (25c) 는, 스피치 섹션중에 계산되는 것과 같이 노이즈 섹션중에 동일한 강화된 스피치 파워를 생성한다. 반대로, 확률 "p" 이 비교적 높다면, 평활화 회로 (25c) 는, 혼합기 (25a) 의 출력에 대한 그 평활 동작을 수행하기 위해 평균 강화된 스피치 파워의 더 큰 양을 포함하는 신호를 사용하며, 따라서, 그것의 출력은 업데이트된다.
평활화 회로 (25c) 가 넌스피치 섹션중에 그것의 출력을 업데이트하는 것이 아니라 스피치 섹션중에 그것의 출력을 업데이트하는 것에 대한 이유는, 입력 스피치 신호가 낮은 음성으로부터 높은 음성까지 변동하는 스피커의 볼륨의 관점에서 측정되는 것이다. 스피커가 조용한 환경에서 큰 소리를 낸다면, 계산된 스피치 존재 확률 "p" 의 신뢰도는 높고, 스피커의 음성이 노이즈 있는 환경에서 낮다면, 확률 "p" 의 신뢰도는 낮다.
평활화 회로 (25c) 로부터의 평활 강화된 스피치 파워는, 신호-대-노이즈 비를 생성하기 위해 추정된 노이즈 컴포넌트
Figure 112007064408205-pat00103
의 평균 파워로 제산 회로 (25d) 에서 제산되며, 그 신호-대-노이즈 비는 로그 컨버터 (25e) 에서 로그로 변환된다. 상술된 혼합기 (25a) 의 기능으로부터 알 수 있는 바와 같이, 스피치 존재 확률 "p" 가 낮다면, 평활화 회로 (25c) 는, 현재 프레임의 평활 강화된 스피치 파워를 계산하기 위해, 이전 프레임의 평활 강화된 스피치 파워의 더 큰 양을 포함하는 신호를 사용한다. 따라서, 확률 "p" 이 낮은 경우, 평활 강화된 스피치 파워는 실질적으로 업데이트되지 않는다. 그 결과, 노이즈 섹션중에서, 평활화 회로 (25c) 는, 스피치 섹션중에 계산된 동일한 강화된 스피치 파워를 발생시킨다. 반면, 스피치 존재 확률 "p" 이 높은 섹션중에, 평활화 회로 (25c) 는, 평활 강화된 스피치 파워를 계산하기 위해 강화된 평균 스피치 파워의 더 큰 양을 포함하는 신호를 사용한다.
또한, 제산 회로 (25d) 의 출력은, 강화된 평균 스피치 파워와 추정된 노이즈 파워의 비, 즉 강화된 평균 스피치 파워의 신호-대-노이즈 비를 표현한다. 로그 컨버터 (25e) 의 출력은 10배-승산 회로 (25f) 에서 정수 "10" 과 스케일되고 웨이팅 계산기 (25g) 에 제공된다.
또한, 위에서 획득되는 강화된 평균 스피치 파워의 SNR 에 기초하여, 웨이팅 계산기 (25g) 는, 스피치 존재의 확률 "p" 의 신뢰도를 계산에 포함함으로써 넌스피치 섹션에 부과되는 억제의 양을 표현하는 보정 팩터를 계산한다. 강화된 평균 스피치 파워의 SNR이 높은 경우 (즉, 확률 "p" 의 신뢰도가 높은 경우), 에러로 스피치 섹션이 억제될 가능성이 낮다. 따라서, 이 경우, 보정 팩터는, 억제의 양을 증가시키기 위해 낮은 값으로 설정된다. 반면, 강화된 평균 스피치 파워의 SNR 이 낮은 경우 (즉, 확률 "p" 의 신뢰도가 낮은 경우), 에러 y 로 스피치 섹션이 억제될 가능성은 높다. 따라서, 강화된 평균 스피치 파워의 SNR 이 낮은 경우, 에러로 스피치 섹션이 억제되는 것을 방지하기 위해, 보정 팩터는 억제의 양을 감소시키기 위해 높은 값으로 설정된다.
이러한 넌스피치 존재 SNR 값의 계산은 스피치 존재 확률의 신뢰도를 무음 억제 계수에 통합시키는 효과를 갖는다. 넌스피치 존재 SNR 값이 높은 경우, 즉, 스피치 존재 확률 "p" 의 신뢰도가 높은 경우, 스피치 섹션을 틀리게 억제할 가능성이 낮다. 이 경우, 웨이팅 계산기 (25g) 의 출력은 억제의 정도를 증가시키도록 낮다. 반면, 넌스피치 존재 SNR 값이 낮은 경우, 즉 스피치 존재 확률 "p" 의 신뢰도가 낮은 경우, 웨이팅 계산기 (25g) 의 출력은, 스피치 섹션이 잘못 억제되는 것을 방지하기 위해 억제의 정도를 감소시키도록 높다. 도 9는 무음 억제 계수를 계산하기 위해 사용될 수 있는 비선형 함수의 통상적인 예를 나타낸 그래프이다. 도 9에서,
Figure 112006038651418-pat00104
fcm 은 입력값을 나타내고, gcm 은 출력을 나타내며, 위 식에서 acm, bcm, ccm, dcm 은 양의 실수이다. 도 9에서 도시된 비선형 함수는 입력값이 증가함에 따라 출력값은 감소하는 것을 표시한다.
상술된 바와 같은 방식으로 획득된 무음 억제 계수는, 10-으로-제산 회로 (25h) 에서 정수 "10" 으로 제산되며, 10-으로-제산 회로 (25h) 의 출력이 넌스피치 존재 보정 팩터
Figure 112006038651418-pat00105
를 나타내는 지수값으로 변환되는 지수 계산기 (25i) 에 제공된다.
사후-억제 계수 계산기 (25) 는, 넌스피치 섹션 보정 팩터
Figure 112006038651418-pat00106
및 확률 "p" 및 스피치 섹션 보정 팩터
Figure 112006038651418-pat00107
를 수신하고,
Figure 112006038651418-pat00108
로서 표현된 결합 계수 F를 생성하는 결합 계수 계산기 (251) 를 포함한다. 확률 "p" 의 값이 크다면, 스피치 존재 보정 팩터
Figure 112006038651418-pat00109
는 결합 계수 F의 더 큰 부분이 된다는 것을 볼 수 있다. 또한, 결합 계수 F는,
Figure 112006038651418-pat00110
로서의 식에 따라 획득될 수 있으며, 여기서, FSFC 및 GSFC 는 상이한 함수값이다.
승산기 (252) 에서, 노이즈 억제 계수 보정기 (9) 로부터 제공된 노이즈 억제 계수
Figure 112007064408205-pat00111
는, 사후-억제 계수의 벡터
Figure 112007064408205-pat00232
를 생성하기 위해 사후-억제 계수 F에 의해 웨이팅된다.
스피치 진폭 컴포넌트들
Figure 112006038651418-pat00113
은, 각각, 스펙트럼 승산기 (26) 에서 사후-억제 계수에 의해 웨이팅되고, 스펙트럼 승산기 (26) 의 출력 벡터는 승산기 (11) 에 제공된다.
사후-억제 계수
Figure 112007064408205-pat00114
로 스피치 진폭 컴포넌트들
Figure 112007064408205-pat00115
을 웨이팅하는 이점은, 노이즈 억제가 스피치 섹션에서 비교적 낮은 레벨에서 및 노이즈 섹션에서 비교적 높은 레벨에서 제공될 수 있는 것이다. 그 결과는 스피치 섹션에서의 작은 스피치 왜곡이고 노이즈 섹션에서의 작은 잔류 노이즈이다.
도 7의 제 1 변형이 도 10에 도시되고, 여기서 사후-억제 계수 계산기 (25A) 는 도 8의 사후-억제 계수 계산기 (25) 의 변형된 형태이다. 변형된 계산기 (25A) 는, 평균화 회로 (22 및 23) 의 출력을 수신하고, 추정된 노이즈 파워를 강화된 스피치 파워와 비교함으로써 결합 계수 계산기 (251) 로의 출력값
Figure 112007064408205-pat00116
을 생성하는, 스피치 존재 계수 계산기 (253) 를 포함한다.
추정된 노이즈 파워가 강화된 스피치 파워보다 큰 경우 (즉, SNR이 낮은 경우),
Figure 112007064408205-pat00117
는, 1.0 에서부터, 추정된 노이즈 파워와 강화된 스피치 파워의 비의 함수로서 결정되는 어떠한 더 큰 수까지의 범위에서의 값을 가정한다. 보정된 노이즈 억제 계수
Figure 112007064408205-pat00118
가 최적값보다 작아질 가능성이 존재하므로, 1.0 보다 큰 값으로
Figure 112007064408205-pat00119
값을 설정하는 것은 노이즈 억제 계수
Figure 112007064408205-pat00120
가 스피치 섹션상에서 과도-억제의 수행하는 것을 방지한다. 이 경우, 1-보다-큰 출력값은, 추정된 노이즈 파워와 강화된 스피치 파워의 비에 의존하여 가변한다. 반면, 추정된 노이즈 파워가 강화된 스피치 파워보다 작은 경우 (즉, SNR이 높은 경우), 과도-억제가 스피치 섹션중에 발생할 가능성은 적다. 이 경우,
Figure 112007064408205-pat00121
는 1.0 보다 큰 상수값을 가정하고, 그 값은 추정된 노이즈 파워와 강화된 스피치 파워의 비와 관계없이 적절하게 결정된다.
본 발명의 제 2 실시형태가 도 11에 도시되고, 여기서 도 8의 사후-억제 계수 계산기 (25) 는 사후-억제 계수 계산기 (25B) 로서 변형된다. 이 실시형태에서, 계산기 (25B) 는 동일한 구성의 복수의 스펙트럼 사후-억제 계수 계산기들 (2540 내지 254K-1) 를 포함한다. 각각의 스펙트럼 사후-억제 계수 계산기 (254) 는 하한 계산기 (255) 및 최대 선택기 (256) 를 포함한다. 하한 계산기 (255) 는, 스피치 섹션 보정 팩터 하한 (SCLL) 값 및 넌스피치 섹션 보정 팩터 하한 (NCLL) 값을 제공받고, 계산기 (255) 의 출력값에 기여하는 SCLL 값의 일부가 스피치 존재 확률 값 "p" 와 같이 증가하도록, 스피치 존재 확률 계산기 (24) 로부터 제공된 확률값 "p" 에 따라 노이즈 억제 계수의 하한값을 계산한다. 수학식 (7) 및 (8) 은 음성화된 팩터 하한의 기여 팩터를 결정하도록 사용될 수 있다. 음성화된 소리의 왜곡을 방지하기 위해, 스피치 섹션 보정 팩터 하한 (SCLL) 값은 넌스피치 섹션 보정 팩터 하한 (NCLL) 값보다 크게 설정된다. 하한 계산기 (255) 의 출력은, 스펙트럼 사후-억제 계수 계산기 (254K) 에 대응하는 보정된 노이즈 억제 계수
Figure 112007064408205-pat00122
중 하나가 또한 적용되는 최대 선택기 (256) 에 제공된다. 최대 선택기 (256) 는 2개의 입력값 중 더 큰 것을 선택하고 선택된 값을 스펙트럼 승산기 (27) 에 공급한다.
그 결과, 스펙트럼 사후-억제 계수
Figure 112006038651418-pat00123
는, 스피치 섹션 존재 확률 "p" 에 의해 확립된 하한값보다 큰 한에서는, 승산기 (26) 에 제공된다. 이 방법에서, 스피치 존재 확률 "p" 가 높은 경우 확립된 하한값이 크므로, 초과-억제로 인해 스피치 섹션에서 발생할 수 있는 스피치 왜곡은 방지될 수 있다. 반면, 스피치 존재 확률 "p" 가 낮은 경우, 하한값은 작다. 따라서, 노이즈 섹션에 부과된 노이즈 억제의 양을 최적화하는 것이 가능하다.
도 12에서, 제 2 실시형태의 변형이 도시되고, 도 8의 사후-억제 계수 계산기 (25) 가 사후-억제 계수 계산기 (25C) 로서 변형된다. 이 변형에서, 계산기 (25C) 는 동일한 구성의 복수의 스펙트럼 사후-억제 계수 계산기들 (2570 내지 257K-1) 을 포함한다. 각각의 스펙트럼 사후-억제 계수 계산기 (257) 는, 스피치 섹션 보정 팩터 하한 (SCLL) 계산기 (258) 및 넌스피치 섹션 보정 팩터 하한 (NCLL) 계산기 (259) 를 부가적으로 포함한다는 점에서 도 11의 계산기 (254) 의 그것과는 상이하다. 계산기들 (258 및 259) 은, 노이즈 추정 회로 (5) 로부터의 추정된 노이즈 파워 스펙트럼 컴포넌트들
Figure 112007064408205-pat00124
내지
Figure 112007064408205-pat00125
중 대응하는 하나 및 그들의 스펙트럼 수에 대응하는 스퀘어링 회로 (21) 로부터의 강화된 스피치 파워 스펙트럼 컴포넌트들
Figure 112007064408205-pat00126
내지
Figure 112007064408205-pat00127
중 대응하는 하나를 수신한다. 음성화된 팩터 하한 계산기 (258) 는, 강화된 스피치 컴포넌트
Figure 112007064408205-pat00128
와 추정된 노이즈 스펙트럼 샘플
Figure 112007064408205-pat00129
(여기서, k 는 0, 1, ..., K-1 중 하나) 의 신호-대-노이즈 비에 의존하여 음성화된 팩터 하한값을 계산한다. 또한, 무음화된 팩터 하한 계산기 (259) 는, 동일한 신호-대-노이즈 비에 의존하여 무음화된 팩터 하한값을 계산한다. 계산된 스피치 섹션 보정 팩터 하한 (SCLL) 및 넌스피치 섹션 보정 팩터 하한 (NCLL) 값은 하한 계산기 (255) 에 제공된다.
스피치 섹션에서 스피치 왜곡을 감소시키기 위해, 스피치 섹션 보정 팩터 하한 (SCLL) 값은 SNR 값에 반대로 변화하도록 결정된다. 넌스피치 섹션에서 잔류 노이즈를 감소시키고 스피치 섹션에서 초과-억제를 방지하기 위해, 넌스피치 섹션 보정 팩터 하한 (NCLL) 은 스피치 섹션 보정 팩터 하한 (SCLL) 값보다 낮은 값에 설정된다. 계산기들 (258 및 259) 은, SNR 이 비교적 낮은 경우, 그들 하한값 사이의 차이가 일부 임계값 (critical value) 을 초과하지 않도록 설계되는 것이 바람직하다. 이러한 차이가 임계값보다 크다면, 잔류 노이즈에서 음성화 및 넌스피치 섹션 사이의 차이가 증가하며, 이는 왜곡된 소리가 스피치 섹션에서 감지되는 것을 야기한다. 반대로, SNR이 높은 경우, 스피치 섹션에서 잔류 노이즈 는, 음성화된 소리의 마스킹 (masking) 효과로 인해 감지될 가능성이 적다. 낮은 SNR 값의 경우로서, 음성화된 및 넌스피치 섹션에서의 구별적 잔류 노이즈는, 스피치 섹션에서 스피치 왜곡의 기여하는 팩터로 되지 않는다. 이 이유에 대해, SNR 이 높다면, 계산기들 (258 및 259) 은, 넌스피치 섹션의 잔류 노이즈가 충분히 감소하기 위해 그들의 출력값 사이의 차이가 비교적 크게 유지하도록 설계된다. 넌스피치 섹션 보정 팩터 하한 (NCLL) 값은 스피치 섹션 보정 팩터 하한 (SCLL) 값에 의존하여 결정된다. 기본적으로, 스피치 섹션 보정 팩터 하한 (SCLL) 값의 경우와 같이, SNR이 감소하는 경우, 넌스피치 섹션 보정 팩터 하한 (NCLL) 값은 증가한다.
도 13에서 도시된 바와 같이, 본 발명의 제 2 실시형태의 변형에서처럼, 계산기들 (258 및 259) 이, SNR 값을 계산하기 위해 추정된 노이즈 파워 스펙트럼 컴포넌트와 강화된 스피치 파워 컴포넌트의 평균된 값을 사용하는 것이 바람직하다. 이 변형에서, 사후-억제 계수 계산기 (25d) 는 스피치 섹션 보정 팩터 하한 (SCLL) 계산기 (258), 넌스피치 섹션 보정 팩터 하한 (NCLL) 계산기 (259) 및 하한 계산기 (255) 중 하나의 벡터만 포함한다. 평균화 회로들 (22 및 23) 의 출력은 계산기들 (258 및 259) 에 제공되고, 하한 계산기 (255) 의 출력은 최대 선택기들 (2560 내지 256K-1) 에 제공된다. 스피치 존재 확률 계산기 (24) 는 모든 최대 선택기들 (256) 에 연결된다.
도 14에서, 본 발명의 노이즈 억제기의 제 3 실시형태가 도시되고, 도 7의 그것들과 대응하는 엘리먼트들은 동일한 참조 부호를 가진다. 제 3 실시형태는, 사전 SNR 계산기 (7a) 및 노이즈 억제 계수 보정기 (9a) 가 도 7의 진폭 스펙트럼 조정기 (20), 그리고 도 1의 사전SNR 계산기 (7) 및 억제 계수 보정기 (9) 대신에 사용된다는 점에서 제 1 실시형태와는 상이하다. 사전 SNR 계산기 (7a) 는, 스퀘어링 회로 (3) 및 노이즈 추정 회로 (5) 의 출력을 부가적으로 수신한다는 점에서 종래의 계산기 (7) 과는 상이하다.
도 15에서 상세히 도시된 바와 같이, 일반적으로, 사전 SNR 계산기 (7a) 는, 지연 엘리먼트 (78), 승산기 (79), 스피치 존재 확률 계산기 (710) 및 지연 엘리먼트 (711) 를 부가적으로 포함한다는 것을 제외하고 구성에서 도 1의 종래의 계산기 (7) 와 유사하다. 스퀘어링 회로 (3) 로부터의 스피치 파워 스펙트럼 컴포넌트들
Figure 112006038651418-pat00130
은 지연 엘리먼트 (78) 에서 프레임 간격동안 지연되고, 승산기 (79) 에 제공되며, 그곳에서 그들은, 각각, 스퀘어링 회로 (74) 로부터 제공된 이전 프레임의 보정된 노이즈 억제 계수
Figure 112006038651418-pat00131
와 승산된다. 또한, 승산기 (79) 는 결과
Figure 112006038651418-pat00132
를 생성하며, 그것은 현재 프레임 "n" 의 강화된 스피치 파워 컴포넌트의 추정치로서 스피치 존재 확률 계산기 (710) 에 제공된다.
노이즈 추정 회로 (5) 로부터의 추정된 노이즈 파워 컴포넌트
Figure 112006038651418-pat00133
는 지연 엘리먼트 (711) 에서 프레임 간격동안 지연되고 스피치 존재 확률 계산기 (710) 에 제공된다. 이 방법에서, 스피치 존재 확률 계산기 (710) 의 입력 스펙트럼 신 호는 프레임에서 서로 정렬된다. 스피치 존재 확률 계산기 (710) 는, 스피치 존재 확률 "p" 를 생성하고 노이즈 억제 계수 보정기 (9a) 에 그것을 전송하기 위해 스피치 존재 확률 계산기 (24; 도 8) 와 구성에서 동일하다.
도 16에서 도시된 바와 같이, 노이즈 억제 계수 보정기 (9a) 는, 동일한 구성의 스펙트럼 (노이즈) 억제 계수 계산기들 (1900 내지 190K-1) 을 포함한다. 계산기들 (190K) 의 각각은 확률 "p" 및 노이즈 억제 계수 계산기 (8) 로부터의 대응하는 노이즈 억제 계수
Figure 112007064408205-pat00134
및 계산기 (7a) 로부터의 대응하는 사전 SNR
Figure 112007064408205-pat00135
를 수신한다. 각각의 계산기들 (1900 내지 190K-1) 은, 스펙트럼 사후-억제 계수 계산기 (2540 내지 254K-1; 도 11) 를 참조하여 상술된 것과 동일한 방식으로, 확률 "p" 에 따라 스피치 섹션 보정 팩터 하한 (SCLL) 값 및 넌스피치 섹션 보정 팩터 하한 (NCLL) 값으로부터의 하한값을 계산하는 하한 계산기 (191) 를 포함한다. 계산기 (191) 의 출력은, 선택기 (194) 가 상위 위치로 스위칭되는 경우 선택기 (194) 를 통해 직접 제공되는 억제 계수
Figure 112007064408205-pat00136
, 또는 스위치 (194)가 하위 위치에 있는 경우 승산기에서 보정값과 스케일되는 억제 계수
Figure 112007064408205-pat00137
와 최대 선택기 (192) 에서 비교된다. 비교기 (193) 는 사전 SNR
Figure 112007064408205-pat00138
을 임계값과 비교하고, 그 SNR
Figure 112007064408205-pat00139
가 임계값보다 큰 경우 선택기 (194) 를 상위 위치로 스위칭하고 그 SNR 이 임계값보다 낮은 경우 선택기 (194) 를 하위 위치로 스위칭하는 제어 신호를 생성한다. 최대 선택기 (192) 는 2개의 입력값들 중 더 큰 것을 선택하고 그 선택한 값을 승산기 (10; 도 14) 및 사후 SNR 계산기 (7a; 도 15) 의 메모리 (73) 에 전송한다.
그 결과, 스펙트럼 사후-억제 계수
Figure 112006038651418-pat00140
는, 스피치 존재 확률 "p" 에 의해 확립된 하한값보다 큰 한에서는 승산기 (10) 에 제공되며, 초과-억제로 인해 스피치 섹션에서 발생할 수 있는 스피치 왜곡이 방지될 수 있다.
도 17에서, 도 14의 제 3 실시형태의 변형이 도시되고, 사전 SNR 계산기 (7b) 및 억제 계수 보정기 (9b) 가 제공된다. 도 18에서 도시된 바와 같이, 사전 SNR 계산기 (7b) 는, 현재 프레임 "n" 의 강화된 스피치 파워 컴포넌트의 추정치로서 승산기 (79) 의 출력
Figure 112006038651418-pat00141
을 억제 계수 보정기 (9b) 에 제공한다는 것을 제외하고, 도 15의 계산기 (7a) 와 동일하다. 억제 계수 보정기 (9b) 는, 스피치 존재 확률값 "p" 및 노이즈 억제 계수
Figure 112006038651418-pat00142
에 더하여, 노이즈 추정 회로 (5) 로부터의 추정된 노이즈 파워 스펙트럼 컴포넌트
Figure 112006038651418-pat00143
및 사전 SNR 계산기 (7b) 로부터의 강화된 스피치 파워 추정치
Figure 112006038651418-pat00144
을 수신한다.
도 19에서 도시된 바와 같이, 억제 계수 보정기 (9b) 는, 도 16의 하한 계산기 (191) 및 최대 선택기 (192) 대신 넌스피치 섹션 보정 팩터 계산기 (196), 결합 계수 계산기 (197) 및 승산기 (198) 를 포함한다는 것을 제외하고, 도 16의 억제 계수 보정기 (9a) 와 동일하다.
넌스피치 섹션 보정 팩터 계산기 (196) 는, 평균화 회로 (22) 로부터의 강화된 스피치 파워 스펙트럼 컴포넌트
Figure 112007064408205-pat00145
의 평균값을 사용한 도 8의 넌스피치 섹션 보정 팩터 계산기 (250) 와 유사한 방식으로, 넌스피치 섹션 보정 팩터
Figure 112007064408205-pat00146
를 계산하기 위해 확률값 "p", 추정된 노이즈 파워 스펙트럼 컴포넌트
Figure 112007064408205-pat00147
, 및 강화된 스피치 파워 샘플의 추정치
Figure 112007064408205-pat00148
를 사용한다. 특히, 넌스피치 섹션 보정 팩터 계산기 (196) 는, 넌스피치 섹션 보정 팩터
Figure 112007064408205-pat00149
를 결정하기 위해 강화된 스피치 파워 추정치
Figure 112007064408205-pat00150
를 주요한 팩터로서 다룬다.
이 방식에서 계산된 넌스피치 섹션 보정 팩터
Figure 112007064408205-pat00151
는, 스피치 섹션 보정 팩터
Figure 112007064408205-pat00152
가 또한 적용되는 결합 계수 계산기 (197) 에 제공된다. 계산기 (197) 는, 보정 팩터
Figure 112007064408205-pat00153
,
Figure 112007064408205-pat00154
, 확률 "p" 를 사용하여 결합 계수 F를 계산하기 위한 도 8의 계산기 (251) 와 동일하다. 승산기 (198) 는 계산기 (197) 의 출력을 선택기 (194) 를 통해 직접 제공되는 비-보정 노이즈 억제 계수
Figure 112007064408205-pat00155
또는 승산기 (195) 를 통해 제공되는 보정된 노이즈 억제 계수
Figure 112007064408205-pat00156
로 승산한다.
노이즈 억제 계수
Figure 112006038651418-pat00157
가, 스피치 섹션 확률 "p" 에 따라 계산된 보정 팩터에 의해 승산기 (198) 에서 보정되고, 스피치 파워 스펙트럼 컴포넌트의 추정치가, 보정된 억제 계수
Figure 112006038651418-pat00158
를 사용한 피드백 루프를 통해 사전 SNR 계산기 (7b) 에서 업데이트되므로, 노이즈 섹션에서 잔류 노이즈는 효과적으로 더 억제될 수 있다.
도 20은, 도 11의 진폭 스펙트럼 보정기 (20) 가 스피치 존재 확률값 "p" 를 추출하기 위해 도 7에 도시된 바와 같은 진폭 스펙트럼 보정기 (20a) 로서 변형된, 도 7의 제 1 실시형태의 추가적인 변형을 도시한 것이다. 이 실시형태의 노이즈 억제기에 프레임-지연 엘리먼트 (14) 및 가산기 (15) 가 더 제공된다. 진폭 스펙트럼 보정기 (20a) 로부터 추출된 확률 "p" 는, 지연 엘리먼트 (14) 에서 프레임 간격동안 지연되고, 스피치 부재 확률 q = 1 - p 을 생성하기 위해 "1" 을 감산하며, 그 부재 확률은 노이즈 억제 계수 계산기 (8; 도5) 에 제공된다.
도 22에서 도시된 바와 같이, 본 발명은 더 변형할 수 있고, 스피치 존재 확률 "p" 는, 계산기 (7) 의 사전 SNR 값
Figure 112007064408205-pat00159
에 의해 스피치 존재 확률 계산기 (16) 에서 계산된다. 스피치 존재 확률 계산기 (16) 의 출력은, 스피치 부재 확률 "q" 을 발생시키기 위해 확률 "p" 이 "1" 만큼 감산되는 가산기 (15) 및 진폭 스펙트럼 보정기 (20b) 와 커플링되며, 그 부재 확률은 억제 계수 계산기 (8) 에 제공된다.
도 23에서 도시된 바와 같이, 스피치 존재 확률 계산기 (16) 는, 사전 SNR 값들을 합산하고 그 합을 정수 K로 제산함으로써 사전 SNR 값
Figure 112006038651418-pat00160
의 평균값을 생성하는 평균화 회로 (160) 를 포함한다. 사전 SNR 값의 평균값은,
Figure 112006038651418-pat00161
인, 풀-밴드 (full-band) 사전 SNR
Figure 112006038651418-pat00162
을 생성하기 위해, 로그 컨버터 (161) 에서 로그로 변환되고 승산기 (162) 에서 정수 "10" 과 승산된다.
풀-밴드 사전 SNR
Figure 112006038651418-pat00163
는, 식 (3a) 및 (3b) 에 따라 도 8의 평활화 회로 (242a 및 242b) 를 참조하여 상술된 것과 유사한 방식으로, 제 1 및 제 2 평활화된 사전 SNR 값들
Figure 112006038651418-pat00164
Figure 112006038651418-pat00165
의 쌍을 생성하기 위해 평활화 회로들 (163 및 164) 의 쌍에서 평활화된다. 제 1 및 제 2 평활화된 사전 SNR 값들
Figure 112006038651418-pat00166
Figure 112006038651418-pat00167
는,
Figure 112006038651418-pat00168
Figure 112006038651418-pat00169
인, 인덱스 신호
Figure 112006038651418-pat00170
Figure 112006038651418-pat00171
를 생성하기 위해,각각, 순시 인덱스 계산기 (165) 및 평균 인덱스 계산기 (166) 에 제공되며, 여기서 θidx2, aidx2, bidx2 는 실수이고 aidx2 는 bidx2 보다 크다. 인덱스 신호는, 평활화된 사전 SNR의 값에 의존하여 현저하게 변한다. 인덱스 계산기들 (165 및 166) 은, 스피치 존재의 확률 "p" 로서 출력을 생성하도록 가산기 (167) 에서 합산된다. 계산기 (16) 의 출력 "p" 는, 노이즈 억제 계수 계산기 (8; 도 5) 로의 애플리케이션에 대해 스피치 부재 확률 "q" 를 생성하기 위해 "1" 만큼 감산될 가산기 (15) 에 제공된다. 또한, 스피치 존재 확률 계산기 (16) 의 출력 신호는 진폭 스펙트럼 보정기 (20b; 도 24) 로 전송된다.
도 24에서 나타낸 바와 같이, 진폭 스펙트럼 보정기 (20b) 는, 사후-억제 계수 계산기 (25) 및 승산기 (26) 만을 포함한다는 점을 제외하고, 도 21의 진폭 스펙트럼 보정기 (20a) 와 유사하다. 확률 "p" 는 모든 스펙트럼 사후-억제 계수 계산기 (2540 내지 254K-1) 에 제공된다.
도 25에 도시된 바와 같이, 도 22의 노이즈 억제기는 변형될 수 있고, 사후 SNR 값
Figure 112006038651418-pat00172
은 사전 SNR 값
Figure 112006038651418-pat00173
에 부가하여 스피치 존재 확률 계산기 (16a) 에 제공된다.
도 26에서, 스피치 존재 확률 계산기 (16a) 는, 부가적으로, 사후 SNR 값
Figure 112006038651418-pat00174
의 평균값을 계산하는 평균화 회로 (168) 를 포함한다. 사전 SNR의 평균값
Figure 112006038651418-pat00175
및 사후 SNR의 평균값
Figure 112006038651418-pat00176
은,
Figure 112006038651418-pat00177
인, 식 (11) 에 따라 출력
Figure 112006038651418-pat00178
을 생성하기 위해 SNR 혼합기 (169) 에서 함께 결합되며, 여기서, Fmix 는 사전 SNR 평균값
Figure 112006038651418-pat00179
의 함수이고,
Figure 112006038651418-pat00180
에 의존하여 0과 1사이의 범위에서의 실수로 가정한다. SNR 혼합기 (169) 의 출력은 로그 컨버터 (169) 에 제공된다.
식 (11) 은, 입력 신호가 노이즈에 대해 더 적게 열화되는 경우, 사후 SNR 의 평균값
Figure 112006038651418-pat00181
은 SNR 혼합기 (169) 의 출력에서 우세하다는 것을 표시한다. 입력 신호의 신호-대-노이즈 비가 높은 경우 사후 SNR 값
Figure 112006038651418-pat00182
의 정확도가 사전 SNR 값
Figure 112006038651418-pat00183
의 그것보다 높으므로, 혼합기 (169) 의 출력은, 신호-대-노이즈의 상 이한 값에 대해 사후 SNR 값의 평균값보다 더 정확도를 갖는다. 그러므로, 이 방법에서 획득된 스피치 섹션 확률 "p" 는, 도 23의 스피치 존재 확률 계산기 (16) 의 그것보다 더 정확하다.
MMSE-STSA (최소 평균 시퀀스 에러 짧은 시간 스펙트럼 진폭) 로서 공지된 기술이 사용된 실시형태를 설명하였지만, 위너 (Wiener) 필터링 및 스펙트럼 감산과 같은 다른 기술이 또한 동등하게 사용될 수 있다.
상술한 바와 같이, 본 발명에 의하면, 스위치 섹션에서 스위치의 왜곡을 감소시키고, 노이즈 섹션에서의 잔류 노이즈를 억제할 수 있다.

Claims (44)

  1. 스피치 신호에서 노이즈를 억제하는 방법으로서,
    a) 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00233
    및 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00234
    로 상기 스피치 신호를 변환하는 단계;
    b) 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00235
    에 기초하여 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00236
    를 결정하는 단계;
    c) 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00237
    에 기초하여 스피치-대-노이즈 관계 (p) 를 결정하는 단계;
    d) 상기 결정된 스피치-대-노이즈 관계 (p), 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00238
    , 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00239
    에 기초하여 사후-억제 계수의 벡터
    Figure 112007064408205-pat00240
    를 결정하는 단계; 및
    e) 상기 사후-억제 계수의 벡터
    Figure 112007064408205-pat00241
    에 의해 상기 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00242
    를 웨이팅하는 단계를 포함하는, 노이즈 억제 방법.
  2. 제 1 항에 있어서,
    (d) 단계는,
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00243
    에 기초하여 제 1 보정 팩터
    Figure 112007064408205-pat00244
    를 결정하고, 상기 제 1 보정 팩터
    Figure 112007064408205-pat00245
    및 소정의 제 2 보정 팩터
    Figure 112007064408205-pat00246
    에 기초하여 상기 사후-억제 계수의 벡터를 계산하는 단계,
    상기 제 1 보정 팩터와 상기 제 2 보정 팩터를 결합하여 결합된 보정 팩터
    Figure 112007064408205-pat00247
    를 생성하는 단계, 및
    상기 결합된 보정 팩터
    Figure 112007064408205-pat00248
    에 의해 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00249
    를 웨이팅하여 상기 사후-억제 계수의 벡터를 결정하는 단계를 포함하는, 노이즈 억제 방법.
  3. 제 2 항에 있어서,
    (d) 단계는,
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00250
    를 상기 노이즈 억제 계수
    Figure 112007064408205-pat00251
    로 웨이팅하여 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00252
    를 생성하는 단계, 및
    상기 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00253
    를 사용하여 상기 제 1 보정 팩터
    Figure 112007064408205-pat00254
    를 결정하는 단계를 포함하는, 노이즈 억제 방법.
  4. 제 2 항 또는 제 3 항에 있어서,
    상기 주파수 스펙트럼 스피치 컴포넌트로부터 주파수 스펙트럼 노이즈 컴포넌트의 벡터를 추정하는 단계를 더 포함하며,
    (d) 단계는, 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00255
    를 사용하여 상기 제 1 보정 팩터
    Figure 112007064408205-pat00256
    를 결정하는 단계를 포함하는, 노이즈 억제 방법.
  5. 제 2 항에 있어서,
    (d) 단계는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00257
    에 기초하여 상기 제 2 보정 팩터
    Figure 112007064408205-pat00258
    를 결정하고, 상기 사후-억제 계수의 벡터를 결정하기 위해 상기 제 1 및 제 2 보정 팩터를 사용하는 단계를 포함하는, 노이즈 억제 방법.
  6. 제 2 항에 있어서,
    (d) 단계는, 상기 결정된 스피치-대-노이즈 관계 (p) 에 따라 상기 제 1 및 제 2 보정 팩터
    Figure 112007064408205-pat00259
    ,
    Figure 112007064408205-pat00260
    를 결합하여 상기 결합된 보정 팩터
    Figure 112007064408205-pat00261
    를 생성하는 단계를 포함하는, 노이즈 억제 방법.
  7. 제 6 항에 있어서,
    (d) 단계는,
    Figure 112006038651418-pat00184
    에 따라 상기 제 1 보정 팩터와 상기 제 2 보정 팩터를 결합하는 단계를 포함하며,
    여기서, p는 상기 스피치-대-노이즈 관계를 나타내고,
    Figure 112006038651418-pat00185
    Figure 112006038651418-pat00186
    는, 각각, 상기 제 1 보정 팩터 및 상기 제 2 보정 팩터를 나타내는, 노이즈 억제 방법.
  8. 제 1 항에 있어서,
    상기 스피치-대-노이즈 관계는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 있어서의 스피치 섹션의 존재의 확률을 나타내는, 노이즈 억제 방법.
  9. 제 1 항에 있어서,
    (d) 단계는,
    상기 스피치-대-노이즈 관계 (p) 에 기초하여 노이즈 억제 계수의 복수의 하한값을 결정하는 단계, 상기 노이즈 억제 계수의 복수의 하한값과 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00262
    와 비교하는 단계, 및 그 비교 결과에 의존하여 상기 복수의 하한값 또는 상기 노이즈 억제 계수를 사용하여 상기 사후-억제 계수의 벡터
    Figure 112007064408205-pat00263
    를 결정하는 단계를 포함하는, 노이즈 억제 방법.
  10. 제 9 항에 있어서,
    (d) 단계는, 제 1 보정 팩터 하한값 (NCLL) 및 제 2 보정 팩터 하한값 (SCLL) 에 더 기초하여 노이즈 억제 계수의 상기 복수의 하한값을 결정하는 단계를 포함하는, 노이즈 억제 방법.
  11. 제 10 항에 있어서,
    (d) 단계는, 상기 스피치-대-노이즈 관계 (p) 에 기초하여 상기 제 1 보정 팩터 하한값 (NCLL) 및 상기 제 2 보정 팩터 하한값 (SCLL) 을 결정하는 단계를 포함하는, 노이즈 억제 방법.
  12. 삭제
  13. 스피치 신호에서 노이즈를 억제하는 방법으로서,
    a) 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00264
    및 주파수 스펙트럼 스피치 컴포넌트의 상기 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00265
    로 상기 스피치 신호를 변환하는 단계;
    b) 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00266
    로 부터 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00267
    를 추정하는 단계;
    c) 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00268
    , 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00269
    , 및 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00270
    를 사용하여 신호-대-잡음 비를 계산하는 단계;
    d) 상기 신호-대-잡음 비로부터 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00271
    를 결정하는 단계;
    e) 상기 신호-대-잡음 비 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00272
    를 사용하여 상기 노이즈 억제 계수의 벡터를 보정하는 단계; 및
    f) 상기 보정된 노이즈 억제 계수의 벡터에 의해 상기 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00273
    를 웨이팅하는 단계를 포함하는, 노이즈 억제 방법.
  14. 제 13 항에 있어서,
    상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00274
    , 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00275
    , 및 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00276
    로부터 스피치-대-노이즈 관계 (p) 를 결정하는 단계를 더 포함하며,
    (d) 단계는, 상기 노이즈 억제 계수
    Figure 112007064408205-pat00277
    의 하한값의 벡터를 결정하는 단계, 및 상기 하한값의 벡터 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00278
    중 더 큰 것을 상기 보정된 노이즈 억제 계수로서 선택하는 단계를 포함하는, 노이즈 억제 방법.
  15. 제 14 항에 있어서,
    상기 스피치-대-노이즈 관계는 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 있어서의 스피치 섹션의 존재의 확률을 나타내는, 노이즈 억제 방법.
  16. 제 13 항에 있어서,
    e) 단계는,
    e1) 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00279
    , 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00280
    , 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00281
    로부터 스피치 파워 추정치
    Figure 112007064408205-pat00282
    의 벡터를 결정하는 단계;
    e2) 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00283
    및 상기 스피치 파워 추정치
    Figure 112007064408205-pat00284
    의 벡터를 사용하여 제 1 보정 팩터
    Figure 112007064408205-pat00285
    의 벡터 를 계산하는 단계;
    e3) 제 1 보정 팩터
    Figure 112007064408205-pat00286
    의 벡터와 제 2 보정 팩터
    Figure 112007064408205-pat00287
    의 벡터를 결합하여 결합된 보정 팩터
    Figure 112007064408205-pat00288
    의 벡터를 생성하는 단계; 및
    e4) 상기 결합된 보정 팩터
    Figure 112007064408205-pat00289
    의 벡터로 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00290
    를 보정하는 단계를 포함하는, 노이즈 억제 방법.
  17. 제 16 항에 있어서,
    (e3) 단계는,
    Figure 112007064408205-pat00187
    에 따라 상기 제 1 보정 팩터와 상기 제 2 보정 팩터를 결합하는 단계를 포함하며,
    여기서, p는 상기 스피치-대-노이즈 관계를 나타내고
    Figure 112007064408205-pat00188
    Figure 112007064408205-pat00189
    는, 각각, 상기 제 1 및 제 2 보정 팩터를 나타내는, 노이즈 억제 방법.
  18. 삭제
  19. 스피치 신호에서 노이즈를 억제하는 장치로서,
    주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00291
    및 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00292
    로 상기 스피치 신호를 변환하는 컨버터 (2);
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 기초하여 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00293
    를 결정하는 노이즈 억제 계수 계산기 (8);
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00294
    및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00295
    에 기초하여 스피치-대-노이즈 관계 (p) 를 결정하는 스피치-대-노이즈 관계 계산기 (24, 710);
    상기 스피치-대-노이즈 관계 (p), 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00296
    , 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00297
    에 기초하여 사후-억제 계수의 벡터
    Figure 112007064408205-pat00298
    를 결정하는 사후-억제 계수 계산기 (25); 및
    상기 사후-억제 계수의 벡터
    Figure 112007064408205-pat00299
    에 의해 상기 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00300
    를 웨이팅하는 웨이팅 회로 (26) 를 포함하는, 노이즈 억제 장치.
  20. 제 19 항에 있어서,
    상기 사후-억제 계수 계산기 (25) 는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00301
    에 기초하여 제 1 보정 팩터
    Figure 112007064408205-pat00302
    를 결정하고, 제 1 보정 팩터
    Figure 112007064408205-pat00303
    및 소정의 제 2 보정 팩터
    Figure 112007064408205-pat00304
    에 기초하여 상기 사후-억제 계수를 계산하며, 상기 제 1 보정 팩터와 상기 제 2 보정 팩터를 결합하여 결합된 보정 팩터
    Figure 112007064408205-pat00305
    를 생성하고, 상기 결합된 보정 팩터
    Figure 112007064408205-pat00306
    로 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00307
    를 웨이팅하여 상기 사후-억제 계수의 벡터
    Figure 112007064408205-pat00308
    를 결정하는, 노이즈 억제 장치.
  21. 제 20 항에 있어서,
    상기 노이즈 억제 계수 계산기 (8) 로부터의 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00309
    로 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00310
    를 웨이팅하여 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00311
    를 생성하는 웨이팅 회로 (10) 를 더 포함하며,
    상기 사후-억제 계수 계산기 (25) 는, 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00312
    를 사용하여 상기 제 1 보정 팩터
    Figure 112007064408205-pat00313
    를 결정하는, 노이즈 억제 장치.
  22. 제 20 항 또는 제 21 항에 있어서,
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00314
    로부터 주파수 스펙트럼 노이즈 컴포넌트의 벡터를 추정하는 노이즈 추정 회로 (5) 를 더 포함하며,
    상기 사후-억제 계수 계산기 (25) 는, 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트를 사용하여 상기 제 1 보정 팩터
    Figure 112007064408205-pat00315
    를 결정하는, 노이즈 억제 장치.
  23. 제 20 항에 있어서,
    상기 사후-억제 계수 계산기 (25) 는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00316
    에 기초하여 상기 제 2 보정 팩터를 결정하고, 상기 제 1 및 제 2 보정 팩터를 사용하여 상기 사후-억제 계수의 벡터를 결정하는, 노이즈 억제 장치.
  24. 제 20 항에 있어서,
    상기 사후-억제 계수 계산기 (25) 는, 상기 결정된 스피치-대-노이즈 관계 (p) 에 따라 상기 제 1 및 제 2 보정 팩터
    Figure 112007064408205-pat00317
    ,
    Figure 112007064408205-pat00318
    를 결합하는 결합 회로 (251) 를 포함하는, 노이즈 억제 장치.
  25. 제 24 항에 있어서,
    상기 결합 회로 (251) 는,
    Figure 112007064408205-pat00190
    에 따라, 상기 제 1 보정 팩터와 상기 제 2 보정 팩터를 결합하며,
    여기서, p 는 상기 스피치-대-노이즈 관계를 나타내고
    Figure 112007064408205-pat00191
    Figure 112007064408205-pat00192
    는, 각각, 상기 제 1 보정 팩터 및 상기 제 2 보정 팩터를 나타내는, 노이즈 억제 장치.
  26. 제 19 항에 있어서,
    상기 스피치-대-노이즈 관계는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 있어서의 스피치 섹션 존재의 확률을 나타내는, 노이즈 억제 장치.
  27. 제 22 항에 있어서,
    상기 주파수 스펙트럼 스피치 컴포넌트를 스퀘어링하는 스퀘어링 회로 (21), 상기 스퀘어링된 주파수 스펙트럼 스피치 컴포넌트를 평균하여 스피치 파워 평균값을 생성하는 제 1 평균화 회로 (22) 및 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트를 평균하여 노이즈 파워 평균값을 생성하는 제 2 평균화 회로 (23) 를 더 포함하며,
    스피치-대-노이즈 관계 계산기 (24) 는,
    제 1 및 제 2 평활화 팩터에 따라 상기 스피치 파워 평균값을 평활화하여 제 1 평활화된 스피치 파워 평균값 및 제 2 평활화된 스피치 파워 평균값을 각각 생성하는 평활화 회로의 쌍 (242a, 242b);
    상기 노이즈 파워 평균값으로부터 제 1 함수값 및 제 2 함수값을 생성하는 제 1 및 제 2 함수값 계산기의 쌍 (245a, 245b);
    상기 제 1 평활화된 스피치 파워 평균값에 따라 상기 제 1 함수값으로부터 제 1 인덱스를 생성하고, 상기 제 2 평활화된 스피치 파워 평균값에 따라 상기 제 2 함수값으로부터 제 2 인덱스를 생성하는 제 1 및 제 2 인덱스 계산기의 쌍 (246a, 246b); 및
    상기 제 1 인덱스와 상기 제 2 인덱스를 합산하여 상기 스피치-대-노이즈 관계를 나타내는 출력 신호를 생성하는 가산기 (247) 를 포함하는, 노이즈 억제 장치.
  28. 제 19 항에 있어서,
    상기 사후-억제 계수 계산기 (25b) 는,
    상기 스피치-대-노이즈 관계 (p) 에 기초하여 노이즈 억제 계수의 복수의 하한값을 결정하고, 상기 노이즈 억제 계수의 하한값과 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00319
    와 비교하고, 그 비교 결과에 의존하여 상기 복수의 하한값 또는 상기 노이즈 억제 계수를 사용하여 상기 사후-억제 계수의 벡터
    Figure 112007064408205-pat00320
    를 결정하는, 노이즈 억제 장치.
  29. 제 28 항에 있어서,
    상기 사후-억제 계수 계산기 (25b) 는, 제 1 보정 팩터 하한값 (NCLL) 및 제 2 보정 팩터 하한값 (SCLL) 에 더 기초하여 노이즈 억제 계수의 상기 복수의 하한값을 결정하는, 노이즈 억제 장치.
  30. 제 29 항에 있어서,
    상기 사후-억제 계수 계산기 (25b) 는, 상기 스피치-대-노이즈 관계 (p) 에 기초하여 제 1 보정 팩터 하한값 (NCLL) 및 상기 제 2 보정 팩터 하한값 (SCLL) 을 결정하는, 노이즈 억제 장치.
  31. 삭제
  32. 삭제
  33. 스피치 신호에서 노이즈를 억제하는 장치로서,
    주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00321
    및 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00322
    와 동일한 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00323
    로 상기 스피치 신호를 변환하는 컨버터 (2);
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00324
    로부터 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00325
    를 추정하는 노이즈 추정기 (5);
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00326
    , 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00327
    및 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00328
    를 사용하여 신호-대-잡음비를 계산하는 신호-대-잡음비 계산기 (6, 7a, 7b);
    상기 신호-대-잡음 비로부터 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00329
    를 결정하는 노이즈 억제 계수 계산기 (8);
    상기 신호-대-잡음 비를 사용하여 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00330
    를 보정하는 억제 계수 보정기 (9a, 9b); 및
    상기 보정된 노이즈 억제 계수의 벡터에 의해 상기 주파수 스펙트럼 스피치 컴포넌트의 제 2 벡터
    Figure 112007064408205-pat00331
    를 웨이팅하는 웨이팅 회로 (10) 를 포함하는, 노이즈 억제 장치.
  34. 제 33 항에 있어서,
    상기 신호-대-잡음비 계산기 (7a) 는 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00332
    , 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00333
    및 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00334
    로부터 스피치-대-노이즈 관계 (p) 를 결정하는 스피치-대-노이즈 관계 계산기 (710) 를 포함하며,
    상기 억제 계수 보정기 (9a) 는, 상기 스피치-대-노이즈 관계 (p) 에 기초하여 상기 노이즈 억제 계수
    Figure 112007064408205-pat00335
    의 하한값의 벡터를 결정하고, 상기 하한값의 벡터 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00336
    중 더 큰 것을 상기 보정된 노이즈 억제 계수로서 선택하는, 노이즈 억제 장치.
  35. 제 33 항에 있어서,
    상기 스피치-대-노이즈 관계는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터에 있어서의 스피치 섹션 존재의 확률을 나타내는, 노이즈 억제 장치.
  36. 삭제
  37. 삭제
  38. 제 4 항에 있어서,
    (c) 단계는,
    상기 주파수 스펙트럼 스피치 컴포넌트를 스퀘어링하는 단계;
    상기 스퀘어링된 주파수 스펙트럼 스피치 컴포넌트를 평균하여 스피치 파워 평균값을 생성하는 단계;
    상기 추정된 주파수 스펙트럼 노이즈 컴포넌트를 평균하여 노이즈 파워 평균값을 생성하는 단계;
    제 1 및 제 2 평활화 팩터에 따라 스피치 파워 평균값을 평활화하여 제 1 평활화된 스피치 파워 평균값 및 제 2 평활화된 스피치 파워 평균값을 생성하는 단계;
    상기 노이즈 파워 평균값으로부터 제 1 함수값 및 제 2 함수값을 생성하는 단계;
    상기 제 1 평활화된 스피치 파워 평균값에 따라 상기 제 1 함수값으로부터 제 1 인덱스를, 상기 제 2 평활화된 스피치 파워 평균값에 따라 상기 제 2 함수값으로부터 제 2 인덱스를 생성하는 단계; 및
    상기 제 1 및 제 2 인덱스를 합산하여 상기 스피치-대-노이즈 관계를 나타내는 출력 신호를 생성하는 단계를 포함하는, 노이즈 억제 방법.
  39. 제 1 항에 있어서,
    (c) 단계는,
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00337
    및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00338
    를 사용하여 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00339
    를 결정하는 단계; 및
    상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00340
    및 상기 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00341
    에 기초하여 상기 스피치-대-노이즈 관계 (p) 를 결정하는 단계를 포함하는, 노이즈 억제 방법.
  40. 삭제
  41. 제 19 항에 있어서,
    상기 스피치-대-노이즈 관계 계산기 (24) 는,
    상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00344
    및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00345
    를 사용하여 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00346
    를 결정하는 수단; 및
    상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00347
    및 상기 강화된 스피치 진폭 스펙트럼 컴포넌트의 벡터
    Figure 112007064408205-pat00348
    에 기초하여 상기 스피치-대-노이즈 관계 (p) 를 결정하는 수단을 포함하는, 노이즈 억제 장치.
  42. 삭제
  43. 제 33 항에 있어서,
    상기 신호-대-잡음비 계산기 (6, 7b) 는, 상기 주파수 스펙트럼 스피치 컴포넌트의 제 1 벡터
    Figure 112007064408205-pat00351
    , 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00352
    , 및 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00353
    로부터 스피치 파워 추정치의 벡터
    Figure 112007064408205-pat00354
    를 결정하고;
    상기 억제 계수 보정기 (9b) 는, 상기 추정된 주파수 스펙트럼 노이즈 컴포넌트의 벡터
    Figure 112007064408205-pat00355
    및 상기 스피치 파워 추정치의 벡터
    Figure 112007064408205-pat00356
    를 사용하여 제 1 보정 팩터
    Figure 112007064408205-pat00357
    의 벡터를 계산하고, 결합된 보정 팩터
    Figure 112007064408205-pat00358
    의 벡터를 생성하도록 제 1 보정 팩터
    Figure 112007064408205-pat00359
    의 벡터와 제 2 보정 팩터
    Figure 112007064408205-pat00360
    의 벡터를 결합하고, 상기 결합된 보정 팩터
    Figure 112007064408205-pat00361
    의 벡터로 상기 노이즈 억제 계수의 벡터
    Figure 112007064408205-pat00362
    를 보정하는, 노이즈 억제 장치.
  44. 제 43 항에 있어서,
    상기 억제 계수 보정기 (9b) 는,
    Figure 112007064408205-pat00193
    에 따라 상기 제 1 보정 팩터
    Figure 112007064408205-pat00363
    의 벡터와 상기 제 2 보정 팩터
    Figure 112007064408205-pat00364
    의 벡터를 결합하며, 여기서, p는 상기 스피치-대-노이즈 관계를 나타내고
    Figure 112007064408205-pat00365
    Figure 112007064408205-pat00366
    는 각각 상기 제 1 및 제 2 보정 팩터를 나타내는, 노이즈 억제 장치.
KR1020060049097A 2005-05-31 2006-05-31 노이즈 억제를 위한 방법 및 장치 KR100843522B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005158447A JP4670483B2 (ja) 2005-05-31 2005-05-31 雑音抑圧の方法及び装置
JPJP-P-2005-00158447 2005-05-31

Publications (2)

Publication Number Publication Date
KR20060125572A KR20060125572A (ko) 2006-12-06
KR100843522B1 true KR100843522B1 (ko) 2008-07-03

Family

ID=36819562

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060049097A KR100843522B1 (ko) 2005-05-31 2006-05-31 노이즈 억제를 위한 방법 및 장치

Country Status (5)

Country Link
US (1) US8160873B2 (ko)
EP (1) EP1729286B1 (ko)
JP (1) JP4670483B2 (ko)
KR (1) KR100843522B1 (ko)
CN (1) CN1892822B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101320963B1 (ko) 2009-03-31 2013-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100593197C (zh) * 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
ES2525427T3 (es) * 2006-02-10 2014-12-22 Telefonaktiebolaget L M Ericsson (Publ) Un detector de voz y un método para suprimir sub-bandas en un detector de voz
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
JP5151102B2 (ja) * 2006-09-14 2013-02-27 ヤマハ株式会社 音声認証装置、音声認証方法およびプログラム
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
JP2008216721A (ja) * 2007-03-06 2008-09-18 Nec Corp 雑音抑圧の方法、装置、及びプログラム
US7885810B1 (en) * 2007-05-10 2011-02-08 Mediatek Inc. Acoustic signal enhancement method and apparatus
KR20080111290A (ko) * 2007-06-18 2008-12-23 삼성전자주식회사 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
CN101911183A (zh) * 2008-01-11 2010-12-08 日本电气株式会社 信号分析控制、信号分析、信号控制系统、装置以及程序
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
US8914282B2 (en) * 2008-09-30 2014-12-16 Alon Konchitsky Wind noise reduction
US20100082339A1 (en) * 2008-09-30 2010-04-01 Alon Konchitsky Wind Noise Reduction
US20110125490A1 (en) * 2008-10-24 2011-05-26 Satoru Furuta Noise suppressor and voice decoder
JP5413575B2 (ja) * 2009-03-03 2014-02-12 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
US20110096942A1 (en) * 2009-10-23 2011-04-28 Broadcom Corporation Noise suppression system and method
JP5641186B2 (ja) * 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
TWI459828B (zh) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
CN101976566B (zh) * 2010-07-09 2012-05-02 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
JP5265056B2 (ja) * 2011-01-19 2013-08-14 三菱電機株式会社 雑音抑圧装置
US20150287406A1 (en) * 2012-03-23 2015-10-08 Google Inc. Estimating Speech in the Presence of Noise
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
FR3002679B1 (fr) * 2013-02-28 2016-07-22 Parrot Procede de debruitage d'un signal audio par un algorithme a gain spectral variable a durete modulable dynamiquement
US9570087B2 (en) 2013-03-15 2017-02-14 Broadcom Corporation Single channel suppression of interfering sources
CN105144290B (zh) * 2013-04-11 2021-06-15 日本电气株式会社 信号处理装置、信号处理方法和信号处理程序
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9449610B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Speech probability presence modifier improving log-MMSE based noise suppression performance
EP3152756B1 (en) * 2014-06-09 2019-10-23 Dolby Laboratories Licensing Corporation Noise level estimation
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
WO2017136018A1 (en) * 2016-02-05 2017-08-10 Nuance Communications, Inc. Babble noise suppression
CN106910511B (zh) * 2016-06-28 2020-08-14 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
EP3692529B1 (en) * 2017-10-12 2023-05-24 Huawei Technologies Co., Ltd. An apparatus and a method for signal enhancement
WO2020107269A1 (zh) * 2018-11-28 2020-06-04 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
JP7439432B2 (ja) 2019-09-27 2024-02-28 ヤマハ株式会社 音響処理方法、音響処理装置およびプログラム
JP7439433B2 (ja) 2019-09-27 2024-02-28 ヤマハ株式会社 表示制御方法、表示制御装置およびプログラム
JP7484118B2 (ja) 2019-09-27 2024-05-16 ヤマハ株式会社 音響処理方法、音響処理装置およびプログラム
CN111933169B (zh) * 2020-08-20 2022-08-02 成都启英泰伦科技有限公司 一种二次利用语音存在概率的语音降噪方法
CN111986691B (zh) * 2020-09-04 2024-02-02 腾讯科技(深圳)有限公司 音频处理方法、装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002204175A (ja) * 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
JPH06348293A (ja) * 1993-06-10 1994-12-22 Hitachi Ltd 音声情報分析装置
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
US6044341A (en) * 1997-07-16 2000-03-28 Olympus Optical Co., Ltd. Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
JP3566197B2 (ja) 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
JP2002221988A (ja) * 2001-01-25 2002-08-09 Toshiba Corp 音声信号の雑音抑圧方法と装置及び音声認識装置
JP3574123B2 (ja) * 2001-03-28 2004-10-06 三菱電機株式会社 雑音抑圧装置
JP3457293B2 (ja) * 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
JP2003233186A (ja) 2002-02-08 2003-08-22 Fuji Photo Film Co Ltd ネガ型レジスト組成物
JP2005019555A (ja) 2003-06-24 2005-01-20 Sumitomo Electric Ind Ltd 化合物半導体集積装置
JP4162604B2 (ja) 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002204175A (ja) * 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101320963B1 (ko) 2009-03-31 2013-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
KR101390433B1 (ko) * 2009-03-31 2014-04-29 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
US8965758B2 (en) 2009-03-31 2015-02-24 Huawei Technologies Co., Ltd. Audio signal de-noising utilizing inter-frame correlation to restore missing spectral coefficients

Also Published As

Publication number Publication date
KR20060125572A (ko) 2006-12-06
EP1729286A2 (en) 2006-12-06
US8160873B2 (en) 2012-04-17
EP1729286B1 (en) 2020-11-18
JP2006337415A (ja) 2006-12-14
US20060271362A1 (en) 2006-11-30
EP1729286A3 (en) 2010-01-06
CN1892822A (zh) 2007-01-10
JP4670483B2 (ja) 2011-04-13
CN1892822B (zh) 2010-06-09

Similar Documents

Publication Publication Date Title
KR100843522B1 (ko) 노이즈 억제를 위한 방법 및 장치
JP4423300B2 (ja) 雑音抑圧装置
US8477963B2 (en) Method, apparatus, and computer program for suppressing noise
US7590528B2 (en) Method and apparatus for noise suppression
US8521530B1 (en) System and method for enhancing a monaural audio signal
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP4973873B2 (ja) 残響抑圧の方法、装置及び残響抑圧用プログラム
JP4836720B2 (ja) ノイズサプレス装置
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
WO2010046954A1 (ja) 雑音抑圧装置および音声復号化装置
EP2987314B1 (en) Echo suppression
JP2003140700A (ja) ノイズ除去方法及び装置
US20030065509A1 (en) Method for improving noise reduction in speech transmission in communication systems
JP2006113515A (ja) ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置
JP2003131689A (ja) ノイズ除去方法及び装置
JP5131149B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP6559576B2 (ja) 雑音抑圧装置、雑音抑圧方法及びプログラム
JP2001267973A (ja) 騒音抑制装置および騒音抑制方法
JP2018031819A (ja) 信号処理装置、信号処理方法、及び、信号処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130531

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140603

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150529

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160527

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180619

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190619

Year of fee payment: 12