KR20080042166A - 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램 - Google Patents
잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램 Download PDFInfo
- Publication number
- KR20080042166A KR20080042166A KR1020087008024A KR20087008024A KR20080042166A KR 20080042166 A KR20080042166 A KR 20080042166A KR 1020087008024 A KR1020087008024 A KR 1020087008024A KR 20087008024 A KR20087008024 A KR 20087008024A KR 20080042166 A KR20080042166 A KR 20080042166A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- frequency domain
- amplitude
- noise
- unit
- Prior art date
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004590 computer program Methods 0.000 title claims abstract description 5
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 description 80
- 238000004364 calculation method Methods 0.000 description 52
- 238000010586 diagram Methods 0.000 description 38
- 230000006870 function Effects 0.000 description 32
- 238000000926 separation method Methods 0.000 description 17
- 230000004044 response Effects 0.000 description 11
- 230000015556 catabolic process Effects 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 4
- 206010002953 Aphonia Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012892 rational function Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Telephone Function (AREA)
Abstract
적은 동작 양으로 낮은 범위 성분을 억압할 수 있고 고품질의 잡음 억압을 달성할 수 있는 잡음 억압 방법, 잡음 억압 장치 및 컴퓨터 프로그램이 제공된다. 입력 신호를 주파수 범위 신호로 변형하고 주파수 범위 신호의 진폭을 보정하여 진폭 보정된 신호를 결정하며, 진폭 보정된 신호를 이용하여 추정 잡음을 결정하며, 추정 잡음과 진폭 보정된 신호를 이용하여 억압 계수를 결정하며, 억압 계수로 진폭 보정된 신호를 가중함으로써 입력 신호 내의 원하는 신호에 중첩되어 있는 잡음을 억압한다.
주파수 영역 신호, 억압 계수, 오프셋, 진폭 보정부, 잡음 추정부
Description
기술 분야
본 발명은, 원하는 음성 신호에 중첩되어 있는 잡음을 억압하기 위한 잡음 억압 방법과 잡음 억압 장치, 및 잡음을 억압하는데 이용되는 컴퓨터 프로그램에 관한 것이다.
배경 기술
잡음 억압기 (잡음 억압 시스템) 는, 원하는 음성 신호에 중첩되어 있는 잡음을 억압하기 위한 시스템으로, 일반적으로, 주파수 영역으로 변환된 입력 신호를 이용하여 잡음 성분의 파워 스펙트럼을 추정하고, 이 추정된 파워 스펙트럼을 입력 신호로부터 감산함으로써 원하는 음성 신호에 혼재된 잡음을 억압하도록 동작한다. 잡음 억압기는 또한, 잡음 성분의 파워 스펙트럼을 연속적으로 추정함으로써 비정상 잡음을 억압하는데 적용될 수 있다. 잡음 억압기는, 예를 들어, 북미 휴대전화에 대한 표준으로서 채용되는 방식으로, 비특허 문헌 1 (기술적 요건 (TR 45), ENHANCED VARIABLE RATE CODEC, SPEECH SERVICE OPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS, TIA/EIA/IS-127-1 (1996년 9월)) 과 특허 문헌 1 (일본 공개특허공보 제2002-204175호) 에 기재되어 있다.
통상, 음파를 수집하는 마이크로폰의 출력 신호를 아날로그-디지털 (AD) 변 환함으로써 획득된 디지털 신호가 입력 신호로서 잡음 억압기에 공급 (deliver) 된다. 주로, 마이크로폰에서 음을 수집할 때와 그 음을 AD 변환할 때에 부가되는 저주파수 범위 성분을 억압하기 위해, 일반적으로, 고역 통과 필터가 AD 변환기와 잡음 억압기 사이에 배치된다. 이러한 구성의 예는, 예를 들어, 특허 문헌 2 (미국특허 제5,659,622호) 에 개시된다.
도 1 은, 특허 문헌 1 의 잡음 억압기에 특허 문헌 2 의 고역 통과 필터를 조합한 구조를 나타낸다.
입력 단자 (11) 에는, 열화 음성 신호 (원하는 음성 신호와 잡음이 혼재되어 있는 신호) 가 샘플 값 계열 (sample value series) 로서 공급된다. 열화 음성 신호 샘플은, 고역 통과 필터 (17) 에 공급되고, 저주파수 범위 성분을 억압시킨 후, 프레임 분할부 (1) 에 공급된다. 저주파수 범위 성분의 억압은, 입력된 열화 음성의 선형성을 유지하고 충분한 신호 처리 성능을 실현하기 위해 절대적으로 필요하다. 프레임 분할부 (1) 는, 열화 음성 신호 샘플을, 특정 수를 단위로 한 프레임들로 분할하고, 그 프레임들을 윈도우 처리부 (2) 에 전달한다. 윈도우 처리부 (2) 는, 프레임들로 분할된 열화 음성 신호 샘플에 윈도우 함수를 승산하고, 그 결과를 푸리에 변환부 (3) 에 전달한다.
푸리에 변환부 (3) 는, 윈도우 처리된 열화 음성 신호 샘플을 푸리에 변환하여 그 샘플을 복수의 주파수 성분들로 분할하고, 진폭 값을 다중화하여 복수의 주파수 성분들을 추정 잡음 계산부 (52), 잡음 억압 계수 생성부 (82), 및 다중 승산부 (16) 에 공급한다. 위상은, 역 푸리에 변환부 (9) 에 전달된다. 추정 잡음 계산부 (52) 는, 공급된 복수의 주파수 성분들 각각에 대해 잡음을 추정하고, 그 잡음을 잡음 억압 계수 생성부 (82) 에 전달한다. 잡음 추정 방식의 일 예로는, 과거의 신호 대 잡음비로 열화 음성을 가중하여 잡음 성분으로 하는 그런 방식이 있으며, 그의 상세는 특허 문헌 1 에 기재되어 있다.
잡음 억압 계수 생성부 (82) 는, 열화 음성에 추정 잡음을 승산함으로써, 잡음이 억압된 강화된 음성을 획득하기 위한 잡음 억압 계수를 복수의 주파수 성분들 각각에 대해 생성한다. 잡음 억압 계수 생성의 일 예로서, 강화된 음성의 평균 제곱 파워를 최소화하는 최소 평균 제곱 단시간 스펙트럼 진폭법이 널리 이용되고 있으며, 그의 상세는 특허 문헌 1 에 기재되어 있다.
각 주파수에 대해 생성된 잡음 억압 계수는 다중 승산부 (16) 에 공급된다. 다중 승산부 (16) 는, 각 주파수에 대해, 푸리에 변환부 (3) 로부터 공급되는 열화 음성에 잡음 억압 계수 생성부 (82) 로부터 공급되는 잡음 억압 계수를 승산하고, 그 적을 강화된 음성의 진폭으로서 역 푸리에 변환부 (9) 에 전달한다. 역 푸리에 변환부 (9) 는, 다중 승산부 (16) 로부터 공급되는 강화된 음성 진폭과 푸리에 변환부 (3) 로부터 공급되는 열화 음성의 위상을 조합함으로써 역 푸리에 변환을 수행하고, 그 역 푸리에 변환된 신호를 강화된 음성 신호 샘플로서 프레임 합성부 (10) 에 공급한다. 프레임 합성부 (10) 는, 인접 프레임의 강화된 음성 샘플을 이용함으로써 당해 프레임의 출력 음성 샘플을 합성하여, 그 합성된 샘플을 출력 단자 (12) 에 공급한다.
발명의 개시
고역 통과 필터 (17) 는, 직류 근방의 주파수 성분을 억압한다. 통상, 100Hz 내지 120Hz 이상인 주파수의 성분은 억압 없이 고역 통과 필터 (17) 를 통과한다. 고역 통과 필터 (17) 의 구성을 유한 임펄스 응답 (FIR) 형 또는 무한 임펄스 응답 (IIR) 형의 필터로서 할 수 있지만, 날카로운 통과 대역단 특성이 필요하기 때문에, 통상은 후자를 이용한다. IIR 형 필터는, 그의 전달 함수가 유리 함수로서 표현되고, 분모 계수의 감도가 극도로 높다는 것이 알려져 있다. 따라서, 고역 통과 필터 (17) 를 유한어 길이 계산에 의해 실현할 때에는, 충분한 정확도를 달성하기 위해 2 배 정밀도 계산 (double precision calculation) 을 빈번히 이용할 필요가 있어 계산량이 많아진다는 문제가 있다. 한편, 계산량을 줄이기 위해 고역 통과 필터 (17) 를 제거한다면, 입력 신호의 선형성을 유지하기가 어려워지고, 고품질의 잡음 억압을 달성하는 것이 불가능해진다.
본 발명의 목적은, 적은 계산량으로 저주파수 범위 성분을 억압할 수 있고, 고품질의 잡음 억압을 달성할 수 있는 잡음 억압 방법 및 잡음 억압 장치를 제공하는 것이다.
본 발명에 따른 잡음 억압 방법은, 입력 신호를 주파수 영역 신호로 변환하고, 주파수 영역 신호의 진폭을 보정하여 진폭 보정된 신호를 획득하고, 진폭 보정된 신호를 이용하여 추정 잡음을 획득하고, 추정 잡음과 진폭 보정된 신호를 이용하여 억압 계수를 결정하며, 억압 계수로 진폭 보정된 신호를 가중한다.
한편, 본 발명에 따른 잡음 억압 장치에는, 입력 신호를 주파수 영역 신호로 변환하는 변환기, 그 주파수 영역 신호의 진폭을 보정하여 진폭 보정된 신호를 획 득하는 진폭 보정부, 진폭 보정된 신호를 이용하여 추정 잡음을 획득하는 잡음 추정부, 추정 잡음과 진폭 보정된 신호를 이용하여 억압 계수를 결정하는 억압 계수 생성부, 및 억압 계수로 진폭 보정된 신호를 가중하는 승산부가 구비된다.
본 발명에 따라 잡음을 억압하도록 신호를 처리하는 컴퓨터 프로그램은, 입력 신호를 주파수 영역 신호로 변환하는 처리, 주파수 영역 신호의 진폭을 보정하여 진폭 보정된 신호를 획득하는 처리, 진폭 보정된 신호를 이용하여 추정 잡음을 획득하는 처리, 추정 잡음과 진폭 보정된 신호를 이용하여 억압 계수를 결정하는 처리, 및 억압 계수로 진폭 보정된 신호를 가중하는 처리를 포함한다.
특히, 본 발명에 따른 잡음 억압의 방법 및 장치는, 푸리에 변환된 신호의 저주파수 범위 성분을 억압하는 것을 특징으로 한다. 더 상세하게는, 잡음 억압 장치는, 푸리에 변환된 출력의 진폭의 저주파수 범위 성분을 억압하는 진폭 보정부, 및 푸리에 변환된 출력의 위상을 보정하기 위해 저주파수 범위 성분의 진폭 변형에 대응한 위상을 보정하는 위상 보정부를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 주파수 영역으로 변환된 신호의 진폭에 상수를 승산하고, 위상에 상수를 가산하므로, 이 방법과 장치를 단일 정확도 계산으로 실현할 수 있고 적은 양의 계산으로 고품질 잡음 억압을 달성할 수 있다.
도면의 간단한 설명
도 1 은, 종래의 잡음 억압 장치의 구성 예를 나타낸 블록도이다.
도 2 는, 본 발명의 제 1 예시적인 실시형태를 나타낸 블록도이다.
도 3 은, 본 발명의 제 1 예시적인 실시형태에 포함되는 진폭 보정부의 구성 을 나타낸 블록도이다.
도 4 는, 도 3 에 포함되는 음성 존재 확률 계산부의 구성을 나타낸 블록도이다.
도 5 는, 본 발명의 제 2 예시적인 실시형태를 나타낸 블록도이다.
도 6 은, 본 발명의 제 3 예시적인 실시형태를 나타낸 블록도이다.
도 7 은, 본 발명의 제 3 예시적인 실시형태에 포함되는 다중 승산부의 구성을 나타낸 블록도이다.
도 8 은, 본 발명의 제 3 예시적인 실시형태에 포함되는 가중된 열화 음성 계산부의 구성을 나타낸 블록도이다.
도 9 는, 도 8 에 포함되는 주파수 영역 SNR 계산부의 구성을 나타낸 블록도이다.
도 10 은, 도 8 에 포함되는 다중 비선형 처리부의 구성을 나타낸 블록도이다.
도 11 은, 비선형 처리부의 비선형 함수의 일 예를 나타낸 블록도이다.
도 12 는, 본 발명의 제 3 예시적인 실시형태에 포함되는 추정 잡음 계산부의 구성을 나타낸 블록도이다.
도 13 은, 도 12 에 포함되는 주파수 영역 추정 잡음 계산부의 구성을 나타낸 블록도이다.
도 14 는, 도 13 에 포함되는 업데이트 판정부의 구성을 나타낸 블록도이다.
도 15 는, 본 발명의 제 3 예시적인 실시형태에 포함되는 추정 선천적 SNR 계산부의 구성을 나타낸 블록도이다.
도 16 은, 도 15 에 포함되는 다중 값 범위 한정처리부의 구성을 나타낸 블록도이다.
도 17 은, 도 15 에 포함되는 다중 가중된 가산부의 구성을 나타낸 블록도이다.
도 18 은, 도 17 에 포함되는 가중된 가산부의 구성을 나타낸 블록도이다.
도 19 는, 본 발명의 제 3 예시적인 실시형태에 포함되는 잡음 억압 계수 생성부의 구성을 나타낸 블록도이다.
도 20 은, 본 발명의 제 3 예시적인 실시형태에 포함되는 억압 계수 보정부의 구성을 나타낸 블록도이다.
도 21 은, 도 20 에 포함되는 주파수 영역 억압 계수 보정부의 구성을 나타낸 블록도이다.
부호의 설명
1 : 프레임 분할부 2, 20 : 윈도우 처리부
3 : 푸리에 변환부 4, 5049 : 카운터
5, 52 : 추정 잡음 계산부 6, 1402 : 주파수 영역 SNR 계산부
7 : 추정 선천적 SNR 계산부 8, 82 : 잡음 억압 계수 생성부
9 : 역 푸리에 변환부 10 : 프레임 합성부
11 : 입력 단자 12 : 출력 단자
13, 16, 704, 705, 1404 : 다중 승산부
14 : 가중된 열화 음성 계산부
15 : 억압 계수 보정부 17 : 고역 통과 필터
18 : 진폭 보정부 19 : 위상 보정부
21 : 음성 부재 확률 메모리 22 : 오프셋 제거부
501, 502, 1302, 1303, 1422, 1423, 1495, 1502, 1503, 1801, 1901, 7013, 7072, 7074 : 분리부
503, 1304, 1424, 1475, 1504, 1803, 1903, 7014, 7075 : 다중화부
5040 내지 504K-1 : 주파수 영역 추정 잡음 계산부
520 : 업데이트 판정부 701 : 다중 값 범위 한정처리부
702 : 후천적 SNR 메모리 703 : 억압 계수 메모리
706 : 가중치 메모리 707 : 다중 가중된 가산부
708, 5046, 7092, 7094 : 가산부
811 : MMSE STSA 이득 함수 값 계산부
812 : 일반화 우도비 계산부 814 : 억압 계수 계산부
921 : 순시 추정 SNR
9210 내지 921K-1 : 주파수 영역 순시 추정 SNR
922 : 과거의 추정 SNR
9220 내지 922K-1 : 과거의 주파수 영역 추정 SNR
923 : 가중치 924 : 추정 선천적 SNR
9240 내지 924K-1 : 주파수 영역 추정 선천적 SNR
13010 내지 1301K-1, 1597, 7091, 7093 : 승산부
1401, 5042 : 추정 잡음 메모리 1405 : 다중 비선형 처리부
14210 내지 1421K-1, 5048 : 제산부 14850 내지 1485K-1 : 비선형 처리부
15010 내지 1501K-1 : 주파수 영역 억압 계수 보정부
1591, 70120 내지 7012K-1 : 최대 값 선택부
1592 : 억압 계수 하한값 메모리 1593, 5204, 5206 : 임계값 메모리
1594, 5203, 5205 : 비교부 1595, 5044 : 스위치
1596 : 보정 값 메모리 18020 내지 1802K-1 : 가중 처리부
19020 내지 1902K-1 : 위상 회전부 5041 : 레지스터 길이 메모리
5045 : 시프트 레지스터 5047 : 최소 값 선택부
5201 : 논리 OR 계산부 5207 : 임계값 계산부
7011 : 상수 메모리 70710 내지 7071K-1 : 가중된 가산부
7095 : 상수 승산부
발명을 실시하기
위한 최선의 형태
도 2 는, 본 발명의 제 1 예시적인 실시형태를 나타낸 블록도이다. 도 2 의 구성과, 종례 예인 도 1 의 구성은, 고역 통과 필터 (17), 진폭 보정부 (18), 위상 보정부 (19), 및 윈도우 처리부 (20) 를 제외하고는 서로 동일하다. 이런 차이점을 중심으로, 상세한 동작을 이하 설명할 것이다.
도 2 에는, 도 1 의 고역 통과 필터 (17) 가 삭제된 대신에, 진폭 보정부 (18), 위상 보정부 (19), 및 윈도우 처리부 (20) 가 제공된다. 진폭 보정부 (18) 와 위상 보정부 (19) 는, 고역 통과 필터의 주파수 응답을, 주파수 영역으로 변환된 신호에 적용하기 위해 제공된다. 고역 통과 필터 (17) 의 전달 함수에 를 적용함으로써 획득되는 f 의 함수의 절대값 (진폭 주파수 응답) 은, 진폭 보정부 (18) 에서 입력 신호로 적용되고, 위상 (위상 주파수 응답) 은, 위상 보정부 (19) 에서 입력 신호로 적용된다.
이런 동작으로, 고역 통과 필터 (17) 를 입력 신호에 적용한 경우와 동일한 효과를 획득할 수 있다. 즉, 고역 통과 필터 (17) 의 전달 함수를 시간 영역에서 입력 신호와 컨볼루션 (convolving) 하는 대신에, 푸리에 변환부 (3) 에서 주파수 영역 신호로 변환시킨 후, 그 함수에 주파수 응답을 승산한다.
진폭 보정부 (18) 의 출력은, 추정 잡음 계산부 (52), 잡음 억압 계수 생성부 (82), 및 다중 승산부 (16) 에 공급된다. 위상 보정부 (19) 의 출력은, 역 푸리에 변환부 (9) 에 전달된다.
이하의 동작은, 도 1 을 이용하여 설명한 동작과 동일하다. 특허 문헌 3 (일본 공개특허공보 제2003-131689호) 에 개시되어 있는 것처럼, 윈도우 처리부 (20) 는, 프레임 경계에서의 단속음 (intermittent sound) 을 억압하기 위해 제공된다.
도 3 은, 진폭 보정부 (18) 의 구성 예를 나타낸다. 푸리에 변환부 (3) 로부터 공급되는 다중화 열화 음성 진폭 스펙트럼은 분리부 (1801) 에 전달된다. 분리부 (1801) 는, 다중화 열화 음성 진폭 스펙트럼을 각 주파수 성분으로 분해하여, 주파수 성분을 가중 처리부 (18020 내지 1802K-1) 에 전달한다. 가중 처리부 (18020 내지 1802K-1) 는, 각 주파수 성분으로 분해된 열화 음성 진폭 스펙트럼 각각을 대응하는 진폭 주파수 응답으로 가중하고, 그 스펙트럼을 다중화부 (1803) 에 전달한다. 다중화부 (1803) 는, 가중 처리부 (18020 내지 1802K-1) 로부터 전달되는 신호들을 다중화하여, 다중화된 신호를 보정된 열화 음성 진폭 스펙트럼으로서 출력한다.
도 4 는, 위상 보정부 (19) 의 구성 예를 나타낸다. 푸리에 변환부 (3) 로부터 공급되는 다중화 열화 음성 위상 스펙트럼은 분리부 (1901) 에 전달된다. 분리부 (1901) 는, 다중화 열화 음성 위상 스펙트럼을 각 주파수 성분으로 분해하여 각 주파수 성분을 위상 회전부 (19020 내지 1902K-1) 에 전달한다. 위상 회전부 (19020 내지 1902K-1) 각각은, 각 주파수 성분으로 분해된 열화 음성 위상 스펙트럼을 대응하는 위상 주파수 응답에 따라 회전시켜, 그 스펙트럼을 다중화부 (1903) 에 전달한다. 다중화부 (1903) 는, 위상 회전부 (19020 내지 1902K-1) 로부터 전달되는 신호들을 다중화하여, 다중화된 신호를 보정된 열화 음성 위상 스펙트럼으로서 출력한다. 위상 보정부 (19) 의 존재는, 진폭 보정부 (18) 의 존재만큼 중요하지 않고, 이를 생략할 수 있다. 이것은, 위상 보정부 (19) 의 존재 가 출력 신호의 위상에만 영향을 주고, 또한 위상 정보는 음성 내용을 이해하는데 있어서, 진폭 정보보다 훨씬 중요성이 낮다는 것이 알려져 있기 때문이다.
도 5 는, 본 발명의 제 2 예시적인 실시형태를 나타낸 블록도이다. 도 5 의 구성과, 제 1 예시적인 실시형태인 도 2 의 구성과의 사이의 차이는, 오프셋 제거부 (22) 이다. 오프셋 제거부 (22) 는, 윈도우 처리된 열화 음성의 오프셋을 제거하여 음성을 출력한다. 오프셋 제거의 가장 간단한 방식은, 각 프레임에 대한 열화 음성의 평균 값을 획득하여 그 평균 값을 오프셋으로 하고, 이 오프셋을 당해 프레임 내의 모든 샘플들로부터 감산하는 것이다. 다른 방법으로, 각 프레임의 평균 값을 복수의 프레임에 대해 평균화하고, 획득된 평균 값을 오프셋으로서, 샘플들로부터 감산할 수도 있다. 오프셋을 제거함으로써, 푸리에 변환부 (3) 에서 변환 정확도를 증가시킬 수 있고, 출력될 강화된 음성의 음질을 향상시킬 수 있다.
도 6 은, 본 발명의 제 3 예시적인 실시형태를 나타낸 블록도이다. 입력 단자 (11) 에는, 열화 음성 신호 (원하는 음성 신호와 잡음이 혼재되어 있는 신호) 가 샘플 값 계열로서 공급된다. 열화 음성 신호 샘플은, 프레임 분할부 (1) 에 공급되어 각 K/2 샘플들에 대한 프레임들로 분할된다. 여기서, K 는 홀수인 것으로 가정된다. 프레임들로 분할된 열화 음성 신호 샘플은, 윈도우 처리부 (2) 에 공급되고, 윈도우 함수 w(t) 와 승산된다. n 번째 프레임의 입력 신호 yn(t) (t = 0, 1, ..., K/2-1) 를 윈도우 처리함으로써 획득된 신호 는,
로서 표현된다. 또한, 2 개의 연속적인 프레임들의 일부를 중첩하여 윈도우 처리하는 동작이 또한 널리 실행된다. 중첩 길이가 프레임 길이의 50% 인 것으로 가정된다면, t = 0, 1,..., K/2-1 에 대해,
로부터 획득된 (t = 0, 1, ..., K-1) 가 윈도우 처리부 (2) 의 출력이 된다. 실수 신호에 대해서는, 좌우 대칭 (bilaterally symmetric) 윈도우 함수 가 이용된다. 윈도우 함수는, 억압 계수를 "1" 로 설정할 때의 계산 오차를 제외하고는 입력 신호와 출력 신호가 서로 일치하도록 설계된다. 이것은, w(t) + w(t+K/2) = 1 을 의미한다.
이후, 2 개의 연속적인 프레임의 50% 를 중첩하여 윈도우 처리하는 경우를 일 예로서 계속 설명할 것이다. 예를 들어, w(t) 로서는,
에 의해 나타내지는 해닝 윈도우 (Hanning window) 가 이용될 수 있다. 이 식 이외에, 해밍 윈도우 (Hamming window), 카이저 윈도우 (Kayser window), 및 블랙맨 윈도우 (Blackman window) 와 같은 다양한 윈도우 함수가 알려져 있다. 윈도우 처리된 출력 는 오프셋 제거부 (22) 에 공급되고, 오프셋이 제거된다. 오프셋을 제거하는 상세는, 도 5 를 이용하여 설명한 것과 동일하다.
오프셋이 제거된 신호는 푸리에 변환부 (3) 에 공급되고, 열화 음성 스펙트럼 Yn(k) 으로 변환된다. 열화 음성 스펙트럼 Yn(k) 은, 위상과 진폭으로 분리되고, 열화 음성 위상 스펙트럼 arg Yn(k) 는, 위상 보정부 (19) 를 통해 역 푸리에 변환부 (9) 에 공급되고, 열화 음성 진폭 스펙트럼 는, 진폭 보정부 (18) 를 통해 다중 승산부 (13) 와 다중 승산부 (16) 에 공급된다. 위상 보정부 (19) 와 진폭 보정부 (18) 의 동작은, 도 2 를 이용하여 설명한 것과 동일하다.
다중 승산부 (13) 는, 진폭이 보정된 열화 음성 진폭 스펙트럼을 이용함으로써 열화 음성 파워 스펙트럼을 계산하여, 그 스펙트럼을 추정 잡음 계산부 (5), 주파수 영역 SNR (신호-대-잡음비) 계산부 (6), 및 가중된 열화 음성 계산부 (14) 에 전달한다. 가중된 열화 음성 계산부 (14) 는, 다중 승산부 (13) 로부터 공급되는 열화 음성 파워 스펙트럼을 이용함으로써 가중된 열화 음성 파워 스펙트럼을 계산하여 그 스펙트럼을 추정 잡음 계산부 (5) 에 전달한다.
추정 잡음 계산부 (5) 는, 열화 음성 파워 스펙트럼, 가중된 열화 음성 파워 스펙트럼, 및 카운터 (4) 로부터 공급되는 카운트 값을 이용하여 잡음의 파워 스펙 트럼을 추정하고, 그 파워 스펙트럼을 추정 잡음 파워 스펙트럼으로서 주파수 영역 SNR 계산부 (6) 에 전달한다. 주파수 영역 SNR 계산부 (6) 는, 입력된 열화 음성 파워 스펙트럼과 입력된 추정 잡음 파워 스펙트럼을 이용하여 각 주파수에 대해 SNR 을 계산하고, 그 SNR 을 후천적 SNR 로서 추정 선천적 SNR 계산부 (7) 와 잡음 억압 계수 생성부 (8) 에 공급한다.
추정 선천적 SNR 계산부 (7) 는, 입력된 후천적 SNR, 및 억압 계수 보정부 (15) 로부터 공급되는 보정 억압 계수를 이용함으로써 선천적 SNR 을 추정하고, 그 선천적 SNR 을 추정 선천적 SNR 로서 잡음 억압 계수 생성부 (8) 에 전달한다. 잡음 억압 계수 생성부 (8) 는, 입력으로서 공급되는 후천적 SNR 과 추정 선천적 SNR 을 이용하고, 음성 부재 확률 메모리 (21) 로부터 공급되는 음성 부재 확률을 이용함으로써 잡음 억압 계수를 생성하고, 그 잡음 억압 계수를 억압 계수로서 억압 계수 보정부 (15) 에 전달한다. 억압 계수 보정부 (15) 는, 입력된 추정 선천적 SNR 과 억압 계수를 이용함으로써 억압 계수를 보정하고, 보정된 억압 계수를 보정된 억압 계수 로서 다중 승산부 (16) 에 공급한다. 다중 승산부 (16) 는, 진폭 보정부 (18) 를 통해 푸리에 변환부 (3) 로부터 공급되는 보정된 열화 음성 진폭 스펙트럼을 억압 계수 보정부 (15) 로부터 공급되는 보정된 억압 계수 로 가중함으로써 강화된 음성 진폭 스펙트럼 을 획득하고, 강화된 음성 진폭 스펙트럼을 역 푸리에 변환부 (9) 에 전달한다.
로서 표현된다. 여기서, Hn(k) 는 진폭 보정부 (18) 에서의 보정 이득이고, 도 1 의 고역 통과 필터의 진폭 주파수 응답으로서 획득된다.
역 푸리에 변환부 (9) 는, 다중 승산부 (16) 로부터 공급되는 강화된 음성 진폭 스펙트럼 에 위상 보정부 (19) 를 통해 푸리에 변환부 (3) 로부터 공급되는 보정된 열화 음성 위상 스펙트럼 (arg Yn(k) + arg Hn(k)) 를 승산함으로써 강화된 음성 를 획득한다. 즉,
가 실행된다. 여기서, arg Hn(k) 는 위상 보정부 (19) 에서의 보정된 위상이고, 도 1 의 고역 통과 필터의 위상 주파수 응답으로서 획득된다.
역 푸리에 변환부 (9) 는, 획득된 강화된 음성 를 역 푸리에 변환하고, 강화된 음성 를, 프레임이 K 개의 샘플로 구성된 시간 영역 샘플 계 열 (t = 0, 1, ...K-1) 로서 윈도우 처리부 (20) 에 공급한다. 윈도우 처리부 (20) 는, 역 푸리에 변환부 (9) 로부터 공급되는 시간 영역 샘플 계열 에 윈도우 함수 w(t) 를 승산한다. 신호 는,
으로서 표현되고, 신호 는 n 번째 프레임의 입력 신호 xn(t) (t = 0, 1, ..., K/2-1) 를 w(t) 로 윈도우 처리함으로써 획득된다. 또한, 2 개의 연속적인 프레임들의 일부를 중첩하여 윈도우 처리하는 그런 동작이 또한 널리 실행된다. 중첩된 길이가 프레임 길이의 50% 라고 가정된다면, t = 0, 1, ..., K/2-1 에 대해,
도 7 은, 도 6 에 나타낸 다중 승산부 (13) 의 구성을 나타낸 블록도이다. 다중 승산부 (13) 는, 승산부 (13010 내지 1301K-1), 분리부 (1302 및 1303), 및 다중화부 (1304) 를 포함한다. 다중화된 것으로서 도 6 의 진폭 보정부 (18) 로부터 공급되는, 보정된 열화 음성 진폭 스펙트럼은, 분리부 (1302 및 1303) 에서 각 주파수를 K 개의 샘플들로 분리되고, 승산부 (13010 내지 1301K-1) 에 각각 공급된다. 승산부 (13010 내지 1301K-1) 는, 입력된 신호들을 각각 제곱하여, 제곱된 신호들을 다중화부 (1304) 에 각각 전달한다. 다중화부 (1304) 는, 입력된 신호들을 다중화하여 다중화된 신호를 열화 음성 파워 스펙트럼으로서 출력한다.
도 8 은, 가중된 열화 음성 계산부 (14) 의 구성을 나타낸 블록도이다. 가중된 열화 음성 계산부 (14) 는, 추정 잡음 메모리 (1401), 주파수 영역 SNR 계산부 (1402), 다중 비선형 처리부 (1405), 및 다중 승산부 (1404) 를 포함한다. 추정 잡음 메모리 (1401) 는, 도 6 의 추정 잡음 계산부 (5) 로부터 공급되는 추정 잡음 파워 스펙트럼을 기억하고, 이전의 프레임에서의 추정 잡음 파워 스펙트럼 을 주파수 영역 SNR 계산부 (1402) 로 출력한다.
주파수 영역 SNR 계산부 (1402) 는, 추정 잡음 메모리 (1401) 로부터 공급되는 추정 잡음 파워 스펙트럼과, 도 6 의 다중 승산부 (13) 로부터 공급되는 열화 음성 파워 스펙트럼을 이용함으로써 각 주파수에 대해 SNR 을 획득하고, 그 SNR 을 다중 비선형 처리부 (1405) 로 출력한다. 다중 비선형 처리부 (1405) 는, 주파수 영역 SNR 계산부 (1402) 로부터 공급되는 SNR 을 이용함으로써 가중 계수 벡터를 계산하고, 그 가중 계수 벡터를 다중 승산부 (1404) 로 출력한다.
다중 승산부 (1404) 는, 도 6 의 다중 승산부 (13) 로부터 공급되는 열화 음성 파워 스펙트럼과, 다중 비선형 처리부 (1405) 로부터 공급되는 가중 계수 벡터의 적을 각 주파수에 대해 계산하고, 그 가중된 열화 음성 파워 스펙트럼을 도 6 의 추정 잡음 계산부 (5) 로 출력한다. 다중 승산부 (1404) 의 구성은, 도 7 을 이용하여 설명한 다중 승산부 (13) 의 구성과 동일하므로, 그의 상세한 설명은 생략될 것이다.
도 9 는, 도 8 에 포함된 주파수 영역 SNR 계산부 (1402) 의 구성을 나타낸 블록도이다. 주파수 영역 SNR 계산부 (1402) 는, 제산부 (14210 내지 1421K-1), 분리부 (1422 및 1423), 및 다중화부 (1424) 를 포함한다. 도 6 의 다중 승산부 (13) 로부터 공급되는 열화 음성 파워 스펙트럼은 분리부 (1422) 에 전달된다. 도 8 의 추정 잡음 메모리 (1401) 로부터 공급되는 추정 잡음 파워 스펙트럼은 분리부 (1423) 에 전달된다. 열화 음성 파워 스펙트럼과 추정 잡음 파워 스펙 트럼은, 분리부 (1422 및 1423) 에서, 주파수 성분에 대응하는 K 개의 샘플들로 각각 분리되고, 제산부 (14210 내지 1421K-1) 에 각각 공급된다.
제산부 (14210 내지 1421K-1) 에서는,
에 따라, 공급된 열화 음성 파워 스펙트럼을 추정 잡음 파워 스펙트럼으로 제산함으로써 주파수 영역 SNR 를 획득하고, 다중화부 (1424) 에 전달한다. 여기서, λn-1(k) 는, 이전의 프레임에서의 추정 잡음 파워 스펙트럼이다. 다중화부 (1424) 는, 전달된 K 개의 주파수 영역 SNR 을 다중화하고, 다중화된 SNR 을 도 8 의 다중 비선형 처리부 (1405) 에 전달한다.
다음으로, 도 10 을 참조하여, 도 8 의 다중 비선형 처리부 (1405) 의 구성 및 동작을 상세히 설명할 것이다. 도 10 은, 가중된 열화 음성 계산부 (14) 에 포함된 다중 비선형 처리부 (1405) 의 구성을 나타낸 블록도이다. 다중 비선형 처리부 (1405) 는, 분리부 (1495), 비선형 처리부 (14850 내지 1485K-1), 및 다중화부 (1475) 를 포함한다. 분리부 (1495) 는, 도 8 의 주파수 영역 SNR 계산부 (1402) 로부터 공급되는 SNR 을 주파수 영역 SNR 로 분리하고, 분리된 SNR 을 비선형 처리부 (14850 내지 1485K-1) 로 출력한다. 비선형 처리부 (14850 내지 1485K- 1) 는, 각각 입력 값에 따라 실수 값을 출력하는 비선형 함수를 포함한다.
도 11 은, 비선형 함수의 일 예를 나타낸다. f1 이 입력 값이라면, 도 11 에 나타낸 비선형 함수의 출력 값 f2 는,
에 의해 획득된다. 여기서, a 와 b 는 임의의 실수이다.
도 10 으로 복귀하면, 비선형 처리부 (14850 내지 1485K-1) 는, 분리부 (1495) 로부터 공급되는 주파수 영역 SNR 을 비선형 함수에 의해 처리하여 가중 계수를 획득하고, 그 가중 계수를 다중화부 (1475) 로 출력한다. 즉, 비선형 처리부 (14850 내지 1485K-1) 는, SNR 에 따라 "1" 내지 "0" 의 가중 계수를 출력한다. SNR 이 작을 때는 "1" 이 출력되고, SNR 이 클 때는 "0" 이 출력된다. 다중화부 (1475) 는, 비선형 처리부 (14850 내지 1485K-1) 로부터 출력된 가중 계수를 다중화하여, 다중화된 가중 계수를 가중 계수 벡터로서 다중 승산부 (1404) 로 출력한다.
도 8 의 다중 승산부 (1404) 에서의 열화 음성 파워 스펙트럼과 승산되는 가중 계수는, SNR 에 대응하는 값이고, SNR 이 클 때, 즉, 열화 음성에 포함된 음성 성분이 클 때, 가중 계수의 값이 작아진다. 열화 음성 파워 스펙트럼이 일반적 으로 추정 잡음을 업데이트하기 위해 이용되지만, SNR 에 따라, 추정 잡음을 업데이트하기 위해 이용된 열화 음성 파워 스펙트럼을 가중시킴으로써, 열화 음성 파워 스펙트럼에 포함된 음성 성분의 영향을 작아지게 할 수 있고, 보다 정확도가 높은 잡음 추정을 실행할 수 있다. 동시에, 가중 계수를 계산하는데 비선형 함수를 이용하는 일 예를 나타내고 있지만, 비선형 함수 이외에도 선형 함수 및 고차 다항식과 같은 다른 식으로 표현되는 SNR 의 함수를 이용하는 것 또한 가능하다.
도 12 는, 도 6 에 나타낸 추정 잡음 계산부 (5) 의 구성을 나타낸 블록도이다. 추정 잡음 계산부 (5) 는, 분리부 (501 및 502), 다중화부 (503), 및 주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 를 포함한다.
도 12 에 있어서, 분리부 (501) 는, 도 6 의 가중된 열화 음성 계산부 (14) 로부터 공급되는 가중된 열화 음성 파워 스펙트럼을 각 주파수의 가중된 열화 음성 파워 스펙트럼들로 분리하고, 그 스펙트럼들을 주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 에 각각 공급한다. 분리부 (502) 는, 도 6 의 다중 승산부 (13) 로부터 공급되는 열화 음성 파워 스펙트럼을 각 주파수의 열화 음성 파워 스펙트럼들로 분리하고, 그 스펙트럼들을 주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 로 각각 출력한다.
주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 는, 분리부 (501) 로부터 공급되는 주파수 영역 가중된 열화 음성 파워 스펙트럼들, 분리부 (502) 로부터 공 급되는 주파수 영역 열화 음성 파워 스펙트럼들, 및 도 6 의 카운터 (4) 로부터 공급되는 카운트 값으로부터, 주파수 영역 추정 잡음 파워 스펙트럼들을 계산하고, 이런 파워 스펙트럼들을 다중화부 (503) 로 출력한다. 다중화부 (503) 는, 주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 로부터 공급되는 주파수 영역 추정 잡음 파워 스펙트럼들을 다중화하고, 그 추정 잡음 파워 스펙트럼을 도 6 의 주파수 영역 SNR 계산부 (6) 와 가중된 열화 음성 계산부 (14) 로 출력한다. 주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 의 구성 및 동작은 도 13 을 참조로 상세히 설명될 것이다.
도 13 은, 도 12 에 나타낸 주파수 영역 추정 잡음 계산부 (5040 내지 504K-1) 의 구성을 나타낸 블록도이다. 주파수 영역 추정 잡음 계산부 (504) 는, 업데이트 판정부 (520), 레지스터 길이 메모리 (5041), 추정 잡음 메모리 (5042), 스위치 (5044), 시프트 레지스터 (5045), 가산부 (5046), 최소 값 선택부 (5047), 제산부 (5048), 및 카운터 (5049) 를 포함한다.
주파수 영역 가중된 열화 음성 파워 스펙트럼은, 도 12 의 분리부 (501) 로부터 스위치 (5044) 로 공급된다. 스위치 (5044) 가 회로를 닫을 (close) 때, 주파수 영역 가중된 열화 음성 파워 스펙트럼은 시프트 레지스터 (5045) 에 전달된다. 시프트 레지스터 (5045) 는, 업데이트 판정부 (520) 로부터 공급되는 제어 신호에 응답하여 내부 레지스터의 기억 값을 인접 레지스터로 시프트한다. 레지스터 길이는, 후에 설명될 레지스터 길이 메모리 (5041) 에 기억된 값과 동일하 다. 시프트 레지스터 (5045) 의 모든 레지스터 출력은 가산부 (5046) 에 공급된다. 가산부 (5046) 는, 모든 공급된 레지스터 출력을 가산하여 가산 결과를 제산부 (5048) 에 전달한다.
한편, 업데이트 판정부 (520) 에는, 카운트 값, 주파수 영역 열화 음성 파워 스펙트럼, 및 주파수 영역 추정 잡음 파워 스펙트럼이 공급된다. 업데이트 판정부 (520) 는, 카운트 값이 미리 결정된 값에 도달할 때까지 항상 "1" 을 출력하고, 입력된 열화 음성 신호가, 카운트 값이 미리 결정된 값에 도달한 후의 잡음인 것으로 판정되는 경우에 "1" 을 출력하며, 다른 경우에는 "0" 을 출력한다. 업데이트 판정부 (520) 의 출력은 카운터 (5049), 스위치 (5044), 및 시프트 레지스터 (5045) 에 전달된다.
스위치 (5044) 는, 업데이트 판정부 (520) 로부터 공급되는 신호가 "1" 일 때 회로를 닫고, 그 신호가 "0" 일 때 회로를 연다 (open). 카운터 (5049) 는, 업데이트 판정부 (520) 로부터 공급되는 신호가 "1" 일 때 카운트 값을 증가시키고, 그 신호가 "0" 일 때는 카운트 값을 변경시키지 않는다. 시프트 레지스터 (5045) 는, 업데이트 판정부 (520) 로부터 공급되는 신호가 "1" 일 때 스위치 (5044) 로부터 공급되는 신호 샘플들 중 일 샘플을 입력하고, 동시에, 내부 레지스터의 기억 값을 인접 레지스터로 시프트한다. 최소 값 선택부 (5047) 에는, 카운터 (5049) 의 출력과 레지스터 길이 메모리 (5041) 의 출력이 공급된다.
최소 값 선택부 (5047) 는, 공급된 카운트 값 또는 레지스터 길이 중 더 작은 값을 선택하고, 선택된 값을 제산부 (5048) 에 전달한다. 제산부 (5048) 는, 가산부 (5046) 로부터 공급되는 주파수 영역 열화 음성 파워 스펙트럼들의 가산 값을 카운트 값 또는 레지스터 길이 중 더 작은 값으로 제산하고, 그 몫을 주파수 영역 추정 잡음 파워 스펙트럼 λn(k) 로서 출력한다. Bn(k) (n = 0, 1, ..., N-1) 이 시프트 레지스터 (5045) 에 저장된 열화 음성 파워 스펙트럼들의 샘플 값이라면, λn(k) 는,
에 의해 획득된다.
상기 식에서, N 은, 카운트 값 또는 레지스터 길이 중 더 작은 값이다. 카운트 값은 "0" 에서 시작하여 단조롭게 증가하기 때문에, 처음에는 카운트 값을 이용하여 제산 연산이 실행되고, 나중에는 레지스터 길이를 이용하여 실행된다. 레지스터 길이에 의한 제산을 위해 시프트 레지스터에 저장된 값들의 평균 값을 획득할 필요가 있다. 먼저, 시프트 레지스터 (5045) 에는 많은 값들이 충분히 기억되지 않기 때문에, 값들이 실제로 기억된 레지스터들의 수를 이용하여 제산 연산이 실행된다. 값들이 실제로 기억된 레지스터의 수는, 카운트 값이 레지스터 길이보다 작을 때는 카운트 값과 동일하고, 카운트 값이 레지스터 길이보다 길어질 때는 레지스터 길이와 동일해진다.
도 14 는, 도 13 에 나타낸 업데이트 판정부 (520) 의 구성을 나타낸 블록도 이다. 업데이트 판정부 (520) 는, 논리 OR 계산부 (5201), 비교부 (5203 및 5205), 임계값 메모리 (5204 및 5206), 및 임계값 계산부 (5207) 를 포함한다.
도 6 의 카운터 (4) 로부터 공급되는 카운트 값은 비교부 (5203) 에 전달된다. 임계값 메모리 (5204) 의 출력인 임계값 또한 비교부 (5203) 에 전달된다. 비교부 (5203) 는, 공급된 카운트 값을 임계값과 비교하고, 카운트 값이 임계값보다 작을 때 논리 OR 계산부 (5201) 에 "1" 을 전달하고, 카운트 값이 임계값보다 클 때 논리 OR 계산부 (5201) 에 "0" 을 전달한다. 한편, 임계값 계산부 (5207) 는, 도 13 의 추정 잡음 메모리 (5042) 로부터 공급되는 주파수 영역 추정 잡음 파워 스펙트럼에 따라 값을 계산하고, 그 값을 임계값으로서 임계값 메모리 (5206) 로 출력한다. 임계값 계산을 위한 가장 간단한 방식은, 주파수 영역 추정 잡음 파워 스펙트럼에 상수를 승산하는 것이다. 다른 방식으로는, 고차 다항식 및 비선형 함수를 이용하여 임계값을 계산할 수도 있다.
임계값 메모리 (5206) 는, 임계값 계산부 (5207) 로부터 출력된 임계값을 기억하고, 일 프레임 전에 기억된 임계값을 비교부 (5205) 로 출력한다. 비교부 (5205) 는, 임계값 메모리 (5206) 로부터 공급되는 임계값을 도 12 의 분리부 (502) 로부터 공급되는 주파수 영역 열화 음성 파워 스펙트럼과 비교하고, 주파수 영역 열화 음성 파워 스펙트럼이 임계값보다 작을 때 논리 OR 계산부 (5201) 에 "1" 을 출력하고, 주파수 영역 열화 음성 파워 스펙트럼이 임계값보다 클 때 논리 OR 계산부 (5201) 에 "0" 을 출력한다. 즉, 열화 음성 신호가 잡음인지 여부를 추정 잡음 파워 스펙트럼의 크기에 기초하여 판정한다. 논리 OR 계산부 (5201) 는, 비교부 (5203) 의 출력 값과 비교부 (5205) 의 출력 값의 논리 OR 을 계산하고, 계산 결과를 스위치 (5044), 시프트 레지스터 (5045), 도 13 의 카운터 (5049) 로 출력한다.
상술한 바와 같이, 초기 상태 또는 무음 구간에서뿐만 아니라, 열화 음성 파워가 유음 구간에서 작을 때 업데이트 판정부 (520) 는 "1" 을 출력한다. 즉, 추정 잡음이 업데이트된다. 임계값은 각 주파수에 대해 계산되기 때문에, 추정 잡음이 각 주파수에 대해 업데이트될 수 있다.
도 15 는, 도 6 에 나타낸 추정 선천적 SNR 계산부 (7) 의 구성을 나타낸 블록도이다. 추정 선천적 SNR 계산부 (7) 는, 다중 값 범위 한정처리부 (701), 후천적 SNR 메모리 (702), 억압 계수 메모리 (703), 다중 승산부 (704 및 705), 가중치 메모리 (706), 다중 가중된 가산부 (707), 및 가산부 (708) 를 포함한다.
도 6 의 주파수 영역 SNR 계산부 (6) 로부터 공급되는 후천적 SNR γn(k) (k = 0, 1, ..., K-1) 은 후천적 SNR 메모리 (702) 와 가산부 (708) 에 전달된다. 후천적 SNR 메모리 (702) 는, n 번째 프레임의 후천적 SNR γn(k) 을 기억하고, (n-1) 번째 프레임의 후천적 SNR γn-1(k) 를 다중 승산부 (705) 에 전달한다. 도 6 의 억압 계수 보정부 (15) 로부터 공급되는 보정된 억압 계수 (k = 0, 1, ..., K-1) 는, 억압 계수 메모리 (703) 에 전달된다. 억압 계수 메모리 (703) 는, n 번째 프레임의 보정된 억압 계수 를 기억하고, n-1 번째 프레 임의 보정된 억압 계수 를 다중 승산부 (704) 에 전달한다.
다중 승산부 (704) 는, 공급된 를 제곱하여, 를 획득하고, 를 다중 승산부 (705) 에 전달한다. 다중 승산부 (705) 는, 와 γn-1(k) 를 k = 0, 1, ..., K-1 에 대해 승산하여 를 획득하고, 그 결과를 과거의 추정 SNR (922) 로서 다중 가중된 가산부 (707) 에 전달한다. 다중 승산부 (704 및 705) 의 구성은 도 7 를 이용하여 설명한 다중 승산부 (13) 의 구성과 동일하기 때문에, 그의 상세한 설명은 생략될 것이다.
가산부 (708) 의 다른 단자에는 "-1" 이 공급되고, 그 가산 결과 γn(k)-1 이 다중 값 범위 한정처리부 (701) 에 전달된다. 다중 값 범위 한정처리부 (701) 는, 가산부 (708) 로부터 공급되는 가산 결과 γn(k)-1 에 값 범위 한정 연산자 P[·] 에 의한 연산을 실시하고, 그 결과인 P[γn(k)-1] 를 순시 추정 SNR (921) 로서 다중 가중된 가산부 (707) 에 전달한다. P[x] 는,
에 의해 정의된다. 다중 가중된 가산부 (707) 에는 또한, 가중치 메모리 (706) 로부터의 가중치 (923) 가 공급된다. 다중 가중된 가산부 (707) 는, 이런 공급 된 순시 추정 SNR (921), 과거의 추정 SNR (922), 및 가중치 (923) 를 이용함으로써 추정 선천적 SNR 을 획득한다. 가중치 (923) 가 α 라면, 는 추정 선천적 SNR (924) 이고, 는,
에 의해 계산될 수 있다. 여기서, G2 -1(k)γ-1(k)bar = 1 인 것으로 가정된다.
도 16 은, 도 15 에 나타낸 다중 값 범위 한정처리부 (701) 의 구성을 나타낸 블록도이다. 다중 값 범위 한정처리부 (701) 는, 상수 메모리 (7011), 최대 값 선택부 (70120 내지 7012K-1), 분리부 (7013), 및 다중화부 (7014) 를 포함한다. 분리부 (7013) 에는, 도 15 의 가산부 (708) 로부터 γn(k)-1 이 공급된다. 분리부 (7013) 는, 공급된 γn(k)-1 을 K 개의 주파수 영역 성분으로 분리하고, 주파수 영역 성분을 최대 값 선택부 (70120 내지 7012K-1) 에 공급한다. 최대 값 선택부 (70120 내지 7012K-1) 의 다른 입력에는 상수 메모리 (7011) 로부터 "0" 이 공급된다. 최대 값 선택부 (70120 내지 7012K-1) 는, γn(k)-1 을 "0" 과 비교하여, 더 큰 값을 다중화부 (7014) 에 전달한다. 이런 최대 값 선택 계산은, 상기 식 12 를 실행하는 것에 해당한다. 다중화부 (7014) 는 이런 값들을 다중화 하여 출력한다.
도 17 은, 도 15 에 나타낸 다중 가중된 가산부 (707) 의 구성을 나타낸 블록도이다. 다중 가중된 가산부 (707) 는, 가중된 가산부 (70710 내지 7071K-1), 분리부 (7072 및 7074), 및 다중화부 (7075) 를 포함한다. 분리부 (7072) 에는, 도 15 의 다중 값 범위 한정처리부 (701) 로부터, 순시 추정 SNR (921) 로서 P[γn(k)-1] 이 공급된다. 분리부 (7072) 는, P[γn(k)-1] 을 K 개의 주파수 영역 성분으로 분리하고, 그 주파수 영역 성분을 주파수 영역 순시 추정 SNR (9210 내지 921K-1) 로서 가중된 가산부 (70710 내지 7071K-1) 에 전달한다. 분리부 (7074) 에는, 도 15 의 다중 승산부 (705) 로부터, 과거의 추정 SNR (922) 로서 이 공급된다.
분리부 (7074) 는, 를 K 개의 주파수 영역 성분으로 분리하고, 그 주파수 영역 성분을 과거의 주파수 영역 추정 SNR (9220 내지 922K-1) 로서 가중된 가산부 (70710 내지 7071K-1) 에 전달한다. 한편, 가중된 가산부 (70710 내지 7071K-1) 에는 또한 가중치 (923) 가 공급된다. 가중된 가산부 (70710 내지 7071K-1) 는, 상기 식 13 에 의해 표현된 가중된 가산을 실행하고, 주파수 영역 추정 선천적 SNR (9240 내지 924K-1) 을 다중화부 (7075) 에 전달한다. 다중화부 (7075) 는, 주파수 영역 추정 선천적 SNR (9240 내지 924K-1) 을 다중화하고, 다중화된 SNR 을 추정 선천적 SNR (924) 로서 출력한다. 가중된 가산부 (70710 내지 7071K-1) 의 동작 및 구성은 다음에 도 18 을 참조로 설명될 것이다.
도 18 은, 도 17 에 나타낸 가중된 가산부 (7071) 의 구성을 나타낸 블록도이다. 가중된 가산부 (7071) 는, 다중화부 (7091 및 7093), 및 가산부 (7092 및 7094) 를 포함한다. 가중된 가산부 (7071) 에는, 각 입력으로서, 도 16 의 분리부 (7072) 로부터의 주파수 영역 순시 추정 SNR (921), 도 17 의 분리부 (7074) 로부터의 과거의 주파수 영역 SNR (922), 및 도 15 의 가중치 메모리 (706) 로부터의 가중치 (923) 가 공급된다. 값 α 를 포함한 가중치 (923) 는, 상수 승산부 (7095) 및 승산부 (7093) 에 전달된다. 상수 승산부 (7095) 는, 입력 신호에 "-1" 을 승산함으로써 획득된 -α 를 가산부 (7094) 에 전달한다.
가산부 (7094) 의 다른 입력에는, "1" 이 공급되고, 가산부 (7094) 의 출력은 양자의 합인 1-α 가 된다. 1-α 는, 승산부 (7091) 에 공급되고, 다른 입력인 주파수 영역 순시 추정 SNR P[γn(k)-1] 과 승산되어, 적인 (1-α)P[γn(k)-1] 이 가산부 (7092) 에 전달된다. 한편, 승산부 (7093) 는, 가중치 (923) 로서 공급된 α 에 과거의 추정 SNR (922) 을 승산하여, 적인 가 가산부 (7092) 에 전달된다. 가산부 (7092) 는, (1-α)P[γn(k)-1] 과 의 합을 주파수 영역 추정 선천적 SNR (904) 로서 출력한다.
도 19 는, 도 6 에 나타낸 잡음 억압 계수 생성부 (8) 의 구성을 나타낸 블록도이다. 잡음 억압 계수 생성부 (8) 는, MMSE STSA 이득 함수 값 계산부 (811), 일반화 우도 비 계산부 (812), 억압 계수 계산부 (814) 를 포함한다. 억압 계수의 계산 방법은, 비특허 문헌 2 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL. 32, NO. 6, pp. 1109-1121 (1984년 12월)) 에 기재되어 있는 계산식에 기초하여 이하 설명될 것이다.
프레임 번호를 n 으로, 주파수 번호를 k 로, γn(k) 를 도 6 의 주파수 영역 SNR 계산부 (6) 로부터 공급되는 주파수 영역 후천적 SNR 로, 를 도 6 의 추정 선천적 SNR 계산부 (7) 로부터 공급되는 주파수 영역 추정 선천적 SNR 로, 그리고 q 를 도 6 의 음성 부재 확률 메모리 (21) 로부터 공급되는 음성 부재 확률로 가정한다. 또한,
으로 가정한다. MMSE STSA 이득 함수 값 계산부 (811) 는, 도 6 의 주파수 영역 SNR 계산부 (6) 로부터 공급되는 후천적 SNR γn(k), 도 6 의 추정 선천적 SNR 계산부 (7) 로부터 공급되는 추정 선천적 SNR , 및 도 6 의 음성 부재 확률 메모리 (21) 로부터 공급되는 음성 부재 확률 q 에 기초하여, 각 주파수에 대해 MMSE STSA 이득 함수 값을 계산하고, 그 MMSE STSA 이득 함수 값을 억압 계수 계산부 (814) 로 출력한다.
각 주파수의 MMSE STSA 이득 함수 값 Gn(k) 은,
에 의해 표현된다. 여기서, I0(z) 는, 0 차 변형 베셀 함수이고, I1(z) 는 1 차 변형 베셀 함수이다. 변형 베셀 함수는, 비특허 문헌 3 (MATHEMATICS DICTIONARY, IWANAMI BOOK SHOP, 374. G page, 1985) 에 기재되어 있다.
일반화 우도 비 계산부 (812) 는, 도 6 의 주파수 영역 SNR 계산부 (6) 로부터 공급되는 후천적 SNR γn(k), 도 6 의 추정 선천적 SNR 계산부 (7) 로부터 공급되는 추정 선천적 SNR , 및 도 6 의 음성 부재 확률 메모리 (21) 로부터 공급되는 음성 부재 확률 q 에 기초하여, 각 주파수에 대해 일반화 우도 비를 계산하고, 그 일반화 우도 비를 억압 계수 계산부 (814) 로 출력한다.
각 주파수의 일반화 우도 비 Λn(k) 는,
에 의해 표현된다.
억압 계수 계산부 (814) 는, MMSE STSA 이득 함수 값 계산부 (811) 로부터 공급되는 MMSE STSA 이득 함수 값 Gn(k), 및 일반화 우도 비 계산부 (812) 로부터 공급되는 일반화 우도 비 Λn(k) 로부터, 각 주파수에 대해 억압 계수를 계산하고, 그 억압 계수를 도 6 의 억압 계수 보정부 (15) 로 출력한다. 각 주파수의 억압 계수 는,
에 의해 표현된다. 각 주파수에 대해 SNR 을 계산하는 대신에, 복수의 주파수를 포함한 대역 내에서 공통인 SNR 을 계산 및 이용하는 것이 가능하다.
도 20 은, 도 6 에 나타낸 억압 계수 보정부 (15) 의 구성을 나타낸 블록도이다. 억압 계수 보정부 (15) 는, 주파수 영역 억압 계수 보정부 (15010 내지 1501K-1), 분리부 (1502 및 1503), 및 다중화부 (1504) 를 포함한다.
분리부 (1502) 는, 도 6 의 추정 선천적 SNR 계산부 (7) 로부터 공급되는 추정 선천적 SNR 을 주파수 영역 성분으로 분리하고, 그 주파수 영역 성분을 주파수 영역 억압 계수 보정부 (15010 내지 1501K-1) 로 각각 출력한다. 분리부 (1503) 는, 도 6 의 잡음 억압 계수 생성부 (8) 로부터 공급되는 억압 계수를 주파수 영역 성분으로 분리하고, 그 주파수 영역 성분을 주파수 영역 억압 계수 보정부 (15010 내지 1501K-1) 로 각각 출력한다.
주파수 영역 억압 계수 보정부 (15010 내지 1501K-1) 는, 분리부 (1502) 로부터 공급되는 주파수 영역 추정 선천적 SNR 및 분리부 (1503) 로부터 공급되는 주파수 영역 억압 계수로부터, 주파수 영역 보정 억압 계수를 계산하고, 그 주파수 영역 보정 억압 계수를 다중화부 (1504) 로 출력한다. 다중화부 (1504) 는, 주파수 영역 억압 계수 보정부 (15010 내지 1501K-1) 로부터 공급되는 주파수 영역 보정 억압 계수를 다중화하고, 그 다중화된 주파수 영역 보정 억압 계수를 보정 억압 계수로서 도 6 의 다중 승산부 (16) 와 추정 선천적 SNR 계산부 (7) 로 출력한다.
다음으로, 주파수 영역 억압 계수 보정부 (15010 내지 1501K-1) 의 구성 및 동작이 도 21 을 참조로 상세히 설명될 것이다.
도 21 은, 억압 계수 보정부 (15) 에 포함된 주파수 영역 억압 계수 보정부 (15010 내지 1501K-1) 의 구성을 나타낸 블록도이다. 주파수 영역 억압 계수 보정부 (1501) 는, 최대 값 선택부 (1591), 억압 계수 하한값 메모리 (1592), 임계값 메모리 (1593), 비교부 (1594), 스위치 (1595), 보정 값 메모리 (1596), 및 승산부 (1597) 를 포함한다.
비교부 (1594) 는, 임계값 메모리 (1593) 로부터 공급되는 임계값을 도 20 의 분리부 (1502) 로부터 공급되는 주파수 영역 추정 선천적 SNR 과 비교하고, 주 파수 영역 추정 선천적 SNR 이 임계값보다 클 때 스위치 (1595) 에 "0" 을 공급하고, 주파수 영역 추정 선천적 SNR 이 임계값보다 작을 때 스위치 (1595) 에 "1" 을 공급한다. 스위치 (1595) 는, 도 20 의 분리부 (1503) 로부터 공급되는 주파수 영역 억압 계수를, 비교부 (1594) 의 출력 값이 "1" 일 때 승산부 (1597) 로 출력하고, 출력 값이 "0" 일 때 최대 값 선택부 (1591) 로 출력한다. 즉, 주파수 영역 추정 선천적 SNR 이 임계값보다 작을 때, 억압 계수가 보정된다. 승산부 (1597) 는, 스위치 (1595) 의 출력 값과 보정 값 메모리 (1596) 의 출력 값의 적을 계산하고, 그 적을 최대 값 선택부 (1591) 로 출력한다.
한편, 억압 계수 하한값 메모리 (1592) 는, 기억된 억압 계수의 하한값을 최대 값 선택부 (1591) 에 공급한다. 최대 값 선택부 (1591) 는, 도 20 의 분리부 (1503) 로부터 공급되는 주파수 영역 억압 계수 또는 승산부 (1597) 에 의해 계산된 적을 억압 계수 하한값 메모리 (1592) 로부터 공급되는 억압 계수 하한값과 비교하고, 더 큰 값을 도 20 의 다중화부 (1504) 로 출력한다. 즉, 억압 계수는 확실히 억압 계수 하한값 메모리 (1592) 에 의해 기억된 하한값보다 더 큰 값이 된다.
상술된 예시적인 실시형태에서는, 잡음 억압 방식으로서, 최소 평균 제곱 오차 단시간 스펙트럼 진폭법을 적용하고 있지만, 그 실시형태를 다른 잡음 억압 방식에 적용할 수도 있다. 이런 방식의 예에는, 비특허 문헌 4 (PROCEEDINGS OF THE IEEE, VOL. 67, NO. 12, pp. 1586-1604 (1979년 12월)) 에 기재되어 있는 위너 필터법, 및 비특허 문헌 5 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL. 27, NO. 2, pp. 113-120 (1979년 4월)) 에 기재되어 있는 스펙트럼 감산법이 있으며, 이에 대한 상세한 구성 예의 설명은 생략될 것이다.
상기 예시적인 실시형태들 각각의 잡음 억압 장치는, 프로그램 등을 축적하는 기억 장치, 입력용의 키와 스위치가 배열되는 동작 유닛, LCD 와 같은 디스플레이 장치, 및 동작 유닛으로부터의 입력을 수신함으로써 각 부분의 동작을 제어하는 제어 장치를 포함하는 컴퓨터 장치로 구성될 수 있다. 상기 예시적인 실시형태들 각각의 잡음 억압 장치의 동작은, 제어 장치가 기억 장치 내에 저장된 프로그램을 실행할 때 실현된다. 프로그램은, 미리 기억 장치 내에 저장될 수도 있고, CD-ROM 과 같은 기록 매체에 기입됨으로써 사용자에게 제공될 수도 있다. 네트워크를 통하여 프로그램을 제공하는 것 또한 가능하다.
Claims (9)
- 입력 신호에 포함된 잡음을 억압하는 잡음 억압 방법으로서,상기 입력 신호를 주파수 영역 신호로 변환하는 단계;상기 주파수 영역 신호의 진폭을 보정하여 진폭 보정된 신호를 획득하는 단계;상기 진폭 보정된 신호를 이용하여 추정 잡음을 획득하는 단계;상기 추정 잡음과 상기 진폭 보정된 신호를 이용하여 억압 계수를 결정하는 단계; 및상기 억압 계수로 상기 진폭 보정된 신호를 가중하는 단계를 포함하는 것을 특징으로 하는 잡음 억압 방법.
- 제 1 항에 있어서,상기 주파수 영역 신호의 위상을 보정하여 위상 보정된 신호를 획득하는 단계; 및상기 억압 계수로 상기 진폭 보정된 신호를 가중함으로써 획득된 결과와 상기 위상 보정된 신호를 시간 영역 신호로 변환하는 단계를 포함하는 것을 특징으로 하는 잡음 억압 방법.
- 제 1 항 또는 제 2 항에 있어서,상기 입력 신호의 오프셋을 제거하여 오프셋 제거된 신호를 획득하는 단계; 및상기 오프셋 제거된 신호를 상기 주파수 영역 신호로 변환하는 단계를 포함하는 것을 특징으로 하는 잡음 억압 방법.
- 입력 신호에 포함된 잡음을 억압하는 잡음 억압 장치로서,상기 입력 신호를 주파수 영역 신호로 변환하는 변환부;상기 주파수 영역 신호의 진폭을 보정하여 진폭 보정된 신호를 획득하는 진폭 보정부;상기 진폭 보정된 신호를 이용하여 추정 잡음을 획득하는 잡음 추정부;상기 추정 잡음과 상기 진폭 보정된 신호를 이용하여 억압 계수를 결정하는 억압 계수 생성부; 및상기 억압 계수로 상기 진폭 보정된 신호를 가중하는 승산부를 포함하는 것을 특징으로 하는 잡음 억압 장치.
- 제 4 항에 있어서,상기 주파수 영역 신호의 위상을 보정하여 위상 보정된 신호를 획득하는 위상 보정부; 및상기 억압 계수로 상기 진폭 보정된 신호를 가중함으로써 획득된 결과와 상기 위상 보정된 신호를 시간 영역 신호로 변환하는 역 변환부를 포함하는 것을 특 징으로 하는 잡음 억압 장치.
- 제 4 항 또는 제 5 항에 있어서,상기 입력 신호의 오프셋을 제거하여 오프셋 제거된 신호를 획득하는 오프셋 제거부; 및상기 오프셋 제거된 신호를 상기 주파수 영역 신호로 변환하는 변환부를 포함하는 것을 특징으로 하는 잡음 억압 장치.
- 입력 신호에 포함된 잡음을 억압하도록 신호를 처리하는 컴퓨터 프로그램으로서,컴퓨터로 하여금,상기 입력 신호를 주파수 영역 신호로 변환하는 처리;상기 주파수 영역 신호의 진폭을 보정하여 진폭 보정된 신호를 획득하는 처리;상기 진폭 보정된 신호를 이용하여 추정 잡음을 획득하는 처리;상기 추정 잡음과 상기 진폭 보정된 신호를 이용하여 억압 계수를 결정하는 처리; 및상기 억압 계수로 상기 진폭 보정된 신호를 가중하는 처리를 실행하게 하는, 컴퓨터 프로그램.
- 제 7 항에 있어서,상기 컴퓨터로 하여금,상기 주파수 영역 신호의 위상을 보정하여 위상 보정된 신호를 획득하는 처리; 및상기 억압 계수로 상기 진폭 보정된 신호를 가중함으로써 획득된 결과와 상기 위상 보정된 신호를 시간 영역 신호로 변환하는 처리를 더 실행하게 하는, 컴퓨터 프로그램.
- 제 7 항 또는 제 8 항에 있어서,상기 컴퓨터로 하여금,상기 입력 신호의 오프셋을 제거하여 오프셋 제거된 신호를 획득하는 처리; 및상기 오프셋 제거된 신호를 상기 주파수 영역 신호로 변환하는 처리를 더 실행하게 하는, 컴퓨터 프로그램.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2005-00255669 | 2005-09-02 | ||
JP2005255669 | 2005-09-02 | ||
PCT/JP2006/316849 WO2007029536A1 (ja) | 2005-09-02 | 2006-08-28 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080042166A true KR20080042166A (ko) | 2008-05-14 |
KR101052445B1 KR101052445B1 (ko) | 2011-07-28 |
Family
ID=37835657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087008024A KR101052445B1 (ko) | 2005-09-02 | 2006-08-28 | 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램 |
Country Status (6)
Country | Link |
---|---|
US (3) | US8233636B2 (ko) |
EP (1) | EP1930880B1 (ko) |
JP (1) | JP5092748B2 (ko) |
KR (1) | KR101052445B1 (ko) |
CN (1) | CN101300623B (ko) |
WO (1) | WO2007029536A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014084000A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
WO2014083999A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1982324B1 (en) * | 2006-02-10 | 2014-09-24 | Telefonaktiebolaget LM Ericsson (publ) | A voice detector and a method for suppressing sub-bands in a voice detector |
JP4827661B2 (ja) * | 2006-08-30 | 2011-11-30 | 富士通株式会社 | 信号処理方法及び装置 |
JP5147730B2 (ja) * | 2007-01-12 | 2013-02-20 | パナソニック株式会社 | 受信装置及び受信方法 |
JP5668923B2 (ja) * | 2008-03-14 | 2015-02-12 | 日本電気株式会社 | 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム |
CN101770775B (zh) * | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
TWI459828B (zh) * | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
CN102576543B (zh) * | 2010-07-26 | 2014-09-10 | 松下电器产业株式会社 | 多输入噪声抑制装置、多输入噪声抑制方法以及集成电路 |
WO2012070671A1 (ja) * | 2010-11-24 | 2012-05-31 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
US8724828B2 (en) * | 2011-01-19 | 2014-05-13 | Mitsubishi Electric Corporation | Noise suppression device |
JP6070953B2 (ja) | 2011-02-26 | 2017-02-01 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び記憶媒体 |
GB2493327B (en) | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
GB2495472B (en) | 2011-09-30 | 2019-07-03 | Skype | Processing audio signals |
GB2495131A (en) | 2011-09-30 | 2013-04-03 | Skype | A mobile device includes a received-signal beamformer that adapts to motion of the mobile device |
GB2495128B (en) | 2011-09-30 | 2018-04-04 | Skype | Processing signals |
GB2495129B (en) | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
GB201120392D0 (en) | 2011-11-25 | 2012-01-11 | Skype Ltd | Processing signals |
CN102984323A (zh) * | 2011-12-08 | 2013-03-20 | 斯凯普公司 | 处理音频信号 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
JP6432597B2 (ja) | 2014-03-17 | 2018-12-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
CN104134444B (zh) * | 2014-07-11 | 2017-03-15 | 福建星网视易信息系统有限公司 | 一种基于mmse的歌曲去伴奏方法和装置 |
JP6520276B2 (ja) | 2015-03-24 | 2019-05-29 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法、及び、プログラム |
CN106161125B (zh) * | 2015-03-31 | 2019-05-17 | 富士通株式会社 | 非线性特性的估计装置及方法 |
US11303346B2 (en) | 2015-08-25 | 2022-04-12 | Cellium Technologies, Ltd. | Systems and methods for transporting signals inside vehicles |
US10027374B1 (en) * | 2015-08-25 | 2018-07-17 | Cellium Technologies, Ltd. | Systems and methods for wireless communication using a wire-based medium |
CN106910511B (zh) * | 2016-06-28 | 2020-08-14 | 阿里巴巴集团控股有限公司 | 一种语音去噪方法和装置 |
CN107170461B (zh) * | 2017-07-24 | 2020-10-09 | 歌尔科技有限公司 | 语音信号处理方法及装置 |
CN114360559B (zh) * | 2021-12-17 | 2022-09-27 | 北京百度网讯科技有限公司 | 语音合成方法、装置、电子设备和存储介质 |
CN114333882B (zh) * | 2022-03-09 | 2022-08-19 | 深圳市友杰智新科技有限公司 | 基于幅度谱的语音降噪方法、装置、设备及存储介质 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02272499A (ja) * | 1989-04-13 | 1990-11-07 | Ricoh Co Ltd | 音声認識装置 |
US5680508A (en) | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
JP3277398B2 (ja) | 1992-04-15 | 2002-04-22 | ソニー株式会社 | 有声音判別方法 |
US5536902A (en) | 1993-04-14 | 1996-07-16 | Yamaha Corporation | Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter |
JP3338573B2 (ja) | 1994-11-01 | 2002-10-28 | ユナイテッド・モジュール・コーポレーション | サブバンド分割演算回路 |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
JPH11133996A (ja) * | 1997-10-30 | 1999-05-21 | Victor Co Of Japan Ltd | 音程変換装置 |
JPH11289312A (ja) | 1998-04-01 | 1999-10-19 | Toshiba Tec Corp | マルチキャリア無線通信装置 |
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
JP4308345B2 (ja) | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6366880B1 (en) | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
DE10017646A1 (de) * | 2000-04-08 | 2001-10-11 | Alcatel Sa | Geräuschunterdrückung im Zeitbereich |
WO2001080423A2 (en) * | 2000-04-14 | 2001-10-25 | Harman International Industries, Incorporated | Method and apparatus for dynamic sound optimization |
DE10020756B4 (de) * | 2000-04-27 | 2004-08-05 | Harman Becker Automotive Systems (Becker Division) Gmbh | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
JP4282227B2 (ja) | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
EP2239733B1 (en) | 2001-03-28 | 2019-08-21 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression method |
JP2003131689A (ja) * | 2001-10-25 | 2003-05-09 | Nec Corp | ノイズ除去方法及び装置 |
JP3858668B2 (ja) * | 2001-11-05 | 2006-12-20 | 日本電気株式会社 | ノイズ除去方法及び装置 |
JP2003339709A (ja) * | 2002-05-22 | 2003-12-02 | Ge Medical Systems Global Technology Co Llc | ドップラ信号処理装置および超音波診断装置 |
US7343283B2 (en) * | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
JP4608650B2 (ja) * | 2003-05-30 | 2011-01-12 | 独立行政法人産業技術総合研究所 | 既知音響信号除去方法及び装置 |
US7970150B2 (en) * | 2005-04-29 | 2011-06-28 | Lifesize Communications, Inc. | Tracking talkers using virtual broadside scan and directed beams |
US8126161B2 (en) * | 2006-11-02 | 2012-02-28 | Hitachi, Ltd. | Acoustic echo canceller system |
BRPI0721079A2 (pt) | 2006-12-13 | 2014-07-01 | Panasonic Corp | Dispositivo de codificação, dispositivo de decodificação e método dos mesmos |
US7873114B2 (en) * | 2007-03-29 | 2011-01-18 | Motorola Mobility, Inc. | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate |
-
2006
- 2006-08-28 US US12/065,472 patent/US8233636B2/en not_active Expired - Fee Related
- 2006-08-28 JP JP2007534337A patent/JP5092748B2/ja not_active Expired - Fee Related
- 2006-08-28 EP EP06796883.4A patent/EP1930880B1/en active Active
- 2006-08-28 WO PCT/JP2006/316849 patent/WO2007029536A1/ja active Application Filing
- 2006-08-28 CN CN2006800407045A patent/CN101300623B/zh not_active Expired - Fee Related
- 2006-08-28 KR KR1020087008024A patent/KR101052445B1/ko active IP Right Grant
-
2012
- 2012-06-25 US US13/532,185 patent/US8477963B2/en active Active
- 2012-06-25 US US13/532,159 patent/US8489394B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014084000A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
WO2014083999A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US8233636B2 (en) | 2012-07-31 |
EP1930880B1 (en) | 2019-09-25 |
US8477963B2 (en) | 2013-07-02 |
JP5092748B2 (ja) | 2012-12-05 |
US8489394B2 (en) | 2013-07-16 |
CN101300623A (zh) | 2008-11-05 |
CN101300623B (zh) | 2011-07-27 |
US20090196434A1 (en) | 2009-08-06 |
JPWO2007029536A1 (ja) | 2009-03-19 |
US20120288115A1 (en) | 2012-11-15 |
EP1930880A1 (en) | 2008-06-11 |
WO2007029536A1 (ja) | 2007-03-15 |
US20120290296A1 (en) | 2012-11-15 |
EP1930880A4 (en) | 2009-08-26 |
KR101052445B1 (ko) | 2011-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101052445B1 (ko) | 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램 | |
KR100927897B1 (ko) | 잡음억제방법과 장치, 및 컴퓨터프로그램 | |
JP4282227B2 (ja) | ノイズ除去の方法及び装置 | |
JP5435204B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
WO2012070670A1 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP6064600B2 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP2008216721A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP2003140700A (ja) | ノイズ除去方法及び装置 | |
JP2007006525A (ja) | ノイズ除去の方法及び装置 | |
JP4395772B2 (ja) | ノイズ除去方法及び装置 | |
JP5413575B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP6011536B2 (ja) | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140707 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150619 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160617 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170616 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 8 |