KR20070055599A - 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치 - Google Patents

잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치 Download PDF

Info

Publication number
KR20070055599A
KR20070055599A KR1020077008598A KR20077008598A KR20070055599A KR 20070055599 A KR20070055599 A KR 20070055599A KR 1020077008598 A KR1020077008598 A KR 1020077008598A KR 20077008598 A KR20077008598 A KR 20077008598A KR 20070055599 A KR20070055599 A KR 20070055599A
Authority
KR
South Korea
Prior art keywords
noise
frame
signal
reduction filter
noise reduction
Prior art date
Application number
KR1020077008598A
Other languages
English (en)
Other versions
KR101168002B1 (ko
Inventor
끌로드 마로
시릴 쁠라푸
빠스칼 스캘라
Original Assignee
프랑스 텔레콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프랑스 텔레콤 filed Critical 프랑스 텔레콤
Publication of KR20070055599A publication Critical patent/KR20070055599A/ko
Application granted granted Critical
Publication of KR101168002B1 publication Critical patent/KR101168002B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Vehicle Body Suspensions (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

본 발명은 잡음 신호를 처리하는 방법 및 상기 방법을 구현하기 위한 장치에 관한 것이다. 본 발명에 따른 방법은 잡음 신호의 각 프레임(x(k, n))에 대하여(x(n)), 상기 잡음 신호의 프레임에 대한 주파수 도메인으로의 변환을 적용하는 단계; 상기 프레임에 대한 잡음의 전력 스펙트럼 밀도(rbb(k, f))를 추정하는 단계; 상기 잡음의 추정된 전력 스펙트럼 밀도 및 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정으로부터 제1 잡음 감소 필터
Figure 112007028802742-PCT00187
를 계산하는 단계; 상기 프레임
Figure 112007028802742-PCT00188
에 대한 잡음 보정 추정을 획득하기 위하여 상기 계산된 제1 잡음 감소 필터에 의하여 상기 잡음 신호(x(k, n); X(k, f))의 상기 프레임을 필터링하는 단계; 및 상기 잡음 신호의 상기 프레임의 제1 잡음 보정 추정으로부터 제2 신호의 프레임
Figure 112007028802742-PCT00189
을 획득하는 단계를 포함하며, 제2 신호의 프레임은 상기 잡음 신호의 상기 프레임에 해당하는 유효 신호와 실질적으로 동일한 위치들에서의 하모닉들을 포함한다.
잡음 제거, 잡음 보정, 노이즈 제거, 신호 프레임, 하모닉, 푸리에 변환

Description

잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치{METHOD OF PROCESSING A NOISY SOUND SIGNAL AND DEVICE FOR IMPLEMENTING SAID METHOD}
본 발명은 잡음 신호 처리에 관한 것이다. 구체적으로, 본 발명은 그러한 신호들에 존재하는 잡음의 감소에 관한 것이다.
소리 신호 내의 잡음 즉, 방해 신호를 감소시키기 위한 기술들이 공지된다. 그들은 이러한 신호의 품질 및 명료성을 향상시키도록 소리 신호가 나타나는 음향 환경을 고려하고자 하는 것이다. 이 기술들은 잡음 신호 상에 처리를 수행하는 것에 의하여 고려되는 소리 신호로부터 유용한 정보를 추출하는 것으로 이루어진다. 그러한 기술들은 예를 들면, 몇몇 대화자들 사이에서 소리 신호가 전달되는 전화, 원격 회의, 화상 회의와 같은 응용에서 구두 통신에 적용될 수 있다. 게다가 그들은 시끄러운 환경에서 소리를 취하는 응용에 또는 음성 인식의 응용에 적용되며, 그것의 성능은 음성 신호가 잡음으로 가득한 환경에서 발음될 때 배우 변경된다.
이 기술들은 일반적으로 잡음 감소 필터의 전달 함수를 추정하고, 다음으로 스펙트럼 도메인에서의 곱셈에 근거한 필터링 처리를 수행하는 것으로 이루어진다. 그들은 단구간 스펙트럼 감쇠에 의한 잡음 감소"로 불리는 접근법 내에서 수행된다.
이 기술들에 따르면, 고려되는 소리 신호(x(n))는 유효 신호(s(n)) 성분 및 잡음 성분(b(n))을 포함하며, n은 이산 시간에서 순간 인덱스를 나타낸다. 그러나, 연속 시간에서 신호의 표시가 또한 적용될 수 있음이 주지될 것이다. 신호(x(n))는 일정한 길이 및 인덱스(k)의 연속적인 프레임들(x(n,k))로 구성된다. 각 프레임들은 먼저 잡음 감소 필터의 계산을 위하여 필요한 스펙트럼 양의 추후 추정을 향상시키는 것을 가능하게 하는 가중 윈도우(weighting window)에 의해 곱해진다. 따라서 윈도우가 형성된 각 프레임은 다음으로 예를 들면 이산 또는 빠른 푸리에 변환에 의해 스펙트럼 도메인에서 분석된다. 이 동작은 단구간 푸리에 변환(STFT)으로 불린다.
따라서 관측된 신호로부터 획득된 주파수 표현 x(k,f)(여기서, f는 주파수 인덱스이다)은 잡음 감소 필터의 전달 함수 H(k, f)를 추정하는 것과 동시에, 잡음 신호의 단구간 스펙트럼 및 전달 함수 사이의 간단한 곱셈에 의해 스펙트럼 도메인에 이 필터를 적용하는 것을 가능하게 한다. 따라서 필터링 결과는 다음과 같이 쓰여질 수 있다.
Figure 112007028802742-PCT00001
다음으로 획득된 신호의 시간 도메인으로의 복귀는 역 스펙트럼 변환에 의해 수행된다. 대응 순간 신호는 결국 블록 중첩 및 추가 기술("중첩 추가"를 나타내는 OLA)에 의해 또는 블록 세이브 기술("중첩 세이브"를 나타내는 OLS)에 의해 합성된다. 시간 도메인에서 신호를 재구성하는 이 동작은 역 단구간 푸리에 변환(ISTFT) 으로 불린다.
단구간 스펙트럼 감쇠 방법들에 대한 자세한 설명은 J.S. Lim, A.V. Oppenheim, "노이지 스피치의 향상 및 밴드폭 압축(Enhancement and bandwidth compression of noisy speech)", Proceeding of the IEEE, Vol. 67, pp.1586-1604, 1979; 및 R.E. Crochiere, L.R. Rabiner, "멀티레이트 디지털 신호 처리(Multirate digital signal processing)" Prentice Hall, 1983에 참조로 발견될 것이다.
주파수 성분 f에서 인덱스 k의 순간 세그먼트 상의 관측 신호 x(k, f)에 적용된 단구간 스펙트럼 감쇠 H(k, f)는 일반적으로 로컬 신호-대-잡음비 SNR(k, f)의 추정에 기초하여 판정된다. 모든 억제 규칙들에 공통적인 특성은 다음과 같이 주어지는 그들의 점근 행동 내에 존재한다.
Figure 112007028802742-PCT00002
대부분의 기술에서, 다음 추정이 이루어진다: 잡음과 유효 신호는 통계적으로 상관되어 있지 않고, 유효 신호는 간헐적이며, 인간의 귀는 신호 위상에 민감하지 않다(일반적으로 처리에 의해 변경되지 않는다).
공통적으로 채용되는 억제 규칙들 중에서 예를 들면, 전력 스펙트럼 감산, 진폭 스펙트럼 감산 및 워너(Wiener) 필터의 직접 구현 등이 채용될 수 있다. 이러한 규칙들에 있어서, 유용한 음성 신호의 주파수 성분(f)의 단구간 추정은 각각 다음과 같이 기록될 수 있다
전력 스펙트럼 감산(J.S. Lim, A.V. Oppenheim에 의한 상술한 논문을 참조하 라)에 대하여,
Figure 112007028802742-PCT00003
(1)
진폭 스펙트럼 감산(S.F. Boll, "스펙트럼 감산를 사용하여 음성에서 음향 잡음의 억제(Suppression of acoustic noise in speech using spectral subtraction)", IEEE Trans, on Audio, Speech and Signal Processing, Vol. 27, No. 2, pp. 113-120, April 1979를 참조하라)에 대하여; 및
Figure 112007028802742-PCT00004
(2)
워너 필터링(J.S. Lim, A.V. Oppenheim에 의한 상술한 논문을 참조하라)에 대하여,
Figure 112007028802742-PCT00005
(3)
이 식들에서,
Figure 112007028802742-PCT00006
Figure 112007028802742-PCT00007
은 각각 인덱스(k)의 시간 윈도우 상에서 관측 신호(x(k, f))의 주파수 성분(f) 내에 존재하는 유효 신호 및 잡음의 전력 스펙트럼 밀도를 나타낸다.
상술한 식들에 근거하여, 주어진 주파수 성분(f) 상에서 측정된 로컬 신호 대 잡음비의 함수로서, 잡음 신호에 적용된 스펙트럼 감쇠 행동을 연구할 수 있다. 상술한 세 가지 단구간 억제 규칙에 대한 곡선들이 도 1에 도시된다. 규칙들의 세트는 로컬 신호 대 잡음비가 높은 경우(도 1의 오른쪽 부분) 실질적으로 동일한 감 쇠를 준다는 점이 주지될 것이다. 가우시안 모델의 최대 유사도의 관점에서 최적인 최적 전력 감산 규칙(O. Cappe, "엠프레임 말라 잡음 억제기로 음악 잡음 현상의 제거(Elimination of the musical noise phenomenon with the Ephraim and Malah noise suppressor)", IEEE Trans. on Speech and Audio Processing, Vol. 2, No. 2, pp.345-349, April 1994를 참조하라)은 잡음 전력이 프로세싱 출력에서 가장 높게 남아있는 방법이다. 세 가지 억제 규칙에 있어서, 컷오프값에 대한 로컬 신호 대 잡음비에서의 작은 변화는 전체 감쇠의 경우(H(k, f)≒0)로부터 무시할 수 있는 스펙트럼 변경(H(k, f)≒1)의 경우까지 변화시키기에 충분하다는 사실을 주지해야 할 것이다.
후자의 특성은 "음악 잡음"으로 알려진 현상의 원인들 중 하나를 구성한다. 구체적으로, 판정적이고 무작위적 성분들을 동시에 포함하는 주변 소음이 음성 비활성 기간 동안에만 특징지어질 수 있다. 무작위 성분들의 존재에 의해, 음성 활성화 기간 동안 잡음의 주파수 성분(f)의 실제 기여와 음성 비활성 순간 동안 여러 프레임들에 걸쳐 이루어진 그것의 평균 추정 사이의 매우 큰 변화들이 존재한다. 이 차이에 의해, 로컬 신호 대 잡음비의 추정이 컷오프 레벨 주변에서 변동할 수 있고, 따라서 나타났다 사라지는 스펙트럼 성분에 대한 프로세싱 출력을 상승시킬 수 있으며, 그것의 평균 수명은 실질적으로 관련 분석 윈도우의 크기의 차수를 초과하지 않는다. 통과 대역 전체에 대한 이러한 행동의 일반화는 가청적이고 자극적은 잔여 잡음을 유발한다.
몇몇 연구들은 이 잔여 잡음의 영향을 감소시키기 위하여 노력해 왔다. 해결 책들은 이하의 몇몇 방법들을 주장한다: 단구간 추정들의 평균(상술한 S.F. Boll에 의한 논문 참조), 잡음 전력 스펙트럼 과추정(overestimation((M. Berouti 외, "음향 잡음에 의해 손상되는 음성의 향상(Enhancement of speech currupted by acoustic noise)", Int. Conf. on Speech, Signal Processing, pp. 208-211, 1979; P. Lockwood, J. Boudy, "비선형 스펙트럼 감산기, 은닉 마르코브 모델 및 차량의 강한 음성 인식용 프로젝션을 구비한 실험(Experiments with a non-linear spectral subtractor, hidden Markov models and the projection for robust speech recognition in cars)", Proc. of EUSOPCO'91, pp. 79-82, 1991을 참조하라), 또는 잡음 스펙트럼 밀도의 최소값 트래킹(tracking)(R. Martin, "최소 통계학에 근거한 스펙트럼 감산(Spectral subtraction based on minimum statistics)", in Signal Processing VII: Theories and Applicantions, EUSIPCO'94, pp. 1182-1185, 1994.9를 참조하라).
음악 잡음을 억제하기 위한 상대적으로 효율적인 해결책은 "규제된 판정"이라는 유효 신호의 전력 스펙트럼 밀도의 추정자(estimator)로 구성된다((Y. Ephraim 및 D. Malah "최소 평균 제곱 에러 단구간 진폭 스펙트럼 추정자를 사용한 음성 향상(Speech Enhamcement using a minimum mean square error short-time spectral amplitude estimator)", IEEE Trans. on Audio, Speech and Signal Processing, Vol. 32, No. 6, pp. 1109-1121, 1983 및 상술한 0. Cappe에 의한 논문을 참조하라). 이 추정자는 유효 신호의 순간 및 장구간 전력 스펙트럼 밀도 사이의 중간에 영향을 주며, 그에 의하여 음약 잡음을 효율적으로 제거할 수 있다. 게다가 이 추정자에 내재된 지연을 생성하는 것에 의하여 이 해결책을 향상시키는 것이 알려져 있다(FR2820227 및 C. Plapous, C. Marro, L. Mauuary, P. Scalart, "2단계 잡음 감소 기술(A Two-Step Noise Reduction Technique)", ICASSP, 2004.5를 참조하라).
몇몇 연구들은 또한 음성 및 추가 잡음 신호들의 통계 모델에 근거한 새로운 억제 규칙의 확립하는 것과 관련이 있다. 이 연구들은 종래 방법에 비하여 추가적인 자유도를 가지기 때문에 "연판정(soft decision)" 알고리즘으로 불리는 새로운 알고리즘들의 도입을 가능하게 했다(R.J. Mac Aulay, M.L. Malpass, "연판정 잡음 억제 필터를 사용한 음성 향상(Speech enhancement using a soft-decision noise suppression filter)", IEEE Trans. on Audio, Speech and Signal Processing, Vol. 28, No. 2, pp.137-145, April 1980, Y. Ephraim, D. Malah, "최적 비선형 진폭 스펙트럼 추정을 사용한 음성 향상(Speech enhancement using optimal non-linear spectral amplitude estimation)", Int. Conf. on Speech, Signal Processing, pp. 1118-1121, 1983, 및 상술한 Y. Ephraim, D. Malah 논문 "최소 평균 제곱 에러 단구간 진폭 스펙트럼 추정자를 사용한 음성 향상(Speech enhancement using a munimum mean square error short-time spectral amplitude estimator)"을 참조하라).
상술한 바와 같이, 단구간 스펙트럼 감쇠는 각 스펙트럼 성분상에서의 신호 대 잡음비의 추정에 의존한다. 예를 들면, 앞서 주어진 식들은 이하의 식과 관련이 있다.
Figure 112007028802742-PCT00008
따라서, 잡음 감소 기술의 성능은 특별히 왜곡 및 잡음 레벨의 효율적인 감소에 있어서 신호 대 잡음비의 추정량의 관련성에 의해 통제된다.
이 결점은 공지된 음성 잡음 제거 시스템의 주요한 제한을 구성한다. 특별히, 현재 잡음 제거 시스템은 너무 낮은 신호 대 잡음비로 특징지어지는 하모닉들(harmonics)의 잡음을 제거할 수 있다. 실제로, 잡음 제거 알고리즘들은 각 주파수에 대한 음성 성분의 존재 또는 부재를 검출하기 위하여 SNR을 사용한다. 만약 추정된 SNR이 지나치게 나쁘다면, 알고리즘은 거기에 신호 성분이 존재하지 않고 따라서 그것을 억제해야 하는 것으로 고려한다. 따라서, 하모닉들은 공지된 잡음 제거 시스템에 의해 소실될 수 있다. 이제, 대부분의 언어에서 표현된 소리들(하모닉들)은 발음된 소리의 매우 큰 부분을 나타낸다는 점이 주지되어야 한다.
본 발명의 목적은 공지된 잡음 제거 시스템의 한계를 극복하고자 하는 것이다.
본 발명의 다른 목적은 잡음 감소 방법의 성능을 향상시키고자 하는 것이다.
본 발명의 다른 목적은 소리를 지나치게 왜곡시키지 않는 소리 신호 처리를 제안하고자 하는 것이다. 구체적으로, 수행된 신호 처리는 신호 내에 포함된 하모닉들의 전부 또는 일부를 보유할 수 있게 한다.
본 발명의 다른 목적은 음향 신호 처리의 완료시 음악 잡음의 표현을 제한하고자 하는 것이다.
본 발명의 다른 목적은 유효 신호의 하모닉 조합의 좋은 추정을 획득하기 위한 것이다.
따라서 본 발명은 연속적인 프레임들로 조직된 잡음 신호의 처리 방법을 제안한다. 상기 처리는 상기 프레임들 중 적어도 하나와 관련된 다음 단계들을 포함한다:
- 잡음 신호의 상기 프레임에 대한 주파수 도메인으로의 변환을 적용하는 단계;
- 상기 프레임에 대한 잡음의 전력 스펙트럼 밀도를 추정하는 단계;
- 상기 잡음의 추정된 전력 스펙트럼 밀도 및 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정에 근거하여 제1 잡음 감소 필터를 계산하는 단계;
- 상기 프레임의 제1 잡음 제거된 추정을 획득하기 위하여 계산된 상기 제1 잡음 감소 필터로 상기 잡음 신호의 상기 프레임을 필터링하는 단계; 및
- 상기 잡음 신호의 상기 프레임의 제1 잡음 제거된 추정에 근거하여 상기 제2 신호의 프레임을 획득하는 단계.
상기 제2 신호의 상기 프레임은 상기 잡음 신호의 상기 프레임에 해당하는 유효 신호와 실질적으로 동일한 위치에 하모닉들을 포함하는 것을 특징으로 한다.
따라서 잡음 신호의 그러한 처리는 신호에 적용되는 제1 잡음 감소 필터의 출력에서 하모닉성 표현을 획득할 수 있게 한다. 그렇게 획득된 제2 신호의 프레임은 제1 필터링 동안 나타날 수 있는 잡음이 제거된 신호의 프레임의 왜곡을 제거하는 방식으로 구성된다.
이 처리는 유효 신호의 하모닉 콤브의 좋은 추정을 획득하게 하며, 이것은 다음 이용의 요지일 수 있다.
바람직하게, 잡음 제거 도메인에서, 상기 방법은 상기 잡음의 추정된 전력 스펙트럼 밀도 및 상기 프레임의 제1 잡음 제거 추정과 획득된 상기 제2 신호의 전력의 조합에 근거하여 제2 잡음 감소 필터를 계산하는 단계; 상기 프레임의 제2 잡음 제거 추정을 획득하기 위하여 상기 계산된 제2 잡음 감소 필터에 의하여 상기 잡음 신의 상기 프레임을 필터링하는 단계; 및 상기 프레임의 제2 잡음 제거 추정을 합성하는 단계를 더 포함한다.
이 실시예에서, 제2 잡음 감소 필터는 하모닉성 재생으로부터 발생한 신호에 의해 구성되기 때문에 하모닉들을 보유하는 방식으로 계산된다. 따라서 상기 제2 필터링의 완료시 획득된 프레임의 제2 잡음 제거 추정은 입력 신호의 하모닉들이 파괴되거나 적어도 손상된 종래 잡음 감소 시스템들에서 획득된 것보다 좀 더 효율적이다.
제1 및 제2 잡음 감소 필터의 계산은 바람직하게는 단구간 스펙트럼 감쇠 기술을 구현하는 제1 패스를 포함할 수 있다. 예를 들면, 다음 기술들이 예를 들어 인용될 수 있다: 전력 스펙트럼 감산, 진폭 스펙트럼 감산 및 개방 루프 워너 필터 등. 바람직하게, 그것은 또한 예를 들면, 전력 스펙트럼 감산, 진폭 스펙트럼 감산 및 개방 루프 워너 필터 등과 같은 단구간 스펙트럼 감쇠 기술을 구현하는 제2 패스를 포함하고, 제1 패스 동안 수행된 계산을 고려한 프레임에 대응하는 유효 신호의 전력 스펙트럼 밀도의 추정을 사용한다.
바람직하게, 상기 잡음 신호의 상기 프레임에 해당하는 유효 신호와 실질적으로 동일한 위치들의 하모닉들을 포함하는 상기 제2 신호의 프레임의 획득은 상기 제1 추정이 시간 도메인일 때 상기 잡음 신호의 프레임의 제1 잡음 제거 추정에 대한 비선형 함수의 적용을 포함하며, 상기 제1 추정이 주파수 도메인일 때 상기 잡음 신호의 프레임의 제1 잡음 제거 추정 및 비선형 함수의 주파수 도메인으로의 변경 사이의 순환 컨볼루션의 적용을 포함한다.
상기 비선형 함수는 예를 들면, 단일파 정류 함수, 절대값, 상기 잡음 신호의 프레임의 제1 잡음 제거 추정과 임계 사이의 최대값, 및 상기 잡음 신호의 프레임의 제1 잡음 제거 추정과 임계값 사이의 최소값 중 하나일 수 있다.
본 발명은 상술한 방법을 구현하기 위하여 설계된 수단들을 포함하는 잡음 신호 처리 방치를 더 제안한다.
본 발명은 또한 프로그램이 로드되어 컴퓨팅 수단에 의해 실행될 때, 상술한 방법의 구현을 위하여 설계된 명령어들을 포함하는 정보 매체 상의 컴퓨터 프로그램을 제안한다.
본 발명의 다른 특징들 및 이점들은 첨부된 도면을 참조하여, 비 제한적 실시예들의 이하의 설명으로부터 명백해질 것이다.
도 1은 이미 설명된 세 개의 공지된 단구간 억제 규칙의 행동을 비교하는 도 면이다.
도 2는 본 발명의 실시예를 구현할 수 있는 다양한 기능 블록들을 나타내는 도면이다.
도 3은 잡음이 제거된 신호에서 손실된 하모닉들의 복원 예를 도시하는 도면이다.
도 4는 본 발명의 실시예에 따른 신호 내의 하모닉들의 복원 효과를 도시하는 도면이다.
도 5는 본 발명의 실시예에 따른 제2 잡음 감소 필터의 추정 예를 도시하는 도면이다.
도 2는 본 발명의 실시예에 따른 장치(1)를 도시한다. 잡음 신호의 현재 프레임(2)이 처리를 받기 위하여 장치(1)로 들어간다. 이 프레임은 앞서 도입된 표시에 따라 x(k, n)에 의해 지시된다.
장치(1)는 잡음 신호(x(k, n))의 현재 프레임을 주파수 도메인(X(k, f))으로 변경시키는 규칙을 가진 분석 유닛(3)을 포함한다. 먼저, 프레임에는 가중 윈도우 w(n)이 곱해져 신호 xw(k, n)을 전달한다:
xw(k, n) = w(n)x(k, n)
주파수 도메인으로의 변환은 다음으로 이산 푸리에 변환(DFT), 즉 다음을 사용하여 수행된다:
X(k, f) = DFT(xw(k, n))
이 DFT는 바람직하게는 빠른 푸리에 변환(또는 FFT)에 의해 구현될 수 있다. 그러나, 웨이블렛(wavelet) 변환과 같은 주파수 도메인으로의 다른 변환 또한 가능하다. 동일한 것이 해당하는 역 동작을 위하여 적용된다. 즉, 나중에 언급될 역 이산 푸리에 변환(IDFT)이 시간 도메인으로 되돌아가기 위하여 적용된다.
게다가, 음성 활동 검출(DVA)을 위한 함수(4)는 바람직하게는 현재 프레임(2) 상에서 구현된다. DVA는 잡음의 전력 스펙트럼 밀도(PSD)의 추정을 업데이트할 때를 아는 것을 가능하게 한다. 따라서, DVA에 의해 검출된 각 "잡음만"의 프레임(kb)에 대하여, 잡음 전력 스펙트럼 밀도
Figure 112007028802742-PCT00009
가 다음 순환식에 따라 기능 블록(5)으로 추정된다:
Figure 112007028802742-PCT00010
파라미터 α(kb)는 평활 인자를 제어한다. 그것은 시간에 따라 변할 수 있다.
만약 현재 프레임(2)이 잡음 프레임으로 검출되지 않는다면, 잡음의 전력 스펙트럼 밀도의 추정은 고정된다. 즉, 이전 잡음 프레임에 대하여 획득된 PSD의 마지막 값으로 유지된다.
Figure 112007028802742-PCT00011
의 추정이 지수-평활법 추정자에 한정되지 않고, 임의의 다른 전력 스펙트럼 밀도 추정자가 사용될 수 있음이 이해될 것이다.
후자가 시간 도메인 또는 주파수 도메인에서 동작하는지 여부에 따라 임의 타입의 DVA가 사용될 수 있다. 심지어 음성 활동에 대한 그러한 검출을 생략할 수도 있다.
다음으로 제1 잡음 감소 필터의 추정이 도 2의 기능 블록 7에 의해 수행된다. 이 제1 잡음 감소 필터의 전달 함수는 바람직하게는 2단계 기술의 효과에 의해 주파수 도메인에서 추정된다(상술한 FR2820227 및 C. Plapous, C. Marro, L. Mauuary, P. Scalart, "2단계 잡음 감소 기술(A Two-step Noise Reduction Technique)", ICASSP, May 2004를 참조하라). 제1 단계에서, 다음의 전달 함수를 갖는 필터가 계산된다:
Figure 112007028802742-PCT00012
필터의 전달 함수에 대한 이 식은 유효 신호의 PSD(
Figure 112007028802742-PCT00013
) 및 잡음의 PSD(
Figure 112007028802742-PCT00014
)에 의존하는 수학식이다. 이러한 의미에서, 함수 fstep1은 단구간 스펙트럼 감쇠 기술에 따라 선택될 수 있고, 따라서,
Figure 112007028802742-PCT00015
은 예를 들면 전력 스펙트럼 감산 규칙(식 (1)), 증폭 스펙트럼 감산 규칙(식 (2)), 개방 루프 워너 필터 규칙(식 (3)) 등을 구현한다. 임의의 다른 주파수 기반 잡음 억제 규칙이 또한
Figure 112007028802742-PCT00016
을 추정하기 위하여 구현될 수 있다.
잡음 전력 스펙트럼 밀도(
Figure 112007028802742-PCT00017
)의 계산이 자세히 상술되었다. 스펙트럼 양(
Figure 112007028802742-PCT00018
)에 관한 한, 그것은 음성 활동의 기간 동안 신호 및 잡음의 혼합 을 고려하여 직접 획득될 수 없다. 그것을 계산하기 위하여, 다음 식에 따른 규제된 판정 추정자가 사용된다(상술한 Y. Ephraim 및 D. Malah, "최소 평균 제곱 에러 단구간 진폭 스펙트럼 추정자를 사용한 음성 향상(Speech Enhamcement using a minimum mean square error short-time spectral amplitude estimator)"을 참조하라):
Figure 112007028802742-PCT00019
여기서 β(k)는 시간에 따라 변할 수 있는 무게 중심 파라미터이고,
Figure 112007028802742-PCT00020
은 인덱스 k-1의 이전 프레임과 관련하여 추정된 유효 신호의 스펙트럼이다. 추정 에러인 경우에 음수일 수 있는 양
Figure 112007028802742-PCT00021
의 임계화(thresholding)을 보장하는 함수 P는 다음과 같이 주어진다:
Figure 112007028802742-PCT00022
Figure 112007028802742-PCT00023
의 추정은 규제된 판정 추정자로 제한되지 않음이 주지되어야 한다. 특별히, 지수-평활 추정자 또는 임의의 다른 전력 스펙트럼 밀도 추정자가 사용될 수 있다.
그 다음 전달 함수(
Figure 112007028802742-PCT00024
)는 유효 신호의 PSD(
Figure 112007028802742-PCT00025
)의 추정을 향상시키기 위하여 감소될 수 있다. 다음으로 우리는 다음과 같이 주어진 양(
Figure 112007028802742-PCT00026
)을 획득한다:
Figure 112007028802742-PCT00027
그리고 제2 단계는
Figure 112007028802742-PCT00028
에 근거한 제1 잡음 감소 필터의 전달 함수의 추정자
Figure 112007028802742-PCT00029
를 계산하는 단계로 구성된다:
Figure 112007028802742-PCT00030
유효 신호의 PSD(
Figure 112007028802742-PCT00031
)의 "더 빠른" 업데이트에 특징이 있는 이 2단계의 계산은 제1 잡음 감소 필터(
Figure 112007028802742-PCT00032
) 상에서 두 가지 이점을 수반한다. 한 편으로는, 특히 순간 곡선의 빠른 변화(예를 들면, 침묵/음성 전이 동안 음성 신호의 시작 또는 소멸) 동안 유효 신호의 비안정성의 빠른 트래킹을 획득하는 것이다. 다른 한편으로는, 잡음 감소 필터가 더 잘 추정되고, 이것은 방법 성능의 향상을 통하여 명백해진다.
Figure 112007028802742-PCT00033
Figure 112007028802742-PCT00034
은 예를 들면 전력 스펙트럼 감산 규칙(식 (1)), 증폭 스펙트럼 감산 규칙(식 (2)), 개방 루프 워너 필터 규칙(식 (3))과 같은 단구간 스펙트럼 감쇠 기술을 구현할 수 있다. 임의의 다른 주파수 기반 잡음 억제 기술이 또한
Figure 112007028802742-PCT00035
Figure 112007028802742-PCT00036
을 추정하기 위하여 구현될 수 있다. 물론 제2 단계의 구현 없이 제1 단계로 제한하는 것 또한 가능하다.
다음으로 필터링이 계산된 제1 필터(
Figure 112007028802742-PCT00037
)에 따라, 장치(1)의 기능 블록 6에 의해 수행된다. 그것은 주파수 도메인에서 수행될 수 있으며, 이것은 두 개의 스펙트럼들을 곱하는 것에 해당한다. 그대로, 이것은 시간 도메인에서 순환 컨볼루 션(convolution) 동작과 균등하다. 따라서, 프레임들에 속도의 클릭에 의해 들릴 때 나타나는 순간 위신호(aliasing)에 의한 왜곡을 피하기 위하여 특정 예방조치를 취할 필요가 있다. 따라서, 선형 컨볼루션 제한을 만족시키기 위하여, 특정 수의 빈(null) 샘플들을 각 입력 프레임에 추가하는 것(소위 "제로 패딩" 기술로 불림)과 잡음 감소 필터의 임펄스 응답의 순간 지지를 제한하는 것(이것은 시간 도메인 또는 주파수 도메인에서 수행될 수 있다) 모두가 필요하다.
잡음 감소 필터의 임펄스 응답의 순간 지지를 제한하기 위하여 시간 도메인에서 제약을 도입하는 것이 가능하다는 것이 이해되어야 하며, 이것은 다음을 요구한다.
i) 필터의 전달 함수
Figure 112007028802742-PCT00038
의 이해에 근거한 임펄스 응답
Figure 112007028802742-PCT00039
을 획득하는 것을 가능하게 하는 제1 "역(inverse)" 스펙트럼 변환,
ii) 규제된 순간 필터(
Figure 112007028802742-PCT00040
)를 획득하기 위하여 이 임펄스 응답 점들의 수의 제한,
iii) 규제된 임펄스 응답(
Figure 112007028802742-PCT00041
)에 근거한 필터의 변경된 전달 함수(
Figure 112007028802742-PCT00042
)를 획득하는 것을 가능하게 하는 제2 "정(direct)" 스펙트럼 변환.
잡음 감소 필터의 (주파수) 전달 함수(
Figure 112007028802742-PCT00043
) 가 유용하다면, (순간) 임펄스 응답(
Figure 112007028802742-PCT00044
)은 역 이산 푸리에 변환(IDFT), 즉 다음 식에 의해 획득된다:
Figure 112007028802742-PCT00045
다음으로 이 임펄스 응답은 윈도우(
Figure 112007028802742-PCT00046
)에 의해 가장 큰 계수(
Figure 112007028802742-PCT00047
)를 선택하고 가중치를 두는 것에 의하여 일시적으로 제한된다:
Figure 112007028802742-PCT00048
잡음 감소 필터의 순간 지지에 대한 이 제한은 두 가지 장점을 나타낸다. 한편으로는 순간 위신호의 문제를 피하는 것을 가능하게 하며(선형 컨볼루션에 따름), 다른 한편으로는 필터에 너무 공격적인 효과들을 피하는 것을 가능하게 한다.
따라서 잡음 감소 필터의 전달 함수(
Figure 112007028802742-PCT00049
)는 다음의 이산 푸리에 변환(DFT)에 의해 획득된다:
Figure 112007028802742-PCT00050
마지막으로, 잡음 신호의 제1 잡음 제거 버전이 잡음 신호의 스펙트럼과 잡음 감소 필터의 전달 함수를 곱하는 것, 즉 다음 식에 의한 주파수 필터링에 의해 획득된다:
Figure 112007028802742-PCT00051
이 주파수 필터링 단계는 또한 순간 필터링, 즉
Figure 112007028802742-PCT00052
에 의한
Figure 112007028802742-PCT00053
의 직접 필터링에 의한 것과 균등한 방식으로 수행될 수 있으며, 다음으로 결과의 이산 푸리에 변환(DFT)을 수행한다.
유효 신호의 제1 추정
Figure 112007028802742-PCT00054
은 도입부에서 설명된 바와 같이 특정 하모닉 들이 잡음 감소 필터
Figure 112007028802742-PCT00055
에 의해 억제되기 때문에 가청 왜곡들을 갖는다. 물론, 왜곡의 레벨은 SNR과 직접 관련될 수 있다. 주파수 영역에서 잡음이 강해질수록 이 영역의 하모닉들은 점점 약화되는 경향이 있다.
이러한 단점을 완화시키기 위하여, 도 2에 도시된 장치(1)의 기능 블록 8은 파괴되거나 매우 많이 감쇠되는 곳들의 하모닉들만을 소유하는 인공 신호
Figure 112007028802742-PCT00056
를 생성한다.
신호
Figure 112007028802742-PCT00057
는 시간 도메인 또는 주파수 도메인에서 획득될 수 있다. 시간 도메인에서 상기 신호에 비선형성, 예를 들면, 단파 정류 함수, 절대값, 임계에 대한 최소/최대 등으로부터의 함수을 적용하는 것에 의하여 신호에 대한 하모닉성을 복원하는 것이 가능하다. NL이 도 4의 단계 14에서 설명되는 바와 같이 사용되는 비선형 함수를 가리킨다면, 우리는 다음 식을 가진다:
Figure 112007028802742-PCT00058
여기서
Figure 112007028802742-PCT00059
은 역 이산 푸리에 변환(IDFT)에 의해 도 3의 단계 13에 따라 다음과 같이 획득된다:
Figure 112007028802742-PCT00060
다음으로, 이산 푸리에 변환(DFT)에 의해 도 3의 단계 15에서 지시된 바와 같이
Figure 112007028802742-PCT00061
를 다음과 같이 획득한다:
Figure 112007028802742-PCT00062
하모닉들은 유효 신호의 하모닉들과 동일한 위치에서 재생된다. 이것은 순간 비선형성이 하모닉들을 복원하기 위하여 사용된다는 사실에 의해 함축적으로 보장된다는 사실이 이해되어야 할 것이다.
게다가, 비선형성이 시간 도메인에서 적용되는 경우,
Figure 112007028802742-PCT00063
Figure 112007028802742-PCT00064
의 컨볼루선을 통하여 직접 획득된 신호
Figure 112007028802742-PCT00065
에 비선형성을 적용하는 것에 의하여 주파수 도메인으로의 변경을 피할 수 있다는 점이 이해되어야 할 것이다.
도 4는 비선형성의 효과 및 이점을 도시한다. 제1 스펙트럼(곡선 16)은 비-잡음 유효 신호의 프레임에 대응하며 기준으로서의 역할을 한다. 제2 스펙트럼(곡선 17)은 신호
Figure 112007028802742-PCT00066
에 대응한다. 제2 스펙트럼에서 특정 하모닉들은 완전히 파괴되고 다른 것들은 약화되는 것이 명백히 나타난다. 마지막 스펙트럼(곡선 18)은 상술한 신호
Figure 112007028802742-PCT00067
에 대응한다. 신호
Figure 112007028802742-PCT00068
에 적용된 비선형성이 효과적으로 신호
Figure 112007028802742-PCT00069
내의 손실된 하모닉들을 재생할 수 있게 하는 것이 나타난다. 따라서, 이 신호
Figure 112007028802742-PCT00070
의 스펙트럼은 종래 잡음 감소 기술들이 파괴했던 하모닉들을 보유할 수 있게 하는 새로운 잡음 감소 필터를 계산하는데 특히 유용한 하모닉성 정보를 소유한다.
순간 비선형성은 신호
Figure 112007028802742-PCT00071
의 스펙트럼 및 유효 신호와 동일한 하모닉 구조(하모닉들의 위치들의 레벨에서)를 갖는 신호의 스펙트럼 사이의 순환 컨볼루 선을 수행하는 것으로 구성된 주파수 등가물을 소요한다. 그러한 스펙트럼은 예를 들면
Figure 112007028802742-PCT00072
에 해당하는 순간 신호 d(k, n)에 의해 획득될 수 있다. 따라서, 이하의 방식으로 주파수 도메인에서 신호
Figure 112007028802742-PCT00073
을 획득하는 것이 또한 가능하다:
Figure 112007028802742-PCT00074
여기서 기호
Figure 112007028802742-PCT00075
는 순환 컨볼루션 연산자에 해당한다. 만약 선택된 순간 비선형성이 절대값 함수라면, 예를 들면 신호 d(k, n)은 그것이 적용된 값의 부호를 나타내는 함수 sgn으로 다음과 같이 표현될 수 있다:
Figure 112007028802742-PCT00076
따라서, 순간 비선형성 또는 주파수 순환 컨볼루션을 통하여 획득된 신호
Figure 112007028802742-PCT00077
Figure 112007028802742-PCT00078
의 하모닉이 파괴되거나 약화된 곳의 하모닉들만을 소유한다. 그것은 원래 잡음 제거 신호의 하모닉 콤브(comb)의 좋은 추정을 구성하며, 하모닉들은 유효 신호에서와 동일한 위치들에 보유된다. 이 하모닉 콤브의 추정은 배타적인 것은 아니지만 특히 잡음 제거 목적에 바람직하며 이용될 수 있다.
바람직하게, 이 신호는 또한 이하에서 설명될 바와 같이 종래 알고리즘들에 의해 일반적으로 파괴되었던 하모닉들을 보호할 수 있는 잡음 감소 필터를 계산하는 것을 가능하게 할 수 있다.
본 발명은 신호
Figure 112007028802742-PCT00079
를 획득하기 위한 상술한 예들에 제한되지 않는다는 것이 이해될 것이다. 그것은 사실 잡음 감소 필터
Figure 112007028802742-PCT00080
에 의해 억제된 하 모닉들을 재성하고자 하는 임의의 다른 방법까지 확장된다.
바람직하게, 제2 필터는 그 후 도 2의 기능 블록 9에 의해 추정된다. 이 제2 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00081
는 도 5에 도시된 바와 같이 다음과 같은 방식으로 추정되며, g는 함수를 나타낸다.
Figure 112007028802742-PCT00082
필터의 전달 함수에 대한 이 식은 잡음의 PSD(
Figure 112007028802742-PCT00083
) 및 하모닉 복원 단계에 의해 추정된 유효 신호의 PSD 즉, 다음과 같은 식에 의존하는 수학식이다.
Figure 112007028802742-PCT00084
파라미터
Figure 112007028802742-PCT00085
는 신호
Figure 112007028802742-PCT00086
을 생성하기 위하여 선택된 비선형성 함수(NL)로서 PSD
Figure 112007028802742-PCT00087
의 계산에서 신호
Figure 112007028802742-PCT00088
의 재주입 레벨을 제어하기 위하여 사용된다. 이 파라미터는 고정되거나 주파수 및/또는 시간에 따라 다를 수 있음이 이해되어야 할 것이다.
함수 g는
Figure 112007028802742-PCT00089
가 예를 들어 전력 스펙트럼 감산 규칙(식 (1)), 진폭 스펙트럼 감산 규칙(식 (2)), 또는 개방 루프 워너 필터 규칙(식 (3))을 구현하도록 선택될 수 있다. 물론 임의의 다른 주파수 기반 잡음 억제 규칙이
Figure 112007028802742-PCT00090
를 추정하기 위하여 구현될 수 있다.
이 잡음 감소 전달 함수
Figure 112007028802742-PCT00091
는 종래 잡음 감소 기술에 의해 일반적으로 파괴되었던 신호의 하모닉들을 보유하는 장점을 갖는다. 따라서, 이것은 잡음 제거 신호의 왜곡을 제한한다. 이 필터는 필터
Figure 112007028802742-PCT00092
의 좋은 특성, 즉 비정형성의 좋은 트래킹 및 매우 작은 잔여 음악 잡음을 계속 보유하고 있음이 또한 주지되어야 한다.
그 후 제2 필터링이 제1 추정 잡음 감소 필터에 근거하여 장치(1)의 기능 블록(10)에 의해 수행된다. 따라서, 제1 전달 함수에 대하여, 잡음 감소 필터의 (주파수) 전달 함수
Figure 112007028802742-PCT00093
와 등가인 (순간) 임펄스 응답
Figure 112007028802742-PCT00094
이 역 이산 푸리에 변환(IDFT), 즉 다음 식에 의해 획득된다:
Figure 112007028802742-PCT00095
그 후 이 임펄스 응답은 바람직하게 윈도우 wfilt2에 의해 가장 큰 계수 Lfilt2를 선택하고 가중치를 두는 것, 즉 다음 식에 의해 일시적으로 제한된다:
Figure 112007028802742-PCT00096
그 다음 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00097
가 이산 푸리에 변환(DFT)에 의해 다음과 같이 획득된다:
Figure 112007028802742-PCT00098
마지막으로, 잡음이 제거된 주파수 프레임이 주파수 필터링하는 것에 의하여, 즉 잡음 신호의 스펙트럼과 잡음 감소 필터의 전달 함수를 곱하는 다음 식에 의하여 획득된다:
Figure 112007028802742-PCT00099
이 주파수 필터링 단계는 또한 순간 필터링, 즉
Figure 112007028802742-PCT00100
Figure 112007028802742-PCT00101
에 의해 직접적으로 필터링하는 것에 의하여 동등한 방식으로 수행될 수 있다. 이 경우, 시간 도메인에서 신호
Figure 112007028802742-PCT00102
를 직접 획득한다.
필터링이 주파수 도메인에서 수행될 때, 시간 도메인으로 복귀되는 것이 바람직하다. 이것은 역 스펙트럼 변환(IDFT)을 적용하는 것, 즉 다음 식에 의하여 장치(1)의 기능 블록 11에 의해 수행된다:
Figure 112007028802742-PCT00103
그 다음 잡음 제거된 출력 신호는 바람직하게는 블록 중첩 및 추가 기술("중첩 추가를 나타내는 OLA)또는 다른 블록 세이브 기술("중첩 세이브"로 나타내는 OLS)에 의해 합성된다. 시간 도메인에서 신호를 재구성하는 이 동작은 역 단구간 푸리에 변환(ISTFT)으로 불린다.
이 단계들이 완료되면, 프레임(12)이 장치(1)의 출력에서 획득되고, 이 출력 프레임(12)은 입력 프레임(2)의 잡음이 제거된 추정이며, 왜곡이 제한된다.
나머지 설명에서, 본 발명의 구현의 바람직한 선택들이 설명된다. 이 선택들은 실시예들이며, 제한적 특성을 갖는 것으로 고려되어서는 안 된다.
장치(10)의 기능 블록 3 및 11에 의해 수행되는 분석 및 합성의 구현에 있어서, OLA 기술이 바람직하게 선택된다. 게다가, 분석된 프레임들 사이의 중첩이 존재한다. 예를 들면, 50%의 중첩 비율이 선택될 수 있다. 길이 L의 잡음 신호 x(k, n) {n = 0, ..., L-1}의 현재 프레임(2)은 먼저 가중 윈도우 w(n)으로 곱해져서 신호 xw(k, n)을 나타낸다:
Figure 112007028802742-PCT00104
이 예에서, 사용되는 윈도우는 크기 L의 해닝 윈도우(Hanning window)이며:
Figure 112007028802742-PCT00105
여기서 L = 256이고, 이것은 샘플링 주파수 Fe = 8 ㎑에서 길이 32 ms의 프레임에 해당한다.
주파수 도메인으로의 변경은 바람직하게는 이산 푸리에 변환(DFT)의 수치적으로 최적화된 버전인 빠른 푸리에 변환(FFT)을 사용하는 것에 의하여 수행된다. 좀 더 나은 주파수 해상도를 얻고 선형 컨볼루션 제한을 만족시키기 위하여 길이 LFFT = 512의 FFT가 사용된다. 따라서, 미리 윈도우된 블록 xw(k, n)을 256개의 빈(null) 샘플들("제로 패딩")에 의해 연장할 필요가 있다:
Figure 112007028802742-PCT00106
다음으로 입력 프레임의 FFT X(k, f)은 다음 식에 의해 획득된다:
Figure 112007028802742-PCT00107
음성 활동의 검출은 기능 블록 4에 의해 선택적으로 수행될 수 있다.
기능 블록 5에 의해 수행되는 잡음 전력 스펙트럼 밀도
Figure 112007028802742-PCT00108
의 추정에 관하여는, 바람직하게는 이하의 방식으로 진행할 수 있다. DVA에 의해 검출된 각 "잡음만"의 프레임에 대하여, 잡음 전력 스펙트럼 밀도
Figure 112007028802742-PCT00109
는 이하의 순환식에 의해 추정된다:
Figure 112007028802742-PCT00110
만약 현재 프레임이 잡음 프레임으로 검출되지 않는다면, 잡음의 전력 스펙트럼 밀도의 추정은 고정된다. 평활량 α은 선택된 상수이며 α=0.8825와 같고, 이것은 128ms의 시정수(time constant)에 해당하며(50% 중첩 및 샘플링 주파수 Fe = 8㎑의 관계를 갖는), 신뢰성 있는 추정과 잡음 통계의 임시 변수의 트래킹 사이의 타협을 보장하기에 충분하다고 판단된다.
기능 블록 7에 의해 추정된 제1 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00111
는 바람직하게는 다음과 같은 개방 루프 위너 필터의 전달 함수이다:
Figure 112007028802742-PCT00112
여기서
Figure 112007028802742-PCT00113
은 유효 신호
Figure 112007028802742-PCT00114
및 잡음
Figure 112007028802742-PCT00115
의 PSD들의 추정비에 의해 이론적으로 정의된 연역적 신호 대 잡음비(SNR)을 나타낸다. 즉,:
Figure 112007028802742-PCT00116
.
유효 신호의 PSD
Figure 112007028802742-PCT00117
는 바람직하게는 규제된 판정 추정자, 즉 다음을 사용하여 획득된다:
Figure 112007028802742-PCT00118
여기서, 무게 중심 파라미터 β는 선택 상수이며, β = 0.98과 같다. 상술한 바와 같이, 함수 P는 (1- β)에 의해 가중된 양의 임계화를 보장한다:
Figure 112007028802742-PCT00119
그 다음 전달 함수
Figure 112007028802742-PCT00120
은 바람직하게는 유효 신호
Figure 112007028802742-PCT00121
의 PSD의 추정을 향상시키기 위하여 재사용된다. 따라서 다음 식으로 주어진 양
Figure 112007028802742-PCT00122
이 획득된다:
Figure 112007028802742-PCT00123
이것은 연역적 신호 대 잡음비
Figure 112007028802742-PCT00124
의 제2 추정을 수행하기 위하여 다음과 같이 사용된다:
Figure 112007028802742-PCT00125
다음으로 제2 단계는 바람직하게는
Figure 112007028802742-PCT00126
에 근거한 제1 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00127
의 추정자의 계산, 즉 다음 식으로 구성된다:
Figure 112007028802742-PCT00128
다음으로 기능 블록 6에 의해 수행되는 필터링은 이하에서 지시되는 바와 같 이 수행될 수 있다. 잡음 감소 필터
Figure 112007028802742-PCT00129
의 (주파수) 전달 함수가 유용하다면, 대응 순간 응답
Figure 112007028802742-PCT00130
이 바람직하게는 역 이산 푸리에 변환(IDFF)의 수치적으로 최적화된 버전인 역 빠른 푸리에 변환(IFFT), 즉 다음 식을 사용하는 것에 의하여 획득될 수 있다:
Figure 112007028802742-PCT00131
신호
Figure 112007028802742-PCT00132
이 실수이기 때문에, 대응 순간 필터는 먼저 제공된 원인이 된다. 관찰된 어플리케이션에 상당하는 샘플들에 해당하는 이 필터의 Lfilt1 = 256개의 계수들이 다음으로 선택된다. 따라서 획득된 임펄스 응답이 길이 Lfilt1의 해밍 윈도우에 의해 가중된다. 마지막으로, 가중된 임펄스 응답은 위신호 없는(aliasing-free) 선형 컨볼루션 제약을 따르는 임펄스 응답
Figure 112007028802742-PCT00133
을 주기 위하여, LFFT-Lfilt1으로 보충된다.
그 다음 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00134
가 바람직하게 이산 푸리에 변환(DFT)의 수치적으로 최적화된 버전인 빠른 푸리에 변환(FFT), 즉 다음 식을 사용하는 것에 의하여 획득된다:
Figure 112007028802742-PCT00135
마지막으로, 잡음 신호의 제1 잡음 제거 버전이 주파수 필터링, 즉 잡음 신호의 스펙트럼과 잡음 감소 필터의 전달 함수를 곱하는 것에 의하여 획득된다:
Figure 112007028802742-PCT00136
기능 블록 8에 의해 수행되는 손실 하모닉들의 복구 단계에서, 신호
Figure 112007028802742-PCT00137
는 다음으로 인공 신호
Figure 112007028802742-PCT00138
를 생성하기 위하여 사용된다. 먼저, 순간 신호
Figure 112007028802742-PCT00139
가 바람직하게는 역 빠른 푸리에 변환(FFTI)을 사용하는 것에 의하여 획득된다:
Figure 112007028802742-PCT00140
그 다음, 단일파 비선형 정류 함수가 이 신호에 적용되고, 이것은 그것의 하모닉성을 복구하기 위한 목적을 갖는다:
Figure 112007028802742-PCT00141
물론, 단일파 정류 외의 임의의 다른 비선형성이 상술한 바(절대값, 임계값에 대한 최대/최소 등)와 같이 사용될 수 있다. 마지막으로, 신호
Figure 112007028802742-PCT00142
가 바람직하게는 빠른 푸리에 변환(FFT), 즉 다음을 사용하여 획득된다:
Figure 112007028802742-PCT00143
그 다음 이 신호는 바람직하게는 제2 잡음 감소 필터의 전달 함수를 계산하기 위하여 이용된다.
본 실시예에서, 그러한 제2 필터의 추정은 다음 방식으로 장치(1)의 블록 9에 의하여 수행된다. 제2 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00144
는 개방 루프 워너 필터의 전달 함수이며, 따라서 다음과 같다:
Figure 112007028802742-PCT00145
여기서
Figure 112007028802742-PCT00146
는 유효 신호의 PSD
Figure 112007028802742-PCT00147
및 잡음의 PSD
Figure 112007028802742-PCT00148
추정비에 의해 이론적으로 정의된 연역적 신호 대 잡음비를 나타낸다:
Figure 112007028802742-PCT00149
여기서 유효 신호의 PSD
Figure 112007028802742-PCT00150
는 다음과 같이 획득된다:
Figure 112007028802742-PCT00151
신호
Figure 112007028802742-PCT00152
의 재주입 레벨을 제어하기 위한 파라미터 ρ(k, f)가 선택되고, 관측되는 어플리케이션에 대하여 0.5와 같도록 고정된다.
잡음 감소 필터의 (주파수) 전달 함수
Figure 112007028802742-PCT00153
가 유용하다면, 대응 순간 응답
Figure 112007028802742-PCT00154
이 바람직하게는 역 이산 푸리에 변환(IDFT)의 수치적으로 최적화된 버전인 역 빠른 푸리에 변환(DFFT), 즉 다음 식을 사용하여 획득된다:
Figure 112007028802742-PCT00155
신호
Figure 112007028802742-PCT00156
이 실수이기 때문에, 대응 순간 필터는 먼저 제공된 원인이 된다. 이 어플리케이션에 상당하는 샘플들에 해당하는 이 필터의 Lfilt2 = 256개의 계수들이 다음으로 선택된다. 따라서 획득된 임펄스 응답이 길이 Lfilt2의 해밍 윈도우 에 의해 가중된다. 마지막으로, 가중된 임펄스 응답은 위신호 없는(aliasing-free) 선형 컨볼루션 제약을 따르는 임펄스 응답
Figure 112007028802742-PCT00157
을 주기 위하여, LFFT-Lfilt2으로 보충된다.
그 다음 잡음 감소 필터의 전달 함수
Figure 112007028802742-PCT00158
가 바람직하게 이산 푸리에 변환(DFT)의 수치적으로 최적화된 버전인 빠른 푸리에 변환(FFT), 즉 다음 식을 사용하는 것에 의하여 획득된다:
Figure 112007028802742-PCT00159
잡음 감소 필터
Figure 112007028802742-PCT00160
의 절대값은 지나치게 공격적인 잡음 감소를 피하기 위하여 선택적으로 임계화될 수 있다.
마지막으로, 잡음이 제거된 주파수 프레임은 기능 블록 10에 의하여 수행된 주파수 필터링에 의하여, 다시 말해 잡음 신호의 스펙트럼과 잡음 감소 필터의 전달 함수를 곱하는 것, 즉 다음 식에 의하여 획득된다:
Figure 112007028802742-PCT00161
다음으로 기능 블록 11의 레벨에서, 역 스펙트럼 변환에 의하여, 바람직하게는 역 빠른 푸리에 변환(IFFT)을 사용하는 것, 즉 다음에 의하여 그렇게 획득된 신호의 시간 도메인으로의 복귀가 수행된다:
Figure 112007028802742-PCT00162
그 다음 잡음이 제거된 출력 신호는 블록 중첩 및 추가 기술(OLA)에 의해 합성된다.
도 2에 도시된 장치(1)가 관측된 어플리케이션의 함수에 따라, 소리 픽업 장치의 일부, 통신 장치의 일부 또는 심지어 음성 인식 장치의 일부와 같이 장치의 특정 부품으로 위치될 수 있음이 또한 이해될 것이다.
장치에 의해 구현되는 처리는 예를 들면 통신 단말의 경우에서와 같이 국지적 방식으로 또는 예를 들면 심지어 음성 인식 서버의 경우에 네트워크에 중점을 두고 수행될 수 있음이 또한 이해될 것이다.
추가로, 실질적으로, 본 발명에 따른 잡음 신호 들을 처리하기 위한 장치(1)는 본 발명에 따른 신호 처리 방식을 구현하기에 적절한 (전자) 하드웨어 수단 및/또는 소프트웨어 수단들로 구성된다.
바람직한 실시예에 따르면, 본 발명에 따른 잡음 신호 처리 방법의 단계들은 본 발명에 따른 장치의 부품에 사용되는 컴퓨터 프로그램 명령어에 의해 결정된다.
본 발명에 따른 방법은 다음으로 상술한 프로그램이 장치에 통합된 컴퓨팅 수단으로 로드될 때 구현되고, 동작은 프로그램의 수행에 의해 제어된다.
여기서, "컴퓨터 프로그램"이란 표현은 적절한 컴퓨팅 수단에 의해 수행될 때 본 발명의 구현 목적인 (소프트웨어) 세트를 형성하는 하나 이상의 컴퓨터 프로그램들을 의미하는 것으로 이해된다.
결과적으로 본 발명의 요지는 또한 구체적으로 정보 매체 상에 저장된 소프트웨어의 부분 형태인 그러한 컴퓨터 프로그램이다. 그러한 정보 매체는 본 발명에 따른 프로그램을 저장할 수 있는 임의의 엔터티 또는 장치로 구성될 수 있다.
예를 들면, 해당 매체는 예를 들면 CD ROM 또는 마이크로전자 회로 ROM인 ROM과 같은 하드웨어 저장 수단, 또는 예를 들면 하드 디스크인 자기 기록 수단을 포함할 수 있다. 변경예에서, 정보 매체는 프로그램이 통합된 집적 회로일 수 있으며, 그 회로는 당해 방법의 수행에 사용되거나 방법을 수행하는데 적절할 수 있다.
게다가, 정보 매체는 또한 무선 또는 다른 수단에 의해 전기 또는 광학 케이블을 통하여 전달될 수 있는 전기 또는 광학 신호와 같은 전달가능한 무형 매체일 수 있다. 본 발명에 따른 프로그램은 특히 인터넷 타입의 네트워크로부터 다운로드될 수 있다.
설계 관점에서, 본 발명에 따른 컴퓨터 프로그램은 임의의 프로그래밍 언어를 사용할 수 있으며, 소스 코드, 객체 코드 또는 소스 코드와 객체 코드 사이의 중간 코드(예를 들면, 부분적으로 컴파일된 형태) 형태이거나, 또는 본 발명에 따른 방법을 구현하는데 적절한 임의의 다른 형태일 수 있다.
본 명세서 내에 포함되어 있음

Claims (33)

  1. 연속적인 프레임들로 구성된 잡음 신호(x(n))를 처리하는 방법에 있어서,
    적어도 하나의 프레임들(x(k, n))에 관하여,
    상기 잡음 신호의 프레임에 대한 주파수 도메인으로의 변환을 적용하는 단계;
    상기 프레임에 대한 잡음의 전력 스펙트럼 밀도(rbb(k, f))를 추정하는 단계;
    상기 잡음의 추정된 전력 스펙트럼 밀도 및 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정에 근거하여 제1 잡음 감소 필터
    Figure 112007028802742-PCT00163
    를 계산하는 단계;
    상기 프레임의 제1 잡음 제거 추정
    Figure 112007028802742-PCT00164
    을 획득하기 위하여 상기 계산된 제1 잡음 감소 필터에 의하여 상기 잡음 신호(x(k, n); X(k, f))의 상기 프레임을 필터링하는 단계; 및
    상기 잡음 신호의 상기 프레임의 제1 잡음 제거 추정에 근거하여 제2 신호
    Figure 112007028802742-PCT00165
    의 프레임을 획득하는 단계를 포함하며,
    상기 제2 신호의 프레임은 상기 잡음 신호의 상기 프레임에 해당하는 유효 신호와 실질적으로 동일한 위치들에서의 하모닉들을 포함하는 잡음 신호 처리 방법.
  2. 제1항에 있어서,
    상기 잡음의 추정된 전력 스펙트럼 밀도 및 상기 프레임의 제1 잡음 제거 추정과 획득된 상기 제2 신호
    Figure 112007028802742-PCT00166
    의 전력의 조합에 근거하여 제2 잡음 감소 필터
    Figure 112007028802742-PCT00167
    를 계산하는 단계;
    상기 프레임의 제2 잡음 제거 추정
    Figure 112007028802742-PCT00168
    을 획득하기 위하여 상기 계산된 제2 잡음 감소 필터에 의하여 상기 잡음 신호(x(k, n); X(k, f))의 상기 프레임을 필터링하는 단계; 및
    상기 프레임의 제2 잡음 제거 추정을 합성하는 단계를 더 포함하는 잡음 신호 처리 방법.
  3. 제2항에 있어서,
    상기 제2 잡음 감소 필터에 의하여 수행된 필터링의 결과가 주파수 도메인에 있을 때, 상기 프레임의 제2 잡음 제거 추정을 합성하는 단계 전에, 시간 도메인으로의 변경이 상기 필터링 결과에 적용되는 것을 특징으로 하는 잡음 신호 처리 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 잡음 신호(x(k, n))의 상기 프레임은 상기 프레임에 주파수 도메인으로 의 변경을 적용하기 전에, 가중 윈도우(w(n))에 의해 곱해지는 것을 특징으로 하는 잡음 신호 처리 방법.
  5. 제4항에 있어서,
    상기 가중 윈도우는 크기가 상기 잡음 신호의 프레임의 길이 L인 해밍 윈도우인 것을 특징으로 하는 잡음 신호 처리 방법.
  6. 제5항에 있어서,
    상기 가중 윈도우는
    Figure 112007028802742-PCT00169
    형태이며, 여기서 n은 0에서 L-1까지의 정수이며, L은 256과 같은 것을 특징으로 하는 잡음 신호 처리 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 잡음 신호(x(k, n))의 프레임에 적용된 주파수 도메인으로의 변경은 길이 512의 빠른 푸리에 변환인 것을 특징으로 하는 잡음 신호 처리 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    음성 활동은 상기 잡음 신호(x(k, n))의 프레임 내에서 검색되고, 상기 프레임의 잡음의 전력 스펙트럼 밀도(rbb(k, f))의 추정은 상기 프레임 내에서 음성 활동이 검출되지 않을 때 상기 프레임 내에 포함된 잡음의 전력 스펙트럼 밀도의 추 정 및 음성 활동이 상기 프레임 내에서 검출될 때 상기 프레임 전의 잡음 신호의 적어도 하나의 프레임 내에 포함된 잡음의 전력 스펙트럼 밀도의 추정에 해당하는 것을 특징으로 하는 잡음 신호 처리 방법.
  9. 제8항에 있어서,
    상기 잡음 신호의 인덱스(kb)의 적어도 하나의 프레임 내에 포함되는 상기 잡음의 전력 스펙트럼 밀도, 음성 활동이 검출되지 않는 프레임은
    Figure 112007028802742-PCT00170
    형태의 지수 평활법에 의해 영향을 받으며, X(kb, f)는 상기 잡음 신호의 인덱스(kb)의 프레임의 주파수 도메인으로의 변경을 나타내며, α는 평활량인 것을 특징으로 하는 잡음 신호 처리 방법.
  10. 제9항에 있어서,
    상기 α는 실질적으로 0.8825와 같은 것을 특징으로 하는 잡음 신호 처리 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 제1 잡음 감소 필터의 계산은 단구간 스펙트럼 감쇠 기술을 구현하는 제1 패스(pass)를 포함하는 것을 특징으로 하는 잡음 신호 처리 방법.
  12. 제11항에 있어서,
    상기 제1 잡음 감소 필터의 계산은
    Figure 112007028802742-PCT00171
    형태의 전달 함수를 갖는 개방 루프 워너 필터를 구현하는 제1 패스를 포함하며, 여기서 k는 잡음 신호의 프레임의 인덱스이며,
    Figure 112007028802742-PCT00172
    는 상기 잡음의 추정된 전력 스펙트럼 밀도에 의해 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정비를 나타내는 것을 특징으로 하는 잡음 신호 처리 방법.
  13. 제12항에 있어서,
    상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정은 β가 무게중심 파라미터인
    Figure 112007028802742-PCT00173
    형태의 규제된 판정 추정, 또는 지수 평활 추정인 것을 특징으로 하는 잡음 신호 처리 방법.
  14. 제13항에 있어서,
    상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정은 실질적으로 0.98과 같은 무게 중심 파라미터(β)를 사용하는 규제된 판정 추정인 것을 특징으로 하는 잡음 신호 처리 방법.
  15. 제11항 내지 제14항 중 어느 한 항에 있어서,
    상기 제1 잡음 감소 필터는 단구간 스펙트럼 감쇠 기술을 구현하는 제2 패스를 더 포함하며, 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정은 상기 제1 패스 동안 수행되는 계산을 고려하는 것을 특징으로 하는 잡음 신호 처리 방법.
  16. 제15항에 있어서,
    상기 제1 패스 동안 수행되는 계산을 고려한 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정은
    Figure 112007028802742-PCT00174
    형태이며, 여기서
    Figure 112007028802742-PCT00175
    은 상기 제1 패스 동안 계산된 전달 함수를 나타내며, X(k, f)는 잡음 신호의 인덱스 k의 프레임의 주파수 도메인으로의 변경을 나타내며, 상기 제1 잡음 감소 필터의 계산은
    Figure 112007028802742-PCT00176
    형태의 전달 함수를 갖는 개방 루프 워너 필터를 구현하는 제2 패스를 포함하며, 여기서
    Figure 112007028802742-PCT00177
    는 상기 잡음의 추정된 전력 스펙트럼 밀도에 의한 상기 제1 패스 동안 수행된 계산을 고려한 상기 프레임에 해당하는 유효 신호의 전력 스펙트럼 밀도의 추정비를 나타내는 것을 특징으로 하는 잡음 신호 처리 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서,
    상기 제1 잡음 감소 필터에 의한 상기 잡음 신호(x(k, n); X(k, f))의 상기 프레임의 필터링은 상기 프레임의 주파수 도메인으로의 변경(X(k, f)) 상에서 수행되는 것을 특징으로 하는 잡음 신호 처리 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    상기 제1 잡음 감소 필터에 의한 상기 잡음 신호(x(k, n); X(k, f))의 상기 프레임의 필터링은 상기 제1 잡음 감소 필터의 계수들의 선택 및 상기 제1 잡음 감소 필터의 순간 임펄스 응답의 가중을 포함하는 것을 특징으로 하는 잡음 신호 처리 방법.
  19. 제18항에 있어서,
    상기 제1 잡음 감소 필터의 256개의 계수들은 해밍 윈도우에 의하여 선택되고 가중되는 것을 특징으로 하는 잡음 신호 처리 방법.
  20. 제19항에 있어서,
    상기 잡음 신호의 프레임에 적용된 상기 주파수 도메인으로의 변경은 길이 512의 빠른 푸리에 변환이며, 상기 제1 잡음 감소 필터의 순간 임펄스 응답(xw(k, n))은 235개의 0이 보충되는 것을 특징으로 하는 잡음 신호 처리 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서,
    상기 잡음 신호의 상기 프레임에 해당하는 유효 신호와 실질적으로 동일한 위치들의 하모닉들을 포함하는 상기 제2 신호
    Figure 112007028802742-PCT00178
    의 프레임의 획득은 상기 제1 추정이 시간 도메인일 때 상기 잡음 신호
    Figure 112007028802742-PCT00179
    의 프레임의 제1 잡음 제거 추정에 대한 비선형 함수의 적용을 포함하며, 상기 제1 추정이 주파수 도메인일 때 상기 잡음 신호
    Figure 112007028802742-PCT00180
    의 프레임의 제1 잡음 제거 추정 및 비선형 함수(d(k, n))의 주파수 도메인으로의 변경 사이의 순환 컨볼루션의 적용을 포함하는 것을 특징으로 하는 잡음 신호 처리 방법.
  22. 제21항에 있어서,
    상기 비선형 함수(d(k, n))는 단일파 정류 함수, 절대값, 상기 잡음 신호의 프레임의 제1 잡음 제거 추정과 임계 사이의 최대값, 및 상기 잡음 신호의 프레임의 제1 잡음 제거 추정과 임계값 사이의 최소값 중 하나인 것을 특징으로 하는 잡음 신호 처리 방법.
  23. 제2항 내지 제22항 중 어느 한 항에 있어서,
    상기 제2 잡음 감소 필터
    Figure 112007028802742-PCT00181
    의 계산의 단구간 스펙트럼 감쇠 기술을 구현하는 것을 특징으로 하는 잡음 신호 처리 방법.
  24. 제23항에 있어서,
    상기 제2 잡음 감소 필터의 계산은
    Figure 112007028802742-PCT00182
    Figure 112007028802742-PCT00183
    을 구비한
    Figure 112007028802742-PCT00184
    형태의 전달 함수를 갖는 개방 루프 워너 필터를 구현하며, 여기서
    Figure 112007028802742-PCT00185
    는 인덱스 k의 프레임의 제1 잡음 감소 추정을 나타내며,
    Figure 112007028802742-PCT00186
    는 상기 제2 신호의 프레임을 나타내며, ρ(k, f)는 상기 제2 신호에 대한 재주입 파라미터인 것을 특징으로 하는 잡음 신호 처리 방법.
  25. 제24항에 있어서,
    상기 ρ(k, f)는 주파수 및/또는 시간의 함수로 변하는 것을 특징으로 하는 잡음 신호 처리 방법.
  26. 제24항에 있어서,
    상기 ρ(k, f)는 실질적으로 고정되고 0.5와 같은 것을 특징으로 하는 잡음 신호 처리 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서,
    상기 제2 잡음 감소 필터에 의한 상기 잡음 신호(x(k, n); X(k, f))의 프레임의 필터링은 상기 프레임의 주파수 도메인으로의 변경(X(k, f)) 상에서 수행되는 것을 특징으로 하는 잡음 신호 처리 방법.
  28. 제2항 내지 제27항 중 어느 한 항에 있어서,
    상기 제2 잡음 감소 필터에 의한 상기 잡음 신호(x(k, n); X(k, f))의 프레임의 필터링은 상기 제2 잡음 감소 필터의 순간 임펄스 응답의 선택 및 가중을 포함하는 것을 특징으로 하는 잡음 신호 처리 방법.
  29. 제28항에 있어서,
    상기 제2 잡음 감소 필터의 256개의 계수들은 해밍 윈도우에 의해 선택되고 가중되는 것을 특징으로 하는 잡음 신호 처리 방법.
  30. 제29항에 있어서,
    상기 잡음 신호의 프레임에 적용되는 주파수 도메인으로의 변경은 길이 512의 빠른 푸리에 변환이며, 상기 제2 잡음 감소 필터의 순간 임펄스 응답은 256개의 0으로 보충되는 것을 특징으로 하는 잡음 신호 처리 방법.
  31. 제2항 내지 제30항 중 어느 한 항에 있어서,
    상기 프레임의 제2 잡음 제거 추정의 합성은 OLA 블록 중첩 및 추가 또는 OLS 블록 세이브를 사용하는 것을 특징으로 하는 잡음 신호 처리 방법.
  32. 제1항 내지 제31항 중 어느 한 항에 따른 방법을 구현하도록 설계된 수단들을 포함하는 잡음 신호 처리 장치(1).
  33. 프로그램이 로드되어 컴퓨팅 수단에 의해 실행될 때, 제1항 내지 제31항 중 어느 한 항에 따른 방법의 구현을 위하여 설계된 명령어들을 포함하는 것을 특징으로 하는 정보 매체 상의 컴퓨터 프로그램.
KR1020077008598A 2004-09-16 2005-09-14 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치 KR101168002B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0409819 2004-09-16
FR0409819 2004-09-16
PCT/FR2005/002284 WO2006032760A1 (fr) 2004-09-16 2005-09-14 Procede de traitement d'un signal sonore bruite et dispositif pour la mise en œuvre du procede

Publications (2)

Publication Number Publication Date
KR20070055599A true KR20070055599A (ko) 2007-05-30
KR101168002B1 KR101168002B1 (ko) 2012-07-26

Family

ID=34949870

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077008598A KR101168002B1 (ko) 2004-09-16 2005-09-14 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치

Country Status (9)

Country Link
US (1) US7359838B2 (ko)
EP (1) EP1789956B1 (ko)
JP (1) JP5068653B2 (ko)
KR (1) KR101168002B1 (ko)
CN (1) CN101031963B (ko)
AT (1) ATE476733T1 (ko)
DE (1) DE602005022735D1 (ko)
ES (1) ES2349718T3 (ko)
WO (1) WO2006032760A1 (ko)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7197692B2 (en) 2004-06-18 2007-03-27 Qualcomm Incorporated Robust erasure detection and erasure-rate-based closed loop power control
US8452316B2 (en) * 2004-06-18 2013-05-28 Qualcomm Incorporated Power control for a wireless communication system utilizing orthogonal multiplexing
US7594151B2 (en) * 2004-06-18 2009-09-22 Qualcomm, Incorporated Reverse link power control in an orthogonal system
US8942639B2 (en) 2005-03-15 2015-01-27 Qualcomm Incorporated Interference control in a wireless communication system
US8848574B2 (en) * 2005-03-15 2014-09-30 Qualcomm Incorporated Interference control in a wireless communication system
KR101097021B1 (ko) * 2005-10-27 2011-12-20 콸콤 인코포레이티드 무선 통신 시스템에서 역방향 링크 로딩을 추정하기 위한 방법 및 장치
US8670777B2 (en) * 2006-09-08 2014-03-11 Qualcomm Incorporated Method and apparatus for fast other sector interference (OSI) adjustment
US20080117849A1 (en) * 2006-09-08 2008-05-22 Qualcomm Incorporated Method and apparatus for interaction of fast other sector interference (osi) with slow osi
US8442572B2 (en) * 2006-09-08 2013-05-14 Qualcomm Incorporated Method and apparatus for adjustments for delta-based power control in wireless communication systems
US8296135B2 (en) * 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
CA2678828A1 (en) * 2008-09-15 2010-03-15 Johnson Controls Technology Company Hvac controller user interfaces
US20100205628A1 (en) * 2009-02-12 2010-08-12 Davis Bruce L Media processing methods and arrangements
KR101344435B1 (ko) * 2009-07-27 2013-12-26 에스씨티아이 홀딩스, 인크. 음성의 표적화 및 잡음의 무시에 의한 음성 신호의 프로세싱에 있어서 잡음 감소를 위한 시스템 및 방법
US8762139B2 (en) * 2010-09-21 2014-06-24 Mitsubishi Electric Corporation Noise suppression device
US8818806B2 (en) * 2010-11-30 2014-08-26 JVC Kenwood Corporation Speech processing apparatus and speech processing method
JP6076981B2 (ja) * 2011-08-19 2017-02-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 異なるモダリティのx線画像の周波数依存複合
CN104662605A (zh) * 2012-07-25 2015-05-27 株式会社尼康 信号处理装置、拍摄装置及程序
FR2999776B1 (fr) * 2012-12-19 2015-01-09 Electricite De France Procede d'evaluation du colmatage d'un echangeur thermique
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
CA2916150C (en) * 2013-06-21 2019-06-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for tcx ltp
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN104215265A (zh) * 2014-08-18 2014-12-17 中国空间技术研究院 一种高精度的psd信号降噪方法
EP3185750B1 (en) * 2014-08-25 2020-04-08 Drägerwerk AG & Co. KGaA Rejecting noise in a signal
US10242690B2 (en) 2014-12-12 2019-03-26 Nuance Communications, Inc. System and method for speech enhancement using a coherent to diffuse sound ratio
CN104637489B (zh) * 2015-01-21 2018-08-21 华为技术有限公司 声音信号处理的方法和装置
US9847093B2 (en) * 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
CN106328154B (zh) * 2015-06-30 2019-09-17 芋头科技(杭州)有限公司 一种前端音频处理系统
CN105390142B (zh) * 2015-12-17 2019-04-05 广州大学 一种数字助听器语音噪声消除方法
CN105743818A (zh) * 2016-02-03 2016-07-06 国网智能电网研究院 一种分配方法
CN105788607B (zh) * 2016-05-20 2020-01-03 中国科学技术大学 应用于双麦克风阵列的语音增强方法
CN105845146B (zh) * 2016-05-23 2019-09-06 珠海市杰理科技股份有限公司 语音信号处理的方法及装置
WO2017218386A1 (en) * 2016-06-13 2017-12-21 Med-El Elektromedizinische Geraete Gmbh Recursive noise power estimation with noise model adaptation
CN109427345B (zh) * 2017-08-29 2022-12-02 杭州海康威视数字技术股份有限公司 一种风噪检测方法、装置及系统
FR3086451B1 (fr) * 2018-09-20 2021-04-30 Sagemcom Broadband Sas Filtrage d'un signal sonore acquis par un systeme de reconnaissance vocale
CN110010144A (zh) * 2019-04-24 2019-07-12 厦门亿联网络技术股份有限公司 语音信号增强方法及装置
CN113015050B (zh) * 2019-12-20 2022-11-22 瑞昱半导体股份有限公司 具有抗噪机制的音频播放装置及方法
US20210012767A1 (en) * 2020-09-25 2021-01-14 Intel Corporation Real-time dynamic noise reduction using convolutional networks
CN112242148B (zh) * 2020-11-12 2023-06-16 北京声加科技有限公司 一种基于头戴式耳机的风噪抑制方法及装置
CN112767962B (zh) * 2021-03-01 2021-08-03 北京电信易通信息技术股份有限公司 一种语音增强方法及系统
CN113270113B (zh) * 2021-05-18 2021-12-03 北京理工大学 一种声音信号混杂度的识别方法及系统
WO2022256577A1 (en) * 2021-06-02 2022-12-08 Board Of Regents, The University Of Texas System A method of speech enhancement and a mobile computing device implementing the method

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
FR2764469B1 (fr) * 1997-06-09 2002-07-12 France Telecom Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son
FR2765715B1 (fr) * 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
FR2768546B1 (fr) 1997-09-18 2000-07-21 Matra Communication Procede de debruitage d'un signal de parole numerique
FR2771542B1 (fr) * 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6459914B1 (en) * 1998-05-27 2002-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
FR2820227B1 (fr) * 2001-01-30 2003-04-18 France Telecom Procede et dispositif de reduction de bruit
JP3960834B2 (ja) 2002-03-19 2007-08-15 松下電器産業株式会社 音声強調装置及び音声強調方法
US7054453B2 (en) * 2002-03-29 2006-05-30 Everest Biomedical Instruments Co. Fast estimation of weak bio-signals using novel algorithms for generating multiple additional data frames
GB2398913B (en) 2003-02-27 2005-08-17 Motorola Inc Noise estimation in speech recognition
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression

Also Published As

Publication number Publication date
JP5068653B2 (ja) 2012-11-07
CN101031963A (zh) 2007-09-05
ES2349718T3 (es) 2011-01-10
EP1789956B1 (fr) 2010-08-04
JP2008513819A (ja) 2008-05-01
US20070255535A1 (en) 2007-11-01
KR101168002B1 (ko) 2012-07-26
ATE476733T1 (de) 2010-08-15
US7359838B2 (en) 2008-04-15
DE602005022735D1 (de) 2010-09-16
EP1789956A1 (fr) 2007-05-30
WO2006032760A1 (fr) 2006-03-30
CN101031963B (zh) 2010-09-15

Similar Documents

Publication Publication Date Title
KR101168002B1 (ko) 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치
KR101141033B1 (ko) 스피치 개선을 위한 노이즈 분산 추정기
TWI421856B (zh) 使用感知模型之語音增強技術
US7313518B2 (en) Noise reduction method and device using two pass filtering
US7133825B2 (en) Computationally efficient background noise suppressor for speech coding and speech recognition
JP4861645B2 (ja) スピーチノイズサプレッサ、スピーチノイズ抑圧方法、および、スピーチ信号におけるノイズ抑圧方法
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
WO2000036592A1 (en) Improved noise spectrum tracking for speech enhancement
WO2009043066A1 (en) Method and device for low-latency auditory model-based single-channel speech enhancement
KR20070078171A (ko) 신호대 잡음비에 의한 억제 정도 조절을 이용한 잡음 제거장치 및 그 방법
KR20110024969A (ko) 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법
KR20110061781A (ko) 실시간 잡음 추정에 기반하여 잡음을 제거하는 음성 처리 장치 및 방법
JP3917116B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
JP4094522B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
Schmitt et al. Single Channel Noise Reduction for Hands Free Operation in Automotive Environments
Krishnamoorthy et al. Processing noisy speech for enhancement
CN117116282A (zh) 同一声学空间交流增强语音信号的处理方法、装置及介质
Thanhikam Single Channel Speech Enhancement Based on Speech and Noise Spectral Models

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160630

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170710

Year of fee payment: 6