KR101462293B1 - 고정된 배경 잡음의 평활화를 위한 방법 및 장치 - Google Patents

고정된 배경 잡음의 평활화를 위한 방법 및 장치 Download PDF

Info

Publication number
KR101462293B1
KR101462293B1 KR1020097020591A KR20097020591A KR101462293B1 KR 101462293 B1 KR101462293 B1 KR 101462293B1 KR 1020097020591 A KR1020097020591 A KR 1020097020591A KR 20097020591 A KR20097020591 A KR 20097020591A KR 101462293 B1 KR101462293 B1 KR 101462293B1
Authority
KR
South Korea
Prior art keywords
signal
excitation signal
lpc
excitation
speech
Prior art date
Application number
KR1020097020591A
Other languages
English (en)
Other versions
KR20090129450A (ko
Inventor
스테판 브룬
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20090129450A publication Critical patent/KR20090129450A/ko
Application granted granted Critical
Publication of KR101462293B1 publication Critical patent/KR101462293B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Abstract

전기통신 음성 세션에서 배경 잡음을 평활화하는 방법은 음성 세션을 나타내는 신호를 수신하여 디코딩하는 단계(S10)를 포함하고, 상기 신호는 음성 컴포넌트 및 배경 잡음 컴포넌트 둘 모두를 포함한다. 그 후, 수신된 신호에 대하여 LPC 파라미터를 결정하는 단계(S20) 및 여기 신호를 결정하는 단계(S30)를 포함한다. 그 후, 결정된 LPC 파라미터 및 여기 신호에 기초하여 출력 신호를 합성하여 출력하는 단계(S40)를 포함한다. 게다가, 여기 신호의 파워 및 스펙트럼 변동을 감소시킴으로써 결정된 여기 신호를 변경하여(S35) 평활화된 출력 신호를 제공하는 단계를 포함한다.
음성 세션, 배경 잡음, 스펙트럼 변동, 여기 신호, 선형 예측 코더.

Description

고정된 배경 잡음의 평활화를 위한 방법 및 장치{METHOD AND ARRANGEMENT FOR SMOOTHING OF STATIONARY BACKGROUND NOISE}
본 발명은 일반적으로 전기통신 시스템에서의 음성 코딩에 관한 것이며, 특히 이와 같은 시스템에서 고정된 배경 잡음의 평활화를 위한 방법 및 장치에 관한 것이다.
음성 코딩은 대역-제한된 유선 및 무선 채널 및/또는 저장장치를 통한 효율적인 송신을 위해 음성 신호의 콤팩트한 표현을 획득하는 프로세스이다. 오늘날, 음성 코더는 전기통신 및 멀티미디어 기반구조에서 필수적인 컴포넌트가 되었다. 효율적인 음성 코딩에 의존하는 상업적인 시스템은 셀룰러 통신, VOIP(voice over internet protocol), 화상회의, 전자 완구, 아카이빙(archiving) 및 DSVD(digital simultaneous voice and data), 뿐만 아니라, 다수의 PC-기반 게임 및 멀티미디어 애플리케이션을 포함한다.
연속적인 시간 신호이기 때문에, 음성은 샘플링(sampling) 및 양자화의 프로세스를 통하여 디지털로 표현될 수 있다. 음성 샘플은 전형적으로 16-비트 또는 8-비트 양자화를 사용하여 양자화된다. 많은 다른 신호와 마찬가지로, 음성 신호는 리던던트(redundant)이거나(신호 내의 연속적인 샘플 사이의 제로가 아닌 상호 정 보) 또는 지각적으로 무관한(인간 청취자에 의해 지각되지 않는 정보) 다량의 정보를 포함한다. 대부분의 전기통신 코더는 손실이 많은데, 이는 합성된 음성이 원본과 지각적으로 유사하지만, 물리적으로 유사하지 않을 수 있다는 것을 의미한다.
음성 코더는 디지털화된 음성 신호를 통상적으로 프레임으로 송신되는 코딩된 표현으로 변환한다. 대응적으로, 음성 디코더는 코딩된 프레임을 수신하고, 재구성된 음성을 합성한다.
많은 현대의 음성 코더는 LPC(선형 예측 코더)로서 공지되어 있는 큰 클래스의 음성 코더에 속한다. 이와 같은 코어의 몇 가지 예는: 3GPP FR, EFR, AMR 및 AMR-WB 음성 코덱, 3GPP2 EVRC, SMV 및 EVRC-WB 음성 코덱, 및 G.728, G.723, G.729와 같은 다양한 ITU-T 코덱이다.
이러한 코더는 모두 신호 발생 프로세스에서 합성 필터 개념을 사용한다. 필터는 재생성되어야 하는 신호의 단-시간 스펙트럼을 모델링하는데 사용되지만, 필터로의 입력이 모든 다른 신호 변화를 취급하는 것으로 가정된다.
이러한 합성 필터 모델의 공통적인 특징은 재생될 신호가 합성 필터를 규정하는 파라미터에 의해 표현된다는 것이다. 용어 "선형 예측"은 필터 파라미터를 추정하는데 종종 사용되는 방법의 클래스를 칭한다. LPC 기반 코더에서, 음성 신호는 입력이 필터로의 여기 신호인 선형 시-불변(LTI) 시스템의 출력으로서 간주된다. 따라서, 재생될 신호는 부분적으로는 한 세트의 필터 파라미터에 의하여, 그리고 부분적으로는 필터를 구동시키는 여기 신호에 의하여 표현된다. 이와 같은 코딩 개념의 장점은 필터 및 이의 구동 여기 신호 둘 모두가 상대적으로 적은 비트로 효율 적으로 기술될 수 있다는 사실에 기인한다.
LPC 기반 코덱의 하나의 특정 클래스는 소위 합성에 의한 분석(analysis-by-synthesis: AbS) 원리에 기초한다. 이러한 코덱은 인코더 내에 디코더의 로컬 카피(local copy)를 통합하고, 합성된 출력 신호의 원래 음성 신호와의 유사성을 최대화하는 여기 신호를 한 세트의 후보 여기 신호 사이에서 선택함으로써 합성 필터의 구동 여기 신호를 찾아낸다.
이와 같은 선형 예측 코딩 및 특히 AbS 코딩을 사용하는 개념은 예를 들어, 4 내지 12kbps의 낮은 비트 레이트에서도 음성 신호에 대해 상대적으로 양호하게 동작한다는 것이 입증되었다. 그러나, 이와 같은 코딩 기술을 사용하는 이동 전화의 사용자가 사일런트(silent)하고 입력 신호가 주변 사운드, 예를 들어, 잡음을 포함할 때, 현재 공지되어 있는 코더는 자신이 음성 신호에 대해 최적화되기 때문에 이 상황을 극복하는데 어려움을 갖는다. 수신측 상의 청취자는 친근한 배경 사운드가 코더에 의하여 "잘못취급"되기 때문에 친근한 배경 사운드가 인식될 수 없을 때 용이하게 성가심을 겪을 수 있다.
소위 스월링(swirling)은 재생된 배경 사운드에서 가장 심한 품질 저하 중 하나를 초래한다. 이것은 차량 잡음과 같은 상대적으로 고정된 배경 잡음 사운드에서 발생하는 현상이며, 디코딩된 신호의 스펙트럼 및 파워의 부자연스러운 시간적인 변동(flutuation)에 기인한다. 이러한 변동은 차례로 합성 필터 계수 및 이의 여기 신호의 부적절한 추정 및 양자화에 기인한다. 통상적으로, 스월링은 코덱 비트 레이트가 증가할 때 더 적어진다.
스월링은 종래 기술에서 문제로서 식별되었고, 이에 대한 다수의 해결책에 문헌에서 제안되었다. 제한된 해결책 중 하나는 US 특허 5632004 [1]에 설명되어 있다. 이 특허에 따르면, 음성 비활동 동안, 필터 파라미터가 저역 통과 필터링 또는 대역폭 확장에 의하여 변경되어, 합성된 배경 사운드의 스펙트럼 변화가 감소된다. 이 방법은 US 특허 5579432 [2]에서 개정되어, 설명된 안티-스월링 기술이 배경 잡음의 검출된 고정부 상에만 적용된다.
스월링 문제를 처리하는 하나의 부가적인 방법은 US 특허 5487087 [3]에 설명되어 있다. 이 방법은 신호 자체 및 이의 시간적인 변화 둘 모두를 정합시키는 변경된 신호 양자화 방법을 사용한다. 특히, 비활성 음성의 기간 동안 LPC 필터 파라미터 및 신호 이득 파라미터에 대해 이와 같은 감소된-변동 양자화기를 사용하는 것이 계획된다.
합성된 신호의 바람직하지 않은 파워 변동에 기인하는 신호 품질 저하는 또 다른 세트의 방법에 의해 처리된다. 이들 중 하나는 US 특허 6275798 [4]에 설명되어 있고, 3GGP TS 26.090 [5]에 설명되어 있는 AMR 음성 코덱 알고리즘의 일부이다. 이에 따르면, 합성된 필터 여기 신호, 고정된 코드북 구성 중 적어도 하나의 컴포넌트의 이득이 LPC 단기 스펙트럼의 안정성(stationarity)에 따라 적응형으로 평활화된다. 이 방법은 평활화가 신호 합성에서 사용될 이득의 제한을 부가적으로 포함하는 특허 EP 1096476 [6] 및 특허 출원 EP 1688920 [7]에서 전개되었다. LPC 보코더에서 사용될 관련 방법이 US 5953697 [8]에 설명되어 있다. 이에 따르면, 합성 필터의 여기 신호의 이득은 합성 음성의 최대 진폭이 입력 음성 파형 인벨 롭(envelop)에 도달하도록 제어된다.
스월링 문제를 처리하는 또 다른 클래스의 방법은 음성 디코더 다음의 포스트 프로세서(post process)로서 동작한다. 특허 EP 0665530 [9]는 검출된 음성 비활동 동안, 저역 통과 필터링된 백색 잡음 또는 컴포트 잡음 신호(comfort noise signal)에 의해 음성 디코더 출력 신호의 일부를 교체하는 방법을 설명한다. 유사한 방법이 음성 디코더 출력 신호의 부분을 필터링된 잡음으로 교체하는 관련 방법을 개시하는 다양한 간행물에서 취해진다.
도 1을 참조하면, 스케일링 가능하거나 임베딩된 코딩은 코딩이 계층에서 수행되는 코딩 패러다임(coding paradigm)이다. 베이스 또는 코어 계층은 낮은 비트 레이트로 신호를 인코딩하는 반면, 각각 다른 것의 상부 상에 있는 추가적인 계층은 코어로부터 각각의 이전 계층까지의 모든 계층으로 성취되는 코딩에 관한 어떤 강화를 제공한다. 각각의 계층은 어떤 추가적인 비트 레이트를 추가한다. 발생된 비트 스트림은 임베딩되는데, 이는 하위-계층 인코딩의 비트 스트림이 상위 계층의 비트 스트림 내로 임베딩된다는 것을 의미한다. 이 특성은 송신에서 또는 수신기에서 어디서나 상위 계층에 속하는 비트를 드롭하는 것을 가능하게 한다. 이와 같은 스트립된 비트 스트림은 여전히 비트가 유지되는 계층까지 디코딩될 수 있다.
오늘날의 대부분의 통상적인 스케일링 가능한 음성 압축 알고리즘은 64kpbs G.711 A/U-법칙 알고리즘 PCM 코덱이다. 8kHz 샘플링된 G.711 코덱은 12 비트 또는 13 비트 선형 PCM 샘플을 8 비트 로그 샘플로 변환한다. 로그 샘플의 순서화된 비트 표현은 G.711 비트 스트림에서 최하위 비트(LBS)를 스틸(steal)하는 것을 허용 하여, G.711 코더를 48, 56 및 64kbps 사이에서 부분적으로 SNR-스케일링 가능하도록 한다. G.711 코덱의 이 스케일러빌리티 특성(scalability property)은 대역내 제어 시그널링 목적을 위하여 회선 교환 통신 네트워크에서 사용된다. 이 G.711 스케일링 특성의 최근의 사용 예는 레거시 64kbps PCM 링크를 통한 광대역 음성 설정 및 전송을 가능하게 하는 3GPP TFO 프로토콜이다. 원래 64kbps G.711 스트림의 8 kbps는 협대역 서비스 품질에 상당히 영향을 줌이 없이 광대역 음성 서비스의 호출 설정을 허용하기 위하여 초기에 사용된다. 호출 설정 이후에, 광대역 음성은 64kbps 스트림의 16kbps를 사용할 것이다. 개방-루프 스케일러비리티를 지원하는 다른 구식의 음성 코딩 표준은 G.727(임베딩된 ADPCM) 및 어떤 확장 G.722(서브-대역 ADPCM)이다.
스케일링 가능한 음성 코딩 기술에서의 더 최근의 진보는 MPEG4-CELP에 대한 스케일러빌리티 확장을 제공하는 MPEG-4 표준이다. MPE 베이스 계층은 추가적인 필터 파라미터 정보 또는 추가적인 혁신 파라미터 정보의 송신에 의하여 강화될 수 있다. 국제 전기통신 연합-표준화 섹터(ITU-T)는 최근에 새로운 스케일링 가능한 코덱(닉네임이 G.729.EV인 G.729.1)의 표준화를 종료하였다. 이 스케일링 가능한 음성 코덱의 비트 레이트 범위는 8kbps로부터 32kbps까지이다. 이 코덱에 대한 주요 사용 경우는 가정 또는 사무실 게이트웨이에서 제한된 대역폭 자원의 효율적인 공유하는 것이다(예를 들어, 여러 VOIP 호출 사이의 공유된 xDSL 64/128kbps).
스케일링 가능한 음성 코딩의 하나의 최근의 추세는 음악과 같은 비-음성 오디오 신호의 코딩을 지원하는 상위 계층을 제공하는 것이다. 이와 같은 코덱에서, 하위 계층은 예를 들어, CELP가 전형적인 예인 합성에 의한 분석 패러다임에 따라 단지 종래의 음성 코딩을 사용한다. 이와 같은 코딩이 음성에 대해서 매우 적합할 뿐만 아니라, 음악과 같은 비-음성 오디오 신호에 대해서도 많이 적합하기 때문에, 상위 계층은 오디오 코덱에서 사용되는 코딩 패러다임에 따라 동작한다. 여기서, 전형적으로, 상위 계층 인코딩은 하위-계층 인코딩의 코딩 에러 시에 동작한다.
음성 코덱에 관한 또 다른 관련 방법은 디코딩된 음성의 적응형 포스트 필터링(adaptive post filtering)의 콘텍스트에서 행해지는 소위 스펙트럼 틸트 보상(spectral tilt compensation)이다. 이것에 의해 해결되는 문제는 단기 또는 포먼트 포스트 필터(formant post filter)에 의해 도입되는 스펙트럼 틸트를 보상하는 것이다. 이와 같은 기술은 예를 들어, AMR 코덱 및 SMV 코덱의 일부이며, 주로 이의 배경 잡음 성능이라기보다는 오히려 음성 동안 코덱의 성능을 목표로 한다. SMV 코덱은 나머지의 LPC 분석에 응답하지 않는 것으로 통한 합성 필터링 이전에 가중된 나머지 도메인에서 이 틸트 보상을 적용한다.
US 5632004, US 5579432, 및 US 5487087의 상술된 방법에 의한 문제는 상기 방법이 LPC 합성 필터 여기가 백색(즉, 평활) 스펙트럼을 가지며 스월링 문제를 초래하는 모든 스펙트럼 변동이 LPC 합성 필터 스펙트럼의 변동과 관련된다고 가정하는 것이다. 그러나, 이것은 사실이 아니며, 특히 여기 신호가 단지 정확하지 않게 양자화되는 경우에 사실이 아니다. 그 경우에, 여기 신호의 스펙트럼 변동은 LPC 필터 변동과 유사한 효과를 가지므로, 피해질 필요가 있다.
합성된 신호의 바람직하지 않은 파워 변동을 처리하는 방법에 의한 문제는 상기 방법이 단지 스월링 문제의 한 부분만을 처리하지만, 스펙트럼 변동과 관련된 해결책을 제공하지 않는다는 것이다. 스펙트럼 변동을 처리하는 언급된 방법의 결합에 의해서도, 고정된 배경 사운드 동안 여전히 모든 스월링 관련 신호 품질 저하기 피해질 수는 없다는 것이 시뮬레이션을 통해 제시되었다.
음성 디코더 이후의 포스트 프로세서로서 동작하는 방법에 의한 하나의 문제는 상기 방법이 음성 디코딩된 출력 신호의 일부만을 평활화된 잡음 신호로 교체한다는 것이다. 그러므로, 스월링 문제는 음성 디코더로부터 발생되는 나머지 신호 부분에서 해결되지 않으므로, 최종적인 출력 신호는 음성 디코더 출력 신호와 동일한 LPC 합성 필터를 사용하여 형상화되지 않는다. 이것은 특히 비활동으로부터 활성 음성으로의 전이 동안 가능한 사운드 불연속을 초래할 수 있다. 게다가, 이와 같은 포스트 프로세싱 방법은 상대적으로 높은 계산적인 복잡성을 필요로 하기 때문에 유용하지 않다.
기존 방법 중 어느 것도 스월링에 대한 이유 중 하나가 LPC 합성 필터의 여기 신호의 스펙트럼 변동에 있는 문제에 대한 해결책을 제공하지 못한다. 이 문제는 특히 전형적으로 12kbps 또는 그 이하의 비트 레이트로 동작하는 음성 코덱에 대한 경우인, 여기 신호가 너무 적은 비트로 표현되는 경우에 심해진다.
결과적으로, 음성 비활동의 기간 동안 고정된 배경 잡음에 기인하는 스월링에 의한 상술된 문제를 경감시키는 방법 및 장치가 필요하다.
본 발명의 목적은 전기통신 시스템에서 음성 신호의 개선된 품질을 제공하는 것이다.
부가적인 목적은 고정된 배경 잡음을 갖는 음성 비활동의 기간 동안 음성 디코더 출력 신호의 강화된 품질을 제공하는 것이다.
본 발명은 전기통신 음성 세션에서 배경 잡음을 평활화하는 방법 및 장치를 개시한다. 기본적으로, 본 발명에 따른 방법은 음성 세션을 나타내는 신호를 수신하여 디코딩하는 단계(S10)를 포함하며, 상기 신호는 음성 컴포넌트 및 배경 잡음 컴포넌트 둘 모두를 포함한다. 그 후, 수신된 신호에 대하여 LPC 파라미터를 결정하는 단계(S20) 및 여기 신호를 결정하는 단계(S30)를 포함한다. 그 후, 결정된 LPC 파라미터 및 여기 신호에 기초하여 출력 신호를 합성하여 출력하는 단계(S40)를 포함한다. 게다가, 합성 단계 전에, 여기 신호의 파워 및 스펙트럼 변동을 감소시킴으로써 결정된 여기 신호를 변경하여(S35) 평활화된 출력 신호를 제공하는 단계를 포함한다.
본 발명의 장점은:
개선된 음성 디코더 출력 신호를 가능하게 하는 것;
평활한 음성 디코더 출력 신호를 가능하게 하는 것을 포함한다.
본 발명의 부가적인 목적 및 장점과 함께, 본 발명은 첨부 도면과 함께 취해진 다음의 설명을 참조함으로써 가장 양호하게 이해될 수 있다.
도 1은 스케일링 가능한 음성 및 오디오 코덱의 블록도.
도 2는 본 발명에 따른 방법의 실시예를 도시한 흐름도.
도 3은 본 발명에 따른 방법의 부가적인 실시예를 도시한 흐름도.
도 4는 본 발명에 따른 방법의 실시예를 도시한 블록도.
도 5는 본 발명에 따른 장치의 실시예의 도면.
약어
AbS 합성에 의한 분석
ADPCM 적응형 차동 PCM
AMR-WB 적응형 다중 레이트 광대역
EVRC-WB 강화된 가변 레이트 광대역 코덱
CELP 코드 여기 선형 예측
ISP 이미턴스 스펙트럼 쌍
ITU-T 국제 전기통신 연합
LPC 선형 예측 코더
LSF 라인 스펙트럼 주파수
MPEG 이동 픽처 전문가 그룹
PCM 멀스 코드 변조
SMV 선택 가능한 모드 보코더
VAD 음성 활동 검출기
본 발명은 일반적인 전기통신 시스템에서 음성 세션, 예를 들어, 전화 호출의 콘텍스트에서 설명될 것이다. 전형적으로, 방법 및 장치는 음성 합성에 적합한 디코더에서 구현될 것이다. 그러나, 방법 및 장치가 네트워크 내의 중간 노드에서 구현되고 목표화된 사용자로 나중에 송신되는 것이 동등하게 가능하다. 전기통신 시스템은 무선 및 유선 둘 모두일 수 있다.
결과적으로, 본 발명은 전화 음성 세션에서 음성 비활동의 기간 동안 고정된 배경 잡음에 기인하는 스월링에 의한 상술된 공지되어 있는 문제를 경감시키는 방법 및 장치를 가능하게 한다. 구체적으로, 본 발명은 고정된 배경 잡음을 갖는 음성 비활동의 기간 동안 음성 디코더 출력 신호의 품질을 강화시키는 것을 가능하게 한다.
본 명세서 내에서, 용어 음성 세션은 전기통신 시스템을 통한 음성 신호의 임의의 교환으로서 해석되어야 한다. 따라서, 음성 세션 신호는 활성 부분 및 배경 부분을 포함하는 것으로 설명될 수 있다. 활성 부분은 세션의 실제 음성 신호이다. 배경 부분은 배경 잡음이라고도 칭해지는 사용자에서의 주변 잡음이다. 비활동 기간은 활성 부분이 존재하지 않고, 단지 배경 부분만 존재하는, 예를 들어, 세션의 음성 부분이 비활성인 음성 세션 내의 시간 기간으로서 규정된다.
기본적인 실시예에 따르면, 본 발명은 음성 비활동의 검출 기간 동안 LPC 합성 필터 여기 신호의 파워 변화 및 스펙트럼 변동을 감소시킴으로써 음성 세션의 품질을 개선시키는 것을 가능하게 한다.
부가적인 실시예에 따르면, 출력 신호는 여기 신호 변경을 LPC 파라미터 평활화 동작과 결합함으로써 더 개선된다.
도 2의 흐름도를 참조하면, 본 발명에 따른 방법의 실시예는 음성 세션을 나 타내는(즉, 활성 음성 신호 형태의 음성 컴포넌트 및/또는 고정된 배경 잡음 컴포넌트를 포함하는) 신호를 수신하여 디코딩하는 단계(S10)를 포함한다. 그 후, 수신된 신호에 대해 한 세트의 LPC 파라미터가 결정된다(S20). 게다가, 수신된 신호에 대해 여기 신호가 결정된다(S30). 결정된 LPC 파라미터 및 결정된 여기 신호에 기초하여 출력 신호가 합성되어 출력된다(S40). 본 발명에 따르면, 여기 신호는 여기 신호의 파워 및 스펙트럼 변동을 감소시킴으로써 개선 또는 변경되어(S35) 평활화된 출력 신호를 제공한다.
도 3의 흐름도를 참조하여, 본 발명에 따른 방법의 부가적인 실시예가 설명될 것이다. 대응하는 단계는 도 2와 동일한 참조 번호를 유지한다. 상술된 실시예의 여기 신호를 변경시키는 단계 이외에, 결정된 세트의 LPC 파라미터가 또한 변경 동작(S25), 예를 들어, LPC 파라미터 평활화를 겪는다.
도 4를 참조하면, 본 발명의 부가적인 실시예에 따른 LPC 파라미터 평활화(S25)는 평활화의 정도가 이후에 잡음도 팩터(noisiness factor)라고 칭해지는 파라미터로부터 도출되는 어떤 팩터(β)에 의해 제어되는 방식으로 LPC 파라미터 평활화를 수행하는 것을 포함한다.
제 1 단계에서, 저역 통과 필터링된 세트의 LPC 파라미터가 계산된다(S20). 바람직하게는, 이것은 다음:
Figure 112009060533763-pct00001
(1)
에 따른 1차 자동회귀 필터링(autoregressive filtering)에 의해 행해진다.
여기서
Figure 112009060533763-pct00002
는 현재 프레임(n)에 대해 획득된 저역 통과 필터링된 LPC 파라미터 벡터를 나타내고, a(n)은 프레임(n)에 대한 디코딩된 LPC 파라미터 벡터이며, λ는 평활화의 정도를 제어하는 가중 팩터이다. λ에 대한 적절한 선택은 0.9이다.
제 2 단계(S25)에서, 저역 통과 필터링된 LPC 파라미터 벡터(
Figure 112009060533763-pct00003
) 및 디코딩된 LPC 파라미터 벡터(a(n))의 가중된 결합은 다음:
Figure 112009060533763-pct00004
(2)
에 따라 평활화 제어 팩터(β)를 사용하여 계산된다.
LPC 파라미터는 필터링 및 보간에 적합한 임의의 표현일 수 있고, 바람직하게는 라인 스펙트럼 주파수(LSF) 또는 이미턴스 스펙트럼 쌍(ISP)으로서 표현될 수 있다.
전형적으로, 음성 디코더는 바람직하게는 또한 저역-통과 필터링된 LPC 파라미터가 이에 따라 보간되는 서프-프레임에 걸쳐 LPC 파라미터를 보간할 수 있다. 하나의 특정 실시예에서, 음성 디코더는 20ms의 프레임 및 각각 프레임 내의 5ms의 5개의 서브프레임과 함께 동작한다. 음성 디코더가 원래 이전 프레임의 종단-프레임 LPC 파라미터 벡터(a(n-1)), 중간 프레임 LPC 파라미터 벡터(am(n)) 및 현재 프레임의 종단-프레임 LPC 파라미터 벡터(a(n)) 사이를 보간함으로써 4개의 서브프레임 LPC 파라미터 벡터를 계산하는 경우에, 저역 통과 필터링된 LPC 파라미터 벡터 및 디코딩된 LPC 파라미터 벡터의 가중된 결합이 다음과 같이 계산된다:
Figure 112009060533763-pct00005
(3)
Figure 112009060533763-pct00006
(4)
Figure 112009060533763-pct00007
(5)
그 후, 원래 디코딩된 LPC 파라미터 벡터(a(n-1), am(n) 및 a(n)) 대신에, 이러한 평활화된 LPC 파라미터 벡터가 서브-프레임 보간에 사용된다.
상술된 바와 같이, 본 발명의 중요한 요소는 음성 비활동의 기간 동안 LPC 필터 여기 신호의 파워 및 스펙트럼 변동의 감소이다. 본 발명의 바람직한 실시예에 따르면, 여기 신호가 스펙트럼 틸트에서 더 적은 변동을 가지고 본질적으로 기존의 스펙트럼 틸트가 보상되도록 변경이 행해진다.
결과적으로, 많은 음성 코덱(및 특히 AbS 코덱)이 반드시 틸트가 없거나 백색의 여기 신호를 생성하지는 않는다는 점이 본 발명자에 의해 고려 및 인식된다. 오히려, 본 발명자는 특히 낮은-레이트 음성 코더의 경우에, 프레임들 마다의 여기 신호의 스펙트럼 틸트의 상당한 변동을 초래할 수 있는 합성 신호에 원래 입력 신호를 정합시키기 위한 목적으로 여기를 최적화시킨다.
틸트 보상은 다음:
Figure 112009060533763-pct00008
(6)
에 따라 틸트 보상 필터(또는 화이트닝 필터(whitening filter)(H(z))로 행해질 수 있다.
이 필터의 계수(ai)는 원래 여기 신호의 LPC 계수로서 용이하게 계산된다. 예측기 차수(P)의 적절한 선택은 1이며, 이 경우에, 화이트닝이라기보다는 오히려 본질적으로 단지 틸트 보상이 수행된다. 이 경우에, 계수(a1)는:
Figure 112009060533763-pct00009
(7)로서 계산되고,
여기서 re(0) 및 re(1)은 원래 LPC 합성 필터 여기 신호의 0차 및 1차 자동상관 계수이다.
설명된 틸트 보상 또는 화이트닝 동작은 바람직하게는 각각의 프레임에 대해 적어도 한번 또는 각각의 서브프레임에 대해 한번 행해진다.
대안적인 특정 실시예에 따르면, 여기 신호의 파워 및 스펙트럼 변동은 또한 여기 신호의 일부를 백색 잡음 신호로 교체함으로써 감소될 수 있다. 이를 위해, 우선 적절하게 스케일링된 랜덤 시퀀스가 발생된다. 스케일링은 자신의 파워가 여기 신호의 파워 또는 여기 신호의 평활화된 파워와 동일하도록 행해진다. 후자의 경우가 바람직하고, 평활화는 여기 신호 파워의 추정치 및 이로부터 도출된 여기 이득 팩터의 저역 통과 필터링에 의해 행해질 수 있다. 따라서, 평활화되지 않은 이득 팩터(g(n))가 여기 신호의 파워의 제곱근으로서 계산된다. 그 후, 저역 통과 필터링이 다음:
Figure 112009060533763-pct00010
(8)
에 따라 바람직하게는 1-차 자동회귀 필터링에 의해 수행된다.
여기서
Figure 112009060533763-pct00011
은 현재 프레임(n)에 대해 획득된 저역 통과 필터링된 이득 팩터이고, κ는 평활화의 정도를 제어하는 가중 팩터이다. κ에 대한 적절한 선택은 0.9이다. 원래 랜덤 시퀀스가 1의 표준화된 파워(분산)를 갖는 경우에, 잡음 신호(r)로의 스케일링 이후에, 이의 파워는 여기 신호의 파워 또는 여기 신호의 평활화된 파워에 대응한다. 이득 팩터의 평활화 동작이 또한 다음:
Figure 112009060533763-pct00012
(9)
에 따라 로그 도메인에서 행해질 수 있다는 점이 주의된다.
다음 단계에서, 여기 신호가 잡음 신호와 결합된다. 이를 위해, 여기 신호(e)가 어떤 팩터(α)만큼 스케일링되고, 잡음 신호(r)가 어떤 팩터(β)만큼 스케일링되고 나서, 2개의 스케일링된 신호가 가산된다:
Figure 112009060533763-pct00013
(10)
팩터(β)는 LPC 파라미터 평활화에 사용된 제어 팩터(β)에 대응할 수 있지만, 반드시 대응할 필요는 없다. 상기 팩터는 다시 잡음도 팩터라고 칭해지는 파라미터로부터 도출될 수 있다. 바람직한 실시예에 따르면, 팩터(β)는 1-α로서 선택된다. 그 경우에, α에 대한 적절한 선택은 1 이하일지라도 0.5 또는 그 이상이다. 그러나, α가 1과 동일하지 않다면, 신호(
Figure 112009060533763-pct00014
)가 여기 신호(e)보다 더 작은 파워를 갖는다는 것이 관측된다. 이 효과는 이어서 비활성 및 활성 음성 사이의 전이에서 합성된 출력 신호에서 바람직하지 않은 불연속을 초래할 수 있다. 이 문제를 해결하기 위하여, e 및 r이 일반적으로 통계적으로 무관한 랜덤 시퀀스이라는 것이 고려되어야 한다. 결과적으로, 변경된 여기 신호의 파워는 다음과 같이 팩터(α) 및 여기 신호(e)와 잡음 신호(r)의 파워에 따른다:
Figure 112009060533763-pct00015
(11)
그러므로, 변경된 여기 신호가 적절한 파워를 가지는 것을 보증하기 위하여, 상기 신호는 팩터(γ)만큼 더 스케일링되어야 한다.
Figure 112009060533763-pct00016
(12)
잡음 신호의 파워 및 변경된 여기 신호의 파워가 여기 신호의 파워(P{e})와 동일하다는 (상술된 잡음 신호의 파워 평활화를 무시하는) 간소화된 가정 하에서, 팩터(γ)가 다음과 같이 선택되어야 한다는 것이 발견된다:
Figure 112009060533763-pct00017
(13)
적절한 근사화는 잡음 신호가 아니라 단지 여기 신호를 팩터(γ)와 스케일링하는 것이다:
Figure 112009060533763-pct00018
(14)
설명된 잡음 혼합 동작은 바람직하게는 각각의 프레임에 대해 한번 행해지지만, 각각의 서브-프레임에 대해서도 한번 행해질 수 있다.
신중한 조사 과정에서, 바람직하게는 여기 신호의 설명된 잡음 변경 및 설명된 틸트 보상(화이트닝)이 함께 행해진다는 것이 발견되었다. 그 경우에, 합성된 배경 잡음 신호의 가장 양호한 품질은 잡음 변경이 음성 디코더의 원래 여기 신호라기보다는 오히려 틸트 보상된 여기 신호와 함께 동작할 때 성취될 수 있다.
상기 방법이 훨씬 더 최적으로 동작하도록 하기 위하여, LPC 파라미터 평활화도 활성 음성 신호에 영향을 주지 않고 여기 변경도 활성 음성 신호에 영향을 주지 않도록 보증하는 것이 필요할 수 있다. 기본적인 실시예에 따르면, 그리고 도 4 를 참조하면, 이것은 평활화 동작이 음성 비활동를 나타내는 VAD(S50)에 응답하여 활성화되는 경우에 가능하다.
본 발명의 부가적인 바람직한 실시예는 스케일링 가능한 음성 코덱에서의 이의 애플리케이션이다. 부가적인 개선된 전체 성능은 고정된 배경 잡음의 설명된 평활화 동작을 신호가 디코딩되는 비트 레이트에 적응시키는 단계에 의해 성취될 수 있다. 바람직하게는, 평활화는 단지 낮은 레이트 하위 계층의 디코딩에서 행해지지만, 더 높은 비트 레이트에서 디코딩할 때 턴 오프(turn off)(또는 감소)된다. 이는 상위 계층이 통상적으로 다수가 스월링을 겪지 않고 평활화 동작이 심지어 디코더가 더 높은 비트 레이트에서 음성 신호를 재합성하는 충실도(fidelity)에 영향을 줄 수 있기 때문이다.
도 5를 참조하여, 본 발명에 따른 방법을 가능하게 하는 디코더 내의 장치(1)가 설명될 것이다.
장치(1)는 자신으로부터 입력 신호를 수신하고 출력 신호를 송신하는 일반적인 출력/입력 유닛(I/O)(10)을 포함한다. 상기 유닛은 바람직하게는 장치로 신호를 수신하여 디코딩하기 위한 임의의 필요한 기능을 포함한다. 또한, 장치(1)는 수신되어 디코딩된 신호에 대한 LPC 파라미터를 디코딩하여 결정하는 LPC 파라미터 유닛(20), 및 수신된 입력 신호에 대한 여기 신호를 디코딩하여 결정하는 여기 유닛(30)을 포함한다. 게다가, 장치(1)는 여기 신호의 파워 및 스펙트럼 변동을 감소시킴으로써 결정된 여기 신호를 변경하는 변경 유닛(35)을 포함한다. 최종적으로, 장치(1)는 적어도 결정된 LPC 파라미터 및 변경되는 결정된 여기 신호에 기초하여 평활화되는 합성된 음성 출력 신호를 제공하는 LPC 합성 유닛 또는 필터(40)를 포함한다.
부가적인 실시예에 따르면, 또한 도 5를 참조하면, 상기 장치는 LPC 파라미터 유닛(20)으로부터의 결정된 LPC 파라미터를 평활화하는 평활화 유닛(25)을 포함한다. 게다가, LPC 합성 유닛(40)은 적어도 평활화된 LPC 파라미터 및 변경된 여기 신호에 기초하여 합성된 음성 신호를 결정하도록 적응된다.
최종적으로, 상기 장치에는 음성 세션이 활성 음성 부분을 포함하는지, 예를 들어, 누군가가 실제로 이야기하는지, 또는 배경 잡음만이 존재하는지, 예를 들어, 사용자 중 하나가 고요하고 모바일(mobile)이 단지 배경 잡음을 기록하고 있는지를 검출하는 검출 유닛이 제공될 수 있다. 그 경우에, 상기 장치는 음성 세션의 비활성 음성 부분이 존재하는 경우에만 변경 단계를 수행하도록 적응된다. 즉, 본 발명의 평활화 동작(LPC 파라미터 평활화 및/또는 여기 신호 변경)은 음성 비활동의 기간 동안에만 수행된다.
본 발명의 장점은 다음을 포함한다:
본 발명에 의하면, 음성 비활동의 기간 동안 (차량 잡음과 같은) 고정된 배경 잡음 신호의 재구성 또는 합성된 음성 신호 품질을 개선시키는 것이 가능하다.
첨부된 청구항에 의해서 규정되는 본 발명의 범위를 벗어남이 없이 본 발명에 대해 다양한 변경 및 변화가 행해질 수 있다는 점이 당업자에 의해 이해될 것이다.
참조문헌
[1] US 특허 5632004
[2] US 특허 5579432
[3] US 특허 5487087
[4] US 특허 6275798 B1
[5] 3GPP TS 26.090, AMR 음성 코덱; 트랜스코딩 함수
[6] EP 1096476
[7] EP 1688920
[8] US 특허 595369
[9] EP 665530 B1

Claims (15)

  1. 전기통신 음성 세션에서 배경 잡음을 평활화하는 방법에 있어서:
    음성 세션을 나타내는 신호를 수신하여 디코딩하는 단계(S10)로서, 상기 신호는 음성 컴포넌트 및 배경 잡음 컴포넌트 둘 모두를 포함하는, 수신하여 디코딩하는 단계;
    상기 수신된 신호에 대한 LPC 파라미터를 결정하는 단계(S20);
    상기 수신된 신호에 대한 여기 신호를 결정하는 단계(S30);
    상기 LPC 파라미터 및 상기 여기 신호에 기초하여 출력 신호를 합성하여 출력하는 단계(S40);
    저역 통과 필터링된 세트의 LPC 파라미터를 제공하는 단계 및 상기 저역 통과 필터링된 세트 및 상기 결정된 세트의 LPC 파라미터의 가중된 결합을 결정하는 단계에 의하여 상기 결정된 세트의 LPC 파라미터를 변경하고(S25), 상기 변경된 세트의 LPC 파라미터에 기초하여 상기 합성하여 출력하는 단계를 수행하여 평활화된 출력 신호를 제공하는 단계;
    상기 여기 신호의 파워 및 스펙트럼 변동을 감소시킴으로써 상기 결정된 여기 신호를 변경하여(S35) 평활화된 출력 신호를 제공하는 단계를 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  2. 제 1 항에 있어서,
    1차 자동회귀 필터링에 의하여 상기 저역 통과 필터링을 수행하는 단계를 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  3. 제 1 항에 있어서,
    상기 여기 신호를 변경하는 단계(S35)는 틸트를 보상함으로써 상기 여기 신호의 스펙트럼을 변경하는 단계를 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  4. 제 1 항에 있어서,
    상기 여기 신호를 변경하는 단계는 상기 여기 신호의 적어도 일부를 백색 잡음 신호로 교체하는 단계를 더 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  5. 제 4 항에 있어서,
    결정된 여기 신호 또는 상기 신호를 나타내는 평활화된 여기 신호의 파워와 동일하도록 상기 백색 잡음 신호의 파워를 스케일링하는 단계, 및 변경된 여기 신호를 제공하기 위하여 결정된 여기 신호 및 스케일링된 잡음 신호를 선형으로 결합하는 단계를 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  6. 제 5 항에 있어서,
    변경된 여기 신호의 파워가 원래 여기 신호의 파워와 동일하도록 상기 선형 결합을 수행하는 단계를 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  7. 제 1 항 내지 6 항 중 어느 한 항에 있어서,
    상기 음성 컴포넌트가 활성인지 또는 비활성인지를 결정하는 단계(S50)를 더 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  8. 제 7 항에 있어서,
    상기 음성 컴포넌트가 비활성인 경우에만 상기 변경 단계(S35)를 수행하는 단계를 포함하는 것을 특징으로 하는 배경 잡음 평활화 방법.
  9. 평활화 장치에 있어서:
    음성 세션을 나타내는 신호를 수신하여 디코딩하는 수단(10)으로서, 상기 신호는 음성 컴포넌트 및 배경 잡음 컴포넌트 둘 모두를 포함하는, 수신하여 디코딩하는 수단;
    상기 수신된 신호에 대한 LPC 파라미터를 결정하는 수단(20);
    상기 수신된 신호에 대한 여기 신호를 결정하는 수단(30);
    상기 LPC 파라미터 및 상기 여기 신호에 기초하여 출력 신호를 합성하는 수단(40);
    저역 통과 필터링된 세트의 LPC 파라미터를 제공함으로써 상기 결정된 세트의 LPC 파라미터를 변경하는 수단(25)으로서, 상기 수단(25)은 상기 저역 통과 필터링된 세트 및 상기 결정된 세트의 LPC 파라미터의 가중된 결합을 결정하도록 적응되고, 상기 합성 수단(40)은 상기 변경된 세트의 LPC 파라미터에 기초하여 상기 합성하여 평활화된 출력 신호를 제공하도록 적응되는, 변경 수단; 및
    상기 여기 신호의 파워 및 스펙트럼 변동을 감소시킴으로써 상기 결정된 여기 신호를 변경하여 평활화된 출력 신호를 제공하는 수단(35)을 포함하는 것을 특징으로 하는 평활화 장치.
  10. 제 9 항에 있어서,
    상기 음성 컴포넌트의 비활성 상태를 결정하는 수단을 더 포함하는 것을 특징으로 하는 평활화 장치.
  11. 제 10 항에 있어서,
    상기 여기 신호 변경 수단(35)은 검출된 비활성 음성 컴포넌트에 응답하여 상기 변경 단계를 수행하도록 적응되는 것을 특징으로 하는 평활화 장치.
  12. 제 9 항 내지 11 항 중 어느 한 항에 따른 평활화 장치를 포함하는 전기통신 시스템 내에 디코더 유닛.
  13. 삭제
  14. 삭제
  15. 삭제
KR1020097020591A 2007-03-05 2008-02-13 고정된 배경 잡음의 평활화를 위한 방법 및 장치 KR101462293B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US89299407P 2007-03-05 2007-03-05
US60/892,994 2007-03-05
PCT/SE2008/050169 WO2008108719A1 (en) 2007-03-05 2008-02-13 Method and arrangement for smoothing of stationary background noise

Publications (2)

Publication Number Publication Date
KR20090129450A KR20090129450A (ko) 2009-12-16
KR101462293B1 true KR101462293B1 (ko) 2014-11-14

Family

ID=39738501

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097020591A KR101462293B1 (ko) 2007-03-05 2008-02-13 고정된 배경 잡음의 평활화를 위한 방법 및 장치

Country Status (10)

Country Link
US (1) US8457953B2 (ko)
EP (3) EP2945158B1 (ko)
JP (1) JP5340965B2 (ko)
KR (1) KR101462293B1 (ko)
CN (1) CN101632119B (ko)
AU (1) AU2008221657B2 (ko)
ES (2) ES2548010T3 (ko)
PL (2) PL2132731T3 (ko)
PT (1) PT2945158T (ko)
WO (1) WO2008108719A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8386266B2 (en) 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
EP2502155A4 (en) 2010-11-12 2013-12-04 Polycom Inc HIERARCHICAL AUDIO CODING IN A MULTIPOINT ENVIRONMENT
DK2774145T3 (da) * 2011-11-03 2020-07-20 Voiceage Evs Llc Forbedring af ikke-taleindhold til celp-afkoder med lav hastighed
PL2959480T3 (pl) * 2013-02-22 2016-12-30 Sposoby i urządzenia do ramek hangover transmisji przerywanej w kodowaniu dźwięku
CN105761723B (zh) 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105225670B (zh) 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
CN106531175B (zh) * 2016-11-13 2019-09-03 南京汉隆科技有限公司 一种网络话机柔和噪声产生的方法
KR102198598B1 (ko) * 2019-01-11 2021-01-05 네이버 주식회사 합성 음성 신호 생성 방법, 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09281999A (ja) * 1996-04-12 1997-10-31 Olympus Optical Co Ltd 音声符号化装置
JPH1083200A (ja) * 1996-09-09 1998-03-31 Fujitsu Ltd 符号化,復号化方法及び符号化,復号化装置
JP2001134296A (ja) 1999-11-01 2001-05-18 Nec Corp 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
JP2001142499A (ja) 1999-11-10 2001-05-25 Nec Corp 音声符号化装置ならびに音声復号化装置

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
SE470577B (sv) 1993-01-29 1994-09-19 Ericsson Telefon Ab L M Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
SE501305C2 (sv) 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
JP2906968B2 (ja) * 1993-12-10 1999-06-21 日本電気株式会社 マルチパルス符号化方法とその装置並びに分析器及び合成器
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
JP3557662B2 (ja) * 1994-08-30 2004-08-25 ソニー株式会社 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US5727125A (en) * 1994-12-05 1998-03-10 Motorola, Inc. Method and apparatus for synthesis of speech excitation waveforms
CN1155139A (zh) * 1995-06-30 1997-07-23 索尼公司 降低语音信号噪声的方法
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
EP0763818B1 (en) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
GB2312360B (en) 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
TW326070B (en) 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US6026356A (en) * 1997-07-03 2000-02-15 Nortel Networks Corporation Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JP3223966B2 (ja) * 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6163608A (en) * 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6275798B1 (en) 1998-09-16 2001-08-14 Telefonaktiebolaget L M Ericsson Speech coding with improved background noise reproduction
JP3417362B2 (ja) * 1999-09-10 2003-06-16 日本電気株式会社 音声信号復号方法及び音声信号符号化復号方法
EP1186100A2 (en) * 2000-01-07 2002-03-13 Koninklijke Philips Electronics N.V. Generating coefficients for a prediction filter in an encoder
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
TW564400B (en) * 2001-12-25 2003-12-01 Univ Nat Cheng Kung Speech coding/decoding method and speech coder/decoder

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09281999A (ja) * 1996-04-12 1997-10-31 Olympus Optical Co Ltd 音声符号化装置
JPH1083200A (ja) * 1996-09-09 1998-03-31 Fujitsu Ltd 符号化,復号化方法及び符号化,復号化装置
JP2001134296A (ja) 1999-11-01 2001-05-18 Nec Corp 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
JP2001142499A (ja) 1999-11-10 2001-05-25 Nec Corp 音声符号化装置ならびに音声復号化装置

Also Published As

Publication number Publication date
PT2945158T (pt) 2020-02-18
US20100114567A1 (en) 2010-05-06
JP2010520512A (ja) 2010-06-10
EP2132731A1 (en) 2009-12-16
AU2008221657A1 (en) 2008-09-12
EP3629328A1 (en) 2020-04-01
PL2945158T3 (pl) 2020-07-13
ES2548010T3 (es) 2015-10-13
EP2945158A1 (en) 2015-11-18
KR20090129450A (ko) 2009-12-16
EP2132731B1 (en) 2015-07-22
CN101632119A (zh) 2010-01-20
PL2132731T3 (pl) 2015-12-31
AU2008221657B2 (en) 2010-12-02
ES2778076T3 (es) 2020-08-07
EP2945158B1 (en) 2019-12-25
JP5340965B2 (ja) 2013-11-13
EP2132731A4 (en) 2014-04-16
CN101632119B (zh) 2012-08-15
US8457953B2 (en) 2013-06-04
WO2008108719A1 (en) 2008-09-12

Similar Documents

Publication Publication Date Title
US10438601B2 (en) Method and arrangement for controlling smoothing of stationary background noise
JP6804528B2 (ja) ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム
KR101462293B1 (ko) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
JP5009910B2 (ja) レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US8195450B2 (en) Decoder with embedded silence and background noise compression
JP5097219B2 (ja) 非因果性ポストフィルタ
JP5255575B2 (ja) レイヤード・コーデックのためのポストフィルタ
KR100854534B1 (ko) 오디오 코더 모드들 간의 스위칭 지원

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171024

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181025

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191030

Year of fee payment: 6