KR20150054716A - 컴포트 노이즈의 생성 - Google Patents

컴포트 노이즈의 생성 Download PDF

Info

Publication number
KR20150054716A
KR20150054716A KR1020147036471A KR20147036471A KR20150054716A KR 20150054716 A KR20150054716 A KR 20150054716A KR 1020147036471 A KR1020147036471 A KR 1020147036471A KR 20147036471 A KR20147036471 A KR 20147036471A KR 20150054716 A KR20150054716 A KR 20150054716A
Authority
KR
South Korea
Prior art keywords
parameter
frame
subset
sid
parameters
Prior art date
Application number
KR1020147036471A
Other languages
English (en)
Other versions
KR101648290B1 (ko
Inventor
토프트고르드 토마스 얀손
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20150054716A publication Critical patent/KR20150054716A/ko
Application granted granted Critical
Publication of KR101648290B1 publication Critical patent/KR101648290B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Abstract

컴포트 노이즈(CN) 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기(50)가 기술된다. 미리 결정된 크기의 버퍼(200)는 무음 삽입 서술자(SID) 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터를 저장하도록 구성된다. 서브세트 선택기(50A)는 저장된 CN 파라미터의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트를 결정하도록 구성된다. 컴포트 노이즈 제어 파라미터 추출기(50B)는 액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터를 결정하기 위해 상기 결정된 CN 파라미터 서브세트를 사용하도록 구성된다.

Description

컴포트 노이즈의 생성{GENERATION OF COMFORT NOISE}
본원에 제안된 기술은 통상 컴포트 노이즈 (CN; comfort noise)의 생성에 관한 것으로, 특히 컴포트 노이즈 제어 파라미터의 생성에 관한 것이다.
대화 음성에 이용된 코딩 시스템에서는, 보통 인코딩의 효율을 증대시키기 위해 불연속 전송(DTX; discontinuous transmission)을 이용한다. 이는 대화 중 많은 말 끊김의 원인이 되는데, 예컨대 어느 한 사람이 이야기 하는 동안 다른 사람은 듣고 있게 된다. DTX를 이용할 경우, 음성 인코더는 평균 시간당 약 50%만을 활성화시킬 수 있다. 이러한 형태를 갖는 코덱의 예로는 3GPP 적응형 멀티-레이트 협대역(AMR NB; Adaptive Multi-Rate Narrowband) 코덱 및 ITU-T G.718 코덱이 있다.
DTX에서, 동작 액티브 프레임(operation active frame)은 표준 코덱 모드로 코딩되고, 반면 액티브 영역들간 인액티브((inactive)) 신호 주기는 컴포트 노이즈로 나타난다. 신호 서술 파라미터들이 추출되어 인코더에서 인코딩되고 무음 삽입 서술(SID; silence insertion description) 프레임들의 디코더로 전송된다. 그러한 SID 프레임들은 액티브 음성 코딩 모드(들)에 이용된 것보다 감소된 프레임 레이트 및 낮은 비트 레이트로 전송된다. SID 프레임들간 신호 특성에 대한 정보는 전송되지 않는다. 그러한 낮은 SID 레이트로 인해, 상기 컴포트 노이즈는 액티브 신호 프레임 코딩에 비해 비교적 변하지 않는 특성만을 나타낼 수 있다. 디코더에서, 수신 파라미터들이 디코딩되어 그러한 컴포트 노이즈를 특성화하는데 사용된다.
음성 품질의 저하 없이 고품질의 DTX 동작을 위해서는, 입력 신호에서 음성의 주기를 검출하는 것이 중요하다. 이는 소리 활성도 검출기(VAD; voice activity detector) 또는 음성 활성도 검출기(SAD; sound activity detector)를 이용하여 행해진다. 도 1은 데이터 프레임(실행에 따라 5-30 ms의)의 입력 신호를 분석하여, 각 프레임에 대한 활성도 결정을 생성하는 일반적인 VAD의 블록도를 나타낸다.
임시 활성도 결정(1차 VAD 결정)은 특징 추출기(10)에 의해 추정된 현재 프레임에 대한 특징들과 백그라운드 추정 블록(14)에 의해 이전 입력 프레임으로부터 추정된 백그라운드 특징들의 비교에 의해 1차 소리 검출기(12)에서 이루어진다. 지정된 임계치보다 큰 차이는 활성도 1차 결정을 제공한다. 행오버(hangover) 추가 블록(16)에서, 1차 결정은 최종 활성도 결정(최종 VAD 결정)을 형성하기 위해 과거 1차 결정에 기초하여 확대된다. 그러한 행오버 이용에 대한 주요한 이유는 중간 및 후미 클립핑(clipping)의 위험을 감소시키기 위한 것이다.
선형 예측(LP; linear prediction), 예컨대 G.718에 기초한 음성 코덱의 경우는 액티브 프레임에서와 같은 유사한 표시를 이용하여 엔벨로프(envelope) 및 프레임 에너지를 모델화하는데 적합하다. 이는 DTX 동작에 있어 각기 다른 모드들간 공통의 기능에 의해 메모리 필요성 및 코덱의 복잡성이 감소될 수 있기 때문에 효과적이다.
그와 같은 코덱의 경우, 그러한 컴포트 노이즈는 그 LP 계수(자동 회귀(AR; auto regressive) 계수로도 알려진) 및 LP 잔여(residual)의 에너지, 즉 LP 모델에 대한 입력으로서 기준 오디오 세그먼트를 제공하는 신호로 나타날 수 있다. 상기 디코더에 있어서, 잔여 신호는 상기 컴포트 노이즈를 형성하기 위해 CN 파라미터들에 의해 형성된 랜덤 노이즈로서 여기 생성기(excitation generator)에서 생성된다.
상기 LP 계수는 통상 이하 식 (1)에 따른 영역화된 오디오 세그먼트(
Figure pct00001
;n=0,...,N-1)의 자기 상관(
Figure pct00002
; autocorrelation)을 산출함으로써 얻어진다:
Figure pct00003
(1)
여기서, P는 미리 정해진 모델 차수이다. 다음에 상기 LP 계수(ak)는 예컨대 레빈슨-더빈 알고리즘(Levinson-Durbin algorithm)을 이용하여 자기 상관 시퀀스로부터 얻어진다.
그와 같은 코덱이 이용되는 통신 시스템에 있어서, 상기 LP 계수는 인코더에서 디코더로 효율적으로 전송될 수 있다. 이러한 이유 때문에, 통상 양자화 노이즈에 덜 민감한 좀더 간결한 표시가 이용된다. 예컨대, 상기 LP 계수는 선형 스펙트럼 쌍(LSP)으로 전송될 수 있다. 대안의 실시예들에 있어서, 상기 LP 계수는 대신 이미턴스 스펙트럼 쌍(ISP; immitance spectrum pair), 라인 스펙트럼 주파수(LSF) 또는 이미턴스 스펙트럼 주파수(ISF) 도메인으로 변환될 수 있다.
상기 LP 잔여는 이하의 식 (2)에 의해 규정된 역 LP 합성 필터 A[z]를 통해 기준 신호를 필터링하여 얻어진다:
Figure pct00004
(2)
따라서 필터링된 잔여 신호
Figure pct00005
는 이하의 식 (3)에 의해 주어진다:
Figure pct00006
(3)
에너지가 이하의 식 (4)와 같이 주어지는 경우:
Figure pct00007
(4)
SID 프레임들의 낮은 전송 레이트로 인해, CN 파라미터는 그러한 노이즈 특성이 빠르게 변경되지 않도록 느리게 전개된다. 예컨대, 이를 처리하도록 G.718 코덱은 SID 프레임들간 에너지 변경을 제한하고 LSP 계수들을 보간한다.
SID 프레임들에서 표시 CN 파라미터를 찾기 위해, LSP 계수 및 잔여 에너지는 데이터 프레임을 포함하지 않는 모든 프레임에서 산출된다(따라서, 데이터 프레임이 없는 경우, 그러한 언급된 파라미터들이 결정되기는 하나 전송되지는 않는다). 상기 SID 프레임에서, 중간 LSP 계수 및 평균 잔여 에너지가 산출되고, 인코딩되어 디코더로 전송된다. 컴포트 노이즈가 비정상적으로 정지되지 않도록 하기 위해, 불규칙 변동이 컴포트 노이즈 파라미터, 예컨대 잔여 에너지의 변화에 추가될 것이다. 이러한 기술은 예컨대 G.718 코덱에 사용된다.
또한, 상기 컴포트 노이즈 특성은 항상 기준 백그라운드 노이즈에 잘 매칭되며, 그러한 컴포트 노이즈의 경미한 감쇄(attenuation)는 이에 대한 청취자의 주의력을 감소시킨다. 따라서 감지된 오디오 품질은 더 높아질 수 있다. 또한, 액티브 신호 프레임의 코딩된 노이즈는 코딩되지 않은 기준 노이즈보다 낮은 에너지를 갖는다. 따라서, 액티브 및 인액티브 프레임들에서의 노이즈 표시의 보다 양호한 에너지 매칭을 위해 감쇄가 바람직하다. 그러한 감쇄는 통상 0-5dB의 범위가 되며, 그러한 액티브 코딩 모드(들) 비트레이트를 따르거나 고정될 수 있다.
고효율의 DTX 시스템에 있어서, 좀더 적극적인 VAD가 사용되어야만 하고, 그에 따라 높은 에너지 파트의 신호(백그라운드 노이즈 레벨에 대한)가 컴포트 노이즈에 의해 표시될 수 있다. 그러한 경우, SID 프레임들간 에너지 변경을 제한하는 것은 지각력의 저하를 야기한다. 높은 에너지 세그먼트를 양호하게 처리하기 위해, 그러한 시스템은 이들 환경에 대한 CN 파라미터들의 더 큰 순간 변화를 허용할 것이다.
CN 파라미터들의 저역 필터링 또는 보간(interpolation)은 정상적인 평활한 동적인 컴포트 노이즈를 얻기 위해 인액티브 프레임들에서 수행된다. 하나 또는 몇개의 액티브 프레임을 따르는 제1SID 프레임(이후 "제1SID"로만 표시)에 있어서, LSP 보간(interpolation) 및 에너지 평활화(energy smoothing)의 최상의 기본 체제는 즉 액티브 신호 세그먼트 이전의 선행 인액티브 프레임들로부터의 CN 파라미터들이 될 것이다.
각각의 인액티브 프레임, SID 또는 데이터가 없는 경우, LSP 벡터(
Figure pct00008
)가 이하의 식 (5)에 따른 이전 LSP 계수로부터 보간될 수 있다:
Figure pct00009
(5)
여기서
Figure pct00010
는 인액티브 프레임들의 프레임 번호이고,
Figure pct00011
는 평활 계수이고,
Figure pct00012
는 현재 SID로부터 파라미터들에 의해 산출된 중간 LSP 계수이며, 이전 SID 프레임 이후로 모든 데이터 프레임은 없다. G.718 코덱에 있어서, 평활 계수 α=0.1이 사용되었다.
잔여 에너지
Figure pct00013
는 이하의 식 (6)DP 따라 SID에서 유사하게 보간되거나 또는 데이터 프레임은 없다:
Figure pct00014
(6)
여기서,
Figure pct00015
는 평활 계수이고,
Figure pct00016
는 현재 SID에 대한 평균 에너지이며, 이전 SID 프레임 이후로 데이터 프레임은 없다. G.718 코덱에 있어서, 평활 계수 β=0.3이 사용되었다.
그러한 기술된 보간에 따른 이슈는, 제1SID에 있어서, 보간 메모리(Ei -1 및 qi -1)가 이전의 높은 에너지 프레임, 예컨대 VAD에 의해 인액티브로서 분류되는 무성 음성 프레임과 관련된다는 것이다. 그러한 경우, 제1SID 보간은 클로즈 액티브 모드 행오버 프레임(close active mode hangover frame)의 코딩된 노이즈를 나타내지 않는 노이즈 특성으로부터 시작할 것이다. 상기한 동일한 이슈는 액티브 신호 세그먼트, 예컨대 음성 신호의 세그먼트들 중 백그라운드 노이즈의 특성이 변경될 경우 발생한다.
종래기술과 관련된 문제들의 예가 도 2에 나타나 있다. DTX 동작에서 인코딩된 그러한 노이지 음성 신호(noisy speech signal)의 분광 사진(spectrogram)은 액티브 코딩 오디오(음성과 같은)의 세그먼트 전과 후의 컴포트 노이즈의 2개의 세그먼트를 나타낸다. 제1CN 세그먼트로부터의 노이즈 특성이 제1SID의 보간에 사용될 경우에는 노이즈 특성이 급변하는 것을 볼 수 있다. 몇 시간 후, 그러한 컴포트 노이즈가 액티브 코딩 오디오의 말미에서 더 잘 매칭되나, 그러한 좋지 않은 변이는 감지된 오디오 품질의 명백한 저하를 야기한다.
더 높은 평활 계수 α 및 β의 이용은 그러한 CN 파라미터를 현재 SID의 특성에 초점을 맞추고 있으나, 이는 여전히 문제를 야기한다. 제1SID의 파라미터들이 노이즈 기간 동안 평균화될 수 없기 때문에, 이후의 SID 프레임의 CN 파라미터들만이 그러한 현재 프레임의 신호 특성들에 기초가 될 수 있다. 이들 파라미터는 그러한 보간 메모리에서 롱 텀(long term) 특성보다 양호한 현재 프레임의 백그라운드 노이즈를 나타낸다. 그러나, 이들 SID 파라미터들은 비정상적인 것들로, 롱 텀 노이즈(long term noise) 특성을 나타내지 않을 가능성이 있다. 이는 예컨대, 노이즈 특성의 빠른 비정상적인 변화, 및 낮은 감지된 오디오 품질을 야기할 수 있다.
본원에 제안된 기술의 목적은 상술한 문제들 중 적어도 하나를 극복하는 것에 있다.
본원에 제안된 기술의 제1형태는 CN 제어 파라미터를 생성하는 방법을 포함한다. 그러한 방법은 다음의 단계들을 포함한다:
- 미리 결정된 크기의 버퍼에 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터를 저장하는 단계.
- 상기 저장된 CN 파라미터의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트를 결정하는 단계.
- 액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터를 결정하기 위해 상기 결정된 CN 파라미터 서브세트를 이용하는 단계.
본원에 제안된 기술의 제2형태는 CN 제어 파라미터를 생성하기 위한 컴퓨터 프로그램을 포함한다. 상기 컴퓨터 프로그램은 컴퓨터 상에서 실행될 때 그 컴퓨터가 하기를 실행하게 하는 컴퓨터 판독가능 코드 유닛을 포함한다:
- 미리 결정된 크기의 버퍼에 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터 저장.
- 상기 저장된 CN 파라미터의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트를 결정.
- 액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터를 결정하기 위해 상기 결정된 CN 파라미터 서브세트를 이용.
본원에 제안된 기술의 제3형태는 컴퓨터 판독가능 매체 및 이 컴퓨터 판독가능 매체에 저장된 상기 제2형태에 따른 컴퓨터 프로그램을 포함하는 컴퓨터 프로그램 제품을 포함한다.
본원에 제안된 기술의 제4형태는 CN 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기를 포함한다. 그러한 장치는 하기의 구성요소를 포함한다:
- SID 프레임 및 행오버 프레임에 대한 CN 파라미터를 저장하도록 구성된 미리 결정된 크기의 버퍼.
- 상기 저장된 파라미터의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트를 결정하도록 구성된 서브세트 선택기.
액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터를 결정하기 위해 상기 결정된 CN 파라미터 서브세트를 사용하도록 구성된 컴포트 노이즈 제어 파라미터 추출기.
본원에 제안된 기술의 제5형태는 상기 제4형태에 따른 컴포트 노이즈 제어기를 포함하는 디코더를 포함한다.
본원에 제안된 기술의 제6형태는 상기 제5형태에 따른 디코더를 포함하는 네트워크 노드를 포함한다.
본원에 제안된 기술의 제7형태는 상기 제4형태에 따른 컴포트 노이즈 제어기를 포함하는 네트워크 노드를 포함한다.
상기 본원에 제안된 기술의 장점은 DTX 모드로 동작하는 코덱을 위한 액티브 및 인액티브 코딩 모드들간 스위칭하기 위한 오디오 품질을 향상시키는데 있다. 컴포트 노이즈의 엔벨로프 및 신호 에너지는 이전 SID 및 VAD 행오버 프레임들에서의 유사한 에너지의 이전 신호 특성에 매칭된다.
본원의 다른 목적 및 장점들과 함께 본원에 제안된 기술은 수반되는 도면들과 함께 취해진 이하의 설명을 참조함으로써 더 잘 이해될 수 있을 것이다.
도 1은 일반적인 VAD의 블록도이고;
도 2는 종래 DTX 해결책에 따라 디코딩되는 노이지 음성 신호의 분광 사진의 예이고;
도 3은 코덱에서의 인코더 시스템의 블록도이고;
도 4는 본원에 제안된 기술에 따른 컴포트 노이즈를 생성하는 방법을 실행하는 디코더의 예시 실시예의 블록도이고;
도 5는 본원에 제안된 기술에 따라 디코딩되는 노이지 음성 신호의 분광 사진의 예이고;
도 6은 본원에 제안된 기술에 따른 방법의 예시 실시예를 나타내는 순서도이고;
도 7은 본원에 제안된 기술에 따른 방법의 또 다른 예시 실시예를 나타내는 순서도이고;
도 8은 본원에 제안된 기술에 따른 컴포트 노이즈 제어기의 예시 실시예를 나타내는 블록도이고;
도 9는 본원에 제안된 기술에 따른 컴포트 노이즈 제어기의 또 다른 예시 실시예를 나타내는 블록도이고;
도 10은 본원에 제안된 기술에 따른 컴포트 노이즈 제어기의 또 다른 예시 실시예를 나타내는 블록도이고;
도 11은 기능이 컴퓨터에 의해 실행되는 디코더의 예시 실시예의 몇몇 구성요소들을 나타내는 개략도이며;
도 12는 본원에 제안된 기술에 따른 컴포트 노이즈 제어기를 포함하는 네트워크 노드를 나타내는 블록도이다.
이하 기술된 실시예들은 인액티브 신호 표시를 위한 컴포트 노이즈 크기를 갖는 DTX를 이용하여 주로 음성 통신 애플리케이션들을 위한 오디오 인코더 및 디코드의 시스템에 관한 것이다. 그 시스템은 액티브 및 인액티브 신호 프레임 모두의 코딩을 위한 LP의 이용을 고려하며, VAD는 활성도 결정을 위해 이용된다.
도 3에 나타낸 인코더에 있어서, VAD(18)는 인코더(20)에 의한 인코딩을 위해 이용되는 활성도 결정을 출력한다. 또한, VAD 행오버 결정은 비트스트림 멀티플렉서(22; MUX)에 의해 비트스트림으로 입력되어 액티브 프레임(행오버 및 비-행오버 프레임) 및 SID 프레임의 코딩된 파라미터와 함께 디코더로 전송된다.
그러한 개시된 실시예들은 오디오 디코더의 일부이다. 그와 같은 디코더(100)는 도 4에 개략적으로 나타나 있다. 비트스트림 디멀티플렉서(24; DEMUX)는 수신된 비트스트림을 코딩된 파라미터 및 VAD 행오버 결정으로 디멀티플렉싱(즉, 역다중화)한다. 그러한 디멀티플렉싱된 신호들은 모드 선택기(26)로 보내진다. 수신된 코딩된 파라미터들은 파라미터 디코더(28)에서 디코딩된다. 그 디코딩된 파라미터들은 상기 모드 선택기(26)로부터의 액티브 프레임을 디코드하기 위해 액티브 프레임 디코더(30)에 의해 사용된다.
또한, 디코더(100)는 SID 및 액티브 모드 행오버 프레임에 대한 CN 파라미터들을 수신하여 저장하도록 구성된 미리 결정된 크기(M)의 버퍼(200), 저장된 CN 파라미터들의 시기에 기초하여 SID에 적절한 저장된 CN 파라미터를 결정하도록 구성된 유닛(300), 잔여 에너지 측정에 기초하여 SID에 적절한 상기 결정된 CN 파라미터를 결정하도록 구성된 유닛(400), 및 액티브 신호 프레임(들)을 뒤따르는 제1SID 프레임에 대한 SID에 적절한 상기 결정된 CN 파라미터를 이용하도록 구성된 유닛(500)을 포함한다.
상기 버퍼의 파라미터들은 적절한 것이 되게 하기 위해 새로운 것으로 제한된다. 이에 의해, 적절한 버퍼 서브세트의 선택에 이용된 버퍼의 크기는 더 긴 주기의 액티브 코딩 동안 감소된다. 추가로, 상기 저장된 파라미터들은 SID 및 액티브하게 코딩된 행오버 프레임들 중 좀더 새로운 값으로 교체된다.
순환 버퍼를 이용함으로써, 버퍼 처리를 위한 복잡성 및 메모리 필요성이 감소될 수 있다. 그와 같은 실시에 있어서, 미리 저장된 요소들은 새로운 요소들이 추가될 때 이동하지 않는다. 맨 나중에 추가된 파라미터의 위치, 또는 파라미터 세트는 새로운 요소들에 대한 버퍼의 크기와 함께 이용된다. 새로운 요소들이 추가될 때, 오래된 요소들은 겹쳐 기록된다.
상기 버퍼들이 초기의 SID 및 행오버 프레임들로부터 파라미터를 유지하기 때문에, 이들은 대개 필요로 하지 않는 백그라운드 노이즈를 포함하는 이전 오디오 프레임의 신호 특성을 기술한다. 고려되는 적절한 파라미터의 수는, 정보 저장 이후, 버퍼의 크기 및 시간, 또는 대응하는 프레임의 수에 의해 규정된다.
본원에 개시된 기술은 예컨대 도 4에 나타낸 디코더 측에서 수행된 다수의 알고리즘 단계로 기술될 수 있다. 이들 단계는:
1a. 단계 1a(도 4에서 단위 블록으로 나타낸 단계 1a에 의해 수행) - SID 및 행오버 프레임에 대한 버퍼 업데이트:
각각의 SID 및 액티브 행오버 프레임에 있어서, 양자화 LSP 계수 벡터(
Figure pct00017
) 및 대응하는 양자화 잔여 에너지(
Figure pct00018
)는, 즉 이하의 식 (7)과 같이 버퍼들
Figure pct00019
로 저장된다.
Figure pct00020
(7)
상기 버퍼 위치 인덱스
Figure pct00021
는 각각의 버퍼 업데이트 전에 1씩 증가되며, 이하 식 (8)과 같이 그 인덱스가 버퍼 크기(M)를 초과하면 리셋된다.
Figure pct00022
(8)
이하 기술하는 바와 같이, 서브세트 QK 및 QM 및 EM에 최근에 저장된 KO의 EK는 각각 세트의 저장된 파라미터들을 규정한다.
1b. 단계 1b(도 4에서 단위 블록으로 나타낸 단계 1b에 의해 수행) - 액티브 비- 행오버 프레임에 대한 버퍼 업데이트
액티브 프레임의 디코딩 동안, 서브세트 QK 및 EK의 크기는 이하의 식 (9)에 따른
Figure pct00023
요소들의 비율로 감소된다:
Figure pct00024
(9)
여기서 KO는 이전 SID 및 행오버 프레임에 저장된 요소들의 수이고,
Figure pct00025
및 PA는 연속 액티브 비-행오버 프레임의 수이다. 그 감소 비율은 시간과 관련되고, 여기서
Figure pct00026
는 20 ms 프레임에 대해 실현가능한 것이다. 그러한 감소 비율 상수
Figure pct00027
는 잠재적으로 소정의 값
Figure pct00028
로 규정되나, 이는 현재 백그라운드 노이즈를 나타내지 않는 오래된 노이즈 특성이 서브세트 QK 및 EK로부터 배제되도록 선택될 것이다. 그 값은 예컨대 예상된 동적인 백그라운드 노이즈에 기초하여 선택될 수 있다. 또한, 음성 버스트의 순수 길이 및 VAD의 행위는 긴 시퀀스의 연속 액티브 프레임들이 가능하지 않은 것으로 고려될 것이다. 통상 상기 상수는 10초 이하에 대응되는 20 ms 프레임에 대한
Figure pct00029
의 범위가 될 것이다. 대안의 식이 이하의 식 (10)과 같이 좀더 간단한 형태로 나타날 수 있다:
Figure pct00030
(10)
K0는 버퍼(200)에 저장된 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터의 수이고,
Figure pct00031
는 미리 결정된 상수이며,
Figure pct00032
는 음이 아닌 정수이다.
2. 단계 2(도 4에서 단위 블록으로 나타낸 단계 2에 의해 수행) - 적절한 버퍼 요소의 선택
액티브 프레임을 뒤따르는 제1SID에서, 버퍼 EK의 서브세트는 잔여 에너지에 기초하여 선택된다. 크기 L의 서브세트
Figure pct00033
는 이하의 식 (11)과 같이 정의된다:
Figure pct00034
(11)
여기서,
Figure pct00035
는 최근에 저장된 잔여 에너지이고,
Figure pct00036
Figure pct00037
는 각각 액티브 프레임에서 인액티브 프레임으로의 변이에서 노이즈의 표시로 고려되는 잔여 에너지에 대한 미리 결정된 하한 및 상한(예컨대,
Figure pct00038
Figure pct00039
)이며,
k0,...,kK -1은 k0는 최근에 저장된 그리고 kK -1이 가장 오래 저장된 CN 파라미터에 대응하도록 저장된다.
통상,
Figure pct00040
는 범위
Figure pct00041
로부터 선택되고, 여기서 더 큰 값이 최근 저장된 잔여 에너지
Figure pct00042
에 비해 높은 잔여 에너지를 포함한다. 이는 가청 저하를 야기시키는 컴포트 노이즈의 상당한 점진적 증가를 야기한다. 이는 또한 통상 더 큰 에너지를 갖는 언어 프레임(speech frame)으로부터의 신호 특성들을 배제하는 것이 바람직하며, 그러한 신호 특성들은 보통 백그라운드 노이즈를 잘 나타내지 못한다.
Figure pct00043
은 예컨대 범위
Figure pct00044
로부터
Figure pct00045
보다 약간 더 큰 것이 선택될 수 있으며, 여기서 에너지의 점진적 증가는 보통 덜 문제가 된다. 추가로, 언어 신호를 포함할 가능성은 보통
Figure pct00046
보다 큰 잔여 에너지를 갖는 프레임에서 보다
Figure pct00047
보다 작은 잔여 에너지를 갖는 프레임에서 작다.
그러한 에너지
Figure pct00048
는 선형 영역 뿐만 아니라 로그 영역에서, 예컨대 dB로 나타낼 수 있다는 것을 알아야 한다. 로그 영역에서의 에너지의 경우, 식 (11)에 명시된 것과 같이, 적절한 버퍼 요소들의 선택은 이하와 같이 선형 영역에서의 에너지
Figure pct00049
와 동등하게 기술된다:
Figure pct00050
(12)
여기서,
Figure pct00051
이다. 버퍼(EK)의 서브세트를 지적하는 적절한 경계는 예컨대
Figure pct00052
또는
Figure pct00053
에 의해 주어진다.
LSP 버퍼(QK)에서의 대응하는 벡터는 서브세트
Figure pct00054
를 정의한다.
3. 단계 3(도 4에서 단위 블록으로 나타낸 단계 3에 의해 수행) - 표시 컴포트 노이즈 파라미터의 결정
표시 잔여 에너지를 찾기 위해, 서브세트(ES)의 중량 평균이 이하의 식 (13)과 같이 산출된다:
Figure pct00055
(13)
여기서,
Figure pct00056
는 이하와 같이 중량의 서브세트에서의 요소이다:
Figure pct00057
최대 버퍼 크기 M=8인 경우, 적절한 중량의 설정은 이하와 같다:
WM={0.2, 0.16, 0.128, 0.1024, 0.08192, 0.065536, 0.0524288, 0.01048576}
이러한 평균은 최근 에너지가 잔여 에너지 평균(
Figure pct00058
)에서 좀더 중량이 나간다는 것을 의미하며, 이는 액티브 및 인액티브 프레임 평활자(smoother)들간 에너지 변이를 제공한다.
서브세트(QS)에서의 LSP 벡터들 중, 중간 LSP 벡터는 이하의 식 (14)에 따라 서브세트 버퍼(ES)에서의 모든 LSP 벡터들간 거리를 산출함으로써 선택된다:
Figure pct00059
(14)
여기서, 는 벡터(
Figure pct00061
)에서의 요소이다.
모든 LSP 벡터에 있어서, 다른 벡터들에 대한 거리는, 즉 이하의 식 (15)와 같은 합이 된다.
Figure pct00062
(15)
중간 LSP 벡터는, 즉 서브세트 버퍼에서의 다른 벡터들에 대한 최소 거리를 갖는 벡터에 의해 이하의 식 (16)과 같이 주어진다.
Figure pct00063
(16)
만약 몇개의 벡터가 동일한 총 거리이면, 그 중간은 그들 벡터 중에서 임의로 선택될 수 있다.
대안의 표시 LSP 벡터로서는 서브세트(QS)의 평균 벡터로서 결정될 것이다.
4. 단계 4(도 4에서 단위 블록으로 나타낸 단계 4에 의해 수행) - 제1 SID 프레임에 대한 컴포트 노이즈의 보간
LSP 중간 또는 평균 벡터(
Figure pct00064
) 및 평균 잔여 에너지(
Figure pct00065
)는 이하 식 (17)과 함께 식 (5) 및 식 (6)에 기술한 바와 같이 제1SID 프레임에서의 CN 파라미터의 보간에 이용된다:
Figure pct00066
(17)
Figure pct00067
의 값들은 파라미터 디코더(28)로부터 얻어진다. 평활 계수
Figure pct00068
는 제1SID 프레임에 있어서 다음 SID에 이용된 계수와 다를 수 있고, CN 파라미터의 데이터 프레임 보간이 없을 수 있다. 추가로, 그러한 계수들은 예컨대 결정된 파라미터
Figure pct00069
, 예컨대 서브세트 QS 및 ES의 크기의 신뢰성을 더 기술하는 측정에 좌우될 것이다. 적절한 값들은 예컨대
Figure pct00070
이다. 다음에, 그러한 제1SID 프레임에 대한 컴포트 노이즈 파라미터는 여기 생성기(34)로부터의 여기에 기초하여 노이즈를 모드 선택기(26)로부터 무 데이터 프레임에 채우는 것을 제어하도록 컴포트 노이즈 생성기(32)에 의해 사용된다.
서브세트 QS 및 ES가 비었다면, 최근 추출된 SID 파라미터는 오래된 노이즈 파라미터로부터의 보간 없이 직접 사용된다.
보간에 사용된 전송된 LSP 벡터
Figure pct00071
는 인코더에서 보통 현재 프레임의 LP 분석으로부터 직접적으로 얻어지는데, 즉 이전 프레임은 고려하지 않는다. 바람직하게 그러한 전송된 잔여 에너지
Figure pct00072
는 디코더에서 신호 합성을 위해 이용된 LSP 파라미터에 대응하는 LP 파라미터를 이용하여 얻어진다. 이들 LSP 파라미터는 대응하는 인코더 측 버퍼에 의해 단계 1-4를 수행함으로써 인코더에서 얻어질 수 있다. 이러한 방식의 인코더 동작은, 디코더 합성 LP 파라미터가 인코더에서 공지되어 있기 때문에, 그 디코더 출력의 에너지가 상기 인코딩되어 전송된 잔여 에너지의 제어에 의해 입력 신호 에너지에 일치될 수 있다는 것을 암시한다.
도 5는 본원에 제안된 기술에 따라 디코딩되는 노이지 음성 신호의 분광 사진의 예이다. 그러한 분광 사진은, 즉 동일한 인코더 측 입력 신호에 기초한 도 2의 분광 사진에 대응한다. 종래(도 2)의 분광 사진 및 본원에 제안된 해결책(도 5)의 분광 사진을 비교함으로써, 액티브하게 코딩된 오디오 및 제2컴포트 노이즈 영역간 변이가 후자의 분광 사진에 대한 평활자인 것을 명확히 알 수 있다. 이러한 예에 있어서, VAD 행오버 프레임에서의 서브세트의 신호 특성들은 평환할 변이를 얻기 위해 이용된다. 액티브 프레임의 좀더 짧은 세그먼트를 갖는 다른 신호들에 있어서, 그 파라미터 버퍼들은 또한 시간 SID 프레임에서의 클로즈로부터의 파라미터들을 포함한다.
비록 액티브 신호 프레임을 뒤따르는 하나의 제1SID 프레임만이 존재한다는 것이 사실일 지라도, 평활화/보간으로 인해 다음 SID 프레임의 CN 파라미터들에 직접적으로 영향을 줄 것이다.
도 6은 본원에 제안된 기술에 따른 방법의 예시 실시예를 나타내는 순서도이다. 단계 S1은 미리 결정된 크기의 버퍼에 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터들을 저장한다. 단계 S2는 그러한 저장된 CN 파라미터들의 시기 및 잔여 에너지들에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트를 결정한다. 단계 S3은 액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터들을 결정하기 위해 상기 결정된 CN 파라미터 서브 세트를 이용한다(즉, 상기 결정된 CN 파라미터 서브세트에 기초하여 액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터를 결정한다).
도 7은 본원에 제안된 기술에 따른 방법의 또 다른 예시 실시예를 기술하는 순서도이다. 그 도면은 각각의 프레임에 대해 수행된 방법 단계를 기술한다. 버퍼(도 4의 200과 같은)의 각기 다른 부분들은 프레임이 액티브 비-행오버 프레임 또는 SID/행오버 프레임인지(도 4의 모드 선택기(26)에 대응하는 단계 A에서 결정)에 따라 업데이트된다. 만약 그 프레임이 SID 또는 행오버 프레임이면, 단계 1a(도 4에서 단계 1a로 나타낸 단위 블록에 대응하는)는 예컨대 상기 서브섹션 1a와 관련하여 기술한 바와 같은 새로운 CN 파라미터로 상기 버퍼를 업데이트한다. 만약 상기 프레임이 액티브 비-행오버 프레임이면, 단계 1b(도 4에서 단계 1b로 나타낸 단위 블록에 대응하는)는 예컨대 상기 서브섹션 1b와 관련하여 기술한 바와 같은 다수의 연속 액티브 비-행오버 프레임에 기초하여 상기 저장된 CN 파라미터들의 시기 제한된 서브세트의 크기를 업데이트 한다. 단계 2(도 4에서 단계 2로 나타낸 단위 블록에 대응하는)는 예컨대 상기 서브섹션 2와 관련하여 기술한 바와 같은 잔여 에너지에 기초하여 시기 제한된 서브세트로부터 CN 파라미터 서브세트를 선택한다. 단계 3(도 4에서 단계 3으로 나타낸 단위 블록에 대응하는)은 예컨대 상기 서브섹션 3과 관련하여 기술한 바와 같은 CN 파라미터 서브세트로부터 표시 CN 파라미터를 결정한다. 단계 4(도 4에서 단계 4로 나타낸 단위 블록에 대응하는)는 상기 서브섹션 4와 관련하여 기술한 바와 같은 디코딩된 CN 파라미터로 표시 CN 파라미터를 보간한다. 단계 B는 현재 프레임을 다음 프레임으로 교체한 다음, 상기 과정이 다음 프레임에 반복된다.
도 8은 본원에 제안된 기술에 따른 컴포트 노이즈 제어기(50)의 예시 실시예를 나타내는 블록도이다. 미리 결정된 크기의 버퍼(200)는 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터들을 저장하도록 구성된다. 서브세트 선택기(50A)는 그 저장된 CN 파라미터들의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적합한 CN 파라미터 서브세트를 결정하도록 구성된다. 컴포트 노이즈 제어 파라미터 추출기(50B)는 액티브 신호 프레임을 뒤따르는 제1SID 프레임("제1SID")에 대한 CN 제어 파라미터들을 결정하기 하기 위해 상기 결정된 CN 파라미터 서브세트를 이용하도록 구성된다.
도 9는 본원에 제안된 기술에 따른 컴포트 노이즈 제어기(50)의 또 다른 예시 실시예를 나타내는 블록도이다. SID 및 행오버 프레임 버퍼 업데이터(52)는, SID 프레임 및 액티브 행오버 프레임에 대해, 예컨대 상기 서브섹션 1a와 관련하여 기술한 바와 같은 새로운 CN 파라미터
Figure pct00073
로 버퍼(200)를 업데이트하도록 구성된다. 비-행오버 프레임 버퍼 업데이터(54)는, 액티브 비-행오버 프레임에 대해, 예컨대 상기 서브섹션 1b와 관련하여 기술한 바와 같은 연속의 액티브 비-행오버 프레임의 수(PA)에 기초하여 상기 저장된 CN 파라미터의 시기 제한된 서브세트(QK, EK)의 크기(K)를 업데이트하도록 구성된다. 버퍼 요소 선택기(300)는, 예컨대 상기 서브섹션 2와 관련하여 기술한 바와 같은 잔여 에너지들에 기초하여 시기 제한된 서브세트(QK, EK)로부터 CN 파라미터 서브세트(QS, ES)를 선택하도록 구성된다. 컴포트 노이즈 파라미터 추정기(400)는, 예컨대 상기 서브섹션 3과 관련하여 기술한 바와 같은 CN 파라미터 서브세트(QS, ES)로부터 표시 CN 파라미터
Figure pct00074
를 결정하도록 구성된다. 컴포트 노이즈 파라미터 보간기(500; interpolator)는, 예컨대 상기 서브섹션 4와 관련하여 기술한 바와 같은 디코딩된 CN 파라미터
Figure pct00075
로 표시 CN 파라미터
Figure pct00076
를 보간하도록 구성된다. 다음에, 제1SID 프레임에 대해 얻어진 컴포트 노이즈 제어 파라미터
Figure pct00077
는 여기 생성기(34)로부터의 여기에 기초하여 노이즈를 무 데이터 프레임에 채우는 것을 제어하기 위해 컴포트 노이즈 생성기(32)에 의해 사용된다.
본원에 기술된 단계, 기능, 과정 및/또는 블록들은 일반적인 목적의 전자 회로 및 주문형 회로 모두를 포함하는 이산 회로 또는 집적 회로 기술과 같은 소정의 기존 기술을 이용하는 하드웨어에서 실행될 것이다.
선택적으로, 본원에 기술된 적어도 일부의 단계, 기능, 과정 및/또는 블록들은 적절한 처리 장비에 의해 실행을 위한 소프트웨어로 실행될 것이다. 이러한 장비는 예컨대 하나 또는 몇개의 마이크로 프로세서, 하나 또는 몇개의 디지털 신호 프로세서(DSP), 하나 또는 몇개의 주문형 집적 회로(ASIC; Application Specific Integrated Circuit), 비디오 가속 하드웨어 또는 필드 프로그램가능 게이트 어레이(FPGA; Field Programmable Gate Arrays)와 같은 하나 또는 몇개의 적절한 프로그램가능 로직 장치를 포함한다. 또한 그와 같은 처리 요소들의 조합도 가능하다.
또한 이동 단말기 또는 PC와 같은 네트워크 노드에 이미 제공된 일반적인 처리 기능들을 재사용할 수 있다는 것을 알아야 한다. 이는 예컨대 기존의 소프트웨어의 재프로그램에 의해 또는 새로운 소프트웨어 요소들을 추가함으로써 행해질 수 있다.
도 10은 본원에 제안된 기술에 따른 컴포트 노이즈 제어기(50)의 다른 예시 실시예를 나타내는 블록도이다. 이러한 실시예는 CN 제어 파라미터들을 생성하기 위한 컴퓨터 프로그램을 실행하는 프로세서(62), 예컨대 마이크로 프로세서에 기초한다. 그 프로그램은 메모리(64)에 저장된다. 상기 프로그램은 미리 결정된 크기의 버퍼에 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터들을 저장하기 위한 코드 유닛(66), 상기 저장된 CN 파라미터의 시기 및 잔여 에너지들에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트를 결정하기 위한 코드 유닛(68), 및 액티브 신호 프레임을 뒤따르는 제1SID 프레임에 대한 CN 제어 파라미터를 결정하기 위해 상기 결정된 CN 파라미터 서브세트를 이용하기 위한 코드 유닛(70)을 포함한다. 상기 프로세서(62)는 시스템 버스를 통해 상기 메모리(64)와 통신한다. 그 입력
Figure pct00078
는 상기 프로세서(62) 및 메모리(64)가 연결되는 입/출력(I/O) 버스를 제어하는 I/0 제어기(72)에 의해 수신된다. 상기 프로그램으로부터 얻어진 그러한 CN 제어 파라미터
Figure pct00079
는 I/O 버스를 통해 I/O 제어기(72)에 의해 메모리(64)로부터 출력된다.
그러한 실시예들의 형태에 따르면, 인액티브 신호를 나타내는 컴포트 노이즈를 생성하기 위한 디코더가 제공된다. 상기 디코더는 DTX 모드로 동작할 수 있고, 이동 단말기에서 실행될 수 있으며, 그러한 이동 단말기 또는 PC에서 실행될 수 있는 컴퓨터 프로그램 제품에 의해 실행될 수 있다. 상기 컴퓨터 프로그램 제품은 서버에서 상기 이동 단말기로 다운로드될 수 있다.
도 11은 디코더(100)의 예시 실시예의 몇몇 구성요소들을 나타내는 개략도이며, 그러한 디코더의 기능은 컴퓨터에 의해 실행된다. 상기 컴퓨터는 컴퓨터 프로그램 제품에 저장된 컴퓨터 프로그램에 포함된 소프트웨어 명령들을 실행할 수 있는 프로세서(62)를 포함한다. 더욱이, 상기 컴퓨터는 비휘발성 메모리(64) 또는 휘발성 메모리 형태의 적어도 하나의 컴퓨터 프로그램 제품, 예컨대 EEPROM(Electrically Erasable Programmable Read-only Memory), 플래쉬 메모리, 디스크 드라이브 또는 RAM(Random-access memory)을 포함한다. 상기 컴퓨터 프로그램은 미리 결정된 크기의 버퍼에 SID 및 액티브 모드 행오버 프레임에 대한 CN 파라미터들을 저장함으로써, 그 저장된 CN 파라미터드의 시기 및 잔여 에너지 측정에 기초하여 SID에 적절한 그 저장된 CN 파라미터들의 서브세트를 결정하고, 액티브 신호 프레임(들)을 뒤따르는 제1SID 프레임에서의 CN 파라미터를 추정하기 위해 SID에 적절한 그 결정된 CN 파라미터를 이용할 수 있다.
도 12는 본원에 제안된 기술에 따른 컴포트 노이즈 제어기(50)를 포함하는 네트워크 노드(80)를 나타내는 블록도이다. 상기 네트워크 노드(80)는 통상 이동 단말기 또는 PC와 같은 사용자 장비(UE; User Equipment)이다. 상기 컴포트 노이즈 제어기(50)는 점선으로 표시한 바와 같은 디코더(100)에 제공된다. 대안으로서, 상기 간단히 기술한 바와 같은 인코더에 제공될 수 있다.
상기 기술한 제안된 기술의 실시예들에 있어서, LP 계수(ak)는 LSP 도메인으로 변환된다. 그러나, 그러한 동일한 원리들이 LSF, ISP 또는 KSF 도메인으로 변환되는 LP 계수에도 적용될 수 있다.
이는 컴포트 노이즈의 감쇄가 있는 코덱의 경우, VAD 행오버 프레임들 중 액티브하게 코딩된 신호를 점진적으로 감쇄시키는데 효과적일 수 있다. 다음에, 상기 컴포트 노이즈에 대한 에너지가 최근에 액티브하게 코딩된 프레임에 더 잘 매칭됨으로써, 감지된 오디오 품질을 더 향상시킨다. 감쇄 계수(λ)가 이하의 식과 같이 산출되어 각각의 행오버 프레임에 대해 LP 잔여로 제공된다:
Figure pct00080
(18)
Figure pct00081
(19)
여기서, PHO는 연속 VAD 행오버 프레임의 수이다. 대안으로서, λ는 이하의 식과 같이 산출된다:
Figure pct00082
(20)
여기서, L=0.6 및 L0=6은 최대 감쇄 및 감쇄 비율을 제어한다. 상기 최대 감쇄는 통상 범위 L=[0.5, 1]로 선택되고, 그 비율 제어 파라미터(LO)는 예컨대
Figure pct00083
이도록 선택될 수 있으며, 여기서
Figure pct00084
는 최대 감쇄에 필요한 프레임 수이다.
Figure pct00085
는 예컨대 가능한 한 연속 VAD 행오버 프레임의 평균 또는 최대 수로 설정된다(VAD에서의 행오버 추가로 인해). 통상 이것은 범위
Figure pct00086
프레임이 될 수 있다.
본원에 기술된 기술이 액티브 신호 세그먼트를 뒤따르는 제1CN 프레임을 처리하는 다른 해결책들과 협력할 수 있다는 것을 알아야 한다. 이는 예컨대, CN 파라미터들에서의 큰 변화가 높은 에너지 프레임들에 허용되는 알고리즘을 보완할 수 있다(백그라운드 노이즈 레벨에 대한). 이들 프레임에 있어서, 이전 노이즈 특성들은 현재 SID 프레임의 업데이트에 전혀 영향을 주지 않는다. 이후 상기 기술된 기술은 높은 에너지 프레임으로서 검출되지 않는 프레임들에 사용될 것이다.
통상의 기술자라면 부가된 청구항들에 의해 규정된 범주로부터 벗어나지 않고 다양한 변형 및 변경이 제안된 기술에 이루어질 수 있다는 것을 알 수 있을 것이다.
약어
ACELP 대수 부호 여진 선형 예측(Algebraic Code-Excited
Linear Prediction)
AMR 적응형 멀티-레이트
AMR NB AMR 협대역
AR 자동 회귀
ASIC 주문형 집적 회로
CN 컴포트 노이즈
DFT 이산 퓨리에 변환
DSP 디지털 신호 프로세서
DTX 불연속 전송
EEPROM 전기적으로 소거 및 프로그램가능한 읽기 전용 메모리
FPGA 필드 프로그램가능 게이트 어레이
ISF 이미턴스 스펙트럼 주파수
ISP 이미턴스 스펙트럼 쌍
LP 선형 예측
LSF 라인 스펙트럼 주파수
LSP 라인 스펙트럼 쌍
MDCT 변형 이산 코사인 변환
RAM 랜덤 액세스 메모리
SAD 음성 활성도 검출기
SID 무음 삽입 서술자(Silence Insertion Descriptor)
UE 사용자 장비
VAD 소리 활성도 검출기

Claims (17)

  1. 컴포트 노이즈(CN) 제어 파라미터를 생성하기 위한 방법으로서,
    미리 결정된 크기(M)의 버퍼(200)에 무음 삽입 서술자를 위한 CN 파라미터(
    Figure pct00087
    ), SID 프레임 및 액티브 행오버 프레임을 저장하고(S1; 1a);
    상기 저장된 CN 파라미터의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트(QS, ES)를 결정하며(S2, 1b, 2);
    액티브 신호 프레임을 뒤따르는 제1SID 프레임("제1SID")에 대한 CN 제어 파라미터(
    Figure pct00088
    )를 결정하기 위해 상기 결정된 CN 파라미터 서브세트(QS, ES)를 이용하는(S3, 3, 4) 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 방법.
  2. 청구항 1에 있어서,
    SID 프레임 및 액티브 행오버 프레임에 대해, 새로운 CN 파라미터(
    Figure pct00089
    )로 상기 버퍼(200)를 업데이트하고(1a);
    액티브 비-행오버 프레임에 대해, 연속 액티브 비-행오버 프레임의 수(PA)에 기초하여 상기 저장된 CN 파라미터의 시기 제한된 서브세트(QK, EK)의 크기(K)를 업데이트하고(1b);
    잔여 에너지에 기초하여 시기 제한된 서브세트(QK, EK)로부터 CN 파라미터 서브세트(QS, ES)를 선택하고(2);
    CN 파라미터 서브세트(QS, ES)로부터 표시 CN 파라미터(
    Figure pct00090
    )를 결정하며(3);
    디코딩된 CN 파라미터(
    Figure pct00091
    )로 상기 표시 CN 파라미터(
    Figure pct00092
    )를 보간하는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 방법.
  3. 청구항 2에 있어서,
    액티브 비-행오버 프레임에 대해, 이하의 식에 따라 시기 제한 서브세트(QK, EK)의 크기(K)를 업데이트하며(1b);
    Figure pct00093

    여기서,
    K0는 버퍼(200)에 저장된 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터의 수이고,
    Figure pct00094
    는 미리 결정된 상수이며,
    Figure pct00095
    는 음이 아닌 정수인 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 방법.
  4. 청구항 2 또는 3에 있어서,
    이하의 식과 같이, CN 파라미터만을 포함함으로써 시기 제한된 서브세트(QK, EK)로부터 CN 파라미터 서브세트(QS, ES)를 선택하며(2);
    Figure pct00096

    여기서,
    Figure pct00097
    는 최근에 저장된 잔여 에너지이고,
    Figure pct00098
    Figure pct00099
    는 각각 액티브 프레임에서 인액티브 프레임으로의 변이에서 노이즈의 표시로 고려되는 잔여 에너지에 대한 미리 결정된 하한 및 상한이며,
    k0,...,kK -1은 k0가 최근에 저장된 그리고 kK -1이 가장 오래 저장된 CN 파라미터에 대응하도록 저장되는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 방법.
  5. 청구항 2 내지 4 중 어느 한 항에 있어서,
    CN 파라미터 서브세트(QS, ES)로부터 표시 CN 파라미터(
    Figure pct00100
    )를 결정하며(3);
    여기서,
    Figure pct00101
    는 자동 회귀(AR) 계수를 나타내는 CN 파라미터 서브세트(QS, ES)에서의 벡터 세트(QS)의 중간 벡터이고,
    Figure pct00102
    는 선택된 CN 파라미터 서브세트(QS, ES)에서의 잔여 에너지 세트(ES)의 중량 평균 잔여 에너지인 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 방법.
  6. 청구항 5에 있어서,
    중간 벡터(
    Figure pct00103
    )는 선형 스펙트럼 쌍으로서 AR 계수를 나타내는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 방법.
  7. 컴퓨터(60) 상에서 실행될 때 그 컴퓨터가 하기를 실행하게 하는 컴퓨터 판독가능 코드 유닛을 포함하는 컴포트 노이즈(CN) 제어 파라미터를 생성하기 위한 컴퓨터 프로그램으로서,
    미리 결정된 크기(M)의 버퍼(200)에 무음 삽입 서술자, SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터(
    Figure pct00104
    )를 저장하고(66; S1; 1a);
    상기 저장된 CN 파라미터의 시기 및 잔여 에너지에 기초하여 SID 프레임에 적절한 CN 파라미터 서브세트(QS, ES)를 결정하며(68; S2; 1b, 2);
    액티브 신호 프레임을 뒤따르는 제1SID 프레임("제1SID")에 대한 CN 제어 파라미터(
    Figure pct00105
    )를 결정하기 위해 상기 결정된 CN 파라미터 서브세트(QS, ES)를 이용하는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 컴퓨터 프로그램.
  8. 컴퓨터 판독가능 매체 및 이 컴퓨터 판독가능 매체 상에 저장된 청구항 7에 따른 컴퓨터 프로그램을 포함하는 컴퓨터 프로그램 제품.
  9. 컴포트 노이즈(CN) 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기(50)로서,
    SID 프레임 및 행오버 프레임에 대한 CN 파라미터(
    Figure pct00106
    )를 저장하도록 구성된 미리 결정된 크기(M)의 버퍼(200);
    상기 저장된 CN 파라미터의 시기 및 잔여 에너지에 기초하여 무음 삽입 서술자(SID) 프레임에 적절한 CN 파라미터 서브세트(QS, ES)를 결정하도록 구성된 서브세트 선택기(50A; 54, 300);
    액티브 신호 프레임을 뒤따르는 제1SID 프레임("제1SID")에 대한 CN 제어 파라미터(
    Figure pct00107
    )를 결정하기 위해 상기 결정된 CN 파라미터 서브세트(QS, ES)를 사용하도록 구성된 컴포트 노이즈 제어 파라미터 추출기(50B; 400, 500)를 포함하는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기.
  10. 청구항 9에 있어서,
    SID 프레임 및 액티브 행오버 프레임에 대해, 새로운 CN 파라미터(
    Figure pct00108
    )로 버퍼(200)를 업데이트하도록 구성된 SID 및 행오버 프레임 버퍼 업데이터(52);
    액티브 비-행오버 프레임에 대해, 연속의 액티브 비-행오버 프레임의 수(PA)에 기초하여 저장된 CN 파라미터의 시기 제한된 서브세트(QK, EK)의 크기(K)를 업데이트하도록 구성된 비-행오버 프레임 버퍼 업데이터(54);
    잔여 에너지들에 기초하여 시기 제한된 서브세트(QK, EK)로부터 CN 파라미터 서브세트(QS, ES)를 선택하도록 구성된 버퍼 요소 선택기(300);
    CN 파라미터 서브세트(QS, ES)로부터 표시 CN 파라미터(
    Figure pct00109
    )를 결정하도록 구성된 컴포트 노이즈 파라미터 추정기(400); 및
    디코딩된 CN 파라미터(
    Figure pct00110
    )로 표시 CN 파라미터(
    Figure pct00111
    )를 보간하도록 구성된 컴포트 노이즈 파라미터 보간기(500)를 포함하는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기.
  11. 청구항 10에 있어서,
    버퍼 요소 선택기(300)는 액티브 비-행오버 프레임에 대해, 이하의 식에 따라 시기 제한 서브세트(QK, EK)의 크기(K)를 업데이트하도록 구성되며;
    Figure pct00112

    여기서,
    K0는 버퍼(200)에 저장된 SID 프레임 및 액티브 행오버 프레임에 대한 CN 파라미터의 수이고,
    Figure pct00113
    는 미리 결정된 상수이며,
    Figure pct00114
    는 음이 아닌 정수인 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기.
  12. 청구항 10 또는 11에 있어서,
    버퍼 요소 선택기(300)는 이하의 식과 같이, CN 파라미터만을 포함함으로써 시기 제한된 서브세트(QK, EK)로부터 CN 파라미터 서브세트(QS, ES)를 선택하도록 구성되며;
    Figure pct00115

    여기서,
    Figure pct00116
    는 최근에 저장된 잔여 에너지이고,
    Figure pct00117
    Figure pct00118
    는 각각 액티브 프레임에서 인액티브 프레임으로의 변이에서 노이즈의 표시로 고려되는 잔여 에너지에 대한 미리 결정된 하한 및 상한이며,
    k0,...,kK -1은 k0가 최근에 저장된 그리고 kK -1이 가장 오래 저장된 CN 파라미터에 대응하도록 저장되는 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기.
  13. 청구항 10 내지 12 중 어느 한 항에 있어서,
    컴포트 노이즈 파라미터 추정기(400)는 CN 파라미터 서브세트(QS, ES)로부터 표시 CN 파라미터(
    Figure pct00119
    )를 결정하도록 구성되며;
    여기서,
    Figure pct00120
    는 자동 회귀(AR) 계수를 나타내는 CN 파라미터 서브세트(QS, ES)에서의 벡터 세트(QS)의 중간 벡터이고,
    Figure pct00121
    는 선택된 CN 파라미터 서브세트(QS, ES)에서의 잔여 에너지 세트(ES)의 중량 평균 잔여 에너지인 것을 특징으로 하는 CN 제어 파라미터를 생성하기 위한 컴포트 노이즈 제어기.
  14. 청구항 9 내지 13 중 어느 한 항에 따른 컴포트 노이즈 제어기(50)를 포함하는 디코더(100).
  15. 청구항 14에 따른 디코더(100)를 포함하는 네트워크 노드(80).
  16. 청구항 9 내지 13 중 어느 한 항에 따른 컴포트 노이즈 제어기(50)를 포함하는 네트워크 노드(80).
  17. 네트워크 노드가 이동 단말기인 청구항 14 내지 16 중 어느 한 항에 따른 네트워크 노드(80).
KR1020147036471A 2012-09-11 2013-05-07 컴포트 노이즈의 생성 KR101648290B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261699448P 2012-09-11 2012-09-11
US61/699,448 2012-09-11
PCT/EP2013/059514 WO2014040763A1 (en) 2012-09-11 2013-05-07 Generation of comfort noise

Publications (2)

Publication Number Publication Date
KR20150054716A true KR20150054716A (ko) 2015-05-20
KR101648290B1 KR101648290B1 (ko) 2016-08-12

Family

ID=48289221

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147036471A KR101648290B1 (ko) 2012-09-11 2013-05-07 컴포트 노이즈의 생성

Country Status (24)

Country Link
US (5) US9443526B2 (ko)
EP (2) EP2823479B1 (ko)
JP (1) JP5793636B2 (ko)
KR (1) KR101648290B1 (ko)
CN (1) CN104584120B (ko)
AP (1) AP2015008251A0 (ko)
AU (1) AU2013314636B2 (ko)
BR (1) BR112015002826B1 (ko)
CA (1) CA2884471C (ko)
CL (1) CL2015000540A1 (ko)
DK (1) DK2823479T3 (ko)
ES (2) ES2642574T3 (ko)
HK (1) HK1206861A1 (ko)
HU (1) HUE027963T2 (ko)
IN (1) IN2014DN08789A (ko)
MA (1) MA37890B1 (ko)
MX (1) MX340634B (ko)
MY (1) MY185490A (ko)
PH (1) PH12014502232A1 (ko)
PL (2) PL2927905T3 (ko)
PT (1) PT2823479E (ko)
RU (2) RU2658544C1 (ko)
SG (1) SG11201500595TA (ko)
WO (1) WO2014040763A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE027963T2 (en) * 2012-09-11 2016-11-28 ERICSSON TELEFON AB L M (publ) Generating comfort noise
PL2959480T3 (pl) * 2013-02-22 2016-12-30 Sposoby i urządzenia do ramek hangover transmisji przerywanej w kodowaniu dźwięku
CN104217723B (zh) 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US9775110B2 (en) * 2014-05-30 2017-09-26 Apple Inc. Power save for volte during silence periods
CN106575511B (zh) * 2014-07-29 2021-02-23 瑞典爱立信有限公司 用于估计背景噪声的方法和背景噪声估计器
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
EP4270390A3 (en) * 2018-06-28 2024-01-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive comfort noise parameter determination
US10805191B2 (en) 2018-12-14 2020-10-13 At&T Intellectual Property I, L.P. Systems and methods for analyzing performance silence packets
JP2023536156A (ja) * 2020-07-30 2023-08-23 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号を符号化する、又は符号化オーディオシーンを復号化する装置、方法及びコンピュータープログラム
WO2024056702A1 (en) * 2022-09-13 2024-03-21 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive inter-channel time difference estimation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090122976A (ko) * 2007-03-29 2009-12-01 텔레폰악티에볼라겟엘엠에릭슨(펍) Dtx 행오버 주기의 길이를 조정하는 방법 및 음성 인코더

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
CN1149534C (zh) 1998-12-07 2004-05-12 三菱电机株式会社 声音解码装置和声音解码方法
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN103503062B (zh) * 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
RU2591021C2 (ru) * 2011-02-15 2016-07-10 Войсэйдж Корпорейшн Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp
HUE027963T2 (en) * 2012-09-11 2016-11-28 ERICSSON TELEFON AB L M (publ) Generating comfort noise

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090122976A (ko) * 2007-03-29 2009-12-01 텔레폰악티에볼라겟엘엠에릭슨(펍) Dtx 행오버 주기의 길이를 조정하는 방법 및 음성 인코더

Also Published As

Publication number Publication date
US20160293170A1 (en) 2016-10-06
PL2927905T3 (pl) 2017-12-29
US20150235648A1 (en) 2015-08-20
US10891964B2 (en) 2021-01-12
ES2547457T3 (es) 2015-10-06
US20170352354A1 (en) 2017-12-07
WO2014040763A1 (en) 2014-03-20
IN2014DN08789A (ko) 2015-05-22
MY185490A (en) 2021-05-19
BR112015002826B1 (pt) 2021-05-04
SG11201500595TA (en) 2015-04-29
MX340634B (es) 2016-07-19
AU2013314636B2 (en) 2016-02-25
PL2823479T3 (pl) 2015-10-30
HUE027963T2 (en) 2016-11-28
EP2823479B1 (en) 2015-07-08
PH12014502232B1 (en) 2014-12-15
US20190318752A1 (en) 2019-10-17
KR101648290B1 (ko) 2016-08-12
US9779741B2 (en) 2017-10-03
MA37890B1 (fr) 2017-11-30
RU2658544C1 (ru) 2018-06-22
PH12014502232A1 (en) 2014-12-15
AP2015008251A0 (en) 2015-02-28
DK2823479T3 (en) 2015-10-12
CN104584120A (zh) 2015-04-29
MX2015003060A (es) 2015-07-14
JP2015525896A (ja) 2015-09-07
EP2927905A1 (en) 2015-10-07
US9443526B2 (en) 2016-09-13
CN104584120B (zh) 2016-08-31
AU2013314636A1 (en) 2015-03-19
CA2884471C (en) 2016-12-20
CA2884471A1 (en) 2014-03-20
PT2823479E (pt) 2015-10-08
US10381014B2 (en) 2019-08-13
US20210166704A1 (en) 2021-06-03
HK1206861A1 (zh) 2016-01-15
JP5793636B2 (ja) 2015-10-14
EP2823479A1 (en) 2015-01-14
RU2014150326A (ru) 2016-07-10
EP2927905B1 (en) 2017-07-12
CL2015000540A1 (es) 2015-07-31
MA37890A1 (fr) 2016-12-30
BR112015002826A2 (pt) 2018-05-22
US11621004B2 (en) 2023-04-04
ES2642574T3 (es) 2017-11-16
RU2609080C2 (ru) 2017-01-30

Similar Documents

Publication Publication Date Title
KR101648290B1 (ko) 컴포트 노이즈의 생성
JP5096582B2 (ja) ノイズ生成装置及び方法
KR20150127041A (ko) 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법
CN107818789B (zh) 解码方法和解码装置
JP6584431B2 (ja) 音声情報を用いる改善されたフレーム消失補正
KR102426050B1 (ko) 피치 지연 선택
US10504531B2 (en) Audio parameter quantization
TWI587287B (zh) 柔和噪音產生模式選擇之裝置與方法

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
GRNT Written decision to grant