KR102008488B1 - 편안한 잡음 생성 모드 선택을 위한 장치 및 방법 - Google Patents

편안한 잡음 생성 모드 선택을 위한 장치 및 방법 Download PDF

Info

Publication number
KR102008488B1
KR102008488B1 KR1020177005524A KR20177005524A KR102008488B1 KR 102008488 B1 KR102008488 B1 KR 102008488B1 KR 1020177005524 A KR1020177005524 A KR 1020177005524A KR 20177005524 A KR20177005524 A KR 20177005524A KR 102008488 B1 KR102008488 B1 KR 102008488B1
Authority
KR
South Korea
Prior art keywords
frequency
noise
noise generation
generation mode
comfortable
Prior art date
Application number
KR1020177005524A
Other languages
English (en)
Other versions
KR20170037649A (ko
Inventor
엠마누엘 라벨리
마틴 디에츠
울프강 예거스
크리스티안 노이캄
스테판 로이슐
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20170037649A publication Critical patent/KR20170037649A/ko
Application granted granted Critical
Publication of KR102008488B1 publication Critical patent/KR102008488B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

오디오 정보를 인코딩하기 위한 장치가 제공된다. 오디오 정보를 인코딩하기 위한 장치는, 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하기 위한 선택기(110), 및 오디오 정보를 인코딩하기 위한 인코딩 유닛(120)을 포함하고, 오디오 정보는 선택된 편안한 잡음 생성 모드를 표시하는 모드 정보를 포함한다.

Description

편안한 잡음 생성 모드 선택을 위한 장치 및 방법{APPARATUS AND METHOD FOR COMFORT NOISE GENERATION MODE SELECTION}
본 발명은 오디오 신호 인코딩, 프로세싱 및 디코딩에 관한 것이고, 상세하게는 편안한 잡음 생성 모드 선택을 위한 장치 및 방법에 관한 것이다.
통신 스피치 및 오디오 코덱들(예를 들어, AMR-WB, G.718)은 일반적으로 불연속 송신(DTX) 방식 및 편안한 잡음 생성(CNG) 알고리즘을 포함한다. DTX/CNG 동작은 비활성 신호 기간들 동안 배경 잡음을 시뮬레이션함으로써 송신 레이트를 감소시키기 위해 사용된다.
CNG는 예를 들어 몇몇 방식들로 구현될 수 있다.
AMR-WB(ITU-T G.722.2 Annex A) 및 G.718(ITU-T G.718 섹션 6.12 및 7.12)과 같은 코덱들에서 이용되는 가장 통상적으로 사용되는 방법은 여기 + 선형-예측(LP) 모델에 기초한다. 랜덤 여기 신호가 먼저 생성되고, 그 다음 이득만큼 스케일링되고, 마지막으로 LP 인버스 필터를 사용하여 합성되어 시간-도메인 CNG 신호를 생성한다. 송신되는 2개의 주요 파라미터들은 여기 에너지 및 LP 계수들이다(일반적으로 LSF 또는 ISF 표현을 사용함). 이러한 방법은 본원에서 LP-CNG로 지칭된다.
최근에 제안되고, 예를 들어, 특허 출원 WO2014/096279, "Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals"에서 설명되는 다른 방법은 배경 잡음의 주파수-도메인(FD) 표현에 기초한다. 랜덤 잡음이 주파수-도메인에서 생성되고(예를 들어, FFT, MDCT, QMF), 그 다음, 배경 잡음의 FD 표현을 사용하여 형상화되고, 최종적으로 주파수로부터 시간 도메인으로 변환되어, 시간-도메인 CNG 신호를 생성한다. 송신되는 2개의 주요 파라미터들은 글로벌 이득 및 대역 잡음 레벨들의 세트이다. 이러한 방법은 본원에서 FD-CNG로 지칭된다.
본 발명의 목적은 편안한 잡음 생성에 대한 개선된 개념들을 제공하는 것이다. 본 발명의 목적은, 청구항 제 1 항에 따른 장치, 청구항 제 10 항에 따른 장치, 청구항 제 13 항에 따른 시스템, 청구항 제 14 항에 따른 방법, 청구항 제 15 항에 따른 방법 및 청구항 제 16 항에 따른 컴퓨터 프로그램에 의해 해결된다.
오디오 정보를 인코딩하기 위한 장치가 제공된다. 오디오 정보를 인코딩하기 위한 장치는, 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하기 위한 선택기, 및 오디오 정보를 인코딩하기 위한 인코딩 유닛을 포함하고, 오디오 정보는 선택된 편안한 잡음 생성 모드를 표시하는 모드 정보를 포함한다.
특히, 실시예들은 FD-CNG가 고-기울기 배경 잡음 신호들, 예를 들어, 자동차 잡음에 대해 더 양호한 품질을 제공하는 한편, LP-CNG는 스펙트럼에서 더 평탄한 배경 잡음 신호들, 예를 들어, 사무실 잡음에 대해 더 양호한 품질을 제공한다는 발견에 기초한다.
DTX/CNG 시스템으로부터 최상의 가능한 품질을 획득하기 위해, 실시예들에 따르면, CNG 접근법들 둘 모두가 사용되고, 배경 잡음 특성들에 따라 이들 중 하나가 선택된다.
실시예들은 어느 CNG 모드, 예를 들어, LP-CNG 또는 FD-CNG가 사용되어야 할지를 결정하는 선택기를 제공한다.
일 실시예에 따르면, 선택기는, 예를 들어, 오디오 입력 신호의 배경 잡음의 기울기를 배경 잡음 특성으로서 결정하도록 구성될 수 있다. 선택기는, 예를 들어, 결정된 기울기에 따라 2개 이상의 편안한 잡음 생성 모드로부터 상기 편안한 잡음 생성 모드를 선택하도록 구성될 수 있다.
일 실시예에서, 장치는, 예를 들어, 복수의 주파수 대역들 각각에 대한 배경 잡음의 대역 별 추정을 추정하기 위한 잡음 추정기를 더 포함할 수 있다. 선택기는, 예를 들어, 복수의 주파수 대역들의 추정된 배경 잡음에 따라 기울기를 결정하도록 구성될 수 있다.
일 실시예에 따르면, 잡음 추정기는, 예를 들어, 복수의 주파수 대역들 각각의 배경 잡음의 에너지를 추정함으로써 배경 잡음의 대역 별 추정을 추정하도록 구성될 수 있다.
일 실시예에서, 잡음 추정기는 예를 들어, 복수의 주파수 대역들의 제 1 그룹의 각각의 주파수 대역의 배경 잡음의 대역 별 추정에 따라, 복수의 주파수 대역들의 제 1 그룹에 대한 제 1 배경 잡음 에너지를 표시하는 저주파수 배경 잡음 값을 결정하도록 구성될 수 있다.
또한, 이러한 실시예에서, 잡음 추정기는 예를 들어, 복수의 주파수 대역들의 제 2 그룹의 각각의 주파수 대역의 배경 잡음의 대역 별 추정에 따라, 복수의 주파수 대역들의 제 2 그룹에 대한 제 2 배경 잡음 에너지를 표시하는 고주파수 배경 잡음 값을 결정하도록 구성될 수 있다. 제 1 그룹의 적어도 하나의 주파수 대역은, 예를 들어, 제 2 그룹의 적어도 하나의 주파수 대역의 중심 주파수보다 낮은 중심 주파수를 가질 수 있다. 특정 실시예에서, 제 1 그룹의 각각의 주파수 대역은, 예를 들어, 제 2 그룹의 각각의 주파수 대역의 중심 주파수보다 낮은 중심 주파수를 가질 수 있다.
또한, 선택기는, 예를 들어, 저주파수 배경 잡음 값에 따라 및 고주파수 배경 잡음 값에 따라 기울기를 결정하도록 구성될 수 있다.
일 실시예에 따르면, 잡음 추정기는 예를 들어,
Figure 112017019782649-pct00001
에 따라 저주파수 배경 잡음 값 L을 결정하도록 구성될 수 있고,
여기서 i는 주파수 대역들의 제 1 그룹의 i번째 주파수 대역을 표시하고, I1은 복수의 주파수 대역들 중 제 1 주파수 대역을 표시하고, I2는 복수의 주파수 대역들 중 제 2 주파수 대역을 표시하고, N[i]는 i 번째 주파수 대역의 배경 잡음 에너지의 에너지 추정치를 표시한다.
일 실시예에서, 잡음 추정기는 예를 들어,
Figure 112017019782649-pct00002
에 따라 고주파수 배경 잡음 값 H를 결정하도록 구성될 수 있고,
여기서 i는 주파수 대역들의 제 2 그룹의 i번째 주파수 대역을 표시하고, I3은 복수의 주파수 대역들 중 제 3 주파수 대역을 표시하고, I4는 복수의 주파수 대역들 중 제 4 주파수 대역을 표시하고, N[i]는 i 번째 주파수 대역의 배경 잡음 에너지의 에너지 추정치를 표시한다.
일 실시예에 따르면, 선택기는, 예를 들어, 공식
Figure 112017019782649-pct00003
에 따라, 또는 공식
Figure 112017019782649-pct00004
에 따라, 또는 공식
Figure 112017019782649-pct00005
에 따라, 또는 공식
Figure 112017019782649-pct00006
에 따라, 저주파수 배경 잡음 값 L에 따라 및 고주파수 배경 잡음 값 H에 따라 기울기 T를 결정하도록 구성될 수 있다.
일 실시예에서, 선택기는 예를 들어, 기울기를 현재의 단기 기울기 값으로서 결정하도록 구성될 수 있다. 또한, 선택기는, 예를 들어, 현재의 단기 기울기 값에 따라 및 이전의 장기 기울기 값에 따라 현재의 장기 기울기 값을 결정하도록 구성될 수 있다. 또한, 선택기는, 예를 들어, 현재의 장기 기울기 값에 따라 2개 이상의 편안한 잡음 생성 모드들 중 하나를 선택하도록 구성될 수 있다.
일 실시예에 따르면, 선택기는, 예를 들어, 공식
Figure 112017019782649-pct00007
에 따라 현재의 장기 기울기 값 TcLT를 결정하도록 구성될 수 있고,
여기서 T는 현재의 단기 기울기 값이고, TpLT는 상기 이전의 장기 기울기 값이고, α는 0 < α < 1인 실수이다.
일 실시예에서, 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 예를 들어, 주파수-도메인 편안한 잡음 생성 모드일 수 있다. 또한 2개 이상의 편안한 잡음 생성 모드들 중 제 2 모드는 예를 들어, 선형-예측-도메인 편안한 잡음 생성 모드일 수 있다. 또한, 선택기는, 선택기에 의해 이전에 선택되는 이전의 선택된 생성 모드가 선형-예측-도메인 편안한 잡음 생성 모드이고, 현재의 장기 기울기 값이 제 1 임계값보다 크면, 주파수-도메인 편안한 잡음 생성 모드를 선택하도록 구성될 수 있다. 또한, 선택기는, 선택기에 의해 이전에 선택되는 이전의 선택된 생성 모드가 주파수-도메인 편안한 잡음 생성 모드이고, 현재의 장기 기울기 값이 제 2 임계값보다 작으면, 선형-예측-도메인 편안한 잡음 생성 모드를 선택하도록 구성될 수 있다.
또한, 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 장치가 제공된다. 장치는 인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하기 위한 디코딩 유닛을 포함하고, 모드 정보는 2개 이상의 편안한 잡음 생성 모드들 중 표시된 편안한 잡음 생성 모드를 표시한다. 또한, 장치는 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 오디오 출력 신호를 생성하기 위한 신호 프로세서를 포함한다.
일 실시예에 따르면, 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 예를 들어, 주파수-도메인 편안한 잡음 생성 모드이다. 신호 프로세서는, 예를 들어, 표시된 편안한 잡음 생성 모드가 주파수-도메인 편안한 잡음 생성 모드이면, 주파수 도메인에서 생성되는 편안한 잡음의 주파수-대-시간 변환을 수행함으로써 주파수 도메인에서 편안한 잡음을 생성하도록 구성될 수 있다. 예를 들어, 특정 실시예에서, 신호 프로세서는, 예를 들어, 표시된 편안한 잡음 생성 모드가 주파수-도메인 편안한 잡음 생성 모드이면, 주파수 도메인에서 랜덤 잡음을 생성하고, 주파수 도메인에서 랜덤 잡음을 형상화하여 형상화된 잡음을 획득하고, 형상화된 잡음을 주파수-도메인으로부터 시간 도메인으로 변환함으로써 편안한 잡음을 생성하도록 구성될 수 있다.
일 실시예에서, 2개 이상의 편안한 잡음 생성 모드들 중 제 2 모드는 예를 들어, 선형-예측-도메인 편안한 잡음 생성 모드이다. 신호 프로세서는, 예를 들어, 표시된 편안한 잡음 생성 모드가 선형-예측-도메인 편안한 잡음 생성 모드이면, 선형 예측 필터를 이용함으로써 편안한 잡음을 생성하도록 구성될 수 있다. 예를 들어, 특정 실시예에서, 신호 프로세서는, 예를 들어, 표시된 편안한 잡음 생성 모드가 선형-예측-도메인 편안한 잡음 생성 모드이면, 랜덤 여기 신호를 생성하고, 랜덤 여기 신호를 스케일링하여 스케일링된 여기 신호를 획득하고, LP 인버스 필터를 사용하여 스케일링된 여기 신호를 합성함으로써 편안한 잡음을 생성하도록 구성될 수 있다.
또한, 시스템이 제공된다. 시스템은 앞서 설명된 실시예들 중 하나에 따라 오디오 정보를 인코딩하기 위한 장치 및 앞서 설명된 실시예들 중 하나에 따라 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 장치를 포함한다. 오디오 정보를 인코딩하기 위한 장치의 선택기는 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하도록 구성된다. 오디오 정보를 인코딩하기 위한 장치의 인코딩 유닛은 선택된 편안한 잡음 생성 모드를 표시된 편안한 잡음 생성 모드로서 표시하는 모드 정보를 포함하는 오디오 정보를 인코딩하여 인코딩된 오디오 정보를 획득하도록 구성된다. 또한, 오디오 출력 신호를 생성하기 위한 장치의 디코딩 유닛은 인코딩된 오디오 정보를 수신하도록 구성되고, 또한 인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하도록 구성된다. 오디오 출력 신호를 생성하기 위한 장치의 신호 프로세서는 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 오디오 출력 신호를 생성하도록 구성된다.
또한, 오디오 정보를 인코딩하기 위한 방법이 제공된다. 방법은,
- 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하는 단계; 및;
- 오디오 정보를 인코딩하는 단계를 포함하고, 오디오 정보는 선택된 편안한 잡음 생성 모드를 표시하는 모드 정보를 포함한다.
또한, 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 방법이 제공된다. 방법은,
- 인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하는 단계 ―모드 정보는 2개 이상의 편안한 잡음 생성 모드들 중 표시된 편안한 잡음 생성 모드를 표시함―, 및;
표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 오디오 출력 신호를 생성하는 단계를 포함한다.
또한, 컴퓨터 또는 신호 프로세서 상에서 실행되는 경우 앞서 설명된 방법을 구현하기 위한 컴퓨터 프로그램이 제공된다.
따라서, 일부 실시예들에서, 제안된 프로세서는 예를 들어 배경 잡음의 기울기에 주로 기초할 수 있다. 예를 들어, 배경 잡음의 기울기가 높으면 FD-CNG가 선택되고, 그렇지 않으면 LP-CNG가 선택된다.
하나의 모드로부터 다른 모드로 빈번하게 스위칭하는 것을 회피하기 위해, 예를 들어, 배경 잡음 기울기의 평활화된 버전 및 히스테리시스가 사용될 수 있다.
예를 들어, 저주파수들의 배경 잡음 에너지와 고주파수들의 배경 잡음 에너지의 비를 사용하여 배경 잡음의 기울기가 추정될 수 있다.
배경 잡음 에너지는, 예를 들어, 잡음 추정기를 사용하여 주파수 도메인에서 추정될 수 있다.
아래에서, 본 발명의 실시예들은 도면들을 참조하여 더 상세히 설명된다.
도 1은 일 실시예에 따른 오디오 정보를 인코딩하기 위한 장치를 예시한다.
도 2는 다른 실시예에 따른 오디오 정보를 인코딩하기 위한 장치를 예시한다.
도 3은 일 실시예에 따라 편안한 잡음 생성 모드를 선택하기 위한 단계별 접근법을 예시한다.
도 4는 일 실시예에 따라 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 장치를 예시한다.
도 5는, 일 실시예에 따른 시스템을 예시한다.
도 1은 일 실시예에 따른 오디오 정보를 인코딩하기 위한 장치를 예시한다.
오디오 정보를 인코딩하기 위한 장치는 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하기 위한 선택기(110)를 포함한다.
또한, 장치는 오디오 정보를 인코딩하기 위한 인코딩 유닛(120)을 포함하고, 오디오 정보는 선택된 편안한 잡음 생성 모드를 표시하는 모드 정보를 포함한다.
예를 들어, 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 예를 들어, 주파수-도메인 편안한 잡음 생성 모드이다. 그리고/또는 예를 들어, 2개 이상의 생성 모드들 중 제 2 모드는 예를 들어, 선형-예측-도메인 편안한 잡음 생성 모드일 수 있다.
예를 들어, 디코더 측에서, 인코딩된 오디오 정보가 수신되고, 인코딩된 오디오 정보 내에 인코딩된 모드 정보는 선택된 편안한 잡음 생성 모드가 주파수-도메인 편안한 잡음 생성 모드임을 표시하면, 디코더 측의 신호 프로세서는, 예를 들어, 주파수 도메인에서 랜덤 잡음을 생성하고, 주파수 도메인에서 랜덤 잡음을 형상화하여 형상화된 잡음을 획득하고, 형상화된 잡음을 주파수-도메인으로부터 시간 도메인으로 변환함으로써 편안한 잡음을 생성할 수 있다.
그러나, 예를 들어, 인코딩된 오디오 정보 내에 인코딩된 모드 정보가, 선택된 편안한 잡음 생성 모드가 선형-예측-도메인 편안한 잡음 생성 모드임을 표시하면, 디코더 측의 신호 프로세서는, 예를 들어, 랜덤 여기 신호를 생성하고, 랜덤 여기 신호를 스케일링하여 스케일링된 여기 신호를 획득하고, LP 인버스 필터를 사용하여 스케일링된 여기 신호를 합성함으로써 편안한 잡음을 생성할 수 있다.
인코딩된 오디오 정보 내에서, 편안한 잡음 생성 모드에 대한 정보 뿐만 아니라 추가적인 정보가 인코딩될 수 있다. 예를 들어, 주파수-대역 특정 이득 팩터들, 예를 들어, 각각의 주파수 대역에 대해 하나의 이득 팩터가 또한 인코딩될 수 있다. 또한, 예를 들어, 하나 이상의 LP 필터 계수들 또는 LSF 계수들 또는 ISF 계수들이 예를 들어, 인코딩된 오디오 정보 내에 인코딩될 수 있다. 그 다음, 예를 들어, 선택된 편안한 잡음 생성 모드에 대한 정보 및 인코딩된 오디오 정보 내에 인코딩된 추가적인 정보는 예를 들어, SID 프레임(SID = Silence Insertion Descriptor) 내에서 디코더 측에 송신될 수 있다.
선택된 편안한 잡음 생성 모드에 대한 정보는 명시적으로 또는 묵시적으로 인코딩될 수 있다.
선택된 편안한 잡음 생성 모드를 명시적으로 인코딩하는 경우, 하나 이상의 비트들은, 예를 들어, 선택된 편안한 잡음 생성 모드가 2개 이상의 편안한 잡음 생성 모드들 중 어느 모드인지를 표시하기 위해 이용될 수 있다. 그 다음, 이러한 실시예에서, 상기 하나 이상의 비트들은 인코딩된 모드 정보이다.
그러나, 다른 실시예들에서, 선택된 편안한 잡음 생성 모드는 오디오 정보 내에서 묵시적으로 인코딩된다. 예를 들어, 앞서 언급된 예에서, 주파수-대역 특정 이득 팩터들 및 하나 이상의 LP(또는 LSF 또는 ISF) 계수들은, 예를 들어, 상이한 데이터 포맷을 가질 수 있거나 또는 상이한 비트 길이를 가질 수 있다. 예를 들어, 주파수-대역 특정 이득 팩터들이 오디오 정보 내에 인코딩되면, 이것은, 예를 들어, 주파수-도메인 편안한 잡음 생성 모드가 선택된 편안한 잡음 생성 모드임을 표시할 수 있다. 그러나, 하나 이상의 Lp(또는 LSF 또는 ISF) 계수들이 오디오 정보 내에 인코딩되면, 이것은, 예를 들어, 선형-예측-도메인 편안한 잡음 생성 모드가 선택된 편안한 잡음 생성 모드임을 표시할 수 있다. 이러한 묵시적 인코딩이 사용되는 경우, 주파수-대역 특정 이득 팩터들 또는 하나 이상의 Lp(또는 LSF 또는 ISF) 계수들은 인코딩된 오디오 신호 내에 인코딩된 모드 정보를 표현하고, 이러한 모드 정보는 선택된 편안한 잡음 생성 모드를 표시한다.
일 실시예에 따르면, 선택기(110)는, 예를 들어, 오디오 입력 신호의 배경 잡음의 기울기를 배경 잡음 특성으로서 결정하도록 구성될 수 있다. 선택기(110)는, 예를 들어, 결정된 기울기에 따라 2개 이상의 편안한 잡음 생성 모드로부터 상기 편안한 잡음 생성 모드를 선택하도록 구성될 수 있다.
예를 들어, 저주파수 배경 잡음 값 및 고주파수 배경 잡음 값이 이용될 수 있고, 배경 잡음의 기울기는 예를 들어 저주파수 배경 잡음 값에 따라 그리고 고주파수 배경 잡음 값에 따라 계산될 수 있다.
도 2는 추가적인 실시예에 따른 오디오 정보를 인코딩하기 위한 장치를 예시한다. 도 2의 장치는, 복수의 주파수 대역들 각각에 대한 배경 잡음의 대역 별 추정을 추정하기 위한 잡음 추정기(105)를 더 포함한다. 선택기(110)는, 예를 들어, 복수의 주파수 대역들의 추정된 배경 잡음에 따라 기울기를 결정하도록 구성될 수 있다.
일 실시예에 따르면, 잡음 추정기(105)는, 예를 들어, 복수의 주파수 대역들 각각의 배경 잡음의 에너지를 추정함으로써 배경 잡음의 대역 별 추정을 추정하도록 구성될 수 있다.
일 실시예에서, 잡음 추정기(105)는 예를 들어, 복수의 주파수 대역들의 제 1 그룹의 각각의 주파수 대역의 배경 잡음의 대역 별 추정에 따라, 복수의 주파수 대역들의 제 1 그룹에 대한 제 1 배경 잡음 에너지를 표시하는 저주파수 배경 잡음 값을 결정하도록 구성될 수 있다.
또한, 잡음 추정기(105)는 예를 들어, 복수의 주파수 대역들의 제 2 그룹의 각각의 주파수 대역의 배경 잡음의 대역 별 추정에 따라, 복수의 주파수 대역들의 제 2 그룹에 대한 제 2 배경 잡음 에너지를 표시하는 고주파수 배경 잡음 값을 결정하도록 구성될 수 있다. 제 1 그룹의 적어도 하나의 주파수 대역은, 예를 들어, 제 2 그룹의 적어도 하나의 주파수 대역의 중심 주파수보다 낮은 중심 주파수를 가질 수 있다. 특정 실시예에서, 제 1 그룹의 각각의 주파수 대역은, 예를 들어, 제 2 그룹의 각각의 주파수 대역의 중심 주파수보다 낮은 중심 주파수를 가질 수 있다.
또한, 선택기(110)는, 예를 들어, 저주파수 배경 잡음 값에 따라 및 고주파수 배경 잡음 값에 따라 기울기를 결정하도록 구성될 수 있다.
일 실시예에 따르면, 잡음 추정기(105)는 예를 들어,
Figure 112017019782649-pct00008
에 따라 저주파수 배경 잡음 값 L을 결정하도록 구성될 수 있고,
여기서 i는 주파수 대역들의 제 1 그룹의 i번째 주파수 대역을 표시하고, I1은 복수의 주파수 대역들 중 제 1 주파수 대역을 표시하고, I2는 복수의 주파수 대역들 중 제 2 주파수 대역을 표시하고, N[i]는 i 번째 주파수 대역의 배경 잡음 에너지의 에너지 추정치를 표시한다.
유사하게, 일 실시예에서, 잡음 추정기(105)는 예를 들어,
Figure 112017019782649-pct00009
에 따라 고주파수 배경 잡음 값 H를 결정하도록 구성될 수 있고,
여기서 i는 주파수 대역들의 제 2 그룹의 i번째 주파수 대역을 표시하고, I3은 복수의 주파수 대역들 중 제 3 주파수 대역을 표시하고, I4는 복수의 주파수 대역들 중 제 4 주파수 대역을 표시하고, N[i]는 i 번째 주파수 대역의 배경 잡음 에너지의 에너지 추정치를 표시한다.
일 실시예에 따르면, 선택기(110)는, 예를 들어, 공식
Figure 112017019782649-pct00010
에 따라, 또는 공식
Figure 112017019782649-pct00011
에 따라, 또는 공식
Figure 112017019782649-pct00012
에 따라, 또는 공식
Figure 112017019782649-pct00013
에 따라, 저주파수 배경 잡음 값 L에 따라 및 고주파수 배경 잡음 값 H에 따라 기울기 T를 결정하도록 구성될 수 있다.
예를 들어, L 및 H가 대수 도메인에서 표현되는 경우, 감산 공식들(T = L - H 또는 T = H - L) 중 하나가 이용될 수 있다.
일 실시예에서, 선택기(110)는 예를 들어, 기울기를 현재의 단기 기울기 값으로서 결정하도록 구성될 수 있다. 또한, 선택기(110)는, 예를 들어, 현재의 단기 기울기 값에 따라 및 이전의 장기 기울기 값에 따라 현재의 장기 기울기 값을 결정하도록 구성될 수 있다. 또한, 선택기(110)는, 예를 들어, 현재의 장기 기울기 값에 따라 2개 이상의 편안한 잡음 생성 모드들 중 하나를 선택하도록 구성될 수 있다.
일 실시예에 따르면, 선택기(110)는, 예를 들어, 공식
Figure 112017019782649-pct00014
에 따라 현재의 장기 기울기 값 TcLT를 결정하도록 구성될 수 있고,
여기서 T는 현재의 단기 기울기 값이고, TpLT는 상기 이전의 장기 기울기 값이고, α는 0 < α < 1인 실수이다.
일 실시예에서, 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 예를 들어, 주파수-도메인 편안한 잡음 생성 모드 FD_CNG일 수 있다. 또한 2개 이상의 편안한 잡음 생성 모드들 중 제 2 모드는 예를 들어, 선형-예측-도메인 편안한 잡음 생성 모드 LP_CNG일 수 있다. 선택기(110)는, 선택기(110)에 의해 이전에 선택되는 이전의 선택된 생성 모드 cng_mode_prev가 선형-예측-도메인 편안한 잡음 생성 모드 LP_CNG이고, 현재의 장기 기울기 값이 제 1 임계값 thr1보다 크면, 주파수-도메인 편안한 잡음 생성 모드 FD_CNG를 선택하도록 구성될 수 있다. 또한, 선택기(110)는, 선택기(110)에 의해 이전에 선택되는 이전의 선택된 생성 모드 cng_mode_prev가 주파수-도메인 편안한 잡음 생성 모드 FD_CNG이고, 현재의 장기 기울기 값이 제 2 임계값 thr2보다 작으면, 선형-예측-도메인 편안한 잡음 생성 모드 LP_CNG를 선택하도록 구성될 수 있다.
일부 실시예들에서, 제 1 임계값은 제 2 임계값과 동일하다. 그러나, 일부 다른 실시예들에서, 제 1 임계값은 제 2 임계값과 상이하다.
도 4는 일 실시예에 따라 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 장치를 예시한다.
장치는 인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하기 위한 디코딩 유닛(210)을 포함한다. 모드 정보는 2개 이상의 편안한 잡음 생성 모드들 중 표시된 편안한 잡음 생성 모드를 표시한다.
또한, 장치는 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 오디오 출력 신호를 생성하기 위한 신호 프로세서(220)를 포함한다.
일 실시예에 따르면, 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 예를 들어, 주파수-도메인 편안한 잡음 생성 모드이다. 신호 프로세서(220)는, 예를 들어, 표시된 편안한 잡음 생성 모드가 주파수-도메인 편안한 잡음 생성 모드이면, 주파수 도메인에서 생성되는 편안한 잡음의 주파수-대-시간 변환을 수행함으로써 주파수 도메인에서 편안한 잡음을 생성하도록 구성될 수 있다. 예를 들어, 특정 실시예에서, 신호 프로세서는, 예를 들어, 표시된 편안한 잡음 생성 모드가 주파수-도메인 편안한 잡음 생성 모드이면, 주파수 도메인에서 랜덤 잡음을 생성하고, 주파수 도메인에서 랜덤 잡음을 형상화하여 형상화된 잡음을 획득하고, 형상화된 잡음을 주파수-도메인으로부터 시간 도메인으로 변환함으로써 편안한 잡음을 생성하도록 구성될 수 있다.
예를 들어, WO 2014/096279 A1에 설명된 개념들이 이용될 수 있다.
예를 들어, 하나 이상의 랜덤 시퀀스들을 생성함으로써 FFT 도메인 및 QMF 도메인에서 각각의 개별적인 스펙트럼 대역을 여기시키기 위해 랜덤 생성기가 적용될 수 있다(FFT = Fast Fourier Transform; QMF = Quadrature Mirror Filter). 랜덤 잡음의 형상화는, 예를 들어, 각각의 대역에서 랜덤 시퀀스들의 진폭을 개별적으로 컴퓨팅함으로써 수행되어, 생성된 편안한 잡음의 스펙트럼은, 예를 들어, 오디오 입력 신호를 포함하는 비트스트림에 존재하는, 예를 들어, 실제 배경 잡음의 스펙트럼과 유사할 수 있다. 그 다음, 예를 들어, 컴퓨팅된 진폭은, 예를 들어, 각각의 주파수 대역에서 컴퓨팅된 진폭과 랜덤 시퀀스를 곱함으로써, 예를 들어, 랜덤 시퀀스에 대해 적용될 수 있다. 그 다음, 형상화된 잡음을 주파수 도메인으로부터 시간 도메인으로 변환하는 것이 이용될 수 있다.
일 실시예에서, 2개 이상의 편안한 잡음 생성 모드들 중 제 2 모드는 예를 들어, 선형-예측-도메인 편안한 잡음 생성 모드이다. 신호 프로세서(220)는, 예를 들어, 표시된 편안한 잡음 생성 모드가 선형-예측-도메인 편안한 잡음 생성 모드이면, 선형 예측 필터를 이용함으로써 편안한 잡음을 생성하도록 구성될 수 있다. 예를 들어, 특정 실시예에서, 신호 프로세서는, 예를 들어, 표시된 편안한 잡음 생성 모드가 선형-예측-도메인 편안한 잡음 생성 모드이면, 랜덤 여기 신호를 생성하고, 랜덤 여기 신호를 스케일링하여 스케일링된 여기 신호를 획득하고, LP 인버스 필터를 사용하여 스케일링된 여기 신호를 합성함으로써 편안한 잡음을 생성하도록 구성될 수 있다.
예를 들어, G.722.2(ITU-T G.722.2 Annex A 참조)에 설명된 바와 같이 그리고/또는 G.718(ITU-T G.718 섹션 6.12 및 7.12 참조)에 설명된 바와 같이 편안한 잡음 생성이 이용될 수 있다. 랜덤 여기 신호를 스케일링하여 스케일링된 여기 신호를 획득하고, LP 인버스 필터를 사용하여 스케일링된 여기 신호를 합성함으로써 랜덤 여기 도메인에서 이러한 편안한 잡음을 생성하는 것은 당업계의 통상의 기술자에게 널리 공지되어 있다.
도 5는, 일 실시예에 따른 시스템을 예시한다. 시스템은 앞서 설명된 실시예들 중 하나에 따라 오디오 정보를 인코딩하기 위한 장치(100) 및 앞서 설명된 실시예들 중 하나에 따라 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 장치(200)를 포함한다.
오디오 정보를 인코딩하기 위한 장치(100)의 선택기(110)는 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하도록 구성된다. 오디오 정보를 인코딩하기 위한 장치(100)의 인코딩 유닛(120)은 선택된 편안한 잡음 생성 모드를 표시된 편안한 잡음 생성 모드로서 표시하는 모드 정보를 포함하는 오디오 정보를 인코딩하여 인코딩된 오디오 정보를 획득하도록 구성된다.
또한, 오디오 출력 신호를 생성하기 위한 장치(200)의 디코딩 유닛(210)은 인코딩된 오디오 정보를 수신하도록 구성되고, 또한 인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하도록 구성된다. 오디오 출력 신호를 생성하기 위한 장치(200)의 신호 프로세서(220)는 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 오디오 출력 신호를 생성하도록 구성된다.
도 3은 일 실시예에 따라 편안한 잡음 생성 모드를 선택하기 위한 단계별 접근법을 예시한다.
단계(310)에서, 주파수 도메인에서 배경 잡음 에너지를 추정하기 위해 잡음 추정기가 사용된다. 이것은 일반적으로 대역 별로 수행되어 대역 당 하나의 에너지 추정을 생성한다.
0 ≤ i < N인 N[i] 및 대역들의 수 N (예를 들어, N = 20)
배경 잡음 에너지의 대역 별 추정을 생성하는 임의의 잡음 추정기가 사용될 수 있다. 일례는 G.718(ITU-T G.718 섹션 6.7)에서 사용되는 잡음 추정기이다.
단계(320)에서, 저주파수들의 배경 잡음 정보는
Figure 112017019782649-pct00015
을 사용하여 컴퓨팅되고, I1 및 I2는 신호 대역폭에 의존할 수 있어서, 예를 들어, NB의 경우 I1 = 1, I2 = 9 및 WB의 경우 I1 = 0, I2 = 10이다.
L은 앞서 설명된 바와 같이 저주파수 배경 잡음 값으로 고려될 수 있다.
단계(330)에서, 고주파수들의 배경 잡음 정보는
Figure 112017019782649-pct00016
을 사용하여 컴퓨팅되고, I3 및 I4는 신호 대역폭에 의존할 수 있어서, 예를 들어, NB의 경우 I3 = 16, I4 = 17 및 WB의 경우 I3 = 19, I4 = 20이다.
H는 앞서 설명된 바와 같이 고주파수 배경 잡음 값으로 고려될 수 있다.
단계들(320 및 330)은 예를 들어, 순차적으로 또는 서로 독립적으로 수행될 수 있다.
단계(340)에서 배경 잡음 기울기는
Figure 112017019782649-pct00017
를 사용하여 컴퓨팅된다.
일부 실시예들은 예를 들어, 단계(350)에 따라 진행할 수 있다. 단계(350)에서, 배경 잡음 기울기가 평활화되어, 배경 잡음 기울기의 장기 버전을 생성하고,
Figure 112017019782649-pct00018
α는 예를 들어, 0.9이다. 이러한 순환적 방정식에서, 등호의 좌측에 있는 TLT는 앞서 언급된 현재의 장기 기울기 값 TcLT이고, 등호의 우측에 있는 TLT는 앞서 언급된 상기 이전의 장기 기울기 값 TpLT이다.
단계(360)에서, CNG 모드는 히스테리시스를 갖는 하기 분류기를 사용하여 최종적으로 선택되고,
Figure 112017019782649-pct00019
Figure 112017019782649-pct00020
여기서 thr1 및 thr2는 대역폭에 의존할 수 있어서, 예를 들어, NB의 경우 thr1 = 9, thr2 = 2 및 WB의 경우 thr1 = 45, thr2 = 10이다.
cng_mode는 선택기(110)에 의해 (현재) 선택된 편안한 잡음 생성 모드이다.
cng_mode_prev는 선택기(110)에 의해 이전에 선택되는 이전에 선택된 (편안한 잡음) 생성 모드이다.
단계(360)의 상기 조건들 중 어떠한 조건도 달성되지 않는 경우 발생하는 것은 구현에 의존한다. 일 실시예에서, 예를 들어, 단계(360)의 조건들 둘 모두 중 어떠한 조건도 달성되지 않는 경우, CNG 모드가 이전 상태와 동일하게 유지될 수 있어서,
Figure 112017019782649-pct00021
.
다른 실시예들은 다른 선택 전략들을 구현할 수 있다.
도 3의 실시예에서 thr1은 thr2와 상이하지만, 일부 다른 실시예들에서, thr1은 thr2와 동일하다.
일부 양상들은 장치의 상황에서 설명되었지만, 이러한 양상들은 또한 대응하는 방법의 설명을 표현하는 것이 명백하며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게, 방법의 상황에서 설명되는 양상들은 또한 대응하는 장치의 블록 또는 아이템 또는 특징의 설명을 표현한다.
창작적인 분해된 신호는 디지털 저장 매체 상에 저장될 수 있거나 또는 인터넷과 같은 유선 송신 매체 또는 무선 송신 매체와 같은 송신 매체를 통해 송신될 수 있다.
특정한 구현 요건들에 따라, 본 발명의 실시예들은 하드웨어 또는 소프트웨어로 구현될 수 있다. 구현은, 각각의 방법이 수행되도록 프로그래밍가능 컴퓨터 시스템과 협력하는(또는 협력할 수 있는), 전자적으로 판독가능한 제어 신호들을 저장하는 디지털 저장 매체, 예를 들어, 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 사용하여 수행될 수 있다.
본 발명에 따른 일부 실시예들은, 본원에서 설명되는 방법들 중 하나가 수행되도록 프로그래밍가능 컴퓨터 시스템과 협력할 수 있는, 전자적으로 판독가능한 제어 신호들을 갖는 비일시적 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시예들은 프로그램 코드를 갖는 컴퓨터 프로그램 물건으로서 구현될 수 있고, 프로그램 코드는, 컴퓨터 프로그램 물건이 컴퓨터 상에서 실행되는 경우 본 방법들 중 하나를 수행하도록 동작한다. 프로그램 코드는 예를 들어, 머신-판독가능 캐리어 상에 저장될 수 있다.
다른 실시예들은, 본원에서 설명되는 방법들 중 하나를 수행하기 위한, 머신 판독가능 캐리어 상에 저장되는 컴퓨터 프로그램을 포함한다.
따라서, 달리 말하면, 창작적 방법의 일 실시예는, 컴퓨터 프로그램이 컴퓨터 상에서 실행되는 경우, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
따라서, 창작적 방법들의 추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 포함되고 기록되는 데이터 캐리어(예를 들어, 디지털 저장 매체 또는 컴퓨터 판독가능 매체)이다.
따라서, 창작적 방법의 추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 표현하는 신호들의 시퀀스 또는 데이터 스트림이다. 예를 들어, 신호들의 시퀀스 또는 데이터 스트림은, 예를 들어, 인터넷을 통해, 데이터 통신 접속을 통해 전송되도록 구성될 수 있다.
추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하도록 구성 또는 적응되는 프로세싱 수단, 예를 들어, 컴퓨터 또는 프로그래밍가능 로직 디바이스를 포함한다.
추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
일부 실시예들에서, 프로그래밍가능 로직 디바이스(예를 들어, 필드 프로그래밍가능 게이트 어레이)는 본원에서 설명되는 방법들의 기능들 중 일부 또는 전부를 수행하기 위해 사용될 수 있다. 일부 실시예들에서, 필드 프로그래밍가능 게이트 어레이는, 본원에서 정의되는 방법들 중 하나를 수행하기 위해 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법들은 임의의 하드웨어 장치에 의해 바람직하게 수행된다.
앞서 설명된 실시예들은, 본 발명의 원리들에 대해 단지 예시적이다. 본원에서 설명되는 배열들 및 세부사항들의 변형들 및 변화들이 당업자들에게 자명할 것이 이해된다. 따라서, 본 발명은 후속 특허 청구항들의 범주에 의해서만 제한되며, 본원의 실시예들의 서술 및 설명의 방식으로 제시되는 특정 세부사항들에 의해서는 제한되지 않도록 의도된다.

Claims (16)

  1. 오디오 정보를 인코딩하기 위한 장치로서,
    오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하기 위한 선택기(110), 및
    상기 오디오 정보를 인코딩하기 위한 인코딩 유닛(120)을 포함하고, 상기 오디오 정보는 선택된 편안한 잡음 생성 모드를 표시하는 모드 정보를 포함하고,
    상기 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 주파수-도메인 편안한 잡음 생성 모드이고, 상기 주파수-도메인 편안한 잡음 생성 모드는, 상기 편안한 잡음이 주파수 도메인에서 생성된다는 것과 상기 주파수 도메인에서 생성되는 편안한 잡음이 주파수-대-시간으로 변환된다는 것을 지시하는,
    오디오 정보를 인코딩하기 위한 장치.
  2. 제 1 항에 있어서,
    상기 선택기(110)는, 상기 오디오 입력 신호의 배경 잡음의 기울기를 상기 배경 잡음 특성으로서 결정하도록 구성되고,
    상기 선택기(110)는, 상기 결정된 기울기에 따라 2개 이상의 편안한 잡음 생성 모드로부터 상기 편안한 잡음 생성 모드를 선택하도록 구성되는,
    오디오 정보를 인코딩하기 위한 장치.
  3. 제 2 항에 있어서,
    상기 장치는 복수의 주파수 대역들 각각에 대한 상기 배경 잡음의 대역 별 추정을 추정하기 위한 잡음 추정기(105)를 더 포함하고,
    상기 선택기(110)는, 상기 복수의 주파수 대역들의 추정된 배경 잡음에 따라 기울기를 결정하도록 구성되는,
    오디오 정보를 인코딩하기 위한 장치.
  4. 제 3 항에 있어서,
    상기 잡음 추정기(105)는, 상기 복수의 주파수 대역들의 제 1 그룹의 각각의 주파수 대역의 상기 배경 잡음의 대역 별 추정에 따라, 상기 복수의 주파수 대역들의 제 1 그룹에 대한 제 1 배경 잡음 에너지를 표시하는 저주파수 배경 잡음 값을 결정하도록 구성되고,
    상기 잡음 추정기(105)는, 상기 복수의 주파수 대역들의 제 2 그룹의 각각의 주파수 대역의 상기 배경 잡음의 대역 별 추정에 따라, 상기 복수의 주파수 대역들의 제 2 그룹에 대한 제 2 배경 잡음 에너지를 표시하는 고주파수 배경 잡음 값을 결정하도록 구성되고, 상기 제 1 그룹의 적어도 하나의 주파수 대역은, 상기 제 2 그룹의 적어도 하나의 주파수 대역의 중심 주파수보다 낮은 중심 주파수를 갖고,
    상기 선택기(110)는, 상기 저주파수 배경 잡음 값에 따라 및 상기 고주파수 배경 잡음 값에 따라 상기 기울기를 결정하도록 구성되는,
    오디오 정보를 인코딩하기 위한 장치.
  5. 제 4 항에 있어서,
    상기 잡음 추정기(105)는
    Figure 112017019782649-pct00022

    에 따라 상기 저주파수 배경 잡음 값 L을 결정하도록 구성되고,
    i는 주파수 대역들의 제 1 그룹의 i번째 주파수 대역을 표시하고, I1은 상기 복수의 주파수 대역들 중 제 1 주파수 대역을 표시하고, I2는 상기 복수의 주파수 대역들 중 제 2 주파수 대역을 표시하고, N[i]는 i번째 주파수 대역의 상기 배경 잡음 에너지의 에너지 추정치를 표시하고,
    상기 잡음 추정기(105)는
    Figure 112017019782649-pct00023

    에 따라 상기 고주파수 배경 잡음 값 H를 결정하도록 구성되고,
    i는 주파수 대역들의 제 2 그룹의 i번째 주파수 대역을 표시하고, I3은 상기 복수의 주파수 대역들 중 제 3 주파수 대역을 표시하고, I4는 상기 복수의 주파수 대역들 중 제 4 주파수 대역을 표시하고, N[i]는 i 번째 주파수 대역의 상기 배경 잡음 에너지의 에너지 추정치를 표시하는,
    오디오 정보를 인코딩하기 위한 장치.
  6. 제 4 항에 있어서,
    상기 선택기(110)는, 공식
    Figure 112017019931814-pct00024

    에 따라, 또는 공식
    Figure 112017019931814-pct00025

    에 따라, 또는 공식
    Figure 112017019931814-pct00026

    에 따라, 또는 공식
    Figure 112017019931814-pct00027

    에 따라, 상기 저주파수 배경 잡음 값 L에 따라 및 상기 고주파수 배경 잡음 값 H에 따라 상기 기울기 T를 결정하도록 구성되는,
    오디오 정보를 인코딩하기 위한 장치.
  7. 제 2 항에 있어서,
    상기 선택기(110)는 상기 기울기를 현재의 단기 기울기 값(T)으로서 결정하도록 구성되고,
    상기 선택기(110)는, 상기 현재의 단기 기울기 값에 따라 및 이전의 장기 기울기 값에 따라 현재의 장기 기울기 값을 결정하도록 구성되고,
    상기 선택기(110)는, 상기 현재의 장기 기울기 값에 따라 2개 이상의 편안한 잡음 생성 모드들 중 하나를 선택하도록 구성되는,
    오디오 정보를 인코딩하기 위한 장치.
  8. 제 7 항에 있어서,
    상기 선택기(110)는, 공식
    Figure 112017019782649-pct00028

    에 따라 현재의 상기 장기 기울기 값 TcLT를 결정하도록 구성되고,
    T는 상기 현재의 단기 기울기 값이고,
    TpLT는 상기 이전의 장기 기울기 값이고,
    α는 0 < α < 1인 실수인,
    오디오 정보를 인코딩하기 위한 장치.
  9. 제 7 항에 있어서,
    상기 2개 이상의 편안한 잡음 생성 모드들 중 제 2 모드는 선형-예측-도메인 편안한 잡음 생성 모드이고,
    상기 선택기(110)는, 상기 선택기(110)에 의해 이전에 선택되는 이전의 선택된 생성 모드가 상기 선형-예측-도메인 편안한 잡음 생성 모드이고, 상기 현재의 장기 기울기 값이 제 1 임계값보다 크면, 상기 주파수-도메인 편안한 잡음 생성 모드를 선택하도록 구성되고,
    상기 선택기(110)는, 상기 선택기(110)에 의해 이전에 선택되는 상기 이전의 선택된 생성 모드가 상기 주파수-도메인 편안한 잡음 생성 모드이고, 상기 현재의 장기 기울기 값이 제 2 임계값보다 작으면, 상기 선형-예측-도메인 편안한 잡음 생성 모드를 선택하도록 구성되는,
    오디오 정보를 인코딩하기 위한 장치.
  10. 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 장치로서,
    인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하기 위한 디코딩 유닛(210) ― 상기 모드 정보는 2개 이상의 편안한 잡음 생성 모드들 중 표시된 편안한 잡음 생성 모드를 표시함―, 및
    상기 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 상기 오디오 출력 신호를 생성하기 위한 신호 프로세서(220)를 포함하고,
    상기 2개 이상의 편안한 잡음 생성 모드들 중 제 1 모드는 주파수-도메인 편안한 잡음 생성 모드이고,
    상기 신호 프로세서는, 상기 표시된 편안한 잡음 생성 모드가 상기 주파수-도메인 편안한 잡음 생성 모드이면, 주파수 도메인에서 생성되는 편안한 잡음의 주파수-대-시간 변환을 수행함으로써 상기 주파수 도메인에서 편안한 잡음을 생성하도록 구성되는,
    오디오 출력 신호를 생성하기 위한 장치.
  11. 제 10 항에 있어서,
    상기 2개 이상의 편안한 잡음 생성 모드들 중 제 2 모드는 선형-예측-도메인 편안한 잡음 생성 모드이고,
    상기 신호 프로세서(220)는, 상기 표시된 편안한 잡음 생성 모드가 상기 선형-예측-도메인 편안한 잡음 생성 모드이면, 선형 예측 필터를 이용하여 상기 편안한 잡음을 생성하도록 구성되는,
    오디오 출력 신호를 생성하기 위한 장치.
  12. 시스템으로서,
    오디오 정보를 인코딩하기 위한 제 1 항에 따른 장치(100), 및
    수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 제 10 항에 따른 장치(200)를 포함하고,
    제 1 항에 따른 상기 장치(100)의 선택기(110)는 오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하도록 구성되고,
    제 1 항에 따른 상기 장치(100)의 인코딩 유닛(120)은 상기 선택된 편안한 잡음 생성 모드를 표시된 편안한 잡음 생성 모드로서 표시하는 모드 정보를 포함하는 상기 오디오 정보를 인코딩하여 인코딩된 오디오 정보를 획득하도록 구성되고,
    제 10 항에 따른 상기 장치(200)의 디코딩 유닛(210)은 상기 인코딩된 오디오 정보를 수신하도록 구성되고, 또한 상기 인코딩된 오디오 정보 내에 인코딩된 상기 모드 정보를 획득하기 위해 상기 인코딩된 오디오 정보를 디코딩하도록 구성되고,
    제 10 항에 따른 상기 장치(200)의 신호 프로세서(220)는 상기 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 상기 오디오 출력 신호를 생성하도록 구성되는,
    시스템.
  13. 오디오 정보를 인코딩하기 위한 방법으로서,
    오디오 입력 신호의 배경 잡음 특성에 따라 2개 이상의 편안한 잡음 생성 모드들로부터 편안한 잡음 생성 모드를 선택하는 단계; 및
    상기 오디오 정보를 인코딩하는 단계를 포함하고, 상기 오디오 정보는 상기 선택된 편안한 잡음 생성 모드를 표시하는 모드 정보를 포함하고,
    상기 2개 이상의 편안한 잡음 생성 모드들 중의 제 1의 편안한 잡음 생성 모드는 주파수-도메인 편안한 잡음 생성 모드이고, 상기 주파수-도메인 편안한 잡음 생성 모드는, 상기 편안한 잡음이 주파수 도메인에서 생성된다는 것과 상기 주파수 도메인에서 생성되는 편안한 잡음이 주파수-대-시간으로 변환된다는 것을 지시하는,
    오디오 정보를 인코딩하기 위한 방법.
  14. 수신된 인코딩된 오디오 정보에 기초하여 오디오 출력 신호를 생성하기 위한 방법으로서,
    인코딩된 오디오 정보 내에 인코딩된 모드 정보를 획득하기 위해 인코딩된 오디오 정보를 디코딩하는 단계 ― 모드 정보는 2개 이상의 편안한 잡음 생성 모드들 중 표시된 편안한 잡음 생성 모드를 표시함―, 및
    상기 표시된 편안한 잡음 생성 모드에 따라 편안한 잡음을 생성함으로써 상기 오디오 출력 신호를 생성하는 단계를 포함하고,
    상기 2개 이상의 편안한 잡음 생성 모드들 중 제 1의 편안한 잡음 생성 모드는 주파수-도메인 편안한 잡음 생성 모드이고,
    만약 상기 표시된 편안한 잡음 생성 모드가 상기 주파수-도메인 편안한 잡음 생성 모드인 경우에, 상기 편안한 잡음은 주파수 도메인에서 생성되고 상기 주파수 도메인에서 생성된 편안한 잡음의 주파수-대-시간 변환이 수행되는,
    오디오 출력 신호를 생성하기 위한 방법.
  15. 컴퓨터 또는 신호 프로세서 상에서 실행되는 경우 제 13 항 또는 제 14 항의 방법을 구현하기 위한 컴퓨터 프로그램을 포함하는 컴퓨터-판독가능한 매체.
  16. 삭제
KR1020177005524A 2014-07-28 2015-07-16 편안한 잡음 생성 모드 선택을 위한 장치 및 방법 KR102008488B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14178782.0A EP2980790A1 (en) 2014-07-28 2014-07-28 Apparatus and method for comfort noise generation mode selection
EP14178782.0 2014-07-28
PCT/EP2015/066323 WO2016016013A1 (en) 2014-07-28 2015-07-16 Apparatus and method for comfort noise generation mode selection

Publications (2)

Publication Number Publication Date
KR20170037649A KR20170037649A (ko) 2017-04-04
KR102008488B1 true KR102008488B1 (ko) 2019-08-08

Family

ID=51224868

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177005524A KR102008488B1 (ko) 2014-07-28 2015-07-16 편안한 잡음 생성 모드 선택을 위한 장치 및 방법

Country Status (18)

Country Link
US (3) US10089993B2 (ko)
EP (3) EP2980790A1 (ko)
JP (3) JP6494740B2 (ko)
KR (1) KR102008488B1 (ko)
CN (2) CN113140224B (ko)
AR (1) AR101342A1 (ko)
AU (1) AU2015295679B2 (ko)
CA (1) CA2955757C (ko)
ES (1) ES2802373T3 (ko)
MX (1) MX360556B (ko)
MY (1) MY181456A (ko)
PL (1) PL3175447T3 (ko)
PT (1) PT3175447T (ko)
RU (1) RU2696466C2 (ko)
SG (1) SG11201700688RA (ko)
TW (1) TWI587287B (ko)
WO (1) WO2016016013A1 (ko)
ZA (1) ZA201701285B (ko)

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3989897A (en) * 1974-10-25 1976-11-02 Carver R W Method and apparatus for reducing noise content in audio signals
FI110826B (fi) * 1995-06-08 2003-03-31 Nokia Corp Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä
BR9611050A (pt) 1995-10-20 1999-07-06 America Online Inc Sistema de compressão de som repetitivo
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5903819A (en) * 1996-03-13 1999-05-11 Ericsson Inc. Noise suppressor circuit and associated method for suppressing periodic interference component portions of a communication signal
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6163608A (en) * 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
SE9803698L (sv) * 1998-10-26 2000-04-27 Ericsson Telefon Ab L M Metoder och anordningar i ett telekommunikationssystem
JP2003501925A (ja) * 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
US6832195B2 (en) * 2002-07-03 2004-12-14 Sony Ericsson Mobile Communications Ab System and method for robustly detecting voice and DTX modes
KR100711280B1 (ko) 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
JP2004078235A (ja) * 2003-09-11 2004-03-11 Nec Corp 複数レートで動作する無音声符号化を含む音声符号化・復号装置
US8767974B1 (en) * 2005-06-15 2014-07-01 Hewlett-Packard Development Company, L.P. System and method for generating comfort noise
PL1897085T3 (pl) * 2005-06-18 2017-10-31 Nokia Technologies Oy System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
CN101087319B (zh) * 2006-06-05 2012-01-04 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩系统
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
KR101196506B1 (ko) * 2007-06-11 2012-11-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 임펄스형 부분 및 정적 부분을 갖는 오디오 신호를 인코딩하는 오디오 인코더 및 인코딩 방법, 디코더, 디코딩 방법 및 인코딩된 오디오 신호
CN101394225B (zh) * 2007-09-17 2013-06-05 华为技术有限公司 一种话音传输的方法和装置
CN101335003B (zh) * 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
US8139777B2 (en) * 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
CN101430880A (zh) * 2007-11-07 2009-05-13 华为技术有限公司 一种背景噪声的编解码方法和装置
DE102008009720A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
CN102136271B (zh) * 2011-02-09 2012-07-04 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
EP2676264B1 (en) 2011-02-14 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder estimating background noise during active phases
MY159444A (en) * 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
RU2630390C2 (ru) 2011-02-14 2017-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
US20120237048A1 (en) * 2011-03-14 2012-09-20 Continental Automotive Systems, Inc. Apparatus and method for echo suppression
CN102903364B (zh) * 2011-07-29 2017-04-12 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
CN103093756B (zh) * 2011-11-01 2015-08-12 联芯科技有限公司 舒适噪声生成方法及舒适噪声生成器
CN103137133B (zh) * 2011-11-29 2017-06-06 南京中兴软件有限责任公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
MX366279B (es) * 2012-12-21 2019-07-03 Fraunhofer Ges Forschung Adicion de ruido de confort para modelar el ruido de fondo a bajas tasas de bits.
MX344169B (es) 2012-12-21 2016-12-07 Fraunhofer Ges Forschung Generacion de ruido de confort con alta resolucion espectro-temporal en transmision discontinua de señales de audio.
CN103680509B (zh) * 2013-12-16 2016-04-06 重庆邮电大学 一种语音信号非连续传输及背景噪声生成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Comfort noise aspects. 3GPP TS 26.192 version 11.0.0 Release 11. 2012.10.
EVS Codec Comfort Noise Generation (CNG) Aspects (3GPP TS 26.449 version 12.0.0 Release 12). ETSI TS 126 449 V12.0.0. 2014.10.
EVS Codec Detailed Algorithmic Description (3GPP TS 26.445 version 12.0.0 Release 12). ETSI TS 126 445 V12.0.0. 2014.11.

Also Published As

Publication number Publication date
AR101342A1 (es) 2016-12-14
EP3706120A1 (en) 2020-09-09
PL3175447T3 (pl) 2020-11-02
US11250864B2 (en) 2022-02-15
SG11201700688RA (en) 2017-02-27
CN106663436B (zh) 2021-03-30
CN113140224A (zh) 2021-07-20
WO2016016013A1 (en) 2016-02-04
JP6859379B2 (ja) 2021-04-14
JP7258936B2 (ja) 2023-04-17
EP3175447A1 (en) 2017-06-07
KR20170037649A (ko) 2017-04-04
US20170140765A1 (en) 2017-05-18
CA2955757C (en) 2019-04-30
MY181456A (en) 2020-12-22
JP6494740B2 (ja) 2019-04-03
JP2017524157A (ja) 2017-08-24
PT3175447T (pt) 2020-07-28
TW201606752A (zh) 2016-02-16
CN106663436A (zh) 2017-05-10
MX2017001237A (es) 2017-03-14
US20190027154A1 (en) 2019-01-24
EP2980790A1 (en) 2016-02-03
CA2955757A1 (en) 2016-02-04
RU2696466C2 (ru) 2019-08-01
TWI587287B (zh) 2017-06-11
RU2017105449A (ru) 2018-08-28
AU2015295679A1 (en) 2017-02-16
MX360556B (es) 2018-11-07
BR112017001394A2 (pt) 2017-11-21
US10089993B2 (en) 2018-10-02
ES2802373T3 (es) 2021-01-19
RU2017105449A3 (ko) 2018-08-28
CN113140224B (zh) 2024-02-27
EP3175447B1 (en) 2020-05-06
US20220208201A1 (en) 2022-06-30
AU2015295679B2 (en) 2017-12-21
ZA201701285B (en) 2018-05-30
JP2019124951A (ja) 2019-07-25
JP2021113976A (ja) 2021-08-05

Similar Documents

Publication Publication Date Title
CN102834862B (zh) 用于包括通用音频和语音帧的音频信号的编码器
KR102367538B1 (ko) 다중 채널 신호 인코딩 방법 및 인코더
CN102834863B (zh) 用于包括通用音频和语音帧的音频信号的解码器
CN105247614B (zh) 音频编码器和解码器
US10490199B2 (en) Bandwidth extension audio decoding method and device for predicting spectral envelope
CN104321815A (zh) 用于带宽扩展的高频编码/高频解码方法和设备
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
CN100578618C (zh) 一种解码方法及装置
EP3671737A1 (en) Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system
JP6181773B2 (ja) Celp状コーダのためのサイド情報を用いないノイズ充填
CN107818789B (zh) 解码方法和解码装置
CN104584120A (zh) 生成舒适噪声
KR20150118954A (ko) 저-복잡도 음조-적응 오디오 신호 양자화
KR102008488B1 (ko) 편안한 잡음 생성 모드 선택을 위한 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right