KR20190060887A - 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 - Google Patents

노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 Download PDF

Info

Publication number
KR20190060887A
KR20190060887A KR1020197015048A KR20197015048A KR20190060887A KR 20190060887 A KR20190060887 A KR 20190060887A KR 1020197015048 A KR1020197015048 A KR 1020197015048A KR 20197015048 A KR20197015048 A KR 20197015048A KR 20190060887 A KR20190060887 A KR 20190060887A
Authority
KR
South Korea
Prior art keywords
linear prediction
signal
spectral
noise
linear
Prior art date
Application number
KR1020197015048A
Other languages
English (en)
Other versions
KR102217709B1 (ko
Inventor
저 왕
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20190060887A publication Critical patent/KR20190060887A/ko
Application granted granted Critical
Publication of KR102217709B1 publication Critical patent/KR102217709B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명의 실시예는 선형 예측 기반, 노이즈 신호 처리 방법, 선형 예측 기반, 노이즈 신호 생성 방법, 인코더, 디코더 및 인코딩 디코딩 시스템을 제공한다. 본 발명의 실시예에 따른 노이즈 신호 처리 방법은: 노이즈 신호를 획득하고, 노이즈 신호에 따라 선형 예측 계수를 획득하는 단계; 선형 예측 계수에 따라 노이즈 신호를 필터링하여 선형 예측 잔여 신호를 획득하는 단계; 선형 예측 잔여 신호에 따라, 선형 예측 잔여 신호의 스펙트럼 포락선을 획득하는 단계; 및 선형 예측 잔여 신호의 스펙트럼 포락선을 인코딩하는 단계를 포함한다. 본 발명의 실시예의, 노이즈 신호 처리 방법, 선형 예측 기반, 노이즈 신호 생성 방법, 인코더, 디코더 및 인코딩 디코딩 시스템에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더 근접할 수 있도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일이 복구될 수 있고, 사용자의 주관적 인식 품질은 개선된다.

Description

노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템{NOISE SIGNAL PROCESSING METHOD, NOISE SIGNAL GENERATION METHOD, ENCODER, DECODER, AND ENCODING AND DECODING SYSTEM}
본 발명은 오디오 신호 처리 분야에 관한 것으로서, 보다 상세하게는 노이즈 처리 방법, 노이즈 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템에 관한 것이다.
음성 통신 시간의 약 40%만이 대화이고, 다른 모든 시간에서 침묵 또는 배경 노이즈(통칭하여 이하에서 배경 노이즈라 함)이다. 배경 노이즈의 전송 대역폭을 줄이기 위해, DTX(continuous Transmission) 시스템 및 CNG(Comfort Noise Generation) 기술이 있다.
DTX는, 각 프레임의 오디오 신호를 연속해서 인코딩하고 송신하는 것 대신, 정책에 따라 간헐적으로 배경 노이즈 기간에서 오디오 신호를 인코딩하고 송신한다. 간헐적으로 인코딩되고 송신되는 프레임은 일반적으로 SID(Silence Insertion Descriptor) 프레임으로 지칭된다. SID 프레임은 일반적으로, 에너지 파라미터 및 스펙트럼 파라미터와 같은 배경 노이즈의 파라미터 특성을 일부 포함한다. 디코더 측에서, 디코더는, SID 프레임 디코딩에 의해 획득된 배경 노이즈 파라미터에 따라 연속 배경 노이즈 재생성 신호를 생성할 수 있다. DTX 기간에서 디코더 측의 연속 배경 노이즈 생성 방법은 CNG로서 지칭된다. CNG의 목적은, 인코더 측의 배경 노이즈 신호를 정확하게 재생성하는 것이 아니고, 많은 양의 시간 도메인 배경 노이즈 정보가 배경 노이즈 신호의 불연속 인코딩 및 전송에서 손실되기 때문에, CNG의 목적은 사용자의 주관적 청각 인식 요구를 만족하는 배경 노이즈가 디코더 측에서 생성될 수 있게 하는 것이다. 따라서 사용자의 불편함이 줄어든다.
종래 CNG 기술에서, 컴포트 노이즈(comfort noise)는, 선형 예측 기반의 방법, 즉 디코더 측에서 합성 필터를 여기 시키기 위한 랜덤 노이즈 여기를 사용하는 방법을 이용하여 일반적으로 획득된다. 비록 배경 노이즈 신호가, 이러한 방법을 이용하여 획득되지만, 사용자의 주관적 청각 인식 측면에서, 생성된 컴포트 노이즈와 원래 배경 노이즈 사이에 구체적 차이가 있다. 연속적으로 인코딩된 프레임이 CN(Comfort Noise) 프레임으로 운반되면, 사용자의 주관적 청각 인식에서 이러한 차이는 사용자의 주관적 불편함을 유발할 수 있다.
CNG를 사용하는 방법은, 구체적으로, 3GPP(3rd Generation Partnership Project)에서 AMR-WB(Adaptive Multi-rate Wideband) 표준으로 규정되어 있고, AMR-WB의 CNG 기술은 또한 선형 예측을 기반으로 한다. AMR-WB 표준에서, SID 프레임은 양자화된 배경 노이즈 신호 에너지 계수 및 양자화된 선형 예측 계수를 포함하고, 배경 노이즈 에너지 계수는 배경 노이즈의 로그 에너지 계수이며, 양자화된 선형 예측 계수는 양자화된 ISF(Immittance Spectral Frequency)로써 표현된다. 디코더 측에서, 현재 배경 노이즈의, 에너지 및 선형 예측 계수는, SID 프레임에 포함된 에너지 계수 정보 및 서형 예측 계수에 따라 추정된다. 랜덤 노이즈 시퀀스는 난수 발생기를 사용하여 생성되고, 컴포트 노이즈를 생성하기 위한 여기 신호로서 사용된다. 랜덤 노이즈 시퀀스의 에너지가 예측된 현재 배경 노이즈의 에너지와 같도록, 랜덤 노이지 시퀀스의 이득은 현재 배경 노이즈의 예측된 에너지에 따라 조정된다. 게인 조정 후 획득된 랜덤 시퀀스 여기는 합성 필터를 여기 시키는 데 사용되고, 합성 필터의 계수는 현재 배경 노이즈의 예측된 선형 예측 계수이다. 합성 필터의 출력은 생성된 컴포트 노이즈이다.
여기 신호로서 랜덤 노이즈 시퀀스를 사용하여 컴포트 노이즈를 생성하는 방법에서, 상대적으로 편안한 노이즈가 획득될 수 있으나, 원래 배경 노이즈의 스펙트럼 포락선 또한, 대략 회복될 수 있고, 원래 배경 노이즈의 스펙트럼 디테일이 손실될 수 있다. 그 결과, 주관적 청각 인식에 대해, 생성된 컴포트 노이즈와 원래 배경 노이즈 사이에 구체적인 차이가 여전히 있다. 그러한 차이는, 인코딩된 대화 세그먼트(speech segment)가 연속적으로 컴포트 노이즈 세그먼트로 전송될 때, 사용자의 주관적 청각 인식 불편을 유발할 수 있다.
이러한 관점에서, 전술한 문제점을 해결하기 위해, 본 발명의 실시 예는 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더와, 인코딩 및 디코딩 시스템을 제공한다. 본 발명의 실시예에서의 노이즈 처리 방법, 노이즈 생성 방법, 인코더, 디코더, 및 인코딩-디코딩 시스템에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더 근접할 수 있도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일은 복구될 수 있고, 연속 전송이 불연속 전송으로 이동할 때 생기는 "전환 센스(switching sense)"가 완화되고, 사용자의 주관적 청각 인식 품질이 개선된다.
본 발명의 제1 측면의 실시예는 선형 예측기반의, 노이즈 신호를 처리하는 신호 처리 방법을 제공하고, 이러한 방법은, 노이즈 신호를 획득하고, 상기 노이즈 신호에 따라 선형 예측 계수를 획득하는 단계; 상기 선형 예측 계수에 따라, 상기 노이즈 신호를 필터링하여 선형 예측 잔여 신호(linear prediction residual signal)를 획득하는 단계: 상기 선형 예측 잔여 신호에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 포락선(spectral envelope)을 획득하는 단계; 및 상기 선형 잔여 신호의 스펙트럼 포락선을 인코딩하는 단계를 포함한다.
본 발명의 실시예에서의 노이즈 신호 처리 방법에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더욱 근접하도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일이 복구될 수 있고, 사용자의 주관적 인식 품질은 개선된다.
본 발명의 제1 측면의 실시예를 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제1 구현 방식에서, 상기 선형 예측 잔여 신호에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 포락선(spectral envelope)을 획득하는 단계 후, 상기 신호 처리 방법은, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일(spectral detail)을 획득하는 단계를 더 포함하고, 이에 대응하여, 상기 선형 잔여 신호의 스펙트럼 포락선을 인코딩하는 단계는 구체적으로, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하는 단계를 포함한다.
본 발명의 실시예의 제1 측면의 가능한 제1 구현 방식을 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제2 구현 방식에서, 선형 예측 잔여 신호를 획득하는 단계 후, 상기 신호 처리 방법은, 상기 선형 예측 잔여 신호에 따라, 상기 선형 예측 잔여 신호의 에너지를 획득하는 단계를 더 포함하고, 이에 대응하여, 상기 선형 잔여 신호의 스펙트럼 디테일을 인코딩하는 단계는 구체적으로, 상기 선형 예측 계수, 상기 선형 예측 잔여 신호의 에너지, 및 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하는 단계를 포함한다.
본 명의 실시예의 제1 측면의 가능한 제2 구현 방식을 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제3 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하는 단계는 구체적으로, 상기 선형 예측 잔여 신호의 에너지에 따라, 랜덤 노이즈 여기 신호(random noise excitation signal)를 획득하는 단계; 및 상기 선형 예측 잔여 신호의 스펙트럼 포락선과 상기 랜덤 노이즈 여기 신호의 스펙트럼 포락선 사이의 차를 상기 선형 예측 잔여 신호의 스펙트럼 디테일로 사용하는 단계를 포함한다.
본 발명의 실시예의 제1 측면의 가능한 제1 구현 방식 및 본 발명의 실시예의 제1 측면의 가능한 제2 구현 방식을 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제4 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하는 단계는 구체적으로, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라 제1 대역폭의 스펙트럼 포락선을 획득하는 단계; 및 상기 제1 대역폭의 스펙트럼 포락선에 따라 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하는 단계를 포함하고, 상기 제1 대역폭은 상기 선형 예측 잔여 신호의 대역폭 범위 내에 있다.
본 명의 실시예의 제1 측면의 가능한 제4 구현 방식을 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제5 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라 제1 대역폭의 스펙트럼 포락선을 획득하는 단계는 구체적으로, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하고, 상기 선형 예측 잔여 신호의 제1 부분의 스펙트럼을 상기 제1 대역폭의 스펙트럼 포락선으로 사용하는 단계를 포함하고, 상기 제1 부분의 스펙트럼 구조는, 상기 제1 부분을 제외한, 상기 선형 예측 잔여 신호의 다른 부분의 스펙트럼 구조보다 강하다.
본 명의 실시예의 제1 측면의 가능한 제5 구현 방식을 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제6 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 구조는 이하의 방식: 상기 노이즈 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식; 및 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식 중 어느 하나에 의해 계산된다.
본 명의 실시예의 제1 측면의 가능한 제6 구현 방식을 참조하면, 본 발명의 실시예의 제1 측면의 가능한 제7 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하는 단계 후, 상기 신호 처리 방법은, 상기 선형 예측 잔여 신호의 스펙트럼 디테일에 따라 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하고, 상기 스펙트럼 구조에 따라 상기 선형 예측 잔여 신호의 제2 대역폭의 스펙트럼 디테일을 획득하는 단계를 더 포함하고, 이에 대응하여, 상기 선형 잔여 신호의 스펙트럼 포락선을 인코딩하는 단계는 구체적으로, 상기 선형 예측 잔여 신호의 제2 대역폭의 스펙트럼 디테일을 인코딩하는 단계를 포함하며, 상기 제2 대역폭은 상기 선형 예측 잔여 신호의 대역폭 범위 내에 있고, 상기 제2 대역폭의 스펙트럼 구조는, 상기 제2 대역폭을 제외한, 상기 선형 예측 잔여 신호의 대역폭의 다른 부분의 스펙트럼 구조보다 강하다.
본 발명의 제2 측면의 실시예는 선형 예측 기반의, 컴포트 노이즈 신호 생성 방법을 제공하고, 이러한 방법은, 비트스트림(bitstream)을 수신하고, 상기 비트스트림을 디코딩하여 스펙트럼 디테일(spectral detail) 및 선형 예측 계수를 획득하는 단계 - 상기 스펙트럼 디테일은 선형 예측 여기 신호(linear prediction excitation signal)의 스펙트럼 포락선(spectral envelope)을 지시함 -; 상기 스펙트럼 디테일에 따라, 상기 선형 예측 여기 신호를 획득하는 단계; 및 상기 선형 예측 계수 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계를 포함한다.
본 발명의 실시예에서의 노이즈 생성 방법에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더욱 근접하도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일이 복구될 수 있고, 사용자의 주관적 인식 품질은 개선된다.
본 발명의 제2 측면의 실시예를 참조하면, 본 발명의 제2 측면의 실시예의 가능한 제1 구현 방식에서, 상기 스펙트럼 디테일은 상기 선형 예측 여기 신호의 스펙트럼 포락선(spectral envelope)이다.
본 발명의 제2 측면의 실시예의 가능한 제1 구현 방식을 참조하면, 본 발명의 제2 측면의 실시예의 가능한 제2 구현 방식에서, 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계 전, 상기 신호 생성 방법은, 상기 선형 예측 여기의 에너지에 따라, 제1 노이즈 여기 신호를 획득하는 단계; 및 상기 제1 노이즈 여기 신호 및 상기 선형 예측 여기 신호에 따라 상기 스펙트럼 포락선을 획득하는 단계를 더 포함하고, 상기 제1 노이즈 여기 신호의 에너지는 상기 선형 예측 여기의 에너지와 같고, 이에 대응하여, 상기 선형 예측 계수 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계는 구체적으로, 상기 선형 예측 계수 및 상기 제2 노이즈 여기 신호에 따라, 상기 컴포트 노이즈 신호를 획득하는 단계를 포함한다.
본 발명의 제2 측면의 실시예를 참조하면, 본 발명의 제2 측면의 실시예의 가능한 제3 구현 방식에서, 상기 비트스트림은 선형 예측 여기의 에너지를 포함하고, 상기 선형 예측 계수 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계 전, 상기 신호 생성 방법은, 상기 선형 예측 여기의 에너지에 따라, 제1 노이즈 여기 신호를 획득하는 단계; 및 상기 제1 노이즈 여기 신호 및 상기 선형 예측 여기 신호에 따라 제2 노이즈 여기 신호를 획득하는 단계를 더 포함하고, 상기 제1 노이즈 여기 신호의 에너지는 상기 선형 예측 여기의 에너지와 같고, 이에 대응하여, 상기 선형 예측 계수 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계는 구체적으로, 상기 선형 예측 계수 및 상기 제2 노이즈 여기 신호에 따라, 상기 컴포트 노이즈 신호를 획득하는 단계를 포함한다.
본 발명의 제3 측면의 실시예는 인코더를 제공하고, 이러한 인코더는, 노이즈 신호를 획득하고, 상기 노이즈 신호에 따라 선형 예측 계수를 획득하도록 구성된 획득 모듈; 상기 획득 모듈에 의해 획득된 상기 선형 예측 계수에 따라, 상기 노이즈 신호를 필터링하여 선형 예측 잔여 신호(linear prediction residual signal)를 획득하도록 구성된 필터; 상기 선형 예측 잔여 신호에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 포락선(spectral envelope)을 획득하도록 구성된 스펙트럼 포락선 생성 모듈; 및 상기 선형 예측 잔여 신호의 스펙트럼 포락선을 인코딩하도록 구성된 인코딩 모듈을 포함한다.
본 발명의 실시예에서의 인코더에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더욱 근접하도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일이 복구될 수 있고, 사용자의 주관적 인식 품질은 개선된다.
본 발명의 제3 측면의 실시예를 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제1 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일(spectral detail)을 획득하도록 구성된 스펙트럼 디테일 생성 모듈을 더 포함하고, 이에 대응하여, 상기 인코딩 모듈은 구체적으로, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하도록 구성된다.
본 발명의 제3 측면의 가능한 제1 구현 방식을 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제2 구현 방식에서, 상기 인코더는, 상기 선형 예측 잔여 신호에 따라, 상기 선형 예측 잔여 신호의 에너지를 획득하도록 구성된 잔여 에너지 계산 모듈을 더 포함하고, 이에 대응하여, 상기 인코딩 모듈은 구체적으로, 상기 선형 예측 계수, 상기 선형 예측 잔여 신호의 에너지, 상기 선형 예측 잔여 신호의 스펙트럼 디테일, 및 상기 노이즈 신호를 인코딩하도록 구성된다.
본 발명의 제3 측면의 가능한 제2 구현 방식을 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제3 구현 방식에서, 상기 스펙트럼 디테일 생성 모듈은 구체적으로, 상기 선형 예측 잔여 신호의 에너지에 따라, 랜덤 노이즈 여기 신호(random noise excitation signal)를 획득하고, 상기 선형 예측 잔여 신호의 스펙트럼 포락선 및 상기 랜덤 노이즈 여기 신호의 스펙트럼 포락선 사이의 차를 상기 선형 예측 잔여 신호의 스펙트럼 디테일로 사용하도록 구성된다.
본 발명의 제3 측면의 가능한 제1 구현 방식 및 본 발명의 제3 측면의 가능한 제2 구현 방식을 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제4 구현 방식에서, 상기 스펙트럼 디테일 생성 모듈은, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 제1 대역폭의 스펙트럼 포락선을 획득하도록 구성된 제1 대역폭 스펙트럼 포락선 생성 유닛; 및 상기 제1 대역폭의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하도록 구성된 스펙트럼 디테일 계산 유닛을 포함하고, 상기 제1 대역폭은 상기 선형 예측 잔여 신호의 대역폭 범위 내에 있다.
본 발명의 제3 측면의 가능한 제4 구현 방식을 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제5 구현 방식에서, 상기 제1 대역폭 스펙트럼 포락선 생성 유닛은 구체적으로, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하고, 상기 선형 예측 잔여 신호의 제1 부분의 스펙트럼을 상기 제1 대역폭의 스펙트럼 포락선으로 사용하도록 구성되고, 상기 제1 부분의 스펙트럼 구조는, 상기 제1 부분을 제외한, 상기 선형 예측 잔여 신호의 다른 부분의 스펙트럼 구조보다 강하다.
본 발명의 제3 측면의 가능한 제5 구현 방식을 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제6 구현 방식에서, 상기 제1 대역폭 스펙트럼 포락선 유닛은 이하의 방식: 상기 노이즈 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식; 및 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식 중 어느 한 방식으로, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산한다.
본 발명의 제3 측면의 가능한 제1 구현 방식을 참조하면, 본 발명의 제3 측면의 실시예의 가능한 제7 구현 방식에서, 상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하고, 상기 선형 예측 잔여 신호의 스펙트럼 디테일에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하며, 상기 스펙트럼 구조에 따라, 상기 선형 예측 잔여 신호의 제2 대역폭의 스펙트럼 디테일을 획득하도록 구성되고, 상기 제2 대역폭은 상기 선형 예측 잔여 신호의 대역폭 범위 내에 있고, 상기 제2 대역폭의 스펙트럼 구조는, 상기 제2 대역폭을 제외한, 상기 선형 예측 잔여 신호의 대역폭의 다른 부분의 스펙트럼 구조보다 강하며, 이에 대응하여, 상기 인코딩 모듈은 구체적으로, 상기 선형 예측 잔여 신호의 제2 대역폭의 스펙트럼 디테일을 인코딩하도록 구성된다.
본 발명의 제4 측면의 실시예는 디코더를 제공하고, 이러한 디코더는, 비트스트림(bitstream)을 수신하고, 상기 비트스트림을 디코딩하여 스펙트럼 디테일(spectral detail) 및 선형 예측 계수를 획득하도록 구성된 수신 모듈 - 상기 스펙트럼 디테일은 선형 예측 여기 신호(linear prediction excitation signal)의 스펙트럼 포락선(spectral envelope)을 지시함 -; 상기 스펙트럼 디테일에 따라, 선형 예측 여기 신호를 획득하도록 구성된 선형 예측 여기 신호 생성 모듈; 및 상기 선형 예측 계수 및 상기 선형 예측 여기 신호에 따라, 컴포트 노이즈 신호(comfort noise signal)를 획득하도록 구성된 컴포트 노이즈 신호 생성 모듈을 포함한다.
본 발명의 실시예에서의 디코더에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더욱 근접하도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일이 복구될 수 있고, 사용자의 주관적 인식 품질은 개선된다.
본 발명의 제4 측면의 실시예를 참조하면, 본 발명의 제4 측면의 실시예의 가능한 제1 구현 방식에서, 상기 스펙트럼 디테일은 상기 선형 예측 여기 신호의 스펙트럼 포락선이다.
본 발명의 제2 측면의 실시예의 가능한 제1 구현 방식을 참조하면, 본 발명의 제2 측면의 실시예의 가능한 제2 구현 방식에서, 본 발명의 제2 측면의 실시예의 가능한 제1 구현 방식을 참조하면, 본 발명의 제2 측면의 실시예의 가능한 제2 구현 방식에서, 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계 전, 상기 신호 생성 방법은, 상기 선형 예측 여기의 에너지에 따라, 제1 노이즈 여기 신호를 획득하는 단계; 및 상기 제1 노이즈 여기 신호 및 상기 선형 예측 여기 신호에 따라 상기 스펙트럼 포락선을 획득하는 단계를 더 포함하고, 상기 제1 노이즈 여기 신호의 에너지는 상기 선형 예측 여기의 에너지와 같고, 이에 대응하여, 상기 선형 예측 계수 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계는 구체적으로, 상기 선형 예측 계수 및 상기 제2 노이즈 여기 신호에 따라, 상기 컴포트 노이즈 신호를 획득하는 단계를 포함한다.
본 발명의 제4 측면의 실시예를 참조하면, 본 발명의 제4 측면의 실시예의 가능한 제3 구현 방식에서, 상기 비트스트림은 선형 예측 여기의 에너지를 포함하고, 상기 디코더는, 상기 선형 예측 여기의 에너지에 따라, 제1 노이즈 여기 신호를 획득하도록 구성된 제1 노이즈 여기 신호 생성 모듈; 및 상기 제1 노이즈 여기 신호 및 상기 선형 예측 여기 신호에 따라, 제2 노이즈 여기 신호를 획득하도록 구성된 제2 노이즈 여기 신호 생성 모듈을 더 포함하며, 상기 제1 노이즈 여기 신호의 에너지는 상기 선형 예측 여기의 에너지와 같고, 이에 대응하여, 상기 컴포트 노이즈 신호 생성 모듈은 구체적으로, 상기 선형 예측 계수 및 상기 제2 노이즈 여기 신호에 따라, 상기 컴포트 노이즈 신호를 획득하도록 구성된다.
본 발명의 제5 측면은 인코딩 및 디코딩 시스템을 제공하고, 이러한 인코딩 및 디코딩 시스템은, 본 발명의 제3 측면의 실시예 중 어느 하나에 기재된 인코더 및 본 발명의 제3 측면의 실시예 중 어느 하나에 기재된 디코더를 포함한다.
본 발명의 실시예에서의, 인코딩 및 디코딩 시스템에 따르면, 사용자의 주관적 청각 인식에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더 근접하도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일은 복구될 수 있고, 사용자의 주관적 인식 품질은 개선된다.
본 발명의 실시예 또는 종래 기술의 기술적 해결 수단을 더욱 명확하게 설명하기 위해, 이하에서 실시예 또는 종래 기술의 설명에 필요한 첨부된 도면을 간략하게 설명한다. 분명한 것은, 이하의 설명에서 첨부된 도면은 단지 본 발명의 일부 실시예를 나타낸 것일 뿐, 당업자는, 창의적 노력 없이, 첨부된 도면으로부터 다른 도면을 유도할 수 있다는 것이다.
도 1은 종래 기술에서 노이즈 생성의 흐름도이다.
도 2는 종래 기술에서 노이즈 스펙트럼 생성의 개략도이다.
도 3은 본 발명의 실시예에 따른 인코더 측에서 스펙트럼 디테일 잔여를 생성의 개략도이다.
도 4는 본 발명의 실시예에 따른 디코더 측에서 컴포트 노이즈 스펙트럼 생성의 개략도이다.
도 5는 본 발명의 실시예에 따른 선형 예측 기반의 노이즈 처리 방법의 흐름도이다.
도 6은 본 발명의 실시예에 따른 컴포트 노이즈 생성 방법의 흐름도이다.
도 7은 본 발명의 실시예에 따른 인코더의 구조도이다.
도 8은 본 발명의 실시예에 따른 디코더의 구조도이다.
도 9는 본 발명의 실시예에 따른 인코딩 및 디코딩 시스템의 구조도이다.
도 10은 본 발명의 실시예에 따른 인코더 측에서 디코더 측으로의 모든 절차의 개략도이다.
도 11은 본 발명의 실시예에 따른 인코더 측에서 잔여 스펙트럼 디테일 획득의 개략도이다.
이하에서, 본 발명의 실시 예에서 첨부된 도면을 참조하여 본 발명의 실시 예에서의 기술적 해결 수단을 명확하게 설명한다. 분명한 것은, 설명되는 실시 예는 본 발명의 모든 실시예가 아닌, 본 발명의 일부 실시예라는 것이다. 창의적 노력 없이, 본 발명의 실시 예에 기초하여 당업자에 의해 얻어진 다른 모든 실시예는 본 발명의 보호 범위 내에 포함된다.
도 1은 선형 예측 원칙에 기초한, 기본 CNG(Comfort Noise Generation) 기술의 블록도이다. 선형 예측의 기본은 이하와 같다.: 복수의 대화 신호 샘플링 지점 사이의 대응 관계가 있기 때문에, 지난 샘플링 지점의 값은 현재 또는 미래 샘플링 지점의 값을 예측하는 데 사용될 수 있다. 즉, 대화의 부분의 샘플링은, 과거의 여러 조각의 샘플링의 선형 조합을 사용하여 근사치가 될 수 있고, 예측 계수는 실제 대화 신호 샘플링 값과 평균 제곱 원리(mean square principle)를 사용하여 최솟값에 도달하는 선형 예측 샘플링 값 사이의 에러를 생성하는 것에 의해 계산될 수 있다. 이러한 예측 계수는 대화 신호 특성을 반영한다. 따라서, 이러한 대화 특성 파라미터의 그룹은 대화 인식, 대화 분석 등을 수행하는 데 사용될 수 있다.
도 1에 도시된 바와 같이, 인코더 측에서, 인코더는 입력 시간 영역 배경 노이즈 신호에 따라, 선형 예측 계수(LPC: Linear Prediction Coefficient)를 획득한다. 종래 기술에서, 선형 예측 계수를 획득하는 복수의 구체적인 방법이 제공되고, 상대적 공통 방법은, 예를 들어, 레빈슨 더빈(Levinson Durbin) 알고리즘이다.
입력 시간 영역 배경 노이즈 신호는 추가로, 선형 예측 분석 필터를 통과할 수 있고, 필터링 후 잔여 신호, 즉, 선형 예측 잔여(linear prediction residual)가 획득된다. 선형 예측 분석 필터의 필터 계수는, 전술한 단계에서 획득된 LPC 계수이다. 선형 예측 잔여의 에너지는 선형 예측 잔여에 따라 획득된다. 어느 정도, 선형 예측 잔여의 에너지와 LPC 계수는 각각 입력 배경 노이즈 신호의 에너지 및 입력 배경 노이즈 신호의 스펙트럼 포락선을 지시한다. 선형 예측 잔여의 에너지와 LPC 계수는 SID(Silence Insertion Descriptor) 프레임으로 인코딩된다. 구체적으로, SID 프레임에서 LPC 계수를 인코딩하는 것은, 일반적으로 LPC 계수에 대해 직접 형성되지 않지만, ISP(Immittance Spectral Pair), ISF(mmittance Spectral Frequency), 및 LSP(Line Spectral Pair)/LSF(Spectral Frequency)와 같은 일부 변환을 형성한다. 그러나, 이것은 모두 본질적으로 LPC 계수를 지시한다.
이에 대응하여, 구체적 시간에, 디코더에 의해 수신된 SID 프레임은 연속적이지 않다. 디코더는 SID 프레임을 디코딩하여, 디코딩된, 선형 예측 잔여의 에너지와 디코딩된 LPC 계수를 획득한다. 디코더는 선형 예측 잔여의 에너지, 및 현재 컴포트 노이즈 프레임을 생성하는 데 사용되는, 선형 예측 잔여의 에너지 및 LPC 계수를 업데이트 하기 위한 디코딩 방식으로 획득된 LPC 계수를 사용한다. 합성 필터를 여기하기 위해, 디코더는 랜덤 노이즈 여기를 사용 방법을 이용하여 컴포트 노이즈를 생성할 수 있고, 랜덤 노이즈 여기는 랜덤 노이즈 여기 생성기에 의해 생성된다. 게인 조정 후 획득된 랜덤 노이즈 여기의 에너지가 현재 컴포트 노이즈 프레임의 선형 예측 잔여의 에너지와 같도록, 게인 조정은 대체로 생성된 랜덤 노이즈 여기에 수행된다. 컴포트 노이즈를 생성하도록 구성된 합성 필터의 필터 계수는 현재 컴포트 노이즈 프레임의 LPC 계수이다.
선형 예측 계수는 입력 배경 노이즈 신호의 스펙트럼 포락선을 어느 정도 나타낼 수 있기 때문에, 랜덤 노이즈 여기에 의해 여기 된 선형 예측 합성 필터의 출력은 원래 배경 노이즈 신호의 스펙트럼 포락선을 어느 정도 나타낼 수 있다. 도 2는 CNG 기술에서 컴포트 노이즈 스펙트럼 생성을 나타낸한다.
종래 선형 예측 기반 CNG 기술에서, 컴포트 노이즈는 랜덤 노이즈 여기 방식으로 생성되고, 컴포트 노이즈의 스펙트럼 포락선은 단지 원래 배경 노이즈를 나타내는 대략적 포락선이다. 그러나 원래 배경 노이즈가 구체적 스펙트럼 구조를 가지면, 종래 CNG 기술 방식으로 생성된 컴포트 노이즈와 원래 배경 노이즈 사이에는, 사용자의 주관적 청각 인식에 대하여, 여전히 구체적 차이가 존재한다.
인코더가 연속 인코딩에서 불연속 인코딩으로 트랜짓(transit)될 때, 즉, 활성 음성 신호가 배경 노이즈 신호로 트랜짓되면, 배경 노이즈 세그먼트(segment)의 일부 초기 노이즈 프레임은 여전히 연속 인코딩 방식으로 인코딩된다. 따라서, 디코더에 의해 재생성된 배경 노이즈 신호는 고품질 배경 노이즈로부터 컴포트 노이즈로 트랜지션(transition)을 가진다. 원래 배경 노이즈가 구체적 스펙트럼 구조를 가지면, 이러한 트랜지션은, 컴포트 노이즈와 원래 배경 노이즈 사이의 차이 때문에, 사용자의 주관적 청각 인식에 불편함을 유발할 수 있다. 이러한 문제를 해결하기 위해, 본 발명의 실시예의 기술적 해결 과제의 목적은 생성된 컴포트 노이즈로부터 원래 배경 노이즈의 스펙트럼 디테일을 어느 정도 복구하는 것이다.
이하에서, 도 3 및 4를 참조하여, 본 발명의 실시예의 기술적 해결 수단의 전체 상황을 설명한다.
도 3에 도시된 바와 같이, 원래 배경 노이즈 신호가 디코더 측에서 생성된 초기 컴포트 노이즈 신호와 비교되면, 초기 차이 신호가 획득되고, 초기 차이 신호의 스펙트럼은 초기 컴포트 노이즈 신호와 원래 배경 노이즈 신호의 스펙트럼 사이의 차이를 나타낸다. 초기 차이 신호는 선형 예측 분석 필터에 의해 필터링되고, 잔여 신호 R이 획득된다.
도 4에 도시된 바와 같이, 디코더 측에서, 전술한 과정의 반대 과정으로서, 잔여 신호 R이 여기 신호로 사용되고, 선형 예측 합성 필터를 통과할 수 있으면, 초기 차이 신호는 복구될 수 있다. 본 발명의 실시예에서, 선형 예측 합성 필터의 계수가 완전히 분석 필터의 계수와 동일하고, 디코더 측 잔여 신호 R과 인코더 측 잔여 신호 R이 동일하면, 획득된 신호는 초기 차이 신호와 동일하다. 컴포트 노이즈가 생성될 때, 스펙트럼 디테일 여기는 종래 랜덤 노이즈 여기에 추가되고, 스펙트럼 디테일 여기는 전술한 잔여 신호 R에 대응한다. 랜덤 노이즈 여기와 스펙트럼 디테일 여기의 합은 선형 합성 필터를 여기하기 위한 완전한 여기 신호로 사용된다. 마지막으로 획득된 컴포트 노이즈 신호는, 원래 배경 노이즈 신호와 동일하거나 유사한 스펙트럼을 가진다. 본 발명의 실시예에서, 랜덤 노이즈 여기와 스펙트럼 디테일 여기의 신호 합은 랜덤 노이즈 여기의 시간 영역 신호와 스펙트럼 디테일 여기의 시간 영역 신호를 겹치는 것으로 직접 획득된다. 즉, 동시에 샘플링 지점에 직접 추가를 수행하는 것으로 획득된다.
본 발명의 기술적 해결 수단에서, SID 프레임은 추가로, 선형 예측 잔여 신호 R의 스펙트럼 디테일 정보를 포함하고, 선형 예측 잔여 신호 R의 스펙트럼 디테일 정보는 인코더 측에서 인코딩되고 디코딩 측으로 전송된다. 스펙트럼 디테일 정보는 완전한 스펙트럼 포락선, 부분 스펙트럼 포락선, 또는 스펙트럼 포락선과 그라운드 포락선(ground envelope) 사이의 차이에 관한 정보일 수 있다. 여기에서 그라운드 포락선은, 평균 포락선 또는 다른 신호의 스펙트럼 포락선일 수 있다.
디코더 측에서, 컴포트 노이즈를 생성하는 데 사용되는 여기 신호를 생성할 때, 디코더는 랜덤 노이즈 여기에 추가하여 스펙트럼 디테일 여기를 생성한다. 랜덤 노이즈 여기와 스펙트럼 디테일 여기를 결합하여 획득된 여기 합(sum excitation)은 선형 예측 합성 필터를 통과할 수 있고, 컴포트 노이즈가 획득된다. 배경 노이즈 신호의 위상은 대체로 임의의 특징이기 때문에, 스펙트럼 디테일 여기 신호의 스펙트럼 포락선이 잔여 신호 R의 스펙트럼 디테일과 동일한 한, 스펙트럼 디테일 여기 신호의 위상은 잔여 신호 R의 위상과 일치할 필요가 없다.
이하에서, 도 5를 참조하여, 본 발명의 실시예에서의 선형 예측 기반, 노이즈 신호 처리 방법을 설명한다. 도 5에 도시된 바와 같이, 선형 예측 기반, 노이즈 신호 처리 방법은 이하의 단계를 포함한다.
단계(S51): 노이즈 신호를 획득하고 노이즈 신호에 따라 선형 예측 계수를 획득한다.
선형 예측 계수를 획득하는 많은 방법이 종래 기술에서 제공된다. 구체적 예를 들어, 노이즈 프레임의 선형 예측 계수는 레빈슨 더반(Levinson-Durbin) 알고리즘을 사용하여 획득된다.
단계(S52): 선형 예측 계수에 따라 노이즈 신호를 필터링하여 선형 예측 잔여 신호를 획득한다.
노이즈 신호 프레임은, 오디오 신호 프레임의 선형 예측 잔여를 획득하기 위해 선형 예측 분석 필터를 통과할 수 있다. 선형 예측 분석 필터의 필터 계수에 대해, 단계(S51)에서 획득된 선형 예측 계수에 기준이 만들어져야 한다.
실시예에서, 선형 예측 분석 필터의 필터 계수는 단계(S51)에서 계산된 선형 예측 계수와 같을 수 있다. 다른 실시예에서, 선형 예측 분석 필터의 필터 계수는 이전에 계산된 선형 예측 계수가 양자화된 후 획득된 값일 수 있다.
단계(S53): 선형 예측 잔여 신호에 따라, 선형 예측 잔여 신호의 스펙트럼 포락선을 획득한다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 포락선이 획득된 후, 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 디테일이 획득된다.
선형 예측 잔여 신호의 스펙트럼 디테일은 선형 예측 잔여의 스펙트럼 포락선 및 랜덤 노이즈 여기의 스펙트럼 포락선 사이의 차이에 의해 지시될 수 있다. 랜덤 노이즈 여기는 인코더에서 생성된 로컬 여기이고, 랜덤 노이즈 여기의 생성 방식은 디코더에서의 랜덤 노이즈 여기 생성 방식과 동일하다. 여기에서, 일관된 생성 방식은 난수 생성기의 형태 일관성 구현만을 지시하지 않고, 난수 생성기의 랜덤 시드(random seed)의 동기화가 유지되는것을 지시할 수 있다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 디테일은 완전한 스펙트럼 포락선, 또는 부분 스펙트럼 포락선, 또는 스펙트럼 포락선과 그라운드 포락선 사이의 차이에 대한 정보일 수 있다. 여기에서, 그라운드 포락선은 포락선 평균 또는, 다른 신호의 스펙트럼 포락선일 수 있다.
랜덤 노이즈 여기의 에너지는 선형 예측 잔여의 에너지 신호와 일치한다. 본 발명의 실시예에서, 선형 예측 잔여의 에너지 신호는 선형 예측 잔여 신호를 사용하여 직접 획득될 수 있다.
선형 예측 잔여 신호의 스펙트럼 포락선 및 랜덤 노이즈 여기의 스펙트럼 포락선은 선형 예측 잔여 신호의 시간 영역 신호와 랜덤 노이즈 여기의 신간 영역 신호에 각각 FFT(Fast Fourier Transform)를 수행하여 획득될 수 있다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 포락선에 따라 선형 예측 잔여 신호의 스펙트럼 디테일이 획득되는 것은 구체적으로, 이하를 포함한다.
선형 예측 잔여 신호의 스펙트럼 디테일은 선형 예측 잔여 신호의 스펙트럼 포락선 및 스펙트럼 포락선 평균의 차이에 의해 지시될 수 있다. 스펙트럼 포락선 평균은 평균 스펙트럼 포락선으로 간주할 수 있고, 선형 예측 잔여의 에너지 신호에 따라 획득될 수 있다. 즉, 평균 스펙트럼 포락선의 에너지 합은 선형 예측 잔여의 에너지 신호에 대응해야 한다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 디테일은, 선형 예측 잔여 신호의 스펙트럼 포락선에 따라 획득되는 것은, 구체적으로, 이하:
선형 예측 잔여 신호의 스펙트럼 포락선에 따라 제1 대역폭의 스펙트럼 포락선을 획득하고, 제1 대역폭은 선형 예측 잔여 신호의 대역폭 범위에 있으며, 제1 대역폭의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하는 것을 포함한다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 제1 대역폭의 스펙트럼 포락선을 획득하는 것은, 이하:
선형 예측 잔여 신호의 스펙트럼 구조를 계산하고, 선형 예측 잔여 신호의 제1 부분의 스펙트럼을 제1 대역폭의 스펙트럼 포락선으로 사용하는 것을 포함하고, 제1 부분의 스펙트럼 구조는, 제1 부분을 제외한, 선형 예측 잔여 신호의 다른 부분의 스펙트럼 구조보다 강하다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 구조는 이하의 방식:
노이즈 신호의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 구조 글 계산하는 방식; 및
선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식 중 어느 한 방식에 따라 계산된다.
본 발명의 실시예에서, 모든 선형 예측 잔여 신호의 스펙트럼 디테일은 먼저, 계산된 다음, 선형 예측 잔여 신호의 스펙트럼 디테일에 따라, 선형 예측 잔여 신호의 스펙트럼 구조가 계산될 수 있다. 단계(S45)에서 인코딩되는 동안, 일부 스펙트럼 디테일은 스펙트럼 구조에 따라 인코딩될 수 있다. 구체적 실시예에서, 가장 강한 구조를 가진 스펙트럼 디테일만이 인코딩될 수 있다. 구체적 계산 방식에서, 본 발명의 다른 관련된 실시예에 기준이 만들어질 수 있고, 다른 방식은 당업자가 창의적인 노력 없이 생각해 낼 수 있으며, 세부 사항은 여기에서 설명하지 않는다.
단계(S54): 선형 예측 잔여 신호의 스펙트럼 포락선을 인코딩한다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 포락선을 인코딩하는 것은 구체적으로, 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하는 것이다.
본 발명의 실시예에서, 선형 예측 잔여 신호의 스펙트럼 포락선은 선형 예측 잔여 신호의 부분 스펙트럼의 스펙트럼 포락선일 수 있다. 예를 들어, 실시예에서, 선형 예측 잔여 신호의 스펙트럼 포락선은 선형 예측 잔여 신호의 저주파 부분 만의 스펙트럼 포락선일 수 있다.
실시예에서, 구체적으로, 비트스트림(bitstream)으로 인코딩된 파라미터는 현재 프레임을 나타내는 파라미터만일 수 있다. 하지만, 다른 실시예에서, 구체적으로 비트스트림으로 인코딩된 파라미터는, 평균, 가중화된 평균(weighted average), 또는 일부 프레임의 각 파라미터의 무빙 평균(moving average)과 같은 스무드된 값(smoothed value)일 수 있다. 본 발명의 실시예에서의 선형 예측의, 노이즈 신호 처리 방법에 따르면, 사용자의 주관적 청각 인식, 연속 전송이 불연속 전송으로 트랜짓될 때 유발되는 "감각 전환(switching sense)"의 완화, 및 사용자의 주관적 인식 품질이 개선되는 것에 대해, 컴포트 노이즈가 원래 배경 노이즈에 더욱 가깝도록, 원래 배경 노이즈 신호의 더 많은 스펙트럼 디테일이 복구될 수 있다.
이하에서, 도 6을 참조하여, 본 발명의 실시예의, 선형 예측 기반의, 노이즈 신호 생성 방법을 설명한다. 도 6에 도시된 바와 같이, 본 발명의 실시예에서의 선형 예측 기반, 컴포트 노이즈 신호 생성 방법은 이하의 단계를 포함한다.
단계(S61): 비트스트림을 수신하고, 비트스트림을 디코딩하여 스펙트럼 디테일 및 선형 예측 계수를 획득하고, 스펙트럼 디테일은 선형 예측 여기 신호의 스펙트럼 포락선을 지시한다.
본 발명의 실시예에서, 구체적으로, 스펙트럼 디테일은 스펙트럼 포락선 of the 선형 예측 여기 신호와 일치할 수 있다.
단계(S62): 스펙트럼 디테일에 따라, 선형 예측 여기 신호를 획득한다.
본 발명의 실시예에서, 스펙트럼 디테일이 선형 예측 여기 신호의 스펙트럼 포락선이면, 선형 예측 여기 신호는 선형 예측 여기 신호의 스펙트럼 포락선에 따라 획득될 수 있다.
단계(S63): 선형 예측 계수 및 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득한다.
본 발명의 실시예에서, 비트스트림은 선형 예측 여기의 에너지를 포함하고, 선형 예측 계수 및 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하기 전, 선형 예측 기반의, 노이즈 신호 생성 방법은,
선형 예측 여기의 에너지에 따라, 제1 노이즈의 여기 신호를 획득하는 단계; 및
제1 노이즈 여기 신호에 따라, 제2 노이즈 여기 신호를 획득하는 단계를 더 포함하고, 제1 노이즈 여기 신호의 에너지는 선형 예측 여기의 에너지와 같으며,
이에 대응하여, 선형 예측 계수 및 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계는 구체적으로,
선형 예측 계수 및 제2 노이즈 여기 신호에 따라, 컴포트 노이즈 신호를 획득하는 단계를 포함한다.
본 발명의 실시예에서, 수신된 스펙트럼 디테일이 선형 예측 여기 신호의 스펙트럼 포락선과 일치하면, 디코더 측에서 수신된 비트스트림은 선형 예측 여기의 에너지를 포함할 수 있다.
제1 노이즈 여기 신호는 선형 예측 여기의 에너지에 따라 획득되고, 제1 노이즈 여기 신호의 에너지는 선형 예측 여기의 에너지와 같다.
제2 노이즈 여기 신호는 제1 노이즈 여기 신호 및 스펙트럼 포락선에 따라 획득된다.
이에 대응하여, 선형 예측 계수 및 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 것은 구체적으로,
선형 예측 계수 및 제2 노이즈 신호에 따라 컴포트 노이즈 신호를 획득하는 것을 포함한다.
본 발명의 실시예에서, 비트스트림을 수신하면, 디코더는 비트스트림을 디코딩하고, 디코딩된 선형 예측 계수, 디코딩된 선형 예측 여기 에너지, 및 디코딩된 스펙트럼 디테일을 획득한다.
랜덤 노이즈 여기는, 선형 예측 잔여의 에너지에 따라 생성된다. 구체적 방법은, 먼저, 난수 생성기를 사용하여 난수 시퀀스의 그룹을 생성하고, 조정된 난수 시퀀스의 에너지가 선형 예측 잔여의 에너지와 일치하도록, 난수 시퀀스에 이득 조정을 수행한다. 기본 방식은, 스펙트럼 포락선이 게인 조정이 스펙트럼 디테일과 일치한 후 획득된 FFT 계수에 대응하도록, 스펙트럼 디테일을 사용하여 무작위 위상을 가진 FFT 계수의 시퀀스에 게인 조정을 수행하는 것이다. 마지막으로, IFFT(Inverse Fast Fourier Transform)의 방식을 사용하여 획득된 스펙트럼 디테일 여기가 획득된다.
본 발명의 실시예에서, 구체적 생성 방법은, 난수 생성기를 사용하여 N개의 지점의 난수 시퀀스를 생성하고, N 개의 지점의 난수 시퀀스를 무작위 위상과 무작위 진폭을 가진 FFT 계수의 시퀀스로서 사용하는 것이다. 이득 조정 후 획득된 FFT 계수는 IFFT 변환의 방식으로 시간 영역 신호, 즉, 스펙트럼 디테일로 변환된다. 랜덤 노이즈 신호 여기는 스펙트럼 디테일 여기와 결합하고, 완전한 여기가 획득된다.
마지막으로, 완전한 여기는 선형 예측 합성 필터를 여기 시키는 데 사용되고, 컴포트 노이즈 프레임은 획득되며, 합성 필터의 계수는 선형 예측 계수이다.
이하에서, 도 7을 참조하여 인코더(70)를 설명한다. 도 7에 도시된 바와 같이, 인코더(70)는 이하:
노이즈 신호를 획득하고, 노이즈 신호에 따라 선형 예측 계수를 획득하도록 구성된 획득모듈(71);
획득 모듈(71)에 연결되고, 획득 모듈(71)에 의해 획득된 선형 예측 계수에 따라, 노이즈 신호를 필터링하여, 선형 예측 잔여 신호를 획득하도록 구성된 필터(72):
필터(72)에 연결되고, 선형 예측 잔여 신호에 따라, 선형 예측 잔여 신호의 스펙트럼 포락선을 획득하도록 구성된 스펙트럼 포락선 생성 모듈(73); 및
스펙트럼 포락선 생성 모듈(73)에 연결되고, 선형 예측 잔여 신호의 스펙트럼 포락선을 인코딩하도록 구성된 인코딩 모듈(74)
을 포함한다.
본 발명의 실시예에서, 인코더(70)는 추가로, 스펙트럼 디테일 생성 모듈(76)을 포함하고, 스펙트럼 디테일 생성 모듈(76)은 인코딩 모듈(74)과 스펙트럼 포락선 생성 모듈(73)과 연결되어 있으며, 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하도록 구성된다.
이에 대응하여, 인코딩 모듈(74)은 구체적으로, 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하도록 구성된다.
본 발명의 실시예에서, 인코더(70)는, 필터(72)에 연결되고, 선형 예측 잔여 신호에 따라 선형 예측 잔여 신호의 에너지를 획득하도록 구성된 잔여 에너지 계산 모듈(75)을 더 포함한다.
이에 대응하여, 인코딩 모듈(74)은 구체적으로 선형 예측 계수, 선형 예측 잔여의 에너지 신호, 및 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하도록 구성된다.
본 발명의 실시예에서, 스펙트럼 디테일 생성 모듈(76)은 구체적으로, 선형 예측 잔여의 에너지 신호에 따라, 랜덤 노이즈 여기 신호를 획득하고, 선형 예측 잔여 신호의 스펙트럼 포락선 및 랜덤 노이즈 여기의 스펙트럼 포락선 신호 사이의 차이를 선형 예측 잔여 신호의 스펙트럼 디테일로 사용하도록 구성된다.
본 발명의 실시예에서, 스펙트럼 디테일 생성 모듈(76)은:
선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 제1 대역폭의 스펙트럼 포락선을 획득하도록 구성된 제1 대역폭 스펙트럼 포락선 생성 유닛(761); 및
제1 대역폭의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 디테일을 획득하도록 구성된 스펙트럼 디테일 계산 유닛(762)을 포함하고, 제1 대역폭은 선형 예측 잔여 신호의 대역폭 범위 내에 있다.
본 발명의 실시예에서, 제1 대역폭 스펙트럼 포락선 생성 유닛(761)은 이하의 방식:
노이즈 신호의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식; 및
선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식
중 어느 한 방식에서 선형 예측 잔여 신호의 스펙트럼 구조를 계산한다.
인코더(70)의 처리 과정에 대해, 도 5의 방법 실시예, 도 10 및 도 11의 인코더 측의 실시예에 기준이 추가로 만들어질 수 있다. 여기에서 상세한 것은 설명하지 않는다.
이하에서, 도 8을 참조하여 디코더(80)를 설명한다. 도 8에 도시된 바와 같이, 디코더(80)는 수신 모듈(81), 선형 예측 여기 신호 생성 모듈(82), 및 컴포트 노이즈 신호 생성 모듈(83)을 포함한다.
수신 모듈(81)은 비트스트림을 수신하고, 비트스트림을 디코딩하여 스펙트럼 디테일 및 선형 예측 계수를 획득하도록 구성되며, 스펙트럼 디테일은 선형 예측 여기 신호의 스펙트럼 포락선을 지시한다.
본 발명의 실시예에서, 스펙트럼 디테일은 선형 예측 여기 신호의 스펙트럼 포락선이다.
선형 예측 여기 신호 생성 모듈(82)은 수신 모듈(83)에 연결되어 있고, 스펙트럼 디테일에 따라, 선형 예측 여기 신호를 획득하도록 구성된다.
컴포트 노이즈 신호 생성 모듈(83)은 수신 모듈(81)과 선형 예측 여기 신호 생성 모듈(82)과 연결되어 있고, 선형 예측 계수 및 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하도록 구성된다.
본 발명의 실시예에서, 비트스트림은 선형 예측 여기의 에너지를 포함하고, 디코더(80)는,
수신 모듈(81)에 연결되어 있고, 선형 예측 여기의 에너지에 따라 제1 노이즈 신호를 획득하도록 구성된 제1 노이즈 여기 신호 생성 모듈(84); 및
선형 예측 여기 신호 생성 모듈(82) 및 제1 노이즈 여기 신호 생성 모듈(84)과 연결되어 있고, 제1 노이즈 여기 신호 및 선형 예측 여기 신호에 따라, 제2 노이즈 여기 신호를 획득하도록 구성된 제2 노이즈 여기 신호 생성 모듈(85)
을 더 포함하고, 제1 노이즈 여기 신호의 에너지는 선형 예측 여기의 에너지와 같다.
이에 대응하여, 컴포트 노이즈 신호 생성 모듈(83)은 구체적으로, 선형 예측 계수 및 제2 노이즈 여기 신호에 따라 컴포트 노이즈 신호를 획득하도록 구성된다.
디코더(80)의 작업 시퀀스에 대해, 도 6의 방법 실시예, 도 10의 디코더 측 실시예에 대해 기준이 만들어 질 수 있고, 여기에서 세부사항은 설명하지 않는다.
이하에서, 도 9를 참조하여, 인코딩 및 디코딩 시스템(90)을 설명한다. 도 9에 도시된 바와 같이, 인코딩 및 디코딩 시스템(90)은:
인코더(70) 및 디코더(80)를 포함한다. 인코더(70)와 디코더(80)의 구체적 작업 과정에 대해, 본 발명의 다른 실시예에 기준이 만들어 질 수 있다.
도 10은 본 발명의 기술적 해결 수단에서 CNG 기술을 설명한 블록도 이다.
도 10에 도시된 바와 같이, 레빈슨 더반(Levinson-Durbin ) 알고리즘을 사용하여, 인코더, 오디오 신호 프레임 s(i)의 선형 예측 계수 lpc(k)가 획득되고, i=0, 1,…., N-1, k=0,1,…., M-1이고, N은 오디오 신호 프레임의 시간 영역 샘플링 지점의 수량이고, M은 선형 예측 시퀀스를 지시한다. 오디오 프레임 s(i) 은 오디오 신호 프레임의 선형 예측 잔여 R(i)를 획득하기 위해, 선형 예측 분석 필터 A(Z)를 통과할 수 있고, i=0, 1,…., N-1, 선형 예측 분석 필터 A(Z)의 필터 계수는 lpc(k)이고, k=0,1, ..., M-1이다.
실시예에서, 선형 예측 분석 필터 A(Z)의 필터 계수는 이전에 계산된, 오디오 신호 프레임 s(i)의 선형 예측 계수 lpc(k)와 같을 수 있다. 다른 실시예에서, 선형 예측 분석 필터 A(Z)의 필터 계수는 전에 계산된 오디오 신호 프레임 s(i)의 선형 예측 계수 lpc(k)가 양자화된 후 획득될 수 있다. 간단한 설명을 위해, lpc(k)는 일관되게 선형 예측 분석 필터 A(Z)의 필터 계수를 지시하는 데 사용된다.
선형 예측 잔여 R(i)을 획득하는 과정은 이하:
Figure pat00001
로 표시될 수 있고, lpc(k)는 선형 예측 분석 필터 A(Z)의 필터 계수를 지시하며, M은 오디오 신호 프레임의 시간 영역 샘플링 지점의 수량을 지시하고, K는 자연수이며, s(i-k)는 오디오 신호 프레임을 지시한다.
실시예에서, 선형 예측 잔여의 에너지 ER 는 이하:
Figure pat00002
와 같이 선형 예측 잔여 R(i)을 사용하여 획득할 수 있고, 여기에서, s(i)는 오디오 신호 프레임이고, N은 선형 예측 잔여의 시간 영역 샘플링 지점의 수량을 지시한다.
선형 예측 잔여 R(i)의 스펙트럼 디테일 정보는 선형 예측 잔여의 스펙트럼 포락선 R(i) 및 랜덤 노이즈 여기의 스펙트럼 포락선 EXR 사이의 차로 지시될 수 있고, i=0, 1,…., N-1이다. 랜덤 노이즈 여기 EXR(i)는 인코더에서 생성된 로컬 여기(local excitation)이고, 랜덤 노이즈 여기 EXR(i)의 생성 방식은 디코더에서, EXR(i)의 에너지가 ER인 방식과 일치한다. 여기에서 생성 방식의 일관성은 난수 발생기의 구현 형태 일관성만을 지시하지 않고, 난수 생성기의 랜덤 시드의 동기화가 유지되는 것을 또한 나타낼 수 있다. 실시예에서, 선형 예측 잔여의 스펙트럼 포락선 R(i) 및 랜덤 노이즈 여기의 스펙트럼 포락선 EXR(i)은 또한, 선형 예측 잔여 R(i)의 시간 영역 신호 및 랜덤 노이즈 여기 EXR(i)의 시간 영역 신호에 각각 FFT(Fast Fourier Transform)를 수행하여 획득될 수 있다.
본 발명의 실시예에서, 랜덤 노이즈는 인코더 측에서 생성되기 때문에, 랜덤 노이즈 여기의 에너지는 제어될 수 있다. 여기에서, 생성된 랜덤 노이즈 여기의 에너지는 선형 예측 잔여의 에너지와 같아야 한다. 간결한 설명을 위해, 여기에서, ER은 여전히 랜덤 노이즈 여기의 에너지를 지시한다.
본 발명의 실시예에서, SR(j)은 선형 예측 잔여의 스펙트럼 포락선 R(i)를 지시하는 데 사용되고, SXR(j)는 랜덤 노이즈 여기의 스펙트럼 포락선 EXR(i)을 지시하는 데 사용되며, j=0, 1,…., K-1이고, K는 스펙트럼 포락선의 수량이다. 이 경우:
Figure pat00003
;
Figure pat00004
이고, BR(m) 및 BXR (m)은 각각 선형 예측 잔여의 FFT 에너지 스펙트럼, 랜덤 노이즈 여기의 FFT 에너지 스펙트럼을 나타낸다. m은 mth FFT 주파수 빈(frequency bin)을 나타내고, h(j) 및 l(j)는 각각 jth 스펙트럼 포락선의 상한 및 하한에 대응하는 FFT 주파수 빈을 나타낸다. 스펙트럼 포락선의 수량 K의 선택은 스펙트럼 해상도와 인코딩률 사이의 타협일 수 있고, 더 큰 K는 더 높은 스펙트럼 해상도와 인코딩되어야 하는 비트의 더 큰 수량을 나타낸다. 그렇지 않으면, 더 작은 K은 낮은 스펙트럼 해상도 및 인코딩되어야 하는 비트의 더 적은 수량을 나타낸다. 선형 예측 잔여 R(i)의 스펙트럼 디테일SD(j)은 SR(j) 및 SXR(j)의 차이에 의해 획득된다. SID 프레임이 인코딩될 때, 인코더는, 선형 예측 계수 lpc(k), 선형 예측 잔여의 에너지 ER, 및 선형예측 잔여의 스펙트럼 디테일SD(j)을 따로 양자화하고, 선형 예측 계수 lpc(k)의 양자화는 대체로 ISP/ISF 영역과 LSP/LSF 영역에서 수행된다. 각 파라미터의 구체적 양자화 방법은 종래 기술이기 때문에, 본 발명의 요약이 아니고, 세부사항은 여기에서 설명하지 않는다.
다른 실시예에서, 선형 예측 잔여 R(i)의 스펙트럼 디테일 정보는 선형 예측 잔여의 스펙트럼 포락선 R(i) 및 스펙트럼 포락선 평균 사이의 차이에 의해 지시될 수 있다. SR(j)는 선형 예측 잔여의 스펙트럼 포락선 R(i)을 지시하는 데 사용되고, SM(j)은 스펙트럼 포락선 평균 또는 평균 스펙트럼 포락선을 지시하는 데 사용되며, j=0, 1, ..., K-1이고, K는 스펙트럼 포락선의 수량이다. 이 경우:
Figure pat00005
, 및
Figure pat00006
이고, ER(m)는 선형 예측 잔여의 FFT 에너지 스펙트럼을 나타내며, m은 mth FFT 주파수 빈을 나타내고, h(j) 및 l(j)는 각각 the jth 스펙트럼 포락선의 상한 및 하한에 대응하는 FFT 주파수 빈을 나타낸다. SM(j)은 스펙트럼 포락선 평균 또는 평균 스펙트럼 포락선을 나타내고, ER은 선형 예측 잔여의 에너지이다.
실시예에서, 구체적으로, SID 프레임으로 인코딩된 파라미터는 현재 프레임만 나타내는 파라미터일 수 있다. 그러나 다른 실시예에서, 구체적으로, SID 프레임으로 인코딩된 파라미터는 평균, 가중화된 평균(weighted average), 또는 일부 프레임의 각 파라미터의 무빙 평균(moving average)과 같은 스무드된 값(smoothed value)일 수 있다.
좀 더 구체적으로, 도 11에 도시된 바와 같이, 도 10을 참조한 기술적 해결 방식에서, 스펙트럼 디테일 SD(j)는 신호의 전 대역폭을 커버할 수 있거나, 부분 대역폭만 커버할 수 있다. 실시예에서, 대체로 노이즈의 대부분의 에너지는 저주파에 있기 때문에, 스펙트럼 디테일 SD(j)은 신호의 저주파 대역만 커버할 수 있다. 다른 실시예에서, 스펙트럼 디테일 SD(j)은 커버하기 위해, 추가로 가장 강한 스펙트럼 구조를 가진 대역폭을 적응적으로 선택할 수 있다. 이런 경우, 이러한 주파수 대역의 시작 주파수 위치와 같은 위치 정보는 추가로 인코딩되어야 한다. 전술한 기술적 해결 수단에서, 스펙트럼 구조 강도는 선형 예측 잔여 스펙트럼을 사용하여 계산될 수 있거나, 선형 예측 잔여 스펙트럼과 랜덤 노이즈 여기 스펙트럼 사이의 신호 차이를 사용하여 계산될 수 있거나, 원래 입력 신호 스펙트럼을 사용하여 계산되거나, 또는 원래 입력 신호 스펙트럼과 랜덤 노이즈 여기 신호가 합성 필터를 여기 시킨 후 획득된 합성 노이즈 신호의 스펙트럼 사이의 신호 차이를 사용하여 계산될 수 있다. 스펙트럼 구조 강도는, 엔트로피 방식(entropy method), 플랫니스 방식(flatness method) 및 스파스니스 방식(sparseness method)과 같은 다양한 고전적 방식으로 계산될 수 있다.
분 발명의 본 실시예에서, 전술한 일부 방식 모두는 스펙트럼 구조 강도를 계산하는 방법이고, 스펙트럼 디테일의 계산과는 독립적이다. 스펙트럼 디테일은 먼저, 계산된 다음, 구조 강도가 계산되거나, 구조 강도가 먼저 계산된 다음 적절한 주파수대가 스펙트럼 디테일을 획득하기 위해 선택된다. 본 발명은 여기에 특별한 제한을 두지 않는다.
예를 들어, 실시예에서, 스펙트럼 구조 강도는, 선형 예측 잔여 R의 스펙트럼 포락선 SR(j)에 따라 계산되고, j=0, 1,…., K-1이며, K는 스펙트럼 포락선의 수량이다. 먼저, 프레임의 총 에너지의 각 포락선에 의해 점유된 주파수대의 에너지의 비율은
Figure pat00007
이고, 여기에서, P(j)는 총 에너지에서 jth 포락선에 의해 점유된 주파수대의 에너지의 비율을 나타내고, SR(j)은 선형 예측 잔여의 스펙트럼 포락선을 나타내고, h(j) 및 l(j)는 각각 jth 스펙트럼 포락선의 상한 및 하한에 대응하는 FFT 주파수 빈을 나타내며, Etot는 프레임의 총 에너지이다. 선형 예측 잔여 스펙트럼의 엔트로피 CR은 P(j)에 따라,
Figure pat00008
이다.
엔트로피 CR의 값은 선형 예측 잔여 스펙트럼의 구조 강도를 나타낼 수 있거나 더 큰 CR은 약한 스펙트럼 구조를 나타내고, 더 작은 CR은 더 강한 스펙트럼 구조를 나타낸다.
디코더의 실시예에서, SID 프레임을 수신할 때, 디코더는 SID 프레임을 디코딩하고 디코딩된 선형 예측 계수 lpc(k), 디코딩된 선형 예측 잔여의 에너지 ER, 및 디코딩된 선형 예측 잔여의 스펙트럼 디테일SD(j)을 획득한다. 각 배경 노이즈 프레임에서, 디코더는, 디코딩 방식으로 최근 획득한 이러한 3개의 파라미터에 따라, 현재 컴포트 노이즈 프레임에 대응하는 이러한 3개의 파라미터를 예측한다. 현재 컴포트 노이즈에 대응하는 이러한 3개의 파라미터는: 선형 예측 계수 CNlpc(k), 선형 예측 잔여의 에너지 CNER, 선형 예측 잔여의 스펙트럼 디테일CNSD(j)와 같이 표시된다. 실시예에서, 구체적 추정 방법은:
Figure pat00009
,
Figure pat00010
, 및
이고,
Figure pat00012
는 장기 무빙 평균 계수(long-term moving average coefficient) 또는 망각 계수(forgetting coefficient)이고, M은 필터 차수이며, K는 스펙트럼 포락선의 수량이다. 랜덤 노이즈 여기 EXR(i)는 선형 예측 잔여의 에너지 CNER이다. 구체적 방법은, 먼저 난수 생성기를 사용하여 난수 시퀀스 EX(i)의 그룹을 먼저 생성하고, i=0, 1,…., N-1이며, 조정된 EX(i)의 에너지가 선형 예측 잔여의 에너지 CNER과 일치하도록, EX(i)에 게인 조정을 수행한다. 조정된 EX(i)는 랜덤 노이즈 여기 EXR(i)이고, EXR(i)은 이하의 수식:
Figure pat00013
을 참조하여 획득될 수 있다.
또한, 스펙트럼 디테일 여기 EXD(i)는 선형 예측 잔여의 스펙트럼 디테일CNSD(j)에 따라 생성된다. 기본적인 방법은, 게인 조정 후 획득된 FFT 계수에 대응하는 스펙트럼 포락선이 CNSD(j)와 일치하도록, 선형 예측 잔여의 스펙트럼 디테일 CNSD(j)을 사용하여 무작위 위상을 가진 FFT 계수의 시퀀스에 게인 조정을 수행하고, 그리고 마지막으로, IFFT(Inverse Fast Fourier Transform)방식으로 스펙트럼 디테일 여기 EXD(i)를 획득하는 것이다.
다른 실시예에서, 스펙트럼 디테일 여기 EXD(i)는 선형 예측 잔여의 스펙트럼 포락선에 따라 생성된다. 기본 방법은, 랜덤 노이즈 여기의 스펙트럼 포락선 EXR(i)을 획득하고, 선형 예측 잔여의 스펙트럼 포락선에 따라, 선형 예측 잔여의 스펙트럼 포락선과 스펙트럼 디테일 여기에 대응하는, 랜덤 노이즈 여기의 스펙트럼 포락선 EXR(i)의 포락선 사이의 포락선 차이를 획득하는 것이며, 게인 조정 후 획득된 FFT 계수에 대응하는 스펙트럼 포락선이 포락선 차와 일치하기 위해, 포락선 차이를 사용하여, 무작위 위상을 가진 FFT 계수의 시퀀스에 게인 조정을 수행하는 것이다.
본 발명의 다른 실시예에서, EXD(i)를 생성하는 구체적 방법은: 난수 발생기를 사용하여 N개의 지점의 난수 시퀀스를 생성하고, N개의 포인트의 난수 시퀀스를 무작위 위상 및 무작위 진폭을 가진 FFT 계수의 시퀀스로 사용하는 것이다.
Figure pat00014
; 및
Figure pat00015
이다.
전술한 수식에서, Rel(i) 및 Img(i)은 각각 ith FFT 주파수 빈의 실수 부분과 허수 부분을 나타내고, RAND()은 난수 생성기를 나타내며, 시드(seed)는 랜덤 시드이다. 무작위 FFT 계수의 진폭은 선형 예측 잔여의 스펙트럼 디테일CNSD(j)에 따라 조정되고, FFT 계수 Rel'(i) 및 Img'(i)은 게수 조정 후 획득된다.
Figure pat00016
; 및
Figure pat00017
이다.
여기에서, E(i)는 게인 조종 후 획득된 ith FFT 주파수 빈의 에너지를 나타내고, 선형 예측 잔여의 스펙트럼 디테일CNSD(j)에 의해 결정된다. E(i) 및 CNSD(j) 사이의 관계는:
Figure pat00018
와 같다.
마지막으로, 완전한 여기 EX(i)는 선형 예측 합성 필터 A(1/Z)를 여기 시키는 데 사용되고, 컴포트 노이즈 프레임이 획득되며, 합성 필터의 계수는 CNlpc(k)이다.
편리하고 간단한 설명을 위해, 전술한 인코딩 및 디코딩 시스템, 인코더, 디코더, 모듈, 및 유닛의 구체적 작업 과정에 대해, 전술한 방법 실시예에서의 대응하는 과정에 기준이 만들어질 수 있다는 것은 당업자가 쉽게 알 수 있고, 세부사항은 여기에서 다시 설명하지 않는다.
본원에서 제공되는 여러 실시 예에서, 개시된 시스템, 장치 및 방법은 다른 방식으로 구현될 수 있다는 것을 이해해야 한다. 예를 들어, 설명된 장치 실시 예는 단지 예시이다. 예를 들어, 유닛 부문은 단순히 논리적 기능 부문이며, 실제 구현에서 다른 부문일 수 있다. 예를 들어, 복수의 유닛 또는 구성요소는 결합하거나 다른 시스템에 통합되거나, 일부 기능은 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나, 논의된 상호 연결 또는 직접 연결 또는 통신 연결은 일부 인터페이스를 사용하여 구현될 수 있다. 장치 또는 유닛 간의 간접 연결 또는 통신 접속은, 전자적, 기계적, 또는 다른 형태로 구현 될 수 있다.
또한, 본 발명의 실시 예에서의 기능 유닛은 하나의 프로세싱 유닛에 통합될 수 있거나, 각 유닛은 단독으로 물리적으로 존재할 수 있고, 2개 이상의 유닛이 하나의 유닛으로 통합될 수 있다.
기능이 소프트웨어 기능 유닛의 형태로 구현되어 판매되거나 독립 제품으로 사용되는 경우, 기능은 컴퓨터 판독 가능한 기억 매체에 저장될 수 있다. 이러한 이해를 바탕으로, 본질적으로, 본 발명의 기술적 해결 수단, 종래 기술에 기여하는 부분, 또는 기술적 해결 수단의 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 소프트웨어 제품은 저장 매체에 저장되고, 본 발명의 실시예에서 설명된 방법의 단계의 전부 또는 일부를 수행하기 위한 컴퓨터 장치(퍼스널 컴퓨터, 서버, 또는 네트워크 장치가 될 수 있음)를 명령하는 여러 명령을 포함한다. 이러한 저장 매체는, USB 플래시 드라이브, 이동식 하드 디스크, ROM(Read-Only Memory), RAM(Random Access Memory), 자기 디스크, 광디스크와 같은 프로그램 코드를 저장할 수 있는 메체라면 어떠한 매체라도 포함한다.
전술 한 설명은 단지 본 발명의 예시적인 구현 방식이지만, 본 발명의 보호 범위를 제한하고자 하는 것은 아니다. 본 발명에 기재된 기술적 범위 내에서 당업자가 쉽게 파악한 모든 변형 또는 교체는 본 발명의 보호 범위 내에 포함된다. 따라서, 본 발명의 보호 범위는 특허 청구 범위의 보호 범위에 따른다.

Claims (18)

  1. 선형 예측기반의, 노이즈 신호를 처리하는 신호 처리 방법으로서,
    노이즈 신호를 획득하는 단계;
    상기 노이즈 신호의 선형 예측 계수를 획득하는 단계;
    상기 노이즈 신호를 필터링하여 선형 예측 잔여 신호(linear prediction residual signal)를 획득하는 단계 - 상기 필터링은 획득된 선형 예측 계수에 따라서 적어도 수행됨 -;
    상기 선형 예측 잔여 신호의 에너지를 획득하는 단계;
    상기 선형 예측 잔여 신호의 스펙트럼 포락선(spectral envelope)을 획득하는 단계; 및
    상기 선형 예측 계수, 상기 선형 예측 잔여 신호의 에너지, 및 상기 선형 잔여 신호의 스펙트럼 포락선을 인코딩하는 단계
    를 포함하는 신호 처리 방법.
  2. 제1항에 있어서,
    상기 선형 예측 잔여 신호의 스펙트럼 포락선(spectral envelope)을 획득하는 단계 후, 상기 신호 처리 방법은,
    상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일(spectral detail)을 획득하는 단계를 더 포함하고,
    이에 대응하여, 상기 선형 잔여 신호의 스펙트럼 포락선을 인코딩하는 단계는,
    상기 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하는 단계를 포함하는, 신호 처리 방법.
  3. 제2항에 있어서,
    상기 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하는 단계는,
    상기 선형 예측 잔여 신호의 에너지에 따라, 랜덤 노이즈 여기 신호(random noise excitation signal)를 획득하는 단계; 및
    상기 선형 예측 잔여 신호의 스펙트럼 포락선과 상기 랜덤 노이즈 여기 신호의 스펙트럼 포락선에 따라 스펙트럼 디테일을 획득하는 단계
    를 포함하는,
    신호 처리 방법.
  4. 제2항에 있어서,
    상기 스펙트럼 디테일은, 제1 대역폭의 스펙트럼 포락선이고,
    상기 제1 대역폭은 상기 선형 예측 잔여 신호의 대역폭 범위 내에 있는, 신호 처리 방법.
  5. 제4항에 있어서,
    상기 제1 대역폭의 스펙트럼 포락선은,
    상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하고, 상기 선형 예측 잔여 신호의 제1 부분의 스펙트럼을 상기 제1 대역폭의 스펙트럼 포락선으로 사용하는 단계에 의해 획득되고,
    상기 제1 부분의 스펙트럼 구조는, 상기 선형 예측 잔여 신호의 다른 부분의 스펙트럼 구조보다 강한, 신호 처리 방법.
  6. 제5항에 있어서,
    상기 선형 예측 잔여 신호의 스펙트럼 구조는 이하의 방식:
    상기 노이즈 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식; 또는
    상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식
    중 어느 하나에 의해 계산되는, 신호 처리 방법.
  7. 선형 예측 기반의, 컴포트 노이즈 신호(comfort noise signal)를 생성하는 신호 생성 방법으로서,
    비트스트림(bitstream)을 수신하는 단계;
    상기 비트스트림을 디코딩하여 선형 예측 계수, 선형 예측 여기 신호(linear prediction excitation signal)의 에너지, 및 상기 선형 예측 여기 신호의 스펙트럼 포락선(spectral envelope)을 획득하는 단계;
    상기 선형 예측 여기 신호의 에너지에 따라, 제1 노이즈 여기 신호를 획득하는 단계;
    상기 스펙트럼 포락선에 따라 상기 선형 예측 여기 신호를 획득하는 단계; 및
    상기 선형 예측 계수, 상기 제1 노이즈 여기 신호, 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계
    를 포함하는 신호 생성 방법.
  8. 제7항에 있어서,
    상기 선형 예측 계수, 상기 제1 노이즈 여기 신호, 및 상기 선형 예측 여기 신호에 따라 컴포트 노이즈 신호를 획득하는 단계는,
    상기 제1 노이즈 여기 신호 및 상기 선형 예측 여기 신호에 따라 제2 노이즈 여기 신호를 획득하는 단계; 및
    상기 선형 예측 계수 및 상기 제2 노이즈 여기 신호에 따라, 상기 컴포트 노이즈 신호를 획득하는 단계
    를 포함하는, 신호 생성 방법.
  9. 인코더로서,
    노이즈 신호를 획득하고, 상기 노이즈 신호의 선형 예측 계수를 획득하도록 구성된 획득 모듈;
    상기 노이즈 신호를 필터링하여 선형 예측 잔여 신호(linear prediction residual signal)를 획득하도록 구성된 필터 - 상기 필터는 획득된 선형 예측 계수에 따라 적어도 수행됨 -;
    상기 선형 예측 잔여 신호의 에너지를 획득하도록 구성된 잔여 에너지 계산 모듈;
    상기 선형 예측 잔여 신호의 스펙트럼 포락선(spectral envelope)을 획득하도록 구성된 스펙트럼 포락선 생성 모듈; 및
    상기 선형 예측 계수, 상기 선형 예측 잔여 신호의 에너지, 및 상기 선형 예측 잔여 신호의 스펙트럼 포락선을 인코딩하도록 구성된 인코딩 모듈
    을 포함하는 인코더.
  10. 제9항에 있어서,
    상기 인코더는,
    상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 디테일(spectral detail)을 획득하도록 구성된 스펙트럼 디테일 생성 모듈
    을 더 포함하고,
    이에 대응하여, 상기 인코딩 모듈은,
    상기 선형 예측 잔여 신호의 스펙트럼 디테일을 인코딩하도록 구성된, 인코더.
  11. 제10항에 있어서,
    상기 스펙트럼 디테일 생성 모듈은,
    상기 선형 예측 잔여 신호의 에너지에 따라, 랜덤 노이즈 여기 신호(random noise excitation signal)를 획득하고, 상기 선형 예측 잔여 신호의 스펙트럼 포락선과 상기 랜덤 노이즈 여기 신호의 스펙트럼 포락선에 따라 스펙트럼 디테일을 획득하도록 구성된, 인코더.
  12. 제10항에 있어서,
    상기 스펙트럼 디테일은, 제1 대역폭의 스펙트럼 포락선인, 인코더.
  13. 제12항에 있어서,
    상기 스펙트럼 디테일 생성 모듈은,
    상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하고, 상기 선형 예측 잔여 신호의 제1 부분의 스펙트럼을 상기 제1 대역폭의 스펙트럼 포락선으로 사용하도록 구성되는 제1 대역폭 스펙트럼 포락선 생성 유닛
    을 포함하고,
    상기 제1 부분의 스펙트럼 구조는, 상기 선형 예측 잔여 신호의 다른 부분의 스펙트럼 구조 보다 강한,
    인코더.
  14. 제13항에 있어서,
    상기 제1 대역폭 스펙트럼 포락선 유닛은 이하의 방식:
    상기 노이즈 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식; 또는
    상기 선형 예측 잔여 신호의 스펙트럼 포락선에 따라, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는 방식
    중 어느 한 방식으로, 상기 선형 예측 잔여 신호의 스펙트럼 구조를 계산하는, 인코더.
  15. 디코더로서,
    비트스트림(bitstream)을 수신하고, 상기 비트스트림을 디코딩하여 선형 예측 계수, 선형 예측 여기 신호(linear prediction excitation signal)의 에너지, 및 상기 선형 예측 여기 신호의 스펙트럼 포락선(spectral envelope)를 획득하도록 구성된 수신 모듈;
    상기 선형 예측 여기 신호의 에너지에 따라 제1 노이즈 여기 신호를 획득하도록 구성된 제1 노이즈 여기 신호 생성 모듈;
    상기 스펙트럼 포락선에 따라, 선형 예측 여기 신호를 획득하도록 구성된 선형 예측 여기 신호 생성 모듈; 및
    상기 선형 예측 계수, 상기 제1 노이즈 여기 신호, 및 상기 선형 예측 여기 신호에 따라, 컴포트 노이즈 신호(comfort noise signal)를 획득하도록 구성된 컴포트 노이즈 신호 생성 모듈
    을 포함하는 디코더.
  16. 제15항에 있어서,
    상기 디코더는,
    상기 제1 노이즈 여기 신호 및 상기 선형 예측 여기 신호에 따라, 제2 노이즈 여기 신호를 획득하도록 구성된 제2 노이즈 여기 신호 생성 모듈
    을 더 포함하며,
    이에 대응하여, 상기 컴포트 노이즈 신호 생성 모듈은,
    상기 선형 예측 계수 및 상기 제2 노이즈 여기 신호에 따라, 상기 컴포트 노이즈 신호를 획득하도록 구성된, 디코더.
  17. 프로그램이 기록된 컴퓨터 판독 가능 기록 매체로서,
    상기 프로그램이 실행되면 상기 컴퓨터로 하여금 제1항 내지 제8항 중 어느 한 항의 방법을 수행하도록 하는, 컴퓨터 판독 가능 기록 매체.
  18. 컴퓨터 판독 가능 기록 매체에 기록된 프로그램으로서,
    상기 프로그램이 실행되면 상기 컴퓨터로 하여금 제1항 내지 제8항 중 어느 한 항의 방법을 수행하도록 하는, 프로그램.
KR1020197015048A 2014-04-08 2014-10-09 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 KR102217709B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410137474.0 2014-04-08
CN201410137474.0A CN104978970B (zh) 2014-04-08 2014-04-08 一种噪声信号的处理和生成方法、编解码器和编解码系统
PCT/CN2014/088169 WO2015154397A1 (zh) 2014-04-08 2014-10-09 一种噪声信号的处理和生成方法、编解码器和编解码系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020187016493A Division KR102132798B1 (ko) 2014-04-08 2014-10-09 노이즈 신호 처리 및 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템

Publications (2)

Publication Number Publication Date
KR20190060887A true KR20190060887A (ko) 2019-06-03
KR102217709B1 KR102217709B1 (ko) 2021-02-18

Family

ID=54275424

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020187016493A KR102132798B1 (ko) 2014-04-08 2014-10-09 노이즈 신호 처리 및 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템
KR1020167026295A KR101868926B1 (ko) 2014-04-08 2014-10-09 노이즈 신호 처리 및 생성 방법, 인코더/디코더 및 인코딩/디코딩 시스템
KR1020197015048A KR102217709B1 (ko) 2014-04-08 2014-10-09 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020187016493A KR102132798B1 (ko) 2014-04-08 2014-10-09 노이즈 신호 처리 및 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템
KR1020167026295A KR101868926B1 (ko) 2014-04-08 2014-10-09 노이즈 신호 처리 및 생성 방법, 인코더/디코더 및 인코딩/디코딩 시스템

Country Status (7)

Country Link
US (3) US9728195B2 (ko)
EP (2) EP3671737A1 (ko)
JP (2) JP6368029B2 (ko)
KR (3) KR102132798B1 (ko)
CN (1) CN104978970B (ko)
ES (1) ES2798310T3 (ko)
WO (1) WO2015154397A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106169297B (zh) * 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
WO2017118495A1 (en) * 2016-01-03 2017-07-13 Auro Technologies Nv A signal encoder, decoder and methods using predictor models
CN106531175B (zh) * 2016-11-13 2019-09-03 南京汉隆科技有限公司 一种网络话机柔和噪声产生的方法
JP7139628B2 (ja) * 2018-03-09 2022-09-21 ヤマハ株式会社 音処理方法および音処理装置
EP3913626A1 (en) * 2018-04-05 2021-11-24 Telefonaktiebolaget LM Ericsson (publ) Support for generation of comfort noise
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
CN110289009B (zh) * 2019-07-09 2021-06-15 广州视源电子科技股份有限公司 声音信号的处理方法、装置和交互智能设备
TWI715139B (zh) * 2019-08-06 2021-01-01 原相科技股份有限公司 聲音播放裝置及其透過遮噪音訊遮蓋干擾音之方法
CN112906157A (zh) * 2021-02-20 2021-06-04 南京航空航天大学 一种主轴轴承健康状态评估及剩余寿命预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6606593B1 (en) * 1996-11-15 2003-08-12 Nokia Mobile Phones Ltd. Methods for generating comfort noise during discontinuous transmission
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
KR20130126711A (ko) * 2011-02-14 2013-11-20 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코덱에서 잡음 생성

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1194553A (zh) * 1996-11-14 1998-09-30 诺基亚流动电话有限公司 在不连续传输期间的安慰噪声参数的发送
JP3464371B2 (ja) * 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
FR2761512A1 (fr) 1997-03-25 1998-10-02 Philips Electronics Nv Dispositif de generation de bruit de confort et codeur de parole incluant un tel dispositif
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6163608A (en) * 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
KR100348899B1 (ko) * 2000-09-19 2002-08-14 한국전자통신연구원 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
US8767974B1 (en) * 2005-06-15 2014-07-01 Hewlett-Packard Development Company, L.P. System and method for generating comfort noise
CN101193090B (zh) * 2006-11-27 2011-12-28 华为技术有限公司 信号处理方法及其装置
EP2118889B1 (en) * 2007-03-05 2012-10-03 Telefonaktiebolaget LM Ericsson (publ) Method and controller for smoothing stationary background noise
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
CN102760441B (zh) * 2007-06-05 2014-03-12 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN101335003B (zh) * 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
CN101651752B (zh) * 2008-03-26 2012-11-21 华为技术有限公司 解码的方法及装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
CN102136271B (zh) * 2011-02-09 2012-07-04 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
JP5800915B2 (ja) 2011-02-14 2015-10-28 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号のトラックのパルス位置の符号化および復号化
KR102052144B1 (ko) 2011-10-24 2019-12-05 엘지전자 주식회사 음성 신호의 대역 선택적 양자화 방법 및 장치
CN103093756B (zh) * 2011-11-01 2015-08-12 联芯科技有限公司 舒适噪声生成方法及舒适噪声生成器
CN102664003B (zh) * 2012-04-24 2013-12-04 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
CN103680509B (zh) * 2013-12-16 2016-04-06 重庆邮电大学 一种语音信号非连续传输及背景噪声生成方法
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6606593B1 (en) * 1996-11-15 2003-08-12 Nokia Mobile Phones Ltd. Methods for generating comfort noise during discontinuous transmission
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
KR20130126711A (ko) * 2011-02-14 2013-11-20 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코덱에서 잡음 생성

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Adil Benyassine, et al. ITU-T Recommendation G. 729 Annex B: a silence compression scheme for use with G. 729 optimized for V. 70 digital simultaneous voice and data applications. IEEE Communications* *
EVS Codec Comfort Noise Generation (CNG) Aspects (3GPP TS 26.449 version 12.0.0 Release 12). ETSI TS 126 449 V12.0.0. 2014.10. *
EVS Codec Detailed Algorithmic Description (3GPP TS 26.445 version 12.0.0 Release 12). ETSI TS 126 445 V12.0.0. 2014.11. *
Khaled Helmi El-Maleh. Classification-based Techniques for Digital Coding of Speech-plus-noise. McGill University, 2004.01.* *

Also Published As

Publication number Publication date
EP3131094B1 (en) 2020-04-22
US9728195B2 (en) 2017-08-08
KR20180066283A (ko) 2018-06-18
WO2015154397A1 (zh) 2015-10-15
KR101868926B1 (ko) 2018-06-19
JP2018165834A (ja) 2018-10-25
US20170323648A1 (en) 2017-11-09
KR102132798B1 (ko) 2020-07-10
ES2798310T3 (es) 2020-12-10
KR20160125481A (ko) 2016-10-31
CN104978970B (zh) 2019-02-12
EP3131094A1 (en) 2017-02-15
EP3131094A4 (en) 2017-05-10
JP2017510859A (ja) 2017-04-13
US20170018277A1 (en) 2017-01-19
CN104978970A (zh) 2015-10-14
US10734003B2 (en) 2020-08-04
US20190057704A1 (en) 2019-02-21
JP6368029B2 (ja) 2018-08-01
EP3671737A1 (en) 2020-06-24
JP6636574B2 (ja) 2020-01-29
KR102217709B1 (ko) 2021-02-18
US10134406B2 (en) 2018-11-20

Similar Documents

Publication Publication Date Title
KR101868926B1 (ko) 노이즈 신호 처리 및 생성 방법, 인코더/디코더 및 인코딩/디코딩 시스템
JP5203929B2 (ja) スペクトルエンベロープ表示のベクトル量子化方法及び装置
JP7085640B2 (ja) 快適雑音の生成のサポート
JP5165559B2 (ja) オーディオコーデックポストフィルタ
KR102068112B1 (ko) 음성 복호 장치, 음성 부호화 장치, 음성 복호 방법, 음성 부호화 방법, 음성 복호 프로그램, 및 음성 부호화 프로그램
KR20070002068A (ko) 음성 신호 코딩
KR101828193B1 (ko) 고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정
KR20180041131A (ko) 고대역 타겟 신호 제어
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
JP4782006B2 (ja) 低ビットレートオーディオ符号化
RU2667973C2 (ru) Способы и системы переключения технологий кодирования в устройстве
CA2956019A1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
TW201434033A (zh) 用於判定音調脈衝週期信號界限之系統及方法
UA114233C2 (uk) Системи та способи для визначення набору коефіцієнтів інтерполяції
TW201218185A (en) Determining pitch cycle energy and scaling an excitation signal
JP7258936B2 (ja) 快適雑音生成モード選択のための装置および方法
JP2024073419A (ja) 快適雑音の生成のサポート

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant