KR101737254B1 - 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법 - Google Patents

오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법 Download PDF

Info

Publication number
KR101737254B1
KR101737254B1 KR1020157023505A KR20157023505A KR101737254B1 KR 101737254 B1 KR101737254 B1 KR 101737254B1 KR 1020157023505 A KR1020157023505 A KR 1020157023505A KR 20157023505 A KR20157023505 A KR 20157023505A KR 101737254 B1 KR101737254 B1 KR 101737254B1
Authority
KR
South Korea
Prior art keywords
audio signal
code
synthesizing
spectral slope
codebook
Prior art date
Application number
KR1020157023505A
Other languages
English (en)
Other versions
KR20150112028A (ko
Inventor
기욤 훅스
톰 백스트롬
랄프 가이거
볼프강 재거스
엠마누엘 라벨리
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20150112028A publication Critical patent/KR20150112028A/ko
Application granted granted Critical
Publication of KR101737254B1 publication Critical patent/KR101737254B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

오디오 신호를 합성하는 방법 및 장치가 설명된다. 스펙트럼 기울기는 오디오 신호의 현재 프레임을 합성하기 위해 사용되는 코드북(202)의 코드에 적용된다. 스펙트럼 기울기는 오디오 신호의 현재 프레임의 스펙트럼 기울기에 기초한다. 더욱이, 본 발명의 접근 방식에 따라 동작하는 오디오 디코더가 설명된다.

Description

오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법{APPARATUS AND METHOD FOR SYNTHESIZING AN AUDIO SIGNAL, DECODER, ENCODER, SYSTEM AND COMPUTER PROGRAM}
본 발명은 오디오 코딩 분야에 관한 것을서, 특히 오디오 신호를 합성하는 분야에 관한 것이다. 실시예는 음성 코딩에 관한 것으로서, 특히 코드 여기 선형 예측 코딩(CELP)이라 하는 음성 코딩 기술에 관한 것이다. 실시예는 혁신적(innovative) 또는 고정 코드북(fixed codebook)에서 CELP의 코드를 형성하는데 적응 기울기 보상(tilt compensation)에 대한 접근법을 제공한다.
CELP 코딩 방식은 음성 통신에 널리 사용되고 음성을 코딩하는 효과적인 방식이다. CELP는 두 여기(excitation)의 합을 선형 예측 필터(예를 들어, LPC 합성 필터 1/A(z))로 전달함으로써 오디오 신호를 합성한다. 하나의 여기는 적응 코드북이라고 하는 디코딩된 부분에서 나오고, 다른 기여는 고정 코드에 의해 채워지는 고정 또는 혁신적 코드북에서 나온다. CELP 코딩 방식에 따른 하나의 문제는 낮은 비트율에서 혁신적인 코드북이 음성의 미세 구조를 효율적으로 모델링하는데 충분히 채워지지 않기 때문에 지각 품질이 저하되고, 합성된 출력 신호에 잡음이 들린다는 것이다.
코딩 결함(coding artifact)을 완화하기 위해, 서로 다른 해결책이 이미 제안되었고, 참고 문헌 [1] 및 참고 문헌 [2]에서 설명된다. 이러한 참고 문헌에서, 혁신적인 코드북의 코드는 오디오 신호의 현재 프레임의 포먼트(formant)에 대응하는 스펙트럼 영역을 강화함으로써 적응 및 스펙트럼으로 형상화된다. 포먼트 위치 및 형상은 인코더 및 디코더 모두에서 가능한 계수인 LPC 계수로부터 직접 도출될 수 있다. 혁신적 코드북의 코드 c(n)의 포먼트 향상은 간단한 필터링 동작에 의해 수행된다:
Figure 112015083776326-pct00001
이러한 필터링 프로세스에서,
Figure 112015083776326-pct00002
은 다음과 같은 전달 함수를 가지는 필터의 임펄스 응답이다:
Figure 112016105543986-pct00083
여기서, w1 및 w2는 다소 전달 함수
Figure 112015083776326-pct00004
의 포먼틱(formantic) 구조를 강조하는 두 가중 상수(weighting constants)이다. 혁신적인 코드북의 생성된 형상 코드는 음성 신호의 하나의 특성을 물려받으며, 합성 신호는 덜 시끄러운 소리이다.
CELP 코딩 방식에서는 또한 혁신적인 코드북의 코드에 스펙트럼 기울기를 추가하는 것이 일반적인데. 이는 다음과 같이 혁신적인 코드북으로부터 코드를 필터링함으로써 행해진다:
Figure 112015083776326-pct00005
인수 β는 이전의 오디오 프레임의 유성음(voicing)과 관련되고, 유성음은 적응 코드북으로부터의 에너지 기여로부터 추정될 수 있다. 예를 들면, 이전의 프레임이 유성음화되는 경우, 현재의 프레임이 또한 유성음화되고, 코드가 저주파수에서 더 많은 에너지를 가질 것으로 예상되며, 즉 스펙트럼은 음의 기울기를 갖는다.
본 발명의 목적은 오디오 신호를 합성하기 위한 개선된 접근 방식을 제공하는 것이다.
이러한 목적은 청구항 1에 따른 장치 및 청구항 19에 따른 방법에 의해 달성된다.
본 발명은 오디오 신호의 현재 프레임의 합성에 사용되는 코드북의 코드에 스펙트럼 기울기를 적용하도록 구성된 처리 유닛을 포함하는 오디오 신호를 합성하기 위한 장치를 제공하며, 스펙트럼 기울기는 오디오 신호의 현재 프레임의 스펙트럼 기울기에 기초한다.
본 발명은 오디오 신호를 합성하기 위한 방법을 제공하며, 방법은 오디오 신호의 현재 프레임의 합성에 사용되는 코드북의 코드에 스펙트럼 기울기를 적용하는 단계를 포함하며, 스펙트럼 기울기는 오디오 신호의 현재 프레임의 스펙트럼 기울기에 기초하여 결정된다.
본 출원의 발명자는 오디오 신호의 합성이 달성 가능한 코딩 이득을 향상시키기 위한 신호를 합성할 시에 오디오 신호의 스펙트럼 기울기의 특성을 이용하여 낮은 비트 레이트 및 높은 비트 레이트 모두에서 더 향상될 수 있다는 것을 알았다. 실시예에 따르면, 본 발명은, 예를 들어 CELP 음성 코딩 기술을 이용하여, CELP의 코딩 이득을 향상시켜 디코딩 또는 합성된 신호의 지각적인 품질을 향상시키는 음성 코딩을 위해 제공한다. 본 발명의 접근 방식은 이러한 개선이 현재 처리되는 실제 입력 신호의 스펙트럼 기울기의 함수로서 코드북의 코드, 예를 들어 CELP 혁신적인 코드북의 코드의 스펙트럼 기울기를 적응시킴으로써 달성될 수 있다는 발명자의 발견에 기초한다. 본 발명의 접근 방식은 낮은 비트 레이트에서 향상된 코딩 이득에 추가하여, 혁신적인 코드북이 음성의 미세 구조를 효율적으로 모델링하기 위해 충분히 채워지지 않는 경우에, 또한 추가의 포먼트 향상을 허용할 때 유리하다. 높은 비트 레이트에서, 혁신적인 코드북이 충분히 채워지는 경우에, 본 발명의 접근 방식은 코딩 이득을 향상시킬 것이다. 특히, 높은 비트 레이트에서, 포먼트 향상은 혁신적인 코드북이 음성의 미세 구조를 적절히 모델링하기 위해 충분히 클 때에는 포먼트 향상은 필요하지 않을 수 있으며, 포먼트를 더 향상시키는 것은 포먼트는 합성 신호 소리를 너무 합성시킬 것이다. 그러나, 최적의 코드는 스펙트럼으로 평탄하지 않으며, 스펙트럼 기울기를 추가하면 코딩 이득이 향상될 것이다. 실시예에 따르면, 혁신적인 코드북의 코드에 적용하기 위한 최적의 기울기는 보다 정확하게 추정되며, 특히 그것은 입력 신호의 현재 프레임의 기울기와 상관된다.
실시예에 따르면, 오디오 신호의 현재 프레임의 스펙트럼 기울기는 오디오 신호의 현재 프레임에 대한 스펙트럼 엔벨로프 정보에 기초하여 결정되며, 스펙트럼 엔벨로프 정보는 LPC 계수에 의해 정의될 수 있다. 본 실시예는 인코더 및 디코더 모두에서 이용 가능한 정보, 즉 LPC 계수에 기초하여 현재 프레임의 스펙트럼 기울기를 결정하는 것을 허용할 때에 유리하다.
추가의 실시예에 따르면, 오디오 신호의 현재 프레임의 스펙트럼 기울기는 LPC 계수에 기초하여 LPC 합성 필터의 절단된(truncated) 무한 임펄스 응답에 기초하여 결정될 수 있다. 실시예에 따르면, 절단(truncation)은 혁신적인 코드북의 크기에 의해, 즉 혁신적인 코드북의 코드의 수에 의해 결정될 수 있다. 이러한 접근 방식은 혁신적인 코드북의 실제 크기에 대한 스펙트럼 기울기의 결정에 직접적으로 관계하도록 할 때에 유리하다.
추가의 실시예에 따르면, 무한 임펄스 응답은 가중되지 않은 전달 함수 또는 가중된 전달 함수를 갖는 LPC 합성 필터의 것일 수 있다. 가중되지 않은 전달 함수를 이용하는 것은 스펙트럼 기울기의 단순화된 결정을 허용하지만, 가중된 전달 함수를 이용하는 것은 최적의 기울기에 더욱 가까운 경사를 갖는 스펙트럼 기울기를 허용할 때 유리하다.
실시예에 따르면, 결정된 스펙트럼 기울기는 스펙트럼 기울기를 포함하는 전달 함수에 기초하여 코드북으로부터 코드를 필터링함으로써 각각의 코드에 적용된다. 본 실시예는 간단한 필터링 프로세스에 의해 개선이 달성될 수 있을 때 유리하다.
또 다른 실시예에 따르면, 현재 프레임의 스펙트럼 기울기는 예를 들어 스펙트럼 기울기 및 인수(factor)를 포함하는 전달 함수에 기초하여 코드북으로부터의 코드를 필터링함으로써 오디오 신호의 이전의 프레임의 유성음과 관련된 인수와 조합될 수 있다. 이러한 접근 방식은 더 양호한 최적의 기울기의 추정치를 획득하기 위한 가능성에 대해 제공할 때 유리하다.
본 발명은 오디오 신호를 합성하기 위한 본 발명의 장치를 포함하는 오디오 디코더를 제공한다.
본 발명은 오디오 신호를 디코딩하기 위한 오디오 디코더를 제공하며, 오디오 디코더는 오디오 신호의 현재 프레임을 합성하기 위해 사용되는 코드북의 코드에 스펙트럼 기울기를 적용하도록 구성되며, 스펙트럼 기울기는 오디오 신호의 현재 프레임의 스펙트럼 기울기에 기초한다.
본 발명은 오디오 신호를 인코딩하기 위한 인코더를 제공하며, 오디오 인코더는 오디오 신호의 현재 프레임의 스펙트럼 기울기로부터 오디오 신호의 현재 프레임을 나타내는 코드북의 코드에 대한 스펙트럼 기울기를 결정하도록 구성된다.
본 발명은 본 발명의 오디오 디코더 및 본 발명의 오디오 인코더를 포함하는 시스템을 제공한다.
본 발명은 컴퓨터 상에서 실행될 때 오디오 신호를 합성하기 위한 본 발명의 방법을 수행하기 위한 명령어를 저장하는 비일시적 컴퓨터 매체를 제공한다.
본 발명의 실시예는 이제 첨부된 도면을 참조로 더욱 상세히 설명될 것이다.
도 1은 제 1 실시예에 따른 오디오 신호를 합성하기 위한 본 발명의 장치의 개략도를 도시한다.
도 2는 CELP 방식에 기초하여 동작하는 본 발명의 제 2 실시예에 따른 신호 합성기의 단순화된 블록도를 도시한다.
도 3은 이전의 프레임의 유성음을 통합하는 CELP 코딩 방식을 다시 적용하는 본 발명의 추가의 실시예에 따른 신호 합성기의 단순화된 블록도를 도시한다.
도 4는 디코더, 예를 들어 본 발명의 가르침에 따라 동작하는 음성 디코더의 실시예를 도시한다.
도 5는 인코더, 예를 들어 본 발명의 가르침에 따라 동작하는 음성 인코더의 실시예를 도시한다.
다음에는, 본 발명의 접근 방식의 실시예가 설명될 것이다. 후속 설명에서 유사한 요소/단계는 동일한 도면 부호에 의해 나타내는 것이 주목된다.
도 1은 제 1 실시예에 따른 오디오 신호를 합성하기 위한 본 발명의 장치의 개략도를 도시한다. 장치(100)는 입력(102)에서 음성 신호와 같이 인코딩된 신호, 예를 들어 인코딩된 오디오 신호를 수신한다. 오디오 신호를 디코딩하기 위해, 장치(100)는 복수의 코드를 포함하는 코드북(104)을 포함한다. 신호를 합성하기 위해, 현재 프레임을 처리할 때 입력(102)에서 수신된 인코딩된 신호에 기초하여, 적절한 코드 또는 코드워드는 코드북(104)으로부터 선택되고, 합성기 또는 합성 필터(106)를 향해 공급된다. 본 발명에 따르면, 장치는 오디오 신호의 현재 프레임, 즉 장치(100)에 의해 현재 처리된 오디오 신호의 프레임의 스펙트럼 기울기에 기초하여 110에서 개략적으로 나타낸 바와 같이 코드북(104)으로부터 판독된 코드 c(n)에 적용되는 스펙트럼 기울기를 결정하는 처리 유닛(108)을 포함한다. 수정된 코드
Figure 112015083776326-pct00006
는 수정된 코드에 기초하여 장치(100)의 출력(112)에 제공되는 합성된 신호를 생성하는 합성 필터(106)에 적용된다. 처리 유닛(108)은 현재 프레임에 대한 스펙트럼 엔벨로프 정보, 예를 들어 장치(100)에서 이용할 수 있는 합성 필터(106)에 대한 필터 계수에 기초하여 스펙트럼 기울기를 결정할 수 있다.
추가의 실시예에 따르면, CELP 혁신적인 코드북의 코드를 형상화하기 위한 적응 기울기 보상이 설명될 것이다. 도 2는 CELP 방식에 기초하여 동작하는 본 발명의 제 2 실시예에 따른 신호 합성기의 단순화된 블록도를 도시한다. CELP 방식에 따르면, 합성기(200)는 고정 또는 혁신적인 코드북(202) 및 적응 코드북(204)을 포함한다. 인코딩된 신호에 따라, 합성기(200)에 의해 현재 처리되는 현재 프레임에 대해, 코드는 각각의 코드북(202 및 204)으로부터 출력된다. 합성기(200)는 각각의 코드북(202 및 204)으로부터 수신된 코드를 조합하기 위한 합산기 또는 조합기(206)를 포함한다. 합산기(206)의 출력은 실제 오디오 신호를 합성하여 그것을 출력(210)에서 출력하기 위한 LPC 합성 필터(208)에 접속된다. 실시예에 따르면, 합성기(200)는 원하는 코드 이득에 의해 고정 코드북(202)으로부터 기여(contribution)를 승산하기 위한 제 1 증폭기(212)를 포함할 수 있다. 더욱이, 제 2 증폭기(214)는 적응 코드북으로부터의 기여가 음성의 피치를 모델링할 때 피치 이득에 따라 적응 코드북(204)으로부터 기여를 승산하기 위해 제공될 수 있다. 다른 실시예에 따르면, 또한 메모리 등과 같은 LPC 계수 저장소(216)는 합성기(200)를 포함하는 디코더에서 이용 가능한 LPC 계수를 저장하기 위해 제공될 수 있다. LPC 계수는 원하는 LPC 합성 필터링을 제공하기 위한 합성 필터(208)에 제공된다.
합성기(200)는 고정 코드북(202)과 제 1 증폭기(212) 사이에 접속되는 필터(218)를 포함한다. 필터(218)는 저장소(216)로부터 현재 프레임에 대한 LPC 계수를 수신한다. 본 발명의 구조에 의해, 현재 처리되는 오디오 프레임의 기울기는 저장소(216)에 저장되어 있는 이미 전송된 LPC 계수로부터 찾아낸다. 도 2의 실시예에 따르면,
Figure 112015083776326-pct00007
는 전달 함수
Figure 112015083776326-pct00008
를 갖는 LPC 합성 필터(208)의 임펄스 응답이고, 기울기는 필터(218)에 의해 다음과 같이 결정되는 것으로 추정된다:
Figure 112015083776326-pct00009
여기서 N은 무한 임펄스 응답
Figure 112015083776326-pct00010
의 절단의 크기이다. 실시예에 따르면, N은 혁신적인 코드북의 크기와 동일하며, 즉 N은 혁신적인 코드북에 저장된 코드 또는 코드워드의 수와 동일하다. 스펙트럼 기울기는 도 2의 실시예에 따라 필터(218)에 제공된 필터링 동작에 의해 고정 코드북(202)으로부터 검색된 코드 c(n)에 적용된다. 필터링 동작은 다음과 같이 정의된다:
Figure 112015083776326-pct00011
여기서
Figure 112015083776326-pct00012
은 다음과 같은 전달 함수의 임펄스 응답이다:
Figure 112015083776326-pct00013
도 2의 실시예는 코딩 이득을 향상시킴으로써 디코딩된 신호의 지각적 품질을 향상시킬 수 있을 때 유리하다. 코딩 이득의 향상은 LPC 합성 필터(208)의 전달 함수의 임펄스 응답에 기초하여 결정되는 스펙트럼 기울기를 포함하는 전달 함수에 의해 고정 코드북(202)으로부터 검색된 코드워드 또는 코드를 필터링함으로써 달성된다.
제 3 실시예에 따르면, 최적의 기울기에 가깝도록, 즉 입력 신호의 현재 프레임의 실제 기울기에 가깝도록 스펙트럼 기울기를 더 개선하기 위해, LPC 합성 필터(208)는 다음과 같은 전달 함수를 갖는다:
Figure 112016105543986-pct00084
w1 = 0.8, w2 = 0.9. 이 경우에, 스펙트럼 기울기는 다음과 같이 정의된다:
Figure 112015083776326-pct00015
가중 상수 w1 및 w2는 스펙트럼 엔벨로프의 동적을 제어하는데 사용된다. 예를 들면, w1 = 0.8이고, w2 = 0.9이면,
Figure 112015083776326-pct00016
는 진정한 신호 엔벨로프에 아주 가깝게 따른다. 생성된 스펙트럼 기울기
Figure 112015083776326-pct00017
는 높은 동적을 보여주고 너무 많이 변동할 수 있다. 이것은 코드북이 결정적으로 기울기 구조가 부족한 매우 낮은 비트 레이트에 대한 해결책일 수 있다. 그러나, 스펙트럼 엔벨로프의 스무스 버전(smooth version)으로부터 스펙트럼 기울기
Figure 112015083776326-pct00018
를 지각적으로 추론하는 것이 좋다는 것이 발견되었다. 양호한 스무딩(smoothing)은 위의 값 w1 = 0.8 및 w2 = 0.9으로 달성되는 것으로 발견되었고, 이는 비트 레이트의 큰 범위에 대한 양호한 트레이드 오프(trade-off)를 보여준다. 실시예에 따르면, w1 및 w2는 비트 레이트에 의존한다. 매우 높은 레이트에서 코드북이 충분히 크고, 임의의 스펙트럼 기울기
Figure 112015083776326-pct00019
를 모델링할 수 있는 경우에는, w1 = w2 = 1을 설정함으로써 스펙트럼 기울기
Figure 112015083776326-pct00020
의 영향을 끊을 수 있다.
최적의 기울기보다 더 가파른 경사를 갖는 기울기를 산출하는 제 2 실시예와 비교하면, "가중(weighted)" 전달 함수를 이용하는 제 3 실시예는 현재 프레임의 실제 기울기에 더 가까운 기울기를 제공한다.
도 3은 CELP 코딩 방식을 다시 적용하는 본 발명의 제 4 실시예에 따른 신호 합성기(200')의 추가의 단순화된 블록도를 도시한다. 도 2에 관하여 설명된 실시예와 비교하면, 도 3에 관하여 설명된 실시예는 이전의 프레임의 유성음과 관련된 상술한 인수를 추가로 적용한다. 도 3으로부터 알 수 있는 바와 같이, 게다가 증폭기(214)의 출력과, 합산기(206)에 의해 출력되는 혁신적 및 적응 코드북으로부터의 조합된 기여를 수신하는 유성음 추정기(220)가 제공되는 것을 제외하고는 합성기(200')의 구조는 도 2의 합성기(200)의 구조와 실질적으로 동일하다. 혁신적 코드북(202)으로부터 얻어진 코드 또는 코드워드가 유성음 인수와 조합되는 결정된 기울기에 기초하여 수정되도록(도 2 및 위의 설명 참조) 유성음 추정기는 신호를 필터(280)로 출력한다. 특히, 도 3의 실시예에 따르면, 결정된 스펙트럼 기울기는 이전의 프레임의 유성음에 관한 인수 β와 조합된다. 도 3에 관하여 설명된 접근 방식은 도 1 및 2에 관하여 설명된 실시예와 비교하면 코드워드에 적용될 기울기의 더 양호한 추정을 획득할 수 있을 때 유리하다. 코드 또는 코드 형상의 수정은 다시 다음과 같이 전달 함수를 이용하는 필터링 동작으로서 간주될 수 있다:
Figure 112015083776326-pct00021
여기서, a 및 b는 상수이다. 바람직한 실시예에서, a = 0.5이고, b = 0.25이다. 인수 β는 다음과 같이 이전의 프레임의 유성음으로부터 추론될 수 있다:
유성음 =
Figure 112015083776326-pct00022
실제 인수 β는 다음과 같이 결정될 수 있다:
β = 상수 · (1 + 유성음)
상수 a 및 b는 유성음 기울기 β 및 스펙트럼 기울기
Figure 112015083776326-pct00023
의 혼합을 제어하기 위해 적용된다. 낮은 비트 레이트 및 중간 비트 레이트에 대한 가중 상수 w1 및 w2에 관련하여 상술한 바와 같이, 그것은 스펙트럼 기울기
Figure 112015083776326-pct00024
에 기초하여 저주파 또는 고주파를 샤프(sharp)하게 함으로써 코드북을 형상화하기 위해 관련될 수 있다. 또한, 신호가 더 많이 유성음이 될수록 고주파를 더 잘 샤프하게 하는 것이 관찰되었다. 상수 a 및 b는 기울기 인수 β와
Figure 112015083776326-pct00025
를 정상화하고, 원하는대로 두 효과를 조합하기 위하여 세기를 저울질하기 위해 사용될 수 있다. 실시예에 따르면, 상수 a 및 b는 지각 품질을 평가함으로써 경험적으로 발견될 수 있다. 이것은 두 인수에 동일한 세기에 대해 제공한다:
Figure 112015083776326-pct00026
는 -1과 1 사이에서 경계를 이루며, 그래서
Figure 112015083776326-pct00027
는 -0.25과 0.25 사이에 있고, β는 0과 0.5 사이에서 경계를 이루며, 그래서
Figure 112015083776326-pct00028
는 0과 0.25 사이에서 경계를 이룬다. 가중 상수 w1 및 w2에 관해, 또한 상수 a 및 b는 비트 레이트에 의존하게 될 수 있다.
제 4 실시예에 따르면, 도 3에 도시된 바와 같은 오디오 합성은 적응 코드북 기여가 기여가 음성의 피치를 모델링할 때 피치 이득이라고 하는 이득과 곱해지도록 한다. 혁신적 코드는 먼저 스펙트럼 기울기를 코드에 추가하기 위해 Ft2(z)에 의해 필터링되며, 상술한 바와 같이 기울기는 합성될 신호의 현재 프레임의 기울기와 상관된다. 필터(218)의 출력은 코드 이득과 곱해지며, 두 기여, 적응 코드북으로부터의 곱해진 기여 및 혁신적 코드북으로부터의 곱해진 수정된 기여는 출력(210)에서 합성된 출력 신호를 생성하기 위한 합성 필터에 의해 필터링되기 전에 합산기(206)에 의해 합산된다.
도 4는 디코더, 예를 들어 본 발명의 가르침에 따라 동작하는 음성 디코더의 실시예를 도시한다. 디코더(300)는 상술한 실시예 중 하나에 따라 합성기(100, 200, 200')를 포함한다. 디코더는 디코더와, 디코더(300)의 출력(304)에서 디코딩된 신호를 생성하기 위한 합성기에 의해 처리되는 인코딩된 신호를 수신하는 입력(302)을 갖는다.
도 5는 인코더, 예를 들어 본 발명의 가르침에 따라 동작하는 음성 인코더의 실시예를 도시한다. 인코더(400)는 오디오 신호를 인코딩하기 위한 처리 유닛(402)을 포함한다. 더욱이, 처리 유닛은 오디오 신호의 현재 프레임의 스펙트럼 기울기로부터(예를 들어 인코더에서 이용 가능한 LPC 계수로부터) 오디오 신호의 현재 프레임을 나타내는 디코더에서의 코드북의 코드에 대한 스펙트럼 기울기를 나타내는 정보를 결정한다. 이러한 정보는 인코딩된 오디오 신호와 함께 오디오 신호를 합성할 시에 적용될 수 있는 디코더 측으로 전송될 수 있다. 스펙트럼 기울기는 도 1 내지 3에 관하여 상술한 바와 같은 방식으로 인코더에서 결정될 수 있고, 도 1 내지 3에 관하여 상술한 바와 같이 디코더에서 적용될 수 있다. 따라서, 본 발명의 실시예는 오디오 신호를 디코딩하기 위한 오디오 디코더와 함께 도 5에 도시된 바와 같이 위의 오디오 인코더를 제공하며, 오디오 디코더는 스펙트럼 기울기를 결정하는데 반드시 필요하지는 않고, 오히려, 인코더로부터 수신된 스펙트럼 기울기를 오디오 신호의 현재 프레임을 합성하기 위해 사용되는 코드북의 코드에 적용하도록 구성된다. 예를 들면, 처리 유닛(108) 또는 필터(218)가 인코더에서 계산되고 인코더로부터 전송되는 기울기를 수신하는 것을 제외하고는 디코더는 도 1 내지 도 3의 디코더로서 합성기를 가질 수 있다.
일부 양태가 장치의 맥락에서 설명되었지만, 이러한 양태는 또한 대응하는 방법의 설명을 나타내는 것이 명백하며, 여기서 블록 또는 장치는 방법 단계 또는 방법 단계의 특징에 대응한다. 마찬가지로, 방법 단계의 맥락에서 설명된 양태는 또한 대응하는 블록 또는 항목의 설명 또는 대응하는 장치의 특징을 나타낸다. 방법 단계의 일부 또는 모두는 예를 들어 마이크로 프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 이용하여) 실행될 수 있다. 일부 실시예에서, 가장 중요한 방법 단계 중 일부의 하나 이상은 이러한 장치에 의해 실행될 수 있다.
어떤 구현 요구 사항에 따라, 본 발명의 실시예는 하드웨어 또는 소프트웨어로 구현될 수 있다. 이러한 구현은 디지털 저장 매체와 같은 비일시적 저장 매체, 예를 들어 플로피 디스크, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 이용하여 수행될 수 있으며, 이러한 매체는 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는(또는 협력할 수 있는) 전자적으로 판독 가능한 제어 신호를 저장한다. 그래서, 디지털 저장 매체는 컴퓨터 판독 가능할 수 있다.
본 발명에 따른 일부 실시예는 본 명세서에서 설명된 방법 중 하나가 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전자적으로 판독 가능한 제어 신호를 갖는 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시예는 프로그램 코드를 가진 컴퓨터 프로그램 제품으로 구현될 수 있으며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 방법 중 하나를 수행하기 위해 동작한다. 프로그램 코드는 예를 들어 기계 판독 가능한 캐리어 상에 저장될 수 있다.
다른 실시예는 본 명세서에서 설명되고, 기계 판독 가능 캐리어 상에 저장된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
그래서, 다시 말하면, 본 발명의 방법의 실시예는 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 본 명세서에 설명된 방법 중 하나를 수행하기 위해 프로그램 코드를 갖는 컴퓨터 프로그램이다.
그래서, 본 발명의 방법의 추가의 실시예는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독 가능한 매체)이며, 이러한 데이터 캐리어는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 기록하고 포함한다. 데이터 캐리어, 디지털 저장 매체 또는 기록 매체는 통상적으로 유형 및/또는 비일시적이다.
그래서, 본 발명의 방법의 추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호의 시퀀스이다. 데이터 스트림 또는 신호의 시퀀스는 예를 들어 데이터 통신 접속, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.
추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하도록 구성되거나 적응되는 처리 수단, 예를 들어 컴퓨터 또는 프로그램 가능한 논리 장치를 포함한다.
추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 설치한 컴퓨터를 포함한다.
본 발명에 따른 추가의 실시예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기로 (예를 들어, 전자적 또는 광학적으로) 전송하도록 구성되는 장치 또는 시스템을 포함한다. 수신기는 예를 들어 컴퓨터, 모바일 장치, 메모리 장치 등일 수 있다. 장치 또는 시스템은 예를 들어 컴퓨터 프로그램을 수신기로 전송하기 위한 파일 서버를 포함할 수 있다.
일부 실시예에서, 프로그램 가능한 논리 장치(예를 들어, 필드 프로그램 가능한 게이트 어레이)는 본 명세서에서 설명된 방법의 기능의 일부 또는 모두를 수행하기 위해 이용될 수 있다. 일부 실시예에서, 필드 프로그램 가능한 게이트 어레이는 본 명세서에서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 이러한 방법은 바람직하게는 임의의 하드웨어 장치에 의해 수행된다.
상술한 실시예는 단지 본 발명의 원리에 대한 예시이다. 본 명세서에서 설명된 배치의 수정 및 변형과 상세 사항은 당업자에게는 자명할 것으로 이해된다. 따라서, 본 명세서에서 실시예의 설명에 의해 제시된 특정 상세 사항에 의해서가 아니라 첨부된 청구 범위에 의해서만 제한되는 것으로 의도된다.
참고 문헌
[1] Recommendation ITU-T G.718 : "Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s"
[2] US Patent 6,678,651 B2, "Short-Term Enhancement in CELP Speech Coding"

Claims (33)

  1. 오디오 신호를 합성하는 장치에 있어서,
    상기 오디오 신호의 현재 프레임을 합성하기 위해 사용되는 코드북(104, 202)의 코드에 스펙트럼 기울기를 적용하여 수정된 코드를 생성하도록 구성된 처리 유닛(108, 110, 218)을 포함하고,
    상기 스펙트럼 기울기는 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기에 기초하고,
    상기 처리 유닛(108, 110, 218)은 상기 오디오 신호의 현재 프레임에 대한 스펙트럼 엔벨로프 정보에 기초하여 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기를 결정하도록 구성되며,
    상기 처리 유닛(108, 110, 218)은 상기 스펙트럼 기울기를 포함하는 전달 함수에 기초하여 상기 코드북(104, 202)으로부터 상기 코드를 필터링함으로써 상기 스펙트럼 기울기를 적용하도록 구성되고,
    상기 처리 유닛(108, 110, 218)은 상기 수정된 코드에 기초하여 합성 음성 신호를 생성하도록 구성되는,
    오디오 신호를 합성하는 장치.
  2. 제 1 항에 있어서,
    상기 스펙트럼 엔벨로프 정보는 LPC 계수에 의해 정의될 수 있고, 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기는 다음과 같이 정의되며,
    Figure 112015083900594-pct00058

    Figure 112015083900594-pct00059
    는 전달 함수
    Figure 112015083900594-pct00060
    를 갖는 LPC 합성 필터(106, 208)의 무한 임펄스 응답이고,
    N은 무한 임펄스 응답
    Figure 112015083900594-pct00061
    의 절단의 크기인
    오디오 신호를 합성하는 장치.
  3. 제 1 항에 있어서,
    상기 스펙트럼 엔벨로프 정보는 LPC 계수에 의해 정의될 수 있고, 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기는 다음과 같이 정의되며,
    Figure 112016105543986-pct00085

    Figure 112016105543986-pct00086
    는 전달 함수
    Figure 112016105543986-pct00087
    를 갖는 LPC 합성 필터(106, 208)의 무한 임펄스 응답이고,
    N은 무한 임펄스 응답
    Figure 112016105543986-pct00088
    의 절단의 크기이며,
    w1, w2는 전달 함수
    Figure 112016105543986-pct00089
    의 포먼틱 구조를 정의하기 위한 가중 상수인
    오디오 신호를 합성하는 장치.
  4. 제 2 항에 있어서,
    N은 상기 코드북(104, 202)의 코드의 수와 동일한
    오디오 신호를 합성하는 장치.
  5. 제 1 항에 있어서,
    상기 스펙트럼 기울기를 포함하는 상기 전달 함수는 다음과 같이 정의되고:
    Figure 112015083900594-pct00067

    Figure 112015083900594-pct00068
    은 스펙트럼 기울기인
    오디오 신호를 합성하는 장치.
  6. 제 1 항에 있어서,
    상기 처리 유닛(108, 110, 218)은 상기 오디오 신호의 현재 프레임의 결정된 스펙트럼 기울기를 상기 오디오 신호의 이전 프레임의 유성음과 관련된 인수와 조합하도록 더 구성되는
    오디오 신호를 합성하는 장치.
  7. 제 6 항에 있어서,
    상기 오디오 신호의 상기 이전의 프레임의 유성음과 관련된 인수는 다음과 같이 정의되는:
    β = 상수 · (1 + 유성음)
    유성음 =
    Figure 112015083900594-pct00069

    오디오 신호를 합성하는 장치.
  8. 제 6 항에 있어서,
    상기 처리 유닛(108, 110, 218)은 상기 스펙트럼 기울기와 상기 오디오 신호의 상기 이전의 프레임의 유성음과 관련된 인수를 포함하는 전달 함수에 기초하여 상기 코드북(104, 202)으로부터 상기 코드를 필터링함으로써 상기 스펙트럼 기울기를 적용하도록 구성되는
    오디오 신호를 합성하는 장치.
  9. 제 8 항에 있어서,
    상기 스펙트럼 기울기를 포함하는 상기 전달 함수는 다음과 같이 정의되며:
    Figure 112016105543986-pct00090

    a, b는 상수이고,
    Figure 112016105543986-pct00091
    은 스펙트럼 기울기인,
    오디오 신호를 합성하는 장치.
  10. 제 1 항에 있어서,
    상기 오디오 신호는 음성 신호이고, 상기 스펙트럼 기울기를 적용하기 위한 상기 처리 유닛은 필터(218)를 포함하며, 상기 장치는
    적응 코드북(204),
    고정 코드북(202),
    상기 고정 코드북(202)에 결합되고, 상기 고정 코드북(202)의 필터링된 코드를 획득하기 위해 상기 고정 코드북(202)의 코드에 결정된 스펙트럼 기울기를 적용하도록 구성되는 필터(218),
    상기 적응 코드북(204) 및 상기 필터(218)에 결합되고, 상기 적응 코드북(204)으로부터의 코드를 조합된 코드를 획득하기 위해 상기 고정 코드북(202)의 필터링된 코드와 조합하도록 구성되는 합산기(206), 및
    상기 합산기(206)에 결합된 LPC 합성 필터(208)를 더 포함하는
    오디오 신호를 합성하는 장치.
  11. 제 10 항에 있어서,
    상기 적응 코드북(204)과 상기 합산기(206) 사이에 결합되고, 피치 이득과 상기 적응 코드북(204)으로부터의 코드를 곱하도록 구성되는 피치 이득 증폭기(214), 및
    상기 필터(218)와 상기 합산기(206) 사이에 결합되고, 코드 이득과 상기 고정 코드북(202)의 필터링된 코드를 곱하도록 구성되는 코드 이득 증폭기(212)를 더 포함하는
    오디오 신호를 합성하는 장치.
  12. 제 10 항에 있어서,
    상기 적응 코드북(204)과 상기 합산기(206)에 결합되고, 상기 오디오 신호의 이전의 프레임의 유성음과 관련된 인수를 상기 필터(218)로 출력하도록 구성되는 유성음 추정기(220), 및
    상기 오디오 신호의 현재 프레임에 대한 스펙트럼 엔벨로프 정보를 나타내는 LPC 계수를 저장하도록 구성되는 저장소(216)를 더 포함하는
    오디오 신호를 합성하는 장치.
  13. 오디오 디코더로서,
    인코딩된 오디오 신호를 수신하도록 구성된 입력(302);
    제 1 항에 따라 오디오 신호를 합성하는 장치(100, 200, 200'); 및
    출력(304);을 포함하고,
    상기 장치는 상기 인코딩된 오디오 신호를 수신하고, 출력(304)에서 디코딩된 신호를 생성하도록 구성된,
    오디오 디코더.
  14. 시스템으로서,
    제 13 항에 따른 오디오 디코더, 및
    상기 오디오 신호의 현재 프레임의 스펙트럼 기울기로부터 상기 오디오 신호의 현재 프레임을 나타내는 코드북(104, 202)의 코드에 대한 스펙트럼 기울기를 결정하도록 구성되는 오디오 인코더를 포함하는 시스템.
  15. 오디오 신호를 합성하는 방법에 있어서,
    상기 오디오 신호의 현재 프레임을 합성하기 위해 사용되는 코드북(104, 202)의 코드에 스펙트럼 기울기를 적용하여 수정된 코드를 생성하는 단계; 및
    상기 수정된 코드에 기초하여 합성 음성 신호를 생성하는 단계;를 포함하되,
    상기 스펙트럼 기울기는 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기에 기초하여 결정되고,
    상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기는 상기 오디오 신호의 현재 프레임에 대한 스펙트럼 엔벨로프 정보에 기초하여 결정되며,
    상기 스펙트럼 기울기를 적용하는 단계는 상기 스펙트럼 기울기를 모델링하는 전달 함수에 기초하여 상기 코드북(104, 202)으로부터 상기 코드를 필터링하는 단계를 포함하는,
    오디오 신호를 합성하는 방법.
  16. 제 15 항에 있어서,
    상기 스펙트럼 엔벨로프 정보는 LPC 계수에 의해 정의되고, 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기는 다음과 같이 정의되며,
    Figure 112015083900594-pct00071

    Figure 112015083900594-pct00072
    는 전달 함수
    Figure 112015083900594-pct00073
    를 갖는 LPC 합성 필터(106, 208)의 무한 임펄스 응답이고,
    N은 무한 임펄스 응답
    Figure 112015083900594-pct00074
    의 절단의 크기인
    오디오 신호를 합성하는 방법.
  17. 제 15 항에 있어서,
    상기 스펙트럼 엔벨로프 정보는 LPC 계수에 의해 정의되고, 상기 오디오 신호의 현재 프레임의 상기 스펙트럼 기울기는 다음과 같이 정의되며,
    Figure 112016105543986-pct00092

    Figure 112016105543986-pct00093
    는 전달 함수
    Figure 112016105543986-pct00094
    를 갖는 LPC 합성 필터(106, 208)의 무한 임펄스 응답이고,
    N은 무한 임펄스 응답
    Figure 112016105543986-pct00095
    의 절단의 크기이며,
    w1, w2는 전달 함수
    Figure 112016105543986-pct00096
    의 포먼틱 구조를 정의하기 위한 가중 상수인
    오디오 신호를 합성하는 방법.
  18. 제 16 항에 있어서,
    N은 상기 코드북(104, 202)의 코드의 수와 동일한
    오디오 신호를 합성하는 방법.
  19. 제 15 항에 있어서,
    상기 스펙트럼 기울기를 포함하는 상기 전달 함수는 다음과 같이 결정되고:
    Figure 112015083900594-pct00080

    Figure 112015083900594-pct00081
    은 스펙트럼 기울기인
    오디오 신호를 합성하는 방법.
  20. 제 15 항에 있어서,
    상기 오디오 신호의 현재 프레임의 결정된 스펙트럼 기울기를 상기 오디오 신호의 이전의 프레임의 유성음과 관련된 인수와 조합하는 단계를 더 포함하는
    오디오 신호를 합성하는 방법.
  21. 제 20 항에 있어서,
    상기 오디오 신호의 상기 이전의 프레임의 유성음과 관련된 인수는 다음과 같이 결정되는:
    β = 상수 · (1 + 유성음)
    유성음 =
    Figure 112015083900594-pct00082

    오디오 신호를 합성하는 방법.
  22. 제 20 항에 있어서,
    상기 스펙트럼 기울기를 적용하는 단계는 상기 스펙트럼 기울기와 상기 오디오 신호의 상기 이전의 프레임의 유성음과 관련된 인수를 포함하는 전달 함수에 기초하여 상기 코드북(104, 202)으로부터 상기 코드를 필터링하는 단계를 포함하는
    오디오 신호를 합성하는 방법.
  23. 제 22 항에 있어서,
    상기 스펙트럼 기울기를 포함하는 상기 전달 함수는 다음과 같이 결정되며:
    Figure 112016105543986-pct00097

    a, b는 상수이고,
    Figure 112016105543986-pct00098
    은 스펙트럼 기울기인,
    오디오 신호를 합성하는 방법.
  24. 제 15 항에 있어서,
    상기 오디오 신호는 음성 신호이고, 상기 오디오 신호를 합성하는 단계는 상기 오디오 신호의 프레임에 대해
    고정 코드북(202)의 필터링된 코드를 획득하기 위해 상기 고정 코드북(202)의 코드에 결정된 스펙트럼 기울기를 적용하는 단계,
    적응 코드북(204)으로부터의 코드를 조합된 코드를 획득하기 위해 상기 고정 코드북(202)의 필터링된 코드와 조합하는 단계, 및
    LPC 합성 필터(208)에 의해 상기 조합된 코드를 필터링하는 단계를 포함하는
    오디오 신호를 합성하는 방법.
  25. 제 24 항에 있어서,
    피치 이득과 상기 적응 코드북(204)으로부터의 코드를 곱하는 단계, 및
    코드 이득과 상기 고정 코드북(202)의 필터링된 코드를 곱하는 단계를 더 포함하는
    오디오 신호를 합성하는 방법.
  26. 제 24 항에 있어서,
    상기 적응 코드북(204)으로부터의 코드 및 상기 조합된 코드에 기초하여, 상기 오디오 신호의 이전의 프레임의 유성음과 관련된 인수를 생성하는 단계, 및
    상기 오디오 신호의 현재 프레임에 대한 스펙트럼 엔벨로프 정보를 나타내는 LPC 계수를 저장하는 단계를 더 포함하는
    오디오 신호를 합성하는 방법.
  27. 컴퓨터 상에서 실행될 때, 제 15 항에서 정의된 바와 같이 오디오 신호를 합성하는 방법을 실행하기 위한 명령어를 저장하는 컴퓨터 판독가능 기록매체.
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
KR1020157023505A 2013-01-29 2014-01-28 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법 KR101737254B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758098P 2013-01-29 2013-01-29
US61/758,098 2013-01-29
PCT/EP2014/051592 WO2014118156A1 (en) 2013-01-29 2014-01-28 Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program

Publications (2)

Publication Number Publication Date
KR20150112028A KR20150112028A (ko) 2015-10-06
KR101737254B1 true KR101737254B1 (ko) 2017-05-17

Family

ID=50033504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157023505A KR101737254B1 (ko) 2013-01-29 2014-01-28 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법

Country Status (20)

Country Link
US (3) US10431232B2 (ko)
EP (1) EP2951819B1 (ko)
JP (1) JP6082126B2 (ko)
KR (1) KR101737254B1 (ko)
CN (1) CN105009210B (ko)
AR (1) AR094683A1 (ko)
AU (1) AU2014211524B2 (ko)
BR (1) BR112015018023B1 (ko)
CA (1) CA2899059C (ko)
ES (1) ES2626977T3 (ko)
HK (1) HK1217564A1 (ko)
MX (1) MX347316B (ko)
MY (1) MY183444A (ko)
PL (1) PL2951819T3 (ko)
PT (1) PT2951819T (ko)
RU (1) RU2618919C2 (ko)
SG (1) SG11201505903UA (ko)
TW (1) TWI544481B (ko)
WO (1) WO2014118156A1 (ko)
ZA (1) ZA201506318B (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001091112A1 (en) 2000-05-19 2001-11-29 Conexant Systems, Inc. Gains quantization for a clep speech coder

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6242748B1 (en) 1999-08-10 2001-06-05 Edax, Inc. Methods and apparatus for mounting an X-ray detecting unit to an electron microscope
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US6996523B1 (en) 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
CN1320966C (zh) 2002-05-20 2007-06-13 松下电器产业株式会社 清洗方法及清洗装置
US20060089836A1 (en) * 2004-10-21 2006-04-27 Motorola, Inc. System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization
US7475103B2 (en) 2005-03-17 2009-01-06 Qualcomm Incorporated Efficient check node message transform approximation for LDPC decoder
RU2376657C2 (ru) * 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
EP1722360B1 (en) 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
US8706480B2 (en) * 2007-06-11 2014-04-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoding audio signal
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8788276B2 (en) * 2008-07-11 2014-07-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
CA2778240C (en) * 2009-10-20 2016-09-06 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and celp coding adapted therefore
EP2559028B1 (en) * 2010-04-14 2015-09-16 VoiceAge Corporation Flexible and scalable combined innovation codebook for use in celp coder and decoder
SG185606A1 (en) * 2010-05-25 2012-12-28 Nokia Corp A bandwidth extender
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US9706314B2 (en) * 2010-11-29 2017-07-11 Wisconsin Alumni Research Foundation System and method for selective enhancement of speech signals
JP5328883B2 (ja) * 2011-12-02 2013-10-30 パナソニック株式会社 Celp型音声復号化装置およびcelp型音声復号化方法
BR112015017748B1 (pt) * 2013-01-29 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Preenchimento de ruído na codificação de áudio de transformada perceptual
EP3054446B1 (en) * 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
MX347080B (es) * 2013-01-29 2017-04-11 Fraunhofer Ges Forschung Llenado con ruido sin informacion secundaria para celp (para codificadores tipo celp).
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
RU2644123C2 (ru) * 2013-10-18 2018-02-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
EP3058568B1 (en) * 2013-10-18 2021-01-13 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9672843B2 (en) * 2014-05-29 2017-06-06 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
US9373342B2 (en) * 2014-06-23 2016-06-21 Nuance Communications, Inc. System and method for speech enhancement on compressed speech
CN106228991B (zh) * 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001091112A1 (en) 2000-05-19 2001-11-29 Conexant Systems, Inc. Gains quantization for a clep speech coder

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Definition of the Opus Audio Codec. Internet Engineering Task Force (IETF) RFC 6716, 2012.09.*
Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s. ITU-T Rec. G.718, 2008.06.*
Mandatory Speech Codec speech processing functions AMR speech codec Transcoding functions. ETSI TS 126 090 V3.1.0, 2000.01.*

Also Published As

Publication number Publication date
CN105009210B (zh) 2018-04-10
US20220293114A1 (en) 2022-09-15
EP2951819A1 (en) 2015-12-09
EP2951819B1 (en) 2017-03-01
WO2014118156A1 (en) 2014-08-07
SG11201505903UA (en) 2015-08-28
TW201435862A (zh) 2014-09-16
PL2951819T3 (pl) 2017-08-31
CA2899059A1 (en) 2014-08-07
US10431232B2 (en) 2019-10-01
JP2016509694A (ja) 2016-03-31
MY183444A (en) 2021-02-18
AU2014211524A1 (en) 2015-09-17
RU2618919C2 (ru) 2017-05-12
CN105009210A (zh) 2015-10-28
RU2015136788A (ru) 2017-03-06
US20190378528A1 (en) 2019-12-12
MX347316B (es) 2017-04-21
US11373664B2 (en) 2022-06-28
BR112015018023B1 (pt) 2022-06-07
ES2626977T3 (es) 2017-07-26
US20150332694A1 (en) 2015-11-19
TWI544481B (zh) 2016-08-01
BR112015018023A2 (ko) 2017-08-22
KR20150112028A (ko) 2015-10-06
HK1217564A1 (zh) 2017-01-13
JP6082126B2 (ja) 2017-02-15
AR094683A1 (es) 2015-08-19
CA2899059C (en) 2018-05-15
PT2951819T (pt) 2017-06-06
AU2014211524B2 (en) 2016-07-07
MX2015009749A (es) 2015-11-06
ZA201506318B (en) 2016-07-27

Similar Documents

Publication Publication Date Title
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
US8069040B2 (en) Systems, methods, and apparatus for quantization of spectral envelope representation
US11881228B2 (en) Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US11798570B2 (en) Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
CN105264596A (zh) 用于码激励线性预测类编码器的无边信息的噪声填充
KR102138320B1 (ko) 통신 시스템에서 신호 코덱 장치 및 방법
US20220293114A1 (en) Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP2004151424A (ja) トランスコーダ及び符号変換方法
US8838443B2 (en) Encoder apparatus, decoder apparatus and methods of these
WO2012053146A1 (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant