KR20080034818A - 부호화/복호화 장치 및 방법 - Google Patents

부호화/복호화 장치 및 방법 Download PDF

Info

Publication number
KR20080034818A
KR20080034818A KR1020070104674A KR20070104674A KR20080034818A KR 20080034818 A KR20080034818 A KR 20080034818A KR 1020070104674 A KR1020070104674 A KR 1020070104674A KR 20070104674 A KR20070104674 A KR 20070104674A KR 20080034818 A KR20080034818 A KR 20080034818A
Authority
KR
South Korea
Prior art keywords
pitch
signal
pitches
information
linear prediction
Prior art date
Application number
KR1020070104674A
Other languages
English (en)
Inventor
이민구
성굉모
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20080034818A publication Critical patent/KR20080034818A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 부호화/복호화 장치 및 방법에 관한 것이다. 그 복호화 방법은, 입력되는 비트스트림으로부터 선형 예측 계수, 여기 신호 정보 및 복수의 피치(pitch)들에 대한 정보를 추출하는 단계; 여기 신호 정보 및 복수의 피치들에 대한 정보를 이용하여 잔차 신호를 생성하는 단계; 및 선형 예측 계수 및 잔차 신호를 이용하여 신호를 합성하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 선형 예측 분석을 이용한 신호의 부호화 및 복호화에 있어 신호의 피치를 2 이상 검출하여 부호화 및 복호화에 이용함으로써, 적은 비트율을 가지고 오디오 신호, 음성 신호 등을 모두 효율적으로 부호화할 수 있다.

Description

부호화/복호화 장치 및 방법{Apparatus and method for encoding and decoding signal}
도 1은 선형 예측 분석을 이용한 부호화 장치의 개략적인 구성을 나타내는 블록도이다.
도 2는 본 발명에 따른 부호화 장치의 구성에 대한 일실시예를 나타내는 블록도이다.
도 3은 음성 부호화기의 구성에 대한 일실시예를 나타내는 블록도이다.
도 4는 본 발명에 따른 복호화 장치의 구성에 대한 일실시예를 나타내는 블록도이다.
본 발명은 신호의 부호화/복호화 장치 및 방법에 관한 것으로, 더욱 상세하게는 음성 신호와 오디오 신호를 모두 효율적으로 부호화/복호화할 수 있는 방법 및 장치에 관한 것이다.
일반적으로, 오디오 부호화기는 48kbps 이상의 높은 비트율에서는 고음질의 오디오 신호를 제공하지만 음성 신호의 처리에는 비효율적이며, 종래의 음성 부호 화기는 12kbps 이하의 낮은 비트율에서 음성 신호를 효과적으로 부호화할 수 있지만 다양한 오디오 신호를 부호화하기에 부족하다.
따라서 음성 신호 및 오디오 신호와 같이 서로 특성이 다른 신호들을 모두 효율적으로 부호화할 수 있는 부호화 및 복호화 방법이 필요하다.
본 발명이 이루고자 하는 기술적 과제는, 음성 신호, 오디오 신호 등과 같이 서로 다른 특성을 가지는 신호들을 최적의 비트율로 부호화할 수 있도록 하는 부호화/복호화 장치 및 방법을 제공하는 데 있다.
상술한 기술적 과제를 해결하기 위한 본 발명에 따른 복호화 방법은, 입력되는 비트스트림으로부터 선형 예측 계수, 여기 신호 정보 및 복수의 피치(pitch)들에 대한 정보를 추출하는 단계; 상기 여기 신호 정보 및 복수의 피치들에 대한 정보를 이용하여 잔차 신호를 생성하는 단계; 및 상기 추출된 선형 예측 계수 및 상기 생성된 잔차 신호를 이용하여 신호를 합성하는 단계를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 따른 부호화 방법은, 입력 신호에 대해 선형 예측 분석을 수행하여 선형 예측 계수를 구하는 단계; 상기 구해진 선형 예측 계수를 양자화하는 단계; 및 상기 입력 신호의 피치를 2 이상 검출하는 단계를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 따른 복호화 장치는, 입력되 는 비트스트림으로부터 선형 예측 계수, 여기 신호 정보 및 복수의 피치(pitch)에 대한 정보를 추출하는 비트언팩킹부; 상기 복수의 피치에 대한 정보들 각각에 대응되는 복수의 음원 신호들을 생성하는 음원신호생성부; 상기 여기 신호 정보에 대응되는 여기 신호를 생성하는 여기신호생성부; 상기 생성된 복수의 음원 신호와 여기 신호를 가산하여 잔차 신호를 생성하는 가산부; 및 상기 선형 예측 계수와 상기 생성된 잔차 신호를 이용하여 신호를 합성하는 합성부를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 따른 부호화 장치는, 입력 신호에 대해 선형 예측 분석을 수행하여 선형 예측 계수를 구하는 선형예측분석부; 및 상기 입력 신호의 피치를 2 이상 검출하는 피치검출부를 포함하는 것을 특징으로 한다.
상기 본 발명에 의한 부호화/복호화 방법은 바람직하게는 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현할 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 본 발명에 따른 부호화/복호화 장치 및 방법에 관해 상세히 설명한다.
도 1은 선형 예측 분석을 이용한 부호화 장치의 개략적인 구성을 블록도로 도시한 것으로, 도시된 부호화 장치는 피치검출부(100) 및 선형예측분석부(110)를 포함하여 이루어진다.
음성 신호는 인간의 발성 기구를 참고하여 모델링(modeling)될 수 있다. 즉, 성대의 진동은 임의의 주파수로 진동하는 발진기로 치환할 수 있으며, 후두에서 입 에 이르는 부분은 성대의 진동으로 생기는 음의 스펙트럼에 변화를 가하는 부분이므로 상기 발진기에서 출력된 신호를 변화시키는 필터로 치환할 수 있다. 그에 따라, 상기 발진기의 주파수와 필터의 특성을 나타내는 계수를 결정함으로써 음성 신호를 부호화할 수 있다.
또한, 인간의 발성은 크게 주기적인 특성을 가지는 유성음과 주기성이 없는 잡음적인 특성을 가지는 무성음으로 나눌 수 있으므로, 상기 발진기는 주기 신호 발진기와 잡음 신호 발진기의 조합으로 생각할 수 있다.
따라서, 음성 신호는 주파수 공간 상에서의 특성을 나타내는 계수, 주기 성분인 피치(pitch)에 관한 정보 및 잡음 성분에 관한 정보로 부호화될 수 있다.
도 1을 참조하면, 피치검출부(100)는 부호화하고자하는 신호의 피치를 검출한다. 음성 신호의 경우에는 하나의 피치만을 포함하나, 오디오 신호의 경우에는 2 이상의 피치를 포함할 수 있다.
도 1에 도시된 바와 같이, 피치검출부(100)는 다음의 수학식 1로 표현될 수 있다.
Figure 112007074372981-PAT00001
상기 수학식 1에서, T는 피치의 주기를 나타내며, gp는 상기 피치의 게인(gain)을 나타낸다.
피치검출부(100)는 입력 신호의 피치의 주기 및 게인을 프레임 단위로 검출함으로써 입력 신호의 주기적인 성분을 부호화할 수 있다. 본 발명에 따른 부호화 장치는 음성 신호뿐 아니라 오디오 신호에도 적용 가능하기 위해, 프레임 단위로 2 이상의 피치 주기 및 게인을 검출하는 것이 바람직하다.
선형예측분석부(110)는 입력 신호에 대해 선형 예측 분석을 수행하여 선형 예측 계수를 구한다. 상기 구해진 선형 예측 계수는 상기 입력 신호의 스펙트럼 포락선(spectral envelop), 즉 주파수 공간 상에서의 신호 특성을 표현한다.
다음의 수학식 2와 같이 현재 신호 X(n)을 과거 입력 신호들의 선형 조합으로 표현될 수 있다.
Figure 112007074372981-PAT00002
상기 수학식 2에서 p는 선형 예측 차수이고, a1 내지 ap는 선형 예측 계수이며, e(n)은 선형 예측의 오차를 나타내는 잔차 신호이다. 상기 선형 예측 계수는 프레임 전체에 걸쳐 상기 잔차 신호 e(n)이 최소가 되도록 프레임 단위로 결정된다.
선형예측분석부(110)는 비대칭 윈도우(window)를 이용해 구한 자기 상관 계수를 사용하여 입력되는 신호에 대해 프레임 단위로 선형 예측 분석을 수행할 수 있다. 자기 상관 계수를 구함에 있어, 선형예측분석부(110)는 예견 구간, 예를 들어 상기 비대칭 윈도우가 30ms의 길이를 가지는 경우 5ms의 길이를 가지는 예견 구 간을 두어 선형 예측 분석을 수행할 수 있다. 상기 자기 상관 계수는 Levinson-Durbin 알고리듬을 이용하여 선형 예측 계수로 변환된다.
상기 구해진 선형 예측 계수는 양자화에 적합한 파라미터인 LAR(Log Area Ratio) 또는 LSP(Line Spectrum Pair)로 변환된 후 양자화되어, 양자화 테이블의 인덱스 형태로 부호화될 수 있다.
입력된 여기 신호와 상기 검출된 피치에 의해 표현되는 주기적인 음원 신호에 대해, 상기 구해진 선형 예측 계수를 이용해 LPC 합성 필터링을 수행하면 합성된 신호를 얻을 수 있다.
상기 여기 신호는 입력 신호의 잡음 성분을 나타내는 것으로, 상기 합성 신호와 원본 신호인 상기 입력 신호 사이의 오차가 최소화되도록 결정된 것이다. 상기 피치 검출 및 여기 신호 결정 방법에 대해서는 도 3을 참조하여 상세히 설명하기로 한다.
도 1에 도시된 바와 같이, 여기 신호에는 게인(gc)이 곱해지는데, 상기 여기 신호의 게인(gc) 및 상기 피치의 게인(gp)을 제어함에 따라 주기성이 강한 신호에서 주기성이 없는 잡음 신호까지 다양한 신호의 생성이 가능하다. 상기 게인(gc, gp)은 양자화되어 양자화 테이블의 인덱스 형태로 부호화될 수 있다.
상기 선형 예측 계수에 대한 정보, 상기 검출된 피치 주기 및 게인 정보, 상기 여기 신호에 대한 정보는 비트스트림으로 생성되어 복호화 장치로 전송될 수 있다.
도 2는 본 발명에 따른 부호화 장치의 구성에 대한 일실시예를 블록도로 도시한 것으로, 도시된 부호화 장치는 부호화하고자하는 입력 신호의 피치를 2 이상 검출한다. 도 2에 도시된 부호화 장치의 동작 중 도 1을 참조하여 설명한 동작과 동일한 것은 생략하기로 한다.
도 2를 참조하면, 복수의 피치검출부들(200, 210, 220)은 각각 입력 신호의 피치를 검출하여, 입력 신호로부터 복수의 피치들이 검출된다.
제1 피치검출부(200)는 상기 입력 신호의 피치를 검출한다. 제1 피치검출부(200)는 상기 입력 신호의 피치들 중 가장 큰 피치 성분을 검출하는 것이 바람직하다.
예를 들어, 제1 피치검출부(200)는 피치들 중 합성 신호와 상기 입력 신호의 오차를 최소화시키는 피치를 상기 입력 신호의 피치로 검출할 수 있다.
제2 피치검출부(210)는 상기 입력 신호로부터 제1 피치검출부(200)에서 검출된 피치 성분을 제거하고, 상기 피치 성분이 제거된 신호에서 피치를 검출한다. 나머지 피치 검출부들은 상기한 바와 같이 이미 검출된 피치 성분들을 입력 신호로부터 제거한 후 또 다른 피치를 검출하는 과정을 반복한다.
도 2에 도시된 바와 같이, 상기 검출된 피치에 의해 표현되는 음원 신호의 에너지를 유지하기 위해, 피치검출부들(200, 210, 220)에는 각각 가중치(W1, W2, ..., W3)가 곱해질 수 있다.
복수의 피치검출부들(200, 210, 220)은 다음의 수학식 3과 같이 표현될 수 있다.
Figure 112007074372981-PAT00003
상기 수학식 3에서, M은 검출하고자하는 피치의 개수이며, i는 피치의 인덱스이고, Ti는 i번째 피치의 게인이며, gpi는 i번째 피치의 게인을 의미한다.
상기한 바와 같이, 상기 수학식 3의 파라미터들은 검출된 피치들, 여기 신호 및 선형예측분석부(230)에서 구해진 선형 예측 계수에 의해 합성되는 합성 신호와 원본 신호인 입력 신호 사이의 오차가 최소화되도록 결정되는 것이 바람직하다.
상기에서는, 도 2를 참조하여 부호화 장치가 검출하고자 하는 피치들의 개수(M)만큼의 피치검출부들(200, 210, 220)을 포함하는 것을 예로 들어 본 발명에 따른 부호화 장치를 나타내었으나, 그와 달리 하나의 피치검출부를 이용해 상기한 바와 같은 피치 검출 단계를 검출하고자 하는 피치들의 개수(M)만큼 반복 수행하여 복수 개의 피치들을 검출할 수도 있다.
도 1 및 도 2를 참조하여 설명한 바와 같이, 본 발명에 따른 부호화 장치는 피치 검출 및 선형 예측 분석을 이용하는 음성 부호화 장치의 전체적인 구조를 유지하면서 복수의 피치를 검출하도록 하여 음성 신호뿐 아니라 오디오 신호도 효율적으로 부호화할 수 있다.
도 3은 음성 부호화기의 구성에 대한 일실시예를 블록도로 도시한 것으로, 본 발명에 따른 부호화 장치에서 최적 여기 신호와 피치를 검출하는 방법에 대한 실시예를 설명하기 위해 도시한 것이다.
선형예측부(300)는 입력 신호에 대해 선형 예측 분석을 수행하여 선형 예측 계수를 구하고, 양자화부(310)는 상기 구해진 선형 예측 계수를 양자화에 적합한 파라미터인 LAR(Log Area Ratio) 또는 LSP(Line Spectrum Pair)로 변환된 후 양자화한다.
피치추정부(320)는 상기 입력 신호의 피치 주기를 추정한다. 적응코드북(330)는 과거의 입력 신호 중 주기적인 성분인 음원 신호들을 코드북의 형태로 저장한다. 잡음생성부(340)는 비주기적인 잡음 신호를 생성하며, 상기 잡음 신호들을 코드북의 형태로 저장하고 있을 수도 있다.
가산부(350)는 피치추정부(320)에서 추정된 피치 주기에 따라 적응코드북(330)으로부터 추출된 주기적인 음원 신호와 잡음생성부(340)로부터 출력된 잡음 신호 각각에 게인(gp, gc)을 곱한 후 가산하여 잔차 신호를 생성한다. 일반적으로 잔차 신호는 선형 예측 계수를 이용해 입력 신호에 대해 선형 예측 역필터링을 수행하여 얻어지는 신호를 의미하는데, 가산부(350)로부터 출력되는 상기 잔차 신호는 정확하게는 잔차 신호에 가까운 신호이다.
합성필터(360)는 가산부(350)로부터 출력된 잔차 신호에 대해 상기 양자화된 선형 예측 계수에 의한 합성 필터링을 수행하여 합성 신호를 생성한다.
오차계산부(370)는 원본 신호인 입력 신호와 상기 합성 신호 사이의 오차를 계산하고, 청각가중치필터(380)는 상기 계산된 오차에 대하여 청각적인 가중치를 준다.
오차최소화부(390)는 상기 청각적인 특성을 고려한 오차를 최소로 하는 피치의 주기(Ti), 게인(gpi, gci), 잡음 신호를 결정한다.
본 발명에 따른 복호화 장치는 상기 도 1 내지 도 3을 참조하여 설명한 부호화 장치의 부호화 과정의 역 과정을 수행함에 의해, 입력되는 비트스트림으로부터 신호를 복원할 수 있다.
도 4는 본 발명에 따른 복호화 장치의 구성에 대한 일실시예를 블록도로 도시한 것으로, 도시된 복호화 장치는 비트언팩킹부(400), 음원신호생성부(410), 여기신호생성부(420), 가산부(430) 및 LPC합성필터(440)를 포함하여 이루어진다.
비트언팩킹부(400)는 입력되는 비트스트림으로부터 선형 예측 계수에 대한 정보, 복수의 피치들에 대한 정보 및 여기 신호에 대한 정보를 추출한다.
음원신호생성부(410)는 상기 추출된 복수의 피치들에 대한 정보를 이용하여, 상기 복수의 피치들 각각에 상응하는 주기적인 음원 신호들을 생성한다. 상기 복수의 피치에 대한 정보는 각 피치의 주기(Ti) 및 게인(gpi), 상기 생성된 음원 신호들 각각에 곱해질 가중치(W1, W2, WM)를 포함하는 것이 바람직하다.
도 4를 참조하면, 제1 신호생성부(411)는 복수의 피치들 중 첫번째 피치의 주기(T1) 및 게인(gp1)에 상응하는 제1 음원 신호를 생성하고, 상기 생성된 제1 음원 신호에 제1 가중치(W1)를 곱한다. 제2 신호생성부(412)는 복수의 피치들 중 두번 째 피치의 주기(T2) 및 게인(gp2)에 상응하는 제2 음원 신호를 생성하고, 상기 생성된 제2 음원 신호에 제2 가중치(W2)를 곱한다. 제M 신호생성부(413)는 복수의 피치들 중 M번째 피치의 주기(TM) 및 게인(gpM)에 상응하는 제M 음원 신호를 생성하고, 상기 생성된 제M 음원 신호에 제M 가중치(WM)를 곱한다.
음원신호생성부(410)는 상기 가중치가 곱해진 복수의 음원 신호들을 합하여 하나의 주기적인 특성을 가지는 음원 신호를 생성한다.
상기 비트스트림으로부터 추출된 피치 정보는 코드북 인덱스일 수 있다. 그러한 경우 음원신호생성부(410)는 부호화 장치와 동일한 코드북을 포함하여, 상기 추출된 인덱스에 대응되는 음원 신호를 상기 코드북에서 추출할 수 있다.
여기신호생성부(420)는 상기 추출된 여기 신호 정보에 따라 여기 신호를 생성한다. 상기 비트스트림으로부터 추출된 피치 정보는 코드북 인덱스일 수 있다. 그러한 경우, 여기신호생성부(420)가 부호화 장치와 동일한 코드북을 포함하거나, 코드북 인덱스는 각 트랙에서의 신호의 위치와 부호를 나타내게 되므로 상기 코드북 인덱스 자체만으로 상기 여기 신호를 생성할 수 있다.
가산부(430)는 상기 생성된 음원 신호와 상기 여기 신호를 가산하여 잔차 신호를 생성한다. LPC합성필터(440)는 상기 잔차 신호에 대해 상기 추출된 선형 예측 계수를 이용해 합성 필터링을 수행하여 신호를 복원한다.
상기에서는, 도 4를 참조하여 피치들의 개수(M)만큼의 신호생성부들(411, 412, 413)을 포함하는 것을 예로 들어 본 발명에 따른 부호화 장치를 나타내었으 나, 그와 달리 하나의 신호생성부를 이용해 상기한 바와 같은 주기적인 음원 신호를 생성하는 단계를 반복 수행하여 복수 개의 피치들에 상응하는 복수의 음원 신호들을 생성할 수도 있다.
상술한 본 발명에 따른 부호화/복호화 장치는 DAB(Digital Audio Broadcasting), DMB(Digital Multimedia Broadcasting)과 같은 멀티미디어 방송 송/수신 장치에 구비되어, 오디오 신호 또는 음성 신호 등을 부호화/복호화 하는데 사용될 수 있다. 또한 상기 멀티미디어 방송 송/수신 장치는 이동통신 단말기를 포함할 수 있다.
상술한 본 발명에 따른 부호화/복호화 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 상기한 본 발명에 따른 데이터 구조를 가지는 멀티 미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다. 또한, 상술한 부호화 방법에 의해 생성된 비트스트림은 상기 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
상술한 본 발명에 따른 복호화 장치는 이동 통신 단말기, PMP(Portable Multimedia Player)와 같은 멀티미디어 플레이어, PDA(Personal Digital Assistants) 등의 재생 장치에 구비될 수 있다. 또한, 상술한 복호화 장치는 하드웨어적으로 구현되어 재생 장치 등에 포함되거나, 상술한 바와 같이 소프트웨어적으로 재생 장치에 구현될 수도 있다.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.
상기한 바와 같은 본 발명에 따른 부호화/복호화 방법 및 장치에 의하면, 선형 예측 분석을 이용한 신호의 부호화 및 복호화에 있어 신호의 피치를 2 이상 검출하여 부호화 및 복호화에 이용함으로써, 적은 비트율을 가지고 오디오 신호, 음성 신호 등을 모두 효율적으로 부호화할 수 있다.

Claims (16)

  1. 입력되는 비트스트림으로부터 선형 예측 계수, 여기 신호 정보 및 복수의 피치(pitch)들에 대한 정보를 추출하는 단계;
    상기 복수의 피치들에 대한 정보를 이용하여, 상기 복수의 피치들에 대응되는 복수의 주기 신호들을 생성하는 단계;
    상기 생성된 복수의 주기 신호들 및 상기 여기 신호 정보를 이용하여 잔차 신호를 생성하는 단계; 및
    상기 추출된 선형 예측 계수 및 상기 생성된 잔차 신호를 이용하여 신호를 복원하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  2. 제1항에 있어서, 상기 복수의 주기 신호 생성 단계는
    상기 복수의 피치들에 대한 정보들을 이용해 코드북(codebook)을 검색하여 상기 복수의 주기 신호들을 구하는 것을 특징으로 하는 복호화 방법.
  3. 제1항에 있어서,
    상기 피치에 대한 정보는 상기 피치의 가중치를 포함하고,
    상기 잔차 신호 생성 단계는
    상기 생성된 복수의 주기 신호들 각각에 상기 가중치를 곱하는 단계; 및
    상기 가중치가 곱해진 복수의 주기 신호들을 합성하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  4. 제1항에 있어서, 상기 잔차 신호 생성 단계는
    상기 여기 신호 정보를 이용해 코드북을 검색하여 여기 신호를 구하는 단계; 및
    상기 구해진 여기 신호와 상기 복수의 주기 신호들을 합성하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  5. 제1항에 있어서,
    상기 비트스트림으로부터 상기 복수의 피치들의 개수에 대한 정보를 추출하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  6. 입력 신호에 대해 선형 예측 분석을 수행하여 선형 예측 계수를 구하는 단계;
    상기 입력 신호의 피치를 2 이상 검출하여, 복수의 피치 주기 및 게인을 결정하는 단계; 및
    싱기 구해진 선형 예측 계수 및 복수의 피치 주기 및 게인에 대한 정보를 포함하는 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  7. 제6항에 있어서,
    상기 검출된 복수의 피치들 각각에 대한 가중치를 결정하는 단계를 더 포함하는 것을 특징으로 하는 부호화 방법.
  8. 제6항에 있어서,
    검출하고자하는 피치의 개수를 결정하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  9. 제6항에 있어서, 상기 피치 검출 단계는
    상기 입력 신호의 제1 피치를 검출하는 단계;
    상기 입력 신호로부터 상기 검출된 제1 피치 성분을 제거하는 단계; 및
    상기 제1 피치 성분이 제거된 입력 신호로부터 제2 피치를 검출하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  10. 입력되는 비트스트림으로부터 선형 예측 계수, 여기 신호 정보 및 복수의 피치(pitch)에 대한 정보를 추출하는 비트언팩킹부;
    상기 추출된 복수의 피치들에 대한 정보를 이용하여 상기 복수의 피치들에 대응되는 복수의 주기 신호들을 생성하는 음원신호생성부;
    상기 추출된 여기 신호 정보에 대응되는 여기 신호를 생성하는 여기신호생성부;
    상기 생성된 복수의 주기 신호들과 여기 신호를 가산하여 잔차 신호를 생성 하는 가산부; 및
    상기 선형 예측 계수와 상기 생성된 잔차 신호를 이용하여 신호를 합성하는 합성부를 포함하는 것을 특징으로 하는 복호화 장치.
  11. 제10항에 있어서,
    피치 주기와 음원 신호를 대응시켜 저장하는 제1 코드북을 포함하고,
    상기 음원신호생성부는
    상기 복수의 피치들에 대한 정보를 이용해 상기 제1 코드북(codebook)을 검색하여 복수의 주기 신호들을 추출하고, 상기 추출된 복수의 주기 신호들에 게인 곱하여 출력하는 것을 특징으로 하는 복호화 장치.
  12. 제10항에 있어서,
    상기 여기 신호 정보는 상기 여기 신호의 게인을 포함하고, 상기 피치에 대한 정보는 상기 피치의 가중치를 포함하며,
    상기 가산부는
    상기 가중치가 곱해진 상기 복수의 주기 신호들과 상기 게인이 곱해진 여기 신호를 가산하는 것을 특징으로 하는 복호화 장치.
  13. 입력 신호에 대해 선형 예측 분석을 수행하여 선형 예측 계수를 구하는 선형예측분석부; 및
    상기 입력 신호의 피치를 2 이상 검출하여, 복수의 피치 주기 및 게인을 결정하는 피치검출부; 및
    싱기 구해진 선형 예측 계수 및 복수의 피치 주기 및 게인에 대한 정보를 포함하는 비트스트림을 생성하는 비트팩킹부를 포함하는 것을 특징으로 하는 부호화 장치.
  14. 제13항에 있어서, 상기 피치검출부는
    상기 입력 신호의 제1 피치를 검출하는 제1 피치검출부;
    상기 입력 신호로부터 상기 검출된 제1 피치 성분을 제거하고, 상기 제1 피치 성분이 제거된 입력 신호로부터 제2 피치를 검출하는 제2 피치검출부를 포함하는 것을 특징으로 하는 부호화 장치.
  15. 제1항 내지 제9항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  16. 제10항 내지 제14항 중 어느 한 항에 기재된 장치를 포함하는 것을 특징으로 하는 멀티 미디어 방송 장치.
KR1020070104674A 2006-10-17 2007-10-17 부호화/복호화 장치 및 방법 KR20080034818A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US82979406A 2006-10-17 2006-10-17
US60/829,794 2006-10-17
US86082406A 2006-11-24 2006-11-24
US60/860,824 2006-11-24

Publications (1)

Publication Number Publication Date
KR20080034818A true KR20080034818A (ko) 2008-04-22

Family

ID=39574067

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070104674A KR20080034818A (ko) 2006-10-17 2007-10-17 부호화/복호화 장치 및 방법
KR1020070104675A KR20080034819A (ko) 2006-10-17 2007-10-17 부호화/복호화 장치 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020070104675A KR20080034819A (ko) 2006-10-17 2007-10-17 부호화/복호화 장치 및 방법

Country Status (1)

Country Link
KR (2) KR20080034818A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102251833B1 (ko) 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
WO2024012040A1 (en) * 2022-07-15 2024-01-18 Huawei Technologies Co., Ltd. Method for speech generation and related device

Also Published As

Publication number Publication date
KR20080034819A (ko) 2008-04-22

Similar Documents

Publication Publication Date Title
JP6423460B2 (ja) フレームエラー隠匿装置
JP5373217B2 (ja) 可変レートスピーチ符号化
US11721349B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
JP4005359B2 (ja) 音声符号化及び音声復号化装置
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
US20090192789A1 (en) Method and apparatus for encoding/decoding audio signals
US9640190B2 (en) Decoding method, decoding apparatus, program, and recording medium therefor
JPH10240299A (ja) 音声符号化及び復号装置
KR20080034818A (ko) 부호화/복호화 장치 및 방법
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
KR20060067016A (ko) 음성 부호화 장치 및 방법
KR20080092823A (ko) 부호화/복호화 장치 및 방법
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4438654B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
Bakır Compressing English Speech Data with Hybrid Methods without Data Loss
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination