KR100437900B1 - 음성코덱의음성데이터복원방법 - Google Patents

음성코덱의음성데이터복원방법 Download PDF

Info

Publication number
KR100437900B1
KR100437900B1 KR1019960071319A KR19960071319A KR100437900B1 KR 100437900 B1 KR100437900 B1 KR 100437900B1 KR 1019960071319 A KR1019960071319 A KR 1019960071319A KR 19960071319 A KR19960071319 A KR 19960071319A KR 100437900 B1 KR100437900 B1 KR 100437900B1
Authority
KR
South Korea
Prior art keywords
samples
grid
data
restoring
voice
Prior art date
Application number
KR1019960071319A
Other languages
English (en)
Other versions
KR19980052339A (ko
Inventor
박태홍
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1019960071319A priority Critical patent/KR100437900B1/ko
Priority to EP97122701A priority patent/EP0851407A3/en
Publication of KR19980052339A publication Critical patent/KR19980052339A/ko
Application granted granted Critical
Publication of KR100437900B1 publication Critical patent/KR100437900B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/113Regular pulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Abstract

본 발명은 음성 코덱의 음성 데이터 복원 방법에 관한 것으로 특히, 양자화된 샘플링 데이터를 원래의 샘플 데이터로 복원 궤환함에 있어 샘플간의 빈공간에 인접한 샘플의 평균값을 갖는 샘플을 채우도록 하여 입력 샘플중 최적의 샘플을 선택할 수 있도록 창안한 것이다. 이러한 본 발명은 소정 갯수의 디지털화된 음성 데이타를 13개의 샘플 데이터로 압축하여 전송하는 음성 코덱에 있어서, 13개의 샘플에 대하여 인접한 샘플간의 평균 샘플값을 구하는 단계와, 상기에서 13개 샘플을 배치하는 단계와, 상기에서 12개의 평균 샘플을 13개 샘플이 배치된 빈공간에 배치하는 단계와, 상기에서 샘플이 배치된 나머지 공간에 가장 근접한 공간에 배치된 평균 샘플을 채우는 단계를 반복 수행한다.

Description

음성 코덱의 음성 데이터 복원 방법
본 발명은 음성 코덱에 관한 것으로 특히, 양자화된 샘플링 데이터를 원래의 샘플 데이터로 복원 궤환하도록 한 음성 코덱의 음성 데이터 복원 방법에 관한 것이다. 일반적인 음성 코덱은 도1 의 블럭도에 도시된 바와 같이, 40개의 음성 샘플(x(k))를 입력으로 최적의 음성 샘플 13개를 선택하는 그리드 선택부(110)와, 이 그리드 선택부(110)의 13개의 음성 샘플을 입력으로 룩업 테이블에 의해 양자화하는 양자화기(120)와, 이 양자화기(120)의 출력 데이타를 룩업 테이블에 의해 13개의 음성 샘플로 복호하는 역양자화기(130)와, 이 역양자화기(130)에서 복원된 13개의 음성 샘플을 입력으로 원래의 40개의 샘플로 복원하여 궤환시키는 그리드 복원부(140)로 구성된다.
이러한 일반적인 음성 코덱의 동작 과정을 설명하면 다음과 같다.
일반적으로 음성 코덱에는 PRE-LTP(;Regular Pulse Excited Long Predictive Coding) 알고리즘을 사용하는데, 이는 선형 예측 코딩(LPC) 해석 및 short term 해석 필터에 의하여 레벨이 작은 잔여 신호를 결정하며 레벨이 큰(long term) 신호의 예견에서 그리드(grid)간의 피치를 계산한 이득과 지연(lag)으로 제거하는 알고리즘이다.
먼저, 160개 샘플에서 서브 프레임 단위로 분할된 40개의 샘플을 그리드 선택부(110)에 입력시키면 추림(decimation)한 후 평균 제곱 오차 방식으로 13개의 샘플을 선택하여 양자화기(120)에 전송하게 된다.
이에 따라, APCM 양자화기(120)는 그리드 선택부(110)의 13개의 샘플을 룩업 테이블을 이용하여 양자화하고 그 양자화된 데이터를 디코더에 전송하게 된다.
이때, APCM 역양자화기(130)는 양자화기(120)의 근사화된 13개의 데이터를 룩업 테이블을 이용하여 13개의 샘플로 복호하게 된다.
따라서, 그리드 복원부(140)는 역양자화기(130)에서 복호된 13개의 샘플을 업-샘플링(Up-Sampling)하여 원래의 40개의 샘플을 복원하는데, 13개 샘플사이의 빈공간에 '0'을 채워 원래의 40개 샘플을 복원한다.
이에 따라, 그리드 복원부(140)에서 복원된 40개의 샘플을 신호 처리하여 그리드 선택부(110)에 궤환시킴에 의해 상기 그리드 선택부(110)가 평균 제곱 오차방식으로 다음에 입력되는 40개의 샘플중 13개의 최적 샘플을 선택하게 된다.
그러나, 종래의 기술은 그리그 복원부(140)에서 업-샘플링할 때 12개 샘플사이의 빈공간에 '0'을 채워 원래의 40개 샘플을 복원하여 그리드 선택부(110)로 궤환시킴으로써 많은 음성 데이터 정보가 손실되어 최적 특성의 음성 샘플을 추출하지 못하는 단점이 있다.
본 발명은 종래 기술의 단점을 개선하기 위하여 양자화된 샘플링 데이터를 원래의 샘플 데이터로 복원 궤환함에 있어 샘플간의 빈공간에 인접한 샘플의 평균값을 갖는 샘플을 채우도록 하여 입력 샘플중 최적의 샘플을 선택할 수 있도록 창안한 음성 코덱의 음성 데이터 복원 방법을 제공함에 목적이 있다.
도 1은 일반적인 음성 코덱의 블럭도.
도 2는 본 발명에서 그리드 복원부의 동작을 보인 예시도.
도 3은 본 발명에서 업-샘플링된 호보를 보인 예시도.
***도면의 주요 부분에 대한 부호의 설명***
110 : 그리드 선택부 120 : 양자화기
130 : 역양자화기 140 : 그리드 복원부
본 발명은 상기의 목적을 달성하기 위하여 디지털화된 음성 데이타를 소정 갯수의 샘플 데이터로 압축하여 전송하는 음성 코덱에 있어서, 소정 갯수의 샘플에 대하여 인접한 샘플간의 평균 샘플값을 구하는 단계와, 상기 소정 갯수의 샘플을 그리드 상에 일정 간격으로 배치하는 단계와, 상기에서 구한 평균 샘플값 각각을 소정 갯수의 샘플이 배치된 빈공간에 배치하는 단계와 상기에서 샘플이 배치된 나머지 공간에 가장 근접한 공간에 배치된 평균 샘플을 채우는 단계를 반복 수행한다.
이하, 본 발명을 도면에 의거 상세히 설명하면 다음과 같다.
본 발명을 위한 음성 코덱은 도1 의 블럭도와 동일하게 그리드 선택부(110),양자화기(120), 역양자화기(130), 그리드 복원부(140)으로 구성하며, 상기 그리드 복원부(140)는 역양자화기(130)의 13개 샘플을 추림함에 의해 인접 샘플간의 평균값을 구하고 그 평균 샘플들 13개 샘플간의 빈공간에 배치하여 40개의 샘플을 복원하도록 구성한다.
이와같이 구성한 본 발명의 실시예에 대한 동작 및 작용 효과를 설명하면 다음과 같다.
본 발명은 종래와 동일하게 160개 샘플을 40개씩 분할하여 각각의 40개 샘플을 그리드 선택부(110), 양자화기(120)을 통해 최적의 13개 샘플에 대한 근사화한 음성 데이터를 디코더에 전송하며, 상기 양자화기(120)의 음성 출력 데이터를 역양자화기(130)에서 13개 샘플로 복호하면 그리드 복원부(140)는 업-샘플링함에 의해 40개 샘플을 복원하여 상기 그리드 선택부(110)에 궤환시킴으로써 다음에 입력되는 40개 샘플중에서 13개의 최적 샘플을 선택하게 한다.
상기에서 최적의 후보를 선택할 때의 그리드 번호를 Mc 라 하면 각각의 그리드(Mc[0..2])에는 13개의 샘플이 존재하는데, 그리드 복원부(140)가 그 13개의 최적 샘플간의 평균값을 구하여 그 13개의 샘플간의 빈공간에 배치함에 의해 40개의 샘플을 복원하게 된다.
이러한 과정은 다음과 같은 4단계로 이루어진다.
첫째 단계에서 13개 샘플에 대하여 인접 샘플간의 평균값(f(k))을 아래와 같은 식으로 구한다.
예를 들어, 그리드 번호(Mc)가 '0'인 경우 '0'번째와 '3'번째 샘플에 대한 평균값(f(0))를 구하면 다음과 같다.
둘째 단계에서 각각의 그리드(Mc[0..3])를 이루는 각각의 13개의 샘플(x[0...12])을 아래의 식과 같이 각 그리드(Mc)의 해당 위치(e[0...39])에 삽입한다.
이에 따라, 도3 (a) 내지 (d)와 같이 각 그리드(Mc[0..3])에 13개의 샘플이 배치된다.
셋째 단계에서 각각의 그리드(Mc[0..3])에 배치된 13개의 샘플간의 빈 공간에 상기 첫째 단계에서 구한 평균값(f(k))을 배치한다.
그 때의 삽입 위치는 아래의 식으로 연산하며 각각의 샘플간의 빈공간에는 동일한 평균값이 2개 삽입된다.
예를 들어, 그리드 번호(Mc)가 '0'인 경우 샘플(x[0], x[3])간의 빈공간에는 평균값"f(0) = (x[0]+x[3])/2"이 두번 삽입된다. 즉, 샘플(x[0], x[3])사이에는 삽입 위치가 2개 있다.
이상과 같은 단계를 수행하면 각 그리드에는 13개의 샘플과 그 샘플로부터의 평균값이 채워진다.
허나, 각 그리드(Mc[0..3])마다 37개의 삽입 위치만이 채워진다.
따라서, 아래와 같은 식과 같이 네째 단계를 수행하여 남은 공간을 채우게 된다.
예를 들어, 도3 (a)에서 채워지지 않은 공간(e[37..39])는 평균값(f[11])로 채우게 된다.
여기서, f[0...11] 은 평균된 최적 샘플, e[0...39] 는 피치와 이득 파라미터를 고려하지 않은 합성된 나머지이다.
다시 말해서, 그리드 복원부(140)는 역양자화기(130)에서 각 그리드(Mc[0..3])의 13개 샘플을 입력으로 상기와 같은 단계를 수행하여 각각 40개샘플을 복원한 후 그리드 선택부(110)에 궤환시키게 된다.
상기에서 처리 속도는 기존과 동일한 13Kbps 이다.
상기와 같은 본 발명은 디코더에도 동일한 알고리즘을 구현하면 부호화된 음성 데이터에서 최적의 음성 신호를 복호할 수 있다.
상기에서 상세히 설명한 바와 같이 본 발명은 처리 속도를 증가함이 없이 최적의 샘플을 복원함으로써 디코더에서 최적의 음성 신호를 복호할 수 있는 효과가 있다.

Claims (2)

  1. 소정 갯수의 디지털화된 음성 데이타를 임의의 갯수의 샘플 데이터로 압축하여 전송하는 음성 코덱에 있어서, 임의의 갯수의 샘플에 대하며 인접 샘플간의 평균값을 구하는 제1 단계와, 상기에서 임의의 갯수의 샘플을 그리드상에 일정 간격으로 배치하는 제2 단계와, 상기에서 임의의 갯수의 샘플간의 빈공간에 상기 평균화된 샘플을 삽입하는 제3 단계와, 상기에서 샘플이 배치된 나머지 공간에 가장 근접한 평균 샘플을 삽입하는 제4 단계를 반복 수행함을 특징으로 하는 음성 코덱의 음성 데이터 복원 방법.
  2. 제1항에 있어서, 제3 단계는 아래와 같은 과정을 수행하는 것을 특징으로 하는 음성 코덱의 음성 데이터 복원 방법.
    여기서, Mc 는 그리드 번호, f[k]는 평균값, e[k]는 해당 그리드의 삽입 위치이다.
KR1019960071319A 1996-12-24 1996-12-24 음성코덱의음성데이터복원방법 KR100437900B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1019960071319A KR100437900B1 (ko) 1996-12-24 1996-12-24 음성코덱의음성데이터복원방법
EP97122701A EP0851407A3 (en) 1996-12-24 1997-12-22 Method for restoring speech data in speech codec

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960071319A KR100437900B1 (ko) 1996-12-24 1996-12-24 음성코덱의음성데이터복원방법

Publications (2)

Publication Number Publication Date
KR19980052339A KR19980052339A (ko) 1998-09-25
KR100437900B1 true KR100437900B1 (ko) 2004-09-04

Family

ID=19490655

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960071319A KR100437900B1 (ko) 1996-12-24 1996-12-24 음성코덱의음성데이터복원방법

Country Status (2)

Country Link
EP (1) EP0851407A3 (ko)
KR (1) KR100437900B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162233A (ja) * 1984-09-04 1986-03-31 Radio Res Lab デルタ変調復号器用雑音軽減方式
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
KR930022880A (ko) * 1992-04-11 1993-11-24 강진구 음성 데이타 보간회로
KR960033094A (ko) * 1995-02-15 1996-09-17 구자홍 영상정보의 가변비트레이트 코딩 방법 및 장치
KR970017170A (ko) * 1995-09-19 1997-04-30 스티븐 알. 바쏠로뮤 음성 코딩 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3851887T2 (de) * 1988-07-18 1995-04-20 Ibm Verfahren und Einrichtung zur Sprachkodierung mit niedriger Bitrate.

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162233A (ja) * 1984-09-04 1986-03-31 Radio Res Lab デルタ変調復号器用雑音軽減方式
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
KR930022880A (ko) * 1992-04-11 1993-11-24 강진구 음성 데이타 보간회로
KR960033094A (ko) * 1995-02-15 1996-09-17 구자홍 영상정보의 가변비트레이트 코딩 방법 및 장치
KR970017170A (ko) * 1995-09-19 1997-04-30 스티븐 알. 바쏠로뮤 음성 코딩 방법

Also Published As

Publication number Publication date
EP0851407A3 (en) 2006-02-01
EP0851407A2 (en) 1998-07-01
KR19980052339A (ko) 1998-09-25

Similar Documents

Publication Publication Date Title
EP1575032B1 (en) Lossless audio coding/decoding method and apparatus
Berger et al. Lossy source coding
JP2904472B2 (ja) ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置
EP1569203A2 (en) Lossless audio decoding/encoding method and apparatus
IL178670A0 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
CA2229245A1 (en) Data compression for animated three dimensional objects
EP0450937A2 (en) Geometric vector quantization
US8724915B2 (en) Image encoding and decoding method and apparatus using texture synthesis
US8463615B2 (en) Low-delay audio coder
JP2001507175A (ja) ウェーブレット状及び逆ウェーブレット状にデジタルデータを変換するためのシステム及び方法
EP2183851A1 (fr) Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites
WO2000019411A1 (en) System and method for processing data from and for multiple channels
EP0570171A1 (en) Digital coding of speech signals
US5673364A (en) System and method for compression and decompression of audio signals
KR100292803B1 (ko) 3차원 메쉬모델의 정점위치 압축방법 및 장치
US6611797B1 (en) Speech coding/decoding method and apparatus
KR100437900B1 (ko) 음성코덱의음성데이터복원방법
EP2005756A2 (fr) Quantification vectorielle contrainte
EP2023339A1 (en) A low-delay audio coder
US5822721A (en) Method and apparatus for fractal-excited linear predictive coding of digital signals
RU2227324C2 (ru) Устройство и способ кодирования и декодирования ключевых данных для графической анимации
US6665646B1 (en) Predictive balanced multiple description coder for data compression
Matschkal et al. Spherical logarithmic quantization
Takikawa Fast progressive reconstruction of a transformed image (Corresp.)
JP2020523148A5 (ko)

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
N231 Notification of change of applicant
FPAY Annual fee payment

Payment date: 20080319

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee