KR100255297B1 - 음성 데이터 부호화/복호화장치 및 그 방법 - Google Patents

음성 데이터 부호화/복호화장치 및 그 방법 Download PDF

Info

Publication number
KR100255297B1
KR100255297B1 KR1019960054317A KR19960054317A KR100255297B1 KR 100255297 B1 KR100255297 B1 KR 100255297B1 KR 1019960054317 A KR1019960054317 A KR 1019960054317A KR 19960054317 A KR19960054317 A KR 19960054317A KR 100255297 B1 KR100255297 B1 KR 100255297B1
Authority
KR
South Korea
Prior art keywords
pitch
unit
decoding
last
speech
Prior art date
Application number
KR1019960054317A
Other languages
English (en)
Other versions
KR19980035867A (ko
Inventor
배성근
고용철
Original Assignee
김영환
현대전자산업주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영환, 현대전자산업주식회사 filed Critical 김영환
Priority to KR1019960054317A priority Critical patent/KR100255297B1/ko
Publication of KR19980035867A publication Critical patent/KR19980035867A/ko
Application granted granted Critical
Publication of KR100255297B1 publication Critical patent/KR100255297B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본 발명은 디지털 통신 시스템의 음성신호 처리에 있어서, 피치단위에 의한 매트릭싱 방법과 국부 봉우리와 골에 의한 비균일 표본화 기술을 이용하여 음성 신호를 부호 및 복호화함으로써 두 번의 압축에 걸친 높은 데이터 압축율과 간단한 구조 및 빠른 데이터 처리시간을 제공할 수 있는 음성 데이터 부호화/복호화장치 및 그 방법에 관한 것으로, 입력되는 음성신호의 피치를 검출하여 1차원의 음성신호를 2차원 신호로 변환하는 피치단위 매트릭싱의 제1단계와, 상기 제1단계에서 구성된 2차원 신호 중 첫 번째 피치집합과 마지막 피치집합을 선별한 후 상기 첫 번째와 마지막 피치집합만을 남기고 나머지 두 집합 사이의 집합을 제거하는 매트릭싱 데시메이션의 제2단계와, 상기 제2단계에서 얻어진 첫 번째 피치집합과 마지막 피치집합에 대해 국부 봉우리와 골물 검출하고 이 검출된 봉우리와 골에 대한 양자화 레벨값과 간격값을 사용하여 데이터를 다시 한번 압축하는 비균일 표본화과정의 제4단계로 이루어진 데이터 부호화과정과; 상기 데이터 압축과정의 제4단계에서 압축된 데이터를 복원하기 위해 국부 봉우리와 골의 양자화 레벨값과 비균일 샘플링 간격값으로 첫 번째 피치집합과 마지막 피치집합을 재구성하는 매트릭싱 인터폴레이션의 제1단계와, 상기 제1단계에서 재구성된 첫 번째 피치집합과 마지막 피치집합을 2차원 행열의 나머지 피치집합을 재구성하는 매트릭싱 인터폴레이션의 제2단계와, 상기 제2단계에서 재구성된 2차원 행렬 신호를 1차원의 음성신호로 재생하여 원래의 신호를 복원하는 디매트릭싱의 제3단계로 이루어진 데이터 복호화과정으로 수행되어, 음성신호가 단시간에는 느린 변화를 하며 준주기적인 특성은 가진다는 것을 이용하여 불필요한 데이터를 줄일 수 있고, 2차원 피치행렬과 비균일 표본법을 사용하여 자연성 및 명료성이 우수함은 물론 계산량이 적고 간단한 구조를 갖는 특장점이 있다.

Description

음성 데이터 부호화/복호화장치 및 그 방법
제1도는 본 발명에 의한 첫 번째 음성 데이터 압축을 위한 부호화기의 블록 구성도.
제2도는 본 발명에 의한 두 번째 음성 데이터 압축을 위한 부호화기의 블록 구성도.
제3도는 본 발명에 의한 음성 데이터 신장을 위한 복호화기의 블록 구성도.
제4(a)도는 본 발명에 의한 음성 데이터의 부호화 순서흐름도.
제4(b)도는 본 발명에 의한 음성 데이터의 복호화 순서흐름도.
제5도는 본 발명의 첫 번째 압축을 위한 매트릭싱 과정을 설명하기 위한 도면.
제6도는 본 발명의 두 번째 압축을 위한 국부 봉우리와 골에 의한 비균일 표본화 과정을 설명하기 위한 도면.
* 도면의 주요부분에 대한 부호의 설명
11 : 피치 검출부 12 : 매트릭싱부
13 : 피치 변화 검출부 14 : 에너지 변화 검출부
15 : 매트릭싱 데시메이션부 16 : 대표 피치 집합 선별부
21, 22 : 피치집합 저장부 23 : 봉우리/골 검출부
24 : 양자화 레벨정보 저장부 25 : 샘플링 간격정보 저장부
26 : 데이터 압축 전송부 32 : 봉우리 집합부
33 : 골 집합부 34 : 매트릭싱 인터폴레이션부
35 : 매트릭싱 재구성부 36 : 디매트릭싱부
본 발명은 디지털 통신 시스템의 음성신호 처리에 있어서, 피치단위에 의한 매트릭싱 방법과 국부 봉우리와 골에 의한 비균일 표본화 기술을 이용하여 음성 신호를 부호 및 복호화함으로써 두 번의 압축에 걸친 높은 데이터 압축율과 간단한 구조 및 빠른 데이터 처리시간을 제공할 수 있는 음성 데이터 부호화/복호화장치 및 그 방법에 관한 것이다.
일반적으로 급속히 변화하는 산업사회에서 쏟아지는 많은 정보들은 영상이나 음성을 통해서 전달되게 되며, 특히 상기 음성을 사용한 정보 전달 방법은 통신수단이나 대화수단으로서 가장 오랫동안 사용되어 온 통신 방법이다.
최근, 통신방식이 아날로그에서 디지털화 되어가는 시점에서 음성신호를 디지털화하여 송수신하는 디지털 통신의 음성신호 처리에 있어서, 많은 음성 합성 기술 및 부호화, 복호화기술이 대두되고 있다.
이러한 음성 부호화/복호화 기술에 있어서, 음성을 부호화하고 저장하는 방법으로는 음성신호에 존재하는 반복적이고 불필요한 잉여성분을 제거한 후에 저장 및 부호화하는 파형 부호화법(waveform coding method)과 음성 생성과정(speech production model)에 근거한 각 원(source)을 필터로 간주하여 여기원(excitation source)의 여기필터와 성도성분(vocal tract)의 여파기 필터로서 부호화하는 신호원 부호화법(source coding method) 및 신호원 부호화법 중 상기 파형 부호화법과 합성한 혼성 부호화법(hybrid coding)이 있다.
상기 파형 부호화법은 시간영역에서 잉여성분만을 제거하여 부호화하므로 음질의 자연성(naturality) 및 명료성(intelligibility)이 매우 높으나, 전송에 요구되는 데이터가 많아서 메모리에 효율적이지 못하다는 단점을 가지고 있으며, 이런 부호화 방법으로는 PCM(pulse code modulation), DM(delta modulation), ADM(adaptive modulation), DPC(differential pulse code modulation)등이 있다.
그리고, 음성 생성과정에 근거하여 음성은 음원과 성도필터에 의해 생성되고 이를 모델링하여 인위적으로 부호화하는 신호원 부호화법은 시간영역에서 주파수영역으로 변환하여 여기성분(excitating)과 포만트성분(formant)을 분리하여 처리한다.
특히, 상기 포만트성분을 부호화하고 여기정보를 부호화하기 위해 다시 두가지 방법으로 나누어지는데, 먼저 포만트성분을 부호화하는 방법에는 LPC(linear prediction coding), LSP(linear spectrum pair), PARCOR 등이 있으며, 이런 방법은 특징 파라미터만을 전송함에 따라 메모리 사용이 효율적인 장점이 있다.
그러나, 음의 전이, 음의 시작/끝, 유/무성음의 반복시에는 특징 파라미터만으로는 모델링을 할 수 없기 때문에 음질의 열화가 발생하고, 특히 비음이나 마찰음을 모델링하는 데는 전극형모델(all-pole model)에서 극-영형모델(zero-pole model)이 요구되어 음의 자연성과 명료성이 떨어지는 결점이 있다.
또한, 상기 파형 부호화법의 장점인 고음질과 신호원 부호화법의 장점인 메모리 효율성을 취한 혼성 부호화법은 여기정보를 어떻게 부호화하는지에 따라 CELP(code excited linear prediction), VSELP(vector sum linear prediction)등이 사용되며, 분석에 따른 합성(synthesis by analysis)을 주로 사용한다.
상기 혼성 부호화법은 낮은 비트율로서 고음질을 보장받기 위해서는 반복적인 제산과정과 비교과정이 필요하게 되고, 이로 인하여 계산량이 방대해짐은 물론 구조가 복잡해지는 단점이 있다.
상기와 같은 단점을 해결하고자 최근에는 준주기적인 주기를 가지는 음성신호에 있어서 데이터량을 감소하기 위해 사용되는 피치 동기 인터폴레이션(Pitch Synchronous Interpolation ; 이하 ‘PSI’라고 약칭함)은 사용하고 있는데, 이러한 PSI법은 반복되는 음의 피치구간(pitch period)이나 여기정보를 피치주기에 동기시켜 반복되는 주기를 분석프래임내에 반복적으로 재구성하는 방식으로 규칙에 의한 합성에 따른 부호화나 음성 합성에 적용된다.
그러나, 상기 PSI법 역시 일부 파형으로 균일하게 합성함에 따라 강세변화에 대한 에너지 소상문제와 정확한 피치 검출이 어렵고, 특히 음의 변화가 심하고 피치가 변화하는 구간, 강세와 억양의 변화가 심한 음에서는 심각한 열화뿐 아니라 많은 계산시간이 필요하여 음성데이터의 부호화가 매우 어렵게 되는 문제점이 있었다.
따라서 본 발명은 상기와 같은 문제점들을 해결하기 위해 창안된 것으로서, 그 목적은 피치단위 매트릭싱을 이용한 매트릭싱과정과 국부 봉우리와 골을 이용한 비균일 표본화 과정을 통한 두 번의 압축과, 비균일 표본화의 역과정과 디매트릭싱에 의한 두 번의 신장으로 음성 데이터를 부호화 및 복호화함으로써 계산량이 적고 구조가 간단하며, 음의 자연성과 명료성이 우수하면서 실시간 처리에 적합한 음성 데이터 부호화/복호화장치 및 그 방법을 제공하는 데에 있다.
이러한 목적을 달성하기 위한 본 발명의 음성 데이터 부호화/복호화장치는, 음성신호의 부호화는 입력되는 음성신호를 피치단위로 분리하여 피치집합을 구성하고 이 구성된 피치집합 중 첫 번째 피치집합과 마지막 피치집합만을 남기고 나머지 집합들을 제거하는 첫 번째 압축과정을 수행한 후, 상기 두 피치집합의 국부 봉우리와 골을 이용한 비균일 표본화에 의해 두 번째 압축과정을 수행하도록 하고, 복호화는 상기 부호화시 수행된 비균일 표본화의 역과정에 의해 첫 번째 피치집합과 마지막 피치집합을 재구성하고, 디메트릭싱 과정을 통해 원래의 음성신호를 재생하는 두 번의 신장과정을 거쳐 음성 데이터의 복호가 이루어지도록 한다.
이하, 첨부된 도면을 참조하여 본 발명의 음성 데이터의 부호화/복호화장치 및 그 방법을 상세히 설명한다.
제1도는 본 발명에 의한 첫 번째 음성 데이터 압축을 위한 부호화기의 블록 구성도로 이에 도시된 바와 같이, 입력되는 음성신호의 피치를 검출하는 피치 검출부(11)와, 상기 피치 검출부(11)에서 검출된 피치를 단위별로 분리하여 피치집합을 구성하는 매트릭싱부(12)와, 상기 피치 검출부(11)에서 검출된 피치의 변화를 검출하는 피치 변화 검출부(13)와, 상기 피치 검출부(11)에서 검출된 피치의 에너지 변화를 검출하는 에너지 변화 검출부(14)와, 상기 피치 변화 검출부(13)에서 검출된 피치와 에너지 변화 검출부(14)에서 검출된 에너지의 변화에 따라 상기 매트릭싱부(12)에서 구성된 피치집합 중 첫 번째 피치집합과 마지막 피치집합을 남기고 나머지 집합들을 제거하는 매트릭싱 데시메이션부(15)와, 상기 매트릭싱 데시메이션부(15)에 의해 남은 첫 번째와 마지막 피치집합의 대표 피치 집합을 선별하는 대표 피치 집합 선별부(16)로 구성된다.
제2도는 본 발명에 의한 두 번째 음성 데이터 압축을 위한 부호화기의 블록 구성도로서 이에 도시된 바와 같이, 첫 번째 압축과정에서 얻어진 첫 번째 피치집합과 마지막 피치집합을 각각 저장하는 피치집합 저장부(21)(22)와, 상기 피치집합 저장부(21)(22)의 첫 번째와 마지막 피치집합에 대해 국부 봉우리와 골을 검출하는 봉우리/골 검출부(23)와, 상기 봉우리/골 검출부(23)에서 검출된 봉우리와 골에 대한 양자화 레벨정보를 저장하는 양자화 레벨정보 저장부(24)와 상기 봉우리/골 검출부(23)에서 검출된 봉우리와 골에 대한 샘플링 간격정보를 저장하는 샘플링 간격정보 저장부(25)와, 상기 양자화 레벨정보 저장부(24)의 양자화 레벨값과 상기 샘플링 간격정보 저장부(25)의 샘플링 간격값으로 데이터를 압축하여 전송하는 데이터 압축 전송부(26)로 구성된다.
제3도는 본 발명에 의한 음성 데이터 신장을 위한 복호화기의 블록 구성도로서 이에 도시된 바와 같이, 부호화기(31)로부터 전송되는 압축 음성 데이터의 국부 봉우리와 골집합을 저장하는 봉우리 집합부(32), 골 집합부(33)와, 상기 봉우리 집합부(32)의 봉우리와 골 집합부(33)의 골의 양자화 레벨값과 간격값으로 직선근사를 이용하여 첫 번째와 마지막 피치집합은 재구성하는 매트릭싱 인터폴레이션부(34)와, 상기 매트릭싱 인터폴레이션부(34)에서 재구성된 두 개의 피치 집합으로 2차원 행렬의 나머지 피치집합을 형성하는 매트릭싱 재구성부(35)와, 상기 매트릭싱 재구성부(35)에서 형성된 2차원 행렬을 1차원의 음성신호로 재구성하여 원래의 음성신호를 재생하는 디매트릭싱부(36)로 구성된다.
상기와 같이 구성되는 본 발명의 음성 데이터의 부호화 및 복호화 방법을 나머지 도면을 참조하여 상세히 설명하면 다음과 같다.
제4(a)도는 본 발명에 의한 음성 데이터의 부호화 순서흐름도로서, 제5도의 본 발명의 첫 번째 압축을 위한 매트릭싱 과정을 설명하기 위한 도면과 제6도의 본 발명의 두 번째 압축을 위한 국부 봉우리와 골에 의한 비균일 표본화 과정을 설명하기 위한 도면을 참고하여 상세히 설명하면 다음과 같다.
우선, 입력되는 음성신호가 유성음임을 판단하여(S1) 유성음인 경우라면 상기 입력되는 음성의 피치를 검출하고, 검출된 피치를 단위별로 분리하여 피치집합을 구성한다(S2).
이때, 피치 검출은 자기상관관계(autocorrelation method)를 사용하여 검출하게 되는데, 음성신호는 아날로그 입력에 대해서 디지털 변환을 하여 한 프래임을 256 샘플로 나누어 처리하고, 각 프래임별 처리는 피치단위로 매트릭싱을 작성하기 위하여 피치를 검출하게 된다.
음성신호에 있어서 피치(51)는 제5도 도시되어 있는 바와 같이 두드러진 봉우리(peak)와 봉우리 혹은 골과 골 사이의 기본 주파수(fundamental frequency)를 말하며, 피치 검출은 정확성이 높은 식-1의 자기상관관계를 사용하여 검출하게 된다.
[식-1]
여기서 s(. )는 입력 디지털 음성이고, k는 지연인자이다.
그리고, 상기 식-1에 의해 검출된 피치주기(51)로 피치집합을 구성하는 과정은 1차원의 음성신호를 프래임내의 피치주기와 피치갯수로 2차원 신호로 변환하는 매트릭싱(matrixing)과정으로서, 식-2에 의해 행렬이 구성된다.
즉, i축은 프래임내의 피치주기(52)이고, j축은 피치주기 개수(K)로 구성된 행렬 (Pij)은,
[식-2]
와 같으며, 여기서, P는 피치주기이고, K는 피치갯수이다.
이어서, 상기 매트릭싱 과정을 통해 구성된 행렬(Pij)의 차원 신호에서 제5도에 도시된 바와 같이 첫 번째 피치 열(Pij)(52)과 마지막 피치 열(Pik)(53)만을 선별하여(S3) 매트릭싱 데시메이션에 의해 상기 첫 번째 피치집합과 마지막 피치 집합만을 남기고 나머지 두 집합 사이의 집합들(54)은 제거한다(S4).
지금까지 매트릭싱 데시메이션에 의한 집합의 제거과정은 본 발명에 있어서 첫 번째 압축과정이다.
계속해서, 본 발명의 두 번째의 압축과정인 국부 봉우리와 골(local peak and valley)을 이용한 비균일 표본화(nonuniform sampling)과정을 수행하기 위해 상기 첫 번째 압축과정에서 얻어진 첫 번째 피치집합(52)과 마지막 피치집합(53)에 대해 국부 봉우리(LP(.))와 골(LV(.))을 검출한다(S5).
이러한 봉우리와 골을 사용한 비균일 표본화 과정은 음성신호가 기본 주파수와 포만트성분으로 이루어진다는 것을 이용한 것으로서, 특히 인지(perceptual)에 불필요한 주파수를 제거한다는 개념이다.
제6도에 도시된 바와 같이, 음성신호는 기본 주파수와 여러 고조파로 구성되어 있기 때문에 봉우리(66)와 골(67)을 검출할 경우 인지에 중요한 주파수만을 검출할 수 있게 된다.
마지막으로, 상기 단계(S5)에서 검출된 봉우리와 골에 대한 양자화 레벨값(504)과 간격값(505)이 전송되게 된다.
한편, 부호화기에서 압축되어 전송되는 음성신호의 복호화 과정은 제4(b)도의 본 발명에 의한 음성 데이터의 복호화 순서흐름도를 참고하여 설명하면 다음과 같다.
복호화 과정은 복호화기에 입력되는 음성신호가 유성음임을 판단하면서 시작된다(S6). 유성음이면, 비균일 표본화의 역과정으로서 부호화기측에서 전송된 국부 봉우리와 골의 진폭과 간격값으로 봉우리와 골 사이에 직선으로 근사(linear interpolation)(63)하여 제거된 샘플들(61)을 인터폴레이션한다(S7).
상기 매트릭싱 인터폴레이션 과정에 의해 첫 번째 피치집합(52)과 마지막 피치집합(53)을 재구성하게 된다.
즉, 상기 두 피치집합 각각의 샘플(sample to sample)에서 차(differential) 값을 구하고, 식-3에 의해 매트릭싱 데시메이션된 집합의 개수로 나누어 매트릭싱 인터폴레이션해야 할 지연 갯수(Litp)를 얻는다.
[식-3]
여기서, K는 프래임내의 갯수이고, Plj는 첫 번째 피치 집합열이고, Pij는 마지막 피치집합열이다.
이어서, 상기 재구성된 열집합(lk) 과 (Pij)으로 2차원 행렬(Pij)을 형성한(S8) 후, 디매트릭싱(S9)에 따라 2차원 신호에서 1차원 신호로 재구성하여 원신호를 재생한다.
이상 설명에서와 같이, 본 발명은 두 번의 압축 및 신장을 통해서 필요로 하는 데이터가 절감되고 음의 변화가 심한 곳에서도 적절히 적응할 수 있다.
또한, 음성신호가 단시간에는 느린 변화를 하며 준주기적인 특성을 가진다는 것을 이용하여 불필요한 데이터를 줄일 수 있고, 2차원 피치행렬과 비균일 표본화법을 사용하여 자연성 및 명료성이 우수함은 물론 계산량이 적고 간단한 구조를 갖는 특장점이 있다.

Claims (5)

  1. 디지털 통신 시스템에서의 음성 데이터의 부호화 및 복호화장치에 있어서, 입력되는 음성신호를 피치단위로 분리하여 매트릭싱을 통해 1차 데이터 압축을 수행하는 1차 음성 데이터 압축장치와, 이 1차 음성 데이터 압축장치에 의해 압축된 데이터를 국부 봉우리와 골을 이용한 비균일 표본화를 통해 2차 압축을 수행하는 2차 음성 데이터 압축장치로 구성된 부호화 장치와; 상기 부호화 장치에 의해 부호화된 음성 데이터를 상기 비균일 표본화의 역과정을 통해 1차 신장한 후 디매트릭싱에 의한 2차 신장을 통해 원래의 음성신호를 복원하는 복호화 장치로 구성됨을 특징으로 하는 음성 데이터 부호화/복호화장치.
  2. 제1항에 있어서, 상기 1차 음성 데이터 압축장치는, 입력되는 음성신호의 피치를 검출하는 피치 검출부(11)와, 상기 피치 검출부(11)에서 검출된 피치를 단위별로 분리하여 피치집합을 구성하는 매트릭싱부(12)와, 상기 피치 검출부(11)에서 검출된 피치의 변화를 검출하는 피치 변화 검출부(13)와, 상기 피치 검출부(11)에서 검출된 피치의 에너지 변화를 검출하는 에너지 변화 검출부(14)와, 상기 피치 변화 검출부(13)에서 검출된 피치와 에너지 변화 검출부(14)에서 검출된 에너지의 변화에 따라 상기 매트릭싱부(12)에서 구성된 피치집합 중 첫 번째 피치집합과 마지막 피치집합을 남기고 나머지 집합들은 제거하는 매트릭싱 데시메이션부(15)와, 상기 매트릭싱 데시메이션부(15)에 의해 남은 첫 번째와 마지막 피치집합의 대표 피치 집합을 선별하는 대표 피치 집합 선별부(16)로 구성됨을 특징으로 하는 음성 데이터의 부호화/복호화장치.
  3. 제1항에 있어서, 상기 2차 음성 데이터 압축장치는, 상기 첫 번째 압축과정에서 얻어진 첫 번째 피치집합과 마지막 피치집합을 각각 저장하는 피치집합 저장부(21)(22)와, 상기 피치집합 저장부(21)(22)의 첫 번째와 마지막 피치집합에 대해 국부 봉우리와 골을 검출하는 봉우리/골 검출부(23)와, 상기 봉우리/골 검출부(23)에서 검출된 봉우리와 골에 대한 양자화 레벨정보를 저장하는 양자화 레벨정보 저장부(24)와 상기 봉우리/골 검출부(23)에서 검출된 봉우리와 골에 대한 샘플링 간격정보를 저장하는 샘플링 간격정보 저장부(25)와, 상기 양자화 레벨정보 저장부(24)의 양자화 레벨값과 상기 샘플링 간격정보 저장부(25)의 샘플링 간격값으로 데이터를 압축하여 전송하는 데이터 압축 전송부(26)로 구성됨을 특징으로 하는 음성 데이터의 부호화/복호화장치.
  4. 제1항에 있어서, 상기 음성 데이터의 복호화 장치는, 부호화되어 전송되는 압축 음성 데이터의 국부 봉우리와 골집합을 각각 저장하는 봉우리 집합부(32), 골 집합부(33)와, 상기 봉우리 집합부(32)의 봉우리와 골 집합부(33)의 골의 양자화 레벨값과 간격값으로 직선근사를 이용하여 첫 번째와 마지막 피치집합을 재구성하는 매트릭싱 인터폴레이션부(34)와, 상기 매트릭싱 인터폴레이션부(34)에서 재구성된 두 개의 피치집합으로 2차원 행렬의 나머지 피치집합을 형성하는 매트릭싱 재구성부(35)와, 상기 매트릭싱 재구성부(35)에서 형성된 2차원 행렬을 1차원의 음성신호로 재생하여 원래의 음성신호를 복원하는 디매트릭싱부(36)로 구성됨을 특징으로 하는 음성 데이터의 부호화/복호화장치.
  5. 디지털 통신 시스템에서의 음성 데이터의 부호화 및 복호화 방법에 있어서, 입력되는 음성신호의 피치를 검출하여 1차원의 음성신호를 2차원 신호로 변환하는 피치단위 매트릭싱의 제1단계와, 상기 제1단계에서 구성된 2차원 신호 중 첫 번째 피치집합과 마지막 피치집합을 선별한 후 상기 첫 번째와 마지막 피치집합만을 남기고 나머지 두 집합 사이의 집합을 제거하는 매트릭싱 데시메이션의 제2단계와, 상기 제2단계에서 얻어진 첫 번째 피치집합과 마지막 피치집합에 대해 국부 봉우리와 골을 검출하고 이 검출된 봉우리와 골에 대한 양자화 레벨값과 간격값을 사용하여 데이터를 다시 한번 압축하는 비균일 표본화과정의 제4단계로 이루어진 음성 데이터 부호화과정과; 상기 데이터 압축과정의 제4단계에서 압축된 데이터를 복원하기 위해 국부 봉우리와 골의 양자화 레벨값과 비균일 샘플링 간격값으로 첫 번째 피치집합과 마지막 피치집합을 재구성하는 매트릭싱 인터폴레이션의 제1단계와, 상기 제1단계에서 재구성된 첫 번째 피치집합과 마지막 피치집합을 2차원 행열의 나머지 피치집합을 재구성하는 매트릭싱 인터폴레이션의 제2단계와, 상기 제2단계에서 재구성된 2차원 행렬 신호를 1차원의 음성신호로 재생하여 원래의 신호를 복원하는 디매트릭싱의 제3단계로 이루어진 음성 데이터 복호화과정으로 수행됨을 특징으로 하는 음성 데이터의 부호화/복호화방법.
KR1019960054317A 1996-11-15 1996-11-15 음성 데이터 부호화/복호화장치 및 그 방법 KR100255297B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960054317A KR100255297B1 (ko) 1996-11-15 1996-11-15 음성 데이터 부호화/복호화장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960054317A KR100255297B1 (ko) 1996-11-15 1996-11-15 음성 데이터 부호화/복호화장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR19980035867A KR19980035867A (ko) 1998-08-05
KR100255297B1 true KR100255297B1 (ko) 2000-05-01

Family

ID=19481989

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960054317A KR100255297B1 (ko) 1996-11-15 1996-11-15 음성 데이터 부호화/복호화장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100255297B1 (ko)

Also Published As

Publication number Publication date
KR19980035867A (ko) 1998-08-05

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
US10431233B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
JP4879748B2 (ja) 最適化された複合的符号化方法
CN101577605B (zh) 基于滤波器相似度的语音lpc隐藏和提取算法
USRE43099E1 (en) Speech coder methods and systems
JP2001222297A (ja) マルチバンドハーモニック変換コーダ
US6768978B2 (en) Speech coding/decoding method and apparatus
JP3144009B2 (ja) 音声符号復号化装置
JPH01221800A (ja) 音響波形のコード化方式
JP3297749B2 (ja) 符号化方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR100255297B1 (ko) 음성 데이터 부호화/복호화장치 및 그 방법
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JP2796408B2 (ja) 音声情報圧縮装置
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JPH0990989A (ja) 変換符号化方法および変換復号化方法
KR20120060033A (ko) 분할된 음성 프레임의 디코딩을 위한 음성 디코더 및 그 방법
KR100221186B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
KR100310930B1 (ko) 음성합성장치및그방법
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
Bae et al. On a new vocoder technique by the nonuniform sampling
KR100221185B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100624545B1 (ko) 티티에스 시스템의 음성압축 및 합성방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050120

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee