KR100255533B1 - 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템 - Google Patents

적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템 Download PDF

Info

Publication number
KR100255533B1
KR100255533B1 KR1019970031757A KR19970031757A KR100255533B1 KR 100255533 B1 KR100255533 B1 KR 100255533B1 KR 1019970031757 A KR1019970031757 A KR 1019970031757A KR 19970031757 A KR19970031757 A KR 19970031757A KR 100255533 B1 KR100255533 B1 KR 100255533B1
Authority
KR
South Korea
Prior art keywords
signal
value
code
frequency
quantization
Prior art date
Application number
KR1019970031757A
Other languages
English (en)
Other versions
KR980013436A (ko
Inventor
유이치로 다카미자와
마사히로 이와다레
Original Assignee
가네꼬 히사시
닛본 덴기 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=15922864&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100255533(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 가네꼬 히사시, 닛본 덴기 가부시키가이샤 filed Critical 가네꼬 히사시
Publication of KR980013436A publication Critical patent/KR980013436A/ko
Application granted granted Critical
Publication of KR100255533B1 publication Critical patent/KR100255533B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

적응 변환 코딩 시스템 및/또는 적응 변환 디코딩 시스템에서, 절대값이 큰 소수의 양자화값이 존재하는 경우의 코딩 효율이 향상된다. 적응 변환 코딩 시스템은 개별적으로 절대값이 큰 소수의 양자화값을 코드하고, 다른 양자화값은 코드된다. 특히, 적응 변환 코딩 시스템은 다른 양자화값으로부터 절대값이 큰 소수의 양자화값을 판별하는 셀렉터부(6), 절대값이 큰 소수의 양자화값을 코딩하는 펄스 코딩부(8) 및 양자화값을 디코딩하는 펄스 디코딩부(16), 절대값이 큰 양자화값과 다른 양자화값을 코딩하는 코딩부(7) 및 양자화값을 디코딩하는 디코딩부(15), 및 절대값이 큰 소수의 양자화값 및 다른 양자화값을 종합하는 종합부(18)을 포함한다.

Description

적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템
본 발명은 일반적인 적응 변환 코딩 및/엔코딩 시스템에 관한 것이다. 특히, 본 발명은 고품질을 소유하는 보이스 신호 및 오디오 신호를 효율적으로 코딩 및 디코딩하는 시스템에 관한 것이다.
종래에, 고품질을 소유하는 보이스 신호 및 오디오 신호를 효율적으로 코딩 및 디코딩하는 적응 변환 코딩 시스템 및 적응 변환 디코딩 시스템에는 MPEG(Motion Picture Expert Group)/오디오층(3)등이 있다. MPEG/오디오층(3)은 1993 ISO/IEC 11172-3의 “Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5 Mb/s”(이후, 간단히 참조 1이라 칭함)에 토론되어 있다.
제3도는 종래의 적응 변환 코딩 시스템의 한 예를 도시하는 블록도이다. 종래의 적응 변환 코딩 시스템은 입력 단자(1), 신호변환부(2), 분석부(3), 양자화 파라메터 결정부(4), 양자화부(5), 코딩부(7), 파라메터 코딩부(9), 가산부(22), 다중화부(23) 및 출력 단자(12)로 구성된다.
입력단자(1)에서, 디지털화된 오디오 신호 샘플이 입력된다. 입력 오디오 신호 샘플은 신호 변환부(2) 및 분석부(3)로 출력된다.
신호 변환부(2)에서, 오디오 신호 샘플 수에서 N의 입력 경우마다, 주파수 영역 신호의 수에서 N은 하이브리드 분석 필터 뱅크에 의한 입력 오디오 신호로 형성된다. 상승 연속 순서로 그룹화된 주파수 밴드 신호의 수에서 N은 “프레임으로서 칭해진다. 얻어진 주파수 영역 신호는 양자화부(5) 및 분석부(3)으로 출력되고, N은 정수이며, MPEG/오디오층(3)의 경우에, N은 576이다. 하이브리드 분석 필터 뱅크는 상기 참조 1에서 상세히 토론되어 있다.
분석부(3)에서, 프레임에서 각 주파수 영역 신호용으로 허용가능한 양자화 에러는 얻어져, 양자화 파라메터 결정부(4)로 출력된다. 오디오 신호의 코딩에서, 음향질은 중요해진다. 그러므로, 허용가능한 양자화 에러는 인간 음향 센스에 의해 쉽게 인지할 수 있는 주파수 영역에서 신호의 열화로 결정된다. 허용가능한 양자화 에러를 결정하는 방법은 참조 1에 상세히 토론되어 있다. 예를 들면, 입력 오디오 신호 샘플의 푸리에 변환을 통해 얻어진 주파수 스펙트럼을 분석하는 방법이 있다.
양자화부(5)에서, 주파수 영역 신호 X는 양자화 파라메터 결정부(4)에 의해 얻어진 양자화 스텝 사이즈 QS에 기초하여 양자화된다. 그 다음, 양자화값 Y는 양자화된 주파수 영역 신호의 (3/4)파워값을 라운드함으로써 얻어진다. 일반적으로, 양자화값 Y는 다음과 같이 표현된다.
Y=nint(pow(X/QS, 3/4))
여기에서, nint()는 소수점 후 분수를 완성하는 라운딩 프로세스를 표시하고, a를 표시하는 pow(a,b)는 b에 의해 파워된다. 프레임에서 각 주파수 영역 신호의 양자화에 의해 얻어진 양자화값은 프레임당 코딩부(7)에 공급되도록 주파수의 상승 연속 순서로 분류된다. 한편, 양자화부(5)는 양자화 파라메터 결정부(4)로 출력하도록 양자화 에러 YZ를 계산한다. 양자화값 Y의 역 양자화값 YY는 다음과 같이 표현된다.
YY=pow(Y, 4/3)
그러므로, 양자화 에러 YZ는 다음과 같이 표현된다.
YZ=X-pow(Y, 4/3)
코딩부(7)에서, 후술하는 바와 같이 프레임의 각 양자화값은 엔코드되어, 코드 C1 및 코드 C1의 코드량 L1을 얻는다. 코드 C1은 다중화부(23)으로 출력되고, 코드량 L1은 가산부(22)로 출력된다.
파라메터 코딩부에서 양자화 스텝 사이즈 QS는 양자화 파라메터 결정부(54)로 입력하여, 코드 C1 및 코드 C2의 코드량 1,2를 얻는다. 코드 C2는 다중화부(23)으로 입력되고, 코드량 L1은 가산부(22)로 입력된다.
가산부(22)에서, 코딩부(7) 및 파라메터 코딩부(9)로부터 출력된 총 코드량, 일반적으로 L1 및 L2의 합은 얻어지고, 총 코드량으로서 양자화 파라메터 결정부(4)로 출력된다.
가산기(22)로부터 출력된 총 코드량은 양자화 스텝 사이즈 QS에 따라 변경될 수 있다. 일반적으로, 양자화 스텝 사이즈 QS가 작아질 때 총 코딩량은 커지고, 양자화 스텝 사이즈 WS가 커질 때 총 코딩량은 작게 된다. 양자화 파라메터 결정부(4)에서, 양자화 스텝 사이즈 Q는 총 코딩량이 코딩 비트율에 기초하여 결정된 허용가능한 코딩량 이하로 동일하도록 유지되고, 양자화 에러가 허용가능한 양자화 에러의 에러에 비례되도록 제어된다. 제어 예에서, 먼저 양자화 스텝 사이즈 QS는 충분히 작은값으로 설정되고, 코딩부(7) 및 파라메터 코딩부(9)는 총 코딩량을 얻도록 동작된다. 그 다음, 양자화 스텝 사이즈 QS는 허용가능한 양자화 에러에 비례하여 더 큰 값으로 설정된다. 또, 코딩부 및 파라메터 코딩부(9)는 동작되어, t는 총 코딩량을 얻도록 반복된다.
다중화부(23)에서, 코드 C1 및 C2는 다중화되어 비트 스트림을 형성한다. 코딩부(7)에서, 프레임의 각 양자화값은 주파수의 축에서 3영역, 즉 타입 1영역, 타입 2 영역 및 타입 3영역으로 분리된다. 각 양자값은 타입 1영역 및 타입2 영역 내에서 떨어지고, 영역 당 하프만 코딩에 의해 코드된다.
먼저, 프레임의 양자화값을 영역으로 분배하는 방법이 토론된다. 주파수의 상승 연속 순서의 양자화값의 수에서 N이 다음과 같이 한정되도록 분류된다.
Vector X=[x(1), x(2), ..., x(N)]
벡터 X의 각 요소 x(1), x(2), ..., x(N)은 각각 양자화값을 표시한다. 타입21영역은 저주파수 영역 내의 양자화값을 포함하는 영역이고, 요소 수에서 (2 x big_values)의 x(1), x(2), ..., x(2 x big_values)을 포함한다. 타입 2영역은 절대값이 0 또는 1인 양자화값으로 구성된 영역이고, 요소 수에서 (4xcount1)의 x(2 x bog_values + 1), x(2 x big_values + 2), ..., x(2 x bit_values + 4 x count1)이 포함된다. 타입 3영역은 제로인 양자화값으로 구성된 영역으로, 요소수에서 (2 x count1)의 x(2 x big_values + 4 x count1 +1), x(2 x big_values + 4 x count1 + 2), ..., x(N)을 포함한다. 여기에서,
2x big_values + 4x count1 + 2x rzero=N
값 제로는 다음과 같이 확립하여 먼저 최대값 t2를 얻음으로써 얻어지고, x(t)≠0, (t=1, 2, ..., N) 및 그 다음, rzero = (N-t(t-mod2))/2 에 의해 얻어지며, (x1 mod x2)는 x1을 x2로의 나눔에서 나머지를 얻기 위한 계산을 표시한다.
값 count1은 다음과 같이 확립하여 최대값 t2를 얻음으로써 얻어지고, ┃x(t2)┃>1 및 그 다음 count1 = (N - Rzerox2 - t2 -((N-rzero x2 -t2) mod4)/4 에 의해 얻어진다. 값 big_values는 다음과 같이 얻어진다.
big_values = (N-rzero x 2 -count1 x4)/2 타입 1 및 타입 2 영역에 포함된 각 요소는 다수의 예비적으로 준비된 하프만 테이블 중 선택된 테이블을 사용하여 하프만 코드된다. 하프만 테이블은 하프만 코드의 코드값이 최소가 되도록 선택된다.
타입 1영역에서 각각의 요소를 코드하기 위해 준비된 다수의 하프만 테이블은 각 요소값의 가정된 출현 주파수 및 양자화값의 값 영역을 구별하여 코드된다. 타입 1 영역에서 각 요소의 코딩시 선택된 하프만 테이블에 의해 코드되는 양자화 값의 값 영역은 타입 1영역에 포함된 각 요소의 최대 절대값에 따라 커진다. 동시에, 하프만 테이블에서 각 코드는 일반적으로 더 길어진다. 한편, 절대값이 0 또는 1인 요소만을 타입 2 영역이 포함하기 때문에, 타입 2 영역에서 코딩시 한 요소 당평균 코딩량은 타입 1 영역의 것보다 더 작아진다.
값 big_values, rzero, 타입 1 영역 및 타입 2영역에 사용되는 하프만 테이블에 관계하는 정보는 코딩 보조 정보로서 코드된다. 하프만 코드 및 코딩 보조 정보는 코드 C1로서 다중화 되고 출력된다.
제4도는 적응 변환 디코딩 시스템의 한 예를 도시하는 블록도이다. 종래의 적응 변환 디코딩 시스템은 입력 단자(13), 분리부(24), 디코딩부(15), 파라메터 디코딩부, 역 양자화부(19), 신호 역 변환부(20) 및 출력 단자(21)을 포함한다.
입력단자(13)에서, 비트 스트림이 입력된다. 그 다음, 비트 스트림은 분리부(24)로 출력된다.
분리부(24)에서, 비트 스트림은 코드 C1 및 코드 C2로 분리된다. 코드 C1은 디코딩부(15)로 출력되고, 코드 C2는 파라메터 디코딩부(17)로 출력된다. 파라메터 디코딩부(17)에서, 양자화 스텝 사이즈는 코드 C2를 디코딩함으로써 얻어진다. 얻어진 양자화 스텝 사이즈는 역 양자화부(19)로 출력된다.
디코딩부(15)에서, 먼저 코드 C1은 하프만 코드 및 코딩 보조 정보로 분리된다. 다음에, 타입 1 영역 및 타입 2 영역의 양자화값은 코드 보조 정보에 의해 표시된 하프만 테이블을 사용하여 영역 당 하프만 코드를 디코딩함으로써 얻어진다. 따라서 얻어진 양자화값은 역 양자화부(19)로 공급된다.
역 양자화부(19)에서, 역 양자화값은 양자화값의 역 양자화에 의해 얻어진다. 역 양자화값 YY는 다음 공식을 통해 양자화값 Y로 얻어진다.
YY = pow(Y, 4/3)
따라서 얻어진 역 양자화값은 신호 역 변환부(20)으로 출력된다.
신호 역 변환부는 시간 영역 신호를 하이브리드 종합 필터 뱅크를 통해 역양자화값으로 얻는다. 하이브리드 종합 필터 뱅크는 상기 참조 1에서 상세히 토론되어 있다.
그 다음, 시간 영역 신호는 출력 단자(21)로 출력된다.
상기 적응 변환 코딩 디코딩 시스템에서 나타난 제1문제점은 타입 1 영역과 타입 2영역 사이의 경계 근처의 요소 코딩에서의 저코딩 효율이다. 이들 요소는 타입 2 영역용 하프만 코드 테이블을 사용함으로써 코드될 수 있다. 그러나, 타입 2 영역의 경계 근처에서 표시하는 절대값이 2 이상인 소수 요소의 존재 때문에, 절대값이 0 또는 1인 요소는 타입 1 영역에서의 요소로서 코드될 수 있는 타입 1 영역의 주파수 영역 내로 떨어진다. 타입 1 영역에서 한 요소 당 평균 코딩량이 타입 2영역에서의 것보다 더 커지기 때문에, 절대값이 2 이상인 소수의 요소가 타입 2영역의 경계 근처에서 타입 1 영역에 포함된다.
제2문제점은 타입 1 영역이 절대값이 큰 소수 요소를 포함할 때, 코딩 효율이 저하되는 것이다.
타입 1 영역에 포함된 요소의 코딩시 선택되는 하프만 테이블의 크기는 타입 1 영역에 포함된 요소의 최대 절대값에 따라 커진다. 동시에, 하프만 테이블의 각 코드 길이는 더 길어진다. 타입 1 영역이 절대값이 큰 소수 요소를 포함할 때, 요소당 평균 코딩량은 커, 코딩 효율이 저하된다.
본 발명의 목적은 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/엔코딩 시스템을 제공하는 것으로, 절대값이 큰 요소를 위한 특정 프로세스를 행함으로써 코딩 효율을 향상시킨다.
본 발명의 제1특징에 따라, 적응 변환 코딩 시스템은 입력 신호를 주파수 영역 신호로 변환하는 신호 변환부와, 허용가능한 양자화 에러를 얻기 위해 입력 신호 및 주파수 영역 신호를 분석하는 분석부와, 양자화값 및 양자화 에러를 얻기 위해 양자화 스텝 사이즈에 기초하여 주파수 영역 신호의 진폭값을 양자화하는 양자화부와, 허용가능한 양자화 에러 및 양자화 에러 및 총 코드량을 참조하여 양자화 스텝 사이즈를 결정하는 양자화 파라메터 결정부와, 제1신호 및 제2신호를 얻기 위해 주파수 영역 신호의 양자화값을 분석하는 셀렉터부와, 제1코드 및 제1코드량을 얻기 위해 제2신호에 관계하여 제1신호의 양자화값을 코드하는 제1코딩부와, 제2코드 및 제2코드량을 얻기 위해 제2신호의 양자화값을 코드하는 제2코딩부와, 제3코드 및 제3코드량을 얻기 위해 양자화 스텝 사이즈를 코드하는 파라메터 코딩부와, 제1코드량, 제2코드량 및 제3코드량의 총 코드량을 얻는 가산부 및 비트 스트림을 형성하기 위해 제1코드, 제2코드 및 제3코드를 다중화하는 다중화부를 포함한다. 상기 구성에서, 절대값이 큰 소수의 양자화값 및 다른 양자화값은 다른 방법으로 코드된다. 그러므로, 절대값이 큰 양자화값과 다른 양자화값을 코드하는 코딩부에서, 하프만 코드 테이블은 종래 기술에서보다 더 작아, 한 양자화값당 평균 코딩량을 감소시켜, 코딩 효율의 향상이 달성될 수 있다.
제2부는 주파수 영역 신호의 양자화값을 제1신호 및 제2신호로 분할하여, 제4신호를 형성하고, 제1신호의 양자화값의 절대값은 작은 양자화값으로 교체되고, 제2신호는 제3신호 및 제4신호를 결합함으로써 형성될 수 있다. 또, 셀렉터부는 총 코드량이 최소가 되는 제1신호 및 제2신호를 얻을 수 있다. 제1코딩부는 제1신호의 양자화값의 절대값, 제1신호의 양자화값의 극성 및 제1신호의 주파수를 코딩함으로써 제1코드를 형성할 수 있다. 이 경우에, 제1코딩부는 제1신호의 양자화값의 스레숄드값을 얻어, 제1신호의 양자화값의 절대값 대신에 제1신호의 양자화값에 스레숄드 값을 감산함으로써 얻어진 값을 코드한다. 제1신호의 각 샘플에서, 스레숄드값은 제1신호의 샘플과 동일 주파수에서 제2신호의 샘플의 양자화값의 절대값에 1을 가산함으로써 얻어진 값일 수 있다. 또, 제2코딩부에서 코드되는 양자화값의 영역은 한정될 수 있고, 제1신호의 각 샘플에서, 스레숄드값은 제2코딩부에 의한 샘플과 동일 주파수를 갖는 신호를 코딩할 때 제2코딩부의 입력 영역의 최대 절대값에 1을 가산함으로써 얻어진 값일 수 있다.
택일적으로, 제1코딩부는 주파수의 연속 상승 순서로 제1신호의 각 샘플의 주파수를 코드할 수 있고, 주파수가 가장 낮은 샘플과 다른 샘플용으로, 샘플의 주파수 및 한 선행 순서의 샘플의 주파수의 차는 코드된다. 주파수 신호는 다수의 영역으로 분할되고, 제1코딩부에서, 주파수가 가장 낮은 샘플의 주파수 대신에, 경계 수는 주파수가 가장 낮은 샘플 주파수보다 낮아지고, 주파수가 가장 낮은 샘플의 주파수의 차 및 영역 경계 주파수의 최대값은 주파수가 가장 낮은 샘플의 주파수보다 낮아진다.
본 발명의 제2특징에 따라, 적응 변환 디코딩 시스템은 입력 신호를 제1코드, 제2코드 및 제3코드로 분리하는 분리부와, 제1신호를 얻기 위해 제2코드를 참조하여 제1코드를 디코드하는 제1디코딩부와, 제2신호를 얻기 위해 제2코드를 디코드하는 제2디코딩부와, 양자화 스텝 사이즈를 얻기 위해 제3신호를 디코드하는 파라메터 디코딩부와, 종합된 신호를 얻기 위해 제1신호 및 제2신호를 종합하는 종합부(synthesizing portion)와, 역 양자화 신호를 얻기 위해 종합된 신호의 양자화값을 역 양자화하는 역 양자화부, 및 시간 영역 신호를 얻기 위해 역 양자화 신호를 시간 영역으로 변환하는 신호 역 변환부를 포함한다. 제1디코딩부는 각각 양자화값의 주파수, 양자화값의 절대값 및 제1신호의 양자화값의 극성을 설정하기 위해 제1코드를 디코드함으로써 양자화값의 주파수, 양자화값의 절대값 및 양자화값의 극성을 얻을 수 있다. 제1디코딩부는 스레숄드값을 얻을 수 있고, 제1코드를 디코딩함으로써 얻어진 양자화값의 절대값 대신에, 제1신호의 양자화값의 절대값으로서 제1코드를 디코딩함으로써 얻어진 양자화값의 절대값에 스레숄드값을 가산함으로써 얻어진 값을 취한다. 제1신호의 각 샘플에서, 스레숄드값은 샘플과 동일 주파수인 제2신호의 샘플의 양자화값의 절대값일 수 있다. 제2코딩부는 역 양자화값에 한정될 수 있고, 제1신호의 각 샘플에서, 스레숄드값은 제2디코딩부가 샘플과 동일 주파수를 갖는 신호를 디코드할 때 제한의 최대 절대값에 1을 가산함으로써 얻어질 값일 수 있다.
제1디코딩부는 주파수 및 디코딩함으로써 가장 낮은 주파수의 샘플의 주파수의 차가 얻어지고, 주파수의 차를 주파수가 가장 낮은 샘플의 주파수에 가산함으로써 가장 낮은 주파수를 갖는 샘플과 다른 샘플의 주파수를 얻을 수 있다. 이 경우에, 주파수 신호는 다수의 영역으로 분할될 수 있고, 제1디코딩부에서, 영역 경계의 수 및 주파수의 차는 디코딩함으로써 얻어질 수 있고, 주파수의 차를 영역 경계의 수에 의해 표시된 영역 경계의 주파수에 가산함으로써 얻어진 값은 주파수가 가장 낮은 샘플의 주파수로서 취해진다.
종합부는 종합 신호로서 교체된 신호를 취하기 위해 제1신호의 샘플의 주파수와 동일 주파수를 갖는 샘플의 양자화값을 제1신호의 양자화값으로 교체하는 신호를 형성할 수 있다.
본 발명의 제3특징에 따라, 적응 변환 코딩 및 디코딩 시스템은 입력 신호를 주파수 영역 신호로 변환하는 신호 변환부와, 허용가능한 양자화 에러를 얻기 위해 입력 신호 및 주파수 영역 신호를 분석하는 분석부와, 양자화값 및 양자화 에러를 얻기 위해 양자화 스텝 사이즈에 기초하여 주파수 영역 신호의 진폭값을 양자화하는 양자화부와, 허용가능한 양자화 에러 및 양자화 에러 및 총 코드량을 참조하여 양자화 스텝 사이즈를 결정하는 양자화 파라메터 결정부와, 제1신호 및 제2신호를 얻기 위해 주파수 영역 신호의 양자화값을 분석하는 셀렉터부와, 제1코드 및 제1코드량을 얻기 위해 제2신호에 관계하여 제1신호의 양자화값을 코드하는 제1코딩부와, 제2코드 및 제2코드량을 얻기 위해 제2신호의 양자화값을 코드하는 제2코딩부와, 제3코드 및 제3코드량을 얻기 위해 양자화 스텝 사이즈를 코드하는 파라메터 코딩부와, 제1코드량, 제2코드량 및 제3코드량의 총 코드량을 얻기 위한 가산부와, 비트 스트림을 형성하기 위해, 제1코드, 제2코드 및 제3코드를 다중화하는 다중화부와, 입력신호를 제1코드, 제2코드 및 제3코드로 분리하는 분리부와, 제1신호를 얻기 위해 제2코드에 관해 제1코드를 디코드하는 제1디코딩부와, 제2신호를 얻기 위해 제2코드를 디코드하는 제2디코드부와, 양자화 스텝 사이즈를 얻기 위해 제3신호를 디코드하는 파라메터 디코딩부와, 종합 신호를 억기 위해 제1신호 및 제2신호를 종합하는 종합부와, 역 양자화 신호를 얻기 위해 종합된 신호의 양자화값을 역 양자화하는 역 양자화부, 및 시간 영역 신호를 얻기 위해 역 양자화 신호를 시간 영역으로 변환하는 신호역 변환부를 포함한다.
본 발명의 상기 및 다른 목적, 특징 및 장점은 첨부하는 도면을 참조하여 명백해질 수 있다.
제1도는 본 발명에 따른 코딩 시스템의 양호한 실시예를 도시하는 블록도.
제2도는 본 발명에 따른 디코딩 시스템의 양호한 실시예를 도시하는 블록도.
제3도는 종래의 코딩 시스템을 도시하는 블록도.
제4도는 종래의 디코딩 시스템을 도시하는 블록도.
제5도는 본 발명에서 요소 수를 제로로 교체하도록 유도하는 흐름도.
제6도는 절대값을 제로와 같은 작은 값으로 교체하는 요소 수를 유도하는 흐름도.
제7도는 코딩 실험에서 사용된 사운드 소스의 파형을 도시하는 도면.
제8도는 본 발명의 효과를 감소시키는 코드량을 도시하는 도면.
제9도는 본 발명의 효과를 감소시키는 코드량을 도시하는 도면.
* 도면의 주요부분에 대한 부호의 설명
1 : 입력 단자 2 : 신호 변환부
3 : 분석부 4 : 양자화 파라메터 결정부
5 : 양자화부 6 : 셀렉터부
7 : 코딩부 8 : 펄스 코딩부
9 : 파라메터 코딩부 10 : 가산부
11 : 다중화부 12 : 출력 단자
이하, 적의 도면을 참조하면서 본 발명의 실시 형태를 상술한다. 다음 명세서에서, 다수의 특정 설명은 본 발명의 완전한 이하를 제공하기 위해 설명된다. 그러나, 본 발명이 이들 특정 상세없이 실행될 수 있음이 기술의 숙련자에 의해 명백해질 수 있다. 다른 예에서, 공지된 구조는 본 발명의 불필요함을 피하기 위해 상세히 도시되어 있지 않다.
제1도는 본 발명에 따른 적응 변환 코딩 시스템의 한 실시예를 도시하는 블록도이다. 본 발명에 따른 적응 변환 코딩 시스템은 입력 단자, 신호 변환부(2), 분석부(3), 양자화 파라메터 결정부(4), 양자화부(5), 셀렉터부(6), 코딩부(7), 펄스코딩부(8), 파라메터 코딩부(9), 가산부(10), 다중화부(11) 및 출력 단자(12)로 구성된다.
종래 기술과 비교하여, 적응 변환 코딩 시스템의 도시된 실시예는 추가 요소로서 셀렉터부(6) 및 펄스 코딩부(8)을 포함한다. 또, 적응 변환 코딩 시스템의 도시한 실시예는 제3도에서 다중화부(23) 대신에 다중화부(11) 및 제3도에서 가산기(22)대신에 가산기(10)을 사용한다. 다른 요소는 제3도에 참조하여 토론된 종래 기술에서와 동일하거나 거의 동일해진다. 그러므로, 종래 기술에 대해 다른점인 셀렉터부(6), 펄스 코딩부(8), 가산부(10) 및 다중화부(11)의 동작에 대해 토론하겠다.
셀릭터부(6)에서, 3단계의 프로세스가 행해진다.
제1단계에서, 종래 기술에서 코딩부(7)과 유사하게, 양자화값은 상승 연속 순서로 분류되어, 다음 식을 형성한다.
Vector X = [x(1), x(2), ..., x(N)]
그 다음, 종래 기술에서 코딩부(7)와 유사한 방법에서, 벡터 X에서의 각 요소 x(1), x(2), ..., x(N)은 타입 1 영역, 타입 2 영역 및 타입 3 영역으로 분할된다.
다음에, 제2단계에서, 요소가 타입 2 영역에 대한 경계 근처의 타입 1영역에 위치한 벡터 X의 다수의 요소는 2이상인 절대값을 갖고, 도시한 실시예에서 절대값이 제로로 교체된다. 여기에서, M은 다수의 요소의 상한을 표시하는 정수이고, 절대값은 제로로 교체된다고 가정된다. 코딩이 요소의 수에서 m 이상이거나 2m인 절대값을 제로로 교체하도록 행해질 때 총 코딩량 L(m)은 m=0, 1, ..., M 경우에 코딩부(7) 및 펄스 코딩부(8)의 출력으로 얻어진다. 그 다음, 총 코딩량 L(m)이 최소가 되는 m은 절대값을 제로로 교체하는 요소의 수로서 설정된다.
제5도는 요소의 수를 얻기 위한 프로세스를 도시하는 흐름도이다. 프로세스의 각 단계는 이후 토론하겠다.
단계 101에서, 타입 1영역 및 타입 2영역의 각 요소가 하프만 코딩에 의해 코드될 때, 코드의 코딩량 L(0)는 코딩부(7)에 의해 출력된다. 벡터 X의 값은 벡터 V에 저장된다.
단계 102에서, m은 1로 설정된다.
단계 103에서, 교체된 요소 주파수 표시 P(m) 및 교체된 요소값 Q(m)은 다음과 같이 표현된다.
P(m)=max{i ┃0<i<big_values*2+1┃ x(I) ┃>1}
Q(m)=x(P(m))
단계 104에서, 벡터 X의 요소는 영역으로 분할되어 x(P(m))=0이 얻어져, big_values 및 count1을 재계산한다.
단계 105에서, 코드의 코딩량 B1의 총 코딩량 L(m)=B1+B2는 타입 1 영역 및 타입 2 영역에서의 각 요소, 및 교체된 요소수 m, 교체된 요소 주파수 표시 P(1), P(2), ..., P(m) 및 교체된 요소값 Q(1), Q(2), ..., Q(m)의 코딩용으로 필요한 코딩량 B2의 하프만 코딩시 코딩부에 의해 출력된다. 코딩량 B1은 코딩부(7)의 동작을 실험함으로써 얻어진다. 코딩량 B2는 후술한 펄스 코딩부(8)의 동작을 실험함으로써 얻어진다.
단계 106에서, m은 1씩 증가된다.
단계 107에서, m이 교체된 요소 수의 상한 M이하이거나 동일해질 경우, 프로세스는 단계 103으로 복귀한다.
단계 108에서, min{L(a)┃a=0, 1, ..., M}이 확립된 요소의 수는 요소의 수로서 설정되고, 절대값은 교체된다. 그 다음, 벡터 X는 단계 101에서 저장된 벡터 V로 되돌아간다.
마지막으로, 제3단계에서, 제2단계에서 얻어진 벡터 X의 요소 수에서 a의 값은 제로로 교체되어, 다음 식을 형성한다.
Vector Y = [y(1), y(2), ..., y(N)]
벡터 X와 벡터 Y 사이의 차에 기초하여, Vector Z = [z(1), z(2), ..., y(N)] 이 형성된다. 벡터 Y는 코딩부(7)로 출력되고, 벡터 Z의 논제로 요소에 대한 정보는 펄스 코딩부(8)로 공급된다. 타입 2 영역은 절대값이 2이상인 요소를 포함할 수 없다. 그러므로, 종래 기술에서, 절대값이 2이상인 요소가 존재할 경우, 1이라도 모든 요소는 코딩용으로 타입 1 영역에 분류된 절대값이 2이상인 요소보다 주파수가 낮다. 절대값이 2이상인 요소용으로 절대값을 제로로 교체함으로써, 벡터 Y의 타입 1영역은 벡터 X의 타입 1 영역보다 더 작고, 타입 2 영역은 연장된다. 상기한 바와 같이, 타입 2영역에서 요소당 코딩량이 타입 1 영역에서 요소당 코딩량보다 작게 때문에, 타입 2 영역의 연장 및 타입 1영역의 축소는 코딩량을 감소시킬 수 있다. 여기에서, 절대값이 2 이상이고, 1로 교체된 벡터 X의 요소는 벡터 Z와 같이 펄스 코딩부(8)에 의해 코드된다.
벡터 Y는 초기에 다음과 같이 설정된다.
Vector Y = Vector X
그 다음, 교체된 요소 수 a가 1이상인 경우, 벡터 Y는 y(P(m)) = 0 상기 제2단계에서 얻어진 교체된 요소 주파수 표시 P(m) 및 교체된 요소값 Q(m)을 사용하여 m=1,2, ..., a에 대해 위식을 확립함으로써 얻어진다.
벡터 Z는 (벡터 X -벡터 Y)로서 얻어진다. 벡터 Z의 논제로 요소에 관계하는 정보로서, 교체된 요소 수 a, 교체된 요소 주파수 표시 P(1), P(2), ..., P(a) 및 교체된 요소값 Q(1), Q(2), ..., Q(a)는 펄스 코딩부(8)로 출력된다.
여기에서, (P(m))이 제3단계에서 제로로 교체된 방법에 대해 토론하겠다. 그러나, 절대값을 0 대신에 1 또는 -1로 교체될 수 있다. 이 경우에, 교체는 0, 1 및 -1 중 하나로 행해질 수 있고, 코딩부(7)에 의해 출력된 코드의 코딩량은 코딩의 향상된 효율은 달성하기 위해 최소화된다.
펄스 코딩부(8)은 셀렉터부(6)으로부터 출력된 벡터 Z의 논제로 요소에 관계하는 정보를 코딩함으로써 펄스 코드를 얻는다. 따라서, 펄스 코드는 다중화부(11)에서 얻어진다. 벡터 Z의 코딩에서, 먼저 PP(0) = big_values * 2+1 가 확립된다. 그 다음, 교체된 요소 수 a 및 교체된 요소 주파수 표시 P(m)를 사용하여, a가 1 이상인 경우, 교체된 요소 주파수 표시 오프셋 PP(m)은 PP(m)=(P(a-m+1)-PP(m-1))을 통해 얻어지고, 극성은 QQ(m)=Q(a-m+1)로 표현되며, 교체된 요소 진폭 QQQ(m)은 코딩용으로 다음과 같이 표현된다.
QQQ(m)=(┃QQ(m)┃-2)
이것이 행해질 수 있음에 주위한다. 여기에서, 교체 요소 진폭 QQQ(m)은 코딩용으로 ┃QQ(m)┃일 수 있다. 그러나, ┃QQ(m)┃이 2이상이기 때문에, 코딩을 엔코드 ┃QQ(m)┃-2로 행하는 것이 더 효과적일 수 있다. 또, 교체된 요소 주파수 표시 오프셋 P(m)은 P(m)으로서 코드될 수 있다. 그러나, 일반적으로 더 높은 코딩 효율은 PP(m)에 의해 달성될 수 있다. 펄스 코드 및 교체된 요소 수 a는 코드 C3으로서 다중화부(11)로 출력되도록 다중화된다. 코드 C3의 코딩량 L3은 가산기(10)으로 출력된다.
가산기(10)은 코딩량 C1, C2 및 C3을 합산함으로써 충 코딩량을 얻는다. 얻어진 총 코딩량은 양자화 파라메터 결정부(4)로 출력된다.
다중화부(11)은 코드 C1, C2 및 C3을 다중화하여, 비트 스트림을 형성한다.
제2도는 본 발명에 따른 적응 변환 디코딩 시스템의 한 실시예를 도시하는 블록도이다. 적응 변환 디코딩 시스템은 입력 단자(13), 분리부(14), 디코딩부(15), 펄스 디코딩부(16), 파라메터 디코딩부(17), 종합부(18), 역 양자화부(19), 신호 역 변환부(20) 및 출력 단자(21)을 포함한다.
적응 변환 디코딩 시스템의 도시한 실시예는 펄스 디코딩부(16) 및 종합부(18)이 가산되는 것이 제4도에 도시한 종래 기술과 다르고, 제4도에서 분리부(24)는 분리부(14)로 교체된다. 다른 요소는 제4도에 도시한 종래 기술의 요소와 동일하다. 그러므로, 분리부(14), 펄스 디코딩부(16) 및 종합부(18)의 동작에 대해 토론하겠다.
분리부(14)에서, 비트 스트림은 코드 C1, C1 및 C3으로 분리된다. 코드 C1은 디코딩부(15) 및 펄스 디코딩부(16)으로 공급된다. 코드 C2는 파라메터 디코딩부로 출력된다. 코드 C3은 펄스 디코딩부(16)으로 출력된다.
펄스 디코딩부(16)에서, 먼저 코드 C3은 교체된 요소 수 a 및 펄스 코드로 분리된다. 다음에, 펄스 코드는 m=1,2,...,a에 대해 교체된 요소 주파수 표시 오프셋 PP(m), 극성QQ(m) 및 교체된 요소 진폭 QQQ(m)으로 분리된다. 또, 벡터 Z는 다음과 같이 표시되도록 M 차원의 제로 벡터로서 취해진다.
PP(0)=big_values*2+1
1에서 a까지 1씩 증가된 m 각각에 대해, 이것은 다음과 같이 확립된다.
PP(m)←PP(m)+PP(m-1)
또, 이것은 다음과 같이 확립된다.
z(PP(m)) = QQQ(m)+2
┃QQ(m)┃이 코딩시 QQQ(m)으로서 사용될 때, 이것은 다음과 같이 확립됨에 주의한다. z(PP(m))=QQQ(m) 한편, P(m)이 코딩시 pp(m) 대신에 코드될 때, PP(m)←PP(m)+PP(m-1)의 동작은 불필요해진다. QQ(m)의 극성이 네가티브일 때, z(PP(m))은 -1이 곱해진다. 따라서 얻어진 벡터 Z는 양자화값 스트링으로서 종합부(18)로 출력된다.
종합부(18)에서, 코딩부로부터 출력된 양자화량은 y(1), y(2), ..., y(big_values*2 + count1*4)가 되도록 연속적인 상승 순서로 저장되어, y(big_values*2 + count1*4 +1)을 확립하고, y(big_values*2 + count1*4 + 2), ..., y(N)은 제로로 설정된다. 펄스 디코딩부로부터 출력된 양자화량 y(1), y(2),... y(N) 및 양자화값 스트링 z(1), z(2),... z(N)은 종합되어, 종합적인 양자화값 스트링 x(1), x(2), ..., x(N)을 확립한다. z(m)이 m=1,2, ..., (N)에 대해 제로가 될 경우, x(m) = y(m)이 확립될 수 있다. z(m)이 제로가 아닌 경우, x(m)=z(m)이 확립될 수 있다.
종래 기술에서 코딩부(7)로 입력된 양자와값이 본 발명에 따른 셀렉터부(6)으로 입력된 경우에서 코딩량 감소의 효과에 대해 토론하겠다. 제7도의 파형으로 표시한 바와 같이 사운드 소스 Lyra가 코드될 때, 종래 기술에서, 한 프레임당 평균 코딩량은 1365 비트이다. 이것과 반대로, 본 발명에 따르면, 종래 기술과 비교하여 최대로서 평균 9.37 비트 및 145비트의 코딩량은 감소된다. 각 프레임의 제거된 코드량의 시간 축에서의 변환은 제8도에 도시되어 있다. 제1도에 설명한 바와 같이 본 발명의 제1실시예에서 제거된 코드량이 코딩용으로 사용되기 때문에, 동일 비트율에서 코딩의 질은 종래 기술과 비교하여 향상된다.
제1실시예에서, 코딩 대신에 M=1에 대해 교체된 요소 주파수 표시 오프셋 PP(m)에 관련하여, PP(m)=(P(a-m+1)-PP(m-1))
먼저, 주파수 신호는 영역 수에서 AR로 분할된다. 그 다음, 펄스 코딩부(8)에서, 각각 영역의 경계 주파수는 AL(1), AL(2), ..., AL(AR)로 취해지고, al 의 최대값은 다음을 만족하고 AL(al)<PP(1) 다음과 같이 표현된 값이 코드된다.
a0 = PP(1) -AL(al)
한편, 코딩이 행해질 때, 디코딩 측에서, 펄스 디코딩부(16)에서, PP(1)은 다음과 같이 얻어진다.
PP(1) = AL(a2) + a0
다음에, 본 발명에서, 적응 변환 코딩 시스템 및 적응 변환 디코딩 시스템의 결합에 대해, 다른 실시예를 토론하겠다. 본 발명의 적응 변환 코딩 시스템의 제2실시예는 제1실시예와 유사하게 제1도의 블록도에 설명되어 있다.
본 발명의 제2실시예에서, 셀렉터부(6) 및 코딩부(8)의 동작이 본 발명의 제1실시예와 다르다. 이후, 셀렉터부(6) 및 펄스 코딩부(8)의 동작에 대해 설명하겠다.
셀렉터부(6)은 3단계로 프로세스를 행한다.
제1단계에서, 종래 기술의 코딩부와 유사하게, 양자화값은 주파수의 연속 상승 순서로 분류되어, 벡터 X = [ x(1), x(2), ..., x(N)]을 형성한다. 종래 기술에서 코딩부와 유사한 방법에서, 벡터 X의 요소 x(1), x(2), ..., x(N)은 타입 1영역, 타입 2영역 및 타입 3영역으로 분할된다.
다음에, 제2단계로서, 타입 1영역의 요소 수 a는 절대값을 제로와 같은 작은 값으로 교체하는데 요구된다. M은 절대값을 제로와 같은 작은 값으로 교체되도록 요소의 수의 상한을 표시하는 정수로서 가정된다. 코딩이 절대값을 타입 1영역의 요소 수에서 m에 대해 0과 같은 작은 값으로 교체함으로써 행해질 때, 코딩부(7) 및 펄스 코딩부(8)로부터 출력된 코드의 총 코딩량 L(m)은 m=0.1, ..., M에 관해 얻어진다. 그 다음, 총 코딩량이 최소가 되는 m이 요소의 소 a로서 설정될 때, 절대값은 제로와 같은 작은 값으로 교체된다.
제6도는 요소의 수 a를 얻기 위한 프로세스를 도시하는 흐름도를 도시한다. 각 단계는 이후 토론하겠다.
단계 201에서, 타입 1영역의 각 요소의 하프만 코딩시 코딩부(7)로부터 출력된 코드의 코딩량 L(0)은 벡터 X에서 얻어진다. 벡터 X의 값은 벡터 V에 저장된다.
단계 202에서, m은 1로 설정된다.
단계 203에서, 1이상 및 big_values*2 이상인 i(여기에서, ┃x(i)┃가 최대)는 교체된 요소 주파수 표시 P(m)으로서 설정된다. 한편, 교체된 요소값 Q(m)은 x(P(m))으로서 설정된다.
단계 204에서, n=1, 2, ..., ┃Q(m)┃-1에 대해, x(P(m))=n 은 n을 얻도록 확립되고, 타입 1 영역의 각 요소의 하프만 코딩시 출력된 코드의 코딩량은 최소가 되어, 다음의 식을 확립한다.
x(P(m))=n
R(m)=n
단계 205에서, 총 코딩량 L(m)은 타입 1 영역의 하프만 코딩시 코딩부(7)로부터 출력된 코드의 코딩량 B1 및 교체된 요소 수 m, 교체된 요소 주파수 표시 P(1), P(2), ..., P(m) 및 교체된 요소값 Q(1), Q(2, ..., Q(m)을 코드하기 위해 펄스 코딩부(8)용으로 필요한 코딩량 B2의 합으로서 다음과 같이 얻어진다.
L(m)= B1+B2
코딩량 B1은 코딩부(7)의 동작을 실험함으로써 얻어진다. 코딩량 B2는 펄스 코딩부 (8)의 동작을 실험함으로써 얻어진다.
단계 206에서, m은 1씩 증가된다. 단계 207에서, m이 교체된 요소 수의 상한 M 이하인 경우, 프로세스는 단계 203으로 복귀한다.
단계 208에서, 확립하는 min{L(a)┃a=0, 1, ..., M}은 요소의 수로서 설정되어, 절대값을 제로와 같은 작은 값으로 교체한다. 벡터 X는 단계 201에서 저장된 벡터V로 복귀된다.
마지막으로, 제3단계에서, 벡터 X의 요소의 수에서 a는 제2단계에서 얻어지고, 절대값은 제로와 같은 작은 값으로 교체된다.
Vector Y = [y(1), y(2), ..., y(N)]
이 형성되고, 후에 설정된 절차에 의해
Vector Z = [z(1), z(2), ..., z(N)]
이 형성된다. 벡터 Y는 코딩부(7) 및 펄스 코딩부(8)로 출력된다. 벡터 Z의 논제로 요소에 관한 정보는 펄스 코딩부(8)로 출력된다.
벡터 Y 및 벡터 Z는 벡터 Z가 벡터 X와 동일 크기에서 제로 벡터가 되도록 먼저 확립된다.
Vector Y = Vector X 다음에, 제2단계에서 얻어진 교체된 요소 수 a가 0 이상일 경우, 제2단계에서 얻어진 교체된 요소 주파수 P(m) 및 교체된 요소값 Q(m)은 m=1,2,...,에 대해 사용되어, 다음 식을 얻는다.
z(m) = Q(m)
y(P(m)) = R(m)
벡터 Z의 논제로 요소에 관한 정보로서 교체된 요소 수 a, 교체 요소 주파수 표시 P(1), P(2), ..., P(a) 및 교체된 요소값 Q(1), Q(2), ..., Q(a)는 펄스 코딩부(8)로 출력된다.
펄스 코딩부(8)은 벡터 Z의 논제로 요소에 관한 정보를 코딩함으로써 펄스 코드를 얻는다. 얻어진 펄스 코드는 다중화부(11)로 출력되고, 먼저, m=1,2, ..., a에 대해, {P(m), Q(m)}은 P(m)의 상승 순서로 저장되어, {SP(m), SQ(m)}을 얻는다. 그 다음,
SPP(0) = 1 이 확립된다. a가 1이상일 때, 교체된 요소 주파수 표시 오프셋 SPP(m) = (SP(m)-SP(m-1), SQ(m)의 극성 및 교체된 요소 진폭 SQQ(m) = (┃SQ(m)┃ - ┃y(SP(m))┃)은 코드되어 펄스 코드를 얻는다. 코딩이 교체된 요소 진폭 ┃SQ(m)┃을 설정함으로써 행해질 수 있음에 주의한다. 그러나, ┃SQ(m)┃이 ┃y(SP(m))┃보다 커지기 때문에, SQQ(m)이 코드될 때의 코딩의 효율에 더 효율적이다. 펄스 코드 및 교체된 요소 수 a는 C1로서 다중화되어, 다중화부(11)로 출력된다. 코드 C3의 코딩량 L3은 가산부(10)으로 출력된다.
본 발명에 따른 적응 변환 디코딩 시스템의 제2실시예의 블록도는 제2도에 도시한 바와 같이 본 발명의 적응 변환 코딩 시스템의 제1실시예와 동일해진다. 본 발명에 따른 적응 변환 디코딩 시스템의 제2실시예는 발명의 제1실시예에서의 펄스 디코딩부(16) 및 종합부(18)의 동작과 다르다. 이후, 펄스 디코딩부(16) 및 종합부(18)의 동작에 대해 토론하겠다.
펄스 디코딩부(16)에서, 먼저 코드 C3은 교체된 요소 수 a 및 펄스 코드로 분리된다. 다음에, 코드 C1은 디코딩부(15)와 유사한 절차를 통해 디코드된다. 얻어진 양자화값은 y(1), y(2), ..., y(big_values*2 + count1*4)와 같은 주파수의 상승 순서로 저장된다. 다음에, 펄스 코드는 교체된 요소 주파수 표시 오프셋 SPP(m), SQ(m)의 극성 및 교체된 요소 진폭 SQQ(m)으로 분리된다. 벡터 Z는 다음과 같이 N차 제로 벡터로 확립된다.
SPP(0) =1
그 다음, m은 각 m에 대해 1에서 a까지 1씩 증가되고, SPP(m-1)은 SPP(m)에 가산되며, ┃y(SPP(m))┃은 교체된 요소 진폭 SQQ(m)에 가산되어 z(SPP(m))을 확립한다. SQ(m)의 극성이 네가티브 극성을 표시할 경우, z(SPP(m))은 -1이 곱해진다. 얻어진 벡터 Z는 양자화값 스트링으로서 종합부(18)로 출력된다. 종합부(18)에서, 디토딩부(15)로부터 출력된 양자화값 스트링은 y(1), y(2), ..., y(big_values*2 + count1*4)가 되도록 주파수의 연속 상승 순서로 저장되어, 제로에서 y(big_values*2 + count1*4 +), y(big_ values*2 + count1*4 + 2), ..., y(N)을 설정한다. 펄스 디코딩부(16)으로부터 출력된 y(1), y(2), ..., y(N) 및 양자화값 스트링 z(1), Z(2), ..., z(N)을 종합하여, 종합된 양자화값 스트링 x(1), x(2), ..., x(N)이 얻어진다. m= 1,2, ..., N에 대해, z(m)이 제로인 경우, x(m) = y(m) 이 확립된다. 한편, z(m)이 제로가 아닌 경우 x(m) = z(m)이 확립된다. 여기에서, sgn(x3)은 x3이 네가티브일 때 -1로 복귀하는 함수이고, x3이 제로일 때 0으로 복귀하는 함수이며, x3이 포지티브일 때 1로 복귀하는 함수이다. 따라서 얻어진 종합된 양자화값 스트링은 역 양자화부(19)로 출력된다.
종래 기술에서 코딩부(7)의 입력에 대항 양자화값이 본 발명의 셀렉터부(6)에 대한 입력일 때 코딩량의 감소의 효과에 대해 토론하겠다. 제7도에서 파형에 의해 표현된 사운드 소스 Lyra가 코드될 때, 종래 기술에서, 1프레임당 평균 코딩량은 1365비트이다. 이것과 대조적으로, 본 발명에 따라, 종래 기술과 비교하여 최대로서 평균 1300 비트 및 134 비트의 코딩량은 감소된다. 각 프레임의 제거된 코드량의 시간 축의 변환은 제9도에 도시되어 있다. 제1도에 도시한 바와 같이 본 발명의 제1실시예에서, 제거된 코드량이 코딩용으로 사용되기 때문에, 동일 비트율에서의 코딩질은 종래 기술과 비교하여 향상된다.
본 발명의 제2실시예가 타입 1 영역의 코딩 효율의 향상에 지향되고, 본 발명의 제1실시예는 타입 2영역을 연장하고, 타입 1영역을 감소하는 코딩 효율을 향상시킴에 주의한다. 그러므로, 상기 제1 및 제2실시예의 결합으로 실시예가 확립될 수 있다.
본 발명의 제2실시예에서, m=1에 대해 교체된 요소8
주파수 표시 오프셋 SPP(m)에 대해,
SPP(m) = (SP(a-m+1)-SP(m-1)에 의한 코딩 대신에, 주파수 신호는 영역의 수에서 AR로 분할된다. 그 다음, AL(1), AL(2), ..., AL(AR)과 같이 각 영역의 경제 주파수를 취함으로써, AL(a2) <SPP(1)를 만족하는 최대 a1 및 a0 = SPP(1) - AL(a2) +a0의 값에 대한 코딩을 행하여, SPP(1)을 얻는다.
상기 설명한 본 발명에 따르면, 코딩 효율은 현저하게 개선될 수 있다.
절대값이 큰 소수의 양자화값 및 나머지 양자화값은 다른 방법으로 코드되기 때문에, 절대값이 큰 양자화값과 다른 양자화값을 코드하는 방법(제1도의 코딩부(7))으로 코드하기 위해 사용되는 하프만 코드 테이블은 종래 기술의 것보다 더 작아질 수 있다. 또, 한 양자화값 당 평균 코딩량은 작아져 코딩 효율을 더 개선할 수 있다.
발명의 상세한 설명의 항에서 없는 구체적인 실시 상태 또는 실시예는 어디까지나 본 발명의 기술 내용을 명백하게 하는 것으로, 그와 같은 구체 예에서만 한정하여 협의로 해석되어야 하는 것은 아니고, 본 발명의 정신과 다음에 기재하는 특허 청구 사항의 범위 내에서 여러 가지로 변경하여 실시할 수 있는 것이다.

Claims (18)

  1. 입력 신호를 주파수 영역 신호로 변환하는 신호 변환부와, 허용가능한 양자화 에러를 얻기 위해 상기 입력 신호 및 상기 주파수 영역신호를 분석하는 분석부와, 양자화값 및 양자화 에러를 얻기 위해 양자화 스텝 사이즈에 기초하여 상기 주파수 영역 신호의 진폭값을 양자화하는 양자화부와, 상기 허용가능한 양자화 에러 및 상기 양자화 에러 및 총 코드량에 관해 상기 양자화 스텝 사이즈를 결정하는 양자화 파라메터 결정부와, 제1신호 및 제2신호를 얻기 위해 상기 주파수 영역 신호의 양자화값을 분석하는 셀렉터부와, 제1코드 및 제1코드량을 얻기 위해 상기 제2신호에 관해 상기 제1신호의 상기 양자화값을 코드하는 제1코딩부와, 제2코드 및 제2코드량을 얻기 위해 상기 제2신호의 상기 양자화값을 코드하는 제2코딩부와, 제3코드 및 제3코드량을 얻기 위해 상기 양자화 스텝 사이즈를 코드하는 파라메터 코딩부와, 성가 제1코드량, 상기 제2코드량 및 상기 제3코드량의 상기 총 코드량을 얻는 가산부 및 비트 스트림을 형성하기 위해 상기 제1코드, 상기 제2코드 및 상기 제3코드를 다중화하는 다중화부를 포함하는 것을 특징으로 적응 변환 코딩 시스템.
  2. 제1항에 있어서, 상기 제2부는 제4신호를 형성하기 위해 상기 주파수 영역신호의 양자화값을 제1신호 및 제3신호로 분할하고, 상기 제1신호의 상기 양자화값의 절대값은 작은 양자화값으로 교체하며, 상기 제2신호는 상기 제3신호 및 상기 제4신호를 결합함으로써 형성된 것을 특징으로 적응 변환 코딩 시스템.
  3. 제1항에 있어서, 상기 셀렉터부는 상기 총 코드량이 최소가 되도록 상기 제1신호 및 상기 제2신호를 얻는 것을 특징으로 적응 변환 코딩 시스템.
  4. 제1항에 있어서, 상기 제1코딩부는 상기 제1신호의 상기 양자화값의 절대값, 상기 제1신호의 양자화값의 극성 및 상기 제1신호의 주파수를 코딩함으로써 상기 제1코드를 형성하는 것을 특징으로 적응 변환 코딩 시스템.
  5. 제4항에 있어서, 상기 제1코딩부는 상기 제1신호의 상기 양자화값의 상기 절대값 대신에 상기 제1신호의 상기 양자화값으로부터 상기 스레숄드값을 감산함으로써 얻어진 값을 코드하기 위해 상기 제1신호의 상기 양자화값의 스레숄드값을 얻는 것을 특징으로 적응 변환 코딩 시스템.
  6. 제5항에 있어서, 상기 제1신호의 각 샘플에서, 스레숄드값은 상기 제1신호의 샘플에 대한 동일 주파수로 상기 제2신호 샘플의 양자화값의 절대값용으로 1을 가산함으로써 얻어진 값인 것을 특징으로 적응 변환 코딩 시스템.
  7. 제5항에 있어서, 상기 제2코딩부에서 코드되는 양자화값의 영역은 한정되고, 상기 제1신호의 각 샘플에서, 상기 스레숄드값은 상기 제2코딩부에 의한 상기 샘플과 동일 주파수를 갖는 신호의 코딩시 상기 제2코딩부의 입력 영역의 최대 절대값에 1을 가산함으로써 얻어진 값인 것을 특징으로 적응 변환 코딩 시스템.
  8. 제4항에 있어서, 상기 제1코딩부는 주파수의 연속 상승 순서에서 상기 제1주파수의 각 샘플의 주파수를 코드하고, 주파수가 가장 낮은 상기 샘플과 다른 샘플용으로, 샘플의 주파수 및 하나 선행하는 순서의 샘플의 주파수의 차가 코드되는 것을 특징으로 적응 변환 코딩 시스템.
  9. 제8항에 있어서, 상기 주파수 신호는 상기 제1코딩부에서, 주파수가 가장 낮은 샘플의 주파수, 주파수가 가장 낮은 샘플의 상기 주파수보다 낮은 경계 수, 및 주파수가 가장 낮은 샘플의 상기 주파수 및 주파수가 가장 낮은 샘플의 상기 주파수보다 낮은 영역 경계 주파수의 최대값의 차 대신에 다수의 영역으로 분할되는 것을 특징으로 적응 변환 코딩 시스템.
  10. 입력 신호를 제1코드, 제2코드 및 제3코드로 분리하는 분리부와, 제1신호를 얻기 위해 상기 제2코드에 대해 상기 제1코드를 디코드하는 제1디코딩부와, 제2신호를 얻기 위해 상기 제2코드를 디코드하는 제2디코딩부와, 양자화 스텝 사이즈를 얻기 위해 상기 제3신호를 디코드하는 파라메터 디코딩부와, 종합 신호를 얻기 위해, 상기 제1신호 및 상기 제2신호를 종합하는 종합부와, 역 양자화 신호를 얻기 위해 상기 종합 신호의 상기 양자화값을 역 양자화하는 역 양자화부, 및 시간 영역 신호를 얻기 위해 상기 역 양자화 신호를 시간 영역으로 변환하는 신호 역 변환부를 포함하는 것을 특징으로 하는 적응 변환 디코딩 시스템.
  11. 제10항에 있어서, 상기 제1디코딩부는 각각 양자화값의 주파수, 양자화값의 절대값 및 상기 제1신호의 양자화값의 극성을 설정하기 위해 양자화값의 주파수, 양자화값의 절대값 및 상기 제1코드를 디코딩함으로써 양자화값의 극성을 얻는 것을 특징으로 적응 변환 디코딩 시스템.
  12. 제11항에 있어서, 상기 제1디코딩부는 스레숄드값을 얻고, 상기 제1코드를 디코딩함으로써 얻어진 양자화값의 절대값 대신에 상기 제1신호의 양자화값의 절대값으로서 상기 제1코드를 디코딩함으로써 얻어진 양자화값의 절대값에 상기 스레숄드값을 가산함으로써 얻어진 값을 취하는 것을 특징으로 하는 적응 변환 디코딩 시스템.
  13. 제12항에 있어서, 상기 제1신호의 각 샘플에서, 스레숄드값은 상기 샘플에 대한 동일 주파수의 상기 제2신호의 샘플의 양자화값의 절대값인 것을 특징으로 하는 적응 변환 디코딩 시스템.
  14. 제12항에 있어서, 상기 제2디코딩부는 역 양자화값의 제한을 갖고, 상기 제1신호의 각 샘플에서, 스레숄드값은 상기 제2디코딩부가 상기 샘플과 동일 주파수를 갖는 신호를 디코드할 때 상기 제한의 최대 절대값에 1을 가산함으로써 얻어진 값인 것을 특징으로 하는 적응 변환 디코딩 시스템.
  15. 제11항에 있어서, 상기 제1디코딩부는 주파수 및 디코딩함으로써 가장 낮은 주파수의 샘플의 주파수의 차를 얻고, 상기 주파수의 차를 주파수가 가장 낮은 샘플의 주파수에 가산함으로써 주파수가 가장 낮은 상기 샘플과 다른 샘플의 주파수를 얻는 것을 특징으로 하는 적응 변환 디코딩 시스템.
  16. 제15항에 있어서, 주파수 신호는 다수의 영역으로 분할되고, 상기 제1디코딩부에서, 영역 경계의 수 및 상기 주파수의 차는 디코딩함으로써 얻어지며, 상기 주파수의 차를 상기 영역 경계의 수료 표시한 영역 경계의 주파수에 가산함으로써 얻어진 값은 주파수가 가장 낮은 샘플의 주파수로서 취해진 것을 특징으로 하는 적응 변환 디코딩 시스템.
  17. 제10항에 있어서, 상기 종합부는 상기 제1신호의 각 샘플의 주파수와 동일 주파수를 갖는 샘플의 양자화값을 상기 종합 신호로서 교체된 신호를 취하기 위해 상기 제1신호의 양자화값으로 교체하는 신호를 형성하는 것을 특징으로 하는 적응 변환 디코딩 시스템.
  18. 입력 신호를 주파수 영역 신호로 변환하는 신호 변환부와, 허용가능한 양자화 에러를 얻기 위해 상기 입력 신호 및 상기 주파수 영역 신호를 분석하는 분석부와, 양자화값 및 양자화 에러를 얻기 위해 양자화 스텝 사이즈에 기초하여 상기 주파수 영역 신호의 진폭 값을 양자화하는 양자화부와, 상기 허용가능한 양자화 에러 및 상기 양자화 에러 및 총 코드량에 관해 상기 양자화 스텝 사이즈를 결정하는 양자화 파라메터 결정부와, 제1신호 및 제2신호를 얻기 위해 상기 주파수 영역 신호의 양자화값을 분석하는 셀렉터부와, 제1코드 및 제1코드량을 얻기 위해 상기 제2신호에 대해 상기 제1신호의 상기 양자화값을 코드하는 제1코딩부와, 제2코드 및 제2코드량을 얻기 위해 상기 제2신호의 상기 양자화값을 코드하는 제2코딩부와, 제3코드 및 제3코드량을 얻기 위해, 상기 제2신호의 상기 양자화값을 코드하는 제2코딩부와, 제3코드 및 제3코드량을 얻기 위해 상기 양자화 스텝 사이즈를 코드하는 파라메터 코딩부와, 상기 제1코드량, 상기 제2코드량 및 상기 제3코드량의 상기 총 코드량을 얻는 가산부와, 비트 스트림을 형성하기 위해 상기 제1코드, 상기 제2코드 및 상기 제3코드를 다중화하는 다중화부와, 입력 신호를 제1코드, 제2코드 및 제3코드로 분리하는 분리부와, 제1신호를 얻기 위해 상기 제2코드에 대해 상기 제1코드를 디코드하는 제1디코딩부와, 제2신호를 얻기 위해 상기 제2코드를 디코드하는 제2디코딩부와, 양자화 스텝 사이즈를 얻기 위해 상기 제3신호를 디코드하는 파라메터 디코딩부와, 종합 신호를 얻기 위해 상기 제1신호 및 상기 제2신호를 종합하는 종합부와, 역 양자화 신호를 얻기 위해 상기 종합 신호의 상기 양자화값을 역 양자화하는 역 양자화부, 및 시간 영역 신호를 얻기 위해 상기 역 양자화 신호를 신호 영역으로 변환하는 신호 역 변환부를 포함하는 것을 특징으로 하는 적응 변환 코딩 및 디코딩 시스템.
KR1019970031757A 1996-07-01 1997-07-01 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템 KR100255533B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP17142396A JP3255022B2 (ja) 1996-07-01 1996-07-01 適応変換符号化方式および適応変換復号方式
JP1996-171423 1996-07-01
JP96-171423 1996-07-01

Publications (2)

Publication Number Publication Date
KR980013436A KR980013436A (ko) 1998-04-30
KR100255533B1 true KR100255533B1 (ko) 2000-05-01

Family

ID=15922864

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970031757A KR100255533B1 (ko) 1996-07-01 1997-07-01 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템

Country Status (7)

Country Link
US (3) US5841377A (ko)
EP (1) EP0817395B1 (ko)
JP (1) JP3255022B2 (ko)
KR (1) KR100255533B1 (ko)
AU (1) AU717993B2 (ko)
CA (1) CA2209570C (ko)
DE (1) DE69701927T2 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8505108B2 (en) 1993-11-18 2013-08-06 Digimarc Corporation Authentication using a digital watermark
US6122014A (en) * 1998-09-17 2000-09-19 Motorola, Inc. Modified chroma keyed technique for simple shape coding for digital video
US6278385B1 (en) * 1999-02-01 2001-08-21 Yamaha Corporation Vector quantizer and vector quantization method
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2002215196A (ja) 2001-01-24 2002-07-31 Nec Corp 0.75乗計算装置及び0.75乗計算方法並びにそれに用いるプログラム
US8446947B2 (en) 2003-10-10 2013-05-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
US7292962B1 (en) * 2004-03-25 2007-11-06 Sun Microsystems, Inc. Technique for detecting changes in signals that are measured by quantization
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
JP4903670B2 (ja) * 2007-10-31 2012-03-28 京セラミタ株式会社 画像処理装置、画像形成装置及びプログラム
JP4825916B2 (ja) * 2007-12-11 2011-11-30 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
KR101668093B1 (ko) * 2010-06-17 2016-10-21 삼성전자주식회사 데이터 인코딩 및 디코딩 방법 및 장치
US10101049B2 (en) 2015-11-12 2018-10-16 Oracle International Corporation Determining parameters of air-cooling mechanisms

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
JPS5936280B2 (ja) 1982-11-22 1984-09-03 日本電信電話株式会社 音声の適応変換符号化方式
CA1197619A (en) 1982-12-24 1985-12-03 Kazunori Ozawa Voice encoding systems
EP0163829B1 (en) 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
JPS6262399A (ja) * 1985-09-13 1987-03-19 株式会社日立製作所 音声高能率符号化方式
JP2828997B2 (ja) * 1988-07-22 1998-11-25 株式会社日立製作所 適応型変換符号化装置
JPH0810935B2 (ja) * 1988-12-09 1996-01-31 富士写真フイルム株式会社 画像信号圧縮符号化装置および伸長再生装置
JPH0832039B2 (ja) * 1989-08-19 1996-03-27 日本ビクター株式会社 可変長符号化方法及びその装置
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
JP3158458B2 (ja) * 1991-01-31 2001-04-23 日本電気株式会社 階層表現された信号の符号化方式
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
JPH09503630A (ja) 1993-07-07 1997-04-08 ピクチャーテル コーポレイション 固定ビットレートのスピーチエンコーダ/デコーダ
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
US5508949A (en) 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
KR100289733B1 (ko) 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
JP3563779B2 (ja) 1994-09-13 2004-09-08 株式会社ルネサステクノロジ 半導体記憶装置
JPH08179794A (ja) 1994-12-21 1996-07-12 Sony Corp サブバンド符号化方法及び装置
EP0720316B1 (en) 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive digital audio encoding apparatus and a bit allocation method thereof
JP3297238B2 (ja) 1995-01-20 2002-07-02 大宇電子株式會▲社▼ 適応的符号化システム及びビット割当方法
JPH09135173A (ja) 1995-11-10 1997-05-20 Sony Corp 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
US6272176B1 (en) * 1998-07-16 2001-08-07 Nielsen Media Research, Inc. Broadcast encoding system and method

Also Published As

Publication number Publication date
EP0817395A1 (en) 1998-01-07
CA2209570C (en) 2000-09-19
AU2842097A (en) 1998-01-15
DE69701927T2 (de) 2000-10-05
US5841377A (en) 1998-11-24
USRE38593E1 (en) 2004-09-21
EP0817395B1 (en) 2000-05-10
KR980013436A (ko) 1998-04-30
JP3255022B2 (ja) 2002-02-12
USRE41370E1 (en) 2010-06-08
AU717993B2 (en) 2000-04-06
DE69701927D1 (de) 2000-06-15
JPH1020897A (ja) 1998-01-23
CA2209570A1 (en) 1998-01-01

Similar Documents

Publication Publication Date Title
AU733156B2 (en) Audio coding method and apparatus
US7630902B2 (en) Apparatus and methods for digital audio coding using codebook application ranges
EP1396841B1 (en) Encoding apparatus and method, decoding apparatus and method, and program
KR101000345B1 (ko) 음성 부호화 장치, 음성 복호화 장치 및 그 방법
JPH01233500A (ja) 複数レート音声エンコーデイング方法
KR100255533B1 (ko) 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템
JPH06149296A (ja) 音声符号化方法及び復号化方法
EP1222659A1 (en) Lpc-harmonic vocoder with superframe structure
KR20070029754A (ko) 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법
JPS5912499A (ja) 音声符号化装置
JPH10285048A (ja) デジタルデータの符号化/復号化方法及び装置
Podilchuk et al. Sparse codebooks for the quantization of nondominant sub-bands in image coding
JP2001507822A (ja) スピーチ信号のエンコード方法
JP3297749B2 (ja) 符号化方法
JPH0463400A (ja) 音声符号化器
JP4299676B2 (ja) 固定音源ベクトルの生成方法及び固定音源符号帳
US5265219A (en) Speech encoder using a soft interpolation decision for spectral parameters
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
JP3237178B2 (ja) 符号化方法及び復号化方法
JP2004252068A (ja) デジタルオーディオ信号の符号化装置及び方法
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JPH06268606A (ja) 音声符号化通信方式及びその装置
JPH07334198A (ja) 音声符号化装置
JPS59129900A (ja) 帯域分割符号化方式
JP2001228888A (ja) 音声符号化装置、音声復号化装置及び符号語配列方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130118

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20140117

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20150120

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20160119

Year of fee payment: 17

FPAY Annual fee payment

Payment date: 20170119

Year of fee payment: 18

EXPY Expiration of term