KR960012471B1 - 디지탈 코딩방법 - Google Patents

디지탈 코딩방법 Download PDF

Info

Publication number
KR960012471B1
KR960012471B1 KR1019880700459A KR880700459A KR960012471B1 KR 960012471 B1 KR960012471 B1 KR 960012471B1 KR 1019880700459 A KR1019880700459 A KR 1019880700459A KR 880700459 A KR880700459 A KR 880700459A KR 960012471 B1 KR960012471 B1 KR 960012471B1
Authority
KR
South Korea
Prior art keywords
bits
quantization
spectral coefficients
value
values
Prior art date
Application number
KR1019880700459A
Other languages
English (en)
Other versions
KR880702011A (ko
Inventor
브란덴부르크 카를-하인쯔
Original Assignee
브란덴부르크 카를-하인쯔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=6308482&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR960012471(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 브란덴부르크 카를-하인쯔 filed Critical 브란덴부르크 카를-하인쯔
Publication of KR880702011A publication Critical patent/KR880702011A/ko
Application granted granted Critical
Publication of KR960012471B1 publication Critical patent/KR960012471B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

요약없음

Description

디지탈 코딩방법
제1도는 본 발명에 따른 디지탈 코딩방법을 도시한 흐름도이다.
발명의 배경
본 발명은 음향신호(accoustical signal), 특히 음향신호의 N 주사치가 M 스펙트럼 계수로 변환된 악음신호(musical signal)의 전송 및/또는 저장을 위한 디지탈 코딩방법에 관한 것이다.
기술의 배경
음향신호를 코딩하는 표준 프로세스는 소위 펄스코드변조(pulse code modulation)이다. 이 프로세스에 있어서, 악음신호는 보통은 44.1kHz, 적어도 32kHz로 주사된다. 따라서, 16비트 선형코딩은 512kbit/s와 705.6kbit/s 사이의 데이터 속도를 낳는다.
실제, 그런 데이터 양을 감소시키기 위한 프로세스는 악음신호를 위한 그라운드(ground)를 얻을 수 없다. 악음신호의 코딩과 데이터 감소에 대한 지금까지의 최상의 결과는 소위 적응변환 코딩(Adaptive Transformation Coding, ATC)으로 달성되었다. 이와 관련하여 참고문헌으로는 DE-PS 33 10 480와 더욱 상세히 설명되지 않는 모든 특색들에 관하여 명백히 언급된 내용물을 참조바람. 적응변환 코딩은 양질성을 유지하면서 거의 110kbits의 데이터 감소를 가능케 한다.
그러나, 이러한 종래기술의 단점은 품질의 손상이 특히 악음의 임계부의 경우에 감지될 수 있다는 것이다. 이것은 다른것들 중에서 부호화 신호의 교란부가 선행기술 프로세서에서 귀의 가청도의 한계치에 적합될 수 없음과, 더우기 과변조 또는 너무 조악한 양자화가 존재할 수 있다는 것이다.
발명의 설명
본 발명의 목적은 음향신호 특히 악음신호의 전송 및/또는 저장을 위한 디지탈 코딩 프로세스 뿐만 아니라, 악음신호의 질을 본질적으로 감소시키지 않고서 데이터 속도를 인수 4-6정도 감소시키는 것을 허용할 수 있는 대응 디코딩 프로세서를 제공하는 것이다.
본 발명은 코딩 프로세서의 경우에, 데이터는 이산여현 변환, TDAC 변환 또는 고속 퓨리에 변환을 이용하여 스펙트럼 계수의 집합으로 기존의 프로세스에서 블록형태로 우선 변환된다. 레벨제어(level control)는 미리 행해져도 된다. 더구나, 이른바 윈도우잉이 처리된다. 소위 스펙트럼 불균일 분포에 대한 값은 스펙트럼 계수로부터 계산된다. 그리고 이 값으로부터 스펙트럼 영역에서의 양자화 레벨의 초기치가 결정된다. 종래기술 처리의 수준에 대비하여 ATC 처리를 설명하자면, 스펙트럼 영역에 있는 전체 데이터는 이렇게 형성된 양자화 레벨로 양자화 된다. 스펙트럼 계수의 양자화 값에 상응하는 정수의 귀착분야(resulting field)는 최적 인코더(Optimum encoder), 특히 엔트로피 인코더(entropy encoder)로 직접 인코딩된다.
이렇게 코딩된 데이터의 전장이 이 블록에 유효한 비트수보다 큰 경우에는, 양자화 레벨이 상승되고 인코딩이 다시 한번 실행된다. 이 프로세스는 인코딩에 대한 단지 규정된 수의 비트만이 요구될 때까지 반복된다.
각 블록에 저장되어 있거나 전송된 추가의 정보는,
- 스펙트럼 불균일 분포의 값,
- 유효한 실제 비트의 인코딩을 위하여 요구되는 분산 인수,
- 0으로 양자화된 스펙트럼 계수의 수이다.
더구나, 실제신호 진폭의 값(레벨제어)은 레벨제어가 처리되는 한 전송되어야 한다. 이 추가정보의 값은 아직 정수가 아닌 것까지 전송되어 양자화될 수 있다.
본 발명의 요소는 고정 또는 가변 양자화 레벨을 갖는 선형 양자화기와 비선형 양자화기 둘다, 실례로써 대수 양자화기 또는 소위 MAS 양자화기를 사용해도 된다는 것이다. 더욱이, 양자화 값이 정확히 0이 되도록 하거나 또는 부호비트 코딩된 값에 의하여 표시될 수 있도록 하기 위하여 불균일 레벨수를 대상으로 양자화하는 특수 양자화기를 이용할 수도 있다. 인코딩의 효과는 추가의 측정에 의해 종래의 악음신호에 대해 개량될 수 있다.
고주파수쪽으로 갈수록, 스펙트럼 계수는 소멸되거나, 또는 매우 작아진다. 이 값들은 바람직하게는 개별적으로 카운트되어 부호화될 수 있다. 이 경우에 작은 값의 부호화의 종류와 그 수는 개별적으로 전송될 수 있다.
한 블록의 양자화 스펙트럼 계수를 인코딩하기 위하여 이용가능한 비트 모두가 요구되지 않는 경우에, 그 나머지 비트는 그 다음 블록의 비트수로 카운트된다. 즉, 일부분의 전송이 한 블록에서 일어나고, 반면에 나머지 부분의 변환이 그 다음 블록에서 일어난다. 이 경우에, 그 다음 블록에 얼마나 많은 비트들이 이미 속해 있는가에 대한 정보도 물론 따라서 전송되어야 한다.
더구나, 임계 악음신호중의 교란 가청도는 인코딩시에 심리음향 발견물을 반사시킴으로써 회피될 수 있다. 이 가능성은 다른 프로세스에 대해 본 발명의 프로세스가 갖는 실질적인 장점이다.
이를 위하여, 스펙트럼 계수는 이른바 주파수 그룹들로 분할된다. 이 주파수 그룹들은 각개의 주파수 그룹내의 신호에너지가 동일 주파수 그룹내의 교란 에너지보다 명백히 높은 경우, 또는 교란 에너지가 이 주파수내의 가청도의 절대 한계치보다 작은 경우 심리음향 발견물에 따라 교란의 가청도를 배제할 수 있도록 이 주파수 그룹들을 선택한다. 이를 위하여, 변환후에 각 주파수 그룹들에 대한 신호 에너지는 스펙트럼 계수로부터 먼저 계산되고, 다음에 이것으로부터 허용가능한 교란 에너지가 각 주파수 그룹에 대해 계산된다. 허용가능치는 절대 한계치이며, 이것은 레벨제어의 고정치, 또는 소위 청음 한계치에 비례하며, 어느 값이 더 크냐에 따라, 신호 에너지에 주파수 종속인수를 곱하여 산출된다.
사실상, 스펙트럼 계수는 앞부분에서 설명된 프로세스에 따라 양지화되고 인코딩되어 재구성된다. 각 주파수 그룹에 대한 교란 에너지는 스펙트럼 계수의 원 데이터와 재구성치로부터 산출된다. 한 그룹내의 교란 에너지가 이 그룹과 이 블록에서의 앞에서 산출된 허용가능한 교란 에너지보다 더 큰 경우, 이 주파수 그룹의 값은 상대 교란이 이 주파수 그룹에서 비례하여 더 적어지도록 고정 인수로 곱하여서 증가된다. 다음에, 갱신된 양자화와 인코딩이 일어난다. 이 단계들은 교란의 가청도가 규정될 수 있도록 모든 주파수 그룹에서의 교란이 비교적 적은 값일 때까지, 또는 예를 들어, 몇회의 반복후에 계산을 단축시키기 위하여, 또는 더 이상 개량이 불가능하기 때문에 프로세스를 중단할 때까지 반복적으로 반복된다.
가청도의 한계치를 반영하기 위하여 각 주파수 그룹당 승산인수는 인코딩에 있어서 그 이상의 추가의 정보로써 함께 전송되어야 함을 주목해야 한다.
데이터를 재구성하기 위하여(심리음향 발견물을 고려하든 고려하지 않든간에), 최적으로 인코딩된 값은 실례로 연관기억장치에 의하여, 스펙트럼 계수에 대한 양자화 정수로 우선적으로 디코딩되어야 하며, 필요하다면 적은 값들과 0인 값이 보충되어야 한다. 다음에 이들은 함께 전송된 승산인수와 추가의 값으로 산정된 값과, 또한 필요하다면, 스펙트럼 불균일 분포에 대한 전송치로 산정된 값으로 곱해진다. 다음에, 재구성을 위해 끝수의 반올림만이 필요하다.
발명의 바람직한 실시예
본 발명은 전체적인 발명성의 착상의 범위를 제한코자 하는 의도없이 2개의 바람직한 실시예에 대한 설명은 보다 명백해질 것이다. 이러한 실시예에서 이루어지는 방법은 제1도에 도시된 흐름도의 순서에 따라 이루어진다. 본 발명의 코딩방법은 흐름도에 도시된 것처럼 데이터를 스펙트럼 계수로 변환한후(1)에 이를 양자화하고(2), 양자화된 데이터를 코딩한후(3) 이 양자화 계수를 표시하기 위한 비트수를 체크한후(4)에 이 비트수에 따라 상기 과정을 반복할 것인가(6) 또는 변환된 데이터를 추가 정보와 함께 전송하는 동작(5)을 수행한다. 이러한 동작을 각 단계별로 이후에 상세히 설명한다.
다음의 설명되는 실시예에서는 편의를 위하여 M이 8인 경우를 예를 들어 설명한다. 그러나, 실제로, M은 대표적으로는 256이며, 512 또는 1024가 선택되기도 한다.
제 1 실시예
본 실시예에서 여현변환(cosine transformation)은 음향신호(타임신호)와 스펙트럼치간의 변환으로 이용되며, 그것에 의해서 N=M이다. 이산여현 변환으로 스펙트럼 영역에서 음향신호의 N(=M) 주사치의 변환후에, 예를 들면, 스펙트럼 계수에 대한 값들은 다음과 같다.
-1151 66.4 1860 465 -288 465 -88.6 44.3
이것으로부터, 우선 방정식으로 스펙트럼 불균일 분포(sfm ; spectral nonuniform distribution)가 계산된다.
계산결과는 sfm=0.0045이다. 양자화된 값 sfmq는 다음의 공식에 따라서 smf으로부터 계산된다.
smfq=int(In(1/sfm)/1.8)=3
동반 전송치 sfmq는 값의 범위 0-15의 영역값에 존재하며, 따라서 4비트로 표시될 수 있다. 다음에 첫번째 양자화가, 선택된 바람직한 실시예의 경우에 각각의 스펙트럼 계수의 값들이 값 q1n1에 의해 분할된 주파수 범위에서 일어난다.
q1n1=e(1.8*sfmp)=221
더구나, 심리음향 발견물을 고려하기 위하여, 스펙트럼 계수는 3개의 그룹으로 분할된다.
계수 1-23-45-6
1.32*1063.68*1063.09*106
그리고 허용가능한 교란에 대한 인수들로 분할된다.
0.01 0.1 0.5 청음한계치
0.05*최종치 저주파수에서부터 마스킹하고 시작
따라서 허용가능한 교란이 산출된다.
1.32*105
3.68*105+0.05*1.32*106=4.34*105
1.54+105+0.05*3.68*106=3.38*105
이 방법에 있어서 상수값은 이 블록에 대해 산정되었다.
양자화 레벨 221에 관한 첫번째 인코딩 시도는 다음의 값을 산출한다.
-5.2 0.3 8.4 2.1 -1.3 2.1 -0.4 0.2
또는 다음과 같이 양자화된다.
-5 0 8 2 -1 2 0 0
다음의 엔트로피 인코더로써 인코딩할때, 선택된 실시예에 20비트가 이용가능하다.
양자화 되어야 표시길이양자화 되어야표시길이
할 값 할 값
00151111100 7
11003-51111101 7
-11013611111100 8
211004-611111101 8
-2110147111111100 9
3111005-7111111101 9
-311101581111111100 10
41111006-81111111101 10
-41111016
인코딩에 필요한 비트는 다음과 같다.
7 1 10 4 3 4 1 1
따라서, 총 31비트가 코딩에 필요하다. 그러므로 필요한 비트수는 이용할 수 있는 값보다 더 크다. 이 때문에 제2의 양자화가 시도된다.
선택된 실시예의 경우에, 2로 나누어서 보통의 방법으로 반올림한 제2의 양자화 레벨은 새로운 값을 산출한다.
-3 0 4 1 -1 1 0 0
인코딩에 필요한 비트 :
5 1 6 3 3 3 1 1
따라서, 총 32비트가 필요하므로 20비트의(규정된) 표시길이 이하로 유지하기 위하여 또 한번의 양자화가 필요하다.
제3의 양자화 준위에서 한번 더 2로 나누고 반올림한다 :
-1 0 2 1 0 1 0 0
이 값들을 인코딩하는데 필요한 비트 :
3 1 4 3 1 3 1 1
필요한 비트수는 17개이다. 따라서, 규정된 값 이하이므로 인코딩은 비트수에 관하여는 성공적이다. 인코딩의 유용성을 검토하기 위하여, 상기 값을 전송측에서 재구성하는 것에 의해 인코딩을 검토한다.
재구성 :
인수 : 2*2*221=884
재구성치 :
-884 0 1768 884 0 884 0 0
계수당 인코딩 에러(차)
267 -66.4 -92 419 288 88.6 -44.3
주파수 그룹당 인코딩 에러(합 x2그룹당)
7.57*1041.84*1052.68*105
인코딩 에러는 각 주파수 그룹에서 허용 교란치보다 적으므로, 이 레벨에 있는 값들이 실제로 인코딩되어 전송된다.
레벨인수(전송에 선행한 노르밍(Norming))4비트
smf34비트
인코딩에 관한 승수25비트
승수 외축 루프(교란에너지가 너무 클때) 0,0,03*3비트
부호화된 값 : 1010110010001000017비트
제3의 양자화 준위에 있어서, 전송된 값은 이제 전송되거나 또는 기억저장될 수 있다. 전송될 사이드 정보는 세번째 인코딩 시도가 성공적이었다는 것이다.
다음에 부호화된 값의 재구성이 설명된다 :
(i) 인코딩된 비트 시퀸스로부터 양자화 값을 재구성함 :
결과 : -1 0 2 1 0 1 0 0
(ii) 외부 루프에 승산의 수가 주어질 때마다, 각 주파수 그룹을 인수로 나눔 :
(예 : 제2의 주파수 그룹 1*)
결과 : -1 0 2/3 1/3 0 1 0 0
(iii) 인코딩에 제산이 요구될 때마다, 인수로 곱함 :
(예에서 2*, 가정된 인수는 2이므로)
결과 : -4 0 8/3 4/3 0 4 0 0
(iv) sfm의 양자화 값(여기서는 3)에서, 제1의 양자화 준위가 다시 산출된다(여기서 221), 계수는 이값으로 곱셈되고 반올림된다(여기에는 도시하지 않았음) :
결과 : -884 0 589 295 0 884 0 0
따라서, 외부 루프가 다시 실행되어질 것으로, 즉 정정(제2의 주파수 그룹에서)이 필요한 것으로 가정되었을때 최초에 주어진 것과 다른 값들이 산출된다.
(v) 역변환(이산여현변환, 여기에는 도시하지 않았음)
(vi) 레벨제어 출력부(또한 ATC로서)
(vii) 이전의 블럭과 중복됨(출력부 윈도우임)
제2실시예
이후에 설명되는 제2의 바람직한 실시예는 각개의 블럭이 주파수 누화(얼라이어싱)를 감소시키기 위하여 반블럭 길이만큼 중복되는 부가적인 특징을 갖는다. 이를 위하여 음향신호의 주사치는 입력버퍼에서 윈도우 함수(분석윈도우)에 의하여 곱해지며, 수신측에서 부호화, 복호화 되어, 다시 윈도우 기능(합성윈도우)이 곱해지고 상호 중복하는 영역이 가산된다.
이후에 설명되는 바람직한 실시예의 경우에, 시간영역 얼라이어싱 캔슬레이션(time domain aliasing cancellatio)(TDAC) 프로세스가 적용되며, 상기 프로세스에서 전송된 값들의 수는 반블럭 길이만큼의 윈도위의 중복에도 불구하고 시간영역에서의 값들의 수와 같다. TDAC 프로세스에 관한 상세는 실례로서, 음향 스피치 및 신호 진행에 대한 국제회의의 IEEE 회보에 있는 시간영역 얼라이어싱 캔슬레이션에 기초한 필터 뱅크 디자인을 이용하는 서브밴드/변화코딩(Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation in IEEE Proceeding of Interm. Conf. on Acoustic Speech and Signal Proceeding, 1987, pp. 2161 ff.)을 참조하면 된다.
음향신호에 대해 구성된 윈도우의 제1의 8개의 주사값은 다음의 값들로 곱해진다(윈도우 함수) :
0.1736 0.3420 0.5 0.6428 0.7660 0.8660 0.9397 0.9848
따라서, 윈도우의 제2의 8개의 값은 윈도우함수의 반영된 값으로 곱해진다. 최종 데이터 블록의 음향 신호의 주사값은 실예로써 다음의 값들과
607 541 484 418 337 267 207 154
그리고 인접 데이터 블록의 다음 값들을 가지면 된다 :
108 61 17 -32 -78 -125 -174 -249
8개의 값들을 중복시켜서 전술한 윈도우 함수에 의하여 승산된 후에 다음의 값들이 산출된다 :
105.4 185.0 242.0 268.7 258.1 231.2 194.5 151.6
106.3 57.3 14.7 -24.5 -50.1 -62.5 -59.5 -43.2
TDAC 변환 알고리즘을 윈도우 처리된 16개의 값에 적용한 후에, 구성된 윈도우의 16개의 주사값(N=16)들 대신에 단지 8개의 스펙트럼 값(M=8)들만 받아들인다 :
43.49 170.56 152.3 -38.0 -31.4 -0.59 23.1 6.96
이제 동일 몫이 감산된다. 본 실시예에서, 주파수 그룹의 제1의 값은 다른 값들과 동일한 크기의 것이므로 양자화 동일몫은 0이다
TDAC 변환에 의해 얻어진 스펙트럼 값으로부터, 우선적으로 스펙트럼 불균일 분포 sfm이 방정식 sfm=...을 이용하여 다시 계산되고 sfm=0.2892가 산출된다.
sfm으로부터 다음의 방정식을 이용하여 양자화 값 sfmq가 다시 한번 계산된다.
sfmq=int(In(1/sfm))/1.8=1
qini=6.05
이 실시예에서, 비트수는 25개로 가정되어야 한다.
제1의 양자화 레벨에 있어서, 스펙트럼 값은 qini=6.05로 나누어져,
7.18 28.20 25.17 -6.28 -5.19 -0.097 3.8 1.15
를 산출한다.
또는 아래와 같이 양자화된다.
7 28 25 -6 -5 0 4 1
제1의 실시예에 사용된 엔트로피 인코더에서 값들을 나타내는데 필요한 비트수는 명백히 보인 바와 같이 규정된 비트수보다 더 크다. 더욱이, 엔트로피 인코딩의 범위를 초과하는 값들이 있다. 이것은 그 이상의 양자화가 필요한 기준역할을 한다.
따라서, 2*6.05로 나눗셈하여 제2의 양자화가 시도되어 다음의 값을 산출한다.
3.59 14.09 12.59 -3.14 -2.59 -0.48 1.90 0.575
4 14 13 -3 -3 0 2 1
이 단계에서, 엔트로피 인코더의 비트의 수 또는 범위가 초과되므로, 2*2*6.05로 나눗셈하여 제3의 양자화가 시도되어 다음과 값을 산출한다 :
1.79 7.04 6.29 -1.57 -1.29 -0.024 0.95 0.28
2 7 6 -2 -1 0 1 0
이제 제1실시예에서 규정된 엔트로피 인코더에 대한 비트수는,
4 9 8 4 3 1 3 1
이다.
필요한 총 비트수는 33개이므로 규정된 범위를 초과한다 :
제4의 단계에서 2*2*2*6.05로 나눗셈하여 다음의 값을 산출한다.
0.90 3.52 3.14 -0.78 -0.65 -0.12 -0.48 0.14
1 4 3 -1 -1 0 0 0
코딩을 위하여 다음의 비트수가 필요하다.
3 6 5 3 3 0 0 0
총 비트수는 23개이며, 따라서 규정된 범위 이내의 수이다.
그 이상의 모드의 절차는 제1실시예와 관련하여 설명한 것과 유사하다. 또한, 다음의 것이 지적되어야 한다. 여기서 0인 값들이 고주파수(여기서 33*0)에서 여분으로 카운트되어 개별적으로 전달되지 않는 경우, 20비트면 이미 충분하다. 제1실시예의 경우에서처럼, 양자화 에러를 검토하기 위하여 재구성이 뒤따른다. 이를 위하여 인코딩된 값이 인수로 곱해진다.
23*6.05=48.397
다음의 값들이 산출된다.
48.39 193.59 145.19 -48.39 -48.39 0 0 0
따라서, 각각의 스펙트럼 계수의 코딩 에러는,
-4.9 23 -7.11 10.39 16.99 -0.59 23.1 6.96
이다.
따라서, 주파수 그룹당 에러로써 산출한다(∑x2)
553158.5289.00
(1-2)(3-4)(5-6)
이전의 실시예의 경우에서처럼 허용교란치가 계산된다.
에너지 : 계수 1-23-45-6
3098224639986
전술한 실시예에서와 동일한 방법으로 계산되는 허용교란치에 대한 인수는 다음과 같다.
0.10.10.5
+0.05*최종치0.005*최종치
이것은 실시예에서 산출한다.
3098.2
2463.9+0.05*3098.2=2618.8
493+0.05=2463.9=616.2
허용고란치는 결코 초과되지 않았다.
재구성(디코더)은 이후에 간단히 설명된다.
(i) 양자화 값의 재구성
허프만(Huhhmann)디코더 : (예)
비트 커런트 :
0001 0011 10011110011100101101000xx
sfmq=1에 대해 4비트 승수에 대해 4비트 스펙트럼 계수에 대해 25비트
코드는 어떤 워드도 다른 것의 제1워드가 되지 않도록 선택된다(FANO 상태, 문헌에서 알 수 있음). 이 때문에 비트 커런트로부터 양자화 값은 가능한 코드워드로서 회복될 수 있다.
sfmq=1 <qini=6.05
승수=3 <양자화 준위=6.05*23=48.937
양자화 스펙트럼 값은 아래와 같다.
1 4 3 -1 -1 0 0 0
이 값들은 외부 루프의 정정에러치(이 실시예에서는 항상 1)로 나누어지며, 다음에 양자화 레벨(48.39)로 곱해져서
48.39 193.59 145.19 -48.39 -48.39 0 0 0
을 산출한다.
역변환 후에 16개의 값들이 다시 얻어진다.
-56.42 -11.35 7.20 2.57 -2.57 -7.20 11.35 56.42
61.45 -2.47 -62.24 -73.30 -73.30 -62.24 -2.47 61.45
이 값들은 송신기(transmitter side)에서처럼 동일한 윈도우함수로 윈도우 되어,
-9.79 -3.88 3.60 1.65 -1.96 -6.23 10.66 55.5
60.5 -2.3 -53.9 -56.1 -47.1 -31.1 -0.05 10.67
을 산출한다.
최종 단계로부터 산출된 값(마지막 8개의 값)은 중간 기억장치(intermediated storage)에 저장된다.
615.0 544.0 478.6 411.2 345.1 276.3 198.1 108.4
이 값들은 처음의 8개의 값과 중복(overlaped)된다. 즉, 상기 값들이 가산된다. 그 결과, 즉 타임신호는 처음의 8개의 값을 중간 기억장치에 있는 값들에 가산하므로서 산출된다.
605.2 540.1 475 409.55 343.14 270.07 208.76 163.9
제2의 8개의 값들은 중간 기억장치에 저장된다.
비교를 위하여, 입력치들이 주어진다.
607 541 484 418 337 267 207 154
원 데이터(original data)와 재구성된 데이터(reconstructed data)간의 뛰어난 일치성을 명백하게 알 수 있다. 본 발명은 전체적인 발명성의 착상의 범위와 정신을 한정하지 않으면서 바람직한 실시예들을 참조하여 앞에서 설명되었다. 물론, 전체적인 발명성의 착상의 범위와 정신의 범주내에서 많은 변경과 수정이 가능하다.
양자화는 반드시 값을 나눗셈하고 다음에 정수값으로 반올림하는 것에 의해서 일어날 필요는 없다. 물론 비선형 양자화도 가능하다. 이것은 실례로써 테이블과 비교하여 그 결과로서 일어날 수 있다. 대수 양자화와 맥스 양자화의 가능성은 예로써 언급된다. 우선 전치보상을 행하고 다음에 선형 양자화시키는 것도 가능하다. 더욱이, 전송될 음향신호의 통계에 적합하도록 설계된 인코더가 최적 인코더로 사용될 수 있다.
끝으로, 대표적인 실제값들은 여기에 쓰인 값들과는 매우 다르다는 것을 지적하고자 한다. 실제 값의 예로서는 다음과 같다.
블록길이 : 512개의 값
윈도우길이 : 32개의 값
주파수 그룹의 값 : 27
주변정보 : 레벨제어4비트
sfm 4비트
승산인수/인코더6비트
승산인수/주파수 그룹27*3비트
수 값=09비트
수 값<19비트
인코더의 승산인수 1.189=sqrt(sqrt(2))
주파수 그룹의 승산인수 3
본 발명의 프로세서는 신호 프로세스로써 실현될 수 있다. 따라서, 회로구현의 상세한 설명은 생략한다.

Claims (15)

  1. 음향신호 특히 악음신호의 전송 및/또는 저장을 위한 디지탈 코딩방법에 있어서, 음향신호의 N 주사치가 M 스펙트럼 계수로 변환되는 단계(1) ; 상기 M 스펙트럼 계수를 양자화하는 단계(2) ; 상기 양자화된 스펙트럼 계수를 인코더를 이용하여 인코딩하는 단계(3) ; 상기 인코딩 데이터로부터 상기 양자화 스펙트럼 계수를 표시하기 위하여 요구되는 비트수를 체크하는 단계(4) ; 상기 비트수와 규정된 비트수가 일치하지 않는 경우, 표시에 요구되는 비트수가 상기 규정된 비트수에 도달할 때까지, 변경된 양자화 레벨을 이용하여 상기 양자화와 상기 인코딩을 반복하는 단계(6) ; 및 상기 요구된 레벨이 데이터 비트에 추가로 전송 및/또는 저장되는 단계(5)를 포함하는 것을 특징으로 하는 디지탈 코딩방법.
  2. 제1항에 있어서, 상기 비트수가 상기 규정된 범위내에 있는 양자화 레벨은 한정된 양자화 레벨로부터 선택되고 변경된 양자화 레벨에 의해 반복적으로 양자화되며, 최적 인코더에 의하여 코딩된 두 코딩에 필요한 상기 비트수를 체크하는 것에 이용되는 것을 특징으로 하는 디지탈 코딩방법.
  3. 제1항에 있어서, 상기 인코더는 엔트로피 인코더인 것을 특징으로 하는 디지탈 코딩방법.
  4. 제1항 또는 제2항에 있어서, 상기 실제 신호진폭, 상기 스펙트럼 불균일 분포, 상기 규정된 비트의 범위내에서 코딩을 위한 상기 승산인수 및/또는 0으로 양자화된 상기 스펙트럼 계수의 수들에 대한 추가 값을 전송하는 것을 특징으로 하는 디지탈 코딩방법.
  5. 제1항 또는 제2항에 있어서, 상기 코딩은 각 레벨에서 상기 신호에 의한 관계에 따라 이루어지는 것을 특징으로 하는 디지탈 코딩방법.
  6. 제1항 또는 제2항에 있어서, 상기 양자화는 선형 및/또는 비선형인 것을 특징으로 하는 디지탈 코딩방법.
  7. 제6항에 있어서, 상기 양자화는 첫 단계에서는 대수 또는 선형이며, 다음 단계에서는 선형인 것을 특징으로 하는 디지탈 코딩방법.
  8. 제7항에 있어서, 상기 양자화는 맥스 양자화기(Max Quantizer)에 의하여 이루어지는 것을 특징으로 하는 디지탈 코딩방법.
  9. 제1항에 있어서, 상기 변환은 이산여현 변환, TDAC 변환 또는 퓨리에 변환인 것을 특징으로 하는 디지탈 코딩방법.
  10. 제1항에 있어서, 상기 스펙트럼 계수중 고주파수에서 사라지는 스펙트럼 계수는 별도로 분리되어 카운트되고 인코딩되는 것을 특징으로 하는 디지탈 코딩방법.
  11. 제1항에 있어서, 요구되지 않는 상기 비트의 수는 다음 블록으로 전달되는 것을 특징으로 하는 디지탈 코딩방법.
  12. 제1항 또는 제2항에 있어서, 양자화 에러의 가청도 임계치는 심리음향 발견물에 따라 연속적으로 계산되고, 상기 스펙트럼 값은 교란의 가청도를 제거하기 위하여 정정되는 것을 특징으로 하는 디지탈 코딩방법.
  13. 제1항 또는 제2항에 있어서, 등가 부분(첫번째 스펙트럼 계수)이 감산되는 것을 특징으로 하는 디지탈 코딩방법.
  14. 제1항 또는 제2항에 있어서, 윈도우 기술을 적용하는 것을 특징으로 하는 디지탈 코딩방법.
  15. 음향신호 특히 악음신호의 전송 및/또는 저장을 위하여 음향신호의 N 주사치가 M 스펙트럼 계수로 변환되는 단계(1) ; 상기 M 스펙트럼 계수를 양자화하는 단계(2) ; 양자화된 스펙트럼 계수를 인코딩하는 단계(3) ; 상기 인코딩 데이터로부터 상기 양자화 스펙트럼 계수를 표시하기 위하여 요구되는 비트수를 체크하는 단계(4) ; 상기 비트수와 규정된 비트수가 일치하지 않는 경우, 표시에 요구되는 비트수가 규정된 비트수에 도달할 때까지, 양자화와 인코딩이 변경된 양자화 레벨을 이용하여 추가 단계에서 반복하는 단계(6) ; 및 요구된 양자화 레벨이 데이터 비트에 추가로 전송 및/또는 저장되는 단계(5)를 포함하여 인코딩된 음향신호를 디코딩하기 위한 방법에 있어서, 상기 인코딩된 값들을 상기 스펙트럼 계수에 대해 양자화된 정수에서 디코딩하는 단계 ; 필요하다면 0인 값 또는 상기 0값에 근사한 값을 추가하는 단계 ; 상기 산출된 값들을 함께 전송되었던 상기 승산인수 뿐만 아니라 상기 스펙트럼 불균일 분포에 대한 값으로 승산하는 단계 ; 상기 승산된 결과에 대하여 역변환을 실행하는 단계 ; 및 상기 변환된 값들에 대하여 선택된 윈도우잉에 해당하는 시간영역에서 중복하는 단계를 포함하여 음향신호를 디코딩하는 것을 특징으로 하는 디지탈 신호 디코딩방법.
KR1019880700459A 1986-08-29 1987-08-29 디지탈 코딩방법 KR960012471B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE3629434A DE3629434C2 (de) 1986-08-29 1986-08-29 Digitales Codierverfahren
DEP3629434.9 1986-08-29
PCT/DE1987/000384 WO1988001811A1 (en) 1986-08-29 1987-08-29 Digital coding process

Publications (2)

Publication Number Publication Date
KR880702011A KR880702011A (ko) 1988-11-05
KR960012471B1 true KR960012471B1 (ko) 1996-09-20

Family

ID=6308482

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019880700459A KR960012471B1 (ko) 1986-08-29 1987-08-29 디지탈 코딩방법

Country Status (6)

Country Link
EP (1) EP0287578B1 (ko)
JP (1) JP2796673B2 (ko)
KR (1) KR960012471B1 (ko)
AT (1) ATE126413T1 (ko)
DE (2) DE3629434C2 (ko)
WO (1) WO1988001811A1 (ko)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3881869D1 (de) * 1987-10-06 1993-07-22 Fraunhofer Ges Forschung Digitales adaptives transformationscodierverfahren.
US5742735A (en) * 1987-10-06 1998-04-21 Fraunhofer Gesellschaft Zur Forderung Der Angewanten Forschung E.V. Digital adaptive transformation coding method
USRE40280E1 (en) 1988-12-30 2008-04-29 Lucent Technologies Inc. Rate loop processor for perceptual encoder/decoder
AU631404B2 (en) * 1989-01-27 1992-11-26 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder and encoder/decoder for high-quality audio
DE3943881B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
DE3914267A1 (de) * 1989-04-29 1990-10-31 Thomson Brandt Gmbh Signalverarbeitungssystem fuer digitalsignale
WO1991014162A1 (en) * 1990-03-13 1991-09-19 Ichikawa, Kozo Method and apparatus for acoustic signal compression
DE4135977C2 (de) * 1991-10-31 1996-07-18 Fraunhofer Ges Forschung Verfahren zur gleichzeitigen Übertragung von Signalen aus N-Signalquellen
DE4136825C1 (ko) 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0559348A3 (en) 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
DE4211945C1 (ko) * 1992-04-09 1993-05-19 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
DE4217276C1 (ko) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
EP2282310B1 (en) 2002-09-04 2012-01-25 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
KR101418248B1 (ko) 2007-04-12 2014-07-24 삼성전자주식회사 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치
US7961507B2 (en) 2008-03-11 2011-06-14 Micron Technology, Inc. Non-volatile memory with resistive access component
US8219409B2 (en) 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310480C2 (de) * 1983-03-23 1986-02-13 Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen Digitales Codierverfahren für Audiosignale
DE3587251T2 (de) * 1984-12-20 1993-07-15 Gte Laboratories Inc Anpassbares verfahren und vorrichtung fuer sprachkodierung.

Also Published As

Publication number Publication date
DE3629434C2 (de) 1994-07-28
ATE126413T1 (de) 1995-08-15
DE3751449D1 (de) 1995-09-14
WO1988001811A1 (en) 1988-03-10
JP2796673B2 (ja) 1998-09-10
EP0287578A1 (de) 1988-10-26
KR880702011A (ko) 1988-11-05
JPH01500695A (ja) 1989-03-09
DE3629434A1 (de) 1988-03-03
EP0287578B1 (de) 1995-08-09

Similar Documents

Publication Publication Date Title
KR960012471B1 (ko) 디지탈 코딩방법
US5357594A (en) Encoding and decoding using specially designed pairs of analysis and synthesis windows
AU644170B2 (en) Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio
Pan Digital audio compression
JP3093179B2 (ja) 高品質オーディオ用短時間遅延変換エンコーダ及びデコーダ
KR100420891B1 (ko) 디지탈신호엔코딩/디코딩방법및장치와기록매체
US5825310A (en) Signal encoding method
KR100458969B1 (ko) 신호부호화또는복호화장치,및신호부호화또는복호화방법
KR100304055B1 (ko) 음성 신호 부호화동안 잡음 대체를 신호로 알리는 방법
KR100368854B1 (ko) 디지털신호의부호화장치,그의복호화장치및기록매체
US6604069B1 (en) Signals having quantized values and variable length codes
US7428489B2 (en) Encoding method and apparatus, and decoding method and apparatus
AU2007250308A1 (en) Information signal coding
JPH07336232A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100330290B1 (ko) 신호부호화장치,신호복호화장치,및신호부호화방법
US5924060A (en) Digital coding process for transmission or storage of acoustical signals by transforming of scanning values into spectral coefficients
Honda et al. Bit allocation in time and frequency domains for predictive coding of speech
US6199038B1 (en) Signal encoding method using first band units as encoding units and second band units for setting an initial value of quantization precision
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JP3557674B2 (ja) 高能率符号化方法及び装置
KR20000023852A (ko) 오디오 신호 부호화 장치, 복호화 장치 및 오디오 신호 부호화, 복호화 방법
JP3297050B2 (ja) デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置
US5687281A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US5588089A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100630

Year of fee payment: 15

EXPY Expiration of term