KR100293855B1 - 고능률디지털데이터부호화및복호화장치 - Google Patents

고능률디지털데이터부호화및복호화장치 Download PDF

Info

Publication number
KR100293855B1
KR100293855B1 KR1019920703022A KR920703022A KR100293855B1 KR 100293855 B1 KR100293855 B1 KR 100293855B1 KR 1019920703022 A KR1019920703022 A KR 1019920703022A KR 920703022 A KR920703022 A KR 920703022A KR 100293855 B1 KR100293855 B1 KR 100293855B1
Authority
KR
South Korea
Prior art keywords
block
encoding
circuit
bits
data
Prior art date
Application number
KR1019920703022A
Other languages
English (en)
Other versions
KR930700945A (ko
Inventor
쯔쯔이교야
시모요시오사무
Original Assignee
이데이 노부유끼
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP03091183A external-priority patent/JP3089690B2/ja
Priority claimed from JP03091185A external-priority patent/JP3089691B2/ja
Application filed by 이데이 노부유끼, 소니 가부시끼 가이샤 filed Critical 이데이 노부유끼
Publication of KR930700945A publication Critical patent/KR930700945A/ko
Application granted granted Critical
Publication of KR100293855B1 publication Critical patent/KR100293855B1/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Complex Calculations (AREA)
  • Selective Calling Equipment (AREA)
  • Emergency Protection Circuit Devices (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

입력 디지탈 데이타가 다수의 샘플에 의해서 블록으로 배열되고 직교 변환이 적응 비트수로 부호화되는 계수 데이타를 발생하도록 각 블록내에 수행되는 고능률 부호화에 의해서 입력 디지탈 데이타를 부호화하기 위한 고능률 디지탈 데이타 부호화 장치가 제공된다. 상기 장치는 상이한 블록 길이를 가진 입력 디지탈 데이타의 직교 변환을 수행하는 다수의 직교 변환 유니트를 포함한다. 직교 변환 유니트로부터의 출력 중 하나만이 직교 변환 유니트의 출력에 기초하여 선택된다. 고능률 디지탈 데이타 부호화 장치에 있어서, 입력 디지탈 데이타는 다수의 대역으로 분할되고, 다수의 샘플로 구성된 각 블록은 각 대역에 형성되고 직교 변환은 부호화되어 있는 계수 데이타를 발생 하도록 대역의 각 블록에 수행된다. 상기 장치는 각 대역의 직교 변환전에 블록 데이타의 특성에 기초하여 각 대역의 직교 변환을 위해 블록 길이를 결정하는 블록 길이 결정회로를 구비한다. 각 대역의 직교 변환은 블록 길이 결정 회로에 의해서 결정된 블록 길이에 따라 수행된다. 고능률 디지탈 데이타 부호화 장치는 또한 입력 디지탈 데이타를 주파수 분석하는 주파수 분석 유니트와; 주파수 분석 유니트로부터 다수의 출력 데이타를 구성하는 각 블록의 에너지를 결정하고 블록마다의 베이식상의 에너지에 기초하여 허용 노이즈 레벨을 설정하는 노이즈 레벨 설정 유니트와; 주파수 분석 유니트로부터 다수의 출력 데이타를 구성하는 각 블록의 최대값 데이타에 기초하여 플로팅 계수를 계산하는 플로팅 계수 계산 유니트와; 주파수 분석 유니트의 출력을 부호화하는 부호화 유니트와; 노이즈 레벨 설정 유니트의 출력 및 플로팅 계수 계산 유니트의 출력에 기초하여 부호화 유니트에 의해서 부호화할 때 할당된 비트수를 결정하는 할당 비트수 결정 회로를 구비한다.

Description

고능률 디지탈 데이타 부호화 및 복호화 장치
본 발명은 이른바 고능률 부호화에 의해 입력 디지탈 데이타를 부호화하는 고능률 디지탈 데이타 부호화 및 복호화 장치에 관한 것이다.
시간축상의 오디오 신호등을 부호화를 위해 다수의 주파수 대역으로 분할하는 서브-대역 코딩(SBC)과 시간축의 신호를 주파수축의 신호로 변환하고 다수의 주파수 대역으로 분할하여 각 대역에서 부호화하는 변환 코딩(ATC)과 시간축의 신호를 다수의 대역으로 분할하고 상기 대역 신호를 기저대 신호로 변환하는 예측 코딩을 위해 다수의 선형 예측 분석을 수행하는 적응 예측 코딩(APC)을 SBC에 결합하는 적응 비트 할당(APC-AB)과 같은, 오디오 또는 음성의 다양한 고능률 부호화 방법이 있다.
서브-대역 코딩에 있어서, 예를 들면, 신호가 다수의 대역으로 분할되며, 각 대역의 신호는 직교 변환에 의해 주파수축상의 신호로 직교 변환된 후, 부호화는 각 대역에서 수행된다. 직교 변환을 수행할 때, 입력 비디오 신호는 소정의 단위 시간(프레임) 간격으로 블록화될 수도 있으며, 이산 코사인 변환은 시간축의 신호를 주파수의 신호로 변환시키는 각 블록에서 수행될 수도 있다. 다수의 대역으로 분할할 때, 인간의 청각 특성이 고려될 수도 있다. 그러므로, 오디오 신호는 다수의 대역(예를 들면 25)으로 분할되고, 대역폭은 기준 대역으로 공지된 것보다 더 높은 대역일 수도 있다. 서브-대역 코딩시, 각 대역에 할당되는 비트수는 단위시간 블록 당 비트수를 일정하게 유지하면서 압축 능률을 향상시키기 위해 적절하게 변화된다.
예를 들면, 비트 할당에 의해 DCT 처리 동작으로부터 DCT 계수 데이타를 부호화할 때, 각 블록에 대해 DCT 처리 동작에서 생긴 각 대역용 DCT 계수 데이타는 동적으로 할당된 비트수로 부호화된다.
고능률 부호화에서, 인간의 청각 특성을 고려한 이른바 마스킹 효과를 사용하는 고능률 부호화 기술이 이용된다.
마스킹 효과는 임의의 신호가 다른 신호에 의해 마스크되어 알아들을 수 없는 현상을 의미한다. 그러므로, 마스킹 레벨 아래의 노이즈는 참을 수 있다. 마스킹 효과는 할당된 비트수가 비트 비율을 감소시키기 위해 참을 수 있는 노이즈 레벨 아래로 신호 성분이 감소되는 것을 고려한다.
이러한 부호화에서, 입력 오디오 신호가 다수의 대역으로 분할되고 DCT 같은 직교 변환이 각 대역에서 수행된다면, 즉, 주파수 분석이 각 대역에서 수행된다면, 각 대역의 신호는 소정의 단위시간 간격에서 블록으로 분할되며 직교 변환은 각 대역의 각 블록에서 수행된다.
다른 한편, 직교 변환에 의해 발생된 계수 데이타 (DCT 계수 데이타)는 부호화되고, 부호화 시에 할당된 비트수는 소정 시간단위로 각 블록에 대해 할당된다.
그 동안, 입력 오디오 신호는 레벨에서 실질적으로 변동이 없는 고정 신호를 필요로 하지 않음으로 신호 레벨은 가지각색으로 변화된다. 예를 들면 신호는 피크 레벨이 한 프레임내에서 연속적으로 변화되는 신호로 일시적으로 변화될 수도 있다. 예를 들면, 신호가 충돌 기구로부터 충돌 음의 오디오 신호라면, 충돌 음의 신호는 일시적으로 변화된 신호가 된다.
고정적에서 일시적으로 또는 그 반대로 특성이 변화된 오디오 신호가 프레임 단위에서 각 블록의 직교 변환에 의해 일치하게 처리되면, 부호화는 신호 특성에 적합하지 않으며, 복호화 후 음질은 청각에 최적하지 않다.
허용 가능한 노이즈 레벨을 사용하는 부호화가 수행될 때, 부호화에 할당된 비트수는 블록에서의 에너지 비율(또는 차이) 및, 블록에서의 에너지로부터 발견된 마스킹 양을 확인하는 참을 수 있는 노이즈 레벨을 기초로 하여 결정된다.
그러나, 오디오 신호들 중에 음(tone)(음조가 높은 신호들)의 특성을 갖는 신호들이 존재한다. 음조가 높은 신호들을 갖는 경우, 상기 블록마다의 에너지에 기초한 비트 할당이 정확하게 계산될 수 없다. 즉, 각 블록의 데이타가 고음인 경우와 그렇지 않은 경우에 주어진 블록내의 에너지가 같을 수 있다. 이와같은 경우, 데이타 특성이 블록마다 다르다는 사실에도 불구하고 동일한 에너지에 기초하여 비트 할당을 위한 계산을 하는 것은 바람직하지 않다. 무엇보다도 먼저, 상기 음조가 높은 신호들에 대해서 정확한 비트 할당이 불가능하고, 그러써 음질 열화의 원인으로 되는 일이 있다. 즉, 음조가 높은 신호부분에는 대다수의 비트들이 필요하게 된다는 사실에도 불구하고, 상기 에너지에 기초로 한 비트수가 계산되는 경우 상기 요구된 비트수는 상기 음조가 높은 신호부분에 할당될 수 없기 때문에, 그로써 다시 신호 음질의 열화가 발생하게 된다.
상술한 바와 같은 실정에 감안하여, 본 발명의 목적은 입력 오디오 신호들의 특성 또는 성질에 보다 적합한 고능률의 압축 부호화가 달성되고, 인간의 청각에 보다 적합한 복호화 신호들이 발생되는 고능률 디지털 데이터 부호화 장치를 제공하는데 있다.
본 발명의 또한 목적은 음조(tonality)가 높은 신호들일지라도, 양호한 비트 할당이 달성되어, 음질(sound quality)을 향상시킬 수 있는 고능률 디지털 데이터 부호화 및 복호화 장치를 제공하는데 있다.
발명의 기술
본 발명에 따라서, 상이한 블록 길이를 갖은 입력 디지탈 데이타의 직교 변환을 수행하는 다수의 직교 변환 수단을 구비하며, 입력 디지탈 신호가 다수의 샘플에 의해 블록에 배열되며, 직교 변환은 계수 데이타를 발생하도록 각 블록에서 수행되고 상기 계수 데이타는 적절한 비트수로 부호화되는 고능률 디지탈 데이타 부호화 장치에 있어서, 상기 직교 변환 수단으로부터 출력된 출력만이 상기 직교 변환 수단의 출력을 기초로하여 선택되는 특징이 있다.
본 발명에 따라서, 각 대역의 직교 변환 이전에 블록 데이타의 특성을 기초로한 각 대역의 직교 변환을 위해 블록 길이를 결정하는 블록 길이 결정 회로를 구비하며, 상기 입력 디지탈 데이타가 다수의 대역으로 분할되고, 다수의 샘플로 구성된 각 블록은 각 대역에서 형성되고, 직교 변환은 부호화된 계수 데이타를 발생하기 위해 대역의 각 블록에서 수행되는 고능률 디지탈 데이타 부호화 장치에 있어서, 각 대역의 상기 직교 변환은 상기 블록 길이 결정 회로에 의해 결정되 블록 길이에 따라 수행되는 특징이 있다.
각 직교 변환 수단에 제공된 입력 디지탈 데이타는 각 기준 대역의 데이타일 수도 있다. 예를 들면 직교 변환은 이산 코사인 변환(DCT) 또는 고속 퓨리에 변환(FFT)일 수도 있다. 이러한 경우, 그것은 부호화된 계수 데이타이다.
블록 길이 설정 또는 출력을 선택할 때, 직교 변환 수단으로부터 출력을 부호화하는데 필요한 할당 비트수(즉, 소정의 음질을 실현하는데 필요한 비트수)를 최소화하는 직교 변환 수단의 출력만이 선택되는 처리가 이루어진다. 직교 변환으로부터의 데이타가 부호화된 후 직교 변환 수단으로부터 출력된 한 프레임 씩의 비트수가 소정의 수인 것을 유의해야 한다. 그러나, 부호화동안 적절한 비트 할당이 달성되기 때문에 부호화하는데 필요한 비트수는 소정의 한 프레임씩의 비트수와 다를 수도 있다.
그러므로, 부호화하는데 필요한 비트수가 소정의 비트수 보다 작다면, 나머지 비트수는 더 적절한 부호화를 수행하는데 사용될 수도 있으며, 그 결과, 최소한의 비트수가 제공되는 직교 변환 수단의 출력을 선택함으로써, 최적한 부호화 출력이 발생될 수 있다. 한편, 부호화를 하는데 필요한 비트수가 소정의 한 프레임씩의 비트수 보다 클지라도, 부호화에 기인한 최소한의 왜곡을 갖는 부호하된 출력은 최소한의 비트수를 제공하는 직교 변환 수단의 출력을 선택함으로써 달성될 수도 있다.
본 발명에 따라서, 입력 디지탈 데이타를 주파수 분석하는 주파수 분석 수단과, 상기 주파수 분석 수단으로부터 다수의 출력 데이타로 구성된 각 블록의 에너지를 결정하며, 한 블록상에서의 에너지를 기초로 하여 참을 수 있는 노이즈 레벨을 설정하는 노이즈 레벨 설정 수단과, 상기 주파수 분석 수단으로부터 다수의 출력 데이타로 구성된 각 블록에서 최대 값의 데이타를 기초로 하여 플로팅 계수를 계산하는 플로팅 계수 계산 수단과, 상기 주파수 분석 수단의 출력을 부호화하는 부호화 수단과, 상기 플로팅 계수 계산 수단의 출력 및, 상기 노이즈 레벨 설정 수단의 출력을 기초로 하여 상기 부호화 수단에 의해 부호화할 때 할당된 비트수를 결정하는 할당 비트수 결정 회로를 구성하는 고능률 디지탈 데이타 부호화 장치가 제공된다.
직교 변환 이전에 블록 데이타 또는 프레임의 특성 및 성질 사이에 프레임내 신호의 일시적 또는 고정적 특성이 있다.
신호의 일시적 또는 고정적 특성은 직교 변환 이전에 프레임내 샘플값 또는 프레임내 샘플의 상한에서 시간 변화의 계산된 값, 또는 프레임에서 에너지 시간 변화의 계산된 값을 기초로 하여 검색된다. 그러므로, 본 발명에서, 각 범위 또는 대역에서 직교 변환의 블록 길이는 고정적 또는 일시적 신호를 기초로하여 얻어진 값에 따라 변화된다. 대역 분할은 이른바 기준 대역에 따라 이루어질 수도 있다.
직교 변환에 의해 입력 디지탈 데이타를 특정 데이타 또는 고속 퓨리에 변환(FET)으로 변환시키는 코사인 변환(DCT)이 직교 변환 기술에서 사용된다.
노이즈 레벨 설정 수단에서, 대역폭이 더 높은 주파수로 설정되도록 주파수를 분할하고, 각 대역에서 데이타로 블록을 형성하고, 이른바 마스킹 효과를 이용하도록 한 블록상에서의 에너지를 기초로 하여 참을 수 있는 노이즈 레벨을 결정하는 것이 바람직하다. 여기서, 마스킹 효과는 시간축을 따른 마스킹 효과 및 주파수 축을 따른 마스킹 효과를 의미한다.
플로팅 계수 계산 수단에서, 주파수 분석 수단의 다수의 출력 데이타로 구성된 블록에서 최대의 값 데이타를 기초로 한 스케일 계수는 플로팅 계수로써 사용될 수도 있다. 선택적으로, 최대값 데이타 자체는 블록 플로팅 계수의 적절한 값으로 사용될 수도 있다. 그러므로, 할당 비트수 결정 수단에서, 복호화를 위한 할당 비트수는 마스킹을 이용하는 각 기준 대역에서 결정되는 바와 같이 블록 플로팅 계수 및 참을 수 있는 노이즈 레벨을 기초로 하여 결정될 수도 있다. 이러한 경우, 플로팅 계수 계산 수단에서 각 블록의 데이터 수는 노이즈 레벨 설정 수단에서의 데이타 수와 동일하게 매칭된다.
이러한 목적을 위해, 고능률 디지탈 데이타 부호화 장치는, 입력 디지탈 데이타를 진폭 정보 및 위상 정보로 변환시키는 입력 디지탈 데이타를 주파수 분석하기 위한 주파수 분석 수단과, 상기 진폭 정보 및 위상 정보를 부호화시키기 위한 부호화 수단을 구비한다. 부호화 수단에 의해 부호화할 때, 위상 정보에 할당된 비트수는 주파수 분석 수단의 출력에서 소정의 범위 또는 대역에 관하여 진폭 정보에 할당된 비트수 보다 더 적게 감소된다.
본 발명에 따라서, 입력 디지탈 데이타는 다수의 블록 길이를 갖은 직교 변환에 의해 처리되며, 직교 변환 수단의 출력들 중 하나가 직교 변환 수단의 출력 기초로 하여 선택된다. 적절한 부호화 출력은 부호화에 필요한 최소한의 비트수를 갖은 출력을 선택함으로서 얻어질 수도 있다.
본 발명에 따라서, 각 대역의 직교 변환의 블록 길이는 각 대역의 직교 변환 이전에 블록 데이타 또는 프레임의 특성을 기초로 하여 설정되며, 신호 특성에 적합한 블록 길이를 갖은 직교 변환이 달성될 수도 있으며 압축 부호화는 신호 특성에 적합한 비트수에 따라 달성될 수도 있다.
본 발명에 따라서, 참을 수 있는 노이즈 리벨뿐만 아니라, 각 블록에서 최대 값의 데이타를 기초로 한 플로팅 계수를 사용하여 할당 비트수가 설정되며, 그 결과 블록내의 에너지가 동일하다할지라도, 충분히 큰 수의 비트가 고음 신호에 할당된다.
본 발명에 따라서, 위상 정보에 할당된 비트수에 관한 정보가 진폭 정보에 할당된 비트수 보다 더 작게 설정될 때, 인간의 청각에 나쁜 효과가 발생되지 않기 때문에, 비트 압축 요소는 위상 정보에 할당된 비트수의 정보를 감소시킴으로써 증가될 수도 있다.
본 발명에 따라서, 위상 정보에 할당된 비트수에 대한 정보가 진폭 정보에 할당된 비트수 보다 더 적게 설정되는 대역이 더 높은 대역 또는 범위일 때, 음질의 왜곡이 감소 될 수 있다.
본 발명에 따라서, 진폭 정보에 대한 위상 정보의 비트 감소수가 미리 설정되면, 위상 정보 및 진폭 정보의 부호화된 데이타와 함께 동시에 진폭 정보 및 위상 정보들 중 하나를 전송하여, 할달 비트수 정보를 전송하는데 필요한 비트수는 더 감소될 수도 있다.
본 발명에 따라서, 각 대역의 진폭 변조 에너지로부터 알 수 있는 바와 같이 이른바 마스킹 질을 기초로 한 참을 수 있는 노이즈 레벨을 사용하여 각 대역의 할당 비트수가 설정되기 때문에, 음질의 왜곡 감소와 함께 비트수가 감소될 수 있다.
제 1 도는 본 발명의 제 1 실시예에 따른 고능률 디지탈 데이타 부호화 장치의 개략적인 구성을 나타내는 블록 회로 다이어그램.
제 2 도는 도시된 부호기의 개략적인 구성을 나타내는 블록 다이어그램.
제 3 도는 블록 길이가 각 대역에 대해 동일한 경우의 DCT 처리 블록을 나타내는 도시도.
제 4 도는 고주파수 범위에 대한 블록 길이가 프레임 길이의 1/2 인 경우의 DCT 처리 블록을 나타내는 도시도.
제 5 도는 고주파수 범위에 대한 블록 길이가 프레임 길이의 1/4 인 경우와 중간 주파수 범위에 대한 블록 길이가 프레임 길이의 1/2 인 경우의 DCT 처리 블록을 나타내는 도시도.
제 6 도는 고주파수 범위에 대한 블록 길이가 프레임 길이의 1/4 인 경우와 중간 주파수 범위에 대한 블록 길이가 프레임 길이의 1/4 인 경우의 DCT 처리 블록을 나타내는 도시도.
제 7 도는 비트수의 제 1 오더 비트 할당 및 보정수의 결정을 나타내는 플로우 챠트.
제 8 도는 본 발명의 제 2 실시예에 따른 고능률 디지탈 데이타 부호화의 개략적인 구성을 도시하는 블록 회로 다이어그램.
제 9A 도는 대표적인 일시적 신호를 나타내는 그래프.
제 9B 도는 대표적인 고정 신호를 나타내는 그래프.
제 10 도는 DCT 처리의 대표적인 블록을 나타내는 그래프.
제 11 도는 고능률 부호화 장치의 구성으로써 복호화 장치의 개략적인 구성을 나타내는 도시도.
제 12 도는 본 발명의 제 3 실시예에 따른 고능률 디지탈 데이타 부호화 장치를 도시하는 블록 회로 다이어그램.
제 13 도는 데이타 당 허용 가능한 노이즈 레벨 및 블록 플로팅 계수를 설명하기 위한 도시도.
제 14 도는 참을 수 있는 노이즈 레벨을 설정하는 상세한 구성의 도시도.
제 15 도는 버크 스펙트럼(Burke spectrum)을 도시하는 그래프.
제 16 도는 마스킹 스펙트럼(masking spectrum)을 도시하는 그래프.
제 17 도는 최소 가청 곡선 및 마스킹 스펙트럼의 합성을 도시하는 그래프.
본 발명의 양호한 실시예
제 1 도는 대역폭이 증가 주파수 방향으로 설정되도록 오디오 데이타와 같은 입력 디지탈 데이타를 다수의 대역으로 분할하며 각 대역에 대해 다수의 샘플로 구성된 블록을 형성하며, 계수 데이타(DCT 계수 데이타)를 발생하기 위해 각 대역의 각 블록에 대해 이산 코사인 변환에 의해 직교 변환을 수행하며, 적절하게 할당된 비트수로 계수 데이타를 부호화하는 고능률 디지탈 데이타 부호화 장치를 도시한다. 본 발명의 고능률 부호화 장치에 대해서, 4 개의 부호기(2 내지 5)와 같은 다수의 부호기에서, 각각의 부호기는 한 대역에서 다른 대역까지 다른 블록 길이를 갖은 각 대역에 대해 입력 디지탈 데이타의 직교 변환을 수행하는 직교 변환 수단을 구비하며, 부호기(2 내지 5)로부터의 출력들 중 한 출력만이, 즉, 직교 변환 수단으로부터의 출력들 중 한 출력은, 부호기(2 내지 5)의 직교 변환 수단으로부터의 출력을 기초로 하여 선택된다. 한편, 각 대역에 대해 DCT 처리된 블록의 블록 길이는 한 부호기에서 다른 부호기까지 다르며, 부호기(2 내지 5)의 출력들 중 한 출력만이 부호기(2 내지 5)에서의 출력을 기초로 한 선택 회로(6)에 의해 선택된다. 즉, 전환 스위치(7)의 상태는 부호기(2 내지 5)의 출력들 중 단지 한 출력을 선택하는 선택 회로(6)로부터 선택 신호를 기초로하여 전환된다.
선택 회로(6)에 의한 선택 동작은 부호화 동작을 수행하는 부호기에 필요한 최소한의 비트수를 갖은 부호기의 한 출력만이 선택되도록 이루어진다. 즉, 부호기(2 내지 5)로부터 출력된 각 프레임의 비트수가 임의의 소정수일지라도, 주어진 프레임에서 부호화하는데 필요한 비트수는 추후 상술되는 마스킹 효과를 이용한 적절한 비트 할당에 의해 결정된다. 상기 언급된 선택은 부호화 동작에 필요한 최소한의 비트수를 갖은 부호기의 출력만이 선택되도록 이루어진다.
그러므로, 부호화에 필요한 비트수가 한 프레임상에서 결정된 비트수 보다 적다면, 나머지 비트는 더 만족할만한 부호화를 수행하는데 사용될 수도 있다. 다른 한편, 최소한의 비트수를 갖은 부호기 출력을 선택함으로써, 가장 양호하게 부호화된 출력이 발생될 수 있다. 부호기(2 내지 5)에 필요한 비트수가 한 프레임상에서 결정되는 비트수를 초과하면, 부호화에 기인한 최소한의 왜곡을 갖은 부호화 출력은, 부호화하는데 필요한 최소한의 비트수를 갖은 부호기(2 내지 5)의 출력을 선택함으로써 발생될 수 있다.
즉, 제 2 도에 도시된 바와 같이 본 발명의 고능률 디지탈 데이타 부호화 장치의 부호기(2 내지 5)에서, 입력 단자(1)를 통해 제공된 오디오 또는 음성 데이타와 같은 입력 디지탈 데이타는 구형 미러 필터(41, 42)에 의해 3 개의 주파수 대역으로 분할되며, 대역폭은 이른바 기준 대역에 따라 주파수 대역 분할에 따라서 증가 주파수 방향으로 확대된다. DCT 회로(43, 44, 45)에서, 다수의 샘플로 구성된 각 블록은 각 대역에 대해 형성되며, 직교 변환(시간축으로부터 주파수 축으로의 변환)은 계수 데이타(DCT 계수 데이타)를 발생하는 각 블록에 대해 수행된다. 반면에, DCT 회로(43, 44, 45)의 출력은, 예를 들면 2 개의 고주파수 대역, 3 개의 중간 주파수 대역에 대응하며, 기준 주파수 대역에 따른 20 저주파수 대역에 대응한다. DCT 회로(43 내지 45)로부터 각 대역의 DCT 계수 데이타는 부호화 회로(46, 47, 48)에 의해 적절한 할당 비트수로 부호화된다.
즉, 본 발명의 실시예에 따른 부호화 회로(46, 47, 48)에서 3 대역의 DCT 계수 데이타의 부호화는 인간의 청각 특성을 기초로 한 적절한 할당 비트수에 따라 수행된다.
상기 언급된 대역 분할을 수행하기 위해, 아날로그 오디오 신호를 1024 샘플로 샘플링할 때 얻어진 디지탈 데이타 (0,... 22.1kHz)는 각 부호기(2 내지 5)의 입력 단자(1)에 제공된다. 이러한 디지탈 데이타는 QMF(41, 42)에 의해 3 개의 대역(0,...5.5kHz, 5.5 내지 11.0kHz 및 11.0 내지 22.1kHz)로 분할되며, 대역폭은 더 높은 주파수로 확대된다. QMF(41)에서, 0 내지 22.1kHz의 디지탈 데이타는 2 개로 분할되며 각각 DCT 회로(43) 및 QMF(42)에 제공된 0 내지 11.0kHz의 출력 및 11.0 내지 22.1kHz의 출력을 발생한다. QMF(42)에 제공된 0 내지 11.0kHz 출력은 QMF(42)에 의해 2 개로 분할되며, 각각 DCT 회로(44, 45)에 제공된 0 내지 5.5kHz 출력 및 5.5kHz 내지 11.0kHz 출력을 발생한다.
DCT 회로(43, 44, 45) 각각에서, 제공된 대역 데이타의 1024 샘플은 프레임 B를 구성하며, 퓨리에 변환은 프레임 B에 의해 형성된 각 블록에 대해 수행되어 DCT 계수 데이타를 발생한다. 각각의 DCT 회로(43, 44, 45)에서 DCT 처리 블록 길이는 각 부호기(2 내지 5)에 대해 다른 값을 가진다.
예를 들면, 부호기(2)에서, DCT 처리 블록 길이는 제 3 도에 도시된 바와 같이 동일한 길이이다. 즉, 부호기(2)에서, 11.0 내지 22.1kHz의 높은 범위에 연결된 DCT 회로(43)의 DCT 처리 블록 길이 bH, 5.5 내지 11.0kHz의 중간 범위에 연결된 DCT 회로(44)에서의 DCT 처리 블록 길이 bM, 및, 0 내지 5.5kHz의 하부 범위에 연결된 DCT 회로(45)에서의 DCT 처리 블록 길이 bL은, 상기 언급된 소정의 단위 시간 간격을 갖은 프레임 B와 동등하도록 선택된다.
부호기(3)에서, DCT 처리 블록 길이는 제 4 도에 도시된 바와 같이 높은 주파수 범위에서 더 짧도록 선택된다. 즉, 부호기(3)에서, 높은 범위의 DCT 회로(43)에서의 블록 길이는 중간 범위의 DCT 회로(44)에서의 블록 길이 bM및 낮은 범위의 DCT 회로(45)에서의 블록 길이 bL의 1/2 이다. 본 실시예에서는, 고 주파수 블록이 블록 bH1, bH2로 분할된다.
부호기(4)에서, DCT 처리 블록 길이는 제 5 도에 도시된 바와 같이, 중간 및 고주파수 범위에서 더 짧도록 선택된다. 즉, 저 범위의 블록 길이 bL에 있어서 중간 범위는 저 범위 블록 길이의 1/2 인 블록 길이 bM1, bM2를 가지며, 고 범위는 저 범위 블록 길이의 1/4 또는 중간 범위 블록 길이의 1/2 과 같은 블록 길이 bH1, bH2, bH3, bH4를 가진다.
부호기(5)에서, DCT 처리 블록 길이는 제 6 도에 도시된 바와 같이, 저주파수 범위에서는 더 길고 고 및 중간 주파수 범위에서는 더 짧도록 선택된다. 즉, 저 범위의 블록 길이 bL에서, 고 범위는 저 범위 블록 길이의 1/4과 동등한 블록 길이 bH1, bH2, bH3, bH4를 가지며, 반면에, 중간 범위는 저 범위 블록 길이의 1/4인 블록 길이 bM1, bM2, bM3, bM4을 가진다.
고 및 중간 범위의 블록 길이는 다음 이유에 의해 제 4 도 내지 6 도에 도시된 바와 같이 저 범위의 블록 길이보다 더 짧도록 선택된다. 즉, 인간의 청각의 주파수 분해능은 저 범위에서 높으나 고 범위에서는 그다지 높지 않으며, 저 범위에서 주파수 분해능을 확보할 필요성이 있으며, DCT 처리를 위한 블록 길이는 저범위에서 초과하여 감소되지는 않는다. 이러한 이유 때문에, 블록 길이는 저범위에서 더 길도록 선택된다.
다른 한편, 고정 주기가 고 범위 신호 및 저 범위 신호보다 더 길기 때문에, 고 및 중간 범위에서 블록 길이를 더 짧게 하는 것이 효과적이다. 이러한 관점에서, 고 및 저 범위의 블록 길이는 더 짧도록 선택되며, 저 범위의 블록 길이는 현 실시예에서 더 길도록 선택된다.
그러므로, 본 실시예에서, 주파수축에서의 분해능에 대한 요구조건 및 시간축에서의 분해능에 대한 요구조건을 동시에 충족시키기 위해, 샘플수는 주파수 분해능을 증가시키는 저 범위(0 내지 5.5kHz)에서 증가되며, 반면에 시간 분해능은 고 범위(11.0 내지 22.1kHz)에서 증가되며, 때때로 중간 범위(5.5 내지 11.0kHz)에서 증가된다.
입력 오디오 신호의 특성에 따라서, 고 및 중간 범위에서 DCT 처리 블록 길이를 짧게 하는 것이 효과적이다.
즉, DCT 처리 블록 길이는 입력 오디오 신호가 일시적 신호 또는 고정 신호인 것에 따라 효과적으로 변화될 수도 있다.
고정 신호의 경우, 제 3 도에 도시된 바와 같이 동일한 길이가 되도록 각 대역의 블록 길이를 설정하는 것이 효과적이며, 반면에, 일시적 신호의 경우, 제 6 도에 도시된 바와 같이 길이를 더 짧게 하도록 고 및 중간 범위 대역의 블록 길이를 설정하는 것이 효과적이다. 이러한 방법으로 일시적 신호로 DCT 처리 블록 길이를 감소시킴으로써, 많은 비트는 부호화 동안 하이 피크 레벨(일시적인 신호부)을 갖은 프레임 B에서 블록에 할당될 수 있으며, 반면에 비트수는 다른 블록에서 감소될 수 있다. 이러한 방법에서, 비트는 스펙트럼의 시간 변화에 따른 프레임 B의 각 대역에서 비트 필요성에 의해 블록에 할당된다. 다른 한편 프레임 B의 각 블록에서 유사한 스펙트럼의 신호의 나머지 부호화는 정지 신호의 경우에 방지될 수도 있다.
한편, 각 대역의 DCT 처리 블록 길이는 제 3 도 내지 6 도에 도시된 예에 국한시키지는 않는다. 그러므로, 저 범위에서의 블록 길이를 감소시키며 동시에 고 범위에서의 블록 길이를 감소시키는 것과 같은 다양한 블록 길이 패턴이 예견될 수 있다.
각각의 부호기(2 내지 5)에서, 제 2 도에 도시된 DCT 회로(43 내지 45)의 각각에서 DCT 처리가 수행되어 각 대역에 다른 블록 길이를 제공하도록 부호화 회로(46 내지 48)에 전송되는 DCT 계수 데이타를 발생한다.
한편, 각각의 부호기(2 내지 5)는 다음의 장치를 갖은 부호화 회로(46 내지 48)에서 적절한 비트 할당에 의해 코딩을 수행한다.
즉, 각각의 부호기(2 내지 5)는 DCT 회로(43, 44, 45)로부터 프레임 B에서 DCT 계수 데이타를 부호화하는데 실제로 필요한 비트수, 즉, 소정의 음질을 실현하는데 필요한 비트수를 결정하는 기본 할당 비트수 결정 회로(60)와, 회로(60)에 의해 결정된 기본 비트수를 프레임 B에서 미리 설정된 최종 비트수로 조정하도록 비트 분배 또는 비트 감소를 수행하는 비트수 보정 회로(61)를 구비한다. 그러므로 각 부호화 회로(46 내지 48)에서 DCT 계수 데이타의 부호화는, 비트수 보정 회로(61)에 의해 기본 비트수를 보정함으로써 얻어진 비트수, 즉, 상기 언급된 최종 비트수에 의해 수행된다.
한편, 기본 비트수는 추후 기술되는 이른바 마스킹 효과에 의해 기본 할당 비트수 결정 회로(60)에서 결정된다.
마스킹은 인간의 청각 특성에 연관된다. 즉, 음에 대한 인간 청각 특성사이에서, 마스킹 효과란 용어가 사용되며, 그것은 일시적 마스킹 효과 및 동시 마스킹 효과로 나누어진다.
동시 마스킹 효과는, 작은 음 또는 노이즈가 동시에 발생된 큰 음에 의해 마스크되어 들을 수 없는 그러한 효과를 의미한다. 일시적 마스킹 효과는, 작은 음 또는 노이즈가 작은 노이즈(순방향 마스킹)전에 일시적으로 발생된 큰 음 또는 작은 음(역방향 마스킹)후에 일시적으로 발생된 큰 음에 의해 마스크되어 들을 수 없는 그러한 효과를 의미한다. 인간의 청각 특성 때문에, 순방향 마스킹 효과는 오래 동안, 예를 들면, 약 100msec 동안 유지되며, 반면에, 역방향 마스킹 효과는 5msec 정도 더 짧은 시간동안 유지된다. 마스킹 효과(마스킹 질)의 레벨은, 각각 순방향일 때 20dB 정도이며, 역방향일 때 30dB 정도이다.
그러므로, 마스킹 효과가 프레임 B에서 비트 할당 때 이루어지면, 최적한 비트 할당이 달성될 수도 있다. 즉, 비트수가 임의의 역효과 없이 마스크된 신호부에서 감소되기 때문에, 비트수는 더 작은 비트수를 갖은 효과적인 부호화를 실현하기 위해 마스크된 신호부에서 감소될 수도 있다. 마스킹 레벨 또는 마스킹 질은 각각의 기준 대역의 에너지 합을 기초로 하여 결정될 수도 있다. 마스킹 질을 결정하기 위해, 다른 기준 대역에 의해 주어진 기준 대역 신호의 마스킹 질이 결정 될 수도 있다. 각 대역의 참을수 있는 노이즈 레벨은 마스킹 질에 의해 결정되고, 부호화를 위한 할당 비트수는 각 대역의 참을 수 있는 노이즈 레벨을 기초로 하여 결정될 수도 있다.
기본 할당 비트수 결정 회로(60)에 의해 결정된 기본 비트수는, 비트수 보정 회로(61)에 전송되며, 상기 회로(61)는 회로(60)에 의해 결정된 기본 비트수를 프레임 B에서 미리 설정된 상기 언급된 최종 비트수에 매칭시키도록 비트 분배 및 비트 감소를 수행한다.
회로(60, 61)에 의해 기본 비트수를 결정하며 비트 분배 또는 비트 감소를 결정하는 동작 순서는 제 7 도의 플로우 챠트에 도시된다.
상기 플로우챠트에 있어서, 단계(S1)에서 마스킹 질의 계산을 기초로 하여 결정된 바와 같이, 부호화 회로(46, 47, 48)를 부호화하는데 실제로 필요한 기본 비트수, 즉, 기본 할당 비트수 결정 회로(60)에 의해 결정된 기본 할당 비트수는 변수 nsum0로 구성된다. 단계(S2)에서, 상기 변수 nsum0는 비트수 보정 회로(61)에 전송되며, 상기 회로(61)는 변수 nsum0을 변수 nsum에서 구성한다.
단계(S3)에서, 변수 nsum이 프레임 B에서 미리설정된 최종 비트수를 표시하는 수 보다 작거나 큰지 검색된다. 변수 nsum이 값 nlimit 보다 작다면, 프로그램은 단계(S4)로 진행하며, 변수 nsum이 값 nlimit 보다 크다면 프로그램은 단계(S5)로 진행한다.
변수 nsum가 최종 비트수를 표시하는 값 nlimit 보다 작다면 비트수는 초과된다. 그러므로, 단계(S4)에서, 나머지 비트수(변수 nsum와 값 nlimit 사이의 차이에 대응하는 비트수)는 프레임 B에서 분배된다. 나머지 비트는 음질을 더 개선시키도록 대역 또는 블록에 분배된다. 비트 분배 후 비트수는 단계(S3)로 리턴된다.
단계(S5)에서, 변수 nsum이 최종 비트수를 표시하는 값 nlimit보다 더 크거나 또는 크지 않는지 검색된다. 변수 nsum가 값 nlimit보다 크지 않다면, 변수 nsum가 값 nlimit보다 크다면 프로그램은 단계(S6)로 진행한다.
변수 nsum가 값 nlimit보다 크다면, 비트수는 작아진다. 그러므로 단계(S6)에서, 작아진 비트수는 변수 nsum에 대응하는 비트수로부터 감산된다. 비트 감소는 음질에 영향을 미치지 않은 범위 또는 블록으로부터 이루어진다. 비트 감소 후 비트수는 단계(S5)로 리턴된다.
제 7 도의 플로우챠트에 도시된 동작 순서에 의해, 비트수는 보정되며, 부호화 회로(46 내지 48)에서의 부호화는 보정된 비트수를 기초로 하여 수행된다.
부호화 회로(46 내지 48)로부터 부호화된 데이타는 합성회로(50)에 전송된다. 기본 비트수에 관한 정보(소정의 음질을 실현하는데 필요한 비트수를 표시하는 정보)는, 기본 할당 비트수 결정 회로(60)에 의해 결정되며, 합성 회로(50)로 전송된다. 각 대역의 데이타는 합성 회로(50)에서 조합되며, 상기 조합된 데이타 사이에서, 부호화된 데이타는 출력 단자(52)에서 출력되며, 반면에, 기본 비트수에 관한 정보는 출력 단자(53)에서 출력된다.
제 2 도의 출력 단자(52, 53)에서의 출력은 제 1 도에 도시된 부호기(2 내지 5)로부터 출력된다. 부호기(2 내지 5)로부터의 부호화된 데이타는 전환 스위치(7)에 전송되며, 반면에, 기본 비트수에 관한 정보는 선택 회로(6)에 전송된다.
선택 회로(6)에서, 상술된 바와 같이 부호기(2 내지 5)로부터 전송된 각각의 기본 비트수에 관한 정보를 기초로 하여 부호화에 필요한 비트수, 즉, 소정의 음질을 실현하는데 필요한 비트수가 최소화되는 부호기(2 내지 5)들 중 한 부호기의 출력만이 선택되며, 상기 선택된 신호는 전환 스위치(7)에 전송된다. 그러므로, 전환 스위치(7)는 상기 언급된 선택 신호를 기초로 하여 부호기(2 내지 5)로부터 제공된 부호화된 출력들 중 한 출력만을 출력시키는 전환 동작을 수행한다. 이러한 방법으로 선택되어 부호화된 출력은 출력 단자(8)로부터 출력된다.
도시되지는 않았지만, 기본 할당 비트에 관하여 상기 언급된 정보를 기초로 하여, 복호기에 의해 부호화된 출력을 복호화시킬 때, 발생된 음은 최적의 음질이다.
상기 기술된 바와 같이, 고능률 디지탈 데이타 부호화 장치에서, 일단 부호기의 출력이 부호기(2 내지 5)의 출력으로부터 선택되어 부호화된 데이타를 발생하면, 부호화된 데이타는 부호화되고, 최적한 음질을 발생하는 음으로 변환된다.
또한 실제로 부호화된 출력이 선택되기 때문에, DCT 처리를 위해 선택된 블록은 최적한 블록 길이이며, 블록 길이의 선택을 용이하게 한다. 양호한 실시예의 장치는 컴팩트 디스크(CD) 같은 패키지 매체에 기록된 데이타용 부호화 장치에 적합할 수도 있다. 사용자가 복호기(플레이어)를 필요로 하기 때문에, 부호화 장치는 소정의 필요한 크기로 될 수도 있다.
상기 기술된 실시예에서, 다른 처리 블록을 갖은 DCT 회로(43 내지 45)는 각 부호기(2 내지 5)에 배열된다. 교호적으로 한 부호기만이 제공되며, 다른 DCT 처리 블록 길이를 갖은 DCT 처리 동작을 수행하는 기능을 갖은 DCT 처리 수행용 DCT 회로는 각 대역에 제공될 수도 있다. 이러한 경우, DCT 회로의 한 출력만이 부호화하는데 필요한 최소 비트수를 갖은 각 대역에 연결된 다수의 DCT 회로로부터 선택된다.
이러한 고능률 부호화 장치에는 단지 하나의 부호기만이 제 1 도의 경우와 같이 다수의 부호기 대신에 제공된다.
제 2 도에 도시된 구성과 부호기의 구성을 비교하면 DCT 회로 (43 내지 45)는 제 2 도에서 하나씩 차례로 연결되지 않으며 제 3 도 내지 6 도에서는 각 대역에서의 블록 길이에 대응하는 다수의 DCT 회로가 제공된다. 예를 들면 다른 블록 길이를 갖은 3 개의 DCT 회로가 고 범위에서 제공되며, 반면에, 3 개의 다른 블록 길이를 갖은 3 개의 DCT 회로는 중간 범위에서 제공되고, 하나의 DCT 회로가 저 범위에서 제공된다.
다른 한편, 3 개의 DCT 회로에는, 제 3 도의 블록 길이 bH, 제 4 도의 블록 길이 bH1및 bH2, 제 5 및 6 도의 블록 길이 bH1, bH2, bH3, bH4에 대응하는 3 종류의 블록 길이를 갖은 DCT 처리 고 범위 데이타를 위한 고 범위가 제공된다. 유사한 방법으로, 3 개의 DCT 회로에는, 제 3 및 4 도의 블록 길이 bM, 제 5 도의 블록 길이 bM1, bM2, 제 6 도의 블록 길이 bM1, bM2, bM3, bM4의 블록 길이에 대응하는 3 종류의 블록 길이를 갖은 DCT 처리 중간 범위 데이타를 위한 중간 범위가 제공되며, 반면에, DCT 회로에는 제 3 내지 6 도에 도시된 블록 길이 bL에 대응하는 한 종류의 블록 길이를 갖은 DCT 처리 저 범위 데이타를 위한 저 범위가 제공된다.
DCT 회로의 출력을 선택 회로(6)에 전송함으로써, 그리고, 각 범위에 대해 DCT 회로 출력들 중 단지 한 출력만을 선택함으로써, 제 1 도의 장치에서 달성된 것과 유사한 처리가 이루어질 수도 있다. 상기 방법에서, 제 1 도의 장치에서 얻어진 것과 유사한 효과가 달성될 수 있으며, 한편 그 구성은 매우 단순하다.
변형된 실시예에 따른 고능률 디지탈 데이타 부호화 장치가 제 8 도에 도시된다. 상기 장치는 각 대역의 직교 변환 이전에 블록 데이타의 특성(예를들면 일시적 또는 고정적)을 기초로 하여, 각 대역에 대해 직교 변환의 블록 길이를 결정하는 블록 길이 결정 회로(49, 50, 51)를 포함한다.
직교 변환 동작은 각각의 대역에 대해 결정된 블록 길이를 기초로한 회로(49 내지 51)에 의해 수행된다. 한편 DCT 회로(46 내지 48)는 블록 크기를 변화시키는 장치를 포함한다.
제 8 도에 있어서, 출력은 블록 길이 결정 회로(49 내지 51)에 전송된다. 이러한 회로에서, 입력 오디오 데이타의 프레임(4)내 데이타가 일시적 신호 또는 고정 신호인지 검색되며, 상기 검색된 결과를 기초로 하여 블록 길이 결정 신호가 출력된다. 블록 길이 결정 신호는 DCT 회로(43 내지 45)에서의 DCT 처리 블록 길이가 가변임을 나타낸다.
이러한 대역에 연결된 블록 길이 결정 회로(49 내지 51)에서, 각 샘플의 피크 레벨은, 프레임 B 의 길이를 4 개의 부분으로 분할함으로써 얻어진 각 블록 b1, b2, b3, b4에서 발견된다. 예를 들면, 최대 피크 레벨 Maxpk및 최소 피크 레벨 Minpk은 블록 b1, b2, b3, b4의 피크 레벨 PK1, PK2, PK3, PK4에서 발견되며, 비율 Maxpk/Minpk은 기준 범위내 값과 비교되며, 비율이 기준값 보다 크면, 프레임 B내의 작으면, 프레임 B내의 신호는 고정 신호로 결정된다. 비율이 기준 범위내에 있으면, 신호는 일시적 신호와 고정 신호사이 중간에서 결정된다. 제 9A 및 9B 도는 각각 일시적 신호 및 고정 신호의 예를 도시한다.
회로(49 내지 51)는 블록 b1, b2, b3, b4에서의 신호 에너지를 기초로 한 블록 길이 결정을 수행하도록 설계된다. 이러한 경우, 각 블록에서의 에너지가 발견되며, 최대 및 최소 에너지 사이의 비율이 결정되며, 상기 비율은 상기 언급된 바와 같이 검출 동작을 수행하는 신호 에너지의 기준 범위와 비교된다.
상기 언급된 검출 동작은 검출된 결과에 따라 블록 길이가 결정되는 블록 길이 결정 회로(49 내지 51)에서 수행된다. DCT 처리 회로(43 내지 45)에서의 DCT 처리는 블록 길이 결정 회로(49 내지 51)에서 결정된 블록 길이에 따라 수행된다.
신호가 회로(49 내지 51)에 의해 고정 신호로 결정되면, 각 대역의 블록 길이는, 프레임 B 의 길이 같은 동일한 길이가 되도록 설정된다. 그러므로, 블록 길이는 11.0 내지 22.1kHz의 고 범위, 5.5 내지 11.0kHz의 중간 범위, 0 내지 5.5kHz의 저 범위를 각각 bH, bM, bL로 설정된다.
역으로, 신호가 일시적 신호로 결정되면, 제 6 도에 도시된 바와 같이, 블록 길이가 고 및 중간 범위에서는 더 짧고, 저 범위에서는 더 길도록 설정된다. 즉, 프레임 B 에 대응하는 저 범위의 블록 길이 bL에 있어서, 고 및 중간 범위에서의 블록 길이는 블록 길이 bL의 1/4로 설정된다. 제 6 도의 예에서 고범위 블록은 블록 길이 bH1, bH2, bH3, bH4를 가지며, 반면에, 중간 범위 블록은 블록 길이 bM1, bM2, bM3, bM4를 가진다.
신호가 고정 신호와 일시적 신호사이에서 중간이라면, 저 범위의 블록 길이 bL는 BM과 동일하며, 중간 범위의 블록 길이는 저 범위의 블록 길이의 1/2인 bM1또는 bM2이며, 고 범위의 블록 길이는 저 범위 길이의 1/2 또는 1/4 인 bH1, bH2, bH3, bH4이다.
비록 저 범위 블록 길이 bL가 제 3 도 내지 6 도의 실시예에서 일정하다 할지라도, 이러한 저 범위 블록 길이는 신호에 따라 변화될 수도 있다. 여러 범위에서의 블록 길이는 프레임 B의 길이를 1/2 또는 1/4로 분할된다.
다수의 샘플로 구성된 각 범위에서의 프레임 B 내의 데이타는 회로(49 내지 51)로부터의 블록 길이 결정 신호를 기초로 한 블록 길이에 따라 DCT 회로(43 내지 45)에서 DCT 처리된다. 즉 각 대역에 대한 DCT 처리는 프레임 B 내의 신호 특성에 따른 블록 길이에 의해 수행된다.
한편, DCT 회로(43 내지 45)에 의한 DCT 처리에 있어서 프레임 길이는 제 10 도에 도시한 바와 같이 오버랩 OL 보다 적은 1024 샘플들과 같도록 선택된다. 제 10 도는 제 5 도와 관련하여 전이 신호와 정상 신호 중간에 있는 신호의 경우를 나타낸다. 이 직교 변환은 DCT 외에 이산 코사인 변환 일 수도 있다.
블록 길이 판단 회로(49-51)의 출력은 DCT 회로(43 내지 45)의 DCT 계수 데이타를 부호화하는데 적합한 부호화 회로(46 내지 48)로 전송한다.
프레임 B내의 데이타가 전이 신호로서 검색되고 DCT 처리 블록 길이가 DCT 회로(43 내지 45)에서 단축되면, DCT 계수 데이타의 부호화는 DCT 회로(43 내지 45)의 하단의 부호화 회로(46 내지 48)의 프레임 B내에 적합한 비트 할당에 의해 실행된다. 제 9A 도의 실시예에서, 블록들 b1, b2, b3및 b4중에서 최대 피크 레벨을 지닌 블록 b3에 더 많은 비트들이 할당되는 한편, 나머지 비트들 b1, b2및 b4에 대해서는 비트들의 수가 감소된다. 이런 식으로, 정말 비트가 부족한 블록(여기서는 블록 b3에 더 많은 비트들이 할당되어 일시적인 스펙트럼 변화를 따라간다. 이런 경우의 비트 할당은 마스크 효과를 고려할 적에 실행될 수 있다.
프레임내의 데이터가 정상 신호로 검색되고 DCT 처리 블록 길이가 DCT 회로(43 내지 45)에서 더 길게 선택되면, 부호화 회로(46 내지 48)에서의 부호화는 단위 길이로서 프레임 B의 길이로 실행된다. 제 9 도의 실시예에서, 부호화는 4개의 블록들 b1, b2, b3및 b4로 분할하는 대신 프레임 기준으로 실행된다. 이런 부호화는 프레임 B내에서 유사한 스펙트럼을 가진 신호들의 오버랩이 없어도 가능하다.
또한, 정상 신호의 경우, DCT 회로(43-45)에서의 스펙트럼 분석은 정확도가 개량될 수 있다. 부호화 회로(46 내지 48)에서의 부호화에 사용되는 비트들 수가 감소될 수 있도록, 마스크 계산을 한다면, 그러한 마스크 계산의 정확도 역시 개선될 수 있다.
부호화 회로(46 내지 48)의 출력이 출력 단자(52, 54 및 56)로부터 공급된다. 블록 길이 판단 회로(49 내지 51)의 출력들 역시 서브 데이타로서 출력 단자(53, 55 및 57)로부터 공급된다. 한편, 정상 신호의 경우에, 서브 데이타용 비트들의 수는 전이 신호의 경우보다 더 적을 수 있다. 전이 신호의 경우에 4블록들과 연관된 서브 데이타는 이러한 출력 단자 (53, 55 및 57)로 출력된다. 정상 신호의 경우에, 서브 데이타가 프레임 B 기준의 신호일 수 있으므로, 서브 데이타용 비트들 수는 감소될 수 있다.
전술된 고능률 디지탈 데이타 부호화 장치에 있어서, 각각의 범위에 대한 직교 변환용 블록 길이들은 직교 변환 전에 각각의 범위에 대한 프레임 데이타의 특성(예컨대, 전이 또는 정상)에 기초하여 판단 블록(49-51)에 의해 판단되고, 각각의 범위에 대한 DCT 처리는 대역간에 판단된 블록 길이들로 DCT 회로(43-45)에 의해 실시되기 때문에, 부호화는 전이 또는 정상과 같은 신호 특성에 일치하여 이루어질 수 있다.
개략적인 블록선도로 제 11 도는 본 발명의 교효율 부호화 장치의 상대역인 복호화 장치를 나타낸다. 제 11 도를 참조하면, 부호화 장치의 출력 단자(52, 54 및 56)에서 부호화된 데이타가 입력 단자(152, 155 및 156)로 공급되는 한편, 부호화 장치의 출력 단자(52, 54 및 56)의 서브 데이타는 입력 단자(153, 155 및 157)로 공급된다. 부호화된 데이타와 서브 데이타는 이 서브 테이타에 기초하여 부호화 데이타를 복호화 시키는데 적합한 복호화 회로(146, 147 및 148)에 공급된다.
복호화된 데이타는 DCT 회로(43 내지 45)에 의한 처리의 반대(즉, 이산코사인 변환의 역)가 되는 연산을 수행하는데 적합한 IDCT 회로(143, 144 및 145)에 공급된다. 상기 서브 데이타는 또한 IDCT 회로(143 내지 145)에 공급되어 이 회로에 의한 처리는 이들 서브 데이타를 기초로 하여 수행된다. IDCT 회로(143)의 출력은 QMF(41)에 의해 수행된 연산의 반대인 필터링 연산을 수행하는데 적합한 IQMF 회로(141)에 공급된다.
IDCT 회로(14, 15)의 출력은 QMF(42)에 의해 수행된 연산의 반대인 필터링 연산을 수행하는데 적합한 IQMF 회로(142)에 공급된다. IQMF 회로(142)의 출력이 IQMF 회로(141)에 공급되므로, 각자의 대역들로 분할된 신호들의 조합인 디지탈 오디오 신호는 IQMF 회로(141)로부터 얻어진다. 이 오디오 신호는 출력 단자(130)에서 출력된다.
비트 할당의 실시예가 제 12 도를 참조하여 설명된다.
제 12 도에 도시된 장치는 입력 디지탈 데이타를 주파수 분석하는 주파수 분석 회로(102), 상기 주파수 분석 회로 (102)의 출력 데이터의 블록간 에너지에 기초하여 블록간 허용가능 소음 레벨을 설정하는 소음 레벨 설정 수단으로서 에너지 계산 회로(104) 및 마스크 계산 회로(105), 상기 주파수 분석 회로(102)의 출력 데이타의 복수 블록들 중 최대값 데이타에 기초하여 블록 플로팅 계수(block floating coefficients)를 계산하는 블록 플로팅 계산 회로(107), 주파수 분석 회로(102)의 출력을 부호화하는 부호화 회로(103), 그리고 소음 레벨 설정 수단의 출력과 블록 플로팅 계수 계산 회로(107)의 출력에 기초하여 부호화 회로(103)에 의한 부호화 시에 할당 비트수를 알아내는 할당 비트수 판단 회로(106)를 포함한다.
주파수 분석 회로(102)는 독립 회로일 수 있고, 제 2 도의 DCT 회로와 함께 동시에 사용될 수 있다. 부호화 회로(103)는 제 2 도의 부호화 회로(46 내지 48)의 상대역이다.
제 12 도에 도시된 부호화 장치에 있어서, 오디오 데이타와 같은 입력 디지탈 데이타는 입력 단자(100)에 공급된다. 이러한 입력 오디오 데이타는 이 오디오 데이타를 분석하는 주파수 분석 회로(102)에 공급된다. 주파수 분석 회로(102)에 있어서, 다수 샘플들의 오디오 디지탈 데이타를 DCT와 같은 직교 변환에 의해 스펙트럼 데이타(DCT 계수 데이타)로 변환하는 주파수 분석이 수행된다.
회로(102)의 출력 데이타는 출력 단자(108)에서 출력되기 전에 적합한 비트 할당에 의해 부호화하는 부호화 회로(103)에 공급된다.
다음의 배열은 부호화 회로(103)에서 적절히 할당된 비트수에 의해 부호화를 하는데 사용된다.
그래서 주파수 분석 회로(102)의 스펙트럼 데이타는 소음 레벨 설정 수단인 에너지 계산 회로(104)에 송신되고 또 블록 플로팅 계산 회로(107)에 송신된다.
에너지 계산 회로(104)에 있어서, 분석 회로(102)의 다수 스펙트럼 데이타로 블록들이 각각 형성된다. 이 실시예에서, 주파수 범위는 예컨대 25 대역으로 분할되어, 이 대역폭은 인간 청각의 어떤 특성을 고려한 임계 대역들에 따라 더 높은 주파수쪽으로 더 넓어진다. 어떤 임계 대역에서 다른 대역까지의 에너지, 즉 한 대역에서 다른 대역까지의 스펙트럼 데이타의 에너지 합이 발견된다.
에너지 계산회로(104)와 하단의 주변회로들의 세부 사항이 제 14 도를 참고하여 순차로 설명된다.
각 대역에 대한 에너지 계산 회로(104)의 에너지 데이타는 마스크 계산 회로(105)에 송신되고, 마스크 계산 회로(105)는 각각의 범위에 대한 에너지 데이타에 기초하여 마스크 효과를 참작한 마스크 양을 계산한다. 한편, 인간 청각 특성에서 소위 등음량 곡선을 고려한 허용 소음 레벨은 제 14 도에 도시한대로 마스크 계산과 동시에 알려질 수 있다.
상술한 바와 같이, 각각의 임계 대역에 대한 에너지에 기초한 인간 청각의 어떤 특성에 있어서 소위 마스크 효과를 고려한 대역 각각의 허용 소음 레벨에 관한 정보는 할당 비트수 판단 블록(106)에 송신된다. 블록 부동 계산 회로의 출력은 또한 할당 비트수 판단 회로(106)에 공급된다.
블록 플로팅 계산 회로(107)에 있어서, 이른바 블록 플로팅(block floating)은 주파수 분석 회로(102)에서 공급된 다수의 스펙트럼 데이타로 구성된 각 블록들에 대하여 실행된다. 블록 부동 연산에 있어서, 최대값 데이타는 각 블록의 스펙트럼 데이타로부터 선택되고, 최대값 데이타에 상응한 환산 계수(scale factor) 또는 그 근사값은 블록 환산 계수로서 얻어진다. 블록 부동 계수에 관한 정보는 할당 비트수 판단 회로(106)로 전송된다. 블록 플로팅 계수의 근사값으로서 최대값 데이타 그 자체는 할당 비트수 판단 회로(106)로 전송 될 수 있다.
할당 비트수 판단 회로(106)는 마스크 계산 회로(105)로부터 각 대역에 대해 알려진 허용 소음 레벨에 관한 정보와 블록 플로팅 계수의 정보에 기초하여 비트 할당수를 판단한다.
할당 비트수 판단 회로(106)는 마스크 계산 회로(105)로부터의 각 대역에 대한 허용 소음 레벨을 각 밴드에 있어서 데이타 수, 즉 그 대역에 있어서 스펙트럼 데이타 수로 나누어 각 대역의 스펙트럼 데이터 당 허용 소음 레벨을 찾아낸다. 또한 회로(106)는 데이터 당 허용 소음 레벨과 블록마다의 플로팅 계수에 기초하여 할당 비트에 관한 정보를 얻어낸다.
한편, 할당 비트수를 판단할 때, 블록 플로팅 계산 회로(107)에서 플로팅 계수를 계산할 적에 스펙트럼 데이타의 수는 에너지 계산회로(104)에서 그리고 소음 레벨 세팅 수단인 마스크 계산회로(105)에서 허용 소음 레벨을 계산할 적에 스펙트럼 데이타의 수에 일치된다. 다시 말하자면, 할당 비트수를 판단할 때, 블록 플로팅 계산 회로(107)에 있어서 처리 단위 즉 블록들의 수는 그 스펙트럼 데이타의 수와 일치시키는 소음 레벨 설정 수단에 있어서의 단일 처리 단위 또는 대역에 정합되거나, 허용 소음 레벨을 계산하는 그 처리 단위 또는 대역들의 수는 블록 플로팅 계수를 계산하는 처리 단위 또는 블록에 일치된다. 상기 연산은 다음과 같은 관점에서 실행될 필요가 있다. 즉, 임계 대역들의 대역폭이 더 높은 주파수쪽으로 더 넓어지기 때문에, 블록 플로팅 계수를 계산하는데 있어서 데이타 수가 범위 데이타의 수에 일치되지 않으면 할당 비트수를 얻는 계산이 가능하지 않도록 데이터 수는 범위마다 다르다는 것이다.
본 발명의 할당 비트수 판단 회로(106)에서 제 13도에 도시한 바와 같이 레벨 AD(E2-E3)가 얻어지고, 여기서 E3는 블록 b(데이타의 수가 전술한 바와 같이 일치된 경우의 블록)에 있는 다수의 스펙트럼 데이타 S의 총 에너지 레벨 E0을 블록 b의 데이타 수로 나누어서 얻어지는 스펙트럼 데이터 당 허용 소음 레벨이고, E2는 제 13 도에 도시한대로 블록 b 의 스펙트럼 데이타 S 중 최대값 데이타 Smax에 상응한 환산계수 또는 블록 플로팅 계수의 레벨이다. 제 13 도에 도시한 레벨은 6 비트로 표시되고, dB 레벨은 (E2-E3)로부터 구해진 dB의 레벨은 비트로 환산하여 계산된다((E2-E3)/6.0 비트). 그 결과의 데이타는 블록 b의 할당 비트수에 관한 정보로 사용된다.
한편, 통상적인 실시에서는 레벨 ad(E0-E1)을 구하고(여기서, E0는 블록 b의 총 에너지 레벨을 나타내고, E1은 총 에너지 레벨 E0를 기초로 하여 구해진다), (E2-E3)로부터 구해진 dB의 레벨 ad를 비트로 환산하여 계산하고, 그 결과 데이터를 블록 b에 대한 할당된 비트 수를 고려하는 정보로서 사용한다.
전술한 방식으로 얻어진 할당 비트수 정보는 부호화 회로(103)에 공급되고, 부호화는 할당 비트수 정보에 기초하여 실행된다.
전술한 실시예에 있어서, 각 블록 또는 대역에 있어서 소음 레벨은 허용 소음 레벨내에 억제될 수 있고, 그 신호가 고 음조라 할지라도 비트수는 신호 특성에 맞도록 얻어질 수 있다.
할당 비트수 판단회로(106)에서 나온 할당 비트수에 관한 정보는 출력 단자(109)에서 출력되어, 부호화된 데이타를 복호화하는 하단의 부호화 장치(도시안됨)에서 사용된다.
블록 플로팅 계산 회로(107)에서 나온 블록 플로팅 계수의 정보는 출력 단자(110)에서 출력되어, 부호화 장치에서 부호화하는데 사용된다.
제 14 도에 있어서, 에너지 계산회로(104)와 하단의 회로에 있어서 마스크 효과와 임께 대역들을 고려하여 허용 소음 레벨을 설정하는 구성이 설명된다.
제 14 도에 도시된 배열은 각각의 임계 대역들의 에너지(피크 값 또는 평균 값)에 기초하여 각 대역에 대해 허용 소음 레벨을 설정하는 소음 레벨 설정 수단으로서 여러 가지 회로들로 구성된다.
제 14 도에 있어서, 입력 단자(100)에 공급된 시간축상의 디지탈 오디오 데이타는 주파수 분석 회로(102)의 DCT 회로(111)에 전송되고, 주파수 분석 회로(102)에는 진폭 위상 정보 발생 회로(112)도 제공된다. DCT 회로(111)에 있어서, 시간축상의 오디오 데이타는 단위 시간 또는 단위 블록 시간의 간격을 두고 주파수축상의 데이타로 변환되어, 실수 성분 Re 와 허수 성분 Im 으로 구성된 DCT 계수 데이타를 생성한다. 이 DCT 계수 데이타는 진폭 위상 정보 발생 회로(112)에 전송되며, 여기서 진폭 정보 Am 과 위상 정보 Ph 는 성분 Re 과 Im 으로 생성되어 출력된다.
진폭 정보 Am 와 위상 정보 Ph 중에서, 진폭 정보 Am 는 할당 비트수 판단 회로(106)로 전송되어 진폭 정보 부호화 회로(160) 및 위상 정보 부호화 회로(170)에서 적합한 할당 비트수 정보를 얻는데 사용된다. 일반적으로 인간의 청각은 주파수 범위의 진폭 또는 전력에 민감하지만 위상에 대해서는 극히 둔하므로, 이 실시예에 있어서는 오직 진폭 정보 Am 만이 할당 비트수 정보를 얻는데 사용된다.
주파수 분석 회로(102)의 진폭 정보는 부호화를 위한 진폭 정보 부호화 회로(160)로 전송되는 한편, 위상 정보 Ph 는 마찬가지로 부호화를 위해 위상 정보 부호화 회로(170)에 공급된다. 부호화 회로(160, 170)에 의한 부호화에 있어서, 위상 정보 Ph 에 대해 할당된 비트수는 후술하는 바와 같이 주파수 분석기 (102) 출력의 소정 대역에 대하여, 부호화를 위해 진폭 정보 Am 에 할당된 비트 수 보다 더 작게 감소된다. 진폭 정보 역시 할당 비트수 판단 회로(106)에 공급된다. 할당 비트수 판단 회로(106)는 후술하는 바와 같이 블록 플로팅 계수 및 데이타 당 허용 소음 레벨로부터 할당 비트수 정보를 판단한다.
또한 할당 비트수 판단 회로(106)는 후술하는 바와 같이 상응하는 부호화 회로(160, 170)에 전송하기 위해 진폭 정보 Am에 기초하여, 진폭 정보 Am를 부호화하는 할당 비트수 정보와 위상 정보 Ph를 부호화하는 할당 비트수 정보를 판단한다.
주목할 사항으로서, 할당 비트수 판단 회로(106)에 있어서, 진폭 정보 Am는 인간의 청각 특성을 고려한 임계 대역들에 따라 분할될 수 있고, 마스크 량은 각 대역의 진폭 정보 Am 의 에너지로부터 얻어지며, 각 대역의 진폭 정보 Am 를 부호화하는 할당 비트수와 위상 정보 Ph를 부호화하는 할당 비트수는 마스크 량에 기초한 허용 소음 레벨을 사용하여 판단된다. 각 밴드에 대한 할당 비트수를 판단함에 있어서, 위상 정보 Ph 에 대한 할당 비트수는 인간의 청각 특성을 고려하여 진폭 정보 Am 에 대한 할당 비트수 보다 작도록 선택된다. 이런 식으로 위상 정보 Ph에 할당된 비트수를 감소시킴으로써, 위상 정보 부호화 회로(170)에서 출력된 위상 정보의 부호화된 데이타에서 비트수는 감소될 수 있다. 위상 정보 Ph에 할당된 비트수가 감소된다 할지라도, 그러한 감소는 사람의 귀에 대한 음질을 저하시키는 것으로 생각되지는 않는다.
제 14 도에 있어서, 주파수 분석 회로(102)에서 나온 진폭 정보의 디지탈 데이타는 디지탈 데이타를 임계 대역들로 분할하는 대역 분할 회로(113)로 송신된다. 임계 대역들에 있어서는, 인간 청각의 어떤 특성이나 주파수 분석 능력이 고려된다. 예컨대, 대역폭이 고주파수쪽으로 더 넓어지도록 주파수 영역은 25 대역으로 분할된다. 즉, 인간의 청각은 대역통과 필터의 특성과 유사한 특성을 가진다. 각각의 필터들로 분할된 각각의 대역들은 임계 대역으로 호칭된다.
대역 분할 회로(113)에서 분할된 각 대역의 디지탈 데이타는 총합 검색 회로(114)로 전송되고, 여기서 각 대역 당 에너지(즉 각 대역에서의 스펙트럼 강도)는 각 대역에서 각 스펙트럼 데이타의 강도들의 총합에 의해 얻어진다. 총합 검색 회로(114)의 출력, 즉 각 밴드의 총 스펙트럼은 버크 (Burke) 스펙트럼이라 호칭된다. 각 대역에서 버크 스펙트럼 SB은 제 15 도에 예시되어 있다. 이 도면에서 임계 대역들의 수는 12가 되도록 (B1내지 B12)선택된다.
소위 마스킹(masking)에 대한 버크 스펙트럼 SB의 효과를 고려하여, 소정의 가중함수(weighting function)가 버크 스펙트럼에 컨보루션된다. 이를 위하여, 총합 검색회로 (114)의 출력, 즉 버크 스펙트럼 SB의 값들이 필터 회로(115)에 전송된다. 필터 회로(115)는 입력 데이타를 순차 지연시키는 다수의 지연 장치, 지연 장치의 출력에 필터 상수를 (가중 함수들)을 곱하는 다수의 멀티 플라이어들(예컨대 대역들과 연관된 25 개의 멀티플라이어들), 그리고 멀티플라이어의 출력들을 합하는 합산 장치로 구성된다. 버크 스펙트럼의 컨벌루션(convolution)은 멀티플라이어들 M, M-1, M-2, M-3, M+1, M+2 및 M+3 에서 각각 필터 상수 1, 0.15, 0.0019, 0.0000086, 0.4, 0.06 및 0.007 을 곱함으로써 필터 회로 (115)에서 실행된다. 여기서 M 은 임의의 정수이다. 이러한 컨벌류션에 의해 제 15 도의 쇄선으로 도시된 영역의 총합이 계산된다.
필터 회로(115)의 출력은 컨벌루션 영역의 허용 소음 레벨에 상응하는 레벨 a를 얻는데 적합한 감산기(116)에 공급된다. 허용 소음 레벨에 상응하는 레벨 a는 후술하는 바와 같은 역 컨벌루션에 의해 각 임계 대역에 대한 허용 소음 레벨을 제공하는 레벨이다. 레벨 a를 얻기 위한 허용 가능한 함수(마스킹 레벨을 나타내는 함수)가 감산기(116)에 공급된다.
레벨 a는 허용가능 함수를 증가 또는 감소시킴으로써 조절된다. 이 허용 가능 함수는 후술하는 함수 발생기(129)로부터 공급된다.
저주파수 범위에서 고주파수 범위쪽으로 임계 대역들에 따른 수가 i라면, 허용 소음 레벨에 사응한 레벨 a는 다음의 공식으로 얻어진다.
a = S-(n-ai)
여기서 n 과 a 는 상수이고, a>0 이며, S 는 상기 컨벌루션된 스펙트럼의 강도이고, 상기 공식에서 (n-ai)는 허용가능 함수이다. 제 14 도의 실시예에서 n=38 이고, a=1 이며, 이런 경우 음질의 저하 없이 최적 부호화가 가능하다.
이런식으로 레벨 a가 얻어지고, 상응하는 데이타는 컨벌루션된 영역의 레벨 a 를 역컨벌루션하는데 적합한 디바이더 (divider)(117)로 전송된다. 그래서 역컨벌루션에 의해 마스크 스펙트럼이 레벨 a로부터 얻어질 수 있다. 즉, 마스크 스펙트럼은 허용 소음 레벨이 된다. 역 컨벌루션(deconvolution)은 복잡한 처리에 필요하지만, 단순화된 디바이더(117)에 의해 제 14 도의 실시예에서 실행된다.
마스크 스펙트럼은 합성 회로(118)를 통해 감산기 (119)에 전송되고, 감산기(119)에는 지연 회로(121)를 거쳐 총합 검색 회로(114)의 출력, 즉 전술한 총합 검색 회로(114)의 버크 스펙트럼 SB이 공급된다. 감산기(119)로 마스크 스펙트럼과 버크 스펙트럼 SB의 차를 구함으로써 마스크 레벨 MS 미만의 버크 스펙트럼 SB 부분이 제 16 도와 같이 마스크된다.
합성 회로(118)에 의한 합성에 있어서, 제 17 도에 도시한 바와 같은 인간 청각 특성을 나타내는 최소 가청 커브 발생기(122)로부터 소위 최소 가청 커브 RC 를 지시하는 데이타가 전술한 마스크 스펙트럼과 조합될 수 있다. 최소 가청 커브에 있어서, 그 절대 레벨이 최소 가청 커브보다 낮으면 노이즈가 들리지 않는다. 최소 가청 커브는 부호화는 동일 하지만 예컨대 재생 볼륨의 차이와 같이 달라진다. 그러나, 실용적인 디지탈 시스템에 있어서, 16 비트 동적 범위의 음악에는 별 차이가 없으므로, 사람의 귀에 가장 잘 들리는 4kHz 근처의 주파수 범위에서 양자화 잡음(quantizing noise)이 들리지 않으면, 최소 가청 커브 레벨 미만의 양자화 잡음은 다른 주파수 범위에서 들리지 않는 것으로 생각된다. 그러므로, 시스템의 워드 길이 중 4kHz 근처의 노이즈가 들리지 않고 허용 노이즈 레벨이 최소 가청 커브 RC 와 마스크 스펙트럼 MS 의 합성에 의해 얻어지도록 시스템이 사용되면, 이런 경우에 음영선까지의 노이즈 레벨을 취할 수도 있다. 한편, 제 14 도의 실시예에서 최소 비가청 커브의 4kHz 레벨이 예컨대 20 비트에 상응한 최소 레벨에 일치된다. 제 17 도에서 신호 스펙트럼 SS 이 또한 도시된다.
유의해야할 사항으로서, 허용 노이즈 레벨 교정 회로 (120)에 있어서, 감산기(119)의 허용 노이즈 레벨은 소위 등라우드니스 커브의 정보에 기초하여 교정된다. 허용 노이즈 레벨 교정회로(120)에는 교정 값 판단 회로(128)의 출력이 공급된다.
교정값 판단회로(128)는 등라우드니스 커브의 정보 데이타에 기초하여 감산기(119)의 허용 노이즈 레벨을 교정하는 교정값 데이타를 출력한다. 감산기(119)의 허용 노이즈 레벨은 허용 노이즈 레벨 교정 회로(120)에 전송되는 교정 값에 의해 교정된다.
한편, 등라우드니스 커브는 인간 청각의 어떤 특성에 관계하며, 1kHz의 순수음과 같은 크기로 들리는 각각의 주파수들에서 음압들을 연결시킴으로써 얻어진다. 등라우드니스 커브는 제 17 도에 도시된 최소 가청 커브의 실질적으로 동일한 커브를 그린다. 등라우드니스 커브에 있어서, 4kHz 근처의 1kHz 에서 8~10dB 만큼 낮은 음압을 지닌 소리는 1kHz 와 동일한 크기로 들리는 반면, 음압이 1kHz 의 음압보다 약 15dB 정도 더 높지 않으면 50kHz 근처에서 소리가 들리지 않는다.
이런 생각에서, 등라우드니스 커브를 고려한 허용 노이즈 레벨의 교정이 인간 청각의 특성에 적합하다고 볼 수 있다.
이런 식으로 판단된 허용 노이즈 레벨에 관한 정보가 ROM(130)에 전송되고, 이 ROM(130)에서는 진폭 정보 Am 과 위상 정보 Ph를 부호화하는데 사용되는 다수의 할당 비트수 데이타가 저장된다. 감산 회로(119)의 출력(각 대역의 에너지 와 노이즈 레벨 세팅 수단의 출력 사이의 차이)에 일치하는 할당 비트수 데이타가 ROM(130)에서 출력된다. 위상 정보에 할당된 비트수는 전술한 대로, 진폭 정보에 할당된 비트수 보다 더 적다. ROM(130)의 출력은 진폭 정보 부호화 회로(160)와 위상 정보 부호화 회로(170)에 공급된다. 회로(160)에서 지연 회로(123)를 통해 공급된 진폭 정보 Am 는 ROM(130)의 할당 비트수로 부호화되는 한편, 회로(170)에서는 지연 회로(124)를 통해 공급된 위상 정보 Ph 가 부호화된다. 다시말해서, 이들 회로 (160, 170)에서, 범위 성분들은 임계 대역들의 에너지들과 허용 노이즈 레벨간의 차이 레벨에 따라 할당된 비트수로 부호화되어, 위상 정보 Ph 에 할당된 비트수가 크기 정보 Am 에 할당된 비트수 보다 더 적게된다. 한편, 지연 회로(121)는 합성 회로(118)의 상단측 회로에서 생긴 지연들을 고려하여 총합 검색 회로(114)의 버크 스펙트럼 SB을 지연함과 아울러, 지연 회로 (123, 124) 또는 ROM(130)의 상단측 회로에 생긴 지연들을 고려하여 진폭 정보 Am 또는 위상 정보 Ph를 지연한다.
위상 정보 Ph에 대한 할당 비트수 정보와 진폭 정보 Am 에 해당 할당 비트수 정보는 판단 회로(106)에서 복호화 회로에 직접 공급되지만, 할당 비트수 정보의 비트수는 이 실시예에서 단축된다.
즉, 판단회로(106)에서 진폭 정보 Am에서 위상 정보 Ph의 감소된 비트수는 이미 판단된다. 예컨대, 위상 정보 Ph의 할당 비트수와 진폭 정보 Am 의 할당 비트수가 미리 설정되어 높은 범위(예컨대, 10kHz 이상)에서 위상 정보 Ph에 대한 할당 비트수가 진폭 정보 Am에 대한 할당 비트수 보다 1 비트씩 더 적게 한다. 이런 식으로, 위상 정보에 대해 또는 진폭 정보에 대해 단지 하나의 할당 비트 정보만이 위상 정보 Ph 및 진폭 정보 Am의 부호화된 데이타로 전송될 수 있다.
즉, 하단측 부호기가 비트 감소의 예정된 조건들을 통지 받으면, 그 부호기는 나머지 비트수 정보로부터 다른 할당 비트수 정보를 얻을 수 있다. 그래서 할당 비트수 정보에 대한 비트수가 감소되도록 나머지 비트수 정보는 전송될 필요가 없다. 한편, 할당 비트수 정보로서 전송된 정보가 위상 정보 Ph 의 정보라면, 전송된 비트수는 진폭 정보 Am의 할당 비트수 정보를 전송하는 경우에 비하여 감소될 수 있다.
진폭 정보 부호화 회로(160)의 진폭 정보로부터 부호화된 데이타는 출력 단자(161)를 통해 출력되는 한편, 위상 정보 Ph로부터 부호화된 데이타는 출력 단자(171)를 거쳐 출력된다. 판단 회로(106)에서 출력된 할당 비트수는 출력 단자(151)로부터 출력된다. 진폭 정보 Am로부터 부호화된 데이타오 위상 정보 Ph로부터 부호화된 데이타는 할당 비트수 정보를 사용하여 복호화된다.
전술한 장치에 있어서, 입력 디지탈 데이터는 주파수 분석기에 의해 진폭 정보 Am과 위상 정보 Ph로 변환되고, 위상 정보 Ph 및 진폭 정보 Am의 부호화시에 위상 정보 Ph에 할당된 비트수는 진폭 정보 Am에 할당된 비트수 보다 더 적도록 감소되며, 그래서 부호화된 데이타를 감소하는 것이 가능하게 된다.
그 외에, 진폭 정보 Am에 비하여 위상 정보 Ph에 대한 감소된 비트수가 각 대역에 대해 예정되어 있으면, 진폭 정보 Am에 대해 또는 위상 정보 Ph에 대해 단 하나의 할당 비트수 정보만이 전송될 필요가 있고, 그래서 할당된 비트 정보를 전송하는 비트수가 더욱 감소될 수 있다. 또한, 각 범위에 할당된 비트수가 각 대역의 진폭 정보의 에너지로부터 얻은 마스크 량에 기초한 허용 노이즈 레벨을 사용하여 설정되므로, 청각에 관한 한 덜 저질화되도록 비트 단축이 달성될 수 있다.
동시에, 상기에서 언급한 최소 가청 커브의 합성은 생략될 수 있으며, 상기 경우에서, 최소 가청 커브 발생기(122)와 합성 회로(118)는 제거되고 감산기(116)로부터의 출력은 디바이더(117)에 의해서 디콘벌루션(deconvolution) 후, 감산기(119)에 직접 전송된다.
본 발명은 제 12 도의 실시예에서와 같이, 직교 변환에 의해서 입력 디지탈 신호를 처리하는 적응 변환 부호화뿐만 아니라, 서브 대역 부호화(SBC)를 수행하기에 적합한 장치에도 적용될 수 있으며, 이 경우에서, 신호는 각 대역에 할당된 비트수를 결정하기 위해 대역 통과 필터 등에 의해서 복수 대역으로 분할된다.
본 고능률 디지탈 데이타 부호화 장치에 대하여, 각각의 범위에 대한 직교 변환의 블록 길이가 각 대역의 직교 변환 전에 블록 데이타의 특성(과도 또는 블변 등)에 기초하여 블록 길이 결정 회로에서 결정되고, 각 대역에 대한 직교 변환이 그와 같이 결정된 블록 길이에 따라 수행되므로, 비트 압축이 구성될 수 있는 동안, 과도 또는 불변과 같은 신호 특성에 따라 부호화가 수행될 수 있다.
본 고능률 디지탈 데이타 부호화에 관하여, 각각의 직교 변환 수단으로부터의 출력 중 하나만이 복수의 직교 변환 수단의 출력에 기초하여, 선택될 수 있으므로, 최적 부호화 출력은 입력 디지탈의 특성과, 최적 음질이 복호화에 의해서 생성될 수 있도록 부호화 시간에서 할당된 비트의 최소 수를 가진 직교 변환 수단의 출력을 선택하고 부호화 출력을 음성으로 변환함으로서 인간의 청각 감지의 특성에 따라 얻어 질 수 있다.
더우기, 본 고능률 디지탈 데이타 부호화 장치에 관하여, 부호화 할시에, 할당된 비트의 수가 입력 디지탈 데이타의 주파수 분석에 의해서 얻어진 데이타로 구성된 블록의 최대값 데이타에 기초하여 플로팅 계수와 블록마다의 에너지에 기초하여 허용 노이즈 레벨을 토대로 결정되므로, 최적 비트 할당은 고음 신호일 때마다 성취될 수 있다.
더우기, 본 고능률 디지탈 데이타 부호화 장치에 관하여, 입력 디지탈 데이타가 주파수 분석에 의해서 진폭 정보 및 위상 정보로 변환될 때, 그리고 진폭 정보 및 위상 정보가 부호화될 때, 소정의 위상 정보에 할당된 비트수는 진폭 정보에 할당된 것보다 작게 하기 위해서 감소되며, 그 결과, 비트 압축율이 상승되고 전송 비트율은 감소된다.
더우기, 본 고능률 디지탈 데이타 부호화 장치에 관하여, 위상 정보의 할당된 비트수 정보가 감소되는 대역이 인간의 청각 감지의 특성에 따라서 고임계 대역이므로, 음질 저하는 청각 감지가 영향을 받는 한 감소된다.
본 발명의 장치는 소위 콤팩트 디스크와 같은 패키지 매체상에 기록하는 데이타 부호화 장치에 효과적으로 적용 될 수 있다.

Claims (19)

  1. 입력 디지털 데이터가 다수의 샘플들에 의해서 블록들로 배열되며, 계수 데이터를 발생시키도록 각 블록마다 직교 변환이 행해지고, 상기 계수 데이터가 비트들의 적응 수로 부호화되는 고능률 디지털 데이터 부호화 장치에 있어서, 상기 입력 디지털 데이터를 여러 가지 블록 길이들로 직교 변환 처리하기 위한 다수의 직교 변환 수단을 포함하며, 상기 직교 변환 수단의 출력들에 기초하여 상기 직교 변환 수단으로부터의 출력들 중 하나만이 선택되는 것을 특징으로 하는 고능률 디지털 데이터 부호화 장치.
  2. 제 1 항에 있어서, 상기 블록 길이들은 분할에 의해 고주파수들쪽으로 보다 짧아지는 고능률 디지털 데이터 부호화 장치.
  3. 입력 디지털 데이터가 다수의 대역들로 분할되며, 다수의 샘플들로 각각 구성된 블록들이 각 대역마다 형성되고, 계수 데이터를 발생시키도록 상기 대역의 각 블록마다 직교 변환이 행해지고, 상기 계수 데이터가 부호화되는, 고능률 디지털 데이터 부호화 장치에 있어서, 각 대역의 직교 변환 전에 블록 데이터의 특성에 기초하여 각 대역의 직교 변환에 대한 블록 길이를 결정하기 위한 블록 길이 결정 회로를 포함하며, 상기 각 대역의 직교 변환은 상기 블록 길이 결정 회로에 의해서 결정된 블록 길이에 따라서 수행되는 것을 특징으로 하는 고능률 디지털 데이터 부호화 장치.
  4. 제 3 항에 있어서, 각 대역의 대역폭은 고주파수들쪽으로 보다 넓게 되도록 선택되는 고능률 디지털 데이터 부호화 장치.
  5. 제 4 항에 있어서, 상기 블록 길이들은 분할에 의해서 고주파수들쪽으로 보다 짧아지는 고능률 디지털 데이터 부호화 장치.
  6. 제 4 항에 있어서, 상기 블록 길이들은 중간 및 고 범위에서 다른 고능률 디지털 데이터 부호화 장치.
  7. 제 1 항 또는 제 2 항에 있어서, 상기 직교 변환은 이산 코사인 변환(DCT)인 고능률 디지털 데이터 부호화 장치.
  8. 제 1 항 또는 제 2 항에 있어서, 상기 직교 변환은 고속 퓨리에 변환(FFT)인 고능률 디지털 데이터 부호화 장치.
  9. 고능률 디지털 데이터 부호화 장치에 있어서, 입력 디지털 데이터를 주파수 분석하기 위한 주파수 분석 수단과, 상기 주파수 분석 수단으로부터 다수의 출력 데이터로 이루어져 있는 각 블록마다 에너지들을 조사하고, 블록단위로 에너지들에 기초하여 허용 노이즈 레벨을 설정하기 위한 노이즈 레벨 설정 수단과, 상기 주파수 분석 수단으로부터 다수의 출력 데이터로 이루어져 있는 각 블록 내의 최대 값의 데이터에 기초하여 플로팅 계수들을 산출하기 위한 플로팅 계수 계산 수단과, 상기 주파수 분석 수단의 출력들을 부호화하기 위한 부호화 수단과, 상기 노이즈 레벨 설정 수단의 출력과 상기 플로팅 계수 계산 수단의 출력에 기초하여, 상기 부호화 수단에 의해서 부호화 할 때의 할당된 비트 수를 구하는 할당 비트 수 결정 회로를 포함하는 것을 특징으로 하는 고능률 디지털 데이터 부호화 장치.
  10. 제 9 항에 있어서, 상기 노이즈 레벨 설정 수단은 각 블록 내의 에너지들로부터 마스킹 양을 계산하여 상기 마스킹 양에 기초한 노이즈 레벨을 설정하는 고능률 디지털 데이터 부호화 장치.
  11. 제 10 항에 있어서, 상기 노이즈 레벨 설정 수단은 인간의 청각 특성에서 라우드니스(loudness) 곡선을 고려하여 상기 마스킹 양을 계산하는 고능률 디지털 데이터 부호화 장치.
  12. 제 9 항 내지 제 11 항 중 어느 한 항에 있어서, 상기 직교 변환은 이산 코사인 변환(DCT)인 고능률 디지털 데이터 부호화 장치.
  13. 제 9 항 내지 제 11 항 중 어느 한 항에 있어서, 상기 직교 변환은 고속 퓨리에 변환(FFT)인 고능률 디지털 데이터 부호화 장치.
  14. 고능률 디지털 데이터 부호화 장치에 있어서, 입력 디지털 데이터를 진폭 정보 및 위상 정보로 변환하기 위해 입력 디지털 데이터를 주파수 분석하기 위한 주파수 분석 수단과, 상기 진폭 정보 및 상기 위상 정보를 부호화하기 위한 부호화 수단을 포함하며, 상기 부호화 수단에서의 부호화 시에, 상기 위상 정보에 할당된 비트들의 수는 상기 주파수 분석 수단의 출력의 소정 범위에서 상기 진폭 정보에 할당된 것 보다 적게 선택되는 것을 특징으로 하는 고능률 디지털 데이터 부호화 장치.
  15. 제 14 항에 있어서, 상기 위상 정보에 할당된 비트들의 수가 상기 진폭 정보에 할당된 것 보다 적게 되도록 부호화 시에, 비트들의 수는 소정의 주파수 범위에서만 감소되는 고능률 디지털 데이터 부호화 장치.
  16. 다수의 부호화 데이터와 보조 정보로서 전송되거나 기록되는 디지털 데이터를 복호화하고, 상기 부호화 데이터 및 상기 보조 정보가 다수의 샘플들에 의해 입력 디지털 데이터를 배열함으로서 발생되며, 계수 데이터를 발생시키도록 블록마다 상이한 블록 길이들로 직교 변환을 수행하고, 상기 계수 데이터가 적응적인 비트들의 수로 부호화되는, 디지털 데이터 복호화 장치에 있어서, 상기 부호화 데이터 및 상기 보조 정보는 다수의 복호화 회로들에 의해서 복호화되고 역 직교 변환 회로에 의해서 시간 축 정보로 처리되며, 상기 시간 축 정보는 디지털 오디오 신호들을 발생시키도록 역 QMF 회로에 의해서 합성되는 것을 특징으로 하는 디지털 데이터 복호화 장치.
  17. 제 16 항에 있어서, 상기 역 직교 변환 회로는 역 DCT 회로인 디지털 데이터 복호화 장치.
  18. 제 3 항 내지 제 6 항 중 어느 한 항에 있어서, 상기 직교 변환은 이산 코사인 변환(DCT)인 고능률 디지털 데이터 부호화 장치.
  19. 제 3 항 내지 제 6 항 중 어느 한 항에 있어서, 상기 직교 변환은 고속 퓨리에 변환(FFT)인 고능률 디지털 데이터 부호화 장치.
KR1019920703022A 1991-03-29 1992-03-27 고능률디지털데이터부호화및복호화장치 KR100293855B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP91-91183 1991-03-29
JP91-91185 1991-03-29
JP03091183A JP3089690B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法
JP03091185A JP3089691B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法
PCT/JP1992/000387 WO1992017884A1 (en) 1991-03-29 1992-03-27 High efficiency digital data encoding and decoding apparatus

Publications (2)

Publication Number Publication Date
KR930700945A KR930700945A (ko) 1993-03-16
KR100293855B1 true KR100293855B1 (ko) 2001-09-17

Family

ID=26432643

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019920703022A KR100293855B1 (ko) 1991-03-29 1992-03-27 고능률디지털데이터부호화및복호화장치

Country Status (18)

Country Link
US (1) US5414795A (ko)
EP (1) EP0537361B1 (ko)
KR (1) KR100293855B1 (ko)
CN (1) CN1030129C (ko)
AT (1) ATE153165T1 (ko)
AU (2) AU648656B2 (ko)
BR (1) BR9204820A (ko)
CA (1) CA2083713C (ko)
DE (1) DE69219718T2 (ko)
DK (1) DK0537361T3 (ko)
EG (1) EG20351A (ko)
FI (1) FI112979B (ko)
HU (1) HU213963B (ko)
NO (1) NO306007B1 (ko)
PT (1) PT100309B (ko)
TR (1) TR25961A (ko)
WO (1) WO1992017884A1 (ko)
ZA (1) ZA921988B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100528149B1 (ko) * 1998-04-16 2005-11-15 소니 가부시끼 가이샤 디지털 신호처리장치

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
EP0535889B1 (en) * 1991-09-30 1998-11-11 Sony Corporation Method and apparatus for audio data compression
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法
JP3188013B2 (ja) * 1993-02-19 2001-07-16 松下電器産業株式会社 変換符号化装置のビット配分方法
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
CN1064773C (zh) * 1993-06-30 2001-04-18 索尼公司 数字信号的编码方法和解码方法
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5415979A (en) * 1993-07-28 1995-05-16 Konica Corporation Stabilizer composition for processing silver halide photographic light-sensitive material and a method of processing silver halide light-sensitive material using the same
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
KR100330290B1 (ko) * 1993-11-04 2002-08-27 소니 가부시끼 가이샤 신호부호화장치,신호복호화장치,및신호부호화방법
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JPH07205496A (ja) * 1994-01-14 1995-08-08 Oki Electric Ind Co Ltd ページプリンタ及びデータ圧縮方法
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH09506478A (ja) * 1994-10-06 1997-06-24 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 光放射半導体ダイオード及びこのようなダイオードの製造方法
KR0183328B1 (ko) * 1994-10-28 1999-04-15 다나까 미노루 부호화 데이터 복호 장치와 그것을 이용한 화상 오디오다중화 데이터 복호 장치
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
EP0721257B1 (en) * 1995-01-09 2005-03-30 Daewoo Electronics Corporation Bit allocation for multichannel audio coder based on perceptual entropy
CN1110955C (zh) * 1995-02-13 2003-06-04 大宇电子株式会社 自适应地编码来自多条通道的输入数字音频信号的装置
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP3189660B2 (ja) 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
KR100223169B1 (ko) * 1996-06-14 1999-10-15 윤종용 펄스부호변조된 디지털 오디오신호의 기록 및 재생을 위한 시스템
US5892746A (en) * 1996-06-15 1999-04-06 Samsung Electronics Co., Ltd. System for recording and/or reproducing a pulse code modulation digital audio signal
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6353584B1 (en) * 1998-05-14 2002-03-05 Sony Corporation Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
US7023789B2 (en) 1999-12-21 2006-04-04 Robert Bosch Gmbh Playback device and storage medium for selective storage of data as a function of data compression method
ES2287122T3 (es) * 2000-04-24 2007-12-16 Qualcomm Incorporated Procedimiento y aparato para cuantificar de manera predictiva habla sonora.
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
US8326606B2 (en) * 2004-10-26 2012-12-04 Panasonic Corporation Sound encoding device and sound encoding method
KR20100079121A (ko) * 2008-12-30 2010-07-08 주식회사 동부하이텍 이미지 인코더 및 이미지 인코딩 방법
US8386266B2 (en) 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
US8428381B2 (en) * 2010-06-04 2013-04-23 Altek Corporation Image compression method with variable quantization parameter
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US8831932B2 (en) 2010-07-01 2014-09-09 Polycom, Inc. Scalable audio in a multi-point environment
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
US10699721B2 (en) * 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01276980A (ja) * 1988-04-28 1989-11-07 Sharp Corp 画像データ直交変換符号化方式
JPH0366228A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ブロック符号化装置と復号化装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CA1292071C (en) * 1985-06-28 1991-11-12 Tomohiko Taniguchi Coding transmission equipment for carrying out coding with adaptive quantization
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4815068A (en) * 1987-08-07 1989-03-21 Dolby Ray Milton Audio encoder for use with more than one decoder each having different characteristics
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
CA2026207C (en) * 1989-01-27 1995-04-11 Louis Dunn Fielder Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01276980A (ja) * 1988-04-28 1989-11-07 Sharp Corp 画像データ直交変換符号化方式
JPH0366228A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ブロック符号化装置と復号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100528149B1 (ko) * 1998-04-16 2005-11-15 소니 가부시끼 가이샤 디지털 신호처리장치

Also Published As

Publication number Publication date
KR930700945A (ko) 1993-03-16
DE69219718D1 (de) 1997-06-19
CA2083713A1 (en) 1992-09-30
NO924551L (no) 1993-01-25
NO306007B1 (no) 1999-08-30
AU1448992A (en) 1992-11-02
FI112979B (fi) 2004-02-13
AU5516894A (en) 1994-04-28
EP0537361A1 (en) 1993-04-21
ATE153165T1 (de) 1997-05-15
FI925401A0 (fi) 1992-11-27
WO1992017884A1 (en) 1992-10-15
PT100309A (pt) 1994-04-29
TR25961A (tr) 1993-11-01
DK0537361T3 (da) 1997-06-09
AU670655B2 (en) 1996-07-25
CN1068689A (zh) 1993-02-03
FI925401A (fi) 1992-11-27
EG20351A (en) 1999-01-31
HU213963B (en) 1997-11-28
US5414795A (en) 1995-05-09
HUT63269A (en) 1993-07-28
PT100309B (pt) 1999-04-30
EP0537361B1 (en) 1997-05-14
ZA921988B (en) 1993-02-24
BR9204820A (pt) 1993-07-13
CN1030129C (zh) 1995-10-18
DE69219718T2 (de) 1997-10-02
AU648656B2 (en) 1994-04-28
NO924551D0 (no) 1992-11-25
HU9203758D0 (en) 1993-04-28
CA2083713C (en) 2003-08-19

Similar Documents

Publication Publication Date Title
KR100293855B1 (ko) 고능률디지털데이터부호화및복호화장치
KR100279094B1 (ko) 디지털신호부호화장치
US5115240A (en) Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US5553193A (en) Bit allocation method and device for digital audio signals using aural characteristics and signal intensities
US5978762A (en) Digitally encoded machine readable storage media using adaptive bit allocation in frequency, time and over multiple channels
KR100295217B1 (ko) 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치
US5581654A (en) Method and apparatus for information encoding and decoding
JPH0435123A (ja) ディジタル信号符号化装置
JPH05248972A (ja) 音声信号処理方法
US5781586A (en) Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium
JP3189401B2 (ja) 音声データ符号化方法及び音声データ符号化装置
KR100303580B1 (ko) 송신기,엔코딩장치및송신방법
JP3041967B2 (ja) ディジタル信号符号化装置
JP3336619B2 (ja) 信号処理装置
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP3134363B2 (ja) 量子化方法
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP2913695B2 (ja) ディジタル信号符号化方法
JP3060576B2 (ja) ディジタル信号符号化方法
JP3132031B2 (ja) ディジタル信号の高能率符号化方法
JPH04302536A (ja) ディジタル信号符号化方法
JPH04104618A (ja) ディジタル信号符号化装置
JPH04302535A (ja) ディジタル信号符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050331

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee