KR19990045053A - 음성 대역 분할 디코더 - Google Patents

음성 대역 분할 디코더 Download PDF

Info

Publication number
KR19990045053A
KR19990045053A KR1019980047383A KR19980047383A KR19990045053A KR 19990045053 A KR19990045053 A KR 19990045053A KR 1019980047383 A KR1019980047383 A KR 1019980047383A KR 19980047383 A KR19980047383 A KR 19980047383A KR 19990045053 A KR19990045053 A KR 19990045053A
Authority
KR
South Korea
Prior art keywords
magnification
band
division
decoder
signal
Prior art date
Application number
KR1019980047383A
Other languages
English (en)
Other versions
KR100313204B1 (ko
Inventor
사또시 하세가와
Original Assignee
가네꼬 히사시
닛본 덴기 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가네꼬 히사시, 닛본 덴기 가부시끼가이샤 filed Critical 가네꼬 히사시
Publication of KR19990045053A publication Critical patent/KR19990045053A/ko
Application granted granted Critical
Publication of KR100313204B1 publication Critical patent/KR100313204B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/005Tone control or bandwidth control in amplifiers of digital signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

음량 제어 장치(3)은 엠퍼싸이즈될 분할대역에 인접한 분할대역들이 얼마만큼 감소되었는지에 관한 데이타를 배율 갱신 장치(2)로부터 얻으며, 재생 배율을 감소되기 이전으로 복구하는데 필요한 재생 배율에 대응하는 범위까지 음량 제어(77)의 아날로그 오디오 신호 출력 레벨을 증가시킨다. 그 결과, 원하는 분할대역(즉, 엠퍼싸이즈될 분할대역)의 신호 레벨은 원하는 분할대역의 충분한 엠퍼씨스감을 얻을 수 있도록 증가한다.

Description

음성 대역 분할 디코더
본 발명은 음성 대역 분할 디코더에 관한 것으로, 특히 음질 제어 기능을 가진 음성 대역 분할 디코더에 관한 것이다.
신호 처리의 분야에 있어서, CPU(중앙 처리 장치) 및 DSP(디지털 신호 처리기로서 동작에 있어서 빠르고 고도의 정밀성을 가짐)의 출현으로 인해 디지털 신호 처리가 종래의 아날로그 처리를 대체해 왔다.
또한, CPU 및 DSP의 성능 개선에 따라서, 비교적 어려운 프로세스라 생각되어 왔던 화상과 음성의 코딩 및 디코딩이 디지털 처리에 의해 점진적으로 실현되어 왔다. 특히, 음성의 처리에 있어서, 음질 제어가 디지털로 실현되게 되었다.
예를 들면, 일본 특허 공개 공보 No. 59-178809에 나타난 기술에서는, 디지털 필터로서 FFT(Fast Fourier Transform)를 이용해서 그때까지 아날로그 필터의 조합으로서 구성되는 이퀄라이저(equalizer)를 대체함으로써, 그때까지 정밀한 계수 셋팅에 필요했던 많은 아날로그 필터가 필요없게 되었고, 아날로그 필터의 특성에 기인한 그렇게 넓지 않은 유용 동작 범위를 증가시켰으며, 더 정밀한 주파수 범위에 대응하는 이득 셋팅을 가능하게 했다.
도 6은 상기 기술에 따른 종래 기술의 디코더를 개략적으로 도시한다. 이 경우에, 디지털 이퀄라이저(55)는 분해 필터(52), 이득 제어기(53), 및 합성 필터(54)를 포함하며, 음성 데이타 디코더로서 코딩 데이타 디코더(51)로부터 분리되어 조합되도록 구성된다.
또 하나의 기술로서는 일본 특허 공개 공보 No. 6-348295는 음성 코딩/디코딩 표준 ISO/IFC 11172-3에 규정된 통상 지칭되는 MPEG/오디오 디코더를 나타내는데, 특히 디코더의 알고리즘 특성을 이용함으로써 사용자의 취향에 맞춰서 단순한 구조로 그 디코더의 음질을 제어하는 기능을 실현한 방법이다.
상기 음성 코딩/디코딩 표준의 요점을 설명한다. 표준은 대역 분할 코딩 신호를 분할하는 것을 기술하는데, 이것은 음성 신호의 주파수 대역을 복수의 분할대역으로 분할하고, 각각의 분할대역 신호를 코딩하고 코딩된 분할대역 신호를 결합하여 얻어지는 대역 분할 코딩된 신호를 복수의 분할대역으로 분할하고, 선정된 분할대역 코딩된 신호의 배율을 변화시키고, 각각의 코딩 신호를 결합한 다음 그 결과 신호를 변환하여 선정된 주파수 특성을 가진 음성 신호를 얻는다.
도 7은 공개된 MPEG/오디오 디코더를 개략적으로 도시한다. 디코더는 도면을 참조로해서 기술될 것이다.
역양자화기(61)는 대역 분할 코딩 (또는 분할대역 코딩) 데이타를 각 분할대역의 음성 데이타로 변환한다. 그 다음, 이득 제어 회로(62)는 각 분할대역 음성 데이타의 이득을 제어한다. 그 다음, 측대역 합성 필터 뱅크(63)는 결과적인 각 측대역 음성 데이타를 합성한다. 음질 제어는 이득 제어보다도 MPEG/오디오 알고리즘을 2중화함으로써 수행된다.
상기 언급한 공보는 역양자화기(61)로부터의 각 분할대역 음성 데이타가 음성 음량을 나타내는 범위 데이타를 포함할 때, 음질은 범위 데이타를 제어함으로써 제어될 수 있다고 나타내고 있다. 그러므로 MPEG/오디오 디코더에서, 각 분할대역의 재생 배율을 나타내는 배율 데이타를 제어함으로써 음질 제어를 달성할 수도 있다.
음질 제어 기능을 가진 MPEG 1/오디오 레이어 1 디코더의 구성과 작동을 이후에 기술한다.
도 8은 이전 기술 MPEG 1/오디오 레이어 1 디코더를 도시하는 블럭 다이어그램이다. 디코더는 기본적으로 대역 분할 코딩(또는 분할대역 코딩) 시스템이고 그래서 동일 대역폭을 가진 분할대역 단위로, 즉 32 분할대역 단위로 프로세스를 실행한다.
MPEG 1/오디오 레이어 1 디코더(71)는 비트스트림 분해기(72), 역양자화기(73), 분할대역 합성 필터 뱅크(74), 및 측대역 데이타 디코더(75)로 구성된다.
비트스트림 분해기(72)는 디코더(71)에 인가된 MPEG 1/오디오 비트스트림 신호를 32 분할대역 양자화된 신호 및 속성 데이타인 측대역 데이타로 분해한다.
측대역 데이타 디코더(75)는 측대역 데이타를 디코딩해서 각 분할대역에 할당된 비트수(인간의 청각 특성을 이용해서 결정되는 양자화 비트수로서, 대다수의 비트는 인간의 청각에 중요한 부분을 포함하는 분할대역에 할당되고, 더 적은 수의 비트가 나머지에 할당됨)를 나타내는 비트 할당 데이타 및 각 분할대역의 재생 배율을 나타내는 배율 데이타를 복원한다.
역양자화기(73)는 비트스트림 분해의 결과로 얻어지는 각 신호로부터 32 분할대역 동일 밴드폭 분할대역 신호를 생성한다. 분할대역 합성 필터 뱅크(74)는 이상과 같이 얻어진 분할대역 신호를 합성하며, 그래서 선형 PCM 오디오 데이타(LPCM)를 인가한다. 인가된 LPCM의 주파수 특성은 각 분할대역의 재생 배율을 제어함으로써 제어될 수 있다.
그러나, 배율 데이타가 재생 배율을 증가하는 방향으로 나타낼 때, 디코더(예를 들면 16 비트)의 출력 데이타로서 LPCM이 표현될 수 있는 범위를 초과하는 비트수가 필요하게 될 수 있다.
이것을 피하기 위해, LPCM의 주파수 특성은 배율 데이타의 감소하는 방향으로 즉 재생 배율이 감소하는 방향으로 제어된다. 특정 주파수 대역이 엠퍼싸이즈될 때, 그 외의 대역의 배율 데이타는 감소된다. 그러나, 이러한 경우에, 전체 출력 이득이 인가되고, 원하는 대역의 엠퍼씨스감을 얻기가 어렵게 된다.
따라서 본 발명의 목적은 원하는 주파수 대역의 엠퍼씨스감을 확실하게 얻어지게 하는 음성 대역 분할 디코더를 제공하는 것이다.
본 발명에 따르면, 음성 신호를 복수의 주파수 분할대역 신호로 분할하고, 이들 신호를 코딩하고 코딩된 신호를 합성함으로써 얻어지는 대역 분할 코딩된 신호를 복수의 분할대역으로 분해하고, 소정의 분할대역 코딩 신호의 재생 배율을 갱신하고, 결과 코딩 신호를 합성하고 결과 신호를 아날로그 변환해서 소정의 주파수 특성을 가진 음성 신호를 얻기 위한 음성 대역 분할 디코더가 제공되며, 음성 대역 분할 디코더는 재생 배율의 변화를 제거하는 방향으로 아날로그 변환된 음성 신호의 이득을 제어하기 위한 음성 신호 이득 제어 수단을 더 포함한다.
재생 배율 갱신은 소정의 분할대역에 인접한 분할 밴드의 코딩 신호의 재생 배율을 감소시킨다. 재생 배율의 갱신은 재생 배율에 대응해서 제공되는 배율값을 갱신함으로써 실행된다. 배율값은 재생 배율을 증가시킴으로써 감소되도록 설정된다. 음성 대역 분할 디코더는 상한값 이상인 배율값이 입력될 경우 이 입력된 배율을 상한값으로 설정하기 위한 배율값 제어 수단을 더 포함한다. 대역 분할 코딩 신호를 복수의 분할대역으로 분할된 후 얻어진 코딩 신호는 비트 할당 데이타를 포함하며, 이러한 비트 할당은 인간의 청각 특성에 따라 결정된다. 음성 대역 분할 디코더는 재생 배율을 외부로부터 갱신하는 재생 배율 입력 수단을 더 포함한다.
본 발명의 다른 형태에 따르면, 소정의 주파수 대역의 재생 배율을 변화시킨 후 얻어진 복수의 주파수 대역의 코딩 신호를 합성하여 소정의 주파수 특성을 갖는 음성 신호를 얻기 위한 음성 분할 디코더가 제공되어 있으며, 합성된 코딩 신호의 출력의 이득은 재생 배율의 변화를 상쇄 하는 방향으로 제어된다.
합성된 코딩 신호는 아날로그 신호로 변환되며, 변환된 아날로그 신호의 이득은 재생 배율 변화를 상쇄하는 방향으로 제어된다.
본 발명의 다른 형태에 따르면, MPEG 1/오디오 비트스트림 신호를 복수의 주파수 분할대역 양자화 신호 및 특성 데이타로서의 측대역 데이타로 분해하기 위한 비트스트림 분해기, 각각의 측대역에 할당된 비트수를 나타내는 비트 할당 데이타 및 각각의 분할대역의 재생 배율을 나타내는 배율 데이타를 복구하기 위해 측대역 데이타를 디코딩하기 위한 측대역 데이타 디코더, 분해된 신호를 역양자화하여 복수의 분할대역 신호를 발생하기 위한 역양자화기, 얻어진 분할대역 신호를 합성하기 위한 분할대역 합성 필터, 측대역 데이타 디코더로부터 공급된 배율 데이타를 갱신하기 위한 배율 갱신 장치, 및 배율 갱신 장치로부터의 출력에 기초하여 분할대역 합성 필터의 출력 음량을 제어하기 위한 음량 제어 장치를 포함하는 음성 대역 분할 디코더가 제공된다.
본 발명의 다른 형태에 따르면, MPEG 1/오디오 비트스트림 신호를 복수의 주파수 분할대역 양자화 신호 및 특성 데이타로서의 측대역 데이타로 분해하기 위한 비트스트림 분해기, 각각의 측대역에 할당된 비트수를 나타내는 비트 할당 데이타 및 각각의 분할대역의 재생 배율을 나타내는 배율 데이타를 복구하기 위해 측대역 데이타를 디코딩하기 위한 측대역 데이타 디코더, 분해된 신호를 역양자화하여 복수의 분할대역 신호를 발생하기 위한 역양자화기, 얻어진 분할대역 신호를 합성하기 위한 분할대역 합성 필터, 측대역 데이타 디코더로부터 공급된 배율 데이타를 갱신하기 위한 배율 갱신 장치, 분할대역 합성 필터 뱅크의 출력 및 입력을 변환하기 위한 A/D 변환기, 및 배율 갱신 장치로부터의 출력에 기초하여 A/D 변환기의 출력 음량을 제어하기 위한 음량 제어 장치를 포함하는 음성 대역 분할 디코더가 제공된다.
음성 대역 분할 디코더는 배율 데이타를 외부적으로 갱신하기 위한 입력 장치를 더 포함한다.
본 발명에 있어서, 아날로그 변환 후에 얻어진 음성 신호의 이득은 재생 배율 변화를 상쇄하는 방향으로 제어된다. 즉, 소망의 주파수 대역의 엠퍼씨스감은, 인접한 주파수 대역의 코딩 신호의 재생 배율을 감소시키고 아날로그 변환 후에 얻어진 음성 신호의 이득을 증가시킴으로써 얻어질 수 있다.
본 발명의 다른 목적 및 특징들은, 첨부된 도면을 참조한 다음의 설명으로부터 명확해질 것이다.
도 1은 본 발명에 따른 음성 대역 분할 디코더의 한 실시예를 도시한 블럭도.
도 2는 도 1의 실시예의 동작을 도시한 흐름도.
도 3 내지 도 5는 전체 분할대역수가 5개인 경우의 특성을 도시한 도면.
도 6은 종래 기술의 디코더의 블럭도.
도 7은 종래의 MPEG/오디오 디코더의 블럭도.
도 8은 종래의 MPEG 1/ 오디오 층 1을 도시한 블럭도.
<도면의 주요 부분에 대한 부호의 설명>
1 : 음성 대역 분할 디코더
2 : 배율 갱신 장치
3 : 음량 제어 장치
4 : 입력 장치
72 : 비트스트림 분해기
73 : 역양자화기
74 : 분할대역 합성 필터 뱅크
75 : 측대역 데이타 디코더
76 : D/A 변환기
77 : 음량 제어
이제, 도면을 참조하여 본 발명의 양호한 실시예를 기술하기로 한다.
도 1은 본 발명에 따른 음성 대역 분할 디코더의 양호한 실시예를 도시한 블럭도이다. 도면에서, 종래 기술의 예(도 8)에서와 유사한 부분은 동일한 참조 번호로 나타내었으며, 기술하지 않는다.
본 발명에 따른 음성 대역 분할 디코더(1)는 종래 기술의 예에서의 구성 요소 이외에, 측대역 데이타 디코더(75)로부터 공급된 배율 데이타를 갱신하기 위한 배율 갱신 장치(2), 배율 갱신 장치(2)로부터 분할대역이 변화된 재생 배율의 데이타를 얻음으로써 후술될 음량 제어(77)를 제어하기 위한 음량 제어 장치(3), 및 배율 데이타를 외부적으로 갱신하기 위한 입력 장치(4)를 구비한다는 점에서 종래예와 상이하다. 이 도면은 간략화를 위해, 종래 기술에서는 불필요한 D/A(디지탈-아날로그) 변환기(76) 및 음략 제어(77)를 또한 도시하고 있다.
이하, 그 동작을 기술하기로 한다. 본 명세서에서는, 기술된 종래 기술의 예에서와 공통인 부분의 동작은 기술하지 않고, 본 발명에 관련된 부분의 동작만을 기술하겠다.
먼저, 엠퍼싸이즈될 분할대역이 결정된다. 그 후, 배율 갱신 장치(2)는 측 분할대역 데이타 디코더로부터 적절한 분할대역에 인접한 분할대역의 배율 데이타를 얻으며, 이들 분할대역의 배율 데이타, 즉 재생 배율을 필요한 정도로 감소시킨다. 그 결과, 엠퍼싸이즈될 분할대역에 인접한 분할대역의 재생 배율은 엠퍼싸이즈될 분할대역의 배율 미만으로 된다. 이러한 방식으로, 적절한 분할대역이 청각에 있어 엠퍼싸이즈된다.
분할대역을 포함하는 모든 분할대역의 양자화된 신호, 갱신된 재생 배율은 역양자화기(73)를 통해 분할대역 합성 필터 뱅크(74)에 결합되며 조합된다. 그 결과 신호는 D/A 변환기(76)을 통해 아날로그 오디오 신호로 아날로그 변환되어 음량 제어(77)를 통해 제공된다.
그러나, 상술된 동작에 있어서, 엠퍼싸이즈될 분할대역의 신호의 이득(또는 재생 배율)은 변하지 않는다. 그러므로, 충분한 엠퍼씨스감은 이러한 동작만으로는 얻어질 수 없다. 본 발명에 따르면, 음량 장치(3)는 배율 갱신 장치(2)로부터 상술된 인접한 분할대역(즉, 엠퍼싸이즈될 분할대역에 인접한 분할대역)의 재생 배율의 감소에 관한 데이타를 얻으며, 음량 장치(77)로 하여금 아날로그 오디오 신호 출력 레벨을 감소 전에 재생 배율을 복구하기 위해 필요한 재생 배율에 대응하는 정도로 증가시키도록 한다. 레벨 증가는, 재생 배율을 감소되기 이전으로 복구하는데 필요한 재생 배율을 초과하도록 만들어진다. 따라서, 적절한 분할대역의 원하는 엠퍼씨스감을 달성하는 것이 가능하다. 또한, 배율 데이타는 필요한 배율 데이타를 입력 장치(4)로부터 배율 갱신 장치(2)로 공급함으로써 외부적으로 변경될 수도 있다.
도 2는 실시예의 동작을 설명하는 흐름도이다. 도 3 내지 도 5는 이득-대-주파수(또는 분할대역) 특성을 도시하는 그래프이다.
실시예는 상기 도 1에서 기술한 최적 모드의 형태와 동일한 구성이다. 도 1도 역시 참조할 것이다.
배율 갱신 장치(2)는 배율을 갱신하며, 이 배율은 측대역(side sub-band factor) 데이타 디코더(75)에서의 디코딩 결과로서 얻어지며 각각의 분할대역의 재생 배율을 나타낸다. 층(1)은 규정된 배율값, 즉, "0" 내지 "62"까지의 63개 값을 가지며, 배율이 "1"만큼씩 감소할 때마다 재생 배율은 2dB만큼씩 증가한다. 재생 배율은, 배율이 "0"일 때 최대값 2.0(배)를 가지며, 배율이 "62"일 때 최소값 0.00000120155435를 가진다. 어떤 분할대역의 이득을 사용자가 4dB 감소시키기를 원할 때의 동작 모드가 도 2를 참조하여 기술될 것이다.
측대역 데이타 디코더(75)에서의 디코딩 결과로서 얻어지는 배율이 배율 갱신 장치(2)에 제공될 때(단계 S1), 배율은 사용자가 원하는 배율값으로 갱신된다. 예를 들어, 어떤 분할대역의 얻어진 배율값이 "20"일 때, 배율은 4dB만큼 감소된 배율에 대해 20+2 = 22로 갱신된다.(단계 S2) 배율값은 "0" 내지 "62"의 범위 내에 있어야 하기 때문에, 갱신된 배율값이 최대값 "62"를 초과하는지에 대한 검사가 이루어진다.(단계 S3) 이 예에서 갱신된 배율값은 "62"를 초과하지 않기 때문에, 루틴은 종료하게 된다. 그리고, 갱신된 배율값은 역양자화기(73)으로 전달되어 역양자화를 위해 사용된다.
그러나, 측대역 데이타 디코더(5)로부터 얻어진 어떤 분할대역의 배율값이 4dB만큼의 이득 감소에 대해 "61"일 때, 계산된 배율값은 61+2 = 63이고, 이는 규정된 범위를 초과하는 값이다. 이 경우에, 최대 계수값 "62"가 설정된다.(단계 S4)
상술한 바와 같이, 각각의 분할대역의 이득은 배율값을 갱신함으로써 갱신될 수 있다. 예를 들어, 4번째 분할대역을 엠퍼싸이즈하고 싶을 때, 인접한 분할대역의 이득 데이타가 감소되어, 인접한 분할대역에 비해 4번째 분할대역의 명백한 엠퍼씨스감을 얻게된다.
그러나, 이와 같은 상태에서, 인접한 분할대역들의 이득은 감소하지만 4번째 분할대역의 이득은 실제적으로 변경되지 않는다. 이 경우에, 전체 이득은 감소한다. 그리고, 분할대역 합성 필터 뱅크(74)로부터 최종적으로 제공된 LPCM으로부터 사용자가 원하는 4번째 분할대역의 엠퍼씨스감을 얻는 것은 어렵다. 따라서, 분할대역 합성 필터 뱅크(74)의 LPCM 출력은 A/D변환기(76)에서 아날로그 오디오 신호로 변환되고, 그 다음 처리가 실행된다.
음량 제어 장치(3)은 엠퍼싸이즈될 분할대역이 얼마만큼 엠퍼싸이즈되었는지에 관한 데이타, 즉, 엠퍼싸이즈될 분할대역에 인접한 분할대역들이 얼마만큼 감소되었는지에 관한 데이타를 배율 갱신 장치(2)로부터 얻으며, 이 데이타에 따라 아날로그 오디오 신호 출력 이득을 증가시키는 방향으로 음량 제어를 한다. 이 동작에서, 적절한 분할대역에 대해 사용자가 원하는 엠퍼씨스감을 얻을 수 있다.
이 동작은 도 1 및 도3 내지 도5를 참조하여 기술될 것이다. 도3 내지 도 5는 전체 5개의 분할대역수를 갖는 경우를 도시한다.
도 3은 배율 제어가 없는 분할대역 데이타를 도시한다. 도면에서, 종좌표는 이득(dB)을 나타내고, 횡좌표는 주파수(MHz)를 나타낸다. 횡좌표를 따라 도시된 숫자는 분할대역의 일련의 개수를 의미한다. 이러한 것은 도 4 및 도 5에서도 마찬가지다.
도 3을 참조하면, 제1 및 제5 분할대역의 이득은 각각 d, d, e, f, d (d<e<f)(dB)이다.
4번째 대역이 배율 갱신 장치(2)에서 분할대역 이득 제어와 함께 엠퍼싸이즈될 때, 다른 분할대역의 이득들은 도 4에 도시된 바와 같은 상태를 얻도록 감소된다. 이 상태는 D/A 변환기(6)으로부터 제공된 아날로그 오디오신호의 이득 분포이다. 도면에 도시된 바와 같이, 제1 내지 제3 및 제5 분할대역의 이득들은 각각 c, c, d, 및 c (c < d)로 감소한다.
그러나, 이 상태는 4번째 분할대역의 이득 제어는 하지 않고 얻어진다. 따라서, 이 분할대역의 충분한 엠퍼씨스감을 얻는 것은 어렵다. 따라서, 음량 제어 장치(3)은 배율 갱신 장치(2)로부터 분할대역 이득 제어 데이타를 수신하여 이데이타에 따라 음량 제어(77)을 제어한다.
음량 제어(77)의 최종 아날로그 오디오 신호 출력은 도 5에 도시된 바와 같은 이득 분포를 가진다. 이 상태에서, 4번째 분할대역은 원하는대로 엠퍼싸이즈된다. 특히, 도면에 도시된 바와 같이, 제1 내지 제5 분할대역의 이득들은 각각 d, d, e, g, 및 d (d < g)(dB)이다. 즉, 제4 분할대역을 포함한 모든 분할대역의 이득들은 증가한다.
인간의 청각력은 낮은 이득에서도 용이하게 인지될 수 있지만 이득이 증가하지 않는다면 인지하는데 어려움이 있는 주파수 대역을 가진다. 이것은 소위 Fretchermanson 곡선 또는 청각 임계치 곡선에 도시되어 있다. 음량 제어 장치(3)은 사용자가 원하는 엠퍼싸이즈될 대역의 주파수에 따라 음량 제어 장치(3)를 제어하기 위해 이러한 청각 특성을 이용한다. 따라서, 사용자는 원하는 주파수 대역의 엠퍼씨스감을 충분히 얻을 수 있다.
MPEG/오디오 레이어1에서의 이퀄라이저 처리의 한 예가 기술되었지만, MPEG/오디오 레이어1에서의 공정은 결코 제한적인 의미로 사용된 것은 아니며, MPEGW/오디오 레이어2등의 분할대역 코딩이 사용되고 각각의 분할대역의 재생 배율 데이타와 같은 배율 데이타가 비트스트림 내에 존재하거나 디코딩 처리 중에 발생되는 그러한 종류의 알고리즘이 관련되어 있다면, 본 발명에 따른 처리 시스템을 이용하여 유사한 효과를 얻을 수 있다.
상술한 바와 같이, 본 발명에 따른 음성 대역 분할 디코더는, 음성 신호를 복수의 주파수 분할대역 신호로 분할하고 이들 신호를 코딩하고 코딩된 신호를 합성함으로써 얻어진 대역 분할 코딩 신호 (band division coded signal)를 복수의 분할대역으로 분해하고, 선정된 분할대역 코딩 신호의 재생 배율을 갱신한 다음, 결과적인 코딩 신호를 합성하고 이 결과 신호를 아날로그 변환하여 선정된 주파수 특성을 갖는 음성 신호를 얻기 위하여 제공된다. 음성 대역 분할 디코더는, 재생 배율에서의 변화를 상쇄시키는 반향으로 아날로그 변환된 음성 신호의 이득을 제어하기 위한 음성 신호 이득 제어 수단을 더 포함한다. 따라서, 원하는 분할대역의 충분한 엠퍼씨스감을 얻을 수가 있다.
본 분야의 당업자가 본 발명의 진정한 영역으로부터 벗어나지 않고 다양한 구조적 변경 및 실시예 변경을 만들수 있다는 것은 명백하다. 상술한 설명 및 첨부된 도면은 단지 설명을 위한 것이며 본 발명을 제한하기 위한 것은 아님을 이해해야 할 것이다.

Claims (12)

  1. 음성 신호를 복수의 주파수 분할대역 신호 (frequency sub-band signal)들로 분할하여 이들 신호를 코딩한 다음 합성하여 얻은 대역 분할 코딩 신호를 복수의 분할대역으로 분해하고, 선정된 분할대역 코딩 신호의 재생 배율(playback scale factor)을 갱신한 다음에, 그 결과의 코딩 신호를 합성하고 아날로그 변환하여 선정된 주파수 특성을 갖는 음성 신호를 얻는 음성 대역 분할 디코더 (speech band division decoder)에 있어서,
    상기 재생 배율의 변동을 상쇄하는 방향으로 상기 아날로그 변환된 음성 신호의 이득을 제어하기 위한 음성 신호 이득 제어 수단을 더 포함하는
    음성 대역 분할 디코더.
  2. 제1항에 있어서, 상기 재생 배율의 갱신은 상기 선정된 분할대역에 인접한 분할대역들의 코딩 신호들의 재생 배율을 감소시키는 음성 대역 분할 디코더.
  3. 제1항에 있어서, 상기 재생 배율의 갱신은 상기 재생 배율에 대응하여 제공되는 배율값을 갱신함으로써 실행되는 음성 대역 분할 디코더.
  4. 제3항에 있어서, 상기 배율값은 상기 재생 배율을 증가시키면 감소되도록 설정되는 음성 대역 분할 디코더.
  5. 제3항에 있어서, 상한 배율이 설정되어, 상기 상한값을 초과하는 배율값이 입력되는 경우 상기 배율을 상기 상한값으로 설정하기 위한 배율값 제어 수단을 더 포함하는 음성 대역 분할 디코더.
  6. 제1항에 있어서, 상기 대역 분할 코딩 신호를 복수의 분할대역으로 나눈 후에 얻어지는 상기 코딩 신호들은 비트 할당 데이타를 더 포함하고, 상기 비트 할당은 인간의 청각 특성에 따라 결정되는 음성 대역 분할 디코더.
  7. 제1항에 있어서, 상기 재생 배율을 외부로부터 갱신하기 위한 재생 배율 입력 수단을 더 포함하는 음성 대역 분할 디코더.
  8. 선정된 주파수 대역의 재생 배율을 변경한 후에 얻은 복수의 주파수 대역들의 코딩 신호들을 합성하여 선정된 주파수 특성을 갖는 음성 신호를 얻는 음성 대역 분할 디코더에 있어서,
    상기 합성된 코딩 신호의 출력의 이득은 상기 재생 배율의 변동을 상쇄하는 방향으로 제어되는 음성 대역 분할 디코더.
  9. 제8항에 있어서, 상기 합성된 코딩 신호는 아날로그 신호로 변환되고, 상기 변환된 아날로그 신호의 이득은 상기 재생 배율의 변동을 상쇄하는 방향으로 제어되는 음성 대역 분할 디코더.
  10. 음성 대역 분할 디코더에 있어서,
    MPEG1/오디오 비트스트림 신호를 복수의 주파수 분할대역 양자화 신호와 특성 데이타로서의 측파대 데이타로 분해하기 위한 비트스트림 분해기;
    상기 측파대 데이타를 디코딩하여 각각의 분할대역에 할당된 비트수를 나타내는 비트 할당 데이타 및 각각의 분할대역의 재생 배율을 나타내는 배율 데이타를 복구하기 위한 측파대 데이타 디코더;
    상기 분해된 신호를 역양자화하여 복수의 분할대역 신호들을 발생시키기 위한 역양자화기;
    상기 얻어진 분할대역 신호들을 합성하기 위한 분할대역 합성 필터 뱅크;
    상기 측파대 데이타 디코더로부터 제공되는 배율 데이타를 갱신하기 위한 배율 갱신 장치; 및
    상기 배율 갱신 장치로부터의 출력에 기초하여 상기 분할대역 합성 필터 뱅크의 출력 음량을 제어하기 위한 음량 제어 장치
    를 포함하는 음성 대역 분할 디코더.
  11. 음성 대역 분할 디코더에 있어서,
    MPEG1/오디오 비트스트림 신호를 복수의 주파수 분할대역 양자화 신호와 특성 데이타로서의 측파대 데이타로 분해하기 위한 비트스트림 분해기;
    상기 측파대 데이타를 디코딩하여 각 분할대역에 할당된 비트수를 나타내는 비트 할당 데이타 및 각 분할대역의 재생 배율을 나타내는 배율 데이타를 복구하기 위한 측파대 데이타 디코더;
    상기 분해된 신호를 역양자화하여 복수의 분할대역 신호들을 발생시키기 위한 역양자화기;
    상기 얻어진 분할대역 신호들을 합성하기 위한 분할대역 합성 필터 뱅크;
    상기 측파대 데이타 디코더로부터 제공되는 배율 데이타를 갱신하기 위한 배율 갱신 장치;
    상기 분할대역 합성 필터 뱅크의 출력과 입력을 변환하기 위한 A/D 변환기; 및
    상기 배율 갱신 장치로부터의 출력에 기초하여 상기 A/D 변환기의 출력 음량을 제어하기 위한 음량 제어 장치
    를 포함하는 음성 대역 분할 디코더.
  12. 제10 또는 제11항에 있어서, 상기 배율 데이타를 외부로부터 갱신하기 위한 입력 장치를 더 포함하는 음성 대역 분할 디코더.
KR1019980047383A 1997-11-05 1998-11-05 음성대역분할디코더 KR100313204B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP97-302289 1997-11-05
JP30228997A JP3164038B2 (ja) 1997-11-05 1997-11-05 音声帯域分割復号装置

Publications (2)

Publication Number Publication Date
KR19990045053A true KR19990045053A (ko) 1999-06-25
KR100313204B1 KR100313204B1 (ko) 2001-12-12

Family

ID=17907210

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980047383A KR100313204B1 (ko) 1997-11-05 1998-11-05 음성대역분할디코더

Country Status (5)

Country Link
US (1) US6718295B2 (ko)
EP (1) EP0920127B1 (ko)
JP (1) JP3164038B2 (ko)
KR (1) KR100313204B1 (ko)
DE (1) DE69823458T2 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3620787B2 (ja) * 2000-02-28 2005-02-16 カナース・データー株式会社 音声データの符号化方法
KR100348628B1 (ko) * 2000-10-31 2002-08-13 엘지전자주식회사 디지털 오디오 플레이어의 음량 보정방법
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
GB0410454D0 (en) * 2004-05-11 2004-06-16 Radioscape Ltd Automatic selection of audio-equaliser parameters dependent on broadcast programme type information
US20080059201A1 (en) * 2006-09-03 2008-03-06 Chih-Hsiang Hsiao Method and Related Device for Improving the Processing of MP3 Decoding and Encoding
KR20080073926A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 오디오 신호를 복호화하는 장치에서 이퀄라이저를 구현하는방법 및 이를 위한 장치
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム
JP5045295B2 (ja) 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
EP3998606B8 (en) 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
EP3229443B1 (en) * 2014-12-04 2020-01-01 Sony Corporation Data processing device, data processing method, and program

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59178808A (ja) 1983-03-30 1984-10-11 Oki Electric Ind Co Ltd オ−デイオ用デジタルイコライザアンプ
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5729556A (en) * 1993-02-22 1998-03-17 Texas Instruments System decoder circuit with temporary bit storage and method of operation
JP3263484B2 (ja) 1993-06-07 2002-03-04 三洋電機株式会社 音声帯域分割復号化装置
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
GB9606680D0 (en) 1996-03-29 1996-06-05 Philips Electronics Nv Compressed audio signal processing

Also Published As

Publication number Publication date
EP0920127B1 (en) 2004-04-28
DE69823458D1 (de) 2004-06-03
US6718295B2 (en) 2004-04-06
EP0920127A2 (en) 1999-06-02
US20020069051A1 (en) 2002-06-06
DE69823458T2 (de) 2005-04-14
JPH11145842A (ja) 1999-05-28
JP3164038B2 (ja) 2001-05-08
KR100313204B1 (ko) 2001-12-12
EP0920127A3 (en) 2002-04-03

Similar Documents

Publication Publication Date Title
KR100293855B1 (ko) 고능률디지털데이터부호화및복호화장치
JP3926726B2 (ja) 符号化装置および復号化装置
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
JP3071795B2 (ja) サブバンドコーディング方法および装置
US8081764B2 (en) Audio decoder
KR100197203B1 (ko) 음성의 가공 또는 강조를 위한 필터와 이것을 사용한 각종장치, 시스템 및 방법
JP4000261B2 (ja) ステレオ音響信号の処理方法と装置
KR100295217B1 (ko) 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치
JP3765622B2 (ja) オーディオ符号化復号化システム
JPH04304031A (ja) ディジタル信号符号化方法
US20020004718A1 (en) Audio encoder and psychoacoustic analyzing method therefor
EP0772925B1 (en) Non-linearly quantizing an information signal
KR100313204B1 (ko) 음성대역분할디코더
JP3519859B2 (ja) 符号器及び復号器
US8665914B2 (en) Signal analysis/control system and method, signal control apparatus and method, and program
JP4308229B2 (ja) 符号化装置および復号化装置
JP3041967B2 (ja) ディジタル信号符号化装置
JPH08328592A (ja) 音声信号処理回路
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
US7343292B2 (en) Audio encoder utilizing bandwidth-limiting processing based on code amount characteristics
US8290784B2 (en) Signal processing method and program
US6009399A (en) Method and apparatus for encoding digital signals employing bit allocation using combinations of different threshold models to achieve desired bit rates
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP2001343998A (ja) ディジタルオーディオデコーダ
JPH10143197A (ja) 再生装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120924

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20130924

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20141001

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20150917

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee