KR101209213B1 - 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치 - Google Patents

오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치 Download PDF

Info

Publication number
KR101209213B1
KR101209213B1 KR1020080122123A KR20080122123A KR101209213B1 KR 101209213 B1 KR101209213 B1 KR 101209213B1 KR 1020080122123 A KR1020080122123 A KR 1020080122123A KR 20080122123 A KR20080122123 A KR 20080122123A KR 101209213 B1 KR101209213 B1 KR 101209213B1
Authority
KR
South Korea
Prior art keywords
band
signal
low
channel signal
stereo
Prior art date
Application number
KR1020080122123A
Other languages
English (en)
Other versions
KR20100022422A (ko
Inventor
성종모
이미숙
김현우
김홍국
이영한
김덕수
Original Assignee
광주과학기술원
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광주과학기술원, 한국전자통신연구원 filed Critical 광주과학기술원
Publication of KR20100022422A publication Critical patent/KR20100022422A/ko
Application granted granted Critical
Publication of KR101209213B1 publication Critical patent/KR101209213B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치와 복호화 장치에 관한 것으로서, 오디오의 좌측채널 신호와 우측채널 신호를 각각 저대역 좌측채널 신호, 저대역 우측채널 신호, 고대역 좌측채널 신호, 고대역 우측채널 신호로 분리하는 제1 및 제2QMF 분석부와, 저대역 모노신호를 생성하는 저대역 파라메트릭 스테레오 부호화기와, 고대역 모노신호를 생성하는 고대역 파라메트릭 스테레오 부호화기와, 저대역 모노신호 및 고대역 모노신호를 부호화하는 핵심 부호화기 및 대역 확장 부호화기와, 저대역 모노신호와 고대역 모노신호를 스테레오 파라메타와 함께 비트스트림으로 형성하는 패킷화부를 포함한다. 이에 따라, 스테레오 파라메타를 정확하게 추출할 수 있으며, 계산량 감소가 가능하고, 광대역 스테레오 및 초광대역 스테레오 출력을 추가적인 다운샘플링 없이 구현할 수 있다.
Figure R1020080122123
오디오 신호, 계층적, 파라메트릭, 부호화, 복호화, QMF

Description

오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치{Apparatus for Layered Parametric Stereo coding and decoding of Audio signals}
본 발명은 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치에 관한 것으로서, 보다 상세하게는, 파라메트릭 스테레오 부호화를 디지털 통신망에서의 스케일러블 부호화기에 적용할 수 있도록 하는 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치와 복호화 장치에 관한 것이다.
본 발명은 지식경제부 및 정보통신연구진흥원의 IT성장동력기술개발의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2008-S-011-01, 과제명: FMC 어커스틱 융합코덱 및 제어기술 연구].
최근 통신 기술의 발달에 따라 통신망에서 음성 및 오디오를 전송할 수 있는 대역폭이 증가하고 있으며, 이에 따라 다채널 음성 회의, 음악 스트리밍 등과 같은 더 넓은 신호 대역폭과 다채널을 갖는 음성 및 오디오를 통한 고품질 서비스에 대한 사용자 요구가 커지고 있다. 특히 장거리에 있는 사람들과 회의를 하는 음성 회의(voice conferencing)에 대한 품질 향상이 요구되고 있다. 이를 위해서는 효 율적으로 다채널 음성 및 오디오 신호를 압축 및 복원하는 기술이 필요하다.
이렇게 네트워크의 발달과 고품질 서비스에 대한 사용자 요구에 부응하기 위해, 협대역(narrowband)에서 광대역(wideband) 및 초광대역(super-wideband)에 이르는 스케일러블 부호화기에 대한 개발이 진행되고 있으며, 그 요소 기술로 스테레오 부호화 방식이 활발히 연구되고 있다. 스테레오 부호화 방식으로는 좌/우 채널을 합/차(mid/side)로 변환하여 부호화하는 MS 부호화 방식과, 고주파 성분을 크기 스케일링 정보만으로 복원하는 IS(intensity stereo) 부호화 방식과, 낮은 비트율을 제공하는 파라메트릭 스테레오 부호화 방식이 있다.
그런데, MS 부호화 방식의 경우, 다른 스테레오 부호화 방식보다 높은 비트율을 가지며, 비트율이 가변적이기 때문에 고품질 스케일러블 부호화기의 요소 기술로 부적합하다. IS 부호화 방식의 경우에는, 저주파 대역에 대해서 스테레오 부호화를 하지 않기 때문에 전 대역에 대해 스테레오 부호화를 요구하는 스케일러블 부호화기에 대한 기술로 적합하지 않다. 스테레오 부호화 방식 중 낮은 비트율을 제공하는 기존의 파라메트릭 스테레오 부호화 방식의 경우에도, 많은 계산량과 높은 알고리즘 지연으로 음성통신을 목적으로 하는 부호화기의 기술로 활용하기 어렵다. 더구나, 비트율에 따라 다양한 출력을 제공해야 하는 스케일러블 부호화기에 기존의 파라메트릭 스테레오 부호화 방식을 적용하기 위해서는 추가적으로 표본화 주파수 변환 과정이 필요하다. 따라서 파라메트릭 스테레오 부호화를 디지털 통신망에서의 스케일러블 부호화기에 적용하기 위해서는 이러한 문제점들이 반드시 해결되어야 한다.
한편, 기존의 음성 회의 서비스는 마이크를 통해 소리를 수음한 후, 표본화기를 통해 연속(continuous) 신호를 불연속(discrete) 신호로 변환한다. 이때 전송하고자 하는 대역폭에 적합한 표본화 주파수를 설정하고, 획득된 불연속 신호는 양자화기를 거쳐 디지털(digital) 신호로 변환된다. 이렇게 획득된 디지털 신호는 최종적으로 음성 부호화기를 통해 압축 및 전송된다. 이러한 음성 회의는 화자의 위치가 가운데 정위(localization)되어 청취자로 하여금 여러 명이 말을 하더라도 항상 가운데에서 말하는 것처럼 느껴진다. 뿐만 아니라, 일반적으로 16 kHz의 표본화 주파수를 갖는 광대역 신호를 처리하기 때문에 명료함이 떨어지는 단점을 갖는다. 이에 따라, 이러한 단점을 보완할 수 있는 고품질 스테레오 음성 회의 서비스의 개발이 요구되고 있다.
스테레오 음성 회의 서비스는, 2개의 마이크를 통해 좌/우 신호를 각각 수음(recording)하고, 수음된 신호는 표본화기와 양자화기를 거쳐 디지털 신호로 변환되고, 부호화기를 통해 비트스트림으로 생성된다. 하지만 스테레오 신호를 처리하기 위해서는 모노 신호를 처리할 때보다 높은 비트율을 가지게 된다. 뿐만 아니라 고품질 서비스를 위해 기존의 16 kHz의 표본화 주파수를 갖는 광대역 신호보다 많은 대역을 처리할 수 있는 표본화 주파수가 32 kHz인 초광대역 신호에 대한 처리가 필요하다. 하지만 초광대역 신호를 부호화할 경우 높은 비트율을 가지기 때문에, 네트워크 트래픽에 따라 서비스 품질에 영향을 받는다. 따라서 고품질의 스테레오 음성 회의 서비스를 위해서는, 스테레오 신호를 낮은 비트율로 처리할 수 있는 스테레오 처리 기법이 필수적이고, 비트율에 따라 광대역 신호 및 초광대역 신 호를 처리할 수 있는 구조를 가지는 부호화의 개발이 필요하다.
도 1은 종래의 파라메트릭 스테레오 부호화 기술을 사용하는 파라메트릭 스테레오 부호화 장치의 구성블럭도이다.
종래의 파라메트릭 스테레오 부호화 장치는, 파라메트릭 스테레오 부호화부(10), 2밴드 QMF 분석부(20), 모노화부(30), 패킷화부(45)로 이루어져 있다.
파라메트릭 스테레오 부호화부(10)에서는, 입력 스테레오 신호로부터 스테레오를 위한 파라메타를 추출하고 좌/우 신호를 이용하여 모노 신호를 만들어 모노 부호화부(30)에서 전달한다. 파라메트릭 스테레오 부호화부(10)에서는 각 파라메타 밴드별로 VSLI(virtual source location information) 파라메타와 ICC(inter-channel coherence) 파라메타를 스테레오 파라메타로 추출한다. 이때, 파라메타를 추출하기 위해 파라메트릭 스테레오 부호화부(10)에서는 64밴드 복소 QMF (complex QMF)를 사용하며, 저대역을 보다 세밀히 분석하기 위해 하위 3밴드에 대해 추가적인 QMF를 사용한다. 이때, 음성 및 오디오는 32 kHz 표본화율로 표본화된 것을 가정하면, 일반적으로는 64 밴드 복소 QMF를 위해 대칭형 640 tap의 프로토타입 FIR (finite impulse response) 필터를 사용하며, 하위 3밴드에 대해 추가적으로 13 tap의 FIR 필터를 사용한다.
2밴드 QMF 분석부(20)에서는 입력 신호를 저대역(Mlow)과 고대역(Mhigh)으로 분할한다.
모노 부호화부(30)는 저대역을 처리하는 핵심 부호화기(35)와 고대역을 처리하는 대역 확장 부호화기(40)를 포함하며, 핵심 부호화기(35)와 대역 확장 부호화 기(40)에서는 2밴드 QMF 분석부(20)에서 분할된 저대역 및 고대역 신호 각각을 부호화한다.
패킷화부(45)에서는 비트스트림 패킷화 과정을 통해 부호화된 저대역 및 고대역 신호와, 스테레오 파라메타를 하나의 비트스트림으로 생성한다.
도 2는 종래의 파라메트릭 스테레오 복호화 기술을 사용하는 파라메트릭 스테레오 복호화 장치의 구성블럭도이다.
종래의 파라메트릭 스테레오 복호화 장치는, 패킷 분리부(60), 핵심 복호화기(75), 대역폭 확장 복호화기(80), 2밴드 QMF 합성부(90), 그리고 파라메트릭 스테레오 복호화부(95)로 이루어져 있다.
패킷 분리부(60)는, 복호화 장치로 입력된 한 패킷내의 비트스트림을 모노 복호화부(70)와 파라메트릭 스테레오 복호화부(95)에서 필요한 형태로 분리된다.
모노 복호화부(70)는 저대역을 복호화하는 핵심 복호화기(75)와 고대역을 복호화하는 대역 확장 복호화기(80)를 포함하며, 각각의 복호화기에서 복원된 저대역 신호(Mlow)와 고대역(Mhigh) 신호는 2 밴드 QMF 합성부(90)를 통해 모노 신호로 합성되고, 파라메트릭 스테레오 복호화부(95)를 통해 스테레오 신호로 복원된다.
이러한 복호화 장치에서는 추출된 VSLI와 ICC 파라메타를 적용하기 위해, 파라메트릭 스테레오 복호화부(95)에서 64밴드 복소 QMF (complex QMF)를 사용하고, 저대역을 보다 세밀히 분석하기 위해 하위 3밴드에 대해 추가적인 QMF를 사용한다.
이에 따라, 오디오 신호가 32 kHz 표본화율로 표본화된 것으로 가정하면, QMF 합성을 위해 필요한 알고리즘 지연은 다음과 같다. 64 밴드 복소 QMF를 위해 대칭형 640 tap의 프로토타입 FIR (finite impulse response) 필터를 사용하기 때문에 64 밴드 QMF 분석/합성에 640 샘플의 알고리즘 지연이 발생한다. 또한 저대역을 보다 세밀히 분석하기 위한 추가적인 QMF에 의해, 832 샘플의 알고리즘 지연이 추가된다.
이러한 알고리즘 지연은 초광대역 신호에서 시간/주파수 변환에만 약 1473 샘플이기 때문에 통신망에서 부호화기로 사용할 경우 지연에 의한 품질 열화를 가져오게 된다. 뿐만 아니라 최근 개발되고 있는 초광대역 스케일러블 부호화기는 비트율에 따라 광대역 스테레오 신호와 초광대역 스테레오 신호를 복원할 수 있어야 하는데, 이러한 종래의 파라메트릭 스테레오 방식은 광대역 스테레오 신호를 생성하기 위해 우선 초광대역 스테레오 신호를 복원한 후 광대역 스테레오 신호로 변환하기 위해 다운샘플링(down-sampling) 과정이 추가적으로 필요하게 된다. 그리고 비트스트림 측면에서 광대역 스테레오 신호를 생성하는데 불필요한 광대역에서 초광대역에 이르는 상위대역에 대한 정보도 비트스트림 내에 포함시켜 전송해야 하기 때문에 전송효율이 떨어지게 된다.
본 발명의 목적은, 스케일러블 부호화기에 적용할 수 있으며, 알고리즘 지연과 계산량을 감소시킬 수 있는 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치를 제공하는 것이다.
상기 목적은, 오디오 신호의 좌측채널 신호를 저대역 좌측채널 신호, 고대역 좌측채널 신호로 분리하고, 오디오 신호의 우측채널 신호를 저대역 우측채널 신호, 고대역 우측채널 신호로 분리하는 제1 및 제2QMF 분석부; 상기 저대역 좌측채널 신호와 저대역 우측채널 신호를 이용하여 저대역 스테레오 파라메타를 추출하여 부호화하고, 저대역 모노신호를 생성하는 저대역 파라메트릭 스테레오 부호화기; 상기 고대역 좌측채널 신호와 고대역 우측채널 신호에서 고대역 스테레오 파라메타를 추출하여 부호화하고, 고대역 모노신호를 생성하는 고대역 파라메트릭 스테레오 부호화기; 상기 저대역 모노신호를 부호화하는 핵심 부호화기; 상기 고대역 모노신호를 부호화하는 대역 확장 부호화기; 및 상기 핵심 부호화기와 대역 확장 부호화기에서 부호화된 저대역 모노신호와 고대역 모노신호를 부호화된 상기 저대역 스테레오 파라메타 및 고대역 스테레오 파라메타와 함께 비트스트림으로 형성하는 패킷화부;를 포함하는 것을 특징으로 하는 음성 및 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치에 의해 달성된다.
상기 목적은, 비트스트림을 부호화된 저대역 모노신호 및 고대역 모노신호와, 부호화된 고대역 스테레오 파라메타 및 저대역 스테레오 파라메타로 분리하는패킷 분리화부; 상기 부호화된 저대역 모노신호를 복호화하는 핵심 복호화기; 상기 부호화된 고대역 모노신호를 복호화하는 대역 확장 복호화기; 상기 복호화된 저대역 모노신호를 상기 저대역 스테레오 파라메타를 이용하여 저대역 우측채널 신호와 저대역 좌측채널 신호로 복원하는 저대역 파라메트릭 스테레오 복호화기; 상기 복호화된 고대역 모노신호를 상기 고대역 스테레오 파라메타를 이용하여 고대역 우측채널 신호와 고대역 좌측채널 신호로 복원하는 고대역 파라메트릭 스테레오 복호화기; 및 상기 저대역 우측채널 신호와 고대역 우측채널 신호를 우측채널 신호로 복원하고, 상기 저대역 좌측채널 신호와 고대역 좌측채널 신호를 좌측채널 신호로 복원하는 제1 및 제2QMF 합성부;를 포함하는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 복호화 장치에 의해 달성된다.
본 발명에 따르면, 낮은 알고리즘 지연 제공하면서 저대역과 고대역을 각각 64 밴드로 분석하기 때문에 스테레오 파라메타를 정확하게 추출할 수 있으며, 계산량 감소가 가능하고, 광대역 스테레오 및 초광대역 스테레오 출력을 추가적인 다운샘플링 없이 구현할 수 있다. 이에 따라, 고품질의 음성 회의 서비스의 구현이 가능하고, 음악 스트리밍 서비스 및 고품질 통화연결음 서비스 등을 실현할 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명하기로 한다. 하기의 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하며, 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
도 3은 본 발명에 따른 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치의 구성블럭도이다.
본 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치는, 한 쌍의 2밴드 QMF 분석부(110), 저대역 파라메트릭 스테레오 부호화기(120), 고대역 파라메트릭 스테레오 부호화기(125), 핵심 부호화기(130), 대역 확장 부호화기(135), 패킷화부(140)를 포함한다.
각 QMF(Quadrature Mirror Filter) 분석부(110)는, 입력된 오디오 신호의 좌우신호를 각각 저대역과 고대역으로 분리한다. 제1QMF 분석부(110a)는 오디오 신호의 좌측 신호를 입력받아 저대역 좌측채널 신호와 고대역 좌측채널 신호로 분리하여 출력하고, 제2QMF 분석부(110b)는 오디오 신호의 우측신호를 입력받아 저대역 우측채널 신호와 고대역 우측채널 신호로 분리하여 출력한다.
제1 및 제2QMF 분석부(110a,110b)로는 FIR(Finite Impulse Response) 필터 또는 IIR (Infinite Impulse Response) 필터를 사용할 수 있으며, IIR 필터를 사용할 경우, 50샘플의 알고리즘 지연을 갖게 된다. 이에 따라, 제1 및 제2QMF 분석부(110a,110b)는 알고리즘 지연이 짧은 IIR 필터를 사용한다.
제1 및 제2QMF 분석부(110a,110b)에서 분리된 신호 중, 제1QMF 분석부(110a)에서 분리된 저대역 좌측채널 신호와 제2QMF 분석부(110b)에서 분리된 저대역 우측 채널 신호는 저대역 파라메트릭 스테레오 부호화기(120)로 입력되고, 제1QMF 분석부(110a)에서 분리된 고대역 좌측채널 신호와 제2QMF 분석부(110b)에서 분리된 고대역 우측채널 신호는 고대역 파라메트릭 스테레오 부호화기(125)로 입력된다.
고대역 파라메트릭 스테레오 부호화기(125)와 저대역 파라메트릭 스테레오 부호화기(120)에서는 다음의 수학식 1과 수학식 2를 이용하여, 각 파라메타 밴드별로 각각 VSLI(Virtual Source Location Information) 및 ICC(Inter-Channel Coherence) 파라메타를 산출한다.
Figure 112008083509210-pat00001
Figure 112008083509210-pat00002
여기서, b는 파라메타 밴드를 나타내고, el(b)는 파라메타 밴드의 좌측채널 신호의 에너지, er(b)는 파라메타 밴드의 우측채널 신호의 에너지, eR(b)는 좌측채널 신호와 우측채널 신호의 상관도를 나타낸다.
이렇게 각 파라메타 밴드별로 추출된 VSLI 및 ICC 파라메타는, 저대역 파라메트릭 스테레오 부호화기(120)와 고대역 파라메트릭 스테레오 부호화기(125)내의 5 비트와 3비트의 스칼라 양자화기(scalar quantization)을 통해 각각 부호화된다. 부호화된 VSLI 및 ICC 파라메타는 모두 패킷화부(140)로 전달된다.
이렇게 VSLI 및 ICC 파라메타를 파라메타 밴드별로 추출하기 위해, 파라메타 밴드를 그룹핑해야 하며, 이때, 64 밴드 복소 QMF에 사용하는 프로토타입 필터를 128 샘플 지연을 갖는 비대칭형 640 tap의 FIR (finite impulse response) 필터를 사용한다. 이에 따라, 640 샘플의 알고리즘 지연이 발생하는 기존의 대칭형 640 tap의 FIR 필터에 비해 1/5로 지연이 단축된다.
이러한 64 밴드 복소 QMF에서는 수학식 3의 심리음향적 특성인 ERB(Equivalent Rectangular Bandwidth)를 사용하며, 음질 향상을 위해 실험을 통해 파라메타 밴드를 조절한다.
Figure 112008083509210-pat00003
여기서, f는 중심 주파수를 의미한다.
종래의 파라메타 밴드의 할당구조는, 도 4에 도시된 바와 같이, 0 ~ 16,000Hz 주파수 대역을 64개의 서브밴드로 분할되고, 64개의 서브밴드는 18개의 파라메타 밴드로 맵핑되어 있다. 따라서, 각 서브밴드는 250Hz의 해상도를 갖는다.
이에 반해, 본 발명에서는 수학식 5에 의해 파라메타 밴드에 의해 도 5에 도시된 바와 같이, 서브밴드는 128개로 분할되고, 128개의 서브밴드를 18개의 파라메 터 밴드로 맵핑되어 있다. 따라서, 각 서브밴드는 125Hz의 해상도를 갖는다. 도 5에 도시된 파라메타 밴드의 할당을 보면, 8000Hz 이상의 고대역에서는 64개의 서브밴드를 하나의 파라메타 밴드로 할당하고, 8000Hz 이하의 저대역에서는 64개의 서브밴드를 17개의 파라메타 밴드로 할당하고 있다. 즉, 저대역에 종래보다 많은 서브밴드가 할당되어 있으므로, 종래보다 저대역에서의 신호 분석을 자세하게 수행할 수 있다. 도 6은 서브밴드를 0 ~ 127의 128개로 분할하고, 파라메타 밴드를 0 ~ 17의 18개로 분할하는 경우, 각 파라메타 밴드에 할당되는 서브밴드를 표시하고 있다.
한편, 저대역 파라메트릭 스테레오 부호화기(120)에서는 저대역의 좌측채널 신호와 저대역의 우측채널 신호를 저대역 모노신호로 변경하고, 고대역 파라메트릭 스테레오 부호화기(125)에서는 고대역의 좌측채널 신호와 고대역의 우측채널 신호를 고대역 모노신호로 변경한다. 이때, 저대역 파라메트릭 스테레오 부호화기(120)와 고대역 파라메트릭 스테레오 부호화기(125)는, 각각 다음의 수학식 4 및 수학식 5를 이용하여 저대역 모노신호(Mlow(n))와 고대역 모노신호(Mhigh(n))를 생성한다.
Figure 112008083509210-pat00004
Figure 112008083509210-pat00005
여기서, llow(n)과 rlow(n)은 저대역 좌측채널 신호와 저대역 우측채널 신호이고, lhigh(n)과 rhigh(n)은 고대역 좌측채널 신호와 고대역 우측채널 신호이다.
한편, 저대역 파라메트릭 스테레오 부호화기(120)에서 출력된 저대역 모노신호는 핵심 부호화기(130)로 입력되어 부호화되고, 고대역 파라메트릭 스테레오 부호화기(125)에서 출력된 고대역 모노신호는 대역 확장 부호화기(135)로 입력되어 부호화된다.
핵심 부호화기(130)에서 부호화된 저대역 모노신호와, 대역 확장 부호화기(135)에서 부호화된 고대역 모노신호는 패킷화부(140)로 전달되고, 패킷화부(140)에서는 저대역 파라메트릭 스테레오 부호화기(120)저대역 파라메트릭 스테레오 부호화기(120)기로부터 제공받은 부호화된 VSLI 및 ICC 파라메타, 저대역 모노신호, 고대역 모노신호를 하나의 비트스트림으로 형성한다.
이렇게 생성된 비트스트림은, 수신측으로 전달되고, 수신측에는 오디오 신호의 계층적 파라메트릭 스테레오 복호화 장치가 마련되어 있다.
도 7은 본 발명에 따른 계층적 파라메트릭 스테레오 복호화 장치의 구성블럭도이다.
본 계층적 파라메트릭 스테레오 복호화 장치는, 패킷 분리화부(160), 핵심 복호화기(165), 대역 확장 복호화기(170), 저대역 파라메트릭 스테레오 복호화기(175), 고대역 파라메트릭 스테레오 복호화기(180), 제1 및 제2QMF 합성부(190), 대역 결정부(200)를 포함한다.
패킷 분리화부(160)에서는 하나의 비트스트림으로부터 핵심 복호화기(165), 대역 확장 복호화기(170), 저대역 파라메트릭 스테레오 복호화기(175), 고대역 파라메트릭 스테레오 복호화기(180)에서 사용할 정보를 분리한다. 즉, 패킷 분리화부(160)에서는, 비트스트림으로부터 부호화된 VSLI 및 ICC 파라메타, 저대역 모노신호, 고대역 모노신호를 각각 분리한다. 여기서, 부호화된 VSLI 및 ICC 파라메타는 저대역 파라메트릭 스테레오 복호화기(175)와 고대역 파라메트릭 스테레오 복호화기(180)로 제공되어 모노신호를 스테레오 신호로 복원하기 위해 사용된다. 그리고, 부호화된 저대역 모노신호는 핵심 복호화기(165)로 제공되고 부호화된 고대역 모노신호는 대역 확장 복호화기(170)로 제공되어 각각 복원된 다음, 저대역 파라메트릭 스테레오 복호화기(175)와 고대역 파라메트릭 스테레오 복호화기(180)로 각각 전달된다.
저대역 파라메트릭 스테레오 복호화기(175)와 고대역 파라메트릭 스테레오 복호화기(180)에서는 VSLI 및 ICC 파라메타를 이용하여 저대역 모노신호와 고대역 모노신호를 QMF 영역에서의 스테레오 신호로 복원한다. 저대역 파라메트릭 스테레오 복호화기(175)에서는 저대역 모노신호를 저대역 우측채널 신호와 저대역 좌측채널 신호로 복원하고, 고대역 파라메트릭 스테레오 복호화기(180)에서는 고대역 모노신호를 고대역 우측채널 신호와 고대역 좌측채널 신호로 복원한다.
제1QMF 합성부(190a)는 저대역 파라메트릭 스테레오 복호화기(175)로부터 저대역 좌측채널 신호를 입력받고, 고대역 파라메트릭 스테레오 복호화기(180)로부터 고대역 좌측채널 신호를 입력받으며, 입력받은 신호를 합성하여 스테레오 신호인 좌측채널 신호를 출력한다.
제2QMF 합성부(190b)는 저대역 파라메트릭 스테레오 복호화기(175)로부터 저대역 우측채널 신호를 입력받고, 고대역 파라메트릭 스테레오 복호화기(180)로부터 고대역 우측채널 신호를 입력받으며, 입력받은 신호를 합성하여 스테레오 신호인 우측채널 신호를 출력한다.
대역 결정부(200)는, 저대역 파라메트릭 스테레오 복호화기(175)로부터 출력된 저대역 우측채널 신호 및 저대역 좌측채널 신호와, 제1 및 제2QMF 합성부(190)로부터 출력된 우측채널 신호 및 좌측채널 신호 중 일측을 선택하여 출력하는 제1스위치(190a) 및 제2스위치(190b)를 포함한다.
제1스위치(190a)는, 저대역 파라메트릭 스테레오 복호화기(175)의 저대역 좌측채널 신호가 출력되는 출력단과, 제1QMF 합성부(190a)의 좌측채널 신호가 출력되는 출력단 사이에서 스위칭되어, 저대역 좌측채널 신호와 좌측채널 신호 중 하나가 출력되도록 한다.
제2스위치(190b)는, 저대역 파라메트릭 스테레오 복호화기(175)의 저대역 우측채널 신호가 출력되는 출력단과, 제2QMF 합성부(190b)의 우측채널 신호가 출력되는 출력단 사이에서 스위칭되어, 저대역 우측채널 신호와 우측채널 신호 중 하나가 출력되도록 한다.
이러한 제1스위치(190a)와 제2스위치(190b)는, 스케일러블 구조상 저대역에 대한 파라메타만 전송된 경우, 각각 저대역 파라메트릭 스테레오 복호화기(175)에서 출력된 저대역 좌측채널 신호와 저대역 우측채널 신호가 출력되도록 스위칭된다. 이는 저대역에 대한 파라메타만 전송된 경우에는 고대역에 속하는 신호가 없는 것이므로, 제1QMF 합성부(190a)와 제2QMF 합성부(190b)에서 고대역과 저대역의 신호를 합성할 필요가 없기 때문이다.
도 8은 기존의 파라메트릭 스테레오 기법과, 본 발명의 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치에서 사용하는 파라메트릭 스테레오 기법간의 부호화 및 복호화 알고리즘 지연을 비교한 표이다.
본 계층적 파라메트릭 스테레오 부호화 및 복호화 기법에서는 입력 신호가 초광대역폭일 경우, 제1 및 제2QMF 분석부(110a,110b)를 이용하여 좌측 신호와 우측 신호를 저대역과 고대역으로 분할하는 2밴드 QMF 분석/합성이 필요하다. 이때, 제1 및 제2QMF 분석부(110a,110b)로 사용된 IIR 필터의 지연은 50 샘플이다. 하지만 광대역 복원시에는 IIR 필터를 사용하지 않기 때문에 50 샘플 지연은 초광대역 출력일 경우에만 해당된다.
또한, 본 계층적 파라메트릭 스테레오 부호화 및 복호화 기법에서는 64 밴드 복소 QMF에 사용하는 프로토타입 필터를 128 샘플 지연을 갖는 비대칭형 640 tap FIR 필터(ISO/IEC IS 14496-3:2005/FPDAM9, Enhanced Low Delay AAC, Apr. 2005.)로 사용한다. 따라서, 기존의 파라메트릭 스테레오 기법에서 640 tap의 프로토타입 FIR (finite impulse response) 필터를 사용하고, 하위 3밴드에 대해 추가적으 로 13 tap의 FIR 필터를 사용함에 따라, 각각 640 샘플과 832 샘플의 지연이 발생하던 것을 128 샘플로 감소시킬 수 있다. 또한, 본 계층적 파라메트릭 스테레오 부호화 및 복호화 기법에서는 초광대역 복원시 다운샘플링을 하지 아니하여도 되므로, 다운샘플링시 발생되는 50 샘플의 지연을 제거할 수 있다. 따라서 광대역 복원시 총 지연은 기존의 1522 샘플에서 128 샘플로 감소되고, 초광대역 복원시 총 지연은 1472 샘플에서 178 샘플로 감소된다.
도 9는 기존의 파라메트릭 스테레오 기법과, 본 발명의 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치에서 사용하는 파라메트릭 스테레오 기법간의 64 밴드 QMF 필터에서의 계산량을 비교한 표이다.
본 파라메트릭 스테레오 부호화 및 복호화 장치에서는, 부호화와 복호화에 필요한 대역 할당은 심리음향적 특성을 고려하여 저주파 대역폭은 좁게 분석하고 고주파 대역폭은 상대적으로 넓게 분석한다. 따라서 고대역은 32 kHz 표본화 주파수 기준으로 기존의 파라메트릭 스테레오에서와 같이 250 Hz의 대역폭보다 넓은 대역폭을 가지더라도 성능에 영향을 끼치지 않는다. 따라서 고대역 분석을 위해 64 밴드 복소 QMF 분석/합성 대신 16 밴드 또는 8 밴드 복소 QMF 분석/합성 등을 사용할 경우 성능의 열화 없이 계산량을 줄일 수 있다.
고대역에 16 밴드 복소 QMF 분석/합성을 사용할 경우 64 밴드 복소 QMF 분석/합성을 할 경우보다 약 ¼의 계산량을 가지게 된다. 따라서 본 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치에서, 64 밴드 QMF 필터 분석/합성에 해당하는 계산량을 기존 파라메트릭 스테레오 기법의 64밴드 QMF 필터 분석/합성과 비 교하면, 저대역과 고대역을 합하여도 약 60%의 계산량을 가진다. 그리고, 일반적으로 64 밴드 QMF 필터 분석/합성의 계산량 비율이 전체 파라메트릭 스테레오 기법에서 약 1/3을 차지하기 때문에, 본 계층적 파라메트릭 스테레오 부호화 장치 및 복호화 장치의 전체적인 계산량 비율을 기존의 파라메트릭 스테레오 기법의 88 % 수준으로 감소시킬 수 있다.
이에 따라, 본 파라메트릭 스테레오 부호화 및 복호화 장치에서는 기존의 파라메트릭 스테레오 부호화 및 복호화 장치에 비해 계산속도를 향상시킬 수 있다.
이러한 본 발명의 계층적 파라메트릭 스테레오 부호화/복호화 장치는 비트율에 따라 광대역 스테레오와 초광대역 스테레오 간의 처리가 용이하다. 예를 들어 저대역 파라메트릭 스테레오 정보만 입력될 경우 고대역에 대한 처리와 추가적인 다운샘플링 없이 출력이 가능하다. 따라서 본 발명에서 고안된 계층적 파라메트릭 스테레오 부호화/복호화 기법은 알고리즘 지연과 계산량을 줄일 수 있으며 추가적인 표본화 주파수 변환기를 사용하지 않고 광대역 및 초광대역 신호를 복원할 수 있다는 장점을 가지기 때문에 최종적으로 단말기에 구현하는 통신망에서의 오디오 신호의 부호화기의 기법으로 적합하다.
또한, 본 발명의 계층적 파라메트릭 스테레오 부호화 및 복호화 장치는, 낮은 알고리즘 지연 제공하면서 저대역과 고대역을 각각 64 밴드로 분석하기 때문에 스테레오 파라메타를 정확하게 추출할 수 있다. 또한, 상위 밴드에는 64 밴드 QMF를 사용하지 않고 크리티컬 밴드(critical band) 또는 바크 스케일(bark scale)에 적합하도록 별도의 QMF를 사용할 수 있기 때문에 계산량 감소가 가능하다. 뿐만 아니라, 비트율에 따라 광대역 스테레오 및 초광대역 스테레오 출력을 추가적인 다운샘플링 없이 구현이 가능하다. 이를 활용하여 고품질의 음성 회의 서비스의 구현이 가능하고, 음악 스트리밍 서비스 및 고품질 통화연결음 서비스 등 다양한 부가 서비스를 창출할 수 있다.
특히 고품질 음성 회의를 통한 협업 환경 구축에 활용될 수 있으며 point-to-point (P2P) 대화형 멀티미디어 서비스를 제공할 수 있다. 또한 디지털 방송 및 디지털 라이오 서비스나 주문형 오디오(music on demand) 등에 본 발명이 활용될 수 있다. 뿐만 아니라 본 발명에서 개발한 파라메트릭 스테레오 기술은 기존의 부호화기와 연동이 가능하기 때문에 MPEG-1 layer 3 (MP3), advanced audio coding (AAC), high efficiency AAC+ (HE-AAC+), MPEG Surround 등의 고품질 오디오 부호화기, G.722.1C G.722, AMR-WB 등의 음성 부호화기에 적용할 수 있다.
도 1은 종래의 파라메트릭 스테레오 부호화 장치의 일 실시예를 보인 구성블럭도,
도 2는 종래의 파라메트릭 스테레오 복호화 장치의 일 실시예를 보인 구성블럭도,
도 3은 본 발명에 따른 계층적 파라메트릭 스테레오 부호화 장치의 구성블럭도,
도 4는 종래의 파라메트릭 스테레오 기법에서의 파라메타 밴드 구성을 나타낸 그래프,
도 5는 본 발명에 따른 계층적 파라메트릭 스테레오 기법에서의 파라메타 밴드 구성을 나타낸 그래프,
도 6은 본 발명에 따른 계층적 파라메트릭 스테레오 기법에서의 파라메타 밴드 구성을 나타낸 표,
도 7은 본 발명에 따른 계층적 파라메트릭 스테레오 복호화 장치의 구성블럭도,
도 8은 본 발명에 따른 계층적 파라메트릭 스테레오 기법의 알고리즘 지연 성능을 보인 표,
도 9는 본 발명에 따른 계층적 파라메트릭 스테레오 기법의 계산량 감축 성능을 보인 표이다.
* 도면의 주요 부분에 대한 부호의 설명 *
110a : 제1QMF 분석부 110b : 제2QMF 분석부
120 : 저대역 파라메트릭 스테레오 부호화기
125 : 고대역 파라메트릭 스테레오 부호화기
130 : 핵심 부호화기 135 : 대역 확장 부호화기
140 : 패킷화부

Claims (9)

  1. 오디오 신호의 좌측채널 신호를 저대역 좌측채널 신호, 고대역 좌측채널 신호로 분리하고, 오디오 신호의 우측채널 신호를 저대역 우측채널 신호, 고대역 우측채널 신호로 분리하는 제1 및 제2QMF 분석부;
    상기 저대역 좌측채널 신호와 저대역 우측채널 신호를 이용하여 저대역 스테레오 파라메타를 추출하여 부호화하고, 저대역 모노신호를 생성하는 저대역 파라메트릭 스테레오 부호화기;
    상기 고대역 좌측채널 신호와 고대역 우측채널 신호에서 고대역 스테레오 파라메타를 추출하여 부호화하고, 고대역 모노신호를 생성하는 고대역 파라메트릭 스테레오 부호화기;
    상기 저대역 모노신호를 부호화하는 핵심 부호화기;
    상기 고대역 모노신호를 부호화하는 대역 확장 부호화기; 및
    상기 핵심 부호화기와 대역 확장 부호화기에서 부호화된 저대역 모노신호와 고대역 모노신호를 부호화된 상기 저대역 스테레오 파라메타 및 고대역 스테레오 파라메타와 함께 비트스트림으로 형성하는 패킷화부;를 포함하는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치.
  2. 제 1 항에 있어서,
    상기 제1 및 제2QMF 분석부는 IIR 필터를 사용하는 것을 특징으로 하는 오디 오 신호의 계층적 파라메트릭 스테레오 부호화 장치.
  3. 제 1 항에 있어서,
    상기 저대역 파라메트릭 스테레오 부호화기와 고대역 파라메트릭 스테레오 부호화기는, 각각 비대칭형 640 tap의 FIR (finite impulse response) 필터를 사용하여 파라메타 밴드와 서브밴드를 분할 및 할당하는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치.
  4. 제 3 항에 있어서,
    상기 저대역 파라메트릭 스테레오 부호화기와 고대역 파라메트릭 스테레오 부호화기는, 저대역과 고대역에서 각각 64개의 서브밴드가 형성되도록 주파수 대역을 분할하고, 저대역의 64개의 서브밴드를 17개의 파라메타 밴드와 맵핑시키는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치.
  5. 제 3 항에 있어서,
    상기 저대역 파라메트릭 스테레오 부호화기와 상기 고대역 파라메트릭 스테레오 부호화기는 상기 파라메타 밴드마다 상기 스테레오 파라메타를 추출하는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치.
  6. 비트스트림을 부호화된 저대역 모노신호 및 고대역 모노신호와, 부호화된 고대역 스테레오 파라메타 및 저대역 스테레오 파라메타로 분리하는 패킷 분리화부;
    상기 부호화된 저대역 모노신호를 복호화하는 핵심 복호화기;
    상기 부호화된 고대역 모노신호를 복호화하는 대역 확장 복호화기;
    상기 핵심 복호화기에서 복호화된 저대역 모노신호를 상기 저대역 스테레오 파라메타를 이용하여 저대역 우측채널 신호와 저대역 좌측채널 신호로 복원하는 저대역 파라메트릭 스테레오 복호화기;
    상기 대역 확장 복호화기에서 복호화된 고대역 모노신호를 상기 고대역 스테레오 파라메타를 이용하여 고대역 우측채널 신호와 고대역 좌측채널 신호로 복원하는 고대역 파라메트릭 스테레오 복호화기; 및
    상기 저대역 우측채널 신호와 고대역 우측채널 신호를 우측채널 신호로 복원하고, 상기 저대역 좌측채널 신호와 고대역 좌측채널 신호를 좌측채널 신호로 복원하는 제1 및 제2QMF 합성부;를 포함하는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 복호화 장치.
  7. 제 6 항에 있어서,
    상기 제1 및 제2QMF 합성부의 출력단에는,
    비트율에 따라 광대역 스테레오 또는 초광대역 스테레오를 결정하는 대역 결정부가 배치된 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 복호화 장치.
  8. 제 7 항에 있어서,
    상기 대역 결정부는,
    상기 저대역 파라메트릭 스테레오 복호화기의 저대역 좌측채널 신호가 출력되는 출력단과, 제1QMF 합성부의 출력단 사이에서 스위칭되어 저대역 좌측채널 신호와 좌측채널 신호 중 하나가 출력되도록 하는 제1스위치;
    상기 저대역 파라메트릭 스테레오 복호화기의 저대역 우측채널 신호가 출력되는 출력단과, 제2QMF 합성부의 출력단 사이에서 스위칭되어 저대역 우측채널 신호와 우측채널 신호 중 하나를 출력하는 제2스위치;를 포함하는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 복호화 장치.
  9. 제 8 항에 있어서,
    상기 제1스위치와 제2스위치는,
    저대역에 대한 스테레오 파라메타만 전송된 경우, 상기 저대역 파라메트릭 스테레오 복호화기로부터 저대역 좌측채널 신호와 저대역 우측채널 신호가 출력되도록 스위칭되는 것을 특징으로 하는 오디오 신호의 계층적 파라메트릭 스테레오 복호화 장치.
KR1020080122123A 2008-08-19 2008-12-03 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치 KR101209213B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20080081045 2008-08-19
KR1020080081045 2008-08-19

Publications (2)

Publication Number Publication Date
KR20100022422A KR20100022422A (ko) 2010-03-02
KR101209213B1 true KR101209213B1 (ko) 2012-12-06

Family

ID=42174983

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080122123A KR101209213B1 (ko) 2008-08-19 2008-12-03 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치

Country Status (1)

Country Link
KR (1) KR101209213B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101615776B1 (ko) * 2010-05-28 2016-04-28 한국전자통신연구원 상이한 분석 단계를 사용하는 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
KR102172279B1 (ko) * 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
CN105139865B (zh) * 2015-06-19 2019-01-11 中央电视台 一种确定左右声道音频相关系数的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Breebaart, J. et al. Parametric Coding of Stereo Audio. EURASIP Journal on Applied Signal Processing. 2005.01. (제1305면 내지 제1322면)
Purnhagen, H. Low Complexity Parametric Strereo Coding in MPEG-4. Proc. of DAFx'04. 2004.10.05. (제163면 내지 제168면)

Also Published As

Publication number Publication date
KR20100022422A (ko) 2010-03-02

Similar Documents

Publication Publication Date Title
JP4963962B2 (ja) マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
Herre et al. The reference model architecture for MPEG spatial audio coding
KR101450940B1 (ko) 멀티채널 오디오의 조인트 인핸스먼트
KR101120911B1 (ko) 음성신호 복호화 장치 및 음성신호 부호화 장치
JP4220461B2 (ja) 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置
JP2020060792A (ja) 再構築帯域に対するエネルギ情報を用いてオーディオ信号を復号化または符号化する装置および方法
US8457319B2 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
EP1749296B1 (en) Multichannel audio extension
CN105378832B (zh) 解码器、编码器、解码方法、编码方法和存储介质
KR20070084002A (ko) 스케일러블 복호화 장치 및 스케일러블 부호화 장치
US8352249B2 (en) Encoding device, decoding device, and method thereof
WO2005059899A1 (en) Fidelity-optimised variable frame length encoding
WO2006025337A1 (ja) ステレオ信号生成装置およびステレオ信号生成方法
EP2345027A1 (en) Energy conservative multi-channel audio coding
WO2009048239A2 (en) Encoding and decoding method using variable subband analysis and apparatus thereof
KR20090039016A (ko) 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
KR101209213B1 (ko) 오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
JP2002032100A (ja) オーディオ信号を符号化する方法
Herre et al. Perceptual audio coding
WO2010009659A1 (zh) 编解码方法、装置和系统
JPH09146593A (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置及び音響信号復号化装置
Ning et al. Wideband audio compression using a combined wavelet and WLPC representation
Li et al. Efficient stereo bitrate allocation for fully scalable audio codec
REPLICATION BANDWIDTH EXTENSION OF AUDIO SIGNALS

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161004

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170926

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee