KR100707186B1 - 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 - Google Patents

오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 Download PDF

Info

Publication number
KR100707186B1
KR100707186B1 KR1020050024567A KR20050024567A KR100707186B1 KR 100707186 B1 KR100707186 B1 KR 100707186B1 KR 1020050024567 A KR1020050024567 A KR 1020050024567A KR 20050024567 A KR20050024567 A KR 20050024567A KR 100707186 B1 KR100707186 B1 KR 100707186B1
Authority
KR
South Korea
Prior art keywords
audio signal
harmonic
encoding
audio
band
Prior art date
Application number
KR1020050024567A
Other languages
English (en)
Other versions
KR20060102700A (ko
Inventor
성호상
라케쉬 타오리
이강은
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050024567A priority Critical patent/KR100707186B1/ko
Priority to US11/337,487 priority patent/US8015017B2/en
Publication of KR20060102700A publication Critical patent/KR20060102700A/ko
Application granted granted Critical
Publication of KR100707186B1 publication Critical patent/KR100707186B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16KVALVES; TAPS; COCKS; ACTUATING-FLOATS; DEVICES FOR VENTING OR AERATING
    • F16K17/00Safety valves; Equalising valves, e.g. pressure relief valves
    • F16K17/36Safety valves; Equalising valves, e.g. pressure relief valves actuated in consequence of extraneous circumstances, e.g. shock, change of position
    • F16K17/38Safety valves; Equalising valves, e.g. pressure relief valves actuated in consequence of extraneous circumstances, e.g. shock, change of position of excessive temperature
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16KVALVES; TAPS; COCKS; ACTUATING-FLOATS; DEVICES FOR VENTING OR AERATING
    • F16K19/00Arrangements of valves and flow lines specially adapted for mixing fluids
    • F16K19/006Specially adapted for faucets
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16KVALVES; TAPS; COCKS; ACTUATING-FLOATS; DEVICES FOR VENTING OR AERATING
    • F16K31/00Actuating devices; Operating means; Releasing devices
    • F16K31/002Actuating devices; Operating means; Releasing devices actuated by temperature variation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Abstract

본 발명은 광대역 오디오 부호화 및 복호화 시, 고대역 또는 광대역 잔차 오디오 신호의 하모닉 정보를 이용하여 FGS(Fine Granularity scalability)를 지원할 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체에 관한 것으로, 본 발명에 따른 방법은, 입력되는 오디오 신호의 고대역 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 단계; 검출된 하모닉들의 순서를 결정하는 단계; 및 결정된 하모닉 순서를 토대로 하모닉 부호화를 수행하는 단계를 포함하는 오디오 부호화 방법을 제공한다.

Description

오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체{Audio coding and decoding apparatus and method, and recoding medium thereof }
도 1은 기존의 고대역 오디오 부호화 장치의 기능 블록도의 일 예이다.
도 2는 기존의 고대역 오디오 부호화 장치의 기능 블록도의 다른 예이다.
도 3은 기존의 광대역 잔차 오디오 부호화 장치의 기능 블록도이다.
도 4는 본 발명의 실시 예에 따른 고대역 또는 광대역 잔차 오디오 부호화 및 복호화 장치를 갖는 광대역 오디오 시스템의 기능 블록도이다.
도 5는 도 4에 도시된 고대역 또는 광대역 잔차 오디오 부호화 장치의 기능 블록도이다.
도 6은 본 발명에 따라 검출되는 고대역 또는 광대역 잔차 오디오의 하모닉에 대한 파형 예시도이다.
도 7은 본 발명에 따라 패킹되는 프레임 단위의 비트 스트림의 구조도이다.
도 8은 도 4에 도시된 고대역 또는 광대역 잔차 오디오 복호화 장치의 기능 블록도이다.
도 9은 본 발명의 실시 예에 따른 고대역 또는 광대역 잔차 오디오 부호화 방법의 동작 흐름도이다.
도 10은 본 발명의 실시 예에 따른 고대역 또는 광대역 잔차 오디오 복호화 방법의 동작 흐름도이다.
본 발명은 오디오 부호화 및 복호화 장치와 그 방법 및 기록매체에 관한 것으로서, 특히 광대역 오디오 부호화 및 복호화 시, 고대역(high-band) 또는 광대역 잔차(error)의 하모닉(Harmonic) 정보를 이용하여 FGS(Fine Granularity Scalability)를 지원하는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체에 관한 것이다.
오디오 통신의 응용 분야가 다양해지고 네트워크의 전송속도가 향상됨으로 인해 고품질의 오디오 통신에 대한 필요성이 부각되고 있다. 이에 따라 기존의 오디오 통신 대역인 0.3kHz∼3.4kHz에 비해 자연성과 명료도 등 다양한 측면에서 우수한 성능을 갖는 0.3kHz∼7kHz의 대역폭을 갖는 광대역(wideband) 오디오 신호의 전달이 요구되고 있다.
또한 네트워크 측면에서, 데이터를 패킷단위로 전송하는 패킷 스위칭 네트워크(packet switching network)는 채널의 정체 현상을 초래할 수 있고, 이로 인한 패킷 손실과 오디오의 질 저하가 발생될 수 있다. 이를 해결하기 위하여 손상된 패킷을 은닉하는 기술이 사용되고 있지만 이는 근본적인 처방이 될 수 없다.
따라서 상기 광대역 오디오 신호를 효과적으로 압축하면서 채널의 정체 현상을 해결할 수 있는 광대역 오디오 부호화 및 복호화 기술이 제안되고 있다.
현재 제안되고 있는 광대역 오디오 부호화 및 복호화는 0.3kHz∼7kHz 대역의 오디오 신호를 한꺼번에 압축하고 이를 복원하는 방식과 0.3kHz∼4kHz 대역과 4kHz∼7kHz 대역으로 나누어 계층적으로 압축하고, 이를 복원하는 방식, 그리고 0.3∼3.4kHz 대역을 압축한 후 이를 복원하여 다시 광대역으로 업샘플링(Up-sampling)한 후 원래의 광대역 오디오 신호와의 광대역 잔차 신호를 구하여 이를 압축하는 방식으로 구분될 수 있다.
두 번째 방식과 세 번째 방식은 정체 현상의 정도에 따라 전달하는 계층의 양을 조절하여 주어진 채널 환경에서 최적의 통신이 가능하도록 하는 대역폭 확장(scalability) 기능을 이용한 광대역 오디오 부호화 및 복호화 방식이다.
상기 두 번째 방식을 이용한 광대역 오디오 부호화에서 4kHz∼7kHz 대역의 고대역 오디오 신호는 MLT(Modulated Lapped Transform, 이하 MLT라고 약함) 방식에 의해 부호화된다. MLT 방식을 이용하는 고대역 오디오 신호 부호화 장치는 도 1에 도시된 바와 같다.
상기 대역폭 확장 기능을 이용한 광대역 오디오 부호화에서 4kHz∼7kHz 대역의 고대역 오디오 신호는 MLT(Modulated Lapped Transform, 이하 MLT라고 약함) 방식에 의해 부호화된다. MLT 방식을 이용하는 고대역 오디오 부호화 장치는 도 1에 도시된 바와 같다.
도 1을 참조하면, 상기 고대역 오디오 부호화 장치는, 고대역 오디오 신호가 입력되면, MLT(101)에서 입력되는 고대역 오디오 신호를 MLT하여 MLT 계수를 추출한다. 추출된 MLT 계수의 크기(Magnitude)는 2D-DCT(2 Dimension - Discrete Cosine Transform) 모듈(102)로 출력하고, 추출된 MLT 계수의 부호(sign)는 부호 양자화기(103)로 출력한다.
2D-DCT 모듈(102)은 입력된 MLT 계수의 크기에서 2D-DCT계수를 추출하고, 추출된 2D-DCT 계수를 DCT 계수 양자화기(104)로 출력한다. DCT 계수 양자화기(104)는 2차원 구조를 갖는 2D-DCT 계수에서 통계적으로 그 크기가 큰 순서대로 나열하고, 나열된 벡터를 양자화한 후, 그 코드북 인덱스를 출력한다. 부호 양자화기(103)는 MLT 계수의 크기가 큰 계수에 해당되는 부호를 양자화하여 출력한다. 출력된 코드북 인덱스 및 양자화된 부호는 미 도시된 고대역 오디오 복호화 장치로 제공된다.
그러나, 상기 MLT 방식에 의해 고대역 오디오 신호를 부호화하는 것은 낮은 비트율로 오디오 신호를 전송할 때, 고음질의 복원이 어렵고, 비트율이 낮아질수록 오디오 복원 성능의 저하가 두드러진다.
따라서, 이를 개선하기 위하여 도 2에 도시된 바와 같은 하모닉 코더(Harmonic coder)를 이용한 고대역 오디오 부호화 장치가 제안된 바 있다.
도 2를 참조하면, 하모닉 피크(harmonic peak) 검출부(201)는 입력되는 고대역 오디오 신호의 하모닉 피크를 검출하고, 검출된 하모닉 피크를 토대로 한 고대역 오디오 신호의 진폭(amplitude)과 위상(phase)을 출력한다.
진폭 양자화기(202)는 입력된 고대역 오디오 신호의 진폭을 양자화하여 출력한다. 위상 양자화기(203)는 입력되는 고대역 오디오 신호의 위상을 양자화하여 출력한다. 출력된 양자화된 진폭 및 양자화된 위상은 미 도시된 고대역 오디오 복호 화 장치로 제공된다.
그러나, 도 2와 같은 하모닉 코더를 이용한 고대역 오디오 신호 부호화로 적은 비트율과 낮은 복잡도로 고음질을 재생할 수 있으나, 입력되는 고대역 오디오 신호에 대한 확장성(scalability)을 지원하는데 한계가 있다.
또한, 상기 대역폭 확장 기능을 갖는 세번째 방식을 이용한 광대역 잔차 오디오 부호화 시, 0.05kHz∼7kHz 대역의 광대역 잔차 오디오 신호는 MDCT(Modified Discrete Cosine Transform, 이하 MDCT라고 약함) 방식에 의해 부호화된다. MDCT 방식을 이용하는 광대역 잔차 오디오 신호 부호화 장치는 도 3에 도시된 바와 같다.
도 3을 참조하면, 상기 광대역 잔차 오디오 부호화 장치는, 광대역 오디오 신호가 입력되면, 다운 샘플링 모듈(301)을 통해 저대역으로 다운 샘플링된 신호를 얻고, 상기 저대역으로 다운 샘플링된 신호를 저대역 오디오 부호화기(302)에서 부호화를 한다. 부호화된 오디오 신호는 업 샘플링 모듈(303)에 의해 광대역 신호로 복원하고, 감산기(304)에 의해 원신호에서 복원된 광대역 신호를 감산하여 광대역 잔차 신호를 생성한다. 생성된 광대역 잔차 신호는 MDCT(305)로 입력되고, MDCT(305)는 입력된 광대역 잔차 신호의 MDCT 계수를 추출한다. 추출된 MDCT 계수는 대역 분할 모듈(306)에 의해 대역별로 분할되고, 정규화(normalization) 모듈(307)에서 대역별로 분할된 MDCT 계수는 정규화 된다. 정규화된 MDCT계수는 양자화기(308)에서 양자화되어 코드북 인덱스를 출력한다. 출력된 코드북 인덱스는 미 도시된 고대역 오디오 복호화 장치로 제공된다.
그러나, 상기 MDCT 방식에 의한 광대역 잔차 오디오 신호를 부호화하는 방식 역시 낮은 비트율로 오디오 신호를 전송할 때, 고음질의 복원이 어려운 단점이 있다.
본 발명이 이루고자 하는 기술적 과제는 광대역 오디오 부호화 및 복호화 시, 고대역 또는 광대역 잔차 오디오 신호의 하모닉 정보를 이용하여 FGS(Fine Granularity scalability)를 지원할 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 광대역 오디오 부호화 및 복호화 시, 고대역 또는 광대역 잔차 오디오 신호의 경우에 하모닉 단위로 부호화 및 복호화 함으로써, 오디오 신호에 대한 확장성을 충분하게 지원할 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 입력되는 오디오 신호의 고대역 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 단계; 상기 검출된 하모닉들의 순서를 결정하는 단계; 및 상기 결정된 하모닉 순서를 토대로 하모닉 부호화를 수행하는 단계를 포함하는 오디오 부호화 방법을 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 입력되는 오디오 신호의 고대역 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 하모닉 검출부; 하모닉 검출부에서 검출된 하모닉의 순서를 결정하는 하모닉 순서 결정부; 및 상기 하모닉 순서 결정부에서 결정된 순서를 토대로 하모닉 부호화를 수행하는 하모닉 부호화부를 포함하는 오디오 부호화 장치를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 부호화된 고대역 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면, 계층별로 복호화하는 단계; 및 계층별로 복호화된 결과를 계층별 복원된 고대역 오디오 신호로 출력하는 단계를 포함하는 오디오 복호화 방법을 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 부호화된 고대역 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면, 디패킹하는 비트 패킹부; 및 상기 비트 패킹부로부터 계층별로 출력되는 비트스트림을 계층단위로 복호화하는 복호화 유니트를 포함하는 오디오 복호화 장치를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 오디오 부호화 방법을 수행하는 프로그램이 기록된 기록 매체에 있어서, 상기 오디오 부호화 방법은, 입력되는 오디오 신호의 고대역 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 단계; 상기 검출된 하모닉들의 순서를 결정하는 단계; 및 상기 결정된 하모닉 순서를 토대로 하모닉 부호화를 수행하는 단계를 포함하는 기록 매체를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 오디오 복호화 방법을 수행하는 프로그램이 저장된 기록 매체에 있어서, 상기 오디오 복호화 방법은, 부호화된 고대역 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면, 계층별로 복호화하는 단계; 및 계층별로 복호화된 결과를 계층별 복원된 고대역 또는 광대역 잔차 오디오 신호로 출력하는 단계를 포함하는 기록 매체를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세히 설명하기로 한다.
도 4는 본 발명의 바람직한 실시 예에 따른 고대역 또는 광대역 잔차 오디오 부호화 및 복호화 장치를 갖는 광대역 오디오 시스템의 기능 블록도이다. 도 4를 참조하면, 광대역 오디오 시스템은, 오디오 부호화 장치(400), 채널(410), 및 오디오 복호화 장치(420)를 포함한다.
오디오 부호화 장치(400)는 대역 분할부(401), 고대역 오디오 부호화 장치(402), 및 저대역 오디오 부호화 장치(403)를 포함한다.
대역 분할부(401)는 오디오 신호가 입력되면, 저대역 오디오 신호와 고대역 오디오 신호를 분할하여 출력하거나 입력되는 오디오 신호의 저대역 오디오 신호와 입력되는 오디오 신호에서 저대역 오디오 부호화 장치(403)로부터 출력되는 저대역 오디오 신호를 복호화한 신호를 감산하여 얻은 광대역 잔차 오디오 신호를 분할하여 출력한다.
고대역 또는 광대역 잔차 오디오 부호화 장치(402)는 대역 분할부(401)로부터 출력되는 고대역 또는 광대역 잔차 오디오 신호의 하모닉 정보를 이용하여 FGS(Fine Granularity scalability)를 지원할 수 있도록 고대역 또는 광대역 잔차 오디오 신호를 부호화 한다.
이를 위하여 고대역 또는 광대역 잔차 오디오 부호화 장치(402)는 도 5에 도시된 바와 같이 구성된다. 도 5를 참조하면, 고대역 또는 광대역 잔차 오디오 부호화 장치(402)는 하모닉 검출부(501), 하모닉 순서 결정부(502), 하모닉 부호화부 (503), 및 비트 패킹부(504)를 포함한다.
하모닉 검출부(501)는 입력되는 고대역 또는 광대역 잔차 오디오 신호의 하모닉을 검출한다. 즉, 입력되는 고대역 또는 광대역 잔차 오디오 신호의 전체 하모닉을 검출한다. 하모닉 검출 방식은 MP(Maching Pursuit) 또는 FFT(Fast Fourier Transform) 방법을 이용하여 검출될 수 있다. 이 때, 검출 가능한 하모닉 수는 코덱(codec)의 전송률, 음질, 복잡도 등을 고려하여 설정될 수 있다. 예를 들어 검출 가능한 하모닉 수는 고대역 오디오 신호인 경우 60으로 설정될 수 있고, 광대역 잔차 오디오 신호인 경우 120으로 설정될 수 있으며, 입력신호의 샘플링 방식에 따라 다른 값이 설정될 수도 있다.
FFT방법을 이용한 하모닉 검출방식은, 입력되는 고대역 또는 광대역 잔차 오디오 신호를 FFT한 후, 각각의 하모닉에 해당하는 피크를 찾아서 각 하모닉의 크기와 위상을 검출한다. MP방법을 이용한 하모닉 검출방식은, 고대역 또는 광대역 잔차 신호에서 구한 피치 주기(또는 피치 딜레이)를 이용하여 입력되는 고대역 또는 광대역 잔차 오디오 신호의 하모닉을 분석한다. 즉, 피치 주기를 이용하여 기본 주파수(fundamental frequency) ω0를 찾고, 정현파 사전(sine dictionary)을 사용하여 하모닉 파라미터를 탐색한다. 하모닉 파라미터는 크기 A와 위상 φ를 포함한다.
정현파 사전의 크기 A와 위상 φ는 오디오 신호 s(n)을 목적신호로 한 MP(Matching Pursuit) 알고리즘을 이용하여 탐색된다. 정현파 사전으로 표현된 오디오 신호 sH(n)은 수학식 1과 같이 정의할 수 있다.
Figure 112005015553570-pat00001
수학식 1에서 Ak는 k번째 정현파의 크기, ωk는 k번째 정현파의 각 주파수, φk는 k번째 정현파의 위상, wham(n)은 해밍 윈도우(hamming window), K는 정현파 사전의 개수를 나타낸다.
프레임단위로 검출 가능한 모든 하모닉이 검출되면, 하모닉 검출부(501)는 검출된 하모닉중 크기가 사전에 설정된 소정치 이하의 하모닉을 제거하는 약한 하모닉(weak harmonic)을 제거하는 평활(smoothing) 기법을 이용하여 검출된 하모닉 수를 제한할 수 있다. 평활 기법은 인접한 하모닉의 크기의 비율이 기준치 이하이면 제거된다. 상기 기준치는 코덱의 전송률 및 음질 등에 따라 설정된다. 상기 비율은 인접한 2개의 하모닉의 크기를 이용한다. 즉, 2개의 하모닉의 크기중 큰 값을 분모로 하고 작은 값을 분자로 하여 상기 비율을 구한다.
그리고 하모닉 검출부(501)에서는 노이즈 필링을 위한 정보를 구한다. 이 노이즈 필링을 위한 정보는 하모닉 검출이 수행되는 프레임에서 검출되는 하모닉들의 크기(magnitude)의 총 오디오 출력(RMS, Root Mean Square)값과 스펙트럼의 틸트(tilt)정보를 포함한다. 상기 틸트 정보는 도 6에 도시된 바와 같은 기울기 정보로서, 2차 이하의 함수를 이용하여 정의된다.
하모닉 순서 결정부(502)는 하모닉 검출부(501)에서 검출된 하모닉의 순서 (Ordering)를 결정한다. 이를 위하여 하모닉 순서 결정부(502)는 검출된 하모닉에 대한 인지 가중 접근(perceptual approach)이 필요하다. 즉, 하모닉 순서 결정부(502)는 각 하모닉의 크기(Magnitude), 위상(phase), 및 대역 정보(band information)를 검출한다. 하모닉 순서 결정부(502)는 검출된 크기, 위상 및 대역 정보를 정규화한다.
크기에 대한 정규화는 구해진 하모닉중에서 가장 큰 값을 이용하여 모든 하모닉의 값을 정규화 한다. 대역에 대한 정규화는 입력신호에서 가장 낮은 대역을 1로 설정하고 가장 높은 대역을 0으로 설정한 후 나머지 대역을 이 수치범위에 보간하여 정규화한다. 위상에 대한 정규화는 위상의 변동 범위가 -π ~ π 의 범위를 갖는데 절대값을 π로 정규화 한다. 즉 - π 또는 π는 1이 되고 나머지 값은 0~1사이에 보간된다.
하모닉 순서 결정부(502)는 수학식 2와 같이 정규화된 크기(M), 정규화된 위상(P), 및 정규화된 대역 정보(B)에 사전에 설정된 각각의 가중지(weighting) Wm, Wp, Wb를 곱하여 순서 중요도(Ordering Criterion, C)를 구한다.
Figure 112005015553570-pat00002
상기 가중치 Wm, Wp, Wb은 수학식 3의 조건을 만족하는 값을 갖는다.
Figure 112005015553570-pat00003
하모닉 순서 결정부(502)는 구해진 각 하모닉의 순서 중요도(C)를 토대로 프레임당 검출된 하모닉에 대한 순서를 결정한다. 즉, 도 6에 도시된 바와 같이 검출된 하모닉에 대한 순서가 결정될 수 있다.
하모닉 부호화부(503)는 하모닉 순서 결정부(502)에서 결정된 순서를 토대로 우선순위가 높은 하모닉부터 순차적으로 크기와 위상에 대한 부호화를 수행한다. 이 때, 하모닉 부호화부(503)는 노이즈 필링(noise filling)을 위한 정보도 함께 부호화한다.
비트 패킹부(504)는 하모닉 부호화부(503)에서 부호화된 결과를 비트 패킹하여 도 7에 도시된 바와 같이 데이터 구조를 갖는 비트스트림을 생성하여 출력한다. 도 7을 통해 알 수 있는 바와 같이 고대역 또는 광대역 잔차 오디오 신호에 대한 비트스트림은 코어 계층(core layer)과 확장 계층(enhancement layer)으로 구분된다. 코어계층은 저대역 신호에 대한 데이터와 나머지 데이터 필드(other data)로 나눌 수 있다. 나머지 데이터 필드는 상기 노이즈 필링을 위한 정보가 포함된다. 그리고 확장 계층은 각 하모닉 단위로 크기와 위상에 대한 정보가 포함된다. 도 7과 같은 확장 계층이 FSC를 지원할 수 있는 데이터 구조이다. 도 7의 비트스트림의 전제 비트레이트는 Akbit/s(코어 계층) + Bkbit/s(확장 계층)로 정의된 예이다.
도 4의 저대역 오디오 부호화 장치(403)는 대역 분할부(401)로부터 전송되는 저대역 오디오 신호를 부호화하고, 비트 패킹된 오디오 신호를 출력한다. 저대역 오디오 부호화 장치(403)에서 출력되는 오디오 신호는 채널(410) 및 대역 분할부(401)로 각각 전송된다.
채널(410)은 고대역 또는 광대역 잔차 오디오 부호화 장치(402)와 저대역 오디오 부호화 장치(403)로부터 각각 출력되는 패킷화된 부호화된 비트스트림을 오디오 복호화 장치(420)로 전송한다.
오디오 복호화 장치(420)는 채널(410)로부터 전송되는 부호화된 고대역 또는 광대역 잔차 오디오 신호의 비트스트림 패킷과 부호화된 저대역 오디오 신호의 비트스트림 패킷을 각각 수신하여 복원된 오디오 신호를 생성한다.
이를 위하여 오디오 복호화 장치(420)는 고대역 또는 광대역 잔차 오디오 복호화 장치(421), 저대역 오디오 복호화 장치(422), 및 대역 병합부(423)를 포함한다.
고대역 또는 광대역 잔차 오디오 복호화 장치(421)는 부호화된 고대역 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림 패킷이 수신되면, 디패킹(depacking)하여 계층단위로 복원된 오디오 신호를 생성하여 출력한다.
이를 위하여 고대역 또는 광대역 잔차 오디오 복호화 장치(421)는 도 8에 도시된 바와 같이 구성된다. 즉, 도 8을 참조하면, 고대역 또는 광대역 잔차 오디오 복호화 장치(421)는 비트 디패킹부(810), 및 하모닉 복호화 유니트(820)를 포함한다.
비트 디패킹부(810)는 도 7에 도시된 바와 같이 다른 데이터 필드로 구성된 코어 계층과 확장 계층으로 구성된 비트스트림이 수신되면, 코어 계층과 확장계층으로 분리되고 확장 계층은 데이터 필드 단위(또는 하모닉 단위)로 분리되도록 디패킹하여 출력한다.
하모닉 복호화 유니트(820)는 코어 계층 복호화기(821), 제 1 내지 제 n 계층 복호화기(822_1∼822_n)로 구성되어 각 계층별 비트스트림을 복호한다. 즉, 코더 계층 복호화기(821)는 다른 데이터 필드에 포함되어 있는 비트스트림을 복호화하고, 제 1 계층 복호화기(822_1)는 도 7의 데이터 필드 0(Data 0)을 통해 전송되는 비트스트림을 복호화하고, 제 n 계층 복호화기(822_n)는 도 7의 데이터 필드(Data N-1)를 통해 전송되는 비트스트림을 복호화한다.
그러나, 하모닉 복호화 유니트(820)에 포함되어 있는 각 복호화기의 복호화 여부는 오디오 복호화 장치(420)의 동작 조건 또는 사용자의 취향 또는 채널(410)의 환경에 따라 결정될 수 있다. 만약 해당되는 프레임에서 확장 계층에서 Data 0필드에 정의된 하나의 하모닉 정보가 수신되면, 코어 계층에 정의된 노이즈 필링을 위한 정보를 이용하여 해당되는 프레임의 오디오 신호가 복원될 수 있다.
즉, 만약 해당되는 프레임의 하모닉의 수가 적은 경우에, 하모닉 복호화 유니트(820)는 노이즈 필링을 하게 된다. 노이즈 필링의 여부는 문턱값(threshold)을 이용하여 결정된다. 사용되는 문턱값은 복호화된 전체 하모닉의 크기의 합과 전체 RMS와의 비율을 토대로 설정될 수 있다. 상기 비율이 상기 문턱값 이하인 경우에 상기 노이즈 필링을 하게 된다. 노이즈 필링은 일단 그 때까지 복원된 하모닉을 구하고, 전송된 RMS와 기울기를 이용하여 전체 대역에 대한 크기 정보를 구한다. 그 다음, 아직 디코딩이 되지 않은 부분은 랜덤 노이즈를 발생시켜서 채워놓는 방식으로 수행된다. 이 때, 그 대역에 해당하는 크기정보가 발생될 랜덤 노이즈의 크기가 된다.
각 계층별로 복호화된 고대역 또는 광대역 잔차 오디오 신호는 대역 병합부(423)로 전송된다.
저대역 오디오 복호화 장치(422)는 부호화된 저대역 오디오 신호에 상응하는 비트스트림이 수신되면, 복호화하여 복원된 저대역 오디오 신호를 출력한다. 복원된 저대역 오디오 신호는 대역 병합부(423)로 전송된다.
대역 병합부(423)는 고대역 또는 광대역 잔차 오디오 복호화 장치(421)로부터 출력되는 각 계층별로 복원된 오디오 신호와 저대역 오디오 복호화 장치(422)로부터 출력되는 복원된 저대역 오디신호를 병합하여 복원된 오디오 신호를 출력한다.
도 9는 본 발명의 실시 예에 따른 고대역 또는 광대역 잔차 오디오 부호화 방법의 동작 흐름도이다.
우선, 입력되는 오디오 신호를 도 4에서와 같은 대역 분할부(401)를 이용하여 고대역 또는 광대역 잔차 오디오 신호와 저대역 오디오 신호로 분할하면, 고대역 또는 광대역 잔차 오디오 신호의 모든 하모닉을 프레임 단위로 검출한다(901). 이 때, 검출되는 하모닉 수는 도 5에서 설명한 바와 같이 제한될 수 있다. 또한, 검출된 하모닉에 대해 평활화 기법이 적용될 수 있다.
검출된 각 하모닉의 크기, 위상, 및 대역 정보를 구하여 정규화한다(902). 그리고, 각 하모닉의 크기, 위상 및 대역 정보에 각각의 가중치와 상기 정규화된 크기, 정규화된 위상, 및 정규화된 대역 정보를 이용하여 각 하모닉의 순서 중요도(C)를 구한다(903).
순서 중요도를 토대로 프레임당 검출된 하모닉들에 대한 순서를 결정한다(904). 결정된 하모닉의 순서를 토대로 하모닉 부호화가 수행된다(905). 하모닉 부호화는 순위 중요도가 높은 하모닉부터 순차적으로 수행된다.
그 다음, 노이즈 필링을 위한 정보를 부호화한다(906).
이러한 하모닉 부호화 결과와 노이즈 필링을 위한 정보에 대한 부호화 결과를 이용하여 고대역 또는 광대역 잔차 오디오 신호에 대한 비트 패킹이 수행되어 도 7과 같은 비트스트림이 생성된다(907).
생성된 비트스트림을 부호화된 고대역 또는 광대역 잔차 오디오 신호의 비트스트림으로 하여 채널(410)로 송출한다(908).
입력되는 오디오 신호에서 분할된 저대역 오디오 신호에 대한 부호화는 상술한 고대역 또는 광대역 잔차 오디오 신호에 대한 부호화와 병렬로 수행되어 채널(410)로 전송된다.
도 10은 본 발명의 실시 예에 따른 고대역 또는 광대역 잔차 오디오 신호 복호화 방법의 동작 흐름도이다.
부호화된 고대역 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면(1001), 수신된 비트스트림을 디패킹(depacking)하여 계층별 및 하모닉별로 분할한다(1002). 계층별 하모닉별로 분할된 비스트림을 각 계층별로 도 8에서와 같이 복호화하여(1003), 계층별로 복원된 고대역 또는 광대역 잔차 오디오 신호를 생성한다(1004).
본원 발명에 따른 고대역 또는 광대역 잔차 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 본 발명에 따르면, 고대역 또는 광대역 잔차 오디오 신호의 하모닉 정보를 이용하여 FGS를 지원함으로써, 오디오 신호에 대한 확장성(scalability)을 극대화할 수 있을 뿐 아니라 하모닉 단위로 디코딩이 가능하므로, 아주 미세한 GS(Granularity scalability)를 지원할 수 있다.
또한, 저대역 오디오 신호는 유지하면서 고대역 또는 광대역 잔차 오디오 신호의 하모닉 정보를 이용함으로써, 기본 오디오의 질을 유지할 수 있다.
그리고, 고대역 또는 광대역 잔차 오디오 신호의 하모닉이 아주 작은 경우에도 노이즈 필링(noise filling)을 통해 오디오를 복원할 수 있으므로, 오디오 질을 향상시킬 수 있다.

Claims (25)

  1. 최고 주파수가 7KHz이하인 오디오 신호를 부호화하는 오디오 부호화 방법에 있어서,
    상기 오디오 신호가 입력되면, 상기 입력되는 오디오 신호의 고대역 오디오 신호 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 단계;
    상기 검출된 하모닉에 대한 부호화 순서를 결정하는 단계; 및
    상기 부호화 순서를 토대로 상기 검출된 하모닉에 대한 부호화를 수행하는 단계를 포함하고,
    상기 고대역 오디오 신호는 상기 입력되는 오디오 신호로부터 분할된 고대역 오디오 신호이고,
    상기 광대역 잔차 오디오 신호는 상기 입력되는 오디오 신호의 저대역 오디오 신호를 부호화 및 복호화한 신호를 상기 입력되는 오디오 신호로부터 감산하여 얻은 신호인 것을 특징으로 하는 오디오 부호화 방법.
  2. 제 1 항에 있어서, 상기 하모닉에 대한 부호화 순서 결정 단계는,
    하모닉 단위로 크기, 위상 및 대역 정보를 정규화하는 단계;
    상기 정규화된 크기, 위상 및 대역 정보를 토대로 각 하모닉에 대한 순서 중요도를 구하는 단계;
    상기 각 하모닉의 순서 중요도를 토대로 상기 각 하모닉에 대한 부호화 순서를 결정하는 단계를 포함하는 오디오 부호화 방법.
  3. 제 1 항 또는 제 2 항에 있어서, 상기 방법은,
    노이즈 필링을 위한 정보를 부호화하는 단계를 더 포함하는 오디오 부호화 방법.
  4. 제 3 항에 있어서, 상기 노이즈 필링을 위한 정보는 프레임단위로 상기 하모닉 검출 단계에서 검출된 하모닉들의 크기의 총 오디오 출력(RMS) 값과 스펙트럼의 틸트 정보를 포함하는 오디오 부호화 방법.
  5. 제 3 항에 있어서, 상기 방법은,
    상기 하모닉 부호화 결과와 상기 부호화된 노이즈 필링을 위한 정보를 이용한 비트 패킹을 수행하는 단계를 더 포함하는 오디오 부호화 방법.
  6. 제 5 항에 있어서, 상기 비트 패킹에 의해 상기 노이즈 필링을 위한 정보를 포함한 코어 계층과 하모닉 부호화 결과를 하모닉 단위로 포함한 확장 계층(enhancement layer)을 갖는 비트스트림이 생성되는 것을 특징으로 하는 오디오 부호화 방법.
  7. 제 2 항에 있어서, 상기 하모닉에 대한 부호화 순서는 상기 순서 중요도가 높은 하모닉부터 순차적으로 부호화되도록 결정되는 것을 특징으로 하는 오디오 부호화 방법.
  8. 제 1 항 또는 제 2 항에 있어서, 상기 하모닉 검출 단계는,
    프레임단위로 상기 고대역 오디오 신호 또는 광대역 잔차 오디오 신호의 전체 하모닉을 검출하는 단계; 및
    상기 전체 하모닉중 크기가 소정 치 이하의 하모닉을 제거하는 단계를 포함하는 오디오 부호화 방법.
  9. 최고 주파수 대역이 7KHz이하인 오디오 신호를 부호화하는 오디오 부호화 장치에 있어서,
    상기 오디오 신호가 입력되면, 상기 입력되는 오디오 신호의 고대역 오디오 신호 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 하모닉 검출부;
    상기 하모닉 검출부에서 검출된 하모닉에 대한 부호화 순서를 결정하는 하모닉 순서 결정부; 및
    상기 하모닉 순서 결정부에서 결정된 부호화 순서를 토대로 하모닉에 대한 부호화를 수행하는 하모닉 부호화부를 포함하고,
    상기 고대역 오디오 신호는 상기 입력되는 오디오 신호로부터 분할된 고대역 오디오 신호이고,
    상기 광대역 잔차 오디오 신호는 상기 입력되는 오디오 신호의 저대역 오디오 신호를 부호화 및 복호화한 신호를 상기 입력되는 오디오 신호로부터 감산하여 얻은 신호인 것을 특징으로 하는 오디오 부호화 장치.
  10. 제 9 항에 있어서, 상기 하모닉 순서 결정부는 각 하모닉의 순서 중요도를 구하고, 상기 순서 중요도를 토대로 상기 하모닉에 대한 부호화 순서를 결정하는 것을 특징으로 하는 오디오 부호화 장치.
  11. 제 10 항에 있어서, 상기 하모닉의 순서 중요도는 각 하모닉의 크기, 위상 및 대역 정보를 토대로 구하는 것을 특징으로 하는 오디오 부호화 장치.
  12. 제 9 항 또는 제 10 항에 있어서, 상기 하모닉 부호화는 노이즈 필링을 위한 정보를 더 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
  13. 제 12 항에 있어서, 상기 노이즈 필링을 위한 정보는 프레임단위로 상기 하모닉 검출부에서 검출된 하모닉들의 크기의 총 오디오 출력(RMS) 값과 스펙트럼의 틸트 정보를 포함하는 오디오 부호화 장치.
  14. 제 12 항에 있어서, 상기 오디오 부호화 장치는,
    상기 하모닉 부호화된 결과를 비트 패킹하여 상기 노이즈 필링을 위한 정보를 포함하는 코어 계층과 하모닉 부호화 결과를 하모닉 단위로 포함한 확장 계층을 갖는 비트스트림을 생성하는 비트 패킹부를 더 포함하는 오디오 부호화 장치.
  15. 제 9 항 또는 제 10 항에 있어서, 상기 하모닉 검출부는,
    프레임 단위로 상기 고대역 오디오 신호 또는 광대역 잔차 오디오 신호의 전체 하모닉을 검출하고, 상기 전체 하모닉중 크기가 소정치 이하의 하모닉을 제거하고 남은 하모닉을 검출된 하모닉으로 출력하는 것을 특징으로 하는 오디오 부호화 장치.
  16. 제 9 항 또는 제 10 항에 있어서, 상기 오디오 부호화 장치는,
    상기 입력되는 오디오 신호를 고대역 오디오 신호 또는 광대역 잔차 오디오 신호와 저대역 오디오 신호로 분할하는 대역 분할부; 및
    상기 저대역 오디오 신호를 부호화하고, 상기 부호화된 저대역 오디오 신호를 상기 대역 분할부로 제공하는 저대역 오디오 부호화장치를 더 포함하는 오디오 부호화 장치.
  17. 최고 주파수가 7KHz이하인 오디오 신호를 복호화 하는 오디오 복호화 방법에 있어서,
    부호화된 고대역 오디오 신호 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면, 코어 계층과 확장 계층별로 복호화하는 단계; 및
    상기 코어 계층과 확장 계층별로 복호화된 결과를 코어 계층과 확장 계층별로 복원된 고대역 오디오 신호 또는 광대역 잔차 오디오 신호로 출력하는 단계를 포함하고,
    상기 고대역 오디오 신호는 상기 최고 주파수가 7KHz이하인 오디오 신호 부호화시 상기 오디오 신호로부터 분할된 고대역 오디오 신호이고,
    상기 광대역 잔차 오디오 신호는 상기 최고 주파수가 7KHz이하인 오디오 신호 부호화시 상기 오디오 신호의 저대역 오디오 신호를 부호화 및 복호화한 신호를 상기 입력되는 오디오 신호로부터 감산하여 얻은 신호인 것을 특징으로 하는 오디오 복호화 방법.
  18. 제 17 항에 있어서, 상기 방법은,
    상기 수신된 비트스트림을 디패킹하여 코어 계층과 확장 계층별로 분할하는 단계를 더 포함하는 오디오 복호화 방법.
  19. 제 17 항 또는 제 18 항에 있어서, 상기 확장 계층은 하모닉 단위로 정의되는 것을 특징으로 하는 오디오 복호화 방법.
  20. 제 19 항에 있어서, 상기 확장 계층에 포함되는 비트스트림이 소정치 이하이면, 상기 코어 계층에 포함되어 있는 노이즈 필링을 위한 정보를 이용하여 상기 고대역 오디오 신호 또는 광대역 잔차 오디오 신호를 복원하는 것을 특징으로 하는 오디오 복호화 방법.
  21. 제 17 항 또는 제 18 항에 있어서, 상기 방법은,
    저대역 오디오 신호에 상응하는 부호화된 비트스트림이 수신되면, 복호화하여 복원된 저대역 오디오 신호로 출력하는 단계; 및
    상기 복원된 저대역 오디오 신호와 상기 코어 계층과 확장 계층별로 복원된 고대역 오디오 신호 또는 광대역 잔차 오디오 신호를 병합하여 복원된 오디오 신호를 출력하는 단계를 더 포함하는 오디오 복호화 방법.
  22. 최고 주파수가 7KHz이하인 오디오 신호를 복호화하는 오디오 복호화 장치에 있어서,
    부호화된 고대역 오디오 신호 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면, 디패킹하는 비트 패킹부; 및
    상기 비트 패킹부로부터 코어 계층과 확장 계층별로 출력되는 비트스트림을 코어 계층과 확장 계층단위로 복호화하는 하모닉 복호화 유니트를 포함하고,
    상기 고대역 오디오 신호는 상기 최고 주파수가 7KHz 이하인 오디오 신호 부호화시 상기 오디오 신호로부터 분할된 고대역 오디오 신호이고,
    상기 광대역 잔차 오디오 신호는 상기 오디오 신호 부호화시 상기 최고 주파수가 7KHz이하인 오디오 신호의 저대역 오디오 신호를 부호화 및 복호화한 신호를 상기 입력되는 오디오 신호로부터 감산하여 얻은 신호인 것을 특징으로 하는 오디오 복호화 장치.
  23. 제 22 항에 있어서,
    상기 확장 계층은 하모닉 단위로 구분한 복호화가 수행되도록 구성되는 것을 특징으로 하는 오디오 복호화 장치.
  24. 최고 주파수가 7KHz이하인 오디오 신호를 부호화하는 오디오 부호화 방법을 수행하는 프로그램이 기록된 기록 매체에 있어서,
    상기 오디오 부호화 방법은,
    상기 오디오 신호가 입력되면, 상기 입력되는 오디오 신호의 고대역 오디오 신호 또는 광대역 잔차 오디오 신호의 하모닉을 검출하는 단계;
    상기 검출된 하모닉에 대한 부호화 순서를 결정하는 단계; 및
    상기 부호화 순서를 토대로 상기 검출된 하모닉에 대한 부호화를 수행하는 단계를 포함하는 기록 매체.
  25. 최고 주파수가 7KHz이하인 오디오 신호를 복호화하는 오디오 복호화 방법을 수행하는 프로그램이 저장된 기록 매체에 있어서,
    상기 오디오 복호화 방법은,
    부호화된 고대역 오디오 신호 또는 광대역 잔차 오디오 신호에 상응하는 비트스트림이 수신되면, 코어 계층과 확장 계층별로 복호화하는 단계; 및
    상기 코어 계층과 확장 계층별로 복호화된 결과를 상기 코어 계층과 확장 계층별 복원된 고대역 오디오 신호 또는 광대역 잔차 오디오 신호로 출력하는 단계를 포함하고,
    상기 고대역 오디오 신호는 상기 최고 주파수가 7KHz이하인 오디오 신호 부호화시 상기 오디오 신호로부터 분할된 고대역 오디오 신호이고,
    상기 광대역 잔차 오디오 신호는 상기 오디오 신호 부호화시 상기 최고 주파수가 7KHz이하인 오디오 신호의 저대역 오디오 신호를 부호화 및 복호화한 신호를 상기 입력되는 오디오 신호로부터 감산하여 얻은 신호인 것을 특징으로 하는 기록 매체.
KR1020050024567A 2005-03-24 2005-03-24 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 KR100707186B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050024567A KR100707186B1 (ko) 2005-03-24 2005-03-24 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US11/337,487 US8015017B2 (en) 2005-03-24 2006-01-24 Band based audio coding and decoding apparatuses, methods, and recording media for scalability

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050024567A KR100707186B1 (ko) 2005-03-24 2005-03-24 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체

Publications (2)

Publication Number Publication Date
KR20060102700A KR20060102700A (ko) 2006-09-28
KR100707186B1 true KR100707186B1 (ko) 2007-04-13

Family

ID=37036291

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050024567A KR100707186B1 (ko) 2005-03-24 2005-03-24 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체

Country Status (2)

Country Link
US (1) US8015017B2 (ko)
KR (1) KR100707186B1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
JP5183741B2 (ja) * 2007-08-27 2013-04-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
KR100942700B1 (ko) * 2007-12-17 2010-02-17 한국전자통신연구원 미세 입자 화소 스케일러빌리티 부호화/복호화 방법 및장치
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
US9093120B2 (en) * 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
BR112015017748B1 (pt) 2013-01-29 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Preenchimento de ruído na codificação de áudio de transformada perceptual
US9215017B2 (en) * 2013-06-18 2015-12-15 Samsung Electronics Co., Ltd. Computing system with decoding sequence mechanism and method of operation thereof
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
US9691408B2 (en) 2014-12-16 2017-06-27 Psyx Research, Inc. System and method for dynamic equalization of audio data
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11144382A (ja) 1997-11-12 1999-05-28 Victor Co Of Japan Ltd 符号情報処理方法及び装置、符号情報の記録媒体への記録方法
JP2000276194A (ja) 1999-03-25 2000-10-06 Yamaha Corp 波形圧縮方法及び波形生成方法
JP2003108197A (ja) 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
KR20040001184A (ko) * 2002-06-27 2004-01-07 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
US5864813A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for harmonic enhancement of encoded audio signals
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
EP1039442B1 (en) * 1999-03-25 2006-03-01 Yamaha Corporation Method and apparatus for compressing and generating waveform
WO2001037263A1 (en) * 1999-11-16 2001-05-25 Koninklijke Philips Electronics N.V. Wideband audio transmission system
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
JP2002016925A (ja) * 2000-04-27 2002-01-18 Canon Inc 符号化装置及び符号化方法
US7532943B2 (en) * 2001-08-21 2009-05-12 Microsoft Corporation System and methods for providing automatic classification of media entities according to sonic properties
JP2004522198A (ja) * 2001-05-08 2004-07-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化方法
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
US6934679B2 (en) * 2002-03-07 2005-08-23 Microsoft Corporation Error resilient scalable audio coding
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
EP1673764B1 (en) * 2003-10-10 2008-04-09 Agency for Science, Technology and Research Method for encoding a digital signal into a scalable bitstream, method for decoding a scalable bitstream
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11144382A (ja) 1997-11-12 1999-05-28 Victor Co Of Japan Ltd 符号情報処理方法及び装置、符号情報の記録媒体への記録方法
JP2000276194A (ja) 1999-03-25 2000-10-06 Yamaha Corp 波形圧縮方法及び波形生成方法
JP2003108197A (ja) 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
KR20040001184A (ko) * 2002-06-27 2004-01-07 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치

Also Published As

Publication number Publication date
US8015017B2 (en) 2011-09-06
US20060217975A1 (en) 2006-09-28
KR20060102700A (ko) 2006-09-28

Similar Documents

Publication Publication Date Title
KR100707186B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
KR100707174B1 (ko) 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
KR100803205B1 (ko) 저비트율 오디오 신호 부호화/복호화 방법 및 장치
KR101423737B1 (ko) 오디오 신호의 디코딩 방법 및 장치
US9728196B2 (en) Method and apparatus to encode and decode an audio/speech signal
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100813259B1 (ko) 입력신호의 계층적 부호화/복호화 장치 및 방법
KR100868763B1 (ko) 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
US7805314B2 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
EP2239731A1 (en) Encoding device, decoding device, and method thereof
JP2009515212A (ja) オーディオ圧縮
WO2014042439A1 (ko) 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치
EP1441330B1 (en) Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method
KR20130047643A (ko) 통신 시스템에서 신호 코덱 장치 및 방법
KR20140082676A (ko) 음성 신호 부호화 방법 및 음성 신호 복호화 방법 그리고 이를 이용하는 장치
RU2409874C9 (ru) Сжатие звуковых сигналов
KR100682966B1 (ko) 주파수 크기데이터 양자화/역양자화 방법 및 장치와 이를이용한 오디오 부호화/복호화 방법 및 장치
Joseph et al. Speech coding based on orthogonal and biorthogonal wavelet
Lin et al. Adaptive bandwidth extension of low bitrate compressed audio based on spectral correlation
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
US20090006081A1 (en) Method, medium and apparatus for encoding and/or decoding signal
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR101449432B1 (ko) 신호 부호화 및 복호화 방법 및 장치
EA044947B1 (ru) Обратно совместимая компоновка гармонического транспозера для реконструкции высоких частот звуковых сигналов
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment
FPAY Annual fee payment
FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee