KR20090013571A - 변환 부호화 방법 및 장치 - Google Patents

변환 부호화 방법 및 장치 Download PDF

Info

Publication number
KR20090013571A
KR20090013571A KR1020070077815A KR20070077815A KR20090013571A KR 20090013571 A KR20090013571 A KR 20090013571A KR 1020070077815 A KR1020070077815 A KR 1020070077815A KR 20070077815 A KR20070077815 A KR 20070077815A KR 20090013571 A KR20090013571 A KR 20090013571A
Authority
KR
South Korea
Prior art keywords
encoding
domain
frequency component
encoded
band
Prior art date
Application number
KR1020070077815A
Other languages
English (en)
Other versions
KR101403340B1 (ko
Inventor
김미영
오은미
주기현
김중회
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070077815A priority Critical patent/KR101403340B1/ko
Priority to US11/947,016 priority patent/US20090037180A1/en
Publication of KR20090013571A publication Critical patent/KR20090013571A/ko
Application granted granted Critical
Publication of KR101403340B1 publication Critical patent/KR101403340B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 소정의 방식으로 부호화된 비트스트림을 다른 방식으로 부호화하는 방법 및 장치에 관한 것으로서, 소정의 방식으로 부호화된 비트스트림을 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화함으로써 보다 효율적으로 부호화하여 송수신할 수 있으며 호환성을 제공할 수 있다.

Description

변환 부호화 방법 및 장치{Method and apparatus for transcoding}
본 발명은 트렌스코딩(transcoding)에 관한 것으로, 보다 상세하게는 소정의 방식으로 부호화된 비트스트림을 다른 방식으로 부호화하는 방법 및 장치에 관한 것이다.
음성 신호 또는 음악 신호와 같은 오디오 신호는 다양한 코덱에 의하여 부호화될 수 있다. 그러나 MP3 플레이어, PC(Personal Computer)와 같은 오디오 신호를 복호화하는 디바이스가 모든 코덱 방식을 지원하여 복호화할 수 있는 것은 아니다. 그러므로 디바이스에서 지원하지 않는 코덱으로 부호화된 비트스트림을 디바이스에서 지원하는 포멧으로 변환하여 부호화하는 것이 요구된다.
본 발명이 이루고자 하는 기술적 과제는, 소정의 방식으로 부호화된 비트스트림을 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화하는 방법 및 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 변환 부호화 방법은, 소정의 방식으로 부호화된 비트스트림을 복호화하는 단계, 상기 복호화된 결과를 소정의 밴드별로 분할하여 각 밴드에 대해 부호화할 도메인을 기 설정된 기준에 따라 선택하는 단계 및 상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 단계를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 소정의 방식으로 부호화된 비트스트림을 복호화하는 단계, 상기 복호화된 결과를 소정의 밴드별로 분할하여 각 밴드에 대해 부호화할 도메인을 기 설정된 기준에 따라 선택하는 단계 및 상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 단계를 포함한 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.
상기의 과제를 이루기 위한 본 발명에 의한 변환 부호화 장치는, 소정의 방식으로 부호화된 비트스트림을 복호화하는 복호화부, 상기 복호화된 결과를 소정의 밴드별로 분할하여 각 밴드에 대해 부호화할 도메인을 기 설정된 기준에 따라 선택하는 도메인 선택부 및 상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 부호화부를 포함하는 것을 특징으로 한다.
본 발명에 의한 변환 부호화 방법 및 장치에 의하면, 소정의 방식으로 부호화된 비트스트림을 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화한다.
기존의 코덱에 의해 부호화된 비트스트림도 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화함으로써 보다 효율적으로 부호화하여 송수신할 있는 효과를 거둘 수 있다. 또한, 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화한 비트스트림을 복호화하는 디바이스에서도 기존의 코덱에 의해 부호화된 비트스트림을 복호화하여 재생함으로써 호환성을 제공할 수 있는 효과를 거둘 수 있다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 변환 부호화 방법 및 장치에 대해 상세히 설명한다.
도 1은 본 발명에 의한 변환 부호화 장치를 포함하는 시스템의 일 실시예를 블록도로 도시한 것으로서, 시스템은 컨텐츠 제공부(100) 및 타겟 디바이스(110)를 포함하여 이루어진다.
컨텐츠 제공부(100)는 본 발명에 의한 변환 부호화 장치의 일 실시예로서 소정의 방식으로 부호화된 비트스트림을 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화한다. 컨텐츠 제공부(100)의 실시예로 컨텐츠 서버(contents server) 또는 퍼스털 컴퓨터(personal computer)가 있다.
타겟 디바이스(110)는 소정의 밴드별로 부호화된 도메인이 서로 상이하게 적응적으로 부호화된 비트스트림을 복호화한다.
도 2는 본 발명에 의한 변환 부호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 변환 부호화 장치는 소스 복호화부(200), 타겟 부호화부(210) 및 부가정보 제공부(220)를 포함하여 이루어진다.
소스 복호화부(200, source decoder)는 입력단자 IN을 통해서 입력된 소정의 방식으로 부호화된 비트스트림을 복호화하여 복호화된 결과인 신호를 출력한다. 소스 복호화부(200)에서 복호화하는 비트스트림을 부호화하는 방식으로 MP3(Motion Pictures Expert Group), AAC(Advanced Audio Coding), WMA(Windows Media Audio) 등이 있다.
타겟 부호화부(210, target encoder)는 소스 복호화부(200)에서 복호화된 신호를 소정의 밴드별로 부호화할 도메인을 선택하여 적응적으로 부호화한다.
부가정보 제공부(220)는 타겟 부호화부(210)에서 부호화하는 데 이용할 부가 정보를 소스 복호화부(200)에서 복호화를 수행하는 과정에서 추출하거나 입력단자 IN'을 통해 사용자로부터 입력받아 타겟 부호화부(210)에 제공한다. 그러나 본 발명에 의한 변환 부호화 장치는 부가정보 제공부(220)를 반드시 포함하여 실시해야 하는 것은 아니다.
도 3은 본 발명에 의한 변환 부호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 변환 부호화 장치는 방식 판단부(300), 비트스트림 복호화부(305), 선택부(310), 변환부(315), 시간도메인 부호화부(320), 주파수도메인 부호화부(325), 다중화부(330)를 포함하여 이루어진다. 또한, 변환 부호화 장치는 도메인정보 추출부(335), 설정 입력부(340) 및 파라미터 추출부(345)도 포함하여 실시할 수 있다.
소스 복호화부(200)는 방식 판단부(300) 및 비트스트림 복호화부(305)를 포함하여 이루어진다.
방식 판단부(300)는 입력단자 IN을 통해 입력된 비트스트림이 부호화된 방식을 판단한다. 여기서, 부호화된 방식의 예로 MP3(Motion Pictures Expert Group), AAC(Advanced Audio Coding), WMA(Windows Media Audio) 등이 있다.
비트스트림 복호화부(305)는 방식 판단부(300)에서 판단된 방식으로 방식 판단부(300)에서 입력받은 비트스트림을 복호화한다.
그러나 소스 복호화부(200)는 방식 판단부(300)를 반드시 포함하여 실시해야 하는 것은 아니며, mp3와 같이 사용자에게 일반적으로 이용되는 특정 포멧으로 부호화된 방식을 고정하여 방식 판단부(300)를 포함하지 않고 비트스트림 복호화부(305)에서 비트스트림을 입력받아 고정된 단수의 방식으로만 복호화할 수도 있다.
타겟 부호화부(210)는 선택부(310), 변환부(315), 시간도메인 부호화부(320), 주파수도메인 부호화부(325) 및 다중화부(330)를 포함하여 이루어진다.
선택부(310)는 변환부(315)에서 분할되어 각 밴드에 마련된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 각 밴드 별로 선택한 다. 또한, 선택부(310)에서 각 밴드에 대하여 선택된 도메인에 관한 정보들은 부호화하여 다중화부(330)로 출력한다.
변환부(315)는 비트스트림 복호화부(305)에서 복호화된 결과에 해당하는 신호를 소정의 밴드 단위로 분할하여 각 밴드에 마련된 신호를 시간 도메인 또는 주파수 도메인으로 변환한다.
여기서 변환부(315)는 주파수 도메인으로 변환하는 밴드(들)에 마련된 신호(들)를 제1 변환 방식으로 시간 도메인에서 주파수 도메인으로 변환하고, 심리 음향 모델을 적용하기 위해서 제1 변환 방식 이외의 제2 변환 방식으로도 시간 도메인에서 주파수 도메인으로 변환한다. 제1 변환 방식에 의해 변환된 스펙트럼은 주파수 도메인으로 부호화하는 밴드에 마련된 신호를 부호화하는 데 이용되며, 제2 변환 방식에 의해 변환된 신호는 주파수 도메인으로 부호화하는 밴드에 마련된 신호에 대하여 심리 음향 모델을 적용하는 데 이용된다. 여기서, 심리음향모델은 인간 청각 시스템의 차폐 작용에 대한 수학적 모델을 말한다.
예를 들어, 변환부(315)는 소정의 밴드에 마련된 신호를 제1 변환 방식에 해당하는 MDCT(Modified Discrete Cosine Transform)에 의해 주파수 도메인으로 변환하여 실수부로 표현하고, 제2 변환 방식에 해당하는 MDST(Modified Discrete Sine Transform)에 의해 주파수 도메인으로도 변환하여 허수부로 표현할 수 있다. 여기서, MDCT에 의해 변환되어 실수부로 표현된 신호는 소정의 밴드에 마련된 신호를 부호화하는 데 사용되며, MDST에 의해 변환되어 허수부로 표현된 신호는 소정의 밴드에 마련된 신호에 대하여 심리 음향 모델을 적용하는 데 이용된다. 이에 의하여 신호의 위상 정보를 추가로 표현할 수 있기 때문에 시간 도메인에 해당하는 신호에 대하여 DFT(Discrete Fourier Transform)를 수행한 후, MDCT의 계수를 양자화함으로써 발생되는 미스 매치(miss match)를 해결할 수 있다.
이러한 변환부(315)는 시간 도메인으로 표현된 신호를 입력받아 시간 도메인과 주파수 도메인으로 동시에 표현할 수 있는 모든 변환 방식으로 구현할 수 있다. 보다 상세하게 설명하면, 시간 도메인으로 표현된 신호를 주파수 도메인으로 변환한 후 밴드 별로 적절히 시간 해상도(temporal resolution)를 조절하여 소정의 밴드에 대하여 주파수 도메인으로 표현할 수 있는 적응성 있는(flexible) 변환 방식이다. 이에 부가하여 허수 표현을 통하여 심리 음향 모듈을 적용하기 위한 신호도 생성한다. 이러한 변환 방식의 일 예로 FV-MLT(Frequency Varying Modulated Lapped Transform)이 있다.
시간도메인 부호화부(320)는 선택부(310)에서 시간 도메인으로 부호화하는 것으로 결정되어 변환부(315)에서 시간 도메인으로 변환된 밴드(들)에 마련된 신호(들)을 시간 도메인에서 부호화한다. 시간도메인 부호화부(320)에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction)가 있으나 이에 한정하여 실시해야 하는 것 아니다.
주파수도메인 부호화부(325)는 선택부(310)에서 주파수 도메인으로 부호화하는 것으로 결정되어 변환부(315)에서 주파수 도메인으로 변환된 밴드(들)에 마련된 스펙트럼(들)을 주파수 도메인에서 부호화한다. 주파수도메인 부호화부(325)에서 부호화하는 일 실시예는 도 4를 설명하면서 후술하기로 한다.
다중화부(330)는 선택부(310)에서 부호화된 각 밴드가 부호화된 도메인에 대한 정보, 시간도메인 부호화부(320)에서 부호화된 밴드(들)의 신호(들) 또는 주파수도메인 부호화부(325)에서 부호화된 밴드(들)의 스펙트럼(들)를 포함하여 다중화함으로써 비트스트림을 생성하여 출력단자 OUT을 통해 출력한다.
부가정보 제공부(220)는 도메인정보 추출부(335), 설정 입력부(340) 및 파라미터 추출부(345)를 포함하여 실시할 수 있다. 그러나 본 발명에 의한 변환 부호화 장치는 부가정보 제공부(220)를 반드시 포함하여 실시해야 하는 것은 아니다. 또한, 부가정보 제공부(220)는 도메인정보 추출부(335), 설정 입력부(340) 및 파라미터 추출부(345)를 모두 포함하여 실시해야 하는 것도 아니며 적어도 하나 이상을 포함하여 선택적으로 조합함으로써 실시할 수도 있다.
도메인정보 추출부(335)는 선택부(310)에서 각 밴드에 대해 부호화할 도메인을 선택하는 데 이용할 기 설정된 정보를 비트스트림 복호화부(305)에서 복호화를 수행하는 과정에서 추출한다.
기 설정된 정보의 예로 비트스트림의 포멧(format)에 대한 정보가 있다. 도메인정보 추출부(335)는 비트스트림의 포멧이 음성 코덱으로 부호화된 포멧인지 오디오 코덱으로 부호화된 포멧인지에 대한 정보를 추출하고, 선택부(310)는 포멧에 대한 정보를 이용하여 각 밴드에 마련된 신호를 주파수 도메인으로 부호화할지 시간 도메인으로 부호화할지 여부를 선택한다.
설정 입력부(340)는 시간도메인 부호화부(320) 또는 주파수도메인 부호화부(325)에서 부호화함에 있어서 적용될 설정(들)을 사용자로부터 입력받는다. 설 정 입력부(340)에서 사용자로부터 입력받는 설정의 예로 비트율, 샘플링, 변환 음질, 변환 속도 등의 파라미터가 있다. 여기서, 시간도메인 부호화부(320) 및 주파수도메인 부호화부(325)는 설정 입력부(340)에서 사용자로부터 입력받은 설정에 따라 부호화를 수행한다.
파라미터 추출부(345)는 비트스트림 복호화부(305)에서 복호화를 수행하는 과정에서 생성되는 정보(들)을 시간도메인 부호화부(320) 또는 주파수도메인 부호화부(325)에서 이용하기 위하여 기 설정된 파라미터(들)을 비트스트림 복호화부(305)에서 복호화를 수행하는 과정에서 추출한다. 여기서, 시간도메인 부호화부(320) 및 주파수도메인 부호화부(325)는 추출한 파라미터(들)를 이용하여 부호화를 수행한다.
도 4는 본 발명에 의한 변환 부호화 장치에 포함된 주파수도메인 부호화부(325)의 일 실시예를 블록도로 도시한 것으로서, 주파수도메인 부호화부(325)는 주파수성분 선택부(400), 주파수성분 양자화부(410) 및 잔여스펙트럼 부호화부(420)를 포함하여 이루어진다.
주파수성분 선택부(400)는 선택부(310)에서 주파수 도메인으로 부호화하는 것으로 결정되어 변환부(315)에서 주파수 도메인으로 변환된 밴드(들)에 마련된 스펙트럼(들)에서 기 설정된 기준에 따라 중요한 주파수 성분(들)을 선택한다.
주파수성분 선택부(400)에서 주파수 성분을 선택하는 기 설정된 기준으로 다음과 같은 실시예들이 있다. 첫째, SMR(Signal-to-Mask Ratio) 값을 계산하여 마스킹 역치 보다 큰 신호에 해당하는 주파수 성분을 선택한다. 둘째, 소정의 가중 치를 고려하여 스펙트럼 피크를 추출하여 주파수 성분을 선택한다. 셋째, 각 밴드 별로 SNR(Signal-to-Noise Ratio) 값을 계산하여 SNR 값이 낮은 서브 밴드 중에서 소정 크기 이상의 피크 값을 갖는 주파수 성분을 선택한다. 전술된 세 가지 실시예를 각각 실시할 수 있지만, 적어도 하나 이상 실시예를 결합하여 조합함으로써 실시할 수도 있다.
주파수성분 양자화부(410)는 주파수성분 선택부(400)에서 선택된 주파수 성분(들)을 양자화하고, 양자화된 결과를 출력단자 OUT 1을 통해 출력한다.
잔여스펙트럼 부호화부(420)는 주파수성분 선택부(400)에서 선택된 주파수 성분(들)을 제외한 잔여 스펙트럼을 추출하여 주파수성분 선택부(400)에서 선택된 주파수 성분(들)과 다른 방식으로 부호화하고, 잔여 스펙트럼을 부호화한 결과는 출력단자 OUT 1을 통해 출력한다. 잔여스펙트럼 부호화부(420)에서 부호화하는 실시예로 각 밴드에 마련된 주파수 성분 선택부(400)에서 선택된 주파수 성분(들)을 제외한 잔여 스펙트럼의 각 밴드 별 에너지 값(들)을 계산하여 부호화할 수 있다.
도 5는 본 발명에 의한 변환 부호화 장치에 의해 부호화된 비트스트림을 복호화하는 장치의 일 실시예를 블록도로 도시한 것으로서, 상기 장치는 역다중화부(500), 도메인 판단부(510), 시간도메인 복호화부(515), 주파수도메인 복호화부(520) 및 역변환부(525)를 포함하여 이루어진다.
역다중화부(500)는 변환 부호화 장치에 의해 부호화된 비트스트림을 부호화기로부터 입력단자 IN을 통해 입력받은 비트스트림을 역다중화한다. 역다중화부(500)에서는 각 밴드가 부호화된 도메인에 대한 정보, 시간 도메인에서 부호화된 밴드(들)의 신호(들) 및 주파수 도메인에서 부호화된 밴드(들)의 스펙트럼(들)를 포함하여 역다중화한다.
도메인 판단부(510)는 역다중화부(500)에서 역다중화된 각 밴드가 부호화된 도메인에 대한 정보를 입력받아 부호화기에서 각 밴드가 부호화된 도메인을 판단한다.
시간도메인 복호화부(510)는 도메인 판단부(510)에서 시간 도메인으로 부호화된 것으로 판단된 밴드에 마련된 신호(들)를 시간 도메인에서 복호화한다. 시간도메인 복호화부(510)에서 복호화하는 방식의 예로 CELP(Code Excited Linear Prediction)가 있으나 이에 한정하여 실시해야 하는 것 아니다.
주파수도메인 복호화부(520)는 도메인 판단부(510)에서 주파수 도메인으로 부호화된 것으로 판단된 밴드에 마련된 스펙트럼(들)을 주파수 도메인에서 복호화한다. 주파수도메인 복호화부(520)에서 복호화하는 일 실시예는 도 6을 설명하면서 후술하기로 한다.
역변환부(525)는 시간도메인 복호화부(510)에서 복호화된 밴드(들)에 마련된 신호(들)과 주파수도메인 복호화부(520)에서 복호화된 밴드(들)에 마련된 스펙트럼(들)을 변환부(315)에서 수행하는 변환의 역과정으로 역변환함으로써 합성하여 단수의 시간 도메인에 해당하는 신호를 생성하고, 생성된 신호를 출력단자 OUT을 통해 출력한다.
도 6은 본 발명에 의한 변환 부호화 장치에 의해 부호화된 비트스트림을 복호화하는 장치에 포함된 주파수도메인 복호화부(520)의 일 실시예를 블록도로 도시 한 것으로서, 주파수도메인 복호화부(520)는 주파수성분 역양자화부(600), 잔여스펙트럼 복호화부(610) 및 합성부(620)를 포함하여 이루어진다.
주파수성분 역양자화부(600)는 부호화기에서 선택되어 부호화된 주파수 성분(들)을 역양자화한다.
잔여스펙트럼 복호화부(610)는 부호화기에서 부호화된 잔여 스펙트럼을 복호화한다.
합성부(620)는 주파수성분 역양자화부(600)에서 역양자화된 주파수 성분(들)과 잔여스펙트럼 복호화부(610)에서 복호화된 잔여 스펙트럼을 합성하여 출력단자 OUT 1을 통해 출력한다.
도 7은 본 발명에 의한 변환 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 입력된 소정의 방식으로 부호화된 비트스트림을 복호화한다(제700단계). 제700단계에서 복호화하는 비트스트림을 부호화하는 방식으로 MP3(Motion Pictures Expert Group), AAC(Advanced Audio Coding), WMA(Windows Media Audio) 등이 있다.
제720단계에서 부호화하는 데 이용할 부가 정보를 제700단계에서 복호화를 수행하는 과정에서 추출하거나 사용자로부터 입력받는다(제710단계). 그러나 본 발명에 의한 변환 부호화 방법은 제710단계를 반드시 포함하여 실시해야 하는 것은 아니다.
제710단계에서 추출되거나 입력받은 부가 정보를 이용하여 제700단계에서 복 호화된 신호를 소정의 밴드별로 부호화할 도메인을 선택하고, 각 밴드를 적응적으로 부호화한다(제720단계).
도 8은 본 발명에 의한 변환 부호화 방법에 포함된 제700단계의 일 실시예를 흐름도로 도시한 것이다.
먼저, 입력된 비트스트림이 부호화된 방식을 판단한다(제800단계). 여기서, 부호화된 방식의 예로 MP3(Motion Pictures Expert Group), AAC(Advanced Audio Coding), WMA(Windows Media Audio) 등이 있다.
제800단계에서 판단된 방식으로 비트스트림을 복호화한다(제805단계).
그러나 제700단계는 제800단계를 반드시 포함하여 실시해야 하는 것은 아니며, mp3와 같이 사용자에게 일반적으로 이용되는 특정 포멧으로 부호화된 방식을 고정하여 제800단계를 포함하지 않고 제805단계에서 비트스트림을 고정된 단수의 방식으로만 복호화할 수도 있다.
도 9는 본 발명에 의한 변환 부호화 방법에 포함된 제710단계의 일 실시예를 흐름도로 도시한 것이다. 그러나 본 발명에 의한 변환 부호화 방법은 제710단계를 반드시 포함하여 실시해야 하는 것은 아니다. 또한, 제710단계는 제900단계 내지 제920단계를 모두 포함하여 실시해야 하는 것도 아니며 적어도 하나 이상을 포함하여 선택적으로 조합함으로써 실시할 수도 있다.
후술할 제1010단계에서 각 밴드에 대해 부호화할 도메인을 선택하는 데 이용할 기 설정된 정보를 전술한 제805단계에서 복호화를 수행하는 과정에서 추출한다(제900단계).
기 설정된 정보의 예로 비트스트림의 포멧(format)에 대한 정보가 있다. 제900단계에서는 비트스트림의 포멧이 음성 코덱으로 부호화된 포멧인지 오디오 코덱으로 부호화된 포멧인지에 대한 정보를 추출하고, 후술할 제1010단계에서는 포멧에 대한 정보를 이용하여 각 밴드에 마련된 신호를 주파수 도메인으로 부호화할지 시간 도메인으로 부호화할지 여부를 선택한다.
후술할 제1020단계 내지 제1040단계 또는 제1050단계에서 부호화함에 있어서 적용될 설정(들)을 사용자로부터 입력받는다(제910단계). 제910단계에서 사용자로부터 입력받는 설정의 예로 비트율, 샘플링, 변환 음질, 변환 속도 등의 파라미터가 있다. 여기서, 후술할 제1020단계 내지 제1040단계 및 제1050단계는 제910단계에서 사용자로부터 입력받은 설정에 따라 부호화를 수행한다.
전술한 제805단계에서 복호화를 수행하는 과정에서 생성되는 정보(들)을 후술할 제1020단계 내지 제1040단계 또는 제1050단계에서 이용하기 위하여 기 설정된 파라미터(들)을 제805단계에서 복호화를 수행하는 과정에서 추출한다(제920단계). 여기서, 후술할 제1020단계 내지 제1040단계 및 제1050단계는 추출한 파라미터(들)를 이용하여 부호화를 수행한다.
도 10은 본 발명에 의한 변환 부호화 방법에 포함된 제720단계의 일 실시예를 흐름도로 도시한 것이다.
먼저, 전술한 제805단계에서 분할된 신호의 각 밴드에 마련된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 각 밴드 별로 선택하고, 전술한 제805단계에서 복호화된 결과에 해당하는 신호를 소정의 밴드 단위로 분할하여 각 밴드에 마련된 신호를 선택된 도메인에 따라 시간 도메인 또는 주파수 도메인으로 변환한다(제1000단계). 또한, 제1000단계에서는 각 밴드에 대하여 선택된 도메인에 관한 정보들은 부호화한다.
여기서 제1000단계에서는 주파수 도메인으로 변환하는 밴드(들)에 마련된 신호(들)를 제1 변환 방식으로 시간 도메인에서 주파수 도메인으로 변환하고, 심리 음향 모델을 적용하기 위해서 제1 변환 방식 이외의 제2 변환 방식으로도 시간 도메인에서 주파수 도메인으로 변환한다. 제1 변환 방식에 의해 변환된 스펙트럼은 주파수 도메인으로 부호화하는 밴드에 마련된 신호를 부호화하는 데 이용되며, 제2 변환 방식에 의해 변환된 신호는 주파수 도메인으로 부호화하는 밴드에 마련된 신호에 대하여 심리 음향 모델을 적용하는 데 이용된다. 여기서, 심리음향모델은 인간 청각 시스템의 차폐 작용에 대한 수학적 모델을 말한다.
예를 들어, 제1000단계에서는 소정의 밴드에 마련된 신호를 제1 변환 방식에 해당하는 MDCT(Modified Discrete Cosine Transform)에 의해 주파수 도메인으로 변환하여 실수부로 표현하고, 제2 변환 방식에 해당하는 MDST(Modified Discrete Sine Transform)에 의해 주파수 도메인으로도 변환하여 허수부로 표현할 수 있다. 여기서, MDCT에 의해 변환되어 실수부로 표현된 신호는 소정의 밴드에 마련된 신호를 부호화하는 데 사용되며, MDST에 의해 변환되어 허수부로 표현된 신호는 소정의 밴드에 마련된 신호에 대하여 심리 음향 모델을 적용하는 데 이용된다. 이에 의하여 신호의 위상 정보를 추가로 표현할 수 있기 때문에 시간 도메인에 해당하는 신호에 대하여 DFT(Discrete Fourier Transform)를 수행한 후, MDCT의 계수를 양자화 함으로써 발생되는 미스 매치(miss match)를 해결할 수 있다.
이러한 제1000단계에서는 시간 도메인으로 표현된 신호를 입력받아 시간 도메인과 주파수 도메인으로 동시에 표현할 수 있는 모든 변환 방식으로 구현할 수 있다. 보다 상세하게 설명하면, 시간 도메인으로 표현된 신호를 주파수 도메인으로 변환한 후 밴드 별로 적절히 시간 해상도(temporal resolution)를 조절하여 소정의 밴드에 대하여 주파수 도메인으로 표현할 수 있는 적응성 있는(flexible) 변환 방식이다. 이에 부가하여 허수 표현을 통하여 심리 음향 모듈을 적용하기 위한 신호도 생성한다. 이러한 변환 방식의 일 예로 FV-MLT(Frequency Varying Modulated Lapped Transform)이 있다.
각 밴드에 대하여 제1000단계에서 부호화할 도메인으로 선택된 도메인이 시간 도메인인지 주파수 도메인인지 여부를 판단한다(제1010단계).
제1010단계에서 주파수 도메인에서 부호화하는 것으로 판단된 밴드(들)에 마련된 스펙트럼(들)에서 기 설정된 기준에 따라 중요한 주파수 성분(들)을 선택한다(제1020단계).
제1020단계에서 주파수 성분을 선택하는 기 설정된 기준으로 다음과 같은 실시예들이 있다. 첫째, SMR(Signal-to-Mask Ratio) 값을 계산하여 마스킹 역치 보다 큰 신호에 해당하는 주파수 성분을 선택한다. 둘째, 소정의 가중치를 고려하여 스펙트럼 피크를 추출하여 주파수 성분을 선택한다. 셋째, 각 밴드 별로 SNR(Signal-to-Noise Ratio) 값을 계산하여 SNR 값이 낮은 서브 밴드 중에서 소정 크기 이상의 피크 값을 갖는 주파수 성분을 선택한다. 전술된 세 가지 실시예를 각각 실시할 수 있지만, 적어도 하나 이상 실시예를 결합하여 조합함으로써 실시할 수도 있다.
제1000단계에서 선택된 주파수 성분(들)을 양자화한다(제1030단계).
제1000단계에서 선택된 주파수 성분(들)을 제외한 잔여 스펙트럼을 추출하여 제1000단계에서 선택된 주파수 성분(들)과 다른 방식으로 부호화한다(제1040단계). 제1040단계에서 부호화하는 실시예로 각 밴드에 마련된 제1020단계에서 선택된 주파수 성분(들)을 제외한 잔여 스펙트럼의 각 밴드 별 에너지 값(들)을 계산하여 부호화할 수 있다.
제1010단계에서 시간 도메인에서 부호화하는 것으로 판단된 밴드(들)에 마련된 신호(들)을 시간 도메인에서 부호화한다(제1050단계). 제1050단계에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction)가 있으나 이에 한정하여 실시해야 하는 것 아니다.
제1000단계에서 부호화된 각 밴드가 부호화된 도메인에 대한 정보, 제1030단계에서 양자화된 주파수 성분(들), 제1040단계에서 부호화된 잔여 스펙트럼을 포함하여 다중화함으로써 비트스트림을 생성한다(제1060단계).
도 11은 본 발명에 의한 변환 부호화 방법에 의해 부호화된 비트스트림을 복호화하는 방법의 일 실시예를 흐름도로 도시한 것이다.
먼저, 변환 부호화 장치에 의해 부호화된 비트스트림을 부호화기로부터 입력받은 비트스트림을 역다중화한다(제1100단계). 제1100단계에서는 각 밴드가 부호화된 도메인에 대한 정보, 시간 도메인에서 부호화된 밴드(들)의 신호(들) 및 주파 수 도메인에서 부호화된 밴드(들)의 스펙트럼(들)를 포함하여 역다중화한다.
제1100단계에서 역다중화된 각 밴드가 부호화된 도메인에 대한 정보를 이용하여 부호화기에서 각 밴드가 부호화된 도메인을 판단한다(제1110단계).
제1110단계에서 주파수 도메인으로 부호화된 밴드(들)로 판단된 밴드(들)에 대하여는 부호화기에서 선택되어 부호화된 주파수 성분(들)을 역양자화한다(제1120단계).
제1120단계 후에, 부호화기에서 부호화된 잔여 스펙트럼을 복호화한다(제1130단계).
제1120단계에서 역양자화된 주파수 성분(들)과 제1130단계에서 복호화된 잔여 스펙트럼을 합성한다(제1140단계).
제1110단계에서 주파수 도메인으로 부호화된 밴드(들)로 판단된 신호(들)를 시간 도메인에서 복호화한다(제1150단계). 제1150단계에서 복호화하는 방식의 예로 CELP(Code Excited Linear Prediction)가 있으나 이에 한정하여 실시해야 하는 것 아니다.
제1140단계에서 합성된 스펙트럼(들)과 제1150단계에서 복호화된 밴드(들)에 마련된 신호(들)를 전술한 제1000단계에서 수행하는 변환의 역과정으로 역변환함으로써 합성하여 단수의 시간 도메인에 해당하는 신호를 생성한다(제1160단계).
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이 다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
또한, 본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
도 1은 본 발명에 의한 변환 부호화 장치를 포함하는 시스템의 일 실시예를 블록도로 도시한 것이다.
도 2는 본 발명에 의한 변환 부호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 3은 본 발명에 의한 변환 부호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 4는 본 발명에 의한 변환 부호화 장치에 포함된 주파수도메인 부호화부(325)의 일 실시예를 블록도로 도시한 것이다.
도 5는 본 발명에 의한 변환 부호화 장치에 의해 부호화된 비트스트림을 복호화하는 장치의 일 실시예를 블록도로 도시한 것이다.
도 6은 본 발명에 의한 변환 부호화 장치에 의해 부호화된 비트스트림을 복호화하는 장치에 포함된 주파수도메인 복호화부(520)의 일 실시예를 블록도로 도시한 것이다.
도 7은 본 발명에 의한 변환 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 8은 본 발명에 의한 변환 부호화 방법에 포함된 제700단계의 일 실시예를 흐름도로 도시한 것이다.
도 9는 본 발명에 의한 변환 부호화 방법에 포함된 제710단계의 일 실시예를 흐름도로 도시한 것이다.
도 10은 본 발명에 의한 변환 부호화 방법에 포함된 제720단계의 일 실시예를 흐름도로 도시한 것이다.
도 11은 본 발명에 의한 변환 부호화 방법에 의해 부호화된 비트스트림을 복호화하는 방법의 일 실시예를 흐름도로 도시한 것이다.
〈도면의 주요 부호에 대한 간단한 설명〉
300: 방식 판단부 305: 비트스트림 복호화부
310: 선택부 315: 변환부
320: 시간도메인 부호화부 325: 주파수도메인 부호화부
330: 다중화부 335: 도메인정보 추출부
340: 설정 입력부 345: 파라미터 추출부

Claims (32)

  1. 소정의 방식으로 부호화된 비트스트림을 복호화하는 단계;
    상기 복호화된 결과를 소정의 밴드별로 분할하여 각 밴드에 대해 부호화할 도메인을 기 설정된 기준에 따라 선택하는 단계; 및
    상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 단계를 포함하는 것을 특징으로 하는 변환 부호화 방법.
  2. 제1항에 있어서, 상기 선택하는 단계는
    시간 도메인 또는 주파수 도메인 가운데 어느 하나의 도메인을 선택하는 것을 특징으로 하는 변환 부호화 방법.
  3. 제1항에 있어서,
    상기 복호화하는 단계에서 기 설정된 정보(들)을 추출하는 단계를 더 포함하고,
    상기 선택하는 단계는 상기 추출된 정보(들)도 이용하여 각 밴드에 대해 부호화할 도메인을 선택하는 것을 특징으로 하는 변환 부호화 방법.
  4. 제1항에 있어서,
    상기 부호화하는 단계에서 부호화함에 있어서 적용될 설정(들)을 사용자로부 터 입력받는 단계를 더 포함하고,
    상기 부호화하는 단계는 상기 복호화된 결과를 상기 입력받은 설정(들)에 따라 부호화하는 것을 특징으로 하는 변환 부호화 방법.
  5. 제1항에 있어서, 상기 복호화하는 단계는
    상기 비트스트림이 부호화된 방식을 판단하는 단계; 및
    상기 판단된 방식에 따라 상기 비트스트림을 복호화하는 단계를 포함하는 것을 특징으로 하는 변환 부호화 방법.
  6. 제1항에 있어서,
    상기 부호화하는 단계에서 이용할 기 설정된 파라미터(들)를 상기 복호화하는 단계에서 추출하는 단계를 더 포함하고,
    상기 부호화하는 단계는 상기 추출된 파라미터(들)를 이용하여 상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 것을 특징으로 하는 변환 부호화 방법.
  7. 제1항에 있어서, 상기 부호화하는 단계는
    상기 선택하는 단계에서 주파수 도메인으로 부호화하는 것으로 선택된 밴드(들)에 마련된 스펙트럼(들)에서 기 설정된 기준에 따라 주파수 성분(들)을 선택하는 단계; 및
    상기 선택된 주파수 성분(들)을 부호화하는 단계를 포함하는 것을 특징으로 하는 변환 부호화 방법.
  8. 제7항에 있어서,
    상기 스펙트럼(들)에서 상기 선택된 주파수 성분(들)을 제외한 나머지 스펙트럼을 부호화하는 단계를 더 포함하는 것을 특징으로 하는 변환 부호화 방법.
  9. 제8항에 있어서, 상기 나머지 스펙트럼을 부호화하는 단계는
    각 밴드에 마련된 상기 나머지 스펙트럼의 에너지값(들)을 계산하여 부호화하는 것을 특징으로 하는 변환 부호화 방법.
  10. 소정의 방식으로 부호화된 비트스트림을 복호화하는 단계;
    상기 복호화된 결과를 소정의 밴드별로 분할하여 각 밴드에 대해 부호화할 도메인을 기 설정된 기준에 따라 선택하는 단계; 및
    상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 단계
  11. 소정의 방식으로 부호화된 비트스트림을 복호화하는 복호화부;
    상기 복호화된 결과를 소정의 밴드별로 분할하여 각 밴드에 대해 부호화할 도메인을 기 설정된 기준에 따라 선택하는 도메인 선택부; 및
    상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 부호화부를 포함 하는 것을 특징으로 하는 변환 부호화 장치.
  12. 제11항에 있어서, 상기 도메인 선택부는
    시간 도메인 또는 주파수 도메인 가운데 어느 하나의 도메인을 선택하는 것을 특징으로 하는 변환 부호화 장치.
  13. 제11항에 있어서,
    상기 복호화부에서 기 설정된 정보(들)을 추출하는 정보 추출부를 더 포함하고,
    상기 도메인 선택부는 상기 추출된 정보(들)도 이용하여 각 밴드에 대해 부호화할 도메인을 선택하는 것을 특징으로 하는 변환 부호화 장치.
  14. 제11항에 있어서,
    상기 부호화부에서 부호화함에 있어서 적용될 설정(들)을 사용자로부터 입력받는 설정 입력부를 더 포함하고,
    상기 부호화부는 상기 복호화된 결과를 상기 입력받은 설정(들)에 따라 부호화하는 것을 특징으로 하는 변환 부호화 장치.
  15. 제11항에 있어서, 상기 복호화부는
    상기 비트스트림이 부호화된 방식을 판단하는 방식 판단부; 및
    상기 판단된 방식에 따라 상기 비트스트림을 복호화하는 비트스트림 복호화부를 포함하는 것을 특징으로 하는 변환 부호화 장치.
  16. 제11항에 있어서,
    상기 부호화부에서 이용할 기 설정된 파라미터(들)를 상기 복호화부에서 복호화를 수행하는 과정에서 추출하는 파라미터 추출부를 더 포함하고,
    상기 부호화부는 상기 추출된 파라미터(들)를 이용하여 상기 선택된 도메인에서 상기 복호화된 결과를 부호화하는 것을 특징으로 하는 변환 부호화 장치.
  17. 제11항에 있어서, 상기 부호화부는
    상기 도메인 선택부에서 주파수 도메인으로 부호화하는 것으로 선택된 밴드(들)에 마련된 스펙트럼(들)에서 기 설정된 기준에 따라 주파수 성분(들)을 선택하는 주파수성분 선택부; 및
    상기 선택된 주파수 성분(들)을 부호화하는 주파수성분 부호화부를 포함하는 것을 특징으로 하는 변환 부호화 장치.
  18. 제17항에 있어서,
    상기 스펙트럼(들)에서 상기 선택된 주파수 성분(들)을 제외한 나머지 스펙트럼을 부호화하는 잔여스펙트럼 부호화부를 더 포함하는 것을 특징으로 하는 변환 부호화 장치.
  19. 제18항에 있어서, 상기 잔여스펙트럼 부호화부는
    각 밴드에 마련된 상기 나머지 스펙트럼의 에너지값(들)을 계산하여 부호화하는 것을 특징으로 하는 변환 부호화 장치.
  20. 소정의 방식으로 부호화된 비트스트림을 복호화하는 단계;
    상기 복호화된 결과에서 기 설정된 기준에 따라 주파수 성분(들)을 선택하는 단계; 및
    상기 선택된 주파수 성분(들)을 부호화하는 단계를 포함하는 것을 특징으로 하는 변환 부호화 방법.
  21. 제20항에 있어서,
    상기 복호화된 결과에서 상기 선택된 주파수 성분(들)을 제외한 나머지 스펙트럼을 부호화하는 단계를 더 포함하는 것을 특징으로 하는 변환 부호화 방법.
  22. 제21항에 있어서, 상기 나머지 스펙트럼을 부호화하는 단계는
    각 밴드에 마련된 상기 나머지 스펙트럼의 에너지값(들)을 계산하여 부호화하는 것을 특징으로 하는 변환 부호화 방법.
  23. 제20항에 있어서,
    상기 부호화하는 단계에서 부호화함에 있어서 적용될 설정(들)을 사용자로부터 입력받는 단계를 더 포함하고,
    상기 부호화하는 단계는 상기 선택된 주파수 성분(들)을 상기 입력받은 설정(들)에 따라 부호화하는 것을 특징으로 하는 변환 부호화 방법.
  24. 제20항에 있어서, 상기 복호화하는 단계는
    상기 비트스트림이 부호화된 방식을 판단하는 단계; 및
    상기 판단된 방식에 따라 상기 비트스트림을 복호화하는 단계를 포함하는 것을 특징으로 하는 변환 부호화 방법.
  25. 제20항에 있어서,
    상기 부호화하는 단계에서 이용할 기 설정된 파라미터(들)를 상기 복호화하는 단계에서 추출하는 단계를 더 포함하고,
    상기 부호화하는 단계는 상기 추출된 파라미터(들)를 이용하여 상기 선택된 주파수 성분(들)을 부호화하는 것을 특징으로 하는 변환 부호화 방법.
  26. 소정의 방식으로 부호화된 비트스트림을 복호화하는 단계;
    상기 복호화된 결과에서 기 설정된 기준에 따라 주파수 성분(들)을 선택하는 단계; 및
    상기 선택된 주파수 성분(들)을 부호화하는 단계를 포함한 발명을 컴퓨터에 서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
  27. 소정의 방식으로 부호화된 비트스트림을 복호화하는 복호화부;
    상기 복호화된 결과에서 기 설정된 기준에 따라 주파수 성분(들)을 선택하는 주파수성분 선택부; 및
    상기 선택된 주파수 성분(들)을 부호화하는 주파수성분 부호화부를 포함하는 것을 특징으로 하는 변환 부호화 장치.
  28. 제27항에 있어서,
    상기 복호화된 결과에서 상기 선택된 주파수 성분(들)을 제외한 나머지 스펙트럼을 부호화하는 잔여스펙트럼 부호화부를 더 포함하는 것을 특징으로 하는 변환 부호화 장치.
  29. 제28항에 있어서, 상기 잔여스펙트럼 부호화부는
    각 밴드에 마련된 상기 나머지 스펙트럼의 에너지값(들)을 계산하여 부호화하는 것을 특징으로 하는 변환 부호화 장치.
  30. 제27항에 있어서,
    상기 주파수성분 부호화부에서 부호화함에 있어서 적용될 설정(들)을 사용자로부터 입력받는 설정 입력부를 더 포함하고,
    상기 주파수성분 부호화부는 상기 복호화된 결과를 상기 입력받은 설정(들)에 따라 부호화하는 것을 특징으로 하는 변환 부호화 장치.
  31. 제27항에 있어서, 상기 복호화부는
    상기 비트스트림이 부호화된 방식을 판단하는 방식 판단부; 및
    상기 판단된 방식에 따라 상기 비트스트림을 복호화하는 비트스트림복호화부를 포함하는 것을 특징으로 하는 변환 부호화 장치.
  32. 제27항에 있어서,
    상기 주파수성분 부호화부에서 이용할 기 설정된 파라미터(들)를 상기 복호화부가 복호화를 수행하는 과정에서 추출하는 파라미터 추출부를 더 포함하고,
    상기 주파수성분 부호화부는 상기 추출된 파라미터(들)를 이용하여 상기 선택된 주파수 성분(들)을 부호화하는 것을 특징으로 하는 변환 부호화 장치.
KR1020070077815A 2007-08-02 2007-08-02 변환 부호화 방법 및 장치 KR101403340B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070077815A KR101403340B1 (ko) 2007-08-02 2007-08-02 변환 부호화 방법 및 장치
US11/947,016 US20090037180A1 (en) 2007-08-02 2007-11-29 Transcoding method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070077815A KR101403340B1 (ko) 2007-08-02 2007-08-02 변환 부호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090013571A true KR20090013571A (ko) 2009-02-05
KR101403340B1 KR101403340B1 (ko) 2014-06-09

Family

ID=40338931

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070077815A KR101403340B1 (ko) 2007-08-02 2007-08-02 변환 부호화 방법 및 장치

Country Status (2)

Country Link
US (1) US20090037180A1 (ko)
KR (1) KR101403340B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9159333B2 (en) * 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
EP2099027A1 (en) * 2008-03-05 2009-09-09 Deutsche Thomson OHG Method and apparatus for transforming between different filter bank domains
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
US8521541B2 (en) * 2010-11-02 2013-08-27 Google Inc. Adaptive audio transcoding

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4417102A (en) * 1981-06-04 1983-11-22 Bell Telephone Laboratories, Incorporated Noise and bit rate reduction arrangements
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
US5119092A (en) * 1988-11-22 1992-06-02 Sharp Kabushiki Kaisha Apparatus for encoding, decoding, and storing waveforms
US5113469A (en) * 1990-03-02 1992-05-12 Kabushiki Kaisha Toshiba Optical wavelength-converting device for guided-wave second-harmonic generation in cerenkov radiation mode
US5248845A (en) * 1992-03-20 1993-09-28 E-Mu Systems, Inc. Digital sampling instrument
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
JP3186315B2 (ja) * 1993-02-27 2001-07-11 ソニー株式会社 信号圧縮装置、信号伸張装置、信号送信装置、信号受信装置及び信号送受信装置
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
JP3237089B2 (ja) * 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
TW271524B (ko) * 1994-08-05 1996-03-01 Qualcomm Inc
JP3453898B2 (ja) * 1995-02-17 2003-10-06 ソニー株式会社 音声信号の雑音低減方法及び装置
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
TW321810B (ko) * 1995-10-26 1997-12-01 Sony Co Ltd
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH09185397A (ja) * 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
ID15832A (id) * 1996-02-12 1997-08-14 Philips Electronics Nv Pesawat pendikte genggam
JP3878254B2 (ja) * 1996-06-21 2007-02-07 株式会社リコー 音声圧縮符号化方法および音声圧縮符号化装置
JP3092653B2 (ja) * 1996-06-21 2000-09-25 日本電気株式会社 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6049537A (en) * 1997-09-05 2000-04-11 Motorola, Inc. Method and system for controlling speech encoding in a communication system
JP3235654B2 (ja) * 1997-11-18 2001-12-04 日本電気株式会社 無線電話装置
WO1999050828A1 (en) * 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6182031B1 (en) * 1998-09-15 2001-01-30 Intel Corp. Scalable audio coding system
JP2000221988A (ja) * 1999-01-29 2000-08-11 Sony Corp データ処理装置、データ処理方法、プログラム提供媒体及び記録媒体
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
JP3905706B2 (ja) * 1999-04-19 2007-04-18 富士通株式会社 音声符号化装置、音声処理装置及び音声処理方法
US6975629B2 (en) * 2000-03-22 2005-12-13 Texas Instruments Incorporated Processing packets based on deadline intervals
US6453294B1 (en) * 2000-05-31 2002-09-17 International Business Machines Corporation Dynamic destination-determined multimedia avatars for interactive on-line communications
WO2002072493A1 (fr) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Verre de scellement pour tete magnetique et dispositif d'enregistrement et de reproduction magnetique
US6996522B2 (en) * 2001-03-13 2006-02-07 Industrial Technology Research Institute Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
US20030195745A1 (en) * 2001-04-02 2003-10-16 Zinser, Richard L. LPC-to-MELP transcoder
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
DE60307252T2 (de) * 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
US7580761B2 (en) * 2002-11-15 2009-08-25 Texas Instruments Incorporated Fixed-size cross-correlation computation method for audio time scale modification
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1722359B1 (en) * 2004-03-05 2011-09-07 Panasonic Corporation Error conceal device and error conceal method
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
KR101268218B1 (ko) * 2004-11-29 2013-10-17 내셔널 유니버시티 오브 싱가포르 휴대형 장치용 지각인지 저전력 오디오 디코더
US7609904B2 (en) * 2005-01-12 2009-10-27 Nec Laboratories America, Inc. Transform coding system and method
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US20060190246A1 (en) * 2005-02-23 2006-08-24 Via Telecom Co., Ltd. Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC
US7738766B2 (en) * 2005-04-18 2010-06-15 Microsoft Corporation Sanctioned transcoding of digital-media content
US7516136B2 (en) * 2005-05-17 2009-04-07 Palm, Inc. Transcoding media files in a host computing device for use in a portable computing device
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
US7805292B2 (en) * 2006-04-21 2010-09-28 Dilithium Holdings, Inc. Method and apparatus for audio transcoding
US8700387B2 (en) * 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
AU2009267531B2 (en) * 2008-07-11 2013-01-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for decoding an encoded audio signal

Also Published As

Publication number Publication date
KR101403340B1 (ko) 2014-06-09
US20090037180A1 (en) 2009-02-05

Similar Documents

Publication Publication Date Title
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
US9728196B2 (en) Method and apparatus to encode and decode an audio/speech signal
KR101379263B1 (ko) 대역폭 확장 복호화 방법 및 장치
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
KR101346358B1 (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
KR20070115637A (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
KR20140120286A (ko) 고주파수 신호 복호화 방법 및 장치
KR20080005325A (ko) 적응적 부호화/복호화 방법 및 장치
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
KR101390188B1 (ko) 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
KR101403340B1 (ko) 변환 부호화 방법 및 장치
KR102052144B1 (ko) 음성 신호의 대역 선택적 양자화 방법 및 장치
KR20080034819A (ko) 부호화/복호화 장치 및 방법
KR101449432B1 (ko) 신호 부호화 및 복호화 방법 및 장치
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
KR101434206B1 (ko) 신호 복호화 장치
KR101434209B1 (ko) 오디오/스피치 신호 부호화장치
KR101457897B1 (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
KR101434207B1 (ko) 오디오/스피치 신호 부호화방법
KR20080034817A (ko) 부호화/복호화 장치 및 방법
KR20090043352A (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee