KR20120013893A - 디코딩 방법 및 그에 따른 디코딩 장치 - Google Patents

디코딩 방법 및 그에 따른 디코딩 장치 Download PDF

Info

Publication number
KR20120013893A
KR20120013893A KR1020110069496A KR20110069496A KR20120013893A KR 20120013893 A KR20120013893 A KR 20120013893A KR 1020110069496 A KR1020110069496 A KR 1020110069496A KR 20110069496 A KR20110069496 A KR 20110069496A KR 20120013893 A KR20120013893 A KR 20120013893A
Authority
KR
South Korea
Prior art keywords
audio signal
unit
subband
signal
decoding
Prior art date
Application number
KR1020110069496A
Other languages
English (en)
Other versions
KR101837083B1 (ko
Inventor
김현욱
문한길
이상훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US13/198,763 priority Critical patent/US8762158B2/en
Priority to CN201110225498.8A priority patent/CN102376307B/zh
Publication of KR20120013893A publication Critical patent/KR20120013893A/ko
Application granted granted Critical
Publication of KR101837083B1 publication Critical patent/KR101837083B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00057MPEG-1 or MPEG-2 audio layer III [MP3]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Abstract

본원 발명은 비트스트림을 디코딩하는 단계, 상기 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 단계, 각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하는 단계, 및 n 개의 상기 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성하는 단계를 포함하며, 연산의 복잡도를 낮출 수 있는 오디오 신호의 복원 방법을 기재한다.

Description

디코딩 방법 및 그에 따른 디코딩 장치{Method for decoding of audio signal and apparatus for decoding thereof}
본원 발명은 디코딩 장치 및 그에 따른 디코딩 방법에 관한 것이다.
보다 상세하게는, 오디오 신호를 포함하는 비트 스트림을 디코딩하여 원래의 오디오 신호로 복원하는 디코딩 장치 및 그에 따른 디코딩 방법에 관한 것이다.
오디오 디코더는 오디오 비트 스트림을 수신하고, 수신된 비트 스트림을 디코딩하여 소리로 재생할 수 있는 오디오 신호로 복원한다. 여기서, 오디오 비트 스트림은 MP3 규격 등과 같은 소정 규격에 따라서 오디오 신호를 엔코딩하여 생성될 수 있다. 이 경우, 오디오 디코더는 MP3 디코더가 된다. 또한, 복원된 오디오 신호는 스테리오(stereo) 신호 또는 멀티 채널 오디오 신호일 수 있다.
MP3 디코더는 PQMF(Pseudo Quadrature Mirror Filter) 합성기를 이용한다. PQMF 합성기는 디코딩 된 오디오 신호를 원래의 멀티 채널 오디오 신호로 합성(synthesis)하기 위해서 PQMF 필터 뱅크(filter bank)를 이용한다. PQMF 필터 뱅크는 복원된 비트 스트림을 시간 도메인(time domain)에서 처리한다. 또한, 일반적으로 PQMF 필터 뱅크는 컨볼루션(convolution)과 같은 복잡한 연산을 이용하여 복원된 비트 스트림을 멀티 채널 오디오 신호로 합성한다.
따라서, MP3 디코더의 PQMF 합성기는 수행되는 연산의 복잡도가 매우 높아서, 고속 구동을 위해서는 대용량 메모리와 고사양의 프로세서가 필요하다. 또한, MP3 디코더는 시간 도메인에서 복원된 비트 스트림을 처리하므로, 변환 도메인(transform domain) 상에서 비트 스트림을 처리하는 멀티 채널 코덱(multi channel codec)과 호환성이 없다.
따라서, 다른 코덱, 예를 들어, 멀티 채널 코덱, 과 호환성을 가지면서, 연산의 복잡도를 낮출 수 있는 오디오 신호 디코더 및 오디오 신호의 복원 방법을 제공할 필요가 있다.
본원 발명은 변환 도메인 상에서 비트 스트림을 처리하는 코덱과의 호환성을 갖는 디코딩 장치 및 그에 따른 디코딩 방법의 제공을 목적으로 한다.
또한, 본원 발명은 디코딩 장치의 연상 복잡도를 낮출 수 있는 디코딩 장치 및 그에 따른 디코딩 방법의 제공을 목적으로 한다.
또한, 본원 발명은 음질을 향상시킬 수 있는 디코딩 장치 및 그에 따른 디코딩 방법의 제공을 목적으로 한다.
본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 디코딩 장치를 이용하여 오디오 신호를 복원하는 방법에 있어서, 비트스트림을 디코딩하는 단계, 상기 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 단계, 각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하는 단계, 및 n 개의 상기 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성하는 단계를 포함한다.
또한, 상기 변환 서브 밴드 신호를 생성하는 단계는 각각의 상기 서브 밴드 신호를 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함할 수 있다.
또한, 상기 합성 오디오 신호를 생성하는 단계는 주파수 도메인에서 수행될 수 있다.
또한, 상기 합성 오디오 신호를 생성하는 단계는 고속 퓨리에 변환 도메인에서 수행될 수 있다.
또한, 상기 합성 필터뱅크 계수에 대응되는 소정 값은 상기 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출될 수 있다.
또한, 상기 합성 필터뱅크 계수에 대응되는 소정 값은 상기 합성 필터뱅크 계수들에 근거하여 산출되는 합성 필터 값을 고속 퓨리에 변환한 값이 될 수 있다.
또한, 상기 변환 서브 밴드 신호를 생성하는 단계는 상기 n 개의 서브 밴드 신호들 각각을 역 변형 이산 코사인 변환하는 단계, 및 역 변형 이산 코사인 변환된 상기 n 개의 서브 밴드 신호들 각각을 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 상기 합성 오디오 신호를 역 고속 퓨리에 변환하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 상기 합성 오디오 신호를 역 변형 이산 코인 변환하는 단계를 더 포함할 수 있다.
또한, 상기 합성 오디오 신호를 생성하는 단계는 상기 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터에 맞춰서 조절하는 단계, 및 상기 조절된 변환 서브 밴드 신호를 상기 소정 값과 곱하여 상기 합성 오디오 신호를 생성하는 단계를 포함할 수 있다.
또한, 상기 합성 오디오 신호를 생성하는 단계는 상기 합성 오디오 신호를 멀티플렉싱하는 단계를 더 포함할 수 있다.
또한, 상기 비트 스트림을 디코딩하는 단계는 비트스트림을 언패킹하여 디코딩하는 단계, 디코딩된 상기 비트 스트림을 역양자화 및 재배열하는 단계, 및 역양자화 및 재배열된 상기 비트 스트림을 적어도 하나의 채널로 분리하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따른 디코딩 장치는 비트 스트림을 디코딩하고, 디코딩 된 상기 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 디코딩 코어부, 및 상기 서브 밴드 신호들 각각을 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하며, n 개의 상기 변환 서브 밴드 신호들 각각과 그에 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값들을 곱하여 합성 오디오 신호를 생성하는 합성부를 포함한다.
도 1은 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블록 다이어그램이다.
도 2는 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 일 블록 다이어그램이다.
도 3은 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 다른 블록 다이어그램이다.
도 4는 도 3의 합성부를 좀 더 상세하게 나타내는 일 도면이다.
도 5는 도 4의 합성부를 좀 더 상세하게 나타내는 일 도면이다.
도 6은 도 5의 곱하기 연산부에서 생성되는 신호들을 설명하기 위한 도면이다.
도 7은 도 6의 멀티플렉서의 동작을 설명하기 위한 도면이다.
도 8은 도 1의 합성부를 좀 더 상세하게 나타내는 다른 도면이다.
도 9는 본 발명의 일 실시예에 따른 오디오 신호 복원 방법을 나타내는 플로우차트이다.
이하에서는, 첨부된 도면을 참조하여, 본 발명에 따른 디코딩 장치 및 그에 따른 디코딩 방법에 대하여 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블록 다이어그램이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 디코딩 장치(100)는 디코딩 코어부(decoding core unit)(110) 및 합성부(synthesis unit)(130)를 포함한다.
디코딩 장치(100)는 소정 규격에 따라서 엔코딩되어 전송되는 오디오 비트 스트림을 복원하는 장치이다. 여기서, 소정 규격은 MP3 규격이 될 수 있다.
디코딩 코어부(110)는 엔코딩 된 비트 스트림을 수신하고, 수신된 비트 스트림을 디코딩한다.
합성부(130)는 디코딩 코어부(110)에서 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할한다. 구체적으로, 오디오 신호에 대응되는 비트 스트림을 다수개의 주파수 대역 별로 분할하여, 서브 밴드 신호를 생성한다. 예를 들어, 오디오 신호의 총 주파수 대역을 32개로 분할하여, 32개의 서브 밴도 신호를 생성할 수 있다. 그리고, 각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성한다.
합성부(130)는 계속하여, n 개의 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성한다. 이하, '합성 필터뱅크 계수들에 대응되는 소정 값'은 '계수 대응 소정 값'이라 한다. 여기서, 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 동작은, 디코딩 코어부(110)에서 수행될 수도 있다.
또한, 합성부(130)는 주파수 도메인에서, n 개의 변환 서브 밴드 신호들 각각과 대응되는 계수 대응 소정 값들과 곱하여 합성 오디오 신호를 생성한다. 구체적으로, 합성부(130)는 고속 퓨리에 변환 도메인(FFT domain: Fast Fourier transform domain)에서, n 개의 변환 서브 밴드 신호들 각각과 대응되는 계수 대응 소정 값 간의 곱하기 연산을 수행하여 합성 오디오 신호를 생성할 수 있다.
전술한 바와 같이, 본 발명의 일 실시예에 따른 디코딩 장치는 비트 스트림을 합성하기 위해서, 주파수 도메인에서 변환된 변환 서브 밴드 신호와 계수 대응 소정 값 간의 곱하기 연산을 수행한다. 따라서, 컨볼루션 연산을 통해 비트 스트림을 합성하는 디코딩 장치보다 연산의 복잡도를 크게 낮출 수 있다. 그에 따라서, 대용량 메모리 및 고사양의 프로세서를 구비하지 않고도, 디코딩 속도를 증가시킬 수 있다.
또한, 본 발명의 일 실시예에 따른 디코딩 장치는 시간 도메인을 거치지 않고 고속 퓨리에 변환 도메인과 같은 주파수 도메인에서 비트 스트림을 합성함으로써, 멀티 채널 코덱과의 호환성을 가질 수 있다.
도 2는 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 일 블록 다이어그램이다. 도 2의 디코딩 장치(200), 디코딩 코어부(210) 및 합성부(230)는 각각 도 1에서 설명한 디코딩 장치(100), 디코딩 코어부(110) 및 합성부(130)와 동일 대응된다. 따라서, 도 1에서와 중복되는 설명은 생략한다.
도 2를 참조하면, 디코딩 장치(200)는 디코딩 코어부(210) 및 합성부(230)를 포함한다.
디코딩 코어부(210)는 언패킹 부(unpacking unit)(211), 역 양자화부(requantization unit)(212) 및 채널 분리부(213)를 포함할 수 있다.
언패킹 부(211)는 수신된 비트 스트림은 언패킹(unpacking)한다. 구체적으로, 비트 스트림을 전송하는 엔코딩 장치(미도시)는 오디오 신호를 압축하고 소정 형태로 형태 변환하여 비트 스트림을 생성한다. 구체적으로, 언패킹 부(211)는 수신된 비트 스트림의 형태가 엔코딩 장치에서 형태 변환되기 이전의 형태를 갖도록, 수신된 비트 스트림의 형태를 역변환한다.
또한, 언패킹 부(211)는 언패킹 부(211)에서 언패킹된 비트 스트림을 디코딩한다. 구체적으로, 상기 디코딩은 허프만 디코딩(huffman decoding) 연산에 따라 수행될 수 있다. 허프만 디코딩 연산은, 허프만 부호화 테이블을 이용하여 비트 스트림을 복호화하는 연산로, MPEG(Moving Picture Experts Group) 또는 JPEG(Joint Photographic Experts Group) 등에서 주로 사용되는 무손실 압축 방법이다.
역 양자화 부(212)는 언패킹 부(211)에서 언패킹된 비트 스트림을 역 양자화(requantization)하고, 역 양자화된 비트 스트림을 소정 순서로 재배열(reordering)한다.
채널 분리부(213)는 역 양자화 부(212)에서 출력되는 비트 스트림을 적어도 하나의 채널로 분리한다. 예를 들어, 디코딩 장치(200)가 수신한 비트 스트림이 좌측 채널(left channel) 및 우측 채널(right channel)을 포함하는 스테레오(stereo) 오디오 신호를 포함한다면, 채널 분리부(213)는 수신한 비트 스트림에서 좌측 채널에 대응되는 신호와 우측 채널에 대응되는 신호를 분리하여, 출력할 수 있다. 또한, 수신된 비트 스트림이 5.1 채널(5.1 channel), 즉, 6개의 채널,을 포함하는 경우, 채널 분리부(213)는 비트 스트림을 6개의 채널들로 각각 분리할 수 있다.
도 2에서는, 채널 분리부(213)가 비트 스트림을 2개의 채널로 분리하여 출력하는 경우를 예로 들어 도시하였다. 이 경우, N1 노드로는 좌측 채널에 대응되는 비트 스트림이 출력되며, N2 노드로는 우측 채널에 대응되는 비트 스트림이 출력될 수 있다.
또한, 합성부(230)는 하나의 채널에 대응되는 비트 스트림을 합성하여, 합성 오디오 신호를 생성하는 적어도 하나의 합성부인 제1 및 제2 합성부(231, 232)를 포함할 수 있다. 도 2에서는 합성부(230)가 2개의 제1 및 제2 합성부(231, 232)를 포함하는 경우를 예로 들어 도시하였다.
합성부(230)는 채널 분리부(213)에서 분리된 비트 스트림들 각각에 대응되는 계수 대응 소정 값을 곱하여 합성 오디오 신호를 생성한다.
여기서, 합성 필터뱅크 계수는 디코딩 장치(200)가 수신한 비트 스트림 내에서 추출된 합성 필터뱅크 계수들에 근거하여 산출된다. 구체적으로, 합성 필터뱅크의 계수는 MP3 규격의 ISO/IEC 11172-3 부분의 table B.3에서 정의하는 필터 뱅크의 계수가 될 수 있다. 전술한 곱하기 연산에 이용되는 합성 필터 뱅크의 계수는 이하에서 도 5 및 도 6을 참조하여 상세히 설명한다.
합성부(230)에 구비되는 다수개의 합성부들인 제1 및 제2 합성부(231, 232)들 각각은 일 채널에 대응되는 변환 서브 밴드 신호들과, 상기 변환 서브 밴드 신호들에 대응되는 계수 대응 소정 값들을 곱하여, 합성 오디오 신호를 생성한다.
도 3은 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 다른 블록 다이어그램이다.
도 3을 참조하면, 디코딩 장치(300), 디코딩 코어부(310), 및 합성부(330)는 각각 도 1 및 도 2의 디코딩 장치(100, 200), 디코딩 코어부(110, 210), 및 합성부(130, 230)에 동일 대응되므로, 도 1 및 도 2에서와 중복되는 설명은 생략한다. 구체적으로, 도 3의 합성부(330)는 도 2의 제1 합성부(231) 또는 제2 합성부(232) 중 어느 하나와 동일 대응된다.
전술한 바와 같이, 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 동작은 디코딩 코어부(310)에서 수행될 수 도 있고, 합성부(330)에서 수행될 수 도 있다. 도 3에서는 합성부(330)가 밴드 분할부(340)를 포함하여, 하나의 채널에 대응되는 디코딩된 비트 스트림을 전송받고, n 개의 서브 밴드 신호를 출력하는 경우를 예로 들어 도시하였다.
도 3을 참조하면, 합성부(330)는 밴드 변환부(350) 및 곱하기 연산부(370)를 포함한다. 또한, 밴드 분할부(340)를 더 포함할 수 있다.
밴드 분할부(340)는 하나의 채널에 대응되는 디코딩된 비트 스트림을 전송받고, n 개의 서브 밴드 신호를 출력한다. 또한, 디코딩 코어부(310)가 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 동작을 수행하는 경우, 합성부(330)는 밴드 분할부(340)를 포함하지 않으며, 밴드 변환부(350)는 디코딩 코어부(310)로부터 n 개의 서브 밴드 신호를 직접 전송받는다.
밴드 변환부(350)는 n 개의 서브 밴드 신호들이 입력되는 경우, 내부적으로 소정 서브 밴드 신호들 별로 곱하기 연산을 수행하는 제1 내지 제n 변환부들(351, 355, 359)을 포함한다. 제1 내지 제n 변환부들(351, 355, 359)은 n 개의 서브 밴드 신호들을 입력받고, 각각의 서브 밴드 신호를 고속 퓨리에 변환(FFT)한다. 제1 내지 제N 밴드 변환부들(351, 355, 359) 각각은 입력받은 신호의 FFT 변환을 수행한다.
밴드 변환부(350)의 구체적은 구성 및 동작은 이하에서 도 4 및 도 8을 참조하여 설명한다.
곱하기 연산부(370)는 디코딩 장치(300)로 수신된 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출되는 전술한 계수 대응 소정 값과 밴드 변환부(350)에서 출력되는 변환 서브 밴드 신호를 곱하여 합성 오디오 신호를 생성한다. 여기서, 곱하기 연산부(370)는 주파수 도메인에서 전술한 곱하기 연산을 수행할 수 있다.
도 4는 도 3의 합성부를 좀 더 상세하게 나타내는 일 도면이다. 도 4의 디코딩 코어부(410), 및 합성부(430)는 각각 도 3의 디코딩 코어부(310), 및 합성부(330)와 동일 대응되므로, 중복되는 설명은 생략한다.
또한, 도 4에서는 도 3의 밴드 분할부(340)가 수행하는 역할을 디코딩 코어부(410)가 수행하는 경우를 예로 들어 도시하였다. 따라서, 합성부(430)는 도 3의 합성부(330)와 달리 밴드 분할부(340)를 포함하지 않으며, 디코딩 코어부(410)로부터 n 개의 서브 밴드 신호들을 전송받는다.
도 4를 참조하면, 밴드 변환부(450)는 상기 n 개의 서브 밴드 신호들을 각각 입력받는 n 개의 IMDCT 부(inverse modified discrete cosine transform unit)(452, 456)를 포함하며, 상기 n 개의 IMDCT 부들의 출력을 각각 입력받는 n 개의 FFT 부(fast fourier transform unit)들(453, 457)을 포함한다.
IMDCT 부(예를 들어, 452)는 첫 번째 서브 밴드 신호를 입력받고, 이를 역 이산 변형 코사인 변환하여 출력한다.
FFT 부(예를 들어, 453)는 IMDCT 부(예를 들어, 452)에서 출력되는 신호를 입력받고, 이를 고속 퓨리에 변환하여 출력한다.
또한, 곱하기 연산부(470)는 밴드 변환부(450)에서 출력되는 제1 내지 제 n 변환 서브 밴드 신호들을 입력받는 제1 내지 제 n 밴드 곱하기 연산부들(471, 472)을 포함한다.
제1 내지 제 n 밴드 곱하기 연산부들(471, 472) 각각은 해당 서브 밴드별로 변환 서브 밴드 신호를 입력받고, 입력된 변환 서브 밴드 신호와 그에 대응되는 계수 대응 소정 값을 곱하여 출력한다. 예를 들어, 제1 밴드 곱하기 연산부(471)는 오디오 신호의 주파수 대역이 제1 서브 밴드에 해당하는 변환 제1 서브 밴드 신호를 입력받고, 상기 제1 서브 밴드 신호에 대응되는 계수 대응 소정 값과 제1 서브 밴드 신호 간의 곱하기 연산을 수행한다. 제2 내지 제n 밴드 곱하기 연산부들도 제1 밴드 곱하기 연산부(471)와 동일한 곱하기 연산을 수행한다.
또한, 합성부(430)는 도 3의 합성부(330)에 비하여 멀티플렉서(multiplexer)(480) 및 IFFT 부(inverse fast fourier transform unit)(490)를 더 포함할 수 있다.
멀티플렉서(480)는 제1 내지 제 n 밴드 곱하기 연산부들(471, 472)에서 출력되는 n 개의 합성 오디오 신호들을 입력받고, 이를 멀티플렉싱하여 출력한다. 1 내지 제 n 밴드 곱하기 연산부들(471, 472)에서 출력되는 n 개의 합성 오디오 신호들을 입력받고, 이를 하나의 신호로 통합하여 출력한다.
IFFT 부(490)는 멀티플렉서(480)에서 출려되는 신호를 역 고속 퓨리에 변환하여 출력한다.
도 5는 도 4의 합성부를 좀 더 상세하게 나타내는 일 도면이다.
도 5를 참조하면, 디코딩 코어부(510), 및 합성부(530)는 각각 도 4에서 설명한 디코딩 코어부(410), 및 합성부(430)와 동일 대응되므로, 도 4에서와 중복되는 설명은 생략한다.
밴드 변환부(550)는 내부적으로 구비되는 IMDCT 부(452) 및 FFT 부(453)를 이용하여, 서브 밴드 신호를 역 변형 이산 코사인 연산 및 고속 퓨리에 연산하여 변환 서브 밴드 신호를 출력한다.
도 5를 참조하면, 곱하기 연산부(570)는 제1 내지 제 n 변환 서브 밴드 신호들을 각각 입력받는 n 개의 위상 진폭 보상부(예를 들어, 575)들 및 위상 진폭 보상부와 직렬 연결되는 n 개의 합성 필터부(예를 들어, 576)들을 포함한다. 구체적으로, 도 4의 제1 밴드 곱하기 연산부(471)에 대응되는 제1 밴드 곱하기 연산부(571) 제1 서브 밴드에 대응되는 변환 서브 밴드 신호를 입력받는 위상 진폭 보상부(575) 및 상기 위상 진폭 보상부(575)와 직렬 연결되는 합성 필터부(576)를 포함한다.
도 6은 도 5의 곱하기 연산부에서 생성되는 신호들을 설명하기 위한 도면이다. 이하에서는 도 5 및 도 6을 참조하여, 곱하기 연산부(570)에 포함되는 제1 서브 밴드에 대응되는 변환 서브 밴드 신호를 처리하는 제1 밴드 곱하기 연산부(571)의 구성 및 동작을 설명한다.
위상 진폭 보상부(575)는 입력되는 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터(synthesis filter)에 맞춰 조절한다. 합성 필터는 합성 필터부(571)에 포함되어, 합성 오디오 신호를 생성하기 위한 필터이다.
합성 필터부(576)는 위상 진폭 보상부(575)에서 출력되는 변환 서브 밴드 신호와 그에 대응되는 계수 대응 소정 값 간에 곱하기 연산을 수행하여 합성 오디오 신호를 생성한다.
도 6의 그래프들 각각에서, x 축은 주파수를 나타내며, y 축은 오디오 신호에 대응되는 변환 서브 밴드 신호의 진폭값을 나타낸다. 또한, 도 6에서는, l 번째 서브 밴드를 처리하는 제 l 곱하기 연산부의 동작을 예로 들어 설명한다.
도 6의 (a)를 참조하면, 주파수 밴드 별로 구별되는 n 개의 변환 서브 밴드 신호들이 도시된다. 주파수 밴드는 M 간격이 되는 경우를 예로 들어 도시하였다. 예를 들어, 전술한 n=32가 될 수 있으며, 32개의 주파수 밴드가 존재할 수 있다.
l 번째 서브 밴드는 M(l-1) 내지 Ml 의 주파수 대역을 갖는다. 610 구간의 신호는 l 번째 변환 서브 밴드 신호를 나타낸다.
도 6의 (b)는 합성 필터부(576) 내에 포함되는 합성 필터를 설명하기 위한 도면이다.
합성 필터(synthesis filter)(620)에 있어서, 필터의 에너지는 특정 부분이 몰려있다. 구체적으로, l 번째 서브 밴드에 대응되는 변환 서브 밴드 신호와 곱하기 연산을 수행할 합성 필터(620)는 (1/2Ml-3/4M) 내지 (1/2Ml+1/4M) 의 주파수 대역에 필터의 에너지가 몰려있다. 전술한 합성 필터뱅크 계수는 합성 필터(620)를 정의하는 파라미터 값들로, 오디오 신호의 디코딩을 위한 소정 규격에 따라 다르게 설정될 수 있다. 전술한 바와 같이, 합성 필터뱅크의 계수는 MP3 규격의 ISO/IEC 11172-3 부분의 table B.3에서 정의하는 필터 뱅크의 계수가 될 수 있다.
도 6의 (a) 및 (b)에 도시된 바와 같이, l 번째 변환 서브 밴드 신호와 그에 대응되는 합성 필터(620)의 주파수 대역이 다르므로, l 번째 변환 서브 밴드 신호와 그에 대응되는 계수 대응 소정 값을 곱하기 위해서는, l 번째 변환 서브 밴드 신호를 합성 필터(620)에 맞춰 조절하여야 한다.
구체적으로, l 번째 변환 서브 밴드 신호의 위상(phase) 및 진폭 중 적어도 하나를 합성 필터의 주파수 대역에 맞춰 조절하여야 한다.
도 6의 (c)를 참조하면, l 번째 변환 서브 밴드 신호(631)를 합성 필터(620)의 주파수 대역에 맞춰 조절하여, 조절된 l 번째 변환 서브 밴드 신호(633)를 생성하는 과정이 도시된다.
구체적으로, l 번째 변환 서브 밴드 신호(631)의 위상, 즉, 주파수 대역,을 M(l-1) 내지 Ml에서 (1/2Ml-3/4M) 내지 (1/2Ml+1/4M)으로 이동시킬 수 있다. 또한, l 번째 변환 서브 밴드 신호(631)의 진폭(amplitude)을 합성 필터(620)가 처리할 수 있는 범위 내로 조절할 있다. 위상 및 진폭의 조절값은, 합성 필터를 규정하는 소정 규격, 또는 디코딩 장치의 제품 사양 등에 따라서 달라질 수 있다.
여기서, 변환 서브 밴드 신호의 진폭 및 위상 중 적어도 하나를 조절하는데 있어서, 홀수 번째 서브 밴드에 대응되는 변환 서브 밴드 신호의 위상 및 진폭 조절값은 짝수 번째 서브 밴드에 대응되는 변환 서브 밴드 신호의 위상 및 진폭 조절값과 다를 수 있다.
즉, 도 5의 l 번째 위상 진폭 보상부(미도시)는 l 번째 변환 서브 밴드 신호(631)를 입력받고, 합성 필터에 맞춰 조절된 l 번째 변환 서브 밴드 신호(633)를 생성한다.
합성 필터부(576) 내에 구비되는 합성 필터의 값은 이하의 [수학식 1]과 같이 정의될 수 있다.
[수학식 1]
Figure pat00001
[수학식 1]에서 gl(n)이 l 번째 서브 밴드에 대응되는 합성 필터 값이며, d(n)은 합성 필터뱅크의 계수를 나타낸다. 전술한 바와 같이, 합성 필터 뱅크의 계수 값은 MP3 스펙에서 정의될 수 있다. 그리고, k는 서브 밴드 값을 나타내며, 32 개의 서브 밴드로 주파수 구간을 분할할 경우, k는 0 내지 31의 자연수 값이 될 수 있다. 또한, n 값은 소정 스펙에서 정의될 수 있다.
합성 필터뱅크의 계수들은 디코딩 장치로 수신되는 비트 스트림에 포함되어 있으며, 디코딩 코어부(510), 합성 필터부(576) 또는 디코딩 장치의 전체 제어부(미도시) 중 어느 하나에서 추출될 수 있다.
또한, 합성 필터부(576)에서 수행하는 곱하기 연산의 대상이 되는 합성 필터뱅크의 계수에 대응하는 소정 값인 계수 대응 소정 값은, 전술한 합성 필터의 값(gl(n))을 고속 퓨리에 변환하여 얻을 수 있다.
[수학식 2]
Figure pat00002
[수학식 2]는 곱하기 연산의 대상이 되는 합성 필터뱅크의 계수에 대응하는 소정 값(Gl(k))을 나타낸다.
도 7은 도 6의 멀티플렉서의 동작을 설명하기 위한 도면이다.
1 내지 n 서브 밴드들에 대응되는 제 1 내지 제n 합성 오디오 신호들은 M 포인트 FFT(M-point FFT) 값을 가질 수 있다. 710 블록은 홀수 번째 서브 밴드들에 대응되는 합성 오디오 신호들을 나타내고, 720 블록은 짝수 번째 서브 밴드들에 대응되는 합성 오디오 신호들을 나타낸다.
도 7을 참조하면, 711은 1번째 서브 밴드에 대응되는 합성 오디오 신호를 나타내고, 731은 2 번째 서브 밴드에 대응되는 합성 오디오 신호를 나타내며, 712는 3번째 서브 밴드에 대응되는 합성 오디오 신호를 나타낸다. 도 7에서는 n 값이 32인 경우를 예로 들어 도시하였다.
멀티플렉서(580)는 1 내지 n 서브 밴드들에 대응되는 제 1 내지 제n 합성 오디오 신호들을 멀티플렉싱(multiplexing)하여, N 포인트 FFT 값을 갖는 오디오 신호(750)를 출력한 수 있다. 멀티플렉서(580)에서 출력되는 오디오 신호(750)에 있어서, 751, 752 및 753 신호 구간은 각각 제1, 제2 및 제3 합성 오디오 신호들에 대응되는 신호 구간일 수 있다.
즉, 멀티플렉서(580)는 작은 포인트(small point) FFT 값인 M 포인트 FFT 값을 갖는 합성 오디오 신호들을 통합하여, 큰 포인트(large point) FFT 값인 N 포인트 FFT 값을 갖는 오디오 신호를 생성할 수 있다.
IFFT 부(590)는 도 4의 IFFT 부(490)와 동일 대응되므로, 상세한 설명은 생략한다.
도 8은 도 1의 합성부를 좀 더 상세하게 나타내는 다른 도면이다.
도 8을 참조하면, 도시된 합성부(830)는 도 5의 합성부(530)와 유사하나, IMDCT 부(890)의 연결 관계에 있어서, 도 5의 합성부(530)와 차이가 있다. 또한, 도 5의 합성부(530)에 비하여 FFT 부(453) 및 IFFT 부(590)가 구비되지 않는다. 나머지 구성들은 도 5의 합성부(530)와 동일하므로, 상세한 설명은 생략하도록 한다. 또한, 디코딩 코어부(810)는 도 2의 디코딩 코어부(210)와 동일 대응될 수 있다. 또한, 디코딩 코어부(810)는 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하여 출력할 수 있다.
구체적으로, 도 5의 IMDCT부(예를 들어, 452)에 대응되는 IMDCT 부(890)는 멀티 플렉서(880)의 후속 단에 구비될 수 있다.
IMDCT 부(890)는 멀티플렉서(880에서 멀테플렉싱 된 합성 오디오 신호를 역 변형 이산 코사인 변환하여 IFFT 부(895)로 출력한다.
합성부(830)는 도 5의 밴드 변환부(550)와 대응되는 구성을 구비하지 않는다. 그에 따라서, 곱하기 연산부(870)는 디코딩 코어부(810)에서 출력되는 n 개의 서브 밴드 신호들을 입력받는다.
곱하기 연산부(870)의 위상 진폭 보상부(871)는 서브 밴드 신호를 입력받고, 이의 위상 및 진폭 중 적어도 하나를 추정한다. 그리고, 추정된 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터의 위상 및 진폭에 맞춰서 조절할 수 있다.
합성 필터부(872)는 위상-진폭 보상부(871)에서 출력되는 신호를 입력받고, 전술한 곱하기 연산을 수행한다.
디코딩 코어부(810)에서 수행되는 디코딩, 예를 들어, 허프만 디코딩, 및 채널 분리 코딩은 MDCT 도메인에서 이뤄지므로, IMDCT를 수행하기 이전에 곱하기 연산 및 멀티플렉싱을 수행하면, 디코딩 코어부(810) 내지 멀티플렉서(880)까지의 연산을 동일한 도메인에서 수행할 수 있다. 그에 따라서, 연산의 복잡도를 낮출 수 있고 연산 효율을 높일 수 있다.
전술한 바와 같이, 본 발명에 따른 디코딩 장치는 주파수 도메인에서 오디오 신호의 합성 동작을 완료함으로써, 주파수 도메인에서 코딩을 수행하는 다른 코덱과 호환성을 가질 수 있다.
또한, 오디오 신호를 합성하는데 있어서, 곱하기 연산을 이용하므로, 컨볼루션 연산을 포함한 기타 오디오 신호의 합성 연산에 비하여 복잡도를 낮출 수 있어서, 연산 속도를 높일 수 있다.
또한, 시간 도메인에서 보다 주파수 도메인에서 디코딩 동작을 수행하므로, 음질을 향상시킬 수 있다.
도 9는 본 발명의 일 실시예에 따른 오디오 신호 복원 방법을 나타내는 플로우차트이다. 이하에서는, 도 3 및 도 9를 참조하여 오디오 신호 복원 방법을 설명한다.
도 9를 참조하면, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법(900)은 디코딩 장치(300)를 이용하여 오디오 신호를 복원하는 방법이다.
본 발명의 일 실시예에 따른 오디오 신호 복원 방법(900)은 디코딩 장치(300)로 수신된 비트스트림을 디코딩한다(910 단계). 910 단계는 디코딩 코어부(310)에서 수행될 수 있다.
910 단계에서 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할한다(920 단계). 920 단계는 디코딩 코어부(310) 및 밴드 분할부(340)에서 수행될 수 있다.
920 단계에서 생성된 각각의 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성한다(930 단계). 930 단계 동작은, 밴드 변환부(350)에서 수행될 수 있다.
930 단계에서 생성된, n 개의 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성한다(940 단계). 940 단계는 곱하기 연산부(370)에서 수행될 수 있다.
본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 도 1 내지 도 8을 참조하여 설명한 본 발명에 따른 디코딩 장치의 동작 구성 및 기술적 사상과 동일하다. 따라서, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법의 상세 동작 설명은 생략하도록 한다.
또한 본 발명에 따른 신호 처리 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드 또는 프로그램으로서 구현하는 것도 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구 범위에 기재된 내용과 동등한 범위내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.
100, 200, 300: 디코딩 장치
110, 210, 310: 디코딩 코어부
130, 230, 330: 합성부
211: 언패킹부
212: 역양자화부
213: 채널 분리부

Claims (19)

  1. 디코딩 장치를 이용하여 오디오 신호를 복원하는 방법에 있어서,
    비트스트림을 디코딩하는 단계;
    상기 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 단계;
    각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하는 단계; 및
    n 개의 상기 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 복원 방법.
  2. 제1항에 있어서, 상기 변환 서브 밴드 신호를 생성하는 단계는
    각각의 상기 서브 밴드 신호를 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 복원 방법.
  3. 제1항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
    주파수 도메인에서 수행되는 것을 특징으로 하는 오디오 신호의 복원 방법.
  4. 제3항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
    고속 퓨리에 변환 도메인에서 수행되는 것을 특징으로 하는 오디오 신호의 복원 방법.
  5. 제1항에 있어서, 상기 합성 필터뱅크 계수에 대응되는 소정 값은
    상기 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출되는 것을 특징으로 하는 오디오 신호 복원 방법.
  6. 제5항에 있어서, 상기 합성 필터뱅크 계수에 대응되는 소정 값은
    상기 합성 필터뱅크 계수들에 근거하여 산출되는 합성 필터 값을 고속 퓨리에 변환한 값인 것을 특징으로 하는 오디오 신호 복원 방법.
  7. 제1항에 있어서, 상기 변환 서브 밴드 신호를 생성하는 단계는
    상기 n 개의 서브 밴드 신호들 각각을 역 변형 이산 코사인 변환하는 단계; 및
    역 변형 이산 코사인 변환된 상기 n 개의 서브 밴드 신호들 각각을 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
  8. 제7항에 있어서,
    상기 합성 오디오 신호를 역 고속 퓨리에 변환하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
  9. 제1항에 있어서,
    상기 합성 오디오 신호를 역 변형 이산 코사인 변환하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
  10. 제1항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
    상기 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터에 맞춰서 조절하는 단계; 및
    상기 조절된 변환 서브 밴드 신호를 상기 소정 값과 곱하여 상기 합성 오디오 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
  11. 제10항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
    상기 합성 오디오 신호를 멀티플렉싱하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
  12. 제1항에 있어서, 상기 비트 스트림을 디코딩하는 단계는
    비트스트림을 언패킹하여 디코딩하는 단계;
    디코딩된 상기 비트 스트림을 역양자화 및 재배열하는 단계; 및
    역양자화 및 재배열된 상기 비트 스트림을 적어도 하나의 채널로 분리하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
  13. 비트 스트림을 디코딩하고, 디코딩 된 상기 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 디코딩 코어부; 및
    상기 서브 밴드 신호들 각각을 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하며, n 개의 상기 변환 서브 밴드 신호들 각각과 그에 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값들을 곱하여 합성 오디오 신호를 생성하는 합성부를 포함하는 것을 특징으로 하는 디코딩 장치.
  14. 제13항에 있어서, 상기 합성부는
    상기 합성 오디오 신호는 주파수 도메인에서 생성되는 것을 특징으로 하는 디코딩 장치.
  15. 제13항에 있어서, 상기 합성부는
    각각의 상기 서브 밴드 신호를 고속 퓨리에 변환하여 변환 서브 밴드 신호를 생성하는 밴드 변환부; 및
    상기 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출되는 상기 소정 값과 그에 대응되는 상기 변환 서브 밴드 신호를 곱하여 상기 합성 오디오 신호를 생성하는 곱하기 연산부를 포함하는 것을 특징으로 하는 디코딩 장치.
  16. 제15항에 있어서, 상기 밴드 변환부는
    각각의 상기 서브 밴드 신호를 역 변형 이산 코사인 변환하는 IMDCT 부; 및
    상기 IMDCT 부의 출력 신호를 전송받아 고속 퓨리에 변환하여 변환 서브 밴드 신호를 생성하는 FFT 부를 포함하는 것을 특징으로 하는 디코딩 장치.
  17. 제16항에 있어서, 상기 합성부는
    상기 n 개의 서브 밴드들에 대응되는 상기 합성 오디오 신호들을 멀티플렉싱하는 멀티플렉서; 및
    상기 멀티플렉서의 출력 신호를 역 고속 퓨리에 변환하는 IFFT 부를 더 포함하는 것을 특징으로 하는 디코딩 장치.
  18. 제15항에 있어서, 상기 곱하기 연산부는
    상기 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터에 맞춰서 조절하는 위상 및 진폭 보상부; 및
    상기 위상 및 진폭 보상부에서 조절된 상기 변환 서브 밴드 신호와 상기 소정 값을 곱하여 상기 합성 오디오 신호를 생성하는 합성 필터부를 포함하는 것을 특징으로 하는 디코딩 장치.
  19. 제13항에 있어서, 상기 디코딩 코어부는
    비트스트림을 언패킹하고, 소정 디코딩 방법으로 디코딩하는 언패킹부;
    디코딩된 상기 비트 스트림을 역양자화 및 재배열하는 역 양자화부; 및
    역양자화 및 재배열된 상기 비트 스트림을 적어도 하나의 채널로 분리하는 채널 분리부를 포함하는 것을 특징으로 하는 디코딩 장치.
KR1020110069496A 2010-08-06 2011-07-13 디코딩 방법 및 그에 따른 디코딩 장치 KR101837083B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US13/198,763 US8762158B2 (en) 2010-08-06 2011-08-05 Decoding method and decoding apparatus therefor
CN201110225498.8A CN102376307B (zh) 2010-08-06 2011-08-08 解码方法及其解码装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US37129410P 2010-08-06 2010-08-06
US61/371,294 2010-08-06

Publications (2)

Publication Number Publication Date
KR20120013893A true KR20120013893A (ko) 2012-02-15
KR101837083B1 KR101837083B1 (ko) 2018-03-09

Family

ID=45837281

Family Applications (6)

Application Number Title Priority Date Filing Date
KR1020110053369A KR20120013884A (ko) 2010-08-06 2011-06-02 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 신호 처리 시스템
KR1020110053370A KR101819027B1 (ko) 2010-08-06 2011-06-02 오디오 재생 방법 및 그에 따른 오디오 재생 장치, 및 정보 저장 매체
KR1020110056342A KR20120013887A (ko) 2010-08-06 2011-06-10 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체
KR1020110069498A KR101837084B1 (ko) 2010-08-06 2011-07-13 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체
KR1020110069495A KR20120013892A (ko) 2010-08-06 2011-07-13 오디오 신호 처리 방법, 그에 따른 엔코딩 장치 및 그에 따른 디코딩 장치
KR1020110069496A KR101837083B1 (ko) 2010-08-06 2011-07-13 디코딩 방법 및 그에 따른 디코딩 장치

Family Applications Before (5)

Application Number Title Priority Date Filing Date
KR1020110053369A KR20120013884A (ko) 2010-08-06 2011-06-02 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 신호 처리 시스템
KR1020110053370A KR101819027B1 (ko) 2010-08-06 2011-06-02 오디오 재생 방법 및 그에 따른 오디오 재생 장치, 및 정보 저장 매체
KR1020110056342A KR20120013887A (ko) 2010-08-06 2011-06-10 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체
KR1020110069498A KR101837084B1 (ko) 2010-08-06 2011-07-13 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체
KR1020110069495A KR20120013892A (ko) 2010-08-06 2011-07-13 오디오 신호 처리 방법, 그에 따른 엔코딩 장치 및 그에 따른 디코딩 장치

Country Status (1)

Country Link
KR (6) KR20120013884A (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015041476A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
WO2015060652A1 (ko) * 2013-10-22 2015-04-30 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
US9832585B2 (en) 2014-03-19 2017-11-28 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US9832589B2 (en) 2013-12-23 2017-11-28 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US9848275B2 (en) 2014-04-02 2017-12-19 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
KR20210102695A (ko) * 2020-02-12 2021-08-20 국방과학연구소 신호 필터링 장치 및 방법
US12014744B2 (en) 2013-10-22 2024-06-18 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9838823B2 (en) 2013-04-27 2017-12-05 Intellectual Discovery Co., Ltd. Audio signal processing method
CN107409264B (zh) * 2015-01-16 2021-02-05 三星电子株式会社 基于图像信息处理声音的方法和对应设备
EP3869826A4 (en) * 2018-10-16 2022-03-16 Sony Group Corporation SIGNAL PROCESSING DEVICE AND METHOD AND PROGRAM
US11654742B2 (en) 2019-07-05 2023-05-23 Hanon Systems Unique airflow delivery path for independent rear zone in tri or quad HVAC system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7343285B1 (en) 2003-04-08 2008-03-11 Roxio, Inc. Method to integrate user data into uncompressed audio data

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961469B2 (en) 2013-09-17 2018-05-01 Wilus Institute Of Standards And Technology Inc. Method and device for audio signal processing
WO2015041476A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10469969B2 (en) 2013-09-17 2019-11-05 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing multimedia signals
US10455346B2 (en) 2013-09-17 2019-10-22 Wilus Institute Of Standards And Technology Inc. Method and device for audio signal processing
US9578437B2 (en) 2013-09-17 2017-02-21 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing audio signals
US9584943B2 (en) 2013-09-17 2017-02-28 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing audio signals
WO2015041478A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
US11096000B2 (en) 2013-09-17 2021-08-17 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing multimedia signals
WO2015041477A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US11622218B2 (en) 2013-09-17 2023-04-04 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing multimedia signals
US10580417B2 (en) 2013-10-22 2020-03-03 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
US10204630B2 (en) 2013-10-22 2019-02-12 Electronics And Telecommunications Research Instit Ute Method for generating filter for audio signal and parameterizing device therefor
US12014744B2 (en) 2013-10-22 2024-06-18 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
WO2015060652A1 (ko) * 2013-10-22 2015-04-30 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
US11195537B2 (en) 2013-10-22 2021-12-07 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
US10692508B2 (en) 2013-10-22 2020-06-23 Electronics And Telecommunications Research Institute Method for generating filter for audio signal and parameterizing device therefor
US11109180B2 (en) 2013-12-23 2021-08-31 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US11689879B2 (en) 2013-12-23 2023-06-27 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US9832589B2 (en) 2013-12-23 2017-11-28 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US10158965B2 (en) 2013-12-23 2018-12-18 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US10433099B2 (en) 2013-12-23 2019-10-01 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US10701511B2 (en) 2013-12-23 2020-06-30 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
US10771910B2 (en) 2014-03-19 2020-09-08 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US10321254B2 (en) 2014-03-19 2019-06-11 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US10999689B2 (en) 2014-03-19 2021-05-04 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US10070241B2 (en) 2014-03-19 2018-09-04 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US11343630B2 (en) 2014-03-19 2022-05-24 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US9832585B2 (en) 2014-03-19 2017-11-28 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
US10469978B2 (en) 2014-04-02 2019-11-05 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US10129685B2 (en) 2014-04-02 2018-11-13 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US9986365B2 (en) 2014-04-02 2018-05-29 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US9860668B2 (en) 2014-04-02 2018-01-02 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US9848275B2 (en) 2014-04-02 2017-12-19 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
KR20210102695A (ko) * 2020-02-12 2021-08-20 국방과학연구소 신호 필터링 장치 및 방법

Also Published As

Publication number Publication date
KR101837083B1 (ko) 2018-03-09
KR20120013894A (ko) 2012-02-15
KR20120013887A (ko) 2012-02-15
KR20120013892A (ko) 2012-02-15
KR20120013885A (ko) 2012-02-15
KR101837084B1 (ko) 2018-03-09
KR101819027B1 (ko) 2018-01-17
KR20120013884A (ko) 2012-02-15

Similar Documents

Publication Publication Date Title
KR101837083B1 (ko) 디코딩 방법 및 그에 따른 디코딩 장치
JP6208725B2 (ja) 帯域幅拡張復号化装置
CA2464408C (en) Audio decoding apparatus and method for band expansion with aliasing suppression
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
KR101346358B1 (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
KR100931309B1 (ko) He-aac 디코더와 mpeg 서라운드 디코더를이용하여 멀티채널 오디오 신호를 복원하는 장치 및 방법
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
JP5404412B2 (ja) 符号化装置、復号装置およびこれらの方法
KR20080005325A (ko) 적응적 부호화/복호화 방법 및 장치
JP2009513992A (ja) オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法
WO2006021862A1 (en) Processing of encoded signals
US8977541B2 (en) Speech processing apparatus, speech processing method and program
KR102622804B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
KR102433192B1 (ko) 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치
KR102329309B1 (ko) Qmf 기반 처리 데이터의 시간 정렬
KR101599884B1 (ko) 멀티 채널 오디오 디코딩 방법 및 장치
US8665914B2 (en) Signal analysis/control system and method, signal control apparatus and method, and program
JPH09252254A (ja) オーディオ復号装置
US8762158B2 (en) Decoding method and decoding apparatus therefor
US9905242B2 (en) Signal analysis device, signal control device, its system, method, and program
US20230360655A1 (en) Higher order ambisonics encoding and decoding
KR101457897B1 (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
KR20080046089A (ko) 오디오/스피치 신호의 계층적 부호화/복호화 방법 및시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant