KR20070038020A - 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체 - Google Patents

오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체 Download PDF

Info

Publication number
KR20070038020A
KR20070038020A KR1020060097568A KR20060097568A KR20070038020A KR 20070038020 A KR20070038020 A KR 20070038020A KR 1020060097568 A KR1020060097568 A KR 1020060097568A KR 20060097568 A KR20060097568 A KR 20060097568A KR 20070038020 A KR20070038020 A KR 20070038020A
Authority
KR
South Korea
Prior art keywords
signal
tool
down mix
extracted
audio signal
Prior art date
Application number
KR1020060097568A
Other languages
English (en)
Inventor
방희석
오현오
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20070038020A publication Critical patent/KR20070038020A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

오디오 신호 처리 방법 및 장치와 프로그램을 기록하는 컴퓨터로 읽을 수 있는 기록 매체가 개시된다. 이 방법은, 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 단계 및 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 적용하는 단계를 구비하는 것을 특징으로 한다. 그러므로, 적어도 하나의 툴을 추출된 다운 믹스 신호에 배타적으로 또는 조합하여 적용하므로서, 복원되는 원래의 오디오 신호의 음질을 보다 향상시킬 수 있는 효과를 갖는다.
MPEG 서라운드, TP, TES, 툴

Description

오디오 신호 처리 방법 및 장치와 프로그램을 기록하는 컴퓨터로 읽을 수 있는 기록 매체{Method and apparatus for processing an audio signal, and a computer-readable media storing a program}
도 1은 본 발명에 의한 오디오 신호 처리 방법의 실시예를 설명하기 위한 플로우차트이다.
도 2는 도 1에 도시된 제12 및 제14 단계들에 대한 본 발명에 의한 실시예를 설명하기 위한 플로우차트이다.
도 3은 도 1에 도시된 제12 및 제14 단계들에 대한 본 발명에 의한 다른 실시예를 설명하기 위한 플로우차트이다.
도 4는 본 발명에 의한 오디오 신호 처리 장치의 실시예의 블럭도이다.
* 도면의 주요부분에 대한 부호의 설명
40 : 신호 추출부 42 : 방식 결정부
44 : 오디오 디코딩부
본 발명은 오디오 신호 처리에 관한 것으로서, 특히, 예를 들면 오디오 신호 를 처리하는 멀티 채널 오디오 코덱에 관한 것이다.
멀티 채널(multi-channel) 오디오 코덱(codec) 기법 중에서, 다채널 오디오 신호를 다운 믹스(downmix)하여 생성된 다운 믹스 신호를 전송하고, 그 외의 부가적인 공간 정보(spatial cue side information 또는 spatial parameter side information) 신호를 인코딩시에 추출하여 함께 전송하는 기법들이 있다. 이러한 기법들은, 각 채널별 인코딩을 수행하는 일반적인 멀티 채널 오디오 코덱 기법들에 비해, 비트율 면에서 효율적인 장점을 갖는다. 이 때, 멀티 채널 오디오 코덱의 디코더 측에서 원래의 오디오 신호를 효율적으로 복원하고자 여러 가지 툴들을 다양하게 적용하는 방법들이 대두되고 있다.
본 발명이 이루고자 하는 기술적 과제는, 적어도 하나의 툴을 이용하여 원래의 오디오 신호를 보다 잘 복원할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 상기 오디오 신호 처리 장치를 제어하는 프로그램을 기록하는 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 데 있다.
상기 과제를 이루기 위한 본 발명에 의한 오디오 신호 처리 방법은, 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 단계 및 상기 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 상기 추출된 다운 믹스 신호 에 서로 다른 툴들 중 적어도 하나를 적용하는 단계로 이루어지는 것이 바람직하다.
또는, 본 발명에 의한 오디오 신호 처리 장치는, 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 신호 추출부 및 상기 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 상기 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 적용하는 오디오 디코딩부로 구성되는 것이 바람직하다.
상기 다른 과제를 이루기 위한 본 발명에 의한 프로그램을 기록하는 컴퓨터로 읽을 수 있는 기록 매체에서, 프로그램은 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 단계 및 상기 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 상기 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 적용하는 단계를 수행하는 것이 바람직하다.
이하, 본 발명을 설명하기에 앞서, 본 발명의 이해를 돕기 위해 다채널 오디오 코덱에 대해 다음과 같이 간략하게 살펴본다.
다채널 오디오 코덱의 인코더에서, 다채널 멀티 오디오 신호를 다운 믹싱하여 다운 믹스 신호를 구하고, 구해진 다운 믹스 신호를 인코딩(encoding)한다. 예를 들어, 구해진 다운 믹스 신호를 AAC(Advanced Audio Coding) 할 수 있다. 이 때, 다채널 멀티 오디오 신호를 다운 믹싱할 때 다채널 오디오 신호에 대한 공간 정보를 구한다. 인코딩된 다운 믹스 신호와 공간 정보는 비트 스트림 형태로 변환되어 전송 채널을 통해 다채널 오디오 코덱의 디코더로 함께 전송된다. 이 때, 다운 믹스 신호는 전술한 바와 같이 다채널 오디오 신호로부터 구해질 수도 있고, 외 부에서 입력될 수도 있다. 다채널 오디오 코덱 자체에서 생성되지 않고 외부에서 생성된 다운 믹스 신호를 아티스틱(artistic) 다운 믹스 신호라 한다.
다채널 오디오 코덱의 디코더에서, 전송 채널을 통해 전송받은 비트 스트림 형태의 오디오 신호를 디코딩하여 다운 믹스 신호를 추출하고, 추출된 다운 믹스 신호를 다채널 오디오 디코더 예를 들면 MPEG 서라운드 디코더에서 업 믹싱하여 원래의 다채널 오디오 신호를 복원해낸다. 이 때, 디코딩된 결과를 업 믹싱할 때, 공간 정보가 이용된다.
이하, 본 발명에 의한 오디오 신호 처리 방법의 실시예를 첨부한 도면들을 참조하여 다음과 같이 설명한다.
도 1은 본 발명에 의한 오디오 신호 처리 방법의 실시예를 설명하기 위한 플로우차트로서, 다운 믹스 신호를 추출하는 단계(제10 단계) 및 추출된 다운 믹스 신호에 툴을 적용하는 단계(제12 및 제14 단계)로 이루어진다.
본 발명에 의한 오디오 신호 처리 방법은 먼저, 부호화된 오디오 신호로부터 다운 믹스 신호를 추출한다(제10 단계). 여기서, 부호화된 오디오 신호란, 전술한 바와 같이, 다채널 오디오 코덱의 디코더로 입력되는 비트 스트림 형태의 오디오 신호가 될 수 있다.
제10 단계후에, 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나가 적용될 방식을 방식 정보를 이용하여 결정한다(제12 단계). 여기서, 방식 정보는 외부로부터 주어질 수도 있다. 만일, 방식 정보가 외부에서 주어질 경우, 방식 정보는 다채널 오디오 코덱의 인코더로부터 전송되는 공간 정보에 포함될 수도 있다.
본 발명에 의하면, 툴들의 개수는 적어도 2개 이상이 될 수 있고, 서로 다른 툴들은 서로 동일한 기능을 수행할 수 있다. 예를 들어, 툴은 파형 정형을 위한 툴일 수 있다. 본 발명에 의하면, 툴들은 시간 포락선 적용 툴, 서브 밴드 포락선 적용 툴, 서브 밴드/시간 포락선 적용 툴 및 부가 포락선 적용 툴 및 미세 아티스틱 다운 믹스 이득 조정(Fine artistic downmix gain adjusting)툴 중 적어도 둘이 될 수 있다.
이하, 각 툴에 대해 다음과 같이 설명한다.
다채널 오디오 코덱의 디코더에서 추출된 다운 믹스 신호는 모노(mono) 또는 스테레오(stereo) 형태이다. 다채널 오디오 디코더는 추출한 다운 믹스 신호를 입력하고, 입력한 다운 믹스 신호를 다채널 오디오 신호로 만드는 과정에서 직접(direct) 신호와 확산(diffuse) 신호를 각각 생성하며, 생성된 이 두 신호들을 더하여 현장감 있는 최종 신호를 생성한다. 이 때, 직접 신호는 원래의 파형과 유사하지만 확산 신호는 임의로 만든 것이므로, 확산 신호를 직접 신호와 유사하게 만들어줄 필요가 있다. 이와 같이, 확산 신호를 직접 신호와 유사하게 만들기 위해, 확산 신호의 포락선을 정형하는 것을 '쉐이핑(shaping)'이라 한다.
시간 포락선 적용 툴 및 서브 밴드 포락선 적용 툴은 확산 신호의 시간 포락선(temporal envelope)을 직접 신호의 시간 포락선과 유사하게 만들기 위해 확산 신호에 적용하는 툴들이다. 시간 포락선 적용 툴의 예로서 시간 영역 템포럴 쉐이핑(TP)(time domain temporal shaping 또는 Temporal Processing)이 있고, 서브 밴드 포락선 적용 툴의 예로서 템포럴 포락선 쉐이핑(TES:Temporal Envelope Shaping)가 있다. 여기서, TES는 다채널 오디오 디코더로부터 출력되는 각 출력 채널의 확산 신호 부분의 포락선을 직접 신호의 시간 포락선 형태와 근사적으로 매칭시키기 위해 쉐이핑하는 과정을 의미한다. 이 때, TES는 LPC 모델링에 의해 하이브리드 서브 밴드 영역(hybrid subband domain)에서 수행된다. 즉, TES는 나이퀴스트 합성(Nyquist synthesis) 이전에 하이브리 서브 밴드 영역에서 적용된다. TP는 각 출력 채널의 확산 신호 부분의 포락선을 직접 신호의 시간 포락선과 매칭시키기 위한 쉐이핑을 위해 사용되는 툴이다. TP는 확산 신호와 직접 신호에 대해 시간 영역에서 수행된다. 즉, TP는 다채널 오디오 디코더의 최종 출력단에서 나이퀴스트 합성(Nyquist synthesis) 및 QMF(Quadrature Mirror Filter) 합성을 통과한 신호에 대해서 시간 영역에서 적용된다. TP는 음질은 다른 어느 툴보다 향상시킬 수 있지만 복잡한 계산량을 갖는다. 반면에, TES는 연산량은 TP보다 작지만, TP보다 음질은 떨어진다. 그럼에도 불구하고, 최근에는 TP보다 TES를 선호하여 연산량을 줄이는 것을 우선하는 경향이 있다.
부가 포락선 적용 툴은 합성된 출력 신호 즉, 다채널 오디오 디코더로부터 출력되는 신호의 광 대역(broadband) 포락선을 복원하는 과정이다. 이를 위해, 부가 포락선 적용 툴의 경우, 광 대역 포락선을 복원하기 위한 정보를 다채널 오디오 코덱의 인코더로부터 받는다. 부가 포락선 적용 툴의 예로서 포락선 리쉐이핑(GES)(Guided Envelope Shaping 또는 Envelope reshaping)이 있다. GES는 특히 박수 소리에 대해 음질의 저하가 심하기 때문에 이를 보강하기 위해 제안된 툴이다. 서브 밴드/시간 포락선 적용 툴은 서브 밴드 영역에서 시간 성분을 갖는 신호의 포락선을 쉐이핑하는 툴이다. 서브 밴드/시간 포락선 적용 툴의 예로서, 서브 영역 템포럴 쉐이핑(STP:Subband domain Temporal Shaping)이 있다. STP는 서브 밴드 영역에서 적용되는 툴로서, 예를 들어, 나이퀴스트 합성과 QMF 합성의 중간 즉, QMF 영역에서 적용될 수 있다. 미세 아티스틱 다운 믹스 이득 조정이란, 다채널 오디오 코덱의 인코더에서 아티스틱 다운 믹스 신호가 인코딩될 경우, 다채널 오디오 코덱의 디코더에서 추출된 다운 믹스 신호의 이득을 조정하기 위한 툴이다.
이하, 편의상 시간 포락선 적용 툴은 TP이고, 서브 밴드 포락선 적용 툴은 TES이고, 서브 밴드/시간 포락선 적용 툴은 STP이고, 부가 포락선 적용 툴은 GES라고 가정하면서 기술하지만, 본 발명은 이에 국한되지 않는다.
다채널 오디오 디코더는 음질을 우선시하는 고음질(HQ:High Quality) 디코딩 모드와 연산량을 줄이고 음질을 약간 떨어뜨리는 저전력(LP:Low Power) 디코딩 모드가 있다. HQ 디코딩 모드에서는 TES 또는 TP를 사용하고, LP 디코딩 모드에서는 STP를 사용하여 연산량 및 음질을 모두 적당한 수준으로 유지한다.
한편, 제12 단계후에, 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 제12 단계에서 결정된 방식에 따라 적용한다(제14 단계). 여기서, 제14 단계에서, 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원하는 동작은 전술한 다채널 오디오 디코더에서 수행될 수 있다. 즉, 제14 단계는 다채널 오디오 디코더에서 수행될 수 있다.
예를 들어, 박수 소리에 대한 음질을 강화하기 위해, 추출된 다운 믹스 신호 에 적용될 수 있는 제1 툴과 제2 툴이 있을 경우, 특정한 박수 소리에 대해서는 제1 툴을 추출된 다운 믹스 신호에 적용하는 것이 음질을 향상시킬 수 있고, 다른 특정한 박수 소리에 대해서는 제2 툴을 추출된 다운 믹스 신호에 적용하는 것이 음질을 향상시킬 수도 있고, 또 다른 특정한 박수 소리에 대해서는 제1 및 제2 툴들을 함께 다운 믹스 신호에 적용할 때 음질이 향상될 수 있다. 이와 같이, 제1 및 제2 툴들은 공동으로 조합하여 사용될 수도 있고 배타적으로 사용될 수도 있다.
본 발명의 일 실시예에 의하면, 제14 단계에서, 추출된 다운 믹스 신호에 서로 다른 툴들을 배타적으로 적용할 수 있다. 예컨대, TP, TES 및 STP는 추출된 다운 믹스 신호에 서로 배타적으로 적용될 수 있다. 왜냐하면, 이 툴들(TP, TES 및 STP)의 역할은 서로 중복되기 때문이다.
본 발명의 다른 실시예에 의하면, 제14 단계에서, 추출된 다운 믹스 신호에 서로 다른 툴들을 조합하여 적용할 수 있다. 예컨대, GES는 추출된 다운 믹스 신호에 TP, TES 또는 STP와 조합하여 적용될 수 있다. 만일, TES와 GES가 조합하여 적용될 경우, TES 툴은 적절한 성능에 더욱 적합될 수 있다. 이 때, 직접 신호와 확산 신호의 믹싱 동작은 GES에서 생략되고 TES에서 수행된다.
본 발명의 또 다른 실시예에 의하면, 예를 들어 HQ 디코딩 모드에서 계산량 등의 이유로 말미암아 TP와 TES중 어느 툴도 사용하지 않을 수도 있지만, GES는 사용될 수 있다. 만일, TP와 GES가 조합하여 적용될 경우 GES는 시간 영역에 적용된다. 그러나, TES와 GES가 조합하여 적용될 경우, GES는 하이브리드 서브 밴드 영역에서 적용된다.
본 발명에 의하면, 도 1에 도시된 바와 같이 제12 단계는 제10 단계후에 수행될 수도 있지만, 도 1에 도시된 바와 달리 제10 단계와 동시에 수행될 수도 있다.
본 발명에 의하면, 제12 단계에서 이용되는 방식 정보는 인디케이터(indicator)[또는, 신텍스 엘리먼트(syntax element)]의 형태로 포함될 수도 있다. 이 경우, 신텍스 엘리먼트에 포함된 방식 정보는 비트 스트림의 형태로 다채널 오디오 코덱의 인코더 측으로부터 디코더 측으로 전송될 수 있다. 이 때, 방식 정보는 적어도 하나의 플래그(flag)로 표현될 수도 있다. 여기서, 플래그란, 1비트의 신택스 엘리먼트를 의미한다.
이하, 방식 정보가 플래그로 표현된다고 가정하면서, 도 1에 도시된 제12 및 제14 단계들에 대한 실시예들을 첨부한 도면들을 참조하여 다음과 같이 설명한다.
도 2는 도 1에 도시된 제12 및 제14 단계들에 대한 본 발명에 의한 실시예를 설명하기 위한 플로우차트로서, 툴(들)을 추출된 다운 믹스 신호에 적용할 것인가의 여부에 따라 결정된 툴을 적용하는 단계(제20 내지 제24 단계들)로 이루어진다. 여기서, 제20 및 제22 단계는 도 1에 도시된 제12 단계의 실시예에 해당하고, 제24 단계는 도 1에 도시된 제14 단계의 실시예에 해당한다.
먼저, 방식 정보인 플래그들 중 하나를 분석하고, 툴을 추출된 다운 믹스 신호에 적용할 것인가의 여부를 분석된 결과를 이용하여 판단한다(제20 단계). 즉, 툴을 추출된 다운 믹스 신호에 적용할 것인가의 여부를 하나의 플래그를 이용하여 판단할 수 있다.
만일, 툴들이 추출된 다운 믹스 신호에 배타적으로 적용된다고 가정하자. 이 때, 추출된 다운 믹스 신호에 툴을 적용하는 것으로 판단되면, 플래그들 중 다른 하나를 분석하고 분석된 결과를 이용하여 몇 번째 툴을 추출된 다운 믹스 신호에 적용할 것인가를 결정한다(제22 단계). 이 때, 추출된 다운 믹스 신호에 툴을 적용하지 않을 경우, 플래그의 개수는 단지 하나면 된다. 그러나, 추출된 다운 믹스 신호에 툴을 적용할 경우, 공간 정보를 표현하는 플래그의 개수가 한 개 더 추가된다.
그러나, 툴들이 추출된 다운 믹스 신호에 조합하여 적용된다고 가정하자. 이 때, 플래그들 중 다른 하나를 분석하고 분석된 결과를 이용하여 툴들 중 어떤 툴(들)을 추출된 다운 믹스 신호에 적용할 것인가를 결정한다(제22 단계).
만일, 툴들이 추출된 다운 믹스 신호에 배타적으로 적용된다고 가정하자. 이 때, 첫 번째 툴을 추출된 다운 믹스 신호에 적용하는 것으로 결정되면, 첫 번째 툴을 추출된 다운 믹스 신호에 적용한다(제24 단계). 그러나, 두 번째 툴을 추출된 다운 믹스 신호에 적용하는 것으로 결정되면, 두 번째 툴을 추출된 다운 믹스 신호에 적용한다(제24 단계). 그러나, 툴들이 추출된 다운 믹스 신호에 조합하여 적용된다고 가정하자. 이 때, 제22 단계에서 결정된 툴(들)이 추출된 다운 믹스 신호에 적용된다(제24 단계). 도 2의 경우, 추출된 다운 믹스 신호에 어느 툴을 적용할 것인가를 결정하기 위해, 두 개의 플래그들이 사용되었다.
도 3은 도 1에 도시된 제12 및 제14 단계들에 대한 본 발명에 의한 다른 실시예를 설명하기 위한 플로우차트로서, 몇 번째 툴을 적용할 것인가를 판단하는 단 계(제30 및 제32 단계들) 및 결정된 툴을 적용하는 단계(제34 및 제36 단계들)로 이루어진다. 여기서, 제30 및 제32 단계들은 도 1에 도시된 제12 단계의 실시예에 해당하고, 제34 및 제36 단계들은 도 1에 도시된 제14 단계의 실시예에 해당한다. 도 3은 추출된 다운 믹스 신호에 적용되는 툴들을 서로 배타적으로 적용되는 경우에 대한 실시예이다.
먼저, 플래그 중 하나를 분석하고, 분석된 결과를 이용하여, 툴들 중에서 첫 번째 툴을 추출된 다운 믹스 신호에 적용할 것인가를 판단한다(제30 단계). 만일, 첫 번째 툴을 추출된 다운 믹스 신호에 적용하는 것으로 판단되면, 첫 번째 툴을 추출된 다운 믹스 신호에 적용한다(제34 단계). 그러나, 첫 번째 툴을 추출된 다운 믹스 신호에 적용하지 않은 것으로 판단되면, 플래그 중 다른 하나를 분석하고, 분석된 결과를 이용하여 두 번째 툴을 추출된 다운 믹스 신호에 적용할 것인가의 여부를 판단한다(제32 단계), 만일, 두 번째 툴을 추출된 다운 믹스 신호에 적용하는 것으로 판단되면, 두 번째 툴을 추출된 다운 믹스 신호에 적용한다(제36 단계).
본 발명의 또 다른 실시예에 의하면, 하나의 플래그를 분석하고, 분석된 결과를 이용하여 첫 번째 툴과 두 번째 툴중에서 어느 툴을 추출된 다운 믹스 신호에 적용할 것인가를 판단할 수 있다. 이 경우, 판단된 결과에 따라 결정된 첫 번째 또는 두 번째 툴을 추출된 다운 믹스 신호에 적용한다.
이하, 본 발명에 의한 오디오 신호 처리 장치의 실시예의 구성 및 동작을 첨부한 도면을 참조하여 다음과 같이 설명한다.
도 4는 본 발명에 의한 오디오 신호 처리 장치의 실시예의 블럭도로서, 신호 추출부(40), 방식 결정부(42) 및 오디오 디코딩부(44)로 구성된다. 도 4에 도시된 본 발명에 의한 오디오 신호 처리 장치는 도 1에 도시된 오디오 신호 처리 방법을 수행할 수 있으며, 다채널 오디오 코덱의 디코더에 포함될 수 있다.
도 4에 도시된 신호 추출부(40)는 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하고, 추출된 다운 믹스 신호를 오디오 코딩부(44)로 출력한다. 이를 위해, 신호 추출부(40)는 다채널 오디오 코덱의 인코더 측으로부터 전송된 비트 스트림 형태의 부호화된 오디오 신호를 입력단자 IN1을 통해 입력할 수 있다. 즉, 신호 추출부(40)는 도 1에 도시된 제10 단계를 수행하는 역할을 한다.
방식 결정부(42)는 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나가 적용될 방식을 방식 정보로부터 결정하고, 결정된 방식 정보를 오디오 디코딩부(44)로 출력한다. 이를 위해, 방식 결정부(42)는 다채널 오디오 코덱의 인코더 측으로부터 전송되는 방식 정보를 입력단자 IN2를 통해 입력할 수 있다. 이 경우, 방식 정보는 신텍스 엘리먼트에 포함될 수도 있고, 적어도 하나의 플래그로 표현될 수 있다. 또는, 방식 결정부(42)는 방식 정보를 입력단자 IN2를 통해 외부로부터 입력하는 대신에 내부에 저장할 수도 있다. 이와 같이, 방식 결정부(42)는 도 1에 도시된 제12 단계를 수행하는 역할을 한다.
오디오 디코딩부(44)는 신호 추출부(40)에서 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호로 복원하고, 복원된 원래의 오디오 신호를 출력단자 OUT를 통해 출력한다. 이와 같이, 추출된 다운 믹스 신호를 디코딩할 때, 오디오 디코딩부(44)는 방식 결정부(42)에서 결정된 방식에 상응하여 툴들 중 적어도 하나 를 신호 추출부(40)에서 추출된 다운 믹스 신호에 적용한다.
본 발명의 일 실시예에 의하면, 오디오 신호 처리 방법은 도 1에 도시된 바와 같이, 제10, 제12 및 제14 단계들로 이루어질 수 있다. 이 경우, 도 4에 도시된 오디오 신호 처리 장치는, 신호 추출부(40), 방식 결정부(42) 및 오디오 디코딩부(44)로 구현될 수 있다.
본 발명의 다른 실시예에 의하면, 오디오 신호 처리 방법은 도 1에 도시된 바와 달리, 제10 및 제14 단계만으로 구현될 수도 있다. 이 경우, 오디오 신호 처리 장치는 도 4에 도시된 바와 달리 신호 추출부(40) 및 오디오 디코딩부(44)만으로 구현될 수 있다. 이를 위해, 추출된 다운 믹스 신호에 어느 툴이 적용될 것인가는 사전에 미리 결정되어 오디오 디코딩부(44)가 이를 인식할 수 있도록 한다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
이상, 전술한 본 발명의 바람직한 실시예는, 예시의 목적을 위해 개시된 것으로, 당업자라면 이하 첨부된 특허청구범위에 개시된 본 발명의 기술적 사상과 그 기술적 범위 내에서, 다양한 다른 실시예들을 개량, 변경, 대체 또는 부가 등이 가능할 것이다.
이상에서 설명한 바와 같이, 본 발명에 의한 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는 컴퓨터로 읽을 수 있는 기록 매체는 적어도 하나의 툴을 추출된 다운 믹스 신호에 배타적으로 또는 조합하여 적용하므로서, 복원되는 원래의 오디오 신호의 음질을 보다 향상시킬 수 있는 효과를 갖는다.

Claims (12)

  1. (a) 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 단계; 및
    (b) 상기 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 상기 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 적용하는 단계를 구비하는 것을 특징으로 하는 오디오 신호 처리 방법.
  2. 제1 항에 있어서, 상기 오디오 신호 처리 방법은
    (c) 상기 추출된 다운 믹스 신호에 상기 서로 다른 툴들 중 적어도 하나가 적용될 방식을 방식 정보를 이용하여 결정하는 단계를 더 구비하는 것을 특징으로 하는 오디오 신호 처리 방법.
  3. 제1 항에 있어서, 상기 (b) 단계는
    상기 추출된 다운 믹스 신호에 상기 서로 다른 툴들을 서로 배타적으로 적용하는 것을 특징으로 하는 오디오 신호 처리 방법.
  4. 제1 항에 있어서, 상기 (b) 단계는
    상기 추출된 다운 믹스 신호에 상기 서로 다른 툴들을 조합하여 적용하는 것을 특징으로 하는 오디오 신호 처리 방법.
  5. 제2 항에 있어서, 상기 방식 정보는 신텍스 엘리먼트에 포함되거나, 적어도 하나의 플래그로 표현되는 것을 특징으로 하는 오디오 신호 처리 방법.
  6. 제1 항 내지 제5 항 중 어느 한 항에 있어서, 상기 툴들은
    시간 포락선 적용 툴, 서브 밴드 포락선 적용 툴, 서브 밴드/시간 포락선 적용 툴 및 부가 포락선 적용 툴 및 미세 아티스틱 다운 믹스 이득 조정 중 적어도 둘에 해당하는 것을 특징으로 하는 오디오 신호 처리 방법.
  7. 제6 항에 있어서, 상기 시간 포락선 적용 툴, 서브 밴드 포락선 적용 툴 및 서브 밴드/시간 포락선 적용 툴은 상기 추출된 다운 믹스 신호에 서로 배타적으로 적용되는 것을 특징으로 하는 오디오 신호 처리 방법.
  8. 제6 항에 있어서, 상기 부가 포락선 적용 툴은 상기 추출된 다운 믹스 신호에 상기 시간 포락선 적용 툴, 서브 밴드 포락선 적용 툴 및 서브 밴드/시간 포락선 적용 툴과 조합하여 적용되는 것을 특징으로 하는 오디오 신호 처리 방법.
  9. 제6 항에 있어서, 상기 서브 밴드/시간 포락선 적용 툴은 서브 밴드 영역에서 시간 성분을 갖는 신호에 적용되는 툴인 것을 특징으로 하는 오디오 신호 처리 방법.
  10. 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 신호 추출부; 및
    상기 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 상기 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 적용하는 오디오 디코딩부를 구비하는 것을 특징으로 하는 오디오 신호 처리 장치.
  11. 제10 항에 있어서, 상기 오디오 신호 처리 장치는
    상기 추출된 다운 믹스 신호에 상기 서로 다른 툴들 중 적어도 하나가 적용될 방식을 방식 정보로부터 결정하는 방식 결정부를 더 구비하고,
    상기 오디오 디코딩부는 상기 방식 결정부에서 결정된 방식에 상응하여 상기 툴들중 적어도 하나를 상기 추출된 다운 믹스 신호에 적용하는 것을 특징으로 하는 오디오 신호 처리 장치.
  12. 부호화된 오디오 신호로부터 다운 믹스 신호를 추출하는 단계; 및
    상기 추출된 다운 믹스 신호를 디코딩하여 원래의 오디오 신호를 복원할 때, 상기 추출된 다운 믹스 신호에 서로 다른 툴들 중 적어도 하나를 적용하는 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020060097568A 2005-10-24 2006-10-04 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체 KR20070038020A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72922505P 2005-10-24 2005-10-24
US60/729,225 2005-10-24

Publications (1)

Publication Number Publication Date
KR20070038020A true KR20070038020A (ko) 2007-04-09

Family

ID=38159540

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060097568A KR20070038020A (ko) 2005-10-24 2006-10-04 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체

Country Status (1)

Country Link
KR (1) KR20070038020A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020145659A1 (en) * 2019-01-08 2020-07-16 Lg Electronics Inc. Signal processing device and image display apparatus including the same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020145659A1 (en) * 2019-01-08 2020-07-16 Lg Electronics Inc. Signal processing device and image display apparatus including the same
CN111432273A (zh) * 2019-01-08 2020-07-17 Lg电子株式会社 信号处理装置和包括该信号处理装置的图像显示设备
US11089423B2 (en) 2019-01-08 2021-08-10 Lg Electronics Inc. Signal processing device and image display apparatus including the same

Similar Documents

Publication Publication Date Title
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218777B1 (ko) 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP5232789B2 (ja) オブジェクトベースオーディオ信号をエンコーディング及びデコーディングする方法並びにその装置
KR101058041B1 (ko) 스케일러블 채널 복호화 방법 및 장치
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
EP1934973B1 (en) Temporal and spatial shaping of multi-channel audio signals
JP6808781B2 (ja) 信号をインタリーブするためのオーディオ復号器
EA025020B1 (ru) Аудиодекодер и способ декодирования с использованием эффективного понижающего микширования
KR20070038020A (ko) 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체
KR20080030848A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination