KR20090115200A - 오디오 신호 처리 방법 및 장치 - Google Patents
오디오 신호 처리 방법 및 장치 Download PDFInfo
- Publication number
- KR20090115200A KR20090115200A KR1020097018361A KR20097018361A KR20090115200A KR 20090115200 A KR20090115200 A KR 20090115200A KR 1020097018361 A KR1020097018361 A KR 1020097018361A KR 20097018361 A KR20097018361 A KR 20097018361A KR 20090115200 A KR20090115200 A KR 20090115200A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- signal
- gain
- ratio
- parameter
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 title description 19
- 238000004091 panning Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 5
- 230000006866 deterioration Effects 0.000 abstract description 2
- 230000001755 vocal effect Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 13
- 238000003672 processing method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 5
- 241001342895 Chorus Species 0.000 description 4
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical group N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및, 상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.
오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.
Description
본 발명은 오디오 신호의 처리 방법 및 장치에 관한 것으로, 보다 상세하게는 디지털 매체, 방송 신호 등으로 수신된 오디오 신호를 처리할 수 있는 오디오 신호의 처리 방법 및 장치에 관한 것이다.
일반적으로, 다수 개의 오브젝트를 모노 또는 스테레오 신호로 다운믹스하는 과정에 있어서, 각각의 오브젝트 신호로부터 파라미터들이 추출된다. 이러한 파라미터들은 디코더에서 사용될 수 있는 데, 각각의 오브젝들의 패닝(panning)과 게인(gain)은 유저의 선택에 의해 컨트롤 될 수 있다.
Technical Problem
각각의 오브젝트 시그널을 제어하기 위해서는, 다운믹스에 포함되어 있는 각각의 소스들이 적절히 포지셔닝 또는 패닝되어야 한다.
또한, 채널 기반(channel-oriented) 디코딩 방식으로 하향 호환성을 갖기 위해서는, 오브젝트 파라미터는 업믹싱을 위한 멀티 채널 파라미터로 유연하게 변환되어야 한다.
Technical Solution
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 오브젝트의 게인과 패닝을 제한없이 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤하되, 일정 제한 범위 내에서만 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
Advantageous Effects
본 발명은 다음과 같은 효과와 이점을 제공한다.
우선, 오브젝트의 게인과 패닝을 제한없이 컨트롤 할 수 있다.
둘째, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤할 수 있다.
셋째, 오브젝트의 게인을 조정하는 경우, 게인 조정에 대한 게인범위를 제공함으로써, 게인 조정에 따라 음질이 왜곡되는 것을 방지할 수 있다.
도 1 은 본 발명의 실시예에 따른 오디오 신호 처리 장치의 구성도.
도 2 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 일 예.
도 3 은 본 발명의 일 실시예에 따른 오디오 신호 처리 방법의 순서도.
도 4 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 다른 예.
도 5 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법의 순서도.
Best Mode for Carrying Out the Invention
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함한다.
본 발명에 따르면, 상기 비율정보는, 오디오 신호 비트스트림으로부터 획득된 것일 수 있다.
본 발명에 따르면, 상기 비율정보 및 상기 게인범위 정보의 전송 여부를 나타내는 전송 플래그 정보를 획득하는 단계를 더 포함하고, 상기 비율정보 및 상기 게인범위 정보는, 상기 전송 플래그 정보를 근거로 하여 상기 오디오 신호 비트스트림으로부터 획득된 것일 수 있다.
본 발명에 따르면, 오브젝트 신호가 관계 신호에 해당하는지 여부를 나타내는 관계 플래그 정보를 획득하는 단계를 더 포함하고, 상기 전송 플래그 정보를 획득하는 단계는, 상기 관계 플래그 정보를 근거로 수행되는 것일 수 있다.
본 발명에 따르면, 상기 관계 플래그 정보는, 오브젝트 신호가 관계 신호에 해당하는지 여부를 오브젝트별로 나타내는 것일 수 있다.
발명에 따르면, 주파수 해상도 정보를 수신하는 단계를 더 포함하고,상기 파라미터 정보를 변형하는 단계는, 상기 주파수 해상도 정보를 근거로 수행되는 것일 수 있다.
본발명에 따르면, 상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인, 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함할 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 시간별 서브밴드별로 변화하는 것일 수 있다.
본 발명에 따르면, 상기 게인범위 정보를 표시하는 단계; 및, 오브젝트별 게인 조정에 관한 사용자 제어 정보를 수신하는 단계를 포함하고, 상기 컨트롤 파라미터는, 상기 사용자 제어 정보를 근거로 생성된 것일 수 있다.
본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 메인 신호 및 상기 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계; 및, 상기 다운믹스 정보 및 상기 멀티채널 정보를 이용하여 멀티채널 신호를 생성하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고, 상기 믹스 정보는, 오브젝트 위치 정보, 오브젝트 게인 정보, 및 재생 환경 정보 중 하나 이상을 근거로 생성된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 방송 신호를 통해 수신된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 디지털 매체를 통해 수신된 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.
본 발명의 또 다른 측면에 따르면, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부; 상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 오디오 신호 처리 장치가 제공된다.
본 발명의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계; 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 포함하고,상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것을 특징으로 하는 오디오 신호 처리 방법이 제공된다.
본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계; 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록되고, 상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것인 컴퓨터로 읽을 수 있는 기록 매체.
본 발며의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하고, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하고, 상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것인 오디오 신호 처리 장치가 제공된다.
본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 제공된다.
본 발명에 따르면, 상기 비율정보를 생성하는 단계는, 오브젝트 신호들의 오브젝트 레벨 정보를 이용하여 수행될 수 있다.
본 발명에 따르면, 상기 비율정보를 생성하는 단계는, 특정 오브젝트 신호의 오브젝트 레벨 정보, 및 다른 오브젝트 신호의 오브젝트 레벨 정보간의 비율을 이용하여 수행될 수 있다.
본 발명에 따르면, 상기 다른 오브젝트 신호의 오브젝트 레벨 정보는, 둘 이상의 다른 오브젝트 신호의 오브젝트 레벨 정보의 합일 수 있다.
본 발명에 따르면, 상기 게인범위 정보를 생성하는 단계는, 디폴트 가이드 정보, 유저 가이드 정보, 및 인코더 가이드 정보 중 하나 이상을 이용하여 수행될 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 , 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함할 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 시간별 서브밴드별로 변화할 수 있다.
본 발명에 따르면, 메인 신호 및 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계를 더 포함하고, 상기 비율정보는, 상기 메인 신호 및 상기 서브 신호간의 상대적인 비율을 포함할 수 있다.
본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고, 상기 믹스 정보는, 오브젝트 위치 정보, 오브젝트 게인 정보, 및 재생 환경 정보 중 하나 이상을 근거로 생성된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 방송 신호를 통해 수신된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 디지털 매체를 통해 수신된 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.
본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하고, 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 정보 생성부; 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 오디오 신호 처리 장치가 제공된다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameters), 계수(coeffcients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 그 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
도 1 은 본 발명의 실시예에 따른 오디오 신호 처리 장치의 구성을 보여주는 도면이다. 도 1 을 참조하면, 우선, 본 발명의 실시예에 따른 오디오 신호 처리 장치(100)는 정보 생성 유닛(110), 다운믹스 프로세싱 유닛(120), 멀티채널 더코더(130)를 포함한다.
정보 생성 유닛(information generating unit)(110)은 오브젝트 정보(object information)(OI) 등을 포함하는 부가 정보(side information)를 오디오 신호 비트스트림을 통해 수신하고, 사용자 인터페이스를 통해 믹스 정보(mix information)(MXI)를 수신한다. 여기서, 오브젝트 정보(OI)는 다운믹스 신호 내에 포함되어 있는 오브젝트들에 관한 정보로서, 오브젝트 레벨 정보(object level information), 오브젝트 상관 정보(object correlation information) 등을 포함할 수 있다. 상기 오브젝트 정보(OI)는 오브젝트 특성을 나타내는 파라미터인 오브젝트 파라미터(object parameter)(OP)를 포함할 수 있다. 한편, 믹스 정보(MXI)란, 오브젝트 위치 정보(object position information), 오브젝트 게인 정보(object gain information), 및 재생 환경 정보(playback configuration information) 등을 근거로 생성된 정보로서, 오브젝트 위치 정보란, 사용자가 각 오브젝트의 위치 또는 패닝(panning)를 제어하기 위해 입력한 정보이며, 오브젝트 게인 정보란, 사용자가 각 오브젝트의 게인(gain)을 제어하기 위해 입력한 정보이다. 재생환경 정보는, 스피커의 개수, 스피커의 위치, 앰비언트 정보(speaker 의 가상 위치) 등을 포함하는 정보로서, 사용자로부터 입력받을 수도 있고, 미리 저장되어 있을 수도 있으며, 다른 장치로부터 수신할 수도 있다. 상기 믹스정보(MXI)는 컨트롤 파라미터(control parameter)(CP)를 포함할 수 있는 데, 이때 컨트롤 파라미터(CP)는 특히 오브젝트 게인 정보에 해당하는 파라미터일 수 있으나, 본 발명은 이에 한정되지 아니한다.
한편, 정보 생성 유닛(110)은 비율 정보(RI) 및 게인범위 정보(GI) 등을 비트스트림으로부터 수신하거나, 자체적으로 생성한다. 비율 정보(RI), 게인범위 정보(GI) 등에 관한 구체적인 설명은 도 2 내지 도 5 와 함께 후술하고자 한다. 비율정보(RI) 및 게인범위 정보(GI)를 이용하여 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP) 중 하나 이상을 포함하는 파라미터 정보(PI)를 변형함으로써 변형된 파라미터 정보(MPI)를 생성하고 이를 이용하여 멀티채널 정보(multi-channel information)(MI)를 생성한다. 여기서 멀티채널 정보(MI)는 다운믹스 신호(DMX)를 업믹싱하기 위한 정보로서, 채널 레벨 정보(channel level information), 채널 상관 정보(channel correlation information) 등을 포함할 수 있다. 이에 대해서도 도 2 내지 도 5 에서 구체적으로 기재될 것이다.
한편, 정보 생성 유닛(110)은 변형된 파라미터 정보(MPI) 등을 이용하여 다운믹스 프로세싱 정보(downmix processing information)(DPI)를 생성할 수 있다. 한편, 다운믹스 프로세싱 유닛(120)이 오브젝트 게인을 조절하기 위한 것이 아니라, 오브젝트 패닝만을 조절하기 위한 것이라면, 정보 생성 유닛(110)은 변형된 파라미터 정보(MPI)가 아니라, 변형되지 않은 파라미터 정보(PI)를 이용하여 다운믹스 프로세싱 정보(DPI)를 생성할 수 있다.
다운믹스 프로세싱 유닛(120)은 다운믹스 정보(이하, 다운믹스 신호(DMX))를 수신하고, 다운믹스 프로세싱 정보(DPI)를 이용하여 다운믹스 신호(DMX)를 프로세싱한다. 오브젝트의 패닝 또는 게인을 조절하기 위해 다운믹스 신호(DMX)를 프로세싱할 수 있다.
멀티채널 디코더(multi-channel decoder)(130)는 프로세싱된 다운믹스(processed downmix)를 수신하고, 멀티채널 정보(MI)를 이용하여 프로세싱된 다운믹스 신호를 업믹싱하여 멀티채널 신호를 생성한다.
이하에서는, 도 2 내지 도 5 를 참조하여, 정보 생성 유닛(110)이 비율 정보(RI) 및 게인범위 정보(GI) 등을 비트스트림으로부터 수신하거나, 자체적으로 생성하고, 이를 이용하여 멀티 채널 정보(MI)를 생성하는 과정에 관해서 구체적으로 설명하고자 한다.
도 2 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 일 예이고, 도 3 은 본 발명의 일 실시예에 따른 오디오 신호 처리 방법의 순서를 나타내는 도면이다. 도 2 및 도 3 는 비율 정보(RI)를 비트스트림으로부터 수신하는 방식의 실시예에 해당하는 도면이다. 우선 도 2 를 참조하면, 정보 생성 유닛(110)은 정보 송수신부(112a), 정보 변형부(114a), 및 멀티채널 정보 생성부(116a)를 포함한다. 이하, 도 2 및 도 3 을 함께 참조하면서, 각 구성요소 및 각 단계에 관하여 구체적으로 설명하고자 한다.
정보 송수신부(112a)는 우선 오디오 신호 비트스트림으로부터 오브젝트 파라미터(CP)를 포함하는 오브젝트 정보(object information)(OI)를 획득하고, 사용자 인터페이스 등으로부터 컨트롤 파라미터(CP)를 포함하는 믹스 정보(mix information)(MXI)를 획득한다(S110 단계). 여기서 오브젝트 정보(OI)는 도 1 과 함께 설명된 오브젝트 정보와 동일한 것일 수 있는데, 오브젝트 정보(OI)에 오브젝트 레벨 정보가 포함되어 전송된 경우, 이 전송된 오브젝트 레벨 정보를 제 1 오브젝트 레벨 정보(OL2)라고 지칭하고자 한다.
그리고 정보 송수신부(112a)는 오디오 신호 비트스트림으로부터 관계 플래그 정보를 획득한다(S120 단계).
관계 플래그 정보 중 제 1 관계 플래그 정보가 비트스트림에 포함될 수 있는데, 제 1 관계 플래그 정보의 의미는, 다운믹스 신호에 포함되어 있는 오브젝트 신호가 모두 독립적인 신호인지, 아니면 관계 신호에 해당하는 신호가 하나 이상 존재하는지 여부를 나타낸다. 예를 들어, 제 1 관계 플래그 정보가 '0'일 때는, 모든 오브젝트 신호가 독립적인 신호임을 의미하고, 제 1 관계 플래그 정보가 '1'일 때, 관계 신호에 해당하는 오브젝트 신호가 하나 이상 존재하는 것을 의미하는 설정할 수 있으나, 본 발명은 이에 한정되지 아니한다. 여기서 관계 신호란, 오브젝트 레벨을 조절하는 데 있어서, 다른 오브젝트 신호와의 상대적인 레벨이 일정 수준 이하 또는 이상이 될 때, 음질의 열화가 발생될 수 있는 신호를 지칭한다.
한편, 제 1 관계 플래그 정보에 따라, 관계 신호에 해당하는 오브젝트 신호가 하나 이상 존재하는 경우(예를 들어, 제 1 관계 플래그 정보가 '1'인 경우), 오브젝트별로 해당 오브젝트가 관계 신호에 해당하는지를 나타내는 제 2 관계 플래그 정보를 추출할 수 있다. 반대로, 관계 신호에 해당하는 오브젝트 신호가 하나도 존재하지 않을 경우(예를 들어, 제 1 관계 플래그 정보가 '0'인 경우), 각 오브젝트별로 관계 신호에 해당하는지 여부를 나타내는 제 2 관계 플래그 정보는 추출할 필요가 없다.
앞서 획득된 제 2 관계 플래그 정보에 따라, 해당 오브젝트 신호가 관계 신호에 해당하는 지 여부를 알 수 있다. 예를 들어, 제 2 관계 플래그 정보가 '0'인 경우 해당 오브젝트 신호는 관계 신호에 해당하지 않는 것을 의미하고, 제 2 관계 플래그 정보가 '1'인 경우 해당 오브젝트 신호는 관계 신호에 해당하는 것을 의미하는 것으로 설정할 수 있으나, 역시 본 발명은 이에 한정되지 아니한다.
이와 같이 S120 단계에 획득된 관계 플래그 정보를 근거로 하여, 비율 정보(RI) 및 게인범위 정보(GI)가 전송되는지 여부를 나타내는 전송 플래그 정보를 획득한다(S130 단계). 구체적으로, 제 2 관계 플래그 정보를 참조한 결과, 해당 오브젝트가 관계 신호에 해당하는 경우(예를 들어, 제 2 관계 플래그 정보가 '1'인 경우), 해당 오브젝트에 대해 전송 플래그 정보를 추출할 수 있다.
S130 단계에서 획득된 전송 플래그 정보를 근거로, 해당 오브젝트에 대해 비율 정보(RI) 및 게인범위 정보(GI)의 전송여부를 알 수 있다. 예를 들어, 전송 플래그 정보가 0 인 경우, 비율 정보 및 게인범위 정보가 전송되지 않음을 의미하고, 전송 플래그 정보가 1 인 경우 비율 정보 및 게인범위 정보가 전송되는 것을 의미할 수 있다.
한편, 제 1 관계 플래그 정보 및 제 2 관계 플래그 정보가 비트스트림에 포함되지 않고, 전송 플래그 정보만이 비트스트림에 포함되는 실시예도 구현될 수 있는 바, 본 발명은 이에 한정되지 아니한다.
그런 다음, S130 단계에서 획득된 전송 플래그 정보를 참조한 결과, 비율 정보 및 게인범위 정보가 전송되는 경우(예를 들어, 전송 플래그 정보가 '1'인 경우), 게인범위 정보(GI)가 존재하는 주파수의 해상도를 나타내는 주파수 해상도 정보를 획득한다(S140 단계). 예를 들어, 주파수 해상도 정보가 '1'인 경우, 게인범위 정보가 존재하는 주파수의 해상도가 '28'임을 의미하고, 주파수 해상도 정보가 '2'인 경우, 게인범위 정보가 존재하는 주파수의 해상도가 '20'임을 의미하는 것으로 설정할 수 있지만, 본 발명은 이에 한정되지 아니한다.
또한, S130 단계에서 획득된 전송 플래그 정보를 참조한 결과, 비율 정보(RI) 및 게인범위 정보(GI)가 전송되는 경우(예를 들어, 전송 플래그 정보가 '1'인 경우), 비율 정보(RI) 및 게인범위 정보(GI)를 획득한다(S150 단계)한편, 비율 정보(RI)란, 해당 오브젝트 신호가 메인 신호에 가까운지 또는 서브 신호에 가까운지에 해당하는 정보로서, 구체적으로 메인 신호 및 서브 신호간의 상대적인 비율을 포함할 수 있다. 일 예로, 메인 신호는 음성 신호에, 서브 신호는 잡음 신호에 대응될 수 있고, 다른 예로, 메인 신호는 메인 보컬 신호에, 서브 신호는 백 코러스 신호에 대응될 수 있으나, 본 발명은 이에 한정되지 아니한다. 예를 들어, 비율 정보가 '0'인 경우, 해당 오브젝트 신호가 서브 신호에 매우 가까운 것을 의미하고, '1'인 경우, 해당 오브젝트 신호가 서브 신호에 가까운 것을 의미하고, '2'인 경우, 해당 오브젝트 신호가 메인 신호에 가까운 것을 의미하고, '3'인 경우, 해당 오브젝트 신호가 메인 신호에 매우 가까운 것을 의미하는 것으로 설정할 수 있으나, 본 발명은 이에 한정되지 아니한다.
다른 한편, 게인범위 정보(GI)는, 오브젝트의 게인 조정에 대한 범위를 포함할 수 있는 데, 이때, 상기 범위는 상한값 또는 하한값 등의 제한값으로 결정될 수 있다. 상기 제한값은 특정 오브젝트에 대한 절대적인 게인 값에 해당할 수도 있고, 오브젝트간의 상대적인 게인 차이값에 해당할 수도 있다. 제한값이 절대적인 게인 값에 해당하는 경우, 예를 들어, 보컬 신호의 게인 조정 범위가 10dB 이내가 될 수 있다. 제한값이 상대적인 게인 차이값에 해당하는 경우, 예를들어, 보컬 신호의 게인 조정 범위가 피아노 신호를 기준으로 10dB 이내가 될 수 있다. 이런 경우, 보컬 신호만을 10dB 만큼 강조할 수도 있고, 또는 보컬 신호를 5dB 만큼 강조하고 피아노 신호를 5dB 만큼 억압할 수도 있다. 이러한 게인범위 정보(GI)는 시간 및 주파수 대역에 대해 불변하는 값일 수도 있지만, 시간별 서브밴드별로 변화할 수도 있다.
나아가, 게인범위 정보(GI)는 상대적인 게인 조정 연동 정보에 해당할 수 있 는데, 상대적인 게인 조정 연동 정보란, 특정 오브젝트가 강조되거나 억압되면 경우, 이에 따라 다른 오브젝트도 강조되거나 억압되어야 하는지에 관한 정보이다. 예를 들어, 보컬 신호와 백 코러스 신호의 경우, 보컬 신호가 10dB 강조되었을 때, 이에 따라 백 코러스 신호 또한 5∼15dB 가량 강조되어야 음질 왜곡이 줄어들 수 있다.
S150 단계에서 비율 정보(RI)는 각 오브젝트별 파라미터 세트별로 추출할 수 있고, 게인범위 정보(GI)는 각 오브젝트별로 주파수 해상도에 따라 추출할 수 있으나 본 발명은 이에 한정되지 아니한다.
한편, S150 단계에서 비율 정보(RI)만을 오디오 신호 비트스트림으로부터 추출하고, 게인범위 정보(GI)는 추출하지 않고 자체적으로 생성할 수도 있는데, 게인범위 정보(GI)의 생성에 있어서 추후 도 4 및 도 5 와 함께 설명된 방식이 이용될 수 있다.
정보 송수신부(112a)는 S150 단계에서 획득된 비율 정보(RI) 및 게인범위 정보(GI)를 사용자 인터페이스(200)를 통해 표시할 수 있다(S160 단계). 예를 들어, 보컬 신호가 다른 신호와 관계 신호인지, 보컬 신호의 게인 조정에 있어서 10dB 이상 조정할 경우 음질의 왜곡이 생길 수 있다는 등의 메시지를 사용자가 볼 수 있도록 화면에 표시할 수 있다. 그런 다음 사용자가 이러한 메시지를 확인한 후에, 오브젝트별 게인 조정에 관한 사용자 제어 정보를 사용자 인터페이스(200)를 통해 입력할 수 있다. 이때 사용자 제어 정보는 오브젝트 신호의 제한값(10dB)을 초과한 값(예: 20dB)이 입력되더라도, 제한값 이내로 강제적으로 조정될 수가 있고, 또는 제한값을 초과하더라도 사용자 제어정보(20dB)을 그대로 반영할 수 있다. 이때, S110 단계에서 수신된 믹스 정보(MXI)는 이러한 사용자 제어 정보를 근거로 생성된 것일 수 있다.
정보 변형부(114a)는 S150 단계에 획득된 비율 정보(RI) 및 게인범위 정보(GI)를 이용하여, S110 단계에서 획득된 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP) 중 하나 이상을 포함하는 파라미터 정보(PI)를 변형한다(S170 단계). 구체적으로, 우선 믹스 정보(MXI),비율 정보(RI)를 이용하여 게인범위 정보(GI)를 변형한 후, 변형된 게인범위 정보(GI)를 오브젝트 파라미터(OP)에 적용함으로써, 변형된 파라미터 정보(MPI)를 생성할 수 있으나, 본 발명은 이에 한정되지 아니한다. 상기 S170 단계는, S140 단계에서 추출된 주파수 해상도 정보를 근거로 수행될 수 있다. 구체적으로, S140 단계에서 추출된 주파수 해상도 정보에 따라, 각 주파수 대역에 해당하는 게인범위 정보를 추출하고, 해당 게인범위 정보를 전체 주파수 대역에 매핑시킨 후, 상기 S180 단계를 수행할 수 있다. 한편, 변형된 파라미터 정보(MPI)는 S110 단계에서 수신된 제 1 오브젝트 레벨 정보(OL1)와는 다른 제 2 오브젝트 레벨 정보(OL2)를 포함할 수 있다.
멀티채널 정보 생성부(116a)는 멀티채널 정보(MI)를 생성하는 데(S180 단계), 이 경우 S110 단계에서 전송된 제 1 오브젝트 레벨 정보(OL1)를 이용하여 멀티채널 정보(MI)를 생성할 수도 있고, S170 단계에서 생성 된 변형 파라미터 정보(MPI)의 제 2 오브젝트 레벨 정보(OL2)를 이용하여 멀티채널 정보(MI)를 생성할 수도 있다. 제 1 오브젝트 레벨 정보(OL1)를 이용하는 경우는 물론, 레벨 조정에 있 어서의 가이드가 적용되지 않는 경우이다.
도 4 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 다른 예이고, 도 5 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법의 순서를 보여주는 도면이다. 도 4 및 도 5 는 비율 정보(RI)를 디코더에서 자체적으로 생성하는 방식의 실시예에 해당하는 도면이다. 우선 도 4 를 참조하면, 정보 생성 유닛(110)은 정보 송수신부(112b), 정보 생성부(113b), 정보 변형부(114b), 및 멀티채널 정보 생성부(116b)를 포함한다. 이하, 도 4 및 도 5 를 함께 참조하면서, 각 구성요소 및 각 단계에 관하여 구체적으로 설명하고자 한다.
우선 정보 송수신부(112b)는 우선 오디오 신호 비트스트림으로부터 오브젝트 파라미터(OP)를 포함하는 오브젝트 정보(object information)(OI)를 수신하고, 사용자 인터페이스 등으로부터 컨트롤 파라미터(CP)를 포함하는 믹스 정보(mix information)(MXI)를 수신한다(S310 단계). 나아가 정보 송수신부(112b)는 인코더 가이드 정보(encoder guide information)(EGI)를 수신할 수 있다. 인코더 가이드 정보(EGI)란, 인코더에서 생성된 가이드 정보로서, 오브젝트의 게인 조정에 대한 범위를 포함하며, 오디오 신호 비트스트림을 통해 수신된 정보일 수 있다.
정보 생성부(113b)는 S110 단계에서 수신한 오브젝트 정보(OI)를 이용하여 비율 정보를 생성한다(S320 단계). 구체적으로, 오브젝트 정보(OI) 중 오브젝트 레벨 정보(OLI)를 이용하여 비율 정보(RI)를 생성할 수 있다. 여기서 비율 정보(RI)는, 메인신호 및 서브 신호간의 상대적인 비율에 해당할 수도 있고, 다른 오브젝트 신호(들)와의 레벨 정보 비율에 해당할 수도 있다. 다른 오브젝트 신호와의 레벨 정보의 비율이란 다음과 같이 정의될 수 있다.
[수학식 1]
여기서, OLDi 는 i 번째 오브젝트 신호의 오브젝트 레벨 정보, ODLk 는 다른 오브젝트 신호의 오브젝트 레벨 정보(k≠i)
한편, 다른 오브젝트 신호가 둘 이상일 경우, 비율 정보(RI)는 다른 오브젝트 신호들 전체와의 레벨 정보 비율에 해당할 수도 있는데, 이는 다음 수학식과 같이 정의될 수 있다.
[수학식 2]
여기서 OLDi는 i 번째 오브젝트 신호의 오브젝트 레벨 정보, N 은 총 오브젝트 신호 개수, k=0∼N (단, k≠i)
S320 단계에서 생성한 비율 정보(RI)를 이용하여 게인범위 정보(GI)를 생성한다(S330 단계). 여기서 게인범위 정보(GI)란, 도 2 및 도 3 과 함께 설명된 게인범위 정보(GI)와 마찬가지로 오브젝트의 게인 조정에 대한 범위를 포함할 수 있고, 상기 범위는 상한값 또는 하한값 등과 같은 제한값으로 결정될 수 있다. 이때, 상 기 제한값은, 특정 오브젝트에 대한 절대적인 게인 값에 해당할 수도 있고, 오브젝트간의 상대적인 게인 차이값에 해당할 수도 있다. 게인범위 정보(GI)는 시간 및 주파수 대역에 대해 불변하는 값일 수도 있지만, 시간별 서브밴드별로 변화할 수도 있다.
비율 정보(RI)를 이용하여 게인범위 정보(GI)를 생성하는 방식은 여러 가지 방법이 있을 수 있는데, OLDratio 가 매우 높은 경우, 게인범위 정보(GI)의 게인 제한값(Ggain)을 큰 값으로 결정할 수 있다. 왜냐하면, OLDratio 가 높은 경우, 큰 렌더링 자유도를 주어도 음질 왜곡이 적을 수 있기 때문이다. 예를 들어, 보컬 신호의 OLDratio (vocal)가 매우 높은 값일 경우, 보컬 신호에 대해서의 게인 제한값(Ggain)은 20dB 이 될 수도 있다. 보컬 신호의 OLDratio 가 피아노 신호에 대해서만 큰 값을 갖게 되면, 보컬 신호의 피아노 신호에 대한 게인 제한값(Ggain(back chorus))만 큰 값이 되도록 할 수 있다.
한편, 보다 정밀한 게인범위 정보(GI)를 생성하기 위해, 인코더에서 오브젝트 레벨 정보(OLD)를 생성할 때, 특정한 주파수 웨이팅을 부여할 수 있다. 예를 들어, 가장 낮은 주파수 대역에 해당하는 0 번째 밴드에 대해 특정 주파수를 강조하는 웨이팅이 부여된 필터를 이용하여 OLD 를 구한 후, 일반적인 방법으로 구한 OLD 와의 차분 정보를 부가 정보로 포함하는 것이 가능하다. 음성 신호 등의 경우, 이러한 차분 정보를 활용하여 게인범위 정보(GI)를 생성하는데 이용할 수 있다.
한편, S330 단계에서 게인범위 정보(GI)를 생성하는 데 있어서, 디폴트 가이드 정보(DGI), 유저 가이드 정보(UGI), 및 인코더 가이드 정보(EGI) 등이 이용될 수 있다. 디폴트 가이드 정보(default guide information)(DGI)는 디코더 자체에서 미리 정해진 가이드 정보를 뜻하고, 유저 가이드 정보(user guide information)(UGI)는 사용자 인터페이스(200)를 통해 입력된 가이드 정보에 해당하고, 인코더 가이드 정보(encoder guide information)(EGI)는 인코더에서 생성되어 오디오 비트스트림으로부터 추출된 가이드 정보에 해당한다. 게인범위 정보(GI)를 생성하는 데 있어서, 디폴트 가이드 정보(DGI), 유저 가이드 정보(UGI), 및 인코더 가이드 정보(EGI) 등을 참조할 수 있는데, 예를 들어, 오브젝트 레벨 정보만을 근거로 하여 특정 오브젝트의 게인 제한값(Ggain)을 10dB 으로 정할 수 있지만, 이때, 유저 가이드 정보(UGI)가 5dB 인 경우, 이러한 유저 가이드 정보(UGI)를 참조하여 게인범위 정보(GI)를 생성할 수 있는 것이다.
이와 같이 S320 단계에서 생성된 비율 정보(RI), 및 S330 단계에서 생성된 게인범위 정보(GI)는 앞서 설명된 S160 단계와 마찬가지로 사용자 인터페이스(200)를 통해 표시될 수 있다(S340 단계).
정보 변형부(114b)는 앞서 설명된 S170 단계와 마찬가지로, 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP)중 하나 이상을 포함하는 파라미터 정보(PI)를 변형한다(S350 단계).
그리고 멀티채널 정보 생성부(116b)는 역시 앞서 설명된 S190 단계와 마찬가 지로, 변형된 파라미터 정보(MPI)를 이용하여 멀티채널 정보(MI)를 생성한다(S360 단계).
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 오디오 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.
Claims (14)
- 오브젝트 정보를 이용하여 비율정보를 생성하는 단계;상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 및,상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 비율정보를 생성하는 단계는, 오브젝트 신호들의 오브젝트 레벨 정보를 이용하여 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 2 항에 있어서,상기 비율정보를 생성하는 단계는, 특정 오브젝트 신호의 오브젝트 레벨 정보, 및 다른 오브젝트 신호의 오브젝트 레벨 정보간의 비율을 이용하여 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 3 항에 있어서,상기 다른 오브젝트 신호의 오브젝트 레벨 정보는, 둘 이상의 다른 오브젝트 신호의 오브젝트 레벨 정보의 합인 것을 특징으로 하는 오디오 신호처리 방법.
- 제 1 항에 있어서,상기 게인범위 정보를 생성하는 단계는, 디폴트 가이드 정보, 유저 가이드 정보, 및 인코더 가이드 정보 중 하나 이상을 이용하여 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 게인 값, 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 게인범위 정보는, 시간별 서브밴드별로 변화하는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,메인 신호 및 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계를 더 포함하고,상기 비율정보는, 상기 메인 신호 및 상기 서브 신호간의 상대적인 비율을 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고,상기 믹스정보는, 오브젝트위치 정보, 오브젝트 게인 정보, 및 재생 환경정보 중 하나 이상을 근거로 생성된 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 오디오 신호는, 방송 신호를 통해 수신된 것을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 오디오 신호는, 디지털 매체를 통해 수신된 것을 특징으로 하는 오디오 신호 처리 방법.
- 오브젝트 정보를 이용하여 비율정보를 생성하는 단계;상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 및,상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
- 오브젝트 정보를 이용하여 비율정보를 생성하고, 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 정보 생성부; 및상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US88971507P | 2007-02-13 | 2007-02-13 | |
US60/889,715 | 2007-02-13 | ||
US2456208P | 2008-01-30 | 2008-01-30 | |
US61/024,562 | 2008-01-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20090115200A true KR20090115200A (ko) | 2009-11-04 |
Family
ID=39690253
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097018361A KR20090115200A (ko) | 2007-02-13 | 2008-02-13 | 오디오 신호 처리 방법 및 장치 |
KR1020097018360A KR20090122221A (ko) | 2007-02-13 | 2008-02-13 | 오디오 신호 처리 방법 및 장치 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097018360A KR20090122221A (ko) | 2007-02-13 | 2008-02-13 | 오디오 신호 처리 방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20100119073A1 (ko) |
EP (2) | EP2118886A4 (ko) |
JP (2) | JP2010518452A (ko) |
KR (2) | KR20090115200A (ko) |
CN (2) | CN101627425A (ko) |
WO (2) | WO2008100068A1 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
KR101137361B1 (ko) * | 2009-01-28 | 2012-04-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
ES2793958T3 (es) * | 2009-08-14 | 2020-11-17 | Dts Llc | Sistema para trasmitir adaptativamente objetos de audio |
RU2607266C2 (ru) * | 2009-10-16 | 2017-01-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и компьютерная программа для формирования с использованием среднего значения параметров сигнала, подстроенных для обеспечения представления микшированного с повышением сигнала на базе представления микшированного с понижением сигнала и параметрической сторонней информации, связанной с представлением микшированного с понижением сигнала |
PL2491551T3 (pl) | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Urządzenie do dostarczania reprezentacji sygnału upmixu w oparciu o reprezentację sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, program komputerowy i strumień bitów wykorzystujący sygnalizację sterowania zniekształceniami |
AU2010321013B2 (en) * | 2009-11-20 | 2014-05-29 | Dolby International Ab | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter |
CN102696070B (zh) * | 2010-01-06 | 2015-05-20 | Lg电子株式会社 | 处理音频信号的设备及其方法 |
EP2717261A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
JP5591423B1 (ja) | 2013-03-13 | 2014-09-17 | パナソニック株式会社 | オーディオ再生装置およびオーディオ再生方法 |
TWI505724B (zh) * | 2013-06-10 | 2015-10-21 | Princeton Technology Corp | 增益控制系統、聲音播放系統及其增益控制之方法 |
JP6683618B2 (ja) * | 2014-09-08 | 2020-04-22 | 日本放送協会 | 音声信号処理装置 |
CA3149389A1 (en) * | 2015-06-17 | 2016-12-22 | Sony Corporation | Transmitting device, transmitting method, receiving device, and receiving method |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5128597A (en) * | 1990-06-14 | 1992-07-07 | Kabushiki Kaisha Tokai-Rika-Denki-Seisakusho | Control apparatus for power window regulator |
US6141446A (en) * | 1994-09-21 | 2000-10-31 | Ricoh Company, Ltd. | Compression and decompression system with reversible wavelets and lossy reconstruction |
US5838664A (en) * | 1997-07-17 | 1998-11-17 | Videoserver, Inc. | Video teleconferencing system with digital transcoding |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6026168A (en) * | 1997-11-14 | 2000-02-15 | Microtek Lab, Inc. | Methods and apparatus for automatically synchronizing and regulating volume in audio component systems |
WO1999053479A1 (en) * | 1998-04-15 | 1999-10-21 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Fast frame optimisation in an audio encoder |
US6122619A (en) * | 1998-06-17 | 2000-09-19 | Lsi Logic Corporation | Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor |
US7103187B1 (en) * | 1999-03-30 | 2006-09-05 | Lsi Logic Corporation | Audio calibration system |
WO2002007481A2 (en) * | 2000-07-19 | 2002-01-24 | Koninklijke Philips Electronics N.V. | Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
WO2004080125A1 (en) * | 2003-03-04 | 2004-09-16 | Nokia Corporation | Support of a multichannel audio extension |
US6937737B2 (en) * | 2003-10-27 | 2005-08-30 | Britannia Investment Corporation | Multi-channel audio surround sound from front located loudspeakers |
TWI233091B (en) * | 2003-11-18 | 2005-05-21 | Ali Corp | Audio mixing output device and method for dynamic range control |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
KR100663729B1 (ko) * | 2004-07-09 | 2007-01-02 | 한국전자통신연구원 | 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
JP2006337767A (ja) * | 2005-06-02 | 2006-12-14 | Matsushita Electric Ind Co Ltd | 低演算量パラメトリックマルチチャンネル復号装置および方法 |
US8081764B2 (en) * | 2005-07-15 | 2011-12-20 | Panasonic Corporation | Audio decoder |
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
AU2007271532B2 (en) * | 2006-07-07 | 2011-03-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for combining multiple parametrically coded audio sources |
-
2008
- 2008-02-13 CN CN200880004888A patent/CN101627425A/zh active Pending
- 2008-02-13 EP EP08722947A patent/EP2118886A4/en not_active Withdrawn
- 2008-02-13 KR KR1020097018361A patent/KR20090115200A/ko not_active Application Discontinuation
- 2008-02-13 WO PCT/KR2008/000837 patent/WO2008100068A1/en active Application Filing
- 2008-02-13 JP JP2009549520A patent/JP2010518452A/ja active Pending
- 2008-02-13 CN CN200880010500A patent/CN101647060A/zh active Pending
- 2008-02-13 JP JP2009550086A patent/JP2010518460A/ja active Pending
- 2008-02-13 WO PCT/KR2008/000836 patent/WO2008100067A1/en active Application Filing
- 2008-02-13 US US12/527,153 patent/US20100119073A1/en not_active Abandoned
- 2008-02-13 EP EP08722946A patent/EP2111618A4/en not_active Withdrawn
- 2008-02-13 KR KR1020097018360A patent/KR20090122221A/ko not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
EP2118886A1 (en) | 2009-11-18 |
EP2111618A4 (en) | 2010-04-21 |
KR20090122221A (ko) | 2009-11-26 |
US20100119073A1 (en) | 2010-05-13 |
EP2111618A1 (en) | 2009-10-28 |
EP2118886A4 (en) | 2010-04-21 |
CN101647060A (zh) | 2010-02-10 |
CN101627425A (zh) | 2010-01-13 |
JP2010518460A (ja) | 2010-05-27 |
WO2008100067A1 (en) | 2008-08-21 |
JP2010518452A (ja) | 2010-05-27 |
WO2008100068A1 (en) | 2008-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20090115200A (ko) | 오디오 신호 처리 방법 및 장치 | |
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
KR101100221B1 (ko) | 오디오 신호의 디코딩 방법 및 그 장치 | |
KR101137361B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
US8577482B2 (en) | Device and method for generating an ambience signal | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
KR101100213B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
CA2908794C (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
KR20100063092A (ko) | 오디오 신호의 디코딩 방법 및 장치 | |
TWI468031B (zh) | 用以產生供提供額外輸出聲道的立體音響輸出信號之裝置、方法及電腦程式 | |
KR20100084319A (ko) | 후방향 오디오 채널의 적응적 리마스터링 장치 및 방법 | |
JP2010118978A (ja) | 音像定位制御装置および音像定位制御方法 | |
US20100121470A1 (en) | Method and an apparatus for processing an audio signal | |
JP2010118977A (ja) | 音像定位制御装置および音像定位制御方法 | |
KR20130054963A (ko) | 다운워드 호환가능 사운드 포맷을 제작하기 위한 방법 및 디바이스 | |
Uhle | Center signal scaling using signal-to-downmix ratios | |
JP2015065551A (ja) | 音声再生システム | |
JP2018101824A (ja) | マルチチャンネル音響の音声信号変換装置及びそのプログラム | |
JP2013126116A (ja) | オーディオ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |