KR20070056081A - 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 - Google Patents

스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 Download PDF

Info

Publication number
KR20070056081A
KR20070056081A KR1020077004878A KR20077004878A KR20070056081A KR 20070056081 A KR20070056081 A KR 20070056081A KR 1020077004878 A KR1020077004878 A KR 1020077004878A KR 20077004878 A KR20077004878 A KR 20077004878A KR 20070056081 A KR20070056081 A KR 20070056081A
Authority
KR
South Korea
Prior art keywords
signal
sign
monaural
channel
stereo
Prior art date
Application number
KR1020077004878A
Other languages
English (en)
Inventor
미치요 고토
춘 웨이 테오
수아 홍 네오
고지 요시다
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070056081A publication Critical patent/KR20070056081A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals

Abstract

낮은 비트 레이트로 재현성이 좋은 스테레오 신호를 얻을 수 있는 스테레오 신호 생성 장치. 이 스테레오 신호 생성 장치(90)에서는, FT부(901)가, 시간 영역의 모노럴 신호 M't를 주파수 영역의 모노럴 신호 M'로 변환하고, 전력 스펙트럼 연산부(902)가, 전력 스펙트럼 PM'을 구하고, 스케일링비 산출부(904a)가, 왼쪽 채널에 대한 스케일링비 SL를 구하고, 스케일링비 산출부(904b)가, 오른쪽 채널에 대한 스케일링비 SR를 구하고, 곱셈부(905a)가, 주파수 영역의 모노럴 신호 M'에 스케일링비 SL를 곱셈하여 스테레오 신호의 왼쪽 채널 신호 L"를 생성하고, 곱셈부(905b)가, 주파수 영역의 모노럴의 신호 M'에 스케일링비 SR를 곱셈하여 스테레오 신호의 오른쪽 채널 신호 R"를 생성한다.

Description

스테레오 신호 생성 장치 및 스테레오 신호 생성 방법{STEREO SIGNAL GENERATING APPARATUS AND STEREO SIGNAL GENERATING METHOD}
본 발명은, 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법에 관한 것으로서, 특히, 모노럴 신호 및 신호 파라미터로부터 스테레오 신호를 생성하는 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법에 관한 것이다.
대부분의 음성 코덱에서는, 음성의 모노럴 신호만을 부호화한다. 모노럴의 음성은 스테레오처럼 공간 정보를 제공하지 않는다. 그러한 모노럴 코덱은, 신호가, 예를 들면, 인간의 발성 등의 단일 소스로부터 생성되는, 휴대 전화 및 텔레컨퍼런스(tele-conference/전화 회의) 기기 등의 통신 기기에 있어서 일반적으로 이용된다. 종래에는 송신 대역폭의 제약으로 인해, 그러한 모노럴의 신호로도 충분했다. 하지만, 기술 진보에 의해 대역폭이 개선됨에 따라, 이 제약은, 점차 중요성을 갖지 못하는 것이 되고 있다. 한편, 음성 품질은, 고려해야 할 보다 중요한 요소가 되고 있어, 가능한 한 낮은 비트 레이트로, 높은 품질의 음성을 제공하는 것이 중요해지고 있다.
여기서, 스테레오 기능은, 지각(知覺)되는 음성 품질을 개선하는데 도움이 된다. 스테레오 기능의 용도의 하나로서는, 동시에 복수의 발화자가 존재하는 상황에 있어서, 발화자의 위치를 식별할 수 있는, 고품질 텔레컨퍼런스 기기가 있다.
현재, 스테레오 음성 코덱은, 스테레오 오디오 코덱에 비해, 그다지 일반적이지는 않다. 오디오 부호화에서는, 여러 가지 방법으로 입체 음향 부호화를 실현할 수 있어, 오디오 부호화에 있어서 스테레오 기능은 표준이라고 생각되고 있다. 좌우 두 개의 채널을 독립적으로 듀얼 모노(dual mono)로서 부호화함으로써, 스테레오 효과를 실현할 수 있다. 또, 좌우 두 개의 채널간의 용장성(冗長性)을 이용하여, 조인트 스테레오(joint stereo)로서 부호화할 수도 있고, 이에 의해 좋은 품질을 유지하면서, 비트 레이트를 저감할 수 있다. 조인트 스테레오는, 미들사이드(Middle Side Stereo)(MS) 스테레오 및 인텐시티(I) 스테레오를 이용하여 행할 수 있다. 이들 두 가지 방법을 합쳐서 이용함으로써, 보다 높은 압축률을 실현할 수 있다.
이들 오디오 부호화에는, 이하와 같은 단점이 있다. 즉, 좌우의 채널을 독립하여 부호화할 경우, 채널간의 상관 용장성을 이용한 비트레이트의 저감이 되지 않기 때문에, 대역폭이 낭비되어 버린다. 따라서, 스테레오 채널은, 모노럴 채널에 비해, 2배의 비트레이트를 필요로 한다.
또, MS 스테레오에서는, 스테레오 채널간의 상관성을 이용한다. MS 스테레오에서는, 협대역폭 송신을 위해 낮은 비트 레이트로 부호화가 이루어질 때는, 에일리어싱(aliasing) 왜곡이 발생하기 쉬우며, 신호의 스테레오 이미징도 영향을 받 는다.
또, I 스테레오에 대해서는, 인간의 청각 계통이 고주파수 성분을 분해하는 능력이 고주파 영역에서 저하하기 때문에, I 스테레오는 고주파 영역에 있어서만 효과적이고, 저주파 영역에서는 효과적이지 않다.
또, 대부분의 음성 코덱은, 선형 예측법의 변형을 이용한 파라미터에 의해 인간의 성도(聲道)를 모델화하여 기능하는, 파라미터릭 부호화라고 생각되고 있어, 조인트 스테레오 방법도 역시, 스테레오 음성 코덱에는 적합하지 않다.
여기에, 오디오 코덱에 유사한 음성 코덱 방법의 하나에, 스테레오 음성의 각 채널을 독립적으로 부호화하고, 이것을 이용하여 스테레오 효과를 실현하는 것이 있다. 그러나, 이 코덱 방법에는, 모노럴 소스만을 부호화하는데에 비해 2배의 대역폭을 사용한다고 하는 오디오 코덱의 단점과 동일한 단점이 있다.
또 다른 음성 코덱 방법으로서는, 크로스 채널 예측을 이용하는 것이 있다 (예를 들면, 비특허문헌 1 참조). 이 방법에서는, 입체 음향 신호에 채널간 상관이 존재하는 것을 이용하여, 입체 음향 채널간의 강도차(强度差), 지연차(遲延差) 및 공간차(空間差) 등의 용장성을 모델화한다.
또, 다른 음성 코덱 방법으로서 파라미터릭 공간 오디오를 이용한 방법이 있다(예를 들면, 특허문헌 1 참조). 이 방법의 기본적인 생각은, 파라미터 세트를 이용하여, 음성 신호를 표현하는 것이다. 음성 신호를 표현하는 이러한 파라미터는, 원음과 지각적(知覺的)으로 유사한 신호를 재합성하기 위하여 복호측에서 이용된다. 이 방법에 있어서는, 대역을 서브밴드라고 불리는 다수의 주파수대로 분할 한 후, 파라미터는 대역마다 계산된다. 각 서브밴드는, 몇 개의 주파수 성분 또는 대역 계수로 되며, 성분의 수는, 보다 높은 주파수 서브밴드일수록 증가한다. 예를 들면, 각 서브밴드에 대해 계산되는 파라미터의 하나는, 채널간 레벨차이다. 이 파라미터는, 왼쪽 채널(L 채널)과 오른쪽 채널(R 채널)간의 전력비이다. 이 채널간 레벨차는, 복호 측에 있어서, 대역 계수를 수정하는데 이용된다. 각 서브밴드에 대해서 하나의 채널간 레벨차가 계산되므로, 동일한 채널간 레벨차가 해당 서브밴드에 있어서의 모든 대역 계수에 대해서 적용된다. 이것은, 서브밴드에 있어서의 모든 대역 계수에 대해서 동일한 변경 계수가 적용됨을 의미한다.
(특허문헌 1) 국제 공개 제 03/090208호 팜플렛
(비특허문헌 1) Ramprashad, S. A., "Stereophonic CELP coding using Cross Channel Prediction" Proc. IEEE Workshop on Speech Coding, Pages: 136-138, (17-20 Sept. 2000)
(발명이 해결하고자 하는 과제)
그렇지만, 상기의 크로스 채널 예측을 이용한 음성 코덱 방법에서는, 복잡한 시스템에 있어서 채널간의 용장성을 잃고, 그로 말미암아 크로스 채널 예측의 효과가 감소되어 버린다. 따라서, 이 방법은, ADPCM과 같은 간단한 코덱에 적용되는 경우에만 효과적이다.
또, 상기의 파라미터릭 공간 오디오를 이용한 음성 코덱 방법에서는, 서브밴드마다 1개의 채널간 레벨차를 이용함에 의한 결과, 비트레이트는 보다 낮은 것이 되기는 하지만, 복호측에서는, 주파수 성분에 걸쳐 레벨 변경의 조정이 꽤 조잡한 것이 되어 버려 재현성(再現性)이 저하한다.
본 발명의 목적은, 낮은 비트레이트로 재현성 좋은 스테레오 신호를 얻을 수 있는 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법을 제공하는 것이다.
(과제를 해결하기 위한 수단)
본 발명의 스테레오 신호 생성 장치는, 스테레오 신호의 좌우 각 채널의 신호로부터 얻어진 시간 영역의 모노럴 신호를 주파수 영역의 모노럴 신호로 변환하는 변환 수단과, 상기 주파수 영역의 모노럴 신호의 제 1 전력 스펙트럼을 구하는 전력 산출 수단과, 상기 제 1 전력 스펙트럼과 상기 스테레오 신호의 왼쪽 채널의 전력 스펙트럼의 제 1의 차(差)로부터 상기 왼쪽 채널에 대한 제 1의 스케일링비(scaling比)를 구함과 동시에, 상기 제 1 전력 스펙트럼과 상기 스테레오 신호의 오른쪽 채널 전력 스펙트럼과의 제 2의 차(差)로부터 상기 오른쪽 채널에 대한 제 2의 스케일링비를 구하는 스케일링비 산출 수단과, 상기 주파수 영역의 모노럴 신호에 상기 제 1의 스케일링비를 곱셈하여 상기 스테레오 신호의 왼쪽 채널 신호를 생성함과 동시에, 상기 주파수 영역의 모노럴 신호에 상기 제 2의 스케일링비를 곱셈하여 상기 스테레오 신호의 오른쪽 채널 신호를 생성하는 곱셈 수단을 구비하는 구성을 취한다.
(발명의 효과)
본 발명에 의하면, 낮은 비트 레이트로 재현성 좋은 스테레오 신호를 얻을 수 있다.
도 1은 본 발명의 한 실시예에 따른 전력 스펙트럼 플롯 도면,
도 2는 상기 실시예에 따른 전력 스펙트럼 플롯 도면,
도 3은 상기 실시예에 따른 전력 스펙트럼 플롯 도면,
도 4는 상기 실시예에 따른 전력 스펙트럼 플롯 도면,
도 5는 상기 실시예에 따른 스테레오 신호의 프레임의 전력 스펙트럼 플롯 도면(L 채널),
도 6은 상기 실시예에 따른 스테레오 신호의 프레임의 전력 스펙트럼 플롯 도면(R 채널),
도 7은 상기 실시예에 따른 부호화/복호 시스템의 구성을 나타내는 블록도,
도 8은 상기 실시예에 따른 LPC 분석부의 구성을 나타내는 블록도,
도 9는 상기 실시예에 따른 전력 스펙트럼 연산부의 구성을 나타내는 블록도,
도 10은 상기 실시예에 따른 스테레오 신호 생성 장치의 구성을 나타내는 블록도,
도 11은 상기 실시예에 따른 스테레오 신호 생성 장치의 다른 구성을 나타내 는 블록도,
도 12는 상기 실시예에 따른 전력 스펙트럼 연산부의 구성을 나타내는 블록도,
도 13은 상기 실시예에 따른 LPC 분석부의 다른 구성을 나타내는 블록도,
도 14는 상기 실시예에 따른 전력 스펙트럼 연산부의 다른 구성을 나타내는 블록도이다.
본 발명에서는, 모노럴 신호 및 스테레오 소스로부터의 LPC 파라미터 세트를 이용하여, 스테레오 신호를 생성한다. 본 발명에서는, L 채널 및 R 채널의 전력 스펙트럼 포락선(envelope) 및 모노럴 신호를 이용하여, L 채널 및 R 채널의 스테레오 신호를 생성한다. 전력 스펙트럼 포락선은, 각 채널의 에너지 분산에 대한 근사치(近似値)로서 생각할 수 있다. 따라서, 모노럴 신호에 더해, L 채널 및 R 채널의 근사화된 에너지 분산을 이용하여, L 채널 및 R 채널의 신호를 생성할 수 있다. 모노럴 신호는, 표준적인 음성 부호기/복호기 또는 오디오 부호기/복호기를 이용하여, 부호화 및 복호할 수 있다. 본 발명에서는, LPC 분석의 프로퍼티(property)를 이용하여 스펙트럼 포락선을 계산한다. 신호 전력 스펙트럼 P의 포락선은, 이하의 수학식 1에 나타내는 바와 같이, 전극 필터의 전달 함수 H(z)를 플롯함으로써 얻어진다.
Figure 112007017266474-PCT00001
여기서, ak는 LPC 계수이며, G는 LPC 분석 필터의 게인이다.
위의 수학식 1을 이용한 플롯의 예를, 도 1~도 6에 나타낸다. 점선은, 실제의 신호 전력을 나타내며, 실선은, 위의 수학식 1을 이용해 얻어진 신호 전력의 포락선을 나타낸다.
도 1~도 4는, 필터 차수 P=20에 있어서, 다른 특성의 신호의 몇가지 프레임에 대한 전력 스펙트럼 플롯을 나타낸다. 도 1~도 4로부터, 포락선이, 주파수간에 걸쳐서, 신호 전력의 상승, 하강, 또는 그 추이선에 상당히 충실하게 따르고 있음을 알 수 있다.
또, 도 5 및 도 6은, 스테레오 신호의 프레임의 전력 스펙트럼 플롯을 나타낸다. 도 5는 L 채널의 포락선을 나타내며, 도 6은 R 채널의 포락선을 나타낸다. 도 5 및 도 6으로부터, L 채널의 포락선과 R 채널의 포락선이, 서로 다르다는 것을 알 수 있다.
따라서, 스테레오 신호의 L 채널 신호와 R 채널 신호는, L 채널과 R 채널의 전력 스펙트럼 및 모노럴 신호에 기초하여 구성할 수 있다. 따라서, 본 발명에서는, 모노럴 신호에 더해, 스테레오 소스로부터의 LPC 파라미터만을 이용하여 스테레오 출력 신호를 생성한다. 모노럴 신호는, 표준적인 부호기를 이용하여 부호화 할 수 있다. 한편, LPC 파라미터는 부가 정보로서 송신되기 때문에, LPC 파라미터의 송신에는, 부호화된 L 채널 신호와 R 채널 신호를 독립적으로 송신하는 경우에 비해, 상당히 적은 대역폭밖에 필요로 하지 않는다. 또, 본 발명에서는, L 채널과 R 채널의 전력 스펙트럼을 이용하여, 각 주파수 성분 또는 대역 계수를 수정, 조정하는 것이 가능하게 된다. 이로 말미암아, 비트레이트에 부담을 주는 일 없이, 각 주파수 성분에 걸쳐서 스펙트럼 레벨의 섬세한 조정을 할 수 있다.
이하, 본 발명의 실시예에 대해서 도면을 이용하여 상세히 설명한다.
도 7에, 본 발명의 한 실시예에 따른 부호화/복호 시스템의 구성을 나타낸다. 도 7에 있어서, 부호화 장치는, 다운믹스부(10), 부호화부(20), LPC 분석부(30) 및 다중화부(40)를 포함하여 구성된다. 또, 복호 장치는, 분리부(60), 복호부(70), 전력 스펙트럼 연산부(80) 및 스테레오 신호 생성 장치(90)를 포함하여 구성된다. 또한, 부호화 장치에 입력되는 L 채널 신호 L과 R 채널 신호 R은, 이미 디지털 포맷이 되어 있는 것으로 한다.
부호화 장치에 있어서, 다운믹스부(10)는, 입력되는 L 신호와 R 신호를 다운믹스하여 시간 영역의 모노럴 신호(M)를 생성한다. 부호화부(20)는, 모노럴 신호(M)를 부호화하여 다중화부(40)에 출력한다. 또한, 부호화부(20)는, 오디오 부호기 또는 음성 부호화기의 어느 것이라도 좋다.
한편, LPC 분석부(30)는, L 신호와 R 신호를 LPC 분석을 이용하여 분석하여 L 채널과 R 채널 각각에 대한 LPC 파라미터를 구하여, 다중화부(40)에 출력한다.
다중화부(40)는, 부호화된 모노럴 데이터와 LPC 파라미터를 다중한 비트스트 림을 통신로(50)를 경유하여 복호 장치에 송신한다.
복호 장치에 있어서, 분리부(60)는, 수신한 비트스트림을 모노럴 데이터와 LPC 파라미터로 분리한다. 모노럴 데이터는 복호부(70)에 입력되고, LPC 파라미터는 전력 스펙트럼 연산부(80)에 입력된다.
복호부(70)는, 모노럴 데이터를 복호한다. 이에 의해, 시간 영역의 모노럴 신호M't가 얻어진다. 시간 영역의 모노럴 신호(M't)는, 스테레오 신호 생성 장치(90)에 입력됨과 동시에, 복호 장치로부터 출력된다.
전력 스펙트럼 연산부(80)는, 입력되는 LPC 파라미터를 이용하여, L 채널과 R 채널의 전력 스펙트럼 PL, PR을 구한다. 여기서 구해지는 전력 스펙트럼의 플롯은, 도 5 및 도 6에 나타내는 바와 같이 된다. 전력 스펙트럼 PL, PR은, 스테레오 신호 생성 장치(90)에 입력된다.
스테레오 신호 생성 장치(90)는, 이러한 3개의 파라미터, 즉, 시간 영역의 모노럴의 신호 M't, 전력 스펙트럼 PL, PR을 이용하여, 스테레오 신호 L', R'를 생성하여 출력한다.
다음에, 도 8을 이용하여, LPC 분석부(30)의 구성에 대해 설명한다. LPC 분석부(30)는, L 채널용의 LPC 분석부(301a) 및 R 채널용의 LPC 분석부(301b)를 포함하여 구성된다.
LPC 분석부(301a)는, L 채널 신호 L의 전부의 입력 프레임에 대해서 LPC 분 석을 행한다. 이 LPC 분석에 의해, LPC 계수 aL ,k 및 LPC 게인 GL(k=1, 2, …, P:P는 LPC 필터의 차수)이 L 채널의 LPC 파라미터로서 얻어진다.
또, LPC 분석부(301b)는, R 채널 신호 R의 전부의 입력 프레임에 대해서 LPC 분석을 행한다. 이 LPC 분석에 의해, LPC 계수 aR ,k 및 LPC 게인 GR(k=1, 2, …, P:P는 LPC 필터의 차수)이 R 채널의 LPC 파라미터로서 얻어진다.
L 채널의 LPC 파라미터 및 R 채널의 LPC 파라미터는 다중화부(40)에서 모노럴 데이터와 다중되어 비트스트림이 생성된다. 이 비트스트림은, 통신로(50)를 경유하여 복호 장치에 송신된다.
다음에, 도 9를 이용해, 전력 스펙트럼 연산부(80)의 구성에 대해 설명한다. 전력 스펙트럼 연산부(80)는, 임펄스(inpulse) 응답 형성부(801a, 801b), FT(주파수 변환)부(802a, 802b), 대수(對數) 연산부(803a, 803b)를 포함하여 구성된다. 전력 스펙트럼 연산부(80)에는, 비트스트림이 분리부(60)에서 분리됨으로써 얻어진 각 채널의 LPC 파라미터(즉, LPC 계수 aL ,k、aR ,k) 및 LPC 게인 GL、GR이 입력된다.
L 채널에 대해서는, 임펄스 응답 형성부(801a)가, LPC 계수 aL ,k 및 LPC 게인 GL을 이용하여 임펄스 응답 hL(n)을 형성하여 FT부(802a)에 출력한다. FT부(802a)는, 임펄스 응답 hL(n)을 주파수 영역으로 변환하고 전달 함수 HL(z)를 얻는다. 따라서, 전달 함수 HL(z)는, 이하의 수학식 2로 표시된다.
Figure 112007017266474-PCT00002
대수 연산부(803a)는, 전달 함수 응답 HL(z)의 대수 진폭을 구하여 플롯한다. 이렇게 함으로써, L 채널 신호의 근사화된 전력 스펙트럼 PL의 포락선이 얻어진다. 전력 스펙트럼 PL는, 이하의 수학식 3으로 표시된다.
Figure 112007017266474-PCT00003
한편, R 채널에 대해서는, 임펄스 응답 형성부(801b)가, LPC 계수 aR ,k 및 LPC 게인 GR을 이용하여 임펄스 응답 hR(n)을 형성하여 FT부(802b)에 출력한다. FT부(802b)는, 임펄스 응답 hR(n)을 주파수 영역으로 변환하고 전달 함수 HR(z)를 얻는다. 따라서, 전달 함수 HR(z)는, 이하의 수학식 4로 표시된다.
Figure 112007017266474-PCT00004
대수 연산부(803b)는, 전달 함수 응답 HR(z)의 대수 진폭을 구하여 플롯한다. 이렇게 함으로써, R 채널 신호의 근사화된 전력 스펙트럼 PR의 포락선이 얻어진다. 전력 스펙트럼 PR은, 이하의 수학식 5로 표시된다.
Figure 112007017266474-PCT00005
L 채널의 전력 스펙트럼 PL 및 R 채널의 전력 스펙트럼 PR 은 스테레오 신호 생성 장치(90)에 입력된다. 또, 스테레오 신호 생성 장치(90)에는, 복호부(70)에서 복호된 시간 영역의 모노럴 신호 M't가 입력된다.
다음에, 도 10을 이용하여, 스테레오 신호 생성 장치(90)의 구성에 대해 설명한다. 스테레오 신호 생성 장치(90)에는, 시간 영역의 모노럴 신호 M't , L 채널의 전력 스펙트럼 PL 및 R 채널의 전력 스펙트럼 PR이 입력된다.
FT(주파수 변환)부(901)는, 시간 영역의 모노럴의 신호 M't를, 주파수 변환 함수를 이용하여 주파수 영역의 모노럴 신호 M'로 변환한다. 또한, 이 이후의 설명에서는, 특히 명기하지 않는 한, 모든 신호 및 연산은, 주파수 영역에서의 것으로 한다.
전력 스펙트럼 연산부(902)는, 모노럴 신호 M'가 제로(0)가 아닌 경우, 모노럴 신호 M'의 전력 스펙트럼 PM'을 이하의 수학식 6에 따라 구한다. 또한, 모노럴 신호 M'가 제로인 경우, 전력 스펙트럼 연산부(902)는, 전력 스펙트럼 PM'을 제로로 설정한다.
Figure 112007017266474-PCT00006
감산부(903a)는, 모노럴 신호 M'가 제로가 아닌 경우, L 채널의 전력 스펙트럼 PL과 모노럴 신호의 전력 스펙트럼 PM'과의 차(差) DPL를 이하의 수학식 7에 따라 구한다. 또한, 모노럴 신호 M'가 제로인 경우, 감산부(903a)는, 차분값 DPL을 제로로 설정한다.
Figure 112007017266474-PCT00007
스케일링비 산출부(904a)는, 차분값 DPL을 이용하여, 이하의 수학식 8에 따라 L 채널에 대한 스케일링비 SL를 구한다. 따라서, 모노럴 신호 M'가 제로인 경우, 스케일링비 SL는 1로 설정된다.
Figure 112007017266474-PCT00008
한편, 감산부(903b)는, 모노럴의 신호 M'가 제로가 아닌 경우, R 채널의 전력 스펙트럼 PR과 모노럴 신호의 전력 스펙트럼 PM'과의 차 DPR를 이하의 수학식 9에 따라 구한다. 또한, 모노럴 신호M'가 제로인 경우, 감산부(903a)는, 차분값 DPR을 제로로 설정한다.
Figure 112007017266474-PCT00009
스케일링비 산출부(904b)는, 차분값 DPR을 이용하여, 이하의 수학식 10에 따라 R 채널에 대한 스케일링비 SR를 구한다. 따라서, 모노럴 신호 M'가 제로인 경우, 스케일링비 SR는 1로 설정된다.
Figure 112007017266474-PCT00010
곱셈부(905a)는, 이하의 수학식 11에 나타내는 바와 같이, 모노럴 신호 M'와 L 채널에 대한 스케일링비 SL를 곱셈한다. 또, 곱셈부(905b)는, 이하의 수학식 12에 나타내는 바와 같이, 모노럴 신호 M'와 R 채널에 대한 스케일링비 SR를 곱셈한다. 이러한 곱셈에 의해, 스테레오 신호의 L 채널 신호 L"와 R 채널 신호 R"이 생성된다.
Figure 112007017266474-PCT00011
Figure 112007017266474-PCT00012
곱셈부(905a)에서 얻어진 L 채널 신호 L" 및 곱셈부(905b)에서 얻어진 R 채널 신호 R"는, 신호의 크기에 대해서는 정상적이지만, 정(正/plus) 부(負/minus)의 부호가 올바르지 않은 경우도 있다. 따라서, 이 단계에서 L 채널 신호 L" 및 R 채널 신호 R"를 최종적인 출력 신호로 하면 재현성이 나쁜 스테레오 신호를 출력해 버리는 일이 있다. 그래서, 부호 결정부(100)가, 이하의 처리를 행하여, L 채널 신호 L" 및 R 채널 신호 R"의 올바른 부호를 결정한다.
우선, 가산(加算)부(906a) 및 제산(除算)부(907a)를 이용하여, 이하의 수학식 13에 따라, 합(合)신호 Mi를 구한다. 가산부(906a)가, L 채널 신호 L"와 R 채널 신호 R"를 가산하고, 그 가산 결과를 제산부(907a)가 2로 나눈다.
Figure 112007017266474-PCT00013
또, 감산부(906b) 및 제산부(907b)를 이용하여, 이하의 수학식 14에 따라, 차(差)신호 Mo를 구한다. 감산부(906a)가, L 채널 신호 L"와 R 채널 신호 R"의 차를 구하고, 그 감산 결과를 제산부(907b)가 2로 나눈다.
Figure 112007017266474-PCT00014
다음에, 절대값 산출부(908a)가, 합신호 Mi의 절대값을 구하고, 감산부(910a)가, 절대값 산출부(909)에서 산출되는 모노럴 신호 M'의 절대값과 합신호 Mi의 절대값의 차(差)를 구하고, 절대값 산출부(911a)가, 절대값 산출부(910a)에서 산출된 차분값의 절대값 DMi을 구한다. 따라서, 절대값 산출부(911a)에서 산출되는 절대값 DMi은, 이하의 수학식 15에 의해 표시된다. 이 절대값 DMi은, 비교부(915)에 입력된다.
Figure 112007017266474-PCT00015
마찬가지로, 절대값 산출부(908b)가, 차신호 Mo의 절대값을 구하고, 감산부(910b)가, 절대값 산출부(909)에서 산출되는 모노럴 신호 M'의 절대값과 차신호 Mo의 절대값의 차(差)를 구하고, 절대값 산출부(911b)가, 절대값 산출부(910b)에서 산출된 차분값의 절대값 DMo을 구한다. 따라서, 절대값 산출부(911b)에서 산출되는 절대값 DMo은, 이하의 수학식 16에 의해 표시된다. 이 절대값 DMo는, 비교부(915)에 입력된다.
Figure 112007017266474-PCT00016
한편, 모노럴 신호 M'의 정 부의 부호가 판정부(912)에서 판정되어, 판정 결과 SM'가 비교부(915)에 입력된다. 또, 합신호 Mi의 정 부의 부호가 판정부(913a)에서 판정되어 판정 결과 SMi가 비교부(915)에 입력된다. 또, 차신호 Mo의 정 부의 부호가 판정부(913b)에서 판정되어 판정 결과 SMo가 비교부(915)에 입력된다. 또, 곱셈부(905a)에서 얻어진 L 채널 신호 L"가 그대로 비교부(915)에 입력됨과 동시에, 그 L 채널 신호 L"의 부호가 반전부(914a)에서 반전되어 -L"이 되어 비교부(915)에 입력된다. 또, 곱셈부(905b)에서 얻어진 R 채널 신호 R"이 그대로 비교 부(915)에 입력됨과 동시에, 그 R 채널 신호 R"의 부호가 반전부(914b)에서 반전되어 -R"이 되어 비교부(915)에 입력된다.
비교부(915)는, 이하의 비교에 기초하여 L 채널 신호 L" 및 R 채널 신호 R"의 올바른 부호를 결정한다.
비교부(915)에서는, 우선, 절대값(DMi)과 절대값(DMo)의 사이에서 비교가 행해진다. 그리고, 비교부(915)는, 절대값(DMi)이 절대값(DMo) 이하일 경우는, 최종적으로 출력되는 시간 영역의 L 채널 출력 신호 L'와 시간 영역의 R 채널 출력 신호R'이, 정 부 어느 것인가의 동일 부호라고 결정한다. 또, 비교부(915)는, L 채널 출력 신호 L' 및 R 채널 출력 신호 R'의 실제의 부호를 결정하기 위해서, 부호 SM' 와 부호 SMi를 비교한다. 그리고, 비교부(915)는, 부호 SM'와 부호 SMi가 동일한 경우는, 정(+)의 L 채널 신호(L")를 L 채널 출력 신호(L')로 하고, 정(+)의 R 채널 신호(R")를 R 채널 출력 신호(R')로 한다. 한편, 부호 SM'와 부호 SMi가 다른 경우는, 비교부(915)는, 부(-)의 L 채널 신호(L")를 L 채널 출력 신호(L')로 하고, 부(-)의 R 채널 신호(R")를 R 채널 출력 신호(R')로 한다. 이 비교부(915)에서의 처리를 정리하면, 이하의 수학식 17 및 수학식 18과 같이 된다.
Figure 112007017266474-PCT00017
Figure 112007017266474-PCT00018
한편, 비교부(915)는, 절대값(DMi)이 절대값(DMo)보다 큰 경우는, 최종적으로 출력되는 시간 영역의 L 채널 출력 신호(L')와 시간 영역의 R 채널 출력 신호(R')가, 서로 다른 정 부 어느 것인가의 부호라고 결정한다. 또, 비교부(915)는, L 채널 출력 신호(L') 및 R 채널 출력 신호(R')의 실제의 부호를 결정하기 위해서, 부호 SM'와 부호 SMo를 비교한다. 그리고, 비교부(915)는, 부호 SM'와 부호 SMo가 동일한 경우는, 부(-)의 L 채널 신호(L")를 L 채널 출력 신호(L')로 하고, 정(+)의 R 채널 신호(R")을 R 채널 출력 신호(R')로 한다. 한편, 부호 SM'와 부호 SMo가 다른 경우는, 비교부(915)는, 정(+)의 L 채널 신호(L")를 L 채널 출력 신호(L')로 하고, 부(-)의 R 채널 신호(R")를 R 채널 출력 신호(R')로 한다. 이 비교부(915)에서의 처리를 정리하면, 이하의 수학식 19 및 수학식 20과 같이 된다.
Figure 112007017266474-PCT00019
Figure 112007017266474-PCT00020
또한, 모노럴 신호 M'가 제로인 경우는, L 채널 신호와 R 채널 신호의 양쪽 이 제로이든가, 또는, L 채널 신호와 R 채널 신호가 정 부 반대이든가의 어느 것이다. 그래서, 부호 결정부(100)는, 모노럴 신호 M'가 제로인 경우는, 한쪽 채널의 신호가 그 채널에 있어서의 직전 신호와 동일 부호이며, 다른 쪽 채널의 신호가 그 한쪽 채널의 신호에 대해서 반대 부호라고 결정한다. 이 부호 결정부(100)에서의 처리를 식을 이용하여 나타내면 이하의 수학식 21 또는 수학식 22와 같이 된다.
Figure 112007017266474-PCT00021
Figure 112007017266474-PCT00022
또, 부호 결정부(100)는, 모노럴의 신호 M'가 제로인 경우는, 한쪽 채널의 신호의 부호를, 그 채널에 있어서의 직전의 신호와 직후의 신호의 평균값의 부호로 하고, 다른 쪽 채널의 신호가 그 한쪽 채널의 신호에 대해서 반대의 부호라고 결정할 수도 있다. 이 부호 결정부(100)에서의 처리를 식을 이용하여 나타내면 이하의 수학식 23 또는 수학식 24와 같이 된다.
Figure 112007017266474-PCT00023
Figure 112007017266474-PCT00024
또한, 위의 수학식 21~24에 있어서, 첨자 「-」 및 「+」는, 각각, 현재값 계산의 기초가 되는 직전 및 직후의 값을 나타낸다.
이상과 같이 하여 부호가 결정된 L 채널 신호 및 R 채널 신호는 각각, IFT(역주파수 변환)부(916a) 및 IFT부(916b)에 출력된다. 그리고, IFT부(916a)는, 주파수 영역의 L 채널 신호를 시간 영역으로 변환하여 최종적인 L 채널 출력 신호L'로서 출력한다. 또, IFT부(916b)는, 주파수 영역의 R 채널 신호를 시간 영역으로 변환하여 최종적인 R 채널 출력 신호 R'로서 출력한다.
이상과 같이, 출력 스테레오 신호의 정밀도는, 모노럴 신호 M'의 정밀도, 및, L 채널 및 R 채널의 전력 스펙트럼 PL, PR에 관계한다. 모노럴 신호 M'가 원래의 모노럴 신호 M에 매우 근사(近似)한 것이라고 가정하면, 출력 스테레오 신호의 정밀도는, L 채널 및 R 채널의 전력 스펙트럼 PL, PR이 원래의 전력 스펙트럼에 어느 정도 근사하는지에 의존한다. 전력 스펙트럼 PL, PR은 각각의 채널의 LPC 파라미터로부터 생성되므로, 전력 스펙트럼 PL, PR의 원래의 전력 스펙트럼에 대한 근사 정도는, LPC 분석 필터의 필터 차수 P에 의존한다. 따라서, 보다 높은 필터 차수 P를 가지는 LPC 분석 필터일수록, 보다 정확하게 스펙트럼 포락선을 나타낼 수 있다.
또한, 스테레오 신호 생성 장치가 도 11에 나타내는 구성, 즉, 전력 스펙트럼 연산부(902)에 시간 영역의 모노럴 신호 M't가 그대로 입력되는 구성을 취하는 경우는, 전력 스펙트럼 연산부(902)의 구성은 도 12에 나타내는 바와 같이 된다.
도 12에 있어서, LPC 분석부(9021)는, 시간 영역의 모노럴 신호 M't의 LPC 파라미터, 즉, LPC 게인과 LPC 계수를 구한다. 임펄스 응답 형성부(9022)는, 이 LPC 파라미터를 이용하여, 임펄스 응답hM'(n) 을 형성한다. FT(주파수 변환)부(9023)는, 임펄스 응답 hM'(n)을 주파수 영역으로 변환하고 전달 함수 HM'(z)를 얻는다. 그리고, 대수 연산부(9024)가, 전달 함수 HM'(z)의 대수를 연산하고, 연산 결과에 계수 20을 곱셈함으로써 전력 스펙트럼 PM'을 구한다. 따라서, 전력 스펙트럼 PM'은, 이하의 수학식 25에 의해 표시된다.
Figure 112007017266474-PCT00025
또, 본 발명을, 서브밴드를 이용하는 부호화 및 복호화에 적용하는 것도 가능하다. 이 경우의 LPC 분석부(30)의 구성은 도 13에 나타내는 바와 같으며, 또, 전력 스펙트럼 연산부(80)의 구성은 도 14에 나타내는 바와 같다.
도 13에 나타내는 LPC 분석부(30)에 있어서, SB(서브밴드) 분석 필터(302a), (302b)는, 입력되는 L 채널 신호 및 R 채널 신호를 1~N의 서브밴드에 분리한다. LPC 분석부(303a)는, L 채널의 각 서브밴드 1~N에 대해서 LPC 분석을 행하고, 각 서브밴드마다, LPC 계수aL ,k 및 LPC 게인GL(k= 1, 2,…, P:P는 LPC 필터의 차수)을 L 채널의 LPC 파라미터로서 얻는다. 또, LPC 분석부(303b)는, R 채널의 각 서브밴드 1~N에 대해서 LPC 분석을 행하고, 각 서브밴드마다, LPC 계수 aR ,k 및 LPC 게인 GR(k=1, 2, …, P:P는 LPC 필터의 차수)을 R 채널의 LPC 파라미터로서 얻는다. 각 서브밴드의 L 채널의 LPC 파라미터 및 R 채널의 LPC 파라미터는 다중화부(40)에서 모노럴 데이터와 다중되어, 비트스트림이 생성된다. 이 비트스트림은, 통신로(50)를 경유하여 복호 장치에 송신된다.
도 14에 나타내는 전력 스펙트럼 연산부(80)에 있어서, 임펄스 응답 형성부(804a)는, 각 서브밴드 1~N의 LPC 계수 aL ,k 및 LPC 게인 GL을 이용하여, 각 서브밴드마다 임펄스 응답 hL(n)을 형성하여 FT부(805a)에 출력한다. FT부(805a)는, 서브밴드 1~N의 임펄스 응답 hL(n)을 주파수 영역으로 변환하고 서브밴드 1~N의 전달 함수 HL(z)를 얻는다. 그리고, 대수 연산부(806a)는, 각 서브밴드 1~N의 전달 함수 응답 HL(z)의 대수 진폭을 구하여, 서브밴드별 전력 스펙트럼 PL을 얻는다.
한편, R 채널에 대해서는, 임펄스 응답 형성부(804b)가, 각 서브밴드 1~N의 LPC 계수 aR ,k 및 LPC 게인 GR을 이용하여, 각 서브밴드마다 임펄스 응답 hR(n)을 형성하여 FT부(805b)에 출력한다. FT부(805b)는, 서브밴드 1~N의 임펄스 응답 hR(n)을 주파수 영역으로 변환하여 서브밴드 1~N의 전달 함수 HR(z)를 얻는다. 그리고, 대수 연산부(806b)는, 각 서브밴드 1~N의 전달 함수 응답 HR(z)의 대수 진폭을 구하여, 서브밴드별 전력 스펙트럼 PR을 얻는다.
이와 같이, 복호 장치에서는, 각 서브밴드에 대해, 상술한 것과 동일한 처리가 행해진다. 전부의 서브밴드에 대해서 상술한 것과 동일한 처리가 이루어진 후, 서브밴드 합성 필터가, 전부의 서브밴드의 출력을 합성하여, 최종적인 출력 스테레오 신호를 생성한다.
다음에, 구체적인 수치 예 1~4를 이하에 나타낸다. 또한, 이하의 예에서 든 수치는 모두 주파수 영역의 것이다.
<예 1>
부호화 장치에 있어서, L=3781, R=7687, M=5734라고 한다. 또, 복호 장치에 있어서, PL=71.82dB, PR=77.51dB, M'=5846, 따라서, PM=75.3372dB로 한다. 그 결과, L 채널에 대해서는 표 1, R 채널에 대해서는 표 2에 나타내는 바와 같이 된다.
Figure 112007017266474-PCT00026
Figure 112007017266474-PCT00027
이 경우, DMi가 DMo 이하이고, 또, M' 와Mi의 양쪽 부호가 동일하므로, L 채널 출력 신호 L' 및 R 채널 출력 신호 R'는 다음과 같이 된다.
Figure 112007017266474-PCT00028
Figure 112007017266474-PCT00029
Figure 112007017266474-PCT00030
이 경우, DMi가 DMo 이하이고, 또, M' 와Mi의 양쪽 부호가 동일하므로, L 채널 출력 신호 L' 및 R 채널 출력 신호 R'는 다음과 같이 된다.
Figure 112007017266474-PCT00031
<예 3>
부호화 장치에 있어서, L=-3781, R=7687, M=1953라고 한다. 또, 복호 장치에 있어서, PL=71.82dB, PR=77.51dB, M'=1897, 따라서, PM=65.5613dB로 한다. 그 결과, L 채널에 대해서는 표 5, R 채널에 대해서는 표 6에 나타내는 바와 같이 된다.
Figure 112007017266474-PCT00032
Figure 112007017266474-PCT00033
이 경우, DMi가 DMo보다 크고, 또, M'와 Mi의 양쪽 부호가 같으므로, L 채널 출력 신호 L' 및 R 채널 출력 신호 R'는 다음과 같이 된다.
Figure 112007017266474-PCT00034
<예 4>
부호화 장치에 있어서, L=3781, R=-7687, M=-1953라고 한다. 또, 복호 장치에 있어서, PL=71.82dB, PR=77.51dB, M'=-1897, 따라서, PM=65.5613dB로 한다. 그 결과, L 채널에 대해서는 표 7, R 채널에 대해서는 표 8에 나타내는 바와 같이 된다.
Figure 112007017266474-PCT00035
Figure 112007017266474-PCT00036
이 경우, DMi가 DMo보다 크고, 또, M'의 부호와 Mi의 부호가 서로 다르므로, L 채널 출력 신호 L' 및 R 채널 출력 신호 R'는 다음과 같이 된다.
Figure 112007017266474-PCT00037
이상의 <예 1>~<예 4>의 결과로부터 알 수 있는 것처럼, 부호화 장치에 입력되는 L 채널 신호 L 및 R 채널 신호 R의 값과, 최종적으로 출력되는 L 채널 신호 L' 및 R 채널 신호 R'의 값을 비교하면, 모노럴 신호 M 및 M'의 값에 상관없이, 각각의 채널에 있어서 가까운 값이 얻어지고 있다. 따라서, 본 발명에 의해 재현성이 좋은 스테레오 신호가 얻어짐이 확인되었다.
또한, 상기 각 실시예의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화 되어도 좋고, 일부 또는 모두를 포함하도록 1칩화 되어도 좋다.
여기서는, LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해 LSI에 대체되는 집적 회로화의 기술이 등장하면, 당연히, 그 기술을 이용하여 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는, 2004년 8월 31일에 출원한 특허출원 2004-252027에 기초하는 것이다. 이 내용은 모두 여기에 포함시켜 놓는다.
본 발명은, 디지털 오디오 신호 및 디지털 음성 신호의 송신, 배송 및 축적 미디어 등에 이용하는 것이 가능하다.

Claims (16)

  1. 스테레오 신호의 좌우 각 채널의 신호로부터 얻어진 시간 영역의 모노럴 신호를 주파수 영역의 모노럴 신호로 변환하는 변환 수단과,
    상기 주파수 영역의 모노럴 신호의 제 1 전력 스펙트럼을 구하는 전력 산출 수단과,
    상기 제 1 전력 스펙트럼과 상기 스테레오 신호의 왼쪽 채널의 전력 스펙트럼과의 제 1의 차(差)로부터 상기 왼쪽 채널에 대한 제 1의 스케일링비(scaling比)를 구함과 동시에, 상기 제 1 전력 스펙트럼과 상기 스테레오 신호의 오른쪽 채널의 전력 스펙트럼과의 제 2의 차(差)로부터 상기 오른쪽 채널에 대한 제 2의 스케일링비를 구하는 스케일링비 산출 수단과,
    상기 주파수 영역의 모노럴 신호에 상기 제 1의 스케일링비를 곱셈하여 상기 스테레오 신호의 왼쪽 채널 신호를 생성함과 동시에, 상기 주파수 영역의 모노럴 신호에 상기 제 2의 스케일링비를 곱셈하여 상기 스테레오 신호의 오른쪽 채널 신호를 생성하는 곱셈 수단
    을 구비하는 스테레오 신호 생성 장치.
  2. 제 1 항에 있어서,
    상기 스케일링비 산출 수단은, 상기 주파수 영역의 모노럴 신호가 제로인 경 우, 상기 제 1의 스케일링비 및 상기 제 2의 스케일링비를 1로 설정하는 스테레오 신호 생성 장치.
  3. 제 1 항에 있어서,
    상기 곱셈 수단으로 생성된 상기 왼쪽 채널 신호 및 상기 오른쪽 채널 신호의 정(+) 부(-)의 부호를 결정하는 결정 수단을 더 구비하는 스테레오 신호 생성 장치.
  4. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 왼쪽 채널 신호와 상기 오른쪽 채널 신호의 합신호의 절대값과 상기 주파수 영역의 모노럴 신호의 절대값과의 차(差)인 제 1의 절대값이, 상기 왼쪽 채널 신호와 상기 오른쪽 채널 신호의 차(差)신호의 절대값과 상기 주파수 영역의 모노럴 신호의 절대값과의 차(差)인 제 2의 절대값 이하인 경우, 상기 왼쪽 채널 신호의 부호와 상기 오른쪽 채널 신호의 부호가 동일 부호라고 결정하는 스테레오 신호 생성 장치.
  5. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 왼쪽 채널 신호와 상기 오른쪽 채널 신호의 합신호의 절대값과 상기 주파수 영역의 모노럴 신호의 절대값과의 차(差)인 제 1의 절대값이, 상기 왼쪽 채널 신호와 상기 오른쪽 채널 신호의 차(差)신호의 절대값과 상기 주파수 영역의 모노럴 신호의 절대값과의 차(差)인 제 2의 절대값보다 큰 경우, 상기 왼쪽 채널 신호의 부호와 상기 오른쪽 채널 신호의 부호가 다른 부호이다라고 결정하는 스테레오 신호 생성 장치.
  6. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호의 부호와 상기 합신호의 부호가 동일 부호인 경우, 상기 왼쪽 채널 신호의 부호 및 상기 오른쪽 채널 신호의 부호를 정(+) 부호로 결정하는 스테레오 신호 생성 장치.
  7. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호의 부호와 상기 합신호의 부호가 다른 부호인 경우, 상기 왼쪽 채널 신호의 부호 및 상기 오른쪽 채널 신호의 부호를 부(-) 부호로 결정하는 스테레오 신호 생성 장치.
  8. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호의 부호와 상기 차(差)신호의 부호가 동일 부호인 경우, 상기 왼쪽 채널 신호의 부호를 부(-)의 부호로, 상기 오른쪽 채널 신호의 부호를 정(+)의 부호로 결정하는 스테레오 신호 생성 장치.
  9. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호의 부호와 상기 차(差)신호의 부호가 다른 부호인 경우, 상기 왼쪽 채널 신호의 부호를 정(+)의 부호로, 상기 오른쪽 채널 신호의 부호를 부(-)의 부호로 결정하는 스테레오 신호 생성 장치.
  10. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호가 제로인 경우, 상기 왼쪽 채널 신호의 부호를, 상기 왼쪽 채널 신호의 직전의 왼쪽 채널 신호의 부호와 동일 부호로 결정함과 동시에, 상기 오른쪽 채널 신호의 부호를, 결정한 상기 왼쪽 채널 신호의 부호와 다른 부호로 결정하는 스테레오 신호 생성 장치.
  11. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호가 제로인 경우, 상기 오른쪽 채널 신호의 부호를, 상기 오른쪽 채널 신호의 직전의 오른쪽 채널 신호의 부호와 동일 부호로 결정함과 동시에, 상기 왼쪽 채널 신호의 부호를, 결정한 상기 오른쪽 채널 신호의 부호와 다른 부호로 결정하는 스테레오 신호 생성 장치.
  12. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호가 제로인 경우, 상기 왼쪽 채널 신호의 부호를, 상기 왼쪽 채널 신호의 직전 및 직후의 2개의 왼쪽 채널 신호의 값의 평균값의 부호로 결정함과 동시에, 상기 오른쪽 채널 신호의 부호를, 결정한 상기 왼쪽 채널 신호의 부호와 다른 부호로 결정하는 스테레오 신호 생성 장치.
  13. 제 3 항에 있어서,
    상기 결정 수단은,
    상기 주파수 영역의 모노럴 신호가 제로인 경우, 상기 오른쪽 채널 신호의 부호를, 상기 오른쪽 채널 신호의 직전 및 직후의 2개의 오른쪽 채널 신호의 값의 평균값의 부호로 결정함과 동시에, 상기 왼쪽 채널 신호의 부호를, 결정한 상기 오른쪽 채널 신호의 부호와 다른 부호로 결정하는 스테레오 신호 생성 장치.
  14. 청구항 1 에 기재한 스테레오 신호 생성 장치를 구비하는 복호 장치.
  15. 스테레오 신호의 좌우 각 채널의 신호를 다운믹스(downmix)하여 시간 영역의 모노럴 신호를 얻는 다운믹스 수단과,
    상기 모노럴 신호를 부호화하여 모노럴 데이터를 얻는 부호화 수단과,
    상기 좌우 각 채널의 신호를 LPC 분석하여 상기 좌우 각 채널의 LPC 파라미터를 얻는 분석 수단과,
    상기 모노럴 데이터와 상기 좌우 각 채널의 LPC 파라미터를 다중하여 복호 장치에 송신하는 다중화 수단
    을 구비하는 부호화 장치.
  16. 스테레오 신호의 좌우 각 채널의 신호로부터 얻어진 시간 영역의 모노럴 신호를 주파수 영역의 모노럴 신호로 변환하는 변환 공정과,
    상기 주파수 영역의 모노럴 신호의 제 1 전력 스펙트럼을 구하는 전력 산출 공정과,
    상기 제 1 전력 스펙트럼과 상기 스테레오 신호의 왼쪽 채널의 전력 스펙트럼과의 제 1의 차(差)로부터 상기 왼쪽 채널에 대한 제 1의 스케일링비를 구함과 동시에, 상기 제 1 전력 스펙트럼과 상기 스테레오 신호의 오른쪽 채널의 전력 스펙트럼과의 제 2의 차(差)로부터 상기 오른쪽 채널에 대한 제 2의 스케일링비를 구하는 스케일링비 산출 공정과,
    상기 주파수 영역의 모노럴 신호에 상기 제 1의 스케일링비를 곱셈하여 상기 스테레오 신호의 왼쪽 채널 신호를 생성함과 동시에, 상기 주파수 영역의 모노럴 신호에 상기 제 2의 스케일링비를 곱셈하여 상기 스테레오 신호의 오른쪽 채널 신호를 생성하는 곱셈 공정
    을 구비하는 스테레오 신호 생성 방법.
KR1020077004878A 2004-08-31 2005-08-29 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 KR20070056081A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2004-00252027 2004-08-31
JP2004252027 2004-08-31

Publications (1)

Publication Number Publication Date
KR20070056081A true KR20070056081A (ko) 2007-05-31

Family

ID=35999990

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077004878A KR20070056081A (ko) 2004-08-31 2005-08-29 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법

Country Status (8)

Country Link
US (1) US8019087B2 (ko)
EP (1) EP1786239A1 (ko)
JP (1) JP4832305B2 (ko)
KR (1) KR20070056081A (ko)
CN (1) CN101010985A (ko)
BR (1) BRPI0515128A (ko)
RU (1) RU2007107348A (ko)
WO (1) WO2006025337A1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
JP5030789B2 (ja) * 2005-11-30 2012-09-19 パナソニック株式会社 サブバンド符号化装置およびサブバンド符号化方法
JPWO2007088853A1 (ja) * 2006-01-31 2009-06-25 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
DE602007013415D1 (de) * 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
EP2632165B1 (en) 2007-01-12 2015-09-30 ActiveVideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US20100241434A1 (en) * 2007-02-20 2010-09-23 Kojiro Ono Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
JP5269914B2 (ja) * 2009-01-22 2013-08-21 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
KR101367604B1 (ko) * 2009-03-17 2014-02-26 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
WO2012051528A2 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
EP2523472A1 (en) 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
EP2815582B1 (en) 2012-01-09 2019-09-04 ActiveVideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
CA3013744C (en) * 2013-01-29 2020-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
AU2014331092A1 (en) * 2013-10-02 2016-05-26 Stormingswiss Gmbh Derivation of multichannel signals from two or more basic signals
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN108293165A (zh) * 2015-10-27 2018-07-17 无比的优声音科技公司 增强音场的装置和方法
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
ES2911515T3 (es) * 2017-04-10 2022-05-19 Nokia Technologies Oy Codificación de audio
JP7385531B2 (ja) * 2020-06-17 2023-11-22 Toa株式会社 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2126903C (en) 1994-06-28 1996-12-24 Stephen Hon Digital surround sound method and apparatus
US6084908A (en) 1995-10-25 2000-07-04 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US6230130B1 (en) * 1998-05-18 2001-05-08 U.S. Philips Corporation Scalable mixing for speech streaming
JP3263389B2 (ja) * 2000-08-03 2002-03-04 株式会社ワイ・アール・ピー高機能移動体通信研究所 通信路復号方法および装置
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP3598993B2 (ja) * 2001-05-18 2004-12-08 ソニー株式会社 符号化装置及び方法
JP2003015697A (ja) * 2001-06-29 2003-01-17 Matsushita Electric Ind Co Ltd オーディオ符号化用のビット割当て方法
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US6950794B1 (en) 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
ES2272952T3 (es) * 2002-03-08 2007-05-01 Koninklijke Kpn N.V. Procedimiento y sistema para medir la calidad de la transmision de un sistema.
BRPI0304541B1 (pt) 2002-04-22 2017-07-04 Koninklijke Philips N. V. Method and arrangement for synthesizing a first and a second output sign from an input sign, and, device for providing a decoded audio signal
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
DE60306512T2 (de) 2002-04-22 2007-06-21 Koninklijke Philips Electronics N.V. Parametrische beschreibung von mehrkanal-audio
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
AU2003219428A1 (en) 2002-10-14 2004-05-04 Koninklijke Philips Electronics N.V. Signal filtering
US7395210B2 (en) * 2002-11-21 2008-07-01 Microsoft Corporation Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform
US7787632B2 (en) * 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
RU2381571C2 (ru) * 2004-03-12 2010-02-10 Нокиа Корпорейшн Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like

Also Published As

Publication number Publication date
BRPI0515128A (pt) 2008-07-08
RU2007107348A (ru) 2008-09-10
WO2006025337A1 (ja) 2006-03-09
CN101010985A (zh) 2007-08-01
JP4832305B2 (ja) 2011-12-07
US20080154583A1 (en) 2008-06-26
EP1786239A1 (en) 2007-05-16
JPWO2006025337A1 (ja) 2008-05-08
US8019087B2 (en) 2011-09-13

Similar Documents

Publication Publication Date Title
JP4832305B2 (ja) ステレオ信号生成装置およびステレオ信号生成方法
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
US8290783B2 (en) Apparatus for mixing a plurality of input data streams
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
JP4963962B2 (ja) マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
EP2109861B1 (en) Audio decoder
EP2209114B1 (en) Speech coding/decoding apparatus/method
US8352249B2 (en) Encoding device, decoding device, and method thereof
EP1801783B1 (en) Scalable encoding device, scalable decoding device, and method thereof
US8036390B2 (en) Scalable encoding device and scalable encoding method
JP4685165B2 (ja) 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法
EP1801782A1 (en) Scalable encoding apparatus and scalable encoding method
KR20070090217A (ko) 스케일러블 부호화 장치 및 스케일러블 부호화 방법
KR20180009337A (ko) 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
US8548615B2 (en) Encoder
JPWO2008132826A1 (ja) ステレオ音声符号化装置およびステレオ音声符号化方法
Seto Scalable Speech Coding for IP Networks

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid