WO2006025337A1 - ステレオ信号生成装置およびステレオ信号生成方法 - Google Patents

ステレオ信号生成装置およびステレオ信号生成方法 Download PDF

Info

Publication number
WO2006025337A1
WO2006025337A1 PCT/JP2005/015674 JP2005015674W WO2006025337A1 WO 2006025337 A1 WO2006025337 A1 WO 2006025337A1 JP 2005015674 W JP2005015674 W JP 2005015674W WO 2006025337 A1 WO2006025337 A1 WO 2006025337A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
stereo
sign
monaural
channel
Prior art date
Application number
PCT/JP2005/015674
Other languages
English (en)
French (fr)
Inventor
Michiyo Goto
Chun Woei Teo
Sua Hong Neo
Koji Yoshida
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US11/573,760 priority Critical patent/US8019087B2/en
Priority to BRPI0515128-7A priority patent/BRPI0515128A/pt
Priority to EP05775181A priority patent/EP1786239A1/en
Priority to JP2006532681A priority patent/JP4832305B2/ja
Publication of WO2006025337A1 publication Critical patent/WO2006025337A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals

Definitions

  • the present invention relates to a stereo signal generation device and a stereo signal generation method, and more particularly to a stereo signal generation device and a stereo signal generation method for generating a stereo signal from a monaural signal and signal parameters.
  • the stereo function helps to improve the perceived audio quality.
  • One application of the stereo function is high-quality teleconference equipment that can identify the location of a speaker in a situation where there are multiple speakers at the same time.
  • stereo audio codecs are less common than stereo audio codecs.
  • stereophonic sound codes can be realized in various ways, and stereo functions are considered standard in audio codes.
  • Stereo effects can be achieved by coding the left and right channels independently as dual mono.
  • Joint stereo can be performed using mid-side (MS) stereo and intensity (I) stereo. By using these two methods together, a higher compression ratio can be realized.
  • MS mid-side
  • I intensity
  • MS stereo the correlation between stereo channels is used.
  • MS stereo stereo imaging of signals that are prone to aliasing distortion is also affected when coding is done at low bit rates for narrow bandwidth transmission.
  • I stereo the ability of the human auditory system to decompose high frequency components is reduced in the high frequency region, so I stereo is effective only in the high frequency region and not in the low frequency region. ,.
  • most speech codecs are considered to be parametric coding that functions by modeling the human vocal tract with parameters using a variation of the linear prediction method.
  • the joint stereo method is also a stereo method. Suitable for audio codecs.
  • Non-Patent Document 1 As another speech codec method, there is a method using cross channel prediction (see Non-Patent Document 1, for example). In this method, redundancy such as intensity difference, delay difference, and spatial difference between stereophonic sound channels is modeled by utilizing the existence of interchannel correlation in the stereoacoustic signal.
  • an audio codec method there is a method using parametric spatial audio (see, for example, Patent Document 1).
  • the basic idea of this method is to represent a speech signal using a set of parameters. These parameters representing the audio signal are used on the decoding side to re-synthesize a signal that is perceptually similar to the original sound.
  • the parameters are calculated for each band.
  • Each subband consists of several frequency components or band coefficients, and the number of components increases with higher frequency subbands.
  • One of the parameters calculated for this is the inter-channel level difference. This parameter is the power ratio between the left channel (L channel) and the right channel (R channel).
  • This inter-channel level difference is used on the decoding side to correct the band coefficient. Since one interchannel level difference is calculated for each subband, the same interchannel level difference is applied to all band coefficients in that subband. This means that the same modification factor is applied to all band coefficients in the subband.
  • Patent Document 1 International Publication No. 03Z090208 Pamphlet
  • Non-Patent Literature 1 Ramprashad, b. A., Stereophonic CELP coding using Cross channel Prediction, Proc.IEEE Workshop on Speech Coding, Pages: 136—138, (17-20 Sept. 2000)
  • bit rate is lower as a result of using one inter-channel level difference for each subband. Adjustment of level changes across components is fairly coarse
  • An object of the present invention is to provide a stereo signal generation device and a stereo signal generation method capable of obtaining a stereo signal with good reproducibility at a low bit rate.
  • the stereo signal generation device of the present invention includes a conversion means for converting a time domain monaural signal obtained from the signal power of each of the left and right channels of the stereo signal into a frequency domain monaural signal, and a first of the frequency domain monaural signals.
  • a power calculating means for obtaining a power spectrum of 1; a first power spectrum of the first power spectrum and a power spectrum of a left channel of the stereo signal; The first scaling ratio for the left channel is also obtained, and the second scaling ratio for the right channel is calculated from the second difference between the first power spectrum and the right channel power spectrum of the stereo signal.
  • a scaling ratio calculation means to be calculated; and the frequency domain monaural signal is multiplied by the first scaling ratio to generate a left channel signal of the stereo signal, and the second scaling is applied to the frequency domain monaural signal.
  • a multiplication unit that multiplies the ratio to generate a right channel signal of the stereo signal.
  • a stereo signal can be obtained with a low bit rate and good reproducibility.
  • FIG. 1 is a power spectrum plot diagram according to one embodiment of the present invention.
  • FIG. 2 Power spectrum plot diagram according to the above embodiment
  • FIG. 4 Power spectrum plot according to the above embodiment.
  • FIG. 5 Power spectrum plot of stereo signal frame according to the above embodiment (L channel)
  • FIG. 6 Power spectrum plot of stereo signal frame according to the above embodiment (R channel)
  • FIG. 7 is a block diagram showing the configuration of the code decoding system according to the above embodiment
  • FIG. 8 is a block diagram showing the configuration of the LPC analysis unit according to the above embodiment
  • FIG. 9 is a block diagram showing a configuration of a power spectrum calculation unit according to the above embodiment
  • FIG. 10 is a block diagram showing a configuration of a stereo signal generation device according to the above embodiment.
  • FIG. 11 is a block diagram showing another configuration of the stereo signal generation device according to the above embodiment.
  • FIG. 12 is a block diagram showing a configuration of a power spectrum calculation unit according to the above embodiment
  • FIG. 13 is a block diagram showing another configuration of the LPC analysis unit according to the above embodiment
  • FIG. 14 is a block diagram showing another configuration of the power spectrum calculation unit according to the above embodiment.
  • BEST MODE FOR CARRYING OUT THE INVENTION a stereo signal is generated using a mono signal and a set of LPC parameters from a stereo source.
  • L channel and R channel stereo signals are generated using the L channel and R channel electric vector envelopes and the monaural signal.
  • the power spectrum envelope can be thought of as an approximation to the energy spread of each channel. Therefore, the L channel and R channel signals can be generated using the approximate energy dispersion of the L channel and the R channel in addition to the monaural signal.
  • the monaural signal can be coded and decoded using a standard speech coder Z decoder or audio coder Z decoder.
  • the spectral envelope is calculated using the properties of the LPC analysis.
  • the envelope of the signal power spectrum P can be obtained by plotting the transfer function H (z) of the all-pole filter as shown in the following equation (1).
  • the dotted line represents the actual signal power
  • the solid line represents the envelope of the signal power obtained using the above equation (1).
  • FIG. 5 and FIG. 6 show power spectrum plots of a stereo signal frame.
  • Figure 5 shows the L channel envelope
  • Figure 6 shows the R channel envelope. From Fig. 5 and Fig. 6, it can be seen that the L channel envelope force and the R channel envelope force are different from each other.
  • the L channel signal and the R channel signal of the stereo signal can be configured based on the power spectrum and the monaural signal of the L channel and the R channel. Therefore, this departure In MEI, the stereo output signal is generated using only LPC parameters from a stereo source in addition to the monaural signal.
  • the monaural signal can be encoded by a standard encoder.
  • LPC parameters are transmitted as additional information, transmission of LPC parameters requires less bandwidth than when encoded L channel signals and R channel signals are transmitted independently.
  • FIG. 7 shows the configuration of a coding Z decoding system according to an embodiment of the present invention.
  • the encoding device is configured to include a downmixing unit 10, a encoding unit 20, an LPC analysis unit 30, and a multiplexing unit 40.
  • the decoding device includes a separation unit 60, a decoding unit 70, an electric spectrum calculation unit 80, and a stereo signal generation device 90. It is assumed that the L channel signal L and the R channel signal R input to the encoder are already in a digital format.
  • the downmixing unit 10 generates a time-domain monaural signal M by downmixing the input L signal and R signal.
  • the encoding unit 20 encodes the monaural signal M and outputs it to the multiplexing unit 40.
  • the code key unit 20 may be a shift of the audio encoder or the audio encoder.
  • the LPC analysis unit 30 analyzes the L signal and the R signal by LPC analysis, obtains LPC parameters for the L channel and the R channel, and outputs them to the multiplexing unit 40.
  • the multiplexing unit 40 transmits a bit stream obtained by multiplexing the encoded monaural data and the LPC parameter to the decoding device via the communication path 50.
  • the separation unit 60 separates the received bit stream into monaural data and LPC parameters.
  • the monaural data is input to the decoding unit 70, and the LPC parameters are input to the power spectrum calculation unit 80.
  • the decoding unit 70 decodes monaural data. Thereby, a monaural signal M ′ t in the time domain is obtained.
  • the mono signal M ′ in the time domain is input to the stereo signal generator 90. At the same time, it is output from the decoding device.
  • the power spectrum calculation unit 80 obtains power spectra P and ⁇ ⁇ ⁇ of the L channel and the R channel using the input LPC parameters.
  • the plot of the power spectrum obtained here is
  • the power spectrum ⁇ , ⁇ is the stereo signal generator 90
  • the stereo signal generator 90 generates and outputs a stereo signal R ′ using these three parameters, that is, the time domain monaural signal ⁇ and the power spectrum ⁇ and ⁇ .
  • the LPC analysis unit 30 includes an LPC analysis unit 301a for the L channel and an LPC analysis unit 30 lb for the R channel.
  • the L channel LPC parameters and the R channel LPC parameters are multiplexed with the monaural data by the multiplexing unit 40 to generate a bit stream. This bit stream is transmitted to the decoding device via the communication path 50.
  • the electric spectrum calculation unit 80 includes impulse response forming units 801a and 801b, FT (frequency conversion) units 802a and 802b, and logarithmic calculation units 803a and 803b.
  • the power spectrum calculation unit 80 receives the LPC parameters (that is, the LPC coefficient a a) and the LPC gain GG of each channel obtained by separating the bit stream by the separation unit 60.
  • the impulse response forming unit 801a performs LPC coefficient a and LPC.
  • the impulse response h (n) is formed using the gain G and output to the FT unit 802a.
  • the logarithmic operation unit 803a obtains and plots the logarithmic amplitude of the transfer function response H (z). This gives an envelope of the approximate power spectrum P of the L channel signal.
  • the power spectrum P is expressed by the following equation (3).
  • the impulse response forming unit 801b force LPC coefficient a and
  • the impulse response h (n) is formed using the LPC gain G and output to the FT unit 802b.
  • the unit 802b converts the impulse response h (n) into the frequency domain to obtain a transfer function H (z).
  • the logarithmic operation unit 803b obtains and plots the logarithmic amplitude of the transfer function response H (z). to this
  • the force spectrum P is expressed by the following equation (5).
  • L channel power spectrum P and R channel power spectrum P are stereo signals
  • the stereo signal generating apparatus 90 receives the time domain monaural signal M ′ decoded by the decoding unit 70.
  • the stereo signal generator 90 includes a time domain monaural signal M ′ and an L channel power spectrum. P and R channel power spectrum P is input.
  • the FT (frequency conversion) unit 901 uses a time domain monaural signal M ′ using a frequency conversion function.
  • the power spectrum calculation unit 902 obtains the power spectrum P of the monaural signal M' according to the following equation (6). Note that the monaural signal M 'is zero.
  • the power spectrum calculation unit 902 sets the power spectrum P to zero.
  • the subtraction unit 903a sets the difference value D to zero.
  • the scaling ratio calculation unit 904a uses the difference value D to perform the L check according to the following equation (8).
  • Scaling ratio S is set to 1.
  • subtraction unit 903b obtains difference D between R channel electric spectrum P and monaural signal power spectrum P according to the following equation (9).
  • the subtractor 903a sets the difference value D to zero.
  • the scaling ratio calculation unit 904b uses the difference value D to perform an R check according to the following equation (10).
  • Multiplication section 905a multiplies monaural signal M 'and scaling ratio S for the L channel, as shown in the following equation (11). Further, the multiplication unit 905b is configured as shown in the following formula (12).
  • the code determining unit 100 performs the following processing to determine the correct codes of the L channel signal R ′ and the R channel signal R ′′.
  • the sum signal M is obtained by the adder 906a and the divider 907a according to the following equation (13).
  • the adding unit 906a adds the L channel signal R ′ and the R channel signal R ′′, and the dividing unit 907a divides the result by two.
  • the subtraction unit 906b and the division unit 907b obtain the difference signal M according to the following equation (14).
  • the subtraction unit 906a obtains the difference between the L channel signal and the R channel signal R ", and the division unit 907b divides the result by 2.
  • the absolute value calculation unit 908a calculates the absolute value of the sum signal M ; and the subtraction unit 910a calculates the absolute value of the monaural signal M ′ calculated by the absolute value calculation unit 909 and the absolute value of the sum signal M.
  • the absolute value calculation unit 911a obtains the absolute value D of the difference value calculated by the absolute value calculation unit 910a.
  • the absolute value D is input to the comparison unit 915.
  • the absolute value calculation unit 908b obtains the absolute value of the difference signal M
  • the subtraction unit 910b calculates the absolute value of the monaural signal M ′ calculated by the absolute value calculation unit 909 and the absolute value of the difference signal M.
  • the absolute value calculation unit 911b obtains the absolute value D of the difference value calculated by the absolute value calculation unit 910b. Therefore, the absolute value D calculated by the absolute value calculation unit 9 l ib is expressed by the following equation (16).
  • the absolute value D is input to the comparison unit 915.
  • the sign of the monaural signal M ' is determined by the determination unit 912, and the determination result S is compared with the ratio.
  • the sign of the sum signal M is determined by the determination unit 913a, and the determination result S is input to the comparison unit 915. Further, the sign of the difference signal M is determined by the determination unit 913b.
  • the determination result S is input to the comparison unit 915. Furthermore, obtained by the multiplication unit 905a
  • the L channel signal ' is input to the comparison unit 915 as it is, and the sign of the L channel signal' is inverted by the inversion unit 914a to be input to the comparison unit 915. Further, the R channel signal R ′′ obtained by the multiplication unit 905b is directly input to the comparison unit 915, and the sign of the R channel signal R ′′ is inverted by the inversion unit 914b to become ⁇ R ′′. Input to 915.
  • the comparison unit 915 determines the correct codes of the L channel signal R 'and the R channel signal R ". In comparison unit 915, first, comparison is made between absolute value D and absolute value D. And
  • the comparison unit 915 When the absolute value D is less than or equal to the absolute value D, the comparison unit 915 finally outputs the time region.
  • the L channel output signal in the domain and the R channel output signal R ′ in the time domain are determined to have the same sign, either positive or negative. Further, the comparison unit 915 compares the code S and the code S in order to determine the actual codes of the L channel output signal and the R channel output signal R ′.
  • the comparison unit 915 compares the positive L channel signal when the code S and the code S are the same.
  • the comparator 915 outputs the negative L channel signal.
  • the comparison unit 915 when the absolute value D is larger than the absolute value D, the comparison unit 915 finally outputs it.
  • the time domain L channel output signal and the time domain R channel output signal R ′ are determined to have different signs. Further, the comparison unit 915 determines the actual sign of the L channel output signal and the R channel output signal R ′ in order to determine the sign S and
  • the negative L channel signal ' is the L channel output signal and the positive R channel signal R "is the R channel output signal R'.
  • the comparator 915 if the code S and the code S are different, the comparator 915 ,
  • the positive L channel signal ' is the L channel output signal
  • the negative R channel signal R " is the R channel output signal R'.
  • the processing in this comparison unit 915 is summarized as follows: And Equation (20).
  • the code determination unit 100 sets the code of the signal of one channel as the code of the average value of the immediately preceding signal and the immediately following signal in the channel, It can also be determined that the signal on the other channel is opposite in sign to the signal on that one channel.
  • the processing in the code determination unit 100 is expressed by the following equation (23) or equation (24).
  • the L channel signal and the R channel signal whose codes are determined as described above are output to IFT (Inverse Frequency Conversion) section 916a and IFT section 916b, respectively. Then, the IFT unit 916a converts the L-channel signal in the frequency domain into the time domain and outputs it as the final L-channel output signal. Also, the IFT unit 916b converts the frequency domain R channel signal into the time domain and outputs it as the final R channel output signal R ′.
  • IFT Inverse Frequency Conversion
  • the accuracy of the output stereo signal is related to the accuracy of the monaural signal M 'and the power spectra P, ⁇ of the L channel and the R channel.
  • Monaural signal ⁇ is the original mono
  • the accuracy of the output stereo signal is how close the L and R channel power spectra ⁇ and ⁇ are to the original power spectrum.
  • the power spectra ⁇ and ⁇ are the LPC parameters for each channel and R
  • an LPC analysis filter having a higher filter order ⁇ can represent a spectral envelope more accurately.
  • the stereo signal generation apparatus adopts the configuration shown in FIG. 11, that is, the configuration in which the time-domain monaural signal ⁇ is directly input to the power spectrum calculation unit 902, the power
  • the configuration of the spectrum calculation unit 902 is as shown in FIG.
  • the LPC analysis unit 9021 displays the LPC parameters of the time domain monaural signal M.
  • the impulse response forming unit 9022 forms an impulse response h (n) using this LPC parameter.
  • the logarithm calculation unit 9024 calculates the logarithm of the transfer function H (z) and multiplies the calculation result by the coefficient
  • M is the following formula ( Represented by 25).
  • the present invention can also be applied to coding and decoding using subbands.
  • the configuration of the LPC analysis unit 30 is as shown in FIG. 13
  • the configuration of the electric spectrum calculation unit 80 is as shown in FIG.
  • the SB (subband) analysis filters 302a and 302b separate the input L channel signal and R channel signal into 1 to N subbands.
  • the LPC parameter of the L channel and the LPC parameter of the R channel of each subband are multiplexed with monaural data by the multiplexing unit 40, and a bit stream is generated. This bit stream is transmitted to the decoding device via the communication path 50.
  • the impulse response forming unit 804a uses the LPC coefficient a and the LPC gain G of each subband 1 to N for each subband.
  • FT section 805a has subband 1
  • the logarithmic operation unit 806a obtains the logarithmic amplitude of the transfer function response H (z) of each of the subbands 1 to N to obtain the power spectrum P for each subband.
  • impulse response forming unit 804b force impulse response h (n for each subband using LPC coefficient a and LPC gain G of each subband 1 to N
  • the FT unit 805b converts the impulse response h (n) of subbands 1 to N into the frequency domain to obtain a transfer function H (z) of subbands 1 to N.
  • the logarithmic operation unit 806b obtains the logarithmic amplitude of the transfer function response H (z) of each subband 1 to N.
  • the decoding device Obtain the power spectrum P for each subband. [0070] In this manner, in the decoding device, the same processing as described above is performed for each subpand. After the same processing as described above is performed for all subbands, the subband synthesis filter synthesizes the outputs of all subbands to generate a final output stereo signal.
  • Table 1 shows the L channel and Table 2 shows the R channel.
  • the output signal and R channel output signal R ' are as follows.
  • the L channel is shown in Table 3
  • the R channel is shown in Table 4.
  • the output signal and R channel output signal R ' are as follows.
  • Table 5 shows the L channel and Table 6 shows the R channel.
  • the output signal and the R channel output signal R ' are as follows.
  • Table 7 shows the L channel and Table 8 shows the R channel.
  • the channel output signal and the R channel output signal R ′ are as follows.
  • each functional block used in the description of each of the above embodiments is typically realized as an LSI which is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them.
  • IC integrated circuit
  • system LSI system LSI
  • super LSI non-linear LSI
  • non-linear LSI depending on the difference in power integration as LSI.
  • the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. It is also possible to use a field programmable gate array (FPGA) that can be programmed after LSI manufacture and a reconfigurable processor that can reconfigure the connection and settings of circuit cells inside the LSI.
  • FPGA field programmable gate array
  • the present invention can be used for transmission, distribution and storage media of digital audio signals and digital audio signals.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

 低いビットレートで再現性の良いステレオ信号を得ることができるステレオ信号生成装置。このステレオ信号生成装置(90)では、FT部(901)が、時間領域のモノラル信号M’tを周波数領域のモノラル信号M’に変換し、電力スペクトル演算部(902)が、電力スペクトルPM’を求め、スケーリング比算出部(904a)が、左チャネルに対するスケーリング比SLを求め、スケーリング比算出部(904b)が、右チャネルに対するスケーリング比SRを求め、乗算部(905a)が、周波数領域のモノラル信号M’にスケーリング比SLを乗算してステレオ信号の左チャネル信号L”を生成し、乗算部(905b)が、周波数領域のモノラル信号M’にスケーリング比SRを乗算してステレオ信号の右チャネル信号R”を生成する。

Description

ステレオ信号生成装置およびステレオ信号生成方法
技術分野
[0001] 本発明は、ステレオ信号生成装置およびステレオ信号生成方法に関し、特に、モノ ラル信号および信号パラメータからステレオ信号を生成するステレオ信号生成装置 およびステレオ信号生成方法に関する。
背景技術
[0002] 大部分の音声コーデックでは、音声のモノラル信号のみを符号化する。モノラルの 音声は、ステレオのように空間情報を提供しない。そのようなモノラルコーデックは、 信号が、例えば、人間の発声等の単一ソース力 生成されるような、携帯電話および テレコンファレンス機器などの通信機器において一般に用いられる。従来は、送信帯 域幅の制約により、そのようなモノラル信号でも十分であった。しかしながら、技術進 歩により帯域幅が改善されるにつれ、この制約は、次第に重要性を有しないものとな つてきている。一方で、音声品質が、考慮すべきより重要な要素となっており、可能な 限り低 、ビットレートで、高い品質の音声を提供することが重要となって!/、る。
ここで、ステレオ機能は、知覚される音声品質を改善するのに役立つ。ステレオ機 能の用途の一つとしては、同時に複数の発話者が存在する状況において、発話者 の位置を識別することのできる、高品質なテレコンファレンス機器がある。
[0003] 現在、ステレオ音声コーデックは、ステレオオーディオコーデックに比べて、あまり一 般的ではない。オーディオ符号化では、様々な方法で立体音響符号ィ匕を実現するこ とができ、オーディオ符号ィ匕においてステレオ機能は標準と考えられている。左右二 つのチャネルを独立して、デュアルモノとして符号ィ匕することにより、ステレオ効果を 実現することができる。また、左右二つのチャネル間の冗長性を利用して、ジョイント ステレオとして符号ィ匕することもでき、これにより良い品質を保ちつつ、ビットレートを 低減することができる。ジョイントステレオは、ミツドサイド (MS)ステレオおよびインテ ンシティ (I)ステレオを用いて行なうことができる。これらの二つの方法を合わせて用 いることで、より高い圧縮率を実現することができる。 [0004] これらのオーディオ符号ィ匕には、以下のような短所がある。すなわち、左右のチヤネ ルを独立して符号化する場合は、チャネル間の相関冗長性を利用したビットレートの 低減がなされないので、帯域幅が浪費されてしまう。従って、ステレオチャネルは、モ ノラルチャネルに比べて、二倍のビットレートを必要とする。
[0005] また、 MSステレオでは、ステレオチャネル間の相関性を利用する。 MSステレオで は、狭帯域幅送信のために低いビットレートで符号ィ匕がなされるときには、エイリアジ ング歪みを生じ易ぐ信号のステレオイメージングも影響を受ける。
[0006] また、 Iステレオについては、人間の聴覚系統が高周波数成分を分解する能力が高 周波領域で低下するため、 Iステレオは高周波領域のみにおいて有効であって、低 周波領域では有効でな 、。
[0007] また、大抵の音声コーデックは、線形予測法の変形を用いたパラメータにより人間 の声道をモデルィ匕して機能する、パラメトリック符号化と考えられており、ジョイントステ レオ方法もまた、ステレオ音声コーデックには適して 、な 、。
[0008] ここで、オーディオコーデックに類似する音声コーデック方法の一つに、ステレオ音 声の各チャネルを独立に符号ィ匕し、これによつてステレオ効果を実現するものがある 。しかし、このコーデック方法には、モノラルソースのみを符号ィ匕するのに比べて二倍 の帯域幅を使用するというオーディオコーデックの短所と同一の短所がある。
[0009] また別の音声コーデック方法としては、クロスチャネル予測を用いるものがある(例 えば、非特許文献 1参照)。この方法では、立体音響信号にチャネル間相関が存在 することを利用して、立体音響チャネル間の強度差、遅延差および空間差などの冗 長性をモデル化する。
[0010] また、別の音声コーデック方法として、パラメトリック空間オーディオを用いた方法が ある(例えば、特許文献 1参照)。この方法の基本的な考えは、パラメータのセットを用 いて、音声信号を表現することである。音声信号を表現するこれらのパラメータは、原 音と知覚的に類似する信号を再合成するために、復号側で用いられる。この方法に おいては、帯域をサブバンドと呼ばれる多数の周波数帯に分割した後、パラメータは 帯域毎に計算される。各サブバンドは、いくつかの周波数成分または帯域係数から なり、成分の数は、より高い周波数サブバンドほど増加する。例えば、各サブバンドに ついて計算されるパラメータの一つは、チャネル間レベル差である。このパラメータは 、左チャネル(Lチャネル)と右チャネル (Rチャネル)との間の電力比である。このチヤ ネル間レベル差は、復号側において、帯域係数を修正するのに用いられる。各サブ バンドに対して一つのチャネル間レベル差が計算されるので、同一のチャネル間レ ベル差が当該サブバンドにおける全ての帯域係数に対して適用される。このことは、 サブバンドにおける全ての帯域係数に対して同一の変更係数が適用されることを意 味する。
特許文献 1:国際公開第 03Z090208号パンフレット
非特干文献 1 : Ramprashad, b. A., Stereophonic CELP coding using Cross channel Prediction , Proc. IEEE Workshop on Speech Coding, Pages:136— 138, (17-20 Sept. 2000)
発明の開示
発明が解決しょうとする課題
[0011] し力しながら、上記のクロスチャネル予測を用いた音声コーデック方法では、複雑な システムにお 、てチャネル間の冗長性が失われて、それによりクロスチャネル予測の 効果が減じられてしまう。よって、この方法は、 ADPCMのような簡単なコーデックに適 用される場合にのみ有効である。
[0012] また、上記のパラメトリック空間オーディオを用いた音声コーデック方法では、サブ バンド毎に一つのチャネル間レベル差を用いることによる結果、ビットレートはより低 いものとなるものの、復号側では、周波数成分に渡ってレベル変更の調整がかなり粗
V、ものとなってしま 、再現性が低下する。
[0013] 本発明の目的は、低いビットレートで再現性の良いステレオ信号を得ることができる ステレオ信号生成装置およびステレオ信号生成方法を提供することである。
課題を解決するための手段
[0014] 本発明のステレオ信号生成装置は、ステレオ信号の左右各チャネルの信号力 得 られた時間領域のモノラル信号を周波数領域のモノラル信号に変換する変換手段と 、前記周波数領域のモノラル信号の第 1の電力スペクトルを求める電力算出手段と、 前記第 1の電力スペクトルと前記ステレオ信号の左チャネルの電力スペクトルとの第 1 の差力も前記左チャネルに対する第 1のスケーリング比を求めるとともに、前記第 1の 電力スペクトルと前記ステレオ信号の右チャネルの電力スペクトルとの第 2の差から前 記右チャネルに対する第 2のスケーリング比を求めるスケーリング比算出手段と、前 記周波数領域のモノラル信号に前記第 1のスケーリング比を乗算して前記ステレオ信 号の左チャネル信号を生成するとともに、前記周波数領域のモノラル信号に前記第 2 のスケーリング比を乗算して前記ステレオ信号の右チャネル信号を生成する乗算手 段と、を具備する構成を採る。
発明の効果
[0015] 本発明によれば、低 、ビットレートで再現性の良 、ステレオ信号を得ることができる
図面の簡単な説明
[0016] [図 1]本発明の一実施の形態に係る電力スペクトルプロット図
[図 2]上記実施の形態に係る電力スペクトルプロット図
[図 3]上記実施の形態に係る電力スペクトルプロット図
[図 4]上記実施の形態に係る電力スペクトルプロット図
[図 5]上記実施の形態に係るステレオ信号のフレームの電力スペクトルプロット図(L チャネル)
[図 6]上記実施の形態に係るステレオ信号のフレームの電力スペクトルプロット図(R チャネル)
[図 7]上記実施の形態に係る符号ィ匕 Z復号システムの構成を示すブロック図
[図 8]上記実施の形態に係る LPC分析部の構成を示すブロック図
[図 9]上記実施の形態に係る電力スペクトル演算部の構成を示すブロック図
[図 10]上記実施の形態に係るステレオ信号生成装置の構成を示すブロック図
[図 11]上記実施の形態に係るステレオ信号生成装置の別の構成を示すブロック図
[図 12]上記実施の形態に係る電力スペクトル演算部の構成を示すブロック図
[図 13]上記実施の形態に係る LPC分析部の別の構成を示すブロック図
[図 14]上記実施の形態に係る電力スペクトル演算部の別の構成を示すブロック図 発明を実施するための最良の形態 [0017] 本発明では、モノラル信号およびステレオソースからの LPCパラメータのセットを用 いて、ステレオ信号を生成する。本発明では、 Lチャネルおよび Rチャネルの電カス ベクトルエンベロープおよびモノラル信号を用いて、 Lチャネルおよび Rチャネルのス テレオ信号を生成する。電力スペクトルエンベロープは、各チャネルのエネルギー分 散に対する近似値として考えることができる。よって、モノラル信号にカ卩えて、 Lチヤネ ルおよび Rチャネルの近似化されたエネルギー分散を用いて、 Lチャネルおよび Rチ ャネルの信号を生成することができる。モノラル信号は、標準的な音声符号器 Z復号 器またはオーディオ符号器 Z復号器を用いて、符号ィ匕および復号することができる。 本発明では、 LPC分析のプロパティを用いてスペクトルエンベロープを計算する。信 号電力スペクトル Pのエンベロープは、以下の式(1)〖こ示すように、全極フィルタの伝 達関数 H (z)をプロットすることにより得られる。
[0018] [数 1]
Figure imgf000007_0001
ここで、 aは LPC係数であり、 Gは LPC分析フィルタのゲインである。
k
[0019] 上式(1)を用いたプロットの例を、図 1〜図 6に示す。点線は、実際の信号電力を表 わし、実線は、上式(1)を用いて得られた信号電力のエンベロープを表わす。
[0020] 図 1〜図 4は、フィルタ次数 P=20において、異なる特性の信号のいくつかのフレー ムについての電力スペクトルプロットを示す。図 1〜図 4より、エンベロープが、周波数 間にわたって、信号電力の上昇、下降、あるいはその推移線にかなり忠実に沿って 、ることが分力る。
[0021] また、図 5および図 6は、ステレオ信号のフレームの電力スペクトルプロットを示す。
図 5は Lチャネルのエンベロープを示し、図 6は Rチャネルのエンベロープを示す。図 5および図 6より、 Lチャネルのエンベロープと Rチャネルのエンベロープ力 互いに 異なることが分力ゝる。
[0022] よって、ステレオ信号の Lチャネル信号と Rチャネル信号は、 Lチャネルと Rチャネル の電力スペクトルおよびモノラル信号に基づいて構成することができる。よって、本発 明では、モノラル信号に加えて、ステレオソースからの LPCパラメータのみを用いてス テレオ出力信号を生成する。モノラル信号は、標準的な符号器により符号ィ匕すること ができる。一方、 LPCパラメータは付加情報として送信されるため、 LPCパラメータの 送信には、符号化された Lチャネル信号と Rチャネル信号を独立に送信する場合に 比べ、力なり少ない帯域幅しか必要としない。また、本発明では、 Lチャネルと Rチヤ ネルの電力スペクトルを用いて、各周波数成分または帯域係数を修正、調整すること が可能となる。これにより、ビットレートに負担をかけることなぐ各周波数成分にわた つてスペクトルレベルの細かな調整を行うことができる。
[0023] 以下、本発明の実施の形態について図面を用いて詳細に説明する。
[0024] 図 7に、本発明の一実施の形態に係る符号化 Z復号システムの構成を示す。図 7 において、符号化装置は、ダウンミクス部 10、符号ィ匕部 20、 LPC分析部 30および多 重化部 40を含んで構成される。また、復号装置は、分離部 60、復号部 70、電カスペ タトル演算部 80およびステレオ信号生成装置 90を含んで構成される。なお、符号ィ匕 装置に入力される Lチャネル信号 Lと Rチャネル信号 Rは、既にデジタルフォーマット になっているものとする。
[0025] 符号化装置において、ダウンミクス部 10は、入力される L信号と R信号をダウンミクス して時間領域のモノラル信号 Mを生成する。符号ィ匕部 20は、モノラル信号 Mを符号 化して多重化部 40に出力する。なお、符号ィ匕部 20は、オーディオ符号器または音 声符号化器の 、ずれであってもよ 、。
[0026] 一方、 LPC分析部 30は、 L信号と R信号を LPC分析によって分析して Lチャネルと Rチャネル各々に対する LPCパラメータを求め、多重化部 40に出力する。
[0027] 多重化部 40は、符号ィ匕されたモノラルデータと LPCパラメータとを多重したビットス トリームを通信路 50を介して復号装置に送信する。
[0028] 復号装置において、分離部 60は、受信したビットストリームをモノラルデータと LPC パラメータとに分離する。モノラルデータは復号部 70に入力され、 LPCパラメータは 電力スペクトル演算部 80に入力される。
[0029] 復号部 70は、モノラルデータを復号する。これにより、時間領域のモノラル信号 M' t が得られる。時間領域のモノラル信号 M'は、ステレオ信号生成装置 90に入力される とともに、復号装置から出力される。
[0030] 電力スペクトル演算部 80は、入力される LPCパラメータを用いて、 Lチャネルと Rチ ャネルの電力スペクトル P ,Ρを求める。ここで求められる電力スペクトルのプロットは、
L R
図 5および図 6に示すようになる。電力スペクトル Ρ ,Ρは、ステレオ信号生成装置 90
L R
に入力される。
[0031] ステレオ信号生成装置 90は、これらの三つのパラメータ、すなわち、時間領域のモ ノラル信号 Μ,、電力スペクトル Ρ ,Ρを用いて、ステレオ信号じ, R'を生成して出力す
t し R
る。
[0032] 次に、図 8を用いて、 LPC分析部 30の構成について説明する。 LPC分析部 30は、 Lチャネル用の LPC分析部 301 aおよび Rチャネル用の LPC分析部 30 lbを含んで 構成される。
[0033] LPC分析部 301aは、 Lチャネル信号 Lの全ての入力フレームに対して LPC分析を 行う。この LPC分析により、 LPC係数 a および LPCゲイン G (k= 1, 2,· ··, P: Pは LP
L,k L
Cフィルタの次数)力 チャネルの LPCパラメータとして得られる。
[0034] また、 LPC分析部 301bは、 Rチャネル信号 Rの全ての入力フレームに対して LPC 分析を行う。この LPC分析により、 LPC係数 a および LPCゲイン G (k= 1, 2,· ··, P: P
R,k R
は LPCフィルタの次数)が Rチャネルの LPCパラメータとして得られる。
[0035] Lチャネルの LPCパラメータおよび Rチャネルの LPCパラメータは多重化部 40でモ ノラルデータと多重され、ビットストリームが生成される。このビットストリームは、通信路 50を介して復号装置へ送信される。
[0036] 次に、図 9を用いて、電力スペクトル演算部 80の構成にっ 、て説明する。電カスペ タトル演算部 80は、インパルス応答形成部 801a、 801b, FT (周波数変換)部 802a 、 802b,対数演算部 803a、 803bを含んで構成される。電力スペクトル演算部 80に は、ビットストリームが分離部 60で分離されることにより得られた各チャネルの LPCパ ラメータ(すなわち、 LPC係数 a a )および LPCゲイン G Gが入力される。
L,k、 R,k し、 R
[0037] Lチャネルについては、インパルス応答形成部 801aが、 LPC係数 a および LPC
L,k
ゲイン Gを用いてインパルス応答 h (n)を形成して FT部 802aに出力する。 FT部 802 し し
aは、インパルス応答 h (n)を周波数領域に変換して伝達関数 H (z)を得る。よって、伝 達関数 H (z)は、以下の式(2)で表される。
[数 2] ( ^ ~ … (2 )
[0038] 対数演算部 803aは、伝達関数応答 H (z)の対数振幅を求めてプロットする。これに より、 Lチャネル信号の近似化された電力スペクトル Pのエンベロープが得られる。電 力スペクトル Pは、以下の式(3)で表される。
[数 3]
Figure imgf000010_0001
[0039] 一方、 Rチャネルについては、インパルス応答形成部 801b力 LPC係数 a および
R,k
LPCゲイン Gを用いてインパルス応答 h (n)を形成して FT部 802bに出力する。 FT
R R
部 802bは、インパルス応答 h (n)を周波数領域に変換して伝達関数 H (z)を得る。よ
R R
つて、伝達関数 H (z)は、以下の式 (4)で表される。
R
画 … (4 )
Figure imgf000010_0002
[0040] 対数演算部 803bは、伝達関数応答 H (z)の対数振幅を求めてプロットする。これに
R
より、 Rチャネル信号の近似化された電力スペクトル Pのエンベロープが得られる。電
R
力スペクトル Pは、以下の式(5)で表される。
R
[数 5]
PR
Figure imgf000010_0003
… (5 )
[0041] Lチャネルの電力スペクトル Pおよび Rチャネルの電力スペクトル Pはステレオ信号
L R
生成装置 90に入力される。また、ステレオ信号生成装置 90には、復号部 70で復号 された時間領域のモノラル信号 M'が入力される。
t
[0042] 次に、図 10を用いて、ステレオ信号生成装置 90の構成について説明する。ステレ ォ信号生成装置 90には、時間領域のモノラル信号 M'、 Lチャネルの電力スペクトル Pおよび Rチャネルの電力スペクトル Pが入力される。
L R
[0043] FT (周波数変換)部 901は、時間領域のモノラル信号 M 'を、周波数変換関数を用
t
いて周波数領域のモノラル信号 M,に変換する。なお、これ以降の説明では、特に明 記しない限り、すべての信号および演算は、周波数領域でのものとする。
[0044] 電力スペクトル演算部 902は、モノラル信号 M 'がゼロでな 、場合、モノラル信号 M ' の電力スペクトル P を以下の式(6)に従って求める。なお、モノラル信号 M 'がゼロで
M,
ある場合、電力スペクトル演算部 902は、電力スペクトル P をゼロに設定する。
M,
[数 6] 尸 M, = 101og(M'2 )= 201Og(|M'|) … ( 6 ) [0045] 減算部 903aは、モノラル信号 M,がゼロでな 、場合、 Lチャネルの電力スペクトル P
L
とモノラル信号の電力スペクトル P との差 D を以下の式(7)に従って求める。なお、
M' PL
モノラル信号 M,がゼロである場合、減算部 903aは、差分値 D をゼロに設定する。
PL
[数 7]
DPL = Pし - ΡΜ· ■■· ( 7 )
[0046] スケーリング比算出部 904aは、差分値 D を用いて、以下の式 (8)に従って Lチヤ
PL
ネルに対するスケーリング比 Sを求める。よって、モノラル信号 M,がゼロである場合、 し
スケーリング比 Sは 1に設定される。
[数 8]
SL = 10 20 … ( 8 )
[0047] 一方、減算部 903bは、モノラル信号 M,がゼロでな 、場合、 Rチャネルの電カスペ タトル Pとモノラル信号の電力スペクトル P との差 D を以下の式(9)に従って求める
R Μ' PR
。なお、モノラル信号 M,がゼロである場合、減算部 903aは、差分値 D をゼロに設定
PR
する。
[数 9]
Figure imgf000011_0001
[0048] スケーリング比算出部 904bは、差分値 D を用いて、以下の式(10)に従って Rチヤ
PR
ネルに対するスケーリング比 Sを求める。よって、モノラル信号 M,がゼロである場合、 スケーリング比 Sは 1に設定される。
R
[数 10] sR = 10 20 ··· ( 1 0 )
[0049] 乗算部 905aは、以下の式(11)に示すように、モノラル信号 M'と Lチャネルに対す るスケーリング比 Sとを乗算する。また、乗算部 905bは、以下の式(12)に示すように し
、モノラル信号 M,と Rチャネルに対するスケーリング比 Sとを乗算する。これらの乗算
R
により、ステレオ信号の Lチャネル信号じ'と Rチャネル信号 R"が生成される。
[数 11]
L" = M' X SL ··· ( 1 1 )
[数 12]
R" = M' X SR ... ( 1 2 )
[0050] 乗算部 905aで得られた Lチャネル信号じ'および乗算部 905bで得られた Rチヤネ ル信号 R"は、信号の大きさについては正しいものの、正負の符号が正しくない場合も ある。よって、この段階で Lチャネル信号じ'および Rチャネル信号 R"を最終的な出力 信号とすると再現性の悪いステレオ信号を出力してしまうことがある。そこで、符号決 定部 100が、以下の処理を行って、 Lチャネル信号じ'および Rチャネル信号 R"の正 しい符号を決定する。
[0051] まず、加算部 906aおよび除算部 907aにより、以下の式(13)に従って、和信号 M を求める。加算部 906aが、 Lチャネル信号じ'と Rチャネル信号 R"とを加算し、その加 算結果を除算部 907aが 2で割る。
[数 13]
Mt = ^~ … ( 1 3 )
2
[0052] また、減算部 906bおよび除算部 907bにより、以下の式(14)に従って、差信号 M を求める。減算部 906aが、 Lチャネル信号じ'と Rチャネル信号 R"との差を求め、その 減算結果を除算部 907bが 2で割る。
[数 14] M。 : ^ - ( 1 4 )
2
[0053] 次に、絶対値算出部 908aが、和信号 M;の絶対値を求め、減算部 910aが、絶対値 算出部 909で算出されるモノラル信号 M'の絶対値と和信号 Mの絶対値との差を求 め、絶対値算出部 911aが、絶対値算出部 910aで算出された差分値の絶対値 D を
Mi 求める。よって、絶対値算出部 911aで算出される絶対値 D は、以下の式(15)によ
Mi
つて表される。この絶対値 D は、比較部 915に入力される。
Mi
[数 15]
IM1- l … (丄 5 )
[0054] 同様に、絶対値算出部 908bが、差信号 Mの絶対値を求め、減算部 910bが、絶対 値算出部 909で算出されるモノラル信号 M'の絶対値と差信号 Mの絶対値との差を 求め、絶対値算出部 911bが、絶対値算出部 910bで算出された差分値の絶対値 D を求める。よって、絶対値算出部 9 l ibで算出される絶対値 D は、以下の式(16)に
o
よって表される。この絶対値 D は、比較部 915に入力される。
o
[数 16]
Figure imgf000013_0001
[0055] 一方、モノラル信号 M'の正負の符号が判定部 912で判定され、判定結果 S が比
M, 較部 915に入力される。また、和信号 Mの正負の符号が判定部 913aで判定され、判 定結果 S が比較部 915に入力される。また、差信号 Mの正負の符号が判定部 913b
Mi o
で判定され、判定結果 S が比較部 915に入力される。さらに、乗算部 905aで得られ
o
た Lチャネル信号じ'がそのまま比較部 915に入力されるとともに、その Lチャネル信 号じ'の符号が反転部 914aで反転され-じ'となって比較部 915に入力される。また、 乗算部 905bで得られた Rチャネル信号 R"がそのまま比較部 915に入力されるととも に、その Rチャネル信号 R"の符号が反転部 914bで反転され- R"となって比較部 915 に入力される。
[0056] 比較部 915は、以下の比較に基づ!/、て Lチャネル信号じ'および Rチャネル信号 R" の正しい符号を決定する。 [0057] 比較部 915では、まず、絶対値 D と絶対値 D との間で比較が行われる。そして、
Mi o
比較部 915は、絶対値 D が絶対値 D 以下の場合は、最終的に出力される時間領
Mi o
域の Lチャネル出力信号じと時間領域の Rチャネル出力信号 R'とが、正負何れかの 同一符号であると決定する。また、比較部 915は、 Lチャネル出力信号じおよび Rチ ャネル出力信号 R'の実際の符号を決定するために、符号 S と符号 S とを比較する。
M' Mi
そして、比較部 915は、符号 S と符号 S とが同一の場合は、正の Lチャネル信号じ'
M' Mi
を Lチャネル出力信号じとし、正の Rチャネル信号 R"を Rチャネル出力信号 R'とする 。一方、符号 S と符号 S とが異なる場合は、比較部 915は、負の Lチャネル信号じ'
' Mi
を Lチャネル出力信号じとし、負の Rチャネル信号 R"を Rチャネル出力信号 R'とする 。この比較部 915での処理をまとめると、以下の式(17)および式(18)のようになる。
[数 17] ifDMi≤DMo and SMi = SM, … (1 7 )
Figure imgf000014_0001
[数 18] ifDMi≤DMo and SMi≠SM, … (1 8 )
Figure imgf000014_0002
[0058] 一方、比較部 915は、絶対値 D が絶対値 D より大きい場合は、最終的に出力さ
Mi o
れる時間領域の Lチャネル出力信号じと時間領域の Rチャネル出力信号 R'とが、互 いに異なる正負何れかの符号であると決定する。また、比較部 915は、 Lチャネル出 力信号じおよび Rチャネル出力信号 R'の実際の符号を決定するために、符号 S と
M, 符号 S とを比較する。そして、比較部 915は、符号 S と符号 S とが同一の場合は、
Mo o
負の Lチャネル信号じ'を Lチャネル出力信号じとし、正の Rチャネル信号 R"を Rチヤ ネル出力信号 R'とする。一方、符号 S と符号 S とが異なる場合は、比較部 915は、
Μ' Mo
正の Lチャネル信号じ'を Lチャネル出力信号じとし、負の Rチャネル信号 R"を Rチヤ ネル出力信号 R'とする。この比較部 915での処理をまとめると、以下の式(19)およ び式(20)のようになる。
[数 19]
Figure imgf000015_0001
[数 20] ifDMi > DMo and SMo≠ S JM' ( 2 0 )
Figure imgf000015_0002
[0059] なお、モノラル信号 M,がゼロである場合は、 Lチャネル信号と Rチャネル信号の双 方がゼロである力 または、 Lチャネル信号と Rチャネル信号とが正負逆であるかのい ずれかである。そこで、符号決定部 100は、モノラル信号 M,がゼロである場合は、一 方のチャネルの信号がそのチャネルにおける直前の信号と同一符号であり、他方の チャネルの信号がその一方のチャネルの信号に対して反対の符号であると決定する 。この符号決定部 100での処理を式により示すと以下の式(21)ある ヽは式(22)のよ うになる。
[数 21]
Figure imgf000015_0003
[数 22]
Figure imgf000015_0004
[0060] また、符号決定部 100は、モノラル信号 M,がゼロである場合は、一方のチャネルの 信号の符号を、そのチャネルにおける直前の信号と直後の信号との平均値の符号と し、他方のチャネルの信号がその一方のチャネルの信号に対して反対の符号である と決定することもできる。この符号決定部 100での処理を式により示すと以下の式(2 3)あるいは式(24)のようになる。
[数 23]
( 2 3 )
Figure imgf000015_0005
[数 24]
Figure imgf000016_0001
[0061] なお、上式(21)〜(24)において、下付き文字「一」および「 +」は、それぞれ、現在 値の計算の基になる直前および直後の値を示す。
[0062] 以上のようにして符号が決定された Lチャネル信号および Rチャネル信号はそれぞ れ、 IFT (逆周波数変換)部 916aおよび IFT部 916bに出力される。そして、 IFT部 9 16aは、周波数領域の Lチャネル信号を時間領域に変換して最終的な Lチャネル出 力信号じとして出力する。また、 IFT部 916bは、周波数領域の Rチャネル信号を時 間領域に変換して最終的な Rチャネル出力信号 R'として出力する。
[0063] 以上のように、出力ステレオ信号の精度は、モノラル信号 M'の精度、および、 Lチヤ ネルおよび Rチャネルの電力スペクトル P ,Ρに関係する。モノラル信号 Μ,が元のモノ
L R
ラル信号 Μに非常に近似しているものと仮定すると、出力ステレオ信号の精度は、 L チャネルおよび Rチャネルの電力スペクトル Ρ ,Ρが元の電力スペクトルにどの位近似
L R
しているかに依存する。電力スペクトル Ρ ,Ρはそれぞれのチャネルの LPCパラメータ し R
力 生成されるので、電力スペクトル Ρ ,Ρの元の電力スペクトルに対する近似度合い し R
は、 LPC分析フィルタのフィルタ次数 Ρに依存する。よって、より高いフィルタ次数 Ρを 有する LPC分析フィルタほど、より正確にスペクトルエンベロープを表わすことができ る。
[0064] なお、ステレオ信号生成装置が図 11に示す構成、すなわち、電力スペクトル演算 部 902に時間領域のモノラル信号 Μ,がそのまま入力される構成を採る場合は、電力
t
スペクトル演算部 902の構成は図 12に示すようになる。
[0065] 図 12において、 LPC分析部 9021は、時間領域のモノラル信号 M,の LPCパラメ一
t
タ、すなわち、 LPCゲインと LPC係数を求める。インパルス応答形成部 9022は、この LPCパラメータを用いて、インパルス応答 h (n)を形成する。 FT (周波数変換)部 90
M,
23は、インパルス応答 h (n)を周波数領域に変換して伝達関数 H (z)を得る。そして
M, M,
、対数演算部 9024が、伝達関数 H (z)の対数を演算して、演算結果に係数 20を乗
M,
算することにより、電力スペクトル P
M,求める。よって、電力スペクトル P
M,は、以下の式( 25)によって表される。
[数 25]
PM, = 20
Figure imgf000017_0001
(z)] … (2 5 )
[0066] また、本発明を、サブバンドを用いる符号ィ匕および復号ィ匕に適用することも可能で ある。この場合の LPC分析部 30の構成は図 13に示すようになり、また、電カスペタト ル演算部 80の構成は図 14に示すようになる。
[0067] 図 13に示す LPC分析部 30において、 SB (サブバンド)分析フィルタ 302a、 302b は、入力される Lチャネル信号および Rチャネル信号を 1〜Nのサブバンドに分離す る。 LPC分析部 303aは、 Lチャネルの各サブバンド 1〜Nに対して LPC分析を行い 、各サブバンド毎に、 LPC係数 a および LPCゲイン G (k= 1 , 2, · · · , P : Pは LPCフィ
L,k L
ルタの次数)を Lチャネルの LPCパラメータとして得る。また、 LPC分析部 303bは、 R チャネルの各サブバンド 1〜Nに対して LPC分析を行い、各サブバンド毎に、 LPC係 数 a および LPCゲイン G (k= 1 , 2, · · · , P : Pは LPCフィルタの次数)を Rチャネルの L
R,k R
PCパラメータとして得る。各サブバンドの Lチャネルの LPCパラメータおよび Rチヤネ ルの LPCパラメータは多重化部 40でモノラルデータと多重され、ビットストリームが生 成される。このビットストリームは、通信路 50を介して復号装置へ送信される。
[0068] 図 14に示す電力スペクトル演算部 80において、インパルス応答形成部 804aは、 各サブバンド 1〜Nの LPC係数 a および LPCゲイン Gを用いて、各サブバンド毎に
L,k L
インパルス応答 h (n)を形成して FT部 805aに出力する。 FT部 805aは、サブバンド 1 し
〜Nのインパルス応答 h (n)を周波数領域に変換してサブバンド 1〜Nの伝達関数 H し
(z)を得る。そして、対数演算部 806aは、各サブバンド 1〜Nの伝達関数応答 H (z)の し し 対数振幅を求めて、サブバンド毎の電力スペクトル Pを得る。
L
[0069] 一方、 Rチャネルについては、インパルス応答形成部 804b力 各サブバンド 1〜N の LPC係数 a および LPCゲイン Gを用いて、各サブバンド毎にインパルス応答 h (n
R,k R R
)を形成して FT部 805bに出力する。 FT部 805bは、サブバンド 1〜Nのインパルス応 答 h (n)を周波数領域に変換してサブバンド 1〜Nの伝達関数 H (z)を得る。そして、
R R
対数演算部 806bは、各サブバンド 1〜Nの伝達関数応答 H (z)の対数振幅を求めて
R
、サブバンド毎の電力スペクトル Pを得る。 [0070] このように、復号装置では、各サブパンドにっ 、て、上述したのと同様の処理が行 われる。全てのサブバンドに対して上述したのと同様の処理がなされた後、サブバン ド合成フィルタが、全てのサブバンドの出力を合成して、最終的な出力ステレオ信号 を生成する。
[0071] 次に、具体的な数値例 1〜4を以下に示す。なお、以下の例で挙げた数値はすべ て周波数領域のものである。
[0072] <例 1 >
符号化装置において、 L = 3781、 R = 7687、 M = 5734とする。また、復号装置にお いて、 P = 71.82dB、 P = 77.51dB、 M' = 5846、よって、 P =75.3372dBとする。その結
L R M
果、 Lチャネルについては表 1、 Rチャネルについては表 2に示すようになる。
[表 1]
Figure imgf000018_0001
[表 2]
Figure imgf000018_0002
[0073] この場合、 D 力 ¾ 以下で、また、 M,と Mの両符号が同一であるので、 Lチャネル
Mi Mo i
出力信号じおよび Rチャネル出力信号 R'は以下のようになる。
し, =し,' = 3899.40
R' = R" = 7507.55
[0074] <例 2>
符号化装置において、 L = -3781、 R = -7687、 M = -5734とする。また、復号装置に おいて、 P = 71.82dB、 P = 77.51dB、 M, = -5846、よって、 P = 75.3372dBとする。そ
L M
の結果、 Lチャネルについては表 3、 Rチャネルについては表 4に示すようになる。
[¾3]
Figure imgf000018_0003
[表 4] DPR sR R" M。 DM„ SM。
77. 51 2. 1728 1. 28422 -7507. 55 -1804. 08 4041. 93 - -
[0075] この場合、 D 力 ¾ 以下で、また、 M'と Mの両符号が同一であるので、 Lチャネル
Mi Mo i
出力信号じおよび Rチャネル出力信号 R'は以下のようになる。
し, =し,,: -3899.40
R' = R" = -7507.55
[0076] <例 3〉
符号化装置において、 L = -3781、 R = 7687、 M = 1953とする。また、復号装置にお いて、 P = 71.82dB、 P = 77.51dB、 M, = 1897、よって、 P = 65.5613dBとする。その
L M
結果、 Lチャネルについては表 5、 Rチャネルについては表 6に示すようになる。
[表 5]
Figure imgf000019_0001
[表 6]
Figure imgf000019_0002
[0077] この場合、 D が より大きぐまた、 M'と Mの両符号が同一であるので、 Lチヤネ
Mi Mo l
ル出力信号じおよび Rチャネル出力信号 R'は以下のようになる。
L' = -L" = -3899.40
R' = R" = 7507.55
[0078] <例 4>
符号化装置において、 L = 3781、 R = -7687、 M = -1953とする。また、復号装置に おいて、 P = 71.82dB、 P = 77.51dB、M, = -1897、よって、 P = 65.5613dBとする。そ
L M
の結果、 Lチャネルについては表 7、 Rチャネルについては表 8に示すようになる。
[表 7]
Figure imgf000019_0003
[表 8]
Figure imgf000020_0001
[0079] この場合、 D が D より大きぐまた、 M'の符号と Mの符号が相違するので、 Lチヤ
Mi Mo i
ネル出力信号じおよび Rチャネル出力信号 R'は以下のようになる。
L' = L" = 3899.40
R' = -R" = -7507.55
[0080] 以上、く例 1 >〜く例 4>の結果からわ力るように、符号ィ匕装置に入力される Lチヤ ネル信号 L及び Rチャネル信号 Rの値と、最終的に出力される Lチャネル信号じ及 び Rチャネル信号 R'の値とを比較すると、モノラル信号 M及び M,の値に関わらず、 それぞれのチャネルにおいて近い値が得られている。よって、本発明により再現性の 良 、ステレオ信号が得られることが確認された。
[0081] なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路 である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部又は全 てを含むように 1チップィ匕されても良い。
[0082] ここでは、 LSIとした力 集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥ ノレ卜ラ LSIと呼称されることちある。
[0083] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサ で実現しても良い。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィ ギュラブノレ ·プロセッサーを利用しても良 、。
[0084] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行って も良い。バイオ技術の適応等が可能性としてありえる。
[0085] 本明細書は、 2004年 8月 31日出願の特願 2004— 252027に基づくものである。
この内容はすべてここに含めておく。
産業上の利用可能性
[0086] 本発明は、デジタルオーディオ信号およびデジタル音声信号の送信、配信および 蓄積メディア等に利用することが可能である。

Claims

請求の範囲
[1] ステレオ信号の左右各チャネルの信号力 得られた時間領域のモノラル信号を周 波数領域のモノラル信号に変換する変換手段と、
前記周波数領域のモノラル信号の第 1の電力スペクトルを求める電力算出手段と、 前記第 1の電力スペクトルと前記ステレオ信号の左チャネルの電力スペクトルとの第 1の差力も前記左チャネルに対する第 1のスケーリング比を求めるとともに、前記第 1 の電力スペクトルと前記ステレオ信号の右チャネルの電力スペクトルとの第 2の差から 前記右チャネルに対する第 2のスケーリング比を求めるスケーリング比算出手段と、 前記周波数領域のモノラル信号に前記第 1のスケーリング比を乗算して前記ステレ ォ信号の左チャネル信号を生成するとともに、前記周波数領域のモノラル信号に前 記第 2のスケーリング比を乗算して前記ステレオ信号の右チャネル信号を生成する乗 算手段と、
を具備するステレオ信号生成装置。
[2] 前記スケーリング比算出手段は、前記周波数領域のモノラル信号がゼロである場 合、前記第 1のスケーリング比および前記第 2のスケーリング比を 1に設定する、 請求項 1記載のステレオ信号生成装置。
[3] 前記乗算手段で生成された前記左チャネル信号および前記右チャネル信号の正 負の符号を決定する決定手段、
をさらに具備する請求項 1記載のステレオ信号生成装置。
[4] 前記決定手段は、
前記左チャネル信号と前記右チャネル信号の和信号の絶対値と前記周波数領域 のモノラル信号の絶対値との差の第 1の絶対値が、前記左チャネル信号と前記右チ ャネル信号の差信号の絶対値と前記周波数領域のモノラル信号の絶対値との差の 第 2の絶対値以下の場合、前記左チャネル信号の符号と前記右チャネル信号の符 号とが同一符号であると決定する、
請求項 3記載のステレオ信号生成装置。
[5] 前記決定手段は、
前記左チャネル信号と前記右チャネル信号の和信号の絶対値と前記周波数領域 のモノラル信号の絶対値との差の第 1の絶対値が、前記左チャネル信号と前記右チ ャネル信号の差信号の絶対値と前記周波数領域のモノラル信号の絶対値との差の 第 2の絶対値より大き 、場合、前記左チャネル信号の符号と前記右チャネル信号の 符号とが異なる符号であると決定する、
請求項 3記載のステレオ信号生成装置。
[6] 前記決定手段は、
前記周波数領域のモノラル信号の符号と前記和信号の符号とが同一符号である場 合、前記左チャネル信号の符号および前記右チャネル信号の符号を正の符号に決 定する、
請求項 3記載のステレオ信号生成装置。
[7] 前記決定手段は、
前記周波数領域のモノラル信号の符号と前記和信号の符号とが異なる符号である 場合、前記左チャネル信号の符号および前記右チャネル信号の符号を負の符号に 決定する、
請求項 3記載のステレオ信号生成装置。
[8] 前記決定手段は、
前記周波数領域のモノラル信号の符号と前記差信号の符号とが同一符号である場 合、前記左チャネル信号の符号を負の符号に、前記右チャネル信号の符号を正の 符号に決定する、
請求項 3記載のステレオ信号生成装置。
[9] 前記決定手段は、
前記周波数領域のモノラル信号の符号と前記差信号の符号とが異なる符号である 場合、前記左チャネル信号の符号を正の符号に、前記右チャネル信号の符号を負 の符号に決定する、
請求項 3記載のステレオ信号生成装置。
[10] 前記決定手段は、
前記周波数領域のモノラル信号がゼロである場合、前記左チャネル信号の符号を 、前記左チャネル信号の直前の左チャネル信号の符号と同一符号に決定するととも に、前記右チャネル信号の符号を、決定した前記左チャネル信号の符号と異なる符 号に決定する、
請求項 3記載のステレオ信号生成装置。
[11] 前記決定手段は、
前記周波数領域のモノラル信号がゼロである場合、前記右チャネル信号の符号を 、前記右チャネル信号の直前の右チャネル信号の符号と同一符号に決定するととも に、前記左チャネル信号の符号を、決定した前記右チャネル信号の符号と異なる符 号に決定する、
請求項 3記載のステレオ信号生成装置。
[12] 前記決定手段は、
前記周波数領域のモノラル信号がゼロである場合、前記左チャネル信号の符号を 、前記左チャネル信号の直前および直後の 2つの左チャネル信号の値の平均値の 符号に決定するとともに、前記右チャネル信号の符号を、決定した前記左チャネル 信号の符号と異なる符号に決定する、
請求項 3記載のステレオ信号生成装置。
[13] 前記決定手段は、
前記周波数領域のモノラル信号がゼロである場合、前記右チャネル信号の符号を 、前記右チャネル信号の直前および直後の 2つの右チャネル信号の値の平均値の 符号に決定するとともに、前記左チャネル信号の符号を、決定した前記右チャネル 信号の符号と異なる符号に決定する、
請求項 3記載のステレオ信号生成装置。
[14] 請求項 1記載のステレオ信号生成装置を具備する復号装置。
[15] ステレオ信号の左右各チャネルの信号をダウンミタスして時間領域のモノラル信号 を得るダウンミクス手段と、
前記モノラル信号を符号ィヒしてモノラルデータを得る符号ィヒ手段と、
前記左右各チャネルの信号を LPC分析して前記左右各チャネルの LPCパラメータ を得る分析手段と、
前記モノラルデータと前記左右各チャネルの LPCパラメータとを多重して復号装置 へ送信する多重化手段と、
を具備する符号化装置。
ステレオ信号の左右各チャネルの信号カゝら得られた時間領域のモノラル信号を周 波数領域のモノラル信号に変換する変換工程と、
前記周波数領域のモノラル信号の第 1の電力スペクトルを求める電力算出工程と、 前記第 1の電力スペクトルと前記ステレオ信号の左チャネルの電力スペクトルとの第 1の差力も前記左チャネルに対する第 1のスケーリング比を求めるとともに、前記第 1 の電力スペクトルと前記ステレオ信号の右チャネルの電力スペクトルとの第 2の差から 前記右チャネルに対する第 2のスケーリング比を求めるスケーリング比算出工程と、 前記周波数領域のモノラル信号に前記第 1のスケーリング比を乗算して前記ステレ ォ信号の左チャネル信号を生成するとともに、前記周波数領域のモノラル信号に前 記第 2のスケーリング比を乗算して前記ステレオ信号の右チャネル信号を生成する乗 算工程と、
を具備するステレオ信号生成方法。
PCT/JP2005/015674 2004-08-31 2005-08-29 ステレオ信号生成装置およびステレオ信号生成方法 WO2006025337A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US11/573,760 US8019087B2 (en) 2004-08-31 2005-08-29 Stereo signal generating apparatus and stereo signal generating method
BRPI0515128-7A BRPI0515128A (pt) 2004-08-31 2005-08-29 aparelho de geração de sinal estéreo e método de geração de sinal estéreo
EP05775181A EP1786239A1 (en) 2004-08-31 2005-08-29 Stereo signal generating apparatus and stereo signal generating method
JP2006532681A JP4832305B2 (ja) 2004-08-31 2005-08-29 ステレオ信号生成装置およびステレオ信号生成方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-252027 2004-08-31
JP2004252027 2004-08-31

Publications (1)

Publication Number Publication Date
WO2006025337A1 true WO2006025337A1 (ja) 2006-03-09

Family

ID=35999990

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/015674 WO2006025337A1 (ja) 2004-08-31 2005-08-29 ステレオ信号生成装置およびステレオ信号生成方法

Country Status (8)

Country Link
US (1) US8019087B2 (ja)
EP (1) EP1786239A1 (ja)
JP (1) JP4832305B2 (ja)
KR (1) KR20070056081A (ja)
CN (1) CN101010985A (ja)
BR (1) BRPI0515128A (ja)
RU (1) RU2007107348A (ja)
WO (1) WO2006025337A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008102527A1 (ja) * 2007-02-20 2008-08-28 Panasonic Corporation マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
JP2018511827A (ja) * 2015-03-09 2018-04-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
JP2021196562A (ja) * 2020-06-17 2021-12-27 Toa株式会社 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
US8103516B2 (en) * 2005-11-30 2012-01-24 Panasonic Corporation Subband coding apparatus and method of coding subband
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
CA2874451C (en) * 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
WO2008088741A2 (en) 2007-01-12 2008-07-24 Ictv, Inc. Interactive encoded content system including object models for viewing on a remote device
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
WO2010084756A1 (ja) * 2009-01-22 2010-07-29 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
CN105225667B (zh) 2009-03-17 2019-04-05 杜比国际公司 编码器系统、解码器系统、编码方法和解码方法
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
AU2011315950B2 (en) 2010-10-14 2015-09-03 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
EP2523472A1 (en) 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
EP2815582B1 (en) 2012-01-09 2019-09-04 ActiveVideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
MX345622B (es) * 2013-01-29 2017-02-08 Fraunhofer Ges Forschung Decodificador para generar una señal de audio mejorada en frecuencia, método de decodificación, codificador para generar una señal codificada y metodo de codificación utilizando informacion secundaria de selección compacta.
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
JP2016536856A (ja) * 2013-10-02 2016-11-24 ストーミングスイス・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 二つ以上の基本信号からのマルチチャンネル信号の導出
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
KR20180075610A (ko) * 2015-10-27 2018-07-04 앰비디오 인코포레이티드 사운드 스테이지 향상을 위한 장치 및 방법
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
US11176954B2 (en) * 2017-04-10 2021-11-16 Nokia Technologies Oy Encoding and decoding of multichannel or stereo audio signals

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0847096A (ja) * 1994-06-28 1996-02-16 Internatl Business Mach Corp <Ibm> ディジタル・サラウンド・サウンド方法及び装置
JP2002050969A (ja) * 2000-08-03 2002-02-15 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 通信路復号方法および装置
JP2004112825A (ja) * 1995-10-25 2004-04-08 Sarnoff Corp ビデオ画像符号化方法
JP2004173250A (ja) * 2002-11-21 2004-06-17 Microsoft Corp 複数因子分解可逆変換(multiplefactorizationreversibletransform)を用いたプログレッシブ・ツー・ロスレス埋込みオーディオ・コーダ(ProgressivetoLosslessEmbeddedAudioCoder:PLEAC)
JP2004537739A (ja) * 2000-10-18 2004-12-16 ノキア コーポレーション 音声コーデックにおける擬似高帯域信号の推定方法およびシステム
JP2005519339A (ja) * 2002-03-08 2005-06-30 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ システムの伝送品質を測定する方法及びシステム
JP2005534947A (ja) * 2001-11-20 2005-11-17 シーラス ロジック,インコーポレイテッド 心理音響ベースで圧縮する際に形成されるノイズの許容可能な歪みに基づくスケールファクタのフィードフォワード予測

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US6230130B1 (en) 1998-05-18 2001-05-08 U.S. Philips Corporation Scalable mixing for speech streaming
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP3598993B2 (ja) 2001-05-18 2004-12-08 ソニー株式会社 符号化装置及び方法
JP2003015697A (ja) 2001-06-29 2003-01-17 Matsushita Electric Ind Co Ltd オーディオ符号化用のビット割当て方法
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
ES2280736T3 (es) 2002-04-22 2007-09-16 Koninklijke Philips Electronics N.V. Sintetizacion de señal.
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
JP2006503319A (ja) 2002-10-14 2006-01-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号フィルタリング
CN1748443B (zh) * 2003-03-04 2010-09-22 诺基亚有限公司 多声道音频扩展支持
ES2295837T3 (es) * 2004-03-12 2008-04-16 Nokia Corporation Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada.
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0847096A (ja) * 1994-06-28 1996-02-16 Internatl Business Mach Corp <Ibm> ディジタル・サラウンド・サウンド方法及び装置
JP2004112825A (ja) * 1995-10-25 2004-04-08 Sarnoff Corp ビデオ画像符号化方法
JP2002050969A (ja) * 2000-08-03 2002-02-15 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 通信路復号方法および装置
JP2004537739A (ja) * 2000-10-18 2004-12-16 ノキア コーポレーション 音声コーデックにおける擬似高帯域信号の推定方法およびシステム
JP2005534947A (ja) * 2001-11-20 2005-11-17 シーラス ロジック,インコーポレイテッド 心理音響ベースで圧縮する際に形成されるノイズの許容可能な歪みに基づくスケールファクタのフィードフォワード予測
JP2005519339A (ja) * 2002-03-08 2005-06-30 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ システムの伝送品質を測定する方法及びシステム
JP2004173250A (ja) * 2002-11-21 2004-06-17 Microsoft Corp 複数因子分解可逆変換(multiplefactorizationreversibletransform)を用いたプログレッシブ・ツー・ロスレス埋込みオーディオ・コーダ(ProgressivetoLosslessEmbeddedAudioCoder:PLEAC)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008102527A1 (ja) * 2007-02-20 2008-08-28 Panasonic Corporation マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
JP5328637B2 (ja) * 2007-02-20 2013-10-30 パナソニック株式会社 マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11238874B2 (en) 2015-03-09 2022-02-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10395661B2 (en) 2015-03-09 2019-08-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP2020038374A (ja) * 2015-03-09 2020-03-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US10777208B2 (en) 2015-03-09 2020-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11107483B2 (en) 2015-03-09 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP7469350B2 (ja) 2015-03-09 2024-04-16 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US10388287B2 (en) 2015-03-09 2019-08-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP7077290B2 (ja) 2015-03-09 2022-05-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
JP2022088470A (ja) * 2015-03-09 2022-06-14 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
JP2018511827A (ja) * 2015-03-09 2018-04-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US11881225B2 (en) 2015-03-09 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP7385531B2 (ja) 2020-06-17 2023-11-22 Toa株式会社 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法
JP2021196562A (ja) * 2020-06-17 2021-12-27 Toa株式会社 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法

Also Published As

Publication number Publication date
JPWO2006025337A1 (ja) 2008-05-08
JP4832305B2 (ja) 2011-12-07
US8019087B2 (en) 2011-09-13
RU2007107348A (ru) 2008-09-10
CN101010985A (zh) 2007-08-01
KR20070056081A (ko) 2007-05-31
BRPI0515128A (pt) 2008-07-08
EP1786239A1 (en) 2007-05-16
US20080154583A1 (en) 2008-06-26

Similar Documents

Publication Publication Date Title
JP4832305B2 (ja) ステレオ信号生成装置およびステレオ信号生成方法
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
JP4963962B2 (ja) マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
US8290783B2 (en) Apparatus for mixing a plurality of input data streams
EP2109861B1 (en) Audio decoder
RU2409911C2 (ru) Декодирование бинауральных аудиосигналов
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
US8352249B2 (en) Encoding device, decoding device, and method thereof
US20130230176A1 (en) Method and an Apparatus for Encoding/Decoding a Multichannel Audio Signal
US8036390B2 (en) Scalable encoding device and scalable encoding method
WO2006035810A1 (ja) スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
US20080162148A1 (en) Scalable Encoding Apparatus And Scalable Encoding Method
US8548615B2 (en) Encoder
JPWO2008132826A1 (ja) ステレオ音声符号化装置およびステレオ音声符号化方法
JP2006323314A (ja) マルチチャネル音声信号をバイノーラルキュー符号化する装置
KR20070035410A (ko) 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006532681

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2005775181

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 11573760

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 200580028704.9

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2007107348

Country of ref document: RU

WWE Wipo information: entry into national phase

Ref document number: 1020077004878

Country of ref document: KR

NENP Non-entry into the national phase

Ref country code: DE

WWP Wipo information: published in national office

Ref document number: 2005775181

Country of ref document: EP

ENP Entry into the national phase

Ref document number: PI0515128

Country of ref document: BR