JP5426680B2 - Signal processing method and apparatus - Google Patents
Signal processing method and apparatus Download PDFInfo
- Publication number
- JP5426680B2 JP5426680B2 JP2011528941A JP2011528941A JP5426680B2 JP 5426680 B2 JP5426680 B2 JP 5426680B2 JP 2011528941 A JP2011528941 A JP 2011528941A JP 2011528941 A JP2011528941 A JP 2011528941A JP 5426680 B2 JP5426680 B2 JP 5426680B2
- Authority
- JP
- Japan
- Prior art keywords
- inter
- phase difference
- channel
- difference value
- channel phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title description 20
- 238000000034 method Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 37
- 230000004807 localization Effects 0.000 claims description 28
- 238000012937 correction Methods 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 description 49
- 230000010363 phase shift Effects 0.000 description 44
- 238000010586 diagram Methods 0.000 description 35
- 238000013139 quantization Methods 0.000 description 24
- 238000005259 measurement Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 6
- 230000016507 interphase Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 101100500467 Arabidopsis thaliana EAAC gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、入力された信号の位相を偏移(shift)させた信号を利用し、該位相の偏移した信号のチャネル間位相差値を用いることによって、信号の音質を向上させ、入力された信号をより完壁に復元することができる信号処理方法及び装置に関するものである。 The present invention improves the sound quality of a signal by using a signal obtained by shifting the phase of an input signal and using an inter-channel phase difference value of the signal whose phase is shifted. The present invention relates to a signal processing method and apparatus capable of restoring a complete signal more completely.
一般に、モノ信号からステレオ信号を生成するためにデコリレータを用いて信号を符号化することができる。 In general, a signal can be encoded using a decorrelator to generate a stereo signal from a mono signal.
また、信号処理装置においてチャネル間レベル差値及びチャネル間相関値を用いて信号を符号化することができる。 Further, the signal processing apparatus can encode the signal using the inter-channel level difference value and the inter-channel correlation value.
音声信号をデコリレータを用いて生成する場合、デコリレータはチャネル信号間に存在する位相差又は遅延差を正確に再生できないという問題点がある。 When an audio signal is generated using a decorrelator, there is a problem that the decorrelator cannot accurately reproduce a phase difference or delay difference existing between channel signals.
また、チャネル間レベル差値及びチャネル間相関値を用いて信号を符号化する場合、入力信号のチャネル間位相差を復元して反映することができず、正確な音像の定位(localization)を行い難いうえに、入力信号の残響(reverberation)も復元できないという問題点がある。 Also, when a signal is encoded using the inter-channel level difference value and the inter-channel correlation value, the inter-channel phase difference of the input signal cannot be restored and reflected, and accurate sound image localization is performed. In addition, there is a problem that reverberation of the input signal cannot be restored.
本発明は、上記の問題点を解決するために案出されたもので、その目的は、復号されたオーディオ信号又は音声信号の位相を、チャネル間位相差値及び位相移動フラグを用いて復元及び偏移することによって、音質を向上させ、原音に近づかせることができる信号処理方法及び装置を提供することにある。 The present invention has been devised to solve the above-described problems, and its purpose is to restore and decode the phase of a decoded audio signal or audio signal using an inter-channel phase difference value and a phase shift flag. It is an object of the present invention to provide a signal processing method and apparatus capable of improving sound quality and approaching an original sound by shifting.
本発明は、下記のような効果及び利点を提供する。 The present invention provides the following effects and advantages.
第一に、本発明の信号処理方法及び装置は、位相偏移フラグに基づいて、復号されたオーディオ信号又は音声信号の位相を偏移させることで、復号時にデコリレータによっては効率的に再生し難い位相差又は遅延差を効率的に再生することができるという効果を有する。 First, the signal processing method and apparatus according to the present invention shifts the phase of the decoded audio signal or audio signal based on the phase shift flag, so that it is difficult to efficiently reproduce by the decorrelator at the time of decoding. There is an effect that the phase difference or the delay difference can be efficiently reproduced.
第二に、本発明の信号処理方法及び装置は、チャネル間位相差符号化フラグ及びチャネル間位相差モードフラグに基づいて、チャネル間位相差値を用いることで、チャネル間レベル差値及びチャネル間相関値によっては復元し難い残響を復元し、音像の定位を正確にすることができる。 Second, the signal processing method and apparatus according to the present invention uses the inter-channel phase difference value based on the inter-channel phase difference encoding flag and the inter-channel phase difference mode flag, so that the inter-channel level difference value and the inter-channel phase difference value Depending on the correlation value, reverberation that is difficult to restore can be restored, and the localization of the sound image can be made accurate.
第三に、本発明の信号処理方法及び装置は、フレームごとにチャネル間位相差値を用いているか否かを示すチャネル間位相差モードフラグを受信することによって、必要に応じてチャネル間位相差値を用いて信号を復号することができる。 Third, the signal processing method and apparatus according to the present invention receives an inter-channel phase difference mode flag indicating whether or not an inter-channel phase difference value is used for each frame, so that an inter-channel phase difference is obtained as necessary. The value can be used to decode the signal.
第四に、本発明の信号処理方法及び装置は、先行する(previous)パラメータタイムスロットのチャネル間位相差値を用いて現在のパラメータタイムスロットのチャネル間位相差値を修正(平滑化(smoothing))することで、チャネル間位相差値の差によって一時的に生じうる雑音を除去できるという効果を有する。 Fourth, the signal processing method and apparatus of the present invention corrects (smoothings) the inter-channel phase difference value of the current parameter time slot using the inter-channel phase difference value of the preceding parameter time slot. ), It is possible to remove noise that may be temporarily generated due to the difference in the phase difference value between channels.
第五に、本発明の信号処理方法及び装置は、一定条件を満たす場合にのみチャネル間位相差値を伝送することによって符号化効率を向上させ、原音に近い信号として復号することができる。 Fifth, the signal processing method and apparatus of the present invention can improve the coding efficiency by transmitting the inter-channel phase difference value only when a certain condition is satisfied, and can decode it as a signal close to the original sound.
第六に、本発明の信号処理方法及び装置は、エンコーダで測定されたチャネル間位相差値をチャネル間レベル差値に変換して伝送することによって、チャネル間位相差値の伝送を許容しない既存の信号処理装置及び方法を用いる場合にも、残響を強化し、音像の定位が原音に近い信号として復元できるという効果(後方互換性)を有する。 Sixth, the signal processing method and apparatus of the present invention converts the inter-channel phase difference value measured by the encoder into an inter-channel level difference value and transmits it, thereby not allowing the transmission of the inter-channel phase difference value. In the case of using the signal processing apparatus and method, the reverberation is enhanced and the sound image localization can be restored as a signal close to the original sound (backward compatibility).
以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。これに先立ち、本明細書及び請求の範囲に使われた用語や単語は通常的または辞典的な意味に限定して解釈してはならず、発明者は自身の発明を最善の方法で説明するために用語の概念を適宜定義することができるという原則に立って、本発明の技術的思想に符合する意味と概念として解釈すべきであるということを明らかにしておきたい。したがって、本明細書に記載された実施例及び図面に示す構成は本発明の最も好適な一実施例に過ぎないもので、本発明の技術的思想を全部代弁するものではないので、本出願時点においてそれらを代替できる種々の均等物及び変形例が存在しうるということが理解されるであろう。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, the terms and words used in the specification and claims should not be construed in a normal or lexical sense, and the inventor will explain his invention in the best possible manner. Therefore, it should be clarified that it should be interpreted as a meaning and concept consistent with the technical idea of the present invention based on the principle that the concept of the term can be defined as appropriate. Therefore, the configuration shown in the embodiments and drawings described in the present specification is only the most preferred embodiment of the present invention and does not represent the technical idea of the present invention. It will be understood that there may be various equivalents and variations that can be substituted in
特に、本発明でいう符号化とは、符号化及び復号の両方を含む概念として理解すべきである。 In particular, the encoding in the present invention should be understood as a concept including both encoding and decoding.
また、本明細書でいう情報とは、値、パラメータ、係数、要素などを総称する用語で、場合によって異なる意味として解釈されるが、本発明はこれに限定されない。そして、本明細書で信号の一例としてステレオ信号を挙げて説明するが、これに限定されず、3以上の複数のチャネルを有する複数チャネル信号とすることもできる。 In addition, the information in the present specification is a term that collectively refers to values, parameters, coefficients, elements, and the like, and is interpreted as meanings that differ depending on the case, but the present invention is not limited thereto. In this specification, a stereo signal is described as an example of a signal. However, the present invention is not limited to this, and a multi-channel signal having three or more channels may be used.
図1は、本発明の一実施例による信号処理方法の概念を示す概念図であり、空間情報のビットストリームを示している。図1を参照すると、空間情報は、ヘッダ及び複数個のフレームに区分することができる。ここで、空間情報は、入力信号である複数チャネル信号の属性を表す情報であり、複数チャネルのうちの2チャネル間のレベル差を表すチャネル間レベル差値、2チャネル間の相関度を表すチャネル間相関値、及び2チャネル間の位相差を表すチャネル間位相差値を含むことができる。これらは、デコーダで、複数チャネル信号をダウンミックスして生成されたダウンミックス信号をアップミックスして復元するのに用いることができる。 FIG. 1 is a conceptual diagram showing a concept of a signal processing method according to an embodiment of the present invention, and shows a bit stream of spatial information. Referring to FIG. 1, the spatial information can be divided into a header and a plurality of frames. Here, the spatial information is information that represents attributes of a plurality of channel signals that are input signals, a channel-to-channel level difference value that represents a level difference between two channels of the plurality of channels, and a channel that represents the degree of correlation between two channels An inter-channel correlation value and an inter-channel phase difference value representing a phase difference between two channels can be included. These can be used by a decoder to upmix and restore a downmix signal generated by downmixing a plurality of channel signals.
空間情報のヘッダは、全フレーム中にチャネル間位相差値を用いるフレームがあるか否かを示すチャネル間位相差符号化フラグ(bsPhaseCoding)を含む。すなわち、チャネル間位相差符号化フラグがヘッダに含まれることによって、空間情報の全フレームにおいてチャネル間位相差値が用いられるか否かを判断することができる。チャネル間位相差符号化フラグの意味を、下記の表1に示す。 The header of the spatial information includes an inter-channel phase difference encoding flag (bsPhaseCoding) indicating whether or not there is a frame using the inter-channel phase difference value in all frames. That is, by including the inter-channel phase difference encoding flag in the header, it can be determined whether or not the inter-channel phase difference value is used in all frames of the spatial information. The meaning of the inter-channel phase difference encoding flag is shown in Table 1 below.
また、空間情報は、フレームでチャネル間位相差値が用いられているか否かを示すチャネル間位相差モードフラグ(bsPhaseMode)をフレームごとに含む。チャネル間位相差モードフラグは、チャネル間位相差符号化フラグが1である場合、すなわち、チャネル間位相差符号化フラグが、空間情報にIPD符号化が用いられることを示す場合にのみ、フレームに含まれる。チャネル間位相差モードフラグ(bsPhaseMode)の具体的な意味は、下記の表2の通りである。 The spatial information includes an inter-channel phase difference mode flag (bsPhaseMode) indicating whether or not an inter-channel phase difference value is used in the frame for each frame. The inter-channel phase difference mode flag is only included in the frame when the inter-channel phase difference encoding flag is 1, that is, when the inter-channel phase difference encoding flag indicates that IPD encoding is used for spatial information. included. The specific meaning of the inter-channel phase difference mode flag (bsPhaseMode) is as shown in Table 2 below.
再び図1を参照すると、フレーム2のチャネル間位相差モードフラグが1であれば(bsPhaseMode=1)、フレーム2にチャネル間位相差値(IPD)として0でない値が含まれ、フレーム3のチャネル間位相差モードフラグが0であれば(bsPhaseMode=0)、フレーム3にチャネル間位相差値(IPD)として0の値が含まれる。
Referring to FIG. 1 again, if the inter-channel phase difference mode flag of
したがって、チャネル間位相差符号化フラグ及びチャネル間位相差モードフラグに基づいてチャネル間位相差値を取得し、これをダウンミックス信号に適用して複数チャネル信号にアップミックスすることができる。 Therefore, an inter-channel phase difference value is acquired based on the inter-channel phase difference encoding flag and the inter-channel phase difference mode flag, and this can be applied to the downmix signal and upmixed to a plurality of channel signals.
図2は、本発明の一実施例による信号処理装置を示すブロック図である。図2を参照すると、信号処理装置200は、ダウンミキシング部210、空間情報生成部220、情報取得部230及びアップミキシング部240を含む。
FIG. 2 is a block diagram illustrating a signal processing apparatus according to an embodiment of the present invention. Referring to FIG. 2, the
ダウンミキシング部210は、複数チャネル信号を入力してダウンミックス信号(DMX)を生成することができる。複数チャネル信号は、3以上のチャネルを有する信号であってもよいし、モノ又はステレオチャネルを有する信号であってもよい。ダウンミキシング部210は、複数チャネル信号をダウンミックスすることで、複数チャネル信号のチャネル数よりも少ない数のチャネルを有するダウンミックス信号を生成することができる。
The
空間情報生成部220は、図1で説明したとおり、ダウンミックス信号を後でデコーダでアップミックスするための空間情報を生成し、該空間情報は複数チャネル信号の属性を示すことができる。空間情報は、上述のように、チャネル間レベル差値、チャネル間相関値及びチャネル間位相差値などを含むことができるが、ここでは、図2の空間情報生成部220を参照してチャネル間位相差値について具体的に説明する。
As described with reference to FIG. 1, the spatial
空間情報生成部220は、IPD利用決定部221、IPD値測定部222、IPDモードフラグ生成部223、及びIPD符号化フラグ生成部224を含む。IPD利用決定部221は、空間情報にチャネル間の位相差(IPD)値を含めるか否かを決定でき、特に、複数チャネル信号の特性、チャネル間位相差値とチャネル間レベル差値との比率に基づいて、チャネル間位相差値を含めるか否かを決定することができる。
The spatial
例えば、複数チャネル信号が音声信号である場合、チャネル間位相差値を空間情報に含めると決定することができる。その詳細は後述する。 For example, when the multi-channel signal is an audio signal, it can be determined that the inter-channel phase difference value is included in the spatial information. Details thereof will be described later.
IPD値測定部222は、IPD利用決定部221が、チャネル間位相差値を用いると決定した場合、空間情報生成部200に入力された複数チャネル信号から2チャネル間の位相差を測定する。該測定された位相差は、位相及び/又は角度であってもよいし、時間差であってもよいし、角度又は時間差に対応するインデックス値であってもよい。信号において位相と時間差は密接な関係を有するが、これについての詳細は、図3を参照して後述する。
When the IPD
IPDモードフラグ生成部223は、図1を参照して上述したチャネル間位相差モードフラグ(bsPhaseMode)を生成する。すなわち、チャネル間位相差値がフレームで用いられているか否かを示し、ここで、フレームは、チャネル間位相差値が含まれている現在フレーム(current frame)でありうる。したがって、チャネル間位相差モードフラグはフレーム別に可変的に存在することができる。特に、チャネル間位相差符号化フラグが、チャネル間位相差値が空間情報の全フレームで用いられないことを示す場合は、フレームにチャネル間位相差モードフラグを含めなくてもよい。チャネル間位相差モードフラグは0又は1の値を有することができる。
The IPD mode
IPDコーディングフラグ生成部224は、図1で説明したようなチャネル間位相差符号化フラグ(bsPhaseCoding)を生成する。すなわち、IPD符号化が空間情報で用いられているか否かを示すIPD符号化フラグが生成されるため、図1に示すような区分された空間情報の少なくとも一つのフレームでチャネル間位相差値を用いる場合、チャネル間位相差符号化フラグが1を表すことは当然である。
The IPD coding
情報取得部230は、空間情報生成部220から空間情報を入力する。この空間情報は、チャネル間の位相差(IPD)値のほかに、チャネル間位相差符号化フラグ(bsPhaseCoding)及びチャネル間位相差モードフラグ(bsPhaseMode)を含むことができる。情報取得部230は、IPD符号化フラグ取得部231、IPDモードフラグ取得部232及びIPD値取得部233を含む。IPD符号化フラグ取得部231は、空間情報のヘッダから、空間情報の全フレームのうち少なくとも一つのフレームでチャネル間位相差値が用いられているか否かを示すチャネル間位相差符号化フラグを取得する。このチャネル間位相差符号化フラグの意味は、上記の表1の通りである。
The
IPDモードフラグ取得部232は、チャネル間位相差符号化フラグに基づいて、空間情報のフレームから、チャネル間位相差値がフレームで用いられているか否かを示すチャネル間位相差モードフラグ(bsPhaseMode)を取得する。特に、チャネル間位相差符号化フラグがチャネル間位相差値が用いられていることを示す場合(bsPhaseCoding=1)にIPDモードフラグ取得部232はチャネル間位相差モードフラグを取得することができる。
The IPD mode
IPD値取得部233は、チャネル間位相差モードフラグに基づいて、空間情報からチャネル間位相差値を取得することができる。このチャネル間位相差値はパラメータ帯域別に存在することができる。本明細書でいうパラメータ帯域とは、同じチャネル間位相差値が含まれる少なくとも一つの副帯域(sub−band)のことをいうが、これについては図7及び図8を参照して後述する。
The IPD
アップミキシング部240は、情報取得部230から取得されたチャネル間位相差値を、ダウンミキシング部210から入力されたダウンミックス信号に適用して、複数チャネル信号を生成することができる。ここで、アップミックスとは、ダウンミックス信号のチャネルよりも多い数のチャネル信号を生成するためにアップミキシングマトリクスを適用することを指し、アップミックスされた信号とは、アップミキシングマトリクスが適用された信号のことを指す。したがって、複数チャネル信号は、ダウンミックス信号よりも多い数のチャネルを有する信号である。また、アップミックスされた信号は、アップミキシングマトリクスが適用された信号自体を指すこともでき、アップミキシングマトリクスが適用されることによって複数のチャネルを有するように生成されたQMF領域信号であってもよいし、QMF領域信号が時間領域上の信号に変換された最終信号であってもよい。
The up-mixing
このように、本発明の信号処理装置及び方法は、チャネル間位相差符号化フラグ及びチャネル間位相差モードフラグに基づいて、チャネル間位相差値を用いることによって、チャネル間レベル差値及びチャネル間相関値では復元し難い残響を復元し、音像の定位を正確にすることができるという効果を有する。 As described above, the signal processing apparatus and method according to the present invention uses the inter-channel phase difference value based on the inter-channel phase difference encoding flag and the inter-channel phase difference mode flag, so that The reverberation that is difficult to restore with the correlation value is restored, and the localization of the sound image can be made accurate.
図3は、信号における位相と時間との関係を示すグラフである。図3の左グラフは、信号を位相−振幅領域上に示すものである。(a)信号は、位相変化なく入力された信号であり、(b)信号は、(a)信号よりπ/2だけ位相の遅れた信号を示す。 FIG. 3 is a graph showing the relationship between phase and time in a signal. The left graph of FIG. 3 shows the signal on the phase-amplitude region. (A) The signal is a signal input without phase change, and (b) the signal indicates a signal delayed in phase by π / 2 from (a) signal.
一方、図3の右グラフは、信号を時間−振幅領域上に示すもので、左グラフの(a)及び(b)信号に対応する(a)'及び(b)'信号を示す。すなわち、(a)信号よりπ/2だけ位相の遅れた信号である(b)信号は、時間では(a)'信号より33ms遅れて入力された信号である(b)'信号と同一に示すことができる。このように、信号において位相−時間は密接な関係を有し、これらは互いに対応する値に変換して用いる場合にも同一の効果を奏する。 On the other hand, the right graph of FIG. 3 shows the signals on the time-amplitude region, and shows the (a) ′ and (b) ′ signals corresponding to the (a) and (b) signals of the left graph. That is, the signal (b) which is a signal delayed in phase by π / 2 from the signal (a) is the same as the signal (b) which is a signal input 33 ms behind the signal (a) ′ in time. be able to. Thus, phase-time has a close relationship in a signal, and these have the same effect even when converted into values corresponding to each other.
図4は、図2のIPD値測定部及びIPD値取得部を具体的に示すブロック図である。IPD測定部410は、IPD値測定部411、IPD量子化部412及び量子化モードフラグ生成部413を含む。IPD値測定部411は、入力された複数チャネル信号からチャネル間位相差情報を測定する。上述のように、チャネル間位相差値は、位相角であってもよいし、時間遅延値であってもよいし、これらに対応するインデックス値であってもよい。
FIG. 4 is a block diagram specifically illustrating the IPD value measurement unit and the IPD value acquisition unit of FIG. The
IPD量子化部412は、IPD値測定部411で測定されたチャネル間位相差値を量子化する。IPD量子化部412は、量子化間隔によってチャネル間位相差値をそれぞれ異なる方法で量子化できる細部構造をさらに含むことができる。例えば、第1量子化部(図示せず)では、細かい量子化間隔(細かい間隔)を用いてチャネル間位相差値を量子化でき、第2量子化部(図示せず)では、粗い量子化間隔(粗い間隔)を用いてチャネル間位相差値を量子化することができる。
The
また、IPD量子化モードフラグ生成部413は、チャネル間位相差値を量子化する方式を示す量子化モードフラグ(quant_mode_flag)を生成することができる。量子化モードフラグは、詳細には、細かい間隔又は粗い間隔を用いてチャネル間位相差値が量子化されているか否かを示すことができる。
Further, the IPD quantization mode
チャネル間位相差値取得部(IPD値取得部)420は、IPD量子化モードフラグ取得部421、第1逆量子化部422、第2逆量子化部423及び逆量子化IPD値取得部424を含む。
The inter-channel phase difference value acquisition unit (IPD value acquisition unit) 420 includes an IPD quantization mode
まず、量子化モードフラグ取得部421は、エンコーダから受信した空間情報から、チャネル間位相差値に適用された量子化方式を示す量子化モードフラグ(quant_mode_flag)を取得する。この量子化モードフラグの意味を、下記の表3に示す。
First, the quantization mode
第1逆量子化部422は、量子化フラグが0の場合(IPD_quant_flag=0)、チャネル間位相差値を受信して粗い間隔でチャネル間位相差値を逆量子化する。一方、第2逆量子化部423は、量子化フラグが1の場合(IPD_quant_flag=1)、チャネル間位相差値を受信して細かい間隔でチャネル間位相差値を逆量子化する。次に、逆量子化IPD値取得部424は、第1逆量子化部422又は第2逆量子化部423から、逆量子化されたチャネル間位相差値を取得することができる。
When the quantization flag is 0 (IPD_quant_flag = 0), the first
図5は、位相偏移フラグを用いて複数チャネル信号の位相復元を補償する信号処理装置500を示す図である。信号処理装置500は、グローバル帯域IPD値決定部510、信号修正部520、ダウンミキシング部530、空間情報生成部540、空間情報取得部550、アップミキシング部560及び位相偏移部570を含む。
FIG. 5 is a diagram illustrating a
グローバル帯域IPD値決定部510は、まず、複数チャネル信号を受信する。この複数チャネル信号は、一つ以上のチャネルの位相が一致していない信号であってもよいし、ステレオ信号又は3以上のチャネルを有する信号であってもよい。グローバル帯域IPD値決定部510は、入力された複数チャネル信号の位相を一致させるために偏移される位相の度合いを示す位相偏移フラグを複数チャネル信号から決定する。
Global band IPD
この位相偏移フラグは、複数チャネル信号の位相が偏移したということを示すフラグ情報であってもよいし、フラグ情報に加えて、位相が偏移された情報、位相が偏移されるチャネル信号、位相偏移が起きる周波数帯域、及び位相偏移に対応する時間情報などの、位相偏移と関連した情報をさらに含んでもよい。 This phase shift flag may be flag information indicating that the phase of a plurality of channel signals has shifted, or in addition to the flag information, information on the phase shift and the channel on which the phase is shifted. Information related to the phase shift may be further included, such as a signal, a frequency band where the phase shift occurs, and time information corresponding to the phase shift.
まず、位相偏移フラグがフラグ情報のみを示す場合、複数チャネル信号は、固定された値を用いて位相を偏移させることができる。例えば、複数チャネル信号がステレオ信号である場合、ステレオ信号のうち、右チャネルの位相をπ/2だけ減少させたり、左チャネルの位相を π/2だけ増加させたりすることによって、左及び右チャネルが直交するように位相を偏移させて当該複数チャネル信号を生成することができる。また、π/2の位相偏移に限定されず、左及び右チャネルが直交するように位相を偏移させて、複数チャネル信号を生成することもできる。 First, when the phase shift flag indicates only flag information, the phase of the multi-channel signal can be shifted using a fixed value. For example, if the multi-channel signal is a stereo signal, the left and right channels of the stereo signal can be reduced by decreasing the right channel phase by π / 2 or increasing the left channel phase by π / 2. The plurality of channel signals can be generated by shifting the phase so that the two are orthogonal to each other. The phase shift is not limited to π / 2, and a multi-channel signal can be generated by shifting the phase so that the left and right channels are orthogonal.
ここで、偏移される位相は、複数チャネル信号の全周波数帯域に同一に適用することができる。また、複数チャネル信号のうちの一つ以上のチャネルの位相がπ/2だけ修正されるという情報、特に、修正される位相、又は直交するように偏移される位相に関する情報は別に伝送されず、後でデコーダ端で既に設定された情報を用いることができるが、これに限定されない。 Here, the phase to be shifted can be equally applied to all frequency bands of a plurality of channel signals. In addition, information that the phase of one or more channels of a plurality of channel signals is corrected by π / 2, in particular, information regarding the phase to be corrected or the phase shifted to be orthogonal is not transmitted separately. The information already set at the decoder end can be used later, but is not limited to this.
このようにして、複数のパラメータ帯域にそれぞれチャネル間位相差値を伝送する場合に比べて情報伝送量を減少させることができ、パラメータ帯域ごとにそれぞれチャネル間位相差値を適用する場合に生じうる位相差の問題を防止することができる。 In this way, the amount of information transmission can be reduced compared to the case where inter-channel phase difference values are transmitted to a plurality of parameter bands, respectively, which can occur when the inter-channel phase difference values are applied to each parameter band. The problem of phase difference can be prevented.
一方、位相偏移フラグは、フラグ情報の他に、位相偏移に関する詳細情報をさらに含むことができる。詳細情報は、位相の偏移情報、位相が偏移されるチャネル信号に関する情報、位相偏移が起きる周波数帯域及び時間情報などを含むことができる。 On the other hand, the phase shift flag can further include detailed information regarding the phase shift in addition to the flag information. The detailed information may include phase shift information, information on a channel signal whose phase is shifted, frequency band and time information where the phase shift occurs, and the like.
また、位相偏移フラグは、フレーム別に複数チャネル信号の位相が偏移される度合を可変的に示すことができ、この位相偏移フラグがフラグ情報のみを含む場合には、フレーム別に位相が偏移されたか否かを示すことができる。また、位相偏移フラグがフラグ情報、及び偏移された位相に関する詳細情報を含む場合、詳細情報は副帯域又はパラメータ帯域別に位相の偏移度合を可変的に示すことができ、一定の時間範囲ごとに、例えば、フレーム又はタイムスロットなど、可変的に該当の時間における位相の偏移度合を示すことができる。 In addition, the phase shift flag can variably indicate the degree to which the phase of a plurality of channel signals is shifted for each frame. When this phase shift flag includes only flag information, the phase is shifted for each frame. It can indicate whether it has been moved or not. Further, when the phase shift flag includes flag information and detailed information about the shifted phase, the detailed information can variably indicate the degree of phase shift for each subband or parameter band, and can be set within a certain time range. For each, for example, the degree of phase shift at a corresponding time can be variably indicated, such as a frame or a time slot.
また、位相偏移フラグは、図1乃至図4で説明したチャネル間位相差値と並列に用いることができる。
信号修正部520は、位相偏移フラグ及び複数チャネル信号を受信する。この複数チャネル信号は、位相偏移フラグを用いて一つ以上のチャネルの位相を修正することによって位相の偏移された複数チャネル信号として生成することができる。上述のように、本明細書では、位相が一致していない複数チャネル信号の位相を一致(in−phase)させるように複数チャネル信号の位相を修正し、これに関する位相偏移フラグを生成する方法について述べたが、位相の一致する複数チャネル信号に含まれた少なくとも一つのチャネルの位相を故意に偏移させることで位相が一致していない(out−phase)信号とし、これに関する位相偏移フラグを生成することも可能である。
Further, the phase shift flag can be used in parallel with the inter-channel phase difference value described with reference to FIGS.
The
ダウンミキシング部530は、位相が偏移された複数チャネル信号を受信してダウンミックスすることでダウンミックス信号を生成する。この複数チャネル信号は、ステレオ信号に限定されず、3以上のチャネルを有する信号にすることもできる。複数チャネル信号がステレオ信号である場合、ダウンミックス信号はモノ信号であってよく、複数チャネル信号が3以上のチャネルを有する信号である場合、ダウンミックス信号はステレオ信号、又は複数チャネル信号のチャネル数よりも小さい数のチャネルを有する信号であってよい。
The
空間情報生成部540は、位相が偏移された複数チャネル信号を受信して複数チャネル信号の属性を示す空間情報を生成することができる。空間情報は、デコーダでダウンミックス信号を、位相が偏移された複数チャネル信号にアップミックスするのに用いるもので、チャネル間レベル差情報、チャネル間相関値及びチャネル予測係数を含むことができる。したがって、本発明の空間情報生成部540で生成された空間情報は、位相が偏移されていない複数チャネル信号から生成された空間情報と同一でない場合もある。
Spatial
また、ビットストリーム生成部(図示せず)は、空間情報及び位相偏移フラグを含む一つのビットストリームを生成することもでき、ダウンミックス信号、空間情報及び位相偏移フラグを含む一つのビットストリームを生成することもできる。 In addition, the bitstream generation unit (not shown) can generate one bitstream including spatial information and a phase shift flag, and one bitstream including a downmix signal, spatial information, and a phase shift flag Can also be generated.
情報取得部550は、ビットストリームから、ダウンミックス信号をアップミックスするための空間情報及び位相偏移フラグを取得する。
The
アップミキシング部560は、図2のアップミキシング部240と同一の構成及び機能を果たす。アップミックスされた複数チャネル信号は、アップミキシングマトリクスが適用されてアップミックスされた信号であってもよいし、アップミックスされてQMF領域上に生成された信号であってもよいし、時間領域上の信号として最終出力された信号であってもよい。また、アップミキシング部560でアップミックスされた信号は、信号修正部520で位相が偏移された複数チャネル信号であってもよい。
The up-mixing
位相偏移部570は、空間情報取得部550からの位相偏移フラグ、及びアップミキシング部560からの位相偏移された複数チャネル信号を受信する。その後、位相が偏移された複数チャネル信号に位相偏移フラグを適用することで、複数チャネル信号の偏移された位相を復元させる。
The
この位相偏移フラグは、上述のように、複数チャネル信号の少なくとも一つのチャネルの位相が偏移したか否かを示すフラグ情報のみを含むことができ、位相偏移と関連した詳細情報を更に含むことができる。フラグ情報のみを含む場合、位相偏移部570は、フラグ情報に基づいて、アップミックスされた複数チャネル信号の位相を偏移させるか否かを決定し、固定された値を用いて複数チャネル信号の少なくとも一つのチャネルの位相を偏移させることができる。このとき、固定された値は、デコーダで既に設定された値を利用し、別途にエンコーダで測定して伝送しなくてもよく、例えば、複数チャネル信号の一つ以上のチャネルをπ/2だけ増加させたり減少させたりすることができる。この場合、π/2は複数チャネル信号の全周波数帯域に同一に適用することができる。また、位相偏移フラグはフレーム別に決定することができるので、複数チャネル信号の位相が偏移する度合又は位相が偏移されたか否かを、フレームごとに可変的に示すことができる。
As described above, the phase shift flag can include only flag information indicating whether or not the phase of at least one channel of the multi-channel signal has shifted, and further includes detailed information related to the phase shift. Can be included. When only the flag information is included, the
図6は、位相偏移フラグを用いて複数チャネル信号の位相復元を補償する本発明のほかの実施例である信号処理装置600を示す図である。図6を参照すると、信号処理装置600は、ダウンミキシング部610、空間情報生成部620、信号修正部630、グローバル帯域IPD値取得部640、位相偏移部650及びアップミキシング部660を含む。
FIG. 6 is a diagram illustrating a
ダウンミキシング部610は、入力された複数チャネル信号をダウンミックスしてダウンミックス信号DMXを生成する。ここで、複数チャネル信号は、位相が偏移されていない入力されたままの信号である。
The
空間情報生成部620は、入力された複数チャネル信号の属性を表す空間情報を生成することができる。この空間情報は、図5の空間情報と同一の構成及び機能を有するものであり、ただし、位相が偏移されていない複数チャネル信号から生成されるという点が、図5の空間情報と異なる。一方、空間情報生成部620は、グローバル帯域IPD値決定部621を含み、グローバル帯域IPD値決定部621は、図5のグローバル帯域IPD値決定部と同一の構成及び機能を有するので、その詳細説明は省略する。
The spatial
信号修正部630は、グローバル帯域IPD値決定部621から出力された位相偏移フラグに基づいて、ダウンミキシング部610から出力されたダウンミックス信号の少なくとも一つのチャネルの位相を修正し、位相の修正されたダウンミックス信号DMX’を生成することができる。
The
次に、グローバル帯域IPD値取得部640は、位相偏移フラグを取得し、位相偏移部650は、位相偏移フラグに基づいて、入力された修正ダウンミックス信号MDX’の少なくとも一つのチャネルの位相を偏移させて復元することによって、ダウンミックス信号DMXとして復元することができる。この時、位相偏移部650で位相が偏移されたダウンミックス信号DMXは、信号修正部630に入力される信号DMXと同一であってもよい。
Next, the global band IPD
アップミキシング部660は、空間情報生成部620からの空間情報、及び位相偏移部650からのダウンミックス信号DMXを受信して複数チャネル信号を復号することができる。
The
一方、本発明の信号処理方法及び装置は、チャネル間位相差値が変動する点で一時的に発生する雑音を除去するために種々の方法を行うが、これについては図7乃至図9を参照して説明する。 On the other hand, the signal processing method and apparatus of the present invention performs various methods for removing noise temporarily generated at the point where the inter-channel phase difference value fluctuates. For this, refer to FIGS. To explain.
まず、図7は、パラメータタイムスロットを示す概念図である。信号は、時間−周波数領域で示すことができる。図7を参照すると、1フレームのN個のタイムスロットのうちの2個のタイムスロット(タイムスロット2、タイムスロット4)に、パラメータセットが適用される。そして、信号の全周波数範囲は5個のパラメータ帯域に分割される。したがって、時間軸の単位はタイムスロットとし、周波数軸の単位はパラメータ帯域(pb)とすることができ、パラメータ帯域は、同一のチャネル間位相差値が含まれる少なくとも一つの周波数領域上の副帯域とすることができる。また、タイムスロットのうち、パラメータセットが適用されるように、つまり、チャネル間位相差値が適用されるように定義されたタイムスロットをパラメータタイムスロットと称する。
First, FIG. 7 is a conceptual diagram showing parameter time slots. The signal can be shown in the time-frequency domain. Referring to FIG. 7, the parameter set is applied to two time slots (
図8は、本発明の更にほかの実施例によってチャネル間位相差値を修正(平滑化)する方法を示す概略図である。図8を参照すると、左下段のグラフは、パラメータタイムスロットのうちの2番目のパラメータ帯域に含まれたチャネル間位相差値を示すグラフである。パラメータタイムスロット[0]に適用されるチャネル間位相差値は10゜で、パラメータタイムスロット[1]に適用されるチャネル間位相差値は60゜でありうる。このようにチャネル間位相差値が大きく変動する点では予想せぬ雑音が発生することがある。したがって、本発明の信号処理方法及び装置は、先行するパラメータタイムスロットに適用されるチャネル間位相差値を用いて、現在のパラメータタイムスロットに適用されるチャネル間位相差値を平滑化することによって、雑音を除去できるという効果を奏する。 FIG. 8 is a schematic diagram illustrating a method of correcting (smoothing) the inter-channel phase difference value according to still another embodiment of the present invention. Referring to FIG. 8, the lower left graph is a graph showing the inter-channel phase difference value included in the second parameter band in the parameter time slot. The inter-channel phase difference value applied to the parameter time slot [0] may be 10 °, and the inter-channel phase difference value applied to the parameter time slot [1] may be 60 °. Thus, unexpected noise may occur at the point where the phase difference value between channels fluctuates greatly. Therefore, the signal processing method and apparatus of the present invention uses the inter-channel phase difference value applied to the preceding parameter time slot to smooth the inter-channel phase difference value applied to the current parameter time slot. The effect that noise can be removed is produced.
再び図8を参照すると、現在のパラメータタイムスロットをパラメータタイムスロット[1]とすれば、先行するパラメータタイムスロットはパラメータタイムスロット[0]になりうる。図8の右下段のグラフに示すように、現在のパラメータタイムスロットに適用されるチャネル間位相差値(60゜)を、先行するパラメータタイムスロットに適用されるチャネル間位相差値(10゜)を用いて平滑化することができ、よって、平滑化して修正された現在のパラメータタイムスロットのチャネル間位相差値は、60゜よりも小さい値を有することができる。 Referring again to FIG. 8, if the current parameter time slot is the parameter time slot [1], the preceding parameter time slot can be the parameter time slot [0]. As shown in the lower right graph of FIG. 8, the inter-channel phase difference value (60 °) applied to the current parameter time slot is changed to the inter-channel phase difference value (10 °) applied to the preceding parameter time slot. So that the inter-channel phase difference value of the current parameter time slot that has been smoothed and modified can have a value less than 60 °.
その後、現在及び/又は先行するパラメータタイムスロットに適用される平滑化されたチャネル間位相差値を補間及び/又は複製することによって、パラメータセットが適用されるように定義されていないタイムスロット、例えば、タイムスロット1、タイムスロット3、…、タイムスロットNに適用されるチャネル間位相差値を取得することができる。
A time slot where the parameter set is not defined to be applied, for example by interpolating and / or duplicating the smoothed inter-channel phase difference value applied to the current and / or preceding parameter time slots, e.g. ,
図9は、図8の本発明の更にほかの実施例に係る信号処理装置を示すブロック図である。図9におけるダウンミキシング部910、IPD利用決定部921、IPD値測定部922、IPDモードフラグ生成部923、IPD符号化フラグ生成部924、IPD符号化フラグ取得部931、IPDモードフラグ取得部932、IPD値取得部933、アップミキシング部940は、図2におけるダウンミキシング部210、IPD利用決定部221、IPD値測定部222、IPDモードフラグ生成部223、IPD符号化フラグ生成部224、IPD符号化フラグ取得部231、IPDモードフラグ取得部232、IPD値取得部233及びアップミキシング部240と同一の構成及び機能を有するので、その詳細な説明は省略する。
FIG. 9 is a block diagram showing a signal processing apparatus according to still another embodiment of the present invention shown in FIG. 9, the
情報取得部930は、IPD値平滑化部934を更に含むことができる。IPD値平滑化部934は、先行するパラメータタイムスロットに適用されるチャネル間位相差値を用いて、現在のパラメータタイムスロットに適用されるチャネル間位相差値を修正することができる。これによって、現在のパラメータタイムスロットに適用されるチャネル間位相差値が、先行するパラメータタイムスロットに適用されるチャネル間位相差値と大きな相違を有する場合、生じうる雑音を防止することができる。
The
また、IPD値平滑化部934は、現在のパラメータタイムスロットに適用されるチャネル間位相差値から、複数チャネルのうちの2チャネル間の角度を表す位相角度を生成することができ、この位相角度を、先行するパラメータタイムスロットの位相角度を用いて修正することができる。該修正された位相角度は、後でアップミキシング部640に出力される。修正された位相角度はアップミキシング部640でダウンミックス信号に適用されて複数チャネル信号を生成することができる。
Further, the IPD
以下では、一般に、チャネル間位相差値を利用せず、チャネル間レベル差及びチャネル間相関値を用いて信号を符号化する場合、発生する問題点を解決するための本発明の様々な実施例について説明する。 In the following, various embodiments of the present invention for solving problems that occur when signals are generally encoded using inter-channel level differences and inter-channel correlation values without using inter-channel phase difference values. Will be described.
図10は、本発明のさらに他の実施例による信号処理方法及び装置が解決しようとする問題点を示す概念図である。 FIG. 10 is a conceptual diagram illustrating a problem to be solved by a signal processing method and apparatus according to another embodiment of the present invention.
多くの信号符号化装置では、特に、3GPP及びMPEGで規格化されたEAAC+又はHE AAC Plus及びUSACで使用するPSでは、チャネル間位相差値を利用せず、チャネル間レベル差値及びチャネル間相関情報のみを空間情報として用いている。これは、チャネル間位相差値を生成する上で生じうる位相ラッピング現象とチャネル間位相差値を合成する上で発生する音質の低下のためである。 In many signal coding apparatuses, especially in PS used in EAAC + or HE AAC Plus and USAC standardized by 3GPP and MPEG, the inter-channel phase difference value and the inter-channel correlation value are not used. Only information is used as spatial information. This is because a phase wrapping phenomenon that may occur when generating an inter-channel phase difference value and a deterioration in sound quality that occurs when synthesizing the inter-channel phase difference value.
しかし、チャネル間位相差値を利用せずに複数チャネル信号を符号化する場合、音像定位において深刻な問題が生じることがある。換言すると、2以上のマイクを互いに隣接して配置して録音した信号のように、チャネル間レベル差値を主に用いて符号化した信号では問題が生じないが、2以上のマイクを互いに離して配置して録音した信号は、チャネル間位相差値を用いないと、複数チャネル信号の復号時に正確な音像定位が不可能になるという問題につながる。 However, when a multi-channel signal is encoded without using the inter-channel phase difference value, a serious problem may occur in sound image localization. In other words, there is no problem with a signal encoded mainly using the interchannel level difference value, such as a signal recorded with two or more microphones arranged adjacent to each other, but the two or more microphones are separated from each other. If the signals are arranged and recorded in this manner, an accurate sound image localization cannot be performed when a plurality of channel signals are decoded unless the phase difference value between channels is used.
図10(a)は、チャネル間位相差値のみ存在するステレオ信号を、チャネル間位相差値なしで復号する場合の結果を示す。図10(a)を参照すると、原信号はチャネル間位相差値のみで形成された信号である(IPD=30゜)。しかし、チャネル間レベル差値及びチャネル間相関値のみを用いて復号すると、有効な空間情報(IPD値)がないため、復号された信号(合成信号)の音像は、原信号によらずステレオ信号の中央に位置することになる。この場合、チャネル間相関値が音像定位に影響を及ぼすが、チャネル間位相差値なしでは正確な音像定位が不可能である。 FIG. 10A shows the result when a stereo signal having only an inter-channel phase difference value is decoded without an inter-channel phase difference value. Referring to FIG. 10A, the original signal is a signal formed only by the phase difference value between channels (IPD = 30 °). However, if decoding is performed using only the inter-channel level difference value and the inter-channel correlation value, there is no effective spatial information (IPD value), so the sound image of the decoded signal (synthesized signal) is a stereo signal regardless of the original signal. It will be located in the center of In this case, the inter-channel correlation value affects the sound image localization, but accurate sound image localization is impossible without the inter-channel phase difference value.
一方、図10(b)は、チャネル間位相差値及びチャネル間レベル差値が混在するステレオ信号を、チャネル間位相差値なしで復号する場合の結果を示す。図10(b)を参照すると、ステレオ信号の音像定位は、チャネル間位相差値から決定される調節角度とチャネル間レベル差値から決定される調節角度との線形的な和として決定される。原ステレオ信号が、図10(b)に示すように、左側信号が右側信号に比べて、8dBだけさらに大きい値を有し、0.5msだけさらに速い場合、8dBのレベル差は、音像を中央から左側へ20゜(−20゜)移動させることができ、0.5msの時間差(−10゜のチャネル間位相差値と同一)は、音像を左に10゜(−10゜)移動させることができるという特徴を有する。したがって、原ステレオ信号は、−30゜位置に存在するようになる。しかし、チャネル間位相差値を用いないで信号を復号すると、復号された信号の音像は−20゜に位置するため、正確な音像の定位が不可能である。
On the other hand, FIG. 10B shows a result in the case of decoding a stereo signal in which an inter-channel phase difference value and an inter-channel level difference value are mixed without an inter-channel phase difference value. Referring to FIG. 10B, the sound image localization of the stereo signal is determined as a linear sum of the adjustment angle determined from the inter-channel phase difference value and the adjustment angle determined from the inter-channel level difference value. When the original stereo signal has a larger value by 8 dB than the right signal and is faster by 0.5 ms as shown in FIG. 10B, the level difference of 8 dB causes the sound image to be centered. Can be moved 20 ° to the left side (-20 °), and a time difference of 0.5 ms (same as the phase difference value between channels of -10 °) moves the
したがって、本発明の更にほかの実施例による信号処理方法及び装置は、音像定位における問題を解決するために種々の方法を更に提供する。 Therefore, the signal processing method and apparatus according to still another embodiment of the present invention further provides various methods for solving the problem in sound image localization.
図11及び図12は、本発明の更にほかの実施例による信号処理方法及び装置を示すブロック図である。 11 and 12 are block diagrams illustrating a signal processing method and apparatus according to another embodiment of the present invention.
第一に、複数チャネル信号のチャネル間位相差情報及びチャネル間レベル差値との比率に基づいて、一定条件を満たす場合にのみチャネル間位相差情報を利用することができる。図11に示すように、信号処理装置1100は、ダウンミキシング部1110、空間情報生成部1120、情報取得部1130及びアップミキシング部1140を含む。
First, based on the ratio between the inter-channel phase difference information and the inter-channel level difference value of a plurality of channel signals, the inter-channel phase difference information can be used only when a certain condition is satisfied. As illustrated in FIG. 11, the
ダウンミキシング部1110及びアップミキシング部1140は、図2におけるダウンミキシング部210及びアップミキシング部240と同一の構成及び機能を有する。空間情報生成部1120は、ILD値測定部1121、IPD値測定部1122、情報決定部1123及びIPDフラグ生成部1124を含む。ILD値測定部1121及びIPD値測定部1122は、複数チャネル信号からチャネル間レベル差値及びチャネル間位相差値を測定する。このチャネル間レベル差値及びチャネル間位相差値は、パラメータ帯域別に測定することができる。
The
情報決定部1123は、測定されたチャネル間レベル差値及びチャネル間位相差値を用いて、信号がどれくらい音像定位されるか計算し、チャネル間レベル差値とチャネル間位相差値が全体音像定位においてどれくらいの比率を占めるか計算して、チャネル間位相差値の比率がより高い場合にのみチャネル間位相差値を用いるように決定する。例えば、測定されたチャネル間位相差値が+20゜に対応し、測定されたチャネル間レベル差値が4dBと、+10゜位相偏移させる値に対応する場合、全体音像定位(20゜+10゜=30゜)においてチャネル間位相差値及びチャネル間レベル差値が寄与する度合は、それぞれ20/30、10/30になりうる。この場合、チャネル間位相差値が相対的に重要性が大きいといえるので、情報決定部1123は、チャネル間位相差値を更に用いると決定することができる。
The
IPDフラグ生成部1124は、情報決定部1123でチャネル間位相差値を更に用いると決定すれば、チャネル間位相差値が用いられることを示すチャネル間位相差値フラグを生成することができる。
If the
一方、情報取得部1130は、IPDフラグ取得部1131及びIPD値取得部1132を含むことができ、IPDフラグ取得部1131は、チャネル間位相差値フラグを取得して空間情報にチャネル間位相差値が含まれているか否かを判断する。チャネル間位相差値フラグが1の場合、IPD値取得部1132が活性化されて空間情報からチャネル間位相差値を取得する。その後、アップミキシング部1140は、チャネル間位相差値を含む空間情報を用いて、ダウンミックス信号をアップミックスすることで複数チャネル信号を復号し、チャネル間位相差値を用いない場合に比べて、複数チャネル信号の正確な音像定位が可能になる。また、一定条件を満たす場合にのみチャネル間位相差値を伝送することによって符号化効率を高めることもできる。
Meanwhile, the
第二に、チャネル間位相差値は、等価のチャネル間レベル差値に置き替えることもでき、その逆も可能である。この場合、音像定位に必要なチャネル間位相差値及びチャネル間レベル差値は周波数によって変わることがあるので、周波数帯域別に定義されたデータベースを参照する。 Second, the inter-channel phase difference value can be replaced with an equivalent inter-channel level difference value, and vice versa. In this case, the inter-channel phase difference value and the inter-channel level difference value necessary for sound image localization may vary depending on the frequency, so a database defined for each frequency band is referred to.
図12は、チャネル間位相差値を等価のチャネル間レベル差値に変更して用いる信号処理装置1200を示す。信号処理装置1200は、ILD値測定部1210、IPD値測定部1220、情報決定部1230、IPD値変換部1240及びILD値修正部1250を含む。
FIG. 12 shows a
ILD値測定部1210、IPD値測定部1220及び情報決定部1230は、図11におけるILD値測定部1121、IPD値測定部1122及び情報決定部1130と同一の構成及び機能を有するので、その詳細な説明は省略する。情報決定部1130でチャネル間位相差値を用いると決定した場合、測定されたチャネル間位相差値はIPD値変換部1240に入力される。
Since the ILD
IPD値変換部1240は、データベースを用いて、該当の周波数帯域で測定されたチャネル間位相差値を等価のチャネル間レベル差値ILD'に変換させる。次に、ILD値修正部1250は、ILD値測定部1210から入力されたチャネル間レベル差値ILDに、チャネル間位相差値が変換されたチャネル間レベル差値ILD'を加えて、修正されたチャネル間レベル差値ILD''を計算する。
The IPD
このように、チャネル間位相差値を等価のチャネル間レベル差値に変換して用いる場合、3GPP及びMPEGで用いるHE AAC Plus、又はUSAC標準で用いるPS等を含め、チャネル間位相差値の受信を許容しない既存の信号処理装置及び方法を利用する場合にもチャネル間位相差値を反映することができ、残響及び音像定位が向上した信号として復号することができる。 As described above, when the inter-channel phase difference value is converted into an equivalent inter-channel level difference value, the inter-channel phase difference value is received, including HE AAC Plus used in 3GPP and MPEG, or PS used in the USAC standard. Even when using an existing signal processing apparatus and method that does not allow the signal, the phase difference value between channels can be reflected, and the signal can be decoded as a signal with improved reverberation and sound image localization.
第三に、チャネル間位相差値を連続する少なくとも一つのフレームに共通に適用することによって、正確な音像定位を実現するとともに符号化効率を高めることができる。本明細書では、連続する数個のフレームで用いられるチャネル間位相差値を、グローバルフレームチャネル間位相差値(global frame IPD value)と称する。図13は、本発明の更にほかの実施例によってグローバルフレームチャネル間位相差値が用いられる概念を示す概念図である。図13を参照すると、数字0〜13はそれぞれフレームを表し、影付きフレームは、チャネル間位相差値を用いるフレームであり、そうでないフレームは、チャネル間位相差値が用いられないフレームである。これらは、本明細書で説明したチャネル間位相差モードフラグ(bsPhaseMode)に基づいて決定することができる。
Third, by applying the inter-channel phase difference value in common to at least one continuous frame, accurate sound image localization can be realized and encoding efficiency can be increased. In this specification, an inter-channel phase difference value used in several consecutive frames is referred to as a global frame inter-channel phase difference value (global frame IPD value). FIG. 13 is a conceptual diagram illustrating a concept in which a phase difference value between global frame channels is used according to still another embodiment of the present invention. Referring to FIG. 13,
図13に示すように、フレーム1〜3及びフレーム8〜12のみがチャネル間位相差値を用いる場合、チャネル間位相差値をフレームごとに伝送せずに、代表値を計算してチャネル間位相差値を適用するように決定された連続フレームに同一に適用し、連続するフレームのうちの最初のフレームにのみグローバルフレームチャネル間位相差値を含み、毎フレームは、グローバルフレームチャネル間位相差値が用いられているか否かを示すグローバルフレームチャネル間位相差フラグを含むことができる。グローバルフレームチャネル間位相差フラグの意味は、下記の表4の通りである。
As shown in FIG. 13, when only the
例えば、グローバルフレームチャネル間位相差フラグに基づいて、フレーム0は、グローバルフレームチャネル間位相差値を利用せず、フレーム1はグローバルフレームチャネル間位相差値を用いる。したがって、フレーム1は、グローバルフレームチャネル間位相差値を含み、同一のグローバルフレームチャネル間位相差値は、フレーム1乃至3に適用することができる。同様に、フレーム8は、グローバルフレームチャネル間位相差値を含み、同一のグローバルフレームチャネル間位相差値がフレーム8乃至12に適用することができる。
For example, based on the global frame channel phase difference flag,
図14は、図13のグローバルフレームチャネル間位相差値を用いる本発明の実施例による信号符号化装置1400を示す図である。図14を参照すると、信号符号化装置1400は、先行フレームグローバルフレームIPD値受信部1410、グローバルフレームIPD値計算部1420、グローバルフレームIPDフラグ生成部1430、グローバルフレームIPDフラグ取得部1440、グローバルフレームIPD値取得部1450、アップミキシング部1460を含む。
FIG. 14 is a diagram illustrating a
先行フレームグローバルフレームIPD値受信部1410は、先行フレームのグローバルフレームチャネル間位相差値を受信する。例えば、現在フレームがグローバルフレームチャネル間位相差値を含む1番目のフレームである場合には、受信された先行フレームのグローバルフレームチャネル間位相差値が存在しない。一方、現在のフレームがグローバルフレームチャネル間位相差値を含む連続するフレームのうち、2番目以降のフレームである場合には、先行フレームからグローバルフレームチャネル間位相差値を受信することができる。
The preceding frame global frame IPD
グローバルフレームIPD値計算部1420は、現在のフレームがグローバルフレームチャネル間位相差値を含む1番目のフレームである場合、すなわち、先行フレームのグローバルフレームチャネル間位相差値が存在しない場合、グローバルフレームチャネル間位相差値を計算することができる。現在のフレームのグローバルフレームチャネル間位相差値は、チャネル間位相差値が用いられる連続するフレームのチャネル間位相差値の平均とすることができる。
When the current frame is the first frame including the global frame channel phase difference value, that is, when there is no global frame channel phase difference value of the preceding frame, the global frame IPD
グローバルフレームIPDフラグ生成部1430は、現在のフレームでグローバルフレームチャネル間位相差値(IPD)を用いているか否かを示すグローバルフレームIPDフラグ(global_frame_IPD_flag)を生成する。
The global frame IPD
その後、グローバルフレームIPDフラグ取得部1440は、グローバルフレームチャネル間位相差値を取得し、グローバルフレームIPD値取得部1450は、先行フレームグローバルフレームIPD値受信部1410から出力された先行フレームのグローバルフレームチャネル間位相差値又はグローバルフレームIPD値計算部1420から出力された現在のフレームのグローバルフレームチャネル間位相差値を取得することができる。好ましくは、グローバルフレームIPD値取得部1450は、現在のフレームがチャネル間位相差値を適用する連続するフレームのうちの1番目のフレームである場合、先行フレームのグローバルフレームチャネル間位相差値を取得する。現在のフレームが2番目以降のフレームである場合には、計算された現在のフレームのグローバルフレームチャネル間位相差値を取得することができる。
Thereafter, the global frame IPD
アップミキシング部1460は、ダウンミックス信号にグローバルフレームチャネル間位相差値を適用して複数チャネル信号を生成する。
The
第四に、復号された複数チャネル信号を、エンコーダに入力された複数チャネル信号と最も類似した残響を有するようにチャネル間相関値を調節することができる。図10(b)を再び参照すると、チャネル間位相差値及びチャネル間相関値を用いて信号を復号する場合、原信号に比べて残響が誇張される問題点が発生する。残響とは、アンビエンスによって信号がより広い空間又はより狭い空間に存在するような効果を指し、本明細書で残響が誇張されるということは、原信号は狭い録音室で録音されたが、復号時に広い講堂で録音されたかのように聞こえることを意味する。 Fourth, the inter-channel correlation value can be adjusted so that the decoded multi-channel signal has reverberation most similar to the multi-channel signal input to the encoder. Referring back to FIG. 10B, when a signal is decoded using the inter-channel phase difference value and the inter-channel correlation value, there is a problem that reverberation is exaggerated compared to the original signal. Reverberation refers to the effect that the ambience causes the signal to exist in a wider or narrower space. Exaggeration of reverberation in this specification means that the original signal was recorded in a narrow recording room, but was decoded. Sometimes it sounds like it was recorded in a large auditorium.
この種の問題点はチャネル間位相差値を伝送しない従来の信号処理方法及び装置で頻繁に発生するが、チャネル間位相差値を伝送する場合にも発生することがある。 This type of problem frequently occurs in conventional signal processing methods and devices that do not transmit inter-channel phase difference values, but may also occur when transmitting inter-channel phase difference values.
図15は、上記問題点を解決するための本発明の更にほかの実施例による信号処理装置1500を示すブロック図である。信号処理装置1500は、ICC値測定部1510、IPD値測定部1520、ILD値測定部1530、情報決定部1540、ICC値修正部1550、IPDモードフラグ生成部1560、IPDモードフラグ取得部1570、IPD値取得部1580、ICC値取得部1590及びアップミキシング部1595を含む。ICC値測定部1510、IPD値測定部1520及びILD値測定部1530は、複数チャネル信号からそれぞれチャネル間相関値、チャネル間位相差値及びチャネル間レベル差値を測定することができる。
FIG. 15 is a block diagram showing a
情報決定部1540及びIPDモードフラグ生成部1560は、図11における情報決定部1123及びIPDフラグ生成部1124と同一の構成及び機能を有する。また、情報決定部1540は、測定されたチャネル間レベル差値及びチャネル間位相差値が全体音像定位においてどれくらいの比率を占めるか計算し、チャネル間位相差値の比率がより高い場合にのみチャネル間位相差値を用いると決定し、IPDモードフラグ生成部1560は、チャネル間位相差値を用いるか否かを示すチャネル間位相差モードフラグを生成する。
ICC値修正部1550は、情報決定部1540がチャネル間位相差値を用いると決定した場合、ICC値測定部1510から入力されたチャネル間相関値を修正することができる。好ましくは、チャネル間位相差値を用いるパラメータ帯域では、測定されたチャネル間相関値を含まなくてもよい。残響が誇張される問題点を解決するために、チャネル間相関値が表す値の大きさを修正して用いることができる。
When the
IPDモードフラグ取得部1570及びIPD値取得部1580も、図11におけるIPDフラグ取得部1131及びIPD値取得部1132と同一の構成及び機能を有するので、その詳細な説明は省略する。
The IPD mode
ICC値取得部1590は、IPDモードフラグ取得部1570でチャネル間位相差フラグがチャネル間位相差値が用いられていることを示す場合、ICC値修正部1550から修正されたチャネル間相関値を受信する。
When the IPD mode
アップミキシング部1595は、受信したダウンミックス信号に、チャネル間位相差値及び修正されたチャネル間相関値を適用することで、複数チャネル信号を生成することができる。したがって、チャネル間位相差値を用いる信号処理方法及び装置においてチャネル間相関値によって残響が誇張されて信号が歪むことを防止することができる。
The
第五に、チャネル間位相差値は、単純な音源を有する信号であるほど重要度がより大きいという特徴を利用することができる。 Fifth, it is possible to use the feature that the importance of the phase difference value between channels is larger as the signal has a simple sound source.
図16は、本発明のさらに他の実施例による信号処理装置1600を示すブロック図である。信号処理装置1600は、入力信号分類部1610、IPD値測定部1620、IPDフラグ生成部1630、IPDフラグ取得部1640、IPD値取得部1650及びアップミキシング部1660を含むことができる。
FIG. 16 is a block diagram illustrating a
入力信号分類部1610は、入力信号が音声(speech)のみを含む純音声信号であるか、音楽信号、又は音楽信号と音声信号とが混合された信号であるかを判断する。好ましくは、入力信号分類部1610は、SAD(音響検知器:Sound Activity Detector)又はSMC(音声音楽分類器:Speech and Music Classifier)などを含むことができる。
The input
IPD値測定部1620は、入力信号分類部1610で入力信号を音声信号のみを含む信号と判断する場合にのみ、チャネル間位相差値を測定する。IPDフラグ生成部1630、IPDフラグ取得部1640、IPD値取得部1650及びアップミキシング部1660は、図11におけるIPDフラグ生成部1124、IPDフラグ取得部1131、IPD値取得部1132及びアップミキシング部1140と同一の構成及び機能を有するので、その詳細な説明は省略する。
The IPD
種々の信号が含まれる音楽信号又は音声信号に音楽信号が混合された混合信号は、チャネル間位相差値を利用しないでも、チャネル間レベル差値及びチャネル間相関値を用いてある程度の音像定位は可能である。しかし、音声信号のような単純な音源の場合は、チャネル間位相差値の重要度が相対的に高いため、チャネル間位相差値なしでは正確な音像定位が不可能である。したがって、入力信号分類部1610で入力信号が音声信号と分類される場合にはチャネル間位相差値を用いることによって、より正確に音像定位された複数チャネル信号として復号することができる。
A mixed signal in which a music signal or a sound signal including various signals is mixed with a music signal does not use an inter-channel phase difference value, but a certain level of sound image localization is obtained using an inter-channel level difference value and an inter-channel correlation value. Is possible. However, in the case of a simple sound source such as an audio signal, since the importance of the inter-channel phase difference value is relatively high, accurate sound image localization is impossible without the inter-channel phase difference value. Therefore, when the input signal is classified as an audio signal by the input
図17は、本発明の更にほかの実施例による信号処理装置1700を示す図であり、この信号処理装置1700は、複数チャネル符号化部1710、帯域幅拡張信号符号化部1720、オーディオ信号符号化部1730、音声信号符号化部1740、オーディオ信号復号部1750、音声信号復号部1760、帯域幅拡張信号復号部1770及び複数チャネル復号部1780を含む。
FIG. 17 is a diagram illustrating a
まず、複数チャネル符号化部1710において複数チャネル信号をダウンミックスして生成するダウンミックス信号を、以下全帯域ダウンミックス信号と呼び、全帯域ダウンミックス信号から高周波帯域の信号が除去されて低周波帯域のみ存在するダウンミックス信号を、低周波帯域ダウンミックス信号と呼ぶ。
First, a downmix signal generated by downmixing a plurality of channel signals in the plurality of
複数チャネル符号化部1710は、複数のチャネルを有する(以下、複数チャネル)信号を受信する。受信した複数チャネル信号をダウンミックスして全帯域ダウンミックス信号を生成する一方、複数チャネル信号に対応する空間情報を生成する。この空間情報は、チャネルレベル差情報、チャネル予測係数、チャネル間相関値及びダウンミックス利得情報などを含むことができる。
The
本発明の一実施例による複数チャネル符号化部1710は、チャネル間位相差値を用いるか否かを決定してチャネル間位相差値を測定し、フレームでチャネル間位相差値を用いるか否かを示すチャネル間位相差モード情報及び全フレームのうち、チャネル間位相差値を用いるフレームがあるか否かを示すチャネル間位相差コーディング情報を生成してこれらをミックス情報と共に伝送できる。この過程は、図1乃至図4を参照して説明した通りであるから、その具体的な説明は省略する。
The
一方、複数チャネル符号化部1710には示していないが、図1乃至図4を参照して説明した信号処理装置又は図5乃至図16を参照して説明した本発明の他の実施例による信号処理装置における符号化装置を含むことができる。
On the other hand, although not shown in the
帯域幅拡張信号符号化部1720は、全帯域ダウンミックス信号を受信し、この全帯域ダウンミックス信号のうちの高周波帯域の信号に対応する拡張情報を生成することができる。この拡張情報は、後でデコーダ端で高周波帯域の除去された低周波帯域ダウンミックス信号を全帯域ダウンミックス信号に復元するための情報であり、空間情報とともに伝送することができる。
The bandwidth extension
また、ダウンミックス信号は、当該信号の特性に基づいてオーディオ信号符号化方式で符号化されるか、又は、音声信号符号化方式で符号化されるかが決定され、この符号化方式を決定するモード情報が生成される(図示せず)。ここで、オーディオ符号化方式はMDCT(修正離散コサイン変換)を用いるものとすることができるが、本発明はこれに限定されない。音声符号化方式は、AMR−WB(適応複数速度広帯域)標準に従うものとすることができるが、本発明はこれに限定されない。 Further, it is determined whether the downmix signal is encoded by the audio signal encoding method or the audio signal encoding method based on the characteristics of the signal, and this encoding method is determined. Mode information is generated (not shown). Here, the audio encoding method may use MDCT (modified discrete cosine transform), but the present invention is not limited to this. The speech coding scheme may conform to the AMR-WB (Adaptive Multiple Rate Wideband) standard, but the present invention is not limited to this.
オーディオ信号符号化部1730は、帯域幅拡張信号符号化部1720から入力された拡張情報及び全帯域ダウンミックス信号を用いて、高周波領域の除去された低周波帯域ダウンミックス信号をオーディオ信号符号化方式によって符号化する。
The audio
オーディオ信号符号化方式で符号化される信号は、オーディオ信号であってもよいし、オーディオ信号に音声信号が一部含まれた信号であってもよい。また、オーディオ信号符号化部1730は、周波数領域符号化部とすることができる。
The signal encoded by the audio signal encoding method may be an audio signal or a signal in which a part of the audio signal is included in the audio signal. Also, the audio
音声信号符号化部1740は、帯域幅拡張信号符号化部1720から入力された拡張情報及び全帯域ダウンミックス信号を用いて、高周波領域の除去された低周波帯域ダウンミックス信号を音声信号符号化方式によって符号化する。
The audio
音声信号符号化方式で符号化される信号は、音声信号であってもよいし、音声信号にオーディオ信号が一部含まれた信号であってもよい。また、音声信号符号化部1740は、線形予測符号化(LPC)方式を更に利用することができる。入力信号が時間軸上で高い冗長性を有する場合、過去の信号から現在の信号を予測する線形予測によってモデリングされうるが、この場合、線形予測符号化方式を採用すると符号化効率を上げることができる。一方、音声信号符号化部1740は、時間領域符号化部とすることができる。
The signal encoded by the audio signal encoding method may be an audio signal or a signal in which an audio signal is partly included in the audio signal. Also, the audio
オーディオ信号復号部1750は、信号をオーディオ信号符号化方式によって復号する。オーディオ信号復号部1750に入力されて復号される信号は、オーディオ信号であってもよいし、オーディオ信号に音声信号が一部含まれた信号であってもよい。また、オーディオ信号復号部1750は、周波数領域復号部を含むことができ、IMDCT(逆修正離散コサイン変換)を利用することができる。
The audio
音声信号復号部1760は、信号を音声信号符号化方式によって復号する。音声信号復号部1760で復号される信号は、音声信号であってもよいし、音声信号にオーディオ信号が一部含まれた信号であってもよい。また、音声信号復号部1760は、時間領域復号部を含むことができ、線形予測符号化方式を更に利用することができる。
The audio
帯域幅拡張信号復号部1770は、オーディオ信号復号部1750で復号された信号、又は音声信号復号部1760で復号された信号である低周波帯域ダウンミックス信号及び拡張情報を受信して、符号化時に除去された高周波領域に該当する信号が復元された全帯域ダウンミックス信号を生成する。
The bandwidth extension
この全帯域ダウンミックス信号は、低周波帯域ダウンミックス信号の全部及び拡張情報を用いて生成することもできるが、低周波帯域ダウンミックス信号の一部を用いて生成することもできる。 The full-band downmix signal can be generated using all of the low-frequency band downmix signal and the extended information, but can also be generated using a part of the low-frequency band downmix signal.
複数チャネル復号部1780は、全帯域ダウンミックス信号、空間情報、チャネル間位相差値、チャネル間位相差モードフラグ及びチャネル間位相差符号化フラグを受信し、これらの情報を全帯域ダウンミックス信号に適用して複数チャネル信号を生成するが、この過程についての詳細な説明は、図1乃至図4を参照して説明した通りであるから省略する。
The
このように、本発明の信号処理方法及び装置は、チャネル間位相差値を用いて複数チャネル信号を生成することによって、複数チャネルデコーダが再生し難い位相差又は遅延差を効果的に再生することができる。 As described above, the signal processing method and apparatus according to the present invention effectively reproduces the phase difference or delay difference that is difficult to reproduce by the multi-channel decoder by generating the multi-channel signal using the inter-channel phase difference value. Can do.
図18は、本発明の一実施例によるIPD符号化フラグ取得部1841、IPDモードフラグ取得部1842、IPD値取得部1843及びアップミキシング部1844が具現されている製品の概略的な構成を示す図であり、図19は、本発明の実施例によるIPD符号化フラグ取得部1841、IPDモードフラグ取得部1842、IPD値取得部1843及びアップミキシング部1844が具現されている製品間の関係を示す図である。
18 is a diagram illustrating a schematic configuration of a product in which an IPD encoding
図18を参照すると、有線無線通信部1810は、有線無線通信方式を用いてビットストリームを受信する。具体的に、有線無線通信部1810は、有線通信部1811、赤外線通信部1812、ブルトゥース部1813、無線LAN通信部1814のうち一つ以上を含むことができる。
Referring to FIG. 18, the wired
使用者認証部1820は、使用者情報を取り込んで使用者認証を行うもので、指紋認識部1821、虹彩認識部1822、顔認識部1823、及び音声認識部1824のうち一つ以上を含むことができ、それぞれ、指紋、虹彩情報、顔輪郭情報、音声情報を取り込んで使用者情報に変換し、使用者情報と既に登録されている使用者データとが一致するか否かを判断して、使用者認証を行うことができる。
The
入力部1830は、使用者が種々の命令を入力するための入力装置で、キーパッド部1831、タッチパッド部1832、リモコン部1833のうち一つ以上を含むことができるが、本発明はこれに限定されない。 The input unit 1830 is an input device for a user to input various commands. The input unit 1830 may include one or more of a keypad unit 1831, a touchpad unit 1832, and a remote control unit 1833. It is not limited.
信号復号部1840は、IPD符号化フラグ取得部1841、IPDモードフラグ取得部1842、IPD値取得部1843及びアップミキシング部1844を含み、これらは、図2において同一の名称を有するユニットと同一の構成及び機能を有するので、その詳細な説明は省略する。
The
制御部1850は、入力装置から入力信号を受信し、信号復号部1840と出力部1860のプロセス全般を制御する。上述のように、制御部1850に入力部1830から使用者入力、例えば、出力信号の位相偏移のon/off、メタデータの入出力、信号復号部の作用on/offなどが入力される場合、それを用いて信号を復号する。
The
出力部1860は、信号復号部1840によって生成された出力信号などが出力される構成要素で、信号出力部1861及びディスプレイ部1862を含むことができる。出力信号がオーディオ信号であれば、出力信号は信号出力部1861から出力され、出力信号がビデオ信号であれば、出力信号はディスプレイ部1862から出力される。また、入力部1830にメタデータが入力されると、それをディスプレイ部1862を介して画面に表示する。
The
図19は、図18に示された製品に該当する端末と端末との関係、端末とサーバとの関係を示す図である。図19(a)を参照すると、第1端末1910及び第2端末1920が有線無線通信を介してデータ又はビットストリームの双方向通信ができることがわかる。ここで、有線無線通信を介して交換されるデータ又はビットストリームは、本発明に係る図1におけるビットストリームの形態であってもよいし、図5乃至図16を参照して説明した本発明の位相偏移フラグ、グローバルフレームチャネル間位相差値などを含むデータであってもよい。図19(b)を参照すると、サーバ1930及び第1端末1940も同様、互いに有線無線通信を行うことができる。
FIG. 19 is a diagram illustrating a relationship between a terminal corresponding to the product illustrated in FIG. 18 and a relationship between the terminal and the server. Referring to FIG. 19A, it can be seen that the
図20は、本発明の一実施例によるIPD符号化フラグ取得部2041、IPDモードフラグ取得部2042、IPD値取得部2043及びアップミキシング部2044を含む複数チャネル復号部が具現されている放送信号復号装置2000の概略的な構成を示す図である。
FIG. 20 is a broadcast signal decoding in which a multi-channel decoding unit including an IPD encoding
図20を参照すると、デマルチプレクサ2020は、チューナ2010からTV放送と関連したデータを受信する。これらのデータは、デマルチプレクサ2020で分離され、データデコーダ2030で復号される。一方、デマルチプレクサ2020で分離されたデータは、HDDのような記憶媒体2050に記憶することができる。
Referring to FIG. 20, the
デマルチプレクサ2020で分離されたデータは、複数チャネル復号部2041及びビデオ復号部2042を含む信号復号部2040に入力されて、オーディオ信号及びビデオ信号として復号される。信号復号部2040は、本発明の一実施例によるIPD符号化フラグ取得部2041、IPDモードフラグ取得部2042、IPD値取得部2043及びアップミキシング部2044を含み、これらは、図2における同一名称のユニットと同一の構成及び機能を有するので詳細な説明は省略する。信号復号部2040は、受信したチャネル間位相差値などを用いて信号を復号し、ビデオ信号が入力される場合はビデオ信号も復号して出力し、メタデータが生成される場合はそれをテキストの形態として出力する。
The data separated by the
出力部2070は、ビデオ信号が復号されて、出力されたビデオ信号とメタデータが生成される場合、出力されたメタデータを画面に表示する。また、出力部2070はスピーカ部(図示せず)を含み、信号復号部2040から出力されるチャネル間位相差値を用いて復号された複数チャネル信号を、出力部2070に含まれたスピーカ部から出力する。また、信号復号部2040で復号されたデータは、HDDのような記憶媒体2050に記憶することができる。
When the video signal is decoded and the output video signal and metadata are generated, the
一方、信号復号装置2000は、使用者から情報を受信して該受信したデータを制御できるアプリケーションマネージャ2060をさらに含むことができる。アプリケーションマネージャ2060は、ユーザインタフェースマネージャ2061及びサービスマネージャ2062を含む。ユーザインタフェースマネージャ2061は、使用者から情報を受け取るためのインタフェースを制御する。例えば、出力部2070に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネージャ2062は、信号復号部2040及び出力部2070で放送信号を復号して出力する場合、受信される放送信号を、使用者から入力される情報を用いて制御することができる。例えば、放送チャネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネージャ2060から出力されるデータは、信号復号部2040のほか、出力部2070にも伝送されて利用可能である。
Meanwhile, the
このように、実際製品に本発明の信号処理装置が含まれることによって、チャネル間レベル差値及びチャネル間相関値のみを用いてアップミックスされた複数チャネル信号を用いる従来の技術に比べて、チャネル間位相差値を用いることによってより音質が向上し、元来の入力信号に類似した複数チャネル信号を聴取することが可能になる。 As described above, the actual product includes the signal processing device of the present invention, so that the channel is compared with the conventional technique using a plurality of channel signals upmixed using only the inter-channel level difference value and the inter-channel correlation value. By using the interphase difference value, the sound quality is further improved, and it is possible to listen to a multi-channel signal similar to the original input signal.
本発明の適用される復号/符号化方法は、コンピュータで実行可能なプログラムとして製作されて、コンピュータ読み取り可能な記録媒体に記憶されることができ、本発明によるデータ構造を有するマルチメディアデータも、コンピュータ読み取り可能な記録媒体に記憶されることができる。このコンピュータ読み取り可能な記録媒体は、コンピュータシステムで読み取り可能なデータが記憶されるいかなる種類の記憶装置をも含むことができる。コンピュータ読み取り可能な記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記憶装置などがあり、また、搬送波(例えば、インターネットを介した伝送)の形態とすることもできる。また、該符号化方法によって生成されたビットストリームは、コンピュータ読み取り可能な記録媒体に記憶されたり、有線/無線通信網を用いて伝送することができる。 The decoding / encoding method to which the present invention is applied can be produced as a computer-executable program and stored in a computer-readable recording medium. Multimedia data having the data structure according to the present invention is also It can be stored in a computer readable recording medium. The computer-readable recording medium may include any type of storage device that stores data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc., and carrier wave (for example, transmission via the Internet). It can also be in the form. The bit stream generated by the encoding method can be stored in a computer-readable recording medium or transmitted using a wired / wireless communication network.
以上では、限定された実施例及び図面に挙げて本発明を説明してきたが、本発明は、これに限定されず、本発明の属する技術の分野における通常の知識を有する者には、本発明の技術思想と添付した特許請求の範囲及びその均等範囲内で様々な修正及び変形は可能であるということが理解される。 In the above, the present invention has been described with reference to limited embodiments and drawings. However, the present invention is not limited thereto, and the present invention is not limited to those who have ordinary knowledge in the technical field to which the present invention belongs. It is understood that various modifications and changes can be made within the scope of the technical idea of the present invention and the appended claims and their equivalents.
本発明は、信号を符号化及び復号するために適用することができる。 The present invention can be applied to encode and decode signals.
Claims (10)
複数チャネル信号から生成されたダウンミックス信号と、該ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報とを受信する段階と、
前記空間情報のヘッダから、チャネル間位相差(IPD)符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを取得する段階と、
前記チャネル間位相差符号化フラグに基づいて、前記空間情報のフレームから、チャネル間位相差値が前記空間情報のフレームで用いられているか否かを示すチャネル間位相差モードフラグを取得する段階と、
前記チャネル間位相差モードフラグに基づいて、前記フレーム内のパラメータタイムスロットに対応するパラメータ帯域のチャネル間位相差値を取得する段階と、
先行するパラメータタイムスロットのチャネル間位相差値を用いて前記チャネル間位相差値を修正することによって、前記チャネル間位相差値を平滑化する段階と、
前記ダウンミックス信号に前記平滑化されたチャネル間位相差値を適用して、前記複数チャネル信号を生成する段階と、を有し、
前記空間情報は、前記ヘッダ及び複数個の前記フレームに区分され、
前記チャネル間位相差値は、前記複数チャネル信号のうち二つのチャネル間の位相差を表し、
前記パラメータタイムスロットは、前記チャネル間位相差値が適用されるタイムスロットを示し、
前記パラメータ帯域は、前記チャネル間位相差値が適用される周波数領域の少なくとも一つの副帯域である、方法。 A method of processing a signal, comprising:
Receiving a downmix signal generated from a plurality of channel signals and spatial information representing attributes of the plurality of channel signals to upmix the downmix signals;
Obtaining an inter-channel phase difference encoding flag indicating whether inter-channel phase difference (IPD) encoding is used in the spatial information from the header of the spatial information;
Based on the phase difference coding flag between said channel, from the frame of the spatial information, the step of phase difference value between the switch Yaneru to obtain the inter-channel phase difference mode flag indicating whether used in the frame of the spatial information When,
Obtaining an inter-channel phase difference value of a parameter band corresponding to a parameter time slot in the frame based on the inter-channel phase difference mode flag;
Smoothing the inter-channel phase difference value by modifying the inter-channel phase difference value using the inter-channel phase difference value of the preceding parameter time slot;
Applying the smoothed inter-channel phase difference value to the downmix signal to generate the multi-channel signal,
The spatial information is divided into the header and a plurality of the frames,
The inter-channel phase difference value represents a phase difference between two channels of the plurality of channel signals,
The parameter time slot indicates a time slot to which the inter-channel phase difference value is applied,
The method, wherein the parameter band is at least one subband of a frequency domain to which the inter-channel phase difference value is applied.
前記先行するパラメータタイムスロットの位相角度を用いて前記位相角度を修正する段階と、を更に有する請求項1に記載の方法。 Generating a phase angle representing an angle between two channels of the plurality of channel signals using the inter-channel phase difference value;
The method of claim 1, further comprising modifying the phase angle using the phase angle of the preceding parameter time slot.
前記チャネル間レベル差値は、前記ダウンミックス信号に含まれる前記複数チャネル信号のうち二つのチャネル間のレベル差を示す、請求項1に記載の方法。 The inter-channel phase difference value is received when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference (ILD) value in the whole sound image localization.
The method of claim 1, wherein the inter-channel level difference value indicates a level difference between two channels of the plurality of channel signals included in the downmix signal.
複数チャネル信号から生成されたダウンミックス信号と、前記ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報とを受信する信号受信部と、
前記空間情報のヘッダから、チャネル間位相差(IPD)符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを取得するチャネル間位相差符号化フラグ取得部と、
前記チャネル間位相差符号化フラグに基づいて、前記空間情報のフレームから、チャネル間位相差値が前記空間情報のフレームで用いられているか否かを示すチャネル間位相差モードフラグを取得する位相差モードフラグ取得部と、
前記チャネル間位相差モードフラグに基づいて、パラメータタイムスロットに対応するパラメータ帯域のチャネル間位相差値を取得するチャネル間位相差値取得部と、
先行するパラメータタイムスロットのチャネル間位相差値を用いて前記チャネル間位相差値を修正することによって、前記チャネル間位相差値を平滑化するチャネル間位相差値平滑化部と、
前記ダウンミックス信号に前記平滑化されたチャネル間位相差値を適用して、前記複数チャネル信号を生成するアップミキシング部と、を備え、
前記空間情報は、前記ヘッダ及び複数個の前記フレームに区分され、前記チャネル間位相差値は、前記複数チャネル信号のうち二つのチャネル間の位相差を表し、前記パラメータタイムスロットは、前記チャネル間位相差値が適用されるタイムスロットを示し、前記パラメータ帯域は、前記チャネル間位相差値が適用される周波数領域の少なくとも一つの副帯域である、装置。 A device for processing signals,
A signal receiving unit that receives a downmix signal generated from a plurality of channel signals and spatial information representing attributes of the plurality of channel signals to upmix the downmix signal;
An inter-channel phase difference encoding flag acquisition unit that acquires, from the header of the spatial information, an inter-channel phase difference encoding flag indicating whether or not inter-channel phase difference (IPD) encoding is used in the spatial information;
Based on the phase difference coding flag between said channel, said from the frame of the spatial information, Chi Yaneru between positions where the phase difference value to obtain the inter-channel phase difference mode flag indicating whether used in the frame of the spatial information A phase difference mode flag acquisition unit;
Based on the inter-channel phase difference mode flag, an inter-channel phase difference value acquisition unit that acquires an inter-channel phase difference value of a parameter band corresponding to a parameter time slot;
An inter-channel phase difference value smoothing unit that smoothes the inter-channel phase difference value by correcting the inter-channel phase difference value using the inter-channel phase difference value of the preceding parameter time slot;
An upmixing unit that applies the smoothed inter-channel phase difference value to the downmix signal to generate the plurality of channel signals, and
The spatial information is divided into the header and a plurality of the frames, the inter-channel phase difference value represents a phase difference between two channels of the multi-channel signal, and the parameter time slot is between the channels. The apparatus indicates a time slot to which a phase difference value is applied, and the parameter band is at least one subband of a frequency domain to which the inter-channel phase difference value is applied.
前記チャネル間位相差値を用いて、前記複数チャネル信号のうち二つのチャネル間の角度を表す位相角度を生成する位相角度生成部と、
前記先行するパラメータタイムスロットの位相角度を用いて前記位相角度を修正する位相角度修正部と、を備える請求項5に記載の装置。 The inter-channel phase difference value smoothing unit is
A phase angle generation unit that generates a phase angle representing an angle between two channels of the plurality of channel signals using the inter-channel phase difference value;
The apparatus according to claim 5, further comprising: a phase angle correction unit that corrects the phase angle using a phase angle of the preceding parameter time slot.
前記チャネル間レベル差値は、前記ダウンミックス信号に含まれる前記複数チャネル信号のうち二つのチャネル間のレベル差を示す、請求項5に記載の装置。 The inter-channel phase difference value is received when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference (ILD) value in the whole sound image localization.
The apparatus according to claim 5, wherein the inter-channel level difference value indicates a level difference between two channels of the plurality of channel signals included in the downmix signal.
複数チャネル信号をダウンミックスしてダウンミックス信号を生成する段階と、
前記ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報を生成する段階と、を有し、
前記空間情報を生成する段階は、
前記複数チャネル信号のうち二つのチャネル間の位相差を表すチャネル間位相差(IPD)値を測定する段階と、
前記複数チャネル信号のうち二つのチャネル間のレベル差を表すチャネル間レベル差(ILD)値を測定する段階と、
全音像定位における前記チャネル間位相差値の寄与度合が、全音像定位における前記チャネル間レベル差値の寄与度合よりも高い場合に、IPD符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを生成する段階と、
前記チャネル間位相差値がフレームで用いられているか否かを示すチャネル間位相差モードフラグを生成する段階と、
前記チャネル間位相差値及び前記チャネル間位相差モードフラグを前記空間情報のフレームに含め、前記チャネル間位相差符号化フラグを前記空間情報のヘッダに含める段階と、を有する方法。 A method of processing a signal, comprising:
Downmixing multiple channel signals to generate a downmix signal;
Generating spatial information representing attributes of the multi-channel signal to upmix the downmix signal;
The step of generating the spatial information includes:
Measuring an inter-channel phase difference (IPD) value representing a phase difference between two channels of the multi-channel signal;
Measuring an inter-channel level difference (ILD) value representing a level difference between two channels of the multi-channel signal;
Indicates whether or not IPD encoding is used in the spatial information when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference value in the whole sound image localization. Generating an inter-channel phase difference encoding flag;
Generating an inter-channel phase difference mode flag indicating whether or not the inter-channel phase difference value is used in a frame;
Including the inter-channel phase difference value and the inter-channel phase difference mode flag in the spatial information frame, and including the inter-channel phase difference encoding flag in the spatial information header.
複数チャネル信号をダウンミックスしてダウンミックス信号を生成するダウンミキシング部と、
前記ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報を生成する空間情報生成部と、を備え、
前記空間情報生成部は、
前記複数チャネル信号のうち二つのチャネル間の位相差を表すチャネル間位相差(IPD)値を測定するチャネル間位相差値測定部と、
前記複数チャネル信号のうち二つのチャネル間のレベル差を表すチャネル間レベル差(ILD)値を測定するチャネル間レベル差値測定部と、
全音像定位における前記チャネル間位相差値の寄与度合が、全音像定位における前記チャネル間レベル差値の寄与度合よりも高い場合に、IPD符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを生成するチャネル間位相差符号化フラグ生成部と、
前記チャネル間位相差値がフレームで用いられているか否かを示すチャネル間位相差モードフラグを生成するチャネル間位相差モードフラグ生成部と、を備え、
前記チャネル間位相差値及び前記チャネル間位相差モードフラグは、前記空間情報のフレームに含まれ、前記チャネル間位相差符号化フラグは、前記空間情報のヘッダに含まれる、装置。 A device for processing signals,
A downmixing unit that downmixes multiple channel signals to generate a downmix signal;
A spatial information generating unit that generates spatial information representing attributes of the plurality of channel signals in order to upmix the downmix signal;
The spatial information generator is
An inter-channel phase difference value measuring unit that measures an inter-channel phase difference (IPD) value representing a phase difference between two channels of the plurality of channel signals;
An inter-channel level difference value measuring unit that measures an inter-channel level difference (ILD) value representing a level difference between two channels of the plurality of channel signals;
Indicates whether or not IPD encoding is used in the spatial information when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference value in the whole sound image localization. An inter-channel phase difference encoding flag generating unit for generating an inter-channel phase difference encoding flag;
An inter-channel phase difference mode flag generating unit that generates an inter-channel phase difference mode flag indicating whether or not the inter-channel phase difference value is used in a frame,
The apparatus, wherein the inter-channel phase difference value and the inter-channel phase difference mode flag are included in the spatial information frame, and the inter-channel phase difference encoding flag is included in the spatial information header.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10026208P | 2008-09-25 | 2008-09-25 | |
US61/100,262 | 2008-09-25 | ||
KR10-2009-0090518 | 2009-09-24 | ||
KR1020090090518A KR101108061B1 (en) | 2008-09-25 | 2009-09-24 | A method and an apparatus for processing a signal |
PCT/KR2009/005497 WO2010036059A2 (en) | 2008-09-25 | 2009-09-25 | A method and an apparatus for processing a signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012503791A JP2012503791A (en) | 2012-02-09 |
JP5426680B2 true JP5426680B2 (en) | 2014-02-26 |
Family
ID=42213076
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011528942A Active JP5480274B2 (en) | 2008-09-25 | 2009-09-25 | Signal processing method and apparatus |
JP2011528941A Active JP5426680B2 (en) | 2008-09-25 | 2009-09-25 | Signal processing method and apparatus |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011528942A Active JP5480274B2 (en) | 2008-09-25 | 2009-09-25 | Signal processing method and apparatus |
Country Status (4)
Country | Link |
---|---|
JP (2) | JP5480274B2 (en) |
KR (3) | KR20100035121A (en) |
CN (2) | CN102165520B (en) |
ES (1) | ES2547232T3 (en) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5358691B2 (en) * | 2009-04-08 | 2013-12-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Apparatus, method, and computer program for upmixing a downmix audio signal using phase value smoothing |
MX2013010537A (en) | 2011-03-18 | 2014-03-21 | Koninkl Philips Nv | Audio encoder and decoder having a flexible configuration functionality. |
CN102446507B (en) | 2011-09-27 | 2013-04-17 | 华为技术有限公司 | Down-mixing signal generating and reducing method and device |
EP2702587B1 (en) * | 2012-04-05 | 2015-04-01 | Huawei Technologies Co., Ltd. | Method for inter-channel difference estimation and spatial audio coding device |
JP5977434B2 (en) | 2012-04-05 | 2016-08-24 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | Method for parametric spatial audio encoding and decoding, parametric spatial audio encoder and parametric spatial audio decoder |
EP2790419A1 (en) | 2013-04-12 | 2014-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
CN105637581B (en) * | 2013-10-21 | 2019-09-20 | 杜比国际公司 | The decorrelator structure of Reconstruction for audio signal |
CN104681029B (en) | 2013-11-29 | 2018-06-05 | 华为技术有限公司 | The coding method of stereo phase parameter and device |
CN107452387B (en) | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | A kind of extracting method and device of interchannel phase differences parameter |
CN108694955B (en) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | Coding and decoding method and coder and decoder of multi-channel signal |
CN109215668B (en) * | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | Method and device for encoding inter-channel phase difference parameters |
CN110556118B (en) | 2018-05-31 | 2022-05-10 | 华为技术有限公司 | Coding method and device for stereo signal |
US11765536B2 (en) * | 2018-11-13 | 2023-09-19 | Dolby Laboratories Licensing Corporation | Representing spatial audio by means of an audio signal and associated metadata |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002208869A (en) * | 2001-01-09 | 2002-07-26 | Sony Corp | Multiband radio signal transmission/reception device |
SE0202159D0 (en) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
KR101021079B1 (en) * | 2002-04-22 | 2011-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | Parametric multi-channel audio representation |
CA2992097C (en) * | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
DE602005006777D1 (en) * | 2004-04-05 | 2008-06-26 | Koninkl Philips Electronics Nv | MULTI-CHANNEL CODER |
EP1914723B1 (en) * | 2004-05-19 | 2010-07-07 | Panasonic Corporation | Audio signal encoder and audio signal decoder |
WO2006003813A1 (en) | 2004-07-02 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding apparatus |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
CN101263742B (en) * | 2005-09-13 | 2014-12-17 | 皇家飞利浦电子股份有限公司 | Audio coding |
CN101617360B (en) * | 2006-09-29 | 2012-08-22 | 韩国电子通信研究院 | Apparatus and method for coding and decoding multi-object audio signal with various channel |
KR100917845B1 (en) * | 2006-12-04 | 2009-09-18 | 한국전자통신연구원 | Apparatus and method for decoding multi-channel audio signal using cross-correlation |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
-
2009
- 2009-09-24 KR KR1020090090516A patent/KR20100035121A/en not_active Application Discontinuation
- 2009-09-24 KR KR1020090090515A patent/KR101108060B1/en active IP Right Grant
- 2009-09-24 KR KR1020090090518A patent/KR101108061B1/en active IP Right Grant
- 2009-09-25 JP JP2011528942A patent/JP5480274B2/en active Active
- 2009-09-25 CN CN200980137978XA patent/CN102165520B/en active Active
- 2009-09-25 ES ES09012229.2T patent/ES2547232T3/en active Active
- 2009-09-25 CN CN2009801378698A patent/CN102165519A/en active Pending
- 2009-09-25 JP JP2011528941A patent/JP5426680B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN102165519A (en) | 2011-08-24 |
KR101108060B1 (en) | 2012-01-25 |
KR101108061B1 (en) | 2012-01-25 |
ES2547232T3 (en) | 2015-10-02 |
KR20100035122A (en) | 2010-04-02 |
CN102165520B (en) | 2012-11-28 |
CN102165520A (en) | 2011-08-24 |
JP2012503791A (en) | 2012-02-09 |
JP5480274B2 (en) | 2014-04-23 |
JP2012503792A (en) | 2012-02-09 |
KR20100035120A (en) | 2010-04-02 |
KR20100035121A (en) | 2010-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5426680B2 (en) | Signal processing method and apparatus | |
US10861468B2 (en) | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters | |
RU2763374C2 (en) | Method and system using the difference of long-term correlations between the left and right channels for downmixing in the time domain of a stereophonic audio signal into a primary channel and a secondary channel | |
JP4934427B2 (en) | Speech signal decoding apparatus and speech signal encoding apparatus | |
US8258849B2 (en) | Method and an apparatus for processing a signal | |
JP5554830B2 (en) | Device for supplying one or more adjusted parameters for the provision of an upmix signal representation based on a downmix signal representation, an audio signal decoder using object-related parametric information, an audio signal transcoder, an audio signal Encoder, audio bitstream, method and computer program | |
RU2551797C2 (en) | Method and device for encoding and decoding object-oriented audio signals | |
US8060042B2 (en) | Method and an apparatus for processing an audio signal | |
EP2169666B1 (en) | A method and an apparatus for processing a signal | |
US10818304B2 (en) | Phase coherence control for harmonic signals in perceptual audio codecs | |
JP2013511053A (en) | Apparatus for generating upmix signal representation based on downmix signal representation, device for generating bitstream representing multi-channel audio signal, method using distortion control signaling, computer program and bitstream | |
US8346380B2 (en) | Method and an apparatus for processing a signal | |
RU2407072C1 (en) | Method and device for encoding and decoding object-oriented audio signals | |
Brandenburg | Parametric Coding of High-Quality Audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130930 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131128 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5426680 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |