JP5426680B2 - Signal processing method and apparatus - Google Patents

Signal processing method and apparatus Download PDF

Info

Publication number
JP5426680B2
JP5426680B2 JP2011528941A JP2011528941A JP5426680B2 JP 5426680 B2 JP5426680 B2 JP 5426680B2 JP 2011528941 A JP2011528941 A JP 2011528941A JP 2011528941 A JP2011528941 A JP 2011528941A JP 5426680 B2 JP5426680 B2 JP 5426680B2
Authority
JP
Japan
Prior art keywords
inter
phase difference
channel
difference value
channel phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011528941A
Other languages
Japanese (ja)
Other versions
JP2012503791A (en
Inventor
クク リ,ヒュン
ヨン ユン,スン
スー キム,ドン
ヒュン リム,ジェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from PCT/KR2009/005497 external-priority patent/WO2010036059A2/en
Publication of JP2012503791A publication Critical patent/JP2012503791A/en
Application granted granted Critical
Publication of JP5426680B2 publication Critical patent/JP5426680B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、入力された信号の位相を偏移(shift)させた信号を利用し、該位相の偏移した信号のチャネル間位相差値を用いることによって、信号の音質を向上させ、入力された信号をより完壁に復元することができる信号処理方法及び装置に関するものである。   The present invention improves the sound quality of a signal by using a signal obtained by shifting the phase of an input signal and using an inter-channel phase difference value of the signal whose phase is shifted. The present invention relates to a signal processing method and apparatus capable of restoring a complete signal more completely.

一般に、モノ信号からステレオ信号を生成するためにデコリレータを用いて信号を符号化することができる。   In general, a signal can be encoded using a decorrelator to generate a stereo signal from a mono signal.

また、信号処理装置においてチャネル間レベル差値及びチャネル間相関値を用いて信号を符号化することができる。   Further, the signal processing apparatus can encode the signal using the inter-channel level difference value and the inter-channel correlation value.

音声信号をデコリレータを用いて生成する場合、デコリレータはチャネル信号間に存在する位相差又は遅延差を正確に再生できないという問題点がある。   When an audio signal is generated using a decorrelator, there is a problem that the decorrelator cannot accurately reproduce a phase difference or delay difference existing between channel signals.

また、チャネル間レベル差値及びチャネル間相関値を用いて信号を符号化する場合、入力信号のチャネル間位相差を復元して反映することができず、正確な音像の定位(localization)を行い難いうえに、入力信号の残響(reverberation)も復元できないという問題点がある。   Also, when a signal is encoded using the inter-channel level difference value and the inter-channel correlation value, the inter-channel phase difference of the input signal cannot be restored and reflected, and accurate sound image localization is performed. In addition, there is a problem that reverberation of the input signal cannot be restored.

本発明は、上記の問題点を解決するために案出されたもので、その目的は、復号されたオーディオ信号又は音声信号の位相を、チャネル間位相差値及び位相移動フラグを用いて復元及び偏移することによって、音質を向上させ、原音に近づかせることができる信号処理方法及び装置を提供することにある。   The present invention has been devised to solve the above-described problems, and its purpose is to restore and decode the phase of a decoded audio signal or audio signal using an inter-channel phase difference value and a phase shift flag. It is an object of the present invention to provide a signal processing method and apparatus capable of improving sound quality and approaching an original sound by shifting.

本発明は、下記のような効果及び利点を提供する。   The present invention provides the following effects and advantages.

第一に、本発明の信号処理方法及び装置は、位相偏移フラグに基づいて、復号されたオーディオ信号又は音声信号の位相を偏移させることで、復号時にデコリレータによっては効率的に再生し難い位相差又は遅延差を効率的に再生することができるという効果を有する。   First, the signal processing method and apparatus according to the present invention shifts the phase of the decoded audio signal or audio signal based on the phase shift flag, so that it is difficult to efficiently reproduce by the decorrelator at the time of decoding. There is an effect that the phase difference or the delay difference can be efficiently reproduced.

第二に、本発明の信号処理方法及び装置は、チャネル間位相差符号化フラグ及びチャネル間位相差モードフラグに基づいて、チャネル間位相差値を用いることで、チャネル間レベル差値及びチャネル間相関値によっては復元し難い残響を復元し、音像の定位を正確にすることができる。   Second, the signal processing method and apparatus according to the present invention uses the inter-channel phase difference value based on the inter-channel phase difference encoding flag and the inter-channel phase difference mode flag, so that the inter-channel level difference value and the inter-channel phase difference value Depending on the correlation value, reverberation that is difficult to restore can be restored, and the localization of the sound image can be made accurate.

第三に、本発明の信号処理方法及び装置は、フレームごとにチャネル間位相差値を用いているか否かを示すチャネル間位相差モードフラグを受信することによって、必要に応じてチャネル間位相差値を用いて信号を復号することができる。   Third, the signal processing method and apparatus according to the present invention receives an inter-channel phase difference mode flag indicating whether or not an inter-channel phase difference value is used for each frame, so that an inter-channel phase difference is obtained as necessary. The value can be used to decode the signal.

第四に、本発明の信号処理方法及び装置は、先行する(previous)パラメータタイムスロットのチャネル間位相差値を用いて現在のパラメータタイムスロットのチャネル間位相差値を修正(平滑化(smoothing))することで、チャネル間位相差値の差によって一時的に生じうる雑音を除去できるという効果を有する。   Fourth, the signal processing method and apparatus of the present invention corrects (smoothings) the inter-channel phase difference value of the current parameter time slot using the inter-channel phase difference value of the preceding parameter time slot. ), It is possible to remove noise that may be temporarily generated due to the difference in the phase difference value between channels.

第五に、本発明の信号処理方法及び装置は、一定条件を満たす場合にのみチャネル間位相差値を伝送することによって符号化効率を向上させ、原音に近い信号として復号することができる。   Fifth, the signal processing method and apparatus of the present invention can improve the coding efficiency by transmitting the inter-channel phase difference value only when a certain condition is satisfied, and can decode it as a signal close to the original sound.

第六に、本発明の信号処理方法及び装置は、エンコーダで測定されたチャネル間位相差値をチャネル間レベル差値に変換して伝送することによって、チャネル間位相差値の伝送を許容しない既存の信号処理装置及び方法を用いる場合にも、残響を強化し、音像の定位が原音に近い信号として復元できるという効果(後方互換性)を有する。   Sixth, the signal processing method and apparatus of the present invention converts the inter-channel phase difference value measured by the encoder into an inter-channel level difference value and transmits it, thereby not allowing the transmission of the inter-channel phase difference value. In the case of using the signal processing apparatus and method, the reverberation is enhanced and the sound image localization can be restored as a signal close to the original sound (backward compatibility).

本発明の一実施例による信号処理方法の概念を示す概念図である。It is a conceptual diagram which shows the concept of the signal processing method by one Example of this invention. 本発明の一実施例による信号処理装置を示すブロック図である。1 is a block diagram illustrating a signal processing apparatus according to an embodiment of the present invention. 信号における位相と時間との関係を示すグラフである。It is a graph which shows the relationship between the phase in a signal, and time. 図2におけるIPD値測定部及びIPD値取得部を具体的に示すブロック図である。FIG. 3 is a block diagram specifically illustrating an IPD value measurement unit and an IPD value acquisition unit in FIG. 2. 本発明のほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by the other Example of this invention. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 従来のパラメータタイムスロットを示す概念図である。It is a conceptual diagram which shows the conventional parameter time slot. 本発明の更にほかの実施例によってチャネル間位相差値を修正(平滑化)する方法を示す概略図である。It is the schematic which shows the method of correct | amending (smoothing) the phase difference value between channels by other Example of this invention. 図8における本発明の更にほかの実施例に係る信号処理装置を示すブロック図である。FIG. 9 is a block diagram illustrating a signal processing device according to still another embodiment of the present invention in FIG. 8. 本発明の更にほかの実施例による信号処理方法及び装置が解決しようとする問題点を示す概念図である。It is a conceptual diagram which shows the problem which the signal processing method and apparatus by other Example of this invention are going to solve. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 本発明の更にほかの実施例によってグローバルフレームチャネル間位相差値(global frame IPD)が用いられる概念を示す概念図である。FIG. 10 is a conceptual diagram illustrating a concept in which a global frame channel phase difference value (global frame IPD) is used according to another embodiment of the present invention. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 本発明の更にほかの実施例による信号処理装置を示すブロック図である。It is a block diagram which shows the signal processing apparatus by other Example of this invention. 本発明の更にほかの実施例によるIPD符号化フラグ取得部、IPDモードフラグ取得部、IPD値取得部及びアップミキシング部が具現されている製品の概略的な構成を示す図である。It is a figure which shows the schematic structure of the product by which the IPD encoding flag acquisition part by the further Example of this invention, the IPD mode flag acquisition part, the IPD value acquisition part, and the up-mixing part are embodied. 本発明の更にほかの実施例によるIPD符号化フラグ取得部、IPDモードフラグ取得部、IPD値取得部及びアップミキシング部が具現されている製品間の関係を示す図である。It is a figure which shows the relationship between the products in which the IPD encoding flag acquisition part by the further another Example of this invention, the IPD mode flag acquisition part, the IPD value acquisition part, and the up-mixing part are embodied. 本発明の更にほかの一実施例によるIPD符号化フラグ取得部、IPDモードフラグ取得部、IPD値取得部及びアップミキシング部が具現されている放送信号復号装置の概略的な構成を示す図である。FIG. 7 is a diagram illustrating a schematic configuration of a broadcast signal decoding apparatus in which an IPD encoding flag acquisition unit, an IPD mode flag acquisition unit, an IPD value acquisition unit, and an upmixing unit are implemented according to another embodiment of the present invention. .

以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。これに先立ち、本明細書及び請求の範囲に使われた用語や単語は通常的または辞典的な意味に限定して解釈してはならず、発明者は自身の発明を最善の方法で説明するために用語の概念を適宜定義することができるという原則に立って、本発明の技術的思想に符合する意味と概念として解釈すべきであるということを明らかにしておきたい。したがって、本明細書に記載された実施例及び図面に示す構成は本発明の最も好適な一実施例に過ぎないもので、本発明の技術的思想を全部代弁するものではないので、本出願時点においてそれらを代替できる種々の均等物及び変形例が存在しうるということが理解されるであろう。   Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, the terms and words used in the specification and claims should not be construed in a normal or lexical sense, and the inventor will explain his invention in the best possible manner. Therefore, it should be clarified that it should be interpreted as a meaning and concept consistent with the technical idea of the present invention based on the principle that the concept of the term can be defined as appropriate. Therefore, the configuration shown in the embodiments and drawings described in the present specification is only the most preferred embodiment of the present invention and does not represent the technical idea of the present invention. It will be understood that there may be various equivalents and variations that can be substituted in

特に、本発明でいう符号化とは、符号化及び復号の両方を含む概念として理解すべきである。   In particular, the encoding in the present invention should be understood as a concept including both encoding and decoding.

また、本明細書でいう情報とは、値、パラメータ、係数、要素などを総称する用語で、場合によって異なる意味として解釈されるが、本発明はこれに限定されない。そして、本明細書で信号の一例としてステレオ信号を挙げて説明するが、これに限定されず、3以上の複数のチャネルを有する複数チャネル信号とすることもできる。   In addition, the information in the present specification is a term that collectively refers to values, parameters, coefficients, elements, and the like, and is interpreted as meanings that differ depending on the case, but the present invention is not limited thereto. In this specification, a stereo signal is described as an example of a signal. However, the present invention is not limited to this, and a multi-channel signal having three or more channels may be used.

図1は、本発明の一実施例による信号処理方法の概念を示す概念図であり、空間情報のビットストリームを示している。図1を参照すると、空間情報は、ヘッダ及び複数個のフレームに区分することができる。ここで、空間情報は、入力信号である複数チャネル信号の属性を表す情報であり、複数チャネルのうちの2チャネル間のレベル差を表すチャネル間レベル差値、2チャネル間の相関度を表すチャネル間相関値、及び2チャネル間の位相差を表すチャネル間位相差値を含むことができる。これらは、デコーダで、複数チャネル信号をダウンミックスして生成されたダウンミックス信号をアップミックスして復元するのに用いることができる。   FIG. 1 is a conceptual diagram showing a concept of a signal processing method according to an embodiment of the present invention, and shows a bit stream of spatial information. Referring to FIG. 1, the spatial information can be divided into a header and a plurality of frames. Here, the spatial information is information that represents attributes of a plurality of channel signals that are input signals, a channel-to-channel level difference value that represents a level difference between two channels of the plurality of channels, and a channel that represents the degree of correlation between two channels An inter-channel correlation value and an inter-channel phase difference value representing a phase difference between two channels can be included. These can be used by a decoder to upmix and restore a downmix signal generated by downmixing a plurality of channel signals.

空間情報のヘッダは、全フレーム中にチャネル間位相差値を用いるフレームがあるか否かを示すチャネル間位相差符号化フラグ(bsPhaseCoding)を含む。すなわち、チャネル間位相差符号化フラグがヘッダに含まれることによって、空間情報の全フレームにおいてチャネル間位相差値が用いられるか否かを判断することができる。チャネル間位相差符号化フラグの意味を、下記の表1に示す。   The header of the spatial information includes an inter-channel phase difference encoding flag (bsPhaseCoding) indicating whether or not there is a frame using the inter-channel phase difference value in all frames. That is, by including the inter-channel phase difference encoding flag in the header, it can be determined whether or not the inter-channel phase difference value is used in all frames of the spatial information. The meaning of the inter-channel phase difference encoding flag is shown in Table 1 below.

Figure 0005426680
Figure 0005426680

また、空間情報は、フレームでチャネル間位相差値が用いられているか否かを示すチャネル間位相差モードフラグ(bsPhaseMode)をフレームごとに含む。チャネル間位相差モードフラグは、チャネル間位相差符号化フラグが1である場合、すなわち、チャネル間位相差符号化フラグが、空間情報にIPD符号化が用いられることを示す場合にのみ、フレームに含まれる。チャネル間位相差モードフラグ(bsPhaseMode)の具体的な意味は、下記の表2の通りである。   The spatial information includes an inter-channel phase difference mode flag (bsPhaseMode) indicating whether or not an inter-channel phase difference value is used in the frame for each frame. The inter-channel phase difference mode flag is only included in the frame when the inter-channel phase difference encoding flag is 1, that is, when the inter-channel phase difference encoding flag indicates that IPD encoding is used for spatial information. included. The specific meaning of the inter-channel phase difference mode flag (bsPhaseMode) is as shown in Table 2 below.

Figure 0005426680
Figure 0005426680

再び図1を参照すると、フレーム2のチャネル間位相差モードフラグが1であれば(bsPhaseMode=1)、フレーム2にチャネル間位相差値(IPD)として0でない値が含まれ、フレーム3のチャネル間位相差モードフラグが0であれば(bsPhaseMode=0)、フレーム3にチャネル間位相差値(IPD)として0の値が含まれる。   Referring to FIG. 1 again, if the inter-channel phase difference mode flag of frame 2 is 1 (bsPhaseMode = 1), the frame 2 includes a non-zero value as the inter-channel phase difference value (IPD), and the frame 3 channel If the interphase difference mode flag is 0 (bsPhaseMode = 0), the frame 3 includes a value of 0 as the interchannel phase difference value (IPD).

したがって、チャネル間位相差符号化フラグ及びチャネル間位相差モードフラグに基づいてチャネル間位相差値を取得し、これをダウンミックス信号に適用して複数チャネル信号にアップミックスすることができる。   Therefore, an inter-channel phase difference value is acquired based on the inter-channel phase difference encoding flag and the inter-channel phase difference mode flag, and this can be applied to the downmix signal and upmixed to a plurality of channel signals.

図2は、本発明の一実施例による信号処理装置を示すブロック図である。図2を参照すると、信号処理装置200は、ダウンミキシング部210、空間情報生成部220、情報取得部230及びアップミキシング部240を含む。   FIG. 2 is a block diagram illustrating a signal processing apparatus according to an embodiment of the present invention. Referring to FIG. 2, the signal processing apparatus 200 includes a downmixing unit 210, a spatial information generation unit 220, an information acquisition unit 230, and an upmixing unit 240.

ダウンミキシング部210は、複数チャネル信号を入力してダウンミックス信号(DMX)を生成することができる。複数チャネル信号は、3以上のチャネルを有する信号であってもよいし、モノ又はステレオチャネルを有する信号であってもよい。ダウンミキシング部210は、複数チャネル信号をダウンミックスすることで、複数チャネル信号のチャネル数よりも少ない数のチャネルを有するダウンミックス信号を生成することができる。   The downmixing unit 210 can receive a plurality of channel signals and generate a downmix signal (DMX). The multi-channel signal may be a signal having three or more channels, or a signal having a mono or stereo channel. The downmixing unit 210 can generate a downmix signal having a smaller number of channels than the number of channels of the plurality of channel signals by downmixing the plurality of channel signals.

空間情報生成部220は、図1で説明したとおり、ダウンミックス信号を後でデコーダでアップミックスするための空間情報を生成し、該空間情報は複数チャネル信号の属性を示すことができる。空間情報は、上述のように、チャネル間レベル差値、チャネル間相関値及びチャネル間位相差値などを含むことができるが、ここでは、図2の空間情報生成部220を参照してチャネル間位相差値について具体的に説明する。   As described with reference to FIG. 1, the spatial information generation unit 220 generates spatial information for upmixing a downmix signal later by a decoder, and the spatial information can indicate attributes of a plurality of channel signals. As described above, the spatial information can include an inter-channel level difference value, an inter-channel correlation value, an inter-channel phase difference value, and the like. Here, referring to the spatial information generation unit 220 in FIG. The phase difference value will be specifically described.

空間情報生成部220は、IPD利用決定部221、IPD値測定部222、IPDモードフラグ生成部223、及びIPD符号化フラグ生成部224を含む。IPD利用決定部221は、空間情報にチャネル間の位相差(IPD)値を含めるか否かを決定でき、特に、複数チャネル信号の特性、チャネル間位相差値とチャネル間レベル差値との比率に基づいて、チャネル間位相差値を含めるか否かを決定することができる。   The spatial information generation unit 220 includes an IPD usage determination unit 221, an IPD value measurement unit 222, an IPD mode flag generation unit 223, and an IPD encoding flag generation unit 224. The IPD usage determining unit 221 can determine whether or not to include a phase difference (IPD) value between channels in the spatial information, and in particular, a characteristic of a plurality of channel signals, a ratio between the channel phase difference value and the channel level difference value. Whether to include an inter-channel phase difference value or not can be determined.

例えば、複数チャネル信号が音声信号である場合、チャネル間位相差値を空間情報に含めると決定することができる。その詳細は後述する。   For example, when the multi-channel signal is an audio signal, it can be determined that the inter-channel phase difference value is included in the spatial information. Details thereof will be described later.

IPD値測定部222は、IPD利用決定部221が、チャネル間位相差値を用いると決定した場合、空間情報生成部200に入力された複数チャネル信号から2チャネル間の位相差を測定する。該測定された位相差は、位相及び/又は角度であってもよいし、時間差であってもよいし、角度又は時間差に対応するインデックス値であってもよい。信号において位相と時間差は密接な関係を有するが、これについての詳細は、図3を参照して後述する。   When the IPD usage determining unit 221 determines to use the inter-channel phase difference value, the IPD value measuring unit 222 measures the phase difference between the two channels from the plurality of channel signals input to the spatial information generating unit 200. The measured phase difference may be a phase and / or an angle, a time difference, or an index value corresponding to the angle or time difference. In the signal, the phase and the time difference are closely related, and details thereof will be described later with reference to FIG.

IPDモードフラグ生成部223は、図1を参照して上述したチャネル間位相差モードフラグ(bsPhaseMode)を生成する。すなわち、チャネル間位相差値がフレームで用いられているか否かを示し、ここで、フレームは、チャネル間位相差値が含まれている現在フレーム(current frame)でありうる。したがって、チャネル間位相差モードフラグはフレーム別に可変的に存在することができる。特に、チャネル間位相差符号化フラグが、チャネル間位相差値が空間情報の全フレームで用いられないことを示す場合は、フレームにチャネル間位相差モードフラグを含めなくてもよい。チャネル間位相差モードフラグは0又は1の値を有することができる。   The IPD mode flag generation unit 223 generates the inter-channel phase difference mode flag (bsPhaseMode) described above with reference to FIG. That is, it indicates whether an inter-channel phase difference value is used in a frame, where the frame may be a current frame including an inter-channel phase difference value. Therefore, the inter-channel phase difference mode flag can be variably present for each frame. In particular, when the inter-channel phase difference encoding flag indicates that the inter-channel phase difference value is not used in all frames of spatial information, the inter-channel phase difference mode flag may not be included in the frame. The inter-channel phase difference mode flag can have a value of 0 or 1.

IPDコーディングフラグ生成部224は、図1で説明したようなチャネル間位相差符号化フラグ(bsPhaseCoding)を生成する。すなわち、IPD符号化が空間情報で用いられているか否かを示すIPD符号化フラグが生成されるため、図1に示すような区分された空間情報の少なくとも一つのフレームでチャネル間位相差値を用いる場合、チャネル間位相差符号化フラグが1を表すことは当然である。   The IPD coding flag generation unit 224 generates an inter-channel phase difference encoding flag (bsPhaseCoding) as described with reference to FIG. That is, since an IPD encoding flag indicating whether or not IPD encoding is used in spatial information is generated, an inter-channel phase difference value is set in at least one frame of the partitioned spatial information as shown in FIG. When used, it is natural that the inter-channel phase difference encoding flag represents 1.

情報取得部230は、空間情報生成部220から空間情報を入力する。この空間情報は、チャネル間の位相差(IPD)値のほかに、チャネル間位相差符号化フラグ(bsPhaseCoding)及びチャネル間位相差モードフラグ(bsPhaseMode)を含むことができる。情報取得部230は、IPD符号化フラグ取得部231、IPDモードフラグ取得部232及びIPD値取得部233を含む。IPD符号化フラグ取得部231は、空間情報のヘッダから、空間情報の全フレームのうち少なくとも一つのフレームでチャネル間位相差値が用いられているか否かを示すチャネル間位相差符号化フラグを取得する。このチャネル間位相差符号化フラグの意味は、上記の表1の通りである。   The information acquisition unit 230 receives the spatial information from the spatial information generation unit 220. This spatial information may include an inter-channel phase difference encoding flag (bsPhaseCoding) and an inter-channel phase difference mode flag (bsPhaseMode) in addition to the inter-channel phase difference (IPD) value. The information acquisition unit 230 includes an IPD encoding flag acquisition unit 231, an IPD mode flag acquisition unit 232, and an IPD value acquisition unit 233. The IPD encoding flag acquisition unit 231 acquires an inter-channel phase difference encoding flag indicating whether or not an inter-channel phase difference value is used in at least one frame of all the spatial information frames from the spatial information header. To do. The meaning of the inter-channel phase difference encoding flag is as shown in Table 1 above.

IPDモードフラグ取得部232は、チャネル間位相差符号化フラグに基づいて、空間情報のフレームから、チャネル間位相差値がフレームで用いられているか否かを示すチャネル間位相差モードフラグ(bsPhaseMode)を取得する。特に、チャネル間位相差符号化フラグがチャネル間位相差値が用いられていることを示す場合(bsPhaseCoding=1)にIPDモードフラグ取得部232はチャネル間位相差モードフラグを取得することができる。   The IPD mode flag acquisition unit 232, based on the inter-channel phase difference encoding flag, indicates whether or not the inter-channel phase difference value is used in the frame from the spatial information frame. The inter-phase phase difference mode flag (bsPhaseMode) To get. In particular, when the inter-channel phase difference encoding flag indicates that the inter-channel phase difference value is used (bsPhaseCoding = 1), the IPD mode flag acquisition unit 232 can acquire the inter-channel phase difference mode flag.

IPD値取得部233は、チャネル間位相差モードフラグに基づいて、空間情報からチャネル間位相差値を取得することができる。このチャネル間位相差値はパラメータ帯域別に存在することができる。本明細書でいうパラメータ帯域とは、同じチャネル間位相差値が含まれる少なくとも一つの副帯域(sub−band)のことをいうが、これについては図7及び図8を参照して後述する。   The IPD value acquisition unit 233 can acquire the inter-channel phase difference value from the spatial information based on the inter-channel phase difference mode flag. This inter-channel phase difference value can exist for each parameter band. The parameter band in the present specification means at least one sub-band including the same inter-channel phase difference value, which will be described later with reference to FIGS.

アップミキシング部240は、情報取得部230から取得されたチャネル間位相差値を、ダウンミキシング部210から入力されたダウンミックス信号に適用して、複数チャネル信号を生成することができる。ここで、アップミックスとは、ダウンミックス信号のチャネルよりも多い数のチャネル信号を生成するためにアップミキシングマトリクスを適用することを指し、アップミックスされた信号とは、アップミキシングマトリクスが適用された信号のことを指す。したがって、複数チャネル信号は、ダウンミックス信号よりも多い数のチャネルを有する信号である。また、アップミックスされた信号は、アップミキシングマトリクスが適用された信号自体を指すこともでき、アップミキシングマトリクスが適用されることによって複数のチャネルを有するように生成されたQMF領域信号であってもよいし、QMF領域信号が時間領域上の信号に変換された最終信号であってもよい。   The up-mixing unit 240 can generate the multi-channel signal by applying the inter-channel phase difference value acquired from the information acquisition unit 230 to the downmix signal input from the down-mixing unit 210. Here, upmix refers to applying an upmixing matrix in order to generate a larger number of channel signals than channels of a downmix signal, and an upmixed signal is applied with an upmixing matrix. Refers to the signal. Therefore, the multi-channel signal is a signal having a larger number of channels than the downmix signal. Further, the upmixed signal may refer to the signal itself to which the upmixing matrix is applied, or may be a QMF domain signal generated to have a plurality of channels by applying the upmixing matrix. Alternatively, it may be a final signal obtained by converting the QMF domain signal into a signal on the time domain.

このように、本発明の信号処理装置及び方法は、チャネル間位相差符号化フラグ及びチャネル間位相差モードフラグに基づいて、チャネル間位相差値を用いることによって、チャネル間レベル差値及びチャネル間相関値では復元し難い残響を復元し、音像の定位を正確にすることができるという効果を有する。   As described above, the signal processing apparatus and method according to the present invention uses the inter-channel phase difference value based on the inter-channel phase difference encoding flag and the inter-channel phase difference mode flag, so that The reverberation that is difficult to restore with the correlation value is restored, and the localization of the sound image can be made accurate.

図3は、信号における位相と時間との関係を示すグラフである。図3の左グラフは、信号を位相−振幅領域上に示すものである。(a)信号は、位相変化なく入力された信号であり、(b)信号は、(a)信号よりπ/2だけ位相の遅れた信号を示す。   FIG. 3 is a graph showing the relationship between phase and time in a signal. The left graph of FIG. 3 shows the signal on the phase-amplitude region. (A) The signal is a signal input without phase change, and (b) the signal indicates a signal delayed in phase by π / 2 from (a) signal.

一方、図3の右グラフは、信号を時間−振幅領域上に示すもので、左グラフの(a)及び(b)信号に対応する(a)'及び(b)'信号を示す。すなわち、(a)信号よりπ/2だけ位相の遅れた信号である(b)信号は、時間では(a)'信号より33ms遅れて入力された信号である(b)'信号と同一に示すことができる。このように、信号において位相−時間は密接な関係を有し、これらは互いに対応する値に変換して用いる場合にも同一の効果を奏する。   On the other hand, the right graph of FIG. 3 shows the signals on the time-amplitude region, and shows the (a) ′ and (b) ′ signals corresponding to the (a) and (b) signals of the left graph. That is, the signal (b) which is a signal delayed in phase by π / 2 from the signal (a) is the same as the signal (b) which is a signal input 33 ms behind the signal (a) ′ in time. be able to. Thus, phase-time has a close relationship in a signal, and these have the same effect even when converted into values corresponding to each other.

図4は、図2のIPD値測定部及びIPD値取得部を具体的に示すブロック図である。IPD測定部410は、IPD値測定部411、IPD量子化部412及び量子化モードフラグ生成部413を含む。IPD値測定部411は、入力された複数チャネル信号からチャネル間位相差情報を測定する。上述のように、チャネル間位相差値は、位相角であってもよいし、時間遅延値であってもよいし、これらに対応するインデックス値であってもよい。   FIG. 4 is a block diagram specifically illustrating the IPD value measurement unit and the IPD value acquisition unit of FIG. The IPD measurement unit 410 includes an IPD value measurement unit 411, an IPD quantization unit 412, and a quantization mode flag generation unit 413. The IPD value measurement unit 411 measures inter-channel phase difference information from the input multiple channel signals. As described above, the phase difference value between channels may be a phase angle, a time delay value, or an index value corresponding to these.

IPD量子化部412は、IPD値測定部411で測定されたチャネル間位相差値を量子化する。IPD量子化部412は、量子化間隔によってチャネル間位相差値をそれぞれ異なる方法で量子化できる細部構造をさらに含むことができる。例えば、第1量子化部(図示せず)では、細かい量子化間隔(細かい間隔)を用いてチャネル間位相差値を量子化でき、第2量子化部(図示せず)では、粗い量子化間隔(粗い間隔)を用いてチャネル間位相差値を量子化することができる。   The IPD quantization unit 412 quantizes the inter-channel phase difference value measured by the IPD value measurement unit 411. The IPD quantization unit 412 may further include a detailed structure that can quantize the inter-channel phase difference value using different methods according to the quantization interval. For example, a first quantization unit (not shown) can quantize an inter-channel phase difference value using a fine quantization interval (fine interval), and a second quantization unit (not shown) can perform coarse quantization. An inter-channel phase difference value can be quantized using an interval (coarse interval).

また、IPD量子化モードフラグ生成部413は、チャネル間位相差値を量子化する方式を示す量子化モードフラグ(quant_mode_flag)を生成することができる。量子化モードフラグは、詳細には、細かい間隔又は粗い間隔を用いてチャネル間位相差値が量子化されているか否かを示すことができる。   Further, the IPD quantization mode flag generation unit 413 can generate a quantization mode flag (quant_mode_flag) indicating a method for quantizing the inter-channel phase difference value. Specifically, the quantization mode flag can indicate whether or not the inter-channel phase difference value is quantized using a fine interval or a coarse interval.

チャネル間位相差値取得部(IPD値取得部)420は、IPD量子化モードフラグ取得部421、第1逆量子化部422、第2逆量子化部423及び逆量子化IPD値取得部424を含む。   The inter-channel phase difference value acquisition unit (IPD value acquisition unit) 420 includes an IPD quantization mode flag acquisition unit 421, a first inverse quantization unit 422, a second inverse quantization unit 423, and an inverse quantization IPD value acquisition unit 424. Including.

まず、量子化モードフラグ取得部421は、エンコーダから受信した空間情報から、チャネル間位相差値に適用された量子化方式を示す量子化モードフラグ(quant_mode_flag)を取得する。この量子化モードフラグの意味を、下記の表3に示す。   First, the quantization mode flag acquisition unit 421 acquires a quantization mode flag (quant_mode_flag) indicating the quantization method applied to the inter-channel phase difference value from the spatial information received from the encoder. The meaning of this quantization mode flag is shown in Table 3 below.

Figure 0005426680
Figure 0005426680

第1逆量子化部422は、量子化フラグが0の場合(IPD_quant_flag=0)、チャネル間位相差値を受信して粗い間隔でチャネル間位相差値を逆量子化する。一方、第2逆量子化部423は、量子化フラグが1の場合(IPD_quant_flag=1)、チャネル間位相差値を受信して細かい間隔でチャネル間位相差値を逆量子化する。次に、逆量子化IPD値取得部424は、第1逆量子化部422又は第2逆量子化部423から、逆量子化されたチャネル間位相差値を取得することができる。   When the quantization flag is 0 (IPD_quant_flag = 0), the first inverse quantization unit 422 receives the interchannel phase difference value and dequantizes the interchannel phase difference value at a coarse interval. On the other hand, when the quantization flag is 1 (IPD_quant_flag = 1), the second inverse quantization unit 423 receives the inter-channel phase difference value and de-quantizes the inter-channel phase difference value at fine intervals. Next, the dequantized IPD value acquisition unit 424 can acquire the dequantized inter-channel phase difference value from the first dequantization unit 422 or the second dequantization unit 423.

図5は、位相偏移フラグを用いて複数チャネル信号の位相復元を補償する信号処理装置500を示す図である。信号処理装置500は、グローバル帯域IPD値決定部510、信号修正部520、ダウンミキシング部530、空間情報生成部540、空間情報取得部550、アップミキシング部560及び位相偏移部570を含む。   FIG. 5 is a diagram illustrating a signal processing device 500 that compensates for phase restoration of a plurality of channel signals using a phase shift flag. The signal processing device 500 includes a global band IPD value determination unit 510, a signal correction unit 520, a downmixing unit 530, a spatial information generation unit 540, a spatial information acquisition unit 550, an upmixing unit 560, and a phase shift unit 570.

グローバル帯域IPD値決定部510は、まず、複数チャネル信号を受信する。この複数チャネル信号は、一つ以上のチャネルの位相が一致していない信号であってもよいし、ステレオ信号又は3以上のチャネルを有する信号であってもよい。グローバル帯域IPD値決定部510は、入力された複数チャネル信号の位相を一致させるために偏移される位相の度合いを示す位相偏移フラグを複数チャネル信号から決定する。   Global band IPD value determination section 510 first receives a multi-channel signal. The multi-channel signal may be a signal in which phases of one or more channels do not match, a stereo signal, or a signal having three or more channels. Global band IPD value determining section 510 determines a phase shift flag indicating the degree of phase shifted to match the phases of the input multiple channel signals from the multiple channel signals.

この位相偏移フラグは、複数チャネル信号の位相が偏移したということを示すフラグ情報であってもよいし、フラグ情報に加えて、位相が偏移された情報、位相が偏移されるチャネル信号、位相偏移が起きる周波数帯域、及び位相偏移に対応する時間情報などの、位相偏移と関連した情報をさらに含んでもよい。   This phase shift flag may be flag information indicating that the phase of a plurality of channel signals has shifted, or in addition to the flag information, information on the phase shift and the channel on which the phase is shifted. Information related to the phase shift may be further included, such as a signal, a frequency band where the phase shift occurs, and time information corresponding to the phase shift.

まず、位相偏移フラグがフラグ情報のみを示す場合、複数チャネル信号は、固定された値を用いて位相を偏移させることができる。例えば、複数チャネル信号がステレオ信号である場合、ステレオ信号のうち、右チャネルの位相をπ/2だけ減少させたり、左チャネルの位相を π/2だけ増加させたりすることによって、左及び右チャネルが直交するように位相を偏移させて当該複数チャネル信号を生成することができる。また、π/2の位相偏移に限定されず、左及び右チャネルが直交するように位相を偏移させて、複数チャネル信号を生成することもできる。   First, when the phase shift flag indicates only flag information, the phase of the multi-channel signal can be shifted using a fixed value. For example, if the multi-channel signal is a stereo signal, the left and right channels of the stereo signal can be reduced by decreasing the right channel phase by π / 2 or increasing the left channel phase by π / 2. The plurality of channel signals can be generated by shifting the phase so that the two are orthogonal to each other. The phase shift is not limited to π / 2, and a multi-channel signal can be generated by shifting the phase so that the left and right channels are orthogonal.

ここで、偏移される位相は、複数チャネル信号の全周波数帯域に同一に適用することができる。また、複数チャネル信号のうちの一つ以上のチャネルの位相がπ/2だけ修正されるという情報、特に、修正される位相、又は直交するように偏移される位相に関する情報は別に伝送されず、後でデコーダ端で既に設定された情報を用いることができるが、これに限定されない。   Here, the phase to be shifted can be equally applied to all frequency bands of a plurality of channel signals. In addition, information that the phase of one or more channels of a plurality of channel signals is corrected by π / 2, in particular, information regarding the phase to be corrected or the phase shifted to be orthogonal is not transmitted separately. The information already set at the decoder end can be used later, but is not limited to this.

このようにして、複数のパラメータ帯域にそれぞれチャネル間位相差値を伝送する場合に比べて情報伝送量を減少させることができ、パラメータ帯域ごとにそれぞれチャネル間位相差値を適用する場合に生じうる位相差の問題を防止することができる。   In this way, the amount of information transmission can be reduced compared to the case where inter-channel phase difference values are transmitted to a plurality of parameter bands, respectively, which can occur when the inter-channel phase difference values are applied to each parameter band. The problem of phase difference can be prevented.

一方、位相偏移フラグは、フラグ情報の他に、位相偏移に関する詳細情報をさらに含むことができる。詳細情報は、位相の偏移情報、位相が偏移されるチャネル信号に関する情報、位相偏移が起きる周波数帯域及び時間情報などを含むことができる。   On the other hand, the phase shift flag can further include detailed information regarding the phase shift in addition to the flag information. The detailed information may include phase shift information, information on a channel signal whose phase is shifted, frequency band and time information where the phase shift occurs, and the like.

また、位相偏移フラグは、フレーム別に複数チャネル信号の位相が偏移される度合を可変的に示すことができ、この位相偏移フラグがフラグ情報のみを含む場合には、フレーム別に位相が偏移されたか否かを示すことができる。また、位相偏移フラグがフラグ情報、及び偏移された位相に関する詳細情報を含む場合、詳細情報は副帯域又はパラメータ帯域別に位相の偏移度合を可変的に示すことができ、一定の時間範囲ごとに、例えば、フレーム又はタイムスロットなど、可変的に該当の時間における位相の偏移度合を示すことができる。   In addition, the phase shift flag can variably indicate the degree to which the phase of a plurality of channel signals is shifted for each frame. When this phase shift flag includes only flag information, the phase is shifted for each frame. It can indicate whether it has been moved or not. Further, when the phase shift flag includes flag information and detailed information about the shifted phase, the detailed information can variably indicate the degree of phase shift for each subband or parameter band, and can be set within a certain time range. For each, for example, the degree of phase shift at a corresponding time can be variably indicated, such as a frame or a time slot.

また、位相偏移フラグは、図1乃至図4で説明したチャネル間位相差値と並列に用いることができる。
信号修正部520は、位相偏移フラグ及び複数チャネル信号を受信する。この複数チャネル信号は、位相偏移フラグを用いて一つ以上のチャネルの位相を修正することによって位相の偏移された複数チャネル信号として生成することができる。上述のように、本明細書では、位相が一致していない複数チャネル信号の位相を一致(in−phase)させるように複数チャネル信号の位相を修正し、これに関する位相偏移フラグを生成する方法について述べたが、位相の一致する複数チャネル信号に含まれた少なくとも一つのチャネルの位相を故意に偏移させることで位相が一致していない(out−phase)信号とし、これに関する位相偏移フラグを生成することも可能である。
Further, the phase shift flag can be used in parallel with the inter-channel phase difference value described with reference to FIGS.
The signal correction unit 520 receives the phase shift flag and the multi-channel signal. The multi-channel signal can be generated as a multi-channel signal whose phase is shifted by correcting the phase of one or more channels using a phase shift flag. As described above, in the present specification, a method of correcting the phase of a plurality of channel signals so as to match the phases of the plurality of channel signals that do not match in phase, and generating a phase shift flag related thereto As described above, the phase of at least one channel included in a plurality of channel signals having the same phase is intentionally shifted to obtain an out-phase signal, and a phase shift flag related thereto Can also be generated.

ダウンミキシング部530は、位相が偏移された複数チャネル信号を受信してダウンミックスすることでダウンミックス信号を生成する。この複数チャネル信号は、ステレオ信号に限定されず、3以上のチャネルを有する信号にすることもできる。複数チャネル信号がステレオ信号である場合、ダウンミックス信号はモノ信号であってよく、複数チャネル信号が3以上のチャネルを有する信号である場合、ダウンミックス信号はステレオ信号、又は複数チャネル信号のチャネル数よりも小さい数のチャネルを有する信号であってよい。   The downmixing unit 530 generates a downmix signal by receiving and downmixing a plurality of channel signals whose phases are shifted. The multi-channel signal is not limited to a stereo signal, and can be a signal having three or more channels. When the multi-channel signal is a stereo signal, the downmix signal may be a mono signal, and when the multi-channel signal is a signal having three or more channels, the downmix signal is a stereo signal or the number of channels of the multi-channel signal. It may be a signal having a smaller number of channels.

空間情報生成部540は、位相が偏移された複数チャネル信号を受信して複数チャネル信号の属性を示す空間情報を生成することができる。空間情報は、デコーダでダウンミックス信号を、位相が偏移された複数チャネル信号にアップミックスするのに用いるもので、チャネル間レベル差情報、チャネル間相関値及びチャネル予測係数を含むことができる。したがって、本発明の空間情報生成部540で生成された空間情報は、位相が偏移されていない複数チャネル信号から生成された空間情報と同一でない場合もある。   Spatial information generation section 540 can receive a plurality of channel signals whose phases are shifted and generate spatial information indicating attributes of the plurality of channel signals. Spatial information is used for upmixing a downmix signal into a plurality of phase-shifted channel signals by a decoder, and can include interchannel level difference information, interchannel correlation values, and channel prediction coefficients. Therefore, the spatial information generated by the spatial information generation unit 540 of the present invention may not be the same as the spatial information generated from a plurality of channel signals whose phases are not shifted.

また、ビットストリーム生成部(図示せず)は、空間情報及び位相偏移フラグを含む一つのビットストリームを生成することもでき、ダウンミックス信号、空間情報及び位相偏移フラグを含む一つのビットストリームを生成することもできる。   In addition, the bitstream generation unit (not shown) can generate one bitstream including spatial information and a phase shift flag, and one bitstream including a downmix signal, spatial information, and a phase shift flag Can also be generated.

情報取得部550は、ビットストリームから、ダウンミックス信号をアップミックスするための空間情報及び位相偏移フラグを取得する。   The information acquisition unit 550 acquires spatial information and a phase shift flag for upmixing the downmix signal from the bitstream.

アップミキシング部560は、図2のアップミキシング部240と同一の構成及び機能を果たす。アップミックスされた複数チャネル信号は、アップミキシングマトリクスが適用されてアップミックスされた信号であってもよいし、アップミックスされてQMF領域上に生成された信号であってもよいし、時間領域上の信号として最終出力された信号であってもよい。また、アップミキシング部560でアップミックスされた信号は、信号修正部520で位相が偏移された複数チャネル信号であってもよい。   The up-mixing unit 560 has the same configuration and function as the up-mixing unit 240 of FIG. The upmixed multi-channel signal may be an upmixed signal to which an upmixing matrix is applied, an upmixed signal generated on the QMF domain, or on the time domain. The final output signal may be used as the signal. Further, the signal upmixed by the upmixing unit 560 may be a multi-channel signal whose phase is shifted by the signal correction unit 520.

位相偏移部570は、空間情報取得部550からの位相偏移フラグ、及びアップミキシング部560からの位相偏移された複数チャネル信号を受信する。その後、位相が偏移された複数チャネル信号に位相偏移フラグを適用することで、複数チャネル信号の偏移された位相を復元させる。   The phase shift unit 570 receives the phase shift flag from the spatial information acquisition unit 550 and the phase-shifted multi-channel signal from the upmixing unit 560. Thereafter, a phase shift flag is applied to the plurality of channel signals whose phases are shifted, thereby restoring the phase of the shift of the plurality of channel signals.

この位相偏移フラグは、上述のように、複数チャネル信号の少なくとも一つのチャネルの位相が偏移したか否かを示すフラグ情報のみを含むことができ、位相偏移と関連した詳細情報を更に含むことができる。フラグ情報のみを含む場合、位相偏移部570は、フラグ情報に基づいて、アップミックスされた複数チャネル信号の位相を偏移させるか否かを決定し、固定された値を用いて複数チャネル信号の少なくとも一つのチャネルの位相を偏移させることができる。このとき、固定された値は、デコーダで既に設定された値を利用し、別途にエンコーダで測定して伝送しなくてもよく、例えば、複数チャネル信号の一つ以上のチャネルをπ/2だけ増加させたり減少させたりすることができる。この場合、π/2は複数チャネル信号の全周波数帯域に同一に適用することができる。また、位相偏移フラグはフレーム別に決定することができるので、複数チャネル信号の位相が偏移する度合又は位相が偏移されたか否かを、フレームごとに可変的に示すことができる。   As described above, the phase shift flag can include only flag information indicating whether or not the phase of at least one channel of the multi-channel signal has shifted, and further includes detailed information related to the phase shift. Can be included. When only the flag information is included, the phase shifting unit 570 determines whether to shift the phase of the upmixed multiple channel signal based on the flag information, and uses the fixed value to determine the multiple channel signal. The phase of at least one of the channels can be shifted. At this time, the fixed value may be a value already set by the decoder and may not be separately measured and transmitted by the encoder. For example, one or more channels of a multi-channel signal may be transmitted by π / 2. It can be increased or decreased. In this case, π / 2 can be equally applied to all frequency bands of a plurality of channel signals. Further, since the phase shift flag can be determined for each frame, it is possible to variably indicate for each frame whether the phase of the plurality of channel signals is shifted or whether the phase is shifted.

図6は、位相偏移フラグを用いて複数チャネル信号の位相復元を補償する本発明のほかの実施例である信号処理装置600を示す図である。図6を参照すると、信号処理装置600は、ダウンミキシング部610、空間情報生成部620、信号修正部630、グローバル帯域IPD値取得部640、位相偏移部650及びアップミキシング部660を含む。   FIG. 6 is a diagram illustrating a signal processing apparatus 600 according to another embodiment of the present invention that compensates for phase restoration of a plurality of channel signals using a phase shift flag. Referring to FIG. 6, the signal processing apparatus 600 includes a downmixing unit 610, a spatial information generation unit 620, a signal correction unit 630, a global band IPD value acquisition unit 640, a phase shift unit 650, and an upmixing unit 660.

ダウンミキシング部610は、入力された複数チャネル信号をダウンミックスしてダウンミックス信号DMXを生成する。ここで、複数チャネル信号は、位相が偏移されていない入力されたままの信号である。   The downmixing unit 610 generates a downmix signal DMX by downmixing the input multiple channel signals. Here, the multi-channel signal is a signal that has not been shifted in phase and has been input.

空間情報生成部620は、入力された複数チャネル信号の属性を表す空間情報を生成することができる。この空間情報は、図5の空間情報と同一の構成及び機能を有するものであり、ただし、位相が偏移されていない複数チャネル信号から生成されるという点が、図5の空間情報と異なる。一方、空間情報生成部620は、グローバル帯域IPD値決定部621を含み、グローバル帯域IPD値決定部621は、図5のグローバル帯域IPD値決定部と同一の構成及び機能を有するので、その詳細説明は省略する。   The spatial information generation unit 620 can generate spatial information that represents the attributes of the input multiple channel signals. This spatial information has the same configuration and function as the spatial information in FIG. 5, except that it is generated from a plurality of channel signals whose phases are not shifted. Meanwhile, the spatial information generation unit 620 includes a global band IPD value determination unit 621. The global band IPD value determination unit 621 has the same configuration and function as the global band IPD value determination unit of FIG. Is omitted.

信号修正部630は、グローバル帯域IPD値決定部621から出力された位相偏移フラグに基づいて、ダウンミキシング部610から出力されたダウンミックス信号の少なくとも一つのチャネルの位相を修正し、位相の修正されたダウンミックス信号DMX’を生成することができる。   The signal correction unit 630 corrects the phase of at least one channel of the downmix signal output from the downmixing unit 610 based on the phase shift flag output from the global band IPD value determination unit 621, and corrects the phase. The generated downmix signal DMX ′ can be generated.

次に、グローバル帯域IPD値取得部640は、位相偏移フラグを取得し、位相偏移部650は、位相偏移フラグに基づいて、入力された修正ダウンミックス信号MDX’の少なくとも一つのチャネルの位相を偏移させて復元することによって、ダウンミックス信号DMXとして復元することができる。この時、位相偏移部650で位相が偏移されたダウンミックス信号DMXは、信号修正部630に入力される信号DMXと同一であってもよい。   Next, the global band IPD value acquisition unit 640 acquires a phase shift flag, and the phase shift unit 650 determines at least one channel of the input modified downmix signal MDX ′ based on the phase shift flag. By restoring by shifting the phase, it can be restored as the downmix signal DMX. At this time, the downmix signal DMX whose phase is shifted by the phase shifting unit 650 may be the same as the signal DMX input to the signal correcting unit 630.

アップミキシング部660は、空間情報生成部620からの空間情報、及び位相偏移部650からのダウンミックス信号DMXを受信して複数チャネル信号を復号することができる。   The upmixing unit 660 can receive the spatial information from the spatial information generation unit 620 and the downmix signal DMX from the phase shift unit 650 and decode the multi-channel signal.

一方、本発明の信号処理方法及び装置は、チャネル間位相差値が変動する点で一時的に発生する雑音を除去するために種々の方法を行うが、これについては図7乃至図9を参照して説明する。   On the other hand, the signal processing method and apparatus of the present invention performs various methods for removing noise temporarily generated at the point where the inter-channel phase difference value fluctuates. For this, refer to FIGS. To explain.

まず、図7は、パラメータタイムスロットを示す概念図である。信号は、時間−周波数領域で示すことができる。図7を参照すると、1フレームのN個のタイムスロットのうちの2個のタイムスロット(タイムスロット2、タイムスロット4)に、パラメータセットが適用される。そして、信号の全周波数範囲は5個のパラメータ帯域に分割される。したがって、時間軸の単位はタイムスロットとし、周波数軸の単位はパラメータ帯域(pb)とすることができ、パラメータ帯域は、同一のチャネル間位相差値が含まれる少なくとも一つの周波数領域上の副帯域とすることができる。また、タイムスロットのうち、パラメータセットが適用されるように、つまり、チャネル間位相差値が適用されるように定義されたタイムスロットをパラメータタイムスロットと称する。   First, FIG. 7 is a conceptual diagram showing parameter time slots. The signal can be shown in the time-frequency domain. Referring to FIG. 7, the parameter set is applied to two time slots (time slot 2, time slot 4) of N time slots in one frame. The entire frequency range of the signal is divided into five parameter bands. Therefore, the unit of the time axis can be a time slot, and the unit of the frequency axis can be a parameter band (pb). The parameter band is a subband on at least one frequency region including the same inter-channel phase difference value. It can be. Of the time slots, a time slot defined such that a parameter set is applied, that is, an inter-channel phase difference value is applied, is referred to as a parameter time slot.

図8は、本発明の更にほかの実施例によってチャネル間位相差値を修正(平滑化)する方法を示す概略図である。図8を参照すると、左下段のグラフは、パラメータタイムスロットのうちの2番目のパラメータ帯域に含まれたチャネル間位相差値を示すグラフである。パラメータタイムスロット[0]に適用されるチャネル間位相差値は10゜で、パラメータタイムスロット[1]に適用されるチャネル間位相差値は60゜でありうる。このようにチャネル間位相差値が大きく変動する点では予想せぬ雑音が発生することがある。したがって、本発明の信号処理方法及び装置は、先行するパラメータタイムスロットに適用されるチャネル間位相差値を用いて、現在のパラメータタイムスロットに適用されるチャネル間位相差値を平滑化することによって、雑音を除去できるという効果を奏する。   FIG. 8 is a schematic diagram illustrating a method of correcting (smoothing) the inter-channel phase difference value according to still another embodiment of the present invention. Referring to FIG. 8, the lower left graph is a graph showing the inter-channel phase difference value included in the second parameter band in the parameter time slot. The inter-channel phase difference value applied to the parameter time slot [0] may be 10 °, and the inter-channel phase difference value applied to the parameter time slot [1] may be 60 °. Thus, unexpected noise may occur at the point where the phase difference value between channels fluctuates greatly. Therefore, the signal processing method and apparatus of the present invention uses the inter-channel phase difference value applied to the preceding parameter time slot to smooth the inter-channel phase difference value applied to the current parameter time slot. The effect that noise can be removed is produced.

再び図8を参照すると、現在のパラメータタイムスロットをパラメータタイムスロット[1]とすれば、先行するパラメータタイムスロットはパラメータタイムスロット[0]になりうる。図8の右下段のグラフに示すように、現在のパラメータタイムスロットに適用されるチャネル間位相差値(60゜)を、先行するパラメータタイムスロットに適用されるチャネル間位相差値(10゜)を用いて平滑化することができ、よって、平滑化して修正された現在のパラメータタイムスロットのチャネル間位相差値は、60゜よりも小さい値を有することができる。   Referring again to FIG. 8, if the current parameter time slot is the parameter time slot [1], the preceding parameter time slot can be the parameter time slot [0]. As shown in the lower right graph of FIG. 8, the inter-channel phase difference value (60 °) applied to the current parameter time slot is changed to the inter-channel phase difference value (10 °) applied to the preceding parameter time slot. So that the inter-channel phase difference value of the current parameter time slot that has been smoothed and modified can have a value less than 60 °.

その後、現在及び/又は先行するパラメータタイムスロットに適用される平滑化されたチャネル間位相差値を補間及び/又は複製することによって、パラメータセットが適用されるように定義されていないタイムスロット、例えば、タイムスロット1、タイムスロット3、…、タイムスロットNに適用されるチャネル間位相差値を取得することができる。   A time slot where the parameter set is not defined to be applied, for example by interpolating and / or duplicating the smoothed inter-channel phase difference value applied to the current and / or preceding parameter time slots, e.g. , Time slot 1, time slot 3,..., Time slot N can be obtained.

図9は、図8の本発明の更にほかの実施例に係る信号処理装置を示すブロック図である。図9におけるダウンミキシング部910、IPD利用決定部921、IPD値測定部922、IPDモードフラグ生成部923、IPD符号化フラグ生成部924、IPD符号化フラグ取得部931、IPDモードフラグ取得部932、IPD値取得部933、アップミキシング部940は、図2におけるダウンミキシング部210、IPD利用決定部221、IPD値測定部222、IPDモードフラグ生成部223、IPD符号化フラグ生成部224、IPD符号化フラグ取得部231、IPDモードフラグ取得部232、IPD値取得部233及びアップミキシング部240と同一の構成及び機能を有するので、その詳細な説明は省略する。   FIG. 9 is a block diagram showing a signal processing apparatus according to still another embodiment of the present invention shown in FIG. 9, the downmixing unit 910, the IPD usage determining unit 921, the IPD value measuring unit 922, the IPD mode flag generating unit 923, the IPD encoding flag generating unit 924, the IPD encoding flag acquiring unit 931, the IPD mode flag acquiring unit 932, The IPD value acquisition unit 933 and the upmixing unit 940 are the downmixing unit 210, the IPD usage determination unit 221, the IPD value measurement unit 222, the IPD mode flag generation unit 223, the IPD encoding flag generation unit 224, and the IPD encoding in FIG. Since it has the same configuration and function as the flag acquisition unit 231, the IPD mode flag acquisition unit 232, the IPD value acquisition unit 233, and the upmixing unit 240, detailed description thereof is omitted.

情報取得部930は、IPD値平滑化部934を更に含むことができる。IPD値平滑化部934は、先行するパラメータタイムスロットに適用されるチャネル間位相差値を用いて、現在のパラメータタイムスロットに適用されるチャネル間位相差値を修正することができる。これによって、現在のパラメータタイムスロットに適用されるチャネル間位相差値が、先行するパラメータタイムスロットに適用されるチャネル間位相差値と大きな相違を有する場合、生じうる雑音を防止することができる。   The information acquisition unit 930 can further include an IPD value smoothing unit 934. The IPD value smoothing unit 934 can correct the inter-channel phase difference value applied to the current parameter time slot using the inter-channel phase difference value applied to the preceding parameter time slot. This can prevent noise that may occur when the inter-channel phase difference value applied to the current parameter time slot is significantly different from the inter-channel phase difference value applied to the preceding parameter time slot.

また、IPD値平滑化部934は、現在のパラメータタイムスロットに適用されるチャネル間位相差値から、複数チャネルのうちの2チャネル間の角度を表す位相角度を生成することができ、この位相角度を、先行するパラメータタイムスロットの位相角度を用いて修正することができる。該修正された位相角度は、後でアップミキシング部640に出力される。修正された位相角度はアップミキシング部640でダウンミックス信号に適用されて複数チャネル信号を生成することができる。   Further, the IPD value smoothing unit 934 can generate a phase angle representing an angle between two channels of a plurality of channels from the inter-channel phase difference value applied to the current parameter time slot. Can be corrected using the phase angle of the preceding parameter time slot. The corrected phase angle is output to the upmixing unit 640 later. The corrected phase angle may be applied to the downmix signal by the upmixing unit 640 to generate a multi-channel signal.

以下では、一般に、チャネル間位相差値を利用せず、チャネル間レベル差及びチャネル間相関値を用いて信号を符号化する場合、発生する問題点を解決するための本発明の様々な実施例について説明する。   In the following, various embodiments of the present invention for solving problems that occur when signals are generally encoded using inter-channel level differences and inter-channel correlation values without using inter-channel phase difference values. Will be described.

図10は、本発明のさらに他の実施例による信号処理方法及び装置が解決しようとする問題点を示す概念図である。   FIG. 10 is a conceptual diagram illustrating a problem to be solved by a signal processing method and apparatus according to another embodiment of the present invention.

多くの信号符号化装置では、特に、3GPP及びMPEGで規格化されたEAAC+又はHE AAC Plus及びUSACで使用するPSでは、チャネル間位相差値を利用せず、チャネル間レベル差値及びチャネル間相関情報のみを空間情報として用いている。これは、チャネル間位相差値を生成する上で生じうる位相ラッピング現象とチャネル間位相差値を合成する上で発生する音質の低下のためである。   In many signal coding apparatuses, especially in PS used in EAAC + or HE AAC Plus and USAC standardized by 3GPP and MPEG, the inter-channel phase difference value and the inter-channel correlation value are not used. Only information is used as spatial information. This is because a phase wrapping phenomenon that may occur when generating an inter-channel phase difference value and a deterioration in sound quality that occurs when synthesizing the inter-channel phase difference value.

しかし、チャネル間位相差値を利用せずに複数チャネル信号を符号化する場合、音像定位において深刻な問題が生じることがある。換言すると、2以上のマイクを互いに隣接して配置して録音した信号のように、チャネル間レベル差値を主に用いて符号化した信号では問題が生じないが、2以上のマイクを互いに離して配置して録音した信号は、チャネル間位相差値を用いないと、複数チャネル信号の復号時に正確な音像定位が不可能になるという問題につながる。   However, when a multi-channel signal is encoded without using the inter-channel phase difference value, a serious problem may occur in sound image localization. In other words, there is no problem with a signal encoded mainly using the interchannel level difference value, such as a signal recorded with two or more microphones arranged adjacent to each other, but the two or more microphones are separated from each other. If the signals are arranged and recorded in this manner, an accurate sound image localization cannot be performed when a plurality of channel signals are decoded unless the phase difference value between channels is used.

図10(a)は、チャネル間位相差値のみ存在するステレオ信号を、チャネル間位相差値なしで復号する場合の結果を示す。図10(a)を参照すると、原信号はチャネル間位相差値のみで形成された信号である(IPD=30゜)。しかし、チャネル間レベル差値及びチャネル間相関値のみを用いて復号すると、有効な空間情報(IPD値)がないため、復号された信号(合成信号)の音像は、原信号によらずステレオ信号の中央に位置することになる。この場合、チャネル間相関値が音像定位に影響を及ぼすが、チャネル間位相差値なしでは正確な音像定位が不可能である。   FIG. 10A shows the result when a stereo signal having only an inter-channel phase difference value is decoded without an inter-channel phase difference value. Referring to FIG. 10A, the original signal is a signal formed only by the phase difference value between channels (IPD = 30 °). However, if decoding is performed using only the inter-channel level difference value and the inter-channel correlation value, there is no effective spatial information (IPD value), so the sound image of the decoded signal (synthesized signal) is a stereo signal regardless of the original signal. It will be located in the center of In this case, the inter-channel correlation value affects the sound image localization, but accurate sound image localization is impossible without the inter-channel phase difference value.

一方、図10(b)は、チャネル間位相差値及びチャネル間レベル差値が混在するステレオ信号を、チャネル間位相差値なしで復号する場合の結果を示す。図10(b)を参照すると、ステレオ信号の音像定位は、チャネル間位相差値から決定される調節角度とチャネル間レベル差値から決定される調節角度との線形的な和として決定される。原ステレオ信号が、図10(b)に示すように、左側信号が右側信号に比べて、8dBだけさらに大きい値を有し、0.5msだけさらに速い場合、8dBのレベル差は、音像を中央から左側へ20゜(−20゜)移動させることができ、0.5msの時間差(−10゜のチャネル間位相差値と同一)は、音像を左に10゜(−10゜)移動させることができるという特徴を有する。したがって、原ステレオ信号は、−30゜位置に存在するようになる。しかし、チャネル間位相差値を用いないで信号を復号すると、復号された信号の音像は−20゜に位置するため、正確な音像の定位が不可能である。   On the other hand, FIG. 10B shows a result in the case of decoding a stereo signal in which an inter-channel phase difference value and an inter-channel level difference value are mixed without an inter-channel phase difference value. Referring to FIG. 10B, the sound image localization of the stereo signal is determined as a linear sum of the adjustment angle determined from the inter-channel phase difference value and the adjustment angle determined from the inter-channel level difference value. When the original stereo signal has a larger value by 8 dB than the right signal and is faster by 0.5 ms as shown in FIG. 10B, the level difference of 8 dB causes the sound image to be centered. Can be moved 20 ° to the left side (-20 °), and a time difference of 0.5 ms (same as the phase difference value between channels of -10 °) moves the sound image 10 ° (−10 °) to the left. It has the feature of being able to. Therefore, the original stereo signal is present at the -30 ° position. However, if the signal is decoded without using the inter-channel phase difference value, the sound image of the decoded signal is located at −20 °, so that accurate sound image localization is impossible.

したがって、本発明の更にほかの実施例による信号処理方法及び装置は、音像定位における問題を解決するために種々の方法を更に提供する。   Therefore, the signal processing method and apparatus according to still another embodiment of the present invention further provides various methods for solving the problem in sound image localization.

図11及び図12は、本発明の更にほかの実施例による信号処理方法及び装置を示すブロック図である。   11 and 12 are block diagrams illustrating a signal processing method and apparatus according to another embodiment of the present invention.

第一に、複数チャネル信号のチャネル間位相差情報及びチャネル間レベル差値との比率に基づいて、一定条件を満たす場合にのみチャネル間位相差情報を利用することができる。図11に示すように、信号処理装置1100は、ダウンミキシング部1110、空間情報生成部1120、情報取得部1130及びアップミキシング部1140を含む。   First, based on the ratio between the inter-channel phase difference information and the inter-channel level difference value of a plurality of channel signals, the inter-channel phase difference information can be used only when a certain condition is satisfied. As illustrated in FIG. 11, the signal processing device 1100 includes a downmixing unit 1110, a spatial information generation unit 1120, an information acquisition unit 1130, and an upmixing unit 1140.

ダウンミキシング部1110及びアップミキシング部1140は、図2におけるダウンミキシング部210及びアップミキシング部240と同一の構成及び機能を有する。空間情報生成部1120は、ILD値測定部1121、IPD値測定部1122、情報決定部1123及びIPDフラグ生成部1124を含む。ILD値測定部1121及びIPD値測定部1122は、複数チャネル信号からチャネル間レベル差値及びチャネル間位相差値を測定する。このチャネル間レベル差値及びチャネル間位相差値は、パラメータ帯域別に測定することができる。   The downmixing unit 1110 and the upmixing unit 1140 have the same configuration and function as the downmixing unit 210 and the upmixing unit 240 in FIG. The spatial information generation unit 1120 includes an ILD value measurement unit 1121, an IPD value measurement unit 1122, an information determination unit 1123, and an IPD flag generation unit 1124. The ILD value measuring unit 1121 and the IPD value measuring unit 1122 measure an inter-channel level difference value and an inter-channel phase difference value from a plurality of channel signals. The inter-channel level difference value and the inter-channel phase difference value can be measured for each parameter band.

情報決定部1123は、測定されたチャネル間レベル差値及びチャネル間位相差値を用いて、信号がどれくらい音像定位されるか計算し、チャネル間レベル差値とチャネル間位相差値が全体音像定位においてどれくらいの比率を占めるか計算して、チャネル間位相差値の比率がより高い場合にのみチャネル間位相差値を用いるように決定する。例えば、測定されたチャネル間位相差値が+20゜に対応し、測定されたチャネル間レベル差値が4dBと、+10゜位相偏移させる値に対応する場合、全体音像定位(20゜+10゜=30゜)においてチャネル間位相差値及びチャネル間レベル差値が寄与する度合は、それぞれ20/30、10/30になりうる。この場合、チャネル間位相差値が相対的に重要性が大きいといえるので、情報決定部1123は、チャネル間位相差値を更に用いると決定することができる。   The information determination unit 1123 uses the measured inter-channel level difference value and inter-channel phase difference value to calculate how much the sound image is localized, and the inter-channel level difference value and the inter-channel phase difference value are determined as the overall sound image localization. It is determined to use the inter-channel phase difference value only when the ratio of the inter-channel phase difference value is higher. For example, when the measured inter-channel phase difference value corresponds to + 20 ° and the measured inter-channel level difference value corresponds to 4 dB and a value shifted by + 10 °, the whole sound image localization (20 ° + 10 ° = The degree of contribution of the inter-channel phase difference value and the inter-channel level difference value at 30 ° can be 20/30 and 10/30, respectively. In this case, since the inter-channel phase difference value can be said to be relatively important, the information determination unit 1123 can determine that the inter-channel phase difference value is further used.

IPDフラグ生成部1124は、情報決定部1123でチャネル間位相差値を更に用いると決定すれば、チャネル間位相差値が用いられることを示すチャネル間位相差値フラグを生成することができる。   If the information determination unit 1123 further determines that the inter-channel phase difference value is to be used, the IPD flag generation unit 1124 can generate an inter-channel phase difference value flag indicating that the inter-channel phase difference value is used.

一方、情報取得部1130は、IPDフラグ取得部1131及びIPD値取得部1132を含むことができ、IPDフラグ取得部1131は、チャネル間位相差値フラグを取得して空間情報にチャネル間位相差値が含まれているか否かを判断する。チャネル間位相差値フラグが1の場合、IPD値取得部1132が活性化されて空間情報からチャネル間位相差値を取得する。その後、アップミキシング部1140は、チャネル間位相差値を含む空間情報を用いて、ダウンミックス信号をアップミックスすることで複数チャネル信号を復号し、チャネル間位相差値を用いない場合に比べて、複数チャネル信号の正確な音像定位が可能になる。また、一定条件を満たす場合にのみチャネル間位相差値を伝送することによって符号化効率を高めることもできる。   Meanwhile, the information acquisition unit 1130 can include an IPD flag acquisition unit 1131 and an IPD value acquisition unit 1132. The IPD flag acquisition unit 1131 acquires an inter-channel phase difference value flag and stores the inter-channel phase difference value in the spatial information. It is determined whether or not is included. When the inter-channel phase difference value flag is 1, the IPD value acquisition unit 1132 is activated to acquire the inter-channel phase difference value from the spatial information. Thereafter, the up-mixing unit 1140 uses the spatial information including the inter-channel phase difference value to decode the multiple channel signal by up-mixing the down-mix signal, compared to the case where the inter-channel phase difference value is not used. Accurate sound image localization of multi-channel signals becomes possible. Also, it is possible to increase the coding efficiency by transmitting the inter-channel phase difference value only when a certain condition is satisfied.

第二に、チャネル間位相差値は、等価のチャネル間レベル差値に置き替えることもでき、その逆も可能である。この場合、音像定位に必要なチャネル間位相差値及びチャネル間レベル差値は周波数によって変わることがあるので、周波数帯域別に定義されたデータベースを参照する。   Second, the inter-channel phase difference value can be replaced with an equivalent inter-channel level difference value, and vice versa. In this case, the inter-channel phase difference value and the inter-channel level difference value necessary for sound image localization may vary depending on the frequency, so a database defined for each frequency band is referred to.

図12は、チャネル間位相差値を等価のチャネル間レベル差値に変更して用いる信号処理装置1200を示す。信号処理装置1200は、ILD値測定部1210、IPD値測定部1220、情報決定部1230、IPD値変換部1240及びILD値修正部1250を含む。   FIG. 12 shows a signal processing apparatus 1200 that is used by changing the inter-channel phase difference value to an equivalent inter-channel level difference value. The signal processing device 1200 includes an ILD value measurement unit 1210, an IPD value measurement unit 1220, an information determination unit 1230, an IPD value conversion unit 1240, and an ILD value correction unit 1250.

ILD値測定部1210、IPD値測定部1220及び情報決定部1230は、図11におけるILD値測定部1121、IPD値測定部1122及び情報決定部1130と同一の構成及び機能を有するので、その詳細な説明は省略する。情報決定部1130でチャネル間位相差値を用いると決定した場合、測定されたチャネル間位相差値はIPD値変換部1240に入力される。   Since the ILD value measuring unit 1210, the IPD value measuring unit 1220, and the information determining unit 1230 have the same configurations and functions as the ILD value measuring unit 1121, the IPD value measuring unit 1122, and the information determining unit 1130 in FIG. Description is omitted. When the information determination unit 1130 determines to use the inter-channel phase difference value, the measured inter-channel phase difference value is input to the IPD value conversion unit 1240.

IPD値変換部1240は、データベースを用いて、該当の周波数帯域で測定されたチャネル間位相差値を等価のチャネル間レベル差値ILD'に変換させる。次に、ILD値修正部1250は、ILD値測定部1210から入力されたチャネル間レベル差値ILDに、チャネル間位相差値が変換されたチャネル間レベル差値ILD'を加えて、修正されたチャネル間レベル差値ILD''を計算する。   The IPD value conversion unit 1240 uses the database to convert the inter-channel phase difference value measured in the corresponding frequency band into an equivalent inter-channel level difference value ILD ′. Next, the ILD value correcting unit 1250 is corrected by adding the inter-channel level difference value ILD ′ obtained by converting the inter-channel phase difference value to the inter-channel level difference value ILD input from the ILD value measuring unit 1210. An inter-channel level difference value ILD ″ is calculated.

このように、チャネル間位相差値を等価のチャネル間レベル差値に変換して用いる場合、3GPP及びMPEGで用いるHE AAC Plus、又はUSAC標準で用いるPS等を含め、チャネル間位相差値の受信を許容しない既存の信号処理装置及び方法を利用する場合にもチャネル間位相差値を反映することができ、残響及び音像定位が向上した信号として復号することができる。   As described above, when the inter-channel phase difference value is converted into an equivalent inter-channel level difference value, the inter-channel phase difference value is received, including HE AAC Plus used in 3GPP and MPEG, or PS used in the USAC standard. Even when using an existing signal processing apparatus and method that does not allow the signal, the phase difference value between channels can be reflected, and the signal can be decoded as a signal with improved reverberation and sound image localization.

第三に、チャネル間位相差値を連続する少なくとも一つのフレームに共通に適用することによって、正確な音像定位を実現するとともに符号化効率を高めることができる。本明細書では、連続する数個のフレームで用いられるチャネル間位相差値を、グローバルフレームチャネル間位相差値(global frame IPD value)と称する。図13は、本発明の更にほかの実施例によってグローバルフレームチャネル間位相差値が用いられる概念を示す概念図である。図13を参照すると、数字0〜13はそれぞれフレームを表し、影付きフレームは、チャネル間位相差値を用いるフレームであり、そうでないフレームは、チャネル間位相差値が用いられないフレームである。これらは、本明細書で説明したチャネル間位相差モードフラグ(bsPhaseMode)に基づいて決定することができる。   Third, by applying the inter-channel phase difference value in common to at least one continuous frame, accurate sound image localization can be realized and encoding efficiency can be increased. In this specification, an inter-channel phase difference value used in several consecutive frames is referred to as a global frame inter-channel phase difference value (global frame IPD value). FIG. 13 is a conceptual diagram illustrating a concept in which a phase difference value between global frame channels is used according to still another embodiment of the present invention. Referring to FIG. 13, numerals 0 to 13 represent frames, shaded frames are frames that use interchannel phase difference values, and frames that are not are frames that do not use interchannel phase difference values. These can be determined based on the inter-channel phase difference mode flag (bsPhaseMode) described herein.

図13に示すように、フレーム1〜3及びフレーム8〜12のみがチャネル間位相差値を用いる場合、チャネル間位相差値をフレームごとに伝送せずに、代表値を計算してチャネル間位相差値を適用するように決定された連続フレームに同一に適用し、連続するフレームのうちの最初のフレームにのみグローバルフレームチャネル間位相差値を含み、毎フレームは、グローバルフレームチャネル間位相差値が用いられているか否かを示すグローバルフレームチャネル間位相差フラグを含むことができる。グローバルフレームチャネル間位相差フラグの意味は、下記の表4の通りである。   As shown in FIG. 13, when only the frames 1 to 3 and the frames 8 to 12 use the inter-channel phase difference value, the inter-channel phase difference value is not transmitted for each frame, and the representative value is calculated and the inter-channel phase value is calculated. Apply the same to consecutive frames determined to apply the phase difference value, only the first frame of the consecutive frames contains the global frame channel phase difference value, and each frame contains the global frame channel phase difference value A global frame channel phase difference flag indicating whether or not is used can be included. The meaning of the global frame channel phase difference flag is as shown in Table 4 below.

Figure 0005426680
Figure 0005426680

例えば、グローバルフレームチャネル間位相差フラグに基づいて、フレーム0は、グローバルフレームチャネル間位相差値を利用せず、フレーム1はグローバルフレームチャネル間位相差値を用いる。したがって、フレーム1は、グローバルフレームチャネル間位相差値を含み、同一のグローバルフレームチャネル間位相差値は、フレーム1乃至3に適用することができる。同様に、フレーム8は、グローバルフレームチャネル間位相差値を含み、同一のグローバルフレームチャネル間位相差値がフレーム8乃至12に適用することができる。   For example, based on the global frame channel phase difference flag, frame 0 does not use the global frame channel phase difference value, and frame 1 uses the global frame channel phase difference value. Accordingly, the frame 1 includes global frame channel phase difference values, and the same global frame channel phase difference value can be applied to the frames 1 to 3. Similarly, the frame 8 includes global frame channel phase difference values, and the same global frame channel phase difference value can be applied to the frames 8 to 12.

図14は、図13のグローバルフレームチャネル間位相差値を用いる本発明の実施例による信号符号化装置1400を示す図である。図14を参照すると、信号符号化装置1400は、先行フレームグローバルフレームIPD値受信部1410、グローバルフレームIPD値計算部1420、グローバルフレームIPDフラグ生成部1430、グローバルフレームIPDフラグ取得部1440、グローバルフレームIPD値取得部1450、アップミキシング部1460を含む。   FIG. 14 is a diagram illustrating a signal encoding apparatus 1400 according to an embodiment of the present invention using the global frame channel phase difference value of FIG. Referring to FIG. 14, the signal encoding apparatus 1400 includes a preceding frame global frame IPD value receiving unit 1410, a global frame IPD value calculating unit 1420, a global frame IPD flag generating unit 1430, a global frame IPD flag acquiring unit 1440, and a global frame IPD. A value acquisition unit 1450 and an upmixing unit 1460 are included.

先行フレームグローバルフレームIPD値受信部1410は、先行フレームのグローバルフレームチャネル間位相差値を受信する。例えば、現在フレームがグローバルフレームチャネル間位相差値を含む1番目のフレームである場合には、受信された先行フレームのグローバルフレームチャネル間位相差値が存在しない。一方、現在のフレームがグローバルフレームチャネル間位相差値を含む連続するフレームのうち、2番目以降のフレームである場合には、先行フレームからグローバルフレームチャネル間位相差値を受信することができる。   The preceding frame global frame IPD value receiving unit 1410 receives the global frame channel phase difference value of the preceding frame. For example, when the current frame is the first frame including the global frame channel phase difference value, there is no global frame channel phase difference value of the received previous frame. On the other hand, when the current frame is the second or subsequent frame among consecutive frames including the global frame channel phase difference value, the global frame channel phase difference value can be received from the preceding frame.

グローバルフレームIPD値計算部1420は、現在のフレームがグローバルフレームチャネル間位相差値を含む1番目のフレームである場合、すなわち、先行フレームのグローバルフレームチャネル間位相差値が存在しない場合、グローバルフレームチャネル間位相差値を計算することができる。現在のフレームのグローバルフレームチャネル間位相差値は、チャネル間位相差値が用いられる連続するフレームのチャネル間位相差値の平均とすることができる。   When the current frame is the first frame including the global frame channel phase difference value, that is, when there is no global frame channel phase difference value of the preceding frame, the global frame IPD value calculation unit 1420 The interphase difference value can be calculated. The global frame inter-channel phase difference value of the current frame may be an average of the inter-channel phase difference values of consecutive frames in which the inter-channel phase difference value is used.

グローバルフレームIPDフラグ生成部1430は、現在のフレームでグローバルフレームチャネル間位相差値(IPD)を用いているか否かを示すグローバルフレームIPDフラグ(global_frame_IPD_flag)を生成する。   The global frame IPD flag generation unit 1430 generates a global frame IPD flag (global_frame_IPD_flag) indicating whether or not the global frame inter-channel phase difference value (IPD) is used in the current frame.

その後、グローバルフレームIPDフラグ取得部1440は、グローバルフレームチャネル間位相差値を取得し、グローバルフレームIPD値取得部1450は、先行フレームグローバルフレームIPD値受信部1410から出力された先行フレームのグローバルフレームチャネル間位相差値又はグローバルフレームIPD値計算部1420から出力された現在のフレームのグローバルフレームチャネル間位相差値を取得することができる。好ましくは、グローバルフレームIPD値取得部1450は、現在のフレームがチャネル間位相差値を適用する連続するフレームのうちの1番目のフレームである場合、先行フレームのグローバルフレームチャネル間位相差値を取得する。現在のフレームが2番目以降のフレームである場合には、計算された現在のフレームのグローバルフレームチャネル間位相差値を取得することができる。   Thereafter, the global frame IPD flag acquisition unit 1440 acquires the global frame channel phase difference value, and the global frame IPD value acquisition unit 1450 outputs the global frame channel of the preceding frame output from the preceding frame global frame IPD value receiving unit 1410. The inter-phase difference value or global frame inter-channel phase difference value of the current frame output from the global frame IPD value calculation unit 1420 can be acquired. Preferably, the global frame IPD value acquisition unit 1450 acquires the global frame inter-channel phase difference value of the preceding frame when the current frame is the first frame among consecutive frames to which the inter-channel phase difference value is applied. To do. If the current frame is the second and subsequent frames, the calculated global frame inter-channel phase difference value of the current frame can be obtained.

アップミキシング部1460は、ダウンミックス信号にグローバルフレームチャネル間位相差値を適用して複数チャネル信号を生成する。   The upmixing unit 1460 generates a multi-channel signal by applying the global frame channel phase difference value to the downmix signal.

第四に、復号された複数チャネル信号を、エンコーダに入力された複数チャネル信号と最も類似した残響を有するようにチャネル間相関値を調節することができる。図10(b)を再び参照すると、チャネル間位相差値及びチャネル間相関値を用いて信号を復号する場合、原信号に比べて残響が誇張される問題点が発生する。残響とは、アンビエンスによって信号がより広い空間又はより狭い空間に存在するような効果を指し、本明細書で残響が誇張されるということは、原信号は狭い録音室で録音されたが、復号時に広い講堂で録音されたかのように聞こえることを意味する。   Fourth, the inter-channel correlation value can be adjusted so that the decoded multi-channel signal has reverberation most similar to the multi-channel signal input to the encoder. Referring back to FIG. 10B, when a signal is decoded using the inter-channel phase difference value and the inter-channel correlation value, there is a problem that reverberation is exaggerated compared to the original signal. Reverberation refers to the effect that the ambience causes the signal to exist in a wider or narrower space. Exaggeration of reverberation in this specification means that the original signal was recorded in a narrow recording room, but was decoded. Sometimes it sounds like it was recorded in a large auditorium.

この種の問題点はチャネル間位相差値を伝送しない従来の信号処理方法及び装置で頻繁に発生するが、チャネル間位相差値を伝送する場合にも発生することがある。   This type of problem frequently occurs in conventional signal processing methods and devices that do not transmit inter-channel phase difference values, but may also occur when transmitting inter-channel phase difference values.

図15は、上記問題点を解決するための本発明の更にほかの実施例による信号処理装置1500を示すブロック図である。信号処理装置1500は、ICC値測定部1510、IPD値測定部1520、ILD値測定部1530、情報決定部1540、ICC値修正部1550、IPDモードフラグ生成部1560、IPDモードフラグ取得部1570、IPD値取得部1580、ICC値取得部1590及びアップミキシング部1595を含む。ICC値測定部1510、IPD値測定部1520及びILD値測定部1530は、複数チャネル信号からそれぞれチャネル間相関値、チャネル間位相差値及びチャネル間レベル差値を測定することができる。   FIG. 15 is a block diagram showing a signal processing device 1500 according to still another embodiment of the present invention for solving the above problem. The signal processing device 1500 includes an ICC value measurement unit 1510, an IPD value measurement unit 1520, an ILD value measurement unit 1530, an information determination unit 1540, an ICC value correction unit 1550, an IPD mode flag generation unit 1560, an IPD mode flag acquisition unit 1570, an IPD. A value acquisition unit 1580, an ICC value acquisition unit 1590, and an upmixing unit 1595 are included. The ICC value measuring unit 1510, the IPD value measuring unit 1520, and the ILD value measuring unit 1530 can measure an inter-channel correlation value, an inter-channel phase difference value, and an inter-channel level difference value from a plurality of channel signals, respectively.

情報決定部1540及びIPDモードフラグ生成部1560は、図11における情報決定部1123及びIPDフラグ生成部1124と同一の構成及び機能を有する。また、情報決定部1540は、測定されたチャネル間レベル差値及びチャネル間位相差値が全体音像定位においてどれくらいの比率を占めるか計算し、チャネル間位相差値の比率がより高い場合にのみチャネル間位相差値を用いると決定し、IPDモードフラグ生成部1560は、チャネル間位相差値を用いるか否かを示すチャネル間位相差モードフラグを生成する。   Information determination unit 1540 and IPD mode flag generation unit 1560 have the same configurations and functions as information determination unit 1123 and IPD flag generation unit 1124 in FIG. Further, the information determination unit 1540 calculates the ratio of the measured inter-channel level difference value and inter-channel phase difference value in the overall sound image localization, and only when the ratio of the inter-channel phase difference value is higher The IPD mode flag generation unit 1560 determines to use the interphase phase difference value, and generates an interchannel phase difference mode flag indicating whether or not to use the interchannel phase difference value.

ICC値修正部1550は、情報決定部1540がチャネル間位相差値を用いると決定した場合、ICC値測定部1510から入力されたチャネル間相関値を修正することができる。好ましくは、チャネル間位相差値を用いるパラメータ帯域では、測定されたチャネル間相関値を含まなくてもよい。残響が誇張される問題点を解決するために、チャネル間相関値が表す値の大きさを修正して用いることができる。   When the information determining unit 1540 determines that the inter-channel phase difference value is used, the ICC value correcting unit 1550 can correct the inter-channel correlation value input from the ICC value measuring unit 1510. Preferably, the parameter band using the inter-channel phase difference value may not include the measured inter-channel correlation value. In order to solve the problem that reverberation is exaggerated, the magnitude of the value represented by the inter-channel correlation value can be modified and used.

IPDモードフラグ取得部1570及びIPD値取得部1580も、図11におけるIPDフラグ取得部1131及びIPD値取得部1132と同一の構成及び機能を有するので、その詳細な説明は省略する。   The IPD mode flag acquisition unit 1570 and the IPD value acquisition unit 1580 also have the same configuration and functions as the IPD flag acquisition unit 1131 and the IPD value acquisition unit 1132 in FIG.

ICC値取得部1590は、IPDモードフラグ取得部1570でチャネル間位相差フラグがチャネル間位相差値が用いられていることを示す場合、ICC値修正部1550から修正されたチャネル間相関値を受信する。   When the IPD mode flag acquisition unit 1570 indicates that the inter-channel phase difference flag indicates that the inter-channel phase difference value is used, the ICC value acquisition unit 1590 receives the corrected inter-channel correlation value from the ICC value correction unit 1550. To do.

アップミキシング部1595は、受信したダウンミックス信号に、チャネル間位相差値及び修正されたチャネル間相関値を適用することで、複数チャネル信号を生成することができる。したがって、チャネル間位相差値を用いる信号処理方法及び装置においてチャネル間相関値によって残響が誇張されて信号が歪むことを防止することができる。   The upmixing unit 1595 can generate a multi-channel signal by applying the interchannel phase difference value and the corrected interchannel correlation value to the received downmix signal. Therefore, it is possible to prevent the signal from being distorted by exaggerating the reverberation due to the inter-channel correlation value in the signal processing method and apparatus using the inter-channel phase difference value.

第五に、チャネル間位相差値は、単純な音源を有する信号であるほど重要度がより大きいという特徴を利用することができる。   Fifth, it is possible to use the feature that the importance of the phase difference value between channels is larger as the signal has a simple sound source.

図16は、本発明のさらに他の実施例による信号処理装置1600を示すブロック図である。信号処理装置1600は、入力信号分類部1610、IPD値測定部1620、IPDフラグ生成部1630、IPDフラグ取得部1640、IPD値取得部1650及びアップミキシング部1660を含むことができる。   FIG. 16 is a block diagram illustrating a signal processing apparatus 1600 according to still another embodiment of the present invention. The signal processing apparatus 1600 may include an input signal classification unit 1610, an IPD value measurement unit 1620, an IPD flag generation unit 1630, an IPD flag acquisition unit 1640, an IPD value acquisition unit 1650, and an upmixing unit 1660.

入力信号分類部1610は、入力信号が音声(speech)のみを含む純音声信号であるか、音楽信号、又は音楽信号と音声信号とが混合された信号であるかを判断する。好ましくは、入力信号分類部1610は、SAD(音響検知器:Sound Activity Detector)又はSMC(音声音楽分類器:Speech and Music Classifier)などを含むことができる。   The input signal classification unit 1610 determines whether the input signal is a pure speech signal including only speech, a music signal, or a signal in which a music signal and a speech signal are mixed. Preferably, the input signal classifier 1610 may include an SAD (Sound Activity Detector) or an SMC (Speech and Music Classifier).

IPD値測定部1620は、入力信号分類部1610で入力信号を音声信号のみを含む信号と判断する場合にのみ、チャネル間位相差値を測定する。IPDフラグ生成部1630、IPDフラグ取得部1640、IPD値取得部1650及びアップミキシング部1660は、図11におけるIPDフラグ生成部1124、IPDフラグ取得部1131、IPD値取得部1132及びアップミキシング部1140と同一の構成及び機能を有するので、その詳細な説明は省略する。   The IPD value measuring unit 1620 measures the inter-channel phase difference value only when the input signal classifying unit 1610 determines that the input signal is a signal including only an audio signal. The IPD flag generation unit 1630, the IPD flag acquisition unit 1640, the IPD value acquisition unit 1650, and the upmixing unit 1660 include the IPD flag generation unit 1124, the IPD flag acquisition unit 1131, the IPD value acquisition unit 1132, and the upmixing unit 1140 in FIG. Since it has the same structure and function, the detailed description is abbreviate | omitted.

種々の信号が含まれる音楽信号又は音声信号に音楽信号が混合された混合信号は、チャネル間位相差値を利用しないでも、チャネル間レベル差値及びチャネル間相関値を用いてある程度の音像定位は可能である。しかし、音声信号のような単純な音源の場合は、チャネル間位相差値の重要度が相対的に高いため、チャネル間位相差値なしでは正確な音像定位が不可能である。したがって、入力信号分類部1610で入力信号が音声信号と分類される場合にはチャネル間位相差値を用いることによって、より正確に音像定位された複数チャネル信号として復号することができる。   A mixed signal in which a music signal or a sound signal including various signals is mixed with a music signal does not use an inter-channel phase difference value, but a certain level of sound image localization is obtained using an inter-channel level difference value and an inter-channel correlation value. Is possible. However, in the case of a simple sound source such as an audio signal, since the importance of the inter-channel phase difference value is relatively high, accurate sound image localization is impossible without the inter-channel phase difference value. Therefore, when the input signal is classified as an audio signal by the input signal classification unit 1610, it can be decoded as a multi-channel signal that is localized more accurately by using the inter-channel phase difference value.

図17は、本発明の更にほかの実施例による信号処理装置1700を示す図であり、この信号処理装置1700は、複数チャネル符号化部1710、帯域幅拡張信号符号化部1720、オーディオ信号符号化部1730、音声信号符号化部1740、オーディオ信号復号部1750、音声信号復号部1760、帯域幅拡張信号復号部1770及び複数チャネル復号部1780を含む。   FIG. 17 is a diagram illustrating a signal processing apparatus 1700 according to still another embodiment of the present invention. The signal processing apparatus 1700 includes a multi-channel encoding unit 1710, a bandwidth extension signal encoding unit 1720, and an audio signal encoding. Unit 1730, audio signal encoding unit 1740, audio signal decoding unit 1750, audio signal decoding unit 1760, bandwidth extension signal decoding unit 1770, and multi-channel decoding unit 1780.

まず、複数チャネル符号化部1710において複数チャネル信号をダウンミックスして生成するダウンミックス信号を、以下全帯域ダウンミックス信号と呼び、全帯域ダウンミックス信号から高周波帯域の信号が除去されて低周波帯域のみ存在するダウンミックス信号を、低周波帯域ダウンミックス信号と呼ぶ。   First, a downmix signal generated by downmixing a plurality of channel signals in the plurality of channel encoding unit 1710 is hereinafter referred to as an all-band downmix signal, and a high-frequency band signal is removed from the all-band downmix signal. A downmix signal that only exists is called a low-frequency band downmix signal.

複数チャネル符号化部1710は、複数のチャネルを有する(以下、複数チャネル)信号を受信する。受信した複数チャネル信号をダウンミックスして全帯域ダウンミックス信号を生成する一方、複数チャネル信号に対応する空間情報を生成する。この空間情報は、チャネルレベル差情報、チャネル予測係数、チャネル間相関値及びダウンミックス利得情報などを含むことができる。   The multi-channel encoding unit 1710 receives a signal having a plurality of channels (hereinafter, “multi-channel”). The received multi-channel signal is downmixed to generate an all-band downmix signal, while spatial information corresponding to the multichannel signal is generated. This spatial information may include channel level difference information, channel prediction coefficients, inter-channel correlation values, downmix gain information, and the like.

本発明の一実施例による複数チャネル符号化部1710は、チャネル間位相差値を用いるか否かを決定してチャネル間位相差値を測定し、フレームでチャネル間位相差値を用いるか否かを示すチャネル間位相差モード情報及び全フレームのうち、チャネル間位相差値を用いるフレームがあるか否かを示すチャネル間位相差コーディング情報を生成してこれらをミックス情報と共に伝送できる。この過程は、図1乃至図4を参照して説明した通りであるから、その具体的な説明は省略する。   The multi-channel encoder 1710 according to an embodiment of the present invention determines whether to use an inter-channel phase difference value, measures the inter-channel phase difference value, and determines whether to use the inter-channel phase difference value in a frame. Among the inter-channel phase difference mode information and all frames, inter-channel phase difference coding information indicating whether or not there is a frame using the inter-channel phase difference value can be generated and transmitted together with the mix information. Since this process is as described with reference to FIGS. 1 to 4, the specific description thereof is omitted.

一方、複数チャネル符号化部1710には示していないが、図1乃至図4を参照して説明した信号処理装置又は図5乃至図16を参照して説明した本発明の他の実施例による信号処理装置における符号化装置を含むことができる。   On the other hand, although not shown in the multi-channel encoding unit 1710, the signal processing apparatus described with reference to FIGS. 1 to 4 or the signal according to another embodiment of the present invention described with reference to FIGS. An encoding device in the processing device may be included.

帯域幅拡張信号符号化部1720は、全帯域ダウンミックス信号を受信し、この全帯域ダウンミックス信号のうちの高周波帯域の信号に対応する拡張情報を生成することができる。この拡張情報は、後でデコーダ端で高周波帯域の除去された低周波帯域ダウンミックス信号を全帯域ダウンミックス信号に復元するための情報であり、空間情報とともに伝送することができる。   The bandwidth extension signal encoding unit 1720 can receive the all-band downmix signal and generate extension information corresponding to the high-frequency band signal of the all-band downmix signal. This extended information is information for restoring the low-frequency band downmix signal from which the high-frequency band has been removed at the decoder end to the full-band downmix signal later, and can be transmitted together with the spatial information.

また、ダウンミックス信号は、当該信号の特性に基づいてオーディオ信号符号化方式で符号化されるか、又は、音声信号符号化方式で符号化されるかが決定され、この符号化方式を決定するモード情報が生成される(図示せず)。ここで、オーディオ符号化方式はMDCT(修正離散コサイン変換)を用いるものとすることができるが、本発明はこれに限定されない。音声符号化方式は、AMR−WB(適応複数速度広帯域)標準に従うものとすることができるが、本発明はこれに限定されない。   Further, it is determined whether the downmix signal is encoded by the audio signal encoding method or the audio signal encoding method based on the characteristics of the signal, and this encoding method is determined. Mode information is generated (not shown). Here, the audio encoding method may use MDCT (modified discrete cosine transform), but the present invention is not limited to this. The speech coding scheme may conform to the AMR-WB (Adaptive Multiple Rate Wideband) standard, but the present invention is not limited to this.

オーディオ信号符号化部1730は、帯域幅拡張信号符号化部1720から入力された拡張情報及び全帯域ダウンミックス信号を用いて、高周波領域の除去された低周波帯域ダウンミックス信号をオーディオ信号符号化方式によって符号化する。   The audio signal encoding unit 1730 uses the extension information input from the bandwidth extension signal encoding unit 1720 and the entire band downmix signal to encode the low frequency band downmix signal from which the high frequency region is removed into an audio signal encoding method. It encodes by.

オーディオ信号符号化方式で符号化される信号は、オーディオ信号であってもよいし、オーディオ信号に音声信号が一部含まれた信号であってもよい。また、オーディオ信号符号化部1730は、周波数領域符号化部とすることができる。   The signal encoded by the audio signal encoding method may be an audio signal or a signal in which a part of the audio signal is included in the audio signal. Also, the audio signal encoding unit 1730 can be a frequency domain encoding unit.

音声信号符号化部1740は、帯域幅拡張信号符号化部1720から入力された拡張情報及び全帯域ダウンミックス信号を用いて、高周波領域の除去された低周波帯域ダウンミックス信号を音声信号符号化方式によって符号化する。   The audio signal encoding unit 1740 uses the extension information and the entire band downmix signal input from the bandwidth extension signal encoding unit 1720 to convert the low frequency band downmix signal from which the high frequency region is removed into an audio signal encoding method. It encodes by.

音声信号符号化方式で符号化される信号は、音声信号であってもよいし、音声信号にオーディオ信号が一部含まれた信号であってもよい。また、音声信号符号化部1740は、線形予測符号化(LPC)方式を更に利用することができる。入力信号が時間軸上で高い冗長性を有する場合、過去の信号から現在の信号を予測する線形予測によってモデリングされうるが、この場合、線形予測符号化方式を採用すると符号化効率を上げることができる。一方、音声信号符号化部1740は、時間領域符号化部とすることができる。   The signal encoded by the audio signal encoding method may be an audio signal or a signal in which an audio signal is partly included in the audio signal. Also, the audio signal encoding unit 1740 can further use a linear predictive coding (LPC) method. If the input signal has high redundancy on the time axis, it can be modeled by linear prediction that predicts the current signal from the past signal, but in this case, the use of the linear prediction encoding scheme may increase the encoding efficiency. it can. On the other hand, the audio signal encoding unit 1740 may be a time domain encoding unit.

オーディオ信号復号部1750は、信号をオーディオ信号符号化方式によって復号する。オーディオ信号復号部1750に入力されて復号される信号は、オーディオ信号であってもよいし、オーディオ信号に音声信号が一部含まれた信号であってもよい。また、オーディオ信号復号部1750は、周波数領域復号部を含むことができ、IMDCT(逆修正離散コサイン変換)を利用することができる。   The audio signal decoding unit 1750 decodes the signal using an audio signal encoding method. The signal input to the audio signal decoding unit 1750 and decoded may be an audio signal or a signal in which a part of the audio signal is included in the audio signal. Also, the audio signal decoding unit 1750 can include a frequency domain decoding unit, and can use IMDCT (Inverse Modified Discrete Cosine Transform).

音声信号復号部1760は、信号を音声信号符号化方式によって復号する。音声信号復号部1760で復号される信号は、音声信号であってもよいし、音声信号にオーディオ信号が一部含まれた信号であってもよい。また、音声信号復号部1760は、時間領域復号部を含むことができ、線形予測符号化方式を更に利用することができる。   The audio signal decoding unit 1760 decodes the signal using an audio signal encoding method. The signal decoded by the audio signal decoding unit 1760 may be an audio signal or a signal in which a part of the audio signal is included in the audio signal. Also, the audio signal decoding unit 1760 can include a time domain decoding unit, and can further use a linear predictive coding method.

帯域幅拡張信号復号部1770は、オーディオ信号復号部1750で復号された信号、又は音声信号復号部1760で復号された信号である低周波帯域ダウンミックス信号及び拡張情報を受信して、符号化時に除去された高周波領域に該当する信号が復元された全帯域ダウンミックス信号を生成する。   The bandwidth extension signal decoding unit 1770 receives the low frequency band downmix signal and the extension information, which are the signal decoded by the audio signal decoding unit 1750 or the signal decoded by the audio signal decoding unit 1760, and performs the encoding process. A full-band downmix signal in which a signal corresponding to the removed high frequency region is restored is generated.

この全帯域ダウンミックス信号は、低周波帯域ダウンミックス信号の全部及び拡張情報を用いて生成することもできるが、低周波帯域ダウンミックス信号の一部を用いて生成することもできる。   The full-band downmix signal can be generated using all of the low-frequency band downmix signal and the extended information, but can also be generated using a part of the low-frequency band downmix signal.

複数チャネル復号部1780は、全帯域ダウンミックス信号、空間情報、チャネル間位相差値、チャネル間位相差モードフラグ及びチャネル間位相差符号化フラグを受信し、これらの情報を全帯域ダウンミックス信号に適用して複数チャネル信号を生成するが、この過程についての詳細な説明は、図1乃至図4を参照して説明した通りであるから省略する。   The multi-channel decoding unit 1780 receives the full-band downmix signal, the spatial information, the inter-channel phase difference value, the inter-channel phase difference mode flag, and the inter-channel phase difference encoding flag, and converts these information into the full-band down-mix signal. A multi-channel signal is generated by application, but a detailed description of this process is the same as described with reference to FIGS.

このように、本発明の信号処理方法及び装置は、チャネル間位相差値を用いて複数チャネル信号を生成することによって、複数チャネルデコーダが再生し難い位相差又は遅延差を効果的に再生することができる。   As described above, the signal processing method and apparatus according to the present invention effectively reproduces the phase difference or delay difference that is difficult to reproduce by the multi-channel decoder by generating the multi-channel signal using the inter-channel phase difference value. Can do.

図18は、本発明の一実施例によるIPD符号化フラグ取得部1841、IPDモードフラグ取得部1842、IPD値取得部1843及びアップミキシング部1844が具現されている製品の概略的な構成を示す図であり、図19は、本発明の実施例によるIPD符号化フラグ取得部1841、IPDモードフラグ取得部1842、IPD値取得部1843及びアップミキシング部1844が具現されている製品間の関係を示す図である。   18 is a diagram illustrating a schematic configuration of a product in which an IPD encoding flag acquisition unit 1841, an IPD mode flag acquisition unit 1842, an IPD value acquisition unit 1843, and an upmixing unit 1844 are implemented according to an embodiment of the present invention. FIG. 19 is a diagram illustrating a relationship between products in which an IPD encoding flag acquisition unit 1841, an IPD mode flag acquisition unit 1842, an IPD value acquisition unit 1843, and an upmixing unit 1844 according to an embodiment of the present invention are implemented. It is.

図18を参照すると、有線無線通信部1810は、有線無線通信方式を用いてビットストリームを受信する。具体的に、有線無線通信部1810は、有線通信部1811、赤外線通信部1812、ブルトゥース部1813、無線LAN通信部1814のうち一つ以上を含むことができる。   Referring to FIG. 18, the wired wireless communication unit 1810 receives a bit stream using a wired wireless communication method. Specifically, the wired wireless communication unit 1810 may include one or more of a wired communication unit 1811, an infrared communication unit 1812, a Bluetooth unit 1813, and a wireless LAN communication unit 1814.

使用者認証部1820は、使用者情報を取り込んで使用者認証を行うもので、指紋認識部1821、虹彩認識部1822、顔認識部1823、及び音声認識部1824のうち一つ以上を含むことができ、それぞれ、指紋、虹彩情報、顔輪郭情報、音声情報を取り込んで使用者情報に変換し、使用者情報と既に登録されている使用者データとが一致するか否かを判断して、使用者認証を行うことができる。   The user authentication unit 1820 takes in user information and performs user authentication, and may include one or more of a fingerprint recognition unit 1821, an iris recognition unit 1822, a face recognition unit 1823, and a voice recognition unit 1824. Each of them can capture and convert fingerprint information, iris information, face contour information, and voice information into user information, and determine whether the user information matches the registered user data. Authentication can be performed.

入力部1830は、使用者が種々の命令を入力するための入力装置で、キーパッド部1831、タッチパッド部1832、リモコン部1833のうち一つ以上を含むことができるが、本発明はこれに限定されない。   The input unit 1830 is an input device for a user to input various commands. The input unit 1830 may include one or more of a keypad unit 1831, a touchpad unit 1832, and a remote control unit 1833. It is not limited.

信号復号部1840は、IPD符号化フラグ取得部1841、IPDモードフラグ取得部1842、IPD値取得部1843及びアップミキシング部1844を含み、これらは、図2において同一の名称を有するユニットと同一の構成及び機能を有するので、その詳細な説明は省略する。   The signal decoding unit 1840 includes an IPD encoding flag acquisition unit 1841, an IPD mode flag acquisition unit 1842, an IPD value acquisition unit 1843, and an upmixing unit 1844, which have the same configuration as units having the same name in FIG. The detailed description thereof is omitted.

制御部1850は、入力装置から入力信号を受信し、信号復号部1840と出力部1860のプロセス全般を制御する。上述のように、制御部1850に入力部1830から使用者入力、例えば、出力信号の位相偏移のon/off、メタデータの入出力、信号復号部の作用on/offなどが入力される場合、それを用いて信号を復号する。   The control unit 1850 receives an input signal from the input device and controls the overall processes of the signal decoding unit 1840 and the output unit 1860. As described above, when user input, for example, on / off of phase shift of the output signal, input / output of metadata, operation on / off of the signal decoding unit, or the like is input from the input unit 1830 to the control unit 1850. And use it to decode the signal.

出力部1860は、信号復号部1840によって生成された出力信号などが出力される構成要素で、信号出力部1861及びディスプレイ部1862を含むことができる。出力信号がオーディオ信号であれば、出力信号は信号出力部1861から出力され、出力信号がビデオ信号であれば、出力信号はディスプレイ部1862から出力される。また、入力部1830にメタデータが入力されると、それをディスプレイ部1862を介して画面に表示する。   The output unit 1860 is a component that outputs an output signal generated by the signal decoding unit 1840 and may include a signal output unit 1861 and a display unit 1862. If the output signal is an audio signal, the output signal is output from the signal output unit 1861. If the output signal is a video signal, the output signal is output from the display unit 1862. Further, when metadata is input to the input unit 1830, it is displayed on the screen via the display unit 1862.

図19は、図18に示された製品に該当する端末と端末との関係、端末とサーバとの関係を示す図である。図19(a)を参照すると、第1端末1910及び第2端末1920が有線無線通信を介してデータ又はビットストリームの双方向通信ができることがわかる。ここで、有線無線通信を介して交換されるデータ又はビットストリームは、本発明に係る図1におけるビットストリームの形態であってもよいし、図5乃至図16を参照して説明した本発明の位相偏移フラグ、グローバルフレームチャネル間位相差値などを含むデータであってもよい。図19(b)を参照すると、サーバ1930及び第1端末1940も同様、互いに有線無線通信を行うことができる。   FIG. 19 is a diagram illustrating a relationship between a terminal corresponding to the product illustrated in FIG. 18 and a relationship between the terminal and the server. Referring to FIG. 19A, it can be seen that the first terminal 1910 and the second terminal 1920 can perform bidirectional data or bitstream communication via wired wireless communication. Here, the data or the bit stream exchanged via the wired wireless communication may be in the form of the bit stream in FIG. 1 according to the present invention, or the data stream or the bit stream of the present invention described with reference to FIGS. It may be data including a phase shift flag, a global frame channel phase difference value, and the like. Referring to FIG. 19B, the server 1930 and the first terminal 1940 can similarly perform wired wireless communication with each other.

図20は、本発明の一実施例によるIPD符号化フラグ取得部2041、IPDモードフラグ取得部2042、IPD値取得部2043及びアップミキシング部2044を含む複数チャネル復号部が具現されている放送信号復号装置2000の概略的な構成を示す図である。   FIG. 20 is a broadcast signal decoding in which a multi-channel decoding unit including an IPD encoding flag acquisition unit 2041, an IPD mode flag acquisition unit 2042, an IPD value acquisition unit 2043, and an upmixing unit 2044 according to an embodiment of the present invention is implemented. 2 is a diagram illustrating a schematic configuration of an apparatus 2000. FIG.

図20を参照すると、デマルチプレクサ2020は、チューナ2010からTV放送と関連したデータを受信する。これらのデータは、デマルチプレクサ2020で分離され、データデコーダ2030で復号される。一方、デマルチプレクサ2020で分離されたデータは、HDDのような記憶媒体2050に記憶することができる。   Referring to FIG. 20, the demultiplexer 2020 receives data related to the TV broadcast from the tuner 2010. These data are separated by the demultiplexer 2020 and decoded by the data decoder 2030. On the other hand, the data separated by the demultiplexer 2020 can be stored in a storage medium 2050 such as an HDD.

デマルチプレクサ2020で分離されたデータは、複数チャネル復号部2041及びビデオ復号部2042を含む信号復号部2040に入力されて、オーディオ信号及びビデオ信号として復号される。信号復号部2040は、本発明の一実施例によるIPD符号化フラグ取得部2041、IPDモードフラグ取得部2042、IPD値取得部2043及びアップミキシング部2044を含み、これらは、図2における同一名称のユニットと同一の構成及び機能を有するので詳細な説明は省略する。信号復号部2040は、受信したチャネル間位相差値などを用いて信号を復号し、ビデオ信号が入力される場合はビデオ信号も復号して出力し、メタデータが生成される場合はそれをテキストの形態として出力する。   The data separated by the demultiplexer 2020 is input to a signal decoding unit 2040 including a multi-channel decoding unit 2041 and a video decoding unit 2042, and is decoded as an audio signal and a video signal. The signal decoding unit 2040 includes an IPD encoding flag acquisition unit 2041, an IPD mode flag acquisition unit 2042, an IPD value acquisition unit 2043, and an upmixing unit 2044 according to an embodiment of the present invention, which have the same names in FIG. Since it has the same configuration and function as the unit, detailed description is omitted. The signal decoding unit 2040 decodes the signal using the received inter-channel phase difference value, etc., and when the video signal is input, also decodes and outputs the video signal. Output as a form.

出力部2070は、ビデオ信号が復号されて、出力されたビデオ信号とメタデータが生成される場合、出力されたメタデータを画面に表示する。また、出力部2070はスピーカ部(図示せず)を含み、信号復号部2040から出力されるチャネル間位相差値を用いて復号された複数チャネル信号を、出力部2070に含まれたスピーカ部から出力する。また、信号復号部2040で復号されたデータは、HDDのような記憶媒体2050に記憶することができる。   When the video signal is decoded and the output video signal and metadata are generated, the output unit 2070 displays the output metadata on the screen. The output unit 2070 includes a speaker unit (not shown), and a multi-channel signal decoded using the inter-channel phase difference value output from the signal decoding unit 2040 is received from the speaker unit included in the output unit 2070. Output. The data decoded by the signal decoding unit 2040 can be stored in a storage medium 2050 such as an HDD.

一方、信号復号装置2000は、使用者から情報を受信して該受信したデータを制御できるアプリケーションマネージャ2060をさらに含むことができる。アプリケーションマネージャ2060は、ユーザインタフェースマネージャ2061及びサービスマネージャ2062を含む。ユーザインタフェースマネージャ2061は、使用者から情報を受け取るためのインタフェースを制御する。例えば、出力部2070に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネージャ2062は、信号復号部2040及び出力部2070で放送信号を復号して出力する場合、受信される放送信号を、使用者から入力される情報を用いて制御することができる。例えば、放送チャネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネージャ2060から出力されるデータは、信号復号部2040のほか、出力部2070にも伝送されて利用可能である。   Meanwhile, the signal decoding apparatus 2000 may further include an application manager 2060 that can receive information from a user and control the received data. The application manager 2060 includes a user interface manager 2061 and a service manager 2062. The user interface manager 2061 controls an interface for receiving information from the user. For example, it is possible to control the typeface of the text displayed on the output unit 2070, the brightness of the screen, the menu configuration, and the like. On the other hand, when the service manager 2062 decodes and outputs the broadcast signal by the signal decoding unit 2040 and the output unit 2070, the service manager 2062 can control the received broadcast signal using information input from the user. For example, broadcast channel settings, alarm function settings, adult authentication functions, and the like can be provided. Data output from the application manager 2060 is transmitted to the output unit 2070 as well as the signal decoding unit 2040 and can be used.

このように、実際製品に本発明の信号処理装置が含まれることによって、チャネル間レベル差値及びチャネル間相関値のみを用いてアップミックスされた複数チャネル信号を用いる従来の技術に比べて、チャネル間位相差値を用いることによってより音質が向上し、元来の入力信号に類似した複数チャネル信号を聴取することが可能になる。   As described above, the actual product includes the signal processing device of the present invention, so that the channel is compared with the conventional technique using a plurality of channel signals upmixed using only the inter-channel level difference value and the inter-channel correlation value. By using the interphase difference value, the sound quality is further improved, and it is possible to listen to a multi-channel signal similar to the original input signal.

本発明の適用される復号/符号化方法は、コンピュータで実行可能なプログラムとして製作されて、コンピュータ読み取り可能な記録媒体に記憶されることができ、本発明によるデータ構造を有するマルチメディアデータも、コンピュータ読み取り可能な記録媒体に記憶されることができる。このコンピュータ読み取り可能な記録媒体は、コンピュータシステムで読み取り可能なデータが記憶されるいかなる種類の記憶装置をも含むことができる。コンピュータ読み取り可能な記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記憶装置などがあり、また、搬送波(例えば、インターネットを介した伝送)の形態とすることもできる。また、該符号化方法によって生成されたビットストリームは、コンピュータ読み取り可能な記録媒体に記憶されたり、有線/無線通信網を用いて伝送することができる。   The decoding / encoding method to which the present invention is applied can be produced as a computer-executable program and stored in a computer-readable recording medium. Multimedia data having the data structure according to the present invention is also It can be stored in a computer readable recording medium. The computer-readable recording medium may include any type of storage device that stores data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc., and carrier wave (for example, transmission via the Internet). It can also be in the form. The bit stream generated by the encoding method can be stored in a computer-readable recording medium or transmitted using a wired / wireless communication network.

以上では、限定された実施例及び図面に挙げて本発明を説明してきたが、本発明は、これに限定されず、本発明の属する技術の分野における通常の知識を有する者には、本発明の技術思想と添付した特許請求の範囲及びその均等範囲内で様々な修正及び変形は可能であるということが理解される。   In the above, the present invention has been described with reference to limited embodiments and drawings. However, the present invention is not limited thereto, and the present invention is not limited to those who have ordinary knowledge in the technical field to which the present invention belongs. It is understood that various modifications and changes can be made within the scope of the technical idea of the present invention and the appended claims and their equivalents.

本発明は、信号を符号化及び復号するために適用することができる。   The present invention can be applied to encode and decode signals.

Claims (10)

信号を処理する方法であって、
複数チャネル信号から生成されたダウンミックス信号と、該ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報とを受信する段階と、
前記空間情報のヘッダから、チャネル間位相差(IPD)符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを取得する段階と、
前記チャネル間位相差符号化フラグに基づいて、前記空間情報のフレームから、チャネル間位相差値が前記空間情報のフレームで用いられているか否かを示すチャネル間位相差モードフラグを取得する段階と、
前記チャネル間位相差モードフラグに基づいて、前記フレーム内のパラメータタイムスロットに対応するパラメータ帯域のチャネル間位相差値を取得する段階と、
先行するパラメータタイムスロットのチャネル間位相差値を用いて前記チャネル間位相差値を修正することによって、前記チャネル間位相差値を平滑化する段階と、
前記ダウンミックス信号に前記平滑化されたチャネル間位相差値を適用して、前記複数チャネル信号を生成する段階と、を有し、
前記空間情報は、前記ヘッダ及び複数個の前記フレームに区分され、
前記チャネル間位相差値は、前記複数チャネル信号のうち二つのチャネル間の位相差を表し、
前記パラメータタイムスロットは、前記チャネル間位相差値が適用されるタイムスロットを示し、
前記パラメータ帯域は、前記チャネル間位相差値が適用される周波数領域の少なくとも一つの副帯域である、方法。
A method of processing a signal, comprising:
Receiving a downmix signal generated from a plurality of channel signals and spatial information representing attributes of the plurality of channel signals to upmix the downmix signals;
Obtaining an inter-channel phase difference encoding flag indicating whether inter-channel phase difference (IPD) encoding is used in the spatial information from the header of the spatial information;
Based on the phase difference coding flag between said channel, from the frame of the spatial information, the step of phase difference value between the switch Yaneru to obtain the inter-channel phase difference mode flag indicating whether used in the frame of the spatial information When,
Obtaining an inter-channel phase difference value of a parameter band corresponding to a parameter time slot in the frame based on the inter-channel phase difference mode flag;
Smoothing the inter-channel phase difference value by modifying the inter-channel phase difference value using the inter-channel phase difference value of the preceding parameter time slot;
Applying the smoothed inter-channel phase difference value to the downmix signal to generate the multi-channel signal,
The spatial information is divided into the header and a plurality of the frames,
The inter-channel phase difference value represents a phase difference between two channels of the plurality of channel signals,
The parameter time slot indicates a time slot to which the inter-channel phase difference value is applied,
The method, wherein the parameter band is at least one subband of a frequency domain to which the inter-channel phase difference value is applied.
前記チャンネル間位相差値を用いて、前記複数チャネル信号のうち二つのチャネル間の角度を表す位相角度を生成する段階と、
前記先行するパラメータタイムスロットの位相角度を用いて前記位相角度を修正する段階と、を更に有する請求項1に記載の方法。
Generating a phase angle representing an angle between two channels of the plurality of channel signals using the inter-channel phase difference value;
The method of claim 1, further comprising modifying the phase angle using the phase angle of the preceding parameter time slot.
前記チャネル間位相差値及び前記平滑化されたチャネル間位相差値のうち少なくとも一つを用いて、前記チャネル間位相差値が適用されないタイムスロットのチャネル間位相差値を決定する段階を更に有する請求項1に記載の方法。   The method further includes determining an inter-channel phase difference value of a time slot to which the inter-channel phase difference value is not applied using at least one of the inter-channel phase difference value and the smoothed inter-channel phase difference value. The method of claim 1. 前記チャネル間位相差値は、全音像定位における前記チャネル間位相差値の寄与度合が、全音像定位におけるチャネル間レベル差(ILD)値の寄与度合よりも高い場合に、受信され、
前記チャネル間レベル差値は、前記ダウンミックス信号に含まれる前記複数チャネル信号のうち二つのチャネル間のレベル差を示す、請求項1に記載の方法。
The inter-channel phase difference value is received when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference (ILD) value in the whole sound image localization.
The method of claim 1, wherein the inter-channel level difference value indicates a level difference between two channels of the plurality of channel signals included in the downmix signal.
信号を処理する装置であって、
複数チャネル信号から生成されたダウンミックス信号と、前記ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報とを受信する信号受信部と、
前記空間情報のヘッダから、チャネル間位相差(IPD)符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを取得するチャネル間位相差符号化フラグ取得部と、
前記チャネル間位相差符号化フラグに基づいて、前記空間情報のフレームから、チャネル間位相差値が前記空間情報のフレームで用いられているか否かを示すチャネル間位相差モードフラグを取得する位相差モードフラグ取得部と、
前記チャネル間位相差モードフラグに基づいて、パラメータタイムスロットに対応するパラメータ帯域のチャネル間位相差値を取得するチャネル間位相差値取得部と、
先行するパラメータタイムスロットのチャネル間位相差値を用いて前記チャネル間位相差値を修正することによって、前記チャネル間位相差値を平滑化するチャネル間位相差値平滑化部と、
前記ダウンミックス信号に前記平滑化されたチャネル間位相差値を適用して、前記複数チャネル信号を生成するアップミキシング部と、を備え、
前記空間情報は、前記ヘッダ及び複数個の前記フレームに区分され、前記チャネル間位相差値は、前記複数チャネル信号のうち二つのチャネル間の位相差を表し、前記パラメータタイムスロットは、前記チャネル間位相差値が適用されるタイムスロットを示し、前記パラメータ帯域は、前記チャネル間位相差値が適用される周波数領域の少なくとも一つの副帯域である、装置。
A device for processing signals,
A signal receiving unit that receives a downmix signal generated from a plurality of channel signals and spatial information representing attributes of the plurality of channel signals to upmix the downmix signal;
An inter-channel phase difference encoding flag acquisition unit that acquires, from the header of the spatial information, an inter-channel phase difference encoding flag indicating whether or not inter-channel phase difference (IPD) encoding is used in the spatial information;
Based on the phase difference coding flag between said channel, said from the frame of the spatial information, Chi Yaneru between positions where the phase difference value to obtain the inter-channel phase difference mode flag indicating whether used in the frame of the spatial information A phase difference mode flag acquisition unit;
Based on the inter-channel phase difference mode flag, an inter-channel phase difference value acquisition unit that acquires an inter-channel phase difference value of a parameter band corresponding to a parameter time slot;
An inter-channel phase difference value smoothing unit that smoothes the inter-channel phase difference value by correcting the inter-channel phase difference value using the inter-channel phase difference value of the preceding parameter time slot;
An upmixing unit that applies the smoothed inter-channel phase difference value to the downmix signal to generate the plurality of channel signals, and
The spatial information is divided into the header and a plurality of the frames, the inter-channel phase difference value represents a phase difference between two channels of the multi-channel signal, and the parameter time slot is between the channels. The apparatus indicates a time slot to which a phase difference value is applied, and the parameter band is at least one subband of a frequency domain to which the inter-channel phase difference value is applied.
前記チャネル間位相差値平滑化部は、
前記チャネル間位相差値を用いて、前記複数チャネル信号のうち二つのチャネル間の角度を表す位相角度を生成する位相角度生成部と、
前記先行するパラメータタイムスロットの位相角度を用いて前記位相角度を修正する位相角度修正部と、を備える請求項5に記載の装置。
The inter-channel phase difference value smoothing unit is
A phase angle generation unit that generates a phase angle representing an angle between two channels of the plurality of channel signals using the inter-channel phase difference value;
The apparatus according to claim 5, further comprising: a phase angle correction unit that corrects the phase angle using a phase angle of the preceding parameter time slot.
前記チャネル間位相差値及び前記平滑化されたチャネル間位相差値のうち少なくとも一つを用いて、前記チャネル間位相差値が適用されないタイムスロットのチャネル間位相差値を決定するチャネル間位相差値補間部を更に備える請求項5に記載の装置。   An inter-channel phase difference that determines an inter-channel phase difference value of a time slot to which the inter-channel phase difference value is not applied using at least one of the inter-channel phase difference value and the smoothed inter-channel phase difference value. The apparatus according to claim 5, further comprising a value interpolation unit. 前記チャネル間位相差値は、全音像定位における前記チャネル間位相差値の寄与度合が、全音像定位におけるチャネル間レベル差(ILD)値の寄与度合よりも高い場合に、受信され、
前記チャネル間レベル差値は、前記ダウンミックス信号に含まれる前記複数チャネル信号のうち二つのチャネル間のレベル差を示す、請求項5に記載の装置。
The inter-channel phase difference value is received when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference (ILD) value in the whole sound image localization.
The apparatus according to claim 5, wherein the inter-channel level difference value indicates a level difference between two channels of the plurality of channel signals included in the downmix signal.
信号を処理する方法であって、
複数チャネル信号をダウンミックスしてダウンミックス信号を生成する段階と、
前記ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報を生成する段階と、を有し、
前記空間情報を生成する段階は、
前記複数チャネル信号のうち二つのチャネル間の位相差を表すチャネル間位相差(IPD)値を測定する段階と、
前記複数チャネル信号のうち二つのチャネル間のレベル差を表すチャネル間レベル差(ILD)値を測定する段階と、
全音像定位における前記チャネル間位相差値の寄与度合が、全音像定位における前記チャネル間レベル差値の寄与度合よりも高い場合に、IPD符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを生成する段階と、
前記チャネル間位相差値がフレームで用いられているか否かを示すチャネル間位相差モードフラグを生成する段階と、
前記チャネル間位相差値及び前記チャネル間位相差モードフラグを前記空間情報のフレームに含め、前記チャネル間位相差符号化フラグを前記空間情報のヘッダに含める段階と、を有する方法。
A method of processing a signal, comprising:
Downmixing multiple channel signals to generate a downmix signal;
Generating spatial information representing attributes of the multi-channel signal to upmix the downmix signal;
The step of generating the spatial information includes:
Measuring an inter-channel phase difference (IPD) value representing a phase difference between two channels of the multi-channel signal;
Measuring an inter-channel level difference (ILD) value representing a level difference between two channels of the multi-channel signal;
Indicates whether or not IPD encoding is used in the spatial information when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference value in the whole sound image localization. Generating an inter-channel phase difference encoding flag;
Generating an inter-channel phase difference mode flag indicating whether or not the inter-channel phase difference value is used in a frame;
Including the inter-channel phase difference value and the inter-channel phase difference mode flag in the spatial information frame, and including the inter-channel phase difference encoding flag in the spatial information header.
信号を処理する装置であって、
複数チャネル信号をダウンミックスしてダウンミックス信号を生成するダウンミキシング部と、
前記ダウンミックス信号をアップミックスするために前記複数チャネル信号の属性を表す空間情報を生成する空間情報生成部と、を備え、
前記空間情報生成部は、
前記複数チャネル信号のうち二つのチャネル間の位相差を表すチャネル間位相差(IPD)値を測定するチャネル間位相差値測定部と、
前記複数チャネル信号のうち二つのチャネル間のレベル差を表すチャネル間レベル差(ILD)値を測定するチャネル間レベル差値測定部と、
全音像定位における前記チャネル間位相差値の寄与度合が、全音像定位における前記チャネル間レベル差値の寄与度合よりも高い場合に、IPD符号化が前記空間情報で用いられているか否かを示すチャネル間位相差符号化フラグを生成するチャネル間位相差符号化フラグ生成部と、
前記チャネル間位相差値がフレームで用いられているか否かを示すチャネル間位相差モードフラグを生成するチャネル間位相差モードフラグ生成部と、を備え、
前記チャネル間位相差値及び前記チャネル間位相差モードフラグは、前記空間情報のフレームに含まれ、前記チャネル間位相差符号化フラグは、前記空間情報のヘッダに含まれる、装置。
A device for processing signals,
A downmixing unit that downmixes multiple channel signals to generate a downmix signal;
A spatial information generating unit that generates spatial information representing attributes of the plurality of channel signals in order to upmix the downmix signal;
The spatial information generator is
An inter-channel phase difference value measuring unit that measures an inter-channel phase difference (IPD) value representing a phase difference between two channels of the plurality of channel signals;
An inter-channel level difference value measuring unit that measures an inter-channel level difference (ILD) value representing a level difference between two channels of the plurality of channel signals;
Indicates whether or not IPD encoding is used in the spatial information when the contribution degree of the inter-channel phase difference value in the whole sound image localization is higher than the contribution degree of the inter-channel level difference value in the whole sound image localization. An inter-channel phase difference encoding flag generating unit for generating an inter-channel phase difference encoding flag;
An inter-channel phase difference mode flag generating unit that generates an inter-channel phase difference mode flag indicating whether or not the inter-channel phase difference value is used in a frame,
The apparatus, wherein the inter-channel phase difference value and the inter-channel phase difference mode flag are included in the spatial information frame, and the inter-channel phase difference encoding flag is included in the spatial information header.
JP2011528941A 2008-09-25 2009-09-25 Signal processing method and apparatus Active JP5426680B2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10026208P 2008-09-25 2008-09-25
US61/100,262 2008-09-25
KR1020090090518A KR101108061B1 (en) 2008-09-25 2009-09-24 A method and an apparatus for processing a signal
KR10-2009-0090518 2009-09-24
PCT/KR2009/005497 WO2010036059A2 (en) 2008-09-25 2009-09-25 A method and an apparatus for processing a signal

Publications (2)

Publication Number Publication Date
JP2012503791A JP2012503791A (en) 2012-02-09
JP5426680B2 true JP5426680B2 (en) 2014-02-26

Family

ID=42213076

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011528942A Active JP5480274B2 (en) 2008-09-25 2009-09-25 Signal processing method and apparatus
JP2011528941A Active JP5426680B2 (en) 2008-09-25 2009-09-25 Signal processing method and apparatus

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011528942A Active JP5480274B2 (en) 2008-09-25 2009-09-25 Signal processing method and apparatus

Country Status (4)

Country Link
JP (2) JP5480274B2 (en)
KR (3) KR101108060B1 (en)
CN (2) CN102165520B (en)
ES (1) ES2547232T3 (en)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2452569T3 (en) * 2009-04-08 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device, procedure and computer program for mixing upstream audio signal with downstream mixing using phase value smoothing
KR101742136B1 (en) 2011-03-18 2017-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. Frame element positioning in frames of a bitstream representing audio content
CN102446507B (en) 2011-09-27 2013-04-17 华为技术有限公司 Down-mixing signal generating and reducing method and device
JP2015517121A (en) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Inter-channel difference estimation method and spatial audio encoding device
JP5977434B2 (en) * 2012-04-05 2016-08-24 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Method for parametric spatial audio encoding and decoding, parametric spatial audio encoder and parametric spatial audio decoder
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
EP2830049A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
KR101805327B1 (en) * 2013-10-21 2017-12-05 돌비 인터네셔널 에이비 Decorrelator structure for parametric reconstruction of audio signals
CN104681029B (en) 2013-11-29 2018-06-05 华为技术有限公司 The coding method of stereo phase parameter and device
CN107452387B (en) 2016-05-31 2019-11-12 华为技术有限公司 A kind of extracting method and device of interchannel phase differences parameter
CN108694955B (en) * 2017-04-12 2020-11-17 华为技术有限公司 Coding and decoding method and coder and decoder of multi-channel signal
CN109215668B (en) * 2017-06-30 2021-01-05 华为技术有限公司 Method and device for encoding inter-channel phase difference parameters
CN110556118B (en) * 2018-05-31 2022-05-10 华为技术有限公司 Coding method and device for stereo signal
CN111819863A (en) * 2018-11-13 2020-10-23 杜比实验室特许公司 Representing spatial audio with an audio signal and associated metadata

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002208869A (en) * 2001-01-09 2002-07-26 Sony Corp Multiband radio signal transmission/reception device
SE0202159D0 (en) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2268340T3 (en) * 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. REPRESENTATION OF PARAMETRIC AUDIO OF MULTIPLE CHANNELS.
ATE527654T1 (en) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp MULTI-CHANNEL AUDIO CODING
JP5032977B2 (en) * 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Multi-channel encoder
DE602005022235D1 (en) * 2004-05-19 2010-08-19 Panasonic Corp Audio signal encoder and audio signal decoder
WO2006003813A1 (en) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding apparatus
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR101562379B1 (en) * 2005-09-13 2015-10-22 코닌클리케 필립스 엔.브이. A spatial decoder and a method of producing a pair of binaural output channels
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
KR100917845B1 (en) * 2006-12-04 2009-09-18 한국전자통신연구원 Apparatus and method for decoding multi-channel audio signal using cross-correlation
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding

Also Published As

Publication number Publication date
CN102165520A (en) 2011-08-24
JP2012503791A (en) 2012-02-09
ES2547232T3 (en) 2015-10-02
JP5480274B2 (en) 2014-04-23
CN102165520B (en) 2012-11-28
KR20100035120A (en) 2010-04-02
KR20100035122A (en) 2010-04-02
CN102165519A (en) 2011-08-24
KR101108061B1 (en) 2012-01-25
KR101108060B1 (en) 2012-01-25
KR20100035121A (en) 2010-04-02
JP2012503792A (en) 2012-02-09

Similar Documents

Publication Publication Date Title
JP5426680B2 (en) Signal processing method and apparatus
US10861468B2 (en) Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters
RU2763374C2 (en) Method and system using the difference of long-term correlations between the left and right channels for downmixing in the time domain of a stereophonic audio signal into a primary channel and a secondary channel
JP4934427B2 (en) Speech signal decoding apparatus and speech signal encoding apparatus
US8258849B2 (en) Method and an apparatus for processing a signal
JP5554830B2 (en) Device for supplying one or more adjusted parameters for the provision of an upmix signal representation based on a downmix signal representation, an audio signal decoder using object-related parametric information, an audio signal transcoder, an audio signal Encoder, audio bitstream, method and computer program
RU2551797C2 (en) Method and device for encoding and decoding object-oriented audio signals
US8060042B2 (en) Method and an apparatus for processing an audio signal
EP2169666B1 (en) A method and an apparatus for processing a signal
US10818304B2 (en) Phase coherence control for harmonic signals in perceptual audio codecs
JP2013511053A (en) Apparatus for generating upmix signal representation based on downmix signal representation, device for generating bitstream representing multi-channel audio signal, method using distortion control signaling, computer program and bitstream
US8346380B2 (en) Method and an apparatus for processing a signal
RU2407072C1 (en) Method and device for encoding and decoding object-oriented audio signals
Brandenburg Parametric Coding of High-Quality Audio

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131128

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5426680

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250