JP2003044096A - Method and device for encoding multi-channel audio signal, recording medium and music distribution system - Google Patents

Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Info

Publication number
JP2003044096A
JP2003044096A JP2001236870A JP2001236870A JP2003044096A JP 2003044096 A JP2003044096 A JP 2003044096A JP 2001236870 A JP2001236870 A JP 2001236870A JP 2001236870 A JP2001236870 A JP 2001236870A JP 2003044096 A JP2003044096 A JP 2003044096A
Authority
JP
Japan
Prior art keywords
step
means
intensity stereo
approximation
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001236870A
Other languages
Japanese (ja)
Inventor
Yasuhito Watanabe
泰仁 渡邊
Original Assignee
Matsushita Electric Ind Co Ltd
松下電器産業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Ind Co Ltd, 松下電器産業株式会社 filed Critical Matsushita Electric Ind Co Ltd
Priority to JP2001236870A priority Critical patent/JP2003044096A/en
Publication of JP2003044096A publication Critical patent/JP2003044096A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide a method and a device for encoding multi-channel audio signal, a recording medium and a music distribution system, by which the deterioration of a localization feeling is minimized and the compression efficiency is improved by controlling an IS frequency limit and execution/non-execution for the unit of sfb corresponding to the characteristics and compressibility of an input signal. SOLUTION: A step S4 has a process for processing a value calculated from a step S1 and a form controlled from a step S3, and a step S5 has a process for judging the value calculated from the step S1 and a frequency calculated from the step S4.

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明はマルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システムに関するものであり、主にマルチチャンネルオーディオ信号符号化の分野に係るものである。 BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention is a multi-channel audio signal encoding method, a multi-channel audio signal encoding apparatus, relates a recording medium and a music distribution system, mainly multi those relating to the field of channel audio signal encoding. 【0002】 【従来の技術】従来、このようなマルチチャンネルオーディオ信号符号化の分野の方法として、図11に示すようなオーディオ信号符号化方法(MPEG2 AAC) [0002] Conventionally, as a method in the field of such a multi-channel audio signal encoding, an audio signal encoding method as shown in FIG. 11 (MPEG2 AAC)
がある。 There is. まず、ステップS100は、入力オーディオ信号(「ステレオ信号」、「マルチチャンネルオーディオ信号」ともいい、以下「入力信号」という。)を人間の聴覚特性に従って分析し、信号対マスク比(「信号対マスキング比:SMR」ともいう。)の値を算出する聴覚心理分析である。 First, step S100 is an input audio signal ( "stereo signal", "multi-channel audio signal" a good, hereinafter referred to as "input signal".) And analyzed according to auditory characteristics of a human, the signal-to-mask ratio ( "signal-to-masking the ratio: is a psychoacoustic analysis to calculate the value of also called SMR ").. ステップS101は、MDCT(変形離散コサイン)変換などの変換を用いて、時間領域の入力信号を周波数領域のスペクトルデータに変換する時間/周波数マッピングである。 Step S101 uses the conversion such as MDCT (modified discrete cosine) conversion, the time / frequency mapping for converting an input signal in the time domain to the spectral data in the frequency domain. ステップS102は、量子化雑音の時間的な形状を制御するTNS処理である。 Step S102 is a TNS processing for controlling the temporal shape of the quantization noise. ステップS103は、入力信号を効率よく処理するモジュールの一つであり、2つのチャンネルとして、例えば左チャンネルと右チャンネル(以下「左右チャンネル」という。)の代わりに両方の左右チャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理である。 Step S103 is one of the modules to efficiently process the input signal, as two channels, for example, the left and right channels (hereinafter referred to as "left and right channels.") And coupling the energy of both the left and right channels instead of the directional an intensity stereo processing for converting the information. ステップS104は、左右チャンネルの入力信号(以下「左右チャンネル信号」という。)の和となる信号(以下「和信号」という。)および左右チャンネル信号の差となる信号(以下「差信号」という。)に変換する和差ステレオ処理である。 Step S104, the input signals of the left and right channels (hereinafter referred to as "left and right channel signals.") And becomes signal (hereinafter referred to as "sum signal".) Sum and the difference of the left and right channel signal the signal (hereinafter referred to as "differential signal". ) is the sum stereo processing for converting a. ステップS105は、以上の処理が施された入力信号を量子化、符号化(以下「量子化/ Step S105, quantizes the input signal above processing has been performed, the coding (hereinafter "quantization /
符号化」という。 Coding "that. )する。 ) To. ステップS106は、ステップS105の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成である。 Step S106 is output as the control information in step S105 are multiplexed, a bit stream generating formed to shape as a bit stream. 【0003】強度ステレオ処理は、高い周波数の音の方向性が左右チャンネルの強度差または振幅の差で認識しているという人間の聴覚の特性を利用し、入力信号に対して左右チャンネル共通のエネルギー包絡線とおおまかに定量化した指向情報で置き換える。 [0003] intensity stereo processing, using the characteristics of the human auditory called directional high frequency sounds are recognized by the difference intensity difference or amplitude of the left and right channels, the left and right channels common energy for the input signal broadly the envelope replaced with quantified oriented information. 【0004】 【発明が解決しようとする課題】ところで、従来の強度ステレオ処理では、図12のフローチャートに示すように、入力信号の条件、すなわちチャンネル数、窓長、グルーピング数等によっては使用できない。 [0004] [SUMMARY OF THE INVENTION Incidentally, in the conventional intensity stereo processing, as shown in the flowchart of FIG. 12, the condition of the input signal, i.e. the number of channels, the window length can not be used by the grouping number and the like. 例えば、入力信号がモノラル信号である場合や、左チャンネルがショートフレーム、右チャンネルがロングフレームといったように、左右チャンネルの窓長が違う場合には、強度ステレオ処理ステップを行うことができない。 For example, if the input signal is a monaural signal, so that the left channel is short frame, right channel such long frames, when the window length of the left and right channels are different, it is impossible to perform intensity stereo processing step. 【0005】そこでまず、入力信号の条件を格納している符号化モード情報を参照して、ステップS110において符号化モードの確認を行う。 [0005] Therefore, first, with reference to the coding mode information that contains the condition of the input signal, to check the coding mode in step S110. 強度ステレオ処理を行うことが可能となると、あらかじめ設定されたステップS112を開始する周波数、すなわちIS周波数限度以上のスケールファクタバンドにおいて、ステップS11 If it is possible to perform intensity stereo processing, the frequency for starting the step S112 which is set in advance, that is, in IS frequency limit or more scale factor band, step S11
2が実行される。 2 is executed. ステップS112は、各チャンネルに対するスペクトル成分をそれぞれ送信する必要はなく左右チャンネル共通のエネルギー包絡線とスケールファクタバンドに一つの指向情報を送信するだけでよいため、 Since step S112 may only send one directional information to the left and right channel common energy envelope and scale factor bands not need to send the spectral components for each channel, respectively,
2チャンネルの入力信号の場合、強度ステレオを行う周波数帯域に関しては、約50%の情報量の節約ができる。 For two-channel input signal, for frequency bands for performing intensity stereo can save about 50% of the amount of information. よって圧縮率が高い場合には、ステップ112を行う周波数帯域をできるだけ多くとることにより、圧縮効率を高めることができる。 Thus when the compression ratio is high, by taking as much as possible the frequency band to perform the step 112, it is possible to increase the compression efficiency. 【0006】しかしながら、オーディオ信号符号化方法において、強度ステレオ処理を制御せずに使用すると、 However, in the audio signal encoding method, when used without controlling the intensity stereo processing,
異なるチャンネルでエネルギー包絡線が非常に異なる信号に対して強度ステレオ処理を行う場合、左右チャンネル共通のエネルギー包絡線とその指向情報では左右チャンネル信号を表現することができないため、定位感が劣化したり、また空間的印象が中心位置につぶれることになってしまうという問題があった。 When performing the intensity stereo processing for energy envelope very different signals at different channels, since the in the directivity information is left and right channels common energy envelope can not express the left and right channel signals, a sense localization deteriorated , also there is a problem that supposed to collapse in the center position spatial impression. 【0007】本発明はこのような問題を解決するためになされたもので、入力信号の特性および圧縮率によってIS周波数限度およびスケールファクタバンド単位での強度ステレオ処理の実行または不実行(以下単に「実行/不実行」という。)を制御することで、定位感の劣化を最小とし、かつ高い圧縮効率を得ることが可能なマルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システムを提供するものである。 [0007] The present invention has been made in order to solve such a problem, the execution or non-execution of the intensity stereo processing of a characteristic and IS frequency limit by compression ratio and scale factor band unit of the input signal (hereinafter simply " run / called non-execution ".) by controlling the multi-channel audio signal encoding method capable of degradation of localization a minimum, and to obtain a high compression efficiency, multi-channel audio signal encoding apparatus, a recording medium and it is intended to provide a music distribution system. 【0008】 【課題を解決するための手段】本発明のマルチチャンネルオーディオ信号符号化方法は、入力信号を基に信号対マスク比の値を算出する聴覚心理分析工程と、もう一方の前記入力信号をスペクトルデータに変換する時間・周波数マッピング工程と、変換された前記スペクトルデータを基に形状を制御するTNS処理工程と、制御された前記形状を基に周波数を算出する強度ステレオ周波数限度算出工程と、スケールファクタバンドごとに左チャンネルと右チャンネルの前記入力信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う帯域毎強度ステレオ判定工程と、前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理 [0008] Multi-channel audio signal encoding method of the present invention, in order to solve the problems] includes a psychoacoustic analyzing step of calculating the value of the signal to mask ratio based on the input signal, the other of said input signal and time-frequency mapping step of converting the spectral data, a TNS processing step of controlling a shape based on the converted the spectral data, the intensity stereo frequency limit calculating step of calculating a frequency based on a controlled said shape , a band for each intensity stereo determination step which determines whether performing the intensity stereo processing in accordance with the degree of approximation of the input signal of the left and right channels for each scale factor band, a module for processing the input signal one one, and the intensity stereo processing for converting the two channels connecting the energy and directional information for both channels 工程と、前記チャンネルの前記入力信号をそれぞれの和および差となる信号に変換する和差ステレオ処理工程と、和差ステレオ処理工程で施された前記入力信号を量子化、符号化する量子化・符号化工程と、この量子化・符号化工程の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成工程とを備え、前記強度ステレオ周波数限度算出工程が、前記聴覚心理分析工程から算出された前記値とTNS処理工程から制御された前記形状とを処理する工程を有し、かつ前記帯域毎強度ステレオ判定工程が、前記聴覚心理分析工程から算出された前記値と前記強度ステレオ周波数限度算出工程から算出された前記周波数とを判断する工程を有した方法となっている。 Step and, quantization and sum and difference stereo processing step of converting said input signal of said channel to each of the sum and difference signal which becomes, the input signal applied in sum and difference stereo processing step, quantization of coding and an encoding step, the output control information of the quantization and encoding step are multiplexed, and a bit stream generating forming step of shaping as a bit stream, the intensity stereo frequency limit calculating step, from the psychoacoustic analysis process controlled from said calculated value and the TNS step has the step of treating the said shape, and the band each intensity stereo determination step, the intensity stereo frequency as the value calculated from the psychoacoustic analysis process It has become a method having a step of determining said frequency calculated from the limit calculating step. この方法により、強度ステレオ処理の欠点である定位感の劣化を最小とし、かつ高い圧縮効率を得ることが可能となる。 By this method, minimizing the degradation of which is a defect localization intensity stereo processing, and it is possible to obtain a high compression efficiency. 【0009】ここで、本発明のマルチチャンネルオーディオ信号符号化方法は、符号化に必要な符号化モード情報を設定するための符号化モード情報工程と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理工程と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出工程と、前記圧縮率と所定の値との大小を比較した結果を出力する負荷判定工程と、この負荷判定工程の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定工程とを備えた前記強度ステレオ周波数限度算出工程であって、前記負荷判定工程が前記圧縮率を高いと判断したときには、前記IS周波数限度設定工程がより広い周波数帯域で強度ステレオ処理を行う手段を有し、かつ前記負荷 [0009] Here, the multi-channel audio signal encoding method of the present invention, the coding mode information step for setting a coding mode information required for encoding, from intensity stereo said coded mode information available and intensity stereo pre-processing step for whether the decision or, the compression ratio calculating step of calculating a compression ratio from the information obtained from the encoding mode information, the results of comparing the magnitude of the compression ratio with a predetermined value a load determination step of outputting, a said intensity stereo frequency limit calculation step and a iS frequency limit setting step of setting a frequency for starting the intensity stereo processing the results of the load determination process, the load determination process is the when it is determined that a high compression rate comprises means for the iS frequency limit setting step performs intensity stereo processing in a wider frequency band, and the load 定工程が前記圧縮率を低いと判断したときには、前記IS周波数限度設定工程がより狭い周波数帯域で強度ステレオ処理を行う手段を有した方法となっている。 When the constant-step is judged to be low the compression ratio has a method of the IS frequency limit setting step had the means for performing the intensity stereo processing in a narrower frequency band. この方法により、圧縮率が低い場合には、 In this way, when the compression ratio is low,
より狭い周波数帯域で強度ステレオ処理を行うことにより、強度ステレオ処理の欠点である定位の劣化を最小にすることが可能となる。 By performing the intensity stereo processing in a narrower frequency band, it is possible to minimize the deterioration of the localization is a disadvantage of the intensity stereo processing. 【0010】また、本発明のマルチチャンネルオーディオ信号符号化方法は、符号化に必要な符号化モード情報を設定するための符号化モード情報工程と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理工程と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出工程と、この圧縮率算出工程で算出した前記圧縮率を基に判定閾値を算出する判定閾値算出工程と、判定閾値算出工程で算出した前記判定閾値を基に左チャンネルと右チャンネルの近似度を算出する近似度算出工程と、前記判定閾値と前記圧縮率を比較した結果を出力する近似度判定処理工程と、この近似度判定処理工程の結果より周波数を設定するIS周波数限度設定工程とを備えた前記強度ステレオ周波数限 [0010] The multi-channel audio signal encoding method of the present invention, either the coding mode information step for setting a coding mode information required for encoding, from intensity stereo said coded mode information available and intensity stereo pre-processing step for whether the determination, and compression ratio calculating step of calculating a compression ratio from the information obtained from the encoding mode information, the determination threshold based on the compression rate calculated by the compression ratio calculating step a determination threshold value calculation step of calculating a similarity calculation step of calculating an approximation of the left channel and right channel based on the determination threshold calculated by the determination threshold calculation step, the result of comparing the compression ratio and the determination threshold an approximate determination process step of outputting, the intensity stereo frequency limit with a iS frequency limit setting step of setting a frequency from the results of the similarity determination process 算出工程であって、前記近似度判定処理工程が前記判定閾値より前記近似度を高いと判断したときには、前記IS周波数限度設定工程がより広い周波数帯域で強度ステレオ処理を行う工程を有し、かつ前記近似度判定処理工程が前記近似度を低いと判断したときには、前記IS周波数限度設定工程がより狭い周波数帯域で強度ステレオ処理を行う手段を有した方法となっている。 A calculation step, when the approximation degree determination process is determined to be high the similarity than the determination threshold, and a step of the IS frequency limit setting step performs intensity stereo processing in a wider frequency band, and when the approximation degree determination step determines that lower the degree of approximation, has a method of the iS frequency limit setting step had the means for performing the intensity stereo processing in a narrower frequency band. この方法により、入力信号の特性によって強度ステレオ処理を行う周波数帯域を適応的に設定することよって強度ステレオ処理による定位の劣化が起こらず、 This method does not occur deterioration of localization by I I intensity stereo processing to set a frequency band to perform intensity stereo processing by the characteristics of the input signal adaptively,
圧縮効率の高い符号化を行うことが可能となる。 It is possible to perform high compression efficiency coding. 【0011】さらに、本発明のマルチチャンネルオーディオ信号符号化方法は、前記スケールファクタバンドとIS周波数限度を比較するスケールファクタバンド判定工程と、このスケールファクタバンド判定工程で比較した前記スケールファクタバンドと前記IS周波数限度を基に左チャンネルと右チャンネルの近似度を算出する近似度算出工程と、近似度算出工程で算出した近似度とあらかじめ設定された閾値との大小を比較する近似度判定処理工程と、近似度判定処理工程からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程とを備えた前記帯域毎強度ステレオ判定工程であって、前記近似度判定処理工程が前記近似度を高い Furthermore, the multi-channel audio signal encoding method of the present invention, a scale factor band determination step of comparing the scale factor band and IS frequency limit, and the scale factor band in comparison with the scale factor band determination step wherein a similarity calculation step of calculating a degree of approximation of the left and right channels on the basis of the iS frequency limit, an approximate determination process step of comparing the magnitude of the preset threshold value approximation degree calculated by the approximation degree calculating step is one of the modules for processing the input signal from the similarity determination process, the band for each intensity and a strength stereo processing step of converting the coupled energy directional information of both channels of the two channels a stereo determination step, the approximation degree determination process is high the degree of approximation 判断したときには、前記強度ステレオ処理工程が強度ステレオ処理を行う工程を有し、かつ前記近似度判定処理工程が前記近似度を低いと判断したときには、前記強度ステレオ処理を行わないで前記スケールファクタバンド判定工程に戻る工程を有した方法となっている。 If it is determined, the intensity stereo processing step has a step of performing the intensity stereo processing, and when the approximation degree determination step determines that lower the degree of approximation, the scale factor band without performing the intensity stereo processing It has a method comprising the step of returning to the determination process. この方法により、強度ステレオ処理による定位の劣化が生じず、また音質の影響の少ない高い周波数帯域においてより強度ステレオ処理を実行することができるようになるため、圧縮効率を高めることが可能となる。 This method causes no deterioration in the localization by intensity stereo processing, also because it is possible to perform more intensity stereo processing in less high frequency band impact sound quality, it is possible to increase the compression efficiency. 【0012】また、本発明のマルチチャンネルオーディオ信号符号化方法は、前記スケールファクタバンドとI [0012] The multi-channel audio signal encoding method of the present invention, the scale factor band and I
S周波数限度を比較するスケールファクタバンド判定工程と、このスケールファクタバンド判定工程で比較した前記スケールファクタバンドと前記IS周波数限度を基に判定閾値を算出する判定閾値算出工程と、この判定閾値算出工程で算出した前記判定閾値を基に左右チャンネルの近似度を算出する近似度算出工程と、前記判定閾値算出工程で算出した前記判定閾値と前記近似度算出工程で算出した前記近似度とを比較する近似度判定処理工程と、近似度判定処理工程からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程とを備えた前記帯域毎強度ステレオ判定工程であって、前記近似度判定処理工程が前記判定閾値より近似度が A scale factor band determination step of comparing the S frequency limits, the determination threshold value calculation step of calculating a determination threshold based on the IS frequency limit and the scale factor band in comparison with the scale factor band determination step, the determination threshold value calculation step comparing in the approximation degree calculating step of calculating a degree of approximation of the left and right channels on the basis of the calculated the determination threshold value, and said approximation degree calculated by the determination threshold and the approximation degree calculating step calculated by the determination threshold calculation step an approximate determination process step is one of the modules for processing the input signal from the similarity determination process, the intensity stereo processing step of converting the coupled energy directional information of both channels of the two channels a said zone each intensity stereo determination step with the approximation degree determination step approximation degree than the determination threshold value いと判断したときには、前記強度ステレオ処理工程が強度ステレオ処理を行う工程を有し、 When the intended determination, comprising the step of the intensity stereo processing step performs intensity stereo processing,
かつ前記近似度判定処理工程が前記近似度を低いと判断したときには、前記強度ステレオ処理工程が強度ステレオ処理を行わないで前記スケールファクタバンド判定工程に戻る工程を有した方法となっている。 And when the approximation degree determination step determines that lower the degree of approximation, has a way to the intensity stereo processing step has been comprising the step of returning to the scale factor band determination step without performing the intensity stereo processing. この方法により、強度ステレオ処理による定位の劣化が生じず、また音質の影響の少ない高い周波数帯域においてより強度ステレオ処理を実行することができるようになるため、圧縮効率を高めることが可能となる。 This method causes no deterioration in the localization by intensity stereo processing, also because it is possible to perform more intensity stereo processing in less high frequency band impact sound quality, it is possible to increase the compression efficiency. 【0013】本発明のマルチチャンネルオーディオ信号符号化装置は、入力信号を基に信号対マスク比の値を算出する聴覚心理分析手段と、もう一方の前記入力信号をスペクトルデータに変換する時間・周波数マッピング手段と、変換された前記スペクトルデータを基に形状を制御するTNS処理手段と、制御された前記形状を基に周波数を算出する強度ステレオ周波数限度算出手段と、スケールファクタバンドごとに左チャンネルと右チャンネルの前記入力信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う帯域毎強度ステレオ判定手段と、前記入力信号を処理するモジュールの一つであり、 [0013] Multi-channel audio signal encoding apparatus of the present invention, a psychoacoustic analyzing means for calculating the value of the signal to mask ratio based on the input signal, the time-frequency converting the other of said input signal into spectral data and mapping means, and TNS processing means for controlling the shape based on the converted the spectral data, the intensity stereo frequency limit calculating means for calculating a frequency based on a controlled said shape, and a left channel for each scale factor band a band for each intensity stereo judging means for judging whether or not the intensity stereo processing in accordance with the degree of approximation of the input signal of the right channel, it is one of the modules for processing the input signal,
前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段と、前記チャンネルの前記入力信号をそれぞれの和および差となる信号に変換する和差ステレオ処理手段と、和差ステレオ処理手段で施された前記入力信号を量子化、符号化する量子化・符号化手段と、この量子化・符号化手段の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成手段とを備え、前記強度ステレオ周波数限度算出手段が、前記聴覚心理分析手段から算出された前記値とTNS処理手段から制御された前記形状とを処理する手段を有し、かつ前記帯域毎強度ステレオ判定手段が、前記聴覚心理分析手段から算出された前記値と前記強度ステレオ周波数限度算出手段から算出された前記 And intensity stereo processing means for converting the two channels connecting the energy and directional information for both channels, and sum and difference stereo processing means for converting the input signal of said channel to each of the sum and difference signal which becomes, sum and difference quantizing the input signal subjected to a stereo processing unit, and a quantization and coding means for coding, a bit stream generation form the output control information of the quantization and encoding means multiplexes, shaping as a bit stream and means, the intensity stereo frequency limit calculating means has means for processing and controlled the shape from said values ​​and the TNS processing means calculated from the psychoacoustic analysis means, and the band each intensity stereo determining means, said calculated from the intensity stereo frequency limit calculating means and the value calculated from the psychoacoustic analysis means 波数とを判断する手段を有した構成となっている。 It has a configuration having a means for determining the wave number. この構成により、強度ステレオ処理の欠点である定位感の劣化を最小とし、かつ高い圧縮効率を得ることが可能となる。 With this configuration, the minimum degradation of a defect localization intensity stereo processing, and it is possible to obtain a high compression efficiency. 【0014】ここで、本発明のマルチチャンネルオーディオ信号符号化装置は、符号化に必要な符号化モード情報を設定するための符号化モード情報手段と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理手段と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出手段と、前記圧縮率と所定の値との大小を比較した結果を出力する負荷判定手段と、この負荷判定手段の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定手段とを備えた前記強度ステレオ周波数限度算出手段であって、前記負荷判定手段が前記圧縮率を高いと判断したときには、前記IS周波数限度設定手段がより広い周波数帯域で強度ステレオ処理を行う手段を有し、かつ前記負荷 [0014] Here, the multi-channel audio signal encoding apparatus of the present invention, the coding mode information means for setting a coding mode information required for encoding, from intensity stereo said coded mode information available and whether the determination intensity stereo pre-processing means for performing either a compression ratio calculating means for calculating a compression ratio from the information obtained from the encoding mode information, the results of comparing the magnitude of the compression ratio with a predetermined value a load determination means for outputting to a said intensity stereo frequency limit calculating means and a iS frequency limit setting means for setting a frequency to start the intensity stereo processing the results of the load determination means, the load determining means is the when it is determined that a high compression rate comprises means for the iS frequency limit setting means performs intensity stereo processing in a wider frequency band, and the load 定手段が前記圧縮率を低いと判断したときには、前記IS周波数限度設定手段がより狭い周波数帯域で強度ステレオ処理を行う手段を有した構成となっている。 When the constant means determines that lower the compression ratio, has a configuration in which the IS frequency limit setting means is comprising means for performing intensity stereo processing in a narrower frequency band. この構成により、圧縮率が低い場合には、 By this configuration, when the compression ratio is low,
より狭い周波数帯域で強度ステレオ処理を行うことにより、強度ステレオ処理の欠点である定位の劣化を最小にすることが可能となる。 By performing the intensity stereo processing in a narrower frequency band, it is possible to minimize the deterioration of the localization is a disadvantage of the intensity stereo processing. 【0015】また、本発明のマルチチャンネルオーディオ信号符号化装置は、符号化に必要な符号化モード情報を設定するための符号化モード情報手段と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理手段と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出手段と、この圧縮率算出手段で算出した前記圧縮率を基に判定閾値を算出する判定閾値算出手段と、判定閾値算出手段で算出した前記判定閾値を基に左チャンネルと右チャンネルの近似度を算出する近似度算出手段と、前記判定閾値と前記圧縮率を比較した結果を出力する近似度判定処理手段と、この近似度判定処理手段の結果より周波数を設定するIS周波数限度設定手段とを備えた前記強度ステレオ周波数限 [0015] The multi-channel audio signal encoding apparatus of the present invention, the coding mode information means for setting a coding mode information required for encoding, or the intensity stereo from the encoding mode information can be used and intensity stereo pre-processing means for performing whether the determination, and compression ratio calculating means for calculating a compression ratio from the information obtained from the encoding mode information, the determination threshold based on the compression rate calculated by the compression ratio calculating means a determination threshold calculation means for calculating, and the approximation degree calculating means for calculating an approximation of the left channel and right channel based on the determination threshold calculated by the determination threshold calculation means, the result of comparing the compression ratio and the determination threshold an approximate determination process means for outputting the intensity stereo frequency limit with a iS frequency limit setting means for setting a frequency from the results of the approximation degree determination means 算出手段であって、前記近似度判定処理手段が前記判定閾値より前記近似度を高いと判断したときには、前記IS周波数限度設定手段がより広い周波数帯域で強度ステレオ処理を行う手段を有し、かつ前記近似度判定処理手段が前記近似度を低いと判断したときには、前記IS周波数限度設定手段がより狭い周波数帯域で強度ステレオ処理を行う手段を有した構成となっている。 A calculating means, when the approximation degree determination means determines that high the similarity than the determination threshold value comprises means the IS frequency limit setting means performs intensity stereo processing in a wider frequency band, and when the approximation degree determination means determines that lower the degree of approximation, has a structure in which the iS frequency limit setting means is comprising means for performing intensity stereo processing in a narrower frequency band. この構成により、入力信号の特性によって強度ステレオ処理を行う周波数帯域を適応的に設定することよって強度ステレオ処理による定位の劣化が起こらず、 This configuration does not occur degradation of localization by I I intensity stereo processing to set a frequency band to perform intensity stereo processing by the characteristics of the input signal adaptively,
圧縮効率の高い符号化を行うことが可能となる。 It is possible to perform high compression efficiency coding. 【0016】さらに、本発明のマルチチャンネルオーディオ信号符号化装置は、前記スケールファクタバンドとIS周波数限度を基に左チャンネルと右チャンネルの近似度を算出する近似度算出手段と、近似度算出手段で算出した近似度とあらかじめ設定された閾値との大小を比較する近似度判定処理手段と、近似度判定処理手段からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段とを備えた前記帯域毎強度ステレオ判定手段であって、前記近似度判定処理手段が前記近似度を高いと判断したときには、前記強度ステレオ処理手段が強度ステレオ処理を行う手段を有し、かつ前記近似度判定処理手段が前記近似度を低いと判断した Furthermore, the multi-channel audio signal encoding apparatus of the present invention, the approximation degree calculation means for calculating the approximation degree of the left and right channels on the basis of the scale factor band and IS frequency limit in the approximation degree calculating section an approximate determination processing means for comparing the magnitudes of the calculated degree of approximation and the preset threshold is one of a module for processing the input signal from the approximation degree determination processing means of both the two-channel a said zone each intensity stereo judging means having a strength stereo processing means for converting a channel connecting energy-oriented information, when the approximation degree determination means determines that high the degree of approximation, the intensity stereo processing means comprising means for performing the intensity stereo processing, and is the approximate determination processing means determines that lower the degree of approximation きには、前記強度ステレオ処理を行わないで前記スケールファクタバンド判定手段に戻る手段を有した構成となっている。 Kiniwa, has a configuration having a means for returning to the scale factor band judging unit without performing the intensity stereo processing. この構成により、強度ステレオ処理による定位の劣化が起こらず、かつ圧縮効率を高めることが可能となる。 This configuration does not occur degradation of localization by intensity stereo processing, and it is possible to improve the compression efficiency. 【0017】また、本発明のマルチチャンネルオーディオ信号符号化装置は、前記スケールファクタバンドとI Further, the multi-channel audio signal encoding apparatus of the present invention, the scale factor band and I
S周波数限度を基に判定閾値を算出する判定閾値算出手段と、この判定閾値算出手段で算出した前記判定閾値を基に左右チャンネルの近似度を算出する近似度算出手段と、前記判定閾値算出手段で算出した前記判定閾値と前記近似度算出手段で算出した前記近似度とを比較する近似度判定処理手段と、近似度判定処理手段からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段とを備えた前記帯域毎強度ステレオ判定手段であって、前記近似度判定処理手段が前記判定閾値より近似度が高いと判断したときには、前記強度ステレオ処理手段が強度ステレオ処理を行う手段を有し、かつ前記近似度判定処理手段が前記近似度を低いと判断 A determination threshold value calculating means for calculating a determination threshold based on the S frequency limits, the approximation degree calculation means for calculating the approximation degree of the left and right channels on the basis of the determination threshold calculated by the determination threshold calculation means, said determination threshold calculation means in the approximation degree determination process means for comparing the approximation degree calculated by the calculated the determination threshold value and the approximation degree calculating section, is one of the modules for processing the input signal from the approximation degree determination processing unit, wherein a said zone each intensity stereo judging means having a strength stereo processing means for converting two channels to the coupling energy and directional information for both channels, the approximation degree determination means is higher similarity than the determination threshold It determined that when determination includes means the intensity stereo processing means performs intensity stereo processing, and the approximation degree determination processing unit is lower the degree of approximation and たときには、前記強度ステレオ処理手段が強度ステレオ処理を行わないで前記スケールファクタバンド判定手段に戻る手段を有した構成となっている。 When the has a structure in which the intensity stereo processing means having means for returning to the scale factor band judging unit without performing the intensity stereo processing. この構成により、強度ステレオ処理による定位の劣化が生じず、また音質の影響の少ない高い周波数帯域においてより強度ステレオ処理を実行することができるようになるため、圧縮効率を高めることが可能となる。 This configuration does not occur degradation of localization by intensity stereo processing, also because it is possible to perform more intensity stereo processing in less high frequency band impact sound quality, it is possible to increase the compression efficiency. 【0018】本発明のマルチチャンネルオーディオ信号符号化装置は、上記いずれかに記載のマルチチャンネルオーディオ信号符号化方法を用いて前記入力信号を量子化、符号化した構成を有している。 The multichannel audio signal encoding apparatus of the present invention has the quantized input signal, and coding scheme using a multi-channel audio signal encoding method according to any one of the above. この構成により、上記マルチチャンネルオーディオ信号符号化方法と同様の効果を得ることが可能となる。 This configuration makes it possible to obtain the multi-channel audio signal encoding method the same effect as. 【0019】本発明の記録媒体は、上記いずれかに記載のマルチチャンネルオーディオ信号符号化方法のステップが記憶されている構成を有している。 The recording medium of the present invention has a structure in which the step of multi-channel audio signal encoding method according to any one is stored. この構成により、上記マルチチャンネルオーディオ信号符号化方法と同様の効果を得ることが可能となる。 This configuration makes it possible to obtain the multi-channel audio signal encoding method the same effect as. 【0020】ここで、本発明の音楽配信システムは、この記録媒体を構成要素としたことを特徴としている。 [0020] Here, the music distribution system of the present invention is characterized in that the components of the recording medium. この特徴により、上記マルチチャンネルオーディオ信号符号化方法と同様の効果を得ることが可能となる。 This feature makes it possible to obtain the multi-channel audio signal encoding method the same effect as. 【0021】また、本発明の音楽配信システムは、上記いずれかに記載のマルチチャンネルオーディオ信号符号化方法を用いて音楽が配信されている構成を有している。 Further, the music distribution system of the present invention has a structure in which music using a multi-channel audio signal encoding method according to any one of the above has been delivered. この構成により、上記マルチチャンネルオーディオ信号符号化方法と同様の効果を得ることが可能となる。 This configuration makes it possible to obtain the multi-channel audio signal encoding method the same effect as. 【0022】さらに、本発明の音楽配信システムは、上記いずれかに記載のマルチチャンネルオーディオ信号符号化装置を構成要素としたことを特徴としている。 Furthermore, the music distribution system of the present invention is characterized in that the components of the multichannel audio signal encoding apparatus according to any one of the above. この特徴により、上記マルチチャンネルオーディオ信号符号化装置と同様の効果を得ることが可能となる。 This feature makes it possible to obtain the same effect as the multi-channel audio signal encoding apparatus. 【発明の実施の形態】以下、本発明に係る実施の形態におけるマルチチャンネルオーディオ信号符号化方法について、図面を参照しながら説明する。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, a multi-channel audio signal encoding method in the embodiment of the present invention will be described with reference to the drawings. 図1は、本発明に係る第1の実施の形態におけるマルチチャンネルオーディオ信号符号化方法を示すフローチャートである。 Figure 1 is a flowchart illustrating a multi-channel audio signal encoding method in the first embodiment according to the present invention. 【0023】同図に示すように、マルチチャンネルオーディオ信号符号化方法は、入力信号を基に人間の聴覚の特性を利用する聴覚心理モデルに基づく信号対マスク比の値を算出する聴覚心理分析工程としてのステップS1 As shown in the figure, the multi-channel audio signal encoding method, psychoacoustic analysis step of calculating the value of the psychoacoustic model-based signal-to-mask ratio utilizing the characteristics of the human auditory based on the input signal step as S1
と、もう一方の時間領域の入力信号を周波数領域のスペクトルデータに変換する時間・周波数マッピング工程(以下「時間/周波数マッピング工程」という。)としてのステップS2と、変換されたスペクトルデータを基に量子化雑音の時間的な形状を制御するTNS処理工程としてのステップS3と、制御された形状を基に強度ステレオを開始する周波数を算出する強度ステレオ周波数限度算出工程としてのステップS4と、強度ステレオ処理を行うスケールファクタバンド(以下「sfb」とする。)ごとに左右チャンネル信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う帯域毎強度ステレオ判定工程としてのステップS5と、ステップS5からの入力信号を効率よく処理するモジュールの一つであり、2つのチャンネ If, in step S2 of the time-frequency mapping step of converting an input signal of the other time domain to the spectral data in the frequency domain (hereinafter referred to as "time / frequency mapping step."), Based on the converted spectral data a step S3 of the TNS processing step of controlling the temporal shape of the quantization noise, the step S4 of the intensity stereo frequency limit calculating step of calculating a frequency for starting the intensity stereo based on controlled shape, intensity stereo processing step S5 as bands each intensity stereo determination step which determines whether performing the intensity stereo processing in accordance with the degree of approximation of the scale factor band (hereinafter "sfb" to.) the left and right channels signals to each of performing, the input signal from the step S5 is one of efficiently processing module, two channels の代わりに両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程としてのステップS6と、左右チャンネル信号を和信号および差信号に変換する和差ステレオ処理工程としてのステップS7と、ステップS7で施された前記入力信号を量子化、符号化する量子化/符号化工程としてのステップS8と、ステップ8の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成工程としてのステップS10とを有している。 A step S6 as intensity stereo processing step of converting the coupled energy directional information of both channels in place of the step S7 in the sum and difference stereo processing step of converting the left and right channel signals to the sum and difference signals, step S7 step of the input signal subjected quantized, and step S8 in the quantization / encoding step of encoding, and outputs control information in step 8 multiplexes, as a bit stream generated forming step of shaping as a bit stream in S10 and a. 【0024】次に、このマルチチャンネルオーディオ信号符号化方法の処理の流れについて説明する。 [0024] Next, the flow of processing of the multi-channel audio signal encoding method. 【0025】まず、入力信号は、ステップS1により聴覚心理モデルに基づく、信号対マスク比の値を算出する。 [0025] First, the input signal is based on a psychoacoustic model in step S1, to calculate the value of the signal-to-mask ratio. もう一方の入力信号は、ステップS2により、MD The other input signal, at step S2, MD
CT変換などの変換を用いて、時間領域から周波数領域のスペクトルデータに変換される。 Using transformation such as CT transformation, it is transformed from the time domain to the spectral data in the frequency domain. 【0026】次に、ステップS3は、変換されたスペクトルデータを基に量子化雑音の時間的な形状を制御する。 Next, step S3 controls the temporal shape of the quantization noise based on the converted spectral data. 次いで、ステップS4は、制御された形状を基に強度ステレオを開始する周波数であるIS周波数限度を算出する。 Then, step S4 calculates the IS frequency limit which is a frequency for starting the intensity stereo based on controlled shape. 続いて、ステップS5は、IS周波数限度以上の周波数において、sfb毎に左右チャンネル信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う。 Subsequently, step S5, the IS frequency limit frequencies above, it is determined whether or not the intensity stereo processing in accordance with the degree of approximation of the left and right channel signals for each sfb. 一方、ステップS5は、算出されたIS周波数限度を基に強度ステレオ処理を行うことができないと判定する(NOである)と、ステップS6とステップS7との間に移行する。 On the other hand, step S5, the calculated IS frequency limit and can not perform intensity stereo processing based on judged as (a NO), the process proceeds to between Step S6 and Step S7. ステップS6は、ステップS5において強度ステレオ処理を行うことができると判定される(Y Step S6, it is determined that it is possible to perform intensity stereo processing in step S5 (Y
ESである)と、強度ステレオ処理を行う。 To be ES), perform the intensity stereo processing. 【0027】次に、ステップS7は、左右チャンネル信号をそれぞれ和信号および差信号に変換する。 Next, step S7 converts the left and right channels signals to the sum and difference signals. 次いで、 Then,
ステップS8は、以上の処理が施された入力信号を量子化、符号化する。 Step S8, quantizes the input signal above processing has been performed to encode. ステップS10は、ステップS8の出力と制御情報を多重化し、ビットストリームとして整形する。 Step S10, the output control information in step S8 multiplexed, shaping as a bit stream. 【0028】このようなマルチチャンネルオーディオ信号符号化方法によれば、入力信号の特性および圧縮率によって、強度ステレオを開始する周波数を適応的に変動させ、また入力信号の特性および圧縮率によって、sf According to such a multi-channel audio signal encoding method, the characteristics and the compression ratio of the input signal, a frequency for starting the intensity stereo adaptively varied, also depending on the characteristics and the compression ratio of the input signal, sf
b単位での実行/不実行を制御するので、強度ステレオ処理の欠点である定位感の劣化を最小とし、かつ高い圧縮効率を得ることができる。 And controls execution / non-execution in b units, and minimizing the deterioration of the drawbacks is that the localization of the intensity stereo processing, it is possible to obtain a high compression efficiency. 【0029】図2は、本発明に係る第2の実施の形態におけるステップS4を示すフローチャートである。 FIG. 2 is a flow chart illustrating the step S4 in the second embodiment according to the present invention. 【0030】同図に示すように、ステップS4は、ビットレートやサンプリング周波数などの符号化に必要な符号化モード情報を設定するための符号化モード情報工程としてのステップS21と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理工程としてのステップS22と、前記符号化モード情報より得られるビットレート、サンプリング周波数、チャンネル数等の情報より圧縮率を算出する圧縮率算出工程としてのステップS23と、前記圧縮率と所定の値との大小を比較した結果を出力する負荷判定工程としてのステップS24と、ステップS24の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定工程としてのステップS25とを有している。 As shown in the figure, a step S4, step S21 as coding mode information step for setting a coding mode information necessary for encoding such as bit rate, sampling frequency, the encoding mode calculating a step S22 as the intensity stereo pre-processing step for determining from the intensity stereo information whether available, the encoding mode bit rate obtained from the information, sampling frequency, the compression ratio from the information of the number of channels, etc. setting the step S23 as the compression ratio calculating step, and step S24 as a load judging step of outputting a result of comparing the magnitude of said compression ratio and a predetermined value, the frequency of starting the intensity stereo processing the results of step S24 and a step S25 as iS frequency limit setting step of. 【0031】次に、このステップS4の処理の流れについて説明する。 [0031] Next, the flow of the process in step S4. 【0032】ステップS4において、強度ステレオ処理は、左右チャンネルの符号化モード(チャンネル数、窓長、グルーピング等)が違う場合には使用できないため、まず符号化モード情報S21を用いて、強度ステレオが使用可能か否かの判定を行う。 [0032] In step S4, the intensity stereo processing, the coding mode of the left and right channels (the number of channels, the window length, grouping, etc.) can not be used when a different, first using the coding mode information S21, the intensity stereo it is determined whether available. 入力信号がモノラルなどの符号化モードが異なる場合(NOの場合)には、 In the case where the input signal is the coding mode such as monaural different (in the case of NO),
処理を終了する(END)。 The processing is terminated (END). 強度ステレオ処理が可能であると判定される(YESである)と、ステップS23 It is determined that the intensity stereo processing is possible (having a YES), step S23
は、ステップS21より得られるビットレートとサンプリング周波数およびチャンネル数から例えば、下記の(1)に示す計算式により圧縮率を算出する。 , For example, from the bit rate and the sampling frequency and the number of channels obtained from the step S21, and calculates the compression rate by calculation formula shown in the following (1). 【数1】 [Number 1] 【0033】ここで、fsはサンプリング周波数、br [0033] In this case, fs is the sampling frequency, br
はビットレート、chはチャンネル数である。 Bit rate, ch is the channel number. 【0034】次に、ステップS24は、圧縮率とあらかじめ設定した所定の値との大小比較を行う。 Next, step S24 performs the comparison between the predetermined value set in advance and the compression ratio. 圧縮率が所定の値よりも大きい場合、つまり圧縮率が高い場合には、ステップS25で、より広い周波数帯域で強度ステレオ処理を開始する周波数を下げる。 If the compression ratio is larger than a predetermined value, that is, if the compression ratio is high, in step S25, lowers the frequency to start the intensity stereo processing in a wider frequency band. 逆に圧縮率が所定の値よりも小さい場合、つまり圧縮率が低い場合には、 If conversely the compression rate is smaller than a predetermined value, that is, if the compression ratio is low,
ステップS25で、より狭い周波数帯域で強度ステレオ処理を開始する周波数を上げる。 In step S25, the frequency is increased to initiate the intensity stereo processing in a narrower frequency band. 【0035】このようなステップS4によれば、圧縮率が高い場合には、より広い周波数帯域で強度ステレオ処理を行うことにより、情報量の節約ができ、圧縮効率を高めることができる。 [0035] According to such a step S4, when the compression ratio is high, by performing the intensity stereo processing in a wider frequency band, can save the amount of information, it is possible to increase the compression efficiency. また、ステップS4によれば、圧縮率が低い場合には、より狭い周波数帯域で強度ステレオ処理を行うことにより、強度ステレオ処理の欠点である定位の劣化を最小にすることができる。 Further, according to the step S4, if the compression ratio is low, by performing the intensity stereo processing in a narrower frequency band, the deterioration of the localization is a disadvantage of the intensity stereo processing can be minimized. 【0036】図3は、本発明に係る第3の実施の形態におけるステップS4を示すフローチャートである。 [0036] FIG. 3 is a flow chart illustrating the step S4 of the third embodiment according to the present invention. 【0037】同図に示すように、ステップS4は、上記ステップS21と、上記ステップS22と、上記ステップS23と、ステップS23で算出した圧縮率を基に判定閾値を算出する判定閾値算出工程としてのステップS As shown in the figure, step S4, and step S21, and step S22, and step S23, as determination threshold value calculating step of calculating the determination threshold based on the compression rate calculated in step S23 step S
31と、ステップS31で算出した判定閾値を基に左右チャンネルの近似度を算出する近似度算出工程としてのステップS32と、判定閾値と圧縮率を比較した結果を出力する近似度判定処理工程としてのステップS33 31, a step S32 as an approximation degree calculating step of calculating a degree of approximation of the left and right channels on the basis of the determination threshold value calculated in step S31, as an approximation determination process step of outputting a result of comparison determination threshold and compression ratio step S33
と、ステップS33の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定工程としてのステップS34とを有している。 When, and a step S34 as IS frequency limit setting step of setting a frequency for starting the intensity stereo processing the results of step S33. 【0038】次に、このステップS4の処理の流れについて説明する。 [0038] Next, the flow of the process in step S4. 【0039】ステップS4において、強度ステレオ処理は、左右チャンネルの符号化モードが違う場合には使用できないため、まずステップS21を用いて、強度ステレオが使用可能か否かの判定をステップS22において行う。 [0039] In step S4, the intensity stereo processing, since the coding mode of the left and right channels are not available when a different, first using a step S21, a determination intensity stereo whether usable in step S22. 入力信号がモノラルなどの符号化モードが異なる場合(NOの場合)には、処理を終了する(END)。 In the case where the input signal is the coding mode such as monaural different (in the case of NO), the process ends (END).
強度ステレオ処理が可能であると判定される(YESである)と、ステップS23は、ステップS21より得られるビットレートとサンプリング周波数およびチャンネル数から例えば、下記の(1)に示す計算式により圧縮率を算出する。 Is determined to be strength stereo process (having a YES), step S23, for example, from the bit rate and the sampling frequency and the number of channels obtained from the step S21, the compression ratio by calculation formula shown in the following (1) It is calculated. 【数1】 [Number 1] 【0040】次に、ステップS31は、圧縮率とあらかじめ設定した所定の値と大小を比較することにより、判定閾値を算出する。 Next, step S31, by comparing the predetermined value and the magnitude of the preset compression ratio, it calculates a determination threshold. 判定閾値は、圧縮率が高い場合には、強度ステレオ処理を行う周波数帯域を広くとれるような値をセットしておく。 Determination threshold, when the compression ratio is high, should be set the value that take a wide frequency band to perform intensity stereo processing. また、判定閾値は、圧縮率の大きさによって、数段階の閾値を設定することもできる。 The determination threshold, depending on the size of the compression ratio, it is also possible to set the threshold of the number of stages. 【0041】次いで、ステップS32は、左右チャンネル信号の相互相関値や左右チャンネル信号の比の標準偏差を用いて近似度を算出する。 [0041] Then, Step S32 calculates the degree of approximation by using the standard deviation of the ratio of the cross-correlation value and the left and right channel signals of the left and right channel signals. 続いて、ステップS33 Then, step S33
は、ステップS31で算出された判定閾値とステップS , The decision threshold and step S calculated in step S31
32で算出された近似度の比較を行い、この近似度が判定閾値よりも大きい場合、つまり圧縮率が高く、左右チャンネル信号の近似度が高い場合には、ステップS34 32 compares the approximation degrees calculated in the case the degree of approximation is greater than the determination threshold value, i.e. high compression rate, if a high degree of approximation of the left and right channel signals, step S34
においてより広い周波数で強度ステレオを行えるように強度ステレオ処理を開始する周波数を低く、例えば3k The frequency of starting the intensity stereo processing to allow the intensity stereo wider frequency at low, for example 3k
Hzに設定する。 It is set to Hz. 一方、近似度が判定閾値よりも小さい場合、つまり圧縮率が低く、左右チャンネル信号の近似度が低い場合には、ステップS34において強度ステレオ処理を開始する周波数を高く、例えば6kHzに設定する。 On the other hand, if the approximation degree is smaller than the determination threshold value, i.e. the compression ratio is low and the similarity of the left and right channel signals is low, increase the frequency to start the intensity stereo processing in step S34, and is set to, for example, 6 kHz. 圧縮率が非常に低く、左右チャンネル信号の近似度が非常に低い場合には、強度ステレオ処理を行わないような周波数に設定することもできる。 Compression rate is very low, if the degree of approximation of the left and right channel signals is very low, it may be set to a frequency that does not perform intensity stereo processing. 【0042】このようなステップS4によれば、入力信号の特性によって強度ステレオ処理を行う周波数帯域を適応的に設定することよって強度ステレオ処理による定位の劣化が起こらず、圧縮効率の高い符号化を行うことができる。 [0042] According to such a step S4, it does not occur degradation of localization by I I intensity stereo processing to set a frequency band to perform intensity stereo processing by the characteristics of the input signal adaptively, the high compression efficiency coding It can be carried out. 【0043】図4は、本発明に係る第4の実施の形態におけるステップS5を示すフローチャートである。 [0043] Figure 4 is a flow chart illustrating the step S5 of the fourth embodiment according to the present invention. 【0044】同図に示すように、ステップS5は、sf As shown in the figure, step S5, sf
bとIS周波数限度を比較するスケールファクタバンド判定工程としてのステップS41と、ステップS41で比較したsfbとIS周波数限度を基に左右チャンネルの近似度を算出する近似度算出工程としてのステップS A scale factor band step S41 as determining step of comparing the b and IS frequency limit, step S as an approximation degree calculating step of calculating a degree of approximation of the left and right channels on the basis of sfb and IS frequency limit compared at step S41
42と、ステップS42で算出した近似度とあらかじめ設定された閾値との大小を比較する近似度判定処理工程としてのステップS43と、ステップS43からの入力信号を効率よく処理するモジュールの一つであり、2つのチャンネルの代わりに両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程としてのステップS46とを有している。 42, a step S43 as an approximation determination process step of comparing the magnitude of the predetermined threshold and the calculated degree of approximation in step S42, is one of the modules to handle efficiently input signals from step S43 , and a step S46 as the intensity stereo processing step of converting both channels connected energy directional information in place of the two channels. 【0045】次に、このステップS5の処理の流れについて説明する。 [0045] Next, the flow of the process in step S5. 【0046】まず、sfbを0(ゼロ)にセットする。 [0046] First, to set the sfb to 0 (zero).
ステップS41において強度ステレオ処理を行うsfb sfb performing intensity stereo processing in step S41
とIS周波数限度を比較し、強度ステレオ処理を行うs s, which is compared with IS frequency limit, perform the intensity stereo processing
fbがIS周波数限度より大きい場合(YESの場合) If fb is greater than the IS frequency limit (in the case of YES)
は、ステップS42に進む。 , The process proceeds to step S42. 強度ステレオ処理を行うs s to perform the intensity stereo processing
fbがIS周波数限度より小さい場合(NOの場合) If fb is less than the IS frequency limit (in the case of NO)
は、sfbを1上げ、ステップS41に戻る。 Returns the sfb 1 up, to step S41. ステップS42は、左右チャンネル信号の相互相関値や左右チャンネル信号の比の標準偏差を用いて近似度を算出する。 Step S42 calculates the degree of approximation by using the standard deviation of the ratio of the cross-correlation value and the left and right channel signals of the left and right channel signals. 【0047】次いで、ステップS43は、ステップS4 [0047] Next, step S43, step S4
2で算出された近似度とあらかじめ設定された閾値との比較を行い、近似度が前記あらかじめ設定された閾値よりも大きい場合、つまり左右チャンネル信号が似ている信号である場合(YESの場合)は、ステップS46に進み、強度ステレオ処理を行う。 It makes a comparison with a preset threshold value and the approximation degree calculated in 2, when the degree of approximation is the greater than the preset threshold, if that is a signal left and right channel signals are similar (the case of YES) , the process proceeds to step S46, performing the intensity stereo processing. 一方、近似度が前記あらかじめ設定された閾値よりも小さい場合、つまり左右チャンネル信号が非常に異なる場合(NOの場合)には、強度ステレオ処理をそのsfbでは行わない。 On the other hand, if the degree of approximation the less than a preset threshold value, that is, when the left and right channel signals are very different (in the case of NO), does not perform the intensity stereo processing in the sfb it is. 次に、sfbを1上げ、ステップS41に戻る。 Then, return to sfb 1 up, to step S41. 以上のステップをsfbの最大値まで繰り返す。 Repeating the above steps until a maximum value of the sfb. 【0048】このようなステップS5によれば、圧縮率が高く、多くのsfbで強度ステレオ処理を使用して圧縮効率を高めようと、強度ステレオ処理を開始するsf [0048] According to such a step S5, the compression ratio is high, the attempt to increase the compression efficiency using the intensity stereo processing for many sfb, sf starting the intensity stereo processing
bを下げた場合、強度ステレオ処理を行うsfbの中に定位の劣化をもたらすsfbにおいて強度ステレオ処理を行わないようにすることができる。 If lowering the b, it is possible not to perform the intensity stereo processing in sfb resulting in deterioration of the orientation in the sfb performing intensity stereo processing. そのため、ステップS5によれば、強度ステレオ処理による定位の劣化が生じず、また音質の影響の少ない高い周波数帯域においてより強度ステレオ処理を実行することができるようになるため、圧縮効率を高めることができる。 Therefore, according to step S5, without causing deterioration of localization by intensity stereo processing, also because it is possible to perform more intensity stereo processing in less high frequency band impact sound quality, to enhance the compression efficiency it can. 【0049】図5は、本発明に係る第5の実施の形態におけるステップS5を示すフローチャートである。 [0049] Figure 5 is a flow chart illustrating the step S5 in the fifth embodiment of the present invention. 【0050】同図に示すように、ステップS5は、上記ステップS41と、ステップS41で比較したsfbとIS周波数限度を基に判定閾値を算出する判定閾値算出工程としてのステップS51と、ステップS51で算出した判定閾値を基に左右チャンネルの近似度を算出する近似度算出工程としてのステップS52と、ステップS [0050] As shown in the figure, step S5, as in step S41, and step S51 as the determination threshold calculation step of calculating a determination threshold based on sfb and IS frequency limit compared at step S41, in step S51 and step S52 of the calculated determination threshold as an approximation degree calculating step of calculating a degree of approximation of the left and right channels on the basis of the step S
51で算出した判定閾値とステップS52で算出した近似度とを比較する近似度判定処理工程としてのステップS53と、ステップS5からの入力信号を効率よく処理するモジュールの一つであり、2つのチャンネルの代わりに両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程としてのステップS56とを有している。 And step S53 as an approximation determination process step of comparing the calculated degree of approximation by the determination threshold and the step S52 calculated in 51, is one of the modules to efficiently process the input signals from step S5, 2 single channel and a step S56 as the intensity stereo processing step of converting the coupled energy directional information for both channels instead of. 【0051】次に、このステップS5の処理の流れについて説明する。 [0051] Next, the flow of the process in step S5. 【0052】まずsfbを0にセットする。 [0052] First, to set the sfb to 0. ステップS Step S
41において強度ステレオ処理を行うsfbとIS周波数限度を比較し、強度ステレオ処理を行うsfbがIS The intensity stereo processing compares the sfb and IS frequency limit for performing at 41, sfb performing intensity stereo processing IS
周波数限度より大きい場合(YESの場合)は、ステップS51に進む。 When the frequency limit is larger than (in the case of YES), the process proceeds to step S51. 強度ステレオ処理を行うsfbがIS sfb is IS to perform the intensity stereo processing
周波数限度より小さい場合(NOの場合)は、sfbを1上げ、ステップS41に戻る。 (Case of NO) smaller when than the frequency limit, returns the sfb 1 up, to step S41. ステップS51は、音質の影響の少ない高周波数帯域については、強度ステレオ処理を行いやすくするように判定閾値を設定し、音質の影響の多い低周波数帯域については、強度ステレオ処理を制限するように判定閾値を設定する。 Step S51 is for small high frequency band affected by the quality, intensity and set the determination threshold to a stereo processing facilitate, for many low-frequency band affected by the quality determination to limit the intensity stereo processing to set the threshold. なお、この判定閾値を圧縮率の大小によって調整することもできる。 It is also possible to adjust the decision threshold depending on the magnitude of the compression ratio. 【0053】次に、ステップS52は、左右チャンネル信号の相互相関値や左右チャンネル信号の比の標準偏差を用いて近似度を算出する。 Next, step S52 calculates the degree of approximation by using the standard deviation of the ratio of the cross-correlation value and the left and right channel signals of the left and right channel signals. 次いで、ステップS53 Next, step S53
は、ステップS51で算出された判定閾値とステップS , The decision threshold and step S calculated in step S51
52で設定された近似度との比較を行い、各sfbにおいて近似度が判定閾値よりも大きい場合、つまり左右チャンネル信号が似ている信号である場合(YESの場合)は、ステップS56に進み、強度ステレオ処理を行う。 Makes a comparison between the approximation degree is set at 52, if the degree of approximation in each sfb is greater than the determination threshold value, if that is a signal left and right channel signals are similar (if YES), the process proceeds to step S56, performing the intensity stereo processing. 各sfbにおいて近似度が判定閾値よりも小さい場合、つまり左右チャンネル信号が非常に異なる場合(N If the degree of approximation in each sfb is smaller than the determination threshold value, that is, when the left and right channel signals have very different (N
Oの場合)には、強度ステレオ処理をそのsfbでは行わない。 In the case of O), does not perform the intensity stereo processing in the sfb it is. 続いて、sfbを1上げ、ステップS41に戻る。 Then, return the sfb 1 up, to step S41. 以上のステップをsfbの最大値まで繰り返す。 Repeating the above steps until a maximum value of the sfb. 【0054】このようなステップS5によれば、圧縮率が高く、多くのsfbで強度ステレオ処理を使用して圧縮効率を高めようと、強度ステレオ処理を開始するsf [0054] According to such a step S5, the compression ratio is high, the attempt to increase the compression efficiency using the intensity stereo processing for many sfb, sf starting the intensity stereo processing
bを下げた場合、強度ステレオ処理を行うsfbの中に定位の劣化をもたらすsfbが存在していても強度ステレオ処理を行わないようにすることができる。 If lowering the b, it is possible not to perform the intensity stereo processing be sfb result in deterioration of the orientation in the sfb performing intensity stereo processing is present. そのため、ステップS5によれば、強度ステレオ処理による定位の劣化が生じず、また音質の影響の少ない高い周波数帯域においてより強度ステレオ処理を実行することができるようになるため、圧縮効率を高めることができる。 Therefore, according to step S5, without causing deterioration of localization by intensity stereo processing, also because it is possible to perform more intensity stereo processing in less high frequency band impact sound quality, to enhance the compression efficiency it can. 【0055】以上、各実施の形態において説明したマルチチャンネルオーディオ信号符号化方法は、コンピュータなどに実行させることができるソフトウェアプログラムとして、例えば、磁気ディスク、光ディスク、半導体メモリなどのいかなる記録媒体でも、それに記録または格納する方法として実施することができる。 [0055] above, the multi-channel audio signal encoding method described in the embodiments, as a software program can be executed to the computer, for example, a magnetic disk, an optical disk, in any recording medium such as a semiconductor memory, it it can be implemented as a method of recording or storage. なお、磁気ディスクとしては、フロッピー(登録商標)ディスク、 As the magnetic disk, a floppy disk,
ハードディスク等があり、光ディスクとしては、CD― There is a hard disk or the like, as the optical disk, CD-
ROM、DVD等がある。 ROM, there is a DVD or the like. 【0056】また、各実施の形態において説明したマルチチャンネルオーディオ信号符号化方法を用いて、図示しないがマルチチャンネルオーディオ信号符号化装置は、入力信号を量子化、符号化しているので、上記各実施の形態におけるマルチチャンネルオーディオ信号符号化方法と同様の効果を得ることができる。 [0056] Further, by using a multi-channel audio signal encoding method described in the embodiments, although not illustrated multichannel audio signal encoding apparatus, quantizes the input signal, since the coding, the above-described exemplary the same effect as the multi-channel audio signal encoding method in the form of can be obtained. 【0057】さらに、図示しないが記録媒体は、各実施の形態において説明したマルチチャンネルオーディオ信号符号化方法のステップが記録されているので、上記各実施の形態におけるマルチチャンネルオーディオ信号符号化方法と同様の効果を得ることができる。 [0057] Furthermore, although not shown recording medium, since the step of the multi-channel audio signal encoding method described in the embodiments are recorded, similarly to the multi-channel audio signal encoding method in the above embodiments it is possible to obtain an effect. 【0058】しかも、図示しないが音楽配信システムは、この記録媒体を構成要素としているので、上記各実施の形態におけるマルチチャンネルオーディオ信号符号化方法と同様の効果を得ることができる。 [0058] Moreover, although not shown music distribution system, since the components of the recording medium, it is possible to obtain the same effect as the multi-channel audio signal encoding method in the above embodiments. また、音楽配信システムは、マルチチャンネルオーディオ信号符号化方法を用いて音楽が配信されているので、上記各実施の形態におけるマルチチャンネルオーディオ信号符号化方法と同様の効果を得ることができる。 Also, the music distribution system, since the music using a multi-channel audio signal encoding method has been delivered, it is possible to obtain a multi-channel audio signal encoding method the same effect as in the above embodiments. 【0059】上記各実施の形態では、図1〜図5のフローチャートを参照して、マルチチャンネルオーディオ信号符号化方法の処理の流れについて説明したが、以下、 [0059] In the above embodiments, with reference to the flowchart of FIGS. 1 to 5 have been described flow of processing multi-channel audio signal encoding method, hereinafter,
マルチチャンネルオーディオ信号符号化方法を用いるマルチチャンネルオーディオ信号符号化装置について、図面を参照しながら説明する。 For multi-channel audio signal encoding apparatus using a multi-channel audio signal encoding method will be described with reference to the drawings. 【0060】図6は、上述した第1の実施の形態におけるマルチチャンネルオーディオ信号符号化方法を用いるマルチチャンネルオーディオ信号符号化装置を示すブロック図である。 [0060] Figure 6 is a block diagram illustrating a multi-channel audio signal encoding apparatus using a multi-channel audio signal encoding method in the first embodiment described above. 【0061】同図に示すように、マルチチャンネルオーディオ信号符号化装置は、入力信号から聴覚心理モデルに基づく信号対マスク比の値を算出する聴覚心理分析手段1と、もう一方の時間領域の入力信号を周波数領域のスペクトルデータに変換する時間/周波数マッピング手段2と、量子化雑音の時間的な形状を制御するTNS処理手段3と、強度ステレオを開始する周波数を算出する強度ステレオ周波数限度算出手段4と、sfbごとに左右チャンネル信号の近似度に応じて強度ステレオ処理を行うか判定を行う帯域毎強度ステレオ判定手段5と、入力信号を効率よく処理するモジュールの一つであり、2 [0061] As shown in the figure, the multi-channel audio signal encoding apparatus includes a psychoacoustic analysis means 1 for calculating the value of the signal to mask ratio based on the psychoacoustic model from the input signal, the other input of the time domain a time / frequency mapping unit 2 for converting the signal into spectral data in the frequency domain, the TNS processing means 3 for controlling the temporal shape of the quantization noise, the intensity stereo frequency limit calculating means for calculating a frequency for starting the intensity stereo 4, a band for each intensity stereo determining means 5 for determining whether to intensity stereo processing in accordance with the degree of approximation of the left and right channel signals for each sfb, is one of the modules to efficiently process the input signals, 2
つのチャンネルの代わりに両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段6 Intensity stereo processing means 6 for converting the coupled energy directional information for both channels instead of One channel
と、左右チャンネル信号を和信号および差信号に変換する和差ステレオ処理手段7と、和差ステレオ処理手段7 When a sum and difference stereo processing means 7 for converting the left and right channel signals to the sum and difference signals, sum and difference stereo processing means 7
で施された入力信号を量子化、符号化する量子化/符号化手段8と、量子化/符号化手段8の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成手段10とを有している。 Quantizing applied input signal in, the quantization / encoding means 8 for coding, multiplexing and output control information of the quantization / encoding means 8, the bit stream generating forming means 10 for shaping as a bit stream have. 【0062】次に、このマルチチャンネルオーディオ信号符号化装置の動作について説明する。 Next, the operation of the multichannel audio signal encoding apparatus. 【0063】まず、入力信号は、聴覚心理分析手段1により聴覚心理モデルに基づく、信号対マスク比の値を算出する。 [0063] First, the input signal is based on a psychoacoustic model by psychoacoustic analysis means 1 to calculate the value of the signal-to-mask ratio. もう一方の入力信号は、時間/周波数マッピング手段2により、MDCT変換などの変換を用いて、時間領域から周波数領域のスペクトルデータに変換される。 The other input signal, the time / frequency mapping unit 2, by using a transformation such as MDCT transform is converted from the time domain to the spectral data in the frequency domain. 【0064】次に、TNS処理手段3は、変換されたスペクトルデータを基に量子化雑音の時間的な形状を制御する。 Next, TNS processing unit 3 controls the temporal shape of quantization noise on the converted spectral data. 次いで、強度ステレオ周波数限度算出手段4は、 Then, the intensity stereo frequency limit calculating means 4,
制御された形状を基に強度ステレオを開始する周波数であるIS周波数限度を算出する。 The controlled shape calculating the IS frequency limit which is a frequency for starting the intensity stereo based. 続いて、帯域毎強度ステレオ判定手段5は、IS周波数限度以上の周波数において、sfb毎に入力信号の左右チャンネル信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う。 Subsequently, the band each intensity stereo judging means 5, the IS frequency limit frequencies above, it is determined whether or not the intensity stereo processing in accordance with the degree of approximation of the left and right channel signals of the input signal for each sfb. 強度ステレオ処理手段6は、帯域毎強度ステレオ判定手段5において強度ステレオ処理を行うことができると判定されると強度ステレオ処理を行う。 Intensity stereo processing unit 6 performs intensity stereo processing if it is determined that it is possible to perform intensity stereo processing in the band each intensity stereo judging unit 5. 次に、和差ステレオ処理手段7は、左右チャンネル信号をそれぞれ和信号および差信号に変換する。 Then, sum and difference stereo processing unit 7 converts the left and right channels signals to the sum and difference signals. 次いで、量子化/符号化処理手段8は、和差ステレオ処理手段7で処理が施された入力信号を量子化、符号化する。 Then, the quantization / encoding means 8 quantizes the input signal processed by sum and difference stereo processing unit 7 encodes. ビットストリーム生成形成手段10は、量子化/符号化処理手段8の出力と制御情報を多重化し、ビットストリームとして整形する。 Bitstream generation forming unit 10 multiplexes and outputs the control information of the quantization / encoding means 8, for shaping as a bit stream. 【0065】このようなマルチチャンネルオーディオ信号符号化装置によれば、入力信号の特性および圧縮率によって、強度ステレオを開始する周波数を適応的に変動させ、また入力信号の特性および圧縮率によって、sf [0065] According to such a multi-channel audio signal encoding apparatus, the characteristics and the compression ratio of the input signal, a frequency for starting the intensity stereo adaptively varied, also depending on the characteristics and the compression ratio of the input signal, sf
b単位での実行/不実行を制御するので、強度ステレオ処理の欠点である定位感の劣化を最小とし、かつ高い圧縮効率を得ることができる。 And controls execution / non-execution in b units, and minimizing the deterioration of the drawbacks is that the localization of the intensity stereo processing, it is possible to obtain a high compression efficiency. 【0066】図7は、上述した第2の実施の形態におけるステップS4を用いる強度ステレオ周波数限度算出手段4を示すブロック図である。 [0066] Figure 7 is a block diagram showing an intensity stereo frequency limit calculating means 4 using the step S4 in the second embodiment described above. 【0067】同図に示すように、強度ステレオ周波数限度算出手段4は、ビットレートやサンプリング周波数などの符号化に必要な符号化モード情報を設定するための符号化モード情報手段21と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理手段22と、前記符号化モード情報より得られるビットレート、サンプリング周波数、チャンネル数等の情報より圧縮率を算出する圧縮率算出手段23と、 [0067] As shown in the figure, the intensity stereo frequency limit calculating means 4, the coding mode information means 21 for setting the coding mode information necessary for encoding such as bit rate, sampling frequency, the code of the intensity stereo pre-processing means 22 where the mode information from the intensity stereo is determined whether available compression for calculating the compression ratio from the encoding mode information from resulting bit rate, sampling frequency, number of channels, etc. information the rate calculation means 23,
圧縮率と所定の値との大小を比較した結果を出力する負荷判定手段24と、負荷判定手段24の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定手段25とを有している。 It includes a load determining means 24 for outputting a result of comparing the magnitude of the compression ratio and a predetermined value, the IS frequency limit setting means 25 for setting a frequency to start the intensity stereo processing the results of the load determiner 24 there. 【0068】次に、この強度ステレオ周波数限度算出手段4の動作について説明する。 Next, the operation of the intensity stereo frequency limit calculation unit 4. 【0069】強度ステレオ周波数限度算出手段4において、強度ステレオ処理は、左右チャンネルの符号化モードが違う場合には使用できないため、まず符号化モード情報手段21を用いて、強度ステレオが使用可能か否かの判定を行う。 [0069] In the intensity stereo frequency limit calculating means 4, the intensity stereo processing, since when the encoding mode of the left and right channels are different can not be used, first, with reference to the coding mode information unit 21, whether or not available intensity stereo perform the Kano judgment. 入力信号がモノラルなどの符号化モードが異なる場合には以降の動作は行われない。 Input signal operation after if the coding mode such as monaural different is not performed. 強度ステレオ処理が可能であると判定されると、圧縮率算出手段2 The intensity stereo processing is determined to be possible, the compression ratio calculating means 2
3は、符号化モード情報手段21より得られるビットレートとサンプリング周波数およびチャンネル数から例えば、下記の数式1に示す計算により圧縮率を算出する。 3, for example, from the bit rate and the sampling frequency and the number of channels obtained from the encoding mode information unit 21 calculates the compression ratio by calculation shown in Equation 1 below. 【数1】 [Number 1] 【0070】次に、負荷判定手段24は、圧縮率とあらかじめ設定した所定の値との大小比較を行う。 Next, load determination unit 24 performs the comparison between the predetermined value set in advance and the compression ratio. 圧縮率が所定の値よりも大きい場合、つまり圧縮率が高い場合には、IS周波数限度設定手段25は、強度ステレオ処理を開始する周波数を下げる。 If the compression ratio is larger than a predetermined value, that is, if the compression ratio is high, IS frequency limit setting means 25 lowers the frequency to start the intensity stereo processing. 逆に圧縮率が所定の値よりも小さい場合、つまり圧縮率が低い場合には、IS周波数限度設定手段25で、強度ステレオ処理を開始する周波数を上げる。 If conversely the compression rate is smaller than a predetermined value, that is, if the compression ratio is low, in the IS frequency limit setting means 25, the frequency is increased to initiate the intensity stereo processing. 【0071】このような強度ステレオ周波数限度算出手段4によれば、圧縮率が高い場合には、より広い周波数帯域で強度ステレオ処理を行うことにより、情報量の節約ができ、圧縮効率を高めることができる。 [0071] According to the intensity stereo frequency limit calculation unit 4, when the compression ratio is high, by performing the intensity stereo processing in a wider frequency band, can save the amount of information, to improve the compression efficiency can. また、強度ステレオ周波数限度算出手段4によれば、圧縮率が低い場合には、より狭い周波数帯域で強度ステレオ処理を行うことにより、強度ステレオ処理の欠点である定位の劣化を最小にすることができる。 Further, according to the intensity stereo frequency limit calculation unit 4, when the compression ratio is low, by performing the intensity stereo processing in a narrower frequency band, it is to minimize the degradation of the localization is a disadvantage of the intensity stereo processing it can. 【0072】図8は、上述した第3の実施の形態におけるステップS4を用いる強度ステレオ周波数限度算出手段4を示すブロック図である。 [0072] Figure 8 is a block diagram showing an intensity stereo frequency limit calculating means 4 using the step S4 in the third embodiment described above. 【0073】同図に示すように、強度ステレオ周波数限度算出手段4は、上記符号化モード情報手段21と、上記強度ステレオ前処理手段22と、上記圧縮率算出手段23と、圧縮率算出手段23で算出した圧縮率を基に判定閾値を算出する判定値算出手段31と、判定値算出手段31で算出した判定閾値を基に左右チャンネルの近似度を算出する近似度算出手段32と、判定閾値と圧縮率を比較した結果を出力する近似度判定処理手段33と、 [0073] As shown in the figure, the intensity stereo frequency limit calculating means 4, and the coding mode information means 21, and the intensity stereo pre-processing unit 22, and the compression ratio calculating unit 23, the compression ratio calculating means 23 in the judgment value calculating means 31 for calculating a determination threshold based on the calculated compression ratio, the approximation degree calculating section 32 for calculating a degree of approximation of the left and right channels on the basis of the determination threshold calculated by the judgment value calculation unit 31, the determination threshold value approximation degree determination unit 33 for outputting a result of comparing the compression ratio,
近似度判定処理手段33の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定手段25 It IS frequency limit setting means 25 for setting a frequency to start the intensity stereo processing the results of the approximation degree determination processing unit 33
とを有している。 And it has a door. 【0074】次に、この強度ステレオ周波数限度算出手段4の動作について説明する。 [0074] Next, the operation of the intensity stereo frequency limit calculation unit 4. 【0075】強度ステレオ周波数限度算出手段4において、強度ステレオ処理は、左右チャンネルの符号化モードが違う場合には使用できないため、まず符号化モード情報手段21を用いて、強度ステレオが使用可能か否かの判定を強度ステレオ前処理手段22において行う。 [0075] In the intensity stereo frequency limit calculating means 4, the intensity stereo processing, since when the encoding mode of the left and right channels are different can not be used, first, with reference to the coding mode information unit 21, whether or not available intensity stereo performing Kano determination in the intensity stereo pre-processing means 22. 入力信号がモノラルなどの符号化モードが異なる場合には以降の動作は行われない。 Input signal operation after if the coding mode such as monaural different is not performed. 強度ステレオ処理が可能であると判定されると、圧縮率算出手段23は、符号化モード情報手段21より得られるビットレートとサンプリング周波数およびチャンネル数から例えば、下記の(1) The intensity stereo processing is determined to be possible, the compression ratio calculating unit 23, the bit rate and sampling frequency and number of channels obtained from the encoding mode information means 21 for example, the following (1)
に示す計算により圧縮率を算出する。 Calculating a compression ratio by calculation shown in. 【数1】 [Number 1] 【0076】次に、判定閾値算出手段31は、圧縮率とあらかじめ設定した所定の値と大小を比較することにより判定閾値を算出する。 Next, the determination threshold calculation means 31 calculates a determination threshold by comparing the predetermined value and the magnitude of the preset compression ratio. 判定閾値は、圧縮率が高い場合には、強度ステレオ処理を行う周波数帯域を広くとれるような値をセットしておく。 Determination threshold, when the compression ratio is high, should be set the value that take a wide frequency band to perform intensity stereo processing. また、判定閾値は、圧縮率の大きさによって、数段階の閾値を設定することもできる。 The determination threshold, depending on the size of the compression ratio, it is also possible to set the threshold of the number of stages. 【0077】次いで、近似度算出手段32は、左右チャンネル信号の相互相関値や左右チャンネル信号の比の標準偏差を用いて近似度を算出する。 [0077] Then, the approximation degree calculating section 32 calculates the degree of approximation by using the standard deviation of the ratio of the cross-correlation value and the left and right channel signals of the left and right channel signals. 続いて、近似度判定処理手段33は、判定閾値算出手段31で算出された判定閾値と近似度算出手段32で算出された近似度の比較を行い、この近似度が判定閾値よりも大きい場合、つまり圧縮率が高く、左右チャンネル信号の近似度が高い場合には、IS周波数限度設定手段34においてより広い周波数で強度ステレオを行えるように強度ステレオ処理を開始する周波数を低く、例えば3kHzに設定する。 Subsequently, the approximation degree determination unit 33 compares the approximation degrees calculated and the determination threshold calculated by the determination threshold calculation means 31 in approximation degree calculating section 32, if the degree of approximation is greater than the determination threshold value, that high compression ratio, when the degree of approximation of the left and right channel signals is high, low frequency to start the intensity stereo processing to allow the intensity stereo wider frequency in iS frequency limit setting means 34 is set to, for example, 3kHz .
一方、近似度が判定閾値よりも小さい場合、つまり圧縮率が低く、左右チャンネル信号の近似度が低い場合には、IS周波数限度設定手段34において強度ステレオ処理を開始する周波数を高く、例えば6kHzに設定する。 On the other hand, if the approximation degree is smaller than the determination threshold value, i.e. the compression ratio is low and the low degree of approximation of the left and right channel signals, a high frequency to start the intensity stereo processing in IS frequency limit setting means 34, for example to 6kHz set to. 圧縮率が非常に低く、左右チャンネル信号の近似度が非常に低い場合には、強度ステレオ処理を行わないような周波数に設定することもできる。 Compression rate is very low, if the degree of approximation of the left and right channel signals is very low, it may be set to a frequency that does not perform intensity stereo processing. 【0078】このような強度ステレオ周波数限度算出手段4によれば、入力信号の特性によって強度ステレオ処理を行う周波数帯域を適応的に設定することよって強度ステレオ処理による定位の劣化が起こらず、圧縮効率の高い符号化を行うことができる。 [0078] According to the intensity stereo frequency limit calculating means 4, it does not occur degradation of localization by I I intensity stereo processing to set a frequency band to perform intensity stereo processing by the characteristics of the input signal adaptively, compression efficiency high coding can be performed. 【0079】図9は、上述した第4の実施の形態におけるステップS5を用いる帯域毎強度ステレオ判定手段5 [0079] Figure 9 is a band for each intensity stereo decision means 5 using the step S5 of the fourth embodiment described above
を示すブロック図である。 Is a block diagram showing the. 【0080】同図に示すように、帯域毎強度ステレオ判定手段5は、近似度算出手段32と、近似度算出手段3 [0080] As shown in the figure, the bandwidth for each intensity stereo judging means 5, the approximation degree calculating section 32, approximation degree calculating section 3
2で算出した近似度とあらかじめ設定された閾値との大小を比較する近似度判定処理手段43と、近似度判定処理手段43からの入力信号を効率よく処理するモジュールの一つであり、2つのチャンネルの代わりに両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段46とを有している。 Approximation degree determination means 43 compares the magnitude of the preset threshold value approximation degree calculated by 2, it is one of the modules to handle efficiently input signal from the approximation degree determination unit 43, the two and a strength stereo processing means 46 for converting the coupled energy directional information for both channels instead of the channel. 【0081】次に、この帯域毎強度ステレオ判定手段5 [0081] Next, this band intensity-per-stereo decision means 5
の動作について説明する。 Description will be given of the operation. 【0082】まず、近似度算出手段32において強度ステレオ処理を行うsfbで、左右チャンネル信号の相互相関値や左右チャンネル信号の比の標準偏差を用いて近似度を算出する。 [0082] First, at sfb performing intensity stereo processing in the approximation degree calculating section 32 calculates the degree of approximation by using the standard deviation of the ratio of the cross-correlation value and the left and right channel signals of the left and right channel signals. 次いで、近似度判定処理手段43は、 Then, the approximation degree determination means 43,
近似度算出手段32で算出された近似度と前記あらかじめ設定された閾値との比較をsfb毎に行い、近似度が前記あらかじめ設定された閾値よりも大きい場合、つまり左右チャンネル信号が似ている信号である場合は、強度ステレオ許可フラグをそのsfbに立てる。 Performs the approximation degree calculated in approximation degree calculating section 32 compares with the preset threshold for each sfb, when the degree of approximation is the greater than the preset threshold, i.e. the signal left and right channel signals are similar If it is, it makes a strength stereo permission flag in the sfb. 【0083】一方、近似度が前記あらかじめ設定された閾値よりも小さい場合、つまり左右チャンネル信号が非常に異なる場合には、強度ステレオ許可フラグをそのs [0083] On the other hand, if the degree of approximation the less than a preset threshold value, that is, if the left and right channel signals are very different, the s intensity stereo permission flag
fbには立てない。 Not stand in the fb. 強度ステレオ処理手段46は、近似度判定処理手段43において強度ステレオ許可フラグが立っているsfbで強度ステレオ処理を行う。 Intensity stereo processing unit 46 performs intensity stereo processing with sfb intensity stereo permission flag is set in the similarity determination processing unit 43. 【0084】このような帯域毎強度ステレオ判定手段5 [0084] Such a band intensity-per-stereo decision means 5
によれば、圧縮率が高く、多くのsfbで強度ステレオ処理を使用して圧縮効率を高めようと、強度ステレオ処理を開始するsfbを下げた場合、強度ステレオ処理を行うsfbの中に定位の劣化をもたらすsfbにおいて強度ステレオ処理を行わないようにすることができる。 According to the compression ratio is high, the attempt to increase the compression efficiency using the intensity stereo processing for many sfb, when lowered sfb for starting the intensity stereo processing, the localization in the sfb performing intensity stereo processing it is possible not to perform intensity stereo processing in sfb bring deterioration.
そのため、帯域毎強度ステレオ判定手段5によれば、強度ステレオ処理による定位の劣化が起こらず、かつ圧縮効率を高めることができる。 Therefore, according to the band each intensity stereo judging means 5, does not occur degradation of localization by intensity stereo processing, and it is possible to increase the compression efficiency. 【0085】図10は、上述した第5の実施の形態におけるステップS5を用いる帯域毎強度ステレオ判定手段5を示すブロック図である。 [0085] Figure 10 is a block diagram illustrating a band for each intensity stereo decision means 5 using the step S5 in the fifth embodiment described above. 【0086】同図に示すように、帯域毎強度ステレオ判定手段5は、sfbとIS周波数限度を基に判定閾値を算出する判定閾値算出手段51と、判定閾値算出手段5 [0086] As shown in the figure, the bandwidth for each intensity stereo judging means 5, and the determination threshold calculation means 51 for calculating a determination threshold based on sfb and IS frequency limit determination threshold calculation means 5
1で算出した左右チャンネル信号の近似度を算出する近似度算出手段52、判定閾値算出手段51で算出した判定閾値と近似度算出手段52で算出した近似度とを比較する近似度判定処理手段53と、近似度判定処理手段5 Approximation degree calculating section 52 for calculating a degree of approximation calculated left and right channels signals 1, approximation is compared with the approximation degree calculated a determination threshold calculated by the determination threshold calculation means 51 in approximation degree calculating section 52 determination processing means 53 and, the degree of approximation determination processing unit 5
3からの入力信号を効率よく処理するモジュールの一つであり、2つのチャンネルの代わりに両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段56とを有している。 It is one of the modules to efficiently process the input signals from the three, and a strength stereo processing means 56 for converting into both channels connected energy directional information in place of the two channels. 【0087】次に、この帯域毎強度ステレオ判定手段5 [0087] Next, this band intensity-per-stereo decision means 5
の動作について説明する。 Description will be given of the operation. 【0088】まず、判定閾値算出手段51において、音質の影響の少ない高周波数帯域については、強度ステレオ処理を行いやすくするように判定閾値を設定し、音質の影響の多い低周波数帯域については、強度ステレオ処理を制限するように判定閾値を設定する。 [0088] First, the determination threshold value calculation unit 51, for a small high frequency band influence sound quality, sets the determination threshold to facilitate the intensity stereo processing for many low frequency band affected by the sound quality, strength It sets a determination threshold value to limit stereo processing. なお、この判定閾値を圧縮率の大小によって調整することもできる。 It is also possible to adjust the decision threshold depending on the magnitude of the compression ratio. 【0089】次に、近似度算出手段52で強度ステレオ処理を行うsfbにおいて、左右チャンネル信号の相互相関値や左右チャンネル信号の比の標準偏差を用いて近似度を算出する。 [0089] Next, in sfb performing intensity stereo processing with approximation degree calculating section 52 calculates the degree of approximation by using the standard deviation of the ratio of the cross-correlation value and the left and right channel signals of the left and right channel signals. 次いで、近似度判定処理手段53は、 Then, the approximation degree determination means 53,
判定閾値算出手段51で算出された判定閾値と近似度算出手段52で算出した近似度との比較をsfb毎に行い、各sfbにおいて近似度が判定閾値よりも大きい場合、つまり左右チャンネル信号が似ている信号である場合は、強度ステレオ許可フラグをそのsfbに立てる。 It compares the calculated similarity and the determination threshold value calculated by the determination threshold calculation means 51 in approximation degree calculating section 52 for each sfb, when the degree of approximation in each sfb is greater than the determination threshold value, that is, the left and right channel signals similar If it is to have signals, it sets the intensity stereo permission flag to the sfb.
各sfbにおいて近似度が判定閾値よりも小さい場合、 If the degree of approximation in each sfb is smaller than the determination threshold value,
つまり左右チャンネル信号が非常に異なる場合には、強度ステレオ許可フラグをそのsfbに立てない。 That is, if the left and right channel signals have very different, not make the intensity stereo permission flag to the sfb. 強度ステレオ処理手段56は、近似度判定処理手段53で強度ステレオ許可フラグが立っているsfbにおいて、強度ステレオ処理を行う。 Intensity stereo processing means 56, in sfb strength stereo permission flag in the approximation degree determination unit 53 is set, performs intensity stereo processing. 【0090】このような帯域毎強度ステレオ判定手段5 [0090] Such a band intensity-per-stereo decision means 5
によれば、圧縮率が高く、多くのsfbで強度ステレオ処理を使用して圧縮効率を高めようと、強度ステレオ処理を開始するsfbを下げた場合、強度ステレオ処理を行うsfbの中に定位の劣化をもたらすsfbが存在していても強度ステレオ処理を行わないようにすることができる。 According to the compression ratio is high, the attempt to increase the compression efficiency using the intensity stereo processing for many sfb, when lowered sfb for starting the intensity stereo processing, the localization in the sfb performing intensity stereo processing even sfb result in degradation is present can be prevented to perform intensity stereo processing. そのため、帯域毎強度ステレオ判定手段5によれば、強度ステレオ処理による定位の劣化が生じず、また音質の影響の少ない高い周波数帯域においてより強度ステレオ処理を実行することができるようになるため、 Therefore, according to the band each intensity stereo judging unit 5 causes no degradation of localization by intensity stereo processing, also because it is possible to perform more intensity stereo processing in less high frequency band impact sound quality,
圧縮効率を高めることができる。 It is possible to increase the compression efficiency. 【0091】図示しないが音響配信システムは、上記各実施の形態において説明したマルチチャンネルオーディオ信号符号化装置、記録媒体を構成要素としているので、上記各実施の形態におけるマルチチャンネルオーディオ信号符号化装置と同様の効果を得ることができる。 [0091] Although not shown sound distribution system, a multi-channel audio signal encoding apparatus described in the above embodiments, since the components of the recording medium, and a multi-channel audio signal encoding apparatus in the foregoing embodiments it is possible to obtain the same effect. 【0092】 【発明の効果】以上説明したように、本発明は入力信号を基に信号対マスク比の値を算出する聴覚心理分析工程と、もう一方の前記入力信号をスペクトルデータに変換する時間・周波数マッピング工程と、変換された前記スペクトルデータを基に形状を制御するTNS処理工程と、制御された前記形状を基に周波数を算出する強度ステレオ周波数限度算出工程と、スケールファクタバンドごとに左チャンネルと右チャンネルの前記入力信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う帯域毎強度ステレオ判定工程と、前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程と、前記チャンネルの前記入力信号を [0092] As has been described in the foregoing, the present invention provides a psychoacoustic analyzing step of calculating the value of the signal to mask ratio based on the input signal, the time for converting the other of said input signal into spectral data - a frequency mapping step, a TNS processing step of controlling a shape based on the converted the spectral data, the intensity stereo frequency limit calculating step of calculating a frequency based on a controlled said shape, left for each scale factor band a band for each intensity stereo determination step which determines whether performing the intensity stereo processing in accordance with the degree of approximation and right channel the input signal is one of a module for processing the input signal, the two and intensity stereo processing step of converting a channel connecting the energy and directional information for both channels, the input signal of the channel それぞれの和および差となる信号に変換する和差ステレオ処理工程と、和差ステレオ処理工程で施された前記入力信号を量子化、符号化する量子化・符号化工程と、この量子化・符号化工程の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成工程とを備え、前記強度ステレオ周波数限度算出工程が、前記聴覚心理分析工程から算出された前記値とTNS処理工程から制御された前記形状とを処理する工程を有し、かつ前記帯域毎強度ステレオ判定工程が、 And each of the sum and difference become sum and difference stereo processing step of converting the signal, quantizing the input signal subjected in sum and difference stereo processing step, the quantization and encoding step of encoding, the quantization and coding and output control information of step multiplexes, and a bitstream generation forming step of shaping as a bit stream, the intensity stereo frequency limit calculating step, from the aural the value calculated from psychoanalysis process and TNS processing step and a step of treating a controlled the shape and the bandwidth for each intensity stereo determination step,
前記聴覚心理分析工程から算出された前記値と前記強度ステレオ周波数限度算出工程から算出された前記周波数とを判断する工程を有したことにより、入力信号の特性および圧縮率によってIS周波数限度およびスケールファクタバンド単位での実行/不実行を制御することで定位感の劣化を最小とし、かつ高い圧縮効率を得ることができるというすぐれた効果を有するマルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システムを提供することができるものである。 By having a step of determining said frequency calculated from the intensity stereo frequency limit calculation step and the value calculated from the psychoacoustic analysis process, it IS frequency limit depending on the characteristics and the compression ratio of the input signal and the scale factor multichannel audio signal encoding method having excellent effect that degradation of localization by controlling the execution / non-execution of each band is minimized, it is possible to obtain a high compression efficiency, multi-channel audio signal coding device, in which it is possible to provide a recording medium and the music distribution system.

【図面の簡単な説明】 【図1】本発明に係る第1の実施の形態におけるマルチチャンネルオーディオ信号符号化方法を示すフローチャート【図2】本発明に係る第2の実施の形態におけるステップS4を示すフローチャート【図3】本発明に係る第3の実施の形態におけるステップS4を示すフローチャート【図4】本発明に係る第4の実施の形態におけるステップS5を示すフローチャート【図5】本発明に係る第5の実施の形態におけるステップS5を示すフローチャート【図6】第1の実施の形態におけるマルチチャンネルオーディオ信号符号化方法を用いるマルチチャンネルオーディオ信号符号化装置を示すブロック図【図7】第2の実施の形態におけるステップS4を用いる強度ステレオ周波数限度算出手段4を示すブロック図【 The step S4 in the second embodiment according to the flow chart FIG. 2 the invention showing a multi-channel audio signal encoding method in the first embodiment according to the BRIEF DESCRIPTION OF THE DRAWINGS [Figure 1] The present invention according to the flow chart Figure 5 the invention showing a step S5 of the fourth embodiment according to the flowchart FIG. 4 the invention showing a step S4 of the third embodiment according to the flow chart Figure 3 the invention shown block diagram of a multichannel audio signal encoding apparatus using a multi-channel audio signal encoding method in the fifth flowchart 6 showing a step S5 in the embodiment of the first embodiment [Fig. 7] of the second block diagram illustrating the intensity stereo frequency limit calculating means 4 using the step S4 in the embodiment [ 図8】第3の実施の形態におけるステップS4を用いる強度ステレオ周波数限度算出手段4を示すブロック図【図9】第4の実施の形態におけるステップS5を用いる帯域毎強度ステレオ判定手段5を示すブロック図【図10】上述した第5の実施の形態におけるステップS5を用いる帯域毎強度ステレオ判定手段5を示すブロック図【図11】従来のオーディオ信号符号化方法を示すブロック図【図12】従来の強度ステレオ処理を示すフローチャート【符号の説明】 S1 聴覚心理分析(聴覚心理分析工程) S2 時間/周波数マッピング(時間/周波数マッピング工程) S3 TNS処理(TNS処理工程) S4 強度ステレオ周波数限度算出(強度ステレオ周波数限度算出工程) S5 帯域毎強度ステレオ判定(帯域毎強度ステレオ判定 Figure 8 is a block showing a band for each intensity stereo decision means 5 using the step S5 of the third block diagram showing the intensity stereo frequency limit calculating means 4 using the step S4 in the embodiment 9 the fourth embodiment Figure 10 is a block diagram showing a fifth block diagram showing a band for each intensity stereo decision means 5 using the step S5 in the embodiment of Figure 11 conventional audio signal encoding method described above [12] of the conventional flowchart illustrating the intensity stereo processing [description of Reference numerals] S1 psychoacoustic analysis (psychoacoustic analyzing step) S2 h / frequency mapping (time / frequency mapping step) S3 TNS processing (TNS processing step) S4 intensity stereo frequency limit calculated (intensity stereo frequency limit calculation step) S5 band each intensity stereo determination (band every intensity stereo determination 工程) S6 強度ステレオ処理(強度ステレオ処理工程) S7 和差ステレオ処理(和差ステレオ処理工程) S8 量子化/符号化(量子化/符号化工程) S10 ビットストリーム生成形成(ビットストリーム生成形成工程) Step) S6 intensity stereo processing (intensity stereo processing step) S7 sum and difference stereo processing (sum and difference stereo processing step) S8 quantization / coding (quantization / encoding step) S10 the bit stream generator formed (the bit stream generator forming step)

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 入力信号を基に信号対マスク比の値を算出する聴覚心理分析工程と、もう一方の前記入力信号をスペクトルデータに変換する時間・周波数マッピング工程と、変換された前記スペクトルデータを基に形状を制御するTNS処理工程と、制御された前記形状を基に周波数を算出する強度ステレオ周波数限度算出工程と、スケールファクタバンドごとに左チャンネルと右チャンネルの前記入力信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う帯域毎強度ステレオ判定工程と、前記入力信号を処理するモジュールの一つであり、 A psychoacoustic analyzing step of calculating the value of the Claims 1] signal to mask ratio based on the input signal, and time-frequency mapping step of converting the other of said input signal into spectral data, and TNS processing step of controlling a shape based on the converted the spectral data, the intensity stereo frequency limit calculating step of calculating a frequency based on controlled the shape, the left and right channels for each scale factor band a band for each intensity stereo determination step it is determined whether or not performing the intensity stereo processing in accordance with the degree of approximation of the input signal is one of a module for processing the input signal,
    前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程と、前記チャンネルの前記入力信号をそれぞれの和および差となる信号に変換する和差ステレオ処理工程と、和差ステレオ処理工程で施された前記入力信号を量子化、符号化する量子化・符号化工程と、この量子化・符号化工程の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成工程とを備え、前記強度ステレオ周波数限度算出工程が、前記聴覚心理分析工程から算出された前記値とTNS処理工程から制御された前記形状とを処理する工程を有し、かつ前記帯域毎強度ステレオ判定工程が、前記聴覚心理分析工程から算出された前記値と前記強度ステレオ周波数限度算出工程から算出された前記 And intensity stereo processing step of converting the coupled energy directional information of both channels of the two channels, the sum and difference stereo processing step of converting said input signal of said channel to each of the sum and difference signal which becomes, sum and difference quantizing the input signal subjected to a stereo processing step, the quantization and encoding step of encoding, the bit stream generator forming the output control information of the quantization and encoding step are multiplexed, shaping as a bit stream and a step, the intensity stereo frequency limit calculation step has a step of treating said shape which is controlled from the value and TNS processing steps calculated from the psychoacoustic analysis process, and the band each intensity stereo determination step, said calculated from said value calculated from the psychoacoustic analyzing step said intensity stereo frequency limit calculation step 波数とを判断する工程を有したことを特徴とするマルチチャンネルオーディオ信号符号化方法。 Multichannel audio signal encoding method characterized by having a step of determining a wavenumber. 【請求項2】 符号化に必要な符号化モード情報を設定するための符号化モード情報工程と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理工程と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出工程と、前記圧縮率と所定の値との大小を比較した結果を出力する負荷判定工程と、この負荷判定工程の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定工程とを備えた前記強度ステレオ周波数限度算出工程であって、前記負荷判定工程が前記圧縮率を高いと判断したときには、前記IS周波数限度設定工程がより広い周波数帯域で強度ステレオ処理を行う手段を有し、かつ前記負荷判定工程が前記圧縮率を低いと判断したときには、前記IS周波数 Wherein the coding mode information step for setting a coding mode information required for encoding, the intensity stereo from the encoding mode information and enables whether intensity stereo pre-processing step of performing determination using the compression ratio calculation step of calculating from the compression ratio information obtained from the encoding mode information, the load determination step of outputting a result of comparing the magnitude of said compression ratio and a predetermined value, the result of this load determination step a said intensity stereo frequency limit calculation step and a iS frequency limit setting step of setting a frequency for starting the stronger stereo processing, when the load determination process is determined to be high the compression ratio, the iS frequency limit and means for setting step performs intensity stereo processing in a wider frequency band, and when said load determination step determines that lower the compression ratio, the iS frequency 限度設定工程がより狭い周波数帯域で強度ステレオ処理を行う手段を有したことを特徴とする請求項1に記載のマルチチャンネルオーディオ信号符号化方法。 Multichannel audio signal encoding method according to claim 1, characterized in that limit setting step had the means for performing the intensity stereo processing in a narrower frequency band. 【請求項3】 符号化に必要な符号化モード情報を設定するための符号化モード情報工程と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理工程と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出工程と、この圧縮率算出工程で算出した前記圧縮率を基に判定閾値を算出する判定閾値算出工程と、判定閾値算出工程で算出した前記判定閾値を基に左チャンネルと右チャンネルの近似度を算出する近似度算出工程と、前記判定閾値と前記圧縮率を比較した結果を出力する近似度判定処理工程と、この近似度判定処理工程の結果より周波数を設定するIS周波数限度設定工程とを備えた前記強度ステレオ周波数限度算出工程であって、前記近似度判定処理工程が前記判定閾値よ 3. A coding mode information step for setting a coding mode information required for encoding, the intensity stereo from the encoding mode information and enables whether intensity stereo pre-processing step of performing determination using , a compression ratio calculating step of calculating a compression ratio from the information obtained from the encoding mode information, and determination threshold value calculation step of calculating a determination threshold based on the compression rate calculated in the compression ratio calculation step, the determination threshold value calculation a similarity calculation step of calculating an approximation of the left channel and right channel based on the determination threshold value calculated in step, an approximate determination process step of outputting a result of comparison the compression rate and the determination threshold value, the approximation a said intensity stereo frequency limit calculation step and a iS frequency limit setting step of setting a frequency from the results of the degrees determination processing step, the approximate determination process step is the determination threshold value り前記近似度を高いと判断したときには、前記IS周波数限度設定工程がより広い周波数帯域で強度ステレオ処理を行う工程を有し、かつ前記近似度判定処理工程が前記近似度を低いと判断したときには、前記IS周波数限度設定工程がより狭い周波数帯域で強度ステレオ処理を行う手段を有したことを特徴とする請求項1に記載のマルチチャンネルオーディオ信号符号化方法。 Ri when it is determined that higher the degree of approximation, and a step of the IS frequency limit setting step performs intensity stereo processing in a wider frequency band, and when the approximation degree determination step determines that lower the degree of approximation , multi-channel audio signal encoding method according to claim 1, wherein the iS frequency limit setting step had the means for performing the intensity stereo processing in a narrower frequency band. 【請求項4】 前記スケールファクタバンドとIS周波数限度を比較するスケールファクタバンド判定工程と、 4. A scale factor band determination step of comparing the scale factor band and IS frequency limit,
    このスケールファクタバンド判定工程で比較した前記スケールファクタバンドと前記IS周波数限度を基に左チャンネルと右チャンネルの近似度を算出する近似度算出工程と、近似度算出工程で算出した近似度とあらかじめ設定された閾値との大小を比較する近似度判定処理工程と、近似度判定処理工程からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程とを備えた前記帯域毎強度ステレオ判定工程であって、前記近似度判定処理工程が前記近似度を高いと判断したときには、前記強度ステレオ処理工程が強度ステレオ処理を行う工程を有し、かつ前記近似度判定処理工程が前記近似度を低いと判断したときには、前記強度ステレ Preset the approximation degree calculating step of calculating an approximation of the left channel and right channel based on the IS frequency limit and the scale factor band in comparison with the scale factor band determination step, the approximation degree calculated by the approximation degree calculating step an approximate determination process step of comparing the magnitude of the threshold is one of a module for processing the input signal from the similarity determination process, coupled energy directional information of both channels of the two channels a said zone each intensity stereo determination step that includes a strength stereo processing step of converting into, when the approximation degree determination process is determined to be high the degree of approximation, the intensity stereo processing step performs intensity stereo processing and a step, and when the approximation degree determination step determines that lower the degree of approximation, the intensity stereo 処理を行わないで前記スケールファクタバンド判定工程に戻る工程を有したことを特徴とする請求項1に記載のマルチチャンネルオーディオ信号符号化方法。 Multichannel audio signal encoding method according to claim 1, characterized in that comprising the step of returning to the scale factor band determination step without performing the process. 【請求項5】 前記スケールファクタバンドとIS周波数限度を比較するスケールファクタバンド判定工程と、 A scale factor band determination step of wherein comparing the scale factor band and IS frequency limit,
    このスケールファクタバンド判定工程で比較した前記スケールファクタバンドと前記IS周波数限度を基に判定閾値を算出する判定閾値算出工程と、この判定閾値算出工程で算出した前記判定閾値を基に左右チャンネルの近似度を算出する近似度算出工程と、前記判定閾値算出工程で算出した前記判定閾値と前記近似度算出工程で算出した前記近似度とを比較する近似度判定処理工程と、近似度判定処理工程からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理工程とを備えた前記帯域毎強度ステレオ判定工程であって、前記近似度判定処理工程が前記判定閾値より近似度が高いと判断したときには、前記強度ステレオ処理工程が強度ス A determination threshold value calculation step of calculating a determination threshold based on the IS frequency limit and the scale factor band in comparison with the scale factor band determination step, the approximation of the left and right channels on the basis of the determination threshold calculated by the determination threshold value calculation step a similarity calculation step of calculating a degree, the approximation degree determination process of comparing the approximation degree calculated by the determination threshold and the approximation degree calculating step calculated by the determination threshold calculation step, the approximation degree determination process the is one of the modules for processing the input signals, a said zone each intensity stereo determination step that includes a strength stereo processing step of converting the coupled energy directional information of both channels of the two channel, when the approximation degree determination process is determined to have a high degree of approximation than the determination threshold, the intensity stereo processing step has strength scan レオ処理を行う工程を有し、かつ前記近似度判定処理工程が前記近似度を低いと判断したときには、前記強度ステレオ処理工程が強度ステレオ処理を行わないで前記スケールファクタバンド判定工程に戻る工程を有したことを特徴とする請求項1に記載のマルチチャンネルオーディオ信号符号化方法。 And a step of performing Leo processing, and when the approximation degree determination step determines that lower the degree of approximation, the process returns to the scale factor band determination step is the intensity stereo processing step does not perform intensity stereo processing multichannel audio signal encoding method according to claim 1, characterized in that it had. 【請求項6】 入力信号を基に信号対マスク比の値を算出する聴覚心理分析手段と、もう一方の前記入力信号をスペクトルデータに変換する時間・周波数マッピング手段と、変換された前記スペクトルデータを基に形状を制御するTNS処理手段と、制御された前記形状を基に周波数を算出する強度ステレオ周波数限度算出手段と、スケールファクタバンドごとに左チャンネルと右チャンネルの前記入力信号の近似度に応じて強度ステレオ処理を行うか否かの判定を行う帯域毎強度ステレオ判定手段と、前記入力信号を処理するモジュールの一つであり、 6. A psychoacoustic analyzing means for calculating the value of the signal to mask ratio based on the input signal, and time-frequency mapping means for converting the other of the input signal to the spectral data, it converted the spectral data and TNS processing means for controlling the shape based on the intensity stereo frequency limit calculating means for calculating a frequency based on controlled the shape, the degree of approximation of the input signal of the left and right channels for each scale factor band depending the band each intensity stereo determining means it is determined whether or not performing the intensity stereo processing is one of the modules for processing the input signal,
    前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段と、前記チャンネルの前記入力信号をそれぞれの和および差となる信号に変換する和差ステレオ処理手段と、和差ステレオ処理手段で施された前記入力信号を量子化、符号化する量子化・符号化手段と、この量子化・符号化手段の出力と制御情報を多重化し、ビットストリームとして整形するビットストリーム生成形成手段とを備え、前記強度ステレオ周波数限度算出手段が、前記聴覚心理分析手段から算出された前記値とTNS処理手段から制御された前記形状とを処理する手段を有し、かつ前記帯域毎強度ステレオ判定手段が、前記聴覚心理分析手段から算出された前記値と前記強度ステレオ周波数限度算出手段から算出された前記 And intensity stereo processing means for converting the two channels connecting the energy and directional information for both channels, and sum and difference stereo processing means for converting the input signal of said channel to each of the sum and difference signal which becomes, sum and difference quantizing the input signal subjected to a stereo processing unit, and a quantization and coding means for coding, a bit stream generation form the output control information of the quantization and encoding means multiplexes, shaping as a bit stream and means, the intensity stereo frequency limit calculating means has means for processing and controlled the shape from said values ​​and the TNS processing means calculated from the psychoacoustic analysis means, and the band each intensity stereo determining means, said calculated from the intensity stereo frequency limit calculating means and the value calculated from the psychoacoustic analysis means 波数とを判断する手段を有したことを特徴とするマルチチャンネルオーディオ信号符号化装置。 Multichannel audio signal encoding apparatus characterized by having means for determining the wave number. 【請求項7】 符号化に必要な符号化モード情報を設定するための符号化モード情報手段と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理手段と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出手段と、前記圧縮率と所定の値との大小を比較した結果を出力する負荷判定手段と、この負荷判定手段の結果より強度ステレオ処理を開始する周波数を設定するIS周波数限度設定手段とを備えた前記強度ステレオ周波数限度算出手段であって、前記負荷判定手段が前記圧縮率を高いと判断したときには、前記IS周波数限度設定手段がより広い周波数帯域で強度ステレオ処理を行う手段を有し、かつ前記負荷判定手段が前記圧縮率を低いと判断したときには、前記IS周波数 And the coding mode information means for setting a coding mode information required to 7. A coding, and strength stereo pre-processing means for determining the intensity stereo from the encoding mode information of whether available , a compression ratio calculating means for calculating a compression ratio from the information obtained from the encoding mode information, and load determination means for outputting a result of comparing the magnitude of said compression ratio and a predetermined value, the result of this load determiner a said intensity stereo frequency limit calculating means and a iS frequency limit setting means for setting a frequency to start stronger stereo processing, when the load determining means determines that high the compression ratio, the iS frequency limit setting means includes means for performing intensity stereo processing in a wider frequency band, and wherein when the load determining means determines that lower the compression ratio, the iS frequency 限度設定手段がより狭い周波数帯域で強度ステレオ処理を行う手段を有したことを特徴とする請求項6に記載のマルチチャンネルオーディオ信号符号化装置。 Multichannel audio signal encoding apparatus according to claim 6, wherein a limit setting means having means for performing intensity stereo processing in a narrower frequency band. 【請求項8】 符号化に必要な符号化モード情報を設定するための符号化モード情報手段と、前記符号化モード情報より強度ステレオが使用可能か否かの判定を行う強度ステレオ前処理手段と、前記符号化モード情報より得られる情報より圧縮率を算出する圧縮率算出手段と、この圧縮率算出手段で算出した前記圧縮率を基に判定閾値を算出する判定閾値算出手段と、判定閾値算出手段で算出した前記判定閾値を基に左チャンネルと右チャンネルの近似度を算出する近似度算出手段と、前記判定閾値と前記圧縮率を比較した結果を出力する近似度判定処理手段と、この近似度判定処理手段の結果より周波数を設定するIS周波数限度設定手段とを備えた前記強度ステレオ周波数限度算出手段であって、前記近似度判定処理手段が前記判定閾値よ And the coding mode information means for setting a coding mode information necessary to 8. coding, and strength stereo pre-processing means for determining the intensity stereo from the encoding mode information of whether available , a compression ratio calculating means for calculating a compression ratio from the information obtained from the encoding mode information, and determination threshold calculation means for calculating a determination threshold based on the compression rate calculated in the compression ratio calculation means, determination threshold calculated and approximation calculation means for calculating the approximation degree of the left and right channels on the basis of the determination threshold calculated by the means and the approximation degree determination processing means for outputting a result of comparison the compression rate and the determination threshold value, the approximation a said intensity stereo frequency limit calculating means and a iS frequency limit setting means for setting a frequency from the results of the degrees determination processing unit, wherein the approximation degree determination means the determination threshold value り前記近似度を高いと判断したときには、前記IS周波数限度設定手段がより広い周波数帯域で強度ステレオ処理を行う手段を有し、かつ前記近似度判定処理手段が前記近似度を低いと判断したときには、前記IS周波数限度設定手段がより狭い周波数帯域で強度ステレオ処理を行う手段を有したことを特徴とする請求項6に記載のマルチチャンネルオーディオ信号符号化装置。 Ri when it is determined that higher the degree of approximation, have a means for the IS frequency limit setting means performs intensity stereo processing in a wider frequency band, and when the approximation degree determination means determines that lower the degree of approximation , multi-channel audio signal encoding apparatus according to claim 6, wherein the iS frequency limit setting means is comprising means for performing intensity stereo processing in a narrower frequency band. 【請求項9】 前記スケールファクタバンドとIS周波数限度を基に左チャンネルと右チャンネルの近似度を算出する近似度算出手段と、近似度算出手段で算出した近似度とあらかじめ設定された閾値との大小を比較する近似度判定処理手段と、近似度判定処理手段からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段とを備えた前記帯域毎強度ステレオ判定手段であって、前記近似度判定処理手段が前記近似度を高いと判断したときには、前記強度ステレオ処理手段が強度ステレオ処理を行う手段を有し、かつ前記近似度判定処理手段が前記近似度を低いと判断したときには、前記強度ステレオ処理を行わないで前記スケールファク 9. of the scale factor band with IS and approximation calculation means for calculating the approximation degree of the left and right channels on the basis of the frequency limits, preset threshold value approximation degree calculated by the approximation degree calculating section an approximate determination processing means for comparing the magnitudes, it is one of the modules for processing the input signal from the approximation degree determination unit, the intensity stereo to convert the two channels connecting the energy and directional information for both channels a said zone each intensity stereo judging means and processing means, when the approximation degree determination means determines that high the degree of approximation, have a means for the intensity stereo processing means performs intensity stereo processing, the scale factory and when the approximation degree determination means determines that lower the degree of approximation, without performing the intensity stereo processing タバンド判定手段に戻る手段を有したことを特徴とする請求項6に記載のマルチチャンネルオーディオ信号符号化装置。 Multichannel audio signal encoding apparatus according to claim 6, characterized in that it comprises means for returning to Tabando determining means. 【請求項10】 前記スケールファクタバンドとIS周波数限度を基に判定閾値を算出する判定閾値算出手段と、この判定閾値算出手段で算出した前記判定閾値を基に左右チャンネルの近似度を算出する近似度算出手段と、前記判定閾値算出手段で算出した前記判定閾値と前記近似度算出手段で算出した前記近似度とを比較する近似度判定処理手段と、近似度判定処理手段からの前記入力信号を処理するモジュールの一つであり、前記2つのチャンネルを両方のチャンネルの連結エネルギーと指向情報に変換する強度ステレオ処理手段とを備えた前記帯域毎強度ステレオ判定手段であって、前記近似度判定処理手段が前記判定閾値より近似度が高いと判断したときには、前記強度ステレオ処理手段が強度ステレオ処理を行う手段を有し、かつ前 10. A determination threshold calculation means for calculating a determination threshold on the basis of the scale factor band and IS frequency limit approximation to calculate the approximation degree of the left and right channels on the basis of the determination threshold calculated by the determination threshold calculation means and degree calculation means, and the approximation degree determination processing means for comparing the degree of approximation and calculated the determination threshold value calculated by the approximation degree calculating section in the determination threshold calculation means, the input signal from the approximation degree determination processing unit It is one of the processing modules, a said zone each intensity stereo judging means having a strength stereo processing means for converting the coupled energy directional information of both channels of the two channels, the approximate determination process when the unit determines that a higher degree of approximation than the determination threshold value comprises means the intensity stereo processing means performs intensity stereo processing, and pre 記近似度判定処理手段が前記近似度を低いと判断したときには、前記強度ステレオ処理手段が強度ステレオ処理を行わないで前記スケールファクタバンド判定手段に戻る手段を有したことを特徴とする請求項6に記載のマルチチャンネルオーディオ信号符号化装置。 When serial approximation degree determination means determines that lower the degree of approximation, claim wherein the intensity stereo processing means having means for returning to the scale factor band judging unit without performing the intensity stereo processing 6 multichannel audio signal encoding apparatus according to. 【請求項11】 請求項1ないし請求項5のいずれかに記載のマルチチャンネルオーディオ信号符号化方法を用いて前記入力信号を量子化、符号化したことを特徴とするマルチチャンネルオーディオ信号符号化装置。 11. quantizing the input signal using a multi-channel audio signal encoding method according to any one of claims 1 to 5, a multi-channel audio signal encoding apparatus is characterized in that coded . 【請求項12】 請求項1ないし請求項5のいずれかに記載のマルチチャンネルオーディオ信号符号化方法のステップが記憶されていることを特徴とする記録媒体。 12. A recording medium, wherein the step of multi-channel audio signal encoding method according to any one of claims 1 to 5 are stored. 【請求項13】 請求項12に記載の記録媒体を構成要素としたことを特徴とする音楽配信システム。 13. The music distribution system is characterized in that the components of the recording medium according to claim 12. 【請求項14】 請求項1ないし請求項5のいずれかに記載のマルチチャンネルオーディオ信号符号化方法を用いて音楽が配信されていることを特徴とする音楽配信システム。 14. The music distribution system characterized in that it is distributed music using a multi-channel audio signal encoding method according to any one of claims 1 to 5. 【請求項15】 請求項6ないし請求項10のいずれかに記載のマルチチャンネルオーディオ信号符号化装置を構成要素としたことを特徴とする音楽配信システム。 15. The music distribution system is characterized in that the components of the multichannel audio signal encoding apparatus according to any one of claims 6 to 10.
JP2001236870A 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system Pending JP2003044096A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001236870A JP2003044096A (en) 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001236870A JP2003044096A (en) 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Publications (1)

Publication Number Publication Date
JP2003044096A true JP2003044096A (en) 2003-02-14

Family

ID=19068058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001236870A Pending JP2003044096A (en) 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Country Status (1)

Country Link
JP (1) JP2003044096A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
JP2007183528A (en) * 2005-12-06 2007-07-19 Fujitsu Ltd Encoding apparatus, encoding method, and encoding program
US8200500B2 (en) 2001-05-04 2012-06-12 Agere Systems Inc. Cue-based audio coding/decoding
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200500B2 (en) 2001-05-04 2012-06-12 Agere Systems Inc. Cue-based audio coding/decoding
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
US7627482B2 (en) 2002-05-20 2009-12-01 Sony Corporation Methods, storage medium, and apparatus for encoding and decoding sound signals from multiple channels
US7912731B2 (en) 2002-05-20 2011-03-22 Sony Corporation Methods, storage medium and apparatus for encoding and decoding sound signals from multiple channels
KR101144696B1 (en) 2002-05-20 2012-05-25 소니 주식회사 Acoustic signal, encoding method and encoding device, acoustic signal, decoding method and decoding device, and recording medium image display device
US8238562B2 (en) 2004-10-20 2012-08-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
JP2007183528A (en) * 2005-12-06 2007-07-19 Fujitsu Ltd Encoding apparatus, encoding method, and encoding program

Similar Documents

Publication Publication Date Title
US8554569B2 (en) Quality improvement techniques in an audio encoder
JP4745986B2 (en) Efficient coding of digital media spectral data using wide sense perceptual similarity to (wide-senseperceptualsimilarity)
RU2483364C2 (en) Audio encoding/decoding scheme having switchable bypass
CN101371447B (en) Complex-transform channel coding with extended-band frequency coding
KR101376100B1 (en) Method and apparatus for bandwidth extension decoding
JP5325293B2 (en) Apparatus and method for decoding an encoded audio signal
AU2006301612B2 (en) Temporal and spatial shaping of multi-channel audio signals
EP1483759B1 (en) Scalable audio coding
CN1992533B (en) Signal encoding device and signal encoding method, signal decoding device and signal decoding method, program, and medium
CN102280109B (en) Encoding apparatus, decoding apparatus and methods thereof
US6934677B2 (en) Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP4977471B2 (en) Coding apparatus and coding method
CN1324558C (en) Coding device and decoding device and audio-data distribute device
KR101221919B1 (en) Method and apparatus for processing audio signal
CN1288625C (en) Audio coding and decoding equipment and method thereof
AU721596B2 (en) Method and apparatus for reproducing speech signals and method for transmitting the same
JP5010743B2 (en) Apparatus and method for calculating bandwidth extension data using framing that is controlled by the spectral tilt
JP4741476B2 (en) Encoding device
JP4740260B2 (en) Method and apparatus for extending the bandwidth of the audio signal artificially
CN101297356B (en) Audio compression
JP4977472B2 (en) Scalable decoding apparatus
RU2483365C2 (en) Low bit rate audio encoding/decoding scheme with common preprocessing
JP5628163B2 (en) Apparatus and method for generating a bandwidth extended output data
JP4991397B2 (en) Performance expansion method of coding systems that use the reconstruction method of high-frequency
CN100546233C (en) Multi sound channel AF expansion support method and equipment