JP2003044096A - Method and device for encoding multi-channel audio signal, recording medium and music distribution system - Google Patents

Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Info

Publication number
JP2003044096A
JP2003044096A JP2001236870A JP2001236870A JP2003044096A JP 2003044096 A JP2003044096 A JP 2003044096A JP 2001236870 A JP2001236870 A JP 2001236870A JP 2001236870 A JP2001236870 A JP 2001236870A JP 2003044096 A JP2003044096 A JP 2003044096A
Authority
JP
Japan
Prior art keywords
processing
intensity stereo
determination
approximation
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001236870A
Other languages
Japanese (ja)
Inventor
Yasuhito Watanabe
泰仁 渡邊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001236870A priority Critical patent/JP2003044096A/en
Publication of JP2003044096A publication Critical patent/JP2003044096A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method and a device for encoding multi-channel audio signal, a recording medium and a music distribution system, by which the deterioration of a localization feeling is minimized and the compression efficiency is improved by controlling an IS frequency limit and execution/non-execution for the unit of sfb corresponding to the characteristics and compressibility of an input signal. SOLUTION: A step S4 has a process for processing a value calculated from a step S1 and a form controlled from a step S3, and a step S5 has a process for judging the value calculated from the step S1 and a frequency calculated from the step S4.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明はマルチチャンネルオ
ーディオ信号符号化方法、マルチチャンネルオーディオ
信号符号化装置、記録媒体および音楽配信システムに関
するものであり、主にマルチチャンネルオーディオ信号
符号化の分野に係るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multi-channel audio signal coding method, a multi-channel audio signal coding device, a recording medium and a music distribution system, and mainly to the field of multi-channel audio signal coding. Is.

【0002】[0002]

【従来の技術】従来、このようなマルチチャンネルオー
ディオ信号符号化の分野の方法として、図11に示すよ
うなオーディオ信号符号化方法(MPEG2 AAC)
がある。まず、ステップS100は、入力オーディオ信
号(「ステレオ信号」、「マルチチャンネルオーディオ
信号」ともいい、以下「入力信号」という。)を人間の
聴覚特性に従って分析し、信号対マスク比(「信号対マ
スキング比:SMR」ともいう。)の値を算出する聴覚
心理分析である。ステップS101は、MDCT(変形
離散コサイン)変換などの変換を用いて、時間領域の入
力信号を周波数領域のスペクトルデータに変換する時間
/周波数マッピングである。ステップS102は、量子
化雑音の時間的な形状を制御するTNS処理である。ス
テップS103は、入力信号を効率よく処理するモジュ
ールの一つであり、2つのチャンネルとして、例えば左
チャンネルと右チャンネル(以下「左右チャンネル」と
いう。)の代わりに両方の左右チャンネルの連結エネル
ギーと指向情報に変換する強度ステレオ処理である。ス
テップS104は、左右チャンネルの入力信号(以下
「左右チャンネル信号」という。)の和となる信号(以
下「和信号」という。)および左右チャンネル信号の差
となる信号(以下「差信号」という。)に変換する和差
ステレオ処理である。ステップS105は、以上の処理
が施された入力信号を量子化、符号化(以下「量子化/
符号化」という。)する。ステップS106は、ステッ
プS105の出力と制御情報を多重化し、ビットストリ
ームとして整形するビットストリーム生成形成である。
2. Description of the Related Art Conventionally, as a method in the field of such multi-channel audio signal coding, an audio signal coding method (MPEG2 AAC) as shown in FIG. 11 is used.
There is. First, in step S100, an input audio signal (also referred to as “stereo signal” or “multi-channel audio signal”, hereinafter referred to as “input signal”) is analyzed according to human hearing characteristics, and a signal-to-mask ratio (“signal-to-masking”) is analyzed. It is also a psychoacoustic analysis for calculating the value of "ratio: SMR". Step S101 is time / frequency mapping for converting an input signal in the time domain into spectrum data in the frequency domain using a transformation such as MDCT (modified discrete cosine) transformation. Step S102 is TNS processing for controlling the temporal shape of quantization noise. Step S103 is one of the modules for efficiently processing the input signal, and instead of the two channels, for example, the left channel and the right channel (hereinafter referred to as “left and right channels”), the connection energy and directivity of both left and right channels. This is intensity stereo processing for converting into information. In step S104, a signal (hereinafter referred to as "sum signal") that is the sum of input signals of the left and right channels (hereinafter referred to as "left and right channel signals") and a signal that is the difference between the left and right channel signals (hereinafter referred to as "difference signal"). ) Is the sum-difference stereo processing. In step S105, the input signal subjected to the above processing is quantized and coded (hereinafter referred to as "quantization /
It is called "encoding". ) Do. Step S106 is a bitstream generation formation in which the output of step S105 and the control information are multiplexed and shaped into a bitstream.

【0003】強度ステレオ処理は、高い周波数の音の方
向性が左右チャンネルの強度差または振幅の差で認識し
ているという人間の聴覚の特性を利用し、入力信号に対
して左右チャンネル共通のエネルギー包絡線とおおまか
に定量化した指向情報で置き換える。
Intensity stereo processing utilizes the human auditory sense characteristic that the directionality of a high frequency sound is recognized by the intensity difference or the amplitude difference between the left and right channels, and the energy common to the left and right channels with respect to the input signal is used. Replace the envelope with roughly quantified directional information.

【0004】[0004]

【発明が解決しようとする課題】ところで、従来の強度
ステレオ処理では、図12のフローチャートに示すよう
に、入力信号の条件、すなわちチャンネル数、窓長、グ
ルーピング数等によっては使用できない。例えば、入力
信号がモノラル信号である場合や、左チャンネルがショ
ートフレーム、右チャンネルがロングフレームといった
ように、左右チャンネルの窓長が違う場合には、強度ス
テレオ処理ステップを行うことができない。
By the way, the conventional intensity stereo processing cannot be used depending on the conditions of the input signal, that is, the number of channels, the window length, the number of groupings, etc., as shown in the flowchart of FIG. For example, if the input signal is a monaural signal, or if the left and right channels have different window lengths, such as a left channel having a short frame and a right channel having a long frame, the intensity stereo processing step cannot be performed.

【0005】そこでまず、入力信号の条件を格納してい
る符号化モード情報を参照して、ステップS110にお
いて符号化モードの確認を行う。強度ステレオ処理を行
うことが可能となると、あらかじめ設定されたステップ
S112を開始する周波数、すなわちIS周波数限度以
上のスケールファクタバンドにおいて、ステップS11
2が実行される。ステップS112は、各チャンネルに
対するスペクトル成分をそれぞれ送信する必要はなく左
右チャンネル共通のエネルギー包絡線とスケールファク
タバンドに一つの指向情報を送信するだけでよいため、
2チャンネルの入力信号の場合、強度ステレオを行う周
波数帯域に関しては、約50%の情報量の節約ができ
る。よって圧縮率が高い場合には、ステップ112を行
う周波数帯域をできるだけ多くとることにより、圧縮効
率を高めることができる。
Therefore, first, the coding mode is confirmed in step S110 by referring to the coding mode information storing the condition of the input signal. When it becomes possible to perform the intensity stereo process, in step S11 at a frequency at which preset step S112 is started, that is, in a scale factor band equal to or higher than the IS frequency limit.
2 is executed. In step S112, it is not necessary to transmit the spectrum component for each channel, and it is sufficient to transmit one directional information to the energy envelope and scale factor band common to the left and right channels.
In the case of a 2-channel input signal, about 50% of the information amount can be saved in the frequency band in which the intensity stereo is performed. Therefore, when the compression rate is high, the compression efficiency can be increased by increasing the frequency band in which step 112 is performed.

【0006】しかしながら、オーディオ信号符号化方法
において、強度ステレオ処理を制御せずに使用すると、
異なるチャンネルでエネルギー包絡線が非常に異なる信
号に対して強度ステレオ処理を行う場合、左右チャンネ
ル共通のエネルギー包絡線とその指向情報では左右チャ
ンネル信号を表現することができないため、定位感が劣
化したり、また空間的印象が中心位置につぶれることに
なってしまうという問題があった。
However, in the audio signal encoding method, if the intensity stereo processing is used without controlling,
When intensity stereo processing is performed on signals with very different energy envelopes in different channels, the left and right channel signals cannot be represented by the energy envelope common to the left and right channels and their directional information, and the sense of localization deteriorates. Also, there was a problem that the spatial impression would be collapsed at the center position.

【0007】本発明はこのような問題を解決するために
なされたもので、入力信号の特性および圧縮率によって
IS周波数限度およびスケールファクタバンド単位での
強度ステレオ処理の実行または不実行(以下単に「実行
/不実行」という。)を制御することで、定位感の劣化
を最小とし、かつ高い圧縮効率を得ることが可能なマル
チチャンネルオーディオ信号符号化方法、マルチチャン
ネルオーディオ信号符号化装置、記録媒体および音楽配
信システムを提供するものである。
The present invention has been made in order to solve such a problem, and executes or does not execute intensity stereo processing in units of IS frequency limit and scale factor band depending on the characteristics and compression ratio of the input signal (hereinafter simply referred to as " Control) of "execution / non-execution.", Which can minimize deterioration of localization and can obtain high compression efficiency, a multi-channel audio signal encoding device, and a recording medium. And a music distribution system.

【0008】[0008]

【課題を解決するための手段】本発明のマルチチャンネ
ルオーディオ信号符号化方法は、入力信号を基に信号対
マスク比の値を算出する聴覚心理分析工程と、もう一方
の前記入力信号をスペクトルデータに変換する時間・周
波数マッピング工程と、変換された前記スペクトルデー
タを基に形状を制御するTNS処理工程と、制御された
前記形状を基に周波数を算出する強度ステレオ周波数限
度算出工程と、スケールファクタバンドごとに左チャン
ネルと右チャンネルの前記入力信号の近似度に応じて強
度ステレオ処理を行うか否かの判定を行う帯域毎強度ス
テレオ判定工程と、前記入力信号を処理するモジュール
の一つであり、前記2つのチャンネルを両方のチャンネ
ルの連結エネルギーと指向情報に変換する強度ステレオ
処理工程と、前記チャンネルの前記入力信号をそれぞれ
の和および差となる信号に変換する和差ステレオ処理工
程と、和差ステレオ処理工程で施された前記入力信号を
量子化、符号化する量子化・符号化工程と、この量子化
・符号化工程の出力と制御情報を多重化し、ビットスト
リームとして整形するビットストリーム生成形成工程と
を備え、前記強度ステレオ周波数限度算出工程が、前記
聴覚心理分析工程から算出された前記値とTNS処理工
程から制御された前記形状とを処理する工程を有し、か
つ前記帯域毎強度ステレオ判定工程が、前記聴覚心理分
析工程から算出された前記値と前記強度ステレオ周波数
限度算出工程から算出された前記周波数とを判断する工
程を有した方法となっている。この方法により、強度ス
テレオ処理の欠点である定位感の劣化を最小とし、かつ
高い圧縮効率を得ることが可能となる。
A multi-channel audio signal encoding method according to the present invention comprises a psychoacoustic analysis step of calculating a value of a signal-to-mask ratio based on an input signal, and spectral data of the other input signal. To a time / frequency mapping step, a TNS processing step of controlling a shape based on the converted spectrum data, an intensity stereo frequency limit calculating step of calculating a frequency based on the controlled shape, and a scale factor. It is one of a module for processing the input signal, and a band-by-band intensity stereo determination step of determining whether to perform intensity stereo processing according to the degree of approximation of the input signals of the left channel and the right channel for each band. An intensity stereo processing step for converting the two channels into connection energy and pointing information for both channels; A sum difference stereo processing step of converting the input signals of the channels into respective sum and difference signals, and a quantization / encoding step of quantizing and encoding the input signal applied in the sum difference stereo processing step. , A bitstream generation forming step of multiplexing the output of this quantization / encoding step and control information and shaping it as a bitstream, wherein the intensity stereo frequency limit calculation step is calculated from the psychoacoustic analysis step. A step of processing the value and the shape controlled from the TNS processing step, and the strength stereo determination process for each band includes the value calculated from the psychoacoustic analysis step and the strength stereo frequency limit calculation step. The method has a step of judging the calculated frequency. With this method, it is possible to minimize deterioration of the sense of localization, which is a drawback of intensity stereo processing, and to obtain high compression efficiency.

【0009】ここで、本発明のマルチチャンネルオーデ
ィオ信号符号化方法は、符号化に必要な符号化モード情
報を設定するための符号化モード情報工程と、前記符号
化モード情報より強度ステレオが使用可能か否かの判定
を行う強度ステレオ前処理工程と、前記符号化モード情
報より得られる情報より圧縮率を算出する圧縮率算出工
程と、前記圧縮率と所定の値との大小を比較した結果を
出力する負荷判定工程と、この負荷判定工程の結果より
強度ステレオ処理を開始する周波数を設定するIS周波
数限度設定工程とを備えた前記強度ステレオ周波数限度
算出工程であって、前記負荷判定工程が前記圧縮率を高
いと判断したときには、前記IS周波数限度設定工程が
より広い周波数帯域で強度ステレオ処理を行う手段を有
し、かつ前記負荷判定工程が前記圧縮率を低いと判断し
たときには、前記IS周波数限度設定工程がより狭い周
波数帯域で強度ステレオ処理を行う手段を有した方法と
なっている。この方法により、圧縮率が低い場合には、
より狭い周波数帯域で強度ステレオ処理を行うことによ
り、強度ステレオ処理の欠点である定位の劣化を最小に
することが可能となる。
Here, in the multi-channel audio signal encoding method of the present invention, the encoding mode information step for setting the encoding mode information necessary for encoding and the intensity stereo can be used from the encoding mode information. A strength stereo pre-processing step of determining whether or not, a compression rate calculation step of calculating a compression rate from the information obtained from the encoding mode information, and a result of comparing the compression rate with a predetermined value. In the intensity stereo frequency limit calculation step, which comprises an output load determination step and an IS frequency limit setting step for setting a frequency for starting intensity stereo processing from the result of the load determination step, wherein the load determination step is the When it is determined that the compression ratio is high, the IS frequency limit setting step has means for performing intensity stereo processing in a wider frequency band, and When the constant-step is judged to be low the compression ratio has a method of the IS frequency limit setting step had the means for performing the intensity stereo processing in a narrower frequency band. With this method, if the compression ratio is low,
By performing the intensity stereo processing in a narrower frequency band, it is possible to minimize the deterioration of localization, which is a drawback of the intensity stereo processing.

【0010】また、本発明のマルチチャンネルオーディ
オ信号符号化方法は、符号化に必要な符号化モード情報
を設定するための符号化モード情報工程と、前記符号化
モード情報より強度ステレオが使用可能か否かの判定を
行う強度ステレオ前処理工程と、前記符号化モード情報
より得られる情報より圧縮率を算出する圧縮率算出工程
と、この圧縮率算出工程で算出した前記圧縮率を基に判
定閾値を算出する判定閾値算出工程と、判定閾値算出工
程で算出した前記判定閾値を基に左チャンネルと右チャ
ンネルの近似度を算出する近似度算出工程と、前記判定
閾値と前記圧縮率を比較した結果を出力する近似度判定
処理工程と、この近似度判定処理工程の結果より周波数
を設定するIS周波数限度設定工程とを備えた前記強度
ステレオ周波数限度算出工程であって、前記近似度判定
処理工程が前記判定閾値より前記近似度を高いと判断し
たときには、前記IS周波数限度設定工程がより広い周
波数帯域で強度ステレオ処理を行う工程を有し、かつ前
記近似度判定処理工程が前記近似度を低いと判断したと
きには、前記IS周波数限度設定工程がより狭い周波数
帯域で強度ステレオ処理を行う手段を有した方法となっ
ている。この方法により、入力信号の特性によって強度
ステレオ処理を行う周波数帯域を適応的に設定すること
よって強度ステレオ処理による定位の劣化が起こらず、
圧縮効率の高い符号化を行うことが可能となる。
In the multi-channel audio signal coding method of the present invention, a coding mode information step for setting coding mode information necessary for coding, and whether strength stereo can be used based on the coding mode information. A strength stereo pre-processing step of determining whether or not, a compression rate calculation step of calculating a compression rate from information obtained from the encoding mode information, and a determination threshold value based on the compression rate calculated in this compression rate calculation step. A determination threshold value calculating step, an approximation degree calculating step for calculating the degree of approximation of the left channel and the right channel based on the determination threshold value calculated in the determination threshold value calculation step, and the result of comparing the determination threshold value and the compression rate. And the IS frequency limit setting step of setting the frequency based on the result of the approximation degree determination processing step. In the calculation step, when the approximation degree determination processing step determines that the degree of approximation is higher than the determination threshold value, the IS frequency limit setting step includes a step of performing intensity stereo processing in a wider frequency band, and When the approximation degree determination processing step determines that the approximation degree is low, the IS frequency limit setting step is a method having means for performing intensity stereo processing in a narrower frequency band. By this method, the degradation of localization due to intensity stereo processing does not occur by adaptively setting the frequency band for performing intensity stereo processing according to the characteristics of the input signal,
It is possible to perform encoding with high compression efficiency.

【0011】さらに、本発明のマルチチャンネルオーデ
ィオ信号符号化方法は、前記スケールファクタバンドと
IS周波数限度を比較するスケールファクタバンド判定
工程と、このスケールファクタバンド判定工程で比較し
た前記スケールファクタバンドと前記IS周波数限度を
基に左チャンネルと右チャンネルの近似度を算出する近
似度算出工程と、近似度算出工程で算出した近似度とあ
らかじめ設定された閾値との大小を比較する近似度判定
処理工程と、近似度判定処理工程からの前記入力信号を
処理するモジュールの一つであり、前記2つのチャンネ
ルを両方のチャンネルの連結エネルギーと指向情報に変
換する強度ステレオ処理工程とを備えた前記帯域毎強度
ステレオ判定工程であって、前記近似度判定処理工程が
前記近似度を高いと判断したときには、前記強度ステレ
オ処理工程が強度ステレオ処理を行う工程を有し、かつ
前記近似度判定処理工程が前記近似度を低いと判断した
ときには、前記強度ステレオ処理を行わないで前記スケ
ールファクタバンド判定工程に戻る工程を有した方法と
なっている。この方法により、強度ステレオ処理による
定位の劣化が生じず、また音質の影響の少ない高い周波
数帯域においてより強度ステレオ処理を実行することが
できるようになるため、圧縮効率を高めることが可能と
なる。
Further, in the multi-channel audio signal encoding method of the present invention, the scale factor band determination step of comparing the scale factor band with the IS frequency limit, the scale factor band compared with the scale factor band determination step and the scale factor band An approximation degree calculating step of calculating the approximation degree of the left channel and the right channel based on the IS frequency limit, and an approximation degree determining processing step of comparing the magnitude of the approximation degree calculated in the approximation degree calculating step with a preset threshold value. The intensity for each band, which is one of the modules for processing the input signal from the approximation determination processing step, and which has an intensity stereo processing step for converting the two channels into connection energy of both channels and directivity information. In the stereo determination step, the approximation degree determination processing step increases the approximation degree. When it is determined that the intensity stereo processing step has a step of performing intensity stereo processing, and when the approximation degree determination processing step determines that the degree of approximation is low, the scale factor band is obtained without performing the intensity stereo processing. The method has a step of returning to the determination step. By this method, the localization deterioration due to the intensity stereo processing does not occur, and the intensity stereo processing can be executed more in a high frequency band in which the influence of the sound quality is small, so that the compression efficiency can be improved.

【0012】また、本発明のマルチチャンネルオーディ
オ信号符号化方法は、前記スケールファクタバンドとI
S周波数限度を比較するスケールファクタバンド判定工
程と、このスケールファクタバンド判定工程で比較した
前記スケールファクタバンドと前記IS周波数限度を基
に判定閾値を算出する判定閾値算出工程と、この判定閾
値算出工程で算出した前記判定閾値を基に左右チャンネ
ルの近似度を算出する近似度算出工程と、前記判定閾値
算出工程で算出した前記判定閾値と前記近似度算出工程
で算出した前記近似度とを比較する近似度判定処理工程
と、近似度判定処理工程からの前記入力信号を処理する
モジュールの一つであり、前記2つのチャンネルを両方
のチャンネルの連結エネルギーと指向情報に変換する強
度ステレオ処理工程とを備えた前記帯域毎強度ステレオ
判定工程であって、前記近似度判定処理工程が前記判定
閾値より近似度が高いと判断したときには、前記強度ス
テレオ処理工程が強度ステレオ処理を行う工程を有し、
かつ前記近似度判定処理工程が前記近似度を低いと判断
したときには、前記強度ステレオ処理工程が強度ステレ
オ処理を行わないで前記スケールファクタバンド判定工
程に戻る工程を有した方法となっている。この方法によ
り、強度ステレオ処理による定位の劣化が生じず、また
音質の影響の少ない高い周波数帯域においてより強度ス
テレオ処理を実行することができるようになるため、圧
縮効率を高めることが可能となる。
Also, the multi-channel audio signal encoding method of the present invention comprises:
A scale factor band determination step of comparing S frequency limits, a determination threshold value calculation step of calculating a determination threshold value based on the scale factor band and the IS frequency limit compared in the scale factor band determination step, and this determination threshold value calculation step In the approximation degree calculating step of calculating the degree of approximation of the left and right channels based on the determination threshold value calculated in, the determination threshold value calculated in the determination threshold value calculating step and the approximation degree calculated in the approximation degree calculating step are compared. An approximation degree determination processing step, and one of modules for processing the input signal from the approximation degree determination processing step, and an intensity stereo processing step of converting the two channels into connection energy of both channels and directional information. In the intensity stereo determination process for each band, wherein the approximation degree determination processing step has an approximation degree higher than the determination threshold. When the intended determination, comprising the step of the intensity stereo processing step performs intensity stereo processing,
In addition, when the approximation degree determination processing step determines that the approximation degree is low, the intensity stereo processing step includes a step of returning to the scale factor band determination step without performing intensity stereo processing. By this method, the localization deterioration due to the intensity stereo processing does not occur, and the intensity stereo processing can be executed more in a high frequency band in which the influence of the sound quality is small, so that the compression efficiency can be improved.

【0013】本発明のマルチチャンネルオーディオ信号
符号化装置は、入力信号を基に信号対マスク比の値を算
出する聴覚心理分析手段と、もう一方の前記入力信号を
スペクトルデータに変換する時間・周波数マッピング手
段と、変換された前記スペクトルデータを基に形状を制
御するTNS処理手段と、制御された前記形状を基に周
波数を算出する強度ステレオ周波数限度算出手段と、ス
ケールファクタバンドごとに左チャンネルと右チャンネ
ルの前記入力信号の近似度に応じて強度ステレオ処理を
行うか否かの判定を行う帯域毎強度ステレオ判定手段
と、前記入力信号を処理するモジュールの一つであり、
前記2つのチャンネルを両方のチャンネルの連結エネル
ギーと指向情報に変換する強度ステレオ処理手段と、前
記チャンネルの前記入力信号をそれぞれの和および差と
なる信号に変換する和差ステレオ処理手段と、和差ステ
レオ処理手段で施された前記入力信号を量子化、符号化
する量子化・符号化手段と、この量子化・符号化手段の
出力と制御情報を多重化し、ビットストリームとして整
形するビットストリーム生成形成手段とを備え、前記強
度ステレオ周波数限度算出手段が、前記聴覚心理分析手
段から算出された前記値とTNS処理手段から制御され
た前記形状とを処理する手段を有し、かつ前記帯域毎強
度ステレオ判定手段が、前記聴覚心理分析手段から算出
された前記値と前記強度ステレオ周波数限度算出手段か
ら算出された前記周波数とを判断する手段を有した構成
となっている。この構成により、強度ステレオ処理の欠
点である定位感の劣化を最小とし、かつ高い圧縮効率を
得ることが可能となる。
The multi-channel audio signal encoding device of the present invention comprises a psychoacoustic analysis means for calculating a value of a signal-to-mask ratio based on an input signal, and a time / frequency for converting the other input signal into spectrum data. Mapping means, TNS processing means for controlling a shape based on the converted spectrum data, intensity stereo frequency limit calculating means for calculating a frequency based on the controlled shape, and a left channel for each scale factor band. A band-wise intensity stereo determination means for determining whether or not to perform intensity stereo processing according to the degree of approximation of the input signal of the right channel, and one of modules for processing the input signal,
Intensity stereo processing means for converting the two channels into connection energy and directional information of both channels; sum difference stereo processing means for converting the input signals of the channels into respective sum and difference signals; Quantization / encoding means for quantizing and encoding the input signal applied by the stereo processing means, and bitstream generation forming for multiplexing the output of this quantization / encoding means and control information and shaping it as a bitstream. Means, the intensity stereo frequency limit calculation means includes means for processing the value calculated by the psychoacoustic analysis means and the shape controlled by the TNS processing means, and the intensity stereo for each band. The determination means, the value calculated from the psychoacoustic analysis means and the intensity stereo frequency limit calculation means It has a configuration having a means for determining the wave number. With this configuration, it is possible to minimize deterioration of the sense of localization, which is a drawback of the intensity stereo processing, and obtain high compression efficiency.

【0014】ここで、本発明のマルチチャンネルオーデ
ィオ信号符号化装置は、符号化に必要な符号化モード情
報を設定するための符号化モード情報手段と、前記符号
化モード情報より強度ステレオが使用可能か否かの判定
を行う強度ステレオ前処理手段と、前記符号化モード情
報より得られる情報より圧縮率を算出する圧縮率算出手
段と、前記圧縮率と所定の値との大小を比較した結果を
出力する負荷判定手段と、この負荷判定手段の結果より
強度ステレオ処理を開始する周波数を設定するIS周波
数限度設定手段とを備えた前記強度ステレオ周波数限度
算出手段であって、前記負荷判定手段が前記圧縮率を高
いと判断したときには、前記IS周波数限度設定手段が
より広い周波数帯域で強度ステレオ処理を行う手段を有
し、かつ前記負荷判定手段が前記圧縮率を低いと判断し
たときには、前記IS周波数限度設定手段がより狭い周
波数帯域で強度ステレオ処理を行う手段を有した構成と
なっている。この構成により、圧縮率が低い場合には、
より狭い周波数帯域で強度ステレオ処理を行うことによ
り、強度ステレオ処理の欠点である定位の劣化を最小に
することが可能となる。
Here, the multi-channel audio signal coding apparatus of the present invention can use coding mode information means for setting coding mode information necessary for coding, and strength stereo can be used from the coding mode information. Strength stereo pre-processing means for determining whether or not, compression rate calculating means for calculating a compression rate from information obtained from the encoding mode information, and a result of comparing the compression rate with a predetermined value. The intensity stereo frequency limit calculating means comprises: load determining means for outputting; and IS frequency limit setting means for setting a frequency at which intensity stereo processing is started based on the result of the load determining means. When it is determined that the compression ratio is high, the IS frequency limit setting means has means for performing intensity stereo processing in a wider frequency band, and When the constant means determines that lower the compression ratio, it has a configuration in which the IS frequency limit setting means is comprising means for performing intensity stereo processing in a narrower frequency band. With this configuration, when the compression rate is low,
By performing the intensity stereo processing in a narrower frequency band, it is possible to minimize the deterioration of localization, which is a drawback of the intensity stereo processing.

【0015】また、本発明のマルチチャンネルオーディ
オ信号符号化装置は、符号化に必要な符号化モード情報
を設定するための符号化モード情報手段と、前記符号化
モード情報より強度ステレオが使用可能か否かの判定を
行う強度ステレオ前処理手段と、前記符号化モード情報
より得られる情報より圧縮率を算出する圧縮率算出手段
と、この圧縮率算出手段で算出した前記圧縮率を基に判
定閾値を算出する判定閾値算出手段と、判定閾値算出手
段で算出した前記判定閾値を基に左チャンネルと右チャ
ンネルの近似度を算出する近似度算出手段と、前記判定
閾値と前記圧縮率を比較した結果を出力する近似度判定
処理手段と、この近似度判定処理手段の結果より周波数
を設定するIS周波数限度設定手段とを備えた前記強度
ステレオ周波数限度算出手段であって、前記近似度判定
処理手段が前記判定閾値より前記近似度を高いと判断し
たときには、前記IS周波数限度設定手段がより広い周
波数帯域で強度ステレオ処理を行う手段を有し、かつ前
記近似度判定処理手段が前記近似度を低いと判断したと
きには、前記IS周波数限度設定手段がより狭い周波数
帯域で強度ステレオ処理を行う手段を有した構成となっ
ている。この構成により、入力信号の特性によって強度
ステレオ処理を行う周波数帯域を適応的に設定すること
よって強度ステレオ処理による定位の劣化が起こらず、
圧縮効率の高い符号化を行うことが可能となる。
Further, the multi-channel audio signal coding apparatus of the present invention is capable of using coding mode information means for setting coding mode information necessary for coding and strength stereo based on the coding mode information. Intensity stereo pre-processing means for determining whether or not, compression rate calculating means for calculating a compression rate from information obtained from the encoding mode information, and a determination threshold value based on the compression rate calculated by this compression rate calculating means A determination threshold value calculating means for calculating, the approximation degree calculating means for calculating the degree of approximation of the left channel and the right channel based on the determination threshold value calculated by the determination threshold value calculating means, and the result of comparing the determination threshold value and the compression rate. The intensity stereo frequency limit provided with an approximation degree determination processing means for outputting and an IS frequency limit setting means for setting a frequency from the result of the approximation degree determination processing means. Computation means, when the approximation degree determination processing means determines that the approximation degree is higher than the determination threshold value, the IS frequency limit setting means has means for performing intensity stereo processing in a wider frequency band, and The IS frequency limit setting means has means for performing intensity stereo processing in a narrower frequency band when the approximation degree determination processing means determines that the approximation degree is low. With this configuration, the degradation of localization due to the intensity stereo processing does not occur by adaptively setting the frequency band for performing the intensity stereo processing according to the characteristics of the input signal,
It is possible to perform encoding with high compression efficiency.

【0016】さらに、本発明のマルチチャンネルオーデ
ィオ信号符号化装置は、前記スケールファクタバンドと
IS周波数限度を基に左チャンネルと右チャンネルの近
似度を算出する近似度算出手段と、近似度算出手段で算
出した近似度とあらかじめ設定された閾値との大小を比
較する近似度判定処理手段と、近似度判定処理手段から
の前記入力信号を処理するモジュールの一つであり、前
記2つのチャンネルを両方のチャンネルの連結エネルギ
ーと指向情報に変換する強度ステレオ処理手段とを備え
た前記帯域毎強度ステレオ判定手段であって、前記近似
度判定処理手段が前記近似度を高いと判断したときに
は、前記強度ステレオ処理手段が強度ステレオ処理を行
う手段を有し、かつ前記近似度判定処理手段が前記近似
度を低いと判断したときには、前記強度ステレオ処理を
行わないで前記スケールファクタバンド判定手段に戻る
手段を有した構成となっている。この構成により、強度
ステレオ処理による定位の劣化が起こらず、かつ圧縮効
率を高めることが可能となる。
Further, the multi-channel audio signal encoding device of the present invention comprises an approximation degree calculating means for calculating the approximation degree of the left channel and the right channel based on the scale factor band and the IS frequency limit, and the approximation degree calculating means. It is one of an approximation degree determination processing unit that compares the magnitude of the calculated approximation degree with a preset threshold value, and one of the modules that processes the input signal from the approximation degree determination processing unit. The intensity stereo processing means for each band, which comprises a connection energy of a channel and an intensity stereo processing means for converting to directional information, wherein the intensity stereo processing is performed when the approximation degree determination processing means determines that the approximation degree is high. The means has a means for performing intensity stereo processing, and the approximation degree determination processing means determines that the approximation degree is low. Kiniwa, has a configuration having a means for returning to the scale factor band judging unit without performing the intensity stereo processing. With this configuration, it is possible to improve the compression efficiency without causing the localization deterioration due to the intensity stereo processing.

【0017】また、本発明のマルチチャンネルオーディ
オ信号符号化装置は、前記スケールファクタバンドとI
S周波数限度を基に判定閾値を算出する判定閾値算出手
段と、この判定閾値算出手段で算出した前記判定閾値を
基に左右チャンネルの近似度を算出する近似度算出手段
と、前記判定閾値算出手段で算出した前記判定閾値と前
記近似度算出手段で算出した前記近似度とを比較する近
似度判定処理手段と、近似度判定処理手段からの前記入
力信号を処理するモジュールの一つであり、前記2つの
チャンネルを両方のチャンネルの連結エネルギーと指向
情報に変換する強度ステレオ処理手段とを備えた前記帯
域毎強度ステレオ判定手段であって、前記近似度判定処
理手段が前記判定閾値より近似度が高いと判断したとき
には、前記強度ステレオ処理手段が強度ステレオ処理を
行う手段を有し、かつ前記近似度判定処理手段が前記近
似度を低いと判断したときには、前記強度ステレオ処理
手段が強度ステレオ処理を行わないで前記スケールファ
クタバンド判定手段に戻る手段を有した構成となってい
る。この構成により、強度ステレオ処理による定位の劣
化が生じず、また音質の影響の少ない高い周波数帯域に
おいてより強度ステレオ処理を実行することができるよ
うになるため、圧縮効率を高めることが可能となる。
Also, the multi-channel audio signal encoding device of the present invention is characterized in that the scale factor band and the I
Judgment threshold value calculation means for calculating the judgment threshold value based on the S frequency limit, approximation degree calculation means for calculating the approximation degree of the left and right channels based on the judgment threshold value calculated by the judgment threshold value calculation means, and the decision threshold value calculation means Which is one of a module for processing the input signal from the approximation degree determination processing means and the approximation degree determination processing means for comparing the determination threshold value calculated in the above and the approximation degree calculated by the approximation degree calculation means, The intensity stereo determination means for each band, comprising intensity stereo processing means for converting two channels into connection energy of both channels and directivity information, wherein the approximation degree determination processing means has a degree of approximation higher than the determination threshold. When it is determined that the intensity stereo processing means has a means for performing intensity stereo processing, and the approximation degree determination processing means determines that the approximation degree is low. When the has a structure in which the intensity stereo processing means having means for returning to the scale factor band judging unit without performing the intensity stereo processing. With this configuration, the localization deterioration due to the intensity stereo process does not occur, and the intensity stereo process can be further executed in a high frequency band in which the influence of the sound quality is small, so that the compression efficiency can be improved.

【0018】本発明のマルチチャンネルオーディオ信号
符号化装置は、上記いずれかに記載のマルチチャンネル
オーディオ信号符号化方法を用いて前記入力信号を量子
化、符号化した構成を有している。この構成により、上
記マルチチャンネルオーディオ信号符号化方法と同様の
効果を得ることが可能となる。
The multi-channel audio signal coding apparatus of the present invention has a configuration in which the input signal is quantized and coded by using any one of the above-described multi-channel audio signal coding methods. With this configuration, it is possible to obtain the same effect as that of the above-mentioned multi-channel audio signal encoding method.

【0019】本発明の記録媒体は、上記いずれかに記載
のマルチチャンネルオーディオ信号符号化方法のステッ
プが記憶されている構成を有している。この構成によ
り、上記マルチチャンネルオーディオ信号符号化方法と
同様の効果を得ることが可能となる。
The recording medium of the present invention has a configuration in which the steps of the multi-channel audio signal encoding method described in any of the above are stored. With this configuration, it is possible to obtain the same effect as that of the above-mentioned multi-channel audio signal encoding method.

【0020】ここで、本発明の音楽配信システムは、こ
の記録媒体を構成要素としたことを特徴としている。こ
の特徴により、上記マルチチャンネルオーディオ信号符
号化方法と同様の効果を得ることが可能となる。
Here, the music distribution system of the present invention is characterized by using this recording medium as a constituent element. With this feature, it is possible to obtain the same effect as that of the above-mentioned multi-channel audio signal encoding method.

【0021】また、本発明の音楽配信システムは、上記
いずれかに記載のマルチチャンネルオーディオ信号符号
化方法を用いて音楽が配信されている構成を有してい
る。この構成により、上記マルチチャンネルオーディオ
信号符号化方法と同様の効果を得ることが可能となる。
Further, the music distribution system of the present invention has a structure in which music is distributed by using any one of the above-described multi-channel audio signal encoding methods. With this configuration, it is possible to obtain the same effect as that of the above-mentioned multi-channel audio signal encoding method.

【0022】さらに、本発明の音楽配信システムは、上
記いずれかに記載のマルチチャンネルオーディオ信号符
号化装置を構成要素としたことを特徴としている。この
特徴により、上記マルチチャンネルオーディオ信号符号
化装置と同様の効果を得ることが可能となる。
Further, the music distribution system of the present invention is characterized in that the multi-channel audio signal encoding device according to any one of the above is used as a constituent element. With this feature, it is possible to obtain the same effect as that of the multi-channel audio signal encoding device.

【発明の実施の形態】以下、本発明に係る実施の形態に
おけるマルチチャンネルオーディオ信号符号化方法につ
いて、図面を参照しながら説明する。図1は、本発明に
係る第1の実施の形態におけるマルチチャンネルオーデ
ィオ信号符号化方法を示すフローチャートである。
BEST MODE FOR CARRYING OUT THE INVENTION A multi-channel audio signal encoding method according to an embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a flowchart showing a multi-channel audio signal encoding method according to the first embodiment of the present invention.

【0023】同図に示すように、マルチチャンネルオー
ディオ信号符号化方法は、入力信号を基に人間の聴覚の
特性を利用する聴覚心理モデルに基づく信号対マスク比
の値を算出する聴覚心理分析工程としてのステップS1
と、もう一方の時間領域の入力信号を周波数領域のスペ
クトルデータに変換する時間・周波数マッピング工程
(以下「時間/周波数マッピング工程」という。)とし
てのステップS2と、変換されたスペクトルデータを基
に量子化雑音の時間的な形状を制御するTNS処理工程
としてのステップS3と、制御された形状を基に強度ス
テレオを開始する周波数を算出する強度ステレオ周波数
限度算出工程としてのステップS4と、強度ステレオ処
理を行うスケールファクタバンド(以下「sfb」とす
る。)ごとに左右チャンネル信号の近似度に応じて強度
ステレオ処理を行うか否かの判定を行う帯域毎強度ステ
レオ判定工程としてのステップS5と、ステップS5か
らの入力信号を効率よく処理するモジュールの一つであ
り、2つのチャンネルの代わりに両方のチャンネルの連
結エネルギーと指向情報に変換する強度ステレオ処理工
程としてのステップS6と、左右チャンネル信号を和信
号および差信号に変換する和差ステレオ処理工程として
のステップS7と、ステップS7で施された前記入力信
号を量子化、符号化する量子化/符号化工程としてのス
テップS8と、ステップ8の出力と制御情報を多重化
し、ビットストリームとして整形するビットストリーム
生成形成工程としてのステップS10とを有している。
As shown in the figure, in the multi-channel audio signal coding method, a psychoacoustic analysis step of calculating a value of a signal-to-mask ratio based on a psychoacoustic model utilizing human auditory characteristics based on an input signal. As step S1
And step S2 as a time-frequency mapping step (hereinafter referred to as "time / frequency mapping step") of converting the other input signal in the time domain into spectrum data in the frequency domain, and based on the converted spectrum data. Step S3 as a TNS processing step for controlling the temporal shape of the quantization noise, step S4 as an intensity stereo frequency limit calculating step for calculating a frequency at which intensity stereo is started based on the controlled shape, and intensity stereo. Step S5 as a band-wise intensity stereo determination step of determining whether or not to perform intensity stereo processing according to the degree of approximation of the left and right channel signals for each scale factor band (hereinafter referred to as "sfb") to be processed, It is one of the modules that efficiently processes the input signal from step S5. Step S6 as an intensity stereo processing step for converting the connection energy and directional information of both channels, and step S7 as a sum difference stereo processing step for converting the left and right channel signals into a sum signal and a difference signal, and step S7. Step S8 as a quantizing / encoding step of quantizing and encoding the input signal subjected to in step S8, and step of a bitstream generation forming step of multiplexing the output of step 8 and control information and shaping them as a bitstream. S10 and.

【0024】次に、このマルチチャンネルオーディオ信
号符号化方法の処理の流れについて説明する。
Next, the processing flow of this multi-channel audio signal encoding method will be described.

【0025】まず、入力信号は、ステップS1により聴
覚心理モデルに基づく、信号対マスク比の値を算出す
る。もう一方の入力信号は、ステップS2により、MD
CT変換などの変換を用いて、時間領域から周波数領域
のスペクトルデータに変換される。
First, for the input signal, the value of the signal-to-mask ratio is calculated based on the psychoacoustic model in step S1. The other input signal is MD in step S2.
The spectrum data in the time domain is converted into the spectrum data in the frequency domain using a transform such as CT transform.

【0026】次に、ステップS3は、変換されたスペク
トルデータを基に量子化雑音の時間的な形状を制御す
る。次いで、ステップS4は、制御された形状を基に強
度ステレオを開始する周波数であるIS周波数限度を算
出する。続いて、ステップS5は、IS周波数限度以上
の周波数において、sfb毎に左右チャンネル信号の近
似度に応じて強度ステレオ処理を行うか否かの判定を行
う。一方、ステップS5は、算出されたIS周波数限度
を基に強度ステレオ処理を行うことができないと判定す
る(NOである)と、ステップS6とステップS7との
間に移行する。ステップS6は、ステップS5において
強度ステレオ処理を行うことができると判定される(Y
ESである)と、強度ステレオ処理を行う。
Next, step S3 controls the temporal shape of the quantization noise based on the converted spectrum data. Then, step S4 calculates an IS frequency limit, which is the frequency at which intensity stereo is started based on the controlled shape. Subsequently, in step S5, it is determined whether or not the intensity stereo process is performed for each sfb at a frequency equal to or higher than the IS frequency limit, according to the degree of approximation of the left and right channel signals. On the other hand, if it is determined in step S5 that the intensity stereo process cannot be performed based on the calculated IS frequency limit (NO), the process proceeds between step S6 and step S7. In step S6, it is determined that the intensity stereo processing can be performed in step S5 (Y
ES), and intensity stereo processing is performed.

【0027】次に、ステップS7は、左右チャンネル信
号をそれぞれ和信号および差信号に変換する。次いで、
ステップS8は、以上の処理が施された入力信号を量子
化、符号化する。ステップS10は、ステップS8の出
力と制御情報を多重化し、ビットストリームとして整形
する。
Next, a step S7 converts the left and right channel signals into a sum signal and a difference signal, respectively. Then
A step S8 quantizes and encodes the input signal subjected to the above processing. In step S10, the output of step S8 and the control information are multiplexed and shaped as a bit stream.

【0028】このようなマルチチャンネルオーディオ信
号符号化方法によれば、入力信号の特性および圧縮率に
よって、強度ステレオを開始する周波数を適応的に変動
させ、また入力信号の特性および圧縮率によって、sf
b単位での実行/不実行を制御するので、強度ステレオ
処理の欠点である定位感の劣化を最小とし、かつ高い圧
縮効率を得ることができる。
According to such a multi-channel audio signal encoding method, the frequency at which intensity stereo is started is adaptively changed according to the characteristics and compression rate of the input signal, and sf is changed according to the characteristics and compression rate of the input signal.
Since execution / non-execution is controlled in units of b, it is possible to minimize deterioration of localization, which is a drawback of intensity stereo processing, and obtain high compression efficiency.

【0029】図2は、本発明に係る第2の実施の形態に
おけるステップS4を示すフローチャートである。
FIG. 2 is a flowchart showing step S4 in the second embodiment of the present invention.

【0030】同図に示すように、ステップS4は、ビッ
トレートやサンプリング周波数などの符号化に必要な符
号化モード情報を設定するための符号化モード情報工程
としてのステップS21と、前記符号化モード情報より
強度ステレオが使用可能か否かの判定を行う強度ステレ
オ前処理工程としてのステップS22と、前記符号化モ
ード情報より得られるビットレート、サンプリング周波
数、チャンネル数等の情報より圧縮率を算出する圧縮率
算出工程としてのステップS23と、前記圧縮率と所定
の値との大小を比較した結果を出力する負荷判定工程と
してのステップS24と、ステップS24の結果より強
度ステレオ処理を開始する周波数を設定するIS周波数
限度設定工程としてのステップS25とを有している。
As shown in the figure, step S4 includes step S21 as an encoding mode information step for setting encoding mode information necessary for encoding such as bit rate and sampling frequency, and the encoding mode. The compression ratio is calculated from step S22 as a strength stereo pre-processing step of determining whether or not strength stereo can be used from the information, and information such as the bit rate, sampling frequency, and the number of channels obtained from the coding mode information. A step S23 as a compression rate calculation step, a step S24 as a load determination step for outputting the result of comparing the compression rate with a predetermined value, and a frequency for starting the intensity stereo processing from the result of step S24 are set. Step S25 as an IS frequency limit setting step.

【0031】次に、このステップS4の処理の流れにつ
いて説明する。
Next, the flow of processing in step S4 will be described.

【0032】ステップS4において、強度ステレオ処理
は、左右チャンネルの符号化モード(チャンネル数、窓
長、グルーピング等)が違う場合には使用できないた
め、まず符号化モード情報S21を用いて、強度ステレ
オが使用可能か否かの判定を行う。入力信号がモノラル
などの符号化モードが異なる場合(NOの場合)には、
処理を終了する(END)。強度ステレオ処理が可能で
あると判定される(YESである)と、ステップS23
は、ステップS21より得られるビットレートとサンプ
リング周波数およびチャンネル数から例えば、下記の
(1)に示す計算式により圧縮率を算出する。
In step S4, intensity stereo processing cannot be used when the left and right channel coding modes (number of channels, window length, grouping, etc.) are different. Therefore, the intensity stereo processing is first performed using the coding mode information S21. It is determined whether it can be used. When the input signals are in different encoding modes such as monaural (when NO),
The process ends (END). If it is determined that the intensity stereo processing is possible (YES), step S23.
Calculates the compression rate from the bit rate, the sampling frequency, and the number of channels obtained in step S21, for example, by the calculation formula shown in (1) below.

【数1】 [Equation 1]

【0033】ここで、fsはサンプリング周波数、br
はビットレート、chはチャンネル数である。
Where fs is the sampling frequency and br
Is the bit rate and ch is the number of channels.

【0034】次に、ステップS24は、圧縮率とあらか
じめ設定した所定の値との大小比較を行う。圧縮率が所
定の値よりも大きい場合、つまり圧縮率が高い場合に
は、ステップS25で、より広い周波数帯域で強度ステ
レオ処理を開始する周波数を下げる。逆に圧縮率が所定
の値よりも小さい場合、つまり圧縮率が低い場合には、
ステップS25で、より狭い周波数帯域で強度ステレオ
処理を開始する周波数を上げる。
Next, a step S24 compares the compression rate with a predetermined value set in advance. If the compression rate is higher than the predetermined value, that is, if the compression rate is high, the frequency at which the intensity stereo processing is started in a wider frequency band is lowered in step S25. Conversely, if the compression rate is smaller than the predetermined value, that is, if the compression rate is low,
In step S25, the frequency at which the intensity stereo process is started in a narrower frequency band is increased.

【0035】このようなステップS4によれば、圧縮率
が高い場合には、より広い周波数帯域で強度ステレオ処
理を行うことにより、情報量の節約ができ、圧縮効率を
高めることができる。また、ステップS4によれば、圧
縮率が低い場合には、より狭い周波数帯域で強度ステレ
オ処理を行うことにより、強度ステレオ処理の欠点であ
る定位の劣化を最小にすることができる。
According to step S4 as described above, when the compression rate is high, the intensity stereo processing is performed in a wider frequency band, so that the amount of information can be saved and the compression efficiency can be improved. Further, according to step S4, when the compression rate is low, by performing the intensity stereo process in a narrower frequency band, it is possible to minimize the degradation of localization, which is a drawback of the intensity stereo process.

【0036】図3は、本発明に係る第3の実施の形態に
おけるステップS4を示すフローチャートである。
FIG. 3 is a flowchart showing step S4 in the third embodiment of the present invention.

【0037】同図に示すように、ステップS4は、上記
ステップS21と、上記ステップS22と、上記ステッ
プS23と、ステップS23で算出した圧縮率を基に判
定閾値を算出する判定閾値算出工程としてのステップS
31と、ステップS31で算出した判定閾値を基に左右
チャンネルの近似度を算出する近似度算出工程としての
ステップS32と、判定閾値と圧縮率を比較した結果を
出力する近似度判定処理工程としてのステップS33
と、ステップS33の結果より強度ステレオ処理を開始
する周波数を設定するIS周波数限度設定工程としての
ステップS34とを有している。
As shown in the figure, step S4 is a judgment threshold value calculating step for calculating a judgment threshold value based on the compression rates calculated in step S21, step S22, step S23, and step S23. Step S
31, step S32 as an approximation degree calculating step of calculating the approximation degree of the left and right channels based on the determination threshold value calculated in step S31, and an approximation degree determination processing step of outputting a result of comparing the determination threshold value and the compression rate. Step S33
And step S34 as an IS frequency limit setting step of setting the frequency at which the intensity stereo processing is started based on the result of step S33.

【0038】次に、このステップS4の処理の流れにつ
いて説明する。
Next, the flow of processing in step S4 will be described.

【0039】ステップS4において、強度ステレオ処理
は、左右チャンネルの符号化モードが違う場合には使用
できないため、まずステップS21を用いて、強度ステ
レオが使用可能か否かの判定をステップS22において
行う。入力信号がモノラルなどの符号化モードが異なる
場合(NOの場合)には、処理を終了する(END)。
強度ステレオ処理が可能であると判定される(YESで
ある)と、ステップS23は、ステップS21より得ら
れるビットレートとサンプリング周波数およびチャンネ
ル数から例えば、下記の(1)に示す計算式により圧縮
率を算出する。
In step S4, the intensity stereo process cannot be used when the coding modes of the left and right channels are different. Therefore, first in step S21, it is determined in step S22 whether or not intensity stereo can be used. When the input signal is in a different encoding mode such as monaural (NO), the process is ended (END).
If it is determined that the intensity stereo processing is possible (YES), a step S23 determines a compression rate from the bit rate, the sampling frequency, and the number of channels obtained in the step S21, for example, by the calculation formula shown in (1) below. To calculate.

【数1】 [Equation 1]

【0040】次に、ステップS31は、圧縮率とあらか
じめ設定した所定の値と大小を比較することにより、判
定閾値を算出する。判定閾値は、圧縮率が高い場合に
は、強度ステレオ処理を行う周波数帯域を広くとれるよ
うな値をセットしておく。また、判定閾値は、圧縮率の
大きさによって、数段階の閾値を設定することもでき
る。
Next, in step S31, a judgment threshold value is calculated by comparing the compression rate with a predetermined value that is set in advance. When the compression rate is high, the determination threshold value is set to a value that allows a wide frequency band in which the intensity stereo processing is performed. Further, as the determination threshold, it is possible to set several levels of thresholds depending on the size of the compression rate.

【0041】次いで、ステップS32は、左右チャンネ
ル信号の相互相関値や左右チャンネル信号の比の標準偏
差を用いて近似度を算出する。続いて、ステップS33
は、ステップS31で算出された判定閾値とステップS
32で算出された近似度の比較を行い、この近似度が判
定閾値よりも大きい場合、つまり圧縮率が高く、左右チ
ャンネル信号の近似度が高い場合には、ステップS34
においてより広い周波数で強度ステレオを行えるように
強度ステレオ処理を開始する周波数を低く、例えば3k
Hzに設定する。一方、近似度が判定閾値よりも小さい
場合、つまり圧縮率が低く、左右チャンネル信号の近似
度が低い場合には、ステップS34において強度ステレ
オ処理を開始する周波数を高く、例えば6kHzに設定
する。圧縮率が非常に低く、左右チャンネル信号の近似
度が非常に低い場合には、強度ステレオ処理を行わない
ような周波数に設定することもできる。
Next, in step S32, the degree of approximation is calculated using the cross-correlation value of the left and right channel signals and the standard deviation of the ratio of the left and right channel signals. Then, step S33.
Is the judgment threshold value calculated in step S31 and step S
The approximations calculated in 32 are compared, and if the approximations are larger than the determination threshold, that is, if the compression rate is high and the left and right channel signals are high, the step S34
In order to perform intensity stereo at a wider frequency, the frequency at which intensity stereo processing is started is low, for example 3k.
Set to Hz. On the other hand, when the degree of approximation is smaller than the determination threshold, that is, when the compression rate is low and the degree of approximation of the left and right channel signals is low, the frequency at which the intensity stereo processing is started is set high in step S34, for example, 6 kHz. When the compression rate is very low and the degree of approximation of the left and right channel signals is very low, the frequency may be set so that the intensity stereo process is not performed.

【0042】このようなステップS4によれば、入力信
号の特性によって強度ステレオ処理を行う周波数帯域を
適応的に設定することよって強度ステレオ処理による定
位の劣化が起こらず、圧縮効率の高い符号化を行うこと
ができる。
According to step S4 as described above, by adaptively setting the frequency band in which the intensity stereo processing is performed according to the characteristics of the input signal, localization deterioration due to the intensity stereo processing does not occur, and encoding with high compression efficiency is performed. It can be carried out.

【0043】図4は、本発明に係る第4の実施の形態に
おけるステップS5を示すフローチャートである。
FIG. 4 is a flowchart showing step S5 in the fourth embodiment of the present invention.

【0044】同図に示すように、ステップS5は、sf
bとIS周波数限度を比較するスケールファクタバンド
判定工程としてのステップS41と、ステップS41で
比較したsfbとIS周波数限度を基に左右チャンネル
の近似度を算出する近似度算出工程としてのステップS
42と、ステップS42で算出した近似度とあらかじめ
設定された閾値との大小を比較する近似度判定処理工程
としてのステップS43と、ステップS43からの入力
信号を効率よく処理するモジュールの一つであり、2つ
のチャンネルの代わりに両方のチャンネルの連結エネル
ギーと指向情報に変換する強度ステレオ処理工程として
のステップS46とを有している。
As shown in the figure, step S5 is sf
b as a scale factor band determination step of comparing the IS frequency limit with step S41, and step S41 as an approximation degree calculating step of calculating the degree of approximation of the left and right channels based on the sfb and the IS frequency limit compared in step S41.
42, step S43 as an approximation degree determination processing step of comparing the degree of approximation calculated in step S42 with a preset threshold value, and one of the modules for efficiently processing the input signal from step S43. Instead of the two channels, it has a connection energy of both channels and a step S46 as an intensity stereo processing step for converting into directional information.

【0045】次に、このステップS5の処理の流れにつ
いて説明する。
Next, the flow of processing in step S5 will be described.

【0046】まず、sfbを0(ゼロ)にセットする。
ステップS41において強度ステレオ処理を行うsfb
とIS周波数限度を比較し、強度ステレオ処理を行うs
fbがIS周波数限度より大きい場合(YESの場合)
は、ステップS42に進む。強度ステレオ処理を行うs
fbがIS周波数限度より小さい場合(NOの場合)
は、sfbを1上げ、ステップS41に戻る。ステップ
S42は、左右チャンネル信号の相互相関値や左右チャ
ンネル信号の比の標準偏差を用いて近似度を算出する。
First, sfb is set to 0 (zero).
Sfb for performing intensity stereo processing in step S41
And IS frequency limit are compared, and intensity stereo processing is performed.
If fb is greater than the IS frequency limit (if YES)
Proceeds to step S42. Intensity stereo processing
When fb is smaller than IS frequency limit (when NO)
Raises sfb by 1 and returns to step S41. A step S42 calculates the degree of approximation using the cross-correlation value of the left and right channel signals and the standard deviation of the ratio of the left and right channel signals.

【0047】次いで、ステップS43は、ステップS4
2で算出された近似度とあらかじめ設定された閾値との
比較を行い、近似度が前記あらかじめ設定された閾値よ
りも大きい場合、つまり左右チャンネル信号が似ている
信号である場合(YESの場合)は、ステップS46に
進み、強度ステレオ処理を行う。一方、近似度が前記あ
らかじめ設定された閾値よりも小さい場合、つまり左右
チャンネル信号が非常に異なる場合(NOの場合)に
は、強度ステレオ処理をそのsfbでは行わない。次
に、sfbを1上げ、ステップS41に戻る。以上のス
テップをsfbの最大値まで繰り返す。
Next, in step S43, step S4 is performed.
The degree of approximation calculated in 2 is compared with a preset threshold value, and when the degree of approximation is larger than the preset threshold value, that is, when the left and right channel signals are similar signals (in the case of YES) Advances to step S46 to perform intensity stereo processing. On the other hand, when the degree of approximation is smaller than the preset threshold value, that is, when the left and right channel signals are very different (NO), the intensity stereo process is not performed in sfb. Next, sfb is increased by 1, and the process returns to step S41. The above steps are repeated up to the maximum value of sfb.

【0048】このようなステップS5によれば、圧縮率
が高く、多くのsfbで強度ステレオ処理を使用して圧
縮効率を高めようと、強度ステレオ処理を開始するsf
bを下げた場合、強度ステレオ処理を行うsfbの中に
定位の劣化をもたらすsfbにおいて強度ステレオ処理
を行わないようにすることができる。そのため、ステッ
プS5によれば、強度ステレオ処理による定位の劣化が
生じず、また音質の影響の少ない高い周波数帯域におい
てより強度ステレオ処理を実行することができるように
なるため、圧縮効率を高めることができる。
According to such step S5, the compression ratio is high, and the intensity stereo process is started in order to increase the compression efficiency by using the intensity stereo process in many sfb.
When b is lowered, it is possible to prevent the intensity stereo processing from being performed in sfb which causes localization deterioration in the sfb in which the intensity stereo processing is performed. Therefore, according to step S5, the degradation of the localization due to the intensity stereo process does not occur, and the intensity stereo process can be further executed in the high frequency band in which the influence of the sound quality is small, so that the compression efficiency can be improved. it can.

【0049】図5は、本発明に係る第5の実施の形態に
おけるステップS5を示すフローチャートである。
FIG. 5 is a flowchart showing step S5 in the fifth embodiment of the present invention.

【0050】同図に示すように、ステップS5は、上記
ステップS41と、ステップS41で比較したsfbと
IS周波数限度を基に判定閾値を算出する判定閾値算出
工程としてのステップS51と、ステップS51で算出
した判定閾値を基に左右チャンネルの近似度を算出する
近似度算出工程としてのステップS52と、ステップS
51で算出した判定閾値とステップS52で算出した近
似度とを比較する近似度判定処理工程としてのステップ
S53と、ステップS5からの入力信号を効率よく処理
するモジュールの一つであり、2つのチャンネルの代わ
りに両方のチャンネルの連結エネルギーと指向情報に変
換する強度ステレオ処理工程としてのステップS56と
を有している。
As shown in the figure, step S5 includes step S51, which is a determination threshold value calculating step for calculating a determination threshold value based on the sfb and IS frequency limit compared with step S41. Step S52 as an approximation degree calculating step of calculating the approximation degree of the left and right channels based on the calculated determination threshold;
Step S53 as an approximation degree determination processing step of comparing the determination threshold value calculated in step 51 with the approximation degree calculated in step S52, and one of the modules that efficiently processes the input signal from step S5. Instead of step S56, there is a connection energy of both channels and step S56 as an intensity stereo processing step of converting into directional information.

【0051】次に、このステップS5の処理の流れにつ
いて説明する。
Next, the flow of processing in step S5 will be described.

【0052】まずsfbを0にセットする。ステップS
41において強度ステレオ処理を行うsfbとIS周波
数限度を比較し、強度ステレオ処理を行うsfbがIS
周波数限度より大きい場合(YESの場合)は、ステッ
プS51に進む。強度ステレオ処理を行うsfbがIS
周波数限度より小さい場合(NOの場合)は、sfbを
1上げ、ステップS41に戻る。ステップS51は、音
質の影響の少ない高周波数帯域については、強度ステレ
オ処理を行いやすくするように判定閾値を設定し、音質
の影響の多い低周波数帯域については、強度ステレオ処
理を制限するように判定閾値を設定する。なお、この判
定閾値を圧縮率の大小によって調整することもできる。
First, sfb is set to 0. Step S
In 41, sfb performing intensity stereo processing is compared with IS frequency limit, and sfb performing intensity stereo processing is IS.
When it is larger than the frequency limit (in the case of YES), the process proceeds to step S51. IS is the sfb that performs intensity stereo processing
When it is smaller than the frequency limit (in the case of NO), sfb is increased by 1, and the process returns to step S41. A step S51 sets a determination threshold value so as to facilitate the intensity stereo processing for the high frequency band having a small influence of the sound quality, and makes a determination so as to limit the intensity stereo processing for the low frequency band having a large influence of the sound quality. Set the threshold. It should be noted that this determination threshold can be adjusted depending on the size of the compression rate.

【0053】次に、ステップS52は、左右チャンネル
信号の相互相関値や左右チャンネル信号の比の標準偏差
を用いて近似度を算出する。次いで、ステップS53
は、ステップS51で算出された判定閾値とステップS
52で設定された近似度との比較を行い、各sfbにお
いて近似度が判定閾値よりも大きい場合、つまり左右チ
ャンネル信号が似ている信号である場合(YESの場
合)は、ステップS56に進み、強度ステレオ処理を行
う。各sfbにおいて近似度が判定閾値よりも小さい場
合、つまり左右チャンネル信号が非常に異なる場合(N
Oの場合)には、強度ステレオ処理をそのsfbでは行
わない。続いて、sfbを1上げ、ステップS41に戻
る。以上のステップをsfbの最大値まで繰り返す。
Next, in step S52, the degree of approximation is calculated using the cross-correlation value of the left and right channel signals and the standard deviation of the ratio of the left and right channel signals. Then, step S53
Is the judgment threshold value calculated in step S51 and step S
If the degree of approximation in each sfb is greater than the determination threshold, that is, if the left and right channel signals are similar signals (in the case of YES), the process proceeds to step S56. Intensity stereo processing is performed. In each sfb, when the degree of approximation is smaller than the determination threshold, that is, when the left and right channel signals are very different (N
In the case of O), intensity stereo processing is not performed in the sfb. Then, sfb is increased by 1, and the process returns to step S41. The above steps are repeated up to the maximum value of sfb.

【0054】このようなステップS5によれば、圧縮率
が高く、多くのsfbで強度ステレオ処理を使用して圧
縮効率を高めようと、強度ステレオ処理を開始するsf
bを下げた場合、強度ステレオ処理を行うsfbの中に
定位の劣化をもたらすsfbが存在していても強度ステ
レオ処理を行わないようにすることができる。そのた
め、ステップS5によれば、強度ステレオ処理による定
位の劣化が生じず、また音質の影響の少ない高い周波数
帯域においてより強度ステレオ処理を実行することがで
きるようになるため、圧縮効率を高めることができる。
According to such step S5, the compression ratio is high, and the intensity stereo process is started in order to increase the compression efficiency by using the intensity stereo process in many sfb.
When b is lowered, it is possible not to perform the intensity stereo process even if the sfb that causes the localization deterioration exists in the sfb for which the intensity stereo process is performed. Therefore, according to step S5, the degradation of the localization due to the intensity stereo process does not occur, and the intensity stereo process can be further executed in the high frequency band in which the influence of the sound quality is small, so that the compression efficiency can be improved. it can.

【0055】以上、各実施の形態において説明したマル
チチャンネルオーディオ信号符号化方法は、コンピュー
タなどに実行させることができるソフトウェアプログラ
ムとして、例えば、磁気ディスク、光ディスク、半導体
メモリなどのいかなる記録媒体でも、それに記録または
格納する方法として実施することができる。なお、磁気
ディスクとしては、フロッピー(登録商標)ディスク、
ハードディスク等があり、光ディスクとしては、CD―
ROM、DVD等がある。
The multi-channel audio signal encoding method described in each of the above embodiments can be used as a software program that can be executed by a computer, for example, on any recording medium such as a magnetic disk, an optical disk, a semiconductor memory, or the like. It can be implemented as a method of recording or storing. As the magnetic disk, a floppy (registered trademark) disk,
There is a hard disk, etc., and as an optical disc, CD-
There are ROM, DVD, etc.

【0056】また、各実施の形態において説明したマル
チチャンネルオーディオ信号符号化方法を用いて、図示
しないがマルチチャンネルオーディオ信号符号化装置
は、入力信号を量子化、符号化しているので、上記各実
施の形態におけるマルチチャンネルオーディオ信号符号
化方法と同様の効果を得ることができる。
Further, although the multi-channel audio signal encoding device (not shown) quantizes and encodes the input signal by using the multi-channel audio signal encoding method described in each embodiment, each of the above-mentioned respective embodiments is performed. It is possible to obtain an effect similar to that of the multi-channel audio signal encoding method in the form.

【0057】さらに、図示しないが記録媒体は、各実施
の形態において説明したマルチチャンネルオーディオ信
号符号化方法のステップが記録されているので、上記各
実施の形態におけるマルチチャンネルオーディオ信号符
号化方法と同様の効果を得ることができる。
Further, although not shown, the recording medium has recorded therein the steps of the multi-channel audio signal encoding method described in each of the embodiments, and therefore, the same as the multi-channel audio signal encoding method in each of the above-mentioned embodiments. The effect of can be obtained.

【0058】しかも、図示しないが音楽配信システム
は、この記録媒体を構成要素としているので、上記各実
施の形態におけるマルチチャンネルオーディオ信号符号
化方法と同様の効果を得ることができる。また、音楽配
信システムは、マルチチャンネルオーディオ信号符号化
方法を用いて音楽が配信されているので、上記各実施の
形態におけるマルチチャンネルオーディオ信号符号化方
法と同様の効果を得ることができる。
Further, although not shown, the music distribution system has this recording medium as a constituent element, so that it is possible to obtain the same effect as the multi-channel audio signal encoding method in each of the above-mentioned embodiments. Further, in the music distribution system, since music is distributed by using the multi-channel audio signal encoding method, it is possible to obtain the same effect as the multi-channel audio signal encoding method in each of the above embodiments.

【0059】上記各実施の形態では、図1〜図5のフロ
ーチャートを参照して、マルチチャンネルオーディオ信
号符号化方法の処理の流れについて説明したが、以下、
マルチチャンネルオーディオ信号符号化方法を用いるマ
ルチチャンネルオーディオ信号符号化装置について、図
面を参照しながら説明する。
In each of the above embodiments, the flow of processing of the multi-channel audio signal encoding method has been described with reference to the flow charts of FIGS. 1 to 5.
A multi-channel audio signal coding apparatus using the multi-channel audio signal coding method will be described with reference to the drawings.

【0060】図6は、上述した第1の実施の形態におけ
るマルチチャンネルオーディオ信号符号化方法を用いる
マルチチャンネルオーディオ信号符号化装置を示すブロ
ック図である。
FIG. 6 is a block diagram showing a multi-channel audio signal coding apparatus using the multi-channel audio signal coding method in the above-mentioned first embodiment.

【0061】同図に示すように、マルチチャンネルオー
ディオ信号符号化装置は、入力信号から聴覚心理モデル
に基づく信号対マスク比の値を算出する聴覚心理分析手
段1と、もう一方の時間領域の入力信号を周波数領域の
スペクトルデータに変換する時間/周波数マッピング手
段2と、量子化雑音の時間的な形状を制御するTNS処
理手段3と、強度ステレオを開始する周波数を算出する
強度ステレオ周波数限度算出手段4と、sfbごとに左
右チャンネル信号の近似度に応じて強度ステレオ処理を
行うか判定を行う帯域毎強度ステレオ判定手段5と、入
力信号を効率よく処理するモジュールの一つであり、2
つのチャンネルの代わりに両方のチャンネルの連結エネ
ルギーと指向情報に変換する強度ステレオ処理手段6
と、左右チャンネル信号を和信号および差信号に変換す
る和差ステレオ処理手段7と、和差ステレオ処理手段7
で施された入力信号を量子化、符号化する量子化/符号
化手段8と、量子化/符号化手段8の出力と制御情報を
多重化し、ビットストリームとして整形するビットスト
リーム生成形成手段10とを有している。
As shown in the figure, the multi-channel audio signal encoding apparatus has a psychoacoustic analysis means 1 for calculating a value of a signal-to-mask ratio based on a psychoacoustic model from an input signal, and another input for the time domain. Time / frequency mapping means 2 for converting a signal into frequency domain spectrum data, TNS processing means 3 for controlling the temporal shape of quantization noise, and intensity stereo frequency limit calculation means for calculating a frequency at which intensity stereo is started. 4, an intensity stereo determination unit 5 for each band that determines whether intensity stereo processing is performed for each sfb according to the degree of approximation of the left and right channel signals, and one of the modules that efficiently processes the input signal.
Intensity stereo processing means 6 for converting connection energy and directional information of both channels instead of one channel
A sum difference stereo processing means 7 for converting the left and right channel signals into a sum signal and a difference signal, and a sum difference stereo processing means 7
A quantizing / encoding means 8 for quantizing and encoding the input signal subjected to 1., and a bitstream generating / forming means 10 for multiplexing the output of the quantizing / encoding means 8 and control information and shaping it as a bitstream. have.

【0062】次に、このマルチチャンネルオーディオ信
号符号化装置の動作について説明する。
Next, the operation of this multi-channel audio signal encoding device will be described.

【0063】まず、入力信号は、聴覚心理分析手段1に
より聴覚心理モデルに基づく、信号対マスク比の値を算
出する。もう一方の入力信号は、時間/周波数マッピン
グ手段2により、MDCT変換などの変換を用いて、時
間領域から周波数領域のスペクトルデータに変換され
る。
First, for the input signal, the psychoacoustic analysis means 1 calculates the value of the signal-to-mask ratio based on the psychoacoustic model. The other input signal is converted by the time / frequency mapping means 2 from the time domain into the spectrum data in the frequency domain using a transformation such as MDCT transformation.

【0064】次に、TNS処理手段3は、変換されたス
ペクトルデータを基に量子化雑音の時間的な形状を制御
する。次いで、強度ステレオ周波数限度算出手段4は、
制御された形状を基に強度ステレオを開始する周波数で
あるIS周波数限度を算出する。続いて、帯域毎強度ス
テレオ判定手段5は、IS周波数限度以上の周波数にお
いて、sfb毎に入力信号の左右チャンネル信号の近似
度に応じて強度ステレオ処理を行うか否かの判定を行
う。強度ステレオ処理手段6は、帯域毎強度ステレオ判
定手段5において強度ステレオ処理を行うことができる
と判定されると強度ステレオ処理を行う。次に、和差ス
テレオ処理手段7は、左右チャンネル信号をそれぞれ和
信号および差信号に変換する。次いで、量子化/符号化
処理手段8は、和差ステレオ処理手段7で処理が施され
た入力信号を量子化、符号化する。ビットストリーム生
成形成手段10は、量子化/符号化処理手段8の出力と
制御情報を多重化し、ビットストリームとして整形す
る。
Next, the TNS processing means 3 controls the temporal shape of the quantization noise based on the converted spectrum data. Then, the intensity stereo frequency limit calculation means 4
Calculate the IS frequency limit, which is the frequency at which intensity stereo starts based on the controlled shape. Subsequently, the band-based intensity stereo determination means 5 determines whether or not to perform intensity stereo processing for each sfb at a frequency equal to or higher than the IS frequency limit, according to the degree of approximation of the left and right channel signals of the input signal. The intensity stereo processing means 6 performs the intensity stereo processing when it is determined by the intensity stereo determination means 5 for each band that the intensity stereo processing can be performed. Next, the sum / difference stereo processing means 7 converts the left and right channel signals into a sum signal and a difference signal, respectively. Then, the quantization / encoding processing means 8 quantizes and encodes the input signal processed by the sum difference stereo processing means 7. The bitstream generation / formation unit 10 multiplexes the output of the quantization / encoding processing unit 8 and the control information and shapes them as a bitstream.

【0065】このようなマルチチャンネルオーディオ信
号符号化装置によれば、入力信号の特性および圧縮率に
よって、強度ステレオを開始する周波数を適応的に変動
させ、また入力信号の特性および圧縮率によって、sf
b単位での実行/不実行を制御するので、強度ステレオ
処理の欠点である定位感の劣化を最小とし、かつ高い圧
縮効率を得ることができる。
According to such a multi-channel audio signal coding apparatus, the frequency at which intensity stereo is started is adaptively changed according to the characteristics and compression rate of the input signal, and sf is changed according to the characteristics and compression rate of the input signal.
Since execution / non-execution is controlled in units of b, it is possible to minimize deterioration of localization, which is a drawback of intensity stereo processing, and obtain high compression efficiency.

【0066】図7は、上述した第2の実施の形態におけ
るステップS4を用いる強度ステレオ周波数限度算出手
段4を示すブロック図である。
FIG. 7 is a block diagram showing the intensity stereo frequency limit calculating means 4 using step S4 in the above-described second embodiment.

【0067】同図に示すように、強度ステレオ周波数限
度算出手段4は、ビットレートやサンプリング周波数な
どの符号化に必要な符号化モード情報を設定するための
符号化モード情報手段21と、前記符号化モード情報よ
り強度ステレオが使用可能か否かの判定を行う強度ステ
レオ前処理手段22と、前記符号化モード情報より得ら
れるビットレート、サンプリング周波数、チャンネル数
等の情報より圧縮率を算出する圧縮率算出手段23と、
圧縮率と所定の値との大小を比較した結果を出力する負
荷判定手段24と、負荷判定手段24の結果より強度ス
テレオ処理を開始する周波数を設定するIS周波数限度
設定手段25とを有している。
As shown in the figure, the intensity stereo frequency limit calculating means 4 has a coding mode information means 21 for setting coding mode information necessary for coding such as a bit rate and a sampling frequency, and the code. Intensity stereo preprocessing means 22 for determining whether or not intensity stereo can be used from the encoding mode information, and compression for calculating a compression rate from information such as the bit rate, sampling frequency, and number of channels obtained from the encoding mode information. Rate calculating means 23,
The load determining means 24 outputs a result of comparing the compression rate with a predetermined value, and the IS frequency limit setting means 25 sets a frequency for starting the intensity stereo processing based on the result of the load determining means 24. There is.

【0068】次に、この強度ステレオ周波数限度算出手
段4の動作について説明する。
Next, the operation of the intensity stereo frequency limit calculating means 4 will be described.

【0069】強度ステレオ周波数限度算出手段4におい
て、強度ステレオ処理は、左右チャンネルの符号化モー
ドが違う場合には使用できないため、まず符号化モード
情報手段21を用いて、強度ステレオが使用可能か否か
の判定を行う。入力信号がモノラルなどの符号化モード
が異なる場合には以降の動作は行われない。強度ステレ
オ処理が可能であると判定されると、圧縮率算出手段2
3は、符号化モード情報手段21より得られるビットレ
ートとサンプリング周波数およびチャンネル数から例え
ば、下記の数式1に示す計算により圧縮率を算出する。
In the intensity stereo frequency limit calculation means 4, intensity stereo processing cannot be used when the left and right channel encoding modes are different. Therefore, first, the encoding mode information means 21 is used to determine whether or not intensity stereo can be used. Whether or not it is determined. When the input signal is in a different encoding mode such as monaural, the subsequent operation is not performed. When it is determined that the intensity stereo processing can be performed, the compression rate calculation means 2
3 calculates the compression rate from the bit rate, the sampling frequency, and the number of channels obtained from the encoding mode information means 21, for example, by the calculation shown in Formula 1 below.

【数1】 [Equation 1]

【0070】次に、負荷判定手段24は、圧縮率とあら
かじめ設定した所定の値との大小比較を行う。圧縮率が
所定の値よりも大きい場合、つまり圧縮率が高い場合に
は、IS周波数限度設定手段25は、強度ステレオ処理
を開始する周波数を下げる。逆に圧縮率が所定の値より
も小さい場合、つまり圧縮率が低い場合には、IS周波
数限度設定手段25で、強度ステレオ処理を開始する周
波数を上げる。
Next, the load judging means 24 compares the compression rate with a predetermined value set in advance. When the compression rate is higher than the predetermined value, that is, when the compression rate is high, the IS frequency limit setting unit 25 lowers the frequency at which the intensity stereo process is started. On the contrary, when the compression rate is smaller than the predetermined value, that is, when the compression rate is low, the IS frequency limit setting means 25 increases the frequency at which the intensity stereo processing is started.

【0071】このような強度ステレオ周波数限度算出手
段4によれば、圧縮率が高い場合には、より広い周波数
帯域で強度ステレオ処理を行うことにより、情報量の節
約ができ、圧縮効率を高めることができる。また、強度
ステレオ周波数限度算出手段4によれば、圧縮率が低い
場合には、より狭い周波数帯域で強度ステレオ処理を行
うことにより、強度ステレオ処理の欠点である定位の劣
化を最小にすることができる。
According to the intensity stereo frequency limit calculating means 4 as described above, when the compression rate is high, the intensity stereo processing is performed in a wider frequency band, so that the amount of information can be saved and the compression efficiency can be improved. You can Further, according to the intensity stereo frequency limit calculation means 4, when the compression rate is low, the intensity stereo processing is performed in a narrower frequency band, thereby minimizing the deterioration of localization, which is a drawback of the intensity stereo processing. it can.

【0072】図8は、上述した第3の実施の形態におけ
るステップS4を用いる強度ステレオ周波数限度算出手
段4を示すブロック図である。
FIG. 8 is a block diagram showing the intensity stereo frequency limit calculating means 4 using step S4 in the above-mentioned third embodiment.

【0073】同図に示すように、強度ステレオ周波数限
度算出手段4は、上記符号化モード情報手段21と、上
記強度ステレオ前処理手段22と、上記圧縮率算出手段
23と、圧縮率算出手段23で算出した圧縮率を基に判
定閾値を算出する判定値算出手段31と、判定値算出手
段31で算出した判定閾値を基に左右チャンネルの近似
度を算出する近似度算出手段32と、判定閾値と圧縮率
を比較した結果を出力する近似度判定処理手段33と、
近似度判定処理手段33の結果より強度ステレオ処理を
開始する周波数を設定するIS周波数限度設定手段25
とを有している。
As shown in the figure, the intensity stereo frequency limit calculation means 4 includes the encoding mode information means 21, the intensity stereo preprocessing means 22, the compression rate calculation means 23, and the compression rate calculation means 23. A judgment value calculation means 31 for calculating a judgment threshold value based on the compression ratio calculated in step 1, an approximation degree calculation means 32 for calculating an approximation degree for the left and right channels based on the judgment threshold value calculated by the judgment value calculation means 31, and a judgment threshold value And an approximation degree determination processing unit 33 that outputs a result of comparing the compression rate with
The IS frequency limit setting means 25 for setting the frequency at which the intensity stereo processing is started based on the result of the similarity determination processing means 33.
And have.

【0074】次に、この強度ステレオ周波数限度算出手
段4の動作について説明する。
Next, the operation of the intensity stereo frequency limit calculating means 4 will be described.

【0075】強度ステレオ周波数限度算出手段4におい
て、強度ステレオ処理は、左右チャンネルの符号化モー
ドが違う場合には使用できないため、まず符号化モード
情報手段21を用いて、強度ステレオが使用可能か否か
の判定を強度ステレオ前処理手段22において行う。入
力信号がモノラルなどの符号化モードが異なる場合には
以降の動作は行われない。強度ステレオ処理が可能であ
ると判定されると、圧縮率算出手段23は、符号化モー
ド情報手段21より得られるビットレートとサンプリン
グ周波数およびチャンネル数から例えば、下記の(1)
に示す計算により圧縮率を算出する。
In the intensity stereo frequency limit calculation means 4, intensity stereo processing cannot be used when the left and right channel encoding modes are different. Therefore, first, the encoding mode information means 21 is used to determine whether or not intensity stereo can be used. The determination is made by the intensity stereo preprocessing means 22. When the input signal is in a different encoding mode such as monaural, the subsequent operation is not performed. When it is determined that the intensity stereo processing is possible, the compression rate calculation means 23 uses, for example, the following (1) from the bit rate, the sampling frequency, and the number of channels obtained from the coding mode information means 21.
The compression ratio is calculated by the calculation shown in.

【数1】 [Equation 1]

【0076】次に、判定閾値算出手段31は、圧縮率と
あらかじめ設定した所定の値と大小を比較することによ
り判定閾値を算出する。判定閾値は、圧縮率が高い場合
には、強度ステレオ処理を行う周波数帯域を広くとれる
ような値をセットしておく。また、判定閾値は、圧縮率
の大きさによって、数段階の閾値を設定することもでき
る。
Next, the judgment threshold value calculation means 31 calculates the judgment threshold value by comparing the compression rate with a predetermined value set in advance to determine the magnitude. When the compression rate is high, the determination threshold value is set to a value that allows a wide frequency band in which the intensity stereo processing is performed. Further, as the determination threshold, it is possible to set several levels of thresholds depending on the size of the compression rate.

【0077】次いで、近似度算出手段32は、左右チャ
ンネル信号の相互相関値や左右チャンネル信号の比の標
準偏差を用いて近似度を算出する。続いて、近似度判定
処理手段33は、判定閾値算出手段31で算出された判
定閾値と近似度算出手段32で算出された近似度の比較
を行い、この近似度が判定閾値よりも大きい場合、つま
り圧縮率が高く、左右チャンネル信号の近似度が高い場
合には、IS周波数限度設定手段34においてより広い
周波数で強度ステレオを行えるように強度ステレオ処理
を開始する周波数を低く、例えば3kHzに設定する。
一方、近似度が判定閾値よりも小さい場合、つまり圧縮
率が低く、左右チャンネル信号の近似度が低い場合に
は、IS周波数限度設定手段34において強度ステレオ
処理を開始する周波数を高く、例えば6kHzに設定す
る。圧縮率が非常に低く、左右チャンネル信号の近似度
が非常に低い場合には、強度ステレオ処理を行わないよ
うな周波数に設定することもできる。
Next, the approximation degree calculating means 32 calculates the approximation degree using the cross-correlation value of the left and right channel signals and the standard deviation of the ratio of the left and right channel signals. Subsequently, the approximation degree determination processing unit 33 compares the determination threshold value calculated by the determination threshold value calculation unit 31 and the approximation degree calculated by the approximation degree calculation unit 32, and when the approximation degree is larger than the determination threshold value, That is, when the compression rate is high and the closeness of the left and right channel signals is high, the frequency at which the intensity stereo processing is started is set low, for example, 3 kHz in the IS frequency limit setting means 34 so that intensity stereo can be performed at a wider frequency. .
On the other hand, when the degree of approximation is smaller than the determination threshold, that is, when the compression rate is low and the degree of approximation of the left and right channel signals is low, the frequency at which the intensity stereo processing is started in the IS frequency limit setting means 34 is high, for example, 6 kHz. Set. When the compression rate is very low and the degree of approximation of the left and right channel signals is very low, the frequency may be set so that the intensity stereo process is not performed.

【0078】このような強度ステレオ周波数限度算出手
段4によれば、入力信号の特性によって強度ステレオ処
理を行う周波数帯域を適応的に設定することよって強度
ステレオ処理による定位の劣化が起こらず、圧縮効率の
高い符号化を行うことができる。
According to the intensity stereo frequency limit calculating means 4 as described above, the frequency band for performing the intensity stereo processing is adaptively set according to the characteristics of the input signal, so that the localization deterioration due to the intensity stereo processing does not occur, and the compression efficiency is reduced. It is possible to perform high encoding.

【0079】図9は、上述した第4の実施の形態におけ
るステップS5を用いる帯域毎強度ステレオ判定手段5
を示すブロック図である。
FIG. 9 is a band-wise intensity stereo determination means 5 using step S5 in the above-described fourth embodiment.
It is a block diagram showing.

【0080】同図に示すように、帯域毎強度ステレオ判
定手段5は、近似度算出手段32と、近似度算出手段3
2で算出した近似度とあらかじめ設定された閾値との大
小を比較する近似度判定処理手段43と、近似度判定処
理手段43からの入力信号を効率よく処理するモジュー
ルの一つであり、2つのチャンネルの代わりに両方のチ
ャンネルの連結エネルギーと指向情報に変換する強度ス
テレオ処理手段46とを有している。
As shown in the figure, the intensity stereo determination means 5 for each band includes an approximation degree calculation means 32 and an approximation degree calculation means 3.
It is one of the modules for efficiently processing the input signal from the approximation degree determination processing means 43 and the approximation degree determination processing means 43 for comparing the magnitude of the approximation degree calculated in 2 with a preset threshold value. Instead of channels, it has connection energy of both channels and intensity stereo processing means 46 for converting it into directional information.

【0081】次に、この帯域毎強度ステレオ判定手段5
の動作について説明する。
Next, the intensity stereo determination means 5 for each band
The operation of will be described.

【0082】まず、近似度算出手段32において強度ス
テレオ処理を行うsfbで、左右チャンネル信号の相互
相関値や左右チャンネル信号の比の標準偏差を用いて近
似度を算出する。次いで、近似度判定処理手段43は、
近似度算出手段32で算出された近似度と前記あらかじ
め設定された閾値との比較をsfb毎に行い、近似度が
前記あらかじめ設定された閾値よりも大きい場合、つま
り左右チャンネル信号が似ている信号である場合は、強
度ステレオ許可フラグをそのsfbに立てる。
First, in sfb for performing intensity stereo processing in the approximation degree calculating means 32, the approximation degree is calculated using the cross-correlation value of the left and right channel signals and the standard deviation of the ratio of the left and right channel signals. Next, the approximation degree determination processing means 43
The degree of approximation calculated by the degree-of-approximation calculating unit 32 is compared with the preset threshold value for each sfb, and when the degree of approximation is larger than the preset threshold value, that is, a signal in which the left and right channel signals are similar to each other. If so, the intensity stereo permission flag is set to the sfb.

【0083】一方、近似度が前記あらかじめ設定された
閾値よりも小さい場合、つまり左右チャンネル信号が非
常に異なる場合には、強度ステレオ許可フラグをそのs
fbには立てない。強度ステレオ処理手段46は、近似
度判定処理手段43において強度ステレオ許可フラグが
立っているsfbで強度ステレオ処理を行う。
On the other hand, when the degree of approximation is smaller than the preset threshold value, that is, when the left and right channel signals are very different, the intensity stereo permission flag is set to s.
I can't stand on fb. The intensity stereo processing means 46 performs the intensity stereo processing at sfb for which the intensity stereo permission flag is set in the approximation degree determination processing means 43.

【0084】このような帯域毎強度ステレオ判定手段5
によれば、圧縮率が高く、多くのsfbで強度ステレオ
処理を使用して圧縮効率を高めようと、強度ステレオ処
理を開始するsfbを下げた場合、強度ステレオ処理を
行うsfbの中に定位の劣化をもたらすsfbにおいて
強度ステレオ処理を行わないようにすることができる。
そのため、帯域毎強度ステレオ判定手段5によれば、強
度ステレオ処理による定位の劣化が起こらず、かつ圧縮
効率を高めることができる。
Such band-wise intensity stereo determination means 5
According to this, when the compression ratio is high and the sfb that starts the intensity stereo process is lowered in order to increase the compression efficiency by using the intensity stereo process with many sfb, the localization in the sfb that performs the intensity stereo process is performed. It is possible to prevent the intensity stereo processing from being performed in the sfb that causes deterioration.
Therefore, according to the intensity stereo determination means 5 for each band, the localization deterioration due to the intensity stereo processing does not occur, and the compression efficiency can be improved.

【0085】図10は、上述した第5の実施の形態にお
けるステップS5を用いる帯域毎強度ステレオ判定手段
5を示すブロック図である。
FIG. 10 is a block diagram showing the band-by-band intensity stereo determination means 5 using step S5 in the above-described fifth embodiment.

【0086】同図に示すように、帯域毎強度ステレオ判
定手段5は、sfbとIS周波数限度を基に判定閾値を
算出する判定閾値算出手段51と、判定閾値算出手段5
1で算出した左右チャンネル信号の近似度を算出する近
似度算出手段52、判定閾値算出手段51で算出した判
定閾値と近似度算出手段52で算出した近似度とを比較
する近似度判定処理手段53と、近似度判定処理手段5
3からの入力信号を効率よく処理するモジュールの一つ
であり、2つのチャンネルの代わりに両方のチャンネル
の連結エネルギーと指向情報に変換する強度ステレオ処
理手段56とを有している。
As shown in the figure, the intensity stereo determination means for each band 5 is a determination threshold value calculation means 51 for calculating a determination threshold value based on sfb and the IS frequency limit, and a determination threshold value calculation means 5.
The approximation degree calculation means 52 for calculating the approximation degree of the left and right channel signals calculated in 1 and the approximation degree determination processing means 53 for comparing the determination threshold value calculated by the determination threshold value calculation means 51 with the approximation degree calculated by the approximation degree calculation means 52. And the approximation degree determination processing means 5
It is one of the modules for efficiently processing the input signal from 3 and has intensity stereo processing means 56 for converting connection energy of both channels and directional information instead of two channels.

【0087】次に、この帯域毎強度ステレオ判定手段5
の動作について説明する。
Next, the intensity stereo determination means 5 for each band
The operation of will be described.

【0088】まず、判定閾値算出手段51において、音
質の影響の少ない高周波数帯域については、強度ステレ
オ処理を行いやすくするように判定閾値を設定し、音質
の影響の多い低周波数帯域については、強度ステレオ処
理を制限するように判定閾値を設定する。なお、この判
定閾値を圧縮率の大小によって調整することもできる。
First, in the judgment threshold value calculation means 51, a judgment threshold value is set for a high frequency band having little influence on sound quality, and a judgment threshold value is set so as to facilitate intensity stereo processing, and an intensity is set for a low frequency band having a large influence on sound quality. A judgment threshold value is set so as to limit stereo processing. It should be noted that this determination threshold can be adjusted depending on the size of the compression rate.

【0089】次に、近似度算出手段52で強度ステレオ
処理を行うsfbにおいて、左右チャンネル信号の相互
相関値や左右チャンネル信号の比の標準偏差を用いて近
似度を算出する。次いで、近似度判定処理手段53は、
判定閾値算出手段51で算出された判定閾値と近似度算
出手段52で算出した近似度との比較をsfb毎に行
い、各sfbにおいて近似度が判定閾値よりも大きい場
合、つまり左右チャンネル信号が似ている信号である場
合は、強度ステレオ許可フラグをそのsfbに立てる。
各sfbにおいて近似度が判定閾値よりも小さい場合、
つまり左右チャンネル信号が非常に異なる場合には、強
度ステレオ許可フラグをそのsfbに立てない。強度ス
テレオ処理手段56は、近似度判定処理手段53で強度
ステレオ許可フラグが立っているsfbにおいて、強度
ステレオ処理を行う。
Next, in sfb for performing intensity stereo processing by the approximation degree calculation means 52, the approximation degree is calculated using the cross correlation value of the left and right channel signals and the standard deviation of the ratio of the left and right channel signals. Then, the similarity determination processing means 53
The determination threshold value calculated by the determination threshold value calculation means 51 and the approximation degree calculated by the approximation degree calculation means 52 are compared for each sfb, and when the approximation degree is larger than the determination threshold value in each sfb, that is, the left and right channel signals are similar. If the signal is a signal that has been set, the intensity stereo permission flag is set to the sfb.
When the degree of approximation is smaller than the determination threshold in each sfb,
That is, when the left and right channel signals are very different, the intensity stereo permission flag is not set to the sfb. The intensity stereo processing means 56 performs the intensity stereo processing at sfb in which the intensity stereo permission flag is set by the approximation degree determination processing means 53.

【0090】このような帯域毎強度ステレオ判定手段5
によれば、圧縮率が高く、多くのsfbで強度ステレオ
処理を使用して圧縮効率を高めようと、強度ステレオ処
理を開始するsfbを下げた場合、強度ステレオ処理を
行うsfbの中に定位の劣化をもたらすsfbが存在し
ていても強度ステレオ処理を行わないようにすることが
できる。そのため、帯域毎強度ステレオ判定手段5によ
れば、強度ステレオ処理による定位の劣化が生じず、ま
た音質の影響の少ない高い周波数帯域においてより強度
ステレオ処理を実行することができるようになるため、
圧縮効率を高めることができる。
Such band-wise intensity stereo determination means 5
According to this, when the compression ratio is high and the sfb that starts the intensity stereo process is lowered in order to increase the compression efficiency by using the intensity stereo process in many sfb, the localization in the sfb that performs the intensity stereo process is performed. It is possible to prevent the intensity stereo processing from being performed even if the sfb that causes deterioration exists. Therefore, the intensity stereo determination unit 5 for each band does not cause localization deterioration due to the intensity stereo process, and the intensity stereo process can be performed more in a high frequency band with little influence of sound quality.
The compression efficiency can be increased.

【0091】図示しないが音響配信システムは、上記各
実施の形態において説明したマルチチャンネルオーディ
オ信号符号化装置、記録媒体を構成要素としているの
で、上記各実施の形態におけるマルチチャンネルオーデ
ィオ信号符号化装置と同様の効果を得ることができる。
Although not shown, the audio distribution system has the multi-channel audio signal coding device and the recording medium described in each of the above-described embodiments as its constituent elements. The same effect can be obtained.

【0092】[0092]

【発明の効果】以上説明したように、本発明は入力信号
を基に信号対マスク比の値を算出する聴覚心理分析工程
と、もう一方の前記入力信号をスペクトルデータに変換
する時間・周波数マッピング工程と、変換された前記ス
ペクトルデータを基に形状を制御するTNS処理工程
と、制御された前記形状を基に周波数を算出する強度ス
テレオ周波数限度算出工程と、スケールファクタバンド
ごとに左チャンネルと右チャンネルの前記入力信号の近
似度に応じて強度ステレオ処理を行うか否かの判定を行
う帯域毎強度ステレオ判定工程と、前記入力信号を処理
するモジュールの一つであり、前記2つのチャンネルを
両方のチャンネルの連結エネルギーと指向情報に変換す
る強度ステレオ処理工程と、前記チャンネルの前記入力
信号をそれぞれの和および差となる信号に変換する和差
ステレオ処理工程と、和差ステレオ処理工程で施された
前記入力信号を量子化、符号化する量子化・符号化工程
と、この量子化・符号化工程の出力と制御情報を多重化
し、ビットストリームとして整形するビットストリーム
生成形成工程とを備え、前記強度ステレオ周波数限度算
出工程が、前記聴覚心理分析工程から算出された前記値
とTNS処理工程から制御された前記形状とを処理する
工程を有し、かつ前記帯域毎強度ステレオ判定工程が、
前記聴覚心理分析工程から算出された前記値と前記強度
ステレオ周波数限度算出工程から算出された前記周波数
とを判断する工程を有したことにより、入力信号の特性
および圧縮率によってIS周波数限度およびスケールフ
ァクタバンド単位での実行/不実行を制御することで定
位感の劣化を最小とし、かつ高い圧縮効率を得ることが
できるというすぐれた効果を有するマルチチャンネルオ
ーディオ信号符号化方法、マルチチャンネルオーディオ
信号符号化装置、記録媒体および音楽配信システムを提
供することができるものである。
As described above, according to the present invention, the psychoacoustic analysis step of calculating the value of the signal-to-mask ratio based on the input signal, and the time / frequency mapping for converting the other input signal into spectrum data. A TNS processing step of controlling a shape based on the converted spectral data, an intensity stereo frequency limit calculating step of calculating a frequency based on the controlled shape, and a left channel and a right channel for each scale factor band. The intensity stereo determination process for each band for determining whether or not to perform intensity stereo processing according to the degree of approximation of the input signal of a channel, and one of the modules that processes the input signal. Intensity stereo processing step for converting the connection energy and directivity information of each channel, and summing each of the input signals of the channels. And a difference stereo processing step of converting into a difference signal, a quantization / encoding step of quantizing and encoding the input signal applied in the sum difference stereo processing step, and a quantization / encoding step of this quantization / encoding step. A bitstream generation / forming step of multiplexing output and control information and shaping as a bitstream, wherein the intensity stereo frequency limit calculation step is controlled from the value calculated from the psychoacoustic analysis step and the TNS processing step. And a step of processing the shape, and the band-wise intensity stereo determination step,
By having the step of judging the value calculated from the psychoacoustic analysis step and the frequency calculated from the intensity stereo frequency limit calculation step, the IS frequency limit and scale factor depending on the characteristics and compression ratio of the input signal. A multi-channel audio signal encoding method and a multi-channel audio signal encoding method, which have an excellent effect that deterioration of localization is minimized and high compression efficiency can be obtained by controlling execution / non-execution in band units. An apparatus, a recording medium, and a music distribution system can be provided.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係る第1の実施の形態におけるマルチ
チャンネルオーディオ信号符号化方法を示すフローチャ
ート
FIG. 1 is a flowchart showing a multi-channel audio signal encoding method according to a first embodiment of the present invention.

【図2】本発明に係る第2の実施の形態におけるステッ
プS4を示すフローチャート
FIG. 2 is a flowchart showing step S4 in the second embodiment according to the present invention.

【図3】本発明に係る第3の実施の形態におけるステッ
プS4を示すフローチャート
FIG. 3 is a flowchart showing step S4 in the third embodiment of the present invention.

【図4】本発明に係る第4の実施の形態におけるステッ
プS5を示すフローチャート
FIG. 4 is a flowchart showing step S5 in the fourth embodiment of the present invention.

【図5】本発明に係る第5の実施の形態におけるステッ
プS5を示すフローチャート
FIG. 5 is a flowchart showing step S5 in the fifth embodiment of the present invention.

【図6】第1の実施の形態におけるマルチチャンネルオ
ーディオ信号符号化方法を用いるマルチチャンネルオー
ディオ信号符号化装置を示すブロック図
FIG. 6 is a block diagram showing a multi-channel audio signal coding apparatus using the multi-channel audio signal coding method according to the first embodiment.

【図7】第2の実施の形態におけるステップS4を用い
る強度ステレオ周波数限度算出手段4を示すブロック図
FIG. 7 is a block diagram showing intensity stereo frequency limit calculation means 4 using step S4 in the second embodiment.

【図8】第3の実施の形態におけるステップS4を用い
る強度ステレオ周波数限度算出手段4を示すブロック図
FIG. 8 is a block diagram showing intensity stereo frequency limit calculation means 4 using step S4 in the third embodiment.

【図9】第4の実施の形態におけるステップS5を用い
る帯域毎強度ステレオ判定手段5を示すブロック図
FIG. 9 is a block diagram showing band-wise intensity stereo determination means 5 using step S5 in the fourth embodiment.

【図10】上述した第5の実施の形態におけるステップ
S5を用いる帯域毎強度ステレオ判定手段5を示すブロ
ック図
FIG. 10 is a block diagram showing band-wise intensity stereo determination means 5 using step S5 in the fifth embodiment described above.

【図11】従来のオーディオ信号符号化方法を示すブロ
ック図
FIG. 11 is a block diagram showing a conventional audio signal encoding method.

【図12】従来の強度ステレオ処理を示すフローチャー
FIG. 12 is a flowchart showing conventional intensity stereo processing.

【符号の説明】[Explanation of symbols]

S1 聴覚心理分析(聴覚心理分析工程) S2 時間/周波数マッピング(時間/周波数マッピン
グ工程) S3 TNS処理(TNS処理工程) S4 強度ステレオ周波数限度算出(強度ステレオ周波
数限度算出工程) S5 帯域毎強度ステレオ判定(帯域毎強度ステレオ判
定工程) S6 強度ステレオ処理(強度ステレオ処理工程) S7 和差ステレオ処理(和差ステレオ処理工程) S8 量子化/符号化(量子化/符号化工程) S10 ビットストリーム生成形成(ビットストリーム
生成形成工程)
S1 auditory psychological analysis (auditory psychological analysis process) S2 time / frequency mapping (time / frequency mapping process) S3 TNS processing (TNS processing process) S4 intensity stereo frequency limit calculation (intensity stereo frequency limit calculation process) S5 intensity stereo determination for each band (Intensity stereo determination process for each band) S6 Intensity stereo processing (intensity stereo processing step) S7 Sum difference stereo processing (sum difference stereo processing step) S8 Quantization / encoding (quantization / encoding step) S10 Bitstream generation formation ( Bitstream generation process)

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 入力信号を基に信号対マスク比の値を算
出する聴覚心理分析工程と、もう一方の前記入力信号を
スペクトルデータに変換する時間・周波数マッピング工
程と、変換された前記スペクトルデータを基に形状を制
御するTNS処理工程と、制御された前記形状を基に周
波数を算出する強度ステレオ周波数限度算出工程と、ス
ケールファクタバンドごとに左チャンネルと右チャンネ
ルの前記入力信号の近似度に応じて強度ステレオ処理を
行うか否かの判定を行う帯域毎強度ステレオ判定工程
と、前記入力信号を処理するモジュールの一つであり、
前記2つのチャンネルを両方のチャンネルの連結エネル
ギーと指向情報に変換する強度ステレオ処理工程と、前
記チャンネルの前記入力信号をそれぞれの和および差と
なる信号に変換する和差ステレオ処理工程と、和差ステ
レオ処理工程で施された前記入力信号を量子化、符号化
する量子化・符号化工程と、この量子化・符号化工程の
出力と制御情報を多重化し、ビットストリームとして整
形するビットストリーム生成形成工程とを備え、前記強
度ステレオ周波数限度算出工程が、前記聴覚心理分析工
程から算出された前記値とTNS処理工程から制御され
た前記形状とを処理する工程を有し、かつ前記帯域毎強
度ステレオ判定工程が、前記聴覚心理分析工程から算出
された前記値と前記強度ステレオ周波数限度算出工程か
ら算出された前記周波数とを判断する工程を有したこと
を特徴とするマルチチャンネルオーディオ信号符号化方
法。
1. A psychoacoustic analysis step of calculating a value of a signal-to-mask ratio based on an input signal, a time-frequency mapping step of converting the other input signal into spectrum data, and the converted spectrum data. A TNS processing step for controlling the shape based on the above, an intensity stereo frequency limit calculating step for calculating a frequency based on the controlled shape, and an approximation degree of the input signals of the left channel and the right channel for each scale factor band. Depending on the intensity stereo determination process for each band to determine whether to perform the intensity stereo processing according to, is one of the modules for processing the input signal,
An intensity stereo processing step of converting the two channels into connection energy and directional information of both channels; a sum difference stereo processing step of converting the input signals of the channels into respective sum and difference signals; Quantization / encoding step of quantizing and encoding the input signal applied in the stereo processing step, and bitstream generation forming of multiplexing the output of this quantization / encoding step and control information and shaping as a bitstream And the step of processing the intensity stereo frequency limit calculation step, the step of processing the value calculated from the psychoacoustic analysis step and the shape controlled from the TNS processing step, and the intensity stereo for each band. The determination step, the value calculated from the psychoacoustic analysis step and the strength stereo frequency limit calculated from the calculated Multichannel audio signal encoding method characterized by having a step of determining a wavenumber.
【請求項2】 符号化に必要な符号化モード情報を設定
するための符号化モード情報工程と、前記符号化モード
情報より強度ステレオが使用可能か否かの判定を行う強
度ステレオ前処理工程と、前記符号化モード情報より得
られる情報より圧縮率を算出する圧縮率算出工程と、前
記圧縮率と所定の値との大小を比較した結果を出力する
負荷判定工程と、この負荷判定工程の結果より強度ステ
レオ処理を開始する周波数を設定するIS周波数限度設
定工程とを備えた前記強度ステレオ周波数限度算出工程
であって、前記負荷判定工程が前記圧縮率を高いと判断
したときには、前記IS周波数限度設定工程がより広い
周波数帯域で強度ステレオ処理を行う手段を有し、かつ
前記負荷判定工程が前記圧縮率を低いと判断したときに
は、前記IS周波数限度設定工程がより狭い周波数帯域
で強度ステレオ処理を行う手段を有したことを特徴とす
る請求項1に記載のマルチチャンネルオーディオ信号符
号化方法。
2. A coding mode information step for setting coding mode information necessary for coding, and a strength stereo preprocessing step for judging whether or not strength stereo can be used from the coding mode information. , A compression rate calculation step of calculating a compression rate from information obtained from the encoding mode information, a load determination step of outputting a result of comparing the compression rate with a predetermined value, and a result of the load determination step In the intensity stereo frequency limit calculating step including an IS frequency limit setting step of setting a frequency for starting the intensity stereo processing, the IS frequency limit is set when the load determining step determines that the compression rate is high. If the setting step has means for performing intensity stereo processing in a wider frequency band, and the load determination step determines that the compression rate is low, the IS frequency 2. The multi-channel audio signal coding method according to claim 1, wherein the limit setting step has means for performing intensity stereo processing in a narrower frequency band.
【請求項3】 符号化に必要な符号化モード情報を設定
するための符号化モード情報工程と、前記符号化モード
情報より強度ステレオが使用可能か否かの判定を行う強
度ステレオ前処理工程と、前記符号化モード情報より得
られる情報より圧縮率を算出する圧縮率算出工程と、こ
の圧縮率算出工程で算出した前記圧縮率を基に判定閾値
を算出する判定閾値算出工程と、判定閾値算出工程で算
出した前記判定閾値を基に左チャンネルと右チャンネル
の近似度を算出する近似度算出工程と、前記判定閾値と
前記圧縮率を比較した結果を出力する近似度判定処理工
程と、この近似度判定処理工程の結果より周波数を設定
するIS周波数限度設定工程とを備えた前記強度ステレ
オ周波数限度算出工程であって、前記近似度判定処理工
程が前記判定閾値より前記近似度を高いと判断したとき
には、前記IS周波数限度設定工程がより広い周波数帯
域で強度ステレオ処理を行う工程を有し、かつ前記近似
度判定処理工程が前記近似度を低いと判断したときに
は、前記IS周波数限度設定工程がより狭い周波数帯域
で強度ステレオ処理を行う手段を有したことを特徴とす
る請求項1に記載のマルチチャンネルオーディオ信号符
号化方法。
3. A coding mode information step for setting coding mode information necessary for coding, and a strength stereo pre-processing step for judging whether or not strength stereo can be used from the coding mode information. A compression rate calculation step of calculating a compression rate from information obtained from the encoding mode information, a determination threshold value calculation step of calculating a determination threshold value based on the compression rate calculated in the compression rate calculation step, and a determination threshold value calculation step An approximation degree calculating step of calculating the approximation degree of the left channel and the right channel based on the determination threshold value calculated in the step, an approximation degree determination processing step of outputting a result of comparing the determination threshold value and the compression rate, and this approximation The intensity stereo frequency limit calculation step including an IS frequency limit setting step of setting a frequency based on the result of the degree determination processing step, wherein the approximation degree determination processing step is the determination threshold value. When determining that the degree of approximation is high, the IS frequency limit setting step includes a step of performing intensity stereo processing in a wider frequency band, and when the degree of similarity determination processing determines that the degree of approximation is low. 2. The multi-channel audio signal encoding method according to claim 1, wherein said IS frequency limit setting step has means for performing intensity stereo processing in a narrower frequency band.
【請求項4】 前記スケールファクタバンドとIS周波
数限度を比較するスケールファクタバンド判定工程と、
このスケールファクタバンド判定工程で比較した前記ス
ケールファクタバンドと前記IS周波数限度を基に左チ
ャンネルと右チャンネルの近似度を算出する近似度算出
工程と、近似度算出工程で算出した近似度とあらかじめ
設定された閾値との大小を比較する近似度判定処理工程
と、近似度判定処理工程からの前記入力信号を処理する
モジュールの一つであり、前記2つのチャンネルを両方
のチャンネルの連結エネルギーと指向情報に変換する強
度ステレオ処理工程とを備えた前記帯域毎強度ステレオ
判定工程であって、前記近似度判定処理工程が前記近似
度を高いと判断したときには、前記強度ステレオ処理工
程が強度ステレオ処理を行う工程を有し、かつ前記近似
度判定処理工程が前記近似度を低いと判断したときに
は、前記強度ステレオ処理を行わないで前記スケールフ
ァクタバンド判定工程に戻る工程を有したことを特徴と
する請求項1に記載のマルチチャンネルオーディオ信号
符号化方法。
4. A scale factor band determination step of comparing the scale factor band with an IS frequency limit,
An approximation degree calculating step of calculating an approximation degree of the left channel and the right channel based on the scale factor band and the IS frequency limit compared in the scale factor band determination step, and an approximation degree calculated in the approximation degree calculating step and preset. Is a module for processing the input signal from the approximation degree determination processing step and the approximation degree determination processing step for comparing the magnitude of the two channels with the connection energy of both channels and directivity information. In the intensity stereo determination step for each band, including the intensity stereo processing step for converting to, when the approximation degree determination processing step determines that the approximation degree is high, the intensity stereo processing step performs intensity stereo processing. If there is a step and the approximation degree determination processing step determines that the approximation degree is low, the intensity stereo Multichannel audio signal encoding method according to claim 1, characterized in that comprising the step of returning to the scale factor band determination step without performing the process.
【請求項5】 前記スケールファクタバンドとIS周波
数限度を比較するスケールファクタバンド判定工程と、
このスケールファクタバンド判定工程で比較した前記ス
ケールファクタバンドと前記IS周波数限度を基に判定
閾値を算出する判定閾値算出工程と、この判定閾値算出
工程で算出した前記判定閾値を基に左右チャンネルの近
似度を算出する近似度算出工程と、前記判定閾値算出工
程で算出した前記判定閾値と前記近似度算出工程で算出
した前記近似度とを比較する近似度判定処理工程と、近
似度判定処理工程からの前記入力信号を処理するモジュ
ールの一つであり、前記2つのチャンネルを両方のチャ
ンネルの連結エネルギーと指向情報に変換する強度ステ
レオ処理工程とを備えた前記帯域毎強度ステレオ判定工
程であって、前記近似度判定処理工程が前記判定閾値よ
り近似度が高いと判断したときには、前記強度ステレオ
処理工程が強度ステレオ処理を行う工程を有し、かつ前
記近似度判定処理工程が前記近似度を低いと判断したと
きには、前記強度ステレオ処理工程が強度ステレオ処理
を行わないで前記スケールファクタバンド判定工程に戻
る工程を有したことを特徴とする請求項1に記載のマル
チチャンネルオーディオ信号符号化方法。
5. A scale factor band determination step of comparing the scale factor band with an IS frequency limit,
A judgment threshold value calculating step for calculating a judgment threshold value based on the scale factor band and the IS frequency limit compared in the scale factor band judging step, and approximation of the left and right channels based on the judgment threshold value calculated in the judgment threshold value calculating step. From an approximation degree calculation processing step of calculating a degree, an approximation degree determination processing step of comparing the determination threshold value calculated in the determination threshold value calculation step and the approximation degree calculated in the approximation degree calculation step, and an approximation degree determination processing step Which is one of the modules for processing the input signal of, and the intensity stereo determination step for each band, which comprises an intensity stereo processing step of converting the two channels into connection energy of both channels and directional information, When the approximation degree determination processing step determines that the degree of approximation is higher than the determination threshold value, the intensity stereo processing step is performed. And a step of performing a rheo process, and when the approximation degree determination process step determines that the approximation degree is low, the intensity stereo process step returns to the scale factor band determination step without performing intensity stereo process. The multi-channel audio signal encoding method according to claim 1, wherein the multi-channel audio signal encoding method comprises:
【請求項6】 入力信号を基に信号対マスク比の値を算
出する聴覚心理分析手段と、もう一方の前記入力信号を
スペクトルデータに変換する時間・周波数マッピング手
段と、変換された前記スペクトルデータを基に形状を制
御するTNS処理手段と、制御された前記形状を基に周
波数を算出する強度ステレオ周波数限度算出手段と、ス
ケールファクタバンドごとに左チャンネルと右チャンネ
ルの前記入力信号の近似度に応じて強度ステレオ処理を
行うか否かの判定を行う帯域毎強度ステレオ判定手段
と、前記入力信号を処理するモジュールの一つであり、
前記2つのチャンネルを両方のチャンネルの連結エネル
ギーと指向情報に変換する強度ステレオ処理手段と、前
記チャンネルの前記入力信号をそれぞれの和および差と
なる信号に変換する和差ステレオ処理手段と、和差ステ
レオ処理手段で施された前記入力信号を量子化、符号化
する量子化・符号化手段と、この量子化・符号化手段の
出力と制御情報を多重化し、ビットストリームとして整
形するビットストリーム生成形成手段とを備え、前記強
度ステレオ周波数限度算出手段が、前記聴覚心理分析手
段から算出された前記値とTNS処理手段から制御され
た前記形状とを処理する手段を有し、かつ前記帯域毎強
度ステレオ判定手段が、前記聴覚心理分析手段から算出
された前記値と前記強度ステレオ周波数限度算出手段か
ら算出された前記周波数とを判断する手段を有したこと
を特徴とするマルチチャンネルオーディオ信号符号化装
置。
6. A psychoacoustic analysis means for calculating a value of a signal-to-mask ratio based on an input signal, a time / frequency mapping means for converting the other input signal into spectrum data, and the converted spectrum data. TNS processing means for controlling the shape based on the above, intensity stereo frequency limit calculating means for calculating the frequency based on the controlled shape, and approximation degree of the input signal of the left channel and the right channel for each scale factor band. In accordance with each band intensity stereo determination means for determining whether to perform the intensity stereo processing according to, one of the module for processing the input signal,
Intensity stereo processing means for converting the two channels into connection energy and directional information of both channels; sum difference stereo processing means for converting the input signals of the channels into respective sum and difference signals; Quantization / encoding means for quantizing and encoding the input signal applied by the stereo processing means, and bitstream generation forming for multiplexing the output of this quantization / encoding means and control information and shaping it as a bitstream. Means, the intensity stereo frequency limit calculation means includes means for processing the value calculated by the psychoacoustic analysis means and the shape controlled by the TNS processing means, and the intensity stereo for each band. The determination means, the value calculated from the psychoacoustic analysis means and the intensity stereo frequency limit calculation means Multichannel audio signal encoding apparatus characterized by having means for determining the wave number.
【請求項7】 符号化に必要な符号化モード情報を設定
するための符号化モード情報手段と、前記符号化モード
情報より強度ステレオが使用可能か否かの判定を行う強
度ステレオ前処理手段と、前記符号化モード情報より得
られる情報より圧縮率を算出する圧縮率算出手段と、前
記圧縮率と所定の値との大小を比較した結果を出力する
負荷判定手段と、この負荷判定手段の結果より強度ステ
レオ処理を開始する周波数を設定するIS周波数限度設
定手段とを備えた前記強度ステレオ周波数限度算出手段
であって、前記負荷判定手段が前記圧縮率を高いと判断
したときには、前記IS周波数限度設定手段がより広い
周波数帯域で強度ステレオ処理を行う手段を有し、かつ
前記負荷判定手段が前記圧縮率を低いと判断したときに
は、前記IS周波数限度設定手段がより狭い周波数帯域
で強度ステレオ処理を行う手段を有したことを特徴とす
る請求項6に記載のマルチチャンネルオーディオ信号符
号化装置。
7. Encoding mode information means for setting encoding mode information necessary for encoding, and intensity stereo preprocessing means for determining whether or not intensity stereo can be used from the encoding mode information. , A compression rate calculating means for calculating a compression rate from information obtained from the encoding mode information, a load determining means for outputting a result of comparison between the compression rate and a predetermined value, and a result of the load determining means In the intensity stereo frequency limit calculating means including an IS frequency limit setting means for setting a frequency for starting the intensity stereo processing, the IS frequency limit is set when the load determining means determines that the compression rate is high. If the setting means has means for performing intensity stereo processing in a wider frequency band, and the load determination means determines that the compression rate is low, the IS frequency 7. The multi-channel audio signal coding apparatus according to claim 6, wherein the limit setting means has means for performing intensity stereo processing in a narrower frequency band.
【請求項8】 符号化に必要な符号化モード情報を設定
するための符号化モード情報手段と、前記符号化モード
情報より強度ステレオが使用可能か否かの判定を行う強
度ステレオ前処理手段と、前記符号化モード情報より得
られる情報より圧縮率を算出する圧縮率算出手段と、こ
の圧縮率算出手段で算出した前記圧縮率を基に判定閾値
を算出する判定閾値算出手段と、判定閾値算出手段で算
出した前記判定閾値を基に左チャンネルと右チャンネル
の近似度を算出する近似度算出手段と、前記判定閾値と
前記圧縮率を比較した結果を出力する近似度判定処理手
段と、この近似度判定処理手段の結果より周波数を設定
するIS周波数限度設定手段とを備えた前記強度ステレ
オ周波数限度算出手段であって、前記近似度判定処理手
段が前記判定閾値より前記近似度を高いと判断したとき
には、前記IS周波数限度設定手段がより広い周波数帯
域で強度ステレオ処理を行う手段を有し、かつ前記近似
度判定処理手段が前記近似度を低いと判断したときに
は、前記IS周波数限度設定手段がより狭い周波数帯域
で強度ステレオ処理を行う手段を有したことを特徴とす
る請求項6に記載のマルチチャンネルオーディオ信号符
号化装置。
8. Encoding mode information means for setting encoding mode information necessary for encoding, and intensity stereo pre-processing means for determining whether or not intensity stereo can be used from the encoding mode information. A compression rate calculation means for calculating a compression rate from information obtained from the encoding mode information, a determination threshold value calculation means for calculating a determination threshold value based on the compression rate calculated by the compression rate calculation means, and a determination threshold value calculation An approximation degree calculating means for calculating the approximation degree of the left channel and the right channel based on the determination threshold value calculated by the means, an approximation degree determination processing means for outputting a result of comparing the determination threshold value and the compression rate, and this approximation The intensity stereo frequency limit calculation means including an IS frequency limit setting means for setting a frequency based on the result of the degree judgment processing means, wherein the approximation degree judgment processing means is the judgment threshold value. When determining that the degree of approximation is high, the IS frequency limit setting means has means for performing intensity stereo processing in a wider frequency band, and when the degree of similarity determination processing means determines that the degree of approximation is low. 7. The multi-channel audio signal encoding device according to claim 6, wherein said IS frequency limit setting means has means for performing intensity stereo processing in a narrower frequency band.
【請求項9】 前記スケールファクタバンドとIS周波
数限度を基に左チャンネルと右チャンネルの近似度を算
出する近似度算出手段と、近似度算出手段で算出した近
似度とあらかじめ設定された閾値との大小を比較する近
似度判定処理手段と、近似度判定処理手段からの前記入
力信号を処理するモジュールの一つであり、前記2つの
チャンネルを両方のチャンネルの連結エネルギーと指向
情報に変換する強度ステレオ処理手段とを備えた前記帯
域毎強度ステレオ判定手段であって、前記近似度判定処
理手段が前記近似度を高いと判断したときには、前記強
度ステレオ処理手段が強度ステレオ処理を行う手段を有
し、かつ前記近似度判定処理手段が前記近似度を低いと
判断したときには、前記強度ステレオ処理を行わないで
前記スケールファクタバンド判定手段に戻る手段を有し
たことを特徴とする請求項6に記載のマルチチャンネル
オーディオ信号符号化装置。
9. An approximation degree calculating means for calculating the approximation degree of the left channel and the right channel based on the scale factor band and the IS frequency limit, and the approximation degree calculated by the approximation degree calculating means and a preset threshold value. One of the modules for processing the input signals from the similarity determination processing means for comparing the magnitude and the similarity determination processing means, and an intensity stereo for converting the two channels into connection energy of both channels and directional information. In the intensity stereo determination means for each band including a processing means, when the approximation degree determination processing means determines that the degree of approximation is high, the intensity stereo processing means has means for performing intensity stereo processing, Further, when the approximation degree determination processing means determines that the approximation degree is low, the scale stereo processing is performed without performing the intensity stereo processing. 7. The multi-channel audio signal encoding device according to claim 6, further comprising means for returning to the band determination means.
【請求項10】 前記スケールファクタバンドとIS周
波数限度を基に判定閾値を算出する判定閾値算出手段
と、この判定閾値算出手段で算出した前記判定閾値を基
に左右チャンネルの近似度を算出する近似度算出手段
と、前記判定閾値算出手段で算出した前記判定閾値と前
記近似度算出手段で算出した前記近似度とを比較する近
似度判定処理手段と、近似度判定処理手段からの前記入
力信号を処理するモジュールの一つであり、前記2つの
チャンネルを両方のチャンネルの連結エネルギーと指向
情報に変換する強度ステレオ処理手段とを備えた前記帯
域毎強度ステレオ判定手段であって、前記近似度判定処
理手段が前記判定閾値より近似度が高いと判断したとき
には、前記強度ステレオ処理手段が強度ステレオ処理を
行う手段を有し、かつ前記近似度判定処理手段が前記近
似度を低いと判断したときには、前記強度ステレオ処理
手段が強度ステレオ処理を行わないで前記スケールファ
クタバンド判定手段に戻る手段を有したことを特徴とす
る請求項6に記載のマルチチャンネルオーディオ信号符
号化装置。
10. A determination threshold value calculating means for calculating a determination threshold value based on the scale factor band and the IS frequency limit, and an approximation for calculating a degree of approximation of the left and right channels based on the determination threshold value calculated by the determination threshold value calculating means. A degree calculation means, an approximation degree determination processing means for comparing the determination threshold value calculated by the determination threshold value calculation means and the approximation degree calculated by the approximation degree calculation means, and the input signal from the approximation degree determination processing means. The intensity stereo determination means for each band, which is one of the modules for processing, and comprises intensity stereo processing means for converting the two channels into connection energy of both channels and directivity information, wherein the approximation degree determination processing is performed. When the means determines that the degree of approximation is higher than the determination threshold, the intensity stereo processing means has means for performing intensity stereo processing, and 7. The intensity stereo processing means includes means for returning to the scale factor band determination means without performing intensity stereo processing when the approximation degree determination processing means determines that the approximation degree is low. The multi-channel audio signal encoding device according to.
【請求項11】 請求項1ないし請求項5のいずれかに
記載のマルチチャンネルオーディオ信号符号化方法を用
いて前記入力信号を量子化、符号化したことを特徴とす
るマルチチャンネルオーディオ信号符号化装置。
11. A multi-channel audio signal coding apparatus, wherein the input signal is quantized and coded by using the multi-channel audio signal coding method according to any one of claims 1 to 5. .
【請求項12】 請求項1ないし請求項5のいずれかに
記載のマルチチャンネルオーディオ信号符号化方法のス
テップが記憶されていることを特徴とする記録媒体。
12. A recording medium in which the steps of the multi-channel audio signal encoding method according to claim 1 are stored.
【請求項13】 請求項12に記載の記録媒体を構成要
素としたことを特徴とする音楽配信システム。
13. A music distribution system comprising the recording medium according to claim 12 as a constituent element.
【請求項14】 請求項1ないし請求項5のいずれかに
記載のマルチチャンネルオーディオ信号符号化方法を用
いて音楽が配信されていることを特徴とする音楽配信シ
ステム。
14. A music distribution system, wherein music is distributed by using the multi-channel audio signal encoding method according to any one of claims 1 to 5.
【請求項15】 請求項6ないし請求項10のいずれか
に記載のマルチチャンネルオーディオ信号符号化装置を
構成要素としたことを特徴とする音楽配信システム。
15. A music distribution system comprising the multi-channel audio signal encoding device according to any one of claims 6 to 10 as a constituent element.
JP2001236870A 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system Pending JP2003044096A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001236870A JP2003044096A (en) 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001236870A JP2003044096A (en) 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Publications (1)

Publication Number Publication Date
JP2003044096A true JP2003044096A (en) 2003-02-14

Family

ID=19068058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001236870A Pending JP2003044096A (en) 2001-08-03 2001-08-03 Method and device for encoding multi-channel audio signal, recording medium and music distribution system

Country Status (1)

Country Link
JP (1) JP2003044096A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
JP2007183528A (en) * 2005-12-06 2007-07-19 Fujitsu Ltd Encoding apparatus, encoding method, and encoding program
US8200500B2 (en) 2001-05-04 2012-06-12 Agere Systems Inc. Cue-based audio coding/decoding
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200500B2 (en) 2001-05-04 2012-06-12 Agere Systems Inc. Cue-based audio coding/decoding
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
US7627482B2 (en) 2002-05-20 2009-12-01 Sony Corporation Methods, storage medium, and apparatus for encoding and decoding sound signals from multiple channels
US7912731B2 (en) 2002-05-20 2011-03-22 Sony Corporation Methods, storage medium and apparatus for encoding and decoding sound signals from multiple channels
KR101144696B1 (en) 2002-05-20 2012-05-25 소니 주식회사 Acoustic signal, encoding method and encoding device, acoustic signal, decoding method and decoding device, and recording medium image display device
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8238562B2 (en) 2004-10-20 2012-08-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
JP2007183528A (en) * 2005-12-06 2007-07-19 Fujitsu Ltd Encoding apparatus, encoding method, and encoding program

Similar Documents

Publication Publication Date Title
TWI752281B (en) Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
US9361896B2 (en) Temporal and spatial shaping of multi-channel audio signal
JP5485909B2 (en) Audio signal processing method and apparatus
JP5539203B2 (en) Improved transform coding of speech and audio signals
US8972270B2 (en) Method and an apparatus for processing an audio signal
US9117458B2 (en) Apparatus for processing an audio signal and method thereof
JP5267362B2 (en) Audio encoding apparatus, audio encoding method, audio encoding computer program, and video transmission apparatus
KR100547113B1 (en) Audio data encoding apparatus and method
CN103180899B (en) Stereo signal encoding device, stereo signal decoding device, stereo signal encoding method, and stereo signal decoding method
KR20040080003A (en) Parametric audio coding
WO2006003891A1 (en) Audio signal decoding device and audio signal encoding device
US8619999B2 (en) Audio decoding method and apparatus
US11640825B2 (en) Time-domain stereo encoding and decoding method and related product
US11335355B2 (en) Estimating noise of an audio signal in the log2-domain
EP1779385B1 (en) Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
KR20140017338A (en) Apparatus and method for audio signal processing
JP2002023799A (en) Speech encoder and psychological hearing sense analysis method used therefor
JP2001343997A (en) Method and device for encoding digital acoustic signal and recording medium
US11900952B2 (en) Time-domain stereo encoding and decoding method and related product
JP3923783B2 (en) Encoding device and decoding device
JP2003044096A (en) Method and device for encoding multi-channel audio signal, recording medium and music distribution system
US8799002B1 (en) Efficient scalefactor estimation in advanced audio coding and MP3 encoder
WO2019037710A1 (en) Signal reconstruction method and device in stereo signal encoding
KR102664650B1 (en) Determination of significance of spatial audio parameters and associated encoding
JP3863706B2 (en) Speech coding method