JP4550595B2 - Audio encoding device - Google Patents
Audio encoding device Download PDFInfo
- Publication number
- JP4550595B2 JP4550595B2 JP2005011737A JP2005011737A JP4550595B2 JP 4550595 B2 JP4550595 B2 JP 4550595B2 JP 2005011737 A JP2005011737 A JP 2005011737A JP 2005011737 A JP2005011737 A JP 2005011737A JP 4550595 B2 JP4550595 B2 JP 4550595B2
- Authority
- JP
- Japan
- Prior art keywords
- sub
- block
- blocks
- frame
- grouping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、オーディオ信号を1フレーム中に複数が含まれるサブブロック単位で時間周波数変換してスペクトラルデータを得る処理を伴うとともに、1フレーム中に含まれる前記サブブロックをグルーピングして同一グループに含まれる複数の前記サブブロックでサイド情報を共通化するオーディオ符号化装置に関する。 The present invention involves processing for obtaining spectral data by performing time-frequency conversion of audio signals in units of sub-blocks including a plurality of audio signals in one frame, and grouping the sub-blocks included in one frame into the same group. The present invention relates to an audio encoding device for sharing side information among a plurality of sub-blocks.
非特許文献1には、AAC(Advanced Audio Coding)による符号化について以下のように規定されている。
アタック信号の様な過渡的な信号を含むフレームはショートブロックとして処理する。ショートブロックと判定されたフレームは、8個のサブブロックに分割し、サブブロック毎に処理する。 A frame including a transient signal such as an attack signal is processed as a short block. A frame determined to be a short block is divided into 8 sub-blocks and processed for each sub-block.
ただし、8個のサブブロックの全てが過渡的な信号を含んでいる訳ではない。そこで過渡的な信号を含まないサブブロックを纏めるようにグルーピングする。そして、グループ内でスケールファクター等のサイド情報を共通化することにより、圧縮率を高める。 However, not all eight sub-blocks contain transient signals. Therefore, grouping is performed so that sub-blocks that do not include transient signals are collected. The compression rate is increased by sharing side information such as a scale factor within the group.
ところで、サブブロックは、時間域のオーディオ信号を図3に示すような8つの窓W0〜W7のそれぞれで区切り、各区間の信号を個別にMDCT(Modified Discrete Cosine Transform)することにより得られる。過渡的な信号の位置は、時間域のオーディオ信号において検出する。そしてその位置が図3に示す期間P0〜P7のいずれに属するかを考慮してグルーピングする。具体的には、過渡信号の位置が図3に示す位置であった場合、その位置は期間P2に属するので、窓W2に対応するサブブロックのみを含むグループを作るとともに、他のサブブロックを纏めるようにグルーピングする。
図3に示すように窓W0〜W7は、隣接するものどうしが50%ずつオーバーラップしている。このため、過渡信号の影響は2つのサブブロックにそれぞれ現れる。図3の例では、過渡信号の影響は、窓W2に対応する2番のサブブロックおよび窓W3に対応する3番のサブブロックのそれぞれに現れる。そして図3における過渡信号の位置においては、窓W2の窓関数に比べて窓W3の窓関数の方が大きいため、過渡信号の影響は2番のサブブロックよりも3番のサブブロックに大きく現れる。 As shown in FIG. 3, in the windows W0 to W7, adjacent ones overlap each other by 50%. For this reason, the influence of the transient signal appears in each of the two sub-blocks. In the example of FIG. 3, the influence of the transient signal appears in each of the second sub-block corresponding to the window W2 and the third sub-block corresponding to the window W3. Then, at the position of the transient signal in FIG. 3, the window function of the window W3 is larger than the window function of the window W2, so that the influence of the transient signal appears more in the third subblock than in the second subblock. .
しかしながら前述したように、非特許文献1に規定された手法によると、2番のサブブロックのみを含むグループを作るとともに、他のサブブロックを纏めるようにグルーピングされるのであり、適正なグルーピングに基づく符号化が常に行えるわけではなかった。
However, as described above, according to the method defined in Non-Patent
本発明はこのような事情を考慮してなされたものであり、その目的とするところは、過渡的な信号の影響を正しく反映して適正にグルーピングすることで、圧縮率を向上できるオーディオ符号化装置を提供することにある。 The present invention has been made in consideration of such circumstances, and an object of the present invention is to perform audio encoding that can improve the compression ratio by properly grouping the signal by correctly reflecting the influence of a transient signal. To provide an apparatus.
本発明の第1の態様によるオーディオ符号化装置は、オーディオ信号を、1フレームを構成するサブブロックの単位で時間周波数変換してスペクトラルデータを得る処理を伴うとともに、1フレーム中に含まれる前記サブブロックをグルーピングして同一グループに含まれる複数の前記サブブロックではサイド情報を共通化するオーディオ符号化方法を使用して前記オーディオ信号を符号化するオーディオ符号化装置において、前記スペクトラルデータに基づいて、前記サブブロック毎にスペクトルの平坦度を算出する算出手段と、前記1フレームに含まれた前記サブブロックのうちから最大の前記平坦度が算出されたものを単独ブロックとして選択する選択手段と、前記1フレームに含まれた前記サブブロックを、前記単独ブロックのグループと、前記単独ブロック以外の前記サブブロックのうちの連続する少なくとも2つのサブブロックを含むグループとを作るように前記グルーピングを行うグルーピング手段とを備える。 The audio encoding apparatus according to the first aspect of the present invention includes a process of obtaining spectral data by performing time-frequency conversion on an audio signal in units of sub-blocks constituting one frame, and includes the sub signal included in one frame. In an audio encoding device that encodes the audio signal using an audio encoding method for grouping blocks to share side information in the plurality of sub-blocks included in the same group, based on the spectral data, Calculating means for calculating the flatness of a spectrum for each sub-block, selecting means for selecting, as a single block, the one with the highest flatness calculated from the sub-blocks included in the one frame; The sub-block included in one frame is grouped with the single block. Comprising a flop, and a grouping means for performing the grouping to make a group including a consecutive at least two sub-blocks of said sub-blocks other than the single block.
本発明の第2の態様によるオーディオ符号化装置は、オーディオ信号を、1フレームを構成するサブブロックの単位で時間周波数変換してスペクトラルデータを得る処理を伴うとともに、1フレーム中に含まれる前記サブブロックをグルーピングして同一グループに含まれる複数の前記サブブロックではサイド情報を共通化するオーディオ符号化方法を使用して前記オーディオ信号を符号化するオーディオ符号化装置において、前記スペクトラルデータに基づいて、前記サブブロック毎にスペクトルの平坦度を算出する算出手段と、前記算出手段によって算出された前記平坦度が所定の閾値を超えるサブブロックを単独ブロックとして選択する選択手段と、前記単独ブロックのそれぞれを独立のグループとし、前記1フレームに含まれた前記単独ブロック以外の前記サブブロックのうちの連続する少なくとも2つのサブブロックを含むグループを作るグルーピング手段とを備える。 The audio encoding device according to the second aspect of the present invention includes a process of obtaining spectral data by performing time-frequency conversion on an audio signal in units of sub-blocks constituting one frame, and includes the sub-signals included in one frame. In an audio encoding device that encodes the audio signal using an audio encoding method for grouping blocks to share side information in the plurality of sub-blocks included in the same group, based on the spectral data, Calculating means for calculating the flatness of a spectrum for each sub-block, selecting means for selecting a sub-block whose flatness calculated by the calculating means exceeds a predetermined threshold as a single block, and each of the single blocks The independent group is included in the one frame. Making a group comprising at least two sub-blocks consecutive one of said sub-blocks other than German block and a grouping means.
本発明によれば、過渡的な信号の影響を正しく反映して適正にグルーピングすることで、圧縮率を向上できるようになる。 According to the present invention, it is possible to improve the compression ratio by properly reflecting the influence of a transient signal and appropriately performing grouping.
以下、図面を参照して本発明の一実施形態について説明する。
図1は本実施形態に係るオーディオ符号化装置(以下、符号化装置と称する)のブロック図である。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram of an audio encoding apparatus (hereinafter referred to as an encoding apparatus) according to this embodiment.
この符号化装置は、入力されるPCM信号に対して符号化処理を行い、符号化ビットストリームを出力するものである。この符号化装置は、ブロック切り出し部1、心理聴覚モデル部2、フィルタバンク部3、スイッチ4、フラットネスメジャー算出部5、グルーピング部6、量子化歪み/レート制御部7、ホストプロセッサ8、スケーリング部9、量子化部10、符号化部11およびフォーマッタ12を含む。なお、これらの各部は、ハードウェアによりそれぞれを構成することも可能であるし、各部の機能をDSP(Digital Signal Processor)等によるソフトウェア処理によって実現することも可能である。
This encoding apparatus performs an encoding process on an input PCM signal and outputs an encoded bit stream. This encoding apparatus includes a
ブロック切り出し部1には、符号化の対象となるPCM信号が与えられる。このPCM信号は、時間域の信号である。ブロック切り出し部1は、このPCM信号から規定のブロックサイズのサンプル数毎にデータを切り出す。そしてブロック切り出し部1は、この切り出した信号を出力する。
The
心理聴覚モデル部2は、ブロック切り出し部1が出力する信号に対してDFT(Discrete Fourier Transform)、DCT(Discrete Cosine Transform)、あるいはMDCT(Modified DCT)等の直交変換を行い、これにより時間域の信号から周波数領域の信号に変換する。心理聴覚モデル部2は、上記の直交変換により得られる変換係数(周波数成分)から知覚エントロピーと呼ばれるパラメータを計算する。このパラメータは、上記の変換係数から、聴感上の周波数分解能、周波数成分の拡散、予測不能性、信号の調音性(tonality)を解析することにより1ブロックを符号化するのに必要とされる情報量を推定するためのものであり、計算方法の詳細はISO/IECにより制定された国際標準規格13818-7にて規定されている。
The
ところで心理聴覚モデル部2は、ブロック切替え部2aおよびSMR算出部2bを有する。ブロック切替え部2aは、上記の知覚エントロピーに基づいて、実際に符号化する時の直交変換処理(MDCT処理)で用いるブロック長(ロングブロック,ショートブロック)を判定する。ブロック切替え部2aは、この判定の結果を示したブロック長情報をフィルタバンク部3およびスイッチ4へ出力する。SMR算出部2bは、聴覚上の周波数分解能を考慮した尺度(バーク、メル等)での等間隔の帯域毎に、信号に対してマスクされる音、つまりノイズとして存在しても知覚されない許容雑音の量の比を示すSMR(Signal to Mask Ratio)を算出する。SMR算出部2bは、上記算出したSMRを、量子化歪み/レート制御部7へ出力する。
The
フィルタバンク部3は、ブロック切り出し部1の出力信号を、心理聴覚モデル部2から出力されるブロック長情報に従って直交変換する。フィルタバンク部3は、上記の直交変換により得られたスペクトラルデータを出力する。なお、符号化方式としてAACを採用している場合、フィルタバンク部3での直交変換はMDCTとなる。
The
スイッチ4は、フラットネスメジャー算出部5およびグルーピング部6とスケーリング部9とのいずれかをブロック長情報に基づいて選択する。スイッチ4は、選択している側にフィルタバンク部3の出力信号を与える。
The
フラットネスメジャー算出部5は、フィルタバンク部3の出力信号におけるスペクトルフラットネスメジャーを、サブブロック毎に算出する。グルーピング部6は、フラットネスメジャー算出部5で算出されたスペクトルフラットネスメジャーに基づいて、フィルタバンク部3の出力信号をグルーピングする。
The flatness
量子化歪み/レート制御部7は、ホストプロセッサ8が指示する符号化レートと、心理聴覚モデル部2が出力するSMRとに基づいて、フレーム毎に割当可能な符号量を算出する。量子化歪み/レート制御部7は、上記算出した符号量を符号化フレームの目標符号量として、スケーリング部9、量子化部10および符号化部11を制御する。例えば量子化歪み/レート制御部7は、量子化部10から与えられる量子化係数から量子化歪み量を算出し、その結果に応じて量子化部10へと出力指示を与える。また量子化歪み/レート制御部7は、符号化部11から通知される符号量が上記目標符号量以内であるか否かを確認し、目標符号量以内であるときに符号化部11へと出力指示を与える。
The quantization distortion /
スケーリング部9は、フィルタバンク部3またはグルーピング部6から出力されるスペクトラルデータに基づいてスケールファクターを決定する。スケーリング部9は、この決定したスケールファクターを用いてフィルタバンク部3から出力されるスペクトラルデータをスケーリングする。そしてスケーリング部9は、上記のスケーリング後のスペクトラルデータを量子化部10へ出力する。またスケーリング部9は、量子化歪み/レート制御部7からの指示に応じてスケーリング係数をフォーマッタ12へ出力する。
The
量子化部10は、スケーリング部9から出力されたスペクトラルデータを規定の式に従って補正したのち、全てのスペクトラルデータについて量子化を行う。量子化部10は、量子化したのちのデータを、量子化歪み誤差がSMR値に基づく許容誤差であるかを判定するための情報として量子化歪み/レート制御部7へと出力する。量子化部10は、量子化歪み/レート制御部7からの出力指示に応じて、量子化後のデータを符号化部11へ出力する。
The quantizing
符号化部11は、量子化部10の出力を所定の符号化方式に従って圧縮符号化する。例えば、AACの場合は上述の符号化方式としてハフマン符号化方式が適用される。符号化部11は、符号化後の符号量を量子化歪み/レート制御部7へと出力する。符号化部11は、量子化歪み/レート制御部7からの出力指示に応じて、符号化後のデータをフォーマッタ12へ出力する。
The
フォーマッタ12は、符号化部11の出力とスケーリング部9から出力されるスケーリング係数とを所定のフォーマットに従って多重化する。フォーマッタ12は、上記の多重化の結果を、符号化オーディオ信号として出力する。
The
なお、グルーピング部6にてグルーピングされた信号を処理するとき、スケーリング部9、量子化部10、符号化部11およびフォーマッタ12における処理においては、スケールファクターなどのサイド情報を共通化する。
When signals grouped by the grouping unit 6 are processed, side information such as a scale factor is shared in the processing in the
次に以上のように構成された符号化装置の動作について説明する。なお、本願発明のポイントは、ショートブロックと判定された場合におけるグルーピング処理にある。そこでここでは、この処理を中心として説明する。この他の処理については、AACに準拠する既存の符号化装置と同様な処理を適用可能である。 Next, the operation of the encoding apparatus configured as described above will be described. The point of the present invention lies in the grouping process when it is determined that the block is a short block. Therefore, here, this process will be mainly described. For other processing, processing similar to that of an existing encoding device that conforms to AAC can be applied.
ブロック切替え部2aは、知覚エントロピーに基づいて、アタック信号のような過渡的な信号が含まれるフレームについてはショートブロックと判定し、それ以外のフレームについてはロングブロックと判定する。
Based on the perceptual entropy, the
ショートブロックと判定された場合、スイッチ4はフラットネスメジャー算出部5およびグルーピング部6を選択する。
When it is determined that the block is a short block, the
一方、ショートブロックと判定された場合にフィルタバンク部3は、時間域のオーディオ信号を図3に示すような8つの窓W0〜W7のそれぞれで区切り、各区間の信号を個別にMDCTすることにより、0番から7番までの8つのサブブロックのスペクトラルデータを順次得る。この8つのサブブロックのスペクトラルデータは、フラットネスメジャー算出部5およびグルーピング部6に順次入力される。
On the other hand, when it is determined that the block is a short block, the
フラットネスメジャー算出部5は、入力されるスペクトラルデータの平坦度をサブブロック毎に算出する。スペクトラルデータの平坦度としては、下記の(1)式により算出されるスペクトラルフラットネスメジャーを使用することができる。
上記の(1)式におけるMaおよびMgは、サンプル毎の信号の強さまたはパワー値についてのサブブロック内での相加平均および相乗平均であって、下記の(2)式および(3)式により算出される。
なおここで、kはサブブロック番号、nはサブブロックのサンプル数、spec(i)はサンプル毎の信号の強さまたはパワー値である。
すなわちスペクトラルフラットネスメジャーは、サンプル毎の信号の強さまたはパワー値についてのサブブロック内での相加相乗平均である。
Here, k is a sub-block number, n is the number of sub-block samples, and spec (i) is the signal strength or power value for each sample.
That is, the spectral flatness measure is an arithmetic geometric average within the sub-block for the signal strength or power value for each sample.
図2は図1中のグルーピング部6における動作フローを示す図である。グルーピング部6は各フレームを対象としてこの図2に示す処理を行う。 FIG. 2 is a diagram showing an operation flow in the grouping unit 6 in FIG. The grouping unit 6 performs the processing shown in FIG. 2 for each frame.
ステップSa1においてグルーピング部6は、上述のようにフラットネスメジャー算出部5がサブブロック毎に算出するスペクトラルフラットネスメジャーsfm(0)〜sfm(7)を収集する。ステップSa2においてグルーピング部6は、これらのスペクトラルフラットネスメジャーsfm(0)〜sfm(7)のうちの最大値を判定する。そしてステップSa3においてグルーピング部6は、最大値であるスペクトラルフラットネスメジャーsfmの番号を、変数kminに代入する。すなわち、例えばスペクトラルフラットネスメジャーsfm(3)が最大値であるならば、変数kminに「3」を代入する。
In step Sa1, the grouping unit 6 collects the spectral flatness measures sfm (0) to sfm (7) calculated by the flatness
ステップSa4においてグルーピング部6は、変数kminの値が「0」、「1」〜「6」および「7」のいずれであるかを確認する。 In step Sa4, the grouping unit 6 checks whether the value of the variable kmin is “0”, “1” to “6”, or “7”.
変数kminの値が「0」であるならば、グルーピング部6はステップSa4からステップSa5へ進む。ステップSa5においてグルーピング部6は、0番のサブブロックを第1グループ、1〜7番のサブブロックを第2グループとしてグルーピングする。 If the value of the variable kmin is “0”, the grouping unit 6 proceeds from step Sa4 to step Sa5. In step Sa5, the grouping unit 6 groups the 0th sub-block as the first group and the 1-7th sub-blocks as the second group.
変数kminの値が「1」〜「6」であるならば、グルーピング部6はステップSa4からステップSa6へ進む。ステップSa6においてグルーピング部6は、0番からkmin−1番のサブブロックを第1グループ、kmin番のサブブロックを第2グループ、kmin+1番〜7番のサブブロックを第3グループとしてグルーピングする。 If the value of the variable kmin is “1” to “6”, the grouping unit 6 proceeds from step Sa4 to step Sa6. Grouping unit 6 at step Sa6 is a k min -1 th subblock 0 th first group, the sub-blocks of the second group of k min th, the sub-blocks of k min +1 th to 7 th as the third group Group.
変数kminの値が「7」であるならば、グルーピング部6はステップSa4からステップSa7へ進む。ステップSa7においてグルーピング部6は、0〜6番のサブブロックを第1グループ、7番のサブブロックを第2グループとしてグルーピングする。 If the value of the variable kmin is “7”, the grouping unit 6 proceeds from step Sa4 to step Sa7. In step Sa7, the grouping unit 6 groups the 0th to 6th sub-blocks as the first group and the 7th sub-block as the second group.
つまりグルーピング部6は、スペクトル形状が最も平坦なサブブロックをひとつのブロックとして独立させ、その他の連続したサブブロックをひとつのグループとして纏める。例えば3番のサブブロックにおけるスペクトラルデータのスペクトル形状が最も平坦であるならば、グルーピング部6は各サブブロックを{0,1,2}、{3}、{4,5,6,7}のようにグルーピングする。 That is, the grouping unit 6 separates sub-blocks having the flatest spectrum shape as one block, and collects other consecutive sub-blocks as one group. For example, if the spectral shape of the spectral data in the third sub-block is the flattest, the grouping unit 6 assigns each sub-block to {0,1,2}, {3}, {4,5,6,7}. Group them as follows.
このようにして同一グループにグルーピングされた複数のサブブロックは、スケールファクターなどのサイド情報が共有される。 A plurality of sub-blocks grouped in the same group in this way share side information such as a scale factor.
スペクトルの形状は、過渡的な信号であるほど平坦になる。このため、スペクトル形状が最も平坦なサブブロック、すなわちスペクトラルフラットネスメジャーが最大であるサブブロックは、過渡的な信号の影響が最も大きく現れているサブブロックである。かくして上述のような本実施形態のグルーピングにより、過渡的な信号の影響を正しく反映して適正にグルーピングすることができる。そしてこれにより、サイド情報の共有が適正に行われるから、圧縮率を向上できる。 The shape of the spectrum becomes flatter as the signal is transient. For this reason, the sub-block having the flatst spectral shape, that is, the sub-block having the largest spectral flatness measure is the sub-block in which the influence of the transient signal appears most. Thus, by the grouping of the present embodiment as described above, it is possible to properly perform the grouping by correctly reflecting the influence of the transient signal. As a result, since the side information is properly shared, the compression rate can be improved.
例えば図3に示した例においては、過渡信号の影響は窓W2におけるMDCT処理よりも窓W3におけるMDCT処理に大きく影響し、窓W3に対応する3番のサブブロックのスペクトル形状が平坦になる。この結果、上述の具体例のような適正なグルーピングが行われる。 For example, in the example shown in FIG. 3, the influence of the transient signal has a greater effect on the MDCT processing in the window W3 than in the MDCT processing in the window W2, and the spectrum shape of the third sub-block corresponding to the window W3 becomes flat. As a result, appropriate grouping as in the above specific example is performed.
なお、スペクトラルフラットネスメジャーは、グルーピングとは異なる処理のために計算することが行われる場合がある。この場合には、このような別処理のために計算されるスペクトラルフラットネスメジャーをグルーピングに利用することにより、グルーピングをより簡易な処理で実現することが可能である。 Note that the spectral flatness measure may be calculated for processing different from the grouping. In this case, the grouping can be realized by a simpler process by using the spectral flatness measure calculated for such another process for the grouping.
この実施形態は、次のような種々の変形実施が可能である。
2番目や3番目に大きいスペクトラルフラットネスメジャーが閾値を超える場合に、それらのスペクトラルフラットネスメジャーが算出されたサブブロックも独立させるようにグルーピングしても良い。
This embodiment can be variously modified as follows.
When the second or third largest spectral flatness measure exceeds a threshold, the sub-blocks for which the spectral flatness measure is calculated may be grouped so as to be independent.
知覚エントロピーに基づいてロングブロックと判定できるフレームであっても、その前後のフレームがいずれもショートブロックと判定されるならば、ショートブロックに変換する手法が採用されることがある。この場合、ロングブロックからショートブロックに変換されたフレームには過渡的な信号が含まれないから、グルーピングを行わずに8つのサブブロックを全て1つのグループとして纏めることが好ましい。このようにすれば、全てのサイドブロックでサイド情報の共通化が図れ、圧縮率が向上する。なお、上記のように過渡的な信号が含まれずにショートブロックとされるフレームが生じることに対応するためには、例えばロングブロックからショートブロックに変換処理の結果を監視する手法や、スペクトラルフラットネスメジャーの最大値が閾値を超えるか否かを監視する手法が考えられる。 Even if the frame can be determined to be a long block based on the perceptual entropy, a method of converting to a short block may be adopted if both the preceding and succeeding frames are determined to be short blocks. In this case, since a frame converted from a long block to a short block does not include a transient signal, it is preferable to group all eight sub-blocks as one group without performing grouping. In this way, the side information can be shared by all the side blocks, and the compression rate is improved. In order to cope with the occurrence of a short block frame that does not include a transient signal as described above, for example, a method of monitoring the result of conversion processing from a long block to a short block, or spectral flatness A method of monitoring whether the maximum value of the measure exceeds a threshold value can be considered.
1グループに含めるサブブロックの数を制限すべきならば、より多くのグループを作るようにグルーピングしても良い。例えば、1グループに含めるサブブロックの3つまでに制限すべきならば、上記の実施形態に示した具体例では各サブブロックを{0,1,2}、{3}、{4,5,6,7}のようにグルーピングするところを、{0,1,2}、{3}、{4,5,6}、{7}のようにグルーピングする。 If the number of sub-blocks included in one group should be limited, grouping may be performed so as to create more groups. For example, if the number of subblocks to be included in one group should be limited to three, in the specific example shown in the above embodiment, each subblock is {0,1,2}, {3}, {4,5, Groupings such as 6,7} are grouped as {0,1,2}, {3}, {4,5,6}, {7}.
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment.
1…ブロック切り出し部、2…心理聴覚モデル部、3…フィルタバンク部、4…スイッチ、5…フラットネスメジャー算出部、6…グルーピング部、7…量子化歪み/レート制御部、8…ホストプロセッサ、9…スケーリング部、10…量子化部、11…符号化部、12…フォーマッタ。
DESCRIPTION OF
Claims (5)
前記スペクトラルデータに基づいて、前記サブブロック毎にスペクトルの平坦度を算出する算出手段と、
前記1フレームに含まれた前記サブブロックのうちから最大の前記平坦度が算出されたものを単独ブロックとして選択する選択手段と、
前記1フレームに含まれた前記サブブロックを、前記単独ブロックのグループと、前記単独ブロック以外の前記サブブロックのうちの連続する少なくとも2つのサブブロックを含むグループとを作るように前記グルーピングを行うグルーピング手段とを具備したことを特徴とするオーディオ符号化装置。 The audio signal is subjected to time-frequency conversion in units of sub-blocks constituting one frame to obtain spectral data, and the sub-blocks included in one frame are grouped to form a plurality of the sub-blocks included in the same group. In an audio encoding device that encodes the audio signal using an audio encoding method in which side information is shared in a block,
Based on the spectral data, calculation means for calculating the flatness of the spectrum for each sub-block,
Selecting means for selecting, as a single block, the one with the highest flatness calculated from the sub-blocks included in the one frame;
Grouping for grouping the sub-blocks included in the one frame so as to form a group of the single block and a group including at least two consecutive sub-blocks of the sub-blocks other than the single block. And an audio encoding device.
前記スペクトラルデータに基づいて、前記サブブロック毎にスペクトルの平坦度を算出する算出手段と、
前記算出手段によって算出された前記平坦度が所定の閾値を超えるサブブロックを単独ブロックとして選択する選択手段と、
前記単独ブロックのそれぞれを独立のグループとし、前記1フレームに含まれた前記単独ブロック以外の前記サブブロックのうちの連続する少なくとも2つのサブブロックを含むグループを作るグルーピング手段とを具備したことを特徴とするオーディオ符号化装置。 The audio signal is subjected to time-frequency conversion in units of sub-blocks constituting one frame to obtain spectral data, and the sub-blocks included in one frame are grouped to form a plurality of the sub-blocks included in the same group. In an audio encoding device that encodes the audio signal using an audio encoding method in which side information is shared in a block,
Based on the spectral data, calculation means for calculating the flatness of the spectrum for each sub-block,
Selecting means for selecting, as a single block, a sub-block whose flatness calculated by the calculating means exceeds a predetermined threshold;
Grouping means for making each of the single blocks an independent group and creating a group including at least two consecutive subblocks of the subblocks other than the single block included in the one frame. An audio encoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005011737A JP4550595B2 (en) | 2005-01-19 | 2005-01-19 | Audio encoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005011737A JP4550595B2 (en) | 2005-01-19 | 2005-01-19 | Audio encoding device |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006201375A JP2006201375A (en) | 2006-08-03 |
JP2006201375A5 JP2006201375A5 (en) | 2008-01-31 |
JP4550595B2 true JP4550595B2 (en) | 2010-09-22 |
Family
ID=36959441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005011737A Expired - Fee Related JP4550595B2 (en) | 2005-01-19 | 2005-01-19 | Audio encoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4550595B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2619277T3 (en) | 2007-08-27 | 2017-06-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Transient detector and method to support the encoding of an audio signal |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003195881A (en) * | 2001-12-28 | 2003-07-09 | Victor Co Of Japan Ltd | Device and program for adaptively converting frequency block length |
JP2003345398A (en) * | 2002-05-27 | 2003-12-03 | Matsushita Electric Ind Co Ltd | Audio signal encoding method |
-
2005
- 2005-01-19 JP JP2005011737A patent/JP4550595B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003195881A (en) * | 2001-12-28 | 2003-07-09 | Victor Co Of Japan Ltd | Device and program for adaptively converting frequency block length |
JP2003345398A (en) * | 2002-05-27 | 2003-12-03 | Matsushita Electric Ind Co Ltd | Audio signal encoding method |
Also Published As
Publication number | Publication date |
---|---|
JP2006201375A (en) | 2006-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101178114B1 (en) | Apparatus for mixing a plurality of input data streams | |
CN110379434B (en) | Method for parametric multi-channel coding | |
JP4934427B2 (en) | Speech signal decoding apparatus and speech signal encoding apparatus | |
KR101428487B1 (en) | Method and apparatus for encoding and decoding multi-channel | |
EP3343560B1 (en) | Audio coding device and audio coding method | |
RU2713605C1 (en) | Audio encoding device, an audio encoding method, an audio encoding program, an audio decoding device, an audio decoding method and an audio decoding program | |
KR20100086000A (en) | A method and an apparatus for processing an audio signal | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
KR20160060085A (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
KR20060113998A (en) | Audio coding | |
KR101291672B1 (en) | Apparatus and method for encoding and decoding noise signal | |
KR20090083068A (en) | Method and apparatus for encoding/decoding audio signal | |
US9548056B2 (en) | Signal adaptive FIR/IIR predictors for minimizing entropy | |
WO2009059632A1 (en) | An encoder | |
KR20070046752A (en) | Method and apparatus for signal processing | |
EP3826011A1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP4550595B2 (en) | Audio encoding device | |
JP2008261999A (en) | Audio decoding device | |
JP4359949B2 (en) | Signal encoding apparatus and method, and signal decoding apparatus and method | |
JP4281131B2 (en) | Signal encoding apparatus and method, and signal decoding apparatus and method | |
JP4116628B2 (en) | Audio encoding method and audio encoding apparatus | |
JP4625709B2 (en) | Stereo audio signal encoding device | |
JP4699117B2 (en) | A signal encoding device, a signal decoding device, a signal encoding method, and a signal decoding method. | |
US11176954B2 (en) | Encoding and decoding of multichannel or stereo audio signals | |
JP4191503B2 (en) | Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071210 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100608 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100708 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130716 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |