JP2001007704A - トーン成分データの適応オーディオ符号化方法 - Google Patents

トーン成分データの適応オーディオ符号化方法

Info

Publication number
JP2001007704A
JP2001007704A JP11178102A JP17810299A JP2001007704A JP 2001007704 A JP2001007704 A JP 2001007704A JP 11178102 A JP11178102 A JP 11178102A JP 17810299 A JP17810299 A JP 17810299A JP 2001007704 A JP2001007704 A JP 2001007704A
Authority
JP
Japan
Prior art keywords
tone
component
tone component
encoding
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11178102A
Other languages
English (en)
Inventor
Mei Shen Shen
メイ・シェン シェン
Kiyotaka Nagai
清隆 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11178102A priority Critical patent/JP2001007704A/ja
Publication of JP2001007704A publication Critical patent/JP2001007704A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音質を劣化させずに高い圧縮率で圧縮可能な
オーディオ符号化方法を提供する。 【解決手段】 オーディオ符号化方法において、トーン
データは、適応的に選択されるトーン成分符号化方法ま
たはスペクトルデータ符号化方法により符号化される。
特に、トーン成分データは、最大ピークエネルギーに基
づきトーン信号を識別することによって検出される。検
出されたトーン成分の最大成分がトーンデータの中心と
して位置づけられることにより、識別されたトーンユニ
ットからトーン成分データが抽出される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はオーディオ信号のデ
ジタル符号化技術に関する。
【0002】
【従来の技術】一般にオーディオ信号はトーン成分デー
タとスペクトルデータとを含む。トーン成分データの抽
出及び符号化は、聴覚やTHD+N(全高調波歪み+ノ
イズ)パラメータテストの双方に点において、良好な音
質を実現するために非常に重要である。粗雑に量子化さ
れたトーン成分データにより発生する量子化ノイズは、
粗雑に量子化されたスペクトルデータにより発生するノ
イズと比較して非常に耳ざわりとなる。
【0003】一般に、検出/抽出をより細かく行うほ
ど、オーディオ信号はより高品質に再構成され、THD
+Nをより良く改善できる。しかし、トーン成分データ
の検出/抽出を非常に細かく行うことは、そのTHD+
N値は良くなるが、人間の耳に対する音質は悪くなる。
このことは、特に、ほとんどのビットが抽出されるトー
ン成分データに割り当てられるために、他のスペクトル
データに割り当てられるビットが不十分となる場合に発
生する。
【0004】近年、ミニディスク(MD)符号化やISO/
IEC 13818-3 MPEG 2 アドバンス・オーディオ符号化
(AAC)のような応用分野において、サブバンド符号
化と変換オーディオ符号化を混成した技術が広く使用さ
れている。ミニディスク製品においては、トーン成分の
検出/抽出及び符号化を伴わない純粋なスペクトル符号
化が、周波数成分のスペクトル全体に対して適用され
る。
【0005】ここで、トーン成分データ符号化は、トー
ン成分データの検出と、検出された各トーン成分データ
に対するきめ細かい量子化スケールでの符号化とからな
る。トーン成分データ符号化では良好な音声品質を得る
ために多くのビットを必要とする。一方、スペクトルデ
ータ符号化は、臨界バンドの形成と、一つの量子化スカ
ラーによる全バンドのサンプルの符号化とからなり、高
い符号化効率を達成するが調性(tonality)を損なう可
能性がある。
【0006】別の従来のオーディオ符号化方法として、
トーン成分データ符号化及びスペクトルデータ符号化
を、トーン成分及びスペクトルデータを符号化するため
にそれぞれ使用する方法がある。このような技術は例え
ば、筒井京弥他著の「次世代オーディオ高能率符号化方
式ATRAC2の開発」(Proceedings of the 5th Son
y Research Forum, 1995)に開示されている。
【0007】このオーディオ符号化では、図8に示すよ
うにオーディオ入力はモジュール11におけるサブバン
ドプリフィルタに入力される。モジュール11は所定の
フィルタ処理を行うサブバンドフィルタを有する。モジ
ュール11では、オーディオ入力がオーディオチャネル
毎に、複数のサンプルからなるフレームに分割され、各
フレーム毎に複数のサンプルがサブバンドフィルタによ
り前もって所定のフィルタ処理が行われた後、そのフィ
ルタ処理されたサンプルが異なる所定数の周波数バンド
に分割される。その後、変形離散コンサイン変換(MD
CT)処理がモジュール12で実行され、その結果を用
いてモジュール13で周波数スペクトルが形成される。
【0008】また、モジュール14ではトーン成分が抽
出される。ここで、トーン成分は、一般にその周辺のト
ーン成分以外の成分と比較して、パワーが非常に大き
い。抽出されたトーン成分データはモジュール15に入
力される。トーン成分でないデータ(以下「非トーン成
分データ」という。)はモジュール16のスペクトルデ
ータ符号化部に入力される。同時にモジュール15から
トーン成分データに対して使用されるビットがモジュー
ル16のスペクトルデータ符号化部に入力される。
【0009】トーン成分データ及びスペクトルデータに
対する関連情報(side information)はモジュール18
のビットストリームパック処理部に入力される。なお、
関連情報にはデータに対するサンプリング周波数、量子
化時のビット数、使用したハフマンテーブルに関する情
報等が含まれる。モジュール15及びモジュール16で
それぞれ符号化されたデータはモジュール17の量子化
及び正規化部に入力され、最後に、ビットストリームに
パックするためにモジュール18に入力される。
【0010】
【発明が解決しようとする課題】トーン成分符号化方法
を含むこのような従来のオーディオ符号化においては、
一旦、トーン成分が検出されて抽出されると、これらの
トーン成分データは、量子化誤差の少ないトーン成分符
号化方法を利用することによりそれぞれ符号化される。
【0011】実際には、少ない量子化誤差でトーン成分
データを符号化することは、従来の多くのスペクトルデ
ータ符号化方法において考慮されてきており、それ故、
いくつかのバンドユニット又はいくつかのフレームに対
してでさえも可能であり、トーン成分データを別々に符
号化するためにトーン成分データ符号化を利用する必要
はない。言い換えれば、従来のスペクトルデータ符号化
もまた多くの場合においてトーン成分データの符号化に
適している。
【0012】また、さらなる問題として、トーン成分符
号化方法及びスペクトルデータ符号化方法により同じト
ーン成分データが符号化される場合に、トーン成分デー
タ符号化が、スペクトルデータ符号化よりも効率が悪い
という問題がある。
【0013】さらに別の問題として、多くのトーン成分
が検出されて抽出される場合に、ほとんど全てのビット
がトーン成分データの符号化に対して使用され、このた
め、スペクトルデータの符号化に対するビットが十分に
残っていないという問題がある。
【0014】トーン成分抽出と符号化を含む従来のオー
ディオ符号化では、前述の理由から符号化効率が低下す
る場合がある。
【0015】本発明は適応トーン成分符号化技術を導入
することにより上記課題を解決するためになされたもの
であり、その目的とするところは、オーディオ信号を人
間の聴感上音質劣化させることなく高効率に圧縮可能な
オ−ディオ符号化方法を提供することにある。
【0016】
【課題を解決するための手段】本発明においては、トー
ン成分データを、必ずしもトーン成分データ符号化によ
り符号化するわけではなく、従来のスぺクトルデータ符
号化により符号化し、トーン成分以外の周波数成分に対
するビットをより多く節約する。
【0017】同時に、トーンデータ符号化方法とスペク
トルデータ符号化方法のうちのいずれが使用された場合
でも、トーン成分データの符号化において量子化誤差を
低減することができる。
【0018】本発明の符号化方法では、全周波数成分に
対してそれがどんなトーン成分であろうと最初にスペク
トルデータ符号化方法を適用する。その後、トーン成分
ユニットに対して得られた量子化スカラー(quantizati
on scalar)を検査する。その検査結果にしたがい、ト
ーン成分データ符号化方法を使用するか否かを決定す
る。
【0019】すなわち、トーン成分データ符号化方法
と、量子化誤差が小さいスペクトルデータ符号化方法と
の双方について、同じトーンデータを符号化する場合の
ビット使用量を計算する。
【0020】バンドユニットにおけるピークエネルギー
に基づきトーンデータを最初に検出し、狭い領域におい
てそれらの絶対値を所定のしきい値と比較することによ
り実際のトーン成分を抽出する。
【0021】トーンデータの関連情報は符号化され、各
トーン信号において各周波数成分毎に、トーン信号にお
ける周波数成分の数、トーンの位置、トーンの量子化ス
カラー及びスケールファクタを与える。
【0022】より具体的には、本発明に係るオーディオ
符号化方法では、入力したオーディオ信号は、複数のサ
ブバンドに分割するサブバンドフィルタ前置処理後、周
波数成分を得るためのMDCT変換処理がなされ、MD
CT係数が生成される。
【0023】最初に全周波数バンドにおいてピークエネ
ルギーを識別することによりトーン成分が検出され、さ
らに、そのピークエネルギーを持つバンドユニットにお
いて周波数成分の絶対値の最大値を検査することにより
実際のトーン成分が抽出される。
【0024】全バンドユニットにおいて周波数成分に対
してスペクトルデータ符号化を最初に行う。その結果と
して得られるトーン成分ユニットにおける量子化スカラ
ーを所定の量子化スケール(Qscale)で検査し、トー
ン成分ユニット毎にトーン成分データ符号化方法を使用
するか否かを決定する。
【0025】トーン成分データ符号化方法を使用する必
要がある場合は、そのトーン成分ユニットに対して、所
定の量子化スケールでトーン成分データ符号化及びスペ
クトルデータ符号化の双方が実行される。その後、双方
の符号化に対してビット使用量が計算される。ビット使
用量が小さい方の符号化方法が、そのトーン成分ユニッ
トに対する符号化方法として選択される。
【0026】その後、トーン成分データの符号化に使用
されるビットを除外することにより、スペクトル符号化
方法に基づいたビットの再割り当てが実行される。
【0027】周波数成分の量子化及び正規化のそれぞれ
を行うために、スケールファクタとともに最終的な量子
化スカラーが使用される。その後引き続いてエントロピ
ー符号化とビットストリーム・パック処理が行われる。
【0028】本発明に係る第1のオーディオ符号化方法
は、トーン成分データに対する適応オーディオ符号化方
法である。そのオーディオ符号化方法は、入力オーディ
オデータをオーディオチャネル毎に、各々が複数のサン
プルからなる複数フレームに分割するステップと、フレ
ーム中の複数のサンプルを所定のフィルタ前置処理する
ステップと、フレーム中のフィルタ前置処理されたサン
プルを異なるバンドに分割するステップと、その異なる
バンド中のフィルタ前置処理されたサンプルに対して、
周波数成分を得るための所定の変換を行うステップと、
得られた周波数成分を、各々が複数の周波数成分からな
る異なる臨界バンドユニットに分類するステップと、周
波数スペクトル全体からトーン成分を検出して抽出する
ステップと、最初に、所定のスペクトルデータ符号化に
基づいて周波数成分のそれぞれにビットを割り当るステ
ップと、ビット割り当ての後で、臨界バンドユニット毎
に初期量子化スカラーを取得するステップと、トーン成
分を含むトーン成分ユニットに対して初期量子化スカラ
ーを検査するステップと、検査に基づいて粗雑な量子化
が行われるトーン成分ユニットに対してトーン成分符号
化を行うステップと、同時に、同じトーン成分に対して
スペクトルデータ符号化を、粗雑な量子化をきめ細かな
量子化に変更することにより行うステップと、それらの
実際のビット使用量に基づいて、トーン成分符号化と、
トーンユニットに対してきめ細かな量子化を行うスペク
トルデータ符号化との間で符号化方法を選択するステッ
プと、選択された符号化方法を用いてトーン成分を符号
化するステップと、最後に、ユニット毎に最終的な量子
化スカラーを取得するために、残りのビットを他の周波
数成分に割り当るステップと、トーン成分と周波数成分
の双方について符号化されたビットをビットストリーム
にパックするステップとを有する。
【0029】本発明に係る第2のオーディオ符号化方法
は、トーン成分データに対する適応オーディオ符号化方
法である。そのオーディオ符号化方法は、入力オーディ
オデータをオーディオチャネル毎に、各々が複数のサン
プルからなる複数フレームに分割するステップと、フレ
ーム中の上記複数のサンプルを所定のフィルタ前置処理
するステップと、フレーム中のフィルタ前置処理された
サンプルを異なるバンドに分割するステップと、異なる
バンド中のフィルタ前置処理されたサンプルに対して、
周波数成分を得るための所定の変換を行うステップと、
周波数成分を、各々が複数の周波数成分からなる異なる
臨界バンドユニットに分類するステップと、各バンドユ
ニットにおいて周波数成分に対するピーク値を検出して
該ユニットに対するスケールファクタを計算するステッ
プと、スケールファクタからバンドユニット毎にピーク
エネルギーをそれぞれ取出すステップと、全てのバンド
ユニットに対するピークエネルギーの全てから最大ピー
クエネルギーを捜し出し、その最大ピークエネルギーに
対応するユニットを識別するステップと、最大ピークエ
ネルギーを所定値と比較した後に、最大ピークエネルギ
ー値を選択するステップと、最大ピークエネルギーが選
択されたユニットにおける全ての周波数成分から最大周
波数成分を捜し出すステップと、所定の窓及び平均しき
い値に基づき複数の周波数成分の値を評価するステップ
と、周波数成分の絶対値が上記しきい値よりも大きいと
きに複数の周波数成分からトーン成分を抽出するステッ
プと、トーン成分が抽出されたユニットに対してピーク
値、スケールファクタ及びピークエネルギーを更新する
ステップと、バンドユニット全てに対して、全ての残り
のピークエネルギー及び更新されたピークエネルギーか
ら、次の最大ピークエネルギーを検索し、次の最大ピー
クエネルギーに対応するユニットを識別するステップ
と、次の最大ピークエネルギーを所定のしきい値と比較
した後、次の最大のピークエネルギーを選択するステッ
プと、次の最大ピークエネルギーが選択されたユニット
における全周波数成分から最大の周波数成分を検索する
ステップと、所定の窓及び平均しきい値に基づき複数の
周波数成分を評価するステップと、周波数成分の絶対値
がしきい値よりも大きいときに、複数の周波数成分から
トーン成分を抽出するステップと、次の最大ピークエネ
ルギーが所定のしきい値よりも小さくなるまで、上記各
ステップを繰り返すステップとを有する。
【0030】本発明に係る第3のオーディオ符号化方法
は、トーン成分データに対する適応オーディオ符号化方
法である。そのオーディオ符号化方法は、入力オーディ
オデータをオーディオチャネル毎に、各々が複数のサン
プルからなる複数フレームに分割するステップと、フレ
ーム中の複数のサンプルに対して所定のフィルタ前置処
理を行うステップと、フレーム中のフィルタ前置処理さ
れたサンプルを異なるバンドに分割するステップと、異
なるバンドにおいてフィルタ前置処理されたサンプルに
対して、周波数成分を得るための所定の変換を行うステ
ップと、周波数成分を、各々が複数の周波数成分からな
る異なる臨界バンドユニットに分類するステップと、周
波数スペクトル全体からトーン成分を検出して抽出する
ステップと、最初に、所定のスペクトル符号化に基づい
て周波数成分のそれぞれにビットを割り当るステップ
と、ビット割り当ての後に、ユニット毎に初期量子化ス
カラーを取得するステップと、トーン成分を含むトーン
成分ユニットに対して初期量子化スカラーを検査するス
テップと、トーン成分ユニットに対する量子化スカラー
が所定スカラー量よりも大きいときは、トーン成分符号
化を伴わずに、ビット割り当てを完了し、全ての初期量
子化スカラーをデコーダに送るステップと、トーン成分
ユニットに対する初期量子化スカラーが所定スカラー量
以下のときは、トーン成分ユニットに対してトーン成分
符号化を行うステップと、初期量子化スカラーを所定ス
カラー量に変更して、トーン成分ユニットと同じユニッ
トに対して同時にスペクトルデータ符号化を行うステッ
プと、トーン成分符号化及びスペクトルデータ符号化の
双方の場合について全ビット使用量を求めるステップ
と、ビット使用量に基づいて、トーン成分符号化とスペ
クトルデータ符号化との間で符号化方法を決定するステ
ップと、トーン成分とスペクトル成分に対して使用され
るビットを符号化してパックするステップとを有する。
【0031】
【発明の実施の形態】以下、添付の図面を参照して本発
明に係るオーディオ信号の符号化方法の実施形態につい
て詳細に説明する。
【0032】以下に、本発明に係るオーディオ符号化方
法の好ましい実施形態を添付の図面を用いて詳細に説明
する。
【0033】図1は、本発明に係るオーディオ符号化方
法を実現するオーディオ符号化装置の構成の一例を示し
た図である。オーディオ符号化装置は所定の処理を行う
モジュール21〜29からなる。図1において、オーデ
ィオ入力がモジュール21のサブバンドプリフィルタに
入力される。モジュール21は所定のフィルタ処理を行
うサブバンドフィルタを有する。モジュール21では、
オーディオ入力がオーディオチャネル毎に、複数のサン
プルからなるフレームに分割され、各フレーム毎に複数
のサンプルがサブバンドフィルタにより前もって所定の
フィルタ処理が行われた後、そのフィルタ処理されたサ
ンプルが異なる所定数の周波数バンドに分割される。そ
の後、変形離散コンサイン変換(MDCT)処理がモジ
ュール22で実行され、その結果を用いてモジュール2
3で周波数スペクトルが形成される。
【0034】同時に、モジュール24において全バンド
ユニットに対してトーン成分抽出がなされ、モジュール
25において全バンドユニットに対してスペクトルデー
タ符号化がなされ、量子化スケールQscaleがモジュー
ル26に出力される。トーン成分ユニットに対する量子
化スケールQscaleはモジュール26において所定値Q0
を用いて検査される。
【0035】モジュール27において、トーン成分デー
タ符号化またはスペクトルデータ符号化のいずれかが、
モジュール26からの結果に基づき選択される。
【0036】その後、モジュール28において量子化及
び正規化がなされ、モジュール29においてビットスト
リームへのパックがなされる。
【0037】図2及び図3はモジュール27の処理の詳
細を説明した図である。図2に示すように、ステップS
31でトーン成分が抽出される。また、N個のバンドユ
ニットにおけるMDCT係数がステップS32に入力さ
れ、スペクトルデータ符号化に基づいて、入力したMD
CT係数に対してビット割り当てが実行され、バンドユ
ニット毎に初期量子化スケールQscale[u]を得る。ステ
ップS33においてトーン成分ユニットUTがステップ
S31からの結果に基づき識別される。
【0038】ステップS34においてトーンユニットU
Tに対する量子化スケールQscale[UT]が量子化スケー
ルの所定値Q0と比較される。量子化スケールQscale
[UT]が所定値Q0より大きい場合、すなわち、量子化誤
差が所定レベルよりも小さい場合、初期の量子化スケー
ルQscale[UT]がこのトーンユニットに対する最終的な
量子化スケールQscaleとして出力される(図3のステ
ップS44に示すように)。
【0039】また、ステップS34において量子化スケ
ールQscale[UT]が量子化スケールの所定値Q0以下の
ときは、その所定値Q0すなわち増加した量子化スケー
ルQscale_new[UT](=Q0)を用いたスペクトルデータ
符号化に基づき、そのトーンユニットに対してビット割
り当てが実行される(ステップS35)。同時に、所定
値Q0を用いたトーン成分符号化に基づいてそのトーン
ユニットにおけるトーン成分に対してビット割り当てが
実行される(ステップS36)。
【0040】ステップS37において、スペクトルデー
タ符号化の場合について、量子化スケールQscale[UT]
を所定値Q0に変更したときに増加したビットが計算さ
れる。その結果をBits_specとする。同時に、量子化ス
ケールQ0でトーン成分符号化した場合についてビット
使用量が計算される(ステップS38)。その結果をBi
ts_toneとする。
【0041】その後、Bits_specとBits_toneとが比較さ
れる(図3のステップS39)。Bits_toneがBits_spec
よりも大きい場合は、このトーンユニットを符号化する
ためにスペクトルデータ符号化が選択される(ステップ
S42)。そうでない場合(ステップS39においてN
O)は、トーン成分符号化が、そのトーンユニットにお
けるトーン成分を符号化するために選択される(ステッ
プS40)。
【0042】スペクトルデータ符号化が選択された場
合、トーンユニットに対して使用されるビットを全ての
有効ビットから除外することにより、非トーンユニット
に対してビット再割り当てが行われる(ステップS4
3)。他方、トーン成分データ符号化が選択された場
合、トーン成分データに対して使用されるビットを全て
の有効ビットから除外することにより、全てのユニット
に対してビット再割り当てが行われる(ステップS4
1)。最後に、全てのバンドユニットに対して更新され
た全ての量子化スケールが出力される(ステップS4
4)。
【0043】図4、図5及び図6はトーン成分の検出及
び抽出処理を説明するための図である。ここで、図4及
び図5において、MDCT係数はそれらの絶対値で垂直
方向に示され、周波数は水平方向に低い値から高い値と
なるように示されている。
【0044】図4の(a)に示すように、通常、トーン
成分はそれらの近傍の値と比較してそのMDCTの絶対
値が非常に高くなる。したがって、従来のスペクトルデ
ータ符号化においても、それらは符号化のためにより多
くのビットを必要とする。
【0045】図4の(b)に示すように、トーン成分が
抽出された後、それらより低いレベルのスペクトルデー
タが残る。そのため、それらを符号化するために必要と
されるビットはより少なくなる。
【0046】従来のスペクトルデータ符号化では、ビッ
ト割り当ては、異なる周波数バンドに対する人間の聴覚
応答に基づいて周波数成分を複数の臨界バンドユニット
に分類することにより行われる。そのようなビット割り
当ての場合、スケールファクタは臨界バンドユニット毎
にピークエネルギーから計算するために必要とされる。
そのため、最初に各ユニットに対してピークエネルギー
を得る必要がある。実際には、ピークエネルギーは周波
数成分のピーク値(絶対値)から得る。
【0047】ユニット毎にピークエネルギーを得ること
に基づき、図5の(a)に示すようにトーン信号の識別
が可能となる。P(n)は全バンドユニットにおける最大
ピークエネルギーとして識別され、さらに所定のしきい
値P_aveよりも大きい。ここで、所定のしきい値として
のP_aveは、全ピークエネルギーの平均値のように、全
バンドユニットに対する全ピークエネルギーから得るこ
とができる。
【0048】図5の(a)では、一例として各ユニット
に対する周波数成分の数が異なっている。
【0049】図5の(a)においてトーン信号が捜し出
された後、図5の(b)に示すように実際にトーン成分
が抽出される。すなわち、トーン信号の成分が所定の窓
及び平均しきい値に基づいて評価されることによりトー
ン成分が検出される。
【0050】図5の(a)において識別されるトーンユ
ニットにおいて16個の周波数成分がある場合、絶対値
の最大値は16個の成分の中から求められる。例えば、
図5の(b)においてS(i)が最大値として見出され
る。
【0051】図5の(b)において、水平線で示される
S_aveはそのユニットにおける16個の成分の平均値で
ある。また、各トーン信号に対して幅を狭く想定し、図
5の(b)において破線の長方形ブロックで示すように
ここでは一例として1つのトーンに対して最大5つのス
ペクトル線が選択される。すなわち、図5の(b)にお
いて、破線の長方形ブロックは、ユニットにおいて最大
周波数成分を中心に配置し、その中心に配置した周波数
成分の近傍にある所定数の周波数成分を範囲に含むよう
に設定した窓を示している。
【0052】最終的に、図5の(b)において、垂直方
向の矢印S(i-1)、S(i)及びS(i+1)が、所定の重みを
持つ平均値S_aveよりも大きいことから、トーン成分と
して検出される。
【0053】ここで述べたトーン成分データの抽出の概
要を以下に示す。 1)最大ピークエネルギーを有するユニットを捜し出
す; 2)その捜し出したユニット中の最大成分を検索する;
その最大成分を含めてその周辺にある5つの成分をそれ
ぞれ、しきい値と比較することによりトーン成分を抽出
する。なお、上記の手順においては2つのしきい値が含
まれている。
【0054】最初のステップにおいて、P(n)>P_ave
である限り、さらなる検査のために次のステップに進
む。P_aveは平均のエネルギーパワーとして考えられる
所定のピークエネルギーであり、1から100の間の値
が選択され得る。本実施形態では20に設定する。
【0055】次のステップにおいて、S(i)>K×S_av
eである限り、S(i)の成分がトーン成分データとして考
えられる。ここで、Kは重みであり、1からNの間の値
が選択される。本実施形態では、Kは1に、S_aveはそ
のユニット中の全成分に対する平均値に設定する。
【0056】図6はトーン成分データの検出及び抽出手
順の詳細を示すフローチャートである。
【0057】MDCT係数が入力されると(ステップS
61)、各ユニットに対してピークエネルギーが求めら
れる。各ユニットにおける最大ピークエネルギーをP
(n)として識別する(ステップS62)。
【0058】最大ピークエネルギーP(n)をしきい値P_
aveと比較する(ステップS63)。P(n)がP_ave以下
のときは、そのP(n)に対するトーン成分データは得ら
れず、トーン成分の抽出、検出処理を終了する(ステッ
プS69)。P(n)がP_aveより大きいときは、そのピ
ークエネルギーを有するユニットを識別し、その識別し
たトーンユニットにおける最大成分を検出する(ステッ
プS64)。検出した最大成分をS(0)とする。
【0059】最大成分とその周辺のいくつかの成分(S
(i),i=±1, ±2)をしきい値(K×S_ave)と比較する
(ステップS65)。その成分の絶対値がしきい値(K
×S_ave)よりも大きければ、元のスペクトルからその
成分をトーン成分データとして抽出する(ステップS6
7)。
【0060】トーン成分データ抽出後、ステップS68
においてスペクトルが更新される。すなわち、元のスペ
クトルからトーン成分が抽出された残りのスペクトルを
新たなスペクトルとする。そして、次のトーン信号検索
処理等のために更新されたスペクトルがステップS61
に入力される。引き続いて、全ユニットにおける次の最
大ピークエネルギーが求められ(ステップS62)、そ
の後上記と同様に、しきい値により検査されて、トーン
成分の検出、抽出処理が行われる。
【0061】一方、ステップS65において、その成分
の絶対値がしきい値(K×S_ave)よりも大きくなけれ
ば、検査した最大ピークエネルギーを除外し(ステップ
S66)、ステップS62に戻り、次の最大ピークエネ
ルギーに対するトーン成分の検出、抽出が行われる。
【0062】図7はトーン成分符号化方法の一例を説明
した図である。Num_compは1つのトーンユニットにおけ
る成分の数であり、Posi_toneはトーン信号の位置であ
り、それはトーン信号における最初のトーン成分の位置
であってもよい。Qscale_toneは、トーン信号に対する
量子化スケールであり、Scale_Factorはトーン信号にお
けるトーン成分に対するスケールファクタである。
【0063】Num_comp、Posi_tone、Qscale_tone及びS
cale_Factorの符号化が、モジュール71、72、73
及び74においてそれぞれ行われる。トーン成分の量子
化と正規化がモジュール75において行われ、量子化さ
れた成分のエントロピー符号化がモジュール76におい
て行われる。最後に、モジュール77で、トーン成分に
対する関連情報及び符号化されたビットのパック処理が
行われ、ビットストリームが生成される。
【0064】モジュール71、72、73及び74は、
所定の基準に基づいてトーン成分を複数のグループに分
類する場合についても適応できる。その場合、おそら
く、1つのスケールファクタのみが1つのトーン成分の
グループに対して必要となる。
【0065】
【発明の効果】本発明によれば、ビット使用量の最小値
に基づいて、トーン成分データを符号化するための符号
化方法を適応的に選択することができ、それによってト
ーン成分データの符号化品質に影響を与えることなく、
他の周波数成分を符号化するためのビットをより多く節
約できる。これにより、トーン成分符号化を用いたオー
ディオ符号化方法において処理効率を向上させることが
できる。また、本発明によれば、トーン成分データが、
容易に、効率的に及び正確に検出及び抽出され、抽出さ
れたトーン成分データは異なる方法により適応的に符号
化することができる。これにより、最も効率的のよい符
号化処理を実現できる。
【図面の簡単な説明】
【図1】 本発明に係る適応トーン成分符号化を用いた
オーディオ符号化を実現するため一実施形態の構成を示
した図。
【図2】 適応トーン成分符号化方法の詳細を説明した
フローチャート(前半)。
【図3】 適応トーン成分符号化方法の詳細を説明した
フローチャート(後半)。
【図4】 (a)トーン成分データの分布及び(b)ス
ペクトルからのトーン成分データの抽出を示した図。
【図5】 トーン成分の検出及び抽出の2つのステップ
を説明するための図。
【図6】 トーン成分データの検出及び抽出処理のフロ
ーチャート。
【図7】 トーン成分符号化方法の1つの実施形態を示
した図。
【図8】 従来技術におけるトーン成分符号化方法を用
いたオーディオ符号化を実現するための構成を示した
図。
【符号の説明】
21 サブバンド前置フィルタ処理を行うモジュール 22 MDCT処理を行うモジュール 23 スペクトル形成処理を行うモジュール 24 トーン成分抽出処理を行うモジュール 25 スペクトル符号化処理を行うモジュール 26 量子化スケール検査処理を行うモジュール 27 トーン成分抽出またはスペクトル符号化処理を行
うモジュール 28量子化/正規化処理を行うモジュール 29 パック処理を行うモジュール
───────────────────────────────────────────────────── フロントページの続き (72)発明者 永井 清隆 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5J064 AA02 BA13 BA16 BB12 BC02 BC12 BC14 BC17 BC18 BC22 BD01

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 トーン成分データに対する適応オーディ
    オ符号化方法において、 入力オーディオデータをオーディオチャネル毎に、各々
    が複数のサンプルからなる複数フレームに分割するステ
    ップと、 上記フレーム中の上記複数のサンプルを所定のフィルタ
    前置処理するステップと、 上記フレーム中のフィルタ前置処理されたサンプルを異
    なるバンドに分割するステップと、 該異なるバンド中のフィルタ前置処理されたサンプルに
    対して、周波数成分を得るための所定の変換を行うステ
    ップと、 該得られた周波数成分を、各々が複数の周波数成分から
    なる異なる臨界バンドユニットに分類するステップと、 周波数スペクトル全体からトーン成分を検出して抽出す
    るステップと、 最初に、所定のスペクトルデータ符号化に基づいて上記
    周波数成分のそれぞれにビットを割り当るステップと、 該ビット割り当ての後で、上記臨界バンドユニット毎に
    初期量子化スカラーを取得するステップと、 上記トーン成分を含むトーン成分ユニットに対して上記
    の初期量子化スカラーを検査するステップと、 該検査に基づいて粗雑な量子化が行われるトーン成分ユ
    ニットに対してトーン成分符号化を行うステップと、 同時に、同じトーン成分に対してスペクトルデータ符号
    化を、上記の粗雑な量子化をきめ細かな量子化に変更す
    ることにより行うステップと、 それらの実際のビット使用量に基づいて、トーン成分符
    号化と、上記トーンユニットに対してきめ細かな量子化
    を行うスペクトルデータ符号化との間で符号化方法を選
    択するステップと、 該選択された符号化方法を用いてトーン成分を符号化す
    るステップと、 最後に、ユニット毎に最終的な量子化スカラーを取得す
    るために、残りのビットを他の周波数成分に割り当るス
    テップと、 トーン成分と周波数成分の双方について符号化されたビ
    ットをビットストリームにパックするステップとを有す
    ることを特徴とするオーディオ符号化方法。
  2. 【請求項2】 トーン成分データに対する適応オーディ
    オ符号化方法において、 入力オーディオデータをオーディオチャネル毎に、各々
    が複数のサンプルからなる複数フレームに分割するステ
    ップと、 上記フレーム中の上記複数のサンプルを所定のフィルタ
    前置処理するステップと、 上記フレーム中のフィルタ前置処理されたサンプルを異
    なるバンドに分割するステップと、 上記異なるバンド中のフィルタ前置処理されたサンプル
    に対して、周波数成分を得るための所定の変換を行うス
    テップと、 上記周波数成分を、各々が複数の周波数成分からなる異
    なる臨界バンドユニットに分類するステップと、 上記各バンドユニットにおいて周波数成分に対するピー
    ク値を検出して該ユニットに対するスケールファクタを
    計算するステップと、 上記スケールファクタから上記バンドユニット毎にピー
    クエネルギーをそれぞれ取出すステップと、 全ての上記バンドユニットに対する上記ピークエネルギ
    ーの全てから最大ピークエネルギーを捜し出し、その最
    大ピークエネルギーに対応するユニットを識別するステ
    ップと、 上記最大ピークエネルギーを所定値と比較した後に、最
    大ピークエネルギー値を選択するステップと、 該最大ピークエネルギーが選択されたユニットにおける
    全ての周波数成分から最大周波数成分を捜し出すステッ
    プと、 所定の窓及び平均しきい値に基づき複数の周波数成分の
    値を評価するステップと、 上記周波数成分の絶対値が上記しきい値よりも大きいと
    きに複数の上記周波数成分からトーン成分を抽出するス
    テップと、 トーン成分が抽出された上記ユニットに対してピーク
    値、スケールファクタ及びピークエネルギーを更新する
    ステップと、 上記バンドユニット全てに対して、全ての残りのピーク
    エネルギー及び更新されたピークエネルギーから、次の
    最大ピークエネルギーを検索し、該次の最大ピークエネ
    ルギーに対応するユニットを識別するステップと、 上記次の最大ピークエネルギーを所定のしきい値と比較
    した後、上記次の最大のピークエネルギーを選択するス
    テップと、 上記次の最大ピークエネルギーが選択された上記ユニッ
    トにおける全周波数成分から最大の周波数成分を検索す
    るステップと、 所定の窓及び平均しきい値に基づき複数の周波数成分を
    評価するステップと、該周波数成分の絶対値が上記しき
    い値よりも大きいときに、複数の上記周波数成分からト
    ーン成分を抽出するステップと、 上記次の最大ピークエネルギーが上記所定のしきい値よ
    りも小さくなるまで、上記各ステップを繰り返すステッ
    プとを有することを特徴とするオーディオ符号化方法。
  3. 【請求項3】 請求項2記載のオーディオ符号化方法に
    おいて、 上記の所定の窓及び平均しきい値に基づき複数の周波数
    成分を評価するステップは、 上記ユニットにおいて上記最大周波数成分を中心に配置
    し、該中心に配置した周波数成分の近傍にある所定数の
    周波数成分を範囲に含むように窓を設定するステップ
    と、 上記ユニットにおける全周波数成分に対する絶対値の平
    均を、上記平均しきい値として計算するステップと、 上記最大周波数成分の絶対値を、重み付けられた上記平
    均しきい値と比較するステップと、 上記最大周波数成分の絶対値が、重み付けられた上記平
    均のしきい値よりも大きいときに、上記周波数成分をト
    ーン成分として検出して抽出するステップと、 上記窓の範囲に含まれる上記複数の周波数成分から、次
    の周波数成分を選択するステップと、 該次の周波数成分の絶対値を、重み付けられた上記平均
    しきい値と比較するステップと、 上記次の周波数成分の絶対値が重み付けられた上記平均
    しきい値よりも大きいときに、上記周波数成分をトーン
    成分として検出して抽出するステップと、 上記窓の範囲に含まれる上記周波数成分が比較され検出
    されるまで、上記各ステップを繰り返すステップとを有
    することを特徴とするオーディオ符号化方法。
  4. 【請求項4】 トーン成分データに対する適応オーディ
    オ符号化方法において、 入力オーディオデータをオーディオチャネル毎に、各々
    が複数のサンプルからなる複数フレームに分割するステ
    ップと、 上記フレーム中の複数のサンプルに対して所定のフィル
    タ前置処理を行うステップと、 上記フレーム中の上記フィルタ前置処理されたサンプル
    を異なるバンドに分割するステップと、 上記異なるバンドにおいて上記フィルタ前置処理された
    サンプルに対して、周波数成分を得るための所定の変換
    を行うステップと、 上記周波数成分を、各々が複数の上記周波数成分からな
    る異なる臨界バンドユニットに分類するステップと、 周波数スペクトル全体からトーン成分を検出して抽出す
    るステップと、 最初に、所定のスペクトル符号化に基づいて上記周波数
    成分のそれぞれにビットを割り当るステップと、 該ビット割り当ての後に、上記ユニット毎に初期量子化
    スカラーを取得するステップと、 上記トーン成分を含むトーン成分ユニットに対して上記
    初期量子化スカラーを検査するステップと、 トーン成分ユニットに対する上記量子化スカラーが所定
    スカラー量よりも大きいときは、トーン成分符号化を伴
    わずに、ビット割り当てを完了し、上記全ての初期量子
    化スカラーをデコーダに送るステップと、 トーン成分ユニットに対する上記初期量子化スカラーが
    上記所定スカラー量以下のときは、トーン成分ユニット
    に対してトーン成分符号化を行うステップと、 上記初期量子化スカラーを上記所定スカラー量に変更し
    て、上記トーン成分ユニットと同じユニットに対して同
    時にスペクトルデータ符号化を行うステップと、 トーン成分符号化及びスペクトルデータ符号化の双方の
    場合について全ビット使用量を求めるステップと、 上記ビット使用量に基づいて、トーン成分符号化とスペ
    クトルデータ符号化との間で符号化方法を決定するステ
    ップと、 トーン成分とスペクトル成分に対して使用されるビット
    を符号化してパックするステップとを有することを特徴
    とするオーディオ符号化方法。
  5. 【請求項5】 請求項4記載のオーディオ符号化方法に
    おいて、 上記ビット使用量に基づいて、トーン成分符号化とスペ
    クトルデータ符号化との間で符号化方法を選択し、トー
    ン成分とスペクトル成分に対して使用されるビットを符
    号化してパックする上記のステップは、 トーン成分ユニットに対するトーン成分符号化のビット
    使用量がスペクトルデータ符号化のビット使用量よりも
    小さいときは、該トーン成分ユニットに対してトーン成
    分符号化を選択するステップと、 トーン成分ユニットに対するトーン成分符号化のビット
    使用量がスペクトルデータ符号化のビット使用量よりも
    大きいときは、該トーン成分ユニットに対してスペクト
    ルデータ符号化を選択するステップと、 トーン成分符号化の場合においては、トーン成分に使用
    されるビットを除外することにより残りのビットを計算
    するステップと、 スペクトルデータ成分符号化の場合においては、トーン
    成分ユニットに使用されるビットを除外することにより
    残りのビットを計算するステップと、 上記の残りのビットを計算するステップにおいて、トー
    ン成分符号化によって符号化されたトーン成分を除外
    し、全てのユニットに対して上記の残りのビットを用い
    た所定のスペクトルデータ符号化に基づいてビット再割
    り当てを行うステップと、 上記の残りのビットを計算するステップにおいて、上記
    所定スカラー量を用いたスペクトルデータ符号化によっ
    て符号化されたトーンユニットを除外し、ユニットに対
    して上記の残りのビットを用いた所定のスペクトルデー
    タ符号化に基づいてビット再割り当てを行うステップ
    と、 全ユニットに対して最終的な量子化スカラーを求めるス
    テップと、 上記最終的なスカラー情報を全周波数成分に対して符号
    化されたビットとともにパックし、デコーダに送るステ
    ップとを有することを特徴とするオーディオ符号化方
    法。
  6. 【請求項6】 請求項1または請求項4記載のオーディ
    オ符号化方法において、 上記のトーン成分符号化は、 以前に検出されたトーン毎に複数の周波数成分を記録
    し、符号化し、 上記トーン毎に位置を記録し、符号化し、 上記トーン毎に量子化スカラーを記録し、符号化し、 トーン毎の周波数成分のそれぞれに対するスケールファ
    クタを記録し、符号化し、 上記トーン毎の上記周波数成分を、それらの対応するス
    ケールファクタ及び量子化スカラーにより正規化し、量
    子化し、 エントロピー符号化技術により上記正規化され量子化さ
    れたトーン成分データを符号化し、 上記トーン成分関連情報を、トーン成分データに対する
    エントロピー符号化されたビットとともにパックして、
    デコーダに送信することを特徴とするオーディオ符号化
    方法。
  7. 【請求項7】 請求項1または請求項4記載のオーディ
    オ符号化方法において、 上記のトーン成分符号化は、 全トーン成分をトーン成分の絶対値に基づき異なるグル
    ープに分類し、 各グループ毎に、同じスケールファクタまたは同じ周波
    数成分を同じ量子化スカラーとともに選択し、 各グループ毎に、上記スケールファクタ、上記周波数成
    分及び上記量子化スカラーを符号化し、 上記各グループ毎に各周波数成分の位置を符号化し、 各グループ毎に上記周波数成分を、各グループにおいて
    対応するスケールファクタ及び量子化スカラーにより正
    規化し、量子化し、 上記正規化され量子化されたトーン成分データを、エン
    トロピー符号化技術により符号化し、 上記トーン成分の関連情報をトーン成分データに対して
    エントロピー符号化されたビットとともにパックして、
    デコーダに送信することを特徴とするオーディオ符号化
    方法。
JP11178102A 1999-06-24 1999-06-24 トーン成分データの適応オーディオ符号化方法 Pending JP2001007704A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11178102A JP2001007704A (ja) 1999-06-24 1999-06-24 トーン成分データの適応オーディオ符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11178102A JP2001007704A (ja) 1999-06-24 1999-06-24 トーン成分データの適応オーディオ符号化方法

Publications (1)

Publication Number Publication Date
JP2001007704A true JP2001007704A (ja) 2001-01-12

Family

ID=16042692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11178102A Pending JP2001007704A (ja) 1999-06-24 1999-06-24 トーン成分データの適応オーディオ符号化方法

Country Status (1)

Country Link
JP (1) JP2001007704A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002372996A (ja) * 2001-06-15 2002-12-26 Sony Corp 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
KR100889750B1 (ko) 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
JP2009518694A (ja) * 2005-12-05 2009-05-07 クゥアルコム・インコーポレイテッド トーンコンポーネントの検出のためのシステム、方法および装置
EP2093758A2 (en) 2008-02-19 2009-08-26 Fujitsu Limited Device, method and computer program for encoding audio signal in the spectral domain
JP2012181304A (ja) * 2011-03-01 2012-09-20 Dainippon Printing Co Ltd 音響信号の符号化方法および装置
EP2525354A1 (en) * 2010-01-13 2012-11-21 Panasonic Corporation Encoding device and encoding method
WO2015049820A1 (ja) * 2013-10-04 2015-04-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4622164B2 (ja) * 2001-06-15 2011-02-02 ソニー株式会社 音響信号符号化方法及び装置
WO2002103682A1 (en) * 2001-06-15 2002-12-27 Sony Corporation Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus, and recording medium
US7447640B2 (en) 2001-06-15 2008-11-04 Sony Corporation Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus and recording medium
JP2002372996A (ja) * 2001-06-15 2002-12-26 Sony Corp 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
US8219392B2 (en) 2005-12-05 2012-07-10 Qualcomm Incorporated Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
JP2009518694A (ja) * 2005-12-05 2009-05-07 クゥアルコム・インコーポレイテッド トーンコンポーネントの検出のためのシステム、方法および装置
US7605722B2 (en) 2007-05-17 2009-10-20 Electronics And Telecommunications Research Institute Lossless audio coding/decoding apparatus and method
KR100889750B1 (ko) 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
EP2093758A2 (en) 2008-02-19 2009-08-26 Fujitsu Limited Device, method and computer program for encoding audio signal in the spectral domain
US9076440B2 (en) 2008-02-19 2015-07-07 Fujitsu Limited Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum
EP2525354A1 (en) * 2010-01-13 2012-11-21 Panasonic Corporation Encoding device and encoding method
EP2525354A4 (en) * 2010-01-13 2014-01-08 Panasonic Corp ENCODING DEVICE AND ENCODING METHOD
US8924208B2 (en) 2010-01-13 2014-12-30 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method
JP2012181304A (ja) * 2011-03-01 2012-09-20 Dainippon Printing Co Ltd 音響信号の符号化方法および装置
WO2015049820A1 (ja) * 2013-10-04 2015-04-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
JPWO2015049820A1 (ja) * 2013-10-04 2017-03-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法

Similar Documents

Publication Publication Date Title
CN101305423B (zh) 自适应的基于时间/频率的音频编码和解码设备和方法
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
US6345246B1 (en) Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
KR101168473B1 (ko) 오디오 인코딩 시스템
JP2007523372A (ja) エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、周波数バンドのオーディオ信号を圧縮する方法、モジュール、およびコンピュータプログラム製品
WO1995001680A1 (fr) Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement
RU2463674C2 (ru) Кодирующее устройство и способ кодирования
US9548056B2 (en) Signal adaptive FIR/IIR predictors for minimizing entropy
Soong et al. Optimal quantization of LSP parameters using delayed decisions
US7225123B2 (en) Method for compressing audio signal using wavelet packet transform and apparatus thereof
CN101010727A (zh) 信号编码器件和方法与信号解码器件和方法
JP2006526161A (ja) オーディオ符号化
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JP2001007704A (ja) トーン成分データの適応オーディオ符号化方法
Zelinski et al. Approaches to adaptive transform speech coding at low bit rates
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
Raad et al. Audio compression using the MLT and SPIHT
Ferhaoui et al. LSP quantization in wideband speech coders
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
EP0612159A2 (en) An enhancement method for a coarse quantizer in the ATRAC
JP3465341B2 (ja) オーディオ信号符号化方法
JPS6337400A (ja) 音声符号化及び復号化方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP3010637B2 (ja) 量子化装置及び量子化方法
Voran Perception-based bit-allocation algorithms for audio coding