JP2000078018A

JP2000078018A - 音声符号化方式、音声符号化装置、及びデ―タ記録媒体

Info

Publication number: JP2000078018A
Application number: JP11160383A
Authority: JP
Inventors: Eiji Kawahara; 栄治河原
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1998-06-15
Filing date: 1999-06-08
Publication date: 2000-03-14
Anticipated expiration: 2019-06-08
Also published as: JP3466507B2

Abstract

(57)【要約】【課題】デジタルオーディオ信号を複数の周波数帯域
に分割し、各帯域ごとに符号化を行う方式において、パ
ソコンのＣＰＵ処理能力、及び他のアプリケーションの
ＣＰＵ占有率に左右されず、実時間で音途切れがない高
音質の符号化データの作成を実現することができる音声
符号化方式を提供すること。【解決手段】複数の周波数帯域に分割されたデジタル
オーディオ信号の各帯域に対するビット割り当て情報を
生成するビット割り当て手段として、所定の聴覚心理モ
デルに基づく信号対マスク比値との関係を使用して高効
率にビット割り当てを行う方法、及び低負荷でビット割
り当てを行う方法を有し、符号化手段に対し占有できる
ＣＰＵの処理量情報からビット割り当て手段を切り替え
符号化を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声符号化方式、
及び音声符号化装置、及びデータ記憶媒体に関し、特に
ＭＰＥＧ（Motion Picture Experts Group）方式で用い
られているようなサブバンド符号化方式を用いる音声符
号化方式、及び音声符号化装置、及び前記音声符号化方
式を実行するためのプログラムを格納したデータ記憶媒
体に関するものである。

【０００２】

【従来の技術】近年、パソコンのマルチメディア化やイ
ンターネットの普及により、パソコン（以下、ＰＣとも
いう）等の上で、ソフトウエアによってＭＰＥＧ等の動
画や音声を再生できる環境が整ってきており、ＭＰＥＧ
等の符号化データの利用範囲が広がっている。しかしな
がら、符号化データを作るエンコーダに関しては、いま
だに高価なハードウエアを用いられるのが主流である。
また、ソフトウエアで符号化データを作るものもある
が、符号化対象となる動画や音声の再生時間の実時間の
何倍もの処理時間をかけて符号化を行うものであるた
め、多大な時間、及び手間を要し、広く普及するに至っ
ていない。

【０００３】このため、特に一般のパソコンユーザが安
価で簡単に符号化データを作成できるようになるために
は、ソフトウエア処理により実時間での符号化データの
作成を実現したいという要望がある。

【０００４】以下に従来の音声符号化方式の一例につい
て説明する。図１１は音声に関する符号化データフォー
マットとして、ISO/IEC11172-3にて規格化されているＭ
ＰＥＧオーディオエンコーダのブロック図である。図１
１において、入力デジタルオーディオ信号は、サブバン
ド分析手段２０２において３２個の周波数成分に分割さ
れ、各サブバンド信号に対し、スケールファクタ抽出手
段２０３においてスケールファクタを計算し、ダイナミ
ックレンジをそろえる。また、入力デジタルオーディオ
信号は、ＦＦＴ手段２０４において、高速フーリエ変換
(FFT:Fast Fourier Transform)され、この結果を用い
て、聴覚心理分析手段２０５により人間の聴覚の特性を
利用した聴覚心理モデルに基づく信号対マスク比（ＳＭ
Ｒ）値の関係モデルを利用し、ビット割り当て手段２０
６により各サブバンド信号に対するビット割り当て数を
決める。各サブバンド信号へのビット割り当て数に応じ
て、各サブバンド信号を量子化／符号化手段２０７によ
り量子化／符号化する。そして、ビットストリーム形成
手段２０９により、補助情報符号化手段２０８により符
号化されたヘッダ情報と補助情報を共にしてビットスト
リームを形成して出力する。

【０００５】この従来の音声符号化方式は、各帯域電力
の偏在を利用して各帯域（サブバンド）毎に符号化を行
うような符号化方式であるため、聴覚心理モデルを利用
した各サブバンド信号に対するビット配分が音質を左右
することになる。また、蓄積媒体を利用目的として規格
化されたため、符号化データの高音質化には適している
が、実時間での符号化には適しておらず、音質を左右す
る聴覚心理モデルは非常に演算量の多いものとなってい
る。

【０００６】

【発明が解決しようとする課題】従来の音声符号化方
式、及び音声符号化装置は以上のように構成されてお
り、蓄積媒体を対象とする高音質な符号化データを作成
するには適しているが、聴覚心理モデルの利用は多くの
処理能力が必要とされるため、ソフトウエアで処理する
には現在のＣＰＵ能力ではＰＣ上で実時間処理するには
不適当である。また、実時間処理可能な高性能なＣＰＵ
を搭載したＰＣ上で動作させた場合においても、他のア
プリケーションのＣＰＵ占有率が大きくなった時などで
は、実時間での処理が不可能となる恐れがあり、その結
果、音途切れが発生する可能性があるという問題点があ
る。

【０００７】この発明は、以上のような問題点を解決す
るためになされたもので、パソコンのＣＰＵ処理能力、
及び他のアプリケーションのＣＰＵ占有率に左右され
ず、実時間で音途切れがない高音質の符号化データの作
成をソフトウエア処理により実現することができる音声
符号化方式、音声符号化装置、及び上記符号化を実行す
るためのプログラムを格納したデータ記憶媒体を提供す
ることを目的とする。

【０００８】

【課題を解決するための手段】この発明の請求項１にか
かる音声符号化方式は、デジタルオーディオ信号を複数
の周波数帯域に分割し、各帯域毎に符号化を行う音声符
号化方式であって、上記分割された各帯域に対するビッ
ト割り当て情報を生成し、それぞれ処理量の異なるビッ
ト割り当て手段を複数有し、外部からの制御情報に基づ
いて、上記複数のビット割り当て手段の中から、所定の
ビット割り当て手段を用いて処理がなされるように、使
用するビット割り当て手段を切り替えてビット割り当て
を実行して、符号化するものである。

【０００９】また、本発明の請求項２にかかる音声符号
化方式は、上記請求項１記載の音声符号化方式におい
て、上記外部からの制御情報として、符号化処理を行う
ために占有できる中央演算処理装置の処理量を表す負荷
値を用い、該負荷値に基づいて上記中央演算処理装置で
符号化処理において各ビット割り当て手段を用いて符号
化動作を行った時の各処理量を予め記憶したデータテー
ブルを参照して、上記符号化処理が占有できる中央演算
処理装置の処理量を超えないよう上記ビット割り当て手
段の選択を行うものである。

【００１０】また、本発明の請求項３にかかる音声符号
化方式は、上記請求項２記載の音声符号化方式におい
て、上記負荷値として、符号化処理を行うために占有可
能な上記中央演算処理装置の処理量を監視する監視手段
からの処理量制御情報を用いるものである。

【００１１】また、本発明の請求項４にかかる音声符号
化方式は、上記請求項１記載の音声符号化方式におい
て、上記ビット割り当て手段によるビット割り当て処理
として、符号化データの高音質化を実現可能な高効率に
ビット割り当てを行う高効率ビット割り当て方法を用い
た処理と、上記高効率ビット割り当て方法を用いた処理
と比較して処理量の少ない低負荷でビット割り当てを行
う低負荷ビット割り当て方法を用いた処理とが行われる
ものである。

【００１２】また、本発明の請求項５にかかる音声符号
化方式は、上記請求項１記載の音声符号化方式におい
て、上記符号化時に使用されるビット割り当て手段の切
り替えを、オーディオ信号に復号可能な最小単位である
フレーム単位で行うものである。

【００１３】また、本発明の請求項６にかかる音声符号
化方式は、上記請求項１記載の音声符号化方式におい
て、複数の周波数帯域に分割された各帯域のサブバンド
信号を、各々予め定められた所定個数のサブバンド信号
からなるグループとなるように分けを行うグループ分け
を行い、各グループに対して独立したビット割り当て処
理行い、各帯域に対するビット割り当て情報を生成する
ものである。

【００１４】また、本発明の請求項７にかかる音声符号
化方式は、上記請求項６記載の音声符号化方式におい
て、上記グループ分けは、グループの数、又はグループ
内の周波数軸方向に連続したサブバンド信号の数を、上
記外部からの制御情報により指定された数、又は上記監
視手段からの処理量制御情報に基づいて指定された数に
可変的に行われるものである。

【００１５】また、本発明の請求項８にかかる音声符号
化方式は、上記請求項７記載の音声符号化方式におい
て、上記サブバンド信号の数の変更処理を、オーディオ
信号に復号可能な最小単位であるフレーム単位で行うも
のである。

【００１６】また、本発明の請求項９にかかる音声符号
化方式は、上記請求項８記載の音声符号化方式におい
て、上記グループ分け時に、ビット割り当てを行わない
グループを少なくとも１つ設けるものである。

【００１７】また、本発明の請求項１０にかかる音声符
号化方式は、上記請求項６記載の音声符号化方式におい
て、上記サブバンド信号のグループ分けにより、低帯域
に属するグループにグループ分けされたサブバンド信号
に対し、符号化データの高音質化を実現可能な高効率ビ
ット割り当て方法を用いて、グループ内のサブバンド信
号にビット割り当てを行い、グループ内のサブバンド信
号にビット割り当てを行う一方、高帯域に属するグルー
プにグループ分けされたサブバンド信号に対し、高効率
ビット割り当て方法と比較して処理量の少ない低負荷ビ
ット割り当て処理を用いて、グループ内のサブバンド信
号にビット割り当てを行うものである。また、本発明の
請求項１１にかかる音声符号化方式は、上記請求項６記
載の音声符号化方式において、各グループ毎に独立した
ビット割り当て手段に対する割り当て可能ビット数を決
定する割り当て可能ビット演算手段を設け、各グループ
のグループ全体に対する割合に各グループに属する各帯
域毎の特性に基づいた重み付けを加味したものを用い
て、グループ全体に対する割り当て可能ビット数を各グ
ループ毎に独立したビット割り当て手段に対し振り分け
るものである。

【００１８】また、本発明の請求項１２にかかる音声符
号化方式は、上記請求項１１記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重
み付けを、各帯域毎の所定の最小可聴限界値に基づいた
重み付けとするものである。また、本発明の請求項１３
にかかる音声符号化方式は、上記請求項１１記載の音声
符号化方式において、各グループに属する各帯域毎の特
性に基づいた重み付けを、入力デジタルオーディオ信号
にサブバンド分析を施して得られる各グループに属する
各周波数帯域のサブバンド信号レベルに基づいた重み付
けとするものである。

【００１９】また、本発明の請求項１４にかかる音声符
号化方式は、上記請求項１１記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重
み付けを、入力デジタルオーディオ信号に線形変換を施
して得られる各グループに属するスペクトル信号レベル
に基づいた重み付けとするものである。

【００２０】また、本発明の請求項１５にかかる音声符
号化方式は、上記請求項６記載の音声符号化方式におい
て、各グループに属する信号レベルが所定のしきい値以
上の高レベルな信号に対しては、符号化データの高音質
化を実現可能な高効率ビット割り当て方法を用いてビッ
ト割り当てを行い、各グループに属する信号レベルが、
所定のしきい値以下の低レベルな信号に対しては、上記
高効率ビット割り当て方法と比較して処理量の少ない低
負荷ビット割り当て方法を用いてビット割り当てを行う
ものである。

【００２１】また、本発明の請求項１６にかかる音声符
号化方式は、上記請求項１５記載の音声符号化方式にお
いて、上記各グループに属する信号レベルを、入力デジ
タルオーディオ信号にサブバンド分析を施して得られる
サブバンド信号レベルとするものである。

【００２２】また、本発明の請求項１７にかかる音声符
号化方式は、上記請求項１５記載の音声符号化方式にお
いて、上記各グループに属する信号レベルが、入力デジ
タルオーディオ信号に線形変換を施して得られるスペク
トル信号レベルであるものである。

【００２３】また、本発明の請求項１８にかかる音声符
号化方式は、上記請求項１５記載の音声符号化方式にお
いて、上記各グループに属する信号レベルを、所定の各
帯域毎の最小可聴限界値とするものである。

【００２４】また、本発明の請求項１９にかかる音声符
号化方式は、上記請求項４, １０,１５のいずれかに記
載の音声符号化方式において、上記符号化データの高音
質化を実現可能な高効率ビット割り当て処理は、所定の
聴覚心理モデルに基づく信号対マスク比値との関係を使
用して行われるビット割り当て処理であり、上記高効率
ビット割り当て処理と比較して処理量の少ない低負荷ビ
ット割り当て処理は、複数の周波数帯域に分割された信
号レベルに各帯域毎の所定の最小可聴限界値を加味して
行われるビット割り当て処理であるものとしたものであ
る。

【００２５】また、本発明の請求項２０にかかる音声符
号化方式は、上記請求項１９記載の音声符号化方式にお
いて、聴覚心理モデルがＭＰＥＧ（Motion Picture Exp
ertsGroup）によって指定された聴覚心理モデルである
ものである。

【００２６】また、本発明の請求項２１記載の音声符号
化方式は、上記請求項５または請求項８記載の音声符号
化方式において、上記オーディオ信号に復号可能な最小
単位であるフレームが、ＭＰＥＧ（Motion Picture Exp
erts Group）によって指定されたフレームであるもので
ある。

【００２７】また、本発明の請求項２２記載の音声符号
化方式は、上記請求項１記載の音声符号化方式におい
て、上記ビット割り当て手段は、分割化された各帯域に
対し、所定の聴覚心理モデルから出力される情報に基づ
いてビット割り当て情報を生成するものであり、N(N＝
１，２，３...)フレームに１度、上記所定の聴覚心理モ
デルから出力される情報に基づいてビット割り当て情報
を生成し、上記ビット割り当て情報を生成しなかったフ
レームに対しては、上記聴覚心理モデルから出力された
情報と上記分割された各帯域の信号情報に基づいてビッ
ト割り当て情報を生成し、符号化を行なうものである。

【００２８】また、本発明の請求項２３記載の音声符号
化方式は、上記請求項項１記載の音声符号化方式におい
て、段階的に処理量の制御可能な聴覚心理モデルを有
し、外部からの制御情報に基づいて、上記聴覚心理モデ
ルの処理量制御を行ない、所定の処理量の聴覚心理モデ
ルを用いて処理がなされるように、各帯域に対するビッ
ト割り当て情報を生成するものである。

【００２９】また、本発明の請求項２４記載の音声符号
化方式は、上記請求項１記載の音声符号化方式におい
て、それぞれ処理量の異なる聴覚心理モデルを複数有
し、外部からの制御情報に基づいて、上記複数の聴覚心
理モデルの中から、所定の聴覚心理モデルを用いて処理
が成されるように、使用する聴覚心理モデルを切り替え
て、各帯域に対するビット割り当て情報を生成するもの
である。

【００３０】また、本発明の請求項２５記載の音声符号
化方式は、デジタルオーディオ信号を複数の周波数帯域
に分割し、該分割された各帯域に対するビット割り当て
情報を生成し、所定ビットレートでの伝送を目的として
各帯域毎に符号化を行なう音声符号化方式であって、符
号化データストリーム中にデータを挿入するフレームに
おけるビット割り当て範囲を制御し、符号化オーディオ
データ量を可変に制御するものである。

【００３１】また、本発明の請求項２６記載の音声符号
化方式は、上記請求項２５記載の音声符号化方式におい
て、外部からの制御情報に基づいて、フレーム単位でビ
ット割り当て範囲を制御し、符号化オーディオデータ量
を可変に制御するものである。

【００３２】また、本発明の請求項２７にかかる音声符
号化方式は、上記請求項２６記載の音声符号化方式にお
いて、上記外部からの制御情報として、付加データのバ
ッファを監視する監視手段からのデータ量制御情報を用
いるものである。

【００３３】また、本発明の請求項２８にかかる音声符
号化方式は、上記請求項１記載の音声符号化方式におい
て、符号化処理が実行される中央演算処理装置の性能に
応じて、符号化処理動作前の初期化時に複数のビット割
り当て手段、または複数の聴覚心理モデルの各処理負荷
値情報を外部へ出力するものである。

【００３４】また、本発明の請求項２９にかかる音声符
号化方式は、上記請求項２８記載の音声符号化方式にお
いて、外部への情報として出力される複数のビット割り
当て手段、または複数の聴覚心理モデルの各処理負荷値
情報が、降順、あるいは昇順で出力されるものである。

【００３５】また、本発明の請求項３０にかかる音声符
号化方式は、映像信号，音声信号の符号化処理が同一の
中央演算処理装置にて処理がなされる音声符号化方式に
おいて、異なる複数の演算量で符号化を行うものであっ
て、上記音声信号もしくは映像信号の符号化の演算量を
変更することで、上記中央演算処理装置上での処理の全
体的な演算量を制御するものである。

【００３６】また、本発明の請求項３１にかかる音声符
号化方式は、映像信号，音声信号の符号化処理が同一の
中央演算処理装置にて処理がなされる音声符号化方式に
おいて、演算量の異なる複数の符号化方式を用いて符号
化を行うものであって、上記音声信号の符号化の符号化
方式を変更することで、上記中央演算処理装置上での処
理の全体的な演算量を制御するものである。

【００３７】また、本発明の請求項３２にかかる音声符
号化方式は、上記請求項３０または３１記載の音声符号
化方式において、上記中央演算処理装置上での処理の制
御を、外部からの制御情報に基づいて行うものである。

【００３８】また、本発明の請求項３３にかかる音声符
号化方式は、ディジタルオーディオ信号に対して、時間
／周波数変換を施し、量子化情報を生成することで符号
化を行う音声符号化方式であって、それぞれ演算量の異
なる複数の量子化情報算出手段を有し、外部からの制御
情報に基づいて、上記複数の量子化情報算出手段の中か
ら、所定の量子化情報算出手段を選択して処理が行われ
るように、使用する量子化情報算出手段を切り替えて量
子化情報を算出して符号化を行うものである。

【００３９】また、本発明の請求項３４記載の音声符号
化装置は、上記請求項１ないし請求項３３のいずれかに
記載の音声符号化方式を用いて音声符号化を行うもので
ある。

【００４０】また、本発明の請求項３５記載の記録媒体
は、上記請求項１ないし請求項３３のいずれかに記載の
音声符号化方式のステップが記録されているものであ
る。

【００４１】

【発明の実施の形態】以下、本発明の実施の形態による
音声符号化方式、音声符号化装置について、図面を参照
しながら説明する。（実施の形態１）ここでは、例えば、入力信号を複数の
周波数成分に分割し、各帯域電力の偏在を利用して各帯
域（サブバンド）毎に符号化を行うような符号化方式の
場合について説明する。図１は例えば、上記符号化方式
による音声符号化装置としてパーソナルコンピュータ
（以下、ＰＣともいう）が用いられた場合のシステム全
体の概念図であり、図において、１はカメラ１７とマイ
ク１９などの外部機器よりのデータ入力が可能な、いわ
ゆるマルチメディア型のＰＣであり、各種データ及びプ
ログラムを格納する記憶容量が大きく固定式の記録媒体
であるハードディスクドライブ（ＨＤＤ）１１と、ＨＤ
Ｄ１１とプログラムやデータなどの入出力を行うための
比較的記憶容量の小さな着脱自在な記憶媒体であるＰＤ
ドライブ１２ａ, ＦＤドライブ１２ｂを有し、上記ＨＤ
Ｄに格納されたプログラムが中央演算処理装置（ＣＰ
Ｕ）１４からの命令により適宜ランダムアクセスメモリ
（ＲＡＭ）などで構成されたメモリ１３上に読み出され
て実行されるように構成されている。また、外部機器で
あるカメラ１７、マイク１９の映像、音声を取り込むた
めに、それぞれビデオキャプチャーカード１６、サウン
ドカード１８が内蔵されている。そして以上のような構
成を有するＰＣ１は、内部のデータバス１５によって各
要素が接続されている。

【００４２】図２は図１に示したＰＣ１により実行され
る音声符号化処理を実現するための音声符号化装置の符
号化器２０のブロック構成図であり、実際にはＨＤ１１
からメモリ１３に読み出されたプログラムによって実現
されているものである。図２において、２１はＣＰＵ１
４の負荷状態を監視するためのＣＰＵ負荷監視情報であ
り、２２はＣＰＵ負荷監視情報２１に基づいて、低帯域
符号化処理手段２３と高帯域符号化処理手段２４の動作
を制御する符号化手段制御手段である。また、２５は上
記２つの符号化処理手段２３, ２４の出力をそれぞれス
トリーム信号とするためのビットストリーム形成処理手
段である。さらに、２６は、ユーザが指定することによ
り上記符号化手段制御手段２２に入力される符号化モー
ド指定信号である。

【００４３】図２における低帯域符号化処理手段２３の
構成としては、例えば、図１１の従来例に示したような
構成を用いられる。また、高帯域符号化処理手段２４の
構成としては、例えば、図３に示すように、図１１の例
と同様に、各帯域電力の偏在を利用して各帯域（サブバ
ンド）毎に符号化を行うような符号化方式を用いている
が、聴覚心理モデルを利用した各サブバンド信号に対す
るビット配分は行なわず、その代替手段として、帯域出
力適応ビット割り当て手段３０４を設け、サブバンド信
号毎のスケールファクタに人間の聴覚特性に基づいた重
み付けを行い、高音質化よりも低負荷処理を第１の目的
とし、演算量の少ない構成とする。また、特定帯域への
過度なビット割り当て集中を排除するために、ビットの
割り当て毎に各帯域に応じた重み付けの調整を行なうも
のとしている。

【００４４】図４は図２に示した符号化器２０の詳細な
構成を示すブロック図であり、１０１は符号化器であ
り、後述するサブバンド分析手段１０２，スケールファ
クタ抽出手段１０３，ＦＦＴ手段１０４，聴覚心理分析
手段１０５，量子化／符号化手段１０６，補助情報符号
化手段１０７，ビットストリーム形成手段１０８，帯域
出力適応ビット割り当て手段１０９，聴覚心理モデルビ
ット割り当て手段１１０，グループ分け手段１１１，ビ
ット割り当て処理制御手段１１２，割り当て可能ビット
演算手段１１３から構成されている。

【００４５】上記サブバンド解析手段１０２は、入力さ
れたデジタルオーディオ信号を３２個の周波数成分に分
割する。スケールファクタ抽出手段１０３は、各サブバ
ンド信号に対するスケールファクタを計算し、各サブバ
ンドダイナミックレンジをそろえる。グループ分け手段
１１１は、上記分割された３２個の周波数成分を、外部
からの制御情報である処理量制御情報１２１で指定され
たグループ数に分割する。本実施の形態１では、図５に
示すように、グループ数を３とし、各グループを周波数
軸方向に連続したサブバンド信号として、０〜１５サブ
バンドの低帯域グループＡ、１６〜２９サブバンドの高
帯域グループＢ、及びビット割り当てを行わない３０〜
３１サブバンドの無効グループＣにグループ分けを行
う。なお、上記処理量制御情報１２１にはＣＰＵ負荷監
視情報２１と符号化モード設定信号２６の情報が含まれ
ているものとする。また、本実施の形態１では、上記各
サブバンドグループにビットを割り当てるビット割り当
て手段として、人間の耳に対して感度のよい低帯域に、
ＭＰＥＧによって指定された聴覚心理モデルに基づく信
号対マスク比値との関係を使用して、高効率にビット割
り当てを行う聴覚心理モデルビット割り当て手段１１０
を使用し、人間の耳に対して比較的感度の低い高帯域
に、スケールファクタ抽出手段１０３からのスケールフ
ァクタ情報に予め設定された各帯域毎の最小可聴限界値
を加えたものを使用して、聴覚心理モデルビット割り当
て方法と比較して低負荷でビット割り当てを行う帯域出
力適応ビット割り当て手段１０９を使用するように構成
している。

【００４６】また、ビット割り当て処理制御手段１１２
は、入力されたデジタルオーディオ信号を、聴覚心理モ
デルビット割り当てを行う０〜１５サブバンドの低帯域
グループＡに対して、必要とされる聴覚心理分析を行う
ために、ＦＦＴ（高速フーリエ変換）手段１０４にて高
速フーリエ変換を施すようにＦＦＴ手段１０４を制御す
る。そしてこの変換結果を用いて、聴覚心理分析手段１
０５は、人間の聴覚の特性を利用した聴覚心理モデルに
基づく信号対マスク比（ＳＭＲ）値の関係モデルを導き
出す。

【００４７】また、割り当て可能ビット演算手段１１３
は、サンプリング周波数や符号化のビットレート値か
ら、確定するグループ全体に対する割り当て可能ビット
数を，ビット割り当ての対象となる各グループのグルー
プ全体に対する割合に、各グループに属する各帯域毎の
特性に基づいた重み付けを加えたものを用いて、各グル
ープ毎に独立したビット割り当て手段に対する割り当て
可能ビット数を演算する。本実施の形態１では、聴覚心
理モデルビット割り当て手段１１０、及び帯域出力適応
ビット割り当て手段１１３に対し、スケール・ファクタ
・インデックス値、及び低帯域／高帯域の領域の比を考
慮し、全体の割り当て可能ビット数から、両手段１１
０，１１３への各割り当て可能ビット数を決定する。す
なわち、実際には、スケールファクタ抽出手段１０３に
より求められた各スケール・ファクタ・インデックス値
scf ＿index ［ i］から、下記の数式１，数式２に示す
ように、両領域内のscf ＿index ［ i］の加算値Vpsy,V
non を算出する。

【数１】

【数２】ここで、 psy ＿end=16: 聴覚心理モデルビット割り当てを行うサ
ブバンド数 subband ＿end=30: 全ビット割り当てサブバンド数である。

【００４８】次いで、人間の耳に感度のよい低帯域に、
よりビットを多く配分するために、Vpsyに対し重み付け
を行い、 Vpsy=Vpsy*0.75 聴覚心理モデルビット割り当て可能数psy ＿num 、及び
帯域出力適応ビット割り当て可能数non ＿num を下記の
式に基づいて求める。 Vnon=Vnon*psy-ratio psy ＿num=all ＿alloc ＿num*Vnon/(Vpsy+Vnon) non ＿num=all ＿alloc ＿num-psy ＿num ここで、 all ＿alloc ＿num:全体の割り当て可能ビット数 psy ＿ratio:psy ＿end/(subband＿end-psy ＿end) である。

【００４９】グループ毎の割り当て可能ビット数の範囲
内(psy＿num,non ＿num)で、聴覚心理モデルビット割り
当て手段１１０は、聴覚心理分析手段１０５からのＳＭ
Ｒ値の関係モデルを利用し、低帯域グループＡである０
〜１５サブバンドに対してビット割り合てを行う。一
方、帯域出力適応ビット割り当て手段１０９において
は、高帯域グループＢである１６〜２９サブバンドに対
してビット割り合てを行う。また、無効グループＣであ
る３０〜３１サブバンドに対しては、無効なサブバンド
としたため、ビット割り当ては行われない。

【００５０】これらのビット割り当て手段により決定さ
れた各サブバンド信号へのビット割り当て数に応じて、
各サブバンド信号を量子化／符号化手段１０６において
量子化／符号化し、補助情報符号化手段１０７により符
号化されたヘッダ情報と補助情報とをともに、ビットス
トリーム形成手段１０８においてビットストリームを形
成して出力する。

【００５１】処理量制御情報１２１からの情報が、例え
ば、符号化処理量を減少させるための情報であった場合
には、図６に示すように、処理量の多い聴覚心理モデル
ビット割り当て手段１１０のビット割り当ての対象とな
る０〜１５サブバンド低帯域グループＡのバンド幅を、
０〜７サブバンド低帯域グループＡ' に減少させ、反対
に処理量の小さい帯域出力適応ビット割り当て手段１０
９のビット割り当ての対象となるバンド幅を、８〜２９
サブバンド低帯域グループＢ' となるように増加させ
る。さらに、符号化処理量の減少を考えた時の最終的な
形態は、帯域出力適応ビット割り当て手段１０９のビッ
ト割り当ての対象を０〜２９サブバンドグループとする
ことで処理量を制御する。この場合においては、実質的
に聴覚心理モデルビット割り当て手段１１０は動作しな
いため、ＦＦＴ手段１０４、及び聴覚心理分析手段１０
５も動作しないことになる。

【００５２】一方、処理量制御情報１２１からの情報
が、例えば、符号化データの高音質化を図るための情報
であった場合には、高効率（高音質）なビット配分が可
能な聴覚心理モデルビット割り当て手段１１０のビット
割り当ての対象となるバンド幅を増加させる。さらに、
高音質を考えた時の最終的な形態は、聴覚心理モデルビ
ット割り当て手段１１０のビット割り当ての対象を０〜
２９サブバンドグループとすることである。本実施の形
態では以上のようにサブバンドグループの増減やビット
割り当て手段の切り替えを、オーディオ信号に復号可能
な最小単位であるフレーム単位で行うことで、リアルタ
イムに符号化処理量を制御可能としている。

【００５３】次に本実施の形態１による音声符号化装置
の全体的な動作の流れについて図７を参照しつつ説明す
る。まず、図７（ａ）に示されるような構成を用い、各
エンコーダ（２３，２４）の処理負荷を認識するため
に、各エンコーダの各モード（ビット割り当ての対象と
なるバンド幅の変化）において、所定時間分のダミーデ
ータを符号化することにより、ＣＰＵ負荷監視部７００
は各モードでのＣＰＵ負荷値をデータテーブル７０１に
格納する。そして、サンプル（データ）が入力される
と、図７（ｂ）のステップＳ７０において、サブバンド
分析が行われて３２の周波数成分に分割され、続いてス
テップＳ７１において各サブバンド信号のスケールファ
クタが計算される。

【００５４】次いで、ステップＳ７２において、ＣＰＵ
負荷の検出データがあるかどうかの判定が行われ、ここ
では、動作開始直後なのでＣＰＵ負荷検出データはな
く、従ってステップＳ７４に進んで最も高音質な音声再
生を行うことができる通常のグループ分けを行い、ステ
ップＳ７５に進んで聴覚心理モデルビット割り当て処理
が行われる。そして、ステップＳ７６に進んで量子化／
符号化処理が行われ、さらにステップＳ７９においてビ
ットストリーム形成が行われて一連の処理が終了すると
ともに、処理終了時に、入力された所定数のサンプルの
符号化に要した時間をＣＰＵ負荷監視部７００に通知
し、現在のＣＰＵの負荷が検出される。

【００５５】すると、次回からの処理に際しては、ステ
ップＳ７２において、ＣＰＵ負荷検出が「有」と判定さ
れるようになり、ステップＳ７３において、検出された
ＣＰＵ負荷が実時間での符号化が不可能であると判定さ
れた場合には、ステップＳ７７に進んで、データテーブ
ル７０１を参照して最適なモード（グループ分け）を選
択し、ステップＳ７８における帯域ビット割り当て処理
を併用してステップＳ７５における聴覚心理モデルビッ
ト割り当て処理をそれぞれ、所定の割合にて行い、ステ
ップＳ７６に進んで量子化／符号化処理が行われ、ステ
ップＳ７９において、これら符号化されたデータを用い
たビットストリームが形成されることになる。

【００５６】なお、本実施の形態１における割り当て可
能ビット演算手段１１３の演算を、スケール・ファクタ
・インデックス値、及び低帯域、高帯域の領域の比を考
慮し、各グループ毎に独立したビット割り当て手段に対
する割り当て可能ビット数を演算するものとしたが、ス
ケール・ファクタ・インデックス値の代わりにＦＦＴ手
段１０４からの各グループに属するスペクトル信号レベ
ルとしてもよく、各帯域毎に予め設定した最小可聴限界
値としてもよい。

【００５７】また、実施の形態１における符号化器１０
１の処理量を制御するための情報を、符号化器１０１の
内部に、ＣＰＵの処理量を監視するＣＰＵ負荷監視手段
７００を設け、ＣＰＵの処理能力を超えないように符号
化器１０１を動作させるように構成したが、ユーザ入力
などによる外部からの制御情報としてもよい。ユーザ入
力を行うことにより、音質，画質をユーザの好みに応じ
て優先させたエンコード処理を行うことが可能となる。

【００５８】また、実施の形態１における符号化器１０
１のビット割り当て手段として、人間の耳に対して感度
のよい低帯域に、高効率にビット割り当てを行う聴覚心
理モデルビット割り当て手段１１０を用い、高帯域に、
低負荷でビット割り当てを行う帯域出力適応ビット割り
当て手段１０９を固定的に用いるようにしたが、スケー
ルファクタ抽出手段１０３からの信号により、各グルー
プに属するサブバンド信号レベルが、予め設定した各帯
域のしきい値以下の場合には、つまり、図８に示すよう
に、低帯域に符号化データとして意味のある信号が高帯
域に比べ少ない場合などには、ビット割り当て手段を帯
域に応じて固定的に用いる必要はなく、高帯域に聴覚心
理モデルビット割り当て手段１１０を用いるようにして
もよい。

【００５９】また、図９に示すように、スケールファク
タ抽出手段１０３からの信号により、各グループに属す
るサブバンド信号レベルと閾値とを比較判断するのでは
なく、スケールファクタ抽出手段１０３からの信号より
も分解能（周波数の）の高い、ＦＦＴ手段１０４からの
信号をビット割り当て処理制御手段１１２へ入力して、
各グループに属するサブバンド信号のレベルと、予め設
定した各帯域の閾値との比較判断を行うように構成して
もよい。

【００６０】（実施の形態２）次に本発明の実施の形態
２によるデータ記録媒体について説明する。上記実施の
形態１で示した音声符号化装置あるいは符号化方法の構
成を実現するための符号化プログラムを、フロッピーデ
ィスク等のデータ記憶媒体に記録するようにすることに
より、本発明の各実施の形態で示した処理を、独立した
コンピュータシステムにおいて簡単に実施することが可
能となる。

【００６１】すなわち、図１０は、上記実施の形態１の
符号化処理を、上記符号化プログラムを格納したフロッ
ピーディスクを用いて、コンピュータシステムにより実
施する場合を説明するための図である。図１０（ａ）
は、フロッピーディスクの正面からみた外観、断面構
造、及びフロッピーディスク本体を示し、図１０（ｂ）
は、該フロッピーディスク本体の物理フォーマットの例
を示している。

【００６２】上記フロッピーディスクＦＤは、上記フロ
ッピーディスク本体ＤをフロッピーディスクケースＦＣ
内に収容した構造となっており、該フロッピーディスク
本体Ｄの表面には、同心円状に外周からは内周に向かっ
て複数のトラックＴｒが形成され、各トラックＴｒは角
度方向に１６のセクタＳｅに分割されている。従って、
上記プログラムを格納したフロッピーディスクＦＤで
は、上記フロッピーディスク本体Ｄは、その上に割り当
てられた領域（セクタ）Ｓｅに、上記プログラムとして
のデータが記録されたものとなっている。

【００６３】また、図１０（ｃ）は、フロッピーディス
クＦＤに対する上記プログラムの記録、及びフロッピー
ディスクＦＤに格納したプログラムを用いた音声符号化
処理を行うための構成を示している。上記プログラムを
フロッピーディスクＦＤに記録する場合は、コンピュー
タシステムＣｓから上記プログラムとしてのデータを、
フロッピーディスクドライブＦDDを介してフロッピーデ
ィスクＦＤに書き込む。また、フロッピーディスクＦＤ
に記録されたプログラムにより、上記音声符号化装置を
コンピュータシステムＣｓ中に構築する場合は、フロッ
ピーディスクドライブＦDDによりプログラムをフロッピ
ーディスクＦＤから読み出し、コンピュータシステムＣ
ｓにロードする。

【００６４】なお、上記説明では、データ記録媒体とし
てフロッピーディスクを用いて説明を行ったが、光ディ
スクを用いても上記フロッピーディスクの場合と同様に
ソフトウェアによる音声符号化処理を行うことができ
る。また、記録媒体は上記光ディスクやフロッピーディ
スクに限るものではなく、ＩＣカード、ＲＯＭカセット
等、プログラムを記録できるものであればよく、これら
の記録媒体を用いる場合でも、上記フロッピーディスク
等を用いる場合と同様にソフトウェアによる音声符号化
処理を実施することができる。

【００６５】（実施の形態３）次に本発明の実施の形態
３による音声符号化方式、音声符号化装置について、図
面を参照しながら説明する。図２で示した高帯域符号化
処理手段２４の構成としては、例えば、図３に示したよ
うな構成を用いる。また、低帯域符号化処理手段２３の
構成としては、例えば、図１２示すように、図１１で示
したのと同様に、各帯域電力の偏在を利用して各帯域
（サブバンド）毎に符号化を行うような符号化方式を用
いるが、所定の聴覚心理モデル分析手段のみを利用した
各サブバンド信号に対するビット配分は行わず、新たに
処理量の少ない簡易聴覚心理モデル部４０６２を設け、
前フレームに出力された聴覚心理モデル部４０６１のマ
スキング閾値と当該フレームの帯域分割信号に基づき生
成されたビット割り当て情報からビット配分を行うこと
を可能としている。

【００６６】すなわち、図１２は図２に示した低帯域符
号化処理手段２３の詳細な構成を示すブロック図であ
り、４０１は符号化器であり、後述するサブパンド分析
手段４０２，スケールファクタ抽出手段４０３，ビット
削り当て処理制御手段４０４，ＦＦＴ処理手段４０５，
聴覚心理分析乎段４０６，聴覚心理モデルピツト割り当
て手段４０７，量子化／符号化手段４０８，補助情報符
号化手段４０９，ビットストリーム形成手段４１０から
構成されている。

【００６７】以下、動作について説明する。上記サブバ
ンド分析手段４０２は、入力されたデジタルオーデイオ
信号を３２個の周波数成分に分割する。スケールファク
タ抽出手段４０３は、各サブバンド信号に対するスケー
ルファクタを計算し、各サブバンドダイナミックレンジ
をそろえる。ＦＦＴ処理手段４０５は、入力されたデジ
タルオーディオ信号に対して、高速フーリエ変換を施
す。聴覚心理分析手段４０６は、例えば、ＭＰＥＧによ
って指定された通常聴覚心理モデル部４０６１，及び上
記通常聴覚心理モデル部４０６１に比べて処理量の少な
い上記簡易聴覚心理モデル部４０６２からなり、各モデ
ルは信号対マスク比を算出する。

【００６８】なお、上記通常聴覚心理モデル部４０６１
は、下記の数式３に基づき各サブバンド信号の信号対マ
スク比を算出するのに対し、上記簡易聴覚心理モデル部
４０６２は、下記の数式４に示すように、該当フレーム
においては、各サブハンドの最小マスキング・レベルの
算出は行なわず、上記通常聴覚心理モデル部４０６１に
よって算出された最近の前フレームでの最小マスキング
・レベルを用い、音圧は該当フレームのスケールファク
タ抽出手段４０３によって抽出されたスケール・ファク
タ値を用いて信号対マスク比を算出する。

【数３】ここで、 Lsb(n)：各サブバンドの奢圧ＬＴ_min(n)：各サブバンドの最小マスキング・レベルである。

【数4】ここで、 Lsb(n)＝20・log(scf_max(n) ・32768-10) db scf_max(n)：該当フレームの各サブバンドに対するスケ
ール・ファクタ値ＬＴ_min(n)：最近の上記通常聴覚心理モデル部４０６１
にて算出された各サブバンドの最小マスキング・レベル

【００６９】ビット割り当て処理制御手段４０４は、処
理量制御情報１２１の情報を基に、本実施の形態３で
は、図１３に示すように、Ｎを３とし、低負荷処理が実
現可能な上記簡易聴覚心理モデル部４０６２と高□質化
を実現することができる最適なビット配分情報を出力す
ることが可能な上記通常聴覚心理モデル部４０６１を、
何フレームに一度行なうかの制御，及びＦＦＴ処理手段
４０５における高速フーリエ変換を行なうか否かの制御
を行なう。例えば、図１３の状態において、処理量制御
情報１２１の情報として、符号化処理に割くＣＰＵ占有
率を下げるという情報が、上記ビット割り当て処理制御
手段４０４に知らされると、処理量の小さい上記簡易聴
覚心理モデル部４０６２の使用を多くするために、Ｎの
値を大きくする。反対に、符号化処理に割くＣＰＵ占有
率をもっと使用してもよいという情報が、上記ビット割
り当て処理制御手段４０４に知らされると、高音質化が
実現可能な上記通常聴覚心理モデル部４０６１の使用を
多くするためにＮの値を小さくする。これにより、処理
量の制御を可能とすることができる。

【００７０】聴覚心理モデルビット割り当て手段４０７
は、上記ビット割り当て処理制御手段４０４からの情報
である信号対マスク比の関係から上記サブパンド分析手
段４０２により分割された各サブパンド信号に対し、ピ
ツトの割り当てを行なう。量子化／符号化手段４０８に
より、各サブバンド信号の量子化，及び符号化を行い、
補助情報符号化手段４０９からの補助データと共にビツ
トストリーム形成手段４１０によりピツトストリームが
形成され出力される。

【００７１】このように本実施の形態３によれば、ビッ
ト割り当てをＮフレームに一度の割合で行うようにした
ので、時間軸方向でのＣＰＵ負荷を低減することができ
るようになる。

【００７２】なお、ここでは仮に符号化器４０１を、図
２に示した低帯域符号化処理手段２３としたが、低帯域
信号に対してのみ適用されるのではなく、全帯域信号に
対して適用するようにしてもよい。

【００７３】（実施の形態４）次に本発明の実施の形態
４による音声符号化方式、音声符号化装置について、図
面を参照しながら説明する。図１４は、図１１で示した
のと同様に、各帯域電力の偏在を利用して各帯域（サブ
バンド）毎に符号化を行なうような符号化方式を用いて
いるが、出カビットストリーム中に、オーディオデータ
以外の外部データを付加する機能を備えている点が異な
る。上記外部データとしては、画像データやテキストデ
ータなどが想定される。

【００７４】すなわち、図１４に示す符号化器５０１
は、後述するサブパンド分析手段５０２，スケールファ
クタ抽出手段５０３，ＦＦＴ処理手段５０４，聴覚心理
分析手段５０５，ビット割り当て手段５０６，量子化／
符号化手段５０７，補助情報符号化手段５０８，ビット
ストリーム形成手段５０９，ビット割り当て処理制御手
段５１０，付加データ符号化手段５１１から構成されて
いる。

【００７５】以下、動作について説明する。上記サブバ
ンド分析手段５０２は、入力されたデジタルオーディオ
信号を３２個の周波数成分に分割する。スケールファク
タ抽出手段５０３は、各サブバンド信号に対するスケー
ルファクタを計算し、各サブバンドダイナミックレンジ
をそろえる。ＦＦＴ処理手段５０４は、入力されたデジ
タルオーディオ信号に対して、高速フーリエ変換を施
す。聴覚心理分析手段５０５は、例えば、ＭＰＥＧによ
って指定された聴覚心理モデルにより、信号対マスク比
を算出する。

【００７６】ビット割り当て処理制御手段５１０は、出
カビットストリーム中に付加するデータを一時的に格納
しておく付加データバッファ５１２を監視し、付加デー
タがあるか否かの判断、あるいは付加データがオーバフ
ローするか否かの判断から生成された割り当て範囲制御
情報５１３を基に、ビット割り当て手段５０６に対し、
ビット割り当てを行なう範囲を指定する。

【００７７】例えば、付加データバッファ５１２にデー
タが存在しない場合には、図１５に示すように、サブバ
ンド０〜２９に対してビット割り当てが行われる。この
場合、全体の割り当て可能ビット数を１００とし、サブ
バンド０〜１５に８０ビット、サブバンド１６〜２９に
２０ビットが割り当てられている。

【００７８】そして、付加データバッファ５１２に外部
よりデータが書き込まれ、付加データが存在する状態に
なった場合には、つまり、割り当て範囲制御情報５１３
として、付加データを挿入するという指示が、ビット割
り当て処理制御手段５１０に対して知らされ、本実施の
形態４では、例えば、サブバンド０〜１５に８０ビット
を割り当て、本来割り当てられるべきサブバンド１６〜
２９に対してはビット割り当てを行なわず、余った２０
ビットをデータの付加ビット数として割り当てられる。
また、ビット割り当てが行われないサブバンド１６以降
のサブバンドに対しては、処理量を削減するために、該
当範囲のＦＦＴ処理，及び聴覚心理分析を行なわないよ
うにしてもよい。

【００７９】そして、上記ビット割り当てが行われたサ
ブバンドに対し、量子化／符号化手段５０７により、量
子化，及び符号化を行い、補助情報符号化手段５０８か
らの補助データと、例えば、ＭＰＥＧのアンシラリーデ
ータとして符号化された付加データと共に、ビットスト
リーム形成手段５０９によりットストリームが形成され
出力される。

【００８０】このように本実施の形態４によれば、定ビ
ットレートでの伝送を行う際に、オーディオデータ以外
の付加データの量に応じて、符号化時のビット割り当て
範囲を制御して符号化するオーディオデータの量を可変
として符号化データストリーム中に付加データを挿入す
るようにしたので、余剰帯域に様々なデータを重畳して
帯域を有効に利用することができる。なお、ビット割り
当て処理制御乎段５１０により実行されるビット割りあ
て範囲の制御は、フレーム単位で行い、そのビット割り
当て範囲も付加データバツファ５１２のデータ量に応じ
て、可変可能としている。

【００８１】これらの処理により、付加データ挿入時に
おいてもピット割り当て範囲内の音質を損なうことな
く、リアルタイムにデータ挿入量の制御を可能とするこ
とができる。

【００８２】（実施の形態５）次に本発明の実施の形態
５による音声符号化方式、音声符号化装置について、図
面を参照しながら説明する。図１６は本実施の形態５に
よる音声符号化方式を用いた音声符号化装置の符号化器
の構成を示すブロック図であり、図において、図２と同
一符号は同一または相当部分を示し、１６０〜１６２は
それぞれ独立的に動作可能な符号化処理手段Ａ〜Ｃ、１
６３は各符号化処理手段Ａ〜Ｃの処理負荷値情報を格納
するための処理負荷値格納バッファ、１６４は上記各符
号化処理手段Ａ〜Ｃにサンプルとなるデータを供給する
ためのサンプルデータバッファである。

【００８３】次に動作について説明する。符号化処理を
行う前の初期化時に、まず、サンプルデータバッファ１
６４に格納されている所定のサンプルデータを各符号化
処理手段Ａ〜Ｃに供給し、これによって発生する符号化
処理手段Ａ〜Ｃ、あるいは聴覚心理モデルの処理負荷値
を処理負荷値格納バッファ１６３に格納する。

【００８４】そして、上記処理負荷値を昇順、もしくは
降順にて出力することによって、装置にて使用されるＣ
ＰＵの性能に見合った符号化処理手段を迅速に選択し、
当該符号化処理手段によって符号化処理を行う。符号化
処理の内容については、実施の形態１で示したものと同
じであるので個々では省略する。

【００８５】このように本実施の形態によれば、符号化
処理前の初期化時に、サンプルデータを用いて各符号化
処理手段を動作させ、そのときの負荷値を取得して、使
用するＣＰＵの処理能力に適した符号化処理手段を選択
して用いるようにしたので、ＣＰＵの負荷が減少して、
最適な符号化処理を行うことができるようになる。

【００８６】なお、以上の各実施の形態では、音声符号
化装置として、ＰＣを用いて実現する構成を例に挙げて
説明したが、例えばＶＴＲカメラやＤＶＤエンコーダな
どの機器に組み込んで用いるような場合にも適用するこ
とができる。

【００８７】また、上記各実施の形態では、音声のみを
取り扱うようにしたが、音声とともに映像を処理する場
合には、図１７に示すように、図２の構成において、音
声信号とは別に映像信号を入力し、低帯域符号化処理手
段と高帯域符号化処理手段に代えて、映像符号化処理手
段１７０と音声符号化処理手段１７１を設け、さらに、
ビットストリーム形成処理手段に代えてシステムストリ
ーム処理手段１７２を設けた構成とすることにより、対
応することができる。以上のような構成を用いて、外部
からの制御情報に基づいて、上記各実施の形態で説明し
たような方法で、音声符号化の演算量を変更したり、演
算量の異なる複数の音声符号化方式を切り替えたりする
ことによって、ＣＰＵとしての全体の演算量を制御する
ことが可能となる。また、あるいは、符号化すべき音声
信号の量に応じて、符号化する映像信号の処理量を変化
させるように構成してもよい。

【００８８】さらに、サブバンド方式のコーディングを
行うＭＰＥＧ１以外に、時間／周波数変換を行うＭＰＥ
Ｇ２，ＡＡＣ，ＤｏｌｂｙＡＣ−３、ＡＴＲＡＣ（Ｍ
Ｄ）などのコーディング方式を行う場合についても、符
号化処理に関わる各手段を、図１８に示すように、演算
量の異なる第１の量子情報算出手段１８１と第2の量子
化情報算出手段１８２に置換するとともに、これらを量
子化手段制御手段１８０によって選択して使用し、符号
化情報の代わりに量子化情報を取り扱う構成とすること
で、同様に対応することが可能である。

【００８９】

【発明の効果】以上のように、この発明の請求項１にか
かる音声符号化方式によれば、デジタルオーディオ信号
を複数の周波数帯域に分割し、各帯域毎に符号化を行う
音声符号化方式であって、上記分割された各帯域に対す
るビット割り当て情報を生成し、それぞれ処理量の異な
るビット割り当て手段を複数有し、外部からの制御情報
に基づいて、上記複数のビット割り当て手段の中から、
所定のビット割り当て手段を用いて処理がなされるよう
に、使用するビット割り当て手段を切り替えてビット割
り当てを実行して、符号化を行うようにしたので、常に
最適な処理量のビット割り当て手段を選択して使用する
ことができ、稼動状態において占有できるＣＰＵの処理
量を超えないような符号化が可能となり、リアルタイム
エンコード時に処理が入力信号に対して間に合わないと
いうことがない、つまり再生音に音切れがない符号化を
行うことができるという効果がある。

【００９０】また、本発明の請求項２にかかる音声符号
化方法によれば、上記外部からの制御情報として、符号
化処理を行うために占有できる中央演算処理装置の処理
量を表す負荷値を用い、上記負荷値に基づいて、上記中
央演算処理装置上で符号化処理において各ビット割り当
て手段を用いて符号化動作を行った時の各処理量を予め
記憶したデータテーブルを参照して、上記符号化処理が
占有できる中央演算処理装置の処理量を超えないようビ
ット割り当て手段の選択を行うようにしたので、中央演
算処理装置は常に稼動能力を超えるような要求を受ける
ことが無くなり、システム全体の制御をスムーズに行う
ことができるという効果がある。

【００９１】また、本発明の請求項３にかかる音声符号
化方式によれば、上記請求項２記載の行う音声符号化方
式において、上記負荷値として、符号化処理を行うため
に占有可能な上記中央演算処理装置の処理量を監視する
監視手段からの処理量制御情報を用いるとしたので、占
有可能な中央演算処理装置の最高パフォーマンスの範囲
内で、最適な処理量のビット割り当て手段を選択するこ
とができ、リアルタイムエンコード時に処理が入力信号
に対して間に合わないということがない、つまり再生音
に音切れがない符号化を行うことができるという効果が
ある。

【００９２】また、本発明の請求項４にかかる音声符号
化方式によれば、上記請求項１記載の音声符号化方式に
おいて、上記ビット割り当て手段によるビット割り当て
処理として、符号化データの高音質化を実現可能な高効
率にビット割り当てを行う高効率ビット割り当て方法を
用いた処理と、該高効率ビット割り当て方法を用いた処
理と比較して処理量の少ない低負荷でビット割り当てを
行う低負荷ビット割り当て方法を用いた処理を行うよう
にしたので、符号化器が符号化データの高音質化を優先
するか、又は音質よりも符号化処理の低負荷性を優先す
るかの処理を適宜切り替えて実行することができる符号
化を実現することができるという効果がある。

【００９３】また、本発明の請求項５にかかる音声符号
化方式によれば、上記請求項１記載の音声符号化方式に
おいて、上記符号化時に使用されるビット割り当て手段
の切り替えを、オーディオ信号に復号可能な最小単位で
あるフレーム単位で行うようにしたので、リアルタイム
エンコード時に、動作ＣＰＵ上で該ＣＰＵを共有する他
のアプリケーションなどのＣＰＵ占有率が突然大きくな
った場合などにおいても、フレーム単位時間で符号化処
理が占有できるＣＰＵの処理量に追従可能となり、ま
た、リアルタイムで音質や処理量を制御可能とすること
ができるという効果がある。

【００９４】また、本発明の請求項６にかかる音声符号
化方式によれば、上記請求項１記載の音声符号化方式に
おいて、複数の周波数帯域に分割された各帯域のサブバ
ンド信号を、各々予め定められた所定個数のサブバンド
信号からなるグループとなるようにグループ分けを行
い、各グループに対して独立したビット割り当て処理を
行い、各帯域に対するビット割り当て情報を生成するよ
うにしたので、各帯域毎の特性に応じたビット割り当て
処理を選択して符号化を行うことができるという効果が
ある。

【００９５】また、本発明の請求項７にかかる音声符号
化方式によれば、上記請求項６記載の音声符号化方式に
おいて、上記グループ分けが、グループの数、又はグル
ープ内の周波数軸方向に連続したサブバンド信号の数
を、上記外部からの制御情報により指定された数、又は
上記監視手段からの処理量制御情報に基づいて指定され
た数となるように可変的に行われるようにしたので、Ｃ
ＰＵの使用状況に応じてダイナミックにグループ分けを
行うことができるという効果がある。

【００９６】また、本発明の請求項８にかかる音声符号
化方式によれば、上記請求項７記載の音声符号化方式に
おいて、上記サブバンド信号の数の変更処理を、オーデ
ィオ信号に復号可能な最小単位であるフレーム単位で行
うようにしたので、ビット割り当て方式の変更をきめ細
かく行うことができ、高精度な符号化器を実現すること
ができるという効果がある。

【００９７】また、本発明の請求項９にかかる音声符号
化方式によれば、請求項８記載の音声符号化方式におい
て、上記グループ分け時に、ビット割り当てを行わない
グループを少なくとも１つ設けるようにしたので、オー
ディオ信号に復号可能な最小単位であるフレーム単位
で、グループの数、またはグループ内の周波数軸方向に
連続したサブバンド信号の数を、外部からの制御情報に
より指定された数、または監視手段からの処理量制御情
報により指定された数に変えることで、ビット割り当て
が行われないグループに属する帯域の信号を符号化処理
する必要がなくなり、また、ビット割り当てが行われな
いグループに属する帯域に割り当てられるべきビット
を、ビット割り当てが行われる他のグループの帯域に分
配することができ、その結果、符号化処理が占有するＣ
ＰＵの処理量を制御可能となるとともに、ビット割り当
てが行われる他のグループの帯域の音質を向上すること
ができるという効果がある。

【００９８】また、本発明の請求項１０にかかる音声符
号化方式によれば、上記請求項６記載の音声符号化方式
において、上記サブバンド信号のグループ分けにより、
低帯域に属するグループにグループ分けされたサブバン
ド信号に対し、符号化データの高音質化を実現可能な高
効率ビット割り当て方法を用いて、グループ内のサブバ
ンド信号にビット割り当てを行う一方、高帯域に属する
グループにグループ分けされたサブバンド信号に対し、
上記高効率ビット割り当て方法と比較して処理量の少な
い低負荷ビット割り当て処理を用いて、グループ内のサ
ブバンド信号にビット割り当てを行うようにしたので、
人間の耳に対して感度のよい低帯域については符号化デ
ータの高音質化を図ることができ、一方、人の耳に対し
て感度の悪い高帯域については処理量優先の低負荷ビッ
ト割り当てを用いられるようになり、全体として処理量
を削減した符号化を行うことができるという効果があ
る。

【００９９】また、本発明の請求項１１にかかる音声符
号化方式によれば、上記請求項６記載の音声符号化方式
において、各グループ毎に独立したビット割り当て手段
に対する割り当て可能ビット数を決定する割り当て可能
ビット演算手段を設け、各グループのグループ全体に対
する割合に各グループに属する各帯域毎の特性に基づい
た重み付けを加味したものを用いて、グループ全体に対
する割り当て可能ビット数を、各グループ毎に独立した
ビット割り当て手段に対し振り分けるようにしたので、
入力信号、又は各帯域の特性に対して、聴覚特性を考慮
した符号化データの高音質を実現するのに最適な各グル
ープのビット割り当て手段に対するビット配分が可能な
符号化を行うことができるという効果がある。

【０１００】また、本発明の請求項１２にかかる音声符
号化方式によれば、上記請求項１１記載の音声符号化方
式において、各グループに属する各帯域毎の特性に基づ
いた重み付けを、各帯域毎の所定の最小可聴限界値に基
づいた重み付けとすることにより、上記人間が聴く際に
意味の有る効果的なビット割り当て処理を行うことがで
きるという効果がある。

【０１０１】また、本発明の請求項１３にかかる音声符
号化方式によれば、上記請求項１１記載の音声符号化方
式において、各グループに属する各帯域毎の特性に基づ
いた重み付けを、入力デジタルオーディオ信号にサブバ
ンド分析を施して得られる、各グループに属する各周波
数帯域のサブバンド信号レベルに基づいた重み付けとす
ることにより、効果的なビット割り当て処理を行うこと
ができるという効果がある。

【０１０２】また、本発明の請求項１４にかかる音声符
号化方式は、上記請求項１１記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重
み付けを、入力デジタルオーディオ信号に線形変換を施
して得られる、各グループに属するスペクトル信号レベ
ルに基づいた重み付けとすることにより、効果的なビッ
ト割り当て処理を行うことができるという効果がある。

【０１０３】また、本発明の請求項１５にかかる音声符
号化方式によれば、上記請求項６記載の音声符号化方式
において、各グループに属する信号レベルが、所定のし
きい値以上の高レベルな信号に対しては、符号化データ
の高音質化を実現可能な高効率ビット割り当て方法を用
いてビット割り当てを行い、各グループに属する信号レ
ベルが、所定のしきい値以下の低レベルな信号に対して
は、上記高効率ビット割り当て方法と比較して処理量の
少ない低負荷ビット割り当て方法を用いてビット割り当
てを行うようにしたので、他の帯域に比べ符号化データ
としてそれほど重要でない信号に対し、処理負荷を割く
ことなく、符号化データの高音質化を図ることができる
符号化を行うことができるという効果がある。

【０１０４】また、本発明の請求項１６にかかる音声符
号化方式によれば、上記請求項１５記載の音声符号化方
式において、上記各グループに属する信号レベルを、入
力デジタルオーディオ信号にサブバンド分析を施して得
られるサブバンド信号レベルとすることにより、効果的
なビット割り当て処理を行うことができるという効果が
ある。

【０１０５】また、本発明の請求項１７にかかる音声符
号化方式によれば、上記請求項１５記載の音声符号化方
式において、上記各グループに属する信号レベルを、入
力デジタルオーディオ信号に線形変換を施して得られる
スペクトル信号レベルとしたので、することにより、効
果的なビット割り当て処理を行うことができるという効
果がある。

【０１０６】また、本発明の請求項１８にかかる音声符
号化方式によれば、上記請求項１５記載の音声符号化方
式において、上記各グループに属する信号レベルを、所
定の各帯域毎の最小可聴限界値としたので、上記人間が
聴く際に意味の有る効果的なビット割り当て処理を行う
ことができるという効果がある。

【０１０７】また、本発明の請求項１９にかかる音声符
号化方式によれば、上記請求項４,１０, １５のいずれ
かに記載の音声符号化方式において、上記符号化データ
の高音質化を実現可能な高効率ビット割り当て処理とし
て、所定の聴覚心理モデルに基づく信号対マスク比値と
の関係を使用してビット割り当てを行うものとし、一
方、上記高効率ビット割り当て処理と比較して処理量の
少ない低負荷ビット割り当て処理として、複数の周波数
帯域に分割された信号レベルに各帯域毎の所定の最小可
聴限界値を加味してビット割り当てを行うものとしたの
で、全体として人間の耳で聞いた限りは音質を損なうこ
となく、システムの処理量を軽減することができるとい
う効果がある。

【０１０８】また、本発明の請求項２０にかかる音声符
号化方式は、上記請求項１９記載の音声符号化方式にお
いて、上記聴覚心理モデルがＭＰＥＧによって指定され
た聴覚心理モデルとすることにより、ＭＰＥＧ（Motion
Picture Experts Group）を用いた音声符号化処理にお
いても上記同様の効果を得ることができるという効果が
ある。

【０１０９】また、本発明の請求項２１にかかる音声符
号化方式は、上記請求項５または請求項８記載の音声符
号化方式において、上記オーディオ信号に復号可能な最
小単位であるフレームが、ＭＰＥＧ（Motion Picture E
xperts Group）によって指定されたフレームとすること
により、ＭＰＥＧを用いた音声符号化処理においても上
記同様の効果を得ることができるという効果がある。

【０１１０】また、本発明の請求項２２にかかる音声符
号化方式によれば、上記請求項１記載の音声符号化方式
において、上記ビット割り当て手段は、分割化された各
帯域に対し、所定の聴覚心理モデルから出力される情報
に基づいてビット割り当て情報を生成するものであり、
N(N＝１，２，３...)フレームに１度、上記所定の聴覚
心理モデルから出力される情報に基づいてビット割り当
て情報を生成し、上記ビット割り当て情報を生成しなか
ったフレームに対しては、上記聴覚心理モデルから出力
された情報と上記分割された各帯域の信号情報に基づい
てビット割り当て情報を生成し、符号化を行なうように
したので、時間軸方向でのＣＰＵ負荷を低減することが
できるという効果がある。

【０１１１】また、本発明の請求項２３にかかる音声符
号化方式によれば、上記請求項項１記載の音声符号化方
式において、段階的に処理量の制御可能な聴覚心理モデ
ルを有し、外部からの制御情報に基づいて、上記聴覚心
理モデルの処理量制御を行ない、所定の処理量の聴覚心
理モデルを用いて処理がなされるように、各帯域に対す
るビット割り当て情報を生成するようにしたので、聴覚
的な効果を加味したＣＰＵ負荷制御を行うことができる
という効果がある。

【０１１２】また、本発明の請求項２４にかかる音声符
号化方式によれば、上記請求項１記載の音声符号化方式
において、それぞれ処理量の異なる聴覚心理モデルを複
数有し、外部からの制御情報に基づいて、上記複数の聴
覚心理モデルの中から、所定の聴覚心理モデルを用いて
処理が成されるように、使用する聴覚心理モデルを切り
替えて、各帯域に対するビット割り当て情報を生成する
ようにしたので、より簡単に聴覚的な効果を加味したＣ
ＰＵ負荷制御を行うことができるという効果がある。

【０１１３】また、本発明の請求項２５にかかる音声符
号化方式によれば、デジタルオーディオ信号を複数の周
波数帯域に分割し、該分割された各帯域に対するビット
割り当て情報を生成し、所定ビットレートでの伝送を目
的として各帯域毎に符号化を行なう音声符号化方式であ
って、符号化データストリーム中にデータを挿入するフ
レームにおけるビット割り当て範囲を制御し、符号化オ
ーディオデータ量を可変に制御するようにしたから、Ｃ
ＰＵ処理の負荷が一定となるとともに、余剰帯域に様々
なデータを重畳して帯域を有効に利用することができる
という効果が得られる。

【０１１４】また、本発明の請求項２６にかかる音声符
号化方式によれば、上記請求項２５記載の音声符号化方
式において、外部からの制御情報に基づいて、フレーム
単位でビット割り当て範囲を制御し、符号化オーディオ
データ量を可変に制御するようにしたので、ＣＰＵの処
理負荷を効率よく低減することができるという効果があ
る。

【０１１５】また、本発明の請求項２７にかかる音声符
号化方式によれば、上記請求項２６記載の音声符号化方
式において、上記外部からの制御情報として、付加デー
タのバッファを監視する監視手段からのデータ量制御情
報を用いるようにしたので、負荷データを優先的に重畳
することができるという効果がある。

【０１１６】また、本発明の請求項２８にかかる音声符
号化方式によれば、上記請求項１記載の音声符号化方式
において、符号化処理が実行される中央演算処理装置の
性能に応じて、符号化処理動作前の初期化時に複数のビ
ット割り当て手段、または複数の聴覚心理モデルの各処
理負荷値情報を外部へ出力するようにしたので、実際に
符号化を行う前に、使用されるＣＰＵの性能に関する情
報を取得することができ、ＣＰＵの処理負荷を効率的に
低減することができるという効果がある。

【０１１７】また、本発明の請求項２９にかかる音声符
号化方式によれば、上記請求項２８記載の音声符号化方
式において、外部への情報として出力される複数のビッ
ト割り当て手段、または複数の聴覚心理モデルの各処理
負荷値情報が、降順、あるいは昇順で出力されるように
したので、符号化処理手段の選択を迅速に行うことがで
きるという効果がある。

【０１１８】また、本発明の請求項３０にかかる音声符
号化方式によれば、映像信号，音声信号の符号化処理が
同一の中央演算処理装置にて処理がなされる音声符号化
方式において、異なる複数の演算量で符号化を行うもの
であって、上記音声信号もしくは映像信号の符号化の演
算量を変更することで、上記中央演算処理装置上での処
理の全体的な演算量を制御するようにしたので、音声と
ともに映像信号を符号化する処理においても、ＣＰＵの
負荷処理を行うことができるという効果がある。

【０１１９】また、本発明の請求項３１にかかる音声符
号化方式によれば、映像信号，音声信号の符号化処理が
同一の中央演算処理装置にて処理がなされる音声符号化
方式において、演算量の異なる複数の符号化方式を用い
て符号化を行うものであって、上記音声信号の符号化の
符号化方式を変更することで、上記中央演算処理装置上
での処理の全体的な演算量を制御するようにしたので、
音声とともに映像信号を符号化する処理においても、Ｃ
ＰＵの負荷処理を行うことができるという効果がある。

【０１２０】また、本発明の請求項３２にかかる音声符
号化方式によれば、上記請求項３０または３１記載の音
声符号化方式において、上記中央演算処理装置上での処
理の制御を、外部からの制御情報に基づいて行うように
したので、ＣＰＵの処理負荷を効率よく低減することが
できるという効果がある。

【０１２１】また、本発明の請求項３３にかかる音声符
号化方式によれば、ディジタルオーディオ信号に対し
て、時間／周波数変換を施し、量子化情報を生成するこ
とで符号化を行う音声符号化方式であって、それぞれ演
算量の異なる複数の量子化情報算出手段を有し、外部か
らの制御情報に基づいて、上記複数の量子化情報算出手
段の中から、所定の量子化情報算出手段を選択して処理
が行われるように、使用する量子化情報算出手段を切り
替えて量子化情報を算出して符号化を行うようにしたの
で、時間／周波数変換方式のコーディングを行う符号化
処理装置においても、ＣＰＵの処理負荷を低減すること
ができるという効果がある。

【０１２２】また、本発明の請求項３４にかかる音声符
号化装置によれば、上記請求項１ないし請求項３３のい
ずれかに記載の音声符号化方式を用いて音声符号化を行
うようにしたので、該音声符号化方式を組み込んだＶＴ
Ｒカメラなどの機器においても上記同様の効果を得るこ
とができるという効果がある。

【０１２３】また、本発明の請求項３５にかかるデータ
記憶媒体は、上記請求項１ないし請求項３３のいずれか
に記載の音声符号化方式のステップが記録されているの
で、該記憶媒体を用いて上記音声符号化方式を装置に組
み込むことにより、上記同様の効果を得ることができる
という効果がある。

【図面の簡単な説明】

【図１】本発明の実施の形態１による音声符号化方式を
用いた音声符号化装置を実現するために、パーソナルコ
ンピュータを用いた全体的なシステムとしての構成を示
すブロック図である。

【図２】上記実施の形態１による音声符号化装置を構成
する符号化器の構成を示すブロック図である。

【図３】上記符号化器を構成する高帯域符号化処理手段
の詳細な構成を示すブロック図である。

【図４】上記実施の形態１による音声符号化装置を構成
する符号化器のより詳細な構成を示すブロック図であ
る。

【図５】上記実施の形態１による音声符号化方式で使用
する、各グループに対するビット割り当て処理の一例を
示した模式図である。

【図６】上記実施の形態１による音声符号化方式で使用
する、各グループに対するビット割り当て処理の他の一
例を示した模式図である。

【図７】上記実施の形態１による音声符号化装置を構成
する符号化器の符号化動作を説明するためのフローを示
す図である。

【図８】上記実施の形態１による音声符号化方式で使用
する、各グループに対するビット割り当て処理の、閾値
を用いて処理を行う例を示した模式図である。

【図９】本発明の上記実施の形態１による音声符号化装
置を構成する符号化器の変形例の詳細な構成を示すブロ
ック図である。

【図１０】本発明の実施の形態２によるデータ記憶媒体
及び該記憶媒体を用いて音声符号化装置を構成する場合
の構成を示すブロック図である。

【図１１】従来の音声符号化装置を構成する符号化器の
構成を示すブロック図である。

【図１２】本発明の実施の形態３による音声符号化装置
を構成する低帯域符号化処理手段の詳細な構成を示す図
である。

【図１３】上記実施の形態３による音声符号化装置によ
る低帯域符号化時の各フレームにおける聴覚心理モデル
の状態を説明するための図である。

【図１４】本発明の実施の形態４による音声符号化装置
を構成する低帯域符号化処理手段の詳細な構成を示す図
である。

【図１５】上記実施の形態４による音声符号化装置を用
いたビット割り当て処理の一例を示す図である。

【図１６】本発明の実施の形態５による音声符号化装置
を構成する符号化器の構成を示すブロック図である。

【図１７】音声信号とともに映像信号を取り扱う場合の
符号化器の構成を示すブロック図である。

【図１８】時間／周波数変換方式のコーディングを行う
符号化処理装置における符号化処理において本発明を適
用した場合の構成を示すブロック図である。

【符号の説明】

１パーソナルコンピュータ（音声符号化装置）１１ＨＤＤ１２ａＰＤＤ１２ｂＦＤＤ１３メモリ１４ＣＰＵ（中央演算処理装置）１５データバス１６ビデオキャプチャーカード１７カメラ１８サウンドカード１９マイク２０符号化器２１ＣＰＵ負荷監視情報２２符号化手段制御手段２３低帯域符号化処理手段２４高帯域符号化処理手段２５ビットストリーム形成処理手段２６符号化モード指定信号１０１符号化器１０２サブバンド分析手段１０３スケールファクタ抽出手段１０４ＦＦＴ手段１０５聴覚心理分析手段１０６量子化／符号化手段１０７補助情報符号化手段１０８ビットストリーム形成手段１０９帯域出力適応ビット割り当て手段１１０聴覚心理モデルビット割り当て手段１１１グループ分け手段１１２ビット割り当て処理制御手段１２１処理量制御情報１６０〜１６２符号化処理手段Ａ〜Ｃ１６３処理負荷値格納バッファ１６４サンプルデータバッファ１７０映像符号化処理手段１７１音声符号化処理手段１７２システムストリーム形成処理手段１８０量子化手段制御手段１８１第１の量子化情報算出手段１８２第２の量子化情報算出手段ＦＣフロッピーディスクケースＦＤフロッピーディスクＤフロッピーディスク本体ＳｅセクタＴｒトラックＣｓコンピュータシステムＦDD フロッピーディスクドライブ

Claims

【特許請求の範囲】

【請求項１】デジタルオーディオ信号を複数の周波数
帯域に分割し、各帯域毎に符号化を行う音声符号化方式
であって、上記分割された各帯域に対するビット割り当て情報を生
成し、それぞれ処理量の異なるビット割り当て手段を複
数有し、外部からの制御情報に基づいて、上記複数のビット割り
当て手段の中から、所定のビット割り当て手段を用いて
処理がなされるように、使用するビット割り当て手段を
切り替えてビット割り当てを実行して、符号化を行うこ
とを特徴とする音声符号化方式。
【請求項２】請求項１記載の音声符号化方式におい
て、上記外部からの制御情報として、符号化処理を行うため
に占有できる中央演算処理装置の処理量を表す負荷値を
用い、上記負荷値に基づいて、上記中央演算処理装置上で符号
化処理において各ビット割り当て手段を用いて符号化動
作を行った時の各処理量を予め記憶したデータテーブル
を参照して、上記符号化処理が占有できる中央演算処理
装置の処理量を超えないよう上記ビット割り当て手段の
選択を行うことを特徴とする音声符号化方式。
【請求項３】請求項２記載の音声符号化方式におい
て、上記負荷値として、符号化処理を行うために占有可能な
上記中央演算処理装置の処理量を監視する監視手段から
の処理量制御情報を用いることを特徴とする音声符号化
方式。
【請求項４】請求項１記載の音声符号化方式におい
て、上記ビット割り当て手段によるビット割り当て処理とし
て、符号化データの高音質化を実現可能な高効率にビット割
り当てを行う高効率ビット割り当て方法を用いた処理
と、上記高効率ビット割り当て方法を用いた処理と比較して
処理量の少ない低負荷でビット割り当てを行う低負荷ビ
ット割り当て方法を用いた処理とが行なわれることを特
徴とする音声符号化方式。
【請求項５】請求項１記載の音声符号化方式におい
て、上記符号化時に使用されるビット割り当て手段の切り替
えを、オーディオ信号に復号可能な最小単位であるフレ
ーム単位で行うことを特徴とする音声符号化方式。
【請求項６】請求項１記載の音声符号化方式におい
て、複数の周波数帯域に分割された各帯域のサブバンド信号
を、各々予め定められた所定個数のサブバンド信号から
なるグループとなるようにグループ分けを行い、各グル
ープに対して独立したビット割り当て処理を行い、各帯
域に対するビット割り当て情報を生成することを特徴と
する音声符号化方式。
【請求項７】請求項６記載の音声符号化方式におい
て、上記グループ分けは、グループの数、又はグループ内の周波数軸方向に連続し
たサブバンド信号の数を、上記外部からの制御情報によ
り指定された数、又は上記監視手段からの処理量制御情
報に基づいて指定された数になるように、可変的に行わ
れることを特徴とする音声符号化方式。
【請求項８】請求項７記載の音声符号化方式におい
て、上記サブバンド信号の数の変更処理を、オーディオ信号
に復号可能な最小単位であるフレーム単位で行うことを
特徴とする音声符号化方式。
【請求項９】請求項８記載の音声符号化方式におい
て、上記グループ分け時に、ビット割り当てを行わないグル
ープを少なくとも１つ設けることを特徴とする音声符号
化方法。
【請求項１０】請求項６記載の音声符号化方式におい
て、上記サブバンド信号のグループ分けにより、低帯域に属
するグループにグループ分けされたサブバンド信号に対
し、符号化データの高音質化を実現可能な高効率ビット
割り当てを行う処理を用いて、グループ内のサブバンド
信号にビット割り当てを行い、一方、高帯域に属するグ
ループにグループ分けされたサブバンド信号に対し、上
記高効率ビット割り当て処理と比較して処理量の少ない
低負荷ビット割り当て処理を用いて、グループ内のサブ
バンド信号にビット割り当てを行うことを特徴とする音
声符号化方式。
【請求項１１】請求項６記載の音声符号化方式におい
て、各グループ毎に独立したビット割り当て手段に対する割
り当て可能ビット数を決定する割り当て可能ビット演算
手段を設け、各グループのグループ全体に対する割合
に、各グループに属する各帯域毎の特性に基づいた重み
付けを加味したものを用いて、グループ全体に対する割
り当て可能ビット数を、各グループ毎に独立したビット
割り当て手段に対し振り分けることを特徴とする音声符
号化方式。
【請求項１２】請求項１１記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重み付け
を、各帯域毎の所定の最小可聴限界値に基づいた重み付
けとすることを特徴とする音声符号化方式。
【請求項１３】請求項１１記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重み付け
を、入力デジタルオーディオ信号にサブバンド分析を施
して得られる、各グループに属する各周波数帯域のサブ
バンド信号レベルに基づいた重み付けとすることを特徴
とする音声符号化方式。
【請求項１４】請求項１１記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重み付け
を、入力デジタルオーディオ信号に線形変換を施して得
られる、各グループに属するスペクトル信号レベルに基
づいた重み付けとすることを特徴とする音声符号化方
式。
【請求項１５】請求項６記載の音声符号化方式におい
て、各グループに属する信号レベルが、所定のしきい値以上
の高レベルな信号に対しては、符号化データの高音質化
を実現可能な高効率ビット割り当て方法を用いてビット
割り当てを行い、各グループに属する信号レベルが、所定のしきい値以下
の低レベルな信号に対しては、上記高効率ビット割り当
て方法と比較して処理量の少ない低負荷ビット割り当て
方法を用いてビット割り当てを行うことを特徴とする音
声符号化方式。
【請求項１６】請求項１５記載の音声符号化方式にお
いて、上記各グループに属する信号レベルを、入力デジタルオ
ーディオ信号にサブバンド分析を施して得られるサブバ
ンド信号レベルとすることを特徴とする音声符号化方
式。
【請求項１７】請求項１５記載の音声符号化方式にお
いて、上記各グループに属する信号レベルが、入力デジタルオ
ーディオ信号に線形変換を施して得られるスペクトル信
号レベルであることを特徴とする音声符号化方式。
【請求項１８】請求項１５記載の音声符号化方式にお
いて、上記各グループに属する信号レベルを、所定の各帯域毎
の最小可聴限界値とすることを特徴とする音声符号化方
式。
【請求項１９】請求項４, １０, １５のいずれかに記
載の音声符号化方式において、上記符号化データの高音質化を実現可能な高効率ビット
割り当て処理は、所定の聴覚心理モデルに基づく信号対
マスク比値との関係を使用して行われるビット割り当て
処理であり、上記高効率ビット割り当て処理と比較して処理量の少な
い低負荷ビット割り当て処理は、複数の周波数帯域に分
割された信号レベルに各帯域毎の所定の最小可聴限界値
を加味して行われるビット割り当て処理であることを特
徴とする音声符号化方式。
【請求項２０】請求項１９記載の音声符号化方式にお
いて、上記聴覚心理モデルが、ＭＰＥＧ（Motion Picture Exp
erts Group）によって指定された聴覚心理モデルである
ことを特徴とする音声符号化方式。
【請求項２１】請求項５または請求項８記載の音声符
号化方式において、上記オーディオ信号に復号可能な最小単位であるフレー
ムが、ＭＰＥＧ（Motion Picture Experts Group）によ
って指定されたフレームであることを特徴とする音声符
号化方式。
【請求項２２】請求項１記載の音声符号化方式におい
て、上記ビット割り当て手段は、分割化された各帯域に対
し、所定の聴覚心理モデルから出力される情報に基づい
てビット割り当て情報を生成するものであり、 N(N＝１，２，３...)フレームに１度、上記所定の聴覚
心理モデルから出力される情報に基づいてビット割り当
て情報を生成し、上記ビット割り当て情報を生成しなかったフレームに対
しては、上記聴覚心理モデルから出力された情報と上記
分割された各帯域の信号情報に基づいてビット割り当て
情報を生成し、符号化を行なうことを特徴とする音声符
号化方式。
【請求項２３】請求項項１記載の音声符号化方式にお
いて、段階的に処理量の制御可能な聴覚心理モデルを有し、外部からの制御情報に基づいて、上記聴覚心理モデルの
処理量制御を行ない、所定の処理量の聴覚心理モデルを
用いて処理がなされるように、各帯域に対するビット割
り当て情報を生成することを特徴とする音声符号化方
式。
【請求項２４】請求項１記載の音声符号化方式におい
て、それぞれ処理量の異なる聴覚心理モデルを複数有し、外部からの制御情報に基づいて、上記複数の聴覚心理モ
デルの中から、所定の聴覚心理モデルを用いて処理が成
されるように、使用する聴覚心理モデルを切り替えて、
各帯域に対するビット割り当て情報を生成することを特
徴とする音声符号化方式。
【請求項２５】デジタルオーディオ信号を複数の周波
数帯域に分割し、該分割された各帯域に対するビット割
り当て情報を生成し、所定ビットレートでの伝送を目的
として各帯域毎に符号化を行なう音声符号化方式であっ
て、符号化データストリーム中にデータを挿入するフレーム
におけるビット割り当て範囲を制御し、符号化オーディ
オデータ量を可変に制御することを特徴とする音声符号
化方式。
【請求項２６】請求項２５記載の音声符号化方式にお
いて、外部からの制御情報に基づいて、フレーム単位でビット
割り当て範囲を制御し、符号化オーディオデータ量を可
変に制御することを特徴とする音声符号化方式。
【請求項２７】請求項２６記載の音声符号化方式にお
いて、上記外部からの制御情報として、付加データのバッファ
を監視する監視手段からのデータ量制御情報を用いるこ
とを特徴とする音声符号化方式。
【請求項２８】請求項１記載の音声符号化方式におい
て、符号化処理が実行される中央演算処理装置の性能に応じ
て、符号化処理動作前の初期化時に複数のビット割り当
て手段、または複数の聴覚心理モデルの各処理負荷値情
報を外部へ出力することを特徴とする音声符号化方式。
【請求項２９】請求項２８記載の音声符号化方式にお
いて、外部への情報として出力される複数のビット割り当て手
段、または複数の聴覚心理モデルの各処理負荷値情報
が、降順、あるいは昇順で出力されることを特徴とする
音声符号化方式。
【請求項３０】映像信号，音声信号の符号化処理が同
一の中央演算処理装置にて処理がなされる音声符号化方
式において、異なる複数の演算量で符号化を行うものであって、上記音声信号もしくは映像信号の符号化の演算量を変更
することで、上記中央演算処理装置上での処理の全体的
な演算量を制御することを特徴とする音声符号化方式。
【請求項３１】映像信号，音声信号の符号化処理が同
一の中央演算処理装置にて処理がなされる音声符号化方
式において、演算量の異なる複数の符号化方式を用いて符号化を行う
ものであって、上記音声信号の符号化の符号化方式を変更することで、
上記中央演算処理装置上での処理の全体的な演算量を制
御することを特徴とする音声符号化方式。
【請求項３２】請求項３０または３１記載の音声符号
化方式において、上記中央演算処理装置上での処理の制御を、外部からの
制御情報に基づいて行うことを特徴とする音声符号化方
式。
【請求項３３】ディジタルオーディオ信号に対して、
時間／周波数変換を施し、量子化情報を生成することで
符号化を行う音声符号化方式であって、それぞれ演算量の異なる複数の量子化情報算出手段を有
し、外部からの制御情報に基づいて、上記複数の量子化情報
算出手段の中から、所定の量子化情報算出手段を選択し
て処理が行われるように、使用する量子化情報算出手段
を切り替えて量子化情報を算出して符号化を行うことを
特徴とする音声符号化方式。
【請求項３４】請求項１ないし請求項３３のいずれか
に記載の音声符号化方式を用いて音声符号化を行うこと
を特徴とする音声符号化装置。
【請求項３５】請求項１ないし請求項３３のいずれか
に記載の音声符号化方式のステップが記録されているこ
とを特徴とするデータ記録媒体。