JP2003280695A

JP2003280695A - 音声圧縮方法および音声圧縮装置

Info

Publication number: JP2003280695A
Application number: JP2002077208A
Authority: JP
Inventors: Tatsufumi Oyama; 達史大山; Hideki Yamauchi; 英樹山内
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 2002-03-19
Filing date: 2002-03-19
Publication date: 2003-10-02

Abstract

(57)【要約】【課題】高音質を確保しながら適切な量子化、符号化
を行う音声圧縮技術を提供する。【解決手段】サブバンドのスペクトラム信号成分を量
子化、符号化して得られる符号化データの符号量（ビッ
ト量）が許容値を超える場合、量子化調整部１３０が、
量子化ビット数の調整を行うか、スケールファクタの調
整を行うかの選択を行う。スケールファクタの調整にあ
たっては、スケールファクタの値を若干大きくし、その
結果、量子化データを小さくすることによって、可変長
符号化により符号量を少なくすることができ、また量子
化ビット数の調整を行わなくてすむため、十分な高音質
を維持することが可能となる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声信号を圧縮す
る方法および装置に関する。

【０００２】

【従来の技術】近年、デジタル音声信号を高圧縮率で符
号化する研究開発が盛んに行われており、その適用分野
も拡大している。特に、ポータブル型音声再生装置の普
及に伴い、例えばＣＤ（コンパクトディスク）に記録さ
れたリニアＰＣＭ信号を、小型の半導体メモリやミニデ
ィスクなどの記録媒体に圧縮して記録することが一般化
している。また、情報が氾濫する現代においてデータ圧
縮技術は不可欠なものであり、ＨＤ（ハードディスク）
やＣＤ−Ｒ、ＤＶＤなどの大容量記録媒体であっても、
圧縮したデータを記録して記録容量を少なくすることが
望ましい。この圧縮符号化は、人間の聴覚特性を利用し
た不要な信号の選別や、量子化ビット数の割当ての最適
化、さらにはハフマン符号化など様々な技術を駆使する
ことにより行われる。高音質且つ高圧縮率の音声信号圧
縮手法は、本分野の最重要課題として日々研究されてい
る。

【０００３】図１は、従来の音声圧縮装置１０の構成を
示す。サブバンド分割部１２は、デジタル音声信号を時
間−周波数変換して、複数の周波数帯域（サブバンド）
に分割する。スケーリング部１４は、それぞれのサブバ
ンドごとに最大振幅値を検出し、この最大振幅値以上で
あって且つ最もこの最大振幅値に近いスケールファクタ
を算出する。スケールファクタのとりうる値は音声圧縮
装置１０において設定されるが、一般には隣接するスケ
ールファクタ値の比が２倍以下に設定されている。算出
した時点でこのスケールファクタは一意に決められ、そ
の後の再量子化の際にも変化することはない。一方、聴
覚心理分析部１６は、デジタル音声信号に対して聴覚心
理分析を行い、ビット割当部１８がその分析結果を受け
て、各サブバンドごとに量子化ビット数を割り当てる。
量子化部２０が、スケールファクタおよび量子化ビット
数を用いて、各サブバンドのスペクトラム信号成分を量
子化し、符号化部２２が量子化されたデータを可変長符
号化する。ビットストリーム生成部２４は、符号化され
たデータを用いて所定のビットストリームを生成する。

【０００４】

【発明が解決しようとする課題】量子化部２０における
量子化の分解能は、例えば２ビット、３ビット、４ビッ
ト、５ビット、６ビット、７ビットとビット単位に設定
されるため、その分解能の間隔は約２倍となる。そのた
め、量子化ビット数を１ビット減らすことは、分解能を
半分にすることに相当する。もともと量子化ビット数
は、必要な音質を得るように設定されるものであるた
め、その量子化ビット数を減らすと、十分な音質を確保
できないことが多い。

【０００５】符号化部２２は、量子化されたデータを可
変長符号化するが、この方式によると、符号化により得
られるビット量（以下「符号量」ともいう）が、全体と
して又はサブバンドごとに設定された所定のビット数
（以下「許容値」ともいう）に収まる場合もあるが、符
号量がいくつになるのかは量子化後、符号量を算出する
まで分からないため、量子化の結果、符号量が許容値を
超える事態も生じうる。このような場合、従来は、ある
サブバンドに割り当てていた量子化ビット数を減らして
再量子化することにより、再符号化による符号量を許容
値に収めるように対応している。例えば、あるサブバン
ドに４ビットの量子化ビットを割り当てている場合に
は、この量子化ビット数を３ビットに減らす処理を行
う。これでも符号量が許容値に収まらない場合には、こ
のサブバンドに替えて、効率よく符号量を減らすことの
できるサブバンドを選択してその量子化ビット数を減ら
すか、またはこのサブバンドに追加してさらに別のサブ
バンドに割り当てていた量子化ビット数を減らすことに
なる。

【０００６】さらなる高圧縮率および高音質が要求され
る現在、音質を劣化させる従来の圧縮技術は時代のニー
ズに即していない。そのため、符号量が許容値を超える
場合であっても状況に応じて適切な再量子化および再符
号化を実現できる圧縮技術の開発が望まれている。そこ
で、本発明は、上記の課題を解決することのできる音声
圧縮方法および音声圧縮装置を提供することを目的とす
る。

【０００７】

【課題を解決するための手段】上記課題を解決するため
に、本発明の一つの態様は、音声信号を複数のサブバン
ドに分割し、サブバンドごとに量子化を施した後、可変
長符号化する方法において、前記可変長符号化で得られ
る符号量が許容値を超えないように、少なくとも一つの
サブバンドについて、そのサブバンドに割り当てる量子
化ビット数の調整と、量子化におけるスケールファクタ
の調整を選択して実施する音声圧縮方法を提供する。こ
の態様の音声圧縮方法によると、状況に応じて量子化の
調整方法を選択することが可能となり、またスケールフ
ァクタの調整を選択した場合には、量子化分解能の微調
整が可能となる。音声信号は、楽音や声などの音信号を
意味する。

【０００８】本発明の別の態様は、音声信号を複数のサ
ブバンドに分割して、サブバンドごとにスペクトラム信
号成分を出力する分割部と、サブバンドごとにスケール
ファクタを定めるスケーリング部と、サブバンドごとに
量子化ビットの割当数を定めるビット割当部と、スケー
ルファクタおよび量子化ビット数に基づいて、各サブバ
ンドのスペクトラム信号成分を量子化する量子化部と、
量子化されたデータを可変長符号化する符号化部と、前
記可変長符号化部で得られる符号量が許容値を超えない
ように、少なくとも一つのサブバンドについて、そのサ
ブバンドに割り当てる量子化ビット数の調整と、スケー
ルファクタの調整のいずれかを選択して、前記ビット割
当部または前記スケーリング部に対して、調整について
の指示を行う量子化調整部とを備えた音声圧縮装置を提
供する。この態様の音声圧縮装置によると、状況に応じ
て量子化の調整方法を選択することが可能となり、また
スケールファクタの調整を選択した場合には、量子化分
解能の微調整が可能となる。

【０００９】前記量子化調整部は、前記スケールファク
タの調整によって前記符号量が前記許容値に収まる場
合、前記量子化ビット数の調整をせずに前記スケールフ
ァクタを調整するようスケーリング部に指示してもよ
い。また、前記スケールファクタの当初の値をＳＦと表
現し、スケールファクタの調整後の値をＡＳＦと表現す
るとき、前記量子化調整部は、１＜ＡＳＦ／ＳＦ＜２な
る関係を満たすようスケールファクタの調整を指示して
もよい。さらに前記量子化調整部は、前記可変長符号化
の結果生成される符号化データに内在する量子化誤差が
少なくなるよう前記量子化ビット数の調整と前記スケー
ルファクタの調整のいずれかを選択してもよい。

【００１０】本発明のさらに別の態様は、音声信号を複
数のサブバンドに分割して、サブバンドごとにスペクト
ラム信号成分を出力する分割部と、サブバンドごとにス
ケールファクタを定めるスケーリング部と、サブバンド
ごとに量子化ビットの割当数を定めるビット割当部と、
スケールファクタおよび量子化ビット数に基づいて、各
サブバンドのスペクトラム信号成分を量子化する量子化
部と、量子化されたデータを可変長符号化する符号化部
と、前記可変長符号化部で得られる符号量が許容値を超
えないように、少なくとも一つのサブバンドについて、
スケールファクタの調整を前記スケーリング部に対して
指示する量子化調整部とを備えた音声圧縮装置を提供す
る。この態様の音声圧縮装置によると、スケールファク
タの調整により再量子化を行うため、量子化分解能の微
調整が可能となる。

【００１１】なお、以上の構成要素の任意の組合せ、本
発明の表現を方法、装置、システム、記録媒体などの間
で変換したものもまた、本発明の態様として有効であ
る。

【００１２】

【発明の実施の形態】図２は、本発明の実施の形態に係
る音声圧縮装置１００の構成を示す。この音声圧縮装置
１００は、サブバンド分割部１１２、スケーリング部１
１４、聴覚心理分析部１１６、ビット割当部１１８、量
子化部１２０、符号化部１２２、ビットストリーム生成
部１２４および量子化調整部１３０を備える。音声圧縮
装置１００は、ハードウエアコンポーネントでいえば、
任意のオーディオ装置のＣＰＵ、メモリ、メモリにロー
ドされたプログラムなどによって実現されるが、ここで
はそれらの連携によって実現される機能ブロックを描い
ている。音声圧縮装置１００の機能の全部または一部
は、ＬＳＩ化されてもよい。したがって、これらの機能
ブロックがハードウエアのみ、ソフトウエアのみ、また
はそれらの組合せによっていろいろな形で実現できるこ
とは、当業者には理解されるところである。

【００１３】音声信号が音声圧縮装置１００に供給され
ると、サブバンド分割部１１２が、音声信号を時間−周
波数変換して複数のサブバンドに分割し、サブバンドご
とにスペクトラム信号成分を出力する。音声信号は、デ
ジタル化された時系列信号であり、ＣＤによる音声信号
は、４４．１ｋＨｚで１６ビットの量子化ビット数をも
つリニアＰＣＭである。例えばサブバンド分割部１１２
は、１６ビットの信号１０２４個を時間−周波数変換し
てスペクトラム信号を生成し、このスペクトラム信号を
所定の帯域が割り当てられた３２個のサブバンドに分割
する。サブバンド分割部１１２は、複数の帯域分割フィ
ルタなどから構成されている。

【００１４】スケーリング部１１４は、サブバンド分割
部１１２より送られてきたスペクトラム信号成分をスケ
ーリングし、サブバンドごとにスケールファクタを算出
して定める。具体的にスケーリング部１１４は、サブバ
ンドごとにスペクトラム信号成分の最大振幅値を検出
し、この最大振幅値以上であって且つ最もこの最大振幅
値に近いスケールファクタを算出する。このスケールフ
ァクタは、復号時に音声データをもとの波形に戻すため
の正規化時の倍率に応じた値であり、量子化データがと
りうる範囲を示す。スケーリング部１１４は、このスケ
ールファクタをビット割当部１１８および量子化部１２
０に供給する。

【００１５】聴覚心理分析部１１６は、聴覚心理モデル
を用いて人間の耳に感知できないようなマスキング曲線
を算出する。人間の耳は、周波数に応じて可聴レベルに
限界があり（最小可聴限界）、またさらに高レベルのス
ペクトラム信号成分付近の信号も聞こえにくくなる（マ
スキング効果）。このような人間の聴覚特性を用いて、
聴覚心理分析部１１６は、最小可聴限界およびマスキン
グ効果により聴覚マスキングの限界値を示すマスキング
スレッショルドを求めてマスキング曲線を算出し、ビッ
ト割当部１１８に供給する。

【００１６】ビット割当部１１８は、このマスキング曲
線（マスキングスレッショルド）やスケールファクタを
用いて、サブバンドごとに量子化ビットの割当数を定め
る。ビット割当部１１８は、量子化ノイズのレベルがマ
スキングスレッショルドよりも小さくなるように量子化
ステップを定める。これにより、量子化ノイズによる音
質劣化を防止することが可能となる。スペクトラム周波
数成分がマスキングスレッショルドよりも小さいサブバ
ンドに対しては、ビット割当部１１８は、割り当てる量
子化ビット数を０とする。

【００１７】量子化部１２０は、スケールファクタおよ
び量子化ビット数に基づいて、各サブバンドのスペクト
ラム信号成分を量子化する。符号化部１２２は、この量
子化されたデータをハフマン符号化技術などを用いて可
変長符号化する。以下の表に、３ビットで量子化したデ
ータを符号化するためのハフマン符号の一例を示す。

【００１８】

【表１】

【００１９】このようにハフマン符号は、量子化データ
の絶対値が小さいほど短い符号長を有する傾向がある。
したがって、量子化データが小さいほど、符号化により
得られる符号量は少なくなる。そのため、特に量子化デ
ータ「０」の数が多い場合には、符号量を格段に減らす
ことが可能となり、可変長符号化のメリットが最大限に
発揮されることとなる。しかしながら、場合によっては
符号化部１２２における符号化の結果得られる符号量
が、全体として又はサブバンドごとに設定されたビット
数（許容値）を超えることがある。符号化部１２２は、
量子化データの符号化を行う前に、この符号量を算出し
てもよい。

【００２０】量子化調整部１３０は、符号量の値を符号
化部１２２から受け取り、この符号量が許容値を超えて
いるか否かを判断する。量子化調整部１３０は、この判
断結果に基づき、再量子化の必要性の有無を決定する。
必要のない場合には、符号化部１２２に符号化処理を進
めるように指示してもよい。この実施の形態において、
量子化調整部１３０は、再量子化の方法について少なく
とも２つの選択肢をもつ。１つは、従来と同様にサブバ
ンドに割り当てる量子化ビット数を調整する方法であ
り、２つめは、スケールファクタを調整する方法であ
る。このうち、後者のスケールファクタを調整する方法
は、量子化分解能を微調整することを可能とする。な
お、３つめの選択肢として、量子化ビット数を調整する
方法とスケールファクタを調整する方法とを併用するこ
とも可能である。

【００２１】２つめの選択肢において、最初に設定した
スケールファクタを大きくするように調整することによ
り、調整後の量子化データは調整前の量子化データ以下
の値をとることとなる。具体的にいうと、調整前のスケ
ールファクタが８であり、調整後のスケールファクタが
１０である場合に、調整後の量子化データは、調整前の
量子化データの４／５倍となる。実際には、量子化デー
タは整数値をとるため、調整前の量子化データに単純に
４／５を乗算して量子化データを求めることはできない
が、複数のスペクトラム信号のいくつかはその量子化デ
ータを小さくする。＜表１＞に示したようにハフマン符
号は、小さい量子化データに対してその符号長を短くす
る性質をもつため、量子化データを小さくすることによ
って、符号量を少なくすることが可能となる。特に、０
に収束する量子化データの数が増える場合には、符号量
が大幅に減ることになる。

【００２２】量子化調整部１３０は、可変長の符号化部
１２２で得られる符号量が許容値を超えないように、少
なくとも一つのサブバンドについて、そのサブバンドに
割り当てる量子化ビット数の調整と、スケールファクタ
の調整のいずれかを選択して、ビット割当部１１８また
はスケーリング部１１４に対して、調整についての指示
を行う。具体的には、量子化ビット数の調整を行う場合
にはビット割当部１１８に対して調整指示を行い、スケ
ールファクタの調整を行う場合にはスケーリング部１１
４に対して調整指示を行う。

【００２３】量子化調整部１３０は、スケールファクタ
の調整によって符号量が許容値に収まる場合には、量子
化ビット数の調整をせずに、スケールファクタを調整す
るようスケーリング部１１４に指示することが好まし
い。量子化ビット数を調整すると、そのサブバンドの量
子化分解能が約１／２となる。一方、スケールファクタ
を調整すると、量子化分解能を１／２よりも下げること
なく微調整することができるため、量子化ビットの調整
を行うよりも木目細かな量子化、符号化を行うことがで
き、十分な再生音質を確保することが可能となる。この
微調整は、隣り合うスケールファクタの比が２倍以下で
あることを利用したものである。

【００２４】量子化分解能でみると、スケールファクタ
を２倍の大きさにすることは、量子化ビット数を１ビッ
ト減らすことと実質的に等しい。したがって、スケール
ファクタの当初の値をＳＦと表現し、スケールファクタ
の調整後の値をＡＳＦと表現するとき、量子化調整部１
３０は、１＜ＡＳＦ／ＳＦ＜２なる関係を満たすようス
ケールファクタの調整をスケーリング部１１４に指示す
ることが好ましい。この関係を満たす限りにおいて、ス
ケールファクタを調整した場合のほうが、量子化ビット
数を減らす場合よりも高音質を確保することが可能とな
る。逆に、この関係を満たさない場合には、量子化ビッ
ト数を調整してみるか、または量子化ビット数の調整と
スケールファクタの調整を併用して、符号量を少なくす
る。

【００２５】以上のようにして、符号量が許容値に収ま
るまで、スペクトラム信号成分は量子化、符号化され、
ビットストリーム生成部１２４が、量子化符号化された
データをビットストリームに生成して、録音用の記録媒
体などに供給する。

【００２６】図３は、量子化ビット数の調整とスケール
ファクタの調整を行った場合の量子化および符号化の結
果比較例を示す。この例では、１つのサブバンドにおけ
る１６個のスペクトラム信号を量子化符号化している。
図３（ａ）は、この１６個のスペクトラム信号の振幅を
示す。

【００２７】図３（ｂ）は、スケールファクタが８、量
子化ビット数が４ビットの場合の量子化データ、量子化
誤差およびハフマン符号長を示す。ハフマン符号長は、
量子化データにより一意に定められる。前掲した＜表１
＞を参照して、この表は３ビットの量子化データについ
てのものであるが、ハフマン符号長が量子化データによ
り一意に定められる様子が示されている。符号量は、こ
のスペクトラム信号成分を量子化して符号化したときの
ビット量であり、各量子化データに対するハフマン符号
のビット数を加算することによって求められる。この場
合、符号量は５２であり、量子化誤差の合計は５．４７
である。このサブバンドに対する符号量の許容値が５０
であるとすると、符号量５２はこの許容値を超えている
ため、スケールファクタが８、量子化ビット数が４ビッ
トの量子化条件を採用することはできない。この状況の
もと、量子化ビット数を調整した例と、スケールファク
タの調整を行った例について以下に示す。

【００２８】図３（ｃ）は、スケールファクタが８、量
子化ビット数が３ビットの場合の量子化データ、量子化
誤差およびハフマン符号長を示す。量子化ビット数を調
整した例であり、このとき、符号量は３７、量子化誤差
の合計は７．９４となる。

【００２９】図３（ｄ）は、スケールファクタが１０、
量子化ビット数が４ビットの場合の量子化データ、量子
化誤差およびハフマン符号長を示す。スケールファクタ
を調整した例であり、このとき、符号量は４９、量子化
誤差の合計は５．５３となる。以下に、この結果をまと
める。

【００３０】

【表２】（量子化条件）（符号量）（量子化誤差合計）ｂ）スケールファクタ８、量子化ビット数４５２５．４７ｃ）スケールファクタ８、量子化ビット数３３７７．９４ｄ）スケールファクタ１０、量子化ビット数４４９５．５３

【００３１】この例では、符号量の許容値が５０である
ため、ｄ）スケールファクタ１０、量子化ビット数４で
の量子化符号化は、この許容値の条件を満足する。さら
に、ｃ）スケールファクタ８、量子化ビット数３での量
子化符号化と比較すると、量子化誤差合計値において、
ｄ）の量子化符号化はｃ）の量子化符号化よりも優れて
いる。量子化誤差は、原音との違いを表現するためデー
タであるため、ｄ）の量子化符号化は、ｃ）の量子化符
号化よりも好ましいことが分かる。図２の量子化調整部
１３０は、可変長符号化の結果生成される符号化データ
に内在する量子化誤差が少なくなるよう量子化ビット数
の調整とスケールファクタの調整のいずれかを選択して
もよい。量子化誤差を選択の基準とすることで、高音質
の量子化符号化を行うことが可能となる。

【００３２】図４は、実施の形態に係る音声圧縮方法の
フローチャートを示す。まず、デジタル音声信号を複数
のサブバンドに分割する（Ｓ１０）。続いて、サブバン
ドごとにスケールファクタを決定し（Ｓ１２）、量子化
ビット数を決定する（Ｓ１４）。このスケールファクタ
および量子化ビット数を用いて、サブバンドのスペクト
ラム信号の量子化符号化を行う（Ｓ１６）。

【００３３】それから、符号化データの符号量を算出し
て、その符号量が許容値を超えるか否かを判断する（Ｓ
１８）。超えている場合には（Ｓ１８のＹ）、少なくと
も一つのサブバンドについて、量子化ビット数の調整を
行うか、スケールファクタの調整を行うかの選択を行う
（Ｓ２０）。スケールファクタの調整を選択する場合に
は（Ｓ２０のＡ）、Ｓ１２に戻って、スケールファクタ
を大きくするような調整を行う。一方、量子化ビット数
の調整を行う場合には（Ｓ２０のＢ）、Ｓ１４に戻っ
て、量子化ビット数を減らすような調整を行う。Ｓ１８
において符号量が許容値に収まるまでこのステップは繰
り返される。符号量が許容値に収まった場合には（Ｓ１
８のＮ）、符号化データを用いてビットストリームを生
成し（Ｓ２２）、このフローを終了する。

【００３４】以上、本発明をいくつかの実施の形態をも
とに説明した。これらの実施の形態は例示であり、それ
らの各構成要素や各処理プロセスの組合せにいろいろな
変形例が可能なこと、またそうした変形例も本発明の範
囲にあることは当業者に理解されるところである。例え
ば、実施の形態においては、符号量を算出して求めてい
るが、変形例では符号量の許容値などの条件により、統
計的な法則を用いて自動的に量子化、符号化条件を決定
してもよい。また、スケールファクタを、聴覚心理分析
の結果をもとに決定してもよい。

【００３５】さらに、スケールファクタの調整を選択す
る基準として、ＭＮＲ（マスキングスレッショルド−ノ
イズ比）を利用してもよい。ＭＮＲは、ある音を聴いた
ときに人間がノイズとして認識する量の逆数を表してお
り、一般には各サブバンドのＭＮＲの総和を最大とする
ことが、最適な量子化ビットを割り当てる方法の一つと
いえる。割当てビット数を減らすことによりＭＮＲが目
標値に到達しなくなる場合には、スケールファクタの調
整により量子化および符号化の微調整を行うことが好ま
しい。例えば、割当てビット数を５ビットとした場合に
はＭＮＲが目標値よりも大きいが、割当ビット数を減ら
して４ビットとした場合にＭＮＲが目標値よりも小さく
なるとき、このときはスケールファクタを２倍以内で大
きくすることによって、高音質を確保しながら符号量を
許容値に収めることが可能となる。

【００３６】

【発明の効果】本発明によると、高音質を確保しながら
適切な量子化、符号化を行う音声圧縮技術を提供するこ
とができる。

【図面の簡単な説明】

【図１】従来の音声圧縮装置の構成を示す図である。

【図２】実施の形態に係る音声圧縮装置の構成を示す
図である。

【図３】（ａ）は１６個のスペクトラム信号の振幅を
示す図であり、（ｂ）はスケールファクタが８、量子化
ビット数が４ビットの場合の量子化データ、量子化誤差
およびハフマン符号長を示す図であり、（ｃ）はスケー
ルファクタが８、量子化ビット数が３ビットの場合の量
子化データ、量子化誤差およびハフマン符号長を示す図
であり、（ｄ）はスケールファクタが１０、量子化ビッ
ト数が４ビットの場合の量子化データ、量子化誤差およ
びハフマン符号長を示す図である。

【図４】実施の形態に係る音声圧縮方法のフローチャ
ートである。

【符号の説明】

１００・・・音声圧縮装置、１１２・・・サブバンド分
割部、１１４・・・スケーリング部、１１８・・・ビッ
ト割当部、１２０・・・量子化部、１２２・・・符号化
部、１３０・・・量子化調整部。

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 5D045 DA20 5J064 AA00 BA09 BA16 BC01 BC02 BC11 BC16 BC17 BD03

Claims

【特許請求の範囲】

【請求項１】音声信号を複数のサブバンドに分割し、
サブバンドごとに量子化を施した後、可変長符号化する
方法において、前記可変長符号化で得られる符号量が許容値を超えない
ように、少なくとも一つのサブバンドについて、そのサ
ブバンドに割り当てる量子化ビット数の調整と、量子化
におけるスケールファクタの調整を選択して実施するこ
とを特徴とする音声圧縮方法。
【請求項２】音声信号を複数のサブバンドに分割し
て、サブバンドごとにスペクトラム信号成分を出力する
分割部と、サブバンドごとにスケールファクタを定めるスケーリン
グ部と、サブバンドごとに量子化ビットの割当数を定めるビット
割当部と、スケールファクタおよび量子化ビット数に基づいて、各
サブバンドのスペクトラム信号成分を量子化する量子化
部と、量子化されたデータを可変長符号化する符号化部と、前記可変長符号化部で得られる符号量が許容値を超えな
いように、少なくとも一つのサブバンドについて、その
サブバンドに割り当てる量子化ビット数の調整と、スケ
ールファクタの調整のいずれかを選択して、前記ビット
割当部または前記スケーリング部に対して、調整につい
ての指示を行う量子化調整部とを備えたことを特徴とす
る音声圧縮装置。
【請求項３】前記量子化調整部は、前記スケールファ
クタの調整によって前記符号量が前記許容値に収まる場
合、前記量子化ビット数の調整をせずに前記スケールフ
ァクタを調整するよう指示することを特徴とする請求項
２に記載の装置。
【請求項４】前記スケールファクタの当初の値をＳＦ
と表現し、スケールファクタの調整後の値をＡＳＦと表
現するとき、前記量子化調整部は、１＜ＡＳＦ／ＳＦ＜
２なる関係を満たすようスケールファクタの調整を指示
することを特徴とする請求項２または３に記載の装置。
【請求項５】前記量子化調整部は、前記可変長符号化
の結果生成される符号化データに内在する量子化誤差が
少なくなるよう前記量子化ビット数の調整と前記スケー
ルファクタの調整のいずれかを選択することを特徴とす
る請求項２から４のいずれかに記載の装置。
【請求項６】音声信号を複数のサブバンドに分割し
て、サブバンドごとにスペクトラム信号成分を出力する
分割部と、サブバンドごとにスケールファクタを定めるスケーリン
グ部と、サブバンドごとに量子化ビットの割当数を定めるビット
割当部と、スケールファクタおよび量子化ビット数に基づいて、各
サブバンドのスペクトラム信号成分を量子化する量子化
部と、量子化されたデータを可変長符号化する符号化部と、前記可変長符号化部で得られる符号量が許容値を超えな
いように、少なくとも一つのサブバンドについて、スケ
ールファクタの調整を前記スケーリング部に対して指示
する量子化調整部とを備えたことを特徴とする音声圧縮
装置。