JP2003280695A - 音声圧縮方法および音声圧縮装置 - Google Patents

音声圧縮方法および音声圧縮装置

Info

Publication number
JP2003280695A
JP2003280695A JP2002077208A JP2002077208A JP2003280695A JP 2003280695 A JP2003280695 A JP 2003280695A JP 2002077208 A JP2002077208 A JP 2002077208A JP 2002077208 A JP2002077208 A JP 2002077208A JP 2003280695 A JP2003280695 A JP 2003280695A
Authority
JP
Japan
Prior art keywords
quantization
scale factor
unit
subband
adjustment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002077208A
Other languages
English (en)
Inventor
Tatsufumi Oyama
達史 大山
Hideki Yamauchi
英樹 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2002077208A priority Critical patent/JP2003280695A/ja
Publication of JP2003280695A publication Critical patent/JP2003280695A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 高音質を確保しながら適切な量子化、符号化
を行う音声圧縮技術を提供する。 【解決手段】 サブバンドのスペクトラム信号成分を量
子化、符号化して得られる符号化データの符号量(ビッ
ト量)が許容値を超える場合、量子化調整部130が、
量子化ビット数の調整を行うか、スケールファクタの調
整を行うかの選択を行う。スケールファクタの調整にあ
たっては、スケールファクタの値を若干大きくし、その
結果、量子化データを小さくすることによって、可変長
符号化により符号量を少なくすることができ、また量子
化ビット数の調整を行わなくてすむため、十分な高音質
を維持することが可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を圧縮す
る方法および装置に関する。
【0002】
【従来の技術】近年、デジタル音声信号を高圧縮率で符
号化する研究開発が盛んに行われており、その適用分野
も拡大している。特に、ポータブル型音声再生装置の普
及に伴い、例えばCD(コンパクトディスク)に記録さ
れたリニアPCM信号を、小型の半導体メモリやミニデ
ィスクなどの記録媒体に圧縮して記録することが一般化
している。また、情報が氾濫する現代においてデータ圧
縮技術は不可欠なものであり、HD(ハードディスク)
やCD−R、DVDなどの大容量記録媒体であっても、
圧縮したデータを記録して記録容量を少なくすることが
望ましい。この圧縮符号化は、人間の聴覚特性を利用し
た不要な信号の選別や、量子化ビット数の割当ての最適
化、さらにはハフマン符号化など様々な技術を駆使する
ことにより行われる。高音質且つ高圧縮率の音声信号圧
縮手法は、本分野の最重要課題として日々研究されてい
る。
【0003】図1は、従来の音声圧縮装置10の構成を
示す。サブバンド分割部12は、デジタル音声信号を時
間−周波数変換して、複数の周波数帯域(サブバンド)
に分割する。スケーリング部14は、それぞれのサブバ
ンドごとに最大振幅値を検出し、この最大振幅値以上で
あって且つ最もこの最大振幅値に近いスケールファクタ
を算出する。スケールファクタのとりうる値は音声圧縮
装置10において設定されるが、一般には隣接するスケ
ールファクタ値の比が2倍以下に設定されている。算出
した時点でこのスケールファクタは一意に決められ、そ
の後の再量子化の際にも変化することはない。一方、聴
覚心理分析部16は、デジタル音声信号に対して聴覚心
理分析を行い、ビット割当部18がその分析結果を受け
て、各サブバンドごとに量子化ビット数を割り当てる。
量子化部20が、スケールファクタおよび量子化ビット
数を用いて、各サブバンドのスペクトラム信号成分を量
子化し、符号化部22が量子化されたデータを可変長符
号化する。ビットストリーム生成部24は、符号化され
たデータを用いて所定のビットストリームを生成する。
【0004】
【発明が解決しようとする課題】量子化部20における
量子化の分解能は、例えば2ビット、3ビット、4ビッ
ト、5ビット、6ビット、7ビットとビット単位に設定
されるため、その分解能の間隔は約2倍となる。そのた
め、量子化ビット数を1ビット減らすことは、分解能を
半分にすることに相当する。もともと量子化ビット数
は、必要な音質を得るように設定されるものであるた
め、その量子化ビット数を減らすと、十分な音質を確保
できないことが多い。
【0005】符号化部22は、量子化されたデータを可
変長符号化するが、この方式によると、符号化により得
られるビット量(以下「符号量」ともいう)が、全体と
して又はサブバンドごとに設定された所定のビット数
(以下「許容値」ともいう)に収まる場合もあるが、符
号量がいくつになるのかは量子化後、符号量を算出する
まで分からないため、量子化の結果、符号量が許容値を
超える事態も生じうる。このような場合、従来は、ある
サブバンドに割り当てていた量子化ビット数を減らして
再量子化することにより、再符号化による符号量を許容
値に収めるように対応している。例えば、あるサブバン
ドに4ビットの量子化ビットを割り当てている場合に
は、この量子化ビット数を3ビットに減らす処理を行
う。これでも符号量が許容値に収まらない場合には、こ
のサブバンドに替えて、効率よく符号量を減らすことの
できるサブバンドを選択してその量子化ビット数を減ら
すか、またはこのサブバンドに追加してさらに別のサブ
バンドに割り当てていた量子化ビット数を減らすことに
なる。
【0006】さらなる高圧縮率および高音質が要求され
る現在、音質を劣化させる従来の圧縮技術は時代のニー
ズに即していない。そのため、符号量が許容値を超える
場合であっても状況に応じて適切な再量子化および再符
号化を実現できる圧縮技術の開発が望まれている。そこ
で、本発明は、上記の課題を解決することのできる音声
圧縮方法および音声圧縮装置を提供することを目的とす
る。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明の一つの態様は、音声信号を複数のサブバン
ドに分割し、サブバンドごとに量子化を施した後、可変
長符号化する方法において、前記可変長符号化で得られ
る符号量が許容値を超えないように、少なくとも一つの
サブバンドについて、そのサブバンドに割り当てる量子
化ビット数の調整と、量子化におけるスケールファクタ
の調整を選択して実施する音声圧縮方法を提供する。こ
の態様の音声圧縮方法によると、状況に応じて量子化の
調整方法を選択することが可能となり、またスケールフ
ァクタの調整を選択した場合には、量子化分解能の微調
整が可能となる。音声信号は、楽音や声などの音信号を
意味する。
【0008】本発明の別の態様は、音声信号を複数のサ
ブバンドに分割して、サブバンドごとにスペクトラム信
号成分を出力する分割部と、サブバンドごとにスケール
ファクタを定めるスケーリング部と、サブバンドごとに
量子化ビットの割当数を定めるビット割当部と、スケー
ルファクタおよび量子化ビット数に基づいて、各サブバ
ンドのスペクトラム信号成分を量子化する量子化部と、
量子化されたデータを可変長符号化する符号化部と、前
記可変長符号化部で得られる符号量が許容値を超えない
ように、少なくとも一つのサブバンドについて、そのサ
ブバンドに割り当てる量子化ビット数の調整と、スケー
ルファクタの調整のいずれかを選択して、前記ビット割
当部または前記スケーリング部に対して、調整について
の指示を行う量子化調整部とを備えた音声圧縮装置を提
供する。この態様の音声圧縮装置によると、状況に応じ
て量子化の調整方法を選択することが可能となり、また
スケールファクタの調整を選択した場合には、量子化分
解能の微調整が可能となる。
【0009】前記量子化調整部は、前記スケールファク
タの調整によって前記符号量が前記許容値に収まる場
合、前記量子化ビット数の調整をせずに前記スケールフ
ァクタを調整するようスケーリング部に指示してもよ
い。また、前記スケールファクタの当初の値をSFと表
現し、スケールファクタの調整後の値をASFと表現す
るとき、前記量子化調整部は、1<ASF/SF<2な
る関係を満たすようスケールファクタの調整を指示して
もよい。さらに前記量子化調整部は、前記可変長符号化
の結果生成される符号化データに内在する量子化誤差が
少なくなるよう前記量子化ビット数の調整と前記スケー
ルファクタの調整のいずれかを選択してもよい。
【0010】本発明のさらに別の態様は、音声信号を複
数のサブバンドに分割して、サブバンドごとにスペクト
ラム信号成分を出力する分割部と、サブバンドごとにス
ケールファクタを定めるスケーリング部と、サブバンド
ごとに量子化ビットの割当数を定めるビット割当部と、
スケールファクタおよび量子化ビット数に基づいて、各
サブバンドのスペクトラム信号成分を量子化する量子化
部と、量子化されたデータを可変長符号化する符号化部
と、前記可変長符号化部で得られる符号量が許容値を超
えないように、少なくとも一つのサブバンドについて、
スケールファクタの調整を前記スケーリング部に対して
指示する量子化調整部とを備えた音声圧縮装置を提供す
る。この態様の音声圧縮装置によると、スケールファク
タの調整により再量子化を行うため、量子化分解能の微
調整が可能となる。
【0011】なお、以上の構成要素の任意の組合せ、本
発明の表現を方法、装置、システム、記録媒体などの間
で変換したものもまた、本発明の態様として有効であ
る。
【0012】
【発明の実施の形態】図2は、本発明の実施の形態に係
る音声圧縮装置100の構成を示す。この音声圧縮装置
100は、サブバンド分割部112、スケーリング部1
14、聴覚心理分析部116、ビット割当部118、量
子化部120、符号化部122、ビットストリーム生成
部124および量子化調整部130を備える。音声圧縮
装置100は、ハードウエアコンポーネントでいえば、
任意のオーディオ装置のCPU、メモリ、メモリにロー
ドされたプログラムなどによって実現されるが、ここで
はそれらの連携によって実現される機能ブロックを描い
ている。音声圧縮装置100の機能の全部または一部
は、LSI化されてもよい。したがって、これらの機能
ブロックがハードウエアのみ、ソフトウエアのみ、また
はそれらの組合せによっていろいろな形で実現できるこ
とは、当業者には理解されるところである。
【0013】音声信号が音声圧縮装置100に供給され
ると、サブバンド分割部112が、音声信号を時間−周
波数変換して複数のサブバンドに分割し、サブバンドご
とにスペクトラム信号成分を出力する。音声信号は、デ
ジタル化された時系列信号であり、CDによる音声信号
は、44.1kHzで16ビットの量子化ビット数をも
つリニアPCMである。例えばサブバンド分割部112
は、16ビットの信号1024個を時間−周波数変換し
てスペクトラム信号を生成し、このスペクトラム信号を
所定の帯域が割り当てられた32個のサブバンドに分割
する。サブバンド分割部112は、複数の帯域分割フィ
ルタなどから構成されている。
【0014】スケーリング部114は、サブバンド分割
部112より送られてきたスペクトラム信号成分をスケ
ーリングし、サブバンドごとにスケールファクタを算出
して定める。具体的にスケーリング部114は、サブバ
ンドごとにスペクトラム信号成分の最大振幅値を検出
し、この最大振幅値以上であって且つ最もこの最大振幅
値に近いスケールファクタを算出する。このスケールフ
ァクタは、復号時に音声データをもとの波形に戻すため
の正規化時の倍率に応じた値であり、量子化データがと
りうる範囲を示す。スケーリング部114は、このスケ
ールファクタをビット割当部118および量子化部12
0に供給する。
【0015】聴覚心理分析部116は、聴覚心理モデル
を用いて人間の耳に感知できないようなマスキング曲線
を算出する。人間の耳は、周波数に応じて可聴レベルに
限界があり(最小可聴限界)、またさらに高レベルのス
ペクトラム信号成分付近の信号も聞こえにくくなる(マ
スキング効果)。このような人間の聴覚特性を用いて、
聴覚心理分析部116は、最小可聴限界およびマスキン
グ効果により聴覚マスキングの限界値を示すマスキング
スレッショルドを求めてマスキング曲線を算出し、ビッ
ト割当部118に供給する。
【0016】ビット割当部118は、このマスキング曲
線(マスキングスレッショルド)やスケールファクタを
用いて、サブバンドごとに量子化ビットの割当数を定め
る。ビット割当部118は、量子化ノイズのレベルがマ
スキングスレッショルドよりも小さくなるように量子化
ステップを定める。これにより、量子化ノイズによる音
質劣化を防止することが可能となる。スペクトラム周波
数成分がマスキングスレッショルドよりも小さいサブバ
ンドに対しては、ビット割当部118は、割り当てる量
子化ビット数を0とする。
【0017】量子化部120は、スケールファクタおよ
び量子化ビット数に基づいて、各サブバンドのスペクト
ラム信号成分を量子化する。符号化部122は、この量
子化されたデータをハフマン符号化技術などを用いて可
変長符号化する。以下の表に、3ビットで量子化したデ
ータを符号化するためのハフマン符号の一例を示す。
【0018】
【表1】
【0019】このようにハフマン符号は、量子化データ
の絶対値が小さいほど短い符号長を有する傾向がある。
したがって、量子化データが小さいほど、符号化により
得られる符号量は少なくなる。そのため、特に量子化デ
ータ「0」の数が多い場合には、符号量を格段に減らす
ことが可能となり、可変長符号化のメリットが最大限に
発揮されることとなる。しかしながら、場合によっては
符号化部122における符号化の結果得られる符号量
が、全体として又はサブバンドごとに設定されたビット
数(許容値)を超えることがある。符号化部122は、
量子化データの符号化を行う前に、この符号量を算出し
てもよい。
【0020】量子化調整部130は、符号量の値を符号
化部122から受け取り、この符号量が許容値を超えて
いるか否かを判断する。量子化調整部130は、この判
断結果に基づき、再量子化の必要性の有無を決定する。
必要のない場合には、符号化部122に符号化処理を進
めるように指示してもよい。この実施の形態において、
量子化調整部130は、再量子化の方法について少なく
とも2つの選択肢をもつ。1つは、従来と同様にサブバ
ンドに割り当てる量子化ビット数を調整する方法であ
り、2つめは、スケールファクタを調整する方法であ
る。このうち、後者のスケールファクタを調整する方法
は、量子化分解能を微調整することを可能とする。な
お、3つめの選択肢として、量子化ビット数を調整する
方法とスケールファクタを調整する方法とを併用するこ
とも可能である。
【0021】2つめの選択肢において、最初に設定した
スケールファクタを大きくするように調整することによ
り、調整後の量子化データは調整前の量子化データ以下
の値をとることとなる。具体的にいうと、調整前のスケ
ールファクタが8であり、調整後のスケールファクタが
10である場合に、調整後の量子化データは、調整前の
量子化データの4/5倍となる。実際には、量子化デー
タは整数値をとるため、調整前の量子化データに単純に
4/5を乗算して量子化データを求めることはできない
が、複数のスペクトラム信号のいくつかはその量子化デ
ータを小さくする。<表1>に示したようにハフマン符
号は、小さい量子化データに対してその符号長を短くす
る性質をもつため、量子化データを小さくすることによ
って、符号量を少なくすることが可能となる。特に、0
に収束する量子化データの数が増える場合には、符号量
が大幅に減ることになる。
【0022】量子化調整部130は、可変長の符号化部
122で得られる符号量が許容値を超えないように、少
なくとも一つのサブバンドについて、そのサブバンドに
割り当てる量子化ビット数の調整と、スケールファクタ
の調整のいずれかを選択して、ビット割当部118また
はスケーリング部114に対して、調整についての指示
を行う。具体的には、量子化ビット数の調整を行う場合
にはビット割当部118に対して調整指示を行い、スケ
ールファクタの調整を行う場合にはスケーリング部11
4に対して調整指示を行う。
【0023】量子化調整部130は、スケールファクタ
の調整によって符号量が許容値に収まる場合には、量子
化ビット数の調整をせずに、スケールファクタを調整す
るようスケーリング部114に指示することが好まし
い。量子化ビット数を調整すると、そのサブバンドの量
子化分解能が約1/2となる。一方、スケールファクタ
を調整すると、量子化分解能を1/2よりも下げること
なく微調整することができるため、量子化ビットの調整
を行うよりも木目細かな量子化、符号化を行うことがで
き、十分な再生音質を確保することが可能となる。この
微調整は、隣り合うスケールファクタの比が2倍以下で
あることを利用したものである。
【0024】量子化分解能でみると、スケールファクタ
を2倍の大きさにすることは、量子化ビット数を1ビッ
ト減らすことと実質的に等しい。したがって、スケール
ファクタの当初の値をSFと表現し、スケールファクタ
の調整後の値をASFと表現するとき、量子化調整部1
30は、1<ASF/SF<2なる関係を満たすようス
ケールファクタの調整をスケーリング部114に指示す
ることが好ましい。この関係を満たす限りにおいて、ス
ケールファクタを調整した場合のほうが、量子化ビット
数を減らす場合よりも高音質を確保することが可能とな
る。逆に、この関係を満たさない場合には、量子化ビッ
ト数を調整してみるか、または量子化ビット数の調整と
スケールファクタの調整を併用して、符号量を少なくす
る。
【0025】以上のようにして、符号量が許容値に収ま
るまで、スペクトラム信号成分は量子化、符号化され、
ビットストリーム生成部124が、量子化符号化された
データをビットストリームに生成して、録音用の記録媒
体などに供給する。
【0026】図3は、量子化ビット数の調整とスケール
ファクタの調整を行った場合の量子化および符号化の結
果比較例を示す。この例では、1つのサブバンドにおけ
る16個のスペクトラム信号を量子化符号化している。
図3(a)は、この16個のスペクトラム信号の振幅を
示す。
【0027】図3(b)は、スケールファクタが8、量
子化ビット数が4ビットの場合の量子化データ、量子化
誤差およびハフマン符号長を示す。ハフマン符号長は、
量子化データにより一意に定められる。前掲した<表1
>を参照して、この表は3ビットの量子化データについ
てのものであるが、ハフマン符号長が量子化データによ
り一意に定められる様子が示されている。符号量は、こ
のスペクトラム信号成分を量子化して符号化したときの
ビット量であり、各量子化データに対するハフマン符号
のビット数を加算することによって求められる。この場
合、符号量は52であり、量子化誤差の合計は5.47
である。このサブバンドに対する符号量の許容値が50
であるとすると、符号量52はこの許容値を超えている
ため、スケールファクタが8、量子化ビット数が4ビッ
トの量子化条件を採用することはできない。この状況の
もと、量子化ビット数を調整した例と、スケールファク
タの調整を行った例について以下に示す。
【0028】図3(c)は、スケールファクタが8、量
子化ビット数が3ビットの場合の量子化データ、量子化
誤差およびハフマン符号長を示す。量子化ビット数を調
整した例であり、このとき、符号量は37、量子化誤差
の合計は7.94となる。
【0029】図3(d)は、スケールファクタが10、
量子化ビット数が4ビットの場合の量子化データ、量子
化誤差およびハフマン符号長を示す。スケールファクタ
を調整した例であり、このとき、符号量は49、量子化
誤差の合計は5.53となる。以下に、この結果をまと
める。
【0030】
【表2】 (量子化条件) (符号量) (量子化誤差合計) b)スケールファクタ8、 量子化ビット数4 52 5.47 c)スケールファクタ8、 量子化ビット数3 37 7.94 d)スケールファクタ10、量子化ビット数4 49 5.53
【0031】この例では、符号量の許容値が50である
ため、d)スケールファクタ10、量子化ビット数4で
の量子化符号化は、この許容値の条件を満足する。さら
に、c)スケールファクタ8、量子化ビット数3での量
子化符号化と比較すると、量子化誤差合計値において、
d)の量子化符号化はc)の量子化符号化よりも優れて
いる。量子化誤差は、原音との違いを表現するためデー
タであるため、d)の量子化符号化は、c)の量子化符
号化よりも好ましいことが分かる。図2の量子化調整部
130は、可変長符号化の結果生成される符号化データ
に内在する量子化誤差が少なくなるよう量子化ビット数
の調整とスケールファクタの調整のいずれかを選択して
もよい。量子化誤差を選択の基準とすることで、高音質
の量子化符号化を行うことが可能となる。
【0032】図4は、実施の形態に係る音声圧縮方法の
フローチャートを示す。まず、デジタル音声信号を複数
のサブバンドに分割する(S10)。続いて、サブバン
ドごとにスケールファクタを決定し(S12)、量子化
ビット数を決定する(S14)。このスケールファクタ
および量子化ビット数を用いて、サブバンドのスペクト
ラム信号の量子化符号化を行う(S16)。
【0033】それから、符号化データの符号量を算出し
て、その符号量が許容値を超えるか否かを判断する(S
18)。超えている場合には(S18のY)、少なくと
も一つのサブバンドについて、量子化ビット数の調整を
行うか、スケールファクタの調整を行うかの選択を行う
(S20)。スケールファクタの調整を選択する場合に
は(S20のA)、S12に戻って、スケールファクタ
を大きくするような調整を行う。一方、量子化ビット数
の調整を行う場合には(S20のB)、S14に戻っ
て、量子化ビット数を減らすような調整を行う。S18
において符号量が許容値に収まるまでこのステップは繰
り返される。符号量が許容値に収まった場合には(S1
8のN)、符号化データを用いてビットストリームを生
成し(S22)、このフローを終了する。
【0034】以上、本発明をいくつかの実施の形態をも
とに説明した。これらの実施の形態は例示であり、それ
らの各構成要素や各処理プロセスの組合せにいろいろな
変形例が可能なこと、またそうした変形例も本発明の範
囲にあることは当業者に理解されるところである。例え
ば、実施の形態においては、符号量を算出して求めてい
るが、変形例では符号量の許容値などの条件により、統
計的な法則を用いて自動的に量子化、符号化条件を決定
してもよい。また、スケールファクタを、聴覚心理分析
の結果をもとに決定してもよい。
【0035】さらに、スケールファクタの調整を選択す
る基準として、MNR(マスキングスレッショルド−ノ
イズ比)を利用してもよい。MNRは、ある音を聴いた
ときに人間がノイズとして認識する量の逆数を表してお
り、一般には各サブバンドのMNRの総和を最大とする
ことが、最適な量子化ビットを割り当てる方法の一つと
いえる。割当てビット数を減らすことによりMNRが目
標値に到達しなくなる場合には、スケールファクタの調
整により量子化および符号化の微調整を行うことが好ま
しい。例えば、割当てビット数を5ビットとした場合に
はMNRが目標値よりも大きいが、割当ビット数を減ら
して4ビットとした場合にMNRが目標値よりも小さく
なるとき、このときはスケールファクタを2倍以内で大
きくすることによって、高音質を確保しながら符号量を
許容値に収めることが可能となる。
【0036】
【発明の効果】本発明によると、高音質を確保しながら
適切な量子化、符号化を行う音声圧縮技術を提供するこ
とができる。
【図面の簡単な説明】
【図1】 従来の音声圧縮装置の構成を示す図である。
【図2】 実施の形態に係る音声圧縮装置の構成を示す
図である。
【図3】 (a)は16個のスペクトラム信号の振幅を
示す図であり、(b)はスケールファクタが8、量子化
ビット数が4ビットの場合の量子化データ、量子化誤差
およびハフマン符号長を示す図であり、(c)はスケー
ルファクタが8、量子化ビット数が3ビットの場合の量
子化データ、量子化誤差およびハフマン符号長を示す図
であり、(d)はスケールファクタが10、量子化ビッ
ト数が4ビットの場合の量子化データ、量子化誤差およ
びハフマン符号長を示す図である。
【図4】 実施の形態に係る音声圧縮方法のフローチャ
ートである。
【符号の説明】
100・・・音声圧縮装置、112・・・サブバンド分
割部、114・・・スケーリング部、118・・・ビッ
ト割当部、120・・・量子化部、122・・・符号化
部、130・・・量子化調整部。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA20 5J064 AA00 BA09 BA16 BC01 BC02 BC11 BC16 BC17 BD03

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を複数のサブバンドに分割し、
    サブバンドごとに量子化を施した後、可変長符号化する
    方法において、 前記可変長符号化で得られる符号量が許容値を超えない
    ように、少なくとも一つのサブバンドについて、そのサ
    ブバンドに割り当てる量子化ビット数の調整と、量子化
    におけるスケールファクタの調整を選択して実施するこ
    とを特徴とする音声圧縮方法。
  2. 【請求項2】 音声信号を複数のサブバンドに分割し
    て、サブバンドごとにスペクトラム信号成分を出力する
    分割部と、 サブバンドごとにスケールファクタを定めるスケーリン
    グ部と、 サブバンドごとに量子化ビットの割当数を定めるビット
    割当部と、 スケールファクタおよび量子化ビット数に基づいて、各
    サブバンドのスペクトラム信号成分を量子化する量子化
    部と、 量子化されたデータを可変長符号化する符号化部と、 前記可変長符号化部で得られる符号量が許容値を超えな
    いように、少なくとも一つのサブバンドについて、その
    サブバンドに割り当てる量子化ビット数の調整と、スケ
    ールファクタの調整のいずれかを選択して、前記ビット
    割当部または前記スケーリング部に対して、調整につい
    ての指示を行う量子化調整部とを備えたことを特徴とす
    る音声圧縮装置。
  3. 【請求項3】 前記量子化調整部は、前記スケールファ
    クタの調整によって前記符号量が前記許容値に収まる場
    合、前記量子化ビット数の調整をせずに前記スケールフ
    ァクタを調整するよう指示することを特徴とする請求項
    2に記載の装置。
  4. 【請求項4】 前記スケールファクタの当初の値をSF
    と表現し、スケールファクタの調整後の値をASFと表
    現するとき、前記量子化調整部は、1<ASF/SF<
    2なる関係を満たすようスケールファクタの調整を指示
    することを特徴とする請求項2または3に記載の装置。
  5. 【請求項5】 前記量子化調整部は、前記可変長符号化
    の結果生成される符号化データに内在する量子化誤差が
    少なくなるよう前記量子化ビット数の調整と前記スケー
    ルファクタの調整のいずれかを選択することを特徴とす
    る請求項2から4のいずれかに記載の装置。
  6. 【請求項6】 音声信号を複数のサブバンドに分割し
    て、サブバンドごとにスペクトラム信号成分を出力する
    分割部と、 サブバンドごとにスケールファクタを定めるスケーリン
    グ部と、 サブバンドごとに量子化ビットの割当数を定めるビット
    割当部と、 スケールファクタおよび量子化ビット数に基づいて、各
    サブバンドのスペクトラム信号成分を量子化する量子化
    部と、 量子化されたデータを可変長符号化する符号化部と、 前記可変長符号化部で得られる符号量が許容値を超えな
    いように、少なくとも一つのサブバンドについて、スケ
    ールファクタの調整を前記スケーリング部に対して指示
    する量子化調整部とを備えたことを特徴とする音声圧縮
    装置。
JP2002077208A 2002-03-19 2002-03-19 音声圧縮方法および音声圧縮装置 Pending JP2003280695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002077208A JP2003280695A (ja) 2002-03-19 2002-03-19 音声圧縮方法および音声圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002077208A JP2003280695A (ja) 2002-03-19 2002-03-19 音声圧縮方法および音声圧縮装置

Publications (1)

Publication Number Publication Date
JP2003280695A true JP2003280695A (ja) 2003-10-02

Family

ID=29227922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002077208A Pending JP2003280695A (ja) 2002-03-19 2002-03-19 音声圧縮方法および音声圧縮装置

Country Status (1)

Country Link
JP (1) JP2003280695A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100364235C (zh) * 2004-09-17 2008-01-23 广州广晟数码技术有限公司 多声道数字音频编码设备及其方法
JP2010538316A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化
JP2016218465A (ja) * 2011-07-13 2016-12-22 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 音声信号の符号化と復号化の方法および装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100364235C (zh) * 2004-09-17 2008-01-23 广州广晟数码技术有限公司 多声道数字音频编码设备及其方法
CN101046963B (zh) * 2004-09-17 2011-03-23 广州广晟数码技术有限公司 解码经编码的音频数据流的方法
CN101312041B (zh) * 2004-09-17 2011-05-11 广州广晟数码技术有限公司 多声道数字音频编码设备及其方法
JP2010538316A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化
US9153240B2 (en) 2007-08-27 2015-10-06 Telefonaktiebolaget L M Ericsson (Publ) Transform coding of speech and audio signals
JP2016218465A (ja) * 2011-07-13 2016-12-22 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 音声信号の符号化と復号化の方法および装置
US9984697B2 (en) 2011-07-13 2018-05-29 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device
US10546592B2 (en) 2011-07-13 2020-01-28 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device
US11127409B2 (en) 2011-07-13 2021-09-21 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device

Similar Documents

Publication Publication Date Title
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
US20060004566A1 (en) Low-bitrate encoding/decoding method and system
JP4628861B2 (ja) 複数のルックアップテーブルを利用したデジタル信号の符号化方法、デジタル信号の符号化装置及び複数のルックアップテーブル生成方法
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JP2002533790A (ja) 適応型ビットアロケータ及びオーディオエンコーダ
JP4734859B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JPH11145842A (ja) 音声帯域分割復号装置
JP2003280695A (ja) 音声圧縮方法および音声圧縮装置
US7305346B2 (en) Audio processing method and audio processing apparatus
JPH0537395A (ja) 帯域分割符号化方法
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP2008139781A (ja) 音声符号化方法および装置
JP2003280697A (ja) 音声圧縮方法および音声圧縮装置
JP4024185B2 (ja) デジタルデータ符号化装置
JP2003280698A (ja) 音声圧縮方法および音声圧縮装置
JP2009288560A (ja) 音声符号化装置、音声復号装置、及びプログラム
JP2002534039A (ja) オーディオエンコード装置において固定マスキング閾値を効果的に実現する装置及び方法
JP3389849B2 (ja) 量子化装置
JP2001109497A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP3200886B2 (ja) オーディオ信号処理方法
JP3141853B2 (ja) オーディオ信号処理方法
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JP2001282288A (ja) オーディオ信号の符号化装置及び処理方法
JPH0822298A (ja) 符号化装置および復号化装置