JPS6358500A - 副帯域音声コ−ダ用ビツト割振り方法 - Google Patents

副帯域音声コ−ダ用ビツト割振り方法

Info

Publication number
JPS6358500A
JPS6358500A JP62117250A JP11725087A JPS6358500A JP S6358500 A JPS6358500 A JP S6358500A JP 62117250 A JP62117250 A JP 62117250A JP 11725087 A JP11725087 A JP 11725087A JP S6358500 A JPS6358500 A JP S6358500A
Authority
JP
Japan
Prior art keywords
bits
signal
subband
block
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62117250A
Other languages
English (en)
Inventor
ウイリアム・ジョージ・クローズ
マルコーム・スコット・ウェア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS6358500A publication Critical patent/JPS6358500A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 この発明はアナログ・ディジタル変換器およびディジタ
ル・アナログ変換器に関するものであり、詳細にいえば
受信側のディジタル・アナログ変換器による再構成のた
め、ディジタル・リンクにおける送信用にひとつまたは
それ以上の音声信号を処理するためのディジタル音声サ
ンプリングおよびエンコーディング手段に関するもので
ある。この発明は伝送用の多重音声チャネル圧縮に特に
適するものである。
B、従来技術 各種の副帯域(サブバンド)音声コーダが公知である。
音声コーダ・システムは、このようなシステムで通常発
生するディジタル・エネルギー・レベルのサンプルの処
理を行なうためのディジタル・マイクロプロセッサに基
づくものである。
r1977年5月9日ないし11日に開催された197
7年、音響、音声および信号処理に関するI EEE国
際会議記録(1977IEEEInternation
a! Conference on Acoustic
s。
5peech and Signal Process
ing Record of May9−11.197
7)J 191−195ページおよびr1980年4月
9日ないし11日に開催されたI EEE音響、音声お
よび信号処理学会議事録(IEEE Acoustic
s、 5peech and Si8nalsProc
essing 5octety Proceeding
s of Apri19−11.1980)J Vo 
l 、 1.332−335ページを参照されたい。こ
れらは多重チャネル音声伝送用の典型的なディジタル副
帯域音声コーダおよびデコーダの構成を示している。
上記の文献に記載されているようなシステムにおいて、
受信器の聴取者が感じる副帯域音声コーダの性能の主観
的な品質は、副帯域コーグの個々の周波数帯域に対する
、伝送媒体において利用可能なビットの割振りに大きく
依存するものである。
これまでに行なわれた主な改良は、動的なビットの割振
りを使用することを含んでおり、この場合利用可能なビ
ットが各帯域サンプルに存在するエネルギーにしたがっ
て、周波数帯域の間に動的に分散される。この手法は可
変ビット・レート・システムに拡張されたが、このシス
テムにおいては、他のすべての周波数帯域に対する関係
での、各周波数帯域におけるエネルギーにしたがって、
すべてのコーダのすべての帯域にビットを割り当てるこ
とによって、多くの音声コーダが共通ビット速度資源、
すなわち伝送チャネルを共用することができる。
典型的な副帯域音声コーダはOないし4 k Hzの音
声スペクトルを取り、通常は毎秒s、oo。
サンプルのサンプリング速度でこれをサンプルする。フ
ィルタリングおよびサブサンプリングによって、音声ス
ペクトルは、通常はそれぞれが500Hzの帯域幅の8
つの副帯域の副スペクトルに分割される。第1図に略示
されているこのようなシステムにおいて、アナログ線1
の入力アナログ信号はアナログ・ディジタル変換器2に
よって、ディジタル・サンプル・ストリームに変換され
、このストリームのサンプルはクロック4の制御の下に
線3を介して、通常は8kHzのサンプリング速度で並
列フィルタ・パンク5へ転送される。
フィルタ・パンク5は人力ディジタル・ストリームを、
0ないし4,0OOHzのスペクトルにおよぶ、通常は
8つの周波数の副帯域に分割する。
それ故、出力は一連の8つの独立したチャネルであって
、各々は線7上のフィルタ・パンク5の出力を制御する
クロック6によって略示されているように、1000サ
ンプル/秒の速度で発生するサンプルを有している。
個々の周波数副帯域のピークおよび全体的なピークはピ
ーク量子化器9によって測定され、量子化器はタイム・
フレーム内の信号サンプルを正規化する。フォワード誤
り訂正コード発生器10により、また動的ビット割振り
手法、すなわち動的ビット割振り回路11によって示さ
れているように通常マイクロプロセッサに実施されてい
るアルゴリズムによって、正エラー補正および動的ビッ
ト割振りが量子化されたサンプルに適用される。次いで
、フィルタ・パンク5の出力はコンパンダ8によって標
準値に圧伸または正規化され、回路11によって割り振
られたビット数に量子化される。
コンパンダの出力は通常、約13,0OObpSの信号
ストリームであり、フォワード誤り訂正コード発生器は
ピーク量子化器の出力データを含む約3 + OOOb
 p sの出力ストリームを発生する。従って、並−直
列変換器13は、クロック15の制御の下にディジタル
・チャネル14上での約16,0OObpsの伝送を行
なう。この直列信号ストリームは実際の圧伸信号ならび
に側チャネルの情報を含んでおり、この情報は各周波数
副帯域ならびにフォワード誤り訂正コードに与えられた
ビット割振りを示している。
第1図は従来技術を示すものであって、線1」;の0な
いし4 k Hzの人カスベクトルはアナログ・ディジ
タル変換器2から出たのち、通常毎3′8゜000サン
プルの速度でサンプルされる。これは線3上のアナログ
・ディジタル変換器2からの出力を制御するサンプル・
クロック4によって示されている。フィルタリングおよ
び副サンプリングが並列フィルタ・バンク5で行なわれ
、フィルタ・バンク5は全スペクトルの人力サンプル列
を、通常8つの副スペクトルに区切る。図示の例におい
て、0ないし4 k Hzの入カスベクトルは各々幅が
500 Hzの8つの副帯域に区切られる。最初の帯域
は0ないし0.5kt(zの帯域であり、第2の帯域は
0.5ないし1 k I(zの帯域であるというように
なっている。副帯域の各々の個々の時間波形はフィルタ
・バンク5の出力における、クロック6によって制御さ
れる毎秒L 000サンプルのビット・ストリームによ
って表わされている。その他のさまざまな帯域幅が使用
されることがあり、それぞれ250 Hy、のり11の
IGの帯域せ〕珍しいことで1よない。幅が等しくない
副帯域が用いられることもしばしばある。
通常、8つの個々の副帯域時間波形はマイクロプロでツ
サの形で具現化されることが典型的なものである信号処
理装置において、11ないし32ミリ秒の範囲の時間ブ
ロック長で処理される。第1図は16ミリ秒のサンプル
・ブロック時In長を想定したものである。第1図のピ
ーク量子化器9は所定の時間ブロックないし一連のサン
プル内の各副帯域の信号のピーク強度を決定する。個々
の副帯域の周波数のピークは対数的1こ、典型的な場合
は、2ないし4 d B程度の解像度に量子化される。
次いで、情報は動的ビット割振り回路11、および誤り
訂正のだめのフォワード誤り訂正コード発生器10に渡
される。結果は次いで、並−直列変換器13に渡され、
この変換器は並列フィルタ・バンク5から人力されるサ
ンプルの伝送ストリームからの実際のビットを多重化す
る。ビット割振りは動的ビット割振り回路11で実施さ
れるビット割振り手法によって、低いレベルで割り当て
られる。ビットの削減はコンパンダ8で発生するレベル
に対する七のであって、コンパンダは16ミリ秒のこの
サンプル・ブロック中に用いられる特定のビット割振り
を受信器に通知する側チャネル情報における多重化も行
なう。
第1図において、動的ビット割振り回路11は16ミリ
秒の所定のブロックに対して利用可能な帯域幅ビットを
、通常6dBのピーク信号ごと(こ1ビツトの速度で、
個々の周波数副帯域に割り当てる。
第2の副帯域のピーク値の2倍のピーク値を有する所定
の周波数の副帯域は、第2の副帯域よりもひとつ多いビ
ットを得る。ピーク・エネルギーが4倍の帯域は他の副
帯域よりも2つ多いビットを得ることになり、以下同様
である。実際には、固定数の利用できる帯域幅ビットを
このような態様で、すべての利用できるmjJ帯なの間
に正確に分割することができないので、理想的な割当て
上行なうことができない。実際の方法:より3期ビット
の割当てを行なうが、この割当ては負数および小数を含
むある種のきわめて大きな数を含む可能性がある。これ
らは次いで、整数に丸められ、最小値はO,最大値は大
体5ビツトに制限される。このことは通常、割当てに必
要なビットの合計値を正しくないものとするので、ビッ
トの反復再分配が必要となる。このことはすべて、時間
およびハードウェアをきわめて大量に必要とする方法で
あって、その精度は理想的とはまったくいえないもので
ある。
サンプル・コンパンダおよび量子化器8は量子化された
ピーク・エネルギー↑11報を使用して、各・;17域
における時間波形を圧縮若しくは正規化する。
サンプル・コンパンダおよび量子化器8は次いで、周波
数副帯域に対するビット’i’i!l振り手法によって
割り当てられるビット数を用いて、各周波数副帯域の各
サンプルを量子化する。圧縮およびビットの割振りに使
用されるすべての情報は、システムの他端にある受信器
またはデモシュレータに利用できるようになるので、受
信器は最初の時間ゼ皮形を再構成し、これらを再構成デ
ィジタル・アナログ・フィルタを介して送り、最初のO
ないし4kti zの人力信号を近似する。受信側は第
1図には示されていないが、上述のrlEEE音響、音
声および信号処理学会議事録JVo1.1に明確に示さ
れている。
この方法においては、音声の品質に若干の劣化が生じる
が、これは利用できるビット、すなわち伝送システムの
このコーダに割り当てられた帯域幅が、入力信号を最初
の形試に正確に再構成するに十分なものではないからで
ある。
C1発明が解決しようとする問題点 この型式のシステムに関連する問題は主として、ビット
割振りの問題である。上述のビット割振りの手法は必要
な関数を近似し、コーダに与えられた所定の、許容され
た固定数のビットまたは帯域幅に対して最適な信号対雑
音比を達成しようというものである。第1の問題は割り
当てられた毎秒当りの固定数のビットのため、信号対雑
音比が各音声スペクトルにおいて影響をきわめて受けや
すいということである。均一なスペクトルはその副帯域
のすべてに割り当てられるビットがきわめて少ないのに
対し、粗いスペクトルでは少数の高エネルギーの副帯域
に多くのビットがあり、それ故均−なスペクトルにおけ
る低い信号対雑音比に比較して高い信号対雑音比をもた
らす。第2に、人間に聞こえる雑音が、信号対雑音比に
比例していないことが認められている。さらに、すべて
の人間に同じものが聞こえるわけではなく、また公知の
公式または数学的モデルにしたがった聞こえ方をするわ
けでもない。音声コーダの出力の品質は音声が再構成さ
れた場合の音声の品質の専門家の評価に基づく、コーダ
の主観的な等画信号対雑音比に関して、専門家によって
評価される。通常、全体的な信号対雑音比に関する専門
家の推定値は、存在している実際の定量的な信号対雑音
比と大幅に異なっている。
幾つかの部分的な解決策が上述の問題に対して提案され
ている。6dBの入力ピーク信号当り1ビット未満のレ
ートでビットを割り振ることが、役立つ。非線形量子化
器も役立つ。ビット・レートの割当てを変更する方法を
決定することができれば、可変ビット・レート割当てが
役立つ。これらの試みはすべて、人間が聞くことによっ
て音の質を実際には、どのように認識するかを推測しよ
うとするものである。これらの手法はすべて、真に必要
なものに対立するものとして、有利、または実施しやす
い何らかの公式を使用するものである。
副帯域音声コーダに関する上記の公知の問題に鑑み、こ
の発明の目的は量子化された全帯域のピーク情報を、各
時間ブロックの信号のレベルおよび゛スペクトルの両方
を表わすのに十分な有限で、包含可能な数の状態に減少
させる改善された方法を提供し、かつビット割振りを、
希望する客観的で全体的な音声品質出力と一致した副帯
域に割当てる手段を提供することである。
この発明の他の目的は、各時間ブロックに対する信号レ
ベルと信号エネルギー・レベル分布スペクトルを利用し
て、音声出力の所定の品質に必要なビット割当てのテー
ブルにアクセスする、改善されたビット割当て手段を提
供することである。
この発明のさらに他の目的は、多重ビツト割当てテーブ
ルを使用して、ビット・レート割当てを全体的な知覚さ
れる音声品質出力に変換し、多くのユーザが存在する場
合のビット・レートの低下に適合するか、あるいはひと
りまたはそれ以上のユーザに、所定のビット・レートに
対して他のユーザに与えられるものよりも高い品質のサ
ービスを提供するかのいずれかを行なうことを可能とす
ることである。
D1問題点を解決するための手段 この発明の上述の目的に合致した、上記の問題の解決策
を、もつとも一般的な形態で、以下に記載する。量子化
された副帯域ピーク情報全体が、処理される信号の各時
間ブロック内の絶対ピーク・エネルギー・レベルと、ス
ペクトル・エネルギー・レベル分布の両方を表わすに十
分な、有限で、包含可能な数の状態に減少される。エネ
ルギー・レベルとスペクトル分布(ヨ、テーブル参照用
のアドレスとして使用できる信号状態の所定の順列を表
わす。アクセスされるテーブルは主観的な音声品質出力
に必要なビット割振りを含んでいる。テーブルの値は希
望する主観的な実験に基づいて割り当てられ、さまざま
な性能の品質対平均ビット速度スループットの複数のテ
ーブルを提供することができる。客観的なレベルの品質
のみを必要とするモデムに対する信号などの信号に対し
て、異なるテーブルを提供することもできる。
4ミリ秒で、8kHzのサンプリング速度を有する処理
スロット時間が選択されるので、各4ミリ秒の間に、3
2のサンプルが分割帯域フィルタによってもたらされる
。このようにして、4つの信号サンプルがそれぞれの副
帯域に得られ、8つの副帯域が想定される。ブロック処
理遅れを減らし、かつ行なわれている電話の会話に対す
る往復エコー路を最少限のものとするために、4ミリ秒
の時間ブロックが選択される。ブロックが長ければ、必
要な側チャネル・ビット・レート情報の全体の量が減少
するが、より重要なエコー遅れが多くなる。
ブロックに対する帯域のピークは、各副帯域の4つのサ
ンプルの強さを計算し、かつ各副帯域のブロック内で生
じる最も大きな帯域ピークを選択することによって決定
される。全体的なブロックのピークも、4ミリ秒のブロ
ック中のサンプルのグループでもつとも大きな帯域ピー
クを求めることによって決定される。ブロックのピーク
は量子化され、それぞれ2d13の間隔の32のレベル
のひとつに入れられる。すなわち、求められたブロック
のピークは32のレベルのブロック・ピーク・エネルギ
ーの尺度と比較され、ブロックに対する所定のピーク測
定値がレベルのひとつで識別される。ピークの測定値は
次いで、5ビツト、の2進数としてコードされる。この
2進数はブロックのピークに対して求められた、取るこ
とのできる32のレベルのひとつであるこのレベルの番
号である。
この5ビツトの2進数はデモシュレータへの伝送用の側
チャネル情報に収められ、このブロックのデータの最大
ピークの全体的な尺度を識別する。
次いで、全体的なブロックのピークすなわちブロックの
絶対最大エネルギー・レベルを使用して、乗算器すなわ
ち各種の周波数副帯域のすべてのサンプルを、正規化さ
れた範囲に圧縮するための倍数として使用される圧縮値
を検索する。圧縮されたサンプルは次いで、線形の6ビ
ツト量子化器で量子化され、量子化されたサンプルとし
て一時的に保管される。サンプルの値はOf!:含む−
32から+31までの64個の整数である。6ビツトの
情報は多くのサンプルを表わすに必要なものよりも多い
ものであり、削減は後で行なわれる。
個々の副帯域ピーク・エネルギーもブロック・ピーク尺
度によって圧縮されるが、これらは次いで個々のサンプ
ルとして2倍の解像度で量子化される。帯域ピーク値は
正の数値だけであるから、取りうるレベルは64だけで
ある。これらはレベル0ないし63であって、63が最
大レベルである。
2進数の性質を考慮した場合、サンプルがOないし63
の尺度に入るレベルを表わすには、31を超えるピーク
値を有する帯域!こ6ビツトのデータが必要なことは明
らかである。しかしながら、レベル16ないし31の範
囲のピーク値を有するこれらの周波数副帯域は、同一の
2つの高位ビットを有しており、また8ないし15の範
囲内にある副帯域周波数ピークは等しい3つの高位ビッ
トを有しており、以下同様である。それ故、サンプルに
含まれている最初の情報のすべてを保持するには、最初
の6ビツトの量子化されたサンプル情報のうちどれ位を
保存しなければならないかを示す、測定された個々の帯
域ピーク・エネルギーに基づいて迅速にアドレスされる
テーブルを作成することができる。レベル32ないし6
3に入る帯域ピーク・レベルには6ビツトが必要であり
、1Gおよび31の間の帯域ピーク・レベルでは最そり
の6ビツトのうち、5ピツ)・を保存する必要があり、
レベル8ないし15には4ピツ■・が、レベル4ないし
7には3ビツトが、レベル2および3には2ビツトが必
要であり、レベル1には1ビツトだけが必要であり、レ
ベルOには伺も必要ない。
必要なビット数の表記を3ビツトを利用してコード化で
きるが、これは3ビツトが0ないし7の数値を表わすこ
とができ、これが必要なビットの表記0ないし6をコー
ド化するのに十二分なものだからである。この情報は受
信側のデコーダLこ送られる側チャネルの情報に対する
ものである。8つの周波数副帯域を用いて、各周波数副
帯域に対する3ビツトによって受信11;]に、個々の
帯域ピーク・レベルをコード化するのにサンプル・スト
リーム内のビットを幾つ割り振らなければならないかを
通知することを可能とし、それぞれ3ビツトの8つの周
波数副帯域を与えた場合、デコーダまたはデモシュレー
タに、各帯域の各サンプルに幾つのビットが必要である
かを伝えるため、側チャネルに24ビツトが必要となる
。このことは各サンプルの高位ビットがどこにあるかと
、示しているだけである。
時間ブロック・サンプルにおけるエネルギー・スペクト
ルおよび絶対全体エネルギー・レベルの所見に基づいて
、副帯域に均一に印加されるビットの削減に基づいて、
品質を損なうが、ノj゛害な程度まではいかないビット
・レートのこれ以上の削減がもたらされる。適用される
ビット・レートの削減は、以下で詳述する品質テーブル
に収められる。
)ミ、実施例 上記したところに示すように、上述のコーグは電話サー
ビスに対し、はぼ透明な音声品質を与えることができる
。しかしながら、必要なビット・レートはきわめて高く
、アイドル期間中に50゜000ビツトを超える。主観
的な音声品質の劣化をきわめて少なくして、この必要ピ
ッI・・レートを削減するために、8番目の副帯域を完
全に落とすことが可能である。しかしながら、以下に説
明するように、個々のサンプル・ブロックの全体的なス
ペクトルおよびエネルギー・レベルに基づいて、ビット
・レートをさらに削減することができる。
上述のように、音声コーグはブロック内に、周波数にし
たがった8つの副帯域を有しノており、5ビツトの2進
数にコード化できる0ないし31の範囲にあるブロック
・ピーク・レベルを記述するため、各々には0ないし6
ビツトのデータが割り振られている。通常の音声会話の
際の時間の大部分においては、きわめて高い品質を保存
するのに実際に必要なものよりもはるかに多くのビット
が、サンプル内に存在している。はとんどの場合、ビッ
トの幾つか、特にディジタル信号が再構成された場合に
、僅かなアナログ出力の変動のみを表わす低位ビットが
省かれる。総括的な高レベルの音声の再構成全体を保存
しながら、低位ビットまたは少なくとも幾つかの低位ビ
ットを省くことができる。これらのビット金貨<ことの
できる条件は、側チャネル情報によって、すなわちブロ
ックのピーク値の最大値から、および→ナンプルのスペ
クトルに対するエネルギーの分イ1jを示す個ヤの副帯
域ピーク・スペクトル分イ1jから区別される。
希望する受は入れ5される出力音声再構成の品質によっ
て設定される、主観に基づいて確立されるテーブル属性
の頂目との2!11 :!ヤネル試エバの組合せの各々
に対する独自のアドレスによって、テーブルを構成する
ことができる。テーブルの項目は、各状態条件に対して
省かれる多数のビットを含んでいる。しかしながら、8
番目の副帯域が省がれても、アドレスの全数は2,60
0万を超えることがある。副帯域が7つだけであり、そ
nぞれの副帯域がエネルギー・レベルを識別するのに必
要な、6つまでのビットを有している場合、周波数の7
つの副帯域との、副帯域のエネルギー・スペクトル分布
の組合せには、832,542通りが可能である。32
のエネルギー・レベルが可能なブロックにおける全体的
なエラ、ルギー・レベル・スペクトルにより、テーブル
全体は26 + 3 :33 +344項目の大きさに
なる。このようなテーブル項目は1空目にいっても、上
置ねしいものであり、この実施例に可能な1718通り
の釦合せまで項「j数を削減するには、多数のよる!が
取られることになる。
幾つかの副帯域を組み合わせる、あるいはグループ化す
ること;2よって、テーブルをζJ捨てることができる
。8つまたは7つの副帯域は音声の全体的な特性を良好
に表わすには、十二分な数である。
したがって、テーブルの大きさ、およびその結果生じる
アドレスの問題を軽減するには、8つの副帯域を公知の
明瞭度指数にある程度したがって、3つの副帯域グルー
プにまとめる。帯域グループ0は周波数副帯域0および
1を含む。帯域グループ1は周波数副帯域2および3を
含み、帯域グループ2は残っている副帯域4.5.6お
よび7を含む。各帯域グループにはこれに含まれている
帯域のうち最大のビット割振りの値が指定される。
各帯域グループに割り当てられるレベルまたはビットの
数を削減することによって、テーブルの大きさをさらに
削減することができる。当初のレベルは0ないし6ビツ
トである。まとめることによって、これらを異なるもの
とすることもできる。
その場合、当初のレベルO11および2のいずれかを、
新しいレベルOとtff’、Eことができる。当初のレ
ベル3および4を1で表わし、当初のレベル5を2で表
わし、当初のレベル6を8で表わすことができる。この
時点で、ビット割振りの再定義は行なわれず、情報の粗
いセグメントへのグループ化だけを行なって、テーブル
内のアドレスされる状態の数を削減する。
これらの削減によって、3つの帯域グループだけが存在
し、そのそれぞれが4つのレベルだけを有する試況がも
たらされる。すべての組合せが可能であると想定した場
合にも、この情報の64−の状態または順列が依然存在
する。少なくともひとつの帯域グループの割り当てられ
ている3つのレベルに、6ビツトが割り振られていると
想定した場合、使用しなければならない状態は37だけ
となる。きわめて低いエネルギー・レベルにおいては、
副帯域のいずれにも6つのビット全部が割り振られない
ことがあるが、これは信号レベルが圧縮レベルよりも低
くなるからである。この場合、精度はさほど重要なもの
ではなくなるので、帯域グループ2のレベルがレベル3
であり、それ故、上述した当初の64の順列のうち、3
7種類の1項列のみを使用することが維持されると考え
られる。
これらの37の状態をスペクトルに基ついたテーブル・
アドレスとして利用できるが、これはこれらが圧縮され
た形態で、当初の7つまたは8つの周波数副帯域でのピ
ーク・レベル分布、すなわち当初のサンプルのブロック
におけるエネルギーのスペクトルを表わすからである。
スペクトル・アドレスとしてこれらの37の状態を利用
して構成された品質テーブルは、大きさが限定されたも
のであり、また重要なものであるが、これは人間の聴力
が聞いた信号のエネルギーのスペクトル分イロに基づい
ているからである。しかしながら、ブロックのピークに
対して取ることのできるレベルがまだ82残っている。
これらのレベル全部が保存されているのであれば、各品
質テーブルには全部で37X32、すなわち1184の
アドレスが存在することになる。このレベルが人間の主
観的な音声認識品質において有効なのは、人間の限定さ
れた聴覚の範囲においてだけである。このことは歪みの
知覚が音の低いレベルにおいては低くなることを意味す
る。この特定の実施例において、32のレベルを4つの
一般的な範囲だけに分割することができる。これらはレ
ベル・テーブルによって、主観的に選択できる。5ビツ
トのブロック・ピークの最下位のビットを省くと、範囲
は4dB離れた16のレベルだけに減少する。
残りの4ビツトの2進数を、0.37.74および11
1という数値だけを含んでいる16アドレスのテーブル
に対するアドレスとして使用することができる。
完全なアドレスを得るには、測定したブロックのピーク
値を使用して、レベルのアドレスを求める。すなわち、
最下位のビットを省いた5ビツトのブロック・ピークは
、上述の4つの範囲のひとつに相関させることのできる
4ビツトの数である。
アドレスのこの部分プラス上述したようにして生成され
たスペクトル・アドレスが、品質テーブル・アドレス人
口ポインタとなる。品質テーブル自体はこの場合、全部
で37×4の記憶値すなわち148のアドレス位置を有
することになる。品質テーブルは、並列フィルタ・バン
クから実際に入力する各サンプルから省かれるビットの
数を表わす値を含むことになる。省かれるビット数を被
験者のグループによる選好テストによって、識別するこ
とが理想的である。被験者がこの発明の手法を利用して
コード化された音声を聞いている際に、各アドレスまた
はアドレスの選択されたグループは、省略ビットの敬を
変化させる。あるいは、各々が8つの副帯域の各々に対
応している8つの独自の省略ビットを各アドレスが保持
することもできる。
聴取者の主観的な意見を比較することによって、少なく
とも希望するレベルの品質を維持しながら、各々の所定
のアドレスは省略ビットを最大のものとすることができ
る。各々が異なる品質レベルの、148個のアドレスの
複数のテーブルを容易に生成することができる。最低限
のビット・レートのみを必要とする最低限の許容品質ま
で、歪みが知覚されないほぼ透明な妥当な範囲をカバー
するには、4つのテーブルで十分である。
このようにして、人間の聴覚神経と脳とがどのように影
響しあって、コード化された音声の性能に関する聴取者
の主観的な評価を識別するのかという複雑な問題に対す
る解決策を、品質テーブルが与える。これまでの屏決策
は、何らかの固定等式を使用し、信号対雑音比を含む数
種類のパラメータを最適化するという定義に基づいてい
た。極端に単純イヒされた固定等式を想定する代わりに
、品質テーブルの手法によって、大グループの聴取者が
どのようにビットを音声ブロックから除去して、グルー
プ内の音声品質の主観的な希望を最適化するかを定義す
ることが可能となる。それ故、品質テーブルは統計的に
定義された音声コーダであって、与えられた解像度に対
する定義は2つの異なる品質テーブルの間の好みを選択
する大り゛ループの聴取者の主観的な結果に基づいたも
のである。
第2図はテーブルの手法を略示するものであって、0な
いし3,500Hzの範囲の7つの副帯域からもたらさ
れるすべての可能な組合せからどのように切捨てるかの
方法、および32の絶対ブロック・エネルギー・レベル
を示している。この例では、31000ないし4,00
0の他のものは省かれている。各テーブルは副帯域ピー
ク・エネルギー決定位相で求められる7つの副帯域エネ
ルギー・レベル番号によってアドレスされる。他の項目
は上述の32のレベルのひとつに入る全体的な絶対エネ
ルギー・レベルである。
テーブル全体を以下の規則を遵守することによって、1
48項目のテーブルに圧縮することができる。副帯域0
および1のエネルギー・レベルの最大値を帯域グループ
のエネルギー・レベルと呼ぶ。
副帯域2および3のエネルギー・レベルの最大値を帯域
グループ1のエネルギー・レベルと呼ぶ。
帯域番号4.5および6のエネルギー・レベルの最大値
をグループ2のエネルギー・レベルと呼ぶ。
上述の粗いグループ化がこのテーブルで実施され、副帯
域のエネルギー・ピーク・レベルに対する、以下のよう
な生のスペクトル分布を与えるウ 1つの例として、エ
ネルギー副帯域Oないし6に対するエネルギー・ピーク
を4.6.2、]、3.1および0と表わすことができ
、絶対ブロック・ピーク・エネルギー・レベルを10進
数の4、すなわち2進数の00100とすることができ
る。副帯域をグループ化する規則を想定した場合、4つ
の任意の状態A、B、CまたはDが各帯域グループに存
在し、かつ次のように割り当てられる。帯域グループ0
のレベルがOllまたは2の場合、状57 A、帯域グ
ループOのレベルが3または4の場合、状態B、帯域グ
ループOのレベルが5の場合、状態C1帯域グループ0
のレベルが6の場合、状f31)である。他の帯域グル
ープ1および2にも、同じことがあてはまる。帯域グル
ープOがエネルギー副帯域Oおよび1の測定値がらなっ
ており、帯域グループ1が周波数副帯域2および3のエ
ネルギー・ピークからなっており、かつ帯域グループ2
が周波数副帯域4.5および6のエネルギー・ピークか
らなっていることを想起されたい。
絶対エネルギー・レベルも、幾つかの異なる試Iフを取
ることができるが、これは上述の82ではなく、4つの
状態に削減されたものである。Oないし7の絶対エネル
ギー・レベルの値は、状態A1こ割り当てられる。状態
Bはレベル8ないし15を含んでおり、状態Cは16な
いし23の絶対エネルギー・レベルを含んでおり、状態
りはエネルギー・レベル24ないし31を含んでいる。
絶対エネルギー・レベル・ピークが4つのブロックにな
っており、4.6.2.1.3.1.0という生のスペ
クトル分布が求められる上述の例に戻ると、テーブル2
に定義される独自のエネルギー状態は次のようになる。
最大値が4および6である帯域グループOは6に等しく
、状態りに対応している。最大値が2および1である帯
域グループ1は2であり、状態Aに対応している。3.
1および0という最大値を有する帯域グループ2は3で
あり、状態Bに対応している。絶対エネルギー・レベル
は4であり、状態Aに対応している。それ故、テーブル
内の最終位置は座標DABAによって定義される位置と
なる。多数のスペクトル帯域番号の順列および多数のエ
ネルギー・レベルの順列がこのように、テーブル内の単
一の領域にグループ化され、ブロック全体における7つ
のエネルギー副帯域ピーク・レベルの測定値および絶対
エネルギー・レベルの測定値の順列に基づいた特定の項
目が所定の範囲に入り、かつテーブル内で同じ値が与え
られることに留意されたい。テーブルのアドレスされた
部分における内容は、任意数のビット、たとえば0.1
.2または3であり、これらは伝送されるサンプルから
省かれる。
最高品質の音声伝送の場合、高品質テーブル索引には、
サンプルからビットが省かれないということを示す0内
容位置がロードされ、当初の信号サンプルが通常の16
ビツトの2の補数のサンプルであるとみなされる。最下
位ビットを省き、かつ受信器に対し所定のブロック伝送
期間中に各サンプルから幾つの最下位ビットが省かれた
かを示すことによって、周波数副帯域の各々における4
一つの信号サンプルの各々に対し、全体的な伝送チャネ
ルのローディングを大幅に削減することができる。各サ
ンプルから2つまたは3つのビットを省くことは、最終
的に受信され、再構成される信号に認識可能な歪みをほ
とんど、あるいはまったく生じさせないが、あと高位の
ビットひとつでも削除すると、重大な歪みが生じる。受
入れ可能な歪みのレベルは、被験者にとって知覚される
全体的な信号の受入れ可能度に基づいた主観的な基準で
ある。最低限受入れ可能な解像度の典型的な品質テーブ
ルでは、各サンプルからOないし6つのビットを削除す
ることを必要とするが、最高品質のテーブルでは各サン
プルから削除するビットを0個とすることを要求する可
能性がある。
品質テーブルを最も高い受入れ可能品質レベルから最も
低いものまでの任意の品質の範囲に対して確立できるこ
とがわかろう。特定のユーザに対する特定の音声回線で
の操作が優先通信に対する高レベルの品質に合致するも
のと指示されるが、同じ回線上のモデムなどの機桟には
、きわめて(Eiい客観的なレベルの品質だけが与えら
れることがあるということも、同様に明らかである。構
成の相違は、人力の性質によって、異なる品質性能が利
用されるということだけである。このような通信システ
ムでサービスを受けることを希望するユーザは、高品質
で、高信号対雑音比伝送を選択し、価格が比較的高い、
ビットの削除がほとんど、あるいはまったくない性能品
質のテーブルを割り当てられる可能性がある。これは高
品質のサービスを供給するのに、比例して大きな総帯域
幅が利用され、かつ高い品質を発生するために必要な、
これにしたがった数のビットがより多くのチャネル・ス
ペースを占めるからである。同様に、ユーザがもつと費
用がかからず、これに応じて狭いチャネル帯域幅を要求
し、モデムで使用するようにしてもよい。実際には、こ
れらの品質テーブルが取りうる範囲全体を考えた場合、
可能なサービスの範囲とその品質には、はとんど限界は
ない。
より有用なシナリオは第1図に示すようなシステムに利
用できるチャネル帯域幅を与えた場合に、このシステム
がすべてのユーザに対して、存在している多数のユーザ
がシステムに対して行なった全体的な要求と合致した最
高の品質のサービスを実現することである。チャネル帯
域幅が限定されたり、削減されたりした場合、あるいは
ユーザの数が増加した場合、品質の低い伝送テーブルに
依存すること、すなわち各ユーザに対して割り当てるビ
ット数を少なくすることは、ユーザの要求が減少するま
で、あるいはチャネルの容量が増加するまで、次以降の
サンプル・ブロックに対し異なる音声品質テーブルに切
り換えることによって、容易に達成可能である。
品質テーブルの例は上述のように、経験的に決定される
。以下に2つの例、すなわち中程度の品質に対するもの
と、低品質のものとを説明する。
テーブルに対するスペクトル・アドレスが上述のように
して生成され、37の取りつる状態のうちのひとつをも
たらす。アドレス生成の規則は次のように簡単なもので
ある。帯域グループOの帯域グループ・レベルの値が3
未満であり、帯域グループ1のレベルの値が3未満であ
る場合には、スペクトル・アドレスは帯域グループ0の
レベル+帯域グループ1のレベルの3倍となり、これは
Oないし8のスペクトル・アドレスを生成する。帯域グ
ループ0のレベルが3未満であり、帯域グループ1のレ
ベルが3である場合には、スペクトル・アドレスは帯域
グループOのレベル士帯域グループ2のレベル+9の4
倍となり、これは9ない1ノ20のスペクトル・アドレ
スを生成する。また、帯域グループ0のレベルが3の場
合には、スペクトル・アドレスは帯域グループ1のレベ
ル+帯域グループ2のレベル+21の4倍となり、これ
は21ないし36のスペクトル・アドレスを生成する。
テーブルの他の項目はブロック・ピークの82の取りう
るレベルからのものである。32のレベルは5ビツトの
ブロック・ピーク・レベルの最下位ビットを省くことに
よって4つの範囲に圧縮され、これは範囲をそれぞれの
離隔距離が4. d 13の16だけのレベルに削減す
る。残余の4ビツトの値を使用して、上述のように01
37.7・1および111という値のみを含んでいる1
6−アドレス・テーブルをアドレスする。0.37.7
4および111という値の間のテーブルにおける分割点
の間の実際の範囲は、ユーザに結果を知覚させ、かつ知
覚された最大限受入れ可能な品質を選択させることによ
って、決定される。しかしながら、高いエネルギー・レ
ベルの場合、全体的な知覚される品質が、信号対雑音比
歪みの影響を強く受けること、およびきわめてレベルに
おいては、信号対雑音比が音声について知覚される品質
に対してさほど重要ではないことが認められる。それ故
、取りつる4つの範囲を可能性の間で等分することで、
必要以上に高い品質がきわめて低いレベルに割り当てら
れることになる。したがって、上記の例において、16
の取りつるアドレスのうち2つだけが最も低いエネルギ
ー状態に割り当てられ、3つが次に低いものに割り当て
られ、5つが次のもの、6つが最後のもの、すなわち最
も高いエネルギー・レベルの範囲に割り当てられる。そ
れ故、この明細書記載の特定の実施例においては、絶対
エネルギー・レベル・ピークに可能な32のレベル全部
を利用するのではなく、32のレベルが4つのみの範囲
に分割され、所定の絶対エネルギー・レベルの測定値が
属する範囲が、アクセスされるテーブル値の範囲を決定
する。
コーディング工程全体を再検討すると、その工程は次の
ようになる。先ず、人力信号のサンプルはブロックに分
割される。この発明の実施例においては、4ミリ秒の期
間に発生するすべてのサンプルがブロックとなる。ブロ
ック内のピーク、すなわち副帯域当り4つの信号のサン
プルを有する8つの副帯域の32の信号のサンプル全部
のピーク強度が求められる。32の対数的な大きさにさ
れたセグメントが、ブロック・ピークの範囲に対して確
立される。所定のブロック・ピークが求められたセグメ
ントは、これが求められた32個のセグメントの中のセ
グメントを表わす5ビツトの2進値としてコード化され
る。次に、所定のブロック・ピークに対して識別された
ブロック・ピーク・セグメントの上限にある信号のサン
プルの範囲が求められる。ブロック・ピークが属する範
囲に対して、64個の線形サブセグメントが定義され、
所定の信号のサンプルが属する特定の→ナブセグメント
が6ビツトの2の補数の2進値によって定義され、ピー
クの範囲内で、特定の信号のサンプルがどのレベルを占
めているかを識別する。各副帯域に対する個々の周波数
副帯域の強さが求められ、かつ取りうる64の値の特定
のサブセグメントとして、これらの6ビツトの2の補数
の2進値によって表わされる。次いで、以下の形式を有
する固定された29のビットを有する側チャネル情報が
伝送される。
5ビツトの2進値(取りうる32のセグメント内のブロ
ック・ピーク・セグメント数全体をコード化する)の後
に、個々の周波数副帯域が求められた、識別されたブロ
ック・ピーク・レベル・セグメントの取りうる64のセ
グメント内のセグメントを示す8つの周波数副帯域の各
々に対する3つのビット(計24ビットの2進数)。上
述したように、各周波数副帯域のピークを表わすのに必
要なビット数が、取りつる6つのビットのうちの幾つか
を識別するのには、3つの2進ビツトのみが利用される
ということを、想起されたい。所定の副帯域ピーク・サ
ンプルが占める64の取りつるレベルからのレベルを2
進数でコード化するには、Oないし6のビットが必要で
あるが、Oないし6ビツトのうちどれが、この副帯域内
のピークに割り当てられているかを、受信器に伝えるに
は、2進値の3つのビットだけが必要となる。
上述の形式の側チャネル情報の伝送後、主チャネル情報
、すなわち個々の信号のサンプル(全部で32のサンプ
ル)が伝送される。各サンプルを表わすために使用され
るビット数は、この発明にしたがって利用されるテーブ
ルで求められる値にしたがって切捨てられる。全体的に
単純化した場合、最低限受入れ可能な品質が提供される
と、これは伝送される信号のサンプルで、最も低いビッ
トX個が省かれたことを決定する。ただし、Xは最低限
受入れ可能な品質のサービスに関連したテーブルで求め
られる値である。実際には、省かれるビットの数は、4
ミリ秒ごとに異なっている。さまざまな品質は省かれる
ビットの平均値をもたらすだけである。
容易に理解できるように、処理全体が4ミリ秒のサンプ
ルの次の信号ブロックに対して繰り返される。
F1発明の効果 副帯域音声コーダにおいて、複数の副帯域に対するビッ
トの割振りを簡単且つ迅速に行うことができる。
【図面の簡単な説明】
第1図は、この発明のビット割振り手法を利用すること
のできる副帯域音声コーダの従来技術の略図である。 第2図は、個々の副帯域のエネルギー・レベルのスペク
トルおよびサンプルの全体的なブロックにおける絶対エ
ネルギー・レベルを、どれ位のビットがそれぞれの信号
サンプルから省くかを定義するビット割振り状態を含む
テーブルをアドレスするテーブル・アドレスとして、利
用する方法を略示する、切捨てられたテーブルを示す図
面である。 2・・・・アナログ・ディジタル変換器、4.6、IS
・・・・クロック、5・・・・並列フィルタ・バンク、
8・・・・サンプル・コンバンク゛および量子化器、9
・・・・ピーク量子化器、10・・・・フォワード誤り
訂正コード発生器、1]・・・・動的ビット割振り回路
、13・・・・並−直列変換器。 出願人  インターナショナル・ビジネス・マシーンズ
・コーポレーション 代理人  弁理士  岡  [a  次  生(外1名

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声信号のサンプリングを行つてディジタル
    ・サンプル信号を生じる手段と、該ディジタル・サンプ
    ル信号を複数の副帯域における複数のディジタル成分信
    号に分ける手段と、該ディジタル成分信号を圧縮若しく
    は正規化したものを表わすコード信号を、圧縮若しくは
    正規化の態様を示す標識と共に送信する手段とを有する
    型の副帯域音声コーダにおいて、上記ディジタル成分信
    号を相次ぐ時間ブロックに区分し、各時間ブロック毎の
    ディジタル成分信号全体に関するブロック・ピーク・エ
    ネルギー・レベルを測定すると共に、各副帯域毎のディ
    ジタル成分信号に関する副帯域ピーク・エネルギー・レ
    ベルを測定し、ブロック・ピーク・エネルギー・レベル
    測定値及び副帯域ピーク・エネルギー・レベル測定値に
    応じて、各時間ブロックにおける上記ディジタル成分信
    号のコード化のためのビットの数を削減することを特徴
    とする副帯域音声コーダ用ビット割振り方法。
  2. (2)削減すべきビットの数を表わす数値を記憶してい
    るテーブルを、上記ブロック・ピーク・エネルギー・レ
    ベル測定値および副帯域ピーク・エネルギー・レベル測
    定値に従ってアクセスすることを含む特許請求の範囲第
    (1)項記載の副帯域音声コーダ用ビット割振り方法。
JP62117250A 1986-08-25 1987-05-15 副帯域音声コ−ダ用ビツト割振り方法 Pending JPS6358500A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US900113 1986-08-25
US06/900,113 US4899384A (en) 1986-08-25 1986-08-25 Table controlled dynamic bit allocation in a variable rate sub-band speech coder

Publications (1)

Publication Number Publication Date
JPS6358500A true JPS6358500A (ja) 1988-03-14

Family

ID=25411991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62117250A Pending JPS6358500A (ja) 1986-08-25 1987-05-15 副帯域音声コ−ダ用ビツト割振り方法

Country Status (4)

Country Link
US (1) US4899384A (ja)
EP (1) EP0259553B1 (ja)
JP (1) JPS6358500A (ja)
DE (1) DE3784120T2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04199200A (ja) * 1990-11-29 1992-07-20 Matsushita Electric Ind Co Ltd 帯域分割符号化のビット割当方法
JP2013534328A (ja) * 2010-07-30 2013-09-02 クゥアルコム・インコーポレイテッド ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体
WO2014091694A1 (ja) * 2012-12-13 2014-06-19 パナソニック株式会社 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742735A (en) * 1987-10-06 1998-04-21 Fraunhofer Gesellschaft Zur Forderung Der Angewanten Forschung E.V. Digital adaptive transformation coding method
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
DE69132427D1 (de) * 1990-07-05 2000-11-02 Fujitsu Ltd Digitalmultiplex-Übertragungssystem
DE69232202T2 (de) * 1991-06-11 2002-07-25 Qualcomm Inc Vocoder mit veraendlicher bitrate
US5369724A (en) * 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
US5394508A (en) * 1992-01-17 1995-02-28 Massachusetts Institute Of Technology Method and apparatus for encoding decoding and compression of audio-type data
TW235392B (ja) * 1992-06-02 1994-12-01 Philips Electronics Nv
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder
US5479447A (en) * 1993-05-03 1995-12-26 The Board Of Trustees Of The Leland Stanford, Junior University Method and apparatus for adaptive, variable bandwidth, high-speed data transmission of a multicarrier signal over digital subscriber lines
CN1045852C (zh) * 1993-10-08 1999-10-20 索尼公司 数字信号处理装置和数字信号处理方法
US5506866A (en) * 1993-11-15 1996-04-09 At&T Corp. Side-channel communications in simultaneous voice and data transmission
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5761636A (en) * 1994-03-09 1998-06-02 Motorola, Inc. Bit allocation method for improved audio quality perception using psychoacoustic parameters
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
KR100648475B1 (ko) * 1996-01-29 2007-01-31 소니 가부시끼 가이샤 통신자원할당방법및장치
CN1106085C (zh) * 1996-04-26 2003-04-16 德国汤姆逊-布朗特公司 对数字音频信号编码的方法和装置
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
DE19727938B4 (de) * 1997-07-01 2006-12-14 Mayah Communications Gmbh Verfahren und Vorrichtung zum Codieren von Signalen
US6075821A (en) * 1997-12-16 2000-06-13 Integrated Telecom Express Method of configuring and dynamically adapting data and energy parameters in a multi-channel communications system
US6094459A (en) * 1997-12-16 2000-07-25 Integrated Telecom Express Circuit for configuring data and energy parameters in a multi-channel communications system
US6084917A (en) 1997-12-16 2000-07-04 Integrated Telecom Express Circuit for configuring and dynamically adapting data and energy parameters in a multi-channel communications system
US6128348A (en) * 1997-12-16 2000-10-03 Integrated Telecom Express Method for configuring data and energy parameters in a multi-channel communications system
US6084906A (en) * 1997-12-17 2000-07-04 Integrated Telecom Express ADSL transceiver implemented with associated bit and energy loading integrated circuit
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
FR2791166B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage
WO2001035394A2 (en) * 1999-11-08 2001-05-17 Ericsson Inc. Integrated voice and data transmission based on bit importance ranking
US6369722B1 (en) 2000-03-17 2002-04-09 Matra Nortel Communications Coding, decoding and transcoding methods
JP2005071522A (ja) * 2003-08-27 2005-03-17 Sony Corp コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
CN101989428B (zh) * 2009-07-31 2012-07-04 华为技术有限公司 比特分配方法、编码方法、解码方法、编码器及解码器
FR2973551A1 (fr) * 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
MX2013013261A (es) 2011-05-13 2014-02-20 Samsung Electronics Co Ltd Asignacion de bits, codificacion y decodificacion de audio.

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53135561A (en) * 1977-04-29 1978-11-27 Ibm Method of quantizing signal
JPS58154948A (ja) * 1982-02-09 1983-09-14 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン デイジタル伝送方法
JPS58193598A (ja) * 1982-05-07 1983-11-11 日本電気株式会社 音声符号化方式とそれに供する装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS542050A (en) * 1977-06-07 1979-01-09 Nec Corp Block coding and decoding system
FR2412987A1 (fr) * 1977-12-23 1979-07-20 Ibm France Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede
US4386237A (en) * 1980-12-22 1983-05-31 Intelsat NIC Processor using variable precision block quantization
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
CA1253255A (en) * 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53135561A (en) * 1977-04-29 1978-11-27 Ibm Method of quantizing signal
JPS58154948A (ja) * 1982-02-09 1983-09-14 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン デイジタル伝送方法
JPS58193598A (ja) * 1982-05-07 1983-11-11 日本電気株式会社 音声符号化方式とそれに供する装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04199200A (ja) * 1990-11-29 1992-07-20 Matsushita Electric Ind Co Ltd 帯域分割符号化のビット割当方法
JP2013534328A (ja) * 2010-07-30 2013-09-02 クゥアルコム・インコーポレイテッド ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体
US8831933B2 (en) 2010-07-30 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9767815B2 (en) 2012-12-13 2017-09-19 Panasonic Intellectual Property Corporation Of America Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
RU2643452C2 (ru) * 2012-12-13 2018-02-01 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство кодирования аудио/голоса, устройство декодирования аудио/голоса, способ кодирования аудио/голоса и способ декодирования аудио/голоса
EP2933799A4 (en) * 2012-12-13 2016-01-13 Panasonic Ip Corp America VOICE AUDIO ENCODING DEVICE, VOICE AUDIO DECODING DEVICE, VOICE AUDIO ENCODING METHOD, AND VOICE AUDIO DECODING METHOD
JPWO2014091694A1 (ja) * 2012-12-13 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
WO2014091694A1 (ja) * 2012-12-13 2014-06-19 パナソニック株式会社 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
EP3232437A1 (en) * 2012-12-13 2017-10-18 Panasonic Intellectual Property Corporation of America Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
CN107516531A (zh) * 2012-12-13 2017-12-26 松下电器(美国)知识产权公司 语音声响编码装置和解码装置、语音声响编码和解码方法
CN104838443A (zh) * 2012-12-13 2015-08-12 松下电器(美国)知识产权公司 语音声响编码装置、语音声响解码装置、语音声响编码方法及语音声响解码方法
US10102865B2 (en) 2012-12-13 2018-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
EP3457400A1 (en) * 2012-12-13 2019-03-20 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
JP2019191594A (ja) * 2012-12-13 2019-10-31 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
US10685660B2 (en) 2012-12-13 2020-06-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
CN107516531B (zh) * 2012-12-13 2020-10-13 弗朗霍弗应用研究促进协会 语音声响编码装置和解码装置、语音声响编码和解码方法
JP2022050609A (ja) * 2012-12-13 2022-03-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法

Also Published As

Publication number Publication date
EP0259553B1 (en) 1993-02-10
DE3784120D1 (de) 1993-03-25
DE3784120T2 (de) 1993-08-12
US4899384A (en) 1990-02-06
EP0259553A2 (en) 1988-03-16
EP0259553A3 (en) 1989-06-07

Similar Documents

Publication Publication Date Title
JPS6358500A (ja) 副帯域音声コ−ダ用ビツト割振り方法
JP2732854B2 (ja) ディジタルオーディオ信号のサブバンド符号化用ディジタルシステム
KR100242864B1 (ko) 디지탈 신호 부호화 장치 및 방법
US5623577A (en) Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5632003A (en) Computationally efficient adaptive bit allocation for coding method and apparatus
EP0628195B1 (en) Method for encoding, decoding and compression of audio-type data
US4142071A (en) Quantizing process with dynamic allocation of the available bit resources and device for implementing said process
JP3390013B2 (ja) 広帯域デジタル情報信号の符号化及び復号化
JP3134455B2 (ja) 高能率符号化装置及び方法
KR100295217B1 (ko) 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치
US5625746A (en) Method and apparatus for encoding, decoding and compression of audio-type data
EP1596366A1 (en) Digital signal encoding method and apparatus using plural lookup tables
US5946652A (en) Methods for non-linearly quantizing and non-linearly dequantizing an information signal using off-center decision levels
AU677688B2 (en) Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
KR100300957B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
Pan Overview of the mpeg/audio compression algorithm
KR0152016B1 (ko) 가변 비트할당을 이용한 부호화 및 복호화시스템
JP3060229B2 (ja) 信号処理装置及び信号処理方法
JPH0750589A (ja) サブバンド符号化装置
JPH0360529A (ja) 量子化装置及び量子化方法
JP3011447B2 (ja) 帯域分割符号化装置
EP1176743B1 (en) Methods for non-linearly quantizing and dequantizing an information signal
KR0134350B1 (ko) 적응적 비트할당을 이용한 부호화 및 복호화시스템
KR940010542A (ko) 가변비트할당 방식의 부호화시스템