JPH03505929A - 適応変換コード化の改良 - Google Patents
適応変換コード化の改良Info
- Publication number
- JPH03505929A JPH03505929A JP1506838A JP50683889A JPH03505929A JP H03505929 A JPH03505929 A JP H03505929A JP 1506838 A JP1506838 A JP 1506838A JP 50683889 A JP50683889 A JP 50683889A JP H03505929 A JPH03505929 A JP H03505929A
- Authority
- JP
- Japan
- Prior art keywords
- bit
- bit allocation
- signal
- bits
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 34
- 238000000034 method Methods 0.000 claims description 78
- 238000013139 quantization Methods 0.000 claims description 24
- 238000005311 autocorrelation function Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000000903 blocking effect Effects 0.000 claims 1
- 238000009795 derivation Methods 0.000 claims 1
- 238000010187 selection method Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 description 35
- 230000008569 process Effects 0.000 description 17
- 238000012805 post-processing Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007665 sagging Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
適応変換コード化の改良
[産業上の利用分野]
本発明は、スピーチコード化の分野に関し、特定すると、コード化ビットレート
が最低に維持されるスピーチ信号の適応変換コード化の分野における改良に関す
る。
[技術背景]
電気通信回路網は、ボイスおよびデータ両者に対して完全にディジタル化伝送技
術に向かって迅速に進展しつつある。最初のディジタル搬送装置の1つは196
2年頃に米国において導入された24ボイスチャンネル1.544 Mb/sT
lシステムであった。より賓用のかかるアナログシステムに優る利点のため、T
Iシステムは広く利用されることになった。TIシステムにおける個々のボイス
チャンネルは、ボイス信号を約300〜3400 Hzの周波数範囲に帯域制限
し、この制限された信号を8にHzのレートでサンプルし、ついでサンプルされ
た信号を8ビツト対数量子化器でコード化することによって発生される。得られ
た信号は、64Kb/sディジタル信号である。 TIシステムは、24の個々
のディジタル信号を単一のデータ流に多重化する。 TIシステムは、単一グル
ープにおけるボイスチャンネルの数を24に制限する。チャンネルの数を増加し
、約1.544 Mb/+の伝送レートをなお維持するためには、個々の信号伝
送レートは、64Kb/sのレートから減ぜられねばならない、このレートを減
するのに使用される1つの方法は、変換コード化として知られている。
スピーチ信号の変換コード化においては、個々のスピーチ信号は、スピーチサン
プルの逐次のブロックに分割される。各ブロックのサンプルは、それからベクト
ルに配列され、時間領域から周波数領域のような代わりの領域に変換される。サ
ンプルブロックを周波数領域に変換すると、種々の程度の振幅を有する1組の変
換係数が創成される。各係数は独立的に量子化され、伝送される。
受信端においては、サンプルは量子化が解除され、時間領域に再変換される。変
換の重要性は、変換領域における信号表示が、冗長情報の量を減する、すなわち
、サンプル間の相関が小さいということである。したがって、所与の誤差値(例
えば平均二乗誤差分布)に関して所与のサンプルブロックを量子化するのに、同
じブロックを原時間領域で量子化するのに必要とされるビット数より少ないビッ
トしか必要としない。
この種の従来の変換コード化システムの例は、第1図により詳細に示されている
。スピーチ信号は、バッファ1oに供給されるが、このバッファは、予定数の逐
次のサンプルをベクトルXに配列するものである。ベクトルXは、変換部12に
より時間領域から単位マトリックスAを使用する代わりの領域に直線的に変換さ
れ、ベクトルyを生ずる。ベクトルyの要素は、量子化器14により量子化され
、ベクトルYを生じ、このベクトルが伝送される。ベクトルYは、量子化解除器
16により受信され、脱量子化され、そして逆変換部18により逆マトリックス
A−1を使用して時間領域に変換される。得られた時間領域サンプルのブロック
は、バッファ20により逐次列に戻される。バッファ20の出力は、理想的には
再構成された原信号である。
変換コード化体系は個々のT1チャンネルのビットレートを減する必要性につい
て理論上満足できたが、量子化は、履歴的に雑音および歪について容認できない
量の雑音を生じた。雑音および歪の問題は、大部分2つの面から生ずる。すなわ
ち、原信号を効率的に変換する種々のマトリックスを得ることができないこと、
量子化工程において発生される歪みおよび雑音から生ずる。
変換効率を最適化する試みにおいては、種々の変換マトリックスが評価された。
一般的に、最適の変換マトリクスがKarhunen−Loeve 変換(K
LT)であることは同意できる。しかしながら、この変換に関する問題は、それ
が高速計算アルゴリズムを欠き、マトリクスが信号依存性であるということであ
る。したがって、他の変換、例えば、Wa Ish−Hadamard変換(W
)IT) 、離散傾斜変換(DST) 、離散フーリエ変換(DFT)、対称離
散フーリエ変換(SDFT)、離散余弦変換(DCT)が研究された。 5DF
TおよびDCTは、効率においてにLTにもつとも近いと思われ、信号非依存性
であり、高速アルゴリズムを包含している。
歪みおよび雑音の問題を解決しようとする試みにおいて、先行の研究は、量子化
プロセスに中心が置かれた。
量子化は、アナログ信号をディジタル形式に変換する手続きである。情報理論に
関するIRE Transactions Vol。
IT−6(1960年3月) ?−12頁のJoel Maxのr Quant
izationfor MInimum Distortion」なる論文は、
この手続きを論述している。量子化に置いて、信号の振幅は有限数の出力レベル
により表わされる。各レベルは別個のディジタル表示を有する。各レベルはその
レベル内にあるすべての振幅を包含するから、得られたディジタル信号は、原ア
ナログ信号を精確に反映しない、アナログおよびディジタル信号間の差は、量子
雑音である0例えば信号Xの均一な量子化を考慮する。ここで、Xは、0.00
乃至10.00間の任意の実数であり、それぞれ1.00.3.00.5.00
.7.00および9.00に5つの出力レベルが得られるものとする。この第1
のレベルを表わすディジタル信号は、0.00および2.00間の任意の実数を
表わし得る。所与の入力信号範囲に対して、発生される量子信号は、出力レベル
の数に逆比例する。早期の変換コード化のための量子化研究においては、低ビツ
トレートではすべての変換係数は量子化され伝送されていないことが分かった。
対数特性を有しかつビット割当て体系を有する量子化器を包含した。しかして、
量子化体系は、ある数の変換係数を含む所与のサンプルブロックに該量子化器に
より割り当てられるべき最適数のビットを決定するのに使用された、この種のビ
ット割当て体系は、長期間にわたり被変換信号の二乗平均歪を考慮に入れた式を
利用した。
この形式の手法は、固定ビット割当て法であると認められた。何故ならば、ビッ
ト割当ておよびステップサイズが演鐸的に固定され、長期間スピーチ統計値に基
づくからである。上述のように、低ビツトレートにおいて起こる主たる問題は、
各ブロックにおけるスピーチサンプルまたは係数のすべてを量子化するのに十分
の数のビットを欠くことであった。若干のスピーチサンプルは失われた。したが
って、低ビツトレートでは、これらのビット割当て体系を利用する歪ノイズは不
満足のまま残った。
低ビツトレートにおける変換コード化歪ノイズを改善しようとする他の試みは、
ダイナミックビット割当ておよびダイナミックステップ−サイズ決定法を使用す
る量子化法を研究することを包含した。ビット割当ては、スピーチ信号の短期間
(時間)統計値、すなわちブロック毎に起こる統計値に適応せしめられ、ステッ
プサイズは、各ブロックに対する変換のスペクトル情報に適応せしめられた。こ
れらの技術は、適応変換コード化法として知られた。
変換コード化においては、最適ビット割当ておよびステップサイズは、適応アル
ゴリズムにより普通各サンプルブロックに対して決定されるのであるが、この適
応アルゴリズムは、各ブロックにおける変換係数の振幅のパリアンスについての
ある知識を必要とする。スペクトルトル包絡線は、各サンプルブロックにおける
変換係数のパリアンスにより形成される包絡線である。各ブロックにおけるスペ
クトル包絡線を知ると、ステップサイズおよびビット割当てのより最適な選択が
可能となり、より低歪およびノイズを有するより正確な量子化信号が得られるの
である。
量子化プロセスを補助するためにパリアンスないしスペクトル包絡線情報が発生
されるから、この同じ情報が、量子化解除プロセスに必要となる。したがって、
適応変換コード化はまた、パリアンスまたはスペクトル包絡線の伝送を用意する
。これはサイド情報と称される。
適応変換コード化における全体的目的はビットレートを減することであるから、
実際のパリアンス情報はサイド情報として伝送されず、代わりにスペクトル包絡
線を決定し得る情報が伝送される。
スペクトル包絡線は、変換領域においてスピーチのダイナミック特性、すなわち
ホルマントを表わす、スビー合(例えば有声摩擦子音)のいずれかである励起信
号を生成することによって発生される。励起信号の周期的成分は、ピッチとして
知られる。スピーチ中、励起信号は、口、顎、唇、鼻空胴等の位置により決定さ
れる声道フィルタにより濾波される。このフィルタは、聴かれつつある音の性質
を決定する共振またはホルマントを有する。声道フィルタは、励起信号に対して
包絡線を提供する。この包絡線はフィルタホルマントを含むから、これはホルマ
ントまたはスペクトル包、絡線として知られる。
スピーチの発生は、スピーチ特性が励起信号および声道フィルタをコンポリュウ
ションすることにより数学的に表わされるようにモデル化できる。この種のモデ
ルにおいて、声道フィルタ周波数レスポンス、すなわちスペクトル包絡線は、周
波数領域におけるスピーチ信号の変換係数のパリアンスの評価値である。したが
って、スペクトル包絡線の決定情報がより精確になればなるほど、被変換スピー
チ信号をコード化するのに使用されるステップサイズおよびビット割当て決定情
報はより量的となる。かくして、適応変換コード化技術は、低ビツトレートにて
個々のボイス信号を効率的にコード化し、伝送することができると思われる。
上述の点にかんがみて、適応変換コード化の研究は、スペクトル包絡線をより精
確に決定するための種々の技術に集中された。 IEE Transactio
ns on Acoustics、5peech and Signal Pr
ocessinng、 Vol、 ASSP−25,No、4(1977年8月
) 、 pp、299−309に開示されるR、 Zeliinski等 の
’Adaptive Transform Coding of 5peec
h Signal」と題する論文、およびTEEE Transaction
on Acoustics、 5peech and Signal Pr
ocessing、 Vol、 ASSP−27,No。
1 (1979年2月) 、 pp、89−95のR,Zelinski等の
”Approaches to Adaptive Transform 5p
eech coding at Low BitRates”と題する論文に開
示される1つの早期の技術は、変換係数を平方し、ついで 予め選択された数の
隣接する係数にわたり係数を平均することによって、スペクトル包絡線を求める
ことを含む、平均された係数の大きさは、それ自体量子化され、サイド情報とし
てコード化信号とともに伝送される。全係数のスペクトル値を得るため、平均さ
れた係数は、幾何的に内挿される(すなわち、対数領域において直線的に内挿さ
れる)結果は、周波数領域におけるスペクトルレベルの区画的概略値、すなわち
パリアンスであった。これらの値は、ついで、ビット割当ておよびステップサイ
ズアルゴリズムにより使用された。
この技術は、64kb/sより低いビットレートにて受は入れられる歪およびノ
イズを示したが、この早期の技術に関する問題は、おおむね16および20kb
/s間に限界を有することであった。この限界以下では、先行の変換コード化技
術により示された同じ問題の若干のものは存在した、すなわち、ブロック当り十
分の数のビットの欠如に起因して変換係数のあるものを量子化できないことであ
る。したがって、いくつかの必須のスピーチ要素が失われた。この早期の技術で
必須のスピーチ要素を失う1つの理由は、この技術が、パリアンス情報およびビ
ット割当てを決定するに際して全極声道モデルおよびピッチモデルのようなスピ
ーチの既知の性質を考慮に入れないという意味において非スピーチ特有であった
ということである。
R6にb/sまたはそれ以下のビットレートで 適応変換コード化を利用する試
みとして、スピーチ特有の適応アルゴリズムを開発する努力がなされた。スピー
チ特有の技術においては、スピーチ信号におけるピッチおよびホルマント情報の
両方を考慮すべきである。したがって、適応変換コード化装置において利用され
る変換体系は、スペクトル包絡線を生ずるだけでなく、好ましくはピッチじまを
表わすのに利用できる調整項を含むのがよい。
IEEE Transactions on Accoustics、 5pe
ech and SignalProcessing、 Vol、 ASS
P−27,No、 (1979年10月)、 pp、512−530におけ
るJ、 Tribolet 等の’Frequency DomainCod
ing of 5peech」 と題する論文に開示される1つのスピーチ特有
の技術は、変換係数を得るためにOCTを利用するものであるが、この技術は、
まずOCT係数を平方し、ついでこの平方された係数を逆DFTを使用して逆変
換することによってOCTスペクトル包絡線を決定した。
得られた時間領域サンプルブロックは、自己相関類似の関数を生じた。これは擬
似ACFと称された。ついで、ある数の初ブロックサンプルの値が、相関マトリ
クスを等成形式で定めるのに使用された。等式の解は、線形予測係数より成る線
形予測モデルをもたらした。線形予測係数の逆スペクトルは、OCTスペクトル
包結線の精確な値を生じた。ピッチパターンを発生するためにには、ピッチ周期
およびピッチ利得を得ることが必要であった。これらのファクタを決定するため
に、この技術では擬似ACFを捜索して、最大値を決定し、そしてこれがピッチ
周期となった。ついで、最大値が決定された点における擬似ACF関数の値と、
擬似ACFのその原点における値との比として、ピッチ利得が定められた。つい
で、求められたスペクトル包絡線および生成されたピッチパターンが、ステップ
サイズおよびビット割当てアルゴリズムと一緒に使用された。
上述のスピーチ特有の技術は、従来伝送されなかった多くのピッチ高調波すなわ
ち、必須のスピーチ要素にビットを強制的に割り当て、ピッチ構造情報を保存す
ることを補助したから、先行の適応変換コード化技術より低いビットレートすな
わち16kb/s以下にて良好に働いたと宣言されている。しかしながら、この
技術に関する問題は、その計算の複雑性に起因するものであった。すなわち、こ
の技術は、2N点のFFT操作、大きさ操作および標準化走査を必要とした。+
IEEE transactions on Con+munication
s Vol、 C0M−30,No、4 (1982年4月)におけるRlCr
ochiere等の’ Real−TirBe 5peech Coding」
と題する論文における結論として、実施のためにはアレイプロセッサが必要
とされた。したがって、この技術は、処理時間またはコストいずれに関しても経
済的でなかった。
したがって、低ビツトレートにて効率的に動作でき、低ノイズレベルを有し、そ
して妥当なコストおよび処理時間での実施が可能な適応変換コード化装置の必要
性がなお存在する。
また、入力信号の広いダイナミックレンジにわたり最適性能とし得、他方におい
て全レベルにて高い信号対雑音比を維持できるコード化装置を設計することの必
要性が存在する。これは、先には、A/D変換を正しくバイアスするように入力
レベルを注意深く制御すること、A/D変換に先立つアナログAGCおよびA/
D変換後のディジタルAGCにより試みられた。入力レベルの注意深い制御は、
すべてではないとにても、殆どの信号が外部源から来るから、稀にしか実行可能
でない、 A/D変換前のAGCは、制御がアナログインターフェースを経て維
持されれば可能である。しかしながら、この種の手続きで普通遭遇する問題は、
上昇および降下時間ならびにバックグラウンドノイズ増幅を含む、また、受信機
における逆AGCは可能でない、ディジタルAGCは、アナログAGCで遭遇す
る問題をともない、またある程度の量子化ノイズを導入し、そしてこれは排除で
きないものである。
さらに、量子化されるべき各係数が整数であることを保証するためにビット割当
て後処理を行う適応変換コード装置の必要性が存在する。ビット割当を遂行する
に際しては、特定の情報すなわち変換係数を量子化するに必要とされるビットの
数を決定するために、1または複数の計算が使用される。この種の計算は、普通
整数を生じず、整数および十進少数、例えば3.66、5.72または2.44
を含む実数をもたらす、ビットが計算された値の整数部分にのみ割り当てられ、
十進端数部分の細部が利用可能なビット数の制限に起因して無視された場合、重
要な情報が失われ、歪ノイズは増大されよう、したがって、十進端数情報を補償
し、歪ノイズを最小にする必要性が存在する。
[発明の概要]
本発明の目的は、低ビツトレートで、最小のノイズおよび歪しか伴わずに、ボイ
ス信号を効率的にコード化し得る方法および装置を提供することである。
本発明の他の目的は、ディジタル信号プロセッサで実施できる、低ビツトレート
における適応変換コード化方法および装置を提供することである。
本発明のさらに他の発明は、ステップサイズおよびビット割当てがブロック毎に
決定される適応変換コード化方法および装置を提供することである。
本発明のこれらおよびその他の目的は、情報サンプルより成るサンプルされた時
間領域情報信号に作用する変換コード化装置であって、情報サンプルグループを
ブロックに逐次分離し、各サンプルブロックを時間領域から、サンプルブロック
が変換係数ブロックにより表わされるところの変換領域に変換する変換コード化
装置でスピーチ信号のホルマント・情報を決定する新規な装置および方法におい
て、各時間領域サンプルブロックの偶数エクステンションを生成し、かかるエク
ステンションから自己相関関数を生成し、自己相関関数から線形予測係数を誘導
し、各変換係数のパリアンスまたはホルマント情報が各FFT係数の利得の平方
に等しくなるように、この線形予測係数に高速フーリエ変換を遂行することを含
む新規な装置および方法で達成される0本発明の他の側面においては、変換係数
のホルマント情報の予定された基数の対数を決定することにより各変換係数に割
り当てられるべきビット数を決定し、ついで各変換係数に割り当てられるであろ
う最少数のビットを決定し、ついで最小ビット数を対数に加えることによって各
変換係数に割り当てられるべきビットの数を決定するための装置および方法が提
供される。
本発明のさらに他の側面においては、各係数に対してなされるビット割当てが整
数値であることを保証する装置および方法が提供される。この目的のため、本発
明は、各ビット割当を次の最高の整数に丸め、ビット割当てを総和し、割り当て
られたビット数と入手し得るビット数間の差を計算し、このようなビット割当て
から1ビツト除去されるべき場合に導入されるであろう歪の量に基づきビット割
当てをランク付けするため、ビット割当のヒストグラムを発生し、割り当てられ
たビット数を利用可能なビット数と等しくするために必要なビット割当てを選択
し、ついで選択されたビット割当てを1ビツトだけ減する。
本発明の他の側面においては、各ビット割当てをもっとも近い整数に丸め、割り
当てられたビット数を総和し、割り当てられたビット数が入手し得るビット数に
等しくなる時点を決定し、課題ビットまたは過小ビットが割り当てられているか
否かに依存して、1ビツトが追加または除去された場合にどのビット割当てに最
少量の歪が導入されるかを決定し、そして選択されたビット割当てを1ビツトだ
け増減することによって、ビット割当てが整数であることが保証される。
本発明のこれらおよびその他の目的および利点は、図面と関連してなされる以下
の説明から明らかとなろう。
[図面の簡単な説明コ
第1図は、従来形式の変換コード化装置の概路線図である。
第2図は、本発明に従う適応変換コード化装置の概路線図である。
第3図は、第2図に図示される適応変換コード化装置において伝送前に遂行され
る諸動作の概略的フローチャートである。
第4図は、第2図に図示される適応変換コード化装置において遂行される受信に
続く諸動作の概略的フローチャートである。
第5図は、第3図および第4図に図示されるダイナミックスケーリング動作の詳
細フローチャートである。
第6図は、第3図および第4図に図示されるLPG係数操作の詳細フローチャー
トである。
第7図は、第3図および第4図に図示される包絡線発生操作の詳細フローチャー
トである。
第8図は、第3図および第4図に図示される整数ビット割当て動作の詳細フロー
チャートである。
第9図は、第3図および第4図に示される適応変換コード化装置と関連して使用
できる好ましビット割当て後処理のフローチャートである。
第10図は、第3図および第4図に図示される適応変換コード化装置と一緒に使
用できる代わりのビット割当て後処理のフローチャートである。
[実施例コ
図面を参照してより完全に説明されるように、本発明は、新規な適応変換コード
化方法および装置で具体化される。
本発明に従う適応変換コード化装置は、第2図に図示されており、総括的に10
として指示されている。コード化装置10の心臓部はディジタル信号処理装置で
あり、そしてこれは、好ましい具体例においては、テキサス州所在のTexas
Instruments、 Incにより製造販売されるTMS320C25
デイジタルル信号プロセッサである。この種のプロセッサは、16ビツトのワー
ド長を有する)〜ルスコード変調信号を処理し得るが、本発明によりコード化の
ため想定される信号のワード長は、16ビ・ントより若干短い、プロセッサ12
は、3本の主バス回路網、すなわち直列ボートバス14、アドレスバス16およ
びデータバス18に接続されるものとして図示されてし)る6本発明に従う適応
変換コード化を遂行するため、ブロモ・ンサ12により利用されるべきプログラ
ミングを記憶するためプログラムメモリ20が設けられている。このプログラミ
ングは、第3〜10図を参照してより詳細に説明される。プログラムメモリ2o
は、プロセッサ12の規格要件に合う十分の速度を有すれば、任意の設計とし得
る。好ましい具体例のブロセ°ツサ(7MS320C25)は内部メモリを備え
ている。いまだ合体されていないが、この内部メモリには適応変換コード化プロ
グラミングを記憶するのが好ましい。
プロセッサ12の動作中必要とされ得るデータ、例えば対数表を記憶のため、デ
ータメモリ22が設けられている。しかして、対数表の使用については追って詳
細に明らかとなろう。
クロック信号が、従来形式の信号発生回路、図示せず、によりクロック人力24
に供給される。好ましい具体例において、入力24に供給されるクロック信号は
40MHzクロック信号である。リセット信号26も、プロセッサ12が最初に
賦活されるときのような適当な時点に、プロセッサ12をリセットするために提
供されている。信号が選ばれたプロセッサにより要求される規格に適合する限り
、この信号を入力26に供給するため任意の従来形式の回路を使用できる。
プロセッサ12は、2方向において電気通信信号を送信および受信するように接
続される。まず、本発明に類似の適応変換コード化装置と通信するときは、ブロ
セツサ12は、直列ボートバス14を介して信号を送信および受信するように接
続される。バス14を圧縮ボイスデータ列と接続するために、チャンネルインタ
ーフェース28が設けられている。インターフェース28は、16Kb/Sで動
作するデータ列と関連してデータを送信、受信することができる任意の周知のイ
ンターフェースとし得る。
第2は、既存の64kb/sチヤンネルまたはアナログ装置と通信するときは、
プロセッサ12はデータバス18を介して信号を受信および送信するように接続
される。コンバータ30が設けられており、入力32に現われる個々の64kb
/sチヤンネルを、バス18に供給のため直列形式から並列形式に変換する。認
められるように、この種の変換は、プロセッサ12により利用される信号の形式
とともに使用できるコードおよび直列/並列デバイスを利用して遂行される。好
まし具体例において、プロセッサ12は、バス18上に並列16ビツト信号を受
信および送信する。バス18に供給されるデータを同期するために、プロセッサ
12の入力34に割込み信号が供給される。アナログ信号を受信するときアナロ
グインターフェース36は、この信号を予定されたレートでサンプルしてコンバ
ータ30に提示することにより、アナログ信号を変換する働きをする。インター
フェース36は、伝送するときは、コンバータ30からのサンプルされた信号を
連続信号に変換する。
次に、第3〜1oを参照してプログラミングについて説明するが、このプログラ
ミングは、第2図に図示される要素との関連において利用されるとき、新規な適
応変換コード化装置を提供する0本発明に従い電気通信信号を伝送するための適
応変換コード化は、第3図に図示さ、れている、コード化および送信されるべき
電気通信信号は、バス18上に現われ、入力バッファ50に提示される。この電
気通信信号は、各サンプルの16ビツトPCM表示より成る被サンプル信号であ
ることが思い起こされよう、また、サンプリングリングは8KHzの周波数で行
われることも思い起こされよう0本記述の目的のため、8 KH2にてサンプル
されたボイス信号が伝送のためにコード化されるべきものと仮定する。バッファ
50は、予定数のサンプルをサンプルブロックに累積する。好ましい具体例にお
いて、各ブロックに128のサンプルが存する。
サンプルの各ブロックは、52にて窓掛けされる。好まし具体例において、利用
される窓掛は技術は台形窓[h(sR−11!]であるが、これにあってはMの
スピーチサンプルの各ブロックがRのサンプルだけ重畳される。
Mのサンプルの各ブロックは、54にて動的にスケーリングされる。ダイナミッ
クスケーリングは、ブロックごとに信号対雑音比を増すとともに、プロセッサ1
2の全ダイナミックレンジを短時間基準で使用するようにプロセッサのパラメー
タを最適化する。かくして、高い信号対雑音比が維持される。
第5図を参照すると、ダイナミックスケーリングが、まず主題のブロックにおけ
る最大値を決定することによって達成されるものとして示されている。最大値が
56にて決定されると、かかる最大値の最上位ビット(MSB)の位置が58で
見つけられる。例えば、主題のブロックの最大値が、数6の16ビツト2進表示
であると仮定する、プロセッサのワード長は16であり、他方数6のワード長は
たった3、最上位ビットの位置(すなわち、右から左へ1から計数すれば位置3
)である、この例における各位置の値は位置番号に等しい、すなわち、位置3は
3の値を有し、位置16は16の値を有する。2進表示は、ここでは、下記の式
に従い60で左にシフトされる。すなわち、
MSBの左シフト= [15−(MSB+1)] (1)数1
5は、16ビツトワード長に対する最上位位置MSBを表す、数6の2進表示は
、そのとき左に11位置シフトされろことになろう(すなわち、0011000
000000000)にシフトされることになろう。
サンプルの動的にスケーリングされたブロックの受信は、反対の動作が遂行され
ることを必要とする。したがって、左シフトの量は、サイド情報として伝送され
るべきことを必要とする。好ましい実施例においては、最上位ビットの位置は、
62にてサイド情報として各ブロックとともに伝送される0式(1)は、左シフ
ト数が16ビツトプロセツサに対しては決して15を越えないことを保証するか
ら、二進形式でこのサイド情報を伝送するには、たった4ビツトしか必要とされ
ない、左シフトの量は1だけインクリメントされることが注目されよう、このイ
ンクリメントは、オーバーフローなしにゲインを処理する余裕を与える。
第3図の54にて主題のサンプルブロックを動的にスケーリングした後、主題の
ブロックは、64にて離散余弦変換を利用して、時間領域から周波数領域に変換
される。この種の変換は変換係数のブロックをもたらすが、該係数は66にて量
子化される。量子化は、ガウスの信号について最適化された量子化器によって各
変換係数について遂行される。この量子化器は周知である(M3)(参照)、ゲ
イン(ステップサイズ)の選択および個々の係数当たりに割り当てられるビット
の数は、本発明の適応変換コード化機能に基本的である。この情報なしでは、量
子化は適応性とならない。
ブロックごとに利得およびサンプル当たりのビット割当てを発生するためには、
ビット割当に対する既知の式をまず考慮する。すなわち、
RI”Rava◆0.5X [VI”/Vbloek”l (
2)ここで、
vThl、e*”−” t [rI 1.L、S Vi” ]
(3)RT6tlll” Σl−1,N[R1]
(4)ここで、
R1は第1番目のDCT係数に割り当てられるビットの数である。
RT。talはブロック当りに利用可能なビットの総数である。
RaV@は各DCT係数に割り当てられた平均ビット数である。
R,2は第i番目のOCT係数のパリアンス。
Vbl。cm”はV l0CT係数に対する幾何平均である。
式(2)はビット割当て式であり、そしてこの式から、得られるR1は、加算さ
れるとき、ブロック当りに割り当てられるビットの総数に等しくなるはずである
。下記の新しい誘導法は、実施の要件をかなり減じ、好ましい実施例のプロセッ
サを利用するとき必要とされるような、16ビツト固定小数点演算を使用する計
算を遂行することと関連するダイナミックレンジの問題を解決する0式(2)は
下記のように確認できる。
R+”[Ravs−10g2(Vblock2)]”0.5 X log
z(L”) (5)角括弧内の項は予め計算でき、そしてそれらは係数指
数(i)に依存しないので、この項は一定であり、Gammaとして指示し得る
。それゆえ、式(5)は下記のように書き直すことができる。
RIIIGamma + 0.5 X S+ (6)
S+□ logz (vi”) (7)項v
liは、第i番目のDCT係数のパリアンスすなわちi番目の係数がスペクトル
包絡線において有する値である。したがって、スペクトル包絡線を知ると、上述
の式に対する解が得られる。 OCTスペクトルのスペクトル包絡線を決定す
るための新しい技術が開発された。スペクトル包絡線は下記のように定義される
。
H(z) =利得/(1÷Σkl!1. P [ai+X z−’]
(8)しかして、この式はz、 eJ2pl T+/1Ml [iJ、N−1
]で求められるものとする。
ここで、H(z)はDC丁のスペクトル包絡線であり、akは線形予測係数であ
る。かくして、式(8)は1組のLPS係数のスペクトル包絡線を定める。
DCT領域内のスペクトル包絡線は、 LPG係数を変更し、ついで式(8)の
値を求めることにより誘導できる。
第3図に示されるように、窓掛けされた係数は、68にて1組のLPG係数を決
定するように作用される。 LPG係数を決定するための技術は、第6図により
詳細に示されている。窓掛けされたサンプルブロックは、7oにてx(n)で指
示されている。 x(n)の偶数エクステンションは72にて生成されるが、こ
のエクステンションはy (n)でY(n) ・x(n) n g 0
1N−1(9)* x(2N−1−n) n * N、 2N−1式(9)の
自己相関関数(ACF)は、74にて生成される。
y(n)のACFは、擬似ACFとして利用され、そしてLPGがこの擬似AC
Fから76にて既知の態様で誘導される。
LPG (ak)を発生した後、式(8)はここでスペクトル包絡線を決定する
ようにその値を求めることができる。擬似ACFは、76にて利用されることに
加えて、ピッチ縞情報を発生するために82にも提供される。また第3図におい
ては、好ましい具体例において、LPSが包絡線の生成前に78で量子化される
ことも認められよう、この点における量子化は、点80におけるサイド情報とし
てLPSの伝送を可能にする目的を果たす。
第3図に示されるように、スペクトル包絡線およびピッチ縞情報が、82にて決
定される。これらの決定の詳細な記載は第7図に示されている。まず、スペクト
ル包絡線の決定について考察する。信号ブロックz (n)が84で形成される
が、このブロックは、式(8)の分母を表わすものである。ブロックz (n)
はさらに下記のように定義される。すなわち、
z(n)+1.Onm0
IIannIIl、P(10)
+0. On+P+1.2N−1
ブロツクz (n)は、その後高速フーリエ変換(FFT)を使用してその値を
求められる。さらに詳述すると、z (n)は、N一点FFTを使用することに
より86にてその値を求めることができる。ここで、z(n)は0−N−1の値
のみを有する。かかる操作は、1llO,2,4,6,・・・、N−2に対する
結果V−をもたらす、弐′(7)はv 、 tの対数Logtを必要とするから
、各パリアンスの対数が88で決定される。奇数順番の値を得るためには、■・
1,3,5.N−1に対する下記の式を使用して、幾何的内挿が0で+12の対
数領域において遂行される。すなわち、
VL(i)冨
−0,25X VL (i−3)+0.75x VL (i−1) +〇、75
X VL (i−1)−0,25x VL(i−3)
(11)ここで、VL (i) ”LOgi (v l z)好ま
しくはないが、2N点FFTを利用してz (n)の値を求めることもできる。
この状況の下では、いかなる内挿をも遂行することは必要でないであろう、 2
N点FFTを使用することに関する問題は、FFTがサイズの2倍であるから、
好ましい方法よりも処理時間がかかることである。
パリアンス(vi”)は、64にて決定される各OCT係数に対して92で決定
される。パリアンス■12は、式(8)の大きさの2乗と定義される。ここで、
H(z)は下式で求められる。
Z、 eJ!PIイi/2Nl 1IIO,N−1に対してより簡単にする
ため、下式について考える。すなわち、
vi” ” [利得/FFTl] (7)大きさの2乗 (12)項vl
!は、FF丁分母が90で決定されるi番目のFFT係数であるから、いまや比
較的容易に決定できる。スペクトル包絡線、すなわち64で決定される各DDT
係数のパリアンスを決定した後、これらの値は、ピッチ情報と結合のため94に
結合される。
以前の適合変換コード化装置において必須のスピーチ要素を失う理由は、この種
のコード化装置が非スピーチ特性であったからであることが思いよこされよう、
スピーチ特有技術においては、ピッチおよびホルマント両者(すなわちスベク包
路線)の情報が考慮される。また、従来のスピーチ特有の技術は、ピッチ周期お
よびピッチ利得からピッチモデルを生成することによって、ピッチ情報ないしピ
ッチ縞を考慮に入れたことが思い起こされよう、これらの2つのファクタを決定
するために、この技術では、ピッチ周期となる最大値を決定するため、疑似AC
Fを捜索した。その後、ピッチ利得が、最大値が決定された点における疑似AC
F関数の値と、その源の疑似ACFの値開の比として定められた。この情報の場
合、ピッチすなわち線周波数領域におけるピッチパターンは、下記のように定義
されよう、すなわち、E、11ch(K) K−0,N−1(13)この
従来技術を利用して周波数領域におけるピッチパターンを生成するためには、下
記のように、時間領域インパルス列p (n)を定めることになろう。
P(n) −(PzaIn)” n−kXP、 k−0,1,2,3,・・
・(14)p(n) m OnはkXpに等しくない。
ここで、PzaInはピッチ利得であり、Pはピッチ周期である。
この列は、長さ2Nの有限列を生成するため台形窓により窓掛けされた。N点の
みに対するスペクトルレスポンスを生成するために、2N一点の複合FFTが列
から取り出された。結果の大きさは、単位利得に対して標準化されると、必要と
されるスペクトルレスポンスFp+tc++(k)を生じた。最終的スペクトル
評価値を生成するため、ピッチ縞およびスペクトル包絡線は、乗算され、標準化
された。
結合されたピッチ縞およびスペクトル包絡線情報をグラフ化すると、ピッチは一
連のU字状曲線として現れ、そしてこの曲線においては、 2N点窓にPの反復
が存在する。この全プロセスは、各サンプルブロックに対して適応的に遂行され
る。この従来技術に関する問題は、その実施の複雑性であった0本発明において
は、ピッチ縞は、実施がずっと簡単になるように考慮に入れられる。
前述の技術にかんがみて、ピッチ周期が1であり、有限のシーケンスを発生する
のに使用される窓が方形である場合について考察する。ピッチの得られたスペク
トルレスポンスは、単一のU字状であり、そしてこれは本発明の目的に対して下
記のように定義されよう。
STR(k) k雰0.2N−1に対して (15)1以外
の異なる値のピッチ周期に対して、スペクトルレスポンスFpltChは単に5
TKR(k)、 mojulo 2Nのサンプルバージョン、すなわち
Fp+tch(k) * sTに (K X P) moau I@ 2N
K−o、 n−1(16)であることがわかる、さらに、エネルギおよび大
きさに対して−スケーリング されるとき、同じピッチ周期な維持するPgll
lllの異なる値に対するピッチ縞 (STR1間の差は、主としてU字状の幅
に主として関係づけられることがわかる。上のことに基づき、各サンプルブロッ
クに対するピッチスペクトルレスポンスを適応的に決定することは必要でなく、
この種の情報は演鐸的に開発された情報を使用することとによって生成できるこ
とがわかる0本発明の一側面においては、ピッチスペクトルレスポンスFp+t
ech(k)は、予め開発されデータメモリ22に記憶されたルックアップテー
ブルから適応的に発生される。
このテーブルの開発は、従来の技術を使用して遂行され、そしてこのテーブルは
各サンプルブロックに対して適応的に使用された。しかしながら、本発明で使用
するためのルックアップテーブルを生成する目的のためには、ピッチ周期は1に
固定され、ピッチ利得は所与の値である。好まし実施例において、ピッチ利得は
0.6であった。このプロセスが完了された後、ピッチ縞ルックアップテーブル
は、結果の奇数2に対する対数を取ることによって定められる。すなわち、
STR(k) ”Ioga (FFT[p (n) )STR,n、、gyの大
きさ)1″に−1,N−1(+71
得られた対数テーブルはメモリに記憶される。ルックアップテーブルはピッチ情
報を発生するようにサンプルされ得る前に、ピッチ周期およびピッチ利得に対す
る関係において各サンプルブロックに対して適応的にスケーリングされねばなら
ない、ピッチ周期およびピッチ利得は、従来技術と同様に、96で決定される。
この情報は、97上のサイド情報として伝送される。ルックアップテーブルなス
ケーリングするに必要とされるこの情報は、各サンプルブロックのピッチ縞のエ
ネルギおよび大きさである。上で列p (n)を定めたから、式(13)参照、
任意の所与のピッチ周期およびピッチに対して、エネルギおよび大きさは下記の
ように98で決定される。
STR*nsrgy”Σ[p(n)”] n1IO,2N−1(1B)STR
,、、−Σ[p(n)] n−0,2N−1(19)式(18)および(19
)に基づき、ルックアップテーブルスレーリングファクタSTR,c、、、は1
00にて下記のように計算できる。
5TRtca+* ” IOga[STRmag/STR*n*rgy)””]
(20)データメモリ22に記憶されるルックアップテーブルは、10
2にてSTR、cm、により乗算され、得られたスケールされたテーブルは、下
記のようにピッチ縞を決定するように104にてモジュロ2Nでサンプルされる
。
Fp+tcr+(k) ” [5TR−c−+−/5TR(0)] X[5TR
(kx P)menu+。2% K−0,N−11(21)サンプル値は、対数
値であるから、その後、92で決定される対数パリアンス値に92で加算される
。
1ogzV+”が決定されたから、94でビット割当てを遂行することが可能と
なる0式(2)−(4)はビット割当てを決定するための周知の技術を記述する
ことが思い起こされよう、それから、式 (6)および(7)が誘導された。
簡単化ビット割当てを遂行するには、ただ1つのことしか残っていない0式 (
4)に式(6)を代入することにより、次のようになる。
R丁atal”0.5X Σ r−+、s [S+]+N X Gam
ma (22)式(11)を再構成すると、下記のようになる。
Gamma lI[Rtata+ −0,5XΣl−1,N (Sl)]/N
(23)ここでNはブロックあたりのサンプルの数、そしてR丁。tlllは
ブロック当りに入手し得るビットの数である。
106で遂行されるビット割当は、第8図に詳細に示されている0式(7)を利
用して、各S+が110にて決定される。これは比較的簡単な演算である。各3
1を決定した後、Gammaが式(23)を使用して112で決定される。これ
も比較的簡単な演算である。好まし実施例において、ブロック当りのサンプルの
数は128である。したがって、Nは最初から既知である。
ブロック当り利用可能なビット数は、最初から既知である。好ましい実施例にお
いて、各ブロックは台形状窓を使用して窓掛けされ、8つのサンプルがオーバー
ラツプされつつある、急の各側に4つづつ、ことに留意すると、フレームサイズ
は120サンプルである。伝送は固定周波数、好まし実施例では16Kb/s、
行われつつあり、そして 120のサンプルは約15m5かかるから(サンプル
の数1120が8kHzのサンプリング周波数により分割される)、単位ビット
当り利用可能なビットの総数は240である。ダイナミックスケーリングサイド
情報を伝送するために4ビツトが必要とされることが思い起こされよう、 LP
G係数サイド情報を伝送するのに必要とされ得るビット数も既知である。
したがって、RtOta□も下記の式から分かる。
Rt−t−+= 240− サイド情報で使用されるビット(24)各S 1
.Rt(ltlllおよびNは今やすべて既知であるから、96にてGamma
を決定することは、式(23)を使用して比較的簡単である。各S1およびGa
mmaを知ると、各R1は式(6)を使用して114で決定される。これはやは
り簡単な演算である。この手続きは、各りの計算をかなり′簡単化する。何故な
らば、式(2)により要求される幾何平均■。
1゜ck2を計算することはもはや必要としないからある。
この手続きを利用することの利点は、式(6)に対する入力値としてSlを使用
すると、実時間実施ための固定少数点演算における式(2)のようなアルゴリズ
ムを実施することと関連して起こるダイナミックレンジの問題を減することであ
る。
各31、Rtota+およびNは今やすべて既知であるから、96にてGamm
aを決定することは、式(23)を使用して比較的簡単である。各S1およびG
ammaを知ると、各R1は式(6)を使用して114で決定される。これはや
はり簡単な演算である。この手続きは、各R1の計算をかなり簡単化する。何故
ならば、式(2)により要求される幾何平均Vb+。c++2を計算することは
もはや必要としないからある。この手続きを利用することの利点は、式(6)に
対する入力値としてSlを使用すると、実時間実施のための固定点演算における
式(2)のようなアルゴリズムを実施することと関連して起こるダイナミックレ
ンジの問題が減ぜられることである。
82にて量子化利得ファクタを決定し、また108にていまやビット割当を決定
してしまったから、量子化は66にて完了できる。一度OCT係数が量子化され
たら、これら係数は、116にてサイド情報とともに伝送するようにフォーマッ
ト化される。得られたフォーマット化信号は、102にてバッファ記憶され、予
め定められた周波数にて直列的に伝送される。しかして好ましい実施例において
、この周波数は16kb/sである。
ここで、本発明の原理に従ってコード化されるボイス信号が受信されるとき利用
される適合変換コード化手続きについて考察する。この信号はインターフェース
28により直列ボートバス14上に提示されることが思い起こされよう、信号ブ
ロックと関連するビットのすべてが比較的同時に作用されることを保証するため
に、この信号は、まず120にバッファ記憶される。バッファ記憶される信号は
、次いで122にてデフォ−マット化される。
ブロックと関連され、かつサイド情報として伝送されるLPG係数、ピッチ周期
およびピッチ利得は、124にて集められる。これらの係数はすでに量子化され
ていることが思い起こされよう、ついで、スペクトル包絡線およびピッチ縞情報
が、126にて第7図を参照して記述したのと同じ手続きを使用して発生される
。得られた情報は、量子化利得を表すから逆量子化操作部128へ、またビット
割当操作部130に提供される。ビット割当ての決定は、第8図に記述される手
順にしたがって遂行される。
ビット割当は情報は、適正数のビットが適当な量子化器に操作されるように、1
28の逆量子化操作部に提供される。適性数のビットの場合、各量子化解除装置
は、割り当てられたビットの利得および数も既知であるからOCT係数を量子化
解除できる。量子化解除されたOCT係数は、132にて時間領域に変換される
。ついで、新しく再構成されたサンプルブロックは、134にて動的に非スケー
ル化を解除されろ、これは、第5図に詳細に示されている。ダイナミックスケー
ル解除操作は、下式によりビットを右にシフトすることによって136で行われ
る。
右シフト−[15−(MSB + 1 )) (25)134に
て動的にスケーリング解除した後、サンプルブロックは、138にて窓掛けを解
除される。窓掛けはある量のサンプルのオーバーラツプを許容することが思い起
こされよう、窓掛は解除のとき、オーバーラツプされたサンプルがあればこれを
再結合することが重要である。サンプルブロックは、パス18に提示前に、バッ
ファ140により逐次形式に再度整列される。このようにバス18上に提示され
た信号は、コンバータ(3o)により並列形式から直列形式に変換され、そして
32に出力されるか、あるいはアナログインターフェース36に提示される。
サンプルあたりに割り当てられるビットの数が整数値であることを保証するビッ
ト割当後処理について考察する。第3図および第4図を参照すると、この後処理
は、ビット割当て決定が108および130でそれぞれなされた後、かつビット
割当て情報の他の操作部への提示前に直ちに行われるであろう、ビット割当て後
処理は、第9図に詳細に示されている。一般に、108におけるビット割当て決
定後、後処理は、R,を次の整数値に丸め、次いで、ビットの総数がビット割当
に利用可能なビット数に等しくなるまで、選択されたものR1からビットを除去
するのである。これにより、DCT係数当たり整数のビット割当てMlが保証さ
れる結果となる。しかしながら、ただの任意のビットだけがこのプロセスにおい
て除去されることはない、ビットは、かかる除去と関連する歪の量に関連して除
去される。 ボイス信号が伝送のためにコード化されつつあると仮定しよう、各
R+7!l’108で決定された後、後処理で、142にて各R,をもっとも近
い整数に丸める。各丸めは、下記のように定義できる。
L:Integral (R++ 0.99 )、 範囲0−M、、、 (
26)Mtotal”Σ+−+、HfM+] (27)
ここで、
Mlはここの整数ビット割当て、
M、□は係数あたりに許されるビットの最大数、Mtotalはブロックに割り
当てられるビットの総数である。
次いで、ビットの総数Mtotalが、式(27)に従って144で決定される
。ついで下記の式から、MtotalがR〒。talに等しくするためには何ビ
ットが除去されることが必要かについて、146にて決定がなされる。
NRtotal・My0t+ −Rt−t−+ (28)次
いで、MT6tlllがRtota lに等しくなるように、どのビット割当て
から1ビツトが除去されるかについての決定がなされる。この決定は、1を除去
することにより最小量の歪を導入する適合的なビット割当からビットが除去され
るというガイドラインに基づいてなされる。適合的なビット割当ては、0より大
きいものである。所望のビット割当てから必要とされるビットが除去されたら、
得られたビット割当て情報は、66にてOCT係数の量子化のために提供される
。
どのビット割当てから1ビツトが除去されるかを決定するために、ビット割当て
のヒストグラムが148にて発生される。ヒストグラムを発生するために、ある
数のカウンタが、0.00ないし1.00の、同様に大きさ設定された逐次の範
囲の実数を各々表すものとして定義される。
例えば、好ましい実施例においては、16のカウンタが各々0.00および1.
00間の実数の1716を表すものとして定義される、すなわちカウンタ1は0
.00および0.0625間の数を表す、カウンタ2は0.0625および0.
125間の実数を表し、以下そのようになる。カウンタが、定められた範囲の1
つに入るDiの各個に対して1だけインクリメントされる。しかしてこの値は、
下記の式に従い、計算されたパリアンスの各々に関して決定される。すなわち:
DI = 2.72 X [Vl”/Ll”] (29
)ここで、
D、は、i番目の係数の量子化により導入される平均ひずみであり、
Llは、整数レベル割当て(L+−2” )である。
1ビツトの減少は、量子化レベルの数を半分にすることを思い起こされたい、し
たがって、
式(29)から、下記の式が誘導され得る。
Dr = 2.72 x V、”x [1,0,5OL、”−1/Li”l
(30)したがって、
D+寓2.72 X v、’x O,75X [1/L+21 (31
)残念ながら、これらの式は、取り扱いにくくなる場合があり得る。Dlは単調
増加関数であるから、式は、他の単調増加関数により変更氏、同じ結果を得るこ
とができる0例えば、定数により乗算することによりあるいは基数2に対する対
数を採ることにより、やはり相対値、例えばより大きい値または低い価が指示さ
れよう、しだがって、下記の式が得られる。
Di lI Iogz [Vl”/L+”]
(32)したがって、
DI−L−M+ (33)式(33)
はDiに対して式(32)に対して異なる値を生ずるけれども、関数はなお単調
的に増加しており、われわれは関連する値を吟味しているから、結果はなお同じ
である。それゆえ、DIを決定する仕事は、簡単な式に減ぜられる。特定のビッ
ト割当ては1ビツト減ぜられるであろうから、どの割当てがとのカウンタをイン
クメントしたかを関連づけることが必要である。このような関連づけは、任意の
周知のプログラミングによりなすことができる。
ついで、カウンタは、150で、最小量の歪み0.00を表わすカウンタから最
大量の歪を表わすカウンタまで捜索され、各カウンタに記憶されている係数値の
数を累積しCUM (J)、どのカウンタG、: T CIIM (J)がNR
Tota+ニ等しいかまたは大きいかを決定、確認する。
レンジが確認されたカウンタより小さいカウンタと関連する歪により表わされる
ビット割当ては、152にて1だけ減ぜられる。確認されるカウンタにおいて、
CtlM (J)がNRtotalに等しくなるまで、各R4から1ビツト減ぜ
られる。1ビツトが減ぜられるR1は、必要に応じて、最小のDIから最大DI
に至る基準で選択される。ビットが除去される確認されたカウンタで表わされる
ビット割当ての数は、Kとして指示されるべきである。
一度選択されたビット割当て(R1)が各々1ビツト減ぜられてしまえば、Mア
。talがRtOtalに等しくなるかについての決定が1゛54にてなされる
。答えがイエスであれば、ビット割当て情報が量子化器に提示される。 NR7
゜talが適合するビット割当ての数(RI)より大きい場合に起こり得るよう
に、もしも答えがノーであれば、プロセスは146に戻り、プロセスを繰り返す
。
割り当てられつつあるビットの数が整数値であることを保証するための他の新し
いプロセスについて考察する。やはり、各R1が108にて決定された後、第1
0図に示されるこの後処理は、160にて各R+をもつとも近い整数に丸める。
ついで、ビットMTotalの総数が162で決定される。MTOtlllがR
Totalに等しいかどうかについての評価が164にてなされる。Mア。、1
□がRア。talに等しければ、後処理は終り、得られたMtは66にて量子化
のために提示される0M丁。talがRア。talより大きければ、1ビツトが
除去されるべき場合に最少量の歪みを導入するであろうビット割当てR1が、1
66で決定される。1ビツトが168にてR4から除去され、ビットの総数が再
び162で決定される。後処理は、M丁。1,1が8丁。1.1に等しくなるま
でこの態様で循環し続ける。
M76tslが162にてRtotalより小さいと決定されると、R4は、7
oにて、1ビツトの追加で歪を最大に減するであろうところに見つけられる。R
Iを見つけた後、1ビツトが172にてR,に加えられる* MTotlllが
162にて再度決定され、プロセスは、164にて、M7゜tlllがRtOt
alに等しくなることが見出されるまで、循環し続ける。
1ビツトが減算された場合に最小量の歪が起こるところ、あるいは1ビツトが加
算されると歪が最大に減ぜられるところでそのLを決定するために、下記の式を
考察する。
L−Integral (L+0.5)、 範囲0−M、、、 (34
)M7゜□1==Σr−r、s [L] (35)N口
or ” Rtatal−Mtotal (36)O1
=12.72 X (V+2/Li”l (37)DTO
tal・ Σ1゜1.N [DI] (38)ここで、
M、は個々の整数ビット割当てである、Ml、8は係数ごとに割当てられるビッ
トの最大数である、
Mア。talはブロックにおいて割り当てられるビットの総数である、
N+t*rはビット割当てをRtatalに増減するに必要な反復数である、
Dlは第1番目係数の量子化により導入される平均歪である、
LI整数レベル割当て(1,+・21)、そしてDア。talは量子化によりブ
ロックに導入される総平均歪である。
式34は、整数ビット割当てを定めるものであり、そしてこれは、R1から、も
つとも近い整数に丸め、結果をMl、8より大きくない整数に制限することによ
って誘導される。これは割当てられたビットの総数M76talをもたらし、そ
してこれはブロックに割り当てられるビットの正しい数をR7@talを維持す
るためにN+t*rビット(36)により増減されねばならない。
どの係数がそれらのビット割当ての変化を必要とするかを決定するに際して、こ
の操作と関連する歪の測定値が決定される。 MAXは、式(37)におけるサ
ンプルにより導入される平均歪を定めた。この結果は、先に、最適ビット割当て
(2)を定めるために使用された。使用される手法は、除去されることにより(
デクリメント)最小歪を導入するビット、または増大されることにより(インク
リメント)総歪を減するビットを反復的に決定することによって、整数ビット割
当てLを8丁。ta1ビットに変更するとである。上記の式に任せると、この手
続きは、Lawより大きくない正の整数に拘束される。 1ビツトの増加はレ
ベルの数の倍加を倍加し、1ビツトの減少はレベルの数を半減することが再度思
い起こされよう、それゆえ、式(37)から次の式が誘導されよう。
0、(inc) = 2.72X Vl”X [1/L+” −1/(2Li)
”] (39)したがって、
D+(inc) 禦2.72x V+2x3.OX II/L+” ]
(40)D+(dec) M 2.72 X v、”x [1/
(0,5OL+)” −1/Li)”](41)したがって、
D+(dec) l12.72x V+”Xo、75[1/L+”]
(42)それゆえ、ビット数を増すために、D+ (inc) (39)は
、Mtを1ビツトだけ増すことにより、総歪DTOtAlの減少をもたらす、し
たがって、反復プロセスで、ブロックの最大D+ (inc) (i*1.N)
を決定せねばならない。同様にビットの数を減するために、 D+ (dec)
(41)は、M、を1ビツト減することによって、総歪の数の増大を定める。
したがって、反復プロセスでブロックにおける最小D+(dec)(i=1.N
)を決定しなければならない。
しかしながら、上の式はかなり複雑となる場合がある。最小または最大を捜索す
る操作は、D、 (inc)およびり、 (dec)が■1およびし、に関して
単調に増加する関数であるという事実に基づく。したがって、これらは他の単調
増加関数により変更され、正しい結果を維持できる。例えば、定数により乗算し
、基数2に対する対数を採ると、なお相対値、より大きい数またはより小さい数
が指示されるであろう、したがって、下記の式が展開される。
Di(fnc) 冨logs [V+”/L+”l (43
)したがって、
D+(inc) =L −L (44)Di(dec
) m log* [V+2/L+”] (45)したがっ
て、
D+(dec) ” L −L (
46)式(43)および(45)はり、に対して式(42)および(44)と異
なる値をもたらすが、関数はなお単調増加であり、われわれは最大を吟味してい
るから、結果はなお同じである。それゆえ、166または170でD+を決定す
る仕事は、簡単な式に減ぜられる。
以上、本発明を特定の具体例について説明したが、技術に精通したものであれば
、本発明の技術思想から逸脱することなく、ここに開示されるものから種々の変
化変更をなし得るものであることが認められよう。
浄書(内容に変更なし)
FIG、:3
52ssut偵 /jユ9・っ11ム4へ
/JJ’へFIG、8
7tへ
手続辛甫ヱE書(方式)
%式%
事件の表示 PCT/US89102296平成1年特許願第50683平成
1明特許願第506838−ド化の改良補正をする者
事件との関係 特許出願人名 称 パシフィック コミュ
ニケイションサイエンセズ、インコーポレイテッド
住 所 東京都中央区日本橋3丁目13番11号補正の対象
図面の翻訳文 1通補正の内容 別紙の
通り
図面の翻訳文の浄書(内容に変更なし)国際調査報告
I酎−MINIM−^−””””’=PCT/US89102296−詩1+t
sbe酊1 ^e−mwe N6. +l r〒ハマCQQ l凸りつOt
Claims (16)
- (1)情報サンプルより成るサンプルされた時間領域情報信号で作用し得、情報 サンプルのグルーブをブロックに逐次に分離し、かつ変換係数ブロックにより表 わされる各ブロックサンプルを時間領域から変換領域に変換する変換コード化装 置においてスピーチ信号のフォルマント情報を決定するための装置において、 前記時間サンプルブロックの各々に対して偶数エクステンションを発生するため のエクステンション手段と、該偶数エクステンションの自己相関関数を発生する ための関数発生手段と、 該自己相関関数から線形予測係数を誘導するための誘導手段と、 前記係数の高速フーリエ変換を遂行するための第2の変換手段と、 前記高速フーリエ変換から生する各係数の利得を数学的に平方するための平方手 段と を備え、前記各ブロックに対する前記フォルマント情報が、前記ブロックに対す る前記高速フーリエ変換の各平方された利得の収集値に等しいことを特徴とする ホルマント情報決定装置。
- (2)前記変換係数ブロックが関数式X(n)により表わされ、前記偶数エクス テンションが関数式y(n)により表わされ、そしてさらにy(n)が下記のよ うにx(n)に関して定められる、すなわち、 y(n)=x(n) n=o,N−1=x(2N−1−n) n= N,2N−iのように定められる請求の範囲第1項記載のホルマント情報決定装 置。
- (3)前記線形予測係数をサイド情報として伝送するための伝送手段を備える請 求の範囲第1項記載のホルマント情報決定装置。
- (4)情報サンプルより成るサンプルされた時間領域情報信号で作用し得、情報 サンプルのグルーブをブロックに逐次に分離し、かつ変換係数のブロックにより 表わされる各ブロックサンプルを時間領域から変換領域に変換する変換コード化 装置においてスピーチ信号のホルマント情報を決定する方式において、 前記時間サンプルブロックの各々に対して偶数エクステンションを発生し、 前記偶数エクステンションの自己相関関数を発生し、該自己相関関数から線形予 測係数を誘導し、前記係数の高速フーリエ変換を遂行し、該高速フーリエ変換か ら生する各係数の利得を数学的に平方する 諸段階を備え、前記各ブロックに対する前記ホルマント情報が、前記ブロックに 対する前記高速フーリエ変換の各平方された利得の収集値に等しいことを特徴と するホルマント情報決定方法。
- (5)情報信号のある振幅を有する被変換サンプルのブロックを量子化する変換 コード化装置においてビット割当て信号を発生する装置において、 前記被変換サンプル振幅の予定された基数の対数を決定することにより対数値を 生成する対数発生手段と、前記被変換サンプル振幅の各々に割り当てられる最少 数のビットを決定するための定数生成手段と、前記被変換サンプル振幅の各々に 対して決定される前記対数値に最少数のビットを加えることによって、前記被変 換サンプル振幅の各々に割り当てられるべきビットの数を決定し、前記被変換サ ンプル振幅の各々に割り当てられるビット数を表わすビット割当て信号を発生す るためのビット割当て手段と、 を備えることを特徴とするビット割当て信号発生装置。
- (6)情報信号のある振幅を有する被変換サンプルのブロックを量子化する変換 コード化装置においてビット割当て信号を発生するための方法において、前記被 変換サンプル振幅の予定された基数の対数を決定することにより対数値を生成し 、 前記被変換サンプル振幅の各々に割り当てられる最少数のビットを決定し、 前記被変換サンプル振幅の各々に対して決定される前記対数値に最少数のビット を加えることによって、前記被変換サンプル振幅の各々に割り当てられるべきビ ットの数を決定し、前記被変換サンプル振幅の各々に割り当てられるピット数を 表わすビット割当て信号を発生する、 諸段階を含むことを特徴とするビット割当て信号発生方法。
- (7)変換コード化装置においてなされるビット割当てが整数値であることを保 証する装置であって、割当てのために利用可能な数が既知であるものにおいて、 前記ビット割当て値の各々を次の最高の整数に丸めるための丸め手段と、 前記丸め手段により前記割当て値が丸められた後、ビット割当て値を総和する総 和手段と、 割当てのために利用可能な前記ビット数と丸め後のピット割当て値の総和との差 を決定するための計算手段と、 1ビットが除去されるべき場合に各ビット割当て値に導入されるであろう歪の大 きさを決定し、前記歪み決定情報に基づいて前記ビット割当て値をランクづけす るヒストグラム手段と、 前記のビット割当て値の総数が利用可能なビットの前記数に等しくなるように、 1ビットを除去するに必要なピット割当て値を選択するための選択手段と、選択 されたビット割当て値を1ビットだけ減ずるための減少手段と を備えることを特徴とする保証装置。
- (8)変換コード化装置においてなされるビット割当て値が整数であることを保 証するための方法であって、割当てのために利用可能な数が既知であるものにお いて、前記ビット割当ての各々を次の最高の整数に丸め、前記丸め手段により前 記割当てが丸められた後、ビット割当て値を総和し、 割当てのために利用可能な前記ビット数と丸め後のビット割当て値の総数との差 を決定し、 1ビットが除去されるべき場合に各ビット割当て値に導入されるであろう歪の大 きさを決定し、前記歪み決定情報に基づいて前記ビット割当て値をランクづけし 、前記ビット割当て値の総数が利用可能なビットの前記数に等しくなるように、 1ビットを除去するに必要なビット割当て値を選択し、 選択されたビット割当て値を1ビットだけ減ずる諸段階を含むことを特徴とする 保証方法。
- (9)変換コード化装置においてなされるビット割当てが整数であることを保証 する装置であって、割当てのために利用可能な数が既知であるものにおいて、前 記ビット割当て値の各々を次の最高の整数に丸めるための丸め手段と、 前記丸め手段により前記割当て値が丸められた後、ビット割当て値を総和する総 和手段と、 前記ビット割当て値総和が前記の利用可能なビットの既知の数に等しくなる時点 を決定し、前記の等しい関係が得られるとき前記装置を停止させるための決定手 段と、前記ビット割当て値が1ビット変更される場合にとのビット割当てが最小 量の歪を導入するかを決定するための捜索手段と、 選択されたビット割当て値を1ビットだけ変更するための変更手段と を備えることを特徴とする保証装置。
- (10)前記ビット割当て値の総和が、前記の利用可能なビットの数より大きく 、前記捜索手段が、もしも1ビットが除去された場合にとのビット割当てが最小 量の歪を導入するかを決定し、前記変更手段が前記の選択されたビット割当て値 を1ビット減ずる請求の範囲第9項記載の保証装置。
- (11)前記ビット割当て値の総和が、前記の利用可能なビットの数より小さく 、前記捜索手段が、もしも1ビットが加算された場合にどのビット割当てが最小 量の歪を導入するかを決定し、前記変更手段が前記の選択されたビット割当て値 を1ビット増大させる請求の範囲第9項記載の保証装置。
- (12)変換コード化装置においてなされるビット割当て値が整数であることを 保証する装置であって、割当てのために利用可能な数が既知であるものにおいて 、前記ビット割当ての各々を次の最高の整数に丸め、前記丸め手段により前記割 当て値が丸められた後、ビット割当て値を総和し、 前記ビット割当て値総和が前記の利用可能なビットの既知の数に等しくなる時点 を決定し、前記の等しい関係が得られたとき前記装置を停止し、 前記ビット割当て値が1ビット変更される場合にとのビット割当てが最小量の歪 を導入するかを決定し、選択されたビット割当て値を1ビットだけ変更する諸段 階を含むことを特徴とする保証方法。
- (13)前記ビット割当て値の総和が、前記の利用可能なビットの数より大きく 、もしも1ビットが変更された場合にとのビット割当てが最小量の歪を導入する かを決定するための段階が、除去されつつある1ビットを考慮に入れ、前記の変 更段階が前記の選択されたビット割当て値を1ビット減ずる請求の範囲第12項 記載の保証方法。
- (14)前記ビット割当て値の総和が、前記の利用可能なビットの数より小さく 、もしも1ビットが変更された場合にどのビット割当てが最小量の歪を導入する かを決定する前記の段階が、加算されつつある1ビットを考慮に入れ、前記の変 更段階が前記の選択されたビット割当て値を1ビット増大させる請求の範囲第1 2項記載の保証方法。
- (15)情報サンプルより成るサンプルされた時間領域情報信号で動作し得る適 合変換コード化装置において、情報サンプルのグルーブをブロックに逐次分離す るための窓掛け手段と、 変換係数ブロックにより表わされる各サンプルブロックを時間領域から変換領域 に変換するための第1変換手段と、 前記変換係数のバリアンスを決定し、該バリアンスを反映する包絡線信号を発生 するための旬絡線生成手段であって、前記時間領域ブロックブロックの各々に対 して偶数エクステンションを生成するためのエクステンション手段と、前記偶数 エクステンションの自己相関関数を生成するための関数生成手段と、該自己相関 関数から線形予測係数を誘導するための誘導手段と、該線形予測係数の信号ブロ ックを形成するための信号ブロック手段と、該信号ブロックの高速フーリエ変換 を遂行するための第2の変換手段と、前記高速フーリエ変換から生ずる各係数の 利得を数学的に平方するための手段とを備え、そして各変換係数の前記バリアン スが対応する高速フーリエ変換係数の平方化利得に等しくなされている包絡線生 成手段と、 前記包絡線信号に反映される前記バリアンスに関して前記変換係数に割当てられ るべきビット数を決定し、前記変換係数に割り当てられるべきビット数を表わす ビット割当て信号を発生するためのビット割当て手段と、前記包絡線信号および 前記ビット割当て信号に応答して前記変換係数を量子化し、該量子化変換係数を 表わす量子化信号を発生するための量子化手段と、前記量子化信号および前記包 絡線信号を伝送するための伝送手段と を備えることを特徴とする適合変換コード化装置。
- (16)量子化変換係数のバリアンスを表わす量子化線形予測係数を含むサイド 情報および量子化変換係数の逐次のブロックを含むコード化スピーチ信号を解読 するための装置において、 前記線形予測係数の高速フーリエ変換を遂行するための変換手段と、 前記高速フーリエ変換から得られる各係数の利得を数学的に平方するための平方 化手段であって、前記量子化された変換係数の前記バリアンスが前記ブロックに 対する前記高速フーリエ変換係数の各平方された利得の収集値に等しくなる平方 化手段と、 前記バリアンスを表わす情報信号を発生するための信号発生手段と、 前記の変換された線形予測係数の予定された基数の対数を発生するための対数生 成手段と、 前記の変換された線形予測係数の各々に割り当てられる最小ビット数を決定する ための定数生成手段と、前記対数値に前記の最小ビット数を加え、前記の変換さ れたサンプル振幅の各々に対して割り当てられるビットの数を表わすビット割当 て信号を発生することによって、前記量子化された変換係数の各々に割り当てら れるビット数を決定するためのビット割当て手段と、前記情報信号および前記ビ ット割当て信号に応答して、前記変換係数の量子化を解除し、該量子化解除され た変換係数を表わす信号を発生するための量子化解除手段と、前記の量子化解除 された変換係数を前記変換領域から前記時間領域に変換し、前記スピーチ信号を ほぼ再生するための逆変換手段と を備えることを特徴とするコード化スピーチ信号解読装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/199,360 US4964166A (en) | 1988-05-26 | 1988-05-26 | Adaptive transform coder having minimal bit allocation processing |
US199,360 | 1988-05-26 | ||
CA000600458A CA1333940C (en) | 1988-05-26 | 1989-05-23 | Adaptive transform coder |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03505929A true JPH03505929A (ja) | 1991-12-19 |
Family
ID=25672750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1506838A Pending JPH03505929A (ja) | 1988-05-26 | 1989-05-25 | 適応変換コード化の改良 |
Country Status (6)
Country | Link |
---|---|
US (1) | US4964166A (ja) |
EP (1) | EP0416036A4 (ja) |
JP (1) | JPH03505929A (ja) |
AU (1) | AU3773289A (ja) |
CA (1) | CA1333940C (ja) |
WO (1) | WO1989011718A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03117919A (ja) * | 1989-09-30 | 1991-05-20 | Sony Corp | ディジタル信号符号化装置 |
JP2841765B2 (ja) * | 1990-07-13 | 1998-12-24 | 日本電気株式会社 | 適応ビット割当て方法及び装置 |
US5588089A (en) * | 1990-10-23 | 1996-12-24 | Koninklijke Ptt Nederland N.V. | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal |
US5687281A (en) * | 1990-10-23 | 1997-11-11 | Koninklijke Ptt Nederland N.V. | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
JP3254687B2 (ja) * | 1991-02-26 | 2002-02-12 | 日本電気株式会社 | 音声符号化方式 |
CA2105387A1 (en) * | 1991-03-05 | 1992-09-06 | Antony H. Crossman | Variable bit rate speech encoder |
US5317672A (en) * | 1991-03-05 | 1994-05-31 | Picturetel Corporation | Variable bit rate speech encoder |
DE69232251T2 (de) * | 1991-08-02 | 2002-07-18 | Sony Corp., Tokio/Tokyo | Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung |
US5450522A (en) * | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
JP3186292B2 (ja) * | 1993-02-02 | 2001-07-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
JP3150475B2 (ja) * | 1993-02-19 | 2001-03-26 | 松下電器産業株式会社 | 量子化方法 |
JP3186307B2 (ja) * | 1993-03-09 | 2001-07-11 | ソニー株式会社 | 圧縮データ記録装置及び方法 |
DE69420848T2 (de) * | 1993-07-07 | 2000-07-20 | Picturetel Corp., Peabody | Sprachkodierer/-dekodierer mit fester bitrate |
US5664057A (en) * | 1993-07-07 | 1997-09-02 | Picturetel Corporation | Fixed bit rate speech encoder/decoder |
US5608713A (en) * | 1994-02-09 | 1997-03-04 | Sony Corporation | Bit allocation of digital audio signal blocks by non-linear processing |
JP3250376B2 (ja) * | 1994-06-13 | 2002-01-28 | ソニー株式会社 | 情報符号化方法及び装置並びに情報復号化方法及び装置 |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3277705B2 (ja) | 1994-07-27 | 2002-04-22 | ソニー株式会社 | 情報符号化装置及び方法、並びに情報復号化装置及び方法 |
JP3341474B2 (ja) * | 1994-07-28 | 2002-11-05 | ソニー株式会社 | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 |
US5664053A (en) * | 1995-04-03 | 1997-09-02 | Universite De Sherbrooke | Predictive split-matrix quantization of spectral parameters for efficient coding of speech |
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5819215A (en) * | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
US5960387A (en) * | 1997-06-12 | 1999-09-28 | Motorola, Inc. | Method and apparatus for compressing and decompressing a voice message in a voice messaging system |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
EP0966109B1 (en) * | 1998-06-15 | 2005-04-27 | Matsushita Electric Industrial Co., Ltd. | Audio coding method and audio coding apparatus |
US6510247B1 (en) * | 1998-09-25 | 2003-01-21 | Hewlett-Packard Company | Decoding of embedded bit streams produced by context-based ordering and coding of transform coeffiecient bit-planes |
US20010031016A1 (en) * | 2000-03-14 | 2001-10-18 | Ernest Seagraves | Enhanced bitloading for multicarrier communication channel |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
EP1918909B1 (en) * | 2006-11-03 | 2010-07-07 | Psytechnics Ltd | Sampling error compensation |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
KR101362696B1 (ko) * | 2011-10-19 | 2014-02-17 | 전북대학교산학협력단 | 하이브리드 아키텍쳐가 적용된 신호 변환 장치, 신호 변환 방법 및 기록매체 |
CN103854653B (zh) * | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | 信号解码的方法和设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3405237A (en) * | 1965-06-01 | 1968-10-08 | Bell Telephone Labor Inc | Apparatus for determining the periodicity and aperiodicity of a complex wave |
US3662108A (en) * | 1970-06-08 | 1972-05-09 | Bell Telephone Labor Inc | Apparatus for reducing multipath distortion of signals utilizing cepstrum technique |
FR2412987A1 (fr) * | 1977-12-23 | 1979-07-20 | Ibm France | Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede |
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
EP0070948B1 (fr) * | 1981-07-28 | 1985-07-10 | International Business Machines Corporation | Procédé de codage de la voix et dispositif de mise en oeuvre dudit procédé |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
GB8330885D0 (en) * | 1983-11-18 | 1983-12-29 | British Telecomm | Data transmission |
-
1988
- 1988-05-26 US US07/199,360 patent/US4964166A/en not_active Expired - Lifetime
-
1989
- 1989-05-23 CA CA000600458A patent/CA1333940C/en not_active Expired - Fee Related
- 1989-05-25 WO PCT/US1989/002296 patent/WO1989011718A1/en not_active Application Discontinuation
- 1989-05-25 JP JP1506838A patent/JPH03505929A/ja active Pending
- 1989-05-25 EP EP19890907458 patent/EP0416036A4/en not_active Withdrawn
- 1989-05-25 AU AU37732/89A patent/AU3773289A/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US4964166A (en) | 1990-10-16 |
EP0416036A4 (en) | 1992-05-06 |
AU3773289A (en) | 1989-12-12 |
CA1333940C (en) | 1995-01-10 |
WO1989011718A1 (en) | 1989-11-30 |
EP0416036A1 (en) | 1991-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03505929A (ja) | 適応変換コード化の改良 | |
US4184049A (en) | Transform speech signal coding with pitch controlled adaptive quantizing | |
EP0700032B1 (en) | Methods and apparatus with bit allocation for quantizing and de-quantizing of transformed voice signals | |
US5012517A (en) | Adaptive transform coder having long term predictor | |
RU2214048C2 (ru) | Способ кодирования речи (варианты), кодирующее и декодирующее устройство | |
US6377916B1 (en) | Multiband harmonic transform coder | |
JP2650201B2 (ja) | ピツチ関連遅延値を導出する方法 | |
EP0927988B1 (en) | Encoding speech | |
US4704730A (en) | Multi-state speech encoder and decoder | |
US5668925A (en) | Low data rate speech encoder with mixed excitation | |
US4991213A (en) | Speech specific adaptive transform coder | |
EP0865028A1 (en) | Waveform interpolation speech coding using splines functions | |
EP1329877A2 (en) | Speech synthesis and decoding | |
WO1996002050A1 (en) | Harmonic adaptive speech coding method and system | |
CN101542599A (zh) | 用于编码和解码宽带语音信号的方法、装置和系统 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
EP0865029B1 (en) | Efficient decomposition in noise and periodic signal waveforms in waveform interpolation | |
US5649051A (en) | Constant data rate speech encoder for limited bandwidth path | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
JP2000132194A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
US5809456A (en) | Voiced speech coding and decoding using phase-adapted single excitation | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
WO2021142198A1 (en) | Speech coding using time-varying interpolation | |
JPH0651800A (ja) | データ数変換方法 |