JP3464450B2 - コード化音声信号のスパースネス低減法 - Google Patents
コード化音声信号のスパースネス低減法Info
- Publication number
- JP3464450B2 JP3464450B2 JP2000509080A JP2000509080A JP3464450B2 JP 3464450 B2 JP3464450 B2 JP 3464450B2 JP 2000509080 A JP2000509080 A JP 2000509080A JP 2000509080 A JP2000509080 A JP 2000509080A JP 3464450 B2 JP3464450 B2 JP 3464450B2
- Authority
- JP
- Japan
- Prior art keywords
- sparseness
- digital signal
- operator
- input
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000009467 reduction Effects 0.000 title description 2
- 230000004044 response Effects 0.000 claims description 22
- 238000001228 spectrum Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims 3
- 238000004891 communication Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000010267 cellular communication Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
ァイルされた同時係属仮出願U.S.Provisio
nal Application No.06/05
7,752の米国特許法第 119条(e)(l)に基
づいて優先権を主張するものであり、1998年3月4
日付け出願の同時係属出願U.S.Serial N
o.09/034,590(docket 34645
−405)の一部継続出願である。
化された音声信号におけるスパースネス(sparse
ness)の問題に関するものである。
ばデジタルセルラ通信システムなどの無線通信システム
の重要な役割を果たしている。現在から将来にわたって
この種のシステムに必要な大容量を達成するために、音
声信号の効率的圧縮および音声信号の高品質化が必須条
件である。これに関連して、例えば音声コーダのビット
レートを下げて他の通信信号のために通信チャネル容量
を追加する場合、不愉快なアーチファクトを導入せずに
音声品質を緩やかに低下させること(graceful
degradation)が望ましい。
例については、IS−641(D−AMPS EFR)
およびITU規格G.729に記載されている。上記規
格で指定されるコーダは構造的に類似しており、一般に
両者共に比較的疎らな(sparse)出力を生成する
代数的コードブック(algebraic codeb
ook)を含んでいる。一般に、与えられたコードブッ
クエントリのサンプルのわずか数個だけに非ゼロサンプ
ル値が含まれるような状況を、スパースネス(spar
seness)と呼んでいる。特に、音声の圧縮を実行
しようとして代数的コードブックのビットレートを低減
するとき、このスパースネス状態がよく現れる。まず第
1に非ゼロサンプルが僅かしかコードブックに含まれて
いないということ、そして低ビットレートなのでさらに
少ないコードブックサンプルの使用を要するというこ
と、の結果として生ずるスパースネスは、前述のような
従来の音声コーダによるコード化音声信号においては、
容易に感知し得る劣化となる。
のビットレートを下げる場合は、前述のコード化音声信
号の劣化を避けることが望ましい。
に、本発明は、コード化音声信号あるいはデジタル信号
のスパースネスが障害になる場合にスパースネスを低減
するアンチスパースネスオペレータ(anti−spa
rseness operator)を提供する。
を示す。図1のアンチスパースネスオペレータASO
は、発信源から送信される疎らなデジタル信号を入力A
で受信する。アンチスパースネスオペレータASOは疎
らな信号Aを処理して、入力信号Aより密なデジタル信
号Bを出力に供給する。
信機に設けられたCELP(Code Excited
Linear Predictive)音声エンコー
ダ、または無線通信システムの受信機に設けられたCE
LP音声デコーダにおいて、図1のアンチスパースネス
オペレータASOを適用する場合に可能な様々な位置の
例を示す。図2で示されるように、固定(例えば代数
的)コードブック21の出力と複数位置201〜206
のいずれか、あるいはその両方にアンチスパースネスオ
ペレータASOを設けることができる。図2で示される
各位置に設けた場合、図1のアンチスパースネスオペレ
ータASOはその入力Aで疎らな信号を受信して、その
出力Bから比較的密な信号を出力する。このように、図
2に示されるCELP音声エンコーダ/デコーダ構造に
は、図1の疎らな信号源に関するいくつかの例が含まれ
る。
コーダに従来から設けられている適応型コードブックへ
の従来のフィードバック経路を示す。アンチスパースネ
スオペレータASOが図2に示される位置や、他の位置
201〜204のいずれかに設けられると、加算回路2
10の出力でデコーダによって再構成されたコード化励
振信号がアンチスパースネスオペレータから影響を受け
ることがある。アンチスパースネスオペレータが位置2
05や206に設けられた場合には、加算回路210か
ら出力されるコード化励振信号に対する影響はない。
力を受信して、フィードバック信号を適応型コードブッ
ク23に供給する加算回路25を更に含むCELPデコ
ーダを例示する。アンチスパースネスオペレータASO
が図2Bに示される位置や、位置220、240に設け
られる場合、適応型コードブック23へのフィードバッ
ク信号はアンチスパースネスオペレータの影響を受けな
い。
Pデコーダ構造の受信機(RCVR)と、図2のCEL
Pエンコーダ構造の送信機(XMTR)を含むトランシ
ーバーを例示する。図2Aは、送信機が入力として音響
信号を受信して、出力として再構成情報を通信チャンネ
ルに供給し、その再構成情報から受信機が音響信号を再
構成するところを示している。受信機は通信チャンネル
から入力される再構成情報を受信し、出力として再構成
された音響信号を供給する。図のトランシーバーと通信
チャンネルは例えば、それぞれセルラ電話のトランシー
バーとセルラ電話網のエアインタフェースである。
Oの一実施例を図3に示す。図3において、Aで受信さ
れる疎らな信号に雑音性の信号m(n)が付加される。
図4は、どのようにして信号m(n)が生成されるかを
例示する。雑音性の信号m(n)は、ガウス分布N
(0、1)を持つ雑音信号を適当な高域通過スペクトル
カラーフィルタにかけることによって生成される。
算器33を通して適切な利得係数を持って加算回路31
に供給することができる。図3の利得係数は固定利得係
数とすることができる。図3の利得係数はまた、適応型
コードブック23(または、周期性の量に関する同様の
パラメータ)の出力に適用される従来通りの利得の関数
であってもよい。一例をあげると、図3の利得は適応型
コードブック利得が所定の閾値を超えた時に0になり、
適応型コードブック利得が閾値から減少するにしたがっ
て直線的に増加する。図3の利得はまた、図2の固定コ
ードブック21の出力に適用される従来と同様の利得の
関数とすることができる。また、図3の利得は、従来の
検索方法で使用される目標信号に対する信号m(n)の
パワースペクトルマッチングに基づいたものであって、
利得をコード化した後に受信機に伝送してもよい。
を活用するために周波数領域でノイズ性の信号を付加す
ることができる。
を示す。図5の構成の特徴は、図1の信号源11からの
受信デジタル信号のスパースネスを減少させるようにア
ンチスパースネスフィルタが設計されたことである。
が図6に詳しく示されている。図6のアンチスパースネ
スフィルタは、固定(例えば代数的)コードブック21
から受信されるコード化信号のたたみ込みを、全域通過
フィルタ(all−passfilter)に関連する
インパルス応答(65での)によって実行するコンボル
バ部63を有する。図6のアンチスパースネスフィルタ
の動作が図7〜11に示されている。
個の非ゼロサンプルを含む図2のコードブック21から
のエントリ例を示す。このスパースネス特性は、非ゼロ
サンプルの数(密度)が増加すれば、減少するであろ
う。非ゼロサンプルの数を増加させる1つの方法は、4
0個のサンプルからなるブロック全体にエネルギを分散
するための適切な特性を備えたフィルタに図10のコー
ドブックエントリを適用することである。図7および図
8は、図10のコードブックエントリにおける40個の
サンプル全体に適切なエネルギ分散を行うための全域通
過フィルタの振幅および位相(ラジアン単位)特性をそ
れぞれ示す。図7および図8のフィルタは2〜4kHz
の高周波領域で位相スペクトルを変更するが、2kHz
より低い周波数領域での変更は極くわずかだけである。
図7および図8のフィルタによる振幅スペクトルの実質
的な変更は行われない。
全域通過フィルタのインパルス応答のグラフ表示であ
る。図6のアンチスパースネスフィルタは、図10のサ
ンプルブロックに対する図9のインパルス応答のたたみ
込みを生成する。コードブックエントリはコードブック
から40個のサンプルからなるブロックとして供給され
るので、たたみ込み動作はブロック単位で実行される。
このたたみ込み動作において、図10の各サンプルから
40の中間乗算結果が得られる。例えば図10に示す位
置7でのサンプルを例にとると、最初の34の乗算結果
が図11の結果ブロックの位置7〜40に割り当てら
れ、残りの6つの乗算結果は巡回たたみ込み(circ
ular convolution)動作に従って「包
み込み」(wrapped around)され、位置
1〜6に割り当てられる。同様に、図10の残りの各サ
ンプルから生成される40の中間乗算結果は、図11に
示す結果ブロックの位置に割り当てられ、もちろんサン
プル1の包み込みは必要としない。図11の結果ブロッ
クの各位置に関しては、それに割り当てられる40の中
間乗算結果(図10の各サンプルについて1つの乗算結
果)が合算され、その総和がその位置に対するたたみ込
み結果を表す。
うに、巡回たたみ込み動作は、エネルギがブロック全体
に分散されるように図10のブロックのフーリエスペク
トルを変更し、その結果、ブロック内の非ゼロサンプル
の数(または、密度)が劇的に増加し、それに応じてス
パースネス量が減少する。ブロックごとに実行される巡
回たたみ込みの影響は、図2の合成フィルタ211によ
って取り除かれる。
タイプのアンチスパースネスフィルタの一動作例を示
す。図12および図13の全域通過フィルタは3kHz
より下では実質的に位相スペクトルを変更せず、3〜4
kHzの位相スペクトルを変更する。フィルタのインパ
ルス応答は図14で示すとおりである。図10と同じサ
ンプルブロックが図15に示されていることと、図16
の結果ブロックから明らかなように、図12〜図16に
示されるアンチスパースネス動作では、図11で示され
る場合と比較して十分にエネルギが分散されない。した
がって、図12〜図16では、フィルタが図7〜図11
で定義されたアンチスパースネスフィルタと比較してコ
ードブックエントリ修正の少ないアンチスパースネスフ
ィルタを定義する。従って、図7〜図11と、図12〜
図16のフィルタはそれぞれ異なったレベルのアンチス
パースネスフィルタリングを定義する。
た励振信号(加算回路210から出力される)の適応コ
ードブック成分が比較的小さいことを示しており、その
結果、固定(例えば代数的)コードブック21が比較的
大きく寄与する可能性がある。前述の固定コードブック
エントリのスパースネスに起因して、図7〜図11のフ
ィルタの方が図12〜図16のフィルタよりも大きいサ
ンプルブロック変更を伴うので、図12〜図16のアン
チスパースネスフィルタよりも、図7〜図11のアンチ
スパースネスフィルタを選択する方が有利である。適応
コードブック利得の値が大きい場合、固定コードブック
の寄与が比較的少ないので、アンチスパースネス修正の
比較的少ない図12〜図16のフィルタを使用すること
ができる。
グメントの局部特性を利用して、そのセグメントに関連
するスパースネス特性を修正するか否か、あるいは修正
程度を決定する機能を提供する。
で実行されるたたみ込みを線形たたみ込みにすれば、ブ
ロック単位処理の影響を回避できるので、より円滑な動
作が得られる。上記例でブロック単位処理について記述
されたが、ブロック単位処理は例示された従来のCEL
P音声エンコーダ/デコーダ構造の特質であり、本発明
の実施に必要なものではない。
ある。その場合、コードブック検索の間にエンコーダに
おいてアンチスパースネス修正が考慮される。これには
複雑さの増加が伴うが、それに見合う性能改善が得られ
る。(線形または巡回たたみ込みを使用した)アンチス
パースネスフィルタを定義するマトリクスと、検索フィ
ルタの従来のインパルス応答から構成されたフィルタリ
ングマトリクスとを掛け合わせることによって、(巡回
または線形)たたみ込み動作を実行することができる。
スオペレータASOの別の例を示す。図17の例では、
図5に示されるタイプのアンチスパースネスフィルタが
入力信号Aを受信し、170においてアンチスパースネ
スフィルタの出力に利得係数g2が掛けられる。図3お
よび図4からのノイズ性の信号m(n)には、172に
おいて利得係数g1が掛けられ、g1乗算器170および
g2乗算器の172の出力が174で加算されて、出力
信号Bが生成される。利得係数g1とg2は例えば、下記
のように決定される。最初に、図3の利得に関する上述
の方法の1つによって利得g1が決定され、次に、利得
係数g1の関数として利得係数g2が決定される。例え
ば、利得係数g2と利得係数g1は互いに反比例する。あ
るいは、利得係数g2を図3の利得と同じ方法で決定
し、次に、互いに反比例するように利得係数g1を利得
係数g2の関数として決定することも可能である。
6のアンチスパースネスフィルタが使用される。利得係
数はg2=1とする。エネルギーレベルが固定コードブ
ックエントリに等しくなるように、図4のガウスノイズ
分布N(0、1)を正規化し、図4のハイパスフィルタ
のカットオフ周波数を200Hzに設定することによっ
て、m(n)が得られる。利得係数g1は固定コードブ
ック利得の80%である。
ースネス修正方法を示す。181において、コード化音
声信号のスパースネスレベルが推定される。これはオフ
ライン時、あるいは音声処理期間に適応的に実行するこ
とができる。例えば、代数的コードブックやマルチパル
スコードブックでは、サンプルは互いに近接または離
れ、スパースネスに変動が起こり得るが、正規パルスコ
ードブックでは、サンプル間距離が固定されているの
で、スパースネスは一定である。183において、アン
チスパースネス修正の適切レベルが決定される。このス
テップもまた、オフライン時、あるいは音声処理期間に
適応的に実行することができる。アンチスパースネスレ
ベルを適応的に決定する別の例として、ブロックごとに
インパルス応答(図6、図9、図14参照)を変えるこ
とができる。185において、選択されたアンチスパー
スネス修正レベルが信号に適用される。
と関連する上記実施例は、例えば適切にプログラムされ
たデジタル信号プロセッサや他のデータプロセッサを使
用するか、あるいは、適切にプログラムされたデジタル
信号プロセッサや他のデータプロセッサに接続された付
加的外部回路との組み合わせによって容易に実現するこ
とができる。
が、これは発明の範囲を制限するものではなく、さまざ
まな形態で実施することが可能である。 [図面の簡単な説明]
を示すブロック図。
ear Predictive)エンコーダ/デコーダ
において図1のアンチスパースネスオペレータを適用し
得るさまざまな位置を示す。
使用可能な通信トランシーバーを示す図。
別の代表的なCELP(CodeExcited Li
near Predictive)デコーダを示す図。
示す図。
図。
スパースネスフィルタとして具体化する方法を示すブロ
ック図。
す図。
ィルタの動作を示すグラフ。
ィルタの動作を示すグラフ。
ィルタの動作を示すグラフ。
フィルタの動作を示すグラフ。
フィルタの動作を示すグラフ。
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
を示す図。
正するための代表例を示す図。
Claims (18)
- 【請求項1】 所定数のサンプル値の第1のシーケンス
からなるサンプルブロックを含む入力デジタル信号のス
パースネス(sparseness)を低減する装置で
あって、 前記入力デジタル信号を受信する入力と、 前記入力に接続されたアンチスパースネスオペレータ
(anti−sparseness operato
r)であって、特性の異なる複数のインパルス応答のう
ち選択されたインパルス応答と前記入力デジタル信号と
の畳み込み処理をサンプルブロック単位で行って当該サ
ンプルブロック全体にエネルギーを分散させることによ
り前記第1のシーケンスよりも非ゼロサンプル値密度が
高い新たなシーケンスを適応的に生成して、当該新たな
シーケンスを含む出力デジタル信号を生成するアンチス
パースネスオペレータと、 前記アンチスパースネスオペレータに接続され、前記ア
ンチスパースネスオペレータからの出力デジタル信号を
提供する出力とを備えることを特徴とする装置。 - 【請求項2】 前記アンチスパースネスオペレータは、
さらに、前記入力デジタル信号のスパースネスレベルを
推定し、その推定に基づいてサンプルブロックごとに前
記インパルス応答を選択することを特徴とする請求項1
に記載の装置。 - 【請求項3】 前記アンチスパースネスオペレータは、
前記畳み込み処理として巡回畳み込み又は線形畳み込み
を使用することを特徴とする請求項1に記載の装置。 - 【請求項4】 前記インパルス応答は、前記入力デジタ
ル信号の位相スペクトルを修正し、振幅スペクトルを実
質的に無修正とするような特性を有し、それぞれの前記
インパルス応答においては位相スペクトルの修正が異な
ることを特徴とする請求項1に記載の装置。 - 【請求項5】 前記アンチスパースネスオペレータは、
さらに、前記新たなシーケンスにノイズ性信号を付加す
ることを特徴とする請求項1に記載の装置。 - 【請求項6】 音響信号情報を処理するための装置であ
って、 前記音響信号情報を受信するための入力と、 前記入力に接続され、前記音響信号情報に応答して、所
定数のサンプル値の第1のシーケンスからなるサンプル
ブロックを含むデジタル信号を生成するコーディング装
置と、 前記コーディング装置に接続され、特性の異なる複数の
インパルス応答のうち選択されたインパルス応答と前記
デジタル信号との畳み込み処理をサンプルブロック単位
で行って当該サンプルブロック全体にエネルギーを分散
させることにより前記第1のシーケンスよりも非ゼロサ
ンプル値密度が高い新たなシーケンスを適応的に生成し
て、当該新たなシーケンスを含む出力デジタル信号を生
成するアンチスパースネスオペレータとを備えることを
特徴とする装置。 - 【請求項7】 前記コーディング装置は、複数のコード
ブックと、加算回路と、合成フィルタとを有し、前記コ
ードブックの各出力は前記加算回路の各入力に接続さ
れ、前記加算回路の出力は前記合成フィルタの入力に接
続されることを特徴とする請求項6に記載の装置。 - 【請求項8】 前記コードブックの出力のうちの1つを
前記アンチスパースネスオペレータの入力に接続するこ
とを特徴とする請求項7に記載の装置。 - 【請求項9】 前記加算回路の出力を前記アンチスパー
スネスオペレータの入力に接続することを特徴とする請
求項7に記載の装置。 - 【請求項10】 前記合成フィルタの出力を前記アンチ
スパースネスオペレータの入力に接続することを特徴と
する請求項7に記載の装置。 - 【請求項11】 前記コーディング装置をエンコーディ
ング装置とし、前記音響信号情報に音響信号が含まれる
ことを特徴とする請求項7に記載の装置。 - 【請求項12】 前記コーディング装置をデコーディン
グ装置とし、音響信号を構成するための情報が前記音響
信号情報に含まれることを特徴とする請求項7に記載の
装置。 - 【請求項13】 所定数のサンプル値の第1のシーケン
スからなるサンプルブロックを含む入力デジタル信号の
スパースネス(sparseness)を低減するため
の方法であって、 前記入力デジタル信号を受信するステップと、 特性の異なる複数のインパルス応答のうち選択されたイ
ンパルス応答と前記入力デジタル信号との畳み込み処理
をサンプルブロック単位で行って当該サンプルブロック
全体にエネルギーを分散させることにより前記第1のシ
ーケンスよりも非ゼロサンプル値密度が高い新たなシー
ケンスを適応的に生成して、当該新たなシーケンスを含
む出力デジタル信号を生成するアンチスパースネスオペ
レータステップと、 前記アンチスパースネスオペレータステップからの出力
デジタル信号を出力するステップとを備えることを特徴
とする方法。 - 【請求項14】 前記アンチスパースネスオペレータス
テップは、さらに、前記入力デジタル信号のスパースネ
スレベルを推定し、その推定に基づいてサンプルブロッ
クごとに前記インパルス応答を選択することを特徴とす
る請求項13に記載の方法。 - 【請求項15】 前記アンチスパースネスオペレータス
テップは、前記畳み込み処理として巡回畳み込み又は線
形畳み込みを使用することを特徴とする請求項13に記
載の方法。 - 【請求項16】 前記インパルス応答は、前記入力デジ
タル信号の位相スペクトルを修正し、振幅スペクトルを
実質的に無修正とするような特性を有し、それぞれの前
記インパルス応答においては位相スペクトルの修正が異
なることを特徴とする請求項13に記載の方法。 - 【請求項17】 前記アンチスパースネスオペレータス
テップは、さらに、前記新たなシーケンスにノイズ性信
号を付加することを特徴とする請求項13に記載の方
法。 - 【請求項18】 音響信号情報を処理するための方法で
あって、 前記音響信号情報を受信するステップと、 前記音響信号情報に応答して、所定数のサンプル値の第
1のシーケンスからなるサンプルブロックを含むデジタ
ル信号を生成するコーディングステップと、 特性の異なる複数のインパルス応答のうち選択されたイ
ンパルス応答と前記デジタル信号との畳み込み処理をサ
ンプルブロック単位で行って当該サンプルブロック全体
にエネルギーを分散させることにより前記第1のシーケ
ンスよりも非ゼロサンプル値密度が高い新たなシーケン
スを適応的に生成して、当該新たなシーケンスを含む出
力デジタル信号を生成するアンチスパースネスオペレー
タステップとを備えることを特徴とする方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US5775297P | 1997-09-02 | 1997-09-02 | |
US60/057,752 | 1997-09-02 | ||
US09/034,590 | 1998-03-04 | ||
US09/034,590 US6058359A (en) | 1998-03-04 | 1998-03-04 | Speech coding including soft adaptability feature |
US09/110,989 US6029125A (en) | 1997-09-02 | 1998-07-07 | Reducing sparseness in coded speech signals |
US09/110,989 | 1998-07-07 | ||
PCT/SE1998/001515 WO1999012156A1 (en) | 1997-09-02 | 1998-08-25 | Reducing sparseness in coded speech signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001515230A JP2001515230A (ja) | 2001-09-18 |
JP3464450B2 true JP3464450B2 (ja) | 2003-11-10 |
Family
ID=27364699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000509080A Expired - Lifetime JP3464450B2 (ja) | 1997-09-02 | 1998-08-25 | コード化音声信号のスパースネス低減法 |
Country Status (13)
Country | Link |
---|---|
US (1) | US6029125A (ja) |
EP (1) | EP1008141B1 (ja) |
JP (1) | JP3464450B2 (ja) |
KR (1) | KR100417351B1 (ja) |
CN (1) | CN1125438C (ja) |
AU (1) | AU753740B2 (ja) |
BR (1) | BR9811615B1 (ja) |
CA (1) | CA2301886C (ja) |
DE (2) | DE69808936T2 (ja) |
FI (1) | FI113595B (ja) |
HK (1) | HK1051082A1 (ja) |
TW (1) | TW394927B (ja) |
WO (1) | WO1999012156A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998020483A1 (fr) * | 1996-11-07 | 1998-05-14 | Matsushita Electric Industrial Co., Ltd. | Generateur de vecteur de source sonore, codeur et decodeur vocal |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
EP1755227B1 (en) * | 1997-10-22 | 2008-09-10 | Matsushita Electric Industrial Co., Ltd. | Multistage vector quantization for speech encoding |
JP3346765B2 (ja) * | 1997-12-24 | 2002-11-18 | 三菱電機株式会社 | 音声復号化方法及び音声復号化装置 |
US6301556B1 (en) * | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6820202B1 (en) | 1998-11-09 | 2004-11-16 | First Data Corporation | Account authority digital signature (AADS) system |
US6449313B1 (en) * | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6678651B2 (en) * | 2000-09-15 | 2004-01-13 | Mindspeed Technologies, Inc. | Short-term enhancement in CELP speech coding |
US6529867B2 (en) * | 2000-09-15 | 2003-03-04 | Conexant Systems, Inc. | Injecting high frequency noise into pulse excitation for low bit rate CELP |
JP4304360B2 (ja) * | 2002-05-22 | 2009-07-29 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 |
US7038327B2 (en) * | 2003-11-11 | 2006-05-02 | Au Optronics Corp. | Anisotropic conductive film bonding pad |
CA2603255C (en) * | 2005-04-01 | 2015-06-23 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
EP1875464B9 (en) * | 2005-04-22 | 2020-10-28 | Qualcomm Incorporated | Method, storage medium and apparatus for gain factor attenuation |
JP5801032B2 (ja) | 2006-11-08 | 2015-10-28 | トムソン ライセンシングThomson Licensing | インループのアーチファクト除去フィルタリングのための方法および装置 |
JP5004654B2 (ja) * | 2007-05-16 | 2012-08-22 | パナソニック株式会社 | 配線基板の接続方法および配線基板構造 |
AU2012276367B2 (en) * | 2011-06-30 | 2016-02-04 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
CN103268765B (zh) * | 2013-06-04 | 2015-06-17 | 沈阳空管技术开发有限公司 | 民航管制语音稀疏编码方法 |
WO2017013761A1 (ja) | 2015-07-22 | 2017-01-26 | 古河電気工業株式会社 | 熱輸送装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
JP3338074B2 (ja) * | 1991-12-06 | 2002-10-28 | 富士通株式会社 | 音声伝送方式 |
JP3520555B2 (ja) * | 1994-03-29 | 2004-04-19 | ヤマハ株式会社 | 音声符号化方法及び音声音源装置 |
JPH08123494A (ja) * | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 |
US5602959A (en) * | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
-
1998
- 1998-07-07 US US09/110,989 patent/US6029125A/en not_active Expired - Lifetime
- 1998-08-20 TW TW087113740A patent/TW394927B/zh not_active IP Right Cessation
- 1998-08-25 EP EP98940752A patent/EP1008141B1/en not_active Expired - Lifetime
- 1998-08-25 AU AU88952/98A patent/AU753740B2/en not_active Expired
- 1998-08-25 CN CN98808782A patent/CN1125438C/zh not_active Expired - Lifetime
- 1998-08-25 JP JP2000509080A patent/JP3464450B2/ja not_active Expired - Lifetime
- 1998-08-25 DE DE69808936T patent/DE69808936T2/de not_active Expired - Lifetime
- 1998-08-25 BR BRPI9811615-0A patent/BR9811615B1/pt active IP Right Grant
- 1998-08-25 KR KR10-2000-7002011A patent/KR100417351B1/ko not_active IP Right Cessation
- 1998-08-25 DE DE69828709T patent/DE69828709T2/de not_active Expired - Lifetime
- 1998-08-25 CA CA002301886A patent/CA2301886C/en not_active Expired - Lifetime
- 1998-08-25 WO PCT/SE1998/001515 patent/WO1999012156A1/en active Search and Examination
-
2000
- 2000-02-28 FI FI20000449A patent/FI113595B/fi not_active IP Right Cessation
-
2003
- 2003-05-09 HK HK03103271A patent/HK1051082A1/xx not_active IP Right Cessation
Non-Patent Citations (2)
Title |
---|
Roar Hagen et al.,Removal of Sparse−Excitation Artifacts In CELP,Proc.ICASSP98,1998年 5月,p.145−148 |
片岡章俊,守谷健弘,CELP方式に基づく8kpit/s低遅延音声符号化,電子情報通信学会技術研究報告[音声],日本,1992年 2月19日,SP91−119,p.9−16 |
Also Published As
Publication number | Publication date |
---|---|
FI113595B (fi) | 2004-05-14 |
CA2301886C (en) | 2007-10-23 |
JP2001515230A (ja) | 2001-09-18 |
DE69828709T2 (de) | 2006-01-05 |
BR9811615B1 (pt) | 2012-07-24 |
AU8895298A (en) | 1999-03-22 |
DE69828709D1 (de) | 2005-02-24 |
KR100417351B1 (ko) | 2004-02-05 |
KR20010023373A (ko) | 2001-03-26 |
CN1276898A (zh) | 2000-12-13 |
DE69808936D1 (de) | 2002-11-28 |
WO1999012156A1 (en) | 1999-03-11 |
EP1008141A1 (en) | 2000-06-14 |
EP1008141B1 (en) | 2002-10-23 |
CA2301886A1 (en) | 1999-03-11 |
BR9811615A (pt) | 2000-09-12 |
FI20000449A (fi) | 2000-02-28 |
TW394927B (en) | 2000-06-21 |
CN1125438C (zh) | 2003-10-22 |
HK1051082A1 (en) | 2003-07-18 |
DE69808936T2 (de) | 2003-06-18 |
AU753740B2 (en) | 2002-10-24 |
US6029125A (en) | 2000-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3464450B2 (ja) | コード化音声信号のスパースネス低減法 | |
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
KR101344174B1 (ko) | 오디오 신호 처리 방법 및 오디오 디코더 장치 | |
AU704847B2 (en) | Synthesis of speech using regenerated phase information | |
RU2239239C2 (ru) | Снижение разреженности в кодированных речевых сигналах | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
US6334105B1 (en) | Multimode speech encoder and decoder apparatuses | |
EP2502230B1 (en) | Improved excitation signal bandwidth extension | |
US7209879B2 (en) | Noise suppression | |
US20090198500A1 (en) | Temporal masking in audio coding based on spectral dynamics in frequency sub-bands | |
JP3881946B2 (ja) | 音響符号化装置及び音響符号化方法 | |
Cox et al. | New directions in subband coding | |
JP2013536450A (ja) | ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御 | |
US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
US20140288925A1 (en) | Bandwidth extension of audio signals | |
US6301556B1 (en) | Reducing sparseness in coded speech signals | |
US20130268268A1 (en) | Encoding of an improvement stage in a hierarchical encoder | |
Shoham | Very low complexity interpolative speech coding at 1.2 to 2.4 kbps | |
KR101520212B1 (ko) | 낮은 정확성으로 재구성된 신호 영역의 감쇠를 위한 방법 및 디코더 | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
KR100718487B1 (ko) | 디지털 음성 코더들에서의 고조파 잡음 가중 | |
JP5491193B2 (ja) | 音声コード化の方法および装置 | |
EP1267330B1 (en) | Reducing sparseness in coded speech signals | |
RU2388069C2 (ru) | Снижение разреженности в кодированных речевых сигналах | |
KR100220783B1 (ko) | 음성 양자화 및 에러 보정 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080822 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090822 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100822 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120822 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120822 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130822 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |