JP2001509616A - 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法 - Google Patents
長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法Info
- Publication number
- JP2001509616A JP2001509616A JP2000502499A JP2000502499A JP2001509616A JP 2001509616 A JP2001509616 A JP 2001509616A JP 2000502499 A JP2000502499 A JP 2000502499A JP 2000502499 A JP2000502499 A JP 2000502499A JP 2001509616 A JP2001509616 A JP 2001509616A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- block
- decoding
- excitation
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005284 excitation Effects 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000007774 longterm Effects 0.000 title description 2
- 238000004458 analytical method Methods 0.000 claims abstract description 40
- 230000003044 adaptive effect Effects 0.000 claims abstract description 25
- 230000003111 delayed effect Effects 0.000 claims abstract description 12
- 230000005236 sound signal Effects 0.000 claims description 60
- 239000013598 vector Substances 0.000 claims description 25
- 238000005070 sampling Methods 0.000 claims description 17
- 238000013139 quantization Methods 0.000 claims description 15
- 230000003321 amplification Effects 0.000 claims description 12
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 8
- 230000001934 delay Effects 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims 3
- 230000006978 adaptation Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000011045 prefiltration Methods 0.000 claims 1
- 230000006641 stabilisation Effects 0.000 claims 1
- 238000011105 stabilization Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 6
- 230000015572 biosynthetic process Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/004—Predictors, e.g. intraframe, interframe coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
復号化する方法に関する。
数で低域濾波し、得られた信号を8 kHz のサンプリングレートでサンプリング
する。サンプリングされた信号はデジタル音声信号に変換される。この信号は一
連の音声信号サンプリング値で構成されている。この一連の音声信号サンプリン
グ値から音声信号のエンコーダとデコーダ内で必要となる予測パラメータを求め
る。更に、各音声信号サンプリング値に対して前記予測パタメータとその都度予
測された音声信号サンプリング値を使用して予測値を計算する。各信号サンプリ
ング値とその予測値との間の差を量子化し、デジタル符号化し、予測パラメータ
と共に変調して記憶媒体に導入する。この記憶媒体は、例えば磁気テープもしく
はRAM記憶器である。記憶媒体で再現される信号は個々の部分信号に分割した
後、元の音声信号をできる限り忠実に元に戻すために音声デコーダ内で使用され
る。
書、米国特許第 3,631,520号明細書および米国特許第 3,502,986号明細書により
周知である。
た音声信号の再生品質をどのように改善するかの道筋を提示することにある。
の構成や改良は従属請求項に開示されている。
割込挿入や録音した信号の部分消去のような編集機能を可能にする点にある。
あるいは任意の騒音、例えば混合音声、自動車の騒音等のような他の信号も満足
な品質で録音して再生できる。
は、この発明による構成の可能性を徹底的に枚挙するのでなく、例示的な特徴を
有しているにすぎない。複数の請求項の構成を個々にあるいは任意の組み合わせ
で利用できる。
ブロックにして更に処理される。先ず、前処理したデジタル音声信号sをLPC
分析(LPC= linear-praediktive Codierung ;線形予測符号化)に掛ける、
この分析ではデジタル音声信号からLPCパラメータaを求める。これ等のパラ
メータはデジタル音声信号sからLPC残留信号rを発生させるため反転フィル
タ内で使用される。LPCパラメータaとLPC残留信号rに基づき、LTP分
析、所謂長時間予測分析およびパルスパラメータ発生が行われる。代わりの実施
例では、音声信号sを濾波しないでも、あるいは前記反転濾波以外の後に、LT
P分析および/またはパルスパラメータ発生に導入してもよい。
に加えて、下位ブロックだけ遅らせた全励起信号ev が導入される。LTP分析
の結果として、励起ベクトルeltp を決めるパラメータが得られ、パルス発生の
結果として励起ベクトルempe を決めるパラメータが得られる。
を得る。次いで、この全励起信号eは下位ブロックだけ遅延される。これにより
下位ブロックだけ遅らせた全励起信号ev が生じる。
50 Hz である。これにより、デジタル音声信号は次の分析に対して乱れた影響
を与える直流成分と低周波成分が除去される。高域フィルタの伝達関数は、
ファシスは約1〜 1.5 dBのレベルの僅かな上昇を与える。
ンプリング値、つまりそれぞれ 27 msの互いに重なった分析ブロックにセグメン
ト化が行われる。隣接するブロックの重なりの各々は 3 ms の期間に相当する。
分析ブロック内の中心にある 24 msの期間の合成ブロックは何れもそれぞれ 6 m
s の期間の四つの下位ブロックで構成されている。この場合、更に以下で説明す
るLTP分析とパルスパラメータ発生が各下位ブロックに対して行われる。つま
りブロック当たり4回行われる。
形窓処理に掛ける。この窓は、以下のように規定される。つまり、
算して大きくされる。
ビンソン(Durbin-Levinson)アルゴリズムを用い、a0''=1にして線形方程式 の系、
予測パラメータに対して関係式、
復号化された音声信号の再生は柔らかく快適になる。
果的に求めるためにある。更に信号処理を行うと、音声信号の元に忠実な再生を
与えるLPCパラメータの量子化を改善する。
る。これは再帰則、
れる。この場合、係数k0' 〜k13' に対して5,5,4,4,4,4,4, 4,3,3,3,3,3または3ビットを使用する。この量子化は反射係数に対
する値を含む記憶された表を使用して行われる。その場合、この量子化は、例え
ばユークリッド距離を最小化して行える。この量子化は 14 個の量子化された反
射係数ki の組を与える。ここで、0≦i≦ 13 。
発生の入力量として使用される。スカラー量子化では、その時の反射係数記憶器
るために使用される。その場合、ブロック当たり全部で 14 個のLPCパラメー
分析で求めたLCPパラメータaの外に、LPC残留信号r(n) (0≦n≦ 71
)および遅延させた全励起信号ev が導入される。このLPC残留信号r(n) は
それぞれ一つの下位ブロックに付属し、入力したデジタル音声信号sがLPC反
転フィルタ、
内で求めたLPCパラメータaも導入される。
対する他の計算は個々に行われる。
付けたLPCパラメータaItp が導入される。この場合、フィルタ状態量は各下
位ブロック濾波の前に、全励起信号eが印加するフィルタ、
に延びている。これ等の長さは通過した 186の全励起信号サンプリング値e(n)
から以下の関係、
の検索は 151の遅延の全範囲にわたり各ブロックの最初の下位ブロックでのみ行
われる。各ブロックの他の下位ブロックでは 48 の遅延の減少した範囲のみがそ
れぞれ検索される。この範囲は、先の下位ブロックで求めた遅延に依存し、以下
の式で決まる。即ち、
る。
ド語cm(n) への応答であり、このフィルタの消去された状態記憶器に由来する 。
してこの増幅率を量子化する。得られた量子化された増幅率βは次の式により適
応コードブックから得られた実際の下位ブロックに対する励起ベクトルの成分を
計算するために使用される。即ち、
号化される。即ち、MS が下位ブロックs(1≦s≦4)の遅延であることを前
提として、 24 ビットの遅延コードは以下の式で計算される。つまり、
ドブックから求めた実際の下位ブロックに対する励起ベクトルの成分である信号
eItp (n) を求める。更に、各ブロックに対して遅延コード lagscode および増
値を記憶している付属する表記憶器のアドレスに対応する。上記係数 lagscode
復元するために使用される。
PC残留信号r(n) ,遅延された全励起信号ev およびLTP分析で求めた全励
起信号成分eItp を使用する。
たり一度重み付けされたLPCパラメータai (mpe) およびパルス応答h(mpe)(n
) の計算が行われる。更に、ここでパルス応答h(mpe)(n) から次の式により自 動相関シーケンスを求める。つまり、
用して行われる。ここでも、入力信号の重み付け表示xmpe(n) が、
入力するフィルタ、
パルスパラメータは励起パルスが出力されなければならない各下位ブロックの7
つの位置を与え、更にパルス振幅に関する情報も有する。
は以下のように求める。つまり、
り、
て付属するパルス振幅bj (1≦j≦7)が得られる。即ち、
対する値が減少順となる、つまり、
は 31 ビットの位置コードを与える。この位置コードは二組の係数の和として計
算される。つまり、
り7つのパルス振幅の値の最大値は、例えば記憶された表を用いて6ビットで非
線形量子化され、次いでパルス振幅を量子化されたブロック最大値で規格化し、
その次に、例えば他の表を用いて3ビットの線形量子化にかける。
起ベクトルを形成するために使用される。即ち、
める。
化される。これ等の係数は他の符号化された量と共に記録され、再生側で音声デ
コーダー内で音声信号を復元させるために使用される。これ等のパルスパラメー
に対して他のパラメータM,β,pos と ampが復元される。この場合、一つのブ
ロックの4つの下位ブロックに対するLTP遅延M1 〜M4 は 24 ビット値 lag
scode から以下のように求める。即ち、
器により求める。
して 31 ビットの長さの位置コード poscodeから得られる。即ち、
化し、その次に規格化された7つの振幅を復号化することにより得られる。最後
に、復号化されたパルス振幅 ampをそれぞれ復号化されたブロック最大値と復号
化された規格化振幅の積として求める。
ップで励起信号を計算する。この計算は下位ブロックの各々に対して行う。つま
りブロック当たり4回行う。
い周波数を低下させることが伝達関数、
のように再構築された音声信号の主観的な質の印象が影響を受ける。
るので、一般に周囲の雑音レベルが低い時、有効、つまり平均ビットレートを低
減できる。この構成では、入力信号を音声休止の発生に関して監視する音声活性
度検出器が使用されている。この音声休止の間にある信号は品質を低下させて伝
達されるか、記憶されるので、音声休止の期間中の信号は音声の存在時より相当
低いビットレートで符号化される。
対する入力信号の効率が、
うにして求める。即ち、
毎に大きくされる。この条件が満たされないなら、この予測値はリセットされ、
初期化は、しきい値・遷移期間中に低レベルの音声信号を音声休止と解釈するこ
とを避けるため、
を処理する間に生じる入力信号の最小効率Pmin を求める。この最初の 50 ブロ
ックの後、音声休止が認められない限り、Pmin がPn より大きい時、雑音効率
の予測値を関係式、
る。即ち、
号効率がしきい値以下である時にのみ、現在のブロックを音声信号のないブロッ
クと分類することを意味する。
れる。このブロックのために、その時零である音声活性度に加えて、LPC係数
と増幅率が下位ブロック毎に記憶される。LPC分析と反射係数の符号化/復号
化は音声信号に対するのと同じように行われ、これは一ビット小さい 14 の反射
係数を量子化するためだけに使用される。
タの出力信号として現れる。これはそのように量子化されたLPCパラメータで
定まり、ほぼ白色雑音信号が加わる。この信号は、増幅率δで等級付けされる−
1と1の間の振幅領域に均等に分布する乱数u(n) を出力する擬似雑音発生器か
ら取り出せる。
励起信号エネルギがLPC残留信号r(n) のエネルギレベルより3 dB以下にあ
るレベルに合わせることによって行われる。増幅率を同時に5ビット量子化する
ため、これには記憶した表を使用して、式
しでブロックの期間にわたる全ビットレートは、
ビットレートの場合について上に説明したように大体行われる。ただ次の相違が
ある。即ち、
書、米国特許第 3,631,520号明細書および米国特許第 3,502,986号明細書により
周知である。 欧州特許出願公開第 0 657 874号明細書によりデジタル音声信号から予測パラ
メータを算出する音声エンコーダが知られている。適応コードブックに基づきこ
のエンコーダは励起信号成分を求める。更に、このエンコーダは音声信号から励
起信号の多パルス成分を求める。音声信号を処理する場合、音声信号が異なった
時間領域に分割され個々に処理される。 米国特許第 5,327,520号明細書により逆適応性のAGCにより既に記憶されて
いる比較用のコードベクトルが入力音声信号と比較される音声エンコーダが知ら
れている。簡単のため、これは表で管理される。 "Low Complexity Speech Coder for Personal Multimedia Communication",
IKEDO, J. et al, 1995 Fourth IEEE International Conference on Universal
Personal Communications Record, Gateway to the 21 st Century, Tokyo, 06
- 10, Nobember 1995 により、遅延された全励起信号から記入のある適応コード
ブックが知られている。このコードブックでは、第一下位ブロックをその都度完
全に調べるが、他の下位ブロックでは特定な部分領域のみしか検索しない。 "Efficient Computation and Encoding of the Multipulse Excitation for L
PC", Berouti, M. et al, ICASSP 84, Proceedings of the IEEE International
Conference on Acoustics, Speech and Signal Processing, San Diego, USA, 1
9 - 23 March 1984, pp. 10.1/1-4 によりパルス位置と付属する振幅に基づき多
パルス励起ベクトルを符号化する符号化方法が知られている。
ック回路図、
Claims (10)
- 【請求項1】 音声信号を符号化する時、 −デジタル音声信号から予測パラメータを求める音声信号分析を行い、 −励起信号成分を適応コードブックから求め、この適応コードブックを遅延され た信号で形成し、 −励起信号の多パルス成分を求め、そして、 −上記した求めることがその都度考慮される励起信号から生じる信号の入力音声 信号からの重み付け濾波されたずれの効率を最小化して決定され、 および、音声信号を復号化する時、 −量子化された伝達量を回収するためパラメータ復号化を行い、 −適応コードブックにより再生された成分から励起信号を発生することを行い、 そして −励起信号と再生された予測パラメータを使用する合成濾波により再生された音 声信号を形成することが行われる、 特にデジタル口述装置のため音声信号を符号化および/または復号化する方法に
おいて、 音声信号を符号化する時、 −一定数のサンプリング値を有する連続して重なり合うブロックにデジタル音声 信号を処理し、励起信号パラメータを求めるためにその都度再び一定数のサン プリング値を有する一定数の下位ブロックに前記サンプリング値を分割し、 −予測パラメータを決定するためブロック毎に行われる音声信号の分析から生じ る反射係数を個別に合わせた量子化表によりスカラー量子化にかけ、 −遅延された全励起信号から生じる記入事項からLTP分析時に使用する適応コ ードブックを形成し、前記全励起信号を各ブロックの最初の下位ブロックで完 全に検索し、他方、他の下位ブロックではその都度前の遅延により決まるそれ ぞれただ一つの一定の部分領域のみを検索し、 −全ての下位ブロックに対する遅延値を符号化して共通に遅延コードにし、付属 する増幅率を個々に線形量子化し、 −一つの下位ブロックに対して求めた多パルス励起ベクトルの各々が一定数のパ ルスの外に零サンプリング値のみを含み、その場合、それぞれ下位ブロックの 前記パルス位置を符号化して共通に位置コードにし、振幅値の最大値を非線形 量子化し、規格化されパルス振幅を線形量子化するブロックに適応する線形量 子化に付属する振幅をかけ、 および、音声信号を復号化する時、 −量子化された反射係数を復元するため表記憶器を用いてパラメータの復号化を 行い、 −パラメータを復号化する時に適応コードブックから求めた成分に対する遅延を 遅延コードから算出し、その場合一つのブロックの最初の下位ブロックに対す る遅延が遅延された全励起信号のサンプリング周期の範囲内にあり、他の下位 ブロックに対する遅延がそれぞれ先行する遅延により定まる範囲内にあり、 −パラメータを復号化する時に適応コードブックから求めた励起信号の成分に対 する線形化された増幅率を算出するか、一つの表から復元し、 −パラメータを復号化する時に一つの下位ブロックの励起ベクトルの多パルス成 分に対する各パルス位置を算出し、その場合それぞれ位置コードから下位ブロ ックの位置値を復元し、 −パラメータを復号化する時に一つの下位ブロックの励起信号の多パルス成分に 対するパルス振幅を求め、その場合、それぞれ非線形量子化されたブロック最 大値と線形量子化され規格化されたパルス振幅を復元し、その時、下位ブロッ クの量子化され非規格化されたパスル振幅を乗算により再生する、 ことを特徴とする特にデジタル口述装置のため音声信号を符号化および/または
復号化する方法。 - 【請求項2】 デジタル音声信号をサンプリングするため、 11 と 13 kHz の 間のサンプリング周波数を使用し、一つのブロックのサンプリング値の個数は下
位ブロックの個数の複数倍に設定されていることを特徴とする請求項1に記載の
特にデジタル口述装置のため音声信号を符号化および/または復号化する方法。 - 【請求項3】 サンプリング値の個数を 288に設定し、下位ブロックの個数を4
に設定し、下位ブロックのサンプリング値の個数を 72 に設定することを特徴と
する請求項2に記載の特にデジタル口述装置のため音声信号を符号化および/ま
たは復号化する方法。 - 【請求項4】 反射係数の個数を 14 に設定し、その量子化に対して5,5,
4,4,4,4,4,4,3,3,3,3,3または3または2ビットを利用す
ることを特徴とする請求項1に記載の特にデジタル口述装置のため音声信号を符
号化および/または復号化する方法。 - 【請求項5】 適応コードブックを発生させるため、 36 と 186の間のサンプリ
ング周期だけ遅延させた全励起信号値を使用し、第二の下位ブロック以降に検索
すべき部分領域をそれぞれ 48 の遅延値に設定し、遅延コードを 24 ビットの長
さに設定し、5ビットで増幅率の線形量子化を行うことを特徴とする請求項1に
記載の特にデジタル口述装置のため音声信号を符号化および/または復号化する
方法。 - 【請求項6】 他の処理を行う前に、非常に低い低周波成分を抑制し、高い周波
数の成分を軽く強調する前置濾波に符号化すべき音声信号をかけることを特徴と
する請求項1に記載の特にデジタル口述装置のため音声信号を符号化および/ま
たは復号化する方法。 - 【請求項7】 予測パラメータを求めるため音声信号分析を一定の時間範囲に利
用し、前記時間範囲はブロックをそれぞれ一定の時間間隔だけ過去と未来に突出
させるので、隣接する分析部分に生じる重なりにより、音声信号の非一定性を分
析結果に利用することを特徴とする請求項1〜6の何れか1項に記載の特にデジ
タル口述装置のため音声信号を符号化および/または復号化する方法。 - 【請求項8】 分析時間範囲の特定な長さは 27 msであり、その範囲は処理ブロ
ックに対して中心に置かれていることを特徴とする請求項7に記載の特にデジタ
ル口述装置のため音声信号を符号化および/または復号化する方法。 - 【請求項9】 安定化を伴う自動相関方法による 14 次のLPC分析を行う前に
それぞれ 14 のサンプリング値の窓エッジ長さを持つ台形窓付けに分析部分をか
け、遮断周波数が 50 Hz の前置濾波を行い、個々に合わせた代表値の表の記入
から非量子化された値のユークリッド間隔を単純に最小化して反射係数のスカラ
ー量子化を行い、得られたLPCパラメータを係数 0.7の重み付けにかけ、これ
により適応コードブックから励起信号成分を求めるためにLTP分析を行い、こ
の分析ではそれぞれ当該コードブック記入から得られた信号の入力信号音声信号
からの重み付け濾波したずれの効率を最小化し、そして予測パラメータの決定か
ら得られたLPCパラメータを係数 0.9の重み付けにかけ、これにより励起信号
の多パルス成分を求めることを特徴とする請求項1〜8の何れか1項に記載の特
にデジタル口述装置のため音声信号を符号化および/または復号化する方法。 - 【請求項10】 音声信号符号化および/または音声信号復号化を可変ビットレ
ートで行い、音声休止の出現に関して入力信号を監視し、音声休止を認識し、音
声休止の監視では入力信号の信号効率を評価し、音声休止の監視では入力信号の
信号効率を適応しきい値と比較し、入力信号の信号効率の評価をブロック毎に行
い、連続する多数のブロック内で求めた信号効率がしきい値以下にある時、音声
休止を検出し、音声休止の存在の識別符号として音声ビットを保管し、音声信号
のないブロックがある時、雑音発生器で励起信号ベクトルを受信側で発生させる
ことを特徴とする請求項1〜9の何れか1項に記載の特にデジタル口述装置のた
め音声信号を符号化および/または復号化する方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19729494A DE19729494C2 (de) | 1997-07-10 | 1997-07-10 | Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte |
DE19729494.4 | 1997-07-10 | ||
PCT/EP1998/004144 WO1999003094A1 (de) | 1997-07-10 | 1998-07-04 | Verfahren zur codierung und/oder decodierung von sprachsignalen unter verwendung von einer langfristigen prädiktion und einem mehrimpulsanregungssignal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001509616A true JP2001509616A (ja) | 2001-07-24 |
Family
ID=7835233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000502499A Pending JP2001509616A (ja) | 1997-07-10 | 1998-07-04 | 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6246979B1 (ja) |
EP (1) | EP0993672B1 (ja) |
JP (1) | JP2001509616A (ja) |
AT (1) | ATE230889T1 (ja) |
DE (2) | DE19729494C2 (ja) |
WO (1) | WO1999003094A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006030865A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7389227B2 (en) * | 2000-01-14 | 2008-06-17 | C & S Technology Co., Ltd. | High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder |
US7013268B1 (en) | 2000-07-25 | 2006-03-14 | Mindspeed Technologies, Inc. | Method and apparatus for improved weighting filters in a CELP encoder |
EP1528702B1 (en) * | 2003-11-03 | 2008-01-23 | Broadcom Corporation | FEC (forward error correction) decoding with dynamic parameters |
US7991611B2 (en) * | 2005-10-14 | 2011-08-02 | Panasonic Corporation | Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals |
EP2042284B1 (de) * | 2007-09-27 | 2011-08-03 | Sulzer Chemtech AG | Vorrichtung zur Erzeugung einer reaktionsfähigen fliessfähigen Mischung und deren Verwendung |
JP2010060989A (ja) * | 2008-09-05 | 2010-03-18 | Sony Corp | 演算装置および方法、量子化装置および方法、オーディオ符号化装置および方法、並びにプログラム |
JP2010078965A (ja) * | 2008-09-26 | 2010-04-08 | Sony Corp | 演算装置および方法、量子化装置および方法、並びにプログラム |
JP4702645B2 (ja) * | 2008-09-26 | 2011-06-15 | ソニー株式会社 | 演算装置および方法、量子化装置および方法、並びにプログラム |
US20100324913A1 (en) * | 2009-06-18 | 2010-12-23 | Jacek Piotr Stachurski | Method and System for Block Adaptive Fractional-Bit Per Sample Encoding |
WO2011000434A1 (en) * | 2009-07-03 | 2011-01-06 | Nokia Corporation | An apparatus |
EP2657933B1 (en) * | 2010-12-29 | 2016-03-02 | Samsung Electronics Co., Ltd | Coding apparatus and decoding apparatus with bandwidth extension |
WO2023230763A1 (en) * | 2022-05-30 | 2023-12-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for estimating time delay between excitation signal and stimulated signal |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3502986A (en) * | 1967-12-14 | 1970-03-24 | Bell Telephone Labor Inc | Adaptive prediction for redundancy removal in data transmission systems |
US3631520A (en) * | 1968-08-19 | 1971-12-28 | Bell Telephone Labor Inc | Predictive coding of speech signals |
US4133976A (en) * | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
CA1323934C (en) | 1986-04-15 | 1993-11-02 | Tetsu Taguchi | Speech processing apparatus |
CA2027705C (en) * | 1989-10-17 | 1994-02-15 | Masami Akamine | Speech coding system utilizing a recursive computation technique for improvement in processing speed |
JPH0477800A (ja) * | 1990-07-19 | 1992-03-11 | Nec Corp | ベクトル量子化コードブック作成方式 |
JP2776050B2 (ja) * | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5327520A (en) | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
US5513297A (en) | 1992-07-10 | 1996-04-30 | At&T Corp. | Selective application of speech coding techniques to input signal segments |
CA2137756C (en) | 1993-12-10 | 2000-02-01 | Kazunori Ozawa | Voice coder and a method for searching codebooks |
JP3364825B2 (ja) * | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
-
1997
- 1997-07-10 DE DE19729494A patent/DE19729494C2/de not_active Expired - Lifetime
-
1998
- 1998-07-04 EP EP98940141A patent/EP0993672B1/de not_active Expired - Lifetime
- 1998-07-04 WO PCT/EP1998/004144 patent/WO1999003094A1/de active IP Right Grant
- 1998-07-04 US US09/446,613 patent/US6246979B1/en not_active Expired - Lifetime
- 1998-07-04 AT AT98940141T patent/ATE230889T1/de active
- 1998-07-04 DE DE59806874T patent/DE59806874D1/de not_active Expired - Lifetime
- 1998-07-04 JP JP2000502499A patent/JP2001509616A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006030865A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 |
US7848925B2 (en) | 2004-09-17 | 2010-12-07 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus |
US8712767B2 (en) | 2004-09-17 | 2014-04-29 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus |
Also Published As
Publication number | Publication date |
---|---|
US6246979B1 (en) | 2001-06-12 |
DE19729494C2 (de) | 1999-11-04 |
DE59806874D1 (de) | 2003-02-13 |
DE19729494A1 (de) | 1999-01-14 |
EP0993672B1 (de) | 2003-01-08 |
EP0993672A1 (de) | 2000-04-19 |
ATE230889T1 (de) | 2003-01-15 |
WO1999003094A1 (de) | 1999-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Atal | Predictive coding of speech at low bit rates | |
KR101246991B1 (ko) | 오디오 신호 처리 방법 | |
KR100754085B1 (ko) | 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법 | |
JP2964879B2 (ja) | ポストフィルタ | |
US6345246B1 (en) | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates | |
US6681204B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
JP2001509616A (ja) | 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法 | |
JPH09204197A (ja) | 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形 | |
JP4558205B2 (ja) | スピーチコーダパラメータの量子化方法 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JPH0590974A (ja) | 前反響処理方法およびその装置 | |
JP3248668B2 (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
JP3248215B2 (ja) | 音声符号化装置 | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JPH09508479A (ja) | バースト励起線形予測 | |
JP3583945B2 (ja) | 音声符号化方法 | |
JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
JP3798433B2 (ja) | ピッチサイクル波形を平滑化する方法及び装置 | |
JP2900431B2 (ja) | 音声信号符号化装置 | |
JPH06202698A (ja) | 適応ポストフィルタ | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3274451B2 (ja) | 適応ポストフィルタ及び適応ポストフィルタリング方法 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20050124 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050124 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070612 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080422 |