JP3425423B2 - 固定コードブックにおける最適のベクトルの高速決定のための方法および装置 - Google Patents
固定コードブックにおける最適のベクトルの高速決定のための方法および装置Info
- Publication number
- JP3425423B2 JP3425423B2 JP2000531839A JP2000531839A JP3425423B2 JP 3425423 B2 JP3425423 B2 JP 3425423B2 JP 2000531839 A JP2000531839 A JP 2000531839A JP 2000531839 A JP2000531839 A JP 2000531839A JP 3425423 B2 JP3425423 B2 JP 3425423B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- gain
- speech
- impulse response
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000013598 vector Substances 0.000 title claims description 78
- 238000000034 method Methods 0.000 title claims description 43
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 17
- 238000005316 response function Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 23
- 238000011156 evaluation Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000005405 multipole Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
Description
の方法および装置に関し、特に符号励振線形予測(co
de excited linear predict
ive:CELP)符号化アルゴリズムのための方法お
よび装置に関する。CELPアルゴリズムは、例えば、
セルラシステムにおけるベースステーションと移動ステ
ーションとの間の、2方向音声通信において使用され
る。CELPアルゴリズムのための方法は信号プリプロ
セッサにおいてサンプルされた音声s{n}を前処理し
て(pre−processing)少なくともノイズ
ろ波された音声出力ベクトルおよびチャネルノイズ推定
を出力する段階、予測誤差または残余(residua
l)および長時間(long term)予測利得を出
力するように前記ノイズろ波された音声出力ベクトルの
モデルパラメータ推定を行う段階、予測誤差を符号化し
てフィルタのインパルス応答関数の指数およびベクトル
利得を含む適応コードブックベクトルを出力する段階、
および前記符号化された音声パケットをフォーマットま
たは形成する段階を含む。
ト、すなわち、4800または9600bps、におい
て良好な音声品質を提供することが見出されている。し
かしながら、励振信号のベクトル量子化は極めて高い計
算機的な努力を必要とする。重複(overlappi
ng)コードブックベクトルの使用を含むベクトル量子
化をスピードアップするためのいくつかの提案が行なわ
れてきている。
リズムはエス・シンハルおよびビー・エス・アタルによ
る、「低ビットレートにおける多パルスLPC符号器の
性能改善(Improving performanc
e of multi−pulse LPC code
rs at low bit rates)」、Pro
c.Int.Conf.、音響、音声および信号処理、
(サン・ディエゴ)、1984年、pp.1.3.1−
1.3.4;およびダブリュー・ビー・クライジン、デ
ィー・ジェイ・クラシンスキイおよびアール・エイチ・
ケッチャムによる、「CELP音声符号化アルゴリズム
のための高速の方法(Fast methods fo
r the CELP speech coding
algorithm)」、IEEE Trans.、音
響、音声および信号処理、Vol.38,No.8,P
P.1330−1342、1990年、に述べられてい
る。CELP符号化アルゴリズムはサブフレームごとの
ベースでサンプルされた音声を処理するために使用され
る。該音声信号のスペクトルエンベロープは線形予測技
術を使用してその係数が得られるフィルタによって記述
される。前記係数は量子化され、それによって前記フィ
ルタが送信機側および受信機側の双方に関して構築でき
る。前記フィルタ係数は合成による分析(analys
is−by−synthesis)手順によって決定さ
れる。一組のそのような候補の励振シーケンスまたはベ
クトルはコードブックに格納される。最も正確な音声を
生成するベクトルの指数(index)はチャネルの受
信端に送信される。送信側の入力音声は受信側において
その指数が送信されたベクトルを使用して発生される合
成音声によって回復される。
るコードブックにおける最適のベクトルを見つけること
である。高速のベクトル量子化および卓越した合成音声
品質はCELPアルゴリズムを音声符号化の用途にとっ
て魅力的なものにする。スペクトル拡散デジタルシステ
ムにおけるCELPアルゴリズムの実施についてはIS
−127標準「強化された可変レートコーデック、広帯
域スペクトル拡散デジタルシステムのための音声サービ
スオプション3(Enhanced Variable
Rate Codec,Speech Servic
e Option 3 for Wideband S
pread Spectrum Digital Sy
stems)」、1996年4月19日、セクション
4.5.7「代数的CELP固定コードブック寄与の計
算(Computation ofthe algeb
raic CELP Fixed Codebook
Contribution)」に記載されている。この
標準において使用されるコードブックは代数的コードブ
ック(ACELP)構造を備えた固定コードブックであ
る。
ードベクトルを見つけるために、ACELPコードブッ
クが重み付けされた入力音声と重み付けされた合成音声
との間の平均2乗誤差(MSE)を最小にすることによ
りサーチされる。言い換えれば、前記コードブックは次
の項、
インパルス応答および知覚領域ターゲット信号(per
ceptual domain targetsign
al)の相関であり、かつEkはコードブックベクトル
のインパルス応答のエネルギまたは共分散(covar
iance)であり、これらはともに位置kにおけるも
のである。前記コードブックベクトルは一連の単位パル
スであり、各パルスは前記コードブックにおいて適切な
位置にありかつ適切に選択された符号を有している。
するために、前記相関およびエネルギ項はパルス位置お
よび符号のすべての可能な組合わせに対して計算される
べきである。しかしながら、これは禁止されるべきまた
は非常に高価なタスクである。サーチを単純化するため
に、以下に説明されるようにパルス符号および位置をサ
ーチするための二つの戦略が使用される。
考慮することにより(閉ループサーチの外部で)プリセ
ットされる。振幅が、ある位置でのパルスの振幅をその
位置における前記基準信号の符号に等しく設定すること
によりプリセットされる。この「新しい」構成要素によ
り、修正された相関Ck′および修正されたエネルギE
k′が計算される。
トすると、最適のパルス位置が効率的な非網羅的な(n
on−exhaustive)合成による分析サーチ技
術を使用して決定される。この技術においては、項Tk
が反復的な「深さ優先(depth−first)」ツ
リーサーチ戦略を使用して少しの割合の位置の組合わせ
に対してテストされる。
定されると、前記「新しい」コードブックベクトルは一
連の単位パルスとして構築され、各パルスはコードブッ
クにおける「新しい」位置にある。
次の式によって決定される。
ックサーチアルゴリズムは次のような不都合を有する。
多極値関数(non−linearmultidime
nsional multi−extremum fu
nction)である。この非線形多次元多極値関数の
ある極値をサーチするタスクは、利用可能な計算機的な
性能が限られている場合に、組合わせのまたは組合わせ
的な方法(combinatorial way)で解
かれ、これは大域的なもの(global one)よ
りはむしろローカルな極値(local extrem
um)を見つける結果となる。
nction)の計算は非常に時間を消費しかつ多数の
計算サイクルを必要とする。すなわち、IS−127標
準において提案された固定コードブックサーチ方法は各
々のトラックにおいてパルス位置のための線形サーチを
想定しかつ1144の計算を必要とする。さらに、Tk
の評価は前記アルゴリズムの複雑さを大幅に増大する除
算操作を含む。
かつ計算サイクルに関して高価でなく、それでも最大の
達成可能な精度を維持するCELPアルゴリズムのため
の方法および装置が必要とされる。
請求項に記載された特徴的事項を適用することにより解
決される。好ましい実施形態は従属請求項に与えられて
いる。
誤差または残差に対する高速の多パルス符号化アルゴリ
ズムの効率改善の必要性は本発明によって満たされる。
請求項1および請求項8にそれぞれ記載された本発明に
係わる方法および装置は前記アルゴリズムの高速の収斂
を与え、それによって最適のベクトルが従来技術よりも
効率的にサーチできる。
適のコードブックベクトルを見つけるタスクを以下の二
つのサブタスクに分解することである。符号化パルスに
対する振幅利得の計算(第1ステージ)、および符号化
パルスに対する最適のサンプル位置の計算(第2ステー
ジ)。
−127標準による従来技術に記載されたものと逆であ
ることに注目すべきである。
適の符号化パルス位置のサーチの多次元多極値非線形タ
スクをそれぞれのパルスに対して順次最小化される多次
元2乗形式を有する最適の極値サーチタスクへと低減す
る。これは本質的に計算時間を低下させかつより高い符
号化精度を提供する。
ベクトル利得“gc”が次の式によって決定される。
号ベクトル)であり、hは特別関数(フィルタのインパ
ルス応答)であり、aは実験的に決定された重み係数で
あり、そしてNはサブフレーム長さである。
切な関数“h”および非ゼロコードベクトル成分のある
与えられた数“n”に対して実験的に決定される。n=
8および重み合成フィルタ“hwq”のインパルス応答
に対して、値a=2が得られた。
スの最適位置の順次的なサーチが行なわれる。位置p
(j)∈{1,…,N},j=1,…,nにおける符号
ベクトル成分は評価または推定関数(estimate
function)F(p(j))を最大にすること
により順次サーチされ、これはj番目のパルスの音声信
号残差(レシデュアル:residual)への寄与分
を決定する。
nであり、かつ
関数hの共分散アレイである。この場合、
対する前記ソース離散信号の元の相互相関ベクトルであ
る。
施形態の詳細な説明のために、IS−127標準(編集
バージョン6、TR−45)における名称を参照する。
すなわち、MSEはあるサブフレームにおける固定コー
ドブック寄与分からの固定コードブックサーチターゲッ
トベクトルの偏差またはずれの平均2乗誤差である。S
NRは、dBでの、信号対雑音比であり、変更された
(シフトされた)もとの音声信号SWが処理された信号
として使用されかつそれと適応および固定コードブック
の助けにより再構成された信号がノイズとして考えられ
る。平均SNRは音声フラグメントに関して平均されか
つ9600bpsのレートおよび4800bpsのレー
ト、すなわちそれぞれレート1およびレート1/2で送
信されるすべてのフレームに対する平均SNR値として
計算される。すべてのp(j)は5つのトラックT0,
…,T4にわたり分配または分布される。前記トラック
の内の3つは各々8つの非ゼロパルスの内の2つが割当
てられ、前記トラックの内の2つは各々8つのパルスの
内の1つが割当てられる。各々1つのパルスを備えた2
つのトラックは互いにサイクリックまたは循環的に隣接
し、すなわち、トラック3およびトラック4は各々1つ
のパルスを含み、トラック4およびトラック0は各々1
つのパルスを含み、以下同様である。
ブック構造により決定される一般的なタスクはレート1
に対して次のように公式化される。すなわち、次の数
式、
得gcが、固定コードブック構造ならびに以下の条件、
Nはサブフレームのサイズである。なお、→pなる表記
において、記号→は文字pの上に配置されるべきである
が、文字コードの制限のため文字pの前に配置してい
る。
えた多次元関数のための極値のサーチの典型的なタスク
である。最小化される前記関数は一般に1つより多くの
極値を有する非線形9次関数である。前記制約は前記許
容できる解の領域の非線形の境界を形成し、従ってロー
カルまたは局所的極値(local extrema)
の数はさらに増大しかつ大域的極値(global e
xtremum)のサーチは一層複雑になる。変更され
た(前記RCELPアルゴリズムに関してシフトされ
た)もとの残余(residual)から適応コードブ
ック出力を減算することにより得られる離散信号の符号
化のMSEの真のまたは実数の最小のサーチは従って不
成功に終るであろう。
ップは利得の計算である。本発明の第1の実施形態にお
いては、前記利得は、
cの最適の値はサブフレームにおける信号xWの平均2
乗振幅に比例するとみなすことができる。前記ソース離
散信号のエネルギはフィルタのインパルス応答関数の共
分散マトリクスのトレース(trace)と比較され
る。言い換えれば、すべての対角共分散項の合計が行な
われ、それによって利得gcを次のように得る。
ップ101における信号s{n}の前処理およびステッ
プ102におけるモデルパラメータの推定の後に、前処
理された音声信号のエネルギXがステップ103におい
て計算される。ループ104〜109において、共分散
マトリクスの対角要素が決定される。ステップ104に
おいて、第1の対角要素φ(i,i)、すなわち、φ
(1,1)、が計算される。ステップ105において、
それは後に使用する目的でメモリに格納される。さら
に、ステップ106において、前記値φ(i,i)が値
Aに加えられ、それによって最終的に共分散マトリクス
のトレースを得る。
換えれば、処理はi<Nである限り次のφ(i,i)を
計算するためにステップ104に戻るよう分岐し、かつ
i=Nの場合にステップ107においてループを退出し
かつトレースの計算が完了する。
プ106からのAの値により、前記コードベクトルの利
得は次の式によって計算される。
されるべき係数であり、かつAは考慮中のサブフレーム
の共分散マトリクスのトレースに対する単なるかつ一時
的な置換(substitute)である。
計算機的な努力である。前記共分散項φ(i,i)はサ
ブフレームにおける全てのパルス位置(前記IS−12
7標準においてはN=53または54)に対して計算さ
れなければならないが、これは全体の計算機的な努力を
増大するものではなく、その理由は前記対角項(dia
gonal terms)は以下に説明するさらなる計
算のために利用可能であるからである。
ができるが、利得計算の精度を犠牲にする、他の実施形
態が本発明の発明者によって考案されかつ本発明のさら
に他の実施形態(示されていない)において実施されて
いる。
方法の第1の構成の特定の簡単な変更がgcの決定のた
めに実現できるという近似により満足すべき結果が達成
できることが見出され、すなわち、前記第1の実施形態
は、離散的ソース信号およびサブフレーム長さを除き、
前記共分散マトリクスにおける第1の対角項の共分散、
すなわち、φ(i,i)に排他的に依存する。共分散マ
トリクスのこの第1の項はN、サブフレーム長さ、によ
り乗算することにより「拡張され(expande
d)」、かつ次に平均2乗されたソース信号Xと比較さ
れる。前記利得は従って次のように書くことができる。
要素の計算は1つに低減される。この実施形態の利点は
サブフレームにおける全ての他の共分散項の計算が時代
遅れになる(obsolete)ことである。
のもの(図示せず)においては、利得は次のような簡単
な式で表される。
さである。しかしながら、この手法はX2>>Fmin
(gc;→Popt)に対してのみ許容できるものであ
る。ただし、この前提条件は大部分のサンプルされた音
声の残差において当てはまる。この手法により評価され
る利得の分析は高い精度の近似が達成可能であることを
示している。
は、第1のパルスは70パーセントまでの情報を含むと
仮定される。従って、前記第1のパルスはgcの計算の
ための主な候補である。しかしながら、もしそれが第1
のパルスのみに関して決定されれば、gcの値は前記最
適値を超えるため、より多くのパルスが考慮される。こ
の利得計算の構成に対応する関係は次の式で与えられ
る。
あり、kはgcの決定のためのパルスの数または番号で
あり、aは第1のパルスの重み係数である。
異なる音声信号およびパルスの数によって実験的に調べ
られた。発明者によってk=8のパルスの数が最もよい
結果を与えることが見出された。MSEは30パーセン
トに低減できた。
の精度を改善するために、インパルス応答関数の共分散
の影響が考慮される。対応する構成は重み付けられた第
1のパルスおよびサブフレームにおける信号の平均2乗
された振幅X2に依存する。
のパルスの振幅である。この実施形態の利点はその低い
計算機的な複雑さであり、利得の高い精度を有し、それ
はインパルス応答関数の共分散の考慮が多様な音声フラ
グメントに対する異なる最適化された組の係数aおよび
bにつながるからである。
ルゴリズムの全てに対して卓越した結果を示している。
しかしながら、前記第1のアルゴリズムは最も大きな計
算機的な努力を必要とする。一般に、インパルス応答関
数の共分散を考慮に入れる、上記アルゴリズムは余分の
計算機的な努力を必要とする。しかしながら、これは計
算された項の一部がやはりベクトルサーチのために必要
とされるという事実により補償され、これについては後
に説明する。従って、計算機的な努力はベクトルサーチ
から利得計算へとシフトされるのみであり、かつ前記利
得計算の結果の一部がベクトルサーチのためにも利用で
きるという事実により、劇的に増大することはない。
1の“A”において最適のベクトル{p(j),j=
1,…,8}を見つけるよう進行し、この場合8は前記
IS−127システムにおけるベクトル成分の最大数で
ある。
いては励振残余に対する多パルス符号化方法の順次の変
量または変形(variant)によって達成される。
共分散マトリクスにおける対角項のみの考慮において最
小にされるべき関数が次の形式で書かれる。
e)である。
される。
djがp(j−1)に基づき修正され、これは前に次の
式によって計算されている。
て決定された利得である。最後の3つの式の計算手順を
順次反復することにより、前記パルス位置p(j)がパ
ルス位置p(j+1)に進む前に最適化される。
記タスク、
1,…,kであり、前記IS−127標準においてはk
=8である。
おいて、音声残余または残差ならびにインパルス応答関
数dj(i)の相関が計算され(ステップ110)、か
つ前記最大化基準Fの現在の最善の値を一時的に記憶す
るための変数F′がリセットされる。図2には明白に述
べられていないが、非対角項φ(i,j)もステップ1
10において決定されこれらはj=2,…,8に対する
相関ベクトルの修正のために必要とされる。次のステッ
プ111において、固定コードブック構造の制約がチェ
ックされ、かつもしそれらが違反しておれば、手順はス
テップ117へと分岐する。ステップ112において、
前述の利得計算の際に計算された共分散項φ(i,i)
がメモリから取り出される。
よび共分散ベクトルφ(i,i)の値により、ステップ
113において推定または評価関数Fが計算される。F
の値は、前に決定された、値F′と比較される。Fの最
後に評価された値が前のF′より大きい場合は、ステッ
プ115において新しい値がメモリに格納され、p
(j)=iの値がステップ116においてメモリに格納
されかつ処理はステップ117に進む。ステップ117
において、1つのサブフレームにおける全てのサンプル
位置が推定または評価されたか否かがチェックされる。
もし全てのサンプル位置がチェックされていなければ、
処理はステップ117の問合わせの後にステップ118
において増分されたiと共にステップ111に進む。も
し全てのサンプル位置が評価または推定されておれば、
サーチ手順はステップ120において全てのベクトル成
分の評価が完了したか否かをチェックする。もし完了し
ておれば、最適のコードベクトルを見出す手順は考慮中
のサブフレームに対して終了しかつ、ステップ121に
おいて、パケットがチャネルの受信機側への送信のため
に形成またはフォーマットされる。もしベクトル成分の
評価または推定がまだ完了していなければ、処理はステ
ップ120における問合わせの後にステップ119にお
いてjを増分した後ステップ110に進む。
つかの利点を有する。すなわち、ベクトル1/φ(i,
i)はサブフレームごとに一回だけ計算されればよい。
これにより、最適のベクトルに対するサーチ手順の計算
機的努力が大幅に低減される。計算されるべき共分散ア
レイにおける非対角要素φ(i,j)の数が共分散アレ
イの(54から)7行に低減され、従来技術のように共
分散アレイの全ての非対角行(54)を計算する必要が
なくなる。基準計算のサイクル数がパルス数をサブフレ
ーム長さで乗算したものに限定され(例えば、8*54
=432)、一方従来技術(IS−127標準)による
必要なサイクル数は1144(固定コードブック構造に
わたり4つの反復を必要する組合わせ逐次サーチに対し
て)である。しかしながら、実際には、本発明の方法に
よるサーチは本質的に少ないサイクル数の後に切り詰め
る(truncated)ことができる。パルスに対す
る固定コードブック構造の制約は4つのパルスが見出さ
れた後にのみチェックされる。パルスの符号は自動的に
決定され従って音声残余信号xWの余分のろ波および各
サブフレームに対する基準ベクトルの計算を避けること
ができる。最大のMSE偏差またはずれを連続的に修正
することにより、本発明に係わる方法は非常に高速で収
斂する。従って、大域的および局所的極値が大域的なも
のに近い境界で見つけられる。
大部分に対して本発明に係わる方法により0.7dBま
での平均SNR値の増大を見出した。さらに、計算機的
な複雑さは従来技術のアルゴリズムの構成の場合よりも
2〜3の係数でより小さくなることが見出された。これ
は各々の成分をサーチする前に、ベクトルdj(i),
i=1,…,Nの再帰的な計算(修正)を伴ったコード
ベクトル成分の連続的なサーチによる。
または実利得(real gain)は計算されたgc
を使用する代わりに(IS−127のように)計算でき
る。これは合成された音声の品質をやや改善するが、い
くらかの余分の計算機的な努力を必要とする。
す。本発明の実施のためのコンピュータプログラムはプ
ログラムメモリ202に格納することができ、該プログ
ラムメモリ202は好ましくはROMである。他のメモ
リ211(RAM)が相関項(dj(i))、共分散項
(φ(i,i)およびφ(p(i);p(j)))、ソ
ース離散信号エネルギ(X)および利得(gc)の値を
一時的に格納するために必要とされる。ALU 203
においては、上述の種々の数式の計算が行われ、ステー
タスレジスタ204がALU 203のステータスを他
の構成要素に指示する。このハードウエア構成の全ての
要素はデータバス210を介して結合されている。最適
のベクトルのサーチの結果もまたデータバス210を介
して出力される。
e)は考慮されなかったが、その理由はそれが本発明に
係わる利得および最適のコードブックベクトルの計算に
影響を与えないからである。しかしながら、当業者には
レートはチャネルにおけるノイズおよび信号エネルギ推
定または評価に従って決定されることは明らかであろ
う。 [図面の簡単な説明]
した本発明の一実施形態を示すフローチャートである。
示すフローチャートである。
エアの構成を示すブロック図である。
Claims (9)
- 【請求項1】 CELPアルゴリズムのための方法であ
って、 信号プリプロセッサにおいてサンプルされた音声s
{n}を前処理し(101)ノイズろ波された音声出力
ベクトルおよびチャネルノイズ推定を出力する段階、 前記ノイズろ波された音声出力ベクトルのモデルパラメ
ータ推定(102)を行い予測残余および長時間予測利
得を出力する段階、 前記予測残余を符号化して(104〜120)フィルタ
のインパルス応答関数の指数およびベクトル利得を含む
適応コードブックベクトルを出力する段階、 符号化された音声パケットをフォーマットする段階(1
21)、 を含み、前記符号化する段階(104〜120)は以下
の順序で、 理論的な最適値に近いスタート値を選択することにより
前記利得を決定する段階(104〜109)、そして 再帰的に修正された相関ベクトルに基づき推定関数の極
値を逐次的にサーチすることによりベクトルの最適化を
行う段階(110〜120)、 を具備することを特徴とするCELPアルゴリズムのた
めの方法。 - 【請求項2】 前記利得は前記サンプルされた音声フレ
ームのエネルギおよび一組のインパルス応答関数の共分
散マトリクスのトレースに基づき決定されることを特徴
とする請求項1に記載の方法。 - 【請求項3】 前記利得は前記サンプルされた音声フレ
ームのエネルギおよび第1のインパルス応答関数の共分
散項に基づき決定されることを特徴とする請求項1に記
載の方法。 - 【請求項4】 前記利得は前記サンプルされた音声フレ
ームのエネルギおよびフレーム長さに基づき決定される
ことを特徴とする請求項1に記載の方法。 - 【請求項5】 前記最適のベクトルは、 前記サンプルされた音声信号およびインパルス応答関数
の相関項を前に見出されたベクトル成分に適合させ、そ
して 前記適合された相関項を前記推定関数に再挿入する、 ことにより決定されることを特徴とする請求項2に記載
の方法。 - 【請求項6】 前記最適のベクトルは、 前記サンプルされた音声信号およびインパルス応答関数
の相関項を前に見出されたベクトル成分に適合させ、そ
して 前記適合された相関項を前記推定関数に再挿入する、 ことにより決定されることを特徴とする請求項3に記載
の方法。 - 【請求項7】 前記最適のベクトルは、 前記サンプルされた音声信号およびインパルス応答関数
の相関項を前に見出されたベクトル成分に適合させ、そ
して 前記適合された相関項を前記推定関数に再挿入する、 ことにより決定されることを特徴とする請求項4に記載
の方法。 - 【請求項8】 コードブックベクトルおよび該コードブ
ックベクトルの利得を決定するために電気信号を処理す
るためのデジタル信号プロセッサであって、 信号プリプロセッサにおいてサンプルされた音声s
{n}を前処理して(101)少なくともノイズろ波さ
れた音声出力ベクトルおよびチャネルノイズ推定を出力
するための手段、 前記ノイズろ波された音声出力ベクトルのモデルパラメ
ータ推定を行い(102)予測残余および長時間予測利
得を出力するための手段、 前記残余を符号化して(104〜118)フィルタのイ
ンパルス応答関数の指数およびベクトル利得を含む適応
コードブックベクトルを出力するための手段、 前記符号化された音声パケットをフォーマットする(1
16)ための手段、 を具備し、前記符号化(104〜109)は次の順序
で、 理論値に近いスタート値を選択することにより前記利得
の決定を行う(104〜109)ための手段、そして 再帰的に修正された相関ベクトルに基づき推定関数の極
値を逐次的にサーチすることによりベクトルの最適化を
行う(110〜120)ための手段、 によって行なわれることを特徴とするデジタル信号プロ
セッサ。 - 【請求項9】 コードブックベクトルおよび該コードブ
ックベクトルの利得を決定するために電気信号を処理す
るためのデジタル信号プロセッサを具備する電子装置で
あって、前記デジタル信号プロセッサは、 信号プリプロセッサにおいてサンプルされた音声s
{n}を前処理して(101)少なくともノイズろ波さ
れた音声出力ベクトルおよびチャネルノイズ推定を出力
するための手段、 前記ノイズろ波された音声出力ベクトルのモデルパラメ
ータ推定を行い(102)予測残余および長時間予測利
得を出力するための手段、 前記残余を符号化して(104〜118)フィルタのイ
ンパルス応答関数の指数およびベクトル利得を含む適応
コードブックベクトルを出力するための手段、 前記符号化された音声パケットをフォーマットする(1
16)ための手段、 を具備し、前記符号化(104〜109)は次の順序
で、 理論値に近いスタート値を選択することにより前記利得
の決定を行う(104〜109)ための手段、そして 再帰的に修正された相関ベクトルに基づき推定関数の極
値を逐次的にサーチすることによりベクトルの最適化を
行う(110〜120)ための手段、 によって行なわれることを特徴とする電子装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/RU1998/000041 WO1999041737A1 (en) | 1998-02-17 | 1998-02-17 | Method and apparatus for high speed determination of an optimum vector in a fixed codebook |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002503835A JP2002503835A (ja) | 2002-02-05 |
JP3425423B2 true JP3425423B2 (ja) | 2003-07-14 |
Family
ID=20130195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000531839A Expired - Lifetime JP3425423B2 (ja) | 1998-02-17 | 1998-02-17 | 固定コードブックにおける最適のベクトルの高速決定のための方法および装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6807527B1 (ja) |
JP (1) | JP3425423B2 (ja) |
KR (1) | KR100510399B1 (ja) |
WO (1) | WO1999041737A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002017538A2 (en) * | 2000-08-18 | 2002-02-28 | The Regents Of The University Of California | Fixed, variable and adaptive bit rate data source encoding (compression) method |
US6766289B2 (en) * | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
US7327798B2 (en) | 2001-10-19 | 2008-02-05 | Lg Electronics Inc. | Method and apparatus for transmitting/receiving signals in multiple-input multiple-output communication system provided with plurality of antenna elements |
KR100463526B1 (ko) * | 2002-01-04 | 2004-12-29 | 엘지전자 주식회사 | 다중 입력 다중 출력 시스템에서의 전력 할당 방법 |
FR2872664A1 (fr) * | 2004-07-01 | 2006-01-06 | Nextream France Sa | Dispositif et procede de pre-traitemebnt avant codage d'une sequence d'images video |
EP2246845A1 (en) * | 2009-04-21 | 2010-11-03 | Siemens Medical Instruments Pte. Ltd. | Method and acoustic signal processing device for estimating linear predictive coding coefficients |
PT3364411T (pt) | 2009-12-14 | 2022-09-06 | Fraunhofer Ges Forschung | Dispositivo de quantização de vetor, dispositivo de codificação de voz, método de quantização de vetor e método de codificação de voz |
US10931538B2 (en) | 2018-09-13 | 2021-02-23 | Cable Television Laboratories, Inc. | Machine learning algorithms for quality of service assurance in network traffic |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
DE3871369D1 (de) | 1988-03-08 | 1992-06-25 | Ibm | Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate. |
JP2776050B2 (ja) | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
FI98104C (fi) * | 1991-05-20 | 1997-04-10 | Nokia Mobile Phones Ltd | Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi |
WO1995006310A1 (en) | 1993-08-27 | 1995-03-02 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
FR2729244B1 (fr) * | 1995-01-06 | 1997-03-28 | Matra Communication | Procede de codage de parole a analyse par synthese |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
-
1998
- 1998-02-17 US US09/508,183 patent/US6807527B1/en not_active Expired - Lifetime
- 1998-02-17 KR KR10-2000-7009029A patent/KR100510399B1/ko not_active IP Right Cessation
- 1998-02-17 WO PCT/RU1998/000041 patent/WO1999041737A1/en active IP Right Grant
- 1998-02-17 JP JP2000531839A patent/JP3425423B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
WO1999041737A8 (en) | 2000-08-10 |
KR20010024943A (ko) | 2001-03-26 |
WO1999041737A1 (en) | 1999-08-19 |
JP2002503835A (ja) | 2002-02-05 |
KR100510399B1 (ko) | 2005-08-30 |
US6807527B1 (en) | 2004-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0422232B1 (en) | Voice encoder | |
US6813602B2 (en) | Methods and systems for searching a low complexity random codebook structure | |
Campbell Jr et al. | The DoD 4.8 kbps standard (proposed federal standard 1016) | |
EP0747882B1 (en) | Pitch delay modification during frame erasures | |
EP0443548B1 (en) | Speech coder | |
JP2776050B2 (ja) | 音声符号化方式 | |
RU2591021C2 (ru) | Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp | |
US20010037195A1 (en) | Sound source separation using convolutional mixing and a priori sound source knowledge | |
US20080249767A1 (en) | Method and system for reducing frame erasure related error propagation in predictive speech parameter coding | |
EP0824750B1 (en) | A gain quantization method in analysis-by-synthesis linear predictive speech coding | |
JP3425423B2 (ja) | 固定コードブックにおける最適のベクトルの高速決定のための方法および装置 | |
US20050114123A1 (en) | Speech processing system and method | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP3180786B2 (ja) | 音声符号化方法及び音声符号化装置 | |
EP0658876B1 (en) | Speech parameter encoder | |
US6330531B1 (en) | Comb codebook structure | |
EP0724252B1 (en) | A CELP-type speech encoder having an improved long-term predictor | |
WO2024021747A1 (zh) | 声音编解码方法以及相关装置、系统 | |
Cuperman et al. | Backward adaptation for low delay vector excitation coding of speech at 16 kbit/s | |
WO2008072732A1 (ja) | 音声符号化装置および音声符号化方法 | |
CN100487790C (zh) | 选择自适应码本激励信号的方法和装置 | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
Cuperman et al. | Low-delay vector excitation coding of speech at 16 kb/s |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080502 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090502 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090502 Year of fee payment: 6 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090502 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100502 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110502 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110502 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 9 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130502 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130502 Year of fee payment: 10 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130502 Year of fee payment: 10 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |