JPH11500837A - スピーチコーダ用信号予測方法及び装置 - Google Patents

スピーチコーダ用信号予測方法及び装置

Info

Publication number
JPH11500837A
JPH11500837A JP9514782A JP51478297A JPH11500837A JP H11500837 A JPH11500837 A JP H11500837A JP 9514782 A JP9514782 A JP 9514782A JP 51478297 A JP51478297 A JP 51478297A JP H11500837 A JPH11500837 A JP H11500837A
Authority
JP
Japan
Prior art keywords
vector
signal
value
filtered
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9514782A
Other languages
English (en)
Inventor
ジャック ポーラン
ベルトラン ラヴェラ
Original Assignee
フィリップス エレクトロニクス ネムローゼ フェンノートシャップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9511937A external-priority patent/FR2739964A1/fr
Application filed by フィリップス エレクトロニクス ネムローゼ フェンノートシャップ filed Critical フィリップス エレクトロニクス ネムローゼ フェンノートシャップ
Publication of JPH11500837A publication Critical patent/JPH11500837A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Abstract

(57)【要約】 本発明は符号化すべき音声信号を連続するサブフィールドに分割し、該音声信号内に存在する周期性情報を予測する方法及び装置に関する。この予測は各前サブフィールドの最適励起に基づいて構成されたアダプティブディクショナリを用いて行い、これらの前予測をフィルタ処理し、次いで相関させて所望の予測信号を選択し、次にこの予測信号を初期情報と比較して予測誤差のみを符号化し、伝送する。

Description

【発明の詳細な説明】 スピーチコーダ用信号予測方法及び装置 本発明は、CELPスピーチコーダにおいて短時間分析の残差ベクトル信号又 は残差ベクトル、即ち符号化すべき初期音声信号に存在する周期性情報を含む信 号を予測する方法であって、前記音声信号を連続するサブフィールドに分割し、 前記予測を前サブフィールドに対し予測された最適励起に基づいて行う予測方法 に関するものである。本発明は、符号化すべき初期音声信号を受信し、該音声信 号を連続するサブフィールドに分割し、該音声信号内の周期性情報を規定する残 差ベクトル信号を出力する短時間分析フィルタと、この残差ベクトル信号を予測 する予測装置と、この残差ベクトル信号と予測ベクトル信号との差により予測誤 差を推定する回路とを具えるCELPスピーチコーダ、特に前記予測装置に関す るものである。 発声器官により発生された音声は2つの特性を有する音声信号を構成し、一方 の特性はこの信号を人間の聴覚器官(有限通過帯域、有限周波数分解能、共振周 波数に対する感度、信号の周波数成分の位相に対する不感応度等)を通して知覚 するメカニズムに関連し、他方の特性は発声器官の機能(音声の擬似周期性、信 号の共振構造、..)に関連する。音声メッセージ自体は、内容についての情報 と、表現情報という、メッセージの音響表現の個々の変化を解釈する補助情報と の組合せとみなすことができる。このようなメッセージの有効な伝送はたぶん忠 実度基準の決定を必要とすること明らかである。しかも、一般に、伝送メッセー ジと、対応する受信信号との間に知覚の差がないことが検出される知覚基準を決 定するのが一層現実的である。 実際上、音声信号は音声発生に必要なエネルギーを供給する呼吸器系の制御の 下で声道により発生された空気圧の変化により構成される。肺を出た空気の流れ が母音の発生と関連する基本周波数という周波数F0で変調される。この周波数 は男では約70Hzと150Hzの間で変化し、女では約150Hzと400Hzの間で 変化し、有声音を特徴づける(有声音の一例の振幅Aを時間tの関数として図1 に示す)。この場合、空気流が声道の空胴を励起して強制振動させ、声道の形が ホルマントという周波数F1、F2、F3等に対応する。音声信号は、任意の固有 の周波数を持たない音源により発生される声道の適正周波数を励起しない信号、 即ち有声音のコヒーレンス性を持たないで雑音に関連する信号も含む(これらの 音声は大多数の子音の発生に関連する)。音声信号の特徴は、発生スペクトルが 有声音を発生する線スペクトル(周期的励起)及び無声音を発生する連続スペク トル(インコヒーレント励起)を具えることを示すスペクトル分析により示すこ とができる。 音声信号の一層広範な分析は、音声信号の通過帯域の正確且つ高信頼度の伝送 のための処理は音響レベルにおけるかなり多量のデータストリームの処理になる ことを最終的に示す。このデータストリームを相当程度低減するために種々の音 声分析技術が開発されている。得られた冗長性を除去するために、最初アナログ 形式の音声信号を、ディジタル化後に、現行のビットレートラインを経て伝送し うるビットレートに圧縮することができる。 音声信号圧縮に関しては、国際電気通信連合が低ビットレート電話に関する応 用のフレームワークにおける勧告案を公表している("Draft Recommendation G. 723- Dual rate speech coder for multimedia telecommunication transmittin g at 5.3 and 6.3 kbits/s",ITU,Study Group 15,1995,10th "LBC Meeting" ,Newton,Ma,USA)。これにはスピーチコーダに対する標準規格が規定されて いる。 このコーダはアナリシス・バイ・シンセシス(合成による分析)線形予測符号 化に関する原理に基づいている。この符号化は合成フィルタ係数を決定する分析 ステップと、所定の誤差基準(最小二乗誤差基準がしばしば使用される)を最小 にする励起の系列を検出又は計算する合成による分析ステップとを具える。前記 勧告案に述べられている、コード・エクサイテッド・リニア・プレディクティブ ・エンコーデイング(ode xcited inear redictive Encoding)又は CELP符号化(以後この語を使用する)という符号化は音声発生モードの簡単 化モデルに関連し、このモデルによれば第1近似において音声信号を短時間相関 フィルタ(声道)とその入力として励起信号を有する長時間相関フィルタ(音源 )とによりモデル化することができる。 CELPコーダの詳細な実施例が多くの刊行物、例えば "Digital audio codi ng for visual communications",P.Noll,Proceedings of the IEEE,vol.83 ,no.6,June 1995に記載されている。知覚フィルタリングが全てのCELPコ ードに使用され、前記勧告案G.723も調波フィルタリングを使用している。 これらのフィルタリング処理は本発明の範囲に含まれず、ここにはこれ以上詳し く述べない。このように、コーダにおいては、短時間分析がLPC(inear r edictive oding)という線形予測フィルタリング処理からなり、このフィルタ リング処理は一般にA(z): (勧告G.723の場合にはn=10) で表されが、LTP(ong erm rediction)という長時間分析はA(z)の係数 akの量子化を有する合成フィルタリングS(z)=1/A(z)を使用する。 短時間分析は予測方法に基づく。この予測方法の基本思想は、音声入力信号又 は観察信号s(n)(n はサンプルのランクを示す)が既知であるとき、励起信号x( n)により励起され、s(n)にできるだけ近い予測信号p(n)を供給するフィルタを見 つけ出すことにあり、この方法ではs(n)とp(n)との差を設定することによりでき るだけ小さい残差誤差e(n)を得ることができる。短時間分析に使用する予測方法 は線形である。その理由は、伝送すべき初期音声信号の各サンプルs(n)は所定数 (例えば10)の前サンプルの線形結合の形で予測することができ(信号p(n)) 、この線形結合は、例えば次のように書き表せる。 Nが例えば10サンプルの場合には、この式は次のようになる。 p(n)=a1.s(n-1)+a2.s(n-2)+...+a10.s(n-10) (2) これは、予測信号p(n)は、フィルタの係数ak(式(2)の例ではa1〜a10)を予 測誤差e(n)= s(n)-p(n)が最小になるよう計算することにより得られることを意 味する(一般に、得られる誤差を最小にするために最小二乗法が使用されている )。 前記文書G.723に記載されているスピーチコーダは8kHzのサンプリン グ周波数の240サンプルを具えるブロック又はフィールドからなる信号を受信 し、各フィールドは各60サンプルの4つのサブフィールドに分割するものとし ている。伝送すべき信号s(n)が既知であるとき、励起信号x(n)が供給され、サン プリング信号s(n)にできるだけ近い信号p(n)を得ることができる合成フィルタと いうフィルタ1/A(z)を探索することは、伝送すべき信号を受信すると出力信 号ができるだけ白色雑音になる(理想的なコーダでは出力信号が真の白色雑音に なる)ような係数を有する分析フィルタというフィルタA(z)を探索することと 等価であると言える。音声信号を伝送する代わりに、フィルタA(z)の係数を伝 送すれば後にこの信号を再構成することができる(これらの係数の伝送は予測誤 差又は信号自体の伝送より少数のビットを必要とする)。 従って、上述したCELPコーダは、伝送すべき音声信号を受信し、理想的な 場合には白色雑音を出力する短時間分積フィルタを具える。理想的でない場合に は、このフィルタは完全に白色雑音でない残差信号e(n)を出力し、この縮退され た信号はまだ音声信号の有声音部分の周期性情報を含んでおり、上述した長時間 e(n))。 CELPコーダでは、2つのタイプの予測を区別する必要がある。短時間分析 という第1のタイプの予測は隣接サンプルの減相関を行い、その目的は、既知信 号のフィルタリング後に、白色雑音をできるだけよく近似する残差信号を得るの に最適な入力フィルタの係数を決定することにある。長時間予測という、各サブ フィールド毎に行われる第2のタイプの予測(後述する本発明はこの第2のタイ プの予測にのみ関連する)は、次式(3)に従って有声音の残差周期性情報を使用 する。 p(n)= β.t(n-OLP) (3) この式(3)において、t(.)及びp(.)はそれぞれモデル化すべき信号のサンプル及 び予測サンプルを示し、βは利得値であり、OLP(pen oop itch)は信 号の周期性を表すOLP周期という量を示す。式(3)により表される予測を行う にはOLP周期及び利得βを決定すれば十分である。式(3)において、この決定 は直接依存の形を取り、利得係数を別にすれば、予測すべきサンプルは既に発生 したサンプルのうちの一つに等しいことがわかる。 実際には、採用されている原理はもっと一般的なものである。直接依存の値で あるこの値に関し、もっと複雑な関係が例えば5の予測次数に対し次式(4)の形 に構成される。 CELPコーダ、特に上述した標準規格に対する勧告案の目的であるコーダの 場合には、このような予測をアダプティブディクショナリというメモリを用いて 実現している。このアダプティブディクショナリは各サブフィールドごとに部分 的に更新される前サブフィールドの最適励起ベクトル用メモリに基づいて構成さ れる。偶数サブフィールドに対しては、このディクショナリは(5の予測次数の 場合)5つのベクトルの3つのグループで構成され、奇数サブフィールドに対し ては、5つのベクトルの4つのグループで構成される。5つのベクトルのこれら のグループの各々を以後”V−ベクトル”という。δは偶数サブフィールドに対 し値(-1,0,1)及び奇数サブフィールドに対し(-1,0,1,2)であることが既知であれ ば、各V−ベクトルの第1ベクトルの第1成分は過去の(OLP-2+δ)をシフトさ せることにより得られる。各V−ベクトルの他の4つのベクトルは第1ベクトル を用いてサンプルの連続シフトにより得られる。 従って、式(4)の対応する実行はサンプルの線形結合による予測であって、こ の予測においては利得βを変えることにより、例えば上述のG.723勧告案の えるとともに量OLPを低い値δで調整することにより、解ベクトルの探索が正 確になる。この探索中における可能な最良のベクトル解の選択は、決定プロシー と式(4)の実行により得られる解ベクトルとの差の最小化ステップ(最小二乗誤 差に基づく)を含めることにより行う。最後に、CELPコーダは、その入力側 に、伝送すべき音声信号を受信し、この初期音声信号の周期性情報を構成する残 差信号を出力するのみである分析フィルタを具えるので、この縮退された信号t( n)に対し図2につき後述する予測を行う。従って、アダプティブディクショナリ 図2は、G.723勧告案の場合における予測装置の一例を示し、この装置は 上述した決定原理を実施する。この装置は前サブフィールドの最適励起に基づい て、即ち前サンプルに対する同一の予測方法の前回の実施中に選択された励起に 基づいて構成された励起ベクトルを記憶する回路20(これは上述したアダプテ LP(losed oop itch)を見つけ出すために、回路20の後にチャネル3 0を接続し、偶数サブフィールドの場合には3つの同一のチャネル30a,30 b,30cを接続し、この場合にはδは、例えば3つの値−1,0及び+1であ るものとする(これは図2に示す場合である)。(奇数サブフィールドの場合に は、回路20の後に4つの同一のチャネルを接続し、この場合にはδは4つの値 −1,0,+1,+2であるものとする)。 これらのチャネル(即ち記載の実施例では3又は4つのチャネル、このチャネ ル数は限定要素ではない)の各々は当該チャネルのピッチδに対応するアダプテ ィブディクショナリのV−ベクトルを処理し、この目的のために、(先に定義し た)合成フィルタのパルス応答を有するフィルタ31を直列に具える。その後に ラ積により与えられる、フィルタ処理されたベクトルと残差ベクトルとの間の5 つの相関項(又は換言すれば交差積)と、アダプティブディクショナリの5つの フィルタ処理されたベクトル自体のスカラ積により与えられる5つのエネルギー 項と、5つのフィルタ処理されたベクトル間の10の相関項とにより構成される らどの程度までモデル化することができるか決定することができる。利得(量子 化される)は、種々の利得に対する可能な値を含むメモリ40又は量子化テーブ ルにより与えられる(5.3kビット/sに対し170の利得、6.3kビット /sに対し85又は170の利得を含み、異なる2つの場合に使用する170の ベクトルは同一である)。利得に関する情報はこの量子化テーブル内に、次のよ うに定義された20の項:5つの利得値、これらの利得の二乗に等しい5つの値 、これらの5つの利得値の交差積に対応する10の値を有するベクトルの形で与 えられる。 δの各値につき(即ち、上述した実施例では3又は4つのチャネルの各々にお いて3つの値δ=−1,0,+1又は4つの値δ=−1,0,+1,+2につき )実行すべき、次式(5)に従う予測誤差の最小化: (例えば60サンプルのサブフィールドの対しn=0〜59、及びf(.)=合成フ ィルタによりフィルタ処理された過去の最適励起のサンプル)を回路33におい ーブルのベクトルとのスカラ積を最大にするベクトルである点に注意されたい。 回路33の出力側において、回路50がこれらの3つ(又は4つ)の回路の出力 に得られる3つ又は4つのスカラ積から最大のスカラ積を選択し、この最大スカ ラ積に対応するステップサイズδの最適値(メモリ110に記憶される)及び利 用される3つ(又は4つ)の値の一つであり、こうして選択された値がチャネル と同数(3又は4つ)の入力端子を有するスイッチ60を制御する。フィルタ3 1の出力側に配置されたこのスイッチは探索解ベクトルの最良の表現を構成する フィルタ処理されたV−ベクトルを選択することができる。 この選択したフィルタ処理されたベクトルは次に増幅器70の入力端子に供給 され、選択回路50の出力側に設けられたメモリ80に回路50により供給され 入力端子に供給され、この減算器はその正入力端子にCELPコーダの分析フィ このようなスピーチコーダ(文書G.723に記載されている)により得られ る品質は、アダプティブディクショナリを構成する回路20を用いて実行される この閉ループ長時間相関の分析の精度によりほぼ決まる。しかしながら、この品 質は、コーダの実現に含まれる一連の演算から明らかなように、構成が極めて複 雑になるという犠牲を払ってのみ得られるものである。 本発明の第1の目的は、上述した品質にほぼ等しい品質を有する一層簡単な予 測方法を提供することにある。 この目的のために、本発明は、頭書に記載の予測方法において、当該方法は、 各サブフィールドに対し、 (1) ステップサイズδの種々の値に対し、前記周期性情報を決定し、前記先に ズの対応する値を選択するために、δの各値に対し次のサブステップ: (a) フィルタリングサブステップと、 (b) フィルタ処理されたベクトルと残差ベクトルとの間の相関の項、フィル タ処理されたベクトルのエネルギーの項及びフィルタ処理されたベクトル間の相 δ)initを発生させるサブステップと、 を直列に実施するステップと、 なるチャネルに対応するステップサイズδの前記最適値を選択し、このδの最適 を選択するステップと、 (3) 前記先に選択されたδの最適値に対応する前サブフィールドのフィルタ処 理された励起ベクトルと、前記選択された最適利得ベクトルとに基づいて前記予 測残差ベクトル信号又は予測残差ベクトルを計算するステップ、 とを具えることを特徴とする。 本発明の他の目的はほぼ等しい品質を維持しながら低減された複雑度を有する 上述したスピーチコーダに類似のスピーチコーダを提供することにある。 この目的のために、本発明は、頭書に記載のコーダにおいて、予測装置が、 (A) 前サブフィールドに対する予測最適励起ベクトルを記憶する、アダプティ ブディクショナリという記憶回路と、 する複数のチャネルであって、各チャネルが所定値のステップサイズδに対し前 記周期性情報を決定し、各チャネルが、 (a) 前記分析フィルタに基づいて構成された合成フィルタのインパルス応答 に等しいインパルス応答を有するインパルス応答フィルタと、 (b) 前記アダプティブディクショナリから到来するフィルタ処理されたベク トルと前記残差ベクトル又は目標ベクトルとの相関の項、フィルタ処理されたベ クトルのエネルギーの項及びフィルタ処理されたベクトル間の相関の項を計算す る回路と、 (c) チャネル毎に、初期利得ベクトルの成分、該ベクトルの成分の二乗値及 選択する回路と、 を直列に具える複数のチャネルと、 (C) 前記ステップサイズの最適値を計算し、記憶するサブアセンブリと、 (D) 候補利得ベクトルの成分とそれらの二乗値及びそれらの交差積を含む、量 子化テーブルというメモリと、 (E) 前記最適値のステップサイズと関連して、フィルタ処理されたベクトルと 残差ベクトルとのスカラ積により与えられる相関項からなる対応する最適ベクト ネルギー項と、フィルタ処理されたベクトルのスカラ交差積により与えられる相 関項とを選択するスイッチと、 (F) 前記量子化テーブル内の各候補利得ベクトルを選択する回路と、 (G) このように選択された利得ベクトルを記憶するメモリと、 (H) このメモリの出力側にあって、前記最適ステップサイズ値に従ってスイッ チにより選択されたフィルタ出力信号を増幅する増幅器と、 により前記予測誤差を推定する減算器と、 を具えることを特徴とする。 文書G.723の場合には、量子化テーブル内の利得の軌道又は走査が極めて 複雑であり、これはテーブル走査が240サンプルのフィールド毎に14回行わ れるためであるが、本発明による解決方法によれば、品質を殆ど低下することな くもっと少ない走査(この文書に従うコーダの場合には4回)をカバーすること ができる。上述の如き提案の基本思想は、予測子が減相関である、即ちフィルタ 処理されたベクトル間の先に決定された相関が零であるという仮説の簡単化を行 うことにより、各サブフィールド及び各ステップサイズδに対応する各チャネル 要なしに決定することができるという点にある。当該チャネルに対するこのベク トルの成分はフィルタ処理されたベクトルと目標ベクトルとの間の相関の項と先 (次善値)を決定することができ、サブフィールド毎に1回の量子化テーブルの 走査を必要とするのみとすることができる。予測誤差を最小にするステップサイ に関するこの式の微分係数を相殺するベクトルであるという上述の説明から直接 得られ、チャネルの出力端の計算サブアセンブリにより各サブフィールドに対し (偶数サブフィールドの場合)又は4つのスカラ積(奇数サブフィールドの場合 )のうちの一つを最大にするものであり、このスカラ積は各チャネル内に設けら 乗及びこれらの成分の10の交差積を有するベクトルである)。各サブフィール ドに対する最適利得ベクトルは量子化テーブルの出力端に設けられた回路により 得られ、この回路は計算されたステップサイズの最適値に対応するベクトルV(δ )と前記テーブルの各ベクトル(ここではビットレートに応じて170又は85 ベクトル)とのスカラ積の最大値を探索する。この最適利得ベクトルの決定はサ ブフィールド毎に1回、フィールド毎に4回の量子化テーブルの走査を必要とす るのみであり(これまでは偶数サブフィールドであるか奇数サブフィールドであ るかに応じてサブフィールド毎に3回又は4回、即ちフィールド毎に14回の走 査を必要とした)、複雑度の著しい低減が得られる。 本発明のこれらの特徴及び他の特徴は以下に記載する実施例の説明から明らか になる。 図面において、 図1は時間の関数としての有声音の振幅の一例を示し、 図2及び図3はそれぞれ前記文書G.723の場合及び本発明の場合において 閉ループ内で音声周期を予測する装置の構造を示す。 図3に示す本発明による予測装置は図2に示すものと共通の素子、即ち候補励 起ベクトルを記憶する回路(又はアダプティブディクショナリ)、フィルタ31 、相関項及びエネルギー項を計算する回路32、メモリ40(又は量子化テーブ ル)、スイッチ60、メモリ80、減算器90及びメモリ110を有する。 図3に示す実施例によれば次のような簡単化が実現される。各チャネル130 によりδの初期値を決定することができ、この決定はサブフィールド毎に1回の 量子化テーブル(メモリ40)の走査を必要としない(この選択はチャネル数に 応じて3又は4つの予選択回路101で行われる)。このように選択された初期 利得ベクトルに対し最適ステップサイズδの選択が計算回路102において行わ れ、このδ値がメモリ110に記憶され、スイッチ161によりこの値に対応す る計算回路32の出力の一つが選択される。次に最適利得ベクトルが選択回路1 50により探索され、このように選択されたベクトルがメモリ80に記憶される 。フィルタ31の出力側に設けられた、メモリ110により供給されるδの値に より制御されるスイッチ60が選択したフィルタ処理されたV−ベクトルを増幅 器70に供給する。このように増幅された最適なフィルタ処理V−ベクトルが予 このように実現される簡単化は、20人の異なる話者により与えられる12秒 の20の音声信号に基づいて試験したところ、前記文書G.723の場合に得ら れる品質を平均0.2dB低減するだけであった。信号体雑音比(平均S/N比 )のこの低下は知覚し得ないものである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),JP,US

Claims (1)

  1. 【特許請求の範囲】 1.CELPスピーチコーダにおいて短時間分析の残差ベクトル信号又は残差ベ クトル、即ち符号化すべき初期音声信号に存在する周期性情報を含む信号を予測 する方法であって、前記音声信号を連続するサブフィールドに分割し、前記予測 を前サブフィールドに対し予測された最適励起に基づいて行う予測方法において 、当該方法は、各サブフィールドに対し、 (1) ステップサイズδの種々の値に対し、前記周期性情報を決定し、前記先 サイズの対応する値を選択するために、δの各値に対し次のサブステップ: (a) フィルタリングサブステップと、 (b) フィルタ処理されたベクトルと残差ベクトルとの間の相関の項、フィ ルタ処理されたベクトルのエネルギーの項及びフィルタ処理されたベクトル間 T(δ)initを発生させるサブステップと、 を直列に実施するステップと、 になるチャネルに対応する前記ステップサイズδの最適値を選択し、このδの スカラ積のうち最大になる該テーブル内のベクトルである前記最適利得ベクト (3) 前記先に選択されたδの最適値に対応する前サブフィールドのフィルタ 処理された励起ベクトルと、前記選択された最適利得ベクトルとに基づいて前記 予測残差ベクトル信号又は予測残差ベクトルを計算するステップ、 とを具えることを特徴とする予測方法。 2.符号化すべき初期音声信号を受信し、該音声信号を連続するサブフィールド 力する短時間分析フィルタと、この残差信号を予測する装置と、この残差ベク 路とを具えるCELPスピーチコーダにおいて、前記予測装置が、 (A) 前サブフィールドに対する予測最適励起ベクトルを記憶する、アダプテ ィブディクショナリという記憶回路と、 算する複数のチャネルであって、各チャネルが所定値のステップサイズδに対し 前記周期性情報を決定し、各チャネルが、 (a) 前記分析フィルタに基づいて構成された合成フィルタのインパルス応 答に等しいインパルス応答を有するインパルス応答フィルタと、 (b) 前記アダプティブディクショナリから到来するフィルタ処理されたベ クトルと前記残差ベクトル又は目標ベクトルとの相関の項、フィルタ処理された ベクトルのエネルギーの項及びフィルタ処理されたベクトル間の相関の項を計算 する回路と、 (δ)initを予め選択する回路と、 を直列に具える複数のチャネルと、 (C) 前記ステップサイズの最適値を計算し、記憶するサブアセンブリと、 (D) 候補利得ベクトルの成分とそれらの二乗値及びそれらの交差積を含む、 量子化テーブルというメモリと、 (E) 前記最適値のステップサイズと関連して、フィルタ処理されたベクトル と残差ベクトルとのスカラ積により与えられる相関項からなる対応する最適ベ れるエネルギー項と、フィルタ処理されたベクトルのスカラ交差積により与えら れる相関項とを選択するスイッチと、 (F) 前記量子化テーブル内の各候補利得ベクトルを選択する回路と、 (G) このように選択された利得ベクトルを記憶するメモリと、 (H) このメモリの出力側にあって、前記最適ステップサイズ値に従ってスイ ッチにより選択されたフィルタ出力信号を増幅する増幅器と、 差により前記予測誤差を推定する減算器と、 を具えることを特徴とするCELPスピーチコーダ。
JP9514782A 1995-10-11 1996-10-11 スピーチコーダ用信号予測方法及び装置 Pending JPH11500837A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR9511937A FR2739964A1 (fr) 1995-10-11 1995-10-11 Dispositif de prediction de periode de voisement pour codeur de parole
FR95/11937 1996-09-25
FR96402030.9 1996-09-25
EP96402030 1996-09-25
PCT/FR1996/001596 WO1997014139A1 (fr) 1995-10-11 1996-10-11 Methode et dispositif de prediction de signal pour un codeur de parole

Publications (1)

Publication Number Publication Date
JPH11500837A true JPH11500837A (ja) 1999-01-19

Family

ID=26144072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9514782A Pending JPH11500837A (ja) 1995-10-11 1996-10-11 スピーチコーダ用信号予測方法及び装置

Country Status (4)

Country Link
EP (1) EP0796490B1 (ja)
JP (1) JPH11500837A (ja)
DE (1) DE69609592T2 (ja)
WO (1) WO1997014139A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3263347B2 (ja) * 1997-09-20 2002-03-04 松下電送システム株式会社 音声符号化装置及び音声符号化におけるピッチ予測方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer

Also Published As

Publication number Publication date
WO1997014139A1 (fr) 1997-04-17
DE69609592T2 (de) 2001-03-29
DE69609592D1 (de) 2000-09-07
EP0796490B1 (fr) 2000-08-02
EP0796490A1 (fr) 1997-09-24

Similar Documents

Publication Publication Date Title
US5293448A (en) Speech analysis-synthesis method and apparatus therefor
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
EP0749110A2 (en) Adaptive codebook-based speech compression system
EP1420389A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
US4791670A (en) Method of and device for speech signal coding and decoding by vector quantization techniques
JPH0990995A (ja) 音声符号化装置
EP1688920B1 (en) Speech signal decoding
JPH10207498A (ja) マルチモード符号励振線形予測により音声入力を符号化する方法及びその符号器
US4720865A (en) Multi-pulse type vocoder
JPH09160596A (ja) 音声符号化装置
US20040117178A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP3531780B2 (ja) 音声符号化方法および復号化方法
EP0421360B1 (en) Speech analysis-synthesis method and apparatus therefor
US6842732B2 (en) Speech encoding and decoding method and electronic apparatus for synthesizing speech signals using excitation signals
JP3050978B2 (ja) 音声符号化方法
JPH11500837A (ja) スピーチコーダ用信号予測方法及び装置
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP2736157B2 (ja) 符号化装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3192051B2 (ja) 音声符号化装置
JPH09179593A (ja) 音声符号化装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110903

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110903

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

Free format text: JAPANESE INTERMEDIATE CODE: R313115

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110903

Year of fee payment: 12

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110903

Year of fee payment: 12

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120903

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250