JPH05502517A - 最適化された信号エネルギパラメータを有するデジタル音声コーダ - Google Patents
最適化された信号エネルギパラメータを有するデジタル音声コーダInfo
- Publication number
- JPH05502517A JPH05502517A JP2514552A JP51455290A JPH05502517A JP H05502517 A JPH05502517 A JP H05502517A JP 2514552 A JP2514552 A JP 2514552A JP 51455290 A JP51455290 A JP 51455290A JP H05502517 A JPH05502517 A JP H05502517A
- Authority
- JP
- Japan
- Prior art keywords
- information
- gain
- component
- signal
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 26
- 230000007774 longterm Effects 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- NFGXHKASABOEEW-GYMWBFJFSA-N (S)-methoprene Chemical compound COC(C)(C)CCC[C@H](C)C\C=C\C(\C)=C\C(=O)OC(C)C NFGXHKASABOEEW-GYMWBFJFSA-N 0.000 claims 1
- 230000005284 excitation Effects 0.000 description 71
- 230000005540 biological transmission Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 235000009300 Ehretia acuminata Nutrition 0.000 description 1
- 244000046038 Ehretia acuminata Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000287462 Phalacrocorax carbo Species 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- KJONHKAYOJNZEC-UHFFFAOYSA-N nitrazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1 KJONHKAYOJNZEC-UHFFFAOYSA-N 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Sewing Machines And Sewing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
最適化された信号エネルギパラメータを有するデジタル音声コーグ
技術分野
この発明は、一般的には音声コーグに関し、かつより詳細にはゲイン修正可能な
音声表現要素を用いるデジタル音声コーグに関する。
発明の背景
音声コーグが技術上知られている。いくっがの音声コーグはアナログ音声サンプ
ルをデジタル化表現に変換し、かつその後リニア予測符号化(linear p
redictive coding)を用いてスペクトル音声情報を表現する。
他の音声コーグは通常のリニア予測符号化技術に対し元の音声信号に関係する励
起信号(excitation signal)を提供することにより改善を行
う。
米国特許第4.817.157号は改良されたベクトル励起源を有するデジタル
音声コーグを開示しており、該音声コーグにおいてはコードブック励起ベクトル
のコードブックがアクセスされて利用可能な情報に最も適合するコードブック励
起信号を選択し、かつ元の信号をより忠実に表現する復元音声信号を提供するた
めに使用される。そのようなシステムにおいては、ピッチ励起情報およびコード
ブック励起情報が出力されかつ組合わされて複合信号を発生しこれは次に復元音
声情報を8カするために使用される。
これらの信号を組合わせる前に、ゲインファクタが各々に適用され、各々の信号
に関連するエネルギ量がこれらの構成部分によって表現される元の音声成分と関
連するエネルギ量を表すようにする。
音声コーグは適切なピッチ励起およびコードブック励起情報を決定する時に適切
なゲインファクタを決定し、かつこれらすべての要素に関する符号化情報は次に
デコーダに提供されて元の音声情報の再構成を可能にする。一般に、従来技術の
音声コーグはこのゲインファクタ情報をデコーダにディスクリート形式で提供し
ていた。これは該情報を別個の識別可能なパケットで、あるいは(ベトクル量子
化のような)他の形式で送信することにより達成され、送信の目的で組合わされ
るが、依然として実効的には互いに独立である。
従来技術の音声符号化技術はかなりの改善の余地を残している。上に述べたゲイ
ンファクタ送信方法はエラー保護を収容するためにかなりの量の送信媒体容量を
必要とする(さもなければ、送信の間に生ずるエラーがゲイン情報を汚染し、か
つこれが極めて望ましくない不正確な音声再生結果を生じ得る)。
従って、ゲインファクタ情報に対する増強された保護を同時に提供しながら、送
信媒体に対する需要を低減する音声コーディングの方法の必要性が存在する。
発明の概要
この必要性および他のものはここに開示された音声符号化方法の装置により実質
的に満たされる。この音声符号化方法は、音声サンプルを表す第1の成分に対す
るゲインに関係する第1のゲイン値、およびその音声サンプルの第2の成分に対
するゲインに関係する第2のゲイン値を含む、ゲイン情報を生成する結果となる
。この方法によれば、これらのゲイン値は処理されて前記サンプルに対する総合
的なエネルギ値に関係する第1のパラメータ、および前記サンプルに対する総合
的なエネルギ値に対する第1および第2のゲイン値の内の少なくとも1つの相対
的な寄与に、少なくとも部分的に、基づく第2のパラメータを提供する。
第1および第2のパラメータに関する情報は次にデコーダに送信される。
本発明の1つの実施例においては、前記ゲイン情報は少なくとも前記サンプルの
第3の成分に対するゲインに関係する第3のゲイン値を含むことができる。該ゲ
イン値の処理は次に全体のエネルギ値に対する前記第1、第2、および、第3の
ゲイン値の内の異なる1つの相対的な寄与に、少なくとも部分的に、基づく第3
のパラメータを生成する。
本発明の1つの実施例においては、前記第1および第2のパラメータ(そして、
もしあれば、第3のパラメータ)がベクトル量子化されてコードを提供する。こ
のコードは次にデコーダに送信される情報を構成する。
本発明の他の態様においては、コーグによって出力されるゲイン情報は音声信号
に対するロングタームのエネルギ値(たとえば、音声情報の複数のサンプルまた
は単一の所定のフレームに関するエネルギ値)に関係する第1の値、および信号
のショートタームのエネルギ値(たとえば、所定のフレームの一部を構成する単
一サンプルまたはサブフレーム)に関係する第2の値を含み、前記第2の値は特
定のサンプルまたはサブフレームとともに使用するために第1の値を調整するた
め前記第1の値に適用できる訂正ファクタを構成する。前記第1の値は第1のレ
ートでコーグからデコーダに送信され、かつ前記第2の値は第2のレートで送信
され、この場合第2のレートは第1のレートよりもより頻繁である。このように
構成することにより、より重要な情報(ロングタームのエネルギ値)がより小さ
な頻度で送信され、かつ従って送信媒体の容量に不当な影響を与えることなく比
較的高度に保護された形式で送信できる。
より重要でない情報(ショートタームのエネルギ値)はより頻繁に送信されるが
、それらは信号の再構成にとってより重要でないから、より大きな保護が必要で
なくかつ従って送信媒体の容量に対する影響も同様に最小化される。
本発明の他の実施例においては、音声コーグ/デコーダのプラットフォームが無
線機に配置される。
図面の簡単な説明
第1図は、本発明に従って構成された励起源のブロック図である。
第2図は、本発明に従って構成された無線機のブロック図である。
発明を実施するための最良の形態
1989年3月28日に、lra Gersonに発行された、「改良されたベ
クトル励起源を有するデジタル音声コーグ」と題する、米国特許第4.817.
157号は、コードブック励起コードベクトルのコードブックを含むベクトル励
起源を使用するデジタル音声コーグを非常に詳細に説明している。
この発明はモトローラのDSP56000ファミリ装置のような適切なデジタル
信号プロセッサを使用する音声コーグ(またはデコーダ)において実施すること
ができる。
そのようなりSPの実施例のコンピュータ的な機能がブロック図等価回路として
第1図に示されている。
ピッチ励起フィルタ状態(102)は中間ピッチ励起ベクトルを構成するピッチ
励起信号を提供する。乗算器(106)はこのピッチ励起ベクトルを受信しかつ
ゲイン(GAIN)1のスケールファクタを適用する。適切に構成された時、結
果として得られる尺度変更された(scaled)ピッチ励起ベクトルは元の音
声情報におけるピッチ情報のエネルギに対応するエネルギを有する。もし適性に
構成されなければ、もちろん、ピッチ情報のエネルギは元のサンプルと異なり、
かなりのエネルギの差異は結果として得られる再生された音声サンプルのかなり
のひずみにつながり得る。
第1のコードブック(103)は1組の基本ベクトルを含み、これらはリニアに
組合わされて複数の出力励起信号を形成する。コーグは一般にこれらのコードブ
ック励起源のうち元の音声情報の対応する成分を最もよく表すものはどれでも選
択する。デコーダは、もちろん、音声信号を再構成するためにコーグによって識
別されるコードブック励起源はどれでも使用する。(ピッチ励起信号およびコー
ドブック選択は、もちろん、処理されているサンプルに対する対応する成分の規
定において識別される。)ピッチ励起情報についてと同様に、乗算器(107)
はコードブック励起情報を受信しかつゲイン(GAIN)2をスケールファクタ
として適用する。ゲイン2の適用はコードブック励起信号のエネルギを適切にス
ケーリングしてこの音声情報成分と一致する元の信号における実際のエネルギと
対応させる。
もし必要であれば、この手法の特定の用途においては付加的な励起信号を含む付
加的なコードブック(104)を用いることができる。これらの付加的なコード
ブックはまた適切なスケーリングファクタ(ゲイン(GAIN)3のような)を
用いて適切な乗算器(108)によりスケーリングされ上にその概略を述べたの
と同じ目的を達成する。
一旦与えられかつ適切にスケーリングされると、ピッチ励起およびコードブック
励起情報は加算され(109)およびLPGフィルタに提供されて出力音声信号
を生成する。
コーグにおいては、この出力(resultant)信号は元の信号と比較され
、かつこの処理が他のコードブック内容とともに繰返されて、元の信号に最もよ
く対応する出力信号を提供する励起源を識別する。ピッチおよびコードブック情
報は次に符号化されかつ選択された送信媒体によってデコーダに送信される。デ
コーダにおいては、この出力信号はさらに処理されて前記デジタル情報を可聴形
式にし、それにより音声信号の再構成を完了する。
本発明のこの実施例をコーグの見地から説明する前に、デコード処理を最初に説
明することが有用であろう。
ゲイン制御(101)機能はゲイン1およびゲイン2情報(かつ、適切な用途に
おいては、同様にゲイン3情報)を提供する。このゲイン情報は復元されたピッ
チ励起およびコードブック励起信号の実際のエネルギ、コーグによって提供され
るロングタームのエネルギ値、およびロングタームのエネルギ値に対するショー
トタームの訂正値を供給するコーグによって与えられるゲインベクトルの関数と
して提供される。
ピッチ励起フィルタ状態部(102)およびコードブック(単数または複数)(
103および104)(すなわち、プリコンポーネント)から出力されるピッチ
励起およびコードブック励起信号のエネルギは容易にゲイン制御(101)によ
って決定できる。一般に、2つ(または3つ)の信号の間で分割されかつ総計で
見られる、これらの信号のエネルギは元の信号のエネルギを適切に反映しないで
あろう。このエネルギ情報は従って必要とされるエネルギ修正量を決定するため
に知ることが必要である。このエネルギ修正はゲイン1およびゲイン2(もし適
用可能であればゲイン3)を調整することにより達成される。この修正はサブフ
レームごとのベースで行われる。
デコーダにおけるピッチ励起およびコードブック励起信号のエネルギを計算する
このプロセスは重要な利点を提供する。特に、ピッチ励起信号の不適切なエネル
ギを生ずる結果となる前の送信エラーがデコーダにおけるピッチ励起のエネルギ
を排他的に計算することにより補償される。
この説明のために元の音声サンプル(または少なくとも゛ その一部)がデジタ
ル化され、かつ結果として得られるデジタル情報が必要に応じてデータのフレー
ムおよびサブフレームに分割されるものと想定し、これらはよく理解された従来
技術に従って行われる。この説明においては、各フレームは4つのサブフレーム
からなるものと仮定する。このように構成することにより、ロングタームのエネ
ルギ値は一般に単一フレームを表すエネルギ値となり、かつショートタームの修
正値は単一のサブフレームに対応する修正ファクタを構成する。特定のサブフレ
ームに関する概算の残留エネルギ(E E)は一般に次の式によって決定できる
。
EE=E (0)/ ((フィルタ電力ゲイン)(N 5UBS))
この場合、E(0)=合計フレームに対する量子化されたロングターム信号エネ
ルギ、かつ「フィルタ電力ゲイン」は、技術上よく理解されているように、フィ
ルタにより課されるエネルギの増大に対応するLPGフィルタ情報から計算でき
、そしてN 5UBSはフレームごとのサブフレームの数である。
ゲイン1はまた次のようにして計算できる。
この場合、α−第1のベクトルパラメータ、β=第2のベクトルパラメータ、そ
してE (0)=重み付けされていないピッチェネルギ情報である。
αおよびβに関する詳細はコーディング機能を説明する場合に以下に述べる。E
(0)はピッチ励起フィルタ状態(102)により出力される信号のエネルギ
を構成する。
E (0)は従って乗算器(106)を介して与えられるゲイン1の値によって
スケーリングされる前のピッチ励起ベクトルに対するエネルギである。Aの分母
におけるEx(0)は重み付けされないピッチ励起ベクトルにおけるエネルギを
単位値(unity)に正規化し、一方Aの分子は所望のエネルギをピッチ励起
ベクトルに課する。分子においては、項EE(ロングターム信号エネルギに基づ
くサブフレームの残留エネルギの評価値)はαによってスケーリングされ励起信
号におけるショートタームのエネルギと整合し、βはピッチ励起ベクトルによる
組合わされた励起信号におけるエネルギの部分(fraction)を特定する
。最後に、このような表現の平方根を取ることによりゲインを得る。
同様にして、ゲイン2は次のように計算できる。
αおよびβは上に述べたのと同じである。Ex(1)は第1のコードブック(1
11)から実際に出力されるエネルギに対応する重み付けされないコードブック
励起情報を構成する。
ゲイン1およびゲイン2が上で決定されたように計算されると、ピッチ励起およ
びコードブック励起情報が適切に、共に互いに対するそれらの値に関し、かつ加
算機能(109)の出力において与えられる複合結果として、適切にスケーリン
グされ、それにより信号の適切に復元された成分を提供する。1つまたそれ以上
の付加的な励起コードブック(104)を使用するデコーダにおいては、付加的
なスケールファクタ(たとえば、ゲイン3)は同様に決定できる。 本発明のコ
ーグの実施例を次に説明する。
前に述べたように、量子化信号エネルギ値E (0)はデジタル化された音声サ
ンプルの完全なフレームに対して計算できる。この値はコーグからデコーダに適
切に時々送信されデコーダにこの情報を提供する。この情報は、しかしながら、
各々のサブフレームの情報とともに送信する必要はない。従って、このロングタ
ームの情報はより頻繁でなくして送信することができ、この情報はエラーコーデ
ィングその他により比較的よく保護できる。これはより多くの送信容量を必要と
するが、容量に対する全体的な影響はこの情報の比較的頻繁でない送信のために
比較的良性のものである。
前にも述べたように、1つのフレームに関するロングタームのエネルギ情報はそ
のサブフレームにおけるエネルギをよりよく表すために各々の特定のサブフレー
ムに対し修正されなければならない。この修正(mod i f i ca t
ton)は、部分的には、ショートターム修正パラメータ、αの関数として行わ
れる。
コーグはこれらのパラメータαおよびβを、次に、コーグにおいて出力されるピ
ッチ励起およびコードブック励起情報信号のエネルギ内容の関数として出力する
。特に、αはそれによってロングター、ムのエネルギ情報がスケーリングされて
特定のサブフレームにおけるピッチ励起情報エネルギ、コードブック1励起、お
よびコードブック2励起の和を生成するスケールファクタを構成する。しかしな
がら、βは比率を構成し、この実施例では、βは問題のサブフレームに対するピ
ッチ励起情報エネルギのピッチ励起情報、コードブック1、およびコードブック
2励起に帰することができるエネルギの和に対する比率を構成する。同様にして
、かつ第2のコードブックの存在を再び仮定すると、第3のパラメータπは第1
のフードブックエネルギのエネルギのピッチ励起情報、コードブック1、および
コードブック2励起に帰することができるエネルギの和に対する比率を表すこと
ができる。
このように処理することにより、第1のパラメータαは信号サンプルに対する全
体のエネルギ値に関係し、かつ第2の(かつもし用いられておれば第3の)パラ
メータβは、少なくとも部分的に、全体のエネルギ値に対する励起信号の1つの
相対的な寄与に関係する。従って、ある程度まで、パラメータα、βおよびπは
互いに相関している。この相関関係はこのコーディングおよびデコーディング方
法の性能およびエンコーディングの効率の改善に貢献する。
この実施例においては、コーグは実際には3つのパラメータα、βおよびπをデ
コーダに送信しない。その代り、これらのパラメータはベクトル量子化され、か
つその結果を識別する代表的なコードがデコーダに送信される。コーグは元のベ
クトルを正確にエミュレートするベクトルを表すコードを送信できないであろう
から、幾っがのエラーがこの点における表現に導入される。そのようなエラーの
影響を最小にするために、コーグはそれにとって入手可能な各々のかつすべての
ベクトルコードに対するエラー(ERROR)値を計算し、かつ最小のエラーを
生ずるベクトルコードを選択する。(ここで例示のために単一のコードブックの
フープを想定して、αおよびβに対する関係値を生成する)各々のベクトルコー
ドに対し、このエラー値は次のように計算できる。
+ψα(β(1−β))1/2+にαβ+λα(1−β)
この場合、
に=EE−E (0,0)/(E (0))CCz
λ=EE−E (1,1)/ (E (1))CCg
上の各式において、E は理想的な信号におけるサブフ■
レームのエネルギを表す。従って、選択された代表的なパラメータが元のパラメ
ータに近ければ近いほど、エラーは小さくなる。E (0)は理想的な信号と重
み付けられ c
たピッチ情報励起との間の訂正分を表す。E (1)はc
理想的な信号と重み付けられたコードブック励起との間の修正分を表す。E (
0,1)は重み付けられたピッチc
情報励起と重み付けられたコードブック励起との間の修正分を表す。そして最後
に、E (0,0)は、重み付け C
られたピッチ励起におけるエネルギを表し、かっE。。
(1,1)は重み付けられたコードブック励起におけるエネルギを表す。(重み
付けられた励起は技術上知られているように知覚的重み付はフィルタによる処理
の後の励起信号である。)
最も小さなエラー値を生ずるベクトルコードが識別された時、そのベクトルコー
ドは次にデコーダに送信される。
受信された時、デコーダは該ベクトルコードを用いてベクトルコードのデータベ
ースにアクセスしかつそれによりα。
βおよびπ(もしあれば)のパラメータに対する値を復元し、これらのパラメー
タは次に上に述べたようにゲイン1、ゲイン2およびゲイン3(もし用いられて
おれば)を計算するために使用される。
この方法を用いることにより、数多くの重要な利点が得られる。たとえば、送信
の間に比較的強く保護できる、ロングタームのエネルギ値は、ショートタームの
修正ファクタ情報が失われあるいは汚染されていても、復元された音声情報がエ
ネルギ情報の観点からほぼ適切に再構成または再現されることを保証する。デー
コダにおけるピッチエネルギの計算、および補償はピッチ励起のエラーの伝搬を
大幅に低減する。
さらに、α、β、およびπのパラメータによって表される元のゲイン情報の相互
関係は情報のより大きな濃縮を可能にし、かつ同時にさらにこの情報の送信をサ
ポートするための送信容量の要求を最小にする。その結果、この方法は送信容量
の要求を同時に低減するとともに、改善された再構成音声結果を生み出す。
第2図においては、本発明を実施する無線機は音声符号化信号(201)を受信
するためのアンテナ(202)を含む。RFユニット(203)は受信信号を処
理して音声符号化情報を復元する。この情報はパラメータデコーダ(204)に
提供され該パラメータデコーダ(204)は種々の後続の処理のための制御パラ
メータを出力する。上に述べたような励起源(100)がそれに与えられたパラ
メータを用いて励起信号を生成する。該励起源(100)からのこの結果的に得
られた励起信号はLPGフィルタ(206)に提供され、該LPGフィルタ(2
06)は符号化情報に従って合成された音声信号を生成する。合成された音声信
号は次にピッチポストフィルタ(207)でろ波され、かつスペクトル的ポスト
フィルタ(208)によりろ波されて再構成された音声の品質を向上させる。も
し必要であれば、ポストエンファシスフィルタ(209)もまた含むことができ
結果として得られる音声信号をさらに改善する。該音声信号は次にオーディオ処
理ユニット(211)において処理されかつオーディオ変換器(212)により
可聴的にされる。
国際調査報告
−v−)1m−^”−k pfi IT m IT / I’A <’t
Claims (8)
- 1.ある信号サンプルに対するゲイン情報に関係する情報を送信する方法であっ て、該ゲイン情報は、第1の成分に対するゲインに関係する第1のゲイン値、第 2の成分に対するゲインに関係する少なくとも第2のゲイン値、 を含み、前記方法は、 A)少なくとも前記信号サンプルを処理して、前記信号サンプルに対する全体的 なエネルギ値に関係する第1のパラメータ、 前記全体的なエネルギ値に対する前記第1および第2のゲイン値の内の少なくと も1つの相対的な寄与に、少なくとも部分的に、基づく第2のパラメータ、を提 供する段階、 B)前記第1および第2のパラメータに関係する情報を送信する段階、 を具備することを特徴とするある信号サンプルに対するゲイン情報に関係する情 報を送信する方法。
- 2.前記ゲイン情報は少なくとも第3の成分に対するゲインに関係する第3のゲ イン値を含み、前記処理段階は前記全体的なエネルギ値に対する前記第1、第2 および第3のゲイン値の内の異なる1つの相対的な寄与に、少なくとも部分的に 、基づく第3のパラメータをさらに提供する段階を含み、 前記情報を送信する段階は前記第3の成分に関係する情報の送信を含む、 請求の範囲第1項に記載の方法。
- 3.前記処理段階は少なくとも前記第1のパラメータおよび第2のパラメータ情 報をベクトル量子化しコードを発生する段階を含む請求の範囲第1項に記載の方 法。
- 4.前記送信段階は前記コードを送信する段階を含む請求の範囲第3項に記載の 方法。
- 5.さらに、時々、複数の信号サンプルに関係するロングタームのエネルギ値情 報を送信する段階を含む請求の範囲第1項に記載の方法。
- 6.前記第1のパラメータはロングタームのエネルギ値情報に関係する修正ファ クタを具備する請求の範囲第5項に記載の方法。
- 7.前記送信段階はさらに、 B1)時々、前記第1の値に関係する情報を送信する段階、 B2)前記時々よりはさらに頻繁に、前記第2の値に関係する情報を送信する段 階、 を具備する請求の範囲第1項に記載の方法。
- 8.ある信号の成分に対するゲイン情報に関係する情報を復元する方法であって 、 A)前記信号の少なくとも1つの成分に対するエネルギに関係する少なくとも第 1のパラメータを受信する段階、B)前記少なくとも1つの成分に対する成分規 定情報を受信する段階、 C)前記成分規定情報を処理して、エネルギ値を有する、プリコンポーネントを 提供する段階、 D)少なくとも前記第1のパラメータを使用しかつ、必要に応じて、前記プリコ ンポーネントのエネルギ値を修正し、前記信号の復元された成分を提供する段階 、を具備することを特徴とするある信号の成分に対するゲイン情報に関係する情 報を復元する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US42292789A | 1989-10-17 | 1989-10-17 | |
US422,927 | 1989-10-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05502517A true JPH05502517A (ja) | 1993-04-28 |
Family
ID=23676984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2514552A Pending JPH05502517A (ja) | 1989-10-17 | 1990-10-09 | 最適化された信号エネルギパラメータを有するデジタル音声コーダ |
Country Status (11)
Country | Link |
---|---|
US (1) | US5490230A (ja) |
EP (1) | EP0570365A1 (ja) |
JP (1) | JPH05502517A (ja) |
KR (1) | KR950013371B1 (ja) |
CN (1) | CN1097816C (ja) |
AU (1) | AU652348B2 (ja) |
BR (1) | BR9007751A (ja) |
CA (1) | CA2065731C (ja) |
IL (1) | IL95753A (ja) |
NZ (1) | NZ235702A (ja) |
WO (1) | WO1991006943A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010541018A (ja) * | 2007-10-03 | 2010-12-24 | アルカテル−ルーセント ユーエスエー インコーポレーテッド | 符号化されたパラメータからの音声エネルギ推定 |
JP2013537325A (ja) * | 2010-09-17 | 2013-09-30 | クゥアルコム・インコーポレイテッド | ピッチサイクルエネルギーを判断し、励起信号をスケーリングすること |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5692101A (en) * | 1995-11-20 | 1997-11-25 | Motorola, Inc. | Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques |
FI113571B (fi) * | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
GB0005515D0 (en) * | 2000-03-08 | 2000-04-26 | Univ Glasgow | Improved vector quantization of images |
US6754624B2 (en) * | 2001-02-13 | 2004-06-22 | Qualcomm, Inc. | Codebook re-ordering to reduce undesired packet generation |
US7162415B2 (en) * | 2001-11-06 | 2007-01-09 | The Regents Of The University Of California | Ultra-narrow bandwidth voice coding |
US7337110B2 (en) * | 2002-08-26 | 2008-02-26 | Motorola, Inc. | Structured VSELP codebook for low complexity search |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101286320B (zh) * | 2006-12-26 | 2013-04-17 | 华为技术有限公司 | 增益量化系统用于改进语音丢包修补质量的方法 |
BR112012009490B1 (pt) * | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
US20150173473A1 (en) * | 2013-12-24 | 2015-06-25 | Katherine Messervy Jenkins | Convertible Activity Mat |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
DE3871369D1 (de) * | 1988-03-08 | 1992-06-25 | Ibm | Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate. |
-
1990
- 1990-09-24 IL IL9575390A patent/IL95753A/en not_active IP Right Cessation
- 1990-10-09 BR BR909007751A patent/BR9007751A/pt not_active IP Right Cessation
- 1990-10-09 AU AU66031/90A patent/AU652348B2/en not_active Expired
- 1990-10-09 CA CA002065731A patent/CA2065731C/en not_active Expired - Lifetime
- 1990-10-09 EP EP90915602A patent/EP0570365A1/en not_active Withdrawn
- 1990-10-09 JP JP2514552A patent/JPH05502517A/ja active Pending
- 1990-10-09 WO PCT/US1990/005693 patent/WO1991006943A2/en not_active Application Discontinuation
- 1990-10-09 KR KR1019920700861A patent/KR950013371B1/ko not_active IP Right Cessation
- 1990-10-16 NZ NZ235702A patent/NZ235702A/xx unknown
- 1990-10-16 CN CN90108421A patent/CN1097816C/zh not_active Expired - Lifetime
-
1994
- 1994-12-22 US US08/361,474 patent/US5490230A/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010541018A (ja) * | 2007-10-03 | 2010-12-24 | アルカテル−ルーセント ユーエスエー インコーポレーテッド | 符号化されたパラメータからの音声エネルギ推定 |
JP2013537325A (ja) * | 2010-09-17 | 2013-09-30 | クゥアルコム・インコーポレイテッド | ピッチサイクルエネルギーを判断し、励起信号をスケーリングすること |
US8862465B2 (en) | 2010-09-17 | 2014-10-14 | Qualcomm Incorporated | Determining pitch cycle energy and scaling an excitation signal |
Also Published As
Publication number | Publication date |
---|---|
EP0570365A1 (en) | 1993-11-24 |
US5490230A (en) | 1996-02-06 |
EP0570365A4 (en) | 1993-04-02 |
AU652348B2 (en) | 1994-08-25 |
KR920704266A (ko) | 1992-12-19 |
WO1991006943A3 (en) | 1992-08-20 |
IL95753A (en) | 1994-11-11 |
KR950013371B1 (ko) | 1995-11-02 |
BR9007751A (pt) | 1992-07-21 |
CA2065731A1 (en) | 1991-04-18 |
NZ235702A (en) | 1992-12-23 |
CN1051099A (zh) | 1991-05-01 |
CN1097816C (zh) | 2003-01-01 |
CA2065731C (en) | 1995-06-20 |
AU6603190A (en) | 1991-05-31 |
IL95753A0 (en) | 1991-06-30 |
WO1991006943A2 (en) | 1991-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05502517A (ja) | 最適化された信号エネルギパラメータを有するデジタル音声コーダ | |
EP0405584B1 (en) | Gain-shape vector quantization apparatus | |
CN100578621C (zh) | 信号处理设备和方法 | |
JP4101957B2 (ja) | 音声パラメータの合同量子化 | |
CA2430111C (en) | Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs | |
JPH06506070A (ja) | スペクトル補間および高速コードブックサーチを有する音声コーダおよび方法 | |
JPH02501166A (ja) | スピーチコーディング | |
JP3064947B2 (ja) | 音声・楽音符号化及び復号化装置 | |
EP0578436A1 (en) | Selective application of speech coding techniques | |
KR950003557B1 (ko) | 음성 샘플 및 신호 샘플 엔코딩 방법 | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP2000509847A (ja) | 音声信号を伝送する伝送システム | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3102017B2 (ja) | 音声符号化方法 | |
JP3296411B2 (ja) | 音声符号化方法および復号化方法 | |
JP3489748B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3290444B2 (ja) | バックワード型コード励振線形予測復号化器 | |
JPH02282800A (ja) | 音声符号化方式 | |
JP3229784B2 (ja) | 音声符号化復号化装置及び音声復号化装置 | |
JP3071800B2 (ja) | 適応ポストフィルタ | |
JP3274451B2 (ja) | 適応ポストフィルタ及び適応ポストフィルタリング方法 | |
JP2817196B2 (ja) | 音声符号化方式 | |
JPH1078799A (ja) | コードブック | |
JPH03243999A (ja) | 音声符号化装置 | |
JPH0455899A (ja) | 音声信号符号化方式 |