JPH01296300A - 音声信号符号化方法 - Google Patents
音声信号符号化方法Info
- Publication number
- JPH01296300A JPH01296300A JP63316618A JP31661888A JPH01296300A JP H01296300 A JPH01296300 A JP H01296300A JP 63316618 A JP63316618 A JP 63316618A JP 31661888 A JP31661888 A JP 31661888A JP H01296300 A JPH01296300 A JP H01296300A
- Authority
- JP
- Japan
- Prior art keywords
- term
- short
- signal
- residual signal
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007774 longterm Effects 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 24
- 230000005236 sound signal Effects 0.000 claims description 10
- 239000002131 composite material Substances 0.000 claims description 6
- 230000003111 delayed effect Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 claims description 3
- IORPOFJLSIHJOG-UHFFFAOYSA-N 3,7-dimethyl-1-prop-2-ynylpurine-2,6-dione Chemical compound CN1C(=O)N(CC#C)C(=O)C2=C1N=CN2C IORPOFJLSIHJOG-UHFFFAOYSA-N 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000687448 Homo sapiens REST corepressor 1 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 102100024864 REST corepressor 1 Human genes 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0003—Backward prediction of gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A、産業上の利用分野
本発明は音声信号の符号化、特に低いビット速度の符号
化に関する。
化に関する。
B、従来技術
音声信号をディジタル符号化する。即ち音声信号をサン
プリングし、サンプルの流れを、該サンプルの2進符号
を表わすビットの流れに変換する多数の方法が知られて
いる。これは符号化された信号をその最終目的に提供す
る前に最初のアナログ形式に再変換する手段が利用可能
であるものと仮定する。符号化動作及び復号動作はどち
らも歪み又は雑音を発生するので、それらを最小にして
符号化プロセスを最適化する。
プリングし、サンプルの流れを、該サンプルの2進符号
を表わすビットの流れに変換する多数の方法が知られて
いる。これは符号化された信号をその最終目的に提供す
る前に最初のアナログ形式に再変換する手段が利用可能
であるものと仮定する。符号化動作及び復号動作はどち
らも歪み又は雑音を発生するので、それらを最小にして
符号化プロセスを最適化する。
明らかに、音声信号の符号化に割当てられるビット数、
即ちピッ1−速度が大きければ大きいほど、符号化は良
好となる。あいにく、例えば送信チャンネルの費用のよ
うな費用効率の要求により、別々のユーザーの原始音声
信号を多重化動作によって同じ送信チャンネルに集中す
ることが必要となる。その結果、各音声符号化に割当て
られるビット速度が低ければ低いほど、すぐれたシステ
ムとなる。よって、所望のビット速度で符号化の品質及
び効率を最適化することが必要となる。符号化/復号品
質の最適化を可能にする。換言すれば、所与の速度で符
号化雑音の最小化を可能にする符号化方法の開発に多大
の努力が払われている。
即ちピッ1−速度が大きければ大きいほど、符号化は良
好となる。あいにく、例えば送信チャンネルの費用のよ
うな費用効率の要求により、別々のユーザーの原始音声
信号を多重化動作によって同じ送信チャンネルに集中す
ることが必要となる。その結果、各音声符号化に割当て
られるビット速度が低ければ低いほど、すぐれたシステ
ムとなる。よって、所望のビット速度で符号化の品質及
び効率を最適化することが必要となる。符号化/復号品
質の最適化を可能にする。換言すれば、所与の速度で符
号化雑音の最小化を可能にする符号化方法の開発に多大
の努力が払われている。
1つの方法が、M、5chroeder & B、At
al、 ”Code−Excited Linea
r Prediction (CELP)
; lligh−quality 5peech
at very low bit rat
es”。
al、 ”Code−Excited Linea
r Prediction (CELP)
; lligh−quality 5peech
at very low bit rat
es”。
at ICASSP 1985によって発表された。基
本的には。
本的には。
前記方法は符号化されたデータ(コードワード)の多く
のセットをコードブック内の既知の参照位置に事前に記
憶することを含む、符号化すべき音声信号のサンプルの
流れは連続するサンプルのブロックに分割され、各ブロ
ックはそれに最もよく一致するコードワードの参照符に
より表わされる。
のセットをコードブック内の既知の参照位置に事前に記
憶することを含む、符号化すべき音声信号のサンプルの
流れは連続するサンプルのブロックに分割され、各ブロ
ックはそれに最もよく一致するコードワードの参照符に
より表わされる。
この方法の主な欠点は計算に高度の複雑さを含むことで
ある。
ある。
該方法は、J、l’、Adoul et al、”Fa
st CELP codingbased on al
gebraic codes″、 ICASSI) 1
987で更に改善され、″関連する莫大な計算量”の削
減を可能にした。しかしながら、それでもなお前記計算
には逆フィルタリング、即ち符号化すべき信号サンプル
のブロック毎に検査されるコードブック・コードワード
毎にかなり大きい計算力を消費する動作が含まれる。
st CELP codingbased on al
gebraic codes″、 ICASSI) 1
987で更に改善され、″関連する莫大な計算量”の削
減を可能にした。しかしながら、それでもなお前記計算
には逆フィルタリング、即ち符号化すべき信号サンプル
のブロック毎に検査されるコードブック・コードワード
毎にかなり大きい計算力を消費する動作が含まれる。
C0発明が解決しようとする問題点
本発明の1つの目的は、最小のフィルタ動作が。
コードワードで行われるコード励起による予測(コード
に基づいてコードを予測する)の研究に基づいた音声符
号化システムを提供することである。
に基づいてコードを予測する)の研究に基づいた音声符
号化システムを提供することである。
本発明のもう1つの目的は、コード励起された符号化動
作が、音声信号の限定されたぜIF域部分で行われる音
声符号化システムを提供することである。
作が、音声信号の限定されたぜIF域部分で行われる音
声符号化システムを提供することである。
本発明の更にもう1つの目的は、コードブックの大きさ
を最小にするコードブック概念を提供することである。
を最小にするコードブック概念を提供することである。
D0問題点を解決するための手段
最初の音声信号又は少なくともその限定された帯域部分
が、そこから(デエンファシスされた)短期残差信号を
取出すように処理される。取出された信号は、長期残差
信号のCELr’符号化により実行される合成動作によ
る解析及び長期選択コードワードの合成によって長期残
差信号を取出すように処理される。
が、そこから(デエンファシスされた)短期残差信号を
取出すように処理される。取出された信号は、長期残差
信号のCELr’符号化により実行される合成動作によ
る解析及び長期選択コードワードの合成によって長期残
差信号を取出すように処理される。
E、実施例
第1図は本発明を実現するトランシーバ(符号器/復号
器を含む送/受信装置)で用いられる基本素子のブロッ
ク図である。
器を含む送/受信装置)で用いられる基本素子のブロッ
ク図である。
送信すべき音声信号は、8にhzでサンプリングされ、
在来のアナログ/ディジタル変換器(図示せず)でサン
プル当り12ビットでディジタルPCM符号化され、サ
ンプル5(n)を供給する。これらのサンプルは先ずP
RE−EMP装置(10)でプレエンファシスされ1次
に相関装置(12)で処理され、短期予測 (STI’
)フィルタ(13)を調整するのに用いられる部分的な
自己相関派生係数(1’ARcOR派生)a、のセット
が取出される。STPフィルタ(13)は5(n)をフ
ィルタし第1の残差信号r(、)、即ち短期残差信号を
供給する1次に前記短・期成差信号が処理され、所定の
長期遅延Hだけ遅延され利得係数すを乗じた合成信号r
’ (n)をr(n)から引き去ることにより第2の、
即ち長期残差信号e(n)が取出される。
在来のアナログ/ディジタル変換器(図示せず)でサン
プル当り12ビットでディジタルPCM符号化され、サ
ンプル5(n)を供給する。これらのサンプルは先ずP
RE−EMP装置(10)でプレエンファシスされ1次
に相関装置(12)で処理され、短期予測 (STI’
)フィルタ(13)を調整するのに用いられる部分的な
自己相関派生係数(1’ARcOR派生)a、のセット
が取出される。STPフィルタ(13)は5(n)をフ
ィルタし第1の残差信号r(、)、即ち短期残差信号を
供給する1次に前記短・期成差信号が処理され、所定の
長期遅延Hだけ遅延され利得係数すを乗じた合成信号r
’ (n)をr(n)から引き去ることにより第2の、
即ち長期残差信号e(n)が取出される。
前記す及び阿の値は計算装置(9)で計算される。
本発明の目的のためブロック符号化手法が160サンプ
ル長のサンプル・ブロックr(n)で用いられる。パラ
メータb及びには8oサンプル毎に評価される。残差信
号サンプルe(n)の流れはこのように所定の長さ1.
の連続サンプルのブロックに分割され、次いで前記ブロ
ックの各々は、Lサンプルのにシーケンスが正規化され
たコードワードとして使用可能になるコード励起線形予
測(CELP)符号器(14)で処理される。そして、
低速度でe(n>を記録することは、該考慮されたe(
n)シーケンスに最もよく一致するコードワードを選択
し前記e(n)シーケンスをコードワード参照番号kに
より置換えることを必要とする。事前記憶されたコード
ワードは正規化されているものとすると、利得係数Gも
決定され検査されなければならない、160サンプルの
各シーケンスについて、N = 160/L対(k、G
)及び2つの対(b、M)が得られる。
ル長のサンプル・ブロックr(n)で用いられる。パラ
メータb及びには8oサンプル毎に評価される。残差信
号サンプルe(n)の流れはこのように所定の長さ1.
の連続サンプルのブロックに分割され、次いで前記ブロ
ックの各々は、Lサンプルのにシーケンスが正規化され
たコードワードとして使用可能になるコード励起線形予
測(CELP)符号器(14)で処理される。そして、
低速度でe(n>を記録することは、該考慮されたe(
n)シーケンスに最もよく一致するコードワードを選択
し前記e(n)シーケンスをコードワード参照番号kに
より置換えることを必要とする。事前記憶されたコード
ワードは正規化されているものとすると、利得係数Gも
決定され検査されなければならない、160サンプルの
各シーケンスについて、N = 160/L対(k、G
)及び2つの対(b、M)が得られる。
kが決定されると、後に利得係数Gを乗する該選択され
たに番目のコードワードCBk−合成長期残差信号e’
(n)を表わす−は加算機48(1B)を介して長期
予測ループ(15)に供給される。そのもう1つの入力
は装置(15)の出力5換言すれば、該遅延され加重合
成された短期残差信号により供給される。その結果、加
算機構(16)は合成短期残差信号r’ (n)を供給
する。
たに番目のコードワードCBk−合成長期残差信号e’
(n)を表わす−は加算機48(1B)を介して長期
予測ループ(15)に供給される。そのもう1つの入力
は装置(15)の出力5換言すれば、該遅延され加重合
成された短期残差信号により供給される。その結果、加
算機構(16)は合成短期残差信号r’ (n)を供給
する。
最後に、最初の信号は、G、 k、 b、 Mデータ、
例えば160 s(ロ)サンプルのブロック当たりN対
の(G。
例えば160 s(ロ)サンプルのブロック当たりN対
の(G。
k)及び2対の(b、M)、並びにPARCOR係数に
、の、またはPARCOR関連係数a、のセットを含む
低いビット速度のデータの流れに変換され、全てマルチ
プレクサ旧)X(17)により多重化され、受信装置/
復号器に送信される。
、の、またはPARCOR関連係数a、のセットを含む
低いビット速度のデータの流れに変換され、全てマルチ
プレクサ旧)X(17)により多重化され、受信装置/
復号器に送信される。
復号は先ずDMPXで受取ったデータ・フレームをデマ
ルチプレクシングし、G、 k、 b、 M及びa、を
互いに分離することを必要とする。ブロック毎に。
ルチプレクシングし、G、 k、 b、 M及びa、を
互いに分離することを必要とする。ブロック毎に。
kの値を用いて事前記録されたテーブル(19)からコ
ードワードCBkを選択し、続いて対応する利得係数G
t&CBkに乗じて、しサンプル・ブロックの合成され
たe’ (n)を回復する0次いで、各e′(n)で逆
長期予測が実行され、遅延におよび利得すに調整された
遅延素子、並びに加算機構を含む装置(20)を用いて
合成された短期残差r’ (n)を回復する。最後に、
r’(n)は係数a、により調整された逆短期ディジ
タル・フィルタ(21)に供給され1合成された音声信
号s’ (n)を供給する。
ードワードCBkを選択し、続いて対応する利得係数G
t&CBkに乗じて、しサンプル・ブロックの合成され
たe’ (n)を回復する0次いで、各e′(n)で逆
長期予測が実行され、遅延におよび利得すに調整された
遅延素子、並びに加算機構を含む装置(20)を用いて
合成された短期残差r’ (n)を回復する。最後に、
r’(n)は係数a、により調整された逆短期ディジ
タル・フィルタ(21)に供給され1合成された音声信
号s’ (n)を供給する。
第2図の流れ図は第1図の装置の動作のシーケンスの概
略である。 A(z)により表示された2定義域で転送
機能を有するディジタル・フィルタ(13)により5(
n)で実行される、プレエンファシスされた短期解析は
r(n)を供給する0次に、長期解析がr(n)、残留
信号e(n)及びその合成表示に対して実行され、下式
が計算され供給される: e(n) =r(n) −b−r’(n−M)r’
(n) :e’(n)÷b−r’(n−M)e(n)は
コードワード参照番号k及び利得係数Gで符号化された
CELPである。
略である。 A(z)により表示された2定義域で転送
機能を有するディジタル・フィルタ(13)により5(
n)で実行される、プレエンファシスされた短期解析は
r(n)を供給する0次に、長期解析がr(n)、残留
信号e(n)及びその合成表示に対して実行され、下式
が計算され供給される: e(n) =r(n) −b−r’(n−M)r’
(n) :e’(n)÷b−r’(n−M)e(n)は
コードワード参照番号k及び利得係数Gで符号化された
CELPである。
受信装置側では、信号合成はコードワードの選択及びそ
の増幅を含み、下式により合成される:、e’(n)
= G−Cal (k、n)次いで、2つの逆フイルタ
リング動作−1つは長期合成(LTP)動作のため1/
B(z)により、他の1つは短期動作のため11^(Z
)により指定される−によってs’ (n)が合成され
る。
の増幅を含み、下式により合成される:、e’(n)
= G−Cal (k、n)次いで、2つの逆フイルタ
リング動作−1つは長期合成(LTP)動作のため1/
B(z)により、他の1つは短期動作のため11^(Z
)により指定される−によってs’ (n)が合成され
る。
第2図の上部の2つのブロックに関連する動作の詳細を
第3図に示す。
第3図に示す。
先ず、プレエンファシスはプレエンファシスされたPA
RCOR派生の係数a、の取得を可能にする0次に、前
期プレエンファシスされたa、は短期ディジタル・フィ
ルタをセット(調整)するのに用いられ、下式が引出さ
れる: 記号Σは合計動作を示し、 r’ARcORのセットの
合計は8つの係数を含めて行なわれ、該フィルタは・8
つの反復タップを有するディジタル・フィルタである。
RCOR派生の係数a、の取得を可能にする0次に、前
期プレエンファシスされたa、は短期ディジタル・フィ
ルタをセット(調整)するのに用いられ、下式が引出さ
れる: 記号Σは合計動作を示し、 r’ARcORのセットの
合計は8つの係数を含めて行なわれ、該フィルタは・8
つの反復タップを有するディジタル・フィルタである。
前期フィルタリング手法はディジタル信号処理分野の当
業者にはよく知られている。それは多重入力加算機構、
8タツプのシフト・レジスタ及びタップ・インバータを
用いるハードウェアで実現し、又はマイクロプログラム
で作動されるプロセッサを用いて実現することができる
。
業者にはよく知られている。それは多重入力加算機構、
8タツプのシフト・レジスタ及びタップ・インバータを
用いるハードウェアで実現し、又はマイクロプログラム
で作動されるプロセッサを用いて実現することができる
。
残差信号r(n)は80サンプル毎に評価される長期パ
ラメータb及びにを決定するのに用いられる。
ラメータb及びにを決定するのに用いられる。
次に、これらのパラメータは長期フィルタ装置(15)
−第1図参照−をセットするのに使用され、下式を計算
する: c(n) =r(n) −b ・r’(n−M)r
’(n) = e’(n) + b −
r’(n−M)b及びNの値を計算するための多くの方
法が利用可能である0例えば、1つの方法はB、S、
Atal。
−第1図参照−をセットするのに使用され、下式を計算
する: c(n) =r(n) −b ・r’(n−M)r
’(n) = e’(n) + b −
r’(n−M)b及びNの値を計算するための多くの方
法が利用可能である0例えば、1つの方法はB、S、
Atal。
”Predicting Coding of
5peech at low BitRate”
、IEEE Transactions on
Communication。
5peech at low BitRate”
、IEEE Transactions on
Communication。
Vol、 C0M−30,April 1982 ;ま
たは[1,5,Atal &M、R,5chroede
r、”Adaptive predictive
codingof 5peech signals
”、Be1l 5yste+s Technica
lJournal、 Vol、49.1970による。
たは[1,5,Atal &M、R,5chroede
r、”Adaptive predictive
codingof 5peech signals
”、Be1l 5yste+s Technica
lJournal、 Vol、49.1970による。
−殻内に、阿はピッチの値又はその倍音であり。
その計算方法は当業者にはよく知られている。
非常に有効な方法が欧州特許出願第87430006.
4号にも記載されている。
4号にも記載されている。
前期出願により:
O
b及び阿は80のサンプル及びそれらの80の先行サン
プルを用いる160サンプルの各ブロックで2度決定さ
れる。
プルを用いる160サンプルの各ブロックで2度決定さ
れる。
そこで、阿の値、即ちピッチに関連した値が2ステツプ
のプロセスに基づいて計算される。第1のステップでは
粗ピツチに関連したHの値の概略決定をuJ能にし、続
いて第2のステップで限定数の値に自己相関法を用いて
(精密な)Mの値が調整される。
のプロセスに基づいて計算される。第1のステップでは
粗ピツチに関連したHの値の概略決定をuJ能にし、続
いて第2のステップで限定数の値に自己相関法を用いて
(精密な)Mの値が調整される。
(1)第1ステップ:
概略決定は可変しきい値及びO交差検出を含む非線形手
法の使用に基づく、更に詳細に説明すれば、この第1ス
テツプは下記を含む: ・変数Hを0ないしは所定の値し、又は前の精密なHに
初期設定する; ・現在のサブ・ブロックの80サンプル、及び前の80
サンプルを含む160サンプルのブロック・ベクトルを
ロードする; ・前期160サンプルの正(Vmax)及び負(Vmi
n)のピークを検出する; ・下記しきい値を計算する: 正のしきい値Th” =α・Vmax 負のしきい値Th−=α・Vmin αは経験的に選択された値(例えば、α= o、5)で
ある。
法の使用に基づく、更に詳細に説明すれば、この第1ス
テツプは下記を含む: ・変数Hを0ないしは所定の値し、又は前の精密なHに
初期設定する; ・現在のサブ・ブロックの80サンプル、及び前の80
サンプルを含む160サンプルのブロック・ベクトルを
ロードする; ・前期160サンプルの正(Vmax)及び負(Vmi
n)のピークを検出する; ・下記しきい値を計算する: 正のしきい値Th” =α・Vmax 負のしきい値Th−=α・Vmin αは経験的に選択された値(例えば、α= o、5)で
ある。
・下式により現在のサブ・ブロックを表わす新しいベク
トルX(n)をセットする; もしr(n) −Thなら、X(n)=1もしr (n
) = Th−なら、X(n)=−1さもなければ、
X(n)=0−1.0又は1の値だけを含むこ
の新しいベクトルは”クリーン・ベクトル”と呼ばれる
;・2つのクリーン・ベクトル値間の重要な0交差(即
ち、符号遷移)、即ち互いに接近しているO交差を検出
する: ・連続的に検出されたO交差の間のr(n)サンプル間
隔の数を表わすH′の値を計算する;・ΔM=1M’−
Mlを計算してM′とその前の粗いHとを比較し、ΔH
が所定の値D(例えば、D=5)よりも大きい場合にそ
のに′を落す;(2)第2ステップ: 精密なNの決定は該ピッチのパルスの近くに位置するサ
ンプルのまわりで取得されたサンプルにだけ行なわれる
自己相関法の使用に基づく。
トルX(n)をセットする; もしr(n) −Thなら、X(n)=1もしr (n
) = Th−なら、X(n)=−1さもなければ、
X(n)=0−1.0又は1の値だけを含むこ
の新しいベクトルは”クリーン・ベクトル”と呼ばれる
;・2つのクリーン・ベクトル値間の重要な0交差(即
ち、符号遷移)、即ち互いに接近しているO交差を検出
する: ・連続的に検出されたO交差の間のr(n)サンプル間
隔の数を表わすH′の値を計算する;・ΔM=1M’−
Mlを計算してM′とその前の粗いHとを比較し、ΔH
が所定の値D(例えば、D=5)よりも大きい場合にそ
のに′を落す;(2)第2ステップ: 精密なNの決定は該ピッチのパルスの近くに位置するサ
ンプルのまわりで取得されたサンプルにだけ行なわれる
自己相関法の使用に基づく。
第2ステツプは下記を含む:
・計算されたばかりの粗いHの値−〇ではないものと仮
定するーに等しくなるようにHの値を初期設定するか、
さもなければHの値をその前に測定した精密なHに等し
くする: ・粗いピッチの周りのクリーン・バク1−ル、即ち所定
サンプル数の自己相関領域を見つける。
定するーに等しくなるようにHの値を初期設定するか、
さもなければHの値をその前に測定した精密なHに等し
くする: ・粗いピッチの周りのクリーン・バク1−ル、即ち所定
サンプル数の自己相関領域を見つける。
・下式により一組のIt(に′)値を計算する:R(k
’) =Σ r(n) ・r’ (n−に’)n=1 に′はクリーン・ベクトル・サンプルの指標であり1選
択された自己相関領域の下限Mn+inから上限MIl
axまで変化する。自己相関領域は1例えば。
’) =Σ r(n) ・r’ (n−に’)n=1 に′はクリーン・ベクトル・サンプルの指標であり1選
択された自己相関領域の下限Mn+inから上限MIl
axまで変化する。自己相関領域は1例えば。
Mmin = L、 Mmax = 120の限界を有
する。
する。
・探している精密なM値を限定するとき、最大のR(k
’)、即ち自己相関ピークを見つける。
’)、即ち自己相関ピークを見つける。
前記アルゴリズムの実行により、いったん装置(9)で
b及び阿が計算されると1Mは遅延線(15)の長さを
それに応じて調整するのに用いられ、その結果、加算機
構(16)のr’ (n)出方を遅延させてr’ (n
−M)を供給する0次に、bはr’(n−M) ニ乗じ
て装置(15)の出力でb−r’(n−M)を取得する
のに使われる。
b及び阿が計算されると1Mは遅延線(15)の長さを
それに応じて調整するのに用いられ、その結果、加算機
構(16)のr’ (n)出方を遅延させてr’ (n
−M)を供給する0次に、bはr’(n−M) ニ乗じ
て装置(15)の出力でb−r’(n−M)を取得する
のに使われる。
第4図の流れ図はプレエンファシス及びPARCOR関
連の計算に含まれた詳細な動作を示す、160信号サン
プル5(n)の各ブロックが先ず処理され、信号自己相
関関数の2つの最初の値を下式から引出す: 次に、プレエンファシス係数Iが下式により計算され: R= R2/R1 160サンプル5(n)の最初のセットが下式によりプ
レエンファシスされたセラl” sρ(n)に変換され
る: 5p(n)== 5(n)−R05(n−1)プレエ
ンファシスされたパラメータa、は、従来(7) LE
ROUX−GUEGEN法を用いてプレエンファシスさ
れた信号5p(n)から引出されたいわゆるPARCO
R係数k(i)からステップアップ手Jlliにより引
出される。
連の計算に含まれた詳細な動作を示す、160信号サン
プル5(n)の各ブロックが先ず処理され、信号自己相
関関数の2つの最初の値を下式から引出す: 次に、プレエンファシス係数Iが下式により計算され: R= R2/R1 160サンプル5(n)の最初のセットが下式によりプ
レエンファシスされたセラl” sρ(n)に変換され
る: 5p(n)== 5(n)−R05(n−1)プレエ
ンファシスされたパラメータa、は、従来(7) LE
ROUX−GUEGEN法を用いてプレエンファシスさ
れた信号5p(n)から引出されたいわゆるPARCO
R係数k(i)からステップアップ手Jlliにより引
出される。
k、係数はIN/’/ANGアルゴリズムを用いて28
ビットにより符号化することができる。これらの方法及
びアルゴリズムについては下記文献を参照されたい: e J、 Leroux & C,Guc
gcn : A fixedpoint
computation of partia、]
correlationcoefficients
″IEEE Transactions on ASS
P pp 257−259. June 1977゜−
c、に、 On & S、C,Yang :Piece
wise 1inearquantization o
r LI’Creflexion coeffici
ents″Proc、 Int、 Conf、 on
ASSP l1artford 、May 1977゜
・J、 D、 Markel & A、 +1.
Gray : ”l、1nearpredicti
on of 5peech″Springer Vc
rlag 1976゜5tep−up proced
ure pp 9/1−95゜・European p
atent 0002998 (1j5 counte
rpart短期フィルタ(13)は下式により短期残差
信号サンプルを引出す: 1=1 次に、サンプルr(n)のシーケンスはサブ・シーケン
ス・ブロックLに分割され、e(n)を引出して低いビ
ット速度で符号化し、コードワード参照符k及び利得係
数G(k)にするのに用いられる=コードワード及び利
得係数選択は平均二乗誤差基準の検討に基づく、即ち下
式に示す項を最小化するように選択される: E=[e(n)−G(n) ・CB(k、n)]” [
e(n)−G(k)・CB(k、n)]・・・・・(1
) ■は数学的な転置操作を表わす、 C11(k、n)は
第1図の符号器(14)内のテーブルである。換言すれ
ば、Eは2つのL成分ベクトル−Lは各コードワードC
Bののサンプル数−のスカラー積である。
ビットにより符号化することができる。これらの方法及
びアルゴリズムについては下記文献を参照されたい: e J、 Leroux & C,Guc
gcn : A fixedpoint
computation of partia、]
correlationcoefficients
″IEEE Transactions on ASS
P pp 257−259. June 1977゜−
c、に、 On & S、C,Yang :Piece
wise 1inearquantization o
r LI’Creflexion coeffici
ents″Proc、 Int、 Conf、 on
ASSP l1artford 、May 1977゜
・J、 D、 Markel & A、 +1.
Gray : ”l、1nearpredicti
on of 5peech″Springer Vc
rlag 1976゜5tep−up proced
ure pp 9/1−95゜・European p
atent 0002998 (1j5 counte
rpart短期フィルタ(13)は下式により短期残差
信号サンプルを引出す: 1=1 次に、サンプルr(n)のシーケンスはサブ・シーケン
ス・ブロックLに分割され、e(n)を引出して低いビ
ット速度で符号化し、コードワード参照符k及び利得係
数G(k)にするのに用いられる=コードワード及び利
得係数選択は平均二乗誤差基準の検討に基づく、即ち下
式に示す項を最小化するように選択される: E=[e(n)−G(n) ・CB(k、n)]” [
e(n)−G(k)・CB(k、n)]・・・・・(1
) ■は数学的な転置操作を表わす、 C11(k、n)は
第1図の符号器(14)内のテーブルである。換言すれ
ば、Eは2つのL成分ベクトル−Lは各コードワードC
Bののサンプル数−のスカラー積である。
Eを最小にする最適スケール係数G(k)は下式により
決定される: E □=O G 等式G(k)の分母は正規化係数−、1【前記憶された
テーブル内のコードワードを事前に正規化することによ
り回避することができる−である。
決定される: E □=O G 等式G(k)の分母は正規化係数−、1【前記憶された
テーブル内のコードワードを事前に正規化することによ
り回避することができる−である。
式(1)は下記のように変形することができる:最適コ
ードワードは等式(2)の最後の項を最大にするkを見
つけることにより得られる。
ードワードは等式(2)の最後の項を最大にするkを見
つけることにより得られる。
CB(k)はl C11(k、n) If 2を表わし
、 5ll(k)はスカラー積e1(n)・0口(k、
n)を表わすものとすると、先ず、下記の項を最大にす
るkを見つけなければならない: 5P(k)2 0口2(k) 次に、下記の項からG(k)の値を決定する:前記動作
を実行するためのアルゴリズムは第5図に示す。
、 5ll(k)はスカラー積e1(n)・0口(k、
n)を表わすものとすると、先ず、下記の項を最大にす
るkを見つけなければならない: 5P(k)2 0口2(k) 次に、下記の項からG(k)の値を決定する:前記動作
を実行するためのアルゴリズムは第5図に示す。
最初の2つの指標カウンタiおよびjはi=1及びj=
1にセットされる。テーブルは順次に走査される。コー
ドワードC11(1,n)はテーブルから読出される。
1にセットされる。テーブルは順次に走査される。コー
ドワードC11(1,n)はテーブルから読出される。
最初のスカラー積は下式により計算される:5P(1)
”Σ CII(1,n) ・e(n) (
3)n=1 この値は二乗されて5P2(1)となり、対応するコー
ドワードの二乗値[即ち、 cn2(1)]により除さ
れる1次に、iは1だけ増訂数され、前記動作はi=k
になるまで反復される。にはコードブックにあるコード
ワードの数である0次にシーケンス:5P2(i)/C
B2(i) −ただし、i = 1. 、、、、k
−の範囲内で5P2(k)/CB2(k)を最大にす
る最適コードワードCD(k)が選択される。この動作
はテーブル参照番号にの検出を可能にする。
”Σ CII(1,n) ・e(n) (
3)n=1 この値は二乗されて5P2(1)となり、対応するコー
ドワードの二乗値[即ち、 cn2(1)]により除さ
れる1次に、iは1だけ増訂数され、前記動作はi=k
になるまで反復される。にはコードブックにあるコード
ワードの数である0次にシーケンス:5P2(i)/C
B2(i) −ただし、i = 1. 、、、、k
−の範囲内で5P2(k)/CB2(k)を最大にす
る最適コードワードCD(k)が選択される。この動作
はテーブル参照番号にの検出を可能にする。
いったんkが選択されると、利得係数は下式を用いて計
算されるニ ジ−ケンスe(n)内のサンプル数をLの倍数になるよ
うに選択するものとすると、前記シーケンスe(n)は
それぞれがLサンプルの長さのJLウィンドーに再分割
され、次いで、jは1だけ増訂数され。
算されるニ ジ−ケンスe(n)内のサンプル数をLの倍数になるよ
うに選択するものとすると、前記シーケンスe(n)は
それぞれがLサンプルの長さのJLウィンドーに再分割
され、次いで、jは1だけ増訂数され。
前記プロセスはj = JLになるまで反復される。
註:もしピッチの値MがMmin = Lにより低く制
限されるなら、全てのCE / L T PループはL
サンプル毎に適用され、 CE/LTP適用毎にJL
= 1が得られる。 LTI’パラメータは80 r(
n)サンプルCE/LTP処理の後にだけ再計算される
。
限されるなら、全てのCE / L T PループはL
サンプル毎に適用され、 CE/LTP適用毎にJL
= 1が得られる。 LTI’パラメータは80 r(
n)サンプルCE/LTP処理の後にだけ再計算される
。
前記説明とは別に下記のように表現することができる:
(cn)−ただし、 n =1.2. 、、、、L
−は符号化すべきe(n)サンプルのシーケンスを表わ
し、(Y )−ただし、n = 1.2. 、、、 、
k = 1.2. 、、。
−は符号化すべきe(n)サンプルのシーケンスを表わ
し、(Y )−ただし、n = 1.2. 、、、 、
k = 1.2. 、、。
−はしサンプルそれぞれのにコードラードを含むに×1
.テーブルを表わすものとすると、CE L I)符号
化は下記のようになる。
.テーブルを表わすものとすると、CE L I)符号
化は下記のようになる。
・下式により相関積を計算する:
ただし、 k = 1. 、、、、に
・下式を導く kの最適値を選択する:Ekopt =
Max (Ek) ただし、 k = 1. 、、、、 K・対応する利得
は: G(k) = Ekkpt ・(en)シーケンスを下記のブロックに変換する=C
ビット” log2 Kビット + G(k)符号化ビット この方法はテーブルを記憶するのにかなり大きい記憶容
量を必要とする。に:256の場合には、に×しはたぶ
ん40 Kb程度となる。
Max (Ek) ただし、 k = 1. 、、、、 K・対応する利得
は: G(k) = Ekkpt ・(en)シーケンスを下記のブロックに変換する=C
ビット” log2 Kビット + G(k)符号化ビット この方法はテーブルを記憶するのにかなり大きい記憶容
量を必要とする。に:256の場合には、に×しはたぶ
ん40 Kb程度となる。
本明細書では別の方法が推奨される。システムの初期設
定で、残留する原始信号のL+にサンプルの最初のブロ
ック、例えばe(n)がテーブルY(n)。
定で、残留する原始信号のL+にサンプルの最初のブロ
ック、例えばe(n)がテーブルY(n)。
(n=1.L+K)に記憶される0次いで、各々の後続
するLワード長のシーケンス(en)が、下式により、
(en)シーケンスを1つのサンプル位置からその次の
サンプル位置にシフトすることによって (L+K)長
のテーブルのシーケンスと相関される;Ek =Σ
en −Y(n+に−1)n=ま ただし、 k = 1. 、、、、に この方法は、 K = 256の場合に、テーブルに必
要な記憶サイズを2 Kbにまで減少することを可能に
する。
するLワード長のシーケンス(en)が、下式により、
(en)シーケンスを1つのサンプル位置からその次の
サンプル位置にシフトすることによって (L+K)長
のテーブルのシーケンスと相関される;Ek =Σ
en −Y(n+に−1)n=ま ただし、 k = 1. 、、、、に この方法は、 K = 256の場合に、テーブルに必
要な記憶サイズを2 Kbにまで減少することを可能に
する。
第1図に関連して述べたように、受信装置即ち音声合成
動作は、に、G(k)、 b、 M及びa、データを互
いに分離するため、先ず受信データをマルチプレクシン
グする必要がある。にはテーブルから対応するコードワ
ードCB(k、n)を選択するのに使用される。前記コ
ードワードにG(k)を乗すると、下式のように合成信
号が合成される: e’ (n) =C(k) ・C[l(k、n)パラメ
ータb及び阿は受信装置で使用され、遅延素子b−r″
(n−M)の調整を可能にし、下式の合成短期残差信号
を引出す: r’(n) = e’(n) + b r’(n−M)
最後に、a、係数は下式を用いて音声信号を合成するた
め短期残留フィルタ(21)を調整するのに使用される
: 只 本発明の低いビット速度の符号化プロセスは、C,Ga
1and、 ”Voice Excited P
redictive Coding(VEPC)”、
IBM Journal of Re5ear
ch andDevelopment、 Vow、
29. No、2 March 1985が適用される
と更に省力が可能になる。この場合、コード励起線形予
測符号化はベースバンド信号により実行され、バンドは
例えば第6図に示すようなシステム用いて300= 1
00011zに制限される。
動作は、に、G(k)、 b、 M及びa、データを互
いに分離するため、先ず受信データをマルチプレクシン
グする必要がある。にはテーブルから対応するコードワ
ードCB(k、n)を選択するのに使用される。前記コ
ードワードにG(k)を乗すると、下式のように合成信
号が合成される: e’ (n) =C(k) ・C[l(k、n)パラメ
ータb及び阿は受信装置で使用され、遅延素子b−r″
(n−M)の調整を可能にし、下式の合成短期残差信号
を引出す: r’(n) = e’(n) + b r’(n−M)
最後に、a、係数は下式を用いて音声信号を合成するた
め短期残留フィルタ(21)を調整するのに使用される
: 只 本発明の低いビット速度の符号化プロセスは、C,Ga
1and、 ”Voice Excited P
redictive Coding(VEPC)”、
IBM Journal of Re5ear
ch andDevelopment、 Vow、
29. No、2 March 1985が適用される
と更に省力が可能になる。この場合、コード励起線形予
測符号化はベースバンド信号により実行され、バンドは
例えば第6図に示すようなシステム用いて300= 1
00011zに制限される。
この場合、信号r(n)は完全な(300〜34001
1z)バンド信号からはそれ以上引出されず、むしろ低
域フィルタ (60)により供給された低い(300〜
100011z)バンド信号から引出される。原始信号
から低い帯域幅信号を取除くだけで得られる高い帯域幅
信号(1000〜340011z)は装置(62)で処
理され、前記高い周波数帯域幅に含まれたエネルギーに
関連した情報を引出す、高い周波数エネルギーは符号化
されて係数Eのセット(例えば2つのE)となり、受信
装置/シンセサイザに向けて多重化される。さもなけれ
ば、残る全ての動作は第3図〜第5図に関連した前記説
明のように実行される。
1z)バンド信号からはそれ以上引出されず、むしろ低
域フィルタ (60)により供給された低い(300〜
100011z)バンド信号から引出される。原始信号
から低い帯域幅信号を取除くだけで得られる高い帯域幅
信号(1000〜340011z)は装置(62)で処
理され、前記高い周波数帯域幅に含まれたエネルギーに
関連した情報を引出す、高い周波数エネルギーは符号化
されて係数Eのセット(例えば2つのE)となり、受信
装置/シンセサイザに向けて多重化される。さもなけれ
ば、残る全ての動作は第3図〜第5図に関連した前記説
明のように実行される。
合成動作では、ベースバンド残留信号r”(n)が第1
図及び第2図に関連して説明したように合成されると、
高い周波数帯域幅成分が付加されなければならない、そ
のために、ベースバンド・スペクトルが非線形歪み装置
(70)の手法(余波整流)−ピッチ周律により倍音構
造を4にllzにまで拡大する−により展開される。非
音声音の場合。
図及び第2図に関連して説明したように合成されると、
高い周波数帯域幅成分が付加されなければならない、そ
のために、ベースバンド・スペクトルが非線形歪み装置
(70)の手法(余波整流)−ピッチ周律により倍音構
造を4にllzにまで拡大する−により展開される。非
音声音の場合。
特に摩擦音では、ベースバンド・スペク1−ルはあまり
に乏しく高周波信号を正確に生成できないことがある。
に乏しく高周波信号を正確に生成できないことがある。
これは、雑音発生装置(71)を非常に低いレベルで使
用し両者を加えることにより補償される。展開された帯
域幅は (1000〜340011z)の帯域幅を保持
するようにllr’F(72)でフィルタされる。
用し両者を加えることにより補償される。展開された帯
域幅は (1000〜340011z)の帯域幅を保持
するようにllr’F(72)でフィルタされる。
そのエネルギー内容は、処理中のサンプルのブロックの
受信されたE係数に基づいて最初の高い周波数のスペク
トルに一致するように、調整装置(73)で調整される
。このようにして得られた高いバンドの残差信号は、装
置(70)、(72)及び(73)に関連する処理によ
る遅延を考慮して遅延装置(74)で遅延された該合成
されたベースバンド残差信号に加えられ、該合成された
短期残差信号r’ (n)が得られる。 r’(n)は
短期予測フィルタ (75)でフィルタされ1合成され
た音声s’ (n)が得られる。
受信されたE係数に基づいて最初の高い周波数のスペク
トルに一致するように、調整装置(73)で調整される
。このようにして得られた高いバンドの残差信号は、装
置(70)、(72)及び(73)に関連する処理によ
る遅延を考慮して遅延装置(74)で遅延された該合成
されたベースバンド残差信号に加えられ、該合成された
短期残差信号r’ (n)が得られる。 r’(n)は
短期予測フィルタ (75)でフィルタされ1合成され
た音声s’ (n)が得られる。
第1図は本発明に従って構成された送信装置及び受信装
置の双方の基本素子のブロック図、第2図及び第3図は
第1図の装置によって実行される動作の流れ図、 第4図及び第5図は本発明に関連する動作の流れ図、 第6図及び第7図は本発明を実現するもう1つの装置を
示す図である。 9・・・・計算装置、 10・・・・PIIE−EMP
装置、12・・・・相関装置、13・・・・STP、
14・・・・符号器、15・・・・長期予測フィルタ、
16・・・・加算機構、17・・・・Ml”X、 1
8・・・・DMPX、 19・・・・テーブル、20・
・・・逆長期予測装置、21・・・・STP、60・・
・・LPF、62・・・・HI’E、64・・・・符号
器、70・・・・歪み装置、71・・・・雑音発生装置
、72・・・・1IPF、73・・・・調整装置、74
・・・・遅延装置、75・・・・STr’。 出願人 インター亥ショナル・ビジネス・マシーンズ
・コーポレーション 復代理人 弁理士 澤 1) 俊 夫第2図 入力 : e(nl 第5図
置の双方の基本素子のブロック図、第2図及び第3図は
第1図の装置によって実行される動作の流れ図、 第4図及び第5図は本発明に関連する動作の流れ図、 第6図及び第7図は本発明を実現するもう1つの装置を
示す図である。 9・・・・計算装置、 10・・・・PIIE−EMP
装置、12・・・・相関装置、13・・・・STP、
14・・・・符号器、15・・・・長期予測フィルタ、
16・・・・加算機構、17・・・・Ml”X、 1
8・・・・DMPX、 19・・・・テーブル、20・
・・・逆長期予測装置、21・・・・STP、60・・
・・LPF、62・・・・HI’E、64・・・・符号
器、70・・・・歪み装置、71・・・・雑音発生装置
、72・・・・1IPF、73・・・・調整装置、74
・・・・遅延装置、75・・・・STr’。 出願人 インター亥ショナル・ビジネス・マシーンズ
・コーポレーション 復代理人 弁理士 澤 1) 俊 夫第2図 入力 : e(nl 第5図
Claims (1)
- 【特許請求の範囲】 符号化すべき音声信号s(n)のサンプル・ブロックの
各々に対し少なくとも1個のテーブル・アドレスにおよ
びこのテーブル・アドレスに関連する利得Gを生成する
コード励起符号化によって低ビット速度で音声信号s(
n)を符号化する方法において、 音声信号s(n)から導出された部分相関係数の組によ
り調整された短期予測フィルタを用いて音声信号s(n
)をフィルタ処理し、上記短期予測フィルタから短期残
差r(n)を取り出すステップと、重み付けし、遅延さ
せて得た合成短期残差を上記短期残差r(n)から差し
引いて長期残差e(n)を導出するステップと、 上記長期残差e(n)を分割して継続したブロックを生
成するステップと、 上記長期残差e(n)の各ブロックをコード励起符号化
処理し、少なくとも1個のテーブル・アドレスおよび1
個の利得を生成するステップとを有することを特長とす
る音声信号符号化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP88480006.1 | 1988-03-08 | ||
EP88480006A EP0331857B1 (en) | 1988-03-08 | 1988-03-08 | Improved low bit rate voice coding method and system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01296300A true JPH01296300A (ja) | 1989-11-29 |
Family
ID=8200488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63316618A Pending JPH01296300A (ja) | 1988-03-08 | 1988-12-16 | 音声信号符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4933957A (ja) |
EP (1) | EP0331857B1 (ja) |
JP (1) | JPH01296300A (ja) |
DE (1) | DE3871369D1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1992005541A1 (fr) * | 1990-09-14 | 1992-04-02 | Fujitsu Limited | Systeme de codage de la parole |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE68914147T2 (de) * | 1989-06-07 | 1994-10-20 | Ibm | Sprachcodierer mit niedriger Datenrate und niedriger Verzögerung. |
US5097508A (en) * | 1989-08-31 | 1992-03-17 | Codex Corporation | Digital speech coder having improved long term lag parameter determination |
US5054075A (en) * | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
JPH03123113A (ja) * | 1989-10-05 | 1991-05-24 | Fujitsu Ltd | ピッチ周期探索方式 |
IL95753A (en) * | 1989-10-17 | 1994-11-11 | Motorola Inc | Digits a digital speech |
DE9006717U1 (de) * | 1990-06-15 | 1991-10-10 | Philips Patentverwaltung GmbH, 22335 Hamburg | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen |
US5528629A (en) * | 1990-09-10 | 1996-06-18 | Koninklijke Ptt Nederland N.V. | Method and device for coding an analog signal having a repetitive nature utilizing over sampling to simplify coding |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
KR930006476B1 (ko) * | 1990-09-29 | 1993-07-16 | 삼성전자 주식회사 | 영상처리 시스템의 데이타 변복조방법 |
JP3077944B2 (ja) * | 1990-11-28 | 2000-08-21 | シャープ株式会社 | 信号再生装置 |
JPH04264597A (ja) * | 1991-02-20 | 1992-09-21 | Fujitsu Ltd | 音声符号化装置および音声復号装置 |
JP3254687B2 (ja) * | 1991-02-26 | 2002-02-12 | 日本電気株式会社 | 音声符号化方式 |
US5265190A (en) * | 1991-05-31 | 1993-11-23 | Motorola, Inc. | CELP vocoder with efficient adaptive codebook search |
EP0588932B1 (en) * | 1991-06-11 | 2001-11-14 | QUALCOMM Incorporated | Variable rate vocoder |
US5255339A (en) * | 1991-07-19 | 1993-10-19 | Motorola, Inc. | Low bit rate vocoder means and method |
US5657418A (en) * | 1991-09-05 | 1997-08-12 | Motorola, Inc. | Provision of speech coder gain information using multiple coding modes |
US5253269A (en) * | 1991-09-05 | 1993-10-12 | Motorola, Inc. | Delta-coded lag information for use in a speech coder |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
GB2282943B (en) * | 1993-03-26 | 1998-06-03 | Motorola Inc | Vector quantizer method and apparatus |
BE1007617A3 (nl) * | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US5497337A (en) * | 1994-10-21 | 1996-03-05 | International Business Machines Corporation | Method for designing high-Q inductors in silicon technology without expensive metalization |
EP0732687B2 (en) * | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
JP3064947B2 (ja) * | 1997-03-26 | 2000-07-12 | 日本電気株式会社 | 音声・楽音符号化及び復号化装置 |
KR100510399B1 (ko) | 1998-02-17 | 2005-08-30 | 모토로라 인코포레이티드 | 고정 코드북내의 최적 벡터의 고속 결정 방법 및 장치 |
US6691084B2 (en) | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US20070239294A1 (en) * | 2006-03-29 | 2007-10-11 | Andrea Brueckner | Hearing instrument having audio feedback capability |
US11714127B2 (en) | 2018-06-12 | 2023-08-01 | International Business Machines Corporation | On-chip spread spectrum characterization |
US11146307B1 (en) * | 2020-04-13 | 2021-10-12 | International Business Machines Corporation | Detecting distortion in spread spectrum signals |
US11693446B2 (en) | 2021-10-20 | 2023-07-04 | International Business Machines Corporation | On-chip spread spectrum synchronization between spread spectrum sources |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS542050A (en) * | 1977-06-07 | 1979-01-09 | Nec Corp | Block coding and decoding system |
EP0070948B1 (fr) * | 1981-07-28 | 1985-07-10 | International Business Machines Corporation | Procédé de codage de la voix et dispositif de mise en oeuvre dudit procédé |
EP0093219B1 (fr) * | 1982-04-30 | 1986-04-02 | International Business Machines Corporation | Procédé de codage numérique et dispositif de mise en oeuvre dudit procédé |
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
-
1988
- 1988-03-08 DE DE8888480006T patent/DE3871369D1/de not_active Expired - Fee Related
- 1988-03-08 EP EP88480006A patent/EP0331857B1/en not_active Expired - Lifetime
- 1988-12-16 JP JP63316618A patent/JPH01296300A/ja active Pending
-
1989
- 1989-03-07 US US07/320,192 patent/US4933957A/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1992005541A1 (fr) * | 1990-09-14 | 1992-04-02 | Fujitsu Limited | Systeme de codage de la parole |
US5323486A (en) * | 1990-09-14 | 1994-06-21 | Fujitsu Limited | Speech coding system having codebook storing differential vectors between each two adjoining code vectors |
Also Published As
Publication number | Publication date |
---|---|
EP0331857B1 (en) | 1992-05-20 |
DE3871369D1 (de) | 1992-06-25 |
US4933957A (en) | 1990-06-12 |
EP0331857A1 (en) | 1989-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH01296300A (ja) | 音声信号符号化方法 | |
CA2347667C (en) | Periodicity enhancement in decoding wideband signals | |
US6202046B1 (en) | Background noise/speech classification method | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
US4868867A (en) | Vector excitation speech or audio coder for transmission or storage | |
US5873059A (en) | Method and apparatus for decoding and changing the pitch of an encoded speech signal | |
EP0331858B1 (en) | Multi-rate voice encoding method and device | |
US5495555A (en) | High quality low bit rate celp-based speech codec | |
EP0379587B1 (en) | Encoder/decoder apparatus | |
EP0770989B1 (en) | Speech encoding method and apparatus | |
EP0763818B1 (en) | Formant emphasis method and formant emphasis filter device | |
US6119082A (en) | Speech coding system and method including harmonic generator having an adaptive phase off-setter | |
US6078880A (en) | Speech coding system and method including voicing cut off frequency analyzer | |
US6081776A (en) | Speech coding system and method including adaptive finite impulse response filter | |
US6098036A (en) | Speech coding system and method including spectral formant enhancer | |
US6138092A (en) | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency | |
JP4097699B2 (ja) | 複雑さが軽減された信号送信システム | |
JPH08179796A (ja) | 音声符号化方法 | |
JP2003512654A (ja) | 音声の可変レートコーディングのための方法およびその装置 | |
US5295224A (en) | Linear prediction speech coding with high-frequency preemphasis | |
JPH09127989A (ja) | 音声符号化方法及び音声符号化装置 | |
WO2001020595A1 (en) | Voice encoder/decoder | |
JPS63223799A (ja) | ピツチ検出方法 | |
JPH10124094A (ja) | 音声分析方法、音声符号化方法および装置 | |
WO2006120931A1 (ja) | 符号化装置、復号化装置及びこれらの方法 |