JP2776050B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP2776050B2
JP2776050B2 JP3103263A JP10326391A JP2776050B2 JP 2776050 B2 JP2776050 B2 JP 2776050B2 JP 3103263 A JP3103263 A JP 3103263A JP 10326391 A JP10326391 A JP 10326391A JP 2776050 B2 JP2776050 B2 JP 2776050B2
Authority
JP
Japan
Prior art keywords
codebook
code vector
signal
gain
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3103263A
Other languages
English (en)
Other versions
JPH04270400A (ja
Inventor
俊樹 宮野
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP3103263A priority Critical patent/JP2776050B2/ja
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to EP92103180A priority patent/EP0501420B1/en
Priority to CA002061803A priority patent/CA2061803C/en
Priority to EP98119722A priority patent/EP0898267B1/en
Priority to DE69232892T priority patent/DE69232892T2/de
Priority to DE69229364T priority patent/DE69229364T2/de
Priority to US07/841,827 priority patent/US5485581A/en
Publication of JPH04270400A publication Critical patent/JPH04270400A/ja
Application granted granted Critical
Publication of JP2776050B2 publication Critical patent/JP2776050B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を低いビットレ
ート、特に8kb/s以下で、比較的少ない演算量によ
り高品質に符号化するための音声符号化方式に関するも
のである。
【0002】
【従来の技術】音声信号を8kb/s以下のビットレー
トで効率的に符号化する方法として、音声信号の短期相
関を表す線形予測分析部と、音声信号の長期予測を表す
適応コードブックと、励振音源を表す音源コードブック
と、適応コードブックと音声コードブックのゲインを表
すゲインコードブックとからなる音声符号化方式として
CELP方式が知られている。
【0003】CELP方式において、音源コードブック
を探索する際、適応コードベクトルのゲインと音源コー
ドベクトルのゲインとして同時最適ゲインを用いること
により、より良い音源コードベクトルが探索でき音質が
向上することが知られている。音源コードブックを探索
する際、適応コードベクトルのゲインと音源コードベク
トルのゲインとして同時最適ゲインを用いる音声符号化
方式として、IraA.Gerson and Mar
k A.Jasiukによる“VECTORSUM E
XCITED LINEAR PREDICTION
(VSELP) SPEECH CODING AT
8 KBPS”(Proc.ICASSP ’90 S
9.3,pp.461−464,1990)と題した論
文(文献1)や、谷口智彦,マーク・ジョンソンによる
「ピッチ直交型CELP音声符号化方式」(日本音響学
会 平成2年度秋季研究発表会講演論文集I pp.1
89−190,1990)と題した論文(文献2)に記
載されている音声符号化方式が知られている。
【0004】また、音声信号を8kb/s以下のビット
レートで効率的に符号化する方法として、音声信号の短
期相関を表す線形予測分析部と、音声信号の長期予測を
表す適応コードブックと、励振音源を表す音源コードブ
ックと、適応コードブックと音源コードブックのゲイン
を表すゲインコードブックとからなる音声符号化方式と
して、Manfred R.Schroeder an
d Bishnu S.Atalによる“CODE−E
XCITED LINEAR PREDICTION
(CELP):HIGH−QUALITY SPEEC
H AT VERY LOW BIT RATES”
(Proc.ICASSP,pp.937−940,1
985)と題した論文(文献3)に記載されているCE
LP方式が知られている。
【0005】文献1や文献2に記載の従来方式では、音
源コードブックが特別な代数的構造を持っているため、
比較的少ない演算量で、適応コードベクトルと音源コー
ドベクトルの同時最適ゲインを計算できるのであり、特
別な代数構造を持たない音源コードブックの場合は、同
時最適ゲインの計算に多くの演算量が必要であるという
問題点があった。
【0006】また文献3に記載の従来方式では、ゲイン
を正規化しないので、ゲインの分散が大きく、そのため
量子化特性がかなり低かった。
【0007】本発明の目的は、上述した問題を解決し、
比較的少ない演算量により8kb/s以下で音質の良好
な音声符号化方式を提供することにある。
【0008】
【課題を解決するための手段】第1の発明は、一定間隔
のフレームに分割された音声信号を入力し、前記入力音
声信号の線形予測パラメータを求める線形予測分析部
と、前記入力音声信号の長期相関を利用する適応コード
ブックと、前記入力音声信号の励振音源を表す音源コー
ドブックと、前記適応コードブックのゲインと前記音源
コードブックのゲインを量子化するゲインコードブック
を有する音声符号化方式において、前記音源コードブッ
クのコードベクトルと前記線形予測パラメータとで合成
される合成信号の自己相関を、前記適応コードブックの
コードベクトルと前記線形予測パラメータとで合成され
る合成信号の自己相関と、前記適応コードブックのコー
ドベクトルの合成信号と前記音源コードブックのコード
ベクトルの合成信号との相互相関とを用いて修正し、前
記修正した自己相関と、前記入力音声信号から前記適応
コードブックのコードベクトルの合成信号を引いた信号
と前記音源コードブックのコードベクトルの合成信号と
の相互相関とを用いることにより、前記音源コードブッ
クを探索することを特徴とする。
【0009】第2の発明は、一定間隔のフレームに分割
された音声信号を入力し、前記入力音声信号のスペクト
ルパラメータを求める線形予測分析部と、前記入力音声
信号の長期相関を利用する適応コードブックと、前記入
力音声信号の励振音源を表す音源コードブックと、前記
適応コードブックのゲインと前記音源コードブックのゲ
インを量子化するゲインコードブックを有する音声符号
化方式において、前記ゲインコードブックのコードベク
トルを探索する際に、前記音源コードベクトルの合成信
号の自己相関と、前記適応コードベクトルの合成信号と
前記音源コードベクトルの合成信号との相互相関と、前
記音源コードベクトルの合成信号の自己相関と、前記入
力音声信号の自己相関、または、前記入力音声信号の自
己相関の推定値とから計算される正規化係数を用いるこ
とを特徴とする。
【0010】
【作用】第1の発明による音声符号化方式の作用を説明
する。
【0011】まず、次の誤差Cを最小にする適応コード
ベクトルを探索する。
【0012】
【数1】
【0013】
【0014】
【数2】
【0015】
【0016】ここで、xw’は、聴感重み付け入力信号
から影響信号を引いた信号、Sadは、遅れdの適応コ
ードベクトルadの聴感重み付け合成信号、βは適応コ
ードベクトルの最適ゲイン、Nはサブフレーム長、
〈・,・〉は、内積を表す。
【0017】次に、選ばれた適応コードベクトルad
対して、次の誤差Dを最小にする音源コードベクトルを
探索する。
【0018】
【数3】
【0019】
【0020】
【数4】
【0021】
【0022】
【数5】
【0023】
【0024】ここで、Sci’は、選択された適応コー
ドベクトルの聴感重み付け合成信号に対して直交化され
たインデックスiの音源コードベクトルciの聴感重み
付け合成信号、γは、音源コードベクトルの最適ゲイン
である。
【0025】同時最適ゲインを求めるために、選択され
た適応コードベクトルの聴感重み付け合成信号に対し
て、インデックスiの音源コードベクトルciの聴感重
み付け合成信号を直交化させる方法が文献1等により知
られているが、この方法では、きわめて多くの演算量を
必要とする。そこで、Dを次のようにして計算すること
により演算量の低減化を行う。
【0026】まず、数4を数3に代入する。
【0027】
【数6】
【0028】
【0029】次に、数7を数6に代入し、xaとSad
とは直交していることから、数8を得る。
【0030】
【数7】
【0031】
【0032】
【数8】
【0033】
【0034】最後に、選ばれた適応コードベクトルと音
源コードベクトルに対して、次の誤差Eを最小にするゲ
インコードベクトルを探索する。
【0035】
【数9】
【0036】
【0037】ここで、(βj,γj)は、インデックスj
のゲインコードベクトルである。
【0038】ゲインコードブックは、適応コードブック
のゲインと音源コードブックのゲインからなる2次元コ
ードブックを用いても良いし、適応コードブックのゲイ
ンからなる1次元ゲインコードブックと音源コードブッ
クのゲインからなる1次元ゲインコードブックの二つの
コードブックを用いてもよい。
【0039】次に、第2の発明による音声符号化方式の
作用を説明する。
【0040】まず、次の誤差Cを最小にする適応コード
ベクトルを探索する。
【0041】
【数10】
【0042】
【0043】
【数11】
【0044】
【0045】ここで、xw’は、聴感重み付け入力信号
から影響信号を引いた信号、Sadは、遅れdの適応コ
ードベクトルadの聴感重み付け合成信号、βは適応コ
ードベクトルの最適ゲイン、Nはサブフレーム長(例え
ば5ms)、〈・,・〉は、内積を表す。
【0046】次に、選ばれた適応コードベクトルad
対して、次の誤差Dを最小にする音源コードベクトルを
探索する。
【0047】
【数12】
【0048】
【0049】
【数13】
【0050】
【0051】
【数14】
【0052】
【0053】ここで、Sciは、インデックスiの音源
コードベクトルciの聴感重み付け合成信号、γは、音
源コードベクトルの最適ゲインである。Sciは、選択
された適応コードベクトルの聴感重み付け合成信号に対
して直交化されたインデックスiの音源コードベクトル
iの聴感重み付け合成信号としてもよい。
【0054】最後に、選ばれた適応コードベクトルと音
源コードベクトルに対して、次の誤差Eを最小にするゲ
インコードベクトルを探索する。
【0055】ここで、ゲインコードブックは、必ずしも
2次元コードブックであるとは、限らない。例えば、適
応コードブックのゲインを量子化するための1次元コー
ドブックと音源コードブックのゲインを量子化するため
の1次元コードブックをゲインコードブックとして用い
てもよい。
【0056】
【数15】
【0057】
【0058】
【数16】
【0059】
【0060】
【数17】
【0061】
【0062】
【数18】
【0063】
【0064】
【数19】
【0065】
【0066】ここで、XRMSは、重み付けられた1フ
レーム分(例えば20ms)の音声信号の量子化された
RMS、(G1j,G2j)は、インデックスjのゲインコ
ードベクトルである。
【0067】XRMSは、重み付けられた1フレーム分
の音声信号の量子化されたRMSであるが、前フレーム
の重み付けられた1フレーム分の音声信号の量子化され
たRMSを用いて各サブフレームに補間(例えば、対数
補間)した値を用いてもよい。
【0068】
【実施例】まず、第1の発明の一実施例を説明する。
【0069】図1は第1の発明による音声符号化方式を
実施する符号化器の一例を示すブロック図である。図に
おいて、入力端子100から音声信号を入力し、線形予
測器110と、適応コードブック探索回路130と、ゲ
インコードブック探索回路220へ出力する。線形予測
器110では、一定の長さのフレーム(例えば20m
s)に分割された音声信号に対して、線形予測分析を行
い、スペクトルパラメータを、重み付け合成フィルタ1
50と、適応コードブック探索回路130と、ゲインコ
ードブック探索回路220へ出力する。以下の処理は、
フレームをさらに細分化したサブフレーム(例えば5m
s)ごとに行うものとする。適応コードブック120か
ら遅れdの適応コードベクトルadが適応コードブック
探索回路130へ出力され、適応コードブック探索回路
130で、適応コードベクトルが探索される。適応コー
ドブック探索回路130からは、選択された遅れdがマ
ルチプレクサ230へ、選択された遅れdの適応コード
ベクトルadがゲインコードブック探索回路220へ、
選択された遅れdの適応コードベクトルadの重み付け
合成信号Sadが相互相関回路160へ、選択された遅
れdの適応コードベクトルadの重み付け合成信号Sad
の自己相関〈Sad,Sad〉が直交化相互相関回路19
0へ、入力音声信号から、選択された遅れdの適応コー
ドベクトルadの重み付け合成信号Sadに最適ゲインβ
を掛けた信号を引いた信号xaを相互相関回路180
へ、それぞれ出力する。音源コードブック180から、
インデックスiの音源コードベクトルciを重み付け合
成フィルタ150と(相互)2/(自己)最大値探索回
路200へ出力する。重み付け合成フィルタ150で
は、音源コードベクトルciを重み付け合成し、相互相
関回路160と自己相関回路170と相互相関回路18
0へ出力する。相互相関回路160では、適応コードベ
クトルadの重み付け合成信号Sadと音源コードベクト
ルciの重み付け合成信号Sciの相互相関を計算し、直
交化自己相関回路190へ出力する。自己相関回路17
0では、音源コードベクトルciの重み付け合成信号S
iの自己相関を計算し、直交化自己相関回路200へ
出力する。相互相関回路180では、xaと音源コード
ベクトルciの重み付け合成信号Sciの相互相関を計算
し、(相互)2/(自己)最大値探索回路200へ出力
する。直交化自己相関回路190では、適応コードベク
トルadの重み付け合成信号Sadに対して直交化された
音源コードベクトルciの重み付け合成信号Sci’の自
己相関を計算し、(相互)2/(自己)最大値探索回路
200へ出力する。(相互)2/(自己)最大値探索回
路200では、(xaと適応コードベクトルadの重み
付け合成信号Sadに対して直交化された音源コードベ
クトルciの重み付け合成信号Sci’の相互相関)2
(適応コードベクトルadの重み付け合成信号Sadに対
して直交化された音源コードベクトルciの重み付け合
成信号Sci’の自己相関)が最大となるインデックス
iが探索され、インデックスiはマルチプレクサ230
へ、音源コードベクトルciは、ゲインコードブック探
索回路220へ出力される。ゲインコードブック210
からは、インデックスjのゲインコードベクトルが出力
され、ゲインコードブック探索回路220へ、出力され
る。ゲインコードブック探索回路220では、ゲインコ
ードベクトルが探索され、選択されたゲインコードベク
トルのインデックスjがマルチプレクサ230へ出力さ
れる。
【0070】図2は第1の発明による音声符号化方式を
実施する復号化器の一例を示すブロック図である。図に
おいて、デマルチプレクサ240から、適応コードブッ
クの遅れdが適応コードブック250へ、スペクトルパ
ラメータが合成フィルタ310へ、音源コードブックの
インデックスiが音源コードブック260へ、ゲインコ
ードブックのインデックスjがゲインコードブック27
0へ出力され、適応コードブック250から遅れdの適
応コードベクトルadが、音源コードブック260から
インデックスiの音源コードベクトルciが、ゲインコ
ードブック270からインデックスjの音源コードベク
トル(βj,γj)が出力され、乗算器280で、ad
βjを掛け、乗算器290で、ciとγjを掛け、それら
を加算器300で足し合わせ、適応コードブック250
と合成フィルタ310へ、出力する。合成フィルタ31
0で、adβj+ciγjは、合成され、出力端子320へ
出力される。
【0071】ゲインコードブックは、適応コードブック
のゲインと音源コードブックのゲインからなる2次元コ
ードブックを用いても良いし、適応コードブックのゲイ
ンからなる1次元ゲインコードブックと音源コードブッ
クのゲインからなる1次元ゲインコードブックの二つの
コードブックを用いてもよい。
【0072】以上で本発明の実施例の説明を終える。上
記実施例以外にも種々の変形が考えられる。
【0073】相互相関回路180において、数8の〈x
a,Sci〉を計算する際、演算量を低減化するため
に、次式のようにして計算してもよい。
【0074】
【数20】
【0075】
【0076】
【数21】
【0077】
【0078】ここで、hは重み付け合成フィルタのイン
パルス応答。
【0079】また、相互相関回路160において、数8
の〈Sad,Sci〉を計算する際、演算量を低減化する
ために、次式のようにして計算してもよい。
【0080】
【数22】
【0081】
【0082】
【数23】
【0083】
【0084】また、自己相関回路170において、数8
の〈Sci,Sci〉を計算する際、演算量を低減化する
ために、次式のようにして近似計算してもよい。
【0085】
【数24】
【0086】
【0087】
【数25】
【0088】
【0089】
【数26】
【0090】
【0091】また、性能を改善するために、適応コード
ブックでは、遅れdについて複数種類の候補を求め、各
候補に対して音源コードブックを直交化した後に、重み
付け入力信号と重み付け合成信号との誤差電力を最小化
する遅れと音源コードブックの組合せを求めてもよい。
このとき、相互相関回路160において、数8の〈Sa
d,Sci〉を計算する際、演算量を低減化するために、
次式のようにして計算してもよい。ただし、相互相関回
路160にSadを入力する代わりに、適応コードブッ
ク探索回路130から、xaと適応コードベクトルの最
適ゲインβを入力し、相互相関回路180から、〈x
a,Sci〉を入力する。
【0092】
【数27】
【0093】
【0094】上式により、〈Sad,Sci〉の計算は、
適応コードベクトルが変わる毎に内積計算をする必要が
なくなり、演算量を低減できる。
【0095】また、さらに性能を改善するために、適応
コードブックと音源コードブックとをサブフレームで一
意に決定するのではなく、サブフレームでは複数の候補
を求め、フレーム全体で累積誤差電力を求め、これを最
小化する適応コードブックと音源コードブックの組合せ
を求めるようにしてもよい。
【0096】次に、第2の発明の一実施例を説明する。
【0097】図3は、第2の発明による音声符号化方式
の符号化器の一例を示すブロック図である。図におい
て、入力端子400から音声信号を入力し、重み付けフ
ィルタ405と線形予測分析回路420へ出力する。線
形予測分析回路420で、線形予測分析を行い、スペク
トルパラメータを、重み付けフィルタ405と影響信号
減算回路415と重み付け合成フィルタ540と適応コ
ードブック探索回路460と音源コードブック探索回路
480とマルチプレクサ560へ出力する。重み付けフ
ィルタ405では、音声信号を聴感重み付けし、サブフ
レーム分割回路410と自己相関回路430へ出力す
る。サブフレーム分割回路410からサブフレーム長
(例えば5ms)に分割された重み付け音声信号を影響
信号減算回路415へ出力し、影響信号減算回路415
で前のサブフレームからの影響信号を減算し、影響信号
が引かれた重み付け音声信号を適応コードブック探索回
路460と減算器545へ出力する。適応コードブック
450から遅れdの適応コードベクトルadが適応コー
ドブック探索回路460へ出力され、適応コードブック
探索回路460で、適応コードベクトルが探索される。
適応コードブック探索回路460からは、選択された遅
れdがマルチプレクサ560へ、選択された遅れdの適
応コードベクトルadが乗算器522へ、選択された遅
れdの適応コードベクトルadの重み付け合成信号Sad
が自己相関回路490と相互相関回路500へ、重み付
け音声信号から、選択された遅れdの適応コードベクト
ルadの重み付け合成信号Sadに最適ゲインβを掛けた
信号を引いた信号xaを音源コードブック探索回路48
0へ、それぞれ出力する。音源コードブック470か
ら、インデックスiの音源コードベクトルciを音源コ
ードブック探索回路480へ出力する。音源コードブッ
ク探索回路480では、音源コードブックを探索し、選
択された音源コードベクトルのインデックスをマルチプ
レクサ560へ,選択された音源コードベクトルを乗算
器524へ、選択された音源コードベクトルの重み付け
合成信号を相互相関回路500と自己相関回路510
へ、出力する。このとき、適応コードベクトルに対して
音源コードベクトルを直交化して、探索してもよい。自
己相関回路430では、フレーム長の重み付け音声信号
の自己相関を計算し、原音RMS量子化器440へ出力
する。原音RMS量子化器440では、フレーム長の重
み付け音声信号の自己相関から、フレーム長の重み付け
音声信号のRMSを計算し、μ−law量子化し、イン
デックスをマルチプレクサ560へ、量子化された原音
RMSをゲイン計算回路520へ出力する。自己相関回
路490では、適応コードベクトルの重み付け合成信号
の自己相関を計算し、ゲイン計算回路520へ出力す
る。相互相関回路500では、適応コードベクトルの重
み付け合成信号と音源コードベクトルの重み付け合成信
号の相互相関を計算し、ゲイン計算回路520へ出力す
る。自己相関回路510では、音源コードベクトルの重
み付け合成信号の自己相関を計算し、ゲイン計算回路5
20へ出力する。ゲインコードブック530から、イン
デックスjのゲインコードベクトルをゲイン計算回路5
20へ出力し、ゲイン計算回路520では、ゲインを計
算し、適応コードベクトルのゲインを乗算器522へ、
音源コードベクトルのゲインを乗算器524へ、出力す
る。乗算器522では、適応コードベクトルに適応コー
ドベクトルのゲインを掛け、乗算器524では、音源コ
ードベクトルに音源コードベクトルのゲインを掛け、加
算器526で、それらを足し合わせ、重み付け合成フィ
ルタ540へ出力し、重み付け合成フィルタ540で、
重み付け合成され、減算器545へ出力される。減算器
545では、サブフレーム長の音声信号から、重み付け
合成フィルタからの出力信号を引き、2乗誤差計算回路
550へ出力する。2乗誤差計算回路550では、2乗
誤差が最小となるゲインコードベクトルが探索され、そ
のインデックスがマルチプレクサ560へ出力される。
【0098】ゲイン計算回路520で、ゲインを計算す
る際、量子化された原音RMSそのものを用いる代わり
に、前フレームの量子化された原音RMSと現フレーム
の量子化された原音RMSを用いて各サブフレームに補
間(例えば、対数補間)した値を用いてもよい。
【0099】図4は、第2の発明による音声符号化方式
を実施する復号化器の一例を示すブロック図である。図
において、デマルチプレクサ570から原音RMSのイ
ンデックスを原音RMS復号化器580へ、適応コード
ベクトルの遅れは適応コードブック590へ、音源コー
ドベクトルのインデックスは音源コードブック600
へ、ゲインコードベクトルのインデックスはゲインコー
ドブック610へ、スペクトルパラメータは、重み付け
合成フィルタ620と重み付け合成フィルタ630と合
成フィルタ710へ出力される。原音RMS復号化器5
80からは、原音RMSがゲイン計算回路670へ出力
される。適応コードブック590からは、適応コードベ
クトルが重み付け合成フィルタ620と乗算器680へ
出力され、音源コードブック600からは、音源コード
ベクトルが重み付け合成フィルタ630と乗算器690
へ出力され、ゲインコードブック610からは、ゲイン
コードベクトルがゲイン計算回路670へ出力される。
重み付け合成フィルタ620からは適応コードベクトル
の重み付け合成信号が自己相関回路640と相互相関回
路650へ出力され、重み付け合成フィルタ630から
は音源コードベクトルの重み付け合成信号が自己相関回
路660と相互相関回路650へ出力される。自己相関
回路640では、適応コードベクトルの重み付け合成信
号の自己相関が計算され、ゲイン計算回路670へ出力
される。相互相関回路650では、適応コードベクトル
の重み付け合成信号と音源コードベクトルの重み付け合
成信号の相互相関が計算され、ゲイン計算回路670へ
出力される。自己相関回路660では、音源コードベク
トルの重み付け合成信号の自己相関が計算され、ゲイン
計算回路670へ出力される。ゲイン計算回路670で
は、作用で述べた数16〜数19により適応コードベク
トルのゲインと音源コードベクトルのゲインを計算し、
適応コードベクトルのゲインを乗算器680へ、音源コ
ードベクトルのゲインを乗算器690へ、出力する。乗
算器680では、適応コードベクトルに適応コードベク
トルのゲインを掛け、乗算器690では、音源コードベ
クトルに音源コードベクトルのゲインを掛け、それらを
加算器700で加算し、合成フィルタ710へ出力し、
合成フィルタ710では、その信号を合成し、出力端子
720へ出力する。
【0100】ゲイン計算回路670で、ゲインを計算す
る際、量子化された原音RMSそのものを用いる代わり
に、前フレームの量子化された原音RMSと現フレーム
の量子化された原音RMSを用いて各サブフレームに補
間(例えば、対数補間)した値を用いてもよい。
【0101】図5は、ゲイン計算回路670の一例を示
すブロック図である。図において、入力端子730から
量子化された原音RMS(XRMSと書く)を入力し、
除算器850と除算器870へ出力する。入力端子74
0から適応コードベクトルの重み付け合成信号の自己相
関〈Sa,Sa〉を入力し、乗算器790と除算器80
0へ出力する。入力端子750から適応コードベクトル
の重み付け合成信号と音源コードベクトルの重み付け合
成信号との相互相関〈Sa,Sc〉を入力し、除算器8
00と乗算器810へ出力する。入力端子760から音
源コードベクトルの重み付け合成信号との自己相関〈S
c,Sc〉を入力し、減算器820へ出力する。入力端
子770からゲインコードベクトルの第1成分G1を入
力し乗算器890へ出力する。入力端子780からゲイ
ンコードベクトルの第2成分G2 を入力し乗算器880
へ出力する。乗算器790では、〈Sa,Sa〉に1/
Nを掛け、ルート計算回路840へ出力し、ルート計算
回路840では、〈Sa,Sa〉/Nのルートを計算
し、除算器850へ出力する。ここでNはサブフレーム
長(例えば40サンプル)である。除算器850では、
XRMSを(〈Sa,Sa〉/N)1/2で割り、商を乗
算器890へ出力し、乗算器890でXRMS/(〈S
a,Sa〉/N)1/2とゲインコードベクトルの第1成
分G1を掛け、減算器900へ出力する。除算器800
では〈Sa,Sc〉を〈Sa,Sa〉で割り、商を乗算
器810と乗算器910へ出力する。乗算器810で
は、〈Sa,Sc〉/〈Sa,Sa〉と〈Sa,Sc〉
とを掛け、減算器820へ出力する。減算器820で、
〈Sc,Sc〉から〈Sa,Sc〉2/〈Sa,Sa〉
を減算し、乗算器830へ出力し、乗算器830で1/
Nを掛け、ルート計算回路860へ出力し、ルート計算
回路860でルートを計算し、除算器870へ出力す
る。除算器870でXRMSを{(〈Sc,Sc〉−
〈Sa,Sc〉2/〈Sa,Sa〉)/N}1/2で割り、
商を乗算器880へ出力し、乗算器880でゲインコー
ドベクトルの第2成分G2を掛け、乗算器910と出力
端子930へ出力する。乗算器910で、G2・XRM
S/{(〈Sc,Sc〉−〈Sa,Sc〉2/〈Sa,
Sa〉)/N}1/2と〈Sa,Sc〉/〈Sa,Sa〉
を掛け、減算器900へ出力し、減算器900でG1
XRMS/(〈Sa,Sa〉/N)1/2から減算し、出
力端子920へ出力する。
【0102】以上で実施例の説明を終える。
【0103】ゲインコードブックは、必ずしも2次元コ
ードブックであるとは、限らない。例えば、適応コード
ブックのゲインを量子化するための1次元コードブック
と音源コードブックのゲインを量子化するための1次元
コードブックをゲインコードブックとして用いてもよ
い。
【0104】音源コードブックは、前記文献3のように
乱数信号から構成しても良いし、トレーニング信号を用
いて予め学習して構成してもよい。
【0105】
【発明の効果】以上で述べたように、第1の発明の特徴
は、適応コードベクトルと音源コードベクトルのゲイン
として最適ゲインを用いて音源コードブックを探索して
いく際に、数16を直接計算するのではなく、すべて相
関演算による数17を用いることにある。
【0106】今、サブフレーム長をN、音源コードブッ
クサイズをBビットとすると、前記数7においては、S
dに〈Sad,Scj〉/〈Sad,Sad〉を掛けるた
め、N・2B回乗算が必要であったが、前記数8におい
ては、〈Sad,Scj2/〈Sad,Sad〉を計算す
るためのN回の乗算で済むため、N(2B−1)回の乗
算の低減化ができ、しかも、得られる音質は変わらない
という大きな効果を併せ持つ。
【0107】また、第2の発明の特徴は、正規化された
ゲインをゲインコードブックとして用いることにある。
正規化によりゲインの分散は減るため、正規化されたゲ
インをコードベクトルにもつゲインコードブックは良い
量子化特性を持ち、その結果、高品質な符号化音声が得
られるという大きな効果がある。
【図面の簡単な説明】
【図1】第1の発明による音声符号化方式を実施する符
号化器の一例を示すブロック図である。
【図2】第1の発明による音声符号化方式を実施する復
号化器の一例を示すブロック図である。
【図3】第2の発明による音声符号化方式を実施する復
号化器の一例を示すブロック図である。
【図4】第2の発明による音声符号化方式を実施する符
号化器の一例を示すブロック図である。
【図5】図4のゲイン計算回路の一例を示すブロック図
である。
【符号の説明】
100 入力端子 110 線形予測器 120 適応コードブック 130 適応コードブック探索回路 140 音源コードブック 150 重み付け合成フィルタ 160 相互相関回路 170 自己相関回路 180 相互相関回路 190 直交化自己相関回路 200 (相互)2/(自己)最大値探索回路 210 ゲインコードブック 220 ゲインコードブック探索回路 230 マルチプレクサ 240 デマルチプレクサ 250 適応コードブック 260 音源コードブック 270 ゲインコードブック 280 乗算器 290 乗算器 300 加算器 310 合成フィルタ 320 出力端子 400 入力端子 410 サブフレーム分割回路 420 線形予測分析回路 430 自己相関回路 440 原音RMS量子化器 450 適応コードブック 460 適応コードブック探索回路 470 音源コードブック 480 音源コードブック探索回路 490 自己相関回路 500 相互相関回路 510 自己相関回路 520 ゲイン計算回路 522 乗算器 524 乗算器 526 加算器 530 ゲインコードブック 540 重み付け合成フィルタ 545 減算器 550 2乗誤差計算回路 560 マルチプレクサ 570 デマルチプレクサ 580 原音RMS復号化器 590 適応コードブック 600 音源コードブック 610 ゲインコードブック 620 重み付け合成フィルタ 630 重み付け合成フィルタ 640 自己相関回路 650 相互相関回路 660 自己相関回路 670 ゲイン計算回路 680 乗算器 690 乗算器 700 加算器 710 合成フィルタ 720 出力端子 730 入力端子 740 入力端子 750 入力端子 760 入力端子 770 入力端子 780 入力端子 790 乗算器 800 除算器 810 乗算器 820 減算器 830 乗算器 840 ルート計算回路 850 除算器 860 ルート計算回路 870 除算器 880 乗算器 890 乗算器 900 減算器 910 乗算器 920 出力端子 930 出力端子
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 9/14 G10L 9/18

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】一定間隔のフレームに分割された音声信号
    を入力し、前記入力音声信号の線形予測パラメータを求
    める線形予測分析部と、前記入力音声信号の長期相関を
    利用する適応コードブックと、前記入力音声信号の励振
    音源を表す音源コードブックと、前記適応コードブック
    のゲインと前記音源コードブックのゲインを量子化する
    ゲインコードブックを有する音声符号化方式において、
    前記音源コードブックのコードベクトルと前記線形予測
    パラメータとで合成される合成信号の自己相関を、前記
    適応コードブックのコードベクトルと前記線形予測パラ
    メータとで合成される合成信号の自己相関と、前記適応
    コードブックのコードベクトルの合成信号と前記音源コ
    ードブックのコードベクトルの合成信号との相互相関と
    を用いて修正し、前記修正した自己相関と、前記入力音
    声信号から前記適応コードブックのコードベクトルの合
    成信号を引いた信号と前記音源コードブックのコードベ
    クトルの合成信号との相互相関とを用いることにより、
    前記音源コードブックを探索することを特徴とする音声
    符号化方式。
  2. 【請求項2】一定間隔のフレームに分割された音声信号
    を入力し、前記入力音声信号のスペクトルパラメータを
    求める線形予測分析部と、前記入力音声信号の長期相関
    を利用する適応コードブックと、前記入力音声信号の励
    振音源を表す音源コードブックと、前記適応コードブッ
    クのゲインと前記音源コードブックのゲインを量子化す
    るゲインコードブックを有する音声符号化方式におい
    て、前記ゲインコードブックのコードベクトルを探索す
    る際に、前記音源コードベクトルの合成信号の自己相関
    と、前記適応コードベクトルの合成信号と前記音源コー
    ドベクトルの合成信号との相互相関と、前記音源コード
    ベクトルの合成信号の自己相関と、前記入力音声信号の
    自己相関、または、前記入力音声信号の自己相関の推定
    値とから計算される正規化係数を用いることを特徴とす
    る音声符号化方式。
JP3103263A 1991-02-26 1991-02-26 音声符号化方式 Expired - Lifetime JP2776050B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP3103263A JP2776050B2 (ja) 1991-02-26 1991-02-26 音声符号化方式
CA002061803A CA2061803C (en) 1991-02-26 1992-02-25 Speech coding method and system
EP98119722A EP0898267B1 (en) 1991-02-26 1992-02-25 Speech coding system
DE69232892T DE69232892T2 (de) 1991-02-26 1992-02-25 Sprachkodierungssystem
EP92103180A EP0501420B1 (en) 1991-02-26 1992-02-25 Speech coding method and system
DE69229364T DE69229364T2 (de) 1991-02-26 1992-02-25 Einrichtung und Verfahren zur Sprachkodierung
US07/841,827 US5485581A (en) 1991-02-26 1992-02-26 Speech coding method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3103263A JP2776050B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH04270400A JPH04270400A (ja) 1992-09-25
JP2776050B2 true JP2776050B2 (ja) 1998-07-16

Family

ID=14349551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3103263A Expired - Lifetime JP2776050B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Country Status (5)

Country Link
US (1) US5485581A (ja)
EP (2) EP0898267B1 (ja)
JP (1) JP2776050B2 (ja)
CA (1) CA2061803C (ja)
DE (2) DE69229364T2 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06186998A (ja) * 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式
JP3099852B2 (ja) * 1993-01-07 2000-10-16 日本電信電話株式会社 励振信号の利得量子化方法
JP2591430B2 (ja) * 1993-06-30 1997-03-19 日本電気株式会社 ベクトル量子化装置
EP0657874B1 (en) * 1993-12-10 2001-03-14 Nec Corporation Voice coder and a method for searching codebooks
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
JP3179291B2 (ja) * 1994-08-11 2001-06-25 日本電気株式会社 音声符号化装置
JP3328080B2 (ja) * 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
JP3303580B2 (ja) * 1995-02-23 2002-07-22 日本電気株式会社 音声符号化装置
JPH08272395A (ja) * 1995-03-31 1996-10-18 Nec Corp 音声符号化装置
JPH08292797A (ja) * 1995-04-20 1996-11-05 Nec Corp 音声符号化装置
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
US5673129A (en) * 1996-02-23 1997-09-30 Ciena Corporation WDM optical communication systems with wavelength stabilized optical selectors
US5943152A (en) * 1996-02-23 1999-08-24 Ciena Corporation Laser wavelength control device
US6111681A (en) 1996-02-23 2000-08-29 Ciena Corporation WDM optical communication systems with wavelength-stabilized optical selectors
JP3157116B2 (ja) * 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
JP3593839B2 (ja) 1997-03-28 2004-11-24 ソニー株式会社 ベクトルサーチ方法
CA2233896C (en) * 1997-04-09 2002-11-19 Kazunori Ozawa Signal coding system
DE19729494C2 (de) * 1997-07-10 1999-11-04 Grundig Ag Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte
JP4800285B2 (ja) * 1997-12-24 2011-10-26 三菱電機株式会社 音声復号化方法及び音声復号化装置
EP1686563A3 (en) 1997-12-24 2007-02-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for speech decoding
US6807527B1 (en) 1998-02-17 2004-10-19 Motorola, Inc. Method and apparatus for determination of an optimum fixed codebook vector
JP3553356B2 (ja) * 1998-02-23 2004-08-11 パイオニア株式会社 線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体
TW439368B (en) * 1998-05-14 2001-06-07 Koninkl Philips Electronics Nv Transmission system using an improved signal encoder and decoder
US6260010B1 (en) 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
SE519563C2 (sv) * 1998-09-16 2003-03-11 Ericsson Telefon Ab L M Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
SE9901001D0 (en) * 1999-03-19 1999-03-19 Ericsson Telefon Ab L M Method, devices and system for generating background noise in a telecommunications system
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US6789059B2 (en) * 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
ATE447227T1 (de) * 2006-05-30 2009-11-15 Koninkl Philips Electronics Nv Linear-prädiktive codierung eines audiosignals
JPWO2008018464A1 (ja) * 2006-08-08 2009-12-24 パナソニック株式会社 音声符号化装置および音声符号化方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1229681A (en) * 1984-03-06 1987-11-24 Kazunori Ozawa Method and apparatus for speech-band signal coding
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
IL94119A (en) * 1989-06-23 1996-06-18 Motorola Inc Digital voice recorder
US4980916A (en) * 1989-10-26 1990-12-25 General Electric Company Method for improving speech quality in code excited linear predictive speech coding
DE69133296T2 (de) * 1990-02-22 2004-01-29 Nec Corp Sprachcodierer
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式

Also Published As

Publication number Publication date
DE69232892T2 (de) 2003-05-15
JPH04270400A (ja) 1992-09-25
EP0898267A2 (en) 1999-02-24
EP0501420A2 (en) 1992-09-02
DE69229364T2 (de) 1999-11-04
CA2061803A1 (en) 1992-08-27
US5485581A (en) 1996-01-16
EP0501420B1 (en) 1999-06-09
DE69229364D1 (de) 1999-07-15
EP0898267A3 (en) 1999-03-03
CA2061803C (en) 1996-10-29
EP0501420A3 (en) 1993-05-12
DE69232892D1 (de) 2003-02-13
EP0898267B1 (en) 2003-01-08

Similar Documents

Publication Publication Date Title
JP2776050B2 (ja) 音声符号化方式
JP2940005B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3003531B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3256215B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH08320700A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3226180B2 (ja) 音声のピッチ周期符号化法
JP2658794B2 (ja) 音声符号化方式
JP3092200B2 (ja) 音声符号化方式
JP3144244B2 (ja) 音声符号化装置
JP3335650B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100501

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110501

Year of fee payment: 13

EXPY Cancellation because of completion of term