JP3089769B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3089769B2
JP3089769B2 JP03319314A JP31931491A JP3089769B2 JP 3089769 B2 JP3089769 B2 JP 3089769B2 JP 03319314 A JP03319314 A JP 03319314A JP 31931491 A JP31931491 A JP 31931491A JP 3089769 B2 JP3089769 B2 JP 3089769B2
Authority
JP
Japan
Prior art keywords
codebook
excitation
sound source
adaptive
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03319314A
Other languages
English (en)
Other versions
JPH05216500A (ja
Inventor
俊樹 宮野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP03319314A priority Critical patent/JP3089769B2/ja
Priority to EP92120573A priority patent/EP0545386B1/en
Priority to DE69228858T priority patent/DE69228858T2/de
Priority to CA002084338A priority patent/CA2084338C/en
Publication of JPH05216500A publication Critical patent/JPH05216500A/ja
Application granted granted Critical
Publication of JP3089769B2 publication Critical patent/JP3089769B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0003Backward prediction of gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を低いビット
レート、特に8kb/s以下で、比較的少ない演算量に
より高品質に符号化するための音声符号化装置に関する
ものである。
【0002】
【従来の技術】従来、励振音源信号を低い乱数からなる
音源コードブックによりベクトル量子化する音声符号化
方式として、Manfred R.Shroeder
andBishnu S.Atalによる“CODE−
EXCITED LINEAR PRE−DICTIO
N(CELP):HIGH−QUALITY SPEE
CH AT VERY LOW BIT RATES”
(Proc.ICASSP,pp.937−940,1
985)と題した論文(文献1)に記載されているCE
LP方式が知られている。また、適応コードブックを有
するCELP方式として、W.B.Kleijin,
D.J.Krasinski and R.H.Ket
chumによる“IMPROVED SPEECHQU
ALITYAND EFFICIENT VECTOR
QUANTIZATION INSELP”(Pro
c.ICASSP,pp.155−158,1988)
と題した論文(文献2)に記載されている。適応コード
ブックを有するCELP方式は、一定間隔のフレームに
分割された音声信号を入力し、前記入力音声信号のスペ
クトルパラメータを求める線形予測分析部と、過去に定
められた音源信号を持つ適応コードブックと、前記入力
音声信号の励振音源をベクトル量子化にするための乱数
からなる音源コードブックを有し、フレームをさらに等
分割したサブレーム毎に前記入力音声信号と適応コード
ブックの合成信号を用いて適応コードベクトルを選択
し、次に、前記入力信号と前記選択された適応コードベ
クトルの合成信号と前記音源コードブックの合成信号を
用いて、音源コードベクトルを選出する音声符号化方式
である。
【0003】
【発明が解決しようとする課題】しかしながら前記従来
方式は、前記音源コードブックの探索に非常に多くの演
算量を必要とする。また、前記適応コードブックは、前
記音源コードブックとは独立に決定されているため、高
いSN比較を得ることができない。また、前記適応コー
ドブックを探索する時と前記音源コードブックを探索す
る時、量子化されていないゲインを用いて探索している
が、ゲインの量子化値全てに対して、前記適応コードブ
ックと前記音源コードブックを探索した方がより高いS
N比を得ることができる。さらに、8kb/s以下の低
いビットレートでは、音源コードブックのサイズが小さ
すぎ十分に良好な音質を得ることができない。
【0004】本発明の目的は、上述した問題を解決し、
比較的少ない演算量により8kb/s以下で音質の良好
な音声符号化装置を提供することにある。
【0005】
【課題を解決するための手段】第1の発明による音声符
号化装置は、一定間隔のフレームに分割された音声信号
を入力する音声入力部と、前記入力音声信号のスペクト
ルパラメータを求める線形予測分析部と、過去に定めら
れた音源信号を持つ適応コードブックと、前記入力音声
信号の励振音源を多段ベクトル量子化するための複数種
の音源コードブックと、前記適応コードブック並びに前
記複数種の音源コードブックのそれぞれのゲインを量子
化するためのゲインコードブックとを有し、フレームを
さらに分割したサブフレーム毎に前記適応コードブック
と前記複数種の音源コードブックのそれぞれから当該サ
ブフレームの音源信号を形成するコードベクトルの組合
せを探索する際に、前記入力音声信号と前記線形予測分
析部により定まるスペクトルパラメータとを用いて前記
適応コードブックから予め定められた数の適応コードベ
クトルの候補を選出し、前記入力音声信号と前記スペク
トルパラメータと前記選出された適応コードベクトルの
候補とを用いて前記複数種の音源コードブックのそれぞ
れから予め定められた数の音源コードベクトルの候補を
選出し、前記入力音声信号と前記スペクトルパラメータ
とを用いて前記選出された適応コードベクトルの候補と
前記選出された各音源コードベクトルとの候補の中から
当該サブフレームの音源信号を形成するコードベクトル
の組合せを選択することを特徴とする。
【0006】第2の発明による音声符号化装置は、一定
間隔のフレームに分割された音声信号を入力する音声入
力部と、前記入力音声信号のスペクトルパラメータを求
める線形予測分析部と、過去に定められた音源信号を持
つ適応コードブックと、前記入力音声信号の励振音源を
多段ベクトル量子化するための複数種の音源コードブッ
クと、前記適応コードブック並びに前記複数種の音源コ
ードブックのそれぞれのゲインを量子化するためのゲイ
ンコードブックとを有し、フレームをさらに分割したサ
ブフレーム毎に前記適応コードブックと前記複数種の音
源コードブックのそれぞれから当該サブフレームの音源
信号を形成するコードベクトルの組合せを探索する際
に、前記入力音声信号と前記線形予測分析部により定ま
るスペクトルパラメータとを用いて前記適応コードブッ
クから予め定められた数の適応コードベクトルの候補を
選出し、前記入力音声信号と前記スペクトルパラメータ
と前記選出された適応コードベクトルの候補とを用いて
前記複数種の音源コードブックのそれぞれから予め定め
られた数の音源コードベクトルの候補を選出し、前記入
力音声信号と前記スペクトルパラメータと前記ゲインコ
ードブックとを用いて前記選出された適応コードベクト
ルの候補と前記選出された各音源コードベクトルとの候
補の中から当該サブフレームの音源信号を形成するコー
ドベクトルの組合せを選択することを特徴とする。
【0007】第3の発明による音声符号化装置は、第1
の発明において、前記複数種の音源コードブックの中
に、伝送すべきビット数よりもビット数の大きな音源ス
ーパーコードブックを少なくとも一つ所有し、前記音源
スーパーコードブックから定められた数の候補を選出す
る際に、既に選出された音源コードブックの候補あるい
は音源スーパーコードブックの候補に応じて候補を選出
することを特徴とする。
【0008】第4の発明による音声符号化装置は、第2
の発明において、前記複数種の音源コードブックの中
に、伝送すべきビット数よりもビット数の大きな音源ス
ーパーコードブックを少なくとも一つ所有し、前記音源
スーパーコードブックから定められた数の候補を選出す
る際に、既に選出された音源コードブックの候補あるい
は音源スーパーコードブックの候補に応じて候補を選出
することを特徴とする。
【0009】
【作用】簡略化のため、2種の音源コードブックにより
励振音源信号を2段ベクトル量子化する場合に対して説
明する。
【0010】第1の発明による音声符号化装置の作用を
示す。まず、次の誤差E0 が小さいものから順にL0
の適応コードベクトルの候補を選択する。
【0011】
【数1】
【0012】ここで、zは、聴感重み付け入力信号から
影響信号を引いた信号、sad は、遅れdの適応コード
ベクトルad の聴感重み付け合成信号、β0 は適応コー
ドベクトルの逐次最適ゲイン、‖‖はユークリッドノル
ムを表す。適応コードベクトルの逐次最適ゲインβ
0 は、次式で与えられる。
【0013】
【数2】
【0014】この式を、(1)式に代入して次式を得
る。
【0015】
【数3】
【0016】〈,〉は内積を表す。
【0017】次に、選ばれたL0 個の適応コードベクト
ル各々に対して、次の誤差にE1 が小さい順にL1 個の
第1音源コードベクトルの候補を選択する。
【0018】
【数4】
【0019】
【数5】
【0020】γ0 は、第1音源コードベクトルの逐次最
適ゲインであり、zaは、za=z−β0 sad であ
る。
【0021】従って、
【0022】
【数6】
【0023】この式を、(4)式に代入して次式を得
る。
【0024】
【数7】
【0025】次に選ばれたL0 個の適応コードベクトル
各々に対して、次の誤差E2 が小さい順にL2 個の第2
音源コードベクトルの候補を択する。
【0026】
【数8】
【0027】
【数9】
【0028】δ0 は、第2音源コードベクトルの逐次最
適ゲインである。従って、
【0029】
【数10】
【0030】この式を、(7)式に代入して次式を得
る。
【0031】
【数11】
【0032】最後に、選択された適応コードベクトルの
候補と、選択された第1、2音源コードベクトルの候補
の組合せ全てに対して、次の誤差Eを計算して、Eが最
小となる候補の組合せを探索する。
【0033】
【数12】
【0034】ここで、β、γ、δは、それぞれ適応コー
ドベクトル、第1、2音源コードベクトルの同時最適ゲ
インである。従って、
【0035】
【数13】
【0036】(11)式を、(10)式に代入して、次
式を得る。
【0037】
【数14】
【0038】また、上の誤差Eを計算する際、各音源コ
ードベクトル、γ、δに特別な制限つけても良い。例え
ば、γとδが等しいという制限をつけた場合の誤差E
は、次のようになる。
【0039】
【数15】
【0040】第2の発明による音声符号化装置の作用を
示す。適応コードブック、第1、第2音源コードブック
の候補選択は、第1の発明と同様である。
【0041】選択された適応コードベクトルの候補と、
選択された第1、2音源コードベクトルの候補とゲイン
コードベクトル全てとの組合せ全てに対し、次の誤差E
を計算して、Eが最小となる候補の組合せ探索する。
【0042】
【数16】
【0043】ここで、(Qβk ,Qγk ,Qδk )は、
インディックスkのゲインコードベクトルである。
【0044】(Qβk ,Qγk ,Qδk )として、ゲイ
ンコードベクトルそのものではなく、ゲインコードベク
トルを、量子化されたパワーと適応コードベクトルの重
み付け合成信号と第1,2音源コードベクトルの重み付
け合成信号から計算される行列により変換したものを用
いても良い。また、全てのゲインコードベクトルに対し
てEを計算して最小値を探索するには、非常に多くの演
算量を必要とするので、演算量を低減するために、ゲイ
ンコードブックの予備選択を行っても良い。ゲインコー
ドブックの予備選択は、例えば、ゲインコードベクトル
の第1成分が、適応コードベクトルの逐次最適ゲインに
近いものを予め定められた数だけ選択することにより行
う。
【0045】第3の発明による音声符号化装置の作用を
示す。適応コードベクトル第1音源コードベクトルの候
補の選択は、第1の発明と同様である。第1音源コード
ベクトルの候補のインデックスiに応じて決定されるイ
ンデックスの集合F2 (i)で表される第2音源スーパ
ーコードブックの一部の中から、第1の発明と同様にし
て、第2音源コードベクトルの候補を選択する。ここ
で、スーパーコードブックは、伝送すべきビット数より
も多いビット数を持つコードブックである。最後に、第
1の発明と同様にして、候補の組合せ全ての中から、最
適な組合せを選択する。ここで、第2音源コードベクト
ルの候補を選択せず、適応コードベクトルの候補と第1
音源コードベクトルの候補とF2 (i)で表される第2
音源スーパーコードブックの一部の中の第2音源コード
ベクトル全てとの組合せの中から、最適な組合せを、第
1の発明と同様にして選択しても良い。
【0046】第4の発明による音声符号化装置の作用を
示す。適応コードベクトルと第1音源コードベクトルの
候補の選択は、第1の発明と同様である。第1音源コー
ドベクトルの候補のインデックスiに応じて決定される
インデックスの集合F2 (i)で表される第2音源スー
パーコードブックの一部の中から、第1の発明と同様に
して、第2音源コードベクトルの候補を選択する。最後
に、第2の発明と同様にして、候補の組合せ全ての中か
ら最適な組合せ選択する。ここで、第2音源コードベク
トルの候補を選択せず、適応コードベクトルの候補と第
1音源コードベクトルの候補とF2 (i)で表される第
2音源スーパーコードブックの一部の中の第2音源コー
ドベクトル全てとの組合せの中から、最適な組合せを、
第2の発明と同様にして選択しても良い。
【0047】また、第1から4までの発明において、サ
ブフレーム毎に、適応コードベクトルと第1、2音源コ
ードベクトルとゲインコードベクトルを決定してしまわ
ずに、候補を残しておき、フレーム全体での誤差が最小
になる候補の組合せをディレイドディシジョン方式を適
用しても良い。
【0048】
【実施例】簡略化のため、2種の音源コードブックによ
り励振音源信号を2段ベクトル量子化する場合に対して
説明する。また、第2音源コードブックにスーパーコー
ドブックを用いるものとする。
【0049】図1は第1の発明による音声符号化装置の
一実施例を示すブロック図である。図において、入力端
子100からフレーム(例えば、40ms)毎に分割さ
れた音声信号を入力し、線形予測分析回路110とサブ
フレーム分割回路120へ出力する。線形予測分析回路
110で、線形予測分析を行い、スペクトルパラメータ
を、重み付けフィルタ130と影響信号減算回路140
と適応コードブック候補選択回路150と第1音源コー
ドブック候補選択回路160と第2音源コードブック候
補選択回路170とマルチプレクサ230へ出力する。
サブフレーム分割回路120からサブフレーム長(例え
ば8ms)に分割された音声信号を重み付けフィルタ1
30へ出力し、重み付けフイルタ130では、音声信号
聴感重み付けし、影響信号減算回路140へ出力する。
影響信号減算回路140では前のサブフレームから重み
付け影響信号を減算し、適応コードブック候補選択回路
150と第1音源コードブック候補選択回路160と第
2音源コードブック候補選択回路170とゲインコード
ブック探索回路210へ出力する。適応コードブック1
75は、適応コードベクトルを適応コードブック候補選
択回路150へ出力する。適応コードブック候補選択回
路150では、(3)式に従って、適応コードベクトル
の候補を選択し、第1音源コードブック候補選択回路1
60と第2音源コードブック候補選択回路170と最適
組合せ探索回路200へ適応コードベクトルの候補の重
み付け合成信号とディレイを出力する。第1音源コード
ブック180から、第1音源コードベクトルを第1音源
コードブック候補選択回路160へ出力する。第1音源
コードブック候補選択回路160では、第1音源コード
ベクトルの候補(6)式により選出し、最適組合せを探
索回路200へ第1音源コードベクトルの候補の重み付
け合成信号とインデックスを出力する。第2音源コード
ブック190から、第2音源コードベクトルを第2音源
コードブック候補選択回路170へ出力する。第2音源
コードブック候補選択回路170では、第2音源コード
ベクトルの候補を(9)式により選出し、最適組合せ探
索回路200へ第2音源コードベクトルの候補の重み付
け合成信号とインデックスを出力する。最適組合せ探索
回路200では、(14)式に従って、最適な候補の組
合せを探索し、適応コードベクトルと第1、2音源コー
ドベクトルのインデックスをマルチプレクサ230へ、
各コードベクトルの重み付け合成信号をゲインコードブ
ック探索回路210へ出力する。ゲインコードブック2
20からは、ゲインコードベクトルがゲインコードブッ
ク探索回路210へ出力される。ゲインコードブック探
索回路210では、最適なゲインコードベクトルが探索
され、最適なゲインコードベクトルのインデックスがマ
ルチプレクサ230へ出力される。
【0050】図は第2の発明による音声符号化装置の一
実施例を示すブロック図である。図において、入力端子
300からフレーム(例えば、40ms)毎に分割され
た音声信号を入力し、線形予測分析回路310とサブフ
レーム分割回路320へ出力する。線形予測分析回路3
10で、線形予測分析を行い、スペクトルパラメータ
を、重み付けフィルタ330と影響信号減算回路340
と適応コードブック候補選択回路350と第1音源コー
ドブック候補選択回路360と第2音源コードブック候
補選択回路370とマルチプレクサ420へ出力する。
サブフレーム分割回路320からサブフレーム長(例え
ば8ms)に分割された音声信号を重み付けフィルタ3
30へ出力し、重み付けフィルタ330では、音声信号
聴感重み付けし、影響信号減算回路340へ出力する。
影響信号減算回路340では前のサブフレームからの重
み付け影響信号を減算し、適応コードブック候補選択回
路350と第1音源コードブック候補選択回路360と
第2音源コードブック候補選択回路370とゲイン込み
最適組合せ探索回路400へ出力する。適応コードブッ
ク375は、適応コードベクトルを適応コードブック候
補選択回路350へ出力する。適応コードブック候補選
択回路350では、(3)式に従って、適応コードベク
トルの候補を選択し、第1音源コードブック候補選択回
路360と第2音源コードブック候補選択回路370と
ゲイン込み最適組合せ探索回路400へ適応コードベク
トルの候補の重み付け合成信号とディレイを出力する。
第1音源コードブック380から、第1音源コードベク
トルを第1音源コードブック候補選択回路360へ出力
する。第1音源コードブック候補選択回路360では、
第1音源コードベクトルの候補を(6)式により選出
し、ゲイン込み最適組合せ探索回路400へ第1音源コ
ードベクトルの候補の重み付け合成信号とインデックス
を出力する。第2音源コードブック390から、第2音
源コードベクトルを第2音源コードブック候補選択回路
370へ出力する。第2音源コードブック候補選択回路
370では、第2音源コードベクトルの候補を(9)式
より選出し、ゲイン込み最適組合せ探索回路400へ第
2音源コードベクトルの候補の重み付け合成信号とイン
デックスを出力する。ゲインコードブック410から
は、ゲインコードベクトルがゲイン込み最適組合せ探索
回路400へ出力される。ゲイン込み最適組合せ探索回
路400では、(16)式に従って、最適な候補の組合
せを探索し、適応コードベクトルと第1、2音源コード
ベクトルとゲインコードベクトルのインデックスをマル
チプレクサ420へ出力する。
【0051】図3は第3の発明による音声符号化装置の
一実施例を示すブロック図である。図において、入力端
子500からフレーム(例えば、40ms)毎に分割さ
れた音声信号を入力し、線形予測分析回路510とサブ
フレーム分割回路520へ出力する。線形予測分析回路
510で、線形予測分析を行い、スペクトルパラメータ
を、重み付けフィルタ530と影響信号減算回路540
と適応コードブック候補選択回路550と第1音源コー
ドブック候補選択回路560と第2音源コードブック候
補選択回路570とマルチプレクサ630へ出力する。
サブフレーム分割回路520からサブフレーム長(例え
ば8ms)に分割された音声信号を重み付けフィルタ5
30へ出力し、重み付けフィルタ530では、音声信号
を聴感重み付けし、影響信号減算回路540へ出力す
る。影響信号減算回路540では前のサブフレームから
の重み付け影響信号を減算し、適応コードブック候補選
択回路550と第1音源コードブック候補選択回路56
0と第2音源コードブック候補選択回路570とゲイン
コードブック探索回路610へ出力する。適応コードブ
ック575は、適応コードベクトルを適応コードブック
候補選択回路550へ出力する。適応コードブック候補
選択回路550では、(3)式に従って、適応コードベ
クトルの候補を選択し、第1音源コードブック候補選択
回路560と第2音源コードブック候補選択回路570
と最適組合せ探索回路600へ適応コードベクトルの候
補の重み付け合成信号とディレイを出力する。第1音源
コードブック580からは、第1音源コードベクトル第
1音源コードブック候補選択回路560へ出力される。
第1音源コードブック候補選択回路560では、第1音
源コードベクトルの候補を(6)式により選出し、最適
組合せ探索回路600へ第1音源コードベクトルの候補
の重み付け合成信号とインデックスを出力し、第2音源
スーパーコードブック590へインデックスのみを出力
する。第2音源スーパーコードブック590では、入力
した第1音源コードベクトルのインデックスに応じて決
定されるインデックスを持つ第2音源コードベクトルを
第2音源コードブック候補選択回路570へ出力する。
第2音源コードブック候補選択回路570では、第2音
源コードベクトルの候補を(9)式により選出し、最適
組合せ探索回路600へ第2音源コードベクトルの候補
の重み付け合成信号とインデックスを出力する。最適組
合せ探索回路600では、(14)式に従って、最適な
候補の組合せを探索し、適応コードベクトルと第1、2
音源コードベクトルのインデックスをマルチプレクサ6
30へ、各コードベクトルの重み付け合成信号をゲイル
コードブック探索回路610へ出力する。ゲインコード
ブック620からは、ゲインコードベクトルがゲインコ
ードブック探索回路610へ出力される。ゲインコード
ブック探索回路610では、最適なゲインコードベクト
ルが探索され、最適なゲインコードベクトルのインデッ
クスがマルチプレクサ630へ出力される。
【0052】図4は第4の発明による音声符号化装置の
一実施例を示すブロック図である。図において、入力端
子700からフレーム(例えば、40ms)毎に分割さ
れた音声信号を入力し、線形予測分析回路710とサブ
フレーム分割回路720へ出力する。線形予測分析回路
710で、線形予測分析を行い、スペクトルパラメータ
を、重み付けフィルタ730と影響信号減算回路740
と適応コードブック候補選択回路750と第1音源コー
ドブック候補選択回路760と第2音源コードブック候
補選択回路770とマルチプレクサ820へ出力する。
サブフレーム分割回路720からサブフレーム長(例え
ば8ms)に分割された音声信号を重み付けフィルタ7
30へ出力し、重み付けフィルタ730では、音声信号
を聴感重み付けし、影響信号減算回路740へ出力す
る。影響信号減算回路740では前のサブフレームから
の重み付け影響信号を減算し、適応コードブック候補選
択回路750と第1音源コードブック候補選択回路76
0と第2音源コードブック候補選択回路770とゲイン
込み最適組合せ探索回路800へ出力する。適応コード
ブック775は、適応コードベクトルを適応コードブッ
ク候補選択回路750へ出力する。適応コードブック候
補選択回路750では、(3)式に従って、適応コード
ベクトルの候補を選択し、第1音源コードブック候補選
択回路760と第2音源コードブック候補選択回路77
0とゲイン込み最適組合せ探索回路800へ適応コード
ベクトルの候補の重み付け合成信号とディレイを出力す
る。第1音源コードブック780からは、第1音源コー
ドベクトルが第1音源コードブック候補選択回路760
に出力される。第1音源コードブック候補選択回路76
0では、第1音源コードベクトルの候補を(6)式によ
り選出し、ゲイン込み最適組合せ探索回路800へ第1
音源コードベクトルの候補の重み付け合成信号とインデ
ックスを、第2音源スーパーコードブック790へイン
デックスのみを出力する。第2音源スーパーコードブッ
ク790では、入力した第1音源コードベクトルのイン
デックスに応じて決定されるインデックスを持つ第2音
源コードベクトルを第2音源コードブック候補選択回路
770へ出力する。第2音源コードブック候補選択回路
770では、第2音源コードベクトルの候補を(9)式
により選出し、ゲイン込み最適組合せ探索回路800へ
第2音源コードベクトルの候補の重み付け合成信号とイ
ンデックスを出力する。ゲインコードブック810から
は、ゲインコードベクトルがゲイン込み最適組合せ探索
回路800へ出力される。ゲイン込み最適組合せ探索回
路800では、(16)式に従って、最適な候補の組合
せを探索し、適応コードベクトルと第1、2音源コード
ベクトルとゲインコードベクトルのインデックスをマル
チプレクサ820へ出力する。
【0053】第1から4までの発明において、音源コー
ドベクトルの重み付け合成信号sei の自己相関を求め
る際、演算量を低減化するために次のようにして求めて
も良い。
【0054】
【数17】
【0055】ただし、hhは、重み付け合成フィルタの
インパルス応答の自己相関関数、eei は、インデック
スiの音源コードベクトルの自己相関関数、imは、イ
ンパルス応答長である。
【0056】また、音源コードベクトルの重み付け合成
信号sei と任意のベクトルυとの相互相関を求める
際、演算量を低減するために次のようにして求めても良
い。
【0057】
【数18】
【0058】ただし、Hは、重み付け合成フィルタのイ
ンパルス応答行列である。
【0059】適応コードベクトルの重み付け合成信号s
d と任意のベクトルυとの相互相関を求める際にも、
同様にして、次のように求めても良い。
【0060】
【数19】
【0061】第1、3の発明において、最適組合せ探索
回路200、300で最適な組合せを探索する際、作用
の欄で前述したように第1、2音源コードベクトルのゲ
イン、γ,δに特別な制限をつけても良い。本実施例で
は、γとδが等しいという制限をつけているが、他の制
限をつけても良いし、制限をつけなくても良い。
【0062】第2、4の発明において、ゲイン最適組合
せ探索回路400、800で最適な組合せを探索する
際、作用の欄で前述したように、(Qβk 、Qγk 、Q
δk )として、ゲインコードベクトルそのものではな
く、ゲインコードベクトルを、量子化されたパワと適応
コードベクトルの重み付け合成信号と第1,2音源コー
ドベクトルの重み付け合成信号から計算される行列によ
り変換したものを用いても良い。
【0063】また、第2、4の発明において、ゲイン最
適組合せ探索回路400、800で最適な組合せを探索
する際、作用の欄で前述したように、全てのゲインコー
ドベクトルに対して誤差Eを計算して最小値を探索する
には、非常に多くの演算量を必要とするので、演算量を
低減するために、ゲインコードブックの予備選択を行っ
ても良い。ゲインコードブックの予備選択は、例えば、
ゲインコードベクトルの第1成分が、適応コードベクト
ルの逐次最適ゲインに近いものを予め定められた数だけ
選択することにより行う。
【0064】また、第1から4までの発明において、サ
ブフレーム毎に、適応コードベクトルと第1、2音源コ
ードベクトルとゲインコードベクトルを一意に決定して
しまわずに、候補を残しておき、フレーム全体での累積
誤差が最小になる候補の組合せを選択するディレイトデ
ィシジョン方式を適用しても良い。
【0065】
【発明の効果】以上で述べたように、第1の発明には、
前記適応コードブックと複数種の前記音源コードブック
から候補を選択し、前記各候補の組合せの中から最適な
組合せを選択することにより、比較的少ない演算量で、
十分良好な音質を得ることができるという大きな効果が
ある。
【0066】第2の発明には、第1の発明において、候
補を組合せの中から、最適な組合せを選択する際に、前
記ゲインコードブックを用いることにより、より高い音
質を得ることができるという大きな効果がある。
【0067】第3,4の発明には、第1,2の発明にお
いて、各音源コードブックのかわりに音源スーパーコー
ドブックを用いることにより、音源コードブックのサイ
ズを拡大させた場合と殆ど同様の音質を、ビットレート
を増加させずに得ることができるという大きな効果があ
る。
【図面の簡単な説明】
【図1】第1の発明による音声符号化装置の一実施例を
示すブロック図である。
【図2】第2の発明による音声符号化装置の一実施例を
示すブロック図である。
【図3】第3の発明による音声符号化装置の一実施例を
示すブロック図である。
【図4】第4の発明による音声符号化装置の一実施例を
示すブロック図である。
【符号の説明】
100 入力端子 110 サブフレーム分割回路 120 線形予測分析回路 130 重み付けフィルタ 140 影響信号減算回路 150 適応コードブック候補選択回路 160 第1音源コードブック候補選択回路 170 第2音源コードブック候補選択回路 175 適応コードブック 180 第1音源コードブック 190 第2音源コードブック 200 最適組合せ探索回路 210 ゲインコードブック探索回路 220 ゲインコードブック 230 マルチプレクサ300入力端子 310 サブフレーム分割回路 320 線形予測分析回路 330 重み付けフィルタ 340 影響信号減算回路 350 適応コードブック候補選択回路 360 第1音源コードブック候補選択回路 370 第2音源コードブック候補選択回路 375 適応コードブック 380 第1音源コードブック 390 第2音源コードブック 400 ゲイン込み最適組合せ探索回路 410 ゲインコードブック 420 マルチプレクサ 500 入力端子 510 サブフレーム分割回路 520 線形予測分析回路 530 重み付けフィルタ 540 影響信号減算回路 550 適応コードブック候補選択回路 560 第1音源コードブック候補選択回路 570 第2音源コードブック候補選択回路 575 適応コードブック 580 第1音源コードブック 590 第2音源スーパーコードブック 600 最適組合せ探索回路 610 ゲインコードブック探索回路 620 ゲインコードブック 630 マルチプレクサ 700 入力端子 710 サブフレーム分割回路 720 線形予測分析回路 730 重み付けフィルタ 740 影響信号減算回路 750 適応コードブック候補選択回路 760 第1音源コードブック候補選択回路 770 第2音源コードブック候補選択回路 775 適応コードブック 780 第1音源コードブック 790 第2音源スーパーコードブック 800 ゲイン込み最適組合せ探索回路 810 ゲインコードブック 820 マルチプレクサ
フロントページの続き (56)参考文献 特開 平3−101800(JP,A) 特開 平1−319799(JP,A) 特開 平3−60528(JP,A) 特開 平2−75000(JP,A) 特開 昭64−72200(JP,A) Ozawa et.al.”4kb. s IMPROVED CELP CO DER WITH EFFICIENT VECTOR QUANTIZATI ON”,ICASSP−91,Vol. 1,pp213−216(1991) A.Kataoka et.al." A BACKWARD ADAPTIV E 8kbit/s SPEECH C ODER USING CONDITI ONAL PITCH PREDICT OR”,GLOBECOM’91.Vo l.3,pp1889−1893(1991) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 一定間隔のフレームに分割された音声信
    号を入力する音声入力部と、前記入力音声信号のスペク
    トルパラメータを求める線形予測分析部と、過去に定め
    られた音源信号を持つ適応コードブックと、前記入力音
    声信号の励振音源を多段ベクトル量子化するための複数
    種の音源コードブックと、前記適応コードブック並びに
    前記複数種の音源コードブックのそれぞれのゲインを量
    子化するためのゲインコードブックとを有し、フレーム
    をさらに分割したサブフレーム毎に前記適応コードブッ
    クと前記複数種の音源コードブックのそれぞれから当該
    サブフレームの音源信号を形成するコードベクトルの組
    合せを探索する際に、前記入力音声信号と前記線形予測
    分析部により定まるスペクトルパラメータとを用いて前
    記適応コードブックから予め定められた数の適応コード
    ベクトルの候補を選出し、前記入力音声信号と前記スペ
    クトルパラメータと前記選出された適応コードベクトル
    の候補とを用いて前記複数種の音源コードブックのそれ
    ぞれから予め定められた数の音源コードベクトルの候補
    を選出し、前記入力音声信号と前記スペクトルパラメー
    タとを用いて前記選出された適応コードベクトルの候補
    と前記選出された各音源コードベクトルとの候補の中か
    ら当該サブフレームの音源信号を形成するコードベクト
    ルの組合せを選択する音声符号化装置。
  2. 【請求項2】 一定間隔のフレームに分割された音声信
    号を入力する音声入力部と、前記入力音声信号のスペク
    トルパラメータを求める線形予測分析部と、過去に定め
    られた音源信号を持つ適応コードブックと、前記入力音
    声信号の励振音源を多段ベクトル量子化するための複数
    種の音源コードブックと、前記適応コードブック並びに
    前記複数種の音源コードブックのそれぞれのゲインを量
    子化するためのゲインコードブックとを有し、フレーム
    をさらに分割したサブフレーム毎に前記適応コードブッ
    クと前記複数種の音源コードブックのそれぞれから当該
    サブフレームの音源信号を形成するコードベクトルの組
    合せを探索する際に、前記入力音声信号と前記線形予測
    分析部により定まるスペクトルパラメータとを用いて前
    記適応コードブックから予め定められた数の適応コード
    ベクトルの候補を選出し、前記入力音声信号と前記スペ
    クトルパラメータと前記選出された適応コードベクトル
    の候補とを用いて前記複数種の音源コードブックのそれ
    ぞれから予め定められた数の音源コードベクトルの候補
    を選出し、前記入力音声信号と前記スペクトルパラメー
    タと前記ゲインコードブックとを用いて前記選出された
    適応コードベクトルの候補と前記選出された各音源コー
    ドベクトルとの候補の中から当該サブフレームの音源信
    号を形成するコードベクトルの組合せを選択する音声符
    号化装置。
  3. 【請求項3】 前記複数種の音源コードブックの中に、
    伝送すべきビット数よりもビット数の大きな音源スーパ
    ーコードブックを少なくとも一つ所有し、前記音源スー
    パーコードブックから定められた数の候補を選出する際
    に、既に選出された音源コードブックの候補あるいは音
    源スーパーコードブックの候補に応じて候補を選出する
    請求項1記載の音声符号化装置。
  4. 【請求項4】 前記複数種の音源コードブックの中に、
    伝送すべきビット数よりもビット数の大きな音源スーパ
    ーコードブックを少なくとも一つ所有し、前記音源スー
    パーコードブックから定められた数の候補を選出する際
    に、既に選出された音源コードブックの候補あるいは音
    源スーパーコードブックの候補に応じて候補を選出する
    請求項2記載の音声符号化装置。
JP03319314A 1991-12-03 1991-12-03 音声符号化装置 Expired - Lifetime JP3089769B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP03319314A JP3089769B2 (ja) 1991-12-03 1991-12-03 音声符号化装置
EP92120573A EP0545386B1 (en) 1991-12-03 1992-12-02 Method for speech coding and voice-coder
DE69228858T DE69228858T2 (de) 1991-12-03 1992-12-02 Methode zur Sprachkodierung und Sprachkodierer
CA002084338A CA2084338C (en) 1991-12-03 1992-12-02 Method for speech coding and voice-coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03319314A JP3089769B2 (ja) 1991-12-03 1991-12-03 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH05216500A JPH05216500A (ja) 1993-08-27
JP3089769B2 true JP3089769B2 (ja) 2000-09-18

Family

ID=18108816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03319314A Expired - Lifetime JP3089769B2 (ja) 1991-12-03 1991-12-03 音声符号化装置

Country Status (4)

Country Link
EP (1) EP0545386B1 (ja)
JP (1) JP3089769B2 (ja)
CA (1) CA2084338C (ja)
DE (1) DE69228858T2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
JP2800618B2 (ja) * 1993-02-09 1998-09-21 日本電気株式会社 音声パラメータ符号化方式
DE4315315A1 (de) * 1993-05-07 1994-11-10 Ant Nachrichtentech Verfahren zur Vektorquantisierung insbesondere von Sprachsignalen
JP2591430B2 (ja) * 1993-06-30 1997-03-19 日本電気株式会社 ベクトル量子化装置
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
WO1998004046A2 (en) * 1996-07-17 1998-01-29 Universite De Sherbrooke Enhanced encoding of dtmf and other signalling tones
KR100351484B1 (ko) * 1998-06-09 2002-09-05 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP3541680B2 (ja) 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
DE19845888A1 (de) 1998-10-06 2000-05-11 Bosch Gmbh Robert Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
WO2009090876A1 (ja) * 2008-01-16 2009-07-23 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
KR101290997B1 (ko) 2012-03-26 2013-07-30 세종대학교산학협력단 적응형 코드벡터를 이용한 코드북 기반 음성 향상 방법 및 그 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208862A (en) * 1990-02-22 1993-05-04 Nec Corporation Speech coder
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A.Kataoka et.al."A BACKWARD ADAPTIVE 8kbit/s SPEECH CODER USING CONDITIONAL PITCH PREDICTOR",GLOBECOM’91.Vol.3,pp1889−1893(1991)
Ozawa et.al."4kb.s IMPROVED CELP CODER WITH EFFICIENT VECTOR QUANTIZATION",ICASSP−91,Vol.1,pp213−216(1991)

Also Published As

Publication number Publication date
CA2084338C (en) 1997-03-04
EP0545386A2 (en) 1993-06-09
EP0545386A3 (en) 1993-08-18
EP0545386B1 (en) 1999-04-07
DE69228858T2 (de) 1999-08-19
JPH05216500A (ja) 1993-08-27
CA2084338A1 (en) 1993-06-04
DE69228858D1 (de) 1999-05-12

Similar Documents

Publication Publication Date Title
EP0443548B1 (en) Speech coder
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3042886B2 (ja) ベクトル量子化器の方法および装置
JP3196595B2 (ja) 音声符号化装置
JP3089769B2 (ja) 音声符号化装置
JPH0353300A (ja) 音声符号化装置
JP2626223B2 (ja) 音声符号化装置
JPH056199A (ja) 音声パラメータ符号化方式
JP2800618B2 (ja) 音声パラメータ符号化方式
JP3137176B2 (ja) 音声符号化装置
JPH08272395A (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2624130B2 (ja) 音声符号化方式
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3174733B2 (ja) Celp型音声復号化装置、およびcelp型音声復号化方法
JPH08292797A (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3256215B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3194930B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070721

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 12