JP2947012B2 - 音声符号化装置並びにその分析器及び合成器 - Google Patents

音声符号化装置並びにその分析器及び合成器

Info

Publication number
JP2947012B2
JP2947012B2 JP5192740A JP19274093A JP2947012B2 JP 2947012 B2 JP2947012 B2 JP 2947012B2 JP 5192740 A JP5192740 A JP 5192740A JP 19274093 A JP19274093 A JP 19274093A JP 2947012 B2 JP2947012 B2 JP 2947012B2
Authority
JP
Japan
Prior art keywords
coefficient
pulse
lpc
polarity
pulse train
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5192740A
Other languages
English (en)
Other versions
JPH0728497A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP5192740A priority Critical patent/JP2947012B2/ja
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to CA002214584A priority patent/CA2214584A1/en
Priority to CA002214582A priority patent/CA2214582A1/en
Priority to AU66194/94A priority patent/AU674953B2/en
Priority to CA002127483A priority patent/CA2127483C/en
Priority to GB9413753A priority patent/GB2280576B/en
Publication of JPH0728497A publication Critical patent/JPH0728497A/ja
Priority to US08/686,475 priority patent/US5734790A/en
Application granted granted Critical
Publication of JP2947012B2 publication Critical patent/JP2947012B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/113Regular pulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声符号化装置並びにそ
の分析器及び合成器に係り、特に入力音声信号を分析フ
レーム周期毎に線形予測分析する音声符号化装置並びに
その分析器と合成器に関する。
【0002】
【従来の技術】従来より、音声信号を符号化する方式の
一つとして、レギュラー・パルス・イクサイテーション
(regular pulse excitatio
n)が知られている(例えばEd.F.Deprett
er and Peter Kroon ”Regul
ar Excitation Reduction f
or Effective and Efficien
t LP−Codingof Speech”,ICA
SSP 1985,pp.965〜968)。この方式
は、入力音声信号を線形予測分析(Linear Pr
edictiveCoding:LPC)して得たLP
C係数によってスペクトル包絡情報を表現し、位相及び
振幅に自由度を持たせた等間隔のインパルス列によって
音源情報を表現する方式であり、符号化速度が9.6k
b/s又はそれ以上の領域で実用化されている。
【0003】一方、符号化速度が9.6kb/sより低
い2.4kb/sの領域で用いられる音声信号符号化方
式には、スペクトル符号化方式がある。しかし、このス
ペクトル符号化方式は、自然性、人見知り等の音声品質
の問題がある。そこで、本発明者は、先に特願平3−3
19427号にて2.4kb/s程度の符号化速度で波
形符号化を可能とする音声符号化装置並びにその分析器
及び合成器を提案した。
【0004】この音声符号化装置は、入力音声信号を分
析フレーム毎に線形予測分析してLPC係数を出力する
LPC分析手段、前記LPC係数により定義される全極
フィルタのインパルス応答を算出するインパルス応答算
出手段、前記分析フレームの前記入力音声信号と前記イ
ンパルス応答との相互相関係数列を算出する相互相関算
出手段、前記インパルス応答の自己相関係数列を算出す
る自己相関算出手段、パルス間隔及び振幅がそれぞれ等
しい複数の有極性パルスからそれぞれなり、位相が互い
に異なる複数のパルス列のそれぞれについて前記有極性
パルスのそれぞれに対応する前記自己相関係数列を加算
した係数列を前記相互相関係数列に最も類似させる前記
有極性パルスのそれぞれの極性を検索するパルス列極性
検索手段、このパルス列極性検索手段が検索した極性を
前記有極性パルスのそれぞれが有する前記複数のパルス
列のうち前記係数列が前記相互相関係数列に最も類似す
るパルス列を検索するパルス列位相検索手段、及びこの
パルス列位相検索手段が検索したパルス列の情報及び前
記LPC係数を送出する送出手段を有する分析側と、こ
の分析側から送られてきた前記パルス列の情報から音源
パルス列を生成する音源発生手段、及び、前記分析側か
ら送られてきた前記LPC係数を用いて前記音源パルス
列から音声信号を合成する第1のLPC合成手段を有す
る合成側とを備えている。
【0005】また、上記の提案になる分析器は、入力音
声信号を分析フレーム毎に線形予測分析してLPC係数
を出力するLPC分析手段と、前記LPC係数により定
義される全極フィルタのインパルス応答を算出するイン
パルス応答算出手段と、前記分析フレームの前記入力音
声信号と前記インパルス応答との相互相関係数列を算出
する相互相関算出手段と、前記インパルス応答の自己相
関係数列を算出する自己相関算出手段と、パルス間隔及
び振幅がそれぞれ等しい複数の有極性パルスからそれぞ
れなり、位相が互いに異なる複数のパルス列のそれぞれ
について前記有極性パルスのそれぞれに対応する前記自
己相関系列を加算した係数列を前記相互相関係数列に最
も類似させる前記有極性パルスのそれぞれの極性を検索
するパルス列極性検索手段と、このパルス列極性検索手
段が検索した極性を前記有極性パルスのそれぞれが有す
る前記複数のパルス列のうち前記係数列が前記相互相関
係数列に最も類似するパルス列を検索するパルス列位相
検索手段と、このパルス列位相検索手段が検索したパル
ス列の情報及び前記LPC係数を送出する送出手段とを
備えている。
【0006】更に、上記の提案になる合成器は、分析器
が入力音声信号を分析フレーム毎に線形予測分析して送
出したLPC係数及び前記入力音声信号の音源情報とし
て送出したパルス間隔及び振幅がそれぞれ等しい複数の
有極性パルスからなるパルス列の情報のうちパルス列の
情報から音源パルスを生成する音源発生手段と、前記L
PC係数を予め定めた周期で補間するLPC係数補間手
段と、このLPC係数補間手段により補間されたLPC
係数を用いて前記音源パルスから音声信号を合成するL
PC合成手段とよりなる。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
本発明者の提案になる音声符号化装置等では、2.4k
b/s程度の符号化速度で波形符号化はできるが、その
パルス列極性検策手段に膨大な演算量を必要とする問題
がある。
【0008】本発明は上記の点に鑑みてなされたもの
で、パルス列の極性の決定に動的計画法を利用すること
により、上記の課題を解決した音声符号化装置並びにそ
の分析器及び合成器を提供することを目的とする。
【0009】
【課題を解決するための手段】上記の目的を達成するた
め、本発明になる音声符号化装置は分析部と合成部とか
らなる。この分析部は入力音声信号を分析フレーム周期
毎に線形予測分析してLPC係数を出力する分析手段
と、LPC係数により定義される全極フィルタの分析区
間のインパルス応答を算出するインパルス応答算出手段
と、前記分析フレーム周期の入力音声信号とインパルス
応答との相互相関係数列を算出する相互相関算出手段
と、前記インパルス応答の自己相関係数列を算出する自
己相関算出手段と、パルス間隔及び振幅がそれぞれ等し
い複数の有極性パルスのそれぞれに対応する前記自己相
関係数列を波形として加算した自己相関係数波形加算列
を、前記相互相関係数列に最も類似させる前記有極性パ
ルスのそれぞれの極性を、累積類似度を評価尺度とする
動的計画法を利用して検索するパルス列極性検索手段
と、各々パルス列極性検索手段により極性が検索された
前記複数の有極性パルスからなり、かつ、互いに有極性
パルスの位相が異なる複数のパルス列のうち、前記自己
相関係数波形加算列と前記相互相関係数列との波形類似
性が最大であるパルス列を検索するパルス位相検索手段
と、パルス位相検索手段により検索されたパルス列の情
報と前記LPC係数とを合成して送出する送出手段とか
らなる。
【0010】前記合成部は上記送出手段から送出された
パルス列の情報を入力信号として受け、音源パルス列を
生成する音源発生手段と、送出手段から送出されたLP
C係数と音源パルス列とから音声信号を合成する第1の
LPC合成手段とを備える。
【0011】また、本発明になる分析器は、入力音声信
号を分析フレーム周期毎に線形予測分析してLPC係数
を出力する分析手段と、この分析手段が出力したLPC
係数を予め定めた周期で補間するLPC係数補間手段
と、このLPC係数補間手段により補間されたLPC係
数により定義される全極フィルタの分析区間のインパル
ス応答を算出するインパルス応答算出手段と、前記分析
フレーム周期の入力音声信号とインパルス応答との相互
相関係数列を算出する相互相関算出手段と、前記インパ
ルス応答の自己相関係数列を算出する自己相関算出手段
と、パルス間隔及び振幅がそれぞれ等しい複数の有極性
パルスのそれぞれに対応する前記自己相関係数列を波形
として加算した自己相関係数波形加算列を、前記相互相
関係数列に最も類似させる前記有極性パルスのそれぞれ
の極性を、累積類似度を評価尺度とする動的計画法を利
用して検索するパルス列極性検索手段と、各々パルス列
極性検索手段により極性が検索された前記複数の有極性
パルスからなり、かつ、互いに有極性パルスの位相が異
なる複数のパルス列のうち、前記自己相関係数波形加算
列と前記相互相関係数列との波形類似性が最大であるパ
ルス列を検索するパルス位相検索手段と、パルス位相検
索手段により検索されたパルス列の情報と前記LPC係
数とを合成して送出する送出手段とよりなる。
【0012】更に、本発明になる合成器は、分析器によ
り入力音声信号を分析フレーム周期毎に線形予測分析し
て送出されたLPC係数及び前記入力音声信号の音源情
報として送出されたパルス間隔及び振幅がそれぞれ等し
い複数の有極性パルスからなるパルス列の極性及び位相
情報との合成信号を分離するデマルチプレクサと、デマ
ルチプレクサからのパルス列の極性及び位相情報から音
源パルス列を生成する音源発生手段と、デマルチプレク
サからの該LPC係数を予め定めた周期で補間するLP
C係数補間手段と、LPC係数補間手段により補間され
たLPC係数を用いて前記音源発生手段からの音源パル
ス列から音声信号を合成するLPC合成手段とよりな
る。
【0013】
【作用】本発明の音声符号化装置では、パルス間隔及び
振幅がそれぞれ等しい複数の有極性パルスのそれぞれに
対応する自己相関係数列を波形として加算した自己相関
係数波形加算列を、前記相互相関係数列に最も類似させ
る前記有極性パルスのそれぞれの極性を、累積類似度
(累積類似尺度)を評価尺度とする動的計画法を利用し
て検索するようにしているため、前記有極性パルスのそ
れぞれの極性は累積類似度の最大検索に基づき一義的に
決定することができ、相関を評価尺度とする総当たり的
計算を不要とすることができる。
【0014】また、本発明の分析器では、上記の音声符
号化装置の分析部を実現することができ、更に本発明の
合成器では、動的計画法を利用して検索した複数の有極
性パルスのそれぞれの極性と、この複数の有極性パルス
からなるパルス列の位相情報とに基づき音声信号を得る
上記の音声符号化装置の合成部を実現することができ
る。
【0015】
【実施例】図1は本発明になる音声符号化装置の一実施
例の分析側を構成する分析器のブロック図、図2は同じ
音声符号化装置の一実施例の合成側を構成する合成器の
ブロック図、図3は図1及び図2の動作説明用タイミン
グチャートを示す。図1において、音声信号は3.4k
Hz以下に帯域制限されて分析器100の入力端子1を
介してA/D変換器1に供給され、ここでサンプリング
周波数8kHzでサンプリングされ所定のビット数に量
子化された後、32msハミング窓2及び遅延回路9に
供給される。
【0016】32msハミング窓2は、A/D変換器1
の出力信号をLPCフレーム周期32ms毎に窓長32
msのハミング窓で窓切り出し処理して、図3(A)に
示す信号Ii(iはLPC分析フレームの時間順の番
号)を出力する。LSP分析器3は、32msハミング
窓2からの信号Iiを自己相関法によりLPC分析して
αパラメータを算出し、これを更に変換してLPC係数
の一種であるLSP(Line Spectrum P
air)係数のω1〜ω10を抽出する。
【0017】LSP量子化復号化器4は、LSP分析器
3からのフレームiのLSP係数ω1〜ω5を各4ビッ
トに、またLSP係数ω6〜ω10を各3ビットに量子
化して総計35ビットの量子化LSP係数として図2の
合成器200へ伝送するために、マルチプレクサ23に
供給し、更に、量子化LSP係数を復号化して量子化誤
差を含む量子化復号化LSP係数Piとして補間器5に
供給する。量子化復号化LSP係数Piは、図3(B)
に示す如く、LPCフレーム周期で補間器5に入力され
る。
【0018】補間器5は250Hzの補間周波数で量子
化復号化LSP係数Piを補間し、補間LSP係数Pi
j(ただし、jは−3〜4の整数)として出力する。す
なわち、補間器5は量子化復号化LSP係数Piを補間
LSP係数Pi,0とし、量子化復号化LSP係数Pi
−1,Piから4ms(=(1/250)s)毎に補間
LSP係数Pi−1,1〜Pi−1,4、Pi,−3〜
Pi,−1を生成し、量子化復号化LSP係数Pi,P
i+1から4ms毎に補間LSP係数Pi,1〜Pi,
4、Pi+1,−3〜Pi+1,−1を生成する。
【0019】補間LSP係数Pi,0はフレームiの中
央の信号サンプルに相当するものと考えられ、また、補
間LSP係数Pi,1〜Pi,4は量子化復号化LSP
係数Pi+1が補間器5に入力された後から生成される
ことから、図3(C)に示すように、補間LSP係数P
i,jは信号Ijの中央の信号サンプルから50ms遅
れている。従って、A/D変換器1の出力信号は、遅延
回路9により50ms遅延されて後述のスペクトル変形
器10に供給される。
【0020】ω/α変換器6は、補間器5からの補間L
SP係数Pi,jをαパラメータαk (ただし、kは1
〜10の整数)に変換して減衰係数印加器7及びスペク
トル変形器10にそれぞれ供給する。減衰係数印加器7
は、αパラメータαk に減衰係数γ(ただし、0<γ<
1)を印加してαk γk を生成し、これを一時メモリ8
に一時格納すると共に、スペクトル変形器10に供給す
る。
【0021】スペクトル変形器10はαパラメータαk
と、減衰係数γを印加したαパラメータαk γk とを用
いて下記の(1)式により定義されるフィルタであり、
遅延回路9で50ms遅延されたA/D変換器1の出力
信号のうち、これらαパラメータに対応する信号をスペ
クトル構造変換して周知の聴感重み付けを行う。
【0022】
【数1】 スペクトル変形器10の出力信号のうち、補間LSP係
数Pi,jから生成されたαパラメータに対応する部分
を信号Wi,jとすると、この信号Wi,jは図3
(D)に示すように、補間LSP係数Pi,jに対応し
たタイミングで出力される。
【0023】37ms矩形窓11は、図3(E)に示す
ように、上記信号Wi,0の4msの区間の中央から前
16ms、後21ms(=16ms+5ms)の合計3
7msの矩形窓で信号Wi,jを窓切り出し処理する。
窓切り出し処理された信号は、後述するLPC合成フィ
ルタ12から取り出される境界補正信号を用いて、境界
補正器13により先頭の5msが境界補正され、図3
(G)に示すような信号Iiに対応するパルス分析孤立
波形Aiとされて相互相関算出器16及び振幅算出器2
1にそれぞれ供給される。
【0024】パルス分析孤立波形Aiの後尾をフレーム
iに対応する32msの区間より5ms後にしているの
は、この5msの区間の信号サンプルをも用いてパルス
分析することにより、分析区間の後尾の環境補正を行う
ためである。パルス分析孤立波形Ai内には、図5に時
間順にt0 〜t295 で示すように、295個の各信号サ
ンプルのタイムスロットがある。
【0025】インパルス応答算出器14は、一時メモリ
8に格納されている、減衰係数を印加したαパラメータ
αk γk を用いて下記の(2)式により定義される全極
フィルタのタイムスロットt0 〜t295 に相当するすべ
てのインパルス応答Uv 0、Uv 1、Uv 2、...、Uv 295
(ただし、v=0,1,2,...,39)を算出し
て、一時メモリ15に格納する。なお、算出する応答長
は40サンプル分(5ms)とする。これは5ms程度
でインパルス応答が実質的に十分に零に収斂することに
基づき設定される応答長である。
【0026】
【数2】 (2)式により定義される全極フィルタは、係数(減衰
係数を印加したαパラメータαk γk )が4ms毎に更
新される時変フィルタであり、上記のインパルス応答の
算出過程の途中でも係数が変更される。インパルス応答
なる用語は、固定フィルタについて定義される用語であ
るが、本明細書中では、インパルス応答なる用語を時変
フィルタについても意味を拡張して用いている。
【0027】相互相関算出器16は、境界補正器13か
らのパルス分析孤立波形Aiと一時メモリ15に格納さ
れているインパルス応答Uv q(ただし、q=0,1,
2,...,295;v=0,1,2,...,39)
との相互相関係数Φ(q)を下記の(3)式によりすべ
て算出し、得られた296個の相互相関係数から構成さ
れる相互相関係数列を一時メモリ17に格納する。
【0028】
【数3】 自己相関算出器18は、一時メモリ15に格納されてい
る上記インパルス応答Uv qについて、これらの自己相関
係数ρr q(ただし、q=0,1,2,...,295;
r=−39,−38,...,0,...,38,3
9)を下記の(4)式によりすべて算出し、得られた7
9サンプルから構成される自己相関係数列を296組
分、一時メモリ19に格納する。
【0029】
【数4】 最大系列検索器20は、一時メモリ17に記憶されてい
る前記相互相関係数列Φ(q)と、一時メモリ19に記
憶されている前記自己相関係数列ρr qとが入力され、こ
れらに基づいて等間隔、等振幅であり、位相及び各パル
スの極性にのみ自由度がある複数の有極性パルスからな
るという条件の下に、パルス分析孤立波形Aiの先頭か
ら32msの部分(フレームiに対応する部分)の音源
情報である、図3(H)に示す検索出力パルス列Biを
検索する。
【0030】この最大系列検索器20の動作自体は、前
記した本発明者の提案になる音声符号化装置における最
大系列検索器と同様であり、次にこの動作について更に
詳細に説明する。最大系列検索器20は、図5に示すよ
うに、パルス位相”0”〜”7”の8つのパルス列の位
置を設定する。各パルス列はパルス間隔が8タイムスロ
ットの等振幅の37個の有極性パルスからなり、各パル
ス列相互間の位相差は1タイムスロットである。
【0031】パルス位相”0”のパルス列の各パルス
(有極性パルス)は、タイムスロットt0 、t8
16、...、t288 に位置し、パルス位相”1”のパ
ルス列の各パルスは、タイムスロットt1 、t9
17、...、t289 に位置し、以下同様にして、パル
ス位相”7”のパルス列の各パルスは、タイムスロット
7 、t15、t23、...、t295 に位置する。
【0032】図6は最大系列検索器20の機能を説明す
るための波形図である。同図(A)は相互相関係数列φ
(q)を示し、同図(B)は自己相関係数列ρr qのうち
のρr 0、ρr 8及びρr 120を示す。また、図6(C)はρ
r 0を正極性とし、ρr 8を同じく正極性としてρr 0とρr 8
の数値をタイムスロット毎に加算した波形、同図(D)
はρr 0を正極性とし、ρr 8を負極性としてρr 0とρr 8
数値をタイムスロット毎に加算した波形を示す。
【0033】本実施例では一組の自己相関係数列を−3
9〜39の範囲の79サンプルから構成されると定義し
ている。従って、自己相関係数列ρr qをタイムスロット
毎に加算する場合、例えばタイムスロットt0 〜t7
相当する区間は、ρr 0,ρr 1、...、ρr 45 (r=−
39、...、39)のみ関係する。更に、パルス位
相”0”に限定すると、タイムスロットt0 〜t7 に相
当する区間は、ρr 0,ρr 8、ρr 16 、ρr 24 、ρr 32
びρr 40 (r=−39、...、39)のみが関係す
る。すなわち、ρr 0を「正」に設定するか「負」に設定
するかは、タイムスロットt0 〜t7 に関し、ρr 0,ρ
r 8、ρr 16 、ρr 24 、ρr 32 及びρr 40 の各自己相関係
数について、これらの極性のみを自由にした線形結合を
考え、タイムスロットt0 〜t7 に相当する区間におい
て、相互相関係数列φ(q)(ただし、q=0,
1,...,7)と最も良く類似する極性の組み合わせ
を選択することにより決定し得る。
【0034】パルス位相”0”のパルス列の各有極性パ
ルスのうちパルス分析孤立波形Aiの先頭から32ms
の部分に入るタイムスロットt0 〜t248 の32パルス
の極性は以下の手順で決定される。まず、タイムスロッ
トt0 、t8 、t16、t24、t32及びt40の位置の各パ
ルスの極性のすべての組み合わせ(64通りの組み合わ
せ)のそれぞれについて、各パルスの極性をも考慮した
自己相関係数列を波形として加算した係数列を求める。
【0035】次に、これら64種の自己相関係数波形加
算列のそれぞれについて、相互相関係数列との波形とし
ての類似性を計測し、類似性が最大となるものを選択す
る。類似性の計測は例えば、タイムスロットt0 〜t7
の区間の相互相関Ψ(7)を下記の(5)式に基づいて
求め、この算出結果から最適な自己相関係数波形加算列
を選択することで行う。
【0036】
【数5】 次に、選択した自己相関係数波形加算列からタイムスロ
ットt0 の位置のパルスの極性sgn(0)のみを決定
する。続いて、タイムスロットt8 、t16、t24、t32
及びt40の位置の各パルスの極性のすべての組み合わせ
のそれぞれについて、これら6パルス及びタイムスロッ
トt0 の位置の先に決定した極性のパルスの自己相関係
数波形加算列を求め、これら64種の自己相関係数波形
加算列のそれぞれについて相互相関係数列との波形類似
性Ψ(15)を下記の(6)式に基づいて求め、この算
出結果から最適な自己相関係数波形加算列を選択する。
そして、選択した自己相関係数波形加算列からタイムス
ロットt8 の位置のパルスの極性sgn(8)のみを決
定する。
【0037】
【数6】 次に、タイムスロットt0 、t8 の位置のパルスの極性
を先に決定したように固定し、タイムスロットt16、t
24、t32、t40、t48、及びt56の位置のパルスの極性
を自由として、同様にしてタイムスロットt16の位置の
パルスの極性sgn(16)を決定する。以下同様にし
て、タイムスロットt245 の位置のパルスまで極性sg
n(248)を決定する。
【0038】以上のようにして、パルスの極性を総当た
り的計算に基づいて決定しても、原理的には一向に差し
支えない。しかしながら、実用的見地からは(5)式及
び(6)式を直接計算する方法は、膨大な演算量を必要
とし、実時間処理上、並びにハードウェアの規模上極め
て不利である。
【0039】そこで、本実施例では、この演算を後述す
るように、動的計画法(Dynamic Progra
mming Method)により実現することにより
演算量を削減するものである。
【0040】パルス位相”1”〜”7”の各パルス列に
ついても、パルス位相”0”のパルス列において行った
のと同様にして、各有極性パルスの極性を決定する。こ
のようにして極性を決定した有極性パルスからなる各パ
ルス位相のパルス列のそれぞれについて自己相関係数波
形加算列と相互相関係数列との波形類似性を計測し、類
似性が最大となるパルス位相のパルス列を検索出力パル
ス列Biとして選択する。検索出力パルス列Biは、振
幅算出器21及びLPC合成フィルタ12に供給され、
また、合成器200へ伝送するために、3ビットのパル
ス位相情報及び32ビットのパルス極性情報の形でマル
チプレクサ23に供給される。
【0041】振幅算出器21は、最大系列検索器20か
らの検索出力パルス列Biによる合成波形を求め、この
合成波形とパルス分析孤立波形Aiとが最も良く一致す
るパルス振幅を算出する。上記の合成波形の算出は、あ
らためてフィルタ演算を行うのではなく、一時メモリ1
5に格納されているインパルス応答Uv qを波形加算する
ことによって行われる。また、上記のパルス振幅の決定
は、換言するとフレーム全体として電力が一致するパル
ス振幅の決定であり、次式の最小化問題において、Pを
最小にする振幅Aを求めることにより、容易に行うこと
ができる。
【0042】
【数7】 i :パルス分析孤立波形Aiのタイムスロットti
おけるサンプル値 xi :エネルギーを1とした合成波形のタイムスロット
i におけるサンプル値 (7)式からパルス振幅Aは次式により求められる。
【0043】
【数8】 振幅量子化復号化器22は、振幅算出器21で(8)式
から求められたパルス振幅Aを6ビットに量子化してマ
ルチプレクサ23に供給すると共に、量子化した振幅を
再び復号化して量子化誤差を含む振幅をLPC合成フィ
ルタ12に供給する。
【0044】LPC合成フィルタ12は、一時メモリ8
から読み出したフレームiの減衰係数を印加したαパラ
メータαk γk を係数とし、最大系列検索器20からの
検索出力パルス列Biのうち後尾の5msの区間のパル
ス列の振幅を、振幅量子化復号化器22から与えられた
振幅にしたパルス列により駆動され、図3(I)及び図
4(B)の拡大図に示す信号Ciを出力する。なお、図
4(A)は図3(D)に示したスペクトル変形器10の
出力信号Wi,jである。
【0045】図3(I)及び図4(B)に示すように、
信号Ciは、5msのパルス励振部分Caiと、それに続
く5msの減衰振動部分Cbiとからなる。パルス励振部
分Caiは、37ms矩形窓11がフレームiに対応して
切り出した信号のうち、先頭から27msの点に始まり
32msの点で終わる部分を復元した信号であり、ま
た、37ms矩形窓11がフレーム(i+1)に対応し
て切り出した信号の先頭の直前の5msの区間のスペク
トル変形器10の主力信号の復元信号である。
【0046】ところで、37ms矩形窓11がフレーム
iに対応して切り出した信号のうち先頭の部分は、この
先頭の部分に先行する遅延回路9の出力信号によりスペ
クトル変形器10が励振されて出力した減衰振動部分に
より影響を受けている。境界補正器13は、LPC合成
フィルタ12がフレーム(i−1)に対応して出力した
信号Ci−1のうち、長さ5msの減衰振動部分、換言
すると、図3(F)に示す境界補正信号Cb,i-1 を、フ
レームiに対応する37ms矩形窓11の出力信号から
減算することにより、37ms矩形窓11の出力信号の
先頭の5msの部分を境界補正し、図3(G)に示す如
きパルス分析孤立波形Aiとして出力する。
【0047】マルチプレクサ23はLSP量子化復号化
器4からの35ビットの量子化LSP係数と、最大系列
検索器20からの3ビットのパルス位相及び32ビット
のパルス極性と、振幅量子化復号化器22からの6ビッ
トの振幅とを32msのフレーム周期で受け取り、これ
ら計76ビットのデータに5フレーム当り4ビット、換
言すると1フレーム当り0.8ビットのフレーム周期ビ
ットを付加して平均76.8ビットの伝送フレームを構
成し、データ出力として図2に示す合成器200へ送出
する。このデータ出力のビットレートは、2.4kb/
s(=76.8ビット/0.03s)である。
【0048】次に、合成器200について図2と共に説
明する。同図において、デマルチプレクサ24は分析器
100からのデータが入力され、これをフレーム同期し
て分解し、振幅のデータは振幅復号化器25に、パルス
位相及びパルス極性のデータは音源発生器26に、ま
た、量子化LSP係数をLSP復号化器27にそれぞれ
供給する。振幅復号化器25は入力振幅データを復号化
して音源発生器26に供給する。音源発生器26は、デ
マルチプレクサ22から入力されたパルス位相及びパル
ス極性と同じ位相及び極性で、かつ、振幅復号化器25
から入力された復号振幅と同じ振幅のパルス列を発生
し、これをLPC合成フィルタ30に供給する。
【0049】一方、LSP復号化器27は、入力量子化
LSP係数を復号化し、32msのフレーム周期でLS
P係数を補間器28に供給する。補間器28は入力復号
LSP係数を250Hzの補間周波数で補間し、補間L
SP係数を4ms毎にω/α変換器29に供給する。ω
/α変換器29は、補間器28からの補間LSP係数を
αパラメータに変換して、LPC合成フィルタ30へ出
力する。
【0050】LPC合成フィルタ30は、ω/α変換器
29からのαパラメータを係数とし、音源発生器26か
らのパルス列により駆動されて音声信号の量子化サンプ
ル列を出力する。この量子化サンプル列は、8kHZの
クロックにより動作するD/A変換器31によりアナロ
グ音声信号に変換された後、低域フィルタ(図示せず)
を通して3.4kHz以下に帯域制限されて出力され
る。
【0051】以上説明した実姉例は、分析器100から
合成器200へ伝送するLPC係数としてLSP係数を
用いているが、他の方式のLPC係数、例えばKパラメ
ータを伝送するようにしても良い。
【0052】次に、分析器100における最大系列検索
器20での動的計画法を用いたパルスの極性の決定方法
について説明する。図7は本発明における最大系列検索
器20のパルスの極性の決定方法を説明するためのダイ
アグラムである。同図において、タイムスロットt0
位置のパルスの極性sgn(0)が「正」と仮定すwる
と、このタイムスロットt0 におけるインパルス応答の
自己相関係数ρq 0と相互相関係数列φ(q)との類似尺
度d0 は次式で表される。
【0053】
【数9】 タイムスロットt0 の位置のパルスの極性sgn(0)
が「負」と仮定すると、このタイムスロットt0 におけ
るインパルス応答の自己相関係数ρq 0と相互相関係数列
φ(q)との類似尺度は−d0 である。
【0054】次に、タイムスロットt8 の位置のパルス
の極性sgn(8)が「正」と仮定すると、このタイム
スロットt8 におけるインパルス応答の自己相関係数ρ
q 8と相互相関係数列φ(q+8)との類似尺度d8 は次
式で表される。
【0055】
【数10】 タイムスロットt8 の位置のパルスの極性sgn(8)
が「負」と仮定すると、このタイムスロットt8 におけ
るインパルス応答の自己相関係数ρq 8と相互相関係数列
φ(q+8)との類似尺度は−d8 である。
【0056】上記のsgn(8)を「正」と仮定する
と、sgn(0)は下記の(11)式による累積類似尺
度(累積類似度)D8 (+)の最大検索に基づき、一義
的に決定される。
【0057】
【数11】 同様に、sgn(8)を「負」と仮定すると、sgn
(0)は下記の(12)式による累積類似尺度D8
(−)の最大検索に基づき、一義的に決定される。
【0058】
【数12】 また、タイムスロットt16の位置のパルスの極性sgn
(16)が「正」と仮定すると、このタイムスロットt
16におけるインパルス応答の自己相関係数ρq 16 と相互
相関係数列φ(q+16)との類似尺度d16は次式で表
される。
【0059】
【数13】 また、上記のsgn(16)を「正」、「負」とそれぞ
れ仮定した場合の、累積類似尺度D16(+)、D
16(−)は、下記の(14)式、(15)式の最大検索
に基づき、一義的に決定される。
【0060】
【数14】 以下同様にして、次々と累積類似尺度D24(+)、D24
(−)、D32(+)、D32(−)、...、D280
(+)、D280 (−)が算出されて行き、タイムスロッ
トt288 における類似尺度d288
【0061】
【数15】 として求められる。これにより、タイムスロットt288
における累積類似尺度D288 (+)、D288 (−)は下
記の(17)式、(18)式により求められる。
【0062】
【数16】 最終的にタイムスロットt288 の位置のパルスの極性s
gn(288)は、下記の(19)式の検索結果により
決定される。
【0063】
【数17】 すなわち、Dmaxの値が例えばD288(+)であれば、タ
イムスロットt288の位置のパルスの極性sgn(2
88)は「正」に決定される。以後この決定に基づき、
図7のダイアグラム及び(9)式から(18)式などに
従いパルスの極性sgn(280)、sgn(27
2)、...、sgn(16)、sgn(8)及びsg
n(0)が順次決定される。
【0064】このようにして、本実施例によれば、動的
計画法を最大系列検索器20でのパルスの極性の決定に
用いることにより、わずか37回(=(288/8)+
1)の類似尺度の算出により所望の位相のパルス列に対
する極性を決定することができる。
【0065】
【発明の効果】以上説明したように、本発明によれば、
自己相関係数列を加算した係数列を相互相関係数列に最
も類似させる有極性パルスのそれぞれの極性を、累積類
似度を評価尺度とする動的計画法を利用して検索するよ
うにしたため、大幅に演算量を削減することができ、こ
のことから処理速度を向上することができ、また、ハー
ドウェアの規模を縮小することができる。
【0066】また、本発明によれば、等間隔、等振幅で
あり、位相及び各パルスの極性のみに自由度を持たせた
複数の有極性パルスからなるパルス列によって音源情報
を表現することにより、2.4kb/s程度の低い符号
化速度で波形符号化を可能とし、音声品質を向上するこ
とができる。
【図面の簡単な説明】
【図1】本発明になる音声符号化装置の一実施例の分析
側を構成する分析器のブロック図である。
【図2】本発明になる音声符号化装置の一実施例の合成
側を構成する合成器のブロック図である。
【図3】図1及び図2の動作説明用タイミングチャート
である。
【図4】図1のスペクトル変形器及びLPC合成器の各
出力信号を拡大して示す図である。
【図5】図1の最大系列検索器の動作を説明する図であ
る。
【図6】図1の最大系列検索器の機能を説明する図であ
る。
【図7】図1の最大系列検索器の動的計画法に基づくパ
ルス極性決定方法を説明するダイアグラムである。
【符号の説明】
3 LSP分析器 4 LSP量子化復号化器 5、28 補間器 6、29 ω/α変換器 7 減衰係数印加器 10 スペクトル変換器 11 37ms矩形窓 12、30 LPC合成フィルタ 13 境界補正器 14 インパルス応答算出器 16 相互相関算出器 18 自己相関算出器 20 最大系列検索器 23 マルチプレクサ 26 音源発生器

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声信号を分析フレーム周期毎に線
    形予測分析してLPC係数を出力する分析手段と、該L
    PC係数により定義される全極フィルタの分析区間のイ
    ンパルス応答を算出するインパルス応答算出手段と、前
    記分析フレーム周期の入力音声信号と該インパルス応答
    との相互相関係数列を算出する相互相関算出手段と、前
    記インパルス応答の自己相関係数列を算出する自己相関
    算出手段と、パルス間隔及び振幅がそれぞれ等しい複数
    の有極性パルスのそれぞれに対応する前記自己相関係数
    列を波形として加算した自己相関係数波形加算列を、前
    記相互相関係数列に最も類似させる前記有極性パルスの
    それぞれの極性を、累積類似度を評価尺度とする動的計
    画法を利用して検索するパルス列極性検索手段と、各々
    該パルス列極性検索手段により極性が検索された前記複
    数の有極性パルスからなり、かつ、互いに該有極性パル
    スの位相が異なる複数のパルス列のうち、前記自己相関
    係数波形加算列と前記相互相関係数列との波形類似性が
    最大であるパルス列を検索するパルス位相検索手段と、
    該パルス位相検索手段により検索されたパルス列の情報
    と前記LPC係数とを合成して送出する送出手段とから
    なる分析部と、 該送出手段から送出された該パルス列の情報を入力信号
    として受け、音源パルス列を生成する音源発生手段と、
    該送出手段から送出された該LPC係数と該音源パルス
    列とから音声信号を合成する第1のLPC合成手段とを
    備える合成部とを有することを特徴とする音声符号化装
    置。
  2. 【請求項2】 前記分析手段が出力したLPC係数を予
    め定めた周期で補間する第1のLPC係数補間手段と、
    前記分析部から送出された前記LPC係数を前記予め定
    めた周期で補間する第2のLPC係数補間手段とを有
    し、前記インパルス応答算出手段が前記第1のLPC係
    数補間手段により補間されたLPC係数により定義され
    る全極フィルタのインパルス応答を算出して前記相互相
    関算出手段及び前記自己相関算出手段へ出力し、前記第
    1のLPC合成手段が前記第2のLPC係数補間手段に
    より補間されたLPC係数を用いて音声信号を合成する
    ことを特徴とする請求項1記載の音声符号化装置。
  3. 【請求項3】 前記動的計画法は、前記インパルス応答
    の時間長により範囲を制限されたことを特徴とする請求
    項1記載の音声符号化装置。
  4. 【請求項4】 入力音声信号を分析フレーム周期毎に線
    形予測分析してLPC係数を出力する分析手段と、 該分析手段が出力したLPC係数を予め定めた周期で補
    間するLPC係数補間手段と、 該LPC係数補間手段により補間されたLPC係数によ
    り定義される全極フィルタの分析区間のインパルス応答
    を算出するインパルス応答算出手段と、 前記分析フレ
    ーム周期の入力音声信号と該インパルス応答との相互相
    関係数列を算出する相互相関算出手段と、 前記インパルス応答の自己相関係数列を算出する自己相
    関算出手段と、 パルス間隔及び振幅がそれぞれ等しい複数の有極性パル
    スのそれぞれに対応する前記自己相関係数列を波形とし
    て加算した自己相関係数波形加算列を、前記相互相関係
    数列に最も類似させる前記有極性パルスのそれぞれの極
    性を、累積類似度を評価尺度とする動的計画法を利用し
    て検索するパルス列極性検索手段と、 各々該パルス列極性検索手段により極性が検索された前
    記複数の有極性パルスからなり、かつ、互いに該有極性
    パルスの位相が異なる複数のパルス列のうち、前記自己
    相関係数波形加算列と前記相互相関係数列との波形類似
    性が最大であるパルス列を検索するパルス位相検索手段
    と、 該パルス位相検索手段により検索されたパルス列の情報
    と前記LPC係数とを合成して送出する送出手段とを有
    することを特徴とする分析器。
  5. 【請求項5】 前記動的計画法は、前記インパルス応答
    の時間長により範囲を制限されたことを特徴とする請求
    項4記載の分析器。
  6. 【請求項6】 分析器により入力音声信号を分析フレー
    ム周期毎に線形予測分析して送出されたLPC係数及び
    前記入力音声信号の音源情報として送出されたパルス間
    隔及び振幅がそれぞれ等しい複数の有極性パルスからな
    るパルス列の極性及び位相情報との合成信号を分離する
    デマルチプレクサと、 該デマルチプレクサからの該パルス列の極性及び位相情
    報から音源パルス列を生成する音源発生手段と、 該デマルチプレクサからの該LPC係数を予め定めた周
    期で補間するLPC係数補間手段と、 該LPC係数補間手段により補間されたLPC係数を用
    いて前記音源発生手段からの音源パルス列から音声信号
    を合成するLPC合成手段とを備えることを特徴とする
    合成器。
JP5192740A 1993-07-07 1993-07-07 音声符号化装置並びにその分析器及び合成器 Expired - Fee Related JP2947012B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP5192740A JP2947012B2 (ja) 1993-07-07 1993-07-07 音声符号化装置並びにその分析器及び合成器
CA002214582A CA2214582A1 (en) 1993-07-07 1994-07-06 Speech signal encoding system capable of transmitting a speech signal at a low bit rate without carrying out a large volume of calculation
AU66194/94A AU674953B2 (en) 1993-07-07 1994-07-06 Speech signal encoding system capable of transmitting a speech signal at a low bit rate without carrying out a large volume of calculation
CA002127483A CA2127483C (en) 1993-07-07 1994-07-06 Speech signal encoding system capable of transmitting a speech signal at a low bit rate without carrying out a large volume of calculation
CA002214584A CA2214584A1 (en) 1993-07-07 1994-07-06 Speech signal encoding system capable of transmitting a speech signal at a low bit rate without carrying out a large volume of calculation
GB9413753A GB2280576B (en) 1993-07-07 1994-07-07 Speech signal encoding system
US08/686,475 US5734790A (en) 1993-07-07 1996-07-25 Low bit rate speech signal transmitting system using an analyzer and synthesizer with calculation reduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5192740A JP2947012B2 (ja) 1993-07-07 1993-07-07 音声符号化装置並びにその分析器及び合成器

Publications (2)

Publication Number Publication Date
JPH0728497A JPH0728497A (ja) 1995-01-31
JP2947012B2 true JP2947012B2 (ja) 1999-09-13

Family

ID=16296276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5192740A Expired - Fee Related JP2947012B2 (ja) 1993-07-07 1993-07-07 音声符号化装置並びにその分析器及び合成器

Country Status (5)

Country Link
US (1) US5734790A (ja)
JP (1) JP2947012B2 (ja)
AU (1) AU674953B2 (ja)
CA (3) CA2214582A1 (ja)
GB (1) GB2280576B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0967594B1 (en) 1997-10-22 2006-12-13 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
WO2003071522A1 (fr) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe
JP2003347940A (ja) * 2002-05-28 2003-12-05 Fujitsu Ltd 音声を高能率符号化するシステムに音声帯域のデータ信号を透過させるための符号化と伝送の方法と装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1219079A (en) * 1983-06-27 1987-03-10 Tetsu Taguchi Multi-pulse type vocoder
JPS60239798A (ja) * 1984-05-14 1985-11-28 日本電気株式会社 音声信号符号化/復号化装置
CA1323934C (en) * 1986-04-15 1993-11-02 Tetsu Taguchi Speech processing apparatus
JPH0754440B2 (ja) * 1986-06-09 1995-06-07 日本電気株式会社 音声分析合成装置
JPH0738116B2 (ja) * 1986-07-30 1995-04-26 日本電気株式会社 マルチパルス符号化装置
CA1312673C (en) * 1986-09-18 1993-01-12 Akira Fukui Method and apparatus for speech coding
JPS6396699A (ja) * 1986-10-13 1988-04-27 松下電器産業株式会社 音声符号化装置
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
JP2586043B2 (ja) * 1987-05-14 1997-02-26 日本電気株式会社 マルチパルス符号化装置
US5228086A (en) * 1990-05-18 1993-07-13 Matsushita Electric Industrial Co., Ltd. Speech encoding apparatus and related decoding apparatus
US5305421A (en) * 1991-08-28 1994-04-19 Itt Corporation Low bit rate speech coding system and compression
CA2084323C (en) * 1991-12-03 1996-12-03 Tetsu Taguchi Speech signal encoding system capable of transmitting a speech signal at a low bit rate

Also Published As

Publication number Publication date
AU6619494A (en) 1995-01-19
GB2280576A (en) 1995-02-01
CA2214582A1 (en) 1995-01-08
US5734790A (en) 1998-03-31
CA2127483A1 (en) 1995-01-08
AU674953B2 (en) 1997-01-16
CA2127483C (en) 1999-11-09
JPH0728497A (ja) 1995-01-31
GB2280576B (en) 1998-04-15
GB9413753D0 (en) 1994-08-24
CA2214584A1 (en) 1995-01-08

Similar Documents

Publication Publication Date Title
JP2707564B2 (ja) 音声符号化方式
US4720865A (en) Multi-pulse type vocoder
JPH09160596A (ja) 音声符号化装置
JP3255190B2 (ja) 音声符号化装置並びにその分析器及び合成器
JP2947012B2 (ja) 音声符号化装置並びにその分析器及び合成器
JP2798003B2 (ja) 音声帯域拡大装置および音声帯域拡大方法
JP3168238B2 (ja) 再構成音声信号の周期性を増大させる方法および装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
EP0545403A2 (en) Speech signal encoding system capable of transmitting a speech signal at a low bit rate
JP2844589B2 (ja) 音声信号符号化方法とその装置
JPH0782360B2 (ja) 音声分析合成方法
JPH08234795A (ja) 音声符号化装置
NO862602L (no) Vocoder innebygd i digitale signalbehandlingsenheter.
JP3552201B2 (ja) 音声符号化方法および装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
AU617993B2 (en) Multi-pulse type coding system
JPH043879B2 (ja)
JPS62102294A (ja) 音声符号化方式
JP2629762B2 (ja) ピッチ抽出装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JPH0738117B2 (ja) マルチパルス符号化装置
EP0119033B1 (en) Speech encoder
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置
JPH0754438B2 (ja) 音声処理装置
JPH043878B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees