JPH0738115B2 - 音声分析合成装置 - Google Patents

音声分析合成装置

Info

Publication number
JPH0738115B2
JPH0738115B2 JP61122689A JP12268986A JPH0738115B2 JP H0738115 B2 JPH0738115 B2 JP H0738115B2 JP 61122689 A JP61122689 A JP 61122689A JP 12268986 A JP12268986 A JP 12268986A JP H0738115 B2 JPH0738115 B2 JP H0738115B2
Authority
JP
Japan
Prior art keywords
pulse
amplitude
analysis
subframe
speech analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61122689A
Other languages
English (en)
Other versions
JPS63118199A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61122689A priority Critical patent/JPH0738115B2/ja
Priority to CA000534620A priority patent/CA1323934C/en
Publication of JPS63118199A publication Critical patent/JPS63118199A/ja
Priority to US07/421,314 priority patent/US4991215A/en
Publication of JPH0738115B2 publication Critical patent/JPH0738115B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声分析合成装置に関し、特にボコーダ(VOCO
DER)なみの低符号化速度で、マルチパルスを音源情報
として利用する線形予測形式の音声分析合成装置に関す
る。
〔従来の技術〕 ボコーダは音声を極めて狭帯域で符号化しうるもので、
線形予測分析(Linear Prediction Coding,以下LPCと略
称する)によって求めるスペクトル包絡パラメータとし
てのLPC係数とともに分析側から合成側に伝送すべき音
源情報は、ピッチ周期に対応する時系列のパルスもしく
は雑音によってそれぞれ音声/無声状態音を表現すると
いう単純なモデルが利用され分析フレームごとの音源情
報を生成している。
〔発明が解決しようとする問題点〕
ボコーダは極めて狭帯域に音声を符号化しうる特徴をも
つものであるが、音源生成モデルの単純さ、ならびにこ
の音源生成モデルの前提とする正確なピッチ抽出の難し
さといった点で合成音質には自ら限度がある。
ボコーダの弱点とする上述した問題を解決するものとし
て発明されたものにマルチパルス形ボコーダがある。こ
れは、音源を有声/無声にかかわりなく複数のパルス,
すなわちマルチパルスによって表現し、これによってLP
C合成フィルタを駆動せしめるものであり、音源のもつ
波形情報もかなり忠実に反映し、従って合成音質も著し
く改善されたものとなるが、パルス量子化のため符号化
速度が増大するという問題がある。この符号化速度の増
大はADPCM(Adaptive DifferentialPCM)やAPC(Adapti
ve Predictive Coding)ほどではないがボコーダの領域
をはるかに越えたものとなってしまい低ビットレートで
利用できるというボコーダの特徴が著しく減殺されてし
まうという問題がある。
本発明の目的は上述した欠点を除去し、本来の分析フレ
ームを複数のサブフレームに分割し、各サブフレームご
とに最大限1個の音源パルスを、少なくともパルス位置
自由に設定するという条件のもとで選択するという手段
を備えることにより、ボコーダなみの低ビットレートで
合成音質の著しい改善の図れる音声分析合成装置を提供
することにある。
〔問題点を解決するための手段〕
本発明の装置は、線形予測形式の音声分析合成装置にお
いて、位置と振幅のうち少なくとも位置の自由度をもつ
マルチパルスを音源情報として利用しかつこのマルチパ
ルスは1分析フレームを入力音声の最小ピッチ周期より
も短い区間単位で分割したサブフレームのそれぞれに対
して最大限1個を越えない条件のもとで設定する手段を
備えて構成される。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。第1図は
本発明の音声分析合成装置の分析側の一実施例を示すブ
ロック図、第2図は本発明の音声分析合成装置の合成側
の一実施例を示すブロック図である。
第1および第2図に示す実施例の分析側および合成側
は、利用すべきマルチパルスの振幅は“0"を含む3値の
論理値で量子化し、振幅零をパルス位置の符号化に包含
し、マルチパルスのパルス位置はサブフレームごとに符
号化を実施した場合を例としているが、これらマルチパ
ルスの3値論理値化,振幅零のパルス位置符号化組入
れ、およびサブフレームごとのパルス位置符号化はその
すべて、もしくは1部の実施を除去したものとして構成
することも容易に実施しうることは明らかである。
第1図の分析側はA/Dコンバータ1,窓処理器2,ノイズ重
み付フィルタ3,LPC分析器4,量子化器5,復号化器6,K/α
パラメータ変換器7,減衰係数印加器8,インパルス応答算
出器9,相互相関算出器10,自己相関算出器11,一時メモリ
12,相互相関補正器13,最大値検索器14,サブフレームス
テータスメモリ15,マルチパルス一時メモリ16,パルス量
子化符号化器17,マルチプレクサ18から構成され、他に
伝送路30を併記して示す。
また、第2図に示す合成側は、デマルチプレクサ21,復
号化器22〜24,マルチパルス発生器25,LPC合成器26,D/A
コンバータ27を備えて構成される。
第1図において、A/Dコンバータ1は音声入力を受ける
とLPF(Low Pass Filter)で高域遮断周波数3.4kHzフィ
ルタリングを行なったのち、A/Dコンバータで8kHzのサ
ンプリング周波数で標本化し、所定の12ビットの量子化
音声信号として窓処理器2に供給する。
窓処理器2は、こうして供給される量子化音声信号を2
2.5mSECの分析フレーム周期でノイズ重み付フィルタ3
に供給するとともに、また、入力する量子化音声信号を
一旦内部メモリに一定時間長分,たとえば30mSECぶん、
すなわち24サンプルずつを格納し、これにハミング関
数、あるいは矩形関数等のあらかじめ設定する窓関数を
乗算する窓処理を22.5mSECごとに実施しつつ、これをLP
C分析器4に供給する。
LPC分析器4は、入力する量子化音声信号に対し分析フ
レーム単位でLPC分析を実施し、所定の次数,内容のLPC
係数を抽出する。本実施例でLPC係数として10次のKパ
ラメータ、すなわち10次のPARCOR(偏自己相関)係数K1
〜K10を抽出しこれを量子化器5に供給し所定の量子化
内容で量子化したあと、さらに所定の形式で符号化し、
これらKパラメータをマルチプレクサ18と復号化器6と
に出力する。
復号化器6に供給されたKパラメータは復号化されてK/
αパラメータ変換器7に提供され10次のαパラメータα
1〜α10に変換され、その出力はノイズ重み付フィルタ
3と減衰係数付加器8に供給される。こうして得られる
αパラメータは、Kパラメータの符号化,復号化の際に
受ける量子化雑音レベルとほぼ同一レベルの量子化雑音
を付与したものとなる。
さて、ノイズ重み付フィルタ3は、窓処理器2から受け
る量子化音声信号に対し分析フレームごとに聴覚特性に
もとづく重み付けを行なう。この聴覚特性にもとづく重
み付けは、入力する量子化音声信号の量子化雑音スペク
トルを音声信号のスペクトルに近接するように処理し、
マスキング効果による聴覚上の雑音低減を行なうもの
で、このために利用するノイズ重み付フィルタの伝達関
数W(Z)は次の(1)式で示される。
(1)式において、αiはαパラメータで、Pは分析次
数、またはγは重み付係数で0<γ<1の範囲で決定さ
れ、本実施例ではγ=0.9としている。
K/αパラメータ変換器7は(1)式の分子側の係数αi
(i=1…,P)を算出したうえこれをノイズ重み付フィ
ルタ3と減衰係数印加器8に供給する。
減衰係数印加器8は、こうして受けたK/αパラメータ変
換器7の出力に減衰減数γiの乗算,印加を行なって
(1)式分母側の係数γiαi(i=1…,P)を得てこれ
をノイズ重み付フィルタ3およびインパルス応答算出器
9に供給する。
ノイズ重み付フィルタ3は、入力するαi,γiαiを利用
して伝達関数W(Z)を算出し、これと窓処理器2から
受ける入力との畳み込み乗算を実施して聴覚重み付けを
行ないその出力を相互相関算出器10に供給する。
インパルス応答算出器9からパルス量子化符号化器17ま
では、ノイズ重み付フィルタ3から出力された聴覚重み
付量子化音声信号を利用してマルチパルスを検索し出力
する部分で、本実施例の場合このマルチパルス検索は2
2.5mSECの分析フレームを細分割したサブフレームを対
象として行なわれる。
一般的に、マルチパルスを求めるには、A−b−S(An
alysis by Synthesis)手法の名によって知られるスペ
クトル領域評価や、音声入力と合成フィルタのインパル
ス応答との相互相関および前記インパルス応答の自己相
関を利用して求める相関領域評価が利用され、後者の評
価手法が前者よりも効率的処理を行ない得るものとして
知られており、本実施例でも相関領域評価による手法を
利用している。
K個のパルスによって合成された合成信号と音声入力と
の差εは次の(2)式で示される。
(2)式においてNは分析フレーム長,gi,miはそれぞ
れ分析フレーム内のi番目のパルスの振幅ならびに位置
を示す。εを最小とするパルスの振幅および位置は
(2)式をgiについて偏微分して零とおくことによって
得られる(3)式が最大となる点として与えられる。
(3)式においてRhhは合成フィルタの、インパルス応
答の自己相関,hsは音声入力と前記インパルス応答と
の相互相関である。
(3)式の意味するところは、位置miにパルスをたてる
場合には振幅gi(mi)が最適であるということである。
このgi(mi)を求めるには、マルチパルスが決定される
ごとに相互相関hs(mi)から(3)式分子の第(2)
項を減算しつつ相互相関補正を行ない、しかるのち遅れ
時間零における自己相関Rhh(0)で正規化したうえそ
の絶対値の最大値を検索する形式で次次に得られる。こ
の場合、(3)式分子の第2項は、直前に検索された最
大値の振幅ならびに位置情報、その最大値からの遅れ時
間|me−mi|における自己相関Rhh(|me−mi|),および
検索すべきパルスの分析フレーム内の位置情報等にもと
づいて求められる。相互相関補正器13は、一時メモリ12
からは相互相関hs、最大値検索器14からは最大値の振
幅と位置に関する情報を、自己相関算出器11からは自己
相関に関する情報を、また、サブフレームステータスメ
モリ15からは検索すべきパルスの分析フレーム内の位置
情報を得て上述した(3)式の分子に示す相互相関補正
を行ない、そのあとRhh(0)による正規化を施したも
のの絶対値に変換した相互相関補正データとして一時メ
モリに最大値検索ごとに提供する。
最大値検索器14は一時メモリ12から相互相関hsの初期
値を入力したあとは次次に相互相関補正データを受けつ
つその最大値を検索し、これをマルチパルスとして相互
相関補正器13およびマルチパルス一時メモリ16に供給す
る。
この一連の最大値検索は分析フレームごとに次次に実施
されるが、本実施の場合、この分析フレームが12個のサ
ブフレームに分割され、マルチパルスはこのサブフレー
ムに対して検索,設定される。検索,設定されたサブフ
レームは次次に検索対象から除外しつつ、マルチパルス
のたっていないサブフレームのみを対象として実施され
る。なお、サブフレームの個数12は、入力音声として考
えられる最小ピッチ周期よりも短く設定されている。本
実施例の場合は分析フレーム長が22.5mSECであり、従っ
てサブフレーム長は22.5/12=1.875(mSEC)となり、周
波数で言うと約533Hzとなる。これは入力音声の最高ピ
ッチ周期よりも十分に短く、従って12個のサブフレーム
には多くて1個のパルスがたてられるか、もしくは1個
もたてられないかのいずれかの条件でパルス設定が行な
われることとなる。
さて、サブフレームステータスメモリ15は、12個のサブ
フレームのそれぞれがマルチパルスがたてられているか
否かのステイタスを最大値検索器14に提供し、マルチパ
ルスが立てられていないサブフレームの対応時間領域、
いわゆるタイムスロットだけを対象として最大値検索を
行なわしめるものであり、12個のサブフレームを代表す
る12ワードを格納するRAMとして構成される。12ワード
は0番地から11番地までのアドレスに格納され、それぞ
れ1〜15,16〜30,……166〜180のタイムスロットを指定
する。これらタイムスロットは1分析フレーム22.5mSEC
の8kHzのサンプリング周波数によるサンプリングポイン
ト180個を12分割した15個ずつの時間領域である。
マルチパルス一時メモリ16は、分析フレームごとのイニ
シアライズでアドレス内容が一旦オール“0"にされ、マ
ルチパルスが検索されるとその番地は“1"にされて最大
値検索対象から除外される。最大値検索器14はサブフレ
ームステータスメモリ15からこのようなサブフレームス
テータス情報を受けつつ最大値を検索する。
こうして、最大値検索単位は分析フレーム単位である
が、検索処理自体は実効的にサブフレームごとに実施さ
れ、検索されるパルスの個数が所定の設定範囲に入るま
で分析フレームごとに繰返される。こうして検索された
マルチパルスの位置と振幅に関する情報はマルチパルス
一時メモリ16に供給される。
次に波形図を参照して上述のサブフレームを利用したマ
ルチパルス検索法の実際例を説明する。
第6図は本発明によるサブフレームを利用したマルチパ
ルス検索法を説明するための波形図である。第6図に於
いて51で引用される実線で示す波形は相互相関算出器10
で算出され一時メモリ12に記憶されている前述の相互相
関係数hsである。線分52と53とは各々分析フレームの
始端と終端とを示す。線分52と53とにより区別されたフ
レームの長さは前述のように22.5msec(180サンプル)
である。線分54−1〜11は12区分されたサブフレーム
〜の境界を示す。最大値検索器14は一時メモリにより
供給された相互相関係数hsの列51の絶対値の最大なも
のを検索する。点55はhsの列51の最大値でありサブフ
レームに存在する。最大値検索器14は点55を示す位置
情報と振幅情報とを相互相関補正器13とマルチパルス一
時メモリ16とへ出力する。最大値検索器14は更に最大値
55を含むサブフレームの番号7より“1"を引いた数“6"
をサブフレームステータスメモリ15へ出力する。サブフ
レームステータスメモリ15は前述の如く12ワードを格納
するRAMであり、分析フレーム周期でマルチパルス検索
開始前に、その内容が全て“0"に初期設定されている。
即ち番地0〜11に“0"が書込まれている。サブフレーム
ステータスメモリ15は最大値検索器14より供給された数
値“6"により番地“6"の内容を“1"に書き替える。相互
相関補正器13は自己相関算出器11より供給される自己相
関係数Rhhと最大値検索器14より供給される点55を示す
位置情報と振幅情報とを用いて一時メモリ12に記憶され
ている相互相関係数hs51を補正する。この補正結果は
(3)式右辺分子(K=2の場合)に対応し、第5図に
於いて点線56で示されている。
最大値検索器14は一時メモリ12より供給された補正後の
相互相関係数列、即ち実線51と点線56とで示される係数
列のうちサブフレームを除く区間に存在する絶対値の
最大なものを検索する。尚、検索区間として除かれるべ
きサブフレームはサブフレームステータスメモリ15の
記憶内容により指定される。即ちサブフレームステータ
スメモリは番地0〜11を有しており、サブフレームに
対応する番地“6"に“1"が記憶され、他の全ての番地に
は“0"が記憶されている。最大値検索器14はサブフレー
ムステータスメモリの内容を参照してサブフレームを
除く区間の最大を検索する。説明が前後するが、点55検
索時にはサブフレームステータスメモリの全番地の内容
は“0"であり、点55は全てのサブフレームの最大値とし
て検索されたものである。さて、最大値検索器14はサブ
フレームを除く区間からサブフレームに存在する点
57を最大値として検索する。最大値検索器14は点57を示
す位置情報と振幅情報とを相互相関補正器13とマルチパ
ルス一時メモリ16へと出力し、更にサブフレームの番号
4より“1"を引いた数“3"をサブフレームステータスメ
モリ15へ出力する。サブフレームステータスメモリは番
地“3"を“1"に書き替える。相互相関補正器13は前述の
手順により相互相関係数を補正する。補正結果は点線58
で示される。以下同様に第3番目の最大値がサブフレー
ムと同とを除く区間より検索される。このようにし
て12個のサブフレームには多くて1個のパルスがたてら
れるか、もしくは1個もたてられないかのいずれかの条
件でパルス設定を実行する。
上述の条件によりマルチパルスを検索することによりボ
コーダなみの低ビットレートで著しく音質改善の図れる
音声分析合成装置が実現される。低ビットレート領域で
は総マルチパルス数が符号化速度の関係から限定され、
総マルチパルスは少なくならざるを得ない。一方、少な
くとも1ピッチ周期内に1ケのパルスを必要とする事は
自明である。即ち不足の場合、ボコーダに於けるいわゆ
る倍ピッチエラーと同様の音質劣化を招く。従って少な
くとも1ピッチ周期内に1ケのパルスが必ず設定される
ようにする必要がある。本発明はサブフレームを利用す
る事により、これを可能としている。
第7図は従来のサブフレームを用いないマルチパルス検
索に於ける欠点を説明するための波形図である。第7図
(a)は相互相関係数列、第7図(b)は自己相関係数
列を示す。第7図(a)に於いて点61は最大値である。
点61に対応して1ケのパルスが設定され相互相関係数が
自己相関係数により補正される。補正結果を第6図
(c)に示す。第7図(c)に於いて点62は最大値であ
る。点62に対応して1ケのパルスが設定され相互相関係
数が自己相関係数により補正される。補正結果を第7図
(d)に示す。第7図(d)に於いて点63は最大値であ
る。点63に対応して1ケのパルスが設定される。このよ
うにして点61付近に3ケのパルスが集中する事になる。
従って設定し得る総マルチパルス数が少ない場合、全て
のピッチ周期内に1ケのパルスを設定する事が不可能と
なる事が多い。
再び第1図を参照して本発明の説明を続行する。
マルチパルス一時メモリ16に格納されたマルチパルス
は、次にパルス量子化符号化器17に読出され分析フレー
ムごとに所定の形式で量子化,符号化される。
第3図は第1図の実施例における量子化符号化器17の部
分を詳細に示すブロック図で、最大振幅パルス検索器17
1,パルス振幅正規化器172,パルス符号化器173,振幅量子
化器174,復号化器175,3値量子化器176等を備えて構成さ
れる。
ところで、本実施例では、入力音声を4800bpsのビット
レートで分析処理して合成側に送出しており、従って、
1分析フレーム長22.5mSECに対しては108ビットが提供
される。本実施ではこの108ビットの割当て配分を次の
ように設定している。
すなわち、パルス位置・極性はサブフレームあたり5ビ
ット、従って1分析フレームあたり60ビット、分析フレ
ームごとのパルス最大振幅には7ビット、LPC係数(K1
〜K10)は40ビット、さらにフレーム同期ビットとして
1ビット計108ビットである。
マルチパルス一時メモリ16から読出されるマルチパルス
は、最大振幅パルス検索器171、パルス振幅正規化器172
およびパルス符号化器173に供給される。
最大振幅パルス検索器171は、サブフレームによって指
定されるタイムスロット範囲ごとに最大限1個、つまり
有るか無いかという設定条件のもとでたてられたマルチ
パルス列を入力しつつ、分析フレームごとにその最大値
を検索しこれを振幅量子化器174に供給する。
振幅量子化器174は、入力する分析フレームごとの最大
値を非線形圧縮状態で量子化するため交換公式μ−1aw
を利用する対数圧縮を行ない、マルチパルスで表現され
るべき音源振幅のダイナミックレンジの圧縮を図ってい
る。この場合、圧縮パラメータμ=25とし、かつ最大振
幅情報のみを対象とすればよいのでμ−1owによる正側
圧縮だけでよく、このぶん1ビットだけ省略でき7ビッ
トで振幅量子化を行なっている。
振幅量子化器174の出力する最大振幅情報は所定の形式
で符号化されマルチプレクサ18および復号化器175に供
給される。
復号化器175は、符号化最大振幅情報を復号化してこれ
をパルス振幅正規化器172に供給する。
パルス振幅正規化器172は、分析フレームごとの非線形
圧縮最大振幅を指数延伸して原振幅状態に戻したうえこ
れを基準値とする分析フレーム内マルチパルスの正規化
を行ないその出力を3値量子化器176に供給する。
3値量子化器176は、こうして入力する正規化マルチパ
ルス振幅に対し次のように3値量子化を施す。
第4図は3値量子化の内容を説明するための3値量子化
特性図である。
横軸で表示する入力はパルス振幅正規化器172から提供
される正規化マルチパルス振幅であり、マルチパルスの
極性と振幅に対応し+1.0から−1.0の範囲にわたって分
布する。3値量子化は、この範囲を3分割したそれぞれ
を論理値“1",“0"“−1"の3値で量子化するものであ
る。
本実施例では入力範囲中+0.333から−0.333まで、すな
わち零を中心とした全体の1/3の範囲の正規化レベルの
ものはすべて論理値“0"とする。これは、振幅がある程
度以下で、音声合成においても殆んど不要と考えられる
ものについてはこれを量子化の対象から除外するためで
ある。
次に入力が+0.333から+1.0までのものは、すべてこれ
らを論理値“1"で表現する。また入力が−0.333から−
1.0のものについては、すべてこれらを論理値“−1"で
表現する。第3図の縦軸は入力に対応して表現される3
値の論理値の範囲を示し、これら入力と3値範囲との関
係を3値化特性線に示す。
こうして3値量子化したマルチパルスの振幅は、パルス
符号化器173に供給される。
パルス符号化器173にはマルチパルスの位置情報も提供
され、パルス符号化器173はこれら入力を所定の形式の
3値化マルチパルスとしてマルチプレクサ18に供給す
る。
上述したパルス量子化符号化において、3値化マルチパ
ルスの符号化は位置情報に4ビット利用し、振幅情報と
しては1ビット利用して全体として5ビットでマルチパ
ルスの正規化,かつ3値化の振幅と位置に関する情報を
表現している。位置情報は分析フレーム内の各サブフレ
ームごとに決定するものとし、4ビットで表現される0
〜15の値のうち1〜15の15個の数は各サブフレームの1
番目から15番目のタイムスロットに対応させてマルチパ
ルスがたてられたタイムスロット、つまりマルチパルス
の位置を指定せしめ、残った1個の0は振幅が3値の論
理値“0"をとる場合にこれを指定するために利用する。
また、振幅用に割当てた1ビットは、0が3値の論理値
“1"つまり極性が正であることを、また1は3値の論理
値“−1"つまり極性が負であることを指定するのに利用
される。
マルチプレクサ18には、こうして10次のKパラメータと
マルチパルスの最大振幅ならびに3値の論理値によって
表現された正規化マルチパルス、すなわち3値化マルチ
パルスが供給され、マルチプレクサ18は、これら入力を
適宜所定の形式で組合せて多重化し4800bpsのビットレ
ートで伝送路30を介して合成側に送出する。
第5図は分析側の音声パラメータ符号化におけるビット
割当説明図である。
分析フレームごとにその同期ビットとしてのフレーム同
期ビットSがビット目の1ビット、続いてLPC係数ビ
ットKとしてビット目からビット目までの40ビット
が10次のKパラメータ用に割当てられる。マルチパルス
の最大振幅用としてはビット目からビット目の7ビ
ットぶんが割当てられる。さらに、12個のサブフレーム
に立てられるべきマルチパルスに対しては、たとえば第
1番目のサブフレーム、SUB1に対しては、パルス位置情
報としてビット目からビット目までの4ビットが利
用され、さらに、この4ビットで表現される数値のうち
0は振幅零を指定するために利用される。SUB1の振幅は
ビットの1ビットによる1,0で+1もしくは−1を表
現し、これが12番目のサブフレームSUB12の振幅ビット
まで全体として108ビット利用して量子化,符号化され
る。
こうして4800bpsという低ビットレートのもとでマルチ
パルス分析を前提としての音声分析が可能となる。
次に第2図に示す合成側について、この処理内容を説明
する。
デマルチプレクサ21は分析側から伝送路30を介して伝送
されてきた多重化信号を受けるところの多重化分離を行
ない、分析フレームごとのKパラメータは復号化器22
に、また分析フレームごとのマルチパルス最大振幅は復
号化器23に、さらに、分析フレームごとの3値化マルチ
パルスの位置および振幅情報は復号化器24にそれぞれ供
給される。
復号化器22は、入力した符号化Kパラメータの復号化を
行ない、この10次のKパラメータ,K1〜K10をLPC合成器
26に供給する。
LPC合成器26は、全極型ディジタルフィルタを利用する
音声合成器で、入力したKパラメータをそのフィルタ係
数として利用する。
復号化器23は、入力した符号化最大振幅の復号化を行な
ったうえこれを指数延伸して非直線圧縮前の原最大振幅
情報を復元しこれをマルチパルス発生器25に供給する。
復号化器24は、入力した符号化3値化マルチパルスの復
号化を行ない、これと復号化器23から受ける最大振幅に
関する情報を利用して正規化の解除を行なって、分析フ
レームごとのパルス振幅最大値を振幅としサブフレーム
ごとに最大値1個の設定条件で検索,設定されたパルス
位置にたてられる形式でのマルチパルス列を発生し、こ
れをLPC合成器26に供給する。
LPC合成器26はマルチパルス発生器25から受けるマルチ
パルス列によって駆動され、ディジタル音声入力を再生
し、これをD/Aコンバータ27に供給する。
D/Aコンバータ27は、入力のアナログ化を行なったのちL
PFで不要な高周波成分を除去し音声出力として送出す
る。
こうして、分析フレームを複数のサブフレームに分割
し、各サブフレームごとに1個を越えない条件でマルチ
パルスを選択したうえ、さらに、これら選択されたマル
チパルスを“0"を含む“1",“−1"の3値の論理値で量
子化する手段を有することによって4800bpsという低ビ
ットレートのもとでも著しく音質の良好な合成音が得ら
れるが、その理由を要約すると次のとおりである。
その1は、独特なマルチパルス列による音源情報を利用
するため、正確なピッチ抽出の困難性に伴なう問題を基
本的に回避しうることである。また、その2は、マルチ
パルスと同様な検索技術によってサブフレームごとに選
択したパルス列を音源情報としているため、これらパル
ス列には極性が与えられており、無極性のパルス列や白
色雑音を有声/無声情報と関連させてモデル化する従来
のボコーダに比し、最低限のS/N(Signal/Noise)が保
証される。その3は、“0"を含む量子化を実施すること
により、サブフレームを設定し、かつ極性のみ付与され
るパルス列利用する場合に問題となる不要な群小パルス
を除去できること等である。
なお、上述した実施例では、マルチパルスをサブフレー
ムに対して設定する場合、(3)式にもとづく演算処理
にもとづいて、どのサブフレームかに次次のマルチパル
スがたてられることとなるが、このような基本的検索に
代えて時間的に古いサブフレームから新しいサブフレー
ムへと次次に検索していくことも容易に実施しうること
は明らかである。
〔発明の効果〕
以上説明したように本発明によれば、線形予測形式の音
声分析合成装置において、分析フレームを複数のサブフ
レームに分割し、各サブフレームごとに最大限1個を越
えない設定条件で選択したマルチパルス列を“0"を含む
3値の論理値で量子化する手段を備えることにより、ボ
コーダなみの低ビットレートで著しく音質改善の図れる
音声分析合成装置が実現できるという効果がある。
【図面の簡単な説明】 第1図は本発明の音声分析合成装置の分析側の一実施例
を示すブロック図、第2図は本発明の音声分析合成装置
の合成側の一実施例を示すブロック図、第3図は第1図
の実施例におけるパルス量子化符号化器17の部分を詳細
に示すブロック図、第4図は3値量子化の内容を説明す
るための3値量子化特性図、第5図は分析側の音声パラ
メータ符号化におけるビット割当説明図,第6図はサブ
フレームを利用したマルチパルス検索法を説明するため
の波形図、第7図は従来方法の欠点を説明するための波
形図である。 1……A/Dコンバータ、2……窓処理器、3……ノイズ
重み付フィルタ、4……LPC分析器、5……量子化器、
6……復号化器、7……K/αパラメータ変換器、8……
減衰係数印加器、9……インパルス応答算出器、10……
相互相関算出器、11……自己相関算出器、12……一時メ
モリ、13……相互相関補正器、14……最大値検索器、15
……サブフレームステータスメモリ、16……マルチパル
ス一時メモリ、17……パルス量子化符号化器、18……マ
ルチプレクサ、21……デマルチプレクサ、22〜24……復
号化器、25……マルチパルス発生器、26……LPC合成
器、27……D/Aコンバータ、30……伝送路。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】線形予測形式の音声分析合成装置であっ
    て、位置と振幅のうち少なくとも位置の自由度をもつマ
    ルチパルスを音源情報として利用しかつこのマルチパル
    スは1分析フレームを入力音声の最小ピッチ周期よりも
    短い区間単位で分割したサブフレームのそれぞれに対し
    最大限1個を越えない条件のもとで設定したものである
    ことを特徴とする音声分析合成装置。
  2. 【請求項2】マルチパルスの振幅が零を含む3値の論理
    値で量子化されたものであることを特徴とする特許請求
    範囲第(1)項記載の音声分析合成装置。
  3. 【請求項3】量子化によって得られる振幅零をパルス位
    置の符号化に包含するものであることを特徴とする特許
    請求範囲第(2)項記載の音声分析合成装置。
  4. 【請求項4】マルチパルスのパルス位置の符号化を前記
    サブフレームごとに実施することを特徴とする特許請求
    範囲第(1)項記載の音声分析合成装置。
  5. 【請求項5】マルチパルスの振幅が零を含む3値の論理
    値で量子化したものであることを特徴とする特許請求範
    囲第(4)項記載の音声分析合成装置。
  6. 【請求項6】量子化によって得られる振幅零をパルス位
    置の符号化に包含するものであることを特徴とする特許
    請求範囲第(5)項記載の音声分析合成装置。
JP61122689A 1986-04-15 1986-05-27 音声分析合成装置 Expired - Lifetime JPH0738115B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61122689A JPH0738115B2 (ja) 1986-05-27 1986-05-27 音声分析合成装置
CA000534620A CA1323934C (en) 1986-04-15 1987-04-14 Speech processing apparatus
US07/421,314 US4991215A (en) 1986-04-15 1989-10-13 Multi-pulse coding apparatus with a reduced bit rate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61122689A JPH0738115B2 (ja) 1986-05-27 1986-05-27 音声分析合成装置

Publications (2)

Publication Number Publication Date
JPS63118199A JPS63118199A (ja) 1988-05-23
JPH0738115B2 true JPH0738115B2 (ja) 1995-04-26

Family

ID=14842184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61122689A Expired - Lifetime JPH0738115B2 (ja) 1986-04-15 1986-05-27 音声分析合成装置

Country Status (1)

Country Link
JP (1) JPH0738115B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2691921B2 (ja) * 1988-11-25 1997-12-17 日本電信電話株式会社 音声符号化法

Also Published As

Publication number Publication date
JPS63118199A (ja) 1988-05-23

Similar Documents

Publication Publication Date Title
US4220819A (en) Residual excited predictive speech coding system
US6385577B2 (en) Multiple impulse excitation speech encoder and decoder
JPS6046440B2 (ja) 音声処理方法とその装置
US4991215A (en) Multi-pulse coding apparatus with a reduced bit rate
JPH0439679B2 (ja)
JP2586043B2 (ja) マルチパルス符号化装置
US5235670A (en) Multiple impulse excitation speech encoder and decoder
JP3255190B2 (ja) 音声符号化装置並びにその分析器及び合成器
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0738115B2 (ja) 音声分析合成装置
JP3552201B2 (ja) 音声符号化方法および装置
JPH087597B2 (ja) 音声符号化器
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JPS62102294A (ja) 音声符号化方式
JP2853126B2 (ja) マルチパルス符号化装置
JP2629762B2 (ja) ピッチ抽出装置
JP3024467B2 (ja) 音声符号化装置
JP2898641B2 (ja) 音声符号化装置
JPH043876B2 (ja)
JPS6087400A (ja) マルチパルス型音声符号復号化装置
JPH0242240B2 (ja)
JPH043880B2 (ja)
JPH043560B2 (ja)