JPH0235993B2 - - Google Patents

Info

Publication number
JPH0235993B2
JPH0235993B2 JP58131439A JP13143983A JPH0235993B2 JP H0235993 B2 JPH0235993 B2 JP H0235993B2 JP 58131439 A JP58131439 A JP 58131439A JP 13143983 A JP13143983 A JP 13143983A JP H0235993 B2 JPH0235993 B2 JP H0235993B2
Authority
JP
Japan
Prior art keywords
lsp
standard pattern
pattern
frequency
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58131439A
Other languages
English (en)
Other versions
JPS6023900A (ja
Inventor
Satoru Taguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58131439A priority Critical patent/JPS6023900A/ja
Priority to CA000439473A priority patent/CA1203906A/en
Priority to US06/544,198 priority patent/US4701955A/en
Publication of JPS6023900A publication Critical patent/JPS6023900A/ja
Publication of JPH0235993B2 publication Critical patent/JPH0235993B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明はLSP型パタンマツチングボコーダに関
する。
入力音声信号のスペクトル包絡に最近似するス
ペクトル包絡を、予め音声資料を分析して得られ
た標準パタンと照合して選択し、これを入力音声
信号に関する有声および無声ならびに無音に関す
る情報のほか、ピツチ周期および音の強さ等の音
源情報とともに分析側から合成側に伝送して入力
音声信号の波形を再生するパタンマツチングボコ
ーダは近時よく知られており、またこのようなパ
タンマツチングボコーダの分析側と合成側とにお
ける分析および合成パラメータとしてLSP係数を
利用するLSP型パタンマツチングボコーダもまた
よく知られている。
このLSP係数は線形予測係数、PARCOR(偏自
己相関)係数等とともに声道の共振特性を表わす
パラメータとして利用されるものであり、声門を
仮想的に完全開放および完全閉塞した場合の声道
伝達関数の線スペクトル周波数によるパラメータ
であることはよく知られている。
このようなLSP係数は周波数領域で表わされる
パラメータであり、αパラメータ等が時間領域で
表わされるパラメータであるのに対してより直観
的に扱い得る量であるうえ、少ない情報量でしか
も合成すべき入力音声信号の音質も高い精度のも
のが得られるといつたさまざまな特徴を有し、従
つてこのLSP係数を声道フイルタの伝達関数を決
定する分析および合成パラメータとして利用し入
力音声信号の分析、合成を行なうLSP型ボコーダ
も上述したような特徴を有するものとして構成さ
れる。
このLSP型ボコーダを利用するLSP型パターン
マツチングボコーダは、LSP分析器で分析された
LSP係数と、予め音声資料をLSP分析して得られ
る音声の標準的なLSP係数の分布内容に関する標
準パタンとを照合することによつて両者の類似度
が最大となる最近似標準パタンを選択し、これを
合成側に音源情報とともに伝送して入力音声信号
の合成を図るものであり、スペクトル包絡を10ビ
ツト前後の低情報量で分析、合成しうる方法とし
て近時よく知られつつあり、LSPボコーダにパタ
ン照合、復号を行なう機能を付加することによつ
て容易に構成しうるものである。
このようなLSP型パタンマツチングボコーダに
おけるLSPボコーダは、通常LPC(Linear
Prediction Coefficient、線形予測係数)分析器
によつて得られたLPC係数からLSP係数を誘導
するという手段によつてLSP係数を得ている。
さて、パタンマツチングの単位としては入力音
声のスペクトル包絡の如く音声の物理的特徴に着
目した物理単位と、音声の言語的特徴に着目した
言語単位とがあり、いずれを利用するかはパタン
マツチングボコーダの構成内容等に対応して効率
のいいものが選択され、またこれらの単位をマツ
チングの尺度として行なうパタン照合による標準
パタンの選択にはパラメータの空間距離による方
法と言語的な要素との対応による方法とがある。
従つて、たとえばLSP型パタンマツチングボコー
ダの如く、LSPボコーダの機能を内蔵するものに
あつては、LSPボコーダの機能との親和性を考慮
し、マツチング単位には物理単位、選択方法には
パラメータ空間距離を利用することが望ましいと
言える。
LSP型パタンマツチングボコーダにおけるパタ
ンマツチング尺度として利用されるパラメータ空
間距離は、LSP係数もLPC,PARCOR係数と同
様に空間ベクトルと見做すことができ、この空間
ベクトル間の距離を尺度としてその大小比較によ
つて入力音声信号のLSP係数に最も近い標準パタ
ンを選択するために利用される。このような空間
ベクトルであるLSP係数間の距離は次の(1)式に示
すスペクトル距離Dijによつて示される。
Dij=1/π〓0{Si(ω)−Sj(ω)}2dω………
(1) (1)式はまた次の(2)式の如く近似等式に変換しう
る。
DijNK=1 Wk{Pk(i)−Pk(j)2 ………(2) (1)および(2)式においてi,jはLSP分析および
合成における処理単位区間であるフレーム(ブロ
ツク)の番号、Si(ω),Sj(ω)は周波数ωの関
数としてのフレームiおよびjの対数スペクト
ル、Pk(i),Pk(j)はフレームiおよびjにおけるN
次のLSP係数、WkはN次のLSPスペクトル感度
である。
LSP係数の次数は、LSP係数によつて実現すべ
き声道フイルタを構成するための全極型デジタル
フイルタの次数と対応し、N次の全極型デジタル
フイルタにあつては、通常LSP周波数と呼ばれる
N個の線スペクトルω1,ω2,ω3……ωNを示す。
またN次のLSPスペクトル感度WkはN次のLSP
係数の微少変化によつて起るスペクトル変化の程
度を示すものであつて、通常LSP周波数に対応し
て決定されるLSP周波数スペクトル感度が用いら
れる。
さて、入力音声信号のスペクトル包絡に最も近
似した標準パタンを、予め登録された標準パタン
群から選択するには(1)式によるスペクトル距離の
計算を入力音声信号の全フレームにわたつて全標
準パタンとの間で実行すればよいことになるが、
この演算量は極めて膨大なものとなるため、一般
的には(2)式の近似等式を利用していわゆる簡易ス
ペクトル距離を計測する。これは、分析された入
力音声信号の空間特徴ベクトルであるN次のLSP
係数Pk(i)と、標準パタンに登録されている空間特
微ペクトルPk(j)との内積を各次数のLSP係数ごと
に求めたうえ、LSP係数の次数に対応するLSP周
波数ごとに予め設定する重みづけ係数としての
Wkを乗じた簡易スペクトル距離計測を行なうも
のである。
従来のこの種のLSP型パタンマツチングボコー
ダは、(2)式に示す重みづけ係数WkにLSP周波数
に対応するLSP周波数スペクトル感度を利用して
いるが、このLSP周波数スペクトル感度はLSP周
波数間隔によつて異なるため、単純にこのような
スペクトル感度を用いて計測したスペクトル距離
をパタンマツチングの尺度として標準パタンを選
択した場合には合成すべき音声を大きく劣化する
ことが多いという欠点がある。
本発明の目的は上述した欠点を除去し、LSP周
波数間隔に対応するLSP周波数間隔スペクトル感
度またはLSP周波数間隔を重みづけとしてLSP周
波数スペクトル感度とともに利用してスペクトル
距離を求め、これをマツチング尺度としてパタン
マツチングを行なうという手段を備えることによ
り、音質の劣化を大幅に改善しうるLSP型パタン
マツチングボコーダを提供することにある。
本発明のボコーダは、音声資料のLSP(Line
Spectrum Pair)係数の分布に関する標準パタン
と入力音声信号をLSP分析して得られるLSP係数
に関するパタンとを照合して入力音声信号の合成
を行なうLSP型パタンマツチングボコーダにおい
て、前記標準パタンのLSP係数と前記入力音声信
号のLSP係数との重みづけ内積によるスペクトル
距離を計測して前記照合のマツチング尺度を決定
する場合に前記重みづけを前記標準パタンにおけ
るLSP係数としてのLSP周波数に関する周波数ス
ペクトル感度とともにLSP周波数の周波数間隔に
対応する周波数間隔スペクトル感度またはLSP周
波数の周波数間隔によつて行なうマツチング尺度
決定手段を備えて構成される。
次に図面を参照して本発明を詳細に説明する。
第1図A,Bは本発明の第一の実施例を示すブロ
ツク図であり第1図Aは分析側、第1図Bは合成
側の構成を示すブロツク図である。
第1図Aに示す分析側1は、LPF(Low Pass
Filter)11、A/Dコンバータ12、窓関数処理
器13、自己相関係数計測器14、LPC分析器
15、有声/無声/無音判別器16、ピツチ抽出
器17、LSP分析器18、スペクトル距離計測器
19、標準パタンメモリ20、周波数間隔スペク
トル感度メモリ21、周波数スペクトル感度メモ
リ22および符号化器23を備えて構成され、ま
た第1図Bに示す合成側2は、復号器24、パタ
ン復号器25、標準パタンメモリ26、LSP合成
器27、可変利得増幅器28、切替器29、パル
ス発生器30、雑音発生器31、D/Aコンバー
タ32およびLPF33を備えて構成される。
第1図Aにおいて、入力ライン111を介して
入力する入力音声信号はLPF11によつて所定
の分析帯域の周波数成分がフイルタリングされ、
出力ライン112を介してA/Dコンバータ12
に送出されて所定のビツト数でデジタル化された
のち量子化音声信号として出力ライン121を介
して窓関数処理器13に送出される。
窓関数処理器13は、入力した音声信号の
30mSECずつにハミング関数を乗算する窓関数処
理を行なうがこの窓関数処理は10mSEC周期で繰
返されこれを基本フレーム周期としている。
こうして窓関数処理された入力音声信号の音声
波形データは基本フレームごとに出力ライン13
1を介して自己相関係数計測器14に送出され
る。
自己相関係数計測器14は、入力した音声波形
データを乗算回路等を利用して各遅れ時間におけ
る自己相関係数を必要な遅れ時間内で計測し、こ
の自己相関係数データを出力ライン151を介し
てLPS分析器15に、また出力ライン152を介
して有声/無声/無音判別器16およびピツチ抽
出器17に送出するとともに、遅れ時間零におけ
る自己相関係数をとりこれを基本フレームあたり
の短時間音声電力データとして出力ライン153
を介して符号化器23に送出する。
有声/無声/無音判別器16は入力した自己相
関係数データを利用し、各基本フレームごとに含
まれる音声信号の有声あるいは無声、もしくは無
音状態を判別しこれを有声/無声/無音判別デー
タとして出力ライン161を介して符号化器23
に送出、またピツチ抽出器17は入力した自己相
関係数データを利用して各基本フレームごとに含
まれる音声信号のピツチデータを抽出、これを出
力ライン171を介して符号化器23に送出す
る。
LPC分析器15は、後述するLSP分析器18
とともに可変長フレームLSP分析回路を構成する
ものであり、本実施例においてはLSP分析器18
において、有声/無声/無音判別器16から出力
ライン162を介して受ける有声/無声/無音判
別データにもとづきフレームを、有声および無声
に対応する有音区間と、それ以外の無音区間とに
分けこれら2つの区間にそれぞれ予め設定する可
変長伝送フレームを設定している。この場合、
LPC分析器15はよく知られたレビンソン法に
よつて、入力したフレームごとの自己相関係数を
利用して線形予測係数を予め定める次数、本実施
例の場合は10次まで算出し、これを出力ライン1
54を介してLSP分析器18に送出し、LSP分析
器18はこの線形予測係数をNewtonの反復法を
利用する高次方程式法によつて10次のLSP係数に
変換し、さらに基本フレームごとの一定周期をも
つたこのLSP係数列を、出力ライン162を介し
て入力する有声/無声/無音判別データによる情
報を利用しながら予め設定する近似関数による最
適近似法によつて可変長周期化した可変フレーム
長に変換する。
また、このようなLSP分析の前処理として、入
力音声データの高域強調を行なうために波形の1
次差分を利用し波形領域における高域成分の事前
強調を行なうプリエンフアシス(Pre−
Emphasis)処理、および自己相関係数領域にお
けるLag関数によるLagウインド処理が行なわれ
るが、これらの前処理はLSP係数間の最小間隔を
広げ、後述する合成側2におけるLSP合成器27
の全極形デジタルフイルタの安定性を増大させる
ためLSP量子化感度の低減を図つて行なわれるも
のである。
さて、このように得られた10次のLSP係数は出
力ライン181を介してスペクトル距離計測器1
9に送出される。またLSP分析器18からは可変
長フレームを形成する際に基本フレーム長を伸縮
したフレーム変化率情報、いわゆるレピートビツ
トデータを出力ライン182を介して符号化器2
3に送出する。
LSP分析器18から出力ライン181を介して
スペクトル距離計測器19に送出された10次LSP
係数は、スペクトル距離計測器19において(2)式
の近似等式により、いわゆる簡易スペクトル距離
を演算する。
この場合、(2)式における重みづけ係数Wkは原
則として周波数間隔スペクトル感度メモリ21に
ストアされた周波数間隔スペクトル感度を出力ラ
イン211を介して入力し、周波数スペクトル感
度メモリ22にストアされた周波数スペクトル感
度は分析、合成すべき入力音声信号の内容が周波
数間隔スペクトル感度を利用しなくてもすむよう
な場合のみ必要に応じて出力ライン221を介し
て読出して利用するようにしている。
(2)式による簡易スペクトル演算における入力音
声信号の特徴ベクトル、すなわちPk(i)に相当する
10次LSP係数と、標準パタンメモリ20に登録さ
れた標準パタンの特徴ベクトル、すなわちPk(j)
相当する標準10次LSP係数との内積が(2)式の如く
まず演算され、この内積に対して通常は周波数間
隔スペクトル感度Wkが重みづけ係数として乗算
されたものが1次のLSP係数から10次のLSP係数
まで、入力音声信号の可変長フレームのおのおの
について標準パタンメモリ20に登録されたLSP
係数の各パタンとの間で実行され、スペクトル距
離Dijが決定し、可変長フレームのおのおのにつ
いてこのスペクトル距離Dijが最も小さいものが
それぞれ標準パタンとして選択される。このよう
な標準パタンは、標準パタンメモリ20における
標準パタン登録アドレスコードを指定する標準パ
タン指定コードデータとして次次に出力ライン1
91を介して符号化器23に送出される。
標準パタンメモリ20に登録され、ストアされ
ている標準パタンは、本実施例の場合、次のよう
にして予め別なコンピユータによるオフライン処
理で作成されるが、これを本実施例によるボコー
ダを利用して予め作成しておいても一向に差支え
ない。
まず、予め設定した音声資料を利用しLPC分
析等の手法によつて無音区間の除去、不要な近接
フレームの除去、有声、無声、無音による分類等
の前処理を実施する。
この場合、フレーム周期は10mSECとし、この
各フレームごとに有声、無声、無音および有声と
無声との境界音いずれに属するかのタグコードを
与える。次に無音フレームを除去し残りのフレー
ムを有声と無声とに分離し、このとき境界音は有
声と無声とのいずれかに含ませるものとする。
さらに、時間的に接近しスペクトル距離の小さ
いフレームを除去し、このようにして必要とする
サンプル数の削減を図つたうえこれらを従来から
知られている標準パタン選択手法によつて、予め
設定する各スペクトル距離ごとに分類して標準パ
タンとして登録、ストアしておくものである。
上述した標準パタン手法は、本実施例の場合10
次元LSP係数の空間UがN個のパタンから成るも
のとし、このN個のパタンのおのおのについて(2)
式によつてスペクトル距離を計測し、これが予め
設定するスペクトル距離域値θdB2をもつものを
N個のパタンすべてについて求め、このパタン数
Mi(i=1,2,……N)のうち最大のMiをも
つパタンPLを決定したうえ、パタンPLにおける
スペクトル距離が、予め設定する値θdB2以下の
パタンを10次元LSP係数の空間Uから除去したの
ちPLを標準パタンとして登録し、このような操
作を空間Uに含まれるパタンがなくなるまで繰返
して実施して標準パタンとして登録するものであ
る。
また、周波数間隔スペクトル感度メモリ21お
よび周波数スペクトル感度メモリ22にそれぞれ
ストアされている内容は次のようにして決定され
る。
音声資料を(1)式によつて実測して得られるLSP
のK番目(K次)の要素Pkのスペクトル感度は、
次の(3)式によつて求められる。
Wk=1/π〓0{Si(ω)−Sj(ω)}2dω /(ΔPk)2dB2/ラジアン ……(3) (3)式においてΔPkはPkの微少変化であり、Si
(ω)はこの場合P1,P2,……Pk……PL等から求
めたスペクトル包絡、Sj(ω)はP1,P2,……Pk
+ΔPk……PLから求めたスペクトル包絡を用い
ている。
従つて(3)式によつて、ΔPkを予め設定する値
θラジアンとした場合、10次のLSP係数の各周波
数に関するLSP周波数スペクトル感度が得られ
る。
また、LSP周波数間隔スペクトル感度Wktにつ
いては(3)式におけるωtとωt+1とのLSP周波数間隔
比に対するスペクトル感度比として次の(4)式によ
つて求められる。
Wkt=1/π〓0{Si(ω)−Sj(ω)}2 dω/r2dB2/ratio ……(4) ただし(4)式においてrは|((ωt+1)−(ωt)の

隔比)−1.0|であり、Si(ω)はP1,P2,……
Pk,……PIから求められるスペクトル包絡、Sj
(ω)はP1,P2,……,Pt−(Pt+1−Pt)・r,
Pt+1+(Pt+1−Pt)・r,……P1から求めるスペク
トル包絡である。
パタン照合においては、こうして得られた周波
数間隔スペクトル感度を重みづけ係数として入力
音声信号のLSP分析データと標準パタンとのスペ
クトル距離を(2)式によつて演算し、スペクトル距
離が最小となる標準パタンを可変長フレームごと
に検索し、この標準パタン指定コードデータを出
力ライン191を介して符号化器23に送出す
る。
周波数スペクトル感度メモリ22にストアされ
た周波数スペクトル感度を重みづけ係数として利
用する場合には、(3)式によつて設定された重みづ
け係数Wkを利用し、上述した内容とほぼ同様に
パタン照合を実施する。
符号化器23は、このようにして供給された各
データを予め設定する符号形式によつて符号化し
これを伝送路231を介して合成側2に伝送す
る。
合成側2では伝送路231を介して入力した各
種符号化情報の復号化を行ない、標準パタン指定
コードデータは入力ライン251を介してパタン
復号器25、レピートビツトデータは入力ライン
271を介してLSP合成器27、短時間音声電力
データは入力ライン281を介して可変利得増幅
器28、有声/無声/無音判別データおよびピツ
チデータはそれぞれ入力ライン291および30
1を介して切替器29およびパルス発生器30に
供給する。
パタン復号器25は、入力した標準パタン指定
コードデータによつて指定される標準パタンを標
準パタンメモリ26から出力ライン261を介し
て読出し、これを出力ライン252を介してLSP
合成器27に送出する。標準パタンメモリ26は
分析側1における標準パタンメモリ20とほぼ同
一のものであり、パタン復号器25によつてLSP
合成器27に供給されるデータは分析側のパタン
照合の結果入力音声信号の内容に対応して可変長
フレームごとに選択された標準パタンによるLSP
係数列、すなわちLSP周波数列である。
LSP合成器27は、こうして入力したLSP係数
列を含む可変長フレームを、入力ライン271を
介して受けるレピートビツトデータによつてもと
の基本フレームごとに復元し、これを予め設定す
る近似関数を利用して入力音声信号の標本化間
隔、すなわち合成側1の窓関数処理器14におけ
る標本化周期でLSP係数を補間する。こうして補
間処理を受けた基本フレームごとのLSP係数は全
極形モデルによる10次のLSP音声合成デジタルフ
イルタのフイルタ係数として供給される。
LSP音成合成デジタルフイルタはこのようにし
て入力するフイルタ係数と、可変利得増幅器28
から出力ライン282を介して入力する音源励振
電力とによつて音声合成デジタルフイルタとして
の演算を行ない、デジタル形式の合成音声出力を
得てこれを出力ライン271を介してD/Aコン
バータ32に送信する。
上述した音源励振電力は、入力音声信号からス
ペクトル包絡成分を除いたいわゆる残差電力に対
応するものであり、入力音声信号に再現する場合
にスペクトル包絡成分としてのLSP係数とともに
必要な音源情報を付与するものでこれは次のよう
にして発生する。
入力ライン281を介して入力した各基本フレ
ームごとの短時間音声電力データは可変利得増幅
器28に供給される。
一方、パルス発生器30は入力ライン301を
介してピツチデータを受け、このピツチデータに
対応し予め設定された周波数のパルスをピツチパ
ルスとして発生しこれを出力ライン302を介し
て切替器29に送出する。
切替器29は、入力ライン291を介して受け
る有声/無声/無音判別データが有声を指定する
ときは上述したピツチパルスを選択し、また無声
もしくは無音を指定するときには雑音発生器31
の出力する白色雑音を出力ライン311を介して
入力するように切替える動作を行なう。切替器2
9によつて選択出力されるパルス発生器30もし
くは雑音発生器31の出力は、出力ライン292
を介して可変利得増幅器28に供給され、入力ラ
イン281を介して入力した短時間音声電力デー
タの大きさに対応する重みづけを受けるように可
変増幅されて音源励振電力として出力ライン28
2に送出される。
こうしてLSP合成器27から出力したデジタル
形式の合成音声信号は次にD/Aコンバータ32
によつてアナログ化され、LPF33によつて所
要の帯域をフイルタリングして合成音声信号とし
て出力ライン331に送出される。
このようにしてLSP周波数間隔スペクトル感度
を重みづけ係数として計測したスペクトル距離に
よるパタン照合を介して行なう入力音声信号の分
析、合成が容易に実施できる。
第2図は本発明の第二の実施例によるLSP型パ
タンマツチングボコーダにおける分析側の構成を
示すブロツク図である。第2図に示す第二の実施
例による分析側の構成は第1図Aに示す第一の実
施例におけるスペクトル距離計測器19を、スペ
クトル距離計測器(1)40およびスペクトル距離計
測器(2)41によつて構成した点のみが異なり、他
の同一記号による構成内容はすべて同一でありこ
れらに関する詳細な説明は省略する。
第2図に示す本発明第二の実施例による分析側
の構成は、LSP周波数スペクトル感度を重みづけ
係数として計測したスペクトル距離をマツチング
尺度として、予め複数の標準パタン候補を予備的
に選択したのち、この標準パタン候補からLSP周
波数間隔スペクトル感度によるスペクトル距離に
基づき標準パタンを決定する手段を備えることを
特徴とするものであり、次のようにして実施され
る。
LSP分析器18から出力ライン181を介して
出力する可変長フレームごとのLSP係数はスペク
トル距離計測器(1)40およびスペクトル距離計測
器(2)41に供給される。
第3図は第二の実施例における標準パタン選択
における動作のフローを示す標準パタン選択動作
フローチヤートである。以下第3図を参照しなが
ら第2図の実施例について説明する。
分析側1の動作開始のスタート501によつて
LSP分析器18によつて10次LSP分析502を行
ない、得られたLSP係数列についてパタン照合お
よび標準パタン候補選択503を実施する。
スペクトル距離計測器(1)40は、入力音声信号
のLSP係数と標準パタンメモリ20にストアされ
ている標準パタンのLSP係数とのスペクトル距離
を周波数スペクトル感度メモリ22にストアされ
ている周波数スペクトル感度を重みづけ係数とし
て(2)式によつて実施し、最もスペクトル距離の小
さい標準パタンから順に予め設定する個数i個選
択しこれらの標準パタン候補S1,S2……Siおよび
これらの標準パタン候補とのスペクトル距離D1
D2,……Diを得る。
スペクトル計測器(1)40は引続いて分析フレー
ム間隔算出504を実施するが、これはパタン照
合および標準パタン候補選択503によつて求め
た各標準パタン候補の10次のLSP周波数間隔ω〓
を分析フレーム間隔として算出するものであり、
通常は10次のLSP周波数ω1,ω2,……ω10のうち
ω1とω2の差がほぼ入力音声の特徴を代表する分
析フレームと考えてよいので、本実施例にあつて
もω〓=ω2−ω1として分析フレームを代表させて
いる。
この分析フレーム間隔ω〓は次に判定(1)505
によつて、予め設定する分析フレーム間隔判定域
値ωsと比較しωsよりも小さいか否かを判定し、
もしNOならば、すなわちω〓>ωsのときは標準パ
タン選択(1)510によつて、前述したパタン照合
および標準パタン候補選択503によつて選択し
た最も小さいスペクトル距離D1を有する標準パ
タン候補S1を入力音声信号に最近似した標準パタ
ンとして選択したうえパタン照合を終了512と
して、この標準パタンを指定する標準パタン指定
コードデータを出力ライン401を介して符号化
器23に送出する。
一方、判定(1)505によつてω〓<ωsが成立し
てYESのときはスペクトル距離比算出506を
スペクトル距離計測器(1)40において実施する。
このスペクトル距離比はRjはDj/D1で示され、
ここでjは2,3,……iを表わす。
スペクトル距離比Rjは次にスペクトル距離比
判定域値Rsと比較し、LSP周波数ω2に対応する
RjすなわちR2がRsより小さいか否かの判定を行
なつて得られる。R2<Rsの判定を行なう理由は
前述した如く、LSP周波数ω2とLSP周波数ω1
の差がほぼ入力音声信号のスペクトル包絡の特徴
を一義的に決定する特徴と有するからである。
判定(2)507によつてR2<Rsの判定がNOであ
る場合、すなわちR2>Rsである場合には標準パ
タン選択(1)510によつて標準パタン候補S1を標
準パタンに選定し出力ライン401に送出する。
判定(2)507によつてR2<Rsの判定の判定が
YESである場合、すなわちR2<Rsのときにはス
ペクトル距離比域値を越える標準パタン候補除外
508を実施する。これによりスペクトル距離比
域値Rsを越える標準パタン候補を除外した残り
S1,S2,……Skを選択し、これら選択された標
準パタン候補の第1のスペクトル距離D1,D2
……Dkを出力ライン402を介してスペクトル
距離計測器(2)41に送出する。標準パタン選択(1)
510を含み上述した処理がスペクトル距離計測
器(1)40と標準パタンメモリ20および周波数ス
ペクトル感度メモリ22とによつて実施される。
スペクトル距離計測器(2)41は、出力ライン1
81を介して入力した入力音声信号のLSP係数
と、周波数間隔スペクトル感度メモリ21にスト
アされた周波数間隔スペクトル感度データを利用
しつつ、入力した標準パタン候補S1,S2,……
Skの各スペクトル距離D1,D2,……Dkについて
次の(5)式に示すように分析フレーム間隔の比を加
味した第2のスペクトル距離DNjを計測する、分
析フレーム間隔を加味したスペクトル距離算出5
09を実施する。
このことはLSP周波数で表わされる特徴ベクト
ルをほぼ一義的に決定する分析フレーム間隔の比
をスペクトル距離計測によつて得られる近似度を
さらに照合するひとつの尺度として、前述したス
ペクトル距離D1,D2,……Dkのスペクトル距離
を再度計測した第2のスペクトル距離を求めるも
のである。
DNj=Dj+WN・W〓 ・ABS(ω〓/ω2 (j)−ω1 (j))−1.0) ……(5) (5)式においてDNjはD1,D2……Dkのうちの任
意のDjを対称とする第2のスペクトル距離、ω2 (j)
−ω1 (j)はスペクトル距離Djを有する標準パタン候
補の分析フレーム間隔、ω〓/2 (j)−ω1 (j)は分析フ

ーム間隔比、ABSは絶対値記号、W〓は分析フレ
ームω2−ω1に対応する周波数間隔スペクトル感
度、WNは右辺第2項の演算における重みづけ係
数である。
右辺第2項の演算は、分析フレーム間隔比がた
とえば1となるときは零となりDjがそのまま第
2のスペクトル距離となり、分析フレーム間隔比
が1以外のときはDjに対し分析フレーム間隔比
に対応する値が加味されたDNjを得る。このよう
にして分析フレーム間隔比を加味した第2のスペ
クトル距離DNjは次に、標準パタン選択(2)511
を行なつて最小の値をもつDNjを選択し、この最
小のDNjに対応する標準パタン候補Sjを標準パタ
ンとして決定し、この標準パタンを指定する標準
パタン指定コードデータを出力ライン411を介
して符号化器23に送出する。
第1図Bとほぼ同じ構成内容を有する合成側
(図示せず)ではスペクトル距離計測器(1)40、
およびスペクトル距離計測器(2)41いずれかによ
つて送出される標準パタン指定コードデータをパ
タン復号器の制御のもとに標準パタンメモリから
読出し、第1図Bにおける内容と同一の合成処理
を実施する。第4図は本発明の第三の実施例にお
けるLSP型パタンマツチングボコーダの分析側の
構成を示すブロツク図である。
第4図に示す第三の実施例における分析側の構
成は、第1図Aに示す第一の実施例の分析側にお
ける標準パタンメモリを、音声資料のLSP周波数
間隔にもとづいて分類された複数個の標準パタン
フアイルによつて構成し、人力音声信号をLSP分
析して得られるLSP周波数の周波数間隔を尺度と
してまず標準パタンフアイルを選択したのち、こ
の標準パタンフアイルにストアされているLSP周
波数と入力音声信号を分析したLSP周波数との間
でスペクトル距離を計測して標準パタンを決定
し、こうして得られた標準パタンフアイルの指定
コードデータおよび標準パタンの指定コードデー
タを分析側から合成側に伝送する手段を備えて標
準パタンの決定を効果的に実施することを図つた
ものである。
第4図において、I個の標準パタンフアイル1
〜(),50−1,50−2,50−3,……
50−はそれぞれ音声資料にもとずいて予め設
定された複数のLSP係数の周波数間隔を有する
個の標準パタンフアイルである。
出力ライン181を介して供給されるLSP係数
は、LSP間隔計測器51によつて予め設定する
LSP周波数間隔、本実施例においては10次のLSP
周波数ω1,ω2,……ω10のうちω1とω2との周波
数間隔を計測し出力ライン511を介してこれを
標準パタン選択器52に送出する。
標準パタン選択器52は、各標準パタンフアイ
ル50−1〜50−にストアされているフアイ
ル内容を出力ライン500−1〜500−を介
して読出し、最も近似したLSP周波数間隔を有す
る標準パタンフアイルを決定しこの標準パタンフ
アイルの番号を指定する標準パタンフアイル番号
指定コードデータを出力ライン521を介して符
号化器23に送出する。
標準パタン選択器52はまた、決定された標準
パタンフアイルにストアされている内容を出力ラ
イン522を介してスペクトル距離計測器19に
送出し、LSP分析器18から供給される入力音声
信号の分析LSP係数とのスペクトル距離計測を式
(2)によつて実施してパタン照合を実施し、決定し
た標準パタンフアイルに含まれる最近似標準パタ
ン番号を選択し、この標準パタンを指定する標準
パタン番号指定コードデータを出力ライン191
を介して符号化器23に送出する。
なお、スペクトル距離計測器19におけるスペ
クトル距離演算においては、周波数スペクトル感
度メモリ22にストアされている周波数スペクト
ル感度を(2)式における演算の際の重みづけ係数と
して利用している。
こうして分析側1から符号化器23、伝送路2
31を介して合成側に伝送される標準パタンフア
イル番号指定コードおよび標準パタン番号指定コ
ードの両データは、分析側1において分析された
音源情報ならびにレピートビツトデータとともに
合成側で利用され入力音声信号が再生されること
となるが、合成側(図示せず)は第1図Bに示す
合成側2の構成内容中、標準パタンメモリ26を
第4図に示す標準パタンフアイル50−1〜50
−によつて置換したものとして構成し、かつパ
タン復号器25には前述した標準パタンフアイル
番号指定コードおよび標準パタン番号指定コード
に関する両データを供給するものとして標準パタ
ンを再生復号し、他は全く第1図Bによつて説明
した内容で合成処理を実施することができる。
以上説明した第一、第二および第三の実施例に
より、従来のLSP周波数スペクトル感度を重みづ
けとするスペクトル距離計測に対して、LSP周波
数間隔スペクトル感度またはLSP周波数間隔を重
みづけとして得られるスペクトル距離を併用して
標準パタンとの照合におけるマツチング尺度とし
忠実な入力音声信号の分析および合成を図つた
LSP型パタンマツチングボコーダが容易に実現し
うる。
本発明は、LSP型パタンマツチングボコーダに
おいて、標準パタンのLSP係数と入力音声信号を
分析して得られるLSP係数とのスペクトル距離を
計測しこれをマツチング尺度とする場合、スペク
トル距離計測における重みづけとして従来利用さ
れているLSP周波数スペクトル感度のほかにLSP
周波数間隔スペクトル感度またはLSP周波数間隔
を利用して忠実な入力音声信号の合成を図つた点
に基本的な特徴を有するものであり、第1図A,
B、第2図および第4図に示す本発明第一、第二
および第三の実施例の変形も種種考えられる。
たとえば、上述した各実施例における分析側
で、LSP分析器18によつて得られるLSP係数は
高次方程式法によつて演算しているが、これは高
次方程式法とともによく知られた零点探索法によ
つて実施してもよく、またこのLSP係数は可変長
フレームごとに分析抽出しているが、この可変長
フレームは所望に応じ固定長フレームとしても差
支えない。
また、LSP係数分析の前処理として行なわれる
プリエンフアシス処理およびLag関数処理は分析
および合成すべき入力音声信号の特徴、音声合成
デジタルフイルタの内容、データビツト数の配分
等を勘案し所望に応じて実施の有無を選択しうる
ことは明らかである。
さらに、上述した各実施例においては10次の
LSP係数を利用して分析および合成を実施してい
るが、LSP係数の次数を他の次数としても同様に
実施しうることは明らかであり、以上はすべて本
発明の主旨を損なうことなく、いずれも容易に実
施しうるものである。
以上説明したように本発明によれば、LSP型パ
タンマツチングボコーダにおいて、パタンマツチ
ングの尺度とするスペクトル距離の計測において
使用する重みづけとして従来のLSP周波数スペク
トル感度のほかにLSP周波数間隔スペクトル感度
またはLSP周波数間隔も利用してスペクトル距離
を計測することにより、入力音声信号の合成品質
の劣化を大幅に改善することができる。
【図面の簡単な説明】
第1図A,Bは本発明の第一の実施例による
LSP型パタンマツチングボコーダの分析側Aおよ
び合成側Bの構成を示すブロツク図、第2図は本
発明の第二の実施例によるLSP型パタンマツチン
グボコーダの分析側の構成を示すブロツク図、第
3図は第2図に示す第二の実施例による分析側の
標準パタン選択における動作のフローを示す標準
パタン選択動作フローチヤート、第4図は本発明
の第三の実施例によるLSP型パタンマツチングボ
コーダの分析側の構成を示すブロツク図である。 1……分析側、2……合成側、11……LPF、
12……A/Dコンバータ、13……窓関数処理
器、14……自己相関係数計測器、15……
LPC分析器、16……有声/無声/無音判別器、
17……ピツチ抽出器、18……LSP分析器、1
9……スペクトル距離計測器、20……標準パタ
ンメモリ、21……周波数間隔スペクトル感度メ
モリ、22……周波数スペクトル感度メモリ、2
3……符号化器、24……復号器、25……パタ
ン復号器、26……標準パタンメモリ、27……
LSP合成器、28……可変利得増幅器、29……
切替器、30……パルス発生器、31……雑音発
生器、32……D/Aコンバータ、33……LPF、
40……スペクトル距離計測器(1)、41……スペ
クトル距離計測器(2)、50−1,50−2,50
−3,…50−……標準パタンフアイル(1),
(2),(3)…(),51……LSP間隔計測器、52
……標準パタン選択器。

Claims (1)

  1. 【特許請求の範囲】 1 音声資料のLSP係数の分布に関する標準パタ
    ンと入力音声信号をLSP分析して得られるLSP係
    数に関するパタンとを照合して入力音声信号の合
    成を行なうLSP型パタンマツチングボコーダにお
    いて、前記標準パタンのLSP係数と前記入力音声
    信号のLSP係数との重みづけ内積によるスペクト
    ル距離を計測して前記照合のマツチング尺度を決
    定する場合に前記重みづけを前記標準パタンにお
    けるLSP係数としてのLSP周波数に関する周波数
    スペクトル感度とともに、LSP周波数の周波数間
    隔に対応する周波数間隔スペクトル感度または
    LSP周波数の周波数間隔によつて行なうマツチン
    ク尺度決定手段を備えることを特徴とするLSP型
    パタンマツチングボコーダ。 2 前記周波数スペクトル感度を前記重みづけと
    して予め設定した複数の標準パタンの候補を備
    え、前記周波数間隔スペクトル感度を前記重みづ
    けとする前記マツチング尺度に基づいて前記複数
    の標準パタンの候補から前記入力音声信号に対す
    る最近似パタンを選択することを特徴とする特許
    請求の範囲第1項記載のLSP型パタンマツチング
    ボコーダ。 3 前記LSP周波数の周波数間隔に対応して分類
    した複数の標準パタンを備え、前記入力音声信号
    の前記LSP周波数の周波数間隔に対して最近似す
    る標準パタンを前記複数の標準パタンから選択す
    ることを特徴とする特許請求の範囲第1項記載の
    LSP型パタンマツチングボコーダ。
JP58131439A 1982-10-21 1983-07-19 Lsp型パタンマツチングボコ−ダ Granted JPS6023900A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP58131439A JPS6023900A (ja) 1983-07-19 1983-07-19 Lsp型パタンマツチングボコ−ダ
CA000439473A CA1203906A (en) 1982-10-21 1983-10-21 Variable frame length vocoder
US06/544,198 US4701955A (en) 1982-10-21 1983-10-21 Variable frame length vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58131439A JPS6023900A (ja) 1983-07-19 1983-07-19 Lsp型パタンマツチングボコ−ダ

Publications (2)

Publication Number Publication Date
JPS6023900A JPS6023900A (ja) 1985-02-06
JPH0235993B2 true JPH0235993B2 (ja) 1990-08-14

Family

ID=15057985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58131439A Granted JPS6023900A (ja) 1982-10-21 1983-07-19 Lsp型パタンマツチングボコ−ダ

Country Status (1)

Country Link
JP (1) JPS6023900A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0797721A (ja) * 1993-09-24 1995-04-11 Agency Of Ind Science & Technol キトサン含有中空繊維及びそのシートの製造法

Also Published As

Publication number Publication date
JPS6023900A (ja) 1985-02-06

Similar Documents

Publication Publication Date Title
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
US5305421A (en) Low bit rate speech coding system and compression
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
JP3840684B2 (ja) ピッチ抽出装置及びピッチ抽出方法
EP0477960B1 (en) Linear prediction speech coding with high-frequency preemphasis
JPH04270398A (ja) 音声符号化方式
JP3687181B2 (ja) 有声音/無声音判定方法及び装置、並びに音声符号化方法
JPH0439679B2 (ja)
JP2779325B2 (ja) ボコーダーにおける前処理の相関関係式を用いたピッチ検索時間短縮方法
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
JPH0235993B2 (ja)
JPH0235994B2 (ja)
JP2605256B2 (ja) Lspパタンマツチングボコーダ
JPH058839B2 (ja)
JPH05232996A (ja) 音声符号化装置
JPH05265486A (ja) 音声分析合成方法
JPS62278598A (ja) 帯域分割型ボコ−ダ
JP3092654B2 (ja) 信号符号化装置
JPH0736119B2 (ja) 区分的最適関数近似方法
JPH0123800B2 (ja)
JPH05281995A (ja) 音声符号化方法
JPS61219998A (ja) パタンマツチングボコ−ダ
JPH043878B2 (ja)
JPH07104793A (ja) 音声信号の符号化装置及び復号化装置
JPH0229233B2 (ja)