JPH08160993A - 音声分析合成器 - Google Patents

音声分析合成器

Info

Publication number
JPH08160993A
JPH08160993A JP6330477A JP33047794A JPH08160993A JP H08160993 A JPH08160993 A JP H08160993A JP 6330477 A JP6330477 A JP 6330477A JP 33047794 A JP33047794 A JP 33047794A JP H08160993 A JPH08160993 A JP H08160993A
Authority
JP
Japan
Prior art keywords
pitch
degree
normality
analysis
calculator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6330477A
Other languages
English (en)
Inventor
Takayuki Ishikawa
孝行 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6330477A priority Critical patent/JPH08160993A/ja
Publication of JPH08160993A publication Critical patent/JPH08160993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声分析合成器において、ピッチ情報から生成
されるパルス励振時刻を時間位置変調することにより、
合成音声の自然性を向上させる。 【構成】音声信号をスペクトラル包絡情報と音源情報に
分離して伝送し、合成側で音声を生成する音声分析合成
器(通常のピッチ励振線形予測ボコーダ)に、分析側に
て逆フィルタ・定常度算出器、合成側にて振幅時刻制御
器を具備する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声分析合成器に関す
る。
【0002】
【従来の技術】従来の音声分析合成器は、分析側にて入
力音声信号をスペクトラル包絡情報と音源情報に分離
し、合成側で前述のスペクトラル包絡情報と音源情報を
利用して合成音声を生成している。
【0003】一般に、スペクトラル包絡情報としてはL
PC(線形予測符号)係数が用いられ、音源情報として
は声帯振動数(ピッチ周波数)が利用され、代表的なも
のにピッチ励振型LPCボコーダがある。
【0004】特に、ピッチ励振型LPCボコーダは、音
声を合成するための駆動音源信号(音源情報)を、有声
音声時には、ピッチ周波数に応じたインパルス列に単純
化して表現し、その励振周期もピッチ周波数に対応した
固定周期(固定間隔)で発生させている。そして、無声
音声時には、声帯振動がなくピッチ周波数が存在しない
ため、前述のピッチ周波数に基づき固定周期的に励振さ
れるインパルス列の代わりに、白色雑音信号に応じた不
定周期パルス列を発生している。
【0005】
【発明が解決しようとする課題】このように、従来のピ
ッチ励振型LPCボコーダでは、有声音声の合成に際
し、音源情報として、ピッチ周波数に応じた固定周期列
でインパルスを発生している。
【0006】しかしながら、本来の自然音声(有声音
声)の声帯振動は、一定(固定周期)ではなく、肉声の
変化に応じた時間的ゆらぎ、瞬時変動等を伴う準周期的
な動作をしている。
【0007】従って、従来のピッチ励振型LPCボコー
ダでは、有声音声を合成する際に、肉声の変動に伴う声
帯の時間的ゆらぎが表現し得ず、このため、自然性に乏
しい機械的合成音声しか生成できなかった。
【0008】本発明は上記問題点に鑑みて為されたもの
であって、ピッチ情報から生成されるパルス励振時刻を
時間位置変調することにより、合成音声の自然性を向上
させる音声分析合成器を提供することを目的とする。
【0009】
【課題を解決するための手段】前記目的を達成するた
め、本発明の音声分析合成器は、従来のピッチ励振型L
PCボコーダに加えて、分析側で有声音声時の声帯の瞬
時的ゆらぎ(準周期的励振)を観測する定常度算出手段
を有し、合成側では定常度情報を基に、ピッチ励振周期
にゆらぎを与え、準周期的インパルス列を生成(ピッチ
励振点の励振時刻の時間位置変調)する手段を有するこ
とを特徴とする。
【0010】本発明においては、定常度算出器は、好ま
しくは、入力信号に対するケプストラム分析手段と、ケ
プストラム分析の結果から電力を算出する手段、及び電
力量の比較手段を具備していることを特徴とする。
【0011】また、本発明においては、好ましくは、振
幅時刻変調器は、インパルス励振時刻の可変量及び可変
周期を決める演算器と、疑似乱数発生器を具備し、前記
演算器と疑似乱数発生器からの情報に基づきピッチの振
幅時刻変調を行う変調器を具備していることを特徴とす
る。
【0012】
【作用】本発明によれば、パルス列の励振時刻を可変
(変調)することにより、本来の瞬時ゆらぎを含んだ準
周期的ピッチ周期に等しい音源インパルス列が生成で
き、自然性の高い合成音声が実現出来る。
【0013】本発明においては、定常度情報として、好
ましくは、ケプストラムを線形値に変換した線形ケプス
トラム値のフレーム内総電力値PLCPと線形ケプストラ
ム値の声帯振動(ピッチ周波数)成分に相当する部分の
みを抽出し窓処理を施した矩形窓内電力値WPLPCの比
(定常度Cp=WPLPC/PLCPと)として算出される。
この場合、矩形窓内電力WPLCPはピッチの分散によっ
て変化するのに対し、フレーム内総電力値PLCPはピッ
チの分散に影響を受けず、定常度Cpが大きい場合ピッ
チのゆらぎは小さく、定常度Cpが小さい場合ピッチの
ゆらぎが大きくなり、ピッチ周波のゆらぎ量を定量的に
測定することができる。
【0014】そして、本発明によれば、音声合成側は、
音声分析側から伝送された定常度情報に基づき、インパ
ルス励振を可変するに際して、好ましくは疑似乱数を用
いて励振位置の可変量を規定するため、励振位置の偏り
を防ぎ、自然な変調パルスを得ることができる。
【0015】
【実施例】本発明について図面を参照して説明する。
【0016】図1は本発明の一実施例を示すブロック図
である。図1を参照して、LPC分析部1及びLPC合
成部2は、従来型のピッチ励振型LPCボコーダを構成
している。
【0017】より詳細には、図1を参照して、LPC分
析部1は、音声信号を入力する窓切出処理器11と、窓切
出処理器11の出力信号を入力しαパラメータα1
α12、および電力パラメータPwを出力するLPC分析
器12と、αパラメータα1〜α12を入力し所定のビット
数に量子化した量子化αパラメータα1′〜α12′を出
力するα量子化器13と、電力パラメータPwを入力し所
定のビット数に量子化した量子化電力パラメータPw
を出力する電力量子化器14と、窓切出処理器11の出力信
号を入力しピッチパラメータPtを出力するピッチ抽出
器15と、窓切出処理器11の出力信号およびLPC分析器
12の出力信号α1〜α12を入力し残差信号Zwを出力する
逆フィルタ16と、を備えている。
【0018】さらに、LPC分析部1は、ピッチ抽出器
15の出力信号Ptおよび逆フィルタ16の出力信号Zwを入
力し、定常度Cpを出力する定常度算出器17と、定常度
算出器17の出力信号Cpを入力し所定のビット数に量子
化した量子化定常度C´pを出力する定常度量子化器18
と、α量子化器13の出力信号α1′〜α12′、電力量子
化器14の出力信号Pw′、ピッチ抽出器15の出力信号
t、および定常度量子化器18の出力信号Cp′の各信号
を入力した後多重化し、伝送路30へ出力する多重化器19
と、を備えている。
【0019】一方、LPC合成部2は、伝送路を介して
多重化器19の出力信号を入力し、前述の多重化された各
信号を量子化αパラメータα1′〜α12′、量子化電力
パラメータPw′、ピッチパラメータPt、Cp′に分離
する分離器21と、それぞれの入力端が分離器21に接続さ
れ、α1′〜α12′信号を復号してα″1〜α″12を出力
するα復号化器22と、Pw′信号を復号してP″wを出力
する電力復号器23と、ピッチパラメータPtに基づいた
インパルス列Itを出力するパルス列発生器24と、を備
えている。
【0020】さらに、LPC合成部2は、量子化定常度
p′信号を復号してC″pを出力する定常度復号器25
と、ピッチパラメータPt、パルス列発生器24の出力信
号Itおよび定常度復号器25の出力信号C″pを入力し変
調パルス列IMを出力する振幅時刻変調器26と、電力復
号器23の出力信号P″wと振幅時刻変調器26の出力信号
Mを入力し振幅パルス列IMPを出力する振幅制御器27
と、α復号化器22の出力信号α″1〜α″12および振幅
制御器27の出力信号IMPを入力し、合成音声を出力する
音声合成器28と、を具備している。
【0021】図1において、窓切出処理器1〜多重化器
19までが分析側であり、分離器21〜音声合成器28までが
合成側である。
【0022】窓切出処理器11は、入力音声信号を、好ま
しくは300〜3.4kHzに帯域制限した後、8kHzのサンプリ
ング周期で標本化し、各音声サンプルを例えば16ビット
に量子化する。次に、30msec(240サンプル)毎の音声
サンプルにハミング窓関数の乗算を分析フレーム周期で
ある20msec毎に行なう。
【0023】LPC分析器12は、窓切出処理器11から入
力した信号に対しLPC分析(線形予測分析)を施し、
12次のαパラメータα1〜α12を抽出し、また、入力音
声信号の分析フレーム毎の電力を表わす電力パラメータ
wを出力する。
【0024】ピッチ抽出器15は、窓切出処理器11からの
信号を分析フレーム毎に有声音声であるか無声音声であ
るかを判定し、有声音声の場合にはピッチ周波数を抽出
し、判定結果とピッチ周波とを一括してピッチパラメー
タPt(Pt>0)として出力する。また、無声音声の場
合にはピッチパラメータPtをゼロ(Pt=0)として出
力する。
【0025】逆フィルタ16は、窓切出処理器11からの音
声信号を入力信号としLPC分析器12の出力信号α1
α12をフィルタ係数として駆動するデジタルフィルタ
(逆フィルタ)であり、分析フレーム毎にフォルマント
の影響を除去した残差信号Zwを出力する。
【0026】定常度算出器17は、残差信号Zwのケプス
トラム分析値と、補助情報としてのピッチパラメータP
tとから定常度Cpを算出する。
【0027】LPC分析器12の出力αパラメータα1
α12および電力パラメータPwと、定常度算出器17の出
力である定常度Cpは、夫々、α量子化器13、電力量子
化器14、定常度量子化器18にてそれぞれ所定のビット数
に量子化され、α1′〜α12′、Pw′、Cp′として、
ピッチ抽出器15の出力Ptと共に多重化器19にて多重化
処理される。
【0028】一方、分離器21にて多重化器19からの信号
を分離した後、α復号化器22、電力復号器23、定常度復
号器25で復号化αパラメータα″1〜α″12、復号化電
力パラメータP″w、復号化定常度C″pを算出する。
尚、本実施例においての量子化/復号化処理は、αパラ
メータおよび定常度Cpを線形量子化/復号化、電力パ
ラメータPwを対数量子化/復号化で実施している。パ
ルス列発生器24は、ピッチパラメータPtで規定される
周期毎にインパルス列Itを発生する。
【0029】振幅時刻変調器26は、インパルス列It
励振時刻を声帯のゆらぎ量として規定されている定常度
C″pおよびピッチパラメータPtを利用して、変調パル
ス列IM(時間軸上の変調パルス列)を生成する。
【0030】振幅制御器27は、振幅時刻変調器26の出力
である変調パルス列IMの振幅値を電力パラメータP″w
の大きさに応じて可変するものであり、振幅可変後の変
調パルス列IMPとして出力する。
【0031】音声合成器28は、リカーシブ型デジタルフ
ィルタから構成されており、スペクトラル包絡情報に相
当するα″1〜α″12パラメータをフィルタ係数とし、
音源情報に相当する変調パルス列IMPを入力信号として
駆動することにより合成音声を生成する。
【0032】次に本発明の特徴の一つである定常度算出
器17について詳述する。図2は定常度算出器17の構成を
示すブロック図である。図2を参照して、定常度算出器
17は、フーリエ変換器171、対数スペクトル計算機172、
フーリエ逆変換器173、線形化処理器174、総電力算出器
175、矩形窓処理器176、窓内電力算出器177、電力比較
器178から構成される。
【0033】図2を参照して、逆フィルタ16から出力さ
れた残差信号Zwはフーリエ変換器171に入力され、分析
フレーム毎にパワースペクトル値Fwを算出した後、対
数スペクトル計算器172により対数値に変換される。
【0034】フーリエ逆変換器173は、対数化パワース
ペクトル値を入力信号としてフーリエ逆変換を施すもの
であり、その演算結果がケプストラム値CEPとなる。
【0035】本実施例では、ケプストラム値CEPの総電
力値と窓内電力値を利用して定常度Cpを算出すること
を特徴としている。
【0036】なお、フーリエ逆変換器173の出力値はlo
g(対数)値であり、電力算出を直接出来ない。このた
め、線形化処理器174により、一旦log(対数)値から
linear(線形)値に変換した線形ケプストラム値LC
EPを利用して電力算出を行なう。
【0037】すなわち、総電力算出器175は、線形ケプ
ストラム値LCEPのフレーム内総電力値PLCPを算出
し、一方、矩形窓処理器176は、線形ケプストラム値L
EPの声帯振動(ピッチ周波数)成分に相当する部分の
み抽出し、窓内電力算出器177にて矩形窓内電力WPLCP
を算出する。
【0038】なお、矩形窓内電力WPLCPは、ピッチ抽
出器15の出力であるピッチパラメータPtを補助情報と
してケプストラム上の音源信号位置を規定し、その規定
点を中心とした矩形窓(リフター)内総電力を窓内総電
力WPLCPとして求めるものである。
【0039】電力比較器178は、総電力算出器175の出力
LCPと窓内電力算出器177の出力とWPLCPの比(WP
LCP/PLCP)を算出し、これを定常度Cpとして出力す
る。
【0040】一般に、音声信号は、フィルタ特性を示す
インパルス応答と音源信号の畳み込み(convolution)
により表わされることは周知である。逆に、音声信号が
わかればインパルス応答と音源信号の分離が可能であ
り、その分離手法としてケプストラム(CEPSTRUM)分析
手法がある。
【0041】即ち、ケプストラム分析は、音声を横軸を
ケフレンシー(1/f)とし、低ケフレンシー部へ音色
に当るスペクトル情報を、高ケフレンシー部へ音階に当
る音源情報を分離した後、ケプストラム値としてのエネ
ルギー密度(電力)を縦軸に表現する分析手法である。
【0042】つまり、高ケフレンシーに着目すれば音源
信号のみを分離抽出することが可能である。故に、音源
信号(即ちピッチ周波数)が安定して固定周期的に生成
している音声信号の場合は、ケフレンシー上の音源信号
のケプストラム値は、ピッチ周期にほぼ対応した点に集
中する。
【0043】しかし、声帯のゆらぎ等がありピッチ周波
数にゆらぎがある場合のケプストラム値は、ピッチのゆ
らぎの影響を受け、ケフレンシー上の一点に集中せずに
分散した値となる。
【0044】つまり、ピッチ周波数が固定周期の場合の
ケプストラム値はケフレンシー上の一点に集中した大き
なピーク値を持つ(図5参照)が、声帯の瞬時ゆらぎを
含む場合は、そのゆらぎにより、エネルギーが一点に集
中せず、ゆるやかな山状のケプストラム値(図4参照)
となる。
【0045】よって、ケプストラムの形状を観測するこ
とにより、ピッチのゆらぎ量を測定できることになる。
【0046】本実施例では、このゆらぎ量を定量的に表
わすためにケプストラムの形状を電力量に置換して算出
している。
【0047】また、本実施例では、音源情報の抽出をよ
り正確に行うため、フォルマントの影響を除去した後、
ケプストラム分析を行っている。
【0048】しかしながら、実時間処理等のハードウェ
ア処理時間の制約がある場合は、処理時間が比較的多い
逆フィルタ16の処理を省くことも可能である。但し、こ
の場合のケプストラム値はフォルマントの影響を強く受
けたものになるため、フレーム内総電力PLCPを算出す
るに際して、フォルマントの影響を受けている低ケフレ
ンシー部を除去した後に、フレーム内総電力PLCPを算
出するようにしている。
【0049】ところで、窓内電力算出器177の出力WP
LCPは、ピッチパラメータPtに基づいて設定される矩形
窓(リフター)内のケプストラム電力値であり、ピッチ
周波数にゆらぎが無い場合は、リフター内に音源信号電
力が集中するため、WPLCPは大きな電力値(図5参
照)を示す。しかし、ピッチ周波数にゆらぎがある場合
は、リフター外にも音源信号が分散してしまい、リフタ
ー内の電力値WPLCP(図4)は小さな値となる。
【0050】矩形窓(リフター)の決定は、ピッチ抽出
器15の出力であるピッチパラメータPtをケフレンシー
上の中心点とし、その幅は、ピッチ周波数に応じて可変
するものとする。但し、実験結果として、1/(ピッチ
周波数±20)で、その幅全てを代表させても、音源信号
電力の抽出精度に差が余り表われないため、本実施例で
は、一括して、リフターの幅を、1/(ピッチ周波数±
20)としている。
【0051】以上説明したように、ピッチの分散によっ
て変化する矩形窓内電力WPLCPに対し、ピッチの分散
に影響を受けない、フレーム内総電力PLCPを基準値と
した比較値である定常度Cp(Cp=WPLCP/PLCP)に
より、ピッチの分散、即ちピッチ周波のゆらぎ量を定量
的に測定することができる。
【0052】なお、図4は、ピッチ周波数のゆらぎが大
きい(男声一般成人)ときのケプストラム分析図、図5
は、ピッチ周波数のゆらぎが小さい(男声アナウンサ
ー)ときのケプストラム分析図をそれぞれ示している。
【0053】本実施例では、ピッチ抽出器15よりピッチ
パラメータPtを定常度算出器17へ伝送しているが、定
常度算出器17内でもピッチパラメータの抽出が可能であ
り、ピッチパラメータPtを特に伝送しなくとも、矩形
窓内電力WPLCPの算出は可能である。例えば、定常度
算出器17内のケプストラム分析値の高ケフレンシー上の
ピーク点をピッチ位置と決定することにより、ピッチパ
ラメータの内部抽出が行なえる。
【0054】次に、振幅時刻変調器26について詳述す
る。図3は、振幅時刻変調器26の構成を示すブロック図
である。
【0055】図3を参照して、振幅時刻変調器26は、演
算器261、変調器262、疑似乱数発生器263、遅延器264か
ら構成される。
【0056】振幅時刻変調器26は、定常度復号器25から
の定常度情報C″pと、ピッチパラメータPtを利用する
ことにより、インパルス列Itのパルス励振位置を可変
(変調)するものであり、その可変量及び可変速度は演
算器261及び疑似乱数発生器263で規程される。
【0057】本実施例においては、まず、変調パルス列
Mを生成するか否かの判断を演算器261で行う。具体的
には、定常度復号器25からの定常度情報C″pの値が基
準値X(Xは、過去の分析データの統計的処理に基づ
き、主観評価として実験的に決定した値、本実施例では
X=0.4とする)以上の値(C″p≧X)は、励振位置の
可変なしと判断し、パルス列発生器24から来る固定周期
インパルス列Itを、そのまま振幅制御器27へ出力す
る。
【0058】一方、C″pの値が基準値Xより小さい
(C″p<X)の場合は、ピッチにゆらぎがあるものと
判断し、インパルス列Itの励振位置を可変するものと
し、疑似乱数発生器263及び演算器261の情報に基づいて
インパルスの励振時刻を可変(変調)し、変調パルス列
Mとして出力する。
【0059】遅延器264は、変調パルス列を1フレーム
分蓄積することにより、励振時刻が変化(本来の位置よ
り時間的に早く/遅く励振)することによる励振データ
の欠落を防ぐためのものである。
【0060】以下では、X=0.4、ピッチ周波数400Hz、
定常度C″p=0.3の場合の例を示す。
【0061】インパルス列Itは、It=8kHz/400Hz=
20となり、20サンプルを基本として1回励振されるイン
パルス列Itがパルス列発生器24で生成される。
【0062】演算器261は、まず、定常度C″p<0.4で
あるため、ピッチにゆらぎがあるものと判断し、インパ
ルス列Itの励振位置を可変するものとする。
【0063】次に、励振位置の可変に当たり、可変する
大きさ(可変量)及び可変位置(可変周期)を規程す
る。
【0064】可変量をΔImpxとすると、ΔImpxはピッ
チ周期及び定常度情報に比例した計算式(次式(1)参
照)で与えられ、It、X、及びC″pに上記各値を代入
すると、ΔImpxは2となる。
【0065】ΔImpx=It(X−C″p) …(1) =20×(0.4−0.3) =2
【0066】本実施列の場合は、ピッチ励振の可変量は
−ΔImpx〜+ΔImpx、即ち上式より−2〜+2と規定
されることになる。
【0067】上式(1)からもわかるように、定常度C″p
が大きい(ピッチのゆらぎが小さい)とΔImpxの値は
小さく、C″pが小さい(ピッチのゆらぎが大きい)と
ΔImpxの値は大きくなる。すなわち、定常度C″pの値
に応じたインパルス励振時刻の可変の大きさ(最大可変
量)が決まることになる。
【0068】実際にインパルス励振を可変するに際して
は、励振位置の偏りを防ぎ、自然な変調パルスIMを得
るために、疑似乱数(本実施例ではM系列)から得られ
た乱数値RND(−1〜+1)をΔImpxに乗じた値を
可変量ΔImpとする(次式(2)参照)。
【0069】ΔImp=ΔImpx×RND …(2)
【0070】すなわち、最大可変量ΔImpxによって規
定された範囲内で、乱数値RNDの出力値に従ったパル
ス励振位置の可変情報が決定される。
【0071】よって振幅時刻変調器26の出力である変調
パルス列IMは、次式(3)により計算されて出力される。
【0072】IM=It−ΔImp =It−ΔImpx×RND …(3)
【0073】そこで、変調パルスIMは、遅延器264上に
あるメモリに2フレーム分のパルス列It(前フレーム
分及び現フレーム分)を一旦保存しておき、前フレーム
分Itに対し、メモリ保存内容の格納位置の変更を行
う。すなわち、ΔImp情報をメモリのアドレス変更情報
に対応させることにより、インパルスの生成位置をΔI
mpに従った位置にストアしなおし、定周期的メモリ上へ
配置されていたインパルス列がΔImpで変調された位置
に配置され、変調パルス列IMが生成されることにな
る。
【0074】以上説明したように、本実施例を利用する
ことにより、人間の声帯のゆらぎ量がモデル化されて伝
えられ、より人間の音声の発生機構に忠実な分析・合成
を行うことが可能である。
【0075】なお、本実施例では、音源パルスをインパ
ルスとしたが、三角波やマルチパルス波等についても同
様にして適用することが可能であり、種々な音源情報表
現手段について、ゆらぎ量(定常度)を導入することに
より、分析・合成音質の改善を可能とすることができ
る。
【0076】以上本発明を上記実施例に即して説明した
が、本発明は上記態様にのみ限定されず、本発明の原理
に準ずる各種態様を含むことは勿論である。
【0077】
【発明の効果】以上説明したように本発明は、パルス列
の励振時刻を可変(変調)することにより、本来の瞬時
ゆらぎを含んだ準周期的ピッチ周期に等しい音源インパ
ルス列が生成でき、自然性の高い合成音声が実現できる
という効果を有する。
【0078】また、本発明によれば、定常度算出器は、
ピッチの分散によって変化する矩形窓内電力に対し、ピ
ッチの分散に影響を受けない、フレーム内総電力を基準
値とした比較値として定常度を算出し、これにより、ピ
ッチ周波のゆらぎ量を定量的に測定することができる。
【0079】そして、本発明によれば、振幅時刻変調器
は、分析側の定常度情報に基づき、インパルス励振を可
変するに際して、好ましくは疑似乱数を用いて励振位置
の可変量を規定するため、励振位置の偏りを防ぎ、自然
な変調パルスを得ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声分析合成器の構成
を示すブロック図である。
【図2】本発明の一実施例における定常度算出器の構成
を示すブロック図である。
【図3】本発明の一実施例における振幅時刻変調器のブ
ロック図である。
【図4】ピッチ周波数のゆらぎが大きいときのケプスト
ラム分析図である。
【図5】ピッチ周波数のゆらぎが小さいときのケプスト
ラム分析図である。
【符号の説明】
1 LPC分析部 2 LPC合成部 11 窓切出処理器 12 LPC分析器 13 α量子化器 14 電力量子化器 15 ピッチ抽出器 16 逆フィルタ 17 定常度算出器 18 定常度量子化器 19 多重化器 21 分離器 22 α復号化器 23 電力復号器 24 パルス列発生器 25 定常度復号器 26 振幅時刻変調器 27 振幅制御器 28 音声合成器 30 伝送路 171 フーリエ変換器 172 対数スペクトル計算機 173 フーリエ逆変換器 174 線形化処理器 175 総電力算出器 176 矩形窓処理器 177 窓内電力算出器 178 電力比較器 261 演算器 262 変調器 263 疑似乱数発生器 264 遅延器

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】分析側にピッチ周波数情報の時間的ゆらぎ
    を示す定常度を算出する定常度算出器を有し、合成側に
    ピッチ周波数に基づいて励振されるインパルス列の時間
    位置を前記定常度算出器で算出された定常度に基づき変
    調する振幅時刻変調器を有することを特徴とする音声分
    析合成器。
  2. 【請求項2】前記定常度算出器が、入力信号に対するケ
    プストラム分析手段と、前記ケプストラム分析手段の分
    析結果から電力を算出する手段、及び電力量の比較手段
    を具備したことを特徴とする請求項1記載の音声分析合
    成器。
  3. 【請求項3】前記振幅時刻変調器が、インパルス励振時
    刻の可変量及び可変周期を決める演算器と、疑似乱数発
    生器と、を具備し、更に、前記演算器と前記疑似乱数発
    生器とからの情報に基づきピッチの振幅時刻変調を行う
    変調器を具備したことを特徴とする請求項1記載の音声
    分析合成器。
  4. 【請求項4】前記定常度が、ケプストラムの1フレーム
    内の総電力値と、ケプストラムのピッチ周波数成分に相
    当する部分を抽出して窓処理を施した矩形窓内電力値
    と、の比として算出されることを特徴とする請求項1記
    載の音声分析合成器。
  5. 【請求項5】ピッチ周波数情報の時間的ゆらぎを示す定
    常度情報を算出する手段を有することを特徴とする音声
    分析器。
  6. 【請求項6】ピッチ周波数に基づいて励振されるインパ
    ルス列の時間位置を、音声分析器側から伝送されるピッ
    チ周波数情報の時間的ゆらぎを示す定常度情報に基づ
    き、変調する手段を有することを特徴とする音声合成
    器。
JP6330477A 1994-12-08 1994-12-08 音声分析合成器 Pending JPH08160993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6330477A JPH08160993A (ja) 1994-12-08 1994-12-08 音声分析合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6330477A JPH08160993A (ja) 1994-12-08 1994-12-08 音声分析合成器

Publications (1)

Publication Number Publication Date
JPH08160993A true JPH08160993A (ja) 1996-06-21

Family

ID=18233067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6330477A Pending JPH08160993A (ja) 1994-12-08 1994-12-08 音声分析合成器

Country Status (1)

Country Link
JP (1) JPH08160993A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008010413A1 (fr) * 2006-07-21 2008-01-24 Nec Corporation Dispositif, procédé et programme de synthèse audio
JP2016197254A (ja) * 2012-11-15 2016-11-24 株式会社Nttドコモ 音声符号化装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168097A (ja) * 1982-03-29 1983-10-04 日本電気株式会社 音声合成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168097A (ja) * 1982-03-29 1983-10-04 日本電気株式会社 音声合成装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008010413A1 (fr) * 2006-07-21 2008-01-24 Nec Corporation Dispositif, procédé et programme de synthèse audio
US8271284B2 (en) 2006-07-21 2012-09-18 Nec Corporation Speech synthesis device, method, and program
JP5093108B2 (ja) * 2006-07-21 2012-12-05 日本電気株式会社 音声合成装置、方法、およびプログラム
JP2016197254A (ja) * 2012-11-15 2016-11-24 株式会社Nttドコモ 音声符号化装置

Similar Documents

Publication Publication Date Title
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JP4843124B2 (ja) 音声信号を符号化及び復号化するためのコーデック及び方法
Kleijn Encoding speech using prototype waveforms
McCree et al. A mixed excitation LPC vocoder model for low bit rate speech coding
JP4270866B2 (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
EP2384506B1 (en) Speech coding method and apparatus
USRE43099E1 (en) Speech coder methods and systems
KR20040028932A (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
JPH10149199A (ja) 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
Robinson Speech analysis
JPH08160993A (ja) 音声分析合成器
JP3481027B2 (ja) 音声符号化装置
JP2000235400A (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP2853170B2 (ja) 音声符号化復号化方式
Li et al. Basic audio compression techniques
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JP2001166800A (ja) 音声符号化方法及び音声復号化方法
Mohammed et al. A Comparative Study of Speech Coding Techniques for Electro Larynx Speech Production
JP2535809B2 (ja) 線形予測型音声分析合成装置
Chang et al. Quality enhancement of sinusoidal transform vocoders
Kang et al. Phase adjustment in waveform interpolation
Ni et al. Waveform interpolation at bit rates above 2.4 kb/s
JPH1185198A (ja) ボコーダ符号化復号装置
JPS62278598A (ja) 帯域分割型ボコ−ダ

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19971111