JP3109807B2 - 音声合成方式及び装置 - Google Patents
音声合成方式及び装置Info
- Publication number
- JP3109807B2 JP3109807B2 JP01343113A JP34311389A JP3109807B2 JP 3109807 B2 JP3109807 B2 JP 3109807B2 JP 01343113 A JP01343113 A JP 01343113A JP 34311389 A JP34311389 A JP 34311389A JP 3109807 B2 JP3109807 B2 JP 3109807B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- accent
- units
- unit
- control information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
規則によって音声パラメータを接続し、基本周波数パタ
ンを生成する音声規則合成方式に関するものである。
クセント型は頭高型、起伏型、平板型の3種、アクセン
トの大きさは頭高型、起伏型に対しては3つの大きさの
アクセント、平板型に対しては2つの大きさのアクセン
ト。という様に、前もって定めてあるアクセント型と、
アクセント型によって定まる最大3つの大きさのアクセ
ントのみで入力テキストに対応するアクセントがすべて
決まっており、前もってアクセント情報としての辞書を
記憶しているものがあった。
の辞書を有さず、テキスト入力時にアクセント情報を一
緒に入力するものもあったが、操作が非常に困難であっ
た。
定まったものであり、テキスト入力時には変更ができ
ず、入力テキストを見ただけではアクセントの上昇、下
降が分かり難かった。また、日本本来のアクセントとは
違う外来語等のアクセントは日本のアクセント型にはま
っていない為生成しにくいという問題があった。
すべき音声の音韻系列に応じて、音声素片ファイルに登
録された音声素片の特徴パラメータと音源情報とを順次
接続し、音声合成する音声合成方法であって、文字情報
を入力し、前記入力した文字情報から複数の音声素片を
切り出すとともに、該切り出された音声素片によって形
成されるモーラ間に挿入されたアクセント制御情報を抽
出し、前記抽出したアクセント制御情報に従って、前記
音声素片によって形成されるモーラ単位で、前記入力し
た文字情報の音声合成時のアクセントを制御する。
報に替えて発声速度制御情報を抽出し、該抽出した発声
速度制御情報に従って、前記音声素片によって形成され
るモーラ単位で、前記音声合成時の発声速度を制御す
る。
ファイルに登録された音声素片の特徴パラメータと音源
情報とを順次接続し、音声合成する音声合成装置であっ
て、文字情報を入力する入力手段と、前記入力した文字
情報から複数の音声素片を切り出す切出手段と、該切り
出された音声素片によって形成されるモーラ間に挿入さ
れたアクセント制御情報を抽出する抽出手段と、前記抽
出したアクセント制御情報に従って、前記音声素片によ
って形成されるモーラ単位で、前記入力した文字情報の
音声合成時のアクセントを制御する。
アクセント制御情報に替えて発声速度制御情報を抽出
し、前記制御手段は、該抽出した発声速度制御情報に従
って、前記音声素片によって形成されるモーラ単位で、
前記音声合成時の発声速度を制御する。
のファイルに登録された音声素片の特徴パラメータ(LP
C,PARCOR,LSP,メルケプストラムなど。以下単にパラメ
ータと呼ぶことにする)を取り出し、一定の規則に基づ
いてパラメータと駆動音源信号(有声音声区間ではイン
パルス列、無声音声区間ではノイズ)を合成音声の発声
速度に応じて伸縮させて結合し、音声合成器に与えるこ
とにより合成音声を得ている音声合成方式において、ア
クセントと発声速度を所望の状態に指示する方式につい
て説明する。
は入力テキスト解析部、2はパラメータ接続部、3はピ
ッチ生成部、4は音声信号生成部である。ローマ字とコ
ントロール文字から成る入力テキストは、1の入力テキ
スト解析部でVcV(音声素片)単位で切り出され、2の
パラメータ接続部でVcVパラメータ(メルケプストラム
方式で蓄積されている)伸縮接続され、音声パラメータ
となり、3のピッチ生成部でピッチパタンが付加され
て、4の音声信号生成部に送られて音声出力される。
り、入力テキストは文字種判別部11で文字種の判別が行
われ、モーラ区切り文字(母音、撥音、長音、促音)な
らば、VcV番号取り出し部13においてVcV番号からVcV素
片のパラメータを呼び出せる様に記憶してあるVcVテー
ブルをアクセスし、入力テキスト解析出力データにVcV
番号をセットし、VcV番号取り出し部13で取り出したVcV
番号に対して、VcV型設定部14でVcV型(有声/無声、長
音/促音、無音、語頭/語尾、連母音、文末)をセット
し、仮定拍同期点振り付け部15で仮定拍同期点をセット
し、フレーズ設定部17でフレーズ(息継ぎ)をセットす
る。
仮定拍同期点のセットに関するものである。アクセント
と仮定拍同期点は各モーラごとにセットされてピッチ生
成部3に送られる。入力テキストでアクセントをセット
する場合には、例えば東京方言の場合には、「橋」を
“HA/SHI"、「箸」を“/HA¥SHI"と記述して入力する。
アクセントのコントロールはコントロール文字“/"と
“¥”によって行われ、“/"によってアクセントは1単
位上昇し、“¥”によってアクセントは1単位下降す
る。“//"ではアクセントは2単位上昇し“//¥”や
“/¥/"ではアクセントは1単位上昇する。
1)、入力テキストから1文字づつ読み込んで(S32)、
文字種の判別が行われ(S33)、入力文字がアクセント
コントロール記号ならばアクセント上昇記号かアクセン
ト下降記号か判別され(S34)、アクセント上昇記号な
らばアクセントを1単位上昇させ(S36)、アクセント
下降記号ならばアクセントを1単位下降させる(S3
7)。入力文字がアクセントコントロール記号でないと
判別されたならば(S33)文末かどうかが判別され(S3
5)、文末ならば終了し、文末でなければアクセントをV
cVデータにセットする(S38)。
/DE¥SU/KA/."と入力されたときの、入力テキスト解析
部の出力を示す。第3図で示したフローチャートに従っ
て処理手順を説明する。まずアクセントが0に初期化さ
れる(S31)。
字種が判別され(S33)、“K"はコントロール記号では
なくモーラ区切り文字でもないのでVcVバッファにプッ
シュされる。次に文字“0"はコントロール文字でなくモ
ーラ区切り文字なのでVcVバッファにプッシュされて、V
cVバッファ内の文字列“KO"をキーとしてVcV番号取り出
し部13にはVcVテーブル12をアクセスしてVcV番号が取得
され(S38)、“KO"に対する入力テキスト解析出力デー
タに、アクセントの値0がセットされ、VcVバッファが
クリアされてVcVバッファに“0"がプッシュされる(S3
1)。次に文字“/"が入力されて文字種が判別され(S3
3)、“/"はアクセントを上昇させるコントロール文字
なので(S34)アクセントの値に1が加えられ(S36)、
更に文字“/"が入力されてアクセントの値に1が加えら
れ(S36)、アクセントの値は2になる。次に“R"が入
力されて文字種が判別されてVcVバッファにプッシュさ
れる。次に“E"が入力されて文字種が判別され“E"はロ
ーマ字で区切り文字なのでVcVバッファにプッシュされ
てVcVバッファ内の文字列“ORE"をキーとしてVcVテーブ
ルをアクセスしてVcV番号が取得され、“ORE"に対する
入力テキスト解析出力データにアクセント値2と共にセ
ットされ(S38)、VcVバッファがクリアされてVcVバッ
ファに“E"がプッシュされる。次に文字“¥”が入力さ
れて(S32)文字種が判別され(S33)、“¥”はアクセ
ントを下降させるコントロール文字なので(S34)アク
セントの値から1が引かれ(S37)アクセントの値は1
になる。以下同様の処理が行われて、“EWA"の入力テキ
スト解析出力データのアクセント値は1がセットされ
る。スペース(n+1)個をnモーラとしてカウントす
ると、“KO/RE¥WA¥ //PE¥N¥ /DE¥SU/KA/."とい
う入力は、 “KO"+“ORE"+“EWA"+“A"+“PE"+“EN"+“ND
E"+“ESU"+“UKA"+“A" のようにモーラ分解され、各モーラのアクセントの値は
()内の値にセットされて、 “KO(0)”+“ORE(2)”+“EWA(1)”+“A
(0)”+“PE(2)”+“EN(1)”+“NDE
(1)”+“ESU(0)”+“UKA(1)”+“A
(2)” のようになり、3のピッチ生成部に送られて第5図に示
すようなアクセント成分が生成される。
る。
コントロールと同様に、コントロール文字“−”と
“+”によって行われ、“−”によって拍同期点間隔か
ら1が引かれて発声速度が加速され“+”によって拍同
期点間隔に1が加えられて発声速度が減速される。
位で切り出され、各モーラに拍同期点と拍同期点間隔が
付加されてセットされ、パラメータ接続部2とピッチ生
成部3に送られる。
(160msec)に初期化される。
ーラ単位に切り出され、発声速度のコントロールコード
により変化される前の基準となる仮定拍同期点の位置
([]で囲んで示す)が付加されて、次の入力テキスト
解析出力データが作成される。
5]”+“EO[79]”+“O[94]” 第4図に示した発声速度(モーラ間隔)セットのフロ
ーチャートに従って動作を説明する。
(160msec)に初期化する(S41)。ローマ字とコントロ
ール文字からなるテキストが入力され(S42)、文字種
判別部11に入力テキストから1文字づつ読み込んで文字
種の判別が行われる(S43)。入力文字がモーラ間隔コ
ントロール記号であるならば(S43)、減速記号である
か加速記号であるか判別する(S44)。減速記号である
ならば、拍同期点間隔を1単位増加させ(S46)、加速
記号であるならば、拍同期点間隔を1単位減少させる
(S47)。拍同期点間隔を変更したら(S46、S47)、次
の1文字を入力テキストから文字種判別部11に読み込む
(S42)。S43において文字種がモーラ間隔コントロール
記号でないと判断されたならば、文末であるかどうか判
断し(S45)、文末でないならば(S45)仮定拍同期点間
隔を変更せずにVcVデータにセットする(S48)。S45で
文末であると判断されたならば、終了する。
変更された場合、それに伴って前記した仮定拍同期点の
位置も変化する。
御装置)にて行われる。
情報から切り出された複数の音声素片によって形成され
るモーラ単位で、当該文字情報の音声合成時のアクセン
ト若しくは発声速度を制御するようにしたので、日本語
のアクセントのみならず、日本語本来のアクセントとは
異なる外来語等のアクセントをも容易に生成することが
できるといった効果がある。
説明図、 第3図はアクセントセットのフローチャート、 第4図は発声速度(モーラ間隔)セットのフローチャー
ト、 第5図は本発明の一例を説明するためのアクセント成分
を示す。 1……入力テキスト解析部 2……パラメータ接続部 3……ピッチ生成部 4……音声信号生成部 11……文字種判別部 12……VcVテーブル 13……VcV番号取り出し部 14……VcV型設定部 15……仮定拍同期点振り付け部 16……アクセント設定部 17……フレーズ設定部
Claims (4)
- 【請求項1】合成すべき音声の音韻系列に応じて、音声
素片ファイルに登録された音声素片の特徴パラメータと
音源情報とを順次接続し、音声合成する音声合成方法で
あって、 文字情報を入力し、 前記入力した文字情報から複数の音声素片を切り出すと
ともに、該切り出された音声素片によって形成されるモ
ーラ間に挿入されたアクセント制御情報を抽出し、 前記抽出したアクセント制御情報に従って、前記音声素
片によって形成されるモーラ単位で、前記入力した文字
情報の音声合成時のアクセントを制御することを特徴と
する音声合成方法。 - 【請求項2】前記複数の音声素片から前記アクセント制
御情報に替えて発声速度制御情報を抽出し、該抽出した
発声速度制御情報に従って、前記音声素片によって形成
されるモーラ単位で、前記音声合成時の発声速度を制御
することを特徴とする請求項1に記載の音声合成方法。 - 【請求項3】合成すべき音声の音韻系列に応じて、音声
素片ファイルに登録された音声素片の特徴パラメータと
音源情報とを順次接続し、音声合成する音声合成装置で
あって、 文字情報を入力する入力手段と、 前記入力した文字情報から複数の音声素片を切り出す切
出手段と、 該切り出された音声素片によって形成されるモーラ間に
挿入されたアクセント制御情報を抽出する抽出手段と、 前記抽出したアクセント制御情報に従って、前記音声素
片によって形成されるモーラ単位で、前記入力した文字
情報の音声合成時のアクセントを制御する制御手段と を有することを特徴とする音声合成装置。 - 【請求項4】前記抽出手段は、前記複数の音声素片から
前記アクセント制御情報に替えて発声速度制御情報を抽
出し、前記制御手段は、該抽出した発声速度制御情報に
従って、前記音声素片によって形成されるモーラ単位
で、前記音声合成時の発声速度を制御することを特徴と
する請求項3に記載の音声合成装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01343113A JP3109807B2 (ja) | 1989-12-29 | 1989-12-29 | 音声合成方式及び装置 |
EP90312074A EP0427485B1 (en) | 1989-11-06 | 1990-11-05 | Speech synthesis apparatus and method |
US07/608,757 US5220629A (en) | 1989-11-06 | 1990-11-05 | Speech synthesis apparatus and method |
DE69028072T DE69028072T2 (de) | 1989-11-06 | 1990-11-05 | Verfahren und Einrichtung zur Sprachsynthese |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01343113A JP3109807B2 (ja) | 1989-12-29 | 1989-12-29 | 音声合成方式及び装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24314099A Division JP3314058B2 (ja) | 1999-08-30 | 1999-08-30 | 音声合成方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03203799A JPH03203799A (ja) | 1991-09-05 |
JP3109807B2 true JP3109807B2 (ja) | 2000-11-20 |
Family
ID=18359039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01343113A Expired - Lifetime JP3109807B2 (ja) | 1989-11-06 | 1989-12-29 | 音声合成方式及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3109807B2 (ja) |
-
1989
- 1989-12-29 JP JP01343113A patent/JP3109807B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH03203799A (ja) | 1991-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
JPS62160495A (ja) | 音声合成装置 | |
JP2009139677A (ja) | 音声処理装置及びそのプログラム | |
JP3109807B2 (ja) | 音声合成方式及び装置 | |
JP3437064B2 (ja) | 音声合成装置 | |
JP3314058B2 (ja) | 音声合成方法及び装置 | |
JP3006240B2 (ja) | 音声合成方法および装置 | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JPH07140996A (ja) | 音声規則合成装置 | |
JPS62138898A (ja) | 音声規則合成方式 | |
JPH0731509B2 (ja) | 音声分析装置 | |
JP2900454B2 (ja) | 音声合成装置の音節データ作成方式 | |
JPH11282494A (ja) | 音声合成装置および記憶媒体 | |
JP3292218B2 (ja) | 音声メッセージ作成装置 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JP2737122B2 (ja) | 音声辞書作成装置 | |
JP3870583B2 (ja) | 音声合成装置および記憶媒体 | |
JPH06149283A (ja) | 音声合成装置 | |
JPH0635913A (ja) | 文章読み上げ装置 | |
JPH08160983A (ja) | 音声合成装置 | |
JPH045697A (ja) | 単語アクセント登録方法 | |
JPH0756589A (ja) | 音声合成方法 | |
JPH08146984A (ja) | 音声合成装置 | |
JPH0756599B2 (ja) | 音声フアイル作成方法 | |
JPS63174100A (ja) | 音声規則合成方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070914 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080914 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090914 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090914 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 10 |