JP3109807B2 - 音声合成方式及び装置 - Google Patents

音声合成方式及び装置

Info

Publication number
JP3109807B2
JP3109807B2 JP01343113A JP34311389A JP3109807B2 JP 3109807 B2 JP3109807 B2 JP 3109807B2 JP 01343113 A JP01343113 A JP 01343113A JP 34311389 A JP34311389 A JP 34311389A JP 3109807 B2 JP3109807 B2 JP 3109807B2
Authority
JP
Japan
Prior art keywords
speech
accent
units
unit
control information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP01343113A
Other languages
English (en)
Other versions
JPH03203799A (ja
Inventor
勝彦 川崎
恭則 大洞
武 藤田
隆 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP01343113A priority Critical patent/JP3109807B2/ja
Priority to EP90312074A priority patent/EP0427485B1/en
Priority to US07/608,757 priority patent/US5220629A/en
Priority to DE69028072T priority patent/DE69028072T2/de
Publication of JPH03203799A publication Critical patent/JPH03203799A/ja
Application granted granted Critical
Publication of JP3109807B2 publication Critical patent/JP3109807B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は音声合成方式、特に文字と記号等を入力し、
規則によって音声パラメータを接続し、基本周波数パタ
ンを生成する音声規則合成方式に関するものである。
[従来の技術] 従来は、入力テキストからピッチを生成する場合にア
クセント型は頭高型、起伏型、平板型の3種、アクセン
トの大きさは頭高型、起伏型に対しては3つの大きさの
アクセント、平板型に対しては2つの大きさのアクセン
ト。という様に、前もって定めてあるアクセント型と、
アクセント型によって定まる最大3つの大きさのアクセ
ントのみで入力テキストに対応するアクセントがすべて
決まっており、前もってアクセント情報としての辞書を
記憶しているものがあった。
また、入力されたテキストに対応するアクセント情報
の辞書を有さず、テキスト入力時にアクセント情報を一
緒に入力するものもあったが、操作が非常に困難であっ
た。
[発明が解決しようとしている問題点] 従来の技術では、アクセントの型も大きさも前もって
定まったものであり、テキスト入力時には変更ができ
ず、入力テキストを見ただけではアクセントの上昇、下
降が分かり難かった。また、日本本来のアクセントとは
違う外来語等のアクセントは日本のアクセント型にはま
っていない為生成しにくいという問題があった。
[問題点を解決する為の手段] 以上の点に鑑み、本発明に係る音声合成方法は、合成
すべき音声の音韻系列に応じて、音声素片ファイルに登
録された音声素片の特徴パラメータと音源情報とを順次
接続し、音声合成する音声合成方法であって、文字情報
を入力し、前記入力した文字情報から複数の音声素片を
切り出すとともに、該切り出された音声素片によって形
成されるモーラ間に挿入されたアクセント制御情報を抽
出し、前記抽出したアクセント制御情報に従って、前記
音声素片によって形成されるモーラ単位で、前記入力し
た文字情報の音声合成時のアクセントを制御する。
また、前記複数の音声素片から前記アクセント制御情
報に替えて発声速度制御情報を抽出し、該抽出した発声
速度制御情報に従って、前記音声素片によって形成され
るモーラ単位で、前記音声合成時の発声速度を制御す
る。
また、合成すべき音声の音韻系列に応じて、音声素片
ファイルに登録された音声素片の特徴パラメータと音源
情報とを順次接続し、音声合成する音声合成装置であっ
て、文字情報を入力する入力手段と、前記入力した文字
情報から複数の音声素片を切り出す切出手段と、該切り
出された音声素片によって形成されるモーラ間に挿入さ
れたアクセント制御情報を抽出する抽出手段と、前記抽
出したアクセント制御情報に従って、前記音声素片によ
って形成されるモーラ単位で、前記入力した文字情報の
音声合成時のアクセントを制御する。
また、前記抽出手段は、前記複数の音声素片から前記
アクセント制御情報に替えて発声速度制御情報を抽出
し、前記制御手段は、該抽出した発声速度制御情報に従
って、前記音声素片によって形成されるモーラ単位で、
前記音声合成時の発声速度を制御する。
[実施例] 本実施例では、文字列データの情報により、音声素片
のファイルに登録された音声素片の特徴パラメータ(LP
C,PARCOR,LSP,メルケプストラムなど。以下単にパラメ
ータと呼ぶことにする)を取り出し、一定の規則に基づ
いてパラメータと駆動音源信号(有声音声区間ではイン
パルス列、無声音声区間ではノイズ)を合成音声の発声
速度に応じて伸縮させて結合し、音声合成器に与えるこ
とにより合成音声を得ている音声合成方式において、ア
クセントと発声速度を所望の状態に指示する方式につい
て説明する。
第1図は本実施例の構成を示すブロック図であり、1
は入力テキスト解析部、2はパラメータ接続部、3はピ
ッチ生成部、4は音声信号生成部である。ローマ字とコ
ントロール文字から成る入力テキストは、1の入力テキ
スト解析部でVcV(音声素片)単位で切り出され、2の
パラメータ接続部でVcVパラメータ(メルケプストラム
方式で蓄積されている)伸縮接続され、音声パラメータ
となり、3のピッチ生成部でピッチパタンが付加され
て、4の音声信号生成部に送られて音声出力される。
第2図は1の入力テキスト解析部の詳しい説明部であ
り、入力テキストは文字種判別部11で文字種の判別が行
われ、モーラ区切り文字(母音、撥音、長音、促音)な
らば、VcV番号取り出し部13においてVcV番号からVcV素
片のパラメータを呼び出せる様に記憶してあるVcVテー
ブルをアクセスし、入力テキスト解析出力データにVcV
番号をセットし、VcV番号取り出し部13で取り出したVcV
番号に対して、VcV型設定部14でVcV型(有声/無声、長
音/促音、無音、語頭/語尾、連母音、文末)をセット
し、仮定拍同期点振り付け部15で仮定拍同期点をセット
し、フレーズ設定部17でフレーズ(息継ぎ)をセットす
る。
本発明は、1の入力解析部においての、アクセントと
仮定拍同期点のセットに関するものである。アクセント
と仮定拍同期点は各モーラごとにセットされてピッチ生
成部3に送られる。入力テキストでアクセントをセット
する場合には、例えば東京方言の場合には、「橋」を
“HA/SHI"、「箸」を“/HA¥SHI"と記述して入力する。
アクセントのコントロールはコントロール文字“/"と
“¥”によって行われ、“/"によってアクセントは1単
位上昇し、“¥”によってアクセントは1単位下降す
る。“//"ではアクセントは2単位上昇し“//¥”や
“/¥/"ではアクセントは1単位上昇する。
第3図はアクセントセットのフローチャートである。
まず、モーラ番号とアクセントが初期化され(S3
1)、入力テキストから1文字づつ読み込んで(S32)、
文字種の判別が行われ(S33)、入力文字がアクセント
コントロール記号ならばアクセント上昇記号かアクセン
ト下降記号か判別され(S34)、アクセント上昇記号な
らばアクセントを1単位上昇させ(S36)、アクセント
下降記号ならばアクセントを1単位下降させる(S3
7)。入力文字がアクセントコントロール記号でないと
判別されたならば(S33)文末かどうかが判別され(S3
5)、文末ならば終了し、文末でなければアクセントをV
cVデータにセットする(S38)。
次に入力テキストで、“KO//RE¥WA¥ //PE¥N¥
/DE¥SU/KA/."と入力されたときの、入力テキスト解析
部の出力を示す。第3図で示したフローチャートに従っ
て処理手順を説明する。まずアクセントが0に初期化さ
れる(S31)。
次に文字“K"が入力され(S32)文字種判別部11で文
字種が判別され(S33)、“K"はコントロール記号では
なくモーラ区切り文字でもないのでVcVバッファにプッ
シュされる。次に文字“0"はコントロール文字でなくモ
ーラ区切り文字なのでVcVバッファにプッシュされて、V
cVバッファ内の文字列“KO"をキーとしてVcV番号取り出
し部13にはVcVテーブル12をアクセスしてVcV番号が取得
され(S38)、“KO"に対する入力テキスト解析出力デー
タに、アクセントの値0がセットされ、VcVバッファが
クリアされてVcVバッファに“0"がプッシュされる(S3
1)。次に文字“/"が入力されて文字種が判別され(S3
3)、“/"はアクセントを上昇させるコントロール文字
なので(S34)アクセントの値に1が加えられ(S36)、
更に文字“/"が入力されてアクセントの値に1が加えら
れ(S36)、アクセントの値は2になる。次に“R"が入
力されて文字種が判別されてVcVバッファにプッシュさ
れる。次に“E"が入力されて文字種が判別され“E"はロ
ーマ字で区切り文字なのでVcVバッファにプッシュされ
てVcVバッファ内の文字列“ORE"をキーとしてVcVテーブ
ルをアクセスしてVcV番号が取得され、“ORE"に対する
入力テキスト解析出力データにアクセント値2と共にセ
ットされ(S38)、VcVバッファがクリアされてVcVバッ
ファに“E"がプッシュされる。次に文字“¥”が入力さ
れて(S32)文字種が判別され(S33)、“¥”はアクセ
ントを下降させるコントロール文字なので(S34)アク
セントの値から1が引かれ(S37)アクセントの値は1
になる。以下同様の処理が行われて、“EWA"の入力テキ
スト解析出力データのアクセント値は1がセットされ
る。スペース(n+1)個をnモーラとしてカウントす
ると、“KO/RE¥WA¥ //PE¥N¥ /DE¥SU/KA/."とい
う入力は、 “KO"+“ORE"+“EWA"+“A"+“PE"+“EN"+“ND
E"+“ESU"+“UKA"+“A" のようにモーラ分解され、各モーラのアクセントの値は
()内の値にセットされて、 “KO(0)”+“ORE(2)”+“EWA(1)”+“A
(0)”+“PE(2)”+“EN(1)”+“NDE
(1)”+“ESU(0)”+“UKA(1)”+“A
(2)” のようになり、3のピッチ生成部に送られて第5図に示
すようなアクセント成分が生成される。
第4図は発声速度をセットするフローチャートであ
る。
モーラ間隔と発声速度のコントロールはアクセントの
コントロールと同様に、コントロール文字“−”と
“+”によって行われ、“−”によって拍同期点間隔か
ら1が引かれて発声速度が加速され“+”によって拍同
期点間隔に1が加えられて発声速度が減速される。
入力テキスト解析部1に入力された文字列はモーラ単
位で切り出され、各モーラに拍同期点と拍同期点間隔が
付加されてセットされ、パラメータ接続部2とピッチ生
成部3に送られる。
まず、拍同期点が0(msec)に、拍同期点間隔が16
(160msec)に初期化される。
今、“A+IU−−E−O."と入力されたとすると、モ
ーラ単位に切り出され、発声速度のコントロールコード
により変化される前の基準となる仮定拍同期点の位置
([]で囲んで示す)が付加されて、次の入力テキスト
解析出力データが作成される。
“A[16]”+“AI[33]”+“IU[50]”+“UE[6
5]”+“EO[79]”+“O[94]” 第4図に示した発声速度(モーラ間隔)セットのフロ
ーチャートに従って動作を説明する。
まず、拍同期点を0(msec)に、仮の拍同期点を16
(160msec)に初期化する(S41)。ローマ字とコントロ
ール文字からなるテキストが入力され(S42)、文字種
判別部11に入力テキストから1文字づつ読み込んで文字
種の判別が行われる(S43)。入力文字がモーラ間隔コ
ントロール記号であるならば(S43)、減速記号である
か加速記号であるか判別する(S44)。減速記号である
ならば、拍同期点間隔を1単位増加させ(S46)、加速
記号であるならば、拍同期点間隔を1単位減少させる
(S47)。拍同期点間隔を変更したら(S46、S47)、次
の1文字を入力テキストから文字種判別部11に読み込む
(S42)。S43において文字種がモーラ間隔コントロール
記号でないと判断されたならば、文末であるかどうか判
断し(S45)、文末でないならば(S45)仮定拍同期点間
隔を変更せずにVcVデータにセットする(S48)。S45で
文末であると判断されたならば、終了する。
この、発声速度セットの処理において拍同期点間隔が
変更された場合、それに伴って前記した仮定拍同期点の
位置も変化する。
これらのアクセント、速度変更処理は、CPU(中央制
御装置)にて行われる。
[発明の効果] 以上説明したように、本発明によれば、入力した文字
情報から切り出された複数の音声素片によって形成され
るモーラ単位で、当該文字情報の音声合成時のアクセン
ト若しくは発声速度を制御するようにしたので、日本語
のアクセントのみならず、日本語本来のアクセントとは
異なる外来語等のアクセントをも容易に生成することが
できるといった効果がある。
【図面の簡単な説明】
第1図は本実施例の構成を示すブロック図、 第2図は第1図における入力テキスト解析部1の詳しい
説明図、 第3図はアクセントセットのフローチャート、 第4図は発声速度(モーラ間隔)セットのフローチャー
ト、 第5図は本発明の一例を説明するためのアクセント成分
を示す。 1……入力テキスト解析部 2……パラメータ接続部 3……ピッチ生成部 4……音声信号生成部 11……文字種判別部 12……VcVテーブル 13……VcV番号取り出し部 14……VcV型設定部 15……仮定拍同期点振り付け部 16……アクセント設定部 17……フレーズ設定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤田 武 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (72)発明者 麻生 隆 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (56)参考文献 特開 昭61−70597(JP,A) 特開 昭57−93441(JP,A) 特開 平2−195399(JP,A)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】合成すべき音声の音韻系列に応じて、音声
    素片ファイルに登録された音声素片の特徴パラメータと
    音源情報とを順次接続し、音声合成する音声合成方法で
    あって、 文字情報を入力し、 前記入力した文字情報から複数の音声素片を切り出すと
    ともに、該切り出された音声素片によって形成されるモ
    ーラ間に挿入されたアクセント制御情報を抽出し、 前記抽出したアクセント制御情報に従って、前記音声素
    片によって形成されるモーラ単位で、前記入力した文字
    情報の音声合成時のアクセントを制御することを特徴と
    する音声合成方法。
  2. 【請求項2】前記複数の音声素片から前記アクセント制
    御情報に替えて発声速度制御情報を抽出し、該抽出した
    発声速度制御情報に従って、前記音声素片によって形成
    されるモーラ単位で、前記音声合成時の発声速度を制御
    することを特徴とする請求項1に記載の音声合成方法。
  3. 【請求項3】合成すべき音声の音韻系列に応じて、音声
    素片ファイルに登録された音声素片の特徴パラメータと
    音源情報とを順次接続し、音声合成する音声合成装置で
    あって、 文字情報を入力する入力手段と、 前記入力した文字情報から複数の音声素片を切り出す切
    出手段と、 該切り出された音声素片によって形成されるモーラ間に
    挿入されたアクセント制御情報を抽出する抽出手段と、 前記抽出したアクセント制御情報に従って、前記音声素
    片によって形成されるモーラ単位で、前記入力した文字
    情報の音声合成時のアクセントを制御する制御手段と を有することを特徴とする音声合成装置。
  4. 【請求項4】前記抽出手段は、前記複数の音声素片から
    前記アクセント制御情報に替えて発声速度制御情報を抽
    出し、前記制御手段は、該抽出した発声速度制御情報に
    従って、前記音声素片によって形成されるモーラ単位
    で、前記音声合成時の発声速度を制御することを特徴と
    する請求項3に記載の音声合成装置。
JP01343113A 1989-11-06 1989-12-29 音声合成方式及び装置 Expired - Lifetime JP3109807B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP01343113A JP3109807B2 (ja) 1989-12-29 1989-12-29 音声合成方式及び装置
EP90312074A EP0427485B1 (en) 1989-11-06 1990-11-05 Speech synthesis apparatus and method
US07/608,757 US5220629A (en) 1989-11-06 1990-11-05 Speech synthesis apparatus and method
DE69028072T DE69028072T2 (de) 1989-11-06 1990-11-05 Verfahren und Einrichtung zur Sprachsynthese

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01343113A JP3109807B2 (ja) 1989-12-29 1989-12-29 音声合成方式及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP24314099A Division JP3314058B2 (ja) 1999-08-30 1999-08-30 音声合成方法及び装置

Publications (2)

Publication Number Publication Date
JPH03203799A JPH03203799A (ja) 1991-09-05
JP3109807B2 true JP3109807B2 (ja) 2000-11-20

Family

ID=18359039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01343113A Expired - Lifetime JP3109807B2 (ja) 1989-11-06 1989-12-29 音声合成方式及び装置

Country Status (1)

Country Link
JP (1) JP3109807B2 (ja)

Also Published As

Publication number Publication date
JPH03203799A (ja) 1991-09-05

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
JPS62160495A (ja) 音声合成装置
JP2009139677A (ja) 音声処理装置及びそのプログラム
JP3109807B2 (ja) 音声合成方式及び装置
JP3437064B2 (ja) 音声合成装置
JP3314058B2 (ja) 音声合成方法及び装置
JP3006240B2 (ja) 音声合成方法および装置
JPH0580791A (ja) 音声規則合成装置および方法
JPH07140996A (ja) 音声規則合成装置
JPS62138898A (ja) 音声規則合成方式
JPH0731509B2 (ja) 音声分析装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPH11282494A (ja) 音声合成装置および記憶媒体
JP3292218B2 (ja) 音声メッセージ作成装置
JP2573587B2 (ja) ピッチパタン生成装置
JP2737122B2 (ja) 音声辞書作成装置
JP3870583B2 (ja) 音声合成装置および記憶媒体
JPH06149283A (ja) 音声合成装置
JPH0635913A (ja) 文章読み上げ装置
JPH08160983A (ja) 音声合成装置
JPH045697A (ja) 単語アクセント登録方法
JPH0756589A (ja) 音声合成方法
JPH08146984A (ja) 音声合成装置
JPH0756599B2 (ja) 音声フアイル作成方法
JPS63174100A (ja) 音声規則合成方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 10