JP6197362B2 - 音声合成方法、プログラム、及び装置 - Google Patents
音声合成方法、プログラム、及び装置 Download PDFInfo
- Publication number
- JP6197362B2 JP6197362B2 JP2013105325A JP2013105325A JP6197362B2 JP 6197362 B2 JP6197362 B2 JP 6197362B2 JP 2013105325 A JP2013105325 A JP 2013105325A JP 2013105325 A JP2013105325 A JP 2013105325A JP 6197362 B2 JP6197362 B2 JP 6197362B2
- Authority
- JP
- Japan
- Prior art keywords
- range
- emphasis
- enhancement
- information
- rear end
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001308 synthesis method Methods 0.000 title claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000003014 reinforcing effect Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 74
- 238000004458 analytical method Methods 0.000 description 30
- 230000000877 morphologic effect Effects 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 235000003913 Coccoloba uvifera Nutrition 0.000 description 5
- 240000008976 Pterocarpus marsupium Species 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 241000102542 Kara Species 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 208000003028 Stuttering Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000002816 gill Anatomy 0.000 description 2
- 241000357437 Mola Species 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Description
図1に、第1実施形態に係る音声合成装置100の一例を示す。音声合成装置100は、制御部150、形態素解析部120、構文解析部125、強調範囲検出部130、拡張範囲設定部135、強調規則設定部140、音声合成部145、及びインタフェース部160を含む。制御部150は、形態素解析部120、構文解析部125、強調範囲検出部130、拡張範囲設定部135、強調規則設定部140、音声合成部145、及びインタフェース部160と接続されている。
また、図1及び図2によって示す実施例では、平仮名及び漢字の文字列で構成される文字列を入力としている。そして、形態素解析部120(ステップ230)、構文解析部125(ステップ240)によって入力文字列を読み及びアクセント、呼気段落情報を表す表音文字列に変換している。しかし、形態素解析部120(ステップ230)、構文解析部125(ステップ240)を省略し、入力部110から直接表音文字列を入力するようにしてもよい。
仮名漢字文字列:昨日は雨でしたが今日は良い天気です。
表音文字列:キノ’ーワ△ア’メ△デ’シタガ△キョ’ーワ△ヨ’イ△テ’ンキデス.
また、先端拡張範囲の設定に関する別の実施例として、図7Bに示す構成であっても良い。
図7Bの例では、アクセント句境界情報、及びアクセントの高低情報、呼気段落境界情報に基づいて、先端拡張範囲を設定する。
ステップ330で、強調範囲先端がアクセント句の先端であるか否か判断する。強調範囲先端がアクセント句の先端でない場合、ステップ350で、強調範囲先端を前方に1モーラ移動することにより強調範囲を拡張する。強調範囲先端がアクセント句の先端となるまで、ステップ330及びステップ350の処理を繰り返す。
強調範囲先端がアクセント句の先端となった場合、ステップ340に進む。
ステップ340で、強調範囲先端が呼気段落境界であるか否か判断する。強調範囲先端が呼気段落境界である場合、先端拡張範囲の設定は終了する。強調範囲先端が呼気段落境界でない場合、ステップ345に進む。
ステップ345で、強調範囲先端の直前モーラのアクセント高低が低であるか否かを判断する。強調範囲先端の直前モーラのアクセント高低が低である場合、先端拡張範囲の設定は終了する。強調範囲先端の直前モーラのアクセント高低が低でない場合(すなわち、高である場合)、ステップ350で、強調範囲先端を前方に1モーラ移動することにより強調範囲を拡張する。以降、強調範囲先端がアクセント句の先端となるまで、ステップ330及びステップ350の処理を繰り返す。
以上の処理で拡張された範囲を先端拡張範囲と呼ぶ。ステップ345で拡張範囲直前のモーラのアクセントが高で続く場合には、強調範囲先端がアクセント句境界であってもさらに強調範囲を拡張する。これにより、アクセントが高く連続している部分では、強調範囲を区切らないため、文章全体にわたってより自然な強調表現を実現できる。
次に第2実施形態について説明する。
「キノ’ーワ△ア’メ△デ’シタガ,キョ’ーワ△ヨ’イ△テ’ンキデス.」が、
「キノ’ーワ△ア’メ△デ’シタガ,キョ’ー,ワ△ヨ’イ△テ’ンキデス.」になる。
「キノ’ーワ△ア’メ△デ’シタガ△キョ’ーワ△ヨ’イ△テ’ンキデス.」が、
「キノ’ーワ △ア’メ△デ’シタガ△,キョ’ーワ△ヨ’イ△テ’ンキデス.」となる。
「ホ’ン△デモンストレ’ーションデワ,ユーザージ’シンガ△サービスポータルガ’メンカラ△サ’ービスオ△エラ’ビ,」 が、
「ホ’ン△デモンストレ’ーションデワ,ユーザージ’シンガ△サービスポータルガ’メンカラ△サ’ービスオ△エラ’ビ,」となる。
「イッテンシテ’,キョ’ーワ△ヨ’イ△テ’ンキデス.」が、
「イッテンシテ’,キョ’ーワ△ヨ’イ△テ’ンキデス.」となる。
次に第3実施形態について説明する。
一方、強調制御範囲の後端がアクセント句後端であると判断された場合、ステップ520で強調制御範囲の後端のアクセントが高アクセントであるか否か判断する。
ステップ520で、強調制御範囲後端のアクセントが低である場合、後端拡張範囲の設定は終了する。
例8の「アイディ’ート△パスワ’ードオ△シヨーシ’△ログイ’ンシマス.」の「パスワ’ード」の「ド」はアクセント句後端ではないため、強調範囲の後端は右に1モーラ移動する。「パスワ’ードオ」の「オ」はアクセント句後端であるため、強調制御範囲後端が「オ」まで移動すると、ステップ510の判断が肯定され、ステップ520で強調範囲の後端のアクセントが高アクセントであるか否か判断する。「パスワ’ードオ」の「オ」は低アクセントであるため、ステップ520で判断が否定され、処理を終了する。ここでは後端拡張範囲は「オ」となる。
ステップ520の判断で、強調範囲後端が高アクセントであった場合、ステップ525に進み、強調範囲後端が呼気段落後端であるか否かを判断する。ステップ525で、強調制御範囲後端が呼気段落後端であると判断された場合、後端拡張範囲の設定は終了する。
強調範囲後端が呼気段落後端ではないと判断された場合、ステップ530で、強調範囲後端を後方に1モーラ移動することにより強調制御範囲を拡張する。以降、強調制御範囲後端がアクセント句の後端となるまで、ステップ530及びステップ540の処理を繰り返す。
ステップ530で強調制御範囲がアクセント句後端まで拡張された場合、ステップ520に戻り処理を続ける。
以上の処理で拡張された範囲を後端拡張範囲と呼ぶ。
「アイディ’ート△パスワ’ードオ ,△シヨーシ’△ログイ’ンシマス.」
次に第4実施形態について説明する。
「アイディ’ート△パスワ’ードオ△シヨーシ’△ログイ’ンシマス.」が、
「アイディ’ート△パスワ’ード,オ△シヨーシ’△ログイ’ンシマス.」となる。
「アイディ’ート△パスワ’ード,オ△シヨーシ△ログイ’ンシマス.」が、
「アイディ’ート△パスワ’ード,オ△シヨーシ△ログイ’ンシマス.」となる。
「アイディ’ート△パスワ’ードオ△シヨーシ△ログイ’ンシマス.」が、
「アイディ’ート△パスワ’ードオ△シヨーシ△ログイ’ンシマス.」となる。
[第5実施形態]
次に第5実施形態について説明する。
コンピュータが、
音声出力する場合に音声を強調する強調範囲を示す強調範囲情報が設定されている文字列及び呼気段落情報を含む文字情報を入力し、
前記文字情報に含まれる文字列に対して、前記強調範囲情報で示される強調範囲の前方及び後方の少なくとも一方に、前記呼気段落情報に基いて、該強調範囲を拡張する拡張範囲を設定し、
前記強調範囲及び前記拡張範囲の各々に、該強調範囲及び該拡張範囲に含まれる前記文字列の音声を強調する韻律制御パラメータを設定し、
設定された韻律制御パラメータに基いて前記文字列の音声を合成して出力する、
音声合成方法。
前記拡張範囲を設定する際に、
前記文字情報が含むアクセント情報及び音声の区切りを示す呼気段落境界情報に基づいて、前記強調範囲の前方に先端拡張範囲を設定し、該文字情報が有するアクセント句の境界を示すアクセント句境界情報、及び前記呼気段落境界情報に基づいて、該強調範囲の後方に後端拡張範囲を設定する、
付記1に記載の音声合成方法。
前記アクセント句境界情報に基づいて、前記強調範囲の前方を拡張する前方拡張範囲、及び該強調範囲の後方を拡張する後方拡張範囲、の少なくとも一方を設定する、
付記2に記載の音声合成方法。
(付記3−2)
前記前方拡張範囲を設定する際に、前記強調範囲情報に含まれる強調度の情報に基づいて、前記強調範囲と前記前方拡張範囲との間にポーズを挿入する、
付記3−1に記載の音声合成方法。
(付記3−3)
前記文字情報が含むフレーズに含まれる文節数に基づいて、前記先端拡張範囲を設定する、
付記2に記載の音声合成方法。
(付記3−4)
前記先端拡張範囲を設定する際に、前記文字情報が含むフレーズに含まれる文節数に基づいて、前記強調範囲と前記先端拡張範囲との間にポーズを挿入する、
付記2に記載の音声合成方法。
前記強調範囲、前記前方拡張範囲、前記後方拡張範囲、前記先端拡張範囲、及び前記後端拡張範囲の各々に韻律制御パラメータを設定する、
付記3に記載の音声合成方法。
前記韻律制御パラメータは、ピッチ、話速、音量の少なくとも一つを含む、付記1〜4のいずれか1つに記載の音声合成方法。
コンピュータに、
音声出力する場合に音声を強調する強調範囲を示す強調範囲情報が設定されている文字列及び呼気段落情報を含む文字情報を入力し、
前記文字情報に含まれる文字列に対して、前記強調範囲情報で示される強調範囲の前方及び後方の少なくとも一方に、前記呼気段落情報に基づいて、該強調範囲を拡張する拡張範囲を設定し、
前記強調範囲及び前記拡張範囲の各々に、該強調範囲及び該拡張範囲に含まれる前記文字列の音声を強調する韻律制御パラメータを設定し、
設定された韻律制御パラメータに基づいて前記文字列の音声を合成して出力する、
処理を実行させるための音声合成プログラム。
前記拡張範囲を設定する際に、
前記文字情報が含むアクセント情報及び音声の区切りを示す呼気段落境界情報に基づいて、前記強調範囲の前方に先端拡張範囲を設定し、該文字情報が有するアクセント句の境界を示すアクセント句境界情報、及び前記呼気段落境界情報に基づいて、該強調範囲の後方に後端拡張範囲を設定する、
付記6に記載の音声合成プログラム。
前記アクセント句境界情報に基づいて、前記強調範囲の前方を拡張する前方拡張範囲、及び該強調範囲の後方を拡張する後方拡張範囲、の少なくとも一方を設定する、
付記7に記載の音声合成プログラム。
前記強調範囲、前記前方拡張範囲、前記後方拡張範囲、前記先端拡張範囲、及び前記後端拡張範囲の各々に韻律制御パラメータを設定する、
付記8に記載の音声合成プログラム。
前記韻律制御パラメータは、ピッチ、話速、音量の少なくとも一つを含む、付記6〜9のいずれか1つに記載の音声合成プログラム。
音声出力する場合に音声を強調する強調範囲を示す強調範囲情報が設定されている文字列及び呼気段落情報を含む文字情報を入力する入力部と、
前記文字情報に含まれる文字列に対して、前記強調範囲情報で示される強調範囲の前方及び後方の少なくとも一方に、前記呼気段落境界情報に基づいて、該強調範囲を拡張する拡張範囲を設定する拡張範囲設定部と、
前記強調範囲及び前記拡張範囲の各々に、該強調範囲及び該拡張範囲に含まれる前記文字列の音声を強調する韻律制御パラメータを設定する強調規則設定部と、
設定された韻律制御パラメータに基いて前記文字列の音声を合成して出力する音声出力部と、
を備える音声合成装置。
前記拡張範囲設定部は、
前記文字情報が含むアクセント情報及び音声の区切りを示す呼気段落境界情報に基づいて、前記強調範囲の前方に先端拡張範囲を設定し、該文字情報が有するアクセント句の境界を示すアクセント句境界情報、及び前記呼気段落境界情報に基づいて、該強調範囲の後方に後端拡張範囲を設定する、
付記11に記載の音声合成装置。
前記拡張範囲設定部は、さらに、
前記アクセント句境界情報に基づいて、前記強調範囲の前方を拡張する前方拡張範囲、及び該強調範囲の後方を拡張する後方拡張範囲、の少なくとも一方を設定する、
付記12に記載の音声合成装置。
前記強調規則設定部は、前記強調範囲、前記前方拡張範囲、前記後方拡張範囲、前記先端拡張範囲、及び前記後端拡張範囲の各々に韻律制御パラメータを設定する、
付記13に記載の音声合成装置。
前記韻律制御パラメータは、ピッチ、話速、音量の少なくとも一つを含む、付記11〜14のいずれか1つに記載の強調音声合成装置。
110 入力部
115 音声出力部
120 形態素解析部
125 構文解析部
130 強調範囲検出部
135 拡張範囲設定部
140 強調規則設定部
145 音声合成部
900 コンピュータ
Claims (6)
- 音声出力する場合に音声を強調する強調範囲を示す強調範囲情報が設定されている文字列及び呼気段落情報を含む文字情報を入力し、
前記文字情報に含まれる文字列に対して、前記強調範囲情報で示される強調範囲の前方及び後方の少なくとも一方に、前記呼気段落情報に基いて、該強調範囲を拡張する拡張範囲を設定し、
前記強調範囲及び前記強調範囲の前方及び後方の少なくとも一方の前記拡張範囲の各々に対して個別に、前記強調範囲及び前記強調範囲の前方及び後方の少なくとも一方の前記拡張範囲の内の一つの範囲と他の範囲とで異なる、音声を強調する韻律制御パラメータの値を設定し、
設定された韻律制御パラメータに基いて前記文字列の音声を合成して出力する、
音声合成方法。 - 前記拡張範囲を設定する際に、
前記文字情報が含むアクセント情報及び音声の区切りを示す呼気段落境界情報に基づいて、前記強調範囲の前方に先端拡張範囲を設定し、該文字情報が有するアクセント句の境界を示すアクセント句境界情報、及び前記呼気段落境界情報に基づいて、該強調範囲の後方に後端拡張範囲を設定する、
請求項1に記載の音声合成方法。 - 前記アクセント句境界情報に基づいて、前記強調範囲の前方を拡張する前方拡張範囲、及び該強調範囲の後方を拡張する後方拡張範囲、の少なくとも一方を設定する、
請求項2に記載の音声合成方法。 - 前記強調範囲、前記前方拡張範囲、前記後方拡張範囲、前記先端拡張範囲、及び前記後端拡張範囲の各々に韻律制御パラメータを設定する、
請求項3に記載の音声合成方法。 - コンピュータに、
音声出力する場合に音声を強調する強調範囲を示す強調範囲情報が設定されている文字列及び呼気段落情報を含む文字情報を入力し、
前記文字情報に含まれる文字列に対して、前記強調範囲情報で示される強調範囲の前方及び後方の少なくとも一方に、前記呼気段落情報に基づいて、該強調範囲を拡張する拡張範囲を設定し、
前記強調範囲及び前記強調範囲の前方及び後方の少なくとも一方の前記拡張範囲の各々に対して個別に、前記強調範囲及び前記強調範囲の前方及び後方の少なくとも一方の前記拡張範囲の内の一つの範囲と他の範囲とで異なる、音声を強調する韻律制御パラメータの値を設定し、
設定された韻律制御パラメータに基づいて前記文字列の音声を合成して出力する、
処理を実行させるための音声合成プログラム。 - 音声出力する場合に音声を強調する強調範囲を示す強調範囲情報が設定されている文字列及び呼気段落情報を含む文字情報を入力する入力部と、
前記文字情報に含まれる文字列に対して、前記強調範囲情報で示される強調範囲の前方及び後方の少なくとも一方に、前記呼気段落情報に基づいて、該強調範囲を拡張する拡張範囲を設定する拡張範囲設定部と、
前記強調範囲及び前記強調範囲の前方及び後方の少なくとも一方の前記拡張範囲の各々に対して個別に、前記強調範囲及び前記強調範囲の前方及び後方の少なくとも一方の前記拡張範囲の内の一つの範囲と他の範囲とで異なる、音声を強調する韻律制御パラメータの値を設定する強調規則設定部と、
設定された韻律制御パラメータに基いて前記文字列の音声を合成して出力する音声出力部と、
を備える音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013105325A JP6197362B2 (ja) | 2013-05-17 | 2013-05-17 | 音声合成方法、プログラム、及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013105325A JP6197362B2 (ja) | 2013-05-17 | 2013-05-17 | 音声合成方法、プログラム、及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014228556A JP2014228556A (ja) | 2014-12-08 |
JP6197362B2 true JP6197362B2 (ja) | 2017-09-20 |
Family
ID=52128488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013105325A Expired - Fee Related JP6197362B2 (ja) | 2013-05-17 | 2013-05-17 | 音声合成方法、プログラム、及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6197362B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4829605B2 (ja) * | 2005-12-12 | 2011-12-07 | 日本放送協会 | 音声合成装置および音声合成プログラム |
-
2013
- 2013-05-17 JP JP2013105325A patent/JP6197362B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014228556A (ja) | 2014-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8504368B2 (en) | Synthetic speech text-input device and program | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
KR20150146373A (ko) | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 | |
JP2007114507A (ja) | 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム | |
JP6790959B2 (ja) | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム | |
JP2008268477A (ja) | 韻律調整可能な音声合成装置 | |
JP2009139677A (ja) | 音声処理装置及びそのプログラム | |
JP2022133392A (ja) | 音声合成方法、装置、電子機器及び記憶媒体 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP4856560B2 (ja) | 音声合成装置 | |
JP5029884B2 (ja) | 韻律生成装置、韻律生成方法、および、韻律生成プログラム | |
JP5079718B2 (ja) | 外国語学習支援システム、及びプログラム | |
CN112002304B (zh) | 语音合成方法及装置 | |
Toman et al. | Unsupervised and phonologically controlled interpolation of Austrian German language varieties for speech synthesis | |
JP2003271194A (ja) | 音声対話装置及びその制御方法 | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
JP6436806B2 (ja) | 音声合成用データ作成方法、及び音声合成用データ作成装置 | |
JP5294700B2 (ja) | 音声認識及び合成システム、プログラム及び方法 | |
JP6197362B2 (ja) | 音声合成方法、プログラム、及び装置 | |
JP4841339B2 (ja) | 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム | |
JP6411015B2 (ja) | 音声合成装置、音声合成方法、およびプログラム | |
JP6197523B2 (ja) | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム | |
JP4053440B2 (ja) | テキスト音声合成システム及び方法 | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6197362 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |