JP2009237564A - 音声合成用データの選択方法 - Google Patents
音声合成用データの選択方法 Download PDFInfo
- Publication number
- JP2009237564A JP2009237564A JP2009049853A JP2009049853A JP2009237564A JP 2009237564 A JP2009237564 A JP 2009237564A JP 2009049853 A JP2009049853 A JP 2009049853A JP 2009049853 A JP2009049853 A JP 2009049853A JP 2009237564 A JP2009237564 A JP 2009237564A
- Authority
- JP
- Japan
- Prior art keywords
- accent
- evaluation value
- population
- child group
- example sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】第1ステップでは、母集団の例文を登録した母集団ファイルから指定した個数の例文を取り出して仮の子集団とする。第2ステップでは、子集団の例文について音素の出現頻度の分散の程度を評価する第1の評価値およびアクセントパターンの出現頻度の分散の程度を評価する第2の評価値をそれぞれ求める。第3ステップでは、母集団から子集団を除いた残余集団の1個の例文と子集団の1個の例文とを交換したときに第1および第2の評価値により求められる分散の程度の増減を判断し交換によって分散の程度が大きくなる場合には例文を交換する。第1の評価値と第2の評価値との少なくとも一方が規定値以上になるか交換回数が規定回数に達するまで第3ステップを繰り返す。
【選択図】図1
Description
以下に説明する実施形態では、合成音声により出力しようとする音声メッセージが姓名のうちの名前である場合を想定し、名前を漢字かな混じりのテキストとして入力すると、当該テキストを含む音声を出力する場合について説明する。なお、以下に説明する実施形態では、音声データベースに登録する情報を生成するための例文であるテキストと、出力する合成音声を指示する文字列であるテキストとを区別するために、後者を入力テキストと呼ぶ。もちろん、前者と後者とのどちらのテキストも電気的処理が可能であるようにテキストデータとして与えられる。
実施形態1では、1個のアクセント句からなる名前、姓、地名などを例文として扱う例を示したが、本実施形態では複数個のアクセント句を含む文章を例文を扱う場合を例として説明する。
2 学習部
10 音声生成手段
20 収録テキスト集合最適化手段
F1 音声データベース
F2 母集団ファイル
F3 収録音声データベース
F4 書起しテキスト集合ファイル
M 母集団
σ 子集団
Σ 残余集団
Claims (7)
- 少なくとも1個のアクセント句を含んだ例文を要素とする集合である母集団の部分集合としての子集団を生成するにあたり、当該子集団に含まれるすべての例文を読み上げた音声から母集団に含まれるすべての例文の合成音声を生成するのに必要な音響単位が抽出可能になるように、子集団を構成する例文を母集団の例文から選択する方法であって、音響単位として音素とアクセント句のアクセントパターンとを用い、子集団に含まれる例文について音素の出現確率を評価する第1の評価値およびアクセントパターンの出現確率を評価する第2の評価値が、ともに規定値以上になることを判断基準として子集団に含める例文を選択することを特徴とする音声合成用データの選択方法。
- 少なくとも1個のアクセント句を含んだ例文を要素とする集合である母集団の部分集合としての子集団を生成するにあたり、当該子集団に含まれるすべての例文を読み上げた音声から母集団に含まれるすべての例文の合成音声を生成するのに必要な音響単位が抽出可能になるように、子集団を構成する例文を母集団の例文から選択する方法であって、音響単位として音素とアクセント句のアクセントパターンとを用い、子集団に含まれる例文について音素の出現確率を評価する第1の評価値およびアクセントパターンの出現確率を評価する第2の評価値との合計が規定値以上になることを判断基準として子集団に含める例文を選択することを特徴とする音声合成用データの選択方法。
- 少なくとも1個のアクセント句を含んだ例文を要素とする集合である母集団の部分集合としての子集団を生成するにあたり、当該子集団に含まれるすべての例文を読み上げた音声から母集団に含まれるすべての例文の合成音声を生成するのに必要な音響単位が抽出可能になるように、子集団を構成する例文を母集団の例文から選択する方法であって、音響単位として音素とアクセント句のアクセントパターンとを用い、母集団の要素である例文を登録した母集団ファイルから指定した個数の例文を取り出して仮の子集団とする第1ステップと、仮の子集団に含まれる例文について音素の出現確率を評価する第1の評価値およびアクセントパターンの出現確率を評価する第2の評価値をそれぞれ求める第2ステップと、母集団から子集団を除いた残余集団に含まれる1個の例文と子集団に含まれる1個の例文とを仮に交換したときに第1および第2の評価値の増減を判断し交換によって第1および第2の評価値が増大する場合には例文を交換する第3ステップとを有し、第1の評価値と第2の評価値との少なくとも一方が規定値以上になるか交換回数が規定回数に達するまで第3ステップを繰り返すことを特徴とする音声合成用データの選択方法。
- 前記第3ステップで前記第1の評価値と前記第2の評価値とを規定値と比較するにあたり、第1の評価値と第2の評価値との重み付き加算の結果を比較することを特徴とする請求項3記載の音声合成用データの選択方法。
- 前記第3ステップで前記第1の評価値と前記第2の評価値とを規定値と比較するにあたり、第1の評価値と第2の評価値との合計を比較することを特徴とする請求項3記載の音声合成用データの選択方法。
- 前記アクセントパターンは、例文においてアクセント句ごとに抽出したモーラ数とアクセント型とのデータ対であることを特徴とする請求項1〜5のいずれか1項に記載の音声合成用データの選択方法。
- 前記アクセントパターンは、例文においてアクセント句ごとに抽出したモーラ数とアクセント型とのデータ対を、連続する規定の複数個のアクセント句に関して連結したデータ組であることを特徴とする請求項1〜5のいずれか1項に記載の音声合成用データの選択方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009049853A JP2009237564A (ja) | 2008-03-05 | 2009-03-03 | 音声合成用データの選択方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008055243 | 2008-03-05 | ||
JP2009049853A JP2009237564A (ja) | 2008-03-05 | 2009-03-03 | 音声合成用データの選択方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009237564A true JP2009237564A (ja) | 2009-10-15 |
Family
ID=41251498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009049853A Pending JP2009237564A (ja) | 2008-03-05 | 2009-03-03 | 音声合成用データの選択方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009237564A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017102328A (ja) * | 2015-12-03 | 2017-06-08 | 日本電信電話株式会社 | 文章セット生成装置、文章セット生成方法、プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981173A (ja) * | 1995-09-12 | 1997-03-28 | Canon Inc | 音声規則合成方法とその装置 |
JP2002268672A (ja) * | 2001-03-13 | 2002-09-20 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声データベース用文セットの選択方法 |
JP2004246140A (ja) * | 2003-02-14 | 2004-09-02 | Nippon Telegr & Teleph Corp <Ntt> | テキスト選択方法、装置及びプログラム |
JP2006284700A (ja) * | 2005-03-31 | 2006-10-19 | Sanyo Electric Co Ltd | 音声合成装置および音声合成処理プログラム |
-
2009
- 2009-03-03 JP JP2009049853A patent/JP2009237564A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981173A (ja) * | 1995-09-12 | 1997-03-28 | Canon Inc | 音声規則合成方法とその装置 |
JP2002268672A (ja) * | 2001-03-13 | 2002-09-20 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声データベース用文セットの選択方法 |
JP2004246140A (ja) * | 2003-02-14 | 2004-09-02 | Nippon Telegr & Teleph Corp <Ntt> | テキスト選択方法、装置及びプログラム |
JP2006284700A (ja) * | 2005-03-31 | 2006-10-19 | Sanyo Electric Co Ltd | 音声合成装置および音声合成処理プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017102328A (ja) * | 2015-12-03 | 2017-06-08 | 日本電信電話株式会社 | 文章セット生成装置、文章セット生成方法、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7809572B2 (en) | Voice quality change portion locating apparatus | |
US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
EP1221693B1 (en) | Prosody template matching for text-to-speech systems | |
JP6523893B2 (ja) | 学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム | |
MXPA01006594A (es) | Metodo y sistema para la preseleccion de unidades adecuadas para habla por concatenacion. | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
JP5929909B2 (ja) | 韻律生成装置、音声合成装置、韻律生成方法および韻律生成プログラム | |
JP5198046B2 (ja) | 音声処理装置及びそのプログラム | |
JP5320363B2 (ja) | 音声編集方法、装置及び音声合成方法 | |
JP4811557B2 (ja) | 音声再生装置及び発話支援装置 | |
Bettayeb et al. | Speech synthesis system for the holy quran recitation. | |
JP2016151736A (ja) | 音声加工装置、及びプログラム | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP2009237564A (ja) | 音声合成用データの選択方法 | |
JP2011197124A (ja) | データ作成システム及びプログラム | |
JP3571925B2 (ja) | 音声情報処理装置 | |
Bettayeb et al. | A Study to Build a Holy Quran Text-To-Speech System | |
JPH06318094A (ja) | 音声規則合成装置 | |
Dessai et al. | Development of Konkani TTS system using concatenative synthesis | |
Khalil et al. | Optimization of Arabic database and an implementation for Arabic speech synthesis system using HMM: HTS_ARAB_TALK | |
Jha et al. | Maithili text-to-speech system | |
Lazaridis et al. | Phone duration modeling: overview of techniques and performance optimization via feature selection in the context of emotional speech | |
Morais et al. | Data-driven text-to-speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100714 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110915 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20120113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130129 |