JP2011180368A - 合成音声修正装置および合成音声修正方法 - Google Patents
合成音声修正装置および合成音声修正方法 Download PDFInfo
- Publication number
- JP2011180368A JP2011180368A JP2010044311A JP2010044311A JP2011180368A JP 2011180368 A JP2011180368 A JP 2011180368A JP 2010044311 A JP2010044311 A JP 2010044311A JP 2010044311 A JP2010044311 A JP 2010044311A JP 2011180368 A JP2011180368 A JP 2011180368A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- synthesized speech
- resynthesis
- synthesis
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】任意のテキストの読みを示す表音文字列データに対応する合成音声を出力するとともに、当該テキストを画面表示する合成音声出力表示部と、画面表示した前記テキストにおいて、ユーザが指摘した修正位置を取得する修正位置取得部と、前記修正位置に基づいて、前記合成音声にかかる再合成区間を特定する再合成区間特定部と、特定した前記再合成区間のテキストの読みを示す表音文字列データに対応する合成音声の候補を再合成候補として生成する再合成候補生成部と、前記再合成候補を識別可能にしてユーザに提示する再合成候補提示部と、識別可能にしてユーザに提示した前記再合成候補の中からユーザが選択した再合成候補を少なくとも含む合成音声を出力する再合成音声出力部とを備える。
【選択図】図1
Description
以下、本実施形態にかかる合成音声修正装置を、コンピュータ装置を用いて構成する場合の例について説明する。なお、本実施形態にかかる合成音声修正装置を、例えば携帯電話またはPDA(Personal Digital Assistance)等の装置を用いて構成してもよい。
図1は、本実施形態にかかる合成音声修正装置における各機能部の関係の一例を示す図である。本実施形態にかかる合成音声修正装置1は、例えば、修正機能付きの合成音声作成装置として機能するものである。なお、1aは、修正機能のない合成音声作成装置として機能する部分である。
図2は、図1に示した合成音声修正装置1を、CPUを有するコンピュータ装置を用いて実現したハードウェア構成の例を示す図である。上記合成音声修正装置1は、ディスプレイ21、CPU22、メモリ23、ハードディスク24、キーボード/マウス25およびスピーカ26を少なくとも備える。ハードディスク24には、OS(オペレーティング・システム、図示せず。)の他、合成音声修正プログラム24a、韻律コーパス15および波形辞書データ16等が記録される。CPU22は、OSおよび合成音声修正プログラム24a等に基づく処理を実行する。スピーカ26は、波形データとして生成された合成音声を音声出力する。
上述の図1および図2に加え、図3〜図6を用いて、上記合成音声修正装置1における合成音声修正プログラム24aの処理内容を説明する。合成音声修正装置1には、図示しない合成音声生成プログラムがインストールされている。CPU22は、これらの合成音声生成プログラムおよび合成音声修正プログラム24aを実行することによって、合成音声を生成して出力する。図3は、合成音声修正装置1のCPU22で実行される合成音声生成プログラムおよび合成音声修正プログラム24aに基づく合成音声修正処理のオペレーションチャートの一例を示す図である。図4Aは、ディスプレイ21のテキスト入力領域41内に入力されたテキストおよび生成ボタン42の具体例を示す図である。
以上に説明したとおり、上記の合成音声修正装置1は、生成した複数の再合成候補を識別可能にしてユーザに提示し、ユーザが選択した再合成候補を含む合成音声を出力する。このため、音の良い素片をユーザに選ばせる際に、候補となる素片群をユーザに提示して、どの合成音声を優先的に聞くべきかを明確にすることができる。これにより、ユーザは、現在の合成音声と再合成された候補とを聞き比べて、効率的に合成音声の修正を行うことが可能となる。
本実施形態にかかる合成音声修正装置も、第1の実施形態と同様に、コンピュータ装置、携帯電話またはPDA(Personal Digital Assistance)等の装置を用いて構成可能である。
本実施形態にかかる合成音声修正装置1のシステム構成およびハードウェア構成の一例は、図1および図2を用いて説明した第1の実施形態と基本的に同様である。
本実施形態の合成音声修正装置1における合成音声修正プログラム24aの処理内容は、図3〜図6を用いて説明した第1の実施形態と基本的に同様である。つまり、第1の実施形態と同様に、入力テキストに対して合成音声を出力し、指定された修正位置に対応する再合成候補を複数生成して提示するものである。但し、本実施形態では、図4Cに示した再合成候補の提示方法が異なる。
本実施形態にかかる合成音声修正装置も、第1の実施形態と同様に、コンピュータ装置、携帯電話またはPDA(Personal Digital Assistance)等の装置を用いて構成可能である。
図12は、本実施形態にかかる合成音声修正装置における各機能部の関係の一例を示す図である。図12に示す合成音声修正装置1は、第1の実施形態において示した各機能部1〜16に加えて、さらに、修正素片記録部17および修正素片データ18を含む。
図14は、合成音声修正装置1のCPU22で実行される合成音声生成プログラムおよび合成音声修正プログラム24aに基づく合成音声修正処理のオペレーションチャートの一例を示す図である。図14のオペレーションチャートにおけるOp301〜Op317は、第1の実施形態と同様である。
上記第1〜第3の実施形態において説明した構成の一部または全部を、2以上組合せた構成としてもよい。特に、第2の実施形態に示した再合成候補を識別可能にする提示方法においては、ユーザの選択により切り替えて表示してもよい。例えば、所定操作により、表示する情報(スコア、スコア順位、音素片および音素環境に関する情報、音素片の数、ピッチ変換率、音素長の差)を切り替えて表示してもよい。
2 言語処理部
3 韻律生成部
4 素片選択部
5 波形生成部
6 合成音声出力表示部
7 修正位置取得部
8 再合成区間特定部
9 再合成候補生成部
10 部分素片選択部
11 部分波形生成部
12 ピッチ平滑はめ込み部
13 再合成候補提示部
14 再合成音声出力部
15 韻律コーパス
16 波形辞書データ
17 修正素片データ
Claims (12)
- 任意のテキストの読みを示す表音文字列データに対応する合成音声を出力するとともに、当該テキストを画面表示する合成音声出力表示部と、
画面表示した前記テキストにおいて、ユーザが指摘した修正位置を取得する修正位置取得部と、
前記修正位置に基づいて、前記合成音声にかかる再合成区間を特定する再合成区間特定部と、
特定した前記再合成区間のテキストの読みを示す表音文字列データに対応する合成音声の候補を再合成候補として生成する再合成候補生成部と、
前記再合成候補を識別可能にしてユーザに提示する再合成候補提示部と、
識別可能にしてユーザに提示した前記再合成候補の中からユーザが選択した再合成候補を少なくとも含む合成音声を出力する再合成音声出力部とを備える合成音声修正装置。 - 前記再合成候補生成部は、前記表音文字列データから推定される理想的な音素片の組合せに対する、前記再合成候補を構成する音素片の組合せの適合度に基づくスコアを算出し、
前記再合成候補提示部は、前記再合成候補を前記スコアの順に提示する、請求項1の合成音声修正装置。 - 前記再合成候補提示部は、前記スコアを、前記再合成候補とともに表示する、請求項2の合成音声修正装置。
- 前記再合成区間特定部は、アクセント句、文節または呼気段落に基づいて、前記合成音声にかかる再合成区間を特定する、請求項1〜3のいずれか一項に記載の合成音声修正装置。
- 前記再合成候補提示部は、前記再合成候補生成部において再合成候補の生成に用いた前記スコアを算出するための要素を、前記再合成候補とともに表示する、請求項1〜4のいずれか一項に記載の合成音声修正装置。
- 前記再合成候補提示部は、前記スコアを算出するための要素として、前記再合成候補生成部において再合成候補の生成に用いた音素片および音素環境に関する情報を、前記再合成候補とともに表示する、請求項1〜5のいずれか一項に記載の合成音声修正装置。
- 前記再合成候補提示部は、前記スコアを算出するための要素として、前記再合成候補生成部において再合成候補の生成に用いた音素片の数を、前記再合成候補とともに表示する、請求項1〜6のいずれか一項に記載の合成音声修正装置。
- 前記再合成候補提示部は、前記スコアを算出するための要素として、前記再合成候補生成部において用いた波形辞書の音素片のピッチから、生成した再合成候補のピッチへのピッチ変換率を、前記再合成候補とともに表示する、請求項1〜7のいずれか一項に記載の合成音声修正装置。
- 前記再合成候補提示部は、前記スコアを算出するための要素として、素片を取得した波形辞書に記録されている当該素片の音素長と、前記合成音声を生成するために前記素片を変換した変換後の素片の音素長との差を、前記再合成候補とともに表示する、請求項1〜8のいずれか一項に記載の合成音声修正装置。
- 前記合成音声出力表示部において出力した合成音声を、前記再合成候補を含む合成音声により修正する指示を受けると、
前記合成音声出力表示部において出力した合成音声のうち、前記再合成区間に対応する部分の修正前の合成音声を生成するために用いられた素片を、修正素片として記録する修正素片記録部をさらに備え、
前記再合成候補生成部は、前記修正素片記録部を参照して、前記再合成候補を生成する、請求項1〜9のいずれか一項に記載の合成音声修正装置。 - 任意のテキストの読みを示す表音文字列データに対応する合成音声を出力するとともに、当該テキストを画面表示する合成音声出力表示処理と、
画面表示した前記テキストにおいて、ユーザが指摘した修正位置を取得する修正位置取得処理と、
前記修正位置に基づいて、前記合成音声にかかる再合成区間を特定する再合成区間特定処理と、
特定した前記再合成区間のテキストの読みを示す表音文字列データに対応する合成音声の候補を再合成候補として生成する再合成候補生成処理と、
前記再合成候補を識別可能にしてユーザに提示する再合成候補提示処理と、
識別可能にしてユーザに提示した前記再合成候補の中からユーザが選択した再合成候補を少なくとも含む合成音声を出力する再合成音声出力処理とをコンピュータに実行させる、合成音声修正プログラム。 - 任意のテキストの読みを示す表音文字列データに対応する合成音声を出力するとともに、当該テキストを画面表示する合成音声出力表示工程と、
画面表示した前記テキストにおいて、ユーザが指摘した修正位置を取得する修正位置取得工程と、
前記修正位置に基づいて、前記合成音声にかかる再合成区間を特定する再合成区間特定工程と、
特定した前記再合成区間のテキストの読みを示す表音文字列データに対応する合成音声の候補を再合成候補として生成する再合成候補生成工程と、
前記再合成候補を識別可能にしてユーザに提示する再合成候補提示工程と、
識別可能にしてユーザに提示した前記再合成候補の中からユーザが選択した再合成候補を少なくとも含む合成音声を出力する再合成音声出力工程とを含む合成音声修正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010044311A JP2011180368A (ja) | 2010-03-01 | 2010-03-01 | 合成音声修正装置および合成音声修正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010044311A JP2011180368A (ja) | 2010-03-01 | 2010-03-01 | 合成音声修正装置および合成音声修正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011180368A true JP2011180368A (ja) | 2011-09-15 |
Family
ID=44691913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010044311A Pending JP2011180368A (ja) | 2010-03-01 | 2010-03-01 | 合成音声修正装置および合成音声修正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011180368A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015118222A (ja) * | 2013-12-18 | 2015-06-25 | 株式会社日立超エル・エス・アイ・システムズ | 音声合成システム及び音声合成方法 |
CN105654940A (zh) * | 2016-01-26 | 2016-06-08 | 百度在线网络技术(北京)有限公司 | 一种语音合成方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004246129A (ja) * | 2003-02-14 | 2004-09-02 | Arcadia:Kk | 音声合成制御装置 |
JP2007148172A (ja) * | 2005-11-29 | 2007-06-14 | Matsushita Electric Ind Co Ltd | 声質制御装置および方法およびプログラム記憶媒体 |
WO2008102710A1 (ja) * | 2007-02-20 | 2008-08-28 | Nec Corporation | 音声合成装置及び方法とプログラム |
-
2010
- 2010-03-01 JP JP2010044311A patent/JP2011180368A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004246129A (ja) * | 2003-02-14 | 2004-09-02 | Arcadia:Kk | 音声合成制御装置 |
JP2007148172A (ja) * | 2005-11-29 | 2007-06-14 | Matsushita Electric Ind Co Ltd | 声質制御装置および方法およびプログラム記憶媒体 |
WO2008102710A1 (ja) * | 2007-02-20 | 2008-08-28 | Nec Corporation | 音声合成装置及び方法とプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015118222A (ja) * | 2013-12-18 | 2015-06-25 | 株式会社日立超エル・エス・アイ・システムズ | 音声合成システム及び音声合成方法 |
CN105654940A (zh) * | 2016-01-26 | 2016-06-08 | 百度在线网络技术(北京)有限公司 | 一种语音合成方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8219398B2 (en) | Computerized speech synthesizer for synthesizing speech from text | |
US8027837B2 (en) | Using non-speech sounds during text-to-speech synthesis | |
US20090259475A1 (en) | Voice quality change portion locating apparatus | |
CN111739556B (zh) | 一种语音分析的系统和方法 | |
JP5949607B2 (ja) | 音声合成装置 | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP2008268477A (ja) | 韻律調整可能な音声合成装置 | |
US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
Gibbon | Prosody: The rhythms and melodies of speech | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
EP3166104B1 (en) | Voice synthesizing apparatus,voice synthesizing method, and program therefor | |
Hamad et al. | Arabic text-to-speech synthesizer | |
JP2006313176A (ja) | 音声合成装置 | |
JP2010169973A (ja) | 外国語学習支援システム、及びプログラム | |
JP4744338B2 (ja) | 合成音声生成装置 | |
JP2011180368A (ja) | 合成音声修正装置および合成音声修正方法 | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
JP4841339B2 (ja) | 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム | |
JP4409279B2 (ja) | 音声合成装置及び音声合成プログラム | |
JP2006139162A (ja) | 語学学習装置 | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2001134283A (ja) | 音声合成装置および音声合成方法 | |
JP2006284645A (ja) | 音声再生装置およびその再生プログラムならびにその再生方法 | |
JPH10228471A (ja) | 音声合成システム,音声用テキスト生成システム及び記録媒体 | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130108 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130701 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140507 |