JP2006215109A - 音声合成装置及び音声合成プログラム - Google Patents
音声合成装置及び音声合成プログラム Download PDFInfo
- Publication number
- JP2006215109A JP2006215109A JP2005025498A JP2005025498A JP2006215109A JP 2006215109 A JP2006215109 A JP 2006215109A JP 2005025498 A JP2005025498 A JP 2005025498A JP 2005025498 A JP2005025498 A JP 2005025498A JP 2006215109 A JP2006215109 A JP 2006215109A
- Authority
- JP
- Japan
- Prior art keywords
- similar
- phrase
- string
- sentence
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 入力される文章データから韻律を生成して音声を合成する音声合成装置において、前記文章データの言語解析を行う言語解析手段と、前記言語解析手段により得られる解析結果に基づいて、予め蓄積されている文章データと類似する類似文章データを抽出する類似文章抽出手段と、前記類似文章抽出手段から得られる類似文章データの文節列に基づいて、予め蓄積されている文節列と類似する文節列を抽出する類似文節列抽出手段と、前記類似文節列抽出手段により得られる文節列に基づいて韻律素片を合成する韻律素片合成手段とを有することにより、上記課題を解決する。
【選択図】 図1
Description
江藤雅哉他,「生成過程モデルと統計的手法による基本周波数パターンの生成」,電子情報通信学会,SP2001−15(2001−5),pp.1−8. 籠嶋岳彦他,「代表パターンコードブックを用いた基本周波数制御法」,電子情報通信学会論文誌,D−II VOL.J85−D−II No.6 2002年6月,pp.976−986. 片江伸之他,「文型−韻律データベースを用いた定型文音声合成システム」,日本音響学会講演論文集,平成8年3月,pp.275−276.
図1は、本発明における音声合成装置の一構成例を示す図である。図1に示す音声合成装置10は、言語解析手段11と、類似文章抽出手段12と、韻律データベース13と、類似文節列抽出手段14と、韻律素片合成手段15とを有するよう構成されている。
次に、上述した韻律データベース13の例について説明する。図2は、韻律データベースの一例を示す図である。なお、図2では、「向かいの黒い家に犬がいる。」という文章データを例に説明するが、このような文章が予め韻律データベース13に多数蓄積されている。
次に、文章及び文節列の検索手法例について具体的に説明する。図3は、文章及び文節列の検索手法の一例を示す図である。なお、図3は、「向かいの黒い家に犬がいる。」という入力文章データの係り受け解析の結果を基に作成した木構造の一例を示している。
次に、上述した音声合成装置10を用いた具体的な韻律の生成及び音声合成例について図を用いて説明する。図4は、本実施形態における韻律生成及び音声合成の具体例を示す図である。
ここで、本発明における音声合成処理が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図7は、本発明における音声合成処理が実現可能なハードウェア構成の一例を示す図である。
次に、実行プログラムにおける処理手順についてフローチャートを用いて説明する。図8は、本発明における音声合成処理の一例を示すフローチャートである。
11 言語解析手段
12 類似文章抽出手段
13 韻律データベース
14 類似文節列抽出手段
15 韻律素片合成手段
71 入力装置
72 出力装置
73 ドライブ装置
74 補助記憶装置
75 メモリ装置
76 CPU
77 ネットワーク接続装置
78 記録媒体
Claims (10)
- 入力される文章データから韻律を生成して音声を合成する音声合成装置において、
前記文章データの言語解析を行う言語解析手段と、
前記言語解析手段により得られる解析結果に基づいて、予め蓄積されている文章データと類似する類似文章データを抽出する類似文章抽出手段と、
前記類似文章抽出手段から得られる類似文章データの文節列に基づいて、予め蓄積されている文節列と類似する文節列を抽出する類似文節列抽出手段と、
前記類似文節列抽出手段により得られる文節列に基づいて韻律素片を合成する韻律素片合成手段とを有することを特徴とする音声合成装置。 - 前記類似文章抽出手段は、
文章中の係り受け関係、助詞の種類、及び重要単語の位置のうち少なくとも1つの条件に基づいて前記類似文章データを抽出することを特徴とする請求項1に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記類似文章データを予め設定された条件に基づいて文節列に分割し、分割した文節列に対する属性情報の類似度が所定値以上の類似文節又は類似文節列を抽出することを特徴とする請求項1又は2に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記類似度が所定値より小さい場合は、前記文節列を更に分割した文節又は文節列に基づいて、前記類似文節又は類似文節列を抽出することを特徴とする請求項3に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記類似文章データから得られる係り受け関係にある文節の組に基づいて前記文節列に分割することを特徴とする請求項1乃至4の何れか1項に記載の音声合成装置。 - 前記類似文節列抽出手段は、
抽出された前記類似文節又は前記類似文節列から得られる韻律情報として、基本周波数の時系列パターン、パワーの時系列パターン、及び音韻継続時間長の時系列パターンのうち少なくとも1つを有することを特徴とする請求項1乃至5の何れか1項に記載の音声合成装置。 - 前記属性情報は、
音響的な属性情報として、音素の平均的な高さ、基本周波数の変動幅、強弱、及び局所的な話速のうち少なくとも1つを有することを特徴とする請求項3に記載の音声合成装置。 - 前記属性情報は、
文節又は文節列の属性情報として、構成する単語の音素並びの類似性、アクセント型もしくはアクセント核の位置、品詞の並び、係り受け、前記文節又は文節列に対して少なくとも1以上前もしくは後の文節又は文節列の属性情報、及び各文節位置における特徴量のうち少なくとも1つを有することを特徴とする請求項3に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記属性情報と、前記属性情報に含まれる付属語と、前記付属語の用法とに予め設定された重みを付加することを特徴とする請求項3乃至8の何れか1項に記載の音声合成装置。 - 入力される文章データから韻律を生成して音声を合成する処理をコンピュータに実行させるための音声合成プログラムにおいて、
前記文章データの言語解析を行う言語解析処理と、
前記言語解析処理により得られる解析結果に基づいて、予め蓄積されている文章データと類似する類似文章データを抽出する類似文章抽出処理と、
前記類似文章抽出処理から得られる類似文章データの文節列に基づいて、予め蓄積されている文節列と類似する文節列を抽出する類似文節列抽出処理と、
前記類似文節列抽出処理により得られる文節列に基づいて韻律素片を合成する韻律素片合成処理とをコンピュータに実行させるための音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005025498A JP4575798B2 (ja) | 2005-02-01 | 2005-02-01 | 音声合成装置及び音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005025498A JP4575798B2 (ja) | 2005-02-01 | 2005-02-01 | 音声合成装置及び音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006215109A true JP2006215109A (ja) | 2006-08-17 |
JP4575798B2 JP4575798B2 (ja) | 2010-11-04 |
Family
ID=36978419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005025498A Expired - Fee Related JP4575798B2 (ja) | 2005-02-01 | 2005-02-01 | 音声合成装置及び音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4575798B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013073275A (ja) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | 文書マークアップ支援装置、方法、及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056788A (ja) * | 1998-08-03 | 2000-02-25 | Hitachi Ltd | 音声合成装置の韻律制御方法 |
JP2001084250A (ja) * | 1999-08-26 | 2001-03-30 | Internatl Business Mach Corp <Ibm> | 膨大な文書データからの知識抽出方法、その装置及び媒体 |
JP2004029380A (ja) * | 2002-06-26 | 2004-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声付文章作成方法、音声再生方法、音声付文章作成装置、音声再生装置、音声付文章作成プログラム、音声再生プログラム |
JP2004151527A (ja) * | 2002-10-31 | 2004-05-27 | Mitsubishi Electric Corp | 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム |
JP2005025257A (ja) * | 2003-06-30 | 2005-01-27 | National Institute Of Information & Communication Technology | 言い換えを利用した文章作成支援処理プログラム、文章作成支援処理プログラム記録媒体、および文章作成支援処理方法 |
-
2005
- 2005-02-01 JP JP2005025498A patent/JP4575798B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056788A (ja) * | 1998-08-03 | 2000-02-25 | Hitachi Ltd | 音声合成装置の韻律制御方法 |
JP2001084250A (ja) * | 1999-08-26 | 2001-03-30 | Internatl Business Mach Corp <Ibm> | 膨大な文書データからの知識抽出方法、その装置及び媒体 |
JP2004029380A (ja) * | 2002-06-26 | 2004-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声付文章作成方法、音声再生方法、音声付文章作成装置、音声再生装置、音声付文章作成プログラム、音声再生プログラム |
JP2004151527A (ja) * | 2002-10-31 | 2004-05-27 | Mitsubishi Electric Corp | 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム |
JP2005025257A (ja) * | 2003-06-30 | 2005-01-27 | National Institute Of Information & Communication Technology | 言い換えを利用した文章作成支援処理プログラム、文章作成支援処理プログラム記録媒体、および文章作成支援処理方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013073275A (ja) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | 文書マークアップ支援装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4575798B2 (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8036894B2 (en) | Multi-unit approach to text-to-speech synthesis | |
US8219398B2 (en) | Computerized speech synthesizer for synthesizing speech from text | |
US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
Watts | Unsupervised learning for text-to-speech synthesis | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
Ogawa et al. | Tohoku kiritan singing database: A singing database for statistical parametric singing synthesis using japanese pop songs | |
Fackrell et al. | Multilingual prosody modelling using cascades of regression trees and neural networks | |
Bulyko et al. | Efficient integrated response generation from multiple targets using weighted finite state transducers | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
JP4829605B2 (ja) | 音声合成装置および音声合成プログラム | |
JP4004376B2 (ja) | 音声合成装置、音声合成プログラム | |
JP4575798B2 (ja) | 音声合成装置及び音声合成プログラム | |
Garner et al. | Translation and prosody in Swiss languages | |
Nandutu et al. | Luganda text-to-speech machine | |
JP4542400B2 (ja) | 韻律生成装置及び韻律生成プログラム | |
Schultz et al. | Flexible speech translation systems | |
JP2004246140A (ja) | テキスト選択方法、装置及びプログラム | |
JP2000056788A (ja) | 音声合成装置の韻律制御方法 | |
JP2004271615A (ja) | 情報処理装置 | |
JP3821131B2 (ja) | 音声合成装置および音声合成方法 | |
Cabral et al. | The ADAPT entry to the Blizzard Challenge 2016 | |
Mihkla et al. | Development of a unit selection TTS system for Estonian | |
Allen | Speech synthesis from text | |
Gardini | Data preparation and improvement of NLP software modules for parametric speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100727 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4575798 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140827 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |