JP4575798B2 - 音声合成装置及び音声合成プログラム - Google Patents
音声合成装置及び音声合成プログラム Download PDFInfo
- Publication number
- JP4575798B2 JP4575798B2 JP2005025498A JP2005025498A JP4575798B2 JP 4575798 B2 JP4575798 B2 JP 4575798B2 JP 2005025498 A JP2005025498 A JP 2005025498A JP 2005025498 A JP2005025498 A JP 2005025498A JP 4575798 B2 JP4575798 B2 JP 4575798B2
- Authority
- JP
- Japan
- Prior art keywords
- similar
- phrase
- sentence data
- string
- attribute information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
江藤雅哉他,「生成過程モデルと統計的手法による基本周波数パターンの生成」,電子情報通信学会,SP2001−15(2001−5),pp.1−8. 籠嶋岳彦他,「代表パターンコードブックを用いた基本周波数制御法」,電子情報通信学会論文誌,D−II VOL.J85−D−II No.6 2002年6月,pp.976−986. 片江伸之他,「文型−韻律データベースを用いた定型文音声合成システム」,日本音響学会講演論文集,平成8年3月,pp.275−276.
図1は、本発明における音声合成装置の一構成例を示す図である。図1に示す音声合成装置10は、言語解析手段11と、類似文章抽出手段12と、韻律データベース13と、類似文節列抽出手段14と、韻律素片合成手段15とを有するよう構成されている。
次に、上述した韻律データベース13の例について説明する。図2は、韻律データベースの一例を示す図である。なお、図2では、「向かいの黒い家に犬がいる。」という文章データを例に説明するが、このような文章が予め韻律データベース13に多数蓄積されている。
次に、文章及び文節列の検索手法例について具体的に説明する。図3は、文章及び文節列の検索手法の一例を示す図である。なお、図3は、「向かいの黒い家に犬がいる。」という入力文章データの係り受け解析の結果を基に作成した木構造の一例を示している。
次に、上述した音声合成装置10を用いた具体的な韻律の生成及び音声合成例について図を用いて説明する。図4は、本実施形態における韻律生成及び音声合成の具体例を示す図である。
ここで、本発明における音声合成処理が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図7は、本発明における音声合成処理が実現可能なハードウェア構成の一例を示す図である。
次に、実行プログラムにおける処理手順についてフローチャートを用いて説明する。図8は、本発明における音声合成処理の一例を示すフローチャートである。
11 言語解析手段
12 類似文章抽出手段
13 韻律データベース
14 類似文節列抽出手段
15 韻律素片合成手段
71 入力装置
72 出力装置
73 ドライブ装置
74 補助記憶装置
75 メモリ装置
76 CPU
77 ネットワーク接続装置
78 記録媒体
Claims (9)
- 入力される文章データから韻律を生成して音声を合成する音声合成装置において、
前記入力される文章データに対する属性情報及び特徴量を言語解析により取得する言語解析手段と、
前記言語解析手段により得られる解析結果に含まれる前記属性情報を用いて、予め複数の文章データと、該複数の文章データに対する属性情報及び特徴量とが蓄積されている韻律データベースから、前記入力される文章データに対する属性情報に類似する類似文章データを抽出する類似文章抽出手段と、
前記類似文章抽出手段から得られる類似文章データと前記入力される文章データとを文節列に分割し、分割された各文節列に対する属性情報及び特徴量を用いて、前記韻律データベースから前記文節列に類似する文節列を抽出する類似文節列抽出手段と、
前記類似文節列抽出手段により得られる文節列の韻律素片を、前記類似文章データに対する文節列の韻律情報に基づいて調整し、前記入力される文章データに対する文節列の順序に基づいて接続して、前記入力された文章データに対する韻律パターンを出力する韻律素片合成手段とを有し、
前記類似文節列抽出手段は、
最初に、前記類似文章データから分割された各文節列に対する属性情報及び特徴量と、前記入力される文章データから分割された各文節列に対する属性情報及び特徴量とを比較し、前記類似文章データから得られる文節列中に、前記入力される文章データから得られる文節列に類似する文節列が存在しなかった場合に、存在しなかった文節列に対応する前記入力された文章データの文節列から、係り受け関係にある文節の集合を、前記文節の係り側又は受け側の文節が重複するように分割し、分割された各文節列に対する属性情報及び特徴量を用いて前記韻律データベースを検索することを特徴とする音声合成装置。 - 前記類似文章抽出手段は、
前記入力される文章データ中の係り受け関係、助詞の種類、及び重要単語の位置を含む前記属性情報のうち少なくとも1つの条件に基づいて前記類似文章データを抽出することを特徴とする請求項1に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記類似文章データを予め設定された条件に基づいて文節列に分割し、分割した文節列に対する属性情報の類似度が所定値以上の類似文節又は類似文節列を抽出することを特徴とする請求項1又は2に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記類似度が所定値より小さい場合は、前記文節列を更に分割した文節又は文節列に基づいて、前記類似文節又は類似文節列を抽出することを特徴とする請求項3に記載の音声合成装置。 - 前記類似文節列抽出手段は、
抽出された前記類似文節又は前記類似文節列から得られる韻律情報として、基本周波数の時系列パターン、パワーの時系列パターン、及び音韻継続時間長の時系列パターンのうち少なくとも1つを有することを特徴とする請求項1乃至4の何れか1項に記載の音声合成装置。 - 前記属性情報は、
音響的な属性情報として、音素の平均的な高さ、基本周波数の変動幅、強弱、及び局所的な話速のうち少なくとも1つを有することを特徴とする請求項1乃至5の何れか1項に記載の音声合成装置。 - 前記属性情報は、
文節又は文節列の属性情報として、構成する単語の音素並びの類似性、アクセント型もしくはアクセント核の位置、品詞の並び、係り受け、前記文節又は文節列に対して少なくとも1以上前もしくは後の文節又は文節列の属性情報、及び各文節位置における特徴量のうち少なくとも1つを有することを特徴とする請求項1乃至6の何れか1項に記載の音声合成装置。 - 前記類似文節列抽出手段は、
前記属性情報と、前記属性情報に含まれる付属語と、前記付属語の用法とに予め設定された重みを付加することを特徴とする請求項1乃至7の何れか1項に記載の音声合成装置。 - 入力される文章データから韻律を生成して音声を合成する音声合成プログラムにおいて、
コンピュータを、
前記入力される文章データに対する属性情報及び特徴量を言語解析により取得する言語解析手段、
前記言語解析手段により得られる解析結果に含まれる前記属性情報を用いて、予め複数の文章データと、該複数の文章データに対する属性情報及び特徴量とが蓄積されている韻律データベースから、前記入力される文章データに対する属性情報に類似する類似文章データを抽出する類似文章抽出手段、
前記類似文章抽出手段から得られる類似文章データと前記入力される文章データとを文節列に分割し、分割された各文節列に対する属性情報及び特徴量を用いて、前記韻律データベースから前記文節列に類似する文節列を抽出する類似文節列抽出手段、及び、
前記類似文節列抽出手段により得られる文節列の韻律素片を、前記類似文章データに対する文字列の韻律情報に基づいて調整し、前記入力される文章データに対する文節列の順序に基づいて接続して、前記入力された文章データに対する韻律パターンを出力する韻律素片合成手段として機能させ、
前記類似文節列抽出手段は、
最初に、前記類似文章データから分割された各文節列に対する属性情報及び特徴量と、前記入力される文章データから分割された各文節列に対する属性情報及び特徴量とを比較し、前記類似文章データから得られる文節列中に、前記入力される文章データから得られる文節列に類似する文節列が存在しなかった場合に、存在しなかった文節列に対応する前記入力された文章データの文節列から、係り受け関係にある文節の集合を、前記文節の係り側又は受け側の文節が重複するように分割し、分割された各文節列に対する属性情報及び特徴量を用いて前記韻律データベースを検索することを特徴とする音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005025498A JP4575798B2 (ja) | 2005-02-01 | 2005-02-01 | 音声合成装置及び音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005025498A JP4575798B2 (ja) | 2005-02-01 | 2005-02-01 | 音声合成装置及び音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006215109A JP2006215109A (ja) | 2006-08-17 |
JP4575798B2 true JP4575798B2 (ja) | 2010-11-04 |
Family
ID=36978419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005025498A Expired - Fee Related JP4575798B2 (ja) | 2005-02-01 | 2005-02-01 | 音声合成装置及び音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4575798B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5596649B2 (ja) * | 2011-09-26 | 2014-09-24 | 株式会社東芝 | 文書マークアップ支援装置、方法、及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056788A (ja) * | 1998-08-03 | 2000-02-25 | Hitachi Ltd | 音声合成装置の韻律制御方法 |
JP2001084250A (ja) * | 1999-08-26 | 2001-03-30 | Internatl Business Mach Corp <Ibm> | 膨大な文書データからの知識抽出方法、その装置及び媒体 |
JP2004029380A (ja) * | 2002-06-26 | 2004-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声付文章作成方法、音声再生方法、音声付文章作成装置、音声再生装置、音声付文章作成プログラム、音声再生プログラム |
JP2004151527A (ja) * | 2002-10-31 | 2004-05-27 | Mitsubishi Electric Corp | 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム |
JP2005025257A (ja) * | 2003-06-30 | 2005-01-27 | National Institute Of Information & Communication Technology | 言い換えを利用した文章作成支援処理プログラム、文章作成支援処理プログラム記録媒体、および文章作成支援処理方法 |
-
2005
- 2005-02-01 JP JP2005025498A patent/JP4575798B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056788A (ja) * | 1998-08-03 | 2000-02-25 | Hitachi Ltd | 音声合成装置の韻律制御方法 |
JP2001084250A (ja) * | 1999-08-26 | 2001-03-30 | Internatl Business Mach Corp <Ibm> | 膨大な文書データからの知識抽出方法、その装置及び媒体 |
JP2004029380A (ja) * | 2002-06-26 | 2004-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声付文章作成方法、音声再生方法、音声付文章作成装置、音声再生装置、音声付文章作成プログラム、音声再生プログラム |
JP2004151527A (ja) * | 2002-10-31 | 2004-05-27 | Mitsubishi Electric Corp | 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム |
JP2005025257A (ja) * | 2003-06-30 | 2005-01-27 | National Institute Of Information & Communication Technology | 言い換えを利用した文章作成支援処理プログラム、文章作成支援処理プログラム記録媒体、および文章作成支援処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2006215109A (ja) | 2006-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8036894B2 (en) | Multi-unit approach to text-to-speech synthesis | |
US20100268539A1 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
Watts | Unsupervised learning for text-to-speech synthesis | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
KR20040084753A (ko) | 텍스트 처리 시스템 및 방법과, 컴퓨터 판독 가능 매체 | |
KR20060050689A (ko) | 자동 음성 인식 시스템들의 음향 모델들로부터 발생된합성형 입력들을 사용하는 자동 음성 인식 시스템들의 시험및 조정 | |
JP2007206975A (ja) | 言語情報変換装置及びその方法 | |
Fackrell et al. | Multilingual prosody modelling using cascades of regression trees and neural networks | |
Bulyko et al. | Efficient integrated response generation from multiple targets using weighted finite state transducers | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
JP4829605B2 (ja) | 音声合成装置および音声合成プログラム | |
JP4575798B2 (ja) | 音声合成装置及び音声合成プログラム | |
JP4004376B2 (ja) | 音声合成装置、音声合成プログラム | |
Garner et al. | Translation and prosody in Swiss languages | |
Nandutu et al. | Luganda text-to-speech machine | |
JP4542400B2 (ja) | 韻律生成装置及び韻律生成プログラム | |
Schultz et al. | Flexible speech translation systems | |
JP2004246140A (ja) | テキスト選択方法、装置及びプログラム | |
JP3821131B2 (ja) | 音声合成装置および音声合成方法 | |
JP2000056788A (ja) | 音声合成装置の韻律制御方法 | |
JP2004271615A (ja) | 情報処理装置 | |
Yong et al. | Low footprint high intelligibility Malay speech synthesizer based on statistical data | |
JP2004138661A (ja) | 音声素片データベース作成方法、音声合成方法、音声素片データベース作成装置、音声合成装置、音声データベース作成プログラム、音声合成プログラム | |
Wisetpaitoon et al. | End-to-End Thai Text-to-Speech with Linguistic Unit | |
Allen | Speech synthesis from text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100727 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4575798 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140827 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |