JP4640063B2 - 音声合成方法,音声合成装置,およびコンピュータプログラム - Google Patents
音声合成方法,音声合成装置,およびコンピュータプログラム Download PDFInfo
- Publication number
- JP4640063B2 JP4640063B2 JP2005265778A JP2005265778A JP4640063B2 JP 4640063 B2 JP4640063 B2 JP 4640063B2 JP 2005265778 A JP2005265778 A JP 2005265778A JP 2005265778 A JP2005265778 A JP 2005265778A JP 4640063 B2 JP4640063 B2 JP 4640063B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- keyword
- scale
- text
- text body
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
まず,図1を参照しながら,第1の実施の形態にかかる音声合成装置100について説明する。なお,図1は,第1の実施の形態にかかる音声合成装置の概略的な構成を示すブロック図である。
図2に示すように,まず,利用者によって入力部が操作されると,例えば,強調させたい1又は2以上のキーワードを含んだテキスト本文と,その強調させたいキーワードの開始位置及びキーワードの終了位置とが入力される(S201)。なお,かかる例に限定されず,例えば,利用者は,キーワードの開始位置からキーワードの終了位置の範囲全てを指定しても良い。
(1)テキスト本文中の強調させたいキーワード位置を予め利用者(ユーザ)が音声合成装置100に対して指定することで,音声合成装置100はキーワード部分に対する読上げに関して自然性が高い読上げ(自然な読上げ)をすることができ,出力される合成音の音質が良い上,キーワードの読上げが強調される。
次に,図7を参照しながら,第2の実施の形態にかかる音声合成方法について説明する。なお,以下説明する第2の実施の形態にかかる音声合成方法では,上記説明した第1の実施の形態にかかる音声合成方法と相違する点について詳細に説明し,その他の点については略同一であるとして説明は省略する。
図2に示すように,第2の実施の形態にかかる音声合成方法では,まず,第1の実施の形態にかかる音声合成方法と同様に,例えば,強調させたい1又は2以上のキーワードを含んだテキスト本文と,その強調させたいキーワードの開始位置と,キーワードの終了位置とを,利用者が入力する(S201)。なお,かかる例に限定されず,例えば,利用者は,キーワードの開始位置からキーワードの終了位置の範囲全てを指定しても良い。
(1)テキスト本文中の強調させたいキーワードの部分を,何の評価もせずに,キーワード優先音韻選択部107で選択した音韻の候補に置き換えるのではなく,キーワード部分に対して,音韻選択部104で求めたコスト値Ckeyとキーワード優先音韻選択部107で求めたコスト値Corigとを比較し,置き換えの必要の際は,キーワード優先音韻部107が選択した音韻候補の組合せに置き換えることで,キーワード部分のより自然性が高い読上げを可能とし,音質がよく,キーワードの読上げを強調させることができる。
101 テキスト解析部
103 韻律予測部
104 音韻選択部
107 キーワード優先音韻選択部
109 コーパス
111 音韻接続部
Claims (8)
- テキスト本文を解析し,該テキスト本文を構成する各記号の特徴量を予測した韻律予測情報を生成する韻律予測情報生成部と;
前記韻律予測情報と前記テキスト本文を構成する各記号とを基にして観測可能な特徴量から知覚実験に基づいて定められる尺度にマッピングすることで,該テキスト本文を構成する各記号の尺度を求める尺度算出部と;
収録された音声を構成する1又は2以上の音韻が格納された音韻データベースと;
前記テキスト本文を構成する各記号ごとに,前記尺度算出部により求められた尺度に基づいて前記音韻データベースからテキスト音韻を選択する音韻選択部と;
前記韻律予測情報と前記テキスト本文のうちキーワードを構成する各記号とを基にして前記観測可能な特徴量から前記知覚実験に基づいて定められる尺度にマッピングすることで,該キーワードを構成する各記号の尺度を求めるキーワード尺度算出部と;
前記キーワードを構成する各記号ごとに,前記キーワード尺度算出部により求められた前記キーワードを構成する各記号の尺度に基づいて前記音韻データベースからキーワード音韻を選択するキーワード優先音韻選択部と;
前記音韻選択部が選択した前記テキスト音韻のうち前記キーワード部分に該当する音韻を前記キーワード優先音韻選択部が選択した前記キーワード音韻に置き換える音韻置換部と;
前記音韻を接続し,合成音声を生成する合成部と;
を備えることを特徴とする,音声合成装置。 - 前記キーワードが前記テキスト本文中に2つ以上存在する場合,前記キーワード優先音韻選択部は,該テキスト本文の先頭からキーワードが出現する順に,該キーワード各々に優先順位を付与しその優先順に,または該キーワードに付与した重みを優先順位に変換しその優先順に,前記キーワード音韻を選択することを特徴とする,請求項1に記載の音声合成装置。
- 前記キーワードが前記テキスト本文中に2つ以上存在する場合,前記キーワード優先音韻選択部は,前記キーワードを構成する各記号ごとに,前記キーワード尺度算出部により求められた前記キーワードを構成する各記号の尺度と,前記キーワード単位に各々重み付けし該キーワードが出現する順に,該キーワードに重み付けされた値とを基にして前記キーワードを構成する各記号の尺度を求めることを特徴とする,請求項1に記載の音声合成装置。
- 前記音韻置換部は,前記キーワード優先音韻選択部により前記キーワード音韻が選択されると逐次,前記音韻選択部が選択した前記テキスト音韻のうち該キーワード部分に該当する音韻を該キーワード音韻に,置き換えることを特徴とする,請求項1,2,または3項のいずれかに記載の音声合成装置。
- 前記音韻置換部は,前記キーワード優先音韻選択部により求められた尺度と前記音韻選択部により求められた尺度とを比較することにより,前記キーワード音韻に置き換えるか否かを判断することを特徴とする,請求項1又は4に記載の音声合成装置。
- 前記音韻置換部は,前記キーワード優先音韻選択部により求められた尺度及び前記音韻選択部により求められた尺度の差分値と,所定の閾値とを比較することにより,前記キーワード音韻に置き換えるか否かを判断することを特徴とする,請求項1,4,または5項のいずれかに記載の音声合成装置。
- テキスト本文を解析し,該テキスト本文を構成する各記号の特徴量を予測した韻律予測情報を生成する韻律予測情報生成ステップと;
前記韻律予測情報と前記テキスト本文を構成する各記号とを基にして観測可能な特徴量から知覚実験に基づいて定められる尺度にマッピングすることで,該テキスト本文を構成する各記号の尺度を求める尺度算出ステップと;
前記テキスト本文を構成する各記号ごとに,前記尺度算出ステップで求めた尺度に基づいて,収録された音声を構成する1又は2以上の音韻が格納された音韻データベースからテキスト音韻を選択する音韻選択ステップと;
前記韻律予測情報と前記テキスト本文のうちキーワードを構成する各記号とを基にして前記観測可能な特徴量から前記知覚実験に基づいて定められる尺度にマッピングすることで,該キーワードを構成する各記号の尺度を求めるキーワード尺度算出ステップと;
前記キーワードを構成する各記号ごとに,前記キーワード尺度算出ステップで求めた前記キーワードを構成する各記号の尺度に基づいて前記音韻データベースからキーワード音韻を選択するキーワード優先音韻選択ステップと;
前記音韻選択ステップで選択した前記テキスト音韻のうち前記キーワード部分に該当する音韻を前記キーワード優先音韻選択ステップで選択した前記キーワード音韻に置き換える音韻置換ステップと;
前記音韻を接続し,合成音声を生成する合成音声生成ステップと;
を含むことを特徴とする,音声合成方法。 - テキスト本文を解析し,該テキスト本文を構成する各記号の特徴量を予測した韻律予測情報を生成する韻律予測情報生成ステップと;
前記韻律予測情報と前記テキスト本文を構成する各記号とを基にして観測可能な特徴量から知覚実験に基づいて定められる尺度にマッピングすることで,該テキスト本文を構成する各記号の尺度を求める尺度算出ステップと;
前記テキスト本文を構成する各記号ごとに,前記尺度算出ステップで求めた尺度に基づいて,収録された音声を構成する1又は2以上の音韻が格納された音韻データベースからテキスト音韻を選択する音韻選択ステップと;
前記韻律予測情報と前記テキスト本文のうちキーワードを構成する各記号とを基にして前記観測可能な特徴量から前記知覚実験に基づいて定められる尺度にマッピングすることで,該キーワードを構成する各記号の尺度を求めるキーワード尺度算出ステップと;
前記キーワードを構成する各記号ごとに,前記キーワード尺度算出ステップで求めた前記キーワードを構成する各記号の尺度に基づいて前記音韻データベースからキーワード音韻を選択するキーワード優先音韻選択ステップと;
前記音韻選択ステップで選択した前記テキスト音韻のうち前記キーワード部分に該当する音韻を前記キーワード優先音韻選択ステップで選択した前記キーワード音韻に置き換える音韻置換ステップと;
前記音韻を接続し,合成音声を生成する合成音声生成ステップと;
を含んだ音声合成方法をコンピュータに実行させることを特徴とする,コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005265778A JP4640063B2 (ja) | 2005-09-13 | 2005-09-13 | 音声合成方法,音声合成装置,およびコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005265778A JP4640063B2 (ja) | 2005-09-13 | 2005-09-13 | 音声合成方法,音声合成装置,およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007079019A JP2007079019A (ja) | 2007-03-29 |
JP4640063B2 true JP4640063B2 (ja) | 2011-03-02 |
Family
ID=37939427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005265778A Expired - Fee Related JP4640063B2 (ja) | 2005-09-13 | 2005-09-13 | 音声合成方法,音声合成装置,およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4640063B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6369311B2 (ja) * | 2014-12-05 | 2018-08-08 | 三菱電機株式会社 | 音声合成装置および音声合成方法 |
JP6620437B2 (ja) * | 2015-06-24 | 2019-12-18 | カシオ計算機株式会社 | 学習支援装置およびプログラム |
CN112086086B (zh) * | 2020-10-22 | 2024-06-25 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04162098A (ja) * | 1990-10-25 | 1992-06-05 | Ricoh Co Ltd | 規則音声合成装置 |
JPH05224689A (ja) * | 1992-02-13 | 1993-09-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置 |
JPH0792997A (ja) * | 1993-09-22 | 1995-04-07 | N T T Data Tsushin Kk | 音声合成装置 |
JP2002049386A (ja) * | 2000-08-01 | 2002-02-15 | Sharp Corp | テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体 |
JP2002123281A (ja) * | 2000-10-12 | 2002-04-26 | Oki Electric Ind Co Ltd | 音声合成装置 |
JP2003208188A (ja) * | 2002-01-15 | 2003-07-25 | Advanced Telecommunication Research Institute International | 日本語テキスト音声合成方法 |
JP2004126205A (ja) * | 2002-10-02 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び音声合成装置、音声合成プログラム |
JP2007025338A (ja) * | 2005-07-19 | 2007-02-01 | Oki Electric Ind Co Ltd | 音声合成方法,音声合成装置,およびコンピュータプログラム |
-
2005
- 2005-09-13 JP JP2005265778A patent/JP4640063B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04162098A (ja) * | 1990-10-25 | 1992-06-05 | Ricoh Co Ltd | 規則音声合成装置 |
JPH05224689A (ja) * | 1992-02-13 | 1993-09-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置 |
JPH0792997A (ja) * | 1993-09-22 | 1995-04-07 | N T T Data Tsushin Kk | 音声合成装置 |
JP2002049386A (ja) * | 2000-08-01 | 2002-02-15 | Sharp Corp | テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体 |
JP2002123281A (ja) * | 2000-10-12 | 2002-04-26 | Oki Electric Ind Co Ltd | 音声合成装置 |
JP2003208188A (ja) * | 2002-01-15 | 2003-07-25 | Advanced Telecommunication Research Institute International | 日本語テキスト音声合成方法 |
JP2004126205A (ja) * | 2002-10-02 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び音声合成装置、音声合成プログラム |
JP2007025338A (ja) * | 2005-07-19 | 2007-02-01 | Oki Electric Ind Co Ltd | 音声合成方法,音声合成装置,およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2007079019A (ja) | 2007-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
US8015011B2 (en) | Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases | |
JP4130190B2 (ja) | 音声合成システム | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
JP5148026B1 (ja) | 音声合成装置および音声合成方法 | |
JP2006293026A (ja) | 音声合成装置,音声合成方法およびコンピュータプログラム | |
JP4639932B2 (ja) | 音声合成装置 | |
JP4640063B2 (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
JP5152588B2 (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
JP3050832B2 (ja) | 自然発話音声波形信号接続型音声合成装置 | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4648878B2 (ja) | 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP3091426B2 (ja) | 自然発話音声波形信号接続型音声合成装置 | |
JP2012103668A (ja) | 使用者の候補合成単位選択による音声合成方法およびシステム(VoiceSynthesizingMethodandSystemBasedonUserDirectedCandidate−UnitSelection) | |
JP5098932B2 (ja) | 歌詞データ表示装置、歌詞データ表示方法、歌詞データ表示プログラム | |
JP2007025338A (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
JP7183556B2 (ja) | 合成音生成装置、方法、及びプログラム | |
JP3892691B2 (ja) | 音声合成方法及びその装置並びに音声合成プログラム | |
JPH11259094A (ja) | 規則音声合成装置 | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2006243104A (ja) | 音声合成方法 | |
JP4297496B2 (ja) | 音声合成方法及びその装置 | |
JP6479637B2 (ja) | 文章セット生成装置、文章セット生成方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4640063 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |