JP4564416B2 - 音声合成装置および音声合成プログラム - Google Patents
音声合成装置および音声合成プログラム Download PDFInfo
- Publication number
- JP4564416B2 JP4564416B2 JP2005204289A JP2005204289A JP4564416B2 JP 4564416 B2 JP4564416 B2 JP 4564416B2 JP 2005204289 A JP2005204289 A JP 2005204289A JP 2005204289 A JP2005204289 A JP 2005204289A JP 4564416 B2 JP4564416 B2 JP 4564416B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- speech
- unit
- speaker
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
〈音声合成装置の構成〉
図1は音声合成装置のブロック図である。この図1に示すように、音声合成装置1は、入力されたテキストデータである合成テキストを、音声合成するもので、音声データベース3と、合成テキスト解析処理手段5と、特定話者素片選択処理手段7と、特定話者素片確認手段9と、複数話者素片選択処理手段11と、複数話者素片確認手段13と、合成音声選択手段15とを備えている。
なお、この図1の音声合成装置1の構成の説明において、図2または図3を適宜参照して、生成される情報(素片情報、選択素片情報、類似声質選択素片情報等)を説明する。
素片情報は、合成テキストと、合成テキストの素片と、指定されている特定話者の名前とが対応付けられているものである。合成テキストの素片とは、当該合成テキストを音声合成する最小単位(ここでは、音素)に分割されたものである。
次に、図4に示すフローチャートを参照して、音声合成装置1の動作について説明する(適宜図1参照)。なお、ここでは、音声合成装置1における動作の概略を説明することにする。
まず、音声合成装置1は、合成テキスト解析処理手段5によって、入力された合成テキストを解析し、素片情報を特定話者素片選択処理手段7に出力する(ステップS1)。続いて、音声合成装置1は、特定話者素片選択処理手段7によって、選択素片情報を生成する(ステップS2)。
3 音声データベース
3a 特定話者音声データベース
3b 類似声質音声データベース
5 合成テキスト解析処理手段
7 特定話者素片選択処理手段
9 特定話者素片確認手段
11 複数話者素片選択処理手段
13 複数話者素片確認手段
15 合成音声選択手段
15a 素片接続処理手段
15b 出力手段
Claims (4)
- 特定話者が発声した音声から抽出した素片データからなる特定話者音声データベースと、前記音声に予め設定した基準により声質が類似するとした類似音声から抽出した素片データからなる類似声質音声データベースとを切り替えて用いて、音声合成を行う音声合成装置であって、
入力された、音声合成するテキストデータである合成テキストを解析して、当該合成テキストに含まれる素片に関する情報である素片情報を生成する合成テキスト解析処理手段と、
この合成テキスト解析処理手段で生成された素片情報と、前記素片データを接続した際の連続性をコストとして評価するためのコスト関数とを使用して、前記特定話者音声データベースに収められている素片データの選択を行い、選択した素片データに付されている素片番号と、選択した素片データを接続した場合の接続コストと、予め設定したコスト閾値情報とを含む選択素片情報を生成する特定話者素片選択処理手段と、
この特定話者素片選択処理手段で生成された選択素片情報と、予め設定した前記特定話者の素片データと声質が類似する素片データを示す声質類似リストとに基づいて、前記類似声質音声データベースに収められている素片データの選択を行い、選択した素片データに付されている素片番号と、選択した素片データを接続した場合の接続コストとを含む類似声質選択素片情報を生成する複数話者素片選択処理手段と、
前記特定話者素片選択処理手段で生成された選択素片情報に含まれる素片番号と、前記複数話者素片選択処理手段で生成された類似声質選択素片情報に含まれる素片番号との少なくとも一方の素片番号に基づいて、前記特定話者音声データベースと前記類似声質音声データベースとの少なくとも一方から素片データを読み出して接続し、接続した素片データを、音声合成された合成音声として出力する合成音声選択手段と、
を備えることを特徴とする音声合成装置。 - 前記特定話者素片選択処理手段で生成された選択素片情報に含まれる素片番号に基づいて、前記特定話者音声データベースに収められている素片データを読み出して当該素片データ同士を接続し、出力すると共に、出力された出力音声を聴取した聴取者により指定された素片にかかる指定素片情報を入力する特定話者素片確認手段と、
前記複数話者素片選択処理手段で生成された類似声質選択素片情報に含まれる素片番号に基づいて、前記類似声質音声データベースに収められている素片データを読み出して当該素片データ同士を接続して出力し、出力された出力音声を聴取した聴取者により指定された素片があった場合には、前記複数話者素片選択処理手段に再び素片データの選択を指示すると共に、出力された出力音声を聴取した聴取者により指定された素片がなかった場合には、入力された類似声質選択素片情報を出力する複数話者素片確認手段と、
を備えることを特徴とする請求項1に記載の音声合成装置。 - 前記特定話者素片選択処理手段で生成された選択素片情報に含まれる素片番号を前記合成音声選択手段に送出すると共に、出力された出力音声を聴取した聴取者により指定された素片にかかる指定素片情報を入力する特定話者素片確認手段と、
前記複数話者素片選択処理手段で生成された類似声質選択素片情報に含まれる素片番号を前記合成音声選択手段に送出すると共に、出力された出力音声を聴取した聴取者により指定された素片があった場合には、前記複数話者素片選択処理手段に再び素片データの選択を指示すると共に、出力された出力音声を聴取した聴取者により指定された素片がなかった場合には、入力された類似声質選択素片情報を出力する複数話者素片確認手段と、
を備えることを特徴とする請求項1に記載の音声合成装置。 - 特定話者が発声した音声から抽出した素片データからなる特定話者音声データベースと、前記音声に予め設定した基準により声質が類似するとした類似音声から抽出した素片データからなる類似声質音声データベースとを切り替えて用いて、音声合成を行うために、コンピュータを、
入力された、音声合成するテキストデータである合成テキストを解析して、当該合成テキストに含まれる素片に関する情報である素片情報を生成する合成テキスト解析処理手段、
この合成テキスト解析処理手段で生成された素片情報と、前記素片データを接続した際の連続性をコストとして評価するためのコスト関数とを使用して、前記特定話者音声データベースに収められている素片データの選択を行い、選択した素片データに付されている素片番号と、選択した素片データを接続した場合の接続コストと、予め設定したコスト閾値情報とを含む選択素片情報を生成する特定話者素片選択処理手段、
この特定話者素片選択処理手段で生成された選択素片情報と、予め設定した前記特定話者の素片データと声質が類似する素片データを示す声質類似リストとに基づいて、前記類似声質音声データベースに収められている素片データの選択を行い、選択した素片データに付されている素片番号と、選択した素片データを接続した場合の接続コストとを含む類似声質選択素片情報を生成する複数話者素片選択処理手段、
前記特定話者素片選択処理手段で生成された選択素片情報に含まれる素片番号と、前記複数話者素片選択処理手段で生成された類似声質選択素片情報に含まれる素片番号との少なくとも一方の素片番号に基づいて、前記特定話者音声データベースと前記類似声質音声データベースとの少なくとも一方から素片データを読み出して接続し、接続した素片データを、音声合成された合成音声として出力する合成音声選択手段、
として機能させることを特徴とする音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005204289A JP4564416B2 (ja) | 2005-07-13 | 2005-07-13 | 音声合成装置および音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005204289A JP4564416B2 (ja) | 2005-07-13 | 2005-07-13 | 音声合成装置および音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007025042A JP2007025042A (ja) | 2007-02-01 |
JP4564416B2 true JP4564416B2 (ja) | 2010-10-20 |
Family
ID=37785927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005204289A Expired - Fee Related JP4564416B2 (ja) | 2005-07-13 | 2005-07-13 | 音声合成装置および音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4564416B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5301376B2 (ja) * | 2009-07-03 | 2013-09-25 | 日本放送協会 | 音声合成装置およびプログラム |
JP5411845B2 (ja) * | 2010-12-28 | 2014-02-12 | 日本電信電話株式会社 | 音声合成方法、音声合成装置及び音声合成プログラム |
JP5665780B2 (ja) * | 2012-02-21 | 2015-02-04 | 株式会社東芝 | 音声合成装置、方法およびプログラム |
JP2014066916A (ja) * | 2012-09-26 | 2014-04-17 | Brother Ind Ltd | 音声合成装置 |
JP6170384B2 (ja) * | 2013-09-09 | 2017-07-26 | 株式会社日立超エル・エス・アイ・システムズ | 音声データベース生成システム、音声データベース生成方法、及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005070214A (ja) * | 2003-08-21 | 2005-03-17 | Advanced Telecommunication Research Institute International | 声質差評価テーブル作成装置、音声コーパスの声質差評価テーブル作成システム、及び音声合成システム |
-
2005
- 2005-07-13 JP JP2005204289A patent/JP4564416B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005070214A (ja) * | 2003-08-21 | 2005-03-17 | Advanced Telecommunication Research Institute International | 声質差評価テーブル作成装置、音声コーパスの声質差評価テーブル作成システム、及び音声合成システム |
Also Published As
Publication number | Publication date |
---|---|
JP2007025042A (ja) | 2007-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3984207B2 (ja) | 音声認識評価装置、音声認識評価方法、及び音声認識評価プログラム | |
CN105788589B (zh) | 一种音频数据的处理方法及装置 | |
US7739113B2 (en) | Voice synthesizer, voice synthesizing method, and computer program | |
JP3078205B2 (ja) | 波形の連結及び部分的重複化による音声合成方法 | |
US8898055B2 (en) | Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech | |
JP4946293B2 (ja) | 音声強調装置、音声強調プログラムおよび音声強調方法 | |
JP4878538B2 (ja) | 音声合成装置 | |
EP1213704A2 (en) | Speech synthesis apparatus and method | |
JP5103974B2 (ja) | マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム | |
JP2003150187A (ja) | スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法 | |
JP2007140200A (ja) | 語学学習装置およびプログラム | |
JP4564416B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP2011186143A (ja) | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
JP2012042974A (ja) | 音声合成装置 | |
JP2931059B2 (ja) | 音声合成方式およびこれに用いる装置 | |
JP5275470B2 (ja) | 音声合成装置およびプログラム | |
JP2008058379A (ja) | 音声合成システム及びフィルタ装置 | |
JP4414864B2 (ja) | 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体 | |
JP2005524118A (ja) | 合成音声 | |
JP4758931B2 (ja) | 音声合成装置、方法、プログラム及びその記録媒体 | |
JP2009025328A (ja) | 音声合成装置 | |
EP1589524A1 (en) | Method and device for speech synthesis | |
JP3426957B2 (ja) | 映像中への音声録音支援表示方法及び装置及びこの方法を記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100706 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100730 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130806 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140806 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |