JP2015041081A5

JP2015041081A5 -

Info

Publication number: JP2015041081A5
Application number: JP2013173634A
Authority: JP
Filing date: 2013-08-23
Publication date: 2015-06-18
Anticipated expiration: 2033-08-23

Claims

音声データ信号からＦ０パターンを抽出するＦ０パターン抽出手段と、
抽出されたＦ０パターンにフィットするＦ０パターンをフレーズ成分とアクセント成分との重畳により表すために、フレーズ成分を表すターゲットパラメータと、アクセント成分を表すターゲットパラメータとを推定するパラメータ推定手段と、
前記パラメータ推定手段により推定されたターゲットパラメータにしたがって、前記抽出されたＦ０パターンにフィットするＦ０パターンを生成するＦ０パターン生成手段と、
複数の音声データから、前記Ｆ０パターン抽出手段、前記パラメータ推定手段、及び前記Ｆ０パターン生成手段により生成された連続的なＦ０パターンを学習データとして、Ｆ０生成モデルの学習を行なうモデル学習手段とを含む、Ｆ０パターン生成のためのモデル学習装置。
音声データ信号からＦ０パターンを抽出するＦ０パターン抽出手段と、
抽出されたＦ０パターンにフィットするＦ０パターンからフレーズ成分の時間変化パターンと、アクセント成分の時間変化パターンとを分離するための分離手段と、
複数の音声データから前記Ｆ０パターン抽出手段及び前記分離手段によって得られた前記フレーズ成分の時間変化パターンと、前記アクセント成分の時間変化パターンとをそれぞれ学習データとして、フレーズ成分生成用の第１の生成モデルと、アクセント成分生成用の第２の生成モデルとの学習を行なうモデル学習手段とを含む、Ｆ０パターン生成のためのモデル学習装置。
前記モデル学習手段は、前記フレーズ成分の時間変化パターン及び前記アクセント成分の時間変化パターンから得られる、時間情報を共有したマルチストリーム形式の学習データにより、前記第１及び第２の生成モデルの学習を行う手段を含む、請求項２に記載のモデル学習装置。
前記分離手段は、前記Ｆ０パターン抽出手段により抽出されたＦ０パターンにフィットするＦ０パターンからフレーズ成分の時間変化パターンと、アクセント成分の時間変化パターンと、マイクロ・プロソディ成分の時間変化パターンとに分離するための手段を含み、
前記モデル学習装置は、複数の音声データから前記Ｆ０パターン抽出手段及び前記分離手段によって得られた前記フレーズ成分の時間変化パターンと、前記アクセント成分の時間変化パターンと、前記マイクロ・プロディ成分の時間変化パターンとをそれぞれ用いて、前記第１の生成モデル、前記第２の生成モデル、及びマイクロ・プロソディ成分のための第３の生成モデルの学習を行なうためのモデル学習手段とを含む、請求項２に記載のＦ０パターン生成のためのモデル学習装置。
Ｆ０パターンのフレーズ成分の生成用の第１の生成モデルと、Ｆ０パターンのアクセント成分の生成用の第２の生成モデルと、Ｆ０パターンのマイクロ・プロソディ成分の生成用の第３の生成モデルとのパラメータを記憶するモデル記憶手段と、
音声合成の対象となるテキストの入力を受けてテキスト解析し、音声合成用の制御記号列を出力するテキスト解析手段と、
前記テキスト解析手段の出力する制御記号列を前記第１の生成モデルと照合することにより、Ｆ０パターンのフレーズ成分を生成するフレーズ成分生成手段と、
前記テキスト解析手段の出力する制御記号列を前記第２の生成モデルと照合することにより、Ｆ０パターンのアクセント成分を生成するアクセント成分生成手段と、
前記テキスト解析手段の出力する制御記号列を前記第３の生成モデルと照合することにより、Ｆ０パターンのマイクロ・プロソディ成分を生成するマイクロ・プロソディ成分生成手段と、
前記フレーズ成分生成手段により生成されたフレーズ成分、前記アクセント成分生成手段により生成されたアクセント成分、及び前記マイクロ・プロソディ成分生成手段により生成されたマイクロ・プロソディ成分を合成することにより、Ｆ０パターンを生成するＦ０パターン生成手段とを含む、定量的Ｆ０パターン生成装置。
コンピュータにより実行されると、当該コンピュータを、請求項１〜請求項５のいずれかに記載の全ての手段として機能させる、コンピュータプログラム。