JP2019101094A5

JP2019101094A5 - 音声合成方法、音声合成システムおよびプログラム

Info

Publication number: JP2019101094A5
Application number: JP2017229042A
Authority: JP
Filing date: 2017-11-29
Publication date: 2020-05-07
Anticipated expiration: 2037-11-29

Claims

音韻を指定する第１制御データを含む入力に応じた第２制御データを中間学習済モデルにより生成し、
利用者からの第１指示に応じて前記第２制御データを変更し、
前記第１制御データと前記変更後の前記第２制御データとを含む入力に応じて、合成音声の周波数特性に関する合成データを出力学習済モデルにより生成し、
前記合成データに応じた音声信号を生成する、
コンピュータにより実現される音声合成方法。
前記中間学習済モデルは、前記第１制御データを含む入力に応じて前記第２制御データを生成する第１学習済モデルであり、
前記第２制御データは、前記合成音声の音素に関するデータである
請求項１の音声合成方法。
前記第１制御データと前記変更後の前記第２制御データとを含む入力に応じて、前記合成音声の表情に関する第３制御データを第２学習済モデルにより生成し、
利用者からの第２指示に応じて前記第３制御データを変更し、
前記合成データの生成においては、前記第１制御データと前記変更後の前記第２制御データと前記変更後の前記第３制御データとを含む入力に応じて前記合成データを生成する
請求項２の音声合成方法。
前記第２制御データは、前記合成音声の音素および表情に関するデータである
請求項１の音声合成方法。
利用者からの第３指示に応じて前記合成データを変更し、
前記音声信号の生成においては、前記変更後の前記合成データに応じて前記音声信号を生成する
請求項１から請求項４の何れかの音声合成方法。
音韻を指定する第１制御データを含む入力に応じた第２制御データを生成する中間学習済モデルと、
利用者からの第１指示に応じて前記第２制御データを変更する第１編集処理部と、
前記第１制御データと前記変更後の前記第２制御データとを含む入力に応じて、合成音声の周波数特性に関する合成データを生成する出力学習済モデルと、
前記合成データに応じた音声信号を生成する合成処理部と
を具備する音声合成システム。
前記中間学習済モデルは、前記第１制御データを含む入力に応じて前記第２制御データを生成する第１学習済モデルであり、
前記第２制御データは、前記合成音声の音素に関するデータである
請求項６の音声合成システム。
前記第１制御データと前記変更後の前記第２制御データとを含む入力に応じて、前記合成音声の表情に関する第３制御データを生成する第２学習済モデルと、
利用者からの第２指示に応じて前記第３制御データを変更する第２編集処理部とを具備し、
前記出力学習済モデルは、前記第１制御データと第１編集処理部による前記変更後の前記第２制御データと前記第２編集処理部による変更後の前記第３制御データとを含む入力に応じて前記合成データを生成する
請求項７の音声合成システム。
前記第２制御データは、前記合成音声の音素および表情に関するデータである
請求項６の音声合成システム。
利用者からの第３指示に応じて前記合成データを変更する第３編集処理部を具備し、
前記合成処理部は、前記変更後の前記合成データに応じて前記音声信号を生成する
請求項６から請求項９の何れかの音声合成システム。
音韻を指定する第１制御データを含む入力に応じた第２制御データを生成する中間学習済モデル、
利用者からの第１指示に応じて前記第２制御データを変更する第１編集処理部、
前記第１制御データと前記変更後の前記第２制御データとを含む入力に応じて、合成音声の周波数特性に関する合成データを生成する出力学習済モデル、および、
前記合成データに応じた音声信号を生成する合成処理部
としてコンピュータを機能させるプログラム。