JP2019101094A5 - 音声合成方法、音声合成システムおよびプログラム - Google Patents

音声合成方法、音声合成システムおよびプログラム Download PDF

Info

Publication number
JP2019101094A5
JP2019101094A5 JP2017229042A JP2017229042A JP2019101094A5 JP 2019101094 A5 JP2019101094 A5 JP 2019101094A5 JP 2017229042 A JP2017229042 A JP 2017229042A JP 2017229042 A JP2017229042 A JP 2017229042A JP 2019101094 A5 JP2019101094 A5 JP 2019101094A5
Authority
JP
Japan
Prior art keywords
control data
data
learned model
speech
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017229042A
Other languages
English (en)
Other versions
JP2019101094A (ja
JP6729539B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from JP2017229042A external-priority patent/JP6729539B2/ja
Priority to JP2017229042A priority Critical patent/JP6729539B2/ja
Priority to PCT/JP2018/043655 priority patent/WO2019107378A1/ja
Priority to CN202310641326.1A priority patent/CN116504218A/zh
Priority to EP18882396.7A priority patent/EP3719796A4/en
Priority to CN201880077081.1A priority patent/CN111418006B/zh
Publication of JP2019101094A publication Critical patent/JP2019101094A/ja
Publication of JP2019101094A5 publication Critical patent/JP2019101094A5/ja
Priority to US16/886,063 priority patent/US11495206B2/en
Publication of JP6729539B2 publication Critical patent/JP6729539B2/ja
Application granted granted Critical
Priority to US17/965,185 priority patent/US20230034572A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (11)

  1. 音韻を指定する第1制御データを含む入力に応じた第2制御データを中間学習済モデルにより生成し、
    利用者からの第1指示に応じて前記第2制御データを変更し、
    前記第1制御データと前記変更後の前記第2制御データとを含む入力に応じて、合成音声の周波数特性に関する合成データを出力学習済モデルにより生成し、
    前記合成データに応じた音声信号を生成する、
    コンピュータにより実現される音声合成方法。
  2. 前記中間学習済モデルは、前記第1制御データを含む入力に応じ前記第2制御データを生成する第1学習済モデルであり、
    前記第2制御データは、前記合成音声の音素に関するデータである
    請求項1の音声合成方法。
  3. 前記第1制御データと前記変更後の前記第2制御データとを含む入力に応じて、前記合成音声の表情に関する第3制御データを第2学習済モデルにより生成し、
    利用者からの第2指示に応じて前記第3制御データを変更し、
    前記合成データの生成においては、前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとを含む入力に応じて前記合成データを生成する
    請求項2の音声合成方法。
  4. 前記第2制御データは、前記合成音声の音素および表情に関するデータである
    請求項1の音声合成方法。
  5. 利用者からの第3指示に応じて前記合成データを変更し、
    前記音声信号の生成においては、前記変更後の前記合成データに応じて前記音声信号を生成する
    請求項1から請求項4の何れかの音声合成方法。
  6. 音韻を指定する第1制御データを含む入力に応じた第2制御データを生成する中間学習済モデルと、
    利用者からの第1指示に応じて前記第2制御データを変更する第1編集処理部と、
    前記第1制御データと前記変更後の前記第2制御データとを含む入力に応じて、合成音声の周波数特性に関する合成データを生成する出力学習済モデルと、
    前記合成データに応じた音声信号を生成する合成処理部と
    を具備する音声合成システム。
  7. 前記中間学習済モデルは、前記第1制御データを含む入力に応じて前記第2制御データを生成する第1学習済モデルであり、
    前記第2制御データは、前記合成音声の音素に関するデータである
    請求項6の音声合成システム。
  8. 前記第1制御データと前記変更後の前記第2制御データとを含む入力に応じて、前記合成音声の表情に関する第3制御データを生成する第2学習済モデルと、
    利用者からの第2指示に応じて前記第3制御データを変更する第2編集処理部とを具備し、
    前記出力学習済モデルは、前記第1制御データと第1編集処理部による前記変更後の前記第2制御データと前記第2編集処理部による変更後の前記第3制御データとを含む入力に応じて前記合成データを生成する
    請求項7の音声合成システム。
  9. 前記第2制御データは、前記合成音声の音素および表情に関するデータである
    請求項6の音声合成システム。
  10. 利用者からの第3指示に応じて前記合成データを変更する第3編集処理部を具備し、
    前記合成処理部は、前記変更後の前記合成データに応じて前記音声信号を生成する
    請求項6から請求項9の何れかの音声合成システム。
  11. 音韻を指定する第1制御データを含む入力に応じ第2制御データを生成する中間学習済モデル
    利用者からの第1指示に応じて前記第2制御データを変更する第1編集処理部
    前記第1制御データと前記変更後の前記第2制御データとを含む入力に応じて、合成音声の周波数特性に関する合成データを生成する出力学習済モデル、および、
    前記合成データに応じた音声信号を生成する合成処理部
    としてコンピュータを機能させるプログラム。
JP2017229042A 2017-11-29 2017-11-29 音声合成方法、音声合成システムおよびプログラム Active JP6729539B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2017229042A JP6729539B2 (ja) 2017-11-29 2017-11-29 音声合成方法、音声合成システムおよびプログラム
CN201880077081.1A CN111418006B (zh) 2017-11-29 2018-11-28 声音合成方法、声音合成装置及记录介质
CN202310641326.1A CN116504218A (zh) 2017-11-29 2018-11-28 声音合成方法、声音合成系统
EP18882396.7A EP3719796A4 (en) 2017-11-29 2018-11-28 VOICE SYNTHESIS PROCEDURE, VOICE SYNTHESIS DEVICE AND PROGRAM
PCT/JP2018/043655 WO2019107378A1 (ja) 2017-11-29 2018-11-28 音声合成方法、音声合成装置およびプログラム
US16/886,063 US11495206B2 (en) 2017-11-29 2020-05-28 Voice synthesis method, voice synthesis apparatus, and recording medium
US17/965,185 US20230034572A1 (en) 2017-11-29 2022-10-13 Voice synthesis method, voice synthesis apparatus, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017229042A JP6729539B2 (ja) 2017-11-29 2017-11-29 音声合成方法、音声合成システムおよびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020113896A Division JP7180642B2 (ja) 2020-07-01 2020-07-01 音声合成方法、音声合成システムおよびプログラム

Publications (3)

Publication Number Publication Date
JP2019101094A JP2019101094A (ja) 2019-06-24
JP2019101094A5 true JP2019101094A5 (ja) 2020-05-07
JP6729539B2 JP6729539B2 (ja) 2020-07-22

Family

ID=66663973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017229042A Active JP6729539B2 (ja) 2017-11-29 2017-11-29 音声合成方法、音声合成システムおよびプログラム

Country Status (5)

Country Link
US (2) US11495206B2 (ja)
EP (1) EP3719796A4 (ja)
JP (1) JP6729539B2 (ja)
CN (2) CN116504218A (ja)
WO (1) WO2019107378A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6729539B2 (ja) 2017-11-29 2020-07-22 ヤマハ株式会社 音声合成方法、音声合成システムおよびプログラム
JP6737320B2 (ja) * 2018-11-06 2020-08-05 ヤマハ株式会社 音響処理方法、音響処理システムおよびプログラム
JP7331588B2 (ja) * 2019-09-26 2023-08-23 ヤマハ株式会社 情報処理方法、推定モデル構築方法、情報処理装置、推定モデル構築装置およびプログラム
JP7180642B2 (ja) * 2020-07-01 2022-11-30 ヤマハ株式会社 音声合成方法、音声合成システムおよびプログラム
WO2022080395A1 (ja) * 2020-10-15 2022-04-21 ヤマハ株式会社 音声合成方法およびプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4661915A (en) * 1981-08-03 1987-04-28 Texas Instruments Incorporated Allophone vocoder
JP2001134283A (ja) 1999-11-04 2001-05-18 Mitsubishi Electric Corp 音声合成装置および音声合成方法
JP4311710B2 (ja) * 2003-02-14 2009-08-12 株式会社アルカディア 音声合成制御装置
US20140236597A1 (en) * 2007-03-21 2014-08-21 Vivotext Ltd. System and method for supervised creation of personalized speech samples libraries in real-time for text-to-speech synthesis
JP2008268477A (ja) 2007-04-19 2008-11-06 Hitachi Business Solution Kk 韻律調整可能な音声合成装置
JP5029884B2 (ja) 2007-05-22 2012-09-19 富士通株式会社 韻律生成装置、韻律生成方法、および、韻律生成プログラム
US20100066742A1 (en) * 2008-09-18 2010-03-18 Microsoft Corporation Stylized prosody for speech synthesis-based applications
JP5293460B2 (ja) * 2009-07-02 2013-09-18 ヤマハ株式会社 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
JP6236765B2 (ja) * 2011-11-29 2017-11-29 ヤマハ株式会社 音楽データ編集装置および音楽データ編集方法
JP5949607B2 (ja) * 2013-03-15 2016-07-13 ヤマハ株式会社 音声合成装置
JP6372066B2 (ja) * 2013-10-15 2018-08-15 ヤマハ株式会社 合成情報管理装置および音声合成装置
CN105593936B (zh) * 2013-10-24 2020-10-23 宝马股份公司 用于文本转语音性能评价的系统和方法
US9978359B1 (en) * 2013-12-06 2018-05-22 Amazon Technologies, Inc. Iterative text-to-speech with user feedback
JP6507579B2 (ja) 2014-11-10 2019-05-08 ヤマハ株式会社 音声合成方法
CN105206258B (zh) * 2015-10-19 2018-05-04 百度在线网络技术(北京)有限公司 声学模型的生成方法和装置及语音合成方法和装置
JP6004358B1 (ja) * 2015-11-25 2016-10-05 株式会社テクノスピーチ 音声合成装置および音声合成方法
JP2017107228A (ja) * 2017-02-20 2017-06-15 株式会社テクノスピーチ 歌声合成装置および歌声合成方法
JP6729539B2 (ja) 2017-11-29 2020-07-22 ヤマハ株式会社 音声合成方法、音声合成システムおよびプログラム
CN114170997A (zh) * 2021-12-28 2022-03-11 科大讯飞股份有限公司 发音技巧检测方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
JP2019101094A5 (ja) 音声合成方法、音声合成システムおよびプログラム
TW202008348A (zh) 語音合成方法、模型訓練方法、裝置和電腦設備
US20140038489A1 (en) Interactive plush toy
JP6342428B2 (ja) 音声合成装置、音声合成方法およびプログラム
CN110880315A (zh) 一种基于音素后验概率的个性化语音和视频生成系统
CN105224073A (zh) 一种基于语音控制的点读手表及其点读方法
GB2516965A (en) Synthetic audiovisual storyteller
CN103366731A (zh) 语音合成方法及系统
JP2020076843A5 (ja) 情報処理方法、情報処理システムおよびプログラム
TW201227714A (en) Controllable prosody re-estimation system and method and computer program product thereof
JP2019101093A5 (ja) 音声合成方法、音声合成システムおよびプログラム
WO2019107378A1 (ja) 音声合成方法、音声合成装置およびプログラム
US20230018972A1 (en) Synthetic speech processing
JP2020076844A5 (ja) 音響処理方法、音響処理システムおよびプログラム
JP2019168542A (ja) 情報処理方法および情報処理装置
KR20190088126A (ko) 인공 지능 기반 외국어 음성 합성 방법 및 장치
JP2020166298A5 (ja) 音声合成方法、音声合成システムおよびプログラム
JP2014142465A (ja) 音響モデル生成装置及び方法、並びに音声認識装置及び方法
Ramey et al. A social robot as an aloud reader: Putting together recognition and synthesis of voice and gestures for HRI experimentation
JPWO2021240837A5 (ja)
Mendoza et al. Gestural Agency in Human–Machine Musical Interaction
JP6748607B2 (ja) 音声合成学習装置、音声合成装置、これらの方法及びプログラム
JP2016090776A (ja) 応答生成装置、応答生成方法およびプログラム
Boku et al. Speech synthesis of emotions using vowel features of a speaker
Salomé Technologies of sound art: Techno-cultural occurrences