JP5226867B2 - 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム - Google Patents
話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム Download PDFInfo
- Publication number
- JP5226867B2 JP5226867B2 JP2011515936A JP2011515936A JP5226867B2 JP 5226867 B2 JP5226867 B2 JP 5226867B2 JP 2011515936 A JP2011515936 A JP 2011515936A JP 2011515936 A JP2011515936 A JP 2011515936A JP 5226867 B2 JP5226867 B2 JP 5226867B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency pattern
- fundamental frequency
- learning
- voice
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
- G10L2021/0135—Voice conversion or morphing
Description
△V[i]=0.5*(V[i+1]−V[i−1])
△2V[i]=0.5*(−V[i+1] +2V[i]−V[i−1])
算出された1次及び2次の動的特徴量はそれぞれ後述する移動量・変化量学習部150へと渡される。
但し、i3=3(i−1)である。
この方程式はコレスキー分解や最急降下法などの反復計算によって特徴量ベクトルcについて解くことができ、従って時間軸方向の移動量及び周波数軸方向の移動量それぞれについて最適解が求まる。このように、最適化部165は、出力特徴量の分布の列から、最も尤もらしい時間軸方向及び周波数軸方向のそれぞれの移動量の列を求める。算出された時間軸方向及び周波数軸方向のそれぞれの移動量の列は、その後最適化処理部165から後述する目標F0パターン生成部へ渡される。
。
但し「μ′ o=Vys+μoとする。なおysは、上述したように元F0パターン上の時間軸方向又は周波数軸方向の値である。
但し、μzyはzyの平均値ベクトル、μdyはdyの平均値ベクトルであり、ここでzy=Wys,
dy=Wδyである。なおここでも行列Wは数式7を満たす。
但しΣzytは、目標F0パターン(時間軸方向又は周波数軸方向いずれか一方)の共分散行列、Σdyは移動量(時間軸方向又は周波数軸方向いずれか一方)の共分散行列、Σzytdyは目標F0パターンと移動量(時間軸方向同士又は周波数軸同士の組み合わせ)の共分散行列である。
但し、R=UTΣo −1U、r=UTΣo −1μ′ oである。Rを求めるためにΣOの逆行列を求める必要があるが、これはΣzyt 、Σzytdy 、Σdyのそれぞれが対角行列とすれば簡単に求めることができる。例えば、その対角成分を順にa[i]、b[i]、c[i]とすると、ΣOの逆行列の対角成分はc[i]/(a[i] c[i]―b[i]2)として求めることができる。
Claims (19)
- 基準となる音声の基本周波数の時間変化を表した基本周波数パターンに対する目標話者の音声の基本周波数パターンの移動量を学習する学習装置であって、
学習用テキストに対応する基準となる音声の基本周波数パターンと、前記学習用テキストに対応する目標話者の音声の基本周波数パターンとを、山と山及び谷と谷とが対応するように対応付ける対応付け部と、
前記目標話者の音声の基本周波数パターン上の各点について、対応付けの結果を参照して、前記基準となる音声の基本周波数パターン上の対応する点からの時間軸方向及び周波数軸方向の移動量を求める移動量算出部と、
前記学習用テキストの解析結果である言語情報を入力特徴量、及び算出した前記移動量を出力特徴量として決定木を学習する学習部と、
を含む学習装置。 - 前記対応付け部は、前記基準となる音声の基本周波数パターンを、前記目標話者の音声の基本周波数パターンとの差が最小になるように変換するアフィン変換のセットを算出するアフィン変換セット算出部と、
基本周波数パターンの時間軸方向をX軸及び周波数軸方向をY軸とした場合に、前記基準となる音声の基本周波数パターン上の各点を、該点のX座標の値を対応する前記アフィン変換により変換した値をX座標の値とする前記目標話者の音声の基本周波数パターン上の点に対応付けるアフィン変換部とを含む、請求項1に記載の学習装置。 - 前記アフィン変換セット算出部は、前記アフィン変換を求める処理単位の初期値にイントネーション句を設定し、前記目標話者の音声の基本周波数パターンとの差が最小になるように前記基準となる音声の基本周波数パターンを変換するアフィン変換が求まるまで、前記処理単位を再帰的に2分する、請求項2に記載の学習装置。
- 前記対応付け部による対応付け及び移動量算出部による移動量の算出は、フレーム単位又は音声素片単位で行われる、請求項1に記載の学習装置。
- 算出された前記移動量の各々について、隣接する点との間の変化量を算出する変化量算出部を更に含み、前記学習部は、静的特徴量である前記移動量及び動的特徴量である前記移動量の変化量を出力特徴量として決定木を学習する、請求項1に記載の学習装置。
- 前記移動量の変化量は、前記移動量の傾きである1次の動的特徴量と、前記移動量の曲率である2次の動的特徴量とを含む、請求項5に記載の学習装置。
- 前記変化量算出部は、更に前記目標話者の音声の基本周波数パターン上の各点について隣接する点との間の時間軸方向及び周波数軸方向の変化量を算出し、前記学習部は、前記静的特徴量に前記目標話者の音声の基本周波数パターン上の各点の時間軸方向及び周波数軸方向の値を、前記動的特徴量に前記時間軸方向及び周波数軸方向の変化量を各々加えて、前記決定木を学習し、学習した前記決定木の各葉ノードについて、該葉ノードに振り分けられた各出力特徴量及び前記出力特徴量の組み合わせの分布を求める、請求項5に記載の学習装置。
- 前記学習部は、前記決定木の各葉ノードについて、該葉ノードに振り分けられた出力特徴量の分布を多次元の単一又は混合ガウス分布を用いてモデル化する、請求項5に記載の学習装置。
- 前記目標話者の音声の基本周波数パターン上の各点について算出される移動量は、フレーム単位又は音声素片単位で算出された移動量である、請求項5に記載の学習装置。
- 前記言語情報は、アクセント型、品詞、音素、モーラ位置の少なくとも1つに関する情報を含む、請求項1に記載の学習装置。
- 基準となる音声の基本周波数の時間変化を表した基本周波数パターンを基に目標話者の音声の基本周波数パターンを生成する基本周波数パターン生成装置であって、
学習用テキストに対応する基準となる音声の基本周波数パターンと、前記学習用テキストに対応する目標話者の音声の基本周波数パターンとを、山と山及び谷と谷とが対応するように対応付ける対応付け部と、
前記目標話者の音声の基本周波数パターンを構成する各時系列点について、対応付けの結果を参照して、前記基準となる音声の基本周波数パターンを構成する各時系列点のうち対応する点からの時間軸方向及び周波数軸方向の移動量を求める移動量算出部と、
算出された前記移動量の各々について、隣接する時系列点との間の変化量を算出する変化量算出部と、
前記学習用テキストの解析結果である言語情報を入力特徴量、及び静的特徴量である前記移動量及び動的特徴量である前記移動量の変化量を出力特徴量として決定木を学習し、学習した前記決定木の各葉ノードについて、該葉ノードに振り分けられた出力特徴量の分布を求める学習部と、
合成用テキスの解析結果である言語情報を前記決定木に入力し、前記各時系列点における前記出力特徴量の分布を予測する分布列予測部と、
予測した前記出力特徴量の分布の列から算出される尤度を最大とする移動量の列を求めることにより、前記移動量の最適化を行う最適化処理部と、
合成用テキストに対応する基準となる音声の基本周波数パターンに前記移動量の列を加算することにより、前記合成用テキストに対応する前記目標話者の音声の基本周波数パターンを生成する目標話者の周波数パターン生成部と、
を含む基本周波数パターン生成装置。 - 前記対応付け部は、前記基準となる音声の基本周波数パターンを、前記目標話者の音声の基本周波数パターンとの差が最小になるように変換するアフィン変換のセットを算出するアフィン変換セット算出部と、
基本周波数パターンの時間軸方向をX軸及び周波数軸方向をY軸とした場合に、前記基準となる音声の基本周波数パターンの前記各時系列点を、該時系列点のX座標の値を対応する前記アフィン変換により変換した値をX座標の値とする前記目標話者の音声の基本周波数パターンの前記時系列点に対応付けるアフィン変換部とを含む、請求項11に記載の基本周波数パターン生成装置。 - 前記学習部は、前記葉ノードに振り分けられた出力特徴量の平均値、分散、及び共分散を求める、請求項11に記載の基本周波数パターン生成装置。
- 基準となる音声の基本周波数の時間変化を表した基本周波数パターンを基に目標話者の音声の基本周波数パターンを生成する基本周波数パターン生成装置であって、
学習用テキストに対応する基準となる音声の基本周波数パターンと、前記学習用テキストに対応する目標話者の音声の基本周波数パターンとを、山と山及び谷と谷とが対応するように対応付ける対応付け部と、
前記目標話者の音声の基本周波数パターンを構成する各時系列点について、対応付けの結果を参照して、前記基準となる音声の基本周波数パターンを構成する各時系列点のうち対応する点からの時間軸方向及び周波数軸方向の移動量を求める移動量算出部と、
算出された前記移動量と前記目標話者の音声の基本周波数パターン上の各点の各々について、隣接する時系列点との間の変化量を算出する変化量算出部と、
前記学習用テキストの解析結果である言語情報を入力特徴量、静的特徴量である前記移動量と前記目標話者の音声の基本周波数パターン上の各点の値、及び動的特徴量である前記移動量の変化量と前記目標話者の音声の基本周波数パターン上の各点の変化量を出力特徴量として決定木を学習し、学習した前記決定木の各葉ノードについて、該葉ノードに振り分けられた各出力特徴量及び前記出力特徴量の組み合わせの分布を求める学習部と、
合成用テキスの解析結果である言語情報を前記決定木に入力し、前記各時系列点における前記各出力特徴量及び前記出力特徴量の組み合わせの分布を予測する分布列予測部と、
予測した前記出力特徴量及び該出力特徴量の組み合わせの分布の列から算出される尤度を最大とする前記目標話者の音声の基本周波数パターン上の各点の時間軸方向及び周波数軸方向の値とを求めることにより、最適化処理を行う最適化処理部と、
前記最適化処理部により求められた時間軸方向の値及び対応する周波数軸方向の値の各組み合わせを時間順に並べて前記目標話者の音声の基本周波数パターンとする目標話者の周波数パターン生成部と、
を含む基本周波数パターン生成装置。 - 前記対応付け部は、前記基準となる音声の基本周波数パターンを、前記目標話者の音声の基本周波数パターンとの差が最小になるように変換するアフィン変換のセットを算出するアフィン変換セット算出部と、
基本周波数パターンの時間軸方向をX軸及び周波数軸方向をY軸とした場合に、前記基準となる音声の基本周波数パターンの前記各時系列点を、該時系列点のX座標の値を対応する前記アフィン変換により変換した値をX座標の値とする前記目標話者の音声の基本周波数パターンの前記時系列点に対応付けるアフィン変換部とを含む、請求項14に記載の基本周波数パターン生成装置。 - コンピュータの計算処理によって、基準となる音声の基本周波数の時間変化を表した基本周波数パターンに対する目標話者の音声の基本周波数パターンの移動量を学習する学習方法であって、
学習用テキストに対応する基準となる音声の基本周波数パターンと、前記学習用テキストに対応する目標話者の音声の基本周波数パターンとを、山と山及び谷と谷とが対応するように対応付け、対応関係を前記コンピュータの記憶領域に記憶するステップと、
前記記憶領域から前記対応関係を読み出して、前記目標話者の基本周波数パターン上の各点について、前記基準となる音声の基本周波数パターン上の対応する点からの時間軸方向及び周波数軸方向の移動量を求め、該移動量を前記記憶領域に記憶するステップと
前記記憶領域から前記移動量を読み出して、前記学習用テキストの解析結果である言語情報を入力特徴量、及び前記移動量を出力特徴量として決定木を学習するステップと、 を含む学習方法。 - 前記対応付けは、前記基準となる音声の基本周波数パターンを、前記目標話者の音声の基本周波数パターンとの差が最小になるように変換するアフィン変換のセットを算出する第1サブステップと、
基本周波数パターンの時間軸方向をX軸及び周波数軸方向をY軸とした場合に、前記基準の基本周波数パターン上の各点を、該点のX座標の値を対応する前記アフィン変換により変換した値をX座標の値とする前記目標話者の音声の基本周波数パターン上の点に対応付ける第2サブステップとを含む、請求項16に記載の学習方法。 - 基準となる音声の基本周波数の時間変化を表した基本周波数パターンに対する目標話者の音声の基本周波数パターンの移動量を学習する学習プログラムであって、前記学習プログラムは、プロセッサと記憶部を備えたコンピュータに、
学習用テキストに対応する基準となる音声の基本周波数パターンと、前記学習用テキ
ストに対応する目標話者の音声の基本周波数パターンとを、山と山及び谷と谷とが対応するように対応付け、対応関係を前記コンピュータの前記記憶部に記憶するステップと、
前記記憶部から前記対応関係を読み出して、前記目標話者の音声の基本周波数パターン上の各点について、前記基準となる音声の基本周波数パターン上の対応する点からの時間軸方向及び周波数軸方向の移動量を求め、該移動量を前記記憶部に記憶するステップと、
前記記憶部から前記移動量を読み出して、前記学習用テキストの解析結果である言語情報を入力特徴量、及び前記移動量を出力特徴量として決定木を学習するステップと、 を実行させる学習プログラム。 - 前記学習プログラムは、前記コンピュータに前記基準となる音声の基本周波数パターン上の点と前記目標話者の音声の基本周波数パターン上の点を対応させるために、前記コンピュータに、
前記基準となる音声の基本周波数パターンを、前記目標話者の音声の基本周波数パターンとの差が最小になるように変換するアフィン変換のセットを算出する第1サブステップと、
基本周波数パターンの時間軸方向をX軸及び周波数軸方向をY軸とした場合に、前記基準となる音声の基本周波数パターン上の各点を、該点のX座標の値を対応する前記アフィン変換により変換した値をX座標の値とする前記目標話者の音声の基本周波数パターン上の点に対応付ける第2サブステップとを実行させる、請求項18に記載の学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011515936A JP5226867B2 (ja) | 2009-05-28 | 2010-03-16 | 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009129366 | 2009-05-28 | ||
JP2009129366 | 2009-05-28 | ||
PCT/JP2010/054413 WO2010137385A1 (ja) | 2009-05-28 | 2010-03-16 | 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム |
JP2011515936A JP5226867B2 (ja) | 2009-05-28 | 2010-03-16 | 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010137385A1 JPWO2010137385A1 (ja) | 2012-11-12 |
JP5226867B2 true JP5226867B2 (ja) | 2013-07-03 |
Family
ID=43222509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011515936A Active JP5226867B2 (ja) | 2009-05-28 | 2010-03-16 | 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US8744853B2 (ja) |
EP (1) | EP2357646B1 (ja) |
JP (1) | JP5226867B2 (ja) |
CN (1) | CN102341842B (ja) |
TW (1) | TW201108203A (ja) |
WO (1) | WO2010137385A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5238205B2 (ja) * | 2007-09-07 | 2013-07-17 | ニュアンス コミュニケーションズ,インコーポレイテッド | 音声合成システム、プログラム及び方法 |
KR101495410B1 (ko) * | 2007-10-05 | 2015-02-25 | 닛본 덴끼 가부시끼가이샤 | 음성 합성 장치, 음성 합성 방법 및 컴퓨터 판독가능 기억 매체 |
CN102270449A (zh) * | 2011-08-10 | 2011-12-07 | 歌尔声学股份有限公司 | 参数语音合成方法和系统 |
JP5665780B2 (ja) * | 2012-02-21 | 2015-02-04 | 株式会社東芝 | 音声合成装置、方法およびプログラム |
US10832264B1 (en) * | 2014-02-28 | 2020-11-10 | Groupon, Inc. | System, method, and computer program product for calculating an accepted value for a promotion |
WO2016042659A1 (ja) * | 2014-09-19 | 2016-03-24 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
JP6468519B2 (ja) * | 2016-02-23 | 2019-02-13 | 日本電信電話株式会社 | 基本周波数パターン予測装置、方法、及びプログラム |
JP6472005B2 (ja) * | 2016-02-23 | 2019-02-20 | 日本電信電話株式会社 | 基本周波数パターン予測装置、方法、及びプログラム |
JP6468518B2 (ja) * | 2016-02-23 | 2019-02-13 | 日本電信電話株式会社 | 基本周波数パターン予測装置、方法、及びプログラム |
GB201621434D0 (en) * | 2016-12-16 | 2017-02-01 | Palantir Technologies Inc | Processing sensor logs |
JP6876642B2 (ja) * | 2018-02-20 | 2021-05-26 | 日本電信電話株式会社 | 音声変換学習装置、音声変換装置、方法、及びプログラム |
CN112562633A (zh) * | 2020-11-30 | 2021-03-26 | 北京有竹居网络技术有限公司 | 一种歌唱合成方法、装置、电子设备及存储介质 |
CN117476027B (zh) * | 2023-12-28 | 2024-04-23 | 南京硅基智能科技有限公司 | 语音转换方法及装置、存储介质、电子装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05241596A (ja) * | 1992-02-28 | 1993-09-21 | N T T Data Tsushin Kk | 音声の基本周波数抽出システム |
JPH08248994A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 声質変換音声合成装置 |
JP2005266349A (ja) * | 2004-03-18 | 2005-09-29 | Nec Corp | 声質変換装置および声質変換方法ならびに声質変換プログラム |
JP2006276660A (ja) * | 2005-03-30 | 2006-10-12 | Advanced Telecommunication Research Institute International | イントネーションの変化の特徴を声調の変形により表す方法及びそのコンピュータプログラム |
JP2010049196A (ja) * | 2008-08-25 | 2010-03-04 | Toshiba Corp | 声質変換装置及び方法、音声合成装置及び方法 |
WO2010110095A1 (ja) * | 2009-03-25 | 2010-09-30 | 株式会社 東芝 | 音声合成装置及び音声合成方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6411083A (en) | 1987-07-01 | 1989-01-13 | Hitachi Ltd | Laser beam marker |
JPH01152987A (ja) | 1987-12-08 | 1989-06-15 | Toshiba Corp | 速度帰還選別装置 |
JPH0792986A (ja) | 1993-09-28 | 1995-04-07 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法 |
JP3233184B2 (ja) | 1995-03-13 | 2001-11-26 | 日本電信電話株式会社 | 音声符号化方法 |
US6240384B1 (en) * | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
JP3240908B2 (ja) * | 1996-03-05 | 2001-12-25 | 日本電信電話株式会社 | 声質変換方法 |
JP3575919B2 (ja) | 1996-06-24 | 2004-10-13 | 沖電気工業株式会社 | テキスト音声変換装置 |
JP3914612B2 (ja) | 1997-07-31 | 2007-05-16 | 株式会社日立製作所 | 通信システム |
JP3667950B2 (ja) * | 1997-09-16 | 2005-07-06 | 株式会社東芝 | ピッチパターン生成方法 |
US6101469A (en) * | 1998-03-02 | 2000-08-08 | Lucent Technologies Inc. | Formant shift-compensated sound synthesizer and method of operation thereof |
JP2003337592A (ja) | 2002-05-21 | 2003-11-28 | Toshiba Corp | 音声合成方法及び音声合成装置及び音声合成プログラム |
CN100440314C (zh) * | 2004-07-06 | 2008-12-03 | 中国科学院自动化研究所 | 基于语音分析与合成的高品质实时变声方法 |
WO2006104988A1 (en) * | 2005-03-28 | 2006-10-05 | Lessac Technologies, Inc. | Hybrid speech synthesizer, method and use |
CN101004911B (zh) * | 2006-01-17 | 2012-06-27 | 纽昂斯通讯公司 | 用于生成频率弯曲函数及进行频率弯曲的方法和装置 |
JP4241736B2 (ja) * | 2006-01-19 | 2009-03-18 | 株式会社東芝 | 音声処理装置及びその方法 |
CN101064104B (zh) * | 2006-04-24 | 2011-02-02 | 中国科学院自动化研究所 | 基于语音转换的情感语音生成方法 |
JP4264841B2 (ja) * | 2006-12-01 | 2009-05-20 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに、プログラム |
JP5238205B2 (ja) * | 2007-09-07 | 2013-07-17 | ニュアンス コミュニケーションズ,インコーポレイテッド | 音声合成システム、プログラム及び方法 |
JP5025550B2 (ja) * | 2008-04-01 | 2012-09-12 | 株式会社東芝 | 音声処理装置、音声処理方法及びプログラム |
JP2010008853A (ja) * | 2008-06-30 | 2010-01-14 | Toshiba Corp | 音声合成装置及びその方法 |
-
2010
- 2010-03-16 EP EP10780343.9A patent/EP2357646B1/en active Active
- 2010-03-16 WO PCT/JP2010/054413 patent/WO2010137385A1/ja active Application Filing
- 2010-03-16 JP JP2011515936A patent/JP5226867B2/ja active Active
- 2010-03-16 US US13/319,856 patent/US8744853B2/en active Active
- 2010-03-16 CN CN2010800101996A patent/CN102341842B/zh active Active
- 2010-05-10 TW TW099114830A patent/TW201108203A/zh unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05241596A (ja) * | 1992-02-28 | 1993-09-21 | N T T Data Tsushin Kk | 音声の基本周波数抽出システム |
JPH08248994A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 声質変換音声合成装置 |
JP2005266349A (ja) * | 2004-03-18 | 2005-09-29 | Nec Corp | 声質変換装置および声質変換方法ならびに声質変換プログラム |
JP2006276660A (ja) * | 2005-03-30 | 2006-10-12 | Advanced Telecommunication Research Institute International | イントネーションの変化の特徴を声調の変形により表す方法及びそのコンピュータプログラム |
JP2010049196A (ja) * | 2008-08-25 | 2010-03-04 | Toshiba Corp | 声質変換装置及び方法、音声合成装置及び方法 |
WO2010110095A1 (ja) * | 2009-03-25 | 2010-09-30 | 株式会社 東芝 | 音声合成装置及び音声合成方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201108203A (en) | 2011-03-01 |
US8744853B2 (en) | 2014-06-03 |
JPWO2010137385A1 (ja) | 2012-11-12 |
EP2357646A1 (en) | 2011-08-17 |
EP2357646B1 (en) | 2013-08-07 |
EP2357646A4 (en) | 2012-11-21 |
CN102341842A (zh) | 2012-02-01 |
CN102341842B (zh) | 2013-06-05 |
US20120059654A1 (en) | 2012-03-08 |
WO2010137385A1 (ja) | 2010-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5226867B2 (ja) | 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム | |
JP5457706B2 (ja) | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 | |
JP4738057B2 (ja) | ピッチパターン生成方法及びその装置 | |
JP5665780B2 (ja) | 音声合成装置、方法およびプログラム | |
JP5159279B2 (ja) | 音声処理装置及びそれを用いた音声合成装置。 | |
Veaux et al. | Intonation conversion from neutral to expressive speech | |
JP6342428B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
US20080243508A1 (en) | Prosody-pattern generating apparatus, speech synthesizing apparatus, and computer program product and method thereof | |
Wang et al. | An RNN-based quantized F0 model with multi-tier feedback links for text-to-speech synthesis | |
KR20070077042A (ko) | 음성처리장치 및 방법 | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
JP2015152630A (ja) | 音声合成辞書生成装置、音声合成辞書生成方法およびプログラム | |
Bellegarda et al. | Statistical prosodic modeling: from corpus design to parameter estimation | |
Nirmal et al. | Voice conversion using general regression neural network | |
JP2009251029A (ja) | 音声処理装置、音声処理方法及びプログラム | |
US20160189705A1 (en) | Quantitative f0 contour generating device and method, and model learning device and method for f0 contour generation | |
JP4945465B2 (ja) | 音声情報処理装置及びその方法 | |
JP2009069179A (ja) | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム | |
JP2008256942A (ja) | 音声合成データベースのデータ比較装置及び音声合成データベースのデータ比較方法 | |
CN110431546A (zh) | 发音者检索装置、发音者检索方法以及发音者检索程序 | |
JP6523423B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2008191477A (ja) | ハイブリッド型音声合成方法、及びその装置とそのプログラムと、その記憶媒体 | |
JP4282609B2 (ja) | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム | |
JP2016151709A (ja) | 音声合成装置及び音声合成プログラム | |
JP2016085408A (ja) | 基本周波数調整装置、方法及びプログラム、並びに、音声合成装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5226867 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |