JP4738057B2 - ピッチパターン生成方法及びその装置 - Google Patents
ピッチパターン生成方法及びその装置 Download PDFInfo
- Publication number
- JP4738057B2 JP4738057B2 JP2005151568A JP2005151568A JP4738057B2 JP 4738057 B2 JP4738057 B2 JP 4738057B2 JP 2005151568 A JP2005151568 A JP 2005151568A JP 2005151568 A JP2005151568 A JP 2005151568A JP 4738057 B2 JP4738057 B2 JP 4738057B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- pitch pattern
- pattern
- control unit
- patterns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 56
- 238000003860 storage Methods 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000003786 synthesis reaction Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 11
- 239000011295 pitch Substances 0.000 description 286
- 238000012986 modification Methods 0.000 description 23
- 230000004048 modification Effects 0.000 description 23
- 230000008569 process Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000011306 natural pitch Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
まず、本実施形態に使用する用語を説明する。
図1は、本実施形態に係るテキスト音声合成システムの構成例を示したもので、大きく分けて、言語処理部20、韻律生成部21、音声信号生成部22の3つのモジュールから構成される。
本実施形態では、ピッチパターン生成部1の構成とその処理動作に特徴があり、以下、これらについて説明する。なお、ここでは、韻律制御単位はアクセント句であるとする場合を例にとって説明する。
ピッチパターン記憶部14には、自然音声より抽出した大量のアクセント句毎のピッチパターンが、各ピッチパターンに対応するパターン属性情報と共に記憶されている。
パターン選択部10は、アクセント句毎に、言語属性情報100及び音韻継続時間長111を基にピッチパターン記憶部14に蓄積されているピッチパターンの中からN個のピッチパターン101とM個のピッチパターン103を選択する(M>=N>1)。
パターン形状生成部11は、パターン選択部10で選択されたN個のピッチパターン101を言語属性情報100に基づいて融合することで融合ピッチパターン生成し、さらに音韻継続時間長111に従って該融合ピッチパターンの時間軸方向の伸縮を行って、ピッチパターン102を生成する。
オフセット制御部12は、パターン選択部10で選択されたM個のピッチパターン103からオフセット値の統計量を算出し、ピッチパターン102を該統計量に従って周波数軸上で平行移動させ、ピッチパターン104を出力する。
パターン接続部13は、アクセント句毎に生成されたピッチパターン104を接続すると共に、接続境界部分で不連続が生じないような平滑化などの処理を行って、文ピッチパターン121を出力する。
次に、図4のピッチパターン生成部1における処理の流れを示すフローチャートを用いて、ピッチパターン生成部1の各処理について詳しく説明する。
まず、ステップS41において、パターン選択部10は言語属性情報100及び音韻継続時間長111に基づいて、アクセント句毎に、ピッチパターン記憶部14に蓄積されているピッチパターンの中から、N個のピッチパターン101とM個のピッチパターン103を選択する。
このコストの推定は、例えば、従来の音声合成装置におけるものと同様のコスト関数を計算することによって実行される。つまり、例えば、ピッチパターン形状やオフセットが異なる要因毎、またピッチパターンを変形・接続する際に生じる歪の要因毎にサブコスト関数Cl(ui,ui−1,ti)(但し、l=1〜L、Lはサブコスト関数の数)を定義し、これらの重み付き和をアクセント句コスト関数として定義する。
図5は、この2段階での選択処理手順の一例を説明するためのフローチャートである。
ステップS42において、パターン形状生成部11はパターン選択部10で選択されたN個のピッチパターン101を言語属性情報100に基づいて融合することで融合ピッチパターン生成し、さらに音韻継続時間長111に従って該融合ピッチパターンの時間軸方向の伸縮を行って、新たなピッチパターン102を生成する。
ステップS43において、オフセット制御部13は、パターン選択部10で選択されたM個のピッチパターン103からオフセット値の統計量を算出し、ピッチパターン102を該オフセット値の統計量に従って周波数軸上で平行移動させ、ピッチパターン104を生成する。
ステップ44において、パターン接続部13は、アクセント句毎に生成されたピッチパターン104を繋げて、入力されたテキスト201に対応する音声の韻律的な特徴の1つである文ピッチパターン121を生成する。各アクセント句のピッチパターン104を接続する際には、アクセント句境界で不連続が生じないように平滑化などの処理を行って、文ピッチパターン121を出力する。
以上説明したように、本実施形態によれば、パターン選択部10で入力テキストに対応した言語属性情報100に基づいて、自然音声より抽出した大量のピッチパターが記憶されているピッチパターン記憶部14から韻律制御単位あたりM個及びN個のピッチパターンを選択し、さらに、オフセット制御部12において、韻律制御単位毎に選択されたM個のピッチパターン103から算出したオフセット値の統計量に基づいてピッチパターンのオフセットを制御することができる。
上記実施形態の変更例1について説明する。
上記実施形態の変更例2について説明する。
上記実施形態の変更例3について説明する。
上記実施形態の変更例4について説明する。
上記実施形態の変更例5について説明する。
上記実施形態の変更例6について説明する。
上記実施形態の変更例7について説明する。
上記実施形態の変更例8について説明する。
上記実施形態の変更例9について説明する。
上記実施形態の変更例10について説明する。
上記実施形態の変更例11について説明する。
以上の各実施形態の機能は、ハードウェアとしても実現可能である。
10 パターン選択部
11 パターン形状生成部
12 オフセット制御部
13 パターン接続部
14 ピッチパターン記憶部
15 パターン&オフセット値選択部
16 オフセット値記憶部
17 オフセット値選択部
20 言語処理部
21 韻律生成部
22 音声信号生成部
Claims (14)
- 韻律制御単位の原型となるピッチパターンを変形して音声合成に用いられるピッチパターンを生成するピッチパターン生成方法であって、
韻律制御単位毎のピッチパターンの高さを表す自然音声より抽出したオフセット値とこれに対するパターン属性情報とが対応付けて記憶されている記憶手段から複数のオフセット値を選択するものであり、音声合成対象となるテキストを解析することにより得られる言語属性情報と前記パターン属性情報に基づいて韻律制御単位毎に前記複数のオフセット値を選択するオフセット値選択ステップと、
前記テキストの韻律制御単位毎に選択された前記複数のオフセット値の統計量に基づいて前記韻律制御単位の原型となるピッチパターンを変形するピッチパターン生成ステップと、
を有することを特徴とするピッチパターン生成方法。 - 自然音声より抽出した第1のピッチパターンとこれに対するパターン属性情報とが対応付けて記憶されている記憶手段から複数の第1のピッチパターンを選択するものであり、音声合成対象となるテキストを解析することにより得られる言語属性情報と前記パターン属性情報に基づいて韻律制御単位毎に前記複数の第1のピッチパターンを選択するピッチパターン選択ステップと、
前記テキストの韻律制御単位毎に選択された前記複数の第1のピッチパターンに基づいて、前記第1のピッチパターンの高さを表すオフセット値の統計量を求め、前記オフセット値の統計量に基づいて前記韻律制御単位の第2のピッチパターンを生成するピッチパターン生成ステップと、
前記韻律制御単位毎に生成された第2のピッチパターンを接続して前記テキストに対応するピッチパターンを生成するピッチパターン接続ステップと、
を有することを特徴とするピッチパターン生成方法。 - 前記選択ステップは、M個及びN個(M>=N>1)の第1のピッチパターンを選択するものであり、
前記ピッチパターン生成ステップは、前記M個の第1のピッチパターンからオフセット値の統計量を求め、前記N個の第1のピッチパターンを融合することで生成した融合ピッチパターンを前記オフセット値の統計量に基づいて変形することにより第2のピッチパターンを生成する
ことを特徴とする請求項2記載のピッチパターン生成方法。 - 前記選択ステップは、M個及びN個(M>=N>1)の第1のピッチパターンを選択するものであり、
前記ピッチパターン生成ステップは、前記M個の第1のピッチパターンからオフセット値の統計量を求め、前記N個の第1のピッチパターンを前記オフセット値の統計量に基づいて変形し、前記変形したN個の第1のピッチパターンを融合することで第2のピッチパターンを生成する
ことを特徴とする請求項2記載のピッチパターン生成方法。 - 前記選択ステップは、M個の第1のピッチパターン及び1つの第1のピッチパターンを選択するものであり、
前記ピッチパターン生成ステップは、前記M個の第1のピッチパターンからオフセット値の統計量を求め、前記選択された1つの第1のピッチパターンを前記オフセット値の統計量に基づいて変形することにより第2のピッチパターンを生成する
ことを特徴とする請求項2記載のピッチパターン生成方法。 - 前記オフセット値の統計量は、平均値、中央値、重み和のいずれかである
ことを特徴とする請求項1から5のいずれか一項に記載のピッチパターン生成方法。 - 前記選択ステップは、M個及びN個(M>=N>1)の第1のピッチパターンを選択するものであり、
前記ピッチパターン生成ステップは、前記M個の第1のピッチパターンからオフセット値の統計量を求め、前記N個の第1のピッチパターンの各オフセット値と前記オフセット値の統計量とに基づいて、前記N個の第1のピッチパターンそれぞれの重みを決定し、前記重みに基づいてN個の第1のピッチパターンを融合することにより第2のピッチパターンを生成する
ことを特徴とする請求項2記載のピッチパターン生成方法。 - 前記記憶手段には、自然音声より抽出したピッチパターンの高さを表すオフセット値が記憶されるか、または、抽出したオフセット値を量子化したものが記憶されている
ことを特徴とする請求項1記載のピッチパターン生成方法。 - 前記記憶手段には、自然音声より抽出した第1のピッチパターンが記憶されているか、前記第1のピッチパターンを量子化したものが記憶されているか、または、前記第1のピッチパターンを近似したものが記憶されている
ことを特徴とする請求項2記載のピッチパターン生成方法。 - 前記パターン属性情報と前記言語属性情報に基づいて韻律制御単位毎に原型となる複数の第1のピッチパターンを選択する場合に、コスト関数を用いて前記パターン属性情報と前記言語属性情報とからコストを推定し、前記コストの小さい前記複数の第1のピッチパターンを選択する
ことを特徴とする請求項2記載のピッチパターン生成方法。 - 韻律制御単位の原型となるピッチパターンを変形して音声合成に用いられるピッチパターンを生成するピッチパターン生成装置であって、
韻律制御単位毎のピッチパターンの高さを表す自然音声より抽出したオフセット値とこれに対するパターン属性情報とが対応付けて記憶されている記憶手段と、
音声合成対象となるテキストを解析することにより得られる言語属性情報と前記パターン属性情報に基づいて韻律制御単位毎に前記複数のオフセット値を選択するオフセット値選択手段と、
前記テキストの韻律制御単位毎に選択された前記複数のオフセット値の統計量に基づいて前記韻律制御単位の原型となるピッチパターンを変形するピッチパターン生成手段と、
を有することを特徴とするピッチパターン生成装置。 - 自然音声より抽出した第1のピッチパターンとこれに対するパターン属性情報とが対応付けて記憶されている記憶手段と、
音声合成対象となるテキストを解析することにより得られる言語属性情報と前記パターン属性情報に基づいて韻律制御単位毎に前記複数の第1のピッチパターンを選択するピッチパターン選択手段と、
前記テキストの韻律制御単位毎に選択された前記複数の第1のピッチパターンに基づいて、前記第1のピッチパターンの高さを表すオフセット値の統計量を求め、前記オフセット値の統計量に基づいて前記韻律制御単位の第2のピッチパターンを生成するピッチパターン生成手段と、
前記韻律制御単位毎に生成された第2のピッチパターンを接続して前記テキストに対応するピッチパターンを生成するピッチパターン接続手段と、
を有することを特徴とするピッチパターン生成装置。 - 韻律制御単位の原型となるピッチパターンを変形して音声合成に用いられるピッチパターンを生成するピッチパターン生成プログラムであって、
コンピュータに、
韻律制御単位毎のピッチパターンの高さを表す自然音声より抽出したオフセット値とこれに対するパターン属性情報とが対応付けて記憶されている記憶手段から複数のオフセット値を選択するものであり、音声合成対象となるテキストを解析することにより得られる言語属性情報と前記パターン属性情報に基づいて韻律制御単位毎に前記複数のオフセット値を選択するオフセット値選択機能と、
前記テキストの韻律制御単位毎に選択された前記複数のオフセット値の統計量に基づいて前記韻律制御単位の原型となるピッチパターンを変形するピッチパターン生成機能と、
を実現させるためのピッチパターン生成プログラム。 - コンピュータに、
自然音声より抽出した第1のピッチパターンとこれに対するパターン属性情報とが対応付けて記憶されている記憶手段から複数の第1のピッチパターンを選択するものであり、音声合成対象となるテキストを解析することにより得られる言語属性情報と前記パターン属性情報に基づいて韻律制御単位毎に前記複数の第1のピッチパターンを選択するピッチパターン選択機能と、
前記テキストの韻律制御単位毎に選択された前記複数の第1のピッチパターンに基づいて、前記第1のピッチパターンの高さを表すオフセット値の統計量を求め、前記オフセット値の統計量に基づいて前記韻律制御単位の第2のピッチパターンを生成するピッチパターン生成機能と、
前記韻律制御単位毎に生成された第2のピッチパターンを接続して前記テキストに対応するピッチパターンを生成するピッチパターン接続機能と、
を実現させるためのピッチパターン生成プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151568A JP4738057B2 (ja) | 2005-05-24 | 2005-05-24 | ピッチパターン生成方法及びその装置 |
US11/233,021 US20060271367A1 (en) | 2005-05-24 | 2005-09-23 | Pitch pattern generation method and its apparatus |
CNA200610080937XA CN1870130A (zh) | 2005-05-24 | 2006-05-23 | 音调模式生成方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151568A JP4738057B2 (ja) | 2005-05-24 | 2005-05-24 | ピッチパターン生成方法及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006330200A JP2006330200A (ja) | 2006-12-07 |
JP4738057B2 true JP4738057B2 (ja) | 2011-08-03 |
Family
ID=37443775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005151568A Expired - Fee Related JP4738057B2 (ja) | 2005-05-24 | 2005-05-24 | ピッチパターン生成方法及びその装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060271367A1 (ja) |
JP (1) | JP4738057B2 (ja) |
CN (1) | CN1870130A (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4056470B2 (ja) * | 2001-08-22 | 2008-03-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | イントネーション生成方法、その方法を用いた音声合成装置及びボイスサーバ |
US20130070911A1 (en) * | 2007-07-22 | 2013-03-21 | Daniel O'Sullivan | Adaptive Accent Vocie Communications System (AAVCS) |
KR101495410B1 (ko) * | 2007-10-05 | 2015-02-25 | 닛본 덴끼 가부시끼가이샤 | 음성 합성 장치, 음성 합성 방법 및 컴퓨터 판독가능 기억 매체 |
JP5275102B2 (ja) * | 2009-03-25 | 2013-08-28 | 株式会社東芝 | 音声合成装置及び音声合成方法 |
US9286886B2 (en) * | 2011-01-24 | 2016-03-15 | Nuance Communications, Inc. | Methods and apparatus for predicting prosody in speech synthesis |
US20130282844A1 (en) | 2012-04-23 | 2013-10-24 | Contact Solutions LLC | Apparatus and methods for multi-mode asynchronous communication |
US9635067B2 (en) | 2012-04-23 | 2017-04-25 | Verint Americas Inc. | Tracing and asynchronous communication network and routing method |
JP5821824B2 (ja) * | 2012-11-14 | 2015-11-24 | ヤマハ株式会社 | 音声合成装置 |
CN103714824B (zh) * | 2013-12-12 | 2017-06-16 | 小米科技有限责任公司 | 一种音频处理方法、装置及终端设备 |
WO2015120263A1 (en) | 2014-02-06 | 2015-08-13 | Contact Solutions LLC | Systems, apparatuses and methods for communication flow modification |
JP6520108B2 (ja) * | 2014-12-22 | 2019-05-29 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
US9166881B1 (en) | 2014-12-31 | 2015-10-20 | Contact Solutions LLC | Methods and apparatus for adaptive bandwidth-based communication management |
WO2017024248A1 (en) | 2015-08-06 | 2017-02-09 | Contact Solutions LLC | Tracing and asynchronous communication network and routing method |
US10063647B2 (en) | 2015-12-31 | 2018-08-28 | Verint Americas Inc. | Systems, apparatuses, and methods for intelligent network communication and engagement |
US10872598B2 (en) | 2017-02-24 | 2020-12-22 | Baidu Usa Llc | Systems and methods for real-time neural text-to-speech |
US10896669B2 (en) * | 2017-05-19 | 2021-01-19 | Baidu Usa Llc | Systems and methods for multi-speaker neural text-to-speech |
US10872596B2 (en) | 2017-10-19 | 2020-12-22 | Baidu Usa Llc | Systems and methods for parallel wave generation in end-to-end text-to-speech |
CN109992612B (zh) * | 2019-04-19 | 2022-03-04 | 吉林大学 | 一种汽车仪表板造型形态元素特征库的开发方法 |
CN111292720B (zh) * | 2020-02-07 | 2024-01-23 | 北京字节跳动网络技术有限公司 | 语音合成方法、装置、计算机可读介质及电子设备 |
CN113140230B (zh) * | 2021-04-23 | 2023-07-04 | 广州酷狗计算机科技有限公司 | 音符音高值的确定方法、装置、设备及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278943A (en) * | 1990-03-23 | 1994-01-11 | Bright Star Technology, Inc. | Speech animation and inflection system |
JPH0934492A (ja) * | 1995-07-25 | 1997-02-07 | Matsushita Electric Ind Co Ltd | ピッチパターン制御方法 |
US6081780A (en) * | 1998-04-28 | 2000-06-27 | International Business Machines Corporation | TTS and prosody based authoring system |
JP3583929B2 (ja) * | 1998-09-01 | 2004-11-04 | 日本電信電話株式会社 | ピッチパタン変形方法及びその記録媒体 |
US6260016B1 (en) * | 1998-11-25 | 2001-07-10 | Matsushita Electric Industrial Co., Ltd. | Speech synthesis employing prosody templates |
US7200558B2 (en) * | 2001-03-08 | 2007-04-03 | Matsushita Electric Industrial Co., Ltd. | Prosody generating device, prosody generating method, and program |
JP2002297175A (ja) * | 2001-03-29 | 2002-10-11 | Sanyo Electric Co Ltd | テキスト音声合成装置、テキスト音声合成方法及びプログラム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6829581B2 (en) * | 2001-07-31 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method for prosody generation by unit selection from an imitation speech database |
JP4056470B2 (ja) * | 2001-08-22 | 2008-03-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | イントネーション生成方法、その方法を用いた音声合成装置及びボイスサーバ |
JP3737788B2 (ja) * | 2002-07-22 | 2006-01-25 | 株式会社東芝 | 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム |
AU2003275134A1 (en) * | 2002-09-19 | 2004-04-08 | The Penn State Research Foundation | Prosody based audio/visual co-analysis for co-verbal gesture recognition |
JP2004117663A (ja) * | 2002-09-25 | 2004-04-15 | Matsushita Electric Ind Co Ltd | 音声合成システム |
JP2006309162A (ja) * | 2005-03-29 | 2006-11-09 | Toshiba Corp | ピッチパターン生成方法、ピッチパターン生成装置及びプログラム |
-
2005
- 2005-05-24 JP JP2005151568A patent/JP4738057B2/ja not_active Expired - Fee Related
- 2005-09-23 US US11/233,021 patent/US20060271367A1/en not_active Abandoned
-
2006
- 2006-05-23 CN CNA200610080937XA patent/CN1870130A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2006330200A (ja) | 2006-12-07 |
CN1870130A (zh) | 2006-11-29 |
US20060271367A1 (en) | 2006-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4738057B2 (ja) | ピッチパターン生成方法及びその装置 | |
US11990118B2 (en) | Text-to-speech (TTS) processing | |
JP4080989B2 (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
US10692484B1 (en) | Text-to-speech (TTS) processing | |
JP4551803B2 (ja) | 音声合成装置及びそのプログラム | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
US20040030555A1 (en) | System and method for concatenating acoustic contours for speech synthesis | |
JP2006309162A (ja) | ピッチパターン生成方法、ピッチパターン生成装置及びプログラム | |
JP4829477B2 (ja) | 声質変換装置および声質変換方法ならびに声質変換プログラム | |
JP2009047957A (ja) | ピッチパターン生成方法及びその装置 | |
JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
US8478595B2 (en) | Fundamental frequency pattern generation apparatus and fundamental frequency pattern generation method | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP3737788B2 (ja) | 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム | |
JP4417892B2 (ja) | 音声情報処理装置、音声情報処理方法および音声情報処理プログラム | |
JP6137708B2 (ja) | 定量的f0パターン生成装置、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
Huang et al. | Hierarchical prosodic pattern selection based on Fujisaki model for natural mandarin speech synthesis | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP3576792B2 (ja) | 音声情報処理方法 | |
JP2000047680A (ja) | 音声情報処理装置 | |
CN115798452A (zh) | 一种端到端语音拼接合成方法 | |
Wang | Tone Nucleus Model for Emotional Mandarin Speech Synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110426 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |