JP5434587B2 - 音声合成装置及び方法とプログラム - Google Patents
音声合成装置及び方法とプログラム Download PDFInfo
- Publication number
- JP5434587B2 JP5434587B2 JP2009500164A JP2009500164A JP5434587B2 JP 5434587 B2 JP5434587 B2 JP 5434587B2 JP 2009500164 A JP2009500164 A JP 2009500164A JP 2009500164 A JP2009500164 A JP 2009500164A JP 5434587 B2 JP5434587 B2 JP 5434587B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- segment
- candidate
- change amount
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 106
- 230000015572 biosynthetic process Effects 0.000 title claims description 55
- 238000003786 synthesis reaction Methods 0.000 title claims description 55
- 230000008859 change Effects 0.000 claims description 282
- 238000004364 calculation method Methods 0.000 claims description 110
- 230000008569 process Effects 0.000 claims description 60
- 238000012545 processing Methods 0.000 claims description 51
- 238000001308 synthesis method Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 5
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 18
- 238000004590 computer program Methods 0.000 description 10
- 230000015556 catabolic process Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 241000665848 Isca Species 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Processing Or Creating Images (AREA)
Description
本発明は、音声合成技術に関し、特に、テキストから音声を合成するための音声合成装置及び方法とプログラムに関する。
該当・先行・後続の各音素名、
ストレスの有無、
アクセント核からの距離、
合成単位の代表点・始点・終点におけるピッチ周波数やパワー、
単位の継続時間長
が挙げられる。
上記した非特許文献7等に記載された音声合成装置は、下記記載の問題点を有している。
したがって、本発明は、上記課題に鑑みて創案されたものであって、その主たる目的は、合成音声の音質の不均一感を解消する装置、方法、プログラムを提供することにある。
前記素片選択部は、前記目標素片環境と前記候補素片の素片環境を基に、最適素片を検索する最適素片検索部と、
前記目標素片環境と前記候補素片の韻律情報を基に、各候補素片の韻律変更量を計算する韻律変更量計算部と、
前記韻律変更量を基に選択基準を計算する選択基準計算部と、
前記最適素片の中に前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片が存在した場合には、最適素片検索の再実行が必要であると判定する判定部と、
を有し、前記判定部は、最適素片検索の再実行が必要であると判定した場合、前記最適素片検索部が最適素片の再検索を実行する。
前記素片選択部は、前記目標素片環境と前記候補素片の韻律情報を基に、各候補素片の韻律変更量を計算する韻律変更量計算部と、
前記韻律変更量から選択基準を計算する選択基準計算部と、
前記目標素片環境と前記候補素片の素片環境を基に、各候補素片の単位コストを計算する単位コスト計算部と、
前記単位コストを基に候補素片の中から最適素片を検索する最適素片検索部と、
を有し、
前記単位コスト計算部は、
前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片の単位コストに対してペナルティを付与する。
前記韻律変更量と前記選択基準の相対関係に応じて前記ペナルティを決定する。
前記素片を選択する段階は、
候補素片の韻律変更量を基に定めた選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を選択対象から除外する。
前記素片を選択する段階は、
前記目標素片環境と前記候補素片の韻律情報を基に各候補素片の韻律変更量を計算する段階と、
前記韻律変更量を基に選択基準を計算する段階と、
前記韻律変更量と前記選択基準を基に選択候補の絞り込みを行う段階と、
前記絞り込まれた候補素片の中から最適素片を検索する段階と、
を有し、
前記選択候補の絞込みを行う段階は、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を、最適素片の検索対象から除外する。
目標素片環境と候補素片の素片環境を基に各候補素片のコストを計算する段階を有し、
前記コストに基づいて選択基準を計算する。
前記素片を選択する段階は、
前記目標素片環境と前記候補素片の素片環境を基に、最適素片を検索する段階と、
前記目標素片環境と前記候補素片の韻律情報を基に、各候補素片の韻律変更量を計算する段階と、
前記韻律変更量を基に選択基準を計算する段階と、
前記最適素片の中に前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片が存在した場合には、最適素片検索の再実行が必要であると判定する段階と、
を有し、
前記判定する段階が最適素片検索の再実行が必要であると判定した場合、前記最適素片を検索する段階が最適素片の再検索を実行する。
前記最適素片のみを対象に韻律変更量を計算する。
本発明において、前記最適素片を検索する段階は、
前記選択基準を満足しない素片を候補から外して、最適素片の再検索を実行する。
前記素片を選択する段階は、
前記目標素片環境と前記候補素片の韻律情報を基に、各候補素片の韻律変更量を計算する段階と、
前記韻律変更量から選択基準を計算する段階と、
前記目標素片環境と前記候補素片の素片環境を基に、各候補素片の単位コストを計算する段階と、
前記単位コストを基に候補素片の中から最適素片を検索する段階と、
を有し、
前記単位コストを計算する段階が、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片の単位コストに対してペナルティを付与する。
音声合成装置を構成するコンピュータに、目標素片環境に適した素片を候補素片の中から選択する処理を実行させるプログラムであって、
前記素片を選択する処理は、
候補素片の韻律変更量を基に定めた選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を選択対象から除外する処理、
を含む。
音声合成装置を構成するコンピュータに、目標素片環境に適した素片を候補素片の中から選択する処理を実行させるプログラムであって、
前記素片を選択する処理は、
前記目標素片環境と前記候補素片の韻律情報を基に各候補素片の韻律変更量を計算する処理と、
前記韻律変更量を基に選択基準を計算する処理と、
前記韻律変更量と前記選択基準を基に選択候補の絞り込みを行う処理と、
前記絞り込まれた候補素片の中から最適素片を検索する処理と、
を含み、
前記選択候補の絞り込みを行う処理は、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を、最適素片の検索対象から除外する処理を含む。
目標素片環境と候補素片の素片環境を基に各候補素片のコストを計算する処理を含み、
前記コストに基づいて選択基準を計算する処理を含む。
音声合成装置を構成するコンピュータに、目標素片環境に適した素片を候補素片の中から選択する処理を実行させるプログラムであって、
前記素片を選択する処理は、
前記目標素片環境と前記候補素片の素片環境を基に、最適素片を検索する処理と、
前記目標素片環境と前記候補素片の韻律情報を基に、各候補素片の韻律変更量を計算する処理と、
前記韻律変更量を基に選択基準を計算する処理と、
前記最適素片の中に前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片が存在した場合には、最適素片検索の再実行が必要であると判定する処理と、を含み、
前記判定する処理は、最適素片検索の再実行が必要であると判定した場合、前記最適素片を検索する処理が最適素片の再検索を実行する処理を含む。
前記最適素片のみを対象に韻律変更量を計算する処理を含む。
前記選択基準を満足しない素片を候補から外して、最適素片の再検索を実行する処理を含む。
音声合成装置を構成するコンピュータに、目標素片環境に適した素片を候補素片の中から選択する処理を実行させるプログラムであって、
前記素片を選択する処理は、
前記目標素片環境と前記候補素片の韻律情報を基に、各候補素片の韻律変更量を計算する処理と、
前記韻律変更量から選択基準を計算する処理と、
前記目標素片環境と前記候補素片の素片環境を基に、各候補素片の単位コストを計算する処理と、
前記単位コストを基に候補素片の中から最適素片を検索する処理と、
を含み、
前記単位コストを計算する処理が、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片の単位コストに対してペナルティを付与する処理を含む。
前記韻律変更量と前記選択基準の相対関係に応じて前記ペナルティを決定する処理を含む。
前記韻律変更量の平均値を基に選択基準を定める処理を含む。
前記韻律変更量を時間方向に平滑化した値を基に選択基準を定める処理を含む。
11 韻律生成部
12 単位コスト計算部
13 接続コスト計算部
14 最適素片検索部
15 音声素片情報記憶部
151 付属情報記憶部
152 音声素片記憶部
16、161、162、163 素片選択部
17 波形生成部
18 韻律制御部
19 波形接続部
20、31 韻律変更量計算部
21、32 選択基準計算部
22、30 候補選択部
33 判定部
40 単位コスト補正部
図1は、本発明の第1の実施例の構成を示す図である。図2は、本発明の第1の実施例の動作を説明するための流れ図である。
該当・先行・後続の各音素名、
アクセント核からの距離、
合成単位の代表点におけるピッチ周波数とパワー、
単位の継続時間長
で構成されるものと仮定する。
選択基準値の算出時に使用する韻律変更量の対象を選別する方法、つまり分析対象を選別する方法は複数存在する。
・単位コストを基準に分析対象を選別する方法、即ち、単位コストが所定の値を下回る候補素片の韻律変更量を分析対象とする方法や、
・各合成単位において単位コストが低い方からN個(優良上位N個)を分析対象とする方法も有効である。
選択基準を計算する上で必要な各合成単位の代表値を求める方法も、同様に複数存在する。
分析対象の平均値や、中央値、最良値
などの統計量である。
選択基準値の代表的な算出方法としては、
・平均値を計算する方法と、
・時間方向に平滑化する方法
が挙げられる。
アクセント句毎に選択基準を求める場合には、各アクセント句を構成する合成単位の代表値を、
それぞれ用いて算出する。
・移動平均や、
・一次リーク積分
などがあげられる。
γは、0<γ<1を満たす時定数であり、
L(-1)=0とする。
選択基準計算部21から供給される選択基準値と、
韻律変更量計算部20から供給される候補素片の韻律変更量と、
単位コスト計算部12から供給された各候補素片情報と、
その単位コストと、
を基に、候補素片の絞込みを行い、再選択された候補素片の情報とその単位コストを接続コスト計算部13に伝達する(ステップA6)。
選択基準をL(i)、
j番目の候補素片の韻律変更量をΔp(i,j)
としたときに、次式(10)又は(11)で得られる値ηが、閾値θを下回る場合には、その素片は選択候補から除外される。
候補選択部22における選択基準が予め決まっている場合や、
音声合成装置の外部から入力される場合、すなわち韻律変更量からの算出が不要である場合、
には、選択基準計算部21は不要となる。この場合、選択基準の計算に必要な演算量を削減できる。
図3は、本発明の第2の実施例の構成を示す図である。図4は、本発明の第2の実施例の動作を説明するための流れ図である。前記実施例1の構成を示した図1と、図3を比較すると、本実施例は、図1と以下の点が相違している。
(A)候補選択部22が候補選択部30に置き換えられている。
(B)韻律変更量計算部20が韻律変更量計算部31に置き換えられている。
(C)判定部33を新たに備えている。
(D)選択基準計算部21の代わりに、選択基準計算部32を備えている。
(E)図1では、接続コスト計算部13は、候補選択部22と最適素片検索部14の間に配置されているが、図3では、接続コスト計算部13は、単位コスト計算部12と候補選択部30との間に配置されており、単位コスト計算部12からの情報(候補素片の情報と、音声素片情報記憶部からの各音声素片の属性情報)を基に、接続コストを計算する。候補選択部30は、接続コスト計算部13からの出力と、判定部33の判定結果を基に、候補を絞り込む。
(F)また、図1では、最適素片検索部14は接続コスト計算部13に接続され、その出力は、波形生成部17の韻律制御部18に接続されているが、図3では、最適素片検索部14は候補選択部30に接続され、その出力は、判定部33と韻律変更量計算部31に接続されている。
最適素片検索部14から出力された最適素片と、
韻律生成部11から供給された韻律情報と、
音声素片情報記憶部15から供給された各最適素片の属性情報と、
を基に、各候補素片の韻律変更量を計算し、選択基準計算部32と判定部33へ伝達する(ステップB1)。
最適素片検索部14から供給された最適素片と、
韻律変更量計算部31から供給された各素片の韻律変更量と、
選択基準計算部32から供給された選択基準と、
を基に、
韻律変更量が他に比べて著しく小さい素片が存在するか否かを判定する(ステップB3)。
図5は、本発明の第3の実施例の構成を示す図である。図6は、本発明の第3の実施例の動作を説明するための流れ図である。前記実施例1の構成を示した図1と、図5とを比較すると、図1の候補選択部22が単位コスト補正部40に置き換えられている。これ以外の構成は、図1と同一である。
選択基準計算部21から供給される選択基準と、
韻律変更量計算部20から供給される候補素片の韻律変更量と、
単位コスト計算部12から供給された各候補素片情報と、
その単位コストと、
を基に、韻律変更量が他の素片と比較して小さい候補素片の単位コストを補正し、候補素片とその単位コストを接続コスト計算部13に伝達する(ステップC1)。
Claims (41)
- 目標素片環境に適した素片を候補素片の中から選択する素片選択部を有する音声合成装置であって、
前記素片選択部は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算し、前記候補素片の前記韻律変更量を基に定めた選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を、前記選択の対象から除外する、制御を行う、ことを特徴とする音声合成装置。 - 前記素片選択部は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する韻律変更量計算部と、
前記韻律変更量を基に、選択基準を計算する選択基準計算部と、
前記韻律変更量と前記選択基準とを基に、選択候補の絞り込みを行う候補選択部と、
前記絞り込まれた候補素片の中から、最適素片を検索する最適素片検索部と、
を有し、
前記候補選択部は、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を選択候補から外し、前記最適素片検索部での最適素片の検索対象から除外する、ことを特徴とする請求項1記載の音声合成装置。 - 前記選択基準計算部は、
前記目標素片環境と前記候補素片の素片環境とを基に、各候補素片のコストを計算するコスト計算部を有し、
前記コストに基づいて前記選択基準を計算する、ことを特徴とする請求項2に記載の音声合成装置。 - 前記素片選択部は、
前記目標素片環境と前記候補素片の素片環境とを基に、最適素片を検索する最適素片検索部と、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する韻律変更量計算部と、
前記韻律変更量を基に、選択基準を計算する選択基準計算部と、
前記最適素片の中に、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片が存在した場合には、最適素片の検索の再実行が必要であると判定する判定部と、
を有し、
前記判定部が最適素片の検索の再実行が必要であると判定した場合には、前記最適素片検索部が、最適素片の再検索を実行する、ことを特徴とする請求項1記載の音声合成装置。 - 前記韻律変更量計算部は、
前記最適素片のみを対象に韻律変更量を計算する、ことを特徴とする請求項4に記載の音声合成装置。 - 前記最適素片検索部は、
前記選択基準を満足しない素片を候補から外して、最適素片の再検索を実行する、ことを特徴とする請求項4又は5に記載の音声合成装置。 - 前記素片選択部は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する韻律変更量計算部と、
前記韻律変更量から、選択基準を計算する選択基準計算部と、
前記目標素片環境と前記候補素片の素片環境とを基に、各候補素片の単位コストを計算する単位コスト計算部と、
前記単位コストを基に、前記候補素片の中から最適素片を検索する最適素片検索部と、
を有し、
前記単位コスト計算部は、
前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片の単位コストに対してペナルティを付与する、ことを特徴とする請求項1記載の音声合成装置。 - 前記単位コスト計算部は、
前記韻律変更量と前記選択基準との相対関係に応じて、前記ペナルティを決定する、ことを特徴とする請求項7に記載の音声合成装置。 - 前記選択基準計算部は、
前記韻律変更量の平均値を基に前記選択基準を定める、ことを特徴とする請求項2〜8のいずれか一に記載の音声合成装置。 - 前記選択基準計算部は、
前記韻律変更量を時間方向に平滑化した値を基に前記選択基準を定める、ことを特徴とする請求項2〜8のいずれか一に記載の音声合成装置。 - 目標素片環境に適した素片を候補素片の中から選択する段階を有する音声合成方法であって、
前記素片を選択する段階は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算し、前記候補素片の前記韻律変更量を基に定めた選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を、前記選択の対象から除外する、制御を行う、ことを特徴とする音声合成方法。 - 前記素片を選択する段階は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する段階と、
前記韻律変更量を基に、選択基準を計算する段階と、
前記韻律変更量と前記選択基準を基に、選択候補の絞り込みを行う段階と、
前記絞り込まれた候補素片の中から、最適素片を検索する段階と、
を有し、
前記選択候補の絞込みを行う段階は、
前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を選択候補から外す、ことを特徴とする請求項11記載の音声合成方法。 - 前記選択基準を計算する段階は、
前記目標素片環境と前記候補素片の素片環境とを基に、各候補素片のコストを計算する段階を有し、
前記コストに基づいて前記選択基準を計算する、ことを特徴とする請求項12に記載の音声合成方法。 - 前記素片を選択する段階は、
前記目標素片環境と前記候補素片の素片環境とを基に、最適素片を検索する段階と、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する段階と、
前記韻律変更量を基に選択基準を計算する段階と、
前記最適素片の中に前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片が存在した場合には、最適素片検索の再実行が必要であると判定する段階と、
を有し、
前記判定する段階が最適素片検索の再実行が必要であると判定した場合には、前記最適素片を検索する段階が、最適素片の再検索を実行する、ことを特徴とする請求項11記載の音声合成方法。 - 前記韻律変更量を計算する段階は、
前記最適素片のみを対象に韻律変更量を計算する、ことを特徴とする請求項14に記載の音声合成方法。 - 前記最適素片を検索する段階は、
前記選択基準を満足しない素片を候補から外して、最適素片の再検索を実行する、ことを特徴とする請求項14又は15に記載の音声合成方法。 - 前記素片を選択する段階は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する段階と、
前記韻律変更量から選択基準を計算する段階と、
前記目標素片環境と前記候補素片の素片環境とを基に、各候補素片の単位コストを計算する段階と、
前記単位コストを基に前記候補素片の中から最適素片を検索する段階と、
を有し、
前記単位コストを計算する段階は、
前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片の単位コストに対してペナルティを付与する、ことを特徴とする請求項11記載の音声合成方法。 - 前記単位コストを計算する段階は、
前記韻律変更量と前記選択基準の相対関係に応じて前記ペナルティを決定する、ことを特徴とする請求項17に記載の音声合成方法。 - 前記選択基準を計算する段階は、
前記韻律変更量の平均値を基に前記選択基準を定める、ことを特徴とする請求項12〜18のいずれか一に記載の音声合成方法。 - 前記選択基準を計算する段階は、
前記韻律変更量を時間方向に平滑化した値を基に前記選択基準を定める、ことを特徴とする請求項12〜18のいずれか一に記載の音声合成方法。 - 音声合成装置を構成するコンピュータに、
目標素片環境に適した素片を候補素片の中から選択する処理を実行させるプログラムであって、
前記素片を選択する処理は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算し、前記候補素片の前記韻律変更量を基に定めた選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を、前記選択の対象から除外する、制御を行う処理を含む、ことを特徴とするプログラム。
- 前記素片を選択する処理は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する処理と、
前記韻律変更量を基に、選択基準を計算する処理と、
前記韻律変更量と前記選択基準とを基に、選択候補の絞り込みを行う処理と、
前記絞り込まれた候補素片の中から、最適素片を検索する処理と、
を含み、
前記選択候補の絞り込みを行う処理は、
前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片を選択候補から外す処理を含む、ことを特徴とする請求項21記載のプログラム。 - 前記選択基準を計算する処理が、
目標素片環境と候補素片の素片環境を基に各候補素片のコストを計算する処理を含み、
前記コストに基づいて前記選択基準を計算する処理を含む、ことを特徴とする請求項22に記載のプログラム。 - 前記素片を選択する処理は、
前記目標素片環境と前記候補素片の素片環境とを基に、最適素片を検索する処理と、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する処理と、
前記韻律変更量を基に選択基準を計算する処理と、
前記最適素片の中に前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片が存在した場合には、最適素片検索の再実行が必要であると判定する処理と、
を含み、
前記判定する処理は、最適素片検索の再実行が必要であると判定した場合、前記最適素片を検索する処理が最適素片の再検索を実行する処理を含む、ことを特徴とする請求項21記載のプログラム。 - 前記韻律変更量を計算する処理が、
前記最適素片のみを対象に韻律変更量を計算する処理を含む、ことを特徴とする請求項24に記載のプログラム。 - 前記最適素片を検索する処理が、
前記選択基準を満足しない素片を候補から外して、最適素片の再検索を実行する処理を含む、ことを特徴とする請求項24又は25に記載のプログラム。 - 前記素片を選択する処理は、
前記目標素片環境と前記候補素片の韻律情報とを基に、各候補素片の韻律変更量を計算する処理と、
前記韻律変更量から、選択基準を計算する処理と、
前記目標素片環境と前記候補素片の素片環境とを基に、各候補素片の単位コストを計算する処理と、
前記単位コストを基に候補素片の中から最適素片を検索する処理と、
を含み、
前記単位コストを計算する処理が、前記選択基準との大小関係が予め定められた所定の関係にある韻律変更量を有する素片の単位コストに対してペナルティを付与する処理を含む、
ことを特徴とする請求項21記載のプログラム。 - 前記単位コストを計算する処理が、
前記韻律変更量と前記選択基準の相対関係に応じて前記ペナルティを決定する処理を含む、ことを特徴とする請求項27に記載のプログラム。 - 前記選択基準を計算する処理が、
前記韻律変更量の平均値を基に前記選択基準を定める処理を含む、ことを特徴とする請求項22〜28のいずれか一に記載のプログラム。 - 前記選択基準を計算する処理が、
前記韻律変更量を時間方向に平滑化した値を基に前記選択基準を定める処理を含む、ことを特徴とする請求項22〜28のいずれか一に記載のプログラム。 - 請求項21〜30のいずれか一に記載のプログラムを記録した記録媒体。
- 請求項2記載の音声合成装置において、
前記候補選択部で用いる選択基準を予め決めておくか、前記音声合成装置の外部から入力される構成とされ、前記選択基準計算部で前記韻律変更量を基に選択基準を計算することを要しなくしてなる、音声合成装置。 - 請求項1、2、4、7のいずれか一に記載の音声合成装置において、
前記選択基準と前記韻律変更量の大小関係に関する前記予め定められた所定の関係は、前記韻律変更量が前記選択基準よりも小である、ことを特徴とする音声合成装置。 - 請求項11、12、14、17のいずれか一に記載の音声合成方法において、
前記選択基準と前記韻律変更量の大小関係に関する前記予め定められた所定の関係は、前記韻律変更量が前記選択基準よりも小である、ことを特徴とする音声合成方法。 - 請求項21、22、24、27のいずれか一に記載のプログラムにおいて、
前記選択基準と前記韻律変更量の大小関係に関する前記予め定められた所定の関係は、前記韻律変更量が前記選択基準よりも小である、ことを特徴とするプログラム。 - 請求項1記載の音声合成装置において、前記素片選択部に加え、
テキスト文からその読みを表す記号列と、形態素の品詞、活用、アクセント情報を含む言語処理結果を生成する言語処理部と、
前記言語処理結果を基に生成された合成音声の韻律情報を生成する韻律生成部と、
前記素片選択部で選択された音声素片から、前記韻律生成部で生成した韻律を有する波形を生成する韻律制御部と、
前記韻律制御部から出力された音声素片を接続し、合成音声として出力する波形接続部と、
合成単位に分割された音声素片と、各音声素片の属性情報を記憶した音声素片情報記憶部と、
をさらに備え、
前記素片選択部は、
前記言語処理部で生成された前記言語処理結果と、前記韻律生成部で生成された韻律情報と、を受け取り、前記目標素片環境を、合成単位ごとに生成し、前記音声素片情報記憶部から、前記目標素片環境によって指定される情報に合致する音声素片を候補素片として複数選択し、前記候補素片の素片環境と前記目標素片環境と、を基に、各候補素片の単位コストを計算する単位コスト計算部と、
前記韻律情報と複数の候補素片の前記単位コストと、前記音声素片情報記憶部からの各音声素片の属性情報と、を基に、前記候補素片の韻律変更量を計算する韻律変更量計算部と、
前記各候補素片の韻律変更量を基に、候補素片の絞り込みを行うために必要な候補の選択基準を計算する選択基準計算部と、
前記選択基準計算部からの前記選択基準と、前記韻律変更量計算部からの前記韻律変更量と、前記単位コスト計算部からの各候補素片の情報と前記単位コストと、を基に、候補素片の絞込みを行い、その際、前記単位コストが相対的に低い候補素片の中から、前記選択基準を元に、前記韻律変更量が他に比べて小さい素片を候補から除外し、該絞込みで選択された候補素片の情報とその単位コストを出力する候補選択部と、
前記各候補素片の情報と、前記音声素片情報記憶部からの各音声素片の属性情報とを基に、前記各候補素片の接続コストを計算する接続コスト計算部と、
前記候補素片の情報と前記単位コスト及び前記接続コストを基に、前記単位コストと前記接続コストに関する目的関数を最適化する音声素片系列である最適素片系列を求め、前記韻律制御部に供する最適素片検索部と、
を備えている、ことを特徴とする音声合成装置。 - 請求項1記載の音声合成装置において、前記素片選択部に加え、
テキスト文からその読みを表す記号列と、形態素の品詞、活用、アクセント情報を含む言語処理結果を生成する言語処理部と、
前記言語処理結果を基に生成された合成音声の韻律情報を生成する韻律生成部と、
前記素片選択部で選択された音声素片から、前記韻律生成部で生成した韻律を有する波形を生成する韻律制御部と、
前記韻律制御部から出力された音声素片を接続し、合成音声として出力する波形接続部と、
合成単位に分割された音声素片と、各音声素片の属性情報を記憶した音声素片情報記憶部と、
をさらに備え、
前記素片選択部は、
前記言語処理部で生成された前記言語処理結果と、前記韻律生成部で生成された前記韻律情報と、を受け取り、前記目標素片環境を、合成単位ごとに生成し、前記音声素片情報記憶部から、前記目標素片環境によって指定される情報に合致する音声素片を候補素片として複数選択し、前記候補素片の素片環境と前記目標素片環境とを基に、各候補素片の単位コストを計算する単位コスト計算部と、
前記各候補素片の情報と、前記音声素片情報記憶部からの各音声素片の属性情報を基に、前記各候補素片の接続コストを計算する接続コスト計算部と、
前記各候補素片の情報と前記単位コストと前記接続コストを基に、候補素片の絞込みを行い、該絞込みで選択された候補素片の情報とその単位コストを出力する候補選択部と、
前記候補素片の情報と、前記単位コスト、及び前記接続コストを基に、前記単位コストと前記接続コストに関する目的関数を最適化する音声素片系列である最適素片系列を求め、前記韻律制御部に供する最適素片検索部と、
前記最適素片検索部から出力された最適素片系列の各素片と、前記韻律生成部からの韻律情報と、前記音声素片情報記憶部からの前記最適素片系列の各素片の属性情報と、を基に、該最適素片系列の各素片の韻律変更量を計算する韻律変更量計算部と、
前記韻律変更量計算部からの前記最適素片系列の各素片の韻律変更量を基に、韻律変更量が他と比べて著しく小さい素片の存在を判別するために必要な選択基準を計算する選択基準計算部と、
前記最適素片検索部からの前記最適素片系列の各素片と、前記韻律変更量計算部からの前記最適素片系列の各素片の韻律変更量と、前記選択基準計算部から供給された選択基準と、を基に、韻律変更量が他に比べて著しく小さい素片が存在するか否かを判定し、
韻律変更量が他に比べて著しく小さい素片が存在すると判定された場合に、前記韻律変更量が著しく小さい素片を前記候補選択部へ供給して、前記候補選択部からの候補素片の再検索を行い、韻律変更量が他に比べて著しく小さい素片が存在しないと判定された場合、又は、前記再検索の回数が上限を上回った場合に、前記最適素片系列の各素片を前記韻律制御部に供給する制御を行う判定部と、
を備え、
前記候補選択部は、前記接続コスト計算部から供給された前記候補素片の中から、前記判定部から供給された素片を候補から除外し、除外されなかった候補素片と該候補素片の単位コスト及び接続コストを前記最適素片検索部に供給する、ことを特徴とする請求項1記載の音声合成装置。 - 請求項1記載の音声合成装置において、前記素片選択部に加え、
テキスト文からその読みを表す記号列と、形態素の品詞、活用、アクセント情報を含む言語処理結果を生成する言語処理部と、
前記言語処理結果を基に生成された合成音声の韻律情報を生成する韻律生成部と、
前記素片選択部で選択された音声素片から、前記韻律生成部で生成した韻律を有する波形を生成する韻律制御部と、
前記韻律制御部から出力された音声素片を接続し、合成音声として出力する波形接続部と、
合成単位に分割された音声素片と、各音声素片の属性情報を記憶した音声素片情報記憶部と、
をさらに備え、
前記素片選択部は、
前記言語処理部で生成された前記言語処理結果と、前記韻律生成部で生成された前記韻律情報を受け取り、前記目標素片環境を、合成単位ごとに生成し、前記音声素片情報記憶部から、前記目標素片環境によって指定される情報に合致する音声素片を候補素片として複数選択し、前記候補素片の素片環境と前記目標素片環境を基に、各候補素片の単位コストを計算する単位コスト計算部と、
前記韻律情報と、複数の前記候補素片の各々の前記単位コストと、前記音声素片情報記憶部からの各音声素片の属性情報と、を基に、前記候補素片の韻律変更量を計算する韻律変更量計算部と、
前記各候補素片の韻律変更量を基に、候補素片の絞り込みを行うために必要な候補の選択基準を計算する選択基準計算部と、
前記選択基準計算部からの前記選択基準と、前記韻律変更量計算部から供給される候補素片の前記韻律変更量と、前記単位コスト計算部から供給された各候補素片の情報と前記単位コストと、を基に、前記韻律変更量が他の素片と比較して小さい候補素片の単位コストを補正し、候補素片と単位コストを出力する単位コスト補正部と、
前記各候補素片の情報と、前記音声素片情報記憶部からの各音声素片の前記属性情報と、を基に、各候補素片の接続コストを計算する接続コスト計算部と、
前記候補素片の情報と、前記単位コスト、及び前記接続コストを基に、前記単位コストと前記接続コストに関する目的関数を最適化する音声素片系列である最適素片系列を求め、前記韻律制御部に供する最適素片検索部と、
を備えている、ことを特徴とする請求項1記載の音声合成装置。 - 前記素片を選択する段階は、
(A)テキスト文から生成された読みを表す記号列と、形態素の品詞、活用、アクセント情報を含む言語処理結果と、前記言語処理結果を基に生成された合成音声の韻律情報と、から、目標素片環境を合成単位ごとに生成し、
(B)合成単位に分割された音声素片と、各音声素片の属性情報を記憶した音声素片情報記憶部から、前記目標素片環境により指定される情報に合致する音声素片を、候補素片として複数選択し、
(C)前記候補素片の素片環境と前記目標素片環境を基に、各候補素片の単位コストを計算し、
(D)前記韻律情報と、複数の候補素片の各々の前記単位コストと、前記音声素片情報記憶部からの各音声素片の属性情報を基に、前記候補素片の韻律変更量を計算し、
(E)前記各候補素片の韻律変更量を基に、候補素片の絞り込みを行うために必要な候補の選択基準を計算し、
(F)前記選択基準と、候補素片の前記韻律変更量と、各候補素片の情報と前記単位コストと、を基に、候補素片の絞込みを行い、その際、前記単位コストが相対的に低い候補素片の中から、前記選択基準を元に、韻律変更量が他に比べて小さい素片を、候補から除外し、該絞込みで選択された候補素片の情報とその単位コストを出力し、
(G)候補素片の情報と、前記音声素片情報記憶部からの前記各音声素片の属性情報を基に、各候補素片の接続コストを計算し、
(H)前記候補素片の情報と、前記単位コスト、及び前記接続コストを基に、前記単位コストと前記接続コストに関する目的関数を最適化する音声素片系列である最適素片系列を求め、韻律制御に供する、
上記各段階を含む、ことを特徴とする請求項11記載の音声合成方法。 - 前記素片を選択する段階は、
(A)テキスト文から生成された読みを表す記号列と、形態素の品詞、活用、アクセント情報を含む言語処理結果と、前記言語処理結果を基に生成された合成音声の韻律情報から、目標素片環境を、合成単位ごとに生成し、
(B)合成単位に分割された音声素片と、各音声素片の属性情報を記憶した音声素片情報記憶部から、前記目標素片環境により指定される情報に合致する音声素片を、候補素片として複数選択し、
(C)前記候補素片の素片環境と前記目標素片環境を基に、各候補素片の単位コストを計算し、
(D)前記候補素片の情報と、前記音声素片情報記憶部からの各音声素片の属性情報を基に、各候補素片の接続コストを計算し、
(E)候補選択段階として、各候補素片の情報と単位コストと接続コストを基に、候補素片の絞込みを行い、該絞込みで選択された候補素片の情報とその単位コストを出力し、
(F)最適素片検索段階として、前記候補素片の情報と、単位コスト、及び接続コストを基に、前記単位コストと前記接続コストに関する目的関数を最適化する音声素片系列である最適素片系列を求め、韻律制御に供し、
(H)前記最適素片系列の各素片と、前記韻律情報と、前記音声素片情報記憶部からの前記最適素片系列の各素片の属性情報と、を基に、該最適素片系列の各素片の韻律変更量を計算し、
(I)前記最適素片系列の各素片の韻律変更量を基に、韻律変更量が他と比べて著しく小さい素片の存在を判別するために必要な選択基準を計算し、
(J)判定段階として、前記最適素片系列の各素片と、前記最適素片系列の各素片の前記韻律変更量と、前記選択基準と、を基に、韻律変更量が他に比べて著しく小さい素片が存在するか否かを判定し、韻律変更量が他に比べて著しく小さい素片が存在すると判定された場合には、韻律変更量が著しく小さい素片を、前記(E)の候補選択段階へ供給して、候補素片の再検索を行い、
韻律変更量が他に比べて著しく小さい素片が存在しないと判定された場合、又は、前記再検索の回数が上限を上回った場合に、前記最適素片系列の各素片を前記韻律制御に供給し、
前記(E)の候補選択段階では、候補素片の中から、前記判定段階より供給された素片を候補から除外し、除外されなかった候補素片と該候補素片の単位コスト及び接続コストを、前記(F)の最適素片検索段階に供給する、
上記各段階を含む、ことを特徴とする請求項11記載の音声合成方法。 - 前記素片を選択する段階は、
(A)テキスト文から生成された読みを表す記号列と、形態素の品詞、活用、アクセント情報を含む言語処理結果と、前記言語処理結果を基に生成された合成音声の韻律情報と、から、目標素片環境を合成単位ごとに生成し、
(B)合成単位に分割された音声素片と、各音声素片の属性情報を記憶した音声素片情報記憶部から、前記目標素片環境により指定される情報に合致する音声素片を、候補素片として複数選択し、
(C)前記候補素片の素片環境と前記目標素片環境を基に、各候補素片の単位コストを計算し、
(D)前記韻律情報と、複数の候補素片の各々の前記単位コストと、前記音声素片情報記憶部からの各音声素片の属性情報を基に、前記候補素片の韻律変更量を計算し、
(E)各候補素片の韻律変更量を基に、候補素片の絞り込みを行うために必要な候補の選択基準を計算し、
(F)前記選択基準と、各候補素片の前記韻律変更量と候補素片の情報と前記単位コストと、を基に、韻律変更量が他の素片と比較して小さい候補素片の単位コストを補正し、候補素片と単位コストを出力し、
(G)候補素片の情報と、前記音声素片情報記憶部からの各音声素片の属性情報を基に、各候補素片の接続コストを計算し、
(H)前記候補素片の情報と、前記単位コスト、及び前記接続コストを基に、前記単位コストと前記接続コストに関する目的関数を最適化する音声素片系列である最適素片系列を求め、韻律制御に供する、
上記各段階を含む、ことを特徴とする請求項11記載の音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009500164A JP5434587B2 (ja) | 2007-02-20 | 2008-02-15 | 音声合成装置及び方法とプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007039622 | 2007-02-20 | ||
JP2007039622 | 2007-02-20 | ||
JP2009500164A JP5434587B2 (ja) | 2007-02-20 | 2008-02-15 | 音声合成装置及び方法とプログラム |
PCT/JP2008/052574 WO2008102710A1 (ja) | 2007-02-20 | 2008-02-15 | 音声合成装置及び方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008102710A1 JPWO2008102710A1 (ja) | 2010-05-27 |
JP5434587B2 true JP5434587B2 (ja) | 2014-03-05 |
Family
ID=39709987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009500164A Expired - Fee Related JP5434587B2 (ja) | 2007-02-20 | 2008-02-15 | 音声合成装置及び方法とプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8630857B2 (ja) |
JP (1) | JP5434587B2 (ja) |
CN (1) | CN101617359B (ja) |
WO (1) | WO2008102710A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5177135B2 (ja) * | 2007-05-08 | 2013-04-03 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
JP5238205B2 (ja) * | 2007-09-07 | 2013-07-17 | ニュアンス コミュニケーションズ,インコーポレイテッド | 音声合成システム、プログラム及び方法 |
JP5198200B2 (ja) * | 2008-09-25 | 2013-05-15 | 株式会社東芝 | 音声合成装置及び方法 |
US9761219B2 (en) * | 2009-04-21 | 2017-09-12 | Creative Technology Ltd | System and method for distributed text-to-speech synthesis and intelligibility |
JP2011180368A (ja) * | 2010-03-01 | 2011-09-15 | Fujitsu Ltd | 合成音声修正装置および合成音声修正方法 |
JP5123347B2 (ja) * | 2010-03-31 | 2013-01-23 | 株式会社東芝 | 音声合成装置 |
JP5366919B2 (ja) * | 2010-12-07 | 2013-12-11 | 日本電信電話株式会社 | 音声合成方法、装置、及びプログラム |
JP6221301B2 (ja) * | 2013-03-28 | 2017-11-01 | 富士通株式会社 | 音声処理装置、音声処理システムおよび音声処理方法 |
JP6520108B2 (ja) * | 2014-12-22 | 2019-05-29 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263095A (ja) * | 1995-03-20 | 1996-10-11 | N T T Data Tsushin Kk | 音声素片選択方法および音声合成装置 |
JP2001092482A (ja) * | 1999-03-25 | 2001-04-06 | Matsushita Electric Ind Co Ltd | 音声合成システム、および音声合成方法 |
JP2004109535A (ja) * | 2002-09-19 | 2004-04-08 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
JP2004139033A (ja) * | 2002-09-25 | 2004-05-13 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
JP2004347653A (ja) * | 2003-05-20 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 |
JP2004354644A (ja) * | 2003-05-28 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 |
JP2005164749A (ja) * | 2003-11-28 | 2005-06-23 | Toshiba Corp | 音声合成方法、音声合成装置および音声合成プログラム |
JP2005292433A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6823309B1 (en) * | 1999-03-25 | 2004-11-23 | Matsushita Electric Industrial Co., Ltd. | Speech synthesizing system and method for modifying prosody based on match to database |
JP3728172B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
AU2001290882A1 (en) * | 2000-09-15 | 2002-03-26 | Lernout And Hauspie Speech Products N.V. | Fast waveform synchronization for concatenation and time-scale modification of speech |
US6978239B2 (en) * | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
TW556150B (en) * | 2002-04-10 | 2003-10-01 | Ind Tech Res Inst | Method of speech segment selection for concatenative synthesis based on prosody-aligned distortion distance measure |
JP4004376B2 (ja) * | 2002-10-02 | 2007-11-07 | 日本電信電話株式会社 | 音声合成装置、音声合成プログラム |
JP3854593B2 (ja) | 2003-09-16 | 2006-12-06 | 株式会社国際電気通信基礎技術研究所 | 音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム |
DE602005026778D1 (de) * | 2004-01-16 | 2011-04-21 | Scansoft Inc | Corpus-gestützte sprachsynthese auf der basis von segmentrekombination |
JP4328698B2 (ja) * | 2004-09-15 | 2009-09-09 | キヤノン株式会社 | 素片セット作成方法および装置 |
JP2006084854A (ja) * | 2004-09-16 | 2006-03-30 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
US20080177548A1 (en) * | 2005-05-31 | 2008-07-24 | Canon Kabushiki Kaisha | Speech Synthesis Method and Apparatus |
JP4425192B2 (ja) * | 2005-07-19 | 2010-03-03 | 日本電信電話株式会社 | 音声合成方法、装置、プログラム、および記録媒体 |
JP5177135B2 (ja) * | 2007-05-08 | 2013-04-03 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
JP5238205B2 (ja) * | 2007-09-07 | 2013-07-17 | ニュアンス コミュニケーションズ,インコーポレイテッド | 音声合成システム、プログラム及び方法 |
-
2008
- 2008-02-15 WO PCT/JP2008/052574 patent/WO2008102710A1/ja active Application Filing
- 2008-02-15 CN CN200880005607.1A patent/CN101617359B/zh not_active Expired - Fee Related
- 2008-02-15 US US12/527,802 patent/US8630857B2/en not_active Expired - Fee Related
- 2008-02-15 JP JP2009500164A patent/JP5434587B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263095A (ja) * | 1995-03-20 | 1996-10-11 | N T T Data Tsushin Kk | 音声素片選択方法および音声合成装置 |
JP2001092482A (ja) * | 1999-03-25 | 2001-04-06 | Matsushita Electric Ind Co Ltd | 音声合成システム、および音声合成方法 |
JP2004109535A (ja) * | 2002-09-19 | 2004-04-08 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
JP2004139033A (ja) * | 2002-09-25 | 2004-05-13 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
JP2004347653A (ja) * | 2003-05-20 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 |
JP2004354644A (ja) * | 2003-05-28 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 |
JP2005164749A (ja) * | 2003-11-28 | 2005-06-23 | Toshiba Corp | 音声合成方法、音声合成装置および音声合成プログラム |
JP2005292433A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008102710A1 (ja) | 2008-08-28 |
CN101617359A (zh) | 2009-12-30 |
US8630857B2 (en) | 2014-01-14 |
CN101617359B (zh) | 2012-01-18 |
JPWO2008102710A1 (ja) | 2010-05-27 |
US20100076768A1 (en) | 2010-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5434587B2 (ja) | 音声合成装置及び方法とプログラム | |
US8321208B2 (en) | Speech processing and speech synthesis using a linear combination of bases at peak frequencies for spectral envelope information | |
JP4738057B2 (ja) | ピッチパターン生成方法及びその装置 | |
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
CN101131818A (zh) | 语音合成装置与方法 | |
JP2010230699A (ja) | 音声合成装置、プログラム、及び方法 | |
JP2006309162A (ja) | ピッチパターン生成方法、ピッチパターン生成装置及びプログラム | |
US9805711B2 (en) | Sound synthesis device, sound synthesis method and storage medium | |
JP4639932B2 (ja) | 音声合成装置 | |
JP5512597B2 (ja) | 音声合成装置とその方法とプログラム | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP5177135B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2016065900A (ja) | 音声合成装置、方法、およびプログラム | |
JP4170819B2 (ja) | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 | |
JP5446873B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP4034751B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5158567B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP5020759B2 (ja) | 種々の音声合成装置のための素片データベース生成装置、方法及びプログラム | |
JP4167084B2 (ja) | 音声合成方法及び装置、並びに音声合成プログラム | |
JP5020763B2 (ja) | 音声合成のための決定木を生成する装置、方法及びプログラム | |
JP2007079019A (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
Rojc et al. | Gradient-descent based unit-selection optimization algorithm used for corpus-based text-to-speech synthesis | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5434587 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |