JP2008249808A - 音声合成装置、音声合成方法及びプログラム - Google Patents
音声合成装置、音声合成方法及びプログラム Download PDFInfo
- Publication number
- JP2008249808A JP2008249808A JP2007087857A JP2007087857A JP2008249808A JP 2008249808 A JP2008249808 A JP 2008249808A JP 2007087857 A JP2007087857 A JP 2007087857A JP 2007087857 A JP2007087857 A JP 2007087857A JP 2008249808 A JP2008249808 A JP 2008249808A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- sequence
- segment
- data acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 49
- 230000002194 synthesizing effect Effects 0.000 title 1
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 52
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 52
- 238000011156 evaluation Methods 0.000 claims abstract description 35
- 238000001308 synthesis method Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】音声合成部4は、高速記憶媒体42と低速記憶媒体44を備え、第1の音声素片記憶部43と音声素片属性情報記憶部46が高速記憶媒体42に配置され、第2の音声素片記憶部45が低速記憶媒体44に配置されている。素片選択部47は、音声素片データ取得に関する制約と、音声素片系列に含まれる音声素片に対する音声素片データ取得に関する統計量とに基づいて決まる、音声素片系列の評価値に対するペナルティ係数を、ある合成単位の時点で展開されている音声素片系列候補のそれぞれに対して算出し、評価値とペナルティ係数を用いて、音声素片系列候補の中から適切な候補を選択する。
【選択図】図2
Description
C1(ui,ui−1,ti)={log(f(vi))−log(f(ti))}2 …(1)
ここで、viは、音声素片uiの素片環境を表し、fは、素片環境viから平均基本周波数を取り出す関数を表す。
次に、音韻継続時間長コストは、以下の数式(2)によって算出することができる。
C2(ui,ui−1,ti)={g(vi)−g(ti)}2 …(2)
ここで、gは、素片環境viから音声継続時間長を取り出す関数を表す。
音韻環境コストは、以下の数式(3)によって算出することができる。
C3(ui,ui−1,ti)=Σrj・d(p(vi,j)−p(ti,j)) …(3)
ここで、Σがrj・d(p(vi,j)−p(ti,j))について総和をとるjの範囲は、j=−2〜2(jは整数)である。jは、対象音素に対する音素の相対位置を表し、pは、素片環境viから相対位置jの隣接音素を取り出す関数を表し、dは、2つの音素間の距離(音素間の特徴の違い)を算出する関数を表し、rjは、相対位置jに対する音素間距離の重みを表す。dは、「0」から「1」の値を返し、同一の音素間では「0」、全く特徴の異なる音素間では「1」を返す。
C4(ui,ui−1,ti)=||hpre(ui)−hpost(ui−1)|| …(4)
ここで、||・||は、ノルムを表す。hpreは、音声素片uiの前側の接続境界でのケプストラム係数を表し、hpostは、音声素片ui後側の接続境界でのケプストラム係数をベクトルとして取り出す関数を表す。
ここで、Σがwn・Cn(ui,ui−1,ti)について総和をとるnの範囲は、n=1〜N(nは整数)である。wnは、サブコスト間の重みを表す。
TC=Σ(C(ui,ui−1,ti))P …(6)
ここで、Σが(C(ui,ui−1,ti))Pについて総和をとるiの範囲は、i=1〜I(iは整数)である。Pは定数である。
また、本実施形態は、コンピュータに所定の手順を実行させるための、あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるためのプログラムとして実施することもできる。加えて該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
Claims (21)
- データ取得速度の異なる複数の記憶媒体を用いて構成され、かつ、複数の音声素片を該複数の記憶媒体に振り分けて記憶するように構成された音声素片記憶部と、
前記音声素片の各々が前記記憶媒体のいずれに記憶されているかを示す配置情報を記憶する情報記憶部と、
目標音声に対する音韻系列を合成単位で区切った第1のセグメント列をもとに、前記音声素片を組み合わせて、該第1のセグメント列に対する第1の音声素片列を複数生成し、該第1の音声素片列のうちから、音声素片列を選択する選択部と、
前記音声素片系列に含まれる複数の音声素片のデータを前記配置情報に従って前記音声素片記憶部から取得し、合成音声を生成するために、該音声素片のデータを接続する接続部とを備え、
前記選択部は、前記第1のセグメント列の途中までの部分を抜き出した部分列である第2のセグメント列に対するW個(Wは予め定められた値)の第2の音声素片列をもとに、該第2のセグメント列に新たに前記第1のセグメント列中のセグメントを加えた部分列である第3のセグメント列に対する第3の音声素片列をW個以上生成する生成処理と、該第3の音声素片列のうちからW個を選択する選択処理とを、繰り返し行うものであり、
前記選択部は、前記選択処理において、前記第3の音声素片列の各々について、それぞれ、評価値を求めるとともに、前記第1の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得する際に満たすべきデータ取得の迅速性に関係する制約と、当該第3の音声素片系列に含まれる全音声素片の各々のデータがいずれの前記記憶媒体に記憶されているかに応じて定まる統計量とに基づいて、該評価値に対するペナルティ係数を求め、該ペナルティ係数で該評価値を修正し、前記第3の音声素片列うちから、修正された該評価値に従ってW個を選択することを特徴とする音声合成装置。 - 前記複数の記憶媒体には、データ取得速度の速い記憶媒体と、データ取得速度の遅い記憶媒体とがあり、
前記制約は、前記第1の音声素片系列に含まれる音声素片のデータを前記データ取得速度の遅い記憶媒体から取得する回数の上限値であり、前記統計量は、前記第3の音声素片系列に含まれる音声素片の個数のうち、前記データ取得速度の遅い記憶媒体に記憶されている音声素片の個数の割合であることを特徴とする請求項1に記載の音声合成装置。 - 前記複数の記憶媒体には、データ取得速度の速い記憶媒体と、データ取得速度の遅い記憶媒体とがあり、
前記制約は、前記第1の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得するのに要する時間の上限値であり、前記統計量は、前記第3の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得するのに要する時間の予測値であることを特徴とする請求項1に記載の音声合成装置。 - 前記ペナルティ係数は、前記統計量が前記制約から決まる閾値を超えると単調増加するものであることを特徴とする請求項1に記載の音声合成装置。
- 前記単調増加において、前記統計量の増加量に対する前記ペナルティ係数の増加量の傾きは、前記第1の音声素片系列に含まれる音声素片の個数に対する前記第3の音声素片系列に含まれる音声素片の個数の比率が高いほど、急になるものであることを特徴とする請求項4に記載の音声合成装置。
- 前記第3のセグメント列は、前記第2のセグメント列に対して、前記第1のセグメント列における該第2のセグメント列に対応する部分の次に位置する次セグメントを加えたものであることを特徴とする請求項1に記載の音声合成装置。
- 前記第3の音声素片列は、前記第2の音声素片列に対して、前記次セグメントに対応する音声素片を加えることによって生成されたものであることを特徴とする請求項6に記載の音声合成装置。
- データ取得速度の異なる複数の記憶媒体を用いて構成され、かつ、複数の音声素片を該複数の記憶媒体に振り分けて記憶するように構成された音声素片記憶部と、前記音声素片の各々が前記記憶媒体のいずれに記憶されているかを示す配置情報を記憶する情報記憶部と、選択部と、接続部とを備えた音声合成装置の音声合成方法であって、
前記選択部が、目標音声に対する音韻系列を合成単位で区切った第1のセグメント列をもとに、前記音声素片を組み合わせて、該第1のセグメント列に対する第1の音声素片列を複数生成し、該第1の音声素片列のうちから、音声素片列を選択する選択ステップと、
前記接続部が、前記音声素片系列に含まれる複数の音声素片のデータを前記配置情報に従って前記音声素片記憶部から取得し、合成音声を生成するために、該音声素片のデータを接続する接続ステップとを有し、
前記選択部は、前記選択ステップにおいて、前記第1のセグメント列の途中までの部分を抜き出した部分列である第2のセグメント列に対するW個(Wは予め定められた値)の第2の音声素片列をもとに、該第2のセグメント列に新たに前記第1のセグメント列中のセグメントを加えた部分列である第3のセグメント列に対する第3の音声素片列をW個以上生成する生成処理と、該第3の音声素片列のうちからW個を選択する選択処理とを、繰り返し行うものであり、
前記選択部は、前記選択処理において、前記第3の音声素片列の各々について、それぞれ、評価値を求めるとともに、前記第1の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得する際に満たすべきデータ取得の迅速性に関係する制約と、当該第3の音声素片系列に含まれる全音声素片の各々のデータがいずれの前記記憶媒体に記憶されているかに応じて定まる統計量とに基づいて、該評価値に対するペナルティ係数を求め、該ペナルティ係数で該評価値を修正し、前記第3の音声素片列うちから、修正された該評価値に従ってW個を選択することを特徴とする音声合成方法。 - 前記複数の記憶媒体には、データ取得速度の速い記憶媒体と、データ取得速度の遅い記憶媒体とがあり、
前記制約は、前記第1の音声素片系列に含まれる音声素片のデータを前記データ取得速度の遅い記憶媒体から取得する回数の上限値であり、前記統計量は、前記第3の音声素片系列に含まれる音声素片の個数のうち、前記データ取得速度の遅い記憶媒体に記憶されている音声素片の個数の割合であることを特徴とする請求項8に記載の音声合成方法。 - 前記複数の記憶媒体には、データ取得速度の速い記憶媒体と、データ取得速度の遅い記憶媒体とがあり、
前記制約は、前記第1の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得するのに要する時間の上限値であり、前記統計量は、前記第3の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得するのに要する時間の予測値であることを特徴とする請求項8に記載の音声合成方法。 - 前記ペナルティ係数は、前記統計量が前記制約から決まる閾値を超えると単調増加するものであることを特徴とする請求項8に記載の音声合成方法。
- 前記単調増加において、前記統計量の増加量に対する前記ペナルティ係数の増加量の傾きは、前記第1の音声素片系列に含まれる音声素片の個数に対する前記第3の音声素片系列に含まれる音声素片の個数の比率が高いほど、急になるものであることを特徴とする請求項11に記載の音声合成方法。
- 前記第3のセグメント列は、前記第2のセグメント列に対して、前記第1のセグメント列における該第2のセグメント列に対応する部分の次に位置する次セグメントを加えたものであることを特徴とする請求項8に記載の音声合成方法。
- 前記第3の音声素片列は、前記第2の音声素片列に対して、前記次セグメントに対応する音声素片を加えることによって生成されたものであることを特徴とする請求項13に記載の音声合成方法。
- 音声合成装置としてコンピュータを機能させるためのプログラムであって、
データ取得速度の異なる複数の記憶媒体を用いて構成され、かつ、複数の音声素片を該複数の記憶媒体に振り分けて記憶するように構成された音声素片記憶部と、
前記音声素片の各々が前記記憶媒体のいずれに記憶されているかを示す配置情報を記憶する情報記憶部と、
目標音声に対する音韻系列を合成単位で区切った第1のセグメント列をもとに、前記音声素片を組み合わせて、該第1のセグメント列に対する第1の音声素片列を複数生成し、該第1の音声素片列のうちから、音声素片列を選択する選択部と、
前記音声素片系列に含まれる複数の音声素片のデータを前記配置情報に従って前記音声素片記憶部から取得し、合成音声を生成するために、該音声素片のデータを接続する接続部とをコンピュータを実現させるためのものであるとともに、
前記選択部は、前記第1のセグメント列の途中までの部分を抜き出した部分列である第2のセグメント列に対するW個(Wは予め定められた値)の第2の音声素片列をもとに、該第2のセグメント列に新たに前記第1のセグメント列中のセグメントを加えた部分列である第3のセグメント列に対する第3の音声素片列をW個以上生成する生成処理と、該第3の音声素片列のうちからW個を選択する選択処理とを、繰り返し行うものであり、
前記選択部は、前記選択処理において、前記第3の音声素片列の各々について、それぞれ、評価値を求めるとともに、前記第1の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得する際に満たすべきデータ取得の迅速性に関係する制約と、当該第3の音声素片系列に含まれる全音声素片の各々のデータがいずれの前記記憶媒体に記憶されているかに応じて定まる統計量とに基づいて、該評価値に対するペナルティ係数を求め、該ペナルティ係数で該評価値を修正し、前記第3の音声素片列うちから、修正された該評価値に従ってW個を選択することを特徴とするプログラム。 - 前記複数の記憶媒体には、データ取得速度の速い記憶媒体と、データ取得速度の遅い記憶媒体とがあり、
前記制約は、前記第1の音声素片系列に含まれる音声素片のデータを前記データ取得速度の遅い記憶媒体から取得する回数の上限値であり、前記統計量は、前記第3の音声素片系列に含まれる音声素片の個数のうち、前記データ取得速度の遅い記憶媒体に記憶されている音声素片の個数の割合であることを特徴とする請求項15に記載のプログラム。 - 前記複数の記憶媒体には、データ取得速度の速い記憶媒体と、データ取得速度の遅い記憶媒体とがあり、
前記制約は、前記第1の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得するのに要する時間の上限値であり、前記統計量は、前記第3の音声素片系列に含まれる全音声素片のデータを前記音声素片記憶部から取得するのに要する時間の予測値であることを特徴とする請求項15に記載のプログラム。 - 前記ペナルティ係数は、前記統計量が前記制約から決まる閾値を超えると単調増加するものであることを特徴とする請求項15に記載のプログラム。
- 前記単調増加において、前記統計量の増加量に対する前記ペナルティ係数の増加量の傾きは、前記第1の音声素片系列に含まれる音声素片の個数に対する前記第3の音声素片系列に含まれる音声素片の個数の比率が高いほど、急になるものであることを特徴とする請求項18に記載のプログラム。
- 前記第3のセグメント列は、前記第2のセグメント列に対して、前記第1のセグメント列における該第2のセグメント列に対応する部分の次に位置する次セグメントを加えたものであることを特徴とする請求項15に記載のプログラム。
- 前記第3の音声素片列は、前記第2の音声素片列に対して、前記次セグメントに対応する音声素片を加えることによって生成されたものであることを特徴とする請求項20に記載のプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087857A JP4406440B2 (ja) | 2007-03-29 | 2007-03-29 | 音声合成装置、音声合成方法及びプログラム |
US12/051,104 US8108216B2 (en) | 2007-03-29 | 2008-03-19 | Speech synthesis system and speech synthesis method |
CNA2008100963757A CN101276583A (zh) | 2007-03-29 | 2008-03-28 | 语音合成系统和语音合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087857A JP4406440B2 (ja) | 2007-03-29 | 2007-03-29 | 音声合成装置、音声合成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008249808A true JP2008249808A (ja) | 2008-10-16 |
JP4406440B2 JP4406440B2 (ja) | 2010-01-27 |
Family
ID=39974861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007087857A Expired - Fee Related JP4406440B2 (ja) | 2007-03-29 | 2007-03-29 | 音声合成装置、音声合成方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8108216B2 (ja) |
JP (1) | JP4406440B2 (ja) |
CN (1) | CN101276583A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009069596A1 (ja) * | 2007-11-28 | 2009-06-04 | Nec Corporation | 音声合成装置、音声合成方法及び音声合成プログラム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011025532A1 (en) * | 2009-08-24 | 2011-03-03 | NovaSpeech, LLC | System and method for speech synthesis using frequency splicing |
US9798653B1 (en) * | 2010-05-05 | 2017-10-24 | Nuance Communications, Inc. | Methods, apparatus and data structure for cross-language speech adaptation |
JP5106608B2 (ja) * | 2010-09-29 | 2012-12-26 | 株式会社東芝 | 読み上げ支援装置、方法、およびプログラム |
CN102592594A (zh) * | 2012-04-06 | 2012-07-18 | 苏州思必驰信息科技有限公司 | 基于统计参数模型的增量式语音在线合成方法 |
US9824681B2 (en) * | 2014-09-11 | 2017-11-21 | Microsoft Technology Licensing, Llc | Text-to-speech with emotional content |
JP2016080827A (ja) * | 2014-10-15 | 2016-05-16 | ヤマハ株式会社 | 音韻情報合成装置および音声合成装置 |
CN105895076B (zh) * | 2015-01-26 | 2019-11-15 | 科大讯飞股份有限公司 | 一种语音合成方法及系统 |
WO2017046904A1 (ja) * | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 音声処理装置、音声処理方法及び音声処理プログラム |
CN106970771B (zh) * | 2016-01-14 | 2020-01-14 | 腾讯科技(深圳)有限公司 | 音频数据处理方法和装置 |
US11120786B2 (en) * | 2020-03-27 | 2021-09-14 | Intel Corporation | Method and system of automatic speech recognition with highly efficient decoding |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6697780B1 (en) * | 1999-04-30 | 2004-02-24 | At&T Corp. | Method and apparatus for rapid acoustic unit selection from a large speech corpus |
US7369994B1 (en) * | 1999-04-30 | 2008-05-06 | At&T Corp. | Methods and apparatus for rapid acoustic unit selection from a large speech corpus |
JP2001282278A (ja) | 2000-03-31 | 2001-10-12 | Canon Inc | 音声情報処理装置及びその方法と記憶媒体 |
US7039588B2 (en) * | 2000-03-31 | 2006-05-02 | Canon Kabushiki Kaisha | Synthesis unit selection apparatus and method, and storage medium |
US6684187B1 (en) * | 2000-06-30 | 2004-01-27 | At&T Corp. | Method and system for preselection of suitable units for concatenative speech |
WO2005071663A2 (en) * | 2004-01-16 | 2005-08-04 | Scansoft, Inc. | Corpus-based speech synthesis based on segment recombination |
JP4424024B2 (ja) | 2004-03-16 | 2010-03-03 | 株式会社国際電気通信基礎技術研究所 | 素片接続型音声合成装置及び方法 |
DE602006003723D1 (de) * | 2006-03-17 | 2009-01-02 | Svox Ag | Text-zu-Sprache-Synthese |
JP2007264503A (ja) * | 2006-03-29 | 2007-10-11 | Toshiba Corp | 音声合成装置及びその方法 |
US7640161B2 (en) * | 2006-05-12 | 2009-12-29 | Nexidia Inc. | Wordspotting system |
-
2007
- 2007-03-29 JP JP2007087857A patent/JP4406440B2/ja not_active Expired - Fee Related
-
2008
- 2008-03-19 US US12/051,104 patent/US8108216B2/en not_active Expired - Fee Related
- 2008-03-28 CN CNA2008100963757A patent/CN101276583A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009069596A1 (ja) * | 2007-11-28 | 2009-06-04 | Nec Corporation | 音声合成装置、音声合成方法及び音声合成プログラム |
JP5446873B2 (ja) * | 2007-11-28 | 2014-03-19 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20090018836A1 (en) | 2009-01-15 |
CN101276583A (zh) | 2008-10-01 |
US8108216B2 (en) | 2012-01-31 |
JP4406440B2 (ja) | 2010-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP4080989B2 (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP4469883B2 (ja) | 音声合成方法及びその装置 | |
JP4551803B2 (ja) | 音声合成装置及びそのプログラム | |
JP4241762B2 (ja) | 音声合成装置、その方法、及びプログラム | |
US20060259303A1 (en) | Systems and methods for pitch smoothing for text-to-speech synthesis | |
JP2008033133A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP2007264503A (ja) | 音声合成装置及びその方法 | |
JP4639932B2 (ja) | 音声合成装置 | |
JP3728173B2 (ja) | 音声合成方法、装置および記憶媒体 | |
JP4225128B2 (ja) | 規則音声合成装置及び規則音声合成方法 | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
JP2009133890A (ja) | 音声合成装置及びその方法 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4648878B2 (ja) | 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体 | |
JP4829605B2 (ja) | 音声合成装置および音声合成プログラム | |
JP5106274B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP5177135B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP5275470B2 (ja) | 音声合成装置およびプログラム | |
JP4454780B2 (ja) | 音声情報処理装置とその方法と記憶媒体 | |
JPH06318094A (ja) | 音声規則合成装置 | |
WO2017028003A1 (zh) | 基于隐马尔科夫模型的语音单元拼接方法 | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091013 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091106 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121113 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121113 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131113 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |