JP4869898B2 - 音声合成装置及び音声合成方法 - Google Patents

音声合成装置及び音声合成方法 Download PDF

Info

Publication number
JP4869898B2
JP4869898B2 JP2006332027A JP2006332027A JP4869898B2 JP 4869898 B2 JP4869898 B2 JP 4869898B2 JP 2006332027 A JP2006332027 A JP 2006332027A JP 2006332027 A JP2006332027 A JP 2006332027A JP 4869898 B2 JP4869898 B2 JP 4869898B2
Authority
JP
Japan
Prior art keywords
speech
pitch
speech unit
corrected
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006332027A
Other languages
English (en)
Other versions
JP2008145685A (ja
Inventor
正 山浦
訓 古田
貴弘 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006332027A priority Critical patent/JP4869898B2/ja
Publication of JP2008145685A publication Critical patent/JP2008145685A/ja
Application granted granted Critical
Publication of JP4869898B2 publication Critical patent/JP4869898B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Machine Translation (AREA)

Description

この発明は、任意の文章から人工的に音声信号を作り出す音声合成技術に関するものである。
任意の文章から人工的に音声信号を作り出すテキスト音声合成では、入力テキストに対して言語解析処理、韻律生成処理を行って得られる音韻記号や韻律情報(ピッチ、音韻継続時間長など)などの情報から音声信号を生成する。
その音声生成処理は、母音をV、子音をCで表した、CV、CVC、VCVといった基本となる小さな単位の特徴パラメータを音声素片として記憶しておき、これらを指定された音韻記号に従って選択的に読み出した後、その音韻記号に対応する韻律情報に従ってピッチや音韻継続時間長を制御して順次接続することにより、音声を合成するというものである。
このような音声生成処理において、音声素片のピッチや音韻継続時間長を制御して接続する際に、音声素片における音声波形のピッチ周期に対応する1周期毎の時間的基準位置を表現する情報として、あらかじめ音声素片を個別に分析して設定されたピッチマークを用いる。
従来の音声合成装置では、韻律生成処理を行って得られる韻律情報に従って生成される合成音声のピッチマークに、音声素片のあらかじめ設定されたピッチマークを合わせることにより、音声素片のピッチや音韻継続時間長の制御及び音声素片の接続を行っていた。(例えば、非特許文献1)。
F.J. Charpentier and M.G. Stella, "Diphone synthesis using an overlap-add technique for speech waveforms concatenation", ICASSP 86, pp. 2015-2018, Tokyo, 1986
従来の音声合成装置では、音声素片のピッチマークはあらかじめ音声素片を個別に分析して設定されているにすぎないため、合成の際の音声素片の接続が全く考慮されていないという問題があった。すなわち、音声素片を接続して合成音声を生成した際に、音声素片の接続点においてピッチ周期性が乱れるなどの不連続が発生し、合成音声品質が劣化する場合があるという問題があった。
例えば、第1の音声素片と第2の音声素片とを接続して合成音声を生成する場合、図4に示すように、第1の音声素片のピッチ波形におけるピッチマークと第2の音声素片のピッチ波形におけるピッチマークとの位置関係に齟齬があると、各音声素片のピッチマークを合成音声のピッチマークに合わせて合成音声を生成したときに、音声素片の接続部では、韻律生成によって与えられる本来所望のピッチ周期と得られた合成音声のピッチ周期とが異なってしまい、不連続音の発生など合成音声の品質劣化が起こっていた。
この発明は上記のような問題点を解決するためになされたもので、テキスト音声合成による合成音声の音質を効果的に向上させることができる音声合成装置及び音声合成方法を提供することを目的とする。
この発明に係る音声合成装置は、
音声素片における音声波形のピッチ周期に対応する1周期毎の時間的基準位置を表現するピッチマークが設定され、音韻記号・韻律情報が対応付けされた多数の音声素片格納され音声合成のため、入力テキストから得られた音韻記号が順次入力され、その音韻記号に基づいて対応する音声素片を順次出力する音声素片辞書と、
音声素片辞書から順次入力される、任意の位置の音声素片のピッチマークを元にこの音声素片に接続される音声素片のピッチマークを補正して、その補正された音声素片のピッチ波形と、音声素片のピッチマークの補正に用いた音声素片のピッチ波形の距離で補正結果を評価する処理を音声素片辞書から順次入力される複数の異なる位置の音声素片に対して行い、補正後の評価結果が最も良好な評価値による補正後の音声素片を基準音声素片とする決定し、この決定された基準音声素片のピッチマークを元にして、基準音声素片に接続される音声素片のピッチマークを補正し、次いで、この基準音声素片に接続される音声素片の補正されたピッチマークを元にして、この補正されたピッチマークの音声素片に接続される音声素片のピッチマークを補正する処理を順次行うピッチマーク補正手段と、
音声合成のため、入力テキストから得られ、入力された韻律情報に基づいて、上記ピッチマーク補正手段で補正されたピッチマークを用いて音声素片を順次接続して合成音声を生成する音声生成手段とを備える。
この発明に係る音声合成方法は、
音声合成のため、入力テキストから得られ、順次入力される音韻記号に基づいて、音声素片における音声波形のピッチ周期に対応する1周期毎の時間的基準位置を表現するピッチマークが設定され、音韻記号・韻律情報が対応付けされた多数の音声素片格納された音声素片辞書から、対応する音声素片を順次出力する工程と、
音声素片辞書から順次入力される、任意の位置の音声素片のピッチマークを元にこの音声素片に接続される音声素片のピッチマークを補正して、その補正された音声素片のピッチ波形と、音声素片のピッチマークの補正に用いた音声素片のピッチ波形の距離で補正結果を評価する処理を音声素片辞書から順次入力される複数の異なる位置の音声素片に対して行い、補正後の評価結果が最も良好な評価値による補正後の音声素片を基準音声素片とする決定し、この決定された基準音声素片のピッチマークを元にして、基準音声素片に接続される音声素片のピッチマークを補正し、次いで、この基準音声素片に接続される音声素片の補正されたピッチマークを元にして、この補正されたピッチマークの音声素片に接続される音声素片のピッチマークを補正する処理を順次行うピッチマーク補正工程と、
音声合成のため、入力テキストから得られ、入力された韻律情報に基づいて、上記ピッチマーク補正工程で補正されたピッチマークを用いて音声素片を順次接続して合成音声を生成する音声生成工程とを備える。
この発明の音声合成装置及び音声合成方法によれば、ピッチマークが設定された音声素片を格納した音声素片辞書が、少なくとも入力された音韻記号に基づいて音声素片を順次出力し、第1の音声素片のピッチマークを元にそれに接続する第2の音声素片のピッチマークをピッチマーク補正手段で補正し、少なくとも入力された韻律情報に基づいて、上記補正されたピッチマークを用いて音声素片を順次接続して合成音声を音声生成手段で生成するので、音声素片を接続して合成音声を生成した際に、音声素片の接続点においてピッチ周期性が乱れるなどの不連続を解消することができ、高品質な合成音声を得る効果がある。
実施の形態1.
図1は、この発明の実施の形態1による音声合成装置の構成を示す構成図である。
図において、音声合成装置1は、入力された音韻記号・韻律情報100に基づいて、合成音声200を生成する。
上記音声合成装置1は、音声素片辞書2、ピッチマーク補正手段3、音声生成手段4を備えている。音声素片辞書2は、ピッチマークが設定された多数の音声素片が格納されており、入力された音韻記号・韻律情報100に基づいて音声素片を選択して出力する。ピッチマーク補正手段3は、音声素片辞書2から出力された音声素片のピッチマークを補正し、当該ピッチマークを補正した音声素片を出力する。音声生成手段4は、入力された音韻記号・韻律情報100に基づいて、ピッチマーク補正手段3から出力された音声素片を順次接続して合成音声200を生成する。
次に、実施の形態1の動作について説明する。
図2は、音声合成装置の動作の流れを示すフローチャートである。
本実施の形態において、音声合成装置1に入力される音韻記号・韻律情報100は、例えば、音韻記号、ピッチ、音韻継続時間長、パワーなどの情報であり、例えば、テキスト音声合成のための入力テキストに対して言語解析処理、韻律生成処理を行って得られたものである。音声合成装置1には、入力テキストから得られた複数の音韻記号・韻律情報100が順次入力される。
上記のような音韻記号・韻律情報100が音声合成装置1に入力されると、音声素片辞書2は、入力された音韻記号・韻律情報100のうち少なくとも音韻記号の情報に従って音声素片を選択し、この選択した音声素片をピッチマーク補正手段3に出力する(ステップS1)。
次に、ピッチマーク補正手段3は、入力された音声素片のピッチマークを補正して、このピッチマークを補正した音声素片を音声生成手段4に出力する(ステップS2)。
ピッチマーク補正手段3におけるピッチマーク補正方法は、例えば、まず、先に音声生成手段4に出力したピッチマークを補正した第1の音声素片の終端のピッチ波形w1(p1+n)(n=−T/2,…,T/2)と、新たに音声素片辞書2から入力された第2の音声素片の始端近傍におけるピッチ波形w2(p2+n)(n=−T/2,…,T/2)とを抽出する。ここで、p1は第1の音声素片の補正されたピッチマークであり、p2は第2の音声素片のピッチマーク候補位置である。また、Tは、例えば次式(1)のように、第1の音声素片のピッチ周期T1および第2の音声素片のピッチ周期T2のうち、周期長の小さい方をTとする、などとして設定する。
Figure 0004869898
ただし、min(T1,T2)はT1,T2の中の最小値を表す関数である。
次に、ピッチマーク補正手段3は、第1の音声素片のピッチ波形w1と第2の音声素片のピッチ波形w2との距離に関する評価値を用いて第2の音声素片のピッチマークを補正する。
この実施の形態ではピッチ波形の距離に関する評価値として2つのピッチ波形の相互相関値Cを用い、2つのピッチ波形の相互相関値Cを求めて、相関値Cから第2の音声素片のピッチマークを補正する構成としている。
以下さらに詳しく説明する。次式(2)に示すように、第2の音声素片のピッチマーク候補点p2を順次変更して上記抽出した2つのピッチ波形の相互相関値Cを求め、Cが最大となるp2を求め、これを第2の音声素片の始端における補正したピッチマークとする。
Figure 0004869898
ただし、ピッチマーク候補点p2の探索範囲は、例えば第2の音声素片の始端からT2/2の位置ないし3T2/2の位置までなど、第2の音声素片の始端近傍に限定する。上記Cが最大となる第2の音声素片の始端におけるピッチマークp2を基準に、あらかじめ設定された第2の音声素片のピッチマークから得られるピッチ周期に従って、第2の音声素片全体に渡って補正したピッチマークを求める。
次に、音声生成手段4は、入力された音韻記号・韻律情報100に従って、合成音声のピッチマークを生成する。そして、上記ピッチマークを補正した音声素片のピッチ・継続時間長を制御し(ステップS3)、制御して得られた音声素片のピッチマークを合成音声のピッチマークに合わせて順次接続・合成する(ステップS4)。以上のステップS1からステップS4の処理を、入力テキストから得られた複数の音韻記号・韻律情報100が終了するまで繰り返して音声を生成し(ステップS5)、この音声を合成音声200として出力する。なお、上記ステップS2のピッチマークを補正する処理およびS4の音声素片を順次接続・合成する処理については、実際には、2つ目の音声素片の処理以降(接続すべき音声素片が存在する場合のみ)行われることになる。
以上のように、実施の形態1の音声合成装置によれば、ピッチマークが設定された音声素片を格納し、少なくとも入力された音韻記号に基づいて音声素片を順次出力する音声素片辞書と、第1の音声素片のピッチマークを元に第2の音声素片のピッチマークを補正するピッチマーク補正手段と、少なくとも入力された韻律情報に基づいて、上記補正されたピッチマークを用いて音声素片を順次接続して合成音声を生成する音声生成手段とを備えたので、音声素片を接続して合成音声を生成した際、図3に示すように、音声素片の接続点においてピッチ周期性が乱れるなどの不連続を解消することができ、高品質な合成音声を得る効果がある。
また、実施の形態1の音声合成装置によれば、少なくとも第1の音声素片のピッチ波形およびピッチマークと第2の音声素片のピッチ波形とに基づいて、第2の音声素片のピッチマークを補正するため、従来の音声合成装置における音声素片辞書内に既に格納されている情報のみを用いてピッチマークの補正が可能であり、従来の音声合成装置を基に小規模な変更で高品質な合成音声を得る効果がある。
また、実施の形態1の音声合成装置によれば、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との距離に関する評価値を用いて、評価値が最大あるいは最小となるときの第2の音声素片における第1の音声素片のピッチマークに対応する位置を、第2の音声素片の補正されたピッチマークとするため、単純な算術演算のみで明確にピッチマーク補正が可能であり、簡易に高品質な合成音声を得る効果がある。
また、実施の形態1の音声合成装置によれば、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との距離に関する評価値として、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との相関を用いて第2の音声素片のピッチマークを補正するため、第1の音声素片と第2の音声素片との接続部において合成音声のピッチ相関が高くなりピッチ周期性が乱れるなどの不連続を解消することができ、高品質な合成音声を得る効果がある。
実施の形態2.
実施の形態1では、順次入力される音韻記号・韻律情報100に従って、音声素片を選択し、ピッチマークを補正し、順次接続・合成して合成音声200を生成している。すなわち、入力される音韻記号・韻律情報100に対応する先頭の音声素片のピッチマークの補正は行わず、この先頭の音声素片のピッチマークを基準に以後の音声素片のピッチマークを補正しているが、これに代えて、音韻記号・韻律情報100の末尾より逆順に従って音声素片を選択し、末尾の音声素片のピッチマークの補正を行わず、この末尾の音声素片のピッチマークを基準にそれ以前の音声素片のピッチマークを補正しても良い。さらに、先頭・末尾にかかわらず任意の位置の音声素片を基準として、その基準とする音声素片のピッチマークの補正を行わず、それ以前及び以後の音声素片のピッチマークを順次補正しても良い。
このように構成することにより、例えばアクセント位置やパワーの大きい位置など主観的に重要な位置に対応する音声素片のピッチマークは補正しない、すなわち、音声素片辞書にて設定されている本来正しいと考えられるピッチマークを使用することができ、基準とする音声素片を固定とする場合に比較して高品質な合成音を得る効果がある。
実施の形態3.
上記実施の形態1及び実施の形態2では、基準とする音声素片を予め1つ設定しているが、これに代えて、まず複数の音声素片を候補として、各候補を基準として音声素片のピッチマークを補正した場合の補正結果を評価し、その評価結果に応じて基準とする音声素片を決定するなど、事後的に基準とする音声素片を設定するとしても良い。このピッチマーク補正の評価は、例えば、音声素片辞書におけるピッチマーク設定に用いた評価基準において補正後のピッチマークの評価値を求める、あるいは音声素片辞書にて設定されているピッチマークと補正後のピッチマークとの差分量を評価値とするなどとし、その評価値の平均が最良となるものや、評価値の最悪値が最良となるものを、総合的に最良であるなどとする。
このように構成することにより、合成音声全体に渡ってピッチマーク補正の影響を考慮する、すなわち、生成される合成音声の品質を考慮してピッチマーク補正をすることができるので、ピッチマーク補正の影響を考慮せず予め基準とする音声素片を設定する場合に比較して高品質な合成音声を得る効果がある。
実施の形態4.
実施の形態3では、ピッチマークの補正を行わない基準となる音声素片を設定しているが、これに代えて、合成音声生成に用いる全ての音声素片においてピッチマーク補正を行うとしても良い。すなわち、基準となる音声素片において複数のピッチマーク候補を設定し、各ピッチマーク候補を基準に全ての音声素片のピッチマークを補正し、その補正結果を評価して最良のピッチマーク候補を選択するなどとしても良い。
このように構成することにより、ピッチマーク補正の自由度が増し、必ずピッチマークの補正を行わない音声素片を1つ設定する場合に比較して高品質な合成音声を得る効果がある。
実施の形態5.
上記実施の形態1から実施の形態4では、式(2)に従って、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との距離に関する評価値として相関が最大となるように第2の音声素片のピッチマークを補正しているが、これに代えて、例えば次式(3)に示すように、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との距離に関する評価値として振幅差の絶対値の総和Sが最小となるp2を求め、これを第2の音声素片の始端における補正したピッチマークとし、これを基準に第2の音声素片全体のピッチマークを補正しても良い。
Figure 0004869898
このように構成することにより、ピッチマーク補正のための演算処理が加減算のみで実現でき、積和演算機能をもたない安価なCPUなどでも音声素片のピッチマーク補正を行った高品質な合成音声を得る効果がある。
実施の形態6.
上記実施の形態1から実施の形態4では、式(2)に従って、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との相関が最大となるように第2の音声素片のピッチマークを補正しているが、これに代えて、例えば次式(4)に示すように、第1の音声素片のピッチ波形と第2の音声素片のピッチ波形との距離に関する評価値として波形歪Eが最小となるp2を求め、これを第2の音声素片の始端における補正したピッチマークとし、これを基準に第2の音声素片全体のピッチマークを補正しても良い。
Figure 0004869898
ただし、αは波形歪Eを最小にする振幅調整係数であり、次式(5)に従って求める。
Figure 0004869898
なお、上記式(4)における波形歪Eを最小にすることは、次式(6)の歪Dを最大にすることと同一であるため、式(4)に代えて式(6)を用いて補正したピッチマークを求めても同一の結果が得られる。
Figure 0004869898
このように構成することにより、第1の音声素片と第2の音声素片との振幅の差異の影響を除いて波形の相似性が高くなるピッチマークが得られ、より音声素片の接続部におけるピッチ波形の連続性が向上して高品質な合成音声を得る効果がある。
実施の形態7.
上記実施の形態1から実施の形態6では、音声素片の信号をそのまま用いてピッチ波形間の距離に関する評価値を求めていたが、これに代えて、音声素片の信号の聴覚的に重要な部分に重み付けをした信号のピッチ波形間の距離に関する評価値を求めてピッチマークの補正を行っても良い。
このように構成することにより、音声素片を接続して生成される合成音声の聴覚上の品質劣化を少なくすることができるので、合成音声の音質を向上させることができる。
この発明は、カーナビゲータや、携帯電話機などの合成音声を用いる製品に適用され、これら製品の音質向上が図れる。
この発明の実施の形態1による音声合成装置の構成図である。 実施の形態1による音声合成装置の動作を示すフローチャートである。 実施の形態1による音声合成装置の第1の音声素片と第2の音声素片とを接続して合成音声を生成する説明図である。 従来の第1の音声素片と第2の音声素片とを接続して合成音声を生成する説明図である。
符号の説明
1;音声合成装置、2;音声素片辞書、3;ピッチマーク補正手段、4;音声生成手段、100;音韻記号・韻律情報、200;合成音声。

Claims (6)

  1. 音声素片における音声波形のピッチ周期に対応する1周期毎の時間的基準位置を表現するピッチマークが設定され、音韻記号・韻律情報が対応付けされた多数の音声素片格納され音声合成のため、入力テキストから得られた音韻記号が順次入力され、その音韻記号に基づいて対応する音声素片を順次出力する音声素片辞書と、
    音声素片辞書から順次入力される、任意の位置の音声素片のピッチマークを元にこの音声素片に接続される音声素片のピッチマークを補正して、その補正された音声素片のピッチ波形と、音声素片のピッチマークの補正に用いた音声素片のピッチ波形の距離で補正結果を評価する処理を音声素片辞書から順次入力される複数の異なる位置の音声素片に対して行い、補正後の評価結果が最も良好な評価値による補正後の音声素片を基準音声素片とする決定し、この決定された基準音声素片のピッチマークを元にして、基準音声素片に接続される音声素片のピッチマークを補正し、次いで、この基準音声素片に接続される音声素片の補正されたピッチマークを元にして、この補正されたピッチマークの音声素片に接続される音声素片のピッチマークを補正する処理を順次行うピッチマーク補正手段と、
    音声合成のため、入力テキストから得られ、入力された韻律情報に基づいて、上記ピッチマーク補正手段で補正されたピッチマークを用いて音声素片を順次接続して合成音声を生成する音声生成手段と
    を備えたことを特徴とする音声合成装置。
  2. 上記評価値は、基準音声素片のピッチ波形とピッチマークが補正される音声素片のピッチ波形との相関であることを特徴とする請求項に記載の音声合成装置。
  3. 上記評価値は、基準音声素片のピッチ波形とピッチマークが補正される音声素片のピッチ波形との誤差信号振幅値の絶対値の総和であることを特徴とする請求項に記載の音声合成装置。
  4. 上記評価値は、基準音声素片のピッチ波形に対するピッチマークが補正される音声素片のピッチ波形の波形歪であることを特徴とする請求項に記載の音声合成装置。
  5. 上記評価値は、聴覚的に重要な部分に重み付けされた評価値であることを特徴とする請求項ないしのいずれか1項に記載の音声合成装置。
  6. 音声合成のため、入力テキストから得られ、順次入力される音韻記号に基づいて、音声素片における音声波形のピッチ周期に対応する1周期毎の時間的基準位置を表現するピッチマークが設定され、音韻記号・韻律情報が対応付けされた多数の音声素片格納された音声素片辞書から、対応する音声素片を順次出力する工程と、
    音声素片辞書から順次入力される、任意の位置の音声素片のピッチマークを元にこの音声素片に接続される音声素片のピッチマークを補正して、その補正された音声素片のピッチ波形と、音声素片のピッチマークの補正に用いた音声素片のピッチ波形の距離で補正結果を評価する処理を音声素片辞書から順次入力される複数の異なる位置の音声素片に対して行い、補正後の評価結果が最も良好な評価値による補正後の音声素片を基準音声素片とする決定し、この決定された基準音声素片のピッチマークを元にして、基準音声素片に接続される音声素片のピッチマークを補正し、次いで、この基準音声素片に接続される音声素片の補正されたピッチマークを元にして、この補正されたピッチマークの音声素片に接続される音声素片のピッチマークを補正する処理を順次行うピッチマーク補正工程と、
    音声合成のため、入力テキストから得られ、入力された韻律情報に基づいて、上記ピッチマーク補正工程で補正されたピッチマークを用いて音声素片を順次接続して合成音声を生成する音声生成工程と
    を備えたことを特徴とする音声合成方法。
JP2006332027A 2006-12-08 2006-12-08 音声合成装置及び音声合成方法 Active JP4869898B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006332027A JP4869898B2 (ja) 2006-12-08 2006-12-08 音声合成装置及び音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006332027A JP4869898B2 (ja) 2006-12-08 2006-12-08 音声合成装置及び音声合成方法

Publications (2)

Publication Number Publication Date
JP2008145685A JP2008145685A (ja) 2008-06-26
JP4869898B2 true JP4869898B2 (ja) 2012-02-08

Family

ID=39605941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006332027A Active JP4869898B2 (ja) 2006-12-08 2006-12-08 音声合成装置及び音声合成方法

Country Status (1)

Country Link
JP (1) JP4869898B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3358139B2 (ja) * 1995-12-22 2002-12-16 沖電気工業株式会社 音声ピッチマーク設定方法
JP2003122380A (ja) * 2001-10-09 2003-04-25 Canon Inc ピッチマーク付与装置およびその処理方法ならびに記憶媒体
JP4056319B2 (ja) * 2002-07-31 2008-03-05 三洋電機株式会社 音声合成方法
JP4080989B2 (ja) * 2003-11-28 2008-04-23 株式会社東芝 音声合成方法、音声合成装置および音声合成プログラム
JP4762553B2 (ja) * 2005-01-05 2011-08-31 三菱電機株式会社 テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4550652B2 (ja) * 2005-04-14 2010-09-22 株式会社東芝 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法

Also Published As

Publication number Publication date
JP2008145685A (ja) 2008-06-26

Similar Documents

Publication Publication Date Title
US20200357381A1 (en) Speech synthesis device, speech synthesis method, speech synthesis model training device, speech synthesis model training method, and computer program product
US8370149B2 (en) Speech synthesis system, speech synthesis program product, and speech synthesis method
JP5159325B2 (ja) 音声処理装置及びそのプログラム
JP4469883B2 (ja) 音声合成方法及びその装置
JP4551803B2 (ja) 音声合成装置及びそのプログラム
JP4878538B2 (ja) 音声合成装置
JP2008033133A (ja) 音声合成装置、音声合成方法および音声合成プログラム
WO2014046789A1 (en) System and method for voice transformation, speech synthesis, and speech recognition
JP2008203543A (ja) 声質変換装置及び音声合成装置
JP2005164749A (ja) 音声合成方法、音声合成装置および音声合成プログラム
JP4406440B2 (ja) 音声合成装置、音声合成方法及びプログラム
JP3450237B2 (ja) 音声合成装置および方法
KR100457414B1 (ko) 음성합성방법, 음성합성장치 및 기록매체
JP4225128B2 (ja) 規則音声合成装置及び規則音声合成方法
JP2009133890A (ja) 音声合成装置及びその方法
JP5874639B2 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
JP2012042974A (ja) 音声合成装置
JP4869898B2 (ja) 音声合成装置及び音声合成方法
JP5106274B2 (ja) 音声処理装置、音声処理方法及びプログラム
JP4476855B2 (ja) 音声合成装置及びその方法
JP5862667B2 (ja) 波形処理装置、波形処理方法および波形処理プログラム
JP2008299266A (ja) 音声合成装置および音声合成方法
EP1628288A1 (en) Method and system for sound synthesis
WO2014017024A1 (ja) 音声合成装置、音声合成方法、及び音声合成プログラム
JP2006084854A (ja) 音声合成装置、音声合成方法および音声合成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111116

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4869898

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250