JP2006189554A - テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2006189554A JP2006189554A JP2005000498A JP2005000498A JP2006189554A JP 2006189554 A JP2006189554 A JP 2006189554A JP 2005000498 A JP2005000498 A JP 2005000498A JP 2005000498 A JP2005000498 A JP 2005000498A JP 2006189554 A JP2006189554 A JP 2006189554A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- speech unit
- fusion
- fused
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
【解決手段】複数のトレーニング音声素片から複数の信号波形を切り出し、切り出された信号波形を組み合わせて複数の融合音声素片を生成し、この融合音声素片のピッチおよび継続時間長の少なくとも一方を所定の音声素片の対応パラメータに従って変更して複数の合成音声素片を生成し、生成した複数の合成音声素片と所定の音声素片間の距離を評価し、その評価に基づく融合音声素片を音声素片辞書に記憶し、入力テキストを解析して得られる入力音素に対応した融合音声素片を音声素片辞書から選択して接続し、合成音声を出力する。
【選択図】図1
Description
入力されたテキストは、まず言語処理部において形態素解析や構文解析などが行われ、次に音韻処理部においてアクセントやイントネーションの処理が行われて、音韻記号、ピッチ長、継続時間長などの音素環境情報が出力される。そして音素環境情報を根拠に、音声素片辞書に登録された音声素片を選択する。最後に、音声合成部で音韻記号、ピッチ長、継続時間長などの情報から音声を合成する。
このような音声合成の技術分野において、複数のトレーニング音声素片のピッチおよび継続時間長の少なくとも一方に従って、既に生成されている代表音声素片のピッチおよび継続時間長の少なくとも一方を変更し、複数の合成音声素片を生成する。この生成した合成音声素片とトレーニング素片との歪を評価し、歪が最小となる音声素片(これを代表音声素片という)を選択して接続することにより合成音声を出力するものがある。(例えば特許文献1参照)。
複数のトレーニング音声素片から複数の信号波形を切り出す波形分離ステップと、
前記切り出された複数の信号波形から、任意の1つまたは複数の信号波形を組み合わせて融合することにより複数の融合音声素片を生成する波形融合ステップと、
前記複数のトレーニング音声素片のピッチおよび継続時間長の少なくとも一方に従って、前記生成した融合音声素片のピッチおよび継続時間長の少なくとも一方を変更した複数の合成音声素片を生成する音声素片合成ステップと、
前記複数のトレーニング音声素片のそれぞれに対する、前記生成した複数の合成音声素片のそれぞれとの間の距離を評価し、その評価に基づく融合音声素片を音声素片辞書に保持または記憶する歪み評価ステップと、
前記音声素片辞書に保持または記憶された複数の融合音声素片から、入力テキストを解析して得られる入力音素に対応した融合音声素片を選択して接続することにより合成音声を出力する合成音声生成ステップとを有する。
入力テキストを解析して入力音素を得る韻律設定部と、
複数のトレーニング音声素片から複数の信号波形を切り出し、この複数の信号波形を任意に組み合わせて複数の融合音声素片候補を生成し、この融合音声素片候補のピッチおよび継続時間長の少なくとも一方を前記複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って変更した複数の合成音声素片を生成し、この複数の合成音声素片と前記何れか1つのトレーニング音声素片との間の距離を評価し、その評価に基づく融合音声素片を生成する融合音声素片生成手段と、
前記融合音声素片を保持または記憶する融合音声素片記憶手段と、
融合音声素片記憶手段が保持または記憶する融合音声素片から、前記入力音素に対応する融合音声素片を選択する素片選択手段と、
選択された融合音声素片を接続し、合成音声を生成する音声合成手段とを具備する。
コンピュータに
入力テキストを解析して入力音素を得る韻律設定手段、
複数のトレーニング音声素片から複数の信号波形を切り出し、この複数の信号波形を任意に組み合わせて複数の融合音声素片候補を生成し、この融合音声素片候補のピッチおよび継続時間長の少なくとも一方を前記複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って変更した複数の合成音声素片を生成し、この複数の合成音声素片と前記何れか1つのトレーニング音声素片との間の距離を評価し、その評価に基づく融合音声素片を生成する融合音声素片生成手段、
前記融合音声素片を保持または記憶する融合音声素片記憶手段、
融合音声素片記憶手段が保持または記憶する融合音声素片から、前記入力音素に対応する融合音声素片を選択する素片選択手段、
選択された融合音声素片を接続し、合成音声を生成する音声合成手段として機能させる。
コンピュータを、
入力テキストを解析して入力音素を得る韻律設定手段、
複数のトレーニング音声素片から複数の信号波形を切り出し、この複数の信号波形を任意に組み合わせて複数の融合音声素片候補を生成し、この融合音声素片候補のピッチおよび継続時間長の少なくとも一方を前記複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って変更した複数の合成音声素片を生成し、この複数の合成音声素片と前記何れか1つのトレーニング音声素片との間の距離を評価し、その評価に基づく融合音声素片を生成する融合音声素片生成手段、
前記融合音声素片を保持または記憶する融合音声素片記憶手段、
融合音声素片記憶手段が保持または記憶する融合音声素片から、前記入力音素に対応する融合音声素片を選択する素片選択手段、
選択された融合音声素片を接続し、合成音声を生成する音声合成手段として機能させるためのプログラムを記録した。
実施の形態1.
図1は、この発明の実施の形態1に係る音声合成方法を実現する音声合成装置の構成を示すブロック図である。図1において、1は入力端子、2は言語処理部、3は言語辞書、4は韻律設定部、5は融合音声素片生成部、6は音声素片辞書、7は素片選択部、8は音声合成部、9は出力端子である。
なお、本実施の形態ではトレーニング音声素片は、人間が発声した自然音声信号を用いている。
また、融合音声素片生成部5の処理については、後に詳細に説明する。
このとき、音声素片辞書6へは聴覚重み付け処理を行っていないトレーニング音声素片から、前記歪最小となる融合音声素片のみを生成して出力する。
また、前記の距離e[jk、i]に対して、聴覚重み付けフィルタを構成する関数を距離計算の重み付け関数として組み込んでもよい。聴覚重み付け処理を行うことで、聴覚的に重要な部分を重視した歪評価が可能となり、さらに合成音声の品質を向上することができる。
前記実施の形態1にて示した融合音声素片生成部5において、第2のトレーニング音声素片数がNs2個の場合、(Ns2)×(Ns2)通りの組み合わせの融合音声素片の歪評価が必要であり、Ns2が大きくなると飛躍的に処理量が増大するが、融合音声素片の組み合わせに用いる音声素片を予備選択することで、融合音声素片評価に対する処理量を削減することができる。
また、実施の形態2の別の形態として、C素片とV素片を分離した後に、それぞれの素片別に予備選択を実施することも可能である。
前記実施の形態1の変形例として、CV素片のC素片とV素片を、他の音韻のそれらと共有化することで、合成音声の品質を維持したまま音響辞書のサイズを大幅に削減したり、音素を共通化できるため聴感上の合成音声の安定化を図ることが可能である。
なお、以下の説明の便宜上、他の音韻に対する、第1および第2のトレーニング音声素片の個数もそれぞれNs1およびNs2とするが、この定義はこの発明の範囲を狭めるものではなく、任意の個数を取ることができる。
実施の形態4の別の実施の形態5として、先の実施の形態2と同様に、共通化音声素片、融合音声素片の組み合わせに用いる音声素片を予備選択してもよい。予備選択することで融合音声素片評価に対する処理量を削減できるとともに、音質が悪いトレーニング音声素片を排除することができ、合成音声の品質を向上することができる。
前記実施の形態1では、第1のトレーニング音声素片104中の音声素片が保持するピッチ周期および音韻継続時間長に従って融合音声素片106を生成したが、所定の規則により生成されたピッチおよび継続時間長、例えば、韻律設定部4が出力する入力テキストのピッチ周期および音韻継続時間長に従って融合音声素片を変形して合成音声素片を生成し、韻律設定部4の出力するピッチ周期および音韻継続時間長との差が最小となる音声素片を、第1のトレーニング音声素片104から抽出して、抽出された第1のトレーニング音声素片のピッチおよび継続時間長と合成音声素片との歪評価を行うことも可能である。
実施の形態6の別の実施の形態7として、先の実施の形態2と同様に、融合音声素片の組み合わせに用いる音声素片を予備選択してもよい。予備選択することで融合音声素片評価に対する処理量を削減できるとともに、音質が悪いトレーニング音声素片を排除することができ、合成音声の品質を向上することができる。
前記の実施の形態1において、音声素片辞書6に格納されている融合音声素片は、メモリ量や通信情報量を削減するために圧縮処理を行ってもよい。
また、量子化あるいは符号化して非可逆圧縮した後、非可逆圧縮されたデータを可逆圧縮して更にメモリ量を削減する等、両者を組み合わせて用いることも可能であるし、音声素片毎にその特性を考慮して可逆圧縮のみ、非可逆圧縮のみ、可逆圧縮+非可逆圧縮等の圧縮パタンを使い分けても良い。さらに、量子化・符号化精度(量子化・符号化に割り当てるビット数)や符号化方法は音声素片毎に異なるものであっても良い。
実施の形態8の変形例として、融合音声素片106に対する圧縮・伸張処理を、実施の形態4にて述べた、共通化音声素片203および非共通化音声素片204に対して実施しても良い。
素片選択部7は韻律情報103に従って選択される音声素片辞書6に保持されている共通化音声素片203と非共通化音声素片204に該当する符号化音声素片301を復号化部32へ入力し、復号化部32でデータ伸長あるいは復号化処理が行われ、復号化音声素片302を得て素片選択・接続処理をし、音声合成部8で音声合成して合成音声108を得て出力端子9より出力する。
また、例えばLAN(Local Area Network)、インターネット、赤外線通信、携帯電話パケット通信等の通信手段経由で、サーバコンピュータ等の処理手段により解析された解析結果や韻律情報、あるいはサーバコンピュータ上のハードディスク等の記憶手段に記憶されている解析結果や韻律情報を読み出すことでも省略可能である。
Claims (12)
- 複数のトレーニング音声素片から複数の信号波形を切り出す波形分離ステップと、
前記切り出された複数の信号波形から、任意の1つまたは複数の信号波形を組み合わせて融合することにより複数の融合音声素片を生成する波形融合ステップと、
前記複数のトレーニング音声素片のピッチおよび継続時間長の少なくとも一方に従って、前記生成した融合音声素片のピッチおよび継続時間長の少なくとも一方を変更した複数の合成音声素片を生成する音声素片合成ステップと、
前記複数のトレーニング音声素片のそれぞれに対する、前記生成した複数の合成音声素片のそれぞれとの間の距離を評価し、その評価に基づく融合音声素片を音声素片辞書に保持または記憶する歪み評価ステップと、
前記音声素片辞書に保持または記憶された複数の融合音声素片から、入力テキストを解析して得られる入力音素に対応した融合音声素片を選択して接続することにより合成音声を出力する合成音声生成ステップとを有することを特徴とするテキスト音声合成方法。 - 前記波形融合ステップは、前記切り出された複数の信号波形から、他の音声素片との共通部分となる複数の信号波形と、他の音声素片と非共通部分となる複数の信号波形を生成し、前記共通部分となる複数の信号波形と、前記非共通部分となる複数の信号波形から、任意の1つまたは複数の信号波形を組み合わせて融合することにより、他の音声素片との共通部分を含む複数の融合音声素片を生成し、
前記歪み評価ステップは前記複数のトレーニング音声素片の何れか1つのそれぞれに対する、前記生成した複数の合成音声素片のそれぞれとの間の距離を評価し、その評価に基づく共通音声素片とそれ以外の音声素片を保持または記憶し、
前記合成音声生成ステップは、前記保持または記憶された、複数の共有音声素片とそれ以外の複数の音声素片から、入力音素に対応した融合音声素片を生成して接続することにより合成音声を出力する方法とされたことを特徴とする請求項1記載のテキスト音声合成方法。 - 前記音声素片合成ステップで、合成音声素片を生成する際に用いられるピッチおよび継続時間長は所定の規則により生成されたピッチおよび継続時間長であり、
歪み評価ステップで、合成音声素片を評価する際に用いられるトレーニング音声素片は前記所定の規則により生成されたピッチおよび継続時間長との距離が最小となる前記複数のトレーニング音声素片から選択された音声素片であることを特徴とする請求項1又は2記載のテキスト音声合成方法。 - 波形分離ステップは、複数のトレーニング音声素片に対し、所定の判断基準に基づいて音声素片を選択し、前記選択された音声素片から複数の信号波形を切り出す処理であることを特徴とする請求項1〜3の何れかに記載のテキスト音声合成方法。
- 音声素片辞書に記憶または保持する融合音声素片の情報量を、所定の圧縮方法により圧縮し、
入力音素に対応する融合音声素片を選択する際に、音響素片辞書から圧縮された融合音声素片の情報量を伸張して、合成音声を生成することを特徴とする請求項1〜4の何れかに記載のテキスト音声合成方法。 - 入力テキストを解析して入力音素を得る韻律設定部と、
複数のトレーニング音声素片から複数の信号波形を切り出し、この複数の信号波形を任意に組み合わせて複数の融合音声素片候補を生成し、この融合音声素片候補のピッチおよび継続時間長の少なくとも一方を前記複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って変更した複数の合成音声素片を生成し、この複数の合成音声素片と前記何れか1つのトレーニング音声素片との間の距離を評価し、その評価に基づく融合音声素片を生成する融合音声素片生成手段と、
前記融合音声素片を保持または記憶する融合音声素片記憶手段と、
融合音声素片記憶手段が保持または記憶する融合音声素片から、前記入力音素に対応する融合音声素片を選択する素片選択手段と、
選択された融合音声素片を接続し、合成音声を生成する音声合成手段とを具備することを特徴とするテキスト音声合成装置。 - 前記融合音声素片生成手段は、
複数のトレーニング音声素片から複数の信号波形を切り出して、前記切り出された複数の信号波形から、他の音声素片との共通部分となる複数の信号波形と、他の音声素片と非共通部分となる複数の信号波形を生成し、前記融合音声素片生成手段に出力する共通音声素片生成具と、
前記共通部分となる複数の信号波形と、前記非共通部分となる複数の信号波形から、任意の信号波形を組み合わせて融合することにより、他の音声素片との共通部分を含む複数の融合音声素片を生成し、複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って、前記生成した融合音声素片のピッチおよび継続時間長の少なくとも一方を変更した複数の合成音声素片を生成し、前記複数のトレーニング音声素片の何れか1つとそれに対応する前記生成した複数の合成音声素片との間の距離を評価し、その評価に基づき融合音声素片を出力する融合音声素片生成具とから構成されることを特徴とする請求項6記載のテキスト音声合成装置。 - 前記融合音声素片生成手段は、
融合音声素片のピッチおよび継続時間長の少なくとも一方を変更して複数の合成音声素片を生成する際に用いられるピッチおよび継続時間長は所定の規則により予め生成されたものであり、
合成音声素片の歪み評価に用いられる音声素片は前記所定の規則により生成されたピッチおよび継続時間長との距離が最小となる前記複数のトレーニング音声素片の何れか1つのトレーニング音声素片から選択されたものであることを特徴とする請求項6又は7記載のテキスト音声合成装置。 - 前記融合音声素片生成手段は、
複数のトレーニング音声素片に対し、所定の判断基準に基づいて音声素片を選択し、前記選択された音声素片を用いて複数の融合音声素片の生成および評価を行う構成にされたことを特徴とする請求項6〜8の何れかに記載のテキスト音声合成装置。 - 音声素片辞書に記憶または保持する融合音声素片の情報量を、所定の圧縮方法により圧縮する符号化部と、
音声素片辞書中の圧縮された融合音声素片の情報量を伸張する、復号化部を具備することを特徴とする、請求項6〜9の何れかに記載のテキスト音声合成装置。 - コンピュータに
入力テキストを解析して入力音素を得る韻律設定手段、
複数のトレーニング音声素片から複数の信号波形を切り出し、この複数の信号波形を任意に組み合わせて複数の融合音声素片候補を生成し、この融合音声素片候補のピッチおよび継続時間長の少なくとも一方を前記複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って変更した複数の合成音声素片を生成し、この複数の合成音声素片と前記何れか1つのトレーニング音声素片との間の距離を評価し、その評価に基づく融合音声素片を生成する融合音声素片生成手段、
前記融合音声素片を保持または記憶する融合音声素片記憶手段、
融合音声素片記憶手段が保持または記憶する融合音声素片から、前記入力音素に対応する融合音声素片を選択する素片選択手段、
選択された融合音声素片を接続し、合成音声を生成する音声合成手段として機能させるためのテキスト音声合成プログラム。 - コンピュータを
入力テキストを解析して入力音素を得る韻律設定手段、
複数のトレーニング音声素片から複数の信号波形を切り出し、この複数の信号波形を任意に組み合わせて複数の融合音声素片候補を生成し、この融合音声素片候補のピッチおよび継続時間長の少なくとも一方を前記複数のトレーニング音声素片の何れか1つのピッチおよび継続時間長の少なくとも一方に従って変更した複数の合成音声素片を生成し、この複数の合成音声素片と前記何れか1つのトレーニング音声素片との間の距離を評価し、その評価に基づく融合音声素片を生成する融合音声素片生成手段、
前記融合音声素片を保持または記憶する融合音声素片記憶手段、
融合音声素片記憶手段が保持または記憶する融合音声素片から、前記入力音素に対応する融合音声素片を選択する素片選択手段、
選択された融合音声素片を接続し、合成音声を生成する音声合成手段として機能させるためのテキスト音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005000498A JP4762553B2 (ja) | 2005-01-05 | 2005-01-05 | テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005000498A JP4762553B2 (ja) | 2005-01-05 | 2005-01-05 | テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006189554A true JP2006189554A (ja) | 2006-07-20 |
JP4762553B2 JP4762553B2 (ja) | 2011-08-31 |
Family
ID=36796845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005000498A Active JP4762553B2 (ja) | 2005-01-05 | 2005-01-05 | テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4762553B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008145685A (ja) * | 2006-12-08 | 2008-06-26 | Mitsubishi Electric Corp | 音声合成装置及び音声合成方法 |
WO2012001457A1 (en) * | 2010-06-28 | 2012-01-05 | Kabushiki Kaisha Toshiba | Method and apparatus for fusing voiced phoneme units in text-to-speech |
JP2012185356A (ja) * | 2011-03-07 | 2012-09-27 | Yamaha Corp | 音声合成装置 |
US8754663B2 (en) | 2008-07-21 | 2014-06-17 | Dspace Digital Signal Processing And Control Engineering Gmbh | Circuit for simulating an electrical load |
CN111312210A (zh) * | 2020-03-05 | 2020-06-19 | 云知声智能科技股份有限公司 | 一种融合图文的语音合成方法及装置 |
CN113313183A (zh) * | 2020-06-05 | 2021-08-27 | 谷歌有限责任公司 | 通过使用能量分值来训练语音合成神经网络 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3935627A1 (en) * | 2019-05-15 | 2022-01-12 | DeepMind Technologies Limited | Speech synthesis utilizing audio waveform difference signal(s) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319391A (ja) * | 1996-03-12 | 1997-12-12 | Toshiba Corp | 音声合成方法 |
JPH10171484A (ja) * | 1996-12-10 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成方法および装置 |
JPH10288999A (ja) * | 1997-04-15 | 1998-10-27 | Oki Electric Ind Co Ltd | 音声合成方法及び音声合成装置 |
JP2001282273A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | 音声情報処理装置とその方法と記憶媒体 |
-
2005
- 2005-01-05 JP JP2005000498A patent/JP4762553B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319391A (ja) * | 1996-03-12 | 1997-12-12 | Toshiba Corp | 音声合成方法 |
JPH10171484A (ja) * | 1996-12-10 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成方法および装置 |
JPH10288999A (ja) * | 1997-04-15 | 1998-10-27 | Oki Electric Ind Co Ltd | 音声合成方法及び音声合成装置 |
JP2001282273A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | 音声情報処理装置とその方法と記憶媒体 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008145685A (ja) * | 2006-12-08 | 2008-06-26 | Mitsubishi Electric Corp | 音声合成装置及び音声合成方法 |
US8754663B2 (en) | 2008-07-21 | 2014-06-17 | Dspace Digital Signal Processing And Control Engineering Gmbh | Circuit for simulating an electrical load |
WO2012001457A1 (en) * | 2010-06-28 | 2012-01-05 | Kabushiki Kaisha Toshiba | Method and apparatus for fusing voiced phoneme units in text-to-speech |
CN102511061A (zh) * | 2010-06-28 | 2012-06-20 | 株式会社东芝 | 在语音合成中用于融合浊音音素单元的方法和装置 |
JP2012185356A (ja) * | 2011-03-07 | 2012-09-27 | Yamaha Corp | 音声合成装置 |
CN111312210A (zh) * | 2020-03-05 | 2020-06-19 | 云知声智能科技股份有限公司 | 一种融合图文的语音合成方法及装置 |
CN113313183A (zh) * | 2020-06-05 | 2021-08-27 | 谷歌有限责任公司 | 通过使用能量分值来训练语音合成神经网络 |
Also Published As
Publication number | Publication date |
---|---|
JP4762553B2 (ja) | 2011-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7831420B2 (en) | Voice modifier for speech processing systems | |
CA2161540C (en) | A method and apparatus for converting text into audible signals using a neural network | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
JP4328698B2 (ja) | 素片セット作成方法および装置 | |
US20200410981A1 (en) | Text-to-speech (tts) processing | |
JP3910628B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
US20060229877A1 (en) | Memory usage in a text-to-speech system | |
Lee et al. | A very low bit rate speech coder based on a recognition/synthesis paradigm | |
JPH031200A (ja) | 規則型音声合成装置 | |
US5633984A (en) | Method and apparatus for speech processing | |
JP4762553B2 (ja) | テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
Hamad et al. | Arabic text-to-speech synthesizer | |
JP2001265375A (ja) | 規則音声合成装置 | |
RU61924U1 (ru) | Статистическая модель речи | |
JP5376643B2 (ja) | 音声合成装置、方法およびプログラム | |
JP5268731B2 (ja) | 音声合成装置、方法およびプログラム | |
JPWO2010104040A1 (ja) | 1モデル音声認識合成に基づく音声合成装置、音声合成方法および音声合成プログラム | |
Ramasubramanian et al. | Ultra low bit-rate speech coding | |
Sassi et al. | Neural speech synthesis system for Arabic language using CELP algorithm | |
JP2009271190A (ja) | 音声素片辞書作成装置及び音声合成装置 | |
Dong-jian | Two stage concatenation speech synthesis for embedded devices | |
Ebihara et al. | Speech synthesis software with a variable speaking rate and its implementation on a 32-bit microprocessor | |
WO2023182291A1 (ja) | 音声合成装置、音声合成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110322 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110608 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4762553 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |