JP3949346B2 - 音声合成方法及び装置 - Google Patents

音声合成方法及び装置 Download PDF

Info

Publication number
JP3949346B2
JP3949346B2 JP2000099961A JP2000099961A JP3949346B2 JP 3949346 B2 JP3949346 B2 JP 3949346B2 JP 2000099961 A JP2000099961 A JP 2000099961A JP 2000099961 A JP2000099961 A JP 2000099961A JP 3949346 B2 JP3949346 B2 JP 3949346B2
Authority
JP
Japan
Prior art keywords
speech
pitch
unit
sound source
source signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000099961A
Other languages
English (en)
Other versions
JP2001282280A (ja
Inventor
剛 平林
岳彦 籠嶋
勝美 土谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000099961A priority Critical patent/JP3949346B2/ja
Publication of JP2001282280A publication Critical patent/JP2001282280A/ja
Application granted granted Critical
Publication of JP3949346B2 publication Critical patent/JP3949346B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、合成すべき音声の元となるピッチ波形をピッチ周期に基づいて重畳することによって合成音声を生成する音声合成方法及び装置に関する。
【0002】
【従来の技術】
音声合成方式の一つである規則合成方式は、入力された韻律情報から自動的に合成音声を生成する技術であり、具体的には音韻記号列、音韻継続時間長、ピッチパターンおよびパワーなどの韻律情報に従って、素片辞書記憶部に記憶されている代表音声素片を選択し、選択された代表音声素片をピッチや継続時間長によって調節して接続し重畳することにより、合成音声を生成する。ここで、代表音声素片は音声をCV、CVC、VCV(Cは子音、Vは母音を表す)などの基本となる細かい単位で素片化したものである。この規則合成方式による音声合成技術は、例えば任意の文字列データ(テキスト)から人工的に音声を生成するテキスト音声合成に用いられる。
【0003】
このような規則合成方式による音声合成技術では、合成音声の品質を向上させるために、代表音声素片として音声データから切り出したピッチ波形や、それを分析して得られる音源信号と合成フィルタの特性を表す係数の組などが用いられる。また、代表音声素片を多数集めた音声素片辞書の記憶容量を削減するために、音声素片群を圧縮符号化して圧縮音声素片辞書を構成し、音声合成時に符号化された音声素片を復号化して使用する方法が提案されている(例えば、特開平6−110498)。
【0004】
この圧縮音声素片辞書を用いた従来の音声合成装置(規則合成系)では、まず入力された韻律情報に従って圧縮音声素片辞書から符号化された代表音声素片が選択される。符号化代表音声素片は、音源信号と合成フィルタのフィルタ係数との組として記憶されている。選択された符号化代表音声素片は、ピッチ波形生成部に入力される。
【0005】
ピッチ波形生成部では、選択された符号化代表音声素片を構成するフィルタ係数と音源信号が復号化され、復号化されたフィルタ係数に基づいて構成された合成フィルタによって、復号化された音源信号がフィルタリング処理されることにより、ピッチ波形が生成される。このようにして生成されたピッチ波形が韻律情報に基づいて、所望のピッチ周期の間隔や継続時間長となるように波形重畳されることにより、合成音声が生成される。
【0006】
このような規則合成系の特徴として、ピッチ周期の短い部分ではピッチ波形を狭い間隔で重ね合わせて配置する必要があり、ピッチ波形を数多く生成しなければならない。従って、圧縮符号化された音声素片辞書を用いた規則合成系では、符号化代表音声素片の復号化および合成フィルタでのフィルタリング処理の回数が増加し、それに伴う演算量の増大が問題となってくる。
【0007】
また、代表音声素片の符号化によりフィルタ係数もしくは音源信号に歪みが生じた場合、ピッチ波形が終端で減衰しきれずに、打ち切られた波形となることがある。このようなピッチ波形を重畳することで生成された合成音声は、波形が不連続となるために雑音感が存在し、品質の悪いものとなる。この合成音声の品質劣化を抑制するためには、生成したピッチ波形の終端が減衰するように元の音源信号の長さよりも長くフィルタリング処理を行う必要があり、さらに演算量が増加することになる。
【0008】
【発明が解決しようとする課題】
上述したように従来の音声合成技術、特に音声素片辞書の記憶容量を削減するために圧縮符号化された音声素片辞書を用いた規則合成系では、ピッチ周期の短い部分でピッチ波形の重なる度合いが大きくなると、ピッチ波形生成の処理回数が増え、それに伴い音声合成に必要な演算量が非常に多くなってしまいう問題があった。
【0009】
さらに、音声素片の符号化によるフィルタ係数や音源信号の歪みのために、ピッチ波形が終端で減衰しきれずに打ち切られた波形となることがあり、これによる合成音声の品質劣化を避けるには、ピッチ波形の終端が減衰するまで元の音源信号の長さよりも長くフィルタリング処理を行う必要があるため、さらに演算量が増加してしまうという問題があった。
【0010】
本発明は、従来の音声合成におけるこのような問題を考慮し、合成音声の品質劣化を抑制し、かつ音声合成時の演算量を減少させることができる音声合成方法及び装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記課題を解決するため、本発明ではまず圧縮符号化された音声素片群よりなる圧縮音声素片辞書から、合成すべき音声の元となる音声素片を選択する。この選択された音声素片を合成すべき音声のピッチ周期に応じた長さだけ復号化することでピッチ波形を生成し、このピッチ波形をピッチ周期の間隔で時間軸方向に並べて重畳することにより合成音声を生成する。
【0012】
このように圧縮音声素片辞書から選択された音声素片のうち、ピッチ周期に応じて例えば合成音声の音質に影響しない必要な長さだけを復号化してピッチ波形を生成することにより、特にピッチ周期の短い部分でのピッチ波形生成に要する演算量の増加を抑制することが可能となる。
【0013】
また、本発明では上記と同様にまず圧縮符号化された音声素片群よりなる圧縮音声素片辞書から合成すべき音声の元となる音声素片を選択する。次に、この選択された音声素片を復号化しかつ終端を減衰させて(波形の端点における不連続性を低減させる処理を行って)ピッチ波形を生成し、このピッチ波形をピッチ周期に基づき重畳して合成音声を生成する。
【0014】
圧縮音声素片辞書の符号化による歪みなどのために、生成したピッチ波形が終端で十分に減衰しないうちに打ち切られた波形に対して、このように波形の終端を減衰させる処理を行うことにより、元の音源信号の長さよりも長くフィルタリング処理を行う従来の方法と比較して、非常に少ない演算量でピッチ波形を重畳する際の波形間の不連続性を低減することができ、重畳後の波形がなめらかで雑音感の少ない合成音声を生成することができる。
【0015】
さらに、本発明では選択された符号化音声素片を合成すべき音声のピッチ周期に応じた長さだけ復号化することと、波形の終端を減衰させる処理を組み合わせて行うことにより、必要な演算量が少なく、かつより高品質の音声合成が可能となる。
【0016】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
まず、図1を用いて本発明が適用されるシステムの一例として、テキスト音声合成方式について述べる。図1に示すように、入力されたテキスト(文字列データ)に対してテキスト解析部1によって解析を行い、この解析結果から韻律制御部2において音声合成に必要な音韻記号列、音韻継続時間長、ピッチパターンおよびパワーなどの韻律情報を求め、これらの韻律情報に基づき音声波形生成部3においてピッチ波形を生成し、その生成したピッチ波形をピッチ周期に基づいて重畳することで合成音声を生成する。
【0017】
ここで、本発明は音声波形生成部3の構成法に関する。この音声波形生成部3はハードウェアにより構成してもよいが、ソフトウェアにより実現してもよい。ソフトウェアで音声波形生成部3を実現する場合、例えば図2に示すような概略的な流れに従って合成音声を生成する。
【0018】
まず、圧縮符号化された音声素片群よりなる辞書(圧縮音声素片辞書)から、合成すべき音声の元となる、例えば図1の韻律制御部2からの韻律情報に応じて最適な符号化代表音声素片を選択する(ステップS1)。
次に、ステップS1で選択された符号化代表音声素片を入力とし、これを合成すべき音声のピッチ周期に応じた長さだけ復号化する(ステップS2)。
【0019】
次に、ステップS2の復号化により得られた波形の終端を減衰させて、最終的なピッチ波形を生成する(ステップS3)。
最後に、ステップS3で生成されたピッチ波形をピッチ周期、さらには合成すべき音声の時間長に基づいて重畳することによって、韻律情報に応じた合成音声を生成する(ステップS4)。
【0020】
ここで、本発明において特徴的な処理はステップS2とステップS3であり、これらの処理を行うことによって演算量の増大を抑制し、かつ合成音声の品質を大幅に向上させることができる。
【0021】
次に、図3により本発明の一実施形態に係る音声合成装置について説明する。この音声合成装置は、図1中に示した音声波形生成部3に相当するものであり、音声合成の分野でいわゆる規則合成系と称される部分である。
【0022】
この規則合成系は、大きく分けて素片選択部10、複数の符号化代表音声素片(音声素片群)よりなる圧縮音声素片辞書11、この圧縮音声素片辞書11から素片選択部10により選択された符号化代表音声素片を復号化してピッチ波形を生成するピッチ波形生成部12、ピッチ周期・継続時間長制御部13及びピッチ周期・時間長制御部13により制御されてピッチ波形を重畳することで合成音声を生成するピッチ波形重畳部14から構成されている。
【0023】
圧縮音声素片辞書11は、種々の音声データを分析して得られた音源信号と合成フィルタの特性を表すフィルタ係数との組からなる多数の符号化代表音声素片(音声素片群)からなり、メモリに格納されている。音源信号及びフィルタ係数の符号化には、例えばベクトル量子化が用いられる。合成フィルタの特性を表すフィルタ係数は、スペクトラムパラメータ、すなわちケプストラム、LPC、PARCOR、LSPといった係数であり、これらの係数を変換した結果得られる係数を用いることもできる。
【0024】
ピッチ波形生成部12は、音源信号復号化部20、フィルタ係数復号化部21、音源信号長調整部22、合成フィルタ23及び窓掛け処理部24から構成される。ここで、音源信号長調整部22と窓掛け処理部24が追加されている点が従来の規則合成系におけるピッチ波形生成部の構成と異なっている。音源信号長調整部22及び窓掛け処理部24については、後に詳しく述べる。
【0025】
次に、図3の規則合成系の動作を説明する。
まず、例えば図1の韻律制御部2から出力される音韻記号列100、音韻継続時間長情報101、ピッチパターン情報102及びパワー情報103などの韻律情報に従って、素片選択部10により圧縮音声素片辞書11から最適な一組の符号化代表音声素片、つまり符号化音源信号110と符号化フィルタ係数111の組が選択される。選択された符号化代表音声素片は、ピッチ波形生成部12に入力される。
【0026】
また、韻律情報100〜103はピッチ・時間長制御部13にも入力される。ピッチ・時間長制御部13は、ピッチ波形を重畳して音声合成を行う際に必要なピッチ周期と合成音声の時間長の制御を行うものであり、ピッチ周期情報104をピッチ波形生成部12に供給し、ピッチ周期・時間長情報105を後述するピッチ波形重畳部14に供給する。
【0027】
ピッチ波形生成部12においては、符号化音源信号110が音源信号復号化部20により音源信号120が復号化され、さらに符号化フィルタ係数111がフィルタ係数復号化部21により復号化されてフィルタ係数121が再生される。合成フィルタの特性を表すフィルタ係数とは、例えばケプストラム、LPC、PARCOR、LSPなどの係数、あるいはこれらの係数を変換したフィルタ係数である。
【0028】
音源信号復号化部20から出力される再生された音源信号120は、音源信号長調整部22に入力され、ピッチ周期・時間長制御部13からのピッチ周期情報104に従ってその長さ(音源信号長)が調整される。例えば、音源信号120の長さがピッチ周期の2倍より長い場合は、ピッチ周期の2倍の長さとなるように音源信号長が調整される。
【0029】
ここで、ピッチ周期に対して音源信号長を極端に短くした場合には、スペクトル包絡に歪みを生じ、元のピッチ波形に対して品質が劣化してしまう。このため音源信号調整部22においては、ピッチ波形生成部12で最終的に生成されるピッチ波形のスペクトル歪みが許容できる範囲内で、音源信号長を調整する必要がある。
【0030】
音源信号復号化部20及び音源信号長調整部22は、全体として符号化音源信号110をピッチ周期に応じた長さだけ復号化していることになる。音源信号復号化部20と音源信号長調整部22の位置を入れ替えてもよい。ここでは説明の便宜上、音源信号復号化部20と音源信号長調整部22を分けて示しているが、音源信号復号化部が符号化音源信号110をピッチ周期に応じた長さだけ復号化する機能を有していてもよい。すなわち、復号化の後に音源信号長の調整を行うのではなく、復号化そのものをピッチ周期に応じた長さだけ行うようにしても一向に構わない。
【0031】
音源信号長調整部22から出力される音源信号は、合成フィルタ23に入力される。合成フィルタ23には、前述したようにフィルタ係数復号化部21から出力されるフィルタ係数121が与えられている。これにより合成フィルタ23において、音源信号長調整部22からの音源信号がフィルタ係数121に従った特性でフィルタリング処理されることにより、ピッチ周期に応じた長さのピッチ波形が生成される。
【0032】
図4に、上述のようにしてピッチ周期に応じて音源信号長を調整し、ピッチ周期に応じた長さのピッチ波形を生成する様子を簡単に示す。この例では、音源信号復号化部20から出力される音源信号120の長さが音源信号調整部20によりピッチ周期の2倍に調整される。この結果、合成フィルタ23からピッチ周期の2倍の長さのピッチ波形が出力されることになる。
【0033】
ここで、フィルタ係数復号化部21から出力されるフィルタ係数121や音源信号復号化部20から出力される音源信号120には、圧縮音声素片辞書11として格納されている音声素片が符号化されていることに伴う歪みが生じており、加えて本実施形態では音源信号長調整部22において音源信号120の長さが調整されているため、合成フィルタ23から出力されるピッチ波形が終端で減衰しきれずに打ち切られた形となる場合がある。このように終端部分が打ち切られたピッチ波形をそのまま用いて合成音声を生成すると、合成音声は波形が不連続なものとなり、雑音感の存在する品質の悪いものとなる。
【0034】
そこで、本実施形態ではこのようにピッチ波形終端の打ち切りを防ぐために、合成フィルタ23から出力されるピッチ波形は窓掛け処理部24に入力され、例えば次式(1)(2)で定義されるような窓掛け処理が施されることによって、ピッチ波形の終端が減衰させられる。
【0035】
【数1】
Figure 0003949346
【0036】
ここで、FLは音源信号長を表す。図5(a)に式(1)で定義される窓関数を示し、図5(b)に窓掛け処理によってピッチ波形の終端が減衰する様子を示す。図5(b)に示されるように、窓掛け処理を行う前のピッチ波形(合成フィルタ23の出力波形)は、比較的振幅の大きいところで終端が打ち切られているが、窓掛け処理を行うことによって終端の波形は徐々に減衰し、最終的に振幅が零となっている。
【0037】
このようにして窓掛け処理部24で処理されたピッチ波形122は、ピッチ波形重畳部14に入力される。ピッチ波形重畳部14では、音韻記号列100、音韻継続時間長情報101、ピッチパターン情報102及びパワー情報103などの韻律情報に基づいてピッチ・時間長制御部13より生成されるピッチ周期・時間長情報105に従ってピッチ波形122が波形重畳されることにより、合成音声106が生成される。ピッチ周期・時間長情報105によって与えられる時間長は通常、韻律情報の一部として入力される音韻継続時間長情報101で与えられる音韻継続時間と同じである。
【0038】
図6に、ピッチ波形重畳部14での重畳の様子を示す。図6(a)をオリジナルのピッチ波形とすると、ピッチ周期が比較的短い場合にピッチ波形生成部12から出力されるピッチ波形と、これをピッチ波形重畳部14でピッチ周期の間隔で時間方向に並べて重畳した波形は図6(b)に示すようになる。一方、ピッチ周期が比較的長い場合にピッチ波形生成部12から出力されるピッチ波形と、これをピッチ波形重畳部14で重畳した波形は図6(c)に示すようになる。いずれも場合も、ピッチ・時間長制御部13によって与えられるピッチ周期に応じた長さのピッチ波形が、ピッチ・時間長制御部13によって与えられる時間長にわたって重畳されることで、合成音声106が生成される。
【0039】
このようにピッチ波形生成部12においては、圧縮音声素片辞書11から出力される符号化代表音声素片のうちの符号化音源信号110をピッチ周期に応じた長さだけ復号化し、これと復号化したフィルタ係数を用いて合成フィルタ23でピッチ波形を生成している。
【0040】
このため、ピッチ周期が短い場合においてもピッチ波形の重なり度合いが減少し、合成音声106の長さの最大2倍の長さに相当するピッチ波形を生成すればよいことになるため、合成フィルタ23でのフィルタリングに要する演算量や、ピッチ波形重畳部14での重畳時の演算量を従来の音声合成方法に比べて削減できる。このように演算量が少ないことは、小型の高品質音声合成装置への応用に適している。
【0041】
また、窓掛け処理部24によってピッチ波形の不連続性に対して、打ち切られた形のピッチ波形に窓を掛けて減衰させることで、僅かな演算で合成音声106の品質劣化を抑制することができる。
【0042】
本発明は上述した実施形態に限られず、種々変更しての実施が可能である。例えば、上記実施形態ではピッチ波形を分析して得られる音源信号と合成フィルタの特性を表すフィルタ係数の組を圧縮符号化する分析合成符号化方式を用いて圧縮音声素片辞書を構成したが、ピッチ波形をADPCM(適応差分PCM)などの波形符号化方式で符号化した音声素片により圧縮音声素片辞書を構成することも可能である。その場合、ピッチ波形生成部はピッチ波形を波形符号化方式で符号化した符号化代表音声素片を復号化する際に、復号化する長さをピッチ周期の応じて制御する構成とすればよい。
【0043】
また、上記実施形態では復号化されたピッチ波形の終端を窓掛け処理により減衰させる方法を用いたが、復号化されたピッチ波形の終端に最も近い零交差点より後ろの部分を零とするなどにより終端を減衰させる処理に置き換えることも可能である。
【0044】
さらに、本発明は(a)符号化音声素片をピッチ周期に応じた長さだけ復号化することと、(b)符号化音声素片を復号化しかつ終端を減衰させることを両方組み合わせる必要は必ずしもなく、特に後者の(b)については単独で実施することも可能である。
【0045】
また、本発明は上述した音声合成の手順をコンピュータプログラムとして記録した記録媒体として実施することができる。そのような記録媒体の本発明に基づく好ましい態様を示すと、以下のようになる。
【0046】
(1)コンピュータに音声合成処理を行わせるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、圧縮符号化された音声素片群よりなる辞書から合成すべき音声の元となる音声素片を選択し、選択された音声素片を前記合成すべき音声のピッチ周期に応じた長さだけ復号化してピッチ波形を生成し、生成されたピッチ波形を前記ピッチ周期に基づき重畳して合成音声を生成する処理を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。これは本発明に基づいて(a)符号化音声素片をピッチ周期に応じた長さだけ復号化することと、(b)符号化音声素片を復号化しかつ端点における不連続性を低減させる処理を行うことのうち、前者(a)の処理のみをコンピュータに行わせるプログラムを記録した記録媒体である。
【0047】
(2)コンピュータに音声合成処理を行わせるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、圧縮符号化された音声素片群よりなる辞書から合成すべき音声の元となる音声素片を選択し、選択された音声素片を復号化しかつ端点における不連続性を低減させる処理を行うことによりピッチ波形を生成し、生成されたピッチ波形を前記ピッチ周期に基づき重畳して合成音声を生成する処理を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。これは本発明に基づいて (a)符号化音声素片をピッチ周期に応じた長さだけ復号化することと、(b)符号化音声素片を復号化しかつ終端を減衰させることのうち、前者(b)の処理のみをコンピュータに行わせるプログラムを記録した記録媒体である。
【0048】
(3)コンピュータに音声合成処理を行わせるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、圧縮符号化された音声素片群よりなる辞書から合成すべき音声の元となる音声素片を選択し、選択された音声素片を前記合成すべき音声のピッチ周期に応じた長さだけ復号化しかつ端点における不連続性を低減させる処理を行うことによりピッチ波形を生成し、生成されたピッチ波形を前記ピッチ周期に基づき重畳して合成音声を生成する処理を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。これは本発明に基づいて(a)符号化音声素片をピッチ周期に応じた長さだけ復号化することと、(b)符号化音声素片を復号化しかつ端点における不連続性を低減させる処理を行うことの両方の処理をコンピュータに行わせるプログラムを記録した記録媒体である。
【0049】
【発明の効果】
以上説明したように、本発明によれば音声合成時の演算量を減少させ、かつ合成音声の品質劣化を抑制することができる。
【図面の簡単な説明】
【図1】本発明が適用されるシステムの一例であるテキスト音声合成システムの説明図
【図2】本発明の一実施形態に係る音声合成処理の流れを示すフローチャート
【図3】同実施形態に係る音声合成装置(規則合成系)の構成を示すブロック図
【図4】同実施形態において音源信号波形からピッチ波形が生成される様子を説明する図
【図5】同実施形態における窓掛け処理部で用いる窓関数W(n)と窓掛け処理の様子を説明する図
【図6】同実施形態におけるピッチ波形の重畳の様子を説明する図
【符号の説明】
1…テキスト解析部
2…韻律制御部
3…音声波形生成部
10…素片選択部
11…圧縮音声素片辞書
12…ピッチ波形生成部
13…ピッチ・時間長制御部
14…ピッチ波形重畳部
20…音源信号復号化部
21…フィルタ係数復号化部
22…音源信号長調整部
23…合成フィルタ
24…窓掛け処理部
100…音韻記号列
101…音韻継続時間長情報
102…ピッチパターン情報
103…パワー情報
104…ピッチ周期情報
105…ピッチ周期・時間長情報
106…合成音声
110…符号化音源信号
111…符号化フィルタ係数
120…音源信号
121…フィルタ係数
122…ピッチ波形

Claims (4)

  1. ピッチ波形が圧縮符号化された音源信号とフィルタ係数との組からなる音声素片群よりなる辞書から合成すべき音声の元となる音声素片を選択するステップと、
    選択された音声素片の音源信号とフィルタ係数とを復号化し、該音源信号は前記合成すべき音声のピッチ周期に応じて長さが調整され、長さが調整された音源信号を復号化されたフィルタ係数をもとにフィルタリングしてピッチ波形を生成するステップと、
    生成されたピッチ波形を前記ピッチ周期の間隔で時間軸方向に並べて重畳することにより合成音声を生成するステップと
    を有することを特徴とする音声合成方法。
  2. 前記ピッチ波形を生成するステップは、更に端点における不連続性を低減させる処理を行うことを特徴とする請求項1に記載の音声合成方法。
  3. ピッチ波形が圧縮符号化された音源信号とフィルタ係数との組からなる音声素片群よりなる辞書から合成すべき音声の元となる音声素片を選択する素片選択部と、
    選択された音声素片の音源信号とフィルタ係数とを復号化し、該音源信号は前記合成すべき音声のピッチ周期に応じて長さが調整され、長さが調整された音源信号を復号化されたフィルタ係数をもとにフィルタリングし、かつ端点における不連続性を低減させる処理を行うことによりピッチ波形を生成するピッチ波形生成部と、
    生成されたピッチ波形を前記ピッチ周期の間隔で時間軸方向に並べて重畳することにより合成音声を生成するピッチ波形重畳部と
    を有することを特徴とする音声合成装置。
  4. コンピュータに音声合成処理を行わせるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    ピッチ波形が圧縮符号化された音源信号とフィルタ係数との組からなる音声素片群よりなる辞書から合成すべき音声の元となる音声素片を選択し、選択された音声素片の音源信号とフィルタ係数とを復号化し、該音源信号は前記合成すべき音声のピッチ周期に応じて長さが調整され、長さが調整された音源信号を復号化されたフィルタ係数をもとにフィルタリングし、かつ端点における不連続性を低減させる処理を行うことによりピッチ波形を生成し、生成されたピッチ波形を前記ピッチ周期の間隔で時間軸方向に並べて重畳することにより合成音声を生成する処理を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2000099961A 2000-03-31 2000-03-31 音声合成方法及び装置 Expired - Lifetime JP3949346B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000099961A JP3949346B2 (ja) 2000-03-31 2000-03-31 音声合成方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000099961A JP3949346B2 (ja) 2000-03-31 2000-03-31 音声合成方法及び装置

Publications (2)

Publication Number Publication Date
JP2001282280A JP2001282280A (ja) 2001-10-12
JP3949346B2 true JP3949346B2 (ja) 2007-07-25

Family

ID=18614233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000099961A Expired - Lifetime JP3949346B2 (ja) 2000-03-31 2000-03-31 音声合成方法及び装置

Country Status (1)

Country Link
JP (1) JP3949346B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546241B2 (en) 2002-06-05 2009-06-09 Canon Kabushiki Kaisha Speech synthesis method and apparatus, and dictionary generation method and apparatus

Also Published As

Publication number Publication date
JP2001282280A (ja) 2001-10-12

Similar Documents

Publication Publication Date Title
KR940002854B1 (ko) 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP5047268B2 (ja) Mdct係数を使用する音声後処理
JP4162933B2 (ja) 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正
JP3653826B2 (ja) 音声復号化方法及び装置
KR101586317B1 (ko) 신호 처리 방법 및 장치
CN102169692B (zh) 信号处理方法和装置
JP2019511738A (ja) ハイブリッドコンシールメント方法:オーディオコーデックにおける周波数および時間ドメインパケットロスの組み合わせ
JPH1055199A (ja) 音声符号化並びに復号化方法及びその装置
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP3949346B2 (ja) 音声合成方法及び装置
JP4867076B2 (ja) 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
US11915714B2 (en) Neural pitch-shifting and time-stretching
JP3756864B2 (ja) 音声合成方法と装置及び音声合成プログラム
JP2003066982A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP3731575B2 (ja) 符号化装置及び復号装置
JP4619469B2 (ja) 音声合成装置及び音声合成方法並びに音声合成プログラムを記録した記録媒体
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP2650355B2 (ja) 音声分析合成装置
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JPH0876799A (ja) 広帯域音声信号復元方法
JPH09160595A (ja) 音声合成方法
JPH0772897A (ja) 音声合成方法および装置
JPH08160991A (ja) 音声素片作成方法および音声合成方法、装置
JP2002244693A (ja) 音声合成装置および音声合成方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041217

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041224

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050225

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070418

R151 Written notification of patent or utility model registration

Ref document number: 3949346

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100427

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 7

EXPY Cancellation because of completion of term