JP3901475B2 - 信号結合装置、信号結合方法及びプログラム - Google Patents
信号結合装置、信号結合方法及びプログラム Download PDFInfo
- Publication number
- JP3901475B2 JP3901475B2 JP2001201408A JP2001201408A JP3901475B2 JP 3901475 B2 JP3901475 B2 JP 3901475B2 JP 2001201408 A JP2001201408 A JP 2001201408A JP 2001201408 A JP2001201408 A JP 2001201408A JP 3901475 B2 JP3901475 B2 JP 3901475B2
- Authority
- JP
- Japan
- Prior art keywords
- input signals
- signal
- filtering
- bandwidth
- output signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010168 coupling process Methods 0.000 title claims description 21
- 230000008878 coupling Effects 0.000 title claims description 20
- 238000005859 coupling reaction Methods 0.000 title claims description 20
- 238000001914 filtration Methods 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 37
- 238000001228 spectrum Methods 0.000 claims description 32
- 238000001308 synthesis method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 101100488882 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YPL080C gene Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Telephonic Communication Services (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Description
【発明の属する技術分野】
この発明は、信号結合装置及び信号結合方法に関し、特に、波形を表す信号を結合するための信号結合装置及び信号結合方法に関する。
【0002】
【従来の技術】
近年、音声合成の技術により合成された音声が広く利用されている。具体的には、たとえば、テキスト読み上げソフトウェアや、電話番号案内や、株式案内、旅行案内、店舗案内、交通情報など、多くの場面で利用されている。
【0003】
音声合成の手法には、大別して、波形編集方式と、規則合成方式とがある。
規則合成方式は、音声を合成する対象のテキストについて形態素解析を行い、解析の結果に基づき、テキストに音韻論的処理を施すことにより音声を生成する手法である。規則合成方式では、音声合成に用いるテキストの内容についての制約が少なく、多様な内容のテキストを音声合成に用いることができる。しかし、規則合成方式では、波形編集方式に比べ、出力される音声の品質が劣っている。
【0004】
一方、波形編集方式は、人間が実際に発話した音声を録音して、録音した音声を分割して得られる構成部分をつなぎ合わせることにより、目的とする音声を得る手法である。波形編集方式は、音声の品質の点で規則合成方式より有利である。
しかし、波形編集方式では、録音された音声から取り出すことのできない部分を含む音声は合成できない。このため、録音された音声を分割する単位が大きいほど、合成する音声についての制約が多くなる。
このため、波形編集方式では、録音された音声を個々の母音や子音のレベルにまで細分化することにより、多様な音声を合成できるようにする手法も提案されている。
【0005】
【発明が解決しようとする課題】
しかし、録音した音声の構成部分をつなぎ合わせる接続部分の波形は、たとえば図6(a)に示すように不連続となり、これがノイズの発生源になる。そして、録音された音声を細分化する単位が小さい場合、接続部分が不連続であることにより生じるこのノイズが目立つようになり、合成音声の品質の低下を招く。
【0006】
このノイズを軽減する手法としては、たとえば、図6(b)に示すように、不連続な接続部分を直線で接続し改善する手法が考えられる。しかし、接続された部分は高調波成分を発生することとなり、この高調波成分もノイズとなる。
【0007】
また、接続部分が不連続であることにより生じるノイズを軽減する手法としてはMDS(Minimum Distance Search)方式がある。MDS方式は、図6(c)に示すように、2個の波形をつなぎ合わせる際、前に来る波形のうちなるべく後端に近い部分と、後ろに来る波形のうちなるべく前端に近い部分とから、瞬時値と接線の勾配とが互いにほぼ一致する点を1個ずつ探し出して、これらの点同士を接続するという手法である。
しかし、MDS方式では、波形相互の接続部分が、つなぎ合わされる各波形の端ではないことが通常である。このため、つなぎ合わされる波形の一部は通常切り捨てられることになり、この結果、合成音声が不自然なものとなる。
【0008】
この発明は上記実状に鑑みてなされたものであり、ノイズが少なく、あるいは自然な合成音声を生成できる信号結合装置及び信号結合方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記目的を達成すべく、この発明の第1の観点にかかる信号結合装置は、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれフーリエ変換し、当該フーリエ変換の結果に基づいて、当該2個の入力信号のスペクトルの上限の周波数を特定し、当該上限の周波数に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、を備え、
前記フィルタリング手段がフィルタリングする前記2個の入力信号の結合部分について、当該結合部分の先頭から当該2個の入力信号の境界までの時間長は、当該2個の入力信号のうち先行するものの時間長の10分の1以下であり、当該境界から当該結合部分の末尾までの時間長は、当該2個の入力信号のうち後続するものの時間長の10分の1以下である、
ことを特徴とする。
【0010】
このような信号結合装置により結合される2個の入力信号の結合部分は、これらの入力信号のスペクトルの上限の周波数で決まる帯域幅でフィルタリングされるので、出力信号は、高調波成分に起因するノイズが少ないものとなる。また、このような信号結合装置は、入力信号の端を切り捨てることがないので、入力信号が音声の波形を表す場合、自然な合成音声を生成する。
【0013】
また、この発明の第2の観点にかかる信号結合装置は、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれハイパスフィルタによりフィルタリングした結果の振幅に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、を備える、
ことを特徴とする。
【0014】
このような信号結合装置により結合される2個の入力信号の結合部分は、これらの入力信号の高域成分の内容に基づいて決まる帯域幅でフィルタリングされるので、出力信号から、高調波成分に起因するノイズを除去することが可能となる。また、このような信号結合装置は、入力信号の端を切り捨てることがないので、入力信号が音声の波形を表す場合、自然な合成音声を生成する。
【0015】
また、この発明の第3の観点にかかる信号結合方法は、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成し、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれフーリエ変換し、当該フーリエ変換の結果に基づいて、当該2個の入力信号のスペクトルの上限の周波数を特定し、当該上限の周波数に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定し、
前記出力信号のうち、前記2個の入力信号の結合部分を、決定した帯域幅でフィルタリングする、
ことを特徴とする。
【0016】
このような信号結合方法により結合される2個の入力信号の結合部分は、これらの入力信号のスペクトルの上限の周波数で決まる帯域幅でフィルタリングされるので、出力信号は、高調波成分に起因するノイズが少ないものとなる。また、このような信号結合方法では、入力信号の端が切り捨てられることがないので、入力信号が音声の波形を表す場合、自然な合成音声が生成される。
【0017】
また、この発明の第4の観点にかかる信号結合方法は、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成し、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれハイパスフィルタによりフィルタリングした結果の振幅に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定し、
前記出力信号のうち、前記2個の入力信号の結合部分を、決定した帯域幅でフィルタリングする、
ことを特徴とする信号結合方法であって、
フィルタリングする前記2個の入力信号の結合部分について、当該結合部分の先頭から当該2個の入力信号の境界までの時間長は、当該2個の入力信号のうち先行するものの時間長の10分の1以下であり、当該境界から当該結合部分の末尾までの時間長は、当該2個の入力信号のうち後続するものの時間長の10分の1以下である、
ことを特徴とする。
【0018】
このような信号結合方法により結合される2個の入力信号の結合部分は、これらの入力信号の高域成分の内容に基づいて決まる帯域幅でフィルタリングされるので、出力信号から、高調波成分に起因するノイズを除去することが可能となる。また、このような信号結合方法では、入力信号の端が切り捨てられることがないので、入力信号が音声の波形を表す場合、自然な合成音声が生成される。
【0019】
また、この発明の第5の観点にかかるプログラムは、
コンピュータを、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれフーリエ変換し、当該フーリエ変換の結果に基づいて、当該2個の入力信号のスペクトルの上限の周波数を特定し、当該上限の周波数に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、
して機能させるためのプログラムであって、
前記フィルタリング手段がフィルタリングする前記2個の入力信号の結合部分について、当該結合部分の先頭から当該2個の入力信号の境界までの時間長は、当該2個の入力信号のうち先行するものの時間長の10分の1以下であり、当該境界から当該結合部分の末尾までの時間長は、当該2個の入力信号のうち後続するものの時間長の10分の1以下である、
ことを特徴とする。
【0020】
このようなプログラムを実行するコンピュータにより結合される2個の入力信号の結合部分は、これらの入力信号のスペクトルの上限の周波数で決まる帯域幅でフィルタリングされるので、出力信号は、高調波成分に起因するノイズが少ないものとなる。また、このようなプログラムを実行するコンピュータは、入力信号の端を切り捨てることがないので、入力信号が音声の波形を表す場合、自然な合成音声を生成する。
【0021】
また、この発明の第6の観点にかかるプログラムは、
コンピュータを、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれハイパスフィルタによりフィルタリングした結果の振幅に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、
して機能させるためのものであることを特徴とする。
【0022】
このようなプログラムを実行するコンピュータにより結合される2個の入力信号の結合部分は、これらの入力信号の高域成分の内容に基づいて決まる帯域幅でフィルタリングされるので、このコンピュータによれば、出力信号から高調波成分に起因するノイズを除去することが可能となる。また、このようなプログラムを実行するコンピュータは、入力信号の端を切り捨てることがないので、入力信号が音声の波形を表す場合、自然な合成音声を生成する。
【0023】
【発明の実施の形態】
以下に、図面を参照して、この発明の実施の形態を、音声合成装置を例として説明する。
この発明の実施の形態に係る音声合成装置10は図1に示すように、予め録音した音声を個々の母音や子音のレベルに細分化することによって得られる波形信号が入力端IN−A及びIN−Bから供給され、その供給された波形信号を合成した合成音声信号が出力端OUTから出力される基本構成から成っている。
【0024】
この音声合成装置10は、具体的な内部構成を図2に示すように、入力端IN−Aに連なった遅延部1A及びフーリエ変換部2Aと、入力端IN−Bに連なった遅延部1B及びフーリエ変換部及び2Bと、加算部3と、フィルタ特性決定部4と、LPF(ローパスフィルタ)5と、入力端IN−A及びIN−Bと、出力端OUTとから構成されている。
【0025】
遅延部1A及び1Bは、互いに実質的に同一の構成を有しており、それぞれ、たとえばシフトレジスタ等の遅延回路や、DSP(Digital Signal Processor)やCPU(Central Processing Unit)等から構成されている。遅延部1Aは入力端IN−Aに接続されており、遅延部1Bは入力端IN−Bに接続されている。
【0026】
遅延部1Aは、入力端IN−Aより信号を供給されると、この信号を一定時間遅延させて加算部3に供給する。遅延部1Bは、入力端IN−Bより信号を供給されると、この信号を一定時間遅延させて加算部3に供給する。
【0027】
なお、遅延部1A及び1Bが各自に供給された信号を遅延させる時間長は、実質的に同一である。この時間長は、フィルタ特性決定部4がLPF5へと後述の制御信号を供給するタイミングが後述する通りとなるよう選ばれている。
【0028】
フーリエ変換部2A及び2Bは、互いに実質的に同一の構成を有しており、それぞれ、DSPやCPU等から構成されている。フーリエ変換部2Aは入力端IN−Aに接続されており、フーリエ変換部2Bは入力端IN−Bに接続されている。従って、フーリエ変換部2A及び遅延部1Aには、入力端IN−Aから同一の信号が実質的に同時に供給される。また、フーリエ変換部2B及び遅延部1Bには、入力端IN−Bから同一の信号が実質的に同時に供給される。
【0029】
フーリエ変換部2Aは、入力端IN−Aより波形を表す信号を供給されると、高速フーリエ変換の手法(あるいは、信号をフーリエ変換した結果を表すデータを生成する他の任意の手法)により、この信号が表す波形のスペクトルを表すスペクトルデータを生成し、フィルタ特性決定部4へと供給する。フーリエ変換部2Bは、入力端IN−Bより波形を表す信号を供給されると、フーリエ変換部2Aと実質的に同一の動作を行い、この信号が表す波形のスペクトルを表すスペクトルデータを生成して、フィルタ特性決定部4へと供給する。
【0030】
加算部3は、加算回路等より構成されている。加算部3は、遅延部1Aより供給される信号の値と遅延部1Bより供給される信号の値の和を表す信号を生成して、LPF5へと供給する。
【0031】
フィルタ特性決定部4は、DSPやCPUより構成されている。フィルタ特性決定部4は、フーリエ変換部2A及び2Bよりそれぞれスペクトルデータを供給されると、これらのスペクトルデータに基づいて、LPF5のカットオフ周波数(具体的には、たとえばLPF5の利得が高周波側でピークより3デシベル低下する周波数)を決定し、決定したカットオフ周波数を示す制御信号を生成してLPF5に供給する。
【0032】
具体的には、フィルタ特性決定部4は、たとえば図3(a)に示すように、フーリエ変換部2Aより供給されたスペクトルデータが示すスペクトルSaの強度が高周波側でピークより20デシベル減衰する周波数を、このスペクトルSaの上限faと特定する。また、フィルタ特性決定部4は、たとえば図3(b)に示すように、フーリエ変換部2Bから供給されたスペクトルデータが示すスペクトルSbの強度が高周波側でピークより20デシベル減衰する周波数を、このスペクトルSbの上限fbとして特定する。そして、特定した2個の周波数fa及びfbのうち高い方の値を、LPF5のカットオフ周波数と決定する。なお、図3(c)は、fa<fbである場合のLPF5の周波数特性(ただし、制御信号がLPF5に供給されている間の周波数特性)を示すグラフである。
【0033】
LPF5は、たとえば、FIR(Finite Inpulse Response)型のディジタルフィルタ等より構成されている。LPF5は、加算部3より供給された信号をフィルタリングして出力する。LPF5は、フィルタリングの特性を、フィルタ特性決定部4からの制御信号の供給の有無、及び、この制御信号が示す周波数に基づいて決定する。
【0034】
具体的には、LPF5は、たとえば、フィルタ特性決定部4から制御信号が供給されている間は、加算部3より供給された信号が表す波形のうち、この制御信号が示す周波数をカットオフ周波数とするような512次のローパスフィルタを通過する成分を表す信号を生成し、生成した信号を、フィルタリングの結果を表す信号として出力端OUTより出力する。
一方、LPF5は、制御信号を供給されていない間は、加算部3より供給された信号を実質的にフィルタリングすることなくそのまま出力端OUTより出力する。
【0035】
この音声合成装置に音声の合成を行わせるには、入力端IN−A及びIN−Bに、波形信号を交互に供給する。すなわち、たとえば図4(a)及び(b)に示すように、n番目(nは任意の正の奇数)の波形信号s(n)を入力端IN−Aに供給したとすると、n番目の波形信号が終端に達するのと実質的に同時に、入力端IN−Bに、(n+1)番目の波形信号s(n+1)の供給を開始する、というようにして、波形信号を順次供給する。
【0036】
入力端IN−Aにn番目の波形信号が供給され、入力端IN−Bに(n+1)番目の波形信号が供給されると、n番目の波形信号は遅延部1Aにより遅延を受け、また、(n+1)番目の波形信号は遅延部1Bにより遅延を受けた上で、加算部3に供給される。遅延部1A及び1Bが信号を遅延させる時間長(図4(b)及び(c)で「t0」として示す時間長)は互いに実質的に等しいので、加算部3からは、図4(c)に示すように、n番目の波形信号と(n+1)番目の波形信号とが実質的に隙間なく連続してLPF5に供給される。
【0037】
一方、n番目の波形信号はフーリエ変換部2Aにも供給され、(n+1)番目の波形信号はフーリエ変換部2Bにも供給される。すると、フーリエ変換部2Aは、n番目の波形信号が表す波形のスペクトルを表すスペクトルデータを生成し、フィルタ特性決定部4へと供給する。また、フーリエ変換部2Bは、(n+1)番目の波形信号が表す波形のスペクトルを表すスペクトルデータを生成し、フィルタ特性決定部4へと供給する。
【0038】
フィルタ特性決定部4は、n番目及び(n+1)番目の波形信号のスペクトルを表す2個のスペクトルデータを供給されると、これらのスペクトルデータが示す各々のスペクトルの強度が高周波側で平均値より20デシベル減衰する周波数を特定する。そして、特定した2個の周波数のうち高い方の値を、LPF5のカットオフ周波数と決定し、決定したカットオフ周波数を示す制御信号をLPF5に供給する。
【0039】
n番目及び(n+1)番目の波形信号に基づいて決定されたカットオフ周波数を示す制御信号は、図4(d)にタイミングを示すように、加算部3が出力する信号がn番目の波形信号から(n+1)番目の波形信号へと切り替わる時点(図4(d)で「T(n)」として示す時点)を含む期間、フィルタ特性決定部4からLPF5へと供給される。(なお、理解を容易にするため、本明細書及び図面においては、LPF5自身による信号伝搬の遅延時間は無視できる程度に短いものとする。)
【0040】
なお、この音声合成装置が出力する音声信号が表す音声の劣化を防ぐために、制御信号の供給開始から波形信号が切り替わる時点までの時間長は、n番目の波形信号の時間長(図4(a)で「L(n)」として示す時間長)の10分の1以下とすることが望ましい。また、波形信号が切り替わる時点から制御信号の供給終了までの時間長は、(n+1)目の波形信号の時間長(図4(b)で「L(n+1)」として示す時間長)の10分の1以下とすることが望ましい。
【0041】
そして、LPF5は、
(A) (n−1)番目及びn番目の波形信号に基づいて決定された周波数を示す制御信号の供給が終了してから、n番目及び(n+1)番目の波形信号に基づいて決定された周波数を示す制御信号が供給されるまでの期間(図4(d)で「t1」として示す期間)は、n番目の波形信号を、実質的にフィルタリングすることなく出力端OUTから出力し、
(B) n番目及び(n+1)番目の波形信号に基づいて決定された周波数を示す制御信号が供給されている期間(図4(d)で「t2」として示す期間)は、この周波数をカットオフ周波数とする512次のローパスフィルタを通過する成分を表す信号を生成して出力端OUTより出力し、
(C) n番目及び(n+1)番目の波形信号に基づいて決定された周波数を示す制御信号の供給が終了してから、(n+1)番目及び(n+2)番目の波形信号に基づいて決定された周波数を示す制御信号が供給されるまでの期間(図4(d)で「t3」として示す期間)は、(n+1)番目の波形信号を、実質的にフィルタリングすることなく出力端OUTから出力する。
【0042】
LPF5が上述した通りにフィルタリングを行う結果、n番目及び(n+1)番目の波形信号が、不要な高調波成分を生じることなく、また、各波形に元来含まれていた周波数成分を実質的に損なうことなく、互いに結合される。従って、結合された波形信号が表す音声は、ノイズが少なく、また、自然に聞こえるものとなる。
【0043】
なお、この音声合成装置の構成は上述のものに限られない。
たとえば、LPF5のフィルタ段数は任意であり、また、フーリエ変換部2A及び2Bが供給するスペクトルデータが示すスペクトルの上限の周波数の定義の仕方や、LPF5のカットオフ周波数の定義の仕方も、上述の定義に限らず任意である。
また、遅延部1A、遅延部1B、フーリエ変換部2A、フーリエ変換部2B、加算部3、フィルタ特性決定部4及びLPF5の機能の全部又は一部を、単一のDSPやCPUが行ってもよい。
【0044】
また、この音声合成装置は、入力端IN−A及びIN−Bに代えて、波形信号が記録された記録媒体(たとえば、フレキシブルディスクや、MO(Magneto-Optical Disk)など)から波形信号を読み出して遅延部1A及び1Bやフーリエ変換部2A及び2Bに供給する記録媒体ドライブ装置(たとえば、フレキシブルディスクドライブや、MOドライブなど)を備えていてもよい。
また、この音声合成装置は、出力端OUTに代えて、LPF5が生成した信号を記録媒体に書き込む記録媒体ドライブ装置を備えていてもよい。
なお、同一の記録媒体ドライブ装置が、記録媒体からの波形信号を読み出す機能とLPF5が生成した信号を記録媒体に書き込む機能とを両方行うようにしてもよい。
【0045】
なお、入力端IN−A又はIN−Bに供給される波形信号は、無音状態を表すものであっても差し支えない。有音状態を表す波形信号と無音状態を表す波形信号とが結合されることにより、有音状態を表す信号の端を含む部分(具体的には、たとえば、音声の始まりや終わり、あるいは息継ぎ部分など)がノイズを発生することが避けられ、またこの部分が自然に聞こえるものとなる。
【0046】
また、この発明の音声合成装置においては必ずしもフーリエ変換部2A及び2Bを必要とせず、その代わりに、例えば入力端IN−A及びIN−Bに供給される波形信号の候補を識別する識別データとこの候補のスペクトルの上限の周波数を示す周波数データとを互いに対応付けて格納記憶するテーブルを備える手法が考えられる。
この手法の場合、入力端IN−A及びIN−Bに供給された波形信号を識別する識別データを別途外部より取得し、その取得した識別データに対応付けられた周波数データをテーブルから読み出してフィルタ特性決定部4に供給し、フィルタ特性決定部4は、その周波数データが示す周波数のうち高い方の値を、LPF5のカットオフ周波数と決定する。
【0047】
また、図5に示すように、この音声合成装置は、フーリエ変換部2A及び2Bに代えてHPF(ハイパスフィルタ)6A及び6Bを備えていてもよい。
HPF6A及び6Bは、互いに実質的に同一の構成を有しており、それぞれ、たとえばIIR(Infinite Inpulse Response)型のディジタルフィルタ等より構成されている。
【0048】
HPF6Aは入力端IN−Aに接続されており、HPF6Bは入力端IN−Bに接続されていて、HPF6A及び遅延部1Aには、入力端IN−Aから同一の信号が実質的に同時に供給され、HPF6B及び遅延部1Bには、入力端IN−Bから同一の信号が実質的に同時に供給される。
【0049】
HPF6Aは、入力端IN−Aより波形を表す信号を供給されると、この信号のうち所定のカットオフ周波数以下の成分を実質的に遮断し、他の成分フィルタ特性決定部4へと供給する。HPF6Bは、入力端IN−Bより供給された信号のうち所定のカットオフ周波数以下の成分を実質的に遮断し、他の成分フィルタ特性決定部4へと供給する。なお、HPF6A及び6Bのカットオフ周波数は、互いに実質的に等しいものとする。
【0050】
この音声合成装置がフーリエ変換部2A及び2Bに代えてHPF6A及び6Bを備えている場合、フィルタ特性決定部4は、HPF6A及び6Bよりそれぞれ供給された波形信号の成分に基づいて(具体的には、たとえばHPF6Aが供給した成分の振幅及びHPF6Bが供給した成分の振幅のうち大きい方の値に基づいて)、LPF5のカットオフ周波数を決定するものとする。
【0051】
この音声合成装置がフーリエ変換部2A及び2Bに代えてHPF6A及び6Bを備えていれば、比較的複雑なフーリエ変換の処理が省略されるので、この音声合成装置の処理をより高速にすることが可能になる。
【0052】
以上、この発明の実施の形態を説明したが、この発明にかかる信号結合装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。
例えば、パーソナルコンピュータに上述の遅延部1A(又はHPF6A)、遅延部1B(又は)HPF6B、フーリエ変換部2A、フーリエ変換部2B、加算部3、フィルタ特性決定部4及びLPF5の動作を実行させるためのプログラムを格納した媒体(CD−ROM、MO、フレキシブルディスク等)から該プログラムをインストールすることにより、上述の処理を実行する音声合成装置を構成することができる。
【0053】
また、例えば、通信回線の掲示板(BBS)に当該プログラムを掲示し、これを通信回線を介して配信してもよく、また、当該プログラムを表す信号により搬送波を変調し、得られた変調波を伝送し、この変調波を受信した装置が変調波を復調して当該プログラムを復元するようにしてもよい。
そして、当該プログラムを起動し、OSの制御下に、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行することができる。
【0054】
なお、OSが処理の一部を分担する場合、あるいは、OSが本願発明の1つの構成要素の一部を構成するような場合には、記録媒体には、その部分を除いたプログラムを格納してもよい。この場合も、この発明では、その記録媒体には、コンピュータが実行する各機能又はステップを実行するためのプログラムが格納されているものとする。
【0055】
【発明の効果】
以上説明したように、この発明によれば、ノイズが少なく、あるいは自然な合成音声を生成できる信号結合装置及び信号結合方法が実現される。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る音声合成装置を示す図である。
【図2】この発明の実施の形態に係る音声合成装置の内部構成を示すブロック図である。
【図3】(a)は、入力端IN−Aに供給された信号のスペクトルを表すグラフであり、(b)は、入力端IN−Bに供給された信号のスペクトルを表すグラフであり、(c)は、LPFの周波数特性を表すグラフである。
【図4】(a)は、入力端IN−Aに供給された波形信号を表すグラフであり、(b)は、入力端IN−Bに供給された波形信号を表すグラフであり、(c)は、加算部が出力する信号を表すグラフであり、(d)は、LPFが出力する信号を表すグラフである。
【図5】図2の音声合成装置の変形例の内部構成を示すブロック図である。
【図6】(a)は、つなぎ合わされる信号が不連続になる様子を表す図であり、(b)は、不連続部分を直線で接続する従来の手法を表す図であり、(c)は、MDS方式により信号をつなぎ合わせた様子を表す図である。
【符号の説明】
1A、1B 遅延部
2A、2B フーリエ変換部
3 加算部
4 フィルタ特性決定部
5 LPF
6A、6B HPF
10 音声合成装置
Claims (6)
- 波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれフーリエ変換し、当該フーリエ変換の結果に基づいて、当該2個の入力信号のスペクトルの上限の周波数を特定し、当該上限の周波数に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、を備え、
前記フィルタリング手段がフィルタリングする前記2個の入力信号の結合部分について、当該結合部分の先頭から当該2個の入力信号の境界までの時間長は、当該2個の入力信号のうち先行するものの時間長の10分の1以下であり、当該境界から当該結合部分の末尾までの時間長は、当該2個の入力信号のうち後続するものの時間長の10分の1以下である、
ことを特徴とする信号結合装置。 - 波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれハイパスフィルタによりフィルタリングした結果の振幅に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、を備える、
ことを特徴とする信号結合装置。 - 波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成し、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれフーリエ変換し、当該フーリエ変換の結果に基づいて、当該2個の入力信号のスペクトルの上限の周波数を特定し、当該上限の周波数に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定し、
前記出力信号のうち、前記2個の入力信号の結合部分を、決定した帯域幅でフィルタリングする、
ことを特徴とする信号結合方法であって、
フィルタリングする前記2個の入力信号の結合部分について、当該結合部分の先頭から当該2個の入力信号の境界までの時間長は、当該2個の入力信号のうち先行するものの時間長の10分の1以下であり、当該境界から当該結合部分の末尾までの時間長は、当該2個の入力信号のうち後続するものの時間長の10分の1以下である、
ことを特徴とする信号結合方法。 - 波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成し、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれハイパスフィルタによりフィルタリングした結果の振幅に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定し、
前記出力信号のうち、前記2個の入力信号の結合部分を、決定した帯域幅でフィルタリングする、
ことを特徴とする信号結合方法。 - コンピュータを、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれフーリエ変換し、当該フーリエ変換の結果に基づいて、当該2個の入力信号のスペクトルの上限の周波数を特定し、当該上限の周波数に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、
して機能させるためのプログラムであって、
前記フィルタリング手段がフィルタリングする前記2個の入力信号の結合部分について、当該結合部分の先頭から当該2個の入力信号の境界までの時間長は、当該2個の入力信号のうち先行するものの時間長の10分の1以下であり、当該境界から当該結合部分の末尾までの時間長は、当該2個の入力信号のうち後続するものの時間長の10分の1以下である、
ことを特徴とするプログラム。 - コンピュータを、
波形を表す複数の入力信号を入力し、各該入力信号を互いに結合して出力信号を生成する結合手段と、
入力した前記出力信号内で互いに隣接する2個の入力信号をそれぞれハイパスフィルタによりフィルタリングした結果の振幅に基づいて、当該2個の入力信号の結合部分をフィルタリングする帯域幅を決定する帯域幅決定手段と、
前記出力信号のうち、前記2個の入力信号の結合部分を、前記帯域幅決定手段が決定した帯域幅でフィルタリングするフィルタリング手段と、
して機能させるためのプログラム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001201408A JP3901475B2 (ja) | 2001-07-02 | 2001-07-02 | 信号結合装置、信号結合方法及びプログラム |
DE60233658T DE60233658D1 (de) | 2001-07-02 | 2002-06-27 | Konkatenation von Sprachsignalen |
PCT/JP2002/006479 WO2003005342A1 (fr) | 2001-07-02 | 2002-06-27 | Procede et appareil de couplage de signaux |
US10/362,870 US7739112B2 (en) | 2001-07-02 | 2002-06-27 | Signal coupling method and apparatus |
EP02738817A EP1403851B1 (en) | 2001-07-02 | 2002-06-27 | Concatenation of voice signals |
DE0001403851T DE02738817T1 (de) | 2001-07-02 | 2002-06-27 | Signalkoppelverfahren und -vorrichtung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001201408A JP3901475B2 (ja) | 2001-07-02 | 2001-07-02 | 信号結合装置、信号結合方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003015681A JP2003015681A (ja) | 2003-01-17 |
JP3901475B2 true JP3901475B2 (ja) | 2007-04-04 |
Family
ID=19038376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001201408A Expired - Fee Related JP3901475B2 (ja) | 2001-07-02 | 2001-07-02 | 信号結合装置、信号結合方法及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US7739112B2 (ja) |
EP (1) | EP1403851B1 (ja) |
JP (1) | JP3901475B2 (ja) |
DE (2) | DE60233658D1 (ja) |
WO (1) | WO2003005342A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7440902B2 (en) * | 2002-04-12 | 2008-10-21 | International Business Machines Corporation | Service development tool and capabilities for facilitating management of service elements |
US7533026B2 (en) * | 2002-04-12 | 2009-05-12 | International Business Machines Corporation | Facilitating management of service elements usable in providing information technology service offerings |
US7562022B2 (en) * | 2002-04-12 | 2009-07-14 | International Business Machines Corporation | Packaging and distributing service elements |
JP4396646B2 (ja) * | 2006-02-07 | 2010-01-13 | ヤマハ株式会社 | 応答波形合成方法、応答波形合成装置、音響設計支援装置および音響設計支援プログラム |
JP4973492B2 (ja) * | 2007-01-30 | 2012-07-11 | 株式会社Jvcケンウッド | 再生装置、再生方法及び再生プログラム |
JP4470122B2 (ja) * | 2007-06-18 | 2010-06-02 | 株式会社アクセル | 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム |
US20090167947A1 (en) * | 2007-12-27 | 2009-07-02 | Naoko Satoh | Video data processor and data bus management method thereof |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3678416A (en) * | 1971-07-26 | 1972-07-18 | Richard S Burwen | Dynamic noise filter having means for varying cutoff point |
JPH0632037B2 (ja) * | 1985-12-13 | 1994-04-27 | 松下電工株式会社 | 音声合成装置 |
FR2636163B1 (fr) * | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
DE69028072T2 (de) * | 1989-11-06 | 1997-01-09 | Canon Kk | Verfahren und Einrichtung zur Sprachsynthese |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JPH05273998A (ja) * | 1992-03-30 | 1993-10-22 | Toshiba Corp | 音声符号化装置 |
GB2272615A (en) * | 1992-11-17 | 1994-05-18 | Rudolf Bisping | Controlling signal-to-noise ratio in noisy recordings |
US5463715A (en) * | 1992-12-30 | 1995-10-31 | Innovation Technologies | Method and apparatus for speech generation from phonetic codes |
JPH0772897A (ja) * | 1993-09-01 | 1995-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法および装置 |
JPH08254993A (ja) * | 1995-03-16 | 1996-10-01 | Toshiba Corp | 音声合成装置 |
JPH08335095A (ja) * | 1995-06-02 | 1996-12-17 | Matsushita Electric Ind Co Ltd | 音声波形接続方法 |
US6240384B1 (en) * | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
BE1010336A3 (fr) * | 1996-06-10 | 1998-06-02 | Faculte Polytechnique De Mons | Procede de synthese de son. |
JP3669129B2 (ja) * | 1996-11-20 | 2005-07-06 | ヤマハ株式会社 | 音信号分析装置及び方法 |
JPH10187195A (ja) * | 1996-12-26 | 1998-07-14 | Canon Inc | 音声合成方法および装置 |
US6490562B1 (en) * | 1997-04-09 | 2002-12-03 | Matsushita Electric Industrial Co., Ltd. | Method and system for analyzing voices |
JPH11352996A (ja) * | 1998-06-10 | 1999-12-24 | Nec Corp | 音声規則合成装置 |
DE19861167A1 (de) * | 1998-08-19 | 2000-06-15 | Christoph Buskies | Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten sowie Vorrichtungen zur Bereitstellung koartikulationsgerecht konkatenierter Audiodaten |
US6144939A (en) * | 1998-11-25 | 2000-11-07 | Matsushita Electric Industrial Co., Ltd. | Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains |
JP3410387B2 (ja) * | 1999-04-27 | 2003-05-26 | 株式会社エヌ・ティ・ティ・データ | 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体 |
-
2001
- 2001-07-02 JP JP2001201408A patent/JP3901475B2/ja not_active Expired - Fee Related
-
2002
- 2002-06-27 DE DE60233658T patent/DE60233658D1/de not_active Expired - Lifetime
- 2002-06-27 DE DE0001403851T patent/DE02738817T1/de active Pending
- 2002-06-27 EP EP02738817A patent/EP1403851B1/en not_active Expired - Fee Related
- 2002-06-27 WO PCT/JP2002/006479 patent/WO2003005342A1/ja active Application Filing
- 2002-06-27 US US10/362,870 patent/US7739112B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20040015359A1 (en) | 2004-01-22 |
DE60233658D1 (de) | 2009-10-22 |
EP1403851A4 (en) | 2005-10-26 |
WO2003005342A1 (fr) | 2003-01-16 |
DE02738817T1 (de) | 2004-08-26 |
JP2003015681A (ja) | 2003-01-17 |
US7739112B2 (en) | 2010-06-15 |
EP1403851B1 (en) | 2009-09-09 |
EP1403851A1 (en) | 2004-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3078205B2 (ja) | 波形の連結及び部分的重複化による音声合成方法 | |
US8229738B2 (en) | Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method | |
JP2008191659A (ja) | 音声強調方法及び音声再生システム | |
KR101489035B1 (ko) | 오디오 신호 프로세싱을 위한 방법 및 장치 | |
JPWO2003019530A1 (ja) | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム | |
JP3430985B2 (ja) | 合成音生成装置 | |
JP3901475B2 (ja) | 信号結合装置、信号結合方法及びプログラム | |
JP4175376B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法、及びオーディオ信号処理プログラム | |
JP2007025042A (ja) | 音声合成装置および音声合成プログラム | |
JP2000081897A (ja) | 音声情報の記録方法、音声情報記録媒体、並びに音声情報の再生方法及び再生装置 | |
JP2005309464A (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
JP2003022100A (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
EP0421531A2 (en) | Device for sound synthesis | |
JP2650355B2 (ja) | 音声分析合成装置 | |
JPS5888798A (ja) | 音声合成方式 | |
JP2005062442A (ja) | 波形接続装置、波形接続方法及びプログラム | |
JPH06250695A (ja) | ピッチ制御方法及び装置 | |
KR100372576B1 (ko) | 오디오신호 가공방법 | |
JP2004053932A (ja) | 波形再生装置 | |
JP2003122361A (ja) | 効果付与装置 | |
JP2000310994A (ja) | 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体 | |
WO2016148298A1 (ja) | 信号処理装置及び信号処理方法 | |
JP2008262140A (ja) | 音程変換装置及び音程変換方法 | |
KR20030000400A (ko) | 음성 재생속도 실시간 변환 방법 및 장치 | |
JP2006086558A (ja) | 音声処理方法および音声処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040813 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041029 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20041202 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061226 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130112 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140112 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |