JP2003015681A - 信号結合装置、信号結合方法及びプログラム - Google Patents

信号結合装置、信号結合方法及びプログラム

Info

Publication number
JP2003015681A
JP2003015681A JP2001201408A JP2001201408A JP2003015681A JP 2003015681 A JP2003015681 A JP 2003015681A JP 2001201408 A JP2001201408 A JP 2001201408A JP 2001201408 A JP2001201408 A JP 2001201408A JP 2003015681 A JP2003015681 A JP 2003015681A
Authority
JP
Japan
Prior art keywords
input signals
bandwidth
signal
filtering
output signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001201408A
Other languages
English (en)
Other versions
JP3901475B2 (ja
Inventor
Yasushi Sato
寧 佐藤
Patrick Dabin
パトリック ダビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
ATR Advanced Telecommunications Research Institute International
Original Assignee
Kenwood KK
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK, ATR Advanced Telecommunications Research Institute International filed Critical Kenwood KK
Priority to JP2001201408A priority Critical patent/JP3901475B2/ja
Priority to DE0001403851T priority patent/DE02738817T1/de
Priority to US10/362,870 priority patent/US7739112B2/en
Priority to DE60233658T priority patent/DE60233658D1/de
Priority to PCT/JP2002/006479 priority patent/WO2003005342A1/ja
Priority to EP02738817A priority patent/EP1403851B1/en
Publication of JP2003015681A publication Critical patent/JP2003015681A/ja
Application granted granted Critical
Publication of JP3901475B2 publication Critical patent/JP3901475B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Telephonic Communication Services (AREA)
  • Noise Elimination (AREA)

Abstract

(57)【要約】 【課題】 ノイズが少なく、あるいは自然な合成音声を
生成できる信号結合装置及び信号結合方法を提供するこ
とである。 【解決手段】 複数の波形信号が、遅延部1A及びフー
リエ変換部2Aと、遅延部1B及びフーリエ変換部2B
とに、交互に供給される。遅延部1A及び1Bは、これ
らの波形信号を遅延させて加算部3に送り、加算部3は
これらの波形信号を加算してLPF5に送る。一方、フ
ーリエ変換部2A及び2Bは、波形信号をフーリエ変換
して、得られたスペクトルを表すスペクトルデータをフ
ィルタ特性決定部4に送る。フィルタ特性決定部は、こ
のスペクトルデータが表すスペクトル上限の周波数をL
PF5のカットオフ周波数と決定し、LPF5に波形信
号の結合部分が供給された時点にLPF5に制御信号を
送って、フィルタリングを行わせる。LPF5は、制御
信号がない期間はフィルタリングを行わなず信号を素通
しする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、信号結合装置及
び信号結合方法に関し、特に、波形を表す信号を結合す
るための信号結合装置及び信号結合方法に関する。
【0002】
【従来の技術】近年、音声合成の技術により合成された
音声が広く利用されている。具体的には、たとえば、テ
キスト読み上げソフトウェアや、電話番号案内や、株式
案内、旅行案内、店舗案内、交通情報など、多くの場面
で利用されている。
【0003】音声合成の手法には、大別して、波形編集
方式と、規則合成方式とがある。規則合成方式は、音声
を合成する対象のテキストについて形態素解析を行い、
解析の結果に基づき、テキストに音韻論的処理を施すこ
とにより音声を生成する手法である。規則合成方式で
は、音声合成に用いるテキストの内容についての制約が
少なく、多様な内容のテキストを音声合成に用いること
ができる。しかし、規則合成方式では、波形編集方式に
比べ、出力される音声の品質が劣っている。
【0004】一方、波形編集方式は、人間が実際に発話
した音声を録音して、録音した音声を分割して得られる
構成部分をつなぎ合わせることにより、目的とする音声
を得る手法である。波形編集方式は、音声の品質の点で
規則合成方式より有利である。しかし、波形編集方式で
は、録音された音声から取り出すことのできない部分を
含む音声は合成できない。このため、録音された音声を
分割する単位が大きいほど、合成する音声についての制
約が多くなる。このため、波形編集方式では、録音され
た音声を個々の母音や子音のレベルにまで細分化するこ
とにより、多様な音声を合成できるようにする手法も提
案されている。
【0005】
【発明が解決しようとする課題】しかし、録音した音声
の構成部分をつなぎ合わせる接続部分の波形は、たとえ
ば図6(a)に示すように不連続となり、これがノイズ
の発生源になる。そして、録音された音声を細分化する
単位が小さい場合、接続部分が不連続であることにより
生じるこのノイズが目立つようになり、合成音声の品質
の低下を招く。
【0006】このノイズを軽減する手法としては、たと
えば、図6(b)に示すように、不連続な接続部分を直
線で接続し改善する手法が考えられる。しかし、接続さ
れた部分は高調波成分を発生することとなり、この高調
波成分もノイズとなる。
【0007】また、接続部分が不連続であることにより
生じるノイズを軽減する手法としてはMDS(Minimum
Distance Search)方式がある。MDS方式は、図6
(c)に示すように、2個の波形をつなぎ合わせる際、
前に来る波形のうちなるべく後端に近い部分と、後ろに
来る波形のうちなるべく前端に近い部分とから、瞬時値
と接線の勾配とが互いにほぼ一致する点を1個ずつ探し
出して、これらの点同士を接続するという手法である。
しかし、MDS方式では、波形相互の接続部分が、つな
ぎ合わされる各波形の端ではないことが通常である。こ
のため、つなぎ合わされる波形の一部は通常切り捨てら
れることになり、この結果、合成音声が不自然なものと
なる。
【0008】この発明は上記実状に鑑みてなされたもの
であり、ノイズが少なく、あるいは自然な合成音声を生
成できる信号結合装置及び信号結合方法を提供すること
を目的とする。
【0009】
【課題を解決するための手段】上記目的を達成すべく、
この発明の第1の観点にかかる信号結合装置は、波形を
表す複数の入力信号を互いに結合して出力信号を生成す
る結合手段と、前記出力信号内で互いに隣接する2個の
入力信号のスペクトルの上限の周波数に基づいて、当該
2個の入力信号の結合部分をフィルタリングする帯域幅
を決定する帯域幅決定手段と、前記出力信号のうち、前
記2個の入力信号の結合部分を、前記帯域幅決定手段が
決定した帯域幅でフィルタリングするフィルタリング手
段と、を備える、ことを特徴とする。
【0010】このような信号結合装置により結合される
2個の入力信号の結合部分は、これらの入力信号のスペ
クトルの上限の周波数で決まる帯域幅でフィルタリング
されるので、出力信号は、高調波成分に起因するノイズ
が少ないものとなる。また、このような信号結合装置
は、入力信号の端を切り捨てることがないので、入力信
号が音声の波形を表す場合、自然な合成音声を生成す
る。
【0011】前記帯域幅決定手段は、たとえば、前記2
個の入力信号をそれぞれフーリエ変換する手段を備え、
フーリエ変換の結果に基づいて、当該2個の入力信号の
スペクトルの上限の周波数を特定するようにすればよ
い。
【0012】前記帯域幅決定手段は、たとえば、入力信
号となり得る複数の候補のスペクトルの上限の周波数を
候補別に示すテーブルを記憶するテーブル記憶手段を備
えてもよい。この場合、前記帯域幅決定手段は、前記2
個の入力信号を識別する識別データを外部より取得し
て、取得した識別データにより識別されるそれぞれの入
力信号のスペクトルの上限の周波数を前記テーブルから
読み出し、読み出した各周波数のうちの最高値を、当該
2個の入力信号のスペクトルの上限の周波数として特定
するようにしてもよい。
【0013】また、この発明の第2の観点にかかる信号
結合装置は、波形を表す複数の入力信号を互いに結合し
て出力信号を生成する結合手段と、前記出力信号内で互
いに隣接する2個の入力信号をそれぞれハイパスフィル
タによりフィルタリングした結果に基づいて、当該2個
の入力信号の結合部分をフィルタリングする帯域幅を決
定する帯域幅決定手段と、前記出力信号のうち、前記2
個の入力信号の結合部分を、前記帯域幅決定手段が決定
した帯域幅でフィルタリングするフィルタリング手段
と、を備える、ことを特徴とする。
【0014】このような信号結合装置により結合される
2個の入力信号の結合部分は、これらの入力信号の高域
成分の内容に基づいて決まる帯域幅でフィルタリングさ
れるので、出力信号から、高調波成分に起因するノイズ
を除去することが可能となる。また、このような信号結
合装置は、入力信号の端を切り捨てることがないので、
入力信号が音声の波形を表す場合、自然な合成音声を生
成する。
【0015】また、この発明の第3の観点にかかる信号
結合方法は、波形を表す複数の入力信号を互いに結合し
て出力信号を生成し、前記出力信号内で互いに隣接する
2個の入力信号のスペクトルの上限の周波数に基づい
て、当該2個の入力信号の結合部分をフィルタリングす
る帯域幅を決定し、前記出力信号のうち、前記2個の入
力信号の結合部分を、決定した帯域幅でフィルタリング
する、ことを特徴とする。
【0016】このような信号結合方法により結合される
2個の入力信号の結合部分は、これらの入力信号のスペ
クトルの上限の周波数で決まる帯域幅でフィルタリング
されるので、出力信号は、高調波成分に起因するノイズ
が少ないものとなる。また、このような信号結合方法で
は、入力信号の端が切り捨てられることがないので、入
力信号が音声の波形を表す場合、自然な合成音声が生成
される。
【0017】また、この発明の第4の観点にかかる信号
結合方法は、波形を表す複数の入力信号を互いに結合し
て出力信号を生成し、前記出力信号内で互いに隣接する
2個の入力信号をそれぞれハイパスフィルタによりフィ
ルタリングした結果に基づいて、当該2個の入力信号の
結合部分をフィルタリングする帯域幅を決定し、前記出
力信号のうち、前記2個の入力信号の結合部分を、決定
した帯域幅でフィルタリングする、ことを特徴とする。
【0018】このような信号結合方法により結合される
2個の入力信号の結合部分は、これらの入力信号の高域
成分の内容に基づいて決まる帯域幅でフィルタリングさ
れるので、出力信号から、高調波成分に起因するノイズ
を除去することが可能となる。また、このような信号結
合方法では、入力信号の端が切り捨てられることがない
ので、入力信号が音声の波形を表す場合、自然な合成音
声が生成される。
【0019】また、この発明の第5の観点にかかるプロ
グラムは、コンピュータを、波形を表す複数の入力信号
を互いに結合して出力信号を生成する結合手段と、前記
出力信号内で互いに隣接する2個の入力信号のスペクト
ルの上限の周波数に基づいて、当該2個の入力信号の結
合部分をフィルタリングする帯域幅を決定する帯域幅決
定手段と、前記出力信号のうち、前記2個の入力信号の
結合部分を、前記帯域幅決定手段が決定した帯域幅でフ
ィルタリングするフィルタリング手段と、して機能させ
るためのものであることを特徴とする。
【0020】このようなプログラムを実行するコンピュ
ータにより結合される2個の入力信号の結合部分は、こ
れらの入力信号のスペクトルの上限の周波数で決まる帯
域幅でフィルタリングされるので、出力信号は、高調波
成分に起因するノイズが少ないものとなる。また、この
ようなプログラムを実行するコンピュータは、入力信号
の端を切り捨てることがないので、入力信号が音声の波
形を表す場合、自然な合成音声を生成する。
【0021】また、この発明の第6の観点にかかるプロ
グラムは、コンピュータを、波形を表す複数の入力信号
を互いに結合して出力信号を生成する結合手段と、前記
出力信号内で互いに隣接する2個の入力信号をそれぞれ
ハイパスフィルタによりフィルタリングした結果に基づ
いて、当該2個の入力信号の結合部分をフィルタリング
する帯域幅を決定する帯域幅決定手段と、前記出力信号
のうち、前記2個の入力信号の結合部分を、前記帯域幅
決定手段が決定した帯域幅でフィルタリングするフィル
タリング手段と、して機能させるためのものであること
を特徴とする。
【0022】このようなプログラムを実行するコンピュ
ータにより結合される2個の入力信号の結合部分は、こ
れらの入力信号の高域成分の内容に基づいて決まる帯域
幅でフィルタリングされるので、このコンピュータによ
れば、出力信号から高調波成分に起因するノイズを除去
することが可能となる。また、このようなプログラムを
実行するコンピュータは、入力信号の端を切り捨てるこ
とがないので、入力信号が音声の波形を表す場合、自然
な合成音声を生成する。
【0023】
【発明の実施の形態】以下に、図面を参照して、この発
明の実施の形態を、音声合成装置を例として説明する。
この発明の実施の形態に係る音声合成装置10は図1に
示すように、予め録音した音声を個々の母音や子音のレ
ベルに細分化することによって得られる波形信号が入力
端IN−A及びIN−Bから供給され、その供給された
波形信号を合成した合成音声信号が出力端OUTから出
力される基本構成から成っている。
【0024】この音声合成装置10は、具体的な内部構
成を図2に示すように、入力端IN−Aに連なった遅延
部1A及びフーリエ変換部2Aと、入力端IN−Bに連
なった遅延部1B及びフーリエ変換部及び2Bと、加算
部3と、フィルタ特性決定部4と、LPF(ローパスフ
ィルタ)5と、入力端IN−A及びIN−Bと、出力端
OUTとから構成されている。
【0025】遅延部1A及び1Bは、互いに実質的に同
一の構成を有しており、それぞれ、たとえばシフトレジ
スタ等の遅延回路や、DSP(Digital Signal Process
or)やCPU(Central Processing Unit)等から構成
されている。遅延部1Aは入力端IN−Aに接続されて
おり、遅延部1Bは入力端IN−Bに接続されている。
【0026】遅延部1Aは、入力端IN−Aより信号を
供給されると、この信号を一定時間遅延させて加算部3
に供給する。遅延部1Bは、入力端IN−Bより信号を
供給されると、この信号を一定時間遅延させて加算部3
に供給する。
【0027】なお、遅延部1A及び1Bが各自に供給さ
れた信号を遅延させる時間長は、実質的に同一である。
この時間長は、フィルタ特性決定部4がLPF5へと後
述の制御信号を供給するタイミングが後述する通りとな
るよう選ばれている。
【0028】フーリエ変換部2A及び2Bは、互いに実
質的に同一の構成を有しており、それぞれ、DSPやC
PU等から構成されている。フーリエ変換部2Aは入力
端IN−Aに接続されており、フーリエ変換部2Bは入
力端IN−Bに接続されている。従って、フーリエ変換
部2A及び遅延部1Aには、入力端IN−Aから同一の
信号が実質的に同時に供給される。また、フーリエ変換
部2B及び遅延部1Bには、入力端IN−Bから同一の
信号が実質的に同時に供給される。
【0029】フーリエ変換部2Aは、入力端IN−Aよ
り波形を表す信号を供給されると、高速フーリエ変換の
手法(あるいは、信号をフーリエ変換した結果を表すデ
ータを生成する他の任意の手法)により、この信号が表
す波形のスペクトルを表すスペクトルデータを生成し、
フィルタ特性決定部4へと供給する。フーリエ変換部2
Bは、入力端IN−Bより波形を表す信号を供給される
と、フーリエ変換部2Aと実質的に同一の動作を行い、
この信号が表す波形のスペクトルを表すスペクトルデー
タを生成して、フィルタ特性決定部4へと供給する。
【0030】加算部3は、加算回路等より構成されてい
る。加算部3は、遅延部1Aより供給される信号の値と
遅延部1Bより供給される信号の値の和を表す信号を生
成して、LPF5へと供給する。
【0031】フィルタ特性決定部4は、DSPやCPU
より構成されている。フィルタ特性決定部4は、フーリ
エ変換部2A及び2Bよりそれぞれスペクトルデータを
供給されると、これらのスペクトルデータに基づいて、
LPF5のカットオフ周波数(具体的には、たとえばL
PF5の利得が高周波側でピークより3デシベル低下す
る周波数)を決定し、決定したカットオフ周波数を示す
制御信号を生成してLPF5に供給する。
【0032】具体的には、フィルタ特性決定部4は、た
とえば図3(a)に示すように、フーリエ変換部2Aよ
り供給されたスペクトルデータが示すスペクトルSaの
強度が高周波側でピークより20デシベル減衰する周波
数を、このスペクトルSaの上限faと特定する。ま
た、フィルタ特性決定部4は、たとえば図3(b)に示
すように、フーリエ変換部2Bから供給されたスペクト
ルデータが示すスペクトルSbの強度が高周波側でピー
クより20デシベル減衰する周波数を、このスペクトル
Sbの上限fbとして特定する。そして、特定した2個
の周波数fa及びfbのうち高い方の値を、LPF5の
カットオフ周波数と決定する。なお、図3(c)は、f
a<fbである場合のLPF5の周波数特性(ただし、
制御信号がLPF5に供給されている間の周波数特性)
を示すグラフである。
【0033】LPF5は、たとえば、FIR(Finite I
npulse Response)型のディジタルフィルタ等より構成
されている。LPF5は、加算部3より供給された信号
をフィルタリングして出力する。LPF5は、フィルタ
リングの特性を、フィルタ特性決定部4からの制御信号
の供給の有無、及び、この制御信号が示す周波数に基づ
いて決定する。
【0034】具体的には、LPF5は、たとえば、フィ
ルタ特性決定部4から制御信号が供給されている間は、
加算部3より供給された信号が表す波形のうち、この制
御信号が示す周波数をカットオフ周波数とするような5
12次のローパスフィルタを通過する成分を表す信号を
生成し、生成した信号を、フィルタリングの結果を表す
信号として出力端OUTより出力する。一方、LPF5
は、制御信号を供給されていない間は、加算部3より供
給された信号を実質的にフィルタリングすることなくそ
のまま出力端OUTより出力する。
【0035】この音声合成装置に音声の合成を行わせる
には、入力端IN−A及びIN−Bに、波形信号を交互
に供給する。すなわち、たとえば図4(a)及び(b)
に示すように、n番目(nは任意の正の奇数)の波形信
号s(n)を入力端IN−Aに供給したとすると、n番
目の波形信号が終端に達するのと実質的に同時に、入力
端IN−Bに、(n+1)番目の波形信号s(n+1)
の供給を開始する、というようにして、波形信号を順次
供給する。
【0036】入力端IN−Aにn番目の波形信号が供給
され、入力端IN−Bに(n+1)番目の波形信号が供
給されると、n番目の波形信号は遅延部1Aにより遅延
を受け、また、(n+1)番目の波形信号は遅延部1B
により遅延を受けた上で、加算部3に供給される。遅延
部1A及び1Bが信号を遅延させる時間長(図4(b)
及び(c)で「t0」として示す時間長)は互いに実質
的に等しいので、加算部3からは、図4(c)に示すよ
うに、n番目の波形信号と(n+1)番目の波形信号と
が実質的に隙間なく連続してLPF5に供給される。
【0037】一方、n番目の波形信号はフーリエ変換部
2Aにも供給され、(n+1)番目の波形信号はフーリ
エ変換部2Bにも供給される。すると、フーリエ変換部
2Aは、n番目の波形信号が表す波形のスペクトルを表
すスペクトルデータを生成し、フィルタ特性決定部4へ
と供給する。また、フーリエ変換部2Bは、(n+1)
番目の波形信号が表す波形のスペクトルを表すスペクト
ルデータを生成し、フィルタ特性決定部4へと供給す
る。
【0038】フィルタ特性決定部4は、n番目及び(n
+1)番目の波形信号のスペクトルを表す2個のスペク
トルデータを供給されると、これらのスペクトルデータ
が示す各々のスペクトルの強度が高周波側で平均値より
20デシベル減衰する周波数を特定する。そして、特定
した2個の周波数のうち高い方の値を、LPF5のカッ
トオフ周波数と決定し、決定したカットオフ周波数を示
す制御信号をLPF5に供給する。
【0039】n番目及び(n+1)番目の波形信号に基
づいて決定されたカットオフ周波数を示す制御信号は、
図4(d)にタイミングを示すように、加算部3が出力
する信号がn番目の波形信号から(n+1)番目の波形
信号へと切り替わる時点(図4(d)で「T(n)」と
して示す時点)を含む期間、フィルタ特性決定部4から
LPF5へと供給される。(なお、理解を容易にするた
め、本明細書及び図面においては、LPF5自身による
信号伝搬の遅延時間は無視できる程度に短いものとす
る。)
【0040】なお、この音声合成装置が出力する音声信
号が表す音声の劣化を防ぐために、制御信号の供給開始
から波形信号が切り替わる時点までの時間長は、n番目
の波形信号の時間長(図4(a)で「L(n)」として
示す時間長)の10分の1以下とすることが望ましい。
また、波形信号が切り替わる時点から制御信号の供給終
了までの時間長は、(n+1)目の波形信号の時間長
(図4(b)で「L(n+1)」として示す時間長)の
10分の1以下とすることが望ましい。
【0041】そして、LPF5は、(A) (n−1)
番目及びn番目の波形信号に基づいて決定された周波数
を示す制御信号の供給が終了してから、n番目及び(n
+1)番目の波形信号に基づいて決定された周波数を示
す制御信号が供給されるまでの期間(図4(d)で「t
1」として示す期間)は、n番目の波形信号を、実質的
にフィルタリングすることなく出力端OUTから出力
し、(B) n番目及び(n+1)番目の波形信号に基
づいて決定された周波数を示す制御信号が供給されてい
る期間(図4(d)で「t2」として示す期間)は、こ
の周波数をカットオフ周波数とする512次のローパス
フィルタを通過する成分を表す信号を生成して出力端O
UTより出力し、(C) n番目及び(n+1)番目の
波形信号に基づいて決定された周波数を示す制御信号の
供給が終了してから、(n+1)番目及び(n+2)番
目の波形信号に基づいて決定された周波数を示す制御信
号が供給されるまでの期間(図4(d)で「t3」とし
て示す期間)は、(n+1)番目の波形信号を、実質的
にフィルタリングすることなく出力端OUTから出力す
る。
【0042】LPF5が上述した通りにフィルタリング
を行う結果、n番目及び(n+1)番目の波形信号が、
不要な高調波成分を生じることなく、また、各波形に元
来含まれていた周波数成分を実質的に損なうことなく、
互いに結合される。従って、結合された波形信号が表す
音声は、ノイズが少なく、また、自然に聞こえるものと
なる。
【0043】なお、この音声合成装置の構成は上述のも
のに限られない。たとえば、LPF5のフィルタ段数は
任意であり、また、フーリエ変換部2A及び2Bが供給
するスペクトルデータが示すスペクトルの上限の周波数
の定義の仕方や、LPF5のカットオフ周波数の定義の
仕方も、上述の定義に限らず任意である。また、遅延部
1A、遅延部1B、フーリエ変換部2A、フーリエ変換
部2B、加算部3、フィルタ特性決定部4及びLPF5
の機能の全部又は一部を、単一のDSPやCPUが行っ
てもよい。
【0044】また、この音声合成装置は、入力端IN−
A及びIN−Bに代えて、波形信号が記録された記録媒
体(たとえば、フレキシブルディスクや、MO(Magnet
o-Optical Disk)など)から波形信号を読み出して遅延
部1A及び1Bやフーリエ変換部2A及び2Bに供給す
る記録媒体ドライブ装置(たとえば、フレキシブルディ
スクドライブや、MOドライブなど)を備えていてもよ
い。また、この音声合成装置は、出力端OUTに代え
て、LPF5が生成した信号を記録媒体に書き込む記録
媒体ドライブ装置を備えていてもよい。なお、同一の記
録媒体ドライブ装置が、記録媒体からの波形信号を読み
出す機能とLPF5が生成した信号を記録媒体に書き込
む機能とを両方行うようにしてもよい。
【0045】なお、入力端IN−A又はIN−Bに供給
される波形信号は、無音状態を表すものであっても差し
支えない。有音状態を表す波形信号と無音状態を表す波
形信号とが結合されることにより、有音状態を表す信号
の端を含む部分(具体的には、たとえば、音声の始まり
や終わり、あるいは息継ぎ部分など)がノイズを発生す
ることが避けられ、またこの部分が自然に聞こえるもの
となる。
【0046】また、この発明の音声合成装置においては
必ずしもフーリエ変換部2A及び2Bを必要とせず、そ
の代わりに、例えば入力端IN−A及びIN−Bに供給
される波形信号の候補を識別する識別データとこの候補
のスペクトルの上限の周波数を示す周波数データとを互
いに対応付けて格納記憶するテーブルを備える手法が考
えられる。この手法の場合、入力端IN−A及びIN−
Bに供給された波形信号を識別する識別データを別途外
部より取得し、その取得した識別データに対応付けられ
た周波数データをテーブルから読み出してフィルタ特性
決定部4に供給し、フィルタ特性決定部4は、その周波
数データが示す周波数のうち高い方の値を、LPF5の
カットオフ周波数と決定する。
【0047】また、図5に示すように、この音声合成装
置は、フーリエ変換部2A及び2Bに代えてHPF(ハ
イパスフィルタ)6A及び6Bを備えていてもよい。H
PF6A及び6Bは、互いに実質的に同一の構成を有し
ており、それぞれ、たとえばIIR(Infinite Inpulse
Response)型のディジタルフィルタ等より構成されて
いる。
【0048】HPF6Aは入力端IN−Aに接続されて
おり、HPF6Bは入力端IN−Bに接続されていて、
HPF6A及び遅延部1Aには、入力端IN−Aから同
一の信号が実質的に同時に供給され、HPF6B及び遅
延部1Bには、入力端IN−Bから同一の信号が実質的
に同時に供給される。
【0049】HPF6Aは、入力端IN−Aより波形を
表す信号を供給されると、この信号のうち所定のカット
オフ周波数以下の成分を実質的に遮断し、他の成分フィ
ルタ特性決定部4へと供給する。HPF6Bは、入力端
IN−Bより供給された信号のうち所定のカットオフ周
波数以下の成分を実質的に遮断し、他の成分フィルタ特
性決定部4へと供給する。なお、HPF6A及び6Bの
カットオフ周波数は、互いに実質的に等しいものとす
る。
【0050】この音声合成装置がフーリエ変換部2A及
び2Bに代えてHPF6A及び6Bを備えている場合、
フィルタ特性決定部4は、HPF6A及び6Bよりそれ
ぞれ供給された波形信号の成分に基づいて(具体的に
は、たとえばHPF6Aが供給した成分の振幅及びHP
F6Bが供給した成分の振幅のうち大きい方の値に基づ
いて)、LPF5のカットオフ周波数を決定するものと
する。
【0051】この音声合成装置がフーリエ変換部2A及
び2Bに代えてHPF6A及び6Bを備えていれば、比
較的複雑なフーリエ変換の処理が省略されるので、この
音声合成装置の処理をより高速にすることが可能にな
る。
【0052】以上、この発明の実施の形態を説明した
が、この発明にかかる信号結合装置は、専用のシステム
によらず、通常のコンピュータシステムを用いて実現可
能である。例えば、パーソナルコンピュータに上述の遅
延部1A(又はHPF6A)、遅延部1B(又は)HP
F6B、フーリエ変換部2A、フーリエ変換部2B、加
算部3、フィルタ特性決定部4及びLPF5の動作を実
行させるためのプログラムを格納した媒体(CD−RO
M、MO、フレキシブルディスク等)から該プログラム
をインストールすることにより、上述の処理を実行する
音声合成装置を構成することができる。
【0053】また、例えば、通信回線の掲示板(BB
S)に当該プログラムを掲示し、これを通信回線を介し
て配信してもよく、また、当該プログラムを表す信号に
より搬送波を変調し、得られた変調波を伝送し、この変
調波を受信した装置が変調波を復調して当該プログラム
を復元するようにしてもよい。そして、当該プログラム
を起動し、OSの制御下に、他のアプリケーションプロ
グラムと同様に実行することにより、上述の処理を実行
することができる。
【0054】なお、OSが処理の一部を分担する場合、
あるいは、OSが本願発明の1つの構成要素の一部を構
成するような場合には、記録媒体には、その部分を除い
たプログラムを格納してもよい。この場合も、この発明
では、その記録媒体には、コンピュータが実行する各機
能又はステップを実行するためのプログラムが格納され
ているものとする。
【0055】
【発明の効果】以上説明したように、この発明によれ
ば、ノイズが少なく、あるいは自然な合成音声を生成で
きる信号結合装置及び信号結合方法が実現される。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る音声合成装置を示
す図である。
【図2】この発明の実施の形態に係る音声合成装置の内
部構成を示すブロック図である。
【図3】(a)は、入力端IN−Aに供給された信号の
スペクトルを表すグラフであり、(b)は、入力端IN
−Bに供給された信号のスペクトルを表すグラフであ
り、(c)は、LPFの周波数特性を表すグラフであ
る。
【図4】(a)は、入力端IN−Aに供給された波形信
号を表すグラフであり、(b)は、入力端IN−Bに供
給された波形信号を表すグラフであり、(c)は、加算
部が出力する信号を表すグラフであり、(d)は、LP
Fが出力する信号を表すグラフである。
【図5】図2の音声合成装置の変形例の内部構成を示す
ブロック図である。
【図6】(a)は、つなぎ合わされる信号が不連続にな
る様子を表す図であり、(b)は、不連続部分を直線で
接続する従来の手法を表す図であり、(c)は、MDS
方式により信号をつなぎ合わせた様子を表す図である。
【符号の説明】
1A、1B 遅延部 2A、2B フーリエ変換部 3 加算部 4 フィルタ特性決定部 5 LPF 6A、6B HPF 10 音声合成装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ダビン パトリック 京都府相楽郡精華町光台二丁目2番地2 株式会社国際電気通信基礎技術研究所内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】波形を表す複数の入力信号を互いに結合し
    て出力信号を生成する結合手段と、 前記出力信号内で互いに隣接する2個の入力信号のスペ
    クトルの上限の周波数に基づいて、当該2個の入力信号
    の結合部分をフィルタリングする帯域幅を決定する帯域
    幅決定手段と、 前記出力信号のうち、前記2個の入力信号の結合部分
    を、前記帯域幅決定手段が決定した帯域幅でフィルタリ
    ングするフィルタリング手段と、を備える、 ことを特徴とする信号結合装置。
  2. 【請求項2】前記帯域幅決定手段は、前記2個の入力信
    号をそれぞれフーリエ変換する手段を備え、フーリエ変
    換の結果に基づいて、当該2個の入力信号のスペクトル
    の上限の周波数を特定する、 ことを特徴とする請求項1に記載の信号結合装置。
  3. 【請求項3】前記帯域幅決定手段は、入力信号となり得
    る複数の候補のスペクトルの上限の周波数を候補別に示
    すテーブルを記憶するテーブル記憶手段を備え、 前記帯域幅決定手段は、前記2個の入力信号を識別する
    識別データを外部より取得して、取得した識別データに
    より識別されるそれぞれの入力信号のスペクトルの上限
    の周波数を前記テーブルから読み出し、読み出した各周
    波数のうちの最高値を、当該2個の入力信号のスペクト
    ルの上限の周波数として特定する、 ことを特徴とする請求項1に記載の信号結合装置。
  4. 【請求項4】波形を表す複数の入力信号を互いに結合し
    て出力信号を生成する結合手段と、 前記出力信号内で互いに隣接する2個の入力信号をそれ
    ぞれハイパスフィルタによりフィルタリングした結果に
    基づいて、当該2個の入力信号の結合部分をフィルタリ
    ングする帯域幅を決定する帯域幅決定手段と、 前記出力信号のうち、前記2個の入力信号の結合部分
    を、前記帯域幅決定手段が決定した帯域幅でフィルタリ
    ングするフィルタリング手段と、を備える、 ことを特徴とする信号結合装置。
  5. 【請求項5】波形を表す複数の入力信号を互いに結合し
    て出力信号を生成し、 前記出力信号内で互いに隣接する2個の入力信号のスペ
    クトルの上限の周波数に基づいて、当該2個の入力信号
    の結合部分をフィルタリングする帯域幅を決定し、 前記出力信号のうち、前記2個の入力信号の結合部分
    を、決定した帯域幅でフィルタリングする、 ことを特徴とする信号結合方法。
  6. 【請求項6】波形を表す複数の入力信号を互いに結合し
    て出力信号を生成し、 前記出力信号内で互いに隣接する2個の入力信号をそれ
    ぞれハイパスフィルタによりフィルタリングした結果に
    基づいて、当該2個の入力信号の結合部分をフィルタリ
    ングする帯域幅を決定し、 前記出力信号のうち、前記2個の入力信号の結合部分
    を、決定した帯域幅でフィルタリングする、 ことを特徴とする信号結合方法。
  7. 【請求項7】コンピュータを、 波形を表す複数の入力信号を互いに結合して出力信号を
    生成する結合手段と、 前記出力信号内で互いに隣接する2個の入力信号のスペ
    クトルの上限の周波数に基づいて、当該2個の入力信号
    の結合部分をフィルタリングする帯域幅を決定する帯域
    幅決定手段と、 前記出力信号のうち、前記2個の入力信号の結合部分
    を、前記帯域幅決定手段が決定した帯域幅でフィルタリ
    ングするフィルタリング手段と、 して機能させるためのプログラム。
  8. 【請求項8】コンピュータを、 波形を表す複数の入力信号を互いに結合して出力信号を
    生成する結合手段と、 前記出力信号内で互いに隣接する2個の入力信号をそれ
    ぞれハイパスフィルタによりフィルタリングした結果に
    基づいて、当該2個の入力信号の結合部分をフィルタリ
    ングする帯域幅を決定する帯域幅決定手段と、 前記出力信号のうち、前記2個の入力信号の結合部分
    を、前記帯域幅決定手段が決定した帯域幅でフィルタリ
    ングするフィルタリング手段と、 して機能させるためのプログラム。
JP2001201408A 2001-07-02 2001-07-02 信号結合装置、信号結合方法及びプログラム Expired - Fee Related JP3901475B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2001201408A JP3901475B2 (ja) 2001-07-02 2001-07-02 信号結合装置、信号結合方法及びプログラム
DE0001403851T DE02738817T1 (de) 2001-07-02 2002-06-27 Signalkoppelverfahren und -vorrichtung
US10/362,870 US7739112B2 (en) 2001-07-02 2002-06-27 Signal coupling method and apparatus
DE60233658T DE60233658D1 (de) 2001-07-02 2002-06-27 Konkatenation von Sprachsignalen
PCT/JP2002/006479 WO2003005342A1 (fr) 2001-07-02 2002-06-27 Procede et appareil de couplage de signaux
EP02738817A EP1403851B1 (en) 2001-07-02 2002-06-27 Concatenation of voice signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001201408A JP3901475B2 (ja) 2001-07-02 2001-07-02 信号結合装置、信号結合方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2003015681A true JP2003015681A (ja) 2003-01-17
JP3901475B2 JP3901475B2 (ja) 2007-04-04

Family

ID=19038376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001201408A Expired - Fee Related JP3901475B2 (ja) 2001-07-02 2001-07-02 信号結合装置、信号結合方法及びプログラム

Country Status (5)

Country Link
US (1) US7739112B2 (ja)
EP (1) EP1403851B1 (ja)
JP (1) JP3901475B2 (ja)
DE (2) DE60233658D1 (ja)
WO (1) WO2003005342A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209903A (ja) * 2007-01-30 2008-09-11 Victor Co Of Japan Ltd 再生装置、再生方法及び再生プログラム
JP2008310238A (ja) * 2007-06-18 2008-12-25 Akuseru:Kk 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533026B2 (en) * 2002-04-12 2009-05-12 International Business Machines Corporation Facilitating management of service elements usable in providing information technology service offerings
US7440902B2 (en) * 2002-04-12 2008-10-21 International Business Machines Corporation Service development tool and capabilities for facilitating management of service elements
US7562022B2 (en) * 2002-04-12 2009-07-14 International Business Machines Corporation Packaging and distributing service elements
JP4396646B2 (ja) * 2006-02-07 2010-01-13 ヤマハ株式会社 応答波形合成方法、応答波形合成装置、音響設計支援装置および音響設計支援プログラム
US20090167947A1 (en) * 2007-12-27 2009-07-02 Naoko Satoh Video data processor and data bus management method thereof

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3678416A (en) * 1971-07-26 1972-07-18 Richard S Burwen Dynamic noise filter having means for varying cutoff point
JPH0632037B2 (ja) 1985-12-13 1994-04-27 松下電工株式会社 音声合成装置
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
EP0427485B1 (en) * 1989-11-06 1996-08-14 Canon Kabushiki Kaisha Speech synthesis apparatus and method
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JPH05273998A (ja) 1992-03-30 1993-10-22 Toshiba Corp 音声符号化装置
GB2272615A (en) * 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
US5463715A (en) * 1992-12-30 1995-10-31 Innovation Technologies Method and apparatus for speech generation from phonetic codes
JPH0772897A (ja) 1993-09-01 1995-03-17 Nippon Telegr & Teleph Corp <Ntt> 音声合成方法および装置
JPH08254993A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 音声合成装置
JPH08335095A (ja) 1995-06-02 1996-12-17 Matsushita Electric Ind Co Ltd 音声波形接続方法
US6240384B1 (en) * 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
BE1010336A3 (fr) * 1996-06-10 1998-06-02 Faculte Polytechnique De Mons Procede de synthese de son.
JP3669129B2 (ja) 1996-11-20 2005-07-06 ヤマハ株式会社 音信号分析装置及び方法
JPH10187195A (ja) * 1996-12-26 1998-07-14 Canon Inc 音声合成方法および装置
US6490562B1 (en) * 1997-04-09 2002-12-03 Matsushita Electric Industrial Co., Ltd. Method and system for analyzing voices
JPH11352996A (ja) 1998-06-10 1999-12-24 Nec Corp 音声規則合成装置
DE19861167A1 (de) * 1998-08-19 2000-06-15 Christoph Buskies Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten sowie Vorrichtungen zur Bereitstellung koartikulationsgerecht konkatenierter Audiodaten
US6144939A (en) 1998-11-25 2000-11-07 Matsushita Electric Industrial Co., Ltd. Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains
JP3410387B2 (ja) 1999-04-27 2003-05-26 株式会社エヌ・ティ・ティ・データ 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209903A (ja) * 2007-01-30 2008-09-11 Victor Co Of Japan Ltd 再生装置、再生方法及び再生プログラム
JP2008310238A (ja) * 2007-06-18 2008-12-25 Akuseru:Kk 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム

Also Published As

Publication number Publication date
EP1403851B1 (en) 2009-09-09
EP1403851A4 (en) 2005-10-26
DE60233658D1 (de) 2009-10-22
JP3901475B2 (ja) 2007-04-04
DE02738817T1 (de) 2004-08-26
WO2003005342A1 (fr) 2003-01-16
US20040015359A1 (en) 2004-01-22
US7739112B2 (en) 2010-06-15
EP1403851A1 (en) 2004-03-31

Similar Documents

Publication Publication Date Title
US6205420B1 (en) Method and device for instantly changing the speed of a speech
US8706496B2 (en) Audio signal transforming by utilizing a computational cost function
US8229738B2 (en) Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method
US8078456B2 (en) Audio time scale modification algorithm for dynamic playback speed control
JP2008191659A (ja) 音声強調方法及び音声再生システム
KR101489035B1 (ko) 오디오 신호 프로세싱을 위한 방법 및 장치
JP3430985B2 (ja) 合成音生成装置
KR20050049103A (ko) 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치
JP2003015681A (ja) 信号結合装置、信号結合方法及びプログラム
US8280737B2 (en) Sound signal generating method, sound signal generating device, and recording medium
JP3379348B2 (ja) ピッチ変換器
JP4747434B2 (ja) 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム
JP2005309464A (ja) 雑音除去方法、雑音除去装置およびプログラム
JP2003022100A (ja) 雑音除去方法、雑音除去装置およびプログラム
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP2650355B2 (ja) 音声分析合成装置
JP4222250B2 (ja) 圧縮楽音データ再生装置
JP2005062442A (ja) 波形接続装置、波形接続方法及びプログラム
JP3592617B2 (ja) 音声合成方法、その装置及びそのプログラム記録媒体
JP2003122361A (ja) 効果付与装置
JP5899865B2 (ja) 音響信号加工装置及びプログラム
JP2000310994A (ja) 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体
JPH10143171A (ja) 信号処理装置および方法
JPS5842096A (ja) 音声信号の雑音抑圧方式
Saito et al. A speech speed control using Fourier composite approach

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040813

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041029

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041202

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061226

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140112

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees