JP2005539267A - 音声波形の連結を用いる音声合成 - Google Patents

音声波形の連結を用いる音声合成 Download PDF

Info

Publication number
JP2005539267A
JP2005539267A JP2004537379A JP2004537379A JP2005539267A JP 2005539267 A JP2005539267 A JP 2005539267A JP 2004537379 A JP2004537379 A JP 2004537379A JP 2004537379 A JP2004537379 A JP 2004537379A JP 2005539267 A JP2005539267 A JP 2005539267A
Authority
JP
Japan
Prior art keywords
interval
fade
audio unit
signal
intervals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004537379A
Other languages
English (en)
Other versions
JP4510631B2 (ja
Inventor
エルカン、エフ.ヒヒ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005539267A publication Critical patent/JP2005539267A/ja
Application granted granted Critical
Publication of JP4510631B2 publication Critical patent/JP4510631B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)
  • Machine Translation (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本発明は、少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号の合成方法に関する。この方法は、エンドインターバルを有する第1音声ユニット信号を用意するステップと、フロントインターバルを有する第2音声ユニット信号を用意するステップと、第1音声ユニット信号の終わりにエンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意するステップと、第2音声ユニット信号の始まりにフロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意するステップと、エンド及びフェイドインインターバルとフェイドアウト及びフロントインターバルとを重畳するステップと、を備える。

Description

本発明は、音声又は音楽の合成の分野、より詳細には、それに限定されるものではないが、テキストを音声に変換し合成する分野に関する。
テキストを音声に変換し合成する、すなわちテキスト・ツー・スピーチ(TTS)合成を行うシステムの機能は、与えられた言語の一般的なテキストから音声を合成することである。現在では、TTSシステムは、電話回線を介してデータベースにアクセスしたり障害者を手助けしたりするような多くの用途にとって実用期に入ってきている。音声を合成する一つの方法は、半音節(デミシラブル)又は多音節(ポリフォン)のような音声のサブユニットの記録セットのエレメントを連結することによるものである。成功している商業システムの大部分は多音節の連結を用いている。
多音節は、2つのグループ(2音節)、3つのグループ(3音節)、又はそれを超える音節を含み、無意味な言葉(ナンセンスワード)から安定スペクトル領域において音声の所望のグループ分けをセグメント化することによって決定されうる。連結に基づく合成においては、隣接する2音間の移行部の会話は合成された音声の品質を保証するのに非常に重要なものである。多音節を基本的なサブユニットとして選択することによって、隣接する2音間の移行部が記録用サブユニット内に保存され、その連結は類似音間で実行される。
しかしながら、そのような音節を含む新しい単語の韻律論上の連結を実行するために、合成の前に、音節はその時間幅及びピッチが調整されなければならない。この処理は合成音声の一本調子の響きの生成を避けるために必要なものである。TTSシステムでは、この機能は韻律モジュールによって実行される。記録用サブユニットにおける時間及びピッチの調整を可能とするために、連結に基づく多くのTTSシステムが合成のタイムドメイン・ピッチ同期・重畳加え合わせ法(TD−PSOLA)のモデルを用いる(E.Moulines and F.Charpentier“Pitch synchronous waveform processing techniques for text-to-speech synthesis using diphones,”Speech Commun., vol.9, pp.453-467, 1990)。
このTD−PSOLAモデルでは、音声信号はまずピッチマーキングアルゴリズムに通される。このアルゴリズムは発声セグメント内の信号のピーク点にマークを割り当て、非発声セグメント内に10ms離してマークを割り当てる。合成は、ピッチマークに中心を合わされたハニング(Hanning)ウインドウセグメントと、次のものへと先のピッチマークから延びるセグメントとの重畳によって作られる。時間幅の調整はウインドウセグメントの数個を削除または複写することによって行われる。他方、ピッチ周期の調整はウインドウセグメント間の重畳を増加又は減少することによって行われる。
しかしながら多くの商業的TTSシステムにおいて達成された成功にもかかわらず、合成のTD−PSOLAモデルを用いることによって生成された合成音声には数個の欠点が存在する。それは主として大きな韻律論的な変化の問題である。
そのようなPSOLA法の例が、欧州特許第0363233号明細書、米国特許第5479564号明細書、及び欧州特許第0706170号明細書に開示されている。具体例は、T.Dutoit and H.Leich, “Speech Communications”, Elsevier Publisher, November 1993に開示されているMBR−PSOLA法である。米国特許第5479564号明細書に開示されている方法は、基底周波数を、その信号から抽出された短期信号を重畳/加え合わせによって調整する手段を示唆している。短期信号を得るのに用いられる重み付けウインドウの長さは音響信号の周期の2倍にほぼ等しく、周期内のそれらの位置は任意の値にセットされうる(連続するウインドウ間の時間シフトが音響信号の周期に等しいとすれば)。米国特許第5479564号明細書は又、不連続性を平滑化するように、連結するセグメント間に波形補間を施す手段についても記載している。従来のテキスト/音声変換システムにおいては、予め記録された音声フラグメントのセットが特定の順序で連結され、ある一定のテキストを自然に響く音声に変換される。小さな音声フラグメントを用いるテキスト/音声変換システムは、そのような多くの連結点を持っている。特に複数の音声フラグメントがスペクトル的に異なる時は、それらの結合が人工音を生成し、それが明瞭性を低下させる。特に異なる記録時の2つの音声セグメントが連結される場合、結果として得られる音声は2つのセグメントの結合点に不連続性を生じることがある。例えば、母音が合成される場合、左部分は大抵右部分よりも異なる記録部から到来する。これは母音の正確な特色の再生を不可能にする。
フォルマント軌跡におけるわずかな相違が結合部における突然のジャンプを作り出す。この作用を減少させるために従来技術で主として行われているのは、音声フラグメントが残りの部分にマッチし、または差異を最少化するために異なるバージョン(余分なフラグメント)を加え合わせするまで、音声フラグメントを再記録することである。
したがって本発明の目的は、少なくとも第1二音節及び第2二音節を含む音声信号の改善された合成方法を提供することである。本発明のさらなる目的は、対応するコンピュータプログラムプロダクト及びコンピュータシステム、特にテキスト/音声変換システムを提供することである。
本発明は、結合点で重畳される第1二音節及び第2二音節信号に基づく音声信号の合成方法を提供するものである。本発明は、いかなる聴取可能な人工音をも伴うことなく二音節信号の円滑な連結を可能にするものである。これは、第1二音節信号の終わりに第1二音節信号のエンドインターバルの周期を逆順で付加し、さらに第2二音節信号の始まりに第2二音節信号のフロントインターバルの周期を付加することによって達成される。エンド及びフロントインターバルは円滑な移行部を生成するために重畳される。
本発明の一実施態様によれば、第1及び第2二音節信号のエンド及びフロントインターバルはマーカによって識別される。好ましくは、エンド及びフロントインターバルはほぼ一様な周期を含む。すなわち、ほぼ同じ情報内容及び信号形態を持つ周期を含む。このようなエンド及びフロントインターバルは専門家によって識別され、又は対応するコンピュータプログラム手段によって識別される。好ましくは、第1分析がコンピュータプログラム手段によって行われ、もしその結果が専門家によって再吟味されるならば、精度が一層向上する。
本発明のさらなる実施態様によれば、エンドインターバルの最後の周期及びフロントインターバルの最初の周期は付加されない。これは、周期性が隣接する2つの同一周期の繰り返しによる信号に導入されないという利点を持っている。
本発明のさらなる実施態様によれば、ウインドウイング動作がエンド及びフロントインターバル上と同様にそれぞれフェイドアウト及びフェイドインウインドウ手段によって、各付加周期上でも行われる。好ましくは、発声エンドインターバル及び付加周期のために持ち上げられたコサイン関数が用いられる。それに対して、非発声エンドインターバル及び付加周期のためにフェイドアウトウインドウとしてサインウインドウが用いられる。同様に、第2二音節の発声セグメントの始まりを円滑にするためのウインドウ関数として持ち上げられたコサイン関数が用いられ、又は非発声セグメントのためのウインドウ関数としてサイン関数が用いられる。
本発明の一実施態様によれば、時間幅調整は重畳されるべきインターバルに対して行われる。特にインターバルが異なる時間幅を持っている場合、これは突然の信号移行部の導入を避けるために利点となる。
本発明の他の実施態様によれば、テキスト/音声変換処理は本発明の原理により二音節どうしを連結することによって行われる。このようして自然に響く音声出力を生成することができる。
本発明は二音節どうしの連結に限定されることなく、三音節、それ以上の多音節、又は単語(ワード)のような他の音声ユニットの連結のためにも良好に用いることができる。
次に本発明の実施例について図面を参照して詳細に説明する。
図1は本発明の方法の好ましい実施例を示すフローチャートである。ステップ100において、第1二音節信号Aが用意される。この二音節信号Aはその二音節信号Aのエンドインターバルを識別する少なくとも1つのマーカを持っている。
ステップ102において、二音節信号Aのエンドインターバル内の周期がそのエンドインターバルにおいて付加されるフェイドアウトインターバルを用意するために逆順で繰り返される。ステップ104において、付加されたフェイドアウトインターバルを有するエンドインターバルが、そのエンドにおける二音節信号を円滑にフェイドアウトするためにフェイドアウトウインドウ関数手段によってウインドウされる。同様に、二音節信号Bがステップ106において用意される。二音節信号Bはその二音節信号Bのフロントセグメントを識別するために少なくとも1つの関連するマーカを持っている。ステップ108において、少なくとも数個のフロントインターバル周期が二音節信号Bのフロントインターバルの始まりで逆順で付加される。このようにしてフェイドインインターバルが用意される。ステップ110において、フロントインターバル及び付加されたフェイドインインターバルがフェイドインウインドウ手段によってウインドウされる。このようにして二音節信号Bの円滑な始まりが用意される。ステップ112において、時間幅適応が行われる。これは、エンド及びフェイドインインターバルが同じ時間幅を持つように二音節信号A及びBのエンド及びフロントインターバルの時間幅が調整されることを意味する。同様に、フェイドアウト及びフロントインターバルが適応される。ステップ114において、二音節信号A及びBに対する、処理されたエンド及びフェイドインインターバルとフェイドアウト及びフロントインターバルとの重畳及び加え合わせ操作が行われる。このようにして、二音節信号A及びBの円滑な連結が達成される。発声セグメントに対しては、次の持ち上げコサインウインドウ関数の使用が好ましい。すなわち、
w[n]=0.5−0.5・cos{(π・(n+0.5))/m} , 0≦n<m
がそれである。ここで、mは平滑範囲内の周期の全数である。
非発声セグメントに対しては、サインウインドウ、
w[n]=sin{(0.5・π・(n+0.5))/m} , 0≦n<m
が用いられる。
サインウインドウを用いることの利点は、パワー域内の信号全体のエンベロープを一定に維持することを保証することにある。周期信号とは異なり、2つのノイズサンプルが加えられる時は、総合計を2つのサンプルのいずれの絶対値よりも小さいものとすることができる。これは、信号位相が(大抵)ずれているからである。サインウインドウはこの効果に対する調整を行い、エンベロープ変調を除去する。
図2は逆順で加え合わせするインターバル周期のプロセスを示すものである(図1のステップ102及び108参照)。時間軸200は二音節信号Aの時間ドメインを示すものである。二音節信号Aは周期p,p,・・・,p,・・・,pN−1,pを含むエンドインターバル202を持っている。フェイドアウトインターバル204を用意するために、エンドインターバル202の周期pがエンドインターバル202の終わりに逆順で付加される。意図しない周期性を導きかねない2つの同一周期の繰り返しを避けるために、エンドインターバル202の最後の周期pは付加されない。この周期性はある一定の状況下で聴取可能である。したがってエンドインターバル202の最後の周期pは繰り返さないのが好ましい。フェイドアウトインターバル204の最初の周期p’が周期pN−1の信号をコピーすることによって用意される。一般に、フェイドアウトインターバル204の周期p’はエンドインターバル202からの周期pN−jを付加することによって得られる。すなわちp’=pN−jである。時間軸206は二音節信号Bの時間推移を示すものである。二音節信号Bは周期P,P,・・・,P,・・・,PN−1,Pを含むフロントインターバル208を持っている。フロントインターバル208の始まりにフロントインターバル208からの周期を逆順で付加することによってフェイドインインターバル210が用意される。ここでも、意図しない周期性の導入を避けるために、フロントインターバル208の最初の周期pは付加しないのが好ましい。一般的なケースでは、信号周期P’はフロントインターバル208の周期PN−J+1から得られる。すなわち、P’=PN−J+1である。二音節信号A及び二音節信号Bを連結するために、インターバル202及びフェイドインインターバル210がそれぞれフェイドアウトインターバル204及びフロントインターバル208と重畳され、かつ加え合わされる。ここで考えられている例では、それは各インターバルの時間幅を適応させることなく行うことができる。その場合、エンドインターバル202及びフェイドインインターバル210の時間幅はそれぞれフェイドアウトインターバル204及びフロントインターバル208の時間幅と同一である。
図3は単語“young”に対する種々の合成ステップの例を示すものである。この単語は音素/j/,/V/,/N/及び沈黙/_/で作られている。図3の(a)及び(b)は、/j/ないし/V/及び/V/ないし/N/からの移行部を含む記録された無意味な単語である。各無意味な単語の中に5つのマーカが配置されている。外側のマーカは二音節境界(ラベルj−,−V,V−及び−N)である。中央のマーカは新たな音素がスタートする場所である(ラベルV、及びN)。他のラベルは重畳/加え合わせのために用いられるであろうセグメントをマークするために用いられる。図3の(c)に示されているようにエンドインターバル300の周期が逆順で繰り返されてフェイドアウトインターバル302が用意される。エンドインターバル300内の周期が全てエンドインターバル300の最後の周期である周期304の後に付加される。周期304自体は、意図しない周期性を導入する同じ周期の繰り返しを避けるために加え合わせされない。同様に図3の(b)の二音節信号に対しては、フロントインターバル306内の周期がフロントインターバル306の始まりで逆順で付加される。これは、フロントインターバル306の始まりの最初の周期310を除く、フロントインターバル306内の周期の全てに対して適用される。この周期310が意図しない周期性を導入するであろう2つの連続する2つの同一周期を避けるためにここでも付加されることはない。同じ種類の処理が図(a)の二音節信号のフロントインターバル312、及び図(b)の二音節信号のエンドインターバルに対して行われさらに同じアプローチが単語“young”の合成のために連結される必要のある、さらなる二音節に適用される。次にフロント、エンド、フェイドイン、及びフェイドアウトインターバルに対して平滑ウインドウが適用される。発声セグメントに対して、好ましくはウインドウ関数として持ち上げられたコサイン関数が用いられる。フェイドイン及びフロントインターバルに対して次のウインドウ関数、
w[n]=0.5−0.5・cos{(π・(n+0.5))/m} , 0≦n<m
が適用される。ここで、mは平滑範囲内の周期の全数である。対応する持ち上げられたコサイン関数が図(d)に、持ち上げられたコサイン関数316として示されている。エンド及びフェイドアウトインターバル300及び302に対しては、持ち上げられたコサイン関数318を提供するために、対応するウインドウ関数が用いられる。図(e)に示されているように重畳され、加え合わせされるインターバル、すなわちインターバル300/308及びインターバル302/306の時間幅は両者を同じ長さにするためにスケールが見直されている。要求される二音節の次の重畳が単語“young”の合成を提供する。
図4はコンピュータシステム400のブロック図を示すものであり、それはテキスト/音声変換システムである。このコンピュータシステム400は、二音節、並びにフロント及びエンドインターバルを示す二音節のためのマーカを保存するのに用いられるモジュール402を備えている。フェイドイン及びフェイドアウトインターバルを提供するためにエンド及びフロントインターバルに含まれる周期を逆順で繰り返すためにモジュール404が用いられる。平滑化の目的でエンド/フェイドアウト及びフェイドイン/フロントインターバルをウインドウイングするウインドウ関数を提供するためにモジュール406が用いられる。重畳されるインターバルの時間幅調整のためにモジュール408が用いられる。この時間幅の調整は、重畳されるインターバルが同じ長さでない場合に必要になるものである。必要とされる二音節を連結するために、エンド/フェイドイン及びフェイドアウト/フロントインターバルを重畳するためにモジュール410が用いられる。テキストがコンピュータ400に入力される時、連結されるべき必要な二音節がモジュール402から選択される。これらの二音節はモジュール404,406及び408の手段によって処理され、その後、モジュール410の手段によって重畳され、加え合わされる。このようにして必要とする合成された音声信号が得られる。
本発明の方法の好ましい実施例のフローチャートである。 オリジナル二音節信号のエンド及びフロントにおける周期の挿入繰り返しの説明図である。 信号合成の一例を示す説明図である。 テキスト/音声変換システムの一実施例を示すブロック図である。

Claims (14)

  1. 少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号の合成方法であって、
    エンドインターバルを有する第1音声ユニット信号を用意するステップと、
    フロントインターバルを有する第2音声ユニット信号を用意するステップと、
    前記第1音声ユニット信号の終わりに前記エンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意するステップと、
    前記第2音声ユニット信号の始まりに前記フロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意するステップと、
    前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを重畳するステップと、
    を備える、音声信号の合成方法。
  2. 前記エンド及びフロントインターバルがほぼ一定の周期を持っている、請求項1に記載の方法。
  3. 前記エンド及びフロントインターバルがマーカによって識別される、請求項1又は2に記載の方法。
  4. 前記エンドインターバルの最後の周期及び前記フロントインターバルの最初の周期は付加されない、請求項1ないし3のいずれか1項に記載の方法。
  5. 前記エンド及びフェイドアウトインターバルの少なくとも一方をフェイドアウトウインドウでウインドウイングするステップをさらに備える、請求項1ないし4のいずれか1項に記載の方法。
  6. 前記フェイドアウトウインドウとして持ち上げられたコサイン関数が用いられる、請求項5に記載の方法。
  7. 発声インターバルに対し、mを平滑範囲内の周期の全数として、ウインドウ関数、
    w[n]=0.5−0.5・cos{(π・(n+0.5))/m} , 0≦n<m
    が用いられる、請求項6に記載の方法。
  8. 非発声インターバルに対するフェイドアウトウインドウとしてサインウインドウが用いられる、請求項5に記載の方法。
  9. mを平滑範囲内の周期の全数として、ウインドウ関数、
    w[n]=sin{(0.5・π・(n+0.5))/m} , 0≦n<m
    が用いられる、請求項8に記載の方法。
  10. 前記第1及び第2音声が二音節、三音節、及びそれ以上の多音節の少なくとも1つ、特に単語である、請求項1ないし9のいずれか1項に記載の方法。
  11. 前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを適応させるステップをさらに備える、請求項1ないし10のいずれか1項に記載の方法。
  12. 音声信号が重畳及び加え合わせ操作によって合成される、請求項1ないし11のいずれか1項に記載の方法。
  13. 少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号を合成するためのプログラム手段を備えたコンピュータプログラムプロダクト、特にディジタル記憶メディアであって、
    エンドインターバルを有する第1音声ユニット信号を用意するステップと、
    フロントインターバルを有する第2音声ユニット信号を用意するステップと、
    前記第1音声ユニット信号の終わりに前記エンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意するステップと、
    前記第2音声ユニット信号の始まりに前記フロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意するステップと、
    前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを重畳するステップと、
    を実行するように構成されている、コンピュータプログラムプロダクト。
  14. 少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号を合成するためのコンピュータシステム、特にテキスト/音声変換システムであって、
    エンドインターバルを有する第1音声ユニット信号を保存する手段と、
    フロントインターバルを有する第2音声ユニット信号を保存する手段と、
    前記第1音声ユニット信号の終わりに前記エンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意する手段と、
    前記第2音声ユニット信号の始まりに前記フロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意する手段と、
    前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを重畳する手段と、
    を備えた、コンピュータシステム。
JP2004537379A 2002-09-17 2003-08-08 音声波形の連結を用いる音声合成 Expired - Lifetime JP4510631B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02078872 2002-09-17
PCT/IB2003/003624 WO2004027756A1 (en) 2002-09-17 2003-08-08 Speech synthesis using concatenation of speech waveforms

Publications (2)

Publication Number Publication Date
JP2005539267A true JP2005539267A (ja) 2005-12-22
JP4510631B2 JP4510631B2 (ja) 2010-07-28

Family

ID=32010992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004537379A Expired - Lifetime JP4510631B2 (ja) 2002-09-17 2003-08-08 音声波形の連結を用いる音声合成

Country Status (8)

Country Link
US (1) US7529672B2 (ja)
EP (1) EP1543500B1 (ja)
JP (1) JP4510631B2 (ja)
CN (1) CN100388357C (ja)
AT (1) ATE318440T1 (ja)
AU (1) AU2003255914A1 (ja)
DE (1) DE60303688T2 (ja)
WO (1) WO2004027756A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60305944T2 (de) * 2002-09-17 2007-02-01 Koninklijke Philips Electronics N.V. Verfahren zur synthese eines stationären klangsignals
US20070106513A1 (en) * 2005-11-10 2007-05-10 Boillot Marc A Method for facilitating text to speech synthesis using a differential vocoder
JP6047922B2 (ja) * 2011-06-01 2016-12-21 ヤマハ株式会社 音声合成装置および音声合成方法
US10382143B1 (en) * 2018-08-21 2019-08-13 AC Global Risk, Inc. Method for increasing tone marker signal detection reliability, and system therefor
US10790829B2 (en) * 2018-09-27 2020-09-29 Intel Corporation Logic circuits with simultaneous dual function capability
CN109686358B (zh) * 2018-12-24 2021-11-09 广州九四智能科技有限公司 高保真的智能客服语音合成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527789A (ja) * 1991-07-24 1993-02-05 Matsushita Electric Ind Co Ltd 音声合成装置
JPH11503535A (ja) * 1995-04-12 1999-03-26 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 波形言語合成
JP2000181452A (ja) * 1998-10-06 2000-06-30 Roland Corp 波形再生装置
JP2002202790A (ja) * 2000-12-28 2002-07-19 Yamaha Corp 歌唱合成装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2636163B1 (fr) 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
DE69028072T2 (de) 1989-11-06 1997-01-09 Canon Kk Verfahren und Einrichtung zur Sprachsynthese
EP0527527B1 (en) 1991-08-09 1999-01-20 Koninklijke Philips Electronics N.V. Method and apparatus for manipulating pitch and duration of a physical audio signal
IT1266943B1 (it) 1994-09-29 1997-01-21 Cselt Centro Studi Lab Telecom Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda.
WO2000030069A2 (en) * 1998-11-13 2000-05-25 Lernout & Hauspie Speech Products N.V. Speech synthesis using concatenation of speech waveforms
US6202049B1 (en) * 1999-03-09 2001-03-13 Matsushita Electric Industrial Co., Ltd. Identification of unit overlap regions for concatenative speech synthesis system
DE60127274T2 (de) * 2000-09-15 2007-12-20 Lernout & Hauspie Speech Products N.V. Schnelle wellenformsynchronisation für die verkettung und zeitskalenmodifikation von sprachsignalen

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527789A (ja) * 1991-07-24 1993-02-05 Matsushita Electric Ind Co Ltd 音声合成装置
JPH11503535A (ja) * 1995-04-12 1999-03-26 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 波形言語合成
JP2000181452A (ja) * 1998-10-06 2000-06-30 Roland Corp 波形再生装置
JP2002202790A (ja) * 2000-12-28 2002-07-19 Yamaha Corp 歌唱合成装置

Also Published As

Publication number Publication date
US7529672B2 (en) 2009-05-05
CN1682275A (zh) 2005-10-12
US20060059000A1 (en) 2006-03-16
AU2003255914A1 (en) 2004-04-08
EP1543500A1 (en) 2005-06-22
DE60303688T2 (de) 2006-10-19
ATE318440T1 (de) 2006-03-15
JP4510631B2 (ja) 2010-07-28
CN100388357C (zh) 2008-05-14
WO2004027756A1 (en) 2004-04-01
EP1543500B1 (en) 2006-02-22
DE60303688D1 (de) 2006-04-27

Similar Documents

Publication Publication Date Title
US8326613B2 (en) Method of synthesizing of an unvoiced speech signal
JPS62160495A (ja) 音声合成装置
HU176776B (en) Method and apparatus for synthetizing speech
US6601030B2 (en) Method and system for recorded word concatenation
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP4510631B2 (ja) 音声波形の連結を用いる音声合成
JP4490818B2 (ja) 定常音響信号のための合成方法
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP5360489B2 (ja) 音素符号変換装置および音声合成装置
EP0912975B1 (en) A method for synthesising voiceless consonants
JP2005523478A (ja) 音声を合成する方法
JP3081300B2 (ja) 残差駆動型音声合成装置
JPH0642158B2 (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP4305022B2 (ja) データ作成装置、プログラム及び楽音合成装置
JP2002244693A (ja) 音声合成装置および音声合成方法
JP3310217B2 (ja) 音声合成方法とその装置
JP5481957B2 (ja) 音声合成装置
JP2001166787A (ja) 音声合成装置および自然言語処理方法
JPH09244680A (ja) 韻律制御装置及び方法
JPS63131195A (ja) 音声合成装置
JPS6228800A (ja) 規則音声合成用駆動信号生成方法
JPS63210898A (ja) 音声合成装置
JPS63208099A (ja) 音声合成装置
JPH03296100A (ja) 音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060807

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100406

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4510631

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term