JP4813796B2 - 信号を合成するための方法、記憶媒体及びコンピュータシステム - Google Patents

信号を合成するための方法、記憶媒体及びコンピュータシステム Download PDF

Info

Publication number
JP4813796B2
JP4813796B2 JP2004537363A JP2004537363A JP4813796B2 JP 4813796 B2 JP4813796 B2 JP 4813796B2 JP 2004537363 A JP2004537363 A JP 2004537363A JP 2004537363 A JP2004537363 A JP 2004537363A JP 4813796 B2 JP4813796 B2 JP 4813796B2
Authority
JP
Japan
Prior art keywords
pitch bell
pitch
signal
synthesized
bell position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004537363A
Other languages
English (en)
Other versions
JP2005539264A (ja
Inventor
エルカン、エフ.ヒヒ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2005539264A publication Critical patent/JP2005539264A/ja
Application granted granted Critical
Publication of JP4813796B2 publication Critical patent/JP4813796B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Radio Relay Systems (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Auxiliary Devices For Music (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声や音楽を合成する分野に関し、特に制限なしにテキスト音声合成の分野に関する。
テキスト音声(TTS―Text-To-Speech―)合成システムの機能は、ある言語の一般的なテキストから音声を合成することである。今日、TTSシステムは、電話網を介してのデータベースへのアクセスや心身障害者の援助など多くの用途に対して実用化されている。1つの方法では、半音節や多音字など、記録された音声の小単位の組の要素をつなぎ合わせることによって音声を合成する。大多数の成功を収めた商業システムは、多音字の連結を使用している。多音字は、2つ(2音字)、3つ(3音字)または更に多くの音のグループを含んでおり、また安定したスペクトル領域で所望の音の分類を区切ることにより、無意味語から割り出すことができる。合成の基礎となる連結において、2つの隣接音間の移行の会話は、合成音声の品質を確保するのに重要である。基本小単位として多音字を選択するので、2つの隣接する音の間の移行は記録された小単位において保存され、また連結は類似する音の間で行なわれる。
しかし、合成の前に、音の継続時間とピッチとを修正して、このような音を含む新しい語の音律的制約を満たす必要がある。この処理は、単調な音の合成音声の生成を回避するのに必要である。TTSシステムにおいて、この機能は音律モジュールによって行なわれる。記録された小単位で継続時間とピッチの修正を可能にするために、多数の連結に基づくTTSシステムでは合成の時間領域ピッチ同期重畳追加(TD−PSOLA―Time-Domain Pitch-Synchronous Overlap-Add―)(E. MoulinesおよびF.Charpentier、「2音字を使用するテキスト音声合成のためのピッチ同期波形処理技術」、Speech Commun.、第9巻、453〜467頁、1990年)モデルを使用している。
TD−PSOLAモデルにおいては、まず、音声信号がピッチマーキングアルゴリズムを受ける。このアルゴリズムは、有声セグメントにおける信号のピークでマークを割当て、また無声セグメントにおいては10ms離れたマークを割当てる。合成は、ピッチマークに中心を置くハニングウィンドウ化セグメントを重ね合わせ、また前のピッチマークから次のピッチマークに拡張することによって行なわれる。継続時間の修正は、ウィンドウ化セグメントの一部を削除または反復することによって行なわれる。一方、ピッチ期間の修正は、ウィンドウ化セグメントの間の重ね合わせを増加あるいは減少させることによって行なわれる。
多数の商業用TTSシステムで成功しているにもかかわらず、合成のTD−PSOLAモデルを使用して生成される合成音声は、主に大きな音律的変化を受けると、幾つかの欠点を示すことがある。
EP−0363233、US−A−5,479,564、EP−0706170は、PSOLA方法を開示している。特定の例も、T.DutoitおよびH.Leich、in Speech Communication、Elsevier Publisher、1993年11月、第13巻、N.等級3−4、1993年で公表されているように、MBR−PSOLA方法である。米国特許第5,479,564号の文献に説明されている方法は、この信号から抽出した短期間信号を重畳追加することによって周波数を修正する手段を提案している。短期間信号を得るために使用される重みウィンドウの長さは、音声信号の期間の2倍にほぼ等しく、またこの期間内におけるそれらの位置を何れかの数値に設定することができる(連続するウィンドウ間の時間的推移が音声信号の期間に等しい場合)。米国特許第5,479,564の文献もまた、不連続性を除去するよう、連結するセグメント間の波形を補間する手段について述べている。ノイズが多い信号を既知のPSOLA方法を使用して合成する場合、信号は周期的に繰り返される。このように、故意でない周期性が周波数スペクトルに導入される。これは金属的な音として認識される。この問題は、無声音部分や音楽など、基本周波数を有さない全てのノイズの多い信号に生じる。「s」音のような無声音部分は、ピッチを有していない。声帯は、有声音のときのように動いていない。その代わりに、ノイズの多いシューという音は、声帯の間の小さな開口を介して空気を押し出すことによって発生する。ささやきは、無声部分のみを含む音声の例である。ピッチが無い場合、ピッチを変更する必要はない。しかし、無声音部分の継続時間を変更することは望ましい。
従って、本発明は、信号に故意でない周期性を導入することなく、無声音部分や音楽の継続時間を修正することを可能にする、信号を合成する方法を提供することを目的とする。
本発明は、元の信号に基づいて、特にノイズの多い信号である信号を合成する方法を提供する。また、本発明は、このような合成を行なうコンピュータプログラム製品と、特にテキスト音声システムである対応するコンピュータシステムとを提供する。
本発明によれば、合成する信号の必要ピッチベル位置が決定される。これは、例えば100Hzの想定周波数に基づいて行なわれる。この選択された周波数は、ピッチ期間に対応する。合成する信号の必要ピッチベル位置は、ピッチ期間の長さを有する間隔で、時間軸上で離間している。必要ピッチベル位置は元の信号上にマッピングされて、元の信号の領域におけるピッチベル位置が与えられる。元の信号の領域におけるピッチベル位置は、ランダムに移動される。好適には、ランダム化は、+/−ピッチ期間内で元の信号領域のピッチベル位置を移動することによって行なわれる。
本発明の実施例によれば、ウィンドウ化は正弦ウィンドウを使用することにより行なわれる。正弦ウィンドウの利点は、残留する周期性を減少させるのに役立つことである。特に、正弦ウィンドウを使用することは、パワードメインにおける信号エンベロープを一定に保つことを確実にすることにおいて有利である。周期的信号とは異なり、2つのノイズサンプルを追加する場合、合計は2つのサンプルの一方の絶対値よりも小さくなりえる。。これは、信号が(多くの場合)同相でないためである。正弦ウィンドウはこの効果に合わせて調整を行ない、エンベロープ変調を除去する。
以下において、本発明の好適な実施例を、図面を参照して更に詳細に説明する。
図1のフローチャートは、信号を合成する方法の実施例を示している。ステップ100において、yの継続時間を有する元の信号が提供される。例えば、元の信号は、ノイズの多い信号特性を有する無声音または音楽信号を含む自然音声信号である。また、基本周波数fは、元の信号がそのノイズの多い特性のためにこのような基本周波数を有していないにもかかわらず、選択される。周波数fの選択は、ピッチ期間pの選択に対応する。周波数fの適切な選択は、50Hzから200Hzの間、好適には100Hzである。また、合成される信号の所望の継続時間xは、ステップ100において入力される。ステップ102において、合成される信号の領域におけるピッチベル位置は、周波数fおよびピッチ期間pの選択に応じて決定される。これは、合成される信号の領域における時間軸を長さpの間隔に分割することによって行なわれる。ステップ104において、ピッチベル位置は、合成される信号の領域から、元の信号の領域上にマッピングされる。継続時間xが元の信号の継続時間yよりも長い場合、これは、元の信号の領域におけるピッチベル位置iがピッチ期間pよりも短い間隔で離間していることを意味している。逆の場合、元の信号の領域におけるピッチベル位置i間の間隔は、ピッチベル位置と合成される信号の領域との間の間隔よりも長くなる。ステップ106において、元の信号の領域におけるピッチベル位置iはランダム化される。これは、元のピッチベル位置i周辺で+/−pの間隔内でピッチベル位置iのそれぞれをランダムに移動させることによって、行なうことができる。擬似乱数生成器を使用して、このランダム化を行なうことが可能である。ステップ108では、元の信号の領域においてウィンドウ化を行なう。好適には、これは、ランダム化されたピッチベル位置i′に適用される正弦ウィンドウを使用することによって行なわれ、このように周期性は更に軽減される。ステップ110では、結果として生じたピッチベルは、合成される信号の領域において重畳および追加され、これによって合成信号が得られる。
図2は、一例としてこの信号合成を示している。時間軸200は、合成される信号の領域に存在する。合成される信号の必要継続時間xは、ここで考察する例では二分の一である。想定周波数fは100Hzであり、これは10ミリ秒のピッチ期間pに対応する。これは、時間軸200上の合成される信号の領域における必要ピッチベル位置が、p=10ミリ秒の間隔で離間されている、すなわち第1ピッチベル位置が時間軸200上のゼロ秒に位置し、次のピッチベル位置が10ミリ秒に位置し、また次のピッチベル位置が20ミリ秒に位置し、以下同様であることを意味している。換言すれば、合成される信号の領域におけるピッチベル位置は、時間ゼロで開始するpの間隔で離間する時間軸200上の点によって決定される。時間軸200上のピッチベル位置は、元の信号の領域における時間軸202にマッピングされる。元の信号は、y=0.5秒の継続時間を有している。継続時間yが合成される信号の継続時間xよりも短くなると、これはピッチベル位置を時間軸202上で「圧縮」する必要があることを意味している。継続時間yが継続時間xの半分であれば、時間軸202上のマッピングされたピッチベル位置の間隔は、pではなくp/2だけ離間している。これは、第1ピッチベル位置i=1が時間軸202上のゼロミリ秒に位置し、次のピッチベル位置i=2が5ミリ秒に位置し、次のピッチベル位置i=3が10ミリ秒に位置し、以下同様であることを意味している。換言すれば、時間軸200上の時間ゼロミリ秒の第1ピッチベル位置は、ゼロミリ秒で時間軸202上のピッチベル位置i=1にマッピングされ、また時間軸200上の10ミリ秒の必要ピッチベル位置は、時間軸202上の5ミリ秒のピッチベル位置i=2にマッピングされ、更に時間軸200上の20ミリ秒の必要ピッチベル位置は、時間軸202上の時間10ミリ秒のピッチベル位置i=3にマッピングされ、以下同様である。次に、ピッチベル位置iはランダム化される。これを、時間軸202上の第1ピッチベル位置i=1について図2に示す。ゼロミリ秒周辺の+/−pの間隔は、時間軸202上で定義される。この間隔内で、ピッチベル位置i=1はランダムに移動される。ピッチベル位置i=1の場合、間隔は時間軸202上で−10ミリ秒から+10ミリ秒の間である。ここで考察する例では、これによって、時間軸202上の7.5ミリ秒のランダム化されたピッチベル位置i′が得られる。この位置で、元の信号はウィンドウ関数204を使用することによってウィンドウ化される。好適には、以下のウィンドウを使用してウィンドウ関数204を得る。
Figure 0004813796
好適には、ピッチベル位置iのランダム化は、以下の式に従って行なわれる。
i′=i+(Rxp)
ここで、iは時間軸202上の元のピッチベル位置を表し、i′はランダム化後の新たなピッチベル位置であり、Rは−1から1の間の乱数であり、またpはピッチ期間である。元の信号をウィンドウ化した結果が、ピッチベルである。このピッチベルは、図2に示すように、時間軸200上の合成される信号の領域内の第1必要ピッチベル位置に位置している。このプロセスは、時間軸上の全ての必要ピッチベルに対して繰り返される。これらのピッチベルは追加され、これによって長さxの所望の合成信号が生じる。
図3は、テキスト音声システムなどのコンピュータシステムのブロック図を示している。コンピュータシステム300は、yの継続時間を有する元の信号を記憶するモジュール302を有している。また、コンピュータシステム300は、予め選択した周波数fまたはピッチpを記憶するモジュール304を有している。モジュール306は、合成される信号の必要継続時間xと予め選択した周波数fまたはピッチpとに基づいて、合成される信号の必要ピッチベル位置を決定するよう機能する。モジュール308は、合成される信号の領域における必要ピッチベル位置を元の信号の領域上にマッピングするよう機能する。このように、ピッチベル位置iは、図2の例に示すように決定される。モジュール310は、ピッチベル位置iをランダム化するよう機能する。モジュール310はランダム化プロセスの乱数を与えるモジュール312に結合される。モジュール314は、ランダム化されたピッチベル位置i′上で元の信号のウィンドウ化を行なうよう機能する。そして、結果として得られるピッチベルは、モジュール316を使用することにより、合成される信号の領域において重畳および追加される。これにより、所望の継続時間yの合成信号が得られる。
本発明の実施例のフローチャートを示している。 無声音信号を合成する例を示している。 コンピュータシステムの好適な実施例のブロック図である。
符号の説明
200 時間軸
202 時間軸
204 ウィンドウ関数
300 コンピュータシステム
302 モジュール
304 モジュール
306 モジュール
308 モジュール
310 モジュール
312 モジュール
314 モジュール
316 モジュール

Claims (9)

  1. 信号を合成する方法であって、
    a)合成される信号の領域における必要ピッチベル位置を決定する工程と、
    b)第1ピッチベル位置を得るために前記必要ピッチベル位置を元の信号上にマッピングする工程と、
    c)第2ピッチベル位置を得るために前記第1ピッチベル位置をランダムに移動させる工程と、
    d)ピッチベルを得るために前記第2ピッチベル位置上で前記元の信号についてウィンドウ化を行なう工程と、
    e)前記合成される信号の領域における前記必要ピッチベル位置に、得られた前記ピッチベルを置く工程と、
    f)前記合成される信号の全ての必要ピッチベル位置に対して工程a)からe)までを繰り返し、合成される前記信号の前記領域における前記ピッチベルに対して重畳および追加操作を行なう工程と
    を有する方法。
  2. 前記必要ピッチベル位置を決定する工程が、合成される信号の必要長さを時間間隔に分割することによって行なわれ、前記時間間隔のそれぞれがピッチの長さを有する、請求項1に記載の方法。
  3. 第2ピッチベル位置を得るために前記第1ピッチベル位置をランダムに移動させる前記工程が、前記第1ピッチベル位置を、±ピッチの長さの範囲内でランダムに移動させることにより行なわれる、請求項1または2に記載の方法。
  4. Rが−1から1の間の乱数であり、pが前記ピッチであり、前記第2ピッチベル位置i′を得るために前記第1ピッチベル位置iをランダムに移動させる前記工程が、以下の式
    i′=i+(Rxp)
    に従って行なわれる、前記請求項1、2または3のいずれか1つに記載の方法。
  5. ウィンドウ化が正弦ウィンドウを用いて行なわれる、前記請求項1ないし4のいずれか1つに記載の方法。
  6. mが前記ウィンドウの長さであり、nが実行指数であるときに、ウィンドウ化が以下の正弦ウィンドウ関数
    Figure 0004813796
    を用いて行なわれる、前記請求項1ないし5のいずれか1つに記載の方法。
  7. 前記元の信号が基本周波数を有しておらず、また前記元の信号が好適には無声音または音楽を含んでいる、前記請求項1ないし6のいずれか1つに記載の方法。
  8. コンピュータにより実行された場合に或る方法を該コンピュータに実行させるプログラムを格納したコンピュータ読取可能な記憶媒体であって、前記方法は、
    a)合成される信号の領域における必要ピッチベル位置を決定する工程と、
    b)第1ピッチベル位置を得るために前記必要ピッチベル位置を元の信号上にマッピングする工程と、
    c)第2ピッチベル位置を得るために前記第1ピッチベル位置をランダムに移動させる工程と、
    d)ピッチベルを得るために前記第2ピッチベル位置上で前記元の信号についてウィンドウ化を行なう工程と、
    e)前記合成される信号の領域における前記必要ピッチベル位置に、得られた前記ピッチベルを置く工程と、
    f)前記合成される信号の全ての必要ピッチベル位置に対して工程a)からe)までを繰り返し、合成される前記信号の前記領域における前記ピッチベルに対して重畳および追加操作を行なう工程と
    を有する、コンピュータ読取可能な記憶媒体。
  9. 信号を合成するテキスト音声合成システムであるコンピュータシステムであって、
    a)合成される信号の領域における必要ピッチベル位置を決定する工程と、
    b)第1ピッチベル位置を得るために前記必要ピッチベル位置を元の信号上にマッピングする工程と、
    c)第2ピッチベル位置を得るために前記第1ピッチベル位置をランダムに移動させる工程と、
    d)ピッチベルを得るために前記第2ピッチベル位置上で前記元の信号についてウィンドウ化を行なう工程と、
    e)前記合成される信号の領域における前記必要ピッチベル位置に、得られた前記ピッチベルを置く工程と、
    f)前記合成される信号の全ての必要ピッチベル位置に対して工程a)からe)までを繰り返し、合成される前記信号の前記領域における前記ピッチベルに対して重畳および追加操作を行なう工程と
    を実行する手段を有するコンピュータシステム。
JP2004537363A 2002-09-17 2003-08-08 信号を合成するための方法、記憶媒体及びコンピュータシステム Expired - Lifetime JP4813796B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02078853 2002-09-17
EP02078853.5 2002-09-17
PCT/IB2003/003544 WO2004027754A1 (en) 2002-09-17 2003-08-08 A method of synthesizing of an unvoiced speech signal

Publications (2)

Publication Number Publication Date
JP2005539264A JP2005539264A (ja) 2005-12-22
JP4813796B2 true JP4813796B2 (ja) 2011-11-09

Family

ID=32010980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004537363A Expired - Lifetime JP4813796B2 (ja) 2002-09-17 2003-08-08 信号を合成するための方法、記憶媒体及びコンピュータシステム

Country Status (8)

Country Link
US (2) US7805295B2 (ja)
EP (1) EP1543498B1 (ja)
JP (1) JP4813796B2 (ja)
CN (1) CN100361198C (ja)
AT (1) ATE328343T1 (ja)
AU (1) AU2003253152A1 (ja)
DE (1) DE60305716T2 (ja)
WO (1) WO2004027754A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4490818B2 (ja) * 2002-09-17 2010-06-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 定常音響信号のための合成方法
US7805295B2 (en) * 2002-09-17 2010-09-28 Koninklijke Philips Electronics N.V. Method of synthesizing of an unvoiced speech signal
JP5482042B2 (ja) * 2009-09-10 2014-04-23 富士通株式会社 合成音声テキスト入力装置及びプログラム
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
EP3803867B1 (en) 2018-05-31 2024-01-10 Shure Acquisition Holdings, Inc. Systems and methods for intelligent voice activation for auto-mixing
WO2019231632A1 (en) 2018-06-01 2019-12-05 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US10382143B1 (en) * 2018-08-21 2019-08-13 AC Global Risk, Inc. Method for increasing tone marker signal detection reliability, and system therefor
EP3854108A1 (en) 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
CN113841419A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、系统及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
JP2022545113A (ja) 2019-08-23 2022-10-25 シュアー アクイジッション ホールディングス インコーポレイテッド 指向性が改善された一次元アレイマイクロホン
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
WO2022165007A1 (en) 2021-01-28 2022-08-04 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61292700A (ja) * 1985-06-20 1986-12-23 日本電気株式会社 音声ノイズ発生回路
JPS63199399A (ja) * 1987-02-16 1988-08-17 キヤノン株式会社 音声合成装置
JPH09281994A (ja) * 1996-04-19 1997-10-31 Oki Electric Ind Co Ltd 音声合成装置
JPH10214098A (ja) * 1997-01-31 1998-08-11 Sanyo Electric Co Ltd 音声変換玩具
JPH11509941A (ja) * 1996-05-24 1999-08-31 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 人間の音声符号化方法及びそのように符号化された人間の音声を再生する装置
JP2001513225A (ja) * 1997-12-19 2001-08-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 伸長オーディオ信号からの周期性の除去

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4631746A (en) * 1983-02-14 1986-12-23 Wang Laboratories, Inc. Compression and expansion of digitized voice signals
JPS60225200A (ja) * 1984-04-23 1985-11-09 日本電気株式会社 音声符号化器
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4805511A (en) * 1986-08-12 1989-02-21 Schulmerich Carillons, Inc. Electronic bell-tone generating system
FR2636163B1 (fr) 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
CA1333425C (en) * 1988-09-21 1994-12-06 Kazunori Ozawa Communication system capable of improving a speech quality by classifying speech signals
JP2903533B2 (ja) * 1989-03-22 1999-06-07 日本電気株式会社 音声符号化方式
US5241650A (en) * 1989-10-17 1993-08-31 Motorola, Inc. Digital speech decoder having a postfilter with reduced spectral distortion
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5150387A (en) * 1989-12-21 1992-09-22 Kabushiki Kaisha Toshiba Variable rate encoding and communicating apparatus
US5664051A (en) * 1990-09-24 1997-09-02 Digital Voice Systems, Inc. Method and apparatus for phase synthesis for speech processing
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
EP0527527B1 (en) 1991-08-09 1999-01-20 Koninklijke Philips Electronics N.V. Method and apparatus for manipulating pitch and duration of a physical audio signal
DE69231266T2 (de) * 1991-08-09 2001-03-15 Koninkl Philips Electronics Nv Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium
JP3360312B2 (ja) * 1992-06-03 2002-12-24 ヤマハ株式会社 楽音合成装置
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5434947A (en) * 1993-02-23 1995-07-18 Motorola Method for generating a spectral noise weighting filter for use in a speech coder
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
IT1266943B1 (it) 1994-09-29 1997-01-21 Cselt Centro Studi Lab Telecom Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda.
US5754094A (en) * 1994-11-14 1998-05-19 Frushour; Robert H. Sound generating apparatus
JPH08254993A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 音声合成装置
EP0763818B1 (en) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
US5940791A (en) * 1997-05-09 1999-08-17 Washington University Method and apparatus for speech analysis and synthesis using lattice ladder notch filters
US6011211A (en) * 1998-03-25 2000-01-04 International Business Machines Corporation System and method for approximate shifting of musical pitches while maintaining harmonic function in a given context
US6015949A (en) * 1998-05-13 2000-01-18 International Business Machines Corporation System and method for applying a harmonic change to a representation of musical pitches while maintaining conformity to a harmonic rule-base
US6284965B1 (en) * 1998-05-19 2001-09-04 Staccato Systems Inc. Physical model musical tone synthesis system employing truncated recursive filters
JP3430968B2 (ja) * 1999-05-06 2003-07-28 ヤマハ株式会社 ディジタル信号の時間軸圧伸方法及び装置
US6963833B1 (en) * 1999-10-26 2005-11-08 Sasken Communication Technologies Limited Modifications in the multi-band excitation (MBE) model for generating high quality speech at low bit rates
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
JP4490818B2 (ja) * 2002-09-17 2010-06-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 定常音響信号のための合成方法
US7805295B2 (en) * 2002-09-17 2010-09-28 Koninklijke Philips Electronics N.V. Method of synthesizing of an unvoiced speech signal
US7657289B1 (en) * 2004-12-03 2010-02-02 Mark Levy Synthesized voice production

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61292700A (ja) * 1985-06-20 1986-12-23 日本電気株式会社 音声ノイズ発生回路
JPS63199399A (ja) * 1987-02-16 1988-08-17 キヤノン株式会社 音声合成装置
JPH09281994A (ja) * 1996-04-19 1997-10-31 Oki Electric Ind Co Ltd 音声合成装置
JPH11509941A (ja) * 1996-05-24 1999-08-31 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 人間の音声符号化方法及びそのように符号化された人間の音声を再生する装置
JPH10214098A (ja) * 1997-01-31 1998-08-11 Sanyo Electric Co Ltd 音声変換玩具
JP2001513225A (ja) * 1997-12-19 2001-08-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 伸長オーディオ信号からの周期性の除去

Also Published As

Publication number Publication date
AU2003253152A1 (en) 2004-04-08
EP1543498B1 (en) 2006-05-31
WO2004027754A1 (en) 2004-04-01
US20060053017A1 (en) 2006-03-09
EP1543498A1 (en) 2005-06-22
CN1682276A (zh) 2005-10-12
DE60305716T2 (de) 2007-05-31
ATE328343T1 (de) 2006-06-15
US8326613B2 (en) 2012-12-04
US20100324906A1 (en) 2010-12-23
CN100361198C (zh) 2008-01-09
JP2005539264A (ja) 2005-12-22
US7805295B2 (en) 2010-09-28
DE60305716D1 (de) 2006-07-06

Similar Documents

Publication Publication Date Title
JP4813796B2 (ja) 信号を合成するための方法、記憶媒体及びコンピュータシステム
JP6791258B2 (ja) 音声合成方法、音声合成装置およびプログラム
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
US20040102975A1 (en) Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
JP2018077283A (ja) 音声合成方法
JP4490818B2 (ja) 定常音響信号のための合成方法
JP4451665B2 (ja) 音声を合成する方法
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP6834370B2 (ja) 音声合成方法
JP6683103B2 (ja) 音声合成方法
JP6822075B2 (ja) 音声合成方法
JP3310217B2 (ja) 音声合成方法とその装置
JPH06250685A (ja) 音声合成方式および規則合成装置
WO2004027755A1 (en) Method of synthesizing creaky voice

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060807

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110628

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110802

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110825

R150 Certificate of patent or registration of utility model

Ref document number: 4813796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term