JP4490818B2 - 定常音響信号のための合成方法 - Google Patents

定常音響信号のための合成方法 Download PDF

Info

Publication number
JP4490818B2
JP4490818B2 JP2004537354A JP2004537354A JP4490818B2 JP 4490818 B2 JP4490818 B2 JP 4490818B2 JP 2004537354 A JP2004537354 A JP 2004537354A JP 2004537354 A JP2004537354 A JP 2004537354A JP 4490818 B2 JP4490818 B2 JP 4490818B2
Authority
JP
Japan
Prior art keywords
acoustic signal
pitch bell
fundamental frequency
signal
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004537354A
Other languages
English (en)
Other versions
JP2005539262A (ja
Inventor
エルカン、エフ.ヒヒ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2005539262A publication Critical patent/JP2005539262A/ja
Application granted granted Critical
Publication of JP4490818B2 publication Critical patent/JP4490818B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音声または音楽の合成の分野に関し、限定はしないが、より詳細には、テキスト音声合成の分野に関する。
テキスト音声(TTS)合成システムの機能は所与の言語で一般テキストから音声を合成することである。今日、TTSシステムは電話ネットワークを介したデータベースへのアクセスや障害者への援助など、多くの用途で実際的に運用されている。音声を合成する1つの方法は、半音節や多音字などの音声のサブユニットの記録されたセットの要素を連結することによる。成功している市販システムの大部分は多音字の連結を採用している。多音字は2つ(ダイフォン(diphone))、3つ(トリフォン(triphone))またはそれ以上の音字のグループを含み、安定したスペクトル領域で音字の所望のグループ化を分割することによって、単義語から決定することができる。連結ベースの合成において、2つの隣接する音字間の遷移の会話は合成音声の品質を保証するために重要である。基本サブユニットとしての多音字の選択で、2つの隣接する音字間の遷移は記録されたサブユニットに保存され、連結は同様の音字間で行われる。
しかしながら、合成の前に、音字は、それらの音字を含有する新しい単語の韻律制約を満たすために、それらの持続時間およびピッチを修正しなければならない。この処理は単調音響合成音声の生成を避けるために必要である。TTSシステムでは、韻律モジュールがこの機能を実行する。記録されたサブユニットにおける持続時間およびピッチの修正を可能にするために、多くの連結ベースのTTSシステムは時間領域ピッチ同期重畳追加(TD−PSOLA)(E.MoulinesおよびF.Charpentier、「Pitch synchronous waveform processing techniques for text-to-speech synthesis using diphones」、Speech Commun.、vol.9、pp.453-467、1990)合成モデルを採用している。合成すべき信号が延長された周期を有する必要がある場合、これは元の信号から得られたピッチ・ベルを反復することによって行われる。この反復プロセスを図1に示す。時間軸100は元の信号の時間領域に属する。元の信号は時間軸100上の0とTの間の時間間隔にわたる長さTを有する。さらに、元の信号は周期pに対応する基本周波数fを有する。ピッチ・ベルはウィンドウ102によって元の信号をウィンドウ処理することにより元の信号から得られる。本明細書で考察する例では、ウィンドウは時間軸100の領域において周期pで離間される。このようにしてピッチ・ベル位置iは時間軸100上で決定される。時間軸104は合成すべき信号の時間領域に属する。合成すべき信号は持続時間yTを有する必要があり、yは任意の数とすることができる。次に、いくつかのピッチ・ベル位置jが時間軸104上で決定される。時間軸100上と同様に、ピッチ・ベル位置jは元の信号の基本周波数fに対応する周期pで離間される。元の信号の持続時間を増加するために、元の信号から得られた元のピッチ・ベルの各々がy回反復される。これにより時間軸104の領域において間隔106、108、...が生じ、それにより間隔106、108、...の各々は同等のピッチ・ベルの反復から構成される。たとえば、間隔106はピッチ・ベル位置j(i=1、k=1)〜j(i=1、k=y)で元の信号からのピッチ・ベル位置i=1から得られたピッチ・ベルの反復を含有する。これは元の信号の時間軸100上のピッチ・ベル位置i=1から得られたピッチ・ベルのy個の反復を間隔106が含有することを意味する。同様に、以下の間隔108は元の信号からのピッチ位置i=2から得られたピッチ・ベルのy個の反復を含有する。したがって、合成信号はピッチ・ベル反復の連結されたシーケンスから構成される。
そのようなPSOLA方法の共通の欠点は極端持続時間操作が信号中にシーケンス間の可聴遷移を導入することである。特に、これは元の音声が、雑音成分と周期成分の両方を有する有声摩擦音(voiced fricative)のような混合音声である場合に問題になる。ピッチ・ベルの反復は雑音成分に周期性を導入し、これにより合成信号が不自然に聞こえるようになる。
したがって本発明は、特に、歌唱の場合のように、極端持続時間修正のために、音響信号を合成する改善された方法を提供することを目的とする。
本発明は、元の信号の持続時間を操作するために元の信号に基づいて音響信号を合成する方法を提供する。特に、本発明は、可聴アーティファクトなしに元の信号の極端持続時間およびピッチ修正を可能にする。これは元の信号の4〜100倍程度の極端持続時間操作が起こりうる歌唱を合成するのに特に有用である。
本質的に、本発明は、反復ピッチ・ベルの1つの連鎖から次の連鎖への遷移が可聴なので、従来技術のPSOLA方法が持続時間操作後に合成信号にアーティファクトを導入するという観察に基づく。極端持続時間操作のために従来技術のPSOLAタイプの方法を採用した場合に受けるこの効果は、雑音成分と周期成分の両方を含有する混合音声にとって特に不利である。
本発明によれば、ピッチ・ベルは合成すべき信号の所要のピッチ・ベル位置の各々について元の信号から無作為に選択される。このようにして雑音成分中の周期性の導入を避けることができ、元の信号の自然さが保存される。本発明の好ましい実施形態によれば、元の信号は雑音成分と周期成分の両方を有する有声摩擦音である。そのような有声摩擦音への本発明の適用は特に有益である。
本発明のさらなる好ましい実施形態によれば、有声摩擦音をウィンドウ処理するために2乗コサイン(raised cosine)が使用される。無声音響間隔に対しては、電力領域における全信号包絡線がほぼ一定のままであるという利点を有するサイン・ウィンドウが使用される。周期信号とは異なり、2つの雑音サンプルを追加した場合、総和を2つのサンプルのいずれかの絶対値よりも小さくすることができる。これは信号が(たいてい)同相でないためである。サイン・ウィンドウはこの効果に対して調節し、包絡線変調を除去する。
本発明のさらなる好ましい実施形態によれば、元の音響信号は、スペクトル的に同様であり、基本的に同じ情報内容を有する周期を有する。有声であるそのような周期は第1の分類子(classifier)によって分類され、無声であるそのような周期は第2の分類子によって分類される。
本発明のさらなる好ましい実施形態によれば、元の信号の分類情報はテキスト音声システムなどのコンピュータ・システムに記憶される。スペクトル的に同様である有声または無声の定常周期として分類される元の信号の間隔が本発明によって処理され、有声間隔に対しては2乗コサイン・ウィンドウが使用され、無声間隔に対してはサイン・ウィンドウが使用される。
以下に、図面を参照して本発明の好ましい実施形態についてより詳細に説明する。
図2は元の信号に基づいて信号を合成する一例を示す。時間軸200は元の信号の時間領域を示す。元の信号は持続時間Tを有し、時間軸200上の0とTの間の時間にわたる。元の信号は周期pに対応する基本周波数fを有する。周期pはウィンドウ202によって元の信号をウィンドウ処理するために時間軸200上の位置iを決定する。本明細書で考察する例では、以下の公式によるコサイン・ウィンドウが使用されるような有声混合音声である。
Figure 0004490818
以前の関係では、mはウィンドウの長さであり、nはラニング指数(running index)である。
元の信号が無声音響信号の場合、以下のウィンドウを使用することが好ましい。
Figure 0004490818
合成すべき信号の時間領域を時間軸204で示す。合成すべき信号はyTの持続時間を有する必要があり、ただしyは任意の数、たとえばy=4またはy=6またはy=20またはy=50またはy=100とすることができる。
周期pは時間軸204上のピッチ・ベル位置jをも決定する。時間軸200上と同様に、ピッチ・ベル位置は周期pで離間される。所要のピッチ・ベル位置jの各々について、時間軸200の時間領域におけるピッチ・ベルiの無作為選択が行われる。本明細書で考察する例では、時間軸200の時間領域において元の信号をウィンドウ処理することによって得られるいくつかの6ピッチ・ベルがある。ピッチ・ベル位置jに対してこれらの得られたピッチ・ベルの1つを選択するために、1と6の間の乱数が発生する。このようにしてピッチ・ベル位置i=1〜i=6上の利用可能なピッチ・ベルからの無作為選択が行われる。このプロセスは時間軸204上のすべての所要のピッチ・ベル位置jに対して反復される。例えば、所要のピッチ・ベル位置j=1のピッチ・ベルは1と6の間の乱数を発生することによって選択される。本明細書で考察する例では、時間軸200上のピッチ・ベル位置i=6から得られるピッチ・ベルが時間軸204上の所要のピッチ・ベル位置j=1に対して選択されるように番号6は得られる。同様に、所要のピッチ・ベル位置j=2に対して乱数が発生する。時間軸200上のピッチ・ベル位置i=4のピッチ・ベルが所要のピッチ・ベル位置j=2に対して選択されるように乱数はこの例では4である。このプロセスは時間軸204上のすべての所要のピッチ・ベル位置j=1〜j=zに対して実行される。元の信号の領域からの無作為選択のために、間隔106、108、...は避けられる(図1参照)。したがって、そのようなアーティファクトは合成信号に導入されず、合成信号は極端持続時間操作に対しても自然に聞こえる。
図3はこの方法を示す流れ図を示す。ステップ300で元の音の録音を行う。ステップ302で混合音声間隔を識別し、元の音の録音で有声または無声として分類する。これは定常周期について元の信号および/またその周波数スペクトルを分析する専門家によってまたはコンピュータ・プログラムによって手動で行うことができる。好ましくは、第1の分析がプログラムによって実施され、専門家がプログラムの出力を検討する。ステップ304でウィンドウ処理によって元の音響信号からピッチ・ベルを得る。ウィンドウ処理は元の音響信号の基本周波数と同期して配置されるウィンドウによって実施される、すなわちウィンドウは元の音響信号の領域において元の信号の周期pで離隔される。ステップ306で、信号を合成するためにピッチ・ベルが必要とされるピッチ・ベル位置jを決定する。この場合も、所要のピッチ・ベル位置jは周期pで離隔される。あるいは、ピッチ・ベル位置jは合成すべき信号のより高いまたはより低い所要の基本周波数に対応する別の周期qで離隔することができる。このようにして持続時間および周波数を修正することができる。ステップ308で、混合として分類される音響間隔内の所要のピッチ・ベル位置jの各々についてピッチ・ベルの無作為選択を実施する。他の音響間隔について、従来技術のPSOLAタイプ方法を採用しても採用しなくてもよい。ステップ310で、合成すべき信号の領域においてピッチ・ベル位置jにピッチ・ベルを重畳および追加する。
図4は/z/から/z/への遷移のダイフォンである元の音響信号400の一例を示す。また音響信号400の周波数スペクトル402を図4に示す。
音響信号404は合成音響信号404の時間領域において所要のピッチ・ベル位置のための音響信号400から得られたピッチ・ベルを手動で選択することによって本発明によって音響信号400から得られる。本明細書で考察する例では、合成音響信号404は元の音響信号400よりもy=5倍長い。また、音響信号404の周波数スペクトル406を図4に示す。音響信号404およびその周波数スペクトル406から明らかなように、元の音響信号400の特性は合成信号に保存され、アーチファクトは導入されない。したがって、音響信号404は音響信号400と同等に聞こえるが、5倍より長くはならない。
図5はテキスト音声合成システムなどのコンピュータ・システムのブロック図を示す。コンピュータ・システム500は元の音響信号を記憶するためのモジュール502を備える。モジュール504はモジュール502に記憶された元の信号の音響分類情報を入力し、記憶する働きをする。たとえば、元の信号において定常有声周期は「r」でマークされ、定常無声周期は「s」でマークされる。モジュール506はピッチ・ベルを得るためにモジュール502の元の音響信号をウィンドウ処理する働きをする。音響分類によって、定常有声周期または定常無声周期に2乗コサインまたはサイン・ウィンドウがそれぞれ使用される。モジュール508は合成すべき信号の領域において所要のピッチ・ベル位置jを決定する働きをする。所要のピッチ・ベル位置jを決定するために、入力パラメータ「長さy」が利用される。入力パラメータ長さyは元の信号の持続時間の増倍率(multiplication factor)を指定する。さらに、持続時間に加えてまたはその代わりに基本周波数を変更するための追加の入力パラメータとして動的に変動するピッチを与えることが可能である。
モジュール510は元の音響信号から得られるピッチ・ベルの組からピッチ・ベルを選択する働きをする。モジュール510は擬似乱数発生器512に結合される。合成すべき信号の領域における所要のピッチ・ベル位置の各々について、擬似乱数は擬似乱数発生器512によって発生する。これらの擬似乱数によって、合成すべき信号の時間領域における所要のピッチ・ベル位置の各々について無作為に選択されるピッチ・ベルを与えるためにピッチ・ベルの組からのピッチ・ベルの選択がモジュール510によって行われる。モジュール514は合成すべき信号の時間領域における選択されたピッチ・ベルに対して重畳および追加を実施する働きをする。このようにして所要の持続時間を有する合成信号が得られる。
本発明は定常領域に適用できることに注意する。たとえば、そのような定常領域は母音または/z/のような雑音有声音声とすることができる。したがって、本発明は「混合」音声に限定されない。
さらに、合成信号は元と同じピッチ(基本周波数)を有する必要がないことに注意する。いくつかの適用例では、たとえば歌唱を合成するためにピッチを変更する必要がある。合成信号における基本周波数のこの変更を行うために、合成信号における周期位置を元よりも互いにより近くにまたはより離れて置く。これは別段に合成手順を変更しない。
さらに、本発明はウィンドウのある一定の選択に制限されない。2乗コサインまたはサイン・ウィンドウの代わりに、三角ウィンドウなどの他のウィンドウを使用することができる。
従来技術のPSOLAタイプ方法を示す図である。 本発明の一実施形態による音響信号を合成するための一例を示す図である。 本発明の方法の一実施形態の流れ図である。 元の信号および合成信号の一例を示す図である。 コンピュータ・システムの好ましい実施形態のブロック図である。

Claims (10)

  1. 所要の第1の基本周波数を有する第1の音響信号を第2の基本周波数を有する第2の音響信号に基づいて合成する方法であって、
    前記第1の音響信号の時間領域において前記第1の基本周波数の1つの周期で離隔された所要のピッチ・ベル位置を決定するステップと、
    前記第2の音響信号の時間領域において前記第2の基本周波数の1つの周期で離隔されたピッチ・ベル位置で前記第2の音響信号をウィンドウ処理することによってピッチ・ベルを与えるステップと、
    前記所要のピッチ・ベル位置の各々について前記与えられたピッチ・ベルからピッチ・ベルを無作為に選択するステップと、
    前記第1の信号を合成するために前記選択されたピッチ・ベルに対して重畳および追加動作を行うステップと
    を含む方法。
  2. 前記第2の音響信号が、雑音成分および周期成分を含む混合音声である請求項1に記載の方法。
  3. 前記第2の音響信号が有声摩擦音音響信号である請求項1または2に記載の方法。
  4. 前記第2の音響信号が有声音響信号であり、前記第2の音響信号をウィンドウ処理するために2乗コサインが使用される請求項1乃至3のいずれかに記載の方法。
  5. 前記第2の音響信号が無声音響信号であり、前記第2の音響信号をウィンドウ処理するためにサイン・ウィンドウが使用される請求項1乃至3のいずれかに記載の方法。
  6. 前記第2の音響信号がスペクトル的に似ている周期を有し、前記スペクトル的に似ている周期は基本的に同じ情報内容を有している請求項1乃至5のいずれかに記載の方法。
  7. 前記所要の第1の基本周波数と前記第2の基本周波数とが実質的に同じである前記請求項1乃至6のいずれかに記載の方法。
  8. コンピュータによって実行される場合に所要の第1の基本周波数を有する第1の音響信号を第2の基本周波数を有する第2の音響信号に基づいて合成するプログラムを有するコンピュータ読取可能なデジタル記憶媒体であって、前記プログラムは前記コンピュータに、
    前記第1の音響信号の時間領域において前記第1の基本周波数の1つの周期で離隔された所要のピッチ・ベル位置を決定する手順と、
    前記第2の音響信号の時間領域において前記第2の基本周波数の1つの周期で離隔されたピッチ・ベル位置で前記第2の音響信号をウィンドウ処理することによってピッチ・ベルを与える手順と、
    前記所要のピッチ・ベル位置の各々について前記与えられたピッチ・ベルからピッチ・ベルを無作為に選択する手順と、
    前記第1の信号を合成するために前記選択されたピッチ・ベルに対して重畳および追加動作を行う手順と
    を実行させるように適合される、コンピュータ読取可能なデジタル記憶媒体
  9. 所要の第1の基本周波数を有する第1の音響信号を第2の基本周波数を有する第2の音響信号に基づいて合成するためのコンピュータ・システム、特にテキスト音声合成システムであって、前記コンピュータ・システムが、
    前記第1の音響信号の時間領域において前記第1の基本周波数の1つの周期で離隔された所要のピッチ・ベル位置を決定するための手段と、
    前記第2の音響信号の時間領域において前記第2の基本周波数の1つの周期で離隔されたピッチ・ベル位置で前記第2の音響信号をウィンドウ処理することによってピッチ・ベルを与えるための手段と、
    前記所要のピッチ・ベル位置の各々について前記与えられたピッチ・ベルからピッチ・ベルを無作為に選択するための手段と、
    前記第1の信号を合成するために前記選択されたピッチ・ベルに対して重畳および追加動作を行うための手段と
    を備えるコンピュータ・システム。
  10. 元の信号の内に前記第2の音響信号を含有する間隔を示すデータを記憶するように適合された、音響分類データを記憶するための手段をさらに備える請求項9に記載のコンピュータ・システム。
JP2004537354A 2002-09-17 2003-08-05 定常音響信号のための合成方法 Expired - Lifetime JP4490818B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02078848 2002-09-17
PCT/IB2003/003381 WO2004027753A1 (en) 2002-09-17 2003-08-05 Method of synthesis for a steady sound signal

Publications (2)

Publication Number Publication Date
JP2005539262A JP2005539262A (ja) 2005-12-22
JP4490818B2 true JP4490818B2 (ja) 2010-06-30

Family

ID=32010977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004537354A Expired - Lifetime JP4490818B2 (ja) 2002-09-17 2003-08-05 定常音響信号のための合成方法

Country Status (11)

Country Link
US (1) US7558727B2 (ja)
EP (1) EP1543497B1 (ja)
JP (1) JP4490818B2 (ja)
KR (1) KR101016978B1 (ja)
CN (1) CN100343893C (ja)
AT (1) ATE329346T1 (ja)
AU (1) AU2003250410A1 (ja)
DE (1) DE60305944T2 (ja)
ES (1) ES2266908T3 (ja)
TW (1) TWI307876B (ja)
WO (1) WO2004027753A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100361198C (zh) * 2002-09-17 2008-01-09 皇家飞利浦电子股份有限公司 一种清音语音信号合成的方法
CN101796575B (zh) 2007-09-06 2012-07-18 富士通株式会社 声音信号生成方法以及声音信号生成装置
CN103295574B (zh) * 2012-03-02 2018-09-18 上海果壳电子有限公司 唱歌语音转换设备及其方法
EP2634769B1 (en) * 2012-03-02 2018-11-07 Yamaha Corporation Sound synthesizing apparatus and sound synthesizing method
CN103295577B (zh) * 2013-05-27 2015-09-02 深圳广晟信源技术有限公司 用于音频信号编码的分析窗切换方法和装置
CN107924678B (zh) 2015-09-16 2021-12-17 株式会社东芝 语音合成装置、语音合成方法及存储介质
CN108831437B (zh) * 2018-06-15 2020-09-01 百度在线网络技术(北京)有限公司 一种歌声生成方法、装置、终端和存储介质

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4344148A (en) * 1977-06-17 1982-08-10 Texas Instruments Incorporated System using digital filter for waveform or speech synthesis
FR2636163B1 (fr) 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
EP0527527B1 (en) 1991-08-09 1999-01-20 Koninklijke Philips Electronics N.V. Method and apparatus for manipulating pitch and duration of a physical audio signal
US5357048A (en) * 1992-10-08 1994-10-18 Sgroi John J MIDI sound designer with randomizer function
IT1266943B1 (it) 1994-09-29 1997-01-21 Cselt Centro Studi Lab Telecom Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda.
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JPH09198089A (ja) * 1996-01-19 1997-07-31 Matsushita Electric Ind Co Ltd 再生速度変換装置
US6170073B1 (en) 1996-03-29 2001-01-02 Nokia Mobile Phones (Uk) Limited Method and apparatus for error detection in digital communications
JP4040126B2 (ja) * 1996-09-20 2008-01-30 ソニー株式会社 音声復号化方法および装置
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
US6026356A (en) 1997-07-03 2000-02-15 Nortel Networks Corporation Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
US6233550B1 (en) 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3576840B2 (ja) * 1997-11-28 2004-10-13 松下電器産業株式会社 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
EP0976125B1 (en) * 1997-12-19 2004-03-24 Koninklijke Philips Electronics N.V. Removing periodicity from a lengthened audio signal
US6253171B1 (en) 1999-02-23 2001-06-26 Comsat Corporation Method of determining the voicing probability of speech signals
US6829577B1 (en) * 2000-11-03 2004-12-07 International Business Machines Corporation Generating non-stationary additive noise for addition to synthesized speech
JP2002244693A (ja) * 2001-02-16 2002-08-30 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法
US7251601B2 (en) * 2001-03-26 2007-07-31 Kabushiki Kaisha Toshiba Speech synthesis method and speech synthesizer
US20030182106A1 (en) * 2002-03-13 2003-09-25 Spectral Design Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal
CN1682281B (zh) * 2002-09-17 2010-05-26 皇家飞利浦电子股份有限公司 在语音合成中用于控制持续时间的方法
CN100361198C (zh) * 2002-09-17 2008-01-09 皇家飞利浦电子股份有限公司 一种清音语音信号合成的方法
DE60303688T2 (de) * 2002-09-17 2006-10-19 Koninklijke Philips Electronics N.V. Sprachsynthese durch verkettung von sprachsignalformen

Also Published As

Publication number Publication date
ES2266908T3 (es) 2007-03-01
WO2004027753A1 (en) 2004-04-01
CN100343893C (zh) 2007-10-17
DE60305944D1 (de) 2006-07-20
KR101016978B1 (ko) 2011-02-25
AU2003250410A1 (en) 2004-04-08
EP1543497A1 (en) 2005-06-22
JP2005539262A (ja) 2005-12-22
TWI307876B (en) 2009-03-21
ATE329346T1 (de) 2006-06-15
DE60305944T2 (de) 2007-02-01
CN1682278A (zh) 2005-10-12
US7558727B2 (en) 2009-07-07
EP1543497B1 (en) 2006-06-07
KR20050057372A (ko) 2005-06-16
TW200425059A (en) 2004-11-16
US20060178873A1 (en) 2006-08-10

Similar Documents

Publication Publication Date Title
US8326613B2 (en) Method of synthesizing of an unvoiced speech signal
JP4130190B2 (ja) 音声合成システム
JP6791258B2 (ja) 音声合成方法、音声合成装置およびプログラム
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
Macon et al. Concatenation-based midi-to-singing voice synthesis
JP2018077283A (ja) 音声合成方法
JP4490818B2 (ja) 定常音響信号のための合成方法
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP6834370B2 (ja) 音声合成方法
JP6683103B2 (ja) 音声合成方法
JP2005539267A (ja) 音声波形の連結を用いる音声合成
JPH09179576A (ja) 音声合成方法
JP3081300B2 (ja) 残差駆動型音声合成装置
JP6822075B2 (ja) 音声合成方法
JP3310217B2 (ja) 音声合成方法とその装置
JPH1097268A (ja) 音声合成装置
JPH06250685A (ja) 音声合成方式および規則合成装置
US20060074675A1 (en) Method of synthesizing creaky voice
KR20060027645A (ko) 감정정보 음색변환 장치 및 그 방법
JP2001092480A (ja) 音声合成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060803

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100402

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4490818

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140409

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term