JP4643914B2 - 音声合成方法および装置 - Google Patents

音声合成方法および装置 Download PDF

Info

Publication number
JP4643914B2
JP4643914B2 JP2004048933A JP2004048933A JP4643914B2 JP 4643914 B2 JP4643914 B2 JP 4643914B2 JP 2004048933 A JP2004048933 A JP 2004048933A JP 2004048933 A JP2004048933 A JP 2004048933A JP 4643914 B2 JP4643914 B2 JP 4643914B2
Authority
JP
Japan
Prior art keywords
unit
boundary
speech
pitch
right unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004048933A
Other languages
English (en)
Other versions
JP2004258660A (ja
Inventor
フェレンチ アッティラ
正 壽 金
在 原 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004258660A publication Critical patent/JP2004258660A/ja
Application granted granted Critical
Publication of JP4643914B2 publication Critical patent/JP4643914B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Machine Translation (AREA)

Description

本発明は音声合成(Text-to-Speech Synthesis:TTS)に係り、特に平滑化された音声ユニットの接続方法および装置に関する。
音声合成は、収集された音声データを加工したコーパスに基づいたデータベース(data base、以下“DB”または“音声DB”という)により行われる。最近、音声合成が適用されるシステム毎にそれぞれのDBの容量によって、システム仕様を満たす音声合成を行うことに関心が集められている。すなわち、大容量の音声合成システムであるほど保存されるDBの容量が大きくなるので、音声データを削除することなく音声合成を行うことが可能である。しかし、全ての音声合成システムにおいて大容量DBを適用できるわけではなく、携帯電話、個人携帯情報端末機(Personal Digital Assistant:PDA)等では、容量の少ないDBのみを適用することができる。したがって、携帯電話などにおいて、小容量のDBを用いて、良質の音声合成を行うことに注目が集まっている。
音声合成時に行われる隣接した二つの音声ユニット間の接続においては、音響的不整合を低減することが最大の関心事であり、これに関するいくつかの従来技術は次の通りである。
特許文献1「ウェイブフォーム・ブレンディング・テクニック・フォー・テクスト−トゥ−スピーチ・システム(Waveform Blending Technique for Text-to-Speech System)」は、最適接続点を決定し、隣接した二つのピッチ間に対してのみ行われる平滑化された接続について開示している。
特許文献2「メソッド・アンド・アパレイタス・フォー・スピーチ・シンセシス・ウィズアウト・プロソディ・モディフィケーション(Method and Apparatus for Speech Synthesis without Prosody Modification)」は、大容量のDBおよび制限された範囲での中小容量DBで使われる音声合成システムであって、平滑化過程なしに大容量の音声DBを利用した接続について開示している。
特許文献3「ファスト・ウェイブフォーム・シンクロニゼイション・フォー・コンカティネーション・アンド・タイムスケール・モディフィケーション・オブ・スピーチ(Fast Waveform Synchronization for Concatenation and Timescale Modification of Speech)」は、1ピッチ区間で行われる制限的な平滑化に係り、正確なピッチマーキングなしに接続される左右ユニットの境界部を調整する。
音声合成時に行われる隣接した二つの有声音音声ユニット間の接続においては、音響的不整合を低減して自然な音声合成を具現することと、音声合成を具現するハードウェアの資源によって効率的な音声合成を具現することとが問題になる。
米国特許第5,490,234号明細書 米国特許出願公開第2002/0099547号明細書 米国特許出願公開第2002/0143526号明細書
したがって、本発明が解決しようとする技術的課題は、音響的考慮に基づいて接続時の不整合を低減し、言語から独立的に接続し、かつ小さなDBサイズでも良好な音声合成を実現できる音声合成方法を提供することである。
また、本発明が解決しようとする他の技術的課題は、前記音声合成方法を行う音声合成装置を提供することである。
前記技術的課題を解決するために、データベース(DB)を用いて音声ユニットを接続する本発明による音声合成方法は、(a)接続される前記音声ユニットを決定して左側ユニットと右側ユニットとに区切る段階と、(b)前記左側ユニットと前記右側ユニットとの内挿される所定領域を可変的に決定する段階と、(c)前記左側ユニットと前記右側ユニットとの境界部に拡張部を連結する段階と、(d)前記拡張部に対して対応ユニットを基準にピッチマークを整列する段階と、(e)前記左側ユニットおよび前記右側ユニットを重畳する段階とを含む。
本発明において、(c)段階は、(c1)前記DB内に前記左側ユニットおよび/または前記右側ユニットに対して別途のセグメントデータが存在するか否かを判断する段階と、(c2)前記DB内に前記別途のセグメントデータが存在する場合に、前記データを用いて境界部を拡張する段階と、(c3)前記別途のセグメントデータが存在していない場合に、外挿法によって境界部を拡張する段階と、を含むことができる。
本発明は、前記(d)段階後に前記重畳される領域のピッチトラックを等比率的に内挿して前記(e)段階に進む段階をさらに含むことができる。
前記他の技術的課題を解決するために、データベース(DB)を用いて音声ユニットを接続する本発明による音声合成装置は、接続される前記音声ユニットを決定して左側ユニットと右側ユニットとに区切り、前記左側ユニットと前記右側ユニットとの内挿される所定領域を可変的に決定する接続領域決定部と、前記左側ユニットと前記右側ユニットとの境界部に拡張部を連結して出力する境界部拡張部と、前記拡張部に対して対応ユニットを基準にピッチマークを整列して出力するピッチマーク整列部と、ピッチマークが整列された前記左側ユニットおよび前記右側ユニットを重畳するユニット重畳部とを含む。
本発明による音声合成装置において、前記境界部拡張部は、前記DB内に前記左側ユニットおよび前記右側ユニットに対して別途のセグメントデータが存在するか否かを判断して、前記DB内に前記別途のセグメントデータが存在する場合に前記データを用いて境界部を拡張し、前記別途のセグメントデータが存在していない場合に外挿法によって境界部を拡張することができる。
本発明による音声合成装置は、前記ピッチマーク整列部からピッチマークを入力されて、前記重畳される領域のピッチトラックを等比率的に内挿して前記ユニット重畳部に出力するピッチトラック内挿部をさらに含むことができる。
本発明によるDBを用いた音声合成方法によれば、コーパスに基づいた小容量DBでも、別途のセグメントデータの有無によって、別途のセグメントデータを用いた内挿法または外挿されたデータの外挿法を選択的に利用して、平滑化された接続を行うことによって、接続境界部の音響的不整合を緩和でき、良好な品質の音声合成を行うことができる。本発明は、大容量および中容量DBを具備するシステムでも効果があるが、相対的に小容量DBを具備するシステムでさらに自然かつ満足な音声合成出力を提供する効果がある。
以下、本発明による音声合成方法および装置を添付した図面を参照して次のように詳細に説明する。本発明は音声のデータを加工して保存したデータベース(DB)を用いて音声ユニットを接続する音声合成方法および装置に関する。
接続される音声ユニットは無声音−無声音、無声音−有声音、有声音−無声音、有声音−有声音の隣接した対に分類できる。したがって、隣接した有声音−有声音の音声ユニット間の平滑化された接続は高品質の音声合成において必須的であり、本発明の音声合成方法および装置は、有声音−有声音の音声ユニットの接続に関する。あらゆる言語で有声音−有声音ユニットの遷移が現れるため、本発明は言語から独立的に適用できる音声合成方法および装置を提供する。
DBを用いた音声合成過程は、音声合成のためのDBを生成するオフライン処理過程と、入力された文字を生成されたDBを利用して音声に変換するオンライン処理過程とに分けられる。
音声合成のためのオフライン処理過程は、最適のコーパス選択段階と、コーパス録音段階と、音素および韻律ラベルを付ける段階と、コーパスを音声ユニットに分割する段階と、波形コーディング方法を用いてデータを圧縮する段階と、コーディングされた音声データを音声DBに保存する段階と、音声ユニットの音素−音響パラメータを抽出する段階と、前記パラメータが含まれたユニットDBを生成する段階と、データサイズを縮小するために音声およびユニットDBを削除する段階とを含む。
音声合成のためのオンライン処理過程は、文字入力段階と、文字前処理段階と、品詞(POS:Part of Speech)分析段階と、綴字音素変換段階と、韻律情報生成段階と、ユニットDBに保存された音素−音響パラメータに基づいて適した音声ユニットを選択する段階と、韻律重畳段階と、接続および平滑化段階と、音声出力段階とを含む。
図1は、本発明による内挿法に基づいた音素接続方法の望ましい一実施例を説明するためのフローチャートであって、接続される音声ユニット決定段階(S10段階)と、内挿領域決定段階(S12段階)と、境界部拡張段階(S14段階)と、ピッチマーク整列段階(S16段階)と、ピッチトラック内挿段階(S18段階)およびユニット重畳段階(S20段階)を含む。
S10段階では、接続される音声ユニットを決定して左側ユニットと右側ユニットに区切る。図2は音声合成が行われる音声ユニット、すなわち3個の有声音の音素が連続した区間での音声波形およびそのスペクトログラムを示し、3個の音素間境界部で波形不整合および音響スペクトログラムの断絶が確認できる。音声合成における平滑化された接続は、有声音の音声ユニットと有声音の音声ユニット間、すなわち、準安定領域で行われる。そして、接続される音声ユニットを決定して図3のように左側ユニットと右側ユニットとに区切る。
S12段階では、左側ユニットと右側ユニットとの内挿される所定領域の長さを可変的に決定する。音素間に実際に内挿法によって接続される内挿領域を該当音素の全体長さに対する割合、たとえば40%以下に決定する。図2を参照すれば、内挿領域として決定された音素長さの最大値である40%の位置が分かる。内挿領域は音声合成の性能仕様および接続される音声ユニット間の不整合によって可変的である。
S14段階は、左側ユニットと右側ユニットとの境界部に拡張部を連結する段階である。S14段階は別途のセグメントデータを連結して境界部を拡張することもあり、境界部の所定ピッチを反復させて境界部を拡張することもある。
図4は、S14段階の望ましい一実施例を説明するためのフローチャートであって、左側および/または右側ユニットの別途のセグメントデータが存在する場合とそうでない場合とに分けて境界部を拡張する(S140〜S144段階)。
S140段階では、DB内に左側ユニットおよび右側ユニットの別途のセグメント分節データが存在するか否かを判断する。別途のセグメントデータが存在する場合に内挿法によって平滑化された接続を行う(S142段階)。すなわち、境界部を拡張するに当たって別途のセグメントデータが存在する場合には、図5に示されたように、重畳される対応ユニット領域のピッチ数だけの別途のセグメントデータをユニット境界部に連結して境界部を拡張する。別途のセグメントデータが存在していない場合、仮想の別途のセグメントデータが生成される(S144段階)。すなわち、別途のセグメントデータが存在していない場合には図6および図7に示されたように、音素境界部の1ピッチを重畳される対応ユニット領域に含まれたピッチ数だけ反復させてユニット境界部に連結して境界部を拡張する。このような過程は、図5および図7に図示されたように、右側音声ユニットについても同一に行われる(S146、S148、S150段階)。
図1に戻って、S16段階は、左側ユニットと右側ユニットとを重畳させるための前処理段階であって、所定内挿領域を基準に左側ユニットおよび右側ユニットそれぞれの拡張部のピッチマークを同期化させて整列させる。図8を参照すれば、内挿領域を基準に左側ユニットの拡張部ピッチを狭める。また図9を参照すれば、内挿領域を基準に右側ユニットの拡張部ピッチを広げる。よって、内挿領域に属する左側ユニットのピッチトラックと右側ユニットのピッチトラックとが整合される。
S18段階は、本発明において代替的にさらに備えられる段階であって、ピッチトラックを内挿する段階である。S18段階は図10に図示されたように、左側ユニットの内挿領域のピッチトラックを等比率的に内挿し、右側ユニットの内挿領域のピッチトラックを等比率的に内挿する。図10を参照すれば、左側ユニットの内挿領域の左側端から右側端までピッチ間隔が均等な割合で狭まっていることが分かり、また、右側ユニットの内挿領域の左側端から右側端までピッチ間隔が均等な割合で狭まっていることが分かる。さらに、内挿領域で左側および右側ユニットのピッチはそれぞれ同期性を維持し、内挿領域で左側および右側ユニットのピッチマークはそれぞれ整列状態を維持する。
S20段階では、左側ユニットと右側ユニットとを重畳する。ここで、重畳はフェード・イン/アウトによって行われる。図11は、左側ユニットと右側ユニットとの重畳される領域がフェード・イン/フェード・アウトされた波形を示す。図12は、図11に図示された左側および右側ユニットが重畳された波形を示す。図13は、平滑化過程なしに音素を接続した波形であって、接続境界部で急な波形の変化があったことが分かる。この場合、荒くて断絶された音声で現れる。これに比べて、図12のユニット間接続境界部を調べれば急激な波形の変化なしにスムーズに接続されたことが分かる。
図14は、DBを用いて音声ユニットを接続する本発明による音声合成装置を説明するためのブロック図であって、接続領域決定部10と境界部拡張部20とピッチマーク整列部30とユニット重畳部50を含む。
本発明による音声合成装置はDBを用いて音声ユニットを接続する。接続領域決定部10は、図1に図示されたS10段階およびS12段階を行うために、接続される音声ユニットを決定して左側ユニットと右側ユニットとに区切り、左側ユニットと右側ユニットとの内挿される所定領域を可変的に決定して出力する。ここで、接続される音声ユニットは有声音の音素単位である。
境界部拡張部20は、図1に図示されたS14段階を行うために、左側ユニットと右側ユニットとの境界部に拡張部を連結して出力する。ここで境界部拡張部20は、コーパス内に左側ユニットおよび右側ユニットに対して別途のセグメントデータが存在するか否かを判断し、別途のセグメントデータが存在する場合に前記データを用いて境界部を拡張し、別途のセグメントデータが存在していない場合に外挿法によって境界部を拡張できる。
ピッチマーク整列部30は、図1に図示されたS16段階を行うために、拡張部に対して対応ユニットを基準にピッチマークを整列して出力する。
ユニット重畳部50は、図1に図示されたS20段階を行うために、ピッチマークが整列された左側ユニットおよび右側ユニットを重畳して出力する。ここでユニット重畳部50は、左側ユニットをフェード・アウトして右側ユニットをフェード・インした後、左側ユニットと右側ユニットとを重畳できる。
本発明による音声合成装置は、図1に図示されたS18段階を行うために、ピッチマーク整列部30からピッチトラックおよび波形データを入力されて、重畳される領域のピッチトラックを等比率的に内挿してユニット重畳部50に出力するピッチトラック内挿部40を選択的にさらに含むことができる。
本発明により平滑化された接続により実現された音声と単純接続により実現された音声とを比較するために、18人のユーザーに3回の設問調査、総54回を施行した結果は次の表1の通りである。表1は単純接続、別途のセグメントデータを利用した内挿法による平滑化接続、および外挿されたデータの外挿法を用いた平滑化接続音声をそれぞれ聞かせてその選好度を1〜5点に評価するようにした設問調査結果である。
前記した音素間の音響的な不整合を低減する方法および装置は、言語から独立的な実現に適している。
本発明は上記に説明した図面に表現されるものに限定されるものではない。特に、本発明は音声合成において有声音と有声音間の平滑化された接続を中心に記載されたが、音声合成以外の分野で準安定の1次元信号を平滑化して接続しようとするときにも本発明が適用できることは明らかである。
本発明は上記に説明した図面に表現されたものに限定されるものではない。当業者ならば、特許請求の範囲に記載された本発明の範囲および目的内で置換、消去、併合、および段階の再配置などによって前述した実施例に対して多くの変形が可能である。
本発明は前記の音声合成に利用され、特に小容量のDBでも良好な音声合成を具現できる音声合成を具現するために利用される。
本発明によるDBを用いた音声合成方法の望ましい一実施例を示すフローチャートである。 音声合成が行われねばならない音声ユニットが連続した区間での音声波形およびそのスペクトログラムを示す図である。 図1のS10段階で、接続が行われるために区切られた左側ユニットと右側ユニットとを示す図である。 図1のS14段階の望ましい一実施例を説明するフローチャートである。 図1のS14段階で、図3の2つの隣接した左側ユニットと右側ユニットとの境界部を別途のセグメントデータを用いて拡張することを説明する図である。 図1のS14段階で、外挿法によって左側ユニットの境界部を拡張する波形を説明する図である。 図1のS14段階で、外挿法によって右側ユニットの境界部を拡張する波形を説明する図である。 図1のS16段階で、所定内挿領域を基準に左側ユニットの拡張部ピッチを圧縮してピッチマークを整列することを説明する図である。 図1のS16段階で、左側ユニットの内挿領域を基準に右側ユニットの拡張部ピッチを伸張してピッチマークを整列することを説明する図である。 図1のS18段階で、重畳される左側ユニットおよび右側ユニットの内挿領域のピッチトラックを等比率的に内挿することを説明する図である。 左側ユニットおよび右側ユニットの重畳される領域がフェード・イン/フェード・アウトされた波形を示す図である。 図11に図示された左側および右側ユニットが重畳された波形を示す図である。 平滑化過程なしに音素を接続した波形を示す図である。 DBを用いて音声ユニットを接続する本発明による音声合成装置を示すブロック図である。
符号の説明
10 接続領域決定部
20 境界拡張部
30 ピッチマーク整列部
40 ピッチトラック内挿部
50 ユニット重畳部

Claims (8)

  1. データベースを用いて音声ユニットを接続する音声合成方法において、
    (a)接続される前記音声ユニットを決定して左側ユニットと右側ユニットとに区切る段階と、
    (b)前記左側ユニットと前記右側ユニットとの内挿される所定領域を可変的に決定する段階と、
    (c)前記左側ユニットの境界部及び前記右側ユニットの境界部の夫々に拡張部を連結する段階と、
    (d)前記内挿される所定領域を基準に、前記左側ユニット及び前記右側ユニット夫々の拡張部のピッチマークを同期化させる段階と、
    (e)前記左側ユニットおよび前記右側ユニットを重畳する段階と、を含み、
    前記(c)段階は、
    (c1)前記データベース内に前記左側ユニットと前記右側ユニットとの前記境界部に連結されるセグメントデータが存在するか否かを判断する段階と、
    (c2)前記データベース内に前記セグメントデータが存在する場合に、該セグメントデータを用いて境界部を拡張する段階と、
    (c3)前記セグメントデータが存在していない場合に、外挿法によって境界部を拡張する段階と、を含むことを特徴とする音声合成方法。
  2. 前記接続される音声ユニットは有声音の音素単位であることを特徴とする請求項1に記載の音声合成方法。
  3. 前記(e)段階は、
    前記左側ユニットをフェード・アウトして前記右側ユニットをフェード・インした後、前記左側ユニットと前記右側ユニットとを重畳することを特徴とする請求項1に記載の音声合成方法。
  4. (f)前記(d)段階後に重畳される前記所定領域のピッチトラックを等比率的に内挿して前記(e)段階に進む段階をさらに含むことを特徴とする請求項1に記載の音声合成方法。
  5. データベースを用いて音声ユニットを接続する音声合成装置において、
    接続される前記音声ユニットを決定して左側ユニットと右側ユニットとに区切り、前記左側ユニットと前記右側ユニットとの内挿される所定領域を可変的に決定する接続領域決定部と、
    前記左側ユニットの境界部及び前記右側ユニットの境界部の夫々に拡張部を連結して出力する境界部拡張部と、
    記内挿される所定領域を基準に、前記左側ユニット及び前記右側ユニット夫々の拡張部のピッチマークを同期化させ出力するピッチマーク整列部と、
    ピッチマークが整列された前記左側ユニットおよび前記右側ユニットを重畳するユニット重畳部と、を含み、
    前記境界部拡張部は、
    前記データベース内に前記左側ユニットと前記右側ユニットとの前記境界部に連結されるセグメントデータが存在するか否かを判断して、前記データベース内に前記セグメントデータが存在する場合に該セグメントデータを用いて境界部を拡張し、前記セグメントデータが存在していない場合に外挿法によって境界部を拡張する、ことを特徴とする音声合成装置。
  6. 前記接続される音声ユニットは有声音の音素単位であることを特徴とする請求項5に記載の音声合成装置。
  7. 前記ユニット重畳部は、
    前記左側ユニットをフェード・アウトして前記右側ユニットをフェード・インした後、前記左側ユニットと前記右側ユニットとを重畳することを特徴とする請求項5に記載の音声合成装置。
  8. 前記ピッチマーク整列部からピッチマークを入力され、重畳される前記所定領域のピッチトラックを等比率的に内挿して前記ユニット重畳部に出力するピッチトラック内挿部をさらに含むことを特徴とする請求項5に記載の音声合成装置。
JP2004048933A 2003-02-25 2004-02-25 音声合成方法および装置 Expired - Fee Related JP4643914B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0011786A KR100486734B1 (ko) 2003-02-25 2003-02-25 음성 합성 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2004258660A JP2004258660A (ja) 2004-09-16
JP4643914B2 true JP4643914B2 (ja) 2011-03-02

Family

ID=36314088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004048933A Expired - Fee Related JP4643914B2 (ja) 2003-02-25 2004-02-25 音声合成方法および装置

Country Status (5)

Country Link
US (1) US7369995B2 (ja)
EP (1) EP1453036B1 (ja)
JP (1) JP4643914B2 (ja)
KR (1) KR100486734B1 (ja)
DE (1) DE602004000656T2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4963345B2 (ja) * 2004-09-16 2012-06-27 株式会社国際電気通信基礎技術研究所 音声合成方法及び音声合成プログラム
FR2884031A1 (fr) * 2005-03-30 2006-10-06 France Telecom Concatenation de signaux
US20070106513A1 (en) * 2005-11-10 2007-05-10 Boillot Marc A Method for facilitating text to speech synthesis using a differential vocoder
US7953600B2 (en) * 2007-04-24 2011-05-31 Novaspeech Llc System and method for hybrid speech synthesis
KR20110006004A (ko) * 2009-07-13 2011-01-20 삼성전자주식회사 결합인식단위 최적화 장치 및 그 방법
KR101650739B1 (ko) * 2015-07-21 2016-08-24 주식회사 디오텍 음성 합성 방법, 서버 및 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램
CN118098236B (zh) * 2024-04-23 2024-08-06 深圳市友杰智新科技有限公司 确定语音识别窗口左右边界的方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10257596A (ja) * 1997-03-14 1998-09-25 Nippon Hoso Kyokai <Nhk> 話速変換方法およびその装置
JPH10307586A (ja) * 1997-05-02 1998-11-17 Yamaha Corp 楽音発生装置および方法
JPH11503535A (ja) * 1995-04-12 1999-03-26 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 波形言語合成
JPH11307586A (ja) * 1998-04-23 1999-11-05 Matsushita Electric Works Ltd 半導体装置とその製造方法、実装方法および用途
JP2000122666A (ja) * 1997-09-30 2000-04-28 Yamaha Corp 波形生成装置及び方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
AU3154893A (en) * 1992-12-21 1994-07-19 Stackpole Limited Method of producing bearings
US5642466A (en) * 1993-01-21 1997-06-24 Apple Computer, Inc. Intonation adjustment in text-to-speech systems
US5490234A (en) 1993-01-21 1996-02-06 Apple Computer, Inc. Waveform blending technique for text-to-speech system
US5592585A (en) * 1995-01-26 1997-01-07 Lernout & Hauspie Speech Products N.C. Method for electronically generating a spoken message
US5978764A (en) * 1995-03-07 1999-11-02 British Telecommunications Public Limited Company Speech synthesis
US6175821B1 (en) * 1997-07-31 2001-01-16 British Telecommunications Public Limited Company Generation of voice messages
JP4183346B2 (ja) * 1999-09-13 2008-11-19 株式会社神戸製鋼所 粉末冶金用混合粉末ならびに鉄系焼結体およびその製造方法
US6514307B2 (en) * 2000-08-31 2003-02-04 Kawasaki Steel Corporation Iron-based sintered powder metal body, manufacturing method thereof and manufacturing method of iron-based sintered component with high strength and high density
AU2001290882A1 (en) 2000-09-15 2002-03-26 Lernout And Hauspie Speech Products N.V. Fast waveform synchronization for concatenation and time-scale modification of speech
US6978239B2 (en) 2000-12-04 2005-12-20 Microsoft Corporation Method and apparatus for speech synthesis without prosody modification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11503535A (ja) * 1995-04-12 1999-03-26 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 波形言語合成
JPH10257596A (ja) * 1997-03-14 1998-09-25 Nippon Hoso Kyokai <Nhk> 話速変換方法およびその装置
JPH10307586A (ja) * 1997-05-02 1998-11-17 Yamaha Corp 楽音発生装置および方法
JP2000122666A (ja) * 1997-09-30 2000-04-28 Yamaha Corp 波形生成装置及び方法
JPH11307586A (ja) * 1998-04-23 1999-11-05 Matsushita Electric Works Ltd 半導体装置とその製造方法、実装方法および用途

Also Published As

Publication number Publication date
DE602004000656D1 (de) 2006-05-24
KR100486734B1 (ko) 2005-05-03
EP1453036B1 (en) 2006-04-19
US20040167780A1 (en) 2004-08-26
KR20040076440A (ko) 2004-09-01
DE602004000656T2 (de) 2007-04-26
US7369995B2 (en) 2008-05-06
JP2004258660A (ja) 2004-09-16
EP1453036A1 (en) 2004-09-01

Similar Documents

Publication Publication Date Title
JPS62160495A (ja) 音声合成装置
JP4112613B2 (ja) 波形言語合成
JPH031200A (ja) 規則型音声合成装置
US20090157397A1 (en) Voice Rule-Synthesizer and Compressed Voice-Element Data Generator for the same
JP4643914B2 (ja) 音声合成方法および装置
JP2009109805A (ja) 音声処理装置及びその方法
JP2001282278A (ja) 音声情報処理装置及びその方法と記憶媒体
JP2623586B2 (ja) 音声合成におけるピッチ制御方式
JP2003108178A (ja) 音声合成装置及び音声合成用素片作成装置
JP3576800B2 (ja) 音声分析方法、及びプログラム記録媒体
JP4274852B2 (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
JPH07319497A (ja) 音声合成装置
JP4454780B2 (ja) 音声情報処理装置とその方法と記憶媒体
JP5387410B2 (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP2005321520A (ja) 音声合成装置及びそのプログラム
JP4414864B2 (ja) 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体
JP2577372B2 (ja) 音声合成装置および方法
JP5089473B2 (ja) 音声合成装置及び音声合成方法
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP3426957B2 (ja) 映像中への音声録音支援表示方法及び装置及びこの方法を記録した記録媒体
JP3561654B2 (ja) 音声合成方法
JPS63208099A (ja) 音声合成装置
JP3292218B2 (ja) 音声メッセージ作成装置
JP3283657B2 (ja) 音声規則合成装置
JP2000099094A (ja) 時系列信号処理装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061107

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees