JP4206230B2 - 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム - Google Patents

音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム Download PDF

Info

Publication number
JP4206230B2
JP4206230B2 JP2002191819A JP2002191819A JP4206230B2 JP 4206230 B2 JP4206230 B2 JP 4206230B2 JP 2002191819 A JP2002191819 A JP 2002191819A JP 2002191819 A JP2002191819 A JP 2002191819A JP 4206230 B2 JP4206230 B2 JP 4206230B2
Authority
JP
Japan
Prior art keywords
speech
data
speech synthesis
synthesis
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002191819A
Other languages
English (en)
Other versions
JP2004037605A (ja
Inventor
寛之 世木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2002191819A priority Critical patent/JP4206230B2/ja
Publication of JP2004037605A publication Critical patent/JP2004037605A/ja
Application granted granted Critical
Publication of JP4206230B2 publication Critical patent/JP4206230B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声合成に使用される音声合成用データの削減に関する。
【0002】
【従来の技術】
従来、音声合成の方法(装置)には、例えば、次に示すものがある。
(1)音声合成方法(特開平2−47700号公報)
この公報で公開されている音声合成装置には、単位音声(音素または単語)の発話時間が記録された音声データからなる音声データベースが備えられており、この音声合成装置は、当該装置に入力された文章を単位音声に分解した後、分解した単位音声毎に音声データベースの探索を実行し、得られた音声合成用データに対し、音韻および音律の補正を実行して音声合成を行うものである。
【0003】
(2)自然発話音声波形信号接続型音声合成装置(特開平10−49193号公報)
この公報で公開されている音声合成装置には、音素の発話時間が記録された音声データベースが備えられており、この音声合成装置は、当該装置に入力された文章を音素列に分解した後、分解した音素列の音素単位で音声データベースの探索を実行し音声合成を行うものである。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の音声合成装置では、どのような単位音声(音素または単語)を保持している音声データベースなのかが明示されていなかった。また、いずれの音声合成装置も音声データベースのデータ量が多くなると、音声合成の候補となる音声合成用データ数が増大し、探索時間が膨大となり、処理速度が低下してしまうという問題がある。
【0005】
そこで、本発明の目的は前記した従来の技術が有する課題を解消し、音声データベースが保持している単位音声を明確にすると共に、音声合成する際の処理速度を向上させるために音声データベースを小容量に保持することができる音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラムを提供することにある。
【0006】
【課題を解決するための手段】
前記した目的を達成するため、以下に示す構成とした。
請求項1記載の音声合成用データ削減方法は、音声合成を行う際に使用される、音素および単語の発話時間が記録された音声データベース中における使用頻度の低い、音素および単語からなる音声合成用データを削減する音声合成用データ削減方法であって、前記音声データベースが、当該音声データベース中に含まれる音声合成用データからなる文章の集合として構成されており、音声合成を行う際に使用した音声合成用データの使用頻度を記録する使用頻度記録ステップと、予め設定した使用頻度閾値よりも使用頻度が低い音声合成用データを削減する音声合成用データ削減ステップと、を含み、前記使用頻度記録ステップにおいて、前記音声データベース中の文章をそれ以外の全ての文章に含まれる音声合成用データに基づいて音声合成を実行した際に、使用した音声合成用データの使用頻度を記録することを特徴とする。
【0007】
この方法によれば、使用頻度記録ステップにおいて、音声合成装置等で音声合成が行われる度に、当該装置等に内在している音声データベース中の音声合成用データの使用頻度が記録される。そして、音声合成用データ削減ステップにおいて、予め設定した使用頻度閾値よりも使用頻度の低い音声合成用データが削減される。なお、合成音声用データは、音素および単語からなるもので、音声合成する際の最小単位である。また、予め設定した使用頻度閾値は、任意に設定可能な数値であり、例えば、この使用頻度閾値を音声合成装置の使用回数に基づいて想定すると、「使用回数50回 使用頻度閾値1」、つまり、50回音声合成を実行しても一度も使用しない音声合成用データを削減の対象に設定することができる。また、この音声合成用データ削減方法は、音声合成装置における音声合成する方法を問わず、当該装置等に少なくとも音声データベースが存在していれば適用可能なものである。なお、音声データベースには音声合成用データからなる複数の文章が記憶されており、これらの文章それぞれについて、使用頻度記録ステップにて、音声データベース中に記憶されているそれ以外の文章に含まれる音声合成用データを使用して音声合成した場合の音声合成用データの使用頻度が記録され、音声合成用データ削減ステップにて、予め設定した使用頻度閾値より使用頻度が低い音声合成用データが削減される。
【0008】
請求項2記載の音声合成用データ削減装置は、音声合成を行う際に使用される、音素および単語の発話時間が記録された音声データベース中における使用頻度の低い、音素および単語からなる音声合成用データを削減する音声合成用データ削減装置であって、前記音声データベースが、当該音声データベース中に含まれる音声合成用データからなる文章の集合として構成されており、音声合成を行う際に使用した音声合成用データの使用頻度を記録する使用頻度記録手段と、予め設定した使用頻度閾値よりも使用頻度が低い音声合成用データを削減する音声合成用データ削減手段と、を備え、前記使用頻度記録手段において、前記音声データベース中の文章をそれ以外の全ての文章に含まれる音声合成用データに基づいて音声合成を実行した際に、使用した音声合成用データの使用頻度を記録することを特徴とする。
【0009】
かかる構成によれば、使用頻度記録手段で、音声合成装置等で音声合成が行われる度に、当該装置等に内在している音声データベース中の音声合成用データの使用頻度が記録される。そして、音声合成用データ削減手段で、予め設定した使用頻度閾値よりも使用頻度の低い音声合成用データが削減される。なお、音声データベースには音声合成用データからなる複数の文章が記憶されており、これらの文章それぞれについて、使用頻度記録手段で、音声データベース中に記憶されているそれ以外の文章に含まれる音声合成用データを使用して音声合成した場合の音声合成用データの使用頻度が記録され、音声合成用データ削減手段で、予め設定した使用頻度閾値より使用頻度が低い音声合成用データが削減される。
【0010】
請求項3記載の音声合成用データ削減プログラムは、音声合成を行う際に使用される、音素および単語の発話時間が記録された音声データベース中における使用頻度の低い、音素および単語からなる音声合成用データを削減するために、コンピュータを、音声合成を行う際に使用した音声合成用データの使用頻度を記録する使用頻度記録手段、予め設定した使用頻度閾値よりも使用頻度が低い音声合成用データを削減する音声合成用データ削減手段、として機能させ、前記音声データベースが、当該音声データベース中に含まれる音声合成用データからなる文章の集合として構成されており、前記使用頻度記録手段において、前記音声データベース中の文章をそれ以外の全ての文章に含まれる音声合成用データに基づいて音声合成を実行した際に、使用した音声合成用データの使用頻度を記録することを特徴とする。
【0011】
かかる構成によれば、使用頻度記録手段で、音声合成装置等で音声合成が行われる度に、当該装置等に内在している音声データベース中の音声合成用データの使用頻度が記録される。そして、音声合成用データ削減手段で、予め設定した使用頻度閾値よりも使用頻度の低い音声合成用データが削減される。なお、音声データベースには音声合成用データからなる複数の文章が記憶されており、これらの文章それぞれについて、使用頻度記録手段で、音声データベース中に記憶されているそれ以外の文章に含まれる音声合成用データを使用して音声合成した場合の音声合成用データの使用頻度が記録され、音声合成用データ削減手段で、予め設定した使用頻度閾値より使用頻度が低い音声合成用データが削減される。
【0018】
【発明の実施の形態】
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。
(音声合成用データ削減装置の構成)
図1は、音声合成用データ削減システムのブロック図である。この図1に示すように、音声合成用データ削減システムは、音声合成用データ削減装置1と音声合成装置2とからなり、音声合成用データ削減装置1は、入出力部3と、合成用データ使用頻度記録部5と、合成用データ削減部7と、記録部9とを備えている。
【0019】
音声合成装置2は、音声データベース4を備えており、入力されたテキストデータから音声データ列(音声合成結果)を出力するものである。この音声合成装置2の音声データベース4で保持されている単位音声(音声合成用データ)は、「単語」を基盤としており、この実施の形態では、複数の単語からなる「文章」がデータベースの構成単位となっている。そして、各文章には「文番号」が付されており、各単語の発話時間が記憶されている。なお、当該音声合成装置2の他の構成について、例えば、音声合成の仕方については、本発明と直接関係がないので、図示及び説明を省略する。
【0020】
音声合成用データ削減装置1は、音声合成装置2において音声合成される度に利用される音声データベース4のデータ量、すなわち、音声合成用データ(単語)を削減するためのもので、この音声合成用データ削減装置1によって音声データベース4のデータ量を減少させることで、音声合成する際の音声合成候補(単語の候補)の探索時間を大幅に短縮させることができるものである。
【0021】
入出力部3は、音声合成装置2と情報(後記する合成用データ使用頻度情報、合成用データ削減情報)を送受信するためのものである。なお、この入出力部3は、インターネット等の通信回線網(図示を省略)を介して情報の送受信が行えるように構成されている。
【0022】
合成用データ使用頻度記録部5は、音声合成装置2の音声データベース4で音声合成する度に使用された単位音声(音声合成用データ)の使用頻度に関する情報である合成用データ使用頻度情報を記録部9に記録するものである。つまり、この合成用データ使用頻度記録部5は、音声合成装置2で音声合成された場合に、合成用データ使用頻度情報を音声合成装置2から取得するものであるといえる。
【0023】
この合成用データ使用頻度記録部5では、例えば、音声合成装置2において音声データベース削減用のテストセット(頻繁に音声合成されるテキストデータ)を用意しておき、このテストセットの文章(テキストデータ)が入力された際の音声合成した結果(合成用データ使用頻度情報)が記録される。この実施の形態では、音声合成装置2の音声データベース4の構成単位が文章であるので、この合成用データ使用頻度情報は、どの文章のどの単語が使用されたかが記録されている。
【0024】
また、この合成用データ使用頻度記録部5は、音声合成装置2の音声データベース4中の音声合成用データが文章単位で記録されている場合には、一つの文章をその文章以外の他の文章で音声合成した場合の音声合成用データの使用頻度に関する情報である合成用データ使用頻度情報が記録部9に記録される。この合成用データ使用頻度記録部5が請求項に記載した音声合成用データ使用頻度記録手段に相当するものである。
【0025】
合成用データ削減部7は、合成用データ使用頻度記録部5で記録部9に記録された合成用データ使用頻度情報を使用頻度閾値(合計使用頻度閾値)と比較して、この使用頻度閾値(合計使用頻度閾値)よりも小さい場合に、この合成用データ使用頻度情報に含まれている音声合成用データを削減するための情報である合成用データ削減情報を、入出力部3を介して音声合成装置2に出力するものである。この合成用データ削減情報を受信した音声合成装置2では、音声データベース4中の該当する音声合成用データが削減される。この合成用データ削減部7が請求項に記載した音声合成用データ削減手段に相当するものである。
【0026】
なお、使用頻度閾値は、予め任意に設定可能な数値であり、例えば、この使用頻度閾値を音声合成装置の使用回数に基づいて想定すると、「使用回数50 使用頻度閾値1」、つまり、50回音声合成を実行しても一度も使用しない音声合成用データを削減の対象に設定することができる。
【0027】
また、合計使用頻度閾値は、音声合成装置2の音声データベース4中の合成用データが文章単位で記録されている場合に、一つの文章をその文章以外の他の文章に含まれる音声合成用データで音声合成した場合の音声合成用データの使用頻度に関する情報である合成用データ使用頻度情報と比較するためのものである。
【0028】
記録部9は、一般的なハードディスク等によって構成されており、合成用データ使用頻度情報と、使用頻度閾値(合計使用頻度閾値)とを記録するものである。なお、合成用データ使用頻度情報は、この記録部9において、各音声合成用データに設定されているデータ使用頻度に数値を加算していく形式(1回使用されれば+1)で更新される。
【0029】
この音声合成用データ削減装置1によれば、合成用データ使用頻度記録部5で、音声合成装置2で音声合成が行われる度に、当該装置2に内在している音声データベース4中の音声合成用データの使用頻度が記録される。そして、合成用データ削減部7で、予め設定した使用頻度閾値よりも使用頻度の低い音声合成用データが削減される。このため、音声合成装置2の音声データベース4で保持されている単位音声(音声合成用データ)が単語である場合に、音声合成する際に利用される音声データベース4中で、使用頻度の低い音声合成用データ(単語)を適宜削除することで、音声データベース4をコンパクトに(小容量に)維持することができ、音声合成装置2で音声合成する際の処理速度を向上させることができる。
【0030】
音声合成装置2の音声データベース4には音声合成用データ(単語)からなる複数の文章が記憶されており、これらの文章それぞれについて、合成用データ使用頻度記録部5で、音声データベース4中に記憶されているそれ以外の文章を使用して音声合成した場合の音声合成用データの使用頻度が記録され、合成用データ削減部7で、予め設定した合計使用頻度閾値より使用頻度が低い音声合成用データが削減される。このため、音声データベース4の一つの文章中の音声合成用データ(単語)が他の文章を使用して音声合成することで使用頻度が記録され、使用頻度が低い場合には削除されるので、自動的に(自己学習的に)音声データベース4のデータ量を小容量に維持することができ、音声合成装置2で音声合成する際の処理速度を向上させることができる。
【0031】
(音声合成用データ削減装置の動作)
次に、図2に示すフローチャートを参照して音声合成用データ削減装置1の動作を説明する(適宜図1参照)。
まず、入出力部3で合成用データ使用頻度情報が入力される(S1)。この音声合成用データ削減装置1の動作の説明では、一定期間、音声合成装置2において音声合成が実行されて、音声合成装置2で保持され合成用データ使用頻度情報が定期的に音声合成用データ削減装置1に入力されるものとしている。そして、入出力部3から合成用データ使用頻度記録部5に合成用データ使用頻度情報が出力されると、合成用データ使用頻度記録部5で、合成用データ使用頻度情報が記録部9に記録される(S2)。
【0032】
そして、合成用データ削減部7で、合成用データ使用頻度情報と使用頻度閾値とが比較され、合成用データ使用頻度情報(図2中、使用頻度)が使用頻度閾値未満であるかどうかが判断される(S3)。合成用データ使用頻度情報が使用頻度閾値未満であると判断された場合(S3、Yes)には、入出力部3に合成用データ削減情報が出力され、入出力部3から音声合成装置2に出力される(S4)。その後、音声合成用データ削減装置1の動作が終了される。合成用データ使用頻度情報が使用頻度閾値未満であると判断されない場合(S3、No)は、そのまま音声合成用データ削減装置1の動作が終了される。
【0033】
(音声合成用データ削減装置の具体的な音声合成用データ削減例)
次に、具体的に、音声合成用データ削減システムで、音声合成用データの削減を実行(運用)した場合について説明する。
実際の運用例では、音声合成装置2に、テキストデータの文章として「音声データベース削減用テストセット」を入力し、音声合成を行う。この「音声データベース削減用テストセット」は、報道番組等で頻繁に音声合成されるテキストデータの中から無作為抽出した数十種類の文章(テキストデータ)である。つまり、この「音声データベース削減用テストセット」が入力された際に使用される音声データベース4中の音声合成用データ(単語)は、通常の日本語を音声合成する際にも、頻繁に使用される可能性が高いものである。
【0034】
まず、音声合成装置2で「音声データベース削減用テストセット」が入力されると、音声合成が実行され、音声合成用データ削減装置1の合成用データ使用頻度記録部5で、音声合成装置2の音声データベース4中のどの文章のどの単語が使用されたかが、合成用データ使用頻度情報によって得られ、記録部9に記録される。
【0035】
例えば、「音声データベース削減用テストセット」として、「〈文頭〉次のニュースです〈文末〉」が入力されたときに、
「〈文頭〉次の」・・・文番号50の0ms〜1000ms
「ニュース」・・・文番号8の2125ms〜2840ms
「です〈文末〉」・・・文番号32の1500ms〜2000ms
が使用されたとする(合成用データ使用頻度情報に含まれたデータとする)。
【0036】
この時に、合成用データ使用頻度記録部5では、“文番号50の「〈文頭〉」、「次」”、“文番号8の「ニュース」”、“文番号32の「です〈文末〉」”のデータ使用頻度(記録部9)にそれぞれ1をプラスする。以降、次のテストセット(文章)が入力される毎に、合成用データ使用頻度記録部5では、使用された単語のデータ使用頻度に+1していく。全てのテストセットが終了したらデータ使用頻度が低いもの、すなわち、使用頻度閾値に満たないものが合成用データ削減部7によって削減される。
【0037】
この具体的な例によれば、「音声データベース削減用テストセット」によって生成される合成用データ使用頻度情報に基づいて、音声合成用データ削減装置1で音声合成用データが削減された音声データベース4は、音声データベースのバリエーション、すなわち、合成される日本語のバリエーションの幅が狭まるが、データ量がコンパクト(小容量)に抑えられると共に、音声合成する際の処理速度を向上させることができる。
【0038】
以上、一実施形態に基づいて本発明を説明したが、本発明はこれに限定されるものではない。
例えば、音声合成用データ削減装置1の各構成の処理を一つずつの工程と捉えた音声合成用データ削減方法とみなすことや、各構成の処理を汎用的なコンピュータ言語で記述した音声合成用データ削減プログラムとみなすことができる。これらの場合、音声合成用データ削減装置1と同様の効果を得ることができる。
【0039】
【発明の効果】
請求項1、2、3に記載の発明によれば、音声合成装置等で音声合成が行われる度に、当該装置等に内在している音声データベース中の音声合成用データの使用頻度が記録され、予め設定した使用頻度閾値よりも使用頻度の低い音声合成用データが削減される。このため、音声合成装置等の音声データベースで保持されている単位音声が単語である場合に、音声合成する際に利用される音声データベース中で、使用頻度の低い音声合成用データを適宜削除することで、音声データベースを小容量に維持することができ、音声合成装置で音声合成する際の処理速度を向上させることができる。そして、音声データベースには音声合成用データ(単語)からなる複数の文章が記憶されている場合、これらの文章それぞれについて、音声データベース中に記憶されているそれ以外の文章を使用して音声合成した場合の音声合成用データの使用頻度が記録され、予め設定した合計使用頻度閾値より使用頻度が低い音声合成用データが削減される。このため、音声データベースの一つの文章中の音声合成用データが他の文章を使用して音声合成することで使用頻度が記録され、使用頻度が低い場合には削除されるので、自動的に(自己学習的に)音声データベースのデータ量を小容量に維持することができ、音声合成装置で音声合成する際の処理速度を向上させることができる。
【図面の簡単な説明】
【図1】本発明による一実施の形態である音声合成用データ削減システムを図示したブロック図である。
【図2】図1に示した音声合成用データ削減装置の動作を説明したフローチャートである。
【符号の説明】
1 音声合成用データ削減装置
2 音声合成装置
3 入出力部
4 音声データベース
5 合成用データ使用頻度記録部
7 合成用データ削減部
9 記録部

Claims (3)

  1. 音声合成を行う際に使用される、音素および単語の発話時間が記録された音声データベース中における使用頻度の低い、音素および単語からなる音声合成用データを削減する音声合成用データ削減方法であって、
    前記音声データベースが、当該音声データベース中に含まれる音声合成用データからなる文章の集合として構成されており、
    音声合成を行う際に使用した音声合成用データの使用頻度を記録する使用頻度記録ステップと、
    予め設定した使用頻度閾値よりも使用頻度が低い音声合成用データを削減する音声合成用データ削減ステップと、を含み、
    前記使用頻度記録ステップにおいて、前記音声データベース中の文章をそれ以外の全ての文章に含まれる音声合成用データに基づいて音声合成を実行した際に、使用した音声合成用データの使用頻度を記録することを特徴とする音声合成用データ削減方法。
  2. 音声合成を行う際に使用される、音素および単語の発話時間が記録された音声データベース中における使用頻度の低い、音素および単語からなる音声合成用データを削減する音声合成用データ削減装置であって、
    前記音声データベースが、当該音声データベース中に含まれる音声合成用データからなる文章の集合として構成されており、
    音声合成を行う際に使用した音声合成用データの使用頻度を記録する使用頻度記録手段と、
    予め設定した使用頻度閾値よりも使用頻度が低い音声合成用データを削減する音声合成用データ削減手段と、を備え、
    前記使用頻度記録手段において、前記音声データベース中の文章をそれ以外の全ての文章に含まれる音声合成用データに基づいて音声合成を実行した際に、使用した音声合成用データの使用頻度を記録することを特徴とする音声合成用データ削減装置。
  3. 音声合成を行う際に使用される、音素および単語の発話時間が記録された音声データベース中における使用頻度の低い、音素および単語からなる音声合成用データを削減するために、コンピュータを、
    音声合成を行う際に使用した音声合成用データの使用頻度を記録する使用頻度記録手段、
    予め設定した使用頻度閾値よりも使用頻度が低い音声合成用データを削減する音声合成用データ削減手段、として機能させ、
    前記音声データベースが、当該音声データベース中に含まれる音声合成用データからなる文章の集合として構成されており、
    前記使用頻度記録手段において、前記音声データベース中の文章をそれ以外の全ての文章に含まれる音声合成用データに基づいて音声合成を実行した際に、使用した音声合成用データの使用頻度を記録することを特徴とする音声合成用データ削減プログラム。
JP2002191819A 2002-07-01 2002-07-01 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム Expired - Fee Related JP4206230B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002191819A JP4206230B2 (ja) 2002-07-01 2002-07-01 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002191819A JP4206230B2 (ja) 2002-07-01 2002-07-01 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム

Publications (2)

Publication Number Publication Date
JP2004037605A JP2004037605A (ja) 2004-02-05
JP4206230B2 true JP4206230B2 (ja) 2009-01-07

Family

ID=31701277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002191819A Expired - Fee Related JP4206230B2 (ja) 2002-07-01 2002-07-01 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム

Country Status (1)

Country Link
JP (1) JP4206230B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5747471B2 (ja) * 2010-10-20 2015-07-15 三菱電機株式会社 音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体

Also Published As

Publication number Publication date
JP2004037605A (ja) 2004-02-05

Similar Documents

Publication Publication Date Title
US6172675B1 (en) Indirect manipulation of data using temporally related data, with particular application to manipulation of audio or audiovisual data
US6366882B1 (en) Apparatus for converting speech to text
JP5459214B2 (ja) 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体
US7236931B2 (en) Systems and methods for automatic acoustic speaker adaptation in computer-assisted transcription systems
US7487093B2 (en) Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
US6308151B1 (en) Method and system using a speech recognition system to dictate a body of text in response to an available body of text
JP4105841B2 (ja) 音声認識方法、音声認識装置、コンピュータ・システムおよび記憶媒体
US20030191645A1 (en) Statistical pronunciation model for text to speech
US7480612B2 (en) Word predicting method, voice recognition method, and voice recognition apparatus and program using the same methods
US7257534B2 (en) Speech synthesis system for naturally reading incomplete sentences
US7292976B1 (en) Active learning process for spoken dialog systems
US20020143535A1 (en) Method of providing concise forms of natural commands
US20090254349A1 (en) Speech synthesizer
WO1998025216A9 (en) Indirect manipulation of data using temporally related data, with particular application to manipulation of audio or audiovisual data
CN101305362A (zh) 语音索引删减
EP2008189A2 (en) Automatic language model update
CN110390928B (zh) 一种自动拓增语料的语音合成模型训练方法和系统
US20080162559A1 (en) Asynchronous communications regarding the subject matter of a media file stored on a handheld recording device
US20050149888A1 (en) Method and apparatus for minimizing weighted networks with link and node labels
JP5180800B2 (ja) 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム
EP1317749A1 (en) Method of and system for improving accuracy in a speech recognition system
JP2006507530A (ja) 音声認識装置及び方法
JP4206230B2 (ja) 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム
US6963838B1 (en) Adaptive hosted text to speech processing
EP1632933A1 (en) Device, method, and program for selecting voice data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080924

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141024

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees