JP5172682B2 - 音素のnグラムを使用した単語および名前の生成 - Google Patents

音素のnグラムを使用した単語および名前の生成 Download PDF

Info

Publication number
JP5172682B2
JP5172682B2 JP2008534735A JP2008534735A JP5172682B2 JP 5172682 B2 JP5172682 B2 JP 5172682B2 JP 2008534735 A JP2008534735 A JP 2008534735A JP 2008534735 A JP2008534735 A JP 2008534735A JP 5172682 B2 JP5172682 B2 JP 5172682B2
Authority
JP
Japan
Prior art keywords
phoneme
phonemes
pair
sequence
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008534735A
Other languages
English (en)
Other versions
JP2009511959A (ja
Inventor
マキュラー,パトリック
Original Assignee
ソニー オンライン エンタテインメント エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー オンライン エンタテインメント エルエルシー filed Critical ソニー オンライン エンタテインメント エルエルシー
Publication of JP2009511959A publication Critical patent/JP2009511959A/ja
Application granted granted Critical
Publication of JP5172682B2 publication Critical patent/JP5172682B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Description

本出願は、2005年5月10日出願の「System for Generating and Selecting Names」という名称の同時係属の米国特許出願第11/102,519号に関する。この米国特許出願の開示は、参照により本明細書に組み込まれる。
本発明は、単語および/または名前の生成に関し、より具体的には、こうした単語および/または名前を生成するための音素(phoneme)のNグラムの使用に関する。
単語および名前は、しばしば、文字または音節などの言語単位を組み合わせる方法を使用して生成される。しかしながら、これらの方法は、通常、時間のかかる言語単位の手動選択、およびさらに多くの時間がかかるこれら単位の出現頻度の設定を含む、手動のコーディングおよびチューニングを必要とする。「この単位は単語の初めにのみ発生する」などのユニットへの注釈付けに、さらに時間が費やされる可能性がある。
前述の方法で生成された単語はしばしば品質的には許容できるが、生成された結果は時に不満足なものであり、発声不可能および異質な響きである傾向がある。これは、複雑な書記素(grapheme)対音素のマッピングを使用する、英語および他の言語に特に当てはまる。
本発明の実施により、音素のNグラムを使用して単語および名前を生成するための方法および装置を提供する。
一実施では、単語および/または名前を生成するための方法が開示される。この方法は、所与の言語に基づいて少なくとも1つのコーパスを受け取るステップと、このコーパスを使用して、各出現頻度が音素のそれぞれのペアに対応し、ペア内の第1の音素に続くペア内の第2の音素の頻度を示すように、複数の音素のNグラムおよび複数の出現頻度を生成するステップと、複数の音素のNグラムおよび複数の出現頻度を使用して、音素ツリーを生成するステップと、音素のシーケンスを生成するために出現頻度を使用して音素ツリー上でランダムウォーク(random walk)を実行するステップと、音素のシーケンスを書記素のシーケンスにマッピングするステップとを含む。
他の実施では、単語および/または名前を生成するための装置が開示される。この装置は、所与の言語に基づいて少なくとも1つのコーパスを受け取るための手段と、このコーパスを使用して、各出現頻度が音素のそれぞれのペアに対応し、ペア内の第1の音素に続くペア内の第2の音素の頻度を示すように、複数の音素のNグラムおよび複数の出現頻度を生成するための第1の手段と、複数の音素のNグラムおよび複数の出現頻度を使用して、音素ツリーを生成するための第2の手段と、音素のシーケンスを生成するために出現頻度を使用して音素ツリー上でランダムウォークを実行するための手段と、音素のシーケンスを書記素のシーケンスにマッピングするための手段とを備える。
他の実施では、単語および/または名前を生成するための他の装置が開示される。この装置は、所与の言語に基づいて少なくとも1つのコーパスを受け取るための入力/出力インターフェースと、各出現頻度が音素のそれぞれのペアに対応し、ペア内の第1の音素に続くペア内の第2の音素の頻度を示すように、単語のシーケンスおよびディクショナリを使用して複数の音素のNグラムおよび複数の出現頻度を生成するため、ならびに、複数の音素のNグラムおよび複数の出現頻度を使用して、音素ツリーを生成するために、コーパスを単語のシーケンスに分解するように構成された、プロセッサと、ディクショナリ、音素ツリー、および音素対書記素ルックアップテーブルを格納するためのストレージと、を備え、プロセッサは、音素のシーケンスを生成するために出現頻度を使用して音素ツリー上でランダムウォークを実行するために音素ツリーを取り出し、音素対書記素ルックアップテーブルを使用して、音素のシーケンスを書記素のシーケンスにマッピングする。
他の実施では、有形のストレージメディアに格納された、単語および/または名前を生成するためのコンピュータプログラムが開示される。このプログラムは、所与の言語に基づいて少なくとも1つのコーパスを受け取る動作と、このコーパスを使用して、各出現頻度が音素のそれぞれのペアに対応し、ペア内の第1の音素に続くペア内の第2の音素の頻度を示すように、複数の音素のNグラムおよび複数の出現頻度を生成する動作と、複数の音素のNグラムおよび複数の出現頻度を使用して、音素ツリーを生成する動作と、音素のシーケンスを生成するために出現頻度を使用して音素ツリー上でランダムウォークを実行する動作と、音素のシーケンスを書記素のシーケンスにマッピングする動作とを、コンピュータに実行させる、実行可能命令を備える。
本発明の実施形態は、Nグラムの音素を使用して単語および名前を生成するための方法および装置を提供する。
本開示で使用される場合、以下の用語は次のように定義される。
コーパス - 単語生成プログラム(generator)への入力として使用されるテキスト本文。たとえば、シェイクスピアの作品集を英語用のコーパスとして使用することができる。
音素 - 「ch」などの、会話で発せられる音。たとえば、「s」の音の音素は、文字「s」と区別するために/s/と書き表される。
書記素 - 音のグラフ表現。たとえば、文字「k」の書記素は音/k/を表す。英語では、書記素と音素との間に、必ずしも1対1のマッピングは存在しない。たとえば、音/k/は、「k」、「c」、「ck」、「q」などと書き表される可能性がある。したがって、単一の書記素はいくつかの異なる音素を表すことができる。
Nグラム - 単語、音節、音素、文などの、言語単位のシーケンス。バイグラムは2のシーケンス長さを有し(たとえば「s」-「t」)、トライグラムは3のシーケンス長さを有する(たとえば「a」-「b」-「r」)。
音表徴素(phonestheme) - 強い意味論的クラス関連付けを伴う音素。
ソノリティ(sonority) - 本質的に音素の音の大きさの相対的な尺度である、音素の特性。
音節 - シーケンス内の音素の編成。日本語にはおよそ140のシラブルがあるが、英語には15,000以上ある。
音節に分ける(syllabify) - 単語を、その音素から音節へと構成すること。
典型的な単語生成プログラムは、文字、文字の出現頻度、注釈、長さ範囲、および認められない文字の組み合わせを、入力として受け取る場合がある。単語生成プログラムは、受け取った文字を、文字の組み合わせが所望の長さに達するまで、注釈および頻度に従って組み合わせる。次に、この組み合わせを、認められない文字の組み合わせリストに照らしてチェックし、たとえば発音不可能または卑俗な組み合わせを除去する。この文字の組み合わせプロセスが、一般に(たとえば、レストランのメニューから食べ物を注文することと同様の)「メニュー」方式と呼ばれる。
純粋な「メニュー」方式では、単語生成プログラムは、言語単位(たとえば、文字、音節、ならびに/あるいは、文字および音節の組み合わせ)の列またはテーブルから連続してランダムに選択する。図1のテーブルを参照すると、それぞれの列から1つの言語単位が選択される。たとえば、列Aから文字「C」が選択され、列Bから文字「u」が選択され、列Cから文字「p」が選択されて、単語「Cup」が形成される。図1のテーブルおよびメニュー方式を使用して、「Dan」、「Fefi」、および「Nen」などの言語ユニットの他の組み合わせを形成することができる。
修正されたメニュー方式では、単語生成プログラムは、列に重み付けすること、および/または、どの列が選択されるかを変更することができる。したがって、図2のテーブルを参照すると、列Bは、文字に加えて文字の出現頻度も含むことができる。この場合、単語生成プログラムは、列Bから50%の確率で「a」を、20%の確率で「e」を、20%の確率で「o」を、さらに10%の確率で「u」を選択する。加えて、注釈および他の規則も考慮に入れることができる。
単語を生成するための代替の方式には、所与のコーパス (すなわち、単語が生成される言語を適正に代表する、単語生成プログラムへの入力として使用されるテキスト本文)から文字に関する頻度テーブルを生成すること、文字を検出すること、および、所与の文字が他の文字の後に続く頻度を決定することが、含まれる。たとえばコーパスが、その最も単純な形で文字のシーケンス「ABABAC」を含むと想定すると、単語生成プログラムはこのシーケンスを、各文字(すなわち、A、B、またはC)に対して1つの、テーブルのセットに解析する。したがって各文字は、各文字に続く文字をそれらの出現頻度にマッピングする、関連付けられたテーブルを含む。
図3は、前述のコーパス内で検出された3つの文字、A、B、およびCに対応する3つのテーブルを示す。文字Aは、それに続く2つの異なる文字(すなわちBおよびC)を有するため、Aのテーブルは2つの文字エントリBおよびC、ならびに対応する頻度数を含む。所与のコーパスでは、文字Bは、3回のうち2回、文字Aの後に出現し、文字Cは、3回のうち1回、文字Aの後に出現する。したがって、文字シーケンスA-Bの出現頻度数は66%であり、文字シーケンスA-Cの出現頻度数は34%である。BおよびCのテーブルも同様に生成することができる。
前述の技法は、一般に「Nグラム」技法と呼ばれる。図3は、これらのテーブルが2文字シーケンス用に生成されることから、「バイグラム」の例を示す。3文字シーケンスを示すテーブルは、「トライグラム」技法に関係する、という具合である。代替の実施では、このタイプのテーブルを全単語レベルで使用し、音声認識において、認識プログラムへのヒントとして、どの単語の後にどの単語が続く確率が高いかを予測することができる。次に、これらのテーブルは、前述の単語生成プログラムに関する入力の「メニュー」として採用される。
図4は、音素のNグラムを使用した単語および名前の生成の一実施を示す流れ図400である。流れ図400は、402で、単語生成プログラムへの入力としてコーパスが最初に受け取られたことを示す。前述のように、コーパスは、単語が生成される言語を適正に代表するテキスト本文を含むはずである。たとえば英語の単語を生成する場合、集められたシェイクスピアの作品を、コーパスとして使用することができる。いくつかの実施では、複数のコーパスを単語生成プログラムへの入力として使用することができる。入力コーパスとして使用するために異なるソースを選択することによって、生成される単語のタイプを調整および制御することができる。
404で、単語および名前を生成するために使用される音素のインベントリを提供する、受け取ったコーパスを使用して、音素ツリーが生成される。一実施では、音素ツリーの生成は完全に自動的であり、生成の際に、ユーザの編集または修正、あるいは他の手動による補助は必要としない。他の実施では、ユーザが所望のレベルのユーザのカスタマイゼーションを実行できるようにするために、様々なレベルのユーザ対話が提供される。
音素ツリーは、第1に、複数のNグラム頻度テーブルまたは音素の頻度ツリーを生成することによって、生成される。したがって、音素ツリー構築プロセスは、コーパスを単語シーケンスに分解すること、ならびに、ディクショナリおよび/または書記素対音素(grapheme-to-phoneme)分解技法を使用して、単語を音素に分解することを含む。音素後音素(phoneme-following-phoneme)パターンが、Nグラムとして頻度テーブルまたは頻度ツリーにエンコードされる。頻度テーブルまたは頻度ツリーは、所与の音素に続くすべての音素、および、所与の音素に続く音素の確率数を示す対応する出現頻度数を含む。したがって、異なる入力コーパスを使用することで異なる音素ツリーを生成する。
たとえば、テキスト「phoo basr blar foo」がコーパス全体を表すと想定すると、コーパスは単語のシーケンス[phoo, basr, blar, foo]に分解され、これがさらに[[/f/, /U/][/b/, /a/, /s/, /r/][/b/, /l/, /a/, /r/][/f/, /U/]]に分解される。一実施では、次にこの音素を使用して、図5に示されるような頻度テーブルのセットが構築される。
図5を参照すると、前述のコーパス内の5つの非終端音素に対応する5つの頻度テーブルが示される。音素/f/は、それに続く音素が1つ(すなわち/U/)しかないため、/f/のテーブルは1つのエントリならびに対応する頻度数「100%」を含む。音素/b/は、それに続く音素が2つ(すなわち/l/および/a/)あるため、/b/のテーブルは2つのエントリならびに対応する頻度数を含む。音素/l/は、音素/b/の2回の出現のうちの1回で/b/の後に続き、音素/a/は音素/b/の2回の出現のうちの1回で/b/の後に続く。したがって、音素シーケンス/b/-/l/の出現頻度数は50%であり、音素シーケンス/b/-/a/の出現頻度数も50%である。音素/a/、/s/、および/r/のテーブルも同様に生成することができる。音素/U/および/r/は終端音素であるため、これらの音素のテーブルは存在しない。
代替実施では、頻度テーブルの代わりに頻度ツリーが構築される。たとえば、図6Aは音素/f/の頻度ツリーを示し、図6Bは音素/b/の頻度ツリーを示し、図6Cは音素/a/の頻度ツリーを示し、図6Dは音素/s/の頻度ツリーを示し、図6Eは音素/l/の頻度ツリーを示す。頻度ツリーでは、分岐が所与の音素の後に続く音素の出現頻度数を含む。したがって、たとえば図6Cでは、音素/a/の頻度ツリーが、音素/r/の分岐で出現頻度数50%を示し、音素/s/の分岐で出現頻度数50%を示す。
最終的に、音素対音素接続における音素ツリーは頻度テーブルまたは頻度ツリーを組み合わせることによって生成される。図7は、所与のコーパスから構築された音素のインベントリから生成される音素ツリーの一実施を示す。図7の示された実施では、音素ツリーは、ルートから生じる2つのノードとして2つの開始音素/f/および/b/を含む。音素ツリーは、リーフとして2つの終端音素/U/および/r/も含む。
再び図4を参照すると、406で、音素のシーケンスを生成するために、生成された音素ツリー上でランダムウォークが実行される。ランダムウォークを実行するために、音素ツリーの各ノードで、パス内をたどるように分岐を選択するための意思決定が実行される。各分岐の確率数がこの選択に重み付けするため、確率数の高い分岐ほどより頻繁に選択されることになる。したがって、各ノードでの意思決定は、音素の後に続く所定の確率が仕組まれた「仕掛け」さいころを投げるのと等価である。
410では、意思決定ボックスが、生成された音素シーケンスが「受け入れ可能」シーケンスであるかどうかを決定する。一例では、「受け入れ可能」シーケンスとは、発音可能であり、所与の言語の話し手にとって妥当な、音素シーケンスである。他の例では、「受け入れ可能」シーケンスとは、同時係属の米国特許出願第11/102,519号に記載された音表徴素密度などの、ある標準に合致する音素シーケンスである。音素のシーケンスが「受け入れ可能」であると判別された場合、このシーケンスは、412で、単語および名前を生成するために保持される。そうではなく、音素のシーケンスが「受け入れ不能」と判別された場合、414でそのシーケンスはドロップされる。
次に音素のシーケンス(すなわち音の列)は、416で、単語および/または名前を生成するためのルックアップテーブルまたは他の同様の技法を使用して、書記素のシーケンス(すなわち書体)に書き換え/マッピングされる。したがって、前述のテキスト「phoo basr blar foo」のコーパスを使用して、結果として生じる可能性のある音素シーケンスには、[/f/ /U/]、[/b/ /a/ /s/]、および[/b/ /l/ /a/ /s/]が含まれるが、[/r/ /U/ /f/]および[/b/ /a/ /s/ /a/]は含まれない。
420で、十分な単語および/または名前が生成されていないことが判別されると、406で、他の音素シーケンス、ならびに、続いてさらに多くの単語および/または名前を生成するために、ランダムウォークプロセスが繰り返される。ボックス406、410、412、414は、十分な単語および/または名前が生成されるまで繰り返される。そうではなく、十分な単語および/または名前が生成されている場合、プロセスは終了する。
加えて、単語および/または名前を、「悪い」単語のリストまたはまとまりに照らしてチェックすることができる。リストに照らしたチェックは、入力コーパスを「音節に分ける」こと、およびリストから共通の特徴をチェックすることによって、自動化することができる。一例では、「悪い」単語には、卑俗または発音できない単語が含まれる。他の例では、「悪い」まとまりには、心地よくないかまたは発音できないことがわかっている音素のシーケンスが含まれる。
実際のところ、シェイクスピア全集などの大量のテキスト本文からは大量のテーブルが生成されるため、多くの音素の後に多くの他の音素が続き、出現頻度は1%未満になる可能性がある。したがって、Nグラムテーブルは一般に、言語には存在するが「特徴的」または典型的でない音素ペアなどの、低頻度のNグラムが大幅に削減されるように、切り詰められる。
音素のNグラムを使用して単語および/または名前を生成するための代替実施形態には、所与の言語において音韻論的に有効な、無意味なテキストの生成が含まれる。一例では、この無意味なテキストを音声認識プログラムのトレーニングに使用することができる。
音素のNグラムを使用して単語および/または名前を生成するための他の代替実施形態には、音などの、さらに低い言語単位レベルで音素ベースの単語生成プログラムを操作することが含まれる。しかしながら、信頼できる単語対音のディクショナリまたは変換技法を見つけることは困難である。結果として、生成される単語および/または名前は、非常に「粗野」な、ますます普通でない音声をつなぎ合わせてかなり異質な響きの単語および/または名前を形成する可能性がある。しかしながら、場合によっては、これが望ましいこともある。
単語および/または名前を生成するために音素のNグラムを使用することの利点の1つは、音素は結果として生じる単語が音のシーケンスとして表されるため、文字よりもはるかに適応性があることである。したがってこの利点により、単語の音または一部の強制的な包含または排除、同音異義語のチェック、などを含む、他の利点が提供される。
単語および/または名前を生成するために音素のNグラムを使用することの他の利点は、発音チェックがセットアップしやすいことである。音素のシーケンスを使用することは、生成された単語および/または名前の音声を使用可能にすることを含むため、さらに数ステップを使用して、発音チェックのためのプロセスが構成される。
たとえば、一実施では、発音チェックプロセスに、ソノリティ技法を使用して単語を「音節に分ける」こと、および、音節が共通の普遍的特色を含む「正当な」音節であることを保証するために各音節をチェックすることが含まれる。他の実施では、発音チェックプロセスに、ソノリティ技法を使用して単語を「音節に分ける」こと、および、単語の「普通でない」部分を大幅に削減する言語特有のフィルタを使用することが含まれる。たとえば英語では、/ng/で始まる単語は消去される。
音素ベース(すなわちテキストの音声ベース)方式の他の利点には、(1)出力内の他の音声の後に続くそれぞれの音声は実際に入力コーパス内の音声の後に続いていたものであるため、発音できない名前の出現がより少ないこと、(2)命名エンジン(音表徴素、音声記号体系など)によって音声による操作が実施できること、(3)音声の列をすべてまとめて発音できるかどうかが予測しやすいこと、(4)音声フィルタはスペル変化の錯覚を回避できるため、卑俗な言葉のフィルタがより効果的であること、(5)正当かつ頻繁な開始および終了の音声をコーパスから推測および記録することができるため、最初-中間-最後の単位に注釈をつける必要が少なくなること、(6)代替言語に適切であり、これに基づいた、単語/名前を生成することがより容易であること、ならびに、(7)単語/名前が音声としてコード化されるため、単語/名前のスペリング(すなわち書記素表現)が、習慣、正字法、書体、地域、文化、または任意の他の手段に応じて変更可能であること、が含まれる。
図8Aは、コンピュータシステム800およびユーザ802を示す図である。ユーザ802は、単語および/または名前を生成するためにコンピュータシステム800を使用することができる。一例では、コンピュータシステムは単語生成アプリケーションプログラム(「単語生成プログラム」)を格納および実行する。単語生成プログラムは、前述のように、音素のNグラムを使用して単語および名前を生成するように設計される。
図8Bは、単語生成プログラムを含む、図8Aのコンピュータシステム800の一実施を示すブロック図である。コンピュータシステム800は、コントローラ810、メモリ820、ストレージ830、メディアデバイス840、ユーザインターフェース850、入力/出力(I/O)インターフェース860、およびネットワークインターフェース870を含む。これらの構成要素は、共通バス880によって相互接続される。別の方法として、中央にコントローラを備えた星のパターンなどの、異なる接続構成を使用することができる。
コントローラ810はプログラム可能プロセッサであり、コンピュータシステム800およびその構成要素の動作を制御する。コントローラ810は、メモリ820または埋め込み型コントローラメモリ(図示せず)から命令をロードし、これらの命令を実行してシステムを制御する。その実行に際して、コントローラ810は、単語生成プログラム815をソフトウェアシステムとして提供する。別の方法として、このサービスを、コントローラ810またはコンピュータシステム800内の別々の構成要素として実施することができる。単語生成プログラム815は、入力コーパスおよびストレージ830から取り出されたディクショナリを使用して、単語および名前を生成する。
メモリ820は、コンピュータシステム800の他の構成要素によって使用されるためのデータを一時的に格納する。一実施では、メモリ820はRAMとして実施される。他の実施では、メモリ820は、フラッシュメモリおよび/またはROMなどの長期または永続メモリも含む。
ストレージ830は、音素のインベントリおよび生成された単語を格納するためなどの、コンピュータシステム800の他の構成要素による使用のために、一時的または長期間、データを格納する。一実施では、ストレージ830はハードディスクドライブである。ストレージ830は、言語ディクショナリ(たとえば、音素の可用性および配置に関する、文字、キャラクタ、または記号に関する)、または制約ディクショナリ(たとえば、文化的タブーに基づいてフィルタリングするための文化、国、および言語の制約、または、商標に関して名前をフィルタリングするための法的制約)、その他、などの、単語生成プログラム815による使用のための情報を格納する。ストレージ830は、頻度テーブル、頻度ツリー、および音素ツリーなどの、将来使用するために単語生成プログラムによって生成されたデータおよびデータ構造も格納する。
メディアデバイス840は、取り外し可能メディアを受け取り、挿入されたメディアとの間でのデータの読み取りおよび/または書き込みを行う。一実施では、メディアデバイス840は光ディスクドライブである。
ユーザインターフェース850は、コンピュータシステム800のユーザからのユーザ入力を受け入れるため、および、ユーザに情報を提示するための、構成要素を含む。一実施では、ユーザインターフェース850はキーボード、マウス、オーディオスピーカ、およびディスプレイを含む。コントローラ810は、ユーザからの入力を使用して、コンピュータシステム800の動作を調整する。
I/Oインターフェース860は、外部ストレージまたは補助デバイス(たとえばプリンタまたはPDA)などの対応するI/Oデバイスに接続するための、1つまたは複数のI/Oポートを含む。一実施では、I/Oインターフェース860のポートは、USBポート、PCMCIAポート、シリアルポート、および/またはパラレルポートなどの、ポートを含む。他の実施では、I/Oインターフェース860は、外部デバイスと無線で通信するための無線インターフェースを含む。
ネットワークインターフェース870は、イーサネット(登録商標)接続をサポートするRJ-45または「Wi-Fi」インターフェース(802.11)などの、有線および/または無線のネットワーク接続を含む。
コンピュータシステム800は、コンピュータシステムに特有の追加のハードウェアおよびソフトウェア(たとえば、電源、冷却、オペレーティングシステム)を含むが、話を簡潔にするために、これらの構成要素は図8Bには特に示されていない。他の実施では、コンピュータシステムの異なる構成(たとえば、異なるバスまたはストレージ構成、あるいはマルチプロセッサ構成)を使用することができる。
本発明の様々な実施は、電子ハードウェア、コンピュータソフトウェア、またはこれらの技術の組み合わせで実現される。実施の中には、プログラム可能プロセッサまたはコンピュータによって実行される、1つまたは複数のコンピュータプログラムが含まれる。一般に、各コンピュータは、1つまたは複数のプロセッサ、1つまたは複数のデータストレージ構成要素(たとえば、揮発性または不揮発性メモリモジュール、ならびに、ハードおよびフロッピィディスクドライブ、CD-ROMドライブ、ならびに磁気テープドライブなどの、永続性の光および磁気ストレージデバイス)、1つまたは複数の入力デバイス(たとえばマウスおよびキーボード)、および、1つまたは複数の出力デバイス(たとえば、ディスプレイコンソールおよびプリンタ)を含む。
コンピュータプログラムは、通常は永続ストレージメディアに格納され、その後、実行時にメモリにコピーされる、実行可能コードを含む。プロセッサは、定められた順序でメモリからプログラム命令を取り出すことによって、コードを実行する。プログラムコードを実行する場合、コンピュータは、入力および/またはストレージデバイスからデータを受け取り、そのデータに関する操作を実行した後、結果として生じるデータを出力および/またはストレージデバイスに送達する。
以上、本発明の様々な例示的実施について説明してきた。しかしながら、当業者であれば、本発明の範囲内で追加の実施も可能であることを理解されよう。たとえば、前述の説明は、単一の入力コーパスを使用した単語生成プログラムの実施に焦点を当てているが、複数のコーパスを入力として同時に使用することも可能である。さらに入力コーパスは、「混合」効果を発生させる様々な言語とすることも可能であり、新しい空想上の言語を作成するために有用な場合がある。したがって本発明は、前述のそれらの実施に限定されることはない。
列内に配置構成された選択可能な言語単位のテーブルを示す図である。 言語単位の出現頻度を含む中間列を備える、列内に配置構成された選択可能な言語単位の他のテーブルを示す図である。 コーパス「ABABAC」において検出される3つの文字A、B、およびCに対応する3つのテーブルを示す図である。 音素のNグラムを使用した単語および名前の生成の一実施を示す流れ図である。 コーパス「phoo basr blar foo」における5つの非終端音素に対応する5つの頻度テーブルを示す図である。 図6Aから6Eは、図5に示された5つの頻度テーブルに対応する5つの頻度ツリーを示す図である。 所与のコーパスから構築された音素のインベントリから生成される、音素ツリーの一実施を示す図である。 図8Aはコンピュータシステムおよびユーザを示す図であり、図8Bは、単語生成プログラムを含む図8Aのコンピュータシステムの一実施を示すブロック図である。

Claims (33)

  1. コンピュータにより実行される単語および/または名前を生成するための方法であって、
    所与の言語に基づいて、コンピュータ読取可能な媒体にデジタル的に記録された少なくとも1つのコーパスを受け取るステップと、
    前記少なくとも1つのコーパスを使用して、複数の音素のNグラムおよび複数の出現頻度を生成するステップと、
    ここで、前記複数の音素のNグラムを生成するステップは、前記少なくとも1つのコーパスを単語のシーケンスに分解することによって複数の音素のNグラム頻度テーブルを生成するステップと、前記単語のシーケンスを複数の音素のNグラムに分解するステップを含み、
    ここで、前記複数の出現頻度に含まれる各出現頻度は、前記複数の音素のNグラムに含まれる第1及び第2音素のペアのそれぞれに対応するとともに、前記ペア内の第1の音素に続く前記ペア内の第2の音素の頻度を示し、
    前記複数の音素のNグラムおよび前記複数の出現頻度を使用して、各リーフに対し、そのリーフと同一の音素を先頭の音素とするNグラムを接続し、ノードが出現頻度を表す音素ツリーを生成するステップと、
    前記音素ツリーをデジタル記録装置に記録し、
    前記出現頻度を使用して前記音素ツリー上で、音素ツリーの各ノードで、確率の高い分岐先ほどより頻繁に選択されるようにランダムウォークを実行して音素のシーケンスを生成するステップと、
    前記音素のシーケンスを書記素のシーケンスにマッピングして単語および/または名前を生成するステップと、
    を含む、単語および/または名前を生成するための方法。
  2. 前記音素ツリーは、その頂部のルートと、前記ルートから生じる複数のノードとで構成され、前記複数のノードは、接続されたノードのペアが、前記ペア内の第1のノードから前記ペア内の第2のノードへのパスによって接続されるように、接続され、
    ノードのペア内の第1のノードは対応する音素のペア内の第1の音素を表し、前記ノードのペア内の第2のノードは前記音素のペア内の第2の音素を表し、さらに前記ノードのペアのノードを接続するパスは出現頻度を表すように、接続されたノードのペアが、対応する出現頻度を有する音素のペアに対応する、
    請求項1に記載の方法。
  3. 前記音素ツリー上でランダムウォークを実行する前記ステップは、
    前記パスに関する前記出現頻度に基づいて前記ノードからのパスをノードでランダムに選択することによって、前記音素ツリーを介して接続されたパスのセットを選択するステップを含む、請求項2に記載の方法。
  4. 複数の音素のNグラムを生成する前記ステップは、複数の音素のNグラム頻度ツリーを生成するステップを含む、請求項1に記載の方法。
  5. 音素ツリーを生成するステップは、
    前記複数の音素のNグラム頻度ツリーを音素対音素接続で組み合わせるステップを含む、請求項4に記載の方法。
  6. 前記単語のシーケンスを分解する前記ステップは、
    ディクショナリを使用して、前記単語のシーケンスを前記音素のシーケンスに分解するステップを含む、請求項1に記載の方法。
  7. 前記生成された音素のシーケンスが前記所与の言語の話し手にとって発音可能であるかどうかを判別するステップをさらに含む、請求項1に記載の方法。
  8. 前記音素のシーケンスを書記素のシーケンスにマッピングする前記ステップは、
    ルックアップテーブルを使用して、前記音素のシーケンスを前記書記素のシーケンスに書き換えるステップを含む、請求項1に記載の方法。
  9. 前記書記素のシーケンスから単語および/または名前を形成するステップをさらに含む、請求項1に記載の方法。
  10. 前記少なくとも1つのコーパスを使用して複数の音素のNグラムおよび複数の出現頻度を生成する前記ステップ、ならびに音素ツリーを生成する前記ステップは、ユーザの編集、修正、または他の手動による補助を必要とせずに、自動的であるように構成される、請求項1に記載の方法。
  11. 前記少なくとも1つのコーパスを使用して複数の音素のNグラムおよび複数の出現頻度を生成する前記ステップ、ならびに音素ツリーを生成する前記ステップは、異なるコーパスを使用することで異なる音素ツリーを生成するように、固有の音素ツリーを生成するように構成される、請求項1に記載の方法。
  12. 単語および/または名前を生成するための装置であって、
    所与の言語に基づいて少なくとも1つのコーパスを受け取るための手段と、
    前記少なくとも1つのコーパスを使用して、複数の音素のNグラムおよび複数の出現頻度を生成するための第1の手段と、
    ここで、前記複数の音素のNグラムを生成する第1の手段は、前記少なくとも1つのコーパスを単語のシーケンスに分解することによって複数の音素のNグラム頻度テーブルを生成し、前記単語のシーケンスを複数の音素のNグラムに分解する第3の手段を含み、
    ここで、前記複数の出現頻度に含まれる各出現頻度は、前記複数の音素のNグラムに含まれる第1及び第2音素のペアのそれぞれに対応するとともに、前記ペア内の第1の音素に続く前記ペア内の第2の音素の頻度を示し、
    前記複数の音素のNグラムおよび前記複数の出現頻度を使用して、各リーフに対し、そのリーフと同一の音素を先頭の音素とするNグラムを接続し、ノードが出現頻度を表す音素ツリーを生成するための第2の手段と、
    前記出現頻度を使用して前記音素ツリー上で、音素ツリーの各ノードで、確率の高い分岐先ほどより頻繁に選択されるようにランダムウォークを実行して音素のシーケンスを生成するための手段と、
    前記音素のシーケンスを書記素のシーケンスにマッピングして単語および/または名前を生成するための手段と、
    を備える、単語および/または名前を生成するための装置。
  13. 前記音素ツリーは、その頂部のルートと、前記ルートから生じる複数のノードとで構成され、前記複数のノードは、接続されたノードのペアが、前記ペア内の第1のノードから前記ペア内の第2のノードへのパスによって接続されるように、接続され、
    ノードのペア内の第1のノードは対応する音素のペア内の第1の音素を表し、前記ノードのペア内の第2のノードは前記音素のペア内の第2の音素を表し、さらに前記ノードのペアのノードを接続するパスは出現頻度を表すように、接続されたノードのペアが、対応する出現頻度を有する音素のペアに対応する、
    請求項12に記載の装置。
  14. 前記音素ツリー上でランダムウォークを実行するための前記手段は、
    パスに関する前記出現頻度に基づいてノードからの前記パスを前記ノードでランダムに選択することによって、前記音素ツリーを介して接続されたパスのセットを選択するための手段を含む、請求項13に記載の装置。
  15. 複数の音素のNグラムを生成する前記第1の手段は、複数の音素のNグラム頻度ツリーを生成するための第3の手段を含む、請求項12に記載の装置。
  16. 音素ツリーを生成するための前記第2の手段は、
    前記複数の音素のNグラム頻度ツリーを音素対音素接続で組み合わせるための手段を含む、請求項15に記載の装置。
  17. 前記単語のシーケンスを分解するための前記第2の手段は、
    ディクショナリを使用して、前記単語のシーケンスを前記音素のシーケンスに分解するための第3の手段を含む、請求項12に記載の装置。
  18. 前記音素ツリー上でランダムウォークを実行するための前記手段は、
    前記音素ツリーのノードで複数のパスから後に続く音素へのパスを、複数のパスに関する前記対応する複数の出現頻度に基づいて選択するための手段を含む、請求項12に記載の装置。
  19. 前記生成された音素のシーケンスが前記所与の言語の話し手にとって発音可能であるかどうかを判別するための手段をさらに含む、請求項12に記載の装置。
  20. 前記音素のシーケンスを書記素のシーケンスにマッピングするための前記手段は、
    ルックアップテーブルを使用して、前記音素のシーケンスを前記書記素のシーケンスに書き換えるための手段を含む、請求項12に記載の装置。
  21. 前記書記素のシーケンスから単語および/または名前を形成するための手段をさらに含む、請求項12に記載の装置。
  22. 前記少なくとも1つのコーパスを使用して複数の音素のNグラムおよび複数の出現頻度を生成するための前記手段、ならびに音素ツリーを生成するための前記手段は、ユーザの編集、修正、または他の手動による補助を必要とせずに、自動的であるように構成される、請求項12に記載の装置。
  23. 前記少なくとも1つのコーパスを使用して複数の音素のNグラムおよび複数の出現頻度を生成するための前記手段、ならびに音素ツリーを生成するための前記手段は、異なるコーパスを使用することで異なる音素ツリーを生成するように、固有の音素ツリーを生成するように構成される、請求項12に記載の装置。
  24. 単語および/または名前を生成するための装置であって、
    所与の言語に基づいて少なくとも1つのコーパスを受け取るための入力/出力インターフェースと、
    単語のシーケンスおよびディクショナリを使用して複数の音素のNグラムおよび複数の出現頻度を生成するために前記少なくとも1つのコーパスを前記単語のシーケンスに分解するように構成された、プロセッサと、
    ここで、前記プロセッサによる複数の音素のNグラムを生成することには、前記少なくとも1つのコーパスを単語のシーケンスに分解することによって複数の音素のNグラム頻度テーブルを生成することと、前記単語のシーケンスを複数の音素のNグラムに分解することが含まれ、
    ここで、前記複数の出現頻度に含まれる各出現頻度は、前記複数の音素のNグラムに含まれる音素のペアのそれぞれに対応するとともに、前記ペア内の第1の音素に続く前記ペア内の第2の音素の頻度を示し、前記プロセッサは、前記複数の音素のNグラムおよび前記複数の出現頻度を使用して、各リーフに対し、そのリーフと同一の音素を先頭の音素とするNグラムを接続し、ノードが出現頻度を表す音素ツリーを生成し、
    前記ディクショナリ、前記音素ツリー、および音素対書記素ルックアップテーブルを格納するためのストレージと、
    を備え、
    前記音素ツリーは、その頂部のルートと、前記ルートから生じる複数のノードとで構成され、前記複数のノードは、接続されたノードのペアが、前記ペア内の第1のノードから前記ペア内の第2のノードへのパスによって接続されるように、接続され、
    ノードのペア内の第1のノードは対応する音素のペア内の第1の音素を表し、前記ノードのペア内の第2のノードは前記音素のペア内の第2の音素を表し、さらに前記ノードのペアのノードを接続するパスは出現頻度を表すように、前記音素ツリー内の接続されたノードのペアは、対応する出現頻度を有する音素のペアに対応し、
    前記プロセッサは、前記出現頻度を使用して前記音素ツリー上で、音素ツリーの各ノードで、確率の高い分岐先ほどより頻繁に選択されるようにランダムウォークを実行して音素のシーケンスを生成するために前記音素ツリーを取り出し、前記音素対書記素ルックアップテーブルを使用して、前記音素のシーケンスを書記素のシーケンスにマッピングして単語および/または名前を生成する、
    単語および/または名前を生成するための装置。
  25. 単語および/または名前を生成するためのコンピュータプログラムを記録する有形の記録媒体であって、前記プログラムは、コンピュータに、
    所与の言語に基づいて少なくとも1つのコーパスを受け取る動作と、
    前記少なくとも1つのコーパスを使用して、複数の音素のNグラムおよび複数の出現頻度を生成する動作と、
    ここで、前記複数の音素のNグラムを生成する動作は、前記少なくとも1つのコーパスを単語のシーケンスに分解することによって複数の音素のNグラム頻度テーブルを生成するステップと、前記単語のシーケンスを複数の音素のNグラムに分解するステップを含み、
    ここで、前記複数の出現頻度に含まれる各出現頻度は、前記複数の音素のNグラムに含まれる第1及び第2音素のペアのそれぞれに対応するとともに、前記ペア内の第1の音素に続く前記ペア内の第2の音素の頻度を示し、
    前記複数の音素のNグラムおよび前記複数の出現頻度を使用して、各リーフに対し、そのリーフと同一の音素を先頭の音素とするNグラムを接続し、ノードが出現頻度を表す音素ツリーを生成する動作と、
    前記出現頻度を使用して前記音素ツリー上で、音素ツリーの各ノードで、確率の高い分岐先ほどより頻繁に選択されるようにランダムウォークを実行して音素のシーケンスを生成する動作と、
    前記音素のシーケンスを書記素のシーケンスにマッピングして単語および/または名前を生成する動作と
    を、実行させる、実行可能命令を備えている、記録媒体。
  26. 前記音素ツリーは、その頂部のルートと、前記ルートから生じる複数のノードとで構成され、前記複数のノードは、接続されたノードのペアが、前記ペア内の第1のノードから前記ペア内の第2のノードへのパスによって接続されるように、接続され、
    ノードのペア内の第1のノードは対応する音素のペア内の第1の音素を表し、前記ノードのペア内の第2のノードは前記音素のペア内の第2の音素を表し、さらに前記ノードのペアのノードを接続するパスは出現頻度を表すように、接続されたノードのペアが、対応する出現頻度を有する音素のペアに対応する、
    請求項25に記載の記録媒体。
  27. 前記音素ツリー上でランダムウォークを実行する動作をコンピュータに実行させる実行可能命令は、
    パスに関する前記出現頻度に基づいてノードからの前記パスを前記ノードでランダムに選択することによって、前記音素ツリーを介して接続されたパスのセットを選択する動作をコンピュータに実行させる実行可能命令含む、請求項26に記載の記録媒体。
  28. 複数の音素のNグラムを生成する動作をコンピュータに実行させる実行可能命令は、
    複数の音素のNグラム頻度ツリーを生成する動作をコンピュータに実行させる実行可能命令をさらに含む、請求項25に記載の記録媒体。
  29. 音素ツリーを生成する動作をコンピュータに実行させる実行可能命令は、
    前記複数の音素のNグラム頻度ツリーを音素対音素接続で組み合わせる動作をコンピュータに実行させる実行可能命令をさらに含む、請求項28に記載の記録媒体。
  30. 前記単語のシーケンスを分解する動作をコンピュータに実行させる実行可能命令は、
    ディクショナリを使用して、前記単語のシーケンスを前記音素のシーケンスに分解する動作をコンピュータに実行させる実行可能命令をさらに含む、請求項25に記載の記録媒体。
  31. 前記コンピュータプログラムは、前記生成された音素のシーケンスが前記所与の言語の話し手にとって発音可能であるかどうかを判別する動作をコンピュータに実行させる実行可能命令をさらに含む、請求項25に記載の記録媒体。
  32. 前記音素のシーケンスを書記素のシーケンスにマッピングする動作をコンピュータに実行させる実行可能命令は、
    ルックアップテーブルを使用して、前記音素のシーケンスを前記書記素のシーケンスに書き換える動作をコンピュータに実行させる実行可能命令をさらに含む、請求項25に記載の記録媒体。
  33. 前記コンピュータプログラムは、前記書記素のシーケンスから単語および/または名前を形成する動作をコンピュータに実行させる実行可能命令をさらに含む、請求項25に記載の記録媒体。
JP2008534735A 2005-10-06 2006-10-05 音素のnグラムを使用した単語および名前の生成 Active JP5172682B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/245,537 US7912716B2 (en) 2005-10-06 2005-10-06 Generating words and names using N-grams of phonemes
US11/245,537 2005-10-06
PCT/US2006/039232 WO2007044568A2 (en) 2005-10-06 2006-10-05 Generating words and names using n-grams of phonemes

Publications (2)

Publication Number Publication Date
JP2009511959A JP2009511959A (ja) 2009-03-19
JP5172682B2 true JP5172682B2 (ja) 2013-03-27

Family

ID=37911915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008534735A Active JP5172682B2 (ja) 2005-10-06 2006-10-05 音素のnグラムを使用した単語および名前の生成

Country Status (4)

Country Link
US (1) US7912716B2 (ja)
EP (1) EP1932146A4 (ja)
JP (1) JP5172682B2 (ja)
WO (1) WO2007044568A2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101300839B1 (ko) * 2007-12-18 2013-09-10 삼성전자주식회사 음성 검색어 확장 방법 및 시스템
JP5120749B2 (ja) * 2007-12-25 2013-01-16 株式会社国際電気通信基礎技術研究所 木構造辞書を記録した記憶媒体、木構造辞書作成装置、及び木構造辞書作成プログラム
EP2592570A3 (en) * 2011-11-08 2015-04-08 VeriSign, Inc. Pronounceable domain names
US9235565B2 (en) * 2012-02-14 2016-01-12 Facebook, Inc. Blending customized user dictionaries
US8831953B2 (en) * 2013-01-16 2014-09-09 Vikas Vanjani Systems and methods for filtering objectionable content
US9286396B2 (en) * 2013-07-26 2016-03-15 Microsoft Technology Licensing, Llc Query expansion and query-document matching using path-constrained random walks
US10853572B2 (en) * 2013-07-30 2020-12-01 Oracle International Corporation System and method for detecting the occureances of irrelevant and/or low-score strings in community based or user generated content
EP2922280A1 (en) * 2014-03-19 2015-09-23 Verisign, Inc. N-gram combination determination based on pronounceability
WO2015193879A1 (en) * 2014-06-15 2015-12-23 Opisoft Care Ltd. Method and system for searching words in documents written in a source language as transcript of words in an origin language
US9508341B1 (en) * 2014-09-03 2016-11-29 Amazon Technologies, Inc. Active learning for lexical annotations
US10002543B2 (en) * 2014-11-04 2018-06-19 Knotbird LLC System and methods for transforming language into interactive elements
GB2533370A (en) 2014-12-18 2016-06-22 Ibm Orthographic error correction using phonetic transcription
US10387543B2 (en) * 2015-10-15 2019-08-20 Vkidz, Inc. Phoneme-to-grapheme mapping systems and methods
US10102203B2 (en) 2015-12-21 2018-10-16 Verisign, Inc. Method for writing a foreign language in a pseudo language phonetically resembling native language of the speaker
US9947311B2 (en) * 2015-12-21 2018-04-17 Verisign, Inc. Systems and methods for automatic phonetization of domain names
US9910836B2 (en) 2015-12-21 2018-03-06 Verisign, Inc. Construction of phonetic representation of a string of characters
US10102189B2 (en) 2015-12-21 2018-10-16 Verisign, Inc. Construction of a phonetic representation of a generated string of characters
RU2692051C1 (ru) 2017-12-29 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для синтеза речи из текста
CN109754780B (zh) * 2018-03-28 2020-08-04 孔繁泽 基本语音编码图形和音频交换方法
US11138966B2 (en) * 2019-02-07 2021-10-05 Tencent America LLC Unsupervised automatic speech recognition
KR102152902B1 (ko) * 2020-02-11 2020-09-07 주식회사 엘솔루 음성 인식 모델을 학습시키는 방법 및 상기 방법을 이용하여 학습된 음성 인식 장치
EP4323908A1 (en) * 2021-06-04 2024-02-21 Google Llc Systems and methods for generating phonetic spelling variations

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4923855A (en) * 1983-07-08 1990-05-08 The William Seroy Group Synthetic GTF chromium material and process therefor
US4954492A (en) * 1983-07-08 1990-09-04 The William Seroy Group Synthetic GTF chromium material for decreasing blood lipid levels and process therefor
US5194615A (en) * 1983-07-08 1993-03-16 The William Seroy Group Synthetic GTF chromium nicotinate material and its preparation
US5266560A (en) * 1988-06-03 1993-11-30 Thomas Research Corporation Pharmaceutical insulin-potentiating CR(III) complexes with GTF-like activity
AU640485B2 (en) 1990-11-30 1993-08-26 Digital Equipment Corporation Random character generator
DE4130632A1 (de) * 1991-09-14 1993-03-18 Philips Patentverwaltung Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal
US5543405A (en) * 1993-10-22 1996-08-06 Keown; Wendy J. Composition and method for weight reduction and long term management of obesity
US5480657A (en) * 1993-10-27 1996-01-02 Allen; Ann De Wees T. Composition comprising caffeine chromium and fructose for weight control and use thereof
US5621859A (en) * 1994-01-19 1997-04-15 Bbn Corporation Single tree method for grammar directed, very large vocabulary speech recognizer
US5612039A (en) * 1994-03-14 1997-03-18 Nini E. Policappelli Dietary supplement
US5567424A (en) * 1994-06-10 1996-10-22 Reliv International, Inc. Fiber, antioxidant, herbal and enzyme supplemented beverage composition for human consumption
US6352713B1 (en) * 1999-12-01 2002-03-05 Drugtech Corporation Nutritional composition
US5850448A (en) * 1994-10-25 1998-12-15 Bell Atlantic Network Services, Inc. Programmed computer for generating pronounceable security passwords
US5626849A (en) * 1995-06-07 1997-05-06 Reliv International, Inc. Weight loss composition for burning and reducing synthesis of fats
US5799319A (en) 1995-07-13 1998-08-25 Atkins; Hank Method for naming computer files
IT1276253B1 (it) * 1995-12-15 1997-10-27 Sigma Tau Ind Farmaceuti Composizione farmaceutica contenente l-carnitina o alcanoil l-carnitine per la prevenzione ed il trattamento di stati morbosi
AU6141498A (en) * 1997-02-04 1998-08-25 John V. Kosbab Compositions and methods for prevention and treatment of vascular degenerative diseases
US5962030A (en) * 1997-03-07 1999-10-05 Akesis Pharmaceuticals, Inc. Dietary supplement and method of treatment for diabetic control
US5877171A (en) * 1997-07-28 1999-03-02 Mcleod; Malcolm N. Method of treating pre-menstrual syndrome using chromium
CA2320368C (en) * 1998-02-23 2007-08-21 Taiyo Kagaku Co., Ltd. Composition comprising theanine
US6048846A (en) * 1998-02-26 2000-04-11 Cochran; Timothy M. Compositions used in human treatment
WO2000007575A2 (en) * 1998-07-31 2000-02-17 Mount Sinai Hospital Methods and compositions for increasing insulin sensitivity
US5905075A (en) * 1998-08-28 1999-05-18 Ambi Inc. Chromium nicotinate compositions and uses thereof
AU5802499A (en) * 1998-09-01 2000-03-21 Amway Corporation Diet composition and method of weight management
US6541026B2 (en) * 1999-12-16 2003-04-01 Harry J. Siskind Nutritional composition, methods of producing said composition and methods of using said composition
US6291533B1 (en) * 1999-12-22 2001-09-18 Vitamerica, Inc. Dietary supplements for each specific blood type
US6399089B1 (en) * 2000-05-15 2002-06-04 A. Glenn Braswell Compositions and methods for regulating metabolism and balancing body weight
US6383482B1 (en) * 2000-08-24 2002-05-07 Vitacost.Com, Inc. Weight loss composition containing green tea, hydroxycitric acid, 5-hydroxytryptophan, glucomannan, picolinate and lactobacillus
JP2002108878A (ja) * 2000-09-29 2002-04-12 Yutaka Kadotsuji 辞書、および検索システム
US6579866B2 (en) * 2000-12-28 2003-06-17 Mccleary Larry Composition and method for modulating nutrient partitioning
US20040157929A1 (en) * 2002-04-01 2004-08-12 Ohia Sunny E. Method for increasing serotonin levels in a person by administration of a composition incorporating(-)hydroxycitric acid, and related compositions thereof
US7119110B2 (en) * 2001-10-05 2006-10-10 Interhealth Nutraceuticals Incorporated Method and composition for preventing or reducing the symptoms of insulin resistance syndrome
US6985861B2 (en) * 2001-12-12 2006-01-10 Hewlett-Packard Development Company, L.P. Systems and methods for combining subword recognition and whole word recognition of a spoken input
US20030119913A1 (en) * 2001-12-20 2003-06-26 Ohia Sunny E. Method for increasing serotonin levels in a person by administration of a composition incorporating (-)-hydroxycitric acid, and related compositions thereof
US6999918B2 (en) * 2002-09-20 2006-02-14 Motorola, Inc. Method and apparatus to facilitate correlating symbols to sounds
WO2004034378A1 (ja) * 2002-10-08 2004-04-22 Matsushita Electric Industrial Co., Ltd. 言語モデル生成蓄積装置、音声認識装置、言語モデル生成方法および音声認識方法
WO2004085462A2 (en) * 2003-03-21 2004-10-07 Interhealth Nutraceuticals Incorporated Method and composition for decreasing ghrelin levels
US7039873B2 (en) 2003-05-12 2006-05-02 Flashpoint Technology, Inc. User-defined templates for automatic image naming
US20050004915A1 (en) 2003-05-21 2005-01-06 Jean-Philippe Hermand Method for generating names
TWI233589B (en) * 2004-03-05 2005-06-01 Ind Tech Res Inst Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously
US20050267755A1 (en) * 2004-05-27 2005-12-01 Nokia Corporation Arrangement for speech recognition
ES2237345B1 (es) * 2005-02-28 2006-06-16 Prous Institute For Biomedical Research S.A. Procedimiento de conversion de fonemas a texto escrito y sistema informatico y programa informatico correspondientes.
US8050924B2 (en) * 2005-04-08 2011-11-01 Sony Online Entertainment Llc System for generating and selecting names
US20070015121A1 (en) * 2005-06-02 2007-01-18 University Of Southern California Interactive Foreign Language Teaching

Also Published As

Publication number Publication date
US7912716B2 (en) 2011-03-22
WO2007044568A3 (en) 2009-06-25
WO2007044568A2 (en) 2007-04-19
EP1932146A2 (en) 2008-06-18
JP2009511959A (ja) 2009-03-19
US20070083369A1 (en) 2007-04-12
EP1932146A4 (en) 2011-08-17

Similar Documents

Publication Publication Date Title
JP5172682B2 (ja) 音素のnグラムを使用した単語および名前の生成
US7292980B1 (en) Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems
US7454345B2 (en) Word or collocation emphasizing voice synthesizer
JP4833313B2 (ja) 中国語方言判断プログラム
US6343270B1 (en) Method for increasing dialect precision and usability in speech recognition and text-to-speech systems
US20020198715A1 (en) Artificial language generation
JPH07507880A (ja) 複合ワードを有する言語のための音声認識装置
JPH1083277A (ja) 連結型読み上げシステム及びテキストを音声に変換する方法
JP2002318595A (ja) テキスト音声合成システムの韻律テンプレートマッチング
JP4872323B2 (ja) Htmlメール生成システム、通信装置、htmlメール生成方法、及び記録媒体
Davel et al. Pronunciation dictionary development in resource-scarce environments
JP6806662B2 (ja) 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法
JP2009139677A (ja) 音声処理装置及びそのプログラム
GB2376554A (en) Artificial language generation and evaluation
JP2012063542A (ja) 文章提示装置、文章提示方法及びプログラム
JP6619932B2 (ja) 形態素解析装置およびプログラム
EP1668630B1 (en) Improvements to an utterance waveform corpus
JP4173404B2 (ja) 文セット自動生成装置、文セット自動生成プログラム、記憶媒体
JP2006011592A (ja) 情報処理装置および情報処理方法、プログラム、並びに記録媒体
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2004258561A (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JP6277727B2 (ja) 音声合成装置、音声合成方法、プログラム
JP2009075263A (ja) 音声認識装置およびコンピュータプログラム
JP2001166790A (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
JP2010108201A (ja) データ処理装置、そのコンピュータプログラムおよびデータ処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091002

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100702

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120110

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120319

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120619

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120626

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120719

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121226

R150 Certificate of patent or registration of utility model

Ref document number: 5172682

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250