JP2004070959A

JP2004070959A - 適応型文脈依存解析

Info

Publication number: JP2004070959A
Application number: JP2003288282A
Authority: JP
Inventors: Yasuo Kida; キダ　ヤスオ; Michi Iwasaki; イワサキ　ミチ; Keisuke Hara; ハラ　ケイスケ; Takumi Takano; タカノ　タクミ
Original assignee: Apple Computer Inc
Current assignee: Apple Inc
Priority date: 2002-08-06
Filing date: 2003-08-06
Publication date: 2004-03-04
Also published as: CN1495641B; TW200415573A; CN1495641A; US20040030543A1; TWI242181B; US7548863B2

Abstract

【課題】　日本語の文字言語は、発音に基づかない漢字と呼ばれる１０，０００以上の文字を用いる。この多数の文字は、コンピュータへの効率的なテキスト入力に難題を持ち掛ける。
【解決手段】　発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のドキュメントを用いて、類似のドキュメント内に見出されたワードの重み付きリストを含むカスタマイズされた辞書を生成する、テキストに変換する方法、装置、システムおよび信号搬送媒体が提供される。より高い重みが付けられたワードは、入力データにて用いられる確率がより高くなり得、従って、変換されたテキストにおけるワードは、重み付きリストに基づいて選択される。ベクトル空間モデルが、類似のドキュメントを検索するために用いられ得る。
【選択図】　なし

Description

　本特許明細書の開示の一部は、著作権保護の要求がなされる素材を含む。米国特許商標庁ファイルまたは記録に記載されるように、著作権所持者は、特許明細書または特許開示の任意の者による複製に対していかなる異議も有しないが、他のいかなる権利も保護される。

　（分野）
　本発明は、概して、表音文字（ｐｈｏｎｅｔｉｃ　ｃｈａｒａｃｔｅｒｓ）のテキストへの変換に関し、より具体的には、同じ発音であるが異なった表記に変換することに関する。

　（背景）
　日本語の文字言語は、発音に基づかない漢字と呼ばれる１０，０００以上の文字を用いる。この多数の文字は、コンピュータへの効率的なテキスト入力に難題を持ち掛ける。日本語テキストを入力する一般的な方法は、ユーザが仮名と呼ばれる表音文字でテキストをタイプし、コンピュータが仮名−漢字変換と呼ばれるプロセスを用いてその仮名文字を漢字テキストに変換する。

　仮名−漢字変換は複雑なプロセスである。最近の仮名−漢字変換エンジンは、例えば、形容詞が名詞の前に置かれ得るといった文法的解析、および例えば、「夏」は「高温」を意味し得るが「ピリット辛い」とはおそらく意味しない意味的解析を採用する。仮名−漢字変換は、文字または音声認識と非常に類似の性質を共有する。これには、与えられた入力に対して複数の可能な結果が存在し、変換プロセスが最も確かな出力をユーザに提供するためには可能な結果を分類することを必要とする。出力は、変換エラーと呼ばれる誤った結果になり得る。変換エラーの頻度は、正しく変換されたワードの数を、変換されたワードの総数で除算して計算することによって測定される。変換の精度は、多くの場合、ユーザが仮名−漢字変換エンジンを選択する場合の最も重要なファクタであり、最近の変換エンジンは、９６〜９７％の変換精度を有する。

　変換エラーの１クラスは、文脈依存クラス（ｃｏｎｔｅｘｔ　ｄｅｐｅｎｄｅｎｔ　ｃｌａｓｓ）と呼ばれる。文脈依存エラーの例は、同じ発音、従って、同じ仮名表音文字を有するワードであるが、複数の漢字文字は文脈に依存する。例えば、日本語の表音（Ｐｈｏｎｅｔｉｃ　ｓｏｕｎｄ）「そうしゃ」は、楽器の「奏者」または「走者」を意味し得る。これらの両方は「そうしゃ」と発音されるが、文字は異なる。ユーザが仮名で＜ピアノの「そうしゃ」はマリーであった＞とタイプした場合、変換エンジンの意味的解析は、「ピアノ」の「そうしゃ」の文脈であるために、仮名「そうしゃ」が「走者」ではなく「奏者」を意味する漢字文字に変換すべきであることを決定することができる。対照的に、ユーザが仮名で＜「そうしゃ」はマリーであった＞とタイプした場合、変換エンジンの意味的解析は、「そうしゃ」を解釈するための完全な文脈を有さず、漢字文字を任意に推測しなければならず、不正確になり得る。

　別の一般的な変換エラーは、同一の発音であるが異なった文字であり得る名前について生じる。例えば、一般的な日本の名前「けいこ」は、１０通り以上の異なった文字を有し得る。ユーザが、けいこという２人の人を知っており、１人はユーザの友人であり、もう１人はユーザの上司である場合、そのユーザは、両者に対して電子メールを作成することを所望し得、仮名で＜こんにちは「けいこ」今週末にスキーに行きましょう＞および＜「けいこ」、プロジェクトのスケジュールについて話しませんか＞とタイプする。ユーザは、変換エンジンが第１の「けいこ」をけいこという友人の名前と関連する漢字文字に変換し、第２の「けいこ」をけいこという名前の上司と関連する漢字文字に変換することを所望する。残念なことに、既存の変換エンジンによって用いられる文法的および意味的解析は、正しい漢字文字を選択することができない。なぜなら、既存の変換エンジンは、１人の「けいこ」はスキーに出かけるが、もう１人の「けいこ」はプロジェクトのスケジュールについて話すことを知らないからである。

　上述の問題は、仮名および漢字という観点で記載されるが、この問題は、書かれた単語が同一の発音または同一の音声表示を有する場合の任意の言語に等しく当てはまる。例えば、英語の書かれた単語「ｍａｉｎ」および「ｍａｎｅ」は、同一の発音を有する。意味的情報は、「ｍａｉｎ」は管を示し、「ｍａｎｅ」は動物の毛を示す場合、言葉による文章「Ｔｈｅ　ｍａｉｎ　ｗａｓ　ｃｕｔ」を「Ｔｈｅ　ｍａｎｅ　ｗａｓ　ｃｕｔ」と対比して解析する際には役に立たない。

　変換エンジンの買い手は、変換精度に基づいて購買決定を下すので、より正確な変換を実行する解決策を提供することが極めて重要である。

　（要旨）
　１実施形態において、発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のリストを用いて、類似のドキュメントからのワードの重み付きリストを含むカスタマイズされた辞書を生成するテキストに変換する、方法、装置、システムおよび信号搬送媒体が提供される。より高い重みが付けられたワードは、入力データにて用いられる確率がより高くなり得、従って、変換されたテキストにおけるワードは、重み付きリストに基づいて選択される。１実施形態において、ベクトル空間モデルは、類似のドキュメントを検索するために用いられ得る。

　本発明による方法は、入力データと類似である少なくとも１つのドキュメントを見出す工程と、該少なくとも１つのドキュメントにおけるワードの頻度を判定する工程と、該頻度に基づいて該入力データを変換する工程とを包含し、これにより上記目的を達成する。

　本発明によるシステムは、プロセッサと、該プロセッサと接続される格納デバイスとを備えるシステムであって、該格納デバイスは、該プロセッサ上で実行される場合、入力データと類似である少なくとも１つのドキュメントを見出す工程と、該少なくとも１つのドキュメントにおけるワードの頻度を決定する工程と、該頻度に基づいて該入力データを変換する工程とを包含する命令を含み、これにより上記目的を達成する。

　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、前記入力データのベクトルを計算する工程と、該複数のドキュメントの複数のベクトルを計算する工程と、該入力ベクトルと該複数のベクトルの各々とを比較する工程と、該複数のドキュメントの該複数のベクトルへの該入力データの該ベクトルの近接性に基づいて、複数のドキュメントのサブセットを選択する工程とを包含してもよい。

　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、前記入力データの入力ベクトルを計算する工程と、前記複数のドキュメントの複数のベクトルを計算する工程と、該入力ベクトルと、該複数のベクトルの各々との間の角度を比較する工程と、該比較に基づいて該複数のドキュメントのサブセットを選択する工程と
を包含してもよい。

　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、入力データの入力ベクトルを計算する工程と、該複数のドキュメントの複数のベクトルを計算する工程と、該入力データの該ベクトルと、該複数のベクトルの各々との間の角度の余弦を計算することによって、該入力ベクトルと、該複数のベクトルの各々とを比較する工程と、該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
を包含してもよい。

　前記少なくとも１つのドキュメントにおける前記ワードの頻度に基づいて、カスタマイズされた辞書を生成する工程であって、該入力データを変換する工程は、該カスタマイズされた辞書に基づく、工程をさらに包含してもよい。

　前記変換する工程は、ワードの重み付けリストを含むカスタマイズされた辞書を前記少なくとも１つのドキュメントから生成する工程と、該重み付けリストに基づいて、前記入力データをテキストに変換する工程とを包含してもよい。

　前記変換する工程は、より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てることによって、ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも１つのドキュメントから生成する工程と、該重み付きリストに基づいて、該入力データをテキストに変換する工程とを包含してもよい。

　前記変換する工程は、前記少なくとも１つのドキュメントにおける前記ワードの頻度を計算することによって、ワードの重み付きリストを含むカスタマイズされた辞書を該少なくとも１つのドキュメントから生成する工程と、該重み付きリストに基づいて、該入力データをテキストに変換する工程とを包含してもよい。

　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、前記入力データのベクトルを計算する工程と、該複数のドキュメントの複数のベクトルを計算する工程と、前記入力ベクトルと、該複数のベクトルの各々との間のユークリッド距離を決定することによって、該入力ベクトルと該複数のベクトルの各々とを比較する工程と、該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
を包含してもよい。

　本発明による信号搬送媒体は、命令によって復号化される信号搬送媒体であって、該命令は、実行される場合、請求項１および２〜１０の方法を含み、これにより上記目的を達成する。

　前記入力データを供給するマイクロホンをさらに備えてもよい。

　前記入力データを供給する仮名キーボードをさらに備えてもよい。

　前記プロセッサは、ネットワークから前記入力を受信してもよい。

　前記格納デバイスは、辞書と、該辞書、および入力データの入力ベクトルと、既存のドキュメントの複数のベクトルとの間の角度に基づいて、カスタマイズされた辞書を生成する変換エンジンとをさらに備えてもよい。

　前記変換エンジンは、さらに、前記カスタマイズされた辞書に基づいて、前記入力データをテキストに変換してもよい。

　前記変換エンジンは、さらに、前記カスタマイズされた辞書におけるワードの重み付きリストに基づいて、前記入力データをテキストに変換してもよい。

　前記変換エンジンは、さらに、前記既存のドキュメントを、角度に基づいて、類似のドキュメントと異なるドキュメントとに分割してもよい。

　前記変換エンジンは、さらに、前記類似のドキュメントに基づいて、前記カスタマイズされた辞書を生成してもよい。

　本発明による装置は、入力データと類似である少なくとも１つのドキュメントを見出すための手段と、該少なくとも１つのドキュメントにおけるワードの頻度を判定するための手段と、該頻度に基づいて、該入力データを変換するための手段とを備え、これにより上記目的を達成する。

　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出すための手段は、前記入力データの入力ベクトルを計算するための手段と、該複数のドキュメントを、該入力ベクトルに基づいて、該入力データと類似の第１のサブセットおよび該入力データと異なる第２のサブセットに分割するための手段とを備え、これにより上記目的を達成する。

　前記分割するための手段は、前記複数のドキュメントの複数のベクトルを計算するための手段と、前記入力ベクトルと該複数のベクトルとを比較するための手段とを備えてもよい。

　前記比較するための手段は、前記入力ベクトルと前記複数のベクトルの各々との間の角度を決定するための手段を備えてもよい。

　前記比較するための手段は、前記入力ベクトルと、前記複数のベクトルの各々との間のユークリッド距離を決定するための手段を備えてもよい。

　前記変換するための手段は、ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも１つのドキュメントから生成するための手段と、該重み付きリストに基づいて、前記入力データをテキストに変換するための手段とを備えてもよい。

　前記カスタマイズされた辞書を生成するための手段は、より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てるための手段をさらに備えてもよい。

　前記カスタマイズされた辞書を生成する手段は、前記少なくとも１つのドキュメントにおける前記ワードの頻度を計算するための手段をさらに備えてもよい。

　前記入力データは発話データを含んでもよい。

　前記入力データは表音文字を含んでもよい。

　前記入力データは仮名文字を含んでもよい。

　発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のドキュメントを用いて、類似のドキュメント内に見出されたワードの重み付きリストを含むカスタマイズされた辞書を生成する、テキストに変換する方法、装置、システムおよび信号搬送媒体を提供することが可能である。

　（詳細な説明）
　本発明の例示的実施形態の以下の詳細な記載において、本明細書の一部をなし、本発明が実行され得る具体的な例示の実施形態が図示されることにより示される添付の図面（ここで、同じ符号は同じ要素を示す）が参照される。これらの実施形態は、当業者が本発明を実行することを可能にするために十分に詳細に記載されるが、他の実施形態が利用され得、論理的、機械的、電気的およびその他の変更が、本発明の範囲から逸脱することなくなされ得る。従って、以下の詳細な記載は、限定的な意味にとられるべきでなく、本発明の範囲は、従属請求項によってのみ定義される。

　以下の記載において、本発明を徹底的な理解を提供するように多数の具体的詳細が示される。しかしながら、本発明は、これらの具体的な詳細なしで実行され得ることが理解される。他の例において、周知の回路、構造および技術は、発明を不明瞭にしないために詳しくは示されない。

　図１は、本発明の実施形態の例示的コンポーネントのブロック図を示す。図示されるのは、入力データ１０５、変換エンジン１１０、既存のドキュメント１１５、辞書１２０、カスタマイズされた辞書１２５および変換されたテキスト１９９である。

　入力データ１０５は、変換されることをユーザが所望するデータを含む。１実施形態において、入力データ１０５は、漢字に変換されることをユーザが所望する仮名等の表音文字を含む。別の実施形態において、入力データ１０５は、音声認識アプリケーションと関連する話される日本語の表記を含む。別の実施形態において、入力データは、話される英語の表記、または音声認識アプリケーションと関連する任意の他の言語を含み、この表記は、普通のワードまたは音声部分が付けられたワード任意の形態であり得る。示された実施例において、入力データ１０５は、仮名表音文字を表す「けいこ」、「プロジェクト」、「スケジュール」および「ミーティング」を含む。

　変換エンジン１１０は、入力データ１０５を読み出し、辞書１２０、カスタマイズされた辞書１２５および既存のドキュメント１１５を用いて変換されたテキスト１９９に変換する。
図２および図３を参照して以下においてさらに記載されるように、変換エンジン１１０は、入力データ１０５を表すベクトルを生成して、このベクトルを用いて、入力データ１０５と類似であるドキュメントのサブセットについて、既存のドキュメント１１５を検索する。

　１実施形態において、変換エンジン１１０は、スタンドアロンアプリケーションであり得る。しかしながら、別の実施形態において、変換エンジン１１０は、仮名キーボード、または任意の他の入力方法を介して入力された文字の発音表記を漢字文字に変換するユーティリティの一部であり得る。さらに別の実施形態において、変換エンジン１１０は、口頭発話または口頭発話の表記を文字テキストに変換する音声認識アプリケーションの一部であり得る。変換エンジン１１０は、日本語に限定されず、任意の適切な言語とともに用いられ得る。

　既存のドキュメント１１５は、ユーザが前に書き込んだドキュメントを含み得るが、別の実施形態において、既存のドキュメント１１５は、変換エンジン１１０に入力するために用いることをユーザが所望するドキュメントの任意のセットを含み得る。示された実施例において、既存のドキュメント１１５は、ドキュメント１３０、１３５、１４０、１４５および１４６を含む。ドキュメント１３０、１３５、１４０および１４５は、入力データ１０５と類似または近似であると変換エンジン１１０が決定したドキュメントである一方で、異なったドキュメント１４６は、入力データ１０５と類似でないと変換エンジン１１０が決定したドキュメントである。変換エンジン１１０が、類似のドキュメントを異なったドキュメントから分離するために用いる技術は、以下において図２および図３を参照してさらに記載される。

　ドキュメント１３０は、漢字文字「けいこ−上司」および「スケジュール」を含む。ドキュメント１３５は、漢字文字「けいこ−上司」、「プロジェクト」および「ミーティング」を含む。ドキュメント１４０は、漢字文字「けいこ−上司」、「スケジュール」および「ミーティング」を含む。ドキュメント１４５は、漢字文字「けいこ−友人」、「スキー」および「ミーティング」を含む。「けいこ−上司」を「けいこ−友人」と対比させる使用は、「けいこ」の仮名または音声表示が、「けいこ」という名前の人物と、話す人またはユーザとの関係に依存して、異なった対応漢字文字を有することを表すように意図される。例えば、漢字文字は、けいこがユーザの友人であるか、またはユーザの上司であるかに依存して異なる。

　ドキュメント１３０、１３５、１４０および１４５は、漢字文字を含むことが図示されるが、別の実施形態において、これらのドキュメントは、任意の言語の文字を含み得る。例えば、複数の言語は、同一の発音および同一の音声表示であるが、異なった表記形態を有するワードを発話プロセッサ（例えば、音声認識アプリケーション）内に含む。

　辞書１２０は、相対的頻度を有する音声表示およびそれぞれの表記文字のリストと、音声情報の一部（例えば、名詞、動詞、形容詞等）および意味情報（例えば、ピアノというワードは、通常、音楽の文脈で用いられる）を含む。辞書１２０の内容は、多くの場合、重み付きリストと呼ばれる。なぜなら、このリストは、相対頻度によって重み付けされるからである。１実施形態において、複数の辞書が、その辞書を用いるアプリケーションに基づいて、異なった相対頻度で存在し得る。例えば、いくつかのワードは、普通の会話においてまれに用いられ得るが、これらのワードは、法律または医療アプリケーションにおいて頻繁に用いられ得る。別の実施形態において、辞書１２０は、より多いか、またはより少ない項目を有し得る。

　カスタマイズされた辞書１２５は、仮名フィールド１２６、漢字フィールド１２７および頻度フィールド１２８を含む。仮名−漢字変換と関係のない別の実施形態において、仮名フィールド１２６は、音声表示フィールドと置き換えられ得、漢字フィールドは、テキストフィールドと置き換えられ得る。カスタマイズされた辞書１２５は、また音声情報の一部、意味情報および他のアプリケーションフィールドをさらに含み得る。

　カスタマイズされた辞書１２５は、図２および図３を参照して以下にさらに記載されるように、入力データ１０５と既存のドキュメント１１５とを比較することによって改変される相対頻度を有する辞書１２０の重み付きリストを含む。既存のドキュメント１１５の類似のサブセットにおいてより頻繁に用いられるワードは、カスタマイズされた辞書１２５においてより高い頻度１２８を有し、既存のドキュメント１１５の類似のセットにおいてあまり頻繁に用いられないワードは、カスタマイズされた辞書１２５において低い頻度１２８を有する。例えば、「けいこ−上司」は、類似のドキュメント１３０、１３５、１４０および１４５において３回用いられる。従って、「けいこ−上司」はカスタマイズされた辞書１２５において「３」の頻度１２８を有する。「けいこ−友人」は、類似のドキュメント１３０、１３５、１４０および１４５において１回用いられる。従って、「けいこ−友人」は、カスタマイズされた辞書１２５において「１」の頻度を有する。

　カスタマイズされた辞書１２５について示される例は、そのワードが類似の既存のドキュメントにおいて用いられる回数に正確に対応する頻度１２８の入力を有するが、別の実施形態において、頻度１２８は、相対的または比例的である。さらに別の実施形態において、頻度１２８は存在せず、カスタマイズされた辞書１２５への入力の順序にのみ反映され得る。１実施形態において、「変換の総スコア」は、後述されるように、頻度１２８に基づく。入力データが２つの可能な結果、すなわち、「Ｂ１　Ｂ２　Ｂ３　Ｂ４　Ｂ５」および「Ｃ１　Ｃ２　Ｃ３　Ｃ４　Ｃ５」に変換され得る場合（ここで、Ｂ１、Ｂ２、Ｂ３、Ｂ４、Ｂ５、Ｃ１、Ｃ２、Ｃ３、Ｃ４およびＣ５の各々は１つのワードである）、変換の総スコアは、ｆ（Ｂ１）＋ｆ（Ｂ２）＋ｆ（Ｂ３）＋ｆ（Ｂ４）＋ｆ（Ｂ５）＋ｃｎｎ（Ｂ１２）＋ｃｎｎ（Ｂ２３）＋ｃｎｎ（Ｂ３４）＋ｃｎｎ（Ｂ４５）と定義される。

　上述の式において、ｆ（Ｂ１）はワードＢ１の頻度であり、ｆ（Ｂ２）はワードＢ２
の頻度であり、ｆ（Ｂ３）はワードＢ３の頻度であり、ｆ（Ｂ４）はワードＢ４の頻度であり、ｆ（Ｂ５）はワードＢ５の頻度である。上述の等式において、さらに、上述の式において、ｃｎｎ（Ｂ１２）は、音声部分Ｂ１およびＢ２がどれだけ頻繁に集まるか、例えば、形容詞および名詞が非常に容易に結びつき得るかということであり、ｃｎｎ（Ｂ２３）は、音声部分Ｂ２およびＢ３がどれだけ頻繁に集まるか、ｃｎｎ（Ｂ３４）は、音声部分Ｂ３およびＢ４がどれだけ頻繁に集まるかであり、ｃｎｎ（Ｂ４５）は、音声部分Ｂ４およびＢ５がどれだけ頻繁に集まるかということである。特定の入力データについて、変換の総スコアを用いると、頻度１２８だけに基づいてワードを選択するよりも正確な結果をもたらす。

　上述されたように、変換されたテキスト１９９は、辞書１２０、カスタマイズされた辞書１２５、および既存のドキュメント１１５を用いて、変換エンジン１１０が入力データ１０５から生成する目的言語の文字の表示を含む。

　図２は、本発明の実施形態による、例示のドキュメントおよびこれらに関連する例示のベクトルの図形の表示を示す。変換エンジン１１０は、ベクトル空間モデルと呼ばれる技術を用いて、ドキュメント間の類似性または近似性を比較する。ベクトル空間モデルにおいて、変換エンジン１１０は、ｎ次元のベクトルを有するドキュメントを表す。これは、ドキュメントからの一意的なワードおよびその一意的なワードが現れる回数を含むデータ構造である。ｎ次元ベクトルの各次元は、一意的なワードの数を表す整数である「ｎ」を有する一意的なワードの１つを表す。

　図２の実施例において、ドキュメント２０５は、「スケジュール」、「けいこ−上司」および「けいこ−上司」という３つのワードを含み、ドキュメント２１０は、「けいこ−上司」および「スケジュール」という２つのワードを含む。ドキュメント２０５およびドキュメント２１０の両方は、２つの一意的なワードを有し、従って、変換エンジン１１０は、ドキュメント２０５およびドキュメント２１０の両方を２次元ベクトル、すなわちベクトル２１５およびベクトル２２０のそれぞれによって表す。ベクトル２１５および２２０は、２次元ベクトル空間２０２において図示される。この空間は、垂直軸上に「けいこ−上司」のドキュメントのインスタンス数を、および水平軸上に「スケジュール」のインスタンス数を有する。図示を容易にするために、２次元ベクトル空間２０２を生成するための２つの一意的なワードのみを有するドキュメントが示されるが、他の実施形態において、任意の次元および任意のワードが用いられ得る。さらに、ドキュメントは、同じ数または異なった数の一意的ワードを有し得る。

　変換エンジン１１０は、ドキュメントの類似性または近似性を、それらのベクトル間の角度２２５を比較することによって比較する。ベクトル間の角度が小さいベクトルは類似である一方で、大きい角度を有するベクトルは異なる。１実施形態において、変換エンジン１１０は、ベクトル長さ（二乗の和の平方根）の積によって正規化（分解される）された２つのベクトルの内積としての角度２２５の余弦を計算する。角度の余弦が１である場合、ベクトルは同一である。角度の余弦が０の場合、ベクトルは直交である（ベクトルは、共通のワードを有しない）。別の実施形態において、変換エンジン１１０は、ユークリッド距離または任意の他の適切な方法を用いてベクトルの類似性を計算する。

　余弦の類似性は、

であり、
　ユークリッド距離は、

であり、ここで、

および

は、比較されるベクトルである。

　一旦変換エンジン１１０が上述の技術の１つを用いて数を計算すると、変換エンジン１１０は、計算された数が所定の定数に属するか否かを判定することによって、この数がベクトル間の十分な類似性を示すか否かを判定する。例えば、変換エンジン１１０は、ベクトルの余弦が０．７５よりも大きい場合、ドキュメントが類似であり、余弦が０．７５よりも小さいか、または等しい場合、これらのドキュメントが異なることを決定し得る。任意の適切な定数が用いられ得、所定の定数が、変換エンジン１１０によってセットされるか、またはユーザによって選択され得る。別の実施形態において、変換エンジンは、既存のドキュメント１１５の数、既存のドキュメント１１５におけるワードの数、類似であることが所望される既存のドキュメントの比率または数、または任意の他の適切なファクタに基づいて動的に変化する基準を用いる。

　入力データ１０５は、ドキュメント１１５からの異なったフォーマットのデータを含むので（例えば、入力データ１０５は仮名文字を含むが、ドキュメント１１５は漢字文字を含み、あるいは、入力データ１０５は口頭発話の表示を含むが、ドキュメント１１５はテキストを含む）、入力データ１０５の入力ベクトルは間接的であり、反復プロセスを介して計算かつ比較される。ドキュメント１１５および入力データ１０５のベクトルの間接的比較は、「入力されたデータ」と呼ばれるコンセプトを用いる。これは、以下の実施例を参照することによって理解され得る。ここで、最初、入力されたデータは空であり、入力データ１０５におけるデータの第１の構成要素は「ａ」である。

　入力されたデータ：（空）
　入力データの次の構成要素：「ａ」
　入力されたデータがないので、入力データ１０５およびドキュメント１１５のベクトルは、まだ比較され得ず、「ａ」の文脈依存変換は起こり得ず、従って、入力データ１０５が（例えば、仮名は、漢字に変換されるか、または口頭発話がテキストに変換される）、文脈依存を考慮することなく「Ａ」に変換される。入力データ１０５におけるデータの次の構成要素は「ｂ」であり、
　入力されたデータ：（Ａ）
　入力データの次の構成要素：「ｂ」
をもたらす。

　「Ａ」は、ここで、入力データ１０５の現在のベクトルを形成するために用いられ、入力データ１０５の現在のベクトルとドキュメント１１５のベクトルとを比較し、かつ「ｂ」を「Ｂ」に変換することによって、新しい入力「ｂ」の解析を改善するために用いられる。入力データの次の構成要素は「ｃ」であり、
　入力されたデータ：「Ａ　Ｂ」
　入力データの次の構成要素：「ｃ」
をもたらす。

　従って、入力データ１０５の各構成要素が解析されると、入力データ１０５のベクトルは更新かつ改善される。

　本発明の１実施形態は、ベクトル空間モデルに関して記載されてきたが、別の実施形態において、潜伏性意味的モデルまたは類似のドキュメントを見出すことができる任意の他のモデルが用いられ得る。

　図３は、本発明の実施形態による、例示の処理のフローチャートを示す。制御はブロック３００で開始する。制御は、その後、変換エンジン１１０が入力データ１０５を受信するブロック３０５に続く。

　制御は、その後、図２を参照してすでに記載されたように、変換エンジン１１０が入力データ１０５のベクトルを間接的に生成するブロック３１０に続く。

　制御は、その後、図２を参照してすでに記載されたように、変換エンジン１１０が既存のドキュメント１１５を見出し、かつそれらのベクトルを計算するブロック３１５に続く。別の実施形態において、既存のドキュメント１１５のベクトルは、変換プロセスの性能を改善するために、入力データ１０５の変換が開始する前に計算される。１実施形態において、既存のドキュメント１１５のベクトルは圧縮される。

　制御は、その後、図２を参照してすでに記載されたように、変換エンジン１１０が、既存のドキュメントのベクトルが入力データ１０５のベクトルにどれだけ近接しているかに基づいて、その既存のドキュメント１１５のサブセットを選択するブロック３２０に続く。すなわち、変換エンジン１１０は、既存のドキュメント１１５を、それらのベクトルに基づいて、入力データ１０５と類似であるサブセットと、入力データ１０５と異なるもう１つのサブセットという２つのサブセットに分割する。

　制御は、その後、変換エンジン１１０が辞書１２０、およびブロック３２０にて予め選択された類似のドキュメントのサブセットにおけるワードの頻度に基づいて、カスタマイズされた辞書１２５を生成するブロック３２５に続く。従って、既存のドキュメント１１５の類似のサブセットにおいて、より頻繁に用いられるワードは、カスタマイズされた辞書１２５において、より高い頻度または重みを有し、既存のドキュメント１１５の類似のサブセットにおいてあまり頻繁に用いられないワードは、カスタマイズされた辞書１２５において、より低い頻度を有する。

　制御は、その後、変換エンジン１１０が入力データ１０５を、カスタマイズされた辞書１２５におけるワードの重み付けされたリストに基づいて、変換されたテキスト１９９に変換するブロック３３０に続く。入力データ１０５における音声表示が、カスタマイズされた辞書１２５における１つ以上のワードにマッピングすると、変換エンジン１１０は、頻度１２８に基づいてワードを選択する。図１の実施例を用いて、変換エンジン１１０は、入力データ１０５内の仮名文字「けいこ」の漢字文字として「けいこ−上司」を選択する。なぜなら、「けいこ−上司」は、カスタマイズされた辞書１２５において「３」の頻度を有し、これは「けいこ−友人」の「１」の頻度よりも大きいからである。

　変換されたテキスト１９９は、将来、変換する際に参照するために用いられるように、ドキュメント１１５に、適宜、追加され得る。

　制御は、その後、機能が戻るブロック３９９に続く。

　図４は、本発明の実施形態をインプリメントするためのシステムのブロック図を示す。

　システム４００は、ネットワーク４９１を介してサーバ４９０と接続されるコンピュータ４１０を含む。１つのコンピュータ４１０、１つのサーバ４９０、および１つのネットワーク４９１が示されるが、他の実施形態において、任意の数のコンピュータ、サーバおよびネットワーク、またはこれらの組み合わせが存在する。別の実施形態において、サーバ４９０およびネットワーク４９１は存在しない。

　コンピュータ４１０は、プロセッサ４３０、格納デバイス４３５、出力デバイス４３７および入力デバイス４３８を備え、これらはすべて、バス４８０を介して接続されている。

　プロセッサ４３０は、ＣＩＳＣ（Ｃｏｍｐｌｅｘ　Ｉｎｓｔｒｕｃｔｉｏｎ　Ｓｅｔ　Ｃｏｍｐｕｔｉｎｇ）、ＲＩＳＣ（Ｒｅｄｕｃｅｄ　Ｉｎｓｔｒｕｃｔｉｏｎ　Ｓｅｔ　Ｃｏｍｐｕｔｉｎｇ）、ＶＬＩＷ（Ｖｅｒｙ　Ｌｏｎｇ　Ｉｎｓｔｒｕｃｔｉｏｎ　Ｗｏｒｄ）、またはハイブリッドアーキテクチャといった任意のタイプのアーキテクチャの中央処理ユニットを表すが、任意の適切なプロセッサが用いられ得る。プロセッサ４３０は、命令を実行し、かつコンピュータ全体の動作を制御するコンピュータ４１０のその部分を含む。図４に示されないが、プロセッサ４３０は、通常、メモリ内のデータおよびプログラムストレージを整理し、かつデータおよび他の情報をコンピュータ４１０の種々の部分間に転送する制御ユニットを含む。プロセッサ４３０は、入力デバイス４３８およびネットワーク４９１から入力データを受信し、コードおよびデータを読み出して、格納デバイス４３５に格納し、データを出力デバイス４３７に提供する。

　コンピュータ４１０は、単一のプロセッサ４３０および単一のバス４８０のみを含むことが示されるが、本発明は、複数のプロセッサを有し得るコンピュータ、およびいくつか、またはすべてが異なった態様の異なった機能を実行する複数のバスを有し得るコンピュータにも同様に適用される。

　格納デバイス４３５は、データを格納するための１つ以上のメカニズムを表す。例えば、格納デバイス４３５は、読み出し専用メモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、磁気ディスク格納媒体、光学式格納媒体、フラッシュメモリデバイス、および／または機器により読み出し可能な他の媒体を含み得る。他の実施形態において、任意の適切なタイプの格納デバイスが用いられ得る。１つの格納デバイス４３５のみが示されるが、複数の格納デバイスおよび複数のタイプの格納デバイスが存在し得る。さらに、コンピュータ４１０は、格納デバイス４３５を含むことが図示されるが、他のコンピュータにわたって、例えば、サーバ４９０上に分散され得る。

　格納デバイス４３５は、入力データ１０５、変換エンジン１１０、辞書１２０、カスタマイズされた辞書１２５、および既存のドキュメント１１５を含む。変換エンジン１１０は、図１、図２および図３を参照してすでに記載されたように、本発明の機能を実行するプロセッサ４３０上で実行されることが可能な命令を含む。別の実施形態において、本発明のいくつかの、またはすべての機能は、プロセッサベースのシステムの代わりにハードウェアを介して実行される。当然、格納デバイス４３５は、さらなるソフトウェアおよびデータ（図示せず）もまた含み得るが、これは、本発明を理解するために必要とされない。

　変換エンジン１１０、辞書１２０、カスタマイズされた辞書１２５および既存のドキュメント１１５は、コンピュータ４１０における格納デバイス４３５内にあることが示されるが、これらのいくつかまたはすべては、例えば、サーバ４９０上等の他のシステムにわたって分散され得、ネットワーク４９１を介してアクセスされ得る。１実施形態において、ユーザは、入力デバイス４３８を介して入力データ１０５を入力するが、別の実施形態において、入力データ１０５は、ネットワーク４９１からといった、代替的ソースから取得され得る。

　出力デバイス４３７は、出力をユーザに表示するコンピュータ４１０の部分である。出力デバイス４３７は、コンピュータハードウェア分野において周知のブラウン管（ＣＲＴ）ベースのビデオディスプレイであり得る。しかしながら、他の実施形態において、出力デバイス４３７は、液晶ディスプレイ（ＬＣＤ）ベース、またはガス、プラズマベース、フラットパネルディスプレイと置き換えられ得る。さらに別の実施形態において、任意の適切なディスプレイデバイスが用いられ得る。さらに別の実施形態において、スピーカが用いられ得る。１つの出力デバイス４３７のみが示されるが、他の実施形態において、異なったタイプまたは同じタイプの任意の数の出力デバイスが存在し得る。別の実施形態において、出力デバイス４３７は存在し得ない。

　入力デバイス４３８は、キーボード、仮名キーボード、マウス、トラックボール、タッチパッド、タッチスクリーン、キーパッド、マイクロホン、音声認識デバイス、またはユーザがコンピュータ４１０にデータを入力するための、任意の他の適切なメカニズムであり得る。１つの入力デバイス４３８のみが示されるが、別の実施形態において、任意の数およびタイプの入力デバイスが存在し得る。

　バス４８０は、例えば、ＰＣＩ、ＩＳＡ（Ｉｎｄｕｓｔｒｙ　Ｓｔａｎｄａｒｄ　Ａｒｃｈｉｔｅｃｔｕｒｅ）、Ｘ−バス、ＥＩＳＡ（Ｅｘｔｅｎｄｅｄ　Ｉｎｄｕｓｔｒｙ　Ｓｔａｎｄａｒｄ　Ａｒｃｈｉｔｅｃｔｕｒｅ）、または任意の他の適切なバスおよび／またはブリッジ（バスコントローラとも呼ばれる）等の１つ以上のバスを表し得る。

　コンピュータ４１０は、パーソナルコンピュータまたは他の電子計算デバイスといった任意の適切なハードウェアおよび／またはソフトウェアを用いてインプリメントされ得る。ポータブルコンピュータ、ラップトップまたはノートブックコンピュータ、ＰＤＡ（Ｐｅｒｓｏｎａｌ　Ｄｉｇｉｔａｌ　Ａｓｓｉｓｔａｎｔｓ）、双方向アルファニューメリックページャー（ｔｗｏ−ｗａｙ　ａｌｐｈａｎｕｍｅｒｉｃ　ｐａｇｅｒ）、キーパッド、携帯電話、ポケットコンピュータ、計算ユニットを有する機器、およびメインフレームコンピュータが、コンピュータ４１０の可能な他の構成の例である。図４に示されるハードウェアおよびソフトウェアは、特定の用途に対して変更され得、示されるものよりも多いかまたは少ない構成要素を含み得る。例えば、オーディオアダプタ等の他の周辺デバイス、または、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ−Ｏｎｌｙ　Ｍｅｍｏｒｙ）プログラミングデバイス等のチッププログラミングデバイスは、上述のハードウェアに追加して、またはその代わりに用いられ得る。

　ネットワーク４９１は、任意の適切なネットワークであり得、コンピュータ４１０と通信するために適切な任意の適切なプロトコルを支援し得る。１実施形態において、ネットワーク４９１は、ワイヤレス通信を支援し得る。別の実施形態において、ネットワーク４９１は、電話線またはケーブル等のハードワイヤド通信を支援する。別の実施形態において、ネットワーク４９１は、イーサネット（Ｒ）ＩＥＥＥ８０２．３ｘ仕様を支援する。別の実施形態において、ネットワーク４９１はインターネットであり、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）を支援する。別の実施形態において、ネットワーク４９１は、構内ネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）である。別の実施形態において、ネットワーク４９１は、ホットスポットサービスプロバイダネットワークである。別の実施形態において、ネットワーク４９１はイントラネットである。別の実施形態において、ネットワーク４９１はＧＰＲＳ（Ｇｅｎｅｒａｌ　Ｐａｃｋｅｔ　Ｒａｄｉｏ　Ｓｅｒｖｉｃｅ）ネットワークである。別の実施形態において、ネットワーク４９１は、任意の適切なセルラーデータネットワークまたはセルベースの無線ネットワーク技術である。別の実施形態において、ネットワーク４９１は、ＩＥＥＥ（Ｉｎｓｔｉｔｕｔｅ　ｏｆ　Ｅｌｅｃｔｒｉｃａｌ　ａｎｄ　Ｅｌｅｃｔｒｏｎｉｃｓ　Ｅｎｇｉｎｅｅｒｓ）８０２．１１Ｂワイヤレスネットワークである。さらに別の実施形態において、ネットワーク４９１は、任意の適切なネットワークまたはネットワークの組み合わせである。１つのネットワーク４９１が示されるが、他の実施形態において任意の数のネットワーク（同じか、または異なったタイプの）が存在し得る。

　すでに詳細に記載されたように、実施形態の局面は、特定の装置、およびコンピュータまたは他の電子デバイス上でインプリメント可能な方法エレメントに関する。別の実施形態において、本発明は、電子デバイスとともに用いるためのプログラム製品としてインプリメントされ得る。この実施形態の機能を定義するプログラムは、種々の信号搬送媒体を介して電子デバイスに送達され得る。このプログラムは、
　（１）例えば、ＣＤ−ＲＯＭドライブによって読み出し可能なＣＤ−ＲＯＭといった電子デバイスに接続されたか、または電子デバイス内の読み出し専用メモリデバイス等の再書込みできない格納媒体に永久的に格納された情報と、
　（２）例えば、ハードディスクドライブまたはディスケット等の再書込み可能格納媒体に格納された変更可能な情報と、
　（３）例えば、ワイヤレス通信を含む、コンピュータネットワークまたは電話ネットワークといった通信媒体によって電子デバイスに伝達される情報と
を含むが、これらに限定されない。

　このような信号搬送媒体は、本発明の機能を指向する、機器により読み出し可能な命令を搬送する場合、本発明の実施形態を表す。

　発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のドキュメントを用いて、類似のドキュメント内に見出されたワードの重み付きリストを含むカスタマイズされた辞書を生成する、テキストに変換する方法、装置、システムおよび信号搬送媒体が提供される。より高い重みが付けられたワードは、入力データにて用いられる確率がより高くなり得、従って、変換されたテキストにおけるワードは、重み付きリストに基づいて選択される。ベクトル空間モデルが、類似のドキュメントを検索するために用いられ得る。

図１は、本発明の実施形態の例示のコンポーネントのブロック図を示す。図２は、本発明の実施形態による、例示のドキュメントおよびこれに関連する例示のベクトルの図形表示を示す。図３は、本発明の実施形態による、例示の処理のフローチャートを示す。図４は、本発明の実施形態をインプリメントする例示のシステムのブロック図を示す。

符号の説明

　１１０　変換エンジン
　２０５　ドキュメント
　２１０　ドキュメント
　２１５　ベクトル
　２２０　ベクトル
　２２５　角度
　４００　システム
　４１０　コンピュータ
　４９０　サーバ
　４９１　ネットワーク

Claims

　入力データと類似である少なくとも１つのドキュメントを見出す工程と、
　該少なくとも１つのドキュメントにおけるワードの頻度を判定する工程と、
　該頻度に基づいて該入力データを変換する工程と
を包含する、方法。
　プロセッサと、
　該プロセッサと接続される格納デバイスとを備えるシステムであって、該格納デバイスは、該プロセッサ上で実行される場合、
　　入力データと類似である少なくとも１つのドキュメントを見出す工程と、
　　該少なくとも１つのドキュメントにおけるワードの頻度を決定する工程と、
　　該頻度に基づいて該入力データを変換する工程と
　を包含する命令を含む、システム。
　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
　前記入力データのベクトルを計算する工程と、
　該複数のドキュメントの複数のベクトルを計算する工程と、
　該入力ベクトルと該複数のベクトルの各々とを比較する工程と、
　該複数のドキュメントの該複数のベクトルへの該入力データの該ベクトルの近接性に基づいて、複数のドキュメントのサブセットを選択する工程と
　を包含する、請求項１および２に記載の方法およびシステム。
　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
　前記入力データの入力ベクトルを計算する工程と、
　前記複数のドキュメントの複数のベクトルを計算する工程と、
　該入力ベクトルと、該複数のベクトルの各々との間の角度を比較する工程と、
　該比較に基づいて該複数のドキュメントのサブセットを選択する工程と
を包含する、請求項１および２に記載の方法およびシステム。
　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
　入力データの入力ベクトルを計算する工程と、
　該複数のドキュメントの複数のベクトルを計算する工程と、
　該入力データの該ベクトルと、該複数のベクトルの各々との間の角度の余弦を計算することによって、該入力ベクトルと、該複数のベクトルの各々とを比較する工程と、
　該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
を包含する、請求項１および２に記載の方法およびシステム。
　前記少なくとも１つのドキュメントにおける前記ワードの頻度に基づいて、カスタマイズされた辞書を生成する工程であって、
　該入力データを変換する工程は、該カスタマイズされた辞書に基づく、工程をさらに包含する、請求項１および２に記載の方法およびシステム。
　前記変換する工程は、
　ワードの重み付けリストを含むカスタマイズされた辞書を前記少なくとも１つのドキュメントから生成する工程と、
　該重み付けリストに基づいて、前記入力データをテキストに変換する工程と
を包含する、請求項１および２に記載の方法およびシステム。
　前記変換する工程は、
　より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てることによって、ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも１つのドキュメントから生成する工程と、
　該重み付きリストに基づいて、該入力データをテキストに変換する工程と
　を包含する、請求項１および２に記載の方法およびシステム。
　前記変換する工程は、
　前記少なくとも１つのドキュメントにおける前記ワードの頻度を計算することによって、ワードの重み付きリストを含むカスタマイズされた辞書を該少なくとも１つのドキュメントから生成する工程と、
　該重み付きリストに基づいて、該入力データをテキストに変換する工程と
を包含する、請求項１および２に記載の方法およびシステム。
　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
　前記入力データのベクトルを計算する工程と、
　該複数のドキュメントの複数のベクトルを計算する工程と、
　前記入力ベクトルと、該複数のベクトルの各々との間のユークリッド距離を決定することによって、該入力ベクトルと該複数のベクトルの各々とを比較する工程と、
　該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
を包含する、請求項１および２に記載の方法およびシステム。
　命令によって復号化される信号搬送媒体であって、該命令は、実行される場合、請求項１および２〜１０の方法を含む、信号搬送媒体。
　前記入力データを供給するマイクロホンをさらに備える、請求項２に記載のシステム。
　前記入力データを供給する仮名キーボードをさらに備える、請求項２に記載のシステム。
　前記プロセッサは、ネットワークから前記入力を受信する、請求項２に記載のシステム。
　前記格納デバイスは、
　辞書と、
　該辞書、および入力データの入力ベクトルと、既存のドキュメントの複数のベクトルとの間の角度に基づいて、カスタマイズされた辞書を生成する変換エンジンと
　をさらに備える、請求項２に記載のシステム。
　前記変換エンジンは、さらに、前記カスタマイズされた辞書に基づいて、前記入力データをテキストに変換する、請求項１５に記載のシステム。
　前記変換エンジンは、さらに、前記カスタマイズされた辞書におけるワードの重み付きリストに基づいて、前記入力データをテキストに変換する、請求項１５に記載のシステム。
　前記変換エンジンは、さらに、前記既存のドキュメントを、角度に基づいて、類似のドキュメントと異なるドキュメントとに分割する、請求項１５に記載のシステム。
　前記変換エンジンは、さらに、前記類似のドキュメントに基づいて、前記カスタマイズされた辞書を生成する、請求項１８に記載のシステム。
　入力データと類似である少なくとも１つのドキュメントを見出すための手段と、
　該少なくとも１つのドキュメントにおけるワードの頻度を判定するための手段と、
　該頻度に基づいて、該入力データを変換するための手段と
を備える、装置。
　前記少なくとも１つのドキュメントは、複数のドキュメントを含み、前記見出すための手段は、
　前記入力データの入力ベクトルを計算するための手段と、
　該複数のドキュメントを、該入力ベクトルに基づいて、該入力データと類似の第１のサブセットおよび該入力データと異なる第２のサブセットに分割するための手段と
　を備える、請求項２０に記載の装置。
　前記分割するための手段は、
　前記複数のドキュメントの複数のベクトルを計算するための手段と、
　前記入力ベクトルと該複数のベクトルとを比較するための手段と
を備える、請求項２１に記載の装置。
　前記比較するための手段は、
　前記入力ベクトルと前記複数のベクトルの各々との間の角度を決定するための手段を備える、請求項２２に記載の装置。
　前記比較するための手段は、前記入力ベクトルと、前記複数のベクトルの各々との間のユークリッド距離を決定するための手段を備える、請求項２２に記載の装置。
　前記変換するための手段は、
　ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも１つのドキュメントから生成するための手段と、
　該重み付きリストに基づいて、前記入力データをテキストに変換するための手段と
を備える、請求項２０に記載の装置。
　前記カスタマイズされた辞書を生成するための手段は、より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てるための手段をさらに備える、請求講２５に記載の装置。
　前記カスタマイズされた辞書を生成する手段は、前記少なくとも１つのドキュメントにおける前記ワードの頻度を計算するための手段をさらに備える、請求項２５に記載の装置。
　前記入力データは発話データを含む、請求項１、２および２０に記載の方法、システムおよび装置。
　前記入力データは表音文字を含む、請求項１、２および２０に記載の方法、システムおよび装置。
　前記入力データは仮名文字を含む、請求項１、２および２０に記載の方法、システムおよび装置。