JP2004070959A - 適応型文脈依存解析 - Google Patents

適応型文脈依存解析 Download PDF

Info

Publication number
JP2004070959A
JP2004070959A JP2003288282A JP2003288282A JP2004070959A JP 2004070959 A JP2004070959 A JP 2004070959A JP 2003288282 A JP2003288282 A JP 2003288282A JP 2003288282 A JP2003288282 A JP 2003288282A JP 2004070959 A JP2004070959 A JP 2004070959A
Authority
JP
Japan
Prior art keywords
input data
document
documents
vectors
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003288282A
Other languages
English (en)
Inventor
Yasuo Kida
キダ ヤスオ
Michi Iwasaki
イワサキ ミチ
Keisuke Hara
ハラ ケイスケ
Takumi Takano
タカノ タクミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Computer Inc filed Critical Apple Computer Inc
Publication of JP2004070959A publication Critical patent/JP2004070959A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 日本語の文字言語は、発音に基づかない漢字と呼ばれる10,000以上の文字を用いる。この多数の文字は、コンピュータへの効率的なテキスト入力に難題を持ち掛ける。
【解決手段】 発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のドキュメントを用いて、類似のドキュメント内に見出されたワードの重み付きリストを含むカスタマイズされた辞書を生成する、テキストに変換する方法、装置、システムおよび信号搬送媒体が提供される。より高い重みが付けられたワードは、入力データにて用いられる確率がより高くなり得、従って、変換されたテキストにおけるワードは、重み付きリストに基づいて選択される。ベクトル空間モデルが、類似のドキュメントを検索するために用いられ得る。
【選択図】 なし

Description

 本特許明細書の開示の一部は、著作権保護の要求がなされる素材を含む。米国特許商標庁ファイルまたは記録に記載されるように、著作権所持者は、特許明細書または特許開示の任意の者による複製に対していかなる異議も有しないが、他のいかなる権利も保護される。
 (分野)
 本発明は、概して、表音文字(phonetic characters)のテキストへの変換に関し、より具体的には、同じ発音であるが異なった表記に変換することに関する。
 (背景)
 日本語の文字言語は、発音に基づかない漢字と呼ばれる10,000以上の文字を用いる。この多数の文字は、コンピュータへの効率的なテキスト入力に難題を持ち掛ける。日本語テキストを入力する一般的な方法は、ユーザが仮名と呼ばれる表音文字でテキストをタイプし、コンピュータが仮名−漢字変換と呼ばれるプロセスを用いてその仮名文字を漢字テキストに変換する。
 仮名−漢字変換は複雑なプロセスである。最近の仮名−漢字変換エンジンは、例えば、形容詞が名詞の前に置かれ得るといった文法的解析、および例えば、「夏」は「高温」を意味し得るが「ピリット辛い」とはおそらく意味しない意味的解析を採用する。仮名−漢字変換は、文字または音声認識と非常に類似の性質を共有する。これには、与えられた入力に対して複数の可能な結果が存在し、変換プロセスが最も確かな出力をユーザに提供するためには可能な結果を分類することを必要とする。出力は、変換エラーと呼ばれる誤った結果になり得る。変換エラーの頻度は、正しく変換されたワードの数を、変換されたワードの総数で除算して計算することによって測定される。変換の精度は、多くの場合、ユーザが仮名−漢字変換エンジンを選択する場合の最も重要なファクタであり、最近の変換エンジンは、96〜97%の変換精度を有する。
 変換エラーの1クラスは、文脈依存クラス(context dependent class)と呼ばれる。文脈依存エラーの例は、同じ発音、従って、同じ仮名表音文字を有するワードであるが、複数の漢字文字は文脈に依存する。例えば、日本語の表音(Phonetic sound)「そうしゃ」は、楽器の「奏者」または「走者」を意味し得る。これらの両方は「そうしゃ」と発音されるが、文字は異なる。ユーザが仮名で<ピアノの「そうしゃ」はマリーであった>とタイプした場合、変換エンジンの意味的解析は、「ピアノ」の「そうしゃ」の文脈であるために、仮名「そうしゃ」が「走者」ではなく「奏者」を意味する漢字文字に変換すべきであることを決定することができる。対照的に、ユーザが仮名で<「そうしゃ」はマリーであった>とタイプした場合、変換エンジンの意味的解析は、「そうしゃ」を解釈するための完全な文脈を有さず、漢字文字を任意に推測しなければならず、不正確になり得る。
 別の一般的な変換エラーは、同一の発音であるが異なった文字であり得る名前について生じる。例えば、一般的な日本の名前「けいこ」は、10通り以上の異なった文字を有し得る。ユーザが、けいこという2人の人を知っており、1人はユーザの友人であり、もう1人はユーザの上司である場合、そのユーザは、両者に対して電子メールを作成することを所望し得、仮名で<こんにちは「けいこ」今週末にスキーに行きましょう>および<「けいこ」、プロジェクトのスケジュールについて話しませんか>とタイプする。ユーザは、変換エンジンが第1の「けいこ」をけいこという友人の名前と関連する漢字文字に変換し、第2の「けいこ」をけいこという名前の上司と関連する漢字文字に変換することを所望する。残念なことに、既存の変換エンジンによって用いられる文法的および意味的解析は、正しい漢字文字を選択することができない。なぜなら、既存の変換エンジンは、1人の「けいこ」はスキーに出かけるが、もう1人の「けいこ」はプロジェクトのスケジュールについて話すことを知らないからである。
 上述の問題は、仮名および漢字という観点で記載されるが、この問題は、書かれた単語が同一の発音または同一の音声表示を有する場合の任意の言語に等しく当てはまる。例えば、英語の書かれた単語「main」および「mane」は、同一の発音を有する。意味的情報は、「main」は管を示し、「mane」は動物の毛を示す場合、言葉による文章「The main was cut」を「The mane was cut」と対比して解析する際には役に立たない。
 変換エンジンの買い手は、変換精度に基づいて購買決定を下すので、より正確な変換を実行する解決策を提供することが極めて重要である。
 (要旨)
 1実施形態において、発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のリストを用いて、類似のドキュメントからのワードの重み付きリストを含むカスタマイズされた辞書を生成するテキストに変換する、方法、装置、システムおよび信号搬送媒体が提供される。より高い重みが付けられたワードは、入力データにて用いられる確率がより高くなり得、従って、変換されたテキストにおけるワードは、重み付きリストに基づいて選択される。1実施形態において、ベクトル空間モデルは、類似のドキュメントを検索するために用いられ得る。
 本発明による方法は、入力データと類似である少なくとも1つのドキュメントを見出す工程と、該少なくとも1つのドキュメントにおけるワードの頻度を判定する工程と、該頻度に基づいて該入力データを変換する工程とを包含し、これにより上記目的を達成する。
 本発明によるシステムは、プロセッサと、該プロセッサと接続される格納デバイスとを備えるシステムであって、該格納デバイスは、該プロセッサ上で実行される場合、入力データと類似である少なくとも1つのドキュメントを見出す工程と、該少なくとも1つのドキュメントにおけるワードの頻度を決定する工程と、該頻度に基づいて該入力データを変換する工程とを包含する命令を含み、これにより上記目的を達成する。
 前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、前記入力データのベクトルを計算する工程と、該複数のドキュメントの複数のベクトルを計算する工程と、該入力ベクトルと該複数のベクトルの各々とを比較する工程と、該複数のドキュメントの該複数のベクトルへの該入力データの該ベクトルの近接性に基づいて、複数のドキュメントのサブセットを選択する工程とを包含してもよい。
 前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、前記入力データの入力ベクトルを計算する工程と、前記複数のドキュメントの複数のベクトルを計算する工程と、該入力ベクトルと、該複数のベクトルの各々との間の角度を比較する工程と、該比較に基づいて該複数のドキュメントのサブセットを選択する工程と
を包含してもよい。
 前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、入力データの入力ベクトルを計算する工程と、該複数のドキュメントの複数のベクトルを計算する工程と、該入力データの該ベクトルと、該複数のベクトルの各々との間の角度の余弦を計算することによって、該入力ベクトルと、該複数のベクトルの各々とを比較する工程と、該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
を包含してもよい。
 前記少なくとも1つのドキュメントにおける前記ワードの頻度に基づいて、カスタマイズされた辞書を生成する工程であって、該入力データを変換する工程は、該カスタマイズされた辞書に基づく、工程をさらに包含してもよい。
 前記変換する工程は、ワードの重み付けリストを含むカスタマイズされた辞書を前記少なくとも1つのドキュメントから生成する工程と、該重み付けリストに基づいて、前記入力データをテキストに変換する工程とを包含してもよい。
 前記変換する工程は、より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てることによって、ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも1つのドキュメントから生成する工程と、該重み付きリストに基づいて、該入力データをテキストに変換する工程とを包含してもよい。
 前記変換する工程は、前記少なくとも1つのドキュメントにおける前記ワードの頻度を計算することによって、ワードの重み付きリストを含むカスタマイズされた辞書を該少なくとも1つのドキュメントから生成する工程と、該重み付きリストに基づいて、該入力データをテキストに変換する工程とを包含してもよい。
 前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、前記入力データのベクトルを計算する工程と、該複数のドキュメントの複数のベクトルを計算する工程と、前記入力ベクトルと、該複数のベクトルの各々との間のユークリッド距離を決定することによって、該入力ベクトルと該複数のベクトルの各々とを比較する工程と、該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
を包含してもよい。
 本発明による信号搬送媒体は、命令によって復号化される信号搬送媒体であって、該命令は、実行される場合、請求項1および2〜10の方法を含み、これにより上記目的を達成する。
 前記入力データを供給するマイクロホンをさらに備えてもよい。
 前記入力データを供給する仮名キーボードをさらに備えてもよい。
 前記プロセッサは、ネットワークから前記入力を受信してもよい。
 前記格納デバイスは、辞書と、該辞書、および入力データの入力ベクトルと、既存のドキュメントの複数のベクトルとの間の角度に基づいて、カスタマイズされた辞書を生成する変換エンジンとをさらに備えてもよい。
 前記変換エンジンは、さらに、前記カスタマイズされた辞書に基づいて、前記入力データをテキストに変換してもよい。
 前記変換エンジンは、さらに、前記カスタマイズされた辞書におけるワードの重み付きリストに基づいて、前記入力データをテキストに変換してもよい。
 前記変換エンジンは、さらに、前記既存のドキュメントを、角度に基づいて、類似のドキュメントと異なるドキュメントとに分割してもよい。
 前記変換エンジンは、さらに、前記類似のドキュメントに基づいて、前記カスタマイズされた辞書を生成してもよい。
 本発明による装置は、入力データと類似である少なくとも1つのドキュメントを見出すための手段と、該少なくとも1つのドキュメントにおけるワードの頻度を判定するための手段と、該頻度に基づいて、該入力データを変換するための手段とを備え、これにより上記目的を達成する。
 前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出すための手段は、前記入力データの入力ベクトルを計算するための手段と、該複数のドキュメントを、該入力ベクトルに基づいて、該入力データと類似の第1のサブセットおよび該入力データと異なる第2のサブセットに分割するための手段とを備え、これにより上記目的を達成する。
 前記分割するための手段は、前記複数のドキュメントの複数のベクトルを計算するための手段と、前記入力ベクトルと該複数のベクトルとを比較するための手段とを備えてもよい。
 前記比較するための手段は、前記入力ベクトルと前記複数のベクトルの各々との間の角度を決定するための手段を備えてもよい。
 前記比較するための手段は、前記入力ベクトルと、前記複数のベクトルの各々との間のユークリッド距離を決定するための手段を備えてもよい。
 前記変換するための手段は、ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも1つのドキュメントから生成するための手段と、該重み付きリストに基づいて、前記入力データをテキストに変換するための手段とを備えてもよい。
 前記カスタマイズされた辞書を生成するための手段は、より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てるための手段をさらに備えてもよい。
 前記カスタマイズされた辞書を生成する手段は、前記少なくとも1つのドキュメントにおける前記ワードの頻度を計算するための手段をさらに備えてもよい。
 前記入力データは発話データを含んでもよい。
 前記入力データは表音文字を含んでもよい。
 前記入力データは仮名文字を含んでもよい。
 発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のドキュメントを用いて、類似のドキュメント内に見出されたワードの重み付きリストを含むカスタマイズされた辞書を生成する、テキストに変換する方法、装置、システムおよび信号搬送媒体を提供することが可能である。
 (詳細な説明)
 本発明の例示的実施形態の以下の詳細な記載において、本明細書の一部をなし、本発明が実行され得る具体的な例示の実施形態が図示されることにより示される添付の図面(ここで、同じ符号は同じ要素を示す)が参照される。これらの実施形態は、当業者が本発明を実行することを可能にするために十分に詳細に記載されるが、他の実施形態が利用され得、論理的、機械的、電気的およびその他の変更が、本発明の範囲から逸脱することなくなされ得る。従って、以下の詳細な記載は、限定的な意味にとられるべきでなく、本発明の範囲は、従属請求項によってのみ定義される。
 以下の記載において、本発明を徹底的な理解を提供するように多数の具体的詳細が示される。しかしながら、本発明は、これらの具体的な詳細なしで実行され得ることが理解される。他の例において、周知の回路、構造および技術は、発明を不明瞭にしないために詳しくは示されない。
 図1は、本発明の実施形態の例示的コンポーネントのブロック図を示す。図示されるのは、入力データ105、変換エンジン110、既存のドキュメント115、辞書120、カスタマイズされた辞書125および変換されたテキスト199である。
 入力データ105は、変換されることをユーザが所望するデータを含む。1実施形態において、入力データ105は、漢字に変換されることをユーザが所望する仮名等の表音文字を含む。別の実施形態において、入力データ105は、音声認識アプリケーションと関連する話される日本語の表記を含む。別の実施形態において、入力データは、話される英語の表記、または音声認識アプリケーションと関連する任意の他の言語を含み、この表記は、普通のワードまたは音声部分が付けられたワード任意の形態であり得る。示された実施例において、入力データ105は、仮名表音文字を表す「けいこ」、「プロジェクト」、「スケジュール」および「ミーティング」を含む。
 変換エンジン110は、入力データ105を読み出し、辞書120、カスタマイズされた辞書125および既存のドキュメント115を用いて変換されたテキスト199に変換する。
図2および図3を参照して以下においてさらに記載されるように、変換エンジン110は、入力データ105を表すベクトルを生成して、このベクトルを用いて、入力データ105と類似であるドキュメントのサブセットについて、既存のドキュメント115を検索する。
 1実施形態において、変換エンジン110は、スタンドアロンアプリケーションであり得る。しかしながら、別の実施形態において、変換エンジン110は、仮名キーボード、または任意の他の入力方法を介して入力された文字の発音表記を漢字文字に変換するユーティリティの一部であり得る。さらに別の実施形態において、変換エンジン110は、口頭発話または口頭発話の表記を文字テキストに変換する音声認識アプリケーションの一部であり得る。変換エンジン110は、日本語に限定されず、任意の適切な言語とともに用いられ得る。
 既存のドキュメント115は、ユーザが前に書き込んだドキュメントを含み得るが、別の実施形態において、既存のドキュメント115は、変換エンジン110に入力するために用いることをユーザが所望するドキュメントの任意のセットを含み得る。示された実施例において、既存のドキュメント115は、ドキュメント130、135、140、145および146を含む。ドキュメント130、135、140および145は、入力データ105と類似または近似であると変換エンジン110が決定したドキュメントである一方で、異なったドキュメント146は、入力データ105と類似でないと変換エンジン110が決定したドキュメントである。変換エンジン110が、類似のドキュメントを異なったドキュメントから分離するために用いる技術は、以下において図2および図3を参照してさらに記載される。
 ドキュメント130は、漢字文字「けいこ−上司」および「スケジュール」を含む。ドキュメント135は、漢字文字「けいこ−上司」、「プロジェクト」および「ミーティング」を含む。ドキュメント140は、漢字文字「けいこ−上司」、「スケジュール」および「ミーティング」を含む。ドキュメント145は、漢字文字「けいこ−友人」、「スキー」および「ミーティング」を含む。「けいこ−上司」を「けいこ−友人」と対比させる使用は、「けいこ」の仮名または音声表示が、「けいこ」という名前の人物と、話す人またはユーザとの関係に依存して、異なった対応漢字文字を有することを表すように意図される。例えば、漢字文字は、けいこがユーザの友人であるか、またはユーザの上司であるかに依存して異なる。
 ドキュメント130、135、140および145は、漢字文字を含むことが図示されるが、別の実施形態において、これらのドキュメントは、任意の言語の文字を含み得る。例えば、複数の言語は、同一の発音および同一の音声表示であるが、異なった表記形態を有するワードを発話プロセッサ(例えば、音声認識アプリケーション)内に含む。
 辞書120は、相対的頻度を有する音声表示およびそれぞれの表記文字のリストと、音声情報の一部(例えば、名詞、動詞、形容詞等)および意味情報(例えば、ピアノというワードは、通常、音楽の文脈で用いられる)を含む。辞書120の内容は、多くの場合、重み付きリストと呼ばれる。なぜなら、このリストは、相対頻度によって重み付けされるからである。1実施形態において、複数の辞書が、その辞書を用いるアプリケーションに基づいて、異なった相対頻度で存在し得る。例えば、いくつかのワードは、普通の会話においてまれに用いられ得るが、これらのワードは、法律または医療アプリケーションにおいて頻繁に用いられ得る。別の実施形態において、辞書120は、より多いか、またはより少ない項目を有し得る。
 カスタマイズされた辞書125は、仮名フィールド126、漢字フィールド127および頻度フィールド128を含む。仮名−漢字変換と関係のない別の実施形態において、仮名フィールド126は、音声表示フィールドと置き換えられ得、漢字フィールドは、テキストフィールドと置き換えられ得る。カスタマイズされた辞書125は、また音声情報の一部、意味情報および他のアプリケーションフィールドをさらに含み得る。
 カスタマイズされた辞書125は、図2および図3を参照して以下にさらに記載されるように、入力データ105と既存のドキュメント115とを比較することによって改変される相対頻度を有する辞書120の重み付きリストを含む。既存のドキュメント115の類似のサブセットにおいてより頻繁に用いられるワードは、カスタマイズされた辞書125においてより高い頻度128を有し、既存のドキュメント115の類似のセットにおいてあまり頻繁に用いられないワードは、カスタマイズされた辞書125において低い頻度128を有する。例えば、「けいこ−上司」は、類似のドキュメント130、135、140および145において3回用いられる。従って、「けいこ−上司」はカスタマイズされた辞書125において「3」の頻度128を有する。「けいこ−友人」は、類似のドキュメント130、135、140および145において1回用いられる。従って、「けいこ−友人」は、カスタマイズされた辞書125において「1」の頻度を有する。
 カスタマイズされた辞書125について示される例は、そのワードが類似の既存のドキュメントにおいて用いられる回数に正確に対応する頻度128の入力を有するが、別の実施形態において、頻度128は、相対的または比例的である。さらに別の実施形態において、頻度128は存在せず、カスタマイズされた辞書125への入力の順序にのみ反映され得る。1実施形態において、「変換の総スコア」は、後述されるように、頻度128に基づく。入力データが2つの可能な結果、すなわち、「B1 B2 B3 B4 B5」および「C1 C2 C3 C4 C5」に変換され得る場合(ここで、B1、B2、B3、B4、B5、C1、C2、C3、C4およびC5の各々は1つのワードである)、変換の総スコアは、f(B1)+f(B2)+f(B3)+f(B4)+f(B5)+cnn(B12)+cnn(B23)+cnn(B34)+cnn(B45)と定義される。
 上述の式において、f(B1)はワードB1の頻度であり、f(B2)はワードB2
の頻度であり、f(B3)はワードB3の頻度であり、f(B4)はワードB4の頻度であり、f(B5)はワードB5の頻度である。上述の等式において、さらに、上述の式において、cnn(B12)は、音声部分B1およびB2がどれだけ頻繁に集まるか、例えば、形容詞および名詞が非常に容易に結びつき得るかということであり、cnn(B23)は、音声部分B2およびB3がどれだけ頻繁に集まるか、cnn(B34)は、音声部分B3およびB4がどれだけ頻繁に集まるかであり、cnn(B45)は、音声部分B4およびB5がどれだけ頻繁に集まるかということである。特定の入力データについて、変換の総スコアを用いると、頻度128だけに基づいてワードを選択するよりも正確な結果をもたらす。
 上述されたように、変換されたテキスト199は、辞書120、カスタマイズされた辞書125、および既存のドキュメント115を用いて、変換エンジン110が入力データ105から生成する目的言語の文字の表示を含む。
 図2は、本発明の実施形態による、例示のドキュメントおよびこれらに関連する例示のベクトルの図形の表示を示す。変換エンジン110は、ベクトル空間モデルと呼ばれる技術を用いて、ドキュメント間の類似性または近似性を比較する。ベクトル空間モデルにおいて、変換エンジン110は、n次元のベクトルを有するドキュメントを表す。これは、ドキュメントからの一意的なワードおよびその一意的なワードが現れる回数を含むデータ構造である。n次元ベクトルの各次元は、一意的なワードの数を表す整数である「n」を有する一意的なワードの1つを表す。
 図2の実施例において、ドキュメント205は、「スケジュール」、「けいこ−上司」および「けいこ−上司」という3つのワードを含み、ドキュメント210は、「けいこ−上司」および「スケジュール」という2つのワードを含む。ドキュメント205およびドキュメント210の両方は、2つの一意的なワードを有し、従って、変換エンジン110は、ドキュメント205およびドキュメント210の両方を2次元ベクトル、すなわちベクトル215およびベクトル220のそれぞれによって表す。ベクトル215および220は、2次元ベクトル空間202において図示される。この空間は、垂直軸上に「けいこ−上司」のドキュメントのインスタンス数を、および水平軸上に「スケジュール」のインスタンス数を有する。図示を容易にするために、2次元ベクトル空間202を生成するための2つの一意的なワードのみを有するドキュメントが示されるが、他の実施形態において、任意の次元および任意のワードが用いられ得る。さらに、ドキュメントは、同じ数または異なった数の一意的ワードを有し得る。
 変換エンジン110は、ドキュメントの類似性または近似性を、それらのベクトル間の角度225を比較することによって比較する。ベクトル間の角度が小さいベクトルは類似である一方で、大きい角度を有するベクトルは異なる。1実施形態において、変換エンジン110は、ベクトル長さ(二乗の和の平方根)の積によって正規化(分解される)された2つのベクトルの内積としての角度225の余弦を計算する。角度の余弦が1である場合、ベクトルは同一である。角度の余弦が0の場合、ベクトルは直交である(ベクトルは、共通のワードを有しない)。別の実施形態において、変換エンジン110は、ユークリッド距離または任意の他の適切な方法を用いてベクトルの類似性を計算する。
 余弦の類似性は、
Figure 2004070959
であり、
 ユークリッド距離は、
Figure 2004070959
であり、ここで、
Figure 2004070959
および
Figure 2004070959
は、比較されるベクトルである。
 一旦変換エンジン110が上述の技術の1つを用いて数を計算すると、変換エンジン110は、計算された数が所定の定数に属するか否かを判定することによって、この数がベクトル間の十分な類似性を示すか否かを判定する。例えば、変換エンジン110は、ベクトルの余弦が0.75よりも大きい場合、ドキュメントが類似であり、余弦が0.75よりも小さいか、または等しい場合、これらのドキュメントが異なることを決定し得る。任意の適切な定数が用いられ得、所定の定数が、変換エンジン110によってセットされるか、またはユーザによって選択され得る。別の実施形態において、変換エンジンは、既存のドキュメント115の数、既存のドキュメント115におけるワードの数、類似であることが所望される既存のドキュメントの比率または数、または任意の他の適切なファクタに基づいて動的に変化する基準を用いる。
 入力データ105は、ドキュメント115からの異なったフォーマットのデータを含むので(例えば、入力データ105は仮名文字を含むが、ドキュメント115は漢字文字を含み、あるいは、入力データ105は口頭発話の表示を含むが、ドキュメント115はテキストを含む)、入力データ105の入力ベクトルは間接的であり、反復プロセスを介して計算かつ比較される。ドキュメント115および入力データ105のベクトルの間接的比較は、「入力されたデータ」と呼ばれるコンセプトを用いる。これは、以下の実施例を参照することによって理解され得る。ここで、最初、入力されたデータは空であり、入力データ105におけるデータの第1の構成要素は「a」である。
 入力されたデータ:(空)
 入力データの次の構成要素:「a」
 入力されたデータがないので、入力データ105およびドキュメント115のベクトルは、まだ比較され得ず、「a」の文脈依存変換は起こり得ず、従って、入力データ105が(例えば、仮名は、漢字に変換されるか、または口頭発話がテキストに変換される)、文脈依存を考慮することなく「A」に変換される。入力データ105におけるデータの次の構成要素は「b」であり、
 入力されたデータ:(A)
 入力データの次の構成要素:「b」
をもたらす。
 「A」は、ここで、入力データ105の現在のベクトルを形成するために用いられ、入力データ105の現在のベクトルとドキュメント115のベクトルとを比較し、かつ「b」を「B」に変換することによって、新しい入力「b」の解析を改善するために用いられる。入力データの次の構成要素は「c」であり、
 入力されたデータ:「A B」
 入力データの次の構成要素:「c」
をもたらす。
 従って、入力データ105の各構成要素が解析されると、入力データ105のベクトルは更新かつ改善される。
 本発明の1実施形態は、ベクトル空間モデルに関して記載されてきたが、別の実施形態において、潜伏性意味的モデルまたは類似のドキュメントを見出すことができる任意の他のモデルが用いられ得る。
 図3は、本発明の実施形態による、例示の処理のフローチャートを示す。制御はブロック300で開始する。制御は、その後、変換エンジン110が入力データ105を受信するブロック305に続く。
 制御は、その後、図2を参照してすでに記載されたように、変換エンジン110が入力データ105のベクトルを間接的に生成するブロック310に続く。
 制御は、その後、図2を参照してすでに記載されたように、変換エンジン110が既存のドキュメント115を見出し、かつそれらのベクトルを計算するブロック315に続く。別の実施形態において、既存のドキュメント115のベクトルは、変換プロセスの性能を改善するために、入力データ105の変換が開始する前に計算される。1実施形態において、既存のドキュメント115のベクトルは圧縮される。
 制御は、その後、図2を参照してすでに記載されたように、変換エンジン110が、既存のドキュメントのベクトルが入力データ105のベクトルにどれだけ近接しているかに基づいて、その既存のドキュメント115のサブセットを選択するブロック320に続く。すなわち、変換エンジン110は、既存のドキュメント115を、それらのベクトルに基づいて、入力データ105と類似であるサブセットと、入力データ105と異なるもう1つのサブセットという2つのサブセットに分割する。
 制御は、その後、変換エンジン110が辞書120、およびブロック320にて予め選択された類似のドキュメントのサブセットにおけるワードの頻度に基づいて、カスタマイズされた辞書125を生成するブロック325に続く。従って、既存のドキュメント115の類似のサブセットにおいて、より頻繁に用いられるワードは、カスタマイズされた辞書125において、より高い頻度または重みを有し、既存のドキュメント115の類似のサブセットにおいてあまり頻繁に用いられないワードは、カスタマイズされた辞書125において、より低い頻度を有する。
 制御は、その後、変換エンジン110が入力データ105を、カスタマイズされた辞書125におけるワードの重み付けされたリストに基づいて、変換されたテキスト199に変換するブロック330に続く。入力データ105における音声表示が、カスタマイズされた辞書125における1つ以上のワードにマッピングすると、変換エンジン110は、頻度128に基づいてワードを選択する。図1の実施例を用いて、変換エンジン110は、入力データ105内の仮名文字「けいこ」の漢字文字として「けいこ−上司」を選択する。なぜなら、「けいこ−上司」は、カスタマイズされた辞書125において「3」の頻度を有し、これは「けいこ−友人」の「1」の頻度よりも大きいからである。
 変換されたテキスト199は、将来、変換する際に参照するために用いられるように、ドキュメント115に、適宜、追加され得る。
 制御は、その後、機能が戻るブロック399に続く。
 図4は、本発明の実施形態をインプリメントするためのシステムのブロック図を示す。
 システム400は、ネットワーク491を介してサーバ490と接続されるコンピュータ410を含む。1つのコンピュータ410、1つのサーバ490、および1つのネットワーク491が示されるが、他の実施形態において、任意の数のコンピュータ、サーバおよびネットワーク、またはこれらの組み合わせが存在する。別の実施形態において、サーバ490およびネットワーク491は存在しない。
 コンピュータ410は、プロセッサ430、格納デバイス435、出力デバイス437および入力デバイス438を備え、これらはすべて、バス480を介して接続されている。
 プロセッサ430は、CISC(Complex Instruction Set Computing)、RISC(Reduced Instruction Set Computing)、VLIW(Very Long Instruction Word)、またはハイブリッドアーキテクチャといった任意のタイプのアーキテクチャの中央処理ユニットを表すが、任意の適切なプロセッサが用いられ得る。プロセッサ430は、命令を実行し、かつコンピュータ全体の動作を制御するコンピュータ410のその部分を含む。図4に示されないが、プロセッサ430は、通常、メモリ内のデータおよびプログラムストレージを整理し、かつデータおよび他の情報をコンピュータ410の種々の部分間に転送する制御ユニットを含む。プロセッサ430は、入力デバイス438およびネットワーク491から入力データを受信し、コードおよびデータを読み出して、格納デバイス435に格納し、データを出力デバイス437に提供する。
 コンピュータ410は、単一のプロセッサ430および単一のバス480のみを含むことが示されるが、本発明は、複数のプロセッサを有し得るコンピュータ、およびいくつか、またはすべてが異なった態様の異なった機能を実行する複数のバスを有し得るコンピュータにも同様に適用される。
 格納デバイス435は、データを格納するための1つ以上のメカニズムを表す。例えば、格納デバイス435は、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク格納媒体、光学式格納媒体、フラッシュメモリデバイス、および/または機器により読み出し可能な他の媒体を含み得る。他の実施形態において、任意の適切なタイプの格納デバイスが用いられ得る。1つの格納デバイス435のみが示されるが、複数の格納デバイスおよび複数のタイプの格納デバイスが存在し得る。さらに、コンピュータ410は、格納デバイス435を含むことが図示されるが、他のコンピュータにわたって、例えば、サーバ490上に分散され得る。
 格納デバイス435は、入力データ105、変換エンジン110、辞書120、カスタマイズされた辞書125、および既存のドキュメント115を含む。変換エンジン110は、図1、図2および図3を参照してすでに記載されたように、本発明の機能を実行するプロセッサ430上で実行されることが可能な命令を含む。別の実施形態において、本発明のいくつかの、またはすべての機能は、プロセッサベースのシステムの代わりにハードウェアを介して実行される。当然、格納デバイス435は、さらなるソフトウェアおよびデータ(図示せず)もまた含み得るが、これは、本発明を理解するために必要とされない。
 変換エンジン110、辞書120、カスタマイズされた辞書125および既存のドキュメント115は、コンピュータ410における格納デバイス435内にあることが示されるが、これらのいくつかまたはすべては、例えば、サーバ490上等の他のシステムにわたって分散され得、ネットワーク491を介してアクセスされ得る。1実施形態において、ユーザは、入力デバイス438を介して入力データ105を入力するが、別の実施形態において、入力データ105は、ネットワーク491からといった、代替的ソースから取得され得る。
 出力デバイス437は、出力をユーザに表示するコンピュータ410の部分である。出力デバイス437は、コンピュータハードウェア分野において周知のブラウン管(CRT)ベースのビデオディスプレイであり得る。しかしながら、他の実施形態において、出力デバイス437は、液晶ディスプレイ(LCD)ベース、またはガス、プラズマベース、フラットパネルディスプレイと置き換えられ得る。さらに別の実施形態において、任意の適切なディスプレイデバイスが用いられ得る。さらに別の実施形態において、スピーカが用いられ得る。1つの出力デバイス437のみが示されるが、他の実施形態において、異なったタイプまたは同じタイプの任意の数の出力デバイスが存在し得る。別の実施形態において、出力デバイス437は存在し得ない。
 入力デバイス438は、キーボード、仮名キーボード、マウス、トラックボール、タッチパッド、タッチスクリーン、キーパッド、マイクロホン、音声認識デバイス、またはユーザがコンピュータ410にデータを入力するための、任意の他の適切なメカニズムであり得る。1つの入力デバイス438のみが示されるが、別の実施形態において、任意の数およびタイプの入力デバイスが存在し得る。
 バス480は、例えば、PCI、ISA(Industry Standard Architecture)、X−バス、EISA(Extended Industry Standard Architecture)、または任意の他の適切なバスおよび/またはブリッジ(バスコントローラとも呼ばれる)等の1つ以上のバスを表し得る。
 コンピュータ410は、パーソナルコンピュータまたは他の電子計算デバイスといった任意の適切なハードウェアおよび/またはソフトウェアを用いてインプリメントされ得る。ポータブルコンピュータ、ラップトップまたはノートブックコンピュータ、PDA(Personal Digital Assistants)、双方向アルファニューメリックページャー(two−way alphanumeric pager)、キーパッド、携帯電話、ポケットコンピュータ、計算ユニットを有する機器、およびメインフレームコンピュータが、コンピュータ410の可能な他の構成の例である。図4に示されるハードウェアおよびソフトウェアは、特定の用途に対して変更され得、示されるものよりも多いかまたは少ない構成要素を含み得る。例えば、オーディオアダプタ等の他の周辺デバイス、または、EPROM(Erasable Programmable Read−Only Memory)プログラミングデバイス等のチッププログラミングデバイスは、上述のハードウェアに追加して、またはその代わりに用いられ得る。
 ネットワーク491は、任意の適切なネットワークであり得、コンピュータ410と通信するために適切な任意の適切なプロトコルを支援し得る。1実施形態において、ネットワーク491は、ワイヤレス通信を支援し得る。別の実施形態において、ネットワーク491は、電話線またはケーブル等のハードワイヤド通信を支援する。別の実施形態において、ネットワーク491は、イーサネット(R)IEEE802.3x仕様を支援する。別の実施形態において、ネットワーク491はインターネットであり、IP(Internet Protocol)を支援する。別の実施形態において、ネットワーク491は、構内ネットワーク(LAN)または広域ネットワーク(WAN)である。別の実施形態において、ネットワーク491は、ホットスポットサービスプロバイダネットワークである。別の実施形態において、ネットワーク491はイントラネットである。別の実施形態において、ネットワーク491はGPRS(General Packet Radio Service)ネットワークである。別の実施形態において、ネットワーク491は、任意の適切なセルラーデータネットワークまたはセルベースの無線ネットワーク技術である。別の実施形態において、ネットワーク491は、IEEE(Institute of Electrical and Electronics Engineers)802.11Bワイヤレスネットワークである。さらに別の実施形態において、ネットワーク491は、任意の適切なネットワークまたはネットワークの組み合わせである。1つのネットワーク491が示されるが、他の実施形態において任意の数のネットワーク(同じか、または異なったタイプの)が存在し得る。
 すでに詳細に記載されたように、実施形態の局面は、特定の装置、およびコンピュータまたは他の電子デバイス上でインプリメント可能な方法エレメントに関する。別の実施形態において、本発明は、電子デバイスとともに用いるためのプログラム製品としてインプリメントされ得る。この実施形態の機能を定義するプログラムは、種々の信号搬送媒体を介して電子デバイスに送達され得る。このプログラムは、
 (1)例えば、CD−ROMドライブによって読み出し可能なCD−ROMといった電子デバイスに接続されたか、または電子デバイス内の読み出し専用メモリデバイス等の再書込みできない格納媒体に永久的に格納された情報と、
 (2)例えば、ハードディスクドライブまたはディスケット等の再書込み可能格納媒体に格納された変更可能な情報と、
 (3)例えば、ワイヤレス通信を含む、コンピュータネットワークまたは電話ネットワークといった通信媒体によって電子デバイスに伝達される情報と
を含むが、これらに限定されない。
 このような信号搬送媒体は、本発明の機能を指向する、機器により読み出し可能な命令を搬送する場合、本発明の実施形態を表す。
 発話または表音文字といった入力データを入力データと類似であるドキュメントを見出すことによって、および類似のドキュメントを用いて、類似のドキュメント内に見出されたワードの重み付きリストを含むカスタマイズされた辞書を生成する、テキストに変換する方法、装置、システムおよび信号搬送媒体が提供される。より高い重みが付けられたワードは、入力データにて用いられる確率がより高くなり得、従って、変換されたテキストにおけるワードは、重み付きリストに基づいて選択される。ベクトル空間モデルが、類似のドキュメントを検索するために用いられ得る。
図1は、本発明の実施形態の例示のコンポーネントのブロック図を示す。 図2は、本発明の実施形態による、例示のドキュメントおよびこれに関連する例示のベクトルの図形表示を示す。 図3は、本発明の実施形態による、例示の処理のフローチャートを示す。 図4は、本発明の実施形態をインプリメントする例示のシステムのブロック図を示す。
符号の説明
 110 変換エンジン
 205 ドキュメント
 210 ドキュメント
 215 ベクトル
 220 ベクトル
 225 角度
 400 システム
 410 コンピュータ
 490 サーバ
 491 ネットワーク

Claims (30)

  1.  入力データと類似である少なくとも1つのドキュメントを見出す工程と、
     該少なくとも1つのドキュメントにおけるワードの頻度を判定する工程と、
     該頻度に基づいて該入力データを変換する工程と
    を包含する、方法。
  2.  プロセッサと、
     該プロセッサと接続される格納デバイスとを備えるシステムであって、該格納デバイスは、該プロセッサ上で実行される場合、
      入力データと類似である少なくとも1つのドキュメントを見出す工程と、
      該少なくとも1つのドキュメントにおけるワードの頻度を決定する工程と、
      該頻度に基づいて該入力データを変換する工程と
     を包含する命令を含む、システム。
  3.  前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
     前記入力データのベクトルを計算する工程と、
     該複数のドキュメントの複数のベクトルを計算する工程と、
     該入力ベクトルと該複数のベクトルの各々とを比較する工程と、
     該複数のドキュメントの該複数のベクトルへの該入力データの該ベクトルの近接性に基づいて、複数のドキュメントのサブセットを選択する工程と
     を包含する、請求項1および2に記載の方法およびシステム。
  4.  前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
     前記入力データの入力ベクトルを計算する工程と、
     前記複数のドキュメントの複数のベクトルを計算する工程と、
     該入力ベクトルと、該複数のベクトルの各々との間の角度を比較する工程と、
     該比較に基づいて該複数のドキュメントのサブセットを選択する工程と
    を包含する、請求項1および2に記載の方法およびシステム。
  5.  前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
     入力データの入力ベクトルを計算する工程と、
     該複数のドキュメントの複数のベクトルを計算する工程と、
     該入力データの該ベクトルと、該複数のベクトルの各々との間の角度の余弦を計算することによって、該入力ベクトルと、該複数のベクトルの各々とを比較する工程と、
     該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
    を包含する、請求項1および2に記載の方法およびシステム。
  6.  前記少なくとも1つのドキュメントにおける前記ワードの頻度に基づいて、カスタマイズされた辞書を生成する工程であって、
     該入力データを変換する工程は、該カスタマイズされた辞書に基づく、工程をさらに包含する、請求項1および2に記載の方法およびシステム。
  7.  前記変換する工程は、
     ワードの重み付けリストを含むカスタマイズされた辞書を前記少なくとも1つのドキュメントから生成する工程と、
     該重み付けリストに基づいて、前記入力データをテキストに変換する工程と
    を包含する、請求項1および2に記載の方法およびシステム。
  8.  前記変換する工程は、
     より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てることによって、ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも1つのドキュメントから生成する工程と、
     該重み付きリストに基づいて、該入力データをテキストに変換する工程と
     を包含する、請求項1および2に記載の方法およびシステム。
  9.  前記変換する工程は、
     前記少なくとも1つのドキュメントにおける前記ワードの頻度を計算することによって、ワードの重み付きリストを含むカスタマイズされた辞書を該少なくとも1つのドキュメントから生成する工程と、
     該重み付きリストに基づいて、該入力データをテキストに変換する工程と
    を包含する、請求項1および2に記載の方法およびシステム。
  10.  前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出す工程は、
     前記入力データのベクトルを計算する工程と、
     該複数のドキュメントの複数のベクトルを計算する工程と、
     前記入力ベクトルと、該複数のベクトルの各々との間のユークリッド距離を決定することによって、該入力ベクトルと該複数のベクトルの各々とを比較する工程と、
     該比較に基づいて、該複数のドキュメントのサブセットを選択する工程と
    を包含する、請求項1および2に記載の方法およびシステム。
  11.  命令によって復号化される信号搬送媒体であって、該命令は、実行される場合、請求項1および2〜10の方法を含む、信号搬送媒体。
  12.  前記入力データを供給するマイクロホンをさらに備える、請求項2に記載のシステム。
  13.  前記入力データを供給する仮名キーボードをさらに備える、請求項2に記載のシステム。
  14.  前記プロセッサは、ネットワークから前記入力を受信する、請求項2に記載のシステム。
  15.  前記格納デバイスは、
     辞書と、
     該辞書、および入力データの入力ベクトルと、既存のドキュメントの複数のベクトルとの間の角度に基づいて、カスタマイズされた辞書を生成する変換エンジンと
     をさらに備える、請求項2に記載のシステム。
  16.  前記変換エンジンは、さらに、前記カスタマイズされた辞書に基づいて、前記入力データをテキストに変換する、請求項15に記載のシステム。
  17.  前記変換エンジンは、さらに、前記カスタマイズされた辞書におけるワードの重み付きリストに基づいて、前記入力データをテキストに変換する、請求項15に記載のシステム。
  18.  前記変換エンジンは、さらに、前記既存のドキュメントを、角度に基づいて、類似のドキュメントと異なるドキュメントとに分割する、請求項15に記載のシステム。
  19.  前記変換エンジンは、さらに、前記類似のドキュメントに基づいて、前記カスタマイズされた辞書を生成する、請求項18に記載のシステム。
  20.  入力データと類似である少なくとも1つのドキュメントを見出すための手段と、
     該少なくとも1つのドキュメントにおけるワードの頻度を判定するための手段と、
     該頻度に基づいて、該入力データを変換するための手段と
    を備える、装置。
  21.  前記少なくとも1つのドキュメントは、複数のドキュメントを含み、前記見出すための手段は、
     前記入力データの入力ベクトルを計算するための手段と、
     該複数のドキュメントを、該入力ベクトルに基づいて、該入力データと類似の第1のサブセットおよび該入力データと異なる第2のサブセットに分割するための手段と
     を備える、請求項20に記載の装置。
  22.  前記分割するための手段は、
     前記複数のドキュメントの複数のベクトルを計算するための手段と、
     前記入力ベクトルと該複数のベクトルとを比較するための手段と
    を備える、請求項21に記載の装置。
  23.  前記比較するための手段は、
     前記入力ベクトルと前記複数のベクトルの各々との間の角度を決定するための手段を備える、請求項22に記載の装置。
  24.  前記比較するための手段は、前記入力ベクトルと、前記複数のベクトルの各々との間のユークリッド距離を決定するための手段を備える、請求項22に記載の装置。
  25.  前記変換するための手段は、
     ワードの重み付きリストを含むカスタマイズされた辞書を前記少なくとも1つのドキュメントから生成するための手段と、
     該重み付きリストに基づいて、前記入力データをテキストに変換するための手段と
    を備える、請求項20に記載の装置。
  26.  前記カスタマイズされた辞書を生成するための手段は、より高い重みを、前記入力データにおいて用いられる確率がより高い前記重み付きリストにおけるワードに割り当てるための手段をさらに備える、請求講25に記載の装置。
  27.  前記カスタマイズされた辞書を生成する手段は、前記少なくとも1つのドキュメントにおける前記ワードの頻度を計算するための手段をさらに備える、請求項25に記載の装置。
  28.  前記入力データは発話データを含む、請求項1、2および20に記載の方法、システムおよび装置。
  29.  前記入力データは表音文字を含む、請求項1、2および20に記載の方法、システムおよび装置。
  30.  前記入力データは仮名文字を含む、請求項1、2および20に記載の方法、システムおよび装置。
JP2003288282A 2002-08-06 2003-08-06 適応型文脈依存解析 Pending JP2004070959A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/213,925 US7548863B2 (en) 2002-08-06 2002-08-06 Adaptive context sensitive analysis

Publications (1)

Publication Number Publication Date
JP2004070959A true JP2004070959A (ja) 2004-03-04

Family

ID=31494562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003288282A Pending JP2004070959A (ja) 2002-08-06 2003-08-06 適応型文脈依存解析

Country Status (4)

Country Link
US (1) US7548863B2 (ja)
JP (1) JP2004070959A (ja)
CN (1) CN1495641B (ja)
TW (1) TWI242181B (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2493443C (en) 2002-07-23 2011-07-19 Research In Motion Limited Systems and methods of building and using custom word lists
US7536293B2 (en) * 2003-02-24 2009-05-19 Microsoft Corporation Methods and systems for language translation
JP2005202766A (ja) * 2004-01-16 2005-07-28 National Institute Of Information & Communication Technology 類似コンテンツの同時提示システム
EP1605371A1 (en) 2004-06-12 2005-12-14 Getty Images, Inc. Content search in complex language, such as japanese
WO2005124599A2 (en) * 2004-06-12 2005-12-29 Getty Images, Inc. Content search in complex language, such as japanese
US20050283724A1 (en) * 2004-06-18 2005-12-22 Research In Motion Limited Predictive text dictionary population
US7207004B1 (en) * 2004-07-23 2007-04-17 Harrity Paul A Correction of misspelled words
CN101512518B (zh) * 2006-09-07 2015-06-24 日本电气株式会社 自然语言处理系统和词典登录系统
US7752534B2 (en) * 2006-09-19 2010-07-06 International Business Machines Corporation Method and apparatus for customizing the display of multidimensional data
JP5233989B2 (ja) * 2007-03-14 2013-07-10 日本電気株式会社 音声認識システム、音声認識方法、および音声認識処理プログラム
JP5026192B2 (ja) * 2007-08-20 2012-09-12 株式会社リコー ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
EP2299440B1 (en) * 2009-09-11 2012-10-31 Vodafone Holding GmbH Method and Device for automatic recognition of given keywords and/or terms within voice data
US8838453B2 (en) * 2010-08-31 2014-09-16 Red Hat, Inc. Interactive input method
US9330083B2 (en) * 2012-02-14 2016-05-03 Facebook, Inc. Creating customized user dictionary
US9330082B2 (en) * 2012-02-14 2016-05-03 Facebook, Inc. User experience with customized user dictionary
JP5324677B2 (ja) * 2012-02-24 2013-10-23 株式会社日立製作所 類似文書検索支援装置及び類似文書検索支援プログラム
US20150227505A1 (en) * 2012-08-27 2015-08-13 Hitachi, Ltd. Word meaning relationship extraction device
TWI508057B (zh) * 2013-07-15 2015-11-11 Chunghwa Picture Tubes Ltd 語音辨識系統以及方法
CN105404401A (zh) 2015-11-23 2016-03-16 小米科技有限责任公司 输入处理方法、装置及设备
CN107292396B (zh) * 2017-08-14 2020-05-05 南宁学院 一种水电设备报修消息处理方法
US11663414B2 (en) * 2018-02-20 2023-05-30 Fluence Bioengineering, Inc. Controlled agricultural systems and methods of managing agricultural systems

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5270927A (en) * 1990-09-10 1993-12-14 At&T Bell Laboratories Method for conversion of phonetic Chinese to character Chinese
US5325298A (en) * 1990-11-07 1994-06-28 Hnc, Inc. Methods for generating or revising context vectors for a plurality of word stems
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
DE19610848A1 (de) * 1996-03-19 1997-09-25 Siemens Ag Rechnereinheit zur Spracherkennung und Verfahren zur rechnergestützten Abbildung eines digitalisierten Sprachsignals auf Phoneme
US6298174B1 (en) * 1996-08-12 2001-10-02 Battelle Memorial Institute Three-dimensional display of document set
JPH1145241A (ja) 1997-07-28 1999-02-16 Just Syst Corp かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6490563B2 (en) * 1998-08-17 2002-12-03 Microsoft Corporation Proofreading with text to speech feedback
US6360227B1 (en) * 1999-01-29 2002-03-19 International Business Machines Corporation System and method for generating taxonomies with applications to content-based recommendations
JP2002539528A (ja) * 1999-03-05 2002-11-19 キヤノン株式会社 データベース注釈付け及び検索
US6836760B1 (en) * 2000-09-29 2004-12-28 Apple Computer, Inc. Use of semantic inference and context-free grammar with speech recognition system
US7155668B2 (en) * 2001-04-19 2006-12-26 International Business Machines Corporation Method and system for identifying relationships between text documents and structured variables pertaining to the text documents
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US6877001B2 (en) * 2002-04-25 2005-04-05 Mitsubishi Electric Research Laboratories, Inc. Method and system for retrieving documents with spoken queries

Also Published As

Publication number Publication date
CN1495641B (zh) 2013-10-30
TW200415573A (en) 2004-08-16
CN1495641A (zh) 2004-05-12
US20040030543A1 (en) 2004-02-12
TWI242181B (en) 2005-10-21
US7548863B2 (en) 2009-06-16

Similar Documents

Publication Publication Date Title
JP2004070959A (ja) 適応型文脈依存解析
JP6820058B2 (ja) 音声認識方法、装置、デバイス、及び記憶媒体
CN109313896B (zh) 可扩展的动态类语言建模方法、用于生成话语转录的系统、计算机可读介质
JP3962763B2 (ja) 対話支援装置
JP3272288B2 (ja) 機械翻訳装置および機械翻訳方法
US20190220486A1 (en) Method and apparatus for mining general tag, server, and medium
US7630880B2 (en) Japanese virtual dictionary
US20200082808A1 (en) Speech recognition error correction method and apparatus
JP2021524079A (ja) 自然言語分類のための訓練データの拡張
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
WO2012095696A2 (en) Text segmentation with multiple granularity levels
JP2010531492A (ja) ワード確率決定
KR20100035921A (ko) 주제 탐지 장치와 주제 탐지 방법, 저장 매체, 정보 제공 시스템, 서비스 서버 및 방법
CN108986820B (zh) 用于语音翻译的方法、装置、电子设备和存储介质
US20210035569A1 (en) Dynamic interpolation for hybrid language models
JP2009163358A (ja) 情報処理装置、情報処理方法、プログラムおよび音声チャットシステム
JP2006107353A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4576977B2 (ja) 情報処理装置および方法、並びにプログラム
JP6805927B2 (ja) インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法
JPWO2009041220A1 (ja) 略語生成装置およびプログラム、並びに、略語生成方法
JP7435740B2 (ja) 音声認識装置、制御方法、及びプログラム
Lee N-Gram Language Model
WO2022029848A1 (ja) 判定装置、判定方法、および、判定プログラム
CN112346696B (zh) 虚拟助理的语音比较
JP2005122515A (ja) 電子機器装置、テキスト間の類似度計算方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071219

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071225

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071225

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080319

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080325

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080421

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080424

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080519

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080619

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090615

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091202

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091210

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111025

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111028