JP4282769B2 - テキストの意味論的表現を利用した情報の検索 - Google Patents
テキストの意味論的表現を利用した情報の検索 Download PDFInfo
- Publication number
- JP4282769B2 JP4282769B2 JP53853998A JP53853998A JP4282769B2 JP 4282769 B2 JP4282769 B2 JP 4282769B2 JP 53853998 A JP53853998 A JP 53853998A JP 53853998 A JP53853998 A JP 53853998A JP 4282769 B2 JP4282769 B2 JP 4282769B2
- Authority
- JP
- Japan
- Prior art keywords
- words
- text
- passage
- meaning
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Description
本発明は情報検索の分野に関し、特に情報検索のトークン化の分野に関する。
発明の背景
情報検索とは照会または照会文書中に目標文書語が出現するとそれを識別するプロセスのことである。情報検索は明示的なユーザー探索照会の処理、特定の文書に関連する文書の特定、2つの文書の類似性の判定、文書の特徴の抽出、および文書の要約を含む、幾つかの状況に適用して好結果を得ることができる。
情報検索には標準的には2段階のプロセスが含まれている。すなわち(1)索引作成段階では文書は先ず(a)文書中の各々の語を“トークン”と呼ばれる情報検索エンジンか理解でき、これによって区別されることができる一連の文字へと変換するプロセス(文書の“トークン化(tokenizing)”として知られている)、および(b)各々のトークンからトークンが出現した文書中の箇所への索引図を作成するプロセスと、(2)照会段階では、照会(または照会文書)が同様にトークン化され、かつ索引と比較されて、トークン化された照会でトークンが出現する文書中の箇所を特定するプロセスである。
図1は情報検索プロセスを示した概略的なデータの流れ図である。索引作成段階では、目標文書111がトークナイザ112へと提出される。目標文書は文章のような多数のストリングからなっており、その各々は目標文書の特定箇所に出現する。目標文書中のストリングとそれらの語の箇所がトークナイザ120に送られ、このトークナイザによって各ストリング中の語は情報検索エンジン130が理解でき、これによって識別可能な一連のトークンへと変換される。情報検索エンジン130の索引構成部131がトークンとその箇所を索引140に追加する。索引は各々の一意的なトークンをそれが目標文書中で出現した箇所へとマッピングする。必要ならば、多数の異なる目標文書を索引に加えるために、このプロセスを繰り返してもよい。このように索引140が多数の目標文書中のテキストを表す場合、箇所情報には好適には各々の箇所ごとに、この箇所に対応する文書の表示が含まれている。
照会段階では、テキスト照会112がトークナイザ120に提出される。この照会は単一のストリングでも文章でもよく、または文書全体が多数のストリングから構成されていてもよい。トークナイザ120は照会テキストト112中の語を、目標文書をトークンに変換したと同じ態様でトークンに変換する。トークナイザ120はこれらのトークンを情報検索エンジン130の索引検索部132へと送る。情報検索エンジンの索引検索部は索引140を探索して目標文書中にトークンが出現しているかどうかを検索する。情報検索エンジンの情報検索部は、各々のトークン毎に目標文書中のトークンが出現した箇所を特定する。このような箇所のリストが照会結果113として戻される。
従来形のトークナイザには標準的には、各々の大文字の小文字への変更、入力されたテキスト中の個々の語の識別、および語から接尾語を削除すること等のような入力されたテキストの外面的な変換が含まれている。例えば、従来形のトークナイザは下記のような入力されたテキスト・ストリング、父親が赤ちゃんを抱いている。(The father is holding the baby.)を下記のトークンへと変換するであろう。
the
father
is
hold
the
baby
このようなトークン化の方法はこれに基づいて、語の意味が照会テキスト中で意図した意味とは異なるような語の出現(occurrence)を過剰に含める探索を行う傾向がある。例えば、サンプルで入力されたテキスト・ストリングは“抱く(hold)”という動詞を、“支える、または抱きしめる”という意味で用いている。しかし、“hold”というトークンは“船舶の積荷領域”を意味する“hold”という語の用例と適合することがある。このトークン化の方法は更に、語が互いに照会テキスト中の語とは互いに異なる関係にある語の出現を過剰に含める傾向がある。
例えば、“父親”(father)が“抱く(held)”の主語であり、“赤ちゃん(baby)”が目的語である上記の入力されたテキスト・ストリングのサンプルは、“赤ちゃん”が主語で目的語ではない“父親と赤ちゃんが玩具を握っていた。”(The father and the baby held the toy.)と適合することがある。この方法は更に、照会テキストの代わりに、異なってはいるが意味的に関連する語を使用するテキスト・ストリングの出現を見落とすことがある。例えば、上記の入力されたテキスト・ストリングは“両親が赤ちゃんを抱いている”というテキスト・ストリングとは適合しないであろう。従来形のトークン化の上記のような欠点を考慮すると、トークン化されたテキスト中で明示されている意味的な関係をエンコードするトークナイザには重要なユーティリティがあるであろう。
発明の大要
本発明は入力されたテキストを分解して論理形式を特定し、次に上位語(hypernym)を用いて論理形式を拡張する改良形のトークナイザを使用して情報検索を実施することを指向している。本発明を従来形の情報検索の索引構造および照会と組合わせて利用すれば、異なる意味を意図し、かつ語が互いに異なる関係を有している、識別されるテキスト・ストリングの出現数が減少し、かつ異なってはいるが意味的に関連する用語が用いられている、識別されるテキスト・ストリングの出現数が増加する。
本発明は索引付きテキストと照会テキストの双方を分解してこの入力されたテキストの字句的、統語的、および意味論的な解析を行うことによって従来形のトークン化に伴う問題点を克服するものである。この分解プロセスは照会テキスト中の主要な役割を果たす語とその意図された意味とを識別し、かつこれらの語の相互関係を識別する1つ、または複数の論理形式を作成する。パーザは好適には入力されたテキストの深い(実際の)主語、動詞および深い(実際の)目的語に関連する論理形式を作成する。例えば、入力されたテキストが“父親が赤ちゃんを抱いている。”である場合、パーザは下記のような論理形式を作成する。
パーザは更に、これらの語に前記入力されたテキストで用いられている特定の意味を付与する。
ある語の特定の意味について、語の意味にとって総称的な用語(“上位語”)である他の語の意味を特定するディジタル辞書または類語辞典(“言語知識ベース”としても知られている)を用いて、本発明はパーザによって作成された論理形式に含まれる語をその上位語に変更して、これらのオリジナルの論理形式の意味に対して上位概念である全体的な意味を有する追加の論理形式を作成する。例えば、“両親”(parent)の意味が“父親”に付与された意味の上位語であり、“触れる”(touch″)の意味が“抱く”に付与された意味の上位語であり、“子供”(child)の意味と“人”(person)の意味が“赤ちゃん”に付与された意味の上位語であるという辞書の表示に基づいて、本発明は下記のように追加の論理形式を作成する。
次に本発明は、生成された全ての論理形式を情報検索システムが理解できるトークンへと変換し、この情報検索システムがトークン化された照会を索引と比較し、これらのトークンを情報検索システムに提出する。
【図面の簡単な説明】
図1は情報検索プロセスを示す概略的なデータの流れ図である。
図2はそれによって機構が好適に機能する汎用コンピュータ・システムの高レベルのブロック図である。
図3は目標文書を意味論的に表す索引を構成し、これにアクセスするために機構が好適に実施するステップを示す概略的な流れ図である。
図4は入力された文章用のトークンを生成するために機構が利用するトークン化ルーチンを示す流れ図である。
図5は簡単な論理形式を示す論理形式図である。
図6は機構がそのために図5に示した論理形式を構成する、入力されたテキスト断片を示す入力テキスト図である。
図7Aは言語知識ベースによって識別される総称的関係のサンプルを示す言語知識ベース図である。
図7Bは一次論理形式の深い主語の上位語の選択、男(意味2)を示す言語知識ベース図である。
図8は一次論理形式の深い動詞の上位語の選択、キス(意味1)を示す言語知識ベース図である。
図9および図10は一次論理形式の深い目的語の上位語の選択、子豚(意味2)を示す言語知識ベース図である。
図11は拡張された論理形式を示す論理形式図である。
図12は拡張された一次論理形式を置換することによって作成された派生的論理形式を示す図表である。
図13は索引のサンプル内容を示す索引図である。
図14は“男が馬にキスしている。”という照会に関して機構が好適に構成する論理形式を示す論理形式図である。
図15は上位語を用いた一次論理形式の拡張を示している。
図16は照会論理形式の深い目的語の総称の選択、馬(意味1)を示す言語知識ベース図である。
図17は深い主語と動詞だけを含む部分的照会に対応する部分的論理形式を示す部分論理形式図である。
図18は動詞と深い目的語だけを含む部分的照会に対応する部分的論理形式を示す部分論理形式図である。
発明の詳細な説明
本発明はテキストの意味論的な表現を用いた情報検索を行うことを指向している。従来形の情報検索のための索引構造および照会と組合わせて利用すれば、本発明によって、異なる意味を意図し、かつ語が互いに異なる関係を有している、識別されるテキスト・ストリングの出現数が減少し、かつ異なってはいるが意味論的に関連する用語が用いられている、識別されるテキスト・ストリングの出現数が増加する。
好適な実施例では、図1に示した従来形のトークナイザの代わりに改良形の情報検索トークン化機構(“機構”)が使用され、これは入力されたテキストを分解して論理形式を識別し、次に上位語を用いて論理形式を拡張する。本発明は索引付きテキストと照会テキストの双方を分解してこの入力されたテキストの字句的、統語的、および意味論的な解析を行うことによって従来形のトークン化に伴う問題点を克服するものである。この分解プロセスは照会テキスト中の主要な役割を果たす語とその意図された意味とを識別し、かつこれらの語の相互関係を識別する1つ、または複数の論理形式を作成する。パーザは好適には入力されたテキストの深い主語、動詞および深い目的語に関連する論理形式を作成する。例えば、入力されたテキストが“父親が赤ちゃんを抱いている。”である場合、バーザは深い主語が“父親”であり、動詞が“抱く”であり、深い目的語が“赤ちゃん”であることを示す論理形式を作成する。入力されたテキストを論理形式へと変換することによって、修飾語が削除され、かつ時制と態(能動、受動)の差が無視されることで入力されたテキストはその根底的な意味へと抽出されるので、入力されたテキスト・セグメントを論理形式に変換することによって、同じ概念を表現するために自然語で用いられることがある多くの異なる表現方法が統一される傾向がある。
ある語の特定の意味について、語の意味にとって総称的な用語(“上位語”)である他の語の意味を特定するディジタル辞書または類語辞典(“言語知識ベース”としても知られている)を用いて、本発明はパーザによって作成された論理形式に含まれる語をその上位語に変更して、これらのオリジナルの論理形式の意味に対して上位概念である全体的な意味を有する追加の論理形式を作成する。次に本発明は、生成された全ての論理形式を情報検索システムが理解できるトークンへと変換し、この情報検索システムがトークン化された照会を索引と比較し、これらのトークンを情報検索システムに提出する。
図2はそれによって機構が好適に機能する汎用コンピュータ・システムの高レベルのブロック図である。コンピュータ・システム200は中央処理装置(CPU)210と、入力/出力装置220と、コンピュータ記憶装置(メモリ)230とを含んでいる。入力/出力装置の間にはハードディスク駆動装置のような記憶装置211が配置されている。入力/出力装置は更にコンピュータによる読出し可能な媒体駆動装置222を含んでおり、これを用いてCD−ROMのようなコンピュータによる読出し可能な媒体に備えられている機構を含むソフトウェア製品を据えつけることができる。入力/出力装置は更に、コンピュータ・システム200がインターネットを介して他のコンピュータ・システムと通信できるようにするインターネット接続223をも含んでいる。好適には機構240からなるコンピュータ・プログラムはメモリ230内に備えられ、CPU210上で実行する。機構240は更に、論理形式の語に意味番号を付与するためにパーザによって利用される言語知識ベース242を含んでいる。この機構は更に、言語知識ベースを利用して生成された論理形式の語の上位語を識別する。好適にはメモリ230は更に目標文書から生成されたトークンから目標文書中の箇所へとマッピングするための索引250を含んでいる。メモリ230は更に索引250中の目標文書から生成されたトークンを記憶し、かつ照会から生成されたトークンと適合するトークンを索引から識別するための情報検索エンジン(“IRエンジン”)260をも含んでいる。前記機構は上記のように構成されたコンピュータ・システムで好適に実施されるが、異なる構造のコンピュータ・システムでも実施できることが当業者には理解されよう。
図3は目標文書を意味的に表す索引を構成し、かつこれにアクセスするために前記機構によって好適に実行されるステップの概略的な流れ図である。簡略に述べると、この機構は先ず目標文書の各々の文章(単数または複数)を、同じ意味の上位語を含む文章中の重要語の相互の関係を示す拡張された論理形式を表す多数のトークンへと変換することによって、目標文書の意味的な索引を作成する。
機構は文章が出現する目標文書中の箇所と共にこれらの“意味的トークン”を索引中に記憶する。全ての目標文書の索引作成が完了した後、機構は索引に対する情報検索の照会を処理することができる。受理されたこのような照会の各々について、機構は、それが目標文書から文章をトークン化したと同様に、すなわち照会テキスト用の拡張された論理形式を共に表す意味的なトークンへと文章を変換することによって、照会のテキストをトークン化する。次に機構はこれらの意味的なトークンを索引中に記憶された意味論的なトークンと比較して、これらの意味論的なトークンが記憶れている目標文書の箇所を特定し、かつ照会との関連性を特定するためにこれらの意味論的なトークンを含む目標文書をランク付けする。この機構は好適には新たな目標文書のための意味論的なトークンを随時含めるように索引を更新する。
図3を参照すると、ステップ301−304で、この機構は目標文書中の各文章を巡回する。ステップ302で、本機構は図4に示したように文章をトークン化するルーチンを呼び出す。
図4は入力された文章またはその他の入力されたテキスト・セグメントのためのトークンを生成するために本機構が利用するトークン化ルーチンを示した流れ図である。ステップ401で、本機構は入力されたテキスト・セグメントから一次論理形式を構成する。前述したように、論理形式は文章または文章の断片の根底的な意味を表すものである。論理形式は入力されたテキスト・セグメントがパーザ241(図2)によって語句的、および意味論的に分解されることによって作成される。入力されたテキスト・ストリングを表す論理形式の構造に関する詳細な説明は、本明細書に参考文献として引用されている米国特許出願第08/674,610号を参照されたい。
本機構によって利用される論理形式は好適には文章の主要な動詞と、動詞の実際の主語(“深い主語”)である名詞と、動詞の実際の目的語(“深い目的語”)である名詞とを分離する。図5は一次論理形式のサンプルを示す論理形式図である。論理形式は3つの要素を有している。すなわち、深い主語の要素510と、動詞の要素520と、深い目的語の要素530である。論理形式の深い主語は“男”という語の意味2であることが判る。1つ以上の意味を有する語の場合の意味番号は、パーザが利用する言語知識ベースによって定義されたとおりに語に付与された特定の意味を示すものである。例えば、“man”という語は人を表す第1の意味と、大人の弾性を意味する第2の意味を有することができよう。
論理形式の動詞は“kiss”という語の第1の意味である。最後に、深い目的語は“pig”という語の第2の意味である。この論理形式の短縮バージョンはその第1の要素として深い主語を有し、第2の要素として動詞を有し、かつ第3の要素として深い目的語を有する順序付けされた3つの語である。
(man,kiss,pig)
図5に示した論理形式は多数の異なる文章と文章の断片を特徴付けるものである。例えば、図6は本機構がそのために図5に示した論理形式を構成する入力されたテキストを示す入力テキスト図である。図6は入力された文章の断片“mankissing a pig(子豚にキスしている男)”を示している。この語句は文書5の語番号150で出現し、語の位置150、151、152、および153を占めていることが判る。本機構がこの入力テキストの断片をトークン化すると、図5に示した論理形式が生成される。本機構は更に、入力された下記のテキスト・セグメントについても図5に示した論理形式を生成する。
The pig was kissed by an unusual man.(子豚が異常な男にキスされた。)
The man will kiss the largest pig.(男が一番大きい子豚にキスするつもりだ。)
Many pigs have been kissed by that man.(これまで多くの子豚がその男によってキスされた。)
前述したように、入力されたテキストを論理形式へと変換することによって、修飾語が削除され、かつ時制と態の差が無視されることで入力されたテキストはその根底的な意味へと抽出されるので、入力されたテキスト・セグメントを論理形式に変換することによって、同じ概念を表現するために自然語で用いられることがある多くの異なる表現方法が統一される傾向がある。
図4に戻ると、本機構が入力されたテキストから図5に示した論理形式のような一次論理形式を構成した後、機構はステップ402を継続して上位語を用いてこの一次論理形式を拡張する。ステップ402の後、トークン化ルーチンに戻る。
前述したように、上位語は特定の語と“is a”(・・である)の関係を持っている属の語である。例えば、“車両”という語は“自動車”の上位語である。本機構は好適には言語知識ベースを用いて一次論理形式の語の上位語を識別する。このような言語知識ベースは標準的には語の上位語を識別する意味論的なリンクを含んでいる。
図7Aは言語知識ベースによって識別される上位語の関係のサンプルを示す言語知識ベース図である。図7Aは、それ以降の言語知識ベースと同様に、説明を容易にするために簡略化されており、本明細書の説明には直接関連がなる言語知識ベースに一般に見られる情報を省いていることに留意されたい。図7Aの各々の上向きの矢印は語をその上位語に結び付けている。例えば、男(意味2)という語を人(意味1)という語714に結び付けた矢印があり、これは人(意味1)が男(意味2)の上位語であることを示している。逆に、男(意味2)は人(意味1)の“下位語”であるということができる。
一次論理形式をそれによって拡張する上位語を識別する際に、本機構は上位語の下位語との“同類性”(coherency)に基づいて一次論理形式の各々の語ごとに1つ、またはそれ以上の上位語を選択する。このようにして上位語を選択することによって、本機構は入力されたテキスト・セグメントの意味を越えて、しかし制御された分量だけ論理形式の意味を一般化する。一次論理形式の特定の語ごとに、本機構は一次論理形式の語に近い上位語を選択する。例えば、図7Aを参照すると、一次論理形式で出現する男(意味2)7から始まって、本機構はその上位語である人(意味1)714を選択する。次に本機構は、人(意味1)が最初の語である男(意味2)711に対して設定された同類の上位語を有しているか否かに基づいて、人(意味1)714、動物(意味3)715をも選択するか否かを判定する。最初の語(意味2)711以外の、人と言う語のあらゆる意味の多数の下位語が最初の語である男(意味2)711と少なくともしきい値レベルの同類性を備えている場合は、人(意味1)714は男(意味2)711に対して設定された同類の下位語を有している。
上位語の異なる意味の下位語どうしの同類性のレベルを判定するため、本機構は好適には言語知識ベースに諮ってこれらの語の文章どうしの同類性の度合いを示す同類性の重みを得る。図7Bは男(意味2)と、人(意味1)および人(意味5)の他の下位語との同類性の重みを示す言語知識ベースの図である。この図は、男(意味2)と女(意味1)との同類性の重みが“0075”てあり、男(意味2)と子供(意味1)との重みが“0029”であり、男(意味2)と悪役(villain)(意味1)との重みが“0003”であり、男(意味2)と主役(意味7)(lead)との重みが“0002”であることを示している。これらの同類性の重みは好適には一対の語の意味間の言語知識ベースによって保持される意味論的な関係のネットワークに基づいて、論理知識ベースによって計算される。言語知識ベースを利用した一対の語の意味間の同類性の重みの詳細な説明については、本発明に参考文献として引用されている米国特許出願第 号(特許代理人の件番第661005.524号)、「語間の同類性の判定」を参照されたい。
これらの同類性の重みに基づいて下位語の集合が類似しているか否かを判定するために、本機構はしきい値の数の同類性の重みが、同類性の重みのしきい値を超えているか否かを判定する。好適なしきい値百分率は90%であるが、機構の性能を最適化するため、好適にはしきい値百分率を調整してもよい。更に機構の性能が最適化されるように同類性の重みのしきい値を構成してもよい。同類性の重みのしきい値は好適には言語知識ベースによって得られる同類性の重みの全体的な配分と調整される。ここでは“0015”のしきい値が用いられることが示されている。従って本機構は最初の語と、上位語の全ての意味のその他の下位語との間の同類性の重みの少なくとも90%が“0015”である同類性の重みのしきい値、またはそれ以上にあるか否かを判定する。図7Bから、この条件は男(意味1)に対する人の下位語によっては満たされず、一方、男(意味1)と女(意味1)との間の、および男(意味1)と子供(意味1)との間の同類性の重みは“0015”以上であり、男(意味1)と悪役(意味1)との間の、および男(意味1)と主役(意味7)との間の同類性の重みは“0015”未満であることが判る。従って本機構はそれ以上の上位語・動物(意味3)715、または動物(意味3)のどの上位語をも選択しない。その結果、一次論理形式を拡張するために上位語・人(意味1)714が選択される。
一次論理形式を拡張するため、本機構は更に一次論理形式の動詞と深い目的語の上位語をも選択する。図8は一次論理形式の動詞・キス(意味1)の上位語の選択を示している。この図から、触れる(意味2)がキス(意味1)の上位語であることが判る。図は更にキス(意味1)と、触れるの全ての意味のその他の下位語との間の同類性の重みをも示している。本機構は先ず一次論理形式の動詞・キス(意味1)に近い上位語である触れる(意味2)を選択する。触れる(意味2)、相互に関係する(意味9)(interact)を選択するか否かを判定するため、本機構はキス(意味1)と触れるの全ての意味のその他の下位語との間のどの位の数の同類性の重みが、しきい値の同類性の重みと少なくとも同じ値であるかを判定する。これらの4つの同類性の重みのうち2つしか“0015”である同類性の重みのしきい値と少なくととも同じ値ではないので、本機構は触れる(意味2)、互いに関係する(意味9)の上位語を選択することはない。
図9および図10は一次論理形式の深い目的語の上位語および子豚(意味21)の選択を示す言語知識ベースの図である。図9から、豚(swine)の唯一の意味の上位語の90%以上(実際には100%)が“0015”の同類性の重みのしきい値にあるか、それに近いので、本機構は一次論理形式を拡張するために子豚(pig)(意味2)の上位語である豚(意味1)(swine)、並びに豚(意味1)(swine)の上位語である動物(意味3)(animal)を選択することが判る。図10から、動物の意味の下位語の90%未満しか(実際には25%)“0015”、または約“0015”の同類性の重みのしきい値にないので、本機構は継続して動物(意味)の上位語である生物を選択することはないことが判る。
図11は拡張れた論理形式を示した論理形式図である。図11から、拡張された論理形式の深い主語要素1110は男(意味2)という語1111に加えて上位語の人(意味1)1112を含んでいることが判る。動詞要素1120はキス(意味1)1121という語と共に上位語である触れる(意味2)1122を含んでいることが判る。更に、拡張された論理形式の深い目的語要素1130が、子豚(意味2)(pig)1131に加えて、上位語である豚(意味1)(swine)と動物(意味3)1132を含んでいることも判る。
拡張された論理形式の各要素において上位語をオリジナルの語で置換することによって、本機構は意味が一次論理形式に適正に近似する適正に多数の派生的論理形式を生成することができる。図12は拡張された一次論理形式を置換することによって生成される派生的論理形式を示した図表である。図12から、このような置換によって入力されたテキストの意味を各々が適正な正確さで特徴付ける11の派生的論理形式が生成されることが判る。例えば、図12に示された派生的な論理形式
(person,touch,pig)(人、触れる、子豚)
は、意味的に文章の断片、
man kissing a pig(男が子豚にキスしている)
に極めて類似している。
図11に示した拡張された論理形式は一次論理形式プラス、これらの11の派生的論理形式を表しており、これらは拡張された論理形式1200としてよりコンパクトに表現されている。
((男または人)、(キスまたは触れる)、(子豚または豚または動物))
本機構はこの拡張された論理形式から、従来形の情報検索エンジンによる処理が可能であるようにする論理トークンを生成する。最初に、本機構はある語が入力されたテキスト・セグメント中に深い主語、動詞または深い目的語のどれとして出現したかを識別する指定符号を、拡張された論理形式中の各語に添付する。それによって、“man(男)”という語が深い主語として照会用に入力されたテキスト・セグメント用の拡張論理形式に出現した場合、それが動詞であった拡張論理形式の一部として索引に記憶されている“man(人員を配置する)”という語と適合することが確実になくなる。論理形式の要素への指定符号のマッピングのサンプルは下記のとおりである。
論理形式要素 識別符号
深い主語 −
動詞
深い目的語 #
指定符号のこのようなサンプル・マッピングを利用して、論理形式用に生成されたトークン“(男、キス、子豚)”には“男_”、“キス^”、および“子豚#”が含まれよう。
従来形の情報検索エンジンによって作成された索引(複数)は一般に各々のトークンを目標文書のトークンが出現する特定箇所へとマッピングする。従来形の情報検索エンジンは例えば、文書番号を用いてこのような目標文書を表し、トークンの出現を含む目標文書を識別し、その目標文書中のトークンの出現箇所を特定する。このような目標文書の箇所を発見することによって、従来形の情報検索エンジンは、“PHRASE”(語句用)演算子を用いた照会に応答して目標文書中に共に出現する語を識別することが可能であり、その際にPHRASE演算子が結び付ける語は目標文書中の近くにある必要がある。例えば、“赤い PHRASE自転車”という照会は、文書5の語611の“赤い”という語、および文書5の語612の“自転車という語の出現と適合するが、文書7、部762の“赤い”という語、および文書7の語202の、“自転車”という語の出現とは適合しないであろう。目標文書の箇所を索引に記憶しておくことによって更に、従来の情報検索エンジンが照会に応答して、照会がなされたトークンが目標文書中に出現するポイントを特定することが可能になる。
目標文書の入力されたテキスト・セグメントから拡張された論理形式の場合は、拡張された論理形式のトークンが目標文書のその箇所で出現しない場合でも、本機構は好適には人工的な目標文書の箇所を各々のトークンに同様に割当てる。これらの目標文書の箇所を割当てることによって、(A)従来形の探索エンジンがPHRASE演算子を利用して単一の一次、または派生的論理形式に対応する意味論的トークンの組合わせを識別することと、(B)本機構が割当てられた箇所を目標文書中の入力されたテキストの断片の実際の箇所と関連付けることの双方が可能になる。従って本機構は意味論的なトークンに以下のように箇所を割当てる。
論理形式要素 箇所
深い主語 (入力されたテキスト・セグメントの最初の語の箇所)
動詞 (入力されたテキスト・セグメントの最初の語の箇所)+1
深い目的語 (入力されたテキスト・セグメントの最初の語の箇所)+2
従って本機構は文書5、語150で始まる文章から導出された“男、キス、子豚)”について、拡張された論理形式のトークン用に目標文書の箇所を下記のように割当てる。すなわち、“男_”および“人_”、文書5、語150;“キス^”、および“触れる^”、文書5、語151、および“子豚#”および“豚#”および“動物#”、文書5、語152である。
図3に戻ると、ステップ303で、本機構はトークン化ルーチンによって生成されたトークンをそれらが出現する箇所と共に索引に記憶する。図13は索引のサンプル内容を示す索引図である。索引は各トークンから文書の特定、およびトークンが出現する文書中の箇所までをマッピングする。索引中のマッピングをより明解に示すために索引は表として示されているが、実際には索引は好適には木状形式のような、索引中のトークンの箇所をより効率よくサポートする多くの他の形式の1つで記憶されることに留意されたい。更に、索引のサイズを最小限にするため、接頭圧縮のような技術を用いて索引の内容を圧縮することが好適である。
ステップ303に基づいて、本機構は各々の語のためのマッピングを拡張論理形式で索引1300中に記憶していることが判る。マッピングは深い主語である“男”および“人”から目標文書の文書番号5、語番号150までのマッピングが索引に記憶されている。語番号150は図6に示した入力されたテキスト・セグメントが開始される語の位置である。本機構は深い主語に対応するトークンに指定符号“_”を添付したことが判る。この指定符号を添付することによって、本機構は後に索引を探索する際に、論理形式の動詞または深い目的語として出現するこれらの語の出現を検索せずに、論理形式の深い主語として出現するこれらの語の例だけを検索することができる。同様にして、索引は動詞の語である“キス”および“触れる”のトークンを含んでいる。これらの動詞語の入力によってこれらの語は目標文書の文書5、語番号151の箇所に、目標文書の深い主語の箇所の後に1語ずつマッピングされる。更に、指定符号“^”がこれらの動詞語のためのトークンに添付されているので、これらの語がこのような形で出現しても、後に深い主語または深い目的語として出現したものとは見なされないことが判る。同様にくして、索引は深い目的語“動物”、“子豚”、および“豚”のためのトークンを含んでおり、これらの語は目標文書の文書番号5、語番号152の箇所に、すなわち語句(PHRASE)が始まる目標文書の箇所から2語先の箇所にマッピングされる。深い目的語を索引中で深い目的語として識別するため、指定符号“#”が深い目的語のためのトークンに添付される。索引が図示した状態にある場合、図12に示した派生的な一次論理形式のいずれかについて索引を探索することによって、図6に示した入力されたテキストの断片を見出すことができる。
本機構が目標文書中に字句的に出現する語の、目標文書中のそれらの語の実際の箇所へのマッピングと、同じ索引中の目標文書の意味論的な表示の双方を記憶する好適な実施例では、索引中でアクセスされた場合に意味論的な表示の意味論的なトークンと字句的なトークンとを区別するために、意味論的表示の各々の意味論的トークンの語番号の値は、好適にはいずれかの文書中の語の番号よりも大きい定数だけ増分される。図13を簡略にするため、この定数の追加は図示していない。
この例では、本機構は拡張された論理形式の各々の語のためのトークンを索引に追加して、目標文書の意味論的な表示を形成する。しかし、好適な1実施例では、本機構はそれが索引に追加する拡張された論理形式のトークンの集合を、目標文書中の文書どうしを区別するのに有効であると思われる論理形式のトークンに限定する。索引に追加される拡張された論理形式のトークンの集合をこのように限定するため、本機構は好適には各トークンの逆文書頻度(Inverse Document Frequency)を判定する。その公式は下記の方程式(1)によって示されている。この実施例では、本機構はその逆文書頻度が最大しきい値を超えるトークンだけを索引に追加する。
図3に戻ると、トークンを索引に記憶した後、目標文書中の目下の文章の処理前にステップ304で、本機構は目標文書中の次の文章を処理するためにステップ301に戻って循環する。目標文書の全ての文章の処理が終了した後、本機構はステップ305に進行する。ステップ305で、本機構は照会のテキストを受理する。ステップ306−308で、本機構は受理した照会を処理する。ステップ306では、本機構はトークン化ルーチンを呼出して照会テキストをトークン化する。図14はステップ401(図4)に従って“馬にキスする男”という照会のために本機構が好適に構成する論理形式を示す論理形式図である。この論理形式図から、深い主語が男(意味2)であり、動詞がキス(意味1)であり、深い目的語が馬(意味1)であることが判る。この一次論理形式は一次論理形式1450で、
(男、キス、馬)
としてより簡潔に表示される。
図15はステップ402(図4)に基づいて上位語を用いた一次論理形式の拡張を示している。図15から、目標文書からのサンプルの入力テキストと同様に、深い主語である男(意味2)が上位語である人(意味1)によって拡張され、動詞・キス(意味1)が上位語である触れる(意味2)で拡張されたことが判る。更に、深い目的語・馬(意味1)が上位語・動物(意味3)で拡張されたことが判る。
図16は照会論理形式の深い目的語・馬(意味1)の上位語の選択を示す言語知識ベース図である。図16から、動物(意味3)の上位語の90%未満しか“0015”である同類性の重みのしきい値、またはそれ以上にはないので、本機構は動物(意味3)の上位語である生物(意味1)を選択しないことが判る。
従って、本機構は論理形式を拡張するために上位語・動物(意味3)だけを用いるのである。
図3に戻ると、ステップ307で本機構は一次論理形式の語の意味の上位語を用いて構成された拡張論理形式1550(図15)を用いて、適合するトークンが出現する目標文書中の箇所を索引箇所から検索する。本機構は好適には索引に下記の照会を発することによって上記の動作を行う。
(男_または人_)PHRASE(キス^または触れる^)PHRASE(馬#または動物#)
PHRASE演算子は先行する演算数(オペランド)よりも1つだけ大きい語の箇所で後続の演算数の出現を突合わせる(match)。従って、照会によって深い主語である男_または人_が、深い目的語である馬#または動物#に先行する動詞キス^または触れる^に先行する箇所が突合わせされる。図13の索引から、この照会が文書番号5、語番号150で満たされることが判る。
前記照会が索引中で満たされない場合は、本機構は異なる2つの部分的照会によって照会の提出を継続する。第1の部分的形式には深い主語と動詞だけが含まれ、目的語は含まれない。
(男_または人_)PHRASE(キス^または触れる^)
図17はこの第1の照会に対応する部分的論理形式を示した部分的論理形式図である。照会の第2の部分的形式には動詞と深い目的語が含まれるが、深い主語は含まれない。
(キス^または触れる^)PHRASE(馬#または動物#)
図18はこの第2の照会に対応する部分的論理形式を示した部分的論理形式図である。これらの部分的照会によって索引中の異なる深い主語または深い目的語を有する部分的論理形式の突合わせが行われ、また、深い主語または深い目的語を有していない部分的な論理形式が突合わせされよう。これらの部分的突合わせは、照会のための入力テキスト・セグメントと、代名詞の使用および暗示された深い主語および深い目的語を含む目標文書の入力テキスト・セグメントとの差を考慮に入れている。
図3に戻ると、索引中のトークンの適合の有無を識別した後、本機構は継続してステップ308で、一次論理形式または派生的論理形式に対応して、突合わせトークンの特定の組合わせが照会に対する関連性が高い順序で出現する目標文書のランク付けを行う。本発明の様々な実施例において、本機構は関連性に応じた文書のランク付けのための多数の公知のアプローチのうちの1つ、または複数の方法を利用し、それにはジャッカード(Jaccard)重み付けおよび2進項目インピーダンス重み付けが含まれる。本機構は好適には適合する目標文書をランク付けするために逆文書頻度と項目頻度待機の組み合わせを利用する。
逆文書頻度重み付けの特徴は、文書間でより少ない目標文書に出現するトークンの組合わせに、より大きい重みを付与する文書を区別するトークン組合わせの能力にある。例えば、写真の主題に関する目標文書群の場合、論理形式、
(写真家、フレーム、主題)
は、各文書群に出現する可能性があり、従って文書間を区別するための極めて良好な基準にはならないであろう。上記の論理形式は全ての目標文書に出現するので、その逆文書頻度は比較的少ない。トークンの組合わせの逆文書頻度の公式は下記のとおりである。
文書中のトークンの組合わせの項目頻度の重み付けは、ある文書がトークンの組合わせ専用である度合いの尺度であり、かつ特定の照会トークンがより高頻度で出現する文書は照会トークンがより少ない頻度で出現する文書よりも関連性が高いものと想定されている。文書中のトークンの組合わせの項目頻度の重みの公式は下記のとおりである。
項目頻度(トークンの組合わせ)=文書中でトークンの組合わせが出現する数(2)
本機構は各々の突合わせ文書ごとにスコアを用いて文書をランク付けする。本機構は先ず下記の公式を用いて各文書中の各々の突合わせトークンの組合わせのスコアを計算する。
スコア(トークンの組合わせ、文書)=逆文書頻度(トークンの組合わせ)x項目頻度(トークンの組合わせ、文書) (3)
次に本機構は下記の公式に基づいて各突合わせ文書中に適合するトークンの組合わせがあればその最高スコアを選択することによって、各突合わせ文書のスコアを計算する。
本機構が各文書についてスコアの計算を終了すると、本機構はこれらのスコーを増倍して、意味論的な突合わせとは別の照会の項目を反映するようにしてもよい。各文書ごとにスコアを増倍した後、必要ならば本機構は下記の公式に示すように文書のサイズを考慮に入れて各文書の正規化されたスコアを計算する。
サイズ(文書)の項目は例えば文書中の文字数、語、または文書または文書の断片のような文書のサイズのいずれかの適正な尺度でよい。あるいは、余弦尺度による正規化、項目の重みの合計による正規化、および最高の項目重みによる正規化を含む、他の多くの正規化技術を用いて文書スコアを正規化してもよい。
各突合わせ文書ごとに正規化されたスコアを計算した後、本機構は文書の正規化されたスコア順に突合わせ文書のランク付けを行う。ユーザーは好適にはランク付けされた突合わせ文書の1つを選択して、その文書中の適合するトークンの箇所を探し、またはその文書の適合部分が表示されるようにしてもよい。
図3を参照すると、ステップ308で突合わせ目標文書のランク付けを行った後、本機構は好適にはステップ305で索引に対する次の照会テキストを受理する。
上記は突合わせトークンを含む文書の関連性によるランク付けを説明したものである。本発明の更に別の好適な実施例は同様に、適合が含まれる、関連性がある文書群と文書部分のそれぞれによってランク付けを行う。各々が1つ、またはそれ以上の文書を含む文書群へと編成された目標文書の場合は、本機構は好適には、更なる照会のために最も関連性が高い文書群を特定するために、適合が出現する文書群を関連性によってランク付けする。更に、本機構は好適には各々の目標文書を各部分に分割し、適合が出現する文書部分の関連性をランク付ける。これらの文書部分はある数のバイト、語、または文章を選択するか、または目標文書中に出現する構造的、書式的、または言語的なキューを用いて目標文書中で連続的に特定される。更に本機構は好適には特定のテーマに関する非連続的な文書部分を特定することもできる。
これまで本発明を特定の実施例を参考にして図示し、説明してきたが、本発明の範囲を離れることなく形式と細部の多くの変更または修正が可能てあることが当業者には理解されよう。例えば、トークナイザを直截に、論理形式構造の1つの語に各々が対応するトークンの代わりに、完全な論理形式構造に各々が対応するトークンを作成し、索引に記憶されるようにしてもよい。更に、意味論的な突合わせ成分を有する照会に他の種類の探索方法を組入れるために様々な公知の技術を適用してもよい。更に、照会には多数の意味論的な突合わせ成分が含まれるようにしてもよい。加えて、上位語以外に語間で識別される意味論的な関係性を利用して、一次論理形式を拡張してもよい。本機構は更に、前述のルーチンで字句知識ベースから上位語のリストを作成するのではなく、一次論理形式の各語について予め承認された代用可能な語のリストを利用して一次論理形式を拡張してもよい。更に、突合わせの精度を更に高めるため、トークナイザは語に特定された意味番号を語のためのトークン中でエンコードしてもよい。この場合は、上位語の集合の同類性のためのテストは、選択された上位語の全ての意味との類似性のテストよりも軽減される。1例では、人という語の意味1の上位語だけが男(意味2)という語の最初の意味との同類性のしきい値レベルにあればよい。可能性がある索引中の突合わせ項目には曖味さが少ないので、誤った適合を生ずることがある項目の集合を制限することができる。このような理由から、論理形式の語と上位語の関係にある意味だけをテストすればよい。
Claims (3)
- 第2のボディのテキストのあるパッセージに関連する第1のボディのテキストの複数のパッセージを特定するための、メモリ及び処理装置を備えるコンピュータ・システムによって実行される方法において、
前記第1のボディのテキストの前記複数のパッセージの各々に対して、前記処理装置が、パッセージを品詞で分解してパッセージ中の選択された複数の語の間の構文的な関係を特徴付ける第1の論理形式を構築するステップと、前記処理装置が、前記選択された複数の語の少なくともいくつかのための上位語含むように、構築された前記第1の論理形式を拡張するステップと、前記処理装置が、前記選択された複数の語の各々から、前記選択された複数の語の各々に対応する前記第1のボディのテクスト中の箇所へのマッピングを前記メモリのインデックスに格納ステップと、前記処理装置が、前記選択された複数の語の前記少なくともいくつかの上位語の各々から、前記上位語の各々に対応する前記第1のボディのテクスト中の箇所へのマッピングを前記メモリのインデックスに格納するステップと、
前記処理装置が、前記第2のボディのテキストの前記あるパッセージを品詞で分解して前記あるパッセージ中の選択された複数の語の間の構文的な関係を特徴付ける第2の論理形式を構築するステップと、
前記処理装置が、前記あるパッセージ中の前記選択された複数の語の少なくともいくつかのための上位語を含むように、構築された前記第2の論理形式を拡張するステップと、
前記処理装置が、前記インデックスに格納された語のうち、前記第2のボディのテクストの前記あるパッセージの前記選択された複数の語の各々に対応する語、または、前記あるパッセージの前記選択された複数の語の前記少なくともいくつかのための上位語の各々に対応する語を特定して、前記第2のボディのテキストの前記あるパッセージに関連する第1のボディのテキストのパッセージを特定するステップと
を備えることを特徴とする方法。 - 前記第1のボディのテキストは複数の文書から成っており、
前記第1のボディのテキストの前記複数のパッセージの各々の箇所は、前記複数の文書のうちの各パッセージを含む文書の文書番号を含むことを特徴とする請求項1に記載の方法。 - 第2のボディのテキストのあるパッセージに関連する第1のボディのテキストの複数のパッセージを特定するのに適合されたコンピュータ・システムであって、
前記第1のボディのテキストの前記複数のパッセージの各々に対して、パッセージを品詞で分解してパッセージ中の選択された複数の語の間の構文的な関係を特徴付ける第1の論理形式を構築し、前記選択された複数の語の少なくともいくつかのための上位語を含むように構築された前記第1の論理形式を拡張し、前記選択された複数の語の各々から、前記選択された複数の語の各々に対応する前記第1のボディのテクスト中の箇所へのマッピングをインデックスに格納し、前記選択された複数の語の前記少なくともいくつかの上位語の各々から、前記上位語の各々に対応する前記第1のボディのテクスト中の箇所へのマッピングを前記メモリのインデックスに格納するインデックス付けコンポーネントと、
前記第2のボディのテキストの前記あるパッセージを品詞で分解して前記あるパッセージ中の選択された複数の語の間の構文的な関係を特徴付ける第2の論理形式を構築し、前記あるパッセージ中の前記選択された複数の語の少なくともいくつかのための上位語を含むように、構築された前記第2の論理形式を拡張することによって、前記第2のボディのテキストの前記あるパッセージ中の選択された複数の語の間の意味的な関係を特徴付けるように適合された意味的関係特徴化コンポーネントと、
前記インデックスに格納された語のうち、前記第2のボディのテクストの前記あるパッセージの前記選択された複数の語の各々に対応する語、または、前記あるパッセージの前記選択された複数の語の前記少なくともいくつかのための上位語の各々に対応する語を特定して、前記第2のボディのテキストの前記あるパッセージに関連する第1のボディのテキストのパッセージを特定する関連パッセージ特定コンポーネントと
を備えることを特徴とするコンピュータ・システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/886,814 | 1997-03-07 | ||
US08/886,814 US6076051A (en) | 1997-03-07 | 1997-03-07 | Information retrieval utilizing semantic representation of text |
PCT/US1998/003005 WO1998039714A1 (en) | 1997-03-07 | 1998-02-11 | Information retrieval utilizing semantic representation of text |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001513243A JP2001513243A (ja) | 2001-08-28 |
JP4282769B2 true JP4282769B2 (ja) | 2009-06-24 |
Family
ID=25389830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP53853998A Expired - Lifetime JP4282769B2 (ja) | 1997-03-07 | 1998-02-11 | テキストの意味論的表現を利用した情報の検索 |
Country Status (5)
Country | Link |
---|---|
US (5) | US6076051A (ja) |
EP (1) | EP0965089B1 (ja) |
JP (1) | JP4282769B2 (ja) |
CN (1) | CN1252876A (ja) |
WO (1) | WO1998039714A1 (ja) |
Families Citing this family (589)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8725493B2 (en) * | 2004-01-06 | 2014-05-13 | Neuric Llc | Natural language parsing method to provide conceptual flow |
US7089218B1 (en) | 2004-01-06 | 2006-08-08 | Neuric Technologies, Llc | Method for inclusion of psychological temperament in an electronic emulation of the human brain |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US6243670B1 (en) * | 1998-09-02 | 2001-06-05 | Nippon Telegraph And Telephone Corporation | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames |
US6167370A (en) * | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
GB9821969D0 (en) * | 1998-10-08 | 1998-12-02 | Canon Kk | Apparatus and method for processing natural language |
US6964011B1 (en) * | 1998-11-26 | 2005-11-08 | Canon Kabushiki Kaisha | Document type definition generating method and apparatus, and storage medium for storing program |
US6233547B1 (en) * | 1998-12-08 | 2001-05-15 | Eastman Kodak Company | Computer program product for retrieving multi-media objects using a natural language having a pronoun |
WO2000034845A2 (en) * | 1998-12-08 | 2000-06-15 | Mediadna, Inc. | A system and method of obfuscating data |
US6993580B2 (en) * | 1999-01-25 | 2006-01-31 | Airclic Inc. | Method and system for sharing end user information on network |
GB9904662D0 (en) * | 1999-03-01 | 1999-04-21 | Canon Kk | Natural language search method and apparatus |
CA2272739C (en) * | 1999-05-25 | 2003-10-07 | Suhayya Abu-Hakima | Apparatus and method for interpreting and intelligently managing electronic messages |
US6901402B1 (en) * | 1999-06-18 | 2005-05-31 | Microsoft Corporation | System for improving the performance of information retrieval-type tasks by identifying the relations of constituents |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US6816857B1 (en) * | 1999-11-01 | 2004-11-09 | Applied Semantics, Inc. | Meaning-based advertising and document relevance determination |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US8793160B2 (en) | 1999-12-07 | 2014-07-29 | Steve Sorem | System and method for processing transactions |
US6823492B1 (en) * | 2000-01-06 | 2004-11-23 | Sun Microsystems, Inc. | Method and apparatus for creating an index for a structured document based on a stylesheet |
US6751621B1 (en) | 2000-01-27 | 2004-06-15 | Manning & Napier Information Services, Llc. | Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors |
GB0006159D0 (en) * | 2000-03-14 | 2000-05-03 | Ncr Int Inc | Predicting future behaviour of an individual |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU4869601A (en) * | 2000-03-20 | 2001-10-03 | Robert J. Freeman | Natural-language processing system using a large corpus |
US7428500B1 (en) * | 2000-03-30 | 2008-09-23 | Amazon. Com, Inc. | Automatically identifying similar purchasing opportunities |
US7120574B2 (en) * | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US20010039490A1 (en) * | 2000-04-03 | 2001-11-08 | Mikhail Verbitsky | System and method of analyzing and comparing entity documents |
US7962326B2 (en) * | 2000-04-20 | 2011-06-14 | Invention Machine Corporation | Semantic answering system and method |
US20020010574A1 (en) * | 2000-04-20 | 2002-01-24 | Valery Tsourikov | Natural language processing and query driven information retrieval |
US7912868B2 (en) * | 2000-05-02 | 2011-03-22 | Textwise Llc | Advertisement placement method and system using semantic analysis |
WO2002001378A1 (en) * | 2000-06-23 | 2002-01-03 | Decis E-Direct, Inc. | Component models |
US6675159B1 (en) * | 2000-07-27 | 2004-01-06 | Science Applic Int Corp | Concept-based search and retrieval system |
US8200485B1 (en) * | 2000-08-29 | 2012-06-12 | A9.Com, Inc. | Voice interface and methods for improving recognition accuracy of voice search queries |
US7328211B2 (en) * | 2000-09-21 | 2008-02-05 | Jpmorgan Chase Bank, N.A. | System and methods for improved linguistic pattern matching |
US7085708B2 (en) | 2000-09-23 | 2006-08-01 | Ravenflow, Inc. | Computer system with natural language to machine language translator |
US20020143524A1 (en) * | 2000-09-29 | 2002-10-03 | Lingomotors, Inc. | Method and resulting system for integrating a query reformation module onto an information retrieval system |
WO2002029613A1 (en) * | 2000-09-30 | 2002-04-11 | Intel Corporation (A Corporation Of Delaware) | Method and system for building a domain specific statistical language model from rule-based grammar specifications |
US7027974B1 (en) | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US7146349B2 (en) * | 2000-11-06 | 2006-12-05 | International Business Machines Corporation | Network for describing multimedia information |
US6978419B1 (en) * | 2000-11-15 | 2005-12-20 | Justsystem Corporation | Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments |
US20020091671A1 (en) * | 2000-11-23 | 2002-07-11 | Andreas Prokoph | Method and system for data retrieval in large collections of data |
US7013308B1 (en) | 2000-11-28 | 2006-03-14 | Semscript Ltd. | Knowledge storage and retrieval system and method |
US20030028564A1 (en) * | 2000-12-19 | 2003-02-06 | Lingomotors, Inc. | Natural language method and system for matching and ranking documents in terms of semantic relatedness |
US7346491B2 (en) * | 2001-01-04 | 2008-03-18 | Agency For Science, Technology And Research | Method of text similarity measurement |
US6766316B2 (en) | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US7904595B2 (en) | 2001-01-18 | 2011-03-08 | Sdl International America Incorporated | Globalization management system and method therefor |
US20020133392A1 (en) * | 2001-02-22 | 2002-09-19 | Angel Mark A. | Distributed customer relationship management systems and methods |
US6697793B2 (en) | 2001-03-02 | 2004-02-24 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for generating phrases from a database |
US6741981B2 (en) | 2001-03-02 | 2004-05-25 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) | System, method and apparatus for conducting a phrase search |
US6721728B2 (en) | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
US6823333B2 (en) | 2001-03-02 | 2004-11-23 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for conducting a keyterm search |
US6813616B2 (en) * | 2001-03-07 | 2004-11-02 | International Business Machines Corporation | System and method for building a semantic network capable of identifying word patterns in text |
US7426505B2 (en) | 2001-03-07 | 2008-09-16 | International Business Machines Corporation | Method for identifying word patterns in text |
US7194454B2 (en) * | 2001-03-12 | 2007-03-20 | Lucent Technologies | Method for organizing records of database search activity by topical relevance |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
US8744835B2 (en) * | 2001-03-16 | 2014-06-03 | Meaningful Machines Llc | Content conversion method and apparatus |
US8874431B2 (en) * | 2001-03-16 | 2014-10-28 | Meaningful Machines Llc | Knowledge system method and apparatus |
US6847974B2 (en) * | 2001-03-26 | 2005-01-25 | Us Search.Com Inc | Method and apparatus for intelligent data assimilation |
US7146308B2 (en) * | 2001-04-05 | 2006-12-05 | Dekang Lin | Discovery of inference rules from text |
US6904428B2 (en) * | 2001-04-18 | 2005-06-07 | Illinois Institute Of Technology | Intranet mediator |
GB2375859B (en) * | 2001-04-27 | 2003-04-16 | Premier Systems Technology Ltd | Search Engine Systems |
US6829605B2 (en) * | 2001-05-24 | 2004-12-07 | Microsoft Corporation | Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval |
SG103289A1 (en) * | 2001-05-25 | 2004-04-29 | Meng Soon Cheo | System for indexing textual and non-textual files |
US7734459B2 (en) | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7050964B2 (en) * | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7003444B2 (en) * | 2001-07-12 | 2006-02-21 | Microsoft Corporation | Method and apparatus for improved grammar checking using a stochastic parser |
US8799776B2 (en) * | 2001-07-31 | 2014-08-05 | Invention Machine Corporation | Semantic processor for recognition of whole-part relations in natural language documents |
WO2003012661A1 (en) * | 2001-07-31 | 2003-02-13 | Invention Machine Corporation | Computer based summarization of natural language documents |
US9009590B2 (en) * | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US7133862B2 (en) | 2001-08-13 | 2006-11-07 | Xerox Corporation | System with user directed enrichment and import/export control |
US8020754B2 (en) | 2001-08-13 | 2011-09-20 | Jpmorgan Chase Bank, N.A. | System and method for funding a collective account by use of an electronic tag |
US7284191B2 (en) * | 2001-08-13 | 2007-10-16 | Xerox Corporation | Meta-document management system with document identifiers |
US6609124B2 (en) | 2001-08-13 | 2003-08-19 | International Business Machines Corporation | Hub for strategic intelligence |
US7526425B2 (en) * | 2001-08-14 | 2009-04-28 | Evri Inc. | Method and system for extending keyword searching to syntactically and semantically annotated data |
US7024351B2 (en) * | 2001-08-21 | 2006-04-04 | Microsoft Corporation | Method and apparatus for robust efficient parsing |
US7047183B2 (en) * | 2001-08-21 | 2006-05-16 | Microsoft Corporation | Method and apparatus for using wildcards in semantic parsing |
US7403938B2 (en) * | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
JP4065936B2 (ja) * | 2001-10-09 | 2008-03-26 | 独立行政法人情報通信研究機構 | 機械学習法を用いた言語解析処理システムおよび機械学習法を用いた言語省略解析処理システム |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US7194464B2 (en) | 2001-12-07 | 2007-03-20 | Websense, Inc. | System and method for adapting an internet filter |
US7231343B1 (en) * | 2001-12-20 | 2007-06-12 | Ianywhere Solutions, Inc. | Synonyms mechanism for natural language systems |
US20030172368A1 (en) * | 2001-12-26 | 2003-09-11 | Elizabeth Alumbaugh | System and method for autonomously generating heterogeneous data source interoperability bridges based on semantic modeling derived from self adapting ontology |
US7137062B2 (en) * | 2001-12-28 | 2006-11-14 | International Business Machines Corporation | System and method for hierarchical segmentation with latent semantic indexing in scale space |
US7295966B2 (en) * | 2002-01-14 | 2007-11-13 | Microsoft Corporation | System for normalizing a discourse representation structure and normalized data structure |
US7177799B2 (en) * | 2002-01-14 | 2007-02-13 | Microsoft Corporation | Semantic analysis system for interpreting linguistic structures output by a natural language linguistic analysis system |
US7225183B2 (en) * | 2002-01-28 | 2007-05-29 | Ipxl, Inc. | Ontology-based information management system and method |
FR2835334A1 (fr) * | 2002-01-31 | 2003-08-01 | France Telecom | Systeme et procedes d'indexation et de recherche a extension de requetes, moteurs d'indexation et de recherche |
US7031969B2 (en) * | 2002-02-20 | 2006-04-18 | Lawrence Technologies, Llc | System and method for identifying relationships between database records |
US8380491B2 (en) * | 2002-04-19 | 2013-02-19 | Educational Testing Service | System for rating constructed responses based on concepts and a model answer |
AU2003243635A1 (en) * | 2002-06-17 | 2003-12-31 | Beingmeta, Inc. | Systems and methods for processing queries |
US20040039562A1 (en) * | 2002-06-17 | 2004-02-26 | Kenneth Haase | Para-linguistic expansion |
US7493253B1 (en) * | 2002-07-12 | 2009-02-17 | Language And Computing, Inc. | Conceptual world representation natural language understanding system and method |
US20040034541A1 (en) * | 2002-08-16 | 2004-02-19 | Alipio Caban | Client devices, processor-usable media, data signals embodied in a transmission medium and processor implemented methods |
JP2004139553A (ja) * | 2002-08-19 | 2004-05-13 | Matsushita Electric Ind Co Ltd | 文書検索システムおよび質問応答システム |
US7136807B2 (en) * | 2002-08-26 | 2006-11-14 | International Business Machines Corporation | Inferencing using disambiguated natural language rules |
JP2004110161A (ja) * | 2002-09-13 | 2004-04-08 | Fuji Xerox Co Ltd | テキスト文比較装置 |
JP4038717B2 (ja) * | 2002-09-13 | 2008-01-30 | 富士ゼロックス株式会社 | テキスト文比較装置 |
US7567902B2 (en) * | 2002-09-18 | 2009-07-28 | Nuance Communications, Inc. | Generating speech recognition grammars from a large corpus of data |
US7194455B2 (en) * | 2002-09-19 | 2007-03-20 | Microsoft Corporation | Method and system for retrieving confirming sentences |
US7293015B2 (en) * | 2002-09-19 | 2007-11-06 | Microsoft Corporation | Method and system for detecting user intentions in retrieval of hint sentences |
US7171351B2 (en) * | 2002-09-19 | 2007-01-30 | Microsoft Corporation | Method and system for retrieving hint sentences using expanded queries |
US20040122736A1 (en) | 2002-10-11 | 2004-06-24 | Bank One, Delaware, N.A. | System and method for granting promotional rewards to credit account holders |
EP1599866B1 (de) * | 2002-11-13 | 2007-08-22 | Bernd Schönebeck | Sprachverarbeitendes system und verfahren |
US20040098250A1 (en) * | 2002-11-19 | 2004-05-20 | Gur Kimchi | Semantic search system and method |
EP1567941A2 (en) * | 2002-11-28 | 2005-08-31 | Koninklijke Philips Electronics N.V. | Method to assign word class information |
US8155946B2 (en) * | 2002-12-23 | 2012-04-10 | Definiens Ag | Computerized method and system for searching for text passages in text documents |
WO2004077217A2 (en) * | 2003-01-30 | 2004-09-10 | Vaman Technologies (R & D) Limited | System and method of object query analysis, optimization and execution irrespective of server functionality |
US7343280B2 (en) * | 2003-07-01 | 2008-03-11 | Microsoft Corporation | Processing noisy data and determining word similarity |
US20050060140A1 (en) * | 2003-09-15 | 2005-03-17 | Maddox Paul Christopher | Using semantic feature structures for document comparisons |
US7593845B2 (en) * | 2003-10-06 | 2009-09-22 | Microsoflt Corporation | Method and apparatus for identifying semantic structures from text |
AU2004282733A1 (en) * | 2003-10-21 | 2005-04-28 | Intellectual Property Bank Corp. | Document characteristic analysis device for document to be surveyed |
US7584092B2 (en) * | 2004-11-15 | 2009-09-01 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7412385B2 (en) * | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
CN1629833A (zh) * | 2003-12-17 | 2005-06-22 | 国际商业机器公司 | 实现问与答功能和计算机辅助写作的方法及装置 |
US7359851B2 (en) * | 2004-01-14 | 2008-04-15 | Clairvoyance Corporation | Method of identifying the language of a textual passage using short word and/or n-gram comparisons |
JP2005267607A (ja) * | 2004-02-20 | 2005-09-29 | Fuji Photo Film Co Ltd | デジタル図鑑システム、図鑑検索方法、及び図鑑検索プログラム |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
GB0407389D0 (en) * | 2004-03-31 | 2004-05-05 | British Telecomm | Information retrieval |
US20050256700A1 (en) * | 2004-05-11 | 2005-11-17 | Moldovan Dan I | Natural language question answering system and method utilizing a logic prover |
US7665014B2 (en) * | 2004-06-03 | 2010-02-16 | Microsoft Corporation | Method and apparatus for generating forms using form types |
US7424485B2 (en) * | 2004-06-03 | 2008-09-09 | Microsoft Corporation | Method and apparatus for generating user interfaces based upon automation with full flexibility |
US7363578B2 (en) * | 2004-06-03 | 2008-04-22 | Microsoft Corporation | Method and apparatus for mapping a data model to a user interface model |
US20060009966A1 (en) | 2004-07-12 | 2006-01-12 | International Business Machines Corporation | Method and system for extracting information from unstructured text using symbolic machine learning |
US20060026522A1 (en) * | 2004-07-27 | 2006-02-02 | Microsoft Corporation | Method and apparatus for revising data models and maps by example |
US7685118B2 (en) * | 2004-08-12 | 2010-03-23 | Iwint International Holdings Inc. | Method using ontology and user query processing to solve inventor problems and user problems |
US7917480B2 (en) * | 2004-08-13 | 2011-03-29 | Google Inc. | Document compression system and method for use with tokenspace repository |
US8407239B2 (en) * | 2004-08-13 | 2013-03-26 | Google Inc. | Multi-stage query processing system and method for use with tokenspace repository |
US20060047690A1 (en) * | 2004-08-31 | 2006-03-02 | Microsoft Corporation | Integration of Flex and Yacc into a linguistic services platform for named entity recognition |
US20060047691A1 (en) * | 2004-08-31 | 2006-03-02 | Microsoft Corporation | Creating a document index from a flex- and Yacc-generated named entity recognizer |
US20060047500A1 (en) * | 2004-08-31 | 2006-03-02 | Microsoft Corporation | Named entity recognition using compiler methods |
CN100361126C (zh) * | 2004-09-24 | 2008-01-09 | 北京亿维讯科技有限公司 | 使用本体论和用户查询处理技术解决问题的方法 |
US8051096B1 (en) | 2004-09-30 | 2011-11-01 | Google Inc. | Methods and systems for augmenting a token lexicon |
US20060074632A1 (en) * | 2004-09-30 | 2006-04-06 | Nanavati Amit A | Ontology-based term disambiguation |
US7657519B2 (en) * | 2004-09-30 | 2010-02-02 | Microsoft Corporation | Forming intent-based clusters and employing same by search |
US7680648B2 (en) | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation |
US7996208B2 (en) | 2004-09-30 | 2011-08-09 | Google Inc. | Methods and systems for selecting a language for text segmentation |
US7552046B2 (en) * | 2004-11-15 | 2009-06-23 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7546235B2 (en) * | 2004-11-15 | 2009-06-09 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US20060122834A1 (en) * | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
US8843536B1 (en) | 2004-12-31 | 2014-09-23 | Google Inc. | Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries |
US8473449B2 (en) * | 2005-01-06 | 2013-06-25 | Neuric Technologies, Llc | Process of dialogue and discussion |
US7869989B1 (en) * | 2005-01-28 | 2011-01-11 | Artificial Cognition Inc. | Methods and apparatus for understanding machine vocabulary |
US20060235870A1 (en) * | 2005-01-31 | 2006-10-19 | Musgrove Technology Enterprises, Llc | System and method for generating an interlinked taxonomy structure |
EP1846815A2 (en) * | 2005-01-31 | 2007-10-24 | Textdigger, Inc. | Method and system for semantic search and retrieval of electronic documents |
US20060200464A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | Method and system for generating a document summary |
US20060200337A1 (en) * | 2005-03-04 | 2006-09-07 | Microsoft Corporation | System and method for template authoring and a template data structure |
US20060200336A1 (en) * | 2005-03-04 | 2006-09-07 | Microsoft Corporation | Creating a lexicon using automatic template matching |
US20060200338A1 (en) * | 2005-03-04 | 2006-09-07 | Microsoft Corporation | Method and system for creating a lexicon |
US7937396B1 (en) | 2005-03-23 | 2011-05-03 | Google Inc. | Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments |
EP1875336A2 (en) * | 2005-04-11 | 2008-01-09 | Textdigger, Inc. | System and method for searching for a query |
US8032823B2 (en) * | 2005-04-15 | 2011-10-04 | Carnegie Mellon University | Intent-based information processing and updates |
US7672908B2 (en) * | 2005-04-15 | 2010-03-02 | Carnegie Mellon University | Intent-based information processing and updates in association with a service agent |
FR2885712B1 (fr) * | 2005-05-12 | 2007-07-13 | Kabire Fidaali | Dispositif et procede d'analyse semantique de documents par constitution d'arbres n-aire et semantique |
EP1889181A4 (en) | 2005-05-16 | 2009-12-02 | Ebay Inc | METHOD AND SYSTEM FOR SEARCHING SEARCH |
US7401731B1 (en) | 2005-05-27 | 2008-07-22 | Jpmorgan Chase Bank, Na | Method and system for implementing a card product with multiple customized relationships |
GB0512744D0 (en) * | 2005-06-22 | 2005-07-27 | Blackspider Technologies | Method and system for filtering electronic messages |
US7809551B2 (en) * | 2005-07-01 | 2010-10-05 | Xerox Corporation | Concept matching system |
US7689411B2 (en) | 2005-07-01 | 2010-03-30 | Xerox Corporation | Concept matching |
CA2545237A1 (en) * | 2005-07-29 | 2007-01-29 | Cognos Incorporated | Method and system for managing exemplar terms database for business-oriented metadata content |
CA2545232A1 (en) * | 2005-07-29 | 2007-01-29 | Cognos Incorporated | Method and system for creating a taxonomy from business-oriented metadata content |
US8666928B2 (en) * | 2005-08-01 | 2014-03-04 | Evi Technologies Limited | Knowledge repository |
JP4639124B2 (ja) * | 2005-08-23 | 2011-02-23 | キヤノン株式会社 | 文字入力補助方法及び情報処理装置 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070073533A1 (en) * | 2005-09-23 | 2007-03-29 | Fuji Xerox Co., Ltd. | Systems and methods for structural indexing of natural language text |
US7475072B1 (en) | 2005-09-26 | 2009-01-06 | Quintura, Inc. | Context-based search visualization and context management using neural networks |
US7937265B1 (en) | 2005-09-27 | 2011-05-03 | Google Inc. | Paraphrase acquisition |
US7562074B2 (en) * | 2005-09-28 | 2009-07-14 | Epacris Inc. | Search engine determining results based on probabilistic scoring of relevance |
US7908132B2 (en) * | 2005-09-29 | 2011-03-15 | Microsoft Corporation | Writing assistance using machine translation techniques |
US7949444B2 (en) * | 2005-10-07 | 2011-05-24 | Honeywell International Inc. | Aviation field service report natural language processing |
US9886478B2 (en) | 2005-10-07 | 2018-02-06 | Honeywell International Inc. | Aviation field service report natural language processing |
US8036876B2 (en) * | 2005-11-04 | 2011-10-11 | Battelle Memorial Institute | Methods of defining ontologies, word disambiguation methods, computer systems, and articles of manufacture |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
EP1949273A1 (en) * | 2005-11-16 | 2008-07-30 | Evri Inc. | Extending keyword searching to syntactically and semantically annotated data |
US7765212B2 (en) * | 2005-12-29 | 2010-07-27 | Microsoft Corporation | Automatic organization of documents through email clustering |
WO2007081681A2 (en) | 2006-01-03 | 2007-07-19 | Textdigger, Inc. | Search system with query refinement and search method |
US20070162481A1 (en) * | 2006-01-10 | 2007-07-12 | Millett Ronald P | Pattern index |
FR2896603B1 (fr) * | 2006-01-20 | 2008-05-02 | Thales Sa | Procede et dispositif pour extraire des informations et les transformer en donnees qualitatives d'un document textuel |
US8195683B2 (en) * | 2006-02-28 | 2012-06-05 | Ebay Inc. | Expansion of database search queries |
US7599861B2 (en) | 2006-03-02 | 2009-10-06 | Convergys Customer Management Group, Inc. | System and method for closed loop decisionmaking in an automated care system |
US8266152B2 (en) * | 2006-03-03 | 2012-09-11 | Perfect Search Corporation | Hashed indexing |
EP1999565A4 (en) * | 2006-03-03 | 2012-01-11 | Perfect Search Corp | HYPER SPACE INDEX |
WO2007114932A2 (en) * | 2006-04-04 | 2007-10-11 | Textdigger, Inc. | Search system and method with text function tagging |
US7991608B2 (en) * | 2006-04-19 | 2011-08-02 | Raytheon Company | Multilingual data querying |
SG174027A1 (en) * | 2006-05-04 | 2011-09-29 | Jpmorgan Chase Bank Na | System and method for restricted party screening and resolution services |
US8379830B1 (en) | 2006-05-22 | 2013-02-19 | Convergys Customer Management Delaware Llc | System and method for automated customer service with contingent live interaction |
US7809663B1 (en) | 2006-05-22 | 2010-10-05 | Convergys Cmg Utah, Inc. | System and method for supporting the utilization of machine language |
US7493293B2 (en) * | 2006-05-31 | 2009-02-17 | International Business Machines Corporation | System and method for extracting entities of interest from text using n-gram models |
US20070288248A1 (en) * | 2006-06-12 | 2007-12-13 | Rami Rauch | System and method for online service of web wide datasets forming, joining and mining |
US8140267B2 (en) * | 2006-06-30 | 2012-03-20 | International Business Machines Corporation | System and method for identifying similar molecules |
US8020206B2 (en) | 2006-07-10 | 2011-09-13 | Websense, Inc. | System and method of analyzing web content |
US8615800B2 (en) | 2006-07-10 | 2013-12-24 | Websense, Inc. | System and method for analyzing web content |
US20080027971A1 (en) * | 2006-07-28 | 2008-01-31 | Craig Statchuk | Method and system for populating an index corpus to a search engine |
US8589869B2 (en) * | 2006-09-07 | 2013-11-19 | Wolfram Alpha Llc | Methods and systems for determining a formula |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
JP5076417B2 (ja) * | 2006-09-15 | 2012-11-21 | 富士ゼロックス株式会社 | 概念ネットワーク生成システム、概念ネットワーク生成方法及び概念ネットワーク生成プログラム |
US7557167B2 (en) * | 2006-09-28 | 2009-07-07 | Gore Enterprise Holdings, Inc. | Polyester compositions, methods of manufacturing said compositions, and articles made therefrom |
US8146051B2 (en) * | 2006-10-02 | 2012-03-27 | International Business Machines Corporation | Method and computer program product for providing a representation of software modeled by a model |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9098489B2 (en) * | 2006-10-10 | 2015-08-04 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US8892423B1 (en) | 2006-10-10 | 2014-11-18 | Abbyy Infopoisk Llc | Method and system to automatically create content for dictionaries |
US9053090B2 (en) | 2006-10-10 | 2015-06-09 | Abbyy Infopoisk Llc | Translating texts between languages |
US9069750B2 (en) * | 2006-10-10 | 2015-06-30 | Abbyy Infopoisk Llc | Method and system for semantic searching of natural language texts |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US9471562B2 (en) | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US9892111B2 (en) | 2006-10-10 | 2018-02-13 | Abbyy Production Llc | Method and device to estimate similarity between documents having multiple segments |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US9588958B2 (en) | 2006-10-10 | 2017-03-07 | Abbyy Infopoisk Llc | Cross-language text classification |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9075864B2 (en) * | 2006-10-10 | 2015-07-07 | Abbyy Infopoisk Llc | Method and system for semantic searching using syntactic and semantic analysis |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US8661029B1 (en) | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
US9110975B1 (en) * | 2006-11-02 | 2015-08-18 | Google Inc. | Search result inputs using variant generalized queries |
US9208174B1 (en) * | 2006-11-20 | 2015-12-08 | Disney Enterprises, Inc. | Non-language-based object search |
US9654495B2 (en) * | 2006-12-01 | 2017-05-16 | Websense, Llc | System and method of analyzing web addresses |
US8065307B2 (en) * | 2006-12-20 | 2011-11-22 | Microsoft Corporation | Parsing, analysis and scoring of document content |
GB2458094A (en) | 2007-01-09 | 2009-09-09 | Surfcontrol On Demand Ltd | URL interception and categorization in firewalls |
US7437370B1 (en) * | 2007-02-19 | 2008-10-14 | Quintura, Inc. | Search engine graphical interface using maps and images |
US8457959B2 (en) * | 2007-03-01 | 2013-06-04 | Edward C. Kaiser | Systems and methods for implicitly interpreting semantically redundant communication modes |
US8180633B2 (en) * | 2007-03-08 | 2012-05-15 | Nec Laboratories America, Inc. | Fast semantic extraction using a neural network architecture |
CA2717462C (en) | 2007-03-14 | 2016-09-27 | Evri Inc. | Query templates and labeled search tip system, methods, and techniques |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US9031947B2 (en) * | 2007-03-27 | 2015-05-12 | Invention Machine Corporation | System and method for model element identification |
US7873640B2 (en) * | 2007-03-27 | 2011-01-18 | Adobe Systems Incorporated | Semantic analysis documents to rank terms |
US7720783B2 (en) * | 2007-03-28 | 2010-05-18 | Palo Alto Research Center Incorporated | Method and system for detecting undesired inferences from documents |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9092510B1 (en) | 2007-04-30 | 2015-07-28 | Google Inc. | Modifying search result ranking based on a temporal element of user feedback |
GB0709527D0 (en) | 2007-05-18 | 2007-06-27 | Surfcontrol Plc | Electronic messaging system, message processing apparatus and message processing method |
US7792826B2 (en) * | 2007-05-29 | 2010-09-07 | International Business Machines Corporation | Method and system for providing ranked search results |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
US8037086B1 (en) * | 2007-07-10 | 2011-10-11 | Google Inc. | Identifying common co-occurring elements in lists |
US8260619B1 (en) | 2008-08-22 | 2012-09-04 | Convergys Cmg Utah, Inc. | Method and system for creating natural language understanding grammars |
US7912840B2 (en) * | 2007-08-30 | 2011-03-22 | Perfect Search Corporation | Indexing and filtering using composite data stores |
US8280721B2 (en) | 2007-08-31 | 2012-10-02 | Microsoft Corporation | Efficiently representing word sense probabilities |
US8463593B2 (en) * | 2007-08-31 | 2013-06-11 | Microsoft Corporation | Natural language hypernym weighting for word sense disambiguation |
US8316036B2 (en) | 2007-08-31 | 2012-11-20 | Microsoft Corporation | Checkpointing iterators during search |
US8209321B2 (en) * | 2007-08-31 | 2012-06-26 | Microsoft Corporation | Emphasizing search results according to conceptual meaning |
US8868562B2 (en) * | 2007-08-31 | 2014-10-21 | Microsoft Corporation | Identification of semantic relationships within reported speech |
RU2488877C2 (ru) * | 2007-08-31 | 2013-07-27 | Майкрософт Корпорейшн | Идентификация семантических взаимоотношений в косвенной речи |
US8712758B2 (en) | 2007-08-31 | 2014-04-29 | Microsoft Corporation | Coreference resolution in an ambiguity-sensitive natural language processing system |
US20090070322A1 (en) * | 2007-08-31 | 2009-03-12 | Powerset, Inc. | Browsing knowledge on the basis of semantic relations |
WO2009029924A2 (en) * | 2007-08-31 | 2009-03-05 | Powerset, Inc. | Indexing role hierarchies for words in a search index |
US8229970B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Efficient storage and retrieval of posting lists |
US8229730B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Indexing role hierarchies for words in a search index |
US8346756B2 (en) * | 2007-08-31 | 2013-01-01 | Microsoft Corporation | Calculating valence of expressions within documents for searching a document index |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8838659B2 (en) * | 2007-10-04 | 2014-09-16 | Amazon Technologies, Inc. | Enhanced knowledge repository |
US8595642B1 (en) | 2007-10-04 | 2013-11-26 | Great Northern Research, LLC | Multiple shell multi faceted graphical user interface |
US8909655B1 (en) | 2007-10-11 | 2014-12-09 | Google Inc. | Time based ranking |
EP2212772A4 (en) * | 2007-10-17 | 2017-04-05 | VCVC lll LLC | Nlp-based content recommender |
US8594996B2 (en) | 2007-10-17 | 2013-11-26 | Evri Inc. | NLP-based entity recognition and disambiguation |
WO2009059297A1 (en) * | 2007-11-01 | 2009-05-07 | Textdigger, Inc. | Method and apparatus for automated tag generation for digital content |
US20090119090A1 (en) * | 2007-11-01 | 2009-05-07 | Microsoft Corporation | Principled Approach to Paraphrasing |
US8725756B1 (en) | 2007-11-12 | 2014-05-13 | Google Inc. | Session-based query suggestions |
US7860885B2 (en) * | 2007-12-05 | 2010-12-28 | Palo Alto Research Center Incorporated | Inbound content filtering via automated inference detection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8392436B2 (en) * | 2008-02-07 | 2013-03-05 | Nec Laboratories America, Inc. | Semantic search via role labeling |
US8504361B2 (en) * | 2008-02-07 | 2013-08-06 | Nec Laboratories America, Inc. | Deep neural networks and methods for using same |
US10269024B2 (en) * | 2008-02-08 | 2019-04-23 | Outbrain Inc. | Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8180754B1 (en) * | 2008-04-01 | 2012-05-15 | Dranias Development Llc | Semantic neural network for aggregating query searches |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8061142B2 (en) * | 2008-04-11 | 2011-11-22 | General Electric Company | Mixer for a combustor |
US8706477B1 (en) | 2008-04-25 | 2014-04-22 | Softwin Srl Romania | Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8682660B1 (en) * | 2008-05-21 | 2014-03-25 | Resolvity, Inc. | Method and system for post-processing speech recognition results |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US8219397B2 (en) * | 2008-06-10 | 2012-07-10 | Nuance Communications, Inc. | Data processing system for autonomously building speech identification and tagging data |
US8032495B2 (en) * | 2008-06-20 | 2011-10-04 | Perfect Search Corporation | Index compression |
AU2009267107A1 (en) | 2008-06-30 | 2010-01-07 | Websense, Inc. | System and method for dynamic and real-time categorization of webpages |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US9317589B2 (en) * | 2008-08-07 | 2016-04-19 | International Business Machines Corporation | Semantic search by means of word sense disambiguation using a lexicon |
US8112269B2 (en) * | 2008-08-25 | 2012-02-07 | Microsoft Corporation | Determining utility of a question |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8364663B2 (en) * | 2008-09-05 | 2013-01-29 | Microsoft Corporation | Tokenized javascript indexing system |
JP2010066365A (ja) * | 2008-09-09 | 2010-03-25 | Toshiba Corp | 音声認識装置、方法、及びプログラム |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010043257A1 (en) * | 2008-10-15 | 2010-04-22 | Hewlett-Packard Development Company, L.P. | Retrieving configuration records from a configuration management database |
US8185509B2 (en) * | 2008-10-15 | 2012-05-22 | Sap France | Association of semantic objects with linguistic entity categories |
WO2010077714A2 (en) * | 2008-12-09 | 2010-07-08 | University Of Houston System | Word sense disambiguation |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US9805089B2 (en) * | 2009-02-10 | 2017-10-31 | Amazon Technologies, Inc. | Local business and product search system and method |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
EP2394228A4 (en) * | 2009-03-10 | 2013-01-23 | Ebrary Inc | METHOD AND APPARATUS FOR REAL-TIME TEXT ANALYSIS AND NAVIGATION IN TEXT |
KR20110136843A (ko) * | 2009-03-13 | 2011-12-21 | 인벤션 머신 코포레이션 | 지식 검색을 위한 시스템 및 방법 |
US8666730B2 (en) * | 2009-03-13 | 2014-03-04 | Invention Machine Corporation | Question-answering system and method based on semantic labeling of text documents and user questions |
US20110301941A1 (en) * | 2009-03-20 | 2011-12-08 | Syl Research Limited | Natural language processing method and system |
CN101508188B (zh) * | 2009-03-24 | 2012-09-26 | 北京市城南橡塑技术研究所 | 抗冲击复合衬板 |
US20100250522A1 (en) * | 2009-03-30 | 2010-09-30 | Gm Global Technology Operations, Inc. | Using ontology to order records by relevance |
WO2010120699A2 (en) * | 2009-04-16 | 2010-10-21 | Evri Inc. | Enhanced advertisement targeting |
US8601015B1 (en) | 2009-05-15 | 2013-12-03 | Wolfram Alpha Llc | Dynamic example generation for queries |
US8788524B1 (en) * | 2009-05-15 | 2014-07-22 | Wolfram Alpha Llc | Method and system for responding to queries in an imprecise syntax |
US20100299132A1 (en) * | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Mining phrase pairs from an unstructured resource |
CN102598007B (zh) | 2009-05-26 | 2017-03-01 | 韦伯森斯公司 | 有效检测采指纹数据和信息的系统和方法 |
US20100306214A1 (en) * | 2009-05-28 | 2010-12-02 | Microsoft Corporation | Identifying modifiers in web queries over structured data |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US20130219333A1 (en) * | 2009-06-12 | 2013-08-22 | Adobe Systems Incorporated | Extensible Framework for Facilitating Interaction with Devices |
US8762131B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates |
US8762130B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20110015921A1 (en) * | 2009-07-17 | 2011-01-20 | Minerva Advisory Services, Llc | System and method for using lingual hierarchy, connotation and weight of authority |
US20110040604A1 (en) * | 2009-08-13 | 2011-02-17 | Vertical Acuity, Inc. | Systems and Methods for Providing Targeted Content |
US9396485B2 (en) * | 2009-12-24 | 2016-07-19 | Outbrain Inc. | Systems and methods for presenting content |
US20110044447A1 (en) * | 2009-08-21 | 2011-02-24 | Nexidia Inc. | Trend discovery in audio signals |
US10169599B2 (en) * | 2009-08-26 | 2019-01-01 | International Business Machines Corporation | Data access control with flexible data disclosure |
US8498974B1 (en) | 2009-08-31 | 2013-07-30 | Google Inc. | Refining search results |
US8560300B2 (en) * | 2009-09-09 | 2013-10-15 | International Business Machines Corporation | Error correction using fact repositories |
WO2011030355A2 (en) * | 2009-09-14 | 2011-03-17 | Arun Jain | Zolog intelligent human language interface for business software applications |
US9224007B2 (en) | 2009-09-15 | 2015-12-29 | International Business Machines Corporation | Search engine with privacy protection |
US8972391B1 (en) | 2009-10-02 | 2015-03-03 | Google Inc. | Recent interest based relevance scoring |
US8645372B2 (en) * | 2009-10-30 | 2014-02-04 | Evri, Inc. | Keyword-based search engine results using enhanced query strategies |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US20110131033A1 (en) * | 2009-12-02 | 2011-06-02 | Tatu Ylonen Oy Ltd | Weight-Ordered Enumeration of Referents and Cutting Off Lengthy Enumerations |
US20110161091A1 (en) * | 2009-12-24 | 2011-06-30 | Vertical Acuity, Inc. | Systems and Methods for Connecting Entities Through Content |
US20110197137A1 (en) * | 2009-12-24 | 2011-08-11 | Vertical Acuity, Inc. | Systems and Methods for Rating Content |
US10607235B2 (en) * | 2009-12-24 | 2020-03-31 | Outbrain Inc. | Systems and methods for curating content |
US10713666B2 (en) | 2009-12-24 | 2020-07-14 | Outbrain Inc. | Systems and methods for curating content |
US9600134B2 (en) | 2009-12-29 | 2017-03-21 | International Business Machines Corporation | Selecting portions of computer-accessible documents for post-selection processing |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US9201905B1 (en) * | 2010-01-14 | 2015-12-01 | The Boeing Company | Semantically mediated access to knowledge |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
JP5398007B2 (ja) * | 2010-02-26 | 2014-01-29 | 独立行政法人情報通信研究機構 | 関係情報拡張装置、関係情報拡張方法、及びプログラム |
US9710556B2 (en) | 2010-03-01 | 2017-07-18 | Vcvc Iii Llc | Content recommendation based on collections of entities |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8694304B2 (en) * | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US9378202B2 (en) * | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US8676565B2 (en) | 2010-03-26 | 2014-03-18 | Virtuoz Sa | Semantic clustering and conversational agents |
US8645125B2 (en) | 2010-03-30 | 2014-02-04 | Evri, Inc. | NLP-based systems and methods for providing quotations |
US9110882B2 (en) | 2010-05-14 | 2015-08-18 | Amazon Technologies, Inc. | Extracting structured knowledge from unstructured text |
US8484015B1 (en) | 2010-05-14 | 2013-07-09 | Wolfram Alpha Llc | Entity pages |
US9672204B2 (en) * | 2010-05-28 | 2017-06-06 | Palo Alto Research Center Incorporated | System and method to acquire paraphrases |
US9836460B2 (en) * | 2010-06-11 | 2017-12-05 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for analyzing patent-related documents |
WO2011160140A1 (en) | 2010-06-18 | 2011-12-22 | Susan Bennett | System and method of semantic based searching |
US9623119B1 (en) | 2010-06-29 | 2017-04-18 | Google Inc. | Accentuating search results |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8812298B1 (en) | 2010-07-28 | 2014-08-19 | Wolfram Alpha Llc | Macro replacement of natural language input |
US8838633B2 (en) | 2010-08-11 | 2014-09-16 | Vcvc Iii Llc | NLP-based sentiment analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
JP5012981B2 (ja) * | 2010-09-09 | 2012-08-29 | カシオ計算機株式会社 | 電子辞書装置およびプログラム |
US9405848B2 (en) | 2010-09-15 | 2016-08-02 | Vcvc Iii Llc | Recommending mobile device activities |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US9524291B2 (en) | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
US8725739B2 (en) | 2010-11-01 | 2014-05-13 | Evri, Inc. | Category-based content recommendation |
US9424351B2 (en) * | 2010-11-22 | 2016-08-23 | Microsoft Technology Licensing, Llc | Hybrid-distribution model for search engine indexes |
US9824091B2 (en) | 2010-12-03 | 2017-11-21 | Microsoft Technology Licensing, Llc | File system backup using change journal |
US8620894B2 (en) * | 2010-12-21 | 2013-12-31 | Microsoft Corporation | Searching files |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
EP2656243B1 (en) * | 2010-12-23 | 2019-06-26 | Koninklijke Philips N.V. | Generation of pictorial reporting diagrams of lesions in anatomical structures |
JP5237400B2 (ja) * | 2011-01-21 | 2013-07-17 | 株式会社三菱東京Ufj銀行 | 検索装置 |
US9547626B2 (en) | 2011-01-29 | 2017-01-17 | Sdl Plc | Systems, methods, and media for managing ambient adaptability of web applications and web services |
US10657540B2 (en) | 2011-01-29 | 2020-05-19 | Sdl Netherlands B.V. | Systems, methods, and media for web content management |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US10580015B2 (en) | 2011-02-25 | 2020-03-03 | Sdl Netherlands B.V. | Systems, methods, and media for executing and optimizing online marketing initiatives |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
US8543577B1 (en) | 2011-03-02 | 2013-09-24 | Google Inc. | Cross-channel clusters of information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
JP5696555B2 (ja) * | 2011-03-28 | 2015-04-08 | 富士ゼロックス株式会社 | プログラム及び情報処理装置 |
US9116995B2 (en) | 2011-03-30 | 2015-08-25 | Vcvc Iii Llc | Cluster-based identification of news stories |
US20120265784A1 (en) | 2011-04-15 | 2012-10-18 | Microsoft Corporation | Ordering semantic query formulation suggestions |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US10198506B2 (en) * | 2011-07-11 | 2019-02-05 | Lexxe Pty Ltd. | System and method of sentiment data generation |
US9069814B2 (en) | 2011-07-27 | 2015-06-30 | Wolfram Alpha Llc | Method and system for using natural language to generate widgets |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US9734252B2 (en) | 2011-09-08 | 2017-08-15 | Wolfram Alpha Llc | Method and system for analyzing data using a query answering system |
US8914277B1 (en) * | 2011-09-20 | 2014-12-16 | Nuance Communications, Inc. | Speech and language translation of an utterance |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US10169339B2 (en) | 2011-10-31 | 2019-01-01 | Elwha Llc | Context-sensitive query enrichment |
US20130124194A1 (en) * | 2011-11-10 | 2013-05-16 | Inventive, Inc. | Systems and methods for manipulating data using natural language commands |
US9851950B2 (en) | 2011-11-15 | 2017-12-26 | Wolfram Alpha Llc | Programming in a precise syntax using natural language |
US8965750B2 (en) | 2011-11-17 | 2015-02-24 | Abbyy Infopoisk Llc | Acquiring accurate machine translation |
US9195853B2 (en) | 2012-01-15 | 2015-11-24 | International Business Machines Corporation | Automated document redaction |
US9430793B2 (en) * | 2012-02-15 | 2016-08-30 | Rakuten, Inc. | Dictionary generation device, dictionary generation method, dictionary generation program and computer-readable recording medium storing same program |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9064009B2 (en) * | 2012-03-28 | 2015-06-23 | Hewlett-Packard Development Company, L.P. | Attribute cloud |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US9773270B2 (en) | 2012-05-11 | 2017-09-26 | Fredhopper B.V. | Method and system for recommending products based on a ranking cocktail |
US9460082B2 (en) | 2012-05-14 | 2016-10-04 | International Business Machines Corporation | Management of language usage to facilitate effective communication |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9195647B1 (en) * | 2012-08-11 | 2015-11-24 | Guangsheng Zhang | System, methods, and data structure for machine-learning of contextualized symbolic associations |
US9405424B2 (en) | 2012-08-29 | 2016-08-02 | Wolfram Alpha, Llc | Method and system for distributing and displaying graphical items |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US10452740B2 (en) | 2012-09-14 | 2019-10-22 | Sdl Netherlands B.V. | External content libraries |
US11308528B2 (en) | 2012-09-14 | 2022-04-19 | Sdl Netherlands B.V. | Blueprinting of multimedia assets |
US11386186B2 (en) | 2012-09-14 | 2022-07-12 | Sdl Netherlands B.V. | External content library connector systems and methods |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
US9916306B2 (en) | 2012-10-19 | 2018-03-13 | Sdl Inc. | Statistical linguistic analysis of source content |
US9892278B2 (en) | 2012-11-14 | 2018-02-13 | International Business Machines Corporation | Focused personal identifying information redaction |
US10095692B2 (en) * | 2012-11-29 | 2018-10-09 | Thornson Reuters Global Resources Unlimited Company | Template bootstrapping for domain-adaptable natural language generation |
US20150317386A1 (en) * | 2012-12-27 | 2015-11-05 | Abbyy Development Llc | Finding an appropriate meaning of an entry in a text |
JP2016508007A (ja) | 2013-02-07 | 2016-03-10 | アップル インコーポレイテッド | デジタルアシスタントのためのボイストリガ |
US9135240B2 (en) * | 2013-02-12 | 2015-09-15 | International Business Machines Corporation | Latent semantic analysis for application in a question answer system |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9311297B2 (en) * | 2013-03-14 | 2016-04-12 | Prateek Bhatnagar | Method and system for outputting information |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
CN112230878A (zh) | 2013-03-15 | 2021-01-15 | 苹果公司 | 对中断进行上下文相关处理 |
CN105190607B (zh) | 2013-03-15 | 2018-11-30 | 苹果公司 | 通过智能数字助理的用户培训 |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
JP6152711B2 (ja) * | 2013-06-04 | 2017-06-28 | 富士通株式会社 | 情報検索装置および情報検索方法 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
JP6163266B2 (ja) | 2013-08-06 | 2017-07-12 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
US9311300B2 (en) * | 2013-09-13 | 2016-04-12 | International Business Machines Corporation | Using natural language processing (NLP) to create subject matter synonyms from definitions |
US20160224637A1 (en) * | 2013-11-25 | 2016-08-04 | Ut Battelle, Llc | Processing associations in knowledge graphs |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2613847C2 (ru) | 2013-12-20 | 2017-03-21 | ООО "Аби Девелопмент" | Выявление китайской, японской и корейской письменности |
US20150178390A1 (en) * | 2013-12-20 | 2015-06-25 | Jordi Torras | Natural language search engine using lexical functions and meaning-text criteria |
RU2665239C2 (ru) | 2014-01-15 | 2018-08-28 | Общество с ограниченной ответственностью "Аби Продакшн" | Автоматическое извлечение именованных сущностей из текста |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
JP6260294B2 (ja) * | 2014-01-21 | 2018-01-17 | 富士通株式会社 | 情報検索装置、情報検索方法および情報検索プログラム |
RU2648638C2 (ru) | 2014-01-30 | 2018-03-26 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы эффективного автоматического распознавания символов, использующие множество кластеров эталонов символов |
RU2640322C2 (ru) | 2014-01-30 | 2017-12-27 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы эффективного автоматического распознавания символов |
RU2556425C1 (ru) * | 2014-02-14 | 2015-07-10 | Закрытое акционерное общество "Эвентос" (ЗАО "Эвентос") | Способ автоматической итеративной кластеризации электронных документов по семантической близости, способ поиска в совокупности кластеризованных по семантической близости документов и машиночитаемые носители |
US10839110B2 (en) * | 2014-05-09 | 2020-11-17 | Autodesk, Inc. | Techniques for using controlled natural language to capture design intent for computer-aided design |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
KR101661198B1 (ko) * | 2014-07-10 | 2016-10-04 | 네이버 주식회사 | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 |
CN104199803B (zh) * | 2014-07-21 | 2017-10-13 | 安徽华贞信息科技有限公司 | 一种基于组合理论的文本信息处理系统及方法 |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9715488B2 (en) * | 2014-10-06 | 2017-07-25 | International Business Machines Corporation | Natural language processing utilizing transaction based knowledge representation |
US9665564B2 (en) | 2014-10-06 | 2017-05-30 | International Business Machines Corporation | Natural language processing utilizing logical tree structures |
US9588961B2 (en) | 2014-10-06 | 2017-03-07 | International Business Machines Corporation | Natural language processing utilizing propagation of knowledge through logical parse tree structures |
US9710547B2 (en) | 2014-11-21 | 2017-07-18 | Inbenta | Natural language semantic search system and method using weighted global semantic representations |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9589185B2 (en) | 2014-12-10 | 2017-03-07 | Abbyy Development Llc | Symbol recognition using decision forests |
JP6447161B2 (ja) * | 2015-01-20 | 2019-01-09 | 富士通株式会社 | 意味構造検索プログラム、意味構造検索装置、及び意味構造検索方法 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9632999B2 (en) * | 2015-04-03 | 2017-04-25 | Klangoo, Sal. | Techniques for understanding the aboutness of text based on semantic analysis |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9778929B2 (en) | 2015-05-29 | 2017-10-03 | Microsoft Technology Licensing, Llc | Automated efficient translation context delivery |
US10762521B2 (en) | 2015-06-01 | 2020-09-01 | Jpmorgan Chase Bank, N.A. | System and method for loyalty integration for merchant specific digital wallets |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10628521B2 (en) * | 2015-08-03 | 2020-04-21 | International Business Machines Corporation | Scoring automatically generated language patterns for questions using synthetic events |
US10628413B2 (en) * | 2015-08-03 | 2020-04-21 | International Business Machines Corporation | Mapping questions to complex database lookups using synthetic events |
US10134389B2 (en) * | 2015-09-04 | 2018-11-20 | Microsoft Technology Licensing, Llc | Clustering user utterance intents with semantic parsing |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
CN106598722A (zh) * | 2015-10-19 | 2017-04-26 | 上海引跑信息科技有限公司 | 一种在文本信息检索服务中支持分布式事务管理的方法 |
EP3163467A1 (en) * | 2015-10-30 | 2017-05-03 | BIGFLO s.r.l. | Method and tool for the automatic reformulation of search keyword strings in document search systems |
US10614167B2 (en) | 2015-10-30 | 2020-04-07 | Sdl Plc | Translation review workflow systems and methods |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10592603B2 (en) * | 2016-02-03 | 2020-03-17 | International Business Machines Corporation | Identifying logic problems in text using a statistical approach and natural language processing |
US11042702B2 (en) | 2016-02-04 | 2021-06-22 | International Business Machines Corporation | Solving textual logic problems using a statistical approach and natural language processing |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
EP3394798A1 (en) * | 2016-03-18 | 2018-10-31 | Google LLC | Generating dependency parses of text segments using neural networks |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US11200217B2 (en) | 2016-05-26 | 2021-12-14 | Perfect Search Corporation | Structured document indexing and searching |
US10289680B2 (en) * | 2016-05-31 | 2019-05-14 | Oath Inc. | Real time parsing and suggestions from pre-generated corpus with hypernyms |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US11049190B2 (en) | 2016-07-15 | 2021-06-29 | Intuit Inc. | System and method for automatically generating calculations for fields in compliance forms |
US11222266B2 (en) | 2016-07-15 | 2022-01-11 | Intuit Inc. | System and method for automatic learning of functions |
US10579721B2 (en) | 2016-07-15 | 2020-03-03 | Intuit Inc. | Lean parsing: a natural language processing system and method for parsing domain-specific languages |
US10120861B2 (en) | 2016-08-17 | 2018-11-06 | Oath Inc. | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time |
US9984063B2 (en) | 2016-09-15 | 2018-05-29 | International Business Machines Corporation | System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning |
US9953027B2 (en) * | 2016-09-15 | 2018-04-24 | International Business Machines Corporation | System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10437833B1 (en) * | 2016-10-05 | 2019-10-08 | Ontocord, LLC | Scalable natural language processing for large and dynamic text environments |
CN110088754B (zh) * | 2016-10-26 | 2023-04-28 | 联邦科学和工业研究组织 | 立法到逻辑的自动编码器 |
KR102589638B1 (ko) * | 2016-10-31 | 2023-10-16 | 삼성전자주식회사 | 문장 생성 장치 및 방법 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
JP6805927B2 (ja) * | 2017-03-28 | 2020-12-23 | 富士通株式会社 | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US10275452B2 (en) | 2017-05-12 | 2019-04-30 | International Business Machines Corporation | Automatic, unsupervised paraphrase detection |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US11664114B2 (en) | 2017-05-25 | 2023-05-30 | Enlitic, Inc. | Medical scan assisted review system |
CA3076418C (en) * | 2017-09-22 | 2023-02-21 | Intuit Inc. | Lean parsing: a natural language processing system and method for parsing domain-specific languages |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US11087097B2 (en) * | 2017-11-27 | 2021-08-10 | Act, Inc. | Automatic item generation for passage-based assessment |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11410130B2 (en) * | 2017-12-27 | 2022-08-09 | International Business Machines Corporation | Creating and using triplet representations to assess similarity between job description documents |
WO2019132647A1 (en) | 2017-12-28 | 2019-07-04 | Mimos Berhad | A method for self-learning text relevance and determining text relevancy |
IL258689A (en) * | 2018-04-12 | 2018-05-31 | Browarnik Abel | A system and method for computerized semantic indexing and searching |
JP7135399B2 (ja) | 2018-04-12 | 2022-09-13 | 富士通株式会社 | 特定プログラム、特定方法および情報処理装置 |
US11016985B2 (en) * | 2018-05-22 | 2021-05-25 | International Business Machines Corporation | Providing relevant evidence or mentions for a query |
US11042712B2 (en) * | 2018-06-05 | 2021-06-22 | Koninklijke Philips N.V. | Simplifying and/or paraphrasing complex textual content by jointly learning semantic alignment and simplicity |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11163956B1 (en) | 2019-05-23 | 2021-11-02 | Intuit Inc. | System and method for recognizing domain specific named entities using domain specific word embeddings |
US11477140B2 (en) | 2019-05-30 | 2022-10-18 | Microsoft Technology Licensing, Llc | Contextual feedback to a natural understanding system in a chat bot |
US10868778B1 (en) | 2019-05-30 | 2020-12-15 | Microsoft Technology Licensing, Llc | Contextual feedback, with expiration indicator, to a natural understanding system in a chat bot |
CA3150535A1 (en) | 2019-09-16 | 2021-03-25 | Andrew BEGUN | WIZARD FOR CREATION AND INTELLIGENT PROCESSING OF CROSS DOCUMENTS |
US11068665B2 (en) | 2019-09-18 | 2021-07-20 | International Business Machines Corporation | Hypernym detection using strict partial order networks |
CN111090668B (zh) * | 2019-12-09 | 2023-09-26 | 京东科技信息技术有限公司 | 数据检索方法及装置、电子设备和计算机可读存储介质 |
US11783128B2 (en) | 2020-02-19 | 2023-10-10 | Intuit Inc. | Financial document text conversion to computer readable operations |
US11651156B2 (en) * | 2020-05-07 | 2023-05-16 | Optum Technology, Inc. | Contextual document summarization with semantic intelligence |
US11954448B2 (en) * | 2020-07-21 | 2024-04-09 | Microsoft Technology Licensing, Llc | Determining position values for transformer models |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4823306A (en) * | 1987-08-14 | 1989-04-18 | International Business Machines Corporation | Text search system |
US4839853A (en) * | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
SE466029B (sv) * | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
NL8900587A (nl) * | 1989-03-10 | 1990-10-01 | Bso Buro Voor Systeemontwikkel | Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst. |
US5146406A (en) * | 1989-08-16 | 1992-09-08 | International Business Machines Corporation | Computer method for identifying predicate-argument structures in natural language text |
JP3266246B2 (ja) | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5617578A (en) * | 1990-06-26 | 1997-04-01 | Spss Corp. | Computer-based workstation for generation of logic diagrams from natural language text structured by the insertion of script symbols |
US5325298A (en) * | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5278980A (en) * | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US5488719A (en) * | 1991-12-30 | 1996-01-30 | Xerox Corporation | System for categorizing character strings using acceptability and category information contained in ending substrings |
US5591661A (en) | 1992-04-07 | 1997-01-07 | Shiota; Philip | Method for fabricating devices for electrostatic discharge protection and voltage references, and the resulting structures |
US5377103A (en) | 1992-05-15 | 1994-12-27 | International Business Machines Corporation | Constrained natural language interface for a computer that employs a browse function |
US5592661A (en) * | 1992-07-16 | 1997-01-07 | International Business Machines Corporation | Detection of independent changes via change identifiers in a versioned database management system |
US5630121A (en) * | 1993-02-02 | 1997-05-13 | International Business Machines Corporation | Archiving and retrieving multimedia objects using structured indexes |
US5454106A (en) * | 1993-05-17 | 1995-09-26 | International Business Machines Corporation | Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface |
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
GB9320404D0 (en) * | 1993-10-04 | 1993-11-24 | Dixon Robert | Method & apparatus for data storage & retrieval |
US5873056A (en) * | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5724594A (en) | 1994-02-10 | 1998-03-03 | Microsoft Corporation | Method and system for automatically identifying morphological information from a machine-readable dictionary |
US5675819A (en) * | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5794050A (en) * | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
JP2923552B2 (ja) * | 1995-02-13 | 1999-07-26 | 富士通株式会社 | 組織活動データベースの構築方法,それに使用する分析シートの入力方法及び組織活動管理システム |
US5963940A (en) * | 1995-08-16 | 1999-10-05 | Syracuse University | Natural language information retrieval system and method |
WO1997008604A2 (en) | 1995-08-16 | 1997-03-06 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
JP3083742B2 (ja) * | 1995-10-03 | 2000-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 表計算方法 |
US5995922A (en) * | 1996-05-02 | 1999-11-30 | Microsoft Corporation | Identifying information related to an input word in an electronic dictionary |
US5966686A (en) * | 1996-06-28 | 1999-10-12 | Microsoft Corporation | Method and system for computing semantic logical forms from syntax trees |
US5893104A (en) * | 1996-07-09 | 1999-04-06 | Oracle Corporation | Method and system for processing queries in a database system using index structures that are not native to the database system |
US6038561A (en) * | 1996-10-15 | 2000-03-14 | Manning & Napier Information Services | Management and analysis of document information text |
US5970490A (en) * | 1996-11-05 | 1999-10-19 | Xerox Corporation | Integration platform for heterogeneous databases |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US5895464A (en) * | 1997-04-30 | 1999-04-20 | Eastman Kodak Company | Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US6070134A (en) * | 1997-07-31 | 2000-05-30 | Microsoft Corporation | Identifying salient semantic relation paths between two words |
US5991713A (en) * | 1997-11-26 | 1999-11-23 | International Business Machines Corp. | Efficient method for compressing, storing, searching and transmitting natural language text |
US6675159B1 (en) * | 2000-07-27 | 2004-01-06 | Science Applic Int Corp | Concept-based search and retrieval system |
US6664964B1 (en) * | 2000-11-10 | 2003-12-16 | Emc Corporation | Correlation criteria for logical volumes |
US7734459B2 (en) | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7050964B2 (en) | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
-
1997
- 1997-03-07 US US08/886,814 patent/US6076051A/en not_active Expired - Lifetime
-
1998
- 1998-02-11 JP JP53853998A patent/JP4282769B2/ja not_active Expired - Lifetime
- 1998-02-11 EP EP98906476.1A patent/EP0965089B1/en not_active Expired - Lifetime
- 1998-02-11 CN CN98804175A patent/CN1252876A/zh active Pending
- 1998-02-11 WO PCT/US1998/003005 patent/WO1998039714A1/en active Application Filing
-
1999
- 1999-08-03 US US09/366,499 patent/US6161084A/en not_active Expired - Lifetime
- 1999-08-03 US US09/368,071 patent/US6246977B1/en not_active Expired - Lifetime
-
2000
- 2000-05-17 US US09/572,765 patent/US6871174B1/en not_active Expired - Lifetime
-
2004
- 2004-10-29 US US10/977,910 patent/US7013264B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6246977B1 (en) | 2001-06-12 |
EP0965089A1 (en) | 1999-12-22 |
US7013264B2 (en) | 2006-03-14 |
US6076051A (en) | 2000-06-13 |
US6161084A (en) | 2000-12-12 |
WO1998039714A1 (en) | 1998-09-11 |
US20050065777A1 (en) | 2005-03-24 |
JP2001513243A (ja) | 2001-08-28 |
EP0965089B1 (en) | 2015-03-25 |
CN1252876A (zh) | 2000-05-10 |
US6871174B1 (en) | 2005-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4282769B2 (ja) | テキストの意味論的表現を利用した情報の検索 | |
US9659005B2 (en) | System for semantic interpretation | |
JP5243167B2 (ja) | 情報検索システム | |
AU2005217413B2 (en) | Intelligent search and retrieval system and method | |
US6901399B1 (en) | System for processing textual inputs using natural language processing techniques | |
US20050203900A1 (en) | Associative retrieval system and associative retrieval method | |
EP0562818A2 (en) | System for pattern based text translation | |
US20040117352A1 (en) | System for answering natural language questions | |
US20070106499A1 (en) | Natural language search system | |
EP1730659A1 (en) | Information retrieval | |
AU2003243989A1 (en) | Method and system for retrieving confirming sentences | |
KR20060002831A (ko) | 인터랙티브 검색 쿼리 개선 시스템 및 방법 | |
JP2000507008A (ja) | テキスト・ベース型情報ソースのコレクションの中の情報を捜し出すためのシステム、ソフトウエア及び方法 | |
JPH03172966A (ja) | 類似文書検索装置 | |
EP1099171B1 (en) | Accessing a semi-structured database | |
JP3198932B2 (ja) | 文書検索装置 | |
CN100524294C (zh) | 使用自然语言处理技术用于处理文本输入的系统 | |
JP2003108595A (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
Braden-Harder | Sense disambiguation using online dictionaries | |
KR20000036487A (ko) | 정보검색기술을 이용한 한영번역 데이터베이스 시스템 | |
JPH07325837A (ja) | 抽象単語による通信文検索装置及び抽象単語による通信文検索方法 | |
JPH04182871A (ja) | 類似文書検索装置 | |
JPH0973454A (ja) | 文書作成装置及び文書作成方法 | |
JP2005099884A (ja) | 検索装置 | |
Wang et al. | Query Expansion with Biomedical Ontology Graph for Effective MEDLINE Document Retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050119 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050119 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080408 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080708 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081226 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20081226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090217 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090318 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120327 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120327 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130327 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130327 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140327 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |