JP2001513243A - テキストの意味論的表現を利用した情報の検索 - Google Patents

テキストの意味論的表現を利用した情報の検索

Info

Publication number
JP2001513243A
JP2001513243A JP53853998A JP53853998A JP2001513243A JP 2001513243 A JP2001513243 A JP 2001513243A JP 53853998 A JP53853998 A JP 53853998A JP 53853998 A JP53853998 A JP 53853998A JP 2001513243 A JP2001513243 A JP 2001513243A
Authority
JP
Japan
Prior art keywords
words
word
document
logical form
tokens
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP53853998A
Other languages
English (en)
Other versions
JP4282769B2 (ja
Inventor
ジョン ジェイ メセリー
ジョージ イー ヘイドーン
スティーブン ディー リチャードソン
ウィリアム ビー ドーラン
カレン ジェンセン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2001513243A publication Critical patent/JP2001513243A/ja
Application granted granted Critical
Publication of JP4282769B2 publication Critical patent/JP4282769B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 本発明はテキストの意味論的表示を利用した情報の検索に関するものである。好適な実施例では、トークナイザが入力されたストリングから、入力ストリングで表現された意味論的な関係を特徴とするトークンを生成する。トークナイザは先ず、入力ストリングから、入力ストリング中の選択された語間の意味論的な関係を特徴とする一次論理形式を作成する。次にトークナイザは入力ストリング中の選択された語の1つと“・・・である”の関係を各々が有する総称語を識別する。次にトークナイザは一次論理形式から単数または複数の代替論理形式を構成する。トークナイザは入力ストリング中の単数または複数の選択された語の各々について、各々の代替論理形式を構成する。最後に、トークナイザは一次論理形式と代替論理形式の双方を表すトークンを生成する。トークナイザは好適には目標文書を表す索引を構成し、かつ、その索引に対する照会を処理する双方の目的のためのトークンを生成するために利用される。

Description

【発明の詳細な説明】 テキストの意味論的表現を利用した情報の検索 技術分野 本発明は情報検索の分野に関し、特に情報検索のトークン化の分野に関する。 発明の背景 情報検索とは照会または照会文書中に目標文書語が出現するとそれを識別する プロセスのことである。情報検索は明示的なユーザー探索照会の処理、特定の文 書に関連する文書の特定、2つの文書の類似性の判定、文書の特徴の抽出、およ び文書の要約を含む、幾つかの状況に適用して好結果を得ることができる。 情報検索には標準的には2段階のプロセスが含まれている。すなわち(1)索 引作成段階では文書は先ず(a)文書中の各々の語を“トークン”と呼ばれる情 報検索エンジンか理解でき、これによって区別されることができる一連の文字へ と変換するプロセス(文書の“トークン化(tokenizing)”として知られている) 、および(b)各々のトークンからトークンが出現した文書中の箇所への索引図 を作成するプロセスと、(2)照会段階では、照会(または照会文書)が同様に トークン化され、かつ索引と比較されて、トークン化された照会でトークンが出 現する文書中の箇所を特定するプロセスである。 図1は情報検索プロセスを示した概略的なデータの流れ図である。索引作成段 階では、目標文書111がトークナイザ112へと提出される。目標文書は文章 のような多数のストリングからなっており、その各々は目標文書の特定箇所に出 現する。目標文書中のストリングとそれらの語の箇所がトークナイザ120に送 られ、このトークナイザによって各ストリング中の語は情報検索エンジン130 が理解でき、これによって識別可能な一連のトークンへと変換される。情報検索 エンジン130の索引構成部131がトークンとその箇所を索引140に追加す る。索引は各々の一意的なトークンをそれが目標文書中で出現した箇所へとマッ ピングする。必要ならば、多数の異なる目標文書を索引に加えるために、このプ ロセスを繰り返してもよい。このように索引140が多数の目標文書中のテキス トを表す場合、箇所情報には好適には各々の箇所ごとに、この箇所に対応する文 書の表示が含まれている。 照会段階では、テキスト照会112がトークナイザ120に提出される。この 照会は単一のストリングでも文章でもよく、または文書全体が多数のストリング から構成されていてもよい。トークナイザ120は照会テキストト112中の語 を、目標文書をトークンに変換したと同じ態様でトークンに変換する。トークナ イザ120はこれらのトークンを情報検索エンジン130の索引検索部132へ と送る。情報検索エンジンの索引検索部は索引140を探索して目標文書中にト ークンが出現しているかどうかを検索する。情報検索エンジンの情報検索部は、 各々のトークン毎に目標文書中のトークンが出現した箇所を特定する。このよう な箇所のリストが照会結果113として戻される。 従来形のトークナイザには標準的には、各々の大文字の小文字への変更、入力 されたテキスト中の個々の語の識別、および語から接尾語を削除すること等のよ うな入力されたテキストの外面的な変換が含まれている。例えば、従来形のトー クナイザは下記のような入力されたテキスト・ストリング、 父親が赤ちゃんを抱いている。(The father is holding the baby.) を下記のトークンへと変換するであろう。 the father is hold the baby このようなトークン化の方法はこれに基づいて、語の意味が照会テキスト中で 意図した意味とは異なるような語の出現(occurrence)を過剰に含める探索を行う 傾向がある。例えば、サンプルで入力されたテキスト・ストリングは“抱く(hol d)”という動詞を、“支える、または抱きしめる”という意味で用いている。し かし、“hold”というトークンは“船舶の積荷領域”を意味する“hold”という 語の用例と適合することがある。このトークン化の方法は更に、語が互いに照会 テキスト中の語とは互いに異なる関係にある語の出現を過剰に含める傾向がある 。 例えば、“父親”(father)が“抱く(held)”の主語であり、“赤ちゃん(baby)” が目的語である上記の入力されたテキスト・ストリングのサンプルは、“赤ちゃ ん”が主語で目的語ではない“父親と赤ちゃんが玩具を握っていた。”(The fat her and the baby held the toy.)と適合することがある。この方法は更に、照 会テキストの代わりに、異なってはいるが意味的に関連する語を使用するテキス ト・ストリングの出現を見落とすことがある。例えば、上記の入力されたテキス ト・ストリングは“両親が赤ちゃんを抱いている”というテキスト・ストリング とは適合しないであろう。従来形のトークン化の上記のような欠点を考慮すると 、トークン化されたテキスト中で明示されている意味的な関係をエンコードする トークナイザには重要なユーティリティがあるであろう。 発明の大要 本発明は入力されたテキストを分解して論理形式を特定し、次に総称語(hyper nym)を用いて論理形式を拡張する改良形のトークナイザを使用して情報検索を実 施することを指向している。本発明を従来形の情報検索の索引構造および照会と 組合わせて利用すれば、異なる意味を意図し、かつ語が互いに異なる関係を有し ている、識別されるテキスト・ストリングの出現数が減少し、かつ異なってはい るが意味的に関連する用語が用いられている、識別されるテキスト・ストリング の出現数が増加する。 本発明は索引付きテキストと照会テキストの双方を分解してこの入力されたテ キストの字句的、統語的、および意味論的な解析を行うことによって従来形のト ークン化に伴う問題点を克服するものである。この分解プロセスは照会テキスト 中の主要な役割を果たす語とその意図された意味とを識別し、かつこれらの語の 相互関係を識別する1つ、または複数の論理形式を作成する。パーザは好適には 入力されたテキストの深い(実際の)主語、動詞および深い(実際の)目的語に 関連する論理形式を作成する。例えば、入力されたテキストが“父親が赤ちゃん を抱いている。”である場合、パーザは下記のような論理形式を作成する。 深い主語 動詞 目的語 父親 抱く 赤ちゃん パーザは更に、これらの語に前記入力されたテキストで用いられている特定の 意味を付与する。 ある語の特定の意味について、語の意味にとって総称的な用語(“総称語”) である他の語の意味を特定するディジタル辞書または類語辞典(“言語知識ベー ス”としても知られている)を用いて、本発明はパーザによって作成された論理 形式に含まれる語をその総称語に変更して、これらのオリジナルの論理形式の意 味に属する全体的な意味を有する追加の論理形式を作成する。例えば、“両親” (parent)の意味が“父親”に付与された意味の総称であり、“触れる”(touch") の意味が“抱く”に付与された意味の総称であり、“子供”(child)の意味と“ 人”(person)の意味が“赤ちゃん”に付与された意味の総称であるという辞書の 表示に基づいて、本発明は下記のように追加の論理形式を作成する。 深い主語 動詞 目的語 両親 抱く 赤ちゃん 父親 触れる 赤ちゃん 両親 触れる 赤ちゃん 父親 抱く 子供 両親 抱く 子供 父親 触れる 子供 両親 触れる 子供 父親 抱く 人 両親 抱く 人 父親 触れる 人 両親 触れる 人 次に本発明は、生成された全ての論理形式を情報検索システムが理解できるト ークンへと変換し、この情報検索システムがトークン化された照会を索引と比較 し、これらのトークンを情報検索システムに提出する。 図面の簡単な説明 図1は情報検索プロセスを示す概略的なデータの流れ図である。 図2はそれによって機構が好適に機能する汎用コンピュータ・システムの高レ ベルのブロック図である。 図3は目標文書を意味論的に表す索引を構成し、これにアクセスするために機 構が好適に実施するステップを示す概略的な流れ図である。 図4は入力された文章用のトークンを生成するために機構が利用するトークン 化ルーチンを示す流れ図である。 図5は簡単な論理形式を示す論理形式図である。 図6は機構がそのために図5に示した論理形式を構成する、入力されたテキス ト断片を示す入力テキスト図である。 図7Aは言語知識ベースによって識別される総称的関係のサンプルを示す言語 知識ベース図である。 図7Bは一次論理形式の深い主語の総称語の選択、男(意味2)を示す言語知 識ベース図である。 図8は一次論理形式の深い動詞の総称語の選択、キス(意味1)を示す言語知 識ベース図である。 図9および図10は一次論理形式の深い目的語の総称語の選択、子豚(意味2 )を示す言語知識ベース図である。 図11は拡張された論理形式を示す論理形式図である。 図12は拡張された一次論理形式を置換することによって作成された派生的論 理形式を示す図表である。 図13は索引のサンプル内容を示す索引図である。 図14は“男が馬にキスしている。”という照会に関して機構が好適に構成す る論理形式を示す論理形式図である。 図15は総称語を用いた一次論理形式の拡張を示している。 図16は照会論理形式の深い目的語の総称の選択、馬(意味1)を示す言語知 識ベース図である。 図17は深い主語と動詞だけを含む部分的照会に対応する部分的論理形式を示 す部分論理形式図である。 図18は動詞と深い目的語だけを含む部分的照会に対応する部分的論理形式を 示す部分論理形式図である。 発明の詳細な説明 本発明はテキストの意味論的な表現を用いた情報検索を行うことを指向してい る。従来形の情報検索のための索引構造および照会と組合わせて利用すれば、本 発明によって、異なる意味を意図し、かつ語が互いに異なる関係を有している、 識別されるテキスト・ストリングの出現数が減少し、かつ異なってはいるが意味 論的に関連する用語が用いられている、識別されるテキスト・ストリングの出現 数が増加する。 好適な実施例では、図1に示した従来形のトークナイザの代わりに改良形の情 報検索トークン化機構(“機構”)が使用され、これは入力されたテキストを分 解して論理形式を識別し、次に総称語を用いて論理形式を拡張する。本発明は索 引付きテキストと照会テキストの双方を分解してこの入力されたテキストの字句 的、統語的、および意味論的な解析を行うことによって従来形のトークン化に伴 う問題点を克服するものである。この分解プロセスは照会テキスト中の主要な役 割を果たす語とその意図された意味とを識別し、かつこれらの語の相互関係を識 別する1つ、または複数の論理形式を作成する。パーザは好適には入力されたテ キストの深い主語、動詞および深い目的語に関連する論理形式を作成する。例え ば、入力されたテキストが“父親が赤ちゃんを抱いている。”である場合、バー ザは深い主語が“父親”であり、動詞が“抱く”であり、深い目的語が“赤ちゃ ん”であることを示す論理形式を作成する。入力されたテキストを論理形式へと 変換することによって、修飾語が削除され、かつ時制と態(能動、受動)の差が 無視されることで入力されたテキストはその根底的な意味へと抽出されるので、 入力されたテキスト・セグメントを論理形式に変換することによって、同じ概念 を表現するために自然語で用いられることがある多くの異なる表現方法が統一さ れる傾向がある。 ある語の特定の意味について、語の意味にとって総称的な用語(“総称語”) である他の語の意味を特定するディジタル辞書または類語辞典(“言語知識ベー ス”としても知られている)を用いて、本発明はパーザによって作成された論理 形式に含まれる語をその総称語に変更して、これらのオリジナルの論理形式の意 味に属する全体的な意味を有する追加の論理形式を作成する。次に本発明は、生 成された全ての論理形式を情報検索システムが理解できるトークンへと変換し、 この情報検索システムがトークン化された照会を索引と比較し、これらのトーク ンを情報検索システムに提出する。 図2はそれによって機構が好適に機能する汎用コンピュータ・システムの高レ ベルのブロック図である。コンピュータ・システム200は中央処理装置(CP U)210と、入力/出力装置220と、コンピュータ記憶装置(メモリ)23 0とを含んでいる。入力/出力装置の間にはハードディスク駆動装置のような記 憶装置211が配置されている。入力/出力装置は更にコンピュータによる読出 し可能な媒体駆動装置222を含んでおり、これを用いてCD−ROMのような コンピュータによる読出し可能な媒体に備えられている機構を含むソフトウェア 製品を据えつけることができる。入力/出力装置は更に、コンピュータ・システ ム200がインターネットを介して他のコンピュータ・システムと通信できるよ うにするインターネット接続223をも含んでいる。好適には機構240からな るコンピュータ・プログラムはメモリ230内に備えられ、CPU210上で実 行する。機構240は更に、論理形式の語に意味番号を付与するためにパーザに よって利用される言語知識ベース242を含んでいる。この機構は更に、言語知 識ベースを利用して生成された論理形式の語の総称語を識別する。好適にはメモ リ230は更に目標文書から生成されたトークンから目標文書中の箇所へとマッ ピングするための索引250を含んでいる。メモリ230は更に索引250中の 目標文書から生成されたトークンを記憶し、かつ照会から生成されたトークンと 適合するトークンを索引から識別するための情報検索エンジン(“IRエンジン ”)260をも含んでいる。前記機構は上記のように構成されたコンピュータ・ システムで好適に実施されるが、異なる構造のコンピュータ・システムでも実施 できることが当業者には理解されよう。 図3は目標文書を意味的に表す索引を構成し、かつこれにアクセスするために 前記機構によって好適に実行されるステップの概略的な流れ図である。簡略に述 べると、この機構は先ず目標文書の各々の文章(単数または複数)を、同じ意味 の総称語を含む文章中の重要語の相互の関係を示す拡張された論理形式を表す多 数のトークンへと変換することによって、目標文書の意味的な索引を作成する。 機構は文章が出現する目標文書中の箇所と共にこれらの“意味的トークン”を索 引中に記憶する。全ての目標文書の索引作成が完了した後、機構は索引に対する 情報検索の照会を処理することができる。受理されたこのような照会の各々につ いて、機構は、それが目標文書から文章をトークン化したと同様に、すなわち照 会テキスト用の拡張された論理形式を共に表す意味的なトークンへと文章を変換 することによって、照会のテキストをトークン化する。次に機構はこれらの意味 的なトークンを索引中に記憶された意味論的なトークンと比較して、これらの意 味論的なトークンが記憶れている目標文書の箇所を特定し、かつ照会との関連性 を特定するためにこれらの意味論的なトークンを含む目標文書をランク付けする 。この機構は好適には新たな目標文書のための意味論的なトークンを随時含める ように索引を更新する。 図3を参照すると、ステップ301−304で、この機構は目標文書中の各文 章を巡回する。ステップ302で、本機構は図4に示したように文章をトークン 化するルーチンを呼び出す。 図4は入力された文章またはその他の入力されたテキスト・セグメントのため のトークンを生成するために本機構が利用するトークン化ルーチンを示した流れ 図である。ステップ401で、本機構は入力されたテキスト・セグメントから一 次論理形式を構成する。前述したように、論理形式は文章または文章の断片の根 底的な意味を表すものである。論理形式は入力されたテキスト・セグメントがパ ーザ241(図2)によって語句的、および意味論的に分解されることによって 作成される。入力されたテキスト・ストリングを表す論理形式の構造に関する詳 細な説明は、本明細書に参考文献として引用されている米国特許出願第08/6 74,610号を参照されたい。 本機構によって利用される論理形式は好適には文章の主要な動詞と、動詞の実 際の主語(“深い主語”)である名詞と、動詞の実際の目的語(“深い目的語” )である名詞とを分離する。図5は一次論理形式のサンプルを示す論理形式図で ある。論理形式は3つの要素を有している。すなわち、深い主語の要素510と 、動詞の要素520と、深い目的語の要素530である。論理形式の深い主語は “男”という語の意味2であることが判る。1つ以上の意味を有する語の場 合の意味番号は、パーザが利用する言語知識ベースによって定義されたとおりに 語に付与された特定の意味を示すものである。例えば、“man”という語は人を 表す第1の意味と、大人の弾性を意味する第2の意味を有することができよう。 論理形式の動詞は“kiss”という語の第1の意味である。最後に、深い目的語は “pig”という語の第2の意味である。この論理形式の短縮バージョンはその第 1の要素として深い主語を有し、第2の要素として動詞を有し、かつ第3の要素 として深い目的語を有する順序付けされた3つの語である。 (man,kiss,pig) 図5に示した論理形式は多数の異なる文章と文章の断片を特徴付けるものであ る。例えば、図6は本機構がそのために図5に示した論理形式を構成する入力さ れたテキストを示す入力テキスト図である。図6は入力された文章の断片“mank issing a pig(子豚にキスしている男)”を示している。この語句は文書5の語番 号150で出現し、語の位置150、151、152、および153を占めてい ることが判る。本機構がこの入力テキストの断片をトークン化すると、図5に示 した論理形式が生成される。本機構は更に、入力された下記のテキスト・セグメ ントについても図5に示した論理形式を生成する。 The pig was kissed by an unusual man.(子豚が異常な男にキスされた。) The man will kiss the largest pig.(男が一番大きい子豚にキスするつもり だ。) Many pigs have been kissed by that man.(これまで多くの子豚がその男によ ってキスされた。) 前述したように、入力されたテキストを論理形式へと変換することによって、 修飾語が削除され、かつ時制と態の差が無視されることで入力されたテキストは その根底的な意味へと抽出されるので、入力されたテキスト・セグメントを論理 形式に変換することによって、同じ概念を表現するために自然語で用いられるこ とがある多くの異なる表現方法が統一される傾向がある。 図4に戻ると、本機構が入力されたテキストから図5に示した論理形式のよう な一次論理形式を構成した後、機構はステップ402を継続して総称語を用いて この一次論理形式を拡張する。ステップ402の後、トークン化ルーチンに戻る 。 前述したように、総称語は特定の語と“is a”(・・である)の関係を持って いる属の語である。例えば、“車両”という語は“自動車”の総称語である。本 機構は好適には言語知識ベースを用いて一次論理形式の語の総称語を識別する。 このような言語知識ベースは標準的には語の総称語を識別する意味論的なリンク を含んでいる。 図7Aは言語知識ベースによって識別される総称語の関係のサンプルを示す言 語知識ベース図である。図7Aは、それ以降の言語知識ベースと同様に、説明を 容易にするために簡略化されており、本明細書の説明には直接関連がなる言語知 識ベースに一般に見られる情報を省いていることに留意されたい。図7Aの各々 の上向きの矢印は語をその総称語に結び付けている。例えば、男(意味2)とい う語を人(意味1)という語714に結び付けた矢印があり、これは人(意味1 )が男(意味2)の総称語であることを示している。逆に、男(意味2)は人( 意味1)の“属性語”であるということができる。 一次論理形式をそれによって拡張する総称語を識別する際に、本機構は総称語 の属性語との“同類性”(coherency)に基づいて一次論理形式の各々の語ごとに 1つ、またはそれ以上の総称語を選択する。このようにして総称語を選択するこ とによって、本機構は入力されたテキスト・セグメントの意味を越えて、しかし 制御された分量だけ論理形式の意味を一般化する。一次論理形式の特定の語ごと に、本機構は一次論理形式の語に近い総称語を選択する。例えば、図7Aを参照 すると、一次論理形式で出現する男(意味2)7から始まって、本機構はその総 称語である人(意味1)714を選択する。次に本機構は、人(意味1)が最初 の語である男(意味2)711に対して設定された同類の総称語を有しているか 否かに基づいて、人(意味1)714、動物(意味3)715をも選択するか否 かを判定する。最初の語(意味2)711以外の、人と言う語のあらゆる意味の 多数の属性語が最初の語である男(意味2)711と少なくともしきい値レベル の同類性を備えている場合は、人(意味1)714は男(意味2)711に対し て設定された同類の属性語を有している。 総称語の異なる意味の属性語どうしの同類性のレベルを判定するため、本機構 は好適には言語知識ベースに諮ってこれらの語の文章どうしの同類性の度合いを 示す同類性の重みを得る。図7Bは男(意味2)と、人(意味1)および人(意 味5)の他の属性語との同類性の重みを示す言語知識ベースの図である。この図 は、男(意味2)と女(意味1)との同類性の重みが“0075”てあり、男( 意味2)と子供(意味1)との重みが“0029”であり、男(意味2)と悪役 (villain)(意味1)との重みが“0003”であり、男(意味2)と主役(意 味7)(lead)との重みが“0002”であることを示している。これらの同類 性の重みは好適には一対の語の意味間の言語知識ベースによって保持される意味 論的な関係のネットワークに基づいて、論理知識ベースによって計算される。言 語知識ベースを利用した一対の語の意味間の同類性の重みの詳細な説明について は、本発明に参考文献として引用されている米国特許出願第(特許 代理人の件番第661005.524号)、「語間の同類性の判定」を参照され たい。 これらの同類性の重みに基づいて属性語の集合が類似しているか否かを判定す るために、本機構はしきい値の数の同類性の重みが、同類性の重みのしきい値を 超えているか否かを判定する。好適なしきい値百分率は90%であるが、機構の 性能を最適化するため、好適にはしきい値百分率を調整してもよい。更に機構の 性能が最適化されるように同類性の重みのしきい値を構成してもよい。同類性の 重みのしきい値は好適には言語知識ベースによって得られる同類性の重みの全体 的な配分と調整される。ここでは“0015”のしきい値が用いられることが示 されている。従って本機構は最初の語と、総称語の全ての意味のその他の属性語 との間の同類性の重みの少なくとも90%が“0015”である同類性の重みの しきい値、またはそれ以上にあるか否かを判定する。図7Bから、この条件は男 (意味1)に対する人の属性語によっては満たされず、一方、男(意味1)と女 (意味1)との間の、および男(意味1)と子供(意味1)との間の同類性の重 みは“0015”以上であり、男(意味1)と悪役(意味1)との間の、および 男(意味1)と主役(意味7)との間の同類性の重みは“0015”未満である ことが判る。従って本機構はそれ以上の総称語・動物(意味3)715、または 動物(意味3)のどの総称語をも選択しない。その結果、一次論理形式を拡張す るために総称語・人(意味1)714が選択される。 一次論理形式を拡張するため、本機構は更に一次論理形式の動詞と深い目的語 の総称語をも選択する。図8は一次論理形式の動詞・キス(意味1)の総称語の 選択を示している。この図から、触れる(意味2)がキス(意味1)の総称語で あることが判る。図は更にキス(意味1)と、触れるの全ての意味のその他の属 性語との間の同類性の重みをも示している。本機構は先ず一次論理形式の動詞・ キス(意味1)に近い総称語である触れる(意味2)を選択する。触れる(意味 2)、相互に関係する(意味9)(interact)を選択するか否かを判定するため、 本機構はキス(意味1)と触れるの全ての意味のその他の属性語との間のどの位 の数の同類性の重みが、しきい値の同類性の重みと少なくとも同じ値であるかを 判定する。これらの4つの同類性の重みのうち2つしか“0015”である同類 性の重みのしきい値と少なくととも同じ値ではないので、本機構は触れる(意味 2)、互いに関係する(意味9)の総称語を選択することはない。 図9および図10は一次論理形式の深い目的語の総称語および子豚(意味21 )の選択を示す言語知識ベースの図である。図9から、豚(swine)の唯一の意味 の総称語の90%以上(実際には100%)が“0015”の同類性の重みのし きい値にあるか、それに近いので、本機構は一次論理形式を拡張するために子豚 (pig)(意味2)の総称語である豚(意味1)(swine)、並びに豚(意味1)( swine)の総称語である動物(意味3)(animal)を選択することが判る。図10 から、動物の意味の属性語の90%未満しか(実際には25%)“0015”、 または約“0015”の同類性の重みのしきい値にないので、本機構は継続して 動物(意味)の総称語である生物を選択することはないことが判る。 図11は拡張れた論理形式を示した論理形式図である。図11から、拡張され た論理形式の深い主語要素1110は男(意味2)という語1111に加えて総 称語の人(意味1)1112を含んでいることが判る。動詞要素1120はキス (意味1)1121という語と共に総称語である触れる(意味2)1122を含 んでいることが判る。更に、拡張された論理形式の深い目的語要素1130が、 子豚(意味2)(pig)1131に加えて、総称語である豚(意味1)(swine)と動 物(意味3)1132を含んでいることも判る。 拡張された論理形式の各要素において総称語をオリジナルの語で置換すること によって、本機構は意味が一次論理形式に適正に近似する適正に多数の派生的論 理形式を生成することができる。図12は拡張された一次論理形式を置換するこ とによって生成される派生的論理形式を示した図表である。図12から、このよ うな置換によって入力されたテキストの意味を各々が適正な正確さで特徴付ける 11の派生的論理形式が生成されることが判る。例えば、図12に示された派生 的な論理形式 (person,touch,pig)(人、触れる、子豚) は、意味的に文章の断片、 man kissing a pig(男が子豚にキスしている) に極めて類似している。 図11に示した拡張された論理形式は一次論理形式プラス、これらの11の派 生的論理形式を表しており、これらは拡張された論理形式1200としてよりコ ンパクトに表現されている。 ((男または人)、(キスまたは触れる)、(子豚または豚または動物)) 本機構はこの拡張された論理形式から、従来形の情報検索エンジンによる処理 が可能であるようにする論理トークンを生成する。最初に、本機構はある語が入 力されたテキスト・セグメント中に深い主語、動詞または深い目的語のどれとし て出現したかを識別する指定符号を、拡張された論理形式中の各語に添付する。 それによって、“man(男)”という語が深い主語として照会用に入力されたテキ スト・セグメント用の拡張論理形式に出現した場合、それが動詞であった拡張論 理形式の一部として索引に記憶されている“man(人員を配置する)”という語と 適合することが確実になくなる。論理形式の要素への指定符号のマッピングのサ ンプルは下記のとおりである。 論理形式要素 識別符号 深い主語 − 動詞 深い目的語 # 指定符号のこのようなサンプル・マッピングを利用して、論理形式用に生成さ れたトークン“(男、キス、子豚)”には“男_”、“キス^”、および“子豚 #”が含まれよう。 従来形の情報検索エンジンによって作成された索引(複数)は一般に各々のト ークンを目標文書のトークンが出現する特定箇所へとマッピングする。従来形の 情報検索エンジンは例えば、文書番号を用いてこのような目標文書を表し、トー クンの出現を含む目標文書を識別し、その目標文書中のトークンの出現箇所を特 定する。このような目標文書の箇所を発見することによって、従来形の情報検索 エンジンは、“PHRASE”(語句用)演算子を用いた照会に応答して目標文 書中に共に出現する語を識別することが可能であり、その際にPHRASE演算 子が結び付ける語は目標文書中の近くにある必要がある。例えば、“赤い PH RASE 自転車”という照会は、文書5の語611の“赤い”という語、およ び文書5の語612の“自転車という語の出現と適合するが、文書7、部762 の“赤い”という語、および文書7の語202の、“自転車”という語の出現と は適合しないであろう。目標文書の箇所を索引に記憶しておくことによって更に 、従来の情報検索エンジンが照会に応答して、照会がなされたトークンが目標文 書中に出現するポイントを特定することが可能になる。 目標文書の入力されたテキスト・セグメントから拡張された論理形式の場合は 、拡張された論理形式のトークンが目標文書のその箇所で出現しない場合でも、 本機構は好適には人工的な目標文書の箇所を各々のトークンに同様に割当てる。 これらの目標文書の箇所を割当てることによって、(A)従来形の探索エンジン がPHRASE演算子を利用して単一の一次、または派生的論理形式に対応する 意味論的トークンの組合わせを識別することと、(B)本機構が割当てられた箇 所を目標文書中の入力されたテキストの断片の実際の箇所と関連付けることの双 方が可能になる。従って本機構は意味論的なトークンに以下のように箇所を割当 てる。 論理形式要素 箇所 深い主語 (入力されたテキスト・セグメントの最 初の語の箇所) 動詞 (入力されたテキスト・セグメントの最 初の語の箇所)+1 深い目的語 (入力されたテキスト・セグメントの最 初の語の箇所)+2 従って本機構は文書5、語150で始まる文章から導出された“男、キス、子 豚)”について、拡張された論理形式のトークン用に目標文書の箇所を下記のよ うに割当てる。すなわち、“男_”および“人_”、文書5、語150;“キス ^”、および“触れる^”、文書5、語151、および“子豚#”および“豚# ”および“動物#”、文書5、語152である。 図3に戻ると、ステップ303で、本機構はトークン化ルーチンによって生成 されたトークンをそれらが出現する箇所と共に索引に記憶する。図13は索引の サンプル内容を示す索引図である。索引は各トークンから文書の特定、およびト ークンが出現する文書中の箇所までをマッピングする。索引中のマッピングをよ り明解に示すために索引は表として示されているが、実際には索引は好適には木 状形式のような、索引中のトークンの箇所をより効率よくサポートする多くの他 の形式の1つで記憶されることに留意されたい。更に、索引のサイズを最小限に するため、接頭圧縮のような技術を用いて索引の内容を圧縮することが好適であ る。 ステップ303に基づいて、本機構は各々の語のためのマッピングを拡張論理 形式で索引1300中に記憶していることが判る。マッピングは深い主語である “男”および“人”から目標文書の文書番号5、語番号150までのマッピング が索引に記憶されている。語番号150は図6に示した入力されたテキスト・セ グメントが開始される語の位置である。本機構は深い主語に対応するトークンに 指定符号“_”を添付したことが判る。この指定符号を添付することによって、 本機構は後に索引を探索する際に、論理形式の動詞または深い目的語として出現 するこれらの語の出現を検索せずに、論理形式の深い主語として出現するこれら の語の例だけを検索することができる。同様にして、索引は動詞の語である“キ ス”および“触れる”のトークンを含んでいる。これらの動詞語の入力によって これらの語は目標文書の文書5、語番号151の箇所に、目標文書の深い主語の 箇所の後に1語ずつマッピングされる。更に、指定符号“^”がこれらの動詞語 のためのトークンに添付されているので、これらの語がこのような形で出現して も、後に深い主語または深い目的語として出現したものとは見なされないことが 判る。同様にくして、索引は深い目的語“動物”、“子豚”、および“豚”のた めのトークンを含んでおり、これらの語は目標文書の文書番号5、語番号152 の箇所に、すなわち語句(PHRASE)が始まる目標文書の箇所から2語先の 箇所にマッピングされる。深い目的語を索引中で深い目的語として識別するため 、指定符号“#”が深い目的語のためのトークンに添付される。索引が図示した 状態にある場合、図12に示した派生的な一次論理形式のいずれかについて索引 を探索することによって、図6に示した入力されたテキストの断片を見出すこと ができる。 本機構が目標文書中に字句的に出現する語の、目標文書中のそれらの語の実際 の箇所へのマッピングと、同じ索引中の目標文書の意味論的な表示の双方を記憶 する好適な実施例では、索引中でアクセスされた場合に意味論的な表示の意味論 的なトークンと字句的なトークンとを区別するために、意味論的表示の各々の意 味論的トークンの語番号の値は、好適にはいずれかの文書中の語の番号よりも大 きい定数だけ増分される。図13を簡略にするため、この定数の追加は図示して いない。 この例では、本機構は拡張された論理形式の各々の語のためのトークンを索引 に追加して、目標文書の意味論的な表示を形成する。しかし、好適な1実施例で は、本機構はそれが索引に追加する拡張された論理形式のトークンの集合を、目 標文書中の文書どうしを区別するのに有効であると思われる論理形式のトークン に限定する。索引に追加される拡張された論理形式のトークンの集合をこのよう に限定するため、本機構は好適には各トークンの逆文書頻度(Inverse Document Frequency)を判定する。その公式は下記の方程式(1)によって示されている。 この実施例では、本機構はその逆文書頻度が最大しきい値を超えるトークンだけ を索引に追加する。 図3に戻ると、トークンを索引に記憶した後、目標文書中の目下の文章の処理 前にステップ304で、本機構は目標文書中の次の文章を処理するためにステッ プ301に戻って循環する。目標文書の全ての文章の処理が終了した後、本機構 はステップ305に進行する。ステップ305で、本機構は照会のテキストを受 理する。ステップ306−308で、本機構は受理した照会を処理する。ステッ プ306では、本機構はトークン化ルーチンを呼出して照会テキストをトークン 化する。図14はステップ401(図4)に従って“馬にキスする男”という照 会のために本機構が好適に構成する論理形式を示す論理形式図である。この論理 形式図から、深い主語が男(意味2)であり、動詞がキス(意味1)であり、深 い目的語が馬(意味1)であることが判る。この一次論理形式は一次論理形式1 450で、 (男、キス、馬) としてより簡潔に表示される。 図15はステップ402(図4)に基づいて総称語を用いた一次論理形式の拡 張を示している。図15から、目標文書からのサンプルの入力テキストと同様に 、深い主語である男(意味2)が総称語である人(意味1)によって拡張され、 動詞・キス(意味1)が総称語である触れる(意味2)で拡張されたことが判る 。更に、深い目的語・馬(意味1)が総称語・動物(意味3)で拡張されたこと が判る。 図16は照会論理形式の深い目的語・馬(意味1)の総称語の選択を示す言語 知識ベース図である。図16から、動物(意味3)の総称語の90%未満しか“ 0015”である同類性の重みのしきい値、またはそれ以上にはないので、本機 構は動物(意味3)の総称語である生物(意味1)を選択しないことが判る。 従って、本機構は論理形式を拡張するために総称語・動物(意味3)だけを用い るのである。 図3に戻ると、ステップ307で本機構は一次論理形式の語の意味の総称語を 用いて構成された拡張論理形式1550(図15)を用いて、適合するトークン が出現する目標文書中の箇所を索引箇所から検索する。本機構は好適には索引に 下記の照会を発することによって上記の動作を行う。 (男_または人_)PHRASE(キス^または触れる^)PHRASE(馬 #または動物#) PHRASE演算子は先行する演算数(オペランド)よりも1つだけ大きい語 の箇所で後続の演算数の出現を突合わせる(match)。従って、照会によって深 い主語である男_または人_が、深い目的語である馬#または動物#に先行する 動詞キス^または触れる^に先行する箇所が突合わせされる。図13の索引から 、この照会が文書番号5、語番号150で満たされることが判る。 前記照会が索引中で満たされない場合は、本機構は異なる2つの部分的照会に よって照会の提出を継続する。第1の部分的形式には深い主語と動詞だけが含ま れ、目的語は含まれない。 (男_または人_)PHRASE(キス^または触れる^) 図17はこの第1の照会に対応する部分的論理形式を示した部分的論理形式図 である。照会の第2の部分的形式には動詞と深い目的語が含まれるが、深い主語 は含まれない。 (キス^または触れる^)PHRASE(馬#または動物#) 図18はこの第2の照会に対応する部分的論理形式を示した部分的論理形式図 である。これらの部分的照会によって索引中の異なる深い主語または深い目的語 を有する部分的論理形式の突合わせが行われ、また、深い主語または深い目的語 を有していない部分的な論理形式が突合わせされよう。これらの部分的突合わせ は、照会のための入力テキスト・セグメントと、代名詞の使用および暗示された 深い主語および深い目的語を含む目標文書の入力テキスト・セグメントとの差を 考慮に入れている。 図3に戻ると、索引中のトークンの適合の有無を識別した後、本機構は継続し てステップ308で、一次論理形式または派生的論理形式に対応して、突合わせ トークンの特定の組合わせが照会に対する関連性が高い順序で出現する目標文書 のランク付けを行う。本発明の様々な実施例において、本機構は関連性に応じた 文書のランク付けのための多数の公知のアプローチのうちの1つ、または複数の 方法を利用し、それにはジャッカード(Jaccard)重み付けおよび2進項目インピ ーダンス重み付けが含まれる。本機構は好適には適合する目標文書をランク付け するために逆文書頻度と項目頻度待機の組み合わせを利用する。 逆文書頻度重み付けの特徴は、文書間でより少ない目標文書に出現するトーク ンの組合わせに、より大きい重みを付与する文書を区別するトークン組合わせの 能力にある。例えば、写真の主題に関する目標文書群の場合、論理形式、 (写真家、フレーム、主題) は、各文書群に出現する可能性があり、従って文書間を区別するための極めて良 好な基準にはならないであろう。上記の論理形式は全ての目標文書に出現するの で、その逆文書頻度は比較的少ない。トークンの組合わせの逆文書頻度の公式は 下記のとおりである。 文書中のトークンの組合わせの項目頻度の重み付けは、ある文書がトークンの 組合わせ専用である度合いの尺度であり、かつ特定の照会トークンがより高頻度 で出現する文書は照会トークンがより少ない頻度で出現する文書よりも関連性が 高いものと想定されている。文書中のトークンの組合わせの項目頻度の重みの公 式は下記のとおりである。 項目頻度(トークンの組合わせ)=文書中でトークンの組合わせが出現する数 (2) 本機構は各々の突合わせ文書ごとにスコアを用いて文書をランク付けする。本 機構は先ず下記の公式を用いて各文書中の各々の突合わせトークンの組合わせの スコアを計算する。 スコア(トークンの組合わせ、文書)=逆文書頻度(トークンの組合わせ)x 項目頻度(トークンの組合わせ、文書) (3) 次に本機構は下記の公式に基づいて各突合わせ文書中に適合するトークンの組 合わせがあればその最高スコアを選択することによって、各突合わせ文書のスコ アを計算する。 本機構が各文書についてスコアの計算を終了すると、本機構はこれらのスコー を増倍して、意味論的な突合わせとは別の照会の項目を反映するようにしてもよ い。各文書ごとにスコアを増倍した後、必要ならば本機構は下記の公式に示すよ うに文書のサイズを考慮に入れて各文書の正規化されたスコアを計算する。 サイズ(文書)の項目は例えば文書中の文字数、語、または文書または文書の 断片のような文書のサイズのいずれかの適正な尺度でよい。あるいは、余弦尺度 による正規化、項目の重みの合計による正規化、および最高の項目重みによる正 規化を含む、他の多くの正規化技術を用いて文書スコアを正規化してもよい。 各突合わせ文書ごとに正規化されたスコアを計算した後、本機構は文書の正規 化されたスコア順に突合わせ文書のランク付けを行う。ユーザーは好適にはラン ク付けされた突合わせ文書の1つを選択して、その文書中の適合するトークンの 箇所を探し、またはその文書の適合部分が表示されるようにしてもよい。 図3を参照すると、ステップ308で突合わせ目標文書のランク付けを行った 後、本機構は好適にはステップ305で索引に対する次の照会テキストを受理す る。 上記は突合わせトークンを含む文書の関連性によるランク付けを説明したもの である。本発明の更に別の好適な実施例は同様に、適合が含まれる、関連性があ る文書群と文書部分のそれぞれによってランク付けを行う。各々が1つ、または それ以上の文書を含む文書群へと編成された目標文書の場合は、本機構は好適に は、更なる照会のために最も関連性が高い文書群を特定するために、適合が出現 する文書群を関連性によってランク付けする。更に、本機構は好適には各々の目 標文書を各部分に分割し、適合が出現する文書部分の関連性をランク付ける。こ れらの文書部分はある数のバイト、語、または文章を選択するか、または目標文 書中に出現する構造的、書式的、または言語的なキューを用いて目標文書中で連 続的に特定される。更に本機構は好適には特定のテーマに関する非連続的な文書 部分を特定することもできる。 これまで本発明を特定の実施例を参考にして図示し、説明してきたが、本発明 の範囲を離れることなく形式と細部の多くの変更または修正が可能てあることが 当業者には理解されよう。例えば、トークナイザを直截に、論理形式構造の1つ の語に各々が対応するトークンの代わりに、完全な論理形式構造に各々が対応す るトークンを作成し、索引に記憶されるようにしてもよい。更に、意味論的な突 合わせ成分を有する照会に他の種類の探索方法を組入れるために様々な公知の技 術を適用してもよい。更に、照会には多数の意味論的な突合わせ成分が含まれる ようにしてもよい。加えて、総称語以外に語間で識別される意味論的な関係性を 利用して、一次論理形式を拡張してもよい。本機構は更に、前述のルーチンで字 句知識ベースから総称語のリストを作成するのではなく、一次論理形式の各語に ついて予め承認された代用可能な語のリストを利用して一次論理形式を拡張して もよい。更に、突合わせの精度を更に高めるため、トークナイザは語に特定され た意味番号を語のためのトークン中でエンコードしてもよい。この場合は、総称 語の集合の同類性のためのテストは、選択された総称語の全ての意味との類似性 のテストよりも軽減される。1例では、人という語の意味1の総称語だけが男( 意味2)という語の最初の意味との同類性のしきい値レベルにあればよい。可能 性がある索引中の突合わせ項目には曖味さが少ないので、誤った適合を生ずるこ とがある項目の集合を制限することができる。このような理由から、論理形式の 語と総称語の関係にある意味だけをテストすればよい。
【手続補正書】特許法第184条の8第1項 【提出日】平成11年5月10日(1999.5.10) 【補正内容】 請求の範囲 1.コンピュータ・システムで、ある所定の意味論的な機能を満たす語を各々が 指定する論理形式を利用して、入力入力されたストリングから情報検索トーク ンを生成する方法において、 入力ストリング中の選択された語間の意味論的な関係を特徴付ける一次論理 形式を該入力ストリングから作成するステップと、 選択された語と意味的に充分に近い選択された入力ストリング中の語の総称 語を識別するステップと、 入力ストリング中の選択された単数または複数の語の各々について、一次論 理形式の選択された語を、選択された語の識別された総称語で置換することに よって各々が構成された単数または複数の代替論理形式を一次論理形式から構 成するステップと、 一次論理形式と代替論理形式の双方を表するトークンを生成し、生成された トークンを情報検索エンジンにより区別することができることで、成分にアク セスし、かつ成分に比較処理を施すステップと、からなることを特徴とする方 法。 2.前記構成ステップが入力ストリングを分解してその構文的、および意味論的 構造を識別するステップを含むことを特徴とする請求の範囲第1項に記載の方 法。 3.前記識別ステップが、 入力されたデータの選択された各々の語について、 言語知識ベースから各々が選択された語に対する総称語の意味の同類性を特 徴付ける同類性の数値を有する、選択された語の単数または複数の総称語を検 索するステップと、 同類性の値が所定のしきい値を超えるいずれかの総称語を識別するステップ と、 を含むことを特徴とする請求の範囲第1項に記載の方法。 4.前記構成ステップの前に、探索照会から入力ストリングを選択するステップ と、 単数または複数の目標文書の表示と比較するために、生成されたトークンを 照会エンジンに提出するステップと、 を更に含むことを特徴とする請求の範囲第1項に記載の方法。 5.前記構成ステップの前に、索引付けされる本文からの入力ストリングを選択 するステップと、 生成されたトークンをテキストの本文を表す索引に記憶するために索引サブ システムに提出するステップと、 を更に含むことを特徴とする請求の範囲第1項に記載の方法。 6.代替論理形式に出現する各々の語の逆文書頻度を判定するステップを更に含 み、前記提出ステップは、逆文書頻度が所定の最低逆文書頻度よりも低い語を 含む代替論理形式を表すトークンを索引サブシステムに提出することを省くこ とを特徴とする請求の範囲第5項に記載の方法。 7.前記提出ステップの後、代替論理形式に出現する各々の語の逆文書頻度を判 定するステップと、 逆文書頻度が所定の最低逆文書頻度よりも低い語を含む代替論理形式を表す トークンを索引から除去するステップと、 を更に含むことを特徴とする請求の範囲第5項に記載の方法。 8.前記識別ステップが、選択された語に対して同類性がある属性語の集合を有 する選択された語の総称語を識別することを特徴とする請求の範囲第1項に記 載の方法。 9.入力ストリング中の選択された語間の意味論的な関係を特徴付ける一次論理 形式を入力ストリンクから作成するステップと、 選択された語の意味に充分に近い入力ストリング中の選択された語の総称語 を識別するステップと、 入力ストリング中の単数または複数の選択された語の各々について、一次論 理形式中の選択された語を選択された語の識別された総称語で置換するために よって各々が構成された単数または複数の代替論理形式を一次論理形式から構 成するステップと、 一次論理形式と代替論理形式の双方を表するトークンを生成し、生成された トークンを情報検索エンジンにより区別することができることで、成分にアク セスし、かつ成分に比較処理を施すステップと生成されたトークンを情報検索 エンジンにより区別することができるようにするステップと、を実行すること によって、ある所定の意味論的な機能を満たす語を各々が特定する論理形式を 用いて、コンピュータ・システムが入力ストリングから情報検索トークンを生 成するように構成されたコンピュータによる読出し可能な媒体。 10.前記構成ステップが、入力ストリングを分解して、その構文的、および意味 論的構造を識別できるようにするステップを更に含むことを特徴とする請求の 範囲第9項に記載のコンピュータによる読出し可能な媒体。 11.前記識別ステップが、 入力されたデータの選択された各々の語について、 言語知識ベースから各々が選択された語に対する総称語の意味の同類性を特 徴付ける同類性の数値を有する、選択された語の単数または複数の総称語を検 索するステップと、 同類性の値が所定のしきい値を超えるいずれかの総称語を識別するステップ と、 を含むことを特徴とする請求の範囲第9項に記載のコンピュータによる読出し 可能な媒体。 12.前記構成ステップの前に、探索照会から入力ストリングを選択するステップ と、 単数または複数の目標文書の表示と比較するために、生成されたトークンを 照会エンジンに提出するステップと、 を更に含むことを特徴とする請求の範囲第9項に記載のコンピュータによる読 出し可能な媒体。 13.コンピュータによる読出しが可能な媒体の内容によって、コンピュータ・シ ステムが、 前記構成ステップの前に、索引付けされる本文からの入力ストリングを選択 するステップと、 生成されたトークンをテキストの本文を表す索引に記憶するために索引サブ システムに提出するステップと、 を実行するように構成されたことを特徴とする請求の範囲第9項に記載のコン ピュータによる読出し可能な媒体。 14.単数または複数の目標文書の内容を特徴付ける文書索引付けデータ構造を含 むコンピュータ・メモリであって、前記文書索引付けデータ構造は目標文書中 の語から箇所までマッピングし、前記文書索引付けデータ構造は目標文書に出 現する語の複数の語句(passage)ごとに、前記語句によって生成された論理形 式に含まれる語から前記語句に対応する箇所まで、また前記語句によって生成 された論理形式に含まれる部の総称語から前記語句に対応する箇所までマッピ ングすることで、照会に応答して、照会の語句と意味論的に類似する目標文書 の語句箇所を特定するために文書索引付けデータ構造を利用できるようにされ たことを特徴とするコンピュータ・メモリ。 15.文書索引付けデータ構造がいずれの目標文書にも出現しない少なくとも1つ の語から目標文書中の箇所をマッピングすることを特徴とする請求の範囲第1 4項に記載のコンピュータ・メモリ。 16.単数または複数の目標文書に対する語の使うを含む照会に応答するコンピュ ータ・システムであって、各々の目標文書は単数または複数の語の語句からな っており、各々の目標文書の語句が目標文書内に箇所を有している形式のコン ピュータ・システムにおいて、 目標文書を受理するための目標文書レシーバと、 目標文書に関する照会を受理するための照会レシーバと、 目標文書レシーバから受理した目標文書の語句、および照会レシーバから受 理した照会の語句からトークンを生成するトークナイザであって、ある所定の 意味論的な機能を満たす語を特定することによって、各々の語句から前記語句 の意味論的構造を特徴付ける論理形式を合成する論理形式シンセサイザを含ん でおり、語句から合成された論理形式を表すトークンを生成して、照会処理サ ブシステムがトークンの成分にアクセスし、かつそれらに比較処理を施すトー クナイザと、目標文書の語句から生成された各トークンから、トークンが生成 された目標文書の語句の目標文書中の箇所までマッピングする関係性を記憶 する索引メモリと、 各照会ごとに、照会により生成されたトークンと適合するトークンを索引メ モリから識別し、かつ識別されたトークンからマッピングされた箇所の表示を 戻すための照会処理サブシステムと、 を備えてなることを特徴とするコンピュータ・システム。 17.シンセサイザから論理形式によって合成された論理形式(複数)が語を含む と共に、トークナイザが更に、 論理形式シンセサイザによって合成された各論理形式から、論理形式中の単 数または複数の語が意味が充分に近い総称語で置換される単数または複数の論 理形式を作成するための総称語拡張サブシステムを更に含み、 前記トークナイザは更に総称語拡張サブシステムによって作成された補足論 理形式を表すトークンを生成することを特徴とする請求の範囲第16項に記載 のコンピュータ・システム。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ヘイドーン ジョージ イー アメリカ合衆国 ワシントン州 98008 ベルヴィュー ワンハンドレッドアンドシ ックスティーフィフス プレイス ノース イースト 3211 (72)発明者 リチャードソン スティーブン ディー アメリカ合衆国 ワシントン州 98052 レッドモンド ノースイースト ワンハン ドレッドアンドサーティセカンド 18028 (72)発明者 ドーラン ウィリアム ビー アメリカ合衆国 ワシントン州 98052 レッドモンド ノースイースト ワンハン ドレッドアンドフィフティーサード コー ト 7412 (72)発明者 ジェンセン カレン アメリカ合衆国 ワシントン州 98008 ベルヴィュー ワンハンドレッドアンドシ ックスティーフィフス プレイス ノース イースト 3211

Claims (1)

  1. 【特許請求の範囲】 1.コンピュータ・システムで入力されたストリングから情報検索トークンを生 成する方法において、 入力ストリング中の選択された語間の意味論的な関係を特徴付ける一次論理 形式を該入力ストリングから作成するステップと、 選択された入力ストリング中の語の総称語を識別するステップと、 入力ストリング中の選択された単数または複数の語の各々について、一次論 理形式の選択された語を、選択された語の識別された総称語で置換することに よって各々が構成された単数または複数の代替論理形式を一次論理形式から構 成するステップと、 一次論理形式と代替論理形式の双方を表するトークンを生成し、生成された トークンを情報検索エンジンにより区別することができるようにするステップ と、からなることを特徴とする方法。 2.前記構成ステップが入力ストリングを分解してその構文的、および意味論的 構造を識別するステップを含むことを特徴とする請求の範囲第1項に記載の方 法。 3.前記識別ステップが、 入力されたデータの選択された各々の語について、 言語知識ベースから各々が選択された語に対する総称語の意味の同類性を特 徴付ける同類性の数値を有する、選択された語の単数または複数の総称語を検 索するステップと、 同類性の値が所定のしきい値を超えるいずれかの総称語を識別するステップ と、 を含むことを特徴とする請求の範囲第1項に記載の方法。 4.前記構成ステップの前に、探索照会から入力ストリングを選択するステップ と、 単数または複数の目標文書の表示と比較するために、生成されたトークンを 照会エンジンに提出するステップと、 を更に含むことを特徴とする請求の範囲第1項に記載の方法。 5.前記構成ステップの前に、索引付けされる本文からの入力ストリングを選択 するステップと、 生成されたトークンをテキストの本文を表す索引に記憶するために索引サブ システムに提出するステップと、 を更に含むことを特徴とする請求の範囲第1項に記載の方法。 6.代替論理形式に出現する各々の語の逆文書頻度を判定するステップを更に含 み、前記提出ステップは、逆文書頻度が所定の最低逆文書頻度よりも低い語を 含む代替論理形式を表すトークンを索引サブシステムに提出することを省くこ とを特徴とする請求の範囲第5項に記載の方法。 7.前記提出ステップの後、代替論理形式に出現する各々の語の逆文書頻度を判 定するステップと、 逆文書頻度が所定の最低逆文書頻度よりも低い語を含む代替論理形式を表す トークンを索引から除去するステップと、 を更に含むことを特徴とする請求の範囲第5項に記載の方法。 8.前記識別ステップが、選択された語に対して同類性がある属性語の集合を有 する選択された語の総称語を識別することを特徴とする請求の範囲第1項に記 載の方法。 9.入力ストリング中の選択された語間の意味論的な関係を特徴付ける一次論理 形式を入力ストリンクから作成するステップと、 入力ストリング中の選択された語の総称語を識別するステップと、 入力ストリング中の単数または複数の選択された語の各々について、一次論 理形式中の選択された語を選択された語の識別された総称語で置換するために よって各々が構成された単数または複数の代替論理形式を一次論理形式から構 成するステップと、 一次論理形式と代替論理形式の双方を表するトークンを生成し、生成された トークンを情報検索エンジンにより区別することができるようにするステップ と、を実行することによって、媒体の内容によってコンピュータ・システムが 入力ストリングから情報検索トークンを生成するように構成されたコンピュー タによる読出し可能な媒体。 10.前記構成ステップが、入力ストリングを分解して、その構文的、および意味 論的構造を識別できるようにするステップを更に含むことを特徴とする請求の 範囲第9項に記載のコンピュータによる読出し可能な媒体。 11.前記識別ステップが、 入力されたデータの選択された各々の語について、 言語知識ベースから各々が選択された語に対する総称語の意味の同類性を特 徴付ける同類性の数値を有する、選択された語の単数または複数の総称語を検 索するステップと、 同類性の値が所定のしきい値を超えるいずれかの総称語を識別するステップ と、 を含むことを特徴とする請求の範囲第9項に記載のコンピュータによる読出し 可能な媒体。 12.前記構成ステップの前に、探索照会から入力ストリングを選択するステップ と、 単数または複数の目標文書の表示と比較するために、生成されたトークンを 照会エンジンに提出するステップと、 を更に含むことを特徴とする請求の範囲第9項に記載のコンピュータによる読 出し可能な媒体。 13.コンピュータによる読出しが可能な媒体の内容によって、コンピュータ・シ ステムが、 前記構成ステップの前に、索引付けされる本文からの入力ストリングを選択 するステップと、 生成されたトークンをテキストの本文を表す索引に記憶するために索引サブ システムに提出するステップと、 を実行するように構成されたことを特徴とする請求の範囲第9項に記載のコン ピュータによる読出し可能な媒体。 14.単数または複数の目標文書の内容を特徴付ける文書索引付けデータ構造を含 むコンピュータ・メモリであって、前記文書索引付けデータ構造は目標文書中 の語から箇所までマッピングし、前記文書索引付けデータ構造は目標文書に出 現する語の複数の語句(passage)ごとに、前記語句によって生成された論理形 式に含まれる語から前記語句に対応する箇所まで、また前記語句によって生成 された論理形式に含まれる部の総称語から前記語句に対応する箇所までマッピ ングすることで、照会に応答して、照会の語句と意味論的に類似する目標文書 の語句箇所を特定するために文書索引付けデータ構造を利用できるようにされ たことを特徴とするコンピュータ・メモリ。 15.文書索引付けデータ構造がいずれの目標文書にも出現しない少なくとも1つ の語から目標文書中の箇所をマッピングすることを特徴とする請求の範囲第1 4項に記載のコンピュータ・メモリ。 16.単数または複数の目標文書に対する語の使うを含む照会に応答するコンピュ ータ・システムであって、各々の目標文書は単数または複数の語の語句からな っており、各々の目標文書の語句が目標文書内に箇所を有している形式のコン ピュータ・システムにおいて、 目標文書を受理するための目標文書レシーバと、 目標文書に関する照会を受理するための照会レシーバと、 目標文書レシーバから受理した目標文書の語句、および照会レシーバから受 理した照会の語句からトークンを生成するトークナイザであって、各々の語句 から前記語句の意味論的構造を特徴付ける論理形式を合成する論理形式シンセ サイザを含んでおり、語句から合成された論理形式を表すトークンを生成する トークナイザと、目標文書の語句から生成された各トークンから、トークンが 生成された目標文書の語句の目標文書中の箇所までマッピングする関係性を記 憶する索引メモリと、 各照会ごとに、照会により生成されたトークンと適合するトークンを索引メ モリから識別し、かつ識別されたトークンからマッピングされた箇所の表示を 戻すための照会処理サブシステムと、 を備えてなることを特徴とするコンピュータ・システム。 17.シンセサイザから論理形式によって合成された論理形式(複数)が語を含む と共に、トークナイザが更に、 論理形式シンセサイザによって合成された各論理形式から、論理形式中の単 数または複数の語が総称語で置換される単数または複数の論理形式を作成するた めの総称語拡張サブシステムを更に含み、 前記トークナイザは更に総称語拡張サブシステムによって作成された補足論理 形式を表すトークンを生成することを特徴とする請求の範囲第16項に記載のコ ンピュータ・システム。
JP53853998A 1997-03-07 1998-02-11 テキストの意味論的表現を利用した情報の検索 Expired - Lifetime JP4282769B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/886,814 1997-03-07
US08/886,814 US6076051A (en) 1997-03-07 1997-03-07 Information retrieval utilizing semantic representation of text
PCT/US1998/003005 WO1998039714A1 (en) 1997-03-07 1998-02-11 Information retrieval utilizing semantic representation of text

Publications (2)

Publication Number Publication Date
JP2001513243A true JP2001513243A (ja) 2001-08-28
JP4282769B2 JP4282769B2 (ja) 2009-06-24

Family

ID=25389830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53853998A Expired - Lifetime JP4282769B2 (ja) 1997-03-07 1998-02-11 テキストの意味論的表現を利用した情報の検索

Country Status (5)

Country Link
US (5) US6076051A (ja)
EP (1) EP0965089B1 (ja)
JP (1) JP4282769B2 (ja)
CN (1) CN1252876A (ja)
WO (1) WO1998039714A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010538375A (ja) * 2007-08-31 2010-12-09 マイクロソフト コーポレーション 間接話法内の意味論的関係の識別
US8065307B2 (en) 2006-12-20 2011-11-22 Microsoft Corporation Parsing, analysis and scoring of document content
JP2012150751A (ja) * 2011-01-21 2012-08-09 Bank Of Tokyo-Mitsubishi Ufj Ltd 検索装置
JP2012203779A (ja) * 2011-03-28 2012-10-22 Fuji Xerox Co Ltd プログラム及び情報処理装置
JP2015138351A (ja) * 2014-01-21 2015-07-30 富士通株式会社 情報検索装置、情報検索方法および情報検索プログラム
US9449081B2 (en) 2007-08-31 2016-09-20 Microsoft Corporation Identification of semantic relationships within reported speech
JP7351372B2 (ja) 2018-04-12 2023-09-27 富士通株式会社 生成プログラム、生成方法および情報処理装置

Families Citing this family (583)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8725493B2 (en) * 2004-01-06 2014-05-13 Neuric Llc Natural language parsing method to provide conceptual flow
US7089218B1 (en) 2004-01-06 2006-08-08 Neuric Technologies, Llc Method for inclusion of psychological temperament in an electronic emulation of the human brain
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6243670B1 (en) * 1998-09-02 2001-06-05 Nippon Telegraph And Telephone Corporation Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
GB9821969D0 (en) * 1998-10-08 1998-12-02 Canon Kk Apparatus and method for processing natural language
US6964011B1 (en) * 1998-11-26 2005-11-08 Canon Kabushiki Kaisha Document type definition generating method and apparatus, and storage medium for storing program
US6654754B1 (en) * 1998-12-08 2003-11-25 Inceptor, Inc. System and method of dynamically generating an electronic document based upon data analysis
US6233547B1 (en) * 1998-12-08 2001-05-15 Eastman Kodak Company Computer program product for retrieving multi-media objects using a natural language having a pronoun
US6993580B2 (en) * 1999-01-25 2006-01-31 Airclic Inc. Method and system for sharing end user information on network
GB9904662D0 (en) * 1999-03-01 1999-04-21 Canon Kk Natural language search method and apparatus
CA2272739C (en) * 1999-05-25 2003-10-07 Suhayya Abu-Hakima Apparatus and method for interpreting and intelligently managing electronic messages
US6901402B1 (en) * 1999-06-18 2005-05-31 Microsoft Corporation System for improving the performance of information retrieval-type tasks by identifying the relations of constituents
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US6816857B1 (en) 1999-11-01 2004-11-09 Applied Semantics, Inc. Meaning-based advertising and document relevance determination
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US8793160B2 (en) 1999-12-07 2014-07-29 Steve Sorem System and method for processing transactions
US6823492B1 (en) * 2000-01-06 2004-11-23 Sun Microsystems, Inc. Method and apparatus for creating an index for a structured document based on a stylesheet
US6751621B1 (en) 2000-01-27 2004-06-15 Manning & Napier Information Services, Llc. Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors
GB0006159D0 (en) * 2000-03-14 2000-05-03 Ncr Int Inc Predicting future behaviour of an individual
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7392174B2 (en) * 2000-03-20 2008-06-24 Freeman Robert J Natural-language processing system using a large corpus
US7428500B1 (en) * 2000-03-30 2008-09-23 Amazon. Com, Inc. Automatically identifying similar purchasing opportunities
US20010039490A1 (en) * 2000-04-03 2001-11-08 Mikhail Verbitsky System and method of analyzing and comparing entity documents
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US7962326B2 (en) * 2000-04-20 2011-06-14 Invention Machine Corporation Semantic answering system and method
US20020010574A1 (en) * 2000-04-20 2002-01-24 Valery Tsourikov Natural language processing and query driven information retrieval
US7912868B2 (en) * 2000-05-02 2011-03-22 Textwise Llc Advertisement placement method and system using semantic analysis
AU2001271397A1 (en) * 2000-06-23 2002-01-08 Decis E-Direct, Inc. Component models
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US8200485B1 (en) * 2000-08-29 2012-06-12 A9.Com, Inc. Voice interface and methods for improving recognition accuracy of voice search queries
US7328211B2 (en) * 2000-09-21 2008-02-05 Jpmorgan Chase Bank, N.A. System and methods for improved linguistic pattern matching
US7085708B2 (en) 2000-09-23 2006-08-01 Ravenflow, Inc. Computer system with natural language to machine language translator
US20020143524A1 (en) * 2000-09-29 2002-10-03 Lingomotors, Inc. Method and resulting system for integrating a query reformation module onto an information retrieval system
US7346495B1 (en) * 2000-09-30 2008-03-18 Intel Corporation Method and system for building a domain specific statistical language model from rule based grammar specifications
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7146349B2 (en) * 2000-11-06 2006-12-05 International Business Machines Corporation Network for describing multimedia information
US6978419B1 (en) * 2000-11-15 2005-12-20 Justsystem Corporation Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments
US20020091671A1 (en) * 2000-11-23 2002-07-11 Andreas Prokoph Method and system for data retrieval in large collections of data
US7013308B1 (en) 2000-11-28 2006-03-14 Semscript Ltd. Knowledge storage and retrieval system and method
US20030028564A1 (en) * 2000-12-19 2003-02-06 Lingomotors, Inc. Natural language method and system for matching and ranking documents in terms of semantic relatedness
US7346491B2 (en) * 2001-01-04 2008-03-18 Agency For Science, Technology And Research Method of text similarity measurement
US6766316B2 (en) 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US20020133392A1 (en) * 2001-02-22 2002-09-19 Angel Mark A. Distributed customer relationship management systems and methods
US6823333B2 (en) 2001-03-02 2004-11-23 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for conducting a keyterm search
US6721728B2 (en) 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
US6697793B2 (en) 2001-03-02 2004-02-24 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for generating phrases from a database
US6741981B2 (en) 2001-03-02 2004-05-25 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) System, method and apparatus for conducting a phrase search
US6813616B2 (en) * 2001-03-07 2004-11-02 International Business Machines Corporation System and method for building a semantic network capable of identifying word patterns in text
US7426505B2 (en) 2001-03-07 2008-09-16 International Business Machines Corporation Method for identifying word patterns in text
US7194454B2 (en) * 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
US8744835B2 (en) * 2001-03-16 2014-06-03 Meaningful Machines Llc Content conversion method and apparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US6847974B2 (en) * 2001-03-26 2005-01-25 Us Search.Com Inc Method and apparatus for intelligent data assimilation
US7146308B2 (en) * 2001-04-05 2006-12-05 Dekang Lin Discovery of inference rules from text
US6904428B2 (en) * 2001-04-18 2005-06-07 Illinois Institute Of Technology Intranet mediator
GB2375192B (en) * 2001-04-27 2003-04-16 Premier Systems Technology Ltd Search engine systems
US6829605B2 (en) * 2001-05-24 2004-12-07 Microsoft Corporation Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval
SG103289A1 (en) * 2001-05-25 2004-04-29 Meng Soon Cheo System for indexing textual and non-textual files
US7050964B2 (en) * 2001-06-01 2006-05-23 Microsoft Corporation Scaleable machine translation system
US7734459B2 (en) * 2001-06-01 2010-06-08 Microsoft Corporation Automatic extraction of transfer mappings from bilingual corpora
US7003444B2 (en) * 2001-07-12 2006-02-21 Microsoft Corporation Method and apparatus for improved grammar checking using a stochastic parser
US8799776B2 (en) * 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US7251781B2 (en) * 2001-07-31 2007-07-31 Invention Machine Corporation Computer based summarization of natural language documents
US6609124B2 (en) 2001-08-13 2003-08-19 International Business Machines Corporation Hub for strategic intelligence
US7133862B2 (en) 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US7284191B2 (en) * 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US8020754B2 (en) 2001-08-13 2011-09-20 Jpmorgan Chase Bank, N.A. System and method for funding a collective account by use of an electronic tag
US7526425B2 (en) * 2001-08-14 2009-04-28 Evri Inc. Method and system for extending keyword searching to syntactically and semantically annotated data
US7047183B2 (en) * 2001-08-21 2006-05-16 Microsoft Corporation Method and apparatus for using wildcards in semantic parsing
US7024351B2 (en) * 2001-08-21 2006-04-04 Microsoft Corporation Method and apparatus for robust efficient parsing
US7403938B2 (en) * 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
JP4065936B2 (ja) * 2001-10-09 2008-03-26 独立行政法人情報通信研究機構 機械学習法を用いた言語解析処理システムおよび機械学習法を用いた言語省略解析処理システム
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US7194464B2 (en) 2001-12-07 2007-03-20 Websense, Inc. System and method for adapting an internet filter
US7231343B1 (en) * 2001-12-20 2007-06-12 Ianywhere Solutions, Inc. Synonyms mechanism for natural language systems
US20030172368A1 (en) * 2001-12-26 2003-09-11 Elizabeth Alumbaugh System and method for autonomously generating heterogeneous data source interoperability bridges based on semantic modeling derived from self adapting ontology
US7137062B2 (en) * 2001-12-28 2006-11-14 International Business Machines Corporation System and method for hierarchical segmentation with latent semantic indexing in scale space
US7295966B2 (en) * 2002-01-14 2007-11-13 Microsoft Corporation System for normalizing a discourse representation structure and normalized data structure
US7177799B2 (en) * 2002-01-14 2007-02-13 Microsoft Corporation Semantic analysis system for interpreting linguistic structures output by a natural language linguistic analysis system
US7225183B2 (en) * 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
FR2835334A1 (fr) * 2002-01-31 2003-08-01 France Telecom Systeme et procedes d'indexation et de recherche a extension de requetes, moteurs d'indexation et de recherche
US7031969B2 (en) * 2002-02-20 2006-04-18 Lawrence Technologies, Llc System and method for identifying relationships between database records
US8380491B2 (en) * 2002-04-19 2013-02-19 Educational Testing Service System for rating constructed responses based on concepts and a model answer
US20040039562A1 (en) * 2002-06-17 2004-02-26 Kenneth Haase Para-linguistic expansion
AU2003243635A1 (en) * 2002-06-17 2003-12-31 Beingmeta, Inc. Systems and methods for processing queries
US7493253B1 (en) 2002-07-12 2009-02-17 Language And Computing, Inc. Conceptual world representation natural language understanding system and method
US20040034541A1 (en) * 2002-08-16 2004-02-19 Alipio Caban Client devices, processor-usable media, data signals embodied in a transmission medium and processor implemented methods
JP2004139553A (ja) * 2002-08-19 2004-05-13 Matsushita Electric Ind Co Ltd 文書検索システムおよび質問応答システム
US7136807B2 (en) * 2002-08-26 2006-11-14 International Business Machines Corporation Inferencing using disambiguated natural language rules
JP4038717B2 (ja) * 2002-09-13 2008-01-30 富士ゼロックス株式会社 テキスト文比較装置
JP2004110161A (ja) * 2002-09-13 2004-04-08 Fuji Xerox Co Ltd テキスト文比較装置
US7567902B2 (en) * 2002-09-18 2009-07-28 Nuance Communications, Inc. Generating speech recognition grammars from a large corpus of data
US7194455B2 (en) * 2002-09-19 2007-03-20 Microsoft Corporation Method and system for retrieving confirming sentences
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
US7171351B2 (en) * 2002-09-19 2007-01-30 Microsoft Corporation Method and system for retrieving hint sentences using expanded queries
US20040122736A1 (en) 2002-10-11 2004-06-24 Bank One, Delaware, N.A. System and method for granting promotional rewards to credit account holders
EP1599866B1 (de) * 2002-11-13 2007-08-22 Bernd Schönebeck Sprachverarbeitendes system und verfahren
US20040098250A1 (en) * 2002-11-19 2004-05-20 Gur Kimchi Semantic search system and method
US8032358B2 (en) * 2002-11-28 2011-10-04 Nuance Communications Austria Gmbh Classifying text via topical analysis, for applications to speech recognition
US8155946B2 (en) * 2002-12-23 2012-04-10 Definiens Ag Computerized method and system for searching for text passages in text documents
WO2004077217A2 (en) * 2003-01-30 2004-09-10 Vaman Technologies (R & D) Limited System and method of object query analysis, optimization and execution irrespective of server functionality
US7343280B2 (en) * 2003-07-01 2008-03-11 Microsoft Corporation Processing noisy data and determining word similarity
US20050060140A1 (en) * 2003-09-15 2005-03-17 Maddox Paul Christopher Using semantic feature structures for document comparisons
US7593845B2 (en) * 2003-10-06 2009-09-22 Microsoflt Corporation Method and apparatus for identifying semantic structures from text
WO2005038672A1 (ja) * 2003-10-21 2005-04-28 Intellectual Property Bank Corp. 調査対象文書の文書特徴分析装置
US7412385B2 (en) * 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US7584092B2 (en) * 2004-11-15 2009-09-01 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
CN1629833A (zh) * 2003-12-17 2005-06-22 国际商业机器公司 实现问与答功能和计算机辅助写作的方法及装置
US7359851B2 (en) * 2004-01-14 2008-04-15 Clairvoyance Corporation Method of identifying the language of a textual passage using short word and/or n-gram comparisons
JP2005267607A (ja) * 2004-02-20 2005-09-29 Fuji Photo Film Co Ltd デジタル図鑑システム、図鑑検索方法、及び図鑑検索プログラム
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
GB0407389D0 (en) * 2004-03-31 2004-05-05 British Telecomm Information retrieval
US20050256700A1 (en) * 2004-05-11 2005-11-17 Moldovan Dan I Natural language question answering system and method utilizing a logic prover
US7363578B2 (en) * 2004-06-03 2008-04-22 Microsoft Corporation Method and apparatus for mapping a data model to a user interface model
US7424485B2 (en) * 2004-06-03 2008-09-09 Microsoft Corporation Method and apparatus for generating user interfaces based upon automation with full flexibility
US7665014B2 (en) * 2004-06-03 2010-02-16 Microsoft Corporation Method and apparatus for generating forms using form types
US20060009966A1 (en) * 2004-07-12 2006-01-12 International Business Machines Corporation Method and system for extracting information from unstructured text using symbolic machine learning
US20060026522A1 (en) * 2004-07-27 2006-02-02 Microsoft Corporation Method and apparatus for revising data models and maps by example
US7685118B2 (en) * 2004-08-12 2010-03-23 Iwint International Holdings Inc. Method using ontology and user query processing to solve inventor problems and user problems
US8407239B2 (en) 2004-08-13 2013-03-26 Google Inc. Multi-stage query processing system and method for use with tokenspace repository
US7917480B2 (en) 2004-08-13 2011-03-29 Google Inc. Document compression system and method for use with tokenspace repository
US20060047690A1 (en) * 2004-08-31 2006-03-02 Microsoft Corporation Integration of Flex and Yacc into a linguistic services platform for named entity recognition
US20060047691A1 (en) * 2004-08-31 2006-03-02 Microsoft Corporation Creating a document index from a flex- and Yacc-generated named entity recognizer
US20060047500A1 (en) * 2004-08-31 2006-03-02 Microsoft Corporation Named entity recognition using compiler methods
CN100361126C (zh) * 2004-09-24 2008-01-09 北京亿维讯科技有限公司 使用本体论和用户查询处理技术解决问题的方法
US7996208B2 (en) 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation
US8051096B1 (en) 2004-09-30 2011-11-01 Google Inc. Methods and systems for augmenting a token lexicon
US7680648B2 (en) * 2004-09-30 2010-03-16 Google Inc. Methods and systems for improving text segmentation
US7657519B2 (en) * 2004-09-30 2010-02-02 Microsoft Corporation Forming intent-based clusters and employing same by search
US20060074632A1 (en) * 2004-09-30 2006-04-06 Nanavati Amit A Ontology-based term disambiguation
US7546235B2 (en) * 2004-11-15 2009-06-09 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7552046B2 (en) * 2004-11-15 2009-06-23 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US20060122834A1 (en) * 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems
US8843536B1 (en) 2004-12-31 2014-09-23 Google Inc. Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries
US8473449B2 (en) * 2005-01-06 2013-06-25 Neuric Technologies, Llc Process of dialogue and discussion
US7869989B1 (en) * 2005-01-28 2011-01-11 Artificial Cognition Inc. Methods and apparatus for understanding machine vocabulary
EP1851616A2 (en) * 2005-01-31 2007-11-07 Musgrove Technology Enterprises, LLC System and method for generating an interlinked taxonomy structure
JP2008529173A (ja) * 2005-01-31 2008-07-31 テキストディガー,インコーポレイテッド 電子文書の意味検索および取り込みのための方法およびシステム
US20060200464A1 (en) * 2005-03-03 2006-09-07 Microsoft Corporation Method and system for generating a document summary
US20060200337A1 (en) * 2005-03-04 2006-09-07 Microsoft Corporation System and method for template authoring and a template data structure
US20060200336A1 (en) * 2005-03-04 2006-09-07 Microsoft Corporation Creating a lexicon using automatic template matching
US20060200338A1 (en) * 2005-03-04 2006-09-07 Microsoft Corporation Method and system for creating a lexicon
US7937396B1 (en) 2005-03-23 2011-05-03 Google Inc. Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments
JP2008537225A (ja) * 2005-04-11 2008-09-11 テキストディガー,インコーポレイテッド クエリについての検索システムおよび方法
US7672908B2 (en) * 2005-04-15 2010-03-02 Carnegie Mellon University Intent-based information processing and updates in association with a service agent
US8032823B2 (en) * 2005-04-15 2011-10-04 Carnegie Mellon University Intent-based information processing and updates
FR2885712B1 (fr) * 2005-05-12 2007-07-13 Kabire Fidaali Dispositif et procede d'analyse semantique de documents par constitution d'arbres n-aire et semantique
CN101366024B (zh) 2005-05-16 2014-07-30 电子湾有限公司 用于处理数据搜索请求的方法和系统
US7401731B1 (en) 2005-05-27 2008-07-22 Jpmorgan Chase Bank, Na Method and system for implementing a card product with multiple customized relationships
GB0512744D0 (en) * 2005-06-22 2005-07-27 Blackspider Technologies Method and system for filtering electronic messages
US7809551B2 (en) * 2005-07-01 2010-10-05 Xerox Corporation Concept matching system
US7689411B2 (en) 2005-07-01 2010-03-30 Xerox Corporation Concept matching
CA2545237A1 (en) * 2005-07-29 2007-01-29 Cognos Incorporated Method and system for managing exemplar terms database for business-oriented metadata content
CA2545232A1 (en) * 2005-07-29 2007-01-29 Cognos Incorporated Method and system for creating a taxonomy from business-oriented metadata content
US8666928B2 (en) * 2005-08-01 2014-03-04 Evi Technologies Limited Knowledge repository
JP4639124B2 (ja) * 2005-08-23 2011-02-23 キヤノン株式会社 文字入力補助方法及び情報処理装置
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070073533A1 (en) * 2005-09-23 2007-03-29 Fuji Xerox Co., Ltd. Systems and methods for structural indexing of natural language text
US7475072B1 (en) 2005-09-26 2009-01-06 Quintura, Inc. Context-based search visualization and context management using neural networks
US7937265B1 (en) 2005-09-27 2011-05-03 Google Inc. Paraphrase acquisition
US7562074B2 (en) * 2005-09-28 2009-07-14 Epacris Inc. Search engine determining results based on probabilistic scoring of relevance
US7908132B2 (en) * 2005-09-29 2011-03-15 Microsoft Corporation Writing assistance using machine translation techniques
US7949444B2 (en) * 2005-10-07 2011-05-24 Honeywell International Inc. Aviation field service report natural language processing
US9886478B2 (en) 2005-10-07 2018-02-06 Honeywell International Inc. Aviation field service report natural language processing
US8036876B2 (en) * 2005-11-04 2011-10-11 Battelle Memorial Institute Methods of defining ontologies, word disambiguation methods, computer systems, and articles of manufacture
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
CA2669236C (en) 2005-11-16 2016-05-24 Evri Inc. Extending keyword searching to syntactically and semantically annotated data
US7765212B2 (en) * 2005-12-29 2010-07-27 Microsoft Corporation Automatic organization of documents through email clustering
US8694530B2 (en) * 2006-01-03 2014-04-08 Textdigger, Inc. Search system with query refinement and search method
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
FR2896603B1 (fr) * 2006-01-20 2008-05-02 Thales Sa Procede et dispositif pour extraire des informations et les transformer en donnees qualitatives d'un document textuel
US8195683B2 (en) 2006-02-28 2012-06-05 Ebay Inc. Expansion of database search queries
US7599861B2 (en) 2006-03-02 2009-10-06 Convergys Customer Management Group, Inc. System and method for closed loop decisionmaking in an automated care system
US7644082B2 (en) * 2006-03-03 2010-01-05 Perfect Search Corporation Abbreviated index
US8266152B2 (en) * 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
WO2007114932A2 (en) 2006-04-04 2007-10-11 Textdigger, Inc. Search system and method with text function tagging
US7991608B2 (en) * 2006-04-19 2011-08-02 Raytheon Company Multilingual data querying
SG174027A1 (en) * 2006-05-04 2011-09-29 Jpmorgan Chase Bank Na System and method for restricted party screening and resolution services
US8379830B1 (en) 2006-05-22 2013-02-19 Convergys Customer Management Delaware Llc System and method for automated customer service with contingent live interaction
US7809663B1 (en) 2006-05-22 2010-10-05 Convergys Cmg Utah, Inc. System and method for supporting the utilization of machine language
US7493293B2 (en) * 2006-05-31 2009-02-17 International Business Machines Corporation System and method for extracting entities of interest from text using n-gram models
US20070288248A1 (en) * 2006-06-12 2007-12-13 Rami Rauch System and method for online service of web wide datasets forming, joining and mining
US8140267B2 (en) * 2006-06-30 2012-03-20 International Business Machines Corporation System and method for identifying similar molecules
US8020206B2 (en) 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
US8615800B2 (en) 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US20080027971A1 (en) * 2006-07-28 2008-01-31 Craig Statchuk Method and system for populating an index corpus to a search engine
US8589869B2 (en) * 2006-09-07 2013-11-19 Wolfram Alpha Llc Methods and systems for determining a formula
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP5076417B2 (ja) * 2006-09-15 2012-11-21 富士ゼロックス株式会社 概念ネットワーク生成システム、概念ネットワーク生成方法及び概念ネットワーク生成プログラム
US7557167B2 (en) * 2006-09-28 2009-07-07 Gore Enterprise Holdings, Inc. Polyester compositions, methods of manufacturing said compositions, and articles made therefrom
US8146051B2 (en) * 2006-10-02 2012-03-27 International Business Machines Corporation Method and computer program product for providing a representation of software modeled by a model
US8892423B1 (en) 2006-10-10 2014-11-18 Abbyy Infopoisk Llc Method and system to automatically create content for dictionaries
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9053090B2 (en) 2006-10-10 2015-06-09 Abbyy Infopoisk Llc Translating texts between languages
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9098489B2 (en) * 2006-10-10 2015-08-04 Abbyy Infopoisk Llc Method and system for semantic searching
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US9892111B2 (en) 2006-10-10 2018-02-13 Abbyy Production Llc Method and device to estimate similarity between documents having multiple segments
US9588958B2 (en) 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9075864B2 (en) * 2006-10-10 2015-07-07 Abbyy Infopoisk Llc Method and system for semantic searching using syntactic and semantic analysis
US9069750B2 (en) * 2006-10-10 2015-06-30 Abbyy Infopoisk Llc Method and system for semantic searching of natural language texts
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9208174B1 (en) * 2006-11-20 2015-12-08 Disney Enterprises, Inc. Non-language-based object search
US9654495B2 (en) * 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
GB2458094A (en) 2007-01-09 2009-09-09 Surfcontrol On Demand Ltd URL interception and categorization in firewalls
US7437370B1 (en) * 2007-02-19 2008-10-14 Quintura, Inc. Search engine graphical interface using maps and images
EP2135231A4 (en) * 2007-03-01 2014-10-15 Adapx Inc SYSTEM AND METHOD FOR DYNAMIC LEARNING
US8180633B2 (en) * 2007-03-08 2012-05-15 Nec Laboratories America, Inc. Fast semantic extraction using a neural network architecture
WO2008113045A1 (en) * 2007-03-14 2008-09-18 Evri Inc. Query templates and labeled search tip system, methods, and techniques
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US9031947B2 (en) * 2007-03-27 2015-05-12 Invention Machine Corporation System and method for model element identification
US7873640B2 (en) * 2007-03-27 2011-01-18 Adobe Systems Incorporated Semantic analysis documents to rank terms
US7720783B2 (en) * 2007-03-28 2010-05-18 Palo Alto Research Center Incorporated Method and system for detecting undesired inferences from documents
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
GB0709527D0 (en) 2007-05-18 2007-06-27 Surfcontrol Plc Electronic messaging system, message processing apparatus and message processing method
US7792826B2 (en) * 2007-05-29 2010-09-07 International Business Machines Corporation Method and system for providing ranked search results
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US8037086B1 (en) * 2007-07-10 2011-10-11 Google Inc. Identifying common co-occurring elements in lists
US8260619B1 (en) 2008-08-22 2012-09-04 Convergys Cmg Utah, Inc. Method and system for creating natural language understanding grammars
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US8712758B2 (en) 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system
US8229730B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Indexing role hierarchies for words in a search index
US8346756B2 (en) * 2007-08-31 2013-01-01 Microsoft Corporation Calculating valence of expressions within documents for searching a document index
US8639708B2 (en) * 2007-08-31 2014-01-28 Microsoft Corporation Fact-based indexing for natural language search
US8229970B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Efficient storage and retrieval of posting lists
US20090070322A1 (en) * 2007-08-31 2009-03-12 Powerset, Inc. Browsing knowledge on the basis of semantic relations
US8463593B2 (en) * 2007-08-31 2013-06-11 Microsoft Corporation Natural language hypernym weighting for word sense disambiguation
US8316036B2 (en) * 2007-08-31 2012-11-20 Microsoft Corporation Checkpointing iterators during search
US8280721B2 (en) 2007-08-31 2012-10-02 Microsoft Corporation Efficiently representing word sense probabilities
CN101796510A (zh) * 2007-08-31 2010-08-04 微软公司 搜索索引中单词的索引角色分层结构
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8838659B2 (en) * 2007-10-04 2014-09-16 Amazon Technologies, Inc. Enhanced knowledge repository
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US8594996B2 (en) 2007-10-17 2013-11-26 Evri Inc. NLP-based entity recognition and disambiguation
WO2009052308A1 (en) * 2007-10-17 2009-04-23 Roseman Neil S Nlp-based content recommender
US20090119090A1 (en) * 2007-11-01 2009-05-07 Microsoft Corporation Principled Approach to Paraphrasing
WO2009059297A1 (en) * 2007-11-01 2009-05-07 Textdigger, Inc. Method and apparatus for automated tag generation for digital content
US8725756B1 (en) 2007-11-12 2014-05-13 Google Inc. Session-based query suggestions
US7860885B2 (en) * 2007-12-05 2010-12-28 Palo Alto Research Center Incorporated Inbound content filtering via automated inference detection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8504361B2 (en) * 2008-02-07 2013-08-06 Nec Laboratories America, Inc. Deep neural networks and methods for using same
US8392436B2 (en) * 2008-02-07 2013-03-05 Nec Laboratories America, Inc. Semantic search via role labeling
US10269024B2 (en) * 2008-02-08 2019-04-23 Outbrain Inc. Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8180754B1 (en) * 2008-04-01 2012-05-15 Dranias Development Llc Semantic neural network for aggregating query searches
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20090255118A1 (en) * 2008-04-11 2009-10-15 General Electric Company Method of manufacturing mixers
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8682660B1 (en) * 2008-05-21 2014-03-25 Resolvity, Inc. Method and system for post-processing speech recognition results
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US8219397B2 (en) * 2008-06-10 2012-07-10 Nuance Communications, Inc. Data processing system for autonomously building speech identification and tagging data
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
AU2009267107A1 (en) 2008-06-30 2010-01-07 Websense, Inc. System and method for dynamic and real-time categorization of webpages
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US9317589B2 (en) * 2008-08-07 2016-04-19 International Business Machines Corporation Semantic search by means of word sense disambiguation using a lexicon
US8112269B2 (en) * 2008-08-25 2012-02-07 Microsoft Corporation Determining utility of a question
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8364663B2 (en) * 2008-09-05 2013-01-29 Microsoft Corporation Tokenized javascript indexing system
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
JP2010066365A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 音声認識装置、方法、及びプログラム
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010043257A1 (en) * 2008-10-15 2010-04-22 Hewlett-Packard Development Company, L.P. Retrieving configuration records from a configuration management database
US9519636B2 (en) * 2008-10-15 2016-12-13 Business Objects S.A. Deduction of analytic context based on text and semantic layer
US8260605B2 (en) * 2008-12-09 2012-09-04 University Of Houston System Word sense disambiguation
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US9805089B2 (en) 2009-02-10 2017-10-31 Amazon Technologies, Inc. Local business and product search system and method
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
EP2394228A4 (en) * 2009-03-10 2013-01-23 Ebrary Inc METHOD AND APPARATUS FOR REAL-TIME TEXT ANALYSIS AND NAVIGATION IN TEXT
EP2406739A2 (en) * 2009-03-13 2012-01-18 Invention Machine Corporation System and method for knowledge research
JP2012520527A (ja) * 2009-03-13 2012-09-06 インベンション マシーン コーポレーション ユーザ質問及びテキスト文書の意味ラベリングに基づく質問応答システム及び方法
WO2010107327A1 (en) * 2009-03-20 2010-09-23 Syl Research Limited Natural language processing method and system
CN101508188B (zh) * 2009-03-24 2012-09-26 北京市城南橡塑技术研究所 抗冲击复合衬板
US20100250522A1 (en) * 2009-03-30 2010-09-30 Gm Global Technology Operations, Inc. Using ontology to order records by relevance
US20100268600A1 (en) * 2009-04-16 2010-10-21 Evri Inc. Enhanced advertisement targeting
US8788524B1 (en) * 2009-05-15 2014-07-22 Wolfram Alpha Llc Method and system for responding to queries in an imprecise syntax
US8601015B1 (en) 2009-05-15 2013-12-03 Wolfram Alpha Llc Dynamic example generation for queries
US20100299132A1 (en) * 2009-05-22 2010-11-25 Microsoft Corporation Mining phrase pairs from an unstructured resource
CN102598007B (zh) 2009-05-26 2017-03-01 韦伯森斯公司 有效检测采指纹数据和信息的系统和方法
US20100306214A1 (en) * 2009-05-28 2010-12-02 Microsoft Corporation Identifying modifiers in web queries over structured data
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20130219333A1 (en) * 2009-06-12 2013-08-22 Adobe Systems Incorporated Extensible Framework for Facilitating Interaction with Devices
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110015921A1 (en) * 2009-07-17 2011-01-20 Minerva Advisory Services, Llc System and method for using lingual hierarchy, connotation and weight of authority
US9396485B2 (en) * 2009-12-24 2016-07-19 Outbrain Inc. Systems and methods for presenting content
US20110040604A1 (en) * 2009-08-13 2011-02-17 Vertical Acuity, Inc. Systems and Methods for Providing Targeted Content
US20110044447A1 (en) * 2009-08-21 2011-02-24 Nexidia Inc. Trend discovery in audio signals
US10169599B2 (en) * 2009-08-26 2019-01-01 International Business Machines Corporation Data access control with flexible data disclosure
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8560300B2 (en) * 2009-09-09 2013-10-15 International Business Machines Corporation Error correction using fact repositories
WO2011030355A2 (en) * 2009-09-14 2011-03-17 Arun Jain Zolog intelligent human language interface for business software applications
US9224007B2 (en) 2009-09-15 2015-12-29 International Business Machines Corporation Search engine with privacy protection
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
CA2779208C (en) * 2009-10-30 2016-03-22 Evri, Inc. Improving keyword-based search engine results using enhanced query strategies
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US20110131033A1 (en) * 2009-12-02 2011-06-02 Tatu Ylonen Oy Ltd Weight-Ordered Enumeration of Referents and Cutting Off Lengthy Enumerations
US20110197137A1 (en) * 2009-12-24 2011-08-11 Vertical Acuity, Inc. Systems and Methods for Rating Content
US10607235B2 (en) * 2009-12-24 2020-03-31 Outbrain Inc. Systems and methods for curating content
US10713666B2 (en) 2009-12-24 2020-07-14 Outbrain Inc. Systems and methods for curating content
US20110161091A1 (en) * 2009-12-24 2011-06-30 Vertical Acuity, Inc. Systems and Methods for Connecting Entities Through Content
US9600134B2 (en) * 2009-12-29 2017-03-21 International Business Machines Corporation Selecting portions of computer-accessible documents for post-selection processing
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US9201905B1 (en) * 2010-01-14 2015-12-01 The Boeing Company Semantically mediated access to knowledge
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5398007B2 (ja) * 2010-02-26 2014-01-29 独立行政法人情報通信研究機構 関係情報拡張装置、関係情報拡張方法、及びプログラム
US9710556B2 (en) 2010-03-01 2017-07-18 Vcvc Iii Llc Content recommendation based on collections of entities
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8694304B2 (en) * 2010-03-26 2014-04-08 Virtuoz Sa Semantic clustering and user interfaces
US9378202B2 (en) * 2010-03-26 2016-06-28 Virtuoz Sa Semantic clustering
US8676565B2 (en) * 2010-03-26 2014-03-18 Virtuoz Sa Semantic clustering and conversational agents
US8645125B2 (en) 2010-03-30 2014-02-04 Evri, Inc. NLP-based systems and methods for providing quotations
US8484015B1 (en) 2010-05-14 2013-07-09 Wolfram Alpha Llc Entity pages
US9110882B2 (en) 2010-05-14 2015-08-18 Amazon Technologies, Inc. Extracting structured knowledge from unstructured text
US9672204B2 (en) * 2010-05-28 2017-06-06 Palo Alto Research Center Incorporated System and method to acquire paraphrases
US9836460B2 (en) * 2010-06-11 2017-12-05 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for analyzing patent-related documents
US8620890B2 (en) 2010-06-18 2013-12-31 Accelerated Vision Group Llc System and method of semantic based searching
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8812298B1 (en) 2010-07-28 2014-08-19 Wolfram Alpha Llc Macro replacement of natural language input
US8838633B2 (en) 2010-08-11 2014-09-16 Vcvc Iii Llc NLP-based sentiment analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
JP5012981B2 (ja) 2010-09-09 2012-08-29 カシオ計算機株式会社 電子辞書装置およびプログラム
US9405848B2 (en) 2010-09-15 2016-08-02 Vcvc Iii Llc Recommending mobile device activities
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US9524291B2 (en) 2010-10-06 2016-12-20 Virtuoz Sa Visual display of semantic information
US8725739B2 (en) 2010-11-01 2014-05-13 Evri, Inc. Category-based content recommendation
US9424351B2 (en) * 2010-11-22 2016-08-23 Microsoft Technology Licensing, Llc Hybrid-distribution model for search engine indexes
US9824091B2 (en) 2010-12-03 2017-11-21 Microsoft Technology Licensing, Llc File system backup using change journal
US8620894B2 (en) 2010-12-21 2013-12-31 Microsoft Corporation Searching files
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
CN103262070B (zh) 2010-12-23 2018-12-04 皇家飞利浦电子股份有限公司 解剖结构中病变的图片报告示意图的生成
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US8543577B1 (en) 2011-03-02 2013-09-24 Google Inc. Cross-channel clusters of information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9116995B2 (en) 2011-03-30 2015-08-25 Vcvc Iii Llc Cluster-based identification of news stories
US8983995B2 (en) 2011-04-15 2015-03-17 Microsoft Corporation Interactive semantic query suggestion for content search
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US10198506B2 (en) * 2011-07-11 2019-02-05 Lexxe Pty Ltd. System and method of sentiment data generation
US9069814B2 (en) 2011-07-27 2015-06-30 Wolfram Alpha Llc Method and system for using natural language to generate widgets
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9734252B2 (en) 2011-09-08 2017-08-15 Wolfram Alpha Llc Method and system for analyzing data using a query answering system
US8914277B1 (en) * 2011-09-20 2014-12-16 Nuance Communications, Inc. Speech and language translation of an utterance
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US8959082B2 (en) 2011-10-31 2015-02-17 Elwha Llc Context-sensitive query enrichment
US20130124194A1 (en) * 2011-11-10 2013-05-16 Inventive, Inc. Systems and methods for manipulating data using natural language commands
US9851950B2 (en) 2011-11-15 2017-12-26 Wolfram Alpha Llc Programming in a precise syntax using natural language
US8965750B2 (en) 2011-11-17 2015-02-24 Abbyy Infopoisk Llc Acquiring accurate machine translation
US9195853B2 (en) 2012-01-15 2015-11-24 International Business Machines Corporation Automated document redaction
US9430793B2 (en) * 2012-02-15 2016-08-30 Rakuten, Inc. Dictionary generation device, dictionary generation method, dictionary generation program and computer-readable recording medium storing same program
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9064009B2 (en) * 2012-03-28 2015-06-23 Hewlett-Packard Development Company, L.P. Attribute cloud
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US9460082B2 (en) 2012-05-14 2016-10-04 International Business Machines Corporation Management of language usage to facilitate effective communication
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9195647B1 (en) * 2012-08-11 2015-11-24 Guangsheng Zhang System, methods, and data structure for machine-learning of contextualized symbolic associations
US9405424B2 (en) 2012-08-29 2016-08-02 Wolfram Alpha, Llc Method and system for distributing and displaying graphical items
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9892278B2 (en) 2012-11-14 2018-02-13 International Business Machines Corporation Focused personal identifying information redaction
US10095692B2 (en) * 2012-11-29 2018-10-09 Thornson Reuters Global Resources Unlimited Company Template bootstrapping for domain-adaptable natural language generation
US20150317386A1 (en) * 2012-12-27 2015-11-05 Abbyy Development Llc Finding an appropriate meaning of an entry in a text
EP4138075A1 (en) 2013-02-07 2023-02-22 Apple Inc. Voice trigger for a digital assistant
US9135240B2 (en) 2013-02-12 2015-09-15 International Business Machines Corporation Latent semantic analysis for application in a question answer system
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9311297B2 (en) * 2013-03-14 2016-04-12 Prateek Bhatnagar Method and system for outputting information
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR101857648B1 (ko) 2013-03-15 2018-05-15 애플 인크. 지능형 디지털 어시스턴트에 의한 사용자 트레이닝
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN112230878A (zh) 2013-03-15 2021-01-15 苹果公司 对中断进行上下文相关处理
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
JP6152711B2 (ja) * 2013-06-04 2017-06-28 富士通株式会社 情報検索装置および情報検索方法
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9311300B2 (en) * 2013-09-13 2016-04-12 International Business Machines Corporation Using natural language processing (NLP) to create subject matter synonyms from definitions
US20160224637A1 (en) * 2013-11-25 2016-08-04 Ut Battelle, Llc Processing associations in knowledge graphs
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2613847C2 (ru) 2013-12-20 2017-03-21 ООО "Аби Девелопмент" Выявление китайской, японской и корейской письменности
US20150178390A1 (en) * 2013-12-20 2015-06-25 Jordi Torras Natural language search engine using lexical functions and meaning-text criteria
RU2665239C2 (ru) 2014-01-15 2018-08-28 Общество с ограниченной ответственностью "Аби Продакшн" Автоматическое извлечение именованных сущностей из текста
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2640322C2 (ru) 2014-01-30 2017-12-27 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы эффективного автоматического распознавания символов
RU2648638C2 (ru) 2014-01-30 2018-03-26 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы эффективного автоматического распознавания символов, использующие множество кластеров эталонов символов
RU2556425C1 (ru) * 2014-02-14 2015-07-10 Закрытое акционерное общество "Эвентос" (ЗАО "Эвентос") Способ автоматической итеративной кластеризации электронных документов по семантической близости, способ поиска в совокупности кластеризованных по семантической близости документов и машиночитаемые носители
US10839110B2 (en) * 2014-05-09 2020-11-17 Autodesk, Inc. Techniques for using controlled natural language to capture design intent for computer-aided design
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
KR101661198B1 (ko) * 2014-07-10 2016-10-04 네이버 주식회사 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
CN104199803B (zh) * 2014-07-21 2017-10-13 安徽华贞信息科技有限公司 一种基于组合理论的文本信息处理系统及方法
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9665564B2 (en) 2014-10-06 2017-05-30 International Business Machines Corporation Natural language processing utilizing logical tree structures
US9588961B2 (en) 2014-10-06 2017-03-07 International Business Machines Corporation Natural language processing utilizing propagation of knowledge through logical parse tree structures
US9715488B2 (en) * 2014-10-06 2017-07-25 International Business Machines Corporation Natural language processing utilizing transaction based knowledge representation
US9710547B2 (en) 2014-11-21 2017-07-18 Inbenta Natural language semantic search system and method using weighted global semantic representations
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9589185B2 (en) 2014-12-10 2017-03-07 Abbyy Development Llc Symbol recognition using decision forests
JP6447161B2 (ja) * 2015-01-20 2019-01-09 富士通株式会社 意味構造検索プログラム、意味構造検索装置、及び意味構造検索方法
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9632999B2 (en) * 2015-04-03 2017-04-25 Klangoo, Sal. Techniques for understanding the aboutness of text based on semantic analysis
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9778929B2 (en) 2015-05-29 2017-10-03 Microsoft Technology Licensing, Llc Automated efficient translation context delivery
US10762521B2 (en) 2015-06-01 2020-09-01 Jpmorgan Chase Bank, N.A. System and method for loyalty integration for merchant specific digital wallets
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10628521B2 (en) * 2015-08-03 2020-04-21 International Business Machines Corporation Scoring automatically generated language patterns for questions using synthetic events
US10628413B2 (en) * 2015-08-03 2020-04-21 International Business Machines Corporation Mapping questions to complex database lookups using synthetic events
US10134389B2 (en) * 2015-09-04 2018-11-20 Microsoft Technology Licensing, Llc Clustering user utterance intents with semantic parsing
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
CN106598722A (zh) * 2015-10-19 2017-04-26 上海引跑信息科技有限公司 一种在文本信息检索服务中支持分布式事务管理的方法
EP3163467A1 (en) * 2015-10-30 2017-05-03 BIGFLO s.r.l. Method and tool for the automatic reformulation of search keyword strings in document search systems
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10592603B2 (en) * 2016-02-03 2020-03-17 International Business Machines Corporation Identifying logic problems in text using a statistical approach and natural language processing
US11042702B2 (en) 2016-02-04 2021-06-22 International Business Machines Corporation Solving textual logic problems using a statistical approach and natural language processing
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN109313719B (zh) * 2016-03-18 2022-03-22 谷歌有限责任公司 使用神经网络生成文本段的依存性解析
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10289680B2 (en) * 2016-05-31 2019-05-14 Oath Inc. Real time parsing and suggestions from pre-generated corpus with hypernyms
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10579721B2 (en) 2016-07-15 2020-03-03 Intuit Inc. Lean parsing: a natural language processing system and method for parsing domain-specific languages
US11222266B2 (en) 2016-07-15 2022-01-11 Intuit Inc. System and method for automatic learning of functions
US11049190B2 (en) 2016-07-15 2021-06-29 Intuit Inc. System and method for automatically generating calculations for fields in compliance forms
US10120861B2 (en) 2016-08-17 2018-11-06 Oath Inc. Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
US9984063B2 (en) 2016-09-15 2018-05-29 International Business Machines Corporation System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
US9953027B2 (en) * 2016-09-15 2018-04-24 International Business Machines Corporation System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10437833B1 (en) * 2016-10-05 2019-10-08 Ontocord, LLC Scalable natural language processing for large and dynamic text environments
WO2018076058A1 (en) * 2016-10-26 2018-05-03 Commonwealth Scientific And Industrial Research Organisation An automatic encoder of legislation to logic
KR102589638B1 (ko) * 2016-10-31 2023-10-16 삼성전자주식회사 문장 생성 장치 및 방법
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
JP6805927B2 (ja) * 2017-03-28 2020-12-23 富士通株式会社 インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10275452B2 (en) 2017-05-12 2019-04-30 International Business Machines Corporation Automatic, unsupervised paraphrase detection
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US11664114B2 (en) * 2017-05-25 2023-05-30 Enlitic, Inc. Medical scan assisted review system
WO2019060274A1 (en) 2017-09-22 2019-03-28 Intuit Inc. LITTLE ANALYSIS: NATURAL LANGUAGE PROCESSING SYSTEM AND DOMAIN-SPECIFIC LANGUAGE ANALYSIS METHOD
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11087097B2 (en) * 2017-11-27 2021-08-10 Act, Inc. Automatic item generation for passage-based assessment
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11410130B2 (en) * 2017-12-27 2022-08-09 International Business Machines Corporation Creating and using triplet representations to assess similarity between job description documents
MY201295A (en) 2017-12-28 2024-02-15 Mimos Berhad A computer-implemented method for self-learning text relevance and determining text relevancy
IL258689A (en) * 2018-04-12 2018-05-31 Browarnik Abel A system and method for computerized semantic indexing and searching
US11016985B2 (en) * 2018-05-22 2021-05-25 International Business Machines Corporation Providing relevant evidence or mentions for a query
US11042712B2 (en) * 2018-06-05 2021-06-22 Koninklijke Philips N.V. Simplifying and/or paraphrasing complex textual content by jointly learning semantic alignment and simplicity
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
US11163956B1 (en) 2019-05-23 2021-11-02 Intuit Inc. System and method for recognizing domain specific named entities using domain specific word embeddings
US10868778B1 (en) 2019-05-30 2020-12-15 Microsoft Technology Licensing, Llc Contextual feedback, with expiration indicator, to a natural understanding system in a chat bot
US11477140B2 (en) 2019-05-30 2022-10-18 Microsoft Technology Licensing, Llc Contextual feedback to a natural understanding system in a chat bot
KR20220059526A (ko) 2019-09-16 2022-05-10 도큐가미, 인크. 문서 간 지능형 저작 및 처리 보조기
US11068665B2 (en) 2019-09-18 2021-07-20 International Business Machines Corporation Hypernym detection using strict partial order networks
CN111090668B (zh) * 2019-12-09 2023-09-26 京东科技信息技术有限公司 数据检索方法及装置、电子设备和计算机可读存储介质
US11783128B2 (en) 2020-02-19 2023-10-10 Intuit Inc. Financial document text conversion to computer readable operations
US11651156B2 (en) * 2020-05-07 2023-05-16 Optum Technology, Inc. Contextual document summarization with semantic intelligence
US11954448B2 (en) * 2020-07-21 2024-04-09 Microsoft Technology Licensing, Llc Determining position values for transformer models
US11966699B2 (en) * 2021-06-17 2024-04-23 International Business Machines Corporation Intent classification using non-correlated features

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823306A (en) * 1987-08-14 1989-04-18 International Business Machines Corporation Text search system
US4839853A (en) * 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
NL8900587A (nl) * 1989-03-10 1990-10-01 Bso Buro Voor Systeemontwikkel Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst.
US5146406A (en) * 1989-08-16 1992-09-08 International Business Machines Corporation Computer method for identifying predicate-argument structures in natural language text
JP3266246B2 (ja) 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5617578A (en) * 1990-06-26 1997-04-01 Spss Corp. Computer-based workstation for generation of logic diagrams from natural language text structured by the insertion of script symbols
US5325298A (en) * 1990-11-07 1994-06-28 Hnc, Inc. Methods for generating or revising context vectors for a plurality of word stems
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same
US5488719A (en) * 1991-12-30 1996-01-30 Xerox Corporation System for categorizing character strings using acceptability and category information contained in ending substrings
US5591661A (en) 1992-04-07 1997-01-07 Shiota; Philip Method for fabricating devices for electrostatic discharge protection and voltage references, and the resulting structures
US5377103A (en) 1992-05-15 1994-12-27 International Business Machines Corporation Constrained natural language interface for a computer that employs a browse function
US5592661A (en) * 1992-07-16 1997-01-07 International Business Machines Corporation Detection of independent changes via change identifiers in a versioned database management system
US5630121A (en) * 1993-02-02 1997-05-13 International Business Machines Corporation Archiving and retrieving multimedia objects using structured indexes
US5454106A (en) * 1993-05-17 1995-09-26 International Business Machines Corporation Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
GB9320404D0 (en) * 1993-10-04 1993-11-24 Dixon Robert Method & apparatus for data storage & retrieval
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5724594A (en) 1994-02-10 1998-03-03 Microsoft Corporation Method and system for automatically identifying morphological information from a machine-readable dictionary
US5675819A (en) * 1994-06-16 1997-10-07 Xerox Corporation Document information retrieval using global word co-occurrence patterns
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
JP2923552B2 (ja) * 1995-02-13 1999-07-26 富士通株式会社 組織活動データベースの構築方法,それに使用する分析シートの入力方法及び組織活動管理システム
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6006221A (en) 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
JP3083742B2 (ja) * 1995-10-03 2000-09-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 表計算方法
US5995922A (en) * 1996-05-02 1999-11-30 Microsoft Corporation Identifying information related to an input word in an electronic dictionary
US5966686A (en) * 1996-06-28 1999-10-12 Microsoft Corporation Method and system for computing semantic logical forms from syntax trees
US5893104A (en) * 1996-07-09 1999-04-06 Oracle Corporation Method and system for processing queries in a database system using index structures that are not native to the database system
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text
US5970490A (en) * 1996-11-05 1999-10-19 Xerox Corporation Integration platform for heterogeneous databases
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5895464A (en) * 1997-04-30 1999-04-20 Eastman Kodak Company Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6070134A (en) * 1997-07-31 2000-05-30 Microsoft Corporation Identifying salient semantic relation paths between two words
US5991713A (en) * 1997-11-26 1999-11-23 International Business Machines Corp. Efficient method for compressing, storing, searching and transmitting natural language text
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US6664964B1 (en) * 2000-11-10 2003-12-16 Emc Corporation Correlation criteria for logical volumes
US7050964B2 (en) 2001-06-01 2006-05-23 Microsoft Corporation Scaleable machine translation system
US7734459B2 (en) 2001-06-01 2010-06-08 Microsoft Corporation Automatic extraction of transfer mappings from bilingual corpora

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8065307B2 (en) 2006-12-20 2011-11-22 Microsoft Corporation Parsing, analysis and scoring of document content
JP2010538375A (ja) * 2007-08-31 2010-12-09 マイクロソフト コーポレーション 間接話法内の意味論的関係の識別
KR101524889B1 (ko) * 2007-08-31 2015-06-01 마이크로소프트 코포레이션 간접 화법 내에서의 시맨틱 관계의 식별
US9449081B2 (en) 2007-08-31 2016-09-20 Microsoft Corporation Identification of semantic relationships within reported speech
JP2012150751A (ja) * 2011-01-21 2012-08-09 Bank Of Tokyo-Mitsubishi Ufj Ltd 検索装置
JP2012203779A (ja) * 2011-03-28 2012-10-22 Fuji Xerox Co Ltd プログラム及び情報処理装置
JP2015138351A (ja) * 2014-01-21 2015-07-30 富士通株式会社 情報検索装置、情報検索方法および情報検索プログラム
JP7351372B2 (ja) 2018-04-12 2023-09-27 富士通株式会社 生成プログラム、生成方法および情報処理装置

Also Published As

Publication number Publication date
WO1998039714A1 (en) 1998-09-11
US6161084A (en) 2000-12-12
JP4282769B2 (ja) 2009-06-24
US6076051A (en) 2000-06-13
EP0965089B1 (en) 2015-03-25
US20050065777A1 (en) 2005-03-24
US6246977B1 (en) 2001-06-12
EP0965089A1 (en) 1999-12-22
CN1252876A (zh) 2000-05-10
US7013264B2 (en) 2006-03-14
US6871174B1 (en) 2005-03-22

Similar Documents

Publication Publication Date Title
JP4282769B2 (ja) テキストの意味論的表現を利用した情報の検索
US9659005B2 (en) System for semantic interpretation
KR100666064B1 (ko) 인터랙티브 검색 쿼리 개선 시스템 및 방법
Harabagiu et al. FALCON: Boosting Knowledge for Answer Engines.
US8346795B2 (en) System and method for guiding entity-based searching
US20050203900A1 (en) Associative retrieval system and associative retrieval method
KR101040119B1 (ko) 콘텐츠 검색 장치 및 방법
US20070106499A1 (en) Natural language search system
EP0609517A2 (en) Indexing multimedia objects
JP2001511564A (ja) 全体の精度を高めるためにサーチ結果の自然言語処理を用いる情報検索システムのための装置および方法
EP1730659A1 (en) Information retrieval
JP2002510076A (ja) 言語モデルに基づく情報検索および音声認識
JP2000507008A (ja) テキスト・ベース型情報ソースのコレクションの中の情報を捜し出すためのシステム、ソフトウエア及び方法
JPH03172966A (ja) 類似文書検索装置
CN100524294C (zh) 使用自然语言处理技术用于处理文本输入的系统
KR20030006201A (ko) 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
JP2003108595A (ja) 情報検索装置、情報検索方法及び情報検索プログラム
CN114625845A (zh) 一种信息检索方法、智能终端及计算机可读存储介质
JP4452527B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR950013129B1 (ko) 기계번역장치 및 방법
Milić-Frayling Text processing and information retrieval
Ball et al. Creating Meaningful Word and Phrase Vectors for use as Representations of Associative Meaning supporting Grammatical Analysis. Long paper
JP2010003266A (ja) クエリ生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体
JP2005275560A (ja) 形容詞キーワード拡充システムと、これを用いた形容詞情報から検索者の意図理解検索システムと、形容詞情報から検索者の意図推論検索システム。
Sharma et al. Improved stemming approach used for text processing in information retrieval system

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050119

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050119

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080408

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080708

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20081226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090217

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090318

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140327

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term