JP2007200321A - 言語ユーザインターフェース - Google Patents

言語ユーザインターフェース Download PDF

Info

Publication number
JP2007200321A
JP2007200321A JP2007011219A JP2007011219A JP2007200321A JP 2007200321 A JP2007200321 A JP 2007200321A JP 2007011219 A JP2007011219 A JP 2007011219A JP 2007011219 A JP2007011219 A JP 2007011219A JP 2007200321 A JP2007200321 A JP 2007200321A
Authority
JP
Japan
Prior art keywords
text
user
rules
query
text string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007011219A
Other languages
English (en)
Other versions
JP5156236B2 (ja
Inventor
Frederique Segond
セゴン フレデリーク
Claude Roux
ルー クロード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2007200321A publication Critical patent/JP2007200321A/ja
Application granted granted Critical
Publication of JP5156236B2 publication Critical patent/JP5156236B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】システムが抽出する種類の事実は多少制限され、事実を捉え損ねることが多い、という課題を解決する。
【解決手段】テキスト検索システム10は、ユーザが選択したテキストストリングのテキスト断片に関連する文法規則を識別するための命令と、関連する格納媒体から文法規則を満たす付加的なテキストストリングを検索するための命令とを含むプロセッサ20と、検索されたテキストストリングを表示するためのディスプレイ30と、クエリーを生成するのに、表示されたテキストストリングのテキスト断片をユーザが選択することを可能にするユーザ入力デバイス113とを含み、プロセッサが、ユーザが選択しテキスト断片に関連する文法規則を識別してその文法規則を満たすテキストストリングを検索する。
【選択図】図1

Description

本願の例示的な実施形態は、文書処理に関する。これは、文書から事実を抽出するためのシステム及び方法と併せて特定の用途を見出し、これを特別に引用することにより説明される。しかし、本例示的な実施形態は、さらに、他の同様の用途に修正可能であることが理解される。
いろいろな方法及びツールが情報及び事実の抽出に使用可能である。統計及び言語技術が、人工知能の分野からのものと同様に用いられる。例えば、ナイーブベイズ法、隠れマルコフモデル、及び一般的な機械学習技術のような統計学的手法が提案されている。
米国特許第6405162号明細書 米国特許第6678677号明細書 米国特許第6263335号明細書 米国特許出願公開第2003/0074187号明細書 米国特許出願公開第2005/0138556号明細書 米国特許出願公開第2005/0137847号明細書
従来技術のようなシステムが抽出する種類の事実は多少制限される。さらに、これらは高度な言語ツールを用いず、エンティティ間のリンクの意味次元を取り込むことができないので、事実を捉え損ねることが多い。これらの課題を解決することが望まれている。
例示的な実施形態の態様は、テキストを検索(retrieve:サーチではない)するためのシステム及び方法を含む。1つの態様において、テキストを検索するためのシステムは、ユーザにより選択されたテキストストリングのテキスト断片に関連する文法規則を識別するための命令と、関連する格納媒体からこの文法規則を満たすテキストストリングを検索するための命令とを含むプロセッサを含む。ディスプレイは、検索されたテキストストリングを表示するために提供される。プロセッサと通信するユーザ入力デバイスは、ユーザが、クエリー(問合せ)を生成するために、表示されたテキストストリングのテキスト断片を選択することを可能にする。プロセッサは、ユーザにより選択されたテキスト断片に関連する文法規則を識別し、格納媒体からこの文法規則を満たすテキストストリングを検索する。
文法規則は、語彙規則、構文規則、及び意味次元規則で構成される群から選択される規則を含むことができる。テキストストリングには、複数の種類の文法規則のタグを付けることができる。検索されたテキストストリングの少なくとも幾つかのテキスト断片には、複数の文法規則のタグを付けることができる。プロセッサは、検索されたテキストストリングに関連する文法規則をディスプレイに表示させるための命令を含むことができる。ディスプレイは、グラフィカル・ユーザ・インターフェースとして働き、これによって、ユーザが、検索されたテキストストリングに関連する複数の文法規則の少なくとも1つを選択するようになる。GUIは、ユーザが、検索されたテキストストリングに関連する文法規則の全てより少ない数を選択することを可能にすることができ、プロセッサは、ユーザにより選択された文法規則を適用して、格納媒体から、ユーザにより選択された文法規則を満たすテキストストリングを検索する。ユーザが幾つかの文法規則を選択した場合は、プロセッサは、格納媒体から、ユーザにより選択された文法規則のみを満たすテキストストリングを検索することができる。文書抽出及び検索システムは、テキストを検索するためのシステムと、テキストストリングに文法規則の表示を付すパーサと、表示が付されたテキストストリングを格納するデータベースとを含むことができる。パーサは、複数の文法規則を格納する文法規則データベースを含み、複数の規則の規則を入力テキストストリングに適用し、このテキストストリングに適用可能な規則の表示を付すように適応されることができる。
別の態様においては、方法は、選択されたテキストストリングからクエリーを生成するステップを含み、これは、選択されたテキストストリングのユーザにより選択されたテキスト断片に関連する文法規則を自動的に識別することと、関連する格納媒体から、識別された文法規則の少なくとも幾つかを満たす付加的なテキストストリングを検索するためのクエリーを生成することを含む。
クエリーの生成は、ユーザにより選択された文法規則を含むクエリーを生成することを含むことができる。データベースのテキストストリングに、このテキストストリングが満たす文法規則を識別するタグの表示を付すことができ、方法は、さらに、クエリーを満たすテキストストリングを検索することを含むことができる。方法は、さらに、テキストストリングに、このテキストストリングによって満たされる文法規則に対応するタグの表示を付し、表示が付されたテキストストリングを格納媒体内に格納することを含み、ここからクエリーを満たすテキストストリングを検索することができる。
別の態様においては、データベースから文書を検索するためのシステムは、ユーザが、表示されたテキストストリングのテキスト断片を選択することを可能にするグラフィカル・ユーザ・インターフェースを含み、表示されたストリングは、テキスト断片に関連する文法規則に対応するタグの表示が付され、その文法規則は複数の規則から選択される。プロセッサは、選択されたテキスト断片に関連する文法規則を識別し、この文法規則を満たすテキストストリングを含む文書を検索するためのクエリーを生成する。
グラフィカル・ユーザ・インターフェースは、画面及びユーザ入力を含むことができ、プロセッサは、表示される文法規則に対するユーザの入力要求に応答して、ユーザにより選択されたテキスト断片に関連する文法規則を画面上に表示する。
別の態様においては、クエリーを生成するために、コンピュータプログラム製品がコンピュータシステムにおける使用のために提供される。コンピュータプログラム製品は、コンピュータ可読プログラムコードを有するコンピュータ可読媒体を含む。コンピュータ可読プログラムコードは、コンピュータシステムに、入力テキストストリングのテキスト断片に関連するタグを識別させ、この入力テキストストリングのユーザにより選択されたテキスト断片のタグに基づいて、クエリーを生成させる。タグは、テキストストリングのテキスト断片に適用可能な文法規則を含む。
例示的な実施形態の態様は、自然言語テキストを含む文書が格納される、データベースのような格納媒体からテキストを検索するためのシステムに関する。
検索システムは、走査される文書のためのOCR技術を採用し、文書内容の意味を理解するように情報を分類し、格納し、検索し、抽出するために、多機能のシステムにおける用途を見出すことができる。
システムは、関連する情報のみを含む文書の部分を抽出する能力を有するサーチ(探索ともいわれる)エンジンとして特定の用途を見出す。
特に、モバイルユーザにおいては、多くの場合、文書全体ではなくテキストの小さい部分を検索することが望まれる。
統合された表現を抽出された情報全てに用いることができる。例えば、入力文書に対する全ての抽出された情報は、拡張マークアップ言語(XML)文書としてテキストと共に格納されて、データベースとして用いられることを可能にし、これは次いで、XPath命令のような好適なクエリー言語におけるクエリーによりクエリーすることができる。
図1を参照すると、文書の抽出及び検索の両方のための例示的なシステムは、コンピュータシステム形態の文書処理デバイス又はプロセッサ10を含み、これは、電子形態の自然言語文書といった1つ又はそれ以上の文書14、16を受け取るための入力ユニット12と、メモリ18と、自然言語パーサ20とを含み、これは例えば、適用可能な文法規則を文書にタグ付けすることによって、文書14、16に注釈を付ける。文書の注釈及び検索のための例示的な方法は、図2及び図3に例示され、以下にさらに詳細に説明される。
デバイス10に入力される文書14、16をディスク又は他の携帯型格納媒体上に格納することができ、或いは、インターネット又は無線又は有線ネットワークといったリンクを介して処理デバイスに送ることができる。
図4を参照すると、ここで用いられる「文書」という用語は、一般に、テキスト本体を指し、他の非テキスト情報も含むことができる、より大きい文書の下位区分であってもよい。各文書14、16は、語彙及び文法を有する自然言語で表現される1つ又はそれ以上のテキストストリング22を含む。各テキストストリングは、文の句又は節と同程度に短くすることができ、一般に、文を含み、2つ又はそれ以上の連続する文を含むことができる。入力文書は、一般に、各々が、語、句、数字及び日付又はそれらの組み合わせといった、複数のテキスト断片24を含む複数のテキストストリングを含む。入力XML文書に対しては、サーチ可能なテキストストリングは、隠しテキストを含むことができる。コンピュータシステム10は、入力テキストを注釈付きのサーチ可能なテキスト本体に変換する。入力文書は、メモリ18における処理の前に又はその間に格納することができる。文書処理デバイス10は、デスクトップPC、ラップトップPC(ノートPC)、ワークステーション、サーバ又はパーサ20がソフトウェアとしてロードされるメインフレームコンピュータといった汎用コンピュータであってもよいし、又は、図3に概説される方法を実行することができるいずれかの装置であってもよい。
パーサ20は、電子形態の1つ又はそれ以上の文書14、16(又はテキストストリング22)を入力として取り、入力文書を注釈付きの文書に変換する。ここで。用いられる「パーサ」という用語は、一般に、テキストストリング22の注釈付けに使用することのできる全ての注釈付け処理命令を指す。注釈付けは、テキストストリングの内部文法構造を保存して、迅速なサーチを可能にする。一般に、パーサ20は、文書のテキスト内容を構文的、意味次元的及び語彙的に分析し、文書のテキスト断片間の関係を識別するための命令を含む。注釈付き文書は、SQL言語のクエリーにより問合せすることができるリレーショナルデータベース等のデータベース26に格納され、或いは、エンリッチXMLファイル28として又は他の構造のフォーマットとして格納される。データベース26は、ディスク、ハードドライブ、インターネットサーバなどのようないずれかの好適な格納媒体に配置することができる。
言語ユーザインターフェース30は、クエリーに応答する、データベース26からの1つ又はそれ以上の注釈付き文書24又は文書の部分(例えば、テキストストリング)を検索するために、ユーザがクエリーを入力及び編集することを可能にする。ユーザインターフェース30は、画面のようなディスプレイ34及びプロセッサ36をもつプログラムされた汎用コンピュータ32に組み込んでもよいし、又は、専用の処理デバイスであってもよい。
図2を参照すると、パーサ20は、語彙規則、構文規則、及び依存性(意味次元)規則といった文法規則に対応するタグ(ラベル)40、42、44、46、48により、テキストストリング22に索引を付ける/注釈を付ける。語彙規則は、それらが発生する順序又はそれらの間のスペースによって語の間の関係を定義する。構文規則は、名詞−動詞、形容詞−名詞といった語の間の文法的関係を記述する。意味次元規則は、依存性(主語−動詞関係、目的語−動詞関係)、名前付きエンティティ及び同一参照規則を含む。
パーサ20は、例えば、米国特許公開第2005/0138556号及び米国特許公開第2003/0074187号に説明されるように、インクリメンタルパーサを含むことができる。
パーサ20は、構文関係、意味次元関係、概念の適合性の識別並びに語彙分析といった様々な種類のテキストの分析を実行するための処理命令を含む。例えば、パーサ20は、言語分析のための幾つかのモジュールを含むことができる。各モジュールは、入力テキスト上で動作し、幾つかの場合には、他のモジュールのうちの1つによって生成された注釈を用い、全てのモジュールの結果が文書14、16に注釈を付けるために用いられる。従って、幾つかの異なる文法規則は、結果的には、同じテキストストリング22又はその断片24に関連することができる。
パーサモジュールは、入力テキストストリング22の最初の語彙及び構文の処理に対する処理命令を実行する前処理モジュール52、54、56、58を含む。前処理モジュールは、トークン化モジュール52、モルフォロジーモジュール54、曖昧性解消モジュール56、名前付きエンティティモジュール56及び構文モジュール58のうちの1つ又はそれ以上を含むことができるが、これらのモジュールの機能は、単一ユニットとして組み合わせることができることが理解されるであろう。
トークン化モジュール52は、例えば、テキストストリングにおける語、数及び他の認識可能なエンティティを識別するように、テキストストリングにおけるテキスト断片24を識別する。トークン化装置52は、この文字のシーケンスを順序付けられたトークンのシーケンスに変換し、ここでは、各トークンは文字のサブシーケンスである。
モルフォロジーモジュール54又は「レマタイザ」は、不定冠詞、名詞、動詞などのような特徴のリストからの特徴を、文書内の各々の認識される語又は他のテキスト断片と関連させることによってトークンの語彙の性質を分析し、文書内で用いられる語の見出し語の形式及び/又は語幹及び/又はモルフォロジーの形式を識別し、文の文法的部分及び語の見出し語の形式を識別するタグ46を文に付ける。
曖昧性解消モジュール56は、1つより多い意味を有する語の曖昧性を解消するのを補助するために規則を適用する。曖昧性の解消は、所与の内容の曖昧な語に対して関係のないカテゴリを除去することで構成されることができる。
名前付きエンティティモジュール58は、メモリ62に格納された名前付きエンティティの語彙を参照することによって及び/又は文脈の局所的な文法規則により、名前付きエンティティに対応するテキスト断片を識別する。認識されたエンティティは、個人名、組織、日付、通貨表示、場所、百分率、法的参照、事象などを含むことができる。テキスト断片は、例えば、名前付きエンティティの適切な種類を示すタグ40付けるように、意味次元のラベルで注釈を付けることができる。
チャンク化モジュール60は、ヘッド(一般に、名詞、動詞、形容詞又は前置詞)の周りの語を群分けする。これらのカテゴリの周りには、限定詞、副詞、代名詞などのような他の二次的なカテゴリがまとめられて、チャンクを形成する。
チャンクは他のチャンクの上部に作ることができる。
依存性モジュール70は、文、句、又は他のテキストストリング22におけるテキスト断片24の間の意味次元関係(構文依存性、例えば、主語−目的語、主語−動詞、目的語−動詞、補語)を識別し、図5に示す構文ツリーとして、文の文法的部分の間の関係を識別するタグ44を文に付けることができる。
概念適合モジュール74は、テキストストリング22に、種々の語で表現することができる一般の概念を示すタグで表示を付す。
正規化モジュール76は、例えば、時制の情報を位置情報及びトピック情報と識別するように主題役を識別することにより、前置詞句(例えば、in the garden、during the war、after 1984)を区別する。幾つかの句を、構文的には句に関連する動詞、並びに、このような動詞が主として時制の情報(例えば、after 1984)、トピック情報(例えば、in Mechanical Engineering)又は位置情報(例えば、in the garden)に関連する可能性を用いて識別することができる。
語彙モジュール78は、単に特徴を語と関連させる辞書又はシソーラスとすることができる。例えば、特徴educationは、語doctorate及びmaster’s degreeに関連させることができる。語彙モジュール78は、WordNet(登録商標)のような、オンライン語彙参照システムを使用することができる。
時制モジュール80は事実及び事象に関連する、日付のような時制の表現を検出する。これらは、文書における出現順序とは無関係に時系列的に順序付けることができる。例えば、Robert Smith joined Acme Corp in 1991の文では、以下のタグ
join(Robert Smith、Acme Corp.)及びtime(in 1991)
を文書に付加することができる。
同一参照(Co-reference)モジュール82は、意味次元分析を用いて、例えば、代名詞に適当な直前又は直後の名前付きのエンティティを参照し、必要に応じて、代名詞の後方照応又は前方照応リンク42を適用することにより、代名詞に関連する名詞を抽出する。引用におけるテキストは作成者のタグを受け取ることができる。
モジュールのための処理命令を、それぞれのモジュールのメモリに格納することができ、或いは、メモリ84のような単一の格納媒体又はカーネルに組み込むことができる。
更新モジュール86又は規則コンパイラは、キーボード、タッチスクリーン又は他の好適なデバイスといったユーザ入力デバイス88により、ユーザが語彙を追加する、又は、パーサに規則を追加する、或いは、既存の規則を変更することを可能にする。パーサの命令が一組の文書で開始された場合には、これらの特定の文法ファイルが文法カーネル84と共にロードされ、それらが含む規則は通常の分析の終わりにおいて、テキストに適用される。規則のうちの1つが適用されるたびに、特定の依存性がタグとして生成される。
言語ユーザインターフェース30は、グラフィカル・ユーザ・インターフェース(GUI)を含むことができ、手持ち式の、携帯型デバイスとすることができる。言語インターフェース30の全て又は一部を提供するコンピュータ32は、ディスプレイ34及びプロセッサ36に加えて、一時メモリ102、及びハードドライブ104を含むことができ、これら全てはバス106により相互接続される。例えば、コンピュータ32は、パーソナルコンピュータ、或いは、携帯情報端末(PDA)、携帯電話、タブレットPC、ポケットPC等の移動デバイス、又は他の好適な電子デバイスとすることができる。一般に、図3に示すフローチャートを実施することができる有限状態マシンを用いることができるいずれのデバイスも、システム30を実施するために用いることができる。1つの実施形態においては、プロセッサ36は、全ての規則及び語彙のリソースを含む、パーサ20に類似したパーサを装備する。
ユーザは、表示されるテキストストリング又はテキスト断片上をクリックするための、例えば、マウス、トラックボール、ペン、タッチパッド、タッチスクリーン、スタイラスといったポインタ110のような1つ又はそれ以上の関連する入力デバイス110、112、又は、入力/出力(I/O)デバイス113によりインターフェース30と対話するためのキーボードのようなテキスト入力デバイス112を操作することができる。マウス110は表示されるテキスト上をクリックすることを可能にし、キーボード112は、エンティティ名、又はユーザのクエリーの一部を形成することができるテキストストリング22といったテキスト断片24を入力することを可能にする。ストリングの特定のテキスト断片を選択するために、ユーザはマウス及び/又はカーソルを用いて、それを強調表示することができる。
一時メモリ102は、検索された文書のキャッシュを格納することができ、RAM、フレキシブルディスク、及びディスクドライブ、書き込み可能光ディスク及びディスクドライブ、フラッシュメモリ等を用いて実施することができる。
プロセッサ36は、ユーザのクエリーに応答してデータベース26のサーチを実行するため、並びに、応答する文書を検索するための命令を含む。プロセッサ36は、通信インターフェース114に関連することができ、有線又は無線リンク116により、例えば、ローカルエリアネットワーク又はインターネット接続により、データベース26にリンクされる。検索された文書は、データベース26において応答性があるとしてタグを付けることができ、又は、検索されて、キャッシュとしてメモリ102内に格納することができる。クエリーは、少なくとも部分的に、ユーザの識別により、データベース26内に格納された注釈付き文書の1つ又はそれ以上における応答するテキストの強調表示により確立される。ユーザインターフェース30は、ユーザが、関連のある事実を含む一組の文を単に選択することにより、検索することに関心があるという事実を記述することを可能にする。プロセッサ36は、テキストの強調表示された部分に基づいて、パーサの言語における規則を導出するための命令を含む。プロセッサはパーサ20のモジュールと同様なモジュールを含むことができる。
プロセッサ36は、画面34を介して、クエリーの状況を表示するための命令を含む。例えば、図5に示すように、表示は、キーボードを用いて入力されたユーザの入力クエリーを表示するためのクエリーボックス120と、クエリーに応答して検索される文書の数を示す識別子122と、ユーザがドローダウンメニューを選択することを可能にする、又は、ウィンドウを表示させるツールバー124を含むことができる。ポップアップボックス126は、テキスト断片(例えば、語、句又は他のテキストストリング)が、ユーザにより入力又は強調表示されたときに表示され、テキスト断片に関連する使用可能な文法規則からユーザによって選択された語及び規則を示すことができる。デフォルトによって、全ての使用可能な規則が選択される。図6は、ユーザがRobert Smithをサーチするように選択したことを示すポップアップボックス126を示す。図7におけるポップアップボックス126は、joinedの見出し語の形態がツールバー上の見出し語ツールにより選択されたことを示す。検索されたテキストは、テキスト表示ボックス128により表示され、これはクエリーRobert Smithに応答して検索された文書のテキストを例示する。
プロセッサ36は、検索された文書又はテキストストリング22において強調表示されたテキスト断片24に対するタグを検索するための命令を含む。処理命令は、ユーザが、検索された文書全体についてのタグ、又は、強調表示されたテキスト断片についてのみのタグを検索することの間で選択することを可能にする命令を含むことができる。例えば、ツールバー124の識別子はユーザがこれらの選択肢の間で選択することを可能にする。検索されたタグは、クエリーを改良するために規則を公式化するのに使用されることに加えて、ディスプレイ34により表示することができる。図8は、テキストストリングThe Dow Jones plunged that nightが強調表示されたときに表示されるウィンドウ130を示す。ユーザは、例えば、対応する文法規則134を選択するために1つ又はそれ以上のチェックボックス132上をクリックすることによってウィンドウと対話することができる。規則はまた、スクロールダウン規則表示ボックス136に表示することができる。
プロセッサ36に対する命令は、クエリーを生成するようにコンピュータにおいて用いるためのコンピュータプログラム製品として例示することができる。コンピュータプログラム製品は、ディスクのようなコンピュータ可読媒体、コンピュータチップ、又はコンピュータ可読プログラムコードを有する他の有形の電子格納媒体とすることができる。コンピュータ可読プログラムコードは、コンピュータに、入力テキストストリングのテキスト断片に関連するタグを識別させ、この入力テキストストリングのユーザにより選択されたテキスト断片のタグに基づくクエリーを生成させるようにし、タグはテキストストリングのテキスト断片に適用可能な文法規則を含んでいる。
ユーザインターフェース30は、ユーザが、単独で又は組み合わせてクエリーを表現する表示されたテキスト断片上を単にクリックすることを可能にする。プロセッサ36は、自動的に、強調表示された断片が発生するテキスト断片又はテキストストリングに関連するタグを検索する。次に、検索されたタグは、XMLファイル又は既にメモリ102内にキャッシュされた一組の検索された文書をサーチするための文法規則となる。プロセッサは、応答するテキストストリング、すなわち、特定の文法規則が満たされるものを検索する。
ユーザは、検索されたタグを見直し、サーチのために文法規則を選択することが可能になる。例えば、図7において、ウィンドウ130は、ユーザが、関心のある文法規則のみを選択することを可能にする。ウィンドウ130は、ユーザが、強調表示されたテキスト部分について、複数の文法的な選択肢(主語、目的語、動詞、見出し語の形態など)から選択することを可能にすることができ、それによりプロセッサに文法規則を生成させる。表示されるウィンドウ130は、強調表示されるテキスト部分によって違っていてよい。例えば、文書の検索された部分において、ユーザが名前Robert Smithを強調表示した場合には、ウィンドウは、ユーザが主語及び目的語の1つ又はそれ以上を選択することを可能にすることができ、プロセッサはこれを使用して規則を形成する。例えば、ユーザがsubjectを選択した場合には、プロセッサは、Robert Smithが文の主語であるという規則を生成する。或いは、ユーザは、いずれかの個人をサーチするために、Robert Smithに関連する文法規則PERSONを用いることができる。
選択された語が見出し語の形態を有する場合には、ドローダウンメニュー/ウィンドウ130は、ユーザが、見出し語の形態(全ての代替物をサーチするのに用いられる)を選択する、又は、特定の形態を選択することを可能にすることができる。例えば、ユーザがjoinedという語を強調表示した場合に、ドローダウンメニュー/ウィンドウ130は、ユーザが見出し語の形態joinを選択することを可能にする。ユーザが、さらに、Robert Smithに対して意味次元の文法規則PERSONを選択し、動詞joinを主語PERSONに関連させる依存性規則を選択した場合には、プロセッサは、joinの主語であるいずれかの個人に関連するテキストストリングを含む文書を検索する規則を生成する。
言語インターフェース30は抽出された事実から推論をすることができる。例えば、ユーザは、Robert Smithがある日付の前に何をしていたことに対する情報を検索するために「prior to」のような語を強調表示することができる。
Herbert Smith lead Acme Corp. after working for Acme Reserch Center of Europe and Acme Research Center of Canadaというテキストストリングが与えられた場合には、ユーザは、エンティティ依存性特徴だけを選択して、組織を率いる個人について、単に、Herbert Smithではなく、一般的な関心があるという事実を表現することができる。ユーザはさらに、「leads」をクリックし、「lead」の意味次元の特徴を選択して、「leader」の概念に感心があるという事実を表現することができる。
次に、ユーザは、組織の名前(この実施例では、Acme Research Center of Europe and Acme Research Center of Canada)をクリックし、任意的に、文法規則、名前付きエンティティ依存、ORGANIZATION(Acme Research Center of Canada)を選択して、組織のリーダを検索することに対する関心を表現することができる。次に、ユーザインターフェースは、この情報を取り上げて、透過的に規則を生成し、これは次いで、個人名を主語としてもつ、タイプ(活字)Leaderの述語をもつ、及びタイプ組織の目的語をもつ文だけをフィルタ処理するのに用いられる。
インターフェース30は、完全に経験のないユーザによる使用のために設定することができ、特定の事実を抽出するためのクエリーを定義することを可能にする。本実施形態においては、ユーザは、文書の文に表示される語を単にクリックすることによって、関心のある事実の種類を定義する。本実施形態において、グラフィカル・インターフェースは、語及び高レベルの意味次元のリンク(例えば、個人、場所又は組織)のみを表示することができるので、SQL固有の複雑さをユーザから隠すことができる。
インターフェースは、さらに、ユーザが、クリックすることにより、なぜ選択された語に関心があるかを指定するのを可能にすることができる(例えば、それらには特徴PERSONが書いてある、又は、それらが主語の位置にある、タイプ個人の名詞である、活字タイトルの目的語名詞であるので)。具体的には、インターフェースは、ユーザが語をクリックしたときにメニューを生成し、これはユーザが選択することのできる選択肢のリストを提供する。ユーザは、再びクリックすることによって選択肢を選択することができる。この情報を考慮に入れると、プロセッサは、自動的に、パーサにより用いられる言語でクエリーを生成し(例えばXIP)、これを次いで、データベースにおけるいずれかの文書に適用して、関連する情報を抽出することができる。
この後者の場合には、ユーザは、自動的に、構文規則を生成することができる。文法が変化したために、データベース26は、これらの規則が現在可能にする新規のリンクを考慮に入れるために、完全に又は部分的に再作成されることができる。
ユーザは、サーチするための文書又は一組の文書を選択することができる。ユーザは、選択された文書又は文書の集まり(辞書における)をユーザインターフェースのキャッシュにドラッグ・アンド・ドロップすることができる。次に、ユーザは、文書全体を構文解析するか、又は、ツールバーメニュー或いはウィンドウから、ユーザが関心のあるモジュール(例えば、NPのみ、又は、個人名のみ、又は、主語の位置にある個人名のみなど)を選択するかを選ぶことができる。例えば、ユーザは、1つ又はそれ以上の構文ノードを選択する、例えば、クリックする。構文ノードは、名詞、動詞、形容詞といった語彙のカテゴリ、或いは、名詞句(NP)、動詞句(VP)などのような句のカテゴリとすることができる。統語的依存関係(例えば、名詞とその動詞との間の主語の関係)を定義する2つのノードが選択される場合には、統語的依存関係が表示される。このように、マウスのクリックを自動的に複雑な規則に変換することができる。
パーサの規則データベースは、ユーザ指定の規則によって充実させることができ、これはさらに別の使用のために、特定のユーザディレクトリ108に格納することができる。
文書を変換するための例示的な方法及び文書を検索するための方法が、ここで、図2及び図3を参照して説明される。説明目的のために、パーサモジュールのための文法規則をコンピュータシステムにロードしたと仮定する。
図2を参照すると、文書を変換するための方法はステップS200で開始する。この方法は、一組の文書14、16をコンピュータシステム10に入力することを含む(ステップS202)。入力ステップは、ウェブサイトに対して、又は、パーサ20がインストールされたネットワークコンピュータに対して、XMLファイルを形成するために、電子的に文書を送信すること、或いは、それらを携帯型格納媒体からコンピュータシステム10に転送することを含む。又は、文書を走査して、コンピュータ可読フォーマットに変換することができる。ステップS204では、文書が一時メモリ内に格納される。構文解析ステップ(S206−S224)はユーザの入力なしに、自動的に進行することができる。
ステップS206では、トークン化装置52が、入力文書におけるトークン(語、句読点)を識別する。ステップS208では、モルフォロジーモジュール54が、文書において用いられる語の各々のトークン及び見出し語の形式及び/又は語幹の構文の性質を識別し、これに従って語に表示を付すことができる。ステップS210では、曖昧性解消モジュール56が曖昧なトークンに曖昧性解消規則を適用することができる。ステップS212では、名前付きエンティティモジュールが、名前付きエンティティを識別し、表示を付すことができる。ステップS214では、チャンク化モジュールがチャンクを識別する。ステップS216では、依存性モジュールモジュール70がテキスト断片の対の間の構文依存性を識別する。ステップS218では、概念適合モジュール74が、これらが表現する概念に対応するタグでテキストストリングに表示を付すことができる。ステップS220では、正規化モジュール76が前置詞句を区別して、これらに場所、時制、又はトピックのラベルの表示を付す。ステップS220では、語彙モジュール78が、特徴を、それらの特徴に関する語と関連させることができる。ステップS222では、時制モジュールが時称を検出し、それらに表示を付し、ファイル28に関連するヘッダにおいて、時系列的に格納することができる。ステップS224では、同一参照モジュール82が、代名詞の後方照応リンク及び前方照応リンク並びに作成者のタグを判断して、適切なテキスト断片に取り付けることができる。
ステップS226では、注釈付き文書がパーサによって出力され、すべての言語分析により充実されたXMLファイル28としてデータベース26内に格納される。或いは、注釈付き文書は、リレーショナルデータベース内に格納することができる。いずれの場合においても、文書は、クエリーに応答するテキストストリングを検索することを望むユーザにアクセス可能である。
図3を参照すると、文書をクエリーすることを望むユーザは、インターフェース30を用いて、クエリーに応答する文書全体又はテキストストリングを検索する。検索方法はステップS300で開始する。
ステップS302では、ユーザは、注釈付きテキスト本体を含むサーチされるXMLファイル28を選択することができ、或いは、データベース内の複数のファイル28又はさらにデータベース26全体をサーチすることができる。
ステップS304において、ユーザは、ファイル28における注釈付き文書のサブセットを戻すことができる名前付きエンティティのような広範な最初のクエリーを入力することができる。最初の段階において、プロセッサは、多数の応答する文書を識別することができる。ステップS306では、プロセッサは、入力されたサーチをテキストボックスに表示させる。例えば、when did Robert Smith join Acme?というクエリーに応えることを望むユーザは、例えば、キーボードで入力することによって名前Robert Smithを入力して、ユーザが、ツールバー上のNamed Entityツールを選択した後で表示されるポップアップボックスにおいて、それが表示されるようにすることができる。ステップS306では、クエリーがテキストボックスに表示される。ステップS308では、プロセッサは、例えば、関連するタグを検索することによって、最初のクエリーに関連する文法規則を識別し、この文法規則を用いてサーチクエリーを自動的に公式化する。ステップS310では、プロセッサはクエリーに応答する文書を検索する。検索ステップは、検索された文書のサブセットの識別をメモリ内に格納するプロセッサを含むことができ、及び/又は、注釈付き文書自体を一次メモリ内にキャッシュすることができる。ユーザインターフェース30は、ディスプレイ上に戻される文書の数を表示することができる。
ステップS312では、プロセッサは、広範のクエリー応答を含むテキストストリングとして、検索された文書のサブセットからの1つ又はそれ以上の文書の全て又は一部をディスプレイ34上に表示する。例えば、Robert Smithのようなサーチ用語を強調表示することができる。文書の検索をトリガした文法規則の全て又は幾つかは、文書が一時メモリ102内に格納されたときに失われることになる。
ステップS314では、ユーザは、組における検索された文書の1つ又はそれ以上のテキストを強調表示することにより、サーチを変更することを選択することができる。例えば、ユーザは、図7に示すテキストストリングにおいてRobert Smith、joined及びAcme Corpという語を強調表示することができる。強調表示されたテキスト断片は、少なくとも部分的にユーザのクエリーに応答する情報を含む。プロセッサは、強調表示された断片に関連するタグを検索し、そこから自動的にクエリーを生成して、検索される文書を問合せる。
或いは、ステップS316では、ユーザは文を選択し、この言語情報の組を生成するのに適用される規則と併せて、ユーザがその文に対する内部の言語情報にアクセスすることができるモードに切り換えることができる。このモードにおいて、プロセッサは、強調表示された文又はその断片に関連するタグを検索、そこから文法規則を自動的に生成する。ステップS318では、プロセッサは、強調表示されたテキスト断片に対する又はテキストストリングに対する関連する文法規則を表示することができ、これらは、例えば、対話式ウィンドウに表示される。このステップは自動とすることができる。代替的に、文法規則は、ユーザによって、例えば、ツールバーを通してアクセスすることができる。1つの実施形態においては、プロセッサ36は、第1に、規則を選択された文に適用することができ、各々は完全に構文解析される。次に、この構文解析が画面上に表示され、語は一番上に表示される。次に、ユーザは、各ノードをクリックして、結果としてもたらされる分析を、語から、より深い分析まで閲覧することができる。情報を選択するために、ユーザは、ノードをクリックして(例えば、関連するボックスをチェックすることにより)、そのノードに依存する特徴の特定の組を閲覧することができる。ユーザは、特徴のリストを生成するノード、及び、後でパーサ言語における有効な新規な規則に変換するプロセッサに供給されるノードと併せて、これらの特徴の幾つかを選択することができる(ステップS320)。
他の方法を用いて、規則を変更することができる。例えば、ユーザは、図7に示すように、ドローダウンメニューから見出し語ツール140のようなツールを選択することができる。ステップS322では、ユーザは、ツールバー上の語彙同等ツールを選択することができる。語彙同等ツールは、文書及び/又はそれ自体のメモリ内に格納された同等物に関連する語彙同等タグに基づいて、強調表示されたテキスト断片のいずれかの語彙同等物を表示することができる。ユーザは、サーチを拡張するために語彙同等物の1つ又はそれ以上を選択することができる。或いは、ユーザは、全ての語彙同等物を可能にするように選択することができる。
ステップS324では、プロセッサが選択された文法規則を含むクエリーを生成する。例えば、プロセッサ36は、パーサ言語における規則又はSQLクエリーを生成することができる。
実施例において、プロセッサ36は、
名前付きエンティティ:Robert Smith
名前付きエンティティ:Acme Corp.,Acme Corporation
動詞:joined
動詞の原形:join(見出し語)
主語、目的語:Acme Corp
主語、目的語:Robert Smith、Acme Corp.(同一参照タグを介して)
主語、動詞:Robert Smith、join(同一参照タグを介して)
目的語、動詞:join、Acme Corp
のような文法規則を識別する。
GUIは、APIによりパーサ20(又は、プロセッサ36における同等の構文解析命令)に接続することができる。ユーザがノード又は特徴を選択するたびに、システムは、クリックを、パーサにより生成されたC++オブジェクト内に格納された実際の情報とすぐに結びつけることができる。選択及びAPI情報の両方を交差させることは、ノードが別のノードのサブノードであるかどうか、又は、どのノードが所与の特徴の組に取り付けられるかをシステムが検出することを可能にする。提供される情報は実際の分析から生じるので、表示される全ての特徴、カテゴリ及び見出し語が有効である。ユーザはまた、さらに規則の適用を制約するために特定の依存性をクリックすることもできる。
例えば、図8において、ユーザは、ノード「Noun_Dow Jones」及び「Verb_plunged」を選択した。さらに、ユーザは、(ノードNounに対して)特定の見出し語「Dow Jone」を選択した。さらに、Dow Joneが、その後に再試行されるテキストにおける文の主語となることを要求する別の制約として、「SUBJ」依存性が選択された。規則は、自動的に、選択の結果として下のテキストボックスに生成される。ユーザはまた、見出し語の形式を検索するために、見出し語ツールをクリックすることができる。ステップS328では、プロセッサは、任意的にはユーザにより変更された文法規則を、キャッシュ内の検索された文書の組に適用し、文書のサブセットを検索する。例えば、プロセッサは、いずれかの更に別のユーザ選択により充実された、強調表示されたテキストの文法規則に基づいて、1つ又はそれ以上のクエリー規則を定義する。生成される規則は、ユーザの入力によって変更された、強調表示されたテキスト断片に関連するタグを含むことができる。生成される規則は、検索されたテキストにおけるテキスト断片の間の1つの又は無限の又は有限の数のスペースを可能にすることができ、選択されるテキスト断片に対する語彙の同等物を可能にすることができる。
ステップS330では、ユーザは、意図したクエリーが応答されたかどうかを判断するために、キャッシュ内の文書の1つ又はそれ以上を見直すことができる。ユーザは、関心のある文のみを選択することによって、事実抽出プロセスを改良することができる。ユーザは、サーチをさらに改良するために文書の新規の組からさらに別のテキストを選択することができ、又は、結果が意図されるクエリーに応答しない場合には、異なる検索基準を用いてサーチを繰り返すことができる。任意的には、方法が終了する前に、ステップS314ないしS330が、1回又はそれ以上繰り返される。ステップS332では、XMLファイルの文書を、サーチの結果としての新規の規則により、及び/又はユーザの規則の組に追加される新規の規則により充実させることができる。このステップは、自動的に、又は、ユーザの指示で進行することができる。方法は、ユーザがクエリーに対する応答を識別したとき、或いはサーチを終えると判断したときに、ステップS334で終了する。
検索された文書におけるテキスト断片を強調表示することによってクエリーを定義するこのプロセスは、通常の構文解析の動作と反対のものである。ここでの目標は、テキストを分析して自動的に規則を生成することである。次に、文書の組全体をこの減少した規則の組でクエリーすることができる。結果は、文或いは段落のような、規則に応答するテキストストリングの抽出である。
文書の自動化された注釈付けのための例示的なシステム及びクエリーに応答する注釈付き文書の検索システムのブロック図である。 文書の自動化された注釈付けのための例示的な方法のフロー図である。 図2の方法によって注釈が付けられた、クエリーに応答する文書を検索するための例示的な方法のフロー図である。 文書のテキスト断片に関連する文法規則に対応するタグが付けられた例示的な自然言語文書を示す図である。 構文解析後のツリー構造の文書を示す図である。 画面上に表示される最初のユーザクエリーを示す図である。 画面上で検索された文書のテキスト断片を強調表示することによるユーザのクエリーの変更を示す図である。 画面上に表示されるウィンドウを介した、プロセッサとの対話による文法規則のユーザの選択を示す図である。
符号の説明
10:文書処理装置
12:入力
14:テキスト
16:XML
18:一時メモリ
20:パーサ
26:リレーショナルデータベース
30:言語ユーザインターフェース
32:コンピュータ
34:ディスプレイ
36:プロセッサ

Claims (4)

  1. テキストを検索するためのシステムであって、
    ユーザにより選択されたテキストストリングのテキスト断片に関連する文法規則を識別するための命令と、関連する格納媒体から前記文法規則を満たす付加的なテキストストリングを検索するための命令と、を含むプロセッサと、
    検索されたテキストストリングを表示するためのディスプレイと、
    クエリーを生成するために、表示されたテキストストリングのテキスト断片をユーザが選択することを可能にする、前記プロセッサと通信するユーザ入力デバイスとを含み、
    前記プロセッサが、前記ユーザにより選択されたテキスト断片に関連する文法規則を識別し、前記格納媒体から前記文法規則を満たすテキストストリングを検索する、
    ことを特徴とするシステム。
  2. 前記プロセッサが、検索されたテキストストリングに関連する文法規則を前記ディスプレイに表示させるための命令を含むことを特徴とする、請求項1に記載のシステム。
  3. 前記ディスプレイがグラフィカル・ユーザ・インターフェースとして働き、これによって、検索されたテキストストリングに関連する複数の文法規則の少なくとも1つをユーザが選択できるようにすることを特徴とする、請求項1に記載のシステム。
  4. 選択されたテキストストリングからクエリーを生成することを含む方法であって、
    前記選択されたテキストストリングからユーザにより選択されたテキスト断片に関連する文法規則を自動的に識別することと、
    関連する格納媒体から、前記識別された文法規則の少なくとも一部を満たす付加的なテキストストリングを検索するためのクエリーを生成すること、
    を含むことを特徴とする方法。
JP2007011219A 2006-01-27 2007-01-22 言語ユーザインターフェース Expired - Fee Related JP5156236B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/341,788 US8060357B2 (en) 2006-01-27 2006-01-27 Linguistic user interface
US11/341,788 2006-01-27

Publications (2)

Publication Number Publication Date
JP2007200321A true JP2007200321A (ja) 2007-08-09
JP5156236B2 JP5156236B2 (ja) 2013-03-06

Family

ID=37943826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007011219A Expired - Fee Related JP5156236B2 (ja) 2006-01-27 2007-01-22 言語ユーザインターフェース

Country Status (3)

Country Link
US (1) US8060357B2 (ja)
EP (1) EP1814047A1 (ja)
JP (1) JP5156236B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022000772A (ja) * 2017-11-28 2022-01-04 富士フイルムビジネスイノベーション株式会社 文書処理装置及びプログラム

Families Citing this family (260)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
AUPS107202A0 (en) * 2002-03-13 2002-04-11 K W Dinn Holdings Pty Limited Improved device interface
US7865519B2 (en) * 2004-11-17 2011-01-04 Sap Aktiengesellschaft Using a controlled vocabulary library to generate business data component names
KR100669241B1 (ko) * 2004-12-15 2007-01-15 한국전자통신연구원 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
WO2006128183A2 (en) 2005-05-27 2006-11-30 Schwegman, Lundberg, Woessner & Kluth, P.A. Method and apparatus for cross-referencing important ip relationships
NZ566172A (en) 2005-08-12 2011-08-26 Kannuu Pty Ltd Improved process and apparatus for selecting an item from a database
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8306986B2 (en) * 2005-09-30 2012-11-06 American Express Travel Related Services Company, Inc. Method, system, and computer program product for linking customer information
US7707204B2 (en) * 2005-12-13 2010-04-27 Microsoft Corporation Factoid-based searching
US8115869B2 (en) 2007-02-28 2012-02-14 Samsung Electronics Co., Ltd. Method and system for extracting relevant information from content metadata
US8843467B2 (en) 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
US8209724B2 (en) * 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8510453B2 (en) 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8863221B2 (en) 2006-03-07 2014-10-14 Samsung Electronics Co., Ltd. Method and system for integrating content and services among multiple networks
US8200688B2 (en) 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8725729B2 (en) * 2006-04-03 2014-05-13 Steven G. Lisa System, methods and applications for embedded internet searching and result display
US7991608B2 (en) * 2006-04-19 2011-08-02 Raytheon Company Multilingual data querying
US7853555B2 (en) * 2006-04-19 2010-12-14 Raytheon Company Enhancing multilingual data querying
US8602793B1 (en) * 2006-07-11 2013-12-10 Erwin Ernest Sniedzins Real time learning and self improvement educational system and method
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7899822B2 (en) * 2006-09-08 2011-03-01 International Business Machines Corporation Automatically linking documents with relevant structured information
US20080065370A1 (en) * 2006-09-11 2008-03-13 Takashi Kimoto Support apparatus for object-oriented analysis and design
FI20060995A0 (fi) * 2006-11-13 2006-11-13 Tiksis Technologies Oy Luonnollisen kielen käsittely
US8935269B2 (en) 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
AU2007339737A1 (en) * 2007-01-03 2008-07-10 Kannuu Pty Ltd Process and apparatus for selecting an item from a database
US20090055393A1 (en) * 2007-01-29 2009-02-26 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices based on metadata information
US20080208735A1 (en) * 2007-02-22 2008-08-28 American Expresstravel Related Services Company, Inc., A New York Corporation Method, System, and Computer Program Product for Managing Business Customer Contacts
US20100153880A1 (en) * 2007-03-07 2010-06-17 Kannuu Pty Ltd. Method system and apparatus for entering text on a computing device
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8725059B2 (en) * 2007-05-16 2014-05-13 Xerox Corporation System and method for recommending educational resources
US8699939B2 (en) * 2008-12-19 2014-04-15 Xerox Corporation System and method for recommending educational resources
US8457544B2 (en) 2008-12-19 2013-06-04 Xerox Corporation System and method for recommending educational resources
US20100159437A1 (en) * 2008-12-19 2010-06-24 Xerox Corporation System and method for recommending educational resources
US7877403B2 (en) * 2007-05-21 2011-01-25 Data Trace Information Services, Llc System and method for database searching using fuzzy rules
US20080301016A1 (en) * 2007-05-30 2008-12-04 American Express Travel Related Services Company, Inc. General Counsel's Office Method, System, and Computer Program Product for Customer Linking and Identification Capability for Institutions
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
US8374844B2 (en) * 2007-06-22 2013-02-12 Xerox Corporation Hybrid system for named entity resolution
US8260619B1 (en) 2008-08-22 2012-09-04 Convergys Cmg Utah, Inc. Method and system for creating natural language understanding grammars
US8712758B2 (en) * 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system
KR101522049B1 (ko) * 2007-08-31 2015-05-20 마이크로소프트 코포레이션 모호성 민감 자연 언어 처리 시스템에서의 동일 지시어 분석
US8239455B2 (en) * 2007-09-07 2012-08-07 Siemens Aktiengesellschaft Collaborative data and knowledge integration
US8060502B2 (en) 2007-10-04 2011-11-15 American Express Travel Related Services Company, Inc. Methods, systems, and computer program products for generating data quality indicators for relationships in a database
US8041746B2 (en) * 2007-10-30 2011-10-18 Sap Ag Mapping schemas using a naming rule
US8176068B2 (en) 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8000956B2 (en) * 2008-02-08 2011-08-16 Xerox Corporation Semantic compatibility checking for automatic correction and discovery of named entities
US20090235280A1 (en) * 2008-03-12 2009-09-17 Xerox Corporation Event extraction system for electronic messages
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8666729B1 (en) * 2010-02-10 2014-03-04 West Corporation Processing natural language grammar
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8103669B2 (en) * 2008-05-23 2012-01-24 Xerox Corporation System and method for semi-automatic creation and maintenance of query expansion rules
US8473279B2 (en) * 2008-05-30 2013-06-25 Eiman Al-Shammari Lemmatizing, stemming, and query expansion method and system
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8938465B2 (en) 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
US20100075290A1 (en) * 2008-09-25 2010-03-25 Xerox Corporation Automatic Educational Assessment Service
US20100075291A1 (en) * 2008-09-25 2010-03-25 Deyoung Dennis C Automatic educational assessment service
US8370128B2 (en) * 2008-09-30 2013-02-05 Xerox Corporation Semantically-driven extraction of relations between named entities
US20100157345A1 (en) * 2008-12-22 2010-06-24 Xerox Corporation System for authoring educational assessments
US20100228538A1 (en) * 2009-03-03 2010-09-09 Yamada John A Computational linguistic systems and methods
CN101901235B (zh) * 2009-05-27 2013-03-27 国际商业机器公司 文档处理方法和系统
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) * 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110099052A1 (en) * 2009-10-28 2011-04-28 Xerox Corporation Automatic checking of expectation-fulfillment schemes
US8768241B2 (en) * 2009-12-17 2014-07-01 Xerox Corporation System and method for representing digital assessments
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8407217B1 (en) * 2010-01-29 2013-03-26 Guangsheng Zhang Automated topic discovery in documents
US20110195389A1 (en) * 2010-02-08 2011-08-11 Xerox Corporation System and method for tracking progression through an educational curriculum
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8346795B2 (en) * 2010-03-10 2013-01-01 Xerox Corporation System and method for guiding entity-based searching
US8339094B2 (en) * 2010-03-11 2012-12-25 GM Global Technology Operations LLC Methods, systems and apparatus for overmodulation of a five-phase machine
US8463790B1 (en) 2010-03-23 2013-06-11 Firstrain, Inc. Event naming
US8805840B1 (en) 2010-03-23 2014-08-12 Firstrain, Inc. Classification of documents
US8554542B2 (en) 2010-05-05 2013-10-08 Xerox Corporation Textual entailment method for linking text of an abstract to text in the main body of a document
US8788260B2 (en) * 2010-05-11 2014-07-22 Microsoft Corporation Generating snippets based on content features
US9563656B2 (en) 2010-05-17 2017-02-07 Xerox Corporation Method and system to guide formulations of questions for digital investigation activities
US9672204B2 (en) * 2010-05-28 2017-06-06 Palo Alto Research Center Incorporated System and method to acquire paraphrases
US20110295864A1 (en) * 2010-05-29 2011-12-01 Martin Betz Iterative fact-extraction
US8521077B2 (en) 2010-07-21 2013-08-27 Xerox Corporation System and method for detecting unauthorized collaboration on educational assessments
JP5573457B2 (ja) * 2010-07-23 2014-08-20 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US20120035905A1 (en) 2010-08-09 2012-02-09 Xerox Corporation System and method for handling multiple languages in text
US9524279B2 (en) * 2010-10-28 2016-12-20 Microsoft Technology Licensing, Llc Help document animated visualization
JP5423904B2 (ja) * 2010-11-17 2014-02-19 富士通株式会社 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム
US8935199B2 (en) 2010-12-14 2015-01-13 Xerox Corporation Method and system for linking textual concepts and physical concepts
US10762293B2 (en) * 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9418150B2 (en) * 2011-01-11 2016-08-16 Intelligent Medical Objects, Inc. System and process for concept tagging and content retrieval
US8838559B1 (en) * 2011-02-24 2014-09-16 Cadence Design Systems, Inc. Data mining through property checks based upon string pattern determinations
RU2451997C1 (ru) * 2011-02-28 2012-05-27 Учреждение Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН Спецпроцессор для решения задачи поиска кратчайшего пути между объектами на плоскости
US9064004B2 (en) * 2011-03-04 2015-06-23 Microsoft Technology Licensing, Llc Extensible surface for consuming information extraction services
US9582591B2 (en) 2011-03-11 2017-02-28 Microsoft Technology Licensing, Llc Generating visual summaries of research documents
US9075873B2 (en) 2011-03-11 2015-07-07 Microsoft Technology Licensing, Llc Generation of context-informative co-citation graphs
US8719692B2 (en) 2011-03-11 2014-05-06 Microsoft Corporation Validation, rejection, and modification of automatically generated document annotations
US9632994B2 (en) 2011-03-11 2017-04-25 Microsoft Technology Licensing, Llc Graphical user interface that supports document annotation
US9626348B2 (en) 2011-03-11 2017-04-18 Microsoft Technology Licensing, Llc Aggregating document annotations
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9904726B2 (en) * 2011-05-04 2018-02-27 Black Hills IP Holdings, LLC. Apparatus and method for automated and assisted patent claim mapping and expense planning
JP5681041B2 (ja) * 2011-06-03 2015-03-04 富士通株式会社 名寄せ規則生成方法、装置、およびプログラム
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
GB2506807A (en) * 2011-07-29 2014-04-09 Trustees Of Columbia In The City Of New York System and method for language extraction and encoding
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9940327B2 (en) * 2011-10-12 2018-04-10 International Business Machines Corporation Method for generating workflow from business specification
US8782042B1 (en) 2011-10-14 2014-07-15 Firstrain, Inc. Method and system for identifying entities
US9519706B2 (en) * 2011-11-29 2016-12-13 International Business Machines Corporation Multiple rule development support for text analytics
US8744838B2 (en) 2012-01-31 2014-06-03 Xerox Corporation System and method for contextualizing device operating procedures
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US20130332450A1 (en) * 2012-06-11 2013-12-12 International Business Machines Corporation System and Method for Automatically Detecting and Interactively Displaying Information About Entities, Activities, and Events from Multiple-Modality Natural Language Sources
US9043722B1 (en) * 2012-06-19 2015-05-26 Surfwax, Inc. User interfaces for displaying relationships between cells in a grid
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9720903B2 (en) * 2012-07-10 2017-08-01 Robert D. New Method for parsing natural language text with simple links
US10810368B2 (en) 2012-07-10 2020-10-20 Robert D. New Method for parsing natural language text with constituent construction links
US9710431B2 (en) 2012-08-18 2017-07-18 Health Fidelity, Inc. Systems and methods for processing patient information
US9552516B2 (en) * 2012-08-29 2017-01-24 Palo Alto Research Center Incorporated Document information extraction using geometric models
US9396179B2 (en) * 2012-08-30 2016-07-19 Xerox Corporation Methods and systems for acquiring user related information using natural language processing techniques
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9081847B2 (en) * 2012-10-11 2015-07-14 Nuance Communications, Inc. Data store organizing data using semantic classification
US9594872B2 (en) 2012-10-25 2017-03-14 Intelligent Medical Objects, Inc. Method and system for concept-based terminology management
US9152623B2 (en) 2012-11-02 2015-10-06 Fido Labs, Inc. Natural language processing system and method
US11322230B2 (en) 2012-11-05 2022-05-03 Intelligent Medical Objects, Inc. System and method for generating and implementing a stateless patient history module
US8972243B1 (en) * 2012-11-20 2015-03-03 Amazon Technologies, Inc. Parse information encoding in a finite state transducer
US10592480B1 (en) 2012-12-30 2020-03-17 Aurea Software, Inc. Affinity scoring
US9594745B2 (en) 2013-03-01 2017-03-14 The Software Shop, Inc. Systems and methods for improving the efficiency of syntactic and semantic analysis in automated processes for natural language understanding using general composition
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10289653B2 (en) * 2013-03-15 2019-05-14 International Business Machines Corporation Adapting tabular data for narration
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9766905B2 (en) * 2013-03-20 2017-09-19 Microsoft Technology Licensing, Llc Flexible pluralization of localized text
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
US9547640B2 (en) * 2013-10-16 2017-01-17 International Business Machines Corporation Ontology-driven annotation confidence levels for natural language processing
US9779722B2 (en) * 2013-11-05 2017-10-03 GM Global Technology Operations LLC System for adapting speech recognition vocabulary
US20150149203A1 (en) 2013-11-22 2015-05-28 Xerox Corporation Medical event tracking system
US9792276B2 (en) * 2013-12-13 2017-10-17 International Business Machines Corporation Content availability for natural language processing tasks
US11521717B2 (en) 2014-02-21 2022-12-06 Intelligent Medical Objects, Inc. System and method for generating and updating a user interface to evaluate an electronic medical record
US11488690B2 (en) 2014-02-21 2022-11-01 Intelligent Medical Objects, Inc. System and method for problem list reconciliation in an electronic medical record
WO2015138374A1 (en) * 2014-03-10 2015-09-17 Systems Imagination, Inc. Methods to represent and interact with complex knowledge
US9467583B2 (en) 2014-04-24 2016-10-11 Xerox Corporation System and method for semi-automatic generation of operating procedures from recorded troubleshooting sessions
EP3134824A4 (en) 2014-04-25 2018-03-28 Mayo Foundation for Medical Education and Research Enhancing reading accuracy, efficiency and retention
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9690771B2 (en) * 2014-05-30 2017-06-27 Nuance Communications, Inc. Automated quality assurance checks for improving the construction of natural language understanding systems
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US20150347363A1 (en) * 2014-05-30 2015-12-03 Paul Manganaro System for Communicating with a Reader
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10515151B2 (en) * 2014-08-18 2019-12-24 Nuance Communications, Inc. Concept identification and capture
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10909176B1 (en) 2014-10-28 2021-02-02 Intelligent Medical Objects, Inc. System and method for facilitating migration between electronic terminologies
KR101966268B1 (ko) * 2014-11-04 2019-04-05 후아웨이 테크놀러지 컴퍼니 리미티드 메시지 표시 방법, 기기 및 장치
US9904667B2 (en) * 2014-11-20 2018-02-27 International Business Machines Corporation Entity-relation based passage scoring in a question answering computer system
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9965458B2 (en) * 2014-12-09 2018-05-08 Sansa AI Inc. Intelligent system that dynamically improves its knowledge and code-base for natural language understanding
US10146751B1 (en) * 2014-12-31 2018-12-04 Guangsheng Zhang Methods for information extraction, search, and structured representation of text data
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US10885148B2 (en) 2015-03-24 2021-01-05 Intelligent Medical Objects, Inc. System and method for medical classification code modeling
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US9720905B2 (en) 2015-06-22 2017-08-01 International Business Machines Corporation Augmented text search with syntactic information
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10878010B2 (en) 2015-10-19 2020-12-29 Intelligent Medical Objects, Inc. System and method for clinical trial candidate matching
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9836451B2 (en) * 2016-02-18 2017-12-05 Sap Se Dynamic tokens for an expression parser
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9910914B1 (en) * 2016-05-05 2018-03-06 Thomas H. Cowley Information retrieval based on semantics
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US10289680B2 (en) * 2016-05-31 2019-05-14 Oath Inc. Real time parsing and suggestions from pre-generated corpus with hypernyms
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US20170357625A1 (en) * 2016-06-14 2017-12-14 Northrop Grumman Systems Corporation Event extraction from documents
CN107004000A (zh) * 2016-06-29 2017-08-01 深圳狗尾草智能科技有限公司 一种语料生成装置和方法
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11915803B2 (en) 2016-10-28 2024-02-27 Intelligent Medical Objects, Inc. Method and system for extracting data from a plurality of electronic data stores of patient data to provide provider and patient data similarity scoring
CN106648332A (zh) * 2016-11-16 2017-05-10 惠州Tcl移动通信有限公司 一种智能终端快速选择的方法和系统
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10282603B2 (en) * 2017-01-09 2019-05-07 International Business Machines Corporation Analyzing technical documents against known art
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10873545B2 (en) * 2017-06-12 2020-12-22 Microsoft Technology Licensing, Llc Automatic action responses
JP7103763B2 (ja) * 2017-07-20 2022-07-20 株式会社日立製作所 情報処理システムおよび情報処理方法
US11556548B2 (en) 2017-08-08 2023-01-17 Microsoft Technology Licensing, Llc Intelligent query system for attachments
CN107783960B (zh) * 2017-10-23 2021-07-23 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备
US10956670B2 (en) 2018-03-03 2021-03-23 Samurai Labs Sp. Z O.O. System and method for detecting undesirable and potentially harmful online behavior
CN110362808B (zh) * 2018-03-26 2022-06-14 阿里巴巴(中国)有限公司 文本分析方法及装置
CN110362810B (zh) * 2018-03-26 2022-06-14 阿里巴巴(中国)有限公司 文本分析方法及装置
CN110362809B (zh) * 2018-03-26 2022-06-14 阿里巴巴(中国)有限公司 文本分析方法及装置
JP7172101B2 (ja) * 2018-04-03 2022-11-16 日本電信電話株式会社 タグ付与モデル生成装置、タグ付与装置、これらの方法及びプログラム
WO2019229523A1 (en) * 2018-05-21 2019-12-05 Leverton Holding Llc Post-filtering of named entities with machine learning
US10740381B2 (en) * 2018-07-18 2020-08-11 International Business Machines Corporation Dictionary editing system integrated with text mining
US10762301B1 (en) * 2018-09-04 2020-09-01 Michael Dudley Johnson Methods and systems for generating linguistic rules
RU2697647C1 (ru) * 2018-10-01 2019-08-15 Общество с ограниченной ответственностью "Аби Продакшн" Система и метод автоматического создания шаблонов
US11775505B2 (en) 2019-04-03 2023-10-03 Unitedhealth Group Incorporated Managing data objects for graph-based data structures
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
CN111191421B (zh) * 2019-12-30 2023-09-12 出门问问创新科技有限公司 一种文本处理方法和装置、计算机存储介质和电子设备
US11817191B1 (en) 2020-01-12 2023-11-14 Leap Of Faith Technologies, Inc. System and methods for displaying genomic and clinical information
US11321526B2 (en) * 2020-03-23 2022-05-03 International Business Machines Corporation Demonstrating textual dissimilarity in response to apparent or asserted similarity
US11977569B2 (en) * 2021-01-29 2024-05-07 The United States Of America, Represented By The Secretary Of The Navy Autonomous open schema construction from unstructured text
US11487940B1 (en) * 2021-06-21 2022-11-01 International Business Machines Corporation Controlling abstraction of rule generation based on linguistic context

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190972A (ja) * 1989-01-19 1990-07-26 Sharp Corp 用例検索システム
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
JP2004133564A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd 文書検索装置
WO2004114163A2 (en) * 2003-02-19 2004-12-29 Insightful Corporation Method and system for enhanced data searching
JP2005151037A (ja) * 2003-11-13 2005-06-09 Sony Corp 音声処理装置および音声処理方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02240769A (ja) * 1989-03-14 1990-09-25 Canon Inc 自然言語文生成装置
US5761496A (en) * 1993-12-14 1998-06-02 Kabushiki Kaisha Toshiba Similar information retrieval system and its method
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
GB9713019D0 (en) * 1997-06-20 1997-08-27 Xerox Corp Linguistic search system
US5933822A (en) 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6763376B1 (en) 1997-09-26 2004-07-13 Mci Communications Corporation Integrated customer interface system for communications network management
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6601026B2 (en) * 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US6405162B1 (en) 1999-09-23 2002-06-11 Xerox Corporation Type-based selection of rules for semantically disambiguating words
DE10031351A1 (de) * 2000-06-28 2002-01-17 Guru Netservices Gmbh Verfahren zur automatischen Recherche
KR20020045343A (ko) * 2000-12-08 2002-06-19 오길록 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법
US6678677B2 (en) 2000-12-19 2004-01-13 Xerox Corporation Apparatus and method for information retrieval using self-appending semantic lattice
US6970881B1 (en) 2001-05-07 2005-11-29 Intelligenxia, Inc. Concept-based method and system for dynamically analyzing unstructured information
US7526425B2 (en) 2001-08-14 2009-04-28 Evri Inc. Method and system for extending keyword searching to syntactically and semantically annotated data
US7058567B2 (en) * 2001-10-10 2006-06-06 Xerox Corporation Natural language parser
JP3765799B2 (ja) * 2003-05-28 2006-04-12 沖電気工業株式会社 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム
US20050138556A1 (en) 2003-12-18 2005-06-23 Xerox Corporation Creation of normalized summaries using common domain models for input text analysis and output text generation
US7717712B2 (en) 2003-12-19 2010-05-18 Xerox Corporation Method and apparatus for language learning via controlled text authoring
US6915300B1 (en) 2003-12-19 2005-07-05 Xerox Corporation Method and system for searching indexed string containing a search string
US7409383B1 (en) * 2004-03-31 2008-08-05 Google Inc. Locating meaningful stopwords or stop-phrases in keyword-based retrieval systems
JP2005326975A (ja) * 2004-05-12 2005-11-24 Fujitsu Ltd 情報検索装置、情報検索プログラム及び情報検索方法
US7587387B2 (en) * 2005-03-31 2009-09-08 Google Inc. User interface for facts query engine with snippets from information sources that include query terms and answer terms
US20070100862A1 (en) * 2005-10-23 2007-05-03 Bindu Reddy Adding attributes and labels to structured data
US8122019B2 (en) * 2006-02-17 2012-02-21 Google Inc. Sharing user distributed search results
US7890499B1 (en) * 2006-07-28 2011-02-15 Google Inc. Presentation of search results with common subject matters
US7979425B2 (en) * 2006-10-25 2011-07-12 Google Inc. Server-side match
US7925498B1 (en) * 2006-12-29 2011-04-12 Google Inc. Identifying a synonym with N-gram agreement for a query phrase
US7966321B2 (en) * 2007-01-17 2011-06-21 Google Inc. Presentation of local results
US7801876B1 (en) * 2008-01-11 2010-09-21 Google Inc. Systems and methods for customizing behavior of multiple search engines

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190972A (ja) * 1989-01-19 1990-07-26 Sharp Corp 用例検索システム
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
JP2004133564A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd 文書検索装置
WO2004114163A2 (en) * 2003-02-19 2004-12-29 Insightful Corporation Method and system for enhanced data searching
JP2005151037A (ja) * 2003-11-13 2005-06-09 Sony Corp 音声処理装置および音声処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022000772A (ja) * 2017-11-28 2022-01-04 富士フイルムビジネスイノベーション株式会社 文書処理装置及びプログラム

Also Published As

Publication number Publication date
EP1814047A1 (en) 2007-08-01
US20070179776A1 (en) 2007-08-02
US8060357B2 (en) 2011-11-15
JP5156236B2 (ja) 2013-03-06

Similar Documents

Publication Publication Date Title
JP5156236B2 (ja) 言語ユーザインターフェース
US7774198B2 (en) Navigation system for text
JP5744873B2 (ja) トラステッドクエリのシステムおよび方法
US7398201B2 (en) Method and system for enhanced data searching
US7689411B2 (en) Concept matching
US7797303B2 (en) Natural language processing for developing queries
Srihari et al. Infoxtract: A customizable intermediate level information extraction engine
US20070219773A1 (en) Syntactic rule development graphical user interface
JP2004362563A (ja) 非構造化情報管理および自動テキスト分析を実行するためのシステム、方法、およびコンピュータ・プログラム記録媒体
US20090112845A1 (en) System and method for language sensitive contextual searching
Periñán-Pascual Bridging the gap within text-data analytics: a computer environment for data analysis in linguistic research
Fauzi et al. Image understanding and the web: a state-of-the-art review
Klang et al. Linking, searching, and visualizing entities in wikipedia
Litvak et al. Multilingual Text Analysis: Challenges, Models, and Approaches
Basile et al. META-MultilanguagE Text Analyzer
Reinberger et al. Is shallow parsing useful for unsupervised learning of semantic clusters?
Seretan et al. Syntactic concordancing and multi-word expression detection
Fogarolli Wikipedia as a source of ontological knowledge: state of the art and application
Soehn et al. Requirements of a user-friendly, general-purpose corpus query interface
Milić-Frayling Text processing and information retrieval
Du On the use of natural language processing for automated conceptual data modeling
Zhang et al. The identification of grammar points in international Chinese language teaching materials based on sentence-based annotation
Farmakiotou et al. Named entity recognition in Greek web pages
WO2001024053A2 (en) System and method for automatic context creation for electronic documents
Vale et al. Building a large dictionary of abbreviations for named entity recognition in Portuguese historical corpora

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees