JP2012226738A - 意味のある実体に基づき、導かれる、関連文書の検索方法 - Google Patents

意味のある実体に基づき、導かれる、関連文書の検索方法 Download PDF

Info

Publication number
JP2012226738A
JP2012226738A JP2012068155A JP2012068155A JP2012226738A JP 2012226738 A JP2012226738 A JP 2012226738A JP 2012068155 A JP2012068155 A JP 2012068155A JP 2012068155 A JP2012068155 A JP 2012068155A JP 2012226738 A JP2012226738 A JP 2012226738A
Authority
JP
Japan
Prior art keywords
search
entity
document
related documents
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012068155A
Other languages
English (en)
Other versions
JP2012226738A5 (ja
JP5837850B2 (ja
Inventor
Buldyska Oliva
オリヴァー・ブルディスカ
Isaev Petro
ペトロ・イザレフ
Holmes Chris
クリス・ホームズ
Mochalskyy Andriy
アンドレ・モカルスキ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2012226738A publication Critical patent/JP2012226738A/ja
Publication of JP2012226738A5 publication Critical patent/JP2012226738A5/ja
Application granted granted Critical
Publication of JP5837850B2 publication Critical patent/JP5837850B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]

Abstract

【課題】ソース文書に関連した文書から抽出された意味論的実体に基づいて、対話型および反復型の検索の問題を解決する。
【解決手段】一実施形態は、関連文書を検索するためのシステムを提供する。動作中に、システムはソース文書を受信する。システムは、その後、ソース文書から抽出された意味論的実体に基づいて、関連文書を検索する。次に、システムは、ユーザによって調整された検索基準を受信し、それに基づいて関連文書の検索結果を更新する。
【選択図】図2

Description

一実施形態は、関連文書を検索するためのシステムを提供する。動作中に、システムはソース文書を受信する。システムは、その後、ソース文書から抽出された意味論的実体に基づいて、関連文書を検索する。次に、システムは、ユーザによって調整された検索基準を受信し、それに基づいて関連文書の検索結果を更新する。
本実施形態の一変形例では、検索基準は、ソース文書から抽出された実体の数に応じた実体抽出の感知と、実体が関連文書の検索に含まれているか、あるいは、関連文書の検索から除外されているかを指示する実体に関する選択指示と、関連文書の検索用の実体の重要性を指示する実体に関する重みと、検索結果における関連文書の数に応じた検索感知指示であって、より高く感知することによって検索結果におけるより多くの関連文書が得られ、より低く感知することによって検索結果におけるより少ない関連文書が得られる検索感知指示との少なくとも1つを含んでいる。
本実施形態の一変形例では、システムは、1つ以上の追加されたソース文書を受信し、ソース文書から抽出された意味論的実体に基づいて関連文書の検索結果を更新する。
本実施形態の一変形例では、システムは、ユーザによる1つ以上の意味論的実体の指定を可能にし、ユーザによって指定された意味論的実体に基づいて関連文書の検索結果を更新する。
さらなる一変形例では、ユーザによって指定された意味論的実体は、一群の知られている実体から選択された適切な実体である。
本実施形態の一変形例では、検索基準は、構成ファイルに保管される。
本実施形態の一変形例では、システムは、ソース文書に関して他の文書の類似度レベルを計算することによって、関連文書を検索する。
本発明の一実施形態による関連文書を検索するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 本発明の一実施形態による関連文書検索システムを示す図である。 本発明の一実施形態による関連文書の検索プロセスを示すフローチャートである。 本発明の一実施形態による関連文書の検索結果の更新プロセスを示すフローチャートである。 本発明の一実施形態による関連文書を検索するための例示的なコンピュータシステムを示す。 図では、参照符号の同じものは、図の同じ要素を示している。
本発明の実施形態は、ソース文書に関連した文書から抽出された意味論的実体に基づいて、対話型および反復型の検索の問題を解決する。動作中に、システムはソース文書を受信する。システムは、その後、ソース文書から抽出された意味論的実体に基づいて、関連文書を検索する。システムは、ユーザによる検索基準の調整を可能にし、ユーザによって調整された検索基準に基づいて関連文書の検索結果を更新する。
関連したメッセージまたは会話を検索するために、本発明の実施形態は、文書における意味のある語または「実体」の生起を比較する計算方法を利用する。実体は、類似度計算用のソース文書から抽出される。ソース文書および実体の追加/削除と、抽出された実体の数の変更と、検索用の実体の個々の重みの変更とを含む検索基準を対話型および反復型に調整および改良するために、柔軟な枠組みがユーザに提供される。
図1は、本発明の一実施形態による関連文書を検索するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。この例では、この文書タイプは、電子メールメッセージである。GUI100は、ソース文書入力バー102と、ソース文書リスト104と、実体リスト106と、実体感知スライダ108と、検索感知スライダ110と、実体入力バー112と、関連文書リスト114、116とを含む。検索を開始するために、ユーザは、GUI100の上端に位置するソース文書入力バー102に1つ以上の文書を入力またはドラッグおよびドロップできる。ソース文書リスト104は、ユーザによって追加された現在のソース文書(2つの電子メール)を示している。
意味論的実体は、その後、ソース文書から抽出されて、これらの実体の全てまたは多数の部分集合を含む関連文書の検索基盤を形成する。ソース文書から抽出された実体は、実体リスト106において視覚化される。実体を、原文どおり(例えば、人または会社の名称)または図形によって(例えば、人または会社ロゴの写真)のどちらか一方で示すことができる。個々の実体を、実体に関連する名称または写真を強調表示することによって、検索に含むことができるか、あるいは、検索から除外できる。ソース文書から抽出された実体の数を、ユーザが実体感知スライダ108を用いて制御できる。例えば、実体感知スライダ108を右にスライドさせることにより、ユーザは、ソース文書からより多くの実体を抽出する。ユーザはまた、実体リスト106における実体名称または写真をサイズ変更することによって、検索用の個々の実体の重みを調整できる。
付加的な実体の場合、ソース文書から抽出された、追加される必要のある実体に加えて、ユーザは、実体名称をタイプしてもよいし、あるいは、知られている実体の広域データベースから実体入力バー112に実体をドラッグおよびドロップしてもよい。ユーザによって追加された付加的な実体を、実体リスト106における抽出された実体と共に示し、続いて、検索に含むことができるか、あるいは、検索から除外できる。検索感知スライダ110は、ユーザが実体に基づいた関連文書の検索の感知を調整することを可能にする。より高く感知することによって、検索結果においてより多くの関連文書が得られ、より低く感知することによって、検索結果においてより少ない関連文書が得られる。GUI100では、検索結果は、関連文書リスト114、116に示される。リストは、関連した電子メールメッセージがソース電子メールメッセージと同じ会話に属しているかに応じて分けられる。
図2は、本発明の一実施形態による関連文書検索システムを示す図である。関連文書検索システム200は、受信機構202と、ユーザによって調整可能な多数の検索基準204‐210と、検索機構212とを含む。動作中に、受信機構202は、関連文書を検索するためのソース文書220を受信する。ソース文書220は、テキスト、記号、図、および/または、それらの任意の組み合わせを含む、任意のタイプの文書であってもよい。ソース文書220はまた、平文、マイクロソフト(登録商標)社のワード、ハイパーテキストマークアップ言語(HTML)、ポータブル・ドキュメント・フォーマット(PDF)、または、電子メールメッセージといった、任意のタイプのファイル形式であってもよい。
次に、ソース文書220に多数の検索基準204〜210を適用し、意味論的実体を抽出する。意味論的実体は、語、語の組み合わせ、または、特定の意味をもつシーケンスであってもよい。語または語のシーケンスは、人々の名称、会社の名称、日付および時間、所在地住所、業界特有の用語、電子メールアドレス、統一資源位置指定子(URL)、および、電話番号といった、特定の語グループに属していれば、意味論的実体と見なされる。実体感知204は、ソース文書から抽出された実体の数を制御する。実体が抽出されると、ユーザは、実体選択206を調整することによって実体を検索に含めるか、あるいは、検索から除外するかを決定できる。もう1つの実施形態では、ユーザによって指定された実体を、広域実体データベースといった外部ソースから追加してもよい。実体の重み208を、ユーザが調整でき、これにより、関連文書を検索するために各実体の重要性が示される。ユーザはまた、検索結果において生成された関連文書の数に相当する検索感知210を調整してもよい。ここで、より高く感知することによって、より多くの関連文書が得られ、より低く感知することによって、より少ない関連文書が得られる。
ソース文書220および検索基準204〜210から抽出された実体に基づいて、検索機構212は、検索を実施し、関連文書の検索結果230を出力する。関連文書を識別するために、検索機構212は、実体および実体の重みの生起性および共起性に基づいて、様々な基準を用いて目標文書とソース文書との類似度を計算する。例えば、所定の閾値を越える類似度値は、目標文書がソース文書に関連していることを示している。
図3は、本発明の一実施形態による実体の抽出プロセスを示すフローチャートである。動作中に、システムは、ユーザからソース文書を受信する(動作302)。システムは、その後、ソース文書から抽出された意味論的実体に基づいて関連文書を検索する(動作304)。次に、システムは、ユーザによって調整された検索基準を受信する(動作306)。続いて、システムは、ユーザによって調整された検索基準に基づいて、関連文書の検索結果を更新する(動作308)。システムは、適宜、今後使用するために検索基準を構成ファイルに保管する(動作310)。
ユーザによって調整可能な検索基準は、ソース文書から抽出された実体の数に応じた実体抽出の感知と、実体を関連文書の検索に含むか、あるいは、検索から除外するかを指示する実体に関連する選択指示と、関連文書を検索するための実体の重要性を指示する実体に関連する重みと、検索結果における関連文書の数に応じた検索感知指示とを含んでいてもよい。より高く感知することによって、検索結果においてより多くの関連文書が得られ、より低く感知することによって、検索結果においてより少ない関連文書が得られる。
さらに、関連文書検索システムは、ユーザによる1つ以上のソース文書の追加または削除を可能にする。関連文書の検索結果は、更新されたソース文書から抽出された意味論的実体に基づいて、更新される。システムはまた、ユーザによる1つ以上の意味論的実体の指定を可能にし、ユーザによって指定された意味論的実体に基づいて関連文書の検索結果を更新する。ユーザによって指定された意味論的実体は、必ずしもソース文書から抽出されるわけではない。つまり、実体は、知られている実体の広域データベースから選択された適切な実体であってもよい。実体構成の各修正、または、ソースメッセージ入力は、これらの新たに修正されたパラメータによって、新しい実体に基づいた類似検索をトリガする。検索結果は、その後、結果を絶え間なく改良できるユーザに示される。
図4は、本発明の一実施形態による関連文書の検索結果の更新プロセスを示すフローチャートである。動作中に、システムは、1つ以上の追加されたソース文書を受信する(動作402)。次に、システムは、ユーザによって指定された1つ以上の意味論的実体を受信する(動作404)。システムは、その後、追加されたソース文書およびユーザによって指定された意味論的実体に基づいて、関連文書の検索結果を更新する(動作406)。
システムはまた、ユーザが、知られている実体の広域データベースから付加的な意味論的実体を追加する必要があるとき、抽出された実体に最も適した実体をユーザに提案してもよい。ユーザが実体を選択し、および/または、検索するための実体の個々の重みを調整した後、システムは、適切な実体のリストを更新でき、ユーザによって指定された実体に対する実体の適合性に基づいて、実体をソートする。方法を用いてユーザによって細かく調整された文書検索を、その後使用するために構成ファイルに保管できる。保管された構成ファイルは、実体抽出感知、個々の実体の重み、および、検索感知といった、ユーザによってカスタマイズされた検索基準のベクトルと共に、ソース文書および実体のリストを含む。
図5は、本発明の一実施形態による関連文書を検索するための例示的なコンピュータシステムを示している。一実施形態では、コンピュータおよび通信システム500は、プロセッサ502、メモリ504、および、記憶装置506を含む。記憶装置506は、文書検索アプリケーション508、および、アプリケーション510、512といった他のアプリケーションを記憶する。動作中に、文書検索アプリケーション508を、記憶装置506からメモリ504に読み込み、次に、プロセッサ502が実行する。プログラムを実行している間、プロセッサ502は、機能を実施する。コンピュータおよび通信システム500は、任意の表示装置514、キーボード516、および、ポインティングデバイス518に連結されている。
本詳細な説明に記載したデータ構造およびコードは、通常、コンピュータ読取り可能記憶媒体に格納される。媒体は、コンピュータシステムによって用いられるためのコードおよび/またはデータを記憶できる任意のデバイスまたは媒体であってもよい。コンピュータ読取り可能記憶媒体は、揮発性メモリ、不揮発性メモリ、ディスクドライブといった磁気記憶装置および光学記憶装置、磁気テープ、CD(コンパクトディスク)、DVD(デジタル多用途ディスクまたはデジタルビデオディスク)、または、現在知られている、あるいは、後に開発されるコンピュータ読取り可能媒体を記憶できる他の媒体を含むが、それらに限定されるものではない。
本詳細な説明部分に記載した方法およびプロセスを、上述したようなコンピュータ読取り可能記憶媒体に格納されうるコードおよび/またはデータとして具体化できる。コンピュータシステムが、コンピュータ読取り可能記憶媒体に格納されたコードおよび/またはデータを読み取り、実行するとき、コンピュータシステムは、データ構造およびコードとして具体化されてコンピュータ読取り可能記憶媒体内に格納された方法およびプロセスを実施する。
さらに、本明細書において説明した方法およびプロセスを、ハードウェアモジュールまたはハードウェア機器に含むことができる。これらのモジュールまたは機器は、特定用途向けIC(ASIC)チップ、書替え可能ゲートアレイ(FPGA)、特定の時間において特定のソフトウェアモジュールまたはコードの一部を実行する、専用プロセッサまたは共用プロセッサ、および/または、現在知られている、あるいは、後に開発される他のプログラマブルロジックデバイスを含んでいてもよいが、それらに限定されるものではない。ハードウェアモジュールまたはハードウェア機器をアクティブにするとき、モジュールまたは機器は、それらに含まれる方法およびプロセスを実施する。

Claims (10)

  1. コンピュータによって実行可能な、関連文書の検索方法であって、
    ソース文書を受信するステップと、
    前記ソース文書から抽出された意味論的実体に基づいて、関連文書を検索するステップと、
    ユーザによって調整された検索基準を受信するステップと、
    前記ユーザによって調整された検索基準に基づいて関連文書の検索結果を更新するステップとを含む、方法。
  2. 前記検索基準は、
    前記ソース文書から抽出された実体の数に応じた実体抽出の感知と、
    実体が関連文書の前記検索に含まれているか、あるいは、関連文書の前記検索から除外されているかを指示する実体に関する選択指示と、
    関連文書の前記検索用の実体の重要性を指示する前記実体に関する重みと、
    前記検索結果における関連文書の数に応じた検索感知指示であって、より高く感知することによって前記検索結果におけるより多くの関連文書が得られ、より低く感知することによって前記検索結果におけるより少ない関連文書が得られる前記検索感知指示との少なくとも1つを含む、請求項1に記載の方法。
  3. 1つ以上の追加されたソース文書を受信するステップと、
    前記ソース文書から抽出された意味論的実体に基づいて、関連文書の検索結果を更新するステップと、をさらに含む、請求項1に記載の方法。
  4. さユーザによる1つ以上の付加的な意味論的実体の指定を可能にするステップと、
    前記ユーザによって指定された意味論的実体に基づいて、関連文書の検索結果を更新するステップと、をさらに含む、請求項1に記載の方法。
  5. 前記ユーザによって指定された意味論的実体は、一群の知られている実体から選択された適切な実体である、請求項4に記載の方法。
  6. 前記検索基準は、構成ファイルに保管される、請求項1に記載の方法。
  7. 関連文書の前記検索は、ソース文書に関して他の文書の類似度レベルを計算するステップを含む、請求項1に記載の方法。
  8. 関連文書を検索するためのシステムであって、
    ソース文書を受信するように構成された文書受信機構と、
    前記ソース文書から抽出された意味論的実体に基づいて、関連文書を検索するように構成された関連文書検索機構と、
    ユーザによって調整された検索基準を受信するように構成された検索基準受信機構と、
    前記ユーザによって調整された検索基準に基づいて、関連文書の検索結果を更新するように構成された検索更新機構と、を含む、システム。
  9. 前記検索基準は、
    前記ソース文書から抽出された実体の数に応じた実体抽出の感知と、
    実体が関連文書の前記検索に含まれているか、あるいは、関連文書の前記検索から除外されているかを指示する実体に関する選択指示と、
    関連文書の前記検索用の実体の重要性を指示する前記実体に関する重みと、
    前記検索結果における関連文書の数に応じた検索感知指示であって、より高く感知することによって前記検索結果におけるより多くの関連文書が得られ、より低く感知することによって前記検索結果におけるより少ない関連文書が得られる前記検索感知指示との少なくとも1つを含む、請求項8に記載のシステム。
  10. 前記文書受信機構は、さらに、1つ以上の追加されたソース文書を受信するように構成されており、前記検索更新機構は、さらに、前記ソース文書から抽出された意味論的実体に基づいて、関連文書の検索結果を更新するように構成されている、請求項8に記載のシステム。
JP2012068155A 2011-04-18 2012-03-23 意味のある実体に基づき、導かれる、関連文書の検索方法 Active JP5837850B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/089,222 2011-04-18
US13/089,222 US8880530B2 (en) 2011-04-18 2011-04-18 Method for searching related documents based on and guided by meaningful entities

Publications (3)

Publication Number Publication Date
JP2012226738A true JP2012226738A (ja) 2012-11-15
JP2012226738A5 JP2012226738A5 (ja) 2015-05-07
JP5837850B2 JP5837850B2 (ja) 2015-12-24

Family

ID=46044388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012068155A Active JP5837850B2 (ja) 2011-04-18 2012-03-23 意味のある実体に基づき、導かれる、関連文書の検索方法

Country Status (4)

Country Link
US (1) US8880530B2 (ja)
EP (1) EP2515266A1 (ja)
JP (1) JP5837850B2 (ja)
KR (1) KR101942578B1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218885A1 (en) * 2012-02-22 2013-08-22 Salesforce.Com, Inc. Systems and methods for context-aware message tagging
US10713261B2 (en) 2013-03-13 2020-07-14 Google Llc Generating insightful connections between graph entities
US10402061B2 (en) 2014-09-28 2019-09-03 Microsoft Technology Licensing, Llc Productivity tools for content authoring
US10210146B2 (en) 2014-09-28 2019-02-19 Microsoft Technology Licensing, Llc Productivity tools for content authoring
US10528597B2 (en) * 2014-09-28 2020-01-07 Microsoft Technology Licensing, Llc Graph-driven authoring in productivity tools
US10050985B2 (en) 2014-11-03 2018-08-14 Vectra Networks, Inc. System for implementing threat detection using threat and risk assessment of asset-actor interactions
US10033752B2 (en) 2014-11-03 2018-07-24 Vectra Networks, Inc. System for implementing threat detection using daily network traffic community outliers
US11017179B2 (en) 2018-12-28 2021-05-25 Open Text Sa Ulc Real-time in-context smart summarizer
US11003840B2 (en) 2019-06-27 2021-05-11 Open Text Corporation System and method for in-context document composition using subject metadata queries
US11620351B2 (en) 2019-11-07 2023-04-04 Open Text Holdings, Inc. Content management methods for providing automated generation of content summaries
US11256735B2 (en) 2019-11-07 2022-02-22 Open Text Holdings, Inc. Content management systems providing automated generation of content summaries
US11423114B2 (en) 2019-11-07 2022-08-23 Open Text Holdings, Inc. Content management systems for providing automated generation of content suggestions
US11216521B2 (en) 2019-11-07 2022-01-04 Open Text Holdings, Inc. Content management methods for providing automated generation of content suggestions
US11790014B2 (en) * 2021-12-31 2023-10-17 Microsoft Technology Licensing, Llc System and method of determining content similarity by comparing semantic entity attributes

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050055365A1 (en) * 2003-09-09 2005-03-10 I.V. Ramakrishnan Scalable data extraction techniques for transforming electronic documents into queriable archives
JP2007065745A (ja) * 2005-08-29 2007-03-15 Canon Inc 文書検索方法および文書検索装置、プログラム
JP2009048369A (ja) * 2007-08-17 2009-03-05 Fujitsu Ltd 情報処理方法、情報処理装置、および、情報処理プログラム
WO2011039848A1 (ja) * 2009-09-29 2011-04-07 株式会社 東芝 関心領域抽出装置及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6820075B2 (en) 2001-08-13 2004-11-16 Xerox Corporation Document-centric system with auto-completion
US7444328B2 (en) * 2005-06-06 2008-10-28 Microsoft Corporation Keyword-driven assistance
US8713001B2 (en) * 2007-07-10 2014-04-29 Asim Roy Systems and related methods of user-guided searching
US20090210391A1 (en) * 2008-02-14 2009-08-20 Hall Stephen G Method and system for automated search for, and retrieval and distribution of, information
KR101079769B1 (ko) * 2009-05-21 2011-11-04 주식회사 아이네크 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템
US8762375B2 (en) * 2010-04-15 2014-06-24 Palo Alto Research Center Incorporated Method for calculating entity similarities
US8612457B2 (en) * 2011-03-28 2013-12-17 Palo Alto Research Center Incorporated Method and system for comparing documents based on different document-similarity calculation methods using adaptive weighting

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050055365A1 (en) * 2003-09-09 2005-03-10 I.V. Ramakrishnan Scalable data extraction techniques for transforming electronic documents into queriable archives
JP2007065745A (ja) * 2005-08-29 2007-03-15 Canon Inc 文書検索方法および文書検索装置、プログラム
JP2009048369A (ja) * 2007-08-17 2009-03-05 Fujitsu Ltd 情報処理方法、情報処理装置、および、情報処理プログラム
WO2011039848A1 (ja) * 2009-09-29 2011-04-07 株式会社 東芝 関心領域抽出装置及びプログラム

Also Published As

Publication number Publication date
KR20120118420A (ko) 2012-10-26
KR101942578B1 (ko) 2019-01-25
JP5837850B2 (ja) 2015-12-24
EP2515266A1 (en) 2012-10-24
US20120265767A1 (en) 2012-10-18
US8880530B2 (en) 2014-11-04

Similar Documents

Publication Publication Date Title
JP5837850B2 (ja) 意味のある実体に基づき、導かれる、関連文書の検索方法
US11403565B2 (en) Method and system for generating a learning path using machine learning
US20230018582A1 (en) Identifying relevant information within a document hosting system
US8015189B2 (en) Customizable connections between media and meta-data via feeds
US9378290B2 (en) Scenario-adaptive input method editor
US9767186B2 (en) Retrieving a specific sentence from a document
US10929603B2 (en) Context-based text auto completion
US11662872B1 (en) Providing content presentation elements in conjunction with a media content item
US20230221837A1 (en) Coalescing Notifications Associated with Interactive Digital Content
US10810370B2 (en) System and method for generating predictions
JP5754057B2 (ja) ユーザ生成コンテンツ項目とエンティティのマッチング
KR20170037957A (ko) 스프레드시트의 데이터세트를 폼 기반 뷰 내에 표현하는 기법
US10945040B1 (en) Generating and providing topic visual elements based on audio content and video content of a digital video
US20130041962A1 (en) Information Filtering
US10409463B2 (en) Forking digital content items between digital topical environments
JP6728178B2 (ja) 検索データを処理するための方法及び装置
CN104881431B (zh) 一种用于在计算机设备中获得搜索结果页的方法和装置
CN110569494A (zh) 用于生成信息的方法和装置
US10365798B1 (en) Feedback manager for integration with an application
US11775493B2 (en) Information retrieval system
CN106775711B (zh) 针对联系人的信息处理方法、设备和计算机可读存储介质
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム
CN106021416A (zh) 一种文件图标的创建方法和终端
US11928320B1 (en) Storing and arranging application windows for video call scenes
US11960911B1 (en) Storing and restoring desktop application scenes

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150320

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150320

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20150320

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20150331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151106

R150 Certificate of patent or registration of utility model

Ref document number: 5837850

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250