JP2009526290A - データベースレコードの生成または更新に関するデータの特定/抽出 - Google Patents

データベースレコードの生成または更新に関するデータの特定/抽出 Download PDF

Info

Publication number
JP2009526290A
JP2009526290A JP2008553461A JP2008553461A JP2009526290A JP 2009526290 A JP2009526290 A JP 2009526290A JP 2008553461 A JP2008553461 A JP 2008553461A JP 2008553461 A JP2008553461 A JP 2008553461A JP 2009526290 A JP2009526290 A JP 2009526290A
Authority
JP
Japan
Prior art keywords
term
source document
computer
terms
electronic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008553461A
Other languages
English (en)
Inventor
アージッティ、マイケル、エー.
ブリッジ、ジュピター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bloomberg Finance LP
Original Assignee
Bloomberg Finance LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bloomberg Finance LP filed Critical Bloomberg Finance LP
Publication of JP2009526290A publication Critical patent/JP2009526290A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、データ解析者がニュース記事、プレスリリースおよびその他の情報源を利用して、個人、会社およびその他の組織に関する情報を含むデータベースを維持する際の精度および効率の向上を図ることを目的とする、システム、方法およびコンピュータプログラムを提供する。素材情報を含むドキュメントはコンピュータ可読形式で入手され、その後オプションで生テキストに戻される。1つまたは複数のコンピュータ化されたシステムによってテキストを処理し、固有名詞、肩書き、表彰、およびその他の専門、教育、会社等の進展に関わる用語のような重要な用語にタグ付けをする。データ解析者がタグをレビュー、確認、削除、修正、導入、リンクし、最終的にデータベースにこの情報およびリンクを追加し、将来の検索に備えて電子ウェアハウスにソースドキュメントを格納するためのユーザインタフェースを本発明が提供する。

Description

本発明は、データベースレコードの生成または更新に使用される、コンピュータ化されたシステム、方法およびコンピュータ製品に関する。このようなシステム、方法および製品の実施態様では、例えば、電子ドキュメント(印刷文書から変換されたのも含む)の中からデータベースの主題に関係する情報を特定し、そのような情報を抽出し、レコードを更新あるいは生成するか、あるいは、データベースにそのような情報を追加する。特定の実施態様においては、データベースには個人に関するビジネス関連のニュースが格納され、ニュース記事や報告、プレスリリース、証券取引委員会報告のような官庁、行政機関のファイリング、およびその他の情報源などから特定し抽出された情報によって更新される。
著作権について
本特許文書の開示の一部分は、著作権保護の対象となる資料を含む。本著作権者は、特許商標庁における特許ファイルまたは記録に現れる通りの、本特許文書または本特許開示の複写による複製に関しては何人に対しても意義を唱えないが、その他の場合については、すべての著作権を留保する。
本発明は、現在、特に金融、ビジネス、法律などに関する情報やニュースを提供している、ブルームバーグ・プロフェッショナル(登録商標)サービスのようなシステムおよびサービスに応用される。
このような情報を供給、更新するためには、例えばニュース、報告、記事、官報(行政広報を含む)、会議録、プレスリリース、政府記録(例えば、行政記録を含む)などの形式の新規および改変されたデータを常にレビューする必要がある。
しかしながら、新情報は増え続け、結果としてしばしばこれらの情報をレビューする編集スタッフの増加を招く。
本発明は、情報の受信および電子発行の方法に適用されるが、これに限定されるものではない。本発明の一態様は、特にビジネス関連情報の電子発行に適用される。本発明が適用される情報は、様々な電子形式および非電子形式により受信される。例えば、様々な情報源からの、ニュース、報告、記事、官報(行政広報を含む)、会議録、プレスリリース、政府記録(行政記録を含む)およびその他の形式のもの、などである。電子形式および非電子形式での情報のインスタンスをここではドキュメントと呼ぶ。
本発明の実施態様では、レコード、ドキュメント、ファイルなどの生成あるいは更新を目的として、何らかの自動処理形式に情報が提供され、次いでその情報を1つまたは複数のデータベースに供給される。例えば、情報がデータベースに関連する情報であるかどうかを特定するために解析され、関連することが特定された情報がデータベースに供給される。本発明のある実施態様においては、情報を人手で解析するためのユーザインタフェースを備えており、解析を経て適切な情報がデータベースに供給される。
組織および個人に関する情報は、例えばブルームバーグ・エルピーによるブルームバーグ・プロフェッショナル(登録商標)サービスのような、それらの情報を検索、取得、格納、および/または提供することをビジネスとする様々な組織(すなわち、ベンダやサービス会社など)によって現在供給されている。この情報には、組織の性質(例えば、公共団体、私企業、非営利法人、組合組織、政府機関、等)、1つまたは複数の事務所あるいは施設の住所、重役、幹部、管理職の名前、および特に当該組織の事業活動および営業品目、が含まれる。個人に関しては、名前、年齢、学歴、職歴、肩書き、発表論文、表彰・受賞、その他の個人情報、が含まれる。
この種の情報は、例えばビジネスや経歴の過程において変化するものである。この情報の変化は、前述したタイプを含む様々なフォーマットで見つけることができる。本発明の実施態様によると、例えば情報を最新のものとすることによって、組織が情報データベース(複数可)を維持することを手助けできる。
本発明の実施態様によれば、例えば、上で述べたような情報を格納しているデータベースに提供すべき関連情報であるかどうかを特定するプロセスを少なくとも部分的に自動化し、かつ関連すると特定された情報を当該のデータベースに提供するための、方法、システム、コンピュータプログラムおよびプログラム製品が提供される。特定されるべき情報は、上述したように様々なフォーマットで提供される。本発明の一実施態様においては、この特定するプロセスに人が解析者として含まれる。この実施態様においては、関連あると思われる情報が自動的に特定され、例えばユーザインタフェースを介して解析者に呈示され、実際の関与度が決定あるいは確認される。その後に、関連すると特定された情報がデータベースに提供される。例えば、電子情報が自動的に解析され、関連の可能性のある情報が自動的に特定されて解析者に呈示される。呈示された関連の可能性のある情報に対して、例えば、呈示されたまま受理する、呈示された情報を却下する、解析者が修正を加えるなどした修正情報を受理する、というような形で、解析者がデータベースに入れるべきか否かの対応をする。受理された情報はデータベースに提供され、次いで更新される。
ユーザインタフェースの一実施態様では、ユーザインタフェースが関連の可能性のある情報を解析者に呈示する。ユーザインタフェースは、例えば呈示情報の修正に解析者が利用できる編集ツールと、呈示情報を受理あるいは却下するためにマウスのようなポインティングデバイスの使用などの選択機能とを備える。
本発明の一実施態様では、一例として個人、組織、あるいはその両方に影響する重要なイベントを含むデータベース関連の情報に関わる用語を、電子ドキュメントの中から特定するための、システム、方法およびコンピュータプログラムとプログラム製品が提供される。ある実施態様が、「テキスト解析」を備え、個人、組織、肩書きなどのエンティティやイベントを表す用語が個別に特定される。ある実施態様では、特定された用語に対してメタデータが付与される。これにより、特定された用語を解析者に対して自動的に呈示したり、1つまたは複数のデータベースを自動更新することが可能となる。「タグ付け」とは、テキストデータに対する場合も含めて、メタデータを付与することを示す一般的に使用される用語である。(「特定する」という言葉はここでは広範な意味で使用されている。色々あるが例えば、用語、関係、文法構造、および/または文脈のような、ドキュメントの特徴を見つけること、またはそのようにして見つけた特徴を表示すること、あるいはその両方を、状況に応じて含んでいる。)
用語には、例えば法人の経営陣の変更などのようなイベントを表すものがある。「ジェーン・スミス(Jane Smith)」のような固有名詞は個人を表すし、「アマルガメーテッド・コーポレーション(Amalgamated Corporation)」のような他の種類の固有名詞は組織を示す。「昇進した」、「職位」、「会長」、「最高経営責任者」などの用語は、ある組織における経営陣の変更のようなイベントを示す可能性がある。これらの用語が相互に近接して存在する場合には、用語を含んでいる文章の文法構造がそうであるのと同様に、これらがすべて共通のイベントに関係していることを示している可能性がある。
重要な用語およびその相互の関係を特定することで、そのドキュメントの内容についての情報を生成できる。この情報が、他のデータを記述するデータ、を一般に意味するメタデータの一例である。あるドキュメントに関するメタデータを記録する一般的な方法は、例えば、そのドキュメントの内容を記述するマークアップ言語を用いて、その文書そのものの中に記録することである。(「マークアップ言語」という言葉はここでは広範な意味で用いられており、紙のドキュメントあるいは電子ドキュメントに、そのデータの構造および性質を示す注釈をつけるための、記号とルールの正式な組合せを含んでいる。)
この業界でよく知られ、電子ドキュメントに対して幅広く使用されているマークアップ言語は、XMLとしても知られている拡張マークアップ言語(eXtensible Markup Language)である。ある実施態様では、電子ドキュメントの中で特定された重要な用語を示すためにXMLが用いられる。またある実施態様では、これらの用語間の関係を示すためにもXMLが使用される。XMLマークアップの基本要素は「タグ」と呼ばれ、上述の「タグ付け」という言葉の使い方と一貫している。
ある実施態様では、関心のあるデータベースに関連する情報を含むドキュメントの連続的な処理法に対応する。そのようなドキュメントは格納するために集積される。上述したように、ドキュメントは多数の供給源から電子的に入手できる。紙のドキュメントはスキャンした後に、文字認識ソフトウェアによる処理によって電子版とすることにより、実施態様にしたがった次の処理が可能となる。
初めて入手したドキュメントに、マークアップやメタデータ、あるいはドキュメントのテキストを構成するもの以外のデータが既に含まれていることがある。これらのデータはここでは、「非テキストデータ」、「非テキスト情報」、および/または「非テキストコンテンツ」と呼ぶ。実施態様のあるものは、テキスト解析エンジン、および/またはタギングエンジンを備えており、この情報を用いて性能および信頼性向上を図る。他の実施態様では、ドキュメントのテキストコンテンツに対してのみ作用する、テキスト解析エンジンおよび/またはタギングエンジンを有するものがある。そしてこれらの実施態様では、ドキュメントからマークアップやメタデータを分離する前処理段階も含まれており、それによって、生テキスト(未処理のテキスト)用のテキスト解析エンジンおよび/またはタギングエンジンを、生テキストに対して操作することができる。
本発明の実施態様のあるものでは、ドキュメントがタグ付けされ、タグ付けされた用語間の可能な関係が特定された後、このドキュメントが電子ディスプレイ装置を介して解析者に呈示される。解析者は自動的に行われたタグ付けおよびイベントの特定をレビューする。実施態様によっては、マウスのようなポインティングデバイスや、キーボード、あるいはその両方のコンピュータの入力装置を用いて、データ解析者が自動的な特定結果を受理あるいは却下することができる。
ドキュメントの呈示に加えて、あるいはそれに代えて、ユーザインタフェースによってドキュメントの関連部分を呈示し、例えば(ハイライティングのような)テキストにコントラストをつけるテキスト処理ツールを用いて、関連用語の呈示を支援あるいは強調することが望ましい。
タグ付け処理により、特定の個人、組織、場所、および/またはその他の有形、無形の事項に言及する用語がタグ付けされる。本発明の実施態様のあるものでは、更新中のデータベースに、用語が言及するエンティティの種類に関する情報を持った1つまたは複数のデータベースが含まれる。これらの実施態様においては、タグ付けの次に、タグ付けした用語に対応するレコードをデータベースで検索し、見つかったレコードがあれば読み出しを行う。この場合、特定の用語に対応する1つまたは複数のデータベース中で見つかったエンティティのリストも、1つまたは複数の用語に関連して、電子ディスプレイ装置に表示される。コンピュータ入力装置を使って、データ解析者がそれぞれの用語を適切なデータベースレコードとリンクさせることができる。望ましくは、リンク処理を容易にするためのユーザインタフェースが提供される。
例として、1つの実施態様においてタギングエンジンにより、個人、組織、肩書きおよび、同一文章中の「雇用された」というような1つまたは複数のキーワードがタグ付けされる。事前に設定された規則を用いて、イベントに対するレコードがエンジンにより生成され、それぞれの用語がこのイベントに関連づけられる。次いで関連するデータベースにおいて、対象とする個人および組織に関する情報が調査される。この実施態様においては、電子ディスプレイ装置上にユーザインタフェースが現れ、ソースドキュメントが表示される。そこではタグ付けされた用語が例えばハイライト表示され、更なるハイライトによって、これらの用語がすべて同一のイベントに関連していることが示される。データ解析者がキーボードやマウス、あるいはその両方の入力装置を使って、データベース調査で特定された一致候補の中から適切な個人および組織を特定する。データ解析者は、例えばイベントに対して日付範囲を指定したり、既にタグ付けされているその範囲を確認したりという、追加入力をすることもできる。
コンピュータ入力装置を使ってデータ解析者がイベントが適切であることを示すと、1つまたは複数のデータベースでコミット(確定)可能な、潜在的なトランザクションが生成される。解析者がイベントを完全に却下することもあり、この場合には潜在的なトランザクションは生成されない。ソースドキュメントが上述のイベントを2つ以上含むことがある。その場合には、データ解析者が受理するイベントごとに潜在的トランザクションを生成する。ソースドキュメントのレビューを終えると、データ解析者はそれぞれの潜在的トランザクションが対応するデータベースに対してコミットされるべきであることを、コンピュータ入力装置を使って表明する。
本発明のある実施態様においては、更新されたデータベースレコードのすべては、更新に用いた情報源とのリンクを取る。このような実施態様では、ソースドキュメントそのものは、ドキュメントアーカイブ、すなわち後で検索のできるウェアハウス、に電子的に格納される。そして、当該のデータベース(複数可)の更新においては、更新されたデータベース(複数可)のレコードと電子ソースドキュメントとのリンクも格納される。このような実施態様のあるものでは、データベース更新の情報源となった、各ドキュメントの中の特定のテキストとのリンクも格納される。
本発明のある実施態様においては、ユーザインタフェースを用いて同一あるいは異なるディスプレイ上に2つあるいはそれ以上のウィンドウを同時に呈示することができる。例えば、処理対象のドキュメント(あるいはその特定された部分)を1つのウィンドウに呈示し、その一方で、他の関連する情報を別のウィンドウに表示する、ということができる。上述の実施態様では、データ解析者がドキュメントの中で特定された特定のエンティティと対応するデータベースレコードとの間のリンクを確認するが、選択された候補レコードからの情報とそのドキュメントとが別々のウィンドウに同時に呈示される。
一例として、データ解析者が、例えばドキュメントの中のタグ付けされた用語に記名された特定の個人を確認しようとする場合、ソースドキュメントにある名前と一致するかもしくは似ている名前を持ったデータベース中の個人のリストが、ウィンドウに呈示されたユーザインタフェースの中に含まれる。データ解析者が、コンピュータ入力装置を使ってリストから1つのレコードを選択するときに、選択したレコードにある個人情報が別のウィンドウに現れる。この情報に基づき、解析者はそれが当該の個人であることを確認するか、さもなければ、他のレコードを選択して再トライすることができる。
本発明のある実施態様においては、受理、却下、および/またはリンクだけでなく、ユーザがタグの生成および/または修正を行うことができる。タグの修正には、例えばタグの内容あるいは1つまたは複数の他のタグとの関係を変更することや、電子ドキュメント内のタグの位置を変更することが含まれる。
他の実施態様においては、1つまたは複数のデータベースに対してコミットする前に、ソースドキュメントから呈示されたテキストを、解析者がテキスト編集(例えば、テキストの追加、修正、および/または削除、など)をすることができる。そして編集されたテキストが、上述の特定されたテキストについて説明したように、タグ付けされ、上述のようにさらにリンク付けされる。そうして新規に編集されたテキストであることが、ハイライティングのような視覚表示によっても呈示される。
ある実施態様においては、本発明により、提示されたドキュメントあるいはその一部分を処理しながら、生成されたトランザクションを解析者がレビューできるユーザインタフェースが提供される。例えばリスト上に現れるトランザクションに対して、データ解析者が追加、変更、削除を行うことができる。データ解析者がトランザクションのリストを承認すれば、このトランザクションはデータベースに対してコミットされる。ある実施態様においては、トランザクションのコンテンツの正しさを確保するために、解析者によるレビューが終了して初めて、トランザクションはデータベースに対してコミットされる。
本発明の好適な実施態様を、図を参照しながら説明する。
図1は、本発明による情報の収集、維持および提供(配布など)のためのシステムの好適な実施態様の概略図である。
システム100が、例えばビジネス関連の広範なトピックスに関する、最新、最近のニュースおよび情報をビジネス情報プロバイダシステム104に提供する複数の情報源102を含む。情報源102は、例えば、証券取引委員会ファイリング、プレスリリース、ニュースワイヤ(news wires)、為替相場のデータ入力、ウェブクローラ(web crawlers)、およびその他のビジネス情報、専門家情報、ニュース情報などを含む。
情報源102からネットワーク106経由で、プロバイダシステム104に情報が提供される。恐らくこれには、プロバイダシステム104で確立しているもしくはそれに適合するプロトコルに従い、プロバイダシステム104により容易かつ迅速に利用できる標準フォーマットが用いられる。非標準フォーマットで与えられたデータは処理前に正規化が必要かもしれない。また、印刷情報として与えられたデータはスキャナ108によって電子フォーマットに変換されるかもしれない。情報源102からプロバイダシステム104に提供された情報は、必要に応じて処理されてデータベース110に格納される。そしてユーザがアクセスできる1つまたは複数のターミナル122をそれぞれに備えるユーザシステム120において、情報を必要とするクライアントに対して入手可能となる。
要求ユーザシステム120が、アドミニストレータおよびその他の特別なクラスの要求ユーザが使用するシステムを含んでもよい。また、1つまたは複数のその他のユーザ、すなわち要求ユーザによってカレントアウェアネス(Current awareness)や他の情報の受取用に指定された、ユーザがアクセスできる端末122を含んでもよい。要求ユーザは、要求した情報の受取用に自分自身のシステムを指定できる。要求ユーザシステム120が、1つまたは複数のクライアントサーバあるいは他のコンピュータあるいはプロセッサ124と、ユーザシステム120で制御されるデータベースあるいは他のメモリ126とを、任意に含むことができる。
システム100は、インタネットおよび/またはローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、電子証券取引ネットワーク(ECN)の任意の組合せ、のような有効あるいは必要な通信ネットワークを含んでいるか、もしくはそれで動作している。この通信ネットワークには、多数の遠隔ユーザの端末あるいはユーザネットワークへ至る、接続用の通信線や通信施設、セキュリティファイアウォールやその他のデバイスを介したネットワーク、そしてルータおよび類似のものが含まれる。
ソース102、プロバイダシステム104および要求ユーザシステム120のそれぞれは、データファイアウォール、ゲートウェイおよびその他のデータおよびシステムの保護手段131,132,133によって任意に保護されている。
ある実施態様では、ドキュメントの内部ソース140がある場合もある。このような内部ソースは、プロバイダシステム104を制御しているのと同じプロバイダによって制御されていてもよい。また、ゲートウェイやファイアウォール131の仲介なしにプロセッサ150と交信してもよい。
図1のシステム100が、本発明による処理を導入するのに適したアーキテクチャの例である。このようなシステム導入の当業者にとって明らかなように、1つまたは複数の第三者のデータベースプロバイダ、すなわち仲介システム、の利用を含む、他の多くの形態のアーキテクチャも利用できる。
本発明の実施態様に基づいた情報の集積および解析のプロセスを図2に示す。1つまたは複数の情報ソース102と、情報プロバイダシステム104(図1)と、図1に示すような1つまたは複数のユーザが使用できる端末122を備えた、1つまたは複数の情報要求ユーザ120と、による好適な実施例として、図2のプロセス200を示す。
201においてソース102(第三者プロバイダだけでなくプロバイダシステム104の系列会社を含んでもよい)が新規のドキュメントを取り込む。ここで、ドキュメントは、1つまたは複数のページの紙のドキュメントの形であれ、1つまたは複数の電子データファイルであれ、本発明の実施に適した他のいかなる形であれ、要求ユーザ120が関心のあるトピックスに関係するいかなる情報をも含む。ニュース報道機関、著者、政府機関、などの外部当事者から配信された、物理的あるいは電子的な形式、もしくはその他の形式のドキュメントがソース102によって集められ、受け取られる。場合によってはソース102で生成されることもある。このシステムは、印刷されたドキュメントもスキャナ108を介して取得することができる。
ブロック205は、電子情報源からのドキュメントを生テキストに還元するオプション機能を示している。マークアップや他のメタデータ、あるいは非テキスト情報を含んでいないテキストが、生テキストである。例えば、取得したドキュメントが、ソース102から受け取る以前にXMLでマークアップされていることもある。このような元からのマークアップを利用して、自分自身での用語の発見および指示の手助けとするようなタギングエンジンを備えている実施態様もある。(タギングエンジンが1つまたは複数のコンピュータ用のソフトウェアプログラムおよび/またはソフトウェアモジュールを備えていてもよい。)実施態様によっては、元からあるマークアップの一部あるいはすべてを無視するタギングエンジンを含むものがあり、そのような無視された元からのマークアップはこのタギングエンジンの機能には干渉しない。しかしながら、このような入力を受け付けないタギングエンジンを持つものもあり、この場合にはタグ付けする前からあるマークアップの一部あるいはすべてを除去することが必要である。ブロック205はそのような実施例におけるメタデータの除去を表す。
テキスト解析エンジン208は、電子ソースドキュメントを受取り、そのドキュメントの中から本システムを利用して探そうとしている種々の情報に関連しそうな用語を見出し、その後に、そのことを示すタグを使用するように構成されている。(テキスト解析エンジンは、1つまたは複数のコンピュータのソフトウェアプログラムおよび/またはモジュールを含む。)好適な実施態様においては、用語は個人および会社に関する情報の変化に関係する。固有名詞(例えば人名および会社名など)、肩書き(例えば、「議長」とか「最高経営責任者」など)、アクション(例えば、「成功する」、「退職した」など)、およびその他の実業界関連語(例えば、「役員報酬委員会」、「地位」など)などの用語をテキスト解析エンジン208が特定する。
タギングエンジン210では、電子ソースドキュメントを受取り、テキスト解析エンジン208を参照し、テキストに解析結果を表示するためのマークアップを行う。この実施態様においてはマークアップとしてはXMLが使用される。しかし他のマークアップ形式を使用してもよい。タギングエンジンおよびテキスト解析エンジンは、業界ではよく知られており、ベリティ社(Verity, Inc.)、クリアフォレストコーポレーション社(Clear-Forest Corporation),エントリーバ社(Entrieva, Inc.)を含む異なる数社から市販品を入手することができる。
1つまたは複数のテキスト解析エンジンと1つまたは複数のタギングエンジンが、異なる実施態様においては違う形で相互に関連しあっていることは、当業者には明らかなことである。例えばある実施態様においては、テキスト解析エンジンが電子ソースドキュメントを処理し終えてから初めて、関連するタギングエンジンがそのドキュメントの処理を始めるように構成されている。他の実施態様においては、1つまたは複数のテキスト解析エンジンが、電子ソースドキュメントの1つまたは複数の部分を1つまたは複数のタギングエンジンと連携して段階的に処理するように構成されている。さらにまた他の実施態様においては、1つまたは複数のテキスト解析とタグ付けの統合エンジン(図示せず)が用いられ、ここでは1つまたは複数の論理ユニットが両方の機能を果たす。
タグ付けされたドキュメントは作業待ち行列220に入る。そこで解析者222による解析221を待つ。図3に解析221の詳細を示す。
図3に示すように、解析者222に対して、後で述べる図4に大略を示すようなインタフェースがコンピュータを用いて呈示される。解析者222がこのユーザインタフェースで与えられたツールを用いてタギングエンジン210からの出力を処理250する.好適な実施態様においては、「処理する」ということはタグ付けされた情報をレビューし、適切な項目とデータベースのレコードとの間の、および項目同士の間の関連づけを行うことを意味する。
例えば、解析者222が、会社の役員の名前にタグ付けされているのを見つけたとする。タグの属性に表示された文脈から、ドキュメントのこの部分はこの人物の新しい肩書きに関するものだということをシステムが判断する。ユーザインタフェースで提供されるツールを用いて、解析者222がドキュメントをさらにレビューして、その人物の勤務先、新しい肩書き、その地位での任期の開始日と終了日、などの正確なエンティティを特定する。
他の種類の情報も特定される。ドキュメントが証券取引委員会の年次報告書とかその他のファイルなどである場合、経済データがタグ付けされる。プレスリリースやニュース記事であれば、受賞とか学業成績が明らかになるであろうし、その進展状況もまたタグ付けされうる。
実施態様によっては、自動生成されたタグに追加して解析者222が新しいタグを生成することができる。そのような実施態様では、解析者222が追加情報を求めてドキュメントをレビュー252する。そのレビュー252に基づき解析者222がドキュメント254に手動でタグ付けする。例えば、タギングエンジンが情報あるいは関係を特定し損ねた場合に、手動でのタグが挿入される。手動のタグ付け254は、自動のテキスト解析208(図2)およびタグ付け210(図2)で生成されたタグを修正したり削除することを含む。
このレビュー250および手動処理252,254の後に、解析者222はブロック256に示すドキュメント配信に進む。解析者は新しい関係を反映したレコードを生成できる。このレコードは暫定的なデータベースのトランザクションを示し、解析者の命令により1つまたは複数のデータベース110(図1)に対してコミットできる。しかし、必要な場合には解析者がドキュメントを作業待ち行列220に戻し、監督者による更なるレビューを受けることができる。
図2に戻って、実施態様によっては、解析者222が1つまたは複数のデータベースに対して変更をコミットすることを選択した場合、システムは更なる2つの事項の内の1つあるいは両方を行う。第1は、1つまたは複数のデータベース110の更新に使用するために、承認された変更を検索する。変更は幾つかの異なる形態で格納される。例えば、コンピュータシステムのメモリの中、あるいは1つまたは複数のデータベースの中にデータ形式で、あるいは、電子ソースドキュメントそのものの中にメタデータあるいは他の形でコード化されて格納されることもある。後者の場合には、パーサ231がマークアップされたドキュメントから承認済みの変更を抽出することができる。
パーシング(構文解析)の後、抽出したデータを使ってローダ232がデータベース110(図1)の個人およびビジネス情報を更新する。その後に、エンドユーザ122(図1)からの要求に応答してシステムがこの情報を提供する。この情報を更新する際は、システムが、特にデータベース110中に、この情報の出所であったドキュメントのアイデンティティを記録する。これにより、エンドユーザ122が、システムより提供されたデータの出所を後から検索することができる。
第2として、タグ付けされたドキュメントそのものは、後の検索に備えて1つまたは複数のデータベース110の中に保管233される。実施態様によっては保管233には、保管されたドキュメントのテキストコンテンツからメタデータおよび/または他の非テキストデータを除去することが含まれる。
他の例では、変更をコミットするユーザの決定に従って異なる態様を取ることがある。例えばある実施態様では、1つまたは複数のデータベース110の更新の代わりに、あるいは更新に加えて、特定された関係についての情報がそのドキュメントに関連する追加のメタデータの形式で格納する。
電子ソースドキュメントを保管する代わりに廃棄する実施態様もある。
解析者222(図2)が、新規に取得したドキュメントからデータを抽出し、それに応じてデータベースを更新するために、好適な実施態様においては図4に表示されたユーザインタフェース画面300が用いられる。コンピュータワークステーションに取り付けられたディスプレイ装置にこの画面300が現れ、解析者222がこれを用いて、エンティティおよびイベントに対するシステムの特定結果を確認する。
最高レベルでは画面300は2つのパートを有している。1つのパートはドキュメント表示エリア301である。ここにはタグ付けされたドキュメント302が表示される。本実施態様においては、図2に示すようにドキュメント入手201、テキスト化205、1つまたは複数のタギングエンジン210によるタグ付けを経て本システムがこのドキュメントを取得し処理する。もし、ドキュメントが長すぎて割り当てられた領域に表示できない場合には、スクロールバー304によって解析者222がドキュメント全体を見ることができる。
処理によりドキュメントには幾つかのタグ付き用語306が含まれる。インタフェースを過度に混乱させないために、このシステムではタグそのものは解析者222には表示しない。ただしこのインタフェースは、タグ付けされた用語306の外観を変えてタグ付けされていることを示す。1つの方法はタグ付けされた用語306を色分けして、それが、ある人物が新しい地位に就いたことに関するものか、現職を離れたことに関するものか、またはその人物もしくは地位の歴史に関するものか、を示す。他の方法は、タギングエンジンにおいて、素材イベントに潜在的に対応すると認識された単語である「トリガワード」に下線を付すことである。さらに他の方法は、固有名詞を初出のときに太字で表示することである。これらの方法を単独、あるいは組み合わせて用いることができる。タグ付けされた用語の存在および重要性を示す他の方法は当業者には明らかである。
画面300のもう1つのパートは、タグ付けされたドキュメント302中のタグ付けされた用語306に対応するエンティティを特定するためのツールを入れた、ツール表示領域315である。
解析者222がタグ付けされた用語306へ進むのに応答して、その用語に関連づけられた素材イベント317をシステムがハイライトする。ツール表示領域315も変化して、タグ付けされた用語306のタイプに適したツールおよびキューを表示する。図4に、タグ付けされた用語306が肩書きである場合にこの実施態様で入手できるツールを示す。
タイプの凡例322を表示することによって、インタフェースがユーザにタグのタイプについて手がかりを与える。
例として図示したイベント317は、リチャード・スタンス(Richard Stans)という人物が、アマルガメーテッド・コミュニケーション(Amalgamated Communications)という会社の、会長兼最高経営責任者という新職位に就いた、というものである。この場合インタフェースによって、個人340、会社355および肩書き357、を正確に特定できるツールが解析者に対して与えられる。
本実施態様におけるシステムの役割が、個人および組織についての現在および過去の情報の提供であるので、データベース110(図1)の中に実業界の個人に関するデータベースがある。システムが素材イベント317を特定し、次いでタグ付けされた用語に一致する名前をデータベースで探す。そして、データベース中にある、この用語に一致する名前の候補341のリスト340が画面に表示される。解析者が正しい名前342を選択し、それに応じてシステムがその名前をハイライトする。
ツール表示領域315の最上部にボタン351のパネル350がある。ここの表示および機能は、名前ルックアップ領域340や会社ルックアップ領域355や肩書きルックアップ領域357で、そのときどのようなレコードがハイライトされているかによって変わる。図4に示した例では、個人名レコード342が今選択されており、ボタン351は功績、活動、あるいは個人に特徴的なイベントを反映している。このボタン351の1つを選択することによって、システムが判定したイベントのタイプを解析者が変更することができる。
本システムでは、関係するタグ付けされた用語に一致する会社名の候補を同様に調べることができる。画面には一致した名前360のリスト355が含まれ、解析者が適切なものを選択する。上述の場合と同様に、選択に応答してシステムがその名前をハイライトする。
その会社の職位の肩書きの候補362のリスト357も与えられる。タギングエンジン210(図2)によって特定された肩書きを確認しながら、解析者が適切な肩書きを選択する。インタフェースには、その人物が職位に就いた日364や職位を離れた日366、あるいはその両方を解析者が設定できるオプションもある。
ナビゲーションボタン370のパネルがツール表示領域315の最下部にある。「Next(次へ)」ボタン371および「Prev(前へ)」ボタン373によって、解析者がドキュメント302のタグ付けされた用語の間を移動することができる。
個人、企業体、肩書きおよび日付のそれぞれの関係は「トランザクション」とみなされる。「View Records(レコード閲覧)」ボタン372により、画面300から図5のリスト画面400のような、解析者が生成したトランザクションのリストに切り替わる。この実施態様においては、「Commit Records(レコードを確定)」ボタン374はこの画面300では動作せず、1つまたは複数のデータベースに対してコミットする前に解析者がリスト画面400でトランザクションをレビューすることが要求される。他の実施態様では、解析者が画面300から直接トランザクションをコミットさせることができる。
この実施態様では、図5に示すリスト画面400がユーザインタフェースに含まれている。このリスト画面400には、解析者222(図2)がタグ付けされたドキュメントで作業した間に生成したすべてのトランザクションがスプレッドシート状のリスト401として含まれている。トランザクション402のそれぞれが、リスト401の1行として表示される。非常に多くのトランザクションがあってリスト画面400中の割当てられた領域にリストが入りきらない場合には、解析者222はスクロールバー410でリストを前後に移動させることができる。
1つの実施態様では、個々のトランザクション402に対して、トランザクションに含まれる個人の苗字413および名前414、役職名415、関与する組織名称416、情報ソースの特質417(図5において「ドキュメントID」として示されている)、およびこのトランザクションに関与する個人を一意的に特定するコード418(本実施態様で「固有のID」と称されている)がリスト401に含まれている。
リスト画面400の最下部に解析者のための3つのオプションがある。解析者がトランザクション402の1つを選択して、「Show Me(内容閲覧)」のオプション425を選択すると、システムは、図4に示すドキュメント閲覧画面300を、選択したトランザクションに対応するテキストがハイライトされた状態で、表示する。
解析者がトランザクション402の1つを選択して、「Database Lookup(データベース参照)」のオプションを選択すると、システムが、解析者に図6に示す情報画面500を表示する。この画面には、トランザクション402に関連した人物についての個人情報およびその他の情報が表示される。
トランザクション402のレビューが終わると、解析者が「Commit Records(レコードをコミット)」のオプション427を選択する。実施態様によっては、トランザクション画面400に解析者用の追加オプションがあり、更なるレビューのためにタグ付けされたドキュメントを監督者の作業待ち行列に転送することができる.
こうして解析者は作業待ち行列220(図2)の中の次のタグ付けされたドキュメントでの仕事に進むことができる。
図6は個人のプロフィール情報を表示したユーザインタフェース画面500を示す。プロフィールには、システムの1つまたは複数のデータベースからの、個人の名前501、職位や肩書き507、雇用主502、住所503、電話番号504など、データが入手可能な限り表示される。解析者も含むユーザは、この画面から「More Details(詳細)」コントロール510を選択することによって、入手可能な場合には更なる情報を検索することができる。
このユーザインタフェースでは、組織に関する類似の情報を表示する同様な画面も提供される。
図7および図8は、2つの電子ディスプレイ装置を用いるデュアルディスプレイ540の概略図である。当業界で知られているように、第1のディスプレイ542および第2のディスプレイ544は同一のコンピュータに接続されるが異なる情報を表示することができる。図7は、第1のディスプレイ542と第2のディスプレイ544とが横に並んでデュアルディスプレイ540を構成しているディスプレイを表している。図8は、第1のディスプレイ542が第2のディスプレイ544の上に直接配置された他の構成のデュアルディスプレイ540を表している。どちらの場合も、ディスプレイは架台550で支持、固定されている。
本発明の好適な実施態様では、データ解析者がこのようなディスプレイを有するワークステーションを使用する。図9にこの実施態様を用いた縦型デュアルディスプレイ540の使用例を示す。これにより解析者がトランザクションを生成しながら追加の情報を見ることができる。例えば解析者は、1つのディスプレイ542上でドキュメント閲覧画面300(図4)に対して作業しているとき、システムによってタグ付けされた用語306(図4)に一致すると判定された名前の候補342(図4)の1つを選択することができる。この選択に応答して、システムが第2のディスプレイ544上に画面500を表示する。タグ付けされたドキュメントの横に関連する個人情報を配置することによって、本システムでは適切な個人が選択されたことを解析者が確認できる。また、1つのディスプレイ上で画面300と画面500を行ったりきたりして進めなければならない場合に比べてより迅速かつ効率的に解析者が作業をすることができる。デュアルディスプレイが図7に示す水平構成を取るか、図8に示す垂直構成を取るかは、本実施態様には関係しない。
システムにより第1のディスプレイ542上にトランザクション画面400(図5)が表示されているときも、同様の対応を取ることが可能である。データ解析者がトランザクション402(図5)を選択し、次に「Database Lookup(データベース参照)」のオプション426(図5)を選択すると、システムによって関連する個人情報がディスプレイ540の画面544上に表示される。
図10に、タグ付けされたドキュメントをデータ解析者が処理する好適な方法を示す。プロセス700はブロック701から始まり、データ解析者が作業待ち行列の中から次のタグ付けされたドキュメントを選ぶ。
そうすることによって、デュアルディスプレイ540の第1のディスプレイ542上にドキュメント閲覧画面300(図4)が現れる。タグ付けされたドキュメントがドキュメント表示領域301(図4)に現れる。次にブロック702で、データ解析者は「Next(次へ)」ボタン371および「Prev(元へ)」ボタン373(図4)を用いてタグ付けされたドキュメントの中の最初のタグへ進む。あるいは、本システムの実施態様のあるものでは、データ解析者がマウスやその他のポインティングデバイスを使って最初のタグを選択することができる。
データ解析者が最初のタグを選択するのに応答して、システムはブロック703に進む。タグ付けされたドキュメントの中の、タグに関係するイベントを記述した単語317(図4)がハイライトされる。また、システムがタグの属性を読み込み、ツール表示領域に適当なツールのセットを揃える。
選択されるツールはイベントの性質に依存して異なる。例えば、イベントが社内での新職位への任命に関するものであるとシステムが判断すれば、個人の固有名詞、新職位に関連する肩書き、会社名、および新情報が適用される日付範囲をデータ解析者が確認できるようなツールが提供される。
ブロック704はデータ解析者によって行われるプロセスである。ここでは、システムが一致する可能性のある名前として掲げたリストの中から、タグ付けされたテキストに記載された個人と一致する適切な名前を選択する。適切な名前の選択に応答して、システムがブロック705に進み、デュアルディスプレイの第2のディスプレイ上に、個人プロファイルを含む画面500(図6)を表示する。
ブロック706では、データ解析者が同じく会社、肩書きおよび日付範囲を選択する。データ解析者が一致可能リストから1つの会社を選択すると、ちょうどブロック705と同じように、システムによって第2のディスプレイ上に組織のプロファイルが表示される。
ブロック703から706までがデータベースのエントリ案を生成する。データ解析者がタグ付けされたドキュメントのすべてのタグを処理し終えるまで、これらのブロックが反復される。そうすることによって、データ解析者がそれぞれのタグに対するデータベースエントリ案を生成する。
しかしながら本実施態様においては、データ解析者がドキュメント閲覧画面からデータベースエントリ案をデータベースに対してコミットすることはできない。この故に、ブロック709に「View Records(レコード閲覧)」のオプション372(図4)が含まれ、これによりシステムは、第1のディスプレイ上にトランザクションリスト画面400(図5)を表示する。
データ解析者が、トランザクションリスト画面を見て、データベースエントリ案(「トランザクション」とも呼ばれる)をレビューできる。これがブロック710である。データ解析者がトランザクション案は正しいと結論すれば、「Commit Records (レコードのコミット)」オプション427(図5)を選択する。そうするとブロック714に進み、トランザクションが1つまたは複数のデータベースにコミットされる。
トランザクション案710のレビューによってトランザクションの変更や削除が必要な場合には、データ解析者がそのトランザクションに対応する行402(図5)を選んでから、「Database Lookup(データベース参照)」オプションを選択する。この動作に応答して、ブロック711がドキュメント閲覧画面300(図4)を第1のディスプレイ542(図7)へ戻す。ドキュメント閲覧画面が表示されると、選択したトランザクションに対応するイベントがシステムによってハイライトされている。データ解析者が異なるトランザクションを修正したい場合には、所望のタグへ進み712、それを修正713する。
必要なトランザクションを修正した後、データ解析者が再び「View Records(レコード閲覧)」のオプションを選択し、第1のディスプレイ上にトランザクションリスト画面を再表示させる。そうしてプロセスが前述のブロック709に戻る。
データ解析者がトランザクションのコミット714を選択すれば、プロセスは完結する。そうして作業待ち行列220(図2)の次のタグ付けされたドキュメントの作業に取り掛かれる。
本発明の実施態様が、図8に示されたものとは別の、および/またはそれに追加する機能を提供してもよい。例えば、データ解析者222がタグを手動で追加、編集、および/または削除できる実施態様であってもよい。
図2および図10およびその他で表現されたシステムおよびプロセスは、ここで詳述した本発明を遂行する上で用いうる多くの可能なシステム構成の単なる例に過ぎないことを当業者は理解するであろう。ここで表現されたシステムは単に説明的なものであるとみなされるべきである。ここで参照したシステムおよびソフトウェアは、暗示的であれ明示的であれ、コンピュータもしくは他の適切なハードウェアに実装されたソフトウェアを有する。ここで他の適切なハードウェアとしては、ユーザインタフェースの有無に拘らず、プロセッサとデータ記憶手段とオペレーティングシステムを補助する能力とを有する、例えばファイルサーバのような、本発明の目的を達成するのに有効な、その他の情報処理装置を含む。
本発明を具現化するソフトウェアコンポーネントおよびアプリケーションは、磁気、光学、磁気バブルあるいはその他の媒体上の電子ビット記憶装置で配布できる。オプションとして、例えばコンピュータや光ディスク上の電子読出し装置と対話できる輸送可能な形式でも配布できる。もしくはこのような媒体に受信者が保存できるように、有線あるいは無線のネットワークを介して配布されてもよい。
さらに、このような媒体に保存されたソフトウェアが電子的にカスタマイズされた装置を構成することは理解されるであろう。これは、磁気的、光学的に協調可能なコンピュータベースの入力装置と対話して、ソフトウェアの内容にしたがって、コンピュータを特別目的のコンピュータとしてカスタマイズする。このように構成されれば、この特別目的のコンピュータ装置は、特に対象として考えられている専門家ユーザにとって、いっそう高い価値を有することになる。
本発明を添付の図面で示す。ただしこれは例示であって、限定するものではない。また、図における同様の符号は同様または対応するものを指す。
本発明による情報を収集、維持および提供するシステムの好適な実施態様を示す図である。 本発明による情報を収集、維持および提供するシステムの好適な実施態様に従った情報の流れを示す図である。 本発明による情報を収集、維持および提供するシステムの好適な実施態様に従った情報の流れを示す図である。 データ解析者が新規獲得のドキュメントからデータを抽出し、それによってデータベースを更新するために使用するユーザインタフェースの画面である。 タグ付けされたドキュメントのレビューによって解析者が生成したトランザクションのリストを示すユーザインタフェースの画面である。 ある個人の個人情報を表示するユーザインタフェースの画面を示す図である。 2つの電子ディスプレイ装置を水平方向に並べた構成のデュアルディスプレイを示す図である。 2つの電子ディスプレイ装置を垂直方向に並べた構成のデュアルディスプレイを示す図である。 本発明の一実施態様で使用されるデュアルディスプレイを示す図である。 本発明による情報の収集および処理の好適なプロセスのフロー図である。

Claims (64)

  1. データベースの更新に用いる、電子ドキュメントの中の情報を特定する方法であって、
    少なくとも1つのコンピュータに実装された一連の規則に基づいて、前記データベースに関連する可能性のある前記電子ドキュメントの中の情報を自動的に特定するステップと、
    前記特定された情報をディスプレイ装置に自動的に呈示するステップと、
    コンピュータへのユーザ入力に応答して、前記ディスプレイ装置上に表示された前記の特定された情報を前記データベースの更新用に受理もしくは却下するステップと、
    を含むことを特徴とする、方法。
  2. 受理済みの特定された情報を前記データベースへ提供するステップを含むことを特徴とする、請求項1に記載の方法。
  3. 前記特定された情報を呈示するステップが、前記特定された情報の中のテキストを、前記ドキュメントの中の隣接するテキストとの文脈で呈示するステップを含むことを特徴とする、請求項1に記載の方法。
  4. 前記特定された情報の中の前記テキストが、前記ディスプレイ装置上に前記隣接するテキストとは対比されて呈示されることを特徴とする、請求項3に記載の方法。
  5. 前記特定された情報の中のテキストが、ハイライト表示によって対比されることを特徴とする、請求項4に記載の方法。
  6. データベースを更新するためにテキスト情報を利用するコンピュータ化された方法であって、
    1つまたは複数の事前に設定された規則に従って、電子ソースドキュメントの中の少なくとも1つの用語にタグ付けするステップと、
    前記の少なくとも1つのタグ付けされた用語にコントラストをつけて、前記ソースドキュメントを電子ディスプレイ装置上に呈示するステップと、
    少なくとも1つのコンピュータ入力装置を介するユーザ入力に応答して、前記少なくとも1つのタグ付けされた用語と、少なくとも1つの関連用語か外部データ、もしくはその両方とに関する少なくとも1つのリンクを提供するステップと、
    前記の少なくとも1つのタグ付けされた用語およびそのリンクを1つまたは複数のデータベースへ格納するステップと、
    を含むことを特徴とする、方法。
  7. 前記電子ソースドキュメントからすべてのメタデータおよび非テキストデータを除去するステップを含むこと特徴とする、請求項6に記載の方法。
  8. 前記電子ソースドキュメントの中の前記少なくとも1つの用語をタグ付けするステップが、マークアップ言語によるマークアップの生成を含むことを特徴とする、請求項6に記載の方法。
  9. 前記マークアップ言語がXMLであることを特徴とする、請求項8に記載の方法。
  10. 前記タグ付けのステップが、前記電子ソースドキュメントの中にあればタグ付けすることになっている、1つまたは複数の用語データベースの利用を含むことを特徴とする、請求項6に記載の方法。
  11. 前記1つまたは複数の用語データベースの1つまたは複数が、固有名詞を含むことを特徴とする、請求項10に記載の方法。
  12. 前記タグ付けのステップが、
    前記ソースドキュメントの中の前記用語を包含する関係を特定するための1つまたは複数の事前に設定された規則を利用するステップと、
    そのような1つまたは複数の特定された関係に対して、前記特定された関係についてのメタデータを前記ドキュメントと関連付けるステップと、
    を含み、
    前記ドキュメントを電子ディスプレイ装置上に呈示するステップが、前記タグ付けされた用語の間の前記関係を示すためにコントラストをつけることを特徴とする、請求項6に記載の方法。
  13. 前記用語を包含する関係を特定するための前記1つまたは複数の事前に設定された規則が、前記用語同士の近接性に基づく1つまたは複数の規則を含むことを特徴とする、請求項12に記載の方法。
  14. 前記タグ付けのステップが,テキストの前記文法構造を特定するのに適応した、1つまたは複数のコンピュータソフトウェアプログラムおよび/またはモジュールを利用することを含み、少なくとも1つのタグ付けされた用語を包含する関係を特定するための前記1つまたは複数の事前に設定された規則が、前記電子ソースドキュメントの前記文法構造を参照する1つまたは複数の規則を含むことを特徴とする、請求項12に記載の方法。
  15. 前記少なくとも1つのタグ付けされた用語をリンクするための前記少なくとも1つのコンピュータ入力装置を介する前記ユーザ入力が、前記少なくとも1つのタグ付けされた用語を包含する前記自動的に特定された関係を受理もしくは却下することを含むことを特徴とする、請求項12に記載の方法。
  16. タグ付けされた用語のそれぞれに関連する候補エントリを得るために、1つまたは複数のデータベースを検索するステップと、
    前記電子ディスプレイ装置上に表示される前記ユーザインタフェースの中に、候補エントリおよび関連する前記用語の1つまたは複数のリストを含めるステップと、
    タグ付けされた用語のそれぞれを前記関連する候補エントリの中の適正なものと関連付けるために、少なくとも1つのコンピュータ入力装置を介する追加のユーザ入力を受理するステップと、
    を含むことを特徴とする、請求項6に記載の方法。
  17. 前記少なくとも1つのタグ付けされた用語と関連付けられた前記1つまたは複数のデータベース中の少なくとも1つのエントリを更新するために、前記ユーザ入力を介して受理済みの前記少なくとも1つのタグ付けされた用語に関連する前記少なくとも1つのリンクを使用するステップを含むことを特徴とする、請求項16に記載の方法。
  18. データベース中の個人および/または組織に関する情報を維持するためのコンピュータ化された方法であって、
    1つまたは複数の個人および/または組織が関与する、1つまたは複数のイベントを記述するソースドキュメントを電子形式で取得するステップと、
    少なくとも1つの固有名詞を含む用語を有する、1つまたは複数の事前に設定した用語リストにおける個々の用語に対応して、前記電子ソースドキュメントの中から、固有名詞を含む用語を含めて、用語を特定するステップと、
    前記電子ソースドキュメントの中の特定した用語にタグ付けするステップと、
    固有名詞を含むタグ付けされた用語のそれぞれに対して、その固有名詞あるいは類似ものを持つ個人および/または組織を表すレコードを、1つまたは複数のデータベースの中で検索し、1つまたは複数のそのようなレコードを読み出すステップと、
    前記電子ソースドキュメントの中の用語に関わる関係を特定するための1つまたは複数の規則を適用して、前記電子ソースドキュメントに記述されている1つまたは複数のイベントを特定するステップと、
    前記電子ソースドキュメントの中の特定された1つまたは複数のイベントのそれぞれに対して、
    電子ディスプレイ装置上に、少なくとも1つの用語およびイベントにコントラストをつけた状態で、前記電子ソースドキュメントを呈示するステップと、
    前記コントラストの付いたイベントの特定を受理もしくは却下するために、少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理するステップと、
    前記コントラストの付いたイベントが受理された場合には、前記特定された関係の用語を含む前記イベントを記録するために、暫定データベーストランザクションを生成するステップと、
    前記暫定データベーストランザクションを1つまたは複数のデータベースでコミットするように指示する、少なくとも1つのコンピュータ入力装置を介した追加のユーザ入力を受理するステップと、
    少なくとも1つのコンピュータ入力装置を介した、前記追加のユーザ入力に応答して、前記ユーザに受理された前記1つまたは複数のイベントを反映させるために、1つまたは複数のデータベースに含まれるレコードを変更するステップと、
    後からの検索の可能性に備えて、前記電子ソースドキュメントをメモリデバイスに格納するステップと、
    を含むことを特徴とする方法。
  19. 前記電子ソースドキュメントの用語および/またはイベントを手動で特定し、手動および/または自動で特定された用語および/またはイベントを修正し、そして/あるいは手動および/または自動で特定された用語および/またはイベントを削除するために、前記少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理するステップを含むことを特徴とする、請求項18に記載の方法。
  20. 前記電子ソースドキュメントからすべてのマークアップ、メタデータおよび非テキストコンテンツを除去するステップを含むことを特徴とする、請求項18に記載の方法。
  21. 前記電子ソースドキュメントの中で特定された前記1つまたは複数のイベントのそれぞれに対して、
    特定された関係についてのいかなる用語も含む1つまたは複数の固有名詞を、前記電子ソースドキュメントと共に、前記電子ディスプレイ装置上に呈示し、かつ1つまたは複数の前記呈示された固有名詞に対して、一致もしくは類似の固有名詞を含む用語リストを呈示するステップと、
    前記少なくとも1つのコンピュータ入力装置を介するユーザ入力に応答して、少なくとも1つの前記呈示された固有名詞を前記呈示されたリストの中の用語と関連づけるステップと、
    前記少なくとも1つのコンピュータ入力装置を介するユーザの追加入力に応答して、前記関連するイベントを反映させるために、呈示されたリストの用語と関連する少なくとも1つの固有名詞に関連する、少なくとも1つのデータベースのレコードを更新するステップと、
    を含むことを特徴とする、請求項18に記載の方法。
  22. 前記少なくとも1つのコンピュータ入力装置を介する前記ユーザ入力に応答して、
    前記リストされた一致もしくは類似のデータベースレコードの1つを選択するステップと、
    前記データベースレコードが選択されたことを示すために、前記電子ディスプレイ装置上の表示を変更するステップと、
    前記データベースレコードに含まれる情報を、第2の電子ディスプレイ装置上に表示するステップと、
    を含むことを特徴とする、請求項21に記載の方法。
  23. ソースドキュメントを表示するテキスト領域と、
    少なくとも1つのコンピュータ入力装置を介してテキストが選択可能で、かつ選択されたときにそのテキストに視覚的にコントラストがつけられる、前記ソースドキュメントの中の選択可能なテキストと、
    前記ソースドキュメントの中を前記選択されたテキストの前あるいは後ろ、もしくはその両方のテキストへユーザがナビゲートできる1つまたは複数のコントロールと、
    前記電子ソースドキュメントからユーザが選択したテキストに一致もしくは類似するテキストを含む1つまたは複数のデータベースからの、1つまたは複数の候補レコードの第1のリストを表示する第1のルックアップ領域であって、少なくとも1つのコンピュータ入力装置を使用して前記ユーザが1つのレコードを選択でき、それぞれのレコードがエンティティに関する情報を含んでいることを特徴とする第1のルックアップ領域と、
    選択したテキストと選択したレコードとの1つまたは複数の関連を、ユーザが1つまたは複数のデータベースにコミット(確定)することができるコントロールと、
    を含む、電子ディスプレイ上に表示されるユーザインタフェース。
  24. ユーザが用語のタグ付けを手動で行うことができるコントロールを含むことを特徴とする、請求項23に記載のユーザインタフェース。
  25. ユーザが既存のタグの除去、既存のタグの修正、あるいはその両方を行うことができるコントロールを含むことを特徴とする、請求項23に記載のユーザインタフェース。
  26. 前記テキスト領域での前記電子ソースドキュメントの前記表示において、前記用語が相互にかつ同一のイベントに関係していることを示すために、前記ソースドキュメントの中の複数の用語にコントラストをつけて表示することを特徴とする、請求項23に記載のユーザインタフェース。
  27. 1つまたは複数のデータベースからの1つまたは複数の候補レコードの第2のリストを表示する第2のルックアップ領域を含むユーザインタフェースであって、前記第1の選択された単語や句が関連し同じようにコントラストをつけて表示されたイベントに関しての、第2の選択された用語と一致もしくは類似する名前を有するエンティティについての情報をそれぞれのレコードが含み、少なくとも1つのコンピュータ入力装置を利用してユーザが第2のレコードを選択することができることを特徴とする、請求項26に記載のユーザインタフェース。
  28. 1つまたは複数の候補レコードに関する前記第1のリストに表示された1つまたは複数の候補レコードの1つを、あるいはもし存在すれば、候補レコードに関する前記第2のリストに表示された1つまたは複数の候補レコードの1つを、前記少なくとも1つのコンピュータ入力装置を介してユーザが選択することに応答して、
    前記選択されたレコードをコントラストの付いた見え方で呈示することと、
    前記選択されたレコードに関係する情報を第2の電子ディスプレイ装置上に表示することと、
    を含むことを特徴とする、請求項26あるいは請求項27に記載のユーザインタフェース。
  29. 前記少なくとも1つのコンピュータ入力装置を介するユーザ入力によって、ユーザがイベントのタイプを選択することができる1つまたは複数のコントロールを含むことを特徴とする、請求項23に記載のユーザインタフェース。
  30. 前記表示された電子ソースドキュメントが重要な用語を特定するためのタグを含み、前記タグ付けされた用語が前記テキスト領域で視覚的に特定可能であり、前記少なくとも1つのコンピュータ入力装置を使用して選択可能であることを特徴とする、請求項23,26あるいは27に記載のユーザインタフェース。
  31. 1つまたは複数の事前に設定された規則に従って、電子ソースドキュメントの中の少なくとも1つの用語にタグ付けするのに適応した、1つまたは複数のソフトウェアプログラムおよび/またはモジュールを含むタギングエンジンと、
    前記少なくとも1つのタグ付けされた用語がコントラス付きで見える状態で、前記ソースドキュメントを呈示することのできる電子ディスプレイ装置と、
    少なくとも1つのコンピュータ入力装置と、
    前記の少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理することと、および前記ユーザ入力に応答して、前記少なくとも1つのタグ付けされた用語と、前記ユーザ入力に基づく少なくとも1つの関係する用語、外部データもしくはその両方とに関連する少なくとも1つのリンクを与えることとに適応した第1のコンピュータソフトウェアモジュールと、
    1つまたは複数のデータベースと、
    前記少なくとも1つのタグ付けされた用語とそのリンクとを、前記1つまたは複数のデータベース中に格納するためにプログラムされたコンピュータソフトウェアと、
    を含むことを特徴とする、データベースを更新するためにテキスト情報を利用するコンピュータ化されたシステム。
  32. 前記電子ソースドキュメントからすべてのメタデータおよび非テキストデータを除去するようにプログラムされたコンピュータソフトウェアを含むことを特徴とする、請求項31に記載のシステム。
  33. 前記タギングエンジンが、マークアップ言語で表現されるマークアップ形式のタグ生成に適応していることを特徴とする、請求項31に記載のシステム。
  34. 前記マークアップ言語がXMLであることを特徴とする、請求項33に記載のシステム。
  35. 1つまたは複数のソフトウェアプログラムおよび/またはモジュールを有し、1つまたは複数のデータベースのテキストを参照して前記電子ソースドキュメントの中にタグ付けする用語があれば、それを特定するテキスト解析エンジンを含み、前記タギングエンジンが前記テキスト解析エンジンを参照するようになっていることを特徴とする、請求項31に記載のシステム。
  36. 前記1つまたは複数のデータベースのテキストの1つまたは複数が固有名詞を含んでいることを特徴とする、請求項35に記載のシステム。
  37. 前記タギングエンジンが、1つまたは複数の事前に設定された規則を用いて用語を含む関係を特定し、そのような特定された1つまたは複数の関係に対して、特定された関係に関するメタデータを前記電子ソースドキュメントと関連させ、
    前記電子ディスプレイ装置が、前記タグ付けされた用語間の関係を示すために追加コントラストで表示を行うことを特徴とする、請求項31に記載のシステム。
  38. 関係を特定するための前記1つまたは複数の事前に設定された規則が、用語の相互の近接性に基づく1つまたは複数の規則を含むことを特徴とする、請求項37に記載のシステム。
  39. 前記タギングエンジンが、テキストの文法構造の特定に適応し、関係を特定する前記規則が、前記電子ソースドキュメントの前記文法構造を参照する1つまたは複数の規則を含むことを特徴とする、請求項37に記載のシステム。
  40. 少なくとも1つのコンピュータ入力装置を介する前記ユーザ入力に応じて、前記自動的に特定された用語間の関係を、受理あるいは却下するためのソフトウェアを備えることを特徴とする、請求項37に記載のシステム。
  41. 1つまたは複数の用語と関連する可能性のあるエントリ候補を1つまたは複数のデータベース中で検索するためのコンピュータソフトウェアと、
    前記ユーザインタフェースが前記電子ディスプレイ装置上に表示されているとき、前記エントリ候補およびこれに関連するタグ付けされた用語の1つまたは複数のリストを、前記ユーザインタフェースに含むことと、
    少なくとも1つのコンピュータ入力装置を介する追加のユーザ入力を受理し、かつ前記少なくともタグ付けされた用語の少なくとも1つを前記関係する候補の1つと関連させるための前記追加のユーザ入力に使用するためのコンピュータソフトウェアと、
    を備えることを特徴とする、請求項31に記載のシステム。
  42. 前記タグ付けされた用語と既に関連づけられている前記1つまたは複数のデータベース中のそれぞれのエントリを更新するために、前記ユーザ入力を介して受理済みの前記少なくとも1つのタグ付けされた用語に関連する少なくとも1つのリンクを利用するためのコンピュータソフトウェアを備えることを特徴とする、請求項41に記載のシステム。
  43. 1つまたは複数の個人あるいは組織が関与する1つまたは複数のイベントを記述するソースドキュメントを電子形式で取得する手段と、
    固有名詞を含む用語が含まれている前記電子ソースドキュメントにおいて、1つまたは複数の事前に設定した用語のリストから用語を特定するためのコンピュータソフトウェアであって、1つまたは複数の前記事前に設定したリストに、少なくとも1つの固有名詞を含む用語が含まれていることを特徴とするコンピュータソフトウェアと、
    前記電子ソースドキュメントの中の特定された用語にタグ付けするためのコンピュータソフトウェアと、
    固有名詞を含むタグ付けされたそれぞれの用語に対して、この固有名詞ないしは類似の名前がついている個人および/または組織を表すレコードを1つまたは複数のデータベースで検索し、かつ1つまたは複数のそのようなレコードを読み出すためのコンピュータソフトウェアと、
    前記電子ソースドキュメントの中の前記用語が関与する関係を特定するための1つまたは複数の規則を適用して、前記電子ソースドキュメントに記載された1つまたは複数のイベントを特定するためのコンピュータソフトウェアと、
    前記電子ソースドキュメントの中で特定された1つまたは複数のイベントのそれぞれに対し、
    前記電子ソースドキュメントを、少なくとも1つの前記タグ付けされた用語および前記イベントにコントラストを付けた状態で、電子ディスプレイ装置上に呈示し、
    前記コントラストをつけたイベントの特定を受理あるいは却下するための、少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理し、
    前記コントラストをつけたイベントが受理される場合には、前記関連用語を含めて前記イベントを記録するための仮のデータベーストランザクションを生成するためのコンピュータソフトウェアと、
    前記仮のデータベーストランザクションを1つまたは複数のデータベースに対しコミットするように命令する、前記少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理するためのコンピュータソフトウェアと、
    前記ユーザ入力に応答して、前記1つまたは複数のイベントが前記ユーザによって受理されたことを反映するように、1つまたは複数のデータベースに含まれるレコードを変更するためのコンピュータソフトウェアモジュールと、
    前記電子ソースドキュメントを、後からの検索の可能性に備えてメモリ装置の中に格納するためのコンピュータソフトウェアと、
    を備える、データベース中の個人および/または組織に関する情報を維持するためのシステム。
  44. 用語および/またはイベントを手動で特定し、用語および/またはイベントの手動および/または自動での特定を修正し、および/または、用語および/またはイベントの手動および/または自動での特定を削除するための、少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理するためのコンピュータソフトウェアを備えることを特徴とする、請求項43に記載のシステム。
  45. 前記電子ソースドキュメントから、すべてのマークアップ、メタデータおよび非テキストコンテンツを除去するためのコンピュータソフトウェアを備えることを特徴とする、請求項43に記載のシステム。
  46. 前記電子ソースドキュメントにおいて特定された前記1つまたは複数のイベントのそれぞれに対し、
    特定された関係のいかなる用語をも含む1つまたは複数の固有名詞と、1つまたは複数の前記呈示された固有名詞に対する一致もしくは類似のデータベースレコードのリストと、を前記電子ディスプレイ装置上に、前記電子ソースドキュメントと共に呈示し、
    少なくとも1つのコンピュータ入力装置を介したユーザ入力に応答して、前記呈示された固有名詞のそれぞれと、前記リストされた一致もしくは類似のデータベースレコードとを関連させるためのコンピュータソフトウェアと、
    前記少なくとも1つのコンピュータ入力装置を介した追加のユーザ入力に応答して、前記関連するイベントを反映させるために、呈示されたリストの用語と関連する少なくとも1つの固有名詞に関わる少なくとも1つのデータベースレコードを更新するためのコンピュータソフトウェアと、
    を備えることを特徴とする、請求項43に記載のシステム。
  47. 前記少なくとも1つのコンピュータ入力装置を介した前記ユーザ入力に応答して、前記リストされた一致もしくは類似のデータベースレコードの1つを選択するためのコンピュータソフトウェアと、
    前記データベースレコードが選択されたことを示すために、前記電子ディスプレイ装置上の前記表示を変更するためのコンピュータソフトウェアと、
    前記データベースレコードに含まれる情報を第2の電子ディスプレイ装置上に表示するためのコンピュータソフトウェアと、
    を備えることを特徴とする、請求項46に記載のシステム。
  48. コンピュータ可読命令でエンコードされたコンピュータ可読媒体を含み、
    プロセッサで実行される場合、
    1つまたは複数の事前に設定された規則に従って、電子ソースドキュメントの中の少なくとも1つの用語をタグ付けするステップと、
    前記少なくとも1つのタグ付けされた用語にコントラストをつけた状態で、前記ソースドキュメントを電子ディスプレイ上に呈示するステップと、
    少なくとも1つのコンピュータ入力装置を介したユーザ入力に応答して、前記少なくとも1つのタグ付けされた用語と、少なくとも1つの関係する用語あるいは外部データあるいはその両方と、を関連づける少なくとも1つのリンクを提供するステップと、
    前記少なくとも1つのタグ付けされた用語およびそのリンクを1つまたは複数のデータベースに格納するステップと、
    を含む方法をコンピュータシステムに実行させることを特徴とするコンピュータプログラム製品。
  49. 前記方法が、前記電子ソースドキュメントからすべてのメタデータおよび非テキストデータを除去するステップを含むことを特徴とする、請求項48に記載のコンピュータプログラム製品。
  50. 前記電子ソースドキュメントの中の前記少なくとも1つの用語をタグ付けするステップが、マークアップ言語を用いてマークアップを生成するステップを含むことを特徴とする、請求項48に記載のコンピュータプログラム製品。
  51. 前記マークアップ言語がXMLであることを特徴とする、請求項50に記載のコンピュータプログラム製品。
  52. 前記タグ付けするステップが、前記電子ソースドキュメントの中で検出された場合にはタグ付けの対象とする、1つまたは複数の用語データベースの使用を含むことを特徴とする、請求項48に記載のコンピュータプログラム製品。
  53. 前記1つまたは複数の用語データベースの1つまたは複数が、固有名詞を含むことを特徴とする、請求項52に記載のコンピュータプログラム製品。
  54. 前記タグ付けするステップが、
    前記ソースドキュメントの中の前記用語を包含する関係の特定に際して1つまたは複数の事前に設定された規則を使用することと、
    そのような1つまたは複数の特定された関係に対して、前記特定された関係に関するメタデータを前記ドキュメントと関連づけることと、
    を含み、
    電子ディスプレイ上への前記ドキュメントの呈示のステップが、前記タグ付けされた用語間の関係を、コントラストをつけて示すことを含む、
    ことを特徴とする、請求項48に記載のコンピュータプログラム製品。
  55. 用語間の関係を特定するための前記1つまたは複数の事前に設定された規則が、前記用語同士の近接性に基づく1つまたは複数の規則を含むことを特徴とする、請求項54に記載のコンピュータプログラム製品。
  56. 前記タグ付けするステップが、テキストの文法構造の特定のための、1つまたは複数のコンピュータソフトウェアプログラムおよび/またはモジュールを使用することを含み、前記少なくとも1つのタグ付けされた用語を包含する関係を特定するための前記1つまたは複数の事前に設定された規則が、前記電子ソースドキュメントの前記文法構造を参照する1つまたは複数の規則を含むことを特徴とする、請求項54に記載のコンピュータプログラム製品。
  57. 前記少なくとも1つのタグ付けされた用語をリンクするための、前記少なくとも1つのコンピュータ入力装置を介する前記ユーザ入力が、前記少なくとも1つのタグ付けされた用語を包含する前記自動的に特定された関係を、受理もしくは却下するステップを含むことを特徴とする、請求項54に記載のコンピュータプログラム製品。
  58. 前記方法が、
    タグ付けされた用語のそれぞれに関連する候補エントリを得るために、1つまたは複数のデータベースを検索するステップと、
    前記電子ディスプレイ装置上に表示される前記ユーザインタフェースの中に、候補エントリおよび関連する前記タグ付けされた用語の1つまたは複数のリストを含めるステップと、
    タグ付けされた用語のそれぞれを前記関連する候補エントリの中の適正なものと関連付けるために、少なくとも1つのコンピュータ入力装置を介する追加のユーザ入力を受理するステップと、
    を含むことを特徴とする、請求項48に記載のコンピュータプログラム製品。
  59. 前記少なくとも1つのタグ付けされた用語と関連付けられた前記1つまたは複数のデータベース中の少なくとも1つのエントリを更新するために、前記ユーザ入力を介して受理済みの前記少なくとも1つのタグ付けされた用語に関連する前記少なくとも1つのリンクを使用するステップを含むことを特徴とする、請求項58に記載のコンピュータプログラム製品。
  60. コンピュータ可読命令でエンコードされたコンピュータ可読媒体を含み、プロセッサで実行される場合、
    1つまたは複数の個人および/または組織が関与する、1つまたは複数のイベントを記述するソースドキュメントを電子形式で取得するステップと、
    少なくとも1つの固有名詞を含む用語を有する、1つまたは複数の事前に設定した用語リストにおける個々の用語に対応して、前記電子ソースドキュメントの中から、固有名詞を含む用語を含めて、用語を特定するステップと、
    前記電子ソースドキュメントの中の特定した用語にタグ付けするステップと、
    固有名詞を含むタグ付けされた用語のそれぞれに対して、その固有名詞あるいは類似ものを持つ個人および/または組織を表すレコードを、1つまたは複数のデータベースの中で検索し、1つまたは複数のそのようなレコードを読み出すステップと、
    前記電子ソースドキュメントの中の用語に関わる関係を特定するための1つまたは複数の規則を適用して、前記電子ソースドキュメントに記述されている1つまたは複数のイベントを特定するステップと、
    前記電子ソースドキュメントの中の特定された1つまたは複数のイベントのそれぞれに対して、
    電子ディスプレイ装置上に、少なくとも1つの用語およびイベントにコントラストをつけた状態で、前記電子ソースドキュメントを呈示するステップと、
    前記コントラストの付いたイベントの特定を受理もしくは却下するために、少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理するステップと、
    前記コントラストの付いたイベントが受理された場合には、前記特定された関係の用語を含む前記イベントを記録するために、暫定データベーストランザクションを生成するステップと、
    前記暫定データベーストランザクションを1つまたは複数のデータベースでコミットするように指示する、少なくとも1つのコンピュータ入力装置を介した追加のユーザ入力を受理するステップと、
    少なくとも1つのコンピュータ入力装置を介した、前記追加のユーザ入力に応答して、前記ユーザに受理された前記1つまたは複数のイベントを反映させるために、1つまたは複数のデータベースに含まれるレコードを変更するステップと、
    後からの検索の可能性に備えて、前記電子ソースドキュメントをメモリデバイスに格納するステップと、
    を含む方法をコンピュータシステムに実行させることを特徴とするコンピュータプログラム製品。
  61. 前記方法が、前記電子ソースドキュメントの用語および/またはイベントを手動で特定し、手動および/または自動で特定された用語および/またはイベントを修正し、そして/あるいは手動および/または自動で特定された用語および/またはイベントを削除するために、前記少なくとも1つのコンピュータ入力装置を介するユーザ入力を受理するステップを含むことを特徴とする、請求項60に記載のコンピュータプログラム製品。
  62. 前記方法が、前記電子ソースドキュメントからすべてのマークアップ、メタデータおよび非テキストコンテンツを除去するステップを含むことを特徴とする、請求項60に記載のコンピュータプログラム製品。
  63. 前記方法が、
    前記電子ソースドキュメントの中で特定された前記1つまたは複数のイベントのそれぞれに対して、
    特定された関係についてのいかなる用語も含む1つまたは複数の固有名詞を、前記電子ソースドキュメントと共に、前記電子ディスプレイ装置上に呈示し、かつ1つまたは複数の前記呈示された固有名詞に対して、一致もしくは類似の固有名詞を含む用語リストを呈示するステップと、
    前記少なくとも1つのコンピュータ入力装置を介するユーザ入力に応答して、少なくとも1つの前記呈示された固有名詞を前記呈示されたリストの中の用語と関連づけるステップと、
    前記少なくとも1つのコンピュータ入力装置を介するユーザの追加入力に応答して、前記関連するイベントを反映させるために、呈示されたリストの用語と関連する少なくとも1つの固有名詞に関連する、少なくとも1つのデータベースのレコードを更新するステップと、
    を含むことを特徴とする、請求項60に記載のコンピュータプログラム製品。
  64. 前記方法が、
    前記少なくとも1つのコンピュータ入力装置を介する前記ユーザ入力に応答して、
    前記リストされた一致もしくは類似のデータベースレコードの1つを選択するステップと、
    前記データベースレコードが選択されたことを示すために、前記電子ディスプレイ装置上の表示を変更するステップと、
    前記データベースレコードに含まれる情報を、第2の電子ディスプレイ装置上に表示するステップと、
    を含むことを特徴とする、請求項63に記載のコンピュータプログラム製品。
JP2008553461A 2006-02-03 2007-01-30 データベースレコードの生成または更新に関するデータの特定/抽出 Pending JP2009526290A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/347,146 US7676455B2 (en) 2006-02-03 2006-02-03 Identifying and/or extracting data in connection with creating or updating a record in a database
PCT/US2007/061259 WO2008014011A2 (en) 2006-02-03 2007-01-30 Identifying and/or extracting data in connection with creating or updating a record in a database

Publications (1)

Publication Number Publication Date
JP2009526290A true JP2009526290A (ja) 2009-07-16

Family

ID=38335204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008553461A Pending JP2009526290A (ja) 2006-02-03 2007-01-30 データベースレコードの生成または更新に関するデータの特定/抽出

Country Status (4)

Country Link
US (2) US7676455B2 (ja)
EP (1) EP1987418A4 (ja)
JP (1) JP2009526290A (ja)
WO (1) WO2008014011A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011516938A (ja) * 2008-02-22 2011-05-26 ソーシャルレップ・エルエルシー 分散型オンライン会話の測定および管理のためのシステムと方式
WO2016151838A1 (ja) * 2015-03-26 2016-09-29 株式会社日立製作所 先行研究調査システムおよび先行研究調査方法

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668838B2 (en) * 2006-03-28 2010-02-23 Yahoo! Inc. Providing event information to third party event applications
US7676449B2 (en) * 2006-03-28 2010-03-09 Yahoo! Inc. Creating and viewing private events in an events repository
US8001157B2 (en) * 2006-06-27 2011-08-16 Palo Alto Research Center Incorporated Method, apparatus, and program product for developing and maintaining a comprehension state of a collection of information
US8010646B2 (en) * 2006-06-27 2011-08-30 Palo Alto Research Center Incorporated Method, apparatus, and program product for efficiently defining relationships in a comprehension state of a collection of information
US8347237B2 (en) * 2006-06-27 2013-01-01 Palo Alto Research Center Incorporated Method, apparatus, and program product for efficiently detecting relationships in a comprehension state of a collection of information
US8290980B2 (en) * 2006-09-08 2012-10-16 Yahoo! Inc. Generating event data display code
US20080065740A1 (en) * 2006-09-08 2008-03-13 Andrew Baio Republishing group event data
US20080218808A1 (en) * 2007-03-07 2008-09-11 Altep, Inc. Method and System For Universal File Types in a Document Review System
US8046295B1 (en) 2007-08-10 2011-10-25 AllRounds, Inc. Private capital management system and method
US10417586B2 (en) * 2007-08-31 2019-09-17 Red Hat, Inc. Attaching ownership to data
US20090063416A1 (en) * 2007-08-31 2009-03-05 Norman Lee Faus Methods and systems for tagging a variety of applications
US8909632B2 (en) * 2007-10-17 2014-12-09 International Business Machines Corporation System and method for maintaining persistent links to information on the Internet
US10096064B2 (en) * 2008-11-06 2018-10-09 Thomson Reuters Global Resources Unlimited Company Method and system for source document data entry and form association
US8949421B2 (en) * 2009-07-29 2015-02-03 Teradata Us, Inc. Techniques for discovering database connectivity leaks
US20130031110A1 (en) * 2011-07-28 2013-01-31 Kikin Inc. Systems and methods for rich query construction
US9547316B2 (en) 2012-09-07 2017-01-17 Opower, Inc. Thermostat classification method and system
US10067516B2 (en) 2013-01-22 2018-09-04 Opower, Inc. Method and system to control thermostat using biofeedback
US9122710B1 (en) 2013-03-12 2015-09-01 Groupon, Inc. Discovery of new business openings using web content analysis
US10719797B2 (en) 2013-05-10 2020-07-21 Opower, Inc. Method of tracking and reporting energy performance for businesses
US10001792B1 (en) 2013-06-12 2018-06-19 Opower, Inc. System and method for determining occupancy schedule for controlling a thermostat
US10579660B2 (en) 2014-03-10 2020-03-03 Aravind Musuluri System and method for augmenting search results
US9727063B1 (en) 2014-04-01 2017-08-08 Opower, Inc. Thermostat set point identification
US10019739B1 (en) 2014-04-25 2018-07-10 Opower, Inc. Energy usage alerts for a climate control device
US10572889B2 (en) 2014-08-07 2020-02-25 Opower, Inc. Advanced notification to enable usage reduction
US10410130B1 (en) 2014-08-07 2019-09-10 Opower, Inc. Inferring residential home characteristics based on energy data
CN105488320A (zh) * 2014-09-19 2016-04-13 北京奇虎科技有限公司 一种补偿数据处理方法和系统、及一种电子设备
US10033184B2 (en) 2014-11-13 2018-07-24 Opower, Inc. Demand response device configured to provide comparative consumption information relating to proximate users or consumers
US10198483B2 (en) 2015-02-02 2019-02-05 Opower, Inc. Classification engine for identifying business hours
US11093950B2 (en) 2015-02-02 2021-08-17 Opower, Inc. Customer activity score
US10074097B2 (en) 2015-02-03 2018-09-11 Opower, Inc. Classification engine for classifying businesses based on power consumption
US10371861B2 (en) 2015-02-13 2019-08-06 Opower, Inc. Notification techniques for reducing energy usage
US10942961B2 (en) * 2015-04-06 2021-03-09 Aravind Musuluri System and method for enhancing user experience in a search environment
US10817789B2 (en) 2015-06-09 2020-10-27 Opower, Inc. Determination of optimal energy storage methods at electric customer service points
WO2017019732A1 (en) * 2015-07-27 2017-02-02 Mastercard International Incorporated Systems and methods for tracking data using user provided data tags
US9958360B2 (en) 2015-08-05 2018-05-01 Opower, Inc. Energy audit device
US10540408B2 (en) * 2015-08-17 2020-01-21 Harshini Musuluri System and method for constructing search results
US10559044B2 (en) 2015-11-20 2020-02-11 Opower, Inc. Identification of peak days
JP6466887B2 (ja) * 2016-09-01 2019-02-06 本田技研工業株式会社 情報端末用プログラム及び情報端末
US11222076B2 (en) * 2017-05-31 2022-01-11 Microsoft Technology Licensing, Llc Data set state visualization comparison lock
US10452734B1 (en) 2018-09-21 2019-10-22 SSB Legal Technologies, LLC Data visualization platform for use in a network environment

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175569A (ja) * 1997-11-03 1999-07-02 Mitsubishi Electric Inf Technol Center America Inc 文書閲覧システム及び文書閲覧方法
US5920867A (en) * 1996-12-06 1999-07-06 International Business Machines Corporation Data management system having data management configuration
JPH11272695A (ja) * 1998-03-20 1999-10-08 Oki Electric Ind Co Ltd 情報抽出装置及びその方法並びに情報記憶媒体
JP2002342342A (ja) * 2001-05-17 2002-11-29 Hitachi Ltd 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体
US20030158855A1 (en) * 2002-02-20 2003-08-21 Farnham Shelly D. Computer system architecture for automatic context associations
JP2005011301A (ja) * 2003-06-20 2005-01-13 Takaaki Yamaoka 文書処理装置及び文書処理プログラム
US20050028087A1 (en) * 2003-02-13 2005-02-03 Iparadigms, Llc Systems and methods for contextual mark-up of formatted documents
US20060156222A1 (en) * 2005-01-07 2006-07-13 Xerox Corporation Method for automatically performing conceptual highlighting in electronic text

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455945A (en) * 1993-05-19 1995-10-03 Vanderdrift; Richard System and method for dynamically displaying entering, and updating data from a database
US6963920B1 (en) * 1993-11-19 2005-11-08 Rose Blush Software Llc Intellectual asset protocol for defining data exchange rules and formats for universal intellectual asset documents, and systems, methods, and computer program products related to same
US5895461A (en) * 1996-07-30 1999-04-20 Telaric, Inc. Method and system for automated data storage and retrieval with uniform addressing scheme
US7013298B1 (en) * 1996-07-30 2006-03-14 Hyperphrase Technologies, Llc Method and system for automated data storage and retrieval
US7146381B1 (en) * 1997-02-10 2006-12-05 Actioneer, Inc. Information organization and collaboration tool for processing notes and action requests in computer systems
US6356899B1 (en) * 1998-08-29 2002-03-12 International Business Machines Corporation Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US8380875B1 (en) * 1998-09-18 2013-02-19 Oracle International Corporation Method and system for addressing a communication document for transmission over a network based on the content thereof
US6651218B1 (en) * 1998-12-22 2003-11-18 Xerox Corporation Dynamic content database for multiple document genres
US6400845B1 (en) * 1999-04-23 2002-06-04 Computer Services, Inc. System and method for data extraction from digital images
US6862713B1 (en) * 1999-08-31 2005-03-01 International Business Machines Corporation Interactive process for recognition and evaluation of a partial search query and display of interactive results
JP4320491B2 (ja) * 1999-11-18 2009-08-26 ソニー株式会社 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体
US6397211B1 (en) * 2000-01-03 2002-05-28 International Business Machines Corporation System and method for identifying useless documents
US6704733B2 (en) * 2000-10-25 2004-03-09 Lightning Source, Inc. Distributing electronic books over a computer network
US7823057B1 (en) * 2001-01-04 2010-10-26 Adobe Systems Incorporated Simplified document creation
US6868283B1 (en) * 2001-01-16 2005-03-15 Palm Source, Inc. Technique allowing a status bar user response on a portable device graphic user interface
US6778979B2 (en) * 2001-08-13 2004-08-17 Xerox Corporation System for automatically generating queries
US20030115188A1 (en) * 2001-12-19 2003-06-19 Narayan Srinivasa Method and apparatus for electronically extracting application specific multidimensional information from a library of searchable documents and for providing the application specific information to a user application
JP4163870B2 (ja) * 2001-12-28 2008-10-08 富士通株式会社 構造化文書変換装置
US7426499B2 (en) * 2004-11-08 2008-09-16 Asset Trust, Inc. Search ranking system
US20040034638A1 (en) * 2002-07-18 2004-02-19 International Business Machines Corporation Method for analyzing and characterizing the usage pattern of a device
US20040243631A1 (en) * 2002-10-25 2004-12-02 Walker Andrew S. System or method for gathering and utilizing information
EP1645961A4 (en) * 2003-07-10 2006-09-27 Fujitsu Ltd METHOD AND DEVICE FOR PROCESSING A STRUCTURED DOCUMENT, AND ASSOCIATED STORAGE MEDIUM
US7590936B1 (en) * 2003-09-30 2009-09-15 Microsoft Corporation Method for extracting information associated with a search term
US8189852B2 (en) * 2004-08-04 2012-05-29 Lars Cornell Method of creating, using and maintaining links in file archives
US20060069679A1 (en) * 2004-09-10 2006-03-30 Percey Michael F System for creating associative records
US20090019064A1 (en) * 2005-02-14 2009-01-15 Justsystems Corporation Document processing device and document processing method
US8838588B2 (en) * 2005-03-30 2014-09-16 International Business Machines Corporation System and method for dynamically tracking user interests based on personal information
US20060285746A1 (en) * 2005-06-17 2006-12-21 Sherif Yacoub Computer assisted document analysis
US20070050187A1 (en) * 2005-08-30 2007-03-01 James Cox Medical billing system and method
US20070143042A1 (en) * 2005-12-16 2007-06-21 Stewart Gordon M Processes and systems for providing analytical device analysis advisory information
WO2007076453A1 (en) * 2005-12-21 2007-07-05 Decernis, Llc Document validation system and method
US8706730B2 (en) * 2005-12-29 2014-04-22 International Business Machines Corporation System and method for extraction of factoids from textual repositories

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5920867A (en) * 1996-12-06 1999-07-06 International Business Machines Corporation Data management system having data management configuration
JPH11175569A (ja) * 1997-11-03 1999-07-02 Mitsubishi Electric Inf Technol Center America Inc 文書閲覧システム及び文書閲覧方法
JPH11272695A (ja) * 1998-03-20 1999-10-08 Oki Electric Ind Co Ltd 情報抽出装置及びその方法並びに情報記憶媒体
JP2002342342A (ja) * 2001-05-17 2002-11-29 Hitachi Ltd 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体
US20030158855A1 (en) * 2002-02-20 2003-08-21 Farnham Shelly D. Computer system architecture for automatic context associations
US20050028087A1 (en) * 2003-02-13 2005-02-03 Iparadigms, Llc Systems and methods for contextual mark-up of formatted documents
JP2005011301A (ja) * 2003-06-20 2005-01-13 Takaaki Yamaoka 文書処理装置及び文書処理プログラム
US20060156222A1 (en) * 2005-01-07 2006-07-13 Xerox Corporation Method for automatically performing conceptual highlighting in electronic text

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011516938A (ja) * 2008-02-22 2011-05-26 ソーシャルレップ・エルエルシー 分散型オンライン会話の測定および管理のためのシステムと方式
WO2016151838A1 (ja) * 2015-03-26 2016-09-29 株式会社日立製作所 先行研究調査システムおよび先行研究調査方法
JPWO2016151838A1 (ja) * 2015-03-26 2017-07-20 株式会社日立製作所 先行研究調査システムおよび先行研究調査方法

Also Published As

Publication number Publication date
WO2008014011A3 (en) 2008-04-24
US11042841B2 (en) 2021-06-22
US20070185835A1 (en) 2007-08-09
WO2008014011A2 (en) 2008-01-31
US7676455B2 (en) 2010-03-09
US20100121880A1 (en) 2010-05-13
EP1987418A2 (en) 2008-11-05
EP1987418A4 (en) 2010-10-06

Similar Documents

Publication Publication Date Title
US7676455B2 (en) Identifying and/or extracting data in connection with creating or updating a record in a database
US7634732B1 (en) Persona menu
US7636886B2 (en) System and method for grouping and organizing pages of an electronic document into pre-defined categories
KR101972179B1 (ko) 자동 태스크 추출 및 캘린더 엔트리
US7788251B2 (en) System, method and computer program product for concept-based searching and analysis
US8660852B2 (en) CRM office document integration
US10114821B2 (en) Method and system to access to electronic business documents
US6957384B2 (en) Document management system
US8548997B1 (en) Discovery information management system
US8745052B2 (en) System and method for adding context to the creation and revision of artifacts
US11934460B2 (en) Linking business objects and documents
US20090281853A1 (en) Legal Instrument Management Platform
US11729114B2 (en) Configurable views of context-relevant content
US6654788B1 (en) Method and apparatus insuring regulatory compliance of an enterprise messaging system
US20070283288A1 (en) Document management system having bookmarking functionality
US20050076013A1 (en) Context-based contact information retrieval systems and methods
US20080082929A1 (en) Document-centric workflow systems, methods, and software based on document contents, metadata, and context
US20060069690A1 (en) Electronic file system graphical user interface
JP5001846B2 (ja) ニュース見出しを管理するためのシステム及び方法
US20090276732A1 (en) System and method for storage, display and review of electronic mail and attachments
US20040261025A1 (en) Method and system of providing secure on-line access to a database of documents
US20070265865A1 (en) Computer based live resume processing system
US7284189B1 (en) Template help pane
JP2008226068A (ja) 企業情報管理のためのコンピュータとそれを実現するためのコンピュータプログラムとその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120808

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130219