JP2010211828A - 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム - Google Patents

電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム Download PDF

Info

Publication number
JP2010211828A
JP2010211828A JP2010124419A JP2010124419A JP2010211828A JP 2010211828 A JP2010211828 A JP 2010211828A JP 2010124419 A JP2010124419 A JP 2010124419A JP 2010124419 A JP2010124419 A JP 2010124419A JP 2010211828 A JP2010211828 A JP 2010211828A
Authority
JP
Japan
Prior art keywords
document
user
documents
toc
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010124419A
Other languages
English (en)
Other versions
JP5033221B2 (ja
JP2010211828A5 (ja
Inventor
Mark Bluhm
ブルーム マーク
Bruce Getting
ゲッティング ブルース
Mark Hayft
ハイフト マーク
Shirley Walz
ワルツ シャーリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Reuters Global Resources ULC
Original Assignee
Thomson Reuters Global Resources ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Reuters Global Resources ULC filed Critical Thomson Reuters Global Resources ULC
Publication of JP2010211828A publication Critical patent/JP2010211828A/ja
Publication of JP2010211828A5 publication Critical patent/JP2010211828A5/ja
Application granted granted Critical
Publication of JP5033221B2 publication Critical patent/JP5033221B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Storage Device Security (AREA)

Abstract

【課題】カスタマイズされたサービスを複数の多種多様なエンドユーザーに提供しつつ、付加価値のある電子文書の大きなコーパスの配布およびマネジメントを提供するシステムおよび方法を提供すること。
【解決手段】1つの実施形態において、本発明は、電子的に格納されたドキュメントの大きな集合体を維持し、そしてそれらドキュメントを、問合せメッセージを出すユーザーにとって利用可能にするためのシステムであって、このシステムは、ドキュメントを電子的形式において格納するための少なくとも1つのデータ集合であって、ここで、各ドキュメントは特有の識別子を有するデータ集合を備える。
【選択図】図1

Description

本発明は、データレポジトリーのアクセスおよび利用のために作製された、大規模の電子的データレポジトリーおよびソフトウェアアプリケーションにおける、データ、特にドキュメントの配布およびマネジメントに関する。
コンピュータおよびウェブ−ベースアプリケーションの使用にともなって、非常に大量の情報が、エンドユーザーにとって、オンラインでアクセス可能となり得る。近年、オンラインデータベースが、コンテンツにおいて特化され、特定のタイプの記録(例えば、商標、または特定分野の技術文献)のみを網羅する。従って、データベースおよびアクセスツールは、特に、そのコンテンツを念頭において、設計された。複数の情報に対するニーズを有するユーザーは、図1に示す環境が、強いられる。各情報は、必須とされる別個のシステムでの作業およびその特定のユーザーインターフェース(特定のデータベース(または関連するデータベースのセット)に対するアクセスを提供し、その情報リソースに特有のアクセスソフトウェアおよび課金ソフトウェアによってサービスを受ける)を必要とする。大量の格納能力および速度の改善によって、データベースが非常に大きなサイズに成長することを可能にし、そして単一のプロバイダによって、複数のデータベースを提供することを可能にする。
しかし、コンピュータ化された情報の集合のサイズの増加、および、検索速度に対するユーザーの期待、および、使用のユーザー−フレンドリーの形式、およびドキュメントデリバリーは、情報プロバイダの変化をもたらす。過去から受け継がれたユーザーインターフェースおよびアクセスシステムは、しばしば、それを使用することに対して非常に慣れた者に対してのみユーザー−フレンドリーであり、特定のコンテンツに対して調整されたほとんどのユーザーインターフェースおよびアクセスシステムは、お互いに異なり、そのことのために、ユーザーが1つのシステムから、他のコンテンツのためのシステムに移動することを困難となる。たとえ、ユーザーがその差異を受け入れることができたとしても、オペレータは、ただ単に、別個の過去から受け継いだシステムを、より大きな格納デバイスを有するより早いプロセッサにロードすることは、効率的でないことを見出している。
さらに、1つの過去から受け継いだシステムを用いて、別のシステムのデータベースにアクセスして、共有することは、通常、不可能出ない場合でも、困難である。たとえ、過去から受け継いだデータベースが、過去から受け継いだシステムの間で共有することができたとしても、他の非効率性の問題が生じ得る。しばしば、同一の情報が、異なるユーザーによって、異なる目的のために、求められる。従って、同一の情報は、複数のリサーチリソースまたはチャンネル(例えば、法律または金融ドキュメントサービスに対するニュースサービス)を通して、異なるタイプのユーザーにとって、利用可能とされ得る。同一の情報を、複数のリソースを通して利用可能とするために、データは、しばしば、重複し、そして異なるデータベースに格納される。さらに、異なるユーザーの問合せアプリケーション(ユーザーインターフェースと関連するものを含む)は、各別個のデータベースにアクセスするために使用され得る。このような構造は、典型的に非効率的である。なぜなら、これは、重複した、開発およびサポートのための努力、ならびに重複した情報の格納を必要とするからである。さらに、このことは、変化した顧客の関係または市場の状況に応答して、既存のシステムを変化することを、困難にする。
情報プロバイダにとって、2つの基本的な目的は、ユーザーに売却するために利用可能な情報を最大化し、そして情報の売却におけるフレキシビリティーを最大化するということである。これらの目的は、情報プロバイダが、情報プロバイダが、多くの異なる種類のユーザーに対してアピールすることができ、異なるレベルのアクセスおよびデリバリーのモードを提供することができ、そしてコンテンツおよび形式について調整された情報をデリバリーすることができることを意味する。これらの目的を追求することは、情報プロバイダが、異なるユーザーに異なる商品および価格決定を適合させ、そして新規のコンテンツおよび顧客を追加することにおいて、より大きなフレキシビリティを提供する。
これらの目的に取り組むために、複数のユーザーが、異なるアプリケーション(ウェブ−ベースまたはそれ以外)から、同一の情報にアクセスすることを可能にする、集中化された情報データベースおよび情報マネジメントシステムが必要である。さらに、電子的に格納されたドキュメントの大きな集合体にアクセスするための、そのようなアプリケーションを構築するために、効率的なアーキテクチャ/インフラストラクチャモデルがさらに必要である。
(発明の簡単な要旨)
1つの実施形態において、本発明は、電子的に格納されたドキュメントの大きな集合体を維持し、そしてそれらドキュメントを、問合せメッセージを出すユーザーにとって利用可能にするためのシステムである。
別の実施形態において、本発明は、電子的に格納されたドキュメントの大きな集合体を維持し、そしてそれらドキュメントを、問合せメッセージを出すユーザーにとって利用可能にするためのシステムであって、このシステムは、ドキュメントを電子的形式において格納するための少なくとも1つのデータ集合であって、ここで、各ドキュメントは特有の識別子を有するデータ集合を備える。このシステムはさらに、少なくとも1つのデータ集合に対して追加される新規のドキュメントを受け取るための、取入れ口コンポーネント、および、受け取ったドキュメントを処理して、ドキュメントを富化するための、エンリッチメントコンポーネントを、備える。このシステムはさらに、データ集合からの情報を探す、少なくとも1つのユーザーの問合せメッセージを受け取るための、ユーザーインターフェースコンポーネント、少なくとも1つのユーザー問合せメッセージを処理して、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索する、サーチコンポーネント、ならびに、ユーザーのドキュメント要求に対して応答する、要求されたドキュメントのデリバリーのためのデリバリーコンポーネントを、備える。
別の実施形態において、本発明は、問合せメッセージを処理するシステムであって、このシステムは、問合せメッセージを入力するための、1つ以上のユーザーインターフェースであって、ここで、この1つ以上のユーザーインターフェースの各々は、リソースアプリケーションに適合する、ユーザーインターフェース、問合せメッセージに対する応答において、ユーザーに対するデリバリーのために、ドキュメントを格納するための1つ以上のデータ集合、および、その1つ以上のデータ集合中に格納されたドキュメントについてのサーチを容易にするためのメタデータを保持するための、1つ以上のメタデータ情報ファイルを備える。このシステムは、さらに、1つ以上のデータ集合に追加されるべきドキュメントを処理するための、新規ドキュメント取入れ口コンポーネントであって、ここで、この取入れ口コンポーネントは、新規ドキュメントからメタデータを作成し、そして、1つ以上のデータ集合において、実質的に該新規ドキュメントを格納するのと同時に、該メタデータの少なくとも一部を該メタデータファイル中に格納する、メタデータエクストラクタを有する、取入れ口コンポーネント、を備える 別の実施形態において、本発明は、問合せメッセージを出すユーザーに対して、問合せ結果、および電子的に格納されたドキュメントの大きな集合体から選択されたドキュメントをデリバリーするための方法である。この方法は、ユーザーから、データ集合中に電子的形式において格納されたドキュメントを探す電子的形式における問合せメッセージを引き出すために、少なくとも1つのユーザーインターフェースに対するアクセスを提供する工程であって、ここで、各ドキュメントは、特有の識別子を有する、工程、および、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索するための問合せメッセージを処理するために、サーチコンポーネントに対してデリバリーされる問合せメッセージに備える工程、を包含する。この方法は、さらに、問合せメッセージに対する応答において、ユーザーに対して、1つ以上のドキュメントを同定するサーチ結果メッセージを提供する工程、および、サーチ結果メッセージからドキュメントを選択するユーザーのメッセージに応答して、ユーザーに関連するユーザープロファイルに基づいて、予め決められた形式において、該選択されたドキュメントを、デリバリーする工程であって、リソースアプリケーションにおいて具体化され得る、工程、を包含する。この発明はまた、選択されたドキュメントを、時点のアトリビュートと関連付けて、選択されたドキュメントのアップデートされたバージョンの選択を許容する、工程、を包含する。
別の実施形態において、本発明は、問合せメッセージを出したユーザーに対する、問合せ結果、および電子的に格納されたドキュメントの大きな集合体から選択されたドキュメントのデリバリーを容易にするための、伝達媒体において具体化されたコンピュータデータシグナルであって、データ集合中に電子的形式において格納されたドキュメントを探す、電子的形式の問合せメッセージを、ユーザーから引き出すための、少なくとも1つのユーザーインターフェースを提示するためのコードコンポーネントであって、ここで、各ドキュメントは、特有の識別子を有する、コンポーネントを備える、伝達媒体において具体化されたコンピュータデータシグナル。この媒体はまた、問合せメッセージを処理して、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索するために、サーチコンポーネントに対してデリバリーされる、問合せメッセージに備えるコードコンポーネント、および、1つ以上のドキュメントを同定するサーチ結果メッセージを、問合せメッセージに応答してユーザーに提供するためのコードコンポーネントを備える。この媒体はまた、ユーザーと関連するユーザープロファイルに基づいて、予め決定された形式において、ユーザーに対して選択されたドキュメントをデリバリーし、そして選択されたドキュメントを、時点のアトリビュートと関連付けて、選択されたドキュメントのアップデートされたバージョンの選択を許容するために、サーチ結果メッセージからドキュメントを選択するユーザーのメッセージに応答するコードコンポーネント、を備える、コンピュータデータシグナル。
複数の実施形態が開示されるが、本発明のなお別の実施形態が、以下の詳細な説明に従って、当業者に明らかとなる。明かであるように、本発明は、全て本発明の趣旨および範囲から逸脱することなく、種々の明白な局面において、修飾され得る。従って、図面および詳細な説明は、発明の性質を例示するもと看做されるが、限定するものではない。
例えば、本発明は以下を提供する。
(項目1)
電子的に格納されたドキュメントの大きな集合体を維持し、そして問合せメッセージを出すユーザーに該ドキュメントを利用可能とするためのシステムであって、該システムは、以下:
a.ドキュメントを電子的形式において格納するための少なくとも1つのデータ集合であって、ここで、各ドキュメントは特有の識別子を有する、集合;
b.該少なくとも1つのデータ集合に対して追加される新規のドキュメントを受け取るための、取入れ口コンポーネント;
c.受け取ったドキュメントを処理して、該ドキュメントを富化するための、該取入れコンポーネントと関連したエンリッチメントコンポーネント;
d.データ集合からの情報を探す、少なくとも1つのユーザーの問合せメッセージを受け取るための、ユーザーインターフェースコンポーネント;
e.少なくとも1つのユーザー問合せメッセージを処理して、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索する、サーチコンポーネント;ならびに、
f.ユーザーのドキュメント要求に対して応答する、要求されたドキュメントのデリバリーのためのデリバリーコンポーネント、
を備える、システム。
(項目2)
項目1に記載のシステムであって、ここで、該システムはさらに、サーチコンポーネントが少なくとも1つのユーザー問合せメッセージを再処理しないその後のアクセスのための、検索された識別子を格納するための持続性のサービスを備える、システム。
(項目3)
項目1に記載のシステムであって、ここで、該システムはさらに、複数のノードを有するコンテンツの少なくとも1つのテーブルを維持するためのコンテンツサービスのテーブルを備え、ここで該ノードの1つ以上が該1つ以上のノードと関連する1つ以上のドキュメントと同定する、システム。
(項目4)
項目3に記載のシステムであって、ここで、コンテンツサービスのテーブルが、コンテンツの2つ以上のテーブルをサポートし、ここで、コンテンツの各テーブルが特定のユーザーのタイプに適合する、システム。
(項目5)
項目3に記載のシステムであって、ここで、コンテンツの少なくとも1つのテーブルが、2つ以上のデータ集合を参照する、システム。
(項目6)
項目4に記載のシステムであって、ここで、コンテンツの2つ以上のテーブルの1つが、コンテンツの別の2つ以上のテーブルのノードを参照して、再帰的構造を規定する、システム。
(項目7)
項目1に記載のシステムであって、ここで、少なくとも1つのデータ集合中のドキュメントが、少なくとも1つの集合サブセットに分割され、そして該システムは、該インデックス中のキーワードと該集合サブセット中の該キーワードの出現の位置との間の関連を有する、集合サブセット中に少なくとも1回出現するキーワードのインデックスを維持するインデックスサービスを有する、システム。
(項目8)
項目1に記載のシステムであって、ここで、少なくとも1つのデータ集合中のドキュメントが、少なくとも1つの集合サブセットに分割され、そしてここで、新規のドキュメントを受け取る取入れ口コンポーネントは、各追加のドキュメントが特有の識別子を有しそして少なくとも1つの集合サブセットに割り当てられることを、確実にする、システム。
(項目9)
項目1に記載のシステムであって、ここで、少なくとも1つのデータ集合が、1つ以上の集合サブセット中のドキュメントの集合体である少なくとも1つのドキュメントのセットを有する、システム。
(項目10)
項目1に記載のシステムであって、ここで、該システムは、ユーザー識別情報および問合せメッセージを受け取り、そして、ユーザーの申し込み情報に対する該識別情報および問合せメッセージを確認する、セキュリティサービスコンポーネントをさらに備える、システム。
(項目11)
項目1に記載のシステムであって、ここで、エンリッチメントコンポーネントは、ドキュメントが以下:
a.ヒト作因によって準備される、さらなる編集材料;
b.自動化作因によって準備される、さらなる編集材料;
c.前記データ集合中の別のドキュメントに対するポインタを提供するリンク;
d.法律ドキュメントまたは文献目録ドキュメントに対するメタデータに基づく、引用;または、
e.メタデータファイル中に出現するドキュメントと関連するエントリ、の少なくとも1つと関連を生じるように、該ドキュメントを処理する、システム。
(項目12)
項目1に記載のシステムであって、ここで、新規ドキュメントを受け取るための前記取入れ口コンポーネントが、前記受け取られたドキュメントに優先順位をつけ、そして、通常の順序からはずれて、時間を感知できるインディケータを持つ受領ドキュメントの時間に基づき、処理する、システム。
(項目13)
項目1に記載のシステムであって、ここで、新規のドキュメントを受け取るための前記取入れ口コンポーネントが、割り当てられたドキュメントの識別子の特有さを確認し、その後に、そのようなドキュメント識別子を有する新規のドキュメントを、少なくとも1つのデータ集合において利用可能にする、システム。
(項目14)
項目1に記載のシステムであって、ここで、新規のドキュメントを受け取るための前記取入れ口コンポーネントが、予め決められた取入れ口形式について新規のドキュメントを確認し、その後に、そのような新規のドキュメントを、少なくとも1つのデータ集合において利用可能にする、システム。
(項目15)
項目1に記載のシステムであって、ここで、前記ドキュメントの集合体が、少なくとも20テラバイト情報を含む、システム。
(項目16)
ドキュメントを探す問合せメッセージを処理するシステムであって、該システムは、以下:
a.問合せメッセージを受け取るための、1つ以上のユーザーインターフェースであって、ここで、該1つ以上のユーザーインターフェースの各々は、システム上で実行するリソースアプリケーションに適合する、ユーザーインターフェース;
b.問合せメッセージに対する応答において、ユーザーに対するデリバリーのために、ドキュメントを格納するための1つ以上のデータ集合;
c.該1つ以上のデータ集合中に格納されたドキュメントについてのサーチを容易にするためのメタデータを保持するための、1つ以上のメタデータ情報ファイル;ならびに
d.該1つ以上のデータ集合に追加されるべきドキュメントを処理するための、新規ドキュメント取入れ口コンポーネントであって、ここで、該インターフェースは、新規ドキュメントからメタデータを作成し、そして、該1つ以上のデータ集合においてユーザーアクセスの用意ができているように、実質的に該新規ドキュメントを格納するのと同時に、該メタデータの少なくとも一部を該メタデータ情報ファイル中に格納する、メタデータエクストラクタを有する、取入れ口コンポーネント、を備える、システム。
(項目17)
項目16に記載のシステムであって、ここで、前記システムは、複数のノードを有するコンテンツの少なくとも1つのテーブルを維持するためのコンテンツサービスのテーブルを備え、ここで、該ノードの1つ以上が、該1つ以上のノードと関連する1つ以上のドキュメントを同定する、システム。
(項目18)
項目17に記載のシステムであって、ここで、前記コンテンツサービスのテーブルが、コンテンツの2つ以上のテーブルをサポートし、ここで、コンテンツのテーブルの各々が、特定のユーザーのタイプに適合する、システム。
(項目19)
項目17に記載のシステムであって、ここで、前記コンテンツの少なくとも1つのテーブルが、2つ以上のデータ集合中にあるドキュメントを参照する、システム。
(項目20)
項目18に記載のシステムであって、ここで、コンテンツの2つ以上のテーブルの1つが、コンテンツの別の2つ以上のテーブルのノードを参照して、再帰的構造を規定する、システム。
(項目21)
項目16に記載のシステムであって、ここで、少なくとも1つのデータ集合中のドキュメントが、少なくとも1つの集合サブセットに分割され、そして該システムは、該インデックス中のキーワードと該集合サブセット中の該キーワードの出現の位置との間の関連を有する、集合サブセット中に少なくとも1回出現するキーワードのインデックスを維持するインデックスサービスを有する、システム。
(項目22)
項目16に記載のシステムであって、ここで、少なくとも1つのデータ集合中のドキュメントが、少なくとも1つの集合サブセットに分割され、そしてここで、新規のドキュメントを受け取る手段は、各追加のドキュメントが特有の識別子を有しそして少なくとも1つの集合サブセットに割り当てられることを、確実にする、システム。
(項目23)
項目16に記載のシステムであって、ここで、少なくとも1つのデータ集合が、1つ以上の集合サブセット中のドキュメントの集合体である少なくとも1つのドキュメントのセットを有する、システム。
(項目24)
項目16に記載のシステムであって、ここで、該システムは、ユーザー識別情報および問合せメッセージを受け取り、そして、ユーザーの申し込み情報に対する該識別情報および問合せメッセージを確認する、セキュリティサービスコンポーネントをさらに備える、システム。
(項目25)
項目16に記載のシステムであって、ここで、メタデータエクストラクタは、ドキュメントが以下:
a.ヒト作因によって準備される、さらなる編集材料;
b.自動化作因によって準備される、さらなる編集材料;
c.前記データ集合中の別のドキュメントに対するポインタを提供するリンク;
d.法律ドキュメントまたは文献目録ドキュメントに対するメタデータに基づく、引用;または、
e.メタデータファイル中に出現するドキュメントと関連するエントリ、の少なくとも1つと関連を生じるように、該ドキュメントを処理する、システム。
(項目26)
項目16に記載のシステムであって、ここで、前記取入れ口コンポーネントが、前記ドキュメントに優先順位をつけ、そして、通常の順序からはずれて、時間を感知できるインディケータを持つ受領ドキュメントの時間に基づき、処理する、システム。
(項目27)
項目16に記載のシステムであって、ここで、前記取入れ口コンポーネントが、割り当てられたドキュメントの識別子の特有さを確認し、その後に、そのようなドキュメント識別子を有する新規のドキュメントを、少なくとも1つのデータ集合において利用可能にする、システム。
(項目28)
項目16に記載のシステムであって、ここで、前記取入れ口コンポーネントが、予め決められた取入れ口形式について新規のドキュメントを確認し、その後に、そのような新規のドキュメントを、任意のデータ集合において利用可能にする、システム。
(項目29)
項目16に記載のシステムであって、ここで、前記1つ以上のデータ集合が、少なくとも20テラバイト情報を含む、システム。
(項目30)
問合せメッセージを出すユーザーに対して、問合せ結果、および電子的に格納されたドキュメントの大きな集合体から選択されたドキュメントをデリバリーするための方法であって、該方法は、以下:
a.ユーザーから、データ集合中に電子的形式において格納されたドキュメントを探す電子的形式における問合せメッセージを引き出すために、コンピュータシステム上で実行するリソースアプリケーションに関連する、少なくとも1つのユーザーインターフェースに対するアクセスを提供する工程であって、ここで、各ドキュメントは、特有の識別子を有する、工程;
b.応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索するための問合せメッセージを処理するために、複数のリソースアプリケーションによって共有されるサーチコンポーネントに対してデリバリーされる問合せメッセージに備える工程;
c.該問合せメッセージに対する応答において、該ユーザーに対して、1つ以上のドキュメントを同定するサーチ結果メッセージを提供する工程;
d.該サーチ結果メッセージからドキュメントを選択するユーザーのメッセージに応答して、少なくとも1つのユーザーインターフェースに関連する少なくとも1つのリソースアプリケーションに基づいて、予め決められた形式において、該選択されたドキュメントを、デリバリーする工程;ならびに、
e.該選択されたドキュメントを、時点のアトリビュートと関連付けて、選択されたドキュメントのアップデートされたバージョンの選択を許容する、工程、
を包含する、方法。
(項目31)
問合せメッセージを出したユーザーに対する、問合せ結果、および電子的に格納されたドキュメントの大きな集合体から選択されたドキュメントのデリバリーを容易にするための、伝達媒体において具体化されたコンピュータデータシグナルであって、以下:
データ集合中に電子的形式において格納されたドキュメントを探す、電子的形式の問合せメッセージを、ユーザーから引き出すための、コンピュータシステム上で実行するリソースアプリケーションに関連した少なくとも1つのユーザーインターフェースを提示するためのコードコンポーネントであって、ここで、各ドキュメントは、特有の識別子を有する、コンポーネント;
該問合せメッセージを処理して、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索するために、複数のリソースアプリケーションによって共有されるサーチコンポーネントに対してデリバリーされる、該問合せメッセージに備えるコードコンポーネント;
1つ以上のドキュメントを同定する、サーチ結果メッセージを提供するためのコードコンポーネント;ならびに
少なくとも1つのユーザーインターフェースと関連する少なくとも1つのリソースアプリケーションに基づいて、予め決定された形式において、ユーザーに対して選択されたドキュメントをデリバリーし、そして該選択されたドキュメントを、時点のアトリビュートと関連付けて、選択されたドキュメントのアップデートされたバージョンの選択を許容するために、ドキュメント選択データに応答するコードコンポーネント、を備える、コンピュータデータシグナル。
(項目32)
電子的に格納されたドキュメントの大きな集合体を維持し、そしてそのドキュメントを、問合せメッセージを出すユーザーに対して利用可能にするためのシステムであって、該システムは、以下:
a.ドキュメントを、電子的形式において格納するための少なくとも1つのデータ集合であって、ここで、各ドキュメントは、特有の識別子を有する、データ集合;
b.該少なくとも1つのデータ集合に対して追加されるべき新規のドキュメントを受け取り、そして新規のドキュメントを、ドキュメントの上位n個の特有の逆ドキュメント頻度(idf)タームおよびドキュメント長さスカラを含む重複比較シグネチャと関連付けるための取入れ口コンポーネント;
c.該データ集合から情報を探す、少なくとも1つのユーザー問合せメッセージを受け取るためのユーザーインターフェース;
d.少なくとも1つのユーザー問合せメッセージを処理して、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索する、サーチコンポーネント
e.該応答するドキュメントの重複比較シグネチャの中で比較を行って、そして比較シグネチャが正確に同一であるか、または予め決定された類似性の閾値内である場合に、重複を同定するための、重複検出コンポーネント;ならびに
f.ユーザーのドキュメント要求に対して応答する、要求されたドキュメントを提示するためのデリバリーコンポーネント、
を備える、システム。
(項目33)
項目32に記載のシステムであって、ここで、重複比較シグネチャは、上位n個の特有のidfタームおよび前記ドキュメント中でのその相対的位置、およびドキュメント長スカラを含み、そしてnが4から30である、システム。
(項目34)
項目32に記載のシステムであって、ここで、重複比較シグネチャは、トークンに基づく、上位n個の特有のidfタームおよび前記ドキュメント中でのその相対的位置、およびドキュメント長スカラを含み、ここで、長さスカラに関して予め決定された類似性閾値が0から256の範囲である、システム。
(項目35)
項目32に記載のシステムであって、ここで、該システムは、クライアント−サーバー−アーキテクチャを利用し、そして、重複検出コンポーネントは、サーバー側にあり、そして、クライアント側に対して、重複の同定を伝達する、システム。
(項目36)
項目32に記載のシステムであって、ここで、該システムは、クライアント−サーバー−アーキテクチャを利用し、そして、クライアント側に対する重複の同定を用いて、ユーザーに伝達されたサーチ結果リストから該重複ドキュメントを取り除く、システム。
(項目37)
項目36に記載のシステムであって、ここで、前記クライアント側において、ユーザーに伝達されたサーチ結果リストが、重複が見つけられたドキュメントの表示を含む、システム。
(項目38)
項目36に記載のシステムであって、ここで、前記クライアント側において、ユーザーに伝達されたサーチ結果リストが、重複が見つけられたドキュメントの表示を含み、そして重複ドキュメントのセットが、ユーザーにとってアクセス可能にされる、システム。
(項目39)
ユーザー問合せメッセージによって探される情報を小売するためのシステムであって、以下:
a.問合せメッセージを受け取るための1つ以上のユーザーインターフェースであって、該1つ以上のユーザーインターフェースは、システム上で実行するリソースアプリケーションに適合される、ユーザーインターフェース;
b.問合せメッセージに応答してユーザーにデリバリーするための、リソースアプリケーションのための目的のドキュメントを格納するための1つ以上のデータ集合;
c.1つ以上のデータ集合中に格納されたドキュメントについて、問合せメッセージによって開始するサーチを容易にするために、メタデータを保持するための1つ以上のメタデータ情報ファイル;
d.1つ以上のデータ集合に追加されるべきドキュメントを処理するための、新規ドキュメント取入れ口コンポーネントであって、該インターフェースは、新規ドキュメントからメタデータを作成し、そして、該1つ以上のデータ集合においてユーザーアクセスの用意ができているように、実質的に該新規ドキュメントを格納するのと同時に、該メタデータの少なくとも一部を該メタデータ情報ファイル中に格納する、メタデータエクストラクタを有する、取入れ口コンポーネント;ならびに e.問合せメッセージに応答した1つ以上のデータ集合に対するアクセスを制御し、そして、1つ以上のデータ集合に対するアクセスについてユーザーに課金するための情報を作成するための、2つ以上のリソースアプリケーションによって共有されるセキュリティサービスおよび課金サービス、
を備える、システム。
(項目40)
項目39に記載のシステムであって、ここで、前記1つ以上のデータ集合は、以下のタイプの情報:法律、税金、会計、医療、科学、知的財産、教育課程の教材またはニュース、の1つ以上を含む、システム。
(項目41)
項目40に記載のシステムであって、ここで、該システムは、さらに、各々のタイプの情報について、複数のノードを有する少なくとも1つのコンテンツのテーブルを維持するためのコンテンツサービスのテーブルを含み、ここで、該ノードの1つ以上は、該1つ以上のノードに関連する1つ以上のドキュメントを同定し、そして、少なくとも1つのドキュメントは、1つよりも多いコンテンツのテーブルにおいて同定される、システム。
(項目42)
ドキュメントを探す問合せメッセージを処理するためのシステムであって、以下: a.問合せメッセージを受け取るための1つ以上のユーザーインターフェースであって、該1つ以上のユーザーインターフェースの各々は、システム上で実行するリソースアプリケーションに適合する、ユーザーインターフェース;
b.問合せメッセージに応答して、ユーザーに対してデリバリーするための、ドキュメントを格納するための、1つ以上のデータ集合;
c.該1つ以上のデータ集合中に格納されたドキュメントについてのサーチを容易にするための、メタデータを保持するための、1つ以上のメタデータ情報ファイル;ならびに、
d.該1つ以上のデータ集合に追加されるべきドキュメントを処理するための新規ドキュメント取入れ口コンポーネントであって、ここで、該インターフェースは、新規ドキュメントからリソース記述フレームワーク(RDF)ステートメントの形式のメタデータを作成し、そして、該1つ以上のデータ集合においてユーザーアクセスの用意ができているように、実質的に該新規ドキュメントを格納するのと同時に、該メタデータの少なくとも一部を該メタデータ情報ファイル中に格納する、メタデータエクストラクタを有する、新規ドキュメント取入れ口コンポーネント、
を備える、システム。
(項目43)
項目42に記載のシステムであって、さらに、該システムは、各タイプの情報についての複数のノードを有するコンテンツの少なくとも1つのテーブルを維持するための、コンテンツサービスのテーブルを備え、そして前記メタデータエクストラクタの少なくとも1つは、RDFステートメントための語彙として、コンテンツの少なくとも1つのテーブルのノードのラベルを用いる、システム。
(項目44)
電子的に格納されたドキュメントの大きな集合体を維持し、そして問合せメッセージを出すユーザーに該ドキュメントを利用可能とするためのシステムであって、該システムは、以下:
a.ドキュメントを電子的形式において格納するための少なくとも1つのデータ集合であって、ここで、各ドキュメントは特有の識別子を有する、集合;
b.該少なくとも1つのデータ集合に対して追加される新規のドキュメントを受け取るための、取入れ口コンポーネント;
c.受け取ったドキュメント内において、少なくとも1つのPITフィールドの位置決めをするか、または配置するための、該取入れ口コンポーネントと関連したタイムスタンプコンポーネント;
d.データ集合からの情報を探す、少なくとも1つのユーザーの問合せメッセージを受け取るための、ユーザーインターフェースコンポーネント;
e.少なくとも1つのユーザー問合せメッセージを処理して、応答するデータ集合中のドキュメントを同定し、そして、応答するドキュメントについての識別子を検索する、サーチコンポーネントであって、ここで、該処理および検索は、少なくとも1つのPITフィールドに応答して、問合せメッセージのPIT制限に対して応答するドキュメントのバージョンをデリバリーする、サーチコンポーネント;ならびに
f.ユーザーのドキュメント要求に対して応答する、要求されたドキュメントのデリバリーのためのデリバリーコンポーネント。
(項目45)
項目44に記載のシステムであって、ここで、前記少なくとも1つのPITフィールドは、時間と日付の情報を含む、システム。
(項目46)
項目44に記載のシステムであって、ここで、前記少なくとも1つのPITフィールドは、バージョンの情報を含む、システム。
(項目47)
項目44に記載のシステムであって、ここで、前記少なくとも1つのPITフィールドは、法律の異なるバージョンを識別する、システム。
(項目48)
ドキュメントを探す問合せメッセージを処理するシステムであって、該システムは、以下:
a.問合せメッセージを受け取るための、1つ以上のユーザーインターフェースであって、ここで、該1つ以上のユーザーインターフェースの各々は、システム上で実行するリソースアプリケーションに適合する、ユーザーインターフェース;
b.問合せメッセージに対する応答において、ユーザーに対するデリバリーのために、ドキュメントを格納するための1つ以上のデータ集合;
c.特定のリソースアプリケーション内の、ユーザーのサーチ処理についての情報、および、問合せメッセージに応答して見出されたドキュメントについての識別子についての情報を保持するための、1つ以上の試行ファイル;ならびに、
d.試行ファイルを処理して、特定のリソースアプリケーションについての共通の使用パターンを決定し、そして、そのような使用パターンとより一致する様式において、現在のサーチオプションおよびサーチ結果に対して、リソースアプリケーションのパラメータを、調節する、試行分析コンポーネント、
を備える、システム。
(項目49)
項目48に記載のシステムであって、ここで、共通の使用パターンは、ドキュメントがサーチ結果として表示される優先順位と比較して、ユーザーがサーチ結果において同定されたドキュメントをディスプレイする順序を含み、そして、調節されたパラメータは、ドキュメントがサーチ結果として表される優先順位に影響する、システム。
(項目50)
項目48に記載のシステムであって、ここで、共通の使用パターンは、サーチ結果において重複であるとして同定されたドキュメントのユーザーの再調査を含み、そして、調節されたパラメータは、重複する検出サービスについての、類似性閾値に影響する、システム。
(項目51)
ドキュメントを探す問合せメッセージを処理するシステムであって、該システムは、以下:
a.問合せメッセージを受け取るための、1つ以上のユーザーインターフェースであって、ここで、該1つ以上のユーザーインターフェースの各々は、システム上で実行するリソースアプリケーションに適合する、ユーザーインターフェース;
b.問合せメッセージに対する応答において、ユーザーに対するデリバリーのために、ドキュメントを格納するための1つ以上のデータ集合;
c.特定のリソースアプリケーション内の、ユーザーのサーチ処理についての情報、および、問合せメッセージに応答して見出されたドキュメントについての識別子についての情報を保持するための、1つ以上の試行ファイル;ならびに、 d.試行ファイルを処理して、共通の使用パターンを決定し、そして、そのような使用パターンに対するリソースアプリケーションに対して、アクセス可能であるメタデータファイルを構築する、試行分析コンポーネント、
を備える、システム。
図1は、従来技術の小売システムを示す、略ブロック図である。 図2は、本発明のシステムが、いかにして、共通のリソース(共有されたサービス)を使用する別個のアプリケーションを利用して、複数のデータ集合に対する共有されたアクセスに基づき、識別されたユーザーのサービスを提供するのかを示した、略ブロック図である。 図3は、電子的に格納されたドキュメントの大きな集合体を、維持および分配するためのシステムの概観を示す略ブロック図である。 図4は、ドキュメント問合せおよび検索アプリケーションのためのウェブ−ベースのアプリケーションフレームワーク、および共通のコンテンツレポジトリーソフトウェアシステムとのそのインターコネクションを示すブロック図である。 図5は、図4のシステムの、クライアント、サーバーおよびデータのトレイルを示す、模式図である。 図6は、本発明において使用されるドキュメントレコードおよび関連するメタデータレコードの模式図である。 図7は、リソースアプリケーションを構築するために使用される開発ツールを示す略ブロック図である。 図8は、ドキュメントの取り込みのためのプロセスを示すフローチャートダイアグラムである。 図9は、ドキュメントのエンリッチメントのプロセスおよびドキュメントのメタデータ処理を示すフローチャートダイアグラムである。 図10は、本発明のコンテンツ(TOC)アーキテクチャのテーブルを示す模式図である。 図11A〜Dは、本発明に従って構築されたコンテンツ構造のテーブルを示す模式図である。 図12は、本発明に従って構築されたコンテンツの例のテーブルを示す模式図である。 図13は、本発明において、セキュリティーサービスがどのようにして機能するのかを示す、略ブロック図である。 図14は、いかにしてセキュリティーが実行されるのか、ならびにユーザーグループおよび許可を示す、関係ダイアグラムである。 図15は、本発明のセキュリティーモデルについての、定義および関連ダイアグラムである。 図16は、いかにして、アラートサービスがクリッピングを提供するかを示す、模式図である。 図17は、いかにして、トレイルサービスが機能するのかを示す、模式図である。 図18Aは、いかにして、ドキュメントデリバリーサービスが機能するのかを示す、模式的関連ダイアグラムである。 図18Bは、いかにして、ドキュメントデリバリーサービスが機能するのかを示す、模式的関連ダイアグラムである。 図19は、いかにして、ドキュメントレンダリングが、最小のプレゼンテーションスタイルシートとともに機能するのかを示す、略ブロック図である。 図20は、いかにして、ドキュメントレンダリングが、あつらえのスタイルシートおよび複数のスタイルシートともに機能するのかを示す略ブロック図である。
(詳細な説明)
(A.システムの概観)
図2は、いかにして、本発明のシステムが共通のリソースまたは共有されたシステムサービスを用いて、メタデータ50を有する複数のデータ集合30に対する共有されたアクセスに基づいて、ユーザー6に対して、識別された情報リソースサービスを提供するのかを示す、ブロック図である。より具体的には、図2は、いかにして、複数のユーザー6(例えば、金融ニュースに興味を持つユーザー、法律ドキュメントに興味を持つユーザー、および技術および特許ドキュメントに興味を持つユーザー)が、システムと相互に作用し得る。(これら興味の対象は、例示である;ユーザーは、法律、税金、会計、医療、科学、知的財産、教育課程の教材またはニュース情報、あるいは、これら分野の特定の部門。)各ユーザーは、それぞれのユーザー問合せメッセージQa1、Qb1、およびQz1を送り、これらは、ユーザーのそれぞれのリソースアプリケーションソフトウェア15(例えば、リソースApp、リソースApp、およびリソースApp)によって受け取られ、これらの各々は、その情報ソースに対して購読し、そしてアクセスを購入するユーザーの特定のドキュメントのニーズに対して役に立つように、設計される。リソースアプリケーション15(リソースApp、リソースApp、およびリソースApp)の各々は、それぞれのユーザー問合せメッセージQa1、Qb1、およびQz1を、共有システムサービス/ツール20(各リサーチリソースを含む情報リソースフィーチャーを提供するために必要な種々の機能を実行するソフトウェアとハードウェア)のセットに対して送る。
概観するために、より重要な共有されたサービス/ツールは、サーチサービス(ユーザー問合せを処理して、問合せに応答する1つ以上のドキュメントを見出す)、会計サービスおよびビジネスサービス(情報の小売を可能にする)である。共有されたサーチサービスは、適切なデータ集合30(関連するメタデータ50を含む)のコンテンツを分析し、これらの各々は、関連するメタデータ50を有す1つ以上のドキュメントを含む。単純化のために、各データ集合を、2つのドキュメントのみを有するとして示す。従って、データ集合は、ドキュメントD11、D22を有し、データ集合は、ドキュメントDn1、Dn2を有する。各ユーザーは、1つのみのデータ集合30に対するアクセスを提供する購読を有し得、そして各ユーザーのアクセス可能なデータ集合は、他者のものとは異なり得るが、システムは、限定されない。図2の例において、ユーザーは、データ集合にアクセスする問合せを送り、その一方で、ユーザーは、データ集合およびデータ集合の両方にアクセスする問合せを送った。さらに、ユーザーzは、データ集合およびデータ集合の両方にアクセスする問合せを送った。
ユーザーは、ユーザーの問合せQa1に応答して、データ集合からドキュメントD11aを受け取る。デリバリーされるD11aは、リソースAppのフィーチャーに基づき、特定の形式であり、そしてD11として格納されたドキュメントのフォーマットである。ユーザーbは、その問合せQb1に応答して、データ集合から2つのドキュメントを受け取る(データ集合1からのドキュメントD11(問合せQa1に応答するドキュメントと同一のドキュメント)およびデータ集合2からのドキュメントD21)。図2において示されるように、ユーザーに対してデリバリーされるドキュメントD11は、リソースAppがD11として格納されたドキュメントをデリバリーする形式またはフォーマットD11bとは同一ではない、リソースAppによって決定される特徴的な形式、またはフォーマットD11aとして与えられ得る。ユーザーzはまた、問合せQz1に応答して、2つのドキュメントを受け取る(データ集合2からドキュメントD22、データ集合nからドキュメントn2)。再度、リソースAppは、リソースAppzのフィーチャーに基づいて、D22およびDn1として格納したドキュメントの特定の形式またはフォーマット(すなわち、D22zおよびDn2z)において、これらドキュメントの各々を、受け取る。従って、図2は、2つの異なるリソースアプリケーション15が、各々同一のデータ集合30にアクセスし得、そして実際にその集合中の同一のドキュメントにアクセスし得ることを示す。さらに、図2は、各リソースアプリケーション15が、共有されたシステムサービス/ツール20を利用するが、そのユーザーに対してデリバリーされたドキュメントを、別のリソースアプリケーションによってデリバリーされた同一のドキュメントのデリバリーされた形式/フォーマットとは、いくぶん異なる形式またはフォーマットにし得る。サービスおよびデータレベルでのリソースは、共有されるが、ユーザーにデリバリーされる結果は、異なり得る。
図3は、電子的に格納されたドキュメントの大きな集合体を維持しそして分配するためのシステム(図2において機能的に考察されるものを含む)の概観を示す略ブロック図である。より高いレベルの機能エレメントが、示される。これらの格納されたドキュメントは、多様なユーザーの集団によって利用可能とされる。システムのエレメントとしては、1つ以上のリソースアプリケーション(RA)ユーザーインターフェース10a、10b、...10n(ユーザーのための種々の静止スクリーンおよびインタラクティブスクリーンにアクセスし、および/または作成してデリバリーし、そして、1つ以上のユーザーメッセージ12a、12b、...12nを入力として引き出して受け入れる);共有されたサーチコンポーネント22;1つ以上のデータベースまたはデータ集合30a、30b(単純化のために、2つのみが示される);共有されたドキュメントデリバリーコンポーネント40;1つ以上のメタデータファイル50a、50b(再度、単純化のために、2つのみを示す);および新規ドキュメントキュー70、エンリッチメントコンポーネント80を伴い、プライオリティーコンポーネント90およびGUIDコントロール100を含む。
各RAユーザーインターフェースは、10a、10b...10nは、1つ以上の主題領域中の情報アクセスリソースとして供されるソフトウェアのコレクションである、リソースアプリケーション15a、15b...の一部である。リソースアプリケーションは、特定の所望の市販の提供(すなわち、「製品」)を具現化、および/または得意のユーザー必要性またはユーザープロフィールに応答する。従って、1つのリソースアプリケーションは、その他から、それ自身を:アクセス可能なコンテンツ/主題の事項;ドキュメントエンリッチメントの程度、ユーザーインターフェース特徴;ドキュメント送達フォーマットまたはモード;正確さ;および特定のリソース必要性またはユーザーマーケットに対するその他のアピール特徴によって区別し得る。
本発明の種々のコンポーネントは、異なるリソースアプリケーションを横切る記憶されたドキュメントの本質的に縫い目のないコンテンツを共有すること、および種々の様式でアクセス(例えば、ウェブサイト、インターネット、エクストラネット、ワイアレスなど)を可能するツールのセットを提供する。本発明はまた、リソースアプリケーションへの共有されたサービスおよびツールを提供するための、共通リソースアプリケーションインフラ構造(ARサーバー300、図4)による履行を含む。情報販売、セキュリティおよび請求書発行サービスは、重要な共有サービスである。各リソースアプリケーションは、共通コンテンツレポジトリーおよびデータサーバーソフトウェア(CCRDSサーバー400、図4)により記憶および維持されたドキュメントの少なくとも一部分へのアクセスを容易にすることにより、特定のユーザープロフィールおよびマッケットプレイスをサービスするために開発されている。リソースアプリケーションついて規定し、かつ履行することの利点は、共有サービスおよびツールのセットは、以下に論議されるようなものを含み:再使用可能性,アプリケーションを開発するための減少した時間、および新たなアプリケーション開発のための低減されたコストを含む。
本発明に適用可能な1つのシステムでは、データの大きな塊が、CCRDSサーバー400によって管理される共通コンテンツレポジトリー中に記憶されるが、それは、複数のアクセス可能なサーバー上に広がり得、そして余分に維持される。このデータは、広範な範囲の主題をカバーし、そして異なる理由のために多様なグループのユーザーによってアクセスされ得る。従って、それは、異なるユーザーインターフェース10a、10b、...10cを通じてデータへの異なるタイプのユーザーアクセスを提供するために有用であり得る。各ユーザーインターフェースは、特定の詳細ユーザー特徴および必要性を供するよう適合されたスクリーン中で履行され得る。このユーザーインターフェースは、カクタマイズされて質問を作製するか、ドキュメントをリクエストするユーザーメッセージの処方の容易さを提供するのみならず、カスタマイズされてドキュメント送達のためにユーザーに適切な形態およびフォーマットを提供する。すなわち、共通のレポジトリーから送達されたデータは、特定のユーザーインターフェースに特異的に仕立てられ、かつフォーマットされる>
種々の理由のため、記憶された情報は、ドキュメントの塊内の個々のドキュメントの形態で記憶されている。このドキュメントの塊は、ドキュメントの1つ以上のコレクション中に区画される。本明細書で用いられるとき、ドキュメントは、著者または供給元が情報を調製する、ニュース論説、司法的意見(事例レポート)、規制規則、レポート、電子ファイルまたはデータベース記録、またはその他の慣例のフォーマット(紙または電子媒体のいずれか)のような、特有の一般的な識別子(GUID)を受ける1つの密着したデータユニットとして広く規定される。関連するドキュメントのグループは、コレクションとして一緒に記憶され得(論理的に、必ずしも物理的である必要はない)、そして1つ以上のコレクションが、セットとて、一緒に貯蔵され得る(再び、論理的に、必ずしも物理的である必要はない)。
コレクションおよびセットの使用は、ユーザーが、特定の、共通して理解されるセットまたはコレクション、例えば、特定セットの地域法律事例レポーター;法律総説のような特定カテゴリーの定期刊行物;死亡、所有権または商標の記録のような記録のコレクション内のサーチすることのユーザーの範囲を容易にし得る。各ドキュメントは、コレンションおよびセット内で少なくとも一度インデックスを付けられる。このコレクションおよびセット配列はまた、システムが、サーチを特定のコレクションまたはセットに向けることにより課せられるサーチを低減し、そして各サーチが全ドキュメントレポジトリーをカバーすることを必要としない。ドキュメントレポジトリーは、合計20テトラバイト以上の情報を含んで極度に多くあり得る。
いくつかの分野では、新規ドキュメントが、常時、しばしば、数分毎または数秒毎に現れるというような高頻度でさえ生成され、そしてFTPまたはその他のフォーマットにより、リアルタイムにドキュメント行列待ち70に送達される。このデータレポジトリーがアップデートされるか、またはそのコレクションが拡張するとき、新規ドキュメントは、1つ以上のデータコレクション30a、30bに付加され得る。新規ドキュメントは、後に、異なる目的のために異なるユーザーによってアクセスされるので、取り込みコンポーネント(Intake Component)80によって実施されるドキュメント取り込み機能が、適正な基礎を提供することが所望される。所定のドキュメントの取り込みを繰り返されなければならないこと、または、通常でない状況にあることを除き、それがレポジトリーに付加された後でそれを編集することは所望されない。なお、この同じドキュメントは、このドキュメントをアクセスするために採用され得るユーザーインターフェースおよびリソースアプリケーションに基づき、その送達の一部分として改変可能である必要があってもよい。(さらに、このリソースアプリケーションは、このドキュメントがドキュメントコレクションに入るときに存在しなくてもよい)。従って、各ドキュメントは、好ましくは、XML、または後の刊行において柔軟性を許容する別のドキュメントフォーマットで記憶され、そして柔軟性を支援する属性をもって生成またはエントリーの時間で提供される。さらに、このドキュメントに関連するメタデータファイルエントリーまたは記録がまた生成され得る。このメタデータファイルエントリーまたは記録は、ドキュメントのコンテンツが、ドキュメントのコンテンツの取り込みの時間に、ドキュメント自身のために適切であり得る特定の様式で富化され得ることを可能にし、そしてまた、ドキュメント自身を改変することなく、取り込みのときに、ドキュメントに関連するメタデータを改変することにより、ユーザーに利用可能な情報の後の富化を許容する。(本明細書で用いられるとき、メタデータは、情報についての情報を意味し、そしてユーザー、システム、または両方のいずかに有用であるドキュメントについての任意の情報であり得る)。
図6は、ドキュメント110に関連するメタデータレコード152が記憶される、データコレクション30a、30bおよびメタデータファイル150に記憶され得るような、ドキュメントレコード110の概略図である。このドキュメントレコード110は、タイトル112、著者/刊行者114、日付114、GUID(全体汎用識別子:global universal identifier)118、およびPIT(時間点:point in time)スタンプのようなフィールドを含む。このドキュメントは、取り込み時に調製されたエンリッチメントデータを受けるためのフィールド126を含み得、そして必要に応じて、1つ以上のTable of Content(以下にさらに詳細に論議される)にこのドキュメントを関連付ける「ntoview」フィールド127を含み得る。このドキュメントは、1つ以上の挿入されたリンク122または分類属性124を含み得る。ドキュメントは、テキスト、持続するかまたは移動するイメージ、音またはコンテンツのその他の形態を含み得る。コンテンツの性質は、ドキュメントレコード110中またはメタデータファイルレコード152中のいずれかに捕獲される別の属性111であり得る。
陳述のように、取り込みコンポーネント80により処理されるドキュメントは、属性をもつソースから受けたファイル(例えば、ニュース刊行者、ジャーナル刊行者、ストックマーケット、裁判所または規制当局)を提供することにより富化され得る。提供された特定の属性は、付加されているドキュメントのタイプに依存する。これら属性はまた、特定のリソースアプリケーションに一部として特定され得る。
属性は、少なくとも2つの機能を提供し得る。第一は、そのシステム内またはユーザーに対するユーティリタリアン(utilitarian)である。すなわち、特定のコンテンツまたはコンテンツモディファイヤ、ならびに機能フィーチャ(例えば、他の文書へのナビゲーション関係またはナビゲーション接続をアクティブに確立するリンクを示す)が作成され得る。第二は、ブランド認識フィーチャである。なぜなら、ソースの受容は、しばしば、文書自体と同様に重要であるからである。このブランド識別性は、文書の最終の外観によって確立され得る。これは、文書に付加される特定のブランド識別属性(例えば、ユニークな形式またはソースから送達されるコンテンツから生成される特殊に派生する付加価値コンテンツ)によって容易にされ得る。
例えば、取り込みのために処理される文書は、所定の株式報告または会社分析に関連し得る。この文書のテキストまたは事実コンテンツは、一般的に一旦作成されると不変である。2つの異なる販売者は、各々が受容されるレベルの品質を有し、その文書のコンテンツに対するアクセスをユーザーに提供し得る。各々の販売者は、文書をアクセス可能にするが、自分自身の情報販売システムの「外観および感触」を有することを欲し得る。従って、本発明のシステムの属性および/またはメタデータファイルを利用して、それがそのソースから提供されるときに文書を補充または強化し得、その結果、特定のユーザーインターフェースまたはリソースアプリケーションを介して提示されるときに、それが、ユニーク性を増し、そしてブランド化され、そして付加価値が与えられた製品として受容され得る。
取り込みの際にそのエンリッチメントのために文書に関連付けされ得る属性の一つは、リソースアプリケーションに依存するベースに基づいて後に可能性のある使用のために、文書へのリンク付け(例えば、ハイパーリンク122の挿入による)を含む。例えば、法律のリソースアプリケーションに適合される判例法国は、他の内部参照される判例報告へのリンクを含み得る。これは、共通コンテンツレポジトリにおいて見出され得る(または他の場所(例えば、ワールドワイドウェブ))。新聞記事は、その話において識別される個人または事件に関連する特定のコンテンツにリンクされ得る。そのようなリンク122のアクセス可能性は、不確実であり得、すなわち、リソースアプリケーションに依存するが、いくつかの文脈においてユーザーインターフェースを通じて提供されないかもしれない。例えば、ニュースサービスの法曹ではないユーザーが法律関連の判決例報告にアクセスし得る。他の判決例報告に対するリンクは、アクティブではない可能性があり、あるいはそのユーザーについて、法曹のプロユーザーについて同じ様式で適切ではないかもしれない。記述されるように、文書に関連付けられるメタデータファイル記録152は、レポジトリにそれが付加される時点で付加される属性に関する別の場所である。メタデータ記録152は、リソースアプリケーションによって使用されて、もとの格納された文書記録110自体を変化させることなく、ユーザー照会メッセージに関連して文書についてデータ、パラメータまたはディスプレイ形式を重ねがき、付加、削除または改変する情報を格納する(または他のメタデータファイルにリンク付けする156)。
文書取り込みのプロセスの一部として、文書記録110は、編集材料によって強化され得る。すなわち、付加価値編集コンテンツが、文書に挿入され得るか、またはメタデータ記録に付加することによってその文書に関連付けまたは付着され得る。例えば、法律の判決例報告の場合、ヘッドノートまたはまとめが、作成および付加され得る。この材料は、手動でまたはある場合は、自動的に作成され得る。例えば、法律の判決例報告において言及される判例は、引用チェックされ、そして自動的に引用がアップデートされ得る。さらに、新たな文書が種々の分類属性124によってラベルされ得る。この属性は、いくつかの集合分類(例えば、管轄、トピックなど)についての指標として使用され得る。
(B.照会プロセスの外観)
情報小売は、種々の顧客関係に基づいて行うことができる。しかし、ほとんどの場合において、ある種の顧客契約が存在し、この契約は、顧客が購入したサブスクリプションまたはアクセス条項を定義し得る。この契約は、アクセスされ得る主題、アクセス時間などに関する制限を特定し得、そして料金を定義し得る。契約は、紙またはオンラインで締結され得、そして情報レポジトリのいかなる使用に十分先立って結ばれ得る。適切な支払いが確認されると、契約はまた、使用前にすぐに締結され得る。一旦情報プロバイダとユーザーとの間の契約関係が定義されると、ユーザーは、1または複数のリソースアプリケーションおよびそのユーザーインターフェースを介して少なくとも一部の共通コンテンツレポジトリに対するアクセスを有することになる。
本発明の一つの目的は、情報プロバイダが、共通のコンテンツレポジトリの部分へのアクセスおよび文書の送達について所望される本質的に任意の情報製品/サービスおよび顧客との関係を定義することを可能にすることである。従って、この関係は、多数のパラメータを含み得、これは、顧客によって変動し得、以下を含み得る:アクセスが許容されるコレクションまたはセット;アクセス時間、アクセス利用可能なユーザーまたは他のロード制限の数値;ユーザーに提示されるスクリーンの外観およびコンテンツ(これによって、ユーザーは、要求を照会し、そして結果を受け取る);要求され得る文書の送達のモードおよび/または形式;および種々の使用形式の料金。従って、小売業者は、種々の関係を支持するリソースアプリケーションを開発して、システムが、種々の合意されたビジネス条項に適合するサービスを提供することを可能にすることを所望し得る。
リソースアプリケーションがどのようにして共通コンテンツレポジトリにアクセスするかの概観は有用である。まず、エンドユーザーがエンドユーザーの照会においてシステムから文書を検索する。図3に示されるように、これは、ユーザーメッセージ12a、12b、、、12nの形式である。多数のユーザーメッセージが、一日のどの時間でも、世界中のとこからでも(ただし、定義された顧客関係によって制限されない限り)同時にユーザーから入力され得る。ユーザーメッセージは、多数の異なる形式(例えば、検索(find)、サーチ(search)、またはブラウズ機能)に適合され得る。例えば、あるユーザーが特定の情報(例えば、文書のタイトルおよび著者)を知っている場合、そのユーザーは、その特定の文書を検索するようにシステムに要求する。他方、ユーザーがある主題について一般的な情報を探している場合、そのユーザーは、サーチまたはブラウズを実行して、関連する情報を見出し、または照会を再検討する。これらは、リソースアプリケーション内で定義され得、そしてユーザーからシステムが受け取ることができる多数のタイプのユーザーメッセージの本の一例である。
各々のユーザーメッセージは、ユーザーによって、RAユーザーインターフェース10a、10b、、、10nのうち1または複数を使用することによってシステムに入力される。各々のユーザーインターフェースは、ユニークな概観および感触を有し得、そしてユーザーが特定の種類の文書を検索することを容易にする。これは、使用されるユーザーインターフェースのタイプに依存する。例えば、法律文書を検索するためのリソースアプリケーションのユーザーインターフェースは、新聞記事を検索するために設計されてアユーザーインターフェースとは異なる文書にアクセスするように適合される。異なるアプリケーションのこれらのユーザーインターフェースは、おそらく、異なる概観および感触を有する。なぜなら、これらは、異なるタイプの文書にアクセスするように設計されており、そして異なるユーザープロファイルに対してアピールするからである。
要求がユーザーによってユーザーメッセージ12a、12b、、、12nとして入力された後、サーチコンポーネント22を用いて関連する文書を見つける。サーチコンポーネントが、キーワードまたはフレーズを、ユーザーの要求によって使用して、関連する文書が配置される場所、および1または複数の文書を識別するサーチ結果メッセージを送信する場所を決定する。サーチコンポーネントは、究極には、各々の文書についてGUID識別子を見つける。このGUID識別子は、文書が、コレクションから容易に取り出されることを可能にする。いくつかの場合において、サーチコンポーネントは、実際の文書ではなく「ヒット」のリストを送達し、そしてさらなるユーザーメッセージは観察または他の送達のための特定の文書の選択を定義する。サーチコンポーネントは、さらに詳細に以下に記載される。
1または複数のデータコレクション30a、30bに格納される各々の文書は、GUID制御コンポーネントのタイムスタンプコンポーネントから正確な時点(PIT)120を伴って格納される。このPITフィールドは、実際のクロック時間値であり得るが、また、所定の文書について、単に特定のバージョンが他のバージョンに比較して意味づけされることを示す一連の識別子またはバージョンであり得る。例えば、バージョン識別子は、GUID:GUID.00、GUID.01、GUID.02などに基づいて構築され得る(これは、法律的文書について特に有用であり得る)。従って、文書または関連するデータが、経時的に改変される場合(例えば、関連するメタデータを加えるかまたは変更することによる)、PITは、システムが、文書の最も現在のバージョンおよび関連するデータがユーザーに提示されているかどうかを検出することを支援し得る。また、文書の以前のバージョンがすでに提示されているにもかかわらず、文書のアップデートされたバージョンが、サーチ機能がその文書を発見したときに提示されることを可能にする。取り込み時間PITに加えて、リソースアプリケーションは、この後者のアップデート機能について有用であり得る送達時間を追跡し得る。
一旦文書がデーベースから要求されると、文書送達コンポーネント40を用いて、文書をユーザーに送達する。この送達コンポーネント40は、文書を、リソースアプリケーションによって利用可能にされた中からユーザーが選択した形式およびモード(例えば、電子メール、ファクス、郵便)で文書を提示する。従って、送達されるときには同じ文書が、異なる概観および送達モードを有し得、これらの概観および送達モードに依存して、ユーザーインターフェースおよびリソースアプリケーションがそれに関して要求を受け取る。
図3に示されるように、データベースまたはデータコレクション30a、30bに格納される文書は、メタデータファイル50a、50bと関連付けられる。メタデータファイルは、各々の文書に関連する種々のさらなる情報を含み得る。この情報は、文書コンテンツ自体の一部ではないが、関連する文書についてのサーチの間にアクセスされ得、または文書自体と同時に送達のためにアクセスされる。
各々の新たな文書は、まず、取り込みコンポーネント60によってデータベース30a、30bへと配置される。このデータベースは、定期的かつ頻繁に文書がアップデートされ、そして少なくとも文書のいくつかは、即座の発行が必要とされる。例えば、株式市況報告およびホットニュース記事は、可能な限り早く利用可能になるべきである。その関連性は、しばしば、短命であり、その価値は、そのタイムリー性に関連する。取り込みコンポーネントの優先度コンポーネント90は、1または複数の優先度レベルを用いて処理のために入ってくる文書を優先度をつけて、特定のリソースアプリケーション(例えば、報告またはニュース事項の場合の時間発行利用可能性を約束するリソースアプリケーション)のために定義され得るリアルタイムまたは他の特定の利用可能な要件を用いて受け取り文書の時間順序から選択的に処理する。GUID制御コンポーネント100は、それがデータコレクション中の任意のユーザーに利用可能とされる前に、各々の文書に関する割り当てられた文書識別子のユニーク性をチェックし得る。取り込みコンポーネント60はまた、ユーザーに利用可能な文書を作成する前に、所定の形式について文書をチェックし得る。これらのフィーチャは、データコレクション30a、30bに対してリリースされる文書がこのシステムによってアクセスされる準備ができることを確実にすることを支援する。
(取り込み処理)
図8は、取り込み処理をフローチャートの形式で示す。802において、システム5(図3)は、ソース(例えば、ニュースサービス、裁判所、市場データサービス)から送信されるファイルを受け取り、そして804において取り込みコンポーネント60は、ファイルを送信形式から、取り込み処理により適切な形式へと変換する。806において、個々の文書が処理のために分離され、そして808において取り込みコンポーネントは、ソースによってすでに割り当てられたかもしれないまたはいまや割り当てられる必要があり得る優先度コードをサーチする。810において、文書が1または複数のキュー中に蚊k脳され、優先度に従ってさらに処理される。812において、このシステムは、ファイル中のさらなる文書および/または受け取られるべきさらなるファイルについてチェックし、そしていずれかが存在する場合、適切な実行ポイントを返して、次の文書またはファイルを処理する。
814において、最高の優先度を伴う文書を選択することによって、別の処理リソースが文書のキューにアクセスする。816において、取り込みコンポーネントは、ソースによってすでに割り当てられてい得る(GUIDのユニーク性を確実にせねばならないシステムに強調して)か、または今やユニーク姓を確実にする履歴およびアルゴリズムに基づいて割り当てられることを必要とし得るGUIDについてサーチする。818において、文書の格納フォーマットは、エンリッチメント80を処理するための準備を確実にするために820においてチェックされる。
エンリッチメントコンポーネントを用いて、文書コレクション30a、30bにおいて配置されるように、各々の文書を増強することができる。エンリッチメントコンポーネントは、種々のフィーチャを各々の文書に加え、これは、1または複数のユーザーグループのための文書の価値を増大させる。エンリッチメントコンポーネントは、各々の文書を、以下のうち1または複数と関連付ける:人間のエージェントによって準備されたさらなる編集材料;自動化エージェントによって準備されたさらなる編集材料;このデータベース中の別の文書へのポインタを提供するリンク;またはメタデータファイルに出現する文書と関連付けられたエントリ。これらのエンリッチメントフィーチャは、エンドユーザーに対して、ある種類のさらなるコンテンツと組み合わされた個々の文書の形式で付加価値生成物を受け取ることを可能にする。種々の形式のエンリッチメントが、特定のユーザーに役にたち、そして特定の文書を送達するために使用されるリソースアプリケーション15に依存して利用可能であり得る。
820におけるエンリッチメント処理の後、文書は、822においてメタデータ抽出コンポーネント処理に供され得る。この処理で得られるメタデータは、一般に、この文書を1または複数のコレクションへと接続するために重要なデータを抽出する工程を含む。従って、この文書のコンテンツを解析して、同じまたは異なるコレクションにおいて他の文書に対してこの文書の言語学的に洗練された分類を開発することができる。格納または検索を支援し、そして文書を改変またはカスタマイズして1または複数のリソースアプリケーションのフィーチャのための基礎を提供する、種々の形式のメタデータが開発され得る。
図8をなおも参照すると、メタデータが抽出された後、824において、文書がアクセスのためのリリースのその時間に対応するPITとともに格納される。826において、このシステムは、処理される優先キューにおいてより多くの文書が存在するかどうかを決定する。そうでない場合、文書プロセッサは、828において待ち状態へと移る。より多くの文書が存在する場合、制御は、実行点へと移り、その時点で、次の文書が優先キューから選択される。
新たな文書が配置される少なくとも1つのデータコレクションにおける文書は、少なくとも1つのコレクションサブセットへと区分され得、そして新たな文書を受け取るための取り込みコンポーネントが各々の追加の文書がユニークな識別しそして少なくとも1つのコレクションサブセットに割り当てられることを確実にし得る。別のデータコレクションは、少なくとも1つの文書セットを有し得、この文書セットは、1または複数のコレクションサブセットの文書のアグリゲーションである。
(エンリッチメントおよびメタデータ処理)
図9は、図8において言及された文書エンリッチメントおよびメタデータ抽出のプロセス900のためのフローチャートを示す。902において、文書エンリッチメント処理のために使用されるコンポーネントは、制御を受け取り、そしてエンリッチメントのための文書を受け取る。904において、自動化されたエンリッチメントエージェントが適用され、そしてこのエージェントによって生成されるエンリッチメントフィーチャを使用して、文書を増強する。例えば、このエージェントは、新聞記事または事件の中で個人名または会社名についてサーチし得、次いで、文書をブラウズする個人によって相談され得る再度バーディスプレイのためのファイルを構築することができる。自動化されたエンリッチメントエージェントの適用の後、バイパス経路905〜ステップ910は、人間のエンリッチメントエディタの割り当てが必要でない場合に採られ得る。バイパス905が採られない場合、906において、文書は、再検討および編集のために人間のエンリッチメントエディタに割り当てられる。908において、人間のエンリッチメントエディタがさらに増強された文書と共にファイルを返す。910において、増強された文書は、メタデータ処理のために送達され、そして912において、メタデータ抽出コンポーネントは、送達された文書を受け取る。914において、自動化されたメタデータエンジンが文書に適用されて、メタデータが抽出され、そして916において、このメタデータファイルが収集され、そしてその文書と関連付けされる。例えば、抽出されたメタデータは、XMLデータまたはメタデータのレイヤに構築されたリソース・ディスクリプション・フレームワーク(RDF)ステートメントの形式でメタデータのレイヤへと開発され得る。918において、この文書のためのメタデータファイルは、他の文書に関してメタデータファイルとリンク付けられる。例えば、メタデータ処理が、文書のいくつかの言語学的分類を生じる場合、表、インデックス、コンテンツ表または他のコレクションワイドのメタデータファイルが、この文書に由来する情報および/またはそれに対する参照とともにアップデートされ得る。920において、リソースアプリケーション条件付タグがメタデータファイルに付加され得る。これらは、特定のリソースアプリケーションによって用いられて、特定のリソースアプリケーションによって供給される文書リソースサービスにおいて含めるのかまたは排除するためにメタデータをタグ付けする。いくつかの場合において、メタデータは、リソースアプリケーションによってアクセス可能なタグの存在または非存在に基づいて、サーチまたはディスプレイから排除される。
922において、メタデータファイルが格納される。これらは、文書と関連付けられて(couple)格納され得るか、または関連付けられずに格納され得る。すなわち、物理的な関連付けまたは単に論理的な関連付けが存在し得る。924において、このシステムは、ファイル(または部分)を候補としてマークし、または将来のメタデータの付加のための候補としてではなくそのファイルをマークする。この将来のメタデータは、文書使用パターンを経時的に統計学的またはヒューリスティックな規則解析の使用によって派生され得る。メタデータを格納すると共に、処理される文書は、ユーザーアクセスのために準備ができるようになるが、関連するメタデータは後に変更され得る。このシステムが、使用パターンを追跡および解析するためのエージェントを有する場合、このマーキングは、適切な場合この文書の使用が追跡されること、および結果(例えば、図6における使用メタデータ154)が記録されることを確実にし得る。さらに、使用パターン情報が開発されるにつれ、メタデータは、文書取り込みがアップデートされ得る時間に格納され得る。例えば、この文書が頻繁に、観察されるサーチパターンの部分である場合、メタデータファイルは、生じた一連のサーチにおいて近似する他の文書を反映するようになり得、その結果、同じ一連のサーチに沿ってユーザーが後に導くことを支援する。926において、エンリッチメントおよびメタデータ抽出コンポーネントは、システムに制御を戻す。
メタデータは、情報オブジェクトへのアクセスを構成、記述、追跡および他の様式で増強するように作成される付加価値情報である。以下により詳細に説明されるように、本発明において、とりわけ、メタデータは、コンテンツの表、フィルタリングまたは他の操作によって得られるコンテンツ表の派生物、ユーザー追跡情報から派生する使用パターンデータ、重複検出のために開発された文書シグネチャ、およびトークンインデクシングの形式で開発される。文書の大きなアグリゲーションにおいて、メタデータは、ヒエラルキー形態であり得、ここで、より高いレベルのメタデータは、より低いレベルのメタデータの意味を解釈するにおいて支援するように開発され得る。他の状況において、メタデータは、非ヒエラルキーであるがそれにもかかわらず他のメタデータに関してリンクまたは他の非ヒエラルキー形態の指摘手段によって関連付けられるメタデータである。次に記載されるコンテンツ表は、付加価値メタデータを開発するためのプライム機会を提供する。
(コンテンツ表(TOC)構築)
1つの形態のメタデータプロセシングは、コンテンツ表(TOC)構築である。本発明において実行されるように、TOCは、2つの異なるコレクションタイプが定義されることを必要とする。TOCコレクションは、TOCヒエラルキー関係を含む。文書(DOC)コレクションは、文書を含む。TOCは、1、2または多数のDOCコレクションにおいて文書を参照することができる。恒常的なGUIDは、現在のTOC設計の利益を達成するための要件である。システムが多数のタイプの情報をユーザーに提供する場合、それは、代表的には、各々のタイプの情報について少なくとも1つのTOCを有する。
TOCヒエラルキーは、共通のコンテンツレポジトリー中に1つのコレクション中に存在し、そして文書に対する参照を含む。参照される文書は、1または複数のDOCコレクション中に存在する。コレクションセットを用いて、単一のTOCコレクションとDOCコレクション(単数または複数)とを結びつける。このDOCコレクションは、参照される文書を含む。図10は、TOCアーキテクチャの模式的外観である。以下は、TOCの実行についてのさらなる詳細である。
a.ローディングデータ。TOCデータをTOCコレクションにロードする。DOCデータを、DOCコレクションにロードする。TOCコレクションおよびDOCコレクションの両方は、同時に、ローディングデータであり得る。TOCおよび文書データをsync(同期)に維持するために、同期プロモートが、多重コレクションの同期を促進することをクライアントに可能にするために利用可能である。
b.TOCノードに基づくサーチの制限。「n−tocview」エレメントが文書データロードに加えられて、TOCサーチ−クエリ−ビュー制限を支持する。この「n−tocview」127(図6)は、クライアントが文書と関連付けることを希望するTOC GUIDを含む。以下は、図11Aにおいて単純化したサンプルTOC構造をアップデートするために使用されるXMLの例である。ここでは、陰付ノードは、文書「d2」を指摘するTOCノードを表す。
Figure 2010211828
Figure 2010211828
注意。n−topview中で特定されるGUIDは、共通のコンテンツレポジトリによって、コレクションセット内に存在することも、関連情報であることがベリファイされていない。
c.ラッパーAPL。コレクションセットを用いて、TOCコレクションをDOCコレクション(単数または複数)に結びつける。このDOCコレクションは、参照される文書を含む。ラッパーAPLは、コレクションまたはコレクションセットと共に用いるためのTOC APIを含む。コレクションセットは、ラッパーAPIが使用され得る単一の点を提供する。
d.TOC XML。TOCノードは、n−nodeエレメントによって作成、アップデートおよび削除される。各々のn−nodeエレメントは、TOCノードを記述する情報を含む。TOCデータは、(文書のように)トークンインデクシングされておらず、従って、共通のコンテンツレポジトリによってサーチ可能ではない。n−topview情報がその文書内に配置され得、従って、サーチのためにインデクシングされ得る。
n−nodeは2つの属性を有する:
guid−TOCノード
GUID
control:起こるべき動作を示す。
(表)
値 |動作の記述
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
「ADD」 |TOCノードをこの段階で加える
「DEL」 |TOCノードをこの段階から削除する
「DELBRANCH」 |TOCノードおよびこの段階について
|すべてのTOCノードの子を削除する。
n−nodeは、以下のエレメントを有する:
n−parent−guid:親ノードのGUID。ルートノードは、このエレメントを含まない
n−doc−guid:このTOCノードが文書を参照する場合の文書のGUID。TOCノードは、ゼロを有し得るか、またはそれに関連する1つの文書を有し得る。このエレメントにおける任意のコンテンツは、TOCノードが文書を参照することを示す
n−anchor−guid:このTOCがアンカを参照するときのアンカのGUID
n−label:598バイトのサイズ制限を伴うテキストフィールド
n−rank:ランク順序で表示するためのアプリケーションのためのTOCノードをソートするために用いられる実数
n−name:アプリケーションに対して通過して戻るTOCノードに特異的なコンテンツ。このデータは、共通のコンテンツレポジトリ内にTOC定義に対する意味を有しない。n−nameに対する最大値は、20バイトである
n−value:n−name値を伴うアプリケーションに対して通過して戻るTOCノードに特異的なコンテンツ。このデータは、共通のコンテンツレポジトリ内のTOC定義に対して意味を有しない。n−valueの最大値は、200バイトである
n−meta−data:TOCに関するメタデータの情報を含む。
e.TOC DTD
Figure 2010211828
Figure 2010211828
f.TOCおよび文書XMLの例。図11Bを今度は参照すると、陰付ノードは、文書を参照するTOCノードを表す。2つのTOCノードは、文書「d1」を参照する。TOCノード「n7」は、「n5」のアンカーである。
Figure 2010211828
留意点:
文書「d1」は、<n−tocview>n1、n2 n4 n3 n6</n−tocview>の組み合わせn−tocviewを有し得る。文書内に含まれるアンカーは、クライアント特異的なタグで特定される。システムは、アンカーが要求するタグを文書内に含まない。
g.n−nodeに関するルールのアップデート
1.重複するGUIDはない。GUIDは、2回加えられず、削除もされず、そして同じロードにおいて加えられる。この条件が満たされない場合、ロードは、データエラーと共に失敗する。
2.定義されるn−nodeは、置き換えられるノードである。n−nodeがXMLで定義される場合、n−nodeにあるすべての情報は、再定義される必要がある。このデータのロードは成功する。このノードは、最新の定義のみを反映する。
3.子なしのn−nodeは削除機能とともに削除され得る。この条件が満たされない場合、このロードは、データエラーと共に失敗する。
4.ブランチの削除は、n−nodeおよびすべてのその子ノードが削除されたことを示す。
5.削除したブランチのn−nodeは、改変され得ず、ブランと削除として同じロードに加えられ得ない(規則1を参照のこと)。この条件が満たされない場合、ロードは、データエラーと共に失敗する。
6.n−nodeの親guidは、既存のノードでなければならない。この条件が満たされない場合、ロードは、データエラーと共に失敗する。(既存のノードは、すでにTOC中に存在するノードであるか、または現在のロードに存在するノードである。ノードは、ランク順序によりロードされる必要はない。欠失するノードのべリフィケーションは、ロードプロセスの最後に起こる。しかし、よりよいロード速度は、ノードをヒエラルキー(ランク付け)様式でロードする場合に起こり得る)。
h.TOCローディングでの使用の場合
以下は、TOCの実用的な含意を示す使用の場合である。これらの実施例の大部分は、図11CのTOC構造に基づく。この同じ構造は、上記XMLの例において用いられた。
1.大きなデータはどのようにしてTOC構造を用いてロードされ得るか?例えば、50ギガバイトの生データをロードし、所定のコレクションについて500メガバイト/時の速度でロードできるとしよう。1つのTOCおよび3つの文書コレクションが使用される場合、この同じデータは、1日より若干長い時間でロードすることができる。クライアントが文書データを多数のコレクションに分断したい場合、データは迅速にロードされ得る。
2.TOCからブランチはどのようにして削除され得るか?本発明者らの実施例を用いてノード「n2」に始まるTOCブランチを削除し、そしてまた、ノード「n2」のもとでいかなるノードをも削除するとしよう。文書「d2」は、TOC中でもはや参照されない。文書は、「d2」について欠如が共通コンテンツレポジトリに渡されない限り、削除されない。以下は、「n2」で始まるブランチを削除するためのXMLである。
Figure 2010211828
以下は、文書「d2」を削除するためのXMLである。
Figure 2010211828
3.文書「d1」のテキストはどのようにして変更可能か?
文書「d1」を新たな文書データおよびTOCサーチ制限を許容するn−tocview情報とともにリロードする。以下はそのXMLである。
Figure 2010211828
4.TOCノード「n4」のラベルは変更可能か?
TOCノード「n4」を、新たなラベル情報と共にリロードする。この同じ例は、TOCランク、名称、値またはメタデータのフィールドを変更する場合にも機能する。以下は、そのXMLである。
Figure 2010211828
5.文書「d3」は、どのようにして削除され得、そしてノード「n3」をどのようにしてTOC中に残し得るか?
文書「d3」について削除命令を送信し、そしてTOCノード「n3」を最適議して、文書「d3」に対する参照を含ませないようにする。以下はそのXMLである。
Figure 2010211828
6.文書「d1」は、どのようにして削除され得、そしてそれを参照するすべてのTOCノードを以下にして除去し得るか?文書「d1」についての削除命令を送信し、そしてノード「n4」および「n6」についての削除命令を送信する。以下はそのXMLである。
Figure 2010211828
7.新たなTOCノード「n7」を、TOCノード「n1」と「n3」との間にどのようにして挿入し得るか?新たなTOC構造は、図11Dのようである。文書「d1」および「d3」を新たなn−tocviewとともにリロードして、GUID「n7」をクエリビュー制限として支持する。「n7」について新たなTOCノードも作成し、そしてTOCノード「n3」を再定義して、「n1」の代わりに「n7」を指し示すようにする。以下はそのXMLである。
Figure 2010211828
まとめると、TOCは、文書に関するヒエラルキーメタデータを格納するための構造を提供する。TOCは、ノードからなる。GUIDはノード、親ノード、参照される文書およびアンカーを識別する。TOCを構築するためのすべての入力は、XMLである。TOCは、再帰的構造であり得る。これは、ノードのn−doc−guidが、文書のGUIDの代わりにTOCノードのGUIDを含む場合に起こる。次いで、TOCノードは、TOCノードを参照する。TOC中のノードラベルの語彙は、メタデータRDFステートメントに関する語彙として使用することができる。
文書は、いっときに任意の点において、たった一つのDOCコレクション中に存在し得る。しかし、文書は、TOCとともに多重の位置において表され得る。1または複数のDOCコレクションからの文書は、1つのTOCにおいて表され得る。
TOCヒエラルキーデータは、TOCコレクション中に格納される。文書データは、1または複数のDOCコレクション中に格納される。特定のTOCは、1つのコレクション中に存在する。TOCコレクションが参照するTOCコレクションおよび1または複数のDOCコレクションは1つのコレクションセットにより互いに結び付けられる。図12は、2つの文書(ラベルしたDG1およびDG2)を参照する単純化したTOCのサンプルを示す。
本発明のTOC設計は、多数の有用な特徴を許容する。
TOCナビゲーション:APIを提供して、TOCのノードをナビゲートする。以下のサンプル操作は、そのようなAPIを通じて実行され得る:TOCのルートノードを検索し;ノードを与え、その子を検索し;TOCサーチ結果およびTOCノードを与え、TOCの順序で次または前のノードを検索し;そしてノードを与えその親を検索する。
ヒットを伴うTOC:サーチが文書ヒットを得たとき、これらを併せて各々のTOCノードにおけるヒット数をリターンする。
フィルタリングしたTOC:リソースアプリケーションがサーチおよびTOCノードに対して参照を送信するとき、そのサーチに適合しないTOCの部分は、除去される。リソースアプリケーションがサブスクリプションハンドル(サーチに基づく制限、サブスクリプションに基づく)に対する参照を送信するとき、そのサブスクリプション基準に合わない任意のTOCが除去される。
ノードを見出す:リソースアプリケーションが、名称および/または値に対する参照を送信するとき、TOCは、関連するノードをリターンする。
TOCアンカー:アンカーを用いて文書内のヒエラルキーを反映させることができる。
(インデクシング)
メタデータプロセシングのための準備として、文書を、インデックスファイルの作成により正常にインデクシングさせる。そのようなインデックスファイルは、トークン化、ストップ、ステミング、大文字使用の除去、および逆返還(inversion)によって従来の様式で誘導させる。米国特許第6,389, 412号を参照のこと。メタデータ抽出に対するインデクシングプロセスの関係は関心の対象とされ得る。インデクシングは、意味情報のいくつかの喪失を生じることから、インデクシングは、ある文書コレクションについては所望されないかもしれない。他のコレクションにおいて、インデクシングは受容可能であるが、抽出されるべき情報が、インデクシングにおいてその全体または部分が喪失する特徴を伴う場合インデクシング形式ではない文書に基づいてメタデータ抽出を行うことが最良である。メタデータは、インデクシングされてもよくされなくてもよい。1つの実施形態において、TOCデータは、インデクシングされず、従って、インデクシングに依存するサーチエンジンによってサーチ可能でない。しかし、ユーザーが以下に詳細に説明するように探索することは可能である。
データコレクション中の文書は、少なくとも1つのコレクションサブセットに区分され得る。このシステムは、コレクションサブセット中に少なくとも1回出現するキーワードのインデックスを維持するインデックスサービスを有し得る。ここで、インデックス中のキーワードとそのコレクションサブセット中の出現の位置との関係が存在する。
(コンポーネント実行のビュー:概説)
図4は、上記に示されたかまたは記載された高レベル機能エレメントを実行するメインコンポーネントを示すブロック図である。メインコンポーネントは、ウェブサーバー200、アプリケーションリソース(AR)サーバーコンポーネント300、および1または複数のリソースアプリケーションを備える。ウェブベースのシステムにおいて、CCRDサーバー400およびARサーバー300は、クライアントとしてリソースアプリケーションとともにサーバーとして動作する。具体的には、CCRDサーバー400は、データベース(コレクション)サーバーおよびウェブサーバー200およびARサーバー300が、それぞれウェブおよびアプリケーションのサーバーである。他のシステムコンポーネントは、オンラインビジネスシステムサービス500およびビジネスシステム600およびパブリシングAPI700である。ビジネスシステム600内には、オンライン決済およびSAPコンポーネントが存在する。
ARサーバー300コンポーネントは、CCRDSサーバー400レポジトリに存在する文書にアクセスする、ウェブベースのリソースアプリケーションを配備するために使用されるアプリケーションフレームワークを提供する。このフレームワークは、ユーザーがサブスクライブし得る新たなるソースアプリケーション(例えば、ニュースサービス、法律サービスなど)の迅速なターンアラウンドを提供する。1つの実施形態において、ARサーバーコンポーネントは、J2EEコンテナにまたがって使用され得るシリアル化可能なオブジェクトを提供する。
多数のリソースアプリケーションにわたる共有される顧客情報を提供することについて多大な利益およびシステムの能力は、共有されるARサーバーコンポーネントの最大限の使用を伴って生じるが、アプリケーションは、必ずしも、サーバー構造によって提供されるすべての機能を利用するとは限らない。図4のサーバー構造の他の利点のいくつかとしては、再利用可能性、新たなまたはアップデートされたアプリケーションの市場に対する時間の速度および新たな製品開発のためのコストの減少を挙げることができる。
一般的に、CCRDSサーバー400コンポーネントは、電子的に格納され、インデクシングされ、そしてソートされる文書の大きな集合に対するアクセスを提供する。これらの文書は、共通のコンテンツレポジトリに加えられ、そしてより簡単な検索および付加価値コンテンツを可能にするために増強される。リソースアプリケーションを通じて文書をユーザーがサーチまたは要求するとき、CCRDSサーバー400は、ARサーバー300と相互作用して効率よい様式でサーチ結果または文書を提供する。CCRDSサーバー400は、多数の道具を利用して、文書を増強する。これらの道具は、以下により詳細に記載される。
一般的に、ARサーバーコンポーネント300は、ウェブベースのリソースアプリケーションを配置するために用いられるアプリケーションフレームワークを提供する。このコンポーネントは、共通のサービスおよびツールフレームワークを実行する。このサービスおよびツールフレームワークは、CCRDSサーバー400を用いて文書を検索する各々のリソースアプリケーションについて開発時間およびコストを減少させる。従って、新規リソースアプリケーションは、ビジネス部門がテーラーメイドのインターフェースを簡単かつ迅速に作ることを可能にし、他方で、データおよびサービスの集中処理されたコアにアクセスできるようになる。さらに、ARサーバー300コンポーネントは、種々のアプリケーションにわたって顧客に関する情報を共有することを促進する。1つの実施形態において、フレームワークは、アプリケーション開発(例えば、Java(登録商標)2 Enterprise Edition(J2EE))に対するセットモデルおよび他の推奨されるガイドラインを確立する。
フレームワークは、アプリケーションプログラムインターフェース(API)を提供し、HTMLまたはXMLのような包括的マークアップ言語を生成するが、しかし、リソースアプリケーションのアプリケーション開発者は、XMLスタイルシートまたはJava(登録商標)オブジェクトが、包括的HTMLまたはXMLを、このリソースアプリケーションによって要求されるフォーマットに変換するか否かのインターフェースを提供する。共通サービスおよびツールがARサーバーコンポーネント300によって提供され、それ故、各リソースアプリケーションがこれらサービスを個々に開発する必要性をなくする。
各リソースアプリケーションは、ユーザーに、特定のマーケット中で、ドキュメントを位置決めかつ回収するための仕立てられた製品を提供するように設計された特有のアプリケーションである。上記で説明されるように、リソースアプリケーションは、ARサーバー300によって提供される特別のサービスおよびツールを利用し、CCRDSサーバー400によって管理されるドキュメントの大きな共通のコンテンツレポジトリーにアクセスする。1つ以上のリソースアプリケーションが、ARサーバー300およびCCRDSサーバー400と同時に相互作用し得、同じドキュメントをアクセスかつリクエストする;しかし、このドキュメントは、このドキュメントを送達するために用いられるリソースアプリケーションに基づく特有のルック&フィールで提供され得る。
各リソースアプリケーションは、HTML、JPEGイメージ、Java(登録商標)Server Pages(JSP)、Servlets、カスタムスタイルシートなどのようなそれ自身のインターフェースコンポーネントを有して開発されている。しかし、ユーザーと通信するためにカスタムツールおよびサービスを利用する各リソースアプリケーション15(図3)の代わりに、プロセスUser Messageは、共通のコンテンツレポジトリーに記憶されたドキュメントにアクセスし、そして情報小売取り扱いのためのすべてのその他のビジネスルールを適用し、このARサーバー300およびCCRDSサーバー400は、各リソースアプリケーションが予めプログラムされたツールおよびサービスを利用することを可能にする標準的コンポーネントを有している。例えば、ARサーバー300のSecrurityコンポーネントは、各リソースアプリケーションが、同じセキュリティ特徴を利用することを可能にし、なお各々は、アプリケーションを開発するために選択されたコンポーネントに依存して、異なるフォーマットでセキュリティ特徴を提示し得る。ARサーバー300およびCCRDSサーバー400により提供される種々のツールおよびサービス、およびこれらが種々のリソースアプリケーションとどのように相互作用するかは、以下に記載される。
ARサーバー300は、企業を横切るフェブアプリケーションを構築するための共通アーキテクチャー/インフラストラクチャーモデルを提供する。CCRDSサーバー400は、サーチ、ドキュメント送達、およびTable of Contentsのための再利用可能なバックエンドを提供する。ARサーバー300は、ウェブアプリケーションのために同じ再利用可能性を提供する。
(CCRDSサーバー)
CCRDSサーバー400は、新規ドキュメントの導入および現存するドキュメントの回収を容易にする共通コンテンツレポジトリーおよび管理システムである。CCRDSサーバー400は、ドキュメントを入力し、豊富にし、見出しおよび回収するための以下のユーティリティを含む:サーチエンジン、Table of Contents(TOC)、Doc、Utility、CCI、Load Management、Data Management、およびLogging。
(サーチエンジン)
サーチエンジンは、ドキュメントを異なる方法で位置決めするための多くのツールを提供する。例えば、サーチ(Search)、FindおよびBrowse操作が提供され得る。
このサーチ操作は、ユーザーが、User Messageに応答して、共通コンテンツレポジトリーからのクエリーを満足する適正な質問の単一または複数「ヒット」を提供する。一般に、ユーザーインターフェースは、ユーザーを勧誘してクエリー事項を特定し、そして所望のコンテンツコレクションおよび/またはコンテンツタイプをSearch操作の一部分として選択するようにする。Search操作のユーザーは、オンライン−サーチ機能性について異なる能力および理解を有し得る。所有のサーエンジ製品などで先の経験を有するユーザーも居れば、Intenetサーチエンジンで経験を有するユーザーも居る。ユーザーインターフェースは、このような経験をもつ者に親しむように設計され得る。
Searchの1つの使用は、BooleanオペレーターでのQuery Termによる情報のサーチを含む。このユーザーは、クエリー事項(単数または複数)をクエリーボックスに入れ、そしてResultリストが、この事項(単数または複数)を含むドキュメントを含むという期待を有する。ここで、ユーザーは、事項およびBooleanオペレーターでクエリーを構築することを欲する。このユーザーは、すべてのBooleanオペレーターが支持されている、すなわち、かれらが、サーチエンジンによって認識され、しかもクエリー−ストリングの条件を満足するドキュメントのみが回収されるという期待を有する。
Boolean言語サーチは、「フィールド情報」の使用を経由して拡張され得る。この技法は、ユーザーが、特定のメタデータおよびデータのコンテンツ属性をサーチしこのサーチをさらにフィルターにかけることを可能にする。代表的なフィールドは、種々のタイプのドキュメントデータ、著者、タイトル、刊行物、トピック分類などのような項目を含む。
トピックによるサーチ(そこでは、トピックスが、編集プロセスにより進んで割り当てられた特定のドキュメントをともなう)は、Booleanサーチに対するFieldedサーチの拡張を用いて達成されるが、より便利なサーチとして同じ方法でユーザーに曝されなくてもよい。フィールドはまた、コンテンツコレクションに極めて特異的である、例えば:事例に対するパーティ、ジャッジ、ドケット番号などに拡張され得る。
サーチの別の方法は、自然の言語を用いる情報に対するSearchを用いることである。ここで、ユーザーは、自然の言語の構文でクエリー項目を入力することを欲する。例えば:「保険詐欺」。Natural Langageサーチャーから戻るサーチ結果は、文構築構文を省略して、サーチの事項に関する関連性を有することが期待される。例えば、上記のサーチでは、戻る結果は、用語「保険詐欺」を含むべきである。
アラート(Alert)として知られる混合Search機能が提供され得、ここでは、ユーザーは、それらの実施の領域(単数または複数)に関連するなにかが変更されたか、新たな情報があるとき、アップデートすることを欲する。ユーザーは、定期的ベースで自動的に稼動するサーチアラートのポートフォリオをセットアップする。各アラートは、特定の規定された間隔で特定のコンテンツコレクションに対して特定のサーチを走らせるためにセットされる。各アラートは、規定されるべき特定の属性を可能にする。サーチャーには、これらの属性は、例えば、クエリー事項、コンテンツコレクション、主題の領域などを含み得る。ユーザーは、複数のアラート、および各アラートについてそれらのポートフォリオにおける頻度のストップ、スタート、削除または変更を規定することができるべきである。このアラートサービスによって見出されたドキュメントは、従来のクリッピングサービスの様式で送達され得る。
このFind操作は、ユーザーがコンテンツコレクションから単一のドキュメントを回収することを可能にする。一般に、ユーザーは、司法のような特定の分野、カテゴリーまたは領域、またはFind操作の一部分として実施領域を特定することを要求されるべきではない。Find操作のユーザーは、ドキュメントが存在するという予備知識を有し、そしてその特定のドキュメントにアクセスすることを希望する。このようなユーザーは、例えば、サイト、タイトル、関与するパーティ、またはドキュメントの共通名のようなそのドキュメントに特異的な情報を識別する。
特定の参考は、特定のドキュメントを記載するには不十分であるかもしれない。このタイプの問題は、同じドキュメントの複数テキスト、異なる言語の同じドキュメント、または特定の引用略語の異なる供給源で生じる。例えば、略号「ALR」は、AmericanとAustralianとのLegal Report刊行物の間を区別するには不十分である。このような場合、このFind操作は、この参照に適合する特定のドキュメントのすべてのバージョンを回収し、そしてユーザーが目的の特定のドキュメントを選択することを可能にする。
このFind操作は、SearchまたはBrowseとは異なる。Findは、ユーザーが単一の特定のドキュメントにアクセスすることを可能にする。Searchは、ユーザーがかれらが規定する規準のセットに適合するドキュメントについてコレクションを走査することを可能にする。Browseは、ユーザーが、かれらの必要性に適合し得るドキュメントの分類学を通じて精選する。
Findコマンドにまた含まれて、ユーザーが、ドキュメントまたはそのメタデータの1つ以上の属性を特定することによりドキュメントを回収することを可能にする、Find by Attribute操作がある。Find by Attribute操作の例は:Find by Title、Find by Parties(パーティに参加することにより調べる)、およびFind by Common Nameがある。
アプリケーションに依存して、Find操作を走らす前に、プレフィルターをセットアップすることが適切であるときがしばしばある。このようなフィルターは、ユーザーがCountryコード、Lauguage、Applicationドメイン、Applicationで規定されるコンテンツセット、Contentタイプ(法律、規則、税金、ニュース)、Practiceエリア、Jurisdiction、Classificaton区画などにより結果を制限することを可能にし得る。ユーザーは、かれらが、より広いコンテンツベース内でドキュメントを見出すことを希望する場合、このようなデフォールトフィルター属性を置き換えることができるべきである。
Find操作は、その他の操作とパイプラインされ、特有の新規操作または製品を生じる。例えば、Find操作の出力は、直接プリントに送られ得るか、またはeメールサーバーに押され、単一ドキュメントの送達を生成する。ユーザーのプロフィールは、非特有の結果の数を制限するために、複数のコレクションに対して進行するFind捜査のために、デフォールトと自動プレフィルターのセットを含んで用いられ得る。
Find操作の履行のためのデータ要求は、設計時間の間のコンテンツアプリケーションについて決定されるべきである。このアプリケーションは、Find機能性を提供するために十分な、規準化されたかつ正規の名、参照および各ドキュメントのついての情報を提供し得る。
サーチレベルでは、Findは、Search操作と類似である。一般に、Findは、履行および/またはユーザーインターフェースである。ユーザーの視点からは、Findは、Searchが操作が、条件のクエリーに適合する1つ以上の可能なドキュメントについてコンテンツコーパスを走査し、そしてそれでエンドユーザーに異なるタスクモデルを提示する間に、コンテンツコーパスから既知のドキュメントをどうにか引かなければならない。
(Table of Content(TOC)機能)
CCRDSサーバー400により提供されるTOC機能は、コンテンツのペーパーブックテーブルの電子バージョンであるが、ドキュメントへの頭だしレベルおよびドキュメントへのリンクすることの拡張/押し縮めを可能にする適切な技法で増大される。TOCは、階層のトップのルートノード、随意の中間ブランチおよびターミナルエンドのリーフノードから構成される。リーフノードは、ドキュメントまたはドキュメント内のセクションに単一にリンクしている。
Browse Table of Content(TOC)操作は、ユーザーがコレクションのコンテンツの階層図を追求することを可能にする。コレクションは、1つ以上のドキュメントから構成され得るので、対応するTOCは、複数ドキュメント、単一ドキュメント、または特定のドキュメントのサブセクションのためのTOCを提示し得る。逆に、ドキュメントの単一コレクションは、複数のTOCを有し得る。TOCは、特定のユーザータイプおよびそれが参照する特定のDOCコレクションに適合され得る。
TOCをブラウズする間、ユーザーは、かれらが見出すことを試みる特定のドキュメントの予め存在する知識を有し得:かれらは、法律および/または実施の親しみのない領域に関する指針を捜し得;またはかれらは、TOCを用いて論点または問題を補助して作成し得る。TOCによりアドレスされるコンテンツコレクションが1つのドキュメントであるとき、そのときは、関連するTOCは、ドキュメントの構造を反映し得る。ユーザーは、大きなドキュメント、例えば、Legislationを航行するためにこのタイプのTOCを必要とする。
同様に、コンテンツコレクションが、複数のドキュメント、例えば、Journal Articles、Statutes、またはフォームを含むとき、TOCは、各ドキュメントの存在を示して生成され得る。これは、ユーザーが適切なドキュメントをブラウズかつ選択し得るためにすべてのドキュメントのリストを必要とするための重要な特徴である。
TOCブロウジング機能は、リンクされた材料の航行アクセスを含む。航行には、TOC構造は、コレクションの性質およびサイズに依存して、狭く、広く、深く、または浅くあり得る。このTOCは、スクリーン上の航行を支援するために拡張する(より低いレベルを示す)か、または押し縮める(より高いレベルを示す)階層のレベルを有し得る。
ユーザーは、特異性が増加する各レベルにある、トップレベルノードから中間および末端ノードまでのリンクに従うことにより、TOCを下降する。このようなリンクは、アウトライン形態、開放または閉鎖され得るフォルダーのいずれかで明瞭に示されるか、またはその他の階層ユーザーインターフェース方法を用いる。ユーザーがこのTOCを下降するとき、「ブレッドクラム」トリイルが生成され、訪問された各レベルに戻るリンクを提供する。ユーザーは、トップレベルノードから選択すること、そして別のパスに沿って戻って移動することによるか、またはTOCをサーチすることにより、TOCを横切って航行する。
このTOCは、そのコレクション内の任意のドキュメントを見るときアクセス可能であるべきである。コレクション中の他のドキュメントに対するそのドキュメントの相対位置は、TOCによって示される。ユーザーは、このTOCを、コンテンツコレクション中の任意のドキュメントを見ると同時に航行し得;すなわち、このドキュメントは、ユーザーがさらなるコンテンツを捜してTOCを航行するとき、なお開いている。
TOCが、特定のコンテンツコレクションのために、視覚TOCを生成するようフィルターにかけることにより、視覚TOCを生成するよう混合することにより、例えば、編集により、プログラムにより構築され得る。もちろん、TOCは、従来のアプローチを用いて手動で生成され得る。TOCは、コンテンツ中に含まれるマークアップを利用することによりプログラムにより生成され得る。このような場合、このTOCは動的に作製され得、そして種々の方法で組織化され得る。一旦、TOCが生成されると、それは、異なるリソースアプリケーションによって異なる様式で用いられる得るメタデータの柔軟な本体を提供する。TOCは、リソースアプリケーションにより動的にフィルターされ得、1つ以上の完全TOCのサブセット表示を生成する。このような表示は、ドキュメントまたはコレクションのTOCのより大きなコンテンツ内の特定のドキュメントのサブセクションを示す稼動ヘッダーおよびフッターを生成するために用いられ得る。フィルターされた表示は、トピックの、司法の、管理の、または一時的サブセットへの表示を制限するTOCの性質を抽出することにより生成され得る。1つ以上のTOCから抽出された複数のサブセットは、動的に抽出され得、そして組み合わされて、物理的スペースに単一ドキュメントとして存在しない仮想ドキュメントに対応する視覚TOCを生成する。
仮想TOC表示を生成するためのサブセット抽出フィルターは、すべてのレベルの全TOCに対して、または複数のコンテンツセットTOCに対して付与され得る。上記のように、これらサブセット抽出の結果は、所望の選択された部分をクリップして出す。このクリップされたセクションは、次いで、配列され得、新規な混合表示TOCを生成する。この表示TOCは、ユーザーに、同一または異なるコンテンツコレクション中の複数の参照を示す単一の仮想ドキュメントの外観を与える。
インデックスもまた提供され得る。このインデックスは、特定のXMLタグおよびコードをドキュメント内のテキストにマップし、そしてまた、ドキュメント、コレクションまたはセット内の全体のテキストを、完全にサーチ可能なツール中にマップする。
(ロード管理)
本アーキテクチャーは、ハードウェアおよびロードに応答するために共通であるその他のリソースのスケーリングを容易にする。複製されたリソースとともに、ロードを、タスクが、その他がこのようなタスクに代用可能であるとき、特定のリソースに過度に待ち行列を作らないようにバランスすることが必要である。従って、本発明は、ロード管理にビッドスタイルを採用する。これは、待ち行例を作っているタスクのさらなる処理のためにそれらの利用可能性を報告するためにアイドルまたは低ロードリソースを必要とする。このビッドモデルは、モニタリングコンポーネントによるLDAPの使用により一部履行され得る。
(ログ)
ログは、共有されたサービス/ツールによりリクエストされる事象をトラックし、そして何が実際に入ったかを基に診断を可能にする。すなわち、フロントエンドドキュメントロードおよびユーザーサーチの両方がトラックされ、リアルタイムモニタリングおよび階層エラーチェッキングを提供する。
(データ管理)
データ管理コンポーネントは、基礎的なシステム維持および最適化を提供する。
(CCI(中央制御情報))
CCIコンポーネントは、すべてのメタデータが記憶されている場所を管理し、そしてそれを各データコレクション中の形態についてそれをモニターする。取り込みの間、このCCIは、コレクションのロードセットが与えられる。ロードセットは、XMLデータが、共有ツール/サービスによってどのように処理されるべきかを規定するためのルールを含むテーブルである。詳細なインデックス規則、DOC、TOC、およびMMに対する処理規則、およびどのビルダーによりどのエレメントが処理されるかの規則を含むロードセットが存在する。ロードセットは、1つ以上のデータコレクションにより共有され得る。
(DOC)
DOCは、レンダリングコンポーネントへの送達のために、リクエスト、戻りドキュメント、改変、マークアップおよびセットアップドキュメントをとるサービスである。これは、ドキュメントフィルタリングのためのDOC回収エンジンによって提供されるファシリティーを含む。DOCはまた、完全XMLドキュメントから良好に形成された部分を識別かつ回収するために設計されたフィルタリングオプションを提供する。
(ユーティリティ)
ユーティリティサービスは、それら自身のサービスでは保証されていない多くのサービスを集めるために設計された一般的サービスである(これは、それら自身のMQ待ち行列を有することを意味する)。以下のサービスがこのUtility Service内に収容されている。
(1.ドキュメントロケーター)
このサービスは、どのコレクションが、GUIDを与えられたドキュメントをどのコレクションが含むかを位置決めするために用いられる。それは、一般に、ハイパーリンクを置き換える、および/またはそれに従うときに用いられる(これは、標的GUIDのみを含む)。
(2.結果航法)
このサービスは、サーチ結果オブジェクト内の基礎的航法のための機能を提供する。このSearch Serviceは、サーチ結果オブジェクトを生成する。このDOC Searviceは、ドキュメントのテキストを回収するために用いられる。このResult Navigation Serviceは、これら2つを、クライアントが特定のランクについてドキュメント情報(GUID)をリクエストすることを可能にすることにより結びつける。この情報は、サーチ結果オブジェクトから抽出され得、そして戻される。次いで、クライアントは、必要な情報をもち、それを用いてDOC Serviceがドキュメントテキストを回収することを誘起する。
(3.PIT Get)
クラアントは、それらの世界の表示を「凍結」するための機構といてPIT(時間点、point−in−time)値を用いる。同じPITが次の共通コンテンツレポジトリーサービスコールについて用いられ限り、この表示は一定のままである(それらは、ロードされた任意の新たなデータを見ない)。クライアントが、新たなPITをリクエストするとき、それは、リクエストの時間における時間点流れへのその表示をリセットしている。
(4.持続的オブジェクトデストロイヤー)
Persistence Service仕様で記載されるように、持続的オブジェクトの破壊は、クライアントの責任である。このPersistent Object Destryer Serviceは、クライアントが、この破壊が生じるようにし得るAPIを提供する。別個および特有のAPIは、各タイプの持続的オブジェクトを破壊するために生成される。
(持続性)
Persistence Serviceは、図4中では、ARサーバー300の一部として見られるが、それは、共通コンテンツレポジトリーおよびCCRDSサーバー400と緊密に関連している。Persistenceコンポーネントの機能は、サーチの再実行を必要とすることなく次のアクセスのためにサーチ結果を記憶することである。例えば、所定のサーチは、100の関連するドキュメントのための識別子を回収することに至り得る。1〜10のドキュメントが表示され、その一方、11〜100までが保持されている。従って、ユーザーがドキュメント50選択すると、ドキュメント50は、サーチを再び実行する必要なく、記憶された識別子にアクセスすることによりPersistenceコンポーネントから後に決定され得る。サーチコンポーネントで共通のコンテンツレポジトリーをアクセスする複数のユーザーで、このPersistenceコンポーネントは、サーチコンポーネントの負荷を容易にする。
(ウェブサーバー、ARサーバー)
ウェブサーバー200およびARサーバー300コンポーネントは、CCRDSサーバー400のドキュメントレポジトリー中にあるデータに基づく、ウェブベースアプリケーションを生成および破壊するために用いられるアプリケーションフレームワークを提供する。このフレームワークの部分として、ARサーバー300は、参加するビジネスユニットを横切る顧客に関する共有情報を促進するための高レベルのゴールを有している。共通レポジトリーは、ビジネスユニットに参加するためのユーザー情報を記憶する。これらのコンポーネントはまた、ユーザーによる複数アプリケーションのための単一のサインオンを支持する。
ARサーバー300は、異なるリソースアプリケーションと関連する複数の異なるユーザーインタフェースコンポーネントからアクセスできるようにする単一のホストプラットフォームである。このプラットフォームは、翻訳(Rendering)、ローカル化(Localization)およびアラート(アラート)サービスと同様に、若干の共通機能を提供するコンポーネントのセットを有する。プラットフォームは、また、フェイルオーバー(failover)を支持し、且つ高い有効性を支持するコンポーネントを支持するための持続性を実行する共通の標準設計を含む。加えて、再使用可能で一般的な持続するデータコンポーネントは使用可能とされる。セキュリティモデルが、顧客の単一のビュー(view)を確実にするために、認証およびアクセス制御のために提供される。
プラットフォームは、モニター、管理および展開のための共通手順を更に含む。
ARサーバー300のコンポーネントは、CCRDSサーバー400のデータ格納部から共通性を引き出す特定のユーザーインタフェースのためのアプリケーションをカスタマイズするために、ツールキットをリソースアプリケーションデベロッパーに提供する。ARサーバー300の重要なコンポーネントに関する説明は、以下に続く。
(重複の検出)
重複の検出サービスが、それが最後に見られた時からそれが修正されない限り、同じドキュメントが再び示されるのを防止するために、フィルタとして機能する。表題、ソースまたはバージョンの重要でない違いだけについては、例えば、ユーザーが質問をDOCコレクションに提出して、重複を含むドキュメントのリストを受けとるときに、重複ドキュメントの問題は起こる。これは、例えば、ニュース記事に起こり得、それは共通コンテンツレポジトリー部に記事を提供する多くの新聞において同様に報告され得る。ニュース検索から戻されるドキュメントの30%と同程度多くのものは重複ドキュメントのセットの部材であり得ることが分かっている。重複ドキュメントのセットの中で、重複と思われ得る全てのドキュメントの半分以上は、正確な重複のカテゴリに分類される。しかしながら、非常に類似しているが同一でないドキュメントを検出するための重複のよりあいまいな概念を含むことはまた面白いかも知れない。
2つのテキストストリングの比較として、アブストラクトの充分なレベルで、ドキュメント重複の検出は調査することができる。しかし、このとき、引用および候補ソースドキュメントの代わりに、1つはドキュメントおよび候補ソースドキュメントを有する。上部のn(nは比較的少ない整数である)のドキュメントidf条件(各々と関連して特長およびそれらの位置を含む)が、比較のために、ドキュメントの「指紋」を提供するのに十分であると決定された。ここで、idfは、「逆のドキュメント頻度」を意味し、与えられた条件が、条件の「ドキュメント頻度」の逆であり、すなわち、1が、条件を含む考慮の基で、コレクションのドキュメントの数によって分けられる。
この指紋は、重複検出システムで使われる各々のドキュメントのためのメタデータ分野として準備されなければならない。それは、ドキュメント入力時に実行されなければならない計算作業を提供する(ドキュメント収集がすでに共通コンテンツレポジトリーに収納されるために、それは後でなされ得るが)。重複を含み得る検索結果が成されるときに、実際に指紋比較をする計算負荷を広げるのを助けるために、比較作業は、クライアント側(検索要請はそれから始まる)およびサーバー側で分けられる。このように、重複の検出は、基本的に次の3つのステップを含む。
(A.メタデータ生成−バッチロードプロセスの間)
ドキュメント入力セッションの間、各々のドキュメントのために、完全なドキュメント署名(signature)がメタデータ(長さスカラー+指紋ベクトル)の形態として格納される。
ドキュメントの「長さスカラー」(表題、著者および他のヘッダ情報を含む特徴で)が、署名(背丁)の一部として格納される。
「指紋ベクトル」は、例えば、『言葉のごまかし[76]、人質[O]、顕著な[25]、非妥協性[121]、残忍性[163]、シアター(theater)[13]』(idf値によってランクした)、などの互いに関連するそれらの位置とともに、ドキュメント(ヘッダ情報を除外する)の上部n(nが4〜30、好ましくは4〜6、最も好ましくは6である)のユニークなidf条件から成る。
考慮中の条件は、ドキュメントのタイトル、および他の見出しを排除することに注意されたい(なぜなら、異なるタイトル、発行者、編集等によって、これらは明らかに変わり得るので)。
さらに、異常に高いidf(すなわちidf>0.8)は、トップ6の候補とは思われないことに注意されたい。なぜなら、これらは異常(すなわちタイプミスおよびミススペル)である傾向があるので。
指紋ベクトルは、それから、対処可能な長さのキーにハッシュされる、例えば[!X9V^4#w+z2%7t$d](16バイト)。それらが二回以上ドキュメントに記載される場合であっても、ドキュメントの最も高いidf条件は、一回ベクトルの一番上のnのidf条件に現れ得るだけである。
(B.ドキュメント比較処理−サーバー側に検索結果リストが与えられる)
サーバーに、検索結果のトップランクのドキュメントおよびそれとまだ比較される次のドキュメントが始まる。
ドキュメントの長さが比較される、仮に、比較ドキュメントが、ベースドキュメントの±M文字の範囲内である場合は(例えば、Mが0〜256、好ましくは40文字)、続ける;そうでない場合は比較が終わる(±Mが、ヘッダ材料の近くでテキストの潜在的な差異を補償するのに役立つ)。
ドキュメント指紋が次に比較される。仮に比較ドキュメントがベースドキュメントのそれと同一の指紋を有する場合、重複として重複ドキュメントにフラグを付ける、そうでない場合は、比較を終える。
重複の状況のためにフラグを付けられたドキュメントは、クライアント上の重複フォルダに効果的に移動される。
すでに重複のためにフラグが付けらない次の最高にランクが付けられたドキュメントは、以前にフラグが付けられない結果リストの下の順位の他の全てのドキュメントと比較される。
そのプロセスは、フラグが付けられないドキュメントの最後の一対が比較されるまで続く。
(C.ドキュメント翻訳−クライアント側)
(1)重複のないドキュメントは、標準の検索結果リストに記載される。
(2)重複を有する最高位のドキュメントは、標準の検索結果リストに記載される、しかし、それらの対応する重複のドキュメントが、「重複」フォルダ(例えば、スクリーンの下側の左手の隅に見られる)において見られることを示すためにマークされる。
(3)残りの重複のドキュメントは、「重複」フォルダにおいて見られる。
この重複の検出システムを実行することは、いくらかのさらなる考慮を含む。
最高にランク付けされたフラグのないドキュメントは、標準の結果リストに維持される。
idfsは、時間とともに疑いなく変化する。idfsが得られるコレクションが変化する場合、今日発生する指紋は、来年発生する指紋に対応しないかもしれない。周期的にドキュメントの指紋を再生する必要性を回避するために、それから、idfsスコアを基にする大きな安定したコレクションを維持することは重要である。あるいは、一旦大きな安定したコレクションが決定されるならば、条件およびそれらの対応するidfsは、単に参照表に経済的に格納され得る。
ニュース記事のようなドキュメントにおいて、全てのnの上部idf値の条件が同じパラグラフから来ることは可能である。これは、このように乏しいクロスドキュメント範囲を表すようである。しかしながら、およそ1ページの平均の長さで、ニュース記事は長くない。全てのnの高いidf条件が、1つの比較的小さい場所で起こることが非常に低い可能性である場合であっても、これはそれらのドキュメントの範囲がいかなる形であれ減弱するということはできない。ドキュメントの他のセクションにおいて最も高いidf条件の欠如もまた検出に役に立つので、指紋範囲は完全なままである。
指紋ベクトルをハッシュ(hash)することを選択せず、その代わりに、比較されるベクトルの条件の±1、±2又は±Nの関係を許すことによって、ある程度の「不明瞭」を重複の検出プロセスに加えることができる。このように、システムを重複の検出の所望のレベルに合わせるために、2つのドキュメント間の指紋および/または長さスカラーパラメータが、規定のマルチファクターに対して測定でき、類似閾値に調整可能である。
ハッシュすることは、比較されるドキュメント署名に厳格に余分のレベルを加えることができる。なぜなら、idf値における適度の変化は、最高のnのidf条件のオーダーを変えることができ、条件自体でないからである。そのため、用語A[0]の中でハッシュ、用語B[25]の中でハッシュは、用語B[25]、用語A[0]・・・とは異なる。従って、idf算出が標準のマスターコレクションを使用して安定しない限り、より多くの比較は上記の現象のゆえに失敗し得る。
(ドキュメント翻訳コンポーネント)
ドキュメント翻訳コンポーネントは、ドキュメントをアプリケーション特殊スタイルシート(application−specific stylesheet)にマップする。各々のドキュメントは、ARサーバー標準に従って、スタイルシート参照タグで埋められる。翻訳コンポーネントは、外部入力を必要とする。これらの入力は、アプリケーション開発者のカスタムスタイルシートおよび付随するスタイルシートGUIDへのスタイルシートのマッピングを含む。入力は、ファイルシステムおよび共通のコンテンツ保管システムを使用している翻訳コンポーネントによって検索される。
ドキュメント翻訳サービスは描きおよびXSLスタイルシートを蓄える。リソースアプリケーションは、toHTML()を使用してXMLのスタイルを整える。図19は、ドキュメント翻訳がどのように最小のプレゼンテーションスタイルシートを続行するかについて模式的に示す。図20は、ドキュメント翻訳がどのようにカスタムスタイルシートによって、そして、多数のスタイルシートマップによって続行するかを図式的に示す。
(お気に入りオンラインアプリケーションの具体的なインフォメーション格納)
このサービスは、ユーザーが日常的に使用するドキュメント、コレクション、検索文字列またはセットを選択、格納およびアクセスできるようにする。このコンポーネントは、また、ユーザーが、そのユーザーのためそのドキュメントに格納される所与のドキュメントにコメントを加えることができる。格納され得る情報の他の実施例は、保存されたサーチ(Saved Searches)、ドキュメントに対する保存されたクイックリンク(Saved Quick Links)、アラートデフィニションに対する保存されたクイックリンク(Saved Quick Links)を含む。その情報は、ユーザーによって操作され得る動的な階層として格納される。特徴は、従来のウェブブラウザのお気に入り特徴と類似している。
(画像転換)
JPEGに対するTIFFの共有サービス/ツール変換の画像転換コンポーネントが撮像を表わし、又は他の画像フォーマット転換を実行する。コンポーネントはさらに、画像および支持画像操作の大きさを変更するための特徴を支える。上記は、スケーリング、回転、クロップ(cropping)、フィルターを含む。従来の画像転換コンポーネントが使用され得る。
(ローカル化)
このコンポーネントはユーザーに、個々に彼らのローカルユーザーインタフェースを修正し、カスタマイゼーション(custornization)を提供することを許容する。例えば、ユーザーインタフェースは、スペイン語に翻訳されることができ、または特定の市場のためスペイン語で開発され得る。さらに、自然言語の調査が許される範囲で、ローカル化は、英語検索エンジンの全て又は一部はローカル言語に特有の検索コンポーネントと交換されることを必要とし得る。
ローカルは、言語、地方およびこれらのバリエーションによってユーザーのために特定され得る。テキストおよび画像の両方は、ローカル化され得る。1つのプロパティはファイルし、そして、1つのディレクトリはローカルにつきセットアップされる。
(アラートAPIおよびサービス)
アラートサービスは、選ぶ顧客が質問を検索することを許容し、それは指定された間隔で動作する。検索の質問が新しい結果がを出すたびに、検索結果はエンドユーザーに送られる。アラートサービスは、電子メールおよびファクシミリ用の共有サービス/ツールドキュメント送達メカニズムを使用する。以下のコンポーネントは、アラートサービスの一部である:アラートエントリを保つためのデータベース;ユーザーインタフェースからアラートエントリを操作するためのAPI;アラートエントリを行い、結果を顧客に伝えるためのサービス。これらのコンポーネントは、各々のリソースアプリケーションが、それらの特定のアプリケーションのための同じアラートサービスを使用できるようにする。
図16に好適に示されるように、あらゆるユーザーに対する警告は、警告API1602を使用したディレクトリへのエントリーを伴って設定される。警告エントリーは、作成され、修正され、削除され、あるいはランされる。警告エントリー内において定義されるドキュメント選択データをランする頻度は、毎日、ウィークデイ、毎週、隔週、毎月に設定可能であり、あるいは保存される。警告サービス1604は、コモンコンテンツレポジトリー1606および警告データベース1608と情報交換し、続いてクリップしたドキュメントをドキュメントはデリバリーサービス1610を介してデリバリーする。ユーザーは、マルチプルDOCコレクションを利用できる。
(ドキュメントデリバリーAPIおよびサービス)
デリバリーサービスは、ユーザーにオンラインドキュメントの物理的あるいはローカルな電気的コピーの作成を可能にする。デリバリー機能は、調査処理のあらゆる場面においてアクセス可能である。ドキュメントをデリバリーするために、ユーザーは、一般に以下の情報を特定する:デリバリー内容、包含(inclusions)、省略、デリバリー先、およびフォーマット。
デリバリー内容を決定するために、リソースアプリケーションは、特定のドキュメントあるいは所産のためのデリバリー機能にアクセスするための少なくとも1つの方法を提供すると想定される。直接的指示(例えば、ページ上のボタン)あるいは間接的指示(例えば、プリントリンク)によってなされるかは、機能的には同一である。一般には、全体のドキュメントあるいは所産(artifact)がデリバリーされると想定される。大きなドキュメントに対しては、ユーザーには単にドキュメントの特定部のみがデリバリーされ得る。テーブルコンテンツのような手段が、ドキュメント部分の選択に使用できる。
何を含有しあるいは省くかの決定に際し、デリバリー操作のディフォルトモードは、全体テキスト、ならびに映像および特殊なドキュメントに伴うテーブルの全体セットを含む。ドキュメントタイプあるいは他のプロパティに応じて、追加アイテムがデリバリージョブに追加され、あるいは削除される。ユーザーに、各アイテムがドキュメントタイプに適合するかのチェックは、はずされる。
デリバリー先は、ユーザーの選択およびデリバリー先装置の有効性に基づいて決定される。例えば、デリバリー先は、添付のプリンタ(ユーザーコンピュータあるいはLANに添付されたプリンタ)、Eメールアドレス(プリントジョブに代えて、ファイルのフォーマットコピーがユーザーのEメールアドレスに送付される)、ファックス(ファイルのフォーマットコピーがユーザーのファックスアドレスに送付される)、あるいはダウンロード(ファイルのフォーマットコピーが、ユーザーによって特定されたデリバリー先のユーザーコンピュータのハードディスク上に保存される)を含み得る。ユーザーは、デフォルトとしてデリバリー先を選択するまで、デリバリー先アドレスを特定する必要はない。
デリバリー(および多様な他のオプション)のためのユーザーの選択は、リソースアプリケーションおよび共通サービス/ツールのためのデフォルトバリューを保持するファイル内に特定されている。
ドキュメントデリバリー用にサポートされたフォーマットは、HTML、RTF、PDF、PostScriptおよびテキストファイルを含む。図18Aおよび図18Bは、ドキュメントデリバリーに含まれる種々のコンポーネントの関係を示す。デリバリーされるドキュメントは、ドキュメントを表示コンポーネントに提供するデリバリーサービスによってアクセスされる格納装置に一時的に保持される。デリバリーサービスは、表示コンポーネントを有し、XMLおよびXSLtドキュメントを取り入れる。それは、これらをXSL FO、HTMLおよびテキストフォーマットにおいてデリバリーする。XSL FOプロセッサは、SMTPメールによって送信可能なHTMLおよびPDF/PostScriptドキュメントを作成する。RTFプロセッサは、RTFドキュメントをウェブ(Web)に提供する。テキストを含むHTMLドキュメントもまた、デリバリーされ得る。
(トレイルAPIおよびサービス)
トレイルサービスは、再作成可能なアプリケーションイベントの相互交流のあるヒストリを維持する。これによって、ユーザーは、ドキュメント結果を再作成するリサーチイベントを再開発する要求をすることなく、即座にドキュメントを発見することができる。すなわち、システムは、結果として生じるドキュメントのテキストではなく、共通コンテンツ保管場所および作成結果の問い合わせによって実行されるようなリサーチに関する情報を保持する。例えば、各ドキュメントはGUID(Global Universal Identifier)によって識別され、また「Best−of−the−searched−GUIDs」は、参照のために、トレイル機能によって格納される。常時ユーザーは、作成されたリソースアプリケーション、ユーザー要求のトレイルおよび修正のうちの1つに関する新しいセッションを開始する。ユーザーが以前の要求に戻る必要がある場合、トレイルコンポーネントは、サーチプロセスの間に設立されたトレイルを使用してドキュメントへの即座なアクセスを提供する。トレイルコンポーネントは、また、ユーザーにトレイルを保存あるいは以前のトレイルへのアクセスを可能にすることによって、以前のセッションからのサーチの利用をユーザーに可能にする。
トレイル機能は、トレイルデータベース1702(図17参照)に保持されたデータ構造内のユーザーによって実行された操作シーケンスを収集することにより、ユーザーに、簡易で迅速な方法によって以前のサーチを可能にする。トレイルディレクトリは、作成、削除、変更および回収作業を特定するために使用される。トレイル機能は、ユーザーにアクセスを与え、ユーザーにトレイルデータの操作を許可する。
トレイル記録はサーチセッションの間に形成され、データ構造としてリソースアプリケーション内に保持される。トレイルデータ構造は、特定のパスワードに特定さてれおり、そこでは、認証手段、その上クライアントIDによって記録される。トレイル内に記録されたイベントは、基本的に変更可能なリサーチイベント、例えば最初のドキュメント取り込み、サーチおよび引用要求に対応し得る。イベントをクリックすることにより、ユーザーはドキュメント、サーチへの戻り、あるいは引用等にリターンすることができる。
リソースアプリケーションは、ユーザーに、リサーチセッションの間、いつでもトレイル設備へのアクセス(トレイルイベント需要者1706を介して)を可能にする。同様に、トレイル設備は、ユーザーに、リサーチセッションへの離れた地点への継続的な再入力を可能にする。
アプリケーションは、トレイルワークを以下の追跡方法によって進行する。アプリケーションは、ニュートレイルを作成し、特定の情報(例えば、トレイル名、プロダクト、ユーザーID、クライアントID等)を設定する。トレイルはまた、作成データ、最終アクセクデータ、および期限切れデータを含む。追加パラメータも定義可能であり、特にプロダクトによって利用可能である。この「プロパティ」は、データベース検索ができないXMLストリングに格納される。その他、アプリケーションは、特有のトレイルキーによって、特別に先存するトレイルを得る。
プロダクトの「再作成可能イベント」(例えば、サーチ結果、ドキュメント)のために、アプリケーションはニュートレイルアイテムを作成し、それをトレイルに加える。トレイルアイテムは、アイテムタイプ(例えば、サーチ、ドキュメント)のような特別情報を格納し、またデータを作成する。特にプロダクトによって定義されかつ使用される追加パラメータは、格納可能である。これら「プロパティ」は、XMLストリングに格納され、また、プロダクト用のイベントを再作成するために使用可能である。
システムはトレイル要求をキュー(queue)に置き、バックグランドサービスがその要求を処理する。FIFO(First−In−First−Out)フォーマットが、要求を処理するために使用される。サービスは、新規要求のためのキューを継続的にモニタする。データベースエラーが発生した場合、キューはバックアップされ、トレイル情報をユーザーに対して遅延する。それは、アプリケーションの実行をスローダウンさせない。
リソースアプリケーションは、利用可能な最もアップデートなトレイル情報を調べる。アプリケーションは、需要者のためにトレイルアイテム(例えば、再作成可能なイベントへのリンクを伴うウェブページ)のリストを作成するために、トレイルAPI1708を使用する(イベントの再作成は、特別がプロダクトのために正当な請求イベントがビジネスルールに基づいて作成されあるいは回避されることを確認するアプリケーションによってコントロールされ、そのためイベントはトレイル上に再作成されないことに、留意を要する)。
アプリケーションは、ユーザーセッションが終了したとき、あるいはアプリケーションが明らかにトレイルを終了したとき、トレイルを終了する。
トレイル情報の他の使用は、ユーザーの要求および期待に適合するためのシステム改善にある。そのため、要求メッセージに応答して見出されたドキュメント用の特別なリソースアプリケーションおよび識別子の範囲内の、ユーザーサーチ処理に関する情報を保持する1つ以上のトレイルファイルを、システムが有する場合、この情報は、特別なリソースアプリケーション用の共通使用パターンを決定するトレイルファイルを処理するためのトレイル分析コンポーネントに対して、提供可能である。この分析は、検索オプションを提供するために、およびそのような使用パターンに、より適した結果を検索するために、リソースアプリケーションのパラメータ調整に導かれ得る。
ドキュメントが検索結果として存在している優先オーダーに関連する検索結果内で識別されているドキュメントをユーザーが表示しているシーケンスを含む、共通使用パターンを、その分析がもたらす場合、調製されたパラメータは、ドキュメントが検索結果として存在している優先オーダーに影響を与え得る。その分析が、検索結果内に識別されたドキュメントのユーザーレビューが複製(duplicate)として含まれる共通使用パターンをもたらす場合、調製されたパラメータは、二重の検出サービスのための類似閾値に影響を与え得る。また、トレイル分析は、そのような使用パターンを具体化し、それに関連するリソースアプリケーションに適合させるために、メタデータ内に捕らえられている共通使用パターンに導かれ得る。例えば、リソースアプリケーションの最も経験豊富なユーザーのトレイル分析が、TOCブランチの少ない利用、あるいはTOCノードからの探査のある種のパターンを示す最も実際的なTOC使用パターンを表す場合、これは、ベストの実施と見られる具体化として提供され、また経験の少ないユーザーにとっても価値あるものとされ得る。
(イベント課金/ロギングAPI) 共有されるサービス/ツールは、リソースアプリケーションの作成者に、ウェブアプリケーションからの課金記録を作成することを可能にする。課金記録は、一般的であり、リソースアプリケーション作成者に課金要求に必要なデータを獲得させる。APIはXMLに必要なデーダを提供し、しかしながら、リソースアプリケーション作成者は、一般的XMLをその課金システムに適正なフォーマットへの変換するリソースアプリケーションの提供に対する責任がある。
APIは、リソースアプリケーションの特別の名前/価値ペアを伴うイベントを作成する。課金/ロギング機能は、課金イベント情報をビジネスシステム需要者にデリバリーする。ある種のデフォルトプロパティが課金イベントのために存在する:スレッドバリュー、機械名、ファイル更新記録、およびイベントGUID(イベントのためのグローバルな特有ID)。
(セキュリティサービス:セキュリティおよびアクセスコントロールAPI)
セキュリティおよびアクセスコントロールの1つの部分は、サインオンおよびサインオフを含む認証を含む。このサインオン操作はユーザーを識別し、そしてリソースアプリケーションリサーチセッションを開始する。サインオンは、ユーザー識別子(ユーザーid)およびユーザー認証子(バスワード)を必要とする。これらは、リソースアプリケーションによるか、またはユーザーにより生成され得、(特有の識別子文字列が提供される限り)エイリアスを思い出す容易さを含む。このサインオフ操作は、このセッションを閉鎖する。
アクセス制御操作は、リソースアプリケーションが使用法および/または制限アクセスをモニターすることを必要とする;ユーザーが個々またはグループを基礎にインターフェースのカスタム化を必要とする;アクセスが、コンテンツおよび/または機能レベルでモニターされなければならない;ユーザーアクセスが同じコンテンツを参照するアプリケーションタイプを横断して共有されなければならない(例えば、同じコンテンツコレクションへのウェブおよびインターネットアクセス);またはユーザーアクセスが複数のリソースアプリケーションを横切って共有されなければならないとき必要である。
本発明とともに、複数のリソースアプリケーションが、共通システムを横切ってリンクされる。従って、認証プロセスは、ユーザーが使用する権利を有する種々のリソースアプリケーションのすべてについてユーザーにアクセスを提供する。しかし、これら種々のリソースアプリケーションが、それら自身の使用法要求および請求パラメーターを有するとき、この使用法をトラックかつ請求するアプリケーションへのユーザーID/パスワードの接続および記録は、各リソースアプリケーションの責任である。換言すれば、共通のユーザープロフィールが生成されかつ利用される。図13は、ユーザー認可情報を基づくユーザーの置き換え、およびそれらの質問メッセージを提供するために、オンラインで共有されるセキュリティコンポーネントが、どのようにリソースアプリケーション1302およびセキュリティデータベース1304中に記憶されたインターネットセキュリティ情報と通信するかの概略図を提供する。図13は、さらに、顧客の定義、製品、価格プラン、認可などを維持するビジネスシステム1306が、どのように、管理サービス1308を通ってセキュリティデータベースにどのようにアプリケーションセキュリティ定義をおすのかを示す。この認可サービスは、このデータベースの維持を可能にするAPIを出す。このAPIは、XMLリクエスト応答メッセージに基づく。リソースアプリケーションに特異的なセキュリティ情報は、その他のアプリケーションによって用いられ得る。
共有されたアプリケーションサービス中で履行されるセキュリティは、顧客の一致した表示を提供する。共有されたアプリケーションサービスSecurity Model中にユーザー実体(User entity)を生成することにより、顧客は、各サイトの証明書の特異的セットを思い出す必要性なくして参加サイト(またはリソースアプリケーション)間を容易に移動し得る。これは、ユーザーが、すべての参加サイトについて、唯一のサインオンIDおよびパスワードを必要とし、しかもユーザーの保証書が1つの安全な場所に記憶されることを意味する。
従って、ユーザーを認証する共通サイト共有セキュリティは、それら自身の認証システムを構築、購買、ホストおよび維持しなければならないことはないことによって、時間およびお金を節約する。開発者は、それら自身のサイトの特徴および機能性に集中し得る。
セキュリティは、ユーザーの基礎的プロフィールを支持する。言語優先およびファーストネームおよび名字のような情報は、アカウント生成時間で集まり得る。セキュリティモデル内のユーザーは、アカウントが生成されるとき、User Guid(グローバル汎用識別子)を割り当てられる。このユーザーを識別するために用いられるのはこの識別である。
このセキュリティサービスは、種々のセキュリティタスクを実施する。このタスクは:現存するセキュリティユーザーを認証すること;リソースアプリケーションが認証を実施することを可能にすること;現存するセキュリティユーザーをアップデートすること;新たなセキュリティユーザーをセキュリティデータベースに追加すること;セキュリティユーザーを特定の特徴へのアクセスを認可するためにグループと関連付けるか、関連を解くことを含む。その他のセキュリティ特徴は、容積または価格限界をたどること、受給限界のタイミングをとること、エクスポート制御を含む。
図14は、用いられるセキュリティパラダイムを概略的に示す。セキュリティは、ユーザー1402、ユーザーグループ1404、およびユーザーのための認可1406を含む。単一のユーザー定義がすべてのリソースアプリケーションについて用いられ得る。従って、1つのユーザーIDおよびパスワードが、ユーザーが任意のリソースアプリケーションからのドキュメントをアクセスすることを可能にするために用いられ得る。各ユーザーは、一旦性格なIDおよびパスワードが入力されると、利用可能になる特有の許可を認可される。ユーザーIDおよびパスワードが、Security APIを用いてセットアップおよび変更され得る。各認可は、コレクションセットのような特徴1408をリソース1410に関連付ける。
ユーザーはユーザーグループに属し得る。ユーザーグループは、ユーザーのクラスを表示し得る。グループ中のすべてのユーザーは、同じ許可で認可される。ここで再び、ユーザーグループが一旦記載され得、そして次に、すべてのリソースアプリケーションによって用いられる。
図15は、1つの実施形態についてのセキュリティモデルのコンポーネントおよびそれらの関係を示す。このモデルをセットアップするために、最初に、アプリケーション特異的実体のための名前識別子を規定するドメイン1502をセットアップすることが必要である。これは、アプリケーションを横切る二重の名前、例えば、Fiji:サーチを可能する。Ownerm1504は、次いで、管理者にユーザーIDおよびパスワードを定義する。次に、ユーザー1506が規定される。ユーザーID、パスワードおよびその他のユーザープロフィール情報が割り当てられる。このユーザーGUIDは、この定義の基礎にある。
定義されたユーザーがグループの一部である場合、グループユーザーエンティティ1508は、ユーザーのクラスを表すグループ1510へユーザーを追加するために使用される。グループの定義は、一度定義され、あるいは多数のユーザーに割り当てられる許可が認可される際の管理を簡易化する。グループは序列という言葉によって定義され得る。親グループは、1つ以上の子グループを有し得る。子グループは、その親グループから許可を受ける。
フィーチャー1512は、セパレート制御あるいは価格設定(例えば、ドキュメント引用、クリッピング)を要求し得るリソースアプリケーション機能として定義される。セキュリティモデルを介して、ユーザーは、特別のコンテンツあるいは機能へアクセスするフィーチャーの使用を許可され、あるいは拒否され得る。コンテンツリソース1514は、セパレート制御あるいは価格設定(例えば、Fijiニュース、Fiji事情)を要求するコンテンツの定義されたサブセットを表す。セキュリティモデルのために定義されたコモンリソースタイプは、DOCコレクションあるいはコレクションセットである。
また、アクセスコントロールオブジェクト1516は、セキュリティモデル内において定義可能である。アクセスコントロールは、フィーチャー(例えば、サーチ)を介してのコンテンツリソース(例えば、ワールドニュース)へのアクセス許可を許可あるいは拒否する。そのようなアクセスコントロールは、グループあるいは個々に割り当てられ得る。
申し込みが定義されたとき、ユーザー、グループユーザー、グループ、アクセスコントロール、フィーチャー、およびセキュリティモデルのリソース要素は、互いにリンクされる。
(マルチティアー環境)
リソースアプリケーションは、ドキュメントを引き出すために特有のプロダクトを作成するために、ARサーバー300およびCCRDSサーバー400のコンポーネントを利用する。
図5は、リソースアプリケーションおよびそのインフラストラクチャーを形成する、クライアントティアー、サーバーティアー、およびデータサーバーティアー構造のコンポーネントを示す。クライアント側を表すために1つのユーザーが使用されるが、多数の異なり分散されたクライアントユーザーインターフェースがシステムにアクセスする。クライアントユーザーインターフェースは、オンラインデリバリー環境によって提供されるウェブサーバーをアクセスする。オンラインデリバリー環境は、同様に適正なアプリケーションサーバーおよび特別のユーザーインターフェースに基づくプロトコルを提供する。検索が実行されるとき、共有されるサービスサーバー、ディレクトリサーバーおよびアプリケーションサーバーは、ドキュメントを引き出すためのデータベースへのアクセスを得るために、データティアーと情報交換する。
(作成環境)
図7は、本発明に従うリソースアプリケーションのための作成環境を示す。プロセスは、希望プロダクトのフィーチャー、環境サイズ、期待サービスレベル、およびクラスタリングを定義する質問事項によって開始する。作成はまた、実行のための種々のロギング、デバッグ、およびビジネスレポートを含む。設計のスケーラビリティはキャパシティ計画と共に考慮される。管理変更、発行された管理、拡大、および議論フォーラムのためのプロシージャーと同様に、構築および作成のためのツールおよびプロシージャーが、プロセスの作成のために必要である。コンポーネントが作成されるとき、復帰(regression)をテストするユニットおよびストレステストの実行が必要である。また、警告、デリバリー、およびトレイル機能の管理のための種々のツールが作成において使用される。最後に、リソースアプリケーション作成プロセスは、オペレーションシステム、ウェブサーバー、アプリケーションサーバーおよびデータベースのアップグレイドをアドレスしなければならない。
先行作成サービスおよびツールがともに使用され、モノタリングが種々のウェブサーバー、アプリケーションサーバー、共有されるサービス/ツールおよびデータベースサーバーのために使用される。加えて、作成プロセスは、共通コンテンツの保管場所のパーツである、オンラインビジネスサービス、ビジネスサービス、共通コンテンツサービスおよび出版コンポーネントを、必然的に求める。
本発明は好ましい実施形態を参照して記載されたが、本発明の真意と範囲から逸脱することなく、様々な変更が形態および詳細においてなされ得ることは、当業者にとって認められ得る。

Claims (1)

  1. 本願明細書に記載のシステム。
JP2010124419A 2002-11-07 2010-05-31 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム Expired - Fee Related JP5033221B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/289,782 US7085755B2 (en) 2002-11-07 2002-11-07 Electronic document repository management and access system
US10/289,782 2002-11-07

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004551574A Division JP4574356B2 (ja) 2002-11-07 2003-10-27 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム

Publications (3)

Publication Number Publication Date
JP2010211828A true JP2010211828A (ja) 2010-09-24
JP2010211828A5 JP2010211828A5 (ja) 2011-07-28
JP5033221B2 JP5033221B2 (ja) 2012-09-26

Family

ID=32228932

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2004551574A Expired - Fee Related JP4574356B2 (ja) 2002-11-07 2003-10-27 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
JP2010124419A Expired - Fee Related JP5033221B2 (ja) 2002-11-07 2010-05-31 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2004551574A Expired - Fee Related JP4574356B2 (ja) 2002-11-07 2003-10-27 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム

Country Status (8)

Country Link
US (2) US7085755B2 (ja)
EP (1) EP1559034B1 (ja)
JP (2) JP4574356B2 (ja)
AR (1) AR041837A1 (ja)
AU (1) AU2003284945B2 (ja)
CA (1) CA2504794C (ja)
ES (1) ES2645565T3 (ja)
WO (1) WO2004044676A2 (ja)

Families Citing this family (297)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US7797241B2 (en) * 2000-09-13 2010-09-14 Ip.Com, Inc. Global information network product publication system
US7499948B2 (en) * 2001-04-16 2009-03-03 Bea Systems, Inc. System and method for web-based personalization and ecommerce management
US20030217333A1 (en) * 2001-04-16 2003-11-20 Greg Smith System and method for rules-based web scenarios and campaigns
US7774408B2 (en) * 2001-04-23 2010-08-10 Foundationip, Llc Methods, systems, and emails to link emails to matters and organizations
US7653631B1 (en) 2001-05-10 2010-01-26 Foundationip, Llc Method for synchronizing information in multiple case management systems
US20030167181A1 (en) * 2002-03-01 2003-09-04 Schwegman, Lundberg, Woessner & Kluth, P.A. Systems and methods for managing information disclosure statement (IDS) references
US7725560B2 (en) * 2002-05-01 2010-05-25 Bea Systems Inc. Web service-enabled portlet wizard
US8370420B1 (en) 2002-07-11 2013-02-05 Citrix Systems, Inc. Web-integrated display of locally stored content objects
US7290057B2 (en) * 2002-08-20 2007-10-30 Microsoft Corporation Media streaming of web content data
RU2316048C2 (ru) * 2002-08-23 2008-01-27 Эл Джи Электроникс Инк. Способ запроса/доставки электронного документа, основанный на расширяемой спецификации языка (xml)
US7668842B2 (en) 2002-10-16 2010-02-23 Microsoft Corporation Playlist structure for large playlists
US7085755B2 (en) * 2002-11-07 2006-08-01 Thomson Global Resources Ag Electronic document repository management and access system
US7743061B2 (en) * 2002-11-12 2010-06-22 Proximate Technologies, Llc Document search method with interactively employed distance graphics display
KR100636909B1 (ko) 2002-11-14 2006-10-19 엘지전자 주식회사 확장성 표기 언어 기반의 전자문서 버전 매김 및 버전을이용한 갱신 문서 제공 방법
ATE433169T1 (de) * 2002-12-03 2009-06-15 Research In Motion Ltd Verfahren, system und computerprogrammprodukt für die vorauswahl eines ordners für eine nachricht
US20040148278A1 (en) * 2003-01-22 2004-07-29 Amir Milo System and method for providing content warehouse
US7653930B2 (en) 2003-02-14 2010-01-26 Bea Systems, Inc. Method for role and resource policy management optimization
US8831966B2 (en) 2003-02-14 2014-09-09 Oracle International Corporation Method for delegated administration
US7591000B2 (en) 2003-02-14 2009-09-15 Oracle International Corporation System and method for hierarchical role-based entitlements
US20040167880A1 (en) * 2003-02-20 2004-08-26 Bea Systems, Inc. System and method for searching a virtual repository content
US7840614B2 (en) * 2003-02-20 2010-11-23 Bea Systems, Inc. Virtual content repository application program interface
US7293286B2 (en) * 2003-02-20 2007-11-06 Bea Systems, Inc. Federated management of content repositories
US7810036B2 (en) 2003-02-28 2010-10-05 Bea Systems, Inc. Systems and methods for personalizing a portal
JP2004326583A (ja) * 2003-04-25 2004-11-18 Toshiba Corp データ変換装置、データ交換方法およびプログラム
US7415484B1 (en) 2003-05-09 2008-08-19 Vignette Corporation Method and system for modeling of system content for businesses
WO2004104762A2 (en) * 2003-05-16 2004-12-02 Booz Allen Hamilton, Inc. Apparatus, method and computer readable medium for evaluating a network of entities and assets
US7676486B1 (en) * 2003-05-23 2010-03-09 Vignette Software Llc Method and system for migration of legacy data into a content management system
US20040243536A1 (en) * 2003-05-28 2004-12-02 Integrated Data Control, Inc. Information capturing, indexing, and authentication system
US20040243920A1 (en) * 2003-05-29 2004-12-02 Kabushiki Kaisha Toshiba Document input/output journal management system and method
US20050005237A1 (en) * 2003-07-03 2005-01-06 Rail Peter D. Method for maintaining a centralized, multidimensional master index of documents from independent repositories
US7324988B2 (en) * 2003-07-07 2008-01-29 International Business Machines Corporation Method of generating a distributed text index for parallel query processing
US7577654B2 (en) * 2003-07-25 2009-08-18 Palo Alto Research Center Incorporated Systems and methods for new event detection
US8650187B2 (en) * 2003-07-25 2014-02-11 Palo Alto Research Center Incorporated Systems and methods for linked event detection
US20050044192A1 (en) * 2003-07-28 2005-02-24 Applin John R. Web site management system with link management functionality
US7409406B2 (en) * 2003-09-08 2008-08-05 International Business Machines Corporation Uniform search system and method for selectively sharing distributed access-controlled documents
US7500178B1 (en) 2003-09-11 2009-03-03 Agis Network, Inc. Techniques for processing electronic forms
US7747644B1 (en) * 2003-09-30 2010-06-29 Thomson Healthcare Inc. Internet delivery system delivering electronic information products to a purality of users according to user authentication and type of user
US20050091194A1 (en) * 2003-10-10 2005-04-28 Jupp Peter A. List acquisition method and system
US7930757B2 (en) * 2003-10-31 2011-04-19 Adobe Systems Incorporated Offline access in a document control system
US8108672B1 (en) 2003-10-31 2012-01-31 Adobe Systems Incorporated Transparent authentication process integration
US8627489B2 (en) * 2003-10-31 2014-01-07 Adobe Systems Incorporated Distributed document version control
US8166039B1 (en) * 2003-11-17 2012-04-24 The Board Of Trustees Of The Leland Stanford Junior University System and method for encoding document ranking vectors
US20050108260A1 (en) * 2003-11-17 2005-05-19 Xerox Corporation Organizational usage document management system
US8548170B2 (en) * 2003-12-10 2013-10-01 Mcafee, Inc. Document de-registration
US8171426B2 (en) 2003-12-29 2012-05-01 International Business Machines Corporation Method for secondary selection highlighting
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US20050202391A1 (en) * 2004-01-30 2005-09-15 Allen J. V. Educational course content duplicator and manager
US7624274B1 (en) 2004-02-11 2009-11-24 AOL LLC, a Delaware Limited Company Decreasing the fragility of duplicate document detecting algorithms
US7392262B1 (en) * 2004-02-11 2008-06-24 Aol Llc Reliability of duplicate document detection algorithms
US7725475B1 (en) 2004-02-11 2010-05-25 Aol Inc. Simplifying lexicon creation in hybrid duplicate detection and inductive classifier systems
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060041484A1 (en) 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US8521772B2 (en) 2004-02-15 2013-08-27 Google Inc. Document enhancement system and method
US8799303B2 (en) 2004-02-15 2014-08-05 Google Inc. Establishing an interactive environment for rendered documents
JP3918824B2 (ja) * 2004-03-24 2007-05-23 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US20070300142A1 (en) 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8793162B2 (en) 2004-04-01 2014-07-29 Google Inc. Adding information or functionality to a rendered document via association with an electronic counterpart
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8621349B2 (en) 2004-04-01 2013-12-31 Google Inc. Publishing techniques for adding value to a rendered document
US20080313172A1 (en) 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US7774601B2 (en) 2004-04-06 2010-08-10 Bea Systems, Inc. Method for delegated administration
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US20060041558A1 (en) * 2004-04-13 2006-02-23 Mccauley Rodney System and method for content versioning
US20050251503A1 (en) * 2004-04-13 2005-11-10 Bea Systems, Inc. System and method for content and schema versioning
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US9460346B2 (en) 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US7742617B2 (en) * 2004-05-19 2010-06-22 Bentley Systems, Inc. Document genealogy
US8953908B2 (en) 2004-06-22 2015-02-10 Digimarc Corporation Metadata management and generation using perceptual features
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US8015124B2 (en) 2004-07-21 2011-09-06 Equivio Ltd Method for determining near duplicate data objects
US8261196B2 (en) * 2004-08-04 2012-09-04 International Business Machines Corporation Method for displaying usage metrics as part of search results
US7395260B2 (en) * 2004-08-04 2008-07-01 International Business Machines Corporation Method for providing graphical representations of search results in multiple related histograms
US7809695B2 (en) * 2004-08-23 2010-10-05 Thomson Reuters Global Resources Information retrieval systems with duplicate document detection and presentation functions
US8346739B1 (en) * 2004-08-27 2013-01-01 Affiliated Computer Services, Inc. Segmenting documents among multiple data repositories
US20060053169A1 (en) * 2004-09-09 2006-03-09 Straub Roland U System and method for management of data repositories
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7680758B2 (en) 2004-09-30 2010-03-16 Citrix Systems, Inc. Method and apparatus for isolating execution of software applications
US7853947B2 (en) 2004-09-30 2010-12-14 Citrix Systems, Inc. System for virtualizing access to named system objects using rule action associated with request
US8095940B2 (en) 2005-09-19 2012-01-10 Citrix Systems, Inc. Method and system for locating and accessing resources
US8117559B2 (en) * 2004-09-30 2012-02-14 Citrix Systems, Inc. Method and apparatus for virtualizing window information
US8171479B2 (en) 2004-09-30 2012-05-01 Citrix Systems, Inc. Method and apparatus for providing an aggregate view of enumerated system resources from various isolation layers
US7644107B2 (en) 2004-09-30 2010-01-05 Microsoft Corporation System and method for batched indexing of network documents
US10748158B2 (en) 2004-10-08 2020-08-18 Refinitiv Us Organization Llc Method and system for monitoring an issue
US7752548B2 (en) * 2004-10-29 2010-07-06 Microsoft Corporation Features such as titles, transitions, and/or effects which vary according to positions
GB0425355D0 (en) * 2004-11-18 2004-12-22 Ibm Publishing documents in a publish subscribe data processing system
US7995758B1 (en) 2004-11-30 2011-08-09 Adobe Systems Incorporated Family of encryption keys
US8090736B1 (en) * 2004-12-30 2012-01-03 Google Inc. Enhancing search results using conceptual document relationships
NZ556503A (en) * 2005-01-07 2011-07-29 Thomson Reuters Glo Resources Systems, methods and software for distributed loading of databases
US7882043B2 (en) * 2005-01-07 2011-02-01 International Business Machines Corporation Method and apparatuses for facilitating spontaneous shopping collaboration
US20060190449A1 (en) * 2005-02-18 2006-08-24 Lundberg Steven W System and method for prior art cross citation
US20060190471A1 (en) * 2005-02-18 2006-08-24 Lundberg Steven W Auto-filing of watch results in IP management system
US20060190495A1 (en) * 2005-02-18 2006-08-24 Lundberg Steven W System and method for purging messages in a legal information system
DE102005011166A1 (de) * 2005-03-09 2006-09-14 Bundesdruckerei Gmbh Computersystem und Verfahren zur Signierung, Signaturverifizierung und/oder Archivierung
US20060212302A1 (en) * 2005-03-21 2006-09-21 Lundberg Steven W System and method for a user interface in an IP management system
US20060212480A1 (en) * 2005-03-21 2006-09-21 Lundberg Steven W System and method for matter clusters in an IP management system
US7853572B2 (en) * 2005-03-21 2010-12-14 Foundationip, Llc Bulk download of documents from a system for managing documents
US20060212402A1 (en) * 2005-03-21 2006-09-21 Lundberg Steven W System and method for export control of technical documents
US20060212788A1 (en) * 2005-03-21 2006-09-21 Lundberg Steven W Systems and methods for activity management using independent docket items
US20060212471A1 (en) * 2005-03-21 2006-09-21 Lundberg Steven W System and method for intellectual property information management using configurable activities
US8601397B2 (en) * 2005-03-31 2013-12-03 Barclays Capital Inc. System and method for grouping a collection of documents using document series
US7818668B2 (en) * 2005-04-19 2010-10-19 Microsoft Corporation Determining fields for presentable files
US20060271855A1 (en) * 2005-05-27 2006-11-30 Microsoft Corporation Operating system shell management of video files
US20060271384A1 (en) * 2005-05-31 2006-11-30 Microsoft Corporation Reference data aggregate service population
US7268896B2 (en) * 2005-06-04 2007-09-11 Bell Litho, Inc. Method for controlling brand integrity in a network environment
US20060291700A1 (en) * 2005-06-08 2006-12-28 Ogram Mark E Internet signature verification system
JP2006344118A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 利用状況通知システム
US8275810B2 (en) * 2005-07-05 2012-09-25 Oracle International Corporation Making and using abstract XML representations of data dictionary metadata
US8832047B2 (en) 2005-07-27 2014-09-09 Adobe Systems Incorporated Distributed document version control
US7853483B2 (en) * 2005-08-05 2010-12-14 Microsoft Coporation Medium and system for enabling content sharing among participants associated with an event
JP4717743B2 (ja) * 2005-08-23 2011-07-06 株式会社リコー 情報処理装置
US10825029B2 (en) * 2005-09-09 2020-11-03 Refinitiv Us Organization Llc Subscription apparatus and method
US20070073651A1 (en) * 2005-09-23 2007-03-29 Tomasz Imielinski System and method for responding to a user query
US7953734B2 (en) 2005-09-26 2011-05-31 Oracle International Corporation System and method for providing SPI extensions for content management system
US7818344B2 (en) 2005-09-26 2010-10-19 Bea Systems, Inc. System and method for providing nested types for content management
US7917537B2 (en) 2005-09-26 2011-03-29 Oracle International Corporation System and method for providing link property types for content management
US7752205B2 (en) 2005-09-26 2010-07-06 Bea Systems, Inc. Method and system for interacting with a virtual content repository
US20070073770A1 (en) * 2005-09-29 2007-03-29 Morris Robert P Methods, systems, and computer program products for resource-to-resource metadata association
US20070078842A1 (en) * 2005-09-30 2007-04-05 Zola Scot G System and method for responding to a user reference query
US20070083620A1 (en) * 2005-10-07 2007-04-12 Pedersen Bradley J Methods for selecting between a predetermined number of execution methods for an application program
US8131825B2 (en) 2005-10-07 2012-03-06 Citrix Systems, Inc. Method and a system for responding locally to requests for file metadata associated with files stored remotely
US7873624B2 (en) * 2005-10-21 2011-01-18 Microsoft Corporation Question answering over structured content on the web
US8521736B2 (en) * 2005-10-26 2013-08-27 Dassault Systemes Enovia Corp. Managing hierarchies of components
US7962466B2 (en) * 2006-01-23 2011-06-14 Chacha Search, Inc Automated tool for human assisted mining and capturing of precise results
US7844603B2 (en) * 2006-02-17 2010-11-30 Google Inc. Sharing user distributed search results
US8862572B2 (en) * 2006-02-17 2014-10-14 Google Inc. Sharing user distributed search results
US8122019B2 (en) * 2006-02-17 2012-02-21 Google Inc. Sharing user distributed search results
US8868540B2 (en) 2006-03-01 2014-10-21 Oracle International Corporation Method for suggesting web links and alternate terms for matching search queries
US8707451B2 (en) 2006-03-01 2014-04-22 Oracle International Corporation Search hit URL modification for secure application integration
US8214394B2 (en) 2006-03-01 2012-07-03 Oracle International Corporation Propagating user identities in a secure federated search system
US9177124B2 (en) 2006-03-01 2015-11-03 Oracle International Corporation Flexible authentication framework
US8332430B2 (en) * 2006-03-01 2012-12-11 Oracle International Corporation Secure search performance improvement
US8433712B2 (en) 2006-03-01 2013-04-30 Oracle International Corporation Link analysis for enterprise environment
US7941419B2 (en) 2006-03-01 2011-05-10 Oracle International Corporation Suggested content with attribute parameterization
US8875249B2 (en) 2006-03-01 2014-10-28 Oracle International Corporation Minimum lifespan credentials for crawling data repositories
US7599861B2 (en) 2006-03-02 2009-10-06 Convergys Customer Management Group, Inc. System and method for closed loop decisionmaking in an automated care system
US7933890B2 (en) 2006-03-31 2011-04-26 Google Inc. Propagating useful information among related web pages, such as web pages of a website
US7735010B2 (en) * 2006-04-05 2010-06-08 Lexisnexis, A Division Of Reed Elsevier Inc. Citation network viewer and method
TW200743028A (en) * 2006-05-12 2007-11-16 Benq Corp State synchronization apparatuses and methods
TWI305619B (en) * 2006-05-12 2009-01-21 Qisda Corp State synchronization systems and methods
US20070271242A1 (en) * 2006-05-19 2007-11-22 Mark Logic Corporation Point-in-time query method and system
US7809663B1 (en) 2006-05-22 2010-10-05 Convergys Cmg Utah, Inc. System and method for supporting the utilization of machine language
US8379830B1 (en) 2006-05-22 2013-02-19 Convergys Customer Management Delaware Llc System and method for automated customer service with contingent live interaction
US20080033913A1 (en) * 2006-05-26 2008-02-07 Winburn Michael L Techniques for Preventing Insider Theft of Electronic Documents
TWI320534B (en) * 2006-06-23 2010-02-11 Qisda Corp State synchronization systems and methods
US20080016022A1 (en) * 2006-07-14 2008-01-17 Christopher Holt Systems and methods for providing information about patent examiners
US20080021900A1 (en) * 2006-07-14 2008-01-24 Ficus Enterprises, Llc Examiner information system
US8024308B2 (en) * 2006-08-07 2011-09-20 Chacha Search, Inc Electronic previous search results log
US7890885B2 (en) * 2006-08-21 2011-02-15 International Business Machines Corporation Content navigational shortcuts for portal environments
JP2008059063A (ja) * 2006-08-29 2008-03-13 Fujitsu Ltd 情報管理プログラム
AR062635A1 (es) * 2006-09-01 2008-11-19 Thomson Global Resources Sistema, metodos, software e interfases para dar formato a citas de legislacion
EP2067119A2 (en) 2006-09-08 2009-06-10 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US8244694B2 (en) * 2006-09-12 2012-08-14 International Business Machines Corporation Dynamic schema assembly to accommodate application-specific metadata
US7953713B2 (en) * 2006-09-14 2011-05-31 International Business Machines Corporation System and method for representing and using tagged data in a management system
US8655916B2 (en) * 2006-09-22 2014-02-18 Yahoo! Inc. System and method for creating user profiles
US8463852B2 (en) 2006-10-06 2013-06-11 Oracle International Corporation Groupware portlets for integrating a portal with groupware systems
US20080177878A1 (en) * 2007-01-22 2008-07-24 Jeffrey Scott Pierce Multi-device communication method and system
US8700675B2 (en) * 2007-02-19 2014-04-15 Sony Corporation Contents space forming apparatus, method of the same, computer, program, and storage media
US20080222141A1 (en) * 2007-03-07 2008-09-11 Altep, Inc. Method and System for Document Searching
US7953724B2 (en) * 2007-05-02 2011-05-31 Thomson Reuters (Scientific) Inc. Method and system for disambiguating informational objects
US9183290B2 (en) * 2007-05-02 2015-11-10 Thomas Reuters Global Resources Method and system for disambiguating informational objects
US7996392B2 (en) 2007-06-27 2011-08-09 Oracle International Corporation Changing ranking algorithms based on customer settings
US8316007B2 (en) 2007-06-28 2012-11-20 Oracle International Corporation Automatically finding acronyms and synonyms in a corpus
US7991790B2 (en) 2007-07-20 2011-08-02 Salesforce.Com, Inc. System and method for storing documents accessed by multiple users in an on-demand service
US8112715B2 (en) * 2007-07-31 2012-02-07 International Business Machines Corporation Content management system that renders a document to a user based on a usage profile that indicates previous activity in accessing the document
US20090043767A1 (en) * 2007-08-07 2009-02-12 Ashutosh Joshi Approach For Application-Specific Duplicate Detection
US20090089315A1 (en) * 2007-09-28 2009-04-02 Tractmanager, Inc. System and method for associating metadata with electronic documents
WO2009049053A1 (en) * 2007-10-09 2009-04-16 Firstpaper Llc Systems, methods and apparatus for content distribution
WO2009049061A1 (en) * 2007-10-09 2009-04-16 Firstpaper Llc Methods, apparatus, and systems for providing local and online data services
NO20075351A (no) * 2007-10-18 2009-02-09 Fast Search & Transfer Asa Fremgangsmåte for å begrense aksess til søkeresultater og søkemotor som støtter fremgangsmåten
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US8171483B2 (en) 2007-10-20 2012-05-01 Citrix Systems, Inc. Method and system for communicating between isolation environments
US20090150399A1 (en) * 2007-12-06 2009-06-11 Patel Paritosh D Method of Improving Remote Desktop Performance
KR100976722B1 (ko) 2007-12-18 2010-08-18 한국과학기술정보연구원 사용자 맞춤형 연구 정보 제공 방법 및 시스템
US20090164568A1 (en) * 2007-12-20 2009-06-25 Electronics And Telecommunications Research Institute Method for integrating management of posted articles and terminal for the same
US7778992B2 (en) * 2008-01-31 2010-08-17 International Business Machines Corporation Computing resource selection method and system
US7856448B2 (en) * 2008-02-14 2010-12-21 International Business Machines Corporation Access control decision method and system
US20090216734A1 (en) * 2008-02-21 2009-08-27 Microsoft Corporation Search based on document associations
US20120137202A1 (en) * 2008-02-28 2012-05-31 Theodor Holm Nelson System for exploring connections between data pages
US20090222717A1 (en) * 2008-02-28 2009-09-03 Theodor Holm Nelson System for exploring connections between data pages
US20090228427A1 (en) * 2008-03-06 2009-09-10 Microsoft Corporation Managing document work sets
US20090235267A1 (en) * 2008-03-13 2009-09-17 International Business Machines Corporation Consolidated display of resource performance trends
EP2263161A4 (en) * 2008-03-31 2016-07-27 Thomson Reuters Glo Resources SYSTEMS AND METHODS FOR TABLES OF MATERIALS
US20090254631A1 (en) * 2008-04-08 2009-10-08 Microsoft Corporation Defining clippable sections of a network document and saving corresponding content
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8244733B2 (en) * 2008-05-05 2012-08-14 University Of Massachusetts Adaptive hybrid reasoning decision support system
US8463770B1 (en) * 2008-07-09 2013-06-11 Amazon Technologies, Inc. System and method for conditioning search results
US8332359B2 (en) * 2008-07-28 2012-12-11 International Business Machines Corporation Extended system for accessing electronic documents with revision history in non-compatible repositories
WO2010013140A1 (en) * 2008-08-01 2010-02-04 Eamon Mason System and method for building multiple online legal research applications
US9253154B2 (en) 2008-08-12 2016-02-02 Mcafee, Inc. Configuration management for a capture/registration system
US20100082573A1 (en) * 2008-09-23 2010-04-01 Microsoft Corporation Deep-content indexing and consolidation
US8655858B1 (en) * 2008-11-13 2014-02-18 Amazon Technologies, Inc. Digital content reconstruction and distribution
EP2399385B1 (en) 2009-02-18 2019-11-06 Google LLC Automatically capturing information, such as capturing information using a document-aware device
US8473442B1 (en) 2009-02-25 2013-06-25 Mcafee, Inc. System and method for intelligent state management
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
WO2010105246A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Accessing resources based on capturing information from a rendered document
US8447722B1 (en) 2009-03-25 2013-05-21 Mcafee, Inc. System and method for data mining and security policy management
US20100268784A1 (en) * 2009-04-17 2010-10-21 Marc Henness Data synchronization system and method
WO2010129487A1 (en) 2009-05-02 2010-11-11 Citrix Systems, Inc. Methods and systems for providing a consistent profile to overlapping user sessions
US8090797B2 (en) 2009-05-02 2012-01-03 Citrix Systems, Inc. Methods and systems for launching applications into existing isolation environments
CN101887444B (zh) 2009-05-15 2012-12-19 国际商业机器公司 用于网页的导航方法和系统
IT1394765B1 (it) * 2009-07-08 2012-07-13 Onering S R L Dispositivo di raccolta e di gestione di documenti, e di controllo della fruizione di tali documenti, e metodo d'impiego di tale dispositivo
US9245007B2 (en) * 2009-07-29 2016-01-26 International Business Machines Corporation Dynamically detecting near-duplicate documents
CA2776973A1 (en) 2009-10-05 2011-04-14 Callspace, Inc. Contextualized telephony message management
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US20110225074A1 (en) * 2010-03-12 2011-09-15 Microsoft Corporation System and method for providing information as a service via web services
US20110246493A1 (en) * 2010-03-31 2011-10-06 Walker Sean M Systems, methods and interfaces for analyzing electronic files
US10289735B2 (en) * 2010-04-27 2019-05-14 Microsoft Technology Licensing, Llc Establishing search results and deeplinks using trails
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US20110296325A1 (en) * 2010-06-01 2011-12-01 Sony Corporation Method and apparatus for user interface display
US11016938B2 (en) 2010-09-01 2021-05-25 Apple Inc. Consolidating information relating to duplicate images
US8774561B2 (en) 2010-09-01 2014-07-08 Apple Inc. Consolidating information relating to duplicate images
US9262390B2 (en) * 2010-09-02 2016-02-16 Lexis Nexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents
US8527556B2 (en) * 2010-09-27 2013-09-03 Business Objects Software Limited Systems and methods to update a content store associated with a search index
FR2965952B1 (fr) * 2010-10-06 2013-06-21 Commissariat Energie Atomique Procede de mise a jour d'un index inverse et serveur mettant en oeuvre ce procede
US8806615B2 (en) 2010-11-04 2014-08-12 Mcafee, Inc. System and method for protecting specified data combinations
US9824091B2 (en) 2010-12-03 2017-11-21 Microsoft Technology Licensing, Llc File system backup using change journal
US8620894B2 (en) * 2010-12-21 2013-12-31 Microsoft Corporation Searching files
US20120191502A1 (en) 2011-01-20 2012-07-26 John Nicholas Gross System & Method For Analyzing & Predicting Behavior Of An Organization & Personnel
US20120194502A1 (en) * 2011-02-01 2012-08-02 Rockwell Automation Technologies, Inc. Searchable catalog for externally defined graphic element (edge) definitions
WO2012117433A1 (en) * 2011-02-28 2012-09-07 Hitachi, Ltd. Information apparatus
US9366448B2 (en) 2011-06-20 2016-06-14 Honeywell International Inc. Method and apparatus for configuring a filter change notification of an HVAC controller
US9229818B2 (en) 2011-07-20 2016-01-05 Microsoft Technology Licensing, Llc Adaptive retention for backup data
US8935265B2 (en) * 2011-08-30 2015-01-13 Abbyy Development Llc Document journaling
US8892223B2 (en) 2011-09-07 2014-11-18 Honeywell International Inc. HVAC controller including user interaction log
US20130124193A1 (en) * 2011-11-15 2013-05-16 Business Objects Software Limited System and Method Implementing a Text Analysis Service
US8902071B2 (en) 2011-12-14 2014-12-02 Honeywell International Inc. HVAC controller with HVAC system fault detection
US9002523B2 (en) 2011-12-14 2015-04-07 Honeywell International Inc. HVAC controller with diagnostic alerts
US10747243B2 (en) 2011-12-14 2020-08-18 Ademco Inc. HVAC controller with HVAC system failure detection
US9206993B2 (en) 2011-12-14 2015-12-08 Honeywell International Inc. HVAC controller with utility saver switch diagnostic feature
US10533761B2 (en) 2011-12-14 2020-01-14 Ademco Inc. HVAC controller with fault sensitivity
US20130158720A1 (en) 2011-12-15 2013-06-20 Honeywell International Inc. Hvac controller with performance log
US20130246336A1 (en) 2011-12-27 2013-09-19 Mcafee, Inc. System and method for providing data protection workflows in a network environment
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US11455350B2 (en) * 2012-02-08 2022-09-27 Thomson Reuters Enterprise Centre Gmbh System, method, and interfaces for work product management
US10139843B2 (en) 2012-02-22 2018-11-27 Honeywell International Inc. Wireless thermostatic controlled electric heating system
US9442500B2 (en) 2012-03-08 2016-09-13 Honeywell International Inc. Systems and methods for associating wireless devices of an HVAC system
US10452084B2 (en) 2012-03-14 2019-10-22 Ademco Inc. Operation of building control via remote device
US20130246376A1 (en) * 2012-03-16 2013-09-19 Infosys Limited Methods for managing data intake and devices thereof
US9488994B2 (en) 2012-03-29 2016-11-08 Honeywell International Inc. Method and system for configuring wireless sensors in an HVAC system
US9710502B2 (en) * 2012-04-03 2017-07-18 Expedox Llc Document management
US9477239B2 (en) 2012-07-26 2016-10-25 Honeywell International Inc. HVAC controller with wireless network based occupancy detection and control
US9594384B2 (en) 2012-07-26 2017-03-14 Honeywell International Inc. Method of associating an HVAC controller with an external web service
CN103167159B (zh) * 2012-09-25 2015-02-11 深圳市金立通信设备有限公司 一种手机中快速查找相同文件内容的方法
US10140198B1 (en) 2012-10-30 2018-11-27 Google Llc Networked desktop environment
US8819587B1 (en) 2012-10-30 2014-08-26 Google Inc. Methods of managing items in a shared workspace
US8898113B2 (en) * 2012-11-21 2014-11-25 International Business Machines Corporation Managing replicated data
US10372808B1 (en) 2012-12-12 2019-08-06 Google Llc Passing functional spreadsheet data by reference
US10094585B2 (en) 2013-01-25 2018-10-09 Honeywell International Inc. Auto test for delta T diagnostics in an HVAC system
EP2775405A1 (en) * 2013-03-04 2014-09-10 Ubs Ag Preparation of CID Indexes
US9584119B2 (en) 2013-04-23 2017-02-28 Honeywell International Inc. Triac or bypass circuit and MOSFET power steal combination
US9806705B2 (en) 2013-04-23 2017-10-31 Honeywell International Inc. Active triac triggering circuit
US10811892B2 (en) 2013-06-28 2020-10-20 Ademco Inc. Source management for a power transformation system
US9983244B2 (en) 2013-06-28 2018-05-29 Honeywell International Inc. Power transformation system with characterization
US11054448B2 (en) 2013-06-28 2021-07-06 Ademco Inc. Power transformation self characterization mode
US9857091B2 (en) 2013-11-22 2018-01-02 Honeywell International Inc. Thermostat circuitry to control power usage
US9673811B2 (en) 2013-11-22 2017-06-06 Honeywell International Inc. Low power consumption AC load switches
US20150159895A1 (en) 2013-12-11 2015-06-11 Honeywell International Inc. Building automation system with user defined lifestyle macros
US20150169677A1 (en) * 2013-12-18 2015-06-18 Avraham Noiman System for following governmental rules and rulemaking processes
US9628074B2 (en) 2014-06-19 2017-04-18 Honeywell International Inc. Bypass switch for in-line power steal
US9683749B2 (en) 2014-07-11 2017-06-20 Honeywell International Inc. Multiple heatsink cooling system for a line voltage thermostat
US9805099B2 (en) * 2014-10-30 2017-10-31 The Johns Hopkins University Apparatus and method for efficient identification of code similarity
US10579589B2 (en) * 2014-11-06 2020-03-03 Sap Se Data filtering
US9292876B1 (en) 2014-12-16 2016-03-22 Docusign, Inc. Systems and methods for employing document snapshots in transaction rooms for digital transactions
US10198620B2 (en) 2015-07-06 2019-02-05 Accenture Global Services Limited Augmented reality based component replacement and maintenance
DE102015212953B4 (de) * 2015-07-10 2024-08-22 Siemens Healthineers Ag Künstliche neuronale Netze zur Klassifizierung von medizinischen Bilddatensätzen
US20170124597A1 (en) * 2015-10-29 2017-05-04 International Business Machines Corporation Marketing offer personalization utilizating data analytics of social media data
US10592524B2 (en) * 2016-04-19 2020-03-17 Hyland Switzerland Sàrl Systems and methods for sharing context among standalone applications
US10778707B1 (en) * 2016-05-12 2020-09-15 Amazon Technologies, Inc. Outlier detection for streaming data using locality sensitive hashing
US10488062B2 (en) 2016-07-22 2019-11-26 Ademco Inc. Geofence plus schedule for a building controller
WO2018051233A1 (en) * 2016-09-14 2018-03-22 FileFacets Corp. Electronic document management using classification taxonomy
US10536460B2 (en) * 2017-01-20 2020-01-14 International Business Machines Corporation Sharing of anonymous data between connected devices over the internet
US10268688B2 (en) * 2017-05-03 2019-04-23 International Business Machines Corporation Corpus-scoped annotation and analysis
RU174148U1 (ru) * 2017-06-14 2017-10-04 Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской Академии Наук" Технологическая платформа интеграции информационных ресурсов системы межведомственного электронного взаимодействия
US10929384B2 (en) 2017-08-16 2021-02-23 Walmart Apollo, Llc Systems and methods for distributed data validation
US11429642B2 (en) * 2017-11-01 2022-08-30 Walmart Apollo, Llc Systems and methods for dynamic hierarchical metadata storage and retrieval
US11392772B2 (en) 2018-12-25 2022-07-19 Microsoft Technology Licensing, Llc Coding information extractor
US11269812B2 (en) 2019-05-10 2022-03-08 International Business Machines Corporation Derived relationship for collaboration documents
US12093638B2 (en) 2019-05-17 2024-09-17 Slice Legal, Inc. Conversational user interface system and method of operation
US11403455B2 (en) 2020-07-07 2022-08-02 Kudzu Software Llc Electronic form generation from electronic documents
US11341318B2 (en) * 2020-07-07 2022-05-24 Kudzu Software Llc Interactive tool for modifying an automatically generated electronic form
US20240012919A1 (en) * 2020-07-28 2024-01-11 Elementum Scm (Cayman) Ltd. Selectively granting computer system access credentials to external users and non-users
CN112040254B (zh) * 2020-08-13 2023-03-28 广州虎牙信息科技有限公司 一种风险控制方法、装置、存储介质、计算机设备
US11424936B2 (en) 2020-10-30 2022-08-23 Docusign, Inc. Post-completion action management in online document system
US11797750B2 (en) * 2022-03-24 2023-10-24 Global Graphics Software Limited Methods and systems for identifying and tagging outlined or converted text
JP2024075257A (ja) * 2022-11-22 2024-06-03 株式会社リコー 情報処理装置、情報処理システム、情報処理方法及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057154A (ja) * 1998-08-07 2000-02-25 Mitsubishi Electric Corp 構造化文書蓄積検索装置
JP2000172716A (ja) * 1998-12-03 2000-06-23 Ricoh Co Ltd 文書検索装置および文書検索方法
JP2000348061A (ja) * 1998-06-10 2000-12-15 Nippon Telegr & Teleph Corp <Ntt> 半構造化文書情報統合検索装置および半構造化文書情報抽出装置、その方法、ならびにそのプログラムを格納する記録媒体
WO2001073607A2 (en) * 2000-03-27 2001-10-04 Documentum, Inc. Method and apparatus for generating metadata for a document
JP2001282812A (ja) * 2000-03-28 2001-10-12 Sony Corp 情報処理装置および方法、並びにプログラム格納媒体
WO2001096978A2 (en) * 2000-06-10 2001-12-20 Ccr Inc. System and method for facilitating internet search by providing web document layout image

Family Cites Families (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2048039A1 (en) * 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
US5404505A (en) * 1991-11-01 1995-04-04 Finisar Corporation System for scheduling transmission of indexed and requested database tiers on demand at varying repetition rates
US5544320A (en) * 1993-01-08 1996-08-06 Konrad; Allan M. Remote information service access system based on a client-server-service model
US5414854A (en) * 1993-04-05 1995-05-09 Taligent, Inc. Object-oriental system for managing shared libraries
BR9508902A (pt) * 1994-09-08 1998-01-13 Virtex Communications Inc Método e aparelho para distribuição eletrônica de informaç o digital de multimeios
US5625818A (en) * 1994-09-30 1997-04-29 Apple Computer, Inc. System for managing local database updates published to different online information services in different formats from a central platform
WO1996015505A2 (en) * 1994-11-08 1996-05-23 Vermeer Technologies, Inc. An online service development tool with fee setting capabilities
US5793966A (en) * 1995-12-01 1998-08-11 Vermeer Technologies, Inc. Computer system and computer-implemented process for creation and maintenance of online services
US5644720A (en) * 1995-07-31 1997-07-01 West Publishing Company Interprocess communications interface for managing transaction requests
US5907836A (en) * 1995-07-31 1999-05-25 Kabushiki Kaisha Toshiba Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore
US5710887A (en) * 1995-08-29 1998-01-20 Broadvision Computer system and method for electronic commerce
WO1997015018A1 (en) * 1995-10-16 1997-04-24 Bell Communications Research, Inc. Method and system for providing uniform access to heterogeneous information
US6029175A (en) * 1995-10-26 2000-02-22 Teknowledge Corporation Automatic retrieval of changed files by a network software agent
US5799284A (en) * 1996-03-13 1998-08-25 Roy E. Bourquin Software and hardware for publishing and viewing products and services for sale
US5893109A (en) * 1996-03-15 1999-04-06 Inso Providence Corporation Generation of chunks of a long document for an electronic book system
US5815665A (en) * 1996-04-03 1998-09-29 Microsoft Corporation System and method for providing trusted brokering services over a distributed network
JPH09282330A (ja) 1996-04-19 1997-10-31 Hitachi Ltd データベース作成方法
US5802518A (en) * 1996-06-04 1998-09-01 Multex Systems, Inc. Information delivery system and method
JPH103416A (ja) * 1996-06-14 1998-01-06 Canon Inc 情報処理装置およびその方法
US5745899A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for indexing information of a database
US20030093790A1 (en) * 2000-03-28 2003-05-15 Logan James D. Audio and video program recording, editing and playback systems using metadata
US6138142A (en) * 1996-12-20 2000-10-24 Intel Corporation Method for providing customized Web information based on attributes of the requester
US5987497A (en) * 1996-12-30 1999-11-16 J.D. Edwards World Source Company System and method for managing the configuration of distributed objects
US7587323B2 (en) * 2001-12-14 2009-09-08 At&T Intellectual Property I, L.P. System and method for developing tailored content
AUPO489297A0 (en) * 1997-01-31 1997-02-27 Aunty Abha's Electronic Publishing Pty Ltd A system for electronic publishing
US5941944A (en) * 1997-03-03 1999-08-24 Microsoft Corporation Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features
US6370571B1 (en) * 1997-03-05 2002-04-09 At Home Corporation System and method for delivering high-performance online multimedia services
US6038601A (en) * 1997-07-21 2000-03-14 Tibco, Inc. Method and apparatus for storing and delivering documents on the internet
US5845278A (en) * 1997-09-12 1998-12-01 Inioseek Corporation Method for automatically selecting collections to search in full text searches
US5920860A (en) * 1997-09-15 1999-07-06 International Business Machines Corporation Method and apparatus for accessing of large object data segments from a remote database
US6061678A (en) * 1997-10-31 2000-05-09 Oracle Corporation Approach for managing access to large objects in database systems using large object indexes
US5978779A (en) * 1997-11-14 1999-11-02 Merrill Lynch, Pierce, Fenner & Smith Distributed architecture utility
US6745237B1 (en) * 1998-01-15 2004-06-01 Mci Communications Corporation Method and apparatus for managing delivery of multimedia content in a communications system
US6028605A (en) * 1998-02-03 2000-02-22 Documentum, Inc. Multi-dimensional analysis of objects by manipulating discovered semantic properties
US6076108A (en) * 1998-03-06 2000-06-13 I2 Technologies, Inc. System and method for maintaining a state for a user session using a web system having a global session server
US6298342B1 (en) 1998-03-16 2001-10-02 Microsoft Corporation Electronic database operations for perspective transformations on relational tables using pivot and unpivot columns
US6154738A (en) 1998-03-27 2000-11-28 Call; Charles Gainor Methods and apparatus for disseminating product information via the internet using universal product codes
US6185614B1 (en) 1998-05-26 2001-02-06 International Business Machines Corp. Method and system for collecting user profile information over the world-wide web in the presence of dynamic content using document comparators
US6208988B1 (en) * 1998-06-01 2001-03-27 Bigchalk.Com, Inc. Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
US6424980B1 (en) 1998-06-10 2002-07-23 Nippon Telegraph And Telephone Corporation Integrated retrieval scheme for retrieving semi-structured documents
US6638314B1 (en) * 1998-06-26 2003-10-28 Microsoft Corporation Method of web crawling utilizing crawl numbers
US6401118B1 (en) * 1998-06-30 2002-06-04 Online Monitoring Services Method and computer program product for an online monitoring search engine
US6148301A (en) * 1998-07-02 2000-11-14 First Data Corporation Information distribution system
US6304892B1 (en) * 1998-11-02 2001-10-16 Hewlett-Packard Company Management system for selective data exchanges across federated environments
US6360215B1 (en) * 1998-11-03 2002-03-19 Inktomi Corporation Method and apparatus for retrieving documents based on information other than document content
US6286000B1 (en) * 1998-12-01 2001-09-04 International Business Machines Corporation Light weight document matcher
US6449639B1 (en) 1998-12-23 2002-09-10 Doxio, Inc. Method and system for client-less viewing of scalable documents displayed using internet imaging protocol commands
US6493731B1 (en) * 1999-01-27 2002-12-10 Xerox Corporation Document management system for recording and viewing the history of document use
US6631496B1 (en) * 1999-03-22 2003-10-07 Nec Corporation System for personalizing, organizing and managing web information
US6304864B1 (en) * 1999-04-20 2001-10-16 Textwise Llc System for retrieving multimedia information from the internet using multiple evolving intelligent agents
US6631369B1 (en) * 1999-06-30 2003-10-07 Microsoft Corporation Method and system for incremental web crawling
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US6546385B1 (en) * 1999-08-13 2003-04-08 International Business Machines Corporation Method and apparatus for indexing and searching content in hardcopy documents
US7318090B1 (en) * 1999-10-20 2008-01-08 Sony Corporation Method for utilizing concurrent context switching to support isochronous processes
US6643652B2 (en) * 2000-01-14 2003-11-04 Saba Software, Inc. Method and apparatus for managing data exchange among systems in a network
JP2001273300A (ja) * 2000-03-24 2001-10-05 Maruzen Co Ltd 電子論文検索・提供サービス装置及び電子論文検索・提供サービス方法
US6516312B1 (en) * 2000-04-04 2003-02-04 International Business Machine Corporation System and method for dynamically associating keywords with domain-specific search engine queries
US7412605B2 (en) * 2000-08-28 2008-08-12 Contentguard Holdings, Inc. Method and apparatus for variable encryption of data
US20020035482A1 (en) * 2000-08-28 2002-03-21 Coble Keith A. Business to business information environment with subscriber-publisher model
US20020059566A1 (en) * 2000-08-29 2002-05-16 Delcambre Lois M. Uni-level description of computer information and transformation of computer information between representation schemes
US20020083006A1 (en) * 2000-12-14 2002-06-27 Intertainer, Inc. Systems and methods for delivering media content
US20030032409A1 (en) * 2001-03-16 2003-02-13 Hutcheson Stewart Douglas Method and system for distributing content over a wireless communications system
US20030014483A1 (en) * 2001-04-13 2003-01-16 Stevenson Daniel C. Dynamic networked content distribution
US7480860B2 (en) * 2001-04-23 2009-01-20 Versata Computer Industry Solutions, Inc. Data document generator to generate multiple documents from a common document using multiple transforms
US7185050B2 (en) * 2001-04-30 2007-02-27 Hewlett-Packard Development Company, L.P. Document management system and method using content grouping system
US7162483B2 (en) * 2001-07-16 2007-01-09 Friman Shlomo E Method and apparatus for searching multiple data element type files
EP1280070A1 (en) * 2001-07-26 2003-01-29 Hewlett-Packard Company, A Delaware Corporation Method and computer program for generating a list of items for viewing in a browser
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US7284191B2 (en) * 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US20030046182A1 (en) * 2001-08-31 2003-03-06 Hartman Thomas H. System and method for providing articles electronically
US20050021467A1 (en) * 2001-09-07 2005-01-27 Robert Franzdonk Distributed digital rights network (drn), and methods to access operate and implement the same
US7054841B1 (en) * 2001-09-27 2006-05-30 I2 Technologies Us, Inc. Document storage and classification
KR100408044B1 (ko) * 2001-11-07 2003-12-01 엘지전자 주식회사 Atm교환기의 트래픽 제어 장치 및 방법
US6515312B1 (en) 2001-12-03 2003-02-04 Windell Corporation Method for packaging organic electroluminescent device
US20030135553A1 (en) * 2002-01-11 2003-07-17 Ramesh Pendakur Content-based caching and routing of content using subscription information from downstream nodes
CA2475319A1 (en) * 2002-02-04 2003-08-14 Cataphora, Inc. A method and apparatus to visually present discussions for data mining purposes
US7321887B2 (en) * 2002-09-30 2008-01-22 Sap Aktiengesellschaft Enriching information streams with contextual content
US7346668B2 (en) * 2002-05-17 2008-03-18 Sap Aktiengesellschaft Dynamic presentation of personalized content
US8086750B2 (en) * 2002-06-17 2011-12-27 Darby & Mohaine, L.L.C. Method and system for delivering content over a network
US7085755B2 (en) 2002-11-07 2006-08-01 Thomson Global Resources Ag Electronic document repository management and access system
US20040148278A1 (en) * 2003-01-22 2004-07-29 Amir Milo System and method for providing content warehouse
US7475336B2 (en) * 2004-08-11 2009-01-06 Kabushiki Kaisha Toshiba Document information processing apparatus and document information processing program
US8166031B2 (en) * 2007-05-04 2012-04-24 Redknee Inc. System and method for providing context based services

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348061A (ja) * 1998-06-10 2000-12-15 Nippon Telegr & Teleph Corp <Ntt> 半構造化文書情報統合検索装置および半構造化文書情報抽出装置、その方法、ならびにそのプログラムを格納する記録媒体
JP2000057154A (ja) * 1998-08-07 2000-02-25 Mitsubishi Electric Corp 構造化文書蓄積検索装置
JP2000172716A (ja) * 1998-12-03 2000-06-23 Ricoh Co Ltd 文書検索装置および文書検索方法
WO2001073607A2 (en) * 2000-03-27 2001-10-04 Documentum, Inc. Method and apparatus for generating metadata for a document
JP2001282812A (ja) * 2000-03-28 2001-10-12 Sony Corp 情報処理装置および方法、並びにプログラム格納媒体
WO2001096978A2 (en) * 2000-06-10 2001-12-20 Ccr Inc. System and method for facilitating internet search by providing web document layout image

Also Published As

Publication number Publication date
WO2004044676A3 (en) 2004-12-02
JP5033221B2 (ja) 2012-09-26
AU2003284945B2 (en) 2010-05-13
EP1559034A4 (en) 2008-04-02
JP4574356B2 (ja) 2010-11-04
US7941431B2 (en) 2011-05-10
AR041837A1 (es) 2005-06-01
US20040093323A1 (en) 2004-05-13
JP2006505863A (ja) 2006-02-16
WO2004044676A2 (en) 2004-05-27
AU2003284945A1 (en) 2004-06-03
EP1559034A2 (en) 2005-08-03
ES2645565T3 (es) 2017-12-05
US7085755B2 (en) 2006-08-01
EP1559034B1 (en) 2017-08-09
CA2504794C (en) 2014-08-26
CA2504794A1 (en) 2004-05-27
US20060294077A1 (en) 2006-12-28

Similar Documents

Publication Publication Date Title
JP5033221B2 (ja) 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
US7130861B2 (en) Automated creation and delivery of database content
Heery Review of metadata formats
US8099660B1 (en) Tool for managing online content
US9858255B1 (en) Computer-implemented method and system for automated claim construction charts with context associations
JP5536851B2 (ja) 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム
US20050149538A1 (en) Systems and methods for creating and publishing relational data bases
US20060129538A1 (en) Text search quality by exploiting organizational information
US20030018607A1 (en) Method of enabling browse and search access to electronically-accessible multimedia databases
US20070198578A1 (en) Patent mapping
JP2003518664A (ja) パーソナライズされた結果セットを構成する方法およびシステム
US20060235855A1 (en) Digital library system
US7024405B2 (en) Method and apparatus for improved internet searching
US8131752B2 (en) Breaking documents
US20070244861A1 (en) Knowledge management tool
Heery et al. Metadata
EP1672544A2 (en) Improving text search quality by exploiting organizational information
Eberle Current awareness using PubMed: current Web services and possibilities for local solutions
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
US20040267775A1 (en) Method and system for searching binary files
JP2003044490A (ja) 知識分析システムおよび同システムにおける知識重複登録設定方法
Dennis Aggravating or aggregating? Providing effective access to contents of aggregator databases: a reference/collection development librarian's perspective
Bowman Development of a Technical Reports Service at the Higher Education National Software Archive in the UK
Eskicioğlu A Search Engine for Turkish with Stemming
Heery Metadata Projects Group, UKOLN The UK Office for Library and Information Networking, University of Bath

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120629

R150 Certificate of patent or registration of utility model

Ref document number: 5033221

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150706

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees