JP4754748B2 - シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム - Google Patents

シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム Download PDF

Info

Publication number
JP4754748B2
JP4754748B2 JP2001515889A JP2001515889A JP4754748B2 JP 4754748 B2 JP4754748 B2 JP 4754748B2 JP 2001515889 A JP2001515889 A JP 2001515889A JP 2001515889 A JP2001515889 A JP 2001515889A JP 4754748 B2 JP4754748 B2 JP 4754748B2
Authority
JP
Japan
Prior art keywords
symbol
master
database
identifier
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001515889A
Other languages
English (en)
Other versions
JP2003527657A5 (ja
JP2003527657A (ja
Inventor
エー. カーティス,ケビン
ウラゾフ,ユーリ
バーガノフスキー,マイケル
Original Assignee
マルテックス ドット コム,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マルテックス ドット コム,インコーポレイティド filed Critical マルテックス ドット コム,インコーポレイティド
Publication of JP2003527657A publication Critical patent/JP2003527657A/ja
Publication of JP2003527657A5 publication Critical patent/JP2003527657A5/ja
Application granted granted Critical
Publication of JP4754748B2 publication Critical patent/JP4754748B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
[発明の分野]
本発明は、電子的格納領域および情報の検索に関する。特に、本発明は、シンボリックにリンクされた情報を参照し、格納し、検索する方法およびシステムに関する。
[背景情報]
多くの形式の情報がシンボルコードを用いて毎日の日常生活において参照され記録保管(archive)されている。典型的には、シンボルコードは、コードのシンボルにより表された実世界における特定組の表明されたオブジェクト−エンティティを参照する一貫性のある便利な言語を要求するユーザ集団により使用される。しかしながら、実際、大部分のシンボルコードは、定形化されておらず、それゆえユーザはこれらのコードを調和させかつ一貫性をもって使用していない。したがって、シンボルの解釈に難がある。
【0002】
例えば、金融の世界では、金融取引は企業およびそれらの証券を参照してそれぞれが異なる組の取引(チケット)シンボルを用いる。合衆国内ではあるが、ローカルの取引はシンボル名を調和し、一般に、世界的な取引は各々、企業およびそれらの証券を識別するため特定のシンボル組およびシンボル構成を使用する。例えば、PSE(太平洋証券取引所)およびNYSE(ニューヨーク証券取引所)の両方は、IBMの証券を表明するためシンボル「IBM」を使用する。しかしながら、合衆国では、シンボル「T」はAT&Tの証券を指し、一方カナダでは「T」は企業Telosの証券を指す。英国では、シンボル「T」は他の企業の証券を参照し得る。
【0003】
Reuters,Bloomberg,Bridge等の金融情報のベンダーはまた、企業およびそれらの証券を参照するためユニークなシンボル組および構成を使用する。多くの金融情報のベンダーは、境界を定めるキャラクタにより分離された2つの部分にセグメント化された構造シンボルコードを用いる。例えば、ベンダーは、ROOTセグメントが特定の企業の証券を参照し、SOURCEセグメントが証券が取引される国または取引所を参照する、シンボル構成ROOT(境界を定めるキャラクタ)SOURCEを用いることができる。境界を定めるキャラクタは典型的には「@」または「.」である。
【0004】
多数のシンボル組が流通しているので、それが属する証券および企業を識別するためにシンボルを解釈することは困難である。例えば、単一のベンダーは、フランスにおいて取引されたIBMの証券を参照してシンボル「IBM.FR」を用い、英国において取引された同じIBMの証券を参照してシンボル「IBM.GB」を用いることができる。このどちらの場合も、シンボルIBM.FRおよびIBM.GBは両方とも同一企業IBMに関連する。しかしながら、2つのベンダーは、2つの異なる企業により発行される2つの異なる証券を参照するため同一のルートセグメントとソースセグメントを使用できる。例えば、第1のベンダーは、合衆国内で取引されたAT&T証券を参照してシンボル「T.US」を用いることができ、一方第2のベンダーは、異なる企業の証券を参照するためシンボル「T@US」を用いることができる。他方、2つの異なるベンダーが、企業の同一証券を参照するため異なるルートおよびソースシンボルを用いることができ、第1のベンダーは、英国において取引されたIBMの証券を参照するため、シンボル「IBM.UK」を用いることができ、一方、第2ベンダーは同一IBM証券を参照して、同一IBM証券を参照するシンボル「IB.EG」を用いることができる。
【0005】
特定の企業にリンクされた金融情報を参照する一貫性のあるシステムの必要性は、オンラインの金融調査が増大するに連れていっそう重要になってきている。金融ドキュメント(ドキュメント等)を格納するドキュメント貯蔵庫がインターネットのような公的ネットワークまたは私的ネットワークを介して投資家や調査人にアクセス可能である。寄与者(contributors)は、記録保管のためのドキュメント貯蔵庫に特定の企業または証券に関する調査ドキュメントを提出でき、ドキュメント貯蔵庫のクライアント(すなわち投資家または調査人)は興味ある特定の企業または証券に関するドキュメントを検索できる。
【0006】
記録保管処理において、寄与者は典型的には提出ドキュメントの主題である企業または証券を参照する入力ストリングに沿ったドキュメントを提出する。しかしながら、使用するシンボル組が多数なゆえに、ドキュメントの正確な記録保管および検索が非常に問題を起こす傾向にある。寄与者は、典型的には種々のベンダーシンボルの何れかを使用した入力ストリングを提出し、流通でシンボルを取引し、またはその寄与者に対する一意の特有なシンボルを使用する。このように、寄与者により参照される企業証券を識別することは難しい。同様に、特定の企業に関するドキュメントの検索を要するクライアントは、ベンダーシンボル、交換シンボルまたは独立の入力シンボルを含む種々の形式で入力シンボルを提出する。このことが、検索処理を複雑にする。
【0007】
証券シンボルの解釈に関する困難は、情報が正確に記録保管され検索可能な、シンボリックにリンクされた情報を参照する一貫性のある不明瞭でないシステムの一般的必要性を示している。
【0008】
発明の概要
本発明は、特有なシンボルの使用にも関わらず、シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステムを提供する。マスタシンボルデータベースは、複数のマスタシンボルを格納する。ここで、各マスタシンボルは、予め決定された構成にしたがってフォーマットされる。マスタシンボルデータベースにおける各マスタシンボルは、一意のオブジェクトを識別する親識別子にリンクされる。ユーザは、入力シンボルを供給することにより情報データベースにおけるシンボリックにリンクされた情報を記録保管または検索できる。入力シンボルは正規化され、マスタシンボルデータベースは一致するマスタシンボルを探すため検索される。一致するマスタシンボルにリンクされた親識別子は、次に情報データベース内の情報を検索または記録保管するために使用される。
【0009】
一実施形態によれば、本発明は、寄与者により提出されたドキュメントの自動記録保管およびクライアントにより要求されたドキュメントの自動検索が入力シンボルの分析に基づき設けられたコンピュータベースによるドキュメントの貯蔵庫を備えた環境下で適用される。ドキュメントの貯蔵庫は、マスタシンボルのデータベースを格納し、複数のオブジェクトまたはサブオブジェクトを参照する親識別子にリンクされる。記録保管する処理において、ドキュメント貯蔵庫は、寄与者が提出したドキュメントおよびドキュメント内において参照されたオブジェクトに属する入力シンボルを電子的に検索する。入力シンボルは、正規化され、一致するマスタシンボルを探すためマスタシンボルデータベースを検索するよう使用される。ドキュメントは、次に、一致するマスタシンボルに対応する親識別子にリンクされるように、ドキュメントデータベース内に格納される。正規化されたシンボルが、マスタシンボルデータベース内に検出されないとき、非確定のものを解決しようと試みて寄与者の履歴パターンの分析が実行される。クライアントは、入力シンボルを電子的に供給することにより、貯蔵庫に格納されたドキュメントを検索できる。入力シンボルは、正規化され、少なくとも1つのクライアントの好みのパラメータが、入力シンボルの如何なる非確定をも解決するために使用できる。正規化されたシンボルは、一致するマスタシンボルを探すためにマスタシンボルデータベースを検索するために使用される。一致するマスタシンボルにリンクされた親識別子は、次に親識別子にリンクされたドキュメントを検索するために使用される。
[詳細な説明]
本発明は、特有なシンボルの使用にもかかわらず、シンボルとしてリンクされた情報の参照、記録保管(archival)そして検索のための方法及びシステムを提供する。ここで説明される実施例は、ドキュメントを参照し、記録保管(archive)し、検索するコンピュータベースのドキュメント貯蔵庫システムに関する。一実施例によれば、ドキュメント貯蔵庫は、世界中で取引きされる企業(会社)に関するドキュメントを格納する。しかしながら、ここで説明される実施例は、単に説明のためのものであって、添付の特許請求の範囲を限定しようとするものではない。本発明は、シンボルとしてリンクされた情報を記録保管し、検索し、又は参照することを必要とする任意の環境に適用可能である。
【0010】
図1aは、本発明の一実施例による、親識別子、親識別子にリンクされた複数のマスタシンボル、1つのオブジェクト、及びそのオブジェクトに関連する複数のサブオブジェクトを示す。図1の下部には、例としてのオブジェクト130と、オブジェクト130に関係するサブオブジェクト140a〜140bを示す。また図1には、すべての可能なオブジェクトからなるオブジェクト空間150を示す。たとえば、一実施例によれば、オブジェクト空間150は、世界中で取引きされるすべての企業を含み、オブジェクト130は、特定の企業を表わし、関連サブオブジェクト(たとえば140a〜140c)は、その企業によって発行される有価証券を表現する。
【0011】
図1の上部には、オブジェクト130とサブオブジェクト140a〜140cを表わすマスタシンボルデータベースの構造を示す。特に、親識別子110は、オブジェクト130に関係し、マスタシンボル115a〜115cは、サブオブジェクト140a〜140cのそれぞれに関係する。図1aの上部と下部はおおよそ対称である。図1aに示したように、各マスタシンボルは(たとえば115a〜115c)は親識別子にリンクされている。各親識別子110は、さらにオブジェクト空間150に存在する唯一のオブジェクトに関係する。
【0012】
マスタシンボルデータベースの機能は、入力シンボルに基づく特定のオブジェクトの識別を可能とすることである。これはオブジェクト空間150の3平面の交わりによって示される。以下に詳細に説明するように、入力シンボルは正規化され、マスタシンボルデータベースが、マッチするマスタシンボルを発見するために検索される。マッチするマスタシンボルにリンクされた親識別子は、オブジェクト130を識別するために用いられる。
【0013】
図1は唯一の親識別子と3個のマスタシンボルのみを示すが、マスタシンボルデータベースは、代表的には、多くのマスタシンボルを含み、そのうちの各マスタシンボルは多くの親シンボル110の1つにリンクされる。たとえば、図1bは、マスタシンボル115a〜115cが親識別子110aにリンクされ、マスタシンボル115d〜115fが親識別子110bにリンクされ、マスタシンボル115g〜115kが親識別子110cにリンクされ、マスタシンボル115l〜115mが親識別子110dにリンクされている。このように、マスタシンボル115a〜115cは第1のオブジェクトに関係し、マスタシンボル115d〜115fは第2のオブジェクトに関係し、マスタシンボル115g〜115kは第3のオブジェクトに関係し、マスタシンボル1151〜115mは第4のオブジェクトに関係する。
【0014】
さらに一例が、図1aに示されるスキームのアプリケーションを説明する。本発明によれば、各オブジェクト130は企業を表し、各サブオブジェクト(たとえば140a〜140c)はその企業によって発行された有価証券を表す。この例によると、唯一の親識別子110は各企業に割り当てられる。特定の企業により発行された各有価証券は唯一のマスタシンボルに割り当てられ、この唯一のマスタシンボルは、その有価証券を発行する企業に割り当てられた親識別子110にリンクされる。各マスタシンボルはリンクされた親識別子110とともにマスタシンボルデータベースに格納される。
【0015】
一実施例によると、マスタシンボルデータベースに格納されるすべてのマスタシンボルは、シンボルテンプレートによって定義される所定の構造を利用する。図1cに、本発明の一実施例によるシンボルテンプレートを示す。シンボルテンプレート145は任意の数のシンボルフィールド150(1)〜150(N)から成る。各シンボルフィールド150(1)〜150(N)は情報のカテゴリーを表わし、シンボル化されたオブジェクト又はサブオブジェクトの特定の属性に対応する。このようにして、同一の所定のシンボルテンプレート145に従って組立てられるマスタシンボルデータベースに、すべてのマスタシンボルが格納される。
【0016】
特に、マスタシンボルデータベースに格納された各マスタシンボルは、シンボルテンプレート145によって定義される各シンボルフィールド150(1)〜150(N)に対応してマスタシンボルセグメントを含む。各シンボルセグメントはテキスト文字列を含む。たとえば、国属性に関係するシンボルフィールドに対して、マスタシンボルデータベースに格納されたシンボルは、米国、英国、仏国にそれぞれ属するシンボルセグメント(すなわちテキスト文字列)「US」、「GB」、「FR」を含み得る。たとえば、図1aは、3つのシンボルフィールド(図示せず)を含む、シンボルテンプレート145に従って組立てられたマスタシンボル115a〜115cを示す。各マスタシンボル115a〜115cは、シンボルテンプレートによって定義されたシンボルフィールドにそれぞれ対応して、3つのシンボルセグメント(すなわち120a1〜120c1、120a2〜120c2、120a3〜120c3)から成るという事実から、このことは明らかである。
【0017】
さらに、一例によって、マスタシンボルデータベースに格納されたシンボルの構造を形成する対応するシンボルセグメントに対する、シンボルテンプレート145の関係を説明する。一実施例に従えば、マスタシンボルデータベースに格納されたマスタシンボルは、特定のマーケットで取引される企業の有価証券をシンボライズする。この場合、図1dに示したようなシンボルテンプレート145が使用される。ルートフィールドとして言及される第1のシンボルフィールド150aは企業の有価証券を特定し、ソースフィールドして言及される第2のシンボルフィールドは150bは、その有価証券が取引された国を特定する。以上のように、この場合はマスタシンボルデータベースは、2つのシンボルセグメントを含み、2つのシンボルセグメントは、図1dに示すシンボルテンプレート145によって定義されたシンボルフィールド150aと150bのそれぞれに対応する、ルートセグメント(すなわち、企業の有価証券名に対応するASCII文字列)とソースセグメント(すなわち、その有価証券が取引される国に対応するASCII文字列)である。
【0018】
マスタシンボルデータベースに格納されたマスタシンボルは、正規化されたフォーマットで格納され、マスタデータベースを参照し検索する一貫した方法を提供する。このように、たとえばシンボルセグメント「US」は、米国に関連するマスタシンボルデータベースに格納されたすべてのマスタシンボルに対して用いられることができる。
【0019】
図1aは、マスタシンボルデータベースに格納されたマスタシンボル、サブオブジェクト140a〜140cに関連する一例を示すが、代替の実施例では、マスタシンボル140a〜140cがオブジェクト130自体に関連する。マスタシンボルデータベースの構造とシンボルを親識別子にリンクする方法は、以下により詳細に説明される。
【0020】
ドキュメント貯蔵庫のユーザは、入力シンボルに関連する情報の格納又は検索のいずれかのために、マスタシンボルデータベースに対して入力シンボルを入力してサーチすることができる。しかしながら、シンボルの使用法が特異であれば、入力シンボルは正規化され、それに関連するオブジェクト130が識別されるように変換されなければならない。図2は、本発明の一実施例による、唯一の関連オブジェクトを識別するために、入力シンボルを変換する一組のステップを示すフローチャートである。ステップ210では、ユーザから入力シンボルを受信する。ステップ20では、入力シンボルが一組の正規化ルールに従って、正規化シンボルを得るために処理される。入力シンボルの正規化の手続きは、以下により詳細に説明される。ステップ230では、正規化シンボルが既知(すなわちマスタシンボルデータベースに格納されるマスタシンボルに一致する)かどうかが判断される。もし正規化シンボルが既知であれば、正規化シンボルにリンクされた親識別子110が検索される。そのとき、ステップ250では、検索された親識別子110を用いて、情報(たとえば、電子化ドキュメント)の検索と記録保管のような適切な処理が行われる。この手順はステップ290で終わる。
【0021】
もし、正規化シンボル115が既知でなければ、すなわち、マスタシンボルデータベースに格納されるマスタシンボルと一致しない場合(ステップ230の「no」ブランチ)、ステップ260で、そのシンボルの入力者(submitter)の履歴パターンの分析を実行する。以下により詳細に説明するように、未知の入力シンボルがそのユーザより以前に使用されたかどうか、それはどのように変換されたかを判断するために、別個のデータベースをサーチすることを必要とする。あるいは、これに代えて、特定のシンボルセグメントが決定できなければ、未決定のシンボルセグメントに対して発生する頻度を決定するために、ユーザの履歴の統計的分析を実行することができる。シンボルの提案者(contributor)の履歴パターンを用いて、そのシンボルを決定できれば、シンボルは決定され(ステップ270の「yes」ブランチ)、正規化シンボル(ステップ240)にリンクされた親識別子110の検索に、フローが続く。もしそうでなければ(ステップ270の「no」ブランチ)、その手順は失敗である(ステップ280)。
【0022】
図3は、本発明の一実施例による、シンボルとしてリンクされたドキュメントの電子化された記録保管と検索を可能とするネットワークアーキテクチャを示すブロック図である。ドキュメント貯蔵庫319は、他のコンポーネントの間に、コントリビュータゲートウェイサーバ340aとクライアントゲートウェイサーバ340bを備える。サーバ340a及び340bは各々、ネットワークインタフェイス(図示せず)と同様にプログラムの命令を実行するプロセッサとメモリを有する。
【0023】
一実施例によると、クライアント305はパーソナルコンピュータ310を使用し、モデム315、POTS電話線317、インターネットサービスプロバイダ320、TIライン330d、インターネット340、TI330c、及びクライアントゲートウェイサーバ340bを経由して、ドキュメント貯蔵庫319と通信を行う。クライアント305は、所望のオブジェクト又はサブオブジェクトに関する入力シンボルを入力して、ドキュメント貯蔵庫319に格納された特定のデータ又はドキュメントをサーチすることができる。クライアントゲートウェイサーバ340bは、ドキュメント貯蔵庫319からのドキュメントのサーチ(search)及び検索(retrieval)を実行するための多くの処理(以下により詳細に説明する)を実行する。特に、クライアントゲートウェイサーバ340bは、クライアント305から入力シンボルを受信し、入力シンボルを正規化し、対応する親識別子(存在するなら)を見出すためにマスタシンボルデータベース420をサーチし、そしてその親識別子にリンクされたドキュメントをドキュメントデータベースから検索するといった多くの処理を実行する。
【0024】
クライアントゲートウェイサーバ340bはまた、GUI(グラフィカルユーザインターフェイス)を提供する処理を行う。このGUIは、特定のドキュメントについてドキュメント貯蔵庫をサーチするため、及びクライアントに検索ドキュメントを表示するために、クライアント305が入力シンボルを入力するのに便利なインタフェイスを提供する。一実施例によると、クライアントゲートウェイサーバ340bは、クライアントゲートウェイサーバ340bに接続しているクライアント(たとえば305)に対して、記憶手段(図示せず)に置かれるHTML(ハイパーテキストマークアップ言語)コンテントを提供(serve)する。特に、クライアントゲートウェイサーバ340bに格納されたHTMLページは、入力シンボルによってシンボライズされた特定のオブジェクトに関するドキュメントを求めてドキュメント貯蔵庫をサーチするために、クライアントが入力文字列を入力することを可能とする便利なユーザインタフェイスを提供する。さらに、クライアントゲートウェイサーバ340bは、クライアントによって提供される入力サーチ文字列の入力と処理を可能とする少なくとも1つのCGI(コモンゲートウェイインタフェイス)を実行することができる。
【0025】
コントリビュータ340は、TIライン330a、インターネット340、TIライン330b、及びコントリビュータゲートウェイサーバ340bを経由してドキュメント貯蔵庫319と通信する。コントリビュータサイト340で作成されるドキュメントは、TIライン330b、インターネット340、TIライン330b、及びコントリビュータゲートウェイサーバ340aを経由してドキュメント貯蔵庫319に送信される。コントリビュータゲートウェイサーバ340aは、コントリビュータからドキュメント及び入力シンボルを受信し、受信入力シンボルを正規化し、マスタシンボルデータベース420をサーチし、そして各種のコントリビュータによって入力されるドキュメントを記録保管することに関して、多くの処理(以下に詳細に説明する)を実行する。コントリビュータ340はテキストファイル、PDF(ポータブルドキュメントファイル)、マイクロソフトワードファイル等を含む多くのフォーマットで、インターネットを介して電子的にドキュメント貯蔵庫319にドキュメントを入力することができる。ドキュメント貯蔵庫319に含まれる残りのコンポーネントは、図4を参照して以下に説明される。
【0026】
図4は本発明の一実施例によるシンボルとしてリンクされたドキュメントを記録保管し検索するドキュメント貯蔵庫システムの一部のアーキテクチャを示すブロック図である。コントリビュータゲートウェイサーバ340a、クライアントゲートウェイサーバ340b、シンボルサーバ410、マスタシンボルデータベース420、リレーショナルデータベース430、コントリビュータ履歴パターンデータベース440、ドキュメントファイルデータベース450、フルテキストデータベース460、クライアントデータベース470、正規化テーブルデータベース417、及びオブジェクトデータベース415を、ドキュメント貯蔵庫319が備える。ただ1つのコントリビュータ340と1クライアント305が図4に示されているが、システムは複数のコントリビュータと複数のクライアントで機能するように設計されている。
【0027】
シンボルサーバ410は、コントリビュータゲートウェイサーバ340aとクライアントゲートウェイサーバ340bから、マスタシンボルデータベース420をサーチするようにリクエストを受けて処理する。特に、以下により詳細に説明するように、シンボルサーバ410は、コントリビュータゲートウェイサーバ340a又はクライアントゲートウェイサーバ340bのいずれかから、少なくとも1つの正規化入力シンボルを受け取り、正規化入力シンボルに一致するマスタシンボルがマスタシンボルデータベース420に発見される場合には、シンボルデータベース420から検索される対応する親識別子110を返す。
【0028】
マスタシンボルデータベース420はすべてのマスタシンボル(たとえば115a〜115c)のリストとこれらの関連親識別子110を格納している。たとえば、一実施例によると、マスタシンボルデータベース420は、世界中の企業によって発行された有価証券に関係する一組のマスタシンボルを格納する。一実施例によると、マスタシンボルデータベース420は、世界中で取引される企業のすべての既知の有価証券を参照する一組のソーステーブルから定期的に作成される。マスタシンボルデータベース420の作成は、以下により詳細に説明される。
【0029】
図5aは、本発明の一実施例による、マスタシンボルデータベースにおけるマスタシンボルデータの格納のためのデータ構造を示す。特に、図5aは、シンボルセグメント(たとえば120a1〜120c3)の任意の数(N)に従って、組立てられるマスタシンボル(たとえば115a〜115c)とともに親識別子を格納しリンクするためのデータ構造である。マスタシンボルデータベース420は、データベース420において各マスタシンボルに対して1レコード505格納する。各レコード505は親識別子フィールド510とシンボルセグメントフィールド520(1)〜520(N)とからなる。シンボルセグメントフィールドの数は、マスタシンボルデータベース420に格納されるマスタシンボルの構造を定義するシンボルテンプレート145に依存して、変化する(すなわちシンボルセグメントの数は各シンボルを含むシンボルフィールドの数に正確に対応する)。親識別子フィールド510とシンボルセグメントフィールド520(1)〜520(N)は、ハードディスクドライブのような記憶装置上の情報を格納するための1以上のメモリ位置を含む。たとえば、一実施例によれば、親識別子フィールド510は4バイトの情報を占有する32ビット整数値を格納する。シンボルセグメントフィールド520(1)〜520(N)は、所定の長さのASCIIテキスト文字列を格納する。
【0030】
たとえば、図5bは、本発明の一実施例による世界中で取引きされる企業の有価証券シンボルを格納する環境(context)下で適用される5aに示すデータ構造の特定の例を示す。この実施例によると、3フィールド510、520aそして520bを含むレコード505は、各有価証券シンボルのために作成される。フィールド520aと520bは、それぞれ企業の有価証券の名前に対応するルートシンボルセグメントとその有価証券が取引きされる国に対応するソースシンボルセグメントとを格納する。フィールド510はマスタ有価証券シンボルと関連する親識別子、すなわちその有価証券を発行する企業に割り当てられた親識別子を格納する。マスタシンボルデータベース420は以下に詳細に説明される。
【0031】
図6は、本発明の一実施例によるドキュメントファイルデータベースにおけるドキュメントの格納のためのデータ構造を示す。ドキュメントファイルデータベース450は、データベースに格納された各ドキュメントのための1レコード610を格納する。各レコード610は、ドキュメントファイルフィールド630とドキュメント識別子フィールド620を有する。ドキュメントファイルフィールド630はドキュメントの実際のフォーマットされたドキュメントデータを格納する。これに代えて、ドキュメントファイルフィールド630は、ドキュメントデータが格納されているメモリ位置を指示するポインタを格納してもよい。ドキュメント識別子フィールド620はドキュメントファイルデータベース450に格納された各ドキュメントに割り当てられる一意的な識別コードを格納する。以下に説明するように、ドキュメント貯蔵庫319にドキュメントを受け入れると、一意的なドキュメント識別子が受け入れドキュメントに対して作成され、ドキュメント識別子フィールド620のドキュメントとともに格納される。ドキュメントは多くのファイルフォーマットの形で格納される。たとえば、ドキュメントは、PDFファイル、マイクロソフトワードファイル、テキストファイル等として格納される。
【0032】
フルテキスト・データベース460は、ドキュメントデータをテキスト形式で保存(格納)し、特定のキーワードについてドキュメントデータを検索できるようにする。ある実施例によると、コントリビュータ・ゲートウェイ・サーバ340aはプロセスを実行し、コントリビュータ(140等)から受け取ったドキュメントをフルテキスト・データベース460保存用にテキスト形式に変換する。フルテキスト・データベース460では、ドキュメント自体に含まれる特定の検索によりドキュメントの検索および取り出しが可能である。
【0033】
図7は、本発明のある実施例により、ドキュメントリポジトリに保存したドキュメントに関連する情報を保存するためのリレーショナル・データベースに用いられるデータ構造を示す。リレーショナル・データベース430は、ドキュメントファイル・データベース450とマスタ・シンボル・データベース420との間の架け橋の役割を果たす。特に、ドキュメントデータベースに保存される各ドキュメントについて、リレーショナル・データベース430は、ドキュメントで参照するオブジェクトまたはサブ・オブジェクトに対応する親ID720に対しドキュメントのドキュメントID730をクロス・リファレンスする。リレーショナル・データベース430はまた、コントリビュータから受け取ったドキュメントの特定の属性に関して追加データを保存する。
【0034】
レコード705は、ドキュメントリポジトリ319に保存された各ドキュメントについてリレーショナル・データベース430で生成される。本発明のある実施例によると、各レコードはドキュメント識別子フィールド710、親識別子フィールド720、コントリビュータIDフィールド730、マスタ・シンボル・ポインタ・フィールド740、コントリビュータ入力シンボル・フィールド750および所定数のコントリビュータ・エレメント・フィールド(図示せず)を含む。
【0035】
ドキュメント識別子フィールド710は、そのドキュメントに割り当てられた一意なドキュメント識別子を保存する。一意なドキュメント識別子は、ドキュメントリポジトリ(貯蔵庫)319でドキュメントを受けた時点で生成される。親識別子フィールド720は、ドキュメントに関連するオブジェクトに関する親識別子を保存する。普通は、親識別子フィールド720は、ドキュメントのコントリビュータが提出する入力シンボルにリンクされる親識別子を保存する。以下に詳細に述べるように、コントリビュータが提出した新ドキュメントのアーカイブ(記録保管)の一部として、コントリビュータ入力シンボルを正規化し、マスタ・シンボル・データベース中の一致するマスタ・シンボルにリンクされた親識別子をマスタ・シンボル・データベースから取り出す。この親識別子は親識別子フィールド720に保存する。例えば、ある実施例によると、財務ドキュメントのアーカイブのコンテキストでは、親識別子フィールド720は、ドキュメント識別子フィールド710に保存されたドキュメント識別子を持つドキュメントに関連する企業の識別子を保存する。
【0036】
コントリビュータIDフィールド730は、ドキュメントのコントリビュータに対応する一意なコントリビュータ識別子を保存する。マスタ・シンボル・ポインタ・フィールド740は、ドキュメントのオブジェクトに関連するマスタ・シンボル・データベース420のマスタ・シンボルへのポインタを保存する。特に、このポインタはコントリビュータの提供する正規化した入力シンボルを使ってマスタ・シンボル・データベース420を検索することによって見つけた一致するマスタ・シンボルをポイントするポインタである。コントリビュータ入力シンボル・フィールド750は、ドキュメントを提出する時(正規化前に)コントリビュータが提供した入力シンボルを保存する。
【0037】
図8は、本発明のある実施例による特定のコントリビュータの履歴シンボル利用トレンドに関連する情報を保存するためのコントリビュータ履歴パターン・データベースに用いられるデータ構造を示す。コントリビュータ履歴パターン・データベース440の目的は、コントリビュータの提供する入力シンボルの正規化を支援し、ドキュメントリポジトリ319にドキュメントを提出する時、コントリビュータが提供するあいまいな記号の分析を可能にすることである。例えば、コントリビュータは、シンボル・セグメントが1個以上失われたドキュメントと入力シンボルを提出することがある。あるいは、コントリビュータは、正規化およびマスタ・シンボル・データベース420検索後に分析できないシンボル・セグメントを1個以上含む入力シンボルを提出することがある。
【0038】
コントリビュータ履歴パターン・データベース440は、ドキュメントリポジトリ319にドキュメントを与える各コントリビュータのレコードを保存する。各レコードは、コントリビュータIDフィールド810、および所定数の優位使用セグメント・フィールド820(1)−820(N)からなる。本発明の実施例では、各レコード805に保存される優位使用セグメント・フィールドの数は、マスタ・シンボル・データベース420にマスタ・シンボルを保存するためのシンボル・テンプレート145に定義されるシンボル・フィールドの数に正確に一致する。
【0039】
コントリビュータIDフィールド810は、ドキュメントリポジトリ319にドキュメントを提出する各コントリビュータの一意なコントリビュータ識別子を保存する。優位使用セグメント810(1)−820(N)は、シンボル・フィールド150(1)−150(N)にそれぞれ正確に対応し、それぞれがそれぞれのシンボル・フィールドごとにそのコントリビュータについて最も頻繁に提出されたシンボル・セグメントを保存する。
【0040】
例えば、財務ドキュメントリポジトリのコンテキストでは、マスタ・シンボル・データベースは構造ROOT.SOURCEを利用して企業有価証券・シンボルを保存するが、コントリビュータ履歴パターン・データベースは次のレコードを保存することがある。
【0041】
レコード1
フィールド810:コントリビュータ1ID
フィールド820(1):<空白>
フィールド820(2):GB
レコード2
フィールド810:コントリビュータ2ID
フィールド820(1):<空白>
フィールド820(2):US
レコード3
フィールド810:コントリビュータ3ID
フィールド820(1):<空白>
フィールド820(2):FR
レコード1−3はそれぞれ、コントリビュータ1−3の優位使用セグメントを保存する。第1の優位シンボル・セグメント・フィールド820(1)は全コントリビュータについて空白で、図1cに示すシンボル・テンプレート145のルート・フィールドには優位使用セグメントが存在しないことを表す。第2優位シンボル・セグメント・フィールド820(2)には、コントリビュータ1−3のエントリが入っている。特に、レコード1はコントリビュータ1の提出したGBが最優位シンボル・セグメント、USがコントリビュータ2の提出した最優位シンボル・セグメント、FRがコントリビュータ3の提出した最優位シンボル・セグメントであることを示す。
【0042】
故に、ある実施例によると、コントリビュータ2がソース・フィールド150bに対応するシンボル・セグメントのない入力シンボルを提出しようとすると、コントリビュータ履歴パターン・データベースが検索され、「US」がコントリビュータ2の提出したソース・フィールドの最優位使用セグメントであると決定する。そのため、シンボル・セグメント「US」が、このコントリビュータの与える入力シンボルのソース・セグメントとして割り当てられる。
【0043】
履歴パターン・データベース440の生成については、以下に詳細に述べる。
【0044】
図9は、本発明のある実施例によるクライアント・プリファレンスに関連する情報を保存するためのクライアント・データベースに用いられるデータ構造を示す。クライアント・プリファレンス・データベース470は、クライアントの提出した入力シンボルの正規化を支援するため、デフォルトのシンボル・セグメントに関するクライアント・プリファレンス・データを保存する。コントリビュータ履歴パターン・データベース同様、クライアント・データベース440の目的は、ドキュメントリポジトリ319にドキュメントを提出する時、クライアントが提供するあいまいなシンボルを解できるようにすることである。ただし、ある実施例によると、クライアント・データベースはクライアントの履歴トレンドを分析するのではなく、デフォルトのシンボル・セグメント・プリファレンスを前もってクライアントが選択できるようにすることで作成する。例えば、クライアントはドキュメントリポジトリ319を検索するためにシンボル・セグメントが1個以上失われている入力シンボルを提出することがある。あるいは、クライアントは、マスタ・シンボル・データベース420の正規化と検索の後に解できないシンボル・セグメントを1個以上含む入力シンボルを提出することがある。
【0045】
クライアント履歴パターン・データベース440は、ドキュメントリポジトリ319を使って各クライアントのレコードを保存する。各レコードは、クライアントIDフィールド910、および所定数のクライアント・プリファレンス・セグメント・フィールド920(1)−920(N)からなる。各レコード905のクライアント・プリファレンス・セグメント・フィールドの数は、マスタ・シンボル・データベース420にマスタ・シンボルを保存するためのシンボル・テンプレート145に定義されるシンボル・フィールドの数に正確に対応する。
【0046】
クライアントIDフィールド910は、ドキュメントリポジトリ319を使って各クライアントの一意なクライアント識別子を保存する。クライアント・プリファレンス・セグメント920(1)−920(N)は、シンボル・テンプレート145のシンボル・フィールド150(1)−150(N)にそれぞれ対応し、それぞれは、クライアントのそれぞれのシンボル・フィールドに対応するクライアント定義のデフォルトのプリファレンス・セグメントを保存する。
【0047】
例えば、財務ドキュメントリポジトリのコンテキストでは、マスタ・シンボル・データベースは構造ROOT.SOURCEを利用して企業有価証券・シンボルを保存するが、クライアント・データベースは次のレコードを保存することがある:
レコード1
フィールド910:クライアント1ID
フィールド920(1):<空白>
フィールド920(2):GB
レコード2
フィールド910:クライアント2ID
フィールド920(1):<空白>
フィールド920(2):US
レコード3
フィールド910:クライアント3ID
フィールド920(1):<空白>
フィールド920(2):FR
レコード1−3はそれぞれ、クライアント1−3のクライアント・プリファレンス・セグメントを保存する。第1のクライアント・プリファレンス・セグメント・フィールド920(1)はすべてのクライアントについて空白で、図1cに示すシンボル・テンプレート145のルート・フィールドにはクライアント・プリファレンス・セグメントが確立していないことを表す。第2クライアント・プリファレンス・セグメント・フィールド920(2)には、コントリビュータ1−3のエントリが入っている。特に、レコード1はクライアント1−3がそれぞれ「US」、「GB」、および「FR」をそれぞれのソース・フィールド150bに選んだことを示す。
【0048】
故に、ある実施例によると、クライアント2がソース・フィールド150bに対応するシンボル・セグメントのない入力シンボルを提出しようとすると、クライアント履歴データベースが検索され、「US」ソース・フィールドについてクライアント2が選択したデフォルトのシンボル・セグメントであると決定される。そのため、シンボル・セグメント「US」がクライアントの提出した入力シンボルのソース・セグメントとして割り当てられる。
【0049】
図10は、本発明のある実施例による各種シンボル・セットに関連する正規化テーブル・データベースに用いられるデータ構造である。正規化テーブル・データベース417の機能は、コントリビュータまたはクライアントの提出した入力シンボルの正規化を支援することである。クライアントとコントリビュータは既存のあらゆる数のシンボルを使って入力シンボルを提供することができるため、流通している各種シンボル・セットとマスタ・シンボル・データベース420に保存されたマスタ・シンボルのセットとの間のネゴシエーションにメカニズムが用いられる。例えば、財務(金融)シンボルに関して、コントリビュータとクライアントがあらゆる数のベンダー・シンボルまたは交換(取引)シンボルを使って入力ストリングを提出することがある。正規化テーブル・データベース417によって、流通している異なるシンボル・セット間の変換とネゴシエーションが可能になる。
【0050】
例えば、ある実施例によると、正規化テーブル・データベース41は、各種財務情報のベンダーや為替のシンボル・セットをマスタ・シンボル・データベース420に保存されたマスタ・シンボルに関連づける情報を保存する。特に、あるコントリビュータはシンボル・セグメント「GB」を英国の参照に用いる一方、別のコントリビュータはシンボル・セグメント「EN」を使用する場合がある。しかし、マスタ・シンボル・データベース420に保存されたマスタ・シンボルは英国を参照するのにシンボル・セグメント「UK」を使うことがある。故に、クライアントがシンボル・セグメント「GB」の入ったシンボルを提出する場合、これはマスタ・シンボル・データベース420に保存されたマスタ・シンボルに対し検索できるように「UK」に正規化しなければならない。
【0051】
ある実施例によると、正規化テーブル・データベースはコントリビュータまたはクライアントが使うかもしれない流通している各シンボルについてレコード1005を保存する。レコード1005は、シンボル・オーナー・フィールド1010、オーナー・シンボル・セグメント・フィールド1020、マスタ・シンボル・セグメント・フィールド1030を含む。シンボル・オーナー・フィールド1010は流通している特定のシンボル・セグメントが属するエンティティまたは組織の独自の識別子を保存する(為替やベンダー等)。オーナー・シンボル・セグメント・フィールド1020は、特定のシンボル・オーナー(ベンダーや為替等)の採用するシンボル・セグメントのASCIIストリングを保存する。マスタ・シンボル・セグメント1010フィールドは、マスタ・シンボル・データベース420に保存されるであろう対応するシンボル・セグメントを保存する。故に、マスタ・シンボル・セグメント・フィールド1030はフィールド1020に保存されるオーナー・シンボル・セグメントの正規化に対応するシンボル・セグメントを保存する。
【0052】
例えば、正規化テーブル・データベースは次のような2つのレコードを含むことができる。
【0053】
レコード1
フィールド1:GB
フィールド2:シンボル・オーナー1ID
フィールド3:EN
レコード2
フィールド1:GB
フィールド2:シンボル・オーナー2ID
フィールド3:UK
この場合、レコード1は、シンボル・オーナー1が英国を指すのにシンボル・セグメント「EN」を使う一方、マスタ・シンボル・データベース420に保存されたシンボルは英国を指すのにシンボル・セグメント「GB」を用いることを示す。レコード2は、シンボル・オーナー2が英国を指すのにシンボル・セグメント「UK」を使うのに対して、マスタ・シンボル・データベースに保存されたシンボルは英国を指すのにシンボル・セグメント「GB」を用いることを示す。故に、クライアントまたはコントリビュータがシンボル・オーナー2に対応するシンボル・フォーマットで入力シンボルを提出し、入力シンボルがシンボル・セグメント「UK」を含む場合、シンボル・セグメント「UK」はマスタ・シンボル・データベース420に保存されたすべてのマスタ・シンボルで英国を表すのに用いられるシンボル・セグメントに対応するため、「GB」に正規化されることになる。
【0054】
図11は、本発明のある実施例による、親識別子にオブジェクトを関連づける情報を保存するためのオブジェクト・データベースに用いられるデータ構造を示す。レコード1105は、オブジェクト空間105で各オブジェクトについて生成される。各レコード1105は、オブジェクト名フィールド1110と親IDフィード1120の2つのフィールドを含む。オブジェクト名フィールド1110はオブジェクトの名を保存し、親IDフィールド1120はそのオブジェクトに関連する一意な親識別子を保存する。例えば、本発明のある実施例によると、オブジェクト・データベース415は世界中で取引される企業に関する情報を保存する。この場合、レコード1105は各企業について生成される。オブジェクト名フィールド1110は企業の名称を保存し、親IDフィールド1120はフィールド1110で名づけられた企業に関連する一意な親識別子を保存する。
【0055】
図12は、本発明のある実施例によるマスタ・シンボル・データベースの作成のステップを示すフローチャートである。ある実施例によると、1個以上のシンボル・ソースファイルとオブジェクト・データベース415がマスタ・シンボル・データベース420の作成に利用される。例えば、マスタ・シンボル・データベース構築のコンテキストで、企業有価証券、世界中の企業の有価証券のための多数の為替コードや週次ファイルが処理され、マスタ・シンボル・データベース420を構築する。マスタ・シンボル・データベース420の再構築頻度はシンボル情報がどれだけ速く変更されるかによって変わる。
【0056】
ステップ1210で、手順が開始される。ステップ1220で、ソース・ファイルから次のシンボルが取り出される。ステップ1230で、取り出したシンボルを文字ルールセットに従って正規化する。例えば、マスタ・シンボルが世界中で取引される企業の有価証券に言及する実施例によると、利用可能なシンボル・ソース・ファイルから各シンボルに次のキャラクタ(文字)ルールが適用される。
【0057】
1.「@」や「=」などの特殊キャラクタはすべて「/」に変更する。
【0058】
2.アルファベット文字はすべて大文字に変更する。
【0059】
3.数字シンボルから最初のゼロはすべて取り除く。
【0060】
ステップ1240で、プロセスルールが適用される。マスタ・シンボル・データベース420が世界中で取引される企業の有価証券を参照するマスタ・シンボルを保存する本発明のある実施例によると、次のプロセスルールが適用される。
【0061】
1.同じ国で取引される同じ企業の同じ有価証券を参照する二重のシンボルは取り除く。
【0062】
2.特定のカントリールールを適用する。
【0063】
ステップ1250で、正規化シンボルを親識別子110に割り当てる。これは、オブジェクト・データベース415のシンボルに対応するオブジェクトを決定することによって行う。ステップ1260で、正規化シンボル115をマスタ・シンボル・データベース420に保存する。ステップ1270で、親識別子110をマスタ・データベース420に保存し、マスタ・シンボル110にリンクされるようにする。ステップ1280で、ソース・ファイルのシンボルがすべて処理されたか否か判断する。処理されていない場合(ステップ880の「ノー」ブランチ)、次のシンボルを調べる。処理されている場合(ステップ1280の「イエス」ブランチ)、手順は終了する。
【0064】
コントリビュータ・ゲートウェイ・サーバ340aは多数のプロセスを実行して、コントリビュータ(340等)から受けたドキュメントの受信やアーカイブを管理する。この機能を実現するため、コントリビュータ・ゲートウェイ・サーバ340aは、コントリビュータ履歴パターン・データベース440、正規化テーブル・データベース417、ドキュメントファイル・データベース450、フルテキスト・データベース460、リレーショナル・データベース430、シンボル・サーバ410を含む多数のデータベースとインタラクトする。
【0065】
図13は、本発明のある実施例によるコントリビュータから受けたドキュメントの自動アーカイブに関連するドキュメントリポジトリ319での各種サーバとデータベースとの間の情報フローを示す。特に、コントリビュータ・ゲートウェイ・サーバ340aはコントリビュータ340からドキュメントファイル1310および入力シンボルを受けるプロセスを実行する。本発明のある実施例によると、ドキュメントを提出するため、コントリビュータ340はドキュメント1310に関する情報の入った構造化データ形式のヘッダ・ファイル1320を送信することができる。ヘッダ・ファイル1320(図示せず)は、例えば入力シンボル・フィールドやコントロールの名およびドキュメントの日付などのコントリビュータの情報を含む多数のフィールドから構成される。故に、コントリビュータ・ゲートウェイ・サーバ340aは、提出された特定のドキュメントに関する情報を抽出するため、ヘッダ・ファイル1320を解釈する追加プロセスを実行することができる。
【0066】
受信したヘッダ・ファイル1320から入力シンボルを抽出すると、コントリビュータ・ゲートウェイ・サーバ3401は文字およびプロセスルールのセットに従って入力シンボルを正規化するプロセスを実行する。このプロセスを実行する際、コントリビュータ・ゲートウェイ・サーバ340aは、一定のシンボル・セグメントを解するため、1個以上のシンボル・セグメント1325を使って正規化テーブル・データベース417を検索し、正規化テーブル417から正規化したシンボル・セグメント1327を入手することができる。シンボル・セグメントが決である場合、コントリビュータ・ゲートウェイ・サーバ340aはコントリビュータ履歴パターン・データベース3440からコントリビュータの履歴パターン1360に関する統計データを取り出して、シンボル・セグメントを解することができる。
【0067】
正規化後、コントリビュータ・ゲートウェイ・サーバ340aは正規化した入力シンボルをシンボル・サーバ410に送る(1340)。シンボル・サーバ410は、正規化シンボルを使ってマスタ・シンボル・データベース420を検索し、マスタ・シンボル・データベースの一致するマスタ・シンボルにリンクされた親識別子を取り出す。シンボル・サーバ410がマスタ・シンボル・データベース420に一致するマスタ・シンボルを見つけた場合、対応する親識別子110を返す。そうでない場合、シンボル・サーバ410は非確認シンボル1340を示すメッセージを送る。
【0068】
そして、コントリビュータ・ゲートウェイ・サーバ340aは一意なドキュメント識別子を生成し、そのドキュメント識別子、親識別子110およびコントリビュータ・データ(1350)をリレーショナル・データベース430に保存する。正規化入力シンボルを確認できない場合、コントリビュータ・ゲートウェイ・サーバ340aはコントリビュータ入力シンボル(1365)を使ってリレーショナル・データベース430を検索し、入力シンボルが以前に親識別子110にリンクされていたか否か決定することができる。そして、コントリビュータ・ゲートウェイ・サーバ340aはドキュメントを保存し、ドキュメントファイル・データベース450のドキュメント識別子(1370)にリンクされるようにする。
【0069】
コントリビュータ・ゲートウェイ・サーバ340aはまた、異なるドキュメントファイル形式間のネゴシエートという追加プロセスを実行することができる。故に、例えば、コントリビュータ・ゲートウェイ・サーバ340aは特定のファイル形式で受け取ったドキュメントをフルテキスト・データベース460に保存するためテキスト形式(1380)に変換するルーチンを実行することができる。
【0070】
図14は、本発明のある実施例によるドキュメントリポジトリでドキュメントの自動アーカイブのステップを示すフローチャートである。ステップ1410で、ドキュメントファイルとヘッダ・ファイルがドキュメントリポジトリ319で受け取られる。ステップ1415で、入力シンボルがヘッダ・ファイル1415から抽出される。ステップ1420で、入力シンボルが文字およびプロセスルールのセットに従って正規化される。ステップ1425で、入力シンボルにすべてのシンボル・セグメントが入っているか否かが判断される。入っていない場合(ステップ1425の「ノー」ブランチ)、コントリビュータが用いる優位シンボル・セグメントが履歴パターン・データベース440から受信される(ステップ1440)。ステップ1430で、正規化テーブル・データベース417を照会し、一定のシンボル・セグメントを解する。ステップ1445で、マスタ・シンボル・データベース420を正規化シンボルを使って検索する。一致するマスタ・シンボルが見つかったら(ステップ1450の「イエス」ブランチ)、ドキュメント識別子を生成する(ステップ1455)。そして、ドキュメント識別子、親識別子110とヘッダ・ファイル1420からの構造化データがリレーショナル・データベース430に保存される(ステップ1460)。ステップ1465で、ドキュメントとドキュメント識別子がドキュメントデータベース450に保存され、ドキュメント識別子がドキュメントにリンクされる。ステップ1470で、ドキュメントのテキストがフルテキスト・データベース460に保存される。手順はステップ1480で終了する。
【0071】
マスタ・シンボル・データベース420に一致するマスタ・シンボルが見つからない場合、リレーショナル・データベース430をコントリビュータ提出シンボルを使って検索する(ステップ1452)。コントリビュータ提出シンボルが以前に使われており、親識別子110にリンクされている場合(ステップ1454の「イエス」ブランチ)、対応する親識別子110が使われる。そうでない場合、手順は失敗する(ステップ1454の「ノー」ブランチ)。コントリビュータが、解できなかったシンボルを使って過去にドキュメントを提出した可能性があるため、このようなことが発する。しかし、シンボルは人的入力によって手動で解されることがある。この場合、リレーショナル・データベース430は、手動で解されたコントリビュータによって与えられた入力シンボルをコントリビュータ入力シンボル・フィールド750に保存するドキュメントについて、レコード705を保存する。
【0072】
クライアント・ゲートウェイ・サーバ340bは、クライアント(305等)の要求するドキュメントの検索ストリングの処理と取り出しを管理するため多数のプロセスを実行する。この機能を実現するため、クライアント・ゲートウェイ・サーバ340bは、クライアント・データベース470、ドキュメントファイル・データベース450、フルテキスト・データベース460、正規化テーブル・データベース417、リレーショナル・データベース430、シンボル・サーバ410を含む多数のデータベースとインタラクトする。図15は、本発明のある実施例による、クライアント305の提出した入力シンボルに基づくドキュメントの自動取り出しに関連するドキュメントリポジトリ319での各種サーバとデータベースとの間の情報フローを示すブロック図である。
【0073】
特に、クライアント・ゲートウェイ・サーバ340bは、クライアントによる検索要求の入力を可能にするGUIを提供するプロセスを実行する。ある実施例によると、クライアント・ゲートウェイ・サーバ340bは、特定のドキュメント要求に関連するクライアント305の提出した入力シンボル1510の入力と処理を可能にするCGIスクリプトを実行する。
【0074】
クライアント・ゲートウェイ・サーバ340bは、クライアントの提出した入力シンボル1510を正規化するプロセスを実行する。入力シンボルを受け取ると、クライアント・ゲートウェイ・サーバ340bは、クライアント305が特定のセグメントの失われた入力シンボルを提出している場合、デフォルトのシンボル・セグメントに関してクライアント・データベース470から情報1560を取り出すことができる。クライアント・ゲートウェイ・サーバ340bはまた、1個以上の入力シンボル・セグメント1525を提出し、正規化テーブル・データベース417を検索して、対応するマスタ・シンボル・セグメント1527を返すことができる。
【0075】
正規化入力シンボル1520は、シンボル・サーバ410に転送される。すると、シンボル・サーバ410は正規化入力シンボルを使ってマスタ・シンボル・データベース420を検索し、マスタ・シンボル・データベース420の一致するマスタ・シンボルにリンクされた親識別子を見つける。シンボル・サーバ410から返された親識別子110を使って、クライアント・ゲートウェイ・サーバ340bはリレーショナル・データベース430を検索し、提出された親識別子110に対応するドキュメント識別子とドキュメント見出し1540のリストを入手する。ドキュメント見出しは、クライアント・ゲートウェイ・サーバ340bに処理され、クライアント305に表示される。クライアントからの選択を受けると、クライアント・ゲートウェイ・サーバ340bはドキュメントファイル・データベース450から選択したドキュメント1550を取り出す。
【0076】
図16は、本発明のある実施例によるクライアント提出入力シンボルに基づくドキュメントリポジトリでのドキュメントの自動取り出しのステップを示すフローチャートである。ステップ1610で、入力シンボル1510がクライアント305から受け取られる。ステップ1620で、文字およびプロセルルールなどの正規化ルールが受け取った入力シンボル1510に適用される。ステップ1625で、正規化シンボルがすべてのシンボル・セグメントを含むか否か判断される。含まない場合(ステップ1625の「ノー」ブランチ)、クライアント・データベース470から取り出したクライアント・プリファレンス・セグメントを失われたセグメントに用いる(ステップ1630)。ステップ1645で、シンボル・データベース420を正規化されたシンボル115を使って検索する。マスタ・シンボル・データベース420に一致するマスタ・シンボルが見つかったら(ステップ1650の「イエス」ブランチ)、マスタ・シンボルにリンクされた親識別子110を使ってリレーショナル・データベース430を検索し、ドキュメント識別子とドキュメント見出しのリストを生成する。シンボルが見つからない場合(ステップ1650の「ノー」ブランチ)、手順は失敗する。ステップ1665で、見つかった各ドキュメントに関連するドキュメント見出しを選択のために表示する。ステップ1670で、クライアント・ゲートウェイ・サーバ340bがクライアント305によるドキュメント見出しの選択を受け入れる。選択したドキュメント識別子に基づき、対応するドキュメントをドキュメントファイル・データベース450から取り出す。手順はステップ1680で終了する。
【0077】
図17は、本発明のある実施例によるコントリビュータ履歴データベースを作成するためのステップのセットを示すフローチャートである。ステップ1702で、手順が開始される。ステップ1710で、リレーショナル・データベース430の次のレコードが取り出される。ステップ1720で、リレーショナル・データベース430からのレコードが分析される。特に、マスタ・シンボル・ポインタ・フィールド740を使って、レコードで参照されるマスタ・シンボルを決定する。マスタ・シンボルを分析してテーブルをアップデートし、各種コントリビュータによって提出された優位提出シンボル・セグメントに関する統計的情報を記録する。このテーブル(図示せず)は、例えばアレイなどのデータ構造を使ってインプリメントすることができる。ステップ1730で、リレーショナル・データベース430のすべてのレコードが分析されたか否か判断される。されていない場合(ステップ1730の「ノー」ブランチ)、リレーショナル・データベース430の次のレコードを分析する。されている場合(ステップ1730の「イエス」ブランチ)、統計テーブルで生成された情報は履歴パターン・データベース440に保存される(ステップ1740)。手順はステップ1750で終了する。
【0078】
例えば、リレーショナル・データベース430の分析後に次のテーブルを生成することがある。
【0079】
【表1】
Figure 0004754748
【0080】
故に、分析によると、シンボル・フィールド1に最も多く提出されるシンボル・セグメントは、コントリビュータ1、2および3それぞれについて「T」、「IBM」および「QW」であった。さらに、シンボル・フィールド2について最も多く提出されるシンボル・セグメントは、コントリビュータ1、2および3それぞれについて「US」、「GB」および「DE」だった。故に、この情報に基づき、コンピュータ1については、コントリビュータ履歴パターン・データベース440は各コントリビュータについて別個レコード805を保存することになる。特に、この分析に基づき、レコードはそれぞれコントリビュータ1、2、および3について、優位使用セグメント・フィールド820(1)および820(2)に「T」と「US」、「IBM」と「GB」、「QW」と「DE」を保存することになる。
【図面の簡単な説明】
【図1a】 本発明の一実施例による親識別子、その親識別子にリンクされた多数のマスタシンボルおよびオブジェクトとそのオブジェクトに関連する多数のオブジェクト間の関係を示す図である。
【図1b】 本発明の一実施例による、複数の親識別子にリンクされたマスタシンボルを示す図である。
【図1c】 本発明の一実施例によるシンボルテンプレートを示す図である。
【図1d】 本発明の一実施例によるシンボルテンプレートの特別な例を示す図である。
【図2】 本発明の一実施例による、一意の関連オブジェクトを識別するために入力シンボルを解釈する一組のステップを示すフローチャートである。
【図3】 本発明の一実施例による、シンボリックにリンクされたドキュメントを電子的に記録保管し検索することを可能とするネットワークアーキテクチャを示すブロック図である。
【図4】 本発明の一実施例による、シンボリックにリンクされたドキュメントを記録保管し検索するドキュメント貯蔵庫の一部のアーキテクチャを示すブロック図である。
【図5a】 本発明の一実施例による、マスタシンボルデータベースにおけるマスタシンボルデータを格納するデータ構造を示す図である。
【図5b】 本発明の一実施例により、世界中を通して取引される企業証券シンボルの貯蔵庫を備えた環境下で適用される、図5aに示すデータ構造の特別な例を示す図である。
【図6】 本発明の一実施例による、ドキュメントファイルデータベースにおけるドキュメントを格納するデータ構造を示す図である。
【図7】 本発明の一実施例による、ドキュメント貯蔵庫で格納されるドキュメントに関する情報を格納するリレーショナルデータベースで使用されるデータ構造を示す図である。
【図8】 本発明の一実施例による、特定の寄与者の履歴シンボル使用傾向に関する情報を格納する寄与者履歴パターンデータベースで使用されるデータ構造を示す図である。
【図9】 本発明の一実施例による、クライアントの好みに関する情報を格納するクライアントデータベースで使用されるデータ構造を示す図である。
【図10】 本発明の一実施例による、種々のシンボル組に関する正規化テーブルデータベースで使用されるデータ構造を示す図である。
【図11】 本発明の一実施例による、親識別子に対するオブジェクトに関する情報を格納するオブジェクトデータベースで使用されるデータ構造を示す図である。
【図12】 本発明の一実施例による、マスタシンボルデータベースを作成するステップのフローチャートである。
【図13】 本発明の一実施例による、寄与者から受信されたドキュメントの自動記録保管に関するドキュメント貯蔵庫319における種々のサーバとデータベースとの間の情報フローを示すブロック図である。
【図14】 本発明の一実施例による、ドキュメント貯蔵庫におけるドキュメントを自動的に記録保管するステップのフローチャートである。
【図15】 本発明の一実施例による、クライアント305により供給された入力シンボルに基づくドキュメントの自動検索に関するドキュメント貯蔵庫319における種々のサーバとデータベースとの間の情報フローを示すブロック図である。
【図16】 本発明の一実施例による、クライントにより提出された入力シンボルに基づきドキュメント貯蔵庫におけるドキュメントを自動検索するステップのフローチャートである。
【図17】 本発明の一実施例による、寄与者履歴データベースを生成する一組のステップを示すフローチャートである。

Claims (26)

  1. 少なくとも1つのプロセッサを含むシステムによって実現される、シンボルにリンクされた情報を格納しシンボルを用いて参照する方法であって、
    前記プロセッサまたは前記プロセッサの1つがシンボルを正規化してマスタシンボルを生成する段階であって、マスタシンボルは所定の構造に従う標準形式であり、正規化する段階は一組の文字規則及び一組の処理規則の一方をシンボルに適用してマスタシンボルを生成することを含み、各マスタシンボルは企業から発行される証券に該当する段階と、
    前記プロセッサまたは前記プロセッサの1つがマスタシンボルに対応する一意な親識別子を決定する段階であって、各親識別子は企業に該当する段階と、
    前記プロセッサまたは前記プロセッサの1つがマスタシンボルが親識別子にリンクされて記録されるマスタシンボルデータベース内に親識別子とマスタシンボルとを格納する段階と、
    前記プロセッサまたは前記プロセッサの1つが少なくとも一つの情報エレメントを格納する段階であって、少なくとも一つの情報エレメントが前記親識別子にリンクされる段階と、
    を具備し、各マスタシンボルは少なくとも1つのシンボル領域を含むシンボルテンプレートに従って構成され、各マスタシンボルはシンボルテンプレートで画定される少なくとも1つのシンボル領域にそれぞれ対応する少なくとも1つのシンボルセグメントを含み、第1のマスタシンボルが第1の親識別子と関連付けられ、第2のマスタシンボルが前記第1の親識別子と関連付けられる、方法。
  2. 少なくとも一つの情報エレメントはドキュメントである請求項1に記載の方法。
  3. シンボルテンプレートは、証券の名称に該当するルートシンボル領域と証券が取引される国に該当するソースシンボル領域とを含む請求項に記載の方法。
  4. 少なくとも一つの情報エレメントを格納する段階は、情報エレメント識別子を生成する段階と、親識別子が情報エレメント識別子にリンクされるように情報エレメント識別子と親識別子とを格納する段階と、情報エレメント識別子が情報エレメントにリンクされるように情報エレメントと情報エレメント識別子とを格納する段階とを含む請求項1に記載の方法。
  5. 各シンボルセグメントはアスキー(情報交換用米国標準コード)列を具備する請求項1に記載の方法。
  6. 親識別子はリレーショナルデータベース内の情報エレメント識別子にリンクされる請求項に記載の方法。
  7. 少なくとも1つのプロセッサを含むシステムによって実現される、シンボルにリンクされた情報の保存方法であって、
    前記プロセッサまたは前記プロセッサの1つが情報エレメントと少なくとも一つの入力シンボルとを受信する段階と、
    前記プロセッサまたは前記プロセッサの1つが入力シンボルを正規化して正規化シンボルを生成する段階であって、正規化シンボルは所定の構造に従う標準形式であり、正規化する段階は一組の文字規則及び一組の処理規則の一方を入力シンボルに適用して正規化シンボルを生成することを含む段階と、
    前記プロセッサまたは前記プロセッサの1つが正規化シンボルを用いて、一組のマスタシンボルと一組の親識別子を含むマスタシンボルデータベースを捜索して、整合するマスタシンボルとマスタシンボルにリンクされている親識別子とを見い出す段階であって、各マスタシンボルは企業から発行される証券に該当し、各親識別子は企業に該当する段階と、
    前記プロセッサまたは前記プロセッサの1つが親識別子が情報エレメントにリンクされるように少なくとも親識別子と情報エレメントとを格納する段階と、
    を具備し、各マスタシンボルは少なくとも1つのシンボル領域を含むシンボルテンプレートに従って構成され、各マスタシンボルはシンボルテンプレートで画定される少なくとも1つのシンボル領域にそれぞれ対応する少なくとも1つのシンボルセグメントを含み、第1のマスタシンボルが第1の親識別子と関連付けられ、第2のマスタシンボルが前記第1の親識別子と関連付けられる、方法。
  8. 情報エレメントはドキュメントである請求項に記載の方法。
  9. 各マスタシンボルは企業から発行される証券に該当する請求の範囲項に記載の方法。
  10. シンボルテンプレートは、証券の名称に該当するルートシンボル領域と証券が取引される国に該当するソースシンボル領域とを含む請求項に記載の方法。
  11. 情報エレメントを格納する段階は、情報エレメント識別子を生成する段階と、親識別子が情報エレメント識別子にリンクされるように情報エレメント識別子と親識別子とを格納する段階と、情報エレメント識別子が情報エレメントにリンクされるように情報エレメントと情報エレメント識別子とを格納する段階とを含む請求項に記載の方法。
  12. 各シンボルセグメントはアスキー(情報交換用米国標準コード)列を具備する請求項に記載の方法。
  13. 親識別子はリレーショナルデータベース内の情報エレメント識別子にリンクされる請求項11に記載の方法。
  14. 更に、正規化シンボルに未解決セグメントが含まれる場合、コントリビュータデータベースを捜索して優位使用セグメントを探す段階と、優位使用セグメントを未解決セグメントへ割当てる段階とを具備する請求項に記載の方法。
  15. 更に、正規化シンボルがマスタシンボルデータベースにない場合、入力シンボルを用いてデータベースを捜索する段階と、入力シンボルにリンクされた親識別子を取得する段階とを具備する請求項に記載の方法。
  16. 少なくとも1つのプロセッサを含むシステムによって実現される、シンボルにリンクされた情報の検索方法であって、
    前記プロセッサまたは前記プロセッサの1つが入力シンボルを受け取る段階と、
    前記プロセッサまたは前記プロセッサの1つが入力シンボルを正規化して正規化シンボルを生成する段階であって、正規化シンボルは所定の構造に従う標準形式であり、正規化する段階は一組の文字規則及び一組の処理規則の一方を入力シンボルに適用して正規化シンボルを生成することを含む段階と、
    前記プロセッサまたは前記プロセッサの1つが正規化シンボルを用いて、一組のマスタシンボルと一組の親識別子を含むマスタシンボルデータベースを捜索して、整合するマスタシンボルとマスタシンボルにリンクされている親識別子とを見い出す段階であって、各マスタシンボルは企業から発行される証券に該当し、各親識別子は企業に該当し、第1のマスタシンボルが第1の親識別子と関連付けられ、第2のマスタシンボルが前記第1の親識別子と関連付けられる段階と、
    前記プロセッサまたは前記プロセッサの1つが情報エレメントデータベースを捜索して、前記親識別子にリンクされている情報エレメントを見い出す段階と、
    前記プロセッサまたは前記プロセッサの1つが前記親識別子にリンクされている情報エレメントを取得する段階と、
    を具備し、各マスタシンボルは少なくとも1つのシンボル領域を含むシンボルテンプレートに従って構成され、各マスタシンボルはシンボルテンプレートで画定される少なくとも1つのシンボル領域にそれぞれ対応する少なくとも1つのシンボルセグメントを含む、方法。
  17. 更に、入力シンボルに未解決セグメントが含まれるかどうかを決定する段階と、
    入力シンボルに未解決セグメントが含まれている場合に、クライアントデータベースを捜索してクライアントプリファレンスセグメントを見い出し、当該クライアントプリファレンスセグメントを未解決セグメントへ割当てる段階とで構成されることを特徴とする請求項16に記載の方法。
  18. 情報エレメントはドキュメントである請求項16に記載の方法。
  19. 各マスタシンボルは企業から発行される証券に該当する請求項16に記載の方法。
  20. シンボルテンプレートは、証券の名称に該当するルートシンボル領域と証券が取引される国に該当するソースシンボル領域とを含む請求項19に記載の方法。
  21. 各シンボルセグメントはアスキー(情報交換用米国標準コード)列を具備する請求項16に記載の方法。
  22. 情報データベースはリレーショナルデータベースであることを特徴とする請求項16に記載の方法。
  23. 入力シンボルを用いたドキュメントの電子的保存を可能にするドキュメント貯蔵システムであって、
    記憶装置と、
    ネットワークインターフェイスと、
    前記記憶装置に結合されたプロセッサであって、
    各マスタシンボルが親識別子にリンクされて記録されたマスタシンボルデータベースとドキュメントデータベースとを格納することと、
    ネットワークインターフェイスを介して入力シンボルとドキュメントとを受信することと、
    入力シンボルを、正規化して正規化シンボルを得ることであって、正規化シンボルは所定の構造に従う標準形式であり、正規化することは一組の文字規則及び一組の処理規則の一方を入力シンボルに適用して正規化シンボルを生成することを含むことと、
    正規化シンボルを用いて、一組のマスタシンボルと一組の親識別子を含むマスタシンボルデータベースを捜索して、整合するマスタシンボルとマスタシンボルにリンクされている親識別子とを見い出すことであって、各マスタシンボルは企業から発行される証券に該当し、各親識別子は企業に該当し、第1のマスタシンボルが第1の親識別子と関連付けられ、第2のマスタシンボルが前記第1の親識別子と関連付けられることと、
    ドキュメントが親識別子にリンクされるようにドキュメントをドキュメントデータベースに記録することを行うよう適合されたプロセッサと、
    を具備し、各マスタシンボルは少なくとも1つのシンボル領域を含むシンボルテンプレートに従って構成され、各マスタシンボルはシンボルテンプレートで画定される少なくとも1つのシンボル領域にそれぞれ対応する少なくとも1つのシンボルセグメントを含む、ドキュメント貯蔵システム。
  24. 入力シンボルに少なくとも一つの未解決セグメントが含まれている場合、プロセッサは、未解決シンボルセグメント毎にコントリビュータ履歴パターンデータベースを捜索して優位使用セグメントを探し、当該優位使用セグメントを未解決セグメントへ割当てる請求項23に記載のドキュメント貯蔵システム。
  25. 入力シンボルを用いたドキュメントの電子的検索を可能にするドキュメント貯蔵システムであって、
    マスタシンボルデータベースとドキュメントデータベースとが格納された記憶装置であって、マスタシンボルデータベースにはマスタシンボルが記録され、各マスタシンボルは親識別子にリンクされ、ドキュメントデータベースには親識別子にリンクされたドキュメントが記録される記憶装置と、
    ネットワークインターフェイスと、
    プロセッサであって、ネットワークインターフェイスを介して入力シンボルを受信することと、
    入力シンボルを正規化して正規化シンボルを得ることであって、正規化シンボルは所定の構造に従う標準形式であり、正規化することは一組の文字規則及び一組の処理規則の一方を入力シンボルに適用して正規化シンボルを生成することを含むことと、
    正規化シンボルを用いて、一組のマスタシンボルと一組の親識別子を含むマスタシンボルデータベースを捜索して、整合するマスタシンボルとマスタシンボルにリンクされている親識別子とを見い出すことであって、各マスタシンボルは企業から発行される証券に該当し、各親識別子は企業に該当し、第1のマスタシンボルが第1の親識別子と関連付けられ、第2のマスタシンボルが前記第1の親識別子と関連付けられることと、
    ドキュメントデータベースから、親識別子にリンクされているドキュメントを取得することを行う、プロセッサと、
    を具備し、各マスタシンボルは少なくとも1つのシンボル領域を含むシンボルテンプレートに従って構成され、各マスタシンボルはシンボルテンプレートで画定される少なくとも1つのシンボル領域にそれぞれ対応する少なくとも1つのシンボルセグメントを含む、ドキュメント貯蔵システム。
  26. 入力シンボルに少なくとも一つの未解決セグメントが含まれている場合、プロセッサは、未解決シンボルセグメント毎にクライアントデータベースを捜索してクライアントプリファレンスセグメントを探し、当該クライアントプリファレンスセグメントを未解決セグメントへ割当てる請求項25に記載のドキュメント貯蔵システム。
JP2001515889A 1999-06-18 2000-05-18 シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム Expired - Lifetime JP4754748B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/336,031 US7398262B1 (en) 1999-06-18 1999-06-18 Method and system for referencing, archiving and retrieving symbolically linked information
US09/336,031 1999-06-18
PCT/US2000/013914 WO2000079430A1 (en) 1999-06-18 2000-05-18 A method and system for referencing, archiving and retrieving symbolically linked information

Publications (3)

Publication Number Publication Date
JP2003527657A JP2003527657A (ja) 2003-09-16
JP2003527657A5 JP2003527657A5 (ja) 2004-12-24
JP4754748B2 true JP4754748B2 (ja) 2011-08-24

Family

ID=23314265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001515889A Expired - Lifetime JP4754748B2 (ja) 1999-06-18 2000-05-18 シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム

Country Status (7)

Country Link
US (1) US7398262B1 (ja)
EP (1) EP1192566A4 (ja)
JP (1) JP4754748B2 (ja)
AU (1) AU775019B2 (ja)
CA (1) CA2375481C (ja)
HK (1) HK1045736A1 (ja)
WO (1) WO2000079430A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665679B2 (en) * 1999-06-18 2003-12-16 Multex.Com, Inc. Method and system for symbolical linkage and intelligent categorization of information
US7653871B2 (en) 2003-03-27 2010-01-26 General Electric Company Mathematical decomposition of table-structured electronic documents
US8055575B2 (en) * 2005-10-14 2011-11-08 Financial Intergroup Holdings, Ltd. Central counterparty for data management
MX351043B (es) 2011-04-27 2017-09-29 Amyris Inc Metodos para modificacion genomica.
US9679247B2 (en) 2013-09-19 2017-06-13 International Business Machines Corporation Graph matching
CN104376119A (zh) * 2014-12-03 2015-02-25 天津南大通用数据技术股份有限公司 一种适应超大规模列存数据库的数据访问方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03196263A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 文書検索方法
JPH03196364A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 探索項構築の制御テーブルの導入方法
JPH03198384A (ja) * 1989-12-27 1991-08-29 Hitachi Ltd 熱電変換モジュール
JPH0454541A (ja) * 1990-06-21 1992-02-21 Fujitsu Ltd ファイル名生成処理方式
JPH06161855A (ja) * 1992-08-19 1994-06-10 American Teleph & Telegr Co <Att> ファイル装置およびファイルアクセス方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5230048A (en) * 1986-09-03 1993-07-20 Wang Laboratories, Inc. Data processing system with tree and list data structure
US5748953A (en) * 1989-06-14 1998-05-05 Hitachi, Ltd. Document search method wherein stored documents and search queries comprise segmented text data of spaced, nonconsecutive text elements and words segmented by predetermined symbols
US5992752A (en) * 1993-11-24 1999-11-30 Metrologic Instruments, Inc. Internet-based system for enabling information-related transactions over the internet using Java-enabled internet terminals provided with bar code symbol readers for reading Java-Applet encoded bar code symbols
US5623679A (en) 1993-11-19 1997-04-22 Waverley Holdings, Inc. System and method for creating and manipulating notes each containing multiple sub-notes, and linking the sub-notes to portions of data objects
CA2119921C (en) * 1994-03-23 2009-09-29 Sydney H. Belzberg Computerized stock exchange trading system
US5611059A (en) 1994-09-02 1997-03-11 Square D Company Prelinked parameter configuration, automatic graphical linking, and distributed database configuration for devices within an automated monitoring/control system
DE69623227T2 (de) 1995-10-27 2003-04-17 Ncr Int Inc Verfahren und System zur Berechnung von Dateinamen mit hoher Wahrscheinlichkeit der Eindeutigkeit
US5960200A (en) * 1996-05-03 1999-09-28 I-Cube System to transition an enterprise to a distributed infrastructure
US5946666A (en) * 1996-05-21 1999-08-31 Albert Einstein Healthcare Network Monitoring device for financial securities
US5913214A (en) * 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
US5819271A (en) 1996-06-04 1998-10-06 Multex Systems, Inc. Corporate information communication and delivery system and method including entitlable hypertext links
US5864871A (en) * 1996-06-04 1999-01-26 Multex Systems Information delivery system and method including on-line entitlements
US5903902A (en) 1996-09-09 1999-05-11 Design Intelligence, Inc. Design engine with tree and component structure
US5940843A (en) * 1997-10-08 1999-08-17 Multex Systems, Inc. Information delivery system and method including restriction processing
AUPO977997A0 (en) 1997-10-14 1997-11-06 Pouflis, Jason The utilisation of multi-lingual names on the internet
US6212638B1 (en) * 1997-12-02 2001-04-03 George C. Lee Method for generating unpredictable authentication identification symbols
US6055538A (en) 1997-12-22 2000-04-25 Hewlett Packard Company Methods and system for using web browser to search large collections of documents
US6122635A (en) * 1998-02-13 2000-09-19 Newriver Investor Communications, Inc. Mapping compliance information into useable format
US6236980B1 (en) * 1998-04-09 2001-05-22 John P Reese Magazine, online, and broadcast summary recommendation reporting system to aid in decision making
US6408282B1 (en) * 1999-03-01 2002-06-18 Wit Capital Corp. System and method for conducting securities transactions over a computer network
US6496836B1 (en) 1999-12-20 2002-12-17 Belron Systems, Inc. Symbol-based memory language system and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03196263A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 文書検索方法
JPH03196364A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 探索項構築の制御テーブルの導入方法
JPH03198384A (ja) * 1989-12-27 1991-08-29 Hitachi Ltd 熱電変換モジュール
JPH0454541A (ja) * 1990-06-21 1992-02-21 Fujitsu Ltd ファイル名生成処理方式
JPH06161855A (ja) * 1992-08-19 1994-06-10 American Teleph & Telegr Co <Att> ファイル装置およびファイルアクセス方法

Also Published As

Publication number Publication date
WO2000079430A1 (en) 2000-12-28
US7398262B1 (en) 2008-07-08
AU775019B2 (en) 2004-07-15
HK1045736A1 (zh) 2002-12-06
JP2003527657A (ja) 2003-09-16
EP1192566A4 (en) 2006-05-10
CA2375481A1 (en) 2000-12-28
EP1192566A1 (en) 2002-04-03
AU5034800A (en) 2001-01-09
CA2375481C (en) 2010-08-10

Similar Documents

Publication Publication Date Title
JP5536851B2 (ja) 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム
US7092936B1 (en) System and method for search and recommendation based on usage mining
JP5033221B2 (ja) 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
US6012053A (en) Computer system with user-controlled relevance ranking of search results
US7668886B2 (en) Resume storage and retrieval system
US20130086098A1 (en) Identifier vocabulary data access method and system
US20040103075A1 (en) International information search and delivery system providing search results personalized to a particular natural language
US7099870B2 (en) Personalized web page
US20040205047A1 (en) Method for dynamically generating reference indentifiers in structured information
JP2008123547A (ja) 半構造化情報の照会および解釈を構造化する方法および装置
JP2007094570A (ja) データベース利用システム
Sanderson et al. Nrt-news retrieval tool
JP4754748B2 (ja) シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム
JP3786233B2 (ja) 情報検索方法および情報検索システム
Ghavimi et al. A semi-automatic approach for detecting dataset references in social science texts
JP2020064482A (ja) 属性抽出装置および属性抽出方法
US7349918B2 (en) Method and system for searching binary files
WO2001057725A2 (en) System and method for database searching
Capstick et al. Documentation of Technical Results
EP1881429A2 (en) Integration of documents with OLAP using search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100312

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4754748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term