JP2003527657A - シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム - Google Patents

シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム

Info

Publication number
JP2003527657A
JP2003527657A JP2001515889A JP2001515889A JP2003527657A JP 2003527657 A JP2003527657 A JP 2003527657A JP 2001515889 A JP2001515889 A JP 2001515889A JP 2001515889 A JP2001515889 A JP 2001515889A JP 2003527657 A JP2003527657 A JP 2003527657A
Authority
JP
Japan
Prior art keywords
symbol
master
database
symbols
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001515889A
Other languages
English (en)
Other versions
JP2003527657A5 (ja
JP4754748B2 (ja
Inventor
エー. カーティス,ケビン
ウラゾフ,ユーリ
バーガノフスキー,マイケル
Original Assignee
マルテックス ドット コム,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マルテックス ドット コム,インコーポレイティド filed Critical マルテックス ドット コム,インコーポレイティド
Publication of JP2003527657A publication Critical patent/JP2003527657A/ja
Publication of JP2003527657A5 publication Critical patent/JP2003527657A5/ja
Application granted granted Critical
Publication of JP4754748B2 publication Critical patent/JP4754748B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 本発明は、特有なシンボル(120a1,120c1,120a2,120c2,120a3,120c3)の使用にもかかわらずシンボリックにリンクされた情報の参照、記録保管、検索を行う方法とシステムを提供する。マスタ115cデータベースは、各々が予め決定された構造によりフォーマットされた複数のマスタシンボル115cを格納する。マスタシンボル115cデータベースにおける各マスタシンボル115cは、唯一のオブジェクト130を識別する親識別子110にリンクされる。ユーザは、情報データベースにおけるシンボリックにリンクされた情報を入力シンボルを供給することにより記録保管または検索できる。入力シンボルは、正規化され、マスタシンボル115cデータベースは、一致するマスタ115cを探すため検索される。一致するマスタ115cにリンクされた親識別子110は、次いで情報データベース内の情報を検索または記録保管するために使用される。

Description

【発明の詳細な説明】
[発明の分野] 本発明は、電子的格納領域および情報の検索に関する。特に、本発明は、シン
ボリックにリンクされた情報を参照し、格納し、検索する方法およびシステムに
関する。 [背景情報] 多くの形式の情報がシンボルコードを用いて毎日の日常生活において参照され
記録保管(archive)されている。典型的には、シンボルコードは、コー
ドのシンボルにより表された実世界における特定組の表明されたオブジェクト−
エンティティを参照する一貫性のある便利な言語を要求するユーザ集団により使
用される。しかしながら、実際、大部分のシンボルコードは、定形化されておら
ず、それゆえユーザはこれらのコードを調和させかつ一貫性をもって使用してい
ない。したがって、シンボルの解釈に難がある。 例えば、金融の世界では、金融取引は企業およびそれらの証券を参照してそれ
ぞれが異なる組の取引(チケット)シンボルを用いる。合衆国内ではあるが、ロ
ーカルの取引はシンボル名を調和し、一般に、世界的な取引は各々、企業および
それらの証券を識別するため特定のシンボル組およびシンボル構成を使用する。
例えば、PSE(太平洋ストック取引)およびNYSE(ニューヨークストック
交換)の両方は、IBMの証券を表明するためシンボル「IBM」を使用する。
しかしながら、合衆国では、シンボル「T」はAT&Tの証券を指し、一方カナ
ダでは「T」は企業Telosの証券を指す。英国では、シンボル「T」は他の
企業の証券を参照し得る。 Reuters,Bloomberg,Bridge等の金融情報のベンダー
はまた、企業およびそれらの証券を参照するためユニークなシンボル組および構
成を使用する。多くの金融情報のベンダーは、境界を定めるキャラクタにより分
離された2つの部分にセグメント化された構造シンボルコードを用いる。例えば
、ベンダーは、ROOTセグメントが特定の企業の証券を参照し、SOURCE
セグメントが証券が取引される国または取引所を参照する、シンボル構成ROO
T(境界を定めるキャラクタ)SOURCEを用いることができる。境界を定め
るキャラクタは典型的には「@」または「.」である。 多数のシンボル組が流通しているので、それが属する証券および企業を識別す
るためにシンボルを解釈することは困難である。例えば、単一のベンダーは、フ
ランスにおいて取引されたIBMの証券を参照してシンボル「IBM.FR」を
用い、英国において取引された同じIBMの証券を参照してシンボル「IBM.
GB」を用いることができる。このどちらの場合も、シンボルIBM.FRおよ
びIBM.GBは両方とも同一企業IBMに関連する。しかしながら、2つのベ
ンダーは、2つの異なる企業により発行される2つの異なる証券を参照するため
同一のルートセグメントとソースセグメントを使用できる。例えば、第1のベン
ダーは、合衆国内で取引されたAT&T証券を参照してシンボル「T.US」を
用いることができ、一方第2のベンダーは、異なる企業の証券を参照するためシ
ンボル「T@US」を用いることができる。他方、2つの異なるベンダーが、企
業の同一証券を参照するため異なるルートおよびソースシンボルを用いることが
でき、第1のベンダーは、英国において取引されたIBMの証券を参照するため
、シンボル「IBM.UK」を用いることができ、一方、第2ベンダーは同一I
BM証券を参照して、同一IBM証券を参照するシンボル「IB.EG」を用い
ることができる。 特定の企業にリンクされた金融情報を参照する一貫性のあるシステムの必要性
は、オンラインの金融調査が増大するに連れていっそう重要になってきている。
金融ドキュメント(ドキュメント等)を格納するドキュメント貯蔵庫がインター
ネットのような公的ネットワークまたは私的ネットワークを介して投資家や調査
人にアクセス可能である。寄与者(contributors)は、記録保管の
ためのドキュメント貯蔵庫に特定の企業または証券に関する調査ドキュメントを
提出でき、ドキュメント貯蔵庫のクライアント(すなわち投資家または調査人)
は興味ある特定の企業または証券に関するドキュメントを検索できる。 記録保管処理において、寄与者は典型的には提出ドキュメントの主題である企
業または証券を参照する入力ストリングに沿ったドキュメントを提出する。しか
しながら、使用するシンボル組が多数なゆえに、ドキュメントの正確な記録保管
および検索が非常に問題を起こす傾向にある。寄与者は、典型的には種々のベン
ダーシンボルの何れかを使用した入力ストリングを提出し、流通でシンボルを取
引し、またはその寄与者に対する一意の特有なシンボルを使用する。このように
、寄与者により参照される企業証券を識別することは難しい。同様に、特定の企
業に関するドキュメントの検索を要するクライアントは、ベンダーシンボル、交
換シンボルまたは独立の入力シンボルを含む種々の形式で入力シンボルを提出す
る。このことが、検索処理を複雑にする。 証券シンボルの解釈に関する困難は、情報が正確に記録保管され検索可能な、
シンボリックにリンクされた情報を参照する一貫性のある不明瞭でないシステム
の一般的必要性を示している。 発明の概要 本発明は、特有なシンボルの使用にも関わらず、シンボリックにリンクされた
情報を参照し、記録保管し、検索する方法およびシステムを提供する。マスタシ
ンボルデータベースは、複数のマスタシンボルを格納する。ここで、各マスタシ
ンボルは、予め決定された構成にしたがってフォーマットされる。マスタシンボ
ルデータベースにおける各マスタシンボルは、一意のオブジェクトを識別する親
識別子にリンクされる。ユーザは、入力シンボルを供給することにより情報デー
タベースにおけるシンボリックにリンクされた情報を記録保管または検索できる
。入力シンボルは正規化され、マスタシンボルデータベースは一致するマスタシ
ンボルを探すため検索される。一致するマスタシンボルにリンクされた親識別子
は、次に情報データベース内の情報を検索または記録保管するために使用される
。 一実施形態によれば、本発明は、寄与者により提出されたドキュメントの自動
記録保管およびクライアントにより要求されたドキュメントの自動検索が入力シ
ンボルの分析に基づき設けられたコンピュータベースによるドキュメントの貯蔵
庫を備えた環境下で適用される。ドキュメントの貯蔵庫は、マスタシンボルのデ
ータベースを格納し、複数のオブジェクトまたはサブオブジェクトを参照する親
識別子にリンクされる。記録保管する処理において、ドキュメント貯蔵庫は、寄
与者が提出したドキュメントおよびドキュメント内において参照されたオブジェ
クトに属する入力シンボルを電子的に検索する。入力シンボルは、正規化され、
一致するマスタシンボルを探すためマスタシンボルデータベースを検索するよう
使用される。ドキュメントは、次に、一致するマスタシンボルに対応する親識別
子にリンクされるように、ドキュメントデータベース内に格納される。正規化さ
れたシンボルが、マスタシンボルデータベース内に検出されないとき、非確定の
ものを解決しようと試みて寄与者の履歴パターンの分析が実行される。クライア
ントは、入力シンボルを電子的に供給することにより、貯蔵庫に格納されたドキ
ュメントを検索できる。入力シンボルは、正規化され、少なくとも1つのクライ
アントの好みのパラメータが、入力シンボルの如何なる非確定をも解決するため
に使用できる。正規化されたシンボルは、一致するマスタシンボルを探すために
マスタシンボルデータベースを検索するために使用される。一致するマスタシン
ボルにリンクされた親識別子は、次に親識別子にリンクされたドキュメントを検
索するために使用される。 [詳細な説明] 本発明は、特有なシンボルの使用にもかかわらず、シンボルとしてリンクされ
た情報の参照、記録保管(archival)そして検索のための方法及びシス
テムを提供する。ここで説明される実施例は、ドキュメントを参照し、記録保管
(archive)し、検索するコンピュータベースのドキュメント貯蔵庫シス
テムに関する。一実施例によれば、ドキュメント貯蔵庫は、世界中で取引きされ
る企業(会社)に関するドキュメントを格納する。しかしながら、ここで説明さ
れる実施例は、単に説明のためのものであって、添付の特許請求の範囲を限定し
ようとするものではない。本発明は、シンボルとしてリンクされた情報を記録保
管し、検索し、又は参照することを必要とする任意の環境に適用可能である。 図1aは、本発明の一実施例による、親識別子、親識別子にリンクされた複数
のマスタシンボル、1つのオブジェクト、及びそのオブジェクトに関連する複数
のサブオブジェクトを示す。図1の下部には、例としてのオブジェクト130と
、オブジェクト130に関係するサブオブジェクト140a〜140bを示す。
また図1には、すべての可能なオブジェクトからなるオブジェクトスペース15
0を示す。たとえば、一実施例によれば、オブジェクトスペース150は、世界
中で取引きされるすべての企業を含み、オブジェクト130は、特定の企業を表
わし、関連サブオブジェクト(たとえば140a〜140c)は、その企業によ
って発行される有価証券を表現する。 図1の上部には、オブジェクト130とサブオブジェクト140a〜140c
を表わすマスタシンボルデータベースの構造を示す。特に、親識別子110は、
オブジェクト130に関係し、マスタシンボル115a〜115cは、サブオブ
ジェクト140a〜140cのそれぞれに関係する。図1aの上部と下部はおお
よそ対称である。図1aに示したように、各マスタシンボルは(たとえば115
a〜115c)は親識別子にリンクされている。各親識別子110は、順にオブ
ジェクトスペース150に存在する唯一のオブジェクトに関係する。 マスタシンボルデータベースの機能は、入力シンボルに基づく特定のオブジェ
クトの識別を可能とすることである。これはオブジェクトスペース150の3平
面の交わりによって示される。以下に詳細に説明するように、入力シンボルは正
規化され、マスタシンボルデータベースが、マッチするマスタシンボルを発見す
るために検索される。マッチするマスタシンボルにリンクされた親識別子は、オ
ブジェクト130を識別するために用いられる。 図1は唯一の親識別子と3個のマスタシンボルのみを示すが、マスタシンボル
データベースは、代表的には、多くのマスタシンボルを含み、そのうちの各マス
タシンボルは多くの親シンボル110の1つにリンクされる。たとえば、図1b
は、マスタシンボル115a〜115cが親識別子110aにリンクされ、マス
タシンボル115d〜115fが親識別子110bにリンクされ、マスタシンボ
ル115g〜115kが親識別子110cにリンクされ、マスタシンボル115
l〜115mが親識別子110dにリンクされている。このように、マスタシン
ボル115a〜115cは第1のオブジェクトに関係し、マスタシンボル115
d〜115fは第2のオブジェクトに関係し、マスタシンボル115g〜115
kは第3のオブジェクトに関係し、マスタシンボル1151〜115mは第4の
オブジェクトに関係する。 さらに一例が、図1aに示されるスキームのアプリケーションを説明する。本
発明によれば、各オブジェクト130は企業を表し、各サブオブジェクト(たと
えば140a〜140c)はその企業によって発行された有価証券を表す。この
例によると、唯一の親識別子110は各企業に割り当てられる。特定の企業によ
り発行された各有価証券は唯一のマスタシンボルに割り当てられ、この唯一のマ
スタシンボルは、その有価証券を発行する企業に割り当てられた親識別子110
にリンクされる。各マスタシンボルはリンクされた親識別子110とともにマス
タシンボルデータベースに格納される。 一実施例によると、マスタシンボルデータベースに格納されるすべてのマスタ
シンボルは、シンボルテンプレートによって定義される所定の構造を利用する。
図1cに、本発明の一実施例によるシンボルテンプレートを示す。シンボルテン
プレート145は任意の数のシンボルフィールド150(1)〜150(N)か
ら成る。各シンボルフィールド150(1)〜150(N)は情報のカテゴリー
を表わし、シンボル化されたオブジェクト又はサブオブジェクトの特定の属性に
対応する。このようにして、同一の所定のシンボルテンプレート145に従って
組立てられるマスタシンボルデータベースに、すべてのマスタシンボルが格納さ
れる。 特に、マスタシンボルデータベースに格納された各マスタシンボルは、シンボ
ルテンプレート145によって定義される各シンボルフィールド150(1)〜
150(N)に対応してマスタシンボルセグメントを含む。各シンボルセグメン
トはテキスト文字列を含む。たとえば、国属性に関係するシンボルフィールドに
対して、マスタシンボルデータベースに格納されたシンボルは、米国、英国、仏
国にそれぞれ属するシンボルセグメント(すなわちテキスト文字列)「US」、
「GB」、「FR」を含み得る。たとえば、図1aは、3つのシンボルフィール
ド(図示せず)を含む、シンボルテンプレート145に従って組立てられたマス
タシンボル115a〜115cを示す。各マスタシンボル115a〜115cは
、シンボルテンプレートによって定義されたシンボルフィールドにそれぞれ対応
して、3つのシンボルセグメント(すなわち120a1〜120c1、120a
2〜120c2、120a3〜120c3)から成るという事実から、このこと
は明らかである。 さらに、一例によって、マスタシンボルデータベースに格納されたシンボルの
構造を形成する対応するシンボルセグメントに対する、シンボルテンプレート1
45の関係を説明する。一実施例に従えば、マスタシンボルデータベースに格納
されたマスタシンボルは、特定のマーケットで取引される企業の有価証券をシン
ボライズする。この場合、図1dに示したようなシンボルテンプレート145が
使用される。ルートフィールドとして言及される第1のシンボルフィールド15
0aは企業の有価証券を特定し、ソースフィールドして言及される第2のシンボ
ルフィールドは150bは、その有価証券が取引された国を特定する。以上のよ
うに、この場合はマスタシンボルデータベースは、2つのシンボルセグメントを
含み、2つのシンボルセグメントは、図1dに示すシンボルテンプレート145
によって定義されたシンボルフィールド150aと150bのそれぞれに対応す
る、ルートセグメント(すなわち、企業の有価証券名に対応するASCII文字
列)とソースセグメント(すなわち、その有価証券が取引される国に対応するA
SCII文字列)である。 マスタシンボルデータベースに格納されたマスタシンボルは、正規化されたフ
ォーマットで格納され、マスタデータベースを参照し検索する一貫した方法を提
供する。このように、たとえばシンボルセグメント「US」は、米国に関連する
マスタシンボルデータベースに格納されたすべてのマスタシンボルに対して用い
られることができる。 図1aは、マスタシンボルデータベースに格納されたマスタシンボルは、サブ
オブジェクト140a〜140cに関連する一例を示すが、代替の実施例では、
マスタシンボル140a〜140cがオブジェクト130自体に関連する。マス
タシンボルデータベースの構造と親識別子にリンクする方法は、以下により詳細
に説明される。 ドキュメント貯蔵庫のユーザは、入力シンボルに関連する情報の格納又は検索
のいずれかのために、マスタシンボルデータベースに対して入力シンボルを入力
してサーチすることができる。しかしながら、シンボルの使用法が特異であれば
、入力シンボルは正規化され、それに関連するオブジェクト130が識別される
ように変換されなければならない。図2は、本発明の一実施例による、唯一の関
連オブジェクトを識別するために、入力シンボルを変換する一組のステップを示
すフローチャートである。ステップ210では、ユーザから入力シンボルを受信
する。ステップ20では、入力シンボルが一組の正規化ルールに従って、正規化
シンボルを得るために処理される。入力シンボルの正規化の手続きは、以下によ
り詳細に説明される。ステップ230では、正規化シンボルが既知(すなわちマ
スタシンボルデータベースに格納されるマスタシンボルに一致する)かどうかが
判断される。もし正規化シンボルが既知であれば、正規化シンボルにリンクされ
た親識別子110が検索される。そのとき、ステップ250では、検索された親
識別子110を用いて、情報(たとえば、電子化ドキュメント)の検索と記録保
管のような適切な処理が行われる。この手順はステップ290で終わる。 もし、正規化シンボル115が既知でなければ、すなわち、マスタシンボルデ
ータベースに格納されるマスタシンボルと一致しない場合(ステップ230の「
no」ブランチ)、ステップ260で、そのシンボルの入力者(submitt
er)の履歴パターンの分析を実行する。以下により詳細に説明するように、未
知の入力シンボルがそのユーザより以前に使用されたかどうか、それはどのよう
に変換されたかを判断するために、別個のデータベースをサーチすることを必要
とする。あるいは、これに代えて、特定のシンボルセグメントが決定できなけれ
ば、未決定のシンボルセグメントに対して発生する頻度を決定するために、ユー
ザの履歴の統計的分析を実行することができる。シンボルの提案者(contr
ibutor)の履歴パターンを用いて、そのシンボルを決定できれば、シンボ
ルは決定され(ステップ270の「yes」ブランチ)、正規化シンボル(ステ
ップ240)にリンクされた親識別子110の検索に、フローが続く。もしそう
でなければ(ステップ270の「no」ブランチ)、その手順は失敗である(ス
テップ280)。 図3は、本発明の一実施例による、シンボルとしてリンクされたドキュメント
の電子化された記録保管と検索を可能とするネットワークアーキテクチャを示す
ブロック図である。ドキュメント貯蔵庫319は、他のコンポーネントの間に、
コントリビュータゲートウェイサーバ340aとクライアントゲートウェイサー
バ340bを備える。サーバ340a及び340bは各々、ネットワークインタ
フェイス(図示せず)と同様にプログラムの命令を実行するプロセッサとメモリ
を有する。 一実施例によると、クライアント305はパーソナルコンピュータ310を使
用し、モデム315、POTS電話線317、インターネットサービスプロバイ
ダ320、TIライン330d、インターネット340、TI330c、及びク
ライアントゲートウェイサーバ340bを経由して、ドキュメント貯蔵庫319
と通信を行う。クライアント305は、所望のオブジェクト又はサブオブジェク
トに関する入力シンボルを入力して、ドキュメント貯蔵庫319に格納された特
定のデータ又はドキュメントをサーチすることができる。クライアントゲートウ
ェイサーバ340bは、ドキュメント貯蔵庫319からのドキュメントのサーチ
(search)及び検索(retrieval)を実行するための多くの処理
(以下により詳細に説明する)を実行する。特に、クライアントゲートウェイサ
ーバ340bは、クライアント305から入力シンボルを受信し、入力シンボル
を正規化し、対応する親識別子(存在するなら)を見出すためにマスタシンボル
データベース420をサーチし、そしてその親識別子にリンクされたドキュメン
トデータベースからドキュメントを検索するといった多くの処理を実行する。 クライアントゲートウェイサーバ340bはまた、GUI(グラフィカルユー
ザインターフェイス)を提供する処理を行う。このGUIは、特定のドキュメン
トについてドキュメント貯蔵庫をサーチするため、及びクライアントに検索ドキ
ュメントを表示するために、クライアント305が入力シンボルを入力するのに
便利なインタフェイスを提供する。一実施例によると、クライアントゲートウェ
イサーバ340bは、クライアントゲートウェイサーバ340bに接続している
クライアント(たとえば305)に対して、記憶手段(図示せず)に置かれるH
TML(ハイパーテキストマークアップ言語)コンテントを提供(serve)
する。特に、クライアントゲートウェイサーバ340bに格納されたHTMLペ
ージは、入力シンボルによってシンボライズされた特定のオブジェクトに関する
ドキュメントを求めてドキュメント貯蔵庫をサーチするために、クライアントが
入力文字列を入力することを可能とする便利なユーザインタフェイスを提供する
。さらに、クライアントゲートウェイサーバ340bは、クライアントによって
提供される入力サーチ文字列の入力と処理を可能とする少なくとも1つのCGI
(コモンゲートウェイインタフェイス)を実行することができる。 コントリビュータ340は、TIライン330a、インターネット340、T
Iライン330b、及びコントリビュータゲートウェイサーバ340bを経由し
てドキュメント貯蔵庫319と通信する。コントリビュータサイト340で作成
されるドキュメントは、TIライン330b、インターネット340、TIライ
ン330b、及びコントリビュータゲートウェイサーバ340aを経由してドキ
ュメント貯蔵庫319に送信される。コントリビュータゲートウェイサーバ34
0aは、コントリビュータからドキュメント及び入力シンボルを受信し、受信入
力シンボルを正規化し、マスタシンボルデータベース420をサーチし、そして
各種のコントリビュータによって入力されるドキュメントを記録保管することに
関して、多くの処理(以下に詳細に説明する)を実行する。コントリビュータ3
40はテキストファイル、PDF(ポータブルドキュメントファイル)、マイク
ロソフトワードファイル等を含む多くのフォーマットで、インターネットを介し
て電子的にドキュメント貯蔵庫319にドキュメントを入力することができる。
ドキュメント貯蔵庫319に含まれる残りのコンポーネントは、図4を参照して
以下に説明される。 図4は本発明の一実施例によるシンボルとしてリンクされたドキュメントを記
録保管し検索するドキュメント貯蔵庫システムの一部のアーキテクチャを示すブ
ロック図である。コントリビュータゲートウェイサーバ340a、クライアント
ゲートウェイサーバ340b、シンボルサーバ410、マスタシンボルデータベ
ース420、リレーショナルデータベース430、コントリビュータ履歴パター
ンデータベース440、ドキュメントファイルデータベース450、フルテキス
トデータベース460、クライアントデータベース470、正規化テーブルデー
タベース417、及びオブジェクトデータベース415を、ドキュメント貯蔵庫
319が備える。ただ1つのコントリビュータ340と1クライアント305が
図4に示されているが、システムは複数のコントリビュータと複数のクライアン
トで機能するように設計されている。 シンボルサーバ410は、コントリビュータゲートウェイサーバ340aとク
ライアントゲートウェイサーバ340bから、マスタシンボルデータベース42
0をサーチするようにリクエストを受けて処理する。特に、以下により詳細に説
明するように、シンボルサーバ410は、コントリビュータゲートウェイサーバ
340a又はクライアントゲートウェイサーバ340bのいずれかから、少なく
とも1つの正規化入力シンボルを受け取り、正規化入力シンボルに一致するマス
タシンボルがマスタシンボルデータベース420に発見される場合には、シンボ
ルデータベース420から検索される対応する親識別子110を返す。 マスタシンボルデータベース420はすべてのマスタシンボル(たとえば11
5a〜115c)のリストとこれらの関連親識別子110を格納している。たと
えば、一実施例によると、マスタシンボルデータベース420は、世界中の企業
によって発行された有価証券に関係する一組のマスタシンボルを格納する。一実
施例によると、マスタシンボルデータベース420は、世界中で取引される企業
のすべての既知の有価証券を参照する一組のソーステーブルから定期的に作成さ
れる。マスタシンボルデータベース420の作成は、以下により詳細に説明され
る。 図5aは、本発明の一実施例による、マスタシンボルデータベースにおけるマ
スタシンボルデータの格納のためのデータ構造を示す。特に、図5aは、シンボ
ルセグメント(たとえば120a1〜120c3)の任意の数(N)に従って、
組立てられるマスタシンボル(たとえば115a〜115c)とともに親識別子
を格納しリンクするためのデータ構造である。マスタシンボルデータベース42
0は、データベース420において各マスタシンボルに対して1レコード505
格納する。各レコード505は親識別子フィールドシンボルセグメントフィール
ド520(1)〜520(N)を格納する。シンボルセグメントフィールドの数
は、マスタシンボルデータベース420に格納されるマスタシンボルの構造を定
義するシンボルテンプレート145に依存して、変化する(すなわちシンボルセ
グメントの数は各シンボルを含むシンボルフィールドの数に正確に対応する)。
親識別子フィールド510とシンボルセグメントフィールド520(1)〜52
0(N)は、ハードディスクドライブのような記憶装置上の情報を格納するため
の1以上のメモリ位置を含む。たとえば、一実施例によれば、親識別子フィール
ド510は4バイトの情報を占有する32ビット整数値を格納する。シンボルセ
グメントフィールド520(1)〜520(N)は、所定の長さのASCIIテ
キスト文字列を格納する。 たとえば、図5bは、本発明の一実施例による世界中で取引きされる企業の有
価証券シンボルを格納する環境(context)下で適用される5aに示すデ
ータ構造の特定の例を示す。この実施例によると、3フィールド510、520
aそして520bを含むレコード505は、各有価証券シンボルのために作成さ
れる。フィールド520aと520bは、それぞれ企業の有価証券の名前に対応
するルートシンボルセグメントとその有価証券が取引きされる国に対応するソー
スシンボルセグメントとを格納する。フィールド510はマスタ有価証券シンボ
ルと関連する親識別子、すなわちその有価証券を発行する企業に割り当てられた
親識別子を格納する。マスタシンボルデータベース420は以下に詳細に説明さ
れる。 図6は、本発明の一実施例によるドキュメントファイルデータベースにおける
ドキュメントの格納のためのデータ構造を示す。ドキュメントファイルデータベ
ース450は、データベースに格納された各ドキュメントのための1レコード6
10を格納する。各レコード610は、ドキュメントファイルフィールド630
とドキュメント識別子フィールド620を有する。ドキュメントファイルフィー
ルド630はドキュメントの実際のフォーマットされたドキュメントデータを格
納する。これに代えて、ドキュメントファイルフィールド630は、ドキュメン
トデータが格納されているメモリ位置を指示するポインタを格納してもよい。ド
キュメント識別子フィールド620はドキュメントファイルデータベース450
に格納された各ドキュメントに割り当てられる一意的な識別コードを格納する。
以下に説明するように、ドキュメント貯蔵庫319にドキュメントを受け入れる
と、一意的なドキュメント識別子が受け入れドキュメントに対して作成され、ド
キュメント識別子フィールド620のドキュメントとともに格納される。ドキュ
メントは多くのファイルフォーマットの形で格納される。たとえば、ドキュメン
トは、PDFファイル、マイクロソフトワードファイル、テキストファイル等と
して格納される。 フルテキスト・データベース460は、ドキュメントデータをテキスト形式で
保存(格納)し、特定のキーワードについてドキュメントデータを検索できるよ
うにする。ある実施例によると、コントリビュータ・ゲートウェイ・サーバ34
0aはプロセスを実行し、コントリビュータ(140等)から受け取ったドキュ
メントをフルテキスト・データベース460保存用にテキスト形式に変換する。
フルテキスト・データベース460では、ドキュメント自体に含まれる特定の検
索擁護によりドキュメントの検索および取り出しが可能である。 図7は、本発明のある実施例により、ドキュメントリポジトリに保存したドキ
ュメントに関連する情報を保存するためのリレーショナル・データベースに用い
られるデータ構造を示す。リレーショナル・データベース430は、ドキュメン
トファイル・データベース450とマスタ・シンボル・データベース420との
間の架け橋の役割を果たす。特に、ドキュメントデータベースに保存される各ド
キュメントについて、リレーショナル・データベース430は、ドキュメントで
参照するオブジェクトまたはサブ・オブジェクトに対応する親ID720に対し
ドキュメントのドキュメントID730をクロス・リファレンスする。リレーシ
ョナル・データベース430はまた、コントリビュータから受け取ったドキュメ
ントの特定の属性に関して追加データを保存する。 レコード705は、ドキュメントリポジトリ319に保存された各ドキュメン
トについてリレーショナル・データベース430で生成される。本発明のある実
施例によると、各レコードはドキュメント識別子フィールド710、親識別子フ
ィールド720、コントリビュータIDフィールド730、マスタ・シンボル・
ポインタ・フィールド740、コントリビュータ入力シンボル・フィールド75
0および所定数のコントリビュータ・エレメント・フィールド(図示せず)を含
む。 ドキュメント識別子フィールド710は、そのドキュメントに割り当てられた
独自のドキュメント識別子を保存する。独自のドキュメント識別子は、ドキュメ
ントリポジトリ(貯蔵庫)319でドキュメントを受けた時点で生成される。親
識別子フィールド720は、ドキュメントに関連するオブジェクトに関する親識
別子を保存する。普通は、親識別子フィールド720は、ドキュメントのコント
リビュータが提出する入力シンボルにリンクされる親識別子を保存する。以下に
詳細に述べるように、コントリビュータが提出した新ドキュメントのアーカイブ
(記録保管)の一部として、コントリビュータ入力シンボルを正規化し、マスタ
・シンボル・データベース中の一致するマスタ・シンボルにリンクされた親識別
子をマスタ・シンボル・データベースから取り出す。この親識別子は親識別子フ
ィールド720に保存する。例えば、ある実施例によると、財務ドキュメントの
アーカイブのコンテキストでは、親識別子フィールド720は、ドキュメント識
別子フィールド710に保存されたドキュメント識別子を持つドキュメントに関
連する企業の識別子を保存する。 コントリビュータIDフィールド730は、ドキュメントのコントリビュータ
に対応する独自のコントリビュータ識別子を保存する。マスタ・シンボル・ポイ
ンタ・フィールド740は、ドキュメントのオブジェクトに関連するマスタ・シ
ンボル・データベース420のマスタ・シンボルへのポインタを保存する。特に
、このポインタはコントリビュータの提供する正規化した入力シンボルを使って
マスタ・シンボル・データベース420を検索することによって見つけた一致す
るマスタ・シンボルをポイントするポインタである。コントリビュータ入力シン
ボル・フィールド750は、ドキュメントを提出する時(正規化前に)コントリ
ビュータが提供した入力シンボルを保存する。 図8は、本発明のある実施例による特定のコントリビュータの履歴シンボル利
用トレンドに関連する情報を保存するためのコントリビュータ履歴パターン・デ
ータベースに用いられるデータ構造を示す。コントリビュータ履歴パターン・デ
ータベース440の目的は、コントリビュータの提供する入力シンボルの正規化
を支援し、ドキュメントリポジトリ319にドキュメントを提出する時、コント
リビュータが提供するあいまいな記号の分析を可能にすることである。例えば、
コントリビュータは、シンボル・セグメントが1個以上失われたドキュメントと
入力シンボルを提出することがある。あるいは、コントリビュータは、正規化お
よびマスタ・シンボル・データベース420検索後に分析できないシンボル・セ
グメントを1個以上含む入力シンボルを提出することがある。 コントリビュータ履歴パターン・データベース440は、ドキュメントリポジ
トリ319にドキュメントを与える各コントリビュータのレコードを保存する。
各レコードは、コントリビュータIDフィールド810、および所定数の優位使
用セグメント・フィールド820(1)−820(N)からなる。本発明の実施
例では、各レコード805に保存される優位使用セグメント・フィールドの数は
、マスタ・シンボル・データベース420にマスタ・シンボルを保存するための
シンボル・テンプレート145に定義されるシンボル・フィールドの数に正確に
一致する。 コントリビュータIDフィールド810は、ドキュメントリポジトリ319に
ドキュメントを提出する各コントリビュータの独自のコントリビュータ識別子を
保存する。優位使用セグメント810(1)−820(N)は、シンボル・フィ
ールド150(1)−150(N)にそれぞれ正確に対応し、それぞれがコント
ロールのそれぞれのシンボル・フィールドに対応する最も頻繁に提出されたシン
ボル・セグメントを保存する。 例えば、財務ドキュメントリポジトリのコンテキストでは、マスタ・シンボル
・データベースは構造ROOT.SOURCEを利用して企業有価証券・シンボ
ルを保存するが、コントリビュータ履歴パターン・データベースは次のレコード
を保存することがある。 レコード1 フィールド810:コントリビュータ1ID フィールド820(1):<空白> フィールド820(2):GB レコード2 フィールド810:コントリビュータ2ID フィールド820(1):<空白> フィールド820(2):US レコード3 フィールド810:コントリビュータ3ID フィールド820(1):<空白> フィールド820(2):FR レコード1−3はそれぞれ、コントリビュータ1−3の優位使用セグメントを
保存する。第1の優位シンボル・セグメント・フィールド820(1)は全コン
トリビュータについて空白で、図1cに示すシンボル・テンプレート145のル
ート・フィールドには優位使用セグメントが存在しないことを表す。第2優位シ
ンボル・セグメント・フィールド820(2)には、コントリビュータ1−3の
エントリが入っている。特に、レコード1はコントリビュータ1の提出したGB
が最優位シンボル・セグメント、USがコントリビュータ2の提出した最優位シ
ンボル・セグメント、FRがコントリビュータ3の提出した最優位シンボル・セ
グメントであることを示す。 故に、ある実施例によると、コントリビュータ2がソース・フィールド150
bに対応するシンボル・セグメントのない入力シンボルを提出しようとすると、
コントリビュータ履歴パターン・データベースが検索され、「US」がコントリ
ビュータ2の提出したソース・フィールドの最優位使用セグメントであると決定
する。そのため、シンボル・セグメント「US」が、このコントリビュータの与
える入力シンボルのソース・セグメントとして割り当てられる。 履歴パターン・データベース440の生成については、以下に詳細に述べる。 図9は、本発明のある実施例によるクライアント・プリファレンスに関連する
情報を保存するためのクライアント・データベースに用いられるデータ構造を示
す。クライアント・プリファレンス・データベース470は、クライアントの提
出した入力シンボルの正規化を支援するため、デフォルトのシンボル・セグメン
トに関するクライアント・プリファレンス・データを保存する。コントリビュー
タ履歴パターン・データベース同様、クライアント・データベース440の目的
は、ドキュメントリポジトリ319にドキュメントを提出する時、クライアント
が提供するあいまいなシンボルを解析できるようにすることである。ただし、あ
る実施例によると、クライアント・データベースはクライアントの履歴トレンド
を分析するのではなく、デフォルトのシンボル・セグメント・プリファレンスを
前もってクライアントが選択できるようにすることで作成する。例えば、クライ
アントはシンボル・セグメントが1個以上失われているドキュメントリポジトリ
319を検索するため入力シンボルを提出することがある。あるいは、クライア
ントは、マスタ・シンボル・データベース420の正規化と検索の後に解析でき
ないシンボル・セグメントを1個以上含む入力シンボルを提出することがある。 クライアント履歴パターン・データベース440は、ドキュメントリポジトリ
319を使って各クライアントのレコードを保存する。各レコードは、クライア
ントIDフィールド910、および所定数のクライアント・プリファレンス・セ
グメント・フィールド920(1)−920(N)からなる。各レコード905
のクライアント・プリファレンス・セグメント・フィールドの数は、マスタ・シ
ンボル・データベース420にマスタ・シンボルを保存するためのシンボル・テ
ンプレート145に定義されるシンボル・フィールドの数に正確に対応する。 クライアントIDフィールド910は、ドキュメントリポジトリ319を使っ
て各クライアントの独自のクライアント識別子を保存する。クライアント・プリ
ファレンス・セグメント920(1)−920(N)は、シンボル・テンプレー
ト145のシンボル・フィールド150(1)−150(N)にそれぞれ対応し
、それぞれは、クライアントのそれぞれのシンボル・フィールドに対応するクラ
イアント定義のデフォルトのプリファレンス・セグメントを保存する。 例えば、財務ドキュメントリポジトリのコンテキストでは、マスタ・シンボル
・データベースは構造ROOT.SOURCEを利用して企業有価証券・シンボ
ルを保存するが、クライアント・データベースは次のレコードを保存することが
ある: レコード1 フィールド910:クライアント1ID フィールド920(1):<空白> フィールド920(2):GB レコード2 フィールド910:クライアント2ID フィールド920(1):<空白> フィールド920(2):US レコード3 フィールド910:クライアント3ID フィールド920(1):<空白> フィールド920(2):FR レコード1−3はそれぞれ、クライアント1−3のクライアント・プリファレ
ンス・セグメントを保存する。第1のクライアント・プリファレンス・セグメン
ト・フィールド920(1)はクライアントについて空白で、図1cに示すシン
ボル・テンプレート145のルート・フィールドにはクライアント・プリファレ
ンス・セグメントが確立していないことを表す。第2クライアント・プリファレ
ンス・セグメント・フィールド920(2)には、コントリビュータ1−3のエ
ントリが入っている。特に、レコード1はクライアント1−3がそれぞれ「US
」、「GB」、および「FR」をそれぞれのソース・フィールド150bに選ん
だことを示す。 故に、ある実施例によると、クライアント2がソース・フィールド150bに
対応するシンボル・セグメントのない入力シンボルを提出しようとすると、クラ
イアント履歴データベースが検索され、「US」はソース・フィールドについて
クライアント2が選択したデフォルトのシンボル・セグメントであると決定され
る。そのため、シンボル・セグメント「US」がクライアントの提出した入力シ
ンボルのソース・セグメントとして割り当てられる。 図10は、本発明のある実施例による各種シンボル・セットに関連する正規化
テーブル・データベースに用いられるデータ構造である。正規化テーブル・デー
タベース417の機能は、コントリビュータまたはクライアントの提出した入力
シンボルの正規化を支援することである。クライアントとコントリビュータは既
存のあらゆる数のシンボルを使って入力シンボルを提供することができるため、
流通している各種シンボル・セットとマスタ・シンボル・データベース420に
保存されたマスタ・シンボルのセットとの間のネゴシエーションにメカニズムが
用いられる。例えば、財務(金融)シンボルに関して、コントリビュータとクラ
イアントがあらゆる数のベンダー・シンボルまたは交換(取引)シンボルを使っ
て入力ストリングを提出することがある。正規化テーブル・データベース417
によって、流通している異なるシンボル・セット間の変換とネゴシエーションが
可能になる。 例えば、ある実施例によると、正規化テーブル・データベース41は、各種財
務情報のベンダーや為替のシンボル・セットをマスタ・シンボル・データベース
420に保存されたマスタ・シンボルに関連づける情報を保存する。特に、ある
コントリビュータはシンボル・セグメント「GB」を英国の参照に用いる一方、
別のコントリビュータはシンボル・セグメント「EN」を使用する場合がある。
しかし、マスタ・シンボル・データベース420に保存されたマスタ・シンボル
は英国を参照するのにシンボル・セグメント「UK」を使うことがある。故に、
クライアントがシンボル・セグメント「GB」の入ったシンボルを提出する場合
、これはマスタ・シンボル・データベース420に保存されたマスタ・シンボル
に対し検索できるように「UK」に正規化しなければならない。 ある実施例によると、正規化テーブル・データベースはコントリビュータまた
はクライアントが使うかもしれない流通している各シンボルについてレコード1
005を保存する。レコード1005は、シンボル・オーナー・フィールド10
10、オーナー・シンボル・セグメント・フィールド1020、マスタ・シンボ
ル・セグメント・フィールド1030を含む。シンボル・オーナー・フィールド
1010は流通している特定のシンボル・セグメントが属するエンティティまた
は組織の独自の識別子を保存する(為替やベンダー等)。オーナー・シンボル・
セグメント・フィールド1020は、特定のシンボル・オーナー(ベンダーや為
替等)の採用するシンボル・セグメントのASCIIストリングを保存する。マ
スタ・シンボル・セグメント1010フィールドは、マスタ・シンボル・データ
ベース420に保存されるであろう対応するシンボル・セグメントを保存する。
故に、マスタ・シンボル・セグメント・フィールド1030はフィールド102
0に保存されるオーナー・シンボル・セグメントの正規化に対応するシンボル・
セグメントを保存する。 例えば、正規化テーブル・データベースは次のような2つのレコードを含むこ
とができる。 レコード1 フィールド1:GB フィールド2:シンボル・オーナー1ID フィールド3:EN レコード2 フィールド1:GB フィールド2:シンボル・オーナー2ID フィールド3:UK この場合、レコード1は、シンボル・オーナー1が英国を指すのにシンボル・
セグメント「EN」を使う一方、マスタ・シンボル・データベース420に保存
されたシンボルは英国を指すのにシンボル・セグメント「UK」を用いることを
示す。レコード2は、シンボル・オーナー2が英国を指すのにシンボル・セグメ
ント「UK」を使うのに対して、マスタ・シンボル・データベースに保存された
シンボルは英国を指すのにシンボル・セグメント「GB」を用いることを示す。
故に、クライアントまたはコントリビュータがシンボル・オーナー2に対応する
シンボル・フォーマットで入力シンボルを提出し、入力シンボルがシンボル・セ
グメント「UK」を含む場合、シンボル・セグメント「UK」はマスタ・シンボ
ル・データベース420に保存されたすべてのマスタ・シンボルで英国を表すの
に用いられるシンボル・セグメントに対応するため、「GB」に正規化されるこ
とになる。 図11は、本発明のある実施例による、親識別子にオブジェクトを関連づける
情報を保存するためのオブジェクト・データベースに用いられるデータ構造を示
す。レコード1105は、オブジェクト・スペース105で各オブジェクトにつ
いて生成される。各レコード1105は、オブジェクト名フィールド1110と
親IDフィード1120の2つのフィールドを含む。オブジェクト名フィールド
1110はオブジェクトの名を保存し、親IDフィールド1120はそのオブジ
ェクトに関連する独自の親識別子を保存する。例えば、本発明のある実施例によ
ると、オブジェクト・データベース415は世界中で取引される企業に関する情
報を保存する。この場合、レコード1105は各企業について生成される。オブ
ジェクト名フィールド1110は企業の名称を保存し、親IDフィールド112
0はフィールド1110で名づけられた企業に関連する独自の親識別子を保存す
る。 図12は、本発明のある実施例によるマスタ・シンボル・データベースの作成
のステップを示すフローチャートである。ある実施例によると、1個以上のシン
ボル・ソースファイルとオブジェクト・データベース415がマスタ・シンボル
・データベース420の作成に利用される。例えば、マスタ・シンボル・データ
ベース構築のコンテキストで、企業有価証券、世界中の企業の有価証券のための
多数の為替コードや週次ファイルが処理され、マスタ・シンボル・データベース
420を構築する。マスタ・シンボル・データベース420の再構築頻度はシン
ボル情報がどれだけ速く変更されるかによって変わる。 ステップ1210で、手順が開始される。ステップ1220で、ソース・ファイ
ルから次のシンボルが取り出される。ステップ1230で、取り出したシンボル
を文字ルールセットに従って正規化する。例えば、マスタ・シンボルが世界中で
取引される企業の有価証券に言及する実施例によると、利用可能なシンボル・ソ
ース・ファイルから各シンボルに次のキャラクタ(文字)ルールが適用される。 1.「@」や「=」などの特殊キャラクタはすべて「/」に変更する。 2.アルファベット文字はすべて大文字に変更する。 3.数字シンボルから最初のゼロはすべて取り除く。 ステップ1240で、プロセスルールが適用される。マスタ・シンボル・デー
タベース420が世界中で取引される企業の有価証券を参照するマスタ・シンボ
ルを保存する本発明のある実施例によると、次のプロセスルールが適用される。 1.同じ国で取引される同じ企業の同じ有価証券を参照する二重のシンボルは
取り除く。 2.特定のカントリールールを適用する。 ステップ1250で、正規化シンボルを親識別子110に割り当てる。これは、
オブジェクト・データベース415のシンボルに対応するオブジェクトを決定す
ることによって行う。ステップ1260で、正規化シンボル115をマスタ・シ
ンボル・データベース420に保存する。ステップ1270で、親識別子110
をマスタ・データベース420に保存し、マスタ・シンボル110にリンクされ
るようにする。ステップ1280で、ソース・ファイルのシンボルがすべて処理
されたか否か判断する。処理されていない場合(ステップ880の「ノー」ブラ
ンチ)、次のシンボルを調べる。処理されている場合(ステップ1280の「イ
エス」ブランチ)、手順は終了する。 コントリビュータ・ゲートウェイ・サーバ340aは多数のプロセスを実行し
て、コントリビュータ(340等)から受けたドキュメントの受信やアーカイブ
を管理する。この機能を実現するため、コントリビュータ・ゲートウェイ・サー
バ340aは、コントリビュータ履歴パターン・データベース440、正規化テ
ーブル・データベース417、ドキュメントファイル・データベース450、フ
ルテキスト・データベース460、リレーショナル・データベース430、シン
ボル・サーバ410を含む多数のデータベースとインタラクトする。 図13は、本発明のある実施例によるコントリビュータから受けたドキュメン
トの自動アーカイブに関連するドキュメントリポジトリ319での各種サーバと
データベースとの間の情報フローを示す。特に、コントリビュータ・ゲートウェ
イ・サーバ340aはコントリビュータ340からドキュメントファイル131
0および入力シンボルを受けるプロセスを実行する。本発明のある実施例による
と、ドキュメントを提出するため、コントリビュータ340はドキュメント13
10に関する情報の入った構造化データ形式のヘッダ・ファイル1320を送信
することができる。ヘッダ・ファイル1320(図示せず)は、例えば入力シン
ボル・フィールドやコントロールの名およびドキュメントの日付などのコントリ
ビュータの情報を含む多数のフィールドから構成される。故に、コントリビュー
タ・ゲートウェイ・サーバ340aは、提出された特定のドキュメントに関する
情報を抽出するため、ヘッダ・ファイル1320をパーシングする追加プロセス
を実行することができる。 受信したヘッダ・ファイル1320から入力シンボルを抽出すると、コントリ
ビュータ・ゲートウェイ・サーバ3401は文字およびプロセスルールのセット
に従って入力シンボルを正規化するプロセスを実行する。このプロセスを実行す
る際、コントリビュータ・ゲートウェイ・サーバ340aは、一定のシンボル・
セグメントを解析するため、1個以上のシンボル・セグメント1325を使って
正規化テーブル・データベース417を検索し、正規化テーブル417から正規
化したシンボル・セグメント1327を入手することができる。シンボル・セグ
メントが解析されない場合、コントリビュータ・ゲートウェイ・サーバ340a
はコントリビュータ履歴パターン・データベース3440からコントリビュータ
の履歴パターン1360に関する統計データを取り出して、シンボル・セグメン
トを解析することができる。 正規化後、コントリビュータ・ゲートウェイ・サーバ340aは正規化した入
力シンボルをシンボル・サーバ410に送る(1340)。シンボル・サーバ4
10は、正規化シンボルを使ってマスタ・シンボル・データベース420を検索
し、マスタ・シンボル・データベースの一致するマスタ・シンボルにリンクされ
た親識別子を取り出す。シンボル・サーバ410がマスタ・シンボル・データベ
ース420に一致するマスタ・シンボルを見つけた場合、対応する親識別子11
0を返す。そうでない場合、シンボル・サーバ410は非確認シンボル1340
を示すメッセージを送る。 そして、コントリビュータ・ゲートウェイ・サーバ340aは独自のドキュメ
ント識別子を生成し、そのドキュメント識別子、親識別子110およびコントリ
ビュータ・データ(1350)をリレーショナル・データベース430に保存す
る。正規化入力シンボルを確認できない場合、コントリビュータ・ゲートウェイ
・サーバ340aはコントリビュータ入力シンボル(1365)を使ってリレー
ショナル・データベース430を検索し、入力シンボルが以前に親識別子110
にリンクされていたか否か決定することができる。そして、コントリビュータ・
ゲートウェイ・サーバ340aはドキュメントを保存し、ドキュメントファイル
・データベース450のドキュメント識別子(1370)にリンクされるように
する。 コントリビュータ・ゲートウェイ・サーバ340aはまた、異なるドキュメン
トファイル形式間のネゴシエートという追加プロセスを実行することができる。
故に、例えば、コントリビュータ・ゲートウェイ・サーバ340aは特定のファ
イル形式で受け取ったドキュメントをフルテキスト・データベース460に保存
するためテキスト形式(1380)に変換するルーチンを実行することができる
。 図14は、本発明のある実施例によるドキュメントリポジトリでドキュメント
の自動アーカイブのステップを示すフローチャートである。ステップ1410で
、ドキュメントファイルとヘッダ・ファイルがドキュメントリポジトリ319で
受け取られる。ステップ1415で、入力シンボルがヘッダ・ファイル1415
から抽出される。ステップ1420で、入力シンボルが文字およびプロセスルー
ルのセットに従って正規化される。ステップ1425で、入力シンボルにすべて
のシンボル・セグメントが入っているか否かが判断される。入っていない場合(
ステップ1425の「ノー」ブランチ)、コントリビュータが用いる優位シンボ
ル・セグメントが履歴パターン・データベース440から受信される(ステップ
1440)。ステップ1430で、正規化テーブル・データベース417を照会
し、一定のシンボル・セグメントを解析する。ステップ1445で、マスタ・シ
ンボル・データベース420を正規化シンボルを使って検索する。一致するマス
タ・シンボルが見つかったら(ステップ1450の「イエス」ブランチ)、ドキ
ュメント識別子を生成する(ステップ1455)。そして、ドキュメント識別子
、親識別子110とヘッダ・ファイル1420からの構造化データがリレーショ
ナル・データベース430に保存される(ステップ1460)。ステップ146
5で、ドキュメントとドキュメント識別子がドキュメントデータベース450に
保存され、ドキュメント識別子がドキュメントにリンクされる。ステップ147
0で、ドキュメントのテキストがフルテキスト・データベース460に保存され
る。手順はステップ1480で終了する。 マスタ・シンボル・データベース420に一致するマスタ・シンボルが見つか
らない場合、リレーショナル・データベース430をコントリビュータ提出シン
ボルを使って検索する(ステップ1452)。コントリビュータ提出シンボルが
以前に使われており、親識別子110にリンクされている場合(ステップ145
4の「イエス」ブランチ)、対応する親識別子110が使われる。そうでない場
合、手順は失敗する(ステップ1454の「ノー」ブランチ)。コントリビュー
タが、解析できないシンボルを使って過去にドキュメントを提出した可能性があ
るため、このようなことが発声する。しかし、シンボルは人的入力によって手動
で解析されることがある。この場合、リレーショナル・データベース430は、
手動で解析されたコントリビュータによって与えられた入力シンボルをコントリ
ビュータ入力シンボル・フィールド750に保存するドキュメントについて、レ
コード705を保存する。 クライアント・ゲートウェイ・サーバ340bは、クライアント(305等)
の要求するドキュメントの検索ストリングの処理と取り出しを管理するため多数
のプロセスを実行する。この機能を実現するため、クライアント・ゲートウェイ
・サーバ340bは、クライアント・データベース470、ドキュメントファイ
ル・データベース450、フルテキスト・データベース460、正規化テーブル
・データベース417、リレーショナル・データベース430、シンボル・サー
バ410を含む多数のデータベースとインタラクトする。図15は、本発明のあ
る実施例による、クライアント305の提出した入力シンボルに基づくドキュメ
ントの自動取り出しに関連するドキュメントリポジトリ319での各種サーバと
データベースとの間の情報フローを示すブロック図である。 特に、クライアント・ゲートウェイ・サーバ340bは、クライアントによる
検索要求の入力を可能にするGUIを提供するプロセスを実行する。ある実施例
によると、クライアント・ゲートウェイ・サーバ340bは、特定のドキュメン
ト要求に関連するクライアント305の提出した入力シンボル1510の入力と
処理を可能にするCGIスクリプトを実行する。 クライアント・ゲートウェイ・サーバ340bは、クライアントの提出した入
力シンボル1510を正規化するプロセスを実行する。入力シンボルを受け取る
と、クライアント・ゲートウェイ・サーバ340bは、クライアント305が特
定のセグメントの失われた入力シンボルを提出している場合、デフォルトのシン
ボル・セグメントに関してクライアント・データベース470から情報1560
を取り出すことができる。クライアント・ゲートウェイ・サーバ340bはまた
、1個以上の入力シンボル・セグメント1525を提出し、正規化テーブル・デ
ータベース417を検索して、対応するマスタ・シンボル・セグメント1527
を返すことができる。 正規化入力シンボル1520は、シンボル・サーバ410に転送される。する
と、シンボル・サーバ410は正規化入力シンボルを使ってマスタ・シンボル・
データベース420を検索し、マスタ・シンボル・データベース420の一致す
るマスタ・シンボルにリンクされた親識別子を見つける。シンボル・サーバ41
0から返された親識別子110を使って、クライアント・ゲートウェイ・サーバ
340bはリレーショナル・データベース430を検索し、提出された親識別子
110に対応するドキュメント識別子とドキュメント見出し1540のリストを
入手する。ドキュメント見出しは、クライアント・ゲートウェイ・サーバ340
bに処理され、クライアント305に表示される。クライアントからの選択を受
けると、クライアント・ゲートウェイ・サーバ340bはドキュメントファイル
・データベース450から選択したドキュメント1550を取り出す。 図16は、本発明のある実施例によるクライアント提出入力シンボルに基づく
ドキュメントリポジトリでのドキュメントの自動取り出しのステップを示すフロ
ーチャートである。ステップ1610で、入力シンボル1510がクライアント
305から受け取られる。ステップ1620で、文字およびプロセルルールなど
の正規化ルールが受け取った入力シンボル1510に適用される。ステップ16
25で、正規化シンボルがすべてのシンボル・セグメントを含むか否か判断され
る。含まない場合(ステップ1625の「ノー」ブランチ)、クライアント・デ
ータベース470から取り出したクライアント・プリファレンス・セグメントを
失われたセグメントに用いる(ステップ1630)。ステップ1645で、シン
ボル・データベース420を正規化されたシンボル115を使って検索する。マ
スタ・シンボル・データベース420に一致するマスタ・シンボルが見つかった
ら(ステップ1650の「イエス」ブランチ)、マスタ・シンボルにリンクされ
た親識別子110を使ってリレーショナル・データベース430を検索し、ドキ
ュメント識別子とドキュメント見出しのリストを生成する。シンボルが見つから
ない場合(ステップ1650の「ノー」ブランチ)、手順は失敗する。ステップ
1665で、見つかった各ドキュメントに関連するドキュメント見出しを選択の
ために表示する。ステップ1670で、クライアント・ゲートウェイ・サーバ3
40bがクライアント305によるドキュメント見出しの選択を受け入れる。選
択したドキュメント識別子に基づき、対応するドキュメントをドキュメントファ
イル・データベース450から取り出す。手順はステップ1680で終了する。 図17は、本発明のある実施例によるコントリビュータ履歴データベースを作
成するためのステップのセットを示すフローチャートである。ステップ1702
で、手順が開始される。ステップ1710で、リレーショナル・データベース4
30の次のレコードが取り出される。ステップ1720で、リレーショナル・デ
ータベース430からのレコードが分析される。特に、マスタ・シンボル・ポイ
ンタ・フィールド740を使って、レコードで参照されるマスタ・シンボルを決
定する。マスタ・シンボルを分析してテーブルをアップデートし、各種コントリ
ビュータによって提出された優位提出シンボル・セグメントに関する統計的情報
を記録する。このテーブル(図示せず)は、例えばアレイなどのデータ構造を使
ってインプリメントすることができる。ステップ1730で、リレーショナル・
データベース430のすべてのレコードが分析されたか否か判断される。されて
いない場合(ステップ1730の「ノー」ブランチ)、リレーショナル・データ
ベース430の次のレコードを分析する。されている場合(ステップ1730の
「イエス」ブランチ)、統計テーブルで生成された情報は履歴パターン・データ
ベース440に保存される(ステップ1740)。手順はステップ1750で終
了する。 例えば、リレーショナル・データベース430の分析後に次のテーブルを生成
することがある。
【表1】 故に、分析によると、シンボル・フィールド1に最も多く提出されるシンボル
・セグメントは、コントリビュータ1、2および3それぞれについて「T」、「
IBM」および「QW」であった。さらに、シンボル・フィールド2について最
も多く提出されるシンボル・セグメントは、コントリビュータ1、2および3そ
れぞれについて「US」、「GB」および「DE」だった。故に、この情報に基
づき、コンピュータ1については、コントリビュータ履歴パターン・データベー
ス440は各コントリビュータについて別個レコード805を保存することにな
る。特に、この分析に基づき、レコードはそれぞれコントリビュータ1、2、お
よび3について、優位使用セグメント・フィールド820(1)および820(
2)に「T」と「US」、「IBM」と「GB」、「QW」と「DE」を保存す
ることになる。
【図面の簡単な説明】
【図1a】 本発明の一実施例による親識別子、その親識別子にリンクされた多数のマスタ
シンボルおよびオブジェクトとそのオブジェクトに関連する多数のオブジェクト
間の関係を示す図である。
【図1b】 本発明の一実施例による、複数の親識別子にリンクされたマスタシンボルを示
す図である。
【図1c】 本発明の一実施例によるシンボルテンプレートを示す図である。
【図1d】 本発明の一実施例によるシンボルテンプレートの特別な例を示す図である。
【図2】 本発明の一実施例による、一意の関連オブジェクトを識別するために入力シン
ボルを解釈する一組のステップを示すフローチャートである。
【図3】 本発明の一実施例による、シンボリックにリンクされたドキュメントを電子的
に記録保管し検索することを可能とするネットワークアーキテクチャを示すブロ
ック図である。
【図4】 本発明の一実施例による、シンボリックにリンクされたドキュメントを記録保
管し検索するドキュメント貯蔵庫の一部のアーキテクチャを示すブロック図であ
る。
【図5a】 本発明の一実施例による、マスタシンボルデータベースにおけるマスタシンボ
ルデータを格納するデータ構造を示す図である。
【図5b】 本発明の一実施例により、世界中を通して取引される企業証券シンボルの貯蔵
庫を備えた環境下で適用される、図5aに示すデータ構造の特別な例を示す図で
ある。
【図6】 本発明の一実施例による、ドキュメントファイルデータベースにおけるドキュ
メントを格納するデータ構造を示す図である。
【図7】 本発明の一実施例による、ドキュメント貯蔵庫で格納されるドキュメントに関
する情報を格納するリレーショナルデータベースで使用されるデータ構造を示す
図である。
【図8】 本発明の一実施例による、特定の寄与者の履歴シンボル使用傾向に関する情報
を格納する寄与者履歴パターンデータベースで使用されるデータ構造を示す図で
ある。
【図9】 本発明の一実施例による、クライアントの好みに関する情報を格納するクライ
アントデータベースで使用されるデータ構造を示す図である。
【図10】 本発明の一実施例による、種々のシンボル組に関する正規化テーブルデータベ
ースで使用されるデータ構造を示す図である。
【図11】 本発明の一実施例による、親識別子に対するオブジェクトに関する情報を格納
するオブジェクトデータベースで使用されるデータ構造を示す図である。
【図12】 本発明の一実施例による、マスタシンボルデータベースを作成するステップの
フローチャートである。
【図13】 本発明の一実施例による、寄与者から受信されたドキュメントの自動記録保管
に関するドキュメント貯蔵庫319における種々のサーバとデータベースとの間
の情報フローを示すブロック図である。
【図14】 本発明の一実施例による、ドキュメント貯蔵庫におけるドキュメントを自動的
に記録保管するステップのフローチャートである。
【図15】 本発明の一実施例による、クライアント305により供給された入力シンボル
に基づくドキュメントの自動検索に関するドキュメント貯蔵庫319における種
々のサーバとデータベースとの間の情報フローを示すブロック図である。
【図16】 本発明の一実施例による、クライントにより提出された入力シンボルに基づき
ドキュメント貯蔵庫におけるドキュメントを自動検索するステップのフローチャ
ートである。
【図17】 本発明の一実施例による、寄与者履歴データベースを生成する一組のステップ
を示すフローチャートである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,CA,C H,CN,CR,CU,CZ,DE,DK,DM,DZ ,EE,ES,FI,GB,GD,GE,GH,GM, HR,HU,ID,IL,IN,IS,JP,KE,K G,KP,KR,KZ,LC,LK,LR,LS,LT ,LU,LV,MA,MD,MG,MK,MN,MW, MX,NO,NZ,PL,PT,RO,RU,SD,S E,SG,SI,SK,SL,TJ,TM,TR,TT ,TZ,UA,UG,UZ,VN,YU,ZA,ZW (72)発明者 ウラゾフ,ユーリ アメリカ合衆国,ニューヨーク 11375, フォレスト ヒルズ,アパートメント 2,セブンティセカンド ロード 110− 50 (72)発明者 バーガノフスキー,マイケル アメリカ合衆国,ニュージャージー 07661,リバー エッジ,ザ フェンウェ イ 395 Fターム(参考) 5B075 ND36 PP10 QT06

Claims (40)

    【特許請求の範囲】
  1. 【請求項1】 シンボルにリンクされた情報を格納し参照する方法であって
    、 シンボルを処理してマスタシンボルを生成する段階と、 マスタシンボルに対応する一意な親識別子を決定する段階と、 マスタシンボルが親識別子に対応づけられて記録されているマスタシンボルデ
    ータベース内に親識別子とマスタシンボルとを格納する段階と、 少なくとも一つの情報エレメントを格納して、少なくとも一つの情報エレメン
    トを親識別子にリンクする段階と、 で構成されることを特徴とする方法。
  2. 【請求項2】 シンボルを処理してマスタシンボルを生成する段階は、シン
    ボルに一組の文字規則を適用する段階で構成されることを特徴とする請求項1に
    記載の方法。
  3. 【請求項3】 シンボルを処理してマスタシンボルを生成する段階は、シン
    ボルに一組の処理規則を適用する段階で構成されることを特徴とする請求項1に
    記載の方法。
  4. 【請求項4】 少なくとも一つの情報エレメントはドキュメントであること
    を特徴とする請求項1に記載の方法。
  5. 【請求項5】 各マスタシンボルは少なくとも一つのシンボル領域をもつシ
    ンボルテンプレートに従って作成されることを特徴とする請求項1に記載の方法
  6. 【請求項6】 各マスタシンボルは、シンボルテンプレートで画定される少
    なくとも一つのシンボル領域に対応する少なくとも一つのシンボルフィールドで
    構成されることを特徴とする請求項5に記載の方法。
  7. 【請求項7】 各マスタシンボルは企業から発行される証券に該当すること
    を特徴とする請求項6に記載の方法。
  8. 【請求項8】 シンボルテンプレートは、証券の名称に該当するルートシン
    ボル領域と証券が取引される国に該当するソースシンボル領域とで構成されるこ
    とを特徴とする請求項7に記載の方法。
  9. 【請求項9】 少なくとも一つの情報エレメントを格納する段階は、情報エ
    レメント識別子を生成する段階と、情報エレメント識別子と親識別子とを格納し
    て親識別子を情報エレメント識別子にリンクする段階と、情報エレメントと情報
    エレメント識別子とを格納して情報エレメント識別子を情報エレメントにリンク
    する段階とで構成されることを特徴とする請求項1に記載の方法。
  10. 【請求項10】 各シンボルセグメントはアスキー(情報交換用米国標準コ
    ード)列で構成されることを特徴とする請求項6に記載の方法。
  11. 【請求項11】 親識別子はリレーショナルデータベース内の情報エレメン
    ト識別子にリンクすることを特徴とする請求項9に記載の方法。
  12. 【請求項12】 シンボルにリンクされた情報の保存方法であって、 情報エレメントと少なくとも一つの入力シンボルとを受信する段階と、 入力シンボルを処理して正規化シンボルを生成する段階と、 正規化シンボルに基づいてマスタシンボルデータベースを捜索して、整合する
    マスタシンボルとリンクされた親識別子とを探す段階と、 少なくとも親識別子と情報エレメントとを格納して親識別子を情報エレメント
    にリンクする段階と、 で構成されることを特徴とする方法。
  13. 【請求項13】 入力シンボルを処理して正規化シンボルを生成する段階は
    、一組の文字規則を入力シンボルに適用する段階で構成されることを特徴とする
    請求項12に記載の方法。
  14. 【請求項14】 シンボルを処理してマスタシンボルを生成する段階は、一
    組の処理規則をシンボルに適用する段階で構成されることを特徴とする請求項1
    2に記載の方法。
  15. 【請求項15】 情報エレメントはドキュメントであることを特徴とする請
    求項12に記載の方法。
  16. 【請求項16】 マスタシンボルデータベースには一組のマスタシンボルが
    記録され、各マスタシンボルは少なくとも一つのシンボル領域をもつシンボルテ
    ンプレートに従って作成されることを特徴とする請求項12に記載の方法。
  17. 【請求項17】 各マスタシンボルは、シンボルテンプレートで画定される
    少なくとも一つのシンボル領域に対応する少なくとも一つのシンボルセグメント
    で構成されることを特徴とする請求項16に記載の方法。
  18. 【請求項18】 各マスタシンボルは企業から発行される証券に該当するこ
    とを特徴とする請求の範囲項17に記載の方法。
  19. 【請求項19】 シンボルテンプレートは、証券の名称に該当するルートシ
    ンボル領域と証券が取引される国に該当するソースシンボル領域とで構成される
    ことを特徴とする請求項18に記載の方法。
  20. 【請求項20】 情報エレメントを格納する段階は、情報エレメント識別子
    を生成する段階と、情報エレメント識別子と親識別子とを格納して親識別子を情
    報エレメント識別子にリンクする段階と、情報エレメントと情報エレメント識別
    子とを格納して情報エレメント識別子を情報エレメントにリンクする段階とで構
    成されることを特徴とする請求項12に記載の方法。
  21. 【請求項21】 各シンボルセグメントはアスキー(情報交換用米国標準コ
    ード)列で構成されることを特徴とする請求項17に記載の方法。
  22. 【請求項22】 親識別子はリレーショナルデータベース内の情報エレメン
    ト識別子にリンクすることを特徴とする請求項20に記載の方法。
  23. 【請求項23】 更に、正規化シンボルに未解析セグメントが含まれる場合
    、寄与者データベースを捜索して優勢使用セグメントを探す段階と、優勢使用セ
    グメントを未解析セグメントへ割当てる段階とで構成されることを特徴とする請
    求項12に記載の方法。
  24. 【請求項24】 更に、正規化シンボルがマスタシンボルデータベースにな
    い場合、入力シンボルに基づいてデータベースを捜索する段階と、入力シンボル
    にリンクされた親識別子を検索する段階とで構成されることを特徴とする請求項
    12に記載の方法。
  25. 【請求項25】 シンボルにリンクされた情報の検索方法であって、 入力シンボルを検索する段階と、 入力シンボルを処理して正規化シンボルを生成する段階と、 正規化シンボルに基づいてマスタシンボルデータベースを捜索して、整合する
    マスタシンボルとマスタシンボルにリンクされた親識別子とを探す段階と、 情報エレメントデータベースを捜索して、親識別子にリンクされた情報エレメ
    ントを探す段階と、 親識別子にリンクされた情報エレメントを検索する段階と、 で構成されることを特徴とする方法。
  26. 【請求項26】 更に、入力シンボルに未解析セグメントが含まれるかどう
    かを判定する段階と、 入力シンボルに未解析セグメントが含まれている場合に、クライアントデータ
    ベースを捜索してクライアント優先セグメントを探し、当該クライアント優先セ
    グメントを未解析セグメントへ割当てる段階とで構成されることを特徴とする請
    求項25に記載の方法。
  27. 【請求項27】 入力シンボルを処理して正規化シンボルを生成する段階は
    、一組の文字規則をシンボルに適用する段階で構成されることを特徴とする請求
    項25に記載の方法。
  28. 【請求項28】 入力シンボルを処理して正規化シンボルを生成する段階は
    、一組の処理規則をシンボルに適用する段階で構成されることを特徴とする請求
    項25に記載の方法。
  29. 【請求項29】 情報エレメントはドキュメントであることを特徴とする請
    求項25に記載の方法。
  30. 【請求項30】 マスタシンボルデータベースには一組のマスタシンボルが
    記録され、各マスタシンボルは少なくとも一つのシンボル領域をもつシンボルテ
    ンプレートに従って作成されることを特徴とする請求項25に記載の方法。
  31. 【請求項31】 各マスタシンボルは少なくとも一つのシンボル領域をもつ
    シンボルテンプレートに従って作成されることを特徴とする請求項30に記載の
    方法。
  32. 【請求項32】 各マスタシンボルは、シンボルテンプレートで画定される
    少なくとも一つのシンボル領域に対応する少なくとも一つのシンボルセグメント
    で構成されることを特徴とする請求項31に記載の方法。
  33. 【請求項33】 各マスタシンボルは企業から発行される証券に該当するこ
    とを特徴とする請求項32に記載の方法。
  34. 【請求項34】 シンボルテンプレートは、証券の名称に該当するルートシ
    ンボル領域と証券が取引される国に該当するソースシンボル領域とで構成される
    ことを特徴とする請求項33に記載の方法。
  35. 【請求項35】 各シンボルセグメントはアスキー(情報交換用米国標準コ
    ード)列で構成されることを特徴とする請求項32に記載の方法。
  36. 【請求項36】 情報データベースはリレーショナルデータベースであるこ
    とを特徴とする請求項25に記載の方法。
  37. 【請求項37】 入力シンボルに基づくドキュメントの電子的保存のための
    ドキュメント貯蔵システムであって、 記憶装置と、 ネットワークインターフェイスと、 各マスタシンボルが親識別子とドキュメントデータベースとにリンクされて記
    録されたマスタシンボルデータベースを格納し、 ネットワークインターフェイスを介して入力シンボルとドキュメントとを受信
    し、 入力シンボルを処理して正規化入力シンボルを求め、 正規化入力シンボルに基づいてマスタシンボルデータベースを捜索して、整合
    するマスタシンボルと霖雨された親識別子とを探し、 ドキュメントをドキュメントデータベースに記録してドキュメントを親識別子
    にリンクする、 記憶装置に接続されたプロセッサと、 で構成されることを特徴とするドキュメント貯蔵システム。
  38. 【請求項38】 入力シンボルに少なくとも一つの未解析セグメントが含ま
    れている場合、プロセッサは、未解析シンボルセグメント毎に寄与者履歴パター
    ンデータベースを捜索して優勢使用セグメントを探し、当該優勢使用セグメント
    を未解析セグメントへ割当てることを特徴とする請求項37に記載のドキュメン
    ト貯蔵システム。
  39. 【請求項39】 入力シンボルに基づくドキュメントの電子的検索のための
    ドキュメント貯蔵システムであって、 マスタシンボルデータベースとドキュメントデータベースとが格納された記憶
    装置であって、マスタシンボルデータベースにはマスタシンボルが記録され、各
    マスタシンボルは親識別子にリンクされ、ドキュメントデータベースには親識別
    子にリンクされたドキュメントが記録される記憶装置と、 ネットワークインターフェイスと、 ネットワークインターフェイスを介して入力シンボルを受信し、 入力シンボルを処理して正規化入力シンボルを求め、 正規化入力シンボルに基づいてシンボルデータベースを捜索して、整合するマ
    スタシンボルとリンクされた親識別子とを探し、 ドキュメントデータベースからドキュメントを検索して親識別子にリンクする
    、プロセッサと、 で構成されることを特徴とするドキュメント貯蔵システム。
  40. 【請求項40】 入力シンボルに少なくとも一つの未解析セグメントが含ま
    れている場合、プロセッサは、未解析シンボルセグメント毎にクライアントデー
    タベースを捜索してクライアント優先セグメントを探し、当該クライアント優先
    セグメントを未解析セグメントへ割当てることを特徴とする請求項39に記載の
    ドキュメント貯蔵システム。
JP2001515889A 1999-06-18 2000-05-18 シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム Expired - Lifetime JP4754748B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/336,031 US7398262B1 (en) 1999-06-18 1999-06-18 Method and system for referencing, archiving and retrieving symbolically linked information
US09/336,031 1999-06-18
PCT/US2000/013914 WO2000079430A1 (en) 1999-06-18 2000-05-18 A method and system for referencing, archiving and retrieving symbolically linked information

Publications (3)

Publication Number Publication Date
JP2003527657A true JP2003527657A (ja) 2003-09-16
JP2003527657A5 JP2003527657A5 (ja) 2004-12-24
JP4754748B2 JP4754748B2 (ja) 2011-08-24

Family

ID=23314265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001515889A Expired - Lifetime JP4754748B2 (ja) 1999-06-18 2000-05-18 シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム

Country Status (7)

Country Link
US (1) US7398262B1 (ja)
EP (1) EP1192566A4 (ja)
JP (1) JP4754748B2 (ja)
AU (1) AU775019B2 (ja)
CA (1) CA2375481C (ja)
HK (1) HK1045736A1 (ja)
WO (1) WO2000079430A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009271911A (ja) * 2001-01-19 2009-11-19 Reuters Research Inc 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653871B2 (en) 2003-03-27 2010-01-26 General Electric Company Mathematical decomposition of table-structured electronic documents
US8055575B2 (en) * 2005-10-14 2011-11-08 Financial Intergroup Holdings, Ltd. Central counterparty for data management
EP2702160B1 (en) 2011-04-27 2020-05-27 Amyris, Inc. Methods for genomic modification
US9679247B2 (en) 2013-09-19 2017-06-13 International Business Machines Corporation Graph matching
CN104376119A (zh) * 2014-12-03 2015-02-25 天津南大通用数据技术股份有限公司 一种适应超大规模列存数据库的数据访问方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03196263A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 文書検索方法
JPH03196364A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 探索項構築の制御テーブルの導入方法
JPH03198384A (ja) * 1989-12-27 1991-08-29 Hitachi Ltd 熱電変換モジュール
JPH0454541A (ja) * 1990-06-21 1992-02-21 Fujitsu Ltd ファイル名生成処理方式
JPH06161855A (ja) * 1992-08-19 1994-06-10 American Teleph & Telegr Co <Att> ファイル装置およびファイルアクセス方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5230048A (en) * 1986-09-03 1993-07-20 Wang Laboratories, Inc. Data processing system with tree and list data structure
US5748953A (en) * 1989-06-14 1998-05-05 Hitachi, Ltd. Document search method wherein stored documents and search queries comprise segmented text data of spaced, nonconsecutive text elements and words segmented by predetermined symbols
US5992752A (en) * 1993-11-24 1999-11-30 Metrologic Instruments, Inc. Internet-based system for enabling information-related transactions over the internet using Java-enabled internet terminals provided with bar code symbol readers for reading Java-Applet encoded bar code symbols
US5623679A (en) 1993-11-19 1997-04-22 Waverley Holdings, Inc. System and method for creating and manipulating notes each containing multiple sub-notes, and linking the sub-notes to portions of data objects
CA2119921C (en) * 1994-03-23 2009-09-29 Sydney H. Belzberg Computerized stock exchange trading system
US5611059A (en) 1994-09-02 1997-03-11 Square D Company Prelinked parameter configuration, automatic graphical linking, and distributed database configuration for devices within an automated monitoring/control system
DE69623227T2 (de) 1995-10-27 2003-04-17 Ncr Int Inc Verfahren und System zur Berechnung von Dateinamen mit hoher Wahrscheinlichkeit der Eindeutigkeit
US5960200A (en) * 1996-05-03 1999-09-28 I-Cube System to transition an enterprise to a distributed infrastructure
US5946666A (en) * 1996-05-21 1999-08-31 Albert Einstein Healthcare Network Monitoring device for financial securities
US5913214A (en) * 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
US5864871A (en) * 1996-06-04 1999-01-26 Multex Systems Information delivery system and method including on-line entitlements
US5819271A (en) 1996-06-04 1998-10-06 Multex Systems, Inc. Corporate information communication and delivery system and method including entitlable hypertext links
US5903902A (en) 1996-09-09 1999-05-11 Design Intelligence, Inc. Design engine with tree and component structure
US5940843A (en) * 1997-10-08 1999-08-17 Multex Systems, Inc. Information delivery system and method including restriction processing
AUPO977997A0 (en) 1997-10-14 1997-11-06 Pouflis, Jason The utilisation of multi-lingual names on the internet
US6212638B1 (en) * 1997-12-02 2001-04-03 George C. Lee Method for generating unpredictable authentication identification symbols
US6055538A (en) 1997-12-22 2000-04-25 Hewlett Packard Company Methods and system for using web browser to search large collections of documents
US6122635A (en) * 1998-02-13 2000-09-19 Newriver Investor Communications, Inc. Mapping compliance information into useable format
US6236980B1 (en) * 1998-04-09 2001-05-22 John P Reese Magazine, online, and broadcast summary recommendation reporting system to aid in decision making
US6408282B1 (en) * 1999-03-01 2002-06-18 Wit Capital Corp. System and method for conducting securities transactions over a computer network
US6496836B1 (en) 1999-12-20 2002-12-17 Belron Systems, Inc. Symbol-based memory language system and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03196263A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 文書検索方法
JPH03196364A (ja) * 1989-12-20 1991-08-27 Internatl Business Mach Corp <Ibm> 探索項構築の制御テーブルの導入方法
JPH03198384A (ja) * 1989-12-27 1991-08-29 Hitachi Ltd 熱電変換モジュール
JPH0454541A (ja) * 1990-06-21 1992-02-21 Fujitsu Ltd ファイル名生成処理方式
JPH06161855A (ja) * 1992-08-19 1994-06-10 American Teleph & Telegr Co <Att> ファイル装置およびファイルアクセス方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009271911A (ja) * 2001-01-19 2009-11-19 Reuters Research Inc 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム

Also Published As

Publication number Publication date
CA2375481C (en) 2010-08-10
HK1045736A1 (zh) 2002-12-06
AU5034800A (en) 2001-01-09
JP4754748B2 (ja) 2011-08-24
EP1192566A4 (en) 2006-05-10
WO2000079430A1 (en) 2000-12-28
US7398262B1 (en) 2008-07-08
AU775019B2 (en) 2004-07-15
EP1192566A1 (en) 2002-04-03
CA2375481A1 (en) 2000-12-28

Similar Documents

Publication Publication Date Title
JP5536851B2 (ja) 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム
EP1559034B1 (en) Electronic document repository management and access system
US7092936B1 (en) System and method for search and recommendation based on usage mining
US7225197B2 (en) Data entry, cross reference database and search systems and methods thereof
US8234312B2 (en) Schema mapping and data transformation on the basis of layout and content
US6799184B2 (en) Relational database system providing XML query support
US8316292B1 (en) Identifying multiple versions of documents
US20010054153A1 (en) System and method for determining user identity fraud using similarity searching
US20030195873A1 (en) Identifier vocabulary data access method and system
US20020042784A1 (en) System and method for automatically searching and analyzing intellectual property-related materials
JP2003527657A (ja) シンボリックにリンクされた情報を参照し、記録保管し、検索する方法およびシステム
US20010039521A1 (en) Budget information and analysis system and method
WO2002027604A2 (en) Method and system for performing electronic commerce
Knijnenburg What are the issues that arise in the creation and presentation of a hybrid art work?

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100312

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4754748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term