JP4405493B2 - 構造化文書管理システム及びプログラム - Google Patents
構造化文書管理システム及びプログラム Download PDFInfo
- Publication number
- JP4405493B2 JP4405493B2 JP2006269484A JP2006269484A JP4405493B2 JP 4405493 B2 JP4405493 B2 JP 4405493B2 JP 2006269484 A JP2006269484 A JP 2006269484A JP 2006269484 A JP2006269484 A JP 2006269484A JP 4405493 B2 JP4405493 B2 JP 4405493B2
- Authority
- JP
- Japan
- Prior art keywords
- binary data
- structured document
- identification information
- file
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
OS(オペレーティングシステム)のローカルファイルとしてバイナリデータを保存し、XML文書に当該バイナリデータ(ローカルファイル)のファイル名などの情報を保存して管理する。
バイナリデータを文字列化してXMLのテキスト情報として保存する(例えば、特許文献1参照)。
RDB(リレーショナルデータベース)で、バイナリデータを管理する。ここでは、バイナリデータは、BLOB(Binary Large Object)と呼ばれるバイナリデータ格納用の列(カラム)に保存可能である。
図1は本発明の一実施形態に係るXML文書管理システムを含むクライアント−サーバシステムのハードウェア構成を示すブロック図である。図1のクライアント−サーバシステムは、XML文書管理システム10と、クライアント端末20を含む複数のクライアント端末(クライアント)とから構成される。各クライアント端末上では、XML文書管理システム10を利用するアプリケーション(アプリケーションプログラム)が動作する。クライアント端末20を含む複数のクライアント端末は、ローカルエリアネットワーク(LAN)のようなネットワーク30を介して、XML文書管理システム10と接続されている。なお、図1では、クライアント端末20以外のクライアント端末は省略されている。
まず、XML文書管理の原理について図2を参照して説明する。XML文書管理システム10では、XML文書は、従来から良く知られているように図2に示されるツリー構造で管理される。この管理は、ディレクトリを用いた、OSのファイルシステムにおけるファイル管理に相当する。図2では、“id”がそれぞれ“1”及び“2”のXML文書201及び202が、“公開特許_2005”で示されるノードの下位に登録されている。同様に、“id”が“10”のXML文書210が、“公開特許_2006”で示されるノードの下位に登録されている。XML文書201,202及び210は、例えばXMLで記述された特許文書である。
次に、バイナリデータ管理の原理について図3を参照して説明する。本実施形態では、テキストとしてのXML文書(XMLデータ)に付随するバイナリデータは、XML文書とは別のデータとして管理されて、XML文書と同様にXML文書データベース122に格納される。図3の例では、バイナリデータ211がXML文書201に付随し、バイナリデータ220A〜220CがXML文書210に付随している状態が示されている。ここでは、バイナリデータ211は特許文書としてのXML文書201に付随する特許図面のイメージデータであり、バイナリデータ220A〜220Cは特許文書としてのXML文書210に付随する特許図面のイメージデータである。
(a)エクステント
エクステントとは、指定されたサイズで確保された物理的に連続するページ領域を指す。
ファイルとは、データベース(XML文書データベース122)に格納される「論理的な」まとまり(つまり論理的に1つの意味を持つデータ集合)ごとに割り当てた管理単位である。ファイルは物理的には、1つ、もしくは複数のエクステントから構成される。ファイルは、初期エクステントサイズで作成され、データの追加に応じて、エクステント単位で拡張される。
ファイルテーブル(ファイルテーブル420)は、エクステント領域(エクステント領域410)に格納されているファイルを管理するためのテーブルである。ファイルテーブルは、ファイルを管理するためのファイルレコードと呼ばれるレコードをファイル数分格納する。ファイルレコードのデータフォーマットについては後述する。
まず、バイナリデータの登録処理について、図8のフローチャート及び図9のXML文書データベース122の状態を示す図を参照して説明する。
次に、バイナリデータの取り出し処理について、図10フローチャートを参照して説明する。
Claims (3)
- 構造化文書の集合を格納する構造化文書データベースと、
バイナリデータを構造化文書識別情報によって識別される指定の構造化文書に付随して登録することを要求するためのクライアント端末からのバイナリデータ登録要求に従い、当該クライアント端末から要求された前記指定の構造化文書に付随されるべきバイナリデータを管理するための、ファイル識別情報及びバイナリデータ識別情報との対が設定可能なヘッダ情報を含むバイナリデータの管理情報であって、当該バイナリデータを識別するためのバイナリデータ識別情報が前記ファイル識別情報として設定され、且つ当該ファイル識別情報と対をなすバイナリ識別情報が未設定のヘッダ情報を含むバイナリデータの管理情報を生成して、当該バイナリデータの管理情報を前記構造化文書データベースに格納する管理情報生成手段と、
前記クライアント端末から要求された前記指定の構造化文書に付随されるべきバイナリデータを前記構造化文書データベースに格納するバイナリデータ格納手段と、
前記指定の構造化文書に付随されるべきバイナリデータが前記構造化文書データベースに格納された際に、前記構造化文書データベースに格納されている管理情報のうち、前記指定の構造化文書を識別する構造化文書識別情報がファイル識別情報として設定され、且つ当該ファイル識別情報と対をなすバイナリデータ識別情報が未設定のヘッダ情報を含む構造化文書の管理情報、または前記指定の構造化文書に付随されるべきバイナリデータに先行して前記構造化文書データベースに格納された前記指定の構造化文書に付随する別のバイナリデータを識別するバイナリデータ識別情報がファイル識別情報として設定され、且つ当該ファイル識別情報と対をなすバイナリデータ識別情報が未設定のヘッダ情報を含むバイナリデータの管理情報を対象に、前記指定の構造化文書に付随されるべきバイナリデータを識別するバイナリデータ識別情報を、当該管理情報のヘッダ情報中に前記ファイル識別情報と対をなすバイナリデータ識別情報として設定することにより、当該バイナリデータ識別情報が設定された管理情報によって、前記指定の構造化文書に付随されるべきバイナリデータを前記指定の構造化文書と関連付ける関連付け手段と、
構造化文書識別情報によって識別される指定の構造化文書に付随するバイナリデータを取得するためのクライアント端末からのバイナリデータ取得要求に従い、前記指定の構造化文書を識別する構造化文書識別情報を前記ファイル識別情報として含む当該要求された構造化文書の管理情報を起点として、当該管理情報中のバイナリデータ識別情報から、当該バイナリデータ識別情報をファイル識別情報として含むバイナリデータの管理情報を辿る動作を繰り返すことにより、当該構造化文書と関連付けられている全てのバイナリデータを、当該構造化文書に付随して前記構造化文書データベースに格納された順に特定し、当該特定されたバイナリデータを前記構造化文書データベースから取得するバイナリデータ取得手段と
を具備することを特徴とする構造化文書管理システム。 - 前記クライアント端末からの検索要求に従い、前記構造化文書データベースに格納されている構造化文書の集合から当該検索要求で指定された検索条件に合致する構造化文書を特定する構造化文書特定手段を更に具備し、
前記指定の構造化文書が、前記クライアント端末からの前記検索要求に従って特定された構造化文書である
ことを特徴とする請求項1記載の構造化文書管理システム。 - 構造化文書データベースに格納される構造化文書を管理するコンピュータに、
バイナリデータを構造化文書識別情報によって識別される指定の構造化文書に付随して登録することを要求するためのバイナリデータ登録要求がクライアント端末から与えられる都度、当該クライアント端末から要求された前記指定の構造化文書に付随されるべきバイナリデータを管理するための、ファイル識別情報及びバイナリデータ識別情報との対が設定可能なヘッダ情報を含むバイナリデータの管理情報であって、当該バイナリデータを識別するためのバイナリデータ識別情報が前記ファイル識別情報として設定され、且つ当該ファイル識別情報と対をなすバイナリ識別情報が未設定のヘッダ情報を含むバイナリデータの管理情報を生成して、当該バイナリデータの管理情報を前記構造化文書データベースに格納するステップと、
前記クライアント端末から要求された前記指定の構造化文書に付随されるべきバイナリデータを前記構造化文書データベースに格納するステップと、
前記指定の構造化文書に付随されるべきバイナリデータが前記構造化文書データベースに格納される都度、前記構造化文書データベースに格納されている管理情報のうち、前記指定の構造化文書を識別する構造化文書識別情報がファイル識別情報として設定され、且つ当該ファイル識別情報と対をなすバイナリデータ識別情報が未設定のヘッダ情報を含む構造化文書の管理情報、または前記指定の構造化文書に付随されるべきバイナリデータに先行して前記構造化文書データベースに格納された前記指定の構造化文書に付随する別のバイナリデータを識別するバイナリデータ識別情報がファイル識別情報として設定され、且つ当該ファイル識別情報と対をなすバイナリデータ識別情報が未設定のヘッダ情報を含むバイナリデータの管理情報を対象に、前記指定の構造化文書に付随されるべきバイナリデータを識別するバイナリデータ識別情報を、当該管理情報のヘッダ情報中に前記ファイル識別情報と対をなすバイナリデータ識別情報として設定することにより、当該バイナリデータ識別情報が設定された管理情報によって、前記指定の構造化文書に付随されるべきバイナリデータを前記指定の構造化文書と関連付けるステップと、
構造化文書識別情報によって識別される指定の構造化文書に付随するバイナリデータを取得するためのクライアント端末からのバイナリデータ取得要求に従い、前記指定の構造化文書を識別する構造化文書識別情報を前記ファイル識別情報として含む当該要求された構造化文書の管理情報を起点として、当該管理情報中のバイナリデータ識別情報から、当該バイナリデータ識別情報をファイル識別情報として含むバイナリデータの管理情報を辿る動作を繰り返すことにより、当該構造化文書と関連付けられている全てのバイナリデータを、当該構造化文書に付随して前記構造化文書データベースに格納された順に特定し、当該特定されたバイナリデータを前記構造化文書データベースから取得するステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006269484A JP4405493B2 (ja) | 2006-09-29 | 2006-09-29 | 構造化文書管理システム及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006269484A JP4405493B2 (ja) | 2006-09-29 | 2006-09-29 | 構造化文書管理システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008090528A JP2008090528A (ja) | 2008-04-17 |
JP4405493B2 true JP4405493B2 (ja) | 2010-01-27 |
Family
ID=39374614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006269484A Expired - Fee Related JP4405493B2 (ja) | 2006-09-29 | 2006-09-29 | 構造化文書管理システム及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4405493B2 (ja) |
-
2006
- 2006-09-29 JP JP2006269484A patent/JP4405493B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008090528A (ja) | 2008-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5023715B2 (ja) | 情報処理システム、情報処理装置及びプログラム | |
JP4445509B2 (ja) | 構造化文書検索システム及びプログラム | |
JP5656563B2 (ja) | 文書管理システム、文書管理システムの制御方法、プログラム | |
JP4189369B2 (ja) | 構造化文書検索装置及び構造化文書検索方法 | |
JP2011065546A (ja) | ファイル検索システム及びプログラム | |
JPH11242676A (ja) | 構造化文書登録方法、検索方法、およびそれに用いられる可搬型媒体 | |
JP4247108B2 (ja) | 構造化文書検索方法、構造化文書検索装置、及びプログラム | |
JP2008090404A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP3868171B2 (ja) | 文書のデジタル署名付き管理方法および文書管理装置 | |
JP2005227851A (ja) | 構造化データ記憶方法および装置 | |
JP2005242904A (ja) | 文書群分析装置、文書群分析方法、文書群分析システム、プログラムおよび記録媒体 | |
JP2006127229A (ja) | 構造化文書検索システム、構造化文書検索方法及びプログラム | |
JP4405493B2 (ja) | 構造化文書管理システム及びプログラム | |
JP5712496B2 (ja) | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 | |
JP2009187401A (ja) | 文書管理システム、文書管理装置、文書管理方法及びプログラム | |
JP5063447B2 (ja) | コンテンツ管理装置及び方法及びプログラム | |
CN101930451B (zh) | 用于存储高效地搜索至少一个询问数据元素的方法和装置 | |
JP4393498B2 (ja) | 構造化文書管理システム及びプログラム | |
CN117873403B (zh) | office文档IO中tmp文件还原方法及其系统 | |
JP3725088B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP4521413B2 (ja) | データベース管理システム及びプログラム | |
JP5334214B2 (ja) | 組織内ソーシャルマップ作成システム及び組織内ソーシャルマップ作成方法 | |
JP3725837B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP3937944B2 (ja) | 構造化文書からの情報抽出方法及び装置及び情報抽出プログラム及びコンピュータ読み取り可能な記録媒体 | |
JP3725835B2 (ja) | 知識情報収集システムおよび知識情報収集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091006 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091104 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121113 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4405493 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131113 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |