JP3384017B2 - データ抽出システム - Google Patents

データ抽出システム

Info

Publication number
JP3384017B2
JP3384017B2 JP06887993A JP6887993A JP3384017B2 JP 3384017 B2 JP3384017 B2 JP 3384017B2 JP 06887993 A JP06887993 A JP 06887993A JP 6887993 A JP6887993 A JP 6887993A JP 3384017 B2 JP3384017 B2 JP 3384017B2
Authority
JP
Japan
Prior art keywords
data
search
information
identifier
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06887993A
Other languages
English (en)
Other versions
JPH06282577A (ja
Inventor
伸雄 斎藤
勝己 黒川
善二郎 大竹
弘明 小暮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Inc filed Critical Toppan Inc
Priority to JP06887993A priority Critical patent/JP3384017B2/ja
Publication of JPH06282577A publication Critical patent/JPH06282577A/ja
Application granted granted Critical
Publication of JP3384017B2 publication Critical patent/JP3384017B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータベースから所望の
データを抽出するデータ抽出システムに関する。
【0002】
【従来の技術】従来、データを管理する手段として関係
型データベースがある。関係型データベースは管理すべ
きデータを項目分けして複数のテーブルに分類して記憶
し、封数のテーブルを結合させる等して、データ管理者
が要求するデータを抽出するものである。この関係型デ
ータベースは、テーブルの構造を簡単に変更できるため
に、主に、データ構造が蓄積途中で変更される可能性の
あるデータを扱う分野に適用されている。
【0003】図7は関係型データベースを適用したデー
タ抽出システムの一例を示す図であり、このデータ抽出
システムは論文データを抽出してCRT等の表示装置ま
たはプリンタ等の印刷装置に出力するものである。この
データ抽出システムは、図7に示すように、記憶装置に
記憶された論文データに対して、「論文名」「著者名」
「概要」等の論文要素毎にインデックステーブルを作成
する。このインデックステーブルの各レコードには、対
応するデータが記憶されている記憶装置上のアドレスと
ともに、他のテーブルの関連するレコードを指し示す関
連情報が記憶される。
【0004】ここで、データ管理者が所定の検索情報に
より論文を検索すると、まず、データ抽出システムは検
索に先だって、「論文」がどのような論文要素で構成さ
れるかを調べ、必要なデータを検索する。具体的には、
検索キー(例えば、「論文名」)に対応するインデック
ステーブルにおいて、検索情報に適合するレコードを検
索する。そして、適合するレコードに記憶された記憶装
置上のアドレスから対応するデータが抽出され、そのレ
コードに関連する他のテーブル(例えば、「著者名」,
「概要」に関するインデックステーブル)のレコードか
ら対応するデータを抽出する。抽出されたこれらのデー
タは、その論文要素に応じた出力形式(例えば、出力位
置、大きさ、色、書体等)で表示装置あるいは印刷装置
に出力される。
【0005】
【発明が解決しようとする課題】ところで、上述した従
来のデータ抽出システムは、論文要素の数に応じてテー
ブル数が増減する構造であるために、論文要素数が多い
論文を取り扱う場合、テーブル数が多くなる。テーブル
数が多くなると、各テーブルを関連づける情報が増加
し、テーブルの結合等の処理時間が長くなるとともに、
データ容量が急激に増加する。
【0006】また、上述したデータ抽出処理を行うアプ
リケーションプログラムは、抽出する論文要素に応じて
処理対象となるテーブルが異なるために、各論文要素に
応じた処理を行う必要がある。加えて、上記アプリケー
ションプログラムは、論文要素に応じた出力形式を持っ
ている必要がある。これらの要求を満たすようにする
と、論文要素の数が多い論文を取り扱う場合、アプリケ
ーションプログラムが巨大になり、出力形式等を変更す
る際には、多大な労力を必要とするという問題があっ
た。特に、論文誌や書籍等の表示あるいは印刷において
は、出力形式の変更は煩雑に行われるので、極めて非効
率であった。
【0007】本発明は、このような背景の下になされた
もので、簡素な構成で、データが増加しても処理時間が
長くならず、抽出したデータの出力形式を容易に変更す
ることができるデータ抽出システムを提供することを目
的とする。
【0008】
【課題を解決するための手段】本発明によるデータ抽出
システムは、各オブジェクトを、データ、前記データを
特定するための識別子、前記データの種類を示す種別情
報および親となるオブジェクトを示す親情報を含むよう
に構成するとともに、前記識別子および前記種別情報を
含む検索情報を入力する入力手段と、前記検索情報内の
識別子により特定されるオブジェクトまたは当該オブジ
ェクトの祖先にあたるオブジェクトを検索し、検索され
たオブジェクトの中から前記検索情報内の種別情報に一
致するオブジェクトを抽出する抽出手段とを具備するこ
ととを特徴としている。
【0009】
【作用】上記構成によれば、入力手段は前記識別子およ
び前記種別情報を含む検索情報を入力し、抽出手段は前
記検索情報内の識別子により特定されるオブジェクトま
たは当該オブジェクトの祖先にあたるオブジェクトを検
索し、検索されたオブジェクトの中から前記検索情報内
の種別情報に一致するオブジェクトを抽出する。このオ
ブジェクトは、データ、前記データを特定するための識
別子、前記データの種類を示す種別情報および親となる
オブジェクトを示す親情報を含むように構成されている
ので、簡素な構成で、データが増加しても処理時間が長
くならず、抽出したデータの出力形式を容易に変更する
ことができる。
【0010】
【実施例】まず、本発明による一実施例を説明する前
に、本発明の基本となる二つの概念について説明する。A:SGML(Standard Generaliz
ed Markup Language) 一般に、文書データは階層構造を有しており、例えば、
図1に示すような構造のデータとして取り扱うことがで
きる。図1は文書データの構造例を示す図であり、この
図において、「文書」は「前書き」,「本文」,「後書
き」から構成され、「本文」は複数の「章」から構成さ
れる。ISOによる国際規格であるSGMLは、上述し
た文書の論理構造を記述する言語(規格)であり、主に
欧米で用いられている。SGMLは、文書データ中に所
定のキーワードを埋め込むことにより、文書データを構
造的に記述することができる。なお、SGMLでは具体
的なキーワードは決定されておらず、実現する側の自由
となっている。以下、図面を参照して、通常のテキスト
データとSGML化データとの違いを説明する。
【0011】図2は、SGML化データの一例を示す図
であり、図3は図2に示すSGML化データの出力例を
示す。図2において、<P>,<IT>,<INF>お
よび<SUP>はタグであり、これらのタグと</P
>,</IT>,</INF>,</SUP>で表され
る終端記号とで挟まれたシーケンスは、表示あるいは印
刷段階において、タグに応じた出力形式で出力される。
例えば、図2において、タグ<IT>および終端記号<
/IT>で挟まれるシーケンス「water」は、タグ<I
T>に応じた出力形式で出力される。
【0012】なお、上記終端記号は行末を示す記号で代
用されることがあるが、個々のシーケンスは必ず入子に
なっている。また、タグ<P>はパラグラフ、タグ<I
T>はイタリック、タグ<INF>は下付き文字、タグ
<SUP>は上付き文字を示すタグであり、SGMLに
は、これらのタグの他に、文書名や著者名等を示す多く
のタグが用意されている。上述したように、SGMLを
適用することにより、個々のシーケンスは必ず入子にな
るために、文書データを親子関係に基づいて構造化する
ことができる。
【0013】B:オブジェクト指向 一般に、アプリケーションプログラムにおいて、複数デ
ータの関係付け等の処理は、アプリケーションプログラ
ムが提供する機能に関連して記述されている。例えば、
アプリケーションプログラムにおいて、文書データを抽
出するという機能に関する記述は、文書データを構成す
る要素を調べた後に、それらの要素を個々に抽出し、文
書データを再構成するという低いレベルの記述を含む。
したがって、アプリケーションプログラムが提供する機
能の変更は、上述した低いレベルの処理を考慮して為さ
れる必要があり、変更に要する時間および手間が膨大な
ものになる。
【0014】一方、文書データ等を管理するシステムに
おいて、アプリケーションプログラムが参照すべきデー
タは、ほとんど変更されることがない。したがって、文
書データを管理するシステムにおいては、機能に関連し
て各種処理を記述するのではなく、データ(オブジェク
ト)自体に各種処理に対応する記述を内包させること
(オブジェクト指向)により、システムの機能変更を用
意に行うことができる。
【0015】また、前述したように、文書データは親子
関係に基づいて構造化されるために、例えば、文書デー
タ全体を示すオブジェクトが、論文名データを示すオブ
ジェクトを階層的に共有する形式をとることができる。
図4は上述した階層的な共有を説明するための図であ
り、図4(a)はSGML化データ、図4(b)は同図
(a)に示すSGML化データを階層的共有が可能なデ
ータ構造で表現した図である。なお、図4において、属
性1〜3は色情報等の文書の論理構造以外の属性を示
す。図4に示すように、文書データの構造自体を階層的
な共有が可能なデータ構造とすると、任意のオブジェク
トに対する処理を統一することができる。これにより、
アプリケーションプログラムが行うべき処理を大幅に削
減できる。
【0016】C:構成 上述した概念に基づいた本発明の一実施例について、図
面を参照して説明する。図5は本発明の一実施例による
データ抽出システムの機能構成を示す図であり、この図
に示すデータ抽出システムは、図示せぬ制御装置を有
し、この制御装置が図示せぬ記憶装置に記憶されたデー
タから、データ管理者より与えられる検索情報に適合す
るデータを検索し、検索結果を出力するシステムであ
る。図5において、Aで示す部分が図示せぬ制御装置に
対応する機能構成となっている。この図において、1は
図示せぬ記憶装置に記憶されるリソースデータであり、
SGML化された論文データや当該データに参照される
画像データ、音声データ等のオブジェクトから構成され
る。これらのオブジェクトは親情報に基づいて、親オブ
ジェクトに階層的に共有される構造を有する。
【0017】2はインデックスビルダであり、リソース
データ1から全文検索用インデックスファイル(インデ
ックスファイル)3、キーワード検索用インデックスフ
ァイル(対応インデックスファイル)4、オブジェクト
インデックスファイル5を図示せぬ記憶装置上に作成す
る。これらのファイル3〜5を作成するのは、検索処理
を高速化するためである。なお、最も外郭のルートオブ
ジェクトの識別子は「0」、他のオブジェクトの識別子
は、オブジェクトを一意に識別できる数値となる。
【0018】また、6はプロセス間通信を制御するメッ
セージハンドラ、7はメッセージハンドラ6と後述する
各プロセス(構成要素)とのメッセージ送受信における
手順等を統一するソケットである。8はソケット7を介
してメッセージハンドラ6と所定のメッセージの送受信
を行う入出力制御部であり、ディスプレイ9,プリンタ
10,変換器11a(後述する)およびマウス12に対
する入出力を制御するとともに、データの検索情報を入
力する画面の表示や、検索結果の印刷、表示等のユーザ
インタフェースを提供する。ここで、変換器11aは入
出力制御部8から供給されるデータを所定のレベルの音
響信号(アナログ信号)に変換し、この音響信号をスピ
ーカ11bに供給するものである。
【0019】13〜15はソケット7を介してメッセー
ジハンドラ6から供給されるメッセージ(検索情報)に
指定される検索を行うエンジンであり、13は全文検索
(フリーキーワード検索)エンジン、14はキーワード
検索エンジン、15はオブジェクト検索エンジンであ
る。全文検索エンジン13は、全文検索用インデックス
ファイル3を用いて、リソースデータ1中の全てのテキ
ストデータから、検索文字列(検索文字列情報)に合致
する文字列のアドレスと当該文字列が含まれるオブジェ
クトの識別子とをメッセージハンドラ6に供給する。
【0020】キーワード検索エンジン14は、キーワー
ド検索用インデックスファイル4を用いて、検索キーワ
ードによる検索を行い、当該キーワードに合致したオブ
ジェクトの識別子をメッセージハンドラ6に供給する。
オブジェクト検索エンジン15は、オブジェクトインデ
ックスファイル5を用いて、識別子に指定されるオブジ
ェクトを抽出する。なお、抽出されるオブジェクトはそ
の子孫のオブジェクトを階層的に共有している。
【0021】この際、抽出すべきオブジェクトが他のオ
ブジェクトを参照(参照関係情報による参照)していれ
ば、参照されるオブジェクトをも抽出する。また、オブ
ジェクト検索エンジン15は、オブジェクトインデック
スファイル5を用いて、指定したタグを持つオブジェク
トのリスト、および指定した属性が所定の値を持つオブ
ジェクトのリストを抽出する機能を有する。
【0022】前述した入出力制御部8は、オブジェクト
検索エンジン15からメッセージハンドラ6を介して供
給されるオブジェクトを、オブジェクト自体が持つタグ
および属性に応じてディスプレイ9、プリンタ10およ
び変換器11aに出力する。また、入出力制御部8はデ
ィスプレイ9に表示したオブジェクトのうち、他のオブ
ジェクトを参照するオブジェクトをマウス12の操作に
より選択すると、参照されるオブジェクトおよびその子
孫をディスプレイ9に表示する機能を有する。
【0023】D:動作 上述したデータ抽出システムにより、一つの論文を抽出
する動作の例を場合分けして説明する。全文検索(フリーキーワード検索)の動作 まず全文検索エンジン13を用いた全文検索の過程を説
明する。まず、データ管理者が図示せぬキーボードまた
はマウス12を操作して、入出力制御部8に検索文字列
と検索すべきデータの種別情報(「論文」、「章」等)
とを入力する。入力された検索文字列は、全文検索エン
ジン13に供給され、ここで、全文検索用インデックス
ファイル3を用いた検索が行われ、検索文字列と一致す
る文字列を有するオブジェクトの識別子と、当該文字列
のアドレスとがオブジェクト検索エンジン15に供給さ
れる。
【0024】オブジェクト検索エンジン15は、識別子
と入出力制御部8から供給される種別情報とに基づい
て、オブジェクトインデックスファイル5を用いて、識
別子により特定されるオブジェクトの祖先である識別情
報に適合するオブジェクトを抽出する。この際、当該オ
ブジェクトが階層的に共有している子孫のオブジェクト
と、これらのオブジェクトが参照している他のオブジェ
クト(自身の子孫を階層的に有する)が抽出される。そ
して、上述したアドレスの文字列が例えば、反転出力さ
れる一つのオブジェクトとなるように、抽出したオブジ
ェクト群を変更する。
【0025】抽出されたオブジェクト群は、入出力制御
部8に供給され、ここで、付与されたタグおよび属性
(色等)に応じて、ディスプレイ9やプリンタ10等に
出力される。この際、検索文字列に一致した文字列は、
例えば、反転出力される等して、他のデータと区別され
る。また、図6に示すように、ディスプレイ9に表示し
たオブジェクトが他のオブジェクトを参照している際に
は、参照元のオブジェクトをマウス12により選択する
ことにより、参照先のオブジェクトを出力することがで
きる。図6(a)はディスプレイ9による表示例を示す
図であり、同図(b)は参照先のオブジェクトを表示す
る例を示す図である。上述した動作が行われることによ
り、全文検索が終了する。
【0026】キーワード検索の動作 次に、キーワード検索エンジン14を用いたキーワード
検索の過程を説明する。まず、全文検索の場合と同様な
処理が行われ、入出力制御部8に検索キーワードと検索
すべきデータの種別情報(論文、章等)とが入力され
る。次に、キーワード検索エンジン14において、キー
ワード検索用インデックスファイル4を用いた検索が行
われ、検索キーワードに特定されるオブジェクトの識別
子がオブジェクト検索エンジン15に供給される。以降
の動作は全文検索の動作と同様であるのでその説明を省
略する。
【0027】E:まとめ 以上、説明したように、論文データを階層的な共有が可
能なデータ構造のオブジェクトとして取り扱うために、
アプリケーション側はデータ間の包含関係および出力位
置関係を記憶する必要がなく、検索すべきデータの種別
情報に応じて、処理を変更する必要がない。また、全文
検索エンジン13およびキーワード検索エンジン14を
併用することにより、幅広いサービスを提供できる。さ
らに、各種インデックスファイル3〜5を作成すること
により、各種検索を高速化することができる。
【0028】さらに、オブジェクトのデータ構造を他の
オブジェクトを参照できるようにしたために、単なるテ
キストを超えたテキスト(ハイパーテキスト)をディス
プレイ9上に表示することができる。また、音声や画像
を取り扱うことができるようにしたために、マルチメデ
ィアに対応した文書またはアプリケーション等の作成が
容易になる。
【0029】さらに、入出力制御部8および各検索エン
ジン13〜15が、メッセージハンドラ6を介してプロ
セス間通信を行うようにしたために、例えば、入出力制
御部8に変更を加えて再作成しても、各検索エンジン1
3〜15を再作成する必要がない。すなわち、各構成要
素の独立性を高めることができる。また、入出力制御部
8および各検索エンジン13〜15とメッセージハンド
ラ6との間にはソケット7が介挿されるために、新たに
必要とされる機能をシステムに追加する場合には、その
機能を提供するソフトウェアがソケット7に適合するイ
ンタフェースを有していれば良い。したがって、データ
抽出システムに対して、新たな機能を容易に追加するこ
とができる。
【0030】なお、上述した一実施例においては、テキ
ストデータ,画像データおよび音声データをリソースデ
ータ1とする例を示したが、動画等の他のバイナリデー
タをもリソースデータ1に含めてもよい。また、上述し
た一実施例においては、抽出されるオブジェクトと当該
オブジェクトから参照されるオブジェクトとを一度に抽
出したが、ディスプレイ9に表示する必要が生じた時点
で、参照されるオブジェクトを抽出するようにしてもよ
い。
【0031】また、参照されるオブジェクトが他のオブ
ジェクトを参照するようにしても良い。さらに、入出力
制御部8および各検索エンジン13〜15を、別々の処
理装置に配置し、公衆回線または専用回線を介して通信
するようにして、処理装置にかかる負荷を分散させるこ
とができる。また、リソースデータ1を別々のサイトに
分散されて、分散データベースとしてもよい。
【0032】
【発明の効果】以上説明したように、本発明によれば、
入力手段は前記識別子および前記種別情報を含む検索情
報を入力し、抽出手段は前記検索情報内の識別子により
特定されるオブジェクトまたは当該オブジェクトの祖先
にあたるオブジェクトを検索し、検索されたオブジェク
トの中から前記検索情報内の種別情報に一致するオブジ
ェクトを抽出する。このオブジェクトは、データ、前記
データを特定するための識別子、前記データの種類を示
す種別情報および親となるオブジェクトを示す親情報を
含むように構成されている。したがって、簡素な構成
で、データが増加しても処理時間が長くならず、抽出し
たデータの出力形式を容易に変更することができるとい
う効果がある。
【図面の簡単な説明】
【図1】文書データの構造例を示す図である。
【図2】SGML化データの一例を示す図である。
【図3】SGML化データの出力例を示す図である。
【図4】SGML化データが階層的な共有を有する構造
を有することを示す図である。
【図5】本発明の一実施例によるデータ抽出システムの
機能構成を示す図である。
【図6】ディスプレイ9における表示例を示す図であ
る。
【図7】従来のデータ抽出システムの概略構成例を示す
図である。
【符号の説明】
1 リソースデータ(オブジェクト) 3 全文検索(フリーキーワード検索)インデックスフ
ァイル(インデックスファイル) 4 キーワード検索インデックスファイル(対応インデ
ックスファイル) 5 オブジェクトインデックスファイル 8 入出力制御部(入力手段、出力処理手段) 13 全文検索エンジン(検索手段) 14 キーワード検索エンジン(対応検索手段) 15 オブジェクト検索エンジン(抽出手段)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小暮 弘明 東京都台東区台東一丁目5番1号 凸版 印刷株式会社内 (56)参考文献 特開 平6−301721(JP,A) 特開 平2−206839(JP,A) 特開 平5−35576(JP,A) 特開 平4−365173(JP,A) 特開 平4−319744(JP,A) 特開 平4−307666(JP,A) 特開 平4−215185(JP,A) 嶋田 茂,スキーマ類推によるマルチ メディアの意味構造補償,情報処理学会 研究報告,日本,社団法人 情報処理学 会,1992年11月 9日,Vol.92,N o.87(92−FI−28−8),pp.57 −64 今郷 詔,HyTime: 文書の拡 張としてのハイパーメディア記述言語, 情報処理学会研究報告,日本,社団法人 情報処理学会,1992年11月 5日,V ol.92,No.86(92−DBS−91− 6),pp.47−56 飯沢 篤志,文書画像データベースシ ステム,情報処理,日本,社団法人 情 報処理学会,1992年 5月15日,Vo l.33,No.5,pp.497−504 佐藤 誠一郎,データベース機能を持 つマニュアル作成支援システム,情報処 理学会研究報告,日本,社団法人 情報 処理学会,1990年 7月20日,Vol. 90,No.63(90−DBS−78−10), pp.93−100. 内藤 他,オンライン辞書のハイパー テキスト化手法),情報処理学会論文 誌,日本,社団法人 情報処理学会, 1993年 2月15日,Vol.34,No. 2,pp.320−330. (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 180 G06F 17/30 170 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 各オブジェクトを、データ、前記データ
    を特定するための識別子、前記データの種類を示す種別
    情報および親となるオブジェクトを示す親情報を含むよ
    うに構成するとともに、 前記識別子および前記種別情報を含む検索情報を入力す
    る入力手段と、 前記検索情報内の識別子により特定されるオブジェクト
    または当該オブジェクトの祖先にあたるオブジェクトを
    検索し、検索されたオブジェクトの中から前記検索情報
    内の種別情報に一致するオブジェクトを抽出する抽出手
    段とを具備することとを特徴とするデータ抽出システ
    ム。
  2. 【請求項2】 前記オブジェクトは参照する他のオブジ
    ェクトを示す参照関係情報を有し、前記抽出手段は前記
    検索情報に含まれる前記種別情報を有するオブジェクト
    とともに、当該オブジェクトが参照するオブジェクトを
    抽出することを特徴とする請求項1に記載のデータ抽出
    システム。
  3. 【請求項3】 種別情報および検索のための検索文字列
    情報を前記入力手段から入力するよう構成するととも
    に、 前記各オブジェクトのデータの記憶位置および当該デー
    タに対応する識別子を記憶するインデックスファイル
    と、 前記インデックスファイルが示す記憶位置のデータに前
    記検索文字列情報が含まれているか否かを検索し、含ま
    れていた場合にはそのデータに対応する識別子を前記イ
    ンデックスファイルから読み出して前記抽出手段に供給
    する検索手段とを有し、 前記抽出手段は前記検索手段から供給された識別子およ
    び前記入力手段が入力した種別情報に基づいて抽出を行
    うことを特徴とする請求項1または2に記載のデータ抽
    出システム。
  4. 【請求項4】 検索のための検索文字列情報を前記入力
    手段から入力するように構成するとともに、 識別子と種別情報の組を検索文字列情報に対応させて記
    憶する対応インデックスファイルと、 前記入力手段によって入力された検索文字列情報が前記
    対応インデックスファイル内に含まれているか否かを検
    索し、含まれていた場合にはその検索文字列情報に対応
    する識別子および種別情報を前記対応インデックスファ
    イルから読み出して前記抽出手段に供給する対応検索手
    段とを有し、 前記抽出手段は前記対応検索手段から供給された識別子
    および種別情報に基づいて抽出を行うことを特徴とする
    請求項1または2に記載のデータ抽出システム。
  5. 【請求項5】 前記抽出手段により抽出されるオブジェ
    クトのデータを、前記種別情報に応じて表示手段または
    印刷手段へ出力する出力処理手段と、 他のオブジェクトを参照するオブジェクトのデータをマ
    ウスやデジタイザ等の指示装置により選択することによ
    り、前記参照関係情報により指定されるデータを表示手
    段に表示する参照手段とを具備することを特徴とする請
    求項1ないし4いずれかに記載のデータ抽出システム。
  6. 【請求項6】 前記データはテキストデータまたはバイ
    ナリデータであることを特徴とする請求項1ないし5い
    ずれかに記載のデータ抽出システム。
JP06887993A 1993-03-26 1993-03-26 データ抽出システム Expired - Fee Related JP3384017B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06887993A JP3384017B2 (ja) 1993-03-26 1993-03-26 データ抽出システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06887993A JP3384017B2 (ja) 1993-03-26 1993-03-26 データ抽出システム

Publications (2)

Publication Number Publication Date
JPH06282577A JPH06282577A (ja) 1994-10-07
JP3384017B2 true JP3384017B2 (ja) 2003-03-10

Family

ID=13386392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06887993A Expired - Fee Related JP3384017B2 (ja) 1993-03-26 1993-03-26 データ抽出システム

Country Status (1)

Country Link
JP (1) JP3384017B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3662533B2 (ja) * 2001-11-14 2005-06-22 株式会社リオス 情報管理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02206839A (ja) * 1989-02-06 1990-08-16 Hitachi Ltd オブジェクト管理方法
JPH04215185A (ja) * 1990-12-12 1992-08-05 Fujitsu Ltd 条件検索処理方式
JPH04307666A (ja) * 1991-04-05 1992-10-29 Nec Corp オブジェクト検索方式
JP2827562B2 (ja) * 1991-04-19 1998-11-25 富士通株式会社 データベースのオブジェクトの部分集合の管理方式
JPH04365173A (ja) * 1991-06-13 1992-12-17 Fujitsu Ltd オブジェクト指向知識ベースシステム
JP3503029B2 (ja) * 1991-07-26 2004-03-02 日本電信電話株式会社 デ−タベ−スの登録および検索方法
JP3573471B2 (ja) * 1993-04-19 2004-10-06 株式会社日立製作所 全文デ−タベ−ス検索方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
今郷 詔,HyTime: 文書の拡張としてのハイパーメディア記述言語,情報処理学会研究報告,日本,社団法人 情報処理学会,1992年11月 5日,Vol.92,No.86(92−DBS−91−6),pp.47−56
佐藤 誠一郎,データベース機能を持つマニュアル作成支援システム,情報処理学会研究報告,日本,社団法人 情報処理学会,1990年 7月20日,Vol.90,No.63(90−DBS−78−10),pp.93−100.
内藤 他,オンライン辞書のハイパーテキスト化手法),情報処理学会論文誌,日本,社団法人 情報処理学会,1993年 2月15日,Vol.34,No.2,pp.320−330.
嶋田 茂,スキーマ類推によるマルチメディアの意味構造補償,情報処理学会研究報告,日本,社団法人 情報処理学会,1992年11月 9日,Vol.92,No.87(92−FI−28−8),pp.57−64
飯沢 篤志,文書画像データベースシステム,情報処理,日本,社団法人 情報処理学会,1992年 5月15日,Vol.33,No.5,pp.497−504

Also Published As

Publication number Publication date
JPH06282577A (ja) 1994-10-07

Similar Documents

Publication Publication Date Title
US5771380A (en) Method for information retrieval with scaled down images
US6449620B1 (en) Method and apparatus for generating information pages using semi-structured data stored in a structured manner
US6581062B1 (en) Method and apparatus for storing semi-structured data in a structured manner
US5893087A (en) Method and apparatus for improved information storage and retrieval system
US7685106B2 (en) Sharing of full text index entries across application boundaries
KR100372584B1 (ko) 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
US20020075312A1 (en) Displaying graphical information and user selected properties on a computer interface
US6915303B2 (en) Code generator system for digital libraries
EP1661030A2 (en) Generating end-user presentations from structured data
JPH08255155A (ja) 全文登録語検索装置および方法
US7120867B2 (en) System and method for conversion of directly-assigned format attributes to styles in a document
Wang et al. A space efficient XML DOM parser
US6282509B1 (en) Thesaurus retrieval and synthesis system
JP3150254B2 (ja) 文書管理装置および文書管理機能付きデータ処理装置
JP3384017B2 (ja) データ抽出システム
KR101251686B1 (ko) 표시 가능 파일의 필드 및 참조 문헌 및 인용문에 대한확장형 마크업 언어 스키마의 결정
Beckett IAFA Templates in use as Internet Metadata
JPH08147445A (ja) 文書管理方法及びそれを実現する文書処理装置
Fass et al. PicturePiper: Using a re-configurable pipeline to find images on the Web
JPH0277872A (ja) 文書処理プログラムを格納した記憶媒体と文書処理装置
JPH1145238A (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3057726B2 (ja) 設備cadにおける各種資源の管理方法およびその装置
JPH09146968A (ja) 文書検索方法
JPH04241618A (ja) 帳票作成装置
JPS63138431A (ja) オブジエクト属性決定処理方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101227

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111227

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees