JPH0981581A - データベースの作成方法 - Google Patents

データベースの作成方法

Info

Publication number
JPH0981581A
JPH0981581A JP7233905A JP23390595A JPH0981581A JP H0981581 A JPH0981581 A JP H0981581A JP 7233905 A JP7233905 A JP 7233905A JP 23390595 A JP23390595 A JP 23390595A JP H0981581 A JPH0981581 A JP H0981581A
Authority
JP
Japan
Prior art keywords
file
term
link
database
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7233905A
Other languages
English (en)
Inventor
Hideaki Arita
秀昶 有田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP7233905A priority Critical patent/JPH0981581A/ja
Publication of JPH0981581A publication Critical patent/JPH0981581A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 データベースへのデータの入力及びデータ間
の関連付けの作業をできる限り自動化してオペレータの
労力を軽減することができるデータベースの作成方法を
提供する。 【解決手段】 エントリーの対象となる文書データに対
して、句読点等を目印として一つの文を抽出し、構文解
析を行って語句を並び分け、登録すべき用語の候補を自
動的に作成する。オペレータモードの場合は、オペレー
タの指示によって、その用語を登録する。登録は、リン
ク辞書ファイルにその用語と同じものが既に登録されて
いるか否かを判断して、このファイルに必要な情報を記
載する。また、リンクポインタファイルにからリンクポ
インタセルを一つ確保し、リンク内容を格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書作成中など
に、必要に応じて他の文書データ等を参照することがで
きるデータベース、特に、個人利用に好適なデータベー
スの作成方法に関するものである。
【0002】
【従来の技術】多数の文書データに記載されている用語
をコンピュータに登録してデータベース化し、文書作成
その他の作業において、必要な用語がどの文書のどこに
記載されているかを迅速に検索して、文書作成等の作業
を効率化するデータベースソフトウェアが知られてい
る。このようなデータベースソフトウェアは、コンピュ
ータの普及により、個人でも手軽に利用できるようにな
っている。
【0003】このようなデータベースは、一般的には次
のような方法で作成される。まず、文献名など、対象と
なる資料データの主属性に、オペレータがその文献の内
容を表す適当なキーワードを適当な数だけ決定し又は付
加し、これを所定のフォーマットで格納する。そして、
格納されたデータについて、リレーショナルデータベー
スの方法、あるいは全数検索の方法により、キーワード
で該当するものを抽出して記憶させる。
【0004】このようにして記憶されたデータを利用す
る場合は、全文検索又はあいまい検索などの方法によ
り、指定されたワードを持つ文書データ及びその文書内
でそのワードが記載されている位置を探し出し、必要に
応じて画面に表示させてその場で参照できるようにす
る。最近では、国際的な通信ネットワークであるインタ
ーネット上で、WWW(World Wide Web)と呼ばれるハ
イパーテキストの技術が実用化されている。これは、文
章中の語句で、他に参照できるデータがあれば、それを
「リンクを張る」という方法で必要に応じて相互参照で
きるようしたものである。
【0005】
【発明が解決しようとする課題】ところで、従来のデー
タベースの作成方法は、データを入力するオペレータ
が、シソーラスなどを参考にして、またはこれに追加な
どを行って検索ワードを決め、更にキーワード間の参照
関係(リンク)を定めてデータを入力する。このように
して入力されたデータに対しては、上記の各種の検索方
法により検索する。このように、従来方法では、データ
ベースのデータとなる文献等からキーワードを抽出する
作業と、その相互参照関係を設定するという作業をデー
タの入力者が行わなければならない。その結果、選択さ
れるキーワードや相互参照関係がオペレータの知識に左
右され、全く同じ資料データに基づいてデータベースを
構築した場合であっても、出来上がったものには個人差
が生じる。また、キーワードを選択したり、相互参照関
係を設定するという作業は、オペレータにとって大きな
負担になる。
【0006】本発明は上記事情に基づいてなされたもの
であり、データベースへのデータの入力及びデータ間の
関連付けの作業をできる限り自動化してオペレータの労
力を軽減することができるデータベースの作成方法を提
供することを目的とするものである。
【0007】
【課題を解決するための手段】上記の課題を解決するめ
ための請求項1記載の発明は、テキストデータを含む第
一のファイルと、前記第一のファイルのうちリンクが張
られる用語を登録する第二のファイルと、相互にリンク
されている用語同士の間のリンク先情報を含んだ第三の
ファイルとを有し、前記第一のファイルを前記データベ
ースにエントリーする場合は、構文解析手段によって前
記テキストデータのうちで登録すべき用語を抽出し、前
記第二のファイルにこの用語を登録するとともに、前記
第三のファイルに必要なリンク情報を書き込むことによ
って、当該用語をデータベースに登録することを特徴と
するものである。
【0008】請求項2記載の発明は、請求項1記載の発
明において、前記必要なリンク情報には、一つ前のポイ
ンタ及び一つ後のポインタを含むものであることを特徴
とするものである。請求項3記載の発明は、リンクが張
られる用語を登録する第二のファイルと、相互にリンク
されている用語同士の間のリンク先情報を含んだ第三の
ファイルとを有し、テキストデータを含む第一のファイ
ルを前記データベースにエントリーする場合は、構文解
析手段によって抽出された用語を、エントリーするテキ
ストデータを表示した画面上で色を変えて表示するとと
もに、前記抽出された用語に関連する他の用語が既に登
録されているときは、当該他の用語が記載されているテ
キストデータの該当部分を別に表示し、前記抽出された
用語を登録すべき旨の指示があったときは、前記第二の
ファイル及び第三のファイルに必要なリンク情報を追加
することによって当該用語をデータベースに登録するこ
とを特徴とするものである。
【0009】請求項4記載の発明は、請求項1,2又は
3記載の発明において、前記用語の登録は、その用語が
前記第二のファイルに存在しないものであれば、前記第
二のファイルに新たに追加するとともに、前記第三のフ
ァイルにリンク関係がない旨を記載し、その用語がデー
タベースに存在するものであれば、前記第二のファイル
のその用語の所定のその項目にリンク数を一つ増やす旨
の情報を記載するとともに、前記第三のファイルに既存
の用語との間のリンク先情報を記載することを特徴とす
るものである。
【0010】請求項5記載の発明は、データベースが検
索されたときの履歴情報を格納すると共に、前記履歴情
報に基づいて関連する二つの用語をリンクするか否かを
判断し、リンクを張る場合には、リンクが張られる用語
を登録するファイルに同じ用語があるかどうかを調べ、
ない場合には前記ファイルにその用語を新規に登録する
と共に、リンクする相手の前記ファイルに必要なリンク
情報を追加してこれらの用語の間のリンクを自動的に設
定することを特徴とするものである。
【0011】
【作用】構文解析手段は、例えば和文英訳のソフトウェ
アにおいて用いられているものに修正を加えて利用する
か、またはかかるソフトウェアと同様な方法で作成する
ことができる。かかる構文解析手段によって、エントリ
ーする、テキストデータを含む第一のファイルから用語
を抽出して自動的に登録するか、又はオペレータの指示
に基づいて登録することによって、オペレータが登録す
べき用語を選択し、一々入力して登録するという作業を
行う必要がなく、負担が大幅に軽減される。また、用語
が登録されると、第二のファイルにその用語が登録され
た旨が記載される。この第二のファイルには、その用語
がデータベースにいくつ登録されているかを示す情報が
記載される他、その用語に係るリンクの先頭リンクポイ
ンタ及び末尾リンクポインタを含ませることができる。
第三のファイルには、相互にリンクされている用語同士
の間のリンク先情報を、たとえば双方向リスト構造から
なるポインタセルとして含ませることができる。
【0012】また、新規に文書を作成するときに、入力
された文書に対して構文解析を行って抽出した用語につ
いて請求項3記載の登録処理を行なうとともに、それが
既に登録されているものである場合にはその旨を表示
し、必要に応じてそれに関する情報を読みだして表示す
ることにより、文書作成中においても、直ちに必要な情
報の検索が可能となり、その文書作成の支援に供するこ
とができる。
【0013】更に、オペレータが、ある用語について検
索し、それと関連ある用語を続けて検索する場合、オペ
レータにとっては、連続して検索された二つの用語の間
に何からの関連性が有るものとして認識されている可能
性が高い。したがって、検索の履歴情報に基づいてリン
ク関係を設定し、これを多数蓄積すれば、そのオペレー
タにとって独自の、かつ有用なデータベースを構築する
ことができる。
【0014】
【発明の実施の形態】以下に図面を参照して、本発明の
実施の形態について説明する。図1は本実施形態のパー
ソナルデータベース(以下「データベース」という)シ
ステムのハードウェアの構成を示す図、図2はこのデー
タベースシステムのソフトウェアの構成を示す図、図3
はこのデータベースシステムの主要な機能をまとめて示
した図、図4はこのデータベースシステムに用意されて
いる基本的なファイルの構成を示す図、図5はデータベ
ースに文書データをエントリーして用語を登録する処理
を示したフローチャート、図6は連想記憶処理の内容の
一例を示したフローチャート、図7はデータベースに対
して行う検索処理の内容の一例を示したフローチャート
である。
【0015】業務用あるいは個人用の紙文書、パソコン
通信等のログファイル、コンピュータプログラム等のデ
ータが膨大に蓄積されると、そのままでは必要な情報が
その中に含まれているのかどうかが分からなかったり、
また、どこかにあることは分かっていても、それがどの
文書のどこに書かれているのかが分からない場合があ
る。文書データに関連するデータベースが開発された目
的は、このような大量に蓄積された個人利用の情報の中
から、何がどこにあるかを自動的に検索することにあっ
た。たとえば、データベースにエントリーされている複
数の文書データの複数の箇所に「コンピュータ」という
用語が含まれている場合に、これらを相互にリンクさせ
ておくことによって、後に「コンピュータ」という用語
に関する情報が欲しくなったときに、そのリンクを辿っ
て「コンピュータ」という用語を検索し、その用語が含
まれているそれぞれの文書データのその部分を順次画面
に表示させ、表示データを確認し、必要ならばその適当
な部分を本文にコピーして取り入れることなどによっ
て、作成する文書の質を高め、文書作成作業等の効率を
上げることができる。
【0016】本実施形態のデータベースでは、更に、エ
ントリーする文書データに現れるキーワードの登録を自
動化することによって、使用者の負担をより軽減する。
図1は、本実施形態のデータベースシステムを実現する
ためのハードウェアの構成を示す図である。基本システ
ム10は、通常のパーソナルコンピュータで、CPU、
メモリ、表示装置、内蔵ハードディスクを備えており、
更に、SCSIインターファイス、フロッピーディスク
ドライブなども備えていることが望ましい。また、その
他の記憶媒体として、大容量のハードディスクサブシス
テム11及び光磁気ディスク12、データ通信用として
高速のモデム13、画像データを取り込むためのスキャ
ナー14及び所定の画像入力システム15、画像や文字
データをプリントアウトするめのプリンタ16、そして
音声・音響データを取り込むための音声・音響入力シス
テム17を設けることが望ましい。
【0017】図2は、本実施形態のデータベースシステ
ムを実現するためのソフトウェアの構成を示す図であ
り、同図に示すように、ソフトウェアの基本システム2
0、文書電子化ソフトウェア21、データベース処理ソ
フトウェア22、及び各種ツールソフトウェア23から
なる。このうち、基本システム20は、DOSやWIN
DOWSなどの基本ソフトウェア及び各種周辺機器のた
めのドライバーなどを含む。文書電子化ソフトウェア2
1は、各種機器の操作を制御する各種機器操作ソフトウ
ェア21a、スキャナー14で取り込んだバイナリーデ
ータから文字を認識する文字認識ソフトウェア21b、
画像入力システム15で取り込んだ画像データを所定の
形式に変換する画像データ変換ソフトウェア21c、画
像データや音声データ等のために後述のヘッダーファイ
ルを作成するためのヘッダーファイル作成ソフトウェア
21dからなる。
【0018】また、データベース処理ソフトウェア22
は、データベースに関する各種処理を制御する処理制御
ソフトウェア22a、文章の入力や変換、修正、表示、
格納等を行うためのワープロ核ソフトウェア22b、用
語の自動登録を行う場合に用いる構文解析及び用語抽出
ソフトウェア22c、データベースを構成する各種ファ
イル(後述する)を管理するデータベース基本ファイル
管理ソフトウェア22d、抽出された用語に対してリン
ク処理を行うリンキング処理ソフトウェア22e、同一
の用語ではないが相互に関連する用語の間にリンクを張
って連想記憶を可能とする連想関係作成ソフトウェア2
2f、一部のデータのみを用いて高速な検索を可能とす
る高速検索ソフトウェア22g、そして、作成中の本文
の他、参照用語やその詳細な内容を表示するための表示
ソフトウェア22hからなる。
【0019】各種ツールソフトウェア23は、画像デー
タ表示ソフト、音声/音響再生ソフト、ファイルコピ
ー、検索、メインテナンスソフト、およびパソコン通信
やインターネットなどの通信関連ソフトなどからなる。
図3は、本実施形態のデータベースシステムの主な機能
を示した図である。同図において、「新規文書作成・用
語検索」は、ワープロ核ソフト22bを利用して新たに
文書を作成する場合の用語の検索と、単一の用語の検索
を行う機能である。新規文書作成の場合には、オペレー
タがキーボード等を使って入力し、確定した文章の構文
解析を行って、その中からシステムが必要と判断した用
語を抽出する作業を行い、用語が抽出されたら、その用
語について既に登録されているかどうかを判断し、登録
されている場合にはリンクを辿ってその用語を検索する
とともに、そこに出てきた用語の位置もリンクの末尾に
追加登録する。一方、その用語が登録されていない場合
には、自動的に、又はオペレータの指示によって新たに
データベースに登録する。用語検索の場合には、オペレ
ータがキーボード等を使って入力し確定した用語につい
て、既に登録されているかどうかを判断し、登録されて
いる場合にはリンクを辿ってその用語を検索する。すな
わち、本データベースシステムでは、データの検索に関
して、新たに文書を作成する場合と、単一の用語を検索
する場合とを分離せず、同一の手続として捉えている。
これによって、ソフトウェアの構成を簡略化できる。
尚、後述する連想記憶・連想検索の場合には、同一でな
い用語についても、相互にリンクされる。
【0020】「既存文書検索」は、すでにデータベース
にエントリーされ、記憶されている文書を読みだして、
そこに含まれる用語について、リンクをたどって検索す
る機能である。「文書電子化処理」は、データの電子化
処理を行う機能をいう。コンピュータでデータベースを
構築する前提として、エントリーすべきデータは、コン
ピュータで読み取りが可能なディジタル情報になってい
なければならない。パソコン通信のログファイルのよう
に、予め電子化された情報は、そのまま用いることがで
きるが、それ以外の文書、例えば雑誌の記事のように紙
に記録されたデータや画像、音声などのデータは、コン
ピュータが認識できるデータに変換しなければならな
い。そのための処理をこの機能を用いて行う。この処理
は、文字情報の場合はスキャナーで読み込んでから、文
字認識ソフトウェアでキャラクターコードに変換する。
画像データの場合は、カメラからの画像入力処理を行う
とともに、この画像データの検索に必要な情報を含むヘ
ッダーを作成して付随させる。また、音声・音響データ
の場合も、入力処理を行ったあと、画像データと同様の
処理を行う。
【0021】「ファイルのデータベース登録処理」は、
文書データを新たにエントリーする処理をいう。全く始
めからエントリーする場合の初期化処理、エントリーし
た文書データの中の用語を登録する処理、文書及び登録
された用語のファイルを編集する処理、文書及び登録さ
れた用語のファイルを削除する処理などからなる。「指
定文書出力処理」は、既にエントリーされている文書デ
ータを、必要に応じてプリント出力する処理機能であ
る。
【0022】前記のように、本実施形態では、テキスト
データだけでなく、画像、音声その他のバイナリーデー
タもデータベースの構成要素とする。そして、それぞれ
のデータ全体を一つのファイルとしてエントリーし、そ
の中から適当なキーワードを自動的に抽出して登録し、
検索に必要なリンクを張る。但し、画像や音声のデータ
には、テキスト形式のヘッダーを作成して付随させる。
そして、格納や検索を行うときには、バイナリーデータ
とヘッダーを併せたものを一つのファイルとして取り扱
い、このテキスト形式のヘッダーに含まれる用語のリン
クを手掛かりとして検索を行う。たとえば、画像データ
にライオンの写真が含まれていたとすると、そのヘッダ
ーファイルの中のタイトルなどに、「ライオン」という
用語を記載しておいて、この「ライオン」という用語を
キーワードとして登録する。
【0023】また、文書データがその一部に図表、音
声、音響等のバイナリーデータを含んでるいる場合は、
そのバイナリーデータも文書ファイルの一つとして登録
する。そして、本文の文書ファイル中の該当箇所に、バ
イナリーファイルの名称あるいは、先頭8〜16文字の
名前などを付けたアイコン(小さな目印画像)を設けて
おき、それをマウスでクリックすれば、画像/音声など
が再現できるようにする。その場合、本文の文書には、
その中で用いられているバイナリーデータのヘッダーフ
ァイルの情報を属性項目の一つに付しておく。尚、以下
では、テキストデータの他、画像や音声のバイナリーデ
ータのことも、簡単のために「文書データ」と呼ぶ。
【0024】図4は、本実施形態のデータベースシステ
ムに用意されているファイルの構成を示す。このデータ
ベースは、後の検索に必要となる幾つかのファイルから
構成され、文書データをエントリーし、その中の用語を
原則として自動で登録することによって、必要な情報が
これらのファイルに書き込まれ、徐々にデータベースが
構築されてゆく。
【0025】図4において、「文書データファイル」
は、エントリーされる文書データそのものが格納される
ファイルである。この中には、前述のように、テキスト
形式のヘッダーを伴うバイナリーデータも含まれる。紙
などの文書は、コンピュータで認識できる形のファイル
にするために、テキスト部分と図表部分に分けて、スキ
ャナー等で読み取り、テキスト部分は、文字認識ソフト
ウェアによってテキストデータに変換した後、目視で確
認及び必要な修正を行って文書データファイルとする。
図表等の画像データは、各図、各表ごとに、本データベ
ースで表示できる形式、例えばビットマップ形式に変換
したデータとし、本文との関連を持たせるために、必要
な情報を含んだテキスト形式のヘッダーファイルを作成
し、これを含めて文書データファイルとする。パソコン
通信のログデータなどは、テキストデータである限りそ
のまま用いる。
【0026】本文がない画像だけのデータの場合にも、
同じようにヘッダーファイルを作成する。コンピュータ
プログラムはテキストデータではあるが、それについ
て、後述する自動登録のための構文解析を行っても意味
がないので、コンピュータプログラムはバイナリーデー
タとし、画像データ等と同じくテキスト形式のヘッダー
ファイルを作成し、プログラムファイル名、種類コー
ド、容量、コメント等の属性を記載する。ヘッダーファ
イルには、ヘッダーファイル識別コード、親となる文書
データファイルのファイル名、バイナリーファイルのフ
ァイル名、バイナリーファイルの種類(例えば、1=プ
ログラム、2=画像、3=音響とする。)、バイナリー
ファイル属性(例えば、サイズ、フォーマット形式)が
含まれる。
【0027】「文書名ファイル」は、上記の文書データ
に関する情報が記載されるファイルである。具体的に
は、その文書を特定する文書名ID、文書名、その文書
が本文、ヘッダーファイル、バイナリーファイルのいず
れであるかを示す文書の種類、ヘッダーファイルの有無
と有る場合の数、著者名、発行年月日、発行所名、ヘッ
ダーファイル名の並び(有れば)が含まれる。この並び
とは、具体的には、ヘッダーファイル名がaaa.bmp ,bb
b.sound ,ccc.xxx ,・・・であるとすれば、この形
式、すなわち、ヘッダーファイル名をコンマで区切って
並べたものである。
【0028】「リンク辞書ファイル」は、文書データフ
ァイルの中の用語で、登録されているもの、すなわちリ
ンクが張られている用語を並べたファイルである。した
がって、このファイルを見れば、エントリーされている
文書データファイルに含まれる用語のうちどのような用
語が登録されているかが分かる。このファイル内の一つ
の用語、たとえば「コンピュータ」という用語であれ
ば、「コンピュータ」という用語自体の他に、品詞コー
ド、リンクの種類、リンク数、先頭リンクポインタ、末
尾リンクポインタが含まれる。
【0029】「品詞コード」は、その用語の品詞を示す
コードであり、これを含ませることによって、構文解析
を行うときに必要となる構文解析用の辞書として、リン
ク辞書ファイルを兼用することができる。但し、構文解
析で更に必要となる情報があれば、予備の項目に追加す
る。「リンクの種類」は、たとえば、0=リンク不可、
1=リンク可、2=無条件リンク指示という登録可否コ
ードで表現する。このうちリンク不可というのは、後述
のように、普通名称のように、頻出する言葉ではあるが
リンクする必要がないことを示すための指示である。通
常、初期状態では、「1=リンク可」から始めて、同一
の用語がある決められた回数だけ出てきたときに、オペ
レータに判断を促し、オペレータは、「0=リンク不可
(リンク不要)」又は「2=無条件リンク(いくつでも
リンクせよ)」のいずれかに変える。このとき、「1=
リンク可」のままにしておくと、リンクが一定回数増え
るごとに、オペレータに判断を求めてくるものとする。
「リンク数」は、それまでにその用語がいくつ登録され
ているかを示す数である。たとえば、エントリーされて
いる文書データファイルに「コンピュータ」という用語
が100回出てきていれば、リンク数は100となる。
「先頭リンクポインタ」は、その用語の検索が指示され
たときに、一連のリンクの最初に現れるその用語の格納
位置を示すポインタであり、「末尾リンクポインタ」
は、その用語の一連のリンクの最後に現れるその用語の
格納位置を示すポインタである。末尾リンクポインタを
含むのは、新しいリンクの追加を高速に行うためと、リ
ンクの最後から検索する場合があるためである。
【0030】「リンクポインタファイル」は、各用語の
リンクに関する情報を格納するファイルである。すなわ
ち、一つの用語が多数の文献の多数の位置に含まれてい
る場合、これらの間のリンク関係を定め、このリンクを
辿ることによって、その用語が現れるすべての箇所を検
索できるようするためのファイルである。リンクポイン
タファイルの一つの用語については、そのリンク数と同
じ数のリンクポインタセルが設けられる。たとえば「コ
ンピュータ」という用語が、エントリーされている複数
の文書データファイルに100個登録されていたとする
と、そのそれぞれについてリンクポインタセルが存在す
る。各リンクポインタセルは双方向リスト構造をとり、
一つ前のリンクポインタと、一つ後のリンクポインタと
を含む。したがって、たとえば10番目の「コンピュー
タ」という用語を検索したときに、次に11番目の「コ
ンピュータ」という用語を検索する場合は、一つ後のリ
ンクポインタに基づいてリンクを辿り、9番目の「コン
ピュータ」という用語を検索する場合は、一つ前のリン
クポインタに基づいてリンクを辿る。リンクポインタフ
ァイルには、更に、その用語がアクセスされた回数を示
すアクセス回数、それぞれのセルに関係する文書データ
ファイルを特定するファイルID、及びそれぞれのセル
の用語がその文書データファイルのどの位置にあるかを
示すファイルの先頭からのバイト数に関する情報が含ま
れる。
【0031】文書名高速検索補助ファイルは、文書名I
Dの英数字コードを辞書順にならべ、先頭文字が異なれ
ば、何番から検索すればよいか、という情報を格納す
る。これにより、文書名IDの全体を用いて検索する場
合に比べて、高速で検索を行うことができる。リンク辞
書高速検索補助ファイルは、用語の検索を効率的に行う
ためのファイルである。リンクされているものすべて
を、先頭から順番に検索していると非常に時間がかかる
場合があるので、検索したい用語のうち最初の一文字又
は二文字と、その格納開始位置との対応表を作ってお
き、それを指定して、その文字で始まる単語だけを検索
することによって検索を高速化する。そのようなファイ
ルを予め作っておいて、検索が必要となったら、直ちに
そこへジャンプすることを可能にするファイルである。
【0032】以上が、主要なファイルの説明である。
尚、これらのファイルのレコードは、データの蓄積状況
によって刻々と変化する。そして、これらのレコード
は、規定の辞書順に常にソートされるようにする。デー
タベースの初期状態は、次の三つから選ぶことができ
る。初期状態の一つ目は、オールクリアの状態、すなわ
ちデータベースには何も入っていない状態である。この
状態を選択するのは、一からデータベースの構築を行う
場合である。初期状態の二つ目は、用語の登録だけは行
われていて、登録可否コードは設定されているが、リン
クは張られていない状態である。用語の登録は、たとえ
ば、電子化された国語辞書や専門用語辞書などから用語
部分だけを抜き出して、リンク辞書ファイルにその用語
を書き込むことによって行う。このように予め必要な用
語の登録を行っておくと、文書をエントリーしてその中
の用語を登録してゆく作業を行う場合に、その用語を登
録する手間を省くことができるので、迅速な処理が可能
となる。初期状態の三つ目は、すでに前回構築済のデー
タベース状態である。すなわち、すでに他の者によって
構築されているデータベースをそのまま持ってきて、そ
れに更に自分の文書データをエントリーするとともに、
それに含まれる用語を登録して、更に大きなデータベー
スとする場合に有用である。
【0033】上記二つ目の「用語辞書を登録する」場合
には、まず、リンク辞書ファイルを初期化する。そし
て、電子化された辞書より、説明部分を省いた用語部分
だけを抽出し、リンク辞書の用語格納部分に格納する。
この用語のうち、個人的に不必要と判断される用語につ
いてはオペレータが逐次削除することができる。リンク
の種類の登録可否コードは、上記のように、0=リンク
不可、1=リンク可、2=無条件リンク指示、のいずれ
かであり、初期を決めておけば、自動的にその値に設定
される。リンク数は、当然0に設定する。削除した用語
については、つめて、用語の辞書順にソートする。この
とき、登録済みの用語の個数等が確定される。そして、
これに基づいて、高速検索用補助ファイルを作成する。
【0034】次に、実際に、一つの文書を自動的にエン
トリーする手順について説明する。ここで、「文書をエ
ントリーする」とは、その文書自体を文書データファイ
ルとして格納して、その中の用語を自動的に登録し、リ
ンクを張ることをいうものとする。まず、文書を自動的
にエントリーする準備として、そのデータが電子化され
ていないものである場合には、光学的な読み取り装置及
び文字認識ソフトウェアによって、テキスト形式の文書
データとし、これを文書データファイルとする。この文
書データから、文書名(タイトル)、著者名、作成年月
日、発行所名を抽出する。文書データの内容にこれらの
属性情報が記載されていない場合には、オペレータがこ
れらの情報を追加しなければならない。これらの属性情
報を、文書名を主キーワードとして、「文書名ファイ
ル」に書き込む。また、文書データが既にエントリーさ
れている場合には、その属性情報を抽出しておいて、こ
れを利用することができる。この場合、検索が高速に行
えるよう、文書名を何らかの辞書順に整列しておくこと
が望ましい。これは、例えば学会やシンポジュウムの論
文集のように、一つの文書内に著者が異なる複数の論文
等が含まれていて、それぞれの論文を別々にエントリー
する場合や、既にある文書を更新して、同じ文書名でエ
ントリーするといった場合などに有用である。
【0035】文書を自動的にエントリーする場合のこれ
以降の処理手順を図5のフローチャートに示す。同図ス
テップS10において、エントリーの対象文書データフ
ァイルを読み込んで、ワークエリアに格納する。ステッ
プS11において、その文書データファイルの先頭から
処理を開始する。この処理は、句読点等を目印として、
一つの文を抽出し、センテンスバッファに格納する。そ
の際、文の先頭と末尾の位置(先頭からのバイト数)を
カウントしておく。
【0036】ステップS12において、この文に対して
構文解析を行い、語句の並びに分けるとともに、品詞、
語句の先頭位置を確定する。このような構文解析を行う
ソフトウェアは、日本語から英語等への自動翻訳システ
ムなどで実用化されており、これに必要な変更を加えて
容易に本実施形態のデータベースの構文解析用として適
用することができる。語句を並び分けたら、その中から
名詞及び名詞句をリストアップする。
【0037】ステップS13において、このリストアッ
プされた名詞及び名詞句を主対象として、予め定めた適
当な規範に従って登録すべき用語の候補を作成する。
「適当な規範」とは、たとえば、その名詞を含む前後
数語の名詞句、複合名詞(熟語等)、形容詞+名
詞、一つの名詞だけ、といった優先順位で登録すべき
用語の候補(「登録候補」という)を作成するというも
のである。
【0038】ステップS14において、このようにして
作成された各登録候補に対して、それがリンク辞書ファ
イルに既に登録されているかどうかを判定する。ステッ
プS15において、リンク辞書ファイルにある場合に
は、まず、リンクポインタファイル内に図4に示したリ
ンク内容を格納する。また、リンク辞書ファイルのリン
ク数(リンクカウンタ)を1だけアップする。
【0039】尚、ステップS16において、候補がリン
ク辞書ファイルに登録されていても、登録可否コードが
「0=リンク不可」の場合、リンク処理をしない。「1
=リンク可」の場合、リンクの数が予め定めた値以上に
なったならば、オペレータにリンクが必要か否かの判断
を求める。ここで、リンク不要と判断されれば、リンク
コードを「0=リンク不可」に設定し、これまでのリン
クポインタリストを削除し、リンクポインタセルをフリ
ーセル領域にスタックする。なお、上記は、自動登録モ
ードの場合であるが、オペレータ確認モードの場合は、
上記ステップS11〜16において、その時々の処理範
囲と処理結果をディスプレーに表示し、一つの文章ごと
にオペレータの確認を求める。そして、オペレータの要
求があれば、修正処理を行う。以上の処理を、そのファ
イルの末尾まで行うことによって、そのファイルに対す
る処理を終了する。
【0040】以上の処理のうち、用語の登録の部分につ
いて、もう少し詳しく説明する。用語を登録するには、
まず、リンクポインタファイルにおいて、リンクポイン
タセルを確保し、ファイルID、先頭からの位置情報を
セットし、リンクポインタの設定を行う。すなわち、い
ま登録しようとしているのが、その用語の第一番目のデ
ータならば、リンク辞書ファイルにおいて開始ポインタ
と終了ポインタを同一にセットし、ポインタリストの一
つ前のポインタ及び一つ後のポインタを、いずれも、例
えば−1にセットする。この場合、1,2,・・・では
なく「−1」にセットするのは、正の自然数は、カウン
タ、ポインタなどとして使うためである。一方、第二番
目以降のデータであれば、末尾ポインタにリンクする。
すなわち、それまでの末尾ポインタの一つ後のポインタ
に、今回の格納位置ポインタをセットする。同時に、今
回のデータの一つ前のポインタにそれまでの末尾ポイン
タをセットする。そして、一つ後のポインタを−1にセ
ットする。アクセス回数は、当然0にセットする。ま
た、第二番目以降のデータの場合には、リンク辞書ファ
イルのその用語の末尾ポインタを更新する。
【0041】登録しようとしている用語が、リンク辞書
ファイルに登録されていないものである場合には、新規
の登録処理を行う。そのために、まず、リンク辞書ファ
イルの1レコード分を新たに確保する。このレコードに
候補である用語を登録し、登録語数を1とし、リンク数
=0として、上記のリンクポインタファイルの設定等の
処理を行う。
【0042】以上のようなリンク処理を、エントリーさ
れる文書データファイルのすべての文章に対して行う。
ワークエリアにある文書データファイルの終点に至れ
ば、所定の終了処理を行う。以上の処理によって、文書
データファイルの必要な情報が、文書名ファイル、リン
ク辞書ファイル、およびリンクポインタファイルに写し
取られたことになる。
【0043】ところで、自動的に登録すべき用語の候補
を作成することは、その用語の意味が関係してくるため
難しい課題の一つであり、また、登録するまでもないが
頻出する語句も大量に登録され、不必要に記憶容量を消
費してしまう可能性がある。これを防止するために、補
強策として、次のような手段を併用するこができる。す
なわち、文書データファイルの本文を表示して、オペ
レータが適当な入力手段で、意味のある登録用語を指定
するという方法、データベースシステムが登録すべき
であると判断して表示した用語に対して、オペレータが
可否の判定を行う方法、各種の用語辞書等の用語及び
考えられるキーワードを予めリンク辞書ファイルに登録
しておき、リンク数=0に設定するとともに、登録可否
コードの設定をしておくという方法、である。尚、これ
らの方法は複数併用することも可能である。
【0044】次に、図6を参照して、同一用語ではない
が互いに関連する用語の間にリンクを張る、連想記憶処
理について説明する。まず、同図ステップS10におい
て、連想記憶処理プログラムを起動する。ステップS1
1において、マニュアル設定、自動設定、確認設定の各
モードからいずれかを選択する。ここで、「マニュアル
設定」モードとは、オペレータが、自己の判断で互いに
関連すると考える用語(連想用語)を明示的に入力する
モードである。「自動設定」モードとは、オペレータの
リンクジャンプ操作の手順を記憶するリンクジャンプ履
歴ファイルというものを作成し、この履歴データを用い
て、自動的に連想関係を設定するモードである。このモ
ードでは、オペレータがデータベースを利用した履歴デ
ータを活用することができる。また、「確認設定」モー
ドとは、リンクジャンプ履歴ファイルの履歴データを用
いるのであるが、オペレータが確認及び必要な修正を行
うことができるモードである。
【0045】ところで、オペレータの検索履歴に基づい
て、A→B→C→・・・→Y→Xという用語のジャンプ
履歴系列が得られた場合、{A,B,C,・・・,Y,
X}の全体を連想用語集合といい、(A,B),(B,
C),・・・・,(Y,X)のそれぞれを連想用語の対
という。尚、上記では、ジャンプ履歴系列のうち、隣合
うものの組を「連想用語の対」としたが、論理の飛躍が
ない程度にして、連想用語集合のうちから任意の二つを
選んで、これを連想用語の対としてもよい。
【0046】ステップS12では、連想用語の対を作成
し、指定があれば表示する。この場合、マニュアル設定
モードのときは、マウスあるいはキーボード等で連想用
語集合を設定し、リンクジャンプ履歴ファイルを用いる
自動設定モード及び確認設定モードでは、出発点の用語
からリンクジャンプ順に用語を並べる。尚、指定があれ
ば、連想用語集合に用語の追加、修正、削除を行うこと
ができるようにする。ステップS13において、連想用
語集合の各用語については、リンク辞書ファイルに同じ
用語があるかどうかを調べ、ない場合には新規に登録す
る。更に、ステップS14において、連想用語集合の任
意の二つの用語について、お互いに相手のリンク辞書フ
ァイルに必要なリンク情報を追加する。ステップS15
において、一つの連想用語集合の設定が終わり、終了指
定がなければ、再び、モードの指定に戻って同様の操作
を行う。一方、終了指定があれば終了する。
【0047】同一用語の記憶の場合、連想記憶の場合の
いずれの方法も、リンク先のデータをリンク元のデータ
の一つのリンクとして登録するものとする。新たに登録
するときは、アクセス回数を1にするとともに、その他
のときはアクセス回数を1だけアップする。この処理を
多数回繰り返すことにより、利用者の「連想」性向がデ
ータベースに組み込まれてゆくことが期待できる。この
ような連想記憶処理によって、関連する多数の用語を逐
次登録してリンクし、データベースを構築してゆくこと
によって、同一の用語の検索だけでなく、関連する用語
の検索も可能となり、文書作成等における作業性が高く
なり、データベースの実用的価値が更に向上する。
【0048】以上の処理を、オペレータの操作という観
点から説明すると、以下のようになる。まず、データフ
ァイルの先頭から順次一つの文章を確定して用語を抽出
し、リンク辞書ファイル内にその用語があるかどうかが
調べられ、それが存在し、かつ登録可能であるならば、
その用語が画面に水色で表示される。一方、色が変わら
ない部分は登録候補ではないとする。オペレータ確認モ
ードの場合には、オペレータが登録するか否かの最終判
断を行うものとし、システムが表示した登録候補の用語
を確認する作業をマウスのクリック操作などで行い、必
要があれば修正を加えて候補を完成させるか、またはス
キップ指令(表示された候補のいずれも、リンク用語と
しない旨の指令)を発する。そして、オペレータにより
登録すべきとの指示があったものだけを、自動登録の場
合と同様の動作で登録する。この場合に、必要があれば
スクロールは1行オーバーラップするようにして次の表
示画面に写るようにすると、操作上便利である。一方、
自動処理モードの場合には、かかる確認処理は行わずに
次へ進み、登録する候補があれば、次々とリンク処理を
行う。
【0049】次に、上記のようにして構築されたデータ
ベースの検索処理について説明する。本実施形態の検索
処理の機能は、入力テキストのリンク検索・表示処理、
リンク先へのジャンプ処理、および追加登録処理という
三つの処理を行う。「入力テキストのリンク検索・表示
処理」においては、新規文書の作成の場合には空白文書
が表示され、オペレータからの入力待ちの状態となる。
この場合、オペレータは、通常のワープロと同様に、用
語や文章などを入力し、これを確定させると、この確定
された用語もしくは文章が検索の対象となる。また、す
でにエントリーされている既存文書を検索対象とする場
合には、まず、そのファイルをワークエリアに読み込
み、表示する。検索対象として入力・確定されたもの、
またはワークエリアに読み込まれたファイルに対して、
文章を1つずつ切り出して構文解析を行い、それぞれの
用語又は語句に分けるという処理を行う。そして、リン
ク辞書ファイルを参照しながら、それぞれの用語又は語
句に対して、リンクの有無を判断する。
【0050】そして、リンクがあれば、その用語又は語
句を水色の表示に変え、そのリンク情報をリンクポイン
タファイルから引き出して処理バッファに格納する。そ
れと同時に、二つ以上のリンクがあるものについては、
そのリンク先の1行分を別画面(複数の表示手段がある
場合)又は別のウィンドウに一覧表示する。また、一つ
しかリンクがないものについては、直ちに別画面又は別
ウィンドウに詳細表示を行う。詳細表示とは、検索され
た文書データファイルの当該用語の部分を中心として前
後数行ずつの内容(詳細表示方式のデフォールトは、検
索した用語を中心として前後n行を表示するものとす
る)を、実際に表示させることを意味する。尚、このよ
うな表示を行う際には、単一画面を有するパーソナルコ
ンピュータで、ウィンドウ表示を行う他に、三つの画面
を有するパーソナルコンピュータを用意し、中央の画面
には現在作成中の文書を表示し、左側の画面にはリンク
先の1行分の一覧を表示し、右側の画面には一覧表示さ
れたものの中の一つについてその用語がある行を中心と
して前後数行ずつを表示することが考えられる。このよ
うな表示を行うと、その都度表示画面を切り換える必要
がないので、オペレータの負担は軽減され、操作性が向
上する。尚、液晶ディスプレーを始めとする各種の平面
ディスプレーの開発が盛んであり、価格も低下している
現在では、このようなパーソナルコンピュータの開発
は、十分可能であり、かつ現実的であると考えられる。
【0051】「リンク先へのジャンプ処理」は、その用
語に複数のリンクがあるものについては、一行一覧表示
で指定されたものについて所定の方式で詳細表示を行
い、リンクが一つしかないものについては、直ちに別画
面等に詳細表示を行う。但し、別に表示方式をメニュー
等で指定することによって、検索対象であるファイルの
先頭からの表示等を選ぶこともできる。リンク先文書を
表示した中の文章についても、上記と同様の処理を行
う。これによって、詳細表示を行っている画面の中に検
索したい用語がある場合に、その画面から直接その用語
の検索が可能となるので、文書作成作業等の効力が向上
する。また、そのような検索を行った場合には、リンク
ジャンプの履歴を、別に作成する履歴ファイルに記録す
る。この履歴ファイルに基づいて、一番最後にジャンプ
したところから順にジャンプを遡ることができる。リン
クの後退、ジャンプの出発点の文書への後戻りが、マウ
スの簡単な操作で指示できるようにして、操作性を向上
させることができる。このような処理によって、オペレ
ータは、文書作成等の作業において、関連項目へハイパ
ーテキスト的にジャンプすることが可能となる。
【0052】「追加登録処理」には、次の二つの場合が
ある。すなわち、表示された文章の一部で未だリンク
されていない用語についてリンクを追加する場合、後
述する連想記憶・連想検索の一環として指定用語に関係
する語句を設定するか、ジャンプ履歴をデータとして、
順序が隣同士の用語の間にリンクを張る場合である。
の場合には、マウスで登録モードを選び、マウスで範囲
を指定し、登録実行を選らべば、選択された用語がリン
ク辞書に加えられる。の場合には、更に二つの場合が
ある。一つは「連想設定」でマニュアル設定モードを選
択し、設定画面から対象となる用語、すなわち連想用語
を入力して登録する場合である。この場合、連想用語は
複数にすることも可能である。もう一つは、「連想設
定」で、自動設定モードもしくは確認制定モードを選択
し、リンクジャンプ履歴データを用いてリンク設定を行
う場合である。ここで、自動設定モードとは、確認なし
に自動実行するモードであり、確認モードとは、履歴デ
ータを表示し、確認・修正を行った上でリンク処理を行
うモードである。
【0053】ここで、図7のフローチャートを参照し
て、実際の検索処理の一例を説明する。同図のステップ
S10では、まず、検索対象となる文書のファイル名を
指定する。ここで、新規作成する文書を対象とする場合
には、そのファイル名を、また、既存文書を対象とする
場合にはそのファイル名を、それぞれオペレータが入力
し指定する。尚、単一の用語の検索の場合であれば、オ
ペレータが、例えば「S(Search)」を指定することに
よって、内部で規定のファイルを作成する。
【0054】ステップS11では、指定された文書ファ
イルの有無を調べ、そのファイルが見つかった場合は、
先頭から規定量の内容を画面に表示する。一方、そのフ
ァイルが見つからない場合は、オペレータに対して新規
のファイルであるかどうかの確認を促し、新規ファイル
でない場合には、オペレータに対して再度ファイル名の
入力を求める。単一用語の検索の場合、および新規ファ
イル作成の場合には、画面には空白表示を行う。
【0055】ステップS12において、単一用語の検索
の場合には、検索したい用語を入力し、これを確定す
る。一方、新規文書作成の場合には、文章を入力し、こ
れを確定する。更に、既存文書を対象とする場合には、
その文書の先頭から始めて、未処理の1文を抽出する。
ステップS13において、上記の用語又は文書の構文解
析を行い、語句を区切って、品詞を決定する。
【0056】ステップS14において、名詞を含む部分
について、実際に検索を行うべき用語の候補を作成し、
これらがリンク辞書ファイルの中に存在するかを調べ、
存在する場合には、その用語の部分について色を変えて
表示、その用語がデータベースの中に登録されている旨
をオペレータに知らせる。ステップS15において、検
索又は新規文書作成の場合には、検索の結果について別
画面もしくは別ウィンドウに一行だけを一覧表示する。
一方、既存文書を対象とする場合には、マウス等で指示
されたものについて、一行一覧表示を行う。
【0057】ステップS16において、一行一覧表示さ
れたもののうち、マウス等で選択されたものについて、
別画面もしくは別ウィンドウで詳細表示を行う。詳細表
示の形式のデフォールトは、その用語が現れる行を中心
とした前後n行ずつとする。また、表示モードを選択す
ることによって、その用語が現れる部分を表示する代わ
りに、該当文書を先頭から表示することも可能である。
詳細表示が指定されたものについては、リンクポインタ
ファイルの該当データのアクセス回数を1だけアップ
し、また、リンクジャンプの履歴ファイルにも、その旨
を記録する。
【0058】ステップS17において、ステップS16
で詳細表示された部分に現れる別の用語についても、上
記ステップS12〜14の処理を行う。ステップS18
において、詳細表示の画面で、水色で表示されてリンク
がある旨が示されている用語について、マウス等によっ
て指定があれば、そのリンク先の先頭ポインタが示す文
書にジャンプして状ステップS12〜14の処理を行
う。これによって、当初に検索を指定した用語ではなく
ても、詳細表示させた内容に、更に別に検索したい用語
があった場合には、作業を継続した状態でその検索が可
能となる。
【0059】ステップS19において、必要があれば、
マウス等による所定の指定動作によって、リンクを辿っ
た後退や、元の文書への復帰ができる。また、ステップ
S20において、マウス等による所定の指定動作によっ
て、詳細表示部分の指定した部分をコピーし、又は出発
文書にアペンドすることもできる。そして、ステップS
21において、メニューバーなどで終了が指定された
ら、検索処理を終了する。
【0060】
【発明の効果】以上説明したように、本発明によれば、
データベースを構築する際に必要なデータの入力が基本
的に自動化できるので、オペレータの負担が大幅に軽減
されるとともに、本来入力すべきものを入力し忘れると
いったミスが少なくなることが期待でき、また、このよ
うにして構築されたデータベースの用語やリンク関係
は、同一用語に関する限り、オペレータの知識にそれほ
ど左右されず、更に、オペレータのジャンプ履歴などに
基づいて連想記憶処理を行えば、利用者の「連想」性向
がデータベースに反映され、そのオペレータ独自のデー
タベースとしてカスタマイズされ、より使い易くなるデ
ータベースの作成方法を提供することができる。
【図面の簡単な説明】
【図1】本実施形態のデータベースシステムのハードウ
ェアの構成を示す図である。
【図2】このデータベースシステムのソフトウェアの構
成を示す図である。
【図3】このデータベースシステムの主要な機能をまと
めて示した図である。
【図4】このデータベースシステムに用意されている基
本的なファイルの構成を示す図である。
【図5】データベースに文書データをエントリーして用
語を登録する処理を示したフローチャートである。
【図6】連想記憶処理の内容の一例を示したフローチャ
ートである。
【図7】データベースに対して検索を行う処理の内容を
示したフローチャートである。
【符号の説明】
10 ハードウェア基本システム 11 ハードディスクサブシステム 12 光磁気ディスク 13 モデム 14 スキャナー 15 画像入力システム 16 プリンタ 17 音声・音響入力システム 20 ソフトウェア基本システム 21 文書電子化ソフトウェア 21a 各種機器操作ソフトウェア 21b 文字認識ソフトウェア 21c 画像データ変換ソフトウェア 21d ヘッダーファイル作成ソフトウェア 22 データベース処理ソフトウェア 22a 処理制御ソフトウェア 22b ワープロ核ソフトウェア 22c 構文解析・用語抽出ソフトウェア 22d データベース基本ファイル管理ソフトウェア 22e リンキング処理ソフトウェア 22f 連想関係作成ソフトウェア 22g 高速検索ソフトウェア 22h ハイパーテキスト型本文参照詳細表示ソフト
ウェア

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータを含む第一のファイル
    と、前記第一のファイルのうちリンクが張られる用語を
    登録する第二のファイルと、相互にリンクされている用
    語同士の間のリンク先情報を含んだ第三のファイルとを
    有し、前記第一のファイルを前記データベースにエント
    リーする場合は、構文解析手段によって前記テキストデ
    ータのうちで登録すべき用語を抽出し、前記第二のファ
    イルにこの用語を登録するとともに、前記第三のファイ
    ルに必要なリンク情報を書き込むことによって、当該用
    語をデータベースに登録することを特徴とするデータベ
    ースの作成方法。
  2. 【請求項2】 前記必要なリンク情報には、一つ前のポ
    インタ及び一つ後のポインタを含むものであることを特
    徴とする請求項1記載のデータベースの作成方法。
  3. 【請求項3】 リンクが張られる用語を登録する第二の
    ファイルと、相互にリンクされている用語同士の間のリ
    ンク先情報を含んだ第三のファイルとを有し、テキスト
    データを含む第一のファイルを前記データベースにエン
    トリーする場合は、構文解析手段によって抽出された用
    語を、エントリーするテキストデータを表示した画面上
    で色を変えて表示するとともに、前記抽出された用語に
    関連する他の用語が既に登録されているときは、当該他
    の用語が記載されているテキストデータの該当部分を別
    に表示し、前記抽出された用語を登録すべき旨の指示が
    あったときは、前記第二のファイル及び第三のファイル
    に必要なリンク情報を追加することによって当該用語を
    データベースに登録することを特徴とするデータベース
    の作成方法。
  4. 【請求項4】 前記用語の登録は、その用語が前記第二
    のファイルに存在しないものであれば、前記第二のファ
    イルに新たに追加するとともに、前記第三のファイルに
    リンク関係がない旨を記載し、その用語がデータベース
    に存在するものであれば、前記第二のファイルのその用
    語の所定のその項目にリンク数を一つ増やす旨の情報を
    記載するとともに、前記第三のファイルに既存の用語と
    の間のリンク先情報を記載することを特徴とする請求項
    1,2又は3記載のデータベースの作成方法。
  5. 【請求項5】 データベースが検索されたときの履歴情
    報を格納するととに、前記履歴情報に基づいて関連する
    二つの用語をリンクするか否かを判断し、リンクを張る
    場合には、リンクが張られる用語を登録するファイルに
    同じ用語があるかどうかを調べ、ない場合には前記ファ
    イルにその用語を新規に登録するとともに、リンクする
    相手の前記ファイルに必要なリンク情報を追加してこれ
    らの用語の間のリンクを自動的に設定することを特徴と
    するデータベースの作成方法。
JP7233905A 1995-09-12 1995-09-12 データベースの作成方法 Withdrawn JPH0981581A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7233905A JPH0981581A (ja) 1995-09-12 1995-09-12 データベースの作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7233905A JPH0981581A (ja) 1995-09-12 1995-09-12 データベースの作成方法

Publications (1)

Publication Number Publication Date
JPH0981581A true JPH0981581A (ja) 1997-03-28

Family

ID=16962428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7233905A Withdrawn JPH0981581A (ja) 1995-09-12 1995-09-12 データベースの作成方法

Country Status (1)

Country Link
JP (1) JPH0981581A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198058A (ja) * 2009-02-23 2010-09-09 Newswatch Inc 文書処理システム及び方法
JP2019061189A (ja) * 2017-09-28 2019-04-18 株式会社デジタル・ナレッジ 教材オーサリングシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198058A (ja) * 2009-02-23 2010-09-09 Newswatch Inc 文書処理システム及び方法
JP2019061189A (ja) * 2017-09-28 2019-04-18 株式会社デジタル・ナレッジ 教材オーサリングシステム

Similar Documents

Publication Publication Date Title
US5850561A (en) Glossary construction tool
JP3666004B2 (ja) 多言語対応文書検索システム
US6353840B2 (en) User-defined search template for extracting information from documents
EP0810534B1 (en) Document display system and electronic dictionary
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
JP2862626B2 (ja) 電子辞書及び情報検索方法
JP2783558B2 (ja) 要約生成方法および要約生成装置
US5200893A (en) Computer aided text generation method and system
Alexa et al. A review of software for text analysis
JPH04127370A (ja) 情報収集システム
JPH077408B2 (ja) 強調特性変更方法及びシステム
JP3143345B2 (ja) 文字列検索装置
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
JPH06259420A (ja) 文章編集支援装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JP3139658B2 (ja) 文書表示方式
JP2000250908A (ja) 電子書籍の作成支援装置
JPH0981581A (ja) データベースの作成方法
JPS61248160A (ja) 文書情報登録方式
JP2002140338A (ja) 辞書構築支援装置および辞書構築支援方法
JP3016040B2 (ja) 自然言語処理システム
JPH07325826A (ja) 日本語処理システム
Adar et al. On-the-fly Hyperlink Creation for Page Images.
JP3712320B2 (ja) 可変文書作成システム、可変文書出力装置及び可変原稿作成装置
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20021203