JPH1091493A - データベースの構築方法 - Google Patents

データベースの構築方法

Info

Publication number
JPH1091493A
JPH1091493A JP8242927A JP24292796A JPH1091493A JP H1091493 A JPH1091493 A JP H1091493A JP 8242927 A JP8242927 A JP 8242927A JP 24292796 A JP24292796 A JP 24292796A JP H1091493 A JPH1091493 A JP H1091493A
Authority
JP
Japan
Prior art keywords
data
keyword
database
stored
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8242927A
Other languages
English (en)
Inventor
Jiyoukou Kiyou
乗▲晃▼ 姜
Kenichi Yoshida
健一 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8242927A priority Critical patent/JPH1091493A/ja
Publication of JPH1091493A publication Critical patent/JPH1091493A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 データベースを構築する際に人手による対応
の必要性を無くした効率的なデータベースの構築方法を
提供する。 【解決手段】 データベース1中に新規データを記憶す
る時に、このデータベース中に記録してあるデータ1a
に添付されたキーワード1bを調べ、新規データに対す
るキーワードと特定の関係にあるキーワードを持つデー
タを検索し、条件が満たされたデータがそのデータベー
ス中から検索された場合、新規データまたは検索された
データに添付されたキーワードを変更する。 【効果】 データベースを構築する際に、人手で検索用
情報を追加する手間を削減し、効率的なデータベースを
構築することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデータベースの構築
方法に係り、特に人手による対応が不要の効率的なデー
タベースの構築方法に関する。
【0002】
【従来の技術】従来、データベースにデータを記憶する
時には、データに人が様々な基準で選んだ検索用情報を
添付していた。例えば文献Shimazu, H., Shibata, A. a
nd Nihei, K., 1994 Case-Based Retrieval Intercae A
dapted to Customer-InitiatedDialogues in Help Desk
Operations in Proc of AAAI94は、計算機のトラブル
とその対処方法に関するデータベースに関して述べてい
る。このシステムは、データを入力する時には、人がSc
hemaと呼ぶ基準で選択した検索用情報を計算機のトラブ
ルとその対処方法とは別に入力しておく。このSchemata
により利用者は検索条件を指定できる。この時、システ
ムを旨く利用するには、事前に旨いSchemataを選んでお
く必要があった。
【0003】
【発明が解決しようとする課題】上記のような人手によ
る検索情報の準備はデータベース構築上もっとも重要
で、省力化が望まれる部分であった。
【0004】本発明の目的は、上記のような、人手によ
る対応の必要性を無くし、効率的なデータベースの構築
方法を提供することにある。
【0005】
【課題を解決するための手段】上記目的は、後からの検
索要求に提示するために記憶するデータと、このデータ
に対する検索要求をデータベースのユーザーが指定する
ためのキーワードの組み合わせからなるデータベースに
おいて、このデータベース中に新規データを記憶する時
に、このデータベース中に記録してあるデータに添付さ
れたキーワードを調べ、新規データに対するキーワード
と特定の関係にあるキーワードを持つデータを検索し、
条件が満たされたデータがこのデータベース中から検索
された場合、新規データまたは検索されたデータに添付
されたキーワードを変更する仕組みを持つことで達成さ
れる。
【0006】
【発明の実施の形態】以下、図面を使って本発明の1実
施例(実施例1)を詳細に説明する。
【0007】図1は本発明を適用したデータベースの構
成を示した図である。図で1は、文章データ1aとキーワ
ード1bの組み合わせを記憶するデータベース本体であ
り、適当な計算機上のデータベースで良い。2はデータ
ベース1に新規データを記憶するための新規データ記憶
機能であり、キーワード抽出機能2a、キーワード選択機
能2bを備えた適当な計算機プログラムで良い。3はデー
タベース1に記憶されたデータを検索するためのデータ
検索機能であり、キーワード比較機能3aを備えた適当な
計算機プログラムで良い。4はデータベース1の利用者
が計算機を使うためのインターフェース装置であり、計
算機の適当な表示装置および入力装置で良い。
【0008】以下説明のために、初めにデータベース1
に表1に例示した文章データとキーワードの組み合わせ
(ID 1)が1組記憶されていたと仮定する。
【0009】
【表1】
【0010】図2は本発明を適用したデータベースのデ
ータ検索機能3の処理アルゴリズムを例示した図であ
る。まずデータ検索機能3は、インターフェース装置4
から検索用のキーワードを入力する(図2、処理5)。
そしてデータベース1に記憶された総てのデータ1aに対
してそのデータの有無を検出し(同図、判定6)、デー
タなしの場合は処理を終了する(同図、処理7)。デー
タありの場合は、検索条件として示されたキーワード
と、データと対になり記憶されたキーワード1bをキーワ
ード比較機能3aにより比較し、一致するか否か調べ(同
図、判定8)、一致する場合は、このデータ1aを検索結
果として出力する(同図、処理9)。
【0011】本実施例では説明の簡単化のために、キー
ワード比較機能3aは単純にキーワードが全て一致するか
否か判定するものとする。実際の実施例ではK Nearest
Neighbour法など、一致判定以外の比較方法を用いても
よい。
【0012】図3は本発明を適用したデータベースの新
規データ記憶機能3の処理アルゴリズムを例示した図で
ある。新規データ記憶機能3は、インターフェース装置
4を通して、まず文章データ1aを入力する(図3、処理
10)。以下ではデータベースの利用者が新たな文章デ
ータ1aとして「新規データを記憶する時に、キーワード
として,,,」を入力したとする(いま仮にID 2とす
る)。
【0013】次に新規データ記憶機能3は、文章データ
1a(ID 2)から適当な検索用キーワード候補を抽出する
(図3、処理11)。この抽出操作は一般的な情報検索
手法で用いられるような、単語の出現頻度を計算し、通
常の文章に現れる比率に比較して該当文章に頻繁に出現
する単語をキーワード候補として抽出する方法や、品詞
を解析し名詞を抽出する方法など、種々考えられる。本
発明による場合、一般的な情報検索手法で得られたキー
ワードから、さらに後の検索精度が良くなるものを人手
で選択できるので(後述する図3、処理12の処理)、
機械的に選択精度をあげるために複雑な方法をもちいな
くとも、適当な方法を用いれば良い。以下では「データ
ベース、記憶、キーワード、ユーザー、要求、提示」が
抽出されたとする。
【0014】次に新規データ記憶機能3は、文章データ
1aと対になるキーワード1bを選択する(図3、処理1
2)。この選択は処理11で抽出されたキーワード候補
がインターフェース装置4上に表示され、ユーザーが該
当キーワードを選択することを基本とするが、処理11
で抽出されたキーワード候補以外をキーワードとして選
択できるようにしても良い。以下ではユーザーが「デー
タベース」を選択したとする。
【0015】次に新規データ記憶機能3は、データ検索
機能3を用いて処理12で選択したキーワードを持つデ
ータを検索する(図3、処理13)。上記例の場合同じ
キーワードを持つデータ(表1、ID 1)が既にデータベ
ース中に記憶されているので、新たに入力するデータ
(ID 2)のキーワードか、既に記憶されているデータ
(ID 1)のキーワードを変更することをユーザーに指示
する(図3、処理17)。ここではユーザーが新規デー
タ(ID 2)を指定し、再度のキーワードの選択において
「データベース」と「キーワード」を選択したとする
(図3、処理12)。
【0016】次に新規データ記憶機能3は、データ検索
機能3を用いて処理12で選択したキーワードを持つデ
ータを検索する(図3、処理13)。上記例の場合同じ
キーワードを持つデータは既にデータベース中に記憶さ
れていないので、新たに入力するデータのキーワードが
決定され(図3、処理14)、文章データと一緒にデー
タベースに記憶され(図3、処理15)、処理が終了す
る(同図、処理16)。
【0017】以上の処理でデータベースには表2に例示
された内容が記憶される。
【0018】
【表2】
【0019】別の例を用いて、さらに図3の処理アルゴ
リズムを説明する。新規データ記憶機能3は、インター
フェース装置4を通して、まず文章データ1aを入力する
(図3、処理10)。以下ではデータベースの利用者が
新たな文章データ1a(ID 3)として「データベースに記
憶されるデータの内容が,,,」を入力したとする。
【0020】次に新規データ記憶機能3は、文章データ
1a(ID 3)から適当な検索用キーワード候補を抽出する
(図3、処理11)。以下では「データベース」が抽出
され、ユーザーが「データベース」をキーワードとして
選択したとする(図3、処理12)。
【0021】次に新規データ記憶機能3は、データ検索
機能3を用いて処理12で選択したキーワードを持つデ
ータを検索する(図3、処理13)。上記例も同じキー
ワードを持つデータ(表1、ID 1)が既にデータベース
中に記憶されているので、新たに入力するデータ(ID
3)のキーワードか、既に記憶されているデータ(ID
1)のキーワードを変更することをユーザーに指示する
(図3、処理17)。ここではユーザーが記憶済みのデ
ータ(ID 1)を指定したとする。
【0022】この場合、新規データ記憶機能3は、新規
データ(ID 3)のキーワードと文章データをデータベー
スに格納し(図3、処理18)、次に処理13で検索さ
れたデータ(ID 1)のキーワードを再選択する(図3、
処理19)。この処理は一旦処理13で検索されたデー
タ(ID 1)をデータベースから削除し、新たに新規デー
タとして際記憶することにより行う。
【0023】すなわちデータベースには一旦表3に例示
された内容が記憶される。
【0024】
【表3】
【0025】次に新規データ記憶機能3は、新たに新規
データとして再記憶されることになったデータ(ID 1)
の新しいキーワードを選択する(図3、処理12)。こ
こでは「データベース」と「検索」が指定されたとす
る。次にデータ検索機能3を用いて処理12で選択した
キーワードを持つデータを検索する(図3、処理1
3)。上記例の場合同じキーワードを持つデータは既に
データベース中に記憶されていないので、新たに入力す
るデータのキーワードが決定され(図3、処理14)、
文章データと一緒にデータベースに記憶される(図3、
処理15)。
【0026】以上の処理でデータベースには表4に例示
された内容が記憶される。
【0027】
【表4】
【0028】以下、図面を用いて本発明の別の実施例を
説明する。
【0029】図4は別の実施例(実施例2)による新規
データ記憶機能2の画面表示例である。実施例1におい
てはキーワードが同じデータが既にデータベース中に記
憶されていた場合、処理12から19の処理を繰り返し
て、キーワードを変更するデータを選んだ後、キーワー
ドを変更していたが、実施例2では画面上に同じキーワ
ードを持つデータの文章データ、キーワード候補、既選
択キーワードを同時に表示しておく。また、この時、双
方に含まれるキーワード候補、既選択キーワードは、一
方にのみ含まれるキーワードとは表示色などの表示方法
を変え区別しておく(図4では一方にのみ含まれるキー
ワードをハッチングして示す)。
【0030】ユーザーが既選択キーワードをマウスなど
のインターフェース装置4で選択した場合、該当データ
の選択処理(図3、処理17)と、キーワードの選択処
理(図3、処理12、この場合はキーワードの削除)が
1度に処理されるものとする。また、キーワード候補を
選択した場合も、該当データの選択処理(図3、処理1
7)と、キーワードの選択処理(図3、処理12、この
場合はキーワードの追加)が1度に処理されるものとす
る。さらに必要に応じて処理18、19、14、15も
実行されるものとする。
【0031】図5は別の実施例(実施例3)によるデー
タ検索機能3の画面表示例である。図2に示した実施例
1のデータ検索機能3の処理アルゴリズムでは、インタ
ーフェース装置4から検索用のキーワードを処理5(図
2)により1度に処理するだけであったが、実施例3に
おいては複数の検索結果が得られた場合、結果のデータ
に付随したキーワードに対して比較処理をおこない、そ
れぞれの文章データに対するキーワード候補から、別の
文章データのキーワードに含まれないものを選び、さら
に指定できるキーワード候補として表示し(図5)、キ
ーワード候補からさらにキーワードを選択することで再
度データ検索が実施できるようにしている。図5は、こ
の場合の画面表示の例である。
【0032】
【発明の効果】以上から明らかなように,本発明によれ
ば、データベースを構築する際に、人手で検索用情報を
追加する手間を削減し、効率的なデータベースの構築方
法を提供することができる。
【0033】すなわち、データベースに新規データの追
加をする時には、画面上に表示されたキーワードの候補
から適当なものを選択することで、容易に検索用キーワ
ードを選択できる。さらに、誤って既記憶データと同じ
キーワードを指定してしまった場合も、画面上に表示さ
れた両データのキーワード候補を比較しながら、2つの
データの違いを象徴するキーワードを容易に指摘でき
る。
【0034】さらに、データを検索する時も、画面上に
表示されたキーワードを比較しながら、検索結果を絞っ
ていくためのキーワードを容易に、且つ、順番に指摘で
きる。
【図面の簡単な説明】
【図1】データベースの構成例を示す図
【図2】データ検索機能3の処理アルゴリズム例を示す
フロー図
【図3】新規データ記憶機能2の処理アルゴリズム例を
示すフロー図
【図4】新規データ記憶機能2の画面表示例を示す図
【図5】データ検索機能3の画面表示例を示す図
【符号の説明】
1・・・データベース、2・・・新規データ記憶機能、
3・・・データ検索機能、4・・・インターフェース装
置。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】後からの検索要求に提示するために記憶す
    るデータと、上記データに対する検索要求をデータベー
    スのユーザーが指定するためのキーワードの組み合わせ
    からなるデータベースにおいて、上記データベース中に
    新規データを記憶する時に、上記」データベース中に記
    録してあるデータに添付されたキーワードを調べ、新規
    データに対するキーワードと特定の関係にあるキーワー
    ドを持つデータを検索し、条件が満たされたデータが上
    記データベース中から検索された場合、新規データまた
    は検索されたデータに添付されたキーワードを変更する
    ようにしたことを特徴とするデータベースの構築方法。
  2. 【請求項2】新規データを記憶する時に、新規データに
    対するキーワードと特定の関係にあるキーワードを持つ
    データがデータベース中に存在し、上記新規データまた
    は記憶済みのデータのキーワードを変更する場合に、変
    更後のキーワードと上記データベース中に記録してある
    データに添付されたキーワードを再度調べ、特定の関係
    にあるキーワードを持つデータベース中のデータが存在
    した場合、再度キーワードを修正することを特徴とする
    請求項1記載のデータベースの構築方法。
  3. 【請求項3】データベースに記憶されるデータの内容が
    文章であり、上記文章に含まれ特定の条件を満足する単
    語をキーワードとして抽出するキーワード抽出機能を持
    ち、新規文章をデータベースに記憶する時に指定するキ
    ーワードとして、上記キーワード抽出機能が対象となる
    文章から抽出したキーワードを指定することを特徴とす
    る請求項1記載のデータベースの構築方法。
JP8242927A 1996-09-13 1996-09-13 データベースの構築方法 Pending JPH1091493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8242927A JPH1091493A (ja) 1996-09-13 1996-09-13 データベースの構築方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8242927A JPH1091493A (ja) 1996-09-13 1996-09-13 データベースの構築方法

Publications (1)

Publication Number Publication Date
JPH1091493A true JPH1091493A (ja) 1998-04-10

Family

ID=17096292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8242927A Pending JPH1091493A (ja) 1996-09-13 1996-09-13 データベースの構築方法

Country Status (1)

Country Link
JP (1) JPH1091493A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321192B1 (en) * 1998-10-22 2001-11-20 International Business Machines Corporation Adaptive learning method and system that matches keywords using a parsed keyword data structure having a hash index based on an unicode value
JPWO2006030485A1 (ja) * 2004-09-13 2008-05-08 東洋エンジニアリング株式会社 情報管理装置、方法、およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321192B1 (en) * 1998-10-22 2001-11-20 International Business Machines Corporation Adaptive learning method and system that matches keywords using a parsed keyword data structure having a hash index based on an unicode value
JPWO2006030485A1 (ja) * 2004-09-13 2008-05-08 東洋エンジニアリング株式会社 情報管理装置、方法、およびプログラム

Similar Documents

Publication Publication Date Title
US7096218B2 (en) Search refinement graphical user interface
US5257186A (en) Digital computing apparatus for preparing document text
JP3170400B2 (ja) 意味パターン認識による文字列検索方法及びその装置
JPH11110415A (ja) 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体
JPH09218881A (ja) 追加検索語候補提示方法、文書検索方法およびそれらの装置
JPH0567144A (ja) 前編集支援方法およびその装置
JP2726858B2 (ja) 自然語を用いた対話形式による情報検索方法
JPH1091493A (ja) データベースの構築方法
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP2812357B2 (ja) データベース検索システム
JP3415214B2 (ja) 文書検索装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP3383485B2 (ja) 情報検索装置
JP2002099573A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JPH08305695A (ja) 文書処理装置
JPH0535798A (ja) データベース検索装置
JPH04281558A (ja) 文書検索方法および装置
JPH0546670A (ja) 情報検索装置
JPH09305626A (ja) 検索文書作成装置、検索文書記憶メディア、文書検索装置及び文書検索方法
JP3391351B2 (ja) 情報検索装置および方法
JP2990314B2 (ja) データ管理装置
JPH0785104A (ja) 文書処理装置
JPH05189485A (ja) キーワード検索方式
JPH05233713A (ja) 学習形あいまい検索方法
JPS62282364A (ja) 文字列検索方式