JPH03177972A - データベースシステム - Google Patents

データベースシステム

Info

Publication number
JPH03177972A
JPH03177972A JP1319199A JP31919989A JPH03177972A JP H03177972 A JPH03177972 A JP H03177972A JP 1319199 A JP1319199 A JP 1319199A JP 31919989 A JP31919989 A JP 31919989A JP H03177972 A JPH03177972 A JP H03177972A
Authority
JP
Japan
Prior art keywords
data
word
input
search
standardization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1319199A
Other languages
English (en)
Inventor
Emiko Itou
伊藤 栄美子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1319199A priority Critical patent/JPH03177972A/ja
Publication of JPH03177972A publication Critical patent/JPH03177972A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、大量のデータを記憶して検索するデータベー
スシステムに関する。
〔従来の技術〕
データベースシステムは、大量のデータを記憶し、記憶
されているデータの中から検索条件に該当するデータを
取り出すことができるシステムである。記憶できるデー
タ型はシステムによって異なるが、基本的な型は文字(
文字列)型と数値型で、それらに加えて日付型、金額型
環システム固有の型が依存する場合もある。
検索は、検索情報として与えられたデータと記憶されて
いるデータとの比較(マツチング)によって行なわれる
。例えば、文字型データによる検索を行う場合には、検
索情報として入力された文字列と記憶されている文字列
を比較する。これは、単純に文字コードの列の比較によ
って行なわれるので、人間にとって同じ意味の単語であ
っても、システムにとってはコードが完全に一致しなけ
れば同じ単語とは見なされない。
検索時に同じ意味の単語と一致させるための方法として
、同意語として登録された単語全てをキーとして検索を
行い、検索結果の論理和をとる方法等がある。
〔発明が解決しようとする課題〕
従来のデータベースシステムにおいて、キーワード検索
など文字列による検索を行う為には、登録時と完全に同
じコードのデータを検索情報として与えな()ればなら
ない。しかし、−殻内にユーザの入力には一貫性がなく
、データを登録した時と検索情報を入力する時では、同
じ意味を持った別の単語を入力する場合も少なくない。
例えば、登録時に「関係型データベース」と入力しても
、検索時に「リレーショナルデータベース」と入力する
場合などである(「関係型データベース」と入力しても
、検索時に「リレーショナルデータベース」と入力する
場合のどである。特に、マルチユーザで使用している場
合には、登録した人と検索する人が異なることが普通な
ので、個人差も加わり、同意語のうちどの単語を入力す
るがのばらつきが大きくなる。
ユーザが、登録した単語と検索時に入力した単語の文字
コードが異なっても、それらが同意語でユーザが同じも
のとして使用している場合、同意語も検索の障きる仕組
みが必要である。例えば、ユーザが登録時に「関係型デ
ータベース」と入力し検索条件に「リレーショナルデー
タベース」と入力しても、ユーザは「関係型データベー
ス」も検索の対象としていることが多いからである。
また、上記のような同意語の含めた検索を行うために、
同意語全てをキーとして検索し結果の論理講和をとる方
法もあるが、このためには複数回検索を実行しなければ
ならないので検索速度が低下する。
〔課題を解決するための手段〕
本発明のデータベースシステムは、主に登録および検索
のためにデータを入力および表示するための入出力部と
、大量のデータを記憶するデータ記憶部と、前記入出力
部からの入力を受けて前記データ記憶部の内容の登録・
削除・検索・修正を行なうデータ処理部とで構成される
データベースシステムにおいて、同じ意味を持つ単語グ
ループ及びこの単語グループを代表する単語に関する情
報を格納する辞書データベースと、前記入出力部から入
力された単語を前記辞書データベースを使用して属する
前記単語グループを代表する単語に置換する標準化部と
を有している。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図は、本発明の一実施例を示すブロック図である。
本実施例は、データの入出力を行なう入出力部1、入力
されたデータを使用して登録・削除・検索・修正などの
処理を行なうデータ処理部2、登録されているデータを
記憶するデータ記憶部3、入出力部1から入力された文
字型データを必要に応じて同じ意味を持つ単語グループ
の代表単語に置換して(これを標準化と呼ぶ〉データ処
理部2に渡す標準化部4、標準化部4で標準化するため
のデータを格納している辞書データベース5とから構成
される。
入出力部1から入力されたデータを直接、あるいは標準
化部4で標準化してデータ処理部2に送り処理する。入
力データを標準化するがどぅがを決定する方法として次
の方法が考えられる。
■文字型データは全て標準化する。
■標準化を必要とするフィールドを、文字型とは別の属
性(以降、標準化文字型と呼ぶ)として取り入れる。こ
のフィールドに対する入力データは全て標準化する。
■ユーザが標準化を実行するためのファンクション・キ
ーを押下した場合のみ標準化する。
本実施例では■の方法を用い、標準化文字型に対する入
力があった場合、入力された単語が属している単語グル
ープに関する情報(代表単語など)をシステム側から表
示してユーザに確認を求める。
ユーザがこれを承認した場合には、入力データを代表単
語に置換する。ユーザが、入力した単語を代表単語とし
て置換したくない場合には、置換しlいことを指定すれ
ばそのままのデータをデータ処理部2に送る。また、単
語が複数の端側グルー1に属している場合には、各単語
グループに関する情報を表示して、どのグループの代表
単語と置換するかをユーザからの指定によって決定する
登録データを標準化すると、データ記憶部3には代表単
語が記憶されることになる。検索条件を人力するときも
同様に標準化すれば、代表単語と一致するものを検索す
ることになり、同じ単語グループに属する全ての単語と
一致することになる9 第2図は、本実施例における画面イメージの例でちる。
本図は、登録画面で標準化文字型フィールドであるキー
ワードに「リレーショナルデータベース」と入力し、こ
の単語の属する単語グループが表示されたところを示し
ている。この単語グループには、他に、代表単語である
「関係型データベース」と、「関係データベースJ  
rRDBJが含まれている。単語グループ情報の表示画
面の下に「標準化しますか?」と表示され、ここで。
Y′を入力するとキーワードには「リレーショナルデー
タベース」の代わりに「関係型データベース」と登録さ
れる。この例では、キーワードに「関係データベース」
、rRDB、等と入力し、ても単語グループに関して同
様の情報が表示され、「関係型データベース」と置換で
きる。また、検索時に「キーワードがリレーショナルデ
ータベースであるもの」という条件で検索を行ってち、
その条件は標準化部4で「キーワードが関係型データベ
ースであるもの」と書き換えられるので、登録時に標準
化されて「関係型データベース」として記憶されている
全てのデータが選択されることになる。これは、検索条
件としてこの単語グループの他の単語を使った場合も同
じ結果が得られる。
〔発明の効果〕
以上説明したように本発明は、登録するデータを単語グ
ループを代表する単語と置換して記憶し、さらに検索情
報として入力したデータも代表単語と置換することによ
って、同意語を全て同じものとして扱うので、ユーザが
要求するデータをより確立高く提供できるという効果が
ある。
ユーザが記憶されているデータ自体を正確に知らなくて
も、だいたいの意味を知っていれば、その同意語を入力
して検索することができる。このように、ユーザに対し
てあいまいな検索を許し、ユーザの負担を軽減するとい
う意味でユーザインタフェースの改善にもつながる。
従来技術で述べた、同意語として登録されている単語全
てで検索を行い論理和をとる方法は、上記の効果があっ
ても検索速度が遅い。しかし、本発明のデータベースシ
ステムでは、標準化した単語同志の比較によって一度検
索を行うだけなので、検索の高速に行える。ただし、デ
ータの登録時には標準化のためのオーバーヘッドが生じ
るため、本発明は検索専用のデータベースシステムにお
いてより有効である。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図に示す実施例における画面イメージの例を示す図
である。 1・・・入出力部、2・・・データ処理部、3・・・デ
ータ記憶部、4・・・標準化部、5・・・辞書データベ
ース。

Claims (1)

    【特許請求の範囲】
  1. 主に登録および検索のためにデータを入力および表示す
    るための入出力部と、大量のデータを記憶するデータ記
    憶部と、前記入出力部からの入力を受けて前記データ記
    憶部の内容の登録・削除・検索・修正を行なうデータ処
    理部とで構成されるデータベースシステムにおいて、同
    じ意味を持つ単語グループ及びこの単語グループを代表
    する単語に関する情報を格納する辞書データベースと、
    前記入出力部から入力された単語を前記辞書データベー
    スを使用して属する前記単語グループを代表する単語に
    置換する標準化部とを有することを特徴とするデータベ
    ースシステム。
JP1319199A 1989-12-07 1989-12-07 データベースシステム Pending JPH03177972A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1319199A JPH03177972A (ja) 1989-12-07 1989-12-07 データベースシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1319199A JPH03177972A (ja) 1989-12-07 1989-12-07 データベースシステム

Publications (1)

Publication Number Publication Date
JPH03177972A true JPH03177972A (ja) 1991-08-01

Family

ID=18107522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1319199A Pending JPH03177972A (ja) 1989-12-07 1989-12-07 データベースシステム

Country Status (1)

Country Link
JP (1) JPH03177972A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334360A (ja) * 1992-05-28 1993-12-17 Fujitsu Ltd 名称認識方法
JP2003256462A (ja) * 2002-03-04 2003-09-12 Hitachi Ltd コード化システムおよびコード化プログラム
JP2006501529A (ja) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, リアルタイムデータ保管

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334360A (ja) * 1992-05-28 1993-12-17 Fujitsu Ltd 名称認識方法
JP2006501529A (ja) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, リアルタイムデータ保管
JP2003256462A (ja) * 2002-03-04 2003-09-12 Hitachi Ltd コード化システムおよびコード化プログラム

Similar Documents

Publication Publication Date Title
US6957213B1 (en) Method of utilizing implicit references to answer a query
US6496820B1 (en) Method and search method for structured documents
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
JP3281639B2 (ja) 文書検索システム
JPH0773197A (ja) 異表記語辞書作成支援装置
JPH03177972A (ja) データベースシステム
JPH05250416A (ja) データベースの登録・検索装置
JP2939841B2 (ja) データベース検索装置
JPH06325091A (ja) 類似度評価型データベース検索装置
JP2621999B2 (ja) 文書処理装置
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH03150668A (ja) 検索システムの入力文字列正規化方式
JPH02287876A (ja) テキスト型データベース装置
JP3436109B2 (ja) 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3419425B2 (ja) 認識文字補正装置
JPH01233517A (ja) データベース検索装置
JPS6340938A (ja) 情報検索における同意語検索方式
JPS60247756A (ja) デ−タベ−ス装置
JPH07105223A (ja) データベース検索装置
JPH06243118A (ja) 操作手順生成方式
JPH02244380A (ja) データベースシステム
JPH0795300B2 (ja) データベースにおける名称管理方式
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH0721197A (ja) キーワード付与装置