JPS5820072B2 - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPS5820072B2
JPS5820072B2 JP56051760A JP5176081A JPS5820072B2 JP S5820072 B2 JPS5820072 B2 JP S5820072B2 JP 56051760 A JP56051760 A JP 56051760A JP 5176081 A JP5176081 A JP 5176081A JP S5820072 B2 JPS5820072 B2 JP S5820072B2
Authority
JP
Japan
Prior art keywords
data
search
keyword
keywords
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56051760A
Other languages
English (en)
Other versions
JPS57166668A (en
Inventor
菊地紀芳
佐藤正光
斎藤裕美
野寄雅人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP56051760A priority Critical patent/JPS5820072B2/ja
Publication of JPS57166668A publication Critical patent/JPS57166668A/ja
Publication of JPS5820072B2 publication Critical patent/JPS5820072B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Description

【発明の詳細な説明】 本発明はキーワードを用いて情報検索を行う情報検索装
置に関する。
近年、データファイルに蓄積されたデータを、そのデー
タが含むキーワードを用いて検索するこが行われている
また上記キーワードに関しても、検索論理式を構成して
所要とするデータを適切に検索することが行われている
例えばキーワードAを含むデータを検索すると、数多く
のデータが取出され、この中から必要なデータのみを更
に抽出することが必要となるが、最初からキーワードA
とBとを含むデータを検索することにより、出力データ
をセレクトして有効なデータを得ることが行われる。
このようなキーワードAとBを含むものとして、検索論
理式が A*B として与えられる。
ところが従来の装置では、一般に上記検索論理式が与え
られた場合、先ずデータファイル中からキーワードAを
含むデータを検索し、しかるのちこれらのデータが更に
キーワードBを含むか否かをチェックして所要のデータ
を得る如く構成されている。
このとき、キーワードBを含むデータに比してキーワー
ドAを含むデータが多い場合、その分だけキーワードチ
ェックを数多く行わなければならず、この結果検索に多
くの時間を費した。
特に検索論理式が複雑な場合、その検索所要時間が非常
に長くなった。
然し乍ら従来、このような検索効率については何ら着目
されていないのが実情であった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、与えられた検索論理式を解釈し
てデータファイルからのデータ検索を短時間に効率良く
行うことのできる情報検索装置を提供することにある。
本発明の概要は、入力された検索論理式を精査展開し、
この精査展開された検索論理式を構成するキーワードの
データファイル上での出現頻度を予測し、出現頻度の低
いキーワードをベースとしてデータを検索することによ
ってキーワードチェックの回数を減らして短時間に効率
良く所望とするキーワードを検索するようにした情報検
索装置を提供するものである。
以下、図面を参照して本発明の一実施例につき説明する
第1図は情報検索システムの概略構成図で、タイプライ
タ1を入出力端末とし、MT装置等の外部大容量メモリ
をファイルメモリ2として情報検索装置3が設けられる
しかして情報検索装置3は、タイプライタ1から入力さ
れた検索論理式のキーワードに従って前記ファイルメモ
リ2に蓄積されたデータを検索し、その検索データを前
記タイプライタ1を介して出力する。
さて本発明に係る情報検索装置3は、例えば第2図に示
す如く構成される。
入力部11は、所望とするデータを指定する検索論理式
を入力するもので、その入力は前記タイプライタ1等の
キーボード型式のもののみならず、通信回線やデータ伝
送路を介して与えられることもある。
またこの検索論理式はキーワードにより構成されるもの
であり、上記入力部11から式精査・展開部12に入力
される。
この式精査 展開部12では上記入力された検索論理式
をスキャンし、その形式が正しいか否かをチェックして
いる。
そして、その形式に誤りがある場合、前記入力部11に
対してエラー信号を送り、検索論理式の誤り訂正を促す
ここで本装置で用いられる検索論理式について説明する
検索論理式の要素はキーワードA 、 B。C〜として
示され、その関係は*、+、−1()等の演算子によっ
て示される。
(i)A*B:キーワードAとBとが含まれることを意
味し、その演算順序はキーワードAを有するデータ中か
らキーワードBを含むものを検索することを意味する。
(ii)A+B:キーワードAあるいはキーワードBの
いずれかを有するデータを検索することを意味する。
(**b A−B:キーワードAを有するデータであ
って、且つキーワードBを持たないデータを意味し、演
算順序はキーワードAを持つデータ中からキーワードB
を含むものを除外してデータ検索することを意味する。
また、カッコ()なる演算子は、演算順位の優先度を示
すもので、ここでは (、)>*>+、− として定義される。
このようなキーワードおよび演算子により、検索論理式
は例えば (A+B)*C−D*(E+F) 等として与えられる。
しかして前記式精査・展開部12は、このようにして与
えられる検索論理式にカッコが含まれる場合、これを全
て展開して一般形に変換する。
即ち、検索論理式Sが、キーワードをajとじてとして
示されるとき、これを精査展開してなる形式に変換して
いる。
そして、この変換が終了したとき、あるいは検索論理式
にカッコが含まれないとき、式精査展開部12は制御部
13に対して上記−膜形の検索論理式と共に検索指令信
号を供給する。
一方、データファイル14には、上記したキーワードを
含む複数のデータがファイルされている。
このデータファイル14は前記したファイルメモリ2の
一部として設けられた大容量メモリからなるものである
そして、このデータファイル14上に蓄えられたデータ
は、前記制御部13によって作動制御される検索部15
によりスキャンされ、前記検索論理式に示されるキーワ
ードを含むデータが検索されて取出されるようになって
いる。
この検索されたデータが制御部13から出力部16を介
して出力される。
また上記データファイル14に蓄積された複数のデータ
に含まれるキーワードの数は、ファイル14上での出現
頻度として予測ファイル17に格納されている。
即ちこの予測ファイル17は、データファイル14上の
各データが含むキーワードを、各キーワード毎にその出
現頻度を次表のようにファイリングして記憶している。
しかして予測部18は、前記制御部13に与えられた検
索論理式を構成する各キーワードにつき、予測ファイル
17をサーチして、その出現頻度を調べている。
これによって検索論理式がB*Cであって、キーワード
Bの出現頻度が“250“、キーワードCの出現頻度が
“55“等の場合、出現頻度の低いキーワードCが検索
のベースとなるべく、上記検索論理式をCABと組替え
変更している。
これによって制御部13の検索論理式が、出現頻度の低
いキーワードを検索ベースとする型式に組替えられ、こ
の組替えられた検索論理式に従って前記データファイル
14上のデータが検索されることになる。
次に、このように構成された装置におけるデータ検索の
一例につき説明する。
入力部11より与えられたのち精査展開された検索論理
式が制御部13に入力されると、制御部13は先ず上記
検索論理式中に演算子*が含まれるか否かをチェックす
る。
このチェックにおいて演算子*が見出されない場合には
、この検索論理式は検索部15に与えられて、データフ
ァイル14に対するデータ検索に供される。
一方、上記検索論理式中に1つでも演算子*が存在する
場合、その演算子*が含まれる項を順にサーチする。
例えば前記した一般形の検索論理式の各項をa11*a
2!*・・・*a in(i=1.2〜m)を取出し、
まず a1*al*・・・*a1n−A1 2 につきサーチする。
この場合、項A1に含まれるキーワードがall、a2
1〜alnであるから、これらのキーワードのデータフ
ァイル14上での出現頻度を前記予測ファイル17より
それぞれ求める。
そして、これらの出現頻度に従ってその低いものから順
にキーワードa10.a4〜alnを並び替える。
これによって、この項の論理式は、例えばA’1 ””
210 *aa5 * ”’ ” a4として再構成
されることになる。
以下同様にして演算子*を含む項について、キーワード
の出現頻度に基づく論理式の再構成が行われる。
しかるのち、この再構成された検索論理式が検索部15
に送られて、データファイル14上のデータの検索が行
われることになる。
具体的には、検索論理式が (a1+a2)*(b□+b2) として与えられたとき、先ず式精査・展開によって a1*b1+a□*b2+a2*b1+a2*b2とし
て再構成される。
ここで上記検査論理式を構成するキーワードのデータフ
ァイル14上での出現頻度が キーワードa1 :14回 キーワードa2:19回 キーワードb1 :20回 キーワードb : 5回 であるとすれば、上記論理式は次のように組替えられる
al *b1+b2*a1+a2*b、+b2* a2
上記式中、下線を付した項が、出現頻度の関係により再
構成されている。
従って今、検索部15がこの検索論理式に従ってデータ
ファイル14上のデータを検索するとき、先ず第1項の
キーワードa1を含む14個のデータを取出し、これら
についてキーワードb1が含まれるか否かをチェックす
る。
そしてal * blを満たすデータを抽出する。
次に第2項のキーワードb2を含む5個のデータを取出
し、これらについてキーワードa2が含まれるが否かを
チェックする。
更に第3項についてはキーワードa2について19個の
データを取出してチェックし、第4項ではキーワードb
2を含む5個のデータを取出してチェックすることにな
る。
従って、この場合、43回のチェックにより所望とする
データがキーワード検索により取出されることになる。
ちなみに出現頻度によって再構成しない検索論理式を用
いてデータ検索する場合には、66回のチェックが必要
となる。
また式精査展開されない検索論理式を用いる場合には、
先ず(a1+a2)なるキーワードを含む33個のデー
タが取出されたのち、次に(b1+b2)するキーワー
ドを含む25個のデータを取出し、しかるのち再度上記
33個のデータにつきキーワード群(b1+b2)が含
まれるか否かをチェックすることになるので、合計71
回のデータチェックが必要となる。
このような対比からも明らかなように、本装置によれは
データ検索に要する時間を大幅に短縮化できる。
しかも検索論理式が複雑化する程、上記効果が顕著に生
じる。
即ち、無駄な検索を行うことなしに、短時間で効率良く
所望とするデータを検索することができる。
尚、本発明は上記実施例に限定されるものではない。
例えばデータファイル14を検索装置本体に組込むこと
は勿論のこと、装置本体とは独立させて外部メモリとし
て設けることも勿論可能である。
また実施例では、演算子*が含まれる検索論理式中の項
を取出し、これを予測部18に送ってその出現頻度を求
めたのち、その情報と共に上記項を制御部13に戻して
論理式の組替えを行ったが、第3図に示すように論理式
中の演算子*を含む項を直接切出して予測組替え部19
に送り、この予測組替え部19にて出現頻度の参照、比
較、キーワードの組替えを行ったのち、これを制御部1
3に戻すようにしてもよい。
また第4図に示すように式組替え部19aと予測部19
bとを別構成にし、それぞれの作業を分担させるように
してもよいことは勿論のことである。
また第5図に示すように予測ファイル17を省き、制御
部13は予測部18を介してデータファイル14を直接
サーチして、入力された検索論理式を構成するキーワー
ドの出現頻度を、その都度求めるように構成することも
できる。
更には、予測部18にて検索論理式の全体について式組
替えを行ったのち、これを制御部13に与えるようにす
ることも勿論可能である。
その他、検索論理式の形式や検索演算の優先度等は仕様
に応じて定めればよいものであり、検索ベースの数を少
すくシてそのチェック回数を減らすようにすれば種々変
形できる。
要するに本発明は、その要旨を逸脱しない範囲で装置仕
様に応じて変形して実施することができる。
【図面の簡単な説明】
第1図は情報検索システムの概略構成図、第2図は本発
明の一実施例装置の概略構成図、第3図および第4図は
キーワード出現頻度に基づく論理式組替え部の変形例を
示す図、第5図は本発明の別の実施例装置の概略構成図
である。 11・・・・・・入力部、12・・・・・・式精査・展
開部、13・・・・・・制御部、14・・・・・・デー
タファイル、15・・・・・・検索部、16・・・・・
・出力部、17・・・・・・予測ファイル、18・・・
・・・予測部、19・・・・・・予測組替部。

Claims (1)

    【特許請求の範囲】
  1. 1 複数のデータを蓄積したデータファイルと、このデ
    ータファイルに蓄積されたデータにそれぞれ含まれるキ
    ーワードの出現頻度をキーワード毎に記憶した予測ファ
    イルと、キーワードにより構成される検索論理式を精査
    展開する手段と、この精査展開された検索論理式を構成
    するキーワードの前記データファイル上の出現頻度を前
    記予測ファイルから求める手段と、この手段により求め
    られた出現頻度に従って前記精査展開された検索論理式
    の低出現頻度のキーワードを検索ベースとして前記デー
    タファイル上のデータを検索する手段とを具備したこと
    を特徴とする情報検索装置。
JP56051760A 1981-04-08 1981-04-08 情報検索装置 Expired JPS5820072B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56051760A JPS5820072B2 (ja) 1981-04-08 1981-04-08 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56051760A JPS5820072B2 (ja) 1981-04-08 1981-04-08 情報検索装置

Publications (2)

Publication Number Publication Date
JPS57166668A JPS57166668A (en) 1982-10-14
JPS5820072B2 true JPS5820072B2 (ja) 1983-04-21

Family

ID=12895897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56051760A Expired JPS5820072B2 (ja) 1981-04-08 1981-04-08 情報検索装置

Country Status (1)

Country Link
JP (1) JPS5820072B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210006466A (ko) 2018-05-31 2021-01-18 미쓰비시 덴키 빌딩 테크노 서비스 가부시키 가이샤 엘리베이터의 보수 작업 지원 장치
KR20210101327A (ko) 2019-02-14 2021-08-18 미쓰비시덴키 가부시키가이샤 고장 지원 장치, 기록 매체에 저장된 고장 지원 프로그램 및 고장 지원 방법

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0444168A (ja) * 1990-06-11 1992-02-13 Ricoh Co Ltd 電子フアイリング装置の文書検索装置
US5375235A (en) * 1991-11-05 1994-12-20 Northern Telecom Limited Method of indexing keywords for searching in a database recorded on an information recording medium
JPH07239857A (ja) * 1994-02-28 1995-09-12 Nec Software Ltd 全文検索する装置および方法
JPH08180066A (ja) * 1994-12-26 1996-07-12 Toshiba Corp インデックス作成方法、文書検索方法及び文書検索装置
JP3766126B2 (ja) * 1995-10-24 2006-04-12 富士通株式会社 情報検索方法および情報検索装置
JPH11282880A (ja) * 1998-02-02 1999-10-15 Ricoh Co Ltd 電子化文書検索システムおよび記憶媒体
JP2000112982A (ja) * 1998-10-07 2000-04-21 Ricoh Co Ltd 異種データベース統合システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210006466A (ko) 2018-05-31 2021-01-18 미쓰비시 덴키 빌딩 테크노 서비스 가부시키 가이샤 엘리베이터의 보수 작업 지원 장치
KR20210101327A (ko) 2019-02-14 2021-08-18 미쓰비시덴키 가부시키가이샤 고장 지원 장치, 기록 매체에 저장된 고장 지원 프로그램 및 고장 지원 방법

Also Published As

Publication number Publication date
JPS57166668A (en) 1982-10-14

Similar Documents

Publication Publication Date Title
US20020038319A1 (en) Apparatus converting a structured document having a hierarchy
US7457799B2 (en) Apparatus and method for searching data of structured document
JPS60134945A (ja) データベース処理方法
JPS62194533A (ja) 木構造デ−タのパタ−ンマツチング方式
JPS5820072B2 (ja) 情報検索装置
US5721924A (en) Method and device for obtaining a value of a referred to variable defined in a source program having a specific variable name
JP2003515802A (ja) インデクスキーデータフィールドを抽出するためのシステムおよび方法
CA2275391C (en) File processing method, data processing device, and storage medium
JP2894301B2 (ja) 文脈情報を用いた文書検索方法および装置
JP2925042B2 (ja) 情報リンク生成方法
JPH08272818A (ja) 情報検索システム
JP2962287B2 (ja) 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体
JPH11250092A (ja) 共用データベース装置、共用データベースシステム、共用データベース装置のデータ抽出方法および共用データベース装置のデータ抽出プログラムを記録した記録媒体
JPS634334A (ja) 文書イメ−ジ電子フアイル装置
Duff et al. MA62-A Frontal Code for Sparse Positive-Definite Symmetric Systems from Finite-Element Applications
JP2001101186A (ja) 機械翻訳装置
JPH11353316A (ja) 省略語補完装置
JPH0752450B2 (ja) 辞書デ−タ検索装置
JP2001325293A (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JPH0447858B2 (ja)
JP3279002B2 (ja) 情報管理装置
JP3431618B2 (ja) データ検索装置および検索方法
JPH06119156A (ja) プログラム自動生成方法
JP2848609B2 (ja) 論理回路変換方法及び装置
Koyama et al. A fast and compact technique of implementing transition tables for finite state automata