JP2548119B2 - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JP2548119B2
JP2548119B2 JP60124511A JP12451185A JP2548119B2 JP 2548119 B2 JP2548119 B2 JP 2548119B2 JP 60124511 A JP60124511 A JP 60124511A JP 12451185 A JP12451185 A JP 12451185A JP 2548119 B2 JP2548119 B2 JP 2548119B2
Authority
JP
Japan
Prior art keywords
attribute values
attribute
record
delimiter
element attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60124511A
Other languages
English (en)
Other versions
JPS61282927A (ja
Inventor
善夫 中埜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60124511A priority Critical patent/JP2548119B2/ja
Publication of JPS61282927A publication Critical patent/JPS61282927A/ja
Application granted granted Critical
Publication of JP2548119B2 publication Critical patent/JP2548119B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、データベースに総称される情報検索装置に
関するものである。
従来の技術 従来の情報検索装置においては、レコード内のある属
性が複数の値を持つことは許されておらず、論理的に第
8図に示すような状況のレコードに対しては、これの第
9図(a)または第9図(b)のように変形し、階層構
造または関係構造で扱っていた。
発明が解決しようとする問題点 しかしながら上記第9図(a)のような構成ではレコ
ードの構造が大きく変形されており、取り扱いが複雑に
なるという問題点を有し、第9図(b)のような構成で
もレコードの構造がかなり変形されており、しかも情報
の重複が著しいという問題点を有していた。
本発明はかかる点に鑑み、第8図に示すような構造の
レコードに対し、その構成を変形することなく検索用の
索引を作成する情報検索装置を提供することを目的とす
る。
また、本発明は複数の属性値間に属性値相互の係り受
けを示す区切記号を配置し、より高度な検索機能を実現
することを目的とする。
問題点を解決するための手段 本発明は、情報を複数の属性から成るレコードという
単位で管理する情報管理手段と、レコード内の特定の属
性についてその属性値の索引を作成する索引作成手段
と、索引を検索することにより目的とするレコードを得
る検索手段を備えた情報検索装置である。
作用 本発明は、上記した構成により、情報管理手段によっ
て管理されるレコード内の属性値が区切記号によって分
離された複数の値を持つ場合、索引作成手段は、その個
々の値を有意な個別の値として索引に登録し、検索手段
はそのようにして作成された索引を参照することによ
り、属性内の複数の値のいずれからでも目的とするレコ
ードを検索し、区切記号の示す係り受けに基づいて検索
条件の合否を判定する。
実施例 第1図は、本発明の一実施例における情報検索装置の
ブロック図を示すものである。第1図において1は情報
管理手段、2は索引作成手段、3は検索手段、4は検索
である。
情報管理手段1は、複数の属性の集まりから成る情報
をレコードという単位で管理し、レコードの集合を主記
憶上または二次記憶上に管理する。いま、レコードを固
定長とし二次記憶上にすべてのレコードを保持する場合
を考えると、その格納形態は第2図のようになる。第2
図において、5は二次記憶、51〜5nはレコードである。
すべてのレコードにはレコード通番が付与されており、
各レコードの格納位置は(レコード通番)×(レコード
長)で知ることができる。更に、レコードは複数の属性
から成るのでレコードの形式を管理する情報があり、そ
の一例を第3図に示す。第3図において、6はレコード
定義情報、61は属性名、62は属性の型(文字列、数値な
ど)、63は属性の長さ(幅)である。
索引作成手段2は、レコード内のある属性Xに関する
索引を作成するように指示されると、レコード定義情報
6を参照することによりレコード内の属性Xの位置とそ
の長さを知り、属性の値とレコード通番との対応情報で
ある索引4を作成する(第4図)。第4図において、41
は属性値、42はその属性値を持つレコードのレコード通
番である。
検索手段3は、検索条件として与えられた属性値が要
素属性値相互の係り受けを示す区切記号で連結された要
素属性値の並びで構成されているとき、索引4内の属性
値41とそれぞれの要素属性値とを比較し、一致する属性
値41が見つかるとその属性値に対応するレコード通番42
を求める。求められたレコード通番42のうち、それぞれ
の要素属性値に共通するレコード通番、つまりは、すべ
ての要素属性値から検索しうるレコード通番のみを選別
し、そのレコード通番42により検索結果の候補となるレ
コードを二次記憶5から取り出す。そして、それらのレ
コードのうち検索対象としている属性の属性値が検索条
件に示された区切記号による要素属性値相互の係り受け
を満たすものを目的のレコードとして出力する。
以上のように構成された本実施例の情報検索装置につ
いて以下その動作を説明する。
第5図は本実施例における情報管理手段1によるレコ
ードの構成を表わしたものである。属性数は説明上仮に
3個とする。第5図において、10はレコードであり、11
〜13は属性である。また属性13内には3つの要素属性値
「田中」、「佐藤」、「鈴木」が要素属性値相互の係り
受けの<と>を示す区切記号↓で連結されて格納されて
いる。
このように構成されたレコード10(レコード通番は仮
に#100とする)に対して属性13に関して索引を作成す
るように指示がなされると、索引作成手段2は、属性13
内の区切記号↓を識別し、要素属性値「田中」、「佐
藤」、「鈴木」を抽出し、上述の機能によりその値とレ
コード通番#100とを対応させて索引4に登録する(第
6図)。
検索手段3は上述のように索引4を参照することによ
り、属性値41内の値「田中」、「佐藤」、「鈴木」のい
ずれからもレコード通番#100を得ることができるの
で、例えば検索条件“社員=NAME"に対して、NAMEが要
素属性値を区切記号で連結した 田中↓佐藤 (田中<と>佐藤) 田中↓鈴木 (田中<と>鈴木) 佐藤↓鈴木 (佐藤<と>鈴木) 田中↓佐藤↓鈴木 (田中<と>佐藤<と>鈴木) のいずれであってもレコード通番#100はNAMEに示され
たすべての要素属性値から検索しうる値であり、かつ、
レコード通番#100のレコード10内の属性13田中↓佐藤
↓鈴木はNAMEで示された要素属性値と区切記号の関係を
満たしているので、レコード10を検索結果として出力す
る。
いま、第10図に示すように3つのレコードが存在した
とする。このとき、第11図のような索引が作成される。
ここで、本実施例における検索条件の(a)“社員=
田中↓佐藤↓鈴木”と従来の情報検索装置で使用されて
いる意味でのOR演算子を用いた(b)“社員=田中 OR
社員=佐藤 OR 社員=鈴木”では検索結果が異な
る。まず、検索条件(b)では、属性値に区切記号を含
んでいないので、従来の検索技術を用いて検索すること
ができ、このとき、第11図の索引を検索することによ
り、レコード通番#100,#101,#102が求まり、「田中
↓佐藤↓鈴木」のレコード、「田中↑佐藤↑鈴木」のレ
コード、「田中↑鈴木」のレコードのすべてが検索結果
として出力されることは周知である。しかし、検索条件
を(a)としたとき、本実施例の検索手段3によると、
検索結果の候補としては、まず3つの要素属性値の全て
に対応するレコード通番#100と#101だけが検索され、
この2つのレコードのうち区切記号を示す係り受けを満
たす「田中↓佐藤↓鈴木」のレコードのみが検索結果と
して出力される。
上記の例では区切記号として係り受けの<と>を示す
↓を定義したが、区切記号として係り受けの<かつ>を
示す↑を定義し、第7図のようなレコードを考えると、
検索のために与えられた条件が“社員=田中↑佐藤↑鈴
木”(社員=田中<かつ>佐藤<かつ>鈴木”でないと
いレコード20を捜し出さないとの制御も可能となる。つ
まり、検索条件に示された属性値(NAME)が「田中↑佐
藤」や「田中↑鈴木」、「佐藤↑鈴木」では、レコード
20の属性値に示された区切記号↑が要求している要素属
性値に不足があるので検索結果としては出力されない。
これに関し、第10図、第11図を用いて説明を加える。
本実施例における検索条件の(c)“社員=田中↑佐
藤↑鈴木”と従来の情報検索装置で使用されている意味
でのAND演算子を用いた(d)“社員=田中 AND 社員
=佐藤 AND 社員=鈴木”では検索結果が異なる。ま
ず、検索条件(d)では、属性値に区切記号を含んでい
ないので、従来の検索技術を用いて検索することがで
き、このとき、第10図の索引を検索することにより、レ
コード通番#100と#101が求まり、「田中↓佐藤↓鈴
木」のレコードと「田中↑佐藤↑鈴木」のレコードの両
方が検索結果として出力されることは周知である。しか
し、検索条件を(c)としたとき、本実施例の検索手段
3によると、検索結果の候補としてレコード通番#100
のレコードも検索されはするが、区切記号を示す係り受
けを満たさないので、検索結果からは除外され、「田中
↑佐藤↑鈴木」のレコードのみが検索結果として出力さ
れる。
要素属性値相互の係り受けを示す区切記号は<と>を
示す↓、<かつ>を示す↑に限るものではない。例え
ば、<の上司の>を示す→を定義し、属性13の内容が田
中→佐藤↓鈴木つまり田中<の上司の>佐藤<と>鈴木
であれば“社員=田中→佐藤”(“社員=田中<の上司
の>佐藤”)または“社員=田中→鈴木”(“社員=田
中<の上司の>鈴木”)で検索するとの制御もでき、区
切記号の意味づけとそれに対する制御は検索手段3の付
加機能により自由に設計することができる。
また、区切記号として↑、↓、→の代わりにそれぞれ
<と>、<かつ>、<の上司の>のような係り受け表現
をそのまま使用すれば、さらに理解しやすくなる。他の
例として、「標題」という属性があり、あるレコードに
は、要素属性値「データベース」、「検索技術」、「高
速化」が区切記号の<の>、<と>で「データベース<
の>検索技術<と>高速化」のように結合されて格納さ
れている場合を考える。このとき、検索条件が“標題=
データベース<の>の検索技術”、“標題=データベー
ス<の>高速化”のいずれであっても、このレコードが
検索条件に合致するように制御することができる。ま
た、他に標題の属性値が「データベース<は>検索技術
<で>高速化」のように全く同じ要素属性値の組み合わ
せで構成されるレコードが存在していても、区切記号が
示す係り受け関係が異なるので上述の検索条件では検索
されず、これら2つのレコードを検索条件で明確に分離
して検索することができる。
つぎに、区切記号の係り受けに基づく検索の方法の一
例について説明する。
まず、係り受け区切記号で要素属性値を連結した属性
値は、レコード内の属性または検索条件の少なくとも一
方に出現する。
例えば、「田中→佐藤↓鈴木」のような属性値(デー
タ)がレコードに格納されており、検索条件が(ア)田
中→佐藤、(イ)田中→鈴木、または(ウ)田中↓鈴木
であったとする。
〔検索条件(ア)の場合〕
(ステップ1)検索条件内の要素属性値、「田中」、
「佐藤」の何れもを含むレコードを検索し、「田中→佐
藤↓鈴木」のレコードを候補とする候補として抽出す
る。
(ステップ2)係り受け区切記号に基づき、検索条件
の構造解析を行う。この例では、解析結果として第12図
(a)のような構造木が作られる。
(ステップ3)レコード内のデータを取り出し、係り
受け区切り記号に基づき、データの構造解析を行う。こ
の例では、解析結果として第12図(b)のような構造木
が作られる。
(ステップ4)検索条件の構造木1がデータの構造木
2の一部になっているかどうかを検査する。この例で
は、第12図(c)の部分が一致判定され、検索結果とし
て出力される。
〔検索条件(イ)の場合〕
検索条件の構造木は第12図(d)のようになる。
構造木3がデータの構造木2の一部になっているがど
うか検査し、第12図(e)の部分が一致判定され、検索
結果として出力される。
〔検索条件(ウ)の場合〕
検索条件の構造木は第12図(f)のようになる。
この場合は、構造木2の第12図(g)の部分が構造木
4に一致すると判定され、検索結果として出力される。
また、データベース<の>検索技術<と>高速化の場
合は、データの構造木が第12図(h)のようになること
は、上記の説明から容易に理解できる。
以上のように本実施例によれば、属性内に複数の属性
値相互の係り受けを示す区切記号を配し、1つの属性内
に有意な複数の属性値を格納することにより、レコード
の構成を変形することなく効率よく情報の管理および索
引の作成が行なえるとともに、区切記号の示す係り受け
に基づいて、より厳密に検索条件の合否判定が行え、検
索結果の絞り込みが可能となる。
なお、索引の作成法については、ISAM、B−TREE、HA
SH等のいくつかの手法があり、本実施例に限るものでは
ない。
発明の効果 以上説明したように、本発明によれば、レコードの管
理形態を変形せしめることなくしかも情報の重複のない
情報管理ができ、また、区切記号の示す係り受けに基づ
いて検索精度の向上が図られ、その実用的効果は大き
い。
【図面の簡単な説明】
第1図は本発明における一実施例の情報検索装置のブロ
ック図、第2図は二次記憶内のレコードの格納形態を表
わす図、第3図はレコード定義情報の構造を表わす図、
第4図は索引の構造を表わす図、第5図は同実施例にお
ける情報の持ち方を表わす概念図、第6図は同実施例に
おける索引への登録を説明する図、第7図は本発明の他
の実施例における情報の持ち方を表わす概念図、第8図
は本発明装置が扱うレコードの構造を示す図、第9図は
従来の情報検索装置における情報の持ち方を表わす概念
図、第10図、第11図は索引の一例を示す図、第12図は検
索方法の一例に関する説明図である。 1……情報管理手段、2……索引作成手段、3……検索
手段、4……索引、5……二次記憶、51〜5n……レコー
ド、6……レコード定義情報、10……レコード、11〜13
……属性。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】情報を複数の属性から成るレコードという
    単位で管理する情報管理手段と、検索条件として与えら
    れた属性値を一致する属性値を前記情報管理手段から検
    索して目的とする前記レコードを得る検索手段とを具備
    し、前記レコードにはある特定の属性について属性値が
    要素属性値相互の係り受けを示す区切記号で連結された
    要素属性値の並びで構成されるとともに前記区切記号に
    は論理積及び論理和以外の係り受けを示すものを少なく
    とも1つは含むものがあり、前記検索手段が検索条件と
    して与えられた属性値が前記要素属性値相互の係り受け
    を示す区切記号で連結された要素属性値の並びで構成さ
    れたものであるとき、論理和を示す区切記号で連結され
    た複数の要素属性値があるときはそれらを一つの要素属
    性値とみなして要素属性値を含むすべてのレコードを検
    索したのち属性値が要素属性値相互の係り受け区切記号
    を示す関係を満たしているレコードのみを検索結果とし
    て出力することを特徴とする情報検索装置。
  2. 【請求項2】情報を複数の属性から成るレコードという
    単位で管理する情報管理手段と、前記レコード内の指定
    された属性についてその属性値とレコードを特定する情
    報とを対応付けた索引を作成する索引作成手段と、検索
    条件として与えられた属性値に一致する属性値を前記索
    引から検索して目的とする前記レコードを得る検索手段
    とを具備し、前記レコードにはある特定の属性について
    属性値が要素属性値相互の係り受けを示す区切記号で連
    結された要素属性値の並びで構成されるとともに前記区
    切記号には論理積及び論理和以外の係り受けを示すもの
    を少なくとも1つは含むものがあり、前記索引作成手段
    は指定された属性が前記特別な属性のとき複数の要素属
    性値を抽出しそれぞれをレコードを特定する情報と対応
    付けて索引に登録し、前記検索手段は検索条件として与
    えられた属性値が前記要素属性値層相互の係り受けを示
    す区切記号で連結された要素属性値の並びで構成された
    ものであるとき、論理和を示す区切記号で連結された複
    数の要素属性値があるときはそれらを一つの要素属性値
    とみなして前記索引を用いてそれぞれの要素属性値を含
    むレコードをそれぞれに検索するとともに、その結果を
    用いて要素属性値を含むすべてのレコードを検索したの
    ち属性値が要素属性値相互の係り受け区切記号の示す関
    係を満たしているレコードのみを検索結果として出力す
    ることを特徴とする情報検索装置。
  3. 【請求項3】情報を複数の属性から成るレコードという
    単位で管理する情報管理手段と、検索条件として与えら
    れた属性値に一致する属性値を前記情報管理手段から検
    索して目的とする前記レコードを得る検索手段とを具備
    し、前記レコードにはある特定の属性について属性値が
    要素属性値相互の係る受けを示す区切記号で連結された
    要素属性値の並びで構成されるものがあり、前記検索手
    段が検索条件として与えられた属性値が前記要素属性値
    相互の係り受けを示す区切記号で連結された要素属性値
    の並びで構成されるとともに前記区切記号には論理積及
    び論理和以外の係り受けを示すものを少なくとも1つは
    含むとき、論理和を示す区切信号で連結された複数の要
    素属性値があるときはそれらを一つの要素属性値とみな
    して要素属性値を含むすべてのレコードを検索したのち
    属性値が要素属性値相互の係り受け区切記号を示す関係
    を満たしているレコードのみを検索結果として出力する
    ことを特徴とする情報検索装置。
  4. 【請求項4】情報を複数の属性から成るレコードという
    単位で管理する情報管理手段と、前記レコード内の指定
    された属性についてその属性値とレコードを特定する情
    報とを対応付けた索引を作成する索引作成手段と、検索
    条件として与えられた属性値に一致する属性値を前記索
    引から検索して目的とする前記レコードを得る検索手段
    とを具備し、前記レコードにはある特定の属性について
    属性値が要素属性値相互の係り受けを示す区切記号で連
    結された要素属性値の並びで構成されるものがあり、前
    記索引作成手段は指定された属性が前記特別な属性のと
    き複数の要素属性値を抽出してそれぞれをレコードを特
    定する情報と対応付けて索引に登録し、前記検索手段は
    検索条件として与えられた属性値が前記要素属性値相互
    の係り受けを示す区切記号で連結された要素属性値の並
    びで構成されるとともに前記区切記号には論理積及び論
    理和以外の係り受けを示すものを少なくとも1つは含む
    とき、論理和を示す区切記号で連結された複数の要素属
    性値があるときはそれらを一つの要素属性値とみなして
    前記索引を用いてそれぞれの要素属性値を含むレコード
    をそれぞれに検索するとともに、その結果を用いて要素
    属性値を含むすべてのレコードを検索したのち属性値が
    要素属性値相互の係り受け区切記号の示す関係を満たし
    ているレコードのみを検索結果として出力することを特
    徴とする情報検索装置。
JP60124511A 1985-06-07 1985-06-07 情報検索装置 Expired - Lifetime JP2548119B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60124511A JP2548119B2 (ja) 1985-06-07 1985-06-07 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60124511A JP2548119B2 (ja) 1985-06-07 1985-06-07 情報検索装置

Publications (2)

Publication Number Publication Date
JPS61282927A JPS61282927A (ja) 1986-12-13
JP2548119B2 true JP2548119B2 (ja) 1996-10-30

Family

ID=14887297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60124511A Expired - Lifetime JP2548119B2 (ja) 1985-06-07 1985-06-07 情報検索装置

Country Status (1)

Country Link
JP (1) JP2548119B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59870A (ja) * 1982-06-28 1984-01-06 Shin Kobe Electric Mach Co Ltd 密閉式鉛蓄電池

Also Published As

Publication number Publication date
JPS61282927A (ja) 1986-12-13

Similar Documents

Publication Publication Date Title
EP0722145B1 (en) Information retrieval system and method of operation
US6389412B1 (en) Method and system for constructing integrated metadata
US6496820B1 (en) Method and search method for structured documents
US7143086B2 (en) File search method and apparatus, and index file creation method and device
JP2693914B2 (ja) 検索システム
RU2433467C1 (ru) Способ формирования структуры агрегированных данных и способ поиска данных посредством структуры агрегированных данных в системе управления базами данных
JP2548119B2 (ja) 情報検索装置
JP3653333B2 (ja) データベース管理方法およびシステム
JP2000003366A (ja) 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体
JPH0773187A (ja) 検索システム
JPH0727532B2 (ja) 情報検索方法及びシステム
JP3719089B2 (ja) 文書処理装置
JP2697559B2 (ja) 情報検索装置
JPH05128159A (ja) キーワード抽出方法及び装置
JPS6243730A (ja) 情報検索装置
KR101142062B1 (ko) 멀티미디어 데이터의 문자 기반 메타데이터 검색을수행하는 데이터 베이스 장치 및 방법
JPH06187374A (ja) 検索方式
JPH05313971A (ja) リレーショナル・データベースにおけるキーワード管理方式
JPH08314948A (ja) 情報検索装置
JPH05158984A (ja) 文字列抽出装置
JPH03123973A (ja) 文書検索方法
JPH10320402A (ja) 検索式作成方法、検索式作成装置、及び記録媒体
JPH06309368A (ja) 文書検索装置
Leung et al. Semantic-based retrieval of visual data
JPH04148373A (ja) データ検索システム