JPH08180071A - データベース検索結果評価方式 - Google Patents

データベース検索結果評価方式

Info

Publication number
JPH08180071A
JPH08180071A JP6336641A JP33664194A JPH08180071A JP H08180071 A JPH08180071 A JP H08180071A JP 6336641 A JP6336641 A JP 6336641A JP 33664194 A JP33664194 A JP 33664194A JP H08180071 A JPH08180071 A JP H08180071A
Authority
JP
Japan
Prior art keywords
record
attribute
holding unit
similarity
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6336641A
Other languages
English (en)
Other versions
JP2697651B2 (ja
Inventor
Hideo Shimazu
秀雄 島津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6336641A priority Critical patent/JP2697651B2/ja
Publication of JPH08180071A publication Critical patent/JPH08180071A/ja
Application granted granted Critical
Publication of JP2697651B2 publication Critical patent/JP2697651B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 例外的な検索結果を自動的に提示すること
(そのような提示の前提として2つの検索結果の間の類
似度を検出することを含む)を可能にする。 【構成】 データベースの属性毎に、当該各属性におけ
る属性値間の類似度が定義されている類似度定義3と、
類似度計算における当該各属性の重要度を示す重みが定
義されている重み定義4とが設けられる。基本レコード
保持部1はデータベースから検索された1つのレコード
を保持し、比較レコード保持部2はデータベースから検
索された別のレコードを保持する。類似度計算部5は、
基本レコード保持部1内のレコードと比較レコード保持
部2内のレコードとについて、各属性の類似度定義3を
参照して各属性の属性値間の類似度を計算し、各属性の
重み定義4を参照して各属性に関する類似度を各属性の
重みを加味して加重平均し、その計算結果を総合類似度
として出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データベースの検索を
行うデータベース検索システムに関し、特にデータベー
スの検索における検索結果(検索されたレコード)の評
価(検索結果の間の類似度の検出や例外的な検索結果の
提示)を自動的に行うデータベース検索結果評価方式に
関する。
【0002】
【従来の技術】データベース検索システムは、利用者
(検索者)に指定された条件(検索条件)を満たすレコ
ード(データベース内のレコード)を検索するシステム
である。利用者は、自分の入手したいデータを見つける
ために、自分の検索目的を示す検索条件をデータベース
検索式に変換して検索を行う。データベース検索システ
ムは、そのデータベース検索式に基づいてデータベース
の検索を行い、検索結果を利用者に提示する。
【0003】ここで、従来のデータベース検索システム
では、検索結果が妥当なもの(検索条件を満たすレコー
ドの中の通常のもの)でも例外的なもの(検索条件を満
たし、かつ他の検索結果に比べて特異なもの)でも区別
なく、検索結果の提示が行われていた(参考文献として
は、例えば、「マイクロソフトアクセス 1.0(Mi
crosoft ACCESS Version 1.
0) マニュアル,日本マイクロソフト社,1993
年」がある)。
【0004】すなわち、従来のデータベース検索システ
ムには、例外的な検索結果を自動的に提示したり、その
ような提示の前提として2つの検索結果の間の類似度を
検出したりする「データベース検索結果評価方式」が存
在しなかった。
【0005】
【発明が解決しようとする課題】上述した従来のデータ
ベース検索システムでは、例外的な検索結果を自動的に
提示したり、そのような提示の前提として2つの検索結
果の間の類似度を検出したりする「データベース検索結
果評価方式」が存在せず、検索結果が妥当なものでも例
外的なものでも区別なく検索結果の提示が行われている
ので、利用者にとって「多くの検索結果の中から例外的
なレコード(検索結果)を見つけること」が困難とな
り、利用者がそのような例外的なレコードの存在に気づ
かなくて例外的で重要なレコードを見落とす可能性があ
るという問題点があった。
【0006】ここで、例えば、データベース検索システ
ムとして、架空の航空券予約システムを考えてみる。こ
の航空券予約システムは、利用者が日付や予定運賃や行
き先を検索条件として入力すると、それに対応したフラ
イトスケジュールを検索結果として提示するデータベー
ス検索システムである。
【0007】仮に、利用者により「12/22(12月
22日を意味する。以下同様)から12/25の間に運
賃30万円以下でパリに行くフライト」という検索条件
が入力されると、その検索条件を満足するフライトのレ
コードが検索結果として提示される。
【0008】提示されたレコードのうち、12/23,
12/24および12/25に出発するフライトは30
件あり、それらの運賃は全て30万円以下ではあるが、
20万円以上であったとする。一方、12/22に出発
するフライトは、1件しかなかったが、その運賃は12
万円であったとする。
【0009】このような場合に、この航空券予約システ
ムが「他に比べて特に安い運賃のフライトのレコードを
例外的なレコードとして特別に利用者に提示してやる仕
組み」を持っていれば、利用者にとって有益な場合が多
い。
【0010】もちろん、このような示唆(データベース
検索システムによる例外的な検索結果の提示)がいつも
利用者にとって役に立つとは限らない。例えば、上述の
例で、利用者はできるだけ出発日を遅らせて出発したく
てそのことの方が運賃が安いことよりも重要な場合もあ
り、そのような場合には上述の「特に安い運賃のフライ
トのレコードの示唆」は利用者にとってあまり役に立た
ない。しかし、そのような場合があるとしても、例外的
な検索結果(レコード)をデータベース検索システムが
自動的に利用者に提示することは、多くの場合に有益で
ある。
【0011】従来のデータベース検索システムでは、こ
のように利用者にとって有益と考えられる「例外的な検
索結果を提示する仕組み」は存在しなかった。
【0012】本発明の目的は、上述の点に鑑み、例外的
な検索結果を自動的に提示することができ、そのような
提示の前提として2つの検索結果の間の類似度を検出す
ることを可能にするデータベース検索結果評価方式を提
供することにある。
【0013】
【課題を解決するための手段】本発明のデータベース検
索結果評価方式は、属性とその属性値との組の集合で1
つのレコードが構成され、複数のレコードの集合からな
るデータベースに関するデータベース検索結果評価方式
において、データベースから検索された1つのレコード
を保持する基本レコード保持部と、データベースから検
索された別のレコードを保持する比較レコード保持部
と、データベースの属性毎に定義されており当該各属性
における属性値間の類似度が定義されている類似度定義
と、データベースの属性毎に定義されており類似度計算
における当該各属性の重要度を示す重みが定義されてい
る重み定義と、前記基本レコード保持部内のレコードと
前記比較レコード保持部内のレコードとについて、各属
性の前記類似度定義を参照して各属性の属性値間の類似
度を計算し、各属性の前記重み定義を参照して各属性に
関する類似度を各属性の重みを加味して加重平均し、そ
の計算結果を総合類似度として出力する類似度計算部と
を有する。
【0014】
【作用】本発明のデータベース検索結果評価方式では、
属性とその属性値との組の集合で1つのレコードが構成
され複数のレコードの集合からなるデータベースに関す
るデータベース検索結果評価方式において、データベー
スの属性毎に定義されており当該各属性における属性値
間の類似度が定義されている類似度定義が設けられ、デ
ータベースの属性毎に定義されており類似度計算におけ
る当該各属性の重要度を示す重みが定義されている重み
定義が設けられ、基本レコード保持部がデータベースか
ら検索された1つのレコードを保持し、比較レコード保
持部がデータベースから検索された別のレコードを保持
し、類似度計算部が基本レコード保持部内のレコードと
比較レコード保持部内のレコードとについて各属性の類
似度定義を参照して各属性の属性値間の類似度を計算し
各属性の重み定義を参照して各属性に関する類似度を各
属性の重みを加味して加重平均しその計算結果を総合類
似度として出力する。
【0015】
【実施例】次に、本発明について図面を参照して詳細に
説明する。なお、本発明のデータベース検索結果評価方
式が適用されるデータベース検索システムでは、属性と
その属性値との組の集合で1つのレコードが構成されて
複数のレコードの集合からなるデータベースに対する検
索が行われる。
【0016】図1は、本発明の第1の実施例(請求項1
記載の発明に対応する実施例)に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【0017】本実施例のデータベース検索結果評価方式
は、データベースから検索された1つのレコードを保持
(格納)する基本レコード保持部1と、データベースか
ら検索された別のレコードを保持する比較レコード保持
部2と、データベースの属性(ここでは、属性i,jお
よびk)毎に定義されており当該各属性における属性値
間の類似度が定義されている類似度定義3(ここでは、
属性i,jおよびkの類似度定義。後述する他の実施例
でも同様)と、データベースの属性毎に定義されており
類似度計算における当該各属性の重要度を示す重みが定
義されている重み定義4(ここでは、属性i,jおよび
kの重み定義。後述する他の実施例でも同様)と、基本
レコード保持部1内のレコードと比較レコード保持部2
内のレコードとの間の総合類似度を計算してその値を出
力する類似度計算部5とを含んで構成されている。ここ
で、基本レコード保持部1と比較レコード保持部2と
は、通常のメモリで構成される。
【0018】図2は、類似度定義3における類似度定義
表現の一例を示す図である(図2および図3の類似度定
義表現は、先に言及した航空券予約システムにおける類
似度定義表現を想定している)。図2に示す類似度定義
表現は、データベースの属性(データベース内のレコー
ドの属性)の1つである「行き先」に関するものであ
り、その類似度が概念階層木の形で定義されている。
【0019】例えば、グアムとサイパンとの間の類似度
は、両者が「日本から近いマリンリゾート」という点で
共通のグループに属しているので、0.7となる。ま
た、パリ,ミラノおよびフランクフルトの間の類似度
は、三者が「中欧部で日本からのフライトの多い都市」
という点で共通のグループに属しているので、0.5と
なる。
【0020】図3は、類似度定義3における類似度定義
表現の他の例を示す図である。図3に示す類似度定義表
現は、データベースの属性の1つである「運賃」に関す
るものであり、判断尺度と類似度との対応情報の形で定
義されている。
【0021】ここでは、「金額の差が2万円以下」の場
合の類似度が0.8であり、「金額の差が2万円超過で
5万円以下」の場合の類似度が0.3であり、「金額の
差が5万円超過」の場合の類似度が0であるという定義
がなされている。
【0022】なお、各属性の重み定義4には、それぞれ
の属性の重要度(レコード間の総合的な類似度を判断す
る上での重要度)に応じて重みの値が与えられている。
ここでは、重みの値の範囲は、0から1の間の値に正規
化されている(請求項5記載の発明参照)。ただし、本
発明を実現する上で、重みの値がそのような範囲の値に
限定されるものではない。
【0023】図4は、類似度計算部5の処理を示す流れ
図である。この処理は、分子用記憶領域および分母用記
憶領域確保・初期化ステップ400と、基本レコード保
持部属性値取出しステップ401と、比較レコード保持
部属性値取出しステップ402と、類似度読取りステッ
プ403と、分子用記憶領域および分母用記憶領域更新
ステップ404と、全属性値取出し終了判定ステップ4
05と、総合類似度出力ステップ406とからなる。
【0024】次に、このように構成された本実施例のデ
ータベース検索結果評価方式の動作について説明する。
【0025】基本レコード保持部1は、データベースか
ら検索された1つのレコードを自己の内部に保持する。
【0026】また、比較レコード保持部2は、データベ
ースから検索された別のレコードを自己の内部に保持す
る。
【0027】類似度計算部5は、以下に示すような処理
を行う(図4参照)。
【0028】総合類似度の値を計算するための分子用記
憶領域と分母用記憶領域とを確保し、両方に値0(初期
値)をセットする(ステップ400)。この分子用記憶
領域は後述する計算式におけるAに対応し、この分母用
記憶領域は同式におけるBに対応する。
【0029】基本レコード保持部1内のレコードの任意
の1つの属性の属性値を取り出す(ステップ401)。
【0030】比較レコード保持部2内のレコードの同一
の属性(ステップ401で属性値を取り出した属性と同
一の属性)の属性値を取り出す(ステップ402)。
【0031】上述のステップ401および402の処理
が全ての属性について繰り返されて、総合類似度の計算
に必要な各属性値が順次に取り出されていく。
【0032】当該属性に対応する類似度定義3を参照し
て、ステップ401で取り出した属性値とステップ40
2で取り出した属性値との間の類似度を読み取る(ステ
ップ403)。
【0033】当該属性に対応する重み定義4の値(重み
の値)をステップ403で読み取った値に積算した値を
ステップ400で確保した分子用記憶領域の値に加えた
値を、分子用記憶領域にセットする。一方、その重み定
義4の値をステップ400で確保した分母用記憶領域の
値に加えた値を、分母用記憶領域にセットする(ステッ
プ404)。このようにして、分子用記憶領域の値およ
び分母用記憶領域の値の更新を行う。
【0034】基本レコード保持部1および比較レコード
保持部2内のレコードについて、全ての属性(図1で
は、属性i,jおよびk)の属性値を取り出したか否か
を調べる(ステップ405)。
【0035】ステップ405で「全ての属性の属性値を
取り出した」と判定した場合には、分子用記憶領域の値
を分母用記憶領域の値で割算(除算)した値を総合類似
度として出力する(ステップ406)。
【0036】ステップ405で「全ての属性の属性値を
取り出してはいない」と判定した場合には、ステップ4
01の処理に戻る。
【0037】このように、類似度計算部5は、基本レコ
ード保持部1内のレコードと比較レコード保持部2内の
レコードとについて、各属性の類似度定義3を参照して
各属性の属性値間の類似度を計算し、各属性の重み定義
4を参照して各属性に関する類似度を各属性の重みを加
味して加重平均し、その計算結果を総合類似度として出
力する。
【0038】ここで、総合類似度の値を計算式で表す
と、以下のようになる。この計算式においては、属性の
数がn(正整数)であるものとする。
【0039】
【数1】
【0040】図5は、本発明の第2の実施例(請求項2
記載の発明に対応する実施例)に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【0041】本実施例のデータベース検索結果評価方式
は、データベースから検索された1つのレコードを保持
(格納)する基本レコード保持部11と、データベース
から検索された別のレコードを保持する比較レコード保
持部12と、データベースの属性(ここでは、属性i,
jおよびk)毎に定義されており当該各属性における属
性値間の類似度が定義されている類似度定義13と、デ
ータベースの属性毎に定義されており類似度計算におけ
る当該各属性の重要度を示す重みが定義されている重み
定義14と、前もって類似度計算に使う属性の名前(こ
こでは、属性iおよびkの名前とする)を保持する対象
属性保持部15と、対象属性保持部15に名前が保持さ
れている属性だけに限定して基本レコード保持部11内
のレコードと比較レコード保持部12内のレコードとの
間の総合類似度の計算および出力を行う属性限定型類似
度計算部16とを含んで構成されている。ここで、基本
レコード保持部11,比較レコード保持部12,類似度
定義13および重み定義14は、図1中の基本レコード
保持部1,比較レコード保持部2,類似度定義3および
重み定義4と同一の構成要素である。また、基本レコー
ド保持部11,比較レコード保持部12および対象属性
保持部15は、通常のメモリで実現される。なお、属性
限定型類似度計算部16は請求項2における「類似度計
算部」に該当する。
【0042】図6は、属性限定型類似度計算部16の処
理を示す流れ図である。この処理は、分子用記憶領域お
よび分母用記憶領域確保・初期化ステップ600と、基
本レコード保持部属性値取出しステップ601と、比較
レコード保持部属性値取出しステップ602と、類似度
読取りステップ603と、分子用記憶領域および分母用
記憶領域更新ステップ604と、対象属性全属性値取出
し終了判定ステップ605と、総合類似度出力ステップ
606とからなる。
【0043】次に、このように構成された本実施例のデ
ータベース検索結果評価方式の動作について説明する。
【0044】基本レコード保持部11および比較レコー
ド保持部12の動作は、第1の実施例における基本レコ
ード保持部1および比較レコード保持部2の動作と同様
である。
【0045】対象属性保持部15は、利用者からの指示
により、データベースの検索において当該利用者が重要
と考える属性の名前、すなわち類似度計算に使う属性の
名前を自己の内部に保持する。
【0046】属性限定型類似度計算部16は、以下に示
すような処理を行う(図6参照)。
【0047】総合類似度の値を計算するための分子用記
憶領域と分母用記憶領域とを確保し、両方に値0(初期
値)をセットする(ステップ600)。この分子用記憶
領域は後述する計算式におけるCに対応し、この分母用
記憶領域は同式におけるDに対応する。
【0048】基本レコード保持部11内のレコードの属
性(対象属性保持部15に名前が格納されている属性の
うちの任意の1つの属性)の属性値を取り出す(ステッ
プ601)。
【0049】比較レコード保持部12内のレコードの同
一の属性(ステップ601で属性値を取り出した属性と
同一の属性)の属性値を取り出す(ステップ602)。
【0050】上述のステップ601および602の処理
が対象属性保持部15に名前が格納(保持)されている
全ての属性について繰り返されて、総合類似度の計算に
必要な各属性値が順次に取り出されていく。
【0051】当該属性に対応する類似度定義13を参照
して、ステップ601で取り出した属性値とステップ6
02で取り出した属性値との間の類似度を読み取る(ス
テップ603)。
【0052】当該属性に対応する重み定義14の値(重
みの値)をステップ603で読み取った値に積算した値
をステップ600で確保した分子用記憶領域の値に加え
た値を、分子用記憶領域にセットする。一方、その重み
定義14の値をステップ600で確保した分母用記憶領
域の値に加えた値を、分母用記憶領域にセットする(ス
テップ604)。このようにして、分子用記憶領域の値
および分母用記憶領域の値の更新を行う。
【0053】基本レコード保持部11および比較レコー
ド保持部12内のレコードについて、対象属性保持部1
5に名前が格納されている全ての属性(図5では、属性
iおよびk)の属性値を取り出したか否かを調べる(ス
テップ605)。
【0054】ステップ605で「対象属性保持部15に
名前が格納されている全ての属性の属性値を取り出し
た」と判定した場合には、分子用記憶領域の値を分母用
記憶領域の値で割算(除算)した値を総合類似度として
出力する(ステップ606)。
【0055】ステップ605で「対象属性保持部15に
名前が格納されている全ての属性の属性値を取り出して
はいない」と判定した場合には、ステップ601の処理
に戻る。
【0056】このように、類似度計算部16は、対象属
性保持部15に名前が保持されている属性だけに限定し
て、基本レコード保持部11内のレコードと比較レコー
ド保持部12内のレコードとについて、各属性の類似度
定義13を参照して各属性の属性値間の類似度を計算
し、各属性の重み定義14を参照して各属性に関する類
似度を各属性の重みを加味して加重平均し、その計算結
果を総合類似度として出力する。
【0057】ここで、総合類似度の値を計算式で表す
と、以下のようになる。この計算式においては、属性の
数がn(正整数)であるものとする。
【0058】
【数2】
【0059】この計算式において、「m番目の属性の選
択フラグ値」とは、基本レコード保持部11および比較
レコード保持部12内のレコードの属性の数と同じ数の
要素数を持つ1次元のマスク行列の各要素の値であり、
対象属性保持部15内に名前が格納されている属性(類
似度計算の対象として選択されている属性)に対応する
マスク行列の要素には1が格納されており、そうでない
属性に対応する要素には0が格納されている。この「選
択フラグ値」の存在によって、対象属性保持部15内に
名前が格納されている属性の属性値だけが選択されて総
合類似度が計算される。なお、図6に示す処理において
は、ステップ601および602で対象属性(対象属性
保持部15内に名前が格納されている属性)の属性値だ
けが取り出されることによって、上述の計算式における
「m番目の属性の選択フラグ値の積算」が実現される。
【0060】図7は、本発明の第3の実施例(請求項3
記載の発明に対応する実施例)に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【0061】本実施例のデータベース検索結果評価方式
は、データベースから検索された1つのレコードを保持
(格納)する基本レコード保持部21と、データベース
から検索された別のレコードを保持する比較レコード保
持部22と、データベースの属性(ここでは、属性i,
jおよびk)毎に定義されており当該各属性における属
性値間の類似度が定義されている類似度定義23と、デ
ータベースの属性毎に定義されており類似度計算におけ
る当該各属性の重要度を示す重みが定義されている重み
定義24と、基本レコード保持部21内のレコードと比
較レコード保持部22内のレコードとの間の総合類似度
を計算してその値を出力する類似度計算部25と、前も
って定義された例外レコード判定用閾値を保持する閾値
保持部26と、類似度計算部25の出力結果が閾値保持
部26に保持されている例外レコード判定用閾値よりも
小さい場合に比較レコード保持部22内のレコードを例
外レコード(例外的なレコード)と判定して提示する例
外レコード判定部27とを含んで構成されている。ここ
で、基本レコード保持部21,比較レコード保持部2
2,類似度定義23,重み定義24および類似度計算部
25は、図1中の基本レコード保持部1,比較レコード
保持部2,類似度定義3,重み定義4および類似度計算
部5と同一の構成要素である。また、基本レコード保持
部21,比較レコード保持部22および閾値保持部26
は、通常のメモリで実現される。
【0062】図8は、例外レコード判定部27の処理を
示す流れ図である。この処理は、例外レコード判定用閾
値取出しステップ801と、類似度計算部出力受取りス
テップ802と、例外レコード判定用閾値・総合類似度
比較ステップ803と、例外レコード情報出力ステップ
804とからなる。
【0063】次に、このように構成された本実施例のデ
ータベース検索結果評価方式の動作について説明する。
【0064】基本レコード保持部21,比較レコード保
持部22および類似度計算部25の動作は、第1の実施
例における基本レコード保持部1,比較レコード保持部
2および類似度計算部5の動作と同様である。なお、基
本レコード保持部21に保持されているレコードは、デ
ータベースの検索結果として妥当なレコードと考えられ
るレコードである。
【0065】例外レコード判定部27は、類似度計算部
25により総合類似度が出力されていることを前提とし
て、以下に示すような処理を行う(図8参照)。
【0066】閾値保持部26に格納されている例外レコ
ード判定用閾値を取り出す(ステップ801)。
【0067】類似度計算部25の出力(総合類似度)を
受け取る(ステップ802)。
【0068】ステップ801で取り出した値とステップ
802で受け取った値とを比較し、後者(類似度計算部
25の出力結果である総合類似度)の方が小さいか否か
を判定する(ステップ803)。
【0069】ステップ803で「類似度計算部25の出
力結果の方が小さい」と判定した場合には、比較レコー
ド保持部22内のレコードが「例外レコード」であるこ
と(基本レコード保持部21内の妥当なレコードに比べ
て比較レコード保持部22内のレコードが例外的である
こと)を示す情報を出力する(ステップ804)。
【0070】ステップ803で「類似度計算部25の出
力結果の方が小さくない」と判定した場合には、ステッ
プ804の出力を行わずに処理を終了する。これによっ
て、比較レコード保持部22内のレコードが例外レコー
ドでないことを提示する。
【0071】図9は、本発明の第4の実施例(請求項4
記載の発明に対応する実施例)に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【0072】本実施例のデータベース検索結果評価方式
は、データベースから検索された1つのレコード(比較
制御部39によって渡される検索レコード保持部38内
のレコード)を保持する基本レコード保持部31と、デ
ータベースから検索された別のレコード(比較制御部3
9によって渡される検索レコード保持部38内のレコー
ド)を保持する比較レコード保持部32と、データベー
スの属性(ここでは、属性i,jおよびk)毎に定義さ
れており当該各属性における属性値間の類似度が定義さ
れている類似度定義33と、データベースの属性毎に定
義されており類似度計算における当該各属性の重要度を
示す重みが定義されている重み定義34と、基本レコー
ド保持部31内のレコードと比較レコード保持部32内
のレコードとの間の総合類似度を計算してその値を出力
する類似度計算部35と、前もって定義された例外レコ
ード判定用閾値を保持する閾値保持部36と、類似度計
算部35の出力結果が閾値保持部36に保持されている
例外レコード判定用閾値よりも小さい場合に比較レコー
ド保持部32内のレコードを例外レコードと判定して提
示する例外レコード判定部37と、データベースから検
索された1以上のレコードを保持する検索レコード保持
部38と、検索レコード保持部38内のレコード群の中
のレコードを基本レコード保持部31および比較レコー
ド保持部32に渡す比較制御部39とを含んで構成され
ている。ここで、基本レコード保持部31,比較レコー
ド保持部32,類似度定義33,重み定義34,類似度
計算部35,閾値保持部36および例外レコード判定部
37は、図7中の基本レコード保持部21,比較レコー
ド保持部22,類似度定義23,重み定義24,類似度
計算部25,閾値保持部26および例外レコード判定部
27と同一の構成要素である。また、基本レコード保持
部31,比較レコード保持部32,閾値保持部36およ
び検索レコード保持部38は、通常のメモリで実現され
る。
【0073】図10は、比較制御部39の処理を示す流
れ図である。この処理は、基本レコード保持部レコード
引渡しステップ1000と、比較レコード保持部レコー
ド引渡しステップ1001と、例外レコード判定待機ス
テップ1002と、全検索レコード取出し終了判定ステ
ップ1003とからなる。
【0074】次に、このように構成された本実施例のデ
ータベース検索結果評価方式の動作について説明する。
【0075】本実施例のデータベース検索結果評価方式
は、第3の実施例と比べて、検索レコード保持部38の
存在を前提とする比較制御部39の処理が加わっている
点で異なる。
【0076】比較制御部39は、以下に示すような処理
を行う(図10参照)。
【0077】検索レコード保持部38に保持されている
レコード群の中から、利用者により指定された基準によ
って選択される1つのレコード(例外レコードの判定の
ための基準となるレコードとして適切なレコード)を取
り出し、そのレコードを基本レコード保持部31に渡す
(ステップ1000)。基本レコード保持部31は、以
降、そのレコードを保持する。
【0078】検索レコード保持部38に保持されている
レコード群(ステップ1001で基本レコード保持部3
1に渡されたレコードは除外してもよい)のうちの任意
の1つのレコードを順次に取り出し、そのレコードを比
較レコード保持部32に渡す(ステップ1001)。比
較レコード保持部32は、比較制御部39によって次の
レコードが渡されるまで、そのレコードを保持する。
【0079】類似度計算部35によって基本レコード保
持部31内のレコードと比較レコード保持部32内のレ
コードとの間の総合類似度が出力され、その総合類似度
に基づき例外レコード判定部37によって比較レコード
保持部32内のレコードが例外レコードであるかどうか
が判定されるのを待つ(ステップ1002)。
【0080】例外レコード判定部37による判定の出力
が行われると、検索レコード保持部38から全てのレコ
ードを取り出したか否かを調べる(ステップ100
3)。
【0081】ステップ1003で「検索レコード保持部
38から全てのレコードを取り出してはいない」と判定
した場合には、ステップ1001の処理に戻る。すなわ
ち、検索レコード保持部38から新たなレコードを1つ
取り出して比較レコード保持部32に渡す。これによっ
て、検索レコード保持部38内の未処理のレコードがな
くなるまで図10に示す処理が繰り返される。
【0082】ステップ1003で「検索レコード保持部
38から全てのレコードを取り出した」と判定した場合
には、処理を終了する。
【0083】以上のような比較制御部39の処理によっ
て、例外レコード判定部37は複数の検索レコード(検
索レコード保持部38内のレコード群)に関する例外レ
コードかどうかの判定(利用者によって指定された基準
で選択された1つの検索レコードに対する各検索レコー
ドの例外性の判定)が可能となる。
【0084】
【発明の効果】以上説明したように本発明は、データベ
ース検索システムにおいて、あらかじめ各属性の類似度
および重みを定義して類似度計算を行うことにより、例
外的な検索結果を自動的に提示することができ(そのよ
うな提示の前提として2つの検索結果の間の類似度を検
出することを可能にし)、検索されたレコードの中から
「例外的なレコード」を自動的に検出してそれを利用者
に提示することができるという効果を有する。
【0085】このような効果によって、データベース検
索システムの利用者が見落としがちでありながら重要な
レコードの存在を的確に提示でき、いわゆる「気がつ
く」・「気のきいた」データベース検索システムを構築
することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【図2】図1中の類似度定義における類似度定義表現の
一例を示す図である。
【図3】図1中の類似度定義における類似度定義表現の
他の例を示す図である。
【図4】図1中の類似度計算部の処理を示す流れ図であ
る。
【図5】本発明の第2の実施例に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【図6】図5中の属性限定型類似度計算部の処理を示す
流れ図である。
【図7】本発明の第3の実施例に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【図8】図7中の例外レコード判定部の処理を示す流れ
図である。
【図9】本発明の第4の実施例に係るデータベース検索
結果評価方式の構成を示すブロック図である。
【図10】図9中の比較制御部の処理を示す流れ図であ
る。
【符号の説明】
1,11,21,31 基本レコード保持部 2,12,22,32 比較レコード保持部 3,13,23,33 類似度定義 4,14,24,34 重み定義 5,25,35 類似度計算部 15 対象属性保持部 16 属性限定型類似度計算部 26,36 閾値保持部 27,37 例外レコード判定部 38 検索レコード保持部 39 比較制御部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 属性とその属性値との組の集合で1つの
    レコードが構成され、複数のレコードの集合からなるデ
    ータベースに関するデータベース検索結果評価方式にお
    いて、 データベースから検索された1つのレコードを保持する
    基本レコード保持部と、 データベースから検索された別のレコードを保持する比
    較レコード保持部と、 データベースの属性毎に定義されており当該各属性にお
    ける属性値間の類似度が定義されている類似度定義と、 データベースの属性毎に定義されており類似度計算にお
    ける当該各属性の重要度を示す重みが定義されている重
    み定義と、 前記基本レコード保持部内のレコードと前記比較レコー
    ド保持部内のレコードとについて、各属性の前記類似度
    定義を参照して各属性の属性値間の類似度を計算し、各
    属性の前記重み定義を参照して各属性に関する類似度を
    各属性の重みを加味して加重平均し、その計算結果を総
    合類似度として出力する類似度計算部とを有することを
    特徴とするデータベース検索結果評価方式。
  2. 【請求項2】 前もって類似度計算に使う属性の名前を
    保持する対象属性保持部と、 類似度計算で、全ての属性を対象にするのではなく、前
    記対象属性保持部に名前が保持されている属性だけを対
    象とする類似度計算部とを有することを特徴とする請求
    項1記載のデータベース検索結果評価方式。
  3. 【請求項3】 前もって定義された例外レコード判定用
    閾値を保持する閾値保持部と、 類似度計算部の出力結果が前記閾値保持部に保持されて
    いる例外レコード判定用閾値よりも小さい場合に比較レ
    コード保持部内のレコードを例外レコードと判定して提
    示する例外レコード判定部とを有することを特徴とする
    請求項1または請求項2記載のデータベース検索結果評
    価方式。
  4. 【請求項4】 データベースから検索された1以上のレ
    コードを保持する検索レコード保持部と、 この検索レコード保持部に保持されているレコード群の
    中から利用者により指定された基準によって選択された
    1つのレコードを取り出してそのレコードを基本レコー
    ド保持部に渡し、前記検索レコード保持部に保持されて
    いるレコード群を1つずつ比較レコード保持部に渡す比
    較制御部とを有することを特徴とする請求項3記載のデ
    ータベース検索結果評価方式。
  5. 【請求項5】 重み定義における重みの値が0から1の
    間の値に正規化されていることを特徴とする請求項1,
    請求項2,請求項3または請求項4記載のデータベース
    検索結果評価方式。
JP6336641A 1994-12-26 1994-12-26 データベース検索結果評価方式 Expired - Fee Related JP2697651B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6336641A JP2697651B2 (ja) 1994-12-26 1994-12-26 データベース検索結果評価方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6336641A JP2697651B2 (ja) 1994-12-26 1994-12-26 データベース検索結果評価方式

Publications (2)

Publication Number Publication Date
JPH08180071A true JPH08180071A (ja) 1996-07-12
JP2697651B2 JP2697651B2 (ja) 1998-01-14

Family

ID=18301273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6336641A Expired - Fee Related JP2697651B2 (ja) 1994-12-26 1994-12-26 データベース検索結果評価方式

Country Status (1)

Country Link
JP (1) JP2697651B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001357068A (ja) * 2000-04-28 2001-12-26 Internatl Business Mach Corp <Ibm> 類似する関心を有する人物の間のネットワーキングを容易にし、情報に関する共同作業検索を容易にする、インターネット・ベースの方法
JP2002539565A (ja) * 1999-03-17 2002-11-19 センダント パブリッシング インコーポレーテッド 航空旅程予約のためのコンピュータ実行装置及び方法
JP2004515837A (ja) * 2000-07-17 2004-05-27 シーメンス アクチエンゲゼルシヤフト サーチプロファイルの比較方法
JP2006518900A (ja) * 2003-01-22 2006-08-17 アマゾン コム インコーポレイテッド 商品権限(itemauthority)を管理する方法およびシステム
KR100753272B1 (ko) * 1999-08-31 2007-08-29 주식회사 팬택앤큐리텔 배경 및 물체영역 모양정보 특징을 이용한 멀티미디어 검색장치 및 그 방법
JP2010152692A (ja) * 2008-12-25 2010-07-08 Nec Corp 類似度計算装置、類似度計算方法およびプログラム
JP2010231270A (ja) * 2009-03-25 2010-10-14 Toshiba Corp データ表示装置、データ表示方法、データ表示プログラム
CN104331479A (zh) * 2014-11-07 2015-02-04 浪潮通用软件有限公司 一种基于相似度计算方法的数据排列方法
JP2015232802A (ja) * 2014-06-10 2015-12-24 日本電信電話株式会社 目的地抽出方法、目的地抽出装置及び目的地抽出プログラム
JP2017501477A (ja) * 2013-11-04 2017-01-12 オラクル・インターナショナル・コーポレイション アイテム間類似度の生成

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002539565A (ja) * 1999-03-17 2002-11-19 センダント パブリッシング インコーポレーテッド 航空旅程予約のためのコンピュータ実行装置及び方法
KR100753272B1 (ko) * 1999-08-31 2007-08-29 주식회사 팬택앤큐리텔 배경 및 물체영역 모양정보 특징을 이용한 멀티미디어 검색장치 및 그 방법
JP2001357068A (ja) * 2000-04-28 2001-12-26 Internatl Business Mach Corp <Ibm> 類似する関心を有する人物の間のネットワーキングを容易にし、情報に関する共同作業検索を容易にする、インターネット・ベースの方法
JP2004515837A (ja) * 2000-07-17 2004-05-27 シーメンス アクチエンゲゼルシヤフト サーチプロファイルの比較方法
JP4868484B2 (ja) * 2000-07-17 2012-02-01 シーメンス アクチエンゲゼルシヤフト サーチプロファイルの比較方法
JP2006518900A (ja) * 2003-01-22 2006-08-17 アマゾン コム インコーポレイテッド 商品権限(itemauthority)を管理する方法およびシステム
JP2010152692A (ja) * 2008-12-25 2010-07-08 Nec Corp 類似度計算装置、類似度計算方法およびプログラム
JP2010231270A (ja) * 2009-03-25 2010-10-14 Toshiba Corp データ表示装置、データ表示方法、データ表示プログラム
JP2017501477A (ja) * 2013-11-04 2017-01-12 オラクル・インターナショナル・コーポレイション アイテム間類似度の生成
JP2015232802A (ja) * 2014-06-10 2015-12-24 日本電信電話株式会社 目的地抽出方法、目的地抽出装置及び目的地抽出プログラム
CN104331479A (zh) * 2014-11-07 2015-02-04 浪潮通用软件有限公司 一种基于相似度计算方法的数据排列方法

Also Published As

Publication number Publication date
JP2697651B2 (ja) 1998-01-14

Similar Documents

Publication Publication Date Title
US7870108B2 (en) Method and apparatus for version management of a data entity
JP4597122B2 (ja) 商品権限(itemauthority)を管理する方法およびシステム
US5357431A (en) Character string retrieval system using index and unit for making the index
US6370526B1 (en) Self-adaptive method and system for providing a user-preferred ranking order of object sets
CN109446253B (zh) 数据查询控制方法、装置、计算机设备及存储介质
JPH07160806A (ja) 文書用紙認識システム
US20140188905A1 (en) Method and system for manually maintaining item authority
JP2697651B2 (ja) データベース検索結果評価方式
US6166733A (en) Index indicator, index display method and recording medium storing index indicator program
AU2010333238B2 (en) Multi-destination trip selection
EP0889424A2 (en) Method and apparatus for estimating the number of distinct values in a database
JPH06119309A (ja) 購入見込み度合予測方法及び顧客管理システム
JP2000099540A (ja) 多次元データベース管理方法
JP3131142B2 (ja) 地図データリンケージシステム
JP3602084B2 (ja) データベース管理装置
JP2004126848A (ja) 類似事例検索方法
JP2000205870A (ja) 走行履歴記憶装置
JP5384060B2 (ja) 内部者照合装置及び内部者照合方法ならびにそのプログラム
CN116071636B (zh) 商品图像检索方法
JP4622352B2 (ja) 商品ライフサイクル予測方法、商品ライフサイクル予測装置および商品ライフサイクル予測プログラム
JPH06103307A (ja) 構造型データベースにおける検索高速化方法
JPH0675999A (ja) データベース類似検索解表示装置
JPH07105238A (ja) データ・ベース検索装置および方法
JPH10289280A (ja) 伝票入力システムおよび伝票入力プログラムを記録した記録媒体
JPH09167111A (ja) データベースのデータ格納方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080919

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080919

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090919

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090919

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100919

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees