JP2993539B2 - データベース検索システムおよびその方法 - Google Patents

データベース検索システムおよびその方法

Info

Publication number
JP2993539B2
JP2993539B2 JP3356348A JP35634891A JP2993539B2 JP 2993539 B2 JP2993539 B2 JP 2993539B2 JP 3356348 A JP3356348 A JP 3356348A JP 35634891 A JP35634891 A JP 35634891A JP 2993539 B2 JP2993539 B2 JP 2993539B2
Authority
JP
Japan
Prior art keywords
data
property
search
quantization
database search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3356348A
Other languages
English (en)
Other versions
JPH05174067A (ja
Inventor
寛 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP3356348A priority Critical patent/JP2993539B2/ja
Priority to DE69229521T priority patent/DE69229521T2/de
Priority to EP92106939A priority patent/EP0510634B1/en
Priority to US07/873,130 priority patent/US5450580A/en
Publication of JPH05174067A publication Critical patent/JPH05174067A/ja
Priority to US08/471,459 priority patent/US5546578A/en
Application granted granted Critical
Publication of JP2993539B2 publication Critical patent/JP2993539B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データベースから必要
な情報を取り出すためのデータベース検索システムおよ
びその方法に関する。
【0002】
【従来の技術】現状のデータベース検索における検索空
間圧縮の手法としては、キーワード付加方式によるもの
が一般的である。また対象物件数が比較的少数のケース
では、全物件検索方式が実用化されている。例えば効率
的な全物件検索手法として、ボイヤ―モア法が考案され
ている。さらに、検索対象からキーワードを自動抽出
し、索引を生成するインデックス方式もある。
【0003】
【発明が解決しようとする課題】上記のキーワード検索
方式は、以下のような欠点を有する。 (1)、物件一つ一つにキーワードを付加しなくてはな
らない。 (2)、任意のキーワードを付加して行くと、その個数
は膨大になるため、例えばシソーラスによる管理などを
必要とし、その維持に多大なコストがかかる。 (3)、付加されるキーワードが必ずしも適切なものと
は限らないため、検索もれが発生する。すなわち現状の
データベース検索方式では、特に物件数が膨大になった
時に必要なコストに比してパーフォーマンスが伸びない
傾向が現れる。
【0004】一方、全物件検索方式では、上記のような
問題は発生しない。しかし直接検索方式では、物件数が
膨大になったとき、検索時間は対話的な時間の域を大幅
に超過し、実用にならないのが現状である。また全物件
検索方式では、完全一致が条件であり、あいまい一致検
索ができない欠点も有る。また上述のボイヤ―モア法に
よる全物件検索では、文書以外のデータ、例えば物理的
な時系列データを扱うことができない問題がある。
【0005】さらに、インデックス方式では、扱う情報
単位が単語であるため、英語文書のように単語が分割さ
れているものには適しているが、何らかの文法解析を要
する。また、日本語文書などのように単語が分割されて
書かれていないものには不向きである。さらに、単語の
表記上のバリエーションに対しては、考えられるすべて
の組を辞書化せざるを得ないため、システムの負荷が大
きい。
【0006】本発明は、上記のような問題に鑑み、全物
件検索でありながら検索時間を飛躍的に短縮することが
でき、またあいまい一致検索ができるデータベース検索
方式を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明のデータベース検
索システムは、検索キーに応じて検索対象の複数の物件
から情報を検索するためのデータベース検索システムに
おいて、上記検索対象のi番目の物件のj番目のデータ
i,j と、i番目の物件内のデータC i,j の近傍データ
i,k とに基づいて複数の量子化量を算出する量子化量
算出手段と、近傍特徴量として上記複数の量子化量の組
合わせを記憶する記憶手段とを有することを特徴とす
る。 また、本発明の他の態様では、上記量子化量算出手
段で上記検索キーについて複数の量子化量を算出し、上
記検索対象の近傍特徴量との合致度を求める検索手段を
有する。 また、上記物件毎の合致度を上記検索キーの近
傍特徴量の完全一致度数で割った値を、物件毎の検索キ
ーの含有確率として算出する含有率算出手段を更に有す
るようにしても良い。 また、物件番号を合致度の降順に
出力するようにしても良いし、含有確率リストを確率の
降順に出力するようにしても良い。 また、本発明のデー
タベース検索方法は、検索キーに応じて検索対象の複数
の物件から情報を検索するためのデータベース検索方法
であって、上記検索対象のi番目の物件のj番目のデー
タC i,j と、i番目の物件内のデータC i,j の近傍デー
タC i,k とに基づいて複数の量子化量を算出し、近傍特
徴量として上記複数 の量子化量の組合わせを記憶し、上
記検索キーについて上記物件の量子化量を算出するのと
同じ処理を施して上記検索キーの複数の量子化量を算出
し、上記検索キーの複数の量子化量と上記近傍特徴量と
の合致度を求めることを特徴とする。
【0008】
【作用】全物件直接検索を行なう際に検索時間を増大さ
せる要因であるデータの位相情報(検索キーが物件中の
どこに存在するかと言う場所情報)を近傍特徴量の抽出
により捨象してある。検索時間は検索キー情報の長さの
みに依存する。従って、検索時間がデータ量に依存しな
い高速な検索が可能となる。また物件毎の検索キーの合
致度(含有確率)として検索結果が求まるので、文法な
どに依存しない汎用な検索システムが実現可能である。
また、合致度の降順参照により、あいまい検索が可能と
なる。検索対象としては、文書データ、物理計測デー
タ、信号波形データ、画像データ、音響データなどを扱
うことができる。
【0009】
【実施例】図1は、本発明の一実施例を示す近傍特徴量
によるパターン検索システムのデータフロー図である。
この検索システムでは、予め全対象物件から事象(情
報)の位相情報を全て捨象した自己相関データを作成
し、そのデータ群に対して全物件検索を行なう。検索の
アルゴリズムは、学習ステップと検索ステップとからな
る。学習ステップでは、物件毎に近傍特徴量行列が位相
情報として作成される。図1では、検索対象10から自
己相関行列(近傍特徴量行列)30を作成し、それを構
造ファイル40に保存するまでのステップに該当する。
また、検索ステップでは、検索キーに対して学習ステッ
プと同様の処理を行って検索キーの近傍特徴量が求めら
れ、物件の近傍特徴量とのマッチング演算が行なわれ、
物件ごとにマッチング度(類似度)を示す評価結果を得
る。図1では、検索キー50をもとに検索S4にて構造
ファイル40の物件データとのマッチング演算を行い、
評価結果リスト70あるいはソート済みリスト80のよ
うに結果を出力するまでのステップに該当する。以下、
各ステップについて説明する。
【0010】(1)、学習ステップ 図1に於いて、検索対象10は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは量子化された波形数値データ、化学構
造式、遺伝子情報などである。このような検索対象に対
して、まず正規化手段S1により正規化の処理を行な
う。一般に検索対象は、情報の最小単位(文書であれば
アルファベットなどの文字、数値チャートであれば、あ
る時刻における実数値など)の列で表現されている。そ
れをなんらかの方法でn階調の整数列に変換する。これ
をデータの正規化と呼ぶ。
【0011】例えば、英文書データの場合、ASCII
コード表をそのまま用いることにより、次のような25
6階調の数値表現として実現される。 …… This is a pen. …… 84|104 |105 |115 |32|105 |115 |32|97|32|112 |101 |110 |46|
【0012】上記のコードにおいては、Tが84、hが10
4 ..と対応している。
【0013】次に、正規化されたデータ20から、学習
手段S2により近傍特徴量が算出され、以下に説明する
手順で近傍特徴量行列30の形式に畳込まれる。ここで
近傍特徴量をとる演算式は種々考えられる。この演算式
は検索の鋭さ(過検出の少なさ)にも影響を与える。
【0014】学習手段S2の一例として、正規化された
データ20から量子化量を求め、この量子化量を用いて
近傍特徴量行列30を得る手順を説明する。例えば図3
に示すように、検索される対象物件(文書)が複数ある
とし、そのうちのi番目の物件の量子化について考え
る。ここで、i番目の物件(文書)のj番目のデータ
(文字)をCi,j とし、 i,j のk近傍に関するデータ
をC i,j+1 ,C i,j+2 .... i,j+k とする。i番目の
物件において、図2に示すように正規化された数値列13
5,64,37,71,101,...が並んでいるとすると、Ci,j に関
する量子化量xおよびC i,j の前方k近傍に関する量子
化量yは、 x=f(Ci,j ) y=g(Ci,j , Ci,j+1,i,j+2,...., i,j+k ) …式(1) で求められる。
【0015】ここで、f(Ci,j )はCi,j に関するn段
階量子化関数である。すなわち、i番目の物件のj番目
のデータCi,j について所定の演算を行って得られる値
であり、1〜nのいずれかの整数で表される。したがっ
て、このn段階量子化関数fの演算により得られた量子
化量xの値によって、図3に示す行列(座標)において
x軸方向の位置が1〜nの範囲で定まる。
【0016】また、g(Ci,j , Ci,j+1,i,j+2,....,
i,j+k ) は、Ci,j の前方k近傍に関するm段階量子
化関数である。すなわち、i番目の物件のj番目のデー
タCi,j 、そのデータC i,j の近傍の所定数のデータ
i,j+1, i,j+2,...., i,j+k について所定の演算
を行って得られる値であり、1〜mのいずれかの整数で
表される。たとえば図2に示すようにj番目のデータC
i,j が135であり、kが3の場合には、Ci,j+1,
i,j+2,i,j+3 としてデータ135に続くデータ64、
37、71を抽出し、これらのデータとデータ135と
の相関について所定の演算を行う。j番目のデータC
i,j が次の64の場合には、Ci,j+1,i,j+2,i,j+3
としてデータ64に続くデータ37、71、101を抽
出し、これらのデータとデータ64との相関について所
定の演算を行う。このようにしてm段階量子化関数g の
演算により得られた量子化量yの値によって、図3に示
す行列(座標)におけるy軸方向の位置が1〜mの範囲
で定まる。
【0017】したがって、上記のように正規化されたデ
ータ20から量子化量x、yを求めることによって、図
3に示す行列(座標)における位置が定まる。なお、量
子化量を求める演算式f() 、g() としては種々あるが、
例えば、 f: x→x g: (x,y)→x-y (または|x-y|) …式(2) のように、演算式f() は入力された値をそのまま量子化
量とし、演算式g() は入 力された2つの値の差、あるい
は差の絶対値を量子化量とする例が考えられる。この場
合、正規化されたデータ20が先の例 84|104 |105
|115 .... では、データC i,j を84とすると、C
i,j と、C i,j の前方k近傍に関する量子化量x,yの
座標位置は、(84,20) 、(84,21) 、(84,31) 、 .... とな
る。 また、この式(2)以外にも、幾つかの文字列の個
々の文字整数値に対し四則演算を施すことにより近傍特
徴量を取り出してもよい。図2中に示した量子化量x,
yの座標位置(51,71) 、(32,103 ) 、 .... は、上記式
(2)とは異なる手法によって求めたものである。
【0018】本システムでは、各物件情報は、上記のよ
うにして求めたx、yに対して物件の通番iと重みw
(x,y,i)の組として記憶される。重みw(x,y,i)は、デ
ータx、y、iから所定の演算によって求められるが通
常は重みw(x,y,i)の値として1に固定してもよい。
【0019】上記のようにして各物件についてデータC
i,j ごとに求められた量子化量x、yの値に基づき、
3に棒によって示されるように、データを記憶する。す
なわち、データCi,j 量子化量x、yの値によって定
められる座標の位置に、その物件の通番iとその重みw
(x,y,i)を組みとしたデータを記憶する。同図ではこの
ようなデータが記憶されるごとに棒の長さが延びるよう
に表されている。もし重みw(x,y,i)を1とした場合に
は、物件の通番iのデータのみがx、yの値によって定
められる座標の位置に記憶されてゆく。
【0020】この様にして作成された近傍特徴量行列に
物件の識別番号を付加して構造ファイル40として保存
する。
【0021】(2)、検索ステップ まず検索キー50を入力する。例えば、"This is a pe
n."を検索キーとする。この検索キー50に対して学習
ステップでの正規化手段S1と同一の正規化方法に基づ
く正規化手段S3によりキー情報を以下の整数列に正規
化する。 84|104 |105 |115 |32|105 |115 |32|97|32|112 |101 |110 |46|
【0022】次に、検索手段S4において、学習ステッ
での学習手段S2と同一の自己相関計算式f() 、g()
を用いて、正規化された検索キー50の数値列の先頭か
量子化量x、yの組の系列を作成する。次に、この
索キー50の量子化量x、yの組の系列に基づいて、
造ファイル40内から取り出した物件iに対する検索キ
ー50の含有度数ω i として、V(x j, j, i)をj=
1〜mについて合計することにより算出する。
【0023】ただし、V(x j, j, i)は、構造ファイ
ル40に記憶された物件iの重みに等しく、重みを持た
ない場合には0と定める。
【0024】したがって、検索すべきキー50の数値列
から求めた量子化量x、yの組に対応する図3の量子化
x、yの位置にデータがある場合(棒がある場合)に
は、別に設けられた記憶手段のそのデータに示される物
件の通番iの格納箇所に、その重みの値を構造評価値sc
ore (合致度)として記憶させる。
【0025】次に、評価結果出力手段S5において、
造ファイル40内の各物件毎に得られた構造評価値scor
e (合致度)を完全一致の場合の評価値で割って、検索
キー50の含有確率を求め、評価結果のリスト70を得
る。更にソート手段S6において、このリスト70を含
有確率の降順にソートし、ソート済みリスト80を得
る。
【0026】このソート済みリスト80が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。
【0027】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。
【0028】また、1つの物件に対する検索キーの評価
時間は、キーの文字数のみに依存し、各物件の大きさに
は依存しない。従って、非常に高速に検索を行なうこと
ができる。
【0029】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するAND、ORなどの
検索演算処理も高速に実行できる。
【0030】近傍特徴量は、各物件の全データを対象と
し取り出さなくてもよい。例えば、物件データ中の特定
の一つまたは一つ以上の整数値、特定の範囲の整数値、
或いはデータ列を構成する各バイト中の特定の1つまた
は一つ以上のビットを除外して近傍特徴量を生成しても
よい。また日本語文書のように2バイト文字で構成され
ている場合には、例えば上位バイトを除外して下位バイ
トを対象として近傍特徴量を取り出してもよい。
【0031】上述の例では、自己相関によって生成され
る行列は、256次のビット行列であり、これは8Kバ
イトに相当する。従って、1物件のデータが1Kバイト
程度であるデータベースでは、効率のよいシステムであ
るとは言えない。そこでデータ圧縮手段S7を設けてデ
ータ圧縮を行なって構造ファイル40の容量を減らすの
がよい。
【0032】図4にデータ圧縮法の一例を示す。この例
では、256次の近傍特徴量行列の各物件毎に重みwが
0でない物件名40a(識別コード)を1バイト/件の
データ列として蓄積する。従って、重みwが0である物
件名は不要データとして除外する。
【0033】物件数が255個以上ある場合には、物件
名40aは1バイトで表せないので、下位の1バイトの
みを蓄積する。例えば、物件数が1万件の場合、物件名
は2バイトで表されるが、そのうちの下位1バイトを使
用する。そして物件名コードが255を越える毎にデー
タ列にマーカ40bを挿入する。
【0034】検索時には、検索キーの近傍特徴量の各々
に該当する構造ファイルのデータ列を取り出し、物件名
毎の出現度数テーブルを作成する。この際、マーカ40
bを越える毎に物件名コードに255を加える。このよ
うにして作成した出現度数テーブルに基づいて図1の評
価結果リスト70が得られる。
【0035】なお物件名コードのデータ列が例えば全物
件中の半分以上ある場合には、その近傍特徴量行列要素
は各物件について共通であると見なして、その要素を削
除してもよい。
【0036】上述の実施例において,正規化手段S1、
学習手段S2、正規化手段S3、検索手段S4、評価結
果出力手段S5、ソート手段S6、データ圧縮手段S7
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。
【0037】
【発明の効果】本発明のデータベース検索システムおよ
びその方法は、検索対象のi番目の物件のj番目のデー
タC i,j と、i番目の物件内のデータC i,j の近傍デー
タC i,k とに基づいて複数の量子化量を算出し、その複
数の量子化量の組合わせを近傍特徴量として記憶し、検
索キーについて同様の処理を施して算出した複数の量子
化量と検索対象の近傍特徴量との合致度を求める構成で
ある。また、物件毎の合致度から物件毎の検索キーの含
有確率を求めても良い。さらに、物件番号を合致度の降
順に出力するようにしても良いし、含有確率リストを確
率の降順に出力するようにしても良い。
【0038】従って、本発明によると、全物件直接検索
を行なう際に検索時間を増大させる要因であるデータの
位相情報(検索キーが物件中のどこに存在するかと言う
場所情報)を近傍特徴量の抽出により捨象してあるか
ら、検索時間は検索キー情報の長さのみに依存する。従
って、検索時間がデータ量に依存しない高速な検索が可
能となる。また物件毎の検索キーの合致度(含有確率)
として検索結果が求まるので、文法などに依存しない汎
用な検索システムが実現可能である。また、合致度の降
順参照により不完全一致検索を行えるため、あいまい検
索が可能となり、検索キー上のノイズにも強い。
【図面の簡単な説明】
【図1】本発明の一実施例のデータベース検索システム
のデータフロー図である。
【図2】近傍情報の量子化を示す図である。
【図3】記憶される情報構造を示す図である。
【図4】圧縮された近傍特徴量のデータ構成図である。
【符号の説明】
10 検索対象 20 正規化データ 30 近傍特徴量行列 40 構造ファイル 50 検索キー 60 正規化キー 70 評価結果リスト 80 ソート済みリスト S1 正規化手段 S2 学習手段 S3 正規化手段 S4 検索手段 S5 評価結果出力手段 S6 ソート手段 S7 データ圧縮手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−241173(JP,A) 特開 昭60−65335(JP,A) 特開 昭48−39125(JP,A) 特開 平1−102685(JP,A) 特開 平2−16676(JP,A) 特開 昭63−143668(JP,A) 特開 昭61−25272(JP,A) 特開 昭63−27988(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/30

Claims (21)

    (57)【特許請求の範囲】
  1. 【請求項1】 検索キーに応じて検索対象の複数の物件
    から情報を検索するためのデータベース検索システムに
    おいて、 上記検索対象のi番目の物件のj番目のデータC
    i,j と、i番目の物件内のデータC i,j の近傍データC
    i,k とに基づいて複数の量子化量を算出する量子化量算
    出手段と、 近傍特徴量として上記複数の量子化量の組合わせを記憶
    する記憶手段とを有することを特徴とするデータベース
    検索システム。
  2. 【請求項2】 検索キーに応じて検索対象の複数の物件
    から情報を検索するためのデータベース検索システムに
    おいて、 上記検索対象のi番目の物件のj番目のデータC
    i,j と、i番目の物件内のデータC i,j の近傍データC
    i,k とに基づいて複数の量子化量を算出する量子化量算
    出手段と、 近傍特徴量として上記複数の量子化量をそれぞれ近傍特
    徴量行列座標の各軸の要素値とする座標位置に上記物件
    の物件番号を記憶する記憶手段とを有することを特徴と
    するデータベース検索システム。
  3. 【請求項3】 上記量子化量算出手段で上記検索キーに
    ついて複数の量子化量を算出し、上記検索対象の近傍特
    徴量との合致度を求める検索手段を有することを特徴と
    する請求項1または2のデータベース検索システム。
  4. 【請求項4】 上記近傍データC i,k が複数あることを
    特徴とする請求項1〜3の何れか1項のデータベース検
    索システム。
  5. 【請求項5】 上記近傍データC i,k は、k個のデータ
    列C i,j+1, i,j+2,...., i,j+k であることを特徴と
    する請求項1〜4の何れか1項のデータベース検索シス
    テム。
  6. 【請求項6】 物件毎の上記近傍特徴量と共に重みwを
    記憶することを特徴とする請求項1または2のデータベ
    ース検索システム。
  7. 【請求項7】 上記重みwが1であることを特徴とする
    請求項6のデータベース検索システム。
  8. 【請求項8】 上記物件毎の合致度を上記検索キーの近
    傍特徴量の完全一致 度数で割った値を、物件毎の検索キ
    ーの含有確率として算出する含有率算出手段を更に有す
    ることを特徴とする請求項3のデータベース検索システ
    ム。
  9. 【請求項9】 上記検索対象の近傍特徴量を圧縮するデ
    ータ圧縮手段を具備することを特徴とする請求項1のデ
    ータベース検索システム。
  10. 【請求項10】 上記データ圧縮手段は、各物件毎に重
    みwが0でないものだけをデータ列として蓄積すること
    を特徴とする請求項9のデータベース検索システム。
  11. 【請求項11】 上記近傍特徴量は、各物件中のデータ
    の特定の一部のみを用いて生成された値であることを特
    徴とする請求項1〜10の何れか1項のデータベース検
    索システム。
  12. 【請求項12】 上記近傍特徴量は、2バイト以上で構
    成されたデータの内、少なくとも1バイトを用いて生成
    された値であることを特徴とする請求項11のデータベ
    ース検索システム。
  13. 【請求項13】 上記近傍特徴量は、2バイトで構成さ
    れたデータの内、下位1バイトを用いて生成された値で
    あることを特徴とする請求項11のデータベース検索シ
    ステム。
  14. 【請求項14】 上記検索手段は、物件番号を合致度の
    降順に出力することを特徴とする請求項3のデータベー
    ス検索システム。
  15. 【請求項15】 上記検索手段は、物件番号とともに更
    に合致度を出力することを特徴とする請求項3または1
    4のデータベース検索システム。
  16. 【請求項16】 上記検索手段は、含有確率リストを確
    率の降順に出力することを特徴とする請求項8のデータ
    ベース検索システム。
  17. 【請求項17】 上記検索手段は、更に含有確率を出力
    することを特徴とする請求項8または16のデータベー
    ス検索システム。
  18. 【請求項18】 検索キーに応じて検索対象の複数の物
    件から情報を検索するためのデータベース検索方法であ
    って、 上記検索対象のi番目の物件のj番目のデータC
    i,j と、i番目の物件内のデータC i,j の近傍データC
    i,k とに基づいて複数の量子化量を算出し、 近傍特徴量として上記複数の量子化量の組合わせを記憶
    し、 上記検索キーについて上記物件の量子化量を算出するの
    と同じ処理を施して上記検索キーの複数の量子化量を算
    出し、 上記検索キーの複数の量子化量と上記近傍特徴量との合
    致度を求めることを特徴とするデータベース検索方法。
  19. 【請求項19】 検索キーに応じて検索対象の複数の物
    件から情報を検索するためのデータベース検索方法であ
    って、 上記検索対象のi番目の物件のj番目のデータC
    i,j と、i番目の物件内のデータC i,j の近傍データC
    i,k とに基づいて複数の量子化量を算出し、 近傍特徴量として上記複数の量子化量をそれぞれ近傍特
    徴量行列座標の各軸の要素値とする座標位置に上記物件
    の物件番号を記憶し、 上記検索キーについて上記物件の量子化量を算出するの
    と同じ処理を施して上記検索キーの複数の量子化量を算
    出し、 上記検索キーの複数の量子化量と上記近傍特徴量との合
    致度を求めることを特徴とするデータベース検索方法。
  20. 【請求項20】 上記物件毎の合致度を上記検索キーの
    近傍特徴量の完全一致度数で割った値を、物件毎の検索
    キーの含有確率として更に算出することを特徴とする
    求項19のデータベース検索方法。
  21. 【請求項21】 請求項20に記載のデータベース検索
    方法において、更に含有確率リストを出力することを特
    徴とするデータベース検索方法。
JP3356348A 1991-04-25 1991-12-24 データベース検索システムおよびその方法 Expired - Lifetime JP2993539B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP3356348A JP2993539B2 (ja) 1991-12-24 1991-12-24 データベース検索システムおよびその方法
DE69229521T DE69229521T2 (de) 1991-04-25 1992-04-23 Datenbankauffindungssystem
EP92106939A EP0510634B1 (en) 1991-04-25 1992-04-23 Data base retrieval system
US07/873,130 US5450580A (en) 1991-04-25 1992-04-24 Data base retrieval system utilizing stored vicinity feature valves
US08/471,459 US5546578A (en) 1991-04-25 1995-06-06 Data base retrieval system utilizing stored vicinity feature values

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3356348A JP2993539B2 (ja) 1991-12-24 1991-12-24 データベース検索システムおよびその方法

Publications (2)

Publication Number Publication Date
JPH05174067A JPH05174067A (ja) 1993-07-13
JP2993539B2 true JP2993539B2 (ja) 1999-12-20

Family

ID=18448579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3356348A Expired - Lifetime JP2993539B2 (ja) 1991-04-25 1991-12-24 データベース検索システムおよびその方法

Country Status (1)

Country Link
JP (1) JP2993539B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274193A (ja) * 1993-03-17 1994-09-30 Nippon Steel Corp データベース検索システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274193A (ja) * 1993-03-17 1994-09-30 Nippon Steel Corp データベース検索システム

Also Published As

Publication number Publication date
JPH05174067A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
US6826567B2 (en) Registration method and search method for structured documents
US6523030B1 (en) Sort system for merging database entries
US6377945B1 (en) Search system and method for retrieval of data, and the use thereof in a search engine
US5805911A (en) Word prediction system
EP0293161B1 (en) Character processing system with spelling check function
JP2742115B2 (ja) 類似文書検索装置
JP2790466B2 (ja) 文字列検索方法及び装置
JP3143532B2 (ja) 画像検索装置及び方法
JP2669601B2 (ja) 情報検索方法及びシステム
JP3258063B2 (ja) データベース検索システム及び方法
JPH05189490A (ja) 関数結果をセーブし検索する方法と装置
JP3151730B2 (ja) データベース検索システム
JPH0782504B2 (ja) 情報検索処理方式および検索ファイル作成装置
JPH06274193A (ja) データベース検索システム
JP2993539B2 (ja) データベース検索システムおよびその方法
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JP3081093B2 (ja) 索引作成方法およびその装置と文書検索装置
JP2993540B2 (ja) 昇順整数列データの圧縮および復号システム
JP3288063B2 (ja) 可変長データの格納および参照システム
JP4362492B2 (ja) 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム
JP2519129B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JP2519130B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JP3344755B2 (ja) 昇順整数列データの圧縮および復号システム
EP1076305A1 (en) A phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990907

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13