JP3545007B2 - データベース検索システム - Google Patents

データベース検索システム Download PDF

Info

Publication number
JP3545007B2
JP3545007B2 JP08415493A JP8415493A JP3545007B2 JP 3545007 B2 JP3545007 B2 JP 3545007B2 JP 08415493 A JP08415493 A JP 08415493A JP 8415493 A JP8415493 A JP 8415493A JP 3545007 B2 JP3545007 B2 JP 3545007B2
Authority
JP
Japan
Prior art keywords
search
data
feature amount
quantization
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP08415493A
Other languages
English (en)
Other versions
JPH06274193A (ja
Inventor
克信 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP08415493A priority Critical patent/JP3545007B2/ja
Publication of JPH06274193A publication Critical patent/JPH06274193A/ja
Application granted granted Critical
Publication of JP3545007B2 publication Critical patent/JP3545007B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、データベースから必要な情報を取り出すためのデータベース検索システムに関し、特に波形、数値列等のデータについてのデータベース検索システムに関する。
【0002】
【従来の技術】
現状のデータベース検索における検索空間圧縮の手法としては、キーワードなどのインデックス情報を付加する方式によるものが一般的である。また、対象物件数が比較的小数のケースでは、全物件検索方式が実用化されている。たとえば文書データにおいては効率的な全物件検索手法として、ボイヤーモア法が考案されている。
【0003】
【発明が解決しようとする課題】
このインデックス検索方式は、以下のような欠点を有する。
(1)物件1つ1つにインデックスを付加しなくてはならない。
(2)任意のインデックスを付加して行くと、その個数は膨大になるため、たとえばキーワードインデックスの場合にはシソーラスによる管理などを必要とし、その維持に多大なコストがかかる。
(3)付加されるインデックスが必ずしも適切なものとは限らない。すなわち現状のデータベース検索方式では、特に物件数が膨大になった時に必要なコストに比してパフォーマンスが伸びない傾向が現れる。
【0004】
一方、全物件検索方式では、上記のような問題は発生しない。しかし、直接検索方式では、物件数が膨大になったとき、検索時間は対話的な時間の域を大幅に超過し、実用にならないのが現状である。また、全物件検索方式におけるあいまい一致条件では完全一致よりさらに検索時間が必要となる。
【0005】
出願人は先に、全物件検索でありながら、検索時間を飛躍的に短縮することができ、またあいまい一致検索ができるデータベース検索方式を特願平3−122766号として提案した。
【0006】
ところで、上述のボイヤーモア法による全物件検索では、文書以外のデータ、たとえば物理的な時系列データを扱うことができないという問題があった。また、前記の特願平3−122766号に係る検索システムにおいても、波形、数値列等のデータの場合には、これらのデータ列の有意な情報単位が文書データと異なり、特徴量を抽出し量子化することが困難であるため、これらのデータを対象とすることができないという問題があった。
【0007】
すなわち、波形、数値列データは、文書データ等と異なり、サンプリングされた数個の値だけで特徴をもつことがない。したがって、何らかの方法によって情報の抽出度を上げて検索データへの依存度を弱める必要がある。現状において、波形、数値列データの検索は主にDynamic Programingマッチング、隠れマルコフモデルなどの手法を用いた逐次マッチングにより実現されている。しかしながら、これらの手法は多くの計算コストを必要とするため、特に大規模システムへの適用においては検索時間の点で問題を生じる。また、文書データにおけるキーワードに相当する2次情報を事前に作成することで検索時間を短縮する手法も考えられるが、有意な情報単位の一般的定義が困難であるため、実現された例は少ない。
【0008】
本発明は、上記のような問題に鑑み、特定の意味を有する情報単位が文書データと比較して大きい波形、数値列データについて、全物件検索でありながら検索時間を飛躍的に短縮することができ、またあいまい一致検索ができるデータベース検索方式を提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明の波形、数値列データを対象とするデータベース検索システムは、検索キーとなる波形、数値列データに応じて検索対象の複数の波形、数値列データから情報を検索するためのデータベース検索システムにおいて、波形・数値列データを検索を行う所定の検索単位に分割する分割手段と、前記分割手段によって分割された前記検索単位ごとに特徴量抽出を行う特徴量抽出手段と、前記特徴量抽出手段によって特徴量抽出を行われたデータについて量子化を行う量子化手段と、検索時に、検索キーとなる波形・数値列データに対して、重み付けの処理を行う重み付け手段とを具備する。
【0010】
【作用】
本発明によれば、波形、数値列データ情報の抽象度を上げて検索データへの依存性を弱めることができ、波形、数値列データについて全物件検索でありながら検索時間を飛躍的に短縮することができ、またあいまい一致検索ができる。
【0011】
【実施例】
次に図面により本発明の実施例を説明する。本発明の検索システムにおいては、検索対象となる波形・数値列データを検索を行う単位である検索単位に分け、この検索単位ごとに昇順の符合を付与する。学習においては1つの検索単位に対して特徴抽出、量子化、コード列化の処理を施し、データを保存する。
【0012】
検索においては、検索キーとなる波形・数値列データに対して、特徴抽出、量子化、コード列化、重み付けの処理が行われる。
【0013】
本発明による検索システムにおいて、対象とされる波形、数値列データの特徴抽出は、データが時系列であると考えた場合、時間的に局所化した関数との内積を取ることにより特徴量を抽出することが基本的な考え方である。内積値は、その時間近傍での特徴を反映していると考えることができる。特徴量の抽出は、以下の方法が例として挙げられる。
1.窓付きのフーリエ変換、特徴軸は周波数
これは窓関数を用いて境界付近の歪みを抑えつつ、一定の分解能で短時間の周波数成分を抽出するものである。
2.ウェーブレット変換、特徴軸は基本関数のスケール
これは時間と周波数の成分を同時に扱い、周波数によって時間分解能が変化するものである。
3.一般の直交関数系、特徴軸は基本多項式の展開係数
これは時間分解能一定で、波形のトレンドに重点を置くものであり、たとえばルジャンドル多項式があげられる。
上記の特徴抽出は十分に高速であることが、望ましい。
【0014】
次にこれらの特徴抽出方法について説明する。図1に示すように、検索対象である波形、数値列データを複数のブロックたるフレームに分割し、通し番号(フレーム番号)を付与する。このフレームを検索対象データの検索単位とする。
【0015】
次に検索単位の波形、数値列データを時間軸方向、すなわち波形の振幅方向と垂直な軸方向に窓を被せ、この窓を特徴量抽出対象領域としてこの区間で特徴抽出を行う。
【0016】
この窓を走査し、各区間で計算された特徴ベクトル、すなわち特徴抽出の方法にしたがって周波数、スケール、展開係数を成分とする特徴ベクトルの時系列を生成する。
【0017】
例を上げて説明する。サンプリングされた波形あるいは数値列データを時間tの関数であるとし、F(t) (t=0,1,,,,) で表す。時間0の回りに局在した関数をG(t,p) とする。ただし、pは特徴を定義するパラメータである。このとき時刻Tの近傍の特徴値は内積で定義される。
【0018】
【数1】
Figure 0003545007
【0019】
ただし、2×aはTを中心とする窓の区間の大きさを表す。すなわち窓は区間[T-a, T+a]で定義される。
【0020】
例えば、G(t, p)は窓付きのフーリエ変換の場合、
G(t, p) = 0.5× exp(-i ×p ×t){1+ cos( π×t/a)}|t |≦ a
(i は虚数単位) i2 = -1
G(t, p) = 0 |t |≧ a
ウェーブレット変換の場合、
G(t, p) = exp(-t2/p2+i ×5 ×t/p)/ √p |t |≦ a
(i は虚数単位) i2 = -1
G(t, p) = 0 |t |≧ a
などを用いることができる。
【0021】
また、関数G()が複素関数である場合にはI(T,p)の絶対値を特徴量とし、T-p の二次元平面上に特徴量が計算される。
【0022】
図2(a)(b)には、窓付きのフーリエ変換およびウェーブレット変換の基本関数の例をそれぞれ示す。また、図3(a)(b)には、窓付きのフーリエ変換およびウェーブレット変換の時間分解能の比較を示す。
【0023】
次に図1に示すように、得られた特徴ベクトルの量子化を行う。
【0024】
まず、軸方向T 、p の各軸方向で区間を設定する。例えば、T 軸方向で[a×k,a ×(k+1)](k = 0,1,,,,) 、p 軸方向で[b×l,b ×(l+1)](l = 0,1,,,,) とする。この区間内で、例えば
1. 区間ごとにある規則に従って代表点を選び、その点での特徴量をそのままその区間の特徴量とする。
2. 区間内での平均値を計算する。
などの所定の演算により特徴量を抽出する。これらにより特徴平面はベクトル系列(あるいは行列) に変換される。
【0025】
次に、それぞれのベクトル成分を最大値などで正規化した後に量子化する。例えば4ビット、2ビットなどで表現される最大数で正規化し、このビットで量子化する。
【0026】
さらにこのベクトル近傍(ベクトル同士の近傍あるいは、成分での近傍)から数値列を再定義し近傍特徴量とすることも可能である。検索単位である波形のi番目のベクトルのj番目の要素をV[i,j]とする時、例えば、この近傍での特徴量 IR [i,j] は、関数h()を定義して、
IR [i,j] = h(V[i,j],V[i,j +1],V[i+1, j],V[i +1,l+j])
で求められる。
【0027】
一方、検索時には、近傍特徴量に特徴軸方向に重み付けを行うことも可能である。これは、検索時に任意に設定する。
【0028】
類似であると定義するものを繰り返し提示し、定義することも可能である。例えば、特徴量 IR [*,j](* は任意) での重みをA[j] とし、波形1の特徴量を IR1[i,j] 、波形2の特徴量を IR2[i,j] とする時、IR1[i1 ,j] = IR2[i2 ,j] となるような i1, i2 つまり類似した特徴量を持つ波形1と波形2が存在するならば、A[j] +=dAとし、それ以外のjについては、A[j] -=dAとする。ただし、A[j]の初期値は1とし、dAは1に比べ非常に小さい数である。つまり類似した特徴量をもつ波形であれば初期値1の重みに対して、例えばdA=0.01等の数値を加算した値(1.01)を重みA[j]とし、それ以外は、初期値1の重みに対して、例えばdA=0.01等の数値を減算した値(0.99)を重みA[j]とすることで、類似した波形の特徴量は重みの値A[j]が大きくなるようにできる。
【0029】
上記のような波形、数値列データの特徴量抽出、量子化は、たとえば次のようなデータ検索システムにおけるデータの処理に適用できる。
【0030】
図4は、本発明が適用される自己相関記憶型パターン検索システムのデータフロー図である。この検索システムでは、予め全検索対象物件である波形・数値列データから事象(情報)の位相情報を全て捨象した近傍特徴量データを作成し、そのデータ群に対して全件検索を行なう。検索のアルゴリズムは、学習ステップと検索ステップとからなる。学習ステップでは、検索単位毎に近傍特徴量行列が位相情報として作成される。図4では、検索対象10から近傍特徴量行列30を作成し、それを構造ファイル40に保存するまでのステップに該当する。また、検索ステップでは、検索キーとなる波形・数値列データに対して学習ステップと同様の処理を行って検索キーの近傍特徴量が求められ、検索単位の近傍特徴量とのマッチング演算が行なわれ、検索単位ごとにマッチング度(類似度)を示す評価結果を得る。図4では、検索キー50をもとに検索S4にて構造ファイル40のデータとのマッチング演算を行い、評価結果リスト70或いはソート済みリスト80のように結果を出力するまでのステップに該当する。以下、各ステップについて説明する。
【0031】
(1)、学習ステップ
図4に於いて、検索対象10は、例えば日本語、英語、ドイツ語、フランス語、ヘブライ語、ロシア語などの文書データ、或いは本発明の特徴たる波形数値データや、化学構造式、遺伝子情報などである。このような検索対象に対して、まず正規化手段S1により正規化の処理を行なう。一般に検索対象は、情報の最小単位(文書であればアルファベットなどの文字、数値チャートであれば、ある時刻における実数値など)の列で表現されている。それをなんらかの方法で複数階調の整数列に変換する。これをデータの正規化と呼ぶ。本発明においては前述のようにサンプリングされた波形あるいは数値列データをフーリエ変換やウェーブレット変換等の関数で特徴量を算出することで正規化を行う。
【0032】
次に正規化されたデータ20から、学習手段S2により近傍特徴量が算出され以下に説明する手順で近傍特徴量行列30の形式に畳込まれる。ここで近傍特徴量をとる演算式は種々考えられる。この演算式は検索の鋭さ(過検出の少なさ)にも影響を与える。
【0033】
学習手段S2の一例として、正規化されたデータ20から量子化量を求め、この量子化量を用いて近傍特徴量行列30を得る手順を説明する。例えば図6に示すように、検索される対象である検索単位が複数あるとし、そのうちのi番目の検索単位の量子化について考える。ここで、i番目の検索単位のj番目の要素データをCi,j とし、Ci,jのk近傍に関するデータをCi,j+1,Ci,j+2,...., Ci,j+kとする。i番目の検索単位において、図5に示すように所定の演算方法で正規化された数値列135,64,37,71,101,...が並んでいるとすると、Ci,j に関する量子化量x及びCi,jの近傍に関する量子化量yは、
x=f(Ci,j)
y=g(Ci,j , Ci,j+1,Ci,j+2,...., Ci,j+k ) 式(1)
で求められる。
【0034】
ここで、f(Ci,j )はCi,j に関するn段階量子化関数である。すなわち、i番目の検索単位のj番目のデータCi,j について所定の演算を行って得られる値であり、1〜nのいずれかの整数で表される。したがって、このn段階量子化関数fの演算により得られた量子化量xの値によって図6に示す行列(座標)においてx軸方向の位置が1〜nの範囲で定まる。
【0035】
また、g(Ci,j , Ci,j+1,Ci,j+2,...., Ci,j+k ) は、Ci,j の前方k近傍に関するm段階量子化関数である。すなわち、i番目の検索単位のj番目のデータCi,j と、そのデータCi,jの近傍の所定数のデータCi,j+1,Ci,j+2,...., Ci,j+kとについて所定の演算を行って得られる値であり、1〜mのいずれかの整数で表される。たとえば図5に示すようにj番目のデータCi,j が135であり、kが3の場合には、Ci,j+1,Ci,j+2,Ci,j+3 としてデータ135に続くデータ64、37、71を抽出し、これらのデータとデータ135との相関について所定の演算を行う。j番目のデータCi,j が次の64の場合には、Ci,j+1,Ci,j+2,Ci,j+3としてデータ64に続くデータ37、71、101を抽出し、これらのデータとデータ64との相関について所定の演算を行う。このようにしてm段階量子化関数gの演算により得られた量子化量yの値によって、図6に示す行列(座標)におけるy軸方向の位置が1〜mの範囲で定まる。
【0036】
したがって、上記のように正規化されたデータ20から量子化量x、yを求めることによって図6に示す行列(座標)における位置が定まる。なお、量子化量を求める演算式f()、g()としては、他にも種々あるが、例えば、
f: x→x
g: (x,y)→x-y(または|x-y |) 式(2)
のように、演算式f()は入力された値をそのまま量子化量とし、演算式g()は入力された2つの値の差、或いは差の絶対値を量子化量とする例が考えられる。また、この式(2)以外にも、幾つかのデータ列の個々のデータ整数値に対して四則演算を施すことにより近傍特徴量を取り出しても良い。なお、図5中に示した量子化量x、yの座標位置(51,71)、(32,103)、・・・は、上記式(2)とは異なる手法によって求めたものである。
【0037】
本システムでは、各検索単位情報は、上記のようにして求めたx、yに対して検索単位の通番iと重みw(x,y,i)の組を記憶する。重みw(x,y,i)は、データx、y、iから所定の演算によって求められるが、通常は重みw(x,y,i)の値は1に固定してもよい。
【0038】
上記のようにして各検索単位についてデータCi,jごとに求められた量子化量x、yの値に基づき図6に棒によって示されるように、データを記憶する。すなわち、データCi,j の量子化量x、yの値によって定められる座標の位置に、その検索単位の通番iとその重みw(x,y,i)を組みとしたデータを記憶する。同図ではこのようなデータが記憶されるごとに棒の長さが延びるように表されている。通常は重みw(x,y,i)は1とされるから、検索単位の通番iのデータのみがx、yの値によって定められる座標の位置に記憶されてゆく。
【0039】
この様にして作成された近傍特徴量行列に検索単位の識別番号を付加して構造ファイル40として保存する。
【0040】
(2)、検索ステップ
まず検索キー50を入力する。この検索キー50に対して学習ステップでの正規化手段S1と同一の正規化方法に基づく正規化手段S3によりキー情報を以下の整数列に正規化する。
【0041】
次に、検索手段S4において、学習ステップでの学習手段S2と同一の自己相関計算式f() 、g() を用いて正規化された検索キー50の数値列の先頭から量子化量x、yの組の系列を作成する。次に、この検索キー50の量子化量x、yの組の系列に基づいて、構造ファイル40内から取り出した検索単位iに対する検索キー50の含有度数ωiとして、V(xj,yj,i)をj=1〜mについて合計することにより算出する。
【0042】
ただし、V(xj,yj,i)は、構造ファイル40に記憶された検索単位iの重みに等しく、重みを持たない場合には0と定める。
【0043】
したがって、検索すべきキー50数値列から求めた量子化量x、yの組に対応する図6の量子化量x、yの位置にデータがある場合(棒がある場合)には、別に設けられた記憶手段のそのデータに示される検索単位の通番iの格納箇所にその重みの値を構造評価値score(合致度)として記憶させる。
【0044】
次に、評価結果出力手段S5において、構造ファイル40内の検索単位毎に得られた構造評価値score (合致度)を完全一致の場合の評価値で割って、検索キー50の含有確率を求め、評価結果のリスト70を得る。更にソート手段S6において、このリスト70を含有確率の降順にソートしソート済みリスト80を得る。
【0045】
このソート済みリスト80が検索結果であり、その上位検索単位を参照することにより、検索キーが検索単位中に含まれている確率が高い検索単位通番を知ることができる。含有確率は、完全一致及び不完全一致の全てについて求まるから、あいまい一致検索を行なうことができる。
【0046】
また、検索キーの全情報についての全物件探索であるから、検索もれが発生する確率は、本質的に零であると言う特徴がある。
【0047】
また、1つの検索単位に対する検索キーの評価時間は、キーのデータ数のみに依存し、検索単位の大きさには依存しない。従って、非常に高速に検索を行なうことができる。
【0048】
近傍特徴量は、各検索単位の全データを対象とし取り出さなくてもよい。例えば、検索単位データ中の特定の一つまたは一つ以上の整数値、特定の範囲の整数値、或いはデータ列を構成する各バイト中の特定の1つまたは一つ以上のビットを除外して近傍特徴量を捨象してもよい。
【0049】
上述の例では、近傍特徴量によって生成される行列は、256次のビット行列であり、これは8K バイトに相当する。従って、1検索単位のデータが1K バイト程度であるデータベースでは、効率のよいシステムであるとは言えない。そこで上記のようなデータ圧縮手段S7を設けてデータ圧縮を行なって構造ファイル40の容量を減らすのがよい。
【0050】
上述の実施例において,正規化手段S1、学習手段S2、正規化手段S3、検索手段S4、評価結果出力手段S5、ソート手段S6、データ圧縮手段S7は、コンピュータプログラムによって構成することができるが、論理回路素子を用いて専用のハードウエアを構成してもよい。
【0051】
前述のような波形、数値列データの特徴量抽出、量子化を上記の検索システムに適用すれば、波形、数値列データの検索を有効に行うことができる。
【0052】
【発明の効果】
本発明は波形、数値列データの特徴量抽出、量子化を行い、検索時には検索キーとなる波形・数値列データに対して重み付けの処理を行うようにしているからこれらのデータを対象とする検索を有効に行うことができる。
【図面の簡単な説明】
【図1】本発明による特徴量抽出、量子化の例を示す図である。
【図2】本発明に用いられる基本関数の例を示す図である。
【図3】本発明に用いられる変換の解像度の例を示す図である。
【図4】本発明によるデータベース検索システムのデータフロー図である。
【図5】近傍情報の量子化を示す図である。
【図6】記憶される情報構造を示す図である。
【符号の説明】
30 近傍特徴量行列
40 構造ファイル
50 検索キー
60 正規化キー
70 評価結果リスト
80 ソート済みリスト
S1 正規化手段
S2 学習手段
S3 正規化手段
S4 検索手段
S5 評価結果出力手段
S6 ソート手段
S7 データ圧縮手段

Claims (4)

  1. 検索キーとなる波形、数値列データに応じて検索対象の複数の波形、数値列データから情報を検索するためのデータベース検索システムにおいて、
    波形・数値列データを検索を行う所定の検索単位に分割する分割手段と、
    前記分割手段によって分割された前記検索単位ごとに特徴量抽出を行う特徴量抽出手段と、
    前記特徴量抽出手段によって特徴量抽出を行われたデータについて量子化を行う量子化手段と、
    検索時に、検索キーとなる波形・数値列データに対して、重み付けの処理を行う重み付け手段とを具備することを特徴とするデータベース検索システム。
  2. 前記特徴量抽出手段は、データの時系列を第一の軸とし、各特徴成分を第二の軸とする二次元平面上の特徴量分布として抽出し、
    前記量子化手段は、前記各軸方向についてそれぞれの特徴量から量子化量を算出することを特徴とする請求項1に記載のデータベース検索システム。
  3. 検索対象の検索単位毎にその近傍特徴量を記憶した記憶手段と、検索キーの近傍特徴量と検索対象の上記近傍特徴量との合致度を検索単位毎に求め、検索単位番号を合致度の降順に出力する検索手段とを具備するデータベース検索に用いられることを特徴とする請求項1のデータベース検索システム。
  4. 検索対象のi番目の検索単位のj番目のデータ列Ci,j に関する量子化量xとその近傍のk個のデータ列Ci,j+1,i,j+2,...., i,j+k に関する量子化量yとを
    x=f(Ci,j )
    y=g(Ci,j ,Ci,j+1,i,j+2,...., i,j+k )
    によって求め、得られたx、yの値に基づいて定められる記憶手段の位置にその検索単位の通番iを記憶するデータベース検索に用いられることを特徴とする請求項3のデータベース検索システム。
JP08415493A 1993-03-17 1993-03-17 データベース検索システム Expired - Lifetime JP3545007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08415493A JP3545007B2 (ja) 1993-03-17 1993-03-17 データベース検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08415493A JP3545007B2 (ja) 1993-03-17 1993-03-17 データベース検索システム

Publications (2)

Publication Number Publication Date
JPH06274193A JPH06274193A (ja) 1994-09-30
JP3545007B2 true JP3545007B2 (ja) 2004-07-21

Family

ID=13822594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08415493A Expired - Lifetime JP3545007B2 (ja) 1993-03-17 1993-03-17 データベース検索システム

Country Status (1)

Country Link
JP (1) JP3545007B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6381365B2 (en) 1997-08-22 2002-04-30 Minolta Co., Ltd. Image data processing apparatus and image data processing method
JP3747589B2 (ja) 1997-09-17 2006-02-22 コニカミノルタビジネステクノロジーズ株式会社 画像特徴量比較装置および画像特徴量比較プログラムを記録した記録媒体
JP3607059B2 (ja) * 1997-09-19 2005-01-05 コニカミノルタビジネステクノロジーズ株式会社 色特徴抽出装置および色特徴の抽出方法およびプログラム記憶媒体
JP3695084B2 (ja) 1997-09-19 2005-09-14 コニカミノルタビジネステクノロジーズ株式会社 類似画像検索装置および類似画像の検索方法およびプログラム記憶媒体
US6480841B1 (en) 1997-09-22 2002-11-12 Minolta Co., Ltd. Information processing apparatus capable of automatically setting degree of relevance between keywords, keyword attaching method and keyword auto-attaching apparatus
JP3797836B2 (ja) 1999-12-09 2006-07-19 株式会社東芝 リモートメンテナンスシステム
US7421305B2 (en) * 2003-10-24 2008-09-02 Microsoft Corporation Audio duplicate detector
KR100763197B1 (ko) 2006-02-06 2007-10-04 삼성전자주식회사 컨텐츠 검색 방법 및 장치
JP4788810B2 (ja) * 2009-08-17 2011-10-05 ソニー株式会社 楽曲同定装置及び方法、楽曲同定配信装置及び方法
JP5284990B2 (ja) 2010-01-08 2013-09-11 インターナショナル・ビジネス・マシーンズ・コーポレーション キーワードの時系列解析のための処理方法、並びにその処理システム及びコンピュータ・プログラム
JP5733530B2 (ja) 2012-08-22 2015-06-10 横河電機株式会社 データ類似度算出方法およびデータ類似度算出装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60205594A (ja) * 1984-03-30 1985-10-17 電子計算機基本技術研究組合 認識結果表示方式
JP3259781B2 (ja) * 1984-10-08 2002-02-25 新日鉄ソリューションズ株式会社 データベース検索システムおよびデータベース検索方法
JPS61228500A (ja) * 1985-04-03 1986-10-11 沖電気工業株式会社 音声認識方法
JPS625298A (ja) * 1985-06-29 1987-01-12 ソニー株式会社 音声認識装置
JPH03194655A (ja) * 1989-12-25 1991-08-26 Nippon Telegr & Teleph Corp <Ntt> 類似画像の蓄積および検索方法
JP3151730B2 (ja) * 1991-04-25 2001-04-03 新日本製鐵株式会社 データベース検索システム
JP2993539B2 (ja) * 1991-12-24 1999-12-20 新日本製鐵株式会社 データベース検索システムおよびその方法
JP3288063B2 (ja) * 1991-12-27 2002-06-04 新日鉄ソリューションズ株式会社 可変長データの格納および参照システム
JP3258063B2 (ja) * 1992-02-07 2002-02-18 新日鉄ソリューションズ株式会社 データベース検索システム及び方法
JP2870224B2 (ja) * 1991-06-19 1999-03-17 松下電器産業株式会社 音声認識方法
JP3143532B2 (ja) * 1992-11-30 2001-03-07 キヤノン株式会社 画像検索装置及び方法

Also Published As

Publication number Publication date
JPH06274193A (ja) 1994-09-30

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
US6173275B1 (en) Representation and retrieval of images using context vectors derived from image information elements
CN109886294B (zh) 知识融合方法、装置、计算机设备和存储介质
KR100545477B1 (ko) 거리 측정기를 사용한 이미지 검색법
CN107330127B (zh) 一种基于文本图片检索的相似文本检测方法
US7072872B2 (en) Representation and retrieval of images using context vectors derived from image information elements
US6882747B2 (en) Text mining method and apparatus for extracting features of documents
US5528701A (en) Trie based method for indexing handwritten databases
US8095526B2 (en) Efficient retrieval of variable-length character string data
EP1168202A2 (en) Apparatus for retrieving similar documents and apparatus for extracting relevant keywords
JP3545007B2 (ja) データベース検索システム
JPH07319924A (ja) 手書き電子文書のインデックス付けおよび探索方法
JP3258063B2 (ja) データベース検索システム及び方法
CN107908757B (zh) 网站分类方法及系统
JP3151730B2 (ja) データベース検索システム
Arica et al. A shape descriptor based on circular Hidden Markov Model
US7447373B2 (en) Method for efficient coding of shape descriptor parameters
Al-Mofareji et al. WeDoCWT: A new method for web document clustering using discrete wavelet transforms
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JP2993539B2 (ja) データベース検索システムおよびその方法
CN109299260B (zh) 数据分类方法、装置以及计算机可读存储介质
JP2735866B2 (ja) データベースのデータ検索方法
JPH05181913A (ja) 昇順整数列データの圧縮および復号システム
JP4042678B2 (ja) 単語ベクトル推定方法及び装置及び単語ベクトル推定プログラム及び単語ベクトル推定プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3344755B2 (ja) 昇順整数列データの圧縮および復号システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040407

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110416

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120416

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 9