JPH06274193A - データベース検索システム - Google Patents

データベース検索システム

Info

Publication number
JPH06274193A
JPH06274193A JP5084154A JP8415493A JPH06274193A JP H06274193 A JPH06274193 A JP H06274193A JP 5084154 A JP5084154 A JP 5084154A JP 8415493 A JP8415493 A JP 8415493A JP H06274193 A JPH06274193 A JP H06274193A
Authority
JP
Japan
Prior art keywords
data
search
property
feature
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5084154A
Other languages
English (en)
Other versions
JP3545007B2 (ja
Inventor
Katsunobu Shibata
克信 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP08415493A priority Critical patent/JP3545007B2/ja
Publication of JPH06274193A publication Critical patent/JPH06274193A/ja
Application granted granted Critical
Publication of JP3545007B2 publication Critical patent/JP3545007B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 波形または数値列のデータについて特徴量抽
出、量子化を行うデータベース検索システムを提供す
る。 【構成】 検索対象となる波形・数値列データを複数の
ブロックたるフレームに分割し、通し番号(フレーム番
号)を付与する。このフレームを検索対象データの検索
単位とし、学習においては検索単位ごとに特徴量抽出、
量子化、コード列化の処理を施し、データを保存する。
特徴量抽出は窓付きのフーリエ変換、ウェーブレット変
換、一般の直交変換等により行われる。検索において
は、検索キーとなる波形・数値列データに対して、特徴
抽出、量子化、コード列化、重み付けの処理が行われ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データベースから必要
な情報を取り出すためのデータベース検索システムに関
し、特に波形、数値列等のデータについてのデータベー
ス検索システムに関する。
【0002】
【従来の技術】現状のデータベース検索における検索空
間圧縮の手法としては、キーワードなどのインデックス
情報を付加する方式によるものが一般的である。また、
対象物件数が比較的小数のケースでは、全物件検索方式
が実用化されている。たとえば文書データにおいては効
率的な全物件検索手法として、ボイヤーモア法が考案さ
れている。
【0003】
【発明が解決しようとする課題】このインデックス検索
方式は、以下のような欠点を有する。 (1)物件1つ1つにインデックスを付加しなくてはな
らない。 (2)任意のインデックスを付加して行くと、その個数
は膨大になるため、たとえばキーワードインデックスの
場合にはシソーラスによる管理などを必要とし、その維
持に多大なコストがかかる。 (3)付加されるインデックスが必ずしも適切なものと
は限らない。すなわち現状のデータベース検索方式で
は、特に物件数が膨大になった時に必要なコストに比し
てパフォーマンスが伸びない傾向が現れる。
【0004】一方、全物件検索方式では、上記のような
問題は発生しない。しかし、直接検索方式では、物件数
が膨大になったとき、検索時間は対話的な時間の域を大
幅に超過し、実用にならないのが現状である。また、全
物件検索方式におけるあいまい一致条件では完全一致よ
りさらに検索時間が必要となる。
【0005】出願人は先に、全物件検索でありながら、
検索時間を飛躍的に短縮することができ、またあいまい
一致検索ができるデータベース検索方式を特願平3−1
22766号として提案した。
【0006】ところで、上述のボイヤーモア法による全
物件検索では、文書以外のデータ、たとえば物理的な時
系列データを扱うことができないという問題があった。
また、前記の特願平3−122766号に係る検索シス
テムにおいても、波形、数値列等のデータの場合には、
これらのデータ列の有意な情報単位が文書データと異な
り、特徴量を抽出し量子化することが困難であるため、
これらのデータを対象とすることができないという問題
があった。
【0007】すなわち、波形、数値列データは、文書デ
ータ等と異なり、サンプリングされた数個の値だけで特
徴をもつことがない。したがって、何らかの方法によっ
て情報の抽出度を上げて検索データへの依存度を弱める
必要がある。現状において、波形、数値列データの検索
は主にDynamic Programingマッチング、隠れマルコフモ
デルなどの手法を用いた逐次マッチングにより実現され
ている。しかしながら、これらの手法は多くの計算コス
トを必要とするため、特に大規模システムへの適用にお
いては検索時間の点で問題を生じる。また、文書データ
におけるキーワードに相当する2次情報を事前に作成す
ることで検索時間を短縮する手法も考えられるが、有意
な情報単位の一般的定義が困難であるため、実現された
例は少ない。
【0008】本発明は、上記のような問題に鑑み、特定
の意味を有する情報単位が文書データと比較して大きい
波形、数値列データについて、全物件検索でありながら
検索時間を飛躍的に短縮することができ、またあいまい
一致検索ができるデータベース検索方式を提供すること
を目的とする。
【0009】
【課題を解決するための手段】本発明の波形、数値列デ
ータを対象とするデータベース検索システムは、波形・
数値列データを検索を行う所定の検索単位に分割する分
割手段と、分割手段によって分割された検索単位ごとに
特徴量抽出を行う特徴量抽出手段と、特徴量抽出手段に
よって特徴量抽出を行われたデータについて量子化を行
う量子化手段と、検索時に、検索キーとなる波形・数値
列データに対して、重み付けの処理を行う重み付け手段
とを具備する。
【0010】
【作用】本発明によれば、波形、数値列データ情報の抽
象度を上げて検索データへの依存性を弱めることがで
き、波形、数値列データについて全物件検索でありなが
ら検索時間を飛躍的に短縮することができ、またあいま
い一致検索ができる。
【0011】
【実施例】次に図面により本発明の実施例を説明する。
本発明の検索システムにおいては、検索対象となる波形
・数値列データを検索を行う単位である検索単位に分
け、この検索単位ごとに昇順の符合を付与する。学習に
おいては1つの検索単位に対して特徴抽出、量子化、コ
ード列化の処理を施し、データを保存する。
【0012】検索においては、検索キーとなる波形・数
値列データに対して、特徴抽出、量子化、コード列化、
重み付けの処理が行われる。
【0013】本発明による検索システムにおいて、対象
とされる波形、数値列データの特徴抽出は、データが時
系列であると考えた場合、時間的に局所化した関数との
内積を取ることにより特徴量を抽出することが基本的な
考え方である。内積値は、その時間近傍での特徴を反映
していると考えることができる。特徴量の抽出は、以下
の方法が例として挙げられる。 1.窓付きのフーリエ変換、特徴軸は周波数 これは窓関数を用いて境界付近の歪みを抑えつつ、一定
の分解能で短時間の周波数成分を抽出するものである。 2.ウェーブレット変換、特徴軸は基本関数のスケール これは時間と周波数の成分を同時に扱い、周波数によっ
て時間分解能が変化するものである。 3.一般の直交関数系、特徴軸は基本多項式の展開係数 これは時間分解能一定で、波形のトレンドに重点を置く
ものであり、たとえばルジャンドル多項式があげられ
る。 上記の特徴抽出は十分に高速であることが、望ましい。
【0014】次にこれらの特徴抽出方法について説明す
る。図1に示すように、波形、数値列データを複数のブ
ロックたるフレームに分割し、通し番号(フレーム番
号)を付与する。このフレームを検索対象データの単位
とする。
【0015】次に波形、数値列データを時間軸方向、す
なわち波形の振幅方向と垂直な軸方向に窓を被せ、この
窓を特徴量抽出対象領域としてこの区間で特徴抽出を行
う。
【0016】この窓を走査し、各区間で計算された特徴
ベクトル、すなわち特徴抽出の方法にしたがって周波
数、スケール、展開係数を成分とする特徴ベクトルの時
系列を生成する。
【0017】例を上げて説明する。サンプリングされた
波形あるいは数値列データを時間tの関数であるとし、
F(t) (t=0,1,,,,) で表す。時間0の回りに局在した関
数をG(t,p) とする。ただし、pは特徴を定義するパラ
メータである。このとき時刻Tの近傍の特徴値は内積
【0018】
【数1】
【0019】で定義される。ただし、2×aはTを中心
とする窓の区間の大きさを表す。すなわち窓は区間[T-
a, T+a]で定義される。
【0020】例えば、G(t, p)は窓付きのフーリエ変換
の場合、 G(t, p) = 0.5× exp(-i ×p ×t){1+ cos( π×t/
a)}|t |≦ a (i は虚数単位) i2 = -1 G(t, p) = 0 |t |≧ a ウェーブレット変換の場合、 G(t, p) = exp(-t ^2/p ^2+i ×5 ×t/p)/ √p
|t |≦ a (i は虚数単位) i2 = -1 G(t, p) = 0 |t |≧ a などを用いることができる。
【0021】また、関数G()が複素関数である場合には
I(T,p)の絶対値を特徴量とし、T-pの二次元平面上に特
徴量が計算される。
【0022】図2(a)(b)には、窓付きのフーリエ
変換およびウェーブレット変換の基本関数の例をそれぞ
れ示す。また、図3(a)(b)には、窓付きのフーリ
エ変換およびウェーブレット変換の時間分解能の比較を
示す。
【0023】次に図1に示すように、得られた特徴ベク
トルの量子化を行う。量子化はまず、軸方向T 、p の量
子化が行われる。
【0024】まず、各軸方向で区間を設定する。例え
ば、T 軸方向で[a×k,a ×(k+1)](k = 0,1,,,,) 、p 軸
方向で[b×l,b ×(l+1)](l = 0,1,,,,) とする。この区
間内で量子化値 D[i,j] を所定の演算により決定する。
例えば 1. 区間ごとにある規則に従って代表点を選び、その点
での特徴量をそのままその区間の特徴量とする。 2. 区間内での平均値を計算する。 などの方法が考えられる。これらにより特徴平面はベク
トル系列( あるいは行列) に変換される。
【0025】次に、特徴量の量子化として、それぞれの
ベクトル成分を最大値などで正規化した後に量子化す
る。例えば4ビット、2ビットなどで表現される最大数
で正規化し、このビットで量子化する。
【0026】上記の処理でデータの正規化は一応なされ
たが、さらにこのベクトル近傍( ベクトル同士の近傍あ
るいは、成分での近傍)から数値列を再定義し近傍特徴
量とすることも可能である。検索単位である波形のk番
目のベクトルのl番目の要素をV[k,l]とする時、例え
ば、この近傍での特徴量 IR [k,l] は、関数h() を定義
して、 IR [k,l] = h(V[k,l],V[k,l+1],V[k+1,l],V[k+1,l+1] で求められる。
【0027】一方、検索時には、近傍特徴量に特徴軸方
向に重み付けを行うことも可能である。これは、検索時
に任意に設定する、あるいは類似であると定義するもの
を繰り返し提示し、学習することによって定義すること
も可能である。
【0028】例えば、特徴量 IR [*,l](* は任意) での
重みをA[l] とし、波形1の特徴量を IR1[k,l] 、波形
2の特徴量を IR2[k,l] とする時、IR1[k1 ,l] = I
R2[k2 ,l] となるような k1, k2 が存在するならば、A
[ l] +=dAとし、それ以外のlについては、 A[ l] -=
dAとする。ただし、A[l]の初期値は1とし、dAは1に比
べ非常に小さい数である。
【0029】上記のような波形、数値列データの特徴量
抽出、量子化は、たとえば次のようなデータ検索システ
ムにおけるデータの処理に適用できる。
【0030】図4は、本発明が適用される自己相関記憶
型パターン検索システムのデータフロー図である。この
検索システムでは、予め全対象物件から事象(情報)の
位相情報を全て捨象した近傍特徴量データを作成し、そ
のデータ群に対して全物件検索を行なう。検索のアルゴ
リズムは、学習ステップと検索ステップとからなる。学
習ステップでは、物件毎に近傍特徴量行列が位相情報と
して作成される。検索ステップでは、検索キーと近傍特
徴量行列とのマッチング演算が行なわれ、物件ごとにマ
ッチング度(類似度)を示す評価結果を得る。以下、各
ステップについて説明する。
【0031】(1)、学習ステップ 図4に於いて、検索対象10は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは本発明の特徴たる量子化された波形数
値データや、化学構造式、遺伝子情報などである。この
ような検索対象に対して、まず正規化手段S1により正
規化の処理を行なう。一般に検索対象は、情報の最小単
位(文書であればアルファベットなどの文字、数値チャ
ートであれば、ある時刻における実数値など)の列で表
現されている。それをなんらかの方法でn階調の整数列
に変換する。これをデータの正規化と呼ぶ。本発明にお
いては前述のように正規化が行われる。
【0032】正規化されたデータ20は、次に学習手段
S2により近傍特徴量行列30の形式に畳込まれる。こ
こで近傍特徴量をとる演算式は種々考えられる。この演
算式は検索の鋭さ(過検出の少なさ)にも影響を与え
る。
【0033】今、i番目の物件のj番目のデータをC
i,j とし、Ci,j に関する量子化量xとCi,j の前方k
近傍に関する量子化量yを次のようにして求める。ここ
では、検索される対象物件がn個あるとし、そのうちの
i番目の物件の量子化について説明する。i番目の物件
において、図5に示すように正規化された数値列135,6
4,37,71,101,...が並んでいるとすると、Ci,j に関す
る量子化量xは、 x=f(Ci,j ) Ci,j の前方k近傍に関する量子化量yは y=g(Ci,j , Ci,j+1,i,j+2,...., i,j+k ) で求められる。
【0034】ここで、f(Ci,j )はCi,j に関するn段
階量子化関数である。すなわち、i番目の物件のj番目
のデータCi,j について所定の演算を行って得られる値
であり、1〜nのいずれかの整数で表される。したがっ
て、得られたxの値によって図6に示す行列(座標)に
おいてx軸方向の位置が1〜nの範囲で定まる。
【0035】また、g(Ci,j , Ci,j+1,i,j+2,....,
i,j+k ) は、Ci,j の前方k近傍に関するm段階量子
化関数である。すなわち、i番目の物件のj番目のデー
タCi,j とそのデータの近傍の所定の数のデータについ
て所定の演算を行って得られる値であり、1〜mのいず
れかの整数で表される。たとえば図5に示すようにj番
目のデータCi,j が135であり、kが3の場合には、
i,j+1,i,j+2,i,j+3 としてデータ135に続くデ
ータ64、37、71を抽出し、これらのデータとデー
タ135との相関について所定の演算を行う。j番目の
データCi,j が次の64の場合には、Ci,j+1,i,j+2,
i,j+3 としてデータ64に続くデータ37、71、1
01を抽出し、これらのデータとデータ64との相関に
ついて所定の演算を行う。
【0036】このようにして得られたyの値によって、
図6に示す行列(座標)におけるy軸方向の位置が1〜
mの範囲で定まる。したがって、上記のようにx、yを
求めることによって図6に示す行列(座標)における位
置が定まる。
【0037】本システムでは、各物件情報は、上記のよ
うにして求めたx、yに対して物件の通番iと重みw
(x,y,i)の組として記憶される。重みw(x,y,i)は、デ
ータx、y、iから所定の演算によって求められるが、
通常は重みw(x,y,i)の値は1に固定される。
【0038】上記のようにして求められたデータCi,j
ごとにx、yの値に基づき図6に棒によって示されるよ
うに、データを記憶する。すなわち、データCi,j
x、yの値によって定められる座標の位置に、その物件
の通番iとその重みw(x,y,i)を組みとしたデータを記
憶する。同図ではこのようなデータが記憶されるごとに
棒の長さが延びるように表されている。通常は重みw
(x,y,i)は1とされるから、物件の通番iのデータのみ
がx、yの値によって定められる座標の位置に記憶され
てゆく。
【0039】この様にして作成された近傍特徴量行列に
物件の識別番号を付加して構造ファイル40として保存
する。
【0040】(2)、検索ステップ まず検索キー50を入力する。この検索キー50に対し
て学習ステップと同一の正規化方法に基づく正規化手段
S3によりキー情報を整数列に正規化する。
【0041】次に、検索手段S4において、学習ステッ
プと同一の自己相関計算式f() 、g() を用いて各物件に
対応する正規化された数値列の先頭からx、yの組の系
列を作成する。次に、このx、yの組の系列に基づい
て、物件kに対する検索キーの含有度数ωk として、V
(xj,j,k)をj=1〜mについて合計することによ
り算出する。
【0042】ただし、V(xj,j,k)は、物件情報リ
ストが物件iについての重みを持つ場合、はその重みに
等しく、持たない場合には0と定める。
【0043】したがって、検索すべき数値列のx、yの
組に対応する図6のx、yの位置にデータがある場合
(棒がある場合)には、別に設けられた記憶手段のその
データに示される物件の通番iの格納箇所にその重みの
値を記憶させる。
【0044】次に、評価結果出力手段S5において、物
件毎に得られた構造評価値score (合致度)を完全一致
の場合の評価値で割って、検索キーの含有確率を求め、
評価結果のリスト70を得る。更にソート手段S6にお
いて、このリスト70を含有確率の降順にソートしソー
ト済みリスト80を得る。
【0045】このソート済みリスト80が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。
【0046】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。
【0047】また、1つの物件に対する検索キーの評価
時間は、キーのデータ数のみに依存し、物件の大きさに
は依存しない。従って、非常に高速に検索を行なうこと
ができる。
【0048】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するAND、ORなどの
検索演算処理も高速に実行できる。式(1)の自己相関
式は上述の例の他に種々考えることができる。例えば、 f: x→x g: (x,y)→x-y (または|x-y |) とすれば、隣接データ及び一つ置きのデータの差分(ま
たは差分の絶対値)を相関情報として近傍特徴量行列を
作ることができる。また幾つかのデータ列の個々のデー
タ整数値に対し四則演算を施すことにより近傍特徴量を
取り出してもよい。
【0049】近傍特徴量は、各物件の全データを対象と
し取り出さなくてもよい。例えば、物件データ中の特定
の一つまたは一つ以上の整数値、特定の範囲の整数値、
或いはデータ列を構成する各バイト中の特定の1つまた
は一つ以上のビットを除外して近傍特徴量を捨象しても
よい。
【0050】上述の例では、近傍特徴量によって生成さ
れる行列は、256次のビット行列であり、これは8K
バイトに相当する。従って、1物件のデータが1K バイ
ト程度であるデータベースでは、効率のよいシステムで
あるとは言えない。そこで上記のようなデータ圧縮手段
S7を設けてデータ圧縮を行なって構造ファイル40の
容量を減らすのがよい。
【0051】上述の実施例において,正規化手段S1、
学習手段S2、正規化手段S3、検索手段S4、評価結
果出力手段S5、ソート手段S6、データ圧縮手段S7
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。
【0052】前述のような波形、数値列データの特徴量
抽出、量子化を上記の検索システムに適用すれば、波
形、数値列データの検索を有効に行うことができる。
【0053】
【発明の効果】本発明は波形、数値列データの特徴量抽
出、量子化を行うようにしているからこれらのデータを
対象とする検索を有効に行うことができる。
【図面の簡単な説明】
【図1】本発明による特徴量抽出、量子化の例を示す図
である。
【図2】本発明に用いられる基本関数の例を示す図であ
る。
【図3】本発明に用いられる変換の解像度の例を示す図
である。
【図4】本発明によるデータベース検索システムのデー
タフロー図である。
【図5】近傍情報の量子化を示す図である。
【図6】記憶される情報構造を示す図である。
【符号の説明】
30 近傍特徴量行列 40 構造ファイル 50 検索キー 60 正規化キー 70 評価結果リスト 80 ソート済みリスト S1 正規化手段 S2 学習手段 S3 正規化手段 S4 検索手段 S5 評価結果出力手段 S6 ソート手段 S7 データ圧縮手段

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 波形、数値列データを対象とするデータ
    ベース検索システムにおいて、 波形・数値列データを検索を行う所定の検索単位に分割
    する分割手段と、 前記分割手段によって分割された前記検索単位ごとに特
    徴量抽出を行う特徴量抽出手段と、 前記特徴量抽出手段によって特徴量抽出を行われたデー
    タについて量子化を行う量子化手段と、 検索時に、検索キーとなる波形・数値列データに対し
    て、重み付けの処理を行う重み付け手段とを具備するこ
    とを特徴とするデータベース検索システム。
  2. 【請求項2】 前記特徴量抽出手段は、データの時系列
    を第一の軸とし、各特徴成分を第二の軸とする二次元平
    面上に特徴量の分布として、特徴量の抽出を行うことを
    特徴とする請求項1に記載のデータベース検索システ
    ム。
  3. 【請求項3】 検索対象の物件毎にその近傍特徴量を記
    憶した記憶手段と、 検索キーの近傍特徴量と検索対象の上記近傍特徴量との
    合致度を物件毎に求め、物件番号を合致度の降順に出力
    する検索手段とを具備するデータベース検索に用いられ
    ることを特徴とする請求項1のデータベース検索システ
    ム。
  4. 【請求項4】 検索対象のi番目の物件のj番目のデー
    タ列Ci,j に関する量子化量xとその近傍のk個のデー
    タ列Ci,j+1,i,j+2,...., i,j+k に関する量子化量
    yとを x=f(Ci,j ) y=g(Ci,j , Ci,j+1,i,j+2,...., i,j+k ) によって求め、得られたx、yの値に基づいて定められ
    る記憶手段の位置にその物件の通番iを記憶するデータ
    ベース検索に用いられることを特徴とする請求項3のデ
    ータベース検索システム。
JP08415493A 1993-03-17 1993-03-17 データベース検索システム Expired - Lifetime JP3545007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08415493A JP3545007B2 (ja) 1993-03-17 1993-03-17 データベース検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08415493A JP3545007B2 (ja) 1993-03-17 1993-03-17 データベース検索システム

Publications (2)

Publication Number Publication Date
JPH06274193A true JPH06274193A (ja) 1994-09-30
JP3545007B2 JP3545007B2 (ja) 2004-07-21

Family

ID=13822594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08415493A Expired - Lifetime JP3545007B2 (ja) 1993-03-17 1993-03-17 データベース検索システム

Country Status (1)

Country Link
JP (1) JP3545007B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6140997A (en) * 1997-09-19 2000-10-31 Minolta Co., Ltd. Color feature extracting apparatus and method therefor capable of easily transforming a RGB color space into a color space close to human sense
US6249607B1 (en) 1997-09-19 2001-06-19 Minolta Co., Ltd. Similar-image retrieving apparatus, similar-image retrieving method and program storage medium
US6381365B2 (en) 1997-08-22 2002-04-30 Minolta Co., Ltd. Image data processing apparatus and image data processing method
US6480841B1 (en) 1997-09-22 2002-11-12 Minolta Co., Ltd. Information processing apparatus capable of automatically setting degree of relevance between keywords, keyword attaching method and keyword auto-attaching apparatus
US6519360B1 (en) 1997-09-17 2003-02-11 Minolta Co., Ltd. Image processing apparatus for comparing images based on color feature information and computer program product in a memory
JP2005202357A (ja) * 2003-10-24 2005-07-28 Microsoft Corp オーディオ重複検出器
US7126968B2 (en) 1999-12-09 2006-10-24 Kabushiki Kaisha Toshiba Data compression system, data decompression system, supervisory control system and computer-readable storage medium
JP2009276776A (ja) * 2009-08-17 2009-11-26 Sony Corp 楽曲同定装置及び方法、楽曲同定配信装置及び方法
US8340474B2 (en) 2006-02-06 2012-12-25 Samsung Electronics Co., Ltd. Apparatus and method of browsing contents
US8526735B2 (en) 2010-01-08 2013-09-03 International Business Machines Corporation Time-series analysis of keywords
EP2701075A1 (en) 2012-08-22 2014-02-26 Yokogawa Electric Corporation Method and apparatus for data similarity calculation

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60205594A (ja) * 1984-03-30 1985-10-17 電子計算機基本技術研究組合 認識結果表示方式
JPS61228500A (ja) * 1985-04-03 1986-10-11 沖電気工業株式会社 音声認識方法
JPS625298A (ja) * 1985-06-29 1987-01-12 ソニー株式会社 音声認識装置
JPH03194655A (ja) * 1989-12-25 1991-08-26 Nippon Telegr & Teleph Corp <Ntt> 類似画像の蓄積および検索方法
JPH04326164A (ja) * 1991-04-25 1992-11-16 Nippon Steel Corp データベース検索システム
JPH04369696A (ja) * 1991-06-19 1992-12-22 Matsushita Electric Ind Co Ltd 音声認識方法
JPH05174067A (ja) * 1991-12-24 1993-07-13 Nippon Steel Corp データベース検索システム
JPH06168277A (ja) * 1992-11-30 1994-06-14 Canon Inc 画像検索装置及び方法
JP3258063B2 (ja) * 1992-02-07 2002-02-18 新日鉄ソリューションズ株式会社 データベース検索システム及び方法
JP3259781B2 (ja) * 1984-10-08 2002-02-25 新日鉄ソリューションズ株式会社 データベース検索システムおよびデータベース検索方法
JP3288063B2 (ja) * 1991-12-27 2002-06-04 新日鉄ソリューションズ株式会社 可変長データの格納および参照システム

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60205594A (ja) * 1984-03-30 1985-10-17 電子計算機基本技術研究組合 認識結果表示方式
JP3259781B2 (ja) * 1984-10-08 2002-02-25 新日鉄ソリューションズ株式会社 データベース検索システムおよびデータベース検索方法
JPS61228500A (ja) * 1985-04-03 1986-10-11 沖電気工業株式会社 音声認識方法
JPS625298A (ja) * 1985-06-29 1987-01-12 ソニー株式会社 音声認識装置
JPH03194655A (ja) * 1989-12-25 1991-08-26 Nippon Telegr & Teleph Corp <Ntt> 類似画像の蓄積および検索方法
JPH04326164A (ja) * 1991-04-25 1992-11-16 Nippon Steel Corp データベース検索システム
JPH04369696A (ja) * 1991-06-19 1992-12-22 Matsushita Electric Ind Co Ltd 音声認識方法
JPH05174067A (ja) * 1991-12-24 1993-07-13 Nippon Steel Corp データベース検索システム
JP2993539B2 (ja) * 1991-12-24 1999-12-20 新日本製鐵株式会社 データベース検索システムおよびその方法
JP3288063B2 (ja) * 1991-12-27 2002-06-04 新日鉄ソリューションズ株式会社 可変長データの格納および参照システム
JP3258063B2 (ja) * 1992-02-07 2002-02-18 新日鉄ソリューションズ株式会社 データベース検索システム及び方法
JPH06168277A (ja) * 1992-11-30 1994-06-14 Canon Inc 画像検索装置及び方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6381365B2 (en) 1997-08-22 2002-04-30 Minolta Co., Ltd. Image data processing apparatus and image data processing method
US6519360B1 (en) 1997-09-17 2003-02-11 Minolta Co., Ltd. Image processing apparatus for comparing images based on color feature information and computer program product in a memory
US6140997A (en) * 1997-09-19 2000-10-31 Minolta Co., Ltd. Color feature extracting apparatus and method therefor capable of easily transforming a RGB color space into a color space close to human sense
US6249607B1 (en) 1997-09-19 2001-06-19 Minolta Co., Ltd. Similar-image retrieving apparatus, similar-image retrieving method and program storage medium
US6480841B1 (en) 1997-09-22 2002-11-12 Minolta Co., Ltd. Information processing apparatus capable of automatically setting degree of relevance between keywords, keyword attaching method and keyword auto-attaching apparatus
US7126968B2 (en) 1999-12-09 2006-10-24 Kabushiki Kaisha Toshiba Data compression system, data decompression system, supervisory control system and computer-readable storage medium
JP2005202357A (ja) * 2003-10-24 2005-07-28 Microsoft Corp オーディオ重複検出器
US8340474B2 (en) 2006-02-06 2012-12-25 Samsung Electronics Co., Ltd. Apparatus and method of browsing contents
JP2009276776A (ja) * 2009-08-17 2009-11-26 Sony Corp 楽曲同定装置及び方法、楽曲同定配信装置及び方法
US8526735B2 (en) 2010-01-08 2013-09-03 International Business Machines Corporation Time-series analysis of keywords
EP2701075A1 (en) 2012-08-22 2014-02-26 Yokogawa Electric Corporation Method and apparatus for data similarity calculation
US9189198B2 (en) 2012-08-22 2015-11-17 Yokogawa Electric Corporation Data similarity calculation method and data similarity calculation apparatus

Also Published As

Publication number Publication date
JP3545007B2 (ja) 2004-07-21

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
CN109885692B (zh) 知识数据存储方法、装置、计算机设备和存储介质
KR100545477B1 (ko) 거리 측정기를 사용한 이미지 검색법
US6173275B1 (en) Representation and retrieval of images using context vectors derived from image information elements
US5528701A (en) Trie based method for indexing handwritten databases
US6760714B1 (en) Representation and retrieval of images using content vectors derived from image information elements
US6671683B2 (en) Apparatus for retrieving similar documents and apparatus for extracting relevant keywords
CN101138001A (zh) 学习处理方法和学习处理装置以及程序
US6973446B2 (en) Knowledge finding method
JP3545007B2 (ja) データベース検索システム
JPH07319924A (ja) 手書き電子文書のインデックス付けおよび探索方法
CN114398882A (zh) 文档处理方法、装置、设备及存储介质
JPH06168277A (ja) 画像検索装置及び方法
JP3258063B2 (ja) データベース検索システム及び方法
JP4143234B2 (ja) 文書分類装置、文書分類方法及び記憶媒体
Pengcheng et al. Fast Chinese calligraphic character recognition with large-scale data
JP3151730B2 (ja) データベース検索システム
CN107644104B (zh) 一种文本特征提取方法及系统
CN113065005B (zh) 一种基于知识图谱和文本分类模型的法律条文推荐方法
Al-Mofareji et al. WeDoCWT: A new method for web document clustering using discrete wavelet transforms
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JP2993540B2 (ja) 昇順整数列データの圧縮および復号システム
JP2735866B2 (ja) データベースのデータ検索方法
JP3288063B2 (ja) 可変長データの格納および参照システム
JP2993539B2 (ja) データベース検索システムおよびその方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040407

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110416

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120416

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 9