JP4697355B2 - データ検索装置 - Google Patents
データ検索装置 Download PDFInfo
- Publication number
- JP4697355B2 JP4697355B2 JP2010543327A JP2010543327A JP4697355B2 JP 4697355 B2 JP4697355 B2 JP 4697355B2 JP 2010543327 A JP2010543327 A JP 2010543327A JP 2010543327 A JP2010543327 A JP 2010543327A JP 4697355 B2 JP4697355 B2 JP 4697355B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- similarity
- search
- correspondence table
- skip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明はデータ検索装置に関し、特に被検索対象データ系列の中から、検索データと類似するデータを検索するデータ検索装置に関する。
記憶装置に蓄積された映像データや音響データなどの被検索対象データ系列の中から、検索データと類似するデータを検索する典型的な方法は、検索データと被検索対象データ系列中の全てのデータとの類似度を計算して、閾値と比較する方法である。しかし、一般にデータ間の類似度の計算量は多いため、被検索対象データ系列中の全てのデータと検索対象データとの類似度を計算しなければならない上記の方法では、検索に長時間を必要とする。このため、この種の検索の高速化手法が幾つか提案されている。
例えば特許文献1の背景技術の欄には、類似度が或る閾値を超えた場合に類似度計算を途中で打ち切ることで検索を高速に行う手法が記載されている。また、特許文献1では、データ系列の或る部分と別の1つまたは複数の部分との類似度を自己類似度表として計算しておき、この自己類似度表を用いて検索を高速に行う手法を提案している。
被検索対象データ系列を、図17(a)に示すように、yj,yj+1,yj+2,yj+3,yj+4,yj+5,…から構成されるデータの系列とする。この場合、例えば先頭のデータyjの自己類似度表は、図17(b)に示すように、データyjとデータyj+1との類似度d(yj,yj+1)、データyjとデータyj+2との類似度d(yj,yj+2)、データyjとデータyj+3との類似度d(yj,yj+3)、データyjとデータyj+4との類似度d(yj,yj+4)、データyjとデータyj+5との類似度d(yj,yj+5)、…を記録した表になる。ここで、類似度の数値は0以上の正の値を取り、値が小さいほど、より類似しているものとする。
今、検索データxiとの類似度が閾値th以下のデータを被検索対象データ系列から検索する場合、自己類似度表を用いる検索は以下のような手順となる。
まず、検索データxiとデータyjとの類似度を計算する。この計算された類似度をD(xi,yj)とすると、以下の式1を用いて、データyjが検索データxiの類似データか、非類似データかを判定する。すなわち、類似度D(xi,yj)が閾値th以下であれば、データyjは類似データとして出力され、閾値thより大きければ、データyjは非類似データと見做される。
[式1]
D(xi,yj)≦th
[式1]
D(xi,yj)≦th
データyjを非類似データと見做した場合、検索データxiとの類似度計算を行う次のデータを以下のようにして決定する。まず、データyjとその直後のデータyj+1との類似度d(yj,yj+1)をデータyjの自己類似度表から取得し、類似度D(xi,yj)から減算する。次に、この減算結果D(xi,yj)−d(yj,yj+1)と閾値thとを比較し、D(xi,yj)−d(yj,yj+1)≦thならば、データyj+1を、検索データxiとの類似度計算を次に行うデータとして決定する。他方、D(xi,yj)−d(yj,yj+1)>thならば、データyj+1を類似度計算の対象から除外する。その理由は、データyj+1と検索データxiとの類似度を計算したとしても、その計算結果は閾値th以下になることは理論的にあり得ないためである。データyj+1を類似度計算の対象外とした場合、さらに後続のデータについて順番にデータyj+1と同様の判定を繰り返すことにより、検索データxiとの類似度計算を次に行うデータを決定する。
このように自己類似度表を用いることで、検索データxiとの類似度を計算する必要のあるデータ数を削減することができ、その分だけ高速な検索が可能になる。
しかしながら、類似度計算を行うデータが決まるまで、データyjの後続のデータ1つ1つについて順番に、類似度の減算と閾値判定の処理が必要であり、これが更なる高速化の障害となる。
本発明の目的は、被検索対象データ系列の中から、検索データとの類似度が所定の閾値以下のデータを高速に検索することのできるデータ検索装置を提供することにある。
本発明の一形態にかかるデータ検索装置は、被検索対象データ系列中の各データに対応する表であって、対応するデータと検索データとの類似度のとりうる類似度範囲別に、検索データとの類似度が所定の閾値と比較して所定の関係になる可能性の有るデータのうち当該対応するデータ以降で最初に現れるデータを特定するスキップ先データ情報を記録した第1のスキップ対応表と、被検索対象データ系列の中から検索データとの類似度が上記閾値以下のデータを検索する際、検索データとの類似度を計算する必要のある被検索対象データ系列中のデータを、上記第1のスキップ対応表を用いて絞り込む制御手段とを備える。
本発明によれば、被検索対象データ系列の中から、検索データとの類似度が所定の閾値以下のデータを高速に検索することができる。
[第1の実施の形態]
図1を参照すると、本発明の第1の実施の形態に係るデータ検索装置100は、類似度計算部110と、制御部120と、第1のスキップ対応表生成部130と、被検索対象データ系列記憶部140と、第1のスキップ対応表記憶部150とから構成されている。
図1を参照すると、本発明の第1の実施の形態に係るデータ検索装置100は、類似度計算部110と、制御部120と、第1のスキップ対応表生成部130と、被検索対象データ系列記憶部140と、第1のスキップ対応表記憶部150とから構成されている。
被検索対象データ系列記憶部140は、1以上の被検索対象データ系列を記憶する。1つの被検索対象データ系列は、複数のデータの列で構成される。データ検索装置100が例えば動画像検索装置である場合、被検索対象データ系列は動画像の連続するフレーム画像あるいはフレーム画像の特徴ベクトルを時間順に並べた時系列信号に相当し、1つのデータが1フレーム画像あるいはその特徴ベクトルに相当する。本発明のデータ検索装置は動画像検索に限定されず、音響検索など他の種類の検索にも広く適用できる。しかし、以降では、説明の便宜上、被検索対象データ系列は、動画像の連続するフレーム画像の特徴ベクトルを時間順に並べた信号として説明を行う。
第1のスキップ対応表生成部130は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎の第1のスキップ対応表を生成する手段である。ここで、或るデータに対応する第1のスキップ対応表とは、当該データと検索データとの類似度のとりうる範囲別に、検索データとの類似度が予め設定された閾値th以下の範囲に存在する可能性のあるデータのうち当該データ以降で最初に現れるデータを特定する情報を記録した表のことである。
第1のスキップ対応表記憶部150は、第1のスキップ対応表生成部130により生成された第1のスキップ対応表を記憶する手段である。第1のスキップ対応表は、その表がどのデータに対応する表であるかが明確に区別されるように、被検索対象データ系列中のデータと関連付けて、第1のスキップ対応表記憶部150に記憶される。
類似度計算部110は、検索データと被検索対象データ系列中のデータとの類似度を計算する手段である。検索データもまた、複数のデータの列で構成されるデータ列の中の1データであってもよい。本実施の形態では、被検索対象データ系列中の各データは特徴ベクトルであり、検索データも特徴ベクトルである。類似度計算部110は、ベクトルどうしの距離(例えば、ハミング距離、ユークリッド距離、ユークリッド距離の2乗)を類似度として計算する。この場合、類似度は値が0に近いほど、より類似していることを示す。本発明において、類似度の尺度は任意であり、上記以外の計算方法による類似度を計算することも勿論可能である。
制御部120は、データ検索装置100全体の制御を司る手段である。制御部120は、データ検索装置100の外部から検索データが入力されると、類似度計算部110を用いて検索データと被検索対象データ系列中のデータとの類似度を計算し、その計算結果の類似度を予め設定された閾値thと比較することにより、当該データが検索データに類似するデータか否かを判定する。そして、当該データが検索データに類似していれば、検索結果として出力し、当該データの次のデータについて、当該データと同様の処理を繰り返す。他方、制御部120は、当該データが検索データに類似していなければ、当該データと検索データとの類似度と当該データの第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定し、この決定したデータについて、当該データと同様の処理を繰り返す。
次に本実施の形態に係るデータ検索装置100の動作を説明する。
データ検索装置100の動作は、実際のデータ検索動作の実行に先立って行われる第1のスキップ対応表生成動作と、生成された第1のスキップ対応表を用いたデータ検索動作とに大別される。
(1)第1のスキップ対応表生成動作
第1のスキップ対応表生成部130は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に、図2のフローチャートに示す流れに沿って、そのデータに対応する第1のスキップ対応表を生成する。
第1のスキップ対応表生成部130は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に、図2のフローチャートに示す流れに沿って、そのデータに対応する第1のスキップ対応表を生成する。
まず第1のスキップ対応表生成部130は、第1のスキップ対応表を生成する被検索対象データ系列中のデータに注目する(ステップS101)。ここでは、説明の便宜上、被検索対象データ系列を、図3(a)に示すように、yj,yj+1,yj+2,yj+3,yj+4,yj+5,…から構成されるデータ(本例ではn次元の特徴ベクトル)の系列とし、先頭のデータyjに注目したものとする。
次に第1のスキップ対応表生成部130は、注目中データyjとその後続のm個のデータyj+1,yj+2,…,yj+mとの類似度d(yj,yj+1),d(yj,yj+2),…,d(yj,yj+m)を計算し、計算結果を内部テーブルに保存する(ステップS102)。類似度の計算を行う後続データの数mは任意である。後続データ数mが多ければ、検索データと類似度計算するデータ数をより多く削減できる可能性があるが、スキップ対応表に必要な記憶容量は増大する。このため、両者を勘案してmの値を事前に決めておく。
第1のスキップ対応表生成部130が第1のスキップ対応表を生成する過程で使用する内部テーブルの一例を図3(b)に示す。内部テーブルは、最大m個のエントリで構成され、各エントリは、後続データ、類似度、最小値、スキップ可能条件、連続スキップ可能条件の5項目から構成されている。ステップS102では、第1のスキップ対応表生成部130は、内部テーブルの各エントリの後続データの項目に、yj+1,yj+2,…,yj+mを設定し、類似度の項目に、データyjとの類似度d(yj,yj+1),d(yj,yj+2),…,d(yj,yj+m)を設定する。
次に第1のスキップ対応表生成部130は、後続データyj+1,yj+2,…,yj+mのそれぞれについて、検索データとデータyjとの類似度D(x,yj)およびデータyjと後続データとの類似度を用いて、検索データとの類似度の最小値を計算し、内部テーブルの最小値の項目に設定する(ステップS103)。例えば、後続データyj+1の場合、データyjとの類似度がd(yj,yj+1)、データyjと検索データとの類似度がD(x,yj)であるため、検索データと後続データyj+1の類似度の最小値は、D(x,yj)−d(yj,yj+1)になる。
次に第1のスキップ対応表生成部130は、後続データyj+1,yj+2,…,yj+mのそれぞれについて、検索データとの最小値と別途与えられる閾値thとを用いて、検索データとの類似度が閾値以下になる可能性のない(検索データと類似する可能性のない)、データyjと検索データとの類似度の範囲の下限を計算し、内部テーブルのスキップ可能条件の項目に設定する(ステップS104)。例えば、後続データyj+1の場合、最小値D(x,yj)−d(yj,yj+1)でさえも、閾値thより大きければ、前述した式1に照らせば、検索データと類似する可能性はないので、D(x,yj)>th+d(yj,yj+1)が、スキップ可能条件となる。
次に第1のスキップ対応表生成部130は、後続データyj+1,yj+2,…,yj+mのそれぞれについて、自データおよび自データより先行する他の後続データのスキップ可能条件で与えられる類似度の下限の最大値を計算し、内部テーブルの連続スキップ可能条件の項目に設定する(ステップS105)。
次に第1のスキップ対応表生成部130は、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件に従って、注目中データyjの第1のスキップ対応表を生成し、第1のスキップ対応表記憶部150に保存する(ステップS106)。具体的には、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件で与えられる類似度の下限のうち、1番目に値の小さな下限を下限値、2番目に値の小さな下限を上限値とする第1の類似度範囲を生成し、注目中データyjと検索データとの類似度がこの第1の類似度範囲を満たす場合のスキップ先データとして、第1の類似度範囲の上限値に等しい連続スキップ可能条件を持つ後続データのうち最も後続のデータを設定する。次に、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件で与えられる類似度の下限のうち、2番目に値の小さな下限を下限値、3番目に値の小さな下限を上限値とする第2の類似度範囲を生成し、注目中データyjと検索データとの類似度がこの第2の類似度範囲を満たす場合のスキップ先データとして、第2の類似度範囲の上限値に等しい連続スキップ可能条件を持つ後続データのうち最も後続のデータを設定する。以下同様の処理を、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件で与えられる類似度の下限のうちの最大値を、下限値とする類似度範囲を生成するまで繰り返す。
データyjの第1のスキップ対応表を生成する過程で使用した内部テーブルの具体例を図4に、データyjの第1のスキップ対応表の具体例を図5に、それぞれ示す。この例では、閾値thを50、mを13としている。
例えば図4の内部テーブルの後続データyj+3のエントリは、データyjとの類似度が12、検索データとの類似度の最小値がD(x,yj)−12、スキップ可能条件がD(x,yj)>62、連続スキップ可能条件がD(x,yj)>64であることを示している。後続データyj+3の連続スキップ可能条件が、スキップ可能条件のD(x,yj)>62ではなく、D(x,yj)>64になる理由は、自データyj+3より先行するデータyj+2のスキップ可能条件がD(x,yj)>64になっているためである。
また、例えば図5のデータyjの第1のスキップ対応表における1つ目のエントリは、データyjと検索データとの類似度が60より大きく64以下であれば、検索対象データとの類似度を計算する次のデータは、データyj+2であることを示している。この1つ目のエントリは、図4の内部テーブルにおける後続データyj+1,yj+2の連続スキップ可能条件から生成されたデータである。
さらに、例えば図5のデータyjの第1のスキップ対応表における2つ目のエントリは、データyjと検索データとの類似度が64より大きく67以下の範囲であれば、検索対象データとの類似度を計算する次のデータは、データyj+5であることを示している。この2つ目のエントリは、図4の内部テーブルにおける後続データyj+2〜yj+5の連続スキップ可能条件から生成されたデータである。
第1のスキップ対応表生成部130は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータyj以外のデータの第1スキップ対応表についても、データyjと同様の手順で作成する。ただし、被検索対象データ系列の最後尾のデータにはその後続データが存在しないので、第1スキップ対応表は作成されない。また、最後尾のデータを除く全てのデータについて第1のスキップ対応表を作成しておくのではなく、予め指定した一部のデータについてのみ第1のスキップ対応表を作成しておくこともできる。一部のデータの例としては、偶数番目のデータ、奇数番目のデータ、p(>2)個置き毎のデータなどが考えられる。
また、第1のスキップ対応表生成部130は、図2のステップS106において生成した第1のスキップ対応表の連続する複数のエントリを1つのエントリに統合することにより、第1のスキップ対応表のエントリ数を削減する処理を施しても良い。連続する複数のエントリを統合した1つのエントリは、統合前の複数のエントリにおける類似度の範囲の下限の最小値を下限値とし、それらにおける類似度の範囲の上限の最大値を上限値とする類似度の範囲を持ち、また、統合前の複数のエントリにおけるスキップ先データのうちの最も先行するデータをスキップ先データとして持つ。例えば、図5の第1のスキップ対応表の5番目と6番目のエントリを1つのエントリに統合し、7番目と8番目のエントリと1つのエントリに統合すると、図6に示すような第1のスキップ対応表となる。
このように第1のスキップ対応表の複数のエントリを統合し、エントリ数を削減することにより、スキップ可能な最大幅を犠牲にする(本当はもう少し先までスキップできる)代わりに、第1のスキップ対応表に必要な記憶容量を削減することができる。
また、第1のスキップ対応表の複数のエントリを統合する際には、以下のような処理を行うようにしてもよい。
例えば、第1のスキップ対応表に割り当て可能な記憶容量の上限が設定されている場合に、第1のスキップ対応表の記憶容量が上限より小さくなるまで、エントリの統合によるエントリ数の削減を繰り返すようにしてもよい。
また例えば、複数のエントリを統合する際に、エントリの統合によって犠牲となる(本当はもう少し先までスキップできる)類似度の範囲が小さくなるように、統合するエントリを選択してもよい。具体例で説明すると、例えば図5の5番目と6番目のエントリを1つのエントリに統合すると、6番目のエントリの類似度の範囲である75<D≦77は犠牲になる(本当はもう少し先までスキップできる)。また、7番目と8番目のエントリを1つのエントリに統合すると、8番目のエントリの類似度の範囲である80<D≦84は犠牲になる(本当はもう少し先までスキップできる)。この両者を比較すると、前者の方が犠牲となる類似度の範囲が小さいので、統合するエントリを5番目と6番目とする方が、効率がよい。このとき、さらに、犠牲となるフレーム数を考慮したり、類似度の取りうる確率なども考慮してよい。このように、犠牲となる可能性を考慮して、第1のスキップ対応表のエントリを統合してエントリ数を削減することによって、第1のスキップ対応表の単位記憶容量に対する、第1のスキップ対応表による高速化の効率を最大化することができる。
(2)データ検索動作
制御部120は、検索データが与えられると、図7のフローチャートに示す流れに沿って、その検索データに類似するデータを被検索対象データ系列から検索する。被検索対象データ系列が複数存在する場合、それぞれの被検索対象データ系列に対して、同じ処理が繰り返される。以下では、或る1つの被検索対象データ系列に注目し、そのデータ系列中から検索データと類似するデータを検索する場合を例に、本実施の形態におけるデータ検索動作を説明する。
制御部120は、検索データが与えられると、図7のフローチャートに示す流れに沿って、その検索データに類似するデータを被検索対象データ系列から検索する。被検索対象データ系列が複数存在する場合、それぞれの被検索対象データ系列に対して、同じ処理が繰り返される。以下では、或る1つの被検索対象データ系列に注目し、そのデータ系列中から検索データと類似するデータを検索する場合を例に、本実施の形態におけるデータ検索動作を説明する。
制御部120は、被検索対象データ系列の先頭から何番目のデータを処理の対象としているかを管理する変数jを1に初期設定し(ステップS111)、1番目のデータと検索データとの類似度を類似度計算部110により計算する(ステップS112)。
1番目のデータと検索データとの類似度が、閾値th以下であれば(ステップS113でYES)、1番目のデータを類似データとして出力する(ステップS114)。そして、変数jを+1して2とし(ステップS115)、ステップS119経由でステップS112に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
他方、1番目のデータと検索データとの類似度が、閾値thより大きければ(ステップS113でNO)、1番目のデータに対応する第1のスキップ対応表が記憶部150に記憶されているか否かを調べる(ステップS116)。若し、無ければ、変数jを+1して2とし(ステップS115)、ステップS119経由でステップS112に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第1のスキップ対応表が有れば、1番目のデータと検索データとの類似度を含む類似度範囲がその第1のスキップ対応表に存在するか否かを調べる(ステップS117)。若し、存在しなければ、変数jを+1して2とし(ステップS115)、ステップS119経由でステップS112に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第1のスキップ対応表に、1番目のデータと検索データとの類似度を含む類似度範囲が存在すれば、その類似度範囲に対応して記録されているスキップ先データを次に類似度計算するデータに設定して(つまり、変数jがスキップ先データを示すように変更して)(ステップS118)、ステップS119経由でステップS112に戻り、スキップ先データについて、1番目のデータと同様の処理を繰り返す。
ステップS119では、変更後のjの値が、被検索対象データ系列のデータ数の最大値jmaxを超えているか否かを判定し、若し超えていなければ、制御をステップS112に移し、若し超えていれば、当該被検索対象データ系列に対する検索処理を終了する。
このように本実施の形態によれば、被検索対象データ系列の中から、検索データとの類似度が所定の閾値以下のデータを高速に検索することができる。その理由は、被検索対象データ系列中の或るデータと検索データとの類似度が閾値より大きくなった場合、当該或るデータに対応する第1のスキップ対応表を参照することにより、類似度計算が不要なデータをスキップすることができるためである。
例えば、検索対象データ系列中のデータyjと検索データとの類似度が72であった場合、データyjに対応する図5または図6の第1のスキップ対応表によれば、スキップ先データはj+7である。このため、検索対象データ系列中のデータyj+1,yj+2,yj+3,yj+4,yj+5,yj+6の6個のデータについては、検索データとの類似度計算は行われないので、その分だけ検索時間が短縮される。また、データyj+1,yj+2,yj+3,yj+4,yj+5,yj+6のそれぞれについて個別に、検索データとの類似度計算の必要性を判定する必要がないため、その分だけより一層、検索時間の短縮が可能になる。
なお、本実施の形態では、閾値thは1種類に固定されているが、閾値thが複数存在するデータ検索装置にも適用可能である。その場合、それぞれの閾値thに関連付けて、その閾値用の第1のスキップ対応表を生成して記憶しておく。例えば、閾値thが、50、60、70の3種類ある場合、th=50の第1のスキップ対応表、th=60の第1のスキップ対応表、th=70の第1のスキップ対応表を生成して記憶しておけばよい。
[第2の実施の形態]
図8を参照すると、本発明の第2の実施の形態に係るデータ検索装置200は、第1の実施の形態に係るデータ検索装置100と比較して、制御部120、第1のスキップ対応表生成部130および第1のスキップ対応表記憶部150の代わりに、制御部220、第2のスキップ対応表生成部230および第2のスキップ対応表記憶部250を備えている点で相違する。
図8を参照すると、本発明の第2の実施の形態に係るデータ検索装置200は、第1の実施の形態に係るデータ検索装置100と比較して、制御部120、第1のスキップ対応表生成部130および第1のスキップ対応表記憶部150の代わりに、制御部220、第2のスキップ対応表生成部230および第2のスキップ対応表記憶部250を備えている点で相違する。
第2のスキップ対応表生成部230は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎の第2のスキップ対応表を生成する手段である。ここで、或るデータに対応する第2のスキップ対応表とは、当該データと検索データとの類似度のとりうる範囲別に、検索データとの類似度が予め設定された閾値thより大きくなる可能性の有るデータのうち当該データ以降で最初に現れるデータを特定する情報を記録した表のことである。
第2のスキップ対応表記憶部250は、第2のスキップ対応表生成部230により生成された第2のスキップ対応表を記憶する手段である。第2のスキップ対応表は、その表がどのデータに対応する表であるかが明確に区別されるように、被検索対象データ系列中のデータと関連付けて、第2のスキップ対応表記憶部250に記憶される。
制御部220は、データ検索装置200全体の制御を司る手段である。制御部220は、データ検索装置200の外部から検索データが入力されると、類似度計算部110を用いて検索データと被検索対象データ系列中のデータとの類似度を計算し、その計算結果の類似度を予め設定された閾値thと比較することにより、当該データが検索データに類似するデータか否かを判定する。そして、当該データが検索データに類似していれば、検索結果として出力し、当該データと検索データとの類似度と当該データの第2のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定する。そして、この決定したデータが、当該データの次のデータでなければ、当該データの次のデータから、前記決定したデータの直前のデータまでを検索データに類似するデータとして出力し、前記決定したデータについて、当該データと同様の処理を繰り返す。他方、制御部120は、当該データが検索データに類似していなければ、当該データの次のデータについて、当該データと同様の処理を繰り返す。
次に本実施の形態に係るデータ検索装置200の動作を説明する。
データ検索装置200の動作は、実際のデータ検索動作の実行に先立って行われる第2のスキップ対応表生成動作と、生成された第2のスキップ対応表を用いたデータ検索動作とに大別される。
(1)第2のスキップ対応表生成動作
第2のスキップ対応表生成部230は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に、図9のフローチャートに示す流れに沿って、そのデータに対応する第2のスキップ対応表を生成する。
第2のスキップ対応表生成部230は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に、図9のフローチャートに示す流れに沿って、そのデータに対応する第2のスキップ対応表を生成する。
まず第2のスキップ対応表生成部230は、第2のスキップ対応表を生成する被検索対象データ系列中のデータに注目する(ステップS201)。ここでは、説明の便宜上、被検索対象データ系列を、図10(a)に示すように、yj,yj+1,yj+2,yj+3,yj+4,yj+5,…から構成されるデータ(本例ではn次元の特徴ベクトル)の系列とし、先頭のデータyjに注目したものとする。
次に第2のスキップ対応表生成部230は、注目中データyjとその後続のm個のデータyj+1,yj+2,…,yj+mとの類似度d(yj,yj+1),d(yj,yj+2),…,d(yj,yj+m)を計算し、計算結果を内部テーブルに保存する(ステップS202)。類似度の計算を行う後続データの数mは任意である。後続データ数mが多ければ、検索データと類似度計算するデータ数をより多く削減できる可能性があるが、スキップ対応表に必要な記憶容量は増大する。このため、両者を勘案してmの値を事前に決めておく。
第2のスキップ対応表生成部230が第2のスキップ対応表を生成する過程で使用する内部テーブルの一例を図10(b)に示す。内部テーブルは、最大m個のエントリで構成され、各エントリは、後続データ、類似度、最大値、スキップ可能条件、連続スキップ可能条件の5項目から構成されている。ステップS202では、第2のスキップ対応表生成部230は、内部テーブルの各エントリの後続データの項目に、yj+1,yj+2,…,yj+mを設定し、類似度の項目に、データyjとの類似度d(yj,yj+1),d(yj,yj+2),…,d(yj,yj+m)を設定する。
次に第2のスキップ対応表生成部230は、後続データyj+1,yj+2,…,yj+mのそれぞれについて、検索データとデータyjとの類似度D(x,yj)およびデータyjと後続データとの類似度を用いて、検索データとの類似度の最大値を計算し、内部テーブルの最大値の項目に設定する(ステップS203)。例えば、後続データyj+1の場合、データyjとの類似度がd(yj,yj+1)、データyjと検索データとの類似度がD(x,yj)であるため、検索データと後続データyj+1の類似度の最大値は、D(x,yj)+d(yj,yj+1)になる。
次に第2のスキップ対応表生成部230は、後続データyj+1,yj+2,…,yj+mのそれぞれについて、検索データとの最大値と別途与えられる閾値thとを用いて、検索データとの類似度が閾値より大きくなる可能性の無い(検索データと類似しない可能性の無い)、データyjと検索データとの類似度の範囲の上限を計算し、内部テーブルのスキップ可能条件の項目に設定する(ステップS204)。例えば、後続データyj+1の場合、最大値D(x,yj)+d(yj,yj+1)でさえも、閾値th以下であれば、検索データと類似しない可能性はないので、D(x,yj)≦th−d(yj,yj+1)が、スキップ可能条件となる。
次に第2のスキップ対応表生成部230は、後続データyj+1,yj+2,…,yj+mのそれぞれについて、自データおよび自データより先行する他の後続データのスキップ可能条件で与えられる類似度の上限の最小値を計算し、内部テーブルの連続スキップ可能条件の項目に設定する(ステップS205)。
次に第2のスキップ対応表生成部230は、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件に従って、注目中データyjの第2のスキップ対応表を生成し、第2のスキップ対応表記憶部250に保存する(ステップS206)。具体的には、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件で与えられる類似度の上限のうち、1番目に値の大きな上限を上限値、2番目に値の大きな上限を下限値とする第1の類似度範囲を生成し、注目中データyjと検索データとの類似度がこの第1の類似度範囲を満たす場合のスキップ先データとして、第1の類似度範囲の下限値に等しい連続スキップ可能条件を持つ後続データのうち最も後続のデータを設定する。次に、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件で与えられる類似度の上限のうち、2番目に値の大きな上限を上限値、3番目に値の大きな上限を下限値とする第2の類似度範囲を生成し、注目中データyjと検索データとの類似度がこの第2の類似度範囲を満たす場合のスキップ先データとして、第2の類似度範囲の下限値に等しい連続スキップ可能条件を持つ後続データのうち最も後続のデータを設定する。以下同様の処理を、後続データyj+1,yj+2,…,yj+mの連続スキップ可能条件で与えられる類似度の上限のうちの最小値を、下限値とする類似度範囲を生成するまで繰り返す。
データyjの第1のスキップ対応表を生成する過程で使用した内部テーブルの具体例を図11に、データyjの第2のスキップ対応表の具体例を図12に、それぞれ示す。この例では、閾値thを50、mを13としている。
例えば図11の内部テーブルの後続データyj+3のエントリは、データyjとの類似度が12、検索データとの類似度の最大値がD(x,yj)+12、スキップ可能条件がD(x,yj)≦38、連続スキップ可能条件がD(x,yj)≦36であることを示している。後続データyj+3の連続スキップ可能条件が、スキップ可能条件のD(x,yj)≦38ではなく、D(x,yj)≦36になる理由は、自データyj+3より先行するデータyj+2のスキップ可能条件がD(x,yj)≦36になっているためである。
また、例えば図12のデータyjの第2のスキップ対応表における1つ目のエントリは、データyjと検索データとの類似度が36より大きく40以下であれば、検索対象データとの類似度を計算する次のデータは、データyj+2であることを示している。この1つ目のエントリは、図11の内部テーブルにおける後続データyj+1,yj+2の連続スキップ可能条件から生成されたデータである。
さらに、例えば図12のデータyjの第1のスキップ対応表における2つ目のエントリは、データyjと検索データとの類似度が33より大きく36以下の範囲であれば、検索対象データとの類似度を計算する次のデータは、データyj+5であることを示している。この2つ目のエントリは、図11の内部テーブルにおける後続データyj+2〜yj+5の連続スキップ可能条件から生成されたデータである。
第2のスキップ対応表生成部230は、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータyj以外のデータの第2スキップ対応表についても、データyjと同様の手順で作成する。ただし、被検索対象データ系列の最後尾のデータにはその後続データが存在しないので、第2スキップ対応表は作成されない。また、最後尾のデータを除く全てのデータについて第2のスキップ対応表を作成しておくのではなく、予め指定した一部のデータについてのみ第2のスキップ対応表を作成しておくこともできる。一部のデータの例としては、偶数番目のデータ、奇数番目のデータ、p(>2)個置き毎のデータなどが考えられる。
また、第2のスキップ対応表生成部230は、図9のステップS206において生成した第2のスキップ対応表の連続する複数のエントリを1つのエントリに統合することにより、第2のスキップ対応表のエントリ数を削減する処理を施しても良い。連続する複数のエントリを統合した1つのエントリは、統合前の複数のエントリにおける類似度の範囲の下限の最小値を下限値とし、それらにおける類似度の範囲の上限の最大値を上限値とする類似度の範囲を持ち、また、統合前の複数のエントリにおけるスキップ先データのうちの最も先行するデータをスキップ先データとして持つ。例えば、図12の第2のスキップ対応表の5番目と6番目のエントリを1つのエントリに統合し、7番目と8番目のエントリと1つのエントリに統合すると、図13に示すような第1のスキップ対応表となる。
このように第2のスキップ対応表の複数のエントリを統合し、エントリ数を削減することにより、スキップ可能な最大幅を犠牲にする(本当はもう少し先までスキップできる)代わりに、第2のスキップ対応表に必要な記憶容量を削減することができる。
また、第2のスキップ対応表の複数のエントリを統合する際には、以下のような処理を行うようにしてもよい。
例えば、第2のスキップ対応表に割り当て可能な記憶容量の上限が設定されている場合に、第2のスキップ対応表の記憶容量が上限より小さくなるまで、エントリの統合によるエントリ数の削減を繰り返すようにしてもよい。
また例えば、複数のエントリを統合する際に、エントリの統合によって犠牲となる(本当はもう少し先までスキップできる)類似度の範囲が小さくなるように、統合するエントリを選択してもよい。具体例で説明すると、例えば図12の5番目と6番目のエントリを1つのエントリに統合すると、6番目のエントリの類似度の範囲である23<D≦25は犠牲になる(本当はもう少し先までスキップできる)。また、7番目と8番目のエントリを1つのエントリに統合すると、8番目のエントリの類似度の範囲である16<D≦20は犠牲になる(本当はもう少し先までスキップできる)。この両者を比較すると、前者の方が犠牲となる類似度の範囲が小さいので、統合するエントリを5番目と6番目とする方がよい。このとき、さらに、犠牲となるフレーム数を考慮したり、類似度の取りうる確率なども考慮してよい。このように、犠牲となる可能性を考慮して、第2のスキップ対応表のエントリを統合してエントリ数を削減することによって、第2のスキップ対応表の単位記憶容量に対する、第2のスキップ対応表による高速化の効率を最大化することができる。
(2)データ検索動作
制御部220は、検索データが与えられると、図14のフローチャートに示す流れに沿って、その検索データに類似するデータを被検索対象データ系列から検索する。被検索対象データ系列が複数存在する場合、それぞれの被検索対象データ系列に対して、同じ処理が繰り返される。以下では、或る1つの被検索対象データ系列に注目し、そのデータ系列中から検索データと類似するデータを検索する場合を例に、本実施の形態におけるデータ検索動作を説明する。
制御部220は、検索データが与えられると、図14のフローチャートに示す流れに沿って、その検索データに類似するデータを被検索対象データ系列から検索する。被検索対象データ系列が複数存在する場合、それぞれの被検索対象データ系列に対して、同じ処理が繰り返される。以下では、或る1つの被検索対象データ系列に注目し、そのデータ系列中から検索データと類似するデータを検索する場合を例に、本実施の形態におけるデータ検索動作を説明する。
制御部220は、被検索対象データ系列の先頭から何番目のデータを処理の対象としているかを管理する変数jを1に初期設定し(ステップS211)、1番目のデータと検索データとの類似度を類似度計算部110により計算する(ステップS212)。
1番目のデータと検索データとの類似度が、閾値th以下であれば(ステップS213でYES)、1番目のデータを類似データとして出力する(ステップS215)。続いて、1番目のデータに対応する第2のスキップ対応表が記憶部250に記憶されているか否かを調べる(ステップS216)。若し、無ければ、変数jを+1して2とし(ステップS214)、ステップS221経由でステップS212に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第2のスキップ対応表が有れば、1番目のデータと検索データとの類似度を含む類似度範囲がその第2のスキップ対応表に存在するか否かを調べる(ステップS217)。若し、存在しなければ、変数jを+1して2とし(ステップS214)、ステップS221経由でステップS212に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第2のスキップ対応表に、1番目のデータと検索データとの類似度を含む類似度範囲が存在すれば、その類似度範囲に対応して記録されているスキップ先データが現在処理しているデータの次のデータであるか否かを判定する(ステップS218)。若し、スキップ先データが現在処理しているデータの次のデータでない場合(つまり、幾つかのデータをスキップする場合)、現在処理しているデータの次のデータからスキップ先データの直前のデータまでを、類似データとして出力する(ステップS219)。そして、スキップ先データを次に類似度計算するデータに設定して(つまり、変数jがスキップ先データを示すように変更して)(ステップS220)、ステップS221経由でステップS212に戻り、スキップ先データについて、1番目のデータと同様の処理を繰り返す。また、スキップ先データが現在処理しているデータの次のデータであれば、ステップS219を実行せずに、スキップ先データを次に類似度計算するデータに設定して(つまり、変数jがスキップ先データを示すように変更して)(ステップS220)、ステップS221経由でステップS212に戻り、スキップ先データについて、1番目のデータと同様の処理を繰り返す。
一方、1番目のデータと検索データとの類似度が、閾値thより大きければ(ステップS213でNO)、変数jを+1して2とし(ステップS214)、ステップS221経由でステップS212に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
ステップS221では、変更後のjの値が、被検索対象データ系列のデータ数の最大値jmaxを超えているか否かを判定し、若し超えていなければ、制御をステップS112に移し、若し超えていれば、当該被検索対象データ系列に対する検索処理を終了する。
このように本実施の形態によれば、被検索対象データ系列の中から、検索データとの類似度が所定の閾値以下のデータを高速に検索することができる。その理由は、被検索対象データ系列中の或るデータと検索データとの類似度が閾値以下になった場合、当該或るデータに対応する第2のスキップ対応表を参照することにより、類似度計算が不要なデータをスキップすることができるためである。
例えば、検索対象データ系列中のデータyjと検索データとの類似度が28であった場合、データyjに対応する図12または図13の第2のスキップ対応表によれば、スキップ先データはj+7である。このため、検索対象データ系列中のデータyj+1,yj+2,yj+3,yj+4,yj+5,yj+6の6個のデータについては、検索データとの類似度計算は行われないので、その分だけ検索時間が短縮される。また、データyj+1,yj+2,yj+3,yj+4,yj+5,yj+6のそれぞれについて個別に、検索データとの類似度計算の必要性を判定する必要がないため、その分だけより一層、検索時間の短縮が可能になる。
なお、本実施の形態では、閾値thは1種類に固定されているが、閾値thが複数存在するデータ検索装置にも適用可能である。その場合、それぞれの閾値thに関連付けて、その閾値用の第2のスキップ対応表を生成して記憶しておく。例えば、閾値thが、50、60、70の3種類ある場合、th=50の第2のスキップ対応表、th=60の第2のスキップ対応表、th=70の第2のスキップ対応表を生成して記憶しておけばよい。
[第3の実施の形態]
図15を参照すると、本発明の第3の実施の形態に係るデータ検索装置300は、第1の実施の形態に係るデータ検索装置100と比較して、第2のスキップ対応表生成部230と第2のスキップ対応表記憶部250とを新たに備え、また、制御部120の代わりに制御部320を備えている点で相違する。
図15を参照すると、本発明の第3の実施の形態に係るデータ検索装置300は、第1の実施の形態に係るデータ検索装置100と比較して、第2のスキップ対応表生成部230と第2のスキップ対応表記憶部250とを新たに備え、また、制御部120の代わりに制御部320を備えている点で相違する。
第2のスキップ対応表生成部230は、第2の実施の形態における第2のスキップ対応表生成部230と全く同じものであり、被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎の第2のスキップ対応表を生成する手段である。また、第2のスキップ対応表記憶部250は、第2の実施の形態における第2のスキップ対応表記憶部250と全く同じものであり、第2のスキップ対応表生成部230により生成された第2のスキップ対応表を記憶する手段である。
制御部320は、データ検索装置200全体の制御を司る手段である。制御部320は、データ検索装置300の外部から検索データが入力されると、類似度計算部110を用いて検索データと被検索対象データ系列中のデータとの類似度を計算し、その計算結果の類似度を予め設定された閾値thと比較することにより、当該データが検索データに類似するデータか否かを判定する。
制御部320は、当該データが検索データに類似していなければ、当該データと検索データとの類似度と当該データの第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定し、この決定したデータについて、当該データと同様の処理を繰り返す。
また制御部320は、当該データが検索データに類似していれば、検索結果として出力し、当該データと検索データとの類似度と当該データの第2のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定する。そして、この決定したデータが、当該データの次のデータでなければ、当該データの次のデータから、前記決定したデータの直前のデータまでを検索データに類似するデータとして出力し、前記決定したデータについて、当該データと同様の処理を繰り返す。
次に本実施の形態に係るデータ検索装置300の動作を説明する。
データ検索装置300の動作は、実際のデータ検索動作の実行に先立って行われる第1および第2のスキップ対応表生成動作と、生成された第1および第2のスキップ対応表を用いたデータ検索動作とに大別される。
(1)第1および第2のスキップ対応表生成動作
第1のスキップ対応表生成部130が被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に第1のスキップ対応表を生成する動作は、既に詳細な動作を説明した第1の実施の形態における第1のスキップ対応表生成部130と同じであるため、その説明は省略する。
第1のスキップ対応表生成部130が被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に第1のスキップ対応表を生成する動作は、既に詳細な動作を説明した第1の実施の形態における第1のスキップ対応表生成部130と同じであるため、その説明は省略する。
第2のスキップ対応表生成部230が被検索対象データ系列記憶部140に記憶された被検索対象データ系列中のデータ毎に第2のスキップ対応表を生成する動作は、既に詳細な動作を説明した第2の実施の形態における第2のスキップ対応表生成部230と同じであるため、その説明は省略する。
(2)データ検索動作
制御部320は、検索データが与えられると、図16のフローチャートに示す流れに沿って、その検索データに類似するデータを被検索対象データ系列から検索する。被検索対象データ系列が複数存在する場合、それぞれの被検索対象データ系列に対して、同じ処理が繰り返される。以下では、或る1つの被検索対象データ系列に注目し、そのデータ系列中から検索データと類似するデータを検索する場合を例に、本実施の形態におけるデータ検索動作を説明する。
制御部320は、検索データが与えられると、図16のフローチャートに示す流れに沿って、その検索データに類似するデータを被検索対象データ系列から検索する。被検索対象データ系列が複数存在する場合、それぞれの被検索対象データ系列に対して、同じ処理が繰り返される。以下では、或る1つの被検索対象データ系列に注目し、そのデータ系列中から検索データと類似するデータを検索する場合を例に、本実施の形態におけるデータ検索動作を説明する。
制御部320は、被検索対象データ系列の先頭から何番目のデータを処理の対象としているかを管理する変数jを1に初期設定し(ステップS311)、1番目のデータと検索データとの類似度を類似度計算部110により計算する(ステップS312)。
1番目のデータと検索データとの類似度が、閾値thより大きければ(ステップS313でNO)、1番目のデータに対応する第1のスキップ対応表が記憶部150に記憶されているか否かを調べる(ステップS314)。若し、無ければ、変数jを+1して2とし(ステップS317)、ステップS324経由でステップS312に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第1のスキップ対応表が有れば、1番目のデータと検索データとの類似度を含む類似度範囲がその第1のスキップ対応表に存在するか否かを調べる(ステップS315)。若し、存在しなければ、変数jを+1して2とし(ステップS317)、ステップS324経由でステップS312に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第1のスキップ対応表に、1番目のデータと検索データとの類似度を含む類似度範囲が存在すれば、その類似度範囲に対応して記録されているスキップ先データを次に類似度計算するデータに設定して(つまり、変数jがスキップ先データを示すように変更して)(ステップS316)、ステップS324経由でステップS312に戻り、スキップ先データについて、1番目のデータと同様の処理を繰り返す。
他方、1番目のデータと検索データとの類似度が、閾値th以下であれば(ステップS313でYES)、1番目のデータを類似データとして出力する(ステップS318)。続いて、1番目のデータに対応する第2のスキップ対応表が記憶部250に記憶されているか否かを調べる(ステップS319)。若し、無ければ、変数jを+1して2とし(ステップS317)、ステップS324経由でステップS312に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第2のスキップ対応表が有れば、1番目のデータと検索データとの類似度を含む類似度範囲がその第2のスキップ対応表に存在するか否かを調べる(ステップS320)。若し、存在しなければ、変数jを+1して2とし(ステップS317)、ステップS324経由でステップS312に戻り、2番目のデータを次に類似度計算するデータに設定して、1番目のデータと同様の処理を繰り返す。
1番目のデータに対応する第2のスキップ対応表に、1番目のデータと検索データとの類似度を含む類似度範囲が存在すれば、その類似度範囲に対応して記録されているスキップ先データが現在処理しているデータの次のデータであるか否かを判定する(ステップS321)。若し、スキップ先データが現在処理しているデータの次のデータでない場合(つまり、幾つかのデータをスキップする場合)、現在処理しているデータの次のデータからスキップ先データの直前のデータまでを、類似データとして出力する(ステップS322)。そして、スキップ先データを次に類似度計算するデータに設定して(つまり、変数jがスキップ先データを示すように変更して)(ステップS323)、ステップS324経由でステップS312に戻り、スキップ先データについて、1番目のデータと同様の処理を繰り返す。また、スキップ先データが現在処理しているデータの次のデータであれば、ステップS322を実行せずに、スキップ先データを次に類似度計算するデータに設定して(つまり、変数jがスキップ先データを示すように変更して)(ステップS323)、ステップS324経由でステップS312に戻り、スキップ先データについて、1番目のデータと同様の処理を繰り返す。
ステップS324では、変更後のjの値が、被検索対象データ系列のデータ数の最大値jmaxを超えているか否かを判定し、若し超えていなければ、制御をステップS312に移し、若し超えていれば、当該被検索対象データ系列に対する検索処理を終了する。
このように本実施の形態によれば、被検索対象データ系列の中から、検索データとの類似度が所定の閾値以下のデータを高速に検索することができる。
その第1の理由は、被検索対象データ系列中の或るデータと検索データとの類似度が閾値より大きくなった場合、当該或るデータに対応する第1のスキップ対応表を参照することにより、類似度計算が不要なデータをスキップすることができるためである。
例えば、検索対象データ系列中のデータyjと検索データとの類似度が72であった場合、データyjに対応する図5または図6の第1のスキップ対応表によれば、スキップ先データはj+7である。このため、検索対象データ系列中のデータyj+1,yj+2,yj+3,yj+4,yj+5,yj+6の6個のデータについては、検索データとの類似度計算は行われないので、その分だけ検索時間が短縮される。また、データyj+1,yj+2,yj+3,yj+4,yj+5,yj+6のそれぞれについて個別に、検索データとの類似度計算の必要性を判定する必要がないため、その分だけより一層、検索時間の短縮が可能になる。
第2の理由は、被検索対象データ系列中の或るデータと検索データとの類似度が閾値以下になった場合、当該或るデータに対応する第2のスキップ対応表を参照することにより、類似度計算が不要なデータをスキップすることができるためである。
例えば、検索対象データ系列中のデータyjと検索データとの類似度が28であった場合、データyjに対応する図12または図13の第2のスキップ対応表によれば、スキップ先データはj+7である。このため、検索対象データ系列中のデータyj+1,yj+2,yj+3,yj+4,yj+5,yj+6の6個のデータについては、検索データとの類似度計算は行われないので、その分だけ検索時間が短縮される。また、データyj+1,yj+2,yj+3,yj+4,yj+5,yj+6のそれぞれについて個別に、検索データとの類似度計算の必要性を判定する必要がないため、その分だけより一層、検索時間の短縮が可能になる。
なお、本実施の形態では、閾値thは1種類に固定されているが、閾値thが複数存在するデータ検索装置にも適用可能である。その場合、それぞれの閾値thに関連付けて、その閾値用の第1および第2のスキップ対応表を生成して記憶しておく。例えば、閾値thが、50、60、70の3種類ある場合、th=50の第1および第2のスキップ対応表、th=60の第1および第2のスキップ対応表、th=70の第1および第2のスキップ対応表を生成して記憶しておけばよい。
以上本発明の実施の形態について説明したが、本発明は以上の実施の形態にのみ限定されるものではない。本発明の構成や詳細には、本発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、本発明のデータ検索装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における類似度計算部、制御部、第1のスキップ対応表生成部、第2のスキップ対応表生成部などとして機能させる。
なお、本発明は、日本国にて2009年1月23日に特許出願された特願2009−12811の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。
100、200、300…データ検索装置
110…類似度計算部
120、220、320…制御部
130…第1のスキップ対応表生成部
140…被検索対象データ系列記憶部
150…第1のスキップ対応表記憶部
230…第2のスキップ対応表生成部
250…第2のスキップ対応表記憶部
110…類似度計算部
120、220、320…制御部
130…第1のスキップ対応表生成部
140…被検索対象データ系列記憶部
150…第1のスキップ対応表記憶部
230…第2のスキップ対応表生成部
250…第2のスキップ対応表記憶部
Claims (43)
- 被検索対象データ系列中の各データに対応する表であって、対応するデータと検索データとの類似度のとりうる類似度範囲別に、検索データとの類似度が所定の閾値と比較して所定の関係になる可能性の有るデータのうち当該対応するデータ以降で最初に現れるデータを特定するスキップ先データ情報を記録した第1のスキップ対応表と、
被検索対象データ系列の中から検索データとの類似度が前記閾値以下のデータを検索する際、検索データとの類似度を計算する必要のある被検索対象データ系列中のデータを、前記第1のスキップ対応表を用いて絞り込む制御手段とを備えることを特徴とするデータ検索装置。 - 前記所定の関係とは、検索データとの類似度が前記閾値以下になる関係である
ことを特徴とする請求項1に記載のデータ検索装置。 - 前記制御手段は、被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下でなかった場合に、当該計算された類似度と前記或るデータに対応する第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定することを特徴とする請求項2に記載のデータ検索装置。
- 前記制御手段は、前記或るデータと検索データとの類似度を含む類似度範囲が前記第1のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定することを特徴とする請求項3に記載のデータ検索装置。
- 前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第1のスキップ対応表を生成する第1のスキップ対応表生成手段を備えることを特徴とする請求項2乃至4の何れか1項に記載のデータ検索装置。
- 前記第1のスキップ対応表生成手段は、前記第1のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値以下になる可能性が無い、生成対象データと検索データとの類似度の下限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の下限の最大値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第1のスキップ対応表を生成することを特徴とする請求項5に記載のデータ検索装置。
- 前記所定の関係とは、検索データとの類似度が前記閾値より大きくなる関係である
ことを特徴とする請求項1に記載のデータ検索装置。 - 前記制御手段は、被検索対象データ系列中の或るデータについて計算した検索データと
の類似度が前記閾値以下であった場合に、当該計算された類似度と前記或るデータに対応する第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定することを特徴とする請求項7に記載のデータ検索装置。 - 前記制御手段は、前記或るデータと検索データとの類似度を含む類似度範囲が前記第1のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定することを特徴とする請求項8に記載のデータ検索装置。
- 前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第1のスキップ対応表を生成する第1のスキップ対応表生成手段を備えることを特徴とする請求項7乃至9の何れか1項に記載のデータ検索装置。
- 前記第1のスキップ対応表生成手段は、前記第1のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値より大きくなる可能性が無い、生成対象データと検索データとの類似度の上限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の上限の最小値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第1のスキップ対応表を生成することを特徴とする請求項10に記載のデータ検索装置。
- 前記第1のスキップ対応表生成手段は、前記生成した第1のスキップ対応表の連続する複数の類似度範囲を1つの類似度範囲に統合し、統合後の類似度範囲に対応するスキップ先データとして、統合前の類似度範囲に対応するスキップ先データのうちの最も先行するデータを割り当てることを特徴とする請求項6または11に記載のデータ検索装置。
- 前記第1のスキップ対応表生成手段は、被検索対象データ系列中のうちの一部のデータについてのみ、前記第1のスキップ対応表を作成することを特徴とする請求項4、5、6、10、11、または12に記載のデータ検索装置。
- 被検索対象データ系列中の各データに対応する表であって、対応するデータと検索データとの類似度のとりうる類似度範囲別に、検索データとの類似度が前記閾値との関係で前記所定の関係にならない可能性の有るデータのうち当該対応するデータ以降で最初に現れるデータを特定するスキップ先データ情報を記録した第2のスキップ対応表を備え、
前記制御手段は、検索データとの類似度を計算する必要のある被検索対象データ系列中のデータを、前記第1および第2のスキップ対応表を用いて絞り込む
ことを特徴とする請求項2記載のデータ検索装置。 - 前記制御手段は、
被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下でなかった場合に、当該計算された類似度と前記或るデータに対応する第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定し、
被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下であった場合に、当該計算された類似度と前記或るデータに対応する第2のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定することを特徴とする請求項14に記載のデータ検索装置。 - 前記制御手段は、
前記或るデータと検索データとの類似度を含む類似度範囲が前記第1のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定し、
前記或るデータと検索データとの類似度を含む類似度範囲が前記第2のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定することを特徴とする請求項15に記載のデータ検索装置。 - 前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第1のスキップ対応表を生成する第1のスキップ対応表生成手段と、
前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第2のスキップ対応表を生成する第2のスキップ対応表生成手段を備えることを特徴とする請求項14乃至16の何れか1項に記載のデータ検索装置。 - 前記第1のスキップ対応表生成手段は、前記第1のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値以下になる可能性が無い、生成対象データと検索データとの類似度の下限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の下限の最大値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第1のスキップ対応表を生成し、
前記第2のスキップ対応表生成手段は、前記第2のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値よりも大きくなる可能性が無い、生成対象データと検索データとの類似度の上限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の上限の最小値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第2のスキップ対応表を生成することを特徴とする請求項17に記載のデータ検索装置。 - 前記第1のスキップ対応表生成手段は、前記生成した第1のスキップ対応表の連続する複数の類似度範囲を1つの類似度範囲に統合し、統合後の類似度範囲に対応するスキップ先データとして、統合前の類似度範囲に対応するスキップ先データのうちの最も先行するデータを割り当て、
前記第2のスキップ対応表生成手段は、前記生成した第2のスキップ対応表の連続する複数の類似度範囲を1つの類似度範囲に統合し、統合後の類似度範囲に対応するスキップ先データとして、統合前の類似度範囲に対応するスキップ先データのうちの最も先行するデータを割り当てることを特徴とする請求項18に記載のデータ検索装置。 - 前記第1のスキップ対応表生成手段は、被検索対象データ系列中のうちの一部のデータについてのみ、前記第1のスキップ対応表を作成し、
前記第2のスキップ対応表生成手段は、被検索対象データ系列中のうちの一部のデータについてのみ、前記第2のスキップ対応表を作成することを特徴とする請求項17乃至19の何れか1項に記載のデータ検索装置。 - 前記データは、特徴ベクトルであり、
前記類似度は、特徴ベクトルどうしの距離である
ことを特徴とする請求項1乃至20の何れか1項に記載のデータ検索装置。 - 被検索対象データ系列中の各データに対応する表であって、対応するデータと検索データとの類似度のとりうる類似度範囲別に、検索データとの類似度が所定の閾値と比較して所定の関係になる可能性の有るデータのうち当該対応するデータ以降で最初に現れるデータを特定するスキップ先データ情報を記録した第1のスキップ対応表を用いて、被検索対象データ系列の中から検索データとの類似度が前記閾値以下のデータを検索する際、検索データとの類似度を計算する必要のある被検索対象データ系列中のデータを絞り込む
ことを特徴とするデータ検索方法。 - 前記所定の関係とは、検索データとの類似度が前記閾値以下になる関係である
ことを特徴とする請求項22に記載のデータ検索方法。 - 前記絞り込みでは、被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下でなかった場合に、当該計算された類似度と前記或るデータに対応する第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定する
ことを特徴とする請求項23に記載のデータ検索方法。 - 前記絞り込みでは、前記或るデータと検索データとの類似度を含む類似度範囲が前記第1のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定する
ことを特徴とする請求項24に記載のデータ検索方法。 - 前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第1のスキップ対応表を生成する
ことを特徴とする請求項23乃至25の何れか1項に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、前記第1のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値以下になる可能性が無い、生成対象データと検索データとの類似度の下限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の下限の最大値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第1のスキップ対応表を生成する
ことを特徴とする請求項26に記載のデータ検索方法。 - 前記所定の関係とは、検索データとの類似度が前記閾値より大きくなる関係である
ことを特徴とする請求項22に記載のデータ検索方法。 - 前記絞り込みでは、被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下であった場合に、当該計算された類似度と前記或るデータに対応する第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定する
ことを特徴とする請求項28に記載のデータ検索方法。 - 前記絞り込みでは、前記或るデータと検索データとの類似度を含む類似度範囲が前記第1のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定する
ことを特徴とする請求項29に記載のデータ検索方法。 - 前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第1のスキップ対応表を生成する
ことを特徴とする請求項28乃至30の何れか1項に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、前記第1のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値より大きくなる可能性が無い、生成対象データと検索データとの類似度の上限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の上限の最小値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第1のスキップ対応表を生成する
ことを特徴とする請求項31に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、前記生成した第1のスキップ対応表の連続する複数の類似度範囲を1つの類似度範囲に統合し、統合後の類似度範囲に対応するスキップ先データとして、統合前の類似度範囲に対応するスキップ先データのうちの最も先行するデータを割り当てる
ことを特徴とする請求項27または32に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、被検索対象データ系列中のうちの一部のデータについてのみ、前記第1のスキップ対応表を作成することを特徴とする請求項25、26、27、31、32、または33に記載のデータ検索方法。
- 前記絞り込みでは、前記第1のスキップ対応表に加えて、さらに、被検索対象データ系列中の各データに対応する表であって、対応するデータと検索データとの類似度のとりうる類似度範囲別に、検索データとの類似度が前記閾値との関係で前記所定の関係にならない可能性の有るデータのうち当該対応するデータ以降で最初に現れるデータを特定するスキップ先データ情報を記録した第2のスキップ対応表を用いて、検索データとの類似度を計算する必要のある被検索対象データ系列中のデータを絞り込む
ことを特徴とする請求項23記載のデータ検索方法。 - 前記絞り込みでは、
被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下でなかった場合に、当該計算された類似度と前記或るデータに対応する第1のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定し、
被検索対象データ系列中の或るデータについて計算した検索データとの類似度が前記閾値以下であった場合に、当該計算された類似度と前記或るデータに対応する第2のスキップ対応表とから、検索データとの類似度を次に計算する被検索対象データ系列中のデータを決定する
ことを特徴とする請求項35に記載のデータ検索方法。 - 前記絞り込みでは、
前記或るデータと検索データとの類似度を含む類似度範囲が前記第1のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定し、
前記或るデータと検索データとの類似度を含む類似度範囲が前記第2のスキップ対応表に存在する場合、該存在した類似度範囲に対応して記録されたスキップ先データ情報が示すデータを、検索データとの類似度を次に計算する被検索対象データ系列中のデータとして決定する
ことを特徴とする請求項36に記載のデータ検索方法。 - 前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第1のスキップ対応表を生成し、
前記被検索対象データ系列を入力し、前記被検索対象データ系列中のデータ毎の前記第2のスキップ対応表を生成する
ことを特徴とする請求項35乃至37の何れか1項に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、前記第1のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値以下になる可能性が無い、生成対象データと検索データとの類似度の下限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の下限の最大値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第1のスキップ対応表を生成し、
前記第2のスキップ対応表の生成では、前記第2のスキップ対応表の生成対象データの後続データについて、生成対象データとの類似度を計算し、該類似度と前記閾値とから、当該後続データと検索データとの類似度が前記閾値よりも大きくなる可能性が無い、生成対象データと検索データとの類似度の上限を示すスキップ可能条件を求め、自データおよび自データより先行する後続データのスキップ可能条件で与えられる類似度の上限の最小値を示す連続スキップ可能条件を計算し、前記計算した連続スキップ可能条件に従って、生成対象データの第2のスキップ対応表を生成する
ことを特徴とする請求項38に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、前記生成した第1のスキップ対応表の連続する複数の類似度範囲を1つの類似度範囲に統合し、統合後の類似度範囲に対応するスキップ先データとして、統合前の類似度範囲に対応するスキップ先データのうちの最も先行するデータを割り当て、
前記第2のスキップ対応表の生成では、前記生成した第2のスキップ対応表の連続する複数の類似度範囲を1つの類似度範囲に統合し、統合後の類似度範囲に対応するスキップ先データとして、統合前の類似度範囲に対応するスキップ先データのうちの最も先行するデータを割り当てることを特徴とする請求項39に記載のデータ検索方法。 - 前記第1のスキップ対応表の生成では、被検索対象データ系列中のうちの一部のデータについてのみ、前記第1のスキップ対応表を作成し、
前記第2のスキップ対応表の生成では、被検索対象データ系列中のうちの一部のデータについてのみ、前記第2のスキップ対応表を作成することを特徴とする請求項38乃至40の何れか1項に記載のデータ検索方法。 - 前記データは、特徴ベクトルであり、
前記類似度は、特徴ベクトルどうしの距離である
ことを特徴とする請求項22乃至41の何れか1項に記載のデータ検索方法。 - コンピュータに、
被検索対象データ系列中の各データに対応する表であって、対応するデータと検索データとの類似度のとりうる類似度範囲別に、検索データとの類似度が所定の閾値と比較して前記所定の関係になる可能性の有るデータのうち当該対応するデータ以降で最初に現れるデータを特定するスキップ先データ情報を記録した第1のスキップ対応表を用いて、被検索対象データ系列の中から検索データとの類似度が前記閾値以下のデータを検索する際、検索データとの類似度を計算する必要のある被検索対象データ系列中のデータを絞り込む処理
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010543327A JP4697355B2 (ja) | 2009-01-23 | 2010-01-14 | データ検索装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009012811 | 2009-01-23 | ||
JP2009012811 | 2009-01-23 | ||
PCT/JP2010/000155 WO2010084712A1 (ja) | 2009-01-23 | 2010-01-14 | データ検索装置 |
JP2010543327A JP4697355B2 (ja) | 2009-01-23 | 2010-01-14 | データ検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4697355B2 true JP4697355B2 (ja) | 2011-06-08 |
JPWO2010084712A1 JPWO2010084712A1 (ja) | 2012-07-12 |
Family
ID=42355771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010543327A Active JP4697355B2 (ja) | 2009-01-23 | 2010-01-14 | データ検索装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8244739B2 (ja) |
EP (1) | EP2287749A4 (ja) |
JP (1) | JP4697355B2 (ja) |
KR (1) | KR101277419B1 (ja) |
CN (1) | CN102292728B (ja) |
WO (1) | WO2010084712A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2287749A4 (en) * | 2009-01-23 | 2011-08-03 | Nec Corp | DATA DEVICE RECALL |
JP2011243148A (ja) * | 2010-05-21 | 2011-12-01 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
CN108763413B (zh) * | 2018-05-23 | 2021-07-23 | 唐山高新技术产业园区兴荣科技有限公司 | 基于数据存储格式的数据查找定位方法 |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3847100A (en) * | 1974-01-09 | 1974-11-12 | Singer Co | Pattern selection system for sewing machines |
US4490811A (en) * | 1979-03-14 | 1984-12-25 | Yianilos Peter N | String comparator device system circuit and method |
US5265242A (en) * | 1985-08-23 | 1993-11-23 | Hiromichi Fujisawa | Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates |
US5014327A (en) * | 1987-06-15 | 1991-05-07 | Digital Equipment Corporation | Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns |
US4823306A (en) * | 1987-08-14 | 1989-04-18 | International Business Machines Corporation | Text search system |
JPH022419A (ja) * | 1988-06-10 | 1990-01-08 | Hitachi Ltd | プログラム情報管理方式 |
US5008818A (en) * | 1989-04-24 | 1991-04-16 | Alexander K. Bocast | Method and apparatus for reconstructing a token from a token fragment |
US5206845A (en) * | 1989-06-05 | 1993-04-27 | Document Imaging Systems Corporation | Modular data storage and retrieval system |
US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
US5321833A (en) * | 1990-08-29 | 1994-06-14 | Gte Laboratories Incorporated | Adaptive ranking system for information retrieval |
DE4031022A1 (de) * | 1990-10-01 | 1992-04-02 | Agfa Gevaert Ag | Verfahren zur herstellung von kopien von streifenfoermigen kopiervorlagen und zugehoerige vorrichtung |
DE69231077T2 (de) * | 1991-03-06 | 2001-02-01 | Nec Corp | Einchipmikrorechner mit Schutzfuntion für den Inhalt eines internen ROM's |
US5251316A (en) * | 1991-06-28 | 1993-10-05 | Digital Equipment Corporation | Method and apparatus for integrating a dynamic lexicon into a full-text information retrieval system |
US5278980A (en) * | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US5189709A (en) * | 1991-08-26 | 1993-02-23 | The United States Of America As Represented By The United States National Aeronautics And Space Administration | Dynamic pattern matcher using incomplete data |
US5546572A (en) * | 1991-08-28 | 1996-08-13 | Hitachi, Ltd. | Method for retrieving database of image information |
US5331554A (en) * | 1992-12-10 | 1994-07-19 | Ricoh Corporation | Method and apparatus for semantic pattern matching for text retrieval |
JPH07146871A (ja) * | 1993-11-24 | 1995-06-06 | Hitachi Ltd | 静止画検索装置および静止画検索方法 |
JP3067966B2 (ja) * | 1993-12-06 | 2000-07-24 | 松下電器産業株式会社 | 画像部品を検索する装置及びその方法 |
US5694594A (en) * | 1994-11-14 | 1997-12-02 | Chang; Daniel | System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
US5717835A (en) * | 1995-01-11 | 1998-02-10 | International Business Machines Corporation | Simple approach to case-based reasoning for data navigation tasks |
JPH08305638A (ja) * | 1995-05-01 | 1996-11-22 | Nec Corp | Romデータ検査方法 |
JP3326670B2 (ja) * | 1995-08-02 | 2002-09-24 | ソニー株式会社 | データ符号化/復号化方法および装置、および符号化データ記録媒体 |
US5915250A (en) * | 1996-03-29 | 1999-06-22 | Virage, Inc. | Threshold-based comparison |
US5911139A (en) * | 1996-03-29 | 1999-06-08 | Virage, Inc. | Visual image database search engine which allows for different schema |
US5913205A (en) * | 1996-03-29 | 1999-06-15 | Virage, Inc. | Query optimization for visual information retrieval system |
US5893095A (en) * | 1996-03-29 | 1999-04-06 | Virage, Inc. | Similarity engine for content-based retrieval of images |
US5845261A (en) * | 1996-06-12 | 1998-12-01 | Mcabian; Adi Jacob | Interactive multi-media presentation and marketing apparatus |
US5930783A (en) * | 1997-02-21 | 1999-07-27 | Nec Usa, Inc. | Semantic and cognition based image retrieval |
JP3195752B2 (ja) * | 1997-02-28 | 2001-08-06 | シャープ株式会社 | 検索装置 |
US5991714A (en) * | 1998-04-22 | 1999-11-23 | The United States Of America As Represented By The National Security Agency | Method of identifying data type and locating in a file |
JP3615657B2 (ja) * | 1998-05-27 | 2005-02-02 | 株式会社日立製作所 | 映像検索方法及び装置ならびに記録媒体 |
US6774917B1 (en) * | 1999-03-11 | 2004-08-10 | Fuji Xerox Co., Ltd. | Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video |
US6424688B1 (en) * | 1999-10-27 | 2002-07-23 | Advanced Micro Devices, Inc. | Method to transfer data in a system with multiple clock domains using clock skipping techniques |
US6906823B1 (en) * | 2000-05-15 | 2005-06-14 | International Business Machines Corporation | Input interface for a raster object memory in a method, system and program |
JP3532835B2 (ja) * | 2000-07-04 | 2004-05-31 | 松下電器産業株式会社 | データ処理装置およびプログラム変換装置 |
US7046733B2 (en) * | 2001-03-30 | 2006-05-16 | Matsushita Electric Industrial Co., Ltd. | Data sequencing method to improve transmission of self-similar data in a multi-node network |
GB2387302B (en) * | 2002-04-05 | 2005-11-30 | Phyworks Ltd | Error correcting decoder |
CA2431387C (en) * | 2002-06-10 | 2007-05-29 | Research In Motion Limited | Voicemail notification messaging for mobile communication devices |
US7257206B2 (en) * | 2002-06-14 | 2007-08-14 | General Electric Capital Corporation | Skip tracing system |
JP3960151B2 (ja) * | 2002-07-09 | 2007-08-15 | ソニー株式会社 | 類似時系列検出方法及び装置、並びにプログラム |
JP4228662B2 (ja) * | 2002-11-19 | 2009-02-25 | 日本電気株式会社 | 映像閲覧システムおよび方法 |
WO2005011294A1 (ja) * | 2003-07-28 | 2005-02-03 | Nec Corporation | 視聴調査システム |
JP3943060B2 (ja) | 2003-08-14 | 2007-07-11 | 日本電信電話株式会社 | 信号検出方法、装置、プログラム及びその記録媒体 |
US7283999B1 (en) * | 2003-12-19 | 2007-10-16 | Ncr Corp. | Similarity string filtering |
US7461183B2 (en) * | 2004-08-03 | 2008-12-02 | Lsi Corporation | Method of processing a context for execution |
US7596639B2 (en) * | 2004-09-01 | 2009-09-29 | Lsi Corporation | Skip mask table automated context generation |
US9665629B2 (en) * | 2005-10-14 | 2017-05-30 | Yahoo! Inc. | Media device and user interface for selecting media |
US20070089057A1 (en) * | 2005-10-14 | 2007-04-19 | Yahoo! Inc. | Method and system for selecting media |
JP4469785B2 (ja) * | 2005-12-08 | 2010-05-26 | 株式会社東芝 | 信号探索装置及びその方法 |
US7747769B1 (en) * | 2005-12-22 | 2010-06-29 | Kearns James L | Method and apparatus for efficiently searching and selecting preferred content from a plurality of active multimedia streams |
JP2007306322A (ja) * | 2006-05-11 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | 映像再生制御装置及び方法並びにプログラム |
US7577644B2 (en) * | 2006-10-11 | 2009-08-18 | Yahoo! Inc. | Augmented search with error detection and replacement |
JP4893508B2 (ja) | 2007-07-05 | 2012-03-07 | 株式会社ダイフク | 袋が装着される箱体およびこの箱体に袋を装着する袋装着装置 |
US8848794B2 (en) * | 2007-12-18 | 2014-09-30 | Humax Holdings Co., Ltd. | Method and device for video coding and decoding |
EP2287749A4 (en) * | 2009-01-23 | 2011-08-03 | Nec Corp | DATA DEVICE RECALL |
-
2010
- 2010-01-14 EP EP20100733320 patent/EP2287749A4/en not_active Ceased
- 2010-01-14 JP JP2010543327A patent/JP4697355B2/ja active Active
- 2010-01-14 CN CN201080005326.3A patent/CN102292728B/zh active Active
- 2010-01-14 WO PCT/JP2010/000155 patent/WO2010084712A1/ja active Application Filing
- 2010-01-14 KR KR1020117017385A patent/KR101277419B1/ko active IP Right Grant
- 2010-01-14 US US12/995,144 patent/US8244739B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8244739B2 (en) | 2012-08-14 |
JPWO2010084712A1 (ja) | 2012-07-12 |
US20110099177A1 (en) | 2011-04-28 |
EP2287749A4 (en) | 2011-08-03 |
WO2010084712A1 (ja) | 2010-07-29 |
KR20110112822A (ko) | 2011-10-13 |
EP2287749A1 (en) | 2011-02-23 |
KR101277419B1 (ko) | 2013-06-20 |
CN102292728B (zh) | 2015-07-22 |
CN102292728A (zh) | 2011-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A2-RL: Aesthetics aware reinforcement learning for image cropping | |
CN107609098B (zh) | 搜索方法及装置 | |
KR100903961B1 (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
JP5616444B2 (ja) | 文書インデックス化およびデータクエリングのための方法およびシステム | |
US11599578B2 (en) | Building a graph index and searching a corresponding dataset | |
CN101706820A (zh) | 物料清单存储方法及装置、查询方法及装置 | |
JP4374902B2 (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
JP2010055621A (ja) | 検索方法及び検索システム | |
CN105159938A (zh) | 检索方法和装置 | |
JP4697355B2 (ja) | データ検索装置 | |
CN106484818B (zh) | 一种基于Hadoop和HBase的层次聚类方法 | |
JP3505393B2 (ja) | 類似オブジェクト検索方法、装置、および類似オブジェクト検索プログラムを記録した記録媒体 | |
JP4801566B2 (ja) | データストリーム監視装置、データストリーム監視方法、そのプログラムおよび記録媒体 | |
WO2022267094A1 (zh) | 基于欧氏距离的度量空间索引构建方法、装置及相关设备 | |
JP6212635B2 (ja) | メディアコンテンツ順序付けシステムおよびメディアコンテンツを順序付けするための方法 | |
KR101592670B1 (ko) | 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법 | |
WO2011099114A1 (ja) | ハイブリッド型データベースシステム及びその動作方法 | |
US8743883B2 (en) | Apparatus and method for parallel processing data flow | |
JP2008234482A (ja) | 文書分類装置、文書分類方法、プログラムおよび記録媒体 | |
KR100446639B1 (ko) | 셀 기반의 고차원 데이터 색인 장치 및 그 방법 | |
JP2001134584A (ja) | 類似データの検索方法,検索装置および類似データ検索プログラム記録媒体 | |
JP2004213113A (ja) | 配列圧縮方法 | |
JP2014127094A (ja) | 語彙探索装置、語彙探索方法、及び、語彙探索プログラム | |
WO2022230115A1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP2004341693A (ja) | 情報検索方法および情報検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4697355 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |