JP6079738B2 - ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム - Google Patents

ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム Download PDF

Info

Publication number
JP6079738B2
JP6079738B2 JP2014185783A JP2014185783A JP6079738B2 JP 6079738 B2 JP6079738 B2 JP 6079738B2 JP 2014185783 A JP2014185783 A JP 2014185783A JP 2014185783 A JP2014185783 A JP 2014185783A JP 6079738 B2 JP6079738 B2 JP 6079738B2
Authority
JP
Japan
Prior art keywords
histogram
data
bin number
calculation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014185783A
Other languages
English (en)
Other versions
JP2016057996A (ja
Inventor
松永 和久
和久 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2014185783A priority Critical patent/JP6079738B2/ja
Priority to US14/805,019 priority patent/US9875252B2/en
Publication of JP2016057996A publication Critical patent/JP2016057996A/ja
Application granted granted Critical
Publication of JP6079738B2 publication Critical patent/JP6079738B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラムに関する。
近年、文章をベクトル表現する方法として、語順を無視して単語の出現頻度ベクトルで文章を表現するBag-of-Words(BoW)表現が言語処理や情報検索等の分野で用いられている。また他方で、画像処理やマルチメディア検索等の分野でも、画像をベクトル表現する方法として、これとまったく同様に、画像における各特徴点(即ち、visual words;画像から多数抽出される局所特徴ベクトルをベクトル量子化したときの代表ベクトル)の位置を無視して、visual wordsをBag-of-Words化したBag-of-Features(BoF)表現が用いられている。
このように、Bag-of-Words(BoW)表現およびBag-of-Features(BoF)表現は、分野が異なっても同等の表現法として扱うことができるが、本明細書では、本発明を画像関連分野に適用した例を代表的に扱うこととし、以下の説明でもBag-of-Features(BoF)表現を代表的に扱う。
このBag-of-Features(BoF)表現では、画像から抽出された局所特徴量の分布をvisual wordsのヒストグラムで表現している。例えば、画像におけるvisual wordsの出現回数をカウントしてヒストグラムを作成して、これをBoFベクトルとするものである。
また、画像等のデータ照合処理や類似データ検索処理では、クエリ画像と対照画像の対比が行われる。この場合、画像のヒストグラム比較の一手法として、非特許文献1で提案された、ヒストグラムの交差(Intersection)を演算(以下では、ヒストグラムインターセクション演算という)して比較する手法が知られている。このヒストグラムインターセクション演算は、クエリ画像と対照画像の双方のヒストグラムの対応する各ビンの頻度値で小さい方を足し合わせたものをスコア値とし、該スコア値が大きいほど両者の類似度が高いとするものである。
なお、1枚の画像から多数抽出される局所特徴ベクトルをベクトル量子化し、代表ベクトルであるvisual wordsに置き換えて対応点の検索を行う手法は、Sivic, J.らが、ビデオ映像から視点の異なる同一シーンを検索可能なシステム“Video Google” を提案(非特許文献2参照)した際に用いたものである。
Swain, M. J. and Ballard, D. H.: Color Indexing, International Journal of Computer Vision, 7(1), pp.11-32, (1991). Sivic, J. and Zisserman, A.: Video Google: A Text Retrieval Approach to Object Matching in Videos, Proc. of IEEE International Conference on Computer Vision, pp.1470-1477, (2003).
また、非特許文献2では、visual wordsの考え方を導入することで、クエリ画像と同一物体を含む画像や映像の検索が、テキスト検索と同様に転置インデックスを用いて高速に実行可能であることが示されている。
大量のデータを扱う画像等のデータ照合処理や類似データ検索処理では、非特許文献2のように、処理の高速化のために検索対象の画像等のデータ群の圧縮などを行うことが一般的に行われているが、その場合、意図しない画像等が検索結果として得られることが往々にしてある。つまり、従来のデータ照合処理および類似データ検索処理においては、処理時間(応答時間)が処理結果の品質とトレードオフの関係にあるという側面があった。
本発明はこのような事情に鑑みなされたものであり、効率良くヒストグラムインターセクション演算を行って、品質の低下を招くことなくデータ照合処理および類似データ検索処理を高速化し得るヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラムを提供することを目的とする。
本発明は、上記の目的を達成するために以下の構成によって把握される。
(1)本発明のヒストグラムインターセクション演算装置は、クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算手段と、前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から頻度値の降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御手段と、を備える。
(2)本発明のデータ照合装置は、上記(1)のヒストグラムインターセクション演算装置を含み、クエリデータと複数の対照データとのデータ照合を行なうデータ照合装置であって、前記ヒストグラムインターセクション演算装置により演算されたヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までを記憶するベストスコア値記憶手段と、前記ヒストグラムインターセクション演算装置がヒストグラムインターセクションの演算を行っている間に、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高くなるか否かを判定する判定手段と、を備え、前記判定手段により、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高くならないと判定された場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止する。
(3)本発明の類似データ検索装置は、上記(2)に記載のデータ照合装置を含み、複数の対照データの中からクエリデータに類似するデータを検索する類似データ検索装置であって、前記複数の対照データの中から前記クエリデータに類似するデータを出力する類似データ出力手段を備え、前記類似データ出力手段は、前記ベストスコア値記憶手段に記憶されているスコア値を算出した際の前記対照データを、前記クエリデータに類似するデータとして出力する。
(4)本発明のヒストグラムインターセクション演算方法は、コンピュータが、クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算ステップと、前記ヒストグラムインターセクション演算ステップによるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から頻度値の降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御ステップと、を実行する
(5)本発明のヒストグラムインターセクション演算のプログラムは、コンピュータに、クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算機能と、前記ヒストグラムインターセクション演算機能によるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から頻度値の降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御機能と、を実現させる。
本発明によれば、効率良くヒストグラムインターセクション演算を行って、品質の低下を招くことなくデータ照合処理および類似データ検索処理を高速化し得るヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラムを提供することができる。
第1実施形態に係るヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置を含む類似画像データ検索システムの構成を例示する構成図である。 第1実施形態の類似画像データ検索システムの全体的な動作を説明ずるフローチャートである。 ヒストグラムインターセクション演算に関して第1実施形態のヒストグラムインターセクション演算装置およびデータ照合装置で行われる動作を説明ずるフローチャートである。 クエリ画像の具体例として、(a)並べ替え前のクエリ画像VWヒストグラム、(b)並び替え後のクエリ画像VWヒストグラム、(c)ビン番号変換テーブル、および(d)クエリ画像VW積算ヒストグラムをそれぞれ例示する説明図である。 対照画像の具体例として、(a)並べ替え前の対照画像VWヒストグラム、(b)並び替え後の対照画像VWヒストグラム、(c)関数「min」が返す値、および(d)MIN積算値をそれぞれ例示する説明図である。 第2実施形態に係るヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置を含む類似画像データ検索システムの構成を例示する構成図である。 ヒストグラムインターセクション演算に関して第2実施形態のヒストグラムインターセクション演算装置およびデータ照合装置で行われる動作を説明ずるフローチャートである。 第3実施形態に係るヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置を含む類似画像データ検索システムの構成を例示する構成図である。 第3実施形態の類似画像データ検索システムの全体的な動作を説明ずるフローチャートである。 ヒストグラムインターセクション演算に関して第3実施形態のヒストグラムインターセクション演算装置およびデータ照合装置で行われる動作を説明ずるフローチャートである。 演算順序テーブルを例示する説明図である。
以下、添付図面を参照して、本発明を実施するための形態について、第1実施形態、第2実施形態、第3実施形態の順に詳細に説明する。なお、各実施形態の説明を通して同一要素には同一参照符号を付している。
(第1実施形態)
図1は、第1実施形態に係るヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置を含む類似画像データ検索システムの構成を例示する構成図である。本実施形態の類似画像データ検索システムは、クエリ画像が与えられたときに、画像データベース5を検索して該クエリ画像に類似した画像を返すものである。
図1において、本実施形態のヒストグラムインターセクション演算装置は、前処理部11、第1の並び替え部12、ビン番号変換テーブル生成部13A、第2の並び替え部14、ヒストグラムインターセクション演算部15Aおよび演算制御部16Aを含む演算ユニット1Aと、記憶部4と、を備える。ここで、記憶部4には、演算ユニット1Aがアクセスする記憶部4の記憶領域として、クエリ画像データが保存されるクエリ画像データ記憶領域41、クエリ画像のヒストグラムが保存されるクエリ画像VWヒストグラム記憶領域42、ビン番号変換テーブル生成部13Aが生成するビン番号変換テーブルが保存されるビン番号変換テーブル記憶領域43A、並びに、対照画像のヒストグラムが保存される対照画像VWヒストグラム記憶領域44がある。
また、本実施形態のデータ照合装置は、上記ヒストグラムインターセクション演算装置と、積算ヒストグラム生成部21、加算部22、判定部23および照合制御部24を含む照合ユニット2と、記憶部4と、を備える。ここで、記憶部4には、照合ユニット2がアクセスする記憶部4の記憶領域として、積算ヒストグラム生成部21が生成する積算ヒストグラムが保存されるクエリ画像VW積算ヒストグラム記憶領域45、および、判定部23が判定に用いるベストスコア値が保存されるベストスコア値記憶領域46がある。
また、本実施形態の類似データ検索装置は、上記データ照合装置と、類似データ出力部31および検索制御部32を含む検索ユニット3と、記憶部4と、を備える。
なお、記憶部4は、ヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置で共用される構成である。また、より具体的には、演算ユニット1A、照合ユニット2および検索ユニット3は、1または複数個のCPUまたはMPU等で具現され、各ユニットが備える構成要素は、該CPUまたはMPU上で実行されるプログラムの機能的まとまりとして具体化される。
さらに、類似画像データ検索システムは、上記類似データ検索装置の構成に、画像データベース5およびVW辞書6が加わった構成である。
ここで、演算ユニット1A、照合ユニット2、検索ユニット3、記憶部4、画像データベース5およびVW辞書6は、データバス及び各種制御信号群を含むシステムバス9を介してバス接続されている。また、図1には示さないが、類似画像データ検索システムは、クエリ画像を当該類似画像データ検索システムに入力し、検索結果を出力する入出力部や、ユーザとのインタフェースを司るユーザインタフェース部を備えているものとする。
画像データベース5には、検索対象となる複数の対照画像データが保持されている。ここで、対照画像データは、visual wordsをBag-of-Words化したBag-of-Features(BoF)表現が用いられており、該画像から抽出された局所特徴量の分布がvisual wordsのヒストグラムで表現された対照画像VWヒストグラムである。
また、VW辞書6は、画像データベース5に含まれる複数の対照画像が持つvisual wordsの全てが登録された辞書である。
次に、ヒストグラムインターセクション演算を実行する演算ユニット1Aの各構成要素について説明する。
まず前処理部11は、入力されたクエリ画像について、画像グリッド位置から等間隔に画像パッチ情報(特徴ベクトル)を取得し、VW辞書6を参照して各画像パッチがどのVisual wordsに属するのかを調べることによりクエリ画像VWヒストグラムを作成し、クエリ画像VWヒストグラム記憶領域42に保存する。なお、この時点では、クエリ画像VWヒストグラムのビン番号の並びは画像データベース5に保持されている対照画像VWヒストグラムと同一である。
また、第1の並び替え部12は、クエリ画像VWヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える。これにより、クエリ画像VWヒストグラム記憶領域42のクエリ画像VWヒストグラムは、降順に書き替えられる。
また、ビン番号変換テーブル生成部13Aは、第1の並び替え部12により並び替えられたクエリ画像VWヒストグラムのビンが、並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成し、ビン番号変換テーブル記憶領域43Aに保存する。ビン番号変換テーブルは、並び替え後のビン番号と並び替え前のビン番号との対応表となるが、並び替え前のクエリ画像VWヒストグラムで頻度値が非零のビンについての対応関係のみ構成し、零のビンについての対応関係はビン番号変換テーブルに構成しない。
ここで、ヒストグラムインターセクション演算では、関数「min」が用いられ、関数「min」が返す値を順次積算してMIN積算値を得るが、関数「min」が対比する2つの値の内の一方が零である場合には関数が返す値も零となって、その演算結果としてのMIN積算値は変わらない。したがって、関数「min」が対比する2つの値の内の一方が零である場合には、ヒストグラムインターセクション演算を省略しても問題がない。そこで、本実施形態の演算高速化手法は、並び替え前のクエリ画像VWヒストグラムで頻度値が零のビンをビン番号変換テーブルから除外することにより、演算結果に影響を与えることなくヒストグラムインターセクション演算の対象から除外して、演算回数をより少なく抑えようとするものである。
この結果、演算結果に影響を与えることなく、1つの対照画像についてのデータ照合のために必要なヒストグラムインターセクション演算は、ビン番号変換テーブルの項数(即ち並び替え後のビン番号の最大値)をPmaxとすると、演算回数(Pmax)まで抑えることが可能である。
また、第2の並び替え部14は、検索対象となる対照画像の対照画像VWヒストグラムを画像データベース5から取得して対照画像VWヒストグラム記憶領域44に保存し、対照画像VWヒストグラムのビンを、ビン番号変換テーブルに従って並び替える。これにより、対照画像VWヒストグラム記憶領域44の対照画像VWヒストグラムのビン番号の並びは、クエリ画像VWヒストグラム記憶領域42のクエリ画像VWヒストグラムのビン番号の並びと同一となる。
ここで、第2の並び替え部14による対照画像VWヒストグラムの並び替えの際に、第2の並び替え部14は全てのビンの頻度値について参照することが可能であるが、並び替え後の全てのビン番号で頻度値が零である場合には、その対照画像とのデータ照合処理を打ち切って、別の対照画像とのデータ照合処理に移行するようにするのが望ましい。この場合、演算を行うまでもなくその対照画像との類似度は零であるので、データ照合の対象から除外することにより、データ照合処理または類似検索処理全体の処理時間をより少なくすることができる。特に、クエリ画像の局所特徴量の分布が偏りを持つものである場合、このようなケースは往々にして発生し、データ照合の対象から除外することによる効果は大きいと考えられる。
また、ヒストグラムインターセクション演算部15Aは、第1の並び替え部12により並び替えられたクエリ画像VWヒストグラムの最大頻度値を持つビンから順番に、クエリ画像VWヒストグラムの頻度値が零のビンになるまで、第2の並び替え部14により並び替えられた対照画像VWヒストグラムのビンとのヒストグラムインターセクション演算を行い、ヒストグラムインターセクションのスコア値(MIN積算値)を算出する。
また、演算制御部16Aは、演算ユニット1A内の他の構成要素の実行動作(開始、中止または終了など)を制御すると共に、類似画像データ検索システムの他の構成要素とのインタフェースを司る。
例えば、ヒストグラムインターセクション演算部15Aの演算については、演算制御部16Aが持つ変換後ポインタp(=1〜Pmax)の値に沿った実行制御となる。すなわち、ヒストグラムインターセクション演算部15Aでは、変換後ポインタpについて、クエリ画像VWヒストグラムのビン番号pの頻度値HA(p)と、対照画像VWヒストグラムのビン番号pの頻度値HB(p)とを用いて、MIN積算値Dp(スコア値)が次式によって算出される。
Dp = Dp-1 + min(HA(p), HB(p)) (1)
ここで、Dp-1は変換後ポインタがp−1のときのMIN積算値である。
次に、演算ユニット1Aと協調して、クエリ画像と複数の対照画像とのデータ照合を行なう照合ユニット2の各構成要素について説明する。
まず積算ヒストグラム生成部21は、第1の並び替え部12により並び替えられたクエリ画像VWヒストグラムの第2ビン目以降について、ビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算したクエリ画像VW積算ヒストグラムを生成し、クエリ画像VW積算ヒストグラム記憶領域45に保存する。
なお、後述するように、ヒストグラムインターセクション演算の中止判断が、予め設定されているパラメータKを用いた制御により、K回の演算で1回だけ行われる場合には、パラメータKの倍数に該当するビン番号についてのみ積算値を持つクエリ画像VW積算ヒストグラムとして良い。後の演算でパラメータKの倍数に該当するビン番号以外の積算値が参照されることはないからである。これにより、積算演算を省略できると共に、クエリ画像VW積算ヒストグラム記憶領域45を削減することができる。
また、加算部22は、ヒストグラムインターセクション演算部15Aで演算されたスコア値(その時点でのビン番号(変換後ポインタpの値)に応じたMIN積算値)と、積算ヒストグラム生成部21により生成されたクエリ画像VW積算ヒストグラムの該ビン番号(変換後ポインタpの値)における頻度値を加算した評価値Mulを算出する。
また、判定部23は、加算部22で算出した評価値Mulがベストスコア値記憶領域46に記憶されているベストスコア値より低い場合に、ヒストグラムインターセクション演算部15Aの演算を中止する。この場合、照合制御部24を介して演算制御部16Aに演算中止の旨が通知され、演算制御部16Aによってヒストグラムインターセクション演算部15Aの演算が中止されることとなる。
なお、ベストスコア値記憶領域46には、例えば「ベスト10」といったように、ヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までの複数のベストスコア値が登録される。例えば、類似画像検索の結果として、最もクエリ画像に類似する画像から類似度の順に複数の画像をユーザ提示するケースなどに適用される。この場合、登録可能数にベストスコア値の数が達するまでは、中止判定を行う(演算を中止する)ことなく処理が進められ、ベストスコア値が登録可能数分登録されて以降は、ベストスコア値の内の最下位(最小)のベストスコア値と比較して、中止か否かの判定が行われることになる。
また、ここで、評価値Mulが持つ意味について説明しておく。クエリ画像VW積算ヒストグラムの頻度値は、該ビン番号以降のクエリ画像VWヒストグラムの頻度値を積算したものであるので、仮に、該ビン番号以降のヒストグラムインターセクション演算においてクエリ画像VWヒストグラムの頻度値だけが関数「min」によって返される値であった場合に該当し、該ビン番号以降のヒストグラムインターセクション演算において、それ以外の値が返されるとすると、必ず、それよりも小さい値が返されることになる。このため、クエリ画像VW積算ヒストグラムの頻度値は、該ビン番号以降のヒストグラムインターセクション演算において関数「min」によって返される値の和の上限を意味している。したがって、ヒストグラムインターセクション演算部15Aで演算されたスコア値と、クエリ画像VW積算ヒストグラムの該ビン番号(変換後ポインタpの値)における頻度値を加算した評価値Mulは、その後の演算によって算出され得るヒストグラムインターセクションの上限スコア値となる。
すなわち、ヒストグラムインターセクション演算の途中段階で、演算により算出され得るヒストグラムインターセクションの上限スコア値を算出して、該上限スコア値がベストスコア値より高くなるか否かを判定し、高くならないと判定された場合にはその対象画像のスコア値がベストスコア値記憶領域46に登録される可能性はないので、ヒストグラムインターセクション演算を中止するものである。
このように、ベストスコア値より高くなる可能性のない対象画像についてのヒストグラムインターセクション演算を最後まで行うことなく、打ち切ることで演算回数を少なく抑えることが可能である。
なお、ヒストグラムインターセクション演算の中止判断は、必ずしも演算の段階(ビン番号)毎に行う必要はなく、パラメータKを用いて、K回に1回行うように制御することも可能である。パラメータKは、例えば、クエリ画像VWヒストグラムのビン数、visual wordsの数、ベストスコア値記憶領域46へのベストスコア値登録可能数、或いは、検索結果としてユーザに提示される画像数の最大値などに応じて、ユーザまたはシステムによって予め設定されることになる。
また、判定部23における評価値Mulの評価を、ベストスコア値記憶領域46に記憶されているベストスコア値と対比して行うのではなく、予め設定されている所定値と対比して行うようにしても良い。例えば、ユーザがクエリ画像と共に類似度を指定している場合には、クエリ画像VWヒストグラムの総度数と該類似度とに応じた所定値をシステム側で設定し、評価値Mulと所定値とを比較してヒストグラムインターセクション演算の中止か否かの判定を行うようにする。
また、判定部23は、ヒストグラムインターセクション演算部15Aによる最終的なスコア値がベストスコア値より高い場合には、ベストスコア値記憶領域46に記憶されているベストスコア値を更新する。
つまり、判定部23は、加算部22で算出した評価値Mulがベストスコア値記憶領域46に記憶されているベストスコア値より高い場合には、まず、変換後ポインタp(=1〜Pmax)の値がPmax以上であるか否かの判断を行って、並び替え後のクエリ画像VWヒストグラムおよび対照画像VWヒストグラムについて、全てのビン番号のヒストグラムインターセクション演算が終了したか否かを判断する。
そして、変換後ポインタp=Pmaxで全てのビン番号の演算が終了している場合は、さらに、ヒストグラムインターセクション演算部15Aにより演算されているMIN積算値DPmaxを最終的なヒストグラムインターセクション演算によるスコア値として、ベストスコア値と比較する。最終的なスコア値がベストスコア値より高い場合には、現時点での照合対象である対照画像が、ベストスコア値記憶領域46に登録されているものよりもクエリ画像に類似しているとして、ベストスコア値記憶領域46のベストスコア値を最終的なスコア値で置き換えて更新する。
また、照合制御部24は、照合ユニット2内の他の構成要素の実行動作(開始または終了など)を制御すると共に、類似画像データ検索システムの他の構成要素とのインタフェースを司る。
例えば、加算部22の演算については、照合制御部24が持つ演算制御部16Aと共通の変換後ポインタp(=1〜Pmax)の値に沿った実行制御となる。すなわち、変換後ポインタpについて、MIN積算値Dpとクエリ画像VW積算ヒストグラムのビン番号pの頻度値HAs(p)とを加算して評価値Mulが算出される。
次に、演算ユニット1Aおよび照合ユニット2と協調して、複数の対照画像の中からクエリ画像に類似する画像を検索する検索ユニット3の各構成要素について説明する。
まず類似データ出力部31は、ベストスコア値記憶領域46に記憶されているベストスコア値を算出した際の対照画像を、クエリ画像に類似する画像として出力する。
また、検索制御部32は、類似データ出力部31の実行動作を制御すると共に、類似画像データ検索システムの他の構成要素とのインタフェースを司る。
次に、以上説明した構成要素を備えるヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置の動作について、図2〜図5を参照して詳細に説明する。ここで、図2は、第1実施形態の類似画像データ検索システムの全体的な動作を説明ずるフローチャートであり、図3は、ヒストグラムインターセクション演算に関してヒストグラムインターセクション演算装置およびデータ照合装置で行われる動作を説明ずるフローチャートである。
また図4は、クエリ画像の具体例として、(a)並べ替え前のクエリ画像VWヒストグラム、(b)並び替え後のクエリ画像VWヒストグラム、(c)ビン番号変換テーブル、および(d)クエリ画像VW積算ヒストグラムをそれぞれ例示する説明図である。また図5は、対照画像の具体例として、(a)並べ替え前の対照画像VWヒストグラム、(b)並び替え後の対照画像VWヒストグラム、(c)関数「min」が返す値、および(d)MIN積算値をそれぞれ例示する説明図である。なお、図4および図5で示される各具体例は、本実施形態におけるヒストグラムインターセクションの演算手法を分かりやすく説明するために、ヒストグラムのビン数を極めて少なくしたものであり、実際的なものでないことに留意すべきである。
図2において、まずステップS1では、入出力部(図示せず)を介してクエリ画像が入力され、記憶部4のクエリ画像データ記憶領域41に保存される。
次に、ステップS2では、前処理部11は、入力されたクエリ画像について、画像グリッド位置から等間隔に画像パッチ情報(特徴ベクトル)を取得する。
また、ステップS3では、前処理部11は、VW辞書6を参照して各画像パッチがどのvisual wordsに属するのかを調べることによりクエリ画像VWヒストグラムを作成し、クエリ画像VWヒストグラム記憶領域42に保存する。図4(a)に示す具体例では、ビン番号1、5、8、11、16について、それぞれ6、10、8、5、2の頻度値を持ち、その他のビン番号については頻度値が零であるクエリ画像VWヒストグラムが例示されている。なお、事前学習で、学習画像から各特徴ベクトルをクラスタリングして、各クラスタ中心がvisual wordsとして、VW辞書6に保存されている。
次に、ステップS5では、第1の並び替え部12は、クエリ画像VWヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える。具体例では、図4(b)に示すように、ビン番号1〜5についてそれぞれ10、8、6、5、2の頻度値を持ち、頻度値が降順に並び替えられたクエリ画像VWヒストグラムが得られる。
また、この時、ビン番号変換テーブル生成部13Aは、第1の並び替え部12により並び替えられたクエリ画像VWヒストグラムのビンが、並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成し、ビン番号変換テーブル記憶領域43Aに保存する(ステップS4)。なお、ステップS4およびS5の処理順は、並び替え処理のアルゴリズムに応じて決められるものであり、何れが先であっても、或いは、両者を同時に並行して行うようにしても良い。
具体例では、ビン番号変換テーブル生成部13Aは図4(c)に例示される如くなる。ビン番号変換テーブルの項数(並び替え後のビン番号の最大値)は5であり、クエリ画像と対照画像のデータ照合においてヒストグラムインターセクション演算が高々行われる演算回数(Pmax)は5となる。すなわち、クエリ画像VWヒストグラムの頻度値が零のビンは11個あり、ヒストグラムインターセクション演算の対象から除外されることになる。
次に、ステップS6では、積算ヒストグラム生成部21は、第1の並び替え部12により並び替えられたクエリ画像VWヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算したクエリ画像VW積算ヒストグラムを生成し、クエリ画像VW積算ヒストグラム記憶領域45に保存する。具体例では、クエリ画像VW積算ヒストグラムは図4(d)に例示される如くなる。
そして、ステップS7のヒストグラムインターセクションを含む対照画像との照合処理に移行する。ステップS7の処理は、図3で示されるフローに展開される。
図3において、まず、ステップS11では、演算制御部16Aおよび照合制御部24は、変換後ポインタp(=1〜Pmax)の値を初期値「1」に設定する。変換後ポインタpは、図4(c)に例示される如く、並び替え後のビン番号と同等であり、ヒストグラムインターセクション演算の実行順序を指し示すものである。
次に、ステップS12では、第2の並び替え部14は、検索対象となる対照画像の対照画像VWヒストグラムを画像データベース5から取得して対照画像VWヒストグラム記憶領域44に保存し、対照画像VWヒストグラムのビンを、ビン番号変換テーブル記憶領域43Aに保存されているビン番号変換テーブルに従い並び替える。
図5(a)に示す対照画像の第1具体例では、ビン番号1、3、5、11、16について、それぞれ5、8、4、7、3の頻度値を持ち、その他のビン番号については頻度値が零である対照画像VWヒストグラムが例示されている。また、これを図4(c)に示すビン番号変換テーブルに従って並び替えると、図5(b)に示す如くなる。すなわち、並び替えられた対照画像VWヒストグラムは、ビン番号1〜5についてそれぞれ4、0、5、7、3の頻度値を持つ。そして、並び替えられたクエリ画像VWヒストグラムおよび対照画像VWヒストグラムのビン番号1〜5について、それぞれヒストグラムインターセクション演算が実行されることになる。
ステップS13では、ヒストグラムインターセクション演算部15Aは、クエリ画像VWヒストグラムのビン番号pの頻度値HA(p)と、対照画像VWヒストグラムのビン番号pの頻度値HB(p)とを用いて、MIN積算値Dp(スコア値)を式(1)に基づき算出する。
具体例でこの演算をトレースすると、以下のようになる。すなわち、変換後ポインタp=1のときには、クエリ画像VWヒストグラムのビン番号1の頻度値HA(1)=10と、対照画像VWヒストグラムのビン番号1の頻度値HB(1)=4とについて、関数「min」が返す値はHB(1)=4であり、MIN積算値D1=4となる。また、変換後ポインタp=2のときには、HA(2)=8と頻度値HB(2)=0について関数「min」が返す値はHB(2)=0であり、MIN積算値D2=4となる。また、変換後ポインタp=3のときには、HA(3)=6と頻度値HB(3)=5について関数「min」が返す値はHB(3)=5であり、MIN積算値D3=9となる。また、変換後ポインタp=4のときには、HA(4)=5と頻度値HB(4)=7について関数「min」が返す値はHA(4)=5であり、MIN積算値D4=14となる。さらに、変換後ポインタp=5のときには、HA(5)=2と頻度値HB(5)=3について関数「min」が返す値はHA(5)=2であり、MIN積算値D5=16となる。つまり、この具体例の対照画像について、最終的なスコア値は16である。
上記で示した関数「min」が返す値の推移は、図5(c)、MIN積算値Dp(スコア値)の推移は、図5(d)に示す通りである。
次に、ステップS14では、照合制御部24は、変換後ポインタpがKの倍数であるか否かを判断する。ここでパラメータKは、続くステップS15およびS16の処理をK回に1回行うように制御するものであり、1以上の正整数値がユーザまたはシステムにより予め設定されている。
次に、ステップS15では、加算部22は、ビン番号pに応じたMIN積算値Dp(ヒストグラムインターセクション演算部15Aで演算されたスコア値)と、クエリ画像VW積算ヒストグラムの該ビン番号pにおける頻度値HAs(p)と、を加算して、評価値Mulを算出する。
具体例で変換後ポインタp毎の評価値Mulを算出すると、以下のようになる。すなわち、変換後ポインタp=1のときには、MIN積算値D1=4とクエリ画像VW積算ヒストグラムのビン番号1における頻度値HAs(1)=21とを加算すると、評価値Mulは25となる。また、変換後ポインタp=2のときには、MIN積算値D2=4と頻度値HAs(2)=13が加算されて、評価値Mulは17となる。また、変換後ポインタp=3のときには、MIN積算値D3=9と頻度値HAs(3)=7が加算されて、評価値Mulは16となる。さらに、変換後ポインタp=4のときには、MIN積算値D4=14と頻度値HAs(4)=2が加算されて、評価値Mulは16となる。
上述した通り、評価値Mulは、今後の演算を進めたときの上限値であるので、演算が進むごとに最終的な真値に近づくように、順次減少して最終的には、図5(d)のMIN積算値D5=16に一致していることがわかる。
このように、評価値Mulが順次減少して最終的なスコア値に近づいていくという特性は、クエリ画像VWヒストグラムを降順に並べ替えていることに起因している。後述のように、本実施形態では、この評価値Mulとベストスコア値との比較に基づきヒストグラムインターセクション演算の中止判断を行うが、評価値Mulに順次減少していく特性を持たせることにより、結果的に中止判定がなされる対照画像について、より早い段階での中止判断ができるようになる。換言すれば、クエリ画像VWヒストグラムの降順での並べ替えは、より早い段階での中止判断を可能とし、演算を省略して処理の高速化に寄与しているということができる。
次に、ステップS16では、判定部23は、ステップS15で算出した評価値Mulを、ベストスコア値記憶領域46に記憶されているベストスコア値と比較する。ステップS16での比較の結果、評価値Mulがベストスコア値より低い場合には、ヒストグラムインターセクション演算部15Aの演算を中止して、対照画像との照合処理(ステップS7)を終了する。
また、判定部23は、ステップS16での比較の結果、評価値Mulがベストスコア値より高い場合には、ステップS17に進んで、変換後ポインタpの値がPmax以上であるか否かの判断を行う。変換後ポインタpの値がPmax未満であるときは、並び替え後のクエリ画像VWヒストグラムおよび対照画像VWヒストグラムについて、全てのビン番号のヒストグラムインターセクション演算が終了しておらず、ステップS18で変換後ポインタpをインクリメントした後、ステップS13に戻る。
ステップS17において、変換後ポインタp=Pmaxとなって全てのビン番号の演算が終了している場合には、ステップS19に進む。この場合、判定部23は、ヒストグラムインターセクション演算部15Aにより演算されているMIN積算値DPmaxを最終的なヒストグラムインターセクション演算によるスコア値として、ベストスコア値と比較する。そして、最終的なスコア値がベストスコア値より高い場合には、ベストスコア値記憶領域46のベストスコア値を最終的なスコア値に置き換えて更新する。
以上説明したように、本実施形態のヒストグラムインターセクション演算装置、方法およびプログラムでは、第1の並び替え部12により、クエリ画像VWヒストグラムのビンをヒストグラムの頻度値の降順に並び替え、ビン番号変換テーブル生成部13Aにより、並び替えられたクエリ画像VWヒストグラムのビンが並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成し、第2の並び替え部14により、対照画像VWヒストグラムのビンをビン番号変換テーブルに従って並び替え、ヒストグラムインターセクション演算部15Aにより、並び替えられたクエリ画像VWヒストグラムの最大頻度値を持つビンから順番に、クエリ画像VWヒストグラムの頻度値が零のビンになるまで、並び替えられた対照画像VWヒストグラムのビンとのヒストグラムインターセクション演算を行い、ヒストグラムインターセクションのスコア値(MIN積算値)を算出する。
本実施形態のヒストグラムインターセクション演算装置、方法およびプログラムでは、並び替え前後のビン番号の対応関係を示すビン番号変換テーブルを生成する際に、並び替え前のクエリ画像VWヒストグラムで頻度値が零のビンを除外するので、演算結果に影響を与えることなくヒストグラムインターセクション演算の対象から頻度値が零のビンを除外して、演算回数をより少なくすることができ、ヒストグラムインターセクション演算の高速化を図ることができる。
また、本実施形態のデータ照合装置、方法およびプログラムでは、ベストスコア値記憶領域46に、ヒストグラムインターセクション演算装置により演算されたヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までが記憶され、判定部23により、ヒストグラムインターセクション演算装置がヒストグラムインターセクションの演算を行っている間に、当該演算により算出されるヒストグラムインターセクションのスコア値が、ベストスコア値記憶領域46に記憶されているベストスコア値より高くなるか否かを判定し、演算により算出されるヒストグラムインターセクションのスコア値がスコア値より高くならないと判定された場合には、ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止する。
このように、本実施形態のデータ照合装置、方法およびプログラムでは、ヒストグラムインターセクション演算により算出され得る上限スコア値が、ベストスコア値記憶領域46に記憶されているベストスコア値より高くならないと判定された場合には、ヒストグラムインターセクション演算を中止して、最終的に類似画像として採用される可能性のない対照画像との照合処理をヒストグラムインターセクション演算の途中段階で打ち切るので、無駄となる演算を省略して、データ照合処理の高速化を図ることができる。
つまり、データ照合装置が、ヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までの対照画像を、データ照合処理の結果として求めるものである場合に、最終的にベストスコア値記憶領域46にスコア値が残らない対照画像については、ヒストグラムインターセクション演算の途中段階でその旨を判断して、それ以降のヒストグラムインターセクション演算を省略することができるので、全体的なヒストグラムインターセクション演算回数を削減して、結果としてデータ照合処理の高速化を図ることができる。
また、本実施形態のデータ照合装置では、積算ヒストグラム生成部21により、並び替えられたクエリ画像VWヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成し、加算部22により、ヒストグラムインターセクション演算装置により演算されたスコア値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した評価値(加算値)を算出し、該評価値がベストスコア値記憶領域46に記憶されているベストスコア値より低い場合には、ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止する。或いは、該評価値が所定の値より低い場合、ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止する。
すなわち、ヒストグラムインターセクション演算により算出され得る上限スコア値として評価値(加算値)を算出し、該評価値がベストスコア値または所定の値より低い場合に、ヒストグラムインターセクションの演算を中止するので、全体的なヒストグラムインターセクション演算回数を削減して、データ照合処理の高速化を図ることができる。
また、本実施形態の類似データ検索装置、方法およびプログラムでは、類似データ出力部31により、複数の対照データの中からクエリデータに類似するデータを出力する際に、ベストスコア値記憶領域46に記憶されているベストスコア値を算出したときの対照データを、クエリデータに類似するデータとして出力する。
本実施形態の類似データ検索装置、方法およびプログラムには、上述した効果を奏するヒストグラムインターセクション演算装置、方法およびプログラム、並びに、データ照合装置、方法およびプログラムが含まれるので、結果として、効率良くヒストグラムインターセクション演算を行って、品質の低下を招くことなくデータ照合処理および類似データ検索処理を高速化し得る類似データ検索装置、方法およびプログラムを提供することができる。
(第2実施形態)
次に、図6は、第2実施形態に係るヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置を含む類似画像データ検索システムの構成を例示する構成図である。本実施形態では、ヒストグラムインターセクション演算装置の一部の構成が第1実施形態と異なり、他の構成については第1実施形態と同等である。ここでは、第1実施形態と異なる構成要素についてのみ説明し、同一の構成要素には同一参照符号を付して詳しい説明は省略する。
図6において、本実施形態のヒストグラムインターセクション演算装置は、前処理部11、第1の並び替え部12、ビン番号変換テーブル生成部13A、ヒストグラムインターセクション演算部15Bおよび演算制御部16Bを含む演算ユニット1Bと、記憶部4と、を備える。なお、ヒストグラムインターセクション演算装置の構成上、第1実施形態と異なる点は、演算ユニット1Bが第2の並び替え部14を持たない構成であることと、記憶部4から対照画像VWヒストグラム記憶領域44を取り除いた点である。
第1実施形態では、ヒストグラムインターセクション演算で対照画像VWヒストグラムの頻度値を参照する際に、記憶部4の対照画像VWヒストグラム記憶領域44上でビン番号を並び替えた対照画像VWヒストグラムを参照した。これに対して、本実施形態では、画像データベース5上の並び替え前の対照画像VWヒストグラムを直接参照することとし、参照の際のビン番号の(並び替え後のビン番号から並び替え前のビン番号への)変換処理は、ビン番号変換テーブル(ビン番号変換テーブル記憶領域43A)を参照して行う。
演算ユニット1Bの構成要素の内、機能の異なるヒストグラムインターセクション演算部15Bおよび演算制御部16Bについて説明する。
まず、ヒストグラムインターセクション演算部15Bは、クエリ画像VWヒストグラムと対照画像VWヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出する。
また、演算制御部16Bは、演算ユニット1B内の他の構成要素の実行動作(開始、中止または終了など)を制御すると共に、類似画像データ検索システムの他の構成要素とのインタフェースを司る。
特に、ヒストグラムインターセクション演算部15Bの演算については、演算制御部16Bが持つ変換後ポインタp(=1〜Pmax)の値に沿った実行制御となる。すなわち、演算制御部16Bは、変換後ポインタpの値に基づきビン番号変換テーブルを参照して変換前ポインタqの値を取得し、画像データベース5を参照して対照画像VWヒストグラムのビン番号qの頻度値HB(q)を取得し、これをヒストグラムインターセクション演算部15Bに渡す。
ヒストグラムインターセクション演算部15Bでは、変換後ポインタpについて、クエリ画像VWヒストグラム記憶領域42上の並び替えられたクエリ画像VWヒストグラムのビン番号pの頻度値HA(p)と、対照画像VWヒストグラムのビン番号qの頻度値HB(q)とを用いて、MIN積算値Dp(スコア値)が次式によって算出される。
Dp = Dp-1 + min(HA(p), HB(q)) (2)
次に、本実施形態のヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置の動作について説明する。類似画像データ検索システムの全体的な動作については、第1実施形態と同等であり、図2に示されるフローチャートの手順で処理が行われる。
図2において、ヒストグラムインターセクションを含む対照画像との照合処理(ステップS7)は、本実施形態では図7で示されるフローに展開される。図7は、ヒストグラムインターセクション演算に関して、第2実施形態のヒストグラムインターセクション演算装置およびデータ照合装置で行われる動作を説明ずるフローチャートである。
図7において、まず、ステップS11では、演算制御部16Bおよび照合制御部24は、変換後ポインタp(=1〜Pmax)の値を初期値「1」に設定する。変換後ポインタpは、並び替え後のビン番号と同等であり、ヒストグラムインターセクション演算の実行順序を指し示すものである。
次に、ステップS32では、演算制御部16Bは、変換後ポインタpの値に基づきビン番号変換テーブルを参照して変換前ポインタqの値を取得し、画像データベース5を参照して対照画像VWヒストグラムのビン番号qの頻度値HB(q)を取得し、これをヒストグラムインターセクション演算部15Bに渡す。
次に、ステップS33では、ヒストグラムインターセクション演算部15Bは、変換後ポインタpについて、クエリ画像VWヒストグラム記憶領域42上の並び替えられたクエリ画像VWヒストグラムのビン番号pの頻度値HA(p)と、対照画像VWヒストグラムのビン番号qの頻度値HB(q)とを用いて、MIN積算値Dp(スコア値)を式(2)に基づき算出する。
ステップS14以降の処理は、第1実施形態と同等であるので、説明を省略する。但し、本実施形態では、ヒストグラムインターセクションの演算毎に、演算に用いる対照画像VWヒストグラムのビン番号qの頻度値HB(q)を画像データベース5から取得するので、ステップS17において、クエリ画像VWヒストグラムおよび対照画像VWヒストグラムについて、全てのビン番号のヒストグラムインターセクション演算が終了していない場合には、ステップS18で変換後ポインタpをインクリメントした後に、ステップS32に戻ることになる。
以上説明したように、本実施形態のヒストグラムインターセクション演算装置、方法およびプログラムでは、第1の並び替え部12により、クエリ画像VWヒストグラムのビンをヒストグラムの頻度値の降順に並び替え、ビン番号変換テーブル生成部13Aにより、並び替えられたクエリ画像VWヒストグラムのビンが並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成し、演算制御部16Bにより、ヒストグラムインターセクション演算部15Bによるヒストグラムインターセクションの演算を、並び替えられたクエリ画像VWヒストグラムの最大頻度値を持つビンから順番に、並び替えられたクエリ画像VWヒストグラムの頻度値が零のビンになるまで、並び替えられたクエリ画像VWヒストグラムの該ビン番号の頻度値と、ビン番号変換テーブルで該ビン番号に対応する並び替え前ビン番号の対照画像VWヒストグラムの頻度値と、を用いて行わせる。
本実施形態のヒストグラムインターセクション演算装置、方法およびプログラムでは、クエリ画像VWヒストグラムの並び替え前後のビン番号の対応関係を示すビン番号変換テーブルを生成する際に、並び替え前のクエリ画像VWヒストグラムで頻度値が零のビンを除外するので、演算結果に影響を与えることなくヒストグラムインターセクション演算の対象から頻度値が零のビンを除外して、演算回数をより少なくすることができ、ヒストグラムインターセクション演算の高速化を図ることができる。
また、第1実施形態と比較して、本実施形態では、ヒストグラムインターセクションの演算毎に、演算に用いる対照画像VWヒストグラムのビン番号qの頻度値HB(q)を画像データベース5から取得するので、対照画像VWヒストグラムの並び替えを行う必要が無く、ヒストグラムインターセクション演算をより高速化することができる。
また、データ照合装置、方法およびプログラムで処理単位となる対照画像毎に、(対照画像VWヒストグラムの並び替え)処理の削減が可能となるので、データ照合処理の高速化を図ることができると共に、類似データ検索装置、方法およびプログラムでの類似データ検索処理の高速化にも貢献することができる。
(第3実施形態)
次に、図8は、第3実施形態に係るヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置を含む類似画像データ検索システムの構成を例示する構成図である。本実施形態も第2実施形態と同様に、ヒストグラムインターセクション演算装置の一部の構成が第1実施形態と異なり、他の構成については第1実施形態と同等である。ここでは、第1実施形態と異なる構成要素についてのみ説明し、同一の構成要素には同一参照符号を付して詳しい説明は省略する。
図8において、本実施形態のヒストグラムインターセクション演算装置は、前処理部11、演算順序テーブル生成部13C、ヒストグラムインターセクション演算部15Bおよび演算制御部16Cを含む演算ユニット1Cと、記憶部4と、を備える。
なお、ヒストグラムインターセクション演算装置の構成上、第1実施形態と異なる点は、演算ユニット1Cが第1の並び替え部12および第2の並び替え部14を持たない構成であることと、記憶部4から対照画像VWヒストグラム記憶領域44を取り除いた点である。また、ビン番号変換テーブル生成部13Aを演算順序テーブル生成部13Cに、記憶部4のビン番号変換テーブル記憶領域43Aを演算順序テーブル記憶領域43Cに、それぞれ変更しているが、演算順序テーブルは実質的にビン番号変換テーブルと同等のものである。
第1実施形態では、ヒストグラムインターセクション演算でクエリ画像VWヒストグラムの頻度値を参照する際に、記憶部4のクエリ画像VWヒストグラム記憶領域42上でビン番号を並び替えたクエリ画像VWヒストグラムを参照した。これに対して、本実施形態では、クエリ画像VWヒストグラムの並び替えを実際には行わず、演算順序テーブル生成部13Cによって生成した演算順序テーブル記憶領域43Cの演算順序テーブルに基づき、並び替えを行っていないクエリ画像VWヒストグラムを参照する。
また第1実施形態では、ヒストグラムインターセクション演算で対照画像VWヒストグラムの頻度値を参照する際に、記憶部4の対照画像VWヒストグラム記憶領域44上でビン番号を並び替えた対照画像VWヒストグラムを参照した。これに対して、本実施形態では、第2実施形態と同様に、画像データベース5上の並び替え前の対照画像VWヒストグラムを直接参照することとし、参照の際のビン番号の変換処理は演算順序テーブル(演算順序テーブル記憶領域43C)を参照して行う。
演算ユニット1Cの構成要素の内、機能の異なる演算順序テーブル生成部13C、ヒストグラムインターセクション演算部15Bおよび演算制御部16Cについて説明する。
まず演算順序テーブル生成部13Cは、クエリ画像VWヒストグラムを頻度値の降順で並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成する。
具体例として、実施形態1の説明で用いた図4(a)のクエリ画像VWヒストグラムについて、上記定義に従って演算順序テーブルを構成すれば、図11に示す如くなる。すなわち、図4(c)に例示したビン番号変換テーブルと同等であり、シーケンシャル番号は並び替え後のビン番号に対応している。
第1実施形態では、並び替え後のビン番号を変換後ポインタと呼び変えてヒストグラムインターセクション演算の演算順序を制御したが、本実施形態では、シーケンシャル番号を演算順序ポインタと呼び変えて演算順序を制御する。つまり、演算順序テーブルは、演算順序ポインタ値を、その時点で参照すべきヒストグラムのビン番号であるビンポインタ値に変換する変換テーブルとなっている。
また、ヒストグラムインターセクション演算部15Bは、クエリ画像VWヒストグラムと対照画像VWヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出する。
また、演算制御部16Cは、演算ユニット1B内の他の構成要素の実行動作(開始、中止または終了など)を制御すると共に、類似画像データ検索システムの他の構成要素とのインタフェースを司る。
特に、ヒストグラムインターセクション演算部15Bの演算については、演算制御部16Cが持つ演算順序ポインタp(=1〜Pmax;Pmaxは演算順序テーブルの項数)の値に沿った実行制御となる。
すなわち、演算制御部16Cは、演算順序ポインタpの値に基づき演算順序テーブルを参照してビンポインタqの値を取得し、画像データベース5を参照して対照画像VWヒストグラムのビン番号qの頻度値HB(q)を取得する。また同時に、記憶部4のクエリ画像VWヒストグラム記憶領域42を参照してクエリ画像VWヒストグラムのビン番号qの頻度値HA(q)を取得する。そしてこれら頻度値をヒストグラムインターセクション演算部15Bに渡す。
ヒストグラムインターセクション演算部15Bでは、演算順序ポインタpについて、クエリ画像VWヒストグラムのビン番号qの頻度値HA(q)と、対照画像VWヒストグラムのビン番号qの頻度値HB(q)とを用いて、MIN積算値Dp(スコア値)が次式によって算出される。
Dp = Dp-1 + min(HA(q), HB(q)) (3)
次に、本実施形態のヒストグラムインターセクション演算装置、データ照合装置および類似データ検索装置の動作について説明する。類似画像データ検索システムの全体的な動作については、第1実施形態と同様であり、図9に示されるフローチャートの手順で処理が行われる。図9は、第3実施形態の類似画像データ検索システムの全体的な動作を説明ずるフローチャートである。
本実施形態では、クエリ画像VWヒストグラムの並び替えを行わないので、図2におけるクエリ画像VWヒストグラムの並び替え処理(ステップS5)が削除されている。
また、ステップS4では、演算順序テーブル生成部13Cが、クエリ画像VWヒストグラムを頻度値の降順で並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成して、記憶部4の演算順序テーブル記憶領域43Cに保存する。なお、実質的な処理内容は図2のステップS4と同等である。
また、ステップS6では、積算ヒストグラム生成部21は、演算順序テーブルのビン番号に応じたクエリ画像VWヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算したクエリ画像VW積算ヒストグラムを生成し、クエリ画像VW積算ヒストグラム記憶領域45に保存する。なお、実質的な処理内容は図2のステップS6と同等である。
また、その他の各ステップについても第1実施形態(図2)と同等であるので、詳しい説明は省略する。
図9において、ヒストグラムインターセクションを含む対照画像との照合処理(ステップS7)は、本実施形態では図10で示されるフローに展開される。図10は、ヒストグラムインターセクション演算に関して、第3実施形態のヒストグラムインターセクション演算装置およびデータ照合装置で行われる動作を説明ずるフローチャートである。
図10において、まず、ステップS51では、演算制御部16Cおよび照合制御部24は、演算順序ポインタp(=1〜Pmax)の値を初期値「1」に設定する。
次に、ステップS52では、演算制御部16Cは、演算順序ポインタpの値に基づき演算順序テーブルを参照してビンポインタqの値を取得し、画像データベース5を参照して対照画像VWヒストグラムのビン番号qの頻度値HB(q)を取得し、これをヒストグラムインターセクション演算部15Bに渡す。また同時に、記憶部4のクエリ画像VWヒストグラム記憶領域42を参照してクエリ画像VWヒストグラムのビン番号qの頻度値HA(q)を取得し、これをヒストグラムインターセクション演算部15Bに渡す。
次に、ステップS53では、ヒストグラムインターセクション演算部15Bは、演算順序ポインタpについて、クエリ画像VWヒストグラムのビン番号qの頻度値HA(q)と、対照画像VWヒストグラムのビン番号qの頻度値HB(q)とを用いて、MIN積算値Dp(スコア値)を式(3)に基づき算出する。
ステップS54以降の処理は、変換後ポインタpが演算順序ポインタpに呼び変えられている点を除いて第1実施形態と同等であるので、説明を省略する。但し、本実施形態では、ヒストグラムインターセクションの演算毎に、演算に用いるクエリ画像VWヒストグラムのビン番号qの頻度値HA(q)と、対照画像VWヒストグラムのビン番号qの頻度値HB(q)とをそれぞれ取得するので、ステップS57において、クエリ画像VWヒストグラムおよび対照画像VWヒストグラムについて、全てのビン番号のヒストグラムインターセクション演算が終了していない場合には、ステップS58で演算順序ポインタpをインクリメントした後に、ステップS52に戻ることになる。
以上説明したように、本実施形態のヒストグラムインターセクション演算装置、方法およびプログラムでは、演算順序テーブル生成部13Cにより、クエリ画像VWヒストグラムを頻度値の降順で並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成し、演算制御部16Bにより、ヒストグラムインターセクション演算部15Bによるヒストグラムインターセクションの演算を、演算順序テーブルのシーケンシャル番号の順に、該シーケンシャル番号に対応するビン番号のクエリ画像VWヒストグラムおよび対照画像VWヒストグラムのそれぞれの頻度値を用いて行わせる。
本実施形態のヒストグラムインターセクション演算装置、方法およびプログラムでは、シーケンシャル番号(演算順序ポインタ値)とビン番号(ビンポインタ値)との対応関係を示す演算順序テーブルを生成する際に、クエリ画像VWヒストグラムで頻度値が零のビンを除外するので、演算結果に影響を与えることなくヒストグラムインターセクション演算の対象から頻度値が零のビンを除外して、演算回数をより少なくすることができ、ヒストグラムインターセクション演算の高速化を図ることができる。
また、第1実施形態と比較して、本実施形態では、ヒストグラムインターセクションの演算毎に、演算に用いる対照画像VWヒストグラムのビン番号qの頻度値HB(q)を画像データベース5から取得するので、対照画像VWヒストグラムの並び替えを行う必要が無く、ヒストグラムインターセクション演算をより高速化することができる。
また、第2実施形態と比較して、本実施形態では、ヒストグラムインターセクションの演算毎に、演算に用いるクエリ画像VWヒストグラムのビン番号qの頻度値HA(q)を取得することとして、クエリ画像VWヒストグラムの並び替えを行わないので、ヒストグラムインターセクション演算をより高速化することができる。
また、第2実施形態と同様に、データ照合装置、方法およびプログラムで処理単位となる対照画像毎に、(対照画像VWヒストグラムの並び替え)処理の削減が可能となるので、データ照合処理の高速化を図ることができると共に、類似データ検索装置、方法およびプログラムでの類似データ検索処理の高速化にも貢献することができる。
以上、実施形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されないことは言うまでもない。上記実施形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。またそのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
例えば、上記第1、第2および第3実施形態では、Bag-of-Features(BoF)表現を用いることとし、画像から抽出された局所特徴量の分布をvisual wordsのヒストグラムで表現したが、これに限定されることなく他のヒストグラム表現(例えば、カラーヒストグラムなど)であっても良い。
また、上記第1、第2および第3実施形態では、画像を対象とした類似画像データ検索システムを例示したが、これに限定されることなく他のメディア(文章、映像、音声など)を対象とした類似データ検索システムに適用することが可能である。例えば、文章を対象とした場合、Bag-of-Words(BoW)表現を用いて文章から抽出された局所特徴量の分布を単語のヒストグラムで表現するようにすれば、上記第1、第2および第3実施形態の構成をそのまま適用させることができる。
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
〔付記〕
<請求項1>
クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算手段と、
前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御手段と、
を備えたヒストグラムインターセクション演算装置。
<請求項2>
前記演算制御手段は、
前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える第1の並び替え手段と、
前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビンが、並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成するビン番号変換テーブル生成手段と、
前記対照データのヒストグラムのビンを、前記ビン番号変換テーブル生成手段により生成された前記ビン番号変換テーブルに従い並び替える第2の並び替え手段と、
を備え、
前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記第1の並び替え手段により並び替えられた前記クエリデータの最大頻度値のヒストグラムのビンから順番に、当該クエリデータのビン番号の頻度値と、前記第2の並び替え手段により並び替えられた対照データのビン番号の頻度値と、を用いて行わせることを特徴とする請求項1に記載のヒストグラムインターセクション演算装置。
<請求項3>
前記演算制御手段は、
前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える第1の並び替え手段と、
前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビンが、並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成するビン番号変換テーブル生成手段と、
を備え、
前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムの最大頻度値のビンから順番に、前記クエリデータのヒストグラムの該ビン番号の頻度値と、前記ビン番号変換テーブルで該ビン番号に対応する並び替え前ビン番号の前記対照データのヒストグラムの頻度値と、を用いて行わせることを特徴とする請求項1に記載のヒストグラムインターセクション演算装置。
<請求項4>
前記演算制御手段は、
前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成する演算順序テーブル生成手段を備え、
前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記演算順序テーブルのシーケンシャル番号の順に、該シーケンシャル番号に対応するビン番号の前記クエリデータのヒストグラムおよび前記対照データのヒストグラムのそれぞれの頻度値を用いて行わせることを特徴とする請求項1に記載のヒストグラムインターセクション演算装置。
<請求項5>
請求項1乃至請求項4の何れか1項に記載のヒストグラムインターセクション演算装置を含み、クエリデータと複数の対照データとのデータ照合を行なうデータ照合装置であって、
前記ヒストグラムインターセクション演算装置により演算されたヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までを記憶するベストスコア値記憶手段と、
前記ヒストグラムインターセクション演算装置がヒストグラムインターセクションの演算を行っている間に、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高くなるか否かを判定する判定手段と、を備え、
前記判定手段により、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高くならないと判定された場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とするデータ照合装置。
<請求項6>
前記判定手段は、
前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビン番号毎に、或いは、前記演算順序テーブルのビン番号に応じた前記クエリデータのヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成する積算ヒストグラム生成手段と、
当該ビン番号における前記ヒストグラムインターセクション演算装置により演算されたスコア値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した加算値を算出する加算手段と、を備え、
前記加算手段により算出された加算値が、前記ベストスコア値記憶手段に記憶されているスコア値より低い場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とする請求項5に記載のデータ照合装置。
<請求項7>
前記判定手段は、
前記ヒストグラムインターセクション演算手段による最終的なスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高い場合、前記ベストスコア値記憶手段に記憶されているスコア値を更新することを特徴とする請求項6に記載のデータ照合装置。
<請求項8>
前記判定手段は、
前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビン番号毎に、或いは、前記演算順序テーブルのビン番号に応じた前記クエリデータのヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成する積算ヒストグラム生成手段と、
当該ビン番号における前記ヒストグラムインターセクション演算装置により演算された値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した加算値を算出する加算手段と、を備え、
前記加算手段により算出された加算値が、所定の値より低い場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とする請求項5に記載のデータ照合装置。
<請求項9>
請求項5に記載のデータ照合装置を含み、複数の対照データの中からクエリデータに類似するデータを検索する類似データ検索装置であって、
前記複数の対照データの中から前記クエリデータに類似するデータを出力する類似データ出力手段を備え、
前記類似データ出力手段は、前記ベストスコア値記憶手段に記憶されているスコア値を算出した際の前記対照データを、前記クエリデータに類似するデータとして出力することを特徴とする類似データ検索装置。
<請求項10>
クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算ステップと、
前記ヒストグラムインターセクション演算ステップによるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御ステップと、
を含むヒストグラムインターセクション演算方法。
<請求項11>
請求項10に記載のヒストグラムインターセクション演算方法を含み、クエリデータと複数の対照データとのデータ照合を行なうデータ照合方法であって、
前記ヒストグラムインターセクション演算方法により演算されたヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までを記憶するベストスコア値記憶ステップと、
前記ヒストグラムインターセクション演算方法でヒストグラムインターセクションの演算を行っている間に、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶ステップにより記憶されているスコア値より高くなるか否かを判定するスコア値判定ステップと、を含み、
前記スコア値判定ステップにより、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶ステップにより記憶されているスコア値より高くならないと判定された場合、前記ヒストグラムインターセクション演算方法によるヒストグラムインターセクションの演算を中止することを特徴とするデータ照合方法。
<請求項12>
請求項11に記載のデータ照合方法を含み、複数の対照データの中からクエリデータに類似するデータを検索する類似データ検索方法であって、
前記複数の対照データの中から前記クエリデータに類似するデータを出力する類似データ出力ステップを含み、
前記類似データ出力ステップは、前記ベストスコア値記憶ステップにより記憶されているスコア値を算出した際の前記対照データを、前記クエリデータに類似するデータとして出力することを特徴とする類似データ検索方法。
<請求項13>
クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算機能と、
前記ヒストグラムインターセクション演算機能によるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御機能と、
を実現させることを特徴とするヒストグラムインターセクション演算のプログラム。
<請求項14>
請求項13に記載のヒストグラムインターセクション演算のプログラムを含み、クエリデータと複数の対照データとのデータ照合を行なうデータ照合のプログラムであって、
前記ヒストグラムインターセクション演算のプログラムにより演算されたヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までを記憶するベストスコア値記憶機能と、
前記ヒストグラムインターセクション演算のプログラムでヒストグラムインターセクションの演算を行っている間に、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶機能により記憶されているスコア値より高くなるか否かを判定するスコア値判定機能と、を実現させ、
前記スコア値判定機能により、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶機能により記憶されているスコア値より高くならないと判定された場合、前記ヒストグラムインターセクション演算のプログラムによるヒストグラムインターセクションの演算を中止することを特徴とするデータ照合のプログラム。
<請求項15>
請求項14に記載のデータ照合のプログラムを含み、複数の対照データの中からクエリデータに類似するデータを検索する類似データ検索のプログラムであって、
前記複数の対照データの中から前記クエリデータに類似するデータを出力する類似データ出力機能を実現させ、
前記類似データ出力機能は、前記ベストスコア値記憶機能により記憶されているスコア値を算出した際の前記対照データを、前記クエリデータに類似するデータとして出力することを特徴とする類似データ検索のプログラム。
1A、1B、1C 演算ユニット
2 照合ユニット
3 検索ユニット
4 記憶部
5 画像データベース
6 VW辞書
9 システムバス
11 前処理部
12 第1の並び替え部
13A ビン番号変換テーブル生成部
13C 演算順序テーブル生成部
14 第2の並び替え部
15A、15B ヒストグラムインターセクション演算部
16A、16B、16C 演算制御部
21 積算ヒストグラム生成部
22 加算部
23 判定部
24 照合制御部
31 類似データ出力部
32 検索制御部
43A ビン番号変換テーブル記憶領域
43C 演算順序テーブル記憶領域
46 ベストスコア値記憶領域

Claims (13)

  1. クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算手段と、
    前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から頻度値の降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御手段と、
    を備えたヒストグラムインターセクション演算装置。
  2. 前記演算制御手段は、
    前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える第1の並び替え手段と、
    前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビンが、並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成するビン番号変換テーブル生成手段と、
    前記対照データのヒストグラムのビンを、前記ビン番号変換テーブル生成手段により生成された前記ビン番号変換テーブルに従い並び替える第2の並び替え手段と、
    を備え、
    前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記第1の並び替え手段により並び替えられた前記クエリデータの最大頻度値のヒストグラムのビンから順番に、当該クエリデータのビン番号の頻度値と、前記第2の並び替え手段により並び替えられた対照データのビン番号の頻度値と、を用いて行わせることを特徴とする請求項1に記載のヒストグラムインターセクション演算装置。
  3. 前記演算制御手段は、
    前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える第1の並び替え手段と、
    前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビンが、並び替え前にどのビン番号であったかを示すビン番号変換テーブルを生成するビン番号変換テーブル生成手段と、
    を備え、
    前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムの最大頻度値のビンから順番に、前記クエリデータのヒストグラムの該ビン番号の頻度値と、前記ビン番号変換テーブルで該ビン番号に対応する並び替え前ビン番号の前記対照データのヒストグラムの頻度値と、を用いて行わせることを特徴とする請求項1に記載のヒストグラムインターセクション演算装置。
  4. 前記演算制御手段は、
    前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成する演算順序テーブル生成手段を備え、
    前記ヒストグラムインターセクション演算手段によるヒストグラムインターセクションの演算を、前記演算順序テーブルのシーケンシャル番号の順に、該シーケンシャル番号に対応するビン番号の前記クエリデータのヒストグラムおよび前記対照データのヒストグラムのそれぞれの頻度値を用いて行わせることを特徴とする請求項1に記載のヒストグラムインターセクション演算装置。
  5. 請求項に記載のヒストグラムインターセクション演算装置を含み、クエリデータと複数の対照データとのデータ照合を行なうデータ照合装置であって、
    前記ヒストグラムインターセクション演算装置により演算されたヒストグラムインターセクションのスコア値の最高スコア値から所定の順位のスコア値までを記憶するベストスコア値記憶手段と、
    前記ヒストグラムインターセクション演算装置がヒストグラムインターセクションの演算を行っている間に、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高くなるか否かを判定する判定手段と、を備え、
    前記判定手段により、当該演算により算出されるヒストグラムインターセクションのスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高くならないと判定された場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とするデータ照合装置。
  6. 前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える第1の並び替え手段を備え、
    前記判定手段は、
    前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成する積算ヒストグラム生成手段と、
    当該ビン番号における前記ヒストグラムインターセクション演算装置により演算されたスコア値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した加算値を算出する加算手段と、を備え、
    前記加算手段により算出された加算値が、前記ベストスコア値記憶手段に記憶されているスコア値より低い場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とする請求項5に記載のデータ照合装置。
  7. 前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替える第1の並び替え手段を備え、
    前記判定手段は、
    前記第1の並び替え手段により並び替えられた前記クエリデータのヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成する積算ヒストグラム生成手段と、
    当該ビン番号における前記ヒストグラムインターセクション演算装置により演算された値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した加算値を算出する加算手段と、を備え、
    前記加算手段により算出された加算値が、所定の値より低い場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とする請求項5に記載のデータ照合装置。
  8. 前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成する演算順序テーブル生成手段を備え、
    前記判定手段は、
    前記演算順序テーブルのビン番号に応じた前記クエリデータのヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成する積算ヒストグラム生成手段と、
    当該ビン番号における前記ヒストグラムインターセクション演算装置により演算されたスコア値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した加算値を算出する加算手段と、を備え、
    前記加算手段により算出された加算値が、前記ベストスコア値記憶手段に記憶されているスコア値より低い場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とする請求項5に記載のデータ照合装置。
  9. 前記クエリデータのヒストグラムのビンを、ヒストグラムの頻度値の降順に並び替え、且つ該ヒストグラムの頻度値が零のビン番号を除いたときのビン番号の数列に対して、1から始まり1ずつ増加するシーケンシャル番号を割り振った演算順序テーブルを生成する演算順序テーブル生成手段を備え、
    前記判定手段は、
    前記演算順序テーブルのビン番号に応じた前記クエリデータのヒストグラムのビン番号毎に、当該ビン番号以降のヒストグラムの頻度値を積算した積算ヒストグラムを生成する積算ヒストグラム生成手段と、
    当該ビン番号における前記ヒストグラムインターセクション演算装置により演算された値と、前記積算ヒストグラム生成手段により生成された当該ビン番号における前記積算ヒストグラムの値を加算した加算値を算出する加算手段と、を備え、
    前記加算手段により算出された加算値が、所定の値より低い場合、前記ヒストグラムインターセクション演算装置によるヒストグラムインターセクションの演算を中止することを特徴とする請求項5に記載のデータ照合装置。
  10. 前記判定手段は、
    前記ヒストグラムインターセクション演算手段による最終的なスコア値が、前記ベストスコア値記憶手段に記憶されているスコア値より高い場合、前記ベストスコア値記憶手段に記憶されているスコア値を更新することを特徴とする請求項5乃至9の何れか一項に記載のデータ照合装置。
  11. 請求項5に記載のデータ照合装置を含み、複数の対照データの中からクエリデータに類似するデータを検索する類似データ検索装置であって、
    前記複数の対照データの中から前記クエリデータに類似するデータを出力する類似データ出力手段を備え、
    前記類似データ出力手段は、前記ベストスコア値記憶手段に記憶されているスコア値を算出した際の前記対照データを、前記クエリデータに類似するデータとして出力することを特徴とする類似データ検索装置。
  12. コンピュータが、
    クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算ステップと、
    前記ヒストグラムインターセクション演算ステップによるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から頻度値の降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御ステップと、
    実行するヒストグラムインターセクション演算方法。
  13. コンピュータに、
    クエリデータのヒストグラムと対照データのヒストグラムとのヒストグラムインターセクションの演算を行い、ヒストグラムインターセクションのスコア値を算出するヒストグラムインターセクション演算機能と、
    前記ヒストグラムインターセクション演算機能によるヒストグラムインターセクションの演算を、前記クエリデータのヒストグラムの最大頻度値のビン番号から頻度値の降順に、当該クエリデータのビン番号の頻度値と、当該クエリデータのビン番号に対応する前記対象データのビン番号の頻度値と、を用いて行わせる演算制御機能と、
    を実現させることを特徴とするヒストグラムインターセクション演算プログラム。
JP2014185783A 2014-09-12 2014-09-12 ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム Active JP6079738B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014185783A JP6079738B2 (ja) 2014-09-12 2014-09-12 ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム
US14/805,019 US9875252B2 (en) 2014-09-12 2015-07-21 Data processing apparatus using calculation of histogram intersection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014185783A JP6079738B2 (ja) 2014-09-12 2014-09-12 ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016057996A JP2016057996A (ja) 2016-04-21
JP6079738B2 true JP6079738B2 (ja) 2017-02-15

Family

ID=55454936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014185783A Active JP6079738B2 (ja) 2014-09-12 2014-09-12 ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム

Country Status (2)

Country Link
US (1) US9875252B2 (ja)
JP (1) JP6079738B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180122079A1 (en) * 2016-10-27 2018-05-03 Qualcomm Incorporated Systems and methods for determining histograms
CN108399678B (zh) * 2017-02-07 2020-09-22 深圳怡化电脑股份有限公司 一种纸币鉴伪的方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010081894A (ko) * 2000-02-18 2001-08-29 구자홍 이종 시스템간의 내용기반 멀티미디어 검색을 가능하게하는 칼라 히스토그램 변환방법, 멀티미디어 검색 방법,데이터 구조 및 멀티미디어 검색 시스템
DE1174804T1 (de) * 2000-07-21 2002-10-02 Lg Electronics Inc Verfahren zum Suchen von Multimedia-Daten mit progressiven Histogrammen
US8004576B2 (en) * 2008-10-31 2011-08-23 Digimarc Corporation Histogram methods and systems for object recognition
US9092520B2 (en) * 2011-06-20 2015-07-28 Microsoft Technology Licensing, Llc Near-duplicate video retrieval

Also Published As

Publication number Publication date
US9875252B2 (en) 2018-01-23
US20160078055A1 (en) 2016-03-17
JP2016057996A (ja) 2016-04-21

Similar Documents

Publication Publication Date Title
KR102431549B1 (ko) 인과 관계 인식 장치 및 그것을 위한 컴퓨터 프로그램
Bao et al. Dictionary learning for sparse coding: Algorithms and convergence analysis
CN110210028B (zh) 针对语音转译文本的领域特征词提取方法、装置、设备及介质
KR101564535B1 (ko) 소프트웨어-업그레이드 추천을 위한 시스템 및 방법
CN107729322B (zh) 分词方法及装置、建立句子向量生成模型方法及装置
CN110428137B (zh) 一种风险防控策略的更新方法及装置
CN110472043B (zh) 一种针对评论文本的聚类方法及装置
JP5755823B1 (ja) 類似度算出システム、類似度算出方法およびプログラム
KR20160064826A (ko) 지식 그래프 기반에서의 의미적 검색 서비스 제공장치 및 그 방법
TW201730788A (zh) 特徵資料處理方法及設備
WO2019198618A1 (ja) 単語ベクトル変更装置、方法、及びプログラム
WO2018051696A1 (ja) データ圧縮方法、データ圧縮装置、コンピュータプログラム及びデータベースシステム
KR102345401B1 (ko) 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체
JP6079738B2 (ja) ヒストグラムインターセクション演算装置、データ照合装置、類似データ検索装置、ヒストグラムインターセクション演算方法およびプログラム
CN114995729A (zh) 一种语音绘图方法、装置及计算机设备
JP6867963B2 (ja) 要約評価装置、方法、プログラム、及び記憶媒体
JP4099197B2 (ja) 概念ベクトル推定方法及び装置及びプログラム及びコンピュータ読取可能な記憶媒体
JP6647475B2 (ja) 言語処理装置、言語処理システムおよび言語処理方法
JP2017142746A (ja) 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム
CN106951548B (zh) 基于rm算法提升特写词语搜索精度的方法及系统
JP2017027106A (ja) 類似度算出装置、類似検索装置、および類似度算出プログラム
CN115794105A (zh) 一种微服务的提取方法、装置以及电子设备
CN111078886B (zh) 基于dmcnn的特殊事件提取系统
CN108388676A (zh) 一种基于模拟退火算法的模具数据匹配方法、装置及系统
JP2004341948A (ja) 概念抽出システム、概念抽出方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170102

R150 Certificate of patent or registration of utility model

Ref document number: 6079738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150