JP7362568B2 - 画像検索装置、画像検索方法、およびプログラム - Google Patents

画像検索装置、画像検索方法、およびプログラム Download PDF

Info

Publication number
JP7362568B2
JP7362568B2 JP2020138182A JP2020138182A JP7362568B2 JP 7362568 B2 JP7362568 B2 JP 7362568B2 JP 2020138182 A JP2020138182 A JP 2020138182A JP 2020138182 A JP2020138182 A JP 2020138182A JP 7362568 B2 JP7362568 B2 JP 7362568B2
Authority
JP
Japan
Prior art keywords
image
images
extracted
candidate
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020138182A
Other languages
English (en)
Other versions
JP2022034405A (ja
Inventor
クマル ティルビードゥラ ビジャヤ
ラビーンダラン ディープー
亮 木山
一視 白井
瞭 原嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2020138182A priority Critical patent/JP7362568B2/ja
Publication of JP2022034405A publication Critical patent/JP2022034405A/ja
Application granted granted Critical
Publication of JP7362568B2 publication Critical patent/JP7362568B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明の実施形態は、画像検索装置、画像検索方法、およびプログラムに関する。
商標画像は、企業や商品を表す目的で法的に登録または定められたマークまたは文字を含む画像である。商標を登録する利点は、商標の所有者に市場においてこの商標を使用する独占権が保証されることである。またこの独占権は、他者による商標の使用を禁止する権利を保証する。登録された商標画像が複製されたりコピーされたりすることを防ぐためには、類似した商標画像が特許庁のデータベースに既に存在するか否かを確認することが必要となる。これによって、著作権を侵害してしまうことを防ぎ、新しく登録された商標画像を新商品に対して付与することができる。
上述したように商標画像は、画像を構成する部分としてマークまたは文字などを含む。従来の画像検索装置を用いて、新しい商標画像と類似した商標画像をデータベースに登録された商標画像の中から検索する場合に、検索対象の新しい商標画像と部分が類似している商標画像が検索結果として選択されないことがあった。
特開2019-175463号公報
本発明が解決しようとする課題は、検索対象と少なくとも一部分が類似している画像を検索できる画像検索装置、画像検索方法、及びプログラムを提供することである。
実施形態の画像検索装置は、検索対象画像取得部と、抽出画像抽出部と、類似度算出部と、選択部とを持つ。検索対象画像取得部は、検索対象画像を取得する。抽出画像抽出部は、前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出する。類似度算出部は、記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出する。選択部は、複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択する。
実施形態の画像検索システム1の機能構成例を示す図。 実施形態の端末装置100の機能構成例を示す図。 実施形態の画像検索装置200の機能構成例を示す図。 実施形態の学習処理の一例を示す図。 実施形態の特徴量抽出処理の一例を示すフローチャート。 実施形態の特徴量抽出処理の一例を示す図。 実施形態の前処理の一例を示す図。 実施形態のセグメンテーション処理の一例を示す図。 実施形態の水平方向統合処理の概要の一例を示す図。 実施形態の垂直方向統合処理の概要の一例を示す図。 実施形態の大きさ統合処理の概要の一例を示す図。 実施形態の形状統合処理の概要の一例を示す図。 実施形態の水平方向統合処理の一例を示すフローチャート。 実施形態の水平方向統合処理における第1条件の一例を示す図。 実施形態の水平方向統合処理における第2条件の一例を示す図。 実施形態の水平方向統合処理における第3条件の一例を示す図。 実施形態の水平方向統合処理における第4条件の一例を示す図。 実施形態の大きさ統合処理の一例を示すフローチャート。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の大きさ統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の形状統合処理における部分画像の状態の一例を示す図。 実施形態の検索処理の一例を示すフローチャート。 実施形態の検索処理の一例を示す図。 実施形態の類似度の算出方法の一例を示す図。 実施形態の類似度にレイアウトスコアを付加した場合と付加しない場合との検索結果の一例を示す図。
以下、実施形態の画像検索装置、画像検索方法、およびプログラムを、図面を参照して説明する。
[画像検索システムの構成]
図1は、実施形態の画像検索システム1の機能構成例を示す図である。画像検索システム1は、例えば、一以上の端末装置100-1~100-n(nは自然数)と、画像検索装置200とを備える。端末装置100と、画像検索装置200とは、インターネットやLAN(Local Area Network)、WAN(Wide Area Network)等を含むネットワークNWを介して通信する。なお、以下の説明において、端末装置100-1~100-nは、それぞれ同様の構成とし、何れの端末装置であるかを区別しないときは、何れの端末装置であるかを示すハイフン以降の符号を省略し、「端末装置100」と称して説明する。
画像検索システム1は、検索対象である商標画像と類似した画像を検索するシステムである。商標画像とは、企業や商品の登録商標、ロゴ、マーク、エンブレム等の画像である。端末装置100は、検索対象画像の入力を受け付ける。画像検索装置200は、端末装置100から検索対象画像を取得すると、取得した検索対象画像と類似した画像を検索する。端末装置100は、検索対象である商標画像に画像の全体だけでなく画像の部分が類似している画像を含めて検索する。以下の説明では、検索対象である商標画像を検索対象画像という。また、検索対象画像と類似する画像の候補を、候補画像という。
[端末装置の構成]
図2は、実施形態の端末装置100の機能構成例を示す図である。端末装置100は、端末装置側通信部110と、端末装置側表示部120と、検索画像受付部130と、検索指示部140と、類似画像選択部150とを備える。端末装置側通信部110を除く各構成要素は、それぞれ、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め端末装置100の記憶部(不図示)に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体に格納されており、記憶媒体がドライブ装置に装着されることで端末装置100のHDDやフラッシュメモリにインストールされてもよい。
端末装置側通信部110は、ネットワークインタフェースである。端末装置側通信部110は、ネットワークNWを介して画像検索装置200と通信を行う。
端末装置側表示部120は、例えば、LCD(Liquid Crystal Display)や有機EL(Electro Luminescence)表示装置等である。端末装置側表示部120は、検索画像受付部130により受け付けられた検索対象画像、画像検索装置200による検索結果、及びGUI(Graphical User Interface)オブジェクト等を表示する。画像検索装置200による検索結果は、候補画像のうち検索対象画像と類似する画像として選択された1以上の候補画像を含む。検索結果では、一例として、選択された1以上の候補画像が、検索対象画像と類似する類似度の順に表示される。類似度とは、候補画像と検索対象画像とが類似している程度を示す指標である。
GUIオブジェクトには、例えば、ボタンやチェックボックス、スライドバー、スイッチ、アイコン等の各種オブジェクトが含まれる。また、GUIオブジェクトは、画像や文字情報等が含まれてもよい。端末装置側表示部120は、例えば、タッチパネル等のように入力と出力とが一体に形成された装置でもよい。
検索画像受付部130は、画像検索装置200に記憶された画像DB(Database)から類似する候補画像を検索する検索対象画像の入力を受け付ける。検索画像受付部130は、端末装置100の記憶部(不図示)により記憶された画像のうち、利用者により選択された画像を検索対象画像として受け付ける。なお、検索画像受付部130は、端末装置100に搭載されたカメラ等の撮像部(不図示)により撮像された画像を検索対象画像として受け付けてもよい。
検索指示部140は、検索画像受付部130により受け付けられた検索対象画像に基づく検索指示を受け付ける。
類似画像選択部150は、画像検索装置200による検索結果に含まれる候補画像のうち、類似度が高い候補画像に比べて検索対象画像により類似している類似度が低い候補画像を類似画像として選択する操作を受け付ける。類似度が低い候補画像が、類似度が高い候補画像に比べて検索対象画像により類似しているか否かは、ユーザによって判定される。類似画像選択部150は、選択された類似画像を示す情報を画像検索装置200に送信する。選択された類似画像を示す情報は、画像検索装置200の検索処理に反映される。
[画像検索装置の構成]
図3は、実施形態の画像検索装置200の機能構成例を示す図である。画像検索装置200は、検索装置側通信部210と、候補画像取得部220と、検索画像取得部230と、検索装置側表示部240と、表示制御部250と、学習部260と、検索部270と、記憶部280とを備える。検索装置側通信部210および記憶部280を除く各構成要素は、それぞれ、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め画像検索装置200の記憶部280に格納されていてもよいし、DVDやCD-ROM等の着脱可能な記憶媒体に格納されており、記憶媒体がドライブ装置に装着されることで画像検索装置200のHDDやフラッシュメモリにインストールされてもよい。
検索装置側通信部210は、例えば、ネットワークインタフェースである。検索装置側通信部210は、例えば、ネットワークNWを介して端末装置100と通信を行う。
候補画像取得部220は、候補画像DB283から候補画像を取得する。
検索画像取得部230は、端末装置100から検索対象画像を取得する。
検索装置側表示部240は、例えば、LCDや有機EL表示装置等である。検索装置側表示部240は、表示制御部250による制御により、候補画像取得部220が取得した候補画像、検索画像取得部230が取得した検索対象画像、及び検索部270によって検索された結果などを表示する。
表示制御部250は、端末装置100に表示させる検索対象画像を入力させるための入力画面を生成する。また、表示制御部250は、検索部270によって検索された結果に関する情報を、端末装置100に表示させる検索結果画面を生成する。生成される画像には、例えば、GUIオブジェクトが含まれてよい。
学習部260は、一例として、深層学習に基づいて候補画像及び検索対象画像からそれぞれ特徴量を抽出するための学習を実行する。学習部260は、深層学習のモデルとして図4に示す学習モデル282を用いる。
図4は、実施形態の学習処理の一例を示す図である。学習部260は、学習画像DB281から学習画像を取得する。学習画像は、相互に類似している画像と、相互に類似していない画像とを含む複数の画像である。学習部260は、取得した学習画像を組にして用いる。それぞれの組には、互いに類似している画像の組と、互いに類似していない画像の組とがある。
学習モデル282は、一例として、1組のCNN(Convolutional Neural Network)を含む。1組のCNNは、互いに重み及びバイアスのパラメータを共有している。学習モデル282は、いわゆるシャム(Siamese)ネットワークである。CNNは、例えば、VGG16である。学習モデル282に含まれるCNNは、画像が入力されると、入力された画像の特徴量を出力する。
学習部260は、学習画像の組に含まれる画像の一方を、一方のCNNに入力し、他方を他のCNNに入力する。学習部260は、1組のCNNからそれぞれ出力される画像の特徴量同士の損失関数を算出する。この損失関数は、例えば、Contrastive Lossである。学習部260は、損失関数を最小化するようにCNNのパラメータを変更する。学習部260は、学習を実行すると、記憶部280に記憶される学習モデル282を、学習済みの学習モデル282によって更新する。学習済みのCNNから出力される特徴量同士の距離は、検索対象画像と候補画像との類似度の算出に用いられる。類似度の詳細については後述する。
学習部260は、画像検索システム1において検索が行われる前に、上述した学習を予め実行する。また、学習部260は、検索装置側通信部210が端末装置100から類似画像を示す情報を受信すると、学習を再度実行する。学習部260は、受信された情報が示す類似画像を用いて学習モデル282のCNNのパラメータを変更する。
図3に戻って画像検索装置200の構成の説明を続ける。
検索部270は、検索処理を実行する。検索部270は、前処理部271と、抽出画像抽出部272と、特徴量抽出部273と、類似度算出部274と、選択部275とを備える。
前処理部271は、候補画像、及び検索対象画像のそれぞれに前処理を実行する。前処理部271は、前処理によって、候補画像、及び検索対象画像のそれぞれから不要な部分を除去する。不要な部分とは、例えば、商標画像に含まれるマークや文字の周囲の余白の部分である。
抽出画像抽出部272は、検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出する。さらに抽出画像抽出部272は、検索対象画像から部分画像に加えて検索対象画像の全体画像を第1抽出画像として抽出する。つまり、第1抽出画像には、検索対象画像から抽出された部分画像と、全体画像とが含まれる。抽出画像抽出部272は、第1抽出画像のうち部分画像同士を統合し、統合した画像を前記第1抽出画像として1以上抽出する。
また、抽出画像抽出部272は、候補画像の一部を切り出した部分画像を第2抽出画像として1以上抽出する。さらに抽出画像抽出部272は、複数の候補画像から部分画像に加えて複数の候補画像の全体画像をそれぞれ第2抽出画像として抽出する。つまり、第2抽出画像には、複数の候補画像からそれぞれ抽出された部分画像と、複数の候補画像からそれぞれ抽出された全体画像とが含まれる。抽出画像抽出部272は、第2抽出画像のうち部分画像同士を統合し、統合した部分画像を第2抽出画像として1以上抽出する。
なお、画像の全体画像とは、画像そのものである。
なお、抽出画像抽出部272が画像の一部を切り出した部分画像を1以上抽出し、部分画像同士を統合する処理を、セグメンテーションともいう。
特徴量抽出部273は、第1抽出画像、及び第2抽出画像のそれぞれから特徴量を抽出する。特徴量抽出部273は、学習済みの学習モデル282を用いて特徴量を抽出する。特徴量抽出部273は、第2抽出画像から抽出した特徴量を特徴量DB284として記憶部280に記憶させる。
類似度算出部274は、記憶部280に記憶された複数の候補画像を参照し、第1抽出画像と、複数の候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の候補画像毎に算出する。類似度算出部274は、第1抽出画像と、第2抽出画像とのそれぞれから抽出された特徴量同士の距離に基づいて類似度を算出する。複数の候補画像は、記憶部280において候補画像DB283として記憶されている。
選択部275は、複数の候補画像の中から、類似度算出部274が算出した類似度に基づいて検索対象画像に類似する候補画像を選択する。
記憶部280は、例えば、HDD、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、またはRAM(Random Access Memory)等により構成される。記憶部280には、例えば、学習画像DB281、学習モデル282、候補画像DB283、及び特徴量DB284などが記憶される。
[特徴量抽出処理]
図5から図32を参照し、画像検索装置200による特徴量抽出処理について説明する。なお、特徴量抽出処理は、検索処理が実行されるより前に予め実行される。
図5は、実施形態の特徴量抽出処理の一例を示すフローチャートである。図6は、実施形態の特徴量抽出処理の一例を示す図である。図6におけるステップS102、ステップS104、及びステップS106は、図5におけるステップS102、ステップS104、及びステップS106にそれぞれ対応する。
候補画像取得部220は、候補画像DB283から複数の候補画像を取得する(ステップS100)。前処理部271は、候補画像取得部220が取得した複数の候補画像それぞれに前処理を実行する(ステップS102)。抽出画像抽出部272は、前処理部271によって前処理が行われた複数の候補画像のそれぞれから一部を切り出した部分画像と、複数の候補画像のそれぞれの全体画像とを第2抽出画像として1以上抽出する(ステップS104)。図6に示す例では、4つの部分画像(部分画像PI1~PI4)と、全体画像とが抽出されている。抽出画像抽出部272は、第2抽出画像のうち候補画像の一部を切り出した部分画像同士を統合する(ステップS106)。抽出画像抽出部272は、統合した部分画像を第2抽出画像として1以上抽出する。
特徴量抽出部273は、複数の第2抽出画像から特徴量をそれぞれ抽出する(ステップS108)。ここで特徴量抽出部273は、学習済みの学習モデル282を用いて特徴量を抽出する。図6に示す例では、4つの部分画像(部分画像PI1~PI4)から特徴量F1からF4がそれぞれ抽出され、全体画像から特徴量F0が抽出されている。特徴量抽出部273は、複数の第2抽出画像から抽出した特徴量を特徴量DB284として記憶部280に記憶させる(ステップS110)。以上で、画像検索装置200は、特徴量抽出処理を終了する。
[前処理]
ここで図7を参照し、ステップS102の前処理の詳細について説明する。図7は、実施形態の前処理の一例を示す図である。前処理部271は、第2抽出画像に対してグレースケール変換処理を実行する(ステップS200)。前処理部271は、グレースケール変換処理において、RGB画像である第2抽出画像の各画素値をグレースケールに変換する。
前処理部271は、グレースケールに変換された第2抽出画像の画素について、各行及び各列それぞれの画素値の合計値を算出する(ステップS202)。ここで前処理部271は、各行及び各列それぞれについて算出した合計値を、算出した合計値の最大値によってそれぞれ除算することによって規格化する。
前処理部271は、各行及び各列の画素値の合計値に基づいて変化点を判定する(ステップS204)。ここで変化点とは、各行または各列の画素値の合計値が、隣接する行または列同士において所定の値以上変化する点である。前処理部271は、列方向について第2抽出画像の一方の行の端から他方の行の端へと各行の合計値について隣接する行同士の差を算出する。前処理部271は、算出した差が所定の閾値以上である場合、隣接する行の境界を列方向についての画素値の変化点として判定する。前処理部271は、同様の処理を、行方向についても行い、隣接する列の境界を、行方向についての画素値の変化点として判定する。
前処理部271は、判定した行方向についての変化点、及び列方向についての変化点に基づいて、第2抽出画像から余白を除去する(ステップS206)。ここで前処理部271は、行方向及び列方向のそれぞれについて画像の端から変化点までを余白として除去する。ここで余白が除去された第2抽出画像の形状は、長方形である。前処理部271は、複数の第2抽出画像について、余白を除去した後、画素をグレースケールからRGB画素へと戻す。あるいは、前処理部271は、RGB画像である第2抽出画像から余白を除去してもよい。以上で、前処理部271は、前処理を終了する。
[セグメンテーション]
次に図8を参照し、ステップS104の第2抽出画像を抽出する処理、及びステップS106の部分画像を統合する処理(セグメンテーション処理)について説明する。図8は、実施形態のセグメンテーション処理の一例を示す図である。
抽出画像抽出部272は、輪郭抽出処理を実行する(ステップS300)。ステップS300の輪郭抽出処理は、ステップS104において第2抽出画像として部分画像を抽出する処理に対応する。輪郭抽出処理において、まず、抽出画像抽出部272は、候補画像に含まれる各部分画像の輪郭を判定する(ステップS302)。抽出画像抽出部272は、例えば、エッジ検出の技術を用いて輪郭を判定する。さらに抽出画像抽出部272は、判定した輪郭に外接する矩形を部分画像の輪郭とする。輪郭抽出処理において、次に、抽出画像抽出部272は、輪郭を判定した部分画像について、面積が所定の面積以下である部分画像を、第2抽出画像の中から除去する(ステップS304)。
抽出画像抽出部272は、統合処理を実行する(ステップS306)。抽出画像抽出部272は、統合処理において、水平方向統合処理(ステップS308)、垂直方向統合処理(ステップS310)、大きさ統合処理(ステップS312)、及び形状統合処理(ステップS314)をそれぞれ並行して実行する。
統合処理のうち水平方向統合処理及び垂直方向統合処理は、部分画像のうち文字を含む部分画像同士を統合する処理である。水平方向統合処理及び垂直方向統合処理では、文字列が抽出される。
一方、統合処理のうち大きさ統合処理及び形状統合処理は、部分画像のうち文字以外の画像を含む部分画像同士を統合する処理である。ここで文字以外の画像とは、例えば、マーク、図形、模様などである。大きさ統合処理及び形状統合処理では、複数の図形の集まりである図形が抽出される。
ここで図9から図12を参照し、統合処理の概要について説明する。
図9は、実施形態の水平方向統合処理の概要の一例を示す図である。図9では、候補画像において、色が類似している部分画像SG11~SG18が水平方向に直線状に並んでいる。抽出画像抽出部272は、水平方向に直線状に並んでいる部分画像SG11~SG18同士を統合して、部分画像SG19を生成する。ここで抽出画像抽出部272は、水平方向に直線状に並んでいる部分画像のうち、色が類似している部分画像同士を統合する。
図10は、実施形態の垂直方向統合処理の概要の一例を示す図である。図9では、候補画像において、色が類似している部分画像SG21~SG27が垂直方向に直線状に並んでいる。抽出画像抽出部272は、垂直方向に直線状に並んでいる部分画像SG21~SG27同士を統合して、部分画像SG28を生成する。ここで抽出画像抽出部272は、垂直方向に直線状に並んでいる部分画像のうち、色が類似している部分画像同士を統合する。
図11は、実施形態の大きさ統合処理の概要の一例を示す図である。図11では、候補画像において、部分画像SG31~SG35が円形に並んでいる。抽出画像抽出部272は、部分画像SG31~SG35のうち、輪郭の面積、及び輪郭の周囲の長さが同程度であり、かつ互いに距離が近い部分画像同士を統合して、部分画像SG36、及び部分画像SG37を生成する。
図12は、実施形態の形状統合処理の概要の一例を示す図である。図12では、候補画像において、形状が類似している複数の図形の集まりである部分画像SG41が並んでいる。部分画像SG41では、形状が類似している図形とは、様々な大きさの複数の円である。抽出画像抽出部272は、部分画像SG41を構成する形状が類似しており、かつ互いに距離が近い複数の図形同士を統合して部分画像SG42を生成する。
[水平方向統合処理]
図13から図17を参照し、水平方向統合処理の詳細について説明する。図13は、実施形態の水平方向統合処理の一例を示すフローチャートである。抽出画像抽出部272は、部分画像それぞれに初期値のIDを付与する(ステップS400)。
抽出画像抽出部272は、部分画像それぞれについて初期値のIDをもつ部分画像があるか否かを判定する(ステップS402)。抽出画像抽出部272は、初期値のIDをもつ部分画像があると判定する場合(ステップS402;YES)、ステップS404の処理を実行する。一方、抽出画像抽出部272は、初期値のIDをもつ部分画像がないと判定する場合(ステップS402;NO)、水平方向統合処理を終了する。
抽出画像抽出部272は、初期値のIDをもついずれかの部分画像のIDを更新し、処理対象を別の部分画像に変更する(ステップS404)。
抽出画像抽出部272は、処理対象が初期値のIDをもつ部分画像であるか否かを判定する(ステップS406)。抽出画像抽出部272は、処理対象が初期値のIDをもつ部分画像であると判定する場合(ステップS406;YES)、ステップS408の処理を実行する。一方、抽出画像抽出部272は、処理対象が初期値のIDをもつ部分画像でないと判定する場合(ステップS406;NO)、ステップS416の処理を実行する。
抽出画像抽出部272は、IDを更新した部分画像と、初期値のIDをもつ部分画像とについて所定の条件が満たされているか否かを判定する(ステップS408)。ここで抽出画像抽出部272は、例えば、所定の条件として第1条件から第4条件の4種類の条件を判定する。
ここで図14から図17を参照しながら、ステップS408における所定の条件について説明する。
ステップS408において抽出画像抽出部272が判定する第1条件は、部分画像同士の中心点の水平方向の距離が所定の距離以上であることである。ここで中心点とは、例えば、重心である。図14に示すように、部分画像SG51の中心点P51と、部分画像SG52の中心点P52との水平方向の距離は、所定の距離以上である。一方、部分画像SG53の中心点P53と、部分画像SG54の中心点P54との水平方向の距離は、所定の距離未満である。部分画像同士の中心点の水平方向の距離は遠い方が、複数の部分画像が文字列として抽出される精度は高い。部分画像同士の中心点の水平方向の距離が近い場合は、部分画像のうちいずれか一方の部分画像が他方の部分画像内に含まれている場合がある。
ステップS408において抽出画像抽出部272が判定する第2条件は、部分画像同士の中心点の垂直方向の距離が所定の距離未満であることである。図15に示すように、部分画像SG61の中心点P61と、部分画像SG62の中心点P62との垂直方向の距離は、所定の距離未満である。一方、部分画像SG63の中心点P63と、部分画像SG64の中心点P64との垂直方向の距離は、所定の距離以上である。部分画像同士の中心点の垂直方向の距離は近い方が、複数の部分画像が文字列として抽出される精度は高い。部分画像同士の中心点の垂直方向の距離が遠い場合、それらの部分画像は直線状に並んでいない場合がある。
ステップS408において抽出画像抽出部272が判定する第3条件は、部分画像同士の色のヒストグラムの距離が所定の距離未満であることである。図16に示すように、部分画像SG71の色のヒストグラムと、部分画像SG72の色のヒストグラムとの距離は、所定の距離未満である。一方、部分画像SG73の色のヒストグラムと、部分画像SG74の色のヒストグラムとの距離は、所定の距離以上である。部分画像同士の色のヒストグラムの距離は近い方が、複数の部分画像が文字列として抽出される精度は高い。つまり、部分画像に含まれる文字は似た色である方が、部分画像同士が統合されて文字列として抽出される精度は高い。
ステップS408において抽出画像抽出部272が判定する第4条件は、部分画像同士の面積の差が所定の値未満であることである。図17に示すように、部分画像SG81の面積と部分画像SG82の面積とは同程度であり、部分画像SG81の面積と、部分画像SG82の面積との差は、所定の値未満である。一方、部分画像SG83の面積は部分画像SG84の面積に比べて大きく、部分画像SG83の面積と、部分画像SG84の面積との差は、所定の値以上である。部分画像同士の面積の差は小さい方が、複数の部分画像が文字列として抽出される精度は高い。つまり、部分画像に含まれる文字は同程度の大きさである方が、部分画像同士が統合されて文字列として抽出される精度は高い。
図13に戻って、水平方向統合処理の説明を続ける。
特徴量抽出部273は、IDを更新した部分画像と、初期値のIDをもつ部分画像とについて、上述した全ての所定の条件が満たされているか否かを判定する(ステップS410)。特徴量抽出部273は、全ての所定の条件が満たされていると判定する場合(ステップS410;YES)、ステップS412の処理を実行する。一方、特徴量抽出部273は、全ての所定の条件が満たされていないと判定する場合(ステップS410;NO)、ステップS416の処理を実行する。
特徴量抽出部273は、IDを更新した部分画像のIDと同じIDを、初期値のIDをもつ部分画像に付与する(ステップS412)。
特徴量抽出部273は、全ての部分画像を処理対象としたか否かを判定する(ステップS414)。特徴量抽出部273は、全ての部分画像を処理対象としたと判定する場合(ステップS414;YES)、ステップS402の処理を再度実行する。一方、特徴量抽出部273は、全ての部分画像を処理対象としていないと判定する場合(ステップS414;NO)、ステップS416の処理を実行する。
特徴量抽出部273は、処理対象を別の部分画像に変更する(ステップS416)。その後、特徴量抽出部273は、ステップS406の処理を再度実行する。
以上で、特徴量抽出部273は、水平方向統合処理を終了する。
[垂直方向統合処理]
垂直方向統合処理と、上述した水平方向統合処理とでは、ステップS408において抽出画像抽出部272が判定する所定の条件が異なる以外は、処理の内容は同様である。そのため、垂直方向統合処理の説明では、水平方向統合処理と異なる点を説明する。
垂直方向統合処理では、上述した所定の条件のうち、第1条件と、第2条件とが異なる。垂直方向統合処理では、第1条件は、部分画像同士の中心点の垂直方向の距離が所定の距離以上であることである。また、垂直方向統合処理では、第2条件は、部分画像同士の中心点の水平方向の距離が所定の距離未満であることである。垂直方向統合処理では、第3条件及び第4条件は、水平方向統合処理の場合と同様である。
上述したように、抽出画像抽出部272は、候補画像の一部を切り出した部分画像同士を、候補画像内の所定の方向の位置に基づいて統合し、統合した部分画像を第1抽出画像として1以上抽出し、検索対象画像の一部を切り出した部分画像同士を、検索対象画像内の所定の方向の位置に基づいて統合し、統合した部分画像を第2抽出画像として1以上抽出する。ここで所定の方向とは、画像において水平方向、または垂直方向である。なお、所定の方向は、画像において斜めの方向であってもよい。
なお、抽出画像抽出部272は、統合処理の実行前に、例えば、候補画像の一部を切り出した部分画像のうち文字を示す文字部分画像を判定してもよい。抽出画像抽出部272は、判定した文字部分画像について、水平方向統合処理及び垂直方向統合処理を実行する。一方、抽出画像抽出部272は、候補画像の一部を切り出した部分画像のうち、文字部分画像と判定しなかった部分画像について、大きさ統合処理及び形状統合処理を実行する。
その場合、抽出画像抽出部272は、判定した文字部分画像同士を、候補画像内の所定の方向の位置に基づいて統合し、統合した文字部分画像を第2抽出画像として1以上抽出し、検索対象画像の一部を切り出した部分画像のうち文字を示す文字部分画像像同士を、検索対象画像内の所定の方向の位置に基づいて統合し、統合した文字部分画像を第1抽出画像として1以上抽出する。
なお、文字部分画像が判定される場合、抽出画像抽出部272は、判定した文字部分画像同士を、候補画像内の所定の方向の位置に基づいて統合する処理を、文字部分画像に含まれる文字の意味に基づいて実行してもよい。例えば、抽出画像抽出部272は、文字部分画像同士を所定の方向に統合して得られる部分画像に含まれる文字列が、意味をもつ文字列であるか否かを判定する。抽出画像抽出部272は、部分画像に含まれる文字列が意味をもたない場合には、この部分画像を除外する。この場合、抽出画像抽出部272が参照する文字列の意味のデータベースは、例えば、記憶部280、または外部データベースに記憶される。
[大きさ統合処理]
図18から図25を参照し、大きさ統合処理の詳細について説明する。図18は、実施形態の大きさ統合処理の一例を示すフローチャートである。抽出画像抽出部272は、部分画像それぞれに初期値のID及びフラグを付与する(ステップS500)。フラグは、大きさ統合処理における処理の状態を示す。フラグには、「初期状態」であることを示す「0」、「統合中」であることを示す「1」、及び「統合完了」であることを示す「2」がある。図19は、部分画像SG91からSG95それぞれに初期値のID及びフラグが付与された状態を示す。図19では、部分画像SG91からSG95それぞれにフラグとして「0」が付与されている。
抽出画像抽出部272は、部分画像それぞれについて初期値のIDをもつ部分画像があるか否かを判定する(ステップS502)。抽出画像抽出部272は、初期値のIDをもつ部分画像があると判定する場合(ステップS502;YES)、ステップS504の処理を実行する。一方、抽出画像抽出部272は、初期値のIDをもつ部分画像がないと判定する場合(ステップS502;NO)、大きさ統合処理を終了する。
抽出画像抽出部272は、初期値のIDをもついずれかの部分画像のIDを更新しかつこの部分画像のフラグを「統合完了」を示すフラグによって更新し、処理対象を別の部分画像に変更する(ステップS504)。図20は、部分画像SG91からSG95のうち、部分画像SG91のIDが「0」から「1」へと更新され、部分画像SG91に「統合完了」を示すフラグとして「2」が付与された状態を示す。
抽出画像抽出部272は、処理対象が「初期状態」を示すフラグをもつ部分画像であるか否かを判定する(ステップS506)。抽出画像抽出部272は、処理対象が「初期状態」を示すフラグをもつ部分画像であると判定する場合(ステップS506;YES)、ステップS508の処理を実行する。一方、抽出画像抽出部272は、処理対象が「初期状態」を示すフラグをもつ部分画像でないと判定する場合(ステップS506;NO)、ステップS516の処理を実行する。
抽出画像抽出部272は、IDを更新した部分画像と、「初期状態」を示すフラグをもつ部分画像とについて所定の条件が満たされているか否かを判定する(ステップS508)。ここで抽出画像抽出部272は、例えば、所定の条件として、第5条件、第6条件、及び第7条件を判定する。第5条件とは、部分画像同士の中心点の距離が所定の距離未満であることである。第6条件とは、部分画像同士の面積の差が所定の値未満であることである。第7条件とは、部分画像同士の輪郭の長さの差が所定の値未満であることである。
特徴量抽出部273は、IDを更新した部分画像と、「初期状態」を示すフラグをもつ部分画像とについて、上述した全ての所定の条件が満たされているか否かを判定する(ステップS510)。特徴量抽出部273は、全ての所定の条件が満たされていると判定する場合(ステップS510;YES)、ステップS512の処理を実行する。一方、特徴量抽出部273は、全ての所定の条件が満たされていないと判定する場合(ステップS510;NO)、ステップS516の処理を実行する。
図20では、「初期状態」を示すフラグをもつ部分画像SG92からSG95のうち、部分画像SG92及び部分画像SG95が、部分画像SG91に対して上述した全ての所定の条件を満たす。
特徴量抽出部273は、IDを更新した部分画像のIDと同じID、及び「統合中」を示すフラグを、「初期状態」を示すフラグをもつ部分画像に付与する(ステップS512)。図21は、部分画像SG91に対して、全ての所定の条件を満たす部分画像SG92及び部分画像SG95に、部分画像SG91と同じID、及び「統合中」を示すフラグが付与された状態を示す。さらに、IDが更新された部分画像SG92及び部分画像SG95のうち部分画像SG95と、「初期状態」を示すフラグをもつ部分画像SG93及び部分画像SG94との間で、所定の条件が満たされているかが判定される。
図22は、図21において「初期状態」を示すフラグをもっていた部分画像SG94のフラグが「統合中」を示すフラグによって更新された状態を示す。
特徴量抽出部273は、「統合中」を示すフラグをもつ部分画像がないか否かを判定する(ステップS514)。特徴量抽出部273は、「統合中」を示すフラグをもつ部分画像がないとしたと判定する場合(ステップS514;YES)、ステップS502の処理を再度実行する。一方、特徴量抽出部273は、「統合中」を示すフラグをもつ部分画像があると判定する場合(ステップS514;NO)、ステップS516の処理を実行する。
特徴量抽出部273は、処理対象を別の部分画像に変更する(ステップS516)。その後、特徴量抽出部273は、ステップS506の処理を再度実行する。
以上で、特徴量抽出部273は、大きさ統合処理を終了する。
図23は、部分画像SG91からSG95のフラグがそれぞれ「統合完了」を示すフラグによって更新された状態を示す。
図24は、部分画像SG91からSG95について大きさ統合処理が完了した後、「初期状態」を示すフラグをもつ部分画像SG101からSG103がある状態を示す。図25は、部分画像SG101からSG103に対して、上述したステップS504からステップS514までの処理が実行されて、それぞれのフラグが「統合完了」を示すフラグによって更新された状態を示す。
上述したように、抽出画像抽出部272は、候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を第2抽出画像として1以上抽出し、検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を第1抽出画像として1以上抽出する。
[形状統合処理]
形状統合処理と、上述した大きさ統合処理とでは、ステップS508において抽出画像抽出部272が判定する所定の条件が異なる以外は、処理の内容は同様である。そのため、形状統合処理の説明では、大きさ統合処理と異なる点を説明する。
形状統合処理では、上述した所定の条件のうち、第6条件及び第7条件の代わりに第8条件が判定される点が異なる。つまり、形状統合処理では、図18に示したステップS50において、所定の条件として第5条件及び第8条件が判定される。第8条件とは、部分画像同士の形状の差が所定の値未満であることである。抽出画像抽出部272は、部分画像同士の形状の差を、構造的類似性を測る指標であるSSIMや、勾配方向ヒストグラム(Histograms of Oriented Gradients:HOG)などの画像特徴量に基づいて算出する。
図26から図30は、部分画像SG111からSG115に対して形状統合処理が実行される過程をそれぞれ示す。最初に、部分画像SG111のフラグが「初期状態」から「統合完了」に更新される。「初期状態」を示すフラグをもつ部分画像SG112からSG115のうち、部分画像SG111と距離及び形状が近い部分画像が判定される。判定の結果、部分画像SG112及び部分画像SG115のIDは、部分画像SG111のIDによって更新され、フラグは「統合中」を示すフラグに更新される。さらに、部分画像SG115のフラグが「統合中」から「統合完了」に更新される。「初期状態」を示すフラグをもつ部分画像SG113及び部分画像SG114のうち、部分画像SG115と距離及び形状が近い部分画像が判定される。判定の結果、部分画像SG114のIDは、部分画像SG115のIDによって更新され、フラグは「統合中」を示すフラグに更新される。
さらに図31及び図32は、部分画像SG111からSG115について形状統合処理が完了した後、部分画像SG121からSG123に対して形状統合処理が実行される過程をそれぞれ示す。
上述したように、抽出画像抽出部272は、候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を第2抽出画像として1以上抽出し、検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を第1抽出画像として1以上抽出する。
図8に戻ってセグメンテーションの処理の説明を続ける。
抽出画像抽出部272は、重複除去処理を実行する(ステップS316)。上述したステップS306の統合処理では、互いに類似した複数の部分画像が重複して生成される場合がある。抽出画像抽出部272は、重複除去処理によって、互いに類似した複数の部分画像を除去する。
抽出画像抽出部272は、重複除去処理のうち、ステップS318、ステップS322、及びステップS326の処理をそれぞれ並行して実行する。また、抽出画像抽出部272は、重複除去処理のうち、ステップS320、ステップS324、及びステップS328の処理をそれぞれ並行して実行する。ステップS316の説明では、上述した水平方向統合処理、垂直方向統合処理、大きさ統合処理、及び形状統合処理によってそれぞれ統合された部分画像を、それぞれ水平統合部分画像、垂直統合部分画像、大きさ統合部分画像、及び形状統合部分画像という。
抽出画像抽出部272は、形状統合部分画像内に含まれる形状統合部分画像を除去する(ステップS318)。ステップS318を実行した後、抽出画像抽出部272は、水平統合部分画像、垂直統合部分画像、及び大きさ統合部分画像内に含まれる形状統合部分画像を除去する(ステップS320)。
抽出画像抽出部272は、大きさ統合部分画像内に含まれる水平統合部分画像、垂直統合部分画像、及び形状統合部分画像を除去する(ステップS322)。ステップS320及びステップS322を実行した後、抽出画像抽出部272は、形状統合部分画像内に含まれる水平統合部分画像、及び垂直統合部分画像を除去する(ステップS324)。
抽出画像抽出部272は、水平統合部分画像、垂直統合部分画像、及び大きさ統合部分画像内に含まれる部分画像を除去する(ステップS326)。ステップS320及びステップS326を実行した後、抽出画像抽出部272は、形状統合部分画像内に含まれる大きさ統合部分画像内を除去する(ステップS328)。
以上で、抽出画像抽出部272は、重複除去処理を終了する。
抽出画像抽出部272は、後処理を実行する(ステップS332)。後処理において、まず、抽出画像抽出部272は、アスペクト比フィルター処理を実行する(ステップS334)。アスペクト比フィルター処理において、抽出画像抽出部272は、アスペクト比が所定の値以上である部分画像を除外する。
次に、抽出画像抽出部272は、重なりフィルター処理実行する(ステップS334)。重なりフィルター処理において、抽出画像抽出部272は、部分画像同士が重なっている面積を算出する。抽出画像抽出部272は、算出した面積が所定の値以上である場合、互いに重なっている部分画像のうち面積が小さい方を除外する。
抽出画像抽出部272は、上述した処理の後に残った部分画像について、部分画像の数が所定の数以上であるか否かを判定する(ステップS336)。抽出画像抽出部272は、部分画像の数が所定の数以上であると判定する場合(ステップS336;YES)、ステップS338の処理を実行する。一方、抽出画像抽出部272は、部分画像の数が所定の数以上ではないと判定する場合(ステップS336;NO)、ステップS340の処理を実行する。
抽出画像抽出部272は、面積の大きい順に所定の数だけ部分画像を選択する(ステップS338)。その後、抽出画像抽出部272は、部分画像の組を確定する(ステップS340)。抽出画像抽出部272は、確定した部分画像の組に含まれる部分画像について、相互に同じ所定の大きさの画像となるように拡大または縮小を行う。
以上で、抽出画像抽出部272は、セグメンテーションの処理を終了する。
[検索処理]
図33から図36を参照し、画像検索装置200による検索処理について説明する。
図33は、実施形態の検索処理の一例を示すフローチャートである。図34は、実施形態の検索処理の一例を示す図である。図34におけるステップS602、ステップS604、ステップS606、ステップS610、及びステップS614は、図33におけるステップS602、ステップS604、ステップS606、ステップS610、及びステップS614にそれぞれ対応する。
なお、ステップS602、ステップS604、ステップS606、及びステップS608の各処理は、図5におけるステップS102、ステップS104、ステップS106、及びステップS108の各処理と、処理対象が候補画像の代わりに検索対象画像である点以外は同様であるため、説明を省略する。
検索画像取得部230は、端末装置100から検索対象画像を取得する(ステップS600)。
類似度算出部274は、類似度を算出する(ステップS610)。ここで類似度算出部274は、検索画像取得部230が取得した検索対象画像から抽出された1以上の第2抽出画像と、候補画像から抽出された1以上の第1抽出画像との全ての組合せについて個別類似度を算出する。類似度算出部274は、算出した個別類似度に基づいて、類似度を複数の候補画像毎に算出する。ここで個別類似度とは、第1抽出画像と第2抽出画像との類似の程度を示す指標である。一方、類似度は、検索対象画像と候補画像との類似の程度を示す指標である。類似度算出部274は、算出した類似度を候補画像DB283に含まれる候補画像にそれぞれ付与する。
図35は、実施形態の類似度の算出方法の一例を示す図である。全体画像Iq0、部分画像Iq1、部分画像Iq2、及び部分画像Iq3は、検索対象画像から抽出された1以上の第2抽出画像である。全体画像Idb0、部分画像Idb1、部分画像Idb2、及び部分画像Idb3は、候補画像から抽出された1以上の第1抽出画像である。上述したように、類似度算出部274は、1以上の第2抽出画像と、1以上の第1抽出画像との全ての組合せについて個別類似度を算出する。個別類似度は、第1抽出画像と第2抽出画像との類似の程度を示す指標である。
類似度算出部274は、式(1)によって示される距離に基づいて類似度を算出する。
Figure 0007362568000001
式(1)においてCDは抽出画像間距離を示す。抽出画像間距離は個別類似度に対応し、個別類似度は抽出画像間距離が小さいほど高くなる。式(1)が示す通り、類似度は、検索対象画像から抽出された1以上の第2抽出画像と、候補画像から抽出された1以上の第1抽出画像との全ての組合せについての抽出画像間距離の最小値である。検索対象画像と候補画像とが類似しているほど、式(1)によって示される距離は小さくなる。類似度算出部274は、式(1)によって示される距離が小さいほど、類似度を高く算出する。例えば、類似度算出部274は、式(1)によって示される距離の逆数として類似度を算出する。
抽出画像間距離は、式(2)によって示されるコサイン距離に対応する。
Figure 0007362568000002
式(2)において、Akは、第1抽出画像から抽出された特徴量を示す。一方、Bkは、第2抽出画像から抽出された特徴量を示す。それぞれの特徴量の次元は共通である。特徴量の次元は、例えば、4096次元である。抽出画像間距離は、ユークリッド距離などコサイン距離以外の距離に基づいて算出されてもよい。第1抽出画像と、第2抽出画像とが類似しているほど、式(2)によって示されるコサイン距離は小さくなる。上述したように抽出画像間距離は個別類似度に対応するため、抽出画像間距離を算出することは個別類似度を算出することに対応する。個別類似度は抽出画像間距離が小さいほど高くなるように算出される。例えば、類似度算出部274は、抽出画像間距離の逆数として個別類似度を算出する。
なお、類似度算出部274は、複数の候補画像の中から、第1抽出画像と第2抽出画像との抽出画像間距離と、候補画像の全体の画像と検索対象画像の全体の画像との抽出画像間距離に所定の重みづけがされた値とに基づいて、類似度を複数の候補画像毎に算出してもよい。換言すれば、類似度算出部274は、複数の候補画像の中から、第1抽出画像と第2抽出画像との個別類似度と、候補画像の全体の画像と検索対象画像の全体の画像との個別類似度に所定の重みづけがされた値とに基づいて、類似度を複数の候補画像毎に算出してもよい。その場合、類似度は、式(3)によって示される距離に基づいて算出される。
Figure 0007362568000003
式(3)において、第1項は式(1)と同じであり、第2項はレイアウトスコアに対応する。レイアウトスコアとは、全体画像同士の抽出画像間距離に重みを乗じた値である。CD(Iq0、Idb0)は、全体画像Iq0と全体画像Idb0との抽出画像間距離であるレイアウトスコアを示す。重みKは定数である。
レイアウトスコアを付加することによって、複数の候補画像が検索対象画像に対して部分画像同士が同程度類似している場合に、それらの複数の候補画像の中から検索対象画像に対して全体画像が似ている候補画像が検索結果において上位となる。
ここで図36を参照し、レイアウトスコアを付加した場合の類似度と付加しない場合の類似度との違いについて説明する。図36は、実施形態の類似度にレイアウトスコアを付加した場合と付加しない場合との検索結果の一例を示す図である。
検索対象画像と候補画像とにおいて、同一の図形が部分画像として抽出されると、それらの検索対象画像と候補画像とから抽出される特徴量は同じになる。図36に示す例では、検索対象画像Q1からマークMQ1が部分画像として抽出され、候補画像D1からマークMD1が部分画像として抽出されている。
マークMQ1と、マークMD1とは同一の図形である。そのため、検索対象画像Q1から抽出される特徴量と、候補画像D1から抽出される特徴量とが同じになる。上述したように、類似度は、検索対象画像から抽出された1以上の第2抽出画像と、候補画像から抽出された1以上の第1抽出画像との全ての組合せについての抽出画像間距離の最小値である。その結果、検索対象画像Q1と候補画像D1との類似度は、検索対象画像Q1と候補画像D2との類似度、検索対象画像Q1と候補画像D3との類似度に比べて高くなる。これに応じて、候補画像D1は、検索結果において候補画像D2、候補画像D3よりも上位となる。このように、類似度をそのままスコアにすると、全体的に類似している画像が、全体的に類似していない画像よりも検索結果において下位になる場合がある。
そのため、全体画像同士の類似度に重みを乗じたレイアウトスコアを加えることによって、検索対象画像と全体が類似する候補画像が検索結果において上位になりやすくなる。図36では、候補画像D1は、候補画像D3に比べて検索対象画像Q1に類似している。全体画像同士の類似度に重みを乗じたレイアウトスコアを加えたことによって、候補画像D1が候補画像D3よりも検索結果において上位となっている。
図33に戻って検索処理の説明を続ける。
選択部275は、複数の候補画像の中から、類似度算出部274が算出した類似度に基づいて検索対象画像に類似する候補画像を選択する(ステップS612)。
検索装置側表示部240は、選択部275によって選択された候補画像を表示する(ステップS614)。ここで検索装置側表示部240は、検索部270によって検索された結果として、候補画像を端末装置100の端末装置側表示部120に表示させる。
以上で、画像検索装置200は、検索処理を終了する。
なお、図33に示した検索処理においては、類似度算出部274が、1以上の第2抽出画像と、1以上の第1抽出画像との全ての組合せについて算出した個別類似度に基づいて、類似度を複数の候補画像毎に算出する場合の一例について説明したが、これに限らない。類似度算出部274は、1以上の第2抽出画像と、1以上の第1抽出画像との組み合わせのうち一部について算出した個別類似度に基づいて、類似度を複数の候補画像毎に算出してもよい。
例えば、類似度算出部274は、第1抽出画像と第2抽出画像との中から所定の条件を満たす部分画像を選択し、選択した部分画像について第1抽出画像と第2抽出画像との組み合わせについて個別類似度を算出してもよい。所定の条件とは、例えば、部分画像が文字または文字列を含むこと、部分画像に含まれる文字の数が部分画像の中で最大であること、文字または文字列以外のマーク、図形、模様などを含むこと、矩形の部分画像内に占める余白以外の部分の画素数が、部分画像全体の画素数に対する割合が所定の値以上であること、この割合が部分画像の中で最大であることなどである。
以上で説明した少なくとも一つの実施形態によれば、画像検索装置200は、候補画像取得部220と、抽出画像抽出部272と、類似度算出部274と、選択部275とを持つ。候補画像取得部220は、検索対象画像を取得する。抽出画像抽出部272は、検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出する。類似度算出部274は、記憶部280に記憶された複数の候補画像を参照し、第1抽出画像と、複数の候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の候補画像毎に算出する。選択部275は、複数の候補画像の中から、類似度に基づいて検索対象画像に類似する候補画像を選択する。これによって画像検索装置200は、検索対象の画像と少なくとも一部分が類似している画像を検索できる。
なお、上述した実施形態においては、端末装置100と画像検索装置200とが別体として備えられる場合の一例について説明したが、これに限らない。端末装置100と画像検索装置200とは、一体の装置として備えられてもよい。その場合、例えば、画像検索装置200は、端末装置100の検索画像受付部130、検索指示部140、及び類似画像選択部150を備える。
なお、上述した実施形態においては、画像検索装置200が、学習部260を備える場合の一例について説明したが、これに限らない。学習処理は、画像検索装置200以外の外部装置によって実行されてもよい。その場合、画像検索装置200は、外部装置によって実行された学習結果を取得し、記憶部280に学習モデル282として記憶させる。
また、上述した実施形態においては、画像検索装置200が、候補画像から抽出した特徴量を抽出する場合の一例について説明したが、これに限らない。外部装置によって候補画像から特徴量が抽出されてもよい。その場合、画像検索装置200は、外部装置によって抽出された特徴量を取得し、記憶部280に特徴量DB284として記憶させる。その場合、候補画像DB283は、記憶部280に記憶されている必要はなく、候補画像DB283は外部装置によって記憶されてよい。
上述した実施形態においては、商標画像が検索対象である場合の一例について説明したが、これに限らない。検索対象は商標画像以外の画像、または文章であってもよい。く、検索対象が文章である場合、検索装置は、検索対象の文章と、少なくとも一部分が類似している文章を検索する。また、検索対象は、テキスト、音声データ、動画像など様々な種類のデータであってもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
200…画像検索装置、230…検索画像取得部、272…抽出画像抽出部、274…類似度算出部、275…選択部、280…記憶部、283…候補画像DB

Claims (12)

  1. 検索対象画像を取得する検索対象画像取得部と、
    前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出する抽出画像抽出部と、
    記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出する類似度算出部と、
    複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択する選択部と、
    を備え
    前記抽出画像抽出部は、前記候補画像の一部を切り出した部分画像を前記第2抽出画像として1以上抽出し、
    前記抽出画像抽出部は、前記候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を前記第2抽出画像として1以上抽出し、前記検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を前記第1抽出画像として1以上抽出する
    画像検索装置。
  2. 検索対象画像を取得する検索対象画像取得部と、
    前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出する抽出画像抽出部と、
    記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出する類似度算出部と、
    複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択する選択部と、
    を備え
    前記抽出画像抽出部は、前記候補画像の一部を切り出した部分画像を前記第2抽出画像として1以上抽出し、
    前記抽出画像抽出部は、前記候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を前記第2抽出画像として1以上抽出し、前記検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を前記第1抽出画像として1以上抽出する
    画像検索装置。
  3. 前記抽出画像抽出部は、前記候補画像の一部を切り出した部分画像同士を統合し、統合した部分画像を前記第2抽出画像として1以上抽出し、前記検索対象画像の一部を切り出した部分画像同士を統合し、統合した画像を前記第1抽出画像として1以上抽出する
    請求項1または請求項2に記載の画像検索装置。
  4. 前記抽出画像抽出部は、前記候補画像の一部を切り出した部分画像同士を、前記候補画像内の所定の方向の位置に基づいて統合し、統合した部分画像を前記第1抽出画像として1以上抽出し、前記検索対象画像の一部を切り出した部分画像同士を、前記検索対象画像内の所定の方向の位置に基づいて統合し、統合した部分画像を前記第2抽出画像として1以上抽出する
    請求項3に記載の画像検索装置。
  5. 前記抽出画像抽出部は、前記候補画像の一部を切り出した部分画像のうち文字を示す文字部分画像を判定し、判定した前記文字部分画像同士を、前記候補画像内の所定の方向の位置に基づいて統合し、統合した文字部分画像を前記第2抽出画像として1以上抽出し、前記検索対象画像の一部を切り出した部分画像のうち文字を示す文字部分画像像同士を、前記検索対象画像内の所定の方向の位置に基づいて統合し、統合した文字部分画像を前記第1抽出画像として1以上抽出する
    請求項4に記載の画像検索装置。
  6. 前記類似度算出部は、前記検索対象画像から抽出された1以上の前記第2抽出画像と、前記候補画像から抽出された1以上の前記第1抽出画像との全ての組合せについて個別類似度を算出し、算出した前記個別類似度に基づいて前記類似度を複数の前記候補画像毎に算出する
    請求項から請求項のいずれか一項に記載の画像検索装置。
  7. 前記抽出画像抽出部は、複数の前記候補画像から前記部分画像に加えて複数の前記候補画像の全体画像をそれぞれ前記第2抽出画像として抽出し、前記検索対象画像から前記部分画像に加えて前記検索対象画像の全体画像を前記第1抽出画像として抽出する
    請求項から請求項のいずれか一項に記載の画像検索装置。
  8. 前記類似度算出部は、複数の前記候補画像の中から、前記第1抽出画像と前記第2抽出画像との個別類似度と、前記候補画像の全体の画像と前記検索対象画像の全体の画像との個別類似度に所定の重みづけがされた値とに基づいて、前記類似度を前記複数の候補画像毎に算出する
    請求項に記載の画像検索装置。
  9. 画像検索装置が、
    検索対象画像を取得し、
    前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出し、
    記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出し、
    複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択
    前記候補画像の一部を切り出した部分画像を前記第2抽出画像として1以上抽出し、
    前記候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を前記第2抽出画像として1以上抽出し、前記検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を前記第1抽出画像として1以上抽出する
    画像検索方法。
  10. 画像検索装置が、
    検索対象画像を取得し、
    前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出し、
    記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出し、
    複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択
    前記候補画像の一部を切り出した部分画像を前記第2抽出画像として1以上抽出し、
    前記候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を前記第2抽出画像として1以上抽出し、前記検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を前記第1抽出画像として1以上抽出する
    画像検索方法。
  11. 画像検索装置に、
    検索対象画像を取得させ、
    前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出させ、
    記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出させ、
    複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択させ、
    前記候補画像の一部を切り出した部分画像を前記第2抽出画像として1以上抽出させ、
    前記候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を前記第2抽出画像として1以上抽出し、前記検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の大きさに基づいて統合し、統合した画像を前記第1抽出画像として1以上抽出させる
    プログラム。
  12. 画像検索装置に、
    検索対象画像を取得させ、
    前記検索対象画像の一部を切り出した部分画像を第1抽出画像として1以上抽出させ、
    記憶部に記憶された複数の候補画像を参照し、前記第1抽出画像と、複数の前記候補画像それぞれの一部が切り出された部分画像を含む第2抽出画像との類似の程度に基づく類似度を複数の前記候補画像毎に算出させ、
    複数の前記候補画像の中から、前記類似度に基づいて前記検索対象画像に類似する候補画像を選択させ、
    前記候補画像の一部を切り出した部分画像を前記第2抽出画像として1以上抽出させ、
    前記候補画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を前記第2抽出画像として1以上抽出し、前記検索対象画像から抽出した部分の画像同士を、部分の画像に含まれる図形の形状に基づいて統合し、統合した画像を前記第1抽出画像として1以上抽出させる
    プログラム。
JP2020138182A 2020-08-18 2020-08-18 画像検索装置、画像検索方法、およびプログラム Active JP7362568B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020138182A JP7362568B2 (ja) 2020-08-18 2020-08-18 画像検索装置、画像検索方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020138182A JP7362568B2 (ja) 2020-08-18 2020-08-18 画像検索装置、画像検索方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2022034405A JP2022034405A (ja) 2022-03-03
JP7362568B2 true JP7362568B2 (ja) 2023-10-17

Family

ID=80442203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020138182A Active JP7362568B2 (ja) 2020-08-18 2020-08-18 画像検索装置、画像検索方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7362568B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
渡邉裕樹,廣池敦,ビジョン技術を利用した商業・マーケティング支援,画像ラボ,日本,日本工業出版株式会社,2014年03月10日,第25巻第3号,p69~75

Also Published As

Publication number Publication date
JP2022034405A (ja) 2022-03-03

Similar Documents

Publication Publication Date Title
EP2063393B1 (en) Color classifying method, color recognizing method, color classifying device, color recognizing device, color recognizing system, computer program, and recording medium
US7627148B2 (en) Image data processing apparatus and method, and image data processing program
JP2013077296A (ja) 画像処理装置、画像処理方法およびプログラム
US8666170B2 (en) Computer system and method of matching for images and graphs
US20060008148A1 (en) Character recognition device and method
US7724944B2 (en) Image retrieval method and image retrieval device
EP2328127B1 (en) Foreground area extracting program, foreground area extracting apparatus and foreground area extracting method
JP4946878B2 (ja) 画像識別装置及びプログラム
CN113989167B (zh) 基于种子点自生长的轮廓提取方法、装置、设备及介质
JP2005234603A (ja) 地図情報更新方法及び地図更新装置
CN112926399A (zh) 目标对象检测方法、装置、电子设备和存储介质
CN115131363A (zh) 基于语义信息的定位方法、装置和终端设备
JP2007066019A (ja) 画像検索方法及び装置
CN109785283B (zh) 一种用于织物分割的纹理特征匹配方法及装置
JP2011039944A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP3978962B2 (ja) 情報検索方法および情報検索装置
JP4632830B2 (ja) 画像検索方法及び画像検索装置
JP7362568B2 (ja) 画像検索装置、画像検索方法、およびプログラム
JP3819236B2 (ja) パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2006234678A (ja) 目標識別装置
JP2005208740A (ja) 部分画像検索装置及び部分画像検索プログラム
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2005353101A (ja) 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN113807315B (zh) 一种构建待识别对象识别模型的方法、装置、设备及介质
KR101781359B1 (ko) 족흔 검색 자료 제공 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231004

R150 Certificate of patent or registration of utility model

Ref document number: 7362568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150