JP2013515998A - サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム - Google Patents

サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム Download PDF

Info

Publication number
JP2013515998A
JP2013515998A JP2012545942A JP2012545942A JP2013515998A JP 2013515998 A JP2013515998 A JP 2013515998A JP 2012545942 A JP2012545942 A JP 2012545942A JP 2012545942 A JP2012545942 A JP 2012545942A JP 2013515998 A JP2013515998 A JP 2013515998A
Authority
JP
Japan
Prior art keywords
image
sample image
nodes
searched
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012545942A
Other languages
English (en)
Other versions
JP5665879B2 (ja
Inventor
マンニ デュアン
シンツー ウェン
シュールイ フェン
Original Assignee
アリババ グループ ホールディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホールディング リミテッド filed Critical アリババ グループ ホールディング リミテッド
Publication of JP2013515998A publication Critical patent/JP2013515998A/ja
Application granted granted Critical
Publication of JP5665879B2 publication Critical patent/JP5665879B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

監視する画像の精度を向上するために、サンプル画像インデックステーブルを作成し、画像をフィルタリングし、画像を検索するための方法および装置。画像フィルタリングのための方法は、サンプル画像インデックステーブルを確立することと、検索される画像から領域特徴を抽出することと、検索される画像の領域特徴を対応するノードにクラスタリングすることと、ノード識別を使用してサンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得することと、検索される画像と、サンプル画像との間の重複ノードの数を判定することと、検索される画像のノードの数およびサンプル画像のノードの数に基づいて、検索される画像の類似度を取得することと、検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合に、検索される画像をフィルタリング除去することと、を含む。

Description

本発明は、サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステムに関する。
関連出願の相互参照
本出願は、2009年12月24日に出願された中国特許出願第200910260175.5号、名称「METHOD AND SYSTEM FOR SAMPLE IMAGE INDEX CREATION AND IMAGE FILTERING AND SEARCH」の優先権を主張し、参照によりその全体が本明細書に組み込まれる。
本開示は、画像認識技術分野に関し、具体的には、サンプル画像インデックス作成ならびに画像フィルタリングおよび検索のための方法およびシステムに関する。
インターネット企業は概して、画像を監視する必要性を有する。例えば、Taobao.com等の電子商取引プラットフォーム上でのオンライン取引において、武器および薬物等の違法な物品が不可避的に出現する。アップロードされた画像が法律および規制に準拠することを確実にする必要性が存在する。物品監視のための従来の方法は、物品名および物品の説明文等のテキスト情報を監視することである。検出されることを避けるために、違反者はしばしば、違法な物品を説明するために暗示的な、不明瞭な言い回しまたはヒントを使用する。この状況は、Taobao.comのようなプラットフォームが物品を監視する際に多大な困難をもたらす。
現在、基本的な画像フィルタリングのための理論が既に存在し、その基本は画像認識技術である。しかしながら、実際にはまだ多数の問題が存在する。例えば、ある既知のソフトウェアは、画像認識に基づいて、積極的なポルノ画像監視技術を提供する。そのようなソフトウェアは、皮膚の色のセグメンテーションに基づいて、裸の皮膚の大部分を含む可能性がある画像を識別する。そのようなソフトウェアの利点は、ポルノ画像を積極的にブロックできることである。しかし、皮膚の色のセグメンテーションに基づくため、非ポルノ画像をポルノ画像として識別する可能性が高い。エラー率は極めて高い。
画像認識技術自体が発展途上の研究分野である。異なる画像コンテンツをどのように効果的かつ効率的にモデル化するかは、まだ研究者を悩ませている。比較的発展した研究分野である、ポルノ画像の分類の場合も、まだ満足できる実際的な効果は存在しない。オンライン取引のアプリケーション分野において監視されているオブジェクトは、異なる分野の画像が全て監視対象のオブジェクトとなる可能性があるため、ポルノ画像、書籍、薬物、武器、個人情報文書、化粧品等に限定されない。さらに、オンライン取引で監視されることが必要な画像の変化の速度は非常に速く、画像認識に基づいた従来のフィルタリング技術は、オンライン取引のアプリケーションには十分ではない。
画像認識に基づいた現在のフィルタリング技術は、低い精度のために、オンライン取引の商用アプリケーションを満足させることができない。
本開示は、画像監視の精度を向上するために、サンプル画像インデックステーブルを作成し、画像をフィルタリングするための方法および装置を提供する。
一態様に従い、サンプル画像インデックステーブルを作成するための方法は、サンプル画像から領域特徴を抽出することと、サンプル画像の領域特徴を複数のノードにクラスタリングすることであって、それぞれのノードのそれぞれの領域特徴が、同じ類似度を有し、各ノードがそれぞれのノード識別に対応することと、サンプル画像インデックステーブルを確立することであって、サンプル画像インデックステーブルが、複数のノードのうちの第1のノードの第1のノード識別と、サンプル画像の識別と、第1のノードのそれぞれの領域特徴がサンプル画像に出現する回数との間の相関を記憶し、サンプル画像インデックステーブルが、サンプル画像のノードのノード識別と、サンプル画像の中のノードの数のカウントとをさらに記憶することと、を含む。
一実施形態において、サンプル画像から領域特徴を抽出することは、スケール不変性を用いる抽出アルゴリズムを使用することによって、サンプル画像から領域特徴を抽出することを含むことができる。抽出アルゴリズムは、Linderbergスケール不変性理論(scale invariability theory)に基づいた特徴検出器またはDavid Loweのスケール不変特性変換(SIFT)様の高次元記述子アルゴリズムであってもよい。
一実施形態において、領域特徴は、領域特徴ベクトルであってもよく、サンプル画像の領域特徴をクラスタリングすることは、定義されたクラスタリングアルゴリズムを使用して、サンプル画像の領域特徴ベクトルの間のそれぞれの距離を計算することと、サンプル画像の領域内にあり、かつ距離閾値よりも小さいそれぞれの距離を有する、領域特徴の数を同じノードに分類することと、を含むことができる。
別の態様に従い、画像フィルタリングのための方法は、サンプル画像インデックステーブルを確立することであって、サンプル画像インデックステーブルが、複数のノードのノード識別と、複数のノードにクラスタリングされる領域特徴を有するサンプル画像の識別と、ノードの各々のそれぞれの領域特徴がサンプル画像に出現する回数との間の相関を記憶し、サンプル画像インデックステーブルが、サンプル画像のノードのノード識別と、サンプル画像の中のノードの数のカウントとをさらに記憶することと、検索される画像から領域特徴を抽出することと、検索される画像の領域特徴を対応するノードにクラスタリングすることと、検索される画像のノードのノード識別を使用して、サンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得することと、検索される画像と、サンプル画像との間の重複ノードの数を判定することと、検索される画像のノードの数およびサンプル画像のノードの数に基づいて、検索される画像の類似度を取得することと、検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合に、検索される画像をフィルタリング除去することと、をさらに含む。
一実施形態において、検索される画像の類似度の程度を取得することは、検索される画像のノードの数と、サンプル画像のノードの数とを比較して、両者のうちの小さい方の数を提供することと、検索される画像とサンプル画像との間の類似度の程度を、検索される画像とサンプル画像との間の重複ノードの数と小さい方の数との比率として取得することと、を含むことができる。
別の実施形態において、検索される画像の類似度の程度を取得することは、検索される画像のノードの数と、サンプル画像のノードの数とを比較して、両者の間の大きい方の数を提供することと、検索される画像とサンプル画像との間の類似度を、検索される画像とサンプル画像との間の重複ノードの数と大きい方の数との比率として取得することと、を含むことができる。
別の態様に従い、サンプル画像インデックステーブルを作成するための装置は、サンプル画像から領域特徴を抽出する、特徴抽出ユニットと、サンプル画像の領域特徴を、各々が同じ類似度を有するそれぞれの数の領域特徴を有する複数のノードにクラスタリングする、クラスタリングユニットであって、各ノードが、それぞれのノード識別に対応する、クラスタリングユニットと、サンプル画像インデックステーブルを確立する記憶ユニットであって、サンプル画像インデックステーブルが、複数のノードのうちの第1のノードの第1のノード識別と、サンプル画像の識別と、第1のノードのそれぞれの領域特徴がサンプル画像に出現する回数との間の相関を記憶し、サンプル画像インデックステーブルが、サンプル画像のノードのノード識別と、サンプル画像の中のノードの数のカウントとをさらに記憶する、記憶ユニットと、を備えることができる。
一実施形態において、特徴抽出ユニットは、スケール不変性を用いる抽出アルゴリズムを使用することによって、サンプル画像から領域特徴を抽出してもよい。抽出アルゴリズムは、Linderbergスケール不変性理論に基づいた特徴検出器またはDavid Loweのスケール不変特性変換(SIFT)様の高次元記述子アルゴリズムであってもよい。
一実施形態において、領域特徴は、領域特徴ベクトルであってもよく、クラスタリングユニットは、定義されたクラスタリングアルゴリズムを使用して、サンプル画像の領域特徴ベクトルの間のそれぞれの距離を計算し、サンプル画像の領域内にあり、かつ距離閾値より小さいそれぞれの距離を有する領域特徴の数を同じノードに分類することができる。
別の態様に従い、画像フィルタリングのための装置は、サンプル画像インデックステーブルを記憶する記憶ユニットであって、サンプル画像インデックステーブルが、複数のノードのノード識別と、複数のノードにクラスタリングされる領域特徴を有するサンプル画像の識別と、ノードの各々のそれぞれの領域特徴がサンプル画像に出現する回数との間の相関を記憶し、サンプル画像インデックステーブルが、サンプル画像のノードのノード識別と、サンプル画像の中のノードの数のカウントとをさらに記憶する、記憶ユニットと、検索される画像から領域特徴を抽出する、抽出ユニットと、検索される画像の領域特徴を対応するノードにクラスタリングする、ノード判定ユニットと、検索される画像のノードのノード識別を使用してサンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得する、インデックスユニットと、検索される画像と、サンプル画像との間の重複ノードの数を計算する、計算ユニットと、検索される画像のノードの数およびサンプル画像のノードの数に基づいて、検索される画像の類似度を取得する、類似度計算ユニットと、検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合に、検索される画像をフィルタリング除去する、出力フィルタリングユニットと、を備えることができる。
一実施形態において、類似度計算ユニットは、検索される画像のノードの数と、サンプル画像のノードの数とを比較して、両者の間の小さい方の数を提供し、検索される画像とサンプル画像との間の類似度の程度を、検索される画像とサンプル画像との間の重複ノードの数と小さい方の数との比率として取得するようにさらに構成されてもよい。
別の実施形態において、類似度計算ユニットは、検索される画像のノードの数と、サンプル画像のノードの数とを比較して、両者の間の大きい方の数を提供し、検索される画像とサンプル画像との間の類似度を、検索される画像とサンプル画像との間の重複ノードの数と大きい方の数との比率として取得するように、さらに構成されてもよい。
また別の態様に従い、画像検索のための方法は、サンプル画像インデックステーブルを確立することであって、サンプル画像インデックステーブルが、複数のノードのノード識別と、複数のノードにクラスタリングされる領域特徴を有するサンプル画像の識別と、ノードの各々のそれぞれの領域特徴がサンプル画像に出現する回数との間の相関を記憶し、サンプル画像インデックステーブルが、サンプル画像のノードのノード識別と、サンプル画像の中のノードの数のカウントとをさらに記憶することと、検索される画像から領域特徴を抽出することと、検索される画像の領域特徴を対応するノードにクラスタリングすることと、検索される画像のノードのノード識別を使用してサンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得することと、検索される画像と、サンプル画像との間の重複ノードの数を計算することと、検索される画像のノードの数およびサンプル画像のノードの数に基づいて、検索される画像の類似度を取得することと、検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合に、検索結果としてサンプル画像を提供することと、を含んでもよい。
一実施形態において、検索される画像の類似度を取得することは、検索される画像のノードの数と、サンプル画像のノードの数とを比較して、両者の間の小さい方の数を提供することと、検索される画像とサンプル画像との間の類似度の程度を、検索される画像とサンプル画像との間の重複ノードの数と小さい方の数との比率として取得することと、を含んでもよい。
別の実施形態において、検索される画像の類似度を取得することは、検索される画像のノードの数と、サンプル画像のノードの数とを比較して、両者の間の大きい方の数を提供することと、検索される画像とサンプル画像との間の類似度を、検索される画像とサンプル画像との間の重複ノードの数と大きい方の数との比率として取得することと、を含んでもよい。
本開示の実施形態は、検索される画像から領域特徴を抽出することができる。検索される画像の領域特徴に対応するノードは、クラスタリングアルゴリズムによって取得することができる。対応するサンプル画像識別は、サンプル画像インデックステーブルをインデックスするために、各領域特徴に対応するノード識別を使用することによって、取得することができる。検索される画像とサンプル画像との間の類似度が計算される。検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合、検索される画像はさらなる検証のためにフィルタリング除去される。画像監視の精度が向上する。
同様に、本開示の技法は、画像検索のプロセスにおいて適用することができる。検索される画像からのある領域特徴は、検索される取得された画像から抽出することができる。検索される画像の領域特徴に対応するノードは、クラスタリングアルゴリズムによって取得することができる。対応するサンプル画像識別は、サンプル画像インデックステーブルをインデックスするために、各領域特徴に対応するノード識別を使用することによって、取得することができる。検索される画像とサンプル画像との間の類似度が計算される。検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合、サンプル画像が検索結果として使用される。画像検索の精度は高い。
本開示に従うサンプル画像インデックステーブルを作成するための例示的な方法のフローチャートである。 本開示に従う画像フィルタリングのための例示的な方法のフローチャートである。 本開示に従う画像フィルタリングのための例示的な方法のフローチャートである。 本開示に従うサンプル画像インデックステーブルを作成するための装置の模式図である。 本開示に従う画像フィルタリングのための装置の模式図である。 本開示に従う画像検索のための例示的な方法のフローチャートである。 本開示に従う画像検索のための装置の模式図である。
本開示の実施形態において、サンプル画像インデックステーブルは、画像フィルタリングの精度を向上するように記憶されることが必要である。サンプル画像インデックステーブルは、サンプル画像に含有される領域特徴のノード情報を記憶する。領域特徴が検索される画像から抽出される際、検索される画像の領域特徴に対応するノードが取得され、各領域特徴に対応するノード識別は、サンプル画像をインデックスしてサンプル画像識別を取得するために使用される。検索される画像と、対応するサンプル画像の各々との間の重複するノードの数は、統計法によって計算される。検索される画像の類似度は、インデックステーブルから取得される、クラスタリング後の検索される画像の抽出された領域特徴のノードの数、およびクラスタリング後のサンプル画像の抽出された領域特徴のノードの数を使用することによって取得される。検索される画像とサンプル画像との間の類似度が既定の類似性の閾値より高い場合、検索される画像は、画像検証ユニットにフィルタリング入力される。
図1を参照し、サンプル画像インデックステーブルを作成するための方法を以下に記載する。
101で、方法は、既定の抽出アルゴリズムを使用することによって、サンプル画像からある領域特徴の情報を抽出する。
サンプル画像は、予め選択され、フィルタリングの基準として使用することができる画像である。領域特徴は、複数のサンプル画像から抽出することができる。サンプル画像の選択もまたユーザの必要性によって画定することができる。例えば、サンプル画像としてポルノ画像を選択することができる。サンプル画像として、書籍、薬物、武器、個人情報、および化粧品の画像も選択することができる。
本明細書では、抽出アルゴリズムは、Linderbergスケール不変性理論に基づいた特徴検出器およびDavid Loweのスケール不変特性変換(SIFT)様の高次元記述子アルゴリズム等、スケール不変性を用いる任意の領域特徴抽出アルゴリズムとすることができる。これらの抽出アルゴリズムは、画像の構造のスケールを自動的に取得することができ、スケール分散、光分散、角度分散、および回転分散等の多様な分散に対するスケールに基づいた領域特徴を計算することができる。領域特徴が取得された後、画像は、何百もの領域特徴として表現される。領域特徴の情報は、抽出された領域特徴ベクトルにすることができる。本開示は、サンプル画像から領域特徴の情報を抽出するために使用される抽出アルゴリズムの種類を制限しない。
102で、方法は、既定のクラスタリングアルゴリズムを使用することによって、サンプル画像の領域特徴の情報の全てをクラスタリングする。
定義された類似度を持つ領域特徴は、1つのノードに分類される。各ノードは、対応するノード識別を有する。
動作102において、複数の領域特徴は、類似度に基づいて、いくつかの群に分類することができる。換言すると、相対的に類似した領域特徴は1つの群に分類される。各群は1つのノードとして参照される。各群の領域特徴は、対応するノードに属する。
領域特徴情報が領域特徴ベクトルを含む場合、102で、方法は、既定のクラスタリングアルゴリズムを使用して、各サンプル画像の領域特徴ベクトルの間の距離を計算することができる。その距離が既定の距離閾値より小さい領域特徴は、同じノードに分類される。
103で、方法はサンプル画像インデックステーブルを確立する。サンプル画像インデックステーブルは、ノード識別と、そのノードに領域特徴がクラスタリングされるサンプル画像識別と、領域特徴が対応するサンプル画像に出現する回数との間の対応関係を記憶するために使用される。サンプル画像インデックステーブルはまた、ノード識別と、サンプル画像に含まれるノードの数とを記憶するためにも使用される。
図2を参照して、画像フィルタリングのための方法を以下に記載する。
201で、方法は、既定の抽出アルゴリズムを使用することによって、検索される画像からある領域特徴を抽出する。
202で、方法は、既定のクラスタリングアルゴリズムを使用することによって、検索される画像の領域特徴に対応するノードを取得し、サンプル画像インデックステーブルをインデックスするために、各領域特徴に対応するそれぞれのノード識別を使用することによって、対応するサンプル画像識別を取得する。
203で、方法は、検索される画像と対応するサンプル画像との間の重複ノードの数を判定する。
204で、方法は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を使用することによって、検索される画像の類似度を取得する。
検索される画像の類似度は、以下に記載の様式で取得することができる。
抽出された領域特徴のクラスタリング後の検索される画像のノードの数と、対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数とが比較されて、小さい方の数が選択される。検索される画像と対応するサンプル画像との間の重複ノードの数と小さい方の数との比率が、検索される画像とサンプル画像との間の類似度として使用される。代替として、本開示は、検索される画像のノードの数とサンプル画像インテックステーブルから取得された対応するサンプル画像のノードの数との間の大きい方の数を、類似度の計算数として使用することもできる。本開示は、小さい方の数と大きい方の数とのどちらが使用されるかを制限しない。
205で、方法は、検索される画像とサンプル画像との間の類似度が既定の類似性の閾値を超えるかどうかを判定する。超える場合、検索される画像は、画像検証ユニットにフィルタリング入力され、超えない場合は、正常画像として見なされる。
図3を参照して、画像フィルタリングのための別の方法を以下に記載する。
300で、方法は、既定のアルゴリズムを使用することによって、サンプル画像からある領域特徴をサンプル画像の画像特徴として抽出し、クラスタリングアルゴリズムを使用することによって、類似した領域特徴を同じノードに数値化し、インデックステーブルを確立する。インデックステーブルは、ノード識別と、そのノードに領域特徴がクラスタリングされるサンプル画像識別と、領域特徴が対応するサンプル画像に出現する回数との間の対応関係を含む。クラスタリング方法は、高次元領域特徴の計算量を削減するために使用することができる。
例えば、以下の表1において、ノード識別が「1」であるノードは、画像識別が「#Img3307」および「#Img4615」であるサンプル画像に属する。この例において、ノード「1」はサンプル画像「#Img3307」に2回、サンプル画像「#Imag4615」に3回出現する。同様に、この例では、ノード識別が「N」であるノードは、画像識別が「#Img2948」および「#Img3693」であるサンプル画像に属する。ノード「N」は、サンプル画像「#Img2948」に3回、サンプル画像「#Img3693」に5回出現する。サンプル画像の番号は、サンプル画像識別に相当する。
Figure 2013515998
301で、方法は、コンテンツ安全性フィルタリングシステムを起動して、ユーザからアップロードされた画像を受信後に、ユーザによってアップロードされた画像の記憶パスを収集する。
302で、方法は、記憶パスを通じて、ファイルシステムからユーザによってアップロードされた画像を取得する。
303で、方法は、検索される画像として取得された画像を、画像検索データベースへ送信する。
304で、画像検索データベースは、図2に関して記載したアルゴリズムと同じアルゴリズムを使用することによって、検索される画像の画像特徴として、検索される画像のある領域特徴を抽出する。
305で、画像検索データベースは、図2に関して記載したアルゴリズムと同じクラスタリングアルゴリズムを使用することによって、検索される画像の類似した領域特徴を対応するノードに数値化する。
306で、画像検索データベースは、検索される画像に対応するノード識別を使用することによって、インデックステーブルをインデックスし、検索される画像に含まれる各ノード識別の対応するサンプル画像番号を取得し、検索される画像と各サンプル画像との間の重複ノードの数を計算する。
307で、方法は、検索される画像とサンプル画像との間の重複ノードの数、および検索される画像の中のノードの数とサンプル画像の中のノードの数との間の小さい方のノードの数を使用することによって、検索される画像とサンプル画像との間の類似度を取得する。
全てのサンプル画像から抽出された領域特徴は、最終的に、異なるノードにクラスタリングまたは分類される。検索される画像ImgAの領域特徴は、ノードセットA={a1,a2,…,aN}に分類される。同様に、サンプル画像ImgBの領域特徴は、ノードセットB={b1,b2,…,bM}に分類され、式中、a1,a2,…,aNおよびb1,b2,…,bMはノード番号を表す。重複ノードの数は、A∩BまたはAとBの交わりと呼ばれる。ノード数の小さい方は、min(N,M)である。
308で、方法は、検索される画像とサンプル画像との間の類似度が、既定の類似性の閾値より高い、すなわちこれを超える場合に、検索される画像を画像検証ユニットにフィルタリング入力する。
検索される画像とサンプル画像との間の類似度が類似性の閾値を超える場合、検索される画像は疑わしい画像として見なされる。検索される画像のリスクをさらに判定するために、そのような画像は、手動判定のために画像検証ユニットに入力される。
画像検証ユニットの中のサンプル画像は、システムによって自動的に判定されたリスクの高い画像である。手動検証を必要とする、少数の判定エラーが存在する場合がある。さらに、システムによって判定されたリスクの高い画像の中で、いくつかは、サンプル画像に類似するが、同一ではない。そのような種類の画像は、サンプル画像データベースをさらに向上するために、検証後にサンプルデータベースに追加することができる。
サンプル画像データベースの管理は手動で実行することができる。禁忌画像は時々変化する場合があるので、本開示は、サンプル画像データベースを手動で変更するための機能も提供する。サンプル画像データベースが更新された後、インデックステーブルもリアルタイムで変更され、検索結果に適時に反映され、従って高い効率を達成する。
図4を参照すると、本開示は、サンプル画像インデックステーブルを確立するための装置を開示する。装置は、特徴抽出ユニット41と、クラスタリングユニット42と、記憶ユニット43とを含む。
特徴抽出ユニット41は、既定の抽出アルゴリズムを使用することによって、サンプル画像からある領域特徴情報を抽出するように構成される。
クラスタリングユニット42は、既定のクラスタリングアルゴリズムを使用することによって、サンプル画像の領域特徴の情報をクラスタリングするように構成される。定義された類似度を持つ領域特徴は、1つのノードに分類される。各ノードは、対応するノード識別を有する。
記憶ユニット43は、サンプル画像インデックステーブルを確立するように構成される。サンプル画像インデックステーブルは、ノード識別と、そのノードに領域特徴がクラスタリングされるサンプル画像識別と、領域特徴が対応するサンプル画像に出現する回数との間の対応関係を記憶するために使用される。サンプル画像インデックステーブルはまた、ノード識別と、サンプル画像に含まれるノードの数とを記憶するためにも使用される。
抽出アルゴリズムは、スケール不変性を用いる任意の領域特徴抽出アルゴリズムにすることができる。
抽出アルゴリズムは、Linderbergスケール不変性理論に基づいた特徴検出器、またはSIFT様高次元記述子アルゴリズムにすることができる。
領域特徴情報は、抽出された領域特徴ベクトルにすることができる。クラスタリングユニット42は、既定のクラスタリングアルゴリズムを使用して、各サンプル画像の領域特徴ベクトルの間の距離を計算することができる。その距離が既定の距離閾値より小さい領域特徴は、同じノードに分類される。
図5を参照して、本開示は、画像フィルタリングのための装置を開示する。装置は、記憶ユニット51と、抽出ユニット52と、ノード判定ユニット53と、インデックスユニット54と、計算ユニット55と、類似度計算ユニット56と、出力フィルタリングユニット57とを含む。
記憶ユニット51は、サンプル画像インデックステーブルを記憶するように構成される。サンプル画像インデックステーブルは、ノード識別と、そのノードに領域特徴がクラスタリングされるサンプル画像識別と、領域特徴が対応するサンプル画像に出現する回数との間の対応関係を記憶するために使用される。サンプル画像インデックステーブルはまた、ノード識別と、サンプル画像に含まれるノードの数とを記憶するためにも使用される。
抽出ユニット52は、既定の抽出アルゴリズムを使用することによって、検索される画像からある領域特徴情報を抽出するように構成される。
ノード判定ユニット53は、既定のクラスタリングアルゴリズムを使用することによって、検索される画像の領域特徴に対応するノードを取得するように構成される。
インデックスユニット54は、サンプル画像インデックステーブルをインデックスするために、各領域特徴に対応するノード識別を使用することによって、対応するサンプル画像識別を取得するように構成される。
計算ユニット55は、検索される画像と対応するサンプル画像との間の重複ノードの数を計算するように構成される。
類似度計算ユニット56は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を使用することによって、検索される画像の類似度を取得するように構成される。
出力フィルタリングユニット57は、検索される画像とサンプル画像との間の類似度が、既定の類似性の閾値より高い、すなわちこれを超える場合に、検索される画像をフィルタリングするように構成される。
類似度計算ユニット56は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を比較するように構成される。両者のうちの小さい方の数が選択される場合がある。検索される画像と対応するサンプル画像との間の重複ノードの数と小さい方の数との比率が、検索される画像とサンプル画像との間の類似度として使用される。
本開示の実施形態のフィルタリング技術は、画像検索に基づき、アップロードされた画像を、監視を必要とする1つ以上のサンプル画像と比較する。アップロードされた画像がサンプル画像に非常に類似する場合、アップロードされた画像は、検証のために検証ユニットへ送信される。本技術の利点は、高速、および高精度である。一方、手動検証は、エラー率をさらに削減することができる。
本開示の実施形態は、画像のコンテンツを認識することを意図せず、アップロードされた画像を1つ以上のサンプル画像と単純かつ効率的に比較し、アップロードされた画像のリスクの程度として、類似度を分析することを意図する。高いリスクの可能性がある画像に対して、さらなる手動の検証を行う場合がある。オンライン取引に関する画像のほとんどが売買品の画像であり、売買品の画像を繰り返し使用する、または簡単な変化後の売買品の画像を繰り返して使用する高い可能性があることから、画像検索および比較の利用によって、ほとんどの違法な画像を監視することができる。その上、サンプル画像データベースはリアルタイムで手動により維持される。監視ルールに変化が存在する場合、サンプル画像データベースの変更によって、監視ルールを変更することができる。異なる商品に対して異なる監視ターゲットを使用して、範囲問題を解決することができる。一方、異なる売買品の特徴に対して、画像の特徴を分析することができ、監視の柔軟度は、精度を向上するように設定することができる。
同様に、本開示の画像インデックスの発想は、画像検索分野においても使用することができる。画像データベースは、事前に検索エンジンサーバにおいて確立される必要がある。画像データベースに記憶される画像は、例えば、ウェブサイトにログインするユーザによってアップロードされた画像、他のシステムからインポートされた画像、大量のウェブページからネットワークスパイダーによって抽出された画像、他の情報源からの画像、および1つ以上の上記の情報源の組み合わせからの画像である可能性がある。本開示は、画像の情報源を限定しない。インターネット上の大量のウェブページからネットワークスパイダーによって画像を抽出するための技術は、周知の技術であり、本明細書には詳細を記載しない。画像データベースの中の画像に関して、領域特徴情報は、サンプル画像インデックステーブルを確立するために取得される。サンプル画像インデックステーブルは、ノード識別と、そのノードに領域特徴がクラスタリングされるサンプル画像識別と、領域特徴が対応するサンプル画像に出現する回数との間の対応関係を記憶し、さらにノード識別と、サンプル画像の中に含まれるノードの数とを記憶するために使用される。検索エンジンのクライアントが画像検索のための命令を送信すると、検索エンジンサーバは、検索される画像を分析し、サンプル画像インデックステーブルで問い合わせを行い、検索される画像を含む同一または類似の画像を取得し、検索エンジンのクライアントに結果を返す。
図6を参照して、本開示は、以下に記載の画像検索のための方法を提供する。
601で、方法は、検索される画像からある領域特徴を抽出する。
602で、方法は、検索される画像の領域特徴に対応するノードを取得し、サンプル画像インデックステーブルをインデックスするために、各領域特徴に対応するノード識別を使用することによって、対応するサンプル画像識別を取得する。
603で、方法は、検索される画像と対応するサンプル画像との間の重複ノードの数を計算する。
604で、方法は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を使用することによって、検索される画像の類似度を取得する。
検索される画像の類似度は、以下に記載の様式で取得することができる。
抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数が比較されて、小さい方の数が選択される。検索される画像と対応するサンプル画像との間の重複ノードの数と小さい方の数との比率が、検索される画像とサンプル画像との間の類似度として使用される。代替として、本開示は、検索される画像のノードの数とサンプル画像インテックステーブルから取得された対応するサンプル画像のノードの数との間の大きい方の数を、類似度の計算数として使用することもできる。
605で、方法は、検索される画像とサンプル画像との間の類似度が既定の類似性の閾値を超える場合、検索結果としてサンプル画像を使用する。
図7を参照して、本開示は、画像検索のための装置を提供する。装置は、記憶ユニット71と、抽出ユニット72と、ノード判定ユニット73と、インデックスユニット74と、計算ユニット75と、類似度計算ユニット76と、出力検索ユニット77とを含む。
記憶ユニット71は、サンプル画像インデックステーブルを記憶するように構成される。サンプル画像インデックステーブルは、ノード識別と、そのノードに領域特徴がクラスタリングされるサンプル画像識別と、領域特徴が対応するサンプル画像に出現する回数との間の対応関係を記憶するために使用される。サンプル画像インデックステーブルはまた、ノード識別と、サンプル画像に含まれるノードの数とを記憶するためにも使用される。
抽出ユニット72は、検索される画像から、ある領域特徴情報を抽出するように構成される。
ノード判定ユニット73は、検索される画像の領域特徴に対応するノードを取得するように構成される。
インデックスユニット74は、サンプル画像インデックステーブルをインデックするために、各領域特徴に対応するノード識別を使用することによって、対応するサンプル画像識別を取得するように構成される。
計算ユニット75は、検索される画像と対応するサンプル画像との間の重複ノードの数を計算するように構成される。
類似度計算ユニット76は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を使用することによって、検索される画像の類似度を取得するように構成される。
出力検索ユニット77は、検索される画像とサンプル画像との間の類似度が既定の類似性の閾値を超える場合に、サンプル画像を出力するように構成される。
類似度計算ユニット76は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を比較するように構成される。両者のうちの小さい方の数が選択さてもよい。検索される画像と対応するサンプル画像との間の重複ノードの数と小さい方の数との比率が、検索される画像とサンプル画像との間の類似度として使用される。
類似度計算ユニット76は、抽出された領域特徴のクラスタリング後の検索される画像のノードの数、および対応するサンプル画像の領域特徴のクラスタリング後のサンプル画像インデックステーブルから取得された対応するサンプル画像のノードの数を比較するように構成することもできる。両者のうちの大きい方の数が選択されてもよい。検索される画像と対応するサンプル画像との間の重複ノードの数と大きい方の数との比率が、検索される画像とサンプル画像との間の類似度として使用される。
本開示の上記の技法は、画像検索のプロセスにおいて適用することができる。検索される画像が取得された場合、検索される画像からある領域特徴を抽出することができる。検索される画像の領域特徴に対応するノードは、クラスタリングアルゴリズムによって取得することができる。対応するサンプル画像識別は、サンプル画像インデックステーブルをインデックスするために、各領域特徴に対応するノード識別を使用することによって、取得することができる。検索される画像とサンプル画像との間の類似度が計算される。検索される画像とサンプル画像との間の類似度が既定の類似性の閾値を超える場合、サンプル画像が検索結果として使用される。画像検索の精度は高い。
当業者は、本開示の精神および範囲から逸脱することなく、多種多様な方式で本開示を変更または修正することができることが理解される。したがって、これらの修正および変形は、本開示の請求項およびそれらの均等物の範囲内であると考えられるべきである。

Claims (16)

  1. サンプル画像インデックステーブルを作成するための方法であって、
    サンプル画像から領域特徴を抽出することと、
    前記サンプル画像の前記領域特徴を複数のノードにクラスタリングすることであって、それぞれのノードのそれぞれの領域特徴が、同じ類似度を有し、各ノードがそれぞれのノード識別に対応する、クラスタリングすることと、
    サンプル画像インデックステーブルを確立することであって、前記サンプル画像インデックステーブルが、前記複数のノードのうちの第1のノードの第1のノード識別と、前記サンプル画像の識別と、前記第1のノードの前記それぞれの領域特徴が前記サンプル画像に出現する回数との間の相関を記憶し、前記サンプル画像インデックステーブルが、前記サンプル画像の前記ノードのノード識別と、前記サンプル画像の中の前記ノードの数のカウントとをさらに記憶する、確立することと、を含む、方法。
  2. 前記サンプル画像から前記領域特徴を抽出することは、スケール不変性を用いる抽出アルゴリズムを使用することによって、前記サンプル画像から前記領域特徴を抽出することを含む、請求項1に記載の方法。
  3. 前記抽出アルゴリズムは、Linderbergスケール不変性理論に基づいた特徴検出器、またはDavid Loweのスケール不変特性変換(SIFT)様の高次元記述子アルゴリズムである、請求項2に記載の方法。
  4. 前記領域特徴が領域特徴ベクトルであって、前記サンプル画像の前記領域特徴をクラスタリングすることは、
    定義されたクラスタリングアルゴリズムを使用して、前記サンプル画像の前記領域特徴ベクトルの間のそれぞれの距離を計算することと、
    前記サンプル画像の領域内にあり、かつ距離閾値よりも小さいそれぞれの距離を有する、前記領域特徴の数を同じノードに分類することと、を含む、請求項1に記載の方法。
  5. 画像フィルタリングのための方法であって、
    サンプル画像インデックステーブルを確立することであって、前記サンプル画像インデックステーブルが、複数のノードのノード識別と、前記複数のノードにクラスタリングされる領域特徴を有するサンプル画像の識別と、前記ノードの各々のそれぞれの領域特徴が前記サンプル画像に出現する回数との間の相関を記憶し、前記サンプル画像インデックステーブルが、前記サンプル画像の前記ノードのノード識別と、前記サンプル画像の中の前記ノードの数のカウントとをさらに記憶する、確立することと、
    検索される画像から領域特徴を抽出することと、
    前記検索される画像の前記領域特徴を対応するノードにクラスタリングすることと、
    前記検索される画像の前記ノードのノード識別を使用して前記サンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得することと、
    前記検索される画像と、前記サンプル画像との間の重複ノードの数を判定することと、
    前記検索される画像のノードの数および前記サンプル画像の前記ノードの数に基づいて、前記検索される画像の類似度を取得することと、
    前記検索される画像と前記サンプル画像との間の類似度が類似性の閾値を超える場合に検索される前記画像をフィルタリング除去することと、を含む、方法。
  6. 前記検索される画像の前記類似度の程度を取得することは、
    前記検索される画像の前記ノードの数、および前記サンプル画像の前記ノードの数を比較して、両者の間の小さい方の数を提供することと、
    前記検索される画像と前記サンプル画像との間の前記類似度を、前記検索される画像と前記サンプル画像との間の前記重複ノードの数と前記小さい方の数との比率として取得することと、を含む、請求項5に記載の方法。
  7. 前記検索される画像の類似度を取得することは、
    前記検索される画像の前記ノードの数、および前記サンプル画像の前記ノードの数を比較して、両者の間の大きい方の数を提供することと、
    前記検索される画像と前記サンプル画像との間の前記類似度を、前記検索される画像と前記サンプル画像との間の前記重複ノードの数と前記大きい方の数との比率として取得することと、を含む、請求項5に記載の方法。
  8. サンプル画像インデックステーブルを作成するための装置であって、
    サンプル画像から領域特徴を抽出する、特徴抽出ユニットと、
    前記サンプル画像の前記領域特徴を、各々が同じ類似度を有するそれぞれの数の領域特徴を有する複数のノードにクラスタリングする、クラスタリングユニットであって、各ノードが、それぞれのノード識別に対応する、クラスタリングユニットと、
    前記サンプル画像インデックステーブルを確立する記憶ユニットであって、前記サンプル画像インデックステーブルが、前記複数のノードのうちの第1のノードの第1のノード識別と、前記サンプル画像の識別と、前記第1のノードの前記それぞれの領域特徴が前記サンプル画像に出現する回数との間の相関を記憶し、前記サンプル画像インデックステーブルが、前記サンプル画像の前記ノードのノード識別と、前記サンプル画像の中の前記ノードの数のカウントとをさらに記憶する、記憶ユニットと、を備える、装置。
  9. 前記特徴抽出ユニットが、スケール不変性を用いる抽出アルゴリズムを使用することによって、前記サンプル画像から前記領域特徴を抽出し、前記抽出アルゴリズムは、Linderbergスケール不変性理論に基づいた特徴検出器、またはDavid Loweのスケール不変特性変換(SIFT)様の高次元記述子アルゴリズムである、請求項8に記載の装置。
  10. 前記領域特徴が領域特徴ベクトルであり、前記クラスタリングユニットが定義されたクラスタリングアルゴリズムを使用して、前記サンプル画像の前記領域特徴ベクトルの間のそれぞれの距離を計算し、前記サンプル画像の領域内にあり、かつ距離閾値より小さいそれぞれの距離を有する前記領域特徴の数を同じノードに分類する、請求項8に記載の装置。
  11. 画像フィルタリングのための装置であって、
    サンプル画像インデックステーブルを記憶する記憶ユニットであって、前記サンプル画像インデックステーブルが、複数のノードのノード識別と、前記複数のノードにクラスタリングされる領域特徴を有するサンプル画像の識別と、前記ノードの各々のそれぞれの領域特徴が前記サンプル画像に出現する回数との間の相関を記憶し、前記サンプル画像インデックステーブルは、前記サンプル画像の前記ノードのノード識別と、前記サンプル画像の中の前記ノードの数のカウントとをさらに記憶する、記憶ユニットと、
    検索される画像から領域特徴を抽出する、抽出ユニットと、
    前記検索される画像の前記領域特徴を対応するノードにクラスタリングする、ノード判定ユニットと、
    前記検索される画像の前記ノードのノード識別を使用して前記サンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得する、インデックスユニットと、
    前記検索される画像と、前記サンプル画像との間の重複ノードの数を計算する、計算ユニットと、
    前記検索される画像の前記ノードの数および前記サンプル画像の前記ノードの数に基づいて、前記検索される画像の類似度を取得する、類似度計算ユニットと、
    前記検索される画像と前記サンプル画像との間の前記類似度が類似性の閾値を超える場合に、前記検索される画像をフィルタリング除去する、出力フィルタリングユニットと、を備える、装置。
  12. 前記類似度計算ユニットが、
    前記検索される画像の前記ノードの数、および前記サンプル画像の前記ノードの数を比較して、両者の間の小さい方の数を提供し、
    前記検索される画像と前記サンプル画像との間の前記類似度の程度を、前記検索される画像と前記サンプル画像との間の前記重複ノードの数と前記小さい方の数との比率として取得するようにさらに構成される、請求項11に記載の装置。
  13. 前記類似度計算ユニットが、
    前記検索される画像の前記ノードの数、および前記サンプル画像の前記ノードの数を比較して、両者の間の大きい方の数を提供し、
    前記検索される画像と前記サンプル画像との間の前記類似度を、前記検索される画像と前記サンプル画像との間の前記重複ノードの数と前記大きい方の数との比率として取得するようにさらに構成される、請求項11に記載の装置。
  14. 画像検索のための方法であって、
    サンプル画像インデックステーブルを確立することであって、前記サンプル画像インデックステーブルが、複数のノードのノード識別と、前記複数のノードにクラスタリングされる領域特徴を有するサンプル画像の識別と、前記ノードの各々のそれぞれの領域特徴が前記サンプル画像に出現する回数との間の相関を記憶し、前記サンプル画像インデックステーブルが、前記サンプル画像の前記ノードのノード識別と、前記サンプル画像の中の前記ノードの数のカウントとをさらに記憶する、確立することと、
    検索される画像から領域特徴を抽出することと、
    前記検索される画像の前記領域特徴を対応するノードにクラスタリングすることと、
    前記検索される画像の前記ノードのノード識別を使用して前記サンプル画像インデックステーブルをインデックスすることによって、対応するサンプル画像識別を取得することと、
    前記検索される画像と、前記サンプル画像との間の重複ノードの数を計算することと、
    前記検索される画像の前記ノードの数および前記サンプル画像の前記ノードの数に基づいて、前記検索される画像の類似度を取得することと、
    前記検索される画像と前記サンプル画像との間の前記類似度が類似性の閾値を超える場合、検索結果として前記サンプル画像を提供することと、を含む、方法。
  15. 前記検索される画像の前記類似度を取得することは、
    前記検索される画像の前記ノードの数、および前記サンプル画像の前記ノードの数を比較して、両者の間の小さい方の数を提供することと、
    前記検索される画像と前記サンプル画像との間の前記類似度を、前記検索される画像と前記サンプル画像との間の前記重複ノードの数と前記小さい方の数との比率として取得することと、を含む、請求項14に記載の方法。
  16. 前記検索される画像の前記類似度を取得することは、
    前記検索される画像の前記ノードの数、および前記サンプル画像の前記ノードの数を比較して、両者の間の大きい方の数を提供することと、
    前記検索される画像と前記サンプル画像との間の前記類似度を、前記検索される画像と前記サンプル画像との間の前記重複ノードの数と前記大きい方の数との比率として取得することと、を含む、請求項14に記載の方法。
JP2012545942A 2009-12-24 2010-10-28 サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム Active JP5665879B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910260175.5 2009-12-24
CN2009102601755A CN102110122B (zh) 2009-12-24 2009-12-24 一种建立样本图片索引表和图片过滤、搜索方法及装置
PCT/US2010/054493 WO2011078911A1 (en) 2009-12-24 2010-10-28 Method and system for sample image index creation and image filtering and search

Publications (2)

Publication Number Publication Date
JP2013515998A true JP2013515998A (ja) 2013-05-09
JP5665879B2 JP5665879B2 (ja) 2015-02-04

Family

ID=44174284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012545942A Active JP5665879B2 (ja) 2009-12-24 2010-10-28 サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム

Country Status (6)

Country Link
US (1) US8577153B2 (ja)
EP (1) EP2517154A4 (ja)
JP (1) JP5665879B2 (ja)
CN (1) CN102110122B (ja)
HK (1) HK1155235A1 (ja)
WO (1) WO2011078911A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020126465A (ja) * 2019-02-05 2020-08-20 株式会社日立製作所 検出装置、検出方法、および検出プログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9768082B2 (en) * 2009-02-13 2017-09-19 Hermes Microvision Inc. Method and machine for examining wafers
CN103136228A (zh) 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种图片搜索方法以及图片搜索装置
CN103207879B (zh) 2012-01-17 2016-03-30 阿里巴巴集团控股有限公司 图像索引的生成方法及设备
CN102682091A (zh) * 2012-04-25 2012-09-19 腾讯科技(深圳)有限公司 基于云服务的视觉搜索方法和系统
JP6064392B2 (ja) * 2012-06-29 2017-01-25 株式会社リコー 検索装置、検索方法、検索プログラムおよび検索システム
CN103793434A (zh) * 2012-11-02 2014-05-14 北京百度网讯科技有限公司 一种基于内容的图片搜索方法和装置
US9626567B2 (en) * 2013-03-13 2017-04-18 Visible Measures Corp. Automated video campaign building
CN103473299B (zh) * 2013-09-06 2017-02-08 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
US10521817B2 (en) * 2014-04-02 2019-12-31 Nant Holdings Ip, Llc Augmented pre-paid cards, systems and methods
CN105224569B (zh) 2014-06-30 2018-09-07 华为技术有限公司 一种数据过滤、构造数据滤波器的方法及装置
CN105335047B (zh) * 2014-08-14 2024-05-28 小米科技有限责任公司 显示图片的方法及装置
CN105404631B (zh) * 2014-09-15 2021-01-29 腾讯科技(深圳)有限公司 图片识别方法和装置
CN104268446A (zh) * 2014-09-30 2015-01-07 小米科技有限责任公司 防止视频二次传播的方法及装置
CN104268445A (zh) * 2014-09-30 2015-01-07 小米科技有限责任公司 防止图片二次传播的方法及装置
CN104899744B (zh) * 2015-06-29 2018-03-16 汪新淮 钱币邮票收藏品交易系统与交易方法
CN105930499B (zh) * 2016-05-09 2019-11-22 深圳市数极科技有限公司 一种图片搜索方法及系统
CN107590491B (zh) * 2016-07-07 2021-08-06 阿里巴巴集团控股有限公司 一种图像处理方法及装置
CN106250907A (zh) * 2016-07-08 2016-12-21 大连大学 云计算环境基于过采样修正的大规模图像聚类方法
CN106844421A (zh) * 2016-11-30 2017-06-13 上海仙剑文化传媒股份有限公司 一种数字图片管理方法及系统
KR102402096B1 (ko) * 2017-03-27 2022-05-26 삼성전자주식회사 이미지 내 오브젝트와 관련된 정보를 제공하는 전자 장치
CN108121781B (zh) * 2017-12-18 2021-09-24 辽宁师范大学 基于高效样本选取与参数优化的相关反馈图像检索方法
CN108171135A (zh) * 2017-12-21 2018-06-15 深圳云天励飞技术有限公司 人脸检测方法、装置及计算机可读存储介质
CN110727815B (zh) * 2018-07-16 2024-01-30 浙江大华技术股份有限公司 一种更新以图搜图的图库的方法、设备及可读存储介质
CN109165307B (zh) * 2018-09-19 2021-02-02 腾讯科技(深圳)有限公司 一种特征检索方法、装置和存储介质
CN109711298B (zh) * 2018-12-14 2021-02-12 南京甄视智能科技有限公司 基于faiss的高效人脸特征值检索的方法和系统
CN111428179B (zh) * 2020-03-19 2023-09-19 新方正控股发展有限责任公司 图片监测方法、装置及电子设备
CN112182287B (zh) * 2020-09-10 2021-06-08 南京信息工程大学 一种基于时空视觉词组和分层匹配的视频拷贝检测方法
CN113312904A (zh) * 2021-05-31 2021-08-27 南京航空航天大学 一种基于抽象语法树的代码片段推荐方法与系统
CN116630597B (zh) * 2023-06-08 2024-07-16 深圳市玩瞳科技有限公司 一种蜂巢形图像指标、其解码方法、装置和设备
CN116881485B (zh) * 2023-06-19 2024-07-12 北京百度网讯科技有限公司 生成图像检索索引的方法及装置、电子设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005293123A (ja) * 2004-03-31 2005-10-20 Nippon Telegraph & Telephone West Corp コンテンツフィルタリングシステム、その方法およびプログラム
JP2007052556A (ja) * 2005-08-16 2007-03-01 Tokyo Institute Of Technology 複数のxml文書の類似度検出方法および類似性検出システム、ならびに複数のxml文書の統合方法
WO2008020919A2 (en) * 2006-08-14 2008-02-21 Microsoft Corporation Automatic classification of objects within images
JP2008287438A (ja) * 2007-05-16 2008-11-27 Canon Inc 画像処理装置及び画像検索方法
JP2009020888A (ja) * 2007-07-11 2009-01-29 Ricoh Co Ltd インビジブルジャンクションを生成する方法及びシステム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0545944A (ja) * 1991-08-14 1993-02-26 Mita Ind Co Ltd 画像形成装置
US5740269A (en) 1994-09-20 1998-04-14 Neopath, Inc. Method and apparatus for robust biological specimen classification
US6072904A (en) 1997-12-31 2000-06-06 Philips Electronics North America Corp. Fast image retrieval using multi-scale edge representation of images
US6321232B1 (en) * 1998-12-18 2001-11-20 Xerox Corporation Method for creating a geometric hash tree in a document processing system
US6594383B1 (en) * 1999-11-16 2003-07-15 International Business Machines Corporation Method and apparatus for indexing and retrieving images from an images database based on a color query
US6564225B1 (en) * 2000-07-14 2003-05-13 Time Warner Entertainment Company, L.P. Method and apparatus for archiving in and retrieving images from a digital image library
KR100374791B1 (ko) 2000-11-22 2003-03-04 삼성전자주식회사 영상의 영역 구분 방법 및 장치
KR100788643B1 (ko) 2001-01-09 2007-12-26 삼성전자주식회사 색과 질감의 조합을 기반으로 하는 영상 검색 방법
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
US7848566B2 (en) 2004-10-22 2010-12-07 Carnegie Mellon University Object recognizer and detector for two-dimensional images using bayesian network based classifier
US7734067B2 (en) 2004-12-07 2010-06-08 Electronics And Telecommunications Research Institute User recognition system and method thereof
US7831599B2 (en) 2005-03-04 2010-11-09 Eastman Kodak Company Addition of new images to an image database by clustering according to date/time and image content and representative image comparison
JP4721830B2 (ja) * 2005-08-31 2011-07-13 トヨタ自動車株式会社 画像検索方法及び装置
US7725484B2 (en) 2005-11-18 2010-05-25 University Of Kentucky Research Foundation (Ukrf) Scalable object recognition using hierarchical quantization with a vocabulary tree
WO2007103834A1 (en) 2006-03-03 2007-09-13 Honeywell International, Inc. Indexing and database search system
DE102006043910B4 (de) 2006-09-19 2010-02-25 Siemens Ag Ergebnisfilter und Verfahren zur Selektion der Ergebnisdaten einer Applikation zur automatischen Mustererkennung
CN101211355B (zh) * 2006-12-30 2010-05-19 中国科学院计算技术研究所 一种基于聚类的图像查询方法
US20090092299A1 (en) 2007-10-03 2009-04-09 Siemens Medical Solutions Usa, Inc. System and Method for Joint Classification Using Feature Space Cluster Labels
JP4881278B2 (ja) 2007-10-31 2012-02-22 株式会社東芝 物体認識装置及びその方法
US8144947B2 (en) * 2008-06-27 2012-03-27 Palo Alto Research Center Incorporated System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints
US8254697B2 (en) * 2009-02-02 2012-08-28 Microsoft Corporation Scalable near duplicate image search with geometric constraints
US8542950B2 (en) 2009-06-02 2013-09-24 Yahoo! Inc. Finding iconic images

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005293123A (ja) * 2004-03-31 2005-10-20 Nippon Telegraph & Telephone West Corp コンテンツフィルタリングシステム、その方法およびプログラム
JP2007052556A (ja) * 2005-08-16 2007-03-01 Tokyo Institute Of Technology 複数のxml文書の類似度検出方法および類似性検出システム、ならびに複数のxml文書の統合方法
WO2008020919A2 (en) * 2006-08-14 2008-02-21 Microsoft Corporation Automatic classification of objects within images
JP2010500688A (ja) * 2006-08-14 2010-01-07 マイクロソフト コーポレーション 画像内のオブジェクトの自動分類
JP2008287438A (ja) * 2007-05-16 2008-11-27 Canon Inc 画像処理装置及び画像検索方法
JP2009020888A (ja) * 2007-07-11 2009-01-29 Ricoh Co Ltd インビジブルジャンクションを生成する方法及びシステム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG199800290002; 黒川雅人 外1名: '"形状情報を用いた画像の類似検索システム"' 情報処理学会論文誌 第32巻,第6号, 19910615, p.721-730, 社団法人情報処理学会 *
JPN6014008877; 黒川雅人 外1名: '"形状情報を用いた画像の類似検索システム"' 情報処理学会論文誌 第32巻,第6号, 19910615, p.721-730, 社団法人情報処理学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020126465A (ja) * 2019-02-05 2020-08-20 株式会社日立製作所 検出装置、検出方法、および検出プログラム
JP7269747B2 (ja) 2019-02-05 2023-05-09 株式会社日立製作所 検出装置、検出方法、および検出プログラム

Also Published As

Publication number Publication date
CN102110122A (zh) 2011-06-29
HK1155235A1 (en) 2012-05-11
EP2517154A4 (en) 2015-03-18
WO2011078911A1 (en) 2011-06-30
CN102110122B (zh) 2013-04-03
US8577153B2 (en) 2013-11-05
US20120275705A1 (en) 2012-11-01
JP5665879B2 (ja) 2015-02-04
EP2517154A1 (en) 2012-10-31

Similar Documents

Publication Publication Date Title
JP5665879B2 (ja) サンプル画像インデックスの作成ならびに画像フィルタリングおよび検索のための方法およびシステム
US9767348B2 (en) Vector-based face recognition algorithm and image search system
Phyu et al. Performance comparison of feature selection methods
Cheraghian et al. Mitigating the hubness problem for zero-shot learning of 3d objects
US8582872B1 (en) Place holder image detection via image clustering
CN105593851A (zh) 用于跟踪与通过关联的文本和图像可识别的实体相关的微博消息的方法和装置
CN104239553A (zh) 一种基于Map-Reduce框架的实体识别方法
JP5012078B2 (ja) カテゴリ作成方法、カテゴリ作成装置、およびプログラム
WO2022143511A1 (zh) 一种恶意流量识别方法及相关装置
WO2012165135A1 (ja) 近似最近傍探索に係るデータベースの登録方法および登録装置
Luo et al. Pedestrian tracking in surveillance video based on modified CNN
CN110929525A (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
Hernández et al. Video analysis system using deep learning algorithms
Belhaouari et al. Optimized K‐Means Algorithm
JP6173754B2 (ja) 画像検索システム、画像検索装置および画像検索方法
Pouyanfar et al. Semantic concept detection using weighted discretization multiple correspondence analysis for disaster information management
WO2019092782A1 (ja) 情報処理装置、制御方法、及びプログラム
Kaleel et al. Event detection and trending in multiple social networking sites
Shanmugapriya et al. A multi-balanced hybrid optimization technique to track objects using rough set theory
Elezaj et al. Record linkage using probabilistic methods and data mining techniques
Liu et al. A novel clustering algorithm based on PageRank and minimax similarity
CN116719942B (zh) 数据资产分类方法、装置、计算机设备和计算机存储介质
Doulamis et al. 3D modelling of cultural heritage objects from photos posted over the Twitter
Park et al. Query directed web page clustering using suffix tree and Wikipedia links
Ha et al. Spotting symbol over graphical documents via sparsity in visual vocabulary

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141209

R150 Certificate of patent or registration of utility model

Ref document number: 5665879

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250