JP6740457B2 - 商標画像のコンテンツ・ベースの検索及び取得 - Google Patents

商標画像のコンテンツ・ベースの検索及び取得 Download PDF

Info

Publication number
JP6740457B2
JP6740457B2 JP2019506340A JP2019506340A JP6740457B2 JP 6740457 B2 JP6740457 B2 JP 6740457B2 JP 2019506340 A JP2019506340 A JP 2019506340A JP 2019506340 A JP2019506340 A JP 2019506340A JP 6740457 B2 JP6740457 B2 JP 6740457B2
Authority
JP
Japan
Prior art keywords
image
trademark
degrees
color
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019506340A
Other languages
English (en)
Other versions
JP2019520662A (ja
Inventor
アルベイラク、アブドゥルカディール
カルスリギル、エム.エリフ
シギルチ、アイ.オヌール
Original Assignee
アデル ビルジサヤール ヒズメトレリ ヴィイー ティカレット エイ.エス.
アデル ビルジサヤール ヒズメトレリ ヴィイー ティカレット エイ.エス.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アデル ビルジサヤール ヒズメトレリ ヴィイー ティカレット エイ.エス., アデル ビルジサヤール ヒズメトレリ ヴィイー ティカレット エイ.エス. filed Critical アデル ビルジサヤール ヒズメトレリ ヴィイー ティカレット エイ.エス.
Publication of JP2019520662A publication Critical patent/JP2019520662A/ja
Application granted granted Critical
Publication of JP6740457B2 publication Critical patent/JP6740457B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/77Determining position or orientation of objects or cameras using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20182Noise reduction or smoothing in the temporal domain; Spatio-temporal filtering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は一般に画像認識に関し、より詳細には、商標画像のコンテンツ・ベースの検索及び取得に関する。
商標は典型的には、特定のソースの製品又はサービスを他のソースの製品又はサービスから識別するための、名前、言葉、フレーズ、ロゴ、シンボル、デザイン、画像、又はこれらの要素の組合せである。したがって商標は、言葉、形状、パターン、及び/又はロゴを形作る非常に様々なタイプの線及び色を含むことがある。商標は世界中で、商標出願を審査及び承認する様々な国の政府機関に出願され、登録される。しばしば、商標を出願し、承認されるために、類似の登録商標があるかどうかをチェックするための検索が行われる。
コンテンツ・ベースの画像取得又は視覚検索は、いくつかのクエリ画像の視覚特性について類似の複数の画像からデジタル画像を取得するタスクである。視覚検索技術は、従来のキーワード検索に対するいくつかの利点をもたらす。重要なことに、これは、記述的なメタデータをタグ付けされたことがないコレクション内の画像を検索すること、及びテキストではなく画像で検索することを、ユーザが行うことを可能にし、これは、一連のキーワードより非常に強力なクエリになり得る。
しかし、検索用の画像を使用するために、画像の属性又は特徴を抽出、識別、又はそうでなければ認識するための画像処理が行われる。今のところ、十分なスピードで商標をマッチングさせる品質をもたらす正確且つ効率的な検索方法及びシステムが利用できたことはなかった。したがって、商標画像のセットから画像を検索し、マッチングさせ、取得するための、自動的で、計算効率が良く、正確な方法及びシステムが必要である。
本発明は、大いに効率的且つ正確な、商標画像の検索及び取得の方法、システム、及びコンピュータ製品を提供することによって、これらの問題に対処する。
本発明の1つの実施例によれば、商標画像のコンテンツ・ベースの検索及び取得のための方法が提供される。方法は、商標画像の各ピクセルに対する6ビットの色データを使用して各商標画像に対する64ビンの色ヒストグラムをプロセッサを用いて生成することによって、複数の商標画像から色の特徴を抽出することであって、6ビットの色データが、商標画像の各ピクセルに対する赤、緑、及び青チャネルのそれぞれからの2ビットを含む、色の特徴を抽出することを含む。方法は、商標画像の各ピクセルに対する重み付き方向角データを使用して各商標画像に対する9ビンの方向ヒストグラムをプロセッサを用いて生成することによって、複数の商標画像から形状の特徴を抽出することをさらに含む。方法は、2つの商標画像の色ヒストグラムと方向ヒストグラムの間の距離の類似性尺度を、プロセッサによって生成することをさらに含む。
別の実施例によれば、商標画像のコンテンツ・ベースの検索及び取得のための方法は、データベース内の商標画像のセットのURLを提供することと、クエリ商標画像を受け取ることと、を含む。方法は、プロセッサによって商標画像のそれぞれから色の特徴を抽出することであって、画像を平滑化するために第1のフィルタを適用すること、画像の背景ピクセルを取り除くために第2のフィルタを適用すること、画像の各ピクセルに対する6ビットの色データを提供するために、赤、緑、及び青チャネルのそれぞれからの2ビットを連結すること、並びに6ビットの色データを使用して画像の64ビンの色ヒストグラムを抽出することを含む、色の特徴を抽出することをさらに含む。方法は、プロセッサによって商標画像のそれぞれから形状の特徴を抽出することであって、画像をグレースケールに変換すること、画像からノイズの多いピクセルを取り除くために第3のフィルタを適用すること、画像の各ピクセルに対する水平導関数及び垂直導関数を計算すること、画像の各ピクセルに対する導関数の商を得るために、垂直導関数を水平導関数で割ること、導関数の商のアークタンジェントを計算することによって、画像の各ピクセルに対する方向角を計算すること、画像を3×3のブロックに分割すること、並びに画像の81ビンの形状ヒストグラムを得るために、加重値と共に方向角データを使用して、画像の各ブロックに対する9ビンの形状ヒストグラムを抽出することであって、形状ヒストグラムの9個のビンが、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、及び160〜180度を含む、9ビンの形状ヒストグラムを抽出することを含む、形状の特徴を抽出することをさらに含む。方法は、バタチャリヤ距離を使用して、クエリ商標画像と、商標画像のセットの各商標画像との間の色の特徴と形状の特徴を比較することによって、クエリ商標画像と商標画像のセットとの間の類似性を判断することと、バタチャリヤ距離による順序で商標画像のセットから商標画像を返すことと、をさらに含む。
本発明のさらに別の実施例によれば、機械の1つ又は複数のプロセッサによって実行されると、上述のような動作を機械に行わせる命令を含む非一時的機械可読ストレージ媒体が提供される。
本発明のさらに別の実施例によれば、商標画像のコンテンツ・ベースの検索及び取得のためのシステムが提供される。システムは、1つ又は複数のプロセッサと、商標画像の各ピクセルに対する6ビットの色データを使用して、商標画像の64ビンの色ヒストグラムを生成するように、1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する色ヒストグラム・モジュールであって、6ビットの色データが、商標画像の各ピクセルに対する赤、緑、及び青チャネルのそれぞれからの2ビットを含む、色ヒストグラム・モジュールを含む。システムは、商標画像の各ピクセルに対する重み付き方向角データを使用して商標画像の9ビンの方向ヒストグラムを生成するように、1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する方向ヒストグラム・モジュールをさらに含む。システムは、2つの商標画像間の色ヒストグラムと方向ヒストグラムを比較して距離の類似性尺度を生成するように、1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する比較モジュールをさらに含む。
本発明、及びそのいくつかの特定の実施例による、商標検索及び取得のための方法、システム、及びコンピュータ製品が、以下の図を参照しながら説明される。本発明のこれら及び他の特徴、態様、及び利点は、図面の全体を通じて同様の文字が同様の部品を表す添付の図面を参照しながら以下の詳細な説明を読むとよりよく理解されるようになるであろう。添付の図面の図の中で、いくつかの実施例が実例として示されるが、これらに限定されない。断りのない限り、図面が拡大縮小して描かれることはない。
いくつかの実施例による、画像処理を行い、画像処理から得られた画像特徴データを使用するためのシステムの実例を描写するネットワーク図を示す図である。 いくつかの実施例による、図1のシステム内に提供される構成要素を示すブロック図を示す図である。 いくつかの実施例による、モジュール及びライブラリ/データ構造/データベースの中で実行される画像処理及び画像データ使用の機能/動作を示すブロック図を示す図である。 いくつかの実施例による、図3のモジュールによって実行される商標画像処理及び商標画像のマッチング又は比較の判断のための流れ図の実例を示す図である。 いくつかの実施例による、色ヒストグラムを生成するための画像の処理を示す図である。 いくつかの実施例による、指向性勾配ヒストグラム(oriented gradients histogram)を生成するための画像の処理を示す図である。 いくつかの実施例による、マッチング又は比較フェーズの高レベルの流れ図を示す図である。 いくつかの実施例による、図4〜図7の商標検索の流れ図の実装形態に関連するユーザ・インターフェース(UI:user interface)画面及びヒストグラムの描写を示す図である。 いくつかの実施例による、図4〜図7の商標検索の流れ図の実装形態に関連するユーザ・インターフェース(UI)画面及びヒストグラムの描写を示す図である。 いくつかの実施例による、図4〜図7の商標検索の流れ図の実装形態に関連するユーザ・インターフェース(UI)画面及びヒストグラムの描写を示す図である。 いくつかの実施例による、図4〜図7の商標検索の流れ図の実装形態に関連するユーザ・インターフェース(UI)画面及びヒストグラムの描写を示す図である。 いくつかの実施例による、図4〜図7の商標検索の流れ図の実装形態に関連するユーザ・インターフェース(UI)画面及びヒストグラムの描写を示す図である。 いくつかの実施例による、図4〜図7の方法論のうちの任意の1つ又は複数を機械に行わせるための命令のセットが実行され得るコンピュータ・システムの形式の実例における機械の図式表現を示す図である。
本発明の全体的な実施例によれば、クエリ画像、及び登録商標画像のセットのコンテンツに基づく「マッチした」商標画像を検索及び取得するための方法、システム、及びコンピュータ製品が開示される。1つの実施例によれば、企業の登録商標の画像の類似性の比較及び取得のための方法は、(1)画像の色の特徴の類似性の計算、及び(2)画像の形状の特徴の類似性の計算という、少なくとも2つのステージを含むことができる。
いくつかの実施例において、画像の比較、マッチング、及び取得の方式は以下のように動作する。画像データベース/コレクションが提供される。例えば、画像のセット(画像データベース内のロゴ、商標)を含むフォルダのユニフォーム・リソース・ロケータ(URL:uniform resource locator)又はウェブサイト/ウェブ・ページのアドレスが、すべての画像の色及び形状の特徴を計算するために、商標サービス・アプリケーション及び/又は商標検索アプリケーションに与えられる。次に、画像の抽出された特徴はデータベースに格納されてよい。その後、クエリ画像/入力画像(マッチング又は比較するための、関心のあるロゴ、デザイン、言葉、形状、色、及び同様のもの)が提供され、色及び形状の特徴がクエリ画像から抽出される。クエリ画像の色及び形状の特徴は、データベースに格納された登録商標の画像特徴と比較され、所与の入力画像と登録商標画像の間の類似性尺度は、画像データベース/フォルダから最も類似している画像を取得するために計算される。
別の実施例によれば、商標画像を検索する方法は、商標画像の各ピクセルに対する6ビットの色データを使用して商標画像の64ビンの色ヒストグラムを生成することによって、商標画像から色の特徴を抽出することであって、6ビットの色データが、商標画像の各ピクセルに対する赤、緑、及び青チャネルのそれぞれからの最上位の2ビットを含む、色の特徴を抽出することを含む。最上位ビットは、色を表す最も代表的なビットを指し、1つの実例において、RGBチャネルのそれぞれからの最初の2ビットである。方法は、商標画像の各ピクセルに対する重み付き方向角データを使用して商標画像の9ビンの方向ヒストグラムを生成することによって、商標画像から形状の特徴を抽出することをさらに含む。方法は次に、2つの商標画像の色ヒストグラムと方向ヒストグラムの間の距離の類似性尺度を生成することを含む。
入力商標画像から画像特徴データを抽出するため、及び画像特徴データの様々な使用のための方法、システム、及びコンピュータ製品が、本明細書でさらに詳細に説明される。画像特徴データは、入力画像に対応する色ヒストグラム、方向ヒストグラム、パターン識別、及び支配色を含むが、これらに限定されない。クエリ画像又は入力画像は、少なくとも色及び/若しくはパターンなどの、画像をキャプチャするためにユーザによって撮影されたデジタル写真、又はウェブサイト若しくはウェブ・ページ上に含まれる画像を含むことができる。抽出された画像特徴データは、クエリ画像をマッチングさせる、提供されたデータベース内の類似の商標画像を提供するために使用される。いくつかの実施例において、比較のための商標画像のセット(例えば、様々な中央政府機関からの登録商標)を得るために、1つ又は複数のソースが使用される。
実施例の実例に対する様々な変更が、当業者には容易に明白であり、本明細書で定義される包括的な原理が、本発明の範囲を逸脱することなく、他の実施例及び応用例に適用されてよい。その上、以下の説明において、非常に多くの詳細が説明のために示される。しかし、当業者は、これらの具体的詳細を使用することなく本発明が実践されてよいということがわかるであろう。他の例において、不必要に詳しくすることで本発明の説明をあいまいにしないように、よく知られた構造及び処理はブロック図の形では示されない。したがって、本開示は、示された実施例に限定することを意図するものではなく、本明細書で開示される原理及び特徴と一致する最も広い範囲が与えられるべきである。
図1は、いくつかの実施例による、商標画像検索のために画像処理を行い、画像処理から取得された画像特徴データを使用するためのシステム100の実例を描写するネットワーク図を示す。ネットワーク・システム102は、ネットワーク104(例えば、インターネット又は広域ネットワーク(WAN:Wide Area Network))を介して、1つ又は複数のクライアント及びデバイスにサーバ・サイドの機能を提供する、ネットワーク・ベースの公開システムを形成する。図1は、例えば、デバイス・マシン110上で実行するウェブ・クライアント106(例えばウェブ・ブラウザ)及びプログラマティック・クライアント108の1つ又は両方をさらに示す。1つの実施例において、システム100は、マッチング・システム、推奨システム、及び、又は登録サービス・システムを備える。
デバイス・マシン110は、少なくともディスプレイ、及びネットワーク・システム102にアクセスするためのネットワーク104との通信機能を含むコンピューティング・デバイスを備える。デバイス・マシン110は、リモート・デバイス、ワーク・ステーション、コンピュータ、汎用コンピュータ、インターネット家電、ハンドヘルド・デバイス、ワイヤレス・デバイス、ポータブル・デバイス、ウェアラブル・コンピュータ、セルラー又は携帯電話、携帯型情報端末(PDA:portable digital assistant)、スマートフォン、タブレット、ウルトラブック、ネットブック、ラップトップ、デスクトップ、マルチプロセッサ・システム、マイクロプロセッサ・ベースの又はプログラム可能な家庭用電化製品、家庭用ゲーム機、セットトップ・ボックス、ネットワークPC、ミニコンピュータ、及び同様のものを含むが、これらに限定されない。デバイス・マシン110は、有線接続又はワイヤレス接続を介してネットワーク104と接続することができる。例えば、ネットワーク104の1つ又は複数の部分は、アドホック・ネットワーク、イントラネット、エクストラネット、仮想プライベート・ネットワーク(VPN:virtual private network)、ローカル・エリア・ネットワーク(LAN:local area network)、ワイヤレスLAN(WLAN:wireless LAN)、広域ネットワーク(WAN:wide area network)、ワイヤレスWAN(WWAN:wireless WAN)、メトロポリタン・エリア・ネットワーク(MAN:metropolitan area network)、インターネットの一部、公衆交換電話網(PSTN:Public Switched Telephone Network)の一部、セルラー電話ネットワーク、ワイヤレス・ネットワーク、WiFi(登録商標)ネットワーク、WiMax(登録商標)ネットワーク、別のタイプのネットワーク、又は2つ以上のこのようなネットワークの組合せであってよい。
デバイス・マシン110は、ウェブ・ブラウザ、メッセージング・アプリケーション、電子メール(eメール)アプリケーション、eコマース・サイト・アプリケーション(マーケットプレイス・アプリケーションとも呼ばれる)、商標検索及び/又は商標登録アプリケーション、並びに同様のものなど、ただしこれらに限定されない、1つ又は複数のアプリケーション(「アプリ」とも呼ばれる)を含む。いくつかの実施例において、商標アプリケーションが所与のデバイス・マシン110に含まれる場合、このアプリケーションは、ユーザ・インターフェース、及び機能のうちの少なくともいくつかをローカルに提供するように構成され、アプリケーションは、ローカルに利用できないデータ及び/又は処理機能(商標画像のデータベースへのアクセス、ユーザを認証すること、支払いの方法を確認すること等など)を求めて、必要に応じてネットワーク・システム102と通信するように構成される。逆に、商標検索及び/又は商標登録アプリケーションが所与のデバイス・マシン110に含まれない場合、デバイス・マシン110は、そのウェブ・ブラウザを使用して、ネットワーク・システム102上でホストされる商標サービス・サイト(又はその変形物)にアクセスすることができる。単一のデバイス・マシン110が図1に示されるが、さらに多くのデバイス・マシンがシステム100に含まれてもよい。
アプリケーション・プログラム・インターフェース(API:Application Program Interface)サーバ112及びウェブ・サーバ114は、1つ又は複数のアプリケーション・サーバ116に結合され、このアプリケーション・サーバへのプログラマティック・インターフェース及びウェブ・インターフェースをそれぞれ提供する。アプリケーション・サーバ116は、本発明の実施例による、1つ又は複数の「商標アプリケーション」(例えば、商標サービス・アプリケーション118及び商標検索アプリケーション120)をホストする。アプリケーション・サーバ116は、支払アプリケーション及び商標サービスをサポートする他のアプリケーションをさらに含むことができる。アプリケーション・サーバ116は次に、1つ又は複数のデータベース124へのアクセスを容易にする1つ又は複数のデータベース・サーバ122に結合されることが示される。
商標サービス・アプリケーション118は、ネットワーク・システム102にアクセスするユーザにいくつかの商標登録機能及びサービスを提供することができる。商標登録機能/サービスは、いくつかの商標登録機能及びサービス(例えば、フォーム、法律、及び/又は情報の提供、データの取込み、画像キャプチャ、支払い等)を含むことができる。例えば、商標サービス・アプリケーション118は、ユーザの商標を提供すること(例えば、商標をキャプチャすること)、ユーザの商標を政府機関に届け出ること、並びに売却のためのサービスを提案すること(例えば、相談すること、商標登録に対する何らかの異議に応答するために政府機関との橋渡し役をすること、対応を容易にすること、及び商標登録に関連する他のサービス)を行うために、いくつかのサービス及び機能をユーザに提供することができる。さらに、商標サービス・アプリケーション118は、キャプチャされた商標、取引、及びユーザとの対話に関連するデータ及びメタデータを追跡及び格納することができる。いくつかの実施例において、商標サービス・アプリケーション118は、アプリケーション・サーバ116、又はアプリケーション・サーバ116及び/若しくはデータベース・サーバ122にアクセス可能なデータベース124に格納されたコンテンツ項目を公開するか、又はそうでなければこれらへのアクセスを提供することができる。
商標検索アプリケーション120は、いくつかの商標検索及び商標取得の機能及びサービス(例えば、検索すること、報告すること、見直し及びフィードバック、並びに商標検索に関連する他のサービス又は機能など)を含むことができる。商標検索アプリケーション120は、1つの実例において、潜在的な商標登録アプリケーションにとって関心のある可能性のある、提供されたクエリ画像又は入力画像に類似の画像を求めて、登録商標のセット又はデータベースをユーザが検索することを可能にすることができる。商標検索アプリケーション120は、クエリ画像、及び検索された画像(例えば、登録商標画像)のセットから色及び形状の特徴を抽出し、色及び指向性勾配に対応するヒストグラムを生成し、その後、厳密な「マッチング」を求めて、クエリ画像とデータベース画像のセットとの間でヒストグラムを比較する。検索された画像のセットは、データベース124、又はサード・パーティのデータベース130にアクセスできるサード・パーティのサーバ126からのものであってよい(例えば、商標を登録する様々な国の政府機関からの公的に利用可能な登録商標画像)。さらに、商標検索アプリケーション120は、キャプチャされた商標、取引、及びユーザとの対話に関連するデータ及びメタデータを追跡及び格納することができる。いくつかの実施例において、商標検索アプリケーション120は、アプリケーション・サーバ116、又はアプリケーション・サーバ116及び/若しくはデータベース・サーバ122にアクセス可能なデータベース124に格納されたコンテンツ項目を公開するか、又はそうでなければこれらへのアクセスを提供することができる。
商標アプリケーション118及び120は、両方がネットワーク・システム102の一部を形成するように図1に示されるが、代替実施例において、商標アプリケーションは、ネットワーク・システム102とは別々且つ別個の、又は互いに別々且つ別個の商標アプリケーション・サービスの一部を形成することができるということが理解されよう。他の実施例において、商標サービス・アプリケーション118は、システム100から省略されてよい。いくつかの実施例において、デバイス・マシン110上に商標アプリケーションの少なくとも一部が提供されてよい。
さらに、図1に示されるシステム100はクライアント−サーバ・アーキテクチャを用いるが、本開示の実施例はこのようなアーキテクチャに限定されず、例えば、分散型又はピアツーピアのアーキテクチャ・システムに同様にうまく応用されてよい。様々な商標サービス・アプリケーション118及び商標検索アプリケーション120は、必ずしもネットワーク機能がないスタンド・アロンのソフトウェア・プログラムとして実装されてもよい。
ウェブ・クライアント106は、ウェブ・サーバ114によってサポートされるウェブ・インターフェースを介して、様々な商標アプリケーション118及び120にアクセスする。同様に、プログラマティック・クライアント108は、APIサーバ112によって提供されるプログラマティック・インターフェースを介して、商標アプリケーション118及び120によって提供される様々なサービス及び機能にアクセスする。プログラマティック・クライアント108は、例えば、オフラインで、ネットワーク・システム102上で画像をキャプチャし、及び/又は商標アプリケーションを管理すること、並びにプログラマティック・クライアント108とネットワーク・システム102の間でバッチ・モード通信を行うことをユーザができるようにする商標サービス・アプリケーションであってよい。
図1は、APIサーバ112によって提供されるプログラマティック・インターフェースを介して、ネットワーク・システム102へのプログラム的にアクセスできるサード・パーティのアプリケーション128を実行するサード・パーティのサーバ・マシン126も示す。例えば、サード・パーティのアプリケーション128は、ネットワーク・システム102から取得された情報を利用して、サード・パーティによってホストされるウェブサイト上で1つ又は複数の特徴又は機能をサポートすることができる。サード・パーティのウェブサイトは、例えば、ネットワーク・システム102の関連アプリケーションによってサポートされる1つ又は複数の商標サービスを提供することができる。前述の通り、いくつかの実施例において、サード・パーティのサーバ126は、商標を登録し、登録商標画像のデータベース130へのアクセスを可能にする中央政府機関のサーバであってよい。
ここで図2を参照すると、ブロック図は、いくつかの実施例による、ネットワーク・システム102内に提供される構成要素を示す。ネットワーク・システム102は、サーバ・マシン間の通信を可能にするように通信可能に結合される専用又は共有のサーバ・マシン(図示せず)上でホストされてよい。構成要素自体は、情報がアプリケーション間で渡されるのを可能にするように、又はアプリケーションが共通のデータを共有し、アクセスするのを可能にするように、互いに及び様々なデータ・ソースに(例えば、適正なインターフェースを介して)通信可能に結合される。さらに構成要素は、データベース・サーバ122を介して1つ又は複数のデータベース124にアクセスすることができる。構成要素が、1つ又は複数のサード・パーティのデータベース130にアクセスできる可能性もある。
ネットワーク・システム102は、いくつかの商標サービスのメカニズムを提供することができ、それによって出願人は、クエリ画像(例えば、可能性のある商標)を提供又はキャプチャすることができ、システム102はその後、受け取られたクエリ画像を画像(例えば、登録商標)のデータベース又はセットと比較し、最大の「マッチング」をもたらし、取得された画像の閲覧を可能にするために、返された画像又は取得された画像を表示し、商標登録を申請することができる。この目的のために、ネットワーク・システム102は、少なくとも1つの商標画像キャプチャ・エンジン202、少なくとも1つの商標画像特徴抽出エンジン204、少なくとも1つの商標画像検索エンジン206、少なくとも1つの商標画像取得/公開エンジン208、少なくとも1つのナビゲーション・エンジン210、及び少なくとも1つの商標サービス・エンジン212を備えることができる。
商標画像キャプチャ・エンジン202は、検索エンジン206によって検索の基礎として使用されることになるユーザからのクエリ画像を受け取ることを可能にする。画像は、クライアント・デバイス(例えば、ラップトップ、携帯電話、又はタブレット)のカメラ又は画像構成要素から撮影されてよく、またストレージからアクセスされてもよい。1つの実例において、キャプチャ・エンジン202は、クエリ画像をデジタル化又は処理する。
商標画像特徴抽出エンジン204は、色ヒストグラムとして抽出された色の特徴、及び指向性勾配ヒストグラムとして抽出された形状の特徴などの、画像特徴の抽出を可能にする。色及び形状の画像特徴はその後、クエリ画像に類似の登録商標を検索するために使用されてよい。
商標画像検索エンジン206は、登録商標の画像クエリ又はキーワード・クエリを可能にする。実施例の実例において、検索エンジン206は、ユーザのデバイスからクエリ画像及び/又はキーワード・クエリを受け取り、抽出された画像特徴(例えば、色及び形状)と、登録商標のセットの中の画像の特徴及び/又は言葉による説明に関連した登録商標の情報との比較を行う。検索エンジン206は、クエリ(例えば、画像及び/又はキーワード)、並びにその後の任意のユーザのアクション及び挙動(例えば、ナビゲーション)を記録することができる。検索エンジン206は、画像が言葉しか含まないのか、色しか含まないのか、言葉と色の両方を含むのか、及び/又は画像が白黒なのかカラーなのかに基づいて検索することもできる。
検索エンジン206は、検索されることになる登録商標、データベース、又は機関の原産国に基づいて検索することもできる。さらにユーザは、モバイル・デバイスを介して検索エンジン206にアクセスし、検索クエリを生成することができる。検索クエリを使用して、検索エンジン206は、1つの実例において、バタチャリヤ距離などの最短の数理的な距離に基づいて最大のマッチングを見つけるために、関連する画像特徴を比較する。
商標画像取得/公開エンジン208は、比較された色の特徴及び/又は形状の特徴に基づいて、類似の又はマッチした登録商標の関連検索結果を提供すること、公開すること、及び/又は返すことができる。1つの実例において、画像取得/公開エンジン208は、最短のバタチャリヤ距離の数字順に結果を返す。画像取得/公開エンジン208は、それぞれの返された登録商標のカテゴリ又は分類(例えば、登録商標が、特定のカテゴリ中の関連する商品又はサービスに分類されるニース分類)を含むこともできる。所有者、登録人、説明、登録日付、及び同様のものなどの登録商標に関連する追加情報は実施例の範囲内である。
ネットワーク・システム102は、取得された(返された)登録商標の様々なカテゴリ又は分類を通じてユーザがナビゲートすることを可能にするナビゲーション・エンジン210をさらに含むことができる。例えば、ナビゲーション・エンジン210は、一覧の特定のセットに到達するまで、カテゴリの階層(例えば、カテゴリ・ツリー構造)を備えるカテゴリ・ツリーを、ユーザが連続的にナビゲートすることを可能にする。ナビゲーション・エンジン210内の様々な他のナビゲーション・アプリケーションが、検索アプリケーション及びブラウジング・アプリケーションを補うために提供されてよい。ナビゲーション・エンジン210は、カテゴリ・ツリーをナビゲートするためにユーザによって行われる様々なユーザ・アクション(例えば、クリック)を記録することができる。
ネットワーク・システム102に関連する追加のモジュール及びエンジンが、さらに詳細に下記で説明される。モジュール又はエンジンは、下記で説明される詳細の様々な態様を具体化できるということを理解されたい。
図3は、いくつかの実施例による、モジュール及びライブラリ/データ構造/データベースで実行される画像処理及び画像データ使用の機能/動作を示すブロック図を示す。モジュールは、1つ又は複数のソフトウェア構成要素、プログラム、アプリケーション、又はアプリケーション・サーバ116及び/若しくはデバイス・マシン110に含まれる1つ若しくは複数のプロセッサによって実行されるように構成されるコード・ベースの他のユニット若しくは命令を含む。モジュールは、商標画像キャプチャ・モジュール310、色ヒストグラム・モジュール312、指向性勾配ヒストグラム・モジュール314、索引付けモジュール316、比較モジュール318、商標画像取得モジュール320、ブラウザ・プラグイン・モジュール322、及びユーザ関心検出モジュール324を含む。モジュール310〜324は、登録商標画像データベース302及び商標画像索引データベース304のそれぞれと通信することができ、この中でデータベース302、304は、データベース124に含まれても、含まれなくてもよい。データベース302は、サード・パーティのデータベース130に関連付けられるか、又はリンクされてよいということにも留意されたい。図3に別個のモジュールとしてモジュール310〜324が示されているが、モジュール310〜324は、図示されたものよりも少ないか又は多くのモジュールとして実装されてよいということを理解されたい。モジュール310〜324のいずれかは、データベース・サーバ122、アプリケーション・サーバ116、サード・パーティのサーバ126、又はデバイス・マシン110などの、システム100に含まれる1つ又は複数の構成要素と通信することができるということも理解されたい。同様に、図3に別個のデータベースとしてデータベース302、304が示される。しかし、データベース302、304のコンテンツは、図示されるものよりも少ないか又は多くのデータベースに格納されてよいということが理解される。
いくつかの実施例において、モジュール310〜324のうちの1つ又は複数は、コンピューティング・デバイスのタイプにふさわしいサービス・サイトからダウンロードされるか、又はOS依存の複数のモジュール若しくはアプリケーションがダウンロードに利用できることもある。例えば、デバイス・マシン110がiOSタイプのデバイス(例えば、Mac、iPhone(登録商標)、又はiPad(登録商標))を含む場合、(商標サービス・アプリケーション及び/又は商標検索アプリケーションの一部としてパッケージ化され得る)モジュールは、iTunesからダウンロードされてよい。同様に、デバイス・マシン110がAndroidタイプのデバイスを含む場合、モジュールは、Androidマーケットプレイスからダウンロードされてよい。デバイス・マシン110には、データ、並びに/又は下記でさらに詳細に説明されるような、画像キャプチャ、画像処理、及び画像処理からの画像データの使用を容易にする処理機能にアクセスするための、遠隔地にあるサーバ又はデータベース(例えば、データベース124、データベース・サーバ122、APIサーバ112、ウェブ・サーバ114)との通信機能がある。
他の実施例において、モジュール310〜324のうちの1つ又は複数は、アプリケーション・サーバ116上でホストされてよく、デバイス・マシン110上でのモジュールのダウンロードは必要ではない。代わりにモジュールは、ネットワーク104上でウェブ・ブラウザを使用してデバイス・マシン110によってアクセスされてよい。さらに他の実施例において、モジュールの中にはデバイス・マシン110に含まれ得るものがある一方、アプリケーション・サーバ116に含まれ得るものもあり、デバイス・マシン110は、ふさわしい機能を互いに提供するためにアプリケーション・サーバ116と通信する。
図4は、いくつかの実施例による、図3のモジュールによって実行される画像処理、及び画像マッチングの判断のための流れ図400の実例を示す。流れ図400の動作は、デバイス・マシン110、及び/又はネットワーク・システム102に含まれるサーバ(例えば、APIサーバ112、ウェブ・サーバ114、アプリケーション・サーバ116、データベース・サーバ122)によって行われてよい。
流れ図400の動作/機能は、索引付けフェーズ401A及びマッチング・フェーズ401Bという、2つのフェーズに分類されてよい。いくつかの実施例において、索引付けフェーズ401Aは、画像特徴データを得るための、例えば、アプリケーション・サーバ116による既存の登録商標画像(例えば、データベース124、130、及び/又は302に格納された登録商標に対応する画像)のオフライン画像処理を含む。既存の登録商標は、様々な政府機関、登録商標の私的に収集されたデータベース、又は同様のものなどの、様々なソースから提供されてよい。
得られた画像特徴データは、画像索引データベース304に索引付けされてよく、その後、マッチング・フェーズ中のより速い探索のために使用される。いくつかの実施例において、登録商標画像は1つ又は複数のバッチで処理されてよい。いくつかの実施例において、登録商標画像の一部又はバッチはオンラインで処理されてよく、得られた画像特徴データは、画像索引データベース304に索引付けされてよい。画像は、色ヒストグラム、方向ヒストグラム、及び同様のものを通じて示される色分散などの、ただしこれらに限定されない画像の特徴/属性に基づいて索引付けされてよく、ニース分類、登録人、所有者、国、及び同様のものなどの、ただしこれらに限定されない、登録商標に関連する他の利用可能な情報に基づいて索引付けされてもよい。
索引付けフェーズ401Aが完了すると、マッチング・フェーズ401Bは、(クエリ画像又は入力画像と呼ばれる)画像を含むクエリを受け取ることによってトリガされてよい。画像索引データベース304は、最も厳密にマッチする登録商標画像を見つけるためにアクセスされる。これらの登録商標画像は、類似性尺度に基づく、クエリ画像に対する「マッチング」結果として提示される。ブロック402〜406は、索引付けフェーズ401Aに関連し、ブロック412〜430は、マッチング・フェーズ401Bに関連する。ブロック412〜416は、マッチング・フェーズ401Bの中の特徴抽出フェーズ401Cに関連し、この中で、クエリ画像からの色及び形状の特徴が抽出される。ブロック412〜416は、索引付けフェーズ401Aのブロック402〜406に相関し、索引付けフェーズ401Aにおけるような登録商標からの色ヒストグラム及び指向性勾配の抽出に実質的に似ている。他の実施例において、色ヒストグラム及び指向性勾配ヒストグラムの抽出の順序は逆転されてよく、また同時に処理されてもよい(言い換えると、ブロック404/414及び406/416の順序は入れ替えられてよく、また実質的に同時に処理されてもよい)。索引付けフェーズ401Aの動作が最初に下記で説明され、その後マッチング・フェーズ401Bの動作が説明される。さらに他の実施例において、単一の特徴抽出アルゴリズム(言い換えると、色の特徴又は形状の特徴だけに基づくマッチング)が使用され、特に、商標入力画像/商標クエリ画像が色のみに基づく(即ち、形状を伴わない)か、形状のみに基づく(即ち、色を伴わない、即ち白黒である)かがユーザによって選ばれてよい。
索引付けフェーズ401Aに関して、ブロック402において、ネットワーク・システム102(例えば、アプリケーション・サーバ116)は、登録商標画像データベース302などのデータベースから登録商標画像を取得し、登録商標画像データベース302は、データベース124、サード・パーティのデータベース130、又は必ずしもデバイス・マシン110若しくはアプリケーション・サーバ116に収納されないが、デバイス・マシン110若しくはアプリケーション・サーバ116にアクセス可能な別のデータベースを指してよい。データベース302は、登録商標画像、及び登録商標に関連する情報を含む。登録商標についての情報は、登録人、国、ニース分類、関連日付、説明、及び同様のものを含むが、これらに限定されない。登録商標画像は、様々な言葉、文字、色、線、形状、パターン、及び/又は同様のものを含むことができる。単一の商標画像に対して行われる動作が本明細書で議論されるが、複数の画像が、バッチ・ジョブで互いに同時に処理されてよいということが理解される。所与の単一の商標画像に対して行われる動作は、議論を簡単にするためだけのものである。
ブロック404において、色ヒストグラム・モジュール312によって色ヒストグラムが抽出されるか、又は画像の色分散が識別される。索引付けモジュール316は、適宜、商標画像に対応する色ヒストグラムの画像特徴データに索引付けし、画像索引データベース304に追加するように構成される。画像は、1つ又は複数の属性に基づいて索引付けされてよい。例えば、画像は、マッチング項目の迅速な探索を容易にするために、画像の抽出された色の特徴、抽出された形状の特徴、関連情報、及び同様のものに従って索引付けされてよい。
商標画像の背景(例えば、白一色及び/又は黒一色の背景)は、自動的に取り除かれてよい。いくつかの実施例において、サンプリング・マスクは、保有画像の空間サンプリング・エリアをその後の特徴抽出動作に提供することができる。他の実施例において、サンプリング・マスクは、全体の商標画像が処理され得るので、使用されないか、又は必要とされない。画像のサンプリング・エリア、つまりサンプリング・マスク内のエリアが判断されると、このようなサンプリング・エリアは、様々な画像特徴の抽出及び識別のために使用される。他の実施例において、全体画像が処理されるので、サンプリング・エリアは判断されない。色ヒストグラムの抽出は、画像内で特徴づけられた項目の色分散の抽出又は識別を含む。
色表現の選択肢は、色分散の抽出に関係がある。色は様々な方式で表されてよい。商標画像に適した色空間は赤、緑、及び青(RGB)の色空間であり、ここで、すべての色は、3つの色チャネルの赤、緑、及び青について3次元で表される。1つの実施例において、(特に、サンプリング・マスク・エリア又は全体画像の中の)商標画像は、RGB色空間を使用して均一にサンプリングされるか、又はスキャンされる(均一サンプリングとも呼ばれる)。画像からのピクセルがサンプリングされる。これらのピクセルがサンプリングされると、情報(例えば、画像特徴又は属性)が、これらのピクセルのそれぞれから抽出される。情報は、ピクセル、又はそのすぐ隣のピクセルを伴うピクセルに基づいて抽出されてよい。色に関する情報はピクセル毎に抽出され、その後、値のコレクション(特徴とも呼ばれる)に組み合わされるか、統合されるか、又はプールされる。色の特徴の場合、例えば、色ヒストグラムを得るために、ヒストグラム技法が使用される。ヒストグラムは、ピクセルなどの項目がとり得る様々な値の発生の統合を含む。
図5は、いくつかの実施例による、ブロック402及び412それぞれの後に処理され、ブロック406及び416それぞれの前に処理されるブロック404及び414の詳細を示す。上述のように、他の実施例において、色ヒストグラム及び指向性勾配ヒストグラムの処理順序は入れ替えられてよく、また実質的に同時であってもよい。
1つの実施例において、ブロック440において、色ヒストグラムを抽出する前に、商標画像を平滑化するためにメジアン・フィルタ・アルゴリズムが適用される。ブロック442において、背景(例えば、白一色及び/又は黒一色の背景)が取り除かれる。ブロック444において、全体画像(背景を取り除いた後のすべてのピクセル)が、RGB色チャネルのそれぞれに対してサンプリングされる。ブロック446において、所与の画像のピクセルすべてに対して6ビットのデータを提供又は生み出すために、最上位の2ビットがRGBチャネルのそれぞれから連結され、その後、6ビットのデータは、ヒストグラムに追加するために使用される。ブロック448において、6ビットのデータは、商標画像の64ビンの色ヒストグラムを抽出するために使用される。
いくつかの実施例では、ビンが蓄積されると重みは適用されないが、他の実施例では、ビンに対する重みが適用されることもあるということに留意されたい。RGB色空間の3次元/3チャネルに対応する、結果として生じる積み重ねられたヒストグラムを生成するために、重みなし又は重み付き調節済サンプルが、積み重ねられるか又は互いに組み合わされる。いくつかの実施例において、RGB値は0から1までの範囲に正規化され得るということに留意されたい。いくつかの実施例において、RGBチャネルの有効な値の範囲は互いに同じであるということにさらに留意されたい。
以前の方法及びシステムは、HSV、又は十分なRGBカラー・マップなどの他の色空間、及び比較のためのユークリッド距離空間を使用してきた。しかし、元の大きくセグメント化されたRGB値を使用することは、商標画像のより大きな変化及びより精度の低い結果をもたらし、これは、(例えば、しばしば、同じ色の色調、劣化、又は変化のみを使用する)支配色の大きな変化を含まないことが多い。したがって本開示は、類似の色を互いにグループ化し、それにより、商標画像内のさらに正確な色のマッチングを可能にすることによって、カラー・セグメンテーションの削減又は減少をもたらす。
都合のよいことに、本開示は、ノイズの多いピクセルを抑制するため、又は画像内のノイズによる悪影響を削減若しくは無くすために商標画像を平滑化し、背景ピクセルを取り除き、(例えば、白及び/又は黒の背景を取り除くことによって)前景の色ヒストグラムを抽出する。さらに、本開示は、64ビン(2の6乗)の色ヒストグラムとみなされる色のスケールを減少させる(言い換えると、類似の色が互いにグループ化される)。商標画像の色のマッチングにさらに有利な詳細はあまり発見されていない。さらに、(楕円色分散により多くの影響を受ける/球状の塊を可能にする)ユークリッド距離の代わりに(楕円色分散にあまり影響を受けず、楕円分散を可能にする)バタチャリヤ距離を使用することが、商標画像のさらに正確な色のマッチングをもたらす。
図4に戻ると、ブロック406において、指向性勾配ヒストグラムは、指向性勾配ヒストグラム・モジュール314によって商標画像から抽出される。索引付けモジュール316は、商標画像に対応する指向性勾配ヒストグラムの特徴データを適宜索引付けし、画像索引データベース304に追加するように構成される。画像は、1つ又は複数の属性に基づいて索引付けされてよい。例えば、画像は、マッチング項目の迅速な探索を容易にするために、画像の抽出された色の特徴(例えば、色ヒストグラム)、抽出された形状の特徴(例えば、指向性勾配ヒストグラム)、関連情報(例えば、ニース分類)、及び同様のものに従って索引付けされてよい。
図6は、いくつかの実施例による、ブロック404及び414それぞれの後に処理され、ブロック420の前に処理されるブロック406及び416の詳細を示す。上述のように、他の実施例において、色ヒストグラム及び指向性勾配ヒストグラムの処理順序は入れ替えられてよく、また実質的に同時であってもよい。さらに他の実施例において、色の特徴だけ、又は形状の特徴だけを使用する単一の特徴処理が使用されてよい。1つの実施例において、ブロック450において、画像は、(色があれば)色からグレースケールに変換される。3つのRGB色チャネルの線形的寄与を表すグレースケール・フォーマットに変換することが不必要な色チャネルのデータを削減し、したがって、形状の特徴のヒストグラムを得る際の効率性と速度を高めることを可能にする。
ブロック451において、エッジ検出又は形状アルゴリズムを適用するよりも前に、ノイズの多いピクセルを抑制又は取り除くために、メジアン・フィルタが画像に適用される。
ブロック452において、画像の各ピクセルに対して(例えば、Scharr演算子によって)、水平導関数及び垂直導関数(x導関数及びy導関数とも呼ばれる)が計算される。水平導関数は水平勾配をもたらし、垂直導関数は垂直勾配をもたらす。
1つの実施例において、画像のピクセルすべてのエッジ・マップを得るために、Sobelフィルタが適用されてよい。画像に対応するSobelエッジ・マップは、色が取り除かれた画像に含まれるエッジの忠実な線画を含む。他の実施例において、キャニー・エッジ・マップを得るために、キャニーエッジ検出器(Canny edge detector)などの、他のエッジ検出アルゴリズムを使用することができる。
ブロック453において、ブロック452で各ピクセルに対して計算された垂直導関数を水平導関数で割り、そのアークタンジェントをとることによって、方向角(指向性勾配とも呼ばれる)が計算される。
ブロック454において、画像は、ブロック(サブ・セル又はサブ領域と呼ばれることもある)に分割される。1つの実例において、全体画像はセルとみなされ、セルは3×3のブロック(又はサブ・セル若しくはサブ領域)に分割される。別の実例において、画像は2×2のセルに分割され、各セル内は3×3のブロックに分割されてよい(例えば、6×6即ち36のブロック又はサブ・セル若しくはサブ領域)。各ブロック内の各ピクセルに対して方向の計算が行われる。次に、ブロックにグループ化された各ピクセルは、方向ヒストグラムに寄与する。したがって、1つのセル、3×3のブロック、及び1ブロックあたり9ビンのヒストグラムの実例に関して、81ビンの指向性勾配ヒストグラムが形状の特徴としてもたらされる。
或いは、各ブロック内の各ピクセルに対して大きさの計算も行われ、方向ヒストグラムの加重ファクタとして使用されてよい。水平勾配の2乗と垂直勾配の2乗の和の平方根をとることによって、勾配の大きさが計算され得る。勾配の大きさはその後、重み付き方向ヒストグラムの加重ファクタの一部として使用されてよい。
ブロック455において、加重値と共に、計算された方向角をヒストグラムに追加することによって、各ブロックに対して、9ビンの重み付き指向性勾配ヒストグラムが抽出される。1つの実例において、指向性勾配ヒストグラムは、より高い精度を求めて、加重値によって以下の9個のビン、0〜20、20〜40、40〜60、60〜80、80〜100、100〜120、120〜140、140〜160、及び160〜180に分割される。方向角に与えられた重みは、角度をビンに正確に追加するための比率又は割合であってよい。重みは、ヒストグラムに含まれる隣のビンに角度が寄与し得るように使用される。例えば、計算された角度が50である場合、角度は、ビン40及びビン60に等しく寄与することができる。例えば、計算された角度が45である場合、3/4の重みがビン40に与えられてよく、1/4の重みがビン60に与えられてよい。ブロック455において、方向ヒストグラム・モジュール314は、エッジ・マップのピクセルの各方向角に重みを適用し、これは、方向角を9個のビンに正確にフィットする重み付き方向ヒストグラムを生じる。次に、方向ヒストグラム・モジュール314は、商標画像の形状の特徴を得るために、重み付き方向ヒストグラム内のビンを合計する。
或いは、前述のように、水平勾配の2乗と垂直勾配の2乗の和の平方根をとることによって、勾配の大きさが計算されてよい。勾配の大きさはその後、重み付き方向ヒストグラムの加重ファクタの一部として使用されてよい。
都合のよいことに、上述のように、商標が典型的には中心に置かれ、全体画像が処理されるので、形状の特徴を得るために以前に使用されたものよりも粗いか、又は細かくないセグメンテーション(即ち、少ないブロック又はサブ領域)が、商標画像のために使用されてよい。さらに、減少した色空間による画像の形状の特徴の処理と色の特徴の処理の組合せが、効率的且つ正確な商標画像の処理及びマッチングを可能にする。
したがって、所与の保有画像の画像特徴が抽出され/識別され、このような画像特徴は、クエリ画像に応答して迅速な探索を容易にするように適宜索引付けされた画像索引データベース304に格納される。必要に応じて何度でもブロック402〜406を繰り返すことによって、登録商標画像のすべて(セット、バッチ)が好きなだけ同様に索引付けされてよい。
保有画像が索引付けされると、マッチング・フェーズ401Bに関連して図4がここで説明される。ブロック412において、画像キャプチャ・モジュール310は、クエリ画像を受け取るように構成される。1つの実施例において、クエリ画像は、デバイス・マシン110によってネットワーク・システム102に送られる。デバイス・マシン110(例えば、スマートフォン)のユーザは、デバイス・マシン110に含まれるカメラを使用して、色、形状、パターン、ロゴ、テキスタイル、又は同様のものの写真を撮り、関心のある画像をキャプチャすることができる。写真は、画像特徴を抽出するためにクエリ画像としてネットワーク・システム102に伝送され、クエリ画像に最も似ている登録商標画像を返す。他の実施例において、ユーザは、クエリ画像ファイルをデバイス・マシン110に提供することができ、デバイス・マシン110は次に、この画像ファイルをネットワーク・システム102及び画像キャプチャ・モジュール310に伝送する。
デバイス・マシン110は、ウェブ・ブラウザを使用して、ウェブサイトを介してネットワーク・システム102とインターフェースすることができる。クエリ画像は、クエリ画像から特徴を抽出するために、ネットワーク・システム102に送られてよい。ネットワーク・システム102は、クエリ画像の抽出された特徴を使用して、登録商標画像とのマッチングを見つける。最上位のマッチングがデバイス・マシン110に返され、マッチング結果のウェブ・ページに並べられる。
デバイス・マシン110は、ネットワーク・システム102とインターフェースするためにアプリケーションをインストールするか、又はネットワーク・システム102によってホストされるウェブサイトにアクセスすることができる。ユーザがデバイス・マシン110でアプリケーションを起動すると、アプリケーションは、ユーザがクエリ画像を入力、又はそうでなければ指定するのに役立つ。実例として、アプリケーションは、ユーザが写真を撮ること、又はそうでなければ関心のある画像(例えば、色づけされた及び/若しくは模様のついた形状又は言葉)を得ることを可能にするカメラ機能を含むことができる(又はそうでなければ、別々のカメラ・アプリにアクセスすることができる)。さらに、アプリケーションは、既にデバイス・マシン110上にあるクエリ画像のデジタル・ファイルにアップロード又はリンクすることができる。
ブロック412〜416に関して、登録商標画像の代わりにクエリ画像に対して動作が行われる点を除いて、ブロック402〜406に対して上記で説明されたものと同じ動作が行われる。
ブロック420に関して、比較モジュール318は、クエリ画像に類似の又はマッチする1つ又は複数の登録商標画像を見つけるために、クエリ画像の色ヒストグラム及び指向性勾配ヒストグラムを、登録商標画像の色ヒストグラム及び指向性勾配ヒストグラムと比較するように構成される。
いくつかの実施例によれば、図7はブロック406と416の後に処理され、ブロック430の前に処理されるブロック420のさらなる詳細を示す。比較モジュール318は、色ヒストグラムの比較、また同様に指向性勾配ヒストグラムの比較という、クエリ画像と索引付けされた商標画像との各ペアに対して2つの比較を行う。ブロック460において、クエリ画像の色ヒストグラムと各登録商標画像の色ヒストグラムとの間の数理的な距離が計算される。ブロック462において、クエリ画像の指向性勾配ヒストグラムと各登録商標画像の指向性勾配ヒストグラムとの間の数理的な距離が計算される。上述のように、他の実施例において、色ヒストグラム及び指向性勾配ヒストグラムを比較する処理順序は入れ替えられてよく、また実質的に同時であってもよい。さらに他の実施例において、単一の特徴の比較だけが行われる(即ち、色の特徴又は形状の特徴が比較されるが、両方の比較は行われない)。
上記で説明された両方のアルゴリズム(即ち、色及び形状に基づくアルゴリズム)において、所与のクエリ画像/入力画像とフォルダに列挙されたデータベース画像すべてとの間の色及び形状の特徴に対する類似性尺度が、例えば、バタチャリヤ距離に従って計算され、ソートされる。最もマッチした画像は最短距離の類似性尺度を有する。都合のよいことに、本方法は、画像テクスチャが考慮されないので、すばやく且つ正確な商標画像の比較及び取得をもたらす。ほとんどの商標画像にはテクスチャがないか、又は色の移り変わりが多くないので、画像テクスチャは考慮されない。したがって、商標画像に対してあまりデータ処理が必要とされず、したがってより効率的だがそれでも正確な画像比較及び取得は、色の特徴を抽出するのに決して十分ではないRGB色空間と、形状の特徴を抽出するには粗いセグメンテーション(例えば、ブロック化)とを利用する本発明によって可能になる。意外にも、色の特徴と形状の特徴の両方を抽出する際に、(約数千から数百万の)商標タイプの画像の大きなセットに対する画像比較の処理効率と精度の両方を向上させるために、より粗く、且つ削減されたビニングが利用される。
(色又は方向)ヒストグラムのそれぞれの比較に対して、類似性スコア又は値が割り当てられてよい。各画像のペアに関して、最終的な類似性スコアは、色ヒストグラム比較類似性スコアと方向ヒストグラム比較類似性スコアの合計である。
考えられる類似性方式は、バタチャリヤ距離、コサイン類似性(内積)相関性、カイ2乗相関性、及び交差を含むが、これらに限定されない。1つの実施例において、バタチャリヤ距離として、類似値又はスコアが計算される。バタチャリヤ距離は、ビンの数の関数として、色ヒストグラム又は指向性勾配ヒストグラムの平方根のコサイン類似性の補数の平方根を含む。
図4に戻ると、ブロック430において、画像取得モジュール320は、デバイス・マシン110の画面に表示するために、類似結果又はマッチング結果をデバイス・マシン110に提供する。マッチング結果(例えば、登録商標画像、及び関連する可能性のある項目情報)は、クエリ画像に対する類似性の度合いの順に表示される。言い換えると、クエリ画像と、索引付けされた商標画像との各ペアに対する類似値が割り当てられる。類似性スコアは、いくつかの実施例において、入力クエリ画像に対する類似性の順に、デバイス・マシン110にマッチング結果が表示され得るようにソートされる。
いくつかの実施例において、システム又はユーザは、クエリ画像に応答して提示され得るマッチング結果の数に上限値を設定することができる。さらに、いくつかの実施例において、閾値を満たさない画像が取得又は表示されないように、類似性尺度の閾値が設定されてよい。
ここで図8A〜図8Eを参照すると、図8Aは、クエリ画像502を含むスクリーン・ショットの実例、即ちユーザ・インターフェース画面500を示し、図8Bは、色ヒストグラム抽出の高レベルのブロック図を示し、図8C〜図8Dは、指向性勾配ヒストグラム抽出の高レベルのブロック図を示し、図8Eは、クエリ画像との比較後に取得された検索結果又は返された検索結果を示すスクリーン・ショットの実例、即ちユーザ・インターフェース画面530を示す。図8A及び図8Eは、いくつかの実施例による、マッチング・フェーズに関係がある、デバイス・マシン110に表示される様々なユーザ・インターフェース(UI)画面を示す。
図8Aのユーザ・インターフェース500において、画面上に示されるクエリ画像の実例502は、文字、色、及び形状を含む。デバイス・マシン110上のアプリケーション(ネットワーク・システム102とインターフェースするため、又はネットワーク・システム102によってホストされるウェブサイトにアクセスするためのアプリケーション)は、クエリ画像502をネットワーク・システム102に伝送し、それに応じて、ネットワーク・システム102は、画像特徴の抽出動作を行い、上記で論じられたようなマッチング結果をもたらす。ユーザ・インターフェース500は、1つの実施例において、言葉若しくは文字、形状、又は両方などの画像のタイプ(Marka Tipi)、白黒又はカラーなどの色のタイプ(Renk)、及びクラス(siniflar)、又はニース分類若しくは他の番号付けされた説明などの説明を含むが、これらに限定されない、クエリ画像を説明するための検索オプション504をさらに含む。したがって、いくつかの実施例において、ユーザは、(例えば、色又は形状のアルゴリズムしか使用せず、両方を含まないように)検索及び取得のためのマッチング尺度を選択することができる。1つの実施例において、ユーザ・インターフェース500は、商標画像名
キーワード
出願番号(Basvuru No.)、書類番号(Bulten No.)、及びクエリ画像をロード(Yukle)、又は編集(Resmi duzenle)するためのオプションなどの、ただし限定されない、データ入力メニュー506をさらに含む。
図8Bは、色のある商標画像に対応する色ヒストグラム516の一部によって示されるような、画像の色の特徴を抽出するためのブロック404又は414の実行の実例を示す。各RGBチャネル510の2つの最上位ビット512(例えば、10、11、及び10)は、所与の画像内の各ピクセルに対する新しい6ビットの値514を作り出すために用いられ、組み合わされる(例えば、連結される)。
各ピクセルの6ビットの値すべてのヒストグラム516が次に計算されるか、又は抽出され、64ビンの色ヒストグラムに組み合わされる。水平軸は、各画像のピクセルに対するR、G、及びBチャネル510に対するビン(合計64ビン)を表す。ビンは、RGB色空間の中の様々な色に対応する。垂直軸は、水平軸上に表されるビンの量を表す。したがって、高いピークは、色とりどりの商標画像に対する、他の色より顕著に存在している色を表す。
積み重ねられた1Dのヒストグラムは、画像のサンプリング部分のすべてのピクセルの値を格納する代わりに、比較的コンパクトな形で画像についての情報を提示する。垂直軸は、水平軸上の対応する値をとるピクセルの数を表す。したがって、結果として生じる積み重ねられた1Dのヒストグラムは、全体の商標画像の中に(又は画像のサンプリング・マスクの中に)存在している色を識別する。
代替実施例において、商標画像は、有利ではないが、HSV色空間などの、RGB色空間以外の色空間を使用して均一にサンプリングされてよい。さらに他の実施例において、保有画像は、有利ではないが、LUV色空間、又は非均一なサンプリングにふさわしい他の色空間を使用して、非均一にサンプリングされてよい。
図8C及び図8Dは、画像の形状の特徴を抽出するための、ブロック406又は416の実行の実例を示す。商標画像520は、文字、形状、及び色を含むことができる。画像520は、3×3構成などでブロック521に分割され、(サブ・セル又はサブ領域とも呼ばれる)9つのブロック521を生じる。次に、図1〜図3(形状ヒストグラム抽出のためのシステム及び装置)並びに図4及び図6(形状ヒストグラム抽出の方法)に関して上述されたような9つのブロック521のそれぞれに対する9ビンの指向性勾配ヒストグラム526が抽出されてよい。各ブロック521は、Dのベクトルの長さを有する。528において示すような距離測定アルゴリズムを使用することによって各ヒストグラム間の距離Dが測定されてよい。
形状ヒストグラムの方法は、3×3のブロック521を有する1つのセルを1つの画像に設ける。各ブロック521は、合計81個のビンになるように9個のビンを各画像に設ける。商標画像の大部分が画像の中心に集中されるので、左上、右上、左下、及び右下側を計算することは時間の浪費であり、ヒストグラムに寄与することもない。2×2のセルに分割され、各セルが3×3のブロックを有し、各ブロックが9個のビンを有する画像と比較する際、これは、2×2×3×3×9、即ち324個のビンつまり特徴を意味する。324個の要素を有する各ベクトル間の類似性を計算することは、81個の要素を有するベクトルよりも一層時間がかかる。
画像520の各ピクセルに対して、形状の要素を表す行列522が計算され、次に、垂直導関数Gx及び水平導関数Gyが計算される。垂直導関数Gxを水平導関数Gyで割ると導関数の商を生じる。次に、(垂直導関数を水平導関数で割った)導関数の商のアークタンジェントをとることによって方向角Θが計算される。垂直導関数の2乗と水平導関数の2乗の和の平方根((Gx+Gy)の平方根)をとることによって、勾配の大きさが計算され得る。グラフ524は、1つの実例において、垂直導関数Gx、水平導関数Gy、大きさM、及び方向角Θを示す。
1つの実例において、指向性勾配ヒストグラム526は、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、及び160〜180度の9個のビンを使用して、重み付き方向角Θによって追加される。別の実例において、指向性勾配ヒストグラム526は、大きさの構成要素を含む重み付き方向角Θによって追加されてよい。
図8Eにおいて、画面530は、デバイス・マシン110に表示される、返された結果又はマッチング結果を示す。クエリ画像に「マッチする」とみなされるすべての項目が表示される。マッチング結果は、すべての類似値、色ヒストグラムの類似値、又は指向性勾配ヒストグラムの類似値などの、(例えば、最短バタチャリヤ距離による)類似値に基づくことなどの様々な方式で編成され、表示される。画面530は、バタチャリヤ距離に基づいて、返された画像の順序番号532を示し、最短バタチャリヤ距離が最小の順序番号を有し、対応する取得された画像が取得結果のリストの初めの方に現れる。マッチング結果は、ニース分類、登録人、又は同様のものに基づくなどして、類似値とカテゴリの組合せに基づいて編成され、表示されてもよい。選択されたカテゴリ内のマッチング項目は次に、このカテゴリに対して、より高い類似性スコアからより低い類似性スコアに並べられてよい。各マッチング画像に対して、色画像、並びに類似性スコア、登録人、所有者、及び国のうちの1つ又は複数などの、ただしこれらに限定されない情報が表示されてよい。
ユーザは、表示されたマッチング画像の中から、例えば、3番目にランク付けされた画像を選択することができる。それに応じて、選択された画像についてのさらなる画像の詳細が提供される。ユーザは、マッチング結果の中をナビゲートし、関心のある1つ又は複数の登録商標を閲覧することができる。したがって、1つの実施例において、ユーザは、画像ファイルを指し示すことによって、又は色及び/若しくはパターンを有する何かの写真を撮影することによって、クエリ画像を単純に提供することができ、アプリケーションはネットワーク・システム102を併用して、色、パターン、及び/若しくは形状に類似の又はこれらにマッチする登録商標のデータベースから画像を自動的に返すことができる。
登録商標のセットが、何万から何百万もの登録商標を含むとき、所与のクエリ画像のマッチング結果の数が途方もなく大きくなることがある。特にマッチング結果が、スマートフォン及び他のモバイル・デバイスに共通であるような、比較的小さなディスプレイで閲覧されると、マッチング項目のすべてがユーザによって閲覧されるよりかなり前に、閲覧に疲れてしまうことがある。比較的大きなディスプレイでさえ、(非常に)低いマッチング結果よりも、最上位のマッチング結果をユーザが閲覧する可能性が高くなる。したがって、効率的且つ正確な結果が大いに望ましい。
取得された画像を閲覧する際により多くのユーザオプションを提供し、場合によっては、所望の結果を改善するために、ユーザの関心によりよく合わせるように、又は結果を改善するように、当初のマッチング結果の中の登録商標の再ランク付け又は再配列を行うユーザ指示が、提供されたマッチング結果との対話処理中に使用されてよい。
例えば、デバイス・マシン110で所与のクエリ画像に対応するマッチング結果とのユーザの対話処理中に、ユーザは、マッチング結果の中から特定の登録商標への関心を示すことができる。選択された画像に対応する画像の詳細(例えば、より大きい画像、追加の画像、登録人、国、及び/又は同様のもの)が表示されてよい。
1つ又は複数の相関性、関連付け、又は推奨ルールに基づく再配列をリクエストするオプションを、ボタン又は他の指標がユーザに与えることができる。特定の商標、商標、選択された商標のコンテンツに関するユーザ選択などのいくつかのファクタ(例えば、色若しくは形状の特徴といった、好むような特定のヒストグラムのタイプ)、又はニース分類、登録人、所有者、国、及び/若しくは同様のものなどの商標関連の情報が、再配列処理/再ランク付け処理に対する、他の商標画像への相関性又は関連付けのために使用されてよい。ネットワーク・システム102におけるユーザ関心検出モジュール324は、特定の画像又は関連情報に対するユーザの指示/好みを受け取り、次に、ユーザが選択した商標又は関連情報などの、相関性又は関連付けルールに基づいて、初めにマッチした商標画像の再配列を行わせることができる。マッチング結果の中の2つ以上の画像に対するユーザの好みが、再配列又は再ランク付けの開始より前に示されて良い。次に、再配列されたマッチング結果がデバイス・マシン110に表示されてよい。再配列されたマッチング結果は、当初のマッチング結果の中の関心のある画像に関する追加のユーザ入力による、当初のマッチング結果の改良を含む。
ユーザによって提供されたマッチング結果の中の一定の画像又は画像関連情報に対する新しい好み又は追加の好みに応答して、所与のマッチング結果に対して再配列/再ランク付け動作が2回以上繰り返されてよい。
したがって、本発明は、クエリ画像のキャプチャ及び画像特徴の抽出、クエリ画像の画像特徴に最も厳密にマッチする登録商標画像の提示、並びに登録商標画像の詳細の閲覧を、ユーザの関心又は選択された情報に基づいて返された結果を改良するオプションと共に提供する。
ユーザが画像ファイルを提供すること、又はデバイス・マシン110上で写真を撮影し、アプリケーション若しくはウェブサイトを介してネットワーク・システム102にこの写真をアップロードすること以外の、クエリ画像を取得する代替方式は、HTMLベースのウェブ・ページを有する任意のウェブサイトなどの、ネットワーク・システム102に関連しないウェブサイトからのものである。国のカテゴリで登録商標を検索するのに、このようなオプションが有用なことがある。
マッチング結果を再配列又は改良するための、及びサード・パーティのウェブサイトからクエリ画像を取得するためのユーザ関心検出が、以下にさらに説明されるような、デバイス・マシン110にインストールされたブラウザ・プラグインによって容易にされる。ネットワーク・システム102(例えば、アプリケーション・サーバ116)によって提供されるブラウザ・プラグインは、デバイス・マシン110にインストールされる。ブラウザ・プラグインは、ブラウザの機能拡張、コードのjqueryスニペット、又はブラウザ・プラグインを含む。ブラウザ・プラグインは、スタンド・アロン・モジュール、又はアプリケーションの一部であってよい。ブラウザ・プラグインは、少なくともブラウザ・プラグイン・モジュール322を含む。ブラウザ・プラグイン・モジュール322は、一定のウェブサイト(又はウェブ・ページ)へのリクエストを検出するために、デバイス・マシン110におけるウェブ・ブラウザの活動を監視するように構成される。リクエストは、デバイス・マシン110に含まれるウェブ・ブラウザにユニフォーム・リソース・ロケータ(URL)アドレスをユーザがエントリすること、又はウェブ・ページへのハイパーリンクをユーザがクリックすることを含む。一定のウェブサイトは、クエリ画像が供給され得る複数のウェブサイトの中からのウェブサイト(又はウェブ・ページ)(例えば、HTMLベースのウェブ・ページを有する任意のウェブサイト)を含む。このようなウェブサイト(又はウェブ・ページ)は、クエリ画像ソース又は外部のサード・パーティのクエリ画像ソースと呼ばれることもある。
ブラウザ・プラグイン・モジュール322及び/又はユーザ関心検出モジュール324は、ウェブ・ページ上に含まれる画像へのユーザの関心又は興味を検出するように構成される。1つの実施例において、画像へのユーザの関心は、少なくとも最小時間、特定の画像又はその近くにポインティング・デバイス(例えば、マウス、トラックパッド、トラックボール、指など)をユーザが合わせるときに検出される。代替実施例において、ブラウザ・プラグイン・モジュール322は、ウェブ・ページ上に含まれる所与の画像への関心をユーザが明確に指定できるように、1つ又は複数のグラフィカル・ユーザ・インターフェース(GUI:graphical user interface)ツールを提供することができる。GUIツールの実例は、ポインティング・ツール、強調ツール、エリア指示ツール、及び同様のものを含むが、これらに限定されない。画像へのユーザの関心を検出する特定の方式が何であれ、検出は、表示されたウェブ・ページの特定の部分へのユーザの空間的な興味を識別することを含む。ユーザの関心のある画像が検出されると、ブラウザ・プラグイン・モジュール322は、ユーザの関心のある画像を受け取り、これは、上述のようなマッチング・フェーズ401Bに自動的に適用され得るクエリ画像を含む。
このように、画像特徴データの抽出及び画像特徴データの使用が本明細書で開示される。索引付けフェーズにおいて、登録商標画像がアクセスされ、これらの画像特徴及び属性を抽出するため、並びにこれらの画像特徴及び項目カテゴリによって商標画像が索引付けされる画像索引データベースにデータを入れるために、商標画像に対して索引付けが行われる。抽出された画像特徴は、色ヒストグラム及び指向性勾配ヒストグラムを含むが、これらに限定されない。(マッチング・フェーズとも呼ばれる)検索フェーズにおいて、画像索引データベース内の情報は、クエリ画像へのマッチング、又はクエリ画像に対応する最も類似の登録商標画像をもたらすために、(クエリ画像とも呼ばれる)非保有画像が受け取られるときにアクセスされる。クエリ画像は、ユーザが画像ファイルをアップロードすること、指し示すこと、eメールすること、メッセージングすること、又はそうでなければ伝達すること若しくは提供することによって提供されてよい。いくつかの実施例において、画像の写真、又は(無所属の)ウェブサイト若しくはウェブ・ページに含まれる画像は、入力画像又はクエリ画像を含む。検索結果は、クエリ画像に最もマッチする登録商標を含む。
別の実施例において、検索結果の中の商標のリスト化順序を再配列又は再ランク付けするために、検索結果の中にもたらされる商標又は関連情報のいくつかに対するユーザ選択又は好みが使用される。ウェブサイト/ウェブ・ページに含まれる画像へのユーザの関心が、この画像に対応する検索結果を返すために、入力、サンプル、又はクエリ画像として使用されてもよい。
画像特徴データの使用、特徴の抽出、及びマッチングの実行のための代替実施例が可能であるということが意図される。例えば、
○ 世界中のデータベースに商標として登録された類似の画像がないか、新たにデザインされたロゴ、形状、レタリング、色、シンボル、又は他の入力クエリ画像を自動的にチェックする。
○ 侵害を表す登録商標を自動的に検出する。
○ 追加の又は様々なフィルタが特徴の抽出に適用されてよい。
○ 様々な距離の関数を適用して、どの距離の関数がクラス固有という意味で最もよく機能するかを判断する(異なる項目間の距離を最大化させつつ類似の項目間の距離を最小化する)。
したがって、本発明は、大いに改善された速度、効率性、及び精度で、特徴データを抽出すること、特徴と画像を比較すること、画像及び関連データを取得すること、などを自動的に行うための、大いに改善された、商標画像の検索及び取得の方法、システム、及びコンピュータ製品を提供する。意外にも、色の特徴と形状の特徴の両方を抽出する際に、本発明は、フィルタリング、データ削減、より粗いセグメンテーション、及び削減されたビニングを利用して、(約数千から数百万の)商標タイプの画像の大きなセットに対する画像比較の処理効率と精度の両方を向上させる。
図9は、本明細書で議論される方法論のうちの任意の1つ又は複数を機械に行わせるために、命令のセットが実行され得るコンピュータ・システム600の形式の実例において機械の図式表現を示す。コンピュータ・システム600は、例えば、デバイス・マシン110、アプリケーション・サーバ116、APIサーバ112、ウェブ・サーバ114、データベース・サーバ122、又はサード・パーティのサーバ126のいずれかを備える。代替実施例において、機械は、スタンド・アロン・デバイスとして動作してよく、また他の機械に接続されてもよい(例えば、ネットワーク化されてもよい)。ネットワーク化された配置において、機械は、サーバ−クライアント・ネットワーク環境においてサーバ又はデバイス・マシンの処理能力の中で動作してよく、またピアツーピアの(又は分散型の)ネットワーク環境においてピア・マシンとして動作してもよい。機械は、サーバ・コンピュータ、クライアント・コンピュータ、パーソナル・コンピュータ(PC:personal computer)、タブレット、セットトップ・ボックス(STB:set−top box)、パーソナル・デジタル・アシスタント(PDA:Personal Digital Assistant)、スマートフォン、セルラー電話、ウェブ・アプライアンス、ネットワーク・ルータ、スイッチ若しくはブリッジ、又は任意の機械によって行われることになるアクションを指定する、(連続して又は別のやり方で)命令のセットを実行できる任意の機械であってよい。さらに、単一の機械だけしか示されていないが、用語「機械」も、命令のセット(又は複数のセット)を個別に又は統合して実行して、本明細書で議論される方法論のうちの任意の1つ又は複数を行う機械の任意のコレクションを含むように用いられるべきである。
コンピュータ・システム600の実例は、プロセッサ602(例えば、中央処理装置(CPU:central processing unit)、グラフィックス処理ユニット(GPU:graphics processing unit)、又は両方)、メイン・メモリ604、及び静的メモリ606を含み、これらは、バス608を介して互いに通信する。コンピュータ・システム600は、映像表示ユニット610(例えば、液晶ディスプレイ(LCD:liquid crystal display)、有機発光ダイオード(OLED:organic light emitting diode)、タッチ・スクリーン、又は陰極線管(CRT:cathode ray tube))をさらに含むことができる。コンピュータ・システム600は、英数字入力デバイス612(例えば、物理キーボード又は仮想キーボード)、カーソル制御デバイス614(例えば、マウス、タッチ・スクリーン、タッチパッド、トラックボール、トラックパッド)、ディスク・ドライブ・ユニット616、信号生成デバイス618(例えば、スピーカ)、及びネットワーク・インターフェース・デバイス620も含む。
ディスク・ドライブ・ユニット616は、本明細書で説明される方法論又は機能のうちの任意の1つ又は複数を具体化する命令624の1つ又は複数のセット(例えば、ソフトウェア)が格納される機械可読媒体622を含む。命令624は、コンピュータ・システム600による命令の実行中にメイン・メモリ604内及び/又はプロセッサ602内に完全に又は少なくとも部分的に常駐することもでき、メイン・メモリ604及びプロセッサ602も機械可読媒体とみなされる。
命令624は、ネットワーク・インターフェース・デバイス620を介してネットワーク626上でさらに伝送されるか、又は受け取られてよい。
機械可読媒体622は、単一の媒体として実施例の実例に示されるが、用語「機械可読媒体」は、命令の1つ又は複数のセットを格納する単一の媒体又は複数の媒体(例えば、集中型若しくは分散型のデータベース、並びに/又は関連するキャッシュ及びサーバ)を含むように用いられるべきである。用語「機械可読媒体」も、機械による実行のための、及び本発明の方法論の任意の1つ又は複数を機械に行わせる、命令のセットを格納すること、エンコードすること、又は搬送することを行うことができる任意の媒体を含むように用いられるべきである。用語「機械可読媒体」はしたがって、固体メモリ、光媒体及び磁気媒体、並びに搬送波信号を含むが、これらに限定されないように用いられるべきである。
明瞭化のために、上記の説明は、様々な機能ユニット又はプロセッサに関するいくつかの実施例を説明するということが理解されよう。しかし、様々な機能ユニット、プロセッサ、又はドメインの間の機能の任意の適切な分散が、本発明を損ねることなく使用されてよいということが明白であろう。例えば、別々のプロセッサ又はコントローラによって行われるように示される機能は、同じプロセッサ又はコントローラによって行われてよい。したがって、特定の機能ユニットへの参照のみが、厳格な論理的又は物理的な構造又は編成を示すものとしてではなく、説明される機能を提供するのに適切な手段への参照としてみなされる。
本明細書で説明される一定の実施例は、ロジック、又はいくつかのモジュール、エンジン、構成要素、若しくはメカニズムとして実装されてよい。モジュール、エンジン、ロジック、構成要素、又はメカニズム(まとめて「モジュール」と呼ばれる)は、一定の動作を行うことができる有形のユニットであってよく、一定の手法で構成又は配置されてよい。一定の実施例の実例において、1つ若しくは複数のコンピュータ・システム(例えば、スタンド・アロン、クライアント、若しくはサーバ・コンピュータ・システム)、又はコンピュータ・システムの1つ若しくは複数の構成要素(例えば、プロセッサ若しくはプロセッサのグループ)は、本明細書で説明される一定の動作を行うように動作するモジュールとして、ソフトウェア(例えば、アプリケーション若しくはアプリケーション部分)又はファームウェア(当業者によって知られているように、ソフトウェアとファームウェアは一般に、本明細書において区別なく使用されてよいということに留意されたい)によって構成されてよい。
様々な実施例において、モジュールは、機械的又は電子的に実装されてよい。例えば、モジュールは、一定の動作を行うように(例えば、専用プロセッサ、特定用途向け集積回路(ASIC:application specific integrated circuit)、又はアレイの中に)永続的に構成される専用の回路機器又はロジックを備えることができる。モジュールは、一定の動作を行うようにソフトウェア又はファームウェアによって一時的に構成される(例えば、汎用プロセッサ又は他のプログラム可能プロセッサの中に包含されるような)プログラム可能論理回路又は回路機器を備えることもできる。専用且つ永続的に構成される回路機器、又は(例えば、ソフトウェアによって構成される)一時的に構成される回路機器にモジュールを機械的に実装するという判定は、例えば、費用、時間、エネルギー使用量、及びパッケージ・サイズの考察によって決定されてよいということが理解されよう。
したがって、用語「モジュール」は、本明細書で説明される一定の手法で動作するように、又は一定の動作を行うように、物理的に構築される、永続的に構成される(例えば、配線で接続される)、非一時的に構成される、又は一時的に構成される(例えば、プログラムされる)エンティティといった、有形のエンティティを包含するものとして理解されたい。モジュール又は構成要素が一時的に構成される(例えば、プログラムされる)実施例を考えると、モジュール又は構成要素のそれぞれが、時間内の任意の1つの段階に構成又はインスタンス化される必要はない。例えば、モジュール又は構成要素が、ソフトウェアを使用して構成される汎用プロセッサを備える場合、汎用プロセッサは、異なる時間に個々の異なるモジュールとして構成されてよい。ソフトウェアはしたがって、時間の1つの段階において特定のモジュールとみなされるように、及び時間の異なる段階に異なるモジュールとみなされるように、プロセッサを構成することができる。
モジュールは、他のモジュールに情報を提供することができ、他のモジュールから情報を受け取ることができる。したがって、説明されるモジュールは、通信可能に結合されているとみなされてよい。多数のこのようなモジュールが同時に存在する場合、通信は、モジュールをつなぐ信号伝送を通じて(例えば、適正な回路及びバス上で)実現されてよい。複数のモジュールが様々な時間に構成又はインスタンス化される実施例において、このようなモジュール間の通信は、例えば、複数のモジュールがアクセスできるメモリ構造に情報を保存及び取得することによって実現されてよい。例えば、1つのモジュールは1つの動作を行い、このモジュールが通信可能に結合されるメモリ・デバイスにこの動作の出力を格納することができる。さらなるモジュールは次に後で、格納された出力を取得及び処理するためにメモリ・デバイスにアクセスすることができる。モジュールは、入力又は出力デバイスとの通信を開始することもでき、リソース(例えば、情報のコレクション)に対して動作することもできる。
本発明がいくつかの実施例に関連して説明されてきたが、本明細書で示された特定の形式に限定されることを意図するものではない。当業者は、説明された実施例の様々な特徴が、本発明に従って組み合わされてよいということを認識するであろう。その上、様々な修正及び代替が、本発明の範囲を逸脱することなく当業者によって行われてよいということが理解されよう。
本技術的開示の性質を読者が迅速に確かめられるように要約が提供される。これは、特許請求の範囲の範囲又は意味を解釈又は限定するために使用されないという理解のもと提示される。さらに、前述の発明を実施するための形態において、本開示を簡素化するために、様々な特徴が単一の実施例にまとめられているということがわかる。開示の本方法は、特許請求された実施例が、各請求項に明確に列挙されたものよりも多くの特徴を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明の主題は、単一の開示の実施例のすべての特徴より少なくてよい。
本発明の実施例は、システム、方法、又はコンピュータ・プログラム製品(例えば、画像検索システム、方法、又はコンピュータ・プログラム製品のために行われる実施例)として具体化されてよい。したがって、本開示の態様は、全面的にハードウェアの実施例、(ファームウェア、常駐ソフトウェア、マイクロ・コードなどを含む)全面的にソフトウェアの実施例、又は本明細書ですべて全体的に「回路」、「モジュール」、若しくは「システム」と呼ばれ得る、ソフトウェアとハードウェアの態様を組み合わせる実施例の形をとってよい。例えば、画像検索方法は、タブレット、ラップトップ、カメラ、電話、及び同様のものなどの携帯型デバイスに収納され得るソフトウェア・システム及びハードウェア・システムの中で具体化されてよい。別の例において、動作可能な通信及び組合せにおけるクライアント・コンピュータ及びサーバ・コンピュータは、全体として、システム内で具体化されると考えられてよい。さらに、本開示の本実施例の態様は、コンピュータ可読プログラム・コードを具体化させる1つ又は複数のコンピュータ可読媒体(medium)/媒体(media)の中で具体化されるコンピュータ・プログラム製品の形をとることができる。方法は、専用コンピュータ、又は適切にプログラムされた汎用コンピュータの中で実行されてよい。
1つ又は複数のコンピュータ可読媒体(medium)/媒体(media)の任意の組合せが利用されてよい。コンピュータ可読媒体は、コンピュータ可読信号媒体又はコンピュータ可読ストレージ媒体であってよい。コンピュータ可読ストレージ媒体は、例えば、電子、磁気、光、電磁気、赤外線、若しくは半導体のシステム、装置、若しくはデバイス、又は前述の任意の適切な組合せであってよいが、これらに限定されない。コンピュータ可読ストレージ媒体のさらなる具体的な実例(包括的でないリスト)は、1つ若しくは複数のワイヤを有する電気的接続、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM:random access memory)、リード・オンリ・メモリ(ROM:read−only memory)、消去可能プログラム可能リード・オンリ・メモリ(EPROM(erasable programmable read−only memory)即ちフラッシュ・メモリ)、光ファイバ、ポータブル・コンパクト・ディスク・リード・オンリ・メモリ(CD−ROM:compact disc read−only memory)、光ストレージ・デバイス、磁気ストレージ・デバイス、又は前述の任意の適切な組合せを含む。本ドキュメントに関連して、コンピュータ可読ストレージ媒体は、命令実行システム、装置、若しくはデバイスによって、又はこれらと共に使用するためのプログラムを収めるか、又は格納することができる任意の有形的表現媒体であってよい。
コンピュータ可読信号媒体は、例えば、ベースバンドにおいて、又は搬送波の一部として、信号内で具体化されるコンピュータ可読プログラム・コードと共に伝播されるデータ信号を含むことができる。このような伝播される信号は、電磁気、光、又はこれらの任意の適切な組合せを含むが、これらに限定されない様々な形式のいずれかをとることができる。コンピュータ可読信号媒体は、コンピュータ可読ストレージ媒体ではなく、命令実行システム、装置、若しくはデバイスによって、又はこれらと共に使用するためのプログラムを通信、伝播、又は運搬できる任意のコンピュータ可読媒体であってよい。
コンピュータ可読媒体上で具体化されるプログラム・コードは、ワイヤレス、ワイヤライン、光ファイバ・ケーブル、RFなど、又は前述の任意の適切な組合せを含むが、これらに限定されない任意の適正な媒体を使用して伝送されてよい。本開示の本実施例の態様に関する動作を実行するためのコンピュータ・プログラム・コードは、Java(登録商標)、Smalltalk、C++又は同様のものなどのオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は類似のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つ又は複数のプログラミング言語の任意の組合せで書かれてよい。プログラム・コードは、全面的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンド・アロンのソフトウェア・パッケージとして、部分的にユーザのコンピュータ上で、及び部分的にリモート・コンピュータ上で、又は全面的にリモート・コンピュータ若しくはサーバ上で実行することができる。後者のシナリオにおいて、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)又は広域ネットワーク(WAN)を含む、任意のタイプのネットワークを通じてユーザのコンピュータに接続されてよく、また接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを通じて)外部コンピュータに対して行われてよい。
本開示の本実施例の態様は、本発明の実施例(例えば、図1〜図9)による、方法、装置(システム)、及びコンピュータ・プログラム製品の流れ図及び/又はブロック図を参照しながら上記で説明される。流れ図及び/又はブロック図の各ブロック、並びに流れ図及び/又はブロック図におけるブロックの組合せは、コンピュータ・プログラム命令によって実行されてよいということが理解されよう。これらのコンピュータ・プログラム命令は、汎用コンピュータ、専用コンピュータ、又は機械を生み出す他のプログラム可能データ処理装置のプロセッサに提供されてよく、その結果、コンピュータ又は他のプログラム可能データ処理装置のプロセッサを介して実行する命令は、流れ図及び/又はブロック図のブロック又は複数のブロックで指定される機能/作用を実行するための手段を作り出す。
コンピュータ、他のプログラム可能データ処理装置、又は特定の手法で機能する他のデバイスに指示できるこれらのコンピュータ・プログラム命令は、コンピュータ可読媒体に格納されてもよく、その結果、コンピュータ可読媒体に格納された命令は、流れ図及び/又はブロック図のブロック又は複数のブロックで指定される機能/作用を実行する命令を含む製品を生み出す。
コンピュータ・プログラム命令は、コンピュータ又は他のプログラム可能装置上で実行する命令が、流れ図及び/又はブロック図のブロック又は複数のブロックで指定される機能/作用を実行するための処理を行うように、コンピュータによって実行される処理を生み出すコンピュータ、他のプログラム可能装置、又は他のデバイス上で一連の動作ステップが行われるようにするために、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードされてもよい。
本発明は、限られた数の実施例のみに関連して詳細に説明されたが、本発明は、このような開示の実施例に限定されないということを容易に理解されたい。むしろ本発明は、いくつかの変形形態、代替形態、代用、組合せ、又はこれまで説明されていない同等の仕組みを組み込むように修正されてよいが、これらは、本発明の精神及び範囲と同等である。例えば、様々なフィルタの使用、及びヒストグラム生成の順序は、本発明の範囲内にある。さらに、上記で開示された画像検索システム、装置、及び方法を作り上げる様々な構成要素は、本発明の範囲内の様々な適用可能且つ機能的な組合せで組み合わされることが可能な代替であってよい。さらに、本発明の様々な実施例が説明されたが、本発明の態様は、説明された実施例のうちのいくつかしか含んでいない可能性があるということを理解されたい。したがって、本発明は、前述の説明によって限定されるとみなされるべきではなく、添付の特許請求の範囲の範囲によってのみ限定される。

Claims (27)

  1. 商標画像のコンテンツ・ベースの検索及び取得のための方法であって、
    前記商標画像の各ピクセルに対する6ビットの色データを使用して各商標画像に対する重みなしの64ビンの色ヒストグラムをプロセッサを用いて生成することによって、削減されたカラー・セグメンテーションを用いて複数の商標画像から色の特徴を抽出するステップであって、前記6ビットの色データが、前記商標画像の各ピクセルに対する赤、緑、及び青チャネルのそれぞれからの最上位の2ビットを含む、色の特徴を抽出するステップと、
    前記商標画像を3×3のブロックに分割して粗いセグメンテーションを形成し、各セグメンテーション内の各ピクセルに対する重み付き方向角データを使用して9ビンの方向ヒストグラムを前記粗いセグメンテーションごとに前記プロセッサを用いて生成することによって、複数の商標画像から形状の特徴を抽出するステップと、
    前記削減されたカラー・セグメンテーション及び前記粗いセグメンテーションを用いて、エリ商標画像と商標画像のセットの各商標画像との間の色の特徴及び形状の特徴を比較することにより、前記クエリ商標画像と商標画像の前記セットの間の距離の類似性尺度を、前記プロセッサによって生成するステップと
    を含む、方法。
  2. 色の特徴を抽出するステップが、
    前記商標画像を平滑化するために第1のフィルタを適用するステップと、
    前記商標画像から背景ピクセルを取り除くステップと
    をさらに含む、請求項1に記載の方法。
  3. 形状の特徴を抽出することが、
    前記商標画像をグレースケールに変換するステップと、
    前記商標画像からノイズの多いピクセルを取り除くために第3のフィルタを適用するステップと、
    前記商標画像の各ピクセルに対する水平導関数及び垂直導関数を計算するステップと、
    前記商標画像の各ピクセルに対する導関数の商を得るために前記垂直導関数を前記水平導関数で割るステップと、
    前記導関数の商のアークタンジェントを計算することによって、前記商標画像の各ピクセルに対する方向角を計算するステップと、
    をさらに含む、請求項2に記載の方法。
  4. 形状の特徴を抽出するステップが、
    記画像の81ビンの形状ヒストグラムを得るために、加重値と共に方向角データを使用して、前記画像の各ブロックに対する9ビンの形状ヒストグラムを抽出するステッ
    をさらに含む、請求項1に記載の方法。
  5. 前記9ビンの方向ヒストグラムの9個のビンが、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、及び160〜180度を含む、請求項1に記載の方法。
  6. 前記距離の類似性尺度が、バタチャリヤ距離である、請求項1に記載の方法。
  7. バタチャリヤ距離を使用して、クエリ商標画像と、商標画像のセットの各商標画像との間の色の特徴と形状の特徴を比較することによって、前記クエリ商標画像と商標画像の前記セットの間の距離の類似性尺度を生成するステップ
    をさらに含む、請求項1に記載の方法。
  8. バタチャリヤ距離による順序で商標画像の前記セットから商標画像を返し、ディスプレイ上に表示するステップ
    をさらに含む、請求項1に記載の方法。
  9. 商標画像のコンテンツ・ベースの検索及び取得のための方法であって、
    − データベース内の商標画像のセットのURLを提供するステップと、
    − クエリ商標画像を受け取るステップと、
    − 削減されたカラー・セグメンテーションを用いて、プロセッサによって前記商標画像のそれぞれから色の特徴を抽出するステップであって、
    前記画像を平滑化するために第1のフィルタを適用するステップ、
    前記画像の背景ピクセルを取り除くステップ、
    前記画像の各ピクセルに対する6ビットの色データを提供するために、赤、緑、及び青チャネルのそれぞれからの最上位の2ビットを連結することにより、削減されたカラー・セグメンテーションを提供するステップ、並びに
    前記6ビットの色データを使用して前記画像の重みなしの64ビンの色ヒストグラムを抽出するステップ
    を含む、色の特徴を抽出するステップと、
    − 粗いセグメンテーションを用いて、前記プロセッサによって前記商標画像のそれぞれから形状の特徴を抽出するステップであって、
    前記画像をグレースケールに変換するステップ、
    前記画像からノイズの多いピクセルを取り除くステップ、
    前記画像の各ピクセルに対する水平導関数及び垂直導関数を計算するステップ、
    前記画像の各ピクセルに対する導関数の商を得るために、前記垂直導関数を前記水平導関数で割るステップ、
    前記導関数の商のアークタンジェントを計算することによって、前記画像の各ピクセルに対する方向角を計算するステップ、
    前記画像を3×3のブロックに分割するステップ、並びに
    前記画像の81ビンの形状ヒストグラムを得るために、加重値と共に方向角データを使用して、前記画像の各ブロックに対する9ビンの形状ヒストグラムを抽出するステップであって、前記形状ヒストグラムの前記9個のビンが、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、及び160〜180度を含む、9ビンの形状ヒストグラムを抽出するステップ
    を含む、形状の特徴を抽出するステップと、
    − 前記削減されたカラー・セグメンテーション、粗いセグメンテーション及びバタチャリヤ距離を使用して、前記クエリ商標画像と、商標画像の前記セットの各商標画像との間の色の特徴と形状の特徴を比較することによって、前記クエリ商標画像と商標画像の前記セットとの間の類似性を判断するステップと、
    − バタチャリヤ距離による順序で商標画像の前記セットから商標画像を返すステップと
    を含む、方法。
  10. 機械の1つ又は複数のプロセッサによって実行されると、
    商標画像の各ピクセルに対する6ビットの色データを使用して前記商標画像の重みなしの64ビンの色ヒストグラムを生成することによって、削減されたカラー・セグメンテーションを用いて前記商標画像から色の特徴を抽出することであって、前記6ビットの色データが、前記商標画像の各ピクセルに対する赤、緑、及び青チャネルのそれぞれからの最上位の2ビットを含む、色の特徴を抽出することと、
    前記商標画像を3×3のブロックに分割して粗いセグメンテーションを形成し、各セグメンテーション内の各ピクセルに対する重み付き方向角データを使用して9ビンの方向ヒストグラムを前記粗いセグメンテーションごとに生成することによって、前記商標画像から形状の特徴を抽出することと、
    前記削減されたカラー・セグメンテーション及び前記粗いセグメンテーションを用いて、2つの商標画像間の前記色の特徴と前記形状の特徴を比較して距離の類似性尺度を生成することと
    を含む動作を前記機械に行わせる命令を有する非一時的機械可読ストレージ媒体。
  11. 色の特徴を前記抽出することが、
    前記商標画像を平滑化するために第1のフィルタを適用することと、
    前記商標画像から背景ピクセルを取り除くことと
    をさらに含む、請求項10に記載の非一時的機械可読ストレージ媒体。
  12. 形状の特徴を前記抽出することが、
    前記商標画像をグレースケールに変換することと、
    前記商標画像からノイズの多いピクセルを取り除くことと、
    前記商標画像の各ピクセルに対する水平導関数及び垂直導関数を計算することと、
    前記画像の各ピクセルに対する導関数の商を得るために前記垂直導関数を前記水平導関数で割ることと、
    前記導関数の商のアークタンジェントを計算することによって、前記画像の各ピクセルに対する方向角を計算することと、
    をさらに含む、請求項10に記載の非一時的機械可読ストレージ媒体。
  13. 形状の特徴を前記抽出することが、
    重値と共に方向角データを使用して、前記画像の各ブロックに対する9ビンの形状ヒストグラムを抽出するこ
    をさらに含む、請求項10に記載の非一時的機械可読ストレージ媒体。
  14. 前記9ビンの方向ヒストグラムの9個のビンが、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、及び160〜180度を含む、請求項10に記載の非一時的機械可読ストレージ媒体。
  15. 前記距離の類似性尺度が、バタチャリヤ距離である、請求項10に記載の非一時的機械可読ストレージ媒体。
  16. バタチャリヤ距離を使用して、クエリ商標画像と、商標画像のセットの各商標画像との間の色の特徴と形状の特徴を比較することによって、前記クエリ商標画像と商標画像の前記セットの間の距離の類似性尺度を生成すること
    をさらに含む動作を前記機械に行わせる、請求項10に記載の非一時的機械可読ストレージ媒体。
  17. バタチャリヤ距離による順序で商標画像の前記セットから商標画像を返すこと
    をさらに含む動作を前記機械に行わせる、請求項10に記載の非一時的機械可読ストレージ媒体。
  18. 商標画像のコンテンツ・ベースの検索及び取得のためのシステムであって、
    1つ又は複数のプロセッサと、
    削減されたカラー・セグメンテーションを提供するために、商標画像の各ピクセルに対する6ビットの色データを使用して、商標画像の重みなしの64ビンの色ヒストグラムを生成するように、前記1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する色ヒストグラム・モジュールであって、前記6ビットの色データが、前記商標画像の各ピクセルに対する赤、緑、及び青チャネルのそれぞれからの最上位の2ビットを含む、色ヒストグラム・モジュールと、
    粗いセグメンテーションを提供するために、前記商標画像を3×3のブロックに分割し、各セグメンテーション内の各ピクセルに対する重み付き方向角データを使用して9ビンの方向ヒストグラムを前記粗いセグメンテーションごとに生成するように、前記1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する方向ヒストグラム・モジュールと、
    前記削減されたカラー・セグメンテーション及び前記粗いセグメンテーションを用いて、2つの商標画像間の前記色ヒストグラムと前記方向ヒストグラムを比較して距離の類似性尺度を生成するように、前記1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する比較モジュールと
    を備える、システム。
  19. 前記色ヒストグラム・モジュールが、
    前記商標画像を平滑化するために第1のフィルタを適用することと、
    前記商標画像から背景ピクセルを取り除くために第2のフィルタを適用することと
    を行うように、前記少なくとも1つのプロセッサを構成する、請求項18に記載のシステム。
  20. 前記方向ヒストグラム・モジュールが、
    前記商標画像をグレースケールに変換することと、
    前記商標画像からノイズの多いピクセルを取り除くことと、
    前記商標画像の各ピクセルに対する水平導関数及び垂直導関数を計算することと、
    前記画像の各ピクセルに対する導関数の商を得るために前記垂直導関数を前記水平導関数で割ることと、
    前記導関数の商のアークタンジェントを計算することによって、前記画像の各ピクセルに対する方向角を計算することと
    を行うように、前記少なくとも1つのプロセッサを構成する、請求項18に記載のシステム。
  21. 前記方向ヒストグラム・モジュールが、
    記画像の81ビンの形状ヒストグラムを得るために、加重値と共に前記方向角データを使用して、前記画像の各ブロックに対する9ビンの形状ヒストグラムを抽出するこ
    を行わせるように、前記少なくとも1つのプロセッサを構成する、請求項18に記載のシステム。
  22. 前記9ビンの方向ヒストグラムの9個のビンが、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、及び160〜180度を含む、請求項18に記載のシステム。
  23. 前記比較モジュールが、バタチャリヤ距離である距離の類似性尺度を生成するように、前記少なくとも1つのプロセッサを構成する、請求項18に記載のシステム。
  24. 前記比較モジュールが、バタチャリヤ距離を使用して、クエリ商標画像と、商標画像のセットの各商標画像との間の色の特徴と形状の特徴を比較することによって、前記クエリ商標画像と商標画像の前記セットの間の距離の類似性尺度を生成するように、前記少なくとも1つのプロセッサを構成する、請求項18に記載のシステム。
  25. バタチャリヤ距離による順序で商標画像のセットから商標画像を返すように、前記1つ又は複数のプロセッサの中の少なくとも1つのプロセッサを構成する画像取得モジュールをさらに備える、請求項18に記載のシステム。
  26. バタチャリヤ距離による順序で商標画像のセットから取得された商標画像を表示するためのディスプレイをさらに備える、請求項18に記載のシステム。
  27. 前記システムに通信可能に結合されたデバイスから商標又は商標画像を受け取るように構成されるキャプチャ・モジュールをさらに備える、請求項18に記載のシステム。
JP2019506340A 2016-04-14 2016-04-14 商標画像のコンテンツ・ベースの検索及び取得 Active JP6740457B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/TR2016/050111 WO2017180072A1 (en) 2016-04-14 2016-04-14 Content based search and retrieval of trademark images

Publications (2)

Publication Number Publication Date
JP2019520662A JP2019520662A (ja) 2019-07-18
JP6740457B2 true JP6740457B2 (ja) 2020-08-12

Family

ID=56119732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019506340A Active JP6740457B2 (ja) 2016-04-14 2016-04-14 商標画像のコンテンツ・ベースの検索及び取得

Country Status (9)

Country Link
US (1) US10867206B2 (ja)
EP (1) EP3443470A1 (ja)
JP (1) JP6740457B2 (ja)
KR (1) KR20180131621A (ja)
CN (1) CN109643318B (ja)
AU (1) AU2016402555B2 (ja)
CA (1) CA3020845C (ja)
WO (1) WO2017180072A1 (ja)
ZA (1) ZA201807033B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020653A (zh) * 2019-03-06 2019-07-16 平安科技(深圳)有限公司 图像语义分割方法、装置及计算机可读存储介质
US11663642B2 (en) * 2019-10-07 2023-05-30 Salesforce, Inc. Systems and methods of multicolor search of images
KR102316292B1 (ko) * 2019-11-29 2021-10-22 주식회사 마크클라우드 유사 상표 검색을 위한 객체 이미지 등록 방법 및 상표 관리 서버
KR102271470B1 (ko) * 2019-11-29 2021-07-01 주식회사 마크클라우드 유사 상표 검색 서비스 제공 방법 및 상표 관리 서버
CN111353532A (zh) * 2020-02-26 2020-06-30 北京三快在线科技有限公司 图像生成方法及装置、计算机可读存储介质、电子设备
CN112860934A (zh) * 2021-01-29 2021-05-28 浙江知多多网络科技有限公司 一种基于机器学习的商标检索系统
CN113554615B (zh) * 2021-07-21 2023-08-22 网易(杭州)网络有限公司 一种图像精细化处理方法、装置、电子设备及存储介质
CN115344738B (zh) * 2022-10-18 2023-02-28 南通知果科技有限公司 基于人工智能的检索方法及系统
KR102564039B1 (ko) * 2023-01-17 2023-08-04 국방과학연구소 프레임간 유사도에 기초하여, 신경망 학습을 위한 프레임 데이터를 생성하는 방법 및 장치
CN115858839B (zh) * 2023-02-16 2023-05-30 上海蜜度信息技术有限公司 一种跨模态logo检索方法、系统、终端及存储介质
CN116503234B (zh) * 2023-06-26 2023-11-14 南湖实验室 一种基于密码学的商标防伪方法
CN117788850B (zh) * 2024-02-21 2024-05-10 深圳欧税通技术有限公司 一种商标相似度评估方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4850652B2 (ja) * 2006-10-13 2012-01-11 キヤノン株式会社 画像検索装置及びその制御方法、プログラム、記憶媒体
KR20120089452A (ko) * 2009-08-04 2012-08-10 아이큐 비젼 테크놀로지즈 리미티드 물체 추출 시스템 및 방법
WO2013033442A1 (en) * 2011-08-30 2013-03-07 Digimarc Corporation Methods and arrangements for identifying objects
US8737728B2 (en) * 2011-09-30 2014-05-27 Ebay Inc. Complementary item recommendations using image feature data
AU2015271906B2 (en) * 2011-09-30 2017-03-02 Ebay Inc. Image feature data extraction and use
CN102622420B (zh) * 2012-02-22 2013-10-30 哈尔滨工程大学 基于颜色特征和形状上下文的商标图像检索方法
JP2013182416A (ja) * 2012-03-01 2013-09-12 Pioneer Electronic Corp 特徴量抽出装置、特徴量抽出方法及び特徴量抽出プログラム
WO2013173229A1 (en) * 2012-05-14 2013-11-21 Intuitive Surgical Operations Systems and methods for deformation compensation using shape sensing
WO2014000261A1 (zh) * 2012-06-29 2014-01-03 中国科学院自动化研究所 一种基于空间连通域预定位的商标检测方法
IL226219A (en) * 2013-05-07 2016-10-31 Picscout (Israel) Ltd Efficient comparison of images for large groups of images
ES2530687B1 (es) * 2013-09-04 2016-08-19 Shot & Shop. S.L. Método implementado por ordenador para recuperación de imágenes por contenido y programa de ordenador del mismo
US9965547B2 (en) * 2014-05-09 2018-05-08 Camelot Uk Bidco Limited System and methods for automating trademark and service mark searches
US9396404B2 (en) * 2014-08-04 2016-07-19 Datalogic ADC, Inc. Robust industrial optical character recognition
CN105574161B (zh) * 2015-12-15 2017-09-26 徐庆 一种商标图形要素识别方法、装置和系统
CN105426530B (zh) * 2015-12-15 2017-05-10 徐庆 一种商标检索方法、装置和系统

Also Published As

Publication number Publication date
JP2019520662A (ja) 2019-07-18
AU2016402555B2 (en) 2022-03-31
ZA201807033B (en) 2020-01-29
CN109643318B (zh) 2023-07-14
CN109643318A (zh) 2019-04-16
EP3443470A1 (en) 2019-02-20
US20190114505A1 (en) 2019-04-18
KR20180131621A (ko) 2018-12-10
CA3020845A1 (en) 2017-10-19
AU2016402555A1 (en) 2018-11-22
CA3020845C (en) 2023-06-20
US10867206B2 (en) 2020-12-15
WO2017180072A1 (en) 2017-10-19

Similar Documents

Publication Publication Date Title
JP6740457B2 (ja) 商標画像のコンテンツ・ベースの検索及び取得
US10049466B2 (en) Color name generation from images and color palettes
US20210182333A1 (en) Correlating image annotations with foreground features
US9135719B1 (en) Color name generation from images and color palettes
US8825660B2 (en) Image-based indexing in a network-based marketplace
US9535930B2 (en) System and method for using an image to provide search results
US20140254942A1 (en) Systems and methods for obtaining information based on an image
US9773023B2 (en) Image selection using automatically generated semantic metadata
AU2017204531A1 (en) Smart and automatic selection of same shaped objects in images
US11789996B2 (en) Nuanced-color search and recommendation system
US20180107688A1 (en) Image appended search string
US20200097568A1 (en) Fashion by trend user interfaces
US9613059B2 (en) System and method for using an image to provide search results
US10229320B1 (en) Method and system to provide the details about the product item that the user is looking for and providing the navigation map for the selected item presented in the store
CN106599287B (zh) 搜索结果处理方法及装置
US11947590B1 (en) Systems and methods for contextualized visual search

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200722

R150 Certificate of patent or registration of utility model

Ref document number: 6740457

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250