JP2015046071A - 画像認識装置、画像認識方法及び画像認識プログラム - Google Patents

画像認識装置、画像認識方法及び画像認識プログラム Download PDF

Info

Publication number
JP2015046071A
JP2015046071A JP2013177361A JP2013177361A JP2015046071A JP 2015046071 A JP2015046071 A JP 2015046071A JP 2013177361 A JP2013177361 A JP 2013177361A JP 2013177361 A JP2013177361 A JP 2013177361A JP 2015046071 A JP2015046071 A JP 2015046071A
Authority
JP
Japan
Prior art keywords
recognition
image
target image
bof
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013177361A
Other languages
English (en)
Other versions
JP5808371B2 (ja
Inventor
岩崎 雅二郎
Masajiro Iwasaki
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013177361A priority Critical patent/JP5808371B2/ja
Priority to US14/021,497 priority patent/US9355338B2/en
Publication of JP2015046071A publication Critical patent/JP2015046071A/ja
Application granted granted Critical
Publication of JP5808371B2 publication Critical patent/JP5808371B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

【課題】高精度な画像認識を高速に行うこと。【解決手段】本願に係る配信装置は、学習画像記憶部と、第1の認識部と、第2の認識部と、登録部とを有する。学習画像記憶部は、学習画像を記憶する。第1の認識部は、学習画像記憶部に記憶されている学習画像を用いて認識対象画像の認識を行う。第2の認識部は、第1の認識部によって認識対象画像の認識に失敗した場合に、第1の認識部より精細な精度で認識対象画像の認識を行う。登録部は、第2の認識部によって認識対象画像の認識に成功した場合に、認識に成功した認識対象画像に関する情報を記憶部に登録する。【選択図】図3

Description

本発明は、画像認識装置、画像認識方法及び画像認識プログラムに関する。
対象物体が描出されている対象物体画像の特徴を抽出し、対象物体を認識する画像認識が知られている。例えば、対象物体とは、認識対象の商品などであり、一例としてカバンなどである。このような画像認識に関する技術として、辞書データを追加する技術が知られている。具体的には、この技術では、対象物体画像から局所領域を切り出し、局所領域から対象物体を認識するための特徴量を画像ごとに算出し、画像ごとに算出された特徴量同士の類似度を局所領域ごとに算出し、類似度が閾値以上となる特徴量同士がある場合に、一方の特徴量を対象物体に対する辞書データとして局所領域ごとに登録する。
特開2012−238121号公報
しかしながら、上記の従来技術では、高精度な画像認識を高速に行うことができるとは限らなかった。具体的には、上記の技術では、対象物体画像の局所領域の特徴量と辞書データに登録されている局所領域の特徴量との間の類似度を局所領域ごとに算出するので、演算量が多く対象物体画像の認識に時間がかかる。また、上記の技術では、画像認識を高速に行うために認識精度を低くすると撮影条件の異なるような粗い画像を認識できなくなり、実用面で耐えられない。このようなことから、上記の従来技術では、高精度な画像認識を高速に行うことができるとは限らなかった。
本願は、上記に鑑みてなされたものであって、高精度な画像認識を高速に行うことができる画像認識装置、画像認識方法及び画像認識プログラムを提供することを目的とする。
本願に係る配信装置は、学習画像を記憶する記憶部と、前記記憶部に記憶されている学習画像を用いて認識対象画像の認識を行う第1の認識部と、第1の認識部によって前記認識対象画像の認識に失敗した場合に、第1の認識部より精細な精度で前記認識対象画像の認識を行う第2の認識部と、第2の認識部によって前記認識対象画像の認識に成功した場合に、認識に成功した前記認識対象画像に関する情報を前記記憶部に登録する登録部とを備えたことを特徴とする。
実施形態の一態様によれば、高精度な画像認識を高速に行うことができるという効果を奏する。
図1は、実施形態に係る配信装置による登録処理の一例を示す説明図である。 図2は、実施形態に係る配信システムの構成例を示す図である。 図3は、実施形態に係る配信装置の構成例を示す図である。 図4は、実施形態に係る学習画像記憶部の一例を示す図である。 図5は、実施形態に係る配信装置による配信処理の一例を示す説明図である。 図6は、実施形態に係る配信装置による認識処理の一例を示す説明図である。 図7は、実施形態に係る配信装置による配信処理を示すフローチャートである。 図8は、実施形態に係る配信装置による第1の認識処理を示すフローチャートである。 図9は、実施形態に係る配信装置による第2の認識処理を示すフローチャートである。 図10は、配信装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る画像認識装置、画像認識方法及び画像認識プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る画像認識装置、画像認識方法及び画像認識プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.登録処理〕
まず、図1を用いて、第1の実施形態に係る登録処理の一例について説明する。図1は、実施形態に係る配信システムによる登録処理の一例を示す説明図である。図1の例では、配信装置100によって端末装置10から送信された認識対象画像に関する情報を学習画像記憶部120に登録する登録処理が行われる。
図1の例では、端末装置10は、端末装置10を操作するユーザによってカバンC11が描出される認識対象画像P12を配信装置100に送信する。なお、認識対象画像P12は、例えば、端末装置10に内蔵されたカメラによって撮影される。
配信装置100は、学習画像P11を学習画像記憶部120に記憶する。なお、学習画像P11は、配信装置100を管理する管理者によって予め登録される。また、配信装置100は、学習画像P11からBoF(Bag of Features)11を生成する。例えば、配信装置100は、Visual Wordsを用いて学習画像P11のBoF11を生成する。そして、配信装置100は、学習画像P11とBoF11とを対応付けて記憶する。
また、配信装置100は、端末装置10から認識対象画像P12を受信した場合に、認識対象画像P12を認識する第1の認識を行う。例えば、配信装置100は、受信した認識対象画像P12からBoF12を生成する。そして、配信装置100は、学習画像記憶部120に記憶されている学習画像のBoFから、BoF12と類似するBoFを検索する。続いて、配信装置100は、検索されたBoF毎に、BoF12との間で照合することで第1の確信度を算出する。そして、配信装置100は、算出された第1の確信度のうち、最も大きい値である最大確信度が判定閾値より高いか否かを判定する。
ここで、最大確信度のBoFがBoF11であるものとする。また、BoF11の最大確信度が判定閾値より高いものとする。この場合、配信装置100は、最大確信度のBoF11に対応する学習画像P11を認識対象画像P12の認識結果とする。すなわち、配信装置100は、認識対象画像P12に描出されるカバンC11を、BoF11に対応する学習画像P11に描出されるカバンC11であると認識する。
一方、配信装置100は、BoF11の最大確信度が判定閾値より低い場合に、認識対象画像P12の認識に失敗したと判定する。例えば、配信装置100は、撮影場所が暗く撮影条件の悪い状態で撮影された不鮮明な認識対象画像である場合などに認識に失敗する。
そして、配信装置100は、認識対象画像P12の認識に失敗した場合に、第1の認識より精細に照合する第2の認識を行う。例えば、配信装置100は、再判定閾値より高い第1の確信度に対応する全ての学習画像から局所特徴量を抽出する。そして、配信装置100は、抽出した局所特徴量と類似する特徴量を、学習画像と認識対象画像P12との間で対応付けて座標を照合することで第2の確信度を算出する。そして、配信装置100は、算出された第2の確信度のうち、最も大きい値である最大確信度が学習判定閾値より高いか否かを判定する。
ここで、最大確信度のBoFがBoF11であるものとする。また、BoF11の最大確信度が学習判定閾値より高いものとする。この場合、配信装置100は、最大確信度のBoF11に対応する学習画像P11を認識対象画像P12の認識結果とする。すなわち、配信装置100は、認識対象画像P12に描出されるカバンC11を、BoF11に対応する学習画像P11に描出されるカバンC11であると認識する。そして、配信装置100は、認識に成功した認識対象画像P12及びBoF12を認識に成功した学習画像P11に付されているメタ情報の一形態であるカバンC11のタグと対応付けて学習画像記憶部120に登録する。
このように、実施形態に係る配信装置100は、BoFを用いて第1の認識を行うので、局所特徴量を用いた認識と比較して演算量が少なく認識対象画像を高速に認識することができる。また、配信装置100は、第1の認識による認識対象画像の認識に失敗しても、第1の認識より精細な第2の認識を行うので、学習画像と撮影条件が異なる認識対象画像の場合でも高い精度で認識することができる。これにより、配信装置100は、学習画像と撮影条件が異なる認識対象画像も学習画像として登録することが可能となる。また、配信装置100は、認識された認識対象画像を学習画像として登録するので、今後、認識対象画像と類似する画像を受信した場合に、かかる画像を高速に認識することができる。これにより、配信装置100は、高精度な画像認識を高速に行うことができる。
〔2.配信システムの構成〕
次に、図2を用いて、第1の実施形態に係る配信システム1について説明する。図2は、第1の実施形態に係る配信システムの構成例を示す図である。図2に示すように、配信システム1には、端末装置10と、配信装置100とが含まれる。端末装置10、配信装置100は、それぞれネットワークNと無線により通信可能に接続される。なお、図2では、配信システム1に、1台の端末装置10と、1台の配信装置100とが含まれる例を示したが、配信システム1には、複数台の端末装置10や、複数台の配信装置100が含まれてもよい。
端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PCや、携帯電話機、PDA(Personal Digital Assistant)等の情報処理装置である。例えば、端末装置10は、内蔵されたカメラによってユーザが認識したい認識対象を撮影することで認識対象が描出される認識対象画像を生成する。そして、端末装置10は、生成された認識対象画像を配信装置100に送信する。なお、端末装置10は、インターネットを介して取得された画像を認識対象画像として配信装置100に送信してもよい。また、端末装置10は、配信装置100から配信されるオンラインショッピングに関するウェブページである商品ページを表示部(例えば、液晶ディスプレイ)に表示する。
配信装置100は、商品ページを端末装置10に配信するサーバ装置である。具体的には、配信装置100は、端末装置10から認識対象画像が送信された場合に、認識対象画像に描出される商品の認識を行い、認識された商品に関する商品ページを端末装置10に配信する。
〔3.配信装置の構成〕
次に、図3を用いて、実施形態に係る配信装置100の構成について説明する。図3は、実施形態に係る配信装置100の構成例を示す図である。図3に示すように、配信装置100は、通信部110と、学習画像記憶部120と、制御部130とを有する。なお、配信装置100は、配信装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、端末装置10との間で情報の送受信を行う。
(学習画像記憶部120について)
学習画像記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。かかる学習画像記憶部120は、認識対象画像の比較対象として用いる学習画像を記憶する。例えば、学習画像は、オンラインショッピングサイトで販売される商品の画像である。なお、学習画像は、例えば、配信装置100を管理する管理者やオンラインショッピングを運営する運営者から入稿される。
ここで、図4に、実施形態に係る学習画像記憶部120の一例を示す。図4に示した例では、学習画像記憶部120は、「学習画像」、「BoF」、「タグ」といった項目を有する。
「学習画像」は、管理者や運営者から入稿された学習画像を示す。図4に示した例では、「学習画像」に、「P01」や「P10」といった概念的な情報が格納される例を示したが、実際には、静止画像や画像の格納場所を示すファイルパス名などが記憶される。
「BoF」は、学習画像から生成されるBoFを示す。例えば、BoFは、学習画像が入稿された際に、学習画像から局所特徴量を抽出することで生成され、学習画像記憶部120に予め記憶される。図4に示した例では、「BoF」に、「B01」や「B10」といった概念的な情報が格納される例を示したが、実際には、学習画像から抽出される特徴ベクトル群を示す。「タグ」は、学習画像に付されているメタ情報を示す。例えば、「タグ」には、メタ情報の一形態として、学習画像に描出される商品を識別するための商品のJANコードが設定される。
すなわち、図4では、タグ「J11」によって識別される商品の学習画像P11及びBoF11が、記憶されている例を示している。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、配信装置100内部の記憶装置に記憶されている各種プログラム(広告抽出プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
かかる制御部130は、図3に示すように、受信部131と、第1の認識部132と、第2の認識部133と、登録部134と、配信部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
(受信部131について)
受信部131は、端末装置10から認識対象画像を受信する。例えば、受信部131は端末装置10から認識対象画像が添付されたメールを受信することで認識対象画像を受信する。また、受信部131は、例えば、端末装置19からHTTPなどのプロトコルにより画像をアップロードされることで認識対象画像を受信してもよい。
(第1の認識部132について)
第1の認識部132は、受信部131によって認識対象画像が受信された場合に、受信した認識対象画像に描出される商品の認識を行う。具体的には、第1の認識部132は、認識対象画像と、学習画像記憶部120に記憶されている学習画像とを照合することで認識対象画像に描出される商品の認識を行う。
一例を挙げて説明すると、第1の認識部132は、受信した認識対象画像からBoFを生成する。具体的には、第1の認識部132は、認識対象画像から特徴点を抽出する。続いて、第1の認識部132は、SIFT記述子により特徴点周辺パターンをSIFT特徴ベクトル(局所特徴量)として抽出する。そして、第1の認識部132は、予め算出されたVisual Wordsに基づいてSIFT特徴ベクトルを量子化する。続いて、第1の認識部132は、認識対象画像におけるVisual Wordsの出現頻度を示すヒストグラムを生成することでBoFを生成する。
なお、Visual Wordsは、例えば、学習画像記憶部120に記憶されている全ての学習画像から、局所特徴量であるSIFT特徴ベクトルを抽出し、抽出されたSIFT特徴ベクトルを特徴量空間にマッピングしクラスタリングすることで生成されるクラスタである。このクラスタにIDを割り振り、BoFの生成対象となる画像から局所特徴量を抽出して、その局所特徴量が最も類似するクラスタ(Visual Words)を検索して、その検索されたクラスタのID毎での局所特徴量の出現頻度をベクトル表現することでBoFを生成する。このVisual Wordsを用いて生成したBoFを用いることにより、画像から抽出した局所特徴量を画像間で個々に照合して確信度を算出するという複雑な計算よりも、ベクトル表現されたBoFを用いて容易に確信度を算出することができる。ここで、学習画像記憶部120に記憶されている学習画像の数が多い場合は、ランダムにサンプリングした学習画像からSIFT特徴ベクトルを抽出してもよい。
そして、第1の認識部132は、学習画像記憶部120に記憶されている学習画像のBoFから、第1の認識部132によって生成されたBoFと類似するBoFを検索する。
続いて、第1の認識部132は、検索されたBoF毎に、BoF12との間で照合することで第1の確信度を算出する。そして、第1の認識部132は、算出された第1の確信度のうち、最も大きい値である最大確信度が判定閾値より高いか否かを判定する。なお、判定閾値は、例えば、実験などによって得られた用途に応じた認識精度や認識時間が考慮された値が設定される。
ここで、第1の認識部132は、最大確信度が判定閾値より高い場合に、最大確信度のBoFに対応する学習画像を認識対象画像の認識結果とする。すなわち、第1の認識部132は、認識対象画像に描出される商品を、最大確信度のBoFに対応する学習画像に描出される商品であると認識する。このように、第1の認識部132は、BoFを用いて認識対象画像の認識を行うので、局所特徴量を用いた認識と比較して高速に認識対象画像を認識することができる。
一方、第1の認識部132は、BoFの最大確信度が判定閾値より低い場合に、後述する第2の認識部133によって第2の認識を行う。
なお、第1の認識部132は、上述したBoFに基づいて算出する第1の確信度に限らず、認識対象画像の特徴点と、学習画像記憶部120に記憶されている学習画像の特徴点との間で座標を照合することで第1の確信度を算出してもよい。
また、第1の認識部132は、BoFに基づいて確信度を算出し、また、特徴点の座標に基づいて第1の確信度を算出し、BoFに基づいて算出された確信度と、特徴点の座標に基づいて算出された確信度との間で平均値を算出することで第1の確信度を算出してもよい。
(第2の認識部133について)
第2の認識部133は、第1の認識部132によって認識対象画像の認識に失敗した場合に、第1の認識部132より精細な精度で認識対象画像に描出される商品の認識を行う。具体的には、第2の認識部133は、認識対象画像と、学習画像記憶部120に記憶されている学習画像とを照合することで認識対象画像に描出される商品の認識を行う。
一例を挙げて説明すると、第2の認識部133は、第1の認識部132によって算出された第1の確信度の中で、再判定閾値より高い第1の確信度があるか否かを判定する。なお、再判定閾値は、第1の認識部132による認識で用いた判定閾値より低い値に設定される。ここで、第2の認識部133は、再判定閾値より高い第1の確信度がある場合に、再判定閾値より高い確信度に対応する全ての学習画像から局所特徴量を抽出する。
そして、第2の認識部133は、抽出した局所特徴量と類似する特徴量を、学習画像と認識対象画像との間で対応付ける。その後、第2の認識部133は、対応付けられた学習画像の特徴量と認識対象画像の特徴量との間で座標を照合することで第2の確信度を算出する。そして、第2の認識部133は、算出された第2の確信度のうち、最も大きい値である最大確信度が学習判定閾値より高いか否かを判定する。
ここで、第2の認識部133は、最大確信度が学習判定閾値より高い場合に、最大確信度に対応する学習画像を認識対象画像の認識結果とする。すなわち、第1の認識部132は、認識対象画像に描出される商品を、最大確信度に対応する学習画像に描出される商品であると認識する。
一方、第2の認識部133は、最大確信度が学習判定閾値より低い場合に、第2の認識処理を終了する。
(登録部134について)
登録部134は、認識対象画像の認識結果がある場合に、かかる認識対象画像に関する情報を学習画像記憶部120に記憶する。例えば、登録部134は、認識対象画像の認識結果がある場合に、かかる認識対象画像および認識対象画像のBoFを学習画像記憶部120に商品のタグと対応付けて登録する。
また、登録部134は、認識対象画像の認識結果がある場合に、認識結果とされた学習画像の領域に対応する部分を認識対象画像から抽出して登録してもよい。これにより、登録部134は、例えば、認識対象画像に含まれる背景などを除外して認識対象の部分が切り出された画像を学習画像として登録するので、認識精度を高めることができる。
(配信部135について)
配信部135は、第1の認識部132又は第2の認識部133によって認識対象画像に描出される商品が認識された場合に、認識対象画像の送信元である端末装置10に対して、かかる商品の商品ページを配信する。
図5は、実施形態に係る配信装置100による配信処理の一例を示す説明図である。図5が示すように、配信部135は、認識対象画像P12に描出される商品C11が認識された場合に、端末装置10に対して、商品C11の商品ページW11を配信する。
〔4.認識処理の一例〕
上述した第1の認識部132及び第2の認識部133による認識処理の一例を図4及び図6を用いて説明する。図6は、実施形態に係る配信装置による認識処理の一例を示す説明図である。図6に示すように、配信装置100は、端末装置10から認識対象画像P12を受信したものとする。この場合、第1の認識部132は、受信した認識対象画像P12からBoF12を生成する。そして、第1の認識部132は、学習画像記憶部120に記憶されている学習画像のBoFから、BoF12と類似するBoFを検索する。
ここで、第1の認識部132によって学習画像P11のBoF11、学習画像P13のBoF13、学習画像P14のBoF14が検索されたものとする。この場合、第1の認識部132は、検索されたBoF11、BoF13及びBoF14をBoF12との間で照合することで第1の確信度を算出する。
そして、第1の認識部132は、算出された第1の確信度のうち、最も大きい値である最大確信度が所定の判定閾値より高いか否かを判定する。ここで、ここで、最大確信度のBoFがBoF11であるものとする。また、BoF11の最大確信度が判定閾値より低いものとする。
この場合、第1の認識部132は、認識対象画像P12の認識に失敗したと判定する。そして、第2の認識部133は、認識対象画像P12の認識に失敗した場合に、第1の認識より精細に照合する第2の認識を行う。具体的には、第2の認識部133は、再判定閾値より高い第1の確信度のBoFがあるか否かを判定する。ここで、BoF11及びBoF13の第1の確信度が再判定閾値より高いものとする。
この場合、第2の認識部133は、BoF11及びBoF13に対応する学習画像P11及び学習画像P13から局所特徴量を抽出する。なお、第2の認識部133は、再判定閾値より低いBoF14に対応する学習画像P14の局所特徴量を抽出しない。
そして、第2の認識部133は、抽出したBoF11及びBoF13の局所特徴量と類似する特徴量を、認識対象画像P12の特徴量との間で対応付けて座標を照合することで第2の確信度を算出する。そして、第2の認識部133は、算出された第2の確信度のうち、最も大きい値である最大確信度が所定の学習判定閾値より高いか否かを判定する。
ここで、最大確信度のBoFがBoF11であるものとする。また、BoF11の最大確信度が所定の学習判定閾値より高いものとする。この場合、第2の認識部133は、最大確信度のBoF11に対応する学習画像P11を認識対象画像P12の認識結果とする。そして、登録部134は、認識対象画像P12及びBoF12を学習画像記憶部120にカバンC11のタグ「J11」と対応付けて登録する。
〔5.配信処理手順〕
次に、図7を用いて、実施形態に係る配信装置100による処理の手順について説明する。図7は、実施形態に係る配信装置100による配信処理手順を示すフローチャートである。
図7に示すように、配信装置100は、第1の認識処理を実行する(ステップS101)。続いて、配信装置100は、認識対象画像の認識結果があるか否かを判定する(ステップS102)。ここで、配信装置100は、認識対象画像の認識結果がある場合(ステップS102;Yes)に、認識された商品の商品ページを端末装置に配信する(ステップS107)。
一方、配信装置100は、認識対象画像の認識結果がない場合(ステップS102;No)に、再判定閾値より高い第1の確信度があるか否かを判定する(ステップS103)。ここで、配信装置100は、再判定閾値より高い第1の確信度がない場合に、配信処理を終了する(ステップS102;No)。
一方、配信装置100は、再判定閾値より高い第1の確信度がある場合に、第2の認識処理を実行する(ステップS104)。続いて、配信装置100は、認識対象画像の認識結果があるか否かを判定する(ステップS105)。ここで、配信装置100は、認識対象画像の認識結果がない場合に、配信処理を終了する(ステップS105;No)。
一方、配信装置100は、認識対象画像の認識結果がある場合に、認識対象画像および認識対象画像のBoFを学習画像記憶部120に登録する(ステップS106)。また、配信装置100は、ステップS101またはステップS104において認識された商品の商品ページを端末装置10に配信する。これにより、端末装置10は、ステップS107において配信された商品ページを表示部に表示する。
〔6.第1の認識処理手順〕
次に、図8を用いて、実施形態に係る配信装置100による処理の手順について説明する。図8は、実施形態に係る配信装置100による第1の認識処理手順を示すフローチャートである。
図8に示すように、配信装置100は、認識対象画像の局所特徴量を抽出する(ステップS201)。そして、配信装置100は、認識対象画像のBoFを生成する(ステップS202)。
続いて、配信装置100は、生成されたBoFと類似するBoFを学習画像記憶部120に記憶されているBoFから検索する(ステップS203)。この検索は、例えば、BoFをインデックスとした転置インデックスを用いる。そして、配信装置100は、検索されたBoFごとに、第1の確信度を算出する(ステップS204)。
続いて、配信装置100は、算出された第1の確信度の最大確信度が判定閾値より高いか否かを判定する(ステップS205)。ここで、配信装置100は、最大確信度が判定閾値より低い場合に、第1の認識処理を終了する(ステップS205;No)。
一方、配信装置100は、最大確信度が判定閾値より高い場合に、最大確信度に該当する学習画像を認識結果とする(ステップS206)。
〔7.第2の認識処理手順〕
次に、図9を用いて、実施形態に係る配信装置100による処理の手順について説明する。図9は、実施形態に係る配信装置100による第2の認識処理手順を示すフローチャートである。
図9に示すように、配信装置100は、再判定閾値より高い第1の学習画像から局所特徴量を抽出する(ステップS301)。そして、配信装置100は、局所特徴量と類似する特徴量を学習画像と認識対象画像との間で対応付ける(ステップS302)。
続いて、配信装置100は、学習画像と認識対象画像との間で対応付けられた特徴量の座標を照合することで第2の確信度を算出する。(ステップS303)。そして、配信装置100は、算出された第2の確信度の最大確信度が学習判定閾値より高いか否かを判定する(ステップS304)。
ここで、配信装置100は、最大確信度が学習判定閾値より低い場合に、第2の認識処理を終了する(ステップS304;No)。
一方、配信装置100は、最大確信度が学習判定閾値より高い場合に、最大確信度に該当する学習画像を認識結果とする(ステップS305)。
〔8.効果〕
上述してきたように、実施形態に係る配信装置100は、学習画像記憶部120(記憶部の一例に相当)と、第1の認識部132と、第2の認識部133と、登録部134とを有する。学習画像記憶部120は、学習画像を記憶する。第1の認識部132は、学習画像記憶部120に記憶されている学習画像を用いて認識対象画像の認識を行う。第2の認識部133は、第1の認識部によって認識対象画像の認識に失敗した場合に、第1の認識部より精細な精度で認識対象画像の認識を行う。登録部134は、第2の認識部によって認識対象画像の認識に成功した場合に、認識に成功した認識対象画像に関する情報を記憶部に登録する。
これにより、実施形態に係る配信装置100は、第1の認識による認識対象画像の認識に失敗しても第1の認識より精細な第2の認識を行うので、学習画像と撮影条件が異なる認識対象画像の場合でも高い精度で認識することができる。これにより、配信装置100は、学習画像と撮影条件が異なる認識対象画像も学習画像として登録することが可能となる。また、配信装置100は、認識された認識対象画像を学習画像として登録するので、今後、認識対象画像と類似する画像を受信した場合に、かかる画像を高速に認識することができる。これにより、配信装置100は、高精度な画像認識を高速に行うことができる。また、端末装置10のユーザは、認識対象画像に描出される商品を知ることができる。さらに、オンラインショッピングの管理者は、かかるユーザの商品を購入する意欲を向上させることができる。
また、実施形態に係る配信装置100において、第1の認識部132は、学習画像及び認識対象画像に基づいて第1の確信度を算出する。第2の認識部133は、第1の認識部132によって算出された第1の確信度が、所定の判定閾値より低い値である所定の再判定閾値より高い場合に、第1の認識部より精細な精度で認識対象画像の認識を行う。
これにより、実施形態に係る配信装置100は、第2の認識より精度が粗い第1の認識を行うので、局所特徴量を用いた画像認識と比較して演算量が少なく認識対象画像を高速に認識することができる。また、実施形態に係る配信装置100は、第1の認識による認識対象画像の認識に失敗しても、第1の認識より精度が細かい第2の認識を行うので、学習画像と撮影条件が異なる認識対象画像の場合でも高い精度で認識することができる。これにより、実施形態に係る配信装置100は、学習画像と撮影条件が異なる認識対象画像も学習画像として登録することが可能となる。さらに、実施形態に係る配信装置100は、認識に成功した認識対象画像を学習画像記憶部120に登録するので、今後、画質が粗い認識対象画像と類似する画像を受信した場合でも、かかる画像を高速に認識することが可能となる。
また、実施形態に係る配信装置100において、学習画像記憶部120は、学習画像のBoFをさらに記憶する。第1の認識部132は、認識対象画像のBoFを生成し、生成された認識対象画像のBoFと学習画像記憶部120に記憶されている学習画像のBoFとに基づいて第1の確信度を算出する。第2の認識部133は、学習画像の特徴量及び認識対象画像の特徴量に基づいて第2の確信度を算出する。
これにより、実施形態に係る配信装置100は、BoFを用いて第1の認識を行うので、局所特徴量を用いた画像認識と比較して演算量が少なく認識対象画像を高速に認識することができる。また、配信装置100は、特徴量を用いて第2の認識を行うので、認識対象画像を高い精度で認識することができる。
また、実施形態に係る配信装置100において、第1の認識部132は、認識対象画像の局所特徴量を抽出し、抽出された局所特徴量からBoFを生成し、生成されたBoFを学習画像記憶部120に記憶されている学習画像のBoFから検索し、検索されたBoF毎に、認識対象画像のBoFとの間で第1の確信度を算出し、算出された第1の確信度のうち最も大きい値である最大確信度が所定の判定閾値より高い場合に、認識対象画像を当該最大確信度のBoFに対応する学習画像と認識する。
これにより、実施形態に係る配信装置100は、BoFを用いて第1の認識を行うので、演算量が少なく認識対象画像を高速に認識することができる。
また、実施形態に係る配信装置100において、第1の認識部132は、認識対象画像の局所特徴量を抽出し、抽出された局所特徴量からBoFを生成し、生成されたBoFを学習画像記憶部120に記憶されている学習画像のBoFから検索し、検索されたBoFに対応する学習画像毎に、認識対象画像との間で特徴点の座標を照合することで第1の確信度を算出し、算出された第1の確信度のうち最も大きい値である最大確信度が判定閾値より高い場合に、認識対象画像を最大確信度に対応する学習画像と認識する。
これにより、実施形態に係る配信装置100は、特徴点の座標を用いて第1の認識を行うので、高い精度で認識対象画像を認識することができる。
また、実施形態に係る配信装置100において、第1の認識部132は、認識対象画像の局所特徴量を抽出し、抽出された局所特徴量からBoFを生成し、生成されたBoFを学習画像記憶部120に記憶されている学習画像のBoFから検索し、検索されたBoF毎に、認識対象画像のBoFとの間でBoF確信度を算出し、また、検索されたBoFに対応する学習画像毎に、認識対象画像との間で特徴点の座標を照合することで特徴量確信度を算出し、BoF確信度と特徴量確信度との間で平均を算出することで第1の確信度を算出し、算出された第1の確信度のうち最も大きい値である最大確信度が判定閾値より高い場合に、認識対象画像を最大確信度に対応する学習画像と認識する。
これにより、実施形態に係る配信装置100は、BoF及び特徴点の座標を用いて第1の認識を行うので、高い精度で認識対象画像を認識することができる。
また、実施形態に係る配信装置100において、第2の認識部133は、判定閾値より低い値である再判定閾値より高い第1の確信度に対応する学習画像から局所特徴量を抽出し、抽出された局所特徴量と類似する特徴量を学習画像と認識対象画像との間で対応付けて座標を照合することで第2の確信度を算出し、算出された第2の確信度のうち最も大きい値である最大確信度が学習判定閾値より高い場合に、認識対象画像を最大確信度に対応する学習画像と認識する。
これにより、実施形態に係る配信装置100は、特徴量を用いて第2の認識を行うので、高い精度で認識対象画像を認識することができる。
また、実施形態に係る配信装置100において、登録部134は、第2の認識部133によって認識対象画像の認識に成功した場合に、認識に成功した認識対象画像および認識対象画像に対応するBoFを学習画像記憶部120に登録する。
これにより、実施形態に係る配信装置100は、認識に成功した認識対象画像を登録するので、今後、画質が粗い認識対象画像と類似する画像を受信した場合でも、かかる画像を高速に認識することが可能となる。
また、実施形態に係る配信装置100において、登録部134は、第2の認識部133によって認識対象画像の認識に成功した場合に、認識に成功した認識対象画像に認識に成功した学習画像に付されているメタ情報を対応付けて学習画像記憶部120に登録する。
これにより、実施形態に係る配信装置100は、認識対象画像に描出される認識対象をメタ情報に基づいて識別することができる。
〔9.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図4に示した学習画像記憶部120は、配信装置100が保持せずに、ストレージサーバ等に保持されてもよい。この場合、配信装置100は、ストレージサーバにアクセスすることで、学習画像に関する情報を取得する。
また、配信装置100は、商品ページの配信処理は行わず、第1の認識部132及び第2の認識部133による認識処理のみを行う認識装置であってもよい。この場合、認識装置は、少なくとも登録部134及び配信部135を有しない。そして、登録部134を有する登録装置が、認識装置によって認識に成功した認識対象画像を学習画像記憶部120に記憶する。また、配信部135を有する配信装置が、認識装置によってされた商品の商品ページを端末装置10等に配信する。
なお、上記実施形態における配信装置100は、例えば図10に示すような構成のコンピュータ70によって実現される。図10は、配信装置100の機能を実現するコンピュータ70の一例を示すハードウェア構成図である。コンピュータ70は、CPU71、RAM72、ROM(Read Only Memory)73、HDD(Hard Disk Drive)74、通信インターフェイス(I/F)75、入出力インターフェイス(I/F)76、およびメディアインターフェイス(I/F)77を備える。
CPU71は、ROM73またはHDD74に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM73は、コンピュータ70の起動時にCPU71によって実行されるブートプログラムや、コンピュータ70のハードウェアに依存するプログラム等を格納する。
HDD74は、CPU71によって実行されるプログラムおよび当該プログラムによって使用されるデータ等を格納する。通信インターフェイス75は、通信回線Nを介して他の機器からデータを受信してCPU71へ送り、CPU71が生成したデータを、通信回線Nを介して他の機器へ送信する。
CPU71は、入出力インターフェイス76を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU71は、入出力インターフェイス76を介して、入力装置からデータを取得する。また、CPU71は、生成したデータを、入出力インターフェイス76を介して出力装置へ出力する。
メディアインターフェイス77は、記録媒体78に格納されたプログラムまたはデータを読み取り、RAM72を介してCPU71に提供する。CPU71は、当該プログラムを、メディアインターフェイス77を介して記録媒体78からRAM72上にロードし、ロードしたプログラムを実行する。記録媒体78は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
コンピュータ70が実施形態における配信装置100として機能する場合、コンピュータ70のCPU71は、RAM72上にロードされたプログラムを実行することにより、受信部131、第1の認識部132、第2の認識部133、登録部134および配信部135の各機能を実現する。また、HDD74には、学習画像記憶部120内のデータが格納される。
コンピュータ70のCPU71は、これらのプログラムを、記録媒体78から読み取って実行するが、他の例として、他の装置から、通信回線Nを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述した配信装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、特許請求の範囲に記載した「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、受信部は、受信手段や受信回路に読み替えることができる。
1 配信システム
10 端末装置
100 配信装置
120 学習画像記憶部
131 受信部
132 第1の認識部
133 第2の認識部
134 登録部
135 配信部

Claims (11)

  1. 学習画像に関する情報を記憶する記憶部と、
    前記記憶部に記憶されている学習画像を用いて認識対象画像の認識を行う第1の認識部と、
    第1の認識部によって前記認識対象画像の認識に失敗した場合に、第1の認識部より精細な精度で前記認識対象画像の認識を行う第2の認識部と、
    第2の認識部によって前記認識対象画像の認識に成功した場合に、認識に成功した前記認識対象画像に関する情報を前記記憶部に登録する登録部と
    を備えることを特徴とする画像認識装置。
  2. 前記第1の認識部は、
    前記学習画像及び前記認識対象画像に基づいて第1の確信度を算出し、
    前記第2の認識部は、
    前記第1の認識部によって算出された第1の確信度が、所定の判定閾値より低い値である所定の再判定閾値より高い場合に、第1の認識部より精細な精度で前記認識対象画像の認識を行う
    ことを特徴とする請求項1に記載の画像認識装置。
  3. 前記記憶部は、
    前記学習画像のBoF(Bag of features)をさらに記憶し、
    前記第1の認識部は、
    前記認識対象画像のBoFを生成し、生成された前記認識対象画像のBoFと前記記憶部に記憶されている学習画像のBoFとに基づいて第1の確信度を算出し、
    前記第2の認識部は、
    前記学習画像の特徴量及び前記認識対象画像の特徴量に基づいて第2の確信度を算出する
    ことを特徴とする請求項1または2に記載の画像認識装置。
  4. 前記記憶部は、
    前記学習画像のBoFをさらに記憶し、
    前記第1の認識部は、
    前記認識対象画像の局所特徴量を抽出し、抽出された局所特徴量からBoFを生成し、生成されたBoFを前記記憶部に記憶されている学習画像のBoFから検索し、検索されたBoF毎に、認識対象画像のBoFとの間で第1の確信度を算出し、算出された第1の確信度のうち最も大きい値である最大確信度が所定の判定閾値より高い場合に、認識対象画像を当該最大確信度のBoFに対応する学習画像と認識する
    ことを特徴とする請求項1〜3のいずれか1つに記載の画像認識装置。
  5. 前記記憶部は、
    前記学習画像のBoFをさらに記憶し、
    前記第1の認識部は、
    前記認識対象画像の局所特徴量を抽出し、抽出された局所特徴量からBoFを生成し、生成されたBoFを前記記憶部に記憶されている学習画像のBoFから検索し、検索されたBoFに対応する学習画像毎に、前記認識対象画像との間で特徴点の座標を照合することで第1の確信度を算出し、算出された第1の確信度のうち最も大きい値である最大確信度が判定閾値より高い場合に、前記認識対象画像を当該最大確信度に対応する学習画像と認識する
    ことを特徴とする請求項1〜3のいずれか1つに記載の画像認識装置。
  6. 前記記憶部は、
    前記学習画像のBoFをさらに記憶し、
    前記第1の認識部は、
    前記認識対象画像の局所特徴量を抽出し、抽出された局所特徴量からBoFを生成し、生成されたBoFを前記記憶部に記憶されている学習画像のBoFから検索し、検索されたBoF毎に、前記認識対象画像のBoFとの間でBoF確信度を算出し、また、検索されたBoFに対応する学習画像毎に、前記認識対象画像との間で特徴点の座標を照合することで特徴量確信度を算出し、BoF確信度と特徴量確信度との間で平均を算出することで第1の確信度を算出し、算出された第1の確信度のうち最も大きい値である最大確信度が判定閾値より高い場合に、前記認識対象画像を当該最大確信度に対応する学習画像と認識する
    ことを特徴とする請求項1〜3のいずれか1つに記載の画像認識装置。
  7. 前記第2の認識部は、
    判定閾値より低い値である再判定閾値より高い第1の確信度に対応する学習画像から局所特徴量を抽出し、抽出された局所特徴量と類似する局所特徴量を学習画像と前記認識対象画像との間で対応付けて座標を照合することで第2の確信度を算出し、算出された第2の確信度のうち最も大きい値である最大確信度が所定の学習判定閾値より高い場合に、前記認識対象画像を当該最大確信度に対応する学習画像と認識する
    ことを特徴とする請求項1〜6のいずれか1つに記載の画像認識装置。
  8. 前記登録部は、
    第2の認識部によって前記認識対象画像の認識に成功した場合に、認識に成功した前記認識対象画像および前記認識対象画像に対応するBoFを記憶部に登録する
    ことを特徴とする請求項1〜7のいずれか1つに記載の画像認識装置。
  9. 前記登録部は、
    第2の認識部によって前記認識対象画像の認識に成功した場合に、認識に成功した前記認識対象画像に前記認識に成功した学習画像に付されているメタ情報を対応付けて記憶部に登録する
    ことを特徴とする請求項1〜8のいずれか1つに記載の画像認識装置。
  10. 画像認識装置が実行する画像認識方法であって、
    記憶部に記憶されている学習画像を用いて認識対象画像の認識を行う第1の認識工程と、
    第1の認識部によって前記認識対象画像の認識に失敗した場合に、第1の認識部より精細な精度で前記認識対象画像の認識を行う第2の認識工程と、
    第2の認識部によって前記認識対象画像の認識に成功した場合に、認識に成功した前記認識対象画像に関する情報を前記記憶部に登録する登録工程と
    を含んだことを特徴とする画像認識方法。
  11. 記憶部に記憶されている学習画像を用いて認識対象画像の認識を行う第1の認識手順と、
    第1の認識部によって前記認識対象画像の認識に失敗した場合に、第1の認識部より精細な精度で前記認識対象画像の認識を行う第2の認識手順と、
    第2の認識部によって前記認識対象画像の認識に成功した場合に、認識に成功した前記認識対象画像に関する情報を前記記憶部に登録する登録手順と
    をコンピュータに実行させることを特徴とする画像認識プログラム。
JP2013177361A 2013-08-28 2013-08-28 画像認識装置、画像認識方法及び画像認識プログラム Active JP5808371B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013177361A JP5808371B2 (ja) 2013-08-28 2013-08-28 画像認識装置、画像認識方法及び画像認識プログラム
US14/021,497 US9355338B2 (en) 2013-08-28 2013-09-09 Image recognition device, image recognition method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013177361A JP5808371B2 (ja) 2013-08-28 2013-08-28 画像認識装置、画像認識方法及び画像認識プログラム

Publications (2)

Publication Number Publication Date
JP2015046071A true JP2015046071A (ja) 2015-03-12
JP5808371B2 JP5808371B2 (ja) 2015-11-10

Family

ID=52583359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013177361A Active JP5808371B2 (ja) 2013-08-28 2013-08-28 画像認識装置、画像認識方法及び画像認識プログラム

Country Status (2)

Country Link
US (1) US9355338B2 (ja)
JP (1) JP5808371B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101339A (ja) * 2016-12-21 2018-06-28 ヤフー株式会社 推定装置、推定方法及び推定プログラム
WO2018142756A1 (ja) 2017-01-31 2018-08-09 株式会社Nttドコモ 情報処理装置及び情報処理方法
CN108983218A (zh) * 2017-05-31 2018-12-11 本田技研工业株式会社 物体目标识别系统、物体目标识别方法及存储介质
KR20190103283A (ko) * 2017-03-27 2019-09-04 가부시키가이샤 히다치 하이테크놀로지즈 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
JP2020123139A (ja) * 2019-01-30 2020-08-13 キヤノン株式会社 情報処理システム、端末装置、クライアント装置、それらの制御方法、プログラム、記憶媒体

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170154056A1 (en) * 2014-06-24 2017-06-01 Beijing Qihoo Technology Company Limited Matching image searching method, image searching method and devices
US20220345230A1 (en) * 2019-10-08 2022-10-27 Nec Corporation Transmission apparatus recognition apparatus, transmission apparatus recognition system, transmission apparatus recognition method, and computer readable medium
CN111143597B (zh) * 2019-12-13 2023-06-20 浙江大华技术股份有限公司 图像检索方法、终端及存储装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103865A (ja) * 2010-11-09 2012-05-31 Canon Inc 画像処理システム、撮像装置、画像処理装置及びそれらの制御方法、プログラム
JP2012203669A (ja) * 2011-03-25 2012-10-22 Sony Corp 端末装置、情報処理装置、物体識別方法、プログラム及び物体識別システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4470434B2 (ja) * 2003-10-06 2010-06-02 富士ゼロックス株式会社 動作識別装置、及び対象物の姿勢識別装置
JP4611069B2 (ja) * 2004-03-24 2011-01-12 富士フイルム株式会社 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
US8995715B2 (en) * 2010-10-26 2015-03-31 Fotonation Limited Face or other object detection including template matching
US7440929B2 (en) * 2005-01-14 2008-10-21 Ultra-Scan Corporation Multimodal authorization method, system and device
CN101536035B (zh) * 2006-08-31 2012-09-26 公立大学法人大阪府立大学 图像识别方法、以及图像识别装置
US8010471B2 (en) * 2007-07-13 2011-08-30 Microsoft Corporation Multiple-instance pruning for learning efficient cascade detectors
JP5527554B2 (ja) * 2009-03-04 2014-06-18 公立大学法人大阪府立大学 画像検索方法、画像検索プログラム及び画像登録方法
US8559672B2 (en) * 2009-06-01 2013-10-15 Hewlett-Packard Development Company, L.P. Determining detection certainty in a cascade classifier
US8189925B2 (en) * 2009-06-04 2012-05-29 Microsoft Corporation Geocoding by image matching
ES2384928B1 (es) * 2010-06-25 2013-05-20 Telefónica, S.A. Método y sistema para la identificación rápida y robusta de productos específicos en imágenes.
JP5134664B2 (ja) * 2010-09-14 2013-01-30 株式会社東芝 アノテーション装置
JP5801601B2 (ja) 2011-05-10 2015-10-28 キヤノン株式会社 画像認識装置、画像認識装置の制御方法、およびプログラム
US20140286527A1 (en) * 2013-03-20 2014-09-25 Qualcomm Incorporated Systems and methods for accelerated face detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103865A (ja) * 2010-11-09 2012-05-31 Canon Inc 画像処理システム、撮像装置、画像処理装置及びそれらの制御方法、プログラム
JP2012203669A (ja) * 2011-03-25 2012-10-22 Sony Corp 端末装置、情報処理装置、物体識別方法、プログラム及び物体識別システム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6015023149; 黄瀬 浩一: '"特定物体認識"' 電子情報通信学会技術研究報告 Vol.109, No.306, 20091119, pp.79-87, 社団法人電子情報通信学会 *
JPN6015023150; 野口 和人、外3名: '"カメラ付き携帯電話を入力デバイスとした大規模画像認識"' 情報処理学会研究報告 Vol.2009, No.29, 20090306, pp.205-210, 社団法人情報処理学会 *
JPN6015023151; 秋山 瑞樹、柳井 啓司: '"Web上の大量画像を用いた特定物体認識手法による一般物体認識"' 情報処理学会研究報告 コンピュータビジョンとイメージメディア(CVIM) No.172, 20100615, pp.1-8, 社団法人情報処理学会 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101339A (ja) * 2016-12-21 2018-06-28 ヤフー株式会社 推定装置、推定方法及び推定プログラム
WO2018142756A1 (ja) 2017-01-31 2018-08-09 株式会社Nttドコモ 情報処理装置及び情報処理方法
US10977510B2 (en) 2017-01-31 2021-04-13 Ntt Docomo, Inc. Information-processing device and information-processing method
KR20190103283A (ko) * 2017-03-27 2019-09-04 가부시키가이샤 히다치 하이테크놀로지즈 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
KR20210111335A (ko) * 2017-03-27 2021-09-10 주식회사 히타치하이테크 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
KR102336431B1 (ko) 2017-03-27 2021-12-08 주식회사 히타치하이테크 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
KR102435492B1 (ko) 2017-03-27 2022-08-24 주식회사 히타치하이테크 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
CN108983218A (zh) * 2017-05-31 2018-12-11 本田技研工业株式会社 物体目标识别系统、物体目标识别方法及存储介质
JP2020123139A (ja) * 2019-01-30 2020-08-13 キヤノン株式会社 情報処理システム、端末装置、クライアント装置、それらの制御方法、プログラム、記憶媒体
JP7261022B2 (ja) 2019-01-30 2023-04-19 キヤノン株式会社 情報処理システム、端末装置及びその制御方法、プログラム、記憶媒体

Also Published As

Publication number Publication date
JP5808371B2 (ja) 2015-11-10
US20150063686A1 (en) 2015-03-05
US9355338B2 (en) 2016-05-31

Similar Documents

Publication Publication Date Title
JP5808371B2 (ja) 画像認識装置、画像認識方法及び画像認識プログラム
US11430256B2 (en) Image scoring and identification based on facial feature descriptors
CN106446816B (zh) 人脸识别方法及装置
US8966583B2 (en) Method, apparatus and server for user verification
US20120062597A1 (en) Adding metadata apparatus
CN106303599B (zh) 一种信息处理方法、系统及服务器
EP3253032A1 (en) Mediating method and device, and recording medium
US9633272B2 (en) Real time object scanning using a mobile phone and cloud-based visual search engine
CN108596079B (zh) 手势识别方法、装置及电子设备
KR20140139623A (ko) 제품 피드 유사성을 사용하는 스팸 상인 발견
CN105183295A (zh) 一种应用图标的归类方法及终端
CN108197638A (zh) 对待评估样本进行分类的方法及装置
CN111401981B (zh) 竞价云主机的竞价方法、装置及存储介质
JP2010231744A (ja) 情報処理装置、プログラム及び画像データ管理方法
US11295118B2 (en) Online user verification without prior knowledge of the user
US10937066B2 (en) Terminal device, program, and method
JP5932107B2 (ja) 画像処理サーバ及び撮像装置
CN105095215B (zh) 信息获取装置、方法以及服务器
JP2013222406A (ja) 画像検索システム、画像検索装置およびコンピュータプログラム
WO2015100070A1 (en) Presenting information based on a video
JPWO2020044537A1 (ja) 画像照合装置、画像照合方法、及びプログラム
KR20150106621A (ko) 단말, 서비스 제공 장치, 그 제어 방법, 컴퓨터 프로그램이 기록된 기록 매체 및 이미지 검색 시스템
JP2019105905A (ja) 名刺情報登録装置、名刺情報登録方法、およびプログラム
JP6344984B2 (ja) 人物推定装置、人物推定方法及びプログラム
US12008221B2 (en) Method for providing tag, and electronic device for supporting same

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150908

R150 Certificate of patent or registration of utility model

Ref document number: 5808371

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350