JP6127676B2 - 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法 - Google Patents

画像認識装置、画像認識プログラム、記録媒体、および画像認識方法 Download PDF

Info

Publication number
JP6127676B2
JP6127676B2 JP2013084370A JP2013084370A JP6127676B2 JP 6127676 B2 JP6127676 B2 JP 6127676B2 JP 2013084370 A JP2013084370 A JP 2013084370A JP 2013084370 A JP2013084370 A JP 2013084370A JP 6127676 B2 JP6127676 B2 JP 6127676B2
Authority
JP
Japan
Prior art keywords
recognition
changed
image
pair
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013084370A
Other languages
English (en)
Other versions
JP2014206878A (ja
Inventor
田中 清明
清明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2013084370A priority Critical patent/JP6127676B2/ja
Priority to EP14161123.6A priority patent/EP2790129A3/en
Priority to CN201410109852.4A priority patent/CN104102930B/zh
Priority to US14/223,411 priority patent/US9396407B2/en
Publication of JP2014206878A publication Critical patent/JP2014206878A/ja
Application granted granted Critical
Publication of JP6127676B2 publication Critical patent/JP6127676B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)

Description

本発明は、画像に写る表示物体の種類を認識する画像認識装置、画像認識プログラム、記録媒体、および画像認識方法に関する。
画像に含まれる物体や文字列などを認識することは、一般的に画像認識と呼ばれる。特に、画像に含まれる物体の形状・色・動作などに基づき、その物体の種類を特定する画像認識のことを、一般物体認識と呼ぶ。
近年、一般物体認識を含む画像認識に関する研究が増加しており、精度の高い画像認識の実現が追及されている。しかしながら、画像認識の結果が正しい物体を特定することができるような精度の高い画像認識装置は未だ実現されていない。
そこで、画像認識の精度を向上させるための様々な技術が開発されている。
例えば、特許文献1には、画像情報を基に文字列の認識を行い、さらに、得られた文字認識結果を修正する認識装置が記載されている。
詳細には、特許文献1に記載された技術では、まず、画像情報に含まれる文字列について、画像識別処理を行うことにより、該文字列内の各文字の候補文字を推定する。次に、上記候補文字を組み合わせることで、上記文字列の候補としての候補文字列を作成する。その後、上記候補文字列を、単語登録情報内の単語と照合することによって、画像情報に含まれる上記文字列を特定する。
これにより、上記文字認識装置では、低負荷の処理で文字列を認識することができると、同文献には記載されている。
また、特許文献2には、頻出用語集に含まれる文字列を参照して、文字のOCR読み取り結果である文字列を修正する文字認識結果の修正方法が記載されている。同文献に開示された技術では、上記OCR読み取り結果から、その一部をサンプルとして抽出し、さらに、上記サンプルから、予め用意した頻出用語集の登録語と類似の文字列を抽出する。次に、抽出された文字列と、上記類似の文字列とを対応付けた正誤表を作成する。その後、作成された正誤表を用いて、上記OCR読み取り結果を修正する。
特開2010−9440号公報(2010年1月14日公開) 特開2000−11095号公報(2000年1月14日公開)
しかしながら、上記特許文献1および2に記載された技術は、いずれも画像中から文字列を認識して、認識結果を修正する技術であり、画像中から、文字列だけでなく任意の表示物体を認識して、その認識結果を修正する技術はこれまで開示されていない。
本発明は、上記課題に鑑みてなされたものであり、その目的は、画像に写る表示物体の種類を精度よく特定する画像認識装置等を提供することにある。
上記の課題を解決するために、本発明の一態様に係る画像認識装置は、画像に写る表示物体の種類を認識し、上記表示物体の種類の認識結果としての確からしさを示す信頼度をそれぞれ有する1つまたは複数の認識候補を取得する画像認識装置において、上記表示物体の中から、上記認識結果を修正する対象となる1つまたは複数の変更物体を選択するとともに、上記認識結果を修正する対象ではない確定物体の種類を、上記1つまたは複数の認識候補のうちで最大の信頼度を有する認識候補の種類に確定する変更物体選択手段と、上記表示物体のうち、上記確定物体の中から、上記変更物体のペアとなるペア物体を選択するペア物体選択手段と、上記ペア物体の種類に関連付けられている物体の種類を示すペア情報リストに基づき、上記変更物体の認識結果を修正し、上記変更物体を特定する認識処理手段とを備えている。
また、上記の課題を解決するために、本発明の一態様に係る画像認識方法は、画像に写る表示物体の種類を認識し、上記表示物体の種類の認識結果としての確からしさを示す信頼度をそれぞれ有する1つまたは複数の認識候補を取得する画像認識方法において、上記表示物体の中から、上記認識結果を修正する対象となる1つまたは複数の変更物体を選択するとともに、上記認識結果を修正する対象ではない確定物体の種類を、上記1つまたは複数の認識候補のうちで最大の信頼度を有する認識候補の種類に確定する変更物体選択ステップと、上記表示物体のうち、上記確定物体の中から、上記変更物体のペアとなるペア物体を選択するペア物体選択ステップと、上記ペア物体の種類に関連付けられている物体の種類を示すペア情報リストに基づき、上記変更物体の認識結果を修正し、上記変更物体を特定する認識処理ステップとを含んでいる。
上記の各構成によれば、変更物体の認識結果を修正するために、その変更物体のペアとなるペア物体を、確定物体の中から選択する。このとき、変更物体のペア物体をどのように選択するかは任意である。
上記ペア物体は、例えば、該ペア物体と同一の画像に写っている頻度に基づいて対応付けられた物体であるペア情報のリストを有している。
従って、上記ペア情報リストを参照することによって、ペア物体と同一の画像中において認識された変更物体の種類を精度よく特定することができる。
さらに、本発明に係る画像認識装置において、上記変更物体選択手段は、上記表示物体のうち、上記1つまたは複数の認識候補の最大信頼度が所定の閾値よりも低い表示物体を、上記変更物体として選択する構成であってもよい。
上記構成によれば、1つまたは複数の認識候補の信頼度がいずれも所定の閾値より低い表示物体は変更物体となる。一方、上記1つまたは複数の認識候補の信頼度の少なくともいずれか1つが上記閾値以上である表示物体は確定物体となる。そして、上記変更物体は、上記確定物体の中から選択されたペア物体のペア情法リストに基づいて、特定されることになる。
ここで、上記最大信頼度は、上記1つまたは複数の認識候補の各信頼度のうち、最も大きい信頼度のことである。
上記閾値は、ある表示物体の認識候補が上記閾値よりも低い信頼度を有する場合、上記表示物体が上記認識候補であると特定されることが確からしいと言えないような値であってよい。
これにより、いずれの認識候補の信頼度も上記閾値より低く、確からしいと言える認識候補が存在しない表示物体を、変更物体として選択し、該表示物体の認識結果を修正することができる。
さらに、本発明に係る画像認識装置において、上記変更物体選択手段は、上記表示物体のうち、上記1つまたは複数の認識候補の最大信頼度が最も低い表示物体を、上記変更物体として選択する構成であってよい。
上記構成によれば、画像に表示された各表示物体の1つまたは複数の認識候補において、最大の信頼度を有しており、該表示物体として最も確からしいと考えられる最尤認識候補同士が比較される。そして、上記最尤認識候補の値が最も低い表示物体が、変更物体として選択される。
そのため、画像に表示された全表示物体において、いずれかの認識候補として特定されることが最も困難な表示物体を、変更物体とすることができる。
さらに、本発明に係る画像認識装置において、上記ペア物体選択手段は、上記画像において、複数の確定物体が存在する場合、上記変更物体に最も近い位置に表示された確定物体を、上記ペア物体として選択する構成であってよい。
上記構成によれば、変更物体に最も近い位置に表示された確定物体がペア物体となる。ここで、画像において、変更物体に最も近くに位置する確定物体は、その画像が撮影された空間内において、上記変更物体に最近接しているか、あるいは最近接はしていないものの上記変更物体の近傍に位置していると考えられる。
そのため、上記確定物体は、上記変更物体に対して強い関連性を有する物体である可能性が高いので、上記確定物体のペア情報リストには、上記変更物体の正しい特定結果が含まれる可能性が高いことになる。
従って、上記構成のように、画像において変更物体の最も近くに位置する確定物体を、上記ペア物体として選択することによって、上記ペア物体のペア情報リストに基づき、上記変更物体が正しく特定される可能性を向上させることができる。
さらに、本発明に係る画像認識装置において、上記ペア物体選択手段は、上記画像において、複数の確定物体が存在する場合、上記信頼度が最も高い確定物体を、上記ペア物体として選択する構成であってよい。
上記構成によれば、上記ペア物体は、信頼度が最も高い確定物体である。従って、上記ペア物体としての確定物体は、全ての確定物体において、正しく特定されている可能性が最も高い確定物体であると考えられる。
そのため、正しく特定されている可能性が最も高いペア物体のペア情報リストに基づき、上記変更物体の認識結果が修正され、上記変更物体が特定されることになる。これにより、上記変更物体が正しく特定される可能性を向上させることができる。
さらに、本発明に係る画像認識装置において、上記ペア物体選択手段は、上記画像において、複数の確定物体が存在する場合、上記複数の確定物体のうち、最多数の同一種類の確定物体のいずれかを、上記ペア物体として選択する構成であってよい。
上記構成によれば、少なくともいずれか1つの確定物体の特定結果に対応する認識候補のうち、最も多くの確定物体の認識候補である認識候補が探索される。そして、上記探索の結果として検出された認識候補に対応する確定物体が、ペア物体として選択されることになる。
上記ペア物体は、少なくともいずれか1つの確定物体の特定結果に対応する認識候補であり、さらに、上記認識候補のうち、最も多くの確定物体の認識候補である。
従って、上記確定物体の中には、上記ペア物体の特定結果と同一の物体である可能性が高い確定物体が多いことになる。このことは、上記ペア物体が正しく特定されている可能性が高いことを意味する。
ゆえに、正しく特定されている可能性が最も高いペア物体のペア情報リストに基づき、上記変更物体の認識結果が修正され、上記変更物体が特定されることになる。これにより、上記変更物体が正しく特定される可能性を向上させることができる。
さらに、本発明に係る画像認識装置において、上記認識処理手段は、上記変更物体の認識候補において、上記信頼度の高い認識候補から順に、該認識候補に対応するペア情報が上記ペア情報リストに含まれているか探索し、該認識候補に対応するペア情報を検出した場合、上記変更物体を該ペア情報として特定する構成であってよい。
上記構成によれば、信頼度の高い認識候補から順に、ペア物体のペア情報リストにその認識候補に対応するペア情報が含まれているか探索される。このようにして、対応するペア情報が検出された認識候補は、対応するペア情報が上記ペア情報リストに存在する全ての認識候補の中では、最も信頼度が高い。
従って、上記変更物体は、対応する物体が上記ペア情報リストに存在する認識候補の中では、最も信頼度が高い認識候補として特定されることになる。
これにより、対応するペア情報が上記ペア情報リストに存在する認識候補の中で、2番目以下に信頼度が高い認識候補として、上記変更物体が特定される構成と比較して、上記変更物体が正しく特定される可能性をより高くすることができる。
さらに、本発明に係る画像認識装置において、上記認識処理手段は、上記ペア情報リストにおいて優先度が高いペア情報から順に、該ペア情報に対応する認識候補が上記変更物体の認識候補として含まれているか探索し、該ペア情報に対応する認識候補を検出した場合、上記変更物体を該ペア情報として特定する構成であってよい。
ここで、ペア情報リストにおけるペア情報の優先度は、データベース中の同一画像において、上記ペア情報リストを有するペア物体が、該ペア情報と一緒に写っている頻度の高さに基づいて決定されてもよい。
あるいは、ペア情報リストにおけるペア情報の優先度は、経験的にあるいは一般的に、上記ペア情報を有するペア物体と組み合わせて配置される頻度の高さに基づいて決定されてもよい。
上記構成によれば、ペア情報リストにおいて優先度が高いペア情報から順に、変更物体の全ての認識候補の中に、該ペア情報に対応する認識候補が含まれているか探索される。このようにして、対応する認識候補が検出されたペア情報は、上記ペア情報リストにおいて、対応する認識候補が上記変更物体の認識候補として含まれる物体の中では、最も優先度が高い。
従って、上記変更物体は、対応する認識候補が上記変更物体の認識候補として含まれるペア情報の中では、最も優先度が高いペア情報として特定されることになる。
これにより、対応する認識候補が上記変更物体の認識候補として含まれるペア情報の中で、2番目以下に優先度が高いペア情報として、上記変更物体が特定される構成と比較して、上記変更物体が正しく特定される可能性をより高くすることができる。
さらに、本発明に係る画像認識装置において、上記認識処理手段は、上記ペア情報リストを参照して、上記ペア情報リストに含まれるペア情報に対応する認識候補の信頼度が大きくなるように、上記変更物体の認識候補の信頼度に対して重み付けを行った後、上記変更物体を、上記変更物体の認識候補のうち、最も信頼度の高い認識候補として特定する構成であってよい。
上記構成によれば、ペア情報リストに含まれるペア情報に対応する認識候補が検出された場合、変更物体を、該認識候補として特定する代わりに、該認識候補の信頼度が重み付けされる。
従って、ペア情報リストに含まれるペア情報に対応する認識候補の信頼度を重み付けによって増加させて、上記変更物体が該認識候補であることの確からしさを増加させることができる。
なお、ペア情報リストに含まれるペア情報の優先度に応じて、上記ペア情報に対応する認識候補の信頼度に付す重みを変化させてもよい。これにより、ペア情報リストにおいて優先度のより高いペア情報に対応する認識候補ほど、信頼度をより増加させることができることになる。
さらに、本発明に係る画像認識装置において、上記認識処理手段は、上記変更物体選択手段によって複数の変更物体が選択された場合、上記複数の変更物体において、上記1つまたは複数の認識候補の最大信頼度の高い変更物体から順に特定する構成であってよい。
上記構成によれば、信頼度の高い変更物体から順に特定される。
従って、例えば、信頼度が番高い第1の変更物体を特定した後、2番目に信頼度が高い第2の変更物体を特定する際に、先に特定された上記第1の変更物体を、上記第2の変更物体のペア物体として用いることができることになる。
ここで、最大信頼度がより高い変更物体ほど、その最大信頼度を有する認識候補である確からしさが高いことになる。従って、最大信頼度がより高い変更物体ほど、正しく特定される可能性がより高いと考えられる。逆に言えば、最大信頼度がより低い変更物体ほど、正しく特定される可能性がより低いと考えられる。
また、正しく特定される可能性がより高い変更物体を先に確定させた後、その物体をペア物体として用いて、正しく特定される可能性がより低い変更物体を確定させたほうが、正しく特定される可能性がより低い変更物体を先に確定させた後、その物体をペア物体として用いて、正しく特定される可能性がより高い変更物体を確定させることよりも、両方の変更物体が正しく特定される可能性がより高いと考えられる。
ゆえに、上記構成は、最大信頼度の低い変更物体から順に特定する構成と比較して、複数の変更物体が正しく特定される可能性がより高くなると考えられる。
さらに、本発明に係る画像認識装置において、上記認識処理手段は、上記画像において、上記確定物体が存在しない場合、上記変更物体を、該変更物体の最も信頼度の高い認識候補として特定する構成であってよい。
上記構成によれば、ある変更物体が、最も信頼度の高い認識候補として特定されることになる。例えば、最大信頼度が最も高い認識候補を有する変更物体を特定して、確定物体としてもよい。
これにより、画像には、少なくとも1つの確定物体が含まれることになる。そして、上記確定物体をペア物体として用いて、上述したように、変更物体を特定することができる。
なお、上記ペア情報リストには、過去に撮影された画像において、同一の画像内に写っている頻度が所定数よりも高い2つの表示物体が、互いに他方の表示物体に対応付けられたペア情報リストに含まれている構成であってよい。
上記構成では、例えば、まず、高性能な画像認識装置を用いて、データベース化された複数の画像を一般物体認識させる。これにより、上記複数の画像に表示された表示物体が認識され、特定されることになる。
次に、表示物体の特定結果を用いて、同一画像に写っている2つの表示物体を抽出する。これにより、ある2つの表示物体が同一画像内に写っている頻度が求められることになる。
その後、所定の枚数以上の同一画像に写っている2つの表示物体を抽出し、互いに他方の表示物体に対応付けられたペア情報リストに含める。
こうして、同一の画像に写っている頻度が所定回数以上であり、ペアとして配置されたり、組み合わせて使用されたりすると考えられる2つの表示物体を、互いに他方の表示物体に対応付けられたペア情報リストに含めることができる。
本発明の各態様に係る画像認識装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記画像認識装置が備える各手段として動作させることにより上記画像認識装置をコンピュータにて実現させる画像認識装置の画像認識プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明に係る画像認識装置は、画像に写る表示物体の種類を認識し、上記表示物体の種類の認識結果としての確からしさを示す信頼度をそれぞれ有する1つまたは複数の認識候補を取得する画像認識装置において、上記表示物体の中から、上記認識結果を修正する対象となる1つまたは複数の変更物体を選択するとともに、上記認識結果を修正する対象ではない確定物体の種類を、上記1つまたは複数の認識候補のうちで最大の信頼度を有する認識候補の種類に確定する変更物体選択手段と、上記表示物体のうち、上記確定物体の中から、上記変更物体のペアとなるペア物体を選択するペア物体選択手段と、上記ペア物体の種類に関連付けられている物体の種類を示すペア情報リストに基づき、上記変更物体の認識結果を修正し、上記変更物体を特定する認識処理手段とを備えている。
また、本発明に係る画像認識方法は、画像に写る表示物体の種類を認識し、上記表示物体の種類の認識結果としての確からしさを示す信頼度をそれぞれ有する1つまたは複数の認識候補を取得する画像認識方法において、上記表示物体の中から、上記認識結果を修正する対象となる1つまたは複数の変更物体を選択するとともに、上記認識結果を修正する対象ではない確定物体の種類を、上記1つまたは複数の認識候補のうちで最大の信頼度を有する認識候補の種類に確定する変更物体選択ステップと、上記表示物体のうち、上記確定物体の中から、上記変更物体のペアとなるペア物体を選択するペア物体選択ステップと、上記ペア物体の種類に関連付けられている物体の種類を示すペア情報リストに基づき、上記変更物体の認識結果を修正し、上記変更物体を特定する認識処理ステップとを含んでいる。
本発明の一態様によれば、画像に写る表示物体の種類を精度よく特定することができるという効果を奏する。
本発明の実施形態1に係る画像認識装置の構成を示す機能ブロック図である。 画像の一例を示す図であり、画像における一般物体認識の一例を説明する図である。 画像の一例を示す図であり、図1に示す画像認識装置による一般物体認識を説明する図である。 図1に示す画像認識装置による一般物体認識を説明する他の図である。 図1に示す画像認識装置による一般物体認識の流れを示すフローチャートである。
〔実施形態1〕
以下、本発明の実施形態について、図1〜図5を用いて詳細に説明する。
まず、図1を用いて、本実施形態に係る画像認識装置1の構成を説明する。図1は、画像認識装置1の構成を示す機能ブロック図である。
図1に示すように、画像認識装置1は、画像取得部101、一般物体認識手段102、変更物体特定手段10、出力部106、および記憶部107を備えている。
画像取得部101は、画像認識装置1の外部、例えば画像撮影装置または画像のデータベースなどから画像を取得するものである。画像取得部101は、このように取得した画像を一般物体認識手段102に出力する。
一般物体認識手段102は、画像取得部101より出力された画像に対して、一般画像認識を実行するものである。詳細には、一般物体認識手段102は、上記画像に含まれる各物体について、形状・色・動作などに基づいて、その物体の種類を認識する。一般物体認識手段102によって認識された物体は、一般的に、1つまたは複数の認識候補を有することになる。ある物体の各認識候補は、その物体が該認識候補である確からしさ、すなわち信頼度を有する。
図2に、一般物体認識手段102により一般画像認識が実行される対象となる画像の一例を示す。同図において、楕円形の囲みで囲った8つの物体が、一般物体認識手段102により認識される。また、一般物体認識手段102は、8つの物体のそれぞれについて、認識候補を出力する。
変更物体特定手段10は、一般物体認識手段102による物体の認識結果を修正するものである。詳細には、変更物体特定手段10は、物体の認識結果の信頼度が低い変更物体について、その認識結果を修正し、より確からしい物体に特定する。なお、変更物体特定手段10の詳細については後述する。
出力部106は、変更物体特定手段10による画像の処理結果を外部に対して出力するものである。例えば、出力部106は、各種の画像アプリケーションに対して上記処理結果を出力してもよい。
記憶部107は、物体に対応付けられたペア情報のリストであるペア情報リストを記憶している。
(ペア情報について)
物体に対応付けられるペア情報には、特に制限は存在しないが、例えば以下のようにして決定してもよい。
データベースに記憶された撮影画像において、一般物体認識を行い、同一の画像中に存在していることが多い2つの確定物体について、一方の確定物体が、他方の確定物体のペア情報となる。
なお、上記一般物体認識の際には、(画像認識装置1よりも画像認識能力の高い)高性能な画像認識装置を用いて、上記データベース中の画像の画像認識を行うことが望ましい。これにより、画像中の物体が正しく特定されるため、正しく特定された確定物体を用いて、ペア情報を決定することができる。ここで、ペア情報を生成する際には、迅速な処理が要求されることは基本的にないないため、上記のように高性能な画像認識装置を用いることが可能である。
あるいは、一般的にまたは経験的に、組み合わせて使用されたり、ペアとして配置されたりすることが多い2つの物体について、一方の物体を他方の物体のペア情報としてもよい。
上記の構成では、机のペア情報リストには、例えば、椅子および人が含まれることになる。また、PC(パーソナルコンピュータ)のペア情報リストには、例えば、キーボードおよびマウスが含まれる。また、犬のペア情報リストには、例えば、エサ、首輪、および紐が含まれる。
(変更物体特定手段10)
図1に示すように、変更物体特定手段10は、変更物体選択手段103、ペア物体選択手段104、および認識処理手段105を含む構成である。
ここでは、変更物体特定手段10の各構成要素につき、その詳細を順に説明する。
(1.変更物体選択手段103)
変更物体選択手段103は、画像において、一般物体認識手段102によって認識された物体の中から、認識結果の変更を図る対象となる物体(以下、変更物体と称する)を選択するものである。
図3において、各物体について、一般物体認識手段102による認識結果が示されている。例えば、物体5について、認識候補(机、猫、犬)と各認識候補の信頼度を示すスコア(800、300、300)が示されている。
第1の実施例として、変更物体選択手段103は、所定の閾値を設定して、認識候補の信頼度を示すスコア(図3参照)の最大値が所定の閾値以下である表示物体を変更物体とする。例えば、上記閾値が500である場合、図3に示す画像では、物体4(最大スコア450)および物体6(最大スコア400)が変更物体となる。
このとき、変更物体選択手段103は、変更物体(物体4、物体6)以外の各物体を、それぞれの物体の最大スコアを有する認識候補として特定する。以後、特定された物体のことを確定物体と呼ぶ。
なお、画像全体において、上記閾値を超える表示物体が1つも存在しない場合、あるいは、画像において、スコアの最も大きい表示物体から所定の距離範囲内に存在する表示物体が1つも存在しない場合、変更物体選択手段103は、スコアが最も大きい表示物体のみを確定物体とし、それ以外の表示物体を変更物体としてもよい。
第2の実施例として、変更物体選択手段103は、一般物体認識手段102によって認識された全ての物体の最大スコアを有する認識候補同士を比較して、最もスコアの低い認識候補を特定し、その認識候補を有する物体を変更物体とする。この構成の場合、図3に示す画像では、最大スコア400の物体6が変更物体となる。
(2.ペア物体選択手段104)
ペア物体選択手段104は、変更物体選択手段103によって選択された変更物体のペアとする物体(以下、ペア物体と称する)を選択するものである。ある変更物体のペア物体は、その変更物体と同一の画像内にある確定物体の中から選択される、1つまたは複数の確定物体である。
(ペア物体選択処理の具体例)
以下に、ペア物体選択手段104によるペア物体選択処理の実施例を示す。
[実施例1]
ペア物体選択方法の一実施例では、ペア物体選択手段104は、画像において、変更物体の周囲にある確定物体のうち、最もスコアの大きい識別候補を有する物体を、上記変更物体のペア物体として選択する。
[実施例2]
ペア物体選択方法の他の実施例では、ペア物体選択手段104は、画像において、変更物体の最も近傍にある確定物体を、ペア物体として選択する。
これにより、変更物体により近い位置にあって、変更物体との関連がより大きいと考えられる確定物体を優先して、ペア物体として選択することができる。
例えば、図3において、物体6が変更物体である場合、第1に、画像において物体6に最も近い物体5がペア物体として選択される。なお、物体5をペア物体として用いて、物体6が特定されなかった場合、次に、画像において物体6に2番目に近い物体2が新たにペア物体として選択されてもよい。
[実施例3]
ペア物体選択方法の他の一実施例では、変更物体の周囲に複数の確定物体が存在している場合、ペア物体選択手段104は、上記複数の確定物体のうち、最多数の確定物体を、上記ペア物体として選択する。
例えば、図3に示す画像において、物体1〜物体5が確定物体であり、物体6が変更物体であるとする。ここで、物体1〜物体5は、それぞれ、物体1:人、物体2:人、物体3:机、物体4:椅子、物体5:机であると特定されている。
従って、物体1〜物体5において、2つの物体に対応する「人」(物体1、物体2)および「机」((物体3、物体5))が、最多数である。そのため、物体1、物体2、物体3、または物体5がペア物体となる。
例えば、ペア物体選択手段104は、物体1、物体2、物体3、および物体5の信頼度を参照して、最も高い信頼度を有する物体をペア物体として決定してもよい。
[実施例4]
ペア物体選択方法の他の一実施例では、ペア物体選択手段104は、画像中に複数の変更物体が存在する場合、認識候補の最大スコアが大きい変更物体の順で、ペア物体の選択を行う。すなわち、スコアのより高い認識候補を有する第1の変更物体と、スコアのより低い認識候補を有する第2の変更物体とがある場合、ペア物体選択手段104は、第2の変更物体のペア物体よりも、第1の変更物体のペア物体を先に選択する。その理由は以下のとおりである。
第1に、スコアの高い認識候補を有する変更物体は、一般物体認識手段102により正しく認識された認識候補を有している可能性が高い。そのため、スコアのより低い認識候補を有する第2の変更物体よりも、スコアのより高い認識候補を有する第1の変更物体の方が、認識処理手段105により正しく特定される可能性がより高い。
第2に、ペア物体選択手段104が、スコアの高い認識候補を有する第1の変更物体のペア物体を先に選択した場合、第2の変更物体のペア物体を選択する前に、第1の変更物体が特定されることになる。そのため、ペア物体選択手段104は、第2の変更物体のペア物体を選択する際に、特定済の第1の変更物体を、第2の変更物体のペア物体として用いることができる。
ところで、上述したように、第1の変更物体は、第2の変更物体と比較して、正しく特定される可能性が高い。そして、第1の変更物体が正しく特定されていた場合、特定済の第1の変更物体が有するペア情報には、第2の変更物体を正しく特定する情報が含まれている可能性が高い。
従って、第2の変更物体のペア物体を選択する際に、特定済の第1の変更物体をペア物体として選択した場合、認識処理手段105は、特定済の第1の変更物体が有するペア情報に基づき、第2の変更物体を正しく特定することができる可能性が高いことになる。
一方、ペア物体選択手段104が、スコアのより低い認識候補を有する第2の変更物体のペア物体を先に選択した場合、第2の変更物体は、誤って特定される可能性が高い。また、(第2の変更物体が誤って特定された後)第1の変更物体のペア物体を選択する際に、特定済の第2の変更物体をペア物体として選択した場合、認識処理手段105は、特定済の第2の変更物体が有するペア情報に基づき、第2の変更物体を正しく特定することが困難であると考えられる。
以上のことから、画像中に複数の変更物体が存在する場合、認識候補の最大スコアが大きい変更物体の順で、特定を行うことが望ましいことになる。
そこで、ペア物体選択手段104は、認識候補の最大スコアが大きい変更物体の順で、ペア物体を選択する。
例えば、図3に示す画像において、物体4および物体6が変更物体であるとする。このとき、物体4の最大スコア(450)は、物体6の最大スコア(400)よりも大きい。
そのため、まず、物体4について、ペア物体処理が実行される。その後、物体4が確定されたのち、物体4をペア物体として用いて、あるいは用いずに、物体6について、ペア物体処理が実行されることになる。
(認識処理手段105)
認識処理手段105は、ペア物体のペア情報を記憶部107より取得し、上記ペア情報を用いて、変更物体を特定するものである。
(変更物体特定処理の具体例)
以下に、認識処理手段105による変更物体特定処理の実施例を示す。
[実施例1]
変更物体特定処理の一実施例では、認識処理手段105は、スコアの高い認識候補の順で、変更物体の認識候補に対応するペア情報が、ペア物体のペア情報リストに含まれているか探索する。その後、認識処理手段105は、上記探索において検出された認識候補を、変更物体の識別結果として確定する。
本実施例について、図4を用いて説明する。ここで、同図の物体5および物体6は、図3に示された物体5および物体6と同じ物体である。
例えば、図4において、変更物体が物体6であり、ペア物体が物体5であるとする。そして、物体5は、図内に示すように、ペア情報として、「椅子」「筆箱」「鉛筆」「消しゴム」etc.を含むペア情報リストLを有しているとする。
この構成の場合、認識処理手段105は、物体6の最もスコアの高い認識候補である「犬」が、ペア物体である物体5のペア情報リストLに含まれているか探索する。ペア情報リストに「犬」が含まれていた場合、認識処理手段105は、変更物体が「犬」であると確定する。
一方、ペア情報リストに「犬」が含まれていなかった場合、認識処理手段105は、物体6の2番目にスコアの高い認識候補である「椅子」が、物体5のペア情報リストLに含まれているか探索する。以降の処理は、上述したのと同様に進められる。
[実施例2]
変更物体特定処理の他の実施例では、認識処理手段105は、ペア物体のペア情報リストに含まれる一番上のペア情報から順に、該ペア情報が変更物体の認識候補に含まれているか探索する。認識処理手段105は、上記探索において検出された認識候補として、変更物体を特定する。
例えば、図4において、変更物体が物体6であり、ペア物体が物体5である場合、認識処理手段105は、物体5のペア情報リストLにおいて、最も優先度の高いペア情報である「椅子」が、変更物体である物体6の認識候補に含まれているか探索する。そして、物体6の認識候補として「椅子」が含まれているので、物体6は「椅子」として特定される。
なお、物体6の認識候補に「椅子」が含まれていなかった場合、物体5の2番目に優先度の高いペア情報である「筆箱」が、物体6の認識候補に含まれているか探索されることになる。以降の処理は、上述したのと同様に進められる。
以上の処理により、図4に示す例では、変更物体である物体6が「椅子」と特定されることにより、一般物体認識手段102による物体6の認識結果(最大スコアの「犬」)が、「椅子」に修正される。
[変形例1;スコアの重み付け]
認識処理手段105は、上記実施例1または2において、ペア情報に対応する認識候補を検出した後、該認識候補として変更物体を特定する代わりに、該認識候補のスコアを(例えば1.5倍に)増加させるスコア変更を行ってもよい。
この構成の場合、認識処理手段105は、上記スコア変更を行った後において、スコアが最も高い認識候補として、変更物体を特定することになる。
例えば、図3では、検出された「椅子」のスコアを1.5倍して、350から525に変更する。その結果、「犬」(スコア:400)、「椅子」(スコア:525)、「人」(スコア:300)で、スコアが最も高くなった「椅子」として、変更物体6が特定される。
なお、認識処理手段105は、変更物体特定処理を実行する前に、変更物体の認識候補を予め減らしておいてもよい。具体的には、認識処理手段105は、変更物体特定処理を実行する前に、変更物体の認識候補の中から、所定の閾値を超えない認識候補を除外しておいてもよい。
例えば、図3では、物体6の認識候補として、「犬」(スコア:400)、「椅子」(スコア:350)、および「人」(スコア:300)が示されている。ここで、スコアの閾値を325とすれば、上記認識候補のうち、「人」が除外され、物体6の認識候補として「犬」および「椅子」が残ることになる。また、スコアの閾値を375とすれば、上記認識候補のうち、「人」および「椅子」が除外され、物体6の認識候補として「犬」のみが残ることになる。
(変更物体特定処理のフローチャート)
以下では、図3および図5を用いて、変更物体の変更物体特定処理について説明する。図5は、識別方法の流れを示すフローチャートである。
図5に示すように、まず、外部から画像取得部101に対して、図3に示す画像が入力される(S101)。次に、一般物体認識手段102によって、上記画像の一般物体認識が実行され、画像中の物体1〜物体6と、それら各々の認識候補とが取得される(S102)。
その後、変更物体選択手段103は、信頼度(スコア)に基づいて変更物体を選択する(S103)。詳細には、変更物体選択手段103は、画像中の物体1〜物体6のうち、認識候補の最大スコアが閾値以下である物体を変更物体として選択する。
変更物体選択手段103は、画像中に変更物体があるか判定する(S104)。画像中に変更物体がないと判定された場合(S104でNO)、認識処理手段105は、全ての表示物体について、各表示物体の最大のスコアを有する認識候補として特定した結果を出力する(S107)。
一方、画像中に変更物体があると判定された場合(S104でYES)、ペア物体選択手段104は、各変更物体のペア物体をそれぞれ選択する(S105)。
その後、認識処理手段105は、ペア物体のペア情報リストおよび認識候補の信頼度(スコア)に基づいて、変更物体を特定する(S106)。
変更物体が残っていなければ(S104でNO)、出力部106は、認識処理手段105による各表示物体の特定結果を、外部(例えば、画像アプリケーション)に出力する(S107)。
(特許文献1に記載の発明との差異)
特許文献1に記載された従来技術では、複数の単語が登録された単語登録情報に含まれる文字の出現回数に基づいて、各候補文字の重み付けを行い、その結果によって候補文字を候補から除外する。
従って、特許文献1に記載された技術は、本願発明に係る変更物体特定手段10とは異なり、信頼度(スコア)および閾値に基づいて、認識候補を評価するものではない。
そのため、変更物体特定手段10は、スコアの調整による認識候補の信頼度の変更、および閾値の変更による認識候補の削減などを行うことができる一方、特許文献1に記載された技術では、信頼度および/または閾値を利用して、認識候補を評価することはできないことになる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
〔ソフトウェアによる実現例〕
最後に、画像認識装置1の各ブロック、特に変更物体特定手段10は、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
後者の場合、画像認識装置1は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである画像認識装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記画像認識装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、一時的でない有形の媒体(non-transitory tangible medium)、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM/EEPROM(登録商標)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、画像認識装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、画像に写る表示物体を認識する画像認識装置等に利用することができる。
1 画像認識装置
103 変更物体選択手段
104 ペア物体選択手段
105 認識処理手段

Claims (13)

  1. 画像に写る表示物体の種類を認識し、上記表示物体の種類の認識結果としての確からしさを示す信頼度をそれぞれ有する1つまたは複数の認識候補を取得する画像認識装置において、
    上記表示物体の中から、上記認識結果を修正する対象となる1つまたは複数の変更物体を選択するとともに、上記認識結果を修正する対象ではない確定物体の種類を、上記1つまたは複数の認識候補のうちで最大の信頼度を有する認識候補の種類に確定する変更物体選択手段と、
    上記表示物体のうち、上記確定物体の中から、上記変更物体のペアとなるペア物体を選択するペア物体選択手段と、
    上記ペア物体の種類に関連付けられている物体の種類を示すペア情報リストに基づき、上記変更物体の認識結果を修正し、上記変更物体を特定する認識処理手段とを備えたことを特徴とする画像認識装置。
  2. 上記変更物体選択手段は、上記表示物体のうち、上記1つまたは複数の認識候補の最大信頼度が所定の閾値よりも低い表示物体を、上記変更物体として選択することを特徴とする請求項1に記載の画像認識装置。
  3. 上記変更物体選択手段は、上記表示物体のうち、上記1つまたは複数の認識候補の最大信頼度が最も低い表示物体を、上記変更物体として選択することを特徴とする請求項1に記載の画像認識装置。
  4. 上記変更物体選択手段は、上記画像において、上記確定物体が存在しない場合、上記変更物体を、該変更物体の最も信頼度の高い認識候補として特定することを特徴とする請求項1〜3のいずれか1項に記載の画像認識装置。
  5. 上記ペア物体選択手段は、上記画像において、複数の確定物体が存在する場合、上記信頼度が最も高い確定物体を、上記ペア物体として選択することを特徴とする請求項1〜4のいずれか1項に記載の画像認識装置。
  6. 上記ペア物体選択手段は、上記画像において、複数の確定物体が存在する場合、上記変更物体に最も近い位置に表示された確定物体を、上記ペア物体として選択することを特徴とする請求項1〜4のいずれか1項に記載の画像認識装置。
  7. 上記ペア物体選択手段は、上記画像において、複数の確定物体が存在する場合、上記複数の確定物体のうち、最多数の同一種類の確定物体のいずれかを、上記ペア物体として選択することを特徴とする請求項1〜4のいずれか1項に記載の画像認識装置。
  8. 上記認識処理手段は、上記変更物体の認識候補において、上記信頼度の高い認識候補から順に、該認識候補に対応するペア情報が上記ペア情報リストに含まれているか探索し、該認識候補に対応するペア情報を検出した場合、上記変更物体を該ペア情報として特定することを特徴とする請求項1〜7のいずれか1項に記載の画像認識装置。
  9. 上記認識処理手段は、上記ペア情報リストにおいて優先度が高いペア情報から順に、該ペア情報に対応する認識候補が上記変更物体の認識候補として含まれているか探索し、該物体に対応する認識候補を検出した場合、上記変更物体を該ペア情報として特定することを特徴とする請求項1〜7のいずれか1項に記載の画像認識装置。
  10. 上記認識処理手段は、上記ペア情報リストを参照して、上記ペア情報リストに含まれるペア情報に対応する認識候補の信頼度が大きくなるように、上記変更物体の認識候補の信頼度に対して重み付けを行った後、上記変更物体を、上記変更物体の認識候補のうち、最も信頼度の高い認識候補として特定することを特徴とする請求項1〜7のいずれか1項に記載の画像認識装置。
  11. 請求項1から10のいずれか1項に記載の画像認識装置としてコンピュータを機能させるための画像認識プログラムであって、コンピュータを上記各手段として機能させるための画像認識プログラム。
  12. 請求項11に記載の画像認識プログラムを記録したコンピュータ読み取り可能な記録媒体。
  13. 画像に写る表示物体の種類を認識し、上記表示物体の種類の認識結果としての確からしさを示す信頼度をそれぞれ有する1つまたは複数の認識候補を取得する画像認識方法において、
    上記表示物体の中から、上記認識結果を修正する対象となる1つまたは複数の変更物体を選択するとともに、上記認識結果を修正する対象ではない確定物体の種類を、上記1つまたは複数の認識候補のうちで最大の信頼度を有する認識候補の種類に確定する変更物体選択ステップと、
    上記表示物体のうち、上記確定物体の中から、上記変更物体のペアとなるペア物体を選択するペア物体選択ステップと、
    上記ペア物体の種類に関連付けられている物体の種類を示すペア情報リストに基づき、上記変更物体の認識結果を修正し、上記変更物体を特定する認識処理ステップとを含むことを特徴とする画像認識方法。
JP2013084370A 2013-04-12 2013-04-12 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法 Active JP6127676B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2013084370A JP6127676B2 (ja) 2013-04-12 2013-04-12 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法
EP14161123.6A EP2790129A3 (en) 2013-04-12 2014-03-21 Image recognition device, recording medium, and image recognition method
CN201410109852.4A CN104102930B (zh) 2013-04-12 2014-03-24 图像识别装置及图像识别方法
US14/223,411 US9396407B2 (en) 2013-04-12 2014-03-24 Image recognition device, recording medium, and image recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013084370A JP6127676B2 (ja) 2013-04-12 2013-04-12 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法

Publications (2)

Publication Number Publication Date
JP2014206878A JP2014206878A (ja) 2014-10-30
JP6127676B2 true JP6127676B2 (ja) 2017-05-17

Family

ID=50396870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013084370A Active JP6127676B2 (ja) 2013-04-12 2013-04-12 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法

Country Status (4)

Country Link
US (1) US9396407B2 (ja)
EP (1) EP2790129A3 (ja)
JP (1) JP6127676B2 (ja)
CN (1) CN104102930B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107113377A (zh) * 2015-02-10 2017-08-29 奥林巴斯株式会社 图像处理装置、图像处理方法、图像处理程序以及存储介质
US9740951B2 (en) * 2015-09-11 2017-08-22 Intel Corporation Technologies for object recognition for internet-of-things edge devices
KR101771044B1 (ko) * 2015-11-27 2017-08-24 연세대학교 산학협력단 공간-물체 관계 그래프에 기반한 객체 인식 방법 및 그 장치
JP6698864B2 (ja) * 2016-11-08 2020-05-27 三菱電機株式会社 物体検知装置および物体検知方法
JP6909022B2 (ja) * 2017-03-13 2021-07-28 テックファーム株式会社 プログラム、情報端末、情報表示方法及び情報表示システム
US10942816B1 (en) * 2018-09-06 2021-03-09 NortonLifeLock Inc. Systems and methods for dynamically adjusting a backup policy
FR3094115B1 (fr) * 2019-03-22 2021-02-26 Idemia Identity & Security France Procede d’identification de bagages

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6819783B2 (en) * 1996-09-04 2004-11-16 Centerframe, Llc Obtaining person-specific images in a public venue
JP2000011095A (ja) 1998-06-19 2000-01-14 Canon Inc 文字認識装置及び方法
US6287197B1 (en) * 1998-08-18 2001-09-11 Midway Games Inc. Video game with randomly generated images
CN1327217A (zh) * 2000-06-02 2001-12-19 郭华 计算机视觉
JP4704601B2 (ja) * 2000-11-01 2011-06-15 富士通株式会社 文字認識方法,プログラム及び記録媒体
US7137076B2 (en) * 2002-07-30 2006-11-14 Microsoft Corporation Correcting recognition results associated with user input
JP4098021B2 (ja) * 2002-07-30 2008-06-11 富士フイルム株式会社 シーン識別方法および装置ならびにプログラム
JP2006031099A (ja) * 2004-07-12 2006-02-02 Fujitsu Ltd 文字認識をコンピュータに行なわせるためのコンピュータ実行可能なプログラム
EP1780651A1 (en) * 2005-10-25 2007-05-02 Bracco Imaging, S.P.A. Method and system for automatic processing and evaluation of images, particularly diagnostic images
JP5107157B2 (ja) 2008-06-30 2012-12-26 富士通フロンテック株式会社 文字認識プログラム、文字認識装置および文字認識方法
JP2011128992A (ja) * 2009-12-18 2011-06-30 Canon Inc 情報処理装置およびその処理方法
CN101944181A (zh) * 2010-06-10 2011-01-12 复旦大学 一种模式分类模型由抽象到具体AtoC模型
US8724908B2 (en) * 2010-09-03 2014-05-13 Adobe Systems Incorporated System and method for labeling a collection of images

Also Published As

Publication number Publication date
CN104102930A (zh) 2014-10-15
US9396407B2 (en) 2016-07-19
CN104102930B (zh) 2017-07-28
JP2014206878A (ja) 2014-10-30
US20140307974A1 (en) 2014-10-16
EP2790129A3 (en) 2017-03-29
EP2790129A2 (en) 2014-10-15

Similar Documents

Publication Publication Date Title
JP6127676B2 (ja) 画像認識装置、画像認識プログラム、記録媒体、および画像認識方法
CN104350509B (zh) 快速姿势检测器
JP6208383B2 (ja) プレビューモードにおける画像キャプチャリングパラメータ調整
CN105426857B (zh) 人脸识别模型训练方法和装置
US11341770B2 (en) Facial image identification system, identifier generation device, identification device, image identification system, and identification system
US20210064871A1 (en) Apparatus and method for recognition of text information
US9613296B1 (en) Selecting a set of exemplar images for use in an automated image object recognition system
RU2016113791A (ru) Способ и устройство для построения шаблона и способ и устройство для идентификации информации
US20190188729A1 (en) System and method for detecting counterfeit product based on deep learning
US9082000B2 (en) Image processing device and image processing method
US20200380286A1 (en) Automatic optical character recognition (ocr) correction
US20200242398A1 (en) Information processing method and information processing system
US20150269135A1 (en) Language identification for text in an object image
JP2020046819A (ja) 情報処理装置及びプログラム
JP2018032340A (ja) 属性推定装置、属性推定方法および属性推定プログラム
CN110633027A (zh) 一种点读实现方法、系统、计算机设备和存储介质
JP2016103759A (ja) 画像処理装置、画像処理方法、及びプログラム
EP3143548B1 (en) Tagging visual media on a mobile device
KR20150108577A (ko) 식별을 위해 확장된 영역에 대한 특징을 수집하는 학습 장치 및 방법 및 컴퓨터 프로그램이 기록된 기록매체
JP2016015018A (ja) サービス提供装置、方法、及びプログラム
US9972080B2 (en) Apparatus and method for food search service
US9760764B2 (en) Methods, apparatuses and computer program products for efficiently recognizing faces of images associated with various illumination conditions
CN108062301A (zh) 文字翻译方法及其装置
CN109635810A (zh) 一种确定文本信息的方法、装置、设备及存储介质
US9076035B2 (en) Image processor, image processing method, control program, and recording medium

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151023

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20151028

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160304

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160527

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170327

R150 Certificate of patent or registration of utility model

Ref document number: 6127676

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250