JP2005215988A - パターン認識用学習方法、パターン認識用学習装置、画像入力装置、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 - Google Patents
パターン認識用学習方法、パターン認識用学習装置、画像入力装置、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2005215988A JP2005215988A JP2004021823A JP2004021823A JP2005215988A JP 2005215988 A JP2005215988 A JP 2005215988A JP 2004021823 A JP2004021823 A JP 2004021823A JP 2004021823 A JP2004021823 A JP 2004021823A JP 2005215988 A JP2005215988 A JP 2005215988A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- feature
- pattern recognition
- image data
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
Landscapes
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Input (AREA)
- Image Processing (AREA)
Abstract
【解決手段】 異なる種類の物体画像データの集合を、画像入力部111により入力し、入力した各物体画像データから所定の幾何学的構造を有する局所的特徴を、局所特徴検出部1120により検出し、検出した複数の局所的特徴を、クラスタリング1121によりクラスタリングし、クラスタリングした結果に基づき、複数の代表局所特徴を、特徴選択部1122により選択し、選択した代表局所特徴を教師データとして含む学習用データセットを用いて、前記物体画像データに基づく物体を認識または検出するための学習を、学習制御部113により行う。
【選択図】 図11
Description
また、前記特許文献1及び前記非特許文献2ないし4などに例示される認識アルゴリズムは、いずれも、認識対象のサイズや向きの変動などにロバスト(robust)であるとういう要件と、複数の異なるカテゴリの対象の検出・認識に適用可能であるという要件とを満たすことが困難であるという問題点があった。
また、抽出した局所特徴の組み合わせにより得られる更に複雑な特徴を適切に抽出することができるようにすることを第2の目的とする。
また、複数のカテゴリに属する物体の認識や検出を、認識対象の変動の影響を可及的に受けずに、効率的に行うことができるようにすることを第3の目的とする。
本発明のコンピュータ読み取り可能な記録媒体は、前記記載のコンピュータプログラムを記録したことを特徴とする。
また、本発明のその他の特徴によれば、特徴検出層と特徴プーリング層とを交互に含む畳み込み神経回路網における、所定の階層レベルに、学習用データを与えて教師付き学習を行うようにしたので、畳み込み神経回路網の特徴検出ニューロンの受容野を教師付き学習により形成することができる。
また、本発明のその他の特徴によれば、学習用データセットとして、前記画像入力ステップにより入力された物体画像データの特徴量に所定の正規化を行って得られるデータを用いるようにしたので、複数のカテゴリに属する物体の認識や検出を、認識対象の変動の影響を可及的に受けずに行うことができる。
以下、図面を用いて本発明の第1の実施形態を詳細に説明する。
(全体構成概要)
図1は、本実施形態で用いるパターン認識用学習装置を組み込んだパターン認識装置の主要な構成要素をなす、パターン検出・認識を行うための並列階層処理ネットワークの全体構成の一例を模式的に示す図である。このパターン認識装置では、対象または幾何学的特徴などの認識(検出)に関与する情報を主として扱う。
図11において、パターン認識装置は、画像入力部111と、画像認識部112と、学習制御部113と、局所的特徴検出部1120と、局所的特徴検出部1120における局所的特徴の検出結果に対してクラスタリング(clustering)処理を行うクラスタリング部1121と、クラスタリング部1121におけるクラスタリング処理の結果に基づいて代表的局所特徴を選択する特徴選択部1122とを要部として含む。
画像認識部112は、画像入力部111で入力された画像データを認識するために、階層的特徴抽出処理を行う。
クラスタリング部1121は、局所的特徴検出部1120で抽出された複数の局所特徴データについて、自己組織化マップなどの手法により、クラスタリングを行って、複数の特徴クラスに分類する。
学習制御部113は、特徴選択部1122により選択された代表的局所特徴を、画像認識部112の学習用データ(教師データの一部)として用い、後で説明する教師付き学習を行う。
最初の特徴検出層102A((1,0))は、複数の解像度の画像を入力する。そして、画像パターンの局所的な低次の特徴(幾何学的特徴のほかに色成分特徴を含んでもよい)を、全画面の各位置(或いは、全画面にわたる所定のサンプリング点の各点)において、各画面の同一箇所で検出する。この検出は、複数のスケールレベル又は複数の解像度で行うとともに、特徴カテゴリの数だけ行う。特徴検出層102A((1,0))は、特徴量の種類(例えば、幾何学的特徴として所定方向の線分を抽出する場合にはその幾何学的構造である線分の傾き)に応じた受容野構造を有するニューロン素子から構成される。
入力データ上の所定位置(或いはその位置を中心とする局所領域)での複数の幾何学的特徴に関する特徴プーリング層103内のニューロンは、互いに隣接して配置されており、各ニューロンは、より上位の特徴検出層のニューロンへの結合をなしている。
各ニューロンは、分布重み係数と画像データとの積和入力を行って得られる結果に対して非線型squashing関数(典型的にはいわゆるLogistic関数または双曲正接関数)となる出力を行うが、他の非線形関数(例えば非単調関数など)となる出力を行ってもよい。
特徴検出層(1,0)の各ニューロン(または複数ニューロンからなる各グループ)は、所定の空間フィルタ機能を有する。また、この特徴検出層(1,0)では、スケールレベル(解像度)が一定で方向選択性の異なる複数の畳み込み演算カーネルに対応する受容野構造を有するニューロンからなる複数のニューロン集団を一まとめにして一つのチャネルを形成する。
特徴プーリング層((2,0)、(2,1)、・・・)のニューロンについて説明する。
図1に示すごとく特徴検出層(例えば、特徴検出層(1,0)から特徴プーリング層(例えば、特徴プーリング層(2,0))への結合は、当該特徴プーリング層のニューロンの受容野内にある前段の特徴検出層の同一特徴要素(タイプ)のニューロンから興奮性結合の入力を受けるように構成される。また、特徴プーリング層のニューロンは、前述したごとく、特徴カテゴリごとの局所平均化や、最大値検出によるサブサンプリング等を行う機能を有している。
すなわち、特徴プーリング層のニューロンは、同一種類の特徴検出層のニューロンから複数の信号を入力し、それらを局所的な領域(受容野)で統合して平均化する(或いは、受容野内での最大値等の代表値を算出する)ことにより、その特徴の位置のゆらぎや、変形に対しても確実に特徴を検出することができる。
次に、本発明の主眼であるパターン認識のための有用な局所特徴の選択処理の手順の一例について、図2に示すフローチャートを参照して説明する。
先ず、種類、大きさ、向き、撮影条件などの異なる様々な物体クラスを含む入力画像データの集合(各入力画像データ)に対して、いわゆるインテレスト・オペレータなどを作用させ、局所特徴を検出する(ステップS1)。
本実施形態で用いるパターン認識装置の要部をなす畳み込み神経回路(Convolutional Neural Network:以下、必要に応じてCNNと称する)の第2階層レベルにおける特徴検出層の各モジュールのニューロンが、教師信号として選択された局所特徴の画像データに選択的に反応するように、それぞれのモジュールに対して、教師付き学習を誤差逆伝播法(Back Propagation:以下、必要に応じてBPと称する)により行う(ステップS41〜S43)。この場合、正解用の学習画像として選択された局所特徴の画像データを用いるとともに、不正解用の学習画像としてそれ以外の異なるクラスなどの画像データを用いる。
階層レベルが2以上(最下位層レベルより上)の特徴検出モジュールにおいては、その階層レベルより下の結合(各ニューロンの受容野構造)を固定し(ステップS44)、当該特徴検出モジュールのニューロンの結合パターンだけを可変として、その階層レベルと1つ下の階層レベルとの間の結合の教師付き学習を行う(ステップS45)。これを順に上位の階層レベルについて行うようにして、全ての階層に対して学習を実行する(ステップS46、S47)。
なお、畳み込み神経回路(CNN)では、受容野構造は、同じクラスの特徴カテゴリを検出するニューロン間で共有される(即ち、同一モジュールに属するニューロンは同じ受容野構造を有する)。
教師データは、入力データと出力データとのペアであるデータセットであって、そのモジュールが検出予定の局所特徴の画像データセットを入力画像とした場合には、ニューロンの出力データとして発火状態に対応する値(例えば1)が与えられ、検出予定以外の画像データを入力した場合には、出力データとして非発火状態に対応する値(例えば−1)が与えられる。
また、モジュールごとの学習により求められた図形アルファベットおよび中間特徴クラスを用いて、畳み込み神経回路網の特徴検出ニューロンの受容野を教師付き学習により形成することができる。
次に、本発明の第2の実施形態について説明する。なお、前述した第1の実施形態と同一の部分についての詳細な説明を省略する。
本実施形態における学習手順の一例を図5に示すフローチャートを参照して説明する。
ここでは、第1の実施形態で用いた畳み込み神経回路(CNN)において、複数の異なるカテゴリの物体に関する画像データ(例えば、人物の顔や車の画像など)を用いて、第2階層レベル以下の学習を第1の実施形態と同様に行う(ステップS51〜S53)。
その結果、指定されたカテゴリの物体を検出することが可能な特徴検出モジュールが、最上位の特徴検出層に形成されるとともに、第2階層レベルより上位の中間層(特徴検出層)には、中間特徴の検出モジュールが自動的に生成される。
次に、本発明の第3の実施形態について説明する。なお、前述した第1及び第2の実施形態と同一の部分についての詳細な説明を省略する。
本実施形態では、選択された局所特徴の組み合わせにより得られる更に複雑な特徴であって、認識対象を構成する有用な中間的局所特徴を自動的に抽出する方法および装置の構成を示す。
第1及び第2の実施形態で示した畳み込み神経回路(CNN)の学習により生成された最下位層もしくは第2階層レベルで検出される局所特徴の集合(これらを図形アルファベットという)から複数の特徴を選択し、それらの所定の局所的空間配置によって得られる中間レベル図形パターンの集合(パターン認識における一種のボキャブラリイのようなもの)も、異なるカテゴリの物体検出/認識の分野において同様に有用であると考えられる。
先ず、第1の実施形態と同様に、様々な物体クラスを含む画像データセットからインテレスト・オペレータ等を用いて局所特徴の集合を抽出し(ステップS61)、正規化処理(ステップS62)を行った後、ベクトル量子化や自己組織化マップなどによるクラスタリング(ステップSS63)を行い、更に少数の有用な局所特徴のクラスを選択する(ステップS64)。
以上のように、本実施形態で説明した学習を行うことにより、求められた図形アルファベットの所定の空間配置関係により特定される上位の(より複雑な)中間特徴(または高次特徴)であって、特定の物体の検出や認識に有用な特徴クラスを自動的に求めることができる。
図10は、図11に示した構成を基本要素とする、前述した第1〜第3実施形態のパターン認識装置を搭載した撮像装置の構成の概要を示すブロック図である。
図10の撮像装置9は、撮影レンズおよびズーム撮影用駆動制御機構を含む結像光学系92、CCD又はCMOSイメージセンサー93、撮像パラメータ計測部94、映像信号処理回路95、記憶部96、撮像動作の制御や、撮像条件の制御などを行うための制御用信号を発生する制御信号発生部97、EVFなどファインダーを兼ねた表示ディスプレイ98、ストロボ発光部99、記録媒体910、及び被写体検出(認識)部911(前述した各実施形態での階層構造を持った並列パルス信号処理回路からなるパターン認識装置)などを具備する。
なお、図10では、撮像装置にパターン認識装置を搭載する場合について例示したが、撮像装置とは異なるスキャナー等の画像入力装置に、パターン認識装置を搭載するようにしてもよい。
前述した実施形態の機能を実現するべく各種のデバイスを動作させるように、該各種デバイスと接続された装置あるいはシステム内のコンピュータに対し、前記実施形態の機能を実現するためのソフトウェアのプログラムコードを供給し、そのシステムあるいは装置のコンピュータ(CPUあるいはMPU)に格納されたプログラムに従って前記各種デバイスを動作させることによって実施したものも、本発明の範疇に含まれる。
92 結像光学系
93 CCD又はCMOSイメージセンサー
94 撮像パラメータ計測部
95 映像信号処理回路
96 記憶部
97 制御信号発生部
98 表示ディスプレイ
99 ストロボ発光部
101 データ入力層
102 特徴検出層
103 特徴統合層
910 記録媒体
911 被写体検出(認識)部
Claims (27)
- 異なる種類の物体画像データの集合を入力する画像入力ステップと、
前記画像入力ステップにより入力された各物体画像データから所定の幾何学的構造を有する局所的特徴を検出する局所的特徴検出ステップと、
前記局所的特徴検出ステップにより検出された複数の局所的特徴を所定の方法によりクラスタリングするクラスタリングステップと、
前記クラスタリングステップによりクラスタリングされた結果に基づき、複数の代表局所特徴を選択する特徴選択ステップと、
前記特徴選択ステップにより選択された前記代表局所特徴を教師データとして含む学習用データセットを用いて、前記物体画像データに基づく物体を認識または検出するための学習を行う学習ステップとを有することを特徴とするパターン認識用学習方法。 - 前記学習ステップにより学習された結果に基づいて、前記物体画像データに基づく物体を認識または検出する画像認識ステップを有することを特徴とする請求項1に記載のパターン認識用学習方法。
- 前記物体画像データに基づく物体を認識または検出するために、階層的並列処理を、神経回路網を用いて行う画像認識ステップを有し、
前記代表的特徴は、所定の階層レベルの前記局所的特徴に関するものであることを特徴とする請求項1に記載のパターン認識用学習方法。 - 前記クラスタリングステップは、前記局所的特徴検出ステップにより検出された複数の局所的特徴を、ベクトル量子化または自己組織化マップを用いてクラスタリングすることを特徴とする請求項1に記載のパターン認識用学習方法。
- 前記物体画像データに基づく物体を認識または検出するために、階層的並列処理を、畳み込み神経回路網を用いて行う画像認識ステップを有し、
前記畳み込み神経回路網は、特徴検出層と特徴プーリング層とを交互に含み、
前記学習ステップは、前記畳み込み神経回路網における、所定の階層レベルに、学習用データを与えて教師付き学習を行うことを特徴とする請求項1に記載のパターン認識用学習方法。 - 前記局所的特徴検出ステップは、インテレスト・オペレータを用いて、前記局所的特徴を検出することを特徴とする請求項1に記載のパターン認識用学習方法。
- 前記学習ステップは、前記畳み込み神経回路網の所定の階層にある特定の特徴検出モジュールのニューロンに対して、前記学習用データを与えて、前記教師付き学習を行うことを特徴とする請求項5に記載のパターン認識用学習方法。
- 前記学習ステップは、前記畳み込み神経回路網における所定の階層レベル以下の結合を固定するとともに、前記所定の階層レベルより上の階層レベルのニューロンに対して、前記学習用データを与えて、前記教師付き学習を行うことを特徴とする請求項5に記載のパターン認識用学習方法。
- 前記学習ステップは、前記畳み込み神経回路網における所定の階層レベルの特徴検出モジュールのニューロンと、その前段の階層レベルの特徴検出ニューロンとの間で、前記学習を行うことを特徴とする請求項5に記載のパターン認識用学習方法。
- 前記学習ステップは、前記選択された複数の代表的局所特徴の組み合わせの空間配置に基づき指定される所定の特徴を検出するように、前記学習を行うことを特徴とする請求項1に記載のパターン認識用学習方法。
- 前記学習ステップは、前記学習用データセットとして、前記画像入力ステップにより入力された物体画像データの特徴量に所定の正規化を行って得られるデータを用いることを特徴とする請求項1に記載のパターン認識用学習方法。
- 前記異なる種類の物体画像データは、同一のカテゴリに属する物体画像データであって、物体のサイズ、向き、コントラスト、及び色バランスの少なくとも一つの特性が異なることを特徴とする請求項1に記載のパターン認識用学習方法。
- 異なる種類の物体画像データの集合を入力する画像入力手段と、
前記画像入力手段により入力された各物体画像データから所定の幾何学的構造を有する局所的特徴を検出する局所的特徴検出手段と、
前記局所的特徴検出手段により検出された複数の局所的特徴を所定の方法によりクラスタリングするクラスタリング手段と、
前記クラスタリング手段によりクラスタリングされた結果に基づき、複数の代表局所特徴を選択する特徴選択手段と、
前記特徴選択手段により選択された前記代表局所特徴を教師データとして含む学習用データセットを用いて、前記物体画像データに基づく物体を認識または検出するための学習を行う学習手段とを有することを特徴とするパターン認識用学習装置。 - 前記学習手段により学習された結果に基づいて、前記物体画像データに基づく物体を認識または検出する画像認識ステップを有することを特徴とする請求項13に記載のパターン認識用学習装置。
- 前記物体画像データに基づく物体を認識または検出するために、階層的並列処理を、神経回路網を用いて行う画像認識手段を有し、
前記代表的特徴は、所定の階層レベルの前記局所的特徴に関するものであることを特徴とする請求項13に記載のパターン認識用学習装置。 - 前記クラスタリング手段は、前記局所的特徴検出手段により検出された複数の局所的特徴を、ベクトル量子化または自己組織化マップを用いてクラスタリングすることを特徴とする請求項13に記載のパターン認識用学習装置。
- 物体画像データに基づく物体を認識または検出するために、階層的並列処理を、畳み込み神経回路網を用いて行う画像認識手段を有し、
前記畳み込み神経回路網は、特徴検出層と特徴プーリング層とを交互に含み、
前記学習手段は、前記畳み込み神経回路網における、所定の階層レベルに、学習用データを与えて教師付き学習を行うことを特徴とする請求項13に記載のパターン認識用学習装置。 - 前記局所的特徴検出手段は、インテレスト・オペレータを用いて、前記局所的特徴を検出することを特徴とする請求項13に記載のパターン認識用学習装置。
- 前記学習手段は、前記畳み込み神経回路網の所定の階層にある特定の特徴検出モジュールのニューロンに対して、前記学習用データを与えて、前記教師付き学習を行うことを特徴とする請求項16に記載のパターン認識用学習装置。
- 前記学習手段は、前記畳み込み神経回路網における所定の階層レベル以下の結合を固定するとともに、前記所定の階層レベルより上の階層レベルのニューロンに対して、前記学習用データを与えて、前記教師付き学習を行うことを特徴とする請求項16に記載のパターン認識用学習装置。
- 前記学習手段は、前記畳み込み神経回路網における所定の階層レベルの特徴検出モジュールのニューロンと、その前段の階層レベルの特徴検出ニューロンとの間で、前記学習を行うことを特徴とする請求項16に記載のパターン認識用学習装置。
- 前記学習手段は、前記選択された複数の代表的局所特徴の組み合わせ空間配置に基づき指定される所定の特徴を検出するように、前記学習を行うことを特徴とする請求項13に記載のパターン認識用学習装置。
- 前記学習手段は、前記学習用データセットとして、前記画像入力手段により入力された物体画像データの特徴量に所定の正規化を行って得られるデータを用いることを特徴とする請求項13に記載のパターン認識用学習装置。
- 前記異なる種類の物体画像データは、同一のカテゴリに属する物体画像データであって、物体のサイズ、向き、コントラスト、及び色バランスの少なくとも一つの特性が異なることを特徴とする請求項13に記載のパターン認識用学習装置。
- 請求項13〜24の何れか1項に記載の前記パターン認識用学習装置を有することを特徴とする画像入力装置。
- 異なる種類の物体画像データの集合を入力する画像入力ステップと、
前記画像入力ステップにより入力された各物体画像データから所定の幾何学的構造を有する局所的特徴を検出する局所的特徴検出ステップと、
前記局所的特徴検出ステップにより検出された複数の局所的特徴を所定の方法によりクラスタリングするクラスタリングステップと、
前記クラスタリングステップによりクラスタリングされた結果に基づき、複数の代表局所特徴を選択する特徴選択ステップと、
前記特徴選択ステップにより選択された前記代表局所特徴を教師データとして含む学習用データセットを用いて、前記物体画像データに基づく物体を認識または検出するための学習を行う学習ステップとをコンピュータに実行させることを特徴とするコンピュータプログラム。 - 前記請求項26に記載のコンピュータプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004021823A JP4532915B2 (ja) | 2004-01-29 | 2004-01-29 | パターン認識用学習方法、パターン認識用学習装置、画像入力装置、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 |
US11/044,188 US7697765B2 (en) | 2004-01-29 | 2005-01-28 | Learning method and device for pattern recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004021823A JP4532915B2 (ja) | 2004-01-29 | 2004-01-29 | パターン認識用学習方法、パターン認識用学習装置、画像入力装置、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005215988A true JP2005215988A (ja) | 2005-08-11 |
JP4532915B2 JP4532915B2 (ja) | 2010-08-25 |
Family
ID=34857612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004021823A Expired - Fee Related JP4532915B2 (ja) | 2004-01-29 | 2004-01-29 | パターン認識用学習方法、パターン認識用学習装置、画像入力装置、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7697765B2 (ja) |
JP (1) | JP4532915B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009519532A (ja) * | 2005-12-16 | 2009-05-14 | エヌ・シー・アール・コーポレイション | 銀行券の確認 |
JP2013069132A (ja) * | 2011-09-22 | 2013-04-18 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2013196682A (ja) * | 2012-03-16 | 2013-09-30 | Nec (China) Co Ltd | 人の集団検出方法、及び人の集団検出装置 |
JP2015036939A (ja) * | 2013-08-15 | 2015-02-23 | 富士ゼロックス株式会社 | 特徴抽出プログラム及び情報処理装置 |
JP2016033806A (ja) * | 2014-05-15 | 2016-03-10 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
WO2017073373A1 (ja) * | 2015-10-30 | 2017-05-04 | 株式会社モルフォ | 学習システム、学習装置、学習方法、学習プログラム、教師データ作成装置、教師データ作成方法、教師データ作成プログラム、端末装置及び閾値変更装置 |
JP2018506788A (ja) * | 2015-04-03 | 2018-03-08 | 三菱電機株式会社 | 物体の再同定の方法 |
WO2018229594A1 (ja) * | 2017-06-14 | 2018-12-20 | 株式会社半導体エネルギー研究所 | 撮像装置、及び電子機器 |
CN110969173A (zh) * | 2018-09-28 | 2020-04-07 | 杭州海康威视数字技术股份有限公司 | 目标分类方法及装置 |
JP2020530925A (ja) * | 2017-08-01 | 2020-10-29 | スリーエム イノベイティブ プロパティズ カンパニー | 画像の多様化及び認識のためのニューラルスタイル変換 |
WO2021243205A1 (en) * | 2020-05-29 | 2021-12-02 | Motion2Ai | Method and system for geo-semantic recognition of structural object |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7028271B2 (en) * | 2002-11-06 | 2006-04-11 | Canon Kabushiki Kaisha | Hierarchical processing apparatus |
JP4507679B2 (ja) * | 2004-04-21 | 2010-07-21 | 富士ゼロックス株式会社 | 画像認識装置、画像抽出装置、画像抽出方法及びプログラム |
US20080013794A1 (en) * | 2004-09-08 | 2008-01-17 | Koninklijke Philips Electronics, N.V. | Feature Extraction Algorithm for Automatic Ear Recognition |
US8306277B2 (en) | 2005-07-27 | 2012-11-06 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method, and computer program for causing computer to execute control method of image processing apparatus |
US20070156347A1 (en) * | 2005-12-30 | 2007-07-05 | Searete Llc | Using a biological recording to obtain time values |
JP4314266B2 (ja) * | 2006-11-22 | 2009-08-12 | キヤノン株式会社 | 画像制御装置及びその制御方法 |
JP5184824B2 (ja) * | 2007-06-15 | 2013-04-17 | キヤノン株式会社 | 演算処理装置及び方法 |
KR101465668B1 (ko) * | 2008-06-24 | 2014-11-26 | 삼성전자주식회사 | 단말 및 그의 블로깅 방법 |
CN101635763A (zh) * | 2008-07-23 | 2010-01-27 | 深圳富泰宏精密工业有限公司 | 图片分类系统及方法 |
TW201013546A (en) * | 2008-09-19 | 2010-04-01 | Altek Corp | Hierarchical face recognition training method and hierarchical face recognition method thereof |
JP5414416B2 (ja) * | 2008-09-24 | 2014-02-12 | キヤノン株式会社 | 情報処理装置及び方法 |
JP2011154501A (ja) * | 2010-01-27 | 2011-08-11 | Sony Corp | 学習装置、学習方法、識別装置、識別方法、プログラム、及び情報処理システム |
JP2011186519A (ja) * | 2010-03-04 | 2011-09-22 | Sony Corp | 情報処理装置、情報処理方法およびプログラム |
US9053562B1 (en) | 2010-06-24 | 2015-06-09 | Gregory S. Rabin | Two dimensional to three dimensional moving image converter |
JP5110235B1 (ja) * | 2011-06-27 | 2012-12-26 | コニカミノルタホールディングス株式会社 | 画像処理装置、画像処理方法、およびプログラム |
US8768071B2 (en) | 2011-08-02 | 2014-07-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Object category recognition methods and robots utilizing the same |
US9811775B2 (en) * | 2012-12-24 | 2017-11-07 | Google Inc. | Parallelizing neural networks during training |
US9992021B1 (en) | 2013-03-14 | 2018-06-05 | GoTenna, Inc. | System and method for private and point-to-point communication between computing devices |
IL231862A (en) * | 2014-04-01 | 2015-04-30 | Superfish Ltd | Image representation using a neural network |
JP6632288B2 (ja) * | 2014-12-12 | 2020-01-22 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
US9524450B2 (en) * | 2015-03-04 | 2016-12-20 | Accenture Global Services Limited | Digital image processing using convolutional neural networks |
US20160350336A1 (en) * | 2015-05-31 | 2016-12-01 | Allyke, Inc. | Automated image searching, exploration and discovery |
US9965705B2 (en) * | 2015-11-03 | 2018-05-08 | Baidu Usa Llc | Systems and methods for attention-based configurable convolutional neural networks (ABC-CNN) for visual question answering |
US9830534B1 (en) * | 2015-12-16 | 2017-11-28 | A9.Com, Inc. | Object recognition |
WO2017146595A1 (en) * | 2016-02-26 | 2017-08-31 | Imagr Limited | System and methods for shopping in a physical store |
US10360494B2 (en) * | 2016-11-30 | 2019-07-23 | Altumview Systems Inc. | Convolutional neural network (CNN) system based on resolution-limited small-scale CNN modules |
US10657424B2 (en) | 2016-12-07 | 2020-05-19 | Samsung Electronics Co., Ltd. | Target detection method and apparatus |
JP6968681B2 (ja) * | 2016-12-21 | 2021-11-17 | ホーチキ株式会社 | 火災監視システム |
US10783394B2 (en) | 2017-06-20 | 2020-09-22 | Nvidia Corporation | Equivariant landmark transformation for landmark localization |
US10713816B2 (en) * | 2017-07-14 | 2020-07-14 | Microsoft Technology Licensing, Llc | Fully convolutional color constancy with confidence weighted pooling |
CN109300166B (zh) | 2017-07-25 | 2023-04-25 | 同方威视技术股份有限公司 | 重建ct图像的方法和设备以及存储介质 |
EP3673410A4 (en) * | 2017-08-21 | 2021-04-07 | Nokia Technologies Oy | METHOD, SYSTEM AND DEVICE FOR PATTERN RECOGNITION |
US10025950B1 (en) * | 2017-09-17 | 2018-07-17 | Everalbum, Inc | Systems and methods for image recognition |
US10949676B2 (en) | 2018-04-09 | 2021-03-16 | Accenture Global Solutions Limited | Aerial monitoring system and method for identifying and locating object features |
JP6937438B2 (ja) * | 2018-07-31 | 2021-09-22 | オリンパス株式会社 | 画像診断支援システムおよび画像診断支援方法 |
WO2020065436A1 (de) * | 2018-09-28 | 2020-04-02 | Siemens Healthcare Diagnostics Inc. | Verfahren zum konfigurieren einer bildauswerteeinrichtung sowie bildauswerteverfahren und bildauswerteeinrichtung |
CN110889325B (zh) * | 2019-10-12 | 2023-05-23 | 平安科技(深圳)有限公司 | 多任务面部动作识别模型训练和多任务面部动作识别方法 |
DE202019105651U1 (de) | 2019-10-14 | 2019-12-10 | Blbr Gmbh | System zur Bestimmung einer passenden Größe eines Mundstücks einer Zahnputzvorrichtung |
WO2021148658A1 (en) | 2020-01-23 | 2021-07-29 | UMNAI Limited | An explainable neural net architecture for multidimensional data |
CN111444366B (zh) * | 2020-04-10 | 2024-02-20 | Oppo广东移动通信有限公司 | 图像分类方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04500420A (ja) * | 1989-06-27 | 1992-01-23 | トムソン―セーエスエフ | 参照画像と現在画像との間の運動を推定するための反復法および、この方法を実施するための装置 |
JPH05274455A (ja) * | 1992-03-27 | 1993-10-22 | Toshiba Corp | ニューラルネットワーク装置 |
JPH0675933A (ja) * | 1992-08-27 | 1994-03-18 | Hitachi Ltd | 情報処理装置 |
JPH09330406A (ja) * | 1996-06-10 | 1997-12-22 | Fuji Facom Corp | 学習支援装置およびパターン認識装置 |
JP2002008031A (ja) * | 2000-06-16 | 2002-01-11 | Canon Inc | パターン検出装置及び方法、画像処理装置及び方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6728404B1 (en) * | 1991-09-12 | 2004-04-27 | Fuji Photo Film Co., Ltd. | Method for recognizing object images and learning method for neural networks |
US5740274A (en) * | 1991-09-12 | 1998-04-14 | Fuji Photo Film Co., Ltd. | Method for recognizing object images and learning method for neural networks |
JP2723118B2 (ja) * | 1992-08-31 | 1998-03-09 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 2次元オブジェクトの認識に用いるためのニューラル・ネットワーク及び光学式文字認識装置 |
AU3490695A (en) * | 1994-09-20 | 1996-04-09 | Neopath, Inc. | Cytological slide scoring apparatus |
US6345119B1 (en) * | 1996-02-19 | 2002-02-05 | Fujitsu Limited | Handwritten character recognition apparatus and method using a clustering algorithm |
US6038337A (en) | 1996-03-29 | 2000-03-14 | Nec Research Institute, Inc. | Method and apparatus for object recognition |
US6021220A (en) * | 1997-02-11 | 2000-02-01 | Silicon Biology, Inc. | System and method for pattern recognition |
US6363381B1 (en) * | 1998-11-03 | 2002-03-26 | Ricoh Co., Ltd. | Compressed document matching |
US7450229B2 (en) * | 1999-01-25 | 2008-11-11 | Amnis Corporation | Methods for analyzing inter-cellular phenomena |
US7054850B2 (en) * | 2000-06-16 | 2006-05-30 | Canon Kabushiki Kaisha | Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements |
US6801662B1 (en) * | 2000-10-10 | 2004-10-05 | Hrl Laboratories, Llc | Sensor fusion architecture for vision-based occupant detection |
JP2002358523A (ja) * | 2001-05-31 | 2002-12-13 | Canon Inc | パターン認識処理装置及びその方法、画像入力装置 |
JP4846924B2 (ja) * | 2001-05-31 | 2011-12-28 | キヤノン株式会社 | パターン認識装置 |
US7577297B2 (en) * | 2002-12-16 | 2009-08-18 | Canon Kabushiki Kaisha | Pattern identification method, device thereof, and program thereof |
-
2004
- 2004-01-29 JP JP2004021823A patent/JP4532915B2/ja not_active Expired - Fee Related
-
2005
- 2005-01-28 US US11/044,188 patent/US7697765B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04500420A (ja) * | 1989-06-27 | 1992-01-23 | トムソン―セーエスエフ | 参照画像と現在画像との間の運動を推定するための反復法および、この方法を実施するための装置 |
JPH05274455A (ja) * | 1992-03-27 | 1993-10-22 | Toshiba Corp | ニューラルネットワーク装置 |
JPH0675933A (ja) * | 1992-08-27 | 1994-03-18 | Hitachi Ltd | 情報処理装置 |
JPH09330406A (ja) * | 1996-06-10 | 1997-12-22 | Fuji Facom Corp | 学習支援装置およびパターン認識装置 |
JP2002008031A (ja) * | 2000-06-16 | 2002-01-11 | Canon Inc | パターン検出装置及び方法、画像処理装置及び方法 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009519532A (ja) * | 2005-12-16 | 2009-05-14 | エヌ・シー・アール・コーポレイション | 銀行券の確認 |
JP2013069132A (ja) * | 2011-09-22 | 2013-04-18 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2013196682A (ja) * | 2012-03-16 | 2013-09-30 | Nec (China) Co Ltd | 人の集団検出方法、及び人の集団検出装置 |
JP2015036939A (ja) * | 2013-08-15 | 2015-02-23 | 富士ゼロックス株式会社 | 特徴抽出プログラム及び情報処理装置 |
JP2016033806A (ja) * | 2014-05-15 | 2016-03-10 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
JP2018506788A (ja) * | 2015-04-03 | 2018-03-08 | 三菱電機株式会社 | 物体の再同定の方法 |
JPWO2017073373A1 (ja) * | 2015-10-30 | 2017-10-26 | 株式会社モルフォ | 学習システム、学習装置、学習方法、学習プログラム、教師データ作成装置、教師データ作成方法、教師データ作成プログラム、端末装置及び閾値変更装置 |
WO2017073373A1 (ja) * | 2015-10-30 | 2017-05-04 | 株式会社モルフォ | 学習システム、学習装置、学習方法、学習プログラム、教師データ作成装置、教師データ作成方法、教師データ作成プログラム、端末装置及び閾値変更装置 |
KR20180079391A (ko) * | 2015-10-30 | 2018-07-10 | 가부시키가이샤 모르포 | 학습 시스템, 학습 장치, 학습 방법, 학습 프로그램, 교사 데이터 작성 장치, 교사 데이터 작성 방법, 교사 데이터 작성 프로그램, 단말 장치 및 임계치 변경 장치 |
US11170262B2 (en) | 2015-10-30 | 2021-11-09 | Morpho, Inc. | Training system, training device, method for training, training data creation device, training data creation method, terminal device, and threshold value changing device |
KR102114564B1 (ko) | 2015-10-30 | 2020-05-22 | 가부시키가이샤 모르포 | 학습 시스템, 학습 장치, 학습 방법, 학습 프로그램, 교사 데이터 작성 장치, 교사 데이터 작성 방법, 교사 데이터 작성 프로그램, 단말 장치 및 임계치 변경 장치 |
JP2020123975A (ja) * | 2017-06-14 | 2020-08-13 | 株式会社半導体エネルギー研究所 | 撮像装置 |
KR20200019181A (ko) * | 2017-06-14 | 2020-02-21 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 촬상 장치 및 전자 기기 |
CN110741630A (zh) * | 2017-06-14 | 2020-01-31 | 株式会社半导体能源研究所 | 摄像装置及电子设备 |
JPWO2018229594A1 (ja) * | 2017-06-14 | 2020-07-02 | 株式会社半導体エネルギー研究所 | 撮像装置、及び電子機器 |
US11805335B2 (en) | 2017-06-14 | 2023-10-31 | Semiconductor Energy Laboratory Co., Ltd. | Imaging device and electronic device |
WO2018229594A1 (ja) * | 2017-06-14 | 2018-12-20 | 株式会社半導体エネルギー研究所 | 撮像装置、及び電子機器 |
JP7466720B2 (ja) | 2017-06-14 | 2024-04-12 | 株式会社半導体エネルギー研究所 | 撮像装置及び電子機器 |
JP7003126B2 (ja) | 2017-06-14 | 2022-01-20 | 株式会社半導体エネルギー研究所 | 撮像装置、及び電子機器 |
JP7072016B2 (ja) | 2017-06-14 | 2022-05-19 | 株式会社半導体エネルギー研究所 | 撮像装置 |
CN110741630B (zh) * | 2017-06-14 | 2022-06-21 | 株式会社半导体能源研究所 | 摄像装置及电子设备 |
US11388360B2 (en) | 2017-06-14 | 2022-07-12 | Semiconductor Energy Laboratory Co., Ltd. | Imaging device and electronic device |
KR102522350B1 (ko) | 2017-06-14 | 2023-04-14 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 촬상 장치 및 전자 기기 |
JP2020530925A (ja) * | 2017-08-01 | 2020-10-29 | スリーエム イノベイティブ プロパティズ カンパニー | 画像の多様化及び認識のためのニューラルスタイル変換 |
CN110969173A (zh) * | 2018-09-28 | 2020-04-07 | 杭州海康威视数字技术股份有限公司 | 目标分类方法及装置 |
CN110969173B (zh) * | 2018-09-28 | 2023-10-24 | 杭州海康威视数字技术股份有限公司 | 目标分类方法及装置 |
WO2021243205A1 (en) * | 2020-05-29 | 2021-12-02 | Motion2Ai | Method and system for geo-semantic recognition of structural object |
Also Published As
Publication number | Publication date |
---|---|
US7697765B2 (en) | 2010-04-13 |
US20050185835A1 (en) | 2005-08-25 |
JP4532915B2 (ja) | 2010-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4532915B2 (ja) | パターン認識用学習方法、パターン認識用学習装置、画像入力装置、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 | |
US20210319566A1 (en) | Classifying motion in a video using detected visual features | |
Pons et al. | Supervised committee of convolutional neural networks in automated facial expression analysis | |
JP6557783B2 (ja) | オブジェクト検出のためのスケール依存プーリングによるカスケード型ニューラルネットワーク | |
US8015130B2 (en) | Information processing apparatus, information processing method, pattern recognition apparatus, and pattern recognition method | |
Littlewort et al. | Towards social robots: Automatic evaluation of human-robot interaction by facial expression classification | |
US7308134B2 (en) | Pattern recognition with hierarchical networks | |
KR100442835B1 (ko) | 인공 신경망을 이용한 얼굴 인식 방법 및 장치 | |
Damale et al. | Face recognition based attendance system using machine learning algorithms | |
Markou et al. | A neural network-based novelty detector for image sequence analysis | |
CN111444881A (zh) | 伪造人脸视频检测方法和装置 | |
US20070244842A1 (en) | Information Processing Method and Apparatus, and Image Pickup Device | |
CN111242046B (zh) | 一种基于图像检索的地面交通标志识别方法 | |
CN116110089A (zh) | 一种基于深度自适应度量学习的面部表情识别方法 | |
CN114492634B (zh) | 一种细粒度装备图片分类识别方法及系统 | |
JP2020119154A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
Bhanu et al. | Introduction to the special section on learning in computer vision | |
Ragesh et al. | Fast R-CNN based Masked Face Recognition for Access Control System | |
Ağgül et al. | Development of a Counterfeit Vehicle License Plate Detection System by Using Deep Learning | |
Medjahed et al. | On an empirical study: face recognition using machine learning and deep learning techniques | |
EP3572983A1 (en) | Low dimensional neural network based architecture | |
Bartlett et al. | Towards social robots: Automatic evaluation of human-robot interaction by face detection and expression classification | |
VMK | Portable Attendance Monitoring System Using Face Recognition | |
KR20220167998A (ko) | 자동차 번호 인식 방법 및 장치 | |
Ng et al. | Facial Expression Recognition Through Deep Learned Features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4532915 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |