JPWO2020194378A1 - 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム - Google Patents
画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム Download PDFInfo
- Publication number
- JPWO2020194378A1 JPWO2020194378A1 JP2021508361A JP2021508361A JPWO2020194378A1 JP WO2020194378 A1 JPWO2020194378 A1 JP WO2020194378A1 JP 2021508361 A JP2021508361 A JP 2021508361A JP 2021508361 A JP2021508361 A JP 2021508361A JP WO2020194378 A1 JPWO2020194378 A1 JP WO2020194378A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- reference image
- unit
- series
- regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/58—Extraction of image or video features relating to hyperspectral data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
系列性のある系列画像列を入力する系列画像列入力部と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
前記統合されたクラス信頼度を出力する出力部と、
を備える。
系列性のある系列画像列を入力する系列画像列入力部と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
前記統合されたクラス信頼度を出力する出力部と、
を備える。
画像処理装置による画像処理方法であって、
系列性のある系列画像列を入力するステップと、
前記系列画像列の中から、1枚以上の画像を基準画像として選択するステップと、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出するステップと、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰ステップと、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰ステップと、
前記第1回帰ステップにて算出されたクラス信頼度と、前記第2回帰ステップにて算出されたクラス信頼度と、を統合するステップと、
前記統合されたクラス信頼度を出力するステップと、
を含む。
コンピュータに、
系列性のある系列画像列を入力する手順と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する手順と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する手順と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰手順と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰手順と、
前記第1回帰手順にて算出されたクラス信頼度と、前記第2回帰手順にて算出されたクラス信頼度と、を統合する手順と、
前記統合されたクラス信頼度を出力する手順と、
を実行させるための画像処理プログラムが格納される。
まず、図1を参照して、本開示の一実施の形態に係る画像処理システムにおける推論実行部の概略構成について説明する。図1は、本実施の形態に係る画像処理システムにおける推論実行部の概略構成例を示すブロック図である。
或いは、上記の差分画像情報回帰関数及び画像情報回帰関数は、本実施の形態に係る画像処理システムが学習により推定してもよい。この場合、本実施の形態に係る画像処理システムには、図2に示される構成の学習実行部を追加する。
図2を参照すると、本実施の形態に係る画像処理システムにおける学習実行部は、学習用系列画像列入力部102と、教師画像情報入力部103と、学習処理部21と、画像情報回帰関数出力部302と、差分画像情報回帰関数出力部303と、を備える。また、学習処理部21は、前処理部201aと、学習用基準画像選択部202aと、変化量算出部203aと、画像情報回帰関数推定部204aと、差分画像情報回帰関数推定部205aと、を備える。
まず、図1に示される画像処理システムにおける推論実行部の各構成要素の概要について述べる。
系列画像列入力部101:
系列画像列入力部101は、系列性のある系列画像列を入力する。ここでいう系列画像列とは、例えば、ビデオカメラや高速カメラなどで撮影した1つ以上の動画像などを指す。或いは、ここでいう系列画像列とは、例えば、顔や人物或いは物体など、被写体の姿勢を変化させて撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、例えば、照明やカメラの位置を変化させて、顔や人物或いは物体などの被写体を撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、顔や人物或いは物体などの被写体を、複数のスペクトル帯域で撮影したマルチスペクトル画像やハイパースペクトル画像であってもよい。すなわち、ここでいう系列画像列とは、ある一定の規則に基づき、被写体或いは撮影環境を時間的或いは空間的に変化させたものであれば何でもよい。
前処理部201は、系列画像列入力部101にて入力された系列画像列を前処理(画像処理)することで、より画像認識に適した画像に変換する。ここでいう前処理とは、例えば、複数枚超解像或いは1枚超解像であってもよいし、ハイダイナミックレンジ画像合成でもよいし、コントラスト強調であってもよいし、複数枚ノイズ除去であってもよい。
基準画像選択部202は、前処理部201にて前処理された系列画像列の中から、1枚以上の画像を基準画像として選択する。例えば、基準画像選択部202は、系列画像列の中から、最もtが小さい画像を基準画像として選択してもよい。或いは、基準画像選択部202は、系列画像列の中からランダムに選択した画像を基準画像としてもよい。或いは、基準画像選択部202は、利用者があらかじめ決定した基準画像を選択してもよい。或いは、基準画像選択部202は、系列画像列の中の各画像について、例えば、明度やボケ強度など画像を特徴づける量をあらかじめ算出し、これらの値が大きいもの或いは小さいものを優先的に基準画像として選択してもよい。そして、基準画像選択部202は、選択した基準画像をメモリ(図示せず)に記録する。なお、以下では、基準画像選択部202にて選択された基準画像をベクトルIi=I(ti)=(I1(ti),I2(ti),・・・,In(ti),・・・,IN(ti))と表す。ここで添え字のiは、選択された基準画像を区別するためのものである。
変化量算出部203は、基準画像選択部202にて選択された基準画像と基準画像に近接する画像である近接基準画像との間の変化量を算出する。
或いは、基準画像と近接基準画像との関係は、上記の2つの選択の仕方を統合して用いてもよい。
或いは、変化量算出部203にて算出された変化量は、基準画像と近接基準画像との変化、或いは、近接基準画像同士の変化に加え、これら変化量に関する情報に加えて基準画像或いは近接基準画像の情報を加えたものであってもよい。或いは、変化量算出部203にて算出された変化量は、これまで過去に算出された変化量に加え、基準画像及び近接基準画像の情報を加えたものであってもよい。
画像情報回帰部204は、基準画像選択部202にて選択された基準画像を入力として、画像情報回帰関数により、クラス信頼度を算出する。ここでいうクラス信頼度とは、例えば、照合結果や認識結果などを指す。より具体的には、例えば、クラス信頼度が照合結果である場合には、入力した基準画像と別途用意した画像との相違度や類似度がクラス信頼度に相当する。また、クラス信頼度が認識結果である場合は、入力した基準画像に含まれている物体や人物、或いは文字などの情報がクラス信頼度に相当する。なお、クラス信頼度が認識結果である場合、画像情報回帰部204にて算出される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に0或いは1(ゼロである場合はその物体が存在しないことを示し、1である場合はその物体が存在することを示す)を入力し、これをクラス信頼度として算出すればよい。或いは、クラス信頼度が認識結果である場合、画像情報回帰部204にて出力される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に各物体の信頼度(信頼度は大きければ大きいほど、その物体が存在することを示す)を入力し、これをクラス信頼度として算出すればよい。以下では、基準画像Iiのクラス信頼度をci(ti)=(c1(ti),c2(ti),・・・,cd(ti),・・・,cD(ti))と表す。ここで、Dは基準画像の次元であり、dは各次元を区別するための添え字である。例えば、クラス信頼度が認識結果である場合、Dはクラスの数を表す。
差分画像情報回帰部205は、変化量算出部203にて算出された変化量を入力として、差分画像情報回帰関数により、近接クラス信頼度cij(tj)を算出する。ここでいう近接クラス信頼度cijとは、クラス信頼度ci(ti)と同様に、例えば、照合結果や認識結果などを指す。より具体的には、クラス信頼度ci(ti)と同様に、例えば、近接クラス信頼度cij(tj)が照合結果である場合には、入力した基準画像或いは入力した変化量に応じた差分画像と別途用意した画像との相違度や類似度が近接クラス信頼度に相当する。また、近接クラス信頼度cij(tj)が認識結果である場合は、入力した基準画像或いは入力した変化量に応じた差分画像に含まれている物体や人物、或いは文字などにおけるクラス信頼度が近接クラス信頼度に相当する。
信頼度統合部206は、差分画像情報回帰部205にて算出された近接クラス信頼度cij(tj)と、画像情報回帰部204にて算出されたクラス信頼度ci(ti)と、を統合した統合クラス信頼度を算出する。ここでいう統合クラス信頼度とは、クラス信頼度や近接クラス信頼度と同様に、例えば、照合結果や認識結果などを指す。より具体的には、例えば、統合クラス信頼度が照合結果である場合には、基準画像或いは変化量に応じた差分画像と別途用意した画像との相違度や類似度が統合クラス信頼度に相当する。また、統合クラス信頼度が認識結果である場合は、基準画像に含まれている物体や人物、或いは文字などの情報が統合クラス信頼度に相当する。なお、統合クラス信頼度が認識結果である場合、信頼度統合部206にて算出される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に0或いは1(ゼロである場合はその物体が存在しないことを示し、1である場合はその物体が存在することを示す)を入力し、これを統合クラス信頼度として算出すればよい。或いは、統合クラス信頼度が認識結果である場合、信頼度統合部206にて算出される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に各物体の信頼度(信頼度は大きければ大きいほど、その物体が存在することを示す)を入力し、これを統合クラス信頼度として算出すればよい。
出力部301は、信頼度統合部206にて算出された統合クラス信頼度を出力する。
学習用系列画像列入力部102:
学習用系列画像列入力部102は、学習用にあらかじめ用意した、系列性のある系列画像列(以下、学習用系列画像列と呼ぶこともある)を入力する。ここでいう系列画像列とは、例えば、ビデオカメラや高速カメラなどで撮影した1つ以上の動画像などを指す。或いは、ここでいう系列画像列とは、例えば、顔や人物或いは物体など、被写体の姿勢を変化させて撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、例えば、照明やカメラの位置を変化させて、顔や人物或いは物体などの被写体を撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、顔や人物或いは物体などの被写体を、複数のスペクトル帯域で撮影したマルチスペクトル画像やハイパースペクトル画像であってもよい。すなわち、ここでいう系列画像列とは、ある一定の規則に基づき、被写体或いは撮影環境を時間的或いは空間的に変化させたものであれば何でもよい。なお、以下では、学習用系列画像列入力部102にて入力された画像の集合を{Ik(t)}=(I1(t),・・・,Ik(t),・・・,IK(t))と表し、以下ではこれを学習用系列画像群と呼ぶこともある。ここで、kは、入力した学習用系列画像を区別するための添え字であり、Kは、入力した学習用系列画像の総数である。
前処理部201aは、学習用系列画像列入力部102にて入力された学習用系列画像列を前処理(画像処理)することで、より画像認識に適した画像に変換する。なお、前処理部201aの動作の概要は、図1における前処理部201と同様であるので、記述は省略する。
学習用基準画像選択部202aは、前処理部201aにて前処理された学習用系列画像列の中から、1枚以上の画像を学習用基準画像として選択する。なお、学習用基準画像選択部202aの動作の概要は、図1における基準画像選択部202と同様であるので、記述は省略する。また、以下では、学習用基準画像選択部202aにて選択された学習用基準画像を、{Iki(ti)}或いは単に{Iki}と表す。
変化量算出部203aは、学習用基準画像選択部202aにて選択された学習用基準画像と学習用基準画像に近接する画像である近接学習用基準画像との間の変化量を算出する。なお、変化量算出部203aの動作の概要は、図1における変化量算出部203と同様であるので、記述は省略する。また、以下では、近接学習用基準画像を{Ikij(tj)}と表し、算出した変化量を{ΔIkij}と表す。
教師画像情報入力部103は、教師データとなる画像情報を教師画像情報として入力する。本実施の形態における教師画像情報とは、学習用基準画像{Iki}或いは学習用近接基準画像{Ikij}に対し、図1における画像情報回帰部204にて使用した画像情報回帰関数と同様の画像情報回帰関数を用いた場合に期待する出力(すなわち正解値或いは教師信号)と同様の出力を用いてもよい。
画像情報回帰関数推定部204aは、学習用基準画像選択部202aにて選択された学習用基準画像{Iki}と、教師画像情報入力部103にて入力された教師画像情報{zki}と、から、画像情報回帰関数を推定する。すなわち、画像情報回帰関数推定部204aは、学習用基準画像{Iki}及び教師画像情報{zki}を入力とし、画像情報回帰関数を推定する。画像情報回帰関数推定部204aは、例えば、深層学習により、画像情報回帰関数を推定してもよい。より具体的には、画像情報回帰関数推定部204aは、例えば、オートエンコーダーや変分オートエンコーダー(VAE:Variational Auto Encoder)などの手法を用いて、画像情報回帰関数を回帰してもよい。或いは、画像情報回帰関数推定部204aは、サポートベクトル回帰やランダムフォレストなどの方法を用いて、画像情報回帰関数を算出してもよい。
差分画像情報回帰関数推定部205aは、変化量算出部203aにて算出された、学習用基準画像{Iki}と学習用近接基準画像{Ikij}の間の変化量{ΔIkij}と、教師画像情報入力部103にて入力された教師画像情報{zkij}と、から、差分画像情報回帰関数を推定する。すなわち、差分画像情報回帰関数推定部205aは、変化量{ΔIkij}及び教師画像情報{zkij}を入力とし、差分画像情報回帰関数を推定する。差分画像情報回帰関数推定部205aは、例えば、深層学習により、差分画像情報回帰関数を推定してもよい。より具体的には、差分画像情報回帰関数推定部205aは、例えば、オートエンコーダーや変分オートエンコーダー(VAE)などの手法を用いて、の差分画像情報回帰関数を回帰してもよい。或いは、差分画像情報回帰関数推定部205aは、サポートベクトル回帰やランダムフォレストなどの方法を用いて、差分画像情報回帰関数を算出してもよい。
画像情報回帰関数出力部302は、画像情報回帰関数推定部204aにて推定された画像情報回帰関数を出力する。図1における画像情報回帰部204は、画像情報回帰関数出力部302から出力された画像情報回帰関数を使用しても良いし、利用者があらかじめ手動で入力した画像情報回帰関数を使用しても良い。
差分画像情報回帰関数出力部303は、差分画像情報回帰関数推定部205aにて推定された差分画像情報回帰関数を出力する。図1における差分画像情報回帰部205は、差分画像情報回帰関数出力部303から出力された差分画像情報回帰関数を使用しても良いし、利用者があらかじめ手動で入力した差分画像情報回帰関数を使用しても良い。
以下、本実施の形態に係る画像処理システムの動作について説明する。
まず、図5を参照して、図1に示される画像処理システムにおける推論実行部の動作について説明する。図5は、図1に示される画像処理システムにおける推論実行部の動作フロー例を示すフロー図である。
次に、前処理部201は、系列画像列入力部101にて入力された系列画像列の前処理を行う(S102)。
次に、変化量算出部203は、前処理部201にて前処理された系列画像列の中から、基準画像選択部202にて選択された基準画像に近接する近接基準画像を選択し、さらに、基準画像と近接基準画像との間の変化量を算出する(S104)。
次に、差分画像情報回帰部205は、変化量算出部203にて算出された変化量を入力として、差分画像情報回帰関数により、近接クラス信頼度を算出する(S106)。
その後、出力部301は、信頼度統合部206にて算出された統合クラス信頼度を出力する(S108)。
次に、教師画像情報入力部103は、教師データとなる画像情報を教師画像情報として入力する(S202)。
次に、前処理部201aは、学習用系列画像列入力部102にて入力された学習用系列画像列の前処理を行う(S203)。
次に、変化量算出部203aは、前処理部201aにて前処理された学習用系列画像列の中から、学習用基準画像選択部202aにて選択された学習用基準画像に近接する近接学習用基準画像を選択し、さらに、学習用基準画像と近接学習用基準画像との間の変化量を算出する(S205)。
また、差分画像情報回帰関数推定部205aは、変化量算出部203aにて算出された変化量と、教師画像情報入力部103にて入力された教師画像情報と、から、差分画像情報回帰関数を推定する(S207)。
また、差分画像情報回帰関数出力部303は、差分画像情報回帰関数推定部205aにて推定された差分画像情報回帰関数を出力する(S209)。
以下、本実施の形態に係る画像処理システムの効果について説明する。
(1)第1の効果
本実施の形態における第1の効果は、高速カメラを用いて取得したフレームレートが大きな動画像や、複数の照明条件で物体を撮像した画像群などを入力とした場合、より少ない計算負荷で画像認識などの画像処理を行えるという点がある。
さらに、本実施の形態における第2の効果として、画像認識を安定的に行えるという点がある。なぜならば、上述したように、本実施の形態では、画像情報回帰部204にて算出されたクラス信頼度と、差分画像情報回帰部205にて算出されたクラス信頼度と、を統合するという構成になっている。
さらに、本実施の形態における第3の効果として、画像認識をより少ない学習データから行えるという点がある。なぜならば、上述したように、一般的に、画像そのものの値(すなわち画素値)に比べ、系列に沿った画像間の画素値の変化は小さいため、変化量算出部203aにて算出される変化量は相対的に小さな値を持つ。このように、相対的に変化量が小さい場合には、差分画像情報回帰関数の推定を行う場合に、関数の探索範囲が小さくてすむ。そのため、安定的に関数の推定を行うために必要な学習データが少なくてすむ。
通信インタフェース45は、外部の装置との間でデータを送受信する。例えば、通信インタフェース45は、有線ネットワーク又は無線ネットワークを介して外部装置と通信する。
20 推論処理部
201 前処理部
202 基準画像選択部
203 変化量算出部
204 画像情報回帰部
205 差分画像情報回帰部
206 信頼度統合部
301 出力部
102 学習用系列画像列入力部
103 教師画像情報入力部
21 学習処理部
201a 前処理部
202a 学習用基準画像選択部
203a 変化量算出部
204a 画像情報回帰関数推定部
205a 差分画像情報回帰関数推定部
302 画像情報回帰関数出力部
303 差分画像情報回帰関数出力部
40 コンピュータ
41 プロセッサ
42 メモリ
43 ストレージ
44 入出力インタフェース
45 通信インタフェース
Claims (8)
- 系列性のある系列画像列を入力する系列画像列入力部と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
前記統合されたクラス信頼度を出力する出力部と、
を備える、画像処理システム。 - 前記画像情報回帰部は、前記基準画像を入力として、画像情報回帰関数を用いた回帰処理により、クラス信頼度を算出し、
前記差分画像情報回帰部は、前記第1変化量を入力として、差分画像情報回帰関数を用いた回帰処理により、クラス信頼度を算出する、
請求項1に記載の画像処理システム。 - 系列性のある学習用系列画像列を入力する系列画像列入力部と、
教師データとなる画像情報を教師画像情報として入力する教師画像情報入力部と、
前記学習用系列画像列の中から、1枚以上の画像を学習用基準画像として選択する学習用基準画像選択部と、
前記学習用系列画像列の中から、前記学習用基準画像に近接する近接学習用基準画像を選択し、前記学習用基準画像と前記近接学習用基準画像の間の変化量である第2変化量を算出する第2変化量算出部と、
前記教師画像情報と前記学習用基準画像とから、前記画像情報回帰関数を推定する画像情報回帰関数推定部と、
前記教師画像情報と前記第2変化量とから、前記差分画像情報回帰関数を推定する差分画像情報回帰関数推定部と、
をさらに備え、
前記画像情報回帰部は、前記画像情報回帰関数として、前記画像情報回帰関数推定部にて推定された画像情報回帰関数を用い、
前記差分画像情報回帰部は、前記差分画像情報回帰関数として、前記差分画像情報回帰関数推定部にて推定された差分画像情報回帰関数を用いる、
請求項2に記載の画像処理システム。 - 前記基準画像選択部は、前記系列画像列の中から、特定のフレームの画像を前記基準画像として選択し、
前記第1変化量算出部は、
前記系列画像列の中から、前記基準画像の次のフレームの画像を前記近接基準画像として選択し、前記基準画像と前記近接基準画像との間の変化量を算出し、
以降、前記系列画像列の中から、現在の近接基準画像の以降のフレームの画像を、順番に前記近接基準画像として選択し、選択した前記近接基準画像と前記基準画像との間の変化量を算出する、という動作を繰り返す、
請求項1から3のいずれか1項に記載の画像処理システム。 - 前記基準画像選択部は、前記系列画像列の中から、特定のフレームの画像を前記基準画像として選択し、
前記第1変化量算出部は、
前記系列画像列の中から、前記基準画像の次のフレームの画像を前記近接基準画像として選択し、前記基準画像と前記近接基準画像との間の変化量を算出し、
以降、前記系列画像列の中から、現在の近接基準画像の以降のフレームの画像を、順番に前記近接基準画像として選択し、選択した前記近接基準画像と1つ前のフレームの前記近接基準画像との変化量を算出する、という動作を繰り返す、
請求項1から3のいずれか1項に記載の画像処理システム。 - 系列性のある系列画像列を入力する系列画像列入力部と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
前記統合されたクラス信頼度を出力する出力部と、
を備える、画像処理装置。 - 画像処理装置による画像処理方法であって、
系列性のある系列画像列を入力するステップと、
前記系列画像列の中から、1枚以上の画像を基準画像として選択するステップと、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出するステップと、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰ステップと、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰ステップと、
前記第1回帰ステップにて算出されたクラス信頼度と、前記第2回帰ステップにて算出されたクラス信頼度と、を統合するステップと、
前記統合されたクラス信頼度を出力するステップと、
を含む、画像処理方法。 - コンピュータに、
系列性のある系列画像列を入力する手順と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する手順と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する手順と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰手順と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰手順と、
前記第1回帰手順にて算出されたクラス信頼度と、前記第2回帰手順にて算出されたクラス信頼度と、を統合する手順と、
前記統合されたクラス信頼度を出力する手順と、
を実行させるための画像処理プログラムが格納された非一時的なコンピュータ可読媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/012083 WO2020194378A1 (ja) | 2019-03-22 | 2019-03-22 | 画像処理システム、画像処理装置、画像処理方法、及びコンピュータ可読媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020194378A1 true JPWO2020194378A1 (ja) | 2021-12-23 |
JP7176616B2 JP7176616B2 (ja) | 2022-11-22 |
Family
ID=72609227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021508361A Active JP7176616B2 (ja) | 2019-03-22 | 2019-03-22 | 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11748977B2 (ja) |
JP (1) | JP7176616B2 (ja) |
WO (1) | WO2020194378A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6902150B1 (ja) * | 2020-11-17 | 2021-07-14 | 株式会社タナカ技研 | 画像認識装置、学習システム、画像蓄積装置、画像認識方法、画像蓄積方法、およびプログラム |
CN116561525B (zh) * | 2023-07-07 | 2023-09-12 | 四川君安天源精酿啤酒有限公司 | 基于物联网的精酿啤酒酿造数据智能监测方法 |
CN117896482B (zh) * | 2024-03-15 | 2024-05-07 | 东莞市嘉钦精工科技有限公司 | 一种车辆行车记录仪的数据智能存储方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007328435A (ja) * | 2006-06-06 | 2007-12-20 | Mitsubishi Electric Corp | 移動体行動分析装置 |
JP2010165046A (ja) * | 2009-01-13 | 2010-07-29 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2011018996A (ja) * | 2009-07-07 | 2011-01-27 | Nikon Corp | 撮像装置 |
JP2011205387A (ja) * | 2010-03-25 | 2011-10-13 | Sony Corp | 画像処理装置および方法、並びにプログラム |
WO2018230294A1 (ja) * | 2017-06-15 | 2018-12-20 | シャープ株式会社 | 動画像処理装置、表示装置、動画像処理方法、および制御プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321522A1 (en) * | 2015-04-30 | 2016-11-03 | Canon Kabushiki Kaisha | Devices, systems, and methods for pairwise multi-task feature learning |
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
CN109685762A (zh) * | 2018-11-09 | 2019-04-26 | 五邑大学 | 一种基于多尺度深度语义分割网络的天线下倾角测量方法 |
US20200175384A1 (en) * | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | System and method for incremental learning |
US10817777B2 (en) * | 2019-01-31 | 2020-10-27 | StradVision, Inc. | Learning method and learning device for integrating object detection information acquired through V2V communication from other autonomous vehicle with object detection information generated by present autonomous vehicle, and testing method and testing device using the same |
-
2019
- 2019-03-22 US US17/438,632 patent/US11748977B2/en active Active
- 2019-03-22 JP JP2021508361A patent/JP7176616B2/ja active Active
- 2019-03-22 WO PCT/JP2019/012083 patent/WO2020194378A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007328435A (ja) * | 2006-06-06 | 2007-12-20 | Mitsubishi Electric Corp | 移動体行動分析装置 |
JP2010165046A (ja) * | 2009-01-13 | 2010-07-29 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2011018996A (ja) * | 2009-07-07 | 2011-01-27 | Nikon Corp | 撮像装置 |
JP2011205387A (ja) * | 2010-03-25 | 2011-10-13 | Sony Corp | 画像処理装置および方法、並びにプログラム |
WO2018230294A1 (ja) * | 2017-06-15 | 2018-12-20 | シャープ株式会社 | 動画像処理装置、表示装置、動画像処理方法、および制御プログラム |
Non-Patent Citations (1)
Title |
---|
高垣 幸秀、青野 雅樹: ""Deep Spatio−Temporal Transformationを用いた逐次人物動作検出"", 電子情報通信学会技術研究報告, vol. 117, no. 238, JPN6019016985, 5 October 2017 (2017-10-05), JP, pages 31 - 35, ISSN: 0004893731 * |
Also Published As
Publication number | Publication date |
---|---|
US20220351497A1 (en) | 2022-11-03 |
JP7176616B2 (ja) | 2022-11-22 |
WO2020194378A1 (ja) | 2020-10-01 |
US11748977B2 (en) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200167554A1 (en) | Gesture Recognition Method, Apparatus, And Device | |
EP3540637B1 (en) | Neural network model training method, device and storage medium for image processing | |
KR102629380B1 (ko) | 실제 3차원 객체를 실제 객체의 2-차원 스푸프로부터 구별하기 위한 방법 | |
WO2021036059A1 (zh) | 图像转换模型训练方法、异质人脸识别方法、装置及设备 | |
US10832069B2 (en) | Living body detection method, electronic device and computer readable medium | |
JP6624794B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN108197618B (zh) | 用于生成人脸检测模型的方法和装置 | |
US20150215590A1 (en) | Image demosaicing | |
Qin et al. | Robust match fusion using optimization | |
JP7176616B2 (ja) | 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム | |
JP2011134114A (ja) | パターン認識方法およびパターン認識装置 | |
US11704563B2 (en) | Classifying time series image data | |
US20210082127A1 (en) | Image analysis apparatus, image analysis method, and storage medium to display information representing flow quantity | |
Yao et al. | Improving long range and high magnification face recognition: Database acquisition, evaluation, and enhancement | |
JP7419080B2 (ja) | コンピュータシステムおよびプログラム | |
WO2019102535A1 (ja) | 脈波検出装置、脈波検出方法、及び記憶媒体 | |
WO2022227765A1 (zh) | 生成图像修复模型的方法、设备、介质及程序产品 | |
CN116309983B (zh) | 虚拟人物模型的训练方法、生成方法、装置和电子设备 | |
CN111710008B (zh) | 人流密度的生成方法、装置、电子设备以及存储介质 | |
WO2020021879A1 (ja) | 画像処理装置、および画像処理方法、並びにプログラム | |
JP2006146413A (ja) | 対象追従装置 | |
JP7312026B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN116912783A (zh) | 核酸检测平台的状态监控方法及系统 | |
JP2015179426A (ja) | 情報処理装置、パラメータの決定方法、及びプログラム | |
JPWO2011033744A1 (ja) | 画像処理装置、画像処理方法および画像処理用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210827 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221024 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7176616 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |