JPWO2020194378A1 - 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム - Google Patents

画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム Download PDF

Info

Publication number
JPWO2020194378A1
JPWO2020194378A1 JP2021508361A JP2021508361A JPWO2020194378A1 JP WO2020194378 A1 JPWO2020194378 A1 JP WO2020194378A1 JP 2021508361 A JP2021508361 A JP 2021508361A JP 2021508361 A JP2021508361 A JP 2021508361A JP WO2020194378 A1 JPWO2020194378 A1 JP WO2020194378A1
Authority
JP
Japan
Prior art keywords
image
reference image
unit
series
regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021508361A
Other languages
English (en)
Other versions
JP7176616B2 (ja
Inventor
重哲 並木
剛志 柴田
尚司 谷内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020194378A1 publication Critical patent/JPWO2020194378A1/ja
Application granted granted Critical
Publication of JP7176616B2 publication Critical patent/JP7176616B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/58Extraction of image or video features relating to hyperspectral data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本開示に係る画像処理システムは、系列性のある系列画像列を入力する系列画像列入力部(101)と、系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部(202)と、系列画像列の中から、基準画像に近接する近接基準画像を選択し、基準画像と近接基準画像の間の変化量を算出する変化量算出部(203)と、基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部(204)と、変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部(205)と、画像情報回帰部(204)にて算出されたクラス信頼度と、差分画像情報回帰部(205)にて算出されたクラス信頼度と、を統合する信頼度統合部(206)と、統合されたクラス信頼度を出力する出力部(301)と、を備える。

Description

本開示は、画像処理システム、画像処理装置、画像処理方法、及びコンピュータ可読媒体に関し、特に、深層学習をはじめとする機械学習に基づく画像処理における計算負荷を低減する技術に関する。
画像認識や画像照合などの画像処理の分野において、深層学習を用いた手法が数多く提案されている。深層学習を用いることで、人物や物体の画像の中から人物や物体を高精度に認識すること、高精度に画像を復元することなどが可能となった。しかしながら、一般に、これら深層学習を用いる手法は、モデル(深層学習で用いるネットワーク構造)が大規模であるため、多くの計算量を必要とする。そのため、高速カメラを用いて取得したようなフレームレートが大きな動画像や、複数の照明条件で物体を撮像した画像群などを入力とした場合、非常に多くの計算負荷を要するという課題があった。
このような課題を解決するために、非特許文献1では、蒸留学習と呼ばれる、既に学習済みの高精度なモデル(以下、教師モデルと呼ぶこともある)から、より計算負荷が小さなモデル(以下、生徒モデルと呼ぶこともある)を生成する手法が開示されている。具体的には、非特許文献1では、学習データがどのように汎化しているかを表す情報(以下、特権情報と呼ぶこともある)を用い、この特権情報を手掛かりに生徒モデルに学習データを学習させることで、早い収束で成功させ、かつ教師モデルに近い精度の生徒モデルを得る手法が開示されている。
Geoffrey Hinton, Oriol Vinyals, and Jeff Dean. "Distilling the knowledge in a neural network", arXiv preprint arXiv:1503.02531v1 (9 March 2015)
しかしながら、高速カメラを用いて取得したフレームレートが大きな動画像や、複数の照明条件で物体を撮像した画像群などを入力とした場合、非特許文献1に記載の手法では、これらの入力画像全てに対して、生徒モデルを適用し推論することが必要であるため、冗長な計算が多く、計算負荷が大きいという問題がある。
そこで本開示の目的は、上述した課題を解決し、系列性のある系列画像列について、より少ない計算負荷で画像処理を行うことが可能となる画像処理システム、画像処理装置、画像処理方法、及びコンピュータ可読媒体を提供することにある。
一態様による画像処理システムは、
系列性のある系列画像列を入力する系列画像列入力部と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
前記統合されたクラス信頼度を出力する出力部と、
を備える。
一態様による画像処理装置は、
系列性のある系列画像列を入力する系列画像列入力部と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
前記統合されたクラス信頼度を出力する出力部と、
を備える。
一態様による画像処理方法は、
画像処理装置による画像処理方法であって、
系列性のある系列画像列を入力するステップと、
前記系列画像列の中から、1枚以上の画像を基準画像として選択するステップと、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出するステップと、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰ステップと、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰ステップと、
前記第1回帰ステップにて算出されたクラス信頼度と、前記第2回帰ステップにて算出されたクラス信頼度と、を統合するステップと、
前記統合されたクラス信頼度を出力するステップと、
を含む。
一態様によるコンピュータ可読媒体は、
コンピュータに、
系列性のある系列画像列を入力する手順と、
前記系列画像列の中から、1枚以上の画像を基準画像として選択する手順と、
前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する手順と、
前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰手順と、
前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰手順と、
前記第1回帰手順にて算出されたクラス信頼度と、前記第2回帰手順にて算出されたクラス信頼度と、を統合する手順と、
前記統合されたクラス信頼度を出力する手順と、
を実行させるための画像処理プログラムが格納される。
上述の態様によれば、系列性のある系列画像列について、より少ない計算負荷で画像処理を行うことが可能となる画像処理システム、画像処理装置、画像処理方法、及びコンピュータ可読媒体を提供できるという効果が得られる。
本開示の一実施の形態に係る画像処理システムにおける推論実行部の概略構成例を示すブロック図である。 本開示の一実施の形態に係る画像処理システムにおける学習実行部の概略構成例を示すブロック図である。 基準画像と近接基準画像との関係の例を示す図である。 基準画像と近接基準画像との関係の他の例を示す図である。 図1に示される画像処理システムにおける推論実行部の動作フロー例を示すフロー図である。 図2に示される画像処理システムにおける学習実行部の動作フロー例を示すフロー図である。 図1及び図2に示される画像処理システムを実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、本開示を実施するための形態について図面を参照して詳細に説明する。なお、以下の記載及び図面は、説明の明確化のため、適宜、省略及び簡略化がなされている。また、以下の各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
<実施の形態の構成>
まず、図1を参照して、本開示の一実施の形態に係る画像処理システムにおける推論実行部の概略構成について説明する。図1は、本実施の形態に係る画像処理システムにおける推論実行部の概略構成例を示すブロック図である。
図1を参照すると、本実施の形態に係る画像処理システムにおける推論実行部は、系列画像列入力部101と、推論処理部20と、出力部301と、を備える。また、推論処理部20は、前処理部201と、基準画像選択部202と、変化量算出部203と、画像情報回帰部204と、差分画像情報回帰部205と、信頼度統合部206と、を備える。
後に詳細を述べるが、図1における画像情報回帰部204が画像情報回帰関数を使用し、また、図1における差分画像情報回帰部205が差分画像情報回帰関数を使用する。
上記の差分画像情報回帰関数及び画像情報回帰関数は、利用者があらかじめ手動で入力してもよい。
或いは、上記の差分画像情報回帰関数及び画像情報回帰関数は、本実施の形態に係る画像処理システムが学習により推定してもよい。この場合、本実施の形態に係る画像処理システムには、図2に示される構成の学習実行部を追加する。
図2は、本実施の形態に係る画像処理システムにおける学習実行部の概略構成例を示すブロック図である。
図2を参照すると、本実施の形態に係る画像処理システムにおける学習実行部は、学習用系列画像列入力部102と、教師画像情報入力部103と、学習処理部21と、画像情報回帰関数出力部302と、差分画像情報回帰関数出力部303と、を備える。また、学習処理部21は、前処理部201aと、学習用基準画像選択部202aと、変化量算出部203aと、画像情報回帰関数推定部204aと、差分画像情報回帰関数推定部205aと、を備える。
後に詳細を述べるが、図2における画像情報回帰関数推定部204aが画像情報回帰関数を推定し、また、図2における差分画像情報回帰関数推定部205aが差分画像情報回帰関数を推定する。そのため、図2における画像情報回帰関数推定部204aにて推定された画像情報回帰関数を、図1における画像情報回帰部204にて使用してもよい。また、図2における差分画像情報回帰関数推定部205aにて推定された差分画像情報回帰関数を、図1における差分画像情報回帰部205にて使用してもよい。
すなわち、図1に示される画像処理システムにおける推論実行部は、一般的な画像処理における推論を実行する処理(或いはインファレンスを実行する処理)に相当する。また、図2に示される画像処理システムにおける学習実行部は、一般的な画像処理における学習を実行する処理(或いはインファレンスを実行する処理)に相当する。
以下、本実施の形態に係る画像処理システムの各構成要素の概要について述べる。
まず、図1に示される画像処理システムにおける推論実行部の各構成要素の概要について述べる。
系列画像列入力部101:
系列画像列入力部101は、系列性のある系列画像列を入力する。ここでいう系列画像列とは、例えば、ビデオカメラや高速カメラなどで撮影した1つ以上の動画像などを指す。或いは、ここでいう系列画像列とは、例えば、顔や人物或いは物体など、被写体の姿勢を変化させて撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、例えば、照明やカメラの位置を変化させて、顔や人物或いは物体などの被写体を撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、顔や人物或いは物体などの被写体を、複数のスペクトル帯域で撮影したマルチスペクトル画像やハイパースペクトル画像であってもよい。すなわち、ここでいう系列画像列とは、ある一定の規則に基づき、被写体或いは撮影環境を時間的或いは空間的に変化させたものであれば何でもよい。
以下では、系列画像を、ベクトルI(t)=(I(t),I(t),・・・,I(t),・・・,I(t))と表す。ここで、tは、系列を順序づけるためのパラメタであり、例えば時刻、照明や姿勢の角度、物体の姿勢、スペクトルの周波数などであればよい。なお、以下では、tを系列パラメタと呼ぶこともある。また、下付き添え字は、画素のインデックスを表す添え字である。また、Nは、画像の画素数である。なお、本実施の形態では、説明を明確にするため、系列性のある系列データ列が画像である場合の例について説明するが、本実施の形態は、系列データ列が画像であることを前提としていない。例えば、系列データ列は、画像ではなくN個の要素からなる音声信号でもよいし、顧客データなどの非構造データであってもよい。すなわち、系列データ列は、N個の要素からなるデータであれば何でもよい。
前処理部201:
前処理部201は、系列画像列入力部101にて入力された系列画像列を前処理(画像処理)することで、より画像認識に適した画像に変換する。ここでいう前処理とは、例えば、複数枚超解像或いは1枚超解像であってもよいし、ハイダイナミックレンジ画像合成でもよいし、コントラスト強調であってもよいし、複数枚ノイズ除去であってもよい。
基準画像選択部202:
基準画像選択部202は、前処理部201にて前処理された系列画像列の中から、1枚以上の画像を基準画像として選択する。例えば、基準画像選択部202は、系列画像列の中から、最もtが小さい画像を基準画像として選択してもよい。或いは、基準画像選択部202は、系列画像列の中からランダムに選択した画像を基準画像としてもよい。或いは、基準画像選択部202は、利用者があらかじめ決定した基準画像を選択してもよい。或いは、基準画像選択部202は、系列画像列の中の各画像について、例えば、明度やボケ強度など画像を特徴づける量をあらかじめ算出し、これらの値が大きいもの或いは小さいものを優先的に基準画像として選択してもよい。そして、基準画像選択部202は、選択した基準画像をメモリ(図示せず)に記録する。なお、以下では、基準画像選択部202にて選択された基準画像をベクトルIi=I(ti)=(I(ti),I(ti),・・・,I(ti),・・・,I(ti))と表す。ここで添え字のiは、選択された基準画像を区別するためのものである。
変化量算出部203:
変化量算出部203は、基準画像選択部202にて選択された基準画像と基準画像に近接する画像である近接基準画像との間の変化量を算出する。
まず、変化量算出部203は、前処理部201にて前処理された系列画像列の中から、基準画像選択部202にて選択された基準画像に近い系列に属する1枚以上の画像を、近接基準画像として選択する。より具体的に説明すると、変化量算出部203は、例えば、系列画像列の中から、基準画像の系列パラメタtiと近い系列パラメタを持つ系列画像を優先的に1枚以上選択し、これを近接基準画像として選択してもよい。或いは、変化量算出部203は、まず、系列画像列の中から、ランダムに画像を選択し、次に、ランダムに選択した画像の中から、基準画像の系列パラメタtiと近い系列パラメタを持つ1枚以上の画像を、近接基準画像として選択してもよい。以下では、複数枚の画像を近接基準画像として選択した場合に、複数枚の近接基準画像を区別するために、近接基準画像をjで区別する。ただし、以下では、変化量算出部203にて近接基準画像として選択された画像が1枚である場合について説明する。また、以下では、変化量算出部203にて選択された近接基準画像をIij=I(tj)と表す。
なお、基準画像と近接基準画像との関係は、図3に示される関係であってもよい。すなわち、基準画像選択部202は、ある特定のフレームの1つの画像を基準画像として選択する。変化量算出部203は、その基準画像の次のフレームの画像を近接基準画像として選択し、基準画像と近接基準画像との間の変化量を算出する。変化量算出部203は、現在の近接基準画像の以降のフレームの画像を、順番に近接基準画像として選択し、選択した近接基準画像と基準画像との間の変化量を算出し、以降はこの動作を繰り返してもよい。すなわち、変化量は、基準画像と近接基準画像との間の変化量であるとしてもよい。
或いは、基準画像と近接基準画像との関係は、図4に示される関係であってもよい。すなわち、基準画像選択部202は、ある特定のフレームの1つの画像を基準画像として選択する。変化量算出部203は、その基準画像の次のフレームの画像を近接基準画像として選択し、基準画像と近接基準画像との間の変化量を算出する。変化量算出部203は、現在の近接基準画像の以降のフレームの画像を、順番に近接基準画像として選択し、選択した近接基準画像と1つ前のフレームの近接基準画像との変化量を算出し、以降はこの動作を繰り返してもよい。すなわち、変化量は、画像と、その画像の前の画像と、の間の変化量であるとしてもよい。
或いは、基準画像と近接基準画像との関係は、上記の2つの選択の仕方を統合して用いてもよい。
ここでいう変化量とは、基準画像と近接基準画像との変化、或いは、近接基準画像同士の変化を表す量を指す。具体的には、変化量算出部203は、例えば、基準画像と近接基準画像の画素値の差分値、その差分値の二乗値、或いは、その差分値の絶対値などを、変化量としてもよい。或いは、変化量算出部203は、基準画像と近接基準画像の画素値の差分値に対し、線形関数或いは非線形関数を用いて差分値を変換し、その値を変化量としてもよい。或いは、変化量算出部203は、基準画像の画素値と近接基準画像の画素値のそれぞれに対し、線形関数或いは非線形関数を用いて変換した値を算出し、これらの値の差分値を、変化量としてもよいし、これらの値の差分値に対し、さらに線形関数或いは非線形関数を用いて変換した値を変化量としてもよい。或いは、変化量算出部203は、基準画像の画素値と近接基準画像の画素値を引数とする関数を用いて変化量を算出してもよいし、正規化相互相関などの相関値を求める関数を用いて変化量を算出してもよい。或いは、変化量算出部203は、基準画像の画素値と近接基準画像の画素値から、画像の幾何変換や移動量(すなわちオプティカルフロー)を算出し、これを変化量としてもよい。なお、本実施の形態に係る変化量算出部203による変化量の算出方法はこれに限定されず、基準画像と近接基準画像のそれぞれの画素値を引数とする関数を用いた算出方法であれば何でもよい。また、上記の算出方法は、基準画像と近接基準画像の間の変化量の算出方法であるが、近接基準画像同士の変化量も、同様の方法で算出してよい。なお、以下では、変化量算出部203にて算出された変化量を、ΔIijと表し、以下ではこれを単純に変化量と呼ぶこともある。
或いは、変化量算出部203にて算出された変化量は、基準画像と近接基準画像との変化、或いは、近接基準画像同士の変化に加え、これら変化量に関する情報に加えて基準画像或いは近接基準画像の情報を加えたものであってもよい。或いは、変化量算出部203にて算出された変化量は、これまで過去に算出された変化量に加え、基準画像及び近接基準画像の情報を加えたものであってもよい。
画像情報回帰部204:
画像情報回帰部204は、基準画像選択部202にて選択された基準画像を入力として、画像情報回帰関数により、クラス信頼度を算出する。ここでいうクラス信頼度とは、例えば、照合結果や認識結果などを指す。より具体的には、例えば、クラス信頼度が照合結果である場合には、入力した基準画像と別途用意した画像との相違度や類似度がクラス信頼度に相当する。また、クラス信頼度が認識結果である場合は、入力した基準画像に含まれている物体や人物、或いは文字などの情報がクラス信頼度に相当する。なお、クラス信頼度が認識結果である場合、画像情報回帰部204にて算出される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に0或いは1(ゼロである場合はその物体が存在しないことを示し、1である場合はその物体が存在することを示す)を入力し、これをクラス信頼度として算出すればよい。或いは、クラス信頼度が認識結果である場合、画像情報回帰部204にて出力される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に各物体の信頼度(信頼度は大きければ大きいほど、その物体が存在することを示す)を入力し、これをクラス信頼度として算出すればよい。以下では、基準画像Iiのクラス信頼度をci(ti)=(c(ti),c(ti),・・・,c(ti),・・・,c(ti))と表す。ここで、Dは基準画像の次元であり、dは各次元を区別するための添え字である。例えば、クラス信頼度が認識結果である場合、Dはクラスの数を表す。
なお、本実施の形態において、クラス信頼度ci(ti)を算出するために用いる画像情報回帰関数は、利用者があらかじめ手動で入力することで与えてもよい。或いは、別途、図2に示した構成を用いて、この画像情報回帰関数を推定してもよい。また、画像情報回帰関数は、例えば、非特許文献1に記載の手法を用いて推定してもよい。また、画像情報回帰関数は、ディープニューラルネットワークによる回帰関数を用いてもよいし、ランダムフォレストを用いた回帰関数を用いてもよい。或いは、サポートベクトル回帰により、この画像情報回帰関数を獲得してもよい。
差分画像情報回帰部205:
差分画像情報回帰部205は、変化量算出部203にて算出された変化量を入力として、差分画像情報回帰関数により、近接クラス信頼度cij(tj)を算出する。ここでいう近接クラス信頼度cijとは、クラス信頼度ci(ti)と同様に、例えば、照合結果や認識結果などを指す。より具体的には、クラス信頼度ci(ti)と同様に、例えば、近接クラス信頼度cij(tj)が照合結果である場合には、入力した基準画像或いは入力した変化量に応じた差分画像と別途用意した画像との相違度や類似度が近接クラス信頼度に相当する。また、近接クラス信頼度cij(tj)が認識結果である場合は、入力した基準画像或いは入力した変化量に応じた差分画像に含まれている物体や人物、或いは文字などにおけるクラス信頼度が近接クラス信頼度に相当する。
なお、本実施の形態において、近接クラス信頼度cij(tj)を算出するために用いる差分画像情報回帰関数は、利用者があらかじめ手動で入力することで与えてもよい。或いは、別途、図2に示した構成を用いて、この差分画像情報回帰関数を推定してもよい。また、差分画像情報回帰関数は、例えば、非特許文献1に記載の手法を用いて推定してもよい。また、差分画像情報回帰関数は、ディープニューラルネットワークによる回帰関数を用いてもよいし、ランダムフォレストを用いた回帰関数を用いてもよい。或いは、サポートベクトル回帰により、この差分画像情報回帰関数を獲得してもよい。
信頼度統合部206:
信頼度統合部206は、差分画像情報回帰部205にて算出された近接クラス信頼度cij(tj)と、画像情報回帰部204にて算出されたクラス信頼度ci(ti)と、を統合した統合クラス信頼度を算出する。ここでいう統合クラス信頼度とは、クラス信頼度や近接クラス信頼度と同様に、例えば、照合結果や認識結果などを指す。より具体的には、例えば、統合クラス信頼度が照合結果である場合には、基準画像或いは変化量に応じた差分画像と別途用意した画像との相違度や類似度が統合クラス信頼度に相当する。また、統合クラス信頼度が認識結果である場合は、基準画像に含まれている物体や人物、或いは文字などの情報が統合クラス信頼度に相当する。なお、統合クラス信頼度が認識結果である場合、信頼度統合部206にて算出される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に0或いは1(ゼロである場合はその物体が存在しないことを示し、1である場合はその物体が存在することを示す)を入力し、これを統合クラス信頼度として算出すればよい。或いは、統合クラス信頼度が認識結果である場合、信頼度統合部206にて算出される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に各物体の信頼度(信頼度は大きければ大きいほど、その物体が存在することを示す)を入力し、これを統合クラス信頼度として算出すればよい。
なお、信頼度統合部206は、例えば、クラス信頼度ci(ti)と近接クラス信頼度cij(tj)の和或いは平均値或いは中央値或いは最大値、又はこれらを組み合わせた値を算出することで、クラス信頼度ci(ti)と近接クラス信頼度cij(tj)を統合してもよい。或いは、信頼度統合部206は、クラス信頼度ci(ti)と近接クラス信頼度cij(tj)の積を算出することで、クラス信頼度ci(ti)と近接クラス信頼度cij(tj)を統合してもよい。或いは、信頼度統合部206は、基準画像と差分画像の画素値を引数とする何らかの線形或いは非線形関数を設定し、この関数に基準画像と差分画像の画素値を代入し得られた出力を統合クラス信頼度として算出することで、クラス信頼度ci(ti)と近接クラス信頼度cij(tj)とを統合してもよい。或いは、信頼度統合部206は、plurality votingとsimple soft votingといった投票方法で信頼度を投票してもよい。
出力部301は、信頼度統合部206にて算出された統合クラス信頼度を出力する。
続いて、図2に示される画像処理システムにおける学習実行部の各構成要素の概要について述べる。
学習用系列画像列入力部102:
学習用系列画像列入力部102は、学習用にあらかじめ用意した、系列性のある系列画像列(以下、学習用系列画像列と呼ぶこともある)を入力する。ここでいう系列画像列とは、例えば、ビデオカメラや高速カメラなどで撮影した1つ以上の動画像などを指す。或いは、ここでいう系列画像列とは、例えば、顔や人物或いは物体など、被写体の姿勢を変化させて撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、例えば、照明やカメラの位置を変化させて、顔や人物或いは物体などの被写体を撮影した一連の画像列であってもよい。或いは、ここでいう系列画像列とは、顔や人物或いは物体などの被写体を、複数のスペクトル帯域で撮影したマルチスペクトル画像やハイパースペクトル画像であってもよい。すなわち、ここでいう系列画像列とは、ある一定の規則に基づき、被写体或いは撮影環境を時間的或いは空間的に変化させたものであれば何でもよい。なお、以下では、学習用系列画像列入力部102にて入力された画像の集合を{I(t)}=(I(t),・・・,I(t),・・・,I(t))と表し、以下ではこれを学習用系列画像群と呼ぶこともある。ここで、kは、入力した学習用系列画像を区別するための添え字であり、Kは、入力した学習用系列画像の総数である。
前処理部201a:
前処理部201aは、学習用系列画像列入力部102にて入力された学習用系列画像列を前処理(画像処理)することで、より画像認識に適した画像に変換する。なお、前処理部201aの動作の概要は、図1における前処理部201と同様であるので、記述は省略する。
学習用基準画像選択部202a:
学習用基準画像選択部202aは、前処理部201aにて前処理された学習用系列画像列の中から、1枚以上の画像を学習用基準画像として選択する。なお、学習用基準画像選択部202aの動作の概要は、図1における基準画像選択部202と同様であるので、記述は省略する。また、以下では、学習用基準画像選択部202aにて選択された学習用基準画像を、{Iki(ti)}或いは単に{Iki}と表す。
変化量算出部203a:
変化量算出部203aは、学習用基準画像選択部202aにて選択された学習用基準画像と学習用基準画像に近接する画像である近接学習用基準画像との間の変化量を算出する。なお、変化量算出部203aの動作の概要は、図1における変化量算出部203と同様であるので、記述は省略する。また、以下では、近接学習用基準画像を{Ikij(tj)}と表し、算出した変化量を{ΔIkij}と表す。
教師画像情報入力部103:
教師画像情報入力部103は、教師データとなる画像情報を教師画像情報として入力する。本実施の形態における教師画像情報とは、学習用基準画像{Iki}或いは学習用近接基準画像{Ikij}に対し、図1における画像情報回帰部204にて使用した画像情報回帰関数と同様の画像情報回帰関数を用いた場合に期待する出力(すなわち正解値或いは教師信号)と同様の出力を用いてもよい。
すなわち、教師画像情報入力部103にて入力される教師画像情報とは、照合結果や認識結果などの正解値(或いは教師信号)を指す。より具体的には、例えば、教師画像情報が照合結果である場合には、学習用基準画像或いは変化量に応じた差分画像と、別途用意した画像との相違度や類似度が教師画像情報に相当する。また、教師画像情報が認識結果である場合は、学習用基準画像に含まれている物体や人物、或いは文字などの情報が教師画像情報に相当する。なお、教師画像情報が認識結果である場合、教師画像情報入力部103にて入力される値は、通常の画像認識と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に0或いは1(ゼロである場合はその物体が存在しないことを示し、1である場合はその物体が存在することを示す)を入力し、これを教師画像情報として入力すればよい。或いは、教師画像情報が認識結果である場合、教師画像情報入力部103にて入力される値は、通常の画像認識における教師信号と同様に、人や物体或いは文字などのクラスに相当するベクトルを用意し、このベクトルの各要素に各物体の信頼度(信頼度は大きければ大きいほど、その物体が存在することを示す)を入力し、これを教師画像情報として入力すればよい。以下では、学習用基準画像{Iki}に対応する教師画像情報を{zki}と表し、変化量{ΔIkij}に対応する教師画像情報或いは変化量{ΔIkij}に応じた差分画像に対応する教師画像情報を{zkij}と表すこととする。
画像情報回帰関数推定部204a:
画像情報回帰関数推定部204aは、学習用基準画像選択部202aにて選択された学習用基準画像{Iki}と、教師画像情報入力部103にて入力された教師画像情報{zki}と、から、画像情報回帰関数を推定する。すなわち、画像情報回帰関数推定部204aは、学習用基準画像{Iki}及び教師画像情報{zki}を入力とし、画像情報回帰関数を推定する。画像情報回帰関数推定部204aは、例えば、深層学習により、画像情報回帰関数を推定してもよい。より具体的には、画像情報回帰関数推定部204aは、例えば、オートエンコーダーや変分オートエンコーダー(VAE:Variational Auto Encoder)などの手法を用いて、画像情報回帰関数を回帰してもよい。或いは、画像情報回帰関数推定部204aは、サポートベクトル回帰やランダムフォレストなどの方法を用いて、画像情報回帰関数を算出してもよい。
差分画像情報回帰関数推定部205a:
差分画像情報回帰関数推定部205aは、変化量算出部203aにて算出された、学習用基準画像{Iki}と学習用近接基準画像{Ikij}の間の変化量{ΔIkij}と、教師画像情報入力部103にて入力された教師画像情報{zkij}と、から、差分画像情報回帰関数を推定する。すなわち、差分画像情報回帰関数推定部205aは、変化量{ΔIkij}及び教師画像情報{zkij}を入力とし、差分画像情報回帰関数を推定する。差分画像情報回帰関数推定部205aは、例えば、深層学習により、差分画像情報回帰関数を推定してもよい。より具体的には、差分画像情報回帰関数推定部205aは、例えば、オートエンコーダーや変分オートエンコーダー(VAE)などの手法を用いて、の差分画像情報回帰関数を回帰してもよい。或いは、差分画像情報回帰関数推定部205aは、サポートベクトル回帰やランダムフォレストなどの方法を用いて、差分画像情報回帰関数を算出してもよい。
画像情報回帰関数出力部302:
画像情報回帰関数出力部302は、画像情報回帰関数推定部204aにて推定された画像情報回帰関数を出力する。図1における画像情報回帰部204は、画像情報回帰関数出力部302から出力された画像情報回帰関数を使用しても良いし、利用者があらかじめ手動で入力した画像情報回帰関数を使用しても良い。
差分画像情報回帰関数出力部303:
差分画像情報回帰関数出力部303は、差分画像情報回帰関数推定部205aにて推定された差分画像情報回帰関数を出力する。図1における差分画像情報回帰部205は、差分画像情報回帰関数出力部303から出力された差分画像情報回帰関数を使用しても良いし、利用者があらかじめ手動で入力した差分画像情報回帰関数を使用しても良い。
<実施の形態の動作>
以下、本実施の形態に係る画像処理システムの動作について説明する。
まず、図5を参照して、図1に示される画像処理システムにおける推論実行部の動作について説明する。図5は、図1に示される画像処理システムにおける推論実行部の動作フロー例を示すフロー図である。
図5を参照すると、まず、系列画像列入力部101は、系列画像列を入力する(S101)。
次に、前処理部201は、系列画像列入力部101にて入力された系列画像列の前処理を行う(S102)。
次に、基準画像選択部202は、前処理部201にて前処理された系列画像列の中から基準画像を選択する(S103)。
次に、変化量算出部203は、前処理部201にて前処理された系列画像列の中から、基準画像選択部202にて選択された基準画像に近接する近接基準画像を選択し、さらに、基準画像と近接基準画像との間の変化量を算出する(S104)。
次に、画像情報回帰部204は、基準画像選択部202にて選択された基準画像を入力として、基準画像情報回帰関数により、クラス信頼度を算出する(S105)。
次に、差分画像情報回帰部205は、変化量算出部203にて算出された変化量を入力として、差分画像情報回帰関数により、近接クラス信頼度を算出する(S106)。
次に、信頼度統合部206は、画像情報回帰部204にて算出されたクラス信頼度と、差分画像情報回帰部205にて算出された近接クラス信頼度と、を統合した統合クラス信頼度を算出する(S107)。
その後、出力部301は、信頼度統合部206にて算出された統合クラス信頼度を出力する(S108)。
続いて、図6を参照して、図2に示される画像処理システムにおける学習実行部の動作について説明する。図6は、図2に示される画像処理システムにおける学習実行部の動作フロー例を示すフロー図である。
図6を参照すると、まず、学習用系列画像列入力部102は、学習用系列画像列を入力する(S201)。
次に、教師画像情報入力部103は、教師データとなる画像情報を教師画像情報として入力する(S202)。
次に、前処理部201aは、学習用系列画像列入力部102にて入力された学習用系列画像列の前処理を行う(S203)。
次に、学習用基準画像選択部202aは、前処理部201aにて前処理された学習用系列画像列の中から学習用基準画像を選択する(S204)。
次に、変化量算出部203aは、前処理部201aにて前処理された学習用系列画像列の中から、学習用基準画像選択部202aにて選択された学習用基準画像に近接する近接学習用基準画像を選択し、さらに、学習用基準画像と近接学習用基準画像との間の変化量を算出する(S205)。
次に、画像情報回帰関数推定部204aは、学習用基準画像選択部202aにて選択された学習用基準画像と、教師画像情報入力部103にて入力された教師画像情報と、から、画像情報回帰関数を推定する(S206)。
また、差分画像情報回帰関数推定部205aは、変化量算出部203aにて算出された変化量と、教師画像情報入力部103にて入力された教師画像情報と、から、差分画像情報回帰関数を推定する(S207)。
その後、画像情報回帰関数出力部302は、画像情報回帰関数推定部204aにて推定された画像情報回帰関数を出力する(S208)。
また、差分画像情報回帰関数出力部303は、差分画像情報回帰関数推定部205aにて推定された差分画像情報回帰関数を出力する(S209)。
<実施の形態の効果>
以下、本実施の形態に係る画像処理システムの効果について説明する。
(1)第1の効果
本実施の形態における第1の効果は、高速カメラを用いて取得したフレームレートが大きな動画像や、複数の照明条件で物体を撮像した画像群などを入力とした場合、より少ない計算負荷で画像認識などの画像処理を行えるという点がある。
以下に、その理由について述べる。本実施の形態では、まず、変化量算出部203が、基準画像と、基準画像に近接する画像である近接基準画像と、の間の変化量を算出する。次に、画像情報回帰部204が、基準画像を入力として、画像情報回帰関数によりクラス信頼度を算出し、次に、差分画像情報回帰部205が、変化量のみを入力として、差分画像情報回帰関数により、クラス信頼度を算出する。次に、信頼度統合部206が、これらの信頼度を統合する。本実施の形態はこのような構成になっている。
一般的に、画像そのものの値(すなわち画素値)に比べ、系列に沿った画像間の変化は小さい。このように、相対的に変化量が小さい場合には、差分画像情報回帰関数における計算負荷も小さくてすむ。そのため、結果として、差分画像情報回帰関数の推定や実行(推論)に必要とされる計算コストも小さくてよい。すなわち、より高速に差分画像情報回帰関数の推定や実行(すなわち推論)を行うことが可能となる。
別の見方をすると、例えば、画像情報回帰関数及び差分画像情報回帰関数をニューラルネットワークにより構成する場合を考える(図3及び図4を参照)。この場合、変化量に応じた差分画像を用いることで、画像間の相対的な変化のみに着目することができるため、通常の画像を用いた場合に必要であった前段の層を削減することが可能となる。そのため、差分画像を用いない場合に比べ、計算コストが小さくてすむ。すなわち、より高速に差分画像情報回帰関数の推定や実行(すなわち推論)を行うことが可能となる。
(2)第2の効果
さらに、本実施の形態における第2の効果として、画像認識を安定的に行えるという点がある。なぜならば、上述したように、本実施の形態では、画像情報回帰部204にて算出されたクラス信頼度と、差分画像情報回帰部205にて算出されたクラス信頼度と、を統合するという構成になっている。
そのため、1枚の画像のみを用いて画像を認識する場合と比較し、差分画像情報回帰部205にて出力されたクラス信頼度も用いて画像を認識するために、より多くの情報を用いて、画像認識を行うことができる。なぜならば、例えば、画像情報回帰部204にて算出されたクラス信頼度が曖昧である、或いは誤っている場合であっても、差分画像情報回帰部205にて算出されたクラス信頼度が正しい場合は、画像を正しく認識することができるためである。
別の見方をすると、画像認識では、空間方向の微分情報(すなわち空間的な差分情報)を特徴量として画像特徴を記述するのが一般的である。この理由は、輝度情報の空間的な変化の方が、輝度値そのものよりも、物体の輪郭などの情報を強調して記述でき、認識性能が向上するためである。一方、高速カメラなどを用いて撮像され、対象となる物体に対して、わずかに動きが異なる時系列画像を、系列画像列入力部101にて入力することを考える。時系列画像から、空間的な輝度値の変化を算出するだけでなく、時間的な輝度値の変化を算出し、それを特徴として用いることで、物体の輪郭の変化などの情報を強調して記述することができる。すなわち、変化量算出部203にて算出される変化量は、物体の輪郭などの変化を強調した情報であり、これを用いて差分情報回帰関数を構成することで、認識性能が向上させることができるためである。
(3)第3の効果
さらに、本実施の形態における第3の効果として、画像認識をより少ない学習データから行えるという点がある。なぜならば、上述したように、一般的に、画像そのものの値(すなわち画素値)に比べ、系列に沿った画像間の画素値の変化は小さいため、変化量算出部203aにて算出される変化量は相対的に小さな値を持つ。このように、相対的に変化量が小さい場合には、差分画像情報回帰関数の推定を行う場合に、関数の探索範囲が小さくてすむ。そのため、安定的に関数の推定を行うために必要な学習データが少なくてすむ。
なお、本実施の形態に係る画像処理システムは、1台のコンピュータ(画像処理装置)で実現することができる。以下、図7を参照して、本実施の形態に係る画像処理システムを実現するコンピュータ40のハードウェア構成について説明する。図7は、本実施の形態に係る画像処理システムを実現するコンピュータ40のハードウェア構成例を示すブロック図である。
図7を参照すると、本実施の形態に係る画像処理システムは、コンピュータ40で実現することができる。コンピュータ40は、プロセッサ41、メモリ42、ストレージ43、入出力インタフェース(入出力I/F)44、及び通信インタフェース(通信I/F)45等を備えている。プロセッサ41、メモリ42、ストレージ43、入出力インタフェース44、及び通信インタフェース45は、相互にデータを送受信するためのデータ伝送路で接続されている。
プロセッサ41は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の演算処理装置である。メモリ42は、例えば、RAM(Random Access Memory)やROM(Read Only Memory)等のメモリである。ストレージ43は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はメモリカード等の記憶装置である。また、ストレージ43は、RAMやROM等のメモリであっても良い。
ストレージ43は、本実施の形態に係る画像処理システムが備える各構成要素の機能を実現するプログラム(画像処理プログラム)を記憶している。プロセッサ41は、これら各プログラムを実行することで、本実施の形態に係る画像処理システムが備える各構成要素の機能をそれぞれ実現する。ここで、プロセッサ41は、上記各プログラムを実行する際、これらのプログラムをメモリ42上に読み出してから実行しても良いし、メモリ42上に読み出さずに実行しても良い。
また、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータ(コンピュータ40を含む)に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Compact Disc-Read Only Memory)、CD−R(CD-Recordable)、CD−R/W(CD-ReWritable)、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されても良い。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
入出力インタフェース44は、不図示の表示装置や入力装置等と接続される。表示装置は、例えば、LCD(Liquid Crystal Display)やCRT(Cathode Ray Tube)ディスプレイのような、プロセッサ41により処理された描画データに対応する画面を表示する装置である。また、入力装置は、例えば、オペレータの操作入力を受け付ける装置であり、例えば、キーボード、マウス、及びタッチセンサなどである。表示装置及び入力装置は一体化され、タッチパネルとして実現されていても良い。
通信インタフェース45は、外部の装置との間でデータを送受信する。例えば、通信インタフェース45は、有線ネットワーク又は無線ネットワークを介して外部装置と通信する。
以上、実施の形態を参照して本開示を説明したが、本開示は上記の実施の形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
例えば、本開示に係る画像処理システムは、図1に示された構成要素のうち、前処理部201を除く構成要素で最小構成を形成しても良い。この最小構成でも、本開示の効果が得られて、本開示の課題を解決することが可能である。
101 系列画像列入力部
20 推論処理部
201 前処理部
202 基準画像選択部
203 変化量算出部
204 画像情報回帰部
205 差分画像情報回帰部
206 信頼度統合部
301 出力部
102 学習用系列画像列入力部
103 教師画像情報入力部
21 学習処理部
201a 前処理部
202a 学習用基準画像選択部
203a 変化量算出部
204a 画像情報回帰関数推定部
205a 差分画像情報回帰関数推定部
302 画像情報回帰関数出力部
303 差分画像情報回帰関数出力部
40 コンピュータ
41 プロセッサ
42 メモリ
43 ストレージ
44 入出力インタフェース
45 通信インタフェース

Claims (8)

  1. 系列性のある系列画像列を入力する系列画像列入力部と、
    前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
    前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
    前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
    前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
    前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
    前記統合されたクラス信頼度を出力する出力部と、
    を備える、画像処理システム。
  2. 前記画像情報回帰部は、前記基準画像を入力として、画像情報回帰関数を用いた回帰処理により、クラス信頼度を算出し、
    前記差分画像情報回帰部は、前記第1変化量を入力として、差分画像情報回帰関数を用いた回帰処理により、クラス信頼度を算出する、
    請求項1に記載の画像処理システム。
  3. 系列性のある学習用系列画像列を入力する系列画像列入力部と、
    教師データとなる画像情報を教師画像情報として入力する教師画像情報入力部と、
    前記学習用系列画像列の中から、1枚以上の画像を学習用基準画像として選択する学習用基準画像選択部と、
    前記学習用系列画像列の中から、前記学習用基準画像に近接する近接学習用基準画像を選択し、前記学習用基準画像と前記近接学習用基準画像の間の変化量である第2変化量を算出する第2変化量算出部と、
    前記教師画像情報と前記学習用基準画像とから、前記画像情報回帰関数を推定する画像情報回帰関数推定部と、
    前記教師画像情報と前記第2変化量とから、前記差分画像情報回帰関数を推定する差分画像情報回帰関数推定部と、
    をさらに備え、
    前記画像情報回帰部は、前記画像情報回帰関数として、前記画像情報回帰関数推定部にて推定された画像情報回帰関数を用い、
    前記差分画像情報回帰部は、前記差分画像情報回帰関数として、前記差分画像情報回帰関数推定部にて推定された差分画像情報回帰関数を用いる、
    請求項2に記載の画像処理システム。
  4. 前記基準画像選択部は、前記系列画像列の中から、特定のフレームの画像を前記基準画像として選択し、
    前記第1変化量算出部は、
    前記系列画像列の中から、前記基準画像の次のフレームの画像を前記近接基準画像として選択し、前記基準画像と前記近接基準画像との間の変化量を算出し、
    以降、前記系列画像列の中から、現在の近接基準画像の以降のフレームの画像を、順番に前記近接基準画像として選択し、選択した前記近接基準画像と前記基準画像との間の変化量を算出する、という動作を繰り返す、
    請求項1から3のいずれか1項に記載の画像処理システム。
  5. 前記基準画像選択部は、前記系列画像列の中から、特定のフレームの画像を前記基準画像として選択し、
    前記第1変化量算出部は、
    前記系列画像列の中から、前記基準画像の次のフレームの画像を前記近接基準画像として選択し、前記基準画像と前記近接基準画像との間の変化量を算出し、
    以降、前記系列画像列の中から、現在の近接基準画像の以降のフレームの画像を、順番に前記近接基準画像として選択し、選択した前記近接基準画像と1つ前のフレームの前記近接基準画像との変化量を算出する、という動作を繰り返す、
    請求項1から3のいずれか1項に記載の画像処理システム。
  6. 系列性のある系列画像列を入力する系列画像列入力部と、
    前記系列画像列の中から、1枚以上の画像を基準画像として選択する基準画像選択部と、
    前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する第1変化量算出部と、
    前記基準画像を入力として、クラス信頼度を回帰処理により算出する画像情報回帰部と、
    前記第1変化量を入力として、クラス信頼度を回帰処理により算出する差分画像情報回帰部と、
    前記画像情報回帰部にて算出されたクラス信頼度と、前記差分画像情報回帰部にて算出されたクラス信頼度と、を統合する信頼度統合部と、
    前記統合されたクラス信頼度を出力する出力部と、
    を備える、画像処理装置。
  7. 画像処理装置による画像処理方法であって、
    系列性のある系列画像列を入力するステップと、
    前記系列画像列の中から、1枚以上の画像を基準画像として選択するステップと、
    前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出するステップと、
    前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰ステップと、
    前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰ステップと、
    前記第1回帰ステップにて算出されたクラス信頼度と、前記第2回帰ステップにて算出されたクラス信頼度と、を統合するステップと、
    前記統合されたクラス信頼度を出力するステップと、
    を含む、画像処理方法。
  8. コンピュータに、
    系列性のある系列画像列を入力する手順と、
    前記系列画像列の中から、1枚以上の画像を基準画像として選択する手順と、
    前記系列画像列の中から、前記基準画像に近接する近接基準画像を選択し、前記基準画像と前記近接基準画像の間の変化量である第1変化量を算出する手順と、
    前記基準画像を入力として、クラス信頼度を回帰処理により算出する第1回帰手順と、
    前記第1変化量を入力として、クラス信頼度を回帰処理により算出する第2回帰手順と、
    前記第1回帰手順にて算出されたクラス信頼度と、前記第2回帰手順にて算出されたクラス信頼度と、を統合する手順と、
    前記統合されたクラス信頼度を出力する手順と、
    を実行させるための画像処理プログラムが格納された非一時的なコンピュータ可読媒体。
JP2021508361A 2019-03-22 2019-03-22 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム Active JP7176616B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/012083 WO2020194378A1 (ja) 2019-03-22 2019-03-22 画像処理システム、画像処理装置、画像処理方法、及びコンピュータ可読媒体

Publications (2)

Publication Number Publication Date
JPWO2020194378A1 true JPWO2020194378A1 (ja) 2021-12-23
JP7176616B2 JP7176616B2 (ja) 2022-11-22

Family

ID=72609227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021508361A Active JP7176616B2 (ja) 2019-03-22 2019-03-22 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム

Country Status (3)

Country Link
US (1) US11748977B2 (ja)
JP (1) JP7176616B2 (ja)
WO (1) WO2020194378A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6902150B1 (ja) * 2020-11-17 2021-07-14 株式会社タナカ技研 画像認識装置、学習システム、画像蓄積装置、画像認識方法、画像蓄積方法、およびプログラム
CN116561525B (zh) * 2023-07-07 2023-09-12 四川君安天源精酿啤酒有限公司 基于物联网的精酿啤酒酿造数据智能监测方法
CN117896482B (zh) * 2024-03-15 2024-05-07 东莞市嘉钦精工科技有限公司 一种车辆行车记录仪的数据智能存储方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007328435A (ja) * 2006-06-06 2007-12-20 Mitsubishi Electric Corp 移動体行動分析装置
JP2010165046A (ja) * 2009-01-13 2010-07-29 Canon Inc 情報処理装置及び情報処理方法
JP2011018996A (ja) * 2009-07-07 2011-01-27 Nikon Corp 撮像装置
JP2011205387A (ja) * 2010-03-25 2011-10-13 Sony Corp 画像処理装置および方法、並びにプログラム
WO2018230294A1 (ja) * 2017-06-15 2018-12-20 シャープ株式会社 動画像処理装置、表示装置、動画像処理方法、および制御プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160321522A1 (en) * 2015-04-30 2016-11-03 Canon Kabushiki Kaisha Devices, systems, and methods for pairwise multi-task feature learning
US20180268292A1 (en) * 2017-03-17 2018-09-20 Nec Laboratories America, Inc. Learning efficient object detection models with knowledge distillation
CN109685762A (zh) * 2018-11-09 2019-04-26 五邑大学 一种基于多尺度深度语义分割网络的天线下倾角测量方法
US20200175384A1 (en) * 2018-11-30 2020-06-04 Samsung Electronics Co., Ltd. System and method for incremental learning
US10817777B2 (en) * 2019-01-31 2020-10-27 StradVision, Inc. Learning method and learning device for integrating object detection information acquired through V2V communication from other autonomous vehicle with object detection information generated by present autonomous vehicle, and testing method and testing device using the same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007328435A (ja) * 2006-06-06 2007-12-20 Mitsubishi Electric Corp 移動体行動分析装置
JP2010165046A (ja) * 2009-01-13 2010-07-29 Canon Inc 情報処理装置及び情報処理方法
JP2011018996A (ja) * 2009-07-07 2011-01-27 Nikon Corp 撮像装置
JP2011205387A (ja) * 2010-03-25 2011-10-13 Sony Corp 画像処理装置および方法、並びにプログラム
WO2018230294A1 (ja) * 2017-06-15 2018-12-20 シャープ株式会社 動画像処理装置、表示装置、動画像処理方法、および制御プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高垣 幸秀、青野 雅樹: ""Deep Spatio−Temporal Transformationを用いた逐次人物動作検出"", 電子情報通信学会技術研究報告, vol. 117, no. 238, JPN6019016985, 5 October 2017 (2017-10-05), JP, pages 31 - 35, ISSN: 0004893731 *

Also Published As

Publication number Publication date
US20220351497A1 (en) 2022-11-03
JP7176616B2 (ja) 2022-11-22
WO2020194378A1 (ja) 2020-10-01
US11748977B2 (en) 2023-09-05

Similar Documents

Publication Publication Date Title
US20200167554A1 (en) Gesture Recognition Method, Apparatus, And Device
EP3540637B1 (en) Neural network model training method, device and storage medium for image processing
KR102629380B1 (ko) 실제 3차원 객체를 실제 객체의 2-차원 스푸프로부터 구별하기 위한 방법
WO2021036059A1 (zh) 图像转换模型训练方法、异质人脸识别方法、装置及设备
US10832069B2 (en) Living body detection method, electronic device and computer readable medium
JP6624794B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN108197618B (zh) 用于生成人脸检测模型的方法和装置
US20150215590A1 (en) Image demosaicing
Qin et al. Robust match fusion using optimization
JP7176616B2 (ja) 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム
JP2011134114A (ja) パターン認識方法およびパターン認識装置
US11704563B2 (en) Classifying time series image data
US20210082127A1 (en) Image analysis apparatus, image analysis method, and storage medium to display information representing flow quantity
Yao et al. Improving long range and high magnification face recognition: Database acquisition, evaluation, and enhancement
JP7419080B2 (ja) コンピュータシステムおよびプログラム
WO2019102535A1 (ja) 脈波検出装置、脈波検出方法、及び記憶媒体
WO2022227765A1 (zh) 生成图像修复模型的方法、设备、介质及程序产品
CN116309983B (zh) 虚拟人物模型的训练方法、生成方法、装置和电子设备
CN111710008B (zh) 人流密度的生成方法、装置、电子设备以及存储介质
WO2020021879A1 (ja) 画像処理装置、および画像処理方法、並びにプログラム
JP2006146413A (ja) 対象追従装置
JP7312026B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN116912783A (zh) 核酸检测平台的状态监控方法及系统
JP2015179426A (ja) 情報処理装置、パラメータの決定方法、及びプログラム
JPWO2011033744A1 (ja) 画像処理装置、画像処理方法および画像処理用プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210827

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221024

R151 Written notification of patent or utility model registration

Ref document number: 7176616

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151