JP2020047170A - 画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法 - Google Patents

画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法 Download PDF

Info

Publication number
JP2020047170A
JP2020047170A JP2018177007A JP2018177007A JP2020047170A JP 2020047170 A JP2020047170 A JP 2020047170A JP 2018177007 A JP2018177007 A JP 2018177007A JP 2018177007 A JP2018177007 A JP 2018177007A JP 2020047170 A JP2020047170 A JP 2020047170A
Authority
JP
Japan
Prior art keywords
image
value
pixel
neural network
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018177007A
Other languages
English (en)
Inventor
剛志 森谷
Tsuyoshi Moriya
剛志 森谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to JP2018177007A priority Critical patent/JP2020047170A/ja
Publication of JP2020047170A publication Critical patent/JP2020047170A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

【課題】認識精度を向上させる画像認識装置などを提供する。【解決手段】画像認識装置は、第1のニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識装置であって、第1のニューラルネットワークモデルの入力値として、認識対象画像の各画素のRGB値又はHS値とBv値とを用い、第1のニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。このような構成により、ニューラルネットワークモデルを用いて画像を認識するときに、ニューラルネットワークモデルの入力値としてRGB値と明るさの情報であるBv値とを用いて、認識対象画像の各画素に適切にラベル付けをして認識精度を向上させることができる。【選択図】図1

Description

本発明は画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法に関する。
画像認識の一手法として、対象画像の各画素にラベル付けを行うセマンティック・セグメンテーションが開発されている。
例えば、特許文献1には、ニューラルネットワークモデルを用いる認識装置において、認識対象画像の各画素に「道路」、「障害物」、「空」などの、いわゆる被写体種別(クラス)、意味などのラベルを付与し、更に、認識対象画像が属するシーンを「高速道路」、「トンネル」などと識別することが記載されている。
特開2018−073308号公報
特許文献1に係る認識装置では、ニューラルネットワークモデルの入力データ(入力値)として、RGB値(赤、緑、青)、HS値(色相、彩度)、距離などを用いている。
しかしながら、ニューラルネットワークモデルを用いる認識装置において、このような入力値を用いた場合に、各画素のラベル付けを間違えて、シーン識別も間違えることがあった。例えば、認識対象画像中の屋内の絵画の青色画素に対して「空」とラベル付けをして、認識対象画像が属するシーンを屋外の「公園」などと判定することがあった。
本発明は、このような問題を解決するためになされたもので、認識精度を向上させることができる画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法を提供することを目的とする。
本発明に係る画像認識装置は、第1のニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識装置であって、第1のニューラルネットワークモデルの入力値として、認識対象画像の各画素のRGB値又はHS値とBv値とを用い、第1のニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
また、本発明に係るニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
また、本発明に係る撮像装置は、画像を撮像する撮像部と、ニューラルネットワークモデルを用いて当該画像の各画素にラベル付けをして、当該画像が属する撮像シーンを判別する画像認識部と、当該撮像シーンに基づいて、当該画像に画像処理を行う画像処理部とを備える撮像装置であって、画像認識部は、ニューラルネットワークモデルの入力値として当該画像の各画素のRGB値又はHS値とBv値とを用い、ニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
また、本発明に係る画像認識方法は、ニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識方法であって、ニューラルネットワークモデルの入力値として、認識対象画像の各画素のRGB値又はHS値とBv値とを用い、ニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
本発明により、認識精度を向上させる画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法を提供することができる。
実施の形態1に係る画像認識装置を備えた撮像装置1の概略構成を示すブロック図である。 実施の形態1に係る画像認識方法の処理手順を示すフローチャートである。 実施の形態1に係る画像認識方法のラベル付け結果を示す図である。 実施の形態2に係る画像認識装置を備えたパソコン101の概略構成を示すブロック図である。
(実施の形態1)
本実施の形態1に係る画像認識装置及び画像認識方法は、ニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをするもので、このニューラルネットワークモデルの入力値として、認識対象画像の各画素のRGB値及び被写体輝度値(Bv)を用いて、認識精度を向上させるものである。このとき、各画素のBv値は、認識対象画像を撮像したときの露出制御情報、具体的には、シャッター速度、絞り値及び撮影感度(ISO感度)を用いて算出する。
以下、図面を参照して本実施の形態1に係る画像認識装置及び画像認識方法について説明する。
なお、本明細書において、「画像」には静止画像及び動画像が含まれるものとする。
また、本実施の形態1に係る画像認識装置及び画像認識方法において、ニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする手法、すなわち、セマンティック・セグメンテーションの手法は、認識対象画像の各画素のRGB値及びBv値をニューラルネットワークモデルの入力値とする点を除いて、特に限定されるものではなく、公知の手法を用いることができる。
また、ニューラルネットワークモデルを用いて認識対象画像が属するシーンを識別する手法も、特に限定されるものではなく、公知の手法を用いることができる。
まず、本実施の形態1に係る画像認識装置の構成について説明する。
本実施の形態1に係る画像認識装置は、撮像装置内に組み込まれて、入力データ生成部及び認識部として機能し、認識対象画像(撮像画像)の各画素にラベル付けをし、更に、撮像画像が属するシーンを識別するものである。
図1は、本実施の形態1に係る画像認識装置(入力データ生成部14及び画像認識部15)を備えた撮像装置1の概略構成を示すブロック図である。
撮像装置1は、例えば、デジタルカメラ、スマートフォンなどであって、レンズ光学系11、撮像素子(撮像部)12、アナログフロントエンド(AFE)回路13、入力データ生成部14、認識部15、画像信号処理回路(画像処理部)16、画像表示部17、画像記録部18、ドライバ(Driver)19、タイミングジェネレータ(TG)20、システム制御部21などを備えている。
レンズ光学系11は、レンズ(Lens)、絞り、シャッター(Shutter)などを有し、被写体像を撮像素子12の撮像面に結像する。
撮像素子12は、CCD、CMOSなどのイメージセンサであり、被写体像を光電変換して撮像画像の画像信号(RGB色信号)を生成して出力する。
AFE回路13は、撮像素子12が出力し、CDS回路(図示せず)が信号処理を施したアナログの画像信号をA/D変換してデジタルの画像信号とし、入力データ生成部14に出力する。
入力データ生成部14は、画像信号及び露光制御情報を用いて各画素のRGB値及びBv値を生成し、認識部15に出力する。露光制御情報から各画素のBv値を算出する方法については後述する。
認識部15は、ニューラルネットワークモデルを用いて撮像画像の各画素にラベル付けを行い、更に、撮像画像が属するシーン(撮像シーン)を識別する。このとき、認識部15は、ニューラルネットワークモデルの入力値として、撮像画像の各画素のRGB値及びBv値を用いる。
なお、ニューラルネットワークモデルは、教師画像の各画素のRGB値及びBv値を入力値として、当該教師画像の各画素にラベル付けをするように機械学習させたものであって、例えば、パーソナルコンピュータ(パソコン)などにおいて予め生成して、認識部15に記憶させることができる。
また、このニューラルネットワークモデルは、1つのニューラルネットワークで構成されても良いし、複数のニューラルネットワークが結合されて構成されても良い。
画像信号処理回路16は、認識部15が識別した撮像シーンに応じて、AFE回路13が出力した画像信号にエッジ強調処理、ガンマ補正処理、ホワイトバランス(WB)補正処理、色再現マトリックス(CCマトリックス)処理などの画像処理を施す。
画像表示部17は画像処理した撮像画像、ラベル付けした撮像画像などを表示し、画像記録部18は画像処理した撮像画像、ラベル付けした撮像画像などを記録する。
ドライバ19は、レンズ光学系11のレンズ、絞り、シャッターを駆動する。
タイミングジェネレータ20は、撮像素子12を駆動するためのタイミングを生成する。
システム制御部21は、撮像装置1を構成する各要素を直接的に又は間接的に制御する。また、システム制御部21は、各撮像画像の露光制御情報を算出して入力データ生成部14に出力する。また、システム制御部21は、認識部15が識別した撮像シーンに合わせてAE(Automatic Exposure)条件を設定する。
なお、本実施の形態1に係る撮像装置1では、認識部15は、例えば、GPU(Graphics Processing Unit)である認識部15が備える演算装置(図示せず)の制御によって、認識部15にニューラルネットワークモデルを用いて各画素にラベル付けをする画像認識方法を実行させるためのプログラムを実行させることにより実現することができる。
より具体的には、認識部15は、記憶部(図示せず)に格納されたプログラムを主記憶装置(図示せず)にロードし、演算装置の制御によってプログラムを実行して実現する。
上述したプログラムは、様々なタイプの記録メディア、すなわち、非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、認識部15に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。
非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。
また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によって認識部15に供給されても良い。一時的なコンピュータ可読媒体の例は、電気信号、光信号及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバなどの有線通信路、又は、無線通信路を介して、プログラムを認識部15に供給できる。
次に、本実施の形態1に係る画像認識装置(入力データ生成部14及び認識部15)の動作、すなわち、画像認識方法について、撮像装置1の動作と関連付けて説明する。
図2は、本実施の形態1に係る画像認識方法の処理手順を示すフローチャートである。
まず、画像認識方法を実施するための準備として、前述したように、パソコンなど、教師画像の各画素のRGB値及びBv値を入力値とし、教師画像の各画素にラベル付けをし、更に、教師画像が属するシーンを識別するように学習させたニューラルネットワークモデルを生成し、そのプログラムを記録媒体などを介して認識部15に記憶させる。
そして、撮像装置1のシャッターが押されて、撮像素子12が画像を撮像する(ステップS10)と、入力データ生成部14は、撮像画像のRGB値と、露光制御情報とを取得する(ステップS20)。
次に、入力データ生成部14は、撮像画像のRGB値及び露光制御情報から各画素のBv値を算出する(ステップS30)。
具体的には、入力データ生成部14は露光制御情報、すなわち、シャッター速度(Tv)、絞り値(Av)及び撮影感度(Sv)をAPEX関係式(式1)に入力して、撮像画像全体の被写体輝度値(Bvf)を求める。

Bvf=Av+Tv−Sv ・・・(1)
そして、システム制御部21の目標輝度となる信号レベルAEターゲット(AET)と、各画素のG値(rawG)とから各画素の輝度差分値(ΔBv)を求める(式2)。
そして、撮像画像全体の被写体輝度値(Bvf)に各画素の輝度差分値(ΔBv)を加算して、各画素のBv値を求める(式3)。

Bv=Bvf+ΔBv ・・・(3)
次に、認識部15は、各画素のRGB値及びBv値をニューラルネットワークモデルの入力値とし(ステップS40)、ニューラルネットワークモデルを用いて撮像画像の各画素にラベル付けをし(ステップS50)、撮像画像が属するシーンを識別して出力する(ステップS60)。
図3は、本実施の形態1に係る画像認識方法のラベル付け結果を示す図である。参考のために、比較例の画像認識方法のラベル付け結果も一緒に示している。
図3(a)は撮像画像Aを示し、図3(b)は撮像画像Aを教師画像としたときのラベル付け内容を示す。
これらの画像では、画像上部に樹木の枝が「空(sky)」を背景として広がり、画像下部に「水面(water)」が広がっている。また、画像中央部の左右では、皿の形をした「噴水(Other)」から「水(Gray)」が噴き上がり、この2つの噴水の間には、樹木の更に奥に「森林(Plant)」が広がり、森林の上には「建物(Building)」の上部が突き出ている。
そして、撮像画像Aを教師画像の1つとして用いて、比較例では各教師画像の各画素のRGB値をニューラルネットワークモデルγの入力値として学習させ、本実施の形態1に係る画像認識方法では各教師画像の各画素のRGB値及びBv値をニューラルネットワークモデルαの入力値として学習させた。
図3(c)は撮像画像Aの各画素のRGB値を比較例の学習済みのニューラルネットワークモデルγの入力値としたときのラベル付け結果であり、図3(d)は撮像画像Aの各画素のRGB値及びBv値を本実施の形態1に係る学習済みのニューラルネットワークモデルαの入力値としたときのラベル付け結果である。
これらのラベル付け結果を比べると、本実施の形態1に係るラベル付け結果の方が「水面」、「空」について、より適切にラベル付けをしており、撮像画像Aに対して、より適切に撮像シーンを識別できることがわかる。
次に、画像信号処理回路16が、識別した撮像シーンに応じて、撮像画像にエッジ強調処理、ガンマ補正処理、ホワイトバランス補正処理、CCマトリックス処理などの画像処理を施す(ステップS70)。また、システム制御部21が識別した撮像シーンに応じてAEの明るさを調整して、より適切に被写体を撮像できるようにする。
最後に、各種画像処理をした撮像画像、ラベル付けした撮像画像などを画像表示部17に表示し、画像記録部18に記憶して(ステップS80)、処理を終了する。
なお、本実施の形態1に係る画像認識装置又は画像認識方法では、さまざまな変形、応用などが可能である。
例えば、ニューラルネットワークモデルの入力値として、RGB値に代えて、HS値を用いても良いし、入力チャネル数を各画素のRGB値及びBv値の4チャネルに各画素の被写体距離値を加えて5チャネルとしても良い。
また、本実施の形態1に係る入力データ生成部14及び認識部15は、例えば、カメラとともに自動車に搭載されて、当該自動車の自動運転のためのデータを生成するようにしても良い。
以上、説明したように、本実施の形態1に係る画像認識装置14、15は、第1のニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識装置であって、第1のニューラルネットワークモデルの入力値として、認識対象画像の各画素のRGB値又はHS値とBv値とを用い、第1のニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
このような構成により、ニューラルネットワークモデルを用いて画像を認識するときに、ニューラルネットワークモデルの入力値としてRGB値と被写体の明るさの情報であるBv値とを用いて、認識対象画像の各画素に適切にラベル付けをして認識精度を向上させることができる。
例えば、ニューラルネットワークモデルの入力値として明るさの情報であるBv値を加えることで、同じ青色の画素であっても、「空」と青色の「看板」とを適切に推定することができる。
また、本実施の形態1に係る画像認識装置14、15は、認識対象画像の各画素のBv値が、認識対象画像を撮像したときのシャッター速度、絞り値及び撮影感度に基づいて算出したものであることが好ましい。
このような構成により、認識対象画像である撮像画像の各画素に適切にラベル付けをすることができる。
また、本実施の形態1に係るニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
このような構成により、認識対象画像の各画素に適切にラベル付けをして認識精度を向上させることができる。
また、本実施の形態1に係る撮像装置1は、画像を撮像する撮像部12と、ニューラルネットワークモデルを用いて撮像画像の各画素にラベル付けをして、撮像画像が属する撮像シーンを判別する画像認識部14、15と、撮像シーンに基づいて、撮像画像に画像処理を行う画像処理部16とを備える撮像装置であって、画像認識部14、15は、ニューラルネットワークモデルの入力値として撮像画像の各画素のRGB値又はHS値とBv値とを用い、ニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
このような構成により、撮像画像の各画素に適切にラベル付けをし、撮像画像が属するシーンを適切に識別して、認識精度を向上させることができる。
また、本実施の形態1に係る画像認識方法は、ニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識方法であって、ニューラルネットワークモデルの入力値として、各画素のRGB値又はHS値とBv値とを用い、ニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、教師画像の各画素にラベル付けをするように学習させたものである。
このような構成により、ニューラルネットワークモデルを用いて画像を認識するときに、ニューラルネットワークモデルの入力値としてRGB値と明るさの情報であるBv値とを用いて、認識対象画像の各画素に適切にラベル付けをして認識精度を向上させることができる。
(実施の形態2)
実施の形態1に係る画像認識装置及び画像認識方法は、ニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをするときに、認識対象画像の各画素のRGB値と、露出制御情報に基づいて算出した各画素のBv値とをニューラルネットワークモデルの入力値とするものであった。
これに対して、本実施の形態2に係る画像認識装置及び画像認識方法は、認識対象画像の各画素のRGB値及びBv値を入力値とする第1のニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをするときに、各画素のBv値として、認識対象画像の各画素のRGB値を入力値とする第2のニューラルネットワークモデルを用いて算出した各画素のBv値を用いるものである。
すなわち、本実施の形態2に係る画像認識装置及び画像認識方法は、インターネット上の画像などのように露出制御情報が不明な認識対象画像について、認識対象画像の各画素のRGB値を入力値とする第2のニューラルネットワークモデルを用いて各画素のBv値を算出し、認識対象画像の各画素のRGB値と算出した各画素のBv値とを入力値とする第1のニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをするものである。
なお、本実施の形態2に係る第1のニューラルネットワークモデルは実施の形態1に係るニューラルネットワークモデルと同様のもので良く、ここでは、詳細な説明を省略する。
また、第2のニューラルネットワークモデルは、教師画像の各画素のRGB値を入力値とし、当該教師画像の各画素にラベル付けをし、当該教師画像が属するシーンを識別し、当該教師画像全体の被写体輝度値(Bvf)を推定するように学習させたものであって、例えば、パソコンなどにおいて予め生成しておくことができる。第2のニューラルネットワークモデルの学習などの方法も、特に限定されるものではなく、公知の手法を用いることができ、詳細な説明を省略する。
本実施の形態2に係る画像認識装置は、例えば、パソコン内に組み込まれて、入力データ生成部及び認識部として機能し、認識対象画像の各画素にラベル付けをし、必要に応じて、認識対象画像が属するシーンも識別するものである。
以下、本実施の形態2に係る画像認識装置の構成及び動作について説明する。
図4は、本実施の形態2に係る画像認識装置(入力データ生成部112及び認識部113)を備えたパソコン101の概略構成を示すブロック図である。
パソコン101は、画像入力部111、入力データ生成部112、認識部113、画像表示部114、画像記録部115などを備えている。
画像入力部111は、インターネット上の画像、過去にスキャナなどで取り込んだ画像などを入力する。
入力データ生成部112は、入力画像から各画素のRGB値を取得するとともに、当該各画素のRGB値を入力値とする第2のニューラルネットワークモデルを用いて、入力画像の各画素にラベル付けをし、入力画像が属するシーンを識別し、入力画像全体の被写体輝度値(Bvf)を推定する。
また、入力データ生成部112は、入力画像を逆ガンマ補正したときの各画素のG値の大きさに応じてBvf値を増減させた値を各画素のBv値として算出し、出力する。
認識部113は、入力画像の各画素のRGB値と、算出した入力画像の各画素のBv値とを入力値とする第1のニューラルネットワークモデルを用いて、入力画像の各画素にラベル付けをし、必要に応じて入力画像が属するシーンを識別して出力する。前述したように、第1のニューラルネットワークモデルは実施の形態1に係るニューラルネットワークモデルと同様のもので良い。
画像表示部17はラベル付けした入力画像を表示し、画像記録部18はラベル付けした入力画像を記録する。
なお、本実施の形態2に係る画像認識装置又は画像認識方法でも、さまざまな変形、応用などが可能である。
例えば、第1のニューラルネットワークモデル及び第2のニューラルネットワークモデルの入力値として、RGB値に代えて、HS値を用いても良いし、各画素のRGB値(又は、HS値)、Bv値に更に各画素の被写体距離値を加えても良い。
以上、説明したように、本実施の形態2に係る画像認識装置は、認識対象画像の各画素のBv値が、認識対象画像の各画素のRGB値又はHS値を入力値とする第2のニューラルネットワークモデルを用いて推定した認識対象画像全体のBv値から算出したものであり、第2のニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値を入力値とし、教師画像全体のBv値を推定するように学習させたものであることが好ましい。
このような構成により、インターネット上の画像、過去にスキャナなどで取り込んだ画像などのような露出制御情報が不明な認識対象画像についても、各画素に適切にラベル付けをして認識精度を向上させることができる。
また、本実施の形態2に係る画像認識装置は、第2のニューラルネットワークモデルが、認識対象画像の各画素にラベル付けをし、認識対象画像のシーンを識別して認識対象画像全体のBv値を推定することが好ましい。
このような構成により、認識対象画像の各画素のRGB値又はHS値を入力値として認識対象画像の各画素のBv値を直接推定するニューラルネットワークモデルに比べて、より適切に認識対象画像の各画素のBv値を算出することができる。
1 撮像装置
11 レンズ光学系
12 撮像素子(撮像部)
13 アナログフロントエンド回路
14、112 入力データ生成部
15、113 認識部
16 画像信号処理回路(画像処理部)
17、114 画像表示部
18、115 画像記録部
19 ドライバ
20 タイミングジェネレータ
21 システム制御部
101 パーソナルコンピュータ(パソコン)
111 画像入力部

Claims (7)

  1. 第1のニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識装置であって、
    前記第1のニューラルネットワークモデルの入力値として、前記各画素のRGB値又はHS値とBv値とを用い、
    前記第1のニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、前記教師画像の各画素にラベル付けをするように学習させたものである、
    画像認識装置。
  2. 前記各画素のBv値は、前記認識対象画像を撮像したときのシャッター速度、絞り値及び撮影感度に基づいて算出したものである
    請求項1記載の画像認識装置。
  3. 前記各画素のBv値は、前記認識対象画像の各画素のRGB値又はHS値を入力値とする第2のニューラルネットワークモデルを用いて推定した前記認識対象画像全体のBv値から算出したものであり、
    前記第2のニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値を入力値とし、前記教師画像全体のBv値を推定するように学習させたものである、
    請求項1記載の画像認識装置。
  4. 前記第2のニューラルネットワークモデルは、前記認識対象画像の各画素にラベル付けをし、前記認識対象画像のシーンを識別して前記認識対象画像全体のBv値を推定する
    請求項3記載の画像認識装置。
  5. 教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、前記教師画像の各画素にラベル付けをするように学習させた、
    ニューラルネットワークモデル。
  6. 画像を撮像する撮像部と、
    ニューラルネットワークモデルを用いて前記画像の各画素にラベル付けをして、前記画像が属する撮像シーンを判別する画像認識部と、
    前記撮像シーンに基づいて、前記画像に画像処理を行う画像処理部と
    を備える撮像装置であって、
    前記画像認識部は、
    前記ニューラルネットワークモデルの入力値として前記各画素のRGB値又はHS値とBv値とを用い、
    前記ニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、前記教師画像の各画素にラベル付けをするように学習させたものである、
    撮像装置。
  7. ニューラルネットワークモデルを用いて認識対象画像の各画素にラベル付けをする画像認識方法であって、
    前記ニューラルネットワークモデルの入力値として、前記各画素のRGB値又はHS値とBv値とを用い、
    前記ニューラルネットワークモデルは、教師画像の各画素のRGB値又はHS値とBv値とを入力値とし、前記教師画像の各画素にラベル付けをするように学習させたものである、
    画像認識方法。
JP2018177007A 2018-09-21 2018-09-21 画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法 Pending JP2020047170A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018177007A JP2020047170A (ja) 2018-09-21 2018-09-21 画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018177007A JP2020047170A (ja) 2018-09-21 2018-09-21 画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法

Publications (1)

Publication Number Publication Date
JP2020047170A true JP2020047170A (ja) 2020-03-26

Family

ID=69899803

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018177007A Pending JP2020047170A (ja) 2018-09-21 2018-09-21 画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法

Country Status (1)

Country Link
JP (1) JP2020047170A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898535A (zh) * 2020-07-30 2020-11-06 杭州海康威视数字技术股份有限公司 目标识别方法、装置及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898535A (zh) * 2020-07-30 2020-11-06 杭州海康威视数字技术股份有限公司 目标识别方法、装置及存储介质

Similar Documents

Publication Publication Date Title
EP3477931A1 (en) Image processing method and device, readable storage medium and electronic device
US20200043225A1 (en) Image processing apparatus and control method thereof
JP5113514B2 (ja) ホワイトバランス制御装置およびホワイトバランス制御方法
JP6445844B2 (ja) 撮像装置および撮像装置で実行される方法
CN109804622B (zh) 红外图像流的重新着色
CN113766125B (zh) 对焦方法和装置、电子设备、计算机可读存储介质
CN108293092B (zh) 基于强度变化的参数调整
CN106878605B (zh) 一种基于电子设备的图像生成的方法和电子设备
WO2021057474A1 (zh) 主体对焦方法、装置、电子设备和存储介质
CN108322651B (zh) 拍摄方法和装置、电子设备、计算机可读存储介质
KR101441786B1 (ko) 피사체 판정 장치, 피사체 판정 방법, 및 기록 매체
CN110519485B (zh) 图像处理方法、装置、存储介质及电子设备
JP7152065B2 (ja) 画像処理装置
CN111368819B (zh) 光斑检测方法和装置
US8582813B2 (en) Object detection device which detects object based on similarities in different frame images, and object detection method and computer-readable medium recording program
JP2012027572A (ja) 画像処理装置および方法、並びにプログラム
KR20110023762A (ko) 화상 처리 장치, 화상 처리 방법 및 컴퓨터가 판독 가능한 기억 매체
CN116368811A (zh) 基于显著性的捕获或图像处理
JP2006301803A (ja) 画像認識装置及び画像認識方法
CN109325905B (zh) 图像处理方法、装置、计算机可读存储介质和电子设备
CN114998122A (zh) 一种低照度图像增强方法
JP2020047170A (ja) 画像認識装置、ニューラルネットワークモデル、撮像装置及び画像認識方法
JP2008167280A (ja) 画像処理装置及び方法、及び撮像装置
JP2010050651A (ja) ホワイトバランス制御装置およびそれを用いた撮像装置並びにホワイトバランス制御方法
JP6316006B2 (ja) 被写体探索装置、その制御方法、および制御プログラム、並びに撮像装置