JP7589752B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP7589752B2
JP7589752B2 JP2022569366A JP2022569366A JP7589752B2 JP 7589752 B2 JP7589752 B2 JP 7589752B2 JP 2022569366 A JP2022569366 A JP 2022569366A JP 2022569366 A JP2022569366 A JP 2022569366A JP 7589752 B2 JP7589752 B2 JP 7589752B2
Authority
JP
Japan
Prior art keywords
image data
layer
processing
input
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022569366A
Other languages
English (en)
Other versions
JPWO2022130496A1 (ja
Inventor
智規 久保田
旭穎 雷
鷹詔 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2022130496A1 publication Critical patent/JPWO2022130496A1/ja
Application granted granted Critical
Publication of JP7589752B2 publication Critical patent/JP7589752B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0495Quantised networks; Sparse networks; Compressed networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Neurology (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
深層学習モデルによる画像解析処理に用いられる画像データを圧縮して伝送する技術として、例えば、画像データを予め深層学習モデルに入力し、中間層より抽出した中間情報(特徴マップ)を圧縮して伝送する技術が知られている。当該圧縮技術によれば、画像データを直接圧縮して伝送する場合と比較して、高い圧縮率が実現できるとともに、画像データを直接圧縮して伝送する場合と同様に、伝送先の深層学習モデルの出力層において適切な処理結果を出力することができる。
特開2018-195231号公報 特開2019-036899号公報 特開2018-097662号公報 特開2019-029938号公報
しかしながら、深層学習モデルの中間層より抽出される中間情報は、出力層において適切な処理結果を出力するのに必要な情報だけでなく、適切な処理結果を出力するのに必要でない情報も含まれる。
一つの側面では、深層学習モデルより抽出される中間情報を圧縮する際の圧縮率を向上させることを目的とする。
一態様によれば、画像処理装置は、
画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出する算出部と、
前記入力層に入力される前の前記画像データの各画素のうち、前記影響度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成する加工部と、
生成された前記削減後画像データが前記深層学習モデルの前記入力層に入力され、中間層から抽出された中間情報を圧縮する圧縮部とを有する。
深層学習モデルより抽出される中間情報を圧縮する際の圧縮率を向上させることができる。
図1は、画像処理システムのシステム構成の一例を示す図である。 図2は、エッジデバイスのハードウェア構成の一例を示す図である。 図3は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第1の図である。 図4は、画像削減部及び重要箇所抽出部による処理の具体例を示す第1の図である。 図5は、エッジデバイスによる圧縮処理の流れを示す第1のフローチャートである。 図6は、エッジデバイスの画像削減部及び圧縮部の機能構成の一例を示す第2の図である。 図7は、画像削減部及び重要箇所抽出部による処理の具体例を示す第2の図である。 図8は、エッジデバイスによる圧縮処理の流れを示す第2のフローチャートである。 図9は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第3の図である。 図10は、画像削減部及び重要箇所抽出部による処理の具体例を示す第3の図である。 図11は、エッジデバイスによる圧縮処理の流れを示す第3のフローチャートである。 図12は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第4の図である。 図13は、画像削減部及び重要箇所抽出部による処理の具体例を示す第4の図である。 図14は、エッジデバイスによる圧縮処理の流れを示す第4のフローチャートである。
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
[第1の実施形態]
<画像処理システムのシステム構成>
はじめに、第1の実施形態に係る画像処理装置の一例であるエッジデバイスを含む、画像処理システム全体のシステム構成について説明する。図1は、画像処理システムのシステム構成の一例を示す図である。
図1に示すように、画像処理システム100は、撮像装置110と、エッジデバイス120と、サーバ装置130とを有する。
撮像装置110は、所定のフレーム周期で撮影を行い、画像データをエッジデバイス120に送信する。なお、画像データには、後述する深層学習モデルによる画像解析処理の対象となるオブジェクトが含まれている可能性があるものとする。画像データに後述する深層学習モデルによる画像解析処理の対象となるオブジェクトが含まれていない場合には、例えば、後述する画像加工によって、画像データ全体が無効化されることになる。
エッジデバイス120には、画像処理プログラムがインストールされており、当該プログラムが実行されることで、エッジデバイス120は、画像削減部121、重要箇所抽出部122、圧縮部123として機能する。
画像削減部121は削減部の一例であり、深層学習モデル140を有する。図1に示すように、本実施形態では、深層学習モデル140のうち、入力層から、中間情報(「特徴マップ」)が抽出される中間層(例えば、第2層)までの各層を、前段部と称す。また、深層学習モデル140のうち、特徴マップが抽出される中間層の次の層から、出力層までの各層を、後段部と称す。
画像削減部121は、前段部に入力する画像データの情報量を削減することにより、前段部内において最も後ろに位置する中間層(例えば、第2層)より抽出される特徴マップの情報量を削減する。これにより、画像削減部121は「削減後特徴マップ」を生成する。また、画像削減部121は、生成した削減後特徴マップを圧縮部123に通知する。
重要箇所抽出部122は算出部の一例であり、画像データのうち、深層学習モデル140による処理結果に影響を与える各画素の影響度を表す「重要特徴マップ」を生成する。生成した重要特徴マップは、画像削減部121に通知され、前段部に入力される画像データの情報量を削減する際に用いられる。
圧縮部123は、画像削減部121より通知された削減後特徴マップに対して、量子化及び/または符号化処理を行うことで圧縮し、「圧縮後特徴マップ」を生成する。また、圧縮部123は、圧縮後特徴マップをサーバ装置130に伝送する。
このように、第1の実施形態では、深層学習モデル140の中間層より抽出される特徴マップを圧縮する際、画像データの情報量を削減することで、特徴マップの情報量を削減し、削減後特徴マップを生成したうえで圧縮する。これにより、第1の実施形態によれば、特徴マップを圧縮する際の圧縮率を向上させることができる。
サーバ装置130には、画像解析処理プログラムがインストールされており、当該プログラムが実行されることで、サーバ装置130は、復号部131と画像解析部132として機能する。
復号部131は、エッジデバイス120より伝送された圧縮後特徴マップを受信し、受信した圧縮後特徴マップに対して、逆量子化及び/または復号処理を行うことで、削減後特徴マップを生成する。また、復号部131は、生成した削減後特徴マップを画像解析部132に通知する。
画像解析部132は、深層学習モデル140の後段部を有し、復号部131より通知された削減後特徴マップを入力することで、出力層から処理結果を出力する。
<エッジデバイスのハードウェア構成>
次に、エッジデバイス120のハードウェア構成について説明する。図2は、エッジデバイスのハードウェア構成の一例を示す図である。エッジデバイス120は、プロセッサ201、メモリ202、補助記憶装置203、I/F(Interface)装置204、通信装置205、ドライブ装置206を有する。なお、エッジデバイス120の各ハードウェアは、バス207を介して相互に接続されている。
プロセッサ201は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ201は、各種プログラム(例えば、画像処理プログラム等)をメモリ202上に読み出して実行する。
メモリ202は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ201とメモリ202とは、いわゆるコンピュータを形成し、プロセッサ201が、メモリ202上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能(画像削減部121、重要箇所抽出部122及び圧縮部123)を実現する。なお、各種機能の機能構成の詳細は後述する。
補助記憶装置203は、各種プログラムや、各種プログラムがプロセッサ201によって実行される際に用いられる各種データを格納する。
I/F装置204は、外部装置の一例である操作装置210、表示装置211とエッジデバイス120とを接続する接続デバイスである。I/F装置204は、エッジデバイス120に対する操作を、操作装置210を介して受け付ける。また、I/F装置204は、エッジデバイス120による内部処理の結果を出力し、表示装置211を介して表示する。
通信装置205は、他の装置と通信するための通信デバイスである。画像処理システム100の場合、エッジデバイス120は、通信装置205を介して撮像装置110及びサーバ装置130と通信する。
ドライブ装置206は記録媒体212をセットするためのデバイスである。ここでいう記録媒体212には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体212には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
なお、補助記憶装置203にインストールされる各種プログラムは、例えば、配布された記録媒体212がドライブ装置206にセットされ、該記録媒体212に記録された各種プログラムがドライブ装置206により読み出されることでインストールされる。あるいは、補助記憶装置203にインストールされる各種プログラムは、通信装置205を介してネットワークからダウンロードされることで、インストールされてもよい。
<画像削減部、重要箇所抽出部及び圧縮部の機能構成>
次に、エッジデバイス120において、画像処理プログラムが実行されることで実現される各種機能(画像削減部121、重要箇所抽出部122及び圧縮部123)の機能構成の詳細について説明する。図3は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第1の図である。
図3に示すように、画像削減部121は、前段部301、後段部302、誤差算出部303、画像加工部304を有する。
前段部301は、深層学習モデル140のうち、入力層から、特徴マップが抽出される中間層までの各層を有する。前段部301は、画像データが入力されることで、中間層から特徴マップを抽出し、後段部302に通知する。また、前段部301は、「削減後画像データ」が入力されることで、中間層から削減後特徴マップを抽出し、圧縮部123に通知する。なお、削減後画像データとは、重要特徴マップに基づいて画像データを加工することで生成される画像であり、画像加工部304によって生成される(詳細は後述)。
後段部302は、深層学習モデル140のうち、特徴マップが抽出される中間層の次の層から、出力層までの各層を有する。後段部302は特徴マップが入力されることで、出力層から処理結果が出力される。また、後段部302は、出力層から出力された処理結果を誤差算出部303に通知する。
誤差算出部303は、後段部302より通知された処理結果と、基準結果との誤差を算出する。基準結果とは、画像データに含まれるオブジェクト(正解データ)について予め定められた分類確率を指す。例えば、画像処理システム100が、画像データ内に映る人間の行動解析を行うのに用いる処理結果を提供することを目的とするシステムであった場合、画像削減部121では、例えば、
・画像データの所定の領域(x、y、h、w)のオブジェクトを人間と認識する分類確率を0.8、
・画像データの所定の領域(x、y、h、w)のオブジェクトを人間以外のオブジェクトと認識する分類確率を0.1、
とするデータセット等が基準結果として規定される。
また、処理結果と基準結果との誤差とは、例えば、後段部302より通知される処理結果の各オブジェクトの分類確率と、基準結果の各オブジェクトの分類確率との差分を指す。なお、誤差には、分類確率の差分に加えて、後段部302より通知される処理結果に含まれる所定の領域と、基準結果に含まれる所定の領域とのずれ量を示す指標(例えば、IoU(Intersection Over Union))が含まれていてもよい。
また、誤差算出部303では、算出した誤差を逆伝播させる。これにより、重要箇所抽出部122では、画像データのうち、深層学習モデル140による処理結果に影響を与える各画素の影響度を表す重要特徴マップを生成することができる。
なお、誤差算出部303が誤差を逆伝播させる方法には、"通常の逆誤差伝播"、"Guided Backpropagation"、"選択的逆誤差伝播"、"拡張選択的逆誤差伝播"等の複数の方法が含まれる。
通常の逆誤差伝播とは、後段部302より通知された処理結果すべての誤差を逆伝播させる方法である。また、Guided Backpropagationとは、前段部301、後段部302における各層で計算する勾配のうち、正値の勾配のみを用いて誤差を逆伝播させる方法である。
また、選択的逆誤差伝播とは、後段部302より通知された処理結果のうち、正解の処理結果の誤差のみを、"通常の逆誤差伝播"または"Guided Backpropagation"により逆伝播させる方法である。
拡張選択的逆誤差伝播とは、後段部302より通知された処理結果に対して所定の操作をすることで得られる大小の誤差を、"通常の逆誤差伝播"または"Guided Backpropagation"により逆伝播させる方法である。
画像加工部304は、後述する重要箇所抽出部122より通知された重要特徴マップを用いて、画像データを加工することで画像データの情報量を削減し、削減後画像データを生成する。具体的には、画像加工部304は、重要箇所抽出部122より通知された重要特徴マップの各画素の影響度に基づいて画像データを加工することで、画像データの情報量を削減し、削減後画像データを生成する。
なお、画像加工部304による画像データの加工方法は任意であり、例えば、重要特徴マップにおいて影響度が所定の閾値以下の画素を特定し、特定した画素の画像データにおける画素値をゼロにしてもよい(特定した画素を無効化してもよい)。あるいは、重要特徴マップにおいて影響度が所定の閾値以下の画素を特定し、特定した画素を対象に画像データに対してローパスフィルタをかけてもよい。あるいは、重要特徴マップにおいて影響度が所定の閾値以下の画素を特定し、特定した画素を対象に画像データの色を削減してもよい。つまり、画像データの加工とは、不要な特徴を深層学習モデル140が特徴と捉えないように画像データを加工することであり、その目的を果たす加工方法であれば、任意の加工方法が許容される。
また、画像加工部304は、生成した削減後画像データを前段部301に通知する。なお、上述したように、削減後画像データが通知された前段部301では、中間層から削減後特徴マップを抽出し、圧縮部123に通知する。
重要箇所抽出部122は、逆伝播された誤差を用いて重要特徴マップを生成する。上述したように、重要特徴マップは、画像データの各画素が処理結果にどの程度影響を与えたかの影響度を表している。重要箇所抽出部122は、生成した重要特徴マップを画像加工部304に通知する。
また、図3に示すように、圧縮部123は、量子化部311、符号化部312を有する。
量子化部311は、画像削減部121の前段部301より通知された削減後特徴マップを量子化し、符号化部312に通知する。
符号化部312は、量子化部311より通知された、量子化された削減後特徴マップに対して、例えば、エントロピ符号化処理を行うことで、あるいは、他の任意の圧縮処理を行うことで、圧縮後特徴マップを生成する。また、符号化部312は、生成した圧縮後特徴マップを、サーバ装置130に伝送する。
<画像削減部及び重要箇所抽出部の処理の具体例>
次に、エッジデバイス120の画像削減部121及び重要箇所抽出部122による処理の具体例について説明する。図4は、画像削減部及び重要箇所抽出部による処理の具体例を示す第1の図である。図4に示すように、画像削減部121では、画像データ410が入力されると、前段部301及び後段部302が動作し、処理結果を出力する。続いて、画像削減部121では、誤差算出部303が動作し、処理結果と基準結果との誤差を算出した後、算出した誤差を逆伝播させる。
続いて、重要箇所抽出部122が動作し、逆伝播された誤差を用いて重要特徴マップ420を生成する。なお、図4に示す重要特徴マップ420の場合、処理結果に対して影響度の大きい画素を白色で、影響度の小さい画素を黒色で示している。
続いて、画像削減部121では、画像加工部304が動作し、画像データ410のうち、重要特徴マップ420において影響度が所定の閾値以下となる画素を無効化することで、削減後画像データ430を生成する。
続いて、画像削減部121では、削減後画像データ430を前段部301に入力することで、前段部301を再度動作させ、前段部301の中間層(図4の例では第2層)から、特徴マップを抽出する。更に、画像削減部121では、抽出した特徴マップを、削減後特徴マップとして、圧縮部123に通知する。
<エッジデバイスによる圧縮処理の流れ>
次に、エッジデバイス120による圧縮処理の流れについて説明する。図5は、エッジデバイスによる圧縮処理の流れを示す第1のフローチャートである。
ステップS501において、エッジデバイス120の画像削減部121の各部(ここでは、前段部301、後段部302)及び重要箇所抽出部122を初期化する。
ステップS502において、エッジデバイス120の画像削減部121は、前段部301を動作させる。前段部301は、画像データが入力されることで、特徴マップを抽出する。
ステップS503において、エッジデバイス120の画像削減部121は、後段部302を動作させる。後段部302は、特徴マップが入力されることで、処理結果を出力する。
ステップS504において、エッジデバイス120の画像削減部121は、誤差算出部303を動作させる。誤差算出部303は、処理結果と基準結果との誤差を算出することで、算出した誤差を逆伝播させる。
ステップS505において、エッジデバイス120の重要箇所抽出部122は、逆伝播された誤差を用いて重要特徴マップを生成する。
ステップS506において、エッジデバイス120の画像削減部121は、画像加工部304を動作させる。画像加工部304は、重要特徴マップに基づき画像データを加工することで画像データの情報量を削減し、削減後画像データを生成する。
ステップS507において、エッジデバイス120の画像削減部121は、前段部301を再度動作させる。前段部301は、削減後画像データが入力されることで、削減後特徴マップを抽出する。
ステップS508において、エッジデバイス120の圧縮部123は、量子化部311及び/または符号化部312を動作させる。量子化部311及び/または符号化部312は、削減後特徴マップに対して量子化及び/または符号化処理を行うことで、圧縮後特徴マップを生成する。
ステップS509において、エッジデバイス120の圧縮部123は、圧縮後特徴マップを、サーバ装置130に伝送する。
ステップS510において、エッジデバイス120の画像削減部121は、圧縮処理を終了するか否かを判定し、継続すると判定した場合には(ステップS510においてNoの場合には)、ステップS502に戻る。
一方、ステップS510において、圧縮処理を終了すると判定した場合には(ステップS510においてYesの場合には)、圧縮処理を終了する。
以上の説明から明らかなように、第1の実施形態に係る画像処理装置(エッジデバイス120)は、深層学習モデル140に画像データを入力した場合の処理結果に影響を与える、画像データの各画素の影響度を算出し、重要特徴マップを生成する。また、第1の実施形態に係る画像処理装置(エッジデバイス120)は、重要特徴マップに基づいて画像データを加工することで、画像データの情報量を削減する。また、第1の実施形態に係る画像処理装置(エッジデバイス120)は、削減後画像データを深層学習モデルに入力することで、深層学習モデルの中間層より抽出される特徴マップの情報量を削減する。更に、第1の実施形態に係る画像処理装置(エッジデバイス120)は、情報量を削減した削減後特徴マップを圧縮する。
この結果、第1の実施形態によれば、深層学習モデルより抽出される特徴マップを圧縮する際の圧縮率を向上させることができる。
[第2の実施形態]
上記第1の実施形態では、重要特徴マップを生成する際、逆伝播された誤差を用いるものとして説明した。これに対して、第2の実施形態では、重要特徴マップを生成する際、前段部の各層より抽出される各特徴マップを用いる。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
<画像削減部、重要箇所抽出部及び圧縮部の機能構成>
はじめに、第2の実施形態に係る画像処理装置の一例であるエッジデバイス120の画像削減部、重要箇所抽出部及び圧縮部の機能構成の詳細について説明する。図6は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第2の図である。
図6に示すように、画像削減部600は削減部の他の一例であり、前段部601、画像加工部304を有する。
前段部601は、深層学習モデル140のうち、入力層から中間層までの各層を有する。前段部601は画像データが入力されることで、各層から抽出される特徴マップ(例えば、第1層から抽出される特徴マップ1、第2層から抽出される特徴マップ2、・・・)を、重要箇所抽出部610に通知する。
また、前段部601は、削減後画像データが入力されることで、前段部601内において最も後ろに位置する中間層より抽出される削減後特徴マップを、圧縮部123に通知する。
画像加工部304は、重要箇所抽出部610より通知された重要特徴マップを用いて、画像データを加工することで、画像データの情報量を削減し、削減後画像データを生成する。具体的には、画像加工部304は、重要箇所抽出部610より通知された重要特徴マップの各画素の注目度に応じて画像データを加工することで、画像データの情報量を削減し、削減後画像データを生成する。
また、画像加工部304は、生成した削減後画像データを前段部601に通知する。なお、上述したように、削減後画像データが通知された前段部601では、中間層から削減後特徴マップを抽出し、圧縮部123に通知する。
重要箇所抽出部610は算出部の他の一例であり、前段部601より通知される各層の特徴マップを、重み付け加算することで、重要特徴マップを生成する。なお、第2の実施形態において、重要特徴マップは、前段部601の各層が画像データを処理する際、どの画素に注目したかの注目度を表している。重要箇所抽出部610は、生成した重要特徴マップを画像加工部304に通知する。
また、図6に示す圧縮部123は、図3に示す圧縮部123と同じであるため、ここでは説明を省略する。
<画像削減部及び重要箇所抽出部の処理の具体例>
次に、エッジデバイス120の画像削減部600及び重要箇所抽出部610による処理の具体例について説明する。図7は、画像削減部及び重要箇所抽出部による処理の具体例を示す第2の図である。図7に示すように、画像削減部600では、画像データ410が入力されると、前段部601が動作し、各層より特徴マップが抽出される。図7の例は、前段部601が入力層、第1層、第2層を有し、第1層より特徴マップ1が抽出され、第2層より特徴マップ2が抽出された様子を示している。
続いて、重要箇所抽出部610が動作し、前段部601から抽出された各特徴マップを重み付け加算することで、重要特徴マップ710を生成する。なお、図7の例では、重要特徴マップ710のうち、注目度の大きい画素を白色で、注目度の小さい画素を黒色で示している。
続いて、画像削減部121では、画像加工部304が動作し、画像データ410のうち、重要特徴マップ710において注目度が所定の閾値以下となる画素を無効化することで、削減後画像データ720を生成する。
続いて、画像削減部600では、削減後画像データ720を前段部601に入力することで、前段部601を再度動作させ、前段部601内において最も後ろに位置する中間層(図7の例では第2層)から、特徴マップを抽出する。更に、画像削減部600では、抽出した特徴マップを、削減後特徴マップとして、圧縮部123に通知する。
<エッジデバイスによる圧縮処理の流れ>
次に、エッジデバイス120による圧縮処理の流れについて説明する。図7は、エッジデバイスによる圧縮処理の流れを示す第2のフローチャートである。図5を用いて説明した第1のフローチャートとの相違点は、ステップS801、S802である。
ステップS801において、エッジデバイス120の画像削減部600は、前段部601を動作させる。前段部601は、画像データが入力されることで、各層から特徴マップを抽出する。
ステップS802において、エッジデバイス120の重要箇所抽出部610は、前段部601の各層より抽出された各特徴マップを重み付け加算することで、重要特徴マップを生成する。
以上の説明から明らかなように、第2の実施形態に係る画像処理装置(エッジデバイス120)は、深層学習モデル140に画像データを入力した場合に各層が注目する、画像データの各画素の注目度を算出し、重要特徴マップを生成する。また、第2の実施形態に係る画像処理装置(エッジデバイス120)は、重要特徴マップに基づいて画像データを加工することで画像データの情報量を削減する。また、第2の実施形態に係る画像処理装置(エッジデバイス120)は、削減後画像データを深層学習モデルに入力することで、深層学習モデルの中間層より抽出される特徴マップの情報量を削減する。更に、第2の実施形態に係る画像処理装置(エッジデバイス120)は、情報量を削減した削減後特徴マップを圧縮する。
この結果、第2の実施形態によれば、深層学習モデルより抽出される特徴マップを圧縮する際の圧縮率を向上させることができる。
[第3の実施形態]
上記第1の実施形態では、重要特徴マップに基づいて画像データを加工することで画像データの情報量を削減し、削減後画像データを深層学習モデルに入力することで、深層学習モデルの中間層より抽出される特徴マップの情報量を削減する場合について説明した。
これに対して、第3の実施形態では、深層学習モデルの中間層より抽出される特徴マップの情報量を、重要特徴マップに基づいて直接削減する場合について説明する。以下、第3の実施形態について、上記第1の実施形態との相違点を中心に説明する。
<画像削減部、重要箇所抽出部及び圧縮部の機能構成>
はじめに、第3の実施形態に係る画像処理装置の一例であるエッジデバイス120の画像削減部、重要箇所抽出部及び圧縮部の機能構成の詳細について説明する。図9は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第3の図である。
図9に示すように、画像削減部900は削減部の他の一例であり、前段部901、後段部302、誤差算出部303、特徴マップ加工部902を有する。
前段部901は、深層学習モデル140のうち、入力層から、特徴マップが抽出される中間層までの各層を有する。前段部901は画像データが入力されることで、中間層から特徴マップを抽出し、後段部302及び特徴マップ加工部902に通知する。
後段部302及び誤差算出部303は、上記第1の実施形態において、図3を用いて説明した後段部302及び誤差算出部303と同じであるため、ここでは説明を省略する。
特徴マップ加工部902は、重要箇所抽出部910より通知された重要特徴マップに基づいて特徴マップを加工することで特徴マップの情報量を削減し、削減後特徴マップを生成する。具体的には、特徴マップ加工部902は、重要箇所抽出部910より通知された重要特徴マップの各画素の影響度に基づいて特徴マップを加工することで、特徴マップの情報量を削減し、削減後特徴マップを生成する。
なお、特徴マップ加工部902による特徴マップの加工方法は任意である。例えば、重要特徴マップにおいて影響度が所定の閾値以下の画素を特定し、特定した画素の特徴マップにおける画素値をゼロにしてもよい(特定した画素を無効化してもよい)。あるいは、重要特徴マップにおいて影響度が所定の閾値以下の画素を特定し、特定した画素を対象に特徴マップに対してローパスフィルタをかけてもよい。
また、特徴マップ加工部902は、生成した削減後特徴マップを圧縮部123に通知する。
重要箇所抽出部910は算出部の他の一例であり、逆伝播された誤差を用いて重要特徴マップを生成する。上記第1の実施形態で説明したように、重要特徴マップは、画像データの各画素が処理結果にどの程度影響を与えたかの影響度を表している。重要箇所抽出部910は、生成した重要特徴マップを特徴マップ加工部902に通知する。
また、図9に示す圧縮部123は、図3に示す圧縮部123と同じであるため、ここでは説明を省略する。
<画像削減部及び重要箇所抽出部の処理の具体例>
次に、エッジデバイス120の画像削減部900及び重要箇所抽出部910による処理の具体例について説明する。図9は、画像削減部及び重要箇所抽出部による処理の具体例を示す第3の図である。図10に示すように、画像削減部900では、画像データ410が入力されると、前段部301が動作し、特徴マップを抽出するとともに、後段部302が動作し、処理結果を出力する。
続いて、画像削減部900では、誤差算出部303が動作し、処理結果と基準結果との誤差を算出した後、算出した誤差を逆伝播させる。
続いて、重要箇所抽出部910が動作し、逆伝播された誤差を用いて重要特徴マップ420を生成する。
続いて、画像削減部900では、特徴マップ加工部902が動作し、前段部901より抽出された特徴マップについて、重要特徴マップ420において影響度が所定の閾値以下となる画素を無効化することで、削減後特徴マップを生成する。
<エッジデバイスによる圧縮処理の流れ>
次に、エッジデバイス120による圧縮処理の流れについて説明する。図11は、エッジデバイスによる圧縮処理の流れを示す第3のフローチャートである。図5を用いて説明した第1のフローチャートとの相違点は、ステップS1101である。
ステップS1101において、エッジデバイス120の画像削減部900は、特徴マップ加工部902を動作させる。特徴マップ加工部902は、重要特徴マップに基づいて特徴マップを加工することで、特徴マップの情報量を削減し、削減後特徴マップを生成する。
以上の説明から明らかなように、第3の実施形態に係る画像処理装置(エッジデバイス120)は、深層学習モデル140に画像データを入力した場合の処理結果に影響を与える、画像データの各画素の影響度を算出し、重要特徴マップを生成する。また、第3の実施形態に係る画像処理装置(エッジデバイス120)は、深層学習モデルの中間層より抽出される特徴マップを、重要特徴マップに基づいて加工することで、特徴マップの情報量を削減する。更に、第3の実施形態に係る画像処理装置(エッジデバイス120)は、情報量を削減した削減後特徴マップを圧縮する。
この結果、第3の実施形態によれば、深層学習モデルより抽出される特徴マップを圧縮する際の圧縮率を向上させることができる。
[第4の実施形態]
上記第2の実施形態では、重要特徴マップに基づいて画像データを加工することで画像データの情報量を削減し、削減後画像データを深層学習モデルに入力することで、深層学習モデルの中間層より抽出される特徴マップの情報量を削減する場合について説明した。
これに対して、第4の実施形態では、深層学習モデルの中間層より抽出される特徴マップの情報量を重要特徴マップに基づいて直接削減する場合について説明する。以下、第4の実施形態について、上記第2の実施形態との相違点を中心に説明する。
<画像削減部、重要箇所抽出部及び圧縮部の機能構成>
はじめに、第4の実施形態に係る画像処理装置の一例であるエッジデバイス120の画像削減部、重要箇所抽出部及び圧縮部の機能構成の詳細について説明する。図12は、エッジデバイスの画像削減部、重要箇所抽出部及び圧縮部の機能構成の一例を示す第4の図である。
図12に示すように、画像削減部1200は削減部の他の一例であり、前段部601、特徴マップ加工部1201を有する。
前段部601は、上記第2の実施形態において図6を用いて説明した前段部601と同じであるため、ここでは説明を省略する。
特徴マップ加工部1201は、重要箇所抽出部1210より通知された重要特徴マップを用いて、特徴マップを加工することで特徴マップの情報量を削減し、削減後特徴マップを生成する。具体的には、特徴マップ加工部1201は、重要箇所抽出部1210より通知された重要特徴マップの各画素の注目度に応じて特徴マップを加工することで、特徴マップの情報量を削減し、削減後特徴マップを圧縮部123に通知する。
重要箇所抽出部1210は算出部の他の一例であり、前段部601より通知される各層の特徴マップを、重み付け加算することで、重要特徴マップを生成する。なお、上記第2の実施形態で説明したように、重要特徴マップは、前段部601の各層が画像データを処理する際、どの画素に注目したかの注目度を表している。重要箇所抽出部1210は、生成した重要特徴マップを特徴マップ加工部1201に通知する。
また、図12に示す圧縮部123は、図3に示す圧縮部123と同じであるため、ここでは説明を省略する。
<画像削減部及び重要箇所抽出部の処理の具体例>
次に、エッジデバイス120の画像削減部1200及び重要箇所抽出部1210による処理の具体例について説明する。図13は、画像削減部及び重要箇所抽出部による処理の具体例を示す第4の図である。図13に示すように、画像削減部1200では、画像データ410が入力されると、前段部601が動作し、各層より特徴マップが抽出される。図13の例は、前段部601が入力層、第1層、第2層を有し、第1層より特徴マップ1が抽出され、第2層より特徴マップ2が抽出された様子を示している。
続いて、重要箇所抽出部1210が動作し、前段部601から抽出された各特徴マップを重み付け加算することで、重要特徴マップ710を生成する。
続いて、画像削減部1200では、特徴マップ加工部1201が動作する。特徴マップ加工部1201は、前段部601より抽出された特徴マップ(前段部601内において最も後ろに位置する中間層(図13の例では、第2層)から抽出された特徴マップ)を取得する。また、特徴マップ加工部1201は、取得した特徴マップのうち、重要特徴マップ710において注目度が所定の閾値以下となる画素を無効化することで、削減後特徴マップを生成する。
<エッジデバイスによる圧縮処理の流れ>
次に、エッジデバイス120による圧縮処理の流れについて説明する。図14は、エッジデバイスによる圧縮処理の流れを示す第4のフローチャートである。図8を用いて説明した第2のフローチャートとの相違点は、ステップS1401である。
ステップS1401において、エッジデバイス120の画像削減部1200は、特徴マップ加工部1201を動作させる。特徴マップ加工部1201は、重要特徴マップに基づいて特徴マップを加工することで、特徴マップの情報量を削減し、削減後特徴マップを生成する。
以上の説明から明らかなように、第4の実施形態に係る画像処理装置(エッジデバイス120)は、深層学習モデル140に画像データを入力した場合に各層が注目する、画像データの各画素の注目度を算出し、重要特徴マップを生成する。また、第4の実施形態に係る画像処理装置(エッジデバイス120)は、深層学習モデルの中間層より抽出される特徴マップを、重要特徴マップに基づいて加工することで、特徴マップの情報量を削減する。更に、第4の実施形態に係る画像処理装置(エッジデバイス120)は、情報量を削減した削減後特徴マップを圧縮する。
この結果、第4の実施形態によれば、深層学習モデルより抽出される特徴マップを圧縮する際の圧縮率を向上させることができる。
[その他の実施形態]
上記第1及び第2の実施形態では、重要特徴マップの生成に用いられる画像データと、重要特徴マップに基づいて加工される画像データとが同一の画像データであるとして説明した。しかしながら、重要特徴マップの生成に用いられる画像データと、重要特徴マップに基づいて加工される画像データとは、異なるタイミングで撮影された画像データであってもよい。ただし、異なるタイミングで撮影された画像データの場合、両画像データの時間間隔に応じて重要特徴マップを変換し、変換後の重要特徴マップに基づいて画像データを加工するものとする。
同様に、上記第3及び第4の実施形態では、重要特徴マップの生成に用いられる画像データと、重要特徴マップに基づいて加工される特徴マップが抽出された際の画像データとが同一の画像データであるとして説明した。しかしながら、重要特徴マップの生成に用いられる画像データと、重要特徴マップに基づいて加工される特徴マップが抽出された際の画像データとは、異なるタイミングで撮影された画像データであってもよい。ただし、異なるタイミングで撮影された画像データの場合、両画像データの時間間隔に応じて重要特徴マップを変換し、変換後の重要特徴マップに基づいて特徴マップを加工するものとする。
また、上記第1乃至第4の実施形態では言及しなかったが、重要特徴マップの生成に用いられる画像データと、重要特徴マップに基づいて加工される画像データとは、異なるタイミングで撮影されたものであってもよい。あるいは、重要特徴マップの生成に用いられる画像データと、重要特徴マップに基づいて加工される特徴マップが抽出された際の画像データとは、異なるタイミングで撮影された画像データであってもよい。
また、上記第1乃至第4の実施形態において説明した画像削減部121、600、900、1200内の各構成要素は、上記第1乃至第4の実施形態において例示した箇所に配置されていなくてもよい。同様に、上記第1乃至第4の実施形態において説明した重要箇所抽出部122、610、910、1210内の各構成要素は、上記第1乃至第4の実施形態において例示した箇所に配置されていなくてもよい。例えば、各構成要素はネットワークを介して接続された他の装置に配置されていてもよい。また、各構成要素は、複数の装置に配置されていてもよい。
なお、本開示の真意は、深層学習モデル140が画像解析処理する際に、
・対象となるオブジェクトを抽出するための各画素の重要度を、深層学習モデル140のいずれかの箇所の情報から抽出し、
・抽出した情報に基づき、画像データを含む深層学習モデル140の処理過程のいずれか(中間情報の情報量を削減する効果がある箇所)で情報量を削減すること、
にあり、その目的を満たす情報の抽出手法は、上記各実施形態で示した抽出手法以外の手法であってもよい。
また、情報の抽出は、上記各実施形態で例示したように、深層学習モデル140の前段部、後段部等の情報の抽出に必要な部分において行われてもよい。情報の抽出に必要な部分とは、上記各実施形態で例示した部分でもよいし、その一部でも、他の部分でもよい。つまり、上記情報の抽出手法の目的を満たしていればよい。
また、上記第1の実施形態で述べた拡張選択的逆誤差伝播を実施するにあたっては、深層学習モデル140の任意の箇所の誤差を用いてもよい。例えば、上記第1の実施形態において、拡張選択的逆誤差伝播により重要特徴マップを導出する際、後段部はなくてもよい。
また、上記各実施形態で示した圧縮部123は、画像削減部121より通知された削減後特徴マップに対して、量子化及び/または符号化処理を行うことで圧縮するが、単一の削減後特徴マップに対して量子化及び/または符号化処理を行うことで圧縮してもよい。あるいは、複数の削減後特徴マップの相関性を用いて量子化及び/または符号化処理を行うことで圧縮してもよい。複数の削減後特徴マップの相関性を用いる例としては、動画像などが挙げられる。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
100 :画像処理システム
110 :撮像装置
120 :エッジデバイス
121 :画像削減部
122 :重要箇所抽出部
123 :圧縮部
130 :サーバ装置
131 :復号部
132 :画像解析部
140 :深層学習モデル
201 :プロセッサ
202 :メモリ
203 :補助記憶装置
204 :I/F装置
205 :通信装置
206 :ドライブ装置
210 :操作装置
211 :表示装置
212 :記録媒体
301 :前段部
302 :後段部
303 :誤差算出部
304 :画像加工部
310 :圧縮部
311 :量子化部
312 :符号化部
410 :画像データ
420 :重要特徴マップ
430 :削減後画像データ
600 :画像削減部
601 :前段部
610 :重要箇所抽出部
710 :重要特徴マップ
720 :削減後画像データ
900 :画像削減部
901 :前段部
902 :特徴マップ加工部
910 :重要箇所抽出部
1200 :画像削減部
1201 :特徴マップ加工部
1210 :重要箇所抽出部

Claims (13)

  1. 画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出する算出部と、
    前記入力層に入力される前の前記画像データの各画素のうち、前記影響度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成する加工部と、
    生成された前記削減後画像データが前記深層学習モデルの前記入力層に入力され、中間層から抽出された中間情報を圧縮する圧縮部と
    を有する画像処理装置。
  2. 画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出する算出部と、
    前記画像データが前記深層学習モデルの入力層に入力され、中間層の所定の層から抽出された中間情報の各画素のうち、前記影響度が所定の閾値以下の前記中間情報の画素を加工する処理を行うことで、前記中間情報の情報量を削減する加工をした削減後中間情報を生成する削減部と、
    生成された前記削減後中間情報を圧縮する圧縮部と
    を有する画像処理装置。
  3. 画像データが深層学習モデルの入力層に入力された場合に、中間層の各層から抽出された中間情報それぞれに基づいて、前記各層が画像データの処理の際にどの画素に注目するかを示す注目度を、前記画像データの各画素について算出する算出部と、
    前記入力層に入力される前の前記画像データの各画素のうち、前記注目度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成する加工部と、
    生成された前記削減後画像データが前記深層学習モデルの前記入力層に入力され、前記中間層の所定の層から抽出された中間情報を圧縮する圧縮部と
    を有する画像処理装置。
  4. 画像データが深層学習モデルの入力層に入力された場合に、中間層の各層から抽出された中間情報それぞれに基づいて、前記各層が画像データの処理の際にどの画素に注目するかを示す注目度を、前記画像データの各画素について算出する算出部と、
    前記画像データが前記深層学習モデルの入力層に入力され、前記中間層の所定の層から抽出された中間情報の各画素のうち、前記注目度が所定の閾値以下の前記中間情報の画素を加工する処理を行うことで、前記中間情報の情報量を削減する加工をした削減後中間情報を生成する削減部と、
    生成された前記削減後中間情報を圧縮する圧縮部と
    を有する画像処理装置。
  5. 前記画素を加工する処理を行うことは、前記画素を無効化することである、請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. 画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出し、
    前記入力層に入力される前の前記画像データの各画素のうち、前記影響度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成し、
    生成した前記削減後画像データが前記深層学習モデルの前記入力層に入力され、中間層から抽出された中間情報を圧縮する、
    処理をコンピュータが実行する画像処理方法。
  7. 画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出し、
    前記画像データが前記深層学習モデルの入力層に入力され、中間層の所定の層から抽出された中間情報の各画素のうち、前記影響度が所定の閾値以下の前記中間情報の画素を加工する処理を行うことで、前記中間情報の情報量を削減する加工をした削減後中間情報を生成し、
    生成した前記削減後中間情報を圧縮する、
    処理をコンピュータが実行する画像処理方法。
  8. 画像データが深層学習モデルの入力層に入力された場合に、中間層の各層から抽出された中間情報それぞれに基づいて、前記各層が画像データの処理の際にどの画素に注目するかを示す注目度を、前記画像データの各画素について算出し、
    前記入力層に入力される前の前記画像データの各画素のうち、前記注目度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成し、
    生成した前記削減後画像データが前記深層学習モデルの前記入力層に入力され、前記中間層の所定の層から抽出された中間情報を圧縮する、
    処理をコンピュータが実行する画像処理方法。
  9. 画像データが深層学習モデルの入力層に入力された場合に、中間層の各層から抽出された中間情報それぞれに基づいて、前記各層が画像データの処理の際にどの画素に注目するかを示す注目度を、前記画像データの各画素について算出し、
    前記画像データが前記深層学習モデルの入力層に入力され、前記中間層の所定の層から抽出された中間情報の各画素のうち、前記注目度が所定の閾値以下の前記中間情報の画素を加工する処理を行うことで、前記中間情報の情報量を削減する加工をした削減後中間情報を生成し、
    生成した前記削減後中間情報を圧縮する、
    処理をコンピュータが実行する画像処理方法。
  10. 画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出し、
    前記入力層に入力される前の前記画像データの各画素のうち、前記影響度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成し、
    生成した前記削減後画像データが前記深層学習モデルの前記入力層に入力され、中間層から抽出された中間情報を圧縮する、
    処理をコンピュータに実行させるための画像処理プログラム。
  11. 画像データが深層学習モデルの入力層に入力され、出力層から出力された処理結果と基準結果とに基づく誤差が逆伝播されることで、前記画像データのうちの前記深層学習モデルによる処理結果に影響を与える、各画素の影響度を算出し、
    前記画像データが前記深層学習モデルの入力層に入力され、中間層の所定の層から抽出された中間情報の各画素のうち、前記影響度が所定の閾値以下の前記中間情報の画素を加工する処理を行うことで、前記中間情報の情報量を削減する加工をした削減後中間情報を生成し、
    生成した前記削減後中間情報を圧縮する、
    処理をコンピュータに実行させるための画像処理プログラム。
  12. 画像データが深層学習モデルの入力層に入力された場合に、中間層の各層から抽出された中間情報それぞれに基づいて、前記各層が画像データの処理の際にどの画素に注目するかを示す注目度を、前記画像データの各画素について算出し、
    前記入力層に入力される前の前記画像データの各画素のうち、前記注目度が所定の閾値以下である画素を加工する処理を行うことで、前記画像データの情報量を削減する加工をした削減後画像データを生成し、
    生成した前記削減後画像データが前記深層学習モデルの前記入力層に入力され、前記中間層の所定の層から抽出された中間情報を圧縮する、
    処理をコンピュータに実行させるための画像処理プログラム。
  13. 画像データが深層学習モデルの入力層に入力された場合に、中間層の各層から抽出された中間情報それぞれに基づいて、前記各層が画像データの処理の際にどの画素に注目するかを示す注目度を、前記画像データの各画素について算出し、
    前記画像データが前記深層学習モデルの入力層に入力され、前記中間層の所定の層から抽出された中間情報の各画素のうち、前記注目度が所定の閾値以下の前記中間情報の画素を加工する処理を行うことで、前記中間情報の情報量を削減する加工をした削減後中間情報を生成し、
    生成した前記削減後中間情報を圧縮する、
    処理をコンピュータに実行させるための画像処理プログラム。
JP2022569366A 2020-12-15 2020-12-15 画像処理装置、画像処理方法及び画像処理プログラム Active JP7589752B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/046729 WO2022130496A1 (ja) 2020-12-15 2020-12-15 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2022130496A1 JPWO2022130496A1 (ja) 2022-06-23
JP7589752B2 true JP7589752B2 (ja) 2024-11-26

Family

ID=82057414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022569366A Active JP7589752B2 (ja) 2020-12-15 2020-12-15 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (3)

Country Link
US (1) US20230252683A1 (ja)
JP (1) JP7589752B2 (ja)
WO (1) WO2022130496A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024057374A1 (ja) * 2022-09-12 2024-03-21 日本電信電話株式会社 抽出システム、抽出方法および抽出プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200026928A1 (en) 2019-09-26 2020-01-23 Intel Corporation Deep learning for dense semantic segmentation in video with automated interactivity and improved temporal coherence
JP2020092329A (ja) 2018-12-05 2020-06-11 日本電信電話株式会社 画像処理装置、学習装置、画像処理方法、学習方法、及びプログラム
JP2020113809A (ja) 2019-01-08 2020-07-27 ソニー株式会社 固体撮像素子およびその信号処理方法、並びに電子機器
JP2020191631A (ja) 2019-05-22 2020-11-26 富士通株式会社 画像符号化装置、確率モデル生成装置及び画像圧縮システム
WO2020238603A1 (zh) 2019-05-24 2020-12-03 上海肇观电子科技有限公司 深度神经网络的压缩方法、芯片、电子设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020092329A (ja) 2018-12-05 2020-06-11 日本電信電話株式会社 画像処理装置、学習装置、画像処理方法、学習方法、及びプログラム
JP2020113809A (ja) 2019-01-08 2020-07-27 ソニー株式会社 固体撮像素子およびその信号処理方法、並びに電子機器
JP2020191631A (ja) 2019-05-22 2020-11-26 富士通株式会社 画像符号化装置、確率モデル生成装置及び画像圧縮システム
WO2020238603A1 (zh) 2019-05-24 2020-12-03 上海肇观电子科技有限公司 深度神经网络的压缩方法、芯片、电子设备及介质
US20200026928A1 (en) 2019-09-26 2020-01-23 Intel Corporation Deep learning for dense semantic segmentation in video with automated interactivity and improved temporal coherence

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHOI, Hyomin ほか1名,High Efficiency Compression for Object Detection,2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP),2018年02月,[令和6年5月14日検索],インターネット <URL:https://arxiv.org/pdf/1710.11151>,<URL:https://arxiv.org/abs/1710.11151>

Also Published As

Publication number Publication date
US20230252683A1 (en) 2023-08-10
WO2022130496A1 (ja) 2022-06-23
JPWO2022130496A1 (ja) 2022-06-23

Similar Documents

Publication Publication Date Title
US10832069B2 (en) Living body detection method, electronic device and computer readable medium
US11847816B2 (en) Resource optimization based on video frame analysis
US20200126209A1 (en) System and method for detecting image forgery through convolutional neural network and method for providing non-manipulation detection service using the same
CN115115540B (zh) 基于光照信息引导的无监督低光图像增强方法及装置
KR102527642B1 (ko) 딥러닝 기반 소형 표적 탐지 시스템 및 방법
CN110856035B (zh) 处理图像数据以执行对象检测
CN109815931B (zh) 一种视频物体识别的方法、装置、设备以及存储介质
CN112529904A (zh) 图像语义分割方法、装置、计算机可读存储介质和芯片
CN116721334A (zh) 图像生成模型的训练方法、装置、设备及存储介质
CN116363037B (zh) 一种多模态图像融合方法、装置及设备
CN114663957A (zh) 人脸检测方法、人脸检测模型的训练方法及装置
CN109743566B (zh) 一种用于识别vr视频格式的方法与设备
CN113191495A (zh) 超分模型的训练及人脸识别方法、装置、介质及电子设备
KR20220143550A (ko) 포인트 클라우드 인코더를 생성하는 방법 및 장치 및 포인트 클라우드 데이터를 생성하는 방법 및 장치, 전자 기기 및 컴퓨터 저장 매체
CN110855957B (zh) 图像处理方法及装置、存储介质和电子设备
US20240119601A1 (en) Image processing apparatus, image processing method, and computer readable recording medium
CN118823153A (zh) 图像生成方法、装置、设备及存储介质
JP7589752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
CN115311152A (zh) 图像处理方法、装置、电子设备以及存储介质
CN111861877A (zh) 视频超分变率的方法和装置
US20250029384A1 (en) Method performed by electronic apparatus, electronic apparatus and storage medium for inpainting
WO2025130774A1 (zh) 面向机器视觉的图像预处理方法、装置、设备及存储介质
CN119380415A (zh) 视频动作识别方法、装置、电子设备及存储介质
CN112052863B (zh) 一种图像检测方法及装置、计算机存储介质、电子设备
JP2024076159A (ja) 物体検出システム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241028

R150 Certificate of patent or registration of utility model

Ref document number: 7589752

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150