JP7491388B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP7491388B2
JP7491388B2 JP2022556715A JP2022556715A JP7491388B2 JP 7491388 B2 JP7491388 B2 JP 7491388B2 JP 2022556715 A JP2022556715 A JP 2022556715A JP 2022556715 A JP2022556715 A JP 2022556715A JP 7491388 B2 JP7491388 B2 JP 7491388B2
Authority
JP
Japan
Prior art keywords
image data
image
processing
unit
recognition accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022556715A
Other languages
English (en)
Other versions
JPWO2022079791A1 (ja
Inventor
智規 久保田
鷹詔 中尾
康之 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2022079791A1 publication Critical patent/JPWO2022079791A1/ja
Application granted granted Critical
Publication of JP7491388B2 publication Critical patent/JP7491388B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
一般に、画像データを記録または伝送する場合、エンコーダ等を用いて圧縮処理を行い、データサイズを小さくすることで、記録コストや伝送コストの削減を実現している。
一方で、近年、AI(Artificial Intelligence)による画像認識処理に利用される目的で、画像データを記録または伝送するケースが増えてきている。AIの代表的なモデルとしては、例えば、深層学習や機械学習を用いたモデルが挙げられる。
特開2017-163223号公報 特開2006-93880号公報
しかしながら、従来の圧縮処理は、あくまで人間の視覚特性に基づいて行われており、AIの動作解析に基づいて行われているわけではない。このため、従来の圧縮処理は、AIによる画像認識処理に必要でない領域について、十分な圧縮レベルを実現できていない場合があった。
一方で、エンコーダの種類によっては、画像データに対して圧縮処理を行う際の圧縮レベルを、領域単位で変更することができないものもある。このため、このようなエンコーダを用いる場合は、仮にAIによる画像認識処理に必要でない領域を解析できたとしても、当該領域に対して他の領域とは異なる圧縮レベルで圧縮処理を行うことはできず、十分な圧縮レベルを実現することができなかった。
一つの側面では、AIによる画像認識処理に適した圧縮処理を実現することを目的とする。
一態様によれば、画像処理装置は、
画像データの画質を変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出する算出部と、
前記画像データにおいて、前記オブジェクトが含まれる領域を、前記認識精度が所定の許容限界となる画質に変更し、前記オブジェクトが含まれる領域以外を、前記認識精度が所定の許容限界未満となる画質に変更する変更部と、を有し、
前記変更部は、変更後の前記画像データを、エンコーダに入力する。
AIによる画像認識処理に適した圧縮処理を実現することができる。
図1は、圧縮処理システムのシステム構成の一例を示す第1の図である。 図2は、画像処理装置のハードウェア構成の一例を示す図である。 図3は、画像処理装置の機能構成の一例を示す第1の図である。 図4は、画像処理装置による領域別の処理後画像データの生成処理の具体例を示す第1の図である。 図5は、エンコーダの機能構成の一例を示す図である。 図6は、圧縮処理システムによる圧縮処理の流れを示す第1のフローチャートである。 図7は、圧縮処理システムによる圧縮処理の流れを示す第2のフローチャートである。 図8は、画像処理装置の機能構成の一例を示す第2の図である。 図9は、画像処理装置の機能構成の一例を示す第3の図である。 図10は、画像処理装置の機能構成の一例を示す第4の図である。 図11は、画像処理装置による領域別の処理後画像データの生成処理の具体例を示す第2の図である。 図12は、画像処理装置による領域別の処理後画像データの生成処理の具体例を示す第3の図である。 図13は、圧縮処理システムによる圧縮処理の流れを示す第3のフローチャートである。 図14は、圧縮処理システムのシステム構成の一例を示す第2の図である。 図15は、画像処理装置の機能構成の一例を示す第5の図である。 図16は、圧縮処理システムによる圧縮処理の流れを示す第4のフローチャートである。
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
[第1の実施形態]
<圧縮処理システムのシステム構成>
はじめに、第1の実施形態に係る画像処理装置を含む、圧縮処理システム全体のシステム構成について説明する。図1は、圧縮処理システムのシステム構成の一例を示す第1の図である。
図1に示すように、圧縮処理システム100は、撮像装置110、画像処理装置120、エンコーダ130、ストレージ装置140を有する。
撮像装置110は、所定のフレーム周期で撮影を行い、画像データを画像処理装置120に送信する。なお、画像データには、画像認識処理の対象となるオブジェクトが含まれているものとする。
画像処理装置120は、画像認識処理を行う学習済みモデルを有する。画像処理装置120は、エンコーダ130に設定されている量子化ステップを取得する。また、画像処理装置120は、当該量子化ステップを変更しながら、エンコーダ130が圧縮処理を行った場合の、各圧縮データに対応する各復号データの画質と同等の画質になるように、画像データに対して順次フィルタ処理を行う。
また、画像処理装置120は、画像データに対して順次フィルタ処理を行うことで生成される各処理後画像データに対して、学習済みモデルを用いて順次画像認識処理を行い、オブジェクトの認識精度をそれぞれ予測する。
また、画像処理装置120は、
・予測した認識精度が許容限界となる画質に変更された処理後画像データから、オブジェクトの領域を抽出し、
・予測した認識精度が許容限界未満となる画質に変更された処理後画像データから、オブジェクト領域以外の領域を抽出する、
ことで、領域別の処理後画像データを生成する。
更に、画像処理装置120は、生成した領域別の処理後画像データを、エンコーダ130に入力する。
エンコーダ130は、設定された量子化ステップを画像処理装置120に通知する。また、エンコーダ130は、画像処理装置120により入力された、領域別の処理後画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。なお、エンコーダ130は、入力された領域別の処理後画像データに対して、一様な量子化ステップを用いて、圧縮処理を行う。
このように、第1の実施形態に係る画像処理装置120は、画像データから、領域別の処理後画像データを生成し、領域別の処理後画像データをエンコーダ130に入力することで、符号化処理を実行させる。これにより、第1の実施形態に係る画像処理装置120によれば、エンコーダ130が、領域ごとに量子化ステップを変更することができない場合でも、領域ごとに適切な圧縮レベルで圧縮処理が行われた圧縮データがエンコーダ130から出力されることになる。つまり、第1の実施形態に係る画像処理装置120によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。
<画像処理装置及びエンコーダのハードウェア構成>
次に、画像処理装置120及びエンコーダ130のハードウェア構成について説明する。なお、画像処理装置120とエンコーダ130とは、同様のハードウェア構成を有することから、ここでは、画像処理装置120のハードウェア構成について説明する。
図2は、画像処理装置のハードウェア構成の一例を示す図である。画像処理装置120は、プロセッサ201、メモリ202、補助記憶装置203、I/F(Interface)装置204、通信装置205、ドライブ装置206を有する。なお、画像処理装置120の各ハードウェアは、バス207を介して相互に接続されている。
プロセッサ201は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ201は、各種プログラム(例えば、後述する画像処理プログラム等)をメモリ202上に読み出して実行する。
メモリ202は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ201とメモリ202とは、いわゆるコンピュータを形成し、プロセッサ201が、メモリ202上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する(各種機能の詳細は後述する)。
補助記憶装置203は、各種プログラムや、各種プログラムがプロセッサ201によって実行される際に用いられる各種データを格納する。
I/F装置204は、外部装置の一例である操作装置210、表示装置220と、画像処理装置120とを接続する接続デバイスである。I/F装置204は、画像処理装置120に対する操作を、操作装置210を介して受け付ける。また、I/F装置204は、画像処理装置120による処理の結果を、表示装置220を介して表示する。
通信装置205は、他の装置と通信するための通信デバイスである。画像処理装置120の場合、通信装置205を介して撮像装置110及びエンコーダ130と通信する。
ドライブ装置206は記録媒体230をセットするためのデバイスである。ここでいう記録媒体230には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体230には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
なお、補助記憶装置203にインストールされる各種プログラムは、例えば、配布された記録媒体230がドライブ装置206にセットされ、該記録媒体230に記録された各種プログラムがドライブ装置206により読み出されることでインストールされる。あるいは、補助記憶装置203にインストールされる各種プログラムは、通信装置205を介してネットワークからダウンロードされることで、インストールされてもよい。
<画像処理装置の機能構成>
次に、画像処理装置120の機能構成について説明する。図3は、画像処理装置の機能構成の一例を示す第1の図である。上述したように、画像処理装置120には、画像処理プログラムがインストールされており、当該プログラムが実行されることで、画像処理装置120は、処理強度変換部310、処理強度加算部320として機能する。更に、画像処理装置120は、フィルタ処理部330、画像認識部340、評価部350、画像加工部360、画像生成部370として機能する。
処理強度変換部310は、エンコーダ130に設定されている量子化ステップを取得し、量子化ステップを処理強度に変換したうえで、処理強度加算部320に通知する。なお、「処理強度」とは、
・画像データの画質と、
・エンコーダ130が、対応する量子化ステップを用いて、当該画像データに対して圧縮処理を行い、不図示のデコーダが圧縮データに対して復号処理を行った場合の、復号データの画質と、
の差(画質の劣化度合い)と同等の劣化度合いを生じさせるフィルタ処理(画像データの画質を復号データの画質と同等の画質にするフィルタ処理)の強度を指す。なお、処理強度の値の粒度は、量子化ステップの値の粒度と一致していなくてもよい。
処理強度加算部320は、エンコーダ130に設定された量子化ステップを、全範囲にわたって順次上げていった場合に加算される処理強度(「加算処理強度」と称す)を、処理強度変換部310より通知された処理強度に順次加算し、各合計処理強度を算出する。
また、処理強度加算部320は、算出した各合計処理強度に対応する各設定フィルタを、順次フィルタ処理部330に設定する。
更に、処理強度加算部320は、それぞれの加算処理強度に対応する各設定フィルタを、順次評価部350に通知する。
フィルタ処理部330は、入力された画像データを画像認識部340に通知する。また、フィルタ処理部330は、処理強度加算部320より順次設定される設定フィルタを用いて、入力された画像データに対して順次フィルタ処理を行い、各処理後画像データを、順次画像認識部340に通知する。
画像認識部340は算出部の一例であり、画像認識処理を行う学習済みモデルを有する。画像認識部340は、フィルタ処理部330より通知される画像データに対して画像認識処理を行い、認識結果(認識精度を含む)を評価部350に通知する。
また、画像認識部340は、フィルタ処理部330より順次通知される処理後画像データに対して画像認識処理を行い、認識結果を順次評価部350に通知する。
評価部350は、画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、画像データに含まれるオブジェクトの領域及びオブジェクトの領域以外の領域を特定し、画像加工部360に通知する。
また、評価部350は、各処理後画像データに対して画像認識処理が行われることで順次通知される認識結果に含まれるオブジェクトの認識精度を監視し、オブジェクトの認識精度が急激に低下したか否かを判定する。
また、評価部350は、認識精度が急激に低下した直前のタイミングで、処理強度加算部320から通知された設定フィルタ(加算処理強度)を特定し、オブジェクト領域と対応付けて画像加工部360に通知する。なお、このとき特定される設定フィルタ(加算処理強度)は、認識精度(圧縮処理後の圧縮データに対して復号処理を行うことで生成された復号データについての認識精度)が許容限界となる画質に対応する設定フィルタである。
更に、評価部350は、加算処理強度が最大となる設定フィルタを、オブジェクト領域以外の領域と対応付けて画像加工部360に通知する。
画像加工部360は、評価部350より通知される設定フィルタ(加算処理強度)を用いて、画像データに対してフィルタ処理を行い、処理後画像データを生成する。また、画像加工部360は、設定フィルタ(加算処理強度)と対応付けられたオブジェクト領域を、生成した処理後画像データから抽出し、画像生成部370に通知する。
また、画像加工部360は、評価部350より通知される、加算処理強度が最大となる設定フィルタを用いて、画像データに対してフィルタ処理を行い、処理後画像データを生成する。また、画像加工部360は、オブジェクトの領域以外の領域を、生成した処理後画像データから抽出し、画像生成部370に通知する。
画像生成部370は変更部の一例であり、画像加工部360から通知された、オブジェクト領域の処理後画像データと、オブジェクト領域以外の領域の処理後画像データとを結合し、領域別の処理後画像データを生成する。また、画像生成部370は、生成した領域別の処理後画像データを、エンコーダ130に入力する。
<領域別の処理後画像データの生成処理の具体例>
次に、画像処理装置120による領域別の処理後画像データの生成処理の具体例について説明する。図4は、画像処理装置による領域別の処理後画像データの生成処理の具体例を示す第1の図である。
図4に示すように、画像処理装置120のフィルタ処理部330に入力された画像データ400は、画像認識部340に通知され、画像認識部340にて画像認識処理が行われる。符号401は、画像データ400に対して画像認識処理が行われることで、オブジェクトA、オブジェクトB、オブジェクトCが認識されたことを示している。
また、上述したように、画像処理装置120では、処理強度変換部310が取得した量子化ステップを処理強度に変換し、処理強度加算部320が加算処理強度を順次加算することで各合計処理強度を算出する。更に、画像処理装置120では、フィルタ処理部330が、各合計処理強度に対応する設定フィルタを用いて画像データに対して順次フィルタ処理を行うとともに、画像認識部340が、各処理後画像データに対して順次画像認識処理を行う。
図4の例は、QP15に相当する加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタを用いて、画像データ400に対してフィルタ処理が行われ、処理後画像データ410が生成されたことを示している。また、図4の例は、処理後画像データ410に対して画像認識処理が行われることで、認識結果411が出力され、オブジェクトAに対する認識精度が許容限界を下回ったことを示している。
同様に、図4の例は、QP25に相当する加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタを用いて、画像データ400に対してフィルタ処理が行われ、処理後画像データ420が生成されたことを示している。また、図4の例は、処理後画像データ420に対して画像認識処理が行われることで、認識結果421が出力され、新たにオブジェクトBに対する認識精度が許容限界を下回ったことを示している。
同様に、図4の例は、QP35に相当する加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタを用いて、画像データ400に対してフィルタ処理が行われ、処理後画像データ430が生成されたことを示している。また、図4の例は、処理後画像データ430に対して画像認識処理が行われることで、認識結果431が出力され、新たにオブジェクトCに対する認識精度が許容限界を下回ったことを示している。
更に、図4の例は、QP40に相当する最大となる加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタを用いて、画像データ400に対してフィルタ処理が行われ、処理後画像データ440が生成されたことを示している。また、図4の例は、処理後画像データ440に対して画像認識処理が行われることで、認識結果441が出力されたことを示している。
また、図4において、グラフ412、422、432は、フィルタ処理部330にそれぞれの設定フィルタが設定されることで、フィルタ処理が行われ、処理後画像データに対して画像認識処理が行われた際の、各オブジェクトの認識精度の変化を示している。グラフ412、422、432に示すように、オブジェクトA~オブジェクトCは、いずれも、所定の設定フィルタを境に認識精度が急激に低下する。
例えば、オブジェクトAの場合、QP15に相当する加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタが設定されることで、認識精度が急激に低下する。同様に、オブジェクトBの場合、QP25に相当する加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタが設定されることで、認識精度が急激に低下する。同様に、オブジェクトCの場合、QP35に相当する加算処理強度が加算されることで得られる合計処理強度に対応する設定フィルタが設定されることで、認識精度が急激に低下する。
このため、図4の例の場合、評価部350は、認識精度が急激に低下した直前のタイミングで通知された設定フィルタとして、QP14に対応する設定フィルタを特定し、オブジェクトAの領域と対応付けて画像加工部360に通知する。
同様に、評価部350は、認識精度が急激に低下した直前のタイミングで通知された設定フィルタとして、QP24に対応する設定フィルタを特定し、オブジェクトBの領域と対応付けて画像加工部360に通知する。
同様に、評価部350は、認識精度が急激に低下した直前のタイミングで通知された設定フィルタとして、QP34に対応する設定フィルタを特定し、オブジェクトCの領域と対応付けて画像加工部360に通知する。
更に、評価部350は、加算処理強度が最大となる設定フィルタである、QP40に対応する設定フィルタを、画像加工部360に通知する。
この結果、図4に示すように、画像生成部370は、
・画像データ400に対して、QP14に対応する設定フィルタを用いてフィルタ処理が行われることで生成された処理後画像データから抽出されたオブジェクトAの領域と、
・画像データ400に対して、QP24に対応する設定フィルタを用いてフィルタ処理が行われることで生成された処理後画像データから抽出されたオブジェクトBの領域と、
・画像データ400に対して、QP34に対応する設定フィルタを用いてフィルタ処理が行われることで生成された処理後画像データから抽出されたオブジェクトCの領域と、
・画像データ400に対して、QP40に対応する設定フィルタを用いてフィルタ処理が行われることで生成された処理後画像データから抽出されたオブジェクト領域以外の領域と、
を結合した領域別の処理後画像データ450を生成する。
<エンコーダの機能構成>
次に、エンコーダ130の機能構成について説明する。図5は、エンコーダの機能構成の一例を示す図である。エンコーダ130には、符号化プログラムがインストールされており、当該プログラムが実行されることで、エンコーダ130は、符号化部520として機能する。
符号化部520は、差分部521、直交変換部522、量子化部523、エントロピ符号化部524、逆量子化部525、逆直交変換部526を有する。また、符号化部520は、加算部527、バッファ部528、ループ内フィルタ部529、フレームバッファ部530、画面内予測部531、画面間予測部532を有する。
差分部521は、領域別の処理後画像データ(例えば、領域別の処理後画像データ450)と予測画像データとの差分を算出し、予測残差信号を出力する。
直交変換部522は、差分部521により出力された予測残差信号に対して、直交変換処理を行う。
量子化部523は、直交変換処理が行われた予測残差信号を量子化し、量子化信号を生成する。量子化部523は、設定された量子化ステップを用いて量子化信号を生成する。なお、量子化部523に設定される量子化ステップは、あわせて、画像処理装置120にも通知される。
エントロピ符号化部524は、量子化信号に対してエントロピ符号化処理を行うことで、圧縮データを生成する。
逆量子化部525は、量子化信号を逆量子化する。逆直交変換部526は、逆量子化された量子化信号に対して、逆直交変換処理を行う。
加算部527は、逆直交変換部526より出力された信号と、予測画像データとを加算することで、参照画像データを生成する。バッファ部528は、加算部527により生成された参照画像データを格納する。
ループ内フィルタ部529は、バッファ部528に格納された参照画像データに対してフィルタ処理を行う。ループ内フィルタ部529には、
・デブロッキングフィルタ(Deblocking filter:DB)、
・サンプルアダプティブオフセットフィルタ(Sample Adaptive Offset filter:SAO)、
・適応ループフィルタ(Adaptive loop filter:ALF)、
が含まれる。
フレームバッファ部530は、ループ内フィルタ部529によりフィルタ処理が行われた参照画像データをフレーム単位で格納する。
画面内予測部531は、参照画像データに基づいて画面内予測を行い、予測画像データを生成する。画面間予測部532は、入力された画像データ(例えば、領域別の処理後画像データ450)と参照画像データとを用いてフレーム間で動き補償を行い、予測画像データを生成する。
なお、画面内予測部531または画面間予測部532により生成された予測画像データは、差分部521及び加算部527に出力される。
なお、上記説明では、符号化部520が、MPEG-2、MPEG-4、H.264、HEVCなどの既存の動画符号化方式を用いて符号化処理を行うものとした。しかしながら、符号化部520による符号化処理は、これらの動画符号化方式に限定されず、量子化等のパラメータにより圧縮率を制御する任意の符号化方式を用いて行われてもよい。
<圧縮処理システムによる圧縮処理の流れ>
次に、圧縮処理システム100による圧縮処理の流れについて説明する。図6及び図7は、圧縮処理システムによる圧縮処理の流れの一例を示す第1及び第2のフローチャートである。
ステップS601において、画像処理装置120の処理強度変換部310は、エンコーダ130より量子化ステップを取得し、取得した量子化ステップに対応する処理強度を算出する。
ステップS602において、画像処理装置120のフィルタ処理部330は、画像データを取得する。
ステップS603において、画像処理装置120の画像認識部340は、画像データに対して画像認識処理を行い、認識結果を出力する。また、画像処理装置120の評価部350は、オブジェクト領域及びオブジェクト領域以外の領域を特定する。
ステップS604において、画像処理装置120の処理強度加算部320は、全範囲にわたって量子化ステップを上げていった場合に加算される加算処理強度に対応する設定フィルタを、順次、評価部350に通知する。
ステップS605において、画像処理装置120の処理強度加算部320は、ステップS601で算出された処理強度に、全範囲にわたって量子化ステップを上げていった場合に加算される加算処理強度を順次加算することで、合計処理強度をそれぞれ算出する。また、画像処理装置120のフィルタ処理部330は、各合計処理強度に対応する設定フィルタを用いて、画像データに対して順次フィルタ処理を行い、処理後画像データをそれぞれ生成する。
ステップS606において、画像処理装置120の画像認識部340は、各処理後画像データに対して順次画像認識処理を行い、認識結果をそれぞれ出力する。
ステップS607において、画像処理装置120の評価部350は、各認識結果に含まれるオブジェクトの認識精度を監視し、オブジェクトの認識精度が急激に低下したかを判定する。
ステップS608において、画像処理装置120の評価部350は、認識精度が急激に低下した直前の加算処理強度に対応する設定ファイルを、オブジェクト領域と対応付けて画像加工部360に通知する。
続いて、図7のステップS701において、画像処理装置120の画像加工部360は、評価部350より通知された設定フィルタを用いて、画像データに対してフィルタ処理を行い、処理後画像データを生成する。
ステップS702において、画像処理装置120の画像加工部360は、加算処理強度が最大となる設定ファイルを用いて、画像データに対してフィルタ処理を行い、処理後画像データを生成する。
ステップS703において、画像処理装置120の画像加工部360は、ステップS701において生成された処理後画像データから、オブジェクト領域を抽出する。
ステップS704において、画像処理装置120の画像加工部360は、ステップS702において生成された処理後画像データから、オブジェクト領域以外の領域を抽出する。
ステップS705において、画像処理装置120の画像生成部370は、ステップS703及びS704において抽出されたオブジェクト領域及びオブジェクト領域以外の領域の処理後画像データを結合することで、領域別の処理後画像データを生成する。
ステップS706において、エンコーダ130は、領域別の処理後画像データに対して符号化処理を行い、圧縮データを生成する。
ステップS707において、エンコーダ130は、圧縮データをストレージ装置140に格納する。
以上の説明から明らかなように、第1の実施形態に係る画像処理装置は、各合計処理強度に対応する設定フィルタを用いて画像データに対して順次フィルタ処理を行い、生成した各処理後画像データに対して順次画像認識処理を行う。これにより、第1の実施形態に係る画像処理装置によれば、画像データの画質を変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出することができる。
また、第1の実施形態に係る画像処理装置は、認識精度が所定の許容限界となった際の加算処理強度に対応する設定フィルタを用いて画像データに対してフィルタ処理を行い、オブジェクト領域を抽出する。また、第1の実施形態に係る画像処理装置は、加算処理強度が最大となる設定フィルタを用いて画像データに対してフィルタ処理を行い、オブジェクト領域以外の領域を抽出する。更に、抽出したオブジェクト領域の処理後画像データとオブジェクト領域以外の領域の処理後画像データとを結合し、領域別の処理後画像データを生成する。これにより、第1の実施形態に係る画像処理装置によれば、画像データのオブジェクト領域を認識精度が所定の許容限界となる画質に変更し、画像データのオブジェクト領域以外の領域を認識精度が所定の許容限界未満となる画質に変更することができる。
また、第1の実施形態に係る画像処理装置は、領域別の処理後画像データをエンコーダに入力することで、符号化処理を実行させる。これにより、第1の実施形態に係る画像処理装置によれば、エンコーダが領域ごとに量子化ステップを変更することができない場合でも、領域ごとに適切な圧縮レベルで圧縮処理が行われた圧縮データが、エンコーダから出力されることになる。
つまり、第1の実施形態に係る画像処理装置によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。
[第2の実施形態]
上記第1の実施形態では、加算処理強度が最大となる設定フィルタを用いて、画像データに対してフィルタ処理を行った際の処理後画像データから、オブジェクト領域以外の領域を抽出するものとして説明した。
これに対して、第2の実施形態では、予め無効化画像データ(画像データの各画素をゼロにした画像データ)を用意しておき、当該無効化画像データから、オブジェクト領域以外の領域を抽出する場合について説明する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
<画像処理装置の機能構成>
はじめに、第2の実施形態に係る画像処理装置120の機能構成について説明する。図8は、画像処理装置の機能構成の一例を示す第2の図である。上記第1の実施形態において図3を用いて説明した機能構成との相違点は、評価部810、画像加工部820、画像生成部840の機能が異なる点、及び、無効化部830が含まれる点である。
評価部810は、画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、画像データに含まれるオブジェクトの領域を特定し、画像加工部820に通知する。また、評価部810は、画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、画像データに含まれるオブジェクトの領域以外の領域を特定し、無効化部830に通知する。
また、評価部810は、それぞれの処理後画像データに対して画像認識処理が行われることで順次通知される認識結果に含まれるオブジェクトの認識精度を監視し、オブジェクトの認識精度が急激に低下したか否かを判定する。
また、評価部810は、認識精度が急激に低下した直前のタイミングで、処理強度加算部320から通知された設定フィルタ(加算処理強度)を特定し、画像加工部820に通知する。
画像加工部820は、評価部810より通知される設定フィルタ(加算処理強度)を用いて、画像データに対してフィルタ処理を行い、処理後画像データを生成する。また、画像加工部820は、評価部810より通知されるオブジェクト領域を、処理後画像データから抽出し、画像生成部840に通知する。
無効化部830は、予め無効化画像データ(画像データの各画素をゼロにした画像データ)を有しており、当該無効化画像データから、評価部810より通知されるオブジェクト領域以外の領域を抽出し、画像生成部840に通知する。
画像生成部840は変更部の他の一例である。画像生成部840は、画像加工部820から通知された、オブジェクト領域の処理後画像データと、無効化部830から通知された、オブジェクト領域以外の領域の無効化画像データとを結合し、領域別の処理後画像データ850を生成する。また、画像生成部840は、生成した領域別の処理後画像データ850を、エンコーダ130に入力する。
<無効化画像データを用いることの利点>
次に、無効化画像データを用いることの利点について説明する。オブジェクト領域以外の領域の無効化画像データを用いて領域別の処理後画像データ850を生成することで、圧縮処理システム100では、以下のような効果を享受することができる。
・エンコーダ130において画面間予測を行う場合、一般に、エンコーダ130では、既に復号可能な画像データとの差分を導出して符号化処理を行う。このとき、既に復号可能な画像データにおいて、オブジェクト領域以外の領域に無効化画像データが含まれている場合、差分が発生しない。このため、圧縮データのデータ量を更に削減することができる(つまり、量子化ステップによらず、圧縮率を向上させることができる)。
・エンコーダ130において画面内予測を行う場合、一般に、量子化ステップの大きさに応じて、高周波成分をどの程度残すかが決まる。このとき、オブジェクト領域以外の領域に無効化画像データが含まれていると、画面内予測を行う際、予測画像データを隣接画素から生成するにあたり、符号化対象が無効化画像データでない場合の隣接画素から生成するよりも、差分が極めて小さくなる。また、無効化画像データの場合、高周波成分が存在しない。このため、圧縮データのデータ量を更に削減することができる(つまり、量子化ステップによらず、圧縮率を向上させることができる)。
以上の説明から明らかなように、第2の実施形態に係る画像処理装置は、各合計処理強度に対応する設定フィルタを用いて画像データに対して順次フィルタ処理を行い、生成した各処理後画像データに対して順次画像認識処理を行う。これにより、第2の実施形態に係る画像処理装置によれば、画像データの画質を変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出することができる。
また、第2の実施形態に係る画像処理装置は、認識精度が所定の許容限界となった際の加算処理強度に対応する設定フィルタを用いて画像データに対してフィルタ処理を行い、オブジェクト領域を抽出する。また、第2の実施形態に係る画像処理装置は、無効化画像データから、オブジェクト領域以外の領域を抽出する。更に、抽出したオブジェクト領域の処理後画像データとオブジェクト領域以外の領域の無効化画像データとを結合し、領域別の処理後画像データを生成する。これにより、第2の実施形態に係る画像処理装置によれば、画像データのオブジェクト領域を認識精度が所定の許容限界となる画質に変更し、画像データのオブジェクト領域以外の領域を認識精度が所定の許容限界未満となる画質に変更することができる。
また、第2の実施形態に係る画像処理装置は、領域別の処理後画像データをエンコーダに入力することで、符号化処理を実行させる。これにより、第2の実施形態に係る画像処理装置によれば、エンコーダが領域ごとに量子化ステップを変更することができない場合でも、領域ごとに適切な圧縮レベルで圧縮処理が行われた圧縮データが、エンコーダから出力されることになる。
つまり、第2の実施形態に係る画像処理装置によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。
[第3の実施形態]
上記第2の実施形態では、オブジェクト領域の処理後画像データと、オブジェクト領域以外の領域の無効化画像データとを結合し、領域別の処理後画像データを生成した。これに対して、第3の実施形態では、オブジェクト領域の画像データと、オブジェクト領域以外の領域の無効化画像データとを結合し、領域別の処理後画像データを生成する。以下、第3の実施形態について、上記第2の実施形態との相違点を中心に説明する。
<画像処理装置の機能構成>
はじめに、第3の実施形態に係る画像処理装置120の機能構成について説明する。図9は、画像処理装置の機能構成の一例を示す第3の図である。上記第2の実施形態において図8を用いて説明した機能構成との相違点は、処理強度変換部310、処理強度加算部320、フィルタ処理部330、画像加工部820を有していない点、評価部910、画像生成部920の機能が異なる点である。
評価部910は特定部の一例であり、画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、画像データに含まれるオブジェクトの領域を特定し、画像生成部920に通知する。また、評価部910は、画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、画像データに含まれるオブジェクトの領域以外の領域を特定し、無効化部830に通知する。
無効化部830は、予め無効化画像データ(画像データの各画素をゼロにした画像データ)を有しており、当該無効化画像データから、評価部910より通知されるオブジェクト領域以外の領域を抽出し、画像生成部920に通知する。
画像生成部920は変更部の他の一例である。画像生成部920は、評価部910より通知されるオブジェクト領域を画像データから抽出する。また、画像生成部920は、抽出したオブジェクト領域の画像データと、無効化部830から通知された、オブジェクト領域以外の領域の無効化画像データとを結合し、領域別の処理後画像データ930を生成する。また、画像生成部920は、生成した領域別の処理後画像データ930を、エンコーダ130に入力する。
以上の説明から明らかなように、第3の実施形態に係る画像処理装置は、画像データからオブジェクト領域を抽出し、無効化画像データから、オブジェクト領域以外の領域を抽出する。また、第3の実施形態に係る画像処理装置は、抽出したオブジェクト領域の画像データとオブジェクト領域以外の領域の無効化画像データとを結合し、領域別の処理後画像データを生成する。更に、第3の実施形態に係る画像処理装置は、領域別の処理後画像データをエンコーダに入力することで、符号化処理を実行させる。
これにより、第3の実施形態に係る画像処理装置によれば、エンコーダが領域ごとに量子化ステップを変更することができない場合でも、領域ごとに適切な圧縮レベルで圧縮処理が行われた圧縮データがエンコーダから出力されることになる。
つまり、第3の実施形態に係る画像処理装置によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。
[第4の実施形態]
上記第1乃至第3の実施形態において、処理強度加算部は、全範囲にわたって量子化ステップを上げていった場合に加算される加算処理強度を順次処理強度に加算することで、各合計処理強度を算出した。一方で、全範囲にわたって量子化ステップを上げていった場合に加算される加算処理強度を順次処理強度に加算して各合計処理強度を算出し、対応する設定フィルタを順次設定していくと、フィルタ処理を行う回数が増大する。
このため、第4の実施形態では、一部の加算処理強度のみを順次加算して各合計処理強度を算出し、対応する設定フィルタのみを設定していくことで、フィルタ処理を行う回数を削減する。具体的には、処理対象の画像データが、既に処理済みの画像データと同様の画像データ(同一のオブジェクトが含まれる画像データ)であった場合、第4の実施形態では、各オブジェクトの認識精度が急激に低下するタイミングを予め推定する。そして、推定したタイミングに応じた特定範囲の加算処理強度のみを順次処理強度に加算して、各合計処理強度を算出し、対応する設定フィルタのみを用いてフィルタ処理を行う。これにより、フィルタ処理を行う回数を削減することができる。以下、第4の実施形態について、上記第1乃至第3の実施形態との相違点を中心に説明する。
<画像処理装置の機能構成>
はじめに、第4の実施形態に係る画像処理装置120の機能構成について説明する。図10は、画像処理装置の機能構成の一例を示す第4の図である。図3との相違点は、処理強度加算部1010、評価部1020の機能が異なる点、新たに動き追従部1030が追加されている点である。
なお、図10に示す画像処理装置120は、図3に示す画像処理装置120と同様の機能を有しつつ、更に、処理対象の画像データに含まれるオブジェクトが、前回の処理対象の画像データに含まれるオブジェクトと同一であった場合の機能が付加されている。そこで、以下では、第4の実施形態において付加された機能について説明する。
処理強度加算部1010は、処理対象の画像データが、前回の処理対象の画像データに含まれるオブジェクトと同一であった場合に評価部1020から通知される、特定範囲の加算処理強度を取得する。
なお、特定範囲の加算処理強度とは、前回の処理対象の画像データが処理された際、オブジェクトの認識精度が急激に変化する直前のタイミングで、処理強度加算部から通知された設定フィルタに対応する加算処理強度の前後の加算処理強度を指す。したがって、例えば、画像データ内に3つのオブジェクトが含まれていた場合、評価部1020からは、特定範囲の加算処理強度が3種類通知されることになる。
また、処理強度加算部1010は、取得した特定範囲の加算処理強度それぞれを、処理強度変換部310より通知された処理強度に順次加算し、合計処理強度をそれぞれ算出する。
また、処理強度加算部1010は、算出した各合計処理強度に対応する設定フィルタを、順次フィルタ処理部330に通知する。
評価部1020は、処理対象の画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、処理対象の画像データに含まれるオブジェクトの領域及びオブジェクト領域以外の領域を特定し、画像加工部360に通知する。また、評価部1020は、オブジェクト領域の情報を、動き追従部1030に通知し、動き追従部1030より追従結果を取得する。
なお、追従結果とは、処理対象の画像データに含まれるオブジェクトと同一のオブジェクトが、前回の処理対象の画像データに含まれていたか否かを示す情報である。
評価部1020は、動き追従部1030より、同一のオブジェクトが含まれるとの追従結果を受信した場合、特定範囲の加算処理強度を処理強度加算部1010に通知する。具体的には、評価部1020は、前回の処理対象の画像データに対して画像認識処理が行われた際に、認識精度が急激に低下した直前のタイミングで、処理強度加算部1010から通知された設定フィルタ(加算処理強度)を特定する。そして、評価部1020は、特定した設定フィルタに対応する加算処理強度の前後の加算処理強度を指定することで、特定範囲の加算処理強度を、処理強度加算部1010に通知する。
また、評価部1020は、特定範囲の加算処理強度を通知したことに応じて、画像認識部340より順次通知される認識結果に含まれるオブジェクトの認識精度を監視し、オブジェクトの認識精度が急激に変化したか否かを判定する。
また、評価部1020は、認識精度が急激に低下した直前のタイミングに対応する設定フィルタ(加算処理強度)を特定し、オブジェクト領域と対応付けて画像加工部360に通知する。
動き追従部1030は、評価部1020から通知された、処理対象の画像データにおけるオブジェクト領域と、前回の処理対象の画像データにおけるオブジェクト領域と、を比較する。
また、動き追従部1030は、比較の結果、オブジェクトが一致すると判定した場合、同一のオブジェクトが含まれるとの追従結果を、評価部1020に通知する。
また、動き追従部1030は、比較の結果、オブジェクトが一致しないと判定した場合、同一のオブジェクトが含まれないとの追従結果を、評価部1020に通知する。
<領域別の処理後画像データの生成処理の具体例>
次に、第4の実施形態に係る画像処理装置120による領域別の処理後画像データの生成処理の具体例について、図11及び図12を用いて説明する。図11及び図12は、画像処理装置による領域別の処理後画像データの生成処理の具体例を示す第2及び第3の図である。
図11において、軸1150は時間軸であり、連続する3つの画像データ(画像データ400、1100_1、1100_2)が、それぞれの時間に入力された様子を示している。
図11に示すように、画像データ400には、3つのオブジェクト(オブジェクトA~オブジェクトC)が含まれており、画像データ1100_1、1100_2にも、同一のオブジェクトが含まれているとする。
また、図11に示すように、画像データ400が処理対象の画像データであった場合、
・QP~QP15に相当する加算処理強度が順次加算される過程で、オブジェクトAに対する認識精度が許容限界となった際の設定フィルタ(加算処理強度)として、QP14に対応する設定フィルタ(加算処理強度)が決定され、
・QP16~QP25に相当する加算処理強度が順次加算される過程で、オブジェクトBに対する認識精度が許容限界となった際の設定フィルタ(加算処理強度)として、QP24に対応する設定フィルタ(加算処理強度)が決定され、
・QP26~QP35に相当する加算処理強度が順次加算される過程で、オブジェクトCに対する認識精度が許容限界となった際の設定フィルタ(加算処理強度)として、QP34に対応する設定フィルタ(加算処理強度)が決定されたこと、
を示している。なお、図12において、符号1201は、画像加工部360が、画像データ400に対してフィルタ処理を行う際に用いる各設定フィルタ(加算処理強度)を示したものである。
一方、画像データ1100_1が処理対象の画像データであった場合、
・特定範囲の加算処理強度(QP10~QP15に相当する加算処理強度)が順次加算される過程(図12の点線矩形1211)で、オブジェクトAに対する認識精度が許容限界となった際の設定フィルタとして、QP14に対応する設定フィルタが決定され、
・特定範囲の加算処理強度(QP20~QP25に相当する加算処理強度)が順次加算される過程(図12の点線矩形1212)で、オブジェクトBに対する認識精度が許容限界となった際の設定フィルタとして、QP24に対応する設定フィルタが決定され、
・特定範囲の加算処理強度(QP30~QP35に相当する加算処理強度)が順次加算される過程(図12の点線矩形1213)で、オブジェクトCに対する認識精度が許容限界となった際の設定フィルタとして、QP34に対応する設定フィルタが決定されたこと、
を示している。なお、図12において、符号1202は、画像加工部360が、画像データ1100_1に対してフィルタ処理を行う際の設定フィルタ(加算処理強度)が決定される前の状態を示している。一方、符号1203は、決定された後の状態を示している。
同様に、画像データ1100_2が処理対象の画像データであった場合、
・特定範囲の加算処理強度(QP10~QP15に相当する加算処理強度)が順次加算される過程で、オブジェクトAに対する認識精度が許容限界となった際の設定フィルタとして、QP14に対応する設定フィルタが決定され、
・特定範囲の加算処理強度(QP20~QP25に相当する加算処理強度)が順次加算される過程で、オブジェクトBに対する認識精度が許容限界となった際の設定フィルタとして、QP24に対応する設定フィルタが決定され、
・特定範囲の加算処理強度(QP30~QP35に相当する加算処理強度)が順次加算される過程で、オブジェクトCに対する認識精度が許容限界となった際の設定フィルタとして、QP34に対応する設定フィルタが決定されたこと、
ことを示している。
このように、第4の実施形態によれば、処理強度加算部が一部の加算処理強度のみを順次加算して各合計処理強度を算出するため、フィルタ処理を行う回数を大幅に削減することができる。
<圧縮処理システムによる圧縮処理の流れ>
次に、第4の実施形態に係る圧縮処理システム100による圧縮処理の流れについて説明する。図13は、圧縮処理システムによる圧縮処理の流れの一例を示す第3のフローチャートである。図6に示した第1のフローチャートとの相違点は、ステップS1301~S1307である。
ステップS1301において、画像処理装置120の動き追従部1030は、処理対象の画像データに含まれるオブジェクトが、前回の処理対象の画像データに含まれるオブジェクトと一致するか否かを判定する。
ステップS1301において、一致しないと判定された場合には(ステップS1301においてNOの場合には)、ステップS1302に進む。
ステップS1302において、画像処理装置120の処理強度加算部1010は、全範囲にわたって量子化ステップを上げていった場合に加算される加算処理強度に対応する設定フィルタを、順次、評価部1020に通知する。
ステップS1304において、画像処理装置120の処理強度加算部1010は、処理強度に、全範囲にわたって量子化ステップを上げていった場合に加算される加算処理強度を順次加算することで合計処理強度をそれぞれ算出する。また、画像処理装置120のフィルタ処理部330は、各合計処理強度に対応する設定フィルタを用いて、画像データに対して順次フィルタ処理を行い、処理後画像データをそれぞれ生成する。
ステップS1305において、画像処理装置120の画像認識部340は、各処理後画像データに対して順次画像認識処理を行い、認識結果をそれぞれ出力する。
ステップS1306において、画像処理装置120の評価部1020は、各認識結果に含まれるオブジェクトの認識精度を監視し、オブジェクトの認識精度が急激に低下したかを判定する。
ステップS1307において、画像処理装置120の評価部1020は、認識精度が急激に低下した直前の加算処理強度に対応する設定ファイルを、オブジェクト領域と対応付けて画像加工部360に通知する。その後、図7に進む。
一方、ステップS1301において、一致すると判定された場合には(ステップS1301においてYESの場合には)、ステップS1303に進む。
ステップS1303において、画像処理装置120の評価部1020は、特定範囲の加算処理強度を処理強度加算部1010に通知する。
ステップS1304において、画像処理装置120の処理強度加算部1010は、処理強度に、特定範囲の加算処理強度を順次加算することで、合計処理強度をそれぞれ算出する。また、画像処理装置120のフィルタ処理部330は、各合計処理強度に対応する設定フィルタを用いて、画像データに対して順次フィルタ処理を行い、処理後画像データをそれぞれ生成する。
ステップS1305において、画像処理装置120の画像認識部340は、各処理後画像データに対して順次画像認識処理を行い、認識結果をそれぞれ出力する。
ステップS1306において、画像処理装置120の評価部1020は、各認識精度に含まれるオブジェクトの認識精度を監視し、オブジェクトの認識精度が急激に低下したかを判定する。
ステップS1307において、画像処理装置120の評価部1020は、認識精度が急激に低下した直前の加算処理強度に対応する設定フィルタを、オブジェクト領域と対応付けて画像加工部360に通知する。その後、図7に進む。
以上の説明から明らかなように、第4の実施形態に係る画像処理装置は、特定範囲の加算処理強度が加算されてなる各合計処理強度に対応する設定フィルタを用いて、画像データに対して順次フィルタ処理を行う。また、第4の実施形態に係る画像処理装置は、生成した各処理後画像データに対して順次画像認識処理を行う。これにより、第4の実施形態に係る画像処理装置によれば、画像データの画質を特定範囲で変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出することができる。
この結果、第4の実施形態に係る画像処理装置によれば、上記第1の実施形態と同様の効果を享受できるとともに、フィルタ処理を行う回数を削減することができる。
[第5の実施形態]
上記第1乃至第4の実施形態では、エンコーダ130にて符号化処理が行われた圧縮データを、ストレージ装置140に格納する場合について説明した。これに対して、第4の実施形態では、エンコーダ130にて符号化処理が行われた圧縮データを、ネットワークを介してデコーダに伝送する。
なお、エンコーダ130にて符号化処理が行われた圧縮データをデコーダに伝送する場合、圧縮処理システムではビットレートを制御し、仮想バッファにおいてオーバフローが発生することがないよう、量子化ステップを変更する。
一方で、量子化ステップが変更され、変更後の量子化ステップを用いて符号化処理が行われた場合、デコーダにて復号処理が行われた復号データの認識精度が許容限界を下回ることが考えられる。そこで、第5の実施形態では、エンコーダ130において量子化ステップが変更される可能性が生じた場合に、認識精度の観点から、量子化ステップの変更が適切か否かを評価する。以下、第5の実施形態について、上記第1乃至第4の実施形態との相違点を中心に説明する。
<圧縮処理システムのシステム構成>
はじめに、第5の実施形態に係る画像処理装置を含む、圧縮処理システム全体のシステム構成について説明する。図14は、圧縮処理システムのシステム構成の一例を示す第2の図である。
図14に示すように、圧縮処理システム1400は、撮像装置110、画像処理装置1410、制御装置1420、エンコーダ1430、デコーダ1440を有する。なお、エンコーダ1430とデコーダ1440とは、ネットワーク1450を介して通信可能に接続される。
このうち、撮像装置110は、上記第1の実施形態において図1を用いて説明済みであるため、ここでは説明を省略する。
画像処理装置1410は、画像認識処理を行う学習済みモデルを有する。画像処理装置1410は、撮像装置110より送信された画像データをエンコーダ1430に通知する。また、画像処理装置1410は、制御装置1420より、変更予定の量子化ステップを取得し、当該量子化ステップを用いてエンコーダ1430が画像データに対して符号化処理を行った場合の、復号データの画質を評価する。また、画像処理装置1410は、評価結果を制御装置1420に通知する。
制御装置1420は、エンコーダ1430にて符号化処理が行われた圧縮データをデコーダに伝送する際、ビットレートを制御する。制御装置1420は、エンコーダ1430より、ビットレート制御に必要な情報を受け取り、量子化ステップ(仮想バッファにおけるオーバフローの発生を回避するための量子化ステップ)を算出する。また、算出した量子化ステップを、画像処理装置1410に通知し、画像処理装置1410より評価結果を取得する。また、制御装置1420は、取得した評価結果に応じた量子化ステップをエンコーダ1430に設定する。
エンコーダ1430は、画像処理装置1410より通知された画像データに対して、制御装置1420により設定された量子化ステップを用いて符号化処理を行い、圧縮データを生成する。また、エンコーダ1430は生成した圧縮データを、ネットワーク1450を介してデコーダ1440に伝送する。
デコーダ1440は、エンコーダ1430より伝送された圧縮データに対して復号処理を行い、復号データを生成する。
<画像処理装置の機能構成>
次に、第5の実施形態に係る画像処理装置1410の機能構成について説明する。図15は、画像処理装置の機能構成の一例を示す第5の図である。図15に示すように、画像処理装置1410は、処理強度変換部1510、フィルタ処理部1520、画像認識部340、評価部1530として機能する。
処理強度変換部1510は、制御装置1420より通知された、変更予定の量子化ステップを取得し、処理強度に変換する。また、処理強度変換部1510は、処理強度に対応する設定フィルタを、フィルタ処理部1520に通知する。
フィルタ処理部1520は、処理強度変換部1510より通知された設定フィルタを用いて、画像データに対してフィルタ処理を行い、処理後画像データを画像認識部340に通知する。
画像認識部340は、上記第1の実施形態において図3を用いて説明済みであるため、ここでは説明を省略する。
評価部1530は、処理後画像データに対して画像認識処理が行われることで通知された認識結果に基づいて、画像データに含まれるオブジェクトの認識精度が所定の許容限界以上であるか否かを判定する。
また、評価部1530は、認識精度が所定の許容限界以上であると判定した場合には、変更予定の量子化ステップを適用しても、所定の許容限界以上の認識精度が得られるとの評価結果を、制御装置1420に通知する。
また、評価部1530は、認識精度が所定の許容限界未満であると判定した場合には、変更予定の量子化ステップを適用した場合、許容限界以上の認識精度が得られなくなるとの評価結果を制御装置1420に通知する。
<圧縮処理システムによる圧縮処理の流れ>
次に、圧縮処理システム1400による圧縮処理の流れについて説明する。図16は、圧縮処理システムによる圧縮処理の流れの一例を示す第4のフローチャートである。
ステップS1601において、画像処理装置1410のフィルタ処理部1520は、画像データを取得する。
ステップS1602において、画像処理装置1410の処理強度変換部1510は、制御装置1420より変更予定の量子化ステップが通知されたか否かを判定することで、量子化ステップの変更が必要か否かを判定する。
ステップS1602において、変更予定の量子化ステップが通知されていない場合には、量子化ステップの変更が必要でないと判定し(ステップS1602においてNOと判定し)、ステップS1610に進む。
一方、ステップS1602において、変更予定の量子化ステップが通知された場合には、量子化ステップの変更が必要であると判定し(ステップS1602においてYESと判定し)、ステップS1603に進む。
ステップS1603において、画像処理装置1410の処理強度変換部1510は、変更予定の量子化ステップを取得し、処理強度を算出する。また、処理強度変換部1510は、算出した処理強度に対応する設定フィルタをフィルタ処理部1520に通知する。
ステップS1604において、画像処理装置1410のフィルタ処理部1520は、通知された設定フィルタを用いて、画像データに対してフィルタ処理を行い、処理後画像データを生成する。
ステップS1605において、画像処理装置1410の画像認識部340は、生成された処理後画像データに対して画像認識処理を行い、認識結果を出力する。
ステップS1606において、画像処理装置1410の評価部1530は、出力された認識結果が、所定の許容限界以上の認識精度を有するか否かを判定する。
ステップS1606において、所定の許容限界以上の認識精度を有していないと判定した場合には(ステップS1606においてNOの場合には)、ステップS1609に進む。
一方、ステップS1606にいて、所定の許容限界以上の認識精度を有していると判定した場合には(ステップS1606においてYESの場合には)、ステップS1607に進む。
ステップS1607において、画像処理装置1410の評価部1530は、量子化ステップの変更が可能と評価し、評価結果を制御装置1420に通知する。
ステップS1608において、制御装置1420は、変更予定の量子化ステップに変更した変更後の量子化ステップをエンコーダ1430に通知する。また、エンコーダ1430は、制御装置1420より通知された量子化ステップを用いて符号化処理を行い、圧縮データをデコーダ1440に伝送する。
ステップS1609において、画像処理装置1410の評価部1530は、量子化ステップの変更が不可と評価し、評価結果を制御装置1420に通知する。
ステップS1610において、制御装置1420は、変更予定前の量子化ステップをエンコーダ1430に通知する。また、エンコーダ1430は、変更予定前の量子化ステップを用いて符号化処理を行い、圧縮データをデコーダ1440に伝送する。
以上の説明から明らかなように、第5の実施形態に係る圧縮処理システムは、エンコーダにおいて量子化ステップを変更する可能性が生じた場合に、画像処理装置が、復号データの認識精度の観点から、量子化ステップの変更可否を評価する。また、第5の実施形態に係る圧縮処理システムは、画像処理装置による評価結果に応じた量子化ステップで、エンコーダが符号化処理を行う。
これにより、第5の実施形態によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。
なお、上記第5の実施形態において、画像処理装置1410は、取得した画像データをエンコーダ1430に通知するものとして説明した。しかしながら、上記第1乃至第4の実施形態同様、画像処理装置1410は、取得した画像データから処理後画像データを生成し、生成した処理後画像データをエンコーダ1430に通知してもよい。
[その他の実施形態]
上記各実施形態では、画像データにおいてオブジェクトが含まれる領域をオブジェクト領域と特定したが、オブジェクト領域の特定方法はこれに限定されない。例えば、オブジェクトが含まれる領域と、オブジェクトが含まれる領域の周辺の領域と、を含む領域を、オブジェクト領域として特定してもよい。
また、上記各実施形態では、処理強度加算部が、合計処理強度に対応する設定フィルタを特定し、フィルタ処理部がフィルタ処理を行うことで、画像データの画質を変更するものとして説明した。しかしながら、画像データの画質の変更方法はこれに限定されない。
例えば、量子化ステップと、設定フィルタとの関係を予め統計的に求めておくことで、設定フィルタを特定してもよい。また、量子化ステップと設定フィルタとの関係は、例えば、
・量子化ステップを用いて符号化処理が行われた圧縮データに対して復号処理を行った際の復号データと、
・設定フィルタを用いて画像データに対してフィルタ処理が行われた際の処理後画像データと、
を学習することで求めてもよい。その際、復号データの画質及び処理後画像データの画質は、例えば、PSNR(Peak Signal to Noise Ratio)やSSIM(Structural Similarity)等の指標を用いて評価してもよい。
また、上記各実施形態では、画像処理装置とエンコーダとを別体としたが、画像処理装置とエンコーダとは、一体の装置としてもよい。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
100 :圧縮処理システム
120 :画像処理装置
130 :エンコーダ
310 :処理強度変換部
320 :処理強度加算部
330 :フィルタ処理部
340 :画像認識部
350 :評価部
360 :画像加工部
370 :画像生成部
810 :評価部
820 :画像加工部
830 :無効化部
840 :画像生成部
910 :評価部
920 :画像生成部
1010 :処理強度加算部
1020 :評価部
1030 :動き追従部
1410 :画像処理装置
1420 :制御装置
1430 :エンコーダ
1440 :デコーダ
1510 :処理強度変換部
1520 :フィルタ処理部
1530 :評価部

Claims (9)

  1. 画像データの画質を変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出する算出部と、
    前記画像データにおいて、前記オブジェクトが含まれる領域を、前記認識精度が所定の許容限界となる画質に変更し、前記オブジェクトが含まれる領域以外の領域を、前記認識精度が所定の許容限界未満となる画質に変更する変更部と、を有し、
    前記変更部は、変更後の前記画像データを、エンコーダに入力する画像処理装置。
  2. 前記画像データに対して画像認識処理を行った場合の認識結果に基づいて、前記オブジェクトが含まれる領域を特定する、請求項1に記載の画像処理装置。
  3. 前記変更部は、前記画像データにおいて、前記オブジェクトが含まれる領域以外の領域を、所定の画質に変更する、請求項2に記載の画像処理装置。
  4. 前記変更部は、前記画像データにおいて、前記オブジェクトが含まれる領域以外の領域を無効化する、請求項2に記載の画像処理装置。
  5. 前記画像データの画質を特定範囲で変更した場合の、前記認識精度の変化に基づいて、前記認識精度が所定の許容限界となる画質を評価する評価部を更に有する、請求項1に記載の画像処理装置。
  6. 前記画像データに含まれるオブジェクトが、既に画質が変更された画像データに含まれるオブジェクトと同じである場合、前記評価部は、前記所定の許容限界に応じた特定範囲で画質を変更した場合の、前記認識精度の変化に基づいて、前記認識精度が所定の許容限界となる画質を評価する、請求項5に記載の画像処理装置。
  7. 前記エンコーダにおいて用いられる量子化ステップを制御する制御装置から、変更予定の量子化ステップに関する情報を取得した場合、前記算出部は、該量子化ステップに関する情報に基づいて画像データの画質を変更した場合の、変更後の画像データに含まれるオブジェクトの認識精度を算出し、
    前記評価部は、算出された認識精度が所定の許容限界以上であるか否かの評価結果を、前記制御装置に通知する、請求項5に記載の画像処理装置。
  8. 画像データの画質を変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出し、
    前記画像データにおいて、前記オブジェクトが含まれる領域を、前記認識精度が所定の許容限界となる画質に変更し、前記オブジェクトが含まれる領域以外の領域を、前記認識精度が所定の許容限界未満となる画質に変更し、
    変更後の前記画像データを、エンコーダに入力する、
    処理をコンピュータが実行する画像処理方法。
  9. 画像データの画質を変更した場合の、変更後の各画像データに含まれるオブジェクトの認識精度を算出し、
    前記画像データにおいて、前記オブジェクトが含まれる領域を、前記認識精度が所定の許容限界となる画質に変更し、前記オブジェクトが含まれる領域以外の領域を、前記認識精度が所定の許容限界未満となる画質に変更し、
    変更後の前記画像データを、エンコーダに入力する、
    処理をコンピュータに実行させるための画像処理プログラム。
JP2022556715A 2020-10-13 2020-10-13 画像処理装置、画像処理方法及び画像処理プログラム Active JP7491388B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/038601 WO2022079791A1 (ja) 2020-10-13 2020-10-13 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2022079791A1 JPWO2022079791A1 (ja) 2022-04-21
JP7491388B2 true JP7491388B2 (ja) 2024-05-28

Family

ID=81207798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022556715A Active JP7491388B2 (ja) 2020-10-13 2020-10-13 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (3)

Country Link
US (1) US20230206611A1 (ja)
JP (1) JP7491388B2 (ja)
WO (1) WO2022079791A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012186685A (ja) 2011-03-07 2012-09-27 Hitachi Consumer Electronics Co Ltd 画像認識表示システム及びこれに用いるカメラ
JP2016025494A (ja) 2014-07-22 2016-02-08 ルネサスエレクトロニクス株式会社 画像受信装置、画像伝送システムおよび画像受信方法
JP2016046707A (ja) 2014-08-25 2016-04-04 ルネサスエレクトロニクス株式会社 画像通信装置、画像送信装置および画像受信装置
WO2020080141A1 (ja) 2018-10-19 2020-04-23 ソニー株式会社 センサ装置、信号処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012186685A (ja) 2011-03-07 2012-09-27 Hitachi Consumer Electronics Co Ltd 画像認識表示システム及びこれに用いるカメラ
JP2016025494A (ja) 2014-07-22 2016-02-08 ルネサスエレクトロニクス株式会社 画像受信装置、画像伝送システムおよび画像受信方法
JP2016046707A (ja) 2014-08-25 2016-04-04 ルネサスエレクトロニクス株式会社 画像通信装置、画像送信装置および画像受信装置
WO2020080141A1 (ja) 2018-10-19 2020-04-23 ソニー株式会社 センサ装置、信号処理方法

Also Published As

Publication number Publication date
WO2022079791A1 (ja) 2022-04-21
JPWO2022079791A1 (ja) 2022-04-21
US20230206611A1 (en) 2023-06-29

Similar Documents

Publication Publication Date Title
KR102517615B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치
US10469840B2 (en) Motion picture encoding apparatus and method thereof
JP4450828B2 (ja) ビデオコーディングがテクスチャ解析およびテクスチャ合成を含むビデオコーディングのための方法およびアセンブリと、対応するコンピュータプログラムおよび対応するコンピュータで読み込み可能な記録媒体
Fischer et al. Video coding for machines with feature-based rate-distortion optimization
CN103959769B (zh) 用于使用视差信息的3d媒体数据产生、编码、解码和显示的方法和装置
JP2014082639A (ja) 画像符号化装置およびその方法
BR112014004920B1 (pt) Decisões de filtro de desbloqueio de baixa complexidade
JP7318314B2 (ja) 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法
KR20130124285A (ko) 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치, 프로그램 및 집적 회로
US9369703B2 (en) Method and apparatus for SSIM-based bit allocation
JP2013526199A (ja) 予測誤差から導出されるブロック形状を用いた予測符号化
US10652549B2 (en) Video coding device, video coding method, video decoding device, and video decoding method
US20220284632A1 (en) Analysis device and computer-readable recording medium storing analysis program
US9648336B2 (en) Encoding apparatus and method
JP7491388B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
Ma et al. Surveillance video coding with vehicle library
JP7364936B2 (ja) 符号化方法、符号化装置、及びプログラム
Menon et al. ETPS: Efficient two-pass encoding scheme for adaptive live streaming
US20130343449A1 (en) Image encoding apparatus and its control method
JP7444176B2 (ja) 画像処理システム及び画像処理プログラム
US20200296358A1 (en) Method and device for encoding image according to low-quality coding mode, and method and device for decoding mage
WO2022079792A1 (ja) ビットレート制御システム、ビットレート制御方法及びビットレート制御プログラム
Egge et al. Using Daala intra frames for still picture coding
JP2020150441A (ja) 画像パディング方法、画像パディング装置、及びプログラム
Li et al. A novel weight-based URQ scheme for perceptual video coding of conversational video in HEVC

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240429

R150 Certificate of patent or registration of utility model

Ref document number: 7491388

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150