JP7310926B2 - Analysis device and analysis program - Google Patents
Analysis device and analysis program Download PDFInfo
- Publication number
- JP7310926B2 JP7310926B2 JP2021566651A JP2021566651A JP7310926B2 JP 7310926 B2 JP7310926 B2 JP 7310926B2 JP 2021566651 A JP2021566651 A JP 2021566651A JP 2021566651 A JP2021566651 A JP 2021566651A JP 7310926 B2 JP7310926 B2 JP 7310926B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- compression
- unit
- area
- quantization value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Description
本発明は、解析装置及び解析プログラムに関する。 The present invention relates to an analysis device and an analysis program.
一般に、画像データを記録または伝送する場合、画像圧縮処理によりデータサイズを小さくすることで、記録コストや伝送コストの削減を実現している。 In general, when recording or transmitting image data, the data size is reduced by image compression processing, thereby reducing recording costs and transmission costs.
一方で、近年、AI(Artificial Intelligence)による画像認識処理に利用される目的で、画像データを記録または伝送するケースが増えてきている。AIの代表的なモデルとして、例えば、深層学習や機械学習を用いたモデルが挙げられる。 On the other hand, in recent years, there has been an increasing number of cases where image data is recorded or transmitted for the purpose of being used for image recognition processing by AI (Artificial Intelligence). Typical AI models include, for example, models using deep learning and machine learning.
しかしながら、従来の圧縮処理は、人間の視覚特性に基づいて行われており、AIの動作解析に基づいて行われているわけではない。このため、AIによる画像認識処理に必要でない領域について、十分な圧縮レベルで圧縮処理が行われていない場合があった。 However, conventional compression processing is performed based on human visual characteristics, not based on AI motion analysis. For this reason, there have been cases where compression processing has not been performed at a sufficient compression level for regions that are not required for image recognition processing by AI.
一つの側面では、AIによる画像認識処理に適した圧縮処理を実現することを目的とする。 An object of one aspect is to realize compression processing suitable for image recognition processing by AI.
一態様によれば、解析装置は、
画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各領域の認識結果への影響度を示す情報を格納する格納部と、
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報に基づいて、前記画像データの各領域の圧縮レベルを決定する決定部とを有する。According to one aspect, the analysis device comprises:
Recognition of each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed on image data at different compression levels. a storage unit for storing information indicating the degree of influence on the result;
a determination unit that determines the compression level of each region of the image data based on information indicating the degree of influence of each region of the decoded data corresponding to the different compression levels on the recognition result.
AIによる画像認識処理に適した圧縮処理を実現することができる。 Compression processing suitable for image recognition processing by AI can be realized.
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。 Each embodiment will be described below with reference to the accompanying drawings. In the present specification and drawings, constituent elements having substantially the same functional configuration are denoted by the same reference numerals, thereby omitting redundant description.
[第1の実施形態]
<圧縮処理システムのシステム構成>
はじめに、第1の実施形態に係る解析装置を含む、圧縮処理システム全体のシステム構成について説明する。図1は、圧縮処理システムのシステム構成の一例を示す第1の図である。第1の実施形態において、圧縮処理システムが実行する処理は、圧縮レベル(量子化値)を決定するフェーズと、決定した圧縮レベル(量子化値)に基づいて圧縮処理を行うフェーズとに大別することができる。[First embodiment]
<System configuration of compression processing system>
First, the system configuration of the entire compression processing system including the analysis device according to the first embodiment will be described. FIG. 1 is a first diagram showing an example of the system configuration of a compression processing system. In the first embodiment, the processing executed by the compression processing system is roughly divided into a phase of determining the compression level (quantization value) and a phase of performing compression processing based on the determined compression level (quantization value). can do.
図1において、1aは、圧縮レベル(量子化値)を決定するフェーズにおける圧縮処理システムのシステム構成を示しており、1bは、決定した圧縮レベル(量子化値)に基づいて圧縮処理を行うフェーズにおける圧縮処理システムのシステム構成を示している。 In FIG. 1, 1a shows the system configuration of the compression processing system in the phase of determining the compression level (quantization value), and 1b is the phase of performing compression processing based on the determined compression level (quantization value). 1 shows the system configuration of a compression processing system in .
図1の1aに示すように、圧縮レベル(量子化値)を決定するフェーズにおける圧縮処理システムには、撮像装置110、解析装置120、画像圧縮装置130が含まれる。
As shown in FIG. 1a, the compression processing system in the phase of determining the compression level (quantization value) includes an
撮像装置110は、所定のフレーム周期で撮影を行い、画像データを解析装置120に送信する。なお、画像データには、認識処理の対象となるオブジェクトが含まれる。
The image capturing
解析装置120は、認識処理を行う学習済みモデルを有し、画像データまたは画像データに対して異なる圧縮レベルで圧縮処理が行われた場合の圧縮データを復号した復号データを、学習済みモデルに入力することで認識処理を行い、認識結果を出力する。
The
また、解析装置120は、例えば、誤差逆伝播法を用いて学習済みモデルの動作解析を行うことで、認識結果への影響度を示すマップ(重要特徴マップと称す)を生成し、所定領域ごと(圧縮処理が行われる際に用いられるブロックごと)に影響度を集計する
なお、解析装置120では、異なる圧縮レベル(量子化値)での圧縮処理を画像圧縮装置130に指示し、それぞれの圧縮レベルで圧縮処理が行われた場合の圧縮データそれぞれについて、同様の処理を繰り返す。In addition, the
解析装置120は、異なる圧縮レベルでの圧縮処理を画像圧縮装置130に指示するごとに、各ブロックの影響度の集計値を算出し、各圧縮レベル(各量子化値)に対する、集計値の変化に基づいて、各ブロックの最適な圧縮レベル(量子化値)を決定する。なお、最適な圧縮レベル(量子化値)とは、画像データに含まれるオブジェクトを正しく認識処理することができる最大の圧縮レベル(量子化値)を指す。
Each time the
このように、学習済みモデルの動作解析を行い、認識結果への影響度を算出することで、解析装置120によれば、学習済みモデルによる画像認識処理に適した圧縮処理を行う際の、最適な圧縮レベルを決定することができる。
In this way, by analyzing the behavior of the trained model and calculating the degree of influence on the recognition result, the
一方、図1の1bに示すように、決定した圧縮レベル(量子化値)に基づいて圧縮処理を行うフェーズにおける圧縮処理システムには、解析装置120、画像圧縮装置130、ストレージ装置140が含まれる。
On the other hand, as shown in 1b of FIG. 1, the compression processing system in the phase of performing compression processing based on the determined compression level (quantization value) includes an
解析装置120は、ブロックごとに決定した最適な圧縮レベル(量子化値)及び画像データを画像圧縮装置130に送信する。
The
画像圧縮装置130は、決定された最適な圧縮レベル(量子化値)を用いて画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。
The
このように、本実施形態に係る解析装置120では、学習済みモデルによる画像認識処理に適した圧縮レベルを用いる。つまり、本実施形態に係る解析装置120では、従来の圧縮処理に対して下記のような相違点を有することにより、学習済みモデルによる画像認識処理に適した圧縮処理を実現することができる。
・従来の圧縮処理は、そもそも、推論時に注目した特徴部分に基づいておらず(あくまで、人間の概念で把握できる形状、性質、関心対象等に基づいており)、推論時に注目した特徴部分(必ずしも人間の概念で境界分けできない特徴部分)が用いられることもない。
・従来の圧縮処理では、認識結果を出力する過程であるCNN部320の内部動作(例えば、画像データを入力してから認識結果が出力されるまでの信号/処理結果の伝播過程や、信号/処理結果の伝播強度)を解析することもない。Thus, the
・In the first place, conventional compression processing is not based on the feature part focused on inference (it is based on the shape, property, object of interest, etc. that can be grasped by human concepts), and the feature part focused on inference (not necessarily Characteristic parts that cannot be demarcated by human concepts) are not used.
・In conventional compression processing, the internal operation of the CNN
<解析装置または画像圧縮装置のハードウェア構成>
次に、解析装置120及び画像圧縮装置130のハードウェア構成について説明する。なお、解析装置120と画像圧縮装置130とは、同様のハードウェア構成を有するため、ここでは、両装置の説明をまとめて図2を用いて行う。<Hardware Configuration of Analysis Device or Image Compression Device>
Next, hardware configurations of the
図2は、解析装置または画像圧縮装置のハードウェア構成の一例を示す図である。解析装置120または画像圧縮装置130は、プロセッサ201、メモリ202、補助記憶装置203、I/F(Interface)装置204、通信装置205、ドライブ装置206を有する。なお、解析装置120または画像圧縮装置130の各ハードウェアは、バス207を介して相互に接続されている。
FIG. 2 is a diagram illustrating an example of a hardware configuration of an analysis device or an image compression device; The
プロセッサ201は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ201は、各種プログラム(例えば、後述する解析プログラムまたは画像圧縮プログラム等)をメモリ202上に読み出して実行する。
The
メモリ202は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ201とメモリ202とは、いわゆるコンピュータを形成し、プロセッサ201が、メモリ202上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する(各種機能の詳細は後述する)。
The
補助記憶装置203は、各種プログラムや、各種プログラムがプロセッサ201によって実行される際に用いられる各種データを格納する。
The
I/F装置204は、外部装置の一例である操作装置210、表示装置220と、解析装置120または画像圧縮装置130とを接続する接続デバイスである。I/F装置204は、解析装置120または画像圧縮装置130に対する操作を、操作装置210を介して受け付ける。また、I/F装置204は、解析装置120または画像圧縮装置130による処理の結果を出力し、表示装置220を介して表示する。
The I/
通信装置205は、他の装置と通信するための通信デバイスである。解析装置120の場合、通信装置205を介して撮像装置110及び画像圧縮装置130と通信する。また、画像圧縮装置130の場合、通信装置205を介して解析装置120及びストレージ装置140と通信する。
A
ドライブ装置206は記録媒体230をセットするためのデバイスである。ここでいう記録媒体230には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体230には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
A
なお、補助記憶装置203にインストールされる各種プログラムは、例えば、配布された記録媒体230がドライブ装置206にセットされ、該記録媒体230に記録された各種プログラムがドライブ装置206により読み出されることでインストールされる。あるいは、補助記憶装置203にインストールされる各種プログラムは、通信装置205を介してネットワークからダウンロードされることで、インストールされてもよい。
Various programs to be installed in the
<解析装置の機能構成>
次に、解析装置120の機能構成について説明する。図3は、解析装置の機能構成の一例を示す第1の図である。上述したように、解析装置120には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置120は、入力部310、CNN部320、量子化値設定部330、出力部340として機能する。また、解析装置120は、重要特徴マップ生成部350、集計部360、量子化値決定部370として機能する。<Functional configuration of analysis device>
Next, the functional configuration of the
入力部310は、撮像装置110より送信される画像データ、または、画像圧縮装置130より送信される圧縮データを取得する。入力部310は、取得した画像データをCNN部320及び出力部340に通知するとともに、不図示の復号部を用いて、取得した圧縮データを復号し、復号データをCNN部320に通知する。
The
CNN部320は、学習済みモデルを有し、画像データまたは復号データを入力することで、画像データまたは復号データに含まれるオブジェクトに対して認識処理を行い、認識結果を出力する。
The
量子化値設定部330は、画像圧縮装置130が圧縮処理を行う際に用いる圧縮レベル(最小の量子化値(初期値)から最大の量子化値まで)を、順次、出力部340に通知するとともに、格納部の一例である集計結果格納部380に格納する。
The quantization
出力部340は、入力部310が取得した画像データを、画像圧縮装置130に送信する。また、量子化値設定部330より通知された各量子化値を、順次、画像圧縮装置130に送信する。更に、量子化値決定部370により決定された量子化値(決定量子化値)を、画像圧縮装置130に送信する。
The
重要特徴マップ生成部350はマップ生成部の一例であり、学習済みモデルが画像データまたは復号データに対して認識処理を行った際のCNN部構造情報を取得し、取得したCNN部構造情報に基づき誤差逆伝播法を利用することで、重要特徴マップを生成する。
The important feature
重要特徴マップ生成部350では、例えば、BP(Back Propagation)法、GBP(Guided Back Propagation)法または選択的BP法を用いることで、重要特徴マップを生成する。
The important feature
なお、BP法は、認識結果が正解ラベルとなる画像データ(または復号データ)に対して認識処理を行うことで得た分類確率から各ラベルの誤差を計算し、入力層まで逆伝播して得られる勾配の大小を画像化することで、特徴部分を可視化する方法である。また、GBP法は、勾配情報の正値のみを特徴部分として画像化することで、特徴部分を可視化する方法である。 In the BP method, the error of each label is calculated from the classification probability obtained by performing recognition processing on the image data (or decoded data) whose recognition result is the correct label. This is a method of visualizing the characteristic portion by imaging the magnitude of the gradient that is applied. The GBP method is a method of visualizing a characteristic portion by imaging only positive values of gradient information as a characteristic portion.
更に、選択的BP法は、正解ラベルの誤差のみを最大にしたうえで、BP法またはGBP法を用いて逆伝播する方法である。選択的BP法の場合、可視化される特徴部分は、正解ラベルのスコアのみに影響を与える特徴部分となる。 Furthermore, the selective BP method is a method of maximizing only the error of the correct label and then backpropagating using the BP method or the GBP method. In the selective BP method, the visualized features are those that affect only the score of the correct label.
このように、重要特徴マップ生成部350では、BP法、GBP法または選択的BP法を用いることで、画像データまたは復号データが入力されてから認識結果が出力されるまでのCNN部320内の各経路の信号の流れと強度とを解析する。これにより、重要特徴マップ生成部350によれば、入力された画像データまたは復号データのどの部分が、認識結果にどの程度影響を及ぼしているかを可視化することができる。したがって、例えば、CNN部320として、BP法、GBP法または選択的BP法を適用しない(または適用できない)AIが用いられる場合、重要特徴マップ生成部350では、同様の情報を解析することにより、重要特徴マップを生成する。
In this way, the important feature
なお、誤差逆伝播法による重要特徴マップの生成方法は、例えば、
「Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradient-based localization." The IEEE International Conference on Computer Vision (ICCV), 2017, pp. 618-626」、
等の文献に開示されている。Note that the method of generating the important feature map by the error backpropagation method is, for example,
"Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradient-based localization." The IEEE International Conference on Computer Vision (ICCV), 2017, pp. 618-626",
et al.
集計部360は、重要特徴マップに基づいて、認識結果への影響度をブロック単位で集計し、ブロックごとの影響度の集計値を算出する。また、集計部360は、算出した各ブロックの集計値を、量子化値と対応付けて集計結果格納部380に格納する。
量子化値決定部370は決定部の一例であり、集計結果格納部380に格納された、各ブロックの集計値(量子化値の数に応じた数の集計値)に基づいて、各ブロックにおける最適な量子化値を決定する。また、量子化値決定部370は、決定した各ブロックにおける最適な量子化値を出力部340に通知する。
The quantization
このように、解析装置120では、CNN部320が認識処理を行う際に重要となる特徴部分の、圧縮処理に伴う劣化(認識精度への影響)の許容の度合い(量子化値)を、人間の認知する概念ではなく、CNN部320の認知する概念を基準として算出する。
In this way, in the
<集計結果の具体例>
次に、集計結果格納部380に格納された集計結果の具体例について説明する。図4は、集計結果の具体例を示す図である。このうち、4aは、画像データ410内のブロックの配置例を示している。4aに示すように、本実施形態では説明の簡略化のため、画像データ410内のブロックは全て同じ大きさであるとする。また、画像データの左上のブロックのブロック番号を"ブロック1"とし、右下のブロックのブロック番号を"ブロックm"とする。<Specific example of aggregated results>
Next, a specific example of the tally result stored in the tally
4bに示すように、集計結果420には、情報の項目として、"ブロック番号"、"量子化値"とが含まれる。
As shown in 4b, the
"ブロック番号"には、画像データ410内の各ブロックのブロック番号が格納される。"量子化値"には、画像圧縮装置130が圧縮処理を行わない場合を示す"圧縮なし"、及び、画像圧縮装置130が圧縮処理を行う際に用いる、最小の量子化値("Q1")から最大の量子化値("Qn")が格納される。“Block number” stores the block number of each block in the
また、"ブロック番号"と"量子化値"とにより特定される領域には、
・対応する量子化値を用いて画像データ410について圧縮処理を行い、
・取得した圧縮データを復号した復号データを入力することで、学習済みモデルが認識処理を行い、
・認識処理が行われた際に算出された重要特徴マップに基づいて、対応するブロックにおいて集計された、
集計値が格納される。Also, in the area specified by "block number" and "quantization value",
- performing a compression process on the
・By inputting the decoded data obtained by decoding the acquired compressed data, the trained model performs recognition processing,
・Based on the important feature map calculated when recognition processing was performed, aggregated in the corresponding block,
Aggregate value is stored.
<量子化値決定部による処理の具体例>
次に、量子化値決定部370による処理の具体例について説明する。図5は、量子化値決定部による処理の具体例を示す第1の図である。図5において、グラフ510_1~510_mは、横軸に量子化値、縦軸に集計値をとり、集計結果420に含まれる各ブロックの集計値をプロットすることで生成したグラフである。<Specific example of processing by the quantization value determination unit>
Next, a specific example of processing by the quantization
なお、グラフ510_1~510_mの生成に用いられる各ブロックの集計値は、例えば、
・全ブロック共通のオフセット値を用いて調整されていてもよい。
・絶対値をとって集計されていてもよい。
・注目されていないブロックの集計値に基づいて、他のブロックの集計値が加工されていてもよい。Note that the total value of each block used to generate the graphs 510_1 to 510_m is, for example,
- It may be adjusted using an offset value common to all blocks.
- The absolute value may be taken and aggregated.
- The aggregate values of other blocks may be processed based on the aggregate values of blocks that have not received attention.
グラフ510_1~510_mに示すように、最小の量子化値(Q1)から最大の量子化値(Qn)まで変化させた場合の集計値の変化は、ブロックごとに異なる。量子化値決定部370では、例えば、
・集計値の大きさが所定の閾値を超えた場合、あるいは、
・集計値の変化量が所定の閾値を超えた場合、あるいは、
・集計値の傾きが所定の閾値を超えた場合、あるいは、
・集計値の傾きの変化が所定の閾値を超えた場合、
のいずれかの条件を満たす場合に、各ブロックの最適な量子化値を決定する。As shown in graphs 510_1 to 510_m, changes in aggregated values when changing from the minimum quantization value (Q 1 ) to the maximum quantization value (Q n ) differ for each block. In the quantization
・When the size of the aggregated value exceeds a predetermined threshold, or
・If the amount of change in the aggregate value exceeds a predetermined threshold, or
・If the slope of the aggregate value exceeds a predetermined threshold, or
・If the change in the slope of the aggregate value exceeds a predetermined threshold,
Determine the optimum quantization value for each block if any of the conditions of are satisfied.
図5において符号530は、ブロック1~ブロックmの最適な量子化値として、B1Q~BmQが決定され、対応するブロックに設定された様子を示している。In FIG. 5,
なお、集計の際のブロックのサイズと圧縮処理に用いるブロックのサイズとは、一致していなくてもよい。その場合、量子化値決定部370では、例えば、以下のように量子化値を決定する。
・集計の際のブロックのサイズより、圧縮処理に用いるブロックのサイズの方が大きい場合
圧縮処理に用いるブロックに含まれる、集計の際の各ブロックの集計値に基づく量子化値の平均値(あるいは、最小値、最大値、その他の指標で加工した値)を、圧縮処理に用いる各ブロックの量子化値とする。
・集計の際のブロックのサイズより、圧縮処理に用いるブロックのサイズの方が小さい場合
集計の際のブロックに含まれる、圧縮処理に用いる各ブロックの量子化値として、集計の際のブロックの集計値に基づく量子化値を用いる。It should be noted that the size of blocks used for aggregation and the size of blocks used for compression processing do not have to match. In that case, the quantization
・When the size of the block used for compression processing is larger than the size of the block used for aggregation The average value of the quantization values (or , minimum value, maximum value, and values processed by other indexes) is used as the quantization value of each block used for compression processing.
・When the size of the block used for compression processing is smaller than the size of the block used for aggregation. Use value-based quantization values.
また、符号530に示す量子化値は、解析装置120にて追加評価してもよい。具体的には、まず、解析装置120にて、符号530に示す量子化値を用いて圧縮処理された圧縮データを復号し、復号データに対して認識処理を行う。続いて、解析装置120にて、符号530に示す量子化値のうち、最小値に対して量子化値を加算(例えば、1加算)し、符号530に示す量子化値を変更する。このとき、符号530に示す量子化値に、複数の最小値が存在する場合には、同様の加算を行う。
Also, the quantized value indicated by
続いて、解析装置120では、変更した符号530に示す量子化値を用いて圧縮処理された圧縮データを復号し、復号データに対して認識処理を行う。
Subsequently, the
解析装置120では、これらの処理を、符号530に示す量子化値のうちの最大値に等しくなるまで繰り返し、変更した符号530に示す量子化値と、対応する認識結果との組を複数取得する。
In the
続いて、解析装置120では、複数の組の中から、認識精度が許容下限を上回る組であって、量子化値の最小値が最大となる組を選択し、選択した組に含まれる、変更した符号530に示す量子化値を用いて、(変更前の)符号530に示す量子化値を置き換える。
Subsequently, the
このように、符号530に示す量子化値を追加評価することで、符号530に示す量子化値よりも更に圧縮率の高い量子化値を決定することができる。
By additionally evaluating the quantized value indicated by
<画像圧縮装置の機能構成>
次に、画像圧縮装置130の機能構成について説明する。図6は、画像圧縮装置の機能構成の一例を示す第1の図である。上述したように、画像圧縮装置130には、画像圧縮プログラムがインストールされており、当該プログラムが実行されることで、画像圧縮装置130は、符号化部620として機能する。<Functional Configuration of Image Compression Apparatus>
Next, the functional configuration of the
符号化部620は圧縮部の一例である。符号化部620は、差分部621、直交変換部622、量子化部623、エントロピ符号化部624、逆量子化部625、逆直交変換部626を有する。また、符号化部620は、加算部627、バッファ部628、ループ内フィルタ部629、フレームバッファ部630、画面内予測部631、画面間予測部632を有する。
The
差分部621は、画像データ(例えば、画像データ410)と予測画像データとの差分を算出し、予測残差信号を出力する。
A
直交変換部622は、差分部621により出力された予測残差信号に対して、直交変換処理を実行する。
The
量子化部623は、直交変換処理された予測残差信号を量子化し、量子化信号を生成する。量子化部623では、符号530に示す量子化値(解析装置120より送信された量子化値または決定された最適な量子化値)を用いて量子化信号を生成する。
A quantization unit 623 quantizes the orthogonally transformed prediction residual signal to generate a quantized signal. The quantization section 623 generates a quantized signal using the quantized value indicated by reference numeral 530 (the quantized value transmitted from the
エントロピ符号化部624は、量子化信号に対してエントロピ符号化処理を行うことで、圧縮データを生成する。
The
逆量子化部625は、量子化信号を逆量子化する。逆直交変換部626は、逆量子化された量子化信号に対して、逆直交変換処理を実行する。
An
加算部627は、逆直交変換部626より出力された信号と、予測画像データとを加算することで、参照画像データを生成する。バッファ部628は、加算部627により生成された参照画像データを格納する。
The
ループ内フィルタ部629は、バッファ部628に格納された参照画像データに対してフィルタ処理を行う。ループ内フィルタ部629には、
・デブロッキングフィルタ(Deblocking filter:DB)、
・サンプルアダプティブオフセットフィルタ(Sample Adaptive Offset filter:SAO)、
・適応ループフィルタ(Adaptive loop filter:ALF)、
が含まれる。The in-
- Deblocking filter (DB),
・Sample Adaptive Offset filter (SAO),
- Adaptive loop filter (ALF),
is included.
フレームバッファ部630は、ループ内フィルタ部629によりフィルタ処理が行われた参照画像データをフレーム単位で格納する。
The
画面内予測部631は、参照画像データに基づいて画面内予測を行い、予測画像データを生成する。画面間予測部632は、入力された画像データ(例えば、画像データ410)と参照画像データとを用いてフレーム間で動き補償を行い、予測画像データを生成する。
The
なお、画面内予測部631または画面間予測部632により生成された予測画像データは、差分部621及び加算部627に出力される。
Note that the predicted image data generated by the
なお、上記説明では、符号化部620が、MPEG-2、MPEG-4、H.264、HEVCなどの既存の動画符号化方式を用いて圧縮処理を行うものとした。しかしながら、符号化部620による圧縮処理は、これらの動画符号化方式に限定されず、量子化等のパラメータにより圧縮率を制御する任意の符号化方式を用いて行われてもよい。
Note that in the above description, the
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図7は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第1のフローチャートである。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS701において、量子化値設定部330は、圧縮レベルを初期化する(最小の量子化値(Q1)を設定する)とともに、圧縮レベルの上限を設定する(最大の量子化値(Qn)を設定する)。In step S701, the quantization
ステップS702において、入力部310は画像データまたは圧縮データをフレーム単位で取得する。また、入力部310は、圧縮データを取得した場合にあっては、取得した圧縮データを復号し、復号データを生成する。
In step S702, the
ステップS703において、CNN部320は、画像データ(または復号データ)に対して認識処理を行い、認識結果を出力する。
In step S703, the
ステップS704において、重要特徴マップ生成部350は、CNN部構造情報に基づいて、各領域の認識結果への影響度を示す重要特徴マップを生成する。
In step S704, the important
ステップS705において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。また、集計部360は、集計結果を、現在の圧縮レベル(量子化値)と対応付けて、集計結果格納部380に格納する。
In step S705, the
ステップS706において、出力部340は画像データと、現在の圧縮レベル(量子化値)とを画像圧縮装置130に送信する。また、画像圧縮装置130は、送信された画像データを、現在の圧縮レベル(量子化値)で圧縮処理を行い、圧縮データを生成する。
In step S<b>706 , the
ステップS707において、量子化値設定部330は、圧縮レベルを上げる(ここでは、量子化値(Q2)を設定する)。In step S707, the quantization
ステップS708において、量子化値決定部370は、現在の圧縮レベルが上限を超えたか否か(現在の量子化値が、最大の量子化値(Qn)を超えたか否か)を判定する。ステップS708において、現在の圧縮レベルが上限を超えていないと判定した場合には(ステップS708においてNoの場合には)、ステップS702に戻る。In step S708, the quantization
この場合、ステップS702では、ステップS706において生成された圧縮データを取得し、取得した圧縮データを復号した復号データに対して、ステップS703からステップS707の処理を行う。 In this case, in step S702, the compressed data generated in step S706 is acquired, and the process of steps S703 to S707 is performed on the decoded data obtained by decoding the acquired compressed data.
一方、ステップS708において、現在の圧縮レベルが上限を超えたと判定した場合には、ステップS708においてYesの場合には)、ステップS709に進む。 On the other hand, if it is determined in step S708 that the current compression level has exceeded the upper limit (if Yes in step S708), the process proceeds to step S709.
ステップS709において、量子化値決定部370は、集計結果格納部380に格納された集計結果に基づいて、ブロック単位で最適な圧縮レベル(最適な量子化値)を決定する。また、出力部340は、決定された最適な量子化値を画像圧縮装置130に送信する。
In step S<b>709 , the quantization
ステップS710において、画像圧縮装置130は、決定された最適な量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。
In step S<b>710 , the
以上の説明から明らかなように、第1の実施形態に係る解析装置は、画像データに対して異なる量子化値を用いて圧縮処理を行った場合の各圧縮データを取得する。また、第1の実施形態に係る解析装置は、各圧縮データを復号した復号データを学習済みモデルに入力し、認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第1の実施形態に係る解析装置は、重要特徴マップに基づいて影響度をブロック単位で集計し、異なる圧縮レベルに対応する、各ブロックの集計値に基づいて、画像データの各ブロックの圧縮レベルを決定する。 As is clear from the above description, the analysis apparatus according to the first embodiment acquires each piece of compressed data when compression processing is performed on image data using different quantization values. Further, the analysis device according to the first embodiment inputs decoded data obtained by decoding each compressed data to a trained model, and based on the CNN unit structure information when recognition processing is performed, the degree of influence on the recognition result Generate a key feature map showing Further, the analysis device according to the first embodiment aggregates the degree of influence for each block based on the important feature map, and calculates the degree of influence of each block of the image data based on the aggregated value of each block corresponding to different compression levels. Determine compression level.
これにより、第1の実施形態によれば、認識結果への影響度に基づいて決定した最適な量子化値を用いて圧縮処理を行うことができる。つまり、第1の実施形態によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。 Thus, according to the first embodiment, compression processing can be performed using the optimum quantization value determined based on the degree of influence on the recognition result. That is, according to the first embodiment, compression processing suitable for image recognition processing by AI can be realized.
[第2の実施形態]
上記第1の実施形態では、認識結果への影響度に基づいて最適な量子化値を決定するにあたり、画像圧縮装置130に設定可能な最小の量子化値から最大の量子化値まで全てを用いるものとして説明した。[Second embodiment]
In the above-described first embodiment, all values from the minimum quantization value to the maximum quantization value that can be set in the
これに対して、第2の実施形態では、所定の量子化値を用いて圧縮処理を行うことで、最適な量子化値を決定する場合について説明する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。 On the other hand, in the second embodiment, a case will be described in which an optimal quantization value is determined by performing compression processing using a predetermined quantization value. The second embodiment will be described below, focusing on differences from the first embodiment.
<解析装置の機能構成>
はじめに、第2の実施形態に係る解析装置120の機能構成について説明する。図8は、解析装置の機能構成の一例を示す第2の図である。図3に示した機能構成との相違点は、量子化値設定部330に代えて最大量子化値設定部810が含まれる点、及び、量子化値決定部820の機能が、量子化値決定部370の機能とは異なる点である。また、解析装置120が、集計結果格納部380に代えて、グループ情報格納部830を有する点である。<Functional configuration of analysis device>
First, the functional configuration of an
最大量子化値設定部810は、最大の量子化値(Qn)を、出力部340に通知する。量子化値決定部820は、格納部の一例であるグループ情報格納部830に格納されたグループ情報から、集計部360より通知された各ブロックの集計値が属するグループを判定する。また、量子化値決定部820は、判定したグループに予め対応付けられた最適な量子化値を、出力部340に通知する。Maximum quantization
<量子化値決定部による処理の具体例>
次に、量子化値決定部820による処理の具体例について説明する。図9は、量子化値決定部による処理の具体例を示す第2の図である。<Specific example of processing by the quantization value determination unit>
Next, a specific example of processing by the quantization
図9に示すように、グループ情報910には、最小の量子化値から最大の量子化値まで変化させた場合の集計値の典型的な複数のパターン(図9の例では、グラフ911~913に示す3つのパターン)を含むグループが規定されている。また、グループ情報910には、グループごとに、最適な量子化値が規定されている。図13の例は、
・グループ1に、最適な量子化値G1Qが、
・グループ2に、最適な量子化値G2Qが、
・グループ3に、最適な量子化値G3Qが、
それぞれ対応付けられていることを示している。As shown in FIG. 9,
- For
- For
- For
It indicates that they are associated with each other.
量子化値決定部820では、集計部360から、最大の量子化値(Qn)を用いて画像データに対して圧縮処理が行われた場合の圧縮データを復号した復号データについて、認識処理が行われることで算出された、各ブロックの集計値を取得する。また、量子化値決定部820では、各ブロックの集計値がいずれのグループの属するかを判定する。In the quantization
更に、量子化値決定部820では、判定したグループに対応付けられた量子化値を、各ブロックの最適な量子化値として、出力部340に通知する。
Furthermore, the quantization
なお、図9の例では、グループ情報910を1種類のみ示したが、グループ情報は複数種類あってもよい。例えば、認識処理の対象となるオブジェクトの種類ごとに異なるグループ情報を用意してもよい。あるいは、画像データの複雑度ごとに異なるグループ情報を用意してもよい。
Although only one type of
また、図9の例では、グループ情報910がグラフ911~913を含むものとして説明したが、近似関数や深層学習等のモデルを含んでいてもよい。
In the example of FIG. 9, the
また、図9の例では、グループを判定するにあたり、最大の量子化値(Qn)を用いたが、最大の量子化値(Qn)を含む複数の量子化値、あるいは、最大の量子化値(Qn)を含まない複数の量子化値を用いてもよい。In addition, in the example of FIG. 9, the maximum quantization value (Q n ) is used to determine the group. Multiple quantization values may be used that do not include the quantization value (Q n ).
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図10は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第2のフローチャートである。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS1001において、最大量子化値設定部810は、最大圧縮レベル(最大の量子化値(Qn))を設定する。In step S1001, maximum quantization
ステップS1002において、入力部310は画像データをフレーム単位で取得する。
In step S1002, the
ステップS1003において、出力部340は、画像データと最大圧縮レベル(最大の量子化値(Qn))とを画像圧縮装置130に送信する。また、画像圧縮装置130は、送信された画像データに対して、最大圧縮レベル(最大の量子化値(Qn))で圧縮処理を行い、圧縮データを生成する。In step S<b>1003 , the
ステップS1004において、入力部310は、画像圧縮装置130により生成された圧縮データを取得し、復号する。また、CNN部320は、復号データに対して認識処理を行い、認識結果を出力する。
In step S<b>1004 , the
ステップS1005において、重要特徴マップ生成部350は、CNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。
In step S1005, the important
ステップS1006において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。また、集計部360は、集計結果を、量子化値決定部820に通知する。
In step S1006, the
ステップS1007において、量子化値決定部820は、グループ情報格納部830に格納されたグループ情報を参照し、集計部360より通知された各ブロックの集計値が、いずれのグループに属するかを判定する。これにより、量子化値決定部820は、各ブロックをグループ分けする。
In step S1007, the quantization
ステップS1008において、量子化値決定部1220は、ブロックごとに判定したグループそれぞれに対応付けられた最適な量子化値を、各ブロックの最適な量子化値として決定する。また、出力部340は、決定された最適な量子化値を画像圧縮装置130に送信する。
In step S1008, the quantization value determination unit 1220 determines the optimum quantization value associated with each group determined for each block as the optimum quantization value for each block. Also, the
ステップS1009において、画像圧縮装置130は、決定された最適な量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。
In step S<b>1009 , the
以上の説明から明らかなように、第2の実施形態に係る解析装置は、画像データに対して最大の量子化値を用いて圧縮処理を行った場合の圧縮データを取得する。また、第2の実施形態に係る解析装置は、圧縮データを復号した復号データを学習済みモデルに入力して認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第2の実施形態に係る解析装置は、重要特徴マップに基づいて影響度をブロック単位で集計し、集計値が属するグループを判定することで、グループに対応付けられた量子化値を、最適な量子化値として決定する。 As is clear from the above description, the analysis apparatus according to the second embodiment acquires compressed data when compression processing is performed on image data using the maximum quantization value. Further, the analysis device according to the second embodiment determines the degree of influence on the recognition result based on the CNN structure information when the decoded data obtained by decoding the compressed data is input to the trained model and the recognition process is performed. Generate a key feature map shown. Further, the analysis device according to the second embodiment aggregates the degree of influence for each block based on the important feature map, and determines the group to which the aggregated value belongs, so that the quantized value associated with the group is Determine the optimum quantization value.
これにより、第2の実施形態によれば、認識結果への影響度に基づいて決定した最適な量子化値を用いて圧縮処理を行うことができる。つまり、第2の実施形態によれば、上記第1の実施形態と同様の効果を奏する。加えて、第2の実施形態によれば、上記第1の実施形態と比較して、より少ない圧縮処理回数で、最適な量子化値を決定することができる。 Thus, according to the second embodiment, compression processing can be performed using the optimum quantization value determined based on the degree of influence on the recognition result. That is, according to the second embodiment, the same effects as those of the first embodiment are obtained. In addition, according to the second embodiment, it is possible to determine the optimum quantization value with a smaller number of compression processes than in the first embodiment.
[第3の実施形態]
上記第2の実施形態では、集計値が属するグループを判定するにあたり、最大の量子化値を用いて圧縮処理を行った場合の圧縮データを復号した復号データに対して認識処理を行うものとして説明した。これに対して、第3の実施形態では、最大の量子化値を用いて圧縮処理を行うのと、同等の効果を有する画像処理を行うことで、疑似的な圧縮データ(疑似圧縮データ)を生成し、当該疑似圧縮データに対して認識処理を行う。これにより、第3の実施形態によれば、第2の実施形態と比較して、更に少ない圧縮処理回数で、最適な量子化値を決定することができる。以下、第3の実施形態について、上記第2の実施形態との相違点を中心に説明する。[Third Embodiment]
In the above-described second embodiment, in determining the group to which the aggregated value belongs, it is assumed that the recognition process is performed on the decoded data obtained by decoding the compressed data when the compression process is performed using the maximum quantized value. bottom. In contrast, in the third embodiment, pseudo-compressed data (pseudo-compressed data) is generated by performing image processing having the same effect as compression processing using the maximum quantization value. Then, recognition processing is performed on the pseudo-compressed data. As a result, according to the third embodiment, the optimal quantization value can be determined with a smaller number of compression processes than in the second embodiment. The third embodiment will be described below, focusing on differences from the second embodiment.
<解析装置の機能構成>
はじめに、第3の実施形態に係る解析装置120の機能構成について説明する。図11は、解析装置の機能構成の一例を示す第3の図である。図8に示した機能構成との相違点は、最大量子化値設定部810が含まれていない点、及び、画像処理部1110が含まれている点である。<Functional configuration of analysis device>
First, the functional configuration of an
画像処理部1110は、入力部310により取得された画像データに対して、例えば、ローパスフィルタを用いてフィルタリング処理を行う。これにより、画像処理部1110では、画像データに対して最大の量子化値を用いて圧縮処理を行うのと同様の効果を有する疑似圧縮データを生成する。
The
また、画像処理部1110は、生成した疑似圧縮データをCNN部320に入力する。これにより、CNN部320では、疑似圧縮データに対して認識処理を行い、重要特徴マップ生成部350では、CNN部構造情報に基づいて重要特徴マップを生成する。更に、集計部360では、重要特徴マップをブロック単位で集計し、量子化値決定部820では、グループ情報格納部830に格納されたグループ情報から、各ブロックの集計値が属するグループを判定することで、最適な量子化値を出力部340に通知する。
Also, the
<量子化値決定部による処理の具体例>
次に、量子化値決定部820による処理の具体例について説明する。図12は、量子化値決定部による処理の具体例を示す第3の図である。図9との相違点は、量子化値決定部820が、ローパスフィルタを用いてフィルタリング処理された疑似圧縮データに対して、認識処理が行われた場合の、各ブロックの集計値を取得する点である。<Specific example of processing by the quantization value determination unit>
Next, a specific example of processing by the quantization
なお、量子化値決定部820は、取得した各ブロックの集計値に基づいて、各ブロックがいずれのグループの属するかを判定し、判定したグループに対応付けられた最適な量子化値を、各ブロックの最適な量子化値として、出力部340に通知する。
Note that quantization
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図13は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第3のフローチャートである。なお、図10に示した第2のフローチャートとの相違点は、ステップS1001の処理を含まない点と、ステップS1003及びS1004に代えてステップS1301及びS1302の処理を含む点である。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS1301において、画像処理部1110は、ローパスフィルタを用いたフィルタリング処理により、疑似画像データを生成し、CNN部320に入力する。
In step S<b>1301 , the
ステップS1302において、入力部310は、疑似画像データを取得し、CNN部320は、取得された疑似画像データに対して認識処理を行い、認識結果を出力する。
In step S1302, the
以上の説明から明らかなように、第3の実施形態に係る解析装置は、画像データに対してフィルタリング処理を行い、疑似圧縮データを取得する。また、第3の実施形態に係る解析装置は、疑似圧縮データを学習済みモデルに入力して認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第3の実施形態に係る解析装置は、重要特徴マップに基づいて影響度をブロック単位で集計し、集計値が属するグループを判定することで、グループに対応付けられた量子化値を、最適な量子化値として決定する。 As is clear from the above description, the analysis apparatus according to the third embodiment performs filtering processing on image data to acquire pseudo-compressed data. Further, the analysis apparatus according to the third embodiment provides an important feature map indicating the degree of influence on the recognition result based on the CNN part structure information when the pseudo-compressed data is input to the trained model and the recognition process is performed. to generate Further, the analysis apparatus according to the third embodiment aggregates the degree of impact for each block based on the important feature map, and determines the group to which the aggregated value belongs, so that the quantized value associated with the group is Determine the optimum quantization value.
これにより、第3の実施形態によれば、認識結果への影響度に基づいて決定した最適な量子化値を用いて圧縮処理を行うことができる。つまり、第3の実施形態によれば、上記第1の実施形態と同様の効果を奏する。加えて、第3の実施形態によれば、上記第1及び第2の実施形態と比較して、より少ない圧縮処理回数で、最適な量子化値を決定することができる。 Thus, according to the third embodiment, compression processing can be performed using the optimum quantization value determined based on the degree of influence on the recognition result. That is, according to the third embodiment, the same effects as those of the first embodiment are obtained. In addition, according to the third embodiment, the optimal quantization value can be determined with a smaller number of compression processes than the first and second embodiments.
[第4の実施形態]
上記第1の実施形態では、フレーム単位の画像データが1枚入力されるごとに、異なる量子化値を用いて圧縮処理を行い、最適な量子化値を決定するものとして説明した。これに対して、第4の実施形態では、フレーム単位の画像データが複数枚入力される間に、異なる量子化値を用いて圧縮処理を行い、最適な量子化値を決定する。以下、第4の実施形態について、上記第1の実施形態との相違点を中心に説明する。[Fourth embodiment]
In the first embodiment, the compression process is performed using a different quantization value each time image data in units of frames is input, and the optimum quantization value is determined. In contrast, in the fourth embodiment, compression processing is performed using different quantization values while a plurality of frames of image data are input, and the optimum quantization value is determined. The fourth embodiment will be described below, focusing on differences from the first embodiment.
<解析装置の機能構成>
はじめに、第4の実施形態に係る解析装置120の機能構成について説明する。図14は、解析装置の機能構成の一例を示す第4の図である。図3に示した機能構成との相違点は、位置判定部1410が含まれる点、量子化値設定部1420の機能が、量子化値設定部330の機能とは異なる点、量子化値決定部370及び集計結果格納部380が含まれていない点である。<Functional configuration of analysis device>
First, the functional configuration of an
位置判定部1410は、CNN部320より出力された認識結果から、画像データまたは圧縮データを復号した復号データに含まれるオブジェクトの位置情報を抽出する。また、位置判定部1410は、抽出した位置情報を量子化値設定部1420に通知する。
量子化値設定部1420は、画像圧縮装置130が圧縮処理を行う際に用いる圧縮レベル(量子化値)を出力部340に通知する。量子化値設定部1420では、最小の量子化値から開始して、所定のきざみ幅で加算した量子化値を、順次、出力部340に通知する。
The quantization
また、量子化値設定部1420は、量子化値を通知するごとに、集計部360から通知される各ブロックの集計値を監視し、各ブロックの集計値が所定の閾値を超えた場合には、量子化値を下げる。このように、量子化値設定部1420では、集計値が所定の閾値を超えないように、通知する量子化値を制御することができる。
Also, the quantization
なお、量子化値設定部1420では、位置判定部1410より通知されたオブジェクトの位置情報に基づいて、集計値を監視するブロックを特定し、特定したブロックの量子化値を、特定したブロックの集計値に基づいて制御する。
Note that the quantization
<量子化値設定部による処理の具体例>
次に、量子化値設定部1420による処理の具体例について説明する。図15は、量子化値設定部による処理の具体例を示す図である。図15において、圧縮データを復号した復号データ1511~1514は、それぞれ、時間=t1~t4において入力部310が取得した圧縮データを復号した復号データを示している。<Specific example of processing by the quantization value setting unit>
Next, a specific example of processing by the quantization
圧縮データを復号した復号データ1511~1514には、それぞれ、オブジェクト1521が含まれている。図15の例は、オブジェクト1521が時間の経過とともに、圧縮データを復号した復号データ1511~1514内を、左下から右上に向かって移動する様子を示している。
量子化値設定部1420では、位置判定部1410から通知される位置情報に基づいて、圧縮データを復号した復号データ1511~1514内におけるオブジェクト1521の位置を特定する。
Quantization
また、量子化値設定部1420では、特定した位置に含まれる各ブロックの集計値を集計部360から取得する。図15において、符号1531~1534は、量子化値設定部1420が集計部360から通知された、特定した位置に含まれるブロックの集計値を示している。
Also, the quantization
図15の例では、量子化値設定部1420が、所定のきざみ幅で量子化値Qx+1、Qx+2、Qx+3を通知した様子を示している(ただし、Qx+1<Qx+2<Qx+3)。The example of FIG. 15 shows how the quantization
ここで、量子化値Qx+3を用いて圧縮処理が行われた場合の圧縮データを復号した復号データ1513に対して、認識処理が行われることで算出された、オブジェクト1521に含まれるブロックの集計値(符号1533)が、所定の閾値1530を超えたとする。Here, the total number of blocks included in the
この場合、量子化値設定部1420では、次に通知する量子化値を、量子化値Qx+3よりも小さい量子化値にする(図15の例では、量子化値Qx+2を通知した様子を示している)。In this case, the quantization
このように、オブジェクトに含まれる各ブロックの集計値が、所定の閾値を超えないように、通知する量子化値を制御することで、量子化値設定部1420では、最適な量子化値を継続して通知することができる。
In this way, by controlling the quantization value to be notified so that the total value of each block included in the object does not exceed a predetermined threshold value, the quantization
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図16は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第4のフローチャートである。なお、図7に示した第1のフローチャートとの相違点は、ステップS1601~ステップS1606である。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS1601において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。
In step S1601, the
ステップS1602において、量子化値設定部1420は、位置判定部1410より通知された位置情報に基づいて、オブジェクトの位置を特定し、特定したオブジェクトの位置に含まれる各ブロックの集計値が、所定の閾値を超えたか否かを判定する。
In step S1602, the quantization
ステップS1602において、所定の閾値を超えていないと判定した場合には(ステップS1602においてNoの場合には)、ステップS1603に進む。 If it is determined in step S1602 that the predetermined threshold is not exceeded (No in step S1602), the process proceeds to step S1603.
ステップS1603において、量子化値設定部1420は、所定のきざみ幅で量子化値を加算し、加算後の量子化値を出力部1430に通知する。
In step S<b>1603 , quantization
一方、ステップS1602において、所定の閾値を超えたと判定した場合には(ステップS1602においてYesの場合には)、ステップS1604に進む。 On the other hand, if it is determined in step S1602 that the predetermined threshold has been exceeded (Yes in step S1602), the process proceeds to step S1604.
ステップS1604において、量子化値設定部1420は、所定のきざみ幅で量子化値を減算し、減算後の量子化値を出力部1430に通知する。
In step S1604, quantization
ステップS1605において、画像圧縮装置130は、出力部1430より送信される量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。
In step S<b>1605 , the
ステップS1606において、入力部310は、画像圧縮処理を終了するか否かを判定し、終了しないと判定した場合には(ステップS1606においてNoの場合には)、ステップS702に戻る。一方、ステップS1606において、終了すると判定した場合には(ステップS1606においてYesの場合には)、画像圧縮処理を終了する。
In step S1606, the
以上の説明から明らかなように、第4の実施形態に係る解析装置は、複数の画像データそれぞれを異なる量子化値を用いて圧縮処理を行った場合の各圧縮データを取得する。また、第4の実施形態に係る解析装置は、各圧縮データを復号した復号データを学習済みモデルに入力し、認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第4の実施形態に係る解析装置は、重要特徴マップをブロック単位で集計し、オブジェクトの位置に含まれるブロックの集計値を取得する。更に、第4の実施形態に係る解析装置は、取得した集計値が所定の閾値を超えないように、量子化値を制御する。 As is clear from the above description, the analysis apparatus according to the fourth embodiment acquires each piece of compressed data when performing compression processing using different quantization values for each of a plurality of image data. Further, the analysis device according to the fourth embodiment inputs the decoded data obtained by decoding each compressed data to the trained model, and based on the CNN unit structure information when performing the recognition process, the degree of influence on the recognition result Generate a key feature map showing Also, the analysis apparatus according to the fourth embodiment aggregates the important feature map for each block, and obtains the aggregate value of the blocks included in the position of the object. Furthermore, the analysis device according to the fourth embodiment controls the quantization value so that the acquired total value does not exceed a predetermined threshold.
このように、オブジェクトに含まれる各ブロックの集計値が、所定の閾値を超えないように、量子化値を制御することで、第4の実施形態に係る解析装置によれば、最適な量子化値を継続して出力することができる。 In this way, by controlling the quantization value so that the total value of each block included in the object does not exceed a predetermined threshold value, the analysis apparatus according to the fourth embodiment realizes optimal quantization Values can be output continuously.
[第5の実施形態]
上記第1乃至第3の実施形態では、ブロックごとに集計値を算出し、ブロックごとに最適な量子化値を決定するものとして説明した。これに対して、第5の実施形態では、基準となるブロックの集計値と比較し、比較結果に基づいて最適な量子化値を決定する。以下、第5の実施形態について、上記第1の実施形態との相違点を中心に説明する。[Fifth embodiment]
In the first to third embodiments, the total value is calculated for each block, and the optimum quantization value is determined for each block. On the other hand, in the fifth embodiment, the total value of the reference block is compared, and the optimum quantization value is determined based on the comparison result. The fifth embodiment will be described below, focusing on differences from the first embodiment.
<量子化値決定部による処理の具体例>
図17は、量子化値決定部による処理の具体例を示す第4の図である。図17において、グラフ510_1~510_mは、既に、図5を用いて説明したグラフ510_1~510_mと同じである。<Specific example of processing by the quantization value determination unit>
FIG. 17 is a fourth diagram showing a specific example of processing by the quantization value determination unit. In FIG. 17, graphs 510_1 to 510_m are the same as the graphs 510_1 to 510_m already described using FIG.
ここで、図17の例は、ブロック番号="ブロック1"を基準となるブロックとしており、当該ブロックにおける集計値は"v1"、当該ブロックにおける最適な量子化値は"B1Q"であるとする。Here, in the example of FIG. 17, the block number=“
この場合、量子化値決定部では、例えば、
・ブロック2について、最適な量子化値=B1Q×v2/v1、
・ブロック3について、最適な量子化値=B1Q×v3/v1、
・・・
・ブロックmについて、最適な量子化値=B1Q×vm/v1、
をそれぞれ算出する。これにより、量子化値決定部では、最適な量子化値1700を決定する。In this case, the quantization value determination unit, for example,
- For
- For
・・・
- For block m, optimal quantization value = B1Q * vm / v1 ,
are calculated respectively. As a result, the quantization value determination unit determines the
<圧縮処理システムによる画像圧縮処理の流れ>
図18は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第5のフローチャートである。図7に示した第1のフローチャートとの相違点は、ステップS1801である。<Flow of image compression processing by compression processing system>
FIG. 18 is a fifth flowchart showing an example of the flow of image compression processing by the compression processing system. The difference from the first flowchart shown in FIG. 7 is step S1801.
ステップS1801において、量子化値決定部は、基準となるブロックの集計値と各ブロックの集計値とを比較し、基準となるブロックの最適な量子化値と比較結果とに基づいて、各ブロックの最適な量子化値を決定する。 In step S1801, the quantization value determination unit compares the total value of the reference block with the total value of each block, and determines the optimal quantization value of each block based on the comparison result and the optimum quantization value of the reference block. Determine the optimal quantization value.
このように、基準となるブロックの集計値と比較し、比較結果に基づいて最適な量子化値を決定することで、第5の実施形態によれば、画像データによらず、所定の圧縮レベル以上の圧縮レベルで、圧縮処理を行うことができる。また、第5の実施形態によれば、ブロック間で量子化値の整合をとることができる。 In this way, by comparing with the aggregated value of the reference block and determining the optimum quantization value based on the comparison result, according to the fifth embodiment, it is possible to achieve a predetermined compression level regardless of the image data. Compression processing can be performed at the above compression levels. Further, according to the fifth embodiment, quantization values can be matched between blocks.
[第6の実施形態]
上記第1乃至第3の実施形態では、ブロックごとに集計値を算出し、算出した集計値に基づいて、量子化値を決定するものとして説明した。これに対して、第6の実施形態では、画像圧縮装置130に予め設定されている量子化値(人間の視覚特性に基づいて設定された量子化値)を、算出した集計値を用いて補正することで、最適な量子化値を決定する。以下、第6の実施形態について、上記第1の実施形態との相違点を中心に説明する。[Sixth embodiment]
In the first to third embodiments described above, the total value is calculated for each block, and the quantization value is determined based on the calculated total value. In contrast, in the sixth embodiment, the quantization value preset in the image compression device 130 (the quantization value set based on the human visual characteristics) is corrected using the calculated total value. to determine the optimum quantization value. The sixth embodiment will be described below, focusing on differences from the first embodiment.
<量子化値決定部による処理の具体例>
図19は、量子化値決定部による処理の具体例を示す第5の図である。図19において、量子化値1900は、画像圧縮装置130に予め設定されている量子化値であって、人間の視覚特性に基づいて設定された量子化値である。<Specific example of processing by the quantization value determination unit>
FIG. 19 is a fifth diagram showing a specific example of processing by the quantization value determination unit. In FIG. 19, a
また、図19において、集計結果1910は、所定の圧縮データを復号した復号データが認識処理された際の集計結果である。ここでいう所定の圧縮データとは、復号した復号データに対するCNN部320による認識処理において、誤った認識結果が出力された際の量子化値が設定される直前に設定された量子化値を用いて圧縮処理が行われた場合の圧縮データを指す。
Also, in FIG. 19, the
また、図19において、最適な量子化値1920は、量子化値1900と集計結果1910とに基づいて算出された量子化値である。図19に示すように、最適な量子化値1920は、下式(式1)に基づいて算出される。
(式1)Qa(x,y)=Qpb(x,y)+P(x,y)×重み係数
なお、式1において、Qa(x,y)は、座標(x,y)により特定されるブロックの最適な量子化値を指す。また、式1において、Qpb(x,y)は、座標(x,y)により特定されるブロックの量子化値であって、画像圧縮装置130に予め設定されている量子化値を指す。また、式1において、P(x,y)は、座標(x,y)により特定されるブロックの、所定の圧縮データを復号した復号データに対して認識処理が行われた際の集計結果を指す。Also, in FIG. 19, the
(Equation 1) Qa (x, y) = Qpb (x, y) + P (x, y) x weighting coefficient In
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図20は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第6のフローチャートである。図7に示した第1のフローチャートとの相違点は、ステップS2001、ステップS2002~2005である。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS2001において、量子化値決定部は、CNN部より正しい認識結果が出力されたか否かを判定する。ステップS2001において、正しい認識結果が出力されたと判定した場合には(ステップS2001においてYesの場合には)、ステップS704に進む。 In step S2001, the quantization value determination unit determines whether or not the correct recognition result is output from the CNN unit. If it is determined in step S2001 that a correct recognition result has been output (if Yes in step S2001), the process proceeds to step S704.
ステップS704において、重要特徴マップ生成部350は、CNN部構造情報に基づいて、各領域の認識結果への影響度を示す重要特徴マップを生成する。
In step S704, the important
ステップS705において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。また、集計部360は、集計結果を、現在の圧縮レベル(量子化値)と対応付けて、集計結果格納部380に格納する。
In step S705, the
ステップS2002において、量子化値設定部330は、圧縮レベル(量子化値)を上げる。
In step S2002, quantization
ステップS2003において、出力部340は画像データと、現在の圧縮レベル(量子化値)とを画像圧縮装置130に送信する。また、画像圧縮装置130は、送信された画像データに対して、現在の圧縮レベル(量子化値)を用いて圧縮処理を行い、圧縮データを生成する。
In step S<b>2003 , the
一方、ステップS2001において、誤った認識結果が出力されたと判定した場合には(ステップS2001においてNoの場合には)、ステップS2004に進む。 On the other hand, if it is determined in step S2001 that an erroneous recognition result has been output (No in step S2001), the process proceeds to step S2004.
ステップS2004において、量子化値決定部は、最後に認識可能となった復号データの集計値に重み係数をかけ、画像圧縮装置130に予め設定されている量子化値に加算する。
In step S<b>2004 , the quantization value determination unit multiplies the total value of the finally recognizable decoded data by a weighting factor, and adds it to the quantization value preset in the
ステップS2005において、画像圧縮装置130は、ステップS2004において算出された量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。
In step S<b>2005 , the
このように、画像圧縮装置に予め設定されている量子化値(人間の視覚特性に基づいて設定された量子化値)を、算出した集計値を用いて補正することで、第6の実施形態によれば、最適な量子化値を決定することができる。 In this way, by correcting the quantization value preset in the image compression device (the quantization value set based on the human visual characteristics) using the calculated total value, the sixth embodiment can be achieved. can determine the optimal quantization value.
[第7の実施形態]
上記第1乃至第6の実施形態では、認識結果への影響度をブロック単位で集計し、集計結果に基づいて最適な量子化値を決定する場合について説明した。これに対して、第8の実施形態では、集計結果に基づいて、画像データを有効領域と無効領域とに分け、無効領域に含まれるブロックについては無効化したうえで、有効領域に対して圧縮処理を行う。[Seventh embodiment]
In the first to sixth embodiments, cases have been described in which the degree of influence on the recognition result is aggregated for each block and the optimal quantization value is determined based on the aggregated result. On the other hand, in the eighth embodiment, image data is divided into a valid area and an invalid area based on the totalization result, blocks included in the invalid area are invalidated, and then the valid area is compressed. process.
なお、無効領域に含まれるブロックの無効化とは、例えば、無効領域に含まれるブロックの各画素の画素値を"0"にすることを指し、無効領域に含まれるブロックを無効化した画像データを、以下では"無効化画像データ"と称す。 Note that invalidating a block included in the invalid area means, for example, setting the pixel value of each pixel in the block included in the invalid area to "0". is hereinafter referred to as "invalidation image data".
このように、無効化画像データに対して(無効化画像データに含まれる有効領域に対して)圧縮処理を行うことで、画像データ全体に対して圧縮処理を行う場合と比較して、圧縮データのデータサイズをより削減することができる。 By performing compression processing on invalidated image data (valid regions included in invalidated image data) in this way, compared to the case where compression processing is performed on the entire image data, the compressed data data size can be further reduced.
なお、無効化画像データに対して圧縮処理を行うにあたっては、予め定められた量子化値を用いてもよいし、上記第1乃至第6の実施形態において説明した方法に基づいて決定した最適な量子化値を用いてもよい。また、任意の形状のデータを圧縮処理可能な圧縮方式の場合にあっては、無効化画像データの無効領域を取り除いたデータを圧縮処理してもよい。以下、第7の実施形態について、上記第1の実施形態との相違点を中心に説明する。 Note that when performing compression processing on invalidated image data, a predetermined quantization value may be used. Quantized values may also be used. Further, in the case of a compression method capable of compressing data of any shape, data from which invalid regions are removed from the invalidated image data may be compressed. The seventh embodiment will be described below, focusing on differences from the first embodiment.
<解析装置の機能構成>
はじめに、第7の実施形態に係る解析装置120の機能構成について説明する。図21は、解析装置の機能構成の一例を示す第5の図である。図3に示した機能構成との相違点は、量子化値決定部370に代えて、無効領域判定部2110及び無効化画像生成部2120を有する点である。<Functional configuration of analysis device>
First, the functional configuration of an
無効領域判定部2110は、集計結果格納部380に格納された、各ブロックの認識結果への影響度の集計値(量子化値の数に応じた数の集計値)に基づいて、各ブロックが無効領域に属するブロックであるのか否かを判定する。
The invalid
なお、無効領域判定部2110では、各ブロックが無効領域に属するブロックであるのか否かを判定するにあたり、まず、CNN部320より認識結果を取得し、正しい認識結果が出力されなかった際の量子化値を特定する。続いて、無効領域判定部2110では、最小の量子化値に対応する集計値と、特定した量子化値における集計値との差分が所定の閾値以上であるか否かに基づいて、各ブロックが無効領域に属するブロックであるのか否かを判定する。
Note that the invalid
また、無効領域判定部2110は、無効領域に属すると判定したブロックを無効化画像生成部2120に通知する。
In addition, the invalid
無効化画像生成部2120は、画像データに含まれる各ブロックのうち、無効領域判定部2110より通知されたブロックを無効化した、無効化画像データを生成する。また、無効化画像生成部2120は、生成した無効化画像データを、出力部340に通知する。
The invalidated
<無効領域判定部による処理の具体例>
次に、無効領域判定部2110による処理の具体例について説明する。図22は、無効領域判定部による処理の具体例を示す図である。図22において、グラフ510_1~510_mは、図5に示したグラフ510_1~510_mと同じである。ただし、図22に示すグラフ510_1~510_mには、CNN部320による認識処理において、正しい認識結果が出力されなかった際の量子化値(認識不可の量子化値)を明示している(一点鎖線参照)。<Specific example of processing by the invalid area determination unit>
Next, a specific example of processing by the invalid
無効領域判定部2110では、最小の量子化値に対応する集計値と、認識不可の量子化値に対応する集計値との差分を算出する。図22の例は、ブロック1~ブロックmそれぞれにおいて算出された差分が、Δ1~Δmであることを示している。The invalid
無効領域判定部2110では、算出した差分が、所定の閾値以上であるか否かに基づいて、対応するブロックが無効領域に属するブロックか否かを判定する。
The invalid
図22の例は、Δ1が所定の閾値未満であるため、無効領域判定部2110が、ブロック1を、無効領域に属するブロックであると判定した様子を示している。一方、図22の例は、Δ2が所定の閾値以上であるため、無効領域判定部2110が、ブロック2を、有効領域に属するブロックであると判定した様子を示している。また、図22の例は、Δ3が所定の閾値未満であるため、無効領域判定部2110が、ブロック3を、無効領域に属するブロックであると判定した様子を示している。The example of FIG. 22 shows how the invalid
<無効化画像データの具体例>
次に、無効化画像生成部2120により生成される無効化画像データの具体例について説明する。図23は、無効化画像データの具体例を示す図である。<Specific example of invalidation image data>
Next, a specific example of invalidation image data generated by the invalidation
図23に示す無効化画像データ2300において、ハッチングが施された領域2301は、無効領域判定部2110により無効領域と判定された領域である。一方、無効化画像データ2300において、ハッチングが施されていない領域2302は、無効領域判定部2110により有効領域と判定された領域である。
In
出力部340では、領域2301に含まれる各ブロックを無効化し、領域2302に含まれる各ブロックからなる画像データ(無効化画像データ2300)を画像圧縮装置130に送信する。
The
これにより、画像圧縮装置130では、無効化画像データ2300に対して圧縮処理を行うことで、圧縮データを生成する。このため、画像データ全体に対して、最適な量子化値を用いて圧縮処理を行う場合と比較して、圧縮データのデータサイズをより削減することができる。
As a result, the
なお、画像圧縮装置130が無効化画像データ2300に対して圧縮処理を行うにあたり、解析装置120では、領域2302に含まれる各ブロックについて、認識結果への影響度に応じた最適な量子化値を算出し、画像圧縮装置130に送信してもよい。
Note that when the
これにより、無効化画像データ2300について、予め定められた量子化値を用いて圧縮処理を行う場合と比較して、圧縮データのデータサイズを更に削減することができる。
As a result, the data size of the compressed data can be further reduced as compared with the case where the
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図24は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第7のフローチャートである。図7に示した第1のフローチャートとの相違点は、ステップS2401~S2404である。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS2401において、無効領域判定部2110は、CNN部320より正しい認識結果が出力されたか否かを判定する。ステップS2401において、正しい認識結果が出力されたと判定した場合には(ステップS2401においてYesの場合には)、ステップS702に戻る。
In step S2401, invalid
一方、ステップS2401において、正しい認識結果が出力されなかったと判定した場合には(ステップS2401においてNoの場合には)、ステップS2402に進む。 On the other hand, if it is determined in step S2401 that the correct recognition result was not output (No in step S2401), the process proceeds to step S2402.
ステップS2402において、無効領域判定部2110は、各ブロックについて、最小の量子化値に対応付けられた集計値と、認識不可時の量子化値に対応付けられた集計値との差分を算出する。また、無効領域判定部2110は、算出した差分に基づいて、各ブロックが無効領域に属するブロックか否かを判定する。
In step S2402, invalid
ステップS2403において、無効化画像生成部2120は、無効領域に属するブロックを無効化することで、無効化画像データを生成する。
In step S2403, the invalidation
ステップS2404において、出力部340は、無効化画像データを画像圧縮装置130に送信する。また、画像圧縮装置130は、無効化画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。なお、画像圧縮装置130では、正しい認識結果が出力されなかったと判定される直前の正しい認識結果が出力された際の量子化値を用いて圧縮処理を行う。
In step S<b>2404 ,
以上の説明から明らかなように、第7の実施形態に係る解析装置は、画像データに対して異なる量子化値を用いて圧縮処理を行った場合の各圧縮データを取得する。また、第7の実施形態に係る解析装置は、各圧縮データを復号した復号データを学習済みモデルに入力して認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成し、ブロックごとに影響度を集計する。また、第7の実施形態に係る解析装置は、正しい認識結果が出力されなかった際の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分に基づいて、各ブロックが無効領域に属するか否かを判定する。更に、第7の実施形態に係る解析装置は、無効領域に属するブロックを無効化した無効化画像データに対して圧縮処理を行う。 As is clear from the above description, the analysis apparatus according to the seventh embodiment acquires each piece of compressed data when compression processing is performed on image data using different quantization values. In addition, the analysis device according to the seventh embodiment inputs the decoded data obtained by decoding each compressed data to the trained model and performs the recognition processing based on the CNN part structure information, the degree of influence on the recognition result Generate an important feature map showing Further, the analysis device according to the seventh embodiment, based on the difference between the total value corresponding to the quantization value when the correct recognition result is not output and the total value corresponding to the minimum quantization value, Determine whether each block belongs to the invalid area. Furthermore, the analysis apparatus according to the seventh embodiment performs compression processing on invalidated image data in which blocks belonging to invalid areas are invalidated.
このように、認識結果への影響度に基づいて判定した無効領域を無効化した画像データに対して圧縮処理を行うことで、上記第1の実施形態と同様の効果を奏するとともに、上記第1の実施形態と比較して、圧縮データのデータサイズを更に削減することができる。 In this manner, by performing compression processing on image data in which invalid regions determined based on the degree of influence on recognition results are invalidated, the same effects as those of the first embodiment can be obtained, and at the same time, The data size of the compressed data can be further reduced compared to the embodiment of .
[第8の実施形態]
上記第7の実施形態では、認識結果への影響度に基づいて無効領域に属するブロックを判定するものとして説明した。これに対して、第8の実施形態では、認識結果への影響度に基づいて有効領域に属するブロックを判定する。[Eighth embodiment]
In the seventh embodiment described above, blocks belonging to the invalid area are determined based on the degree of influence on the recognition result. In contrast, in the eighth embodiment, blocks belonging to the effective area are determined based on the degree of influence on the recognition result.
なお、第8の実施形態では、有効領域に属するブロックを判定するにあたり、はじめに最小限の有効領域を設定しておき、量子化値を上げた際の各ブロックの集計値の変化に応じて、徐々に有効領域を拡張していくことで、有効領域を確定する。このように、第8の実施形態では、量子化値を上げたことによる認識精度の低下を、有効領域の拡張によりカバーすることで、より大きな量子化値を最適な量子化値として決定することができる。以下、第8の実施形態について、上記第7の実施形態との相違点を中心に説明する。 In the eighth embodiment, when determining blocks belonging to the effective area, the minimum effective area is set first, and according to the change in the total value of each block when the quantization value is increased, The effective area is determined by gradually expanding the effective area. As described above, in the eighth embodiment, a larger quantization value is determined as the optimum quantization value by covering the decrease in recognition accuracy caused by increasing the quantization value by expanding the effective region. can be done. The eighth embodiment will be described below, focusing on differences from the seventh embodiment.
<解析装置の機能構成>
はじめに、第8の実施形態に係る解析装置120の機能構成について説明する。図25は、解析装置の機能構成の一例を示す第6の図である。図21に示した機能構成との相違点は、初期無効化画像生成部2510を有する点、及び、無効領域判定部2110に代えて有効領域判定部2520を有する点である。また、無効化画像生成部2530の機能が、図21の無効化画像生成部2120の機能とは異なっている点である。<Functional configuration of analysis device>
First, the functional configuration of an
初期無効化画像生成部2510は、予め設定された最小限の有効領域を含む無効化画像データ(初期無効化画像データと称す)を生成する。また、初期無効化画像生成部2510は、生成した初期無効化画像データを出力部340に通知する。
The initial invalidation
有効領域判定部2520は、集計結果格納部380より集計結果を読み出し、量子化値の変化に対する各ブロックの集計値の変化量に基づいて、有効領域を拡張するか否かを判定する。また、有効領域判定部2520は、有効領域を拡張すると判定した場合、拡張後の有効領域を無効化画像生成部2530に通知する。
Valid
無効化画像生成部2530は、有効領域判定部2520より通知された拡張後の有効領域以外の領域(無効領域)に属するブロックを無効化し、無効化画像データを生成する。また、無効化画像生成部2530は、生成した無効化画像データを出力部340に通知する。
The invalidation
<有効領域判定部による処理の具体例>
次に、有効領域判定部2520による処理の具体例について説明する。図26は、有効領域判定部による処理の具体例を示す図である。図26において、初期無効化画像データ2610は、初期無効化画像生成部2510により生成された初期無効化画像データを示している。<Specific example of processing by effective area determination unit>
Next, a specific example of processing by the valid
初期無効化画像データ2610において、ハッチングが施された領域は、無効領域2611である。一方、初期無効化画像データ2610において、ハッチングが施されていない領域2612は、最小限の有効領域である。
In the initial
ここで、画像圧縮装置130では、異なる量子化値に基づいて初期無効化画像データ2610に対して圧縮処理を行う。これにより、CNN部320では、それぞれの量子化値に対応する圧縮データを復号した復号データに対して認識処理を行い、集計部360では、それぞれの量子化値に対応する、認識結果への影響度をブロック単位で集計する。
Here, the
図26において、グラフ2641は、それぞれの量子化値に対応する、ブロック2612_1(ブロック番号="ブロックX")の集計値を示している。また、グラフ2642は、それぞれの量子化値に対応する、ブロック2612_2(ブロック番号="ブロックX+1")の集計値を示している。
In FIG. 26, a
有効領域判定部2520では、例えば、ブロック2612_1について、現在の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分Δxを算出する。これにより、有効領域判定部2520は、有効領域を、ブロック2612_1に隣接するブロックまで拡張すべきか否かを判定する。For example, for the block 2612_1, the valid
同様に、有効領域判定部2520では、ブロック2612_2について、現在の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分Δx+1を算出する。これにより、有効領域判定部2520は、有効領域を、ブロック2612_2に隣接するブロックまで拡張すべきか否かを判定する。Similarly, the valid
なお、有効領域判定部2520では、有効領域と無効領域との境界位置内側にある全てのブロックについて同様の判定を行う。
It should be noted that the valid
図26の例は、ブロック2612_1については、Δxが所定の閾値未満であるため、隣接するブロックまで有効領域を拡張する必要はないと判定した様子を示している。また、図26の例は、ブロック2612_2については、Δx+1が所定の閾値以上であるため、隣接するブロックまで有効領域を拡張する必要があると判定された様子を示している。The example of FIG. 26 shows that for block 2612_1, Δx is less than the predetermined threshold, so it is determined that it is not necessary to expand the valid area to adjacent blocks. Also, the example of FIG. 26 shows that for block 2612_2, since Δx +1 is greater than or equal to the predetermined threshold, it is determined that the effective area needs to be extended to the adjacent block.
なお、有効領域判定部2520では、ブロック2612_2に隣接するブロックを有効領域に含めた、拡張後の有効領域を無効化画像生成部2530に通知し、無効化画像生成部2530では、通知された拡張後の有効領域に基づいて、無効化画像データを生成する。
Note that the valid
図26において、無効化画像データ2620は、無効化画像生成部2530が、有効領域判定部2520より通知された、拡張後の有効領域に基づいて生成した無効化画像データを示している。
In FIG. 26, invalidated
図26に示すように、無効化画像データ2620の有効領域2622には、ブロック2612_2に隣接するブロック2631が含まれる。また、無効化画像データ2620の無効領域2621は、有効領域が拡張されたことで、初期無効化画像データ2610の無効領域2611よりも小さくなっている。
As shown in FIG. 26,
このように、有効領域判定部2520では、量子化値を上げた際の各ブロックの集計値の変化に応じて、徐々に有効領域を拡張していくことで、有効領域を確定する。なお、有効領域判定部2520では、隣接するブロックを有効領域に含めることで、有効領域と無効領域との境界位置内側にあったブロックの集計値が下がり、最小の量子化値に対応する集計値との差分が所定の閾値未満になった場合、有効領域の拡張を継続する。
In this manner, the valid
一方、有効領域判定部2520では、隣接するブロックを有効領域に含めたが、有効領域と無効領域との境界位置内側にあったブロックの集計値が下がらず、最小の量子化値に対応する集計値との差分が所定の閾値以上のままの場合には、有効領域の拡張を終了する。
On the other hand, in the valid
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図27は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第8のフローチャートである。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS2701において、入力部310は画像データをフレーム単位で取得する。
In step S2701, the
ステップS2702において、CNN部320は、画像データに対して認識処理を行うことで、認識結果を出力し、重要特徴マップ生成部350は重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。これにより、各ブロックについて、最小の量子化値に対応する集計値が算出される。
In step S2702, the
ステップS2703において、量子化値設定部330は、圧縮レベルを初期化するとともに、圧縮レベルの上限を設定する。また、初期無効化画像生成部2510は、初期無効化画像データを生成する。
In step S2703, quantization
ステップS2704において、画像圧縮装置130は、現在の量子化値を用いて、無効化画像データ(ここでは初期無効化画像データ)に対して圧縮処理を行い、圧縮データを生成する。
In step S2704, the
ステップS2705において、CNN部320は、圧縮データを復号した復号データに対して認識処理を行うことで認識結果を出力し、重要特徴マップ生成部350は重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。
In step S2705, the
ステップS2706において、有効領域判定部2520は、有効領域と無効領域との境界位置内側のブロックについて、現在の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分が所定の閾値以上であるか否かを判定する。
In step S2706, valid
ステップS2706において、所定の閾値未満であると判定された場合には(ステップS2706においてNoの場合には)、ステップS2712に進む。 If it is determined in step S2706 that it is less than the predetermined threshold (No in step S2706), the process proceeds to step S2712.
一方、ステップS2706において、所定の閾値以上であると判定された場合には(ステップS2706においてYesの場合には)、ステップS2707に進む。 On the other hand, if it is determined in step S2706 that it is equal to or greater than the predetermined threshold value (Yes in step S2706), the process proceeds to step S2707.
ステップS2707において、有効領域判定部2520は、差分が所定の閾値以上のブロックに隣接するブロックを有効領域に含め、拡張後の有効領域を無効化画像生成部2530に通知する。
In step S2707, the valid
ステップS2708において、無効化画像生成部2530は、拡張後の有効領域に基づいて無効化画像データを生成する。
In step S2708, the invalidation
ステップS2709において、画像圧縮装置130は、現在の量子化値を用いて、無効化画像データに対して圧縮処理を行い、圧縮データを生成する。
In step S2709, the
ステップS2710において、CNN部320は、圧縮データを復号した復号データに対して認識処理を行うことで認識結果を出力し、重要特徴マップ生成部350は重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。
In step S2710,
ステップS2711において、有効領域判定部2520は、ステップS2706において、所定の閾値以上であると判定されたブロックについて集計値が下がり、差分が所定の閾値未満になったか否かを判定する。
In step S2711, valid
ステップS2711において、所定の閾値未満になったと判定した場合には(ステップS2711においてYesの場合には)、ステップS2712に進む。 If it is determined in step S2711 that the value is less than the predetermined threshold value (Yes in step S2711), the process proceeds to step S2712.
ステップS2712において、量子化値設定部330は、圧縮レベル(量子化値)を上げ、ステップS2704に戻る。
In step S2712, quantization
一方、ステップS2711において、所定の閾値以上のままであると判定した場合には(ステップS2711においてNoの場合には)、ステップS2713に進む。 On the other hand, if it is determined in step S2711 that it remains equal to or greater than the predetermined threshold value (No in step S2711), the process proceeds to step S2713.
ステップS2713において、無効化画像生成部2530は、ステップS2707において有効領域を拡張する直前の有効領域に基づいて無効化画像データを生成する。
In step S2713, invalidation
ステップS2714において、画像圧縮装置130は、ステップS2707において有効領域を拡張する直前の圧縮レベル(量子化値)を用いて、ステップS2713において生成された無効化画像データに対して圧縮処理を行い、圧縮データを格納する。
In step S2714, the
以上の説明から明らかなように、第8の実施形態に係る解析装置は、はじめに最小限の有効領域を設定しておき、量子化値を上げた際の各ブロックの集計値の変化に応じて、徐々に有効領域を拡張していく。 As is clear from the above description, the analysis apparatus according to the eighth embodiment first sets the minimum effective area, and according to the change in the total value of each block when the quantization value is increased, , gradually expanding the effective area.
これにより、第8の実施形態に係る解析装置によれば、量子化値を上げたことによる認識精度の低下を、有効領域の拡張によりカバーすることが可能となり、より大きな量子化値を最適な量子化値として圧縮処理を行うことが可能となる。 As a result, according to the analysis apparatus according to the eighth embodiment, it is possible to compensate for the decrease in recognition accuracy due to the increase in the quantization value by extending the effective region, so that a larger quantization value can be optimized. Compression processing can be performed as a quantized value.
この結果、第8の実施形態によれば、上記第1の実施形態と同様の効果を奏するとともに、上記第1の実施形態よりも、圧縮データのデータサイズをより削減することができる。 As a result, according to the eighth embodiment, the same effects as those of the first embodiment can be obtained, and the data size of the compressed data can be further reduced than that of the first embodiment.
[第9の実施形態]
上記第8の実施形態では、有効領域を拡張するにあたり、有効領域と無効領域との境界位置内側のブロックの集計値に着目した。これに対して、第9の実施形態では、有効領域を拡張するにあたり、境界位置を介して隣接するブロックの集計値(有効領域と無効領域との境界位置内側のブロックの集計値と外側のブロックの集計値と)に着目する。以下、第9の実施形態について、上記第8の実施形態との相違点を中心に説明する。[Ninth Embodiment]
In the above-described eighth embodiment, in extending the valid area, attention is paid to the total value of the blocks inside the boundary position between the valid area and the invalid area. On the other hand, in the ninth embodiment, when expanding the valid area, the total value of the blocks adjacent to each other across the boundary position (the aggregate value of the blocks inside the boundary position between the valid area and the invalid area and the blocks outside and ). The ninth embodiment will be described below, focusing on differences from the eighth embodiment.
<解析装置の機能構成>
はじめに、第8の実施形態に係る解析装置120の機能構成について説明する。図28は、解析装置の機能構成の一例を示す第7の図である。図25に示した機能構成との相違点は、有効領域判定部2810の機能が、有効領域判定部2520の機能と異なる点、無効化画像生成部2830の機能が、無効化画像生成部2530の機能と異なる点である。また、初期無効化画像生成部2510に代えて、初期有効領域設定部2820を有する点である。<Functional configuration of analysis device>
First, the functional configuration of an
初期有効領域設定部2820は、はじめに、有効領域判定部2810に対して最小限の有効領域を設定する。
Initial valid
有効領域判定部2810は、集計結果格納部380より集計結果を読み出し、それぞれの量子化値における各ブロックの集計値に基づいて、有効領域を拡張するか否かを判定する。
Valid
具体的には、有効領域判定部2810は、画像データ全体に対して量子化値を上げるごとに生成されるそれぞれの圧縮データについて、各ブロックの集計値が算出され、集計結果格納部380に格納された場合に、各ブロックの集計値を取得する。
Specifically, the valid
その際、有効領域判定部2810では、初期有効領域と無効領域との境界位置内側にあるブロックと外側にあるブロックとの間(境界位置を介して隣接するブロック間)で、集計値の差分を算出する。そして、有効領域判定部2810では、算出した差分が所定の閾値以上であると判定した場合に、境界位置外側にあるブロックを有効領域に含める。
At that time, the valid
その後も、継続して、画像データ全体に対して量子化値を上げるごとに生成されるそれぞれの圧縮データについて、同様に、各ブロックの集計値を取得する。その際、有効領域判定部2810では、拡張後の有効領域と無効領域との境界位置内側にあるブロックと外側にあるブロックとの間で、集計値の差分を算出する。そして、有効領域判定部2810では、算出した差分が所定の閾値以上であると判定した場合に、境界位置外側にあるブロックを有効領域に含める。
After that, the total value of each block is similarly obtained for each piece of compressed data generated each time the quantization value is increased for the entire image data. At this time, the valid
無効化画像生成部2830は、有効領域判定部2810による有効領域の拡張が完了した際の有効領域に基づいて無効化画像データを生成する。また、無効化画像生成部2830は、生成した無効化画像データを出力部340に通知する。
The invalidation
<有効領域判定部による処理の具体例>
次に、有効領域判定部2810による処理の具体例について説明する。図29は、有効領域判定部による処理の具体例を示す第2の図である。図29において、画像データ2910は、画像圧縮装置130により圧縮処理される画像データである。また、画像データ2910内の、初期有効領域2912は、初期有効領域設定部2820により設定された初期有効領域を示している。<Specific example of processing by effective area determination unit>
Next, a specific example of processing by the valid
ここで、画像データ2910に対しては、画像圧縮装置130が、それぞれの量子化値を用いて圧縮処理を行い、圧縮データを生成する。これにより、CNN部320では、それぞれの量子化値に対応する圧縮データを復号した復号データに対して認識処理を行い、集計部360では、それぞれの量子化値に対応する、認識結果への影響度をブロック単位で集計する。
Here, the
図29において、グラフ2931は、それぞれの量子化値に対応する、ブロック2921(ブロック番号="ブロックX")の集計値を示している。なお、ブロック2921は、初期有効領域2912と無効領域2911との境界位置内側のブロックである。
In FIG. 29, a
また、グラフ2932は、それぞれの量子化値に対応する、ブロック2922(ブロック番号="ブロックX+1")の集計値を示している。なお、ブロック2922は、初期有効領域2912と無効領域2911との境界位置外側のブロックであって、ブロック2921と隣接するブロックである。
Also, a
有効領域判定部2810では、現在の量子化値に対応する、ブロック2921の集計値と、ブロック2922の集計値との差分を算出し、算出した差分が所定の閾値以上であるか否かを判定することで、ブロック2922を有効領域に含めるか否かを判定する。
The valid
図29の例は、ブロック2922について、有効領域に含めると判定された様子を示している。なお、有効領域判定部2810では、初期有効領域と無効領域との境界位置内側にある全てのブロックについて同様の処理を行う。
The example of FIG. 29 shows how
図29において、画像データ2940は、有効領域判定部2810により、拡張後の有効領域2942が設定された様子を示している。図29において、ブロック2922は、新たに有効領域に含めたブロックである。
In FIG. 29, the
なお、画像圧縮装置130では、その後も、継続して画像データ全体に対して量子化値を上げるごとに生成されるそれぞれの圧縮データについて、同様に、各ブロックの集計値を取得する。その際、有効領域判定部2810では、拡張後の有効領域2942と無効領域2941との境界位置内側にあるブロックと外側にあるブロックとの間で、集計値の差分を算出する。そして、有効領域判定部2810では、算出した差分が所定の閾値以上であると判定した場合に、境界位置外側にあるブロックを有効領域に含める。
After that, the
有効領域判定部2810では、有効領域の拡張が完了すると、完了時の有効領域を無効化画像生成部2830に通知し、無効化画像生成部2830では、通知された有効領域に基づいて、無効化画像データを生成する。
When the expansion of the valid area is completed, the valid
<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図30は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第9のフローチャートである。図27に示した第8のフローチャートとの相違点は、ステップS3001~S3009である。<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the
ステップS3001において、初期有効領域設定部2820は、初期有効領域を設定する。
In step S3001, initial valid
ステップS3002において、画像圧縮装置130は、現在の量子化値で画像データに対して圧縮処理を行い、圧縮データを生成する。
In step S3002, the
ステップS3003において、CNN部320は、圧縮データを復号した復号データに対して認識処理を行うことで認識結果を出力し、重要特徴マップ生成部350は、重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。
In step S3003, the
ステップS3004において、有効領域判定部2810は、現在の有効領域及び無効領域について、境界位置内側のブロックと外側のブロックとの間で集計値の差分を算出し、算出した集計値の差分が所定の閾値以上であるか否かを判定する。
In step S3004, valid
ステップS3004において、所定の閾値未満であると判定した場合には(ステップS3004においてNoの場合には)、ステップS3006に進む。 If it is determined in step S3004 that it is less than the predetermined threshold value (No in step S3004), the process proceeds to step S3006.
一方、ステップS3004において、所定の閾値以上であると判定した場合には(ステップS3004においてYesの場合には)、ステップS3005に進む。 On the other hand, if it is determined in step S3004 that it is equal to or greater than the predetermined threshold value (Yes in step S3004), the process proceeds to step S3005.
ステップS3005において、有効領域判定部2810は、境界位置外側のブロックを有効領域に含める。
In step S3005, valid
ステップS3006において、量子化値設定部330は、圧縮レベル(量子化値)を上げ、ステップS3007に進む。
In step S3006, quantization
ステップS3007において、量子化値設定部330は、圧縮レベル(量子化値)が上限を超えたか否かを判定し、上限を超えていないと判定した場合には(ステップS3007においてNoの場合には)、ステップS3002に戻る。
In step S3007, quantization
一方、ステップS3007において、上限を超えたと判定した場合には(ステップS3007においてYesの場合には)、ステップS3008に進む。 On the other hand, if it is determined in step S3007 that the upper limit has been exceeded (if Yes in step S3007), the process proceeds to step S3008.
ステップS3008において、無効化画像生成部2830は、現在の有効領域に基づいて、無効化画像データを生成する。
In step S3008, invalidation
ステップS3009において、画像圧縮装置130は、無効化画像データに対して圧縮処理を行い、圧縮データを格納する。なお、画像圧縮装置130では、例えば、有効領域を拡張した際の量子化値を用いて、無効化画像データに対して圧縮処理を行う。
In step S3009, the
以上の説明から明らかなように、第9の実施形態に係る解析装置は、はじめに最小限の有効領域を設定しておき、量子化値を上げた際の、境界位置の隣接ブロック間の集計値の差分に応じて、徐々に有効領域を拡張していく。 As is clear from the above description, the analysis apparatus according to the ninth embodiment first sets the minimum effective area, and when the quantization value is increased, the total value between adjacent blocks at the boundary position The effective area is gradually expanded in accordance with the difference between .
これにより、第9の実施形態に係る解析装置によれば、量子化値を上げたことによる認識精度の低下を、有効領域の拡張によりカバーすることが可能となり、より大きな量子化値を最適な量子化値として圧縮処理を行うことが可能となる。 As a result, according to the analysis apparatus according to the ninth embodiment, it is possible to compensate for the decrease in recognition accuracy due to the increase in the quantization value by extending the effective region. Compression processing can be performed as a quantized value.
この結果、第9の実施形態によれば、上記第1の実施形態と同様の効果を奏するとともに、上記第1の実施形態よりも、圧縮データのデータサイズをより削減することができる。 As a result, according to the ninth embodiment, the same effects as those of the first embodiment can be obtained, and the data size of the compressed data can be further reduced than that of the first embodiment.
[その他の実施形態]
上記第1の実施形態では、最小の量子化値から最大の量子化値まで全てを用いて圧縮処理を行うものとして説明した。しかしながら、圧縮処理に用いる量子化値は、これに限られず、最小の量子化値から最大の量子化値までの間に含まれる所定数の量子化値を用いて圧縮処理を行ってもよい。所定数の量子化値とは、最適な量子化値を決定しうる数の量子化値を指し、少なくとも2以上の量子化値を指す。[Other embodiments]
In the first embodiment described above, compression processing is performed using all quantized values from the minimum quantized value to the maximum quantized value. However, the quantization value used for compression processing is not limited to this, and compression processing may be performed using a predetermined number of quantization values included between the minimum quantization value and the maximum quantization value. The predetermined number of quantization values refers to the number of quantization values that can determine the optimum quantization value, and refers to at least two quantization values.
また、上記第1の実施形態では、画像データに1のオブジェクトが含まれるものとして説明した。しかしながら、画像データには複数のオブジェクトが含まれていてもよい。この場合、画像データ内の複数のオブジェクトについて、同時に、CNN部構造情報を取得し、複数のオブジェクトについて同時に圧縮レベルを決定してもよい。あるいは、画像データ内の複数のオブジェクトについて、個別に、CNN部構造情報を取得し、オブジェクトごとに圧縮レベルを決定した後に、各オブジェクトの圧縮レベルをマージすることで、画像データ全体の圧縮レベルを決定してもよい。 Further, in the first embodiment, the image data includes one object. However, the image data may contain multiple objects. In this case, the CNN structure information may be obtained for multiple objects in the image data at the same time, and the compression levels may be determined for the multiple objects at the same time. Alternatively, for a plurality of objects in the image data, the CNN structure information is individually acquired, the compression level is determined for each object, and then the compression level of each object is merged to obtain the compression level of the entire image data. may decide.
また、上記第3の実施形態では、疑似圧縮データを生成する際の画像処理として、ローパスフィルタを用いたフィルタリング処理を例に挙げて説明した。しかしながら、疑似圧縮データを生成する際の画像処理は、これに限定されない。 Further, in the above-described third embodiment, filtering processing using a low-pass filter has been described as an example of image processing for generating pseudo-compressed data. However, the image processing for generating pseudo-compressed data is not limited to this.
例えば、画像データ全体をフーリエ変換し、高周波成分をカットしたうえで、逆フーリエ変換してもよい。あるいは、画像データをブロック単位でフーリエ変換し、高周波成分をカットしたうえで、逆フーリエ変換してもよい。 For example, the entire image data may be Fourier-transformed, high-frequency components cut, and then inverse Fourier-transformed. Alternatively, the image data may be Fourier-transformed on a block-by-block basis, high-frequency components cut, and then inverse Fourier-transformed.
あるいは、画像データ全体をDCT変換し、量子化したうえで、逆DCT変換してもよい。あるいは、画像データをブロック単位でDCT変換し、量子化したうえで、逆DCT変換してもよい。 Alternatively, the entire image data may be DCT-transformed, quantized, and then inversely DCT-transformed. Alternatively, image data may be DCT-transformed block by block, quantized, and then inversely DCT-transformed.
また、上記第7~第9のいずれかの実施形態、あるいは、上記第7~第9のいずれかの実施形態を組み合わせた実施形態において、認識結果への影響度が大きい領域と小さい領域とに分離し、
・認識結果への影響度が大きい領域に対しては、上記第1~第6のいずれかの実施形態、あるいは、上記第1~第6のいずれかの実施形態を組み合わせた実施形態を適用し、
・認識結果への影響度が小さい領域に対しては、高圧縮の量子化値を適用してもよい(あるいは、無効領域としてもよい)。Further, in any one of the seventh to ninth embodiments, or an embodiment combining any of the seventh to ninth embodiments, an area having a large influence on the recognition result and an area having a small influence separate,
- Any one of the first to sixth embodiments or an embodiment combining any one of the first to sixth embodiments is applied to an area that has a large influence on the recognition result. ,
- A highly compressed quantization value may be applied to an area having a small influence on the recognition result (or may be an invalid area).
なお、上記各実施形態において算出される圧縮レベルや、有効領域または無効領域を示す情報は、圧縮処理が行われることでデータサイズの削減が期待できる画像データに対する前処理の処理内容を決定するための情報として用いてもよい。ここでいう前処理には、例えば、画像データから色情報を削減する処理や、画像データから高周波成分を削減する処理等が含まれる。 It should be noted that the compression level calculated in each of the above embodiments and the information indicating the effective area or the ineffective area are used to determine the details of preprocessing for image data that can be expected to reduce the data size by performing compression processing. You may use it as information of The preprocessing referred to here includes, for example, processing for reducing color information from image data, processing for reducing high-frequency components from image data, and the like.
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。 It should be noted that the present invention is not limited to the configurations shown here, such as combinations with other elements, etc., in the configurations described in the above embodiments. These points can be changed without departing from the gist of the present invention, and can be determined appropriately according to the application form.
100 :圧縮処理システム
120 :解析装置
130 :画像圧縮装置
310 :入力部
320 :CNN部
330 :量子化値設定部
340 :出力部
350 :重要特徴マップ生成部
360 :集計部
370 :量子化値決定部
420 :集計結果
810 :最大量子化値設定部
820 :量子化値決定部
910 :グループ情報
1110 :画像処理部
1410 :位置判定部
1420 :量子化値設定部
1430 :出力部
2110 :無効領域判定部
2120 :無効化画像生成部
2300 :無効化画像データ
2510 :初期無効化画像生成部
2520 :有効領域判定部
2530 :無効化画像生成部
2810 :有効領域判定部
2820 :初期有効領域設定部
2830 :無効化画像生成部100: Compression processing system 120: Analysis device 130: Image compression device 310: Input unit 320: CNN unit 330: Quantization value setting unit 340: Output unit 350: Important feature map generation unit 360: Aggregation unit 370: Quantization value determination Unit 420: Aggregation result 810: Maximum quantization value setting unit 820: Quantization value determination unit 910: Group information 1110: Image processing unit 1410: Position determination unit 1420: Quantization value setting unit 1430: Output unit 2110: Invalid area determination Unit 2120: invalidation image generation unit 2300: invalidation image data 2510: initial invalidation image generation unit 2520: effective area determination unit 2530: invalidation image generation unit 2810: effective area determination unit 2820: initial effective area setting unit 2830: Invalidation image generator
Claims (11)
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報に基づいて、前記画像データの各領域の圧縮レベルを決定する決定部と
を有する解析装置。Recognition of each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed on image data at different compression levels. a storage unit for storing information indicating the degree of influence on the result;
and a determination unit that determines the compression level of each area of the image data based on information indicating the degree of influence of each area of the decoded data corresponding to the different compression levels on the recognition result.
生成された前記マップに基づいて、前記復号データの各領域の認識結果への影響度を、圧縮処理が行われる際に用いられるブロック単位で集計する集計部と、を更に有し、
前記格納部は、前記ブロック単位で集計した集計値を、前記各領域の認識結果への影響度を示す情報として格納する、請求項1に記載の解析装置。a map generation unit that generates a map indicating the degree of influence of each area of the decoded data on the recognition result, which is calculated by performing recognition processing on the decoded data;
a tallying unit that tallies, based on the generated map, the degree of influence of each region of the decoded data on the recognition result for each block used when compression processing is performed;
2. The analysis apparatus according to claim 1, wherein said storage unit stores the aggregated value aggregated for each block as information indicating the degree of influence of each area on the recognition result.
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報を、複数のグループに分類した場合の各グループに、圧縮レベルが対応付けられたグループ情報を格納し、
前記決定部は、
所定の圧縮レベルに対応する、各領域の認識結果への影響度を示す情報が、前記各グループのいずれに属するかを判定し、判定したグループに対応付けられた圧縮レベルを、前記画像データの各領域の圧縮レベルとして決定する、請求項1または2に記載の解析装置。The storage unit is
Group information associated with a compression level is stored for each group when the information indicating the degree of influence on the recognition result of each region of the decoded data corresponding to the different compression levels is classified into a plurality of groups. death,
The decision unit
It is determined to which of the groups the information indicating the degree of influence of each region on the recognition result corresponding to the predetermined compression level belongs, and the compression level associated with the determined group is stored in the image data. 3. The analyzing apparatus according to claim 1, wherein the compression level of each area is determined.
画像データに対して画像処理が行われることで生成された疑似圧縮データに対して、認識処理が行われることで算出された、該疑似圧縮データの各領域の認識結果への影響度を示す情報が、前記各グループのいずれに属するかを判定し、判定したグループに対応付けられた圧縮レベルを、前記画像データの各領域の圧縮レベルとして決定する、請求項3に記載の解析装置。The decision unit
Information indicating the degree of influence of each region of pseudo-compressed data on the recognition result, calculated by performing recognition processing on pseudo-compressed data generated by performing image processing on image data 4. The analyzing apparatus according to claim 3, further comprising: determining to which of the groups each of the image data belongs, and determining a compression level associated with the determined group as the compression level of each area of the image data.
異なる画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各領域の認識結果への影響度を示す情報が、所定の閾値を超えないように、前記異なる画像データそれぞれの各領域の圧縮レベルを決定する、請求項1に記載の解析装置。The decision unit
Each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed at different compression levels for different image data. 2. The analyzing apparatus according to claim 1, wherein the compression level of each area of each of said different image data is determined so that the information indicating the degree of influence on the recognition result does not exceed a predetermined threshold.
所定のブロック単位で集計した集計値のうち、基準となるブロックの集計値と、他のブロックの集計値とを比較し、該基準となるブロックの圧縮レベルと、比較結果とに基づいて、他のブロックの圧縮レベルを決定する、請求項2に記載の解析装置。The decision unit
Of the aggregated values aggregated in units of predetermined blocks, the aggregated value of the reference block is compared with the aggregated value of other blocks, and based on the compression level of the reference block and the comparison result, other 3. The analysis apparatus of claim 2, determining a compression level for blocks of .
誤った認識結果が出力される直前に出力された、正しい認識結果に対する前記復号データの各領域の認識結果への影響度を示す情報に重み係数をかけ、予め設定された圧縮レベルに加算することで、前記画像データの各領域の圧縮レベルを決定する、請求項1に記載の解析装置。The decision unit
Multiplying information indicating the degree of influence of each region of the decoded data on the recognition result with respect to the correct recognition result output immediately before the erroneous recognition result is output by a weighting factor and adding the result to a preset compression level. 2. The apparatus of claim 1, wherein determining a compression level for each region of said image data.
画像データのうち、前記無効領域と判定された領域を無効化することで、無効化画像データを生成する無効化画像生成部と
を更に有する、請求項1に記載の解析装置。an invalid area determination unit that acquires information indicating the degree of influence on the recognition result of each area of the decoded data with respect to the correct recognition result output immediately before the erroneous recognition result is output, and determines an invalid area;
2. The analysis apparatus according to claim 1, further comprising: an invalidated image generating unit that generates invalidated image data by invalidating the area determined as the invalid area in the image data.
前記格納部は、
前記無効化画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの無効化画像データの有効領域に含まれる各ブロックの集計値を格納し、
前記無効化画像生成部は、
前記無効化画像データの有効領域に含まれる各ブロックの集計値のうち、有効領域と無効領域との境界位置内側に位置するブロックの集計値が所定の条件を満たす場合、有効領域を拡張した新たな無効化画像データを生成する、請求項2に記載の解析装置。further comprising a disabled image generation unit that generates disabled image data by disabling a predetermined disabled area in the image data;
The storage unit is
Disabled image data calculated by performing recognition processing on decoded data obtained by decoding respective compressed data when compression processing is performed on the disabled image data at different compression levels. stores the aggregate value of each block contained in the effective area of ,
The invalidation image generation unit
Among the aggregated values of the blocks included in the valid area of the invalidated image data, if the aggregated value of the blocks located inside the boundary position between the valid area and the invalid area satisfies a predetermined condition, the valid area is newly expanded to expand the aggregated value. 3. The analysis device according to claim 2, which generates invalidated image data.
前記画像データのうち、判定された有効領域以外の無効領域を無効化することで、無効化画像データを生成する無効化画像生成部と、を更に有し、
前記格納部は、
画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各ブロックの集計値を格納し、
前記有効領域判定部は、
前記復号データの各ブロックの集計値のうち、前記有効領域と前記無効領域との境界位置を介して隣接するブロックの集計値が、所定の条件を満たす場合、該有効領域を拡張し、
前記無効化画像生成部は、
前記有効領域が拡張された拡張後の有効領域以外の無効領域を無効化することで、無効化画像データを生成する、請求項2に記載の解析装置。an effective area determination unit that determines an effective area in image data;
a disabled image generating unit that generates disabled image data by disabling an invalid region other than the determined valid region in the image data;
The storage unit is
Aggregation of each block of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed at different compression levels for image data store the value,
The effective area determination unit
expanding the valid area when the aggregate value of blocks adjacent to each other across a boundary position between the valid area and the invalid area, among the aggregate values of each block of the decoded data, satisfies a predetermined condition;
The invalidation image generation unit
3. The analysis apparatus according to claim 2, wherein invalidated image data is generated by invalidating an invalid area other than the valid area after expansion of the valid area.
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報に基づいて、前記画像データの各領域の圧縮レベルを決定する、
処理をコンピュータに実行させるための解析プログラム。Recognition of each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed on image data at different compression levels. Get information that indicates the degree of influence on the result,
Determining the compression level of each region of the image data based on information indicating the degree of influence of each region of the decoded data corresponding to the different compression levels on the recognition result;
An analysis program for making a computer perform processing.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/050896 WO2021130919A1 (en) | 2019-12-25 | 2019-12-25 | Analysis device and analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021130919A1 JPWO2021130919A1 (en) | 2021-07-01 |
JP7310926B2 true JP7310926B2 (en) | 2023-07-19 |
Family
ID=76573779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021566651A Active JP7310926B2 (en) | 2019-12-25 | 2019-12-25 | Analysis device and analysis program |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220284632A1 (en) |
JP (1) | JP7310926B2 (en) |
WO (1) | WO2021130919A1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023047515A1 (en) * | 2021-09-24 | 2023-03-30 | 富士通株式会社 | Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program |
WO2023181323A1 (en) * | 2022-03-25 | 2023-09-28 | 富士通株式会社 | Image processing system, image processing device, image processing method, and image processing program |
-
2019
- 2019-12-25 WO PCT/JP2019/050896 patent/WO2021130919A1/en active Application Filing
- 2019-12-25 JP JP2021566651A patent/JP7310926B2/en active Active
-
2022
- 2022-05-24 US US17/751,871 patent/US20220284632A1/en not_active Abandoned
Non-Patent Citations (3)
Title |
---|
CHOI, Hyomin and BAJIC, Ivan V.,HIGH EFFICIENCY COMPRESSION FOR OBJECT DETECTION,2018 IEEE Internatilnal Conference on Acoustics, Speech and Signal Processing,米国,IEEE,2018年09月13日,pp.1792-1796,<URL:https://ieeexplore.ieee.org/ document/8462653>,<DOI:10.1109/ICASSP.2018.8462653> |
GALTERI, Leonardo et al.,Video Compression for Object Detection Algorithms,2018 24th International Conference on Pattern Recognition,米国,IEEE,2018年11月29日,pp.3007-3012,<URL:https://ieeexplore.ieee.org/document/8546064>,<DOI:10.1109/ICPR.2018.8546064> |
SUZUKI, Satoshi et al.,IMAGE PRE-TRANSFORMATION FOR RECOGNITION-AWARE IMAGE COMPRESSION,2019 IEEE International Conference on Image Processing,米国,IEEE,2019年08月26日,pp 2686-2690,<URL:https://ieeexplore.ieee.org/document/8803275>,<DOI:10.1109/ICIP.2019.8803275> |
Also Published As
Publication number | Publication date |
---|---|
US20220284632A1 (en) | 2022-09-08 |
JPWO2021130919A1 (en) | 2021-07-01 |
WO2021130919A1 (en) | 2021-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A deep learning approach for multi-frame in-loop filter of HEVC | |
KR101901355B1 (en) | Method and apparatus for performing graph-based prediction using optimazation function | |
CN110267041B (en) | Image encoding method, image encoding device, electronic device, and computer-readable storage medium | |
Xu et al. | Non-local convlstm for video compression artifact reduction | |
Zhang et al. | Low-rank decomposition-based restoration of compressed images via adaptive noise estimation | |
Moorthy et al. | Efficient motion weighted spatio-temporal video SSIM index | |
KR101808327B1 (en) | Video encoding/decoding method and apparatus using paddding in video codec | |
JP7310926B2 (en) | Analysis device and analysis program | |
US20030128754A1 (en) | Motion estimation method for control on the basis of scene analysis in video compression systems | |
JP7479137B2 (en) | Signal processing device, signal processing method, system, and program | |
US9319680B2 (en) | Image encoding apparatus and its control method | |
Kirmemis et al. | Learned compression artifact removal by deep residual networks | |
Yuan et al. | Block-based learned image coding with convolutional autoencoder and intra-prediction aided entropy coding | |
WO2021130918A1 (en) | Image processing system and image processing program | |
CN112991192B (en) | Image processing method, device, equipment and system thereof | |
JP5913929B2 (en) | Moving picture coding apparatus, control method therefor, and computer program | |
JP5809574B2 (en) | Encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program | |
JP7491388B2 (en) | IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD, AND IMAGE PROCESSING PROGRAM | |
WO2022130497A1 (en) | Analysis device, analysis method, and analysis program | |
Lin et al. | Coding unit partition prediction technique for fast video encoding in HEVC | |
Ouyang et al. | Towards quantized DCT coefficients restoration for compressed images | |
Zhang et al. | Principal Component Approximation Network for Image Compression | |
JP7310919B2 (en) | Filter generation method, filter generation device and program | |
US20220239935A1 (en) | Video compression with adaptive iterative intra-prediction | |
Kırmemiş et al. | Learned Compression Artifact Removal by Deep Residual Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7310926 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |