JP7310926B2 - Analysis device and analysis program - Google Patents

Analysis device and analysis program Download PDF

Info

Publication number
JP7310926B2
JP7310926B2 JP2021566651A JP2021566651A JP7310926B2 JP 7310926 B2 JP7310926 B2 JP 7310926B2 JP 2021566651 A JP2021566651 A JP 2021566651A JP 2021566651 A JP2021566651 A JP 2021566651A JP 7310926 B2 JP7310926 B2 JP 7310926B2
Authority
JP
Japan
Prior art keywords
image data
compression
unit
area
quantization value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021566651A
Other languages
Japanese (ja)
Other versions
JPWO2021130919A1 (en
Inventor
智規 久保田
鷹詔 中尾
康之 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2021130919A1 publication Critical patent/JPWO2021130919A1/ja
Application granted granted Critical
Publication of JP7310926B2 publication Critical patent/JP7310926B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

本発明は、解析装置及び解析プログラムに関する。 The present invention relates to an analysis device and an analysis program.

一般に、画像データを記録または伝送する場合、画像圧縮処理によりデータサイズを小さくすることで、記録コストや伝送コストの削減を実現している。 In general, when recording or transmitting image data, the data size is reduced by image compression processing, thereby reducing recording costs and transmission costs.

一方で、近年、AI(Artificial Intelligence)による画像認識処理に利用される目的で、画像データを記録または伝送するケースが増えてきている。AIの代表的なモデルとして、例えば、深層学習や機械学習を用いたモデルが挙げられる。 On the other hand, in recent years, there has been an increasing number of cases where image data is recorded or transmitted for the purpose of being used for image recognition processing by AI (Artificial Intelligence). Typical AI models include, for example, models using deep learning and machine learning.

特開2018-101406号公報JP 2018-101406 A 特開2019-079445号公報JP 2019-079445 A 特開2011-234033号公報JP 2011-234033 A

しかしながら、従来の圧縮処理は、人間の視覚特性に基づいて行われており、AIの動作解析に基づいて行われているわけではない。このため、AIによる画像認識処理に必要でない領域について、十分な圧縮レベルで圧縮処理が行われていない場合があった。 However, conventional compression processing is performed based on human visual characteristics, not based on AI motion analysis. For this reason, there have been cases where compression processing has not been performed at a sufficient compression level for regions that are not required for image recognition processing by AI.

一つの側面では、AIによる画像認識処理に適した圧縮処理を実現することを目的とする。 An object of one aspect is to realize compression processing suitable for image recognition processing by AI.

一態様によれば、解析装置は、
画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各領域の認識結果への影響度を示す情報を格納する格納部と、
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報に基づいて、前記画像データの各領域の圧縮レベルを決定する決定部とを有する。
According to one aspect, the analysis device comprises:
Recognition of each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed on image data at different compression levels. a storage unit for storing information indicating the degree of influence on the result;
a determination unit that determines the compression level of each region of the image data based on information indicating the degree of influence of each region of the decoded data corresponding to the different compression levels on the recognition result.

AIによる画像認識処理に適した圧縮処理を実現することができる。 Compression processing suitable for image recognition processing by AI can be realized.

図1は、圧縮処理システムのシステム構成の一例を示す第1の図である。FIG. 1 is a first diagram showing an example of the system configuration of a compression processing system. 図2は、解析装置または画像圧縮装置のハードウェア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of an analysis device or an image compression device; 図3は、解析装置の機能構成の一例を示す第1の図である。FIG. 3 is a first diagram illustrating an example of a functional configuration of an analysis device; 図4は、集計結果の具体例を示す図である。FIG. 4 is a diagram showing a specific example of the aggregate result. 図5は、量子化値決定部による処理の具体例を示す第1の図である。FIG. 5 is a first diagram showing a specific example of processing by the quantization value determination unit. 図6は、画像圧縮装置の機能構成の一例を示す第1の図である。FIG. 6 is a first diagram showing an example of the functional configuration of the image compression device. 図7は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第1のフローチャートである。FIG. 7 is a first flowchart showing an example of the flow of image compression processing by the compression processing system. 図8は、解析装置の機能構成の一例を示す第2の図である。FIG. 8 is a second diagram illustrating an example of the functional configuration of the analysis device; 図9は、量子化値決定部による処理の具体例を示す第2の図である。FIG. 9 is a second diagram showing a specific example of processing by the quantization value determination unit. 図10は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第2のフローチャートである。FIG. 10 is a second flowchart showing an example of the flow of image compression processing by the compression processing system. 図11は、解析装置の機能構成の一例を示す第3の図である。FIG. 11 is a third diagram illustrating an example of the functional configuration of the analysis device; 図12は、量子化値決定部による処理の具体例を示す第3の図である。FIG. 12 is a third diagram showing a specific example of processing by the quantization value determination unit. 図13は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第3のフローチャートである。FIG. 13 is a third flowchart showing an example of the flow of image compression processing by the compression processing system. 図14は、解析装置の機能構成の一例を示す第4の図である。FIG. 14 is a fourth diagram illustrating an example of the functional configuration of the analysis device; 図15は、量子化値設定部による処理の具体例を示す図である。FIG. 15 is a diagram illustrating a specific example of processing by the quantization value setting unit; 図16は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第4のフローチャートである。FIG. 16 is a fourth flowchart showing an example of the flow of image compression processing by the compression processing system. 図17は、量子化値決定部による処理の具体例を示す第4の図である。FIG. 17 is a fourth diagram showing a specific example of processing by the quantization value determination unit. 図18は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第5のフローチャートである。FIG. 18 is a fifth flowchart showing an example of the flow of image compression processing by the compression processing system. 図19は、量子化値決定部による処理の具体例を示す第5の図である。FIG. 19 is a fifth diagram showing a specific example of processing by the quantization value determination unit. 図20は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第6のフローチャートである。FIG. 20 is a sixth flowchart showing an example of the flow of image compression processing by the compression processing system. 図21は、解析装置の機能構成の一例を示す第5の図である。FIG. 21 is a fifth diagram illustrating an example of the functional configuration of the analysis device; 図22は、無効領域判定部による処理の具体例を示す図である。FIG. 22 is a diagram showing a specific example of processing by the invalid area determination unit. 図23は、無効化画像データの具体例を示す図である。FIG. 23 is a diagram showing a specific example of invalidation image data. 図24は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第7のフローチャートである。FIG. 24 is a seventh flowchart showing an example of the flow of image compression processing by the compression processing system. 図25は、解析装置の機能構成の一例を示す第6の図である。FIG. 25 is a sixth diagram illustrating an example of the functional configuration of the analysis device; 図26は、有効領域判定部による処理の具体例を示す図である。FIG. 26 is a diagram illustrating a specific example of processing by the effective area determination unit; 図27は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第8のフローチャートである。FIG. 27 is an eighth flowchart showing an example of the flow of image compression processing by the compression processing system. 図28は、解析装置の機能構成の一例を示す第7の図である。FIG. 28 is a seventh diagram showing an example of the functional configuration of the analysis device; 図29は、有効領域判定部による処理の具体例を示す第2の図である。FIG. 29 is a second diagram showing a specific example of processing by the valid area determination unit. 図30は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第9のフローチャートである。FIG. 30 is a ninth flowchart showing an example of the flow of image compression processing by the compression processing system.

以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。 Each embodiment will be described below with reference to the accompanying drawings. In the present specification and drawings, constituent elements having substantially the same functional configuration are denoted by the same reference numerals, thereby omitting redundant description.

[第1の実施形態]
<圧縮処理システムのシステム構成>
はじめに、第1の実施形態に係る解析装置を含む、圧縮処理システム全体のシステム構成について説明する。図1は、圧縮処理システムのシステム構成の一例を示す第1の図である。第1の実施形態において、圧縮処理システムが実行する処理は、圧縮レベル(量子化値)を決定するフェーズと、決定した圧縮レベル(量子化値)に基づいて圧縮処理を行うフェーズとに大別することができる。
[First embodiment]
<System configuration of compression processing system>
First, the system configuration of the entire compression processing system including the analysis device according to the first embodiment will be described. FIG. 1 is a first diagram showing an example of the system configuration of a compression processing system. In the first embodiment, the processing executed by the compression processing system is roughly divided into a phase of determining the compression level (quantization value) and a phase of performing compression processing based on the determined compression level (quantization value). can do.

図1において、1aは、圧縮レベル(量子化値)を決定するフェーズにおける圧縮処理システムのシステム構成を示しており、1bは、決定した圧縮レベル(量子化値)に基づいて圧縮処理を行うフェーズにおける圧縮処理システムのシステム構成を示している。 In FIG. 1, 1a shows the system configuration of the compression processing system in the phase of determining the compression level (quantization value), and 1b is the phase of performing compression processing based on the determined compression level (quantization value). 1 shows the system configuration of a compression processing system in .

図1の1aに示すように、圧縮レベル(量子化値)を決定するフェーズにおける圧縮処理システムには、撮像装置110、解析装置120、画像圧縮装置130が含まれる。 As shown in FIG. 1a, the compression processing system in the phase of determining the compression level (quantization value) includes an imaging device 110, an analysis device 120, and an image compression device .

撮像装置110は、所定のフレーム周期で撮影を行い、画像データを解析装置120に送信する。なお、画像データには、認識処理の対象となるオブジェクトが含まれる。 The image capturing device 110 captures images at predetermined frame intervals and transmits image data to the analysis device 120 . Note that the image data includes an object to be recognized.

解析装置120は、認識処理を行う学習済みモデルを有し、画像データまたは画像データに対して異なる圧縮レベルで圧縮処理が行われた場合の圧縮データを復号した復号データを、学習済みモデルに入力することで認識処理を行い、認識結果を出力する。 The analysis device 120 has a trained model that performs recognition processing, and inputs image data or decoded data obtained by decoding compressed data obtained when compression processing is performed on image data at different compression levels to the trained model. By doing so, recognition processing is performed and the recognition result is output.

また、解析装置120は、例えば、誤差逆伝播法を用いて学習済みモデルの動作解析を行うことで、認識結果への影響度を示すマップ(重要特徴マップと称す)を生成し、所定領域ごと(圧縮処理が行われる際に用いられるブロックごと)に影響度を集計する
なお、解析装置120では、異なる圧縮レベル(量子化値)での圧縮処理を画像圧縮装置130に指示し、それぞれの圧縮レベルで圧縮処理が行われた場合の圧縮データそれぞれについて、同様の処理を繰り返す。
In addition, the analysis device 120 generates a map (referred to as an important feature map) indicating the degree of influence on the recognition result by performing motion analysis of the trained model using, for example, the error backpropagation method, and for each predetermined region. In addition, the analysis device 120 instructs the image compression device 130 to perform compression processing at different compression levels (quantization values). Similar processing is repeated for each piece of compressed data when compression processing is performed at the level.

解析装置120は、異なる圧縮レベルでの圧縮処理を画像圧縮装置130に指示するごとに、各ブロックの影響度の集計値を算出し、各圧縮レベル(各量子化値)に対する、集計値の変化に基づいて、各ブロックの最適な圧縮レベル(量子化値)を決定する。なお、最適な圧縮レベル(量子化値)とは、画像データに含まれるオブジェクトを正しく認識処理することができる最大の圧縮レベル(量子化値)を指す。 Each time the analysis device 120 instructs the image compression device 130 to perform compression processing at a different compression level, the analysis device 120 calculates a total value of the degree of influence of each block, and changes the total value for each compression level (each quantization value). determines the optimal compression level (quantization value) for each block. The optimum compression level (quantization value) refers to the maximum compression level (quantization value) at which an object included in image data can be correctly recognized.

このように、学習済みモデルの動作解析を行い、認識結果への影響度を算出することで、解析装置120によれば、学習済みモデルによる画像認識処理に適した圧縮処理を行う際の、最適な圧縮レベルを決定することができる。 In this way, by analyzing the behavior of the trained model and calculating the degree of influence on the recognition result, the analysis device 120 can optimize compression processing suitable for image recognition processing using the trained model. compression level can be determined.

一方、図1の1bに示すように、決定した圧縮レベル(量子化値)に基づいて圧縮処理を行うフェーズにおける圧縮処理システムには、解析装置120、画像圧縮装置130、ストレージ装置140が含まれる。 On the other hand, as shown in 1b of FIG. 1, the compression processing system in the phase of performing compression processing based on the determined compression level (quantization value) includes an analysis device 120, an image compression device 130, and a storage device 140. .

解析装置120は、ブロックごとに決定した最適な圧縮レベル(量子化値)及び画像データを画像圧縮装置130に送信する。 The analysis device 120 transmits the optimum compression level (quantization value) determined for each block and the image data to the image compression device 130 .

画像圧縮装置130は、決定された最適な圧縮レベル(量子化値)を用いて画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。 The image compression device 130 compresses the image data using the determined optimum compression level (quantization value) and stores the compressed data in the storage device 140 .

このように、本実施形態に係る解析装置120では、学習済みモデルによる画像認識処理に適した圧縮レベルを用いる。つまり、本実施形態に係る解析装置120では、従来の圧縮処理に対して下記のような相違点を有することにより、学習済みモデルによる画像認識処理に適した圧縮処理を実現することができる。
・従来の圧縮処理は、そもそも、推論時に注目した特徴部分に基づいておらず(あくまで、人間の概念で把握できる形状、性質、関心対象等に基づいており)、推論時に注目した特徴部分(必ずしも人間の概念で境界分けできない特徴部分)が用いられることもない。
・従来の圧縮処理では、認識結果を出力する過程であるCNN部320の内部動作(例えば、画像データを入力してから認識結果が出力されるまでの信号/処理結果の伝播過程や、信号/処理結果の伝播強度)を解析することもない。
Thus, the analysis device 120 according to this embodiment uses a compression level suitable for image recognition processing using a trained model. In other words, the analyzing apparatus 120 according to the present embodiment can realize compression processing suitable for image recognition processing using a trained model by having the following differences from conventional compression processing.
・In the first place, conventional compression processing is not based on the feature part focused on inference (it is based on the shape, property, object of interest, etc. that can be grasped by human concepts), and the feature part focused on inference (not necessarily Characteristic parts that cannot be demarcated by human concepts) are not used.
・In conventional compression processing, the internal operation of the CNN unit 320, which is the process of outputting the recognition result (for example, the signal/processing result propagation process from inputting image data to outputting the recognition result, signal/ Propagation intensity of the processing result) is not analyzed.

<解析装置または画像圧縮装置のハードウェア構成>
次に、解析装置120及び画像圧縮装置130のハードウェア構成について説明する。なお、解析装置120と画像圧縮装置130とは、同様のハードウェア構成を有するため、ここでは、両装置の説明をまとめて図2を用いて行う。
<Hardware Configuration of Analysis Device or Image Compression Device>
Next, hardware configurations of the analysis device 120 and the image compression device 130 will be described. Note that since the analysis device 120 and the image compression device 130 have the same hardware configuration, the two devices will be collectively described here using FIG.

図2は、解析装置または画像圧縮装置のハードウェア構成の一例を示す図である。解析装置120または画像圧縮装置130は、プロセッサ201、メモリ202、補助記憶装置203、I/F(Interface)装置204、通信装置205、ドライブ装置206を有する。なお、解析装置120または画像圧縮装置130の各ハードウェアは、バス207を介して相互に接続されている。 FIG. 2 is a diagram illustrating an example of a hardware configuration of an analysis device or an image compression device; The analysis device 120 or the image compression device 130 has a processor 201 , a memory 202 , an auxiliary storage device 203 , an I/F (Interface) device 204 , a communication device 205 and a drive device 206 . Each piece of hardware of the analysis device 120 or the image compression device 130 is interconnected via a bus 207 .

プロセッサ201は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ201は、各種プログラム(例えば、後述する解析プログラムまたは画像圧縮プログラム等)をメモリ202上に読み出して実行する。 The processor 201 has various computing devices such as a CPU (Central Processing Unit) and a GPU (Graphics Processing Unit). The processor 201 reads out various programs (for example, an analysis program or an image compression program to be described later) onto the memory 202 and executes them.

メモリ202は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ201とメモリ202とは、いわゆるコンピュータを形成し、プロセッサ201が、メモリ202上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する(各種機能の詳細は後述する)。 The memory 202 has main storage devices such as ROM (Read Only Memory) and RAM (Random Access Memory). The processor 201 and the memory 202 form a so-called computer, and the processor 201 executes various programs read on the memory 202, thereby realizing various functions (details of the various functions will be described later).

補助記憶装置203は、各種プログラムや、各種プログラムがプロセッサ201によって実行される際に用いられる各種データを格納する。 The auxiliary storage device 203 stores various programs and various data used when the various programs are executed by the processor 201 .

I/F装置204は、外部装置の一例である操作装置210、表示装置220と、解析装置120または画像圧縮装置130とを接続する接続デバイスである。I/F装置204は、解析装置120または画像圧縮装置130に対する操作を、操作装置210を介して受け付ける。また、I/F装置204は、解析装置120または画像圧縮装置130による処理の結果を出力し、表示装置220を介して表示する。 The I/F device 204 is a connection device that connects the operation device 210 and the display device 220, which are examples of external devices, with the analysis device 120 or the image compression device 130. FIG. The I/F device 204 receives operations for the analysis device 120 or the image compression device 130 via the operation device 210 . The I/F device 204 also outputs the result of processing by the analysis device 120 or the image compression device 130 and displays it via the display device 220 .

通信装置205は、他の装置と通信するための通信デバイスである。解析装置120の場合、通信装置205を介して撮像装置110及び画像圧縮装置130と通信する。また、画像圧縮装置130の場合、通信装置205を介して解析装置120及びストレージ装置140と通信する。 A communication device 205 is a communication device for communicating with other devices. The analysis device 120 communicates with the imaging device 110 and the image compression device 130 via the communication device 205 . Also, in the case of the image compression device 130 , it communicates with the analysis device 120 and the storage device 140 via the communication device 205 .

ドライブ装置206は記録媒体230をセットするためのデバイスである。ここでいう記録媒体230には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体230には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。 A drive device 206 is a device for setting a recording medium 230 . The recording medium 230 here includes media for optically, electrically or magnetically recording information such as a CD-ROM, a flexible disk, a magneto-optical disk, and the like. The recording medium 230 may also include a semiconductor memory or the like that electrically records information, such as a ROM or flash memory.

なお、補助記憶装置203にインストールされる各種プログラムは、例えば、配布された記録媒体230がドライブ装置206にセットされ、該記録媒体230に記録された各種プログラムがドライブ装置206により読み出されることでインストールされる。あるいは、補助記憶装置203にインストールされる各種プログラムは、通信装置205を介してネットワークからダウンロードされることで、インストールされてもよい。 Various programs to be installed in the auxiliary storage device 203 are installed by, for example, setting the distributed recording medium 230 in the drive device 206 and reading the various programs recorded in the recording medium 230 by the drive device 206. be done. Alternatively, various programs installed in the auxiliary storage device 203 may be installed by being downloaded from the network via the communication device 205 .

<解析装置の機能構成>
次に、解析装置120の機能構成について説明する。図3は、解析装置の機能構成の一例を示す第1の図である。上述したように、解析装置120には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置120は、入力部310、CNN部320、量子化値設定部330、出力部340として機能する。また、解析装置120は、重要特徴マップ生成部350、集計部360、量子化値決定部370として機能する。
<Functional configuration of analysis device>
Next, the functional configuration of the analysis device 120 will be described. FIG. 3 is a first diagram illustrating an example of a functional configuration of an analysis device; As described above, the analysis program is installed in the analysis device 120, and when the program is executed, the analysis device 120 includes the input unit 310, the CNN unit 320, the quantization value setting unit 330, the output unit 340. The analysis device 120 also functions as an important feature map generation unit 350 , totalization unit 360 and quantization value determination unit 370 .

入力部310は、撮像装置110より送信される画像データ、または、画像圧縮装置130より送信される圧縮データを取得する。入力部310は、取得した画像データをCNN部320及び出力部340に通知するとともに、不図示の復号部を用いて、取得した圧縮データを復号し、復号データをCNN部320に通知する。 The input unit 310 acquires image data transmitted from the imaging device 110 or compressed data transmitted from the image compression device 130 . The input unit 310 notifies the CNN unit 320 and the output unit 340 of the obtained image data, decodes the obtained compressed data using a decoding unit (not shown), and notifies the CNN unit 320 of the decoded data.

CNN部320は、学習済みモデルを有し、画像データまたは復号データを入力することで、画像データまたは復号データに含まれるオブジェクトに対して認識処理を行い、認識結果を出力する。 The CNN unit 320 has a trained model, receives image data or decoded data, performs recognition processing on an object included in the image data or decoded data, and outputs a recognition result.

量子化値設定部330は、画像圧縮装置130が圧縮処理を行う際に用いる圧縮レベル(最小の量子化値(初期値)から最大の量子化値まで)を、順次、出力部340に通知するとともに、格納部の一例である集計結果格納部380に格納する。 The quantization value setting unit 330 sequentially notifies the output unit 340 of the compression levels (from the minimum quantization value (initial value) to the maximum quantization value) used when the image compression device 130 performs compression processing. Together with this, it is stored in the tally result storage unit 380, which is an example of a storage unit.

出力部340は、入力部310が取得した画像データを、画像圧縮装置130に送信する。また、量子化値設定部330より通知された各量子化値を、順次、画像圧縮装置130に送信する。更に、量子化値決定部370により決定された量子化値(決定量子化値)を、画像圧縮装置130に送信する。 The output unit 340 transmits the image data acquired by the input unit 310 to the image compression device 130 . Also, each quantization value notified from the quantization value setting unit 330 is sequentially transmitted to the image compression device 130 . Furthermore, the quantization value determined by the quantization value determination unit 370 (determined quantization value) is transmitted to the image compression device 130 .

重要特徴マップ生成部350はマップ生成部の一例であり、学習済みモデルが画像データまたは復号データに対して認識処理を行った際のCNN部構造情報を取得し、取得したCNN部構造情報に基づき誤差逆伝播法を利用することで、重要特徴マップを生成する。 The important feature map generation unit 350 is an example of a map generation unit, acquires CNN unit structure information when a trained model performs recognition processing on image data or decoded data, and based on the acquired CNN unit structure information A key feature map is generated by using the error backpropagation method.

重要特徴マップ生成部350では、例えば、BP(Back Propagation)法、GBP(Guided Back Propagation)法または選択的BP法を用いることで、重要特徴マップを生成する。 The important feature map generation unit 350 generates an important feature map by using, for example, a BP (Back Propagation) method, a GBP (Guided Back Propagation) method, or a selective BP method.

なお、BP法は、認識結果が正解ラベルとなる画像データ(または復号データ)に対して認識処理を行うことで得た分類確率から各ラベルの誤差を計算し、入力層まで逆伝播して得られる勾配の大小を画像化することで、特徴部分を可視化する方法である。また、GBP法は、勾配情報の正値のみを特徴部分として画像化することで、特徴部分を可視化する方法である。 In the BP method, the error of each label is calculated from the classification probability obtained by performing recognition processing on the image data (or decoded data) whose recognition result is the correct label. This is a method of visualizing the characteristic portion by imaging the magnitude of the gradient that is applied. The GBP method is a method of visualizing a characteristic portion by imaging only positive values of gradient information as a characteristic portion.

更に、選択的BP法は、正解ラベルの誤差のみを最大にしたうえで、BP法またはGBP法を用いて逆伝播する方法である。選択的BP法の場合、可視化される特徴部分は、正解ラベルのスコアのみに影響を与える特徴部分となる。 Furthermore, the selective BP method is a method of maximizing only the error of the correct label and then backpropagating using the BP method or the GBP method. In the selective BP method, the visualized features are those that affect only the score of the correct label.

このように、重要特徴マップ生成部350では、BP法、GBP法または選択的BP法を用いることで、画像データまたは復号データが入力されてから認識結果が出力されるまでのCNN部320内の各経路の信号の流れと強度とを解析する。これにより、重要特徴マップ生成部350によれば、入力された画像データまたは復号データのどの部分が、認識結果にどの程度影響を及ぼしているかを可視化することができる。したがって、例えば、CNN部320として、BP法、GBP法または選択的BP法を適用しない(または適用できない)AIが用いられる場合、重要特徴マップ生成部350では、同様の情報を解析することにより、重要特徴マップを生成する。 In this way, the important feature map generating unit 350 uses the BP method, the GBP method, or the selective BP method, so that the inside of the CNN unit 320 from the input of image data or decoded data to the output of the recognition result is Analyze the signal flow and strength of each path. As a result, the important feature map generator 350 can visualize which part of the input image data or decoded data affects the recognition result and to what degree. Therefore, for example, when an AI that does not apply (or cannot apply) the BP method, the GBP method, or the selective BP method is used as the CNN unit 320, the important feature map generation unit 350 analyzes similar information, Generate an important feature map.

なお、誤差逆伝播法による重要特徴マップの生成方法は、例えば、
「Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradient-based localization." The IEEE International Conference on Computer Vision (ICCV), 2017, pp. 618-626」、
等の文献に開示されている。
Note that the method of generating the important feature map by the error backpropagation method is, for example,
"Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradient-based localization." The IEEE International Conference on Computer Vision (ICCV), 2017, pp. 618-626",
et al.

集計部360は、重要特徴マップに基づいて、認識結果への影響度をブロック単位で集計し、ブロックごとの影響度の集計値を算出する。また、集計部360は、算出した各ブロックの集計値を、量子化値と対応付けて集計結果格納部380に格納する。 Aggregation unit 360 aggregates the degree of influence on the recognition result for each block based on the important feature map, and calculates the aggregate value of the degree of influence for each block. In addition, the totalization unit 360 stores the calculated totalized value of each block in the totalization result storage unit 380 in association with the quantized value.

量子化値決定部370は決定部の一例であり、集計結果格納部380に格納された、各ブロックの集計値(量子化値の数に応じた数の集計値)に基づいて、各ブロックにおける最適な量子化値を決定する。また、量子化値決定部370は、決定した各ブロックにおける最適な量子化値を出力部340に通知する。 The quantization value determination unit 370 is an example of a determination unit, and based on the total value of each block (the number of total values corresponding to the number of quantization values) stored in the total result storage unit 380, Determine the optimal quantization value. In addition, the quantization value determination unit 370 notifies the output unit 340 of the determined optimal quantization value for each block.

このように、解析装置120では、CNN部320が認識処理を行う際に重要となる特徴部分の、圧縮処理に伴う劣化(認識精度への影響)の許容の度合い(量子化値)を、人間の認知する概念ではなく、CNN部320の認知する概念を基準として算出する。 In this way, in the analysis device 120, the degree of tolerance (quantization value) of deterioration (effect on recognition accuracy) due to the compression processing of the characteristic portion that is important when the CNN unit 320 performs the recognition processing is determined by human is calculated based on the concept recognized by the CNN unit 320 rather than the concept recognized by the CNN unit 320 .

<集計結果の具体例>
次に、集計結果格納部380に格納された集計結果の具体例について説明する。図4は、集計結果の具体例を示す図である。このうち、4aは、画像データ410内のブロックの配置例を示している。4aに示すように、本実施形態では説明の簡略化のため、画像データ410内のブロックは全て同じ大きさであるとする。また、画像データの左上のブロックのブロック番号を"ブロック1"とし、右下のブロックのブロック番号を"ブロックm"とする。
<Specific example of aggregated results>
Next, a specific example of the tally result stored in the tally result storage unit 380 will be described. FIG. 4 is a diagram showing a specific example of the aggregate result. Among them, 4a shows an arrangement example of blocks in the image data 410. FIG. As shown in 4a, in this embodiment, all blocks in the image data 410 are assumed to have the same size for simplification of explanation. Also, let the block number of the upper left block of the image data be "block 1" and the block number of the lower right block be "block m".

4bに示すように、集計結果420には、情報の項目として、"ブロック番号"、"量子化値"とが含まれる。 As shown in 4b, the counting result 420 includes "block number" and "quantization value" as information items.

"ブロック番号"には、画像データ410内の各ブロックのブロック番号が格納される。"量子化値"には、画像圧縮装置130が圧縮処理を行わない場合を示す"圧縮なし"、及び、画像圧縮装置130が圧縮処理を行う際に用いる、最小の量子化値("Q")から最大の量子化値("Q")が格納される。“Block number” stores the block number of each block in the image data 410 . The "quantization value" includes "no compression" indicating that the image compression device 130 does not perform compression processing, and the minimum quantization value (" Q1 ") to the maximum quantized value ("Q n ") is stored.

また、"ブロック番号"と"量子化値"とにより特定される領域には、
・対応する量子化値を用いて画像データ410について圧縮処理を行い、
・取得した圧縮データを復号した復号データを入力することで、学習済みモデルが認識処理を行い、
・認識処理が行われた際に算出された重要特徴マップに基づいて、対応するブロックにおいて集計された、
集計値が格納される。
Also, in the area specified by "block number" and "quantization value",
- performing a compression process on the image data 410 using the corresponding quantized values;
・By inputting the decoded data obtained by decoding the acquired compressed data, the trained model performs recognition processing,
・Based on the important feature map calculated when recognition processing was performed, aggregated in the corresponding block,
Aggregate value is stored.

<量子化値決定部による処理の具体例>
次に、量子化値決定部370による処理の具体例について説明する。図5は、量子化値決定部による処理の具体例を示す第1の図である。図5において、グラフ510_1~510_mは、横軸に量子化値、縦軸に集計値をとり、集計結果420に含まれる各ブロックの集計値をプロットすることで生成したグラフである。
<Specific example of processing by the quantization value determination unit>
Next, a specific example of processing by the quantization value determination unit 370 will be described. FIG. 5 is a first diagram showing a specific example of processing by the quantization value determination unit. In FIG. 5, graphs 510_1 to 510_m are graphs generated by plotting the total values of each block included in the total result 420, with the horizontal axis representing the quantization value and the vertical axis representing the aggregate value.

なお、グラフ510_1~510_mの生成に用いられる各ブロックの集計値は、例えば、
・全ブロック共通のオフセット値を用いて調整されていてもよい。
・絶対値をとって集計されていてもよい。
・注目されていないブロックの集計値に基づいて、他のブロックの集計値が加工されていてもよい。
Note that the total value of each block used to generate the graphs 510_1 to 510_m is, for example,
- It may be adjusted using an offset value common to all blocks.
- The absolute value may be taken and aggregated.
- The aggregate values of other blocks may be processed based on the aggregate values of blocks that have not received attention.

グラフ510_1~510_mに示すように、最小の量子化値(Q)から最大の量子化値(Q)まで変化させた場合の集計値の変化は、ブロックごとに異なる。量子化値決定部370では、例えば、
・集計値の大きさが所定の閾値を超えた場合、あるいは、
・集計値の変化量が所定の閾値を超えた場合、あるいは、
・集計値の傾きが所定の閾値を超えた場合、あるいは、
・集計値の傾きの変化が所定の閾値を超えた場合、
のいずれかの条件を満たす場合に、各ブロックの最適な量子化値を決定する。
As shown in graphs 510_1 to 510_m, changes in aggregated values when changing from the minimum quantization value (Q 1 ) to the maximum quantization value (Q n ) differ for each block. In the quantization value determination unit 370, for example,
・When the size of the aggregated value exceeds a predetermined threshold, or
・If the amount of change in the aggregate value exceeds a predetermined threshold, or
・If the slope of the aggregate value exceeds a predetermined threshold, or
・If the change in the slope of the aggregate value exceeds a predetermined threshold,
Determine the optimum quantization value for each block if any of the conditions of are satisfied.

図5において符号530は、ブロック1~ブロックmの最適な量子化値として、BQ~BQが決定され、対応するブロックに設定された様子を示している。In FIG. 5, reference numeral 530 indicates how B 1 Q to B m Q are determined as the optimum quantization values for blocks 1 to m and set to the corresponding blocks.

なお、集計の際のブロックのサイズと圧縮処理に用いるブロックのサイズとは、一致していなくてもよい。その場合、量子化値決定部370では、例えば、以下のように量子化値を決定する。
・集計の際のブロックのサイズより、圧縮処理に用いるブロックのサイズの方が大きい場合
圧縮処理に用いるブロックに含まれる、集計の際の各ブロックの集計値に基づく量子化値の平均値(あるいは、最小値、最大値、その他の指標で加工した値)を、圧縮処理に用いる各ブロックの量子化値とする。
・集計の際のブロックのサイズより、圧縮処理に用いるブロックのサイズの方が小さい場合
集計の際のブロックに含まれる、圧縮処理に用いる各ブロックの量子化値として、集計の際のブロックの集計値に基づく量子化値を用いる。
It should be noted that the size of blocks used for aggregation and the size of blocks used for compression processing do not have to match. In that case, the quantization value determining section 370 determines the quantization value as follows, for example.
・When the size of the block used for compression processing is larger than the size of the block used for aggregation The average value of the quantization values (or , minimum value, maximum value, and values processed by other indexes) is used as the quantization value of each block used for compression processing.
・When the size of the block used for compression processing is smaller than the size of the block used for aggregation. Use value-based quantization values.

また、符号530に示す量子化値は、解析装置120にて追加評価してもよい。具体的には、まず、解析装置120にて、符号530に示す量子化値を用いて圧縮処理された圧縮データを復号し、復号データに対して認識処理を行う。続いて、解析装置120にて、符号530に示す量子化値のうち、最小値に対して量子化値を加算(例えば、1加算)し、符号530に示す量子化値を変更する。このとき、符号530に示す量子化値に、複数の最小値が存在する場合には、同様の加算を行う。 Also, the quantized value indicated by reference numeral 530 may be additionally evaluated by the analysis device 120 . Specifically, first, the analysis device 120 decodes the compressed data that has been compressed using the quantization value indicated by reference numeral 530, and performs recognition processing on the decoded data. Subsequently, the analysis device 120 adds the quantization value (for example, 1 addition) to the minimum value among the quantization values indicated by reference numeral 530 to change the quantization value indicated by reference numeral 530 . At this time, if there are a plurality of minimum values among the quantized values indicated by reference numeral 530, similar addition is performed.

続いて、解析装置120では、変更した符号530に示す量子化値を用いて圧縮処理された圧縮データを復号し、復号データに対して認識処理を行う。 Subsequently, the analysis device 120 decodes the compressed data compressed using the changed quantization value indicated by reference numeral 530, and performs recognition processing on the decoded data.

解析装置120では、これらの処理を、符号530に示す量子化値のうちの最大値に等しくなるまで繰り返し、変更した符号530に示す量子化値と、対応する認識結果との組を複数取得する。 In the analysis device 120, these processes are repeated until the maximum value of the quantized values indicated by reference numeral 530 is reached, and a plurality of sets of the changed quantized values indicated by reference numeral 530 and the corresponding recognition results are acquired. .

続いて、解析装置120では、複数の組の中から、認識精度が許容下限を上回る組であって、量子化値の最小値が最大となる組を選択し、選択した組に含まれる、変更した符号530に示す量子化値を用いて、(変更前の)符号530に示す量子化値を置き換える。 Subsequently, the analysis device 120 selects a set whose recognition accuracy exceeds the allowable lower limit from among the plurality of sets and whose minimum quantization value is the maximum, and the selected set includes a change The quantized value indicated by reference numeral 530 is used to replace the quantized value indicated by reference numeral 530 (before change).

このように、符号530に示す量子化値を追加評価することで、符号530に示す量子化値よりも更に圧縮率の高い量子化値を決定することができる。 By additionally evaluating the quantized value indicated by reference numeral 530 in this manner, a quantized value with a higher compression rate than the quantized value indicated by reference numeral 530 can be determined.

<画像圧縮装置の機能構成>
次に、画像圧縮装置130の機能構成について説明する。図6は、画像圧縮装置の機能構成の一例を示す第1の図である。上述したように、画像圧縮装置130には、画像圧縮プログラムがインストールされており、当該プログラムが実行されることで、画像圧縮装置130は、符号化部620として機能する。
<Functional Configuration of Image Compression Apparatus>
Next, the functional configuration of the image compression device 130 will be described. FIG. 6 is a first diagram showing an example of the functional configuration of the image compression device. As described above, the image compression program is installed in the image compression device 130 , and the image compression device 130 functions as the encoding unit 620 by executing the program.

符号化部620は圧縮部の一例である。符号化部620は、差分部621、直交変換部622、量子化部623、エントロピ符号化部624、逆量子化部625、逆直交変換部626を有する。また、符号化部620は、加算部627、バッファ部628、ループ内フィルタ部629、フレームバッファ部630、画面内予測部631、画面間予測部632を有する。 The encoder 620 is an example of a compressor. The coding section 620 has a difference section 621 , an orthogonal transformation section 622 , a quantization section 623 , an entropy coding section 624 , an inverse quantization section 625 and an inverse orthogonal transformation section 626 . The encoding unit 620 also has an addition unit 627 , a buffer unit 628 , an in-loop filter unit 629 , a frame buffer unit 630 , an intra-screen prediction unit 631 and an inter-screen prediction unit 632 .

差分部621は、画像データ(例えば、画像データ410)と予測画像データとの差分を算出し、予測残差信号を出力する。 A difference unit 621 calculates a difference between image data (for example, the image data 410) and predicted image data, and outputs a prediction residual signal.

直交変換部622は、差分部621により出力された予測残差信号に対して、直交変換処理を実行する。 The orthogonal transform section 622 performs orthogonal transform processing on the prediction residual signal output from the difference section 621 .

量子化部623は、直交変換処理された予測残差信号を量子化し、量子化信号を生成する。量子化部623では、符号530に示す量子化値(解析装置120より送信された量子化値または決定された最適な量子化値)を用いて量子化信号を生成する。 A quantization unit 623 quantizes the orthogonally transformed prediction residual signal to generate a quantized signal. The quantization section 623 generates a quantized signal using the quantized value indicated by reference numeral 530 (the quantized value transmitted from the analysis device 120 or the determined optimum quantized value).

エントロピ符号化部624は、量子化信号に対してエントロピ符号化処理を行うことで、圧縮データを生成する。 The entropy coding unit 624 generates compressed data by performing entropy coding processing on the quantized signal.

逆量子化部625は、量子化信号を逆量子化する。逆直交変換部626は、逆量子化された量子化信号に対して、逆直交変換処理を実行する。 An inverse quantization unit 625 inversely quantizes the quantized signal. The inverse orthogonal transform unit 626 performs inverse orthogonal transform processing on the inversely quantized quantized signal.

加算部627は、逆直交変換部626より出力された信号と、予測画像データとを加算することで、参照画像データを生成する。バッファ部628は、加算部627により生成された参照画像データを格納する。 The addition unit 627 adds the signal output from the inverse orthogonal transformation unit 626 and the predicted image data to generate reference image data. A buffer unit 628 stores the reference image data generated by the addition unit 627 .

ループ内フィルタ部629は、バッファ部628に格納された参照画像データに対してフィルタ処理を行う。ループ内フィルタ部629には、
・デブロッキングフィルタ(Deblocking filter:DB)、
・サンプルアダプティブオフセットフィルタ(Sample Adaptive Offset filter:SAO)、
・適応ループフィルタ(Adaptive loop filter:ALF)、
が含まれる。
The in-loop filter unit 629 filters the reference image data stored in the buffer unit 628 . The in-loop filter unit 629 includes
- Deblocking filter (DB),
・Sample Adaptive Offset filter (SAO),
- Adaptive loop filter (ALF),
is included.

フレームバッファ部630は、ループ内フィルタ部629によりフィルタ処理が行われた参照画像データをフレーム単位で格納する。 The frame buffer unit 630 stores the reference image data filtered by the in-loop filter unit 629 in units of frames.

画面内予測部631は、参照画像データに基づいて画面内予測を行い、予測画像データを生成する。画面間予測部632は、入力された画像データ(例えば、画像データ410)と参照画像データとを用いてフレーム間で動き補償を行い、予測画像データを生成する。 The intra-screen prediction unit 631 performs intra-screen prediction based on the reference image data to generate predicted image data. The inter-screen prediction unit 632 performs motion compensation between frames using the input image data (for example, image data 410) and reference image data to generate predicted image data.

なお、画面内予測部631または画面間予測部632により生成された予測画像データは、差分部621及び加算部627に出力される。 Note that the predicted image data generated by the intra-screen prediction unit 631 or the inter-screen prediction unit 632 is output to the difference unit 621 and addition unit 627 .

なお、上記説明では、符号化部620が、MPEG-2、MPEG-4、H.264、HEVCなどの既存の動画符号化方式を用いて圧縮処理を行うものとした。しかしながら、符号化部620による圧縮処理は、これらの動画符号化方式に限定されず、量子化等のパラメータにより圧縮率を制御する任意の符号化方式を用いて行われてもよい。 Note that in the above description, the encoding unit 620 uses MPEG-2, MPEG-4, H.264, and MPEG-2. It is assumed that compression processing is performed using an existing moving picture encoding method such as H.264 and HEVC. However, the compression processing by the encoding unit 620 is not limited to these moving image encoding methods, and may be performed using any encoding method that controls the compression rate by parameters such as quantization.

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図7は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第1のフローチャートである。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 7 is a first flowchart showing an example of the flow of image compression processing by the compression processing system.

ステップS701において、量子化値設定部330は、圧縮レベルを初期化する(最小の量子化値(Q)を設定する)とともに、圧縮レベルの上限を設定する(最大の量子化値(Q)を設定する)。In step S701, the quantization value setting unit 330 initializes the compression level (sets the minimum quantization value (Q 1 )) and sets the upper limit of the compression level (maximum quantization value (Q n )).

ステップS702において、入力部310は画像データまたは圧縮データをフレーム単位で取得する。また、入力部310は、圧縮データを取得した場合にあっては、取得した圧縮データを復号し、復号データを生成する。 In step S702, the input unit 310 acquires image data or compressed data in units of frames. Further, when the input unit 310 acquires compressed data, it decodes the acquired compressed data to generate decoded data.

ステップS703において、CNN部320は、画像データ(または復号データ)に対して認識処理を行い、認識結果を出力する。 In step S703, the CNN unit 320 performs recognition processing on image data (or decoded data) and outputs recognition results.

ステップS704において、重要特徴マップ生成部350は、CNN部構造情報に基づいて、各領域の認識結果への影響度を示す重要特徴マップを生成する。 In step S704, the important feature map generator 350 generates an important feature map indicating the degree of influence of each region on the recognition result based on the CNN structure information.

ステップS705において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。また、集計部360は、集計結果を、現在の圧縮レベル(量子化値)と対応付けて、集計結果格納部380に格納する。 In step S705, the tabulation unit 360 tabulates the degree of influence of each region on a block-by-block basis based on the important feature map. Also, the counting unit 360 stores the counting result in the counting result storage unit 380 in association with the current compression level (quantization value).

ステップS706において、出力部340は画像データと、現在の圧縮レベル(量子化値)とを画像圧縮装置130に送信する。また、画像圧縮装置130は、送信された画像データを、現在の圧縮レベル(量子化値)で圧縮処理を行い、圧縮データを生成する。 In step S<b>706 , the output unit 340 transmits the image data and the current compression level (quantization value) to the image compression device 130 . Also, the image compression device 130 compresses the transmitted image data at the current compression level (quantization value) to generate compressed data.

ステップS707において、量子化値設定部330は、圧縮レベルを上げる(ここでは、量子化値(Q)を設定する)。In step S707, the quantization value setting unit 330 increases the compression level (here, sets the quantization value (Q 2 )).

ステップS708において、量子化値決定部370は、現在の圧縮レベルが上限を超えたか否か(現在の量子化値が、最大の量子化値(Q)を超えたか否か)を判定する。ステップS708において、現在の圧縮レベルが上限を超えていないと判定した場合には(ステップS708においてNoの場合には)、ステップS702に戻る。In step S708, the quantization value determination unit 370 determines whether the current compression level has exceeded the upper limit (whether the current quantization value has exceeded the maximum quantization value (Q n )). If it is determined in step S708 that the current compression level does not exceed the upper limit (No in step S708), the process returns to step S702.

この場合、ステップS702では、ステップS706において生成された圧縮データを取得し、取得した圧縮データを復号した復号データに対して、ステップS703からステップS707の処理を行う。 In this case, in step S702, the compressed data generated in step S706 is acquired, and the process of steps S703 to S707 is performed on the decoded data obtained by decoding the acquired compressed data.

一方、ステップS708において、現在の圧縮レベルが上限を超えたと判定した場合には、ステップS708においてYesの場合には)、ステップS709に進む。 On the other hand, if it is determined in step S708 that the current compression level has exceeded the upper limit (if Yes in step S708), the process proceeds to step S709.

ステップS709において、量子化値決定部370は、集計結果格納部380に格納された集計結果に基づいて、ブロック単位で最適な圧縮レベル(最適な量子化値)を決定する。また、出力部340は、決定された最適な量子化値を画像圧縮装置130に送信する。 In step S<b>709 , the quantization value determination unit 370 determines the optimum compression level (optimum quantization value) for each block based on the totalization result stored in the totalization result storage unit 380 . Also, the output unit 340 transmits the determined optimal quantization value to the image compression device 130 .

ステップS710において、画像圧縮装置130は、決定された最適な量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。 In step S<b>710 , the image compression device 130 performs compression processing on the image data using the determined optimum quantization value, and stores the compressed data in the storage device 140 .

以上の説明から明らかなように、第1の実施形態に係る解析装置は、画像データに対して異なる量子化値を用いて圧縮処理を行った場合の各圧縮データを取得する。また、第1の実施形態に係る解析装置は、各圧縮データを復号した復号データを学習済みモデルに入力し、認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第1の実施形態に係る解析装置は、重要特徴マップに基づいて影響度をブロック単位で集計し、異なる圧縮レベルに対応する、各ブロックの集計値に基づいて、画像データの各ブロックの圧縮レベルを決定する。 As is clear from the above description, the analysis apparatus according to the first embodiment acquires each piece of compressed data when compression processing is performed on image data using different quantization values. Further, the analysis device according to the first embodiment inputs decoded data obtained by decoding each compressed data to a trained model, and based on the CNN unit structure information when recognition processing is performed, the degree of influence on the recognition result Generate a key feature map showing Further, the analysis device according to the first embodiment aggregates the degree of influence for each block based on the important feature map, and calculates the degree of influence of each block of the image data based on the aggregated value of each block corresponding to different compression levels. Determine compression level.

これにより、第1の実施形態によれば、認識結果への影響度に基づいて決定した最適な量子化値を用いて圧縮処理を行うことができる。つまり、第1の実施形態によれば、AIによる画像認識処理に適した圧縮処理を実現することができる。 Thus, according to the first embodiment, compression processing can be performed using the optimum quantization value determined based on the degree of influence on the recognition result. That is, according to the first embodiment, compression processing suitable for image recognition processing by AI can be realized.

[第2の実施形態]
上記第1の実施形態では、認識結果への影響度に基づいて最適な量子化値を決定するにあたり、画像圧縮装置130に設定可能な最小の量子化値から最大の量子化値まで全てを用いるものとして説明した。
[Second embodiment]
In the above-described first embodiment, all values from the minimum quantization value to the maximum quantization value that can be set in the image compression device 130 are used in determining the optimum quantization value based on the degree of influence on the recognition result. described as a thing.

これに対して、第2の実施形態では、所定の量子化値を用いて圧縮処理を行うことで、最適な量子化値を決定する場合について説明する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。 On the other hand, in the second embodiment, a case will be described in which an optimal quantization value is determined by performing compression processing using a predetermined quantization value. The second embodiment will be described below, focusing on differences from the first embodiment.

<解析装置の機能構成>
はじめに、第2の実施形態に係る解析装置120の機能構成について説明する。図8は、解析装置の機能構成の一例を示す第2の図である。図3に示した機能構成との相違点は、量子化値設定部330に代えて最大量子化値設定部810が含まれる点、及び、量子化値決定部820の機能が、量子化値決定部370の機能とは異なる点である。また、解析装置120が、集計結果格納部380に代えて、グループ情報格納部830を有する点である。
<Functional configuration of analysis device>
First, the functional configuration of an analysis device 120 according to the second embodiment will be described. FIG. 8 is a second diagram illustrating an example of the functional configuration of the analysis device; The difference from the functional configuration shown in FIG. This is a point different from the function of the unit 370 . Another difference is that the analysis device 120 has a group information storage unit 830 instead of the tally result storage unit 380 .

最大量子化値設定部810は、最大の量子化値(Q)を、出力部340に通知する。量子化値決定部820は、格納部の一例であるグループ情報格納部830に格納されたグループ情報から、集計部360より通知された各ブロックの集計値が属するグループを判定する。また、量子化値決定部820は、判定したグループに予め対応付けられた最適な量子化値を、出力部340に通知する。Maximum quantization value setting section 810 notifies output section 340 of the maximum quantization value (Q n ). The quantization value determination unit 820 determines the group to which the aggregate value of each block notified by the aggregation unit 360 belongs from the group information stored in the group information storage unit 830, which is an example of the storage unit. In addition, quantization value determination section 820 notifies output section 340 of the optimum quantization value associated in advance with the determined group.

<量子化値決定部による処理の具体例>
次に、量子化値決定部820による処理の具体例について説明する。図9は、量子化値決定部による処理の具体例を示す第2の図である。
<Specific example of processing by the quantization value determination unit>
Next, a specific example of processing by the quantization value determination unit 820 will be described. FIG. 9 is a second diagram showing a specific example of processing by the quantization value determination unit.

図9に示すように、グループ情報910には、最小の量子化値から最大の量子化値まで変化させた場合の集計値の典型的な複数のパターン(図9の例では、グラフ911~913に示す3つのパターン)を含むグループが規定されている。また、グループ情報910には、グループごとに、最適な量子化値が規定されている。図13の例は、
・グループ1に、最適な量子化値GQが、
・グループ2に、最適な量子化値GQが、
・グループ3に、最適な量子化値GQが、
それぞれ対応付けられていることを示している。
As shown in FIG. 9, group information 910 includes a plurality of typical patterns of total values when changing from the minimum quantized value to the maximum quantized value (graphs 911 to 913 in the example of FIG. A group containing three patterns shown in ) is defined. Also, the group information 910 defines an optimum quantization value for each group. The example in FIG. 13 is
- For group 1, the optimal quantization value G 1 Q is
- For group 2, the optimal quantization value G 2 Q is
- For group 3, the optimal quantization value G 3 Q is
It indicates that they are associated with each other.

量子化値決定部820では、集計部360から、最大の量子化値(Q)を用いて画像データに対して圧縮処理が行われた場合の圧縮データを復号した復号データについて、認識処理が行われることで算出された、各ブロックの集計値を取得する。また、量子化値決定部820では、各ブロックの集計値がいずれのグループの属するかを判定する。In the quantization value determination unit 820, recognition processing is performed on the decoded data obtained by decoding the compressed data when the image data is compressed using the maximum quantization value (Q n ) from the counting unit 360. Get the total value of each block, calculated by what is done. Also, the quantization value determination unit 820 determines to which group the total value of each block belongs.

更に、量子化値決定部820では、判定したグループに対応付けられた量子化値を、各ブロックの最適な量子化値として、出力部340に通知する。 Furthermore, the quantization value determination unit 820 notifies the output unit 340 of the quantization value associated with the determined group as the optimum quantization value for each block.

なお、図9の例では、グループ情報910を1種類のみ示したが、グループ情報は複数種類あってもよい。例えば、認識処理の対象となるオブジェクトの種類ごとに異なるグループ情報を用意してもよい。あるいは、画像データの複雑度ごとに異なるグループ情報を用意してもよい。 Although only one type of group information 910 is shown in the example of FIG. 9, there may be multiple types of group information. For example, different group information may be prepared for each type of object to be recognized. Alternatively, different group information may be prepared for each complexity of image data.

また、図9の例では、グループ情報910がグラフ911~913を含むものとして説明したが、近似関数や深層学習等のモデルを含んでいてもよい。 In the example of FIG. 9, the group information 910 includes graphs 911 to 913, but may include approximate functions, deep learning models, and the like.

また、図9の例では、グループを判定するにあたり、最大の量子化値(Q)を用いたが、最大の量子化値(Q)を含む複数の量子化値、あるいは、最大の量子化値(Q)を含まない複数の量子化値を用いてもよい。In addition, in the example of FIG. 9, the maximum quantization value (Q n ) is used to determine the group. Multiple quantization values may be used that do not include the quantization value (Q n ).

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図10は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第2のフローチャートである。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 10 is a second flowchart showing an example of the flow of image compression processing by the compression processing system.

ステップS1001において、最大量子化値設定部810は、最大圧縮レベル(最大の量子化値(Q))を設定する。In step S1001, maximum quantization value setting section 810 sets the maximum compression level (maximum quantization value (Q n )).

ステップS1002において、入力部310は画像データをフレーム単位で取得する。 In step S1002, the input unit 310 acquires image data on a frame-by-frame basis.

ステップS1003において、出力部340は、画像データと最大圧縮レベル(最大の量子化値(Q))とを画像圧縮装置130に送信する。また、画像圧縮装置130は、送信された画像データに対して、最大圧縮レベル(最大の量子化値(Q))で圧縮処理を行い、圧縮データを生成する。In step S<b>1003 , the output unit 340 transmits the image data and the maximum compression level (maximum quantization value (Q n )) to the image compression device 130 . The image compression device 130 also performs compression processing on the transmitted image data at the maximum compression level (maximum quantization value (Q n )) to generate compressed data.

ステップS1004において、入力部310は、画像圧縮装置130により生成された圧縮データを取得し、復号する。また、CNN部320は、復号データに対して認識処理を行い、認識結果を出力する。 In step S<b>1004 , the input unit 310 acquires and decodes the compressed data generated by the image compression device 130 . Also, the CNN unit 320 performs recognition processing on the decoded data and outputs the recognition result.

ステップS1005において、重要特徴マップ生成部350は、CNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。 In step S1005, the important feature map generator 350 generates an important feature map indicating the degree of influence on the recognition result based on the CNN structure information.

ステップS1006において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。また、集計部360は、集計結果を、量子化値決定部820に通知する。 In step S1006, the tabulation unit 360 tabulates the degree of influence of each region on a block-by-block basis based on the important feature map. Aggregation unit 360 also notifies quantization value determination unit 820 of the aggregation result.

ステップS1007において、量子化値決定部820は、グループ情報格納部830に格納されたグループ情報を参照し、集計部360より通知された各ブロックの集計値が、いずれのグループに属するかを判定する。これにより、量子化値決定部820は、各ブロックをグループ分けする。 In step S1007, the quantization value determination unit 820 refers to the group information stored in the group information storage unit 830, and determines to which group the total value of each block notified by the totalization unit 360 belongs. . Accordingly, the quantization value determination unit 820 groups each block.

ステップS1008において、量子化値決定部1220は、ブロックごとに判定したグループそれぞれに対応付けられた最適な量子化値を、各ブロックの最適な量子化値として決定する。また、出力部340は、決定された最適な量子化値を画像圧縮装置130に送信する。 In step S1008, the quantization value determination unit 1220 determines the optimum quantization value associated with each group determined for each block as the optimum quantization value for each block. Also, the output unit 340 transmits the determined optimal quantization value to the image compression device 130 .

ステップS1009において、画像圧縮装置130は、決定された最適な量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。 In step S<b>1009 , the image compression device 130 performs compression processing on the image data using the determined optimal quantization value, and stores the compressed data in the storage device 140 .

以上の説明から明らかなように、第2の実施形態に係る解析装置は、画像データに対して最大の量子化値を用いて圧縮処理を行った場合の圧縮データを取得する。また、第2の実施形態に係る解析装置は、圧縮データを復号した復号データを学習済みモデルに入力して認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第2の実施形態に係る解析装置は、重要特徴マップに基づいて影響度をブロック単位で集計し、集計値が属するグループを判定することで、グループに対応付けられた量子化値を、最適な量子化値として決定する。 As is clear from the above description, the analysis apparatus according to the second embodiment acquires compressed data when compression processing is performed on image data using the maximum quantization value. Further, the analysis device according to the second embodiment determines the degree of influence on the recognition result based on the CNN structure information when the decoded data obtained by decoding the compressed data is input to the trained model and the recognition process is performed. Generate a key feature map shown. Further, the analysis device according to the second embodiment aggregates the degree of influence for each block based on the important feature map, and determines the group to which the aggregated value belongs, so that the quantized value associated with the group is Determine the optimum quantization value.

これにより、第2の実施形態によれば、認識結果への影響度に基づいて決定した最適な量子化値を用いて圧縮処理を行うことができる。つまり、第2の実施形態によれば、上記第1の実施形態と同様の効果を奏する。加えて、第2の実施形態によれば、上記第1の実施形態と比較して、より少ない圧縮処理回数で、最適な量子化値を決定することができる。 Thus, according to the second embodiment, compression processing can be performed using the optimum quantization value determined based on the degree of influence on the recognition result. That is, according to the second embodiment, the same effects as those of the first embodiment are obtained. In addition, according to the second embodiment, it is possible to determine the optimum quantization value with a smaller number of compression processes than in the first embodiment.

[第3の実施形態]
上記第2の実施形態では、集計値が属するグループを判定するにあたり、最大の量子化値を用いて圧縮処理を行った場合の圧縮データを復号した復号データに対して認識処理を行うものとして説明した。これに対して、第3の実施形態では、最大の量子化値を用いて圧縮処理を行うのと、同等の効果を有する画像処理を行うことで、疑似的な圧縮データ(疑似圧縮データ)を生成し、当該疑似圧縮データに対して認識処理を行う。これにより、第3の実施形態によれば、第2の実施形態と比較して、更に少ない圧縮処理回数で、最適な量子化値を決定することができる。以下、第3の実施形態について、上記第2の実施形態との相違点を中心に説明する。
[Third Embodiment]
In the above-described second embodiment, in determining the group to which the aggregated value belongs, it is assumed that the recognition process is performed on the decoded data obtained by decoding the compressed data when the compression process is performed using the maximum quantized value. bottom. In contrast, in the third embodiment, pseudo-compressed data (pseudo-compressed data) is generated by performing image processing having the same effect as compression processing using the maximum quantization value. Then, recognition processing is performed on the pseudo-compressed data. As a result, according to the third embodiment, the optimal quantization value can be determined with a smaller number of compression processes than in the second embodiment. The third embodiment will be described below, focusing on differences from the second embodiment.

<解析装置の機能構成>
はじめに、第3の実施形態に係る解析装置120の機能構成について説明する。図11は、解析装置の機能構成の一例を示す第3の図である。図8に示した機能構成との相違点は、最大量子化値設定部810が含まれていない点、及び、画像処理部1110が含まれている点である。
<Functional configuration of analysis device>
First, the functional configuration of an analysis device 120 according to the third embodiment will be described. FIG. 11 is a third diagram illustrating an example of the functional configuration of the analysis device; The difference from the functional configuration shown in FIG. 8 is that the maximum quantization value setting section 810 is not included and the image processing section 1110 is included.

画像処理部1110は、入力部310により取得された画像データに対して、例えば、ローパスフィルタを用いてフィルタリング処理を行う。これにより、画像処理部1110では、画像データに対して最大の量子化値を用いて圧縮処理を行うのと同様の効果を有する疑似圧縮データを生成する。 The image processing unit 1110 performs filtering processing on the image data acquired by the input unit 310 using, for example, a low-pass filter. As a result, the image processing unit 1110 generates pseudo-compressed data having the same effect as compressing image data using the maximum quantization value.

また、画像処理部1110は、生成した疑似圧縮データをCNN部320に入力する。これにより、CNN部320では、疑似圧縮データに対して認識処理を行い、重要特徴マップ生成部350では、CNN部構造情報に基づいて重要特徴マップを生成する。更に、集計部360では、重要特徴マップをブロック単位で集計し、量子化値決定部820では、グループ情報格納部830に格納されたグループ情報から、各ブロックの集計値が属するグループを判定することで、最適な量子化値を出力部340に通知する。 Also, the image processing unit 1110 inputs the generated pseudo-compressed data to the CNN unit 320 . As a result, the CNN unit 320 performs recognition processing on the pseudo-compressed data, and the important feature map generation unit 350 generates an important feature map based on the CNN structure information. Furthermore, the aggregation unit 360 aggregates the important feature map for each block, and the quantization value determination unit 820 determines the group to which the aggregation value of each block belongs from the group information stored in the group information storage unit 830. , the optimum quantization value is notified to the output unit 340 .

<量子化値決定部による処理の具体例>
次に、量子化値決定部820による処理の具体例について説明する。図12は、量子化値決定部による処理の具体例を示す第3の図である。図9との相違点は、量子化値決定部820が、ローパスフィルタを用いてフィルタリング処理された疑似圧縮データに対して、認識処理が行われた場合の、各ブロックの集計値を取得する点である。
<Specific example of processing by the quantization value determination unit>
Next, a specific example of processing by the quantization value determination unit 820 will be described. FIG. 12 is a third diagram showing a specific example of processing by the quantization value determination unit. The difference from FIG. 9 is that the quantization value determination unit 820 acquires the total value of each block when recognition processing is performed on pseudo-compressed data filtered using a low-pass filter. is.

なお、量子化値決定部820は、取得した各ブロックの集計値に基づいて、各ブロックがいずれのグループの属するかを判定し、判定したグループに対応付けられた最適な量子化値を、各ブロックの最適な量子化値として、出力部340に通知する。 Note that quantization value determination section 820 determines which group each block belongs to based on the obtained aggregated value of each block, and assigns the optimum quantization value associated with the determined group to each The output unit 340 is notified as the optimum quantized value of the block.

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図13は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第3のフローチャートである。なお、図10に示した第2のフローチャートとの相違点は、ステップS1001の処理を含まない点と、ステップS1003及びS1004に代えてステップS1301及びS1302の処理を含む点である。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 13 is a third flowchart showing an example of the flow of image compression processing by the compression processing system. The difference from the second flowchart shown in FIG. 10 is that the process of step S1001 is not included, and that the processes of steps S1301 and S1302 are included instead of steps S1003 and S1004.

ステップS1301において、画像処理部1110は、ローパスフィルタを用いたフィルタリング処理により、疑似画像データを生成し、CNN部320に入力する。 In step S<b>1301 , the image processing unit 1110 generates pseudo image data by filtering using a low-pass filter, and inputs the pseudo image data to the CNN unit 320 .

ステップS1302において、入力部310は、疑似画像データを取得し、CNN部320は、取得された疑似画像データに対して認識処理を行い、認識結果を出力する。 In step S1302, the input unit 310 acquires pseudo image data, the CNN unit 320 performs recognition processing on the acquired pseudo image data, and outputs a recognition result.

以上の説明から明らかなように、第3の実施形態に係る解析装置は、画像データに対してフィルタリング処理を行い、疑似圧縮データを取得する。また、第3の実施形態に係る解析装置は、疑似圧縮データを学習済みモデルに入力して認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第3の実施形態に係る解析装置は、重要特徴マップに基づいて影響度をブロック単位で集計し、集計値が属するグループを判定することで、グループに対応付けられた量子化値を、最適な量子化値として決定する。 As is clear from the above description, the analysis apparatus according to the third embodiment performs filtering processing on image data to acquire pseudo-compressed data. Further, the analysis apparatus according to the third embodiment provides an important feature map indicating the degree of influence on the recognition result based on the CNN part structure information when the pseudo-compressed data is input to the trained model and the recognition process is performed. to generate Further, the analysis apparatus according to the third embodiment aggregates the degree of impact for each block based on the important feature map, and determines the group to which the aggregated value belongs, so that the quantized value associated with the group is Determine the optimum quantization value.

これにより、第3の実施形態によれば、認識結果への影響度に基づいて決定した最適な量子化値を用いて圧縮処理を行うことができる。つまり、第3の実施形態によれば、上記第1の実施形態と同様の効果を奏する。加えて、第3の実施形態によれば、上記第1及び第2の実施形態と比較して、より少ない圧縮処理回数で、最適な量子化値を決定することができる。 Thus, according to the third embodiment, compression processing can be performed using the optimum quantization value determined based on the degree of influence on the recognition result. That is, according to the third embodiment, the same effects as those of the first embodiment are obtained. In addition, according to the third embodiment, the optimal quantization value can be determined with a smaller number of compression processes than the first and second embodiments.

[第4の実施形態]
上記第1の実施形態では、フレーム単位の画像データが1枚入力されるごとに、異なる量子化値を用いて圧縮処理を行い、最適な量子化値を決定するものとして説明した。これに対して、第4の実施形態では、フレーム単位の画像データが複数枚入力される間に、異なる量子化値を用いて圧縮処理を行い、最適な量子化値を決定する。以下、第4の実施形態について、上記第1の実施形態との相違点を中心に説明する。
[Fourth embodiment]
In the first embodiment, the compression process is performed using a different quantization value each time image data in units of frames is input, and the optimum quantization value is determined. In contrast, in the fourth embodiment, compression processing is performed using different quantization values while a plurality of frames of image data are input, and the optimum quantization value is determined. The fourth embodiment will be described below, focusing on differences from the first embodiment.

<解析装置の機能構成>
はじめに、第4の実施形態に係る解析装置120の機能構成について説明する。図14は、解析装置の機能構成の一例を示す第4の図である。図3に示した機能構成との相違点は、位置判定部1410が含まれる点、量子化値設定部1420の機能が、量子化値設定部330の機能とは異なる点、量子化値決定部370及び集計結果格納部380が含まれていない点である。
<Functional configuration of analysis device>
First, the functional configuration of an analysis device 120 according to the fourth embodiment will be described. FIG. 14 is a fourth diagram illustrating an example of the functional configuration of the analysis device; The difference from the functional configuration shown in FIG. 370 and the tally result storage unit 380 are not included.

位置判定部1410は、CNN部320より出力された認識結果から、画像データまたは圧縮データを復号した復号データに含まれるオブジェクトの位置情報を抽出する。また、位置判定部1410は、抽出した位置情報を量子化値設定部1420に通知する。 Position determination section 1410 extracts position information of an object included in decoded data obtained by decoding image data or compressed data from the recognition result output from CNN section 320 . In addition, position determination section 1410 notifies quantization value setting section 1420 of the extracted position information.

量子化値設定部1420は、画像圧縮装置130が圧縮処理を行う際に用いる圧縮レベル(量子化値)を出力部340に通知する。量子化値設定部1420では、最小の量子化値から開始して、所定のきざみ幅で加算した量子化値を、順次、出力部340に通知する。 The quantization value setting unit 1420 notifies the output unit 340 of the compression level (quantization value) used when the image compression device 130 performs compression processing. The quantization value setting section 1420 sequentially notifies the output section 340 of the quantization values obtained by starting from the minimum quantization value and adding them in predetermined increments.

また、量子化値設定部1420は、量子化値を通知するごとに、集計部360から通知される各ブロックの集計値を監視し、各ブロックの集計値が所定の閾値を超えた場合には、量子化値を下げる。このように、量子化値設定部1420では、集計値が所定の閾値を超えないように、通知する量子化値を制御することができる。 Also, the quantization value setting unit 1420 monitors the total value of each block notified from the totalization unit 360 each time the quantization value is notified, and if the total value of each block exceeds a predetermined threshold, , lower the quantization value. In this manner, the quantization value setting section 1420 can control the quantization value to be notified so that the total value does not exceed the predetermined threshold.

なお、量子化値設定部1420では、位置判定部1410より通知されたオブジェクトの位置情報に基づいて、集計値を監視するブロックを特定し、特定したブロックの量子化値を、特定したブロックの集計値に基づいて制御する。 Note that the quantization value setting unit 1420 identifies blocks whose aggregate values are to be monitored based on the object position information notified by the position determination unit 1410, and sets the quantization values of the identified blocks to the aggregate values of the identified blocks. Control based on value.

<量子化値設定部による処理の具体例>
次に、量子化値設定部1420による処理の具体例について説明する。図15は、量子化値設定部による処理の具体例を示す図である。図15において、圧縮データを復号した復号データ1511~1514は、それぞれ、時間=t~tにおいて入力部310が取得した圧縮データを復号した復号データを示している。
<Specific example of processing by the quantization value setting unit>
Next, a specific example of processing by the quantization value setting unit 1420 will be described. FIG. 15 is a diagram illustrating a specific example of processing by the quantization value setting unit; In FIG. 15, decoded data 1511 to 1514 obtained by decoding compressed data respectively indicate decoded data obtained by decoding compressed data obtained by the input unit 310 at times=t 1 to t 4 .

圧縮データを復号した復号データ1511~1514には、それぞれ、オブジェクト1521が含まれている。図15の例は、オブジェクト1521が時間の経過とともに、圧縮データを復号した復号データ1511~1514内を、左下から右上に向かって移動する様子を示している。 Decoded data 1511 to 1514 obtained by decoding compressed data each include an object 1521 . The example in FIG. 15 shows how an object 1521 moves over time from the lower left to the upper right within decoded data 1511 to 1514 obtained by decoding compressed data.

量子化値設定部1420では、位置判定部1410から通知される位置情報に基づいて、圧縮データを復号した復号データ1511~1514内におけるオブジェクト1521の位置を特定する。 Quantization value setting section 1420 identifies the position of object 1521 in decoded data 1511 to 1514 obtained by decoding compressed data based on the position information notified from position determination section 1410 .

また、量子化値設定部1420では、特定した位置に含まれる各ブロックの集計値を集計部360から取得する。図15において、符号1531~1534は、量子化値設定部1420が集計部360から通知された、特定した位置に含まれるブロックの集計値を示している。 Also, the quantization value setting unit 1420 acquires the aggregate value of each block included in the specified position from the aggregation unit 360 . In FIG. 15, reference numerals 1531 to 1534 indicate total values of blocks included in the specified position, which the quantization value setting unit 1420 is notified from the totalizing unit 360. In FIG.

図15の例では、量子化値設定部1420が、所定のきざみ幅で量子化値Qx+1、Qx+2、Qx+3を通知した様子を示している(ただし、Qx+1<Qx+2<Qx+3)。The example of FIG. 15 shows how the quantization value setting section 1420 notifies the quantization values Q x+1 , Q x+2 , and Q x+3 in predetermined increments (however, Q x+1 <Q x+2 <Q x+3 ). .

ここで、量子化値Qx+3を用いて圧縮処理が行われた場合の圧縮データを復号した復号データ1513に対して、認識処理が行われることで算出された、オブジェクト1521に含まれるブロックの集計値(符号1533)が、所定の閾値1530を超えたとする。Here, the total number of blocks included in the object 1521 calculated by performing the recognition processing on the decoded data 1513 obtained by decoding the compressed data when the compression processing is performed using the quantization value Q x+3. Suppose a value (1533) exceeds a predetermined threshold 1530;

この場合、量子化値設定部1420では、次に通知する量子化値を、量子化値Qx+3よりも小さい量子化値にする(図15の例では、量子化値Qx+2を通知した様子を示している)。In this case, the quantization value setting unit 1420 sets the quantization value to be notified next to a quantization value smaller than the quantization value Qx +3 (in the example of FIG. 15, the quantization value Qx +2 is notified). shown).

このように、オブジェクトに含まれる各ブロックの集計値が、所定の閾値を超えないように、通知する量子化値を制御することで、量子化値設定部1420では、最適な量子化値を継続して通知することができる。 In this way, by controlling the quantization value to be notified so that the total value of each block included in the object does not exceed a predetermined threshold value, the quantization value setting unit 1420 can continue the optimum quantization value. can be notified by

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図16は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第4のフローチャートである。なお、図7に示した第1のフローチャートとの相違点は、ステップS1601~ステップS1606である。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 16 is a fourth flowchart showing an example of the flow of image compression processing by the compression processing system. Note that steps S1601 to S1606 differ from the first flowchart shown in FIG.

ステップS1601において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。 In step S1601, the tabulation unit 360 tabulates the degree of influence of each region on a block-by-block basis based on the important feature map.

ステップS1602において、量子化値設定部1420は、位置判定部1410より通知された位置情報に基づいて、オブジェクトの位置を特定し、特定したオブジェクトの位置に含まれる各ブロックの集計値が、所定の閾値を超えたか否かを判定する。 In step S1602, the quantization value setting unit 1420 specifies the position of the object based on the position information notified from the position determination unit 1410, and the aggregate value of each block included in the specified position of the object is a predetermined value. Determine whether or not the threshold is exceeded.

ステップS1602において、所定の閾値を超えていないと判定した場合には(ステップS1602においてNoの場合には)、ステップS1603に進む。 If it is determined in step S1602 that the predetermined threshold is not exceeded (No in step S1602), the process proceeds to step S1603.

ステップS1603において、量子化値設定部1420は、所定のきざみ幅で量子化値を加算し、加算後の量子化値を出力部1430に通知する。 In step S<b>1603 , quantization value setting section 1420 adds quantization values in predetermined increments, and notifies output section 1430 of the quantization values after the addition.

一方、ステップS1602において、所定の閾値を超えたと判定した場合には(ステップS1602においてYesの場合には)、ステップS1604に進む。 On the other hand, if it is determined in step S1602 that the predetermined threshold has been exceeded (Yes in step S1602), the process proceeds to step S1604.

ステップS1604において、量子化値設定部1420は、所定のきざみ幅で量子化値を減算し、減算後の量子化値を出力部1430に通知する。 In step S1604, quantization value setting section 1420 subtracts the quantization value by a predetermined step width, and notifies output section 1430 of the quantization value after the subtraction.

ステップS1605において、画像圧縮装置130は、出力部1430より送信される量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。 In step S<b>1605 , the image compression device 130 performs compression processing on the image data using the quantization value transmitted from the output unit 1430 and stores the compressed data in the storage device 140 .

ステップS1606において、入力部310は、画像圧縮処理を終了するか否かを判定し、終了しないと判定した場合には(ステップS1606においてNoの場合には)、ステップS702に戻る。一方、ステップS1606において、終了すると判定した場合には(ステップS1606においてYesの場合には)、画像圧縮処理を終了する。 In step S1606, the input unit 310 determines whether or not to end the image compression processing, and if it is determined not to end (No in step S1606), the process returns to step S702. On the other hand, if it is determined to end in step S1606 (if Yes in step S1606), the image compression process ends.

以上の説明から明らかなように、第4の実施形態に係る解析装置は、複数の画像データそれぞれを異なる量子化値を用いて圧縮処理を行った場合の各圧縮データを取得する。また、第4の実施形態に係る解析装置は、各圧縮データを復号した復号データを学習済みモデルに入力し、認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成する。また、第4の実施形態に係る解析装置は、重要特徴マップをブロック単位で集計し、オブジェクトの位置に含まれるブロックの集計値を取得する。更に、第4の実施形態に係る解析装置は、取得した集計値が所定の閾値を超えないように、量子化値を制御する。 As is clear from the above description, the analysis apparatus according to the fourth embodiment acquires each piece of compressed data when performing compression processing using different quantization values for each of a plurality of image data. Further, the analysis device according to the fourth embodiment inputs the decoded data obtained by decoding each compressed data to the trained model, and based on the CNN unit structure information when performing the recognition process, the degree of influence on the recognition result Generate a key feature map showing Also, the analysis apparatus according to the fourth embodiment aggregates the important feature map for each block, and obtains the aggregate value of the blocks included in the position of the object. Furthermore, the analysis device according to the fourth embodiment controls the quantization value so that the acquired total value does not exceed a predetermined threshold.

このように、オブジェクトに含まれる各ブロックの集計値が、所定の閾値を超えないように、量子化値を制御することで、第4の実施形態に係る解析装置によれば、最適な量子化値を継続して出力することができる。 In this way, by controlling the quantization value so that the total value of each block included in the object does not exceed a predetermined threshold value, the analysis apparatus according to the fourth embodiment realizes optimal quantization Values can be output continuously.

[第5の実施形態]
上記第1乃至第3の実施形態では、ブロックごとに集計値を算出し、ブロックごとに最適な量子化値を決定するものとして説明した。これに対して、第5の実施形態では、基準となるブロックの集計値と比較し、比較結果に基づいて最適な量子化値を決定する。以下、第5の実施形態について、上記第1の実施形態との相違点を中心に説明する。
[Fifth embodiment]
In the first to third embodiments, the total value is calculated for each block, and the optimum quantization value is determined for each block. On the other hand, in the fifth embodiment, the total value of the reference block is compared, and the optimum quantization value is determined based on the comparison result. The fifth embodiment will be described below, focusing on differences from the first embodiment.

<量子化値決定部による処理の具体例>
図17は、量子化値決定部による処理の具体例を示す第4の図である。図17において、グラフ510_1~510_mは、既に、図5を用いて説明したグラフ510_1~510_mと同じである。
<Specific example of processing by the quantization value determination unit>
FIG. 17 is a fourth diagram showing a specific example of processing by the quantization value determination unit. In FIG. 17, graphs 510_1 to 510_m are the same as the graphs 510_1 to 510_m already described using FIG.

ここで、図17の例は、ブロック番号="ブロック1"を基準となるブロックとしており、当該ブロックにおける集計値は"v"、当該ブロックにおける最適な量子化値は"BQ"であるとする。Here, in the example of FIG. 17, the block number=“block 1” is used as a reference block, the total value in this block is “v 1 ”, and the optimum quantization value in this block is “B 1 Q”. Suppose there is

この場合、量子化値決定部では、例えば、
・ブロック2について、最適な量子化値=BQ×v/v
・ブロック3について、最適な量子化値=BQ×v/v
・・・
・ブロックmについて、最適な量子化値=BQ×v/v
をそれぞれ算出する。これにより、量子化値決定部では、最適な量子化値1700を決定する。
In this case, the quantization value determination unit, for example,
- For block 2, optimal quantization value = B1Q * v2 / v1 ,
- For block 3, optimal quantization value = B1Q * v3 / v1 ,
・・・
- For block m, optimal quantization value = B1Q * vm / v1 ,
are calculated respectively. As a result, the quantization value determination unit determines the optimum quantization value 1700 .

<圧縮処理システムによる画像圧縮処理の流れ>
図18は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第5のフローチャートである。図7に示した第1のフローチャートとの相違点は、ステップS1801である。
<Flow of image compression processing by compression processing system>
FIG. 18 is a fifth flowchart showing an example of the flow of image compression processing by the compression processing system. The difference from the first flowchart shown in FIG. 7 is step S1801.

ステップS1801において、量子化値決定部は、基準となるブロックの集計値と各ブロックの集計値とを比較し、基準となるブロックの最適な量子化値と比較結果とに基づいて、各ブロックの最適な量子化値を決定する。 In step S1801, the quantization value determination unit compares the total value of the reference block with the total value of each block, and determines the optimal quantization value of each block based on the comparison result and the optimum quantization value of the reference block. Determine the optimal quantization value.

このように、基準となるブロックの集計値と比較し、比較結果に基づいて最適な量子化値を決定することで、第5の実施形態によれば、画像データによらず、所定の圧縮レベル以上の圧縮レベルで、圧縮処理を行うことができる。また、第5の実施形態によれば、ブロック間で量子化値の整合をとることができる。 In this way, by comparing with the aggregated value of the reference block and determining the optimum quantization value based on the comparison result, according to the fifth embodiment, it is possible to achieve a predetermined compression level regardless of the image data. Compression processing can be performed at the above compression levels. Further, according to the fifth embodiment, quantization values can be matched between blocks.

[第6の実施形態]
上記第1乃至第3の実施形態では、ブロックごとに集計値を算出し、算出した集計値に基づいて、量子化値を決定するものとして説明した。これに対して、第6の実施形態では、画像圧縮装置130に予め設定されている量子化値(人間の視覚特性に基づいて設定された量子化値)を、算出した集計値を用いて補正することで、最適な量子化値を決定する。以下、第6の実施形態について、上記第1の実施形態との相違点を中心に説明する。
[Sixth embodiment]
In the first to third embodiments described above, the total value is calculated for each block, and the quantization value is determined based on the calculated total value. In contrast, in the sixth embodiment, the quantization value preset in the image compression device 130 (the quantization value set based on the human visual characteristics) is corrected using the calculated total value. to determine the optimum quantization value. The sixth embodiment will be described below, focusing on differences from the first embodiment.

<量子化値決定部による処理の具体例>
図19は、量子化値決定部による処理の具体例を示す第5の図である。図19において、量子化値1900は、画像圧縮装置130に予め設定されている量子化値であって、人間の視覚特性に基づいて設定された量子化値である。
<Specific example of processing by the quantization value determination unit>
FIG. 19 is a fifth diagram showing a specific example of processing by the quantization value determination unit. In FIG. 19, a quantization value 1900 is a quantization value that is preset in the image compression device 130, and is a quantization value that is set based on human visual characteristics.

また、図19において、集計結果1910は、所定の圧縮データを復号した復号データが認識処理された際の集計結果である。ここでいう所定の圧縮データとは、復号した復号データに対するCNN部320による認識処理において、誤った認識結果が出力された際の量子化値が設定される直前に設定された量子化値を用いて圧縮処理が行われた場合の圧縮データを指す。 Also, in FIG. 19, the tally result 1910 is the tally result when the decoded data obtained by decoding the predetermined compressed data is subjected to recognition processing. The predetermined compressed data here means the quantization value set immediately before the quantization value is set when an erroneous recognition result is output in the recognition processing by the CNN unit 320 for the decoded decoded data. Compressed data when compression processing is performed by

また、図19において、最適な量子化値1920は、量子化値1900と集計結果1910とに基づいて算出された量子化値である。図19に示すように、最適な量子化値1920は、下式(式1)に基づいて算出される。
(式1)Qa(x,y)=Qpb(x,y)+P(x,y)×重み係数
なお、式1において、Qa(x,y)は、座標(x,y)により特定されるブロックの最適な量子化値を指す。また、式1において、Qpb(x,y)は、座標(x,y)により特定されるブロックの量子化値であって、画像圧縮装置130に予め設定されている量子化値を指す。また、式1において、P(x,y)は、座標(x,y)により特定されるブロックの、所定の圧縮データを復号した復号データに対して認識処理が行われた際の集計結果を指す。
Also, in FIG. 19, the optimum quantized value 1920 is a quantized value calculated based on the quantized value 1900 and the tally result 1910 . As shown in FIG. 19, the optimal quantization value 1920 is calculated based on the following formula (Formula 1).
(Equation 1) Qa (x, y) = Qpb (x, y) + P (x, y) x weighting coefficient In Equation 1, Qa (x, y) is specified by coordinates (x, y) Points to the optimal quantization value for the block. In Expression 1, Qpb(x, y) is the quantization value of the block specified by the coordinates (x, y), which is preset in the image compression device 130 . Further, in Equation 1, P(x, y) is the aggregate result when recognition processing is performed on decoded data obtained by decoding predetermined compressed data of a block specified by coordinates (x, y). Point.

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図20は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第6のフローチャートである。図7に示した第1のフローチャートとの相違点は、ステップS2001、ステップS2002~2005である。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 20 is a sixth flowchart showing an example of the flow of image compression processing by the compression processing system. Differences from the first flowchart shown in FIG. 7 are steps S2001 and steps S2002 to S2005.

ステップS2001において、量子化値決定部は、CNN部より正しい認識結果が出力されたか否かを判定する。ステップS2001において、正しい認識結果が出力されたと判定した場合には(ステップS2001においてYesの場合には)、ステップS704に進む。 In step S2001, the quantization value determination unit determines whether or not the correct recognition result is output from the CNN unit. If it is determined in step S2001 that a correct recognition result has been output (if Yes in step S2001), the process proceeds to step S704.

ステップS704において、重要特徴マップ生成部350は、CNN部構造情報に基づいて、各領域の認識結果への影響度を示す重要特徴マップを生成する。 In step S704, the important feature map generator 350 generates an important feature map indicating the degree of influence of each region on the recognition result based on the CNN structure information.

ステップS705において、集計部360は、重要特徴マップに基づいて、各領域の影響度をブロック単位で集計する。また、集計部360は、集計結果を、現在の圧縮レベル(量子化値)と対応付けて、集計結果格納部380に格納する。 In step S705, the tabulation unit 360 tabulates the degree of influence of each region on a block-by-block basis based on the important feature map. Also, the counting unit 360 stores the counting result in the counting result storage unit 380 in association with the current compression level (quantization value).

ステップS2002において、量子化値設定部330は、圧縮レベル(量子化値)を上げる。 In step S2002, quantization value setting section 330 increases the compression level (quantization value).

ステップS2003において、出力部340は画像データと、現在の圧縮レベル(量子化値)とを画像圧縮装置130に送信する。また、画像圧縮装置130は、送信された画像データに対して、現在の圧縮レベル(量子化値)を用いて圧縮処理を行い、圧縮データを生成する。 In step S<b>2003 , the output unit 340 transmits the image data and the current compression level (quantization value) to the image compression device 130 . The image compression device 130 also performs compression processing on the transmitted image data using the current compression level (quantization value) to generate compressed data.

一方、ステップS2001において、誤った認識結果が出力されたと判定した場合には(ステップS2001においてNoの場合には)、ステップS2004に進む。 On the other hand, if it is determined in step S2001 that an erroneous recognition result has been output (No in step S2001), the process proceeds to step S2004.

ステップS2004において、量子化値決定部は、最後に認識可能となった復号データの集計値に重み係数をかけ、画像圧縮装置130に予め設定されている量子化値に加算する。 In step S<b>2004 , the quantization value determination unit multiplies the total value of the finally recognizable decoded data by a weighting factor, and adds it to the quantization value preset in the image compression device 130 .

ステップS2005において、画像圧縮装置130は、ステップS2004において算出された量子化値を用いて、画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。 In step S<b>2005 , the image compression device 130 compresses the image data using the quantization value calculated in step S<b>2004 , and stores the compressed data in the storage device 140 .

このように、画像圧縮装置に予め設定されている量子化値(人間の視覚特性に基づいて設定された量子化値)を、算出した集計値を用いて補正することで、第6の実施形態によれば、最適な量子化値を決定することができる。 In this way, by correcting the quantization value preset in the image compression device (the quantization value set based on the human visual characteristics) using the calculated total value, the sixth embodiment can be achieved. can determine the optimal quantization value.

[第7の実施形態]
上記第1乃至第6の実施形態では、認識結果への影響度をブロック単位で集計し、集計結果に基づいて最適な量子化値を決定する場合について説明した。これに対して、第8の実施形態では、集計結果に基づいて、画像データを有効領域と無効領域とに分け、無効領域に含まれるブロックについては無効化したうえで、有効領域に対して圧縮処理を行う。
[Seventh embodiment]
In the first to sixth embodiments, cases have been described in which the degree of influence on the recognition result is aggregated for each block and the optimal quantization value is determined based on the aggregated result. On the other hand, in the eighth embodiment, image data is divided into a valid area and an invalid area based on the totalization result, blocks included in the invalid area are invalidated, and then the valid area is compressed. process.

なお、無効領域に含まれるブロックの無効化とは、例えば、無効領域に含まれるブロックの各画素の画素値を"0"にすることを指し、無効領域に含まれるブロックを無効化した画像データを、以下では"無効化画像データ"と称す。 Note that invalidating a block included in the invalid area means, for example, setting the pixel value of each pixel in the block included in the invalid area to "0". is hereinafter referred to as "invalidation image data".

このように、無効化画像データに対して(無効化画像データに含まれる有効領域に対して)圧縮処理を行うことで、画像データ全体に対して圧縮処理を行う場合と比較して、圧縮データのデータサイズをより削減することができる。 By performing compression processing on invalidated image data (valid regions included in invalidated image data) in this way, compared to the case where compression processing is performed on the entire image data, the compressed data data size can be further reduced.

なお、無効化画像データに対して圧縮処理を行うにあたっては、予め定められた量子化値を用いてもよいし、上記第1乃至第6の実施形態において説明した方法に基づいて決定した最適な量子化値を用いてもよい。また、任意の形状のデータを圧縮処理可能な圧縮方式の場合にあっては、無効化画像データの無効領域を取り除いたデータを圧縮処理してもよい。以下、第7の実施形態について、上記第1の実施形態との相違点を中心に説明する。 Note that when performing compression processing on invalidated image data, a predetermined quantization value may be used. Quantized values may also be used. Further, in the case of a compression method capable of compressing data of any shape, data from which invalid regions are removed from the invalidated image data may be compressed. The seventh embodiment will be described below, focusing on differences from the first embodiment.

<解析装置の機能構成>
はじめに、第7の実施形態に係る解析装置120の機能構成について説明する。図21は、解析装置の機能構成の一例を示す第5の図である。図3に示した機能構成との相違点は、量子化値決定部370に代えて、無効領域判定部2110及び無効化画像生成部2120を有する点である。
<Functional configuration of analysis device>
First, the functional configuration of an analysis device 120 according to the seventh embodiment will be described. FIG. 21 is a fifth diagram illustrating an example of the functional configuration of the analysis device; The difference from the functional configuration shown in FIG. 3 is that instead of the quantization value determination section 370, an invalid area determination section 2110 and an invalid image generation section 2120 are provided.

無効領域判定部2110は、集計結果格納部380に格納された、各ブロックの認識結果への影響度の集計値(量子化値の数に応じた数の集計値)に基づいて、各ブロックが無効領域に属するブロックであるのか否かを判定する。 The invalid area determination unit 2110 determines whether each block is a It is determined whether or not the block belongs to the invalid area.

なお、無効領域判定部2110では、各ブロックが無効領域に属するブロックであるのか否かを判定するにあたり、まず、CNN部320より認識結果を取得し、正しい認識結果が出力されなかった際の量子化値を特定する。続いて、無効領域判定部2110では、最小の量子化値に対応する集計値と、特定した量子化値における集計値との差分が所定の閾値以上であるか否かに基づいて、各ブロックが無効領域に属するブロックであるのか否かを判定する。 Note that the invalid area determination unit 2110 first acquires the recognition result from the CNN unit 320 when determining whether or not each block belongs to the invalid area. identify the normalization value. Subsequently, in the invalid area determination unit 2110, based on whether or not the difference between the aggregated value corresponding to the minimum quantized value and the aggregated value of the specified quantized value is equal to or greater than a predetermined threshold, each block is It is determined whether or not the block belongs to the invalid area.

また、無効領域判定部2110は、無効領域に属すると判定したブロックを無効化画像生成部2120に通知する。 In addition, the invalid area determination unit 2110 notifies the invalid image generation unit 2120 of the blocks determined to belong to the invalid area.

無効化画像生成部2120は、画像データに含まれる各ブロックのうち、無効領域判定部2110より通知されたブロックを無効化した、無効化画像データを生成する。また、無効化画像生成部2120は、生成した無効化画像データを、出力部340に通知する。 The invalidated image generating unit 2120 generates invalidated image data by invalidating the blocks notified by the invalid area determination unit 2110 among the blocks included in the image data. In addition, the invalidation image generation unit 2120 notifies the output unit 340 of the invalidation image data thus generated.

<無効領域判定部による処理の具体例>
次に、無効領域判定部2110による処理の具体例について説明する。図22は、無効領域判定部による処理の具体例を示す図である。図22において、グラフ510_1~510_mは、図5に示したグラフ510_1~510_mと同じである。ただし、図22に示すグラフ510_1~510_mには、CNN部320による認識処理において、正しい認識結果が出力されなかった際の量子化値(認識不可の量子化値)を明示している(一点鎖線参照)。
<Specific example of processing by the invalid area determination unit>
Next, a specific example of processing by the invalid area determination unit 2110 will be described. FIG. 22 is a diagram showing a specific example of processing by the invalid area determination unit. Graphs 510_1 to 510_m in FIG. 22 are the same as the graphs 510_1 to 510_m shown in FIG. However, the graphs 510_1 to 510_m shown in FIG. 22 clearly show the quantized values (unrecognizable quantized values) when the correct recognition result is not output in the recognition processing by the CNN unit 320 (chain line reference).

無効領域判定部2110では、最小の量子化値に対応する集計値と、認識不可の量子化値に対応する集計値との差分を算出する。図22の例は、ブロック1~ブロックmそれぞれにおいて算出された差分が、Δ~Δであることを示している。The invalid area determination unit 2110 calculates the difference between the aggregated value corresponding to the minimum quantized value and the aggregated value corresponding to the unrecognizable quantized value. The example of FIG. 22 indicates that the differences calculated for blocks 1 to m are Δ 1 to Δm .

無効領域判定部2110では、算出した差分が、所定の閾値以上であるか否かに基づいて、対応するブロックが無効領域に属するブロックか否かを判定する。 The invalid area determination unit 2110 determines whether the corresponding block belongs to the invalid area based on whether the calculated difference is equal to or greater than a predetermined threshold.

図22の例は、Δが所定の閾値未満であるため、無効領域判定部2110が、ブロック1を、無効領域に属するブロックであると判定した様子を示している。一方、図22の例は、Δが所定の閾値以上であるため、無効領域判定部2110が、ブロック2を、有効領域に属するブロックであると判定した様子を示している。また、図22の例は、Δが所定の閾値未満であるため、無効領域判定部2110が、ブロック3を、無効領域に属するブロックであると判定した様子を示している。The example of FIG. 22 shows how the invalid area determination unit 2110 determines that block 1 belongs to the invalid area because Δ 1 is less than the predetermined threshold. On the other hand, the example of FIG. 22 shows how the invalid area determination unit 2110 determines that block 2 belongs to the valid area because Δ2 is greater than or equal to the predetermined threshold. Also, the example of FIG. 22 shows how the invalid area determination unit 2110 determines that block 3 belongs to the invalid area because Δ3 is less than the predetermined threshold.

<無効化画像データの具体例>
次に、無効化画像生成部2120により生成される無効化画像データの具体例について説明する。図23は、無効化画像データの具体例を示す図である。
<Specific example of invalidation image data>
Next, a specific example of invalidation image data generated by the invalidation image generation unit 2120 will be described. FIG. 23 is a diagram showing a specific example of invalidation image data.

図23に示す無効化画像データ2300において、ハッチングが施された領域2301は、無効領域判定部2110により無効領域と判定された領域である。一方、無効化画像データ2300において、ハッチングが施されていない領域2302は、無効領域判定部2110により有効領域と判定された領域である。 In invalidated image data 2300 shown in FIG. 23, a hatched area 2301 is an area determined as an invalid area by the invalid area determination unit 2110 . On the other hand, a non-hatched area 2302 in the invalidated image data 2300 is an area determined by the invalid area determination unit 2110 to be a valid area.

出力部340では、領域2301に含まれる各ブロックを無効化し、領域2302に含まれる各ブロックからなる画像データ(無効化画像データ2300)を画像圧縮装置130に送信する。 The output unit 340 invalidates each block included in the area 2301 and transmits image data (invalidated image data 2300 ) composed of each block included in the area 2302 to the image compression device 130 .

これにより、画像圧縮装置130では、無効化画像データ2300に対して圧縮処理を行うことで、圧縮データを生成する。このため、画像データ全体に対して、最適な量子化値を用いて圧縮処理を行う場合と比較して、圧縮データのデータサイズをより削減することができる。 As a result, the image compression device 130 performs compression processing on the invalidated image data 2300 to generate compressed data. Therefore, the data size of the compressed data can be further reduced compared to the case where the compression processing is performed on the entire image data using the optimum quantization value.

なお、画像圧縮装置130が無効化画像データ2300に対して圧縮処理を行うにあたり、解析装置120では、領域2302に含まれる各ブロックについて、認識結果への影響度に応じた最適な量子化値を算出し、画像圧縮装置130に送信してもよい。 Note that when the image compression device 130 performs compression processing on the invalidated image data 2300, the analysis device 120 determines an optimum quantization value for each block included in the region 2302 according to the degree of influence on the recognition result. It may be calculated and transmitted to the image compression device 130 .

これにより、無効化画像データ2300について、予め定められた量子化値を用いて圧縮処理を行う場合と比較して、圧縮データのデータサイズを更に削減することができる。 As a result, the data size of the compressed data can be further reduced as compared with the case where the invalidation image data 2300 is compressed using a predetermined quantization value.

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図24は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第7のフローチャートである。図7に示した第1のフローチャートとの相違点は、ステップS2401~S2404である。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 24 is a seventh flowchart showing an example of the flow of image compression processing by the compression processing system. The difference from the first flowchart shown in FIG. 7 is steps S2401 to S2404.

ステップS2401において、無効領域判定部2110は、CNN部320より正しい認識結果が出力されたか否かを判定する。ステップS2401において、正しい認識結果が出力されたと判定した場合には(ステップS2401においてYesの場合には)、ステップS702に戻る。 In step S2401, invalid area determination section 2110 determines whether or not CNN section 320 has output a correct recognition result. If it is determined in step S2401 that a correct recognition result has been output (if Yes in step S2401), the process returns to step S702.

一方、ステップS2401において、正しい認識結果が出力されなかったと判定した場合には(ステップS2401においてNoの場合には)、ステップS2402に進む。 On the other hand, if it is determined in step S2401 that the correct recognition result was not output (No in step S2401), the process proceeds to step S2402.

ステップS2402において、無効領域判定部2110は、各ブロックについて、最小の量子化値に対応付けられた集計値と、認識不可時の量子化値に対応付けられた集計値との差分を算出する。また、無効領域判定部2110は、算出した差分に基づいて、各ブロックが無効領域に属するブロックか否かを判定する。 In step S2402, invalid area determination section 2110 calculates the difference between the total value associated with the minimum quantization value and the total value associated with the quantization value at the time of unrecognizability for each block. Also, the invalid area determination unit 2110 determines whether or not each block belongs to the invalid area based on the calculated difference.

ステップS2403において、無効化画像生成部2120は、無効領域に属するブロックを無効化することで、無効化画像データを生成する。 In step S2403, the invalidation image generating unit 2120 generates invalidation image data by invalidating blocks belonging to the invalid area.

ステップS2404において、出力部340は、無効化画像データを画像圧縮装置130に送信する。また、画像圧縮装置130は、無効化画像データに対して圧縮処理を行い、圧縮データをストレージ装置140に格納する。なお、画像圧縮装置130では、正しい認識結果が出力されなかったと判定される直前の正しい認識結果が出力された際の量子化値を用いて圧縮処理を行う。 In step S<b>2404 , output unit 340 transmits the invalidated image data to image compression device 130 . The image compression device 130 also performs compression processing on the invalidated image data and stores the compressed data in the storage device 140 . Note that the image compression device 130 performs compression processing using the quantized value when the correct recognition result was output immediately before it was determined that the correct recognition result was not output.

以上の説明から明らかなように、第7の実施形態に係る解析装置は、画像データに対して異なる量子化値を用いて圧縮処理を行った場合の各圧縮データを取得する。また、第7の実施形態に係る解析装置は、各圧縮データを復号した復号データを学習済みモデルに入力して認識処理を行った際のCNN部構造情報に基づいて、認識結果への影響度を示す重要特徴マップを生成し、ブロックごとに影響度を集計する。また、第7の実施形態に係る解析装置は、正しい認識結果が出力されなかった際の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分に基づいて、各ブロックが無効領域に属するか否かを判定する。更に、第7の実施形態に係る解析装置は、無効領域に属するブロックを無効化した無効化画像データに対して圧縮処理を行う。 As is clear from the above description, the analysis apparatus according to the seventh embodiment acquires each piece of compressed data when compression processing is performed on image data using different quantization values. In addition, the analysis device according to the seventh embodiment inputs the decoded data obtained by decoding each compressed data to the trained model and performs the recognition processing based on the CNN part structure information, the degree of influence on the recognition result Generate an important feature map showing Further, the analysis device according to the seventh embodiment, based on the difference between the total value corresponding to the quantization value when the correct recognition result is not output and the total value corresponding to the minimum quantization value, Determine whether each block belongs to the invalid area. Furthermore, the analysis apparatus according to the seventh embodiment performs compression processing on invalidated image data in which blocks belonging to invalid areas are invalidated.

このように、認識結果への影響度に基づいて判定した無効領域を無効化した画像データに対して圧縮処理を行うことで、上記第1の実施形態と同様の効果を奏するとともに、上記第1の実施形態と比較して、圧縮データのデータサイズを更に削減することができる。 In this manner, by performing compression processing on image data in which invalid regions determined based on the degree of influence on recognition results are invalidated, the same effects as those of the first embodiment can be obtained, and at the same time, The data size of the compressed data can be further reduced compared to the embodiment of .

[第8の実施形態]
上記第7の実施形態では、認識結果への影響度に基づいて無効領域に属するブロックを判定するものとして説明した。これに対して、第8の実施形態では、認識結果への影響度に基づいて有効領域に属するブロックを判定する。
[Eighth embodiment]
In the seventh embodiment described above, blocks belonging to the invalid area are determined based on the degree of influence on the recognition result. In contrast, in the eighth embodiment, blocks belonging to the effective area are determined based on the degree of influence on the recognition result.

なお、第8の実施形態では、有効領域に属するブロックを判定するにあたり、はじめに最小限の有効領域を設定しておき、量子化値を上げた際の各ブロックの集計値の変化に応じて、徐々に有効領域を拡張していくことで、有効領域を確定する。このように、第8の実施形態では、量子化値を上げたことによる認識精度の低下を、有効領域の拡張によりカバーすることで、より大きな量子化値を最適な量子化値として決定することができる。以下、第8の実施形態について、上記第7の実施形態との相違点を中心に説明する。 In the eighth embodiment, when determining blocks belonging to the effective area, the minimum effective area is set first, and according to the change in the total value of each block when the quantization value is increased, The effective area is determined by gradually expanding the effective area. As described above, in the eighth embodiment, a larger quantization value is determined as the optimum quantization value by covering the decrease in recognition accuracy caused by increasing the quantization value by expanding the effective region. can be done. The eighth embodiment will be described below, focusing on differences from the seventh embodiment.

<解析装置の機能構成>
はじめに、第8の実施形態に係る解析装置120の機能構成について説明する。図25は、解析装置の機能構成の一例を示す第6の図である。図21に示した機能構成との相違点は、初期無効化画像生成部2510を有する点、及び、無効領域判定部2110に代えて有効領域判定部2520を有する点である。また、無効化画像生成部2530の機能が、図21の無効化画像生成部2120の機能とは異なっている点である。
<Functional configuration of analysis device>
First, the functional configuration of an analysis device 120 according to the eighth embodiment will be described. FIG. 25 is a sixth diagram illustrating an example of the functional configuration of the analysis device; The difference from the functional configuration shown in FIG. 21 is that it has an initial disabled image generating section 2510 and that it has a valid area determining section 2520 instead of the invalid area determining section 2110 . Another difference is that the function of the invalidation image generation unit 2530 is different from the function of the invalidation image generation unit 2120 in FIG.

初期無効化画像生成部2510は、予め設定された最小限の有効領域を含む無効化画像データ(初期無効化画像データと称す)を生成する。また、初期無効化画像生成部2510は、生成した初期無効化画像データを出力部340に通知する。 The initial invalidation image generation unit 2510 generates invalidation image data (referred to as initial invalidation image data) including a preset minimum valid area. Further, the initial invalidation image generation unit 2510 notifies the output unit 340 of the generated initial invalidation image data.

有効領域判定部2520は、集計結果格納部380より集計結果を読み出し、量子化値の変化に対する各ブロックの集計値の変化量に基づいて、有効領域を拡張するか否かを判定する。また、有効領域判定部2520は、有効領域を拡張すると判定した場合、拡張後の有効領域を無効化画像生成部2530に通知する。 Valid area determination section 2520 reads out the tally result from tally result storage section 380, and determines whether or not to expand the valid area based on the amount of change in the tally value of each block with respect to the change in quantization value. In addition, when valid area determining section 2520 determines to extend the valid area, it notifies invalid image generating section 2530 of the valid area after the extension.

無効化画像生成部2530は、有効領域判定部2520より通知された拡張後の有効領域以外の領域(無効領域)に属するブロックを無効化し、無効化画像データを生成する。また、無効化画像生成部2530は、生成した無効化画像データを出力部340に通知する。 The invalidation image generation unit 2530 invalidates blocks belonging to an area (invalid area) other than the expanded valid area notified by the valid area determination unit 2520, and creates invalidation image data. In addition, the invalidation image generation unit 2530 notifies the output unit 340 of the generated invalidation image data.

<有効領域判定部による処理の具体例>
次に、有効領域判定部2520による処理の具体例について説明する。図26は、有効領域判定部による処理の具体例を示す図である。図26において、初期無効化画像データ2610は、初期無効化画像生成部2510により生成された初期無効化画像データを示している。
<Specific example of processing by effective area determination unit>
Next, a specific example of processing by the valid area determination unit 2520 will be described. FIG. 26 is a diagram illustrating a specific example of processing by the effective area determination unit; In FIG. 26 , initial invalidation image data 2610 indicates initial invalidation image data generated by the initial invalidation image generation unit 2510 .

初期無効化画像データ2610において、ハッチングが施された領域は、無効領域2611である。一方、初期無効化画像データ2610において、ハッチングが施されていない領域2612は、最小限の有効領域である。 In the initial invalidated image data 2610 , the hatched area is the invalid area 2611 . On the other hand, the non-hatched area 2612 in the initial invalidated image data 2610 is the minimum valid area.

ここで、画像圧縮装置130では、異なる量子化値に基づいて初期無効化画像データ2610に対して圧縮処理を行う。これにより、CNN部320では、それぞれの量子化値に対応する圧縮データを復号した復号データに対して認識処理を行い、集計部360では、それぞれの量子化値に対応する、認識結果への影響度をブロック単位で集計する。 Here, the image compression device 130 performs compression processing on the initial invalidated image data 2610 based on different quantization values. As a result, the CNN unit 320 performs recognition processing on the decoded data obtained by decoding the compressed data corresponding to each quantization value, and the summation unit 360 recognizes the influence on the recognition result corresponding to each quantization value. Aggregate degrees in blocks.

図26において、グラフ2641は、それぞれの量子化値に対応する、ブロック2612_1(ブロック番号="ブロックX")の集計値を示している。また、グラフ2642は、それぞれの量子化値に対応する、ブロック2612_2(ブロック番号="ブロックX+1")の集計値を示している。 In FIG. 26, a graph 2641 shows aggregate values of block 2612_1 (block number=“block X”) corresponding to respective quantization values. Also, the graph 2642 shows the total values of the block 2612_2 (block number=“block X+1”) corresponding to each quantization value.

有効領域判定部2520では、例えば、ブロック2612_1について、現在の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分Δを算出する。これにより、有効領域判定部2520は、有効領域を、ブロック2612_1に隣接するブロックまで拡張すべきか否かを判定する。For example, for the block 2612_1, the valid area determination unit 2520 calculates the difference Δx between the total value corresponding to the current quantization value and the total value corresponding to the minimum quantization value. Accordingly, valid area determination section 2520 determines whether or not the valid area should be extended to blocks adjacent to block 2612_1.

同様に、有効領域判定部2520では、ブロック2612_2について、現在の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分Δx+1を算出する。これにより、有効領域判定部2520は、有効領域を、ブロック2612_2に隣接するブロックまで拡張すべきか否かを判定する。Similarly, the valid area determining section 2520 calculates the difference Δx +1 between the aggregated value corresponding to the current quantized value and the aggregated value corresponding to the minimum quantized value for the block 2612_2. Accordingly, valid area determination section 2520 determines whether or not the valid area should be extended to blocks adjacent to block 2612_2.

なお、有効領域判定部2520では、有効領域と無効領域との境界位置内側にある全てのブロックについて同様の判定を行う。 It should be noted that the valid area determining section 2520 performs the same determination for all blocks inside the boundary position between the valid area and the invalid area.

図26の例は、ブロック2612_1については、Δが所定の閾値未満であるため、隣接するブロックまで有効領域を拡張する必要はないと判定した様子を示している。また、図26の例は、ブロック2612_2については、Δx+1が所定の閾値以上であるため、隣接するブロックまで有効領域を拡張する必要があると判定された様子を示している。The example of FIG. 26 shows that for block 2612_1, Δx is less than the predetermined threshold, so it is determined that it is not necessary to expand the valid area to adjacent blocks. Also, the example of FIG. 26 shows that for block 2612_2, since Δx +1 is greater than or equal to the predetermined threshold, it is determined that the effective area needs to be extended to the adjacent block.

なお、有効領域判定部2520では、ブロック2612_2に隣接するブロックを有効領域に含めた、拡張後の有効領域を無効化画像生成部2530に通知し、無効化画像生成部2530では、通知された拡張後の有効領域に基づいて、無効化画像データを生成する。 Note that the valid area determination unit 2520 notifies the invalidation image generation unit 2530 of the extended valid area including the block adjacent to the block 2612_2 in the valid area. Disabled image data is generated based on the later effective region.

図26において、無効化画像データ2620は、無効化画像生成部2530が、有効領域判定部2520より通知された、拡張後の有効領域に基づいて生成した無効化画像データを示している。 In FIG. 26, invalidated image data 2620 indicates invalidated image data generated by the invalidated image generation unit 2530 based on the effective area after expansion notified by the effective area determination unit 2520 .

図26に示すように、無効化画像データ2620の有効領域2622には、ブロック2612_2に隣接するブロック2631が含まれる。また、無効化画像データ2620の無効領域2621は、有効領域が拡張されたことで、初期無効化画像データ2610の無効領域2611よりも小さくなっている。 As shown in FIG. 26, valid area 2622 of invalidated image data 2620 includes block 2631 adjacent to block 2612_2. Also, the invalid area 2621 of the invalidated image data 2620 is smaller than the invalid area 2611 of the initial invalidated image data 2610 by expanding the valid area.

このように、有効領域判定部2520では、量子化値を上げた際の各ブロックの集計値の変化に応じて、徐々に有効領域を拡張していくことで、有効領域を確定する。なお、有効領域判定部2520では、隣接するブロックを有効領域に含めることで、有効領域と無効領域との境界位置内側にあったブロックの集計値が下がり、最小の量子化値に対応する集計値との差分が所定の閾値未満になった場合、有効領域の拡張を継続する。 In this manner, the valid area determination unit 2520 determines the valid area by gradually expanding the valid area in accordance with the change in the total value of each block when the quantization value is increased. By including the adjacent blocks in the valid area, the effective area determination unit 2520 reduces the total value of the block located inside the boundary position between the valid area and the invalid area, and the total value corresponding to the minimum quantized value is reduced. is less than a predetermined threshold, the extension of the effective area is continued.

一方、有効領域判定部2520では、隣接するブロックを有効領域に含めたが、有効領域と無効領域との境界位置内側にあったブロックの集計値が下がらず、最小の量子化値に対応する集計値との差分が所定の閾値以上のままの場合には、有効領域の拡張を終了する。 On the other hand, in the valid area determination section 2520, although the adjacent blocks were included in the valid area, the aggregate value of the block located inside the boundary position between the valid area and the invalid area did not decrease, and the aggregate value corresponding to the minimum quantized value did not decrease. If the difference from the value remains equal to or greater than the predetermined threshold, the extension of the valid area is terminated.

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図27は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第8のフローチャートである。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 27 is an eighth flowchart showing an example of the flow of image compression processing by the compression processing system.

ステップS2701において、入力部310は画像データをフレーム単位で取得する。 In step S2701, the input unit 310 acquires image data in units of frames.

ステップS2702において、CNN部320は、画像データに対して認識処理を行うことで、認識結果を出力し、重要特徴マップ生成部350は重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。これにより、各ブロックについて、最小の量子化値に対応する集計値が算出される。 In step S2702, the CNN unit 320 outputs recognition results by performing recognition processing on the image data, and the important feature map generation unit 350 generates an important feature map. In addition, the aggregation unit 360 aggregates the degree of impact for each block. As a result, a total value corresponding to the minimum quantized value is calculated for each block.

ステップS2703において、量子化値設定部330は、圧縮レベルを初期化するとともに、圧縮レベルの上限を設定する。また、初期無効化画像生成部2510は、初期無効化画像データを生成する。 In step S2703, quantization value setting section 330 initializes the compression level and sets the upper limit of the compression level. Also, the initial invalidation image generation unit 2510 generates initial invalidation image data.

ステップS2704において、画像圧縮装置130は、現在の量子化値を用いて、無効化画像データ(ここでは初期無効化画像データ)に対して圧縮処理を行い、圧縮データを生成する。 In step S2704, the image compression device 130 uses the current quantization value to perform compression processing on the invalidated image data (initial invalidated image data here) to generate compressed data.

ステップS2705において、CNN部320は、圧縮データを復号した復号データに対して認識処理を行うことで認識結果を出力し、重要特徴マップ生成部350は重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。 In step S2705, the CNN unit 320 performs recognition processing on the decoded data obtained by decoding the compressed data, and outputs a recognition result, and the important feature map generation unit 350 generates an important feature map. In addition, the aggregation unit 360 aggregates the degree of impact for each block.

ステップS2706において、有効領域判定部2520は、有効領域と無効領域との境界位置内側のブロックについて、現在の量子化値に対応する集計値と、最小の量子化値に対応する集計値との差分が所定の閾値以上であるか否かを判定する。 In step S2706, valid area determination section 2520 determines the difference between the aggregated value corresponding to the current quantized value and the aggregated value corresponding to the minimum quantized value for the block inside the boundary position between the valid area and the invalid area. is greater than or equal to a predetermined threshold.

ステップS2706において、所定の閾値未満であると判定された場合には(ステップS2706においてNoの場合には)、ステップS2712に進む。 If it is determined in step S2706 that it is less than the predetermined threshold (No in step S2706), the process proceeds to step S2712.

一方、ステップS2706において、所定の閾値以上であると判定された場合には(ステップS2706においてYesの場合には)、ステップS2707に進む。 On the other hand, if it is determined in step S2706 that it is equal to or greater than the predetermined threshold value (Yes in step S2706), the process proceeds to step S2707.

ステップS2707において、有効領域判定部2520は、差分が所定の閾値以上のブロックに隣接するブロックを有効領域に含め、拡張後の有効領域を無効化画像生成部2530に通知する。 In step S2707, the valid area determination unit 2520 includes the blocks adjacent to the block whose difference is equal to or greater than a predetermined threshold in the valid area, and notifies the invalid image generation unit 2530 of the extended valid area.

ステップS2708において、無効化画像生成部2530は、拡張後の有効領域に基づいて無効化画像データを生成する。 In step S2708, the invalidation image generation unit 2530 generates invalidation image data based on the valid area after expansion.

ステップS2709において、画像圧縮装置130は、現在の量子化値を用いて、無効化画像データに対して圧縮処理を行い、圧縮データを生成する。 In step S2709, the image compression device 130 performs compression processing on the invalidated image data using the current quantization value to generate compressed data.

ステップS2710において、CNN部320は、圧縮データを復号した復号データに対して認識処理を行うことで認識結果を出力し、重要特徴マップ生成部350は重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。 In step S2710, CNN section 320 outputs recognition results by performing recognition processing on decoded data obtained by decoding compressed data, and important feature map generation section 350 generates an important feature map. In addition, the aggregation unit 360 aggregates the degree of impact for each block.

ステップS2711において、有効領域判定部2520は、ステップS2706において、所定の閾値以上であると判定されたブロックについて集計値が下がり、差分が所定の閾値未満になったか否かを判定する。 In step S2711, valid area determination section 2520 determines whether or not the total value for the block determined to be equal to or greater than the predetermined threshold in step S2706 has decreased and the difference has become less than the predetermined threshold.

ステップS2711において、所定の閾値未満になったと判定した場合には(ステップS2711においてYesの場合には)、ステップS2712に進む。 If it is determined in step S2711 that the value is less than the predetermined threshold value (Yes in step S2711), the process proceeds to step S2712.

ステップS2712において、量子化値設定部330は、圧縮レベル(量子化値)を上げ、ステップS2704に戻る。 In step S2712, quantization value setting section 330 increases the compression level (quantization value) and returns to step S2704.

一方、ステップS2711において、所定の閾値以上のままであると判定した場合には(ステップS2711においてNoの場合には)、ステップS2713に進む。 On the other hand, if it is determined in step S2711 that it remains equal to or greater than the predetermined threshold value (No in step S2711), the process proceeds to step S2713.

ステップS2713において、無効化画像生成部2530は、ステップS2707において有効領域を拡張する直前の有効領域に基づいて無効化画像データを生成する。 In step S2713, invalidation image generation section 2530 generates invalidation image data based on the valid area immediately before the valid area is expanded in step S2707.

ステップS2714において、画像圧縮装置130は、ステップS2707において有効領域を拡張する直前の圧縮レベル(量子化値)を用いて、ステップS2713において生成された無効化画像データに対して圧縮処理を行い、圧縮データを格納する。 In step S2714, the image compression apparatus 130 performs compression processing on the invalidated image data generated in step S2713 using the compression level (quantization value) immediately before expanding the valid area in step S2707. Store data.

以上の説明から明らかなように、第8の実施形態に係る解析装置は、はじめに最小限の有効領域を設定しておき、量子化値を上げた際の各ブロックの集計値の変化に応じて、徐々に有効領域を拡張していく。 As is clear from the above description, the analysis apparatus according to the eighth embodiment first sets the minimum effective area, and according to the change in the total value of each block when the quantization value is increased, , gradually expanding the effective area.

これにより、第8の実施形態に係る解析装置によれば、量子化値を上げたことによる認識精度の低下を、有効領域の拡張によりカバーすることが可能となり、より大きな量子化値を最適な量子化値として圧縮処理を行うことが可能となる。 As a result, according to the analysis apparatus according to the eighth embodiment, it is possible to compensate for the decrease in recognition accuracy due to the increase in the quantization value by extending the effective region, so that a larger quantization value can be optimized. Compression processing can be performed as a quantized value.

この結果、第8の実施形態によれば、上記第1の実施形態と同様の効果を奏するとともに、上記第1の実施形態よりも、圧縮データのデータサイズをより削減することができる。 As a result, according to the eighth embodiment, the same effects as those of the first embodiment can be obtained, and the data size of the compressed data can be further reduced than that of the first embodiment.

[第9の実施形態]
上記第8の実施形態では、有効領域を拡張するにあたり、有効領域と無効領域との境界位置内側のブロックの集計値に着目した。これに対して、第9の実施形態では、有効領域を拡張するにあたり、境界位置を介して隣接するブロックの集計値(有効領域と無効領域との境界位置内側のブロックの集計値と外側のブロックの集計値と)に着目する。以下、第9の実施形態について、上記第8の実施形態との相違点を中心に説明する。
[Ninth Embodiment]
In the above-described eighth embodiment, in extending the valid area, attention is paid to the total value of the blocks inside the boundary position between the valid area and the invalid area. On the other hand, in the ninth embodiment, when expanding the valid area, the total value of the blocks adjacent to each other across the boundary position (the aggregate value of the blocks inside the boundary position between the valid area and the invalid area and the blocks outside and ). The ninth embodiment will be described below, focusing on differences from the eighth embodiment.

<解析装置の機能構成>
はじめに、第8の実施形態に係る解析装置120の機能構成について説明する。図28は、解析装置の機能構成の一例を示す第7の図である。図25に示した機能構成との相違点は、有効領域判定部2810の機能が、有効領域判定部2520の機能と異なる点、無効化画像生成部2830の機能が、無効化画像生成部2530の機能と異なる点である。また、初期無効化画像生成部2510に代えて、初期有効領域設定部2820を有する点である。
<Functional configuration of analysis device>
First, the functional configuration of an analysis device 120 according to the eighth embodiment will be described. FIG. 28 is a seventh diagram showing an example of the functional configuration of the analysis device; The difference from the functional configuration shown in FIG. This is different from function. Also, instead of the initial invalidation image generation unit 2510, an initial valid area setting unit 2820 is provided.

初期有効領域設定部2820は、はじめに、有効領域判定部2810に対して最小限の有効領域を設定する。 Initial valid area setting section 2820 first sets the minimum valid area for valid area determining section 2810 .

有効領域判定部2810は、集計結果格納部380より集計結果を読み出し、それぞれの量子化値における各ブロックの集計値に基づいて、有効領域を拡張するか否かを判定する。 Valid area determination unit 2810 reads out the total result from total result storage unit 380, and determines whether or not to expand the effective area based on the total value of each block in each quantization value.

具体的には、有効領域判定部2810は、画像データ全体に対して量子化値を上げるごとに生成されるそれぞれの圧縮データについて、各ブロックの集計値が算出され、集計結果格納部380に格納された場合に、各ブロックの集計値を取得する。 Specifically, the valid area determination unit 2810 calculates the total value of each block for each compressed data generated each time the quantization value is increased for the entire image data, and stores the total value in the total result storage unit 380 . Gets the aggregate value for each block, if any.

その際、有効領域判定部2810では、初期有効領域と無効領域との境界位置内側にあるブロックと外側にあるブロックとの間(境界位置を介して隣接するブロック間)で、集計値の差分を算出する。そして、有効領域判定部2810では、算出した差分が所定の閾値以上であると判定した場合に、境界位置外側にあるブロックを有効領域に含める。 At that time, the valid area determination unit 2810 calculates the difference in total value between the block inside the boundary position between the initial valid area and the invalid area and the block outside the boundary position (blocks adjacent to each other via the boundary position). calculate. Then, when the valid area determination unit 2810 determines that the calculated difference is equal to or greater than a predetermined threshold value, the blocks outside the boundary position are included in the valid area.

その後も、継続して、画像データ全体に対して量子化値を上げるごとに生成されるそれぞれの圧縮データについて、同様に、各ブロックの集計値を取得する。その際、有効領域判定部2810では、拡張後の有効領域と無効領域との境界位置内側にあるブロックと外側にあるブロックとの間で、集計値の差分を算出する。そして、有効領域判定部2810では、算出した差分が所定の閾値以上であると判定した場合に、境界位置外側にあるブロックを有効領域に含める。 After that, the total value of each block is similarly obtained for each piece of compressed data generated each time the quantization value is increased for the entire image data. At this time, the valid area determination unit 2810 calculates the difference in the total values between the blocks inside and outside the boundary position between the valid area and the invalid area after expansion. Then, when the valid area determination unit 2810 determines that the calculated difference is equal to or greater than a predetermined threshold value, the blocks outside the boundary position are included in the valid area.

無効化画像生成部2830は、有効領域判定部2810による有効領域の拡張が完了した際の有効領域に基づいて無効化画像データを生成する。また、無効化画像生成部2830は、生成した無効化画像データを出力部340に通知する。 The invalidation image generation unit 2830 generates invalidation image data based on the effective area when the effective area determination unit 2810 completes the extension of the effective area. In addition, the invalidation image generation unit 2830 notifies the output unit 340 of the generated invalidation image data.

<有効領域判定部による処理の具体例>
次に、有効領域判定部2810による処理の具体例について説明する。図29は、有効領域判定部による処理の具体例を示す第2の図である。図29において、画像データ2910は、画像圧縮装置130により圧縮処理される画像データである。また、画像データ2910内の、初期有効領域2912は、初期有効領域設定部2820により設定された初期有効領域を示している。
<Specific example of processing by effective area determination unit>
Next, a specific example of processing by the valid area determination unit 2810 will be described. FIG. 29 is a second diagram showing a specific example of processing by the valid area determination unit. In FIG. 29, image data 2910 is image data compressed by the image compression device 130 . An initial valid area 2912 in the image data 2910 indicates an initial valid area set by the initial valid area setting section 2820 .

ここで、画像データ2910に対しては、画像圧縮装置130が、それぞれの量子化値を用いて圧縮処理を行い、圧縮データを生成する。これにより、CNN部320では、それぞれの量子化値に対応する圧縮データを復号した復号データに対して認識処理を行い、集計部360では、それぞれの量子化値に対応する、認識結果への影響度をブロック単位で集計する。 Here, the image compression device 130 performs compression processing on the image data 2910 using each quantization value to generate compressed data. As a result, the CNN unit 320 performs recognition processing on the decoded data obtained by decoding the compressed data corresponding to each quantization value, and the summation unit 360 recognizes the influence on the recognition result corresponding to each quantization value. Aggregate degrees in blocks.

図29において、グラフ2931は、それぞれの量子化値に対応する、ブロック2921(ブロック番号="ブロックX")の集計値を示している。なお、ブロック2921は、初期有効領域2912と無効領域2911との境界位置内側のブロックである。 In FIG. 29, a graph 2931 shows aggregate values of block 2921 (block number=“block X”) corresponding to each quantization value. Note that the block 2921 is a block inside the boundary position between the initial valid area 2912 and the invalid area 2911 .

また、グラフ2932は、それぞれの量子化値に対応する、ブロック2922(ブロック番号="ブロックX+1")の集計値を示している。なお、ブロック2922は、初期有効領域2912と無効領域2911との境界位置外側のブロックであって、ブロック2921と隣接するブロックである。 Also, a graph 2932 shows aggregated values of block 2922 (block number=“block X+1”) corresponding to each quantization value. Note that the block 2922 is a block outside the boundary position between the initial valid area 2912 and the invalid area 2911 and adjacent to the block 2921 .

有効領域判定部2810では、現在の量子化値に対応する、ブロック2921の集計値と、ブロック2922の集計値との差分を算出し、算出した差分が所定の閾値以上であるか否かを判定することで、ブロック2922を有効領域に含めるか否かを判定する。 The valid area determination unit 2810 calculates the difference between the aggregated value of block 2921 and the aggregated value of block 2922 corresponding to the current quantized value, and determines whether the calculated difference is equal to or greater than a predetermined threshold. By doing so, it is determined whether or not the block 2922 is included in the valid area.

図29の例は、ブロック2922について、有効領域に含めると判定された様子を示している。なお、有効領域判定部2810では、初期有効領域と無効領域との境界位置内側にある全てのブロックについて同様の処理を行う。 The example of FIG. 29 shows how block 2922 is determined to be included in the valid area. Note that the valid area determination unit 2810 performs the same processing for all blocks inside the boundary position between the initial valid area and the invalid area.

図29において、画像データ2940は、有効領域判定部2810により、拡張後の有効領域2942が設定された様子を示している。図29において、ブロック2922は、新たに有効領域に含めたブロックである。 In FIG. 29, the image data 2940 shows how the effective area determining section 2810 sets the effective area 2942 after expansion. In FIG. 29, block 2922 is a block newly included in the valid area.

なお、画像圧縮装置130では、その後も、継続して画像データ全体に対して量子化値を上げるごとに生成されるそれぞれの圧縮データについて、同様に、各ブロックの集計値を取得する。その際、有効領域判定部2810では、拡張後の有効領域2942と無効領域2941との境界位置内側にあるブロックと外側にあるブロックとの間で、集計値の差分を算出する。そして、有効領域判定部2810では、算出した差分が所定の閾値以上であると判定した場合に、境界位置外側にあるブロックを有効領域に含める。 After that, the image compression device 130 similarly obtains the total value of each block for each compressed data generated each time the quantization value is increased for the entire image data. At this time, the valid area determination unit 2810 calculates the difference in total value between the block inside and outside the boundary position between the valid area 2942 and the invalid area 2941 after expansion. Then, when the valid area determination unit 2810 determines that the calculated difference is equal to or greater than a predetermined threshold value, the blocks outside the boundary position are included in the valid area.

有効領域判定部2810では、有効領域の拡張が完了すると、完了時の有効領域を無効化画像生成部2830に通知し、無効化画像生成部2830では、通知された有効領域に基づいて、無効化画像データを生成する。 When the expansion of the valid area is completed, the valid area determination unit 2810 notifies the invalidation image generation unit 2830 of the valid area at the time of completion. Generate image data.

<圧縮処理システムによる画像圧縮処理の流れ>
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図30は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第9のフローチャートである。図27に示した第8のフローチャートとの相違点は、ステップS3001~S3009である。
<Flow of image compression processing by compression processing system>
Next, the flow of image compression processing by the compression processing system 100 will be described. FIG. 30 is a ninth flowchart showing an example of the flow of image compression processing by the compression processing system. The difference from the eighth flowchart shown in FIG. 27 is steps S3001 to S3009.

ステップS3001において、初期有効領域設定部2820は、初期有効領域を設定する。 In step S3001, initial valid area setting section 2820 sets an initial valid area.

ステップS3002において、画像圧縮装置130は、現在の量子化値で画像データに対して圧縮処理を行い、圧縮データを生成する。 In step S3002, the image compression device 130 compresses the image data using the current quantization value to generate compressed data.

ステップS3003において、CNN部320は、圧縮データを復号した復号データに対して認識処理を行うことで認識結果を出力し、重要特徴マップ生成部350は、重要特徴マップを生成する。また、集計部360は、ブロック単位で影響度を集計する。 In step S3003, the CNN unit 320 outputs recognition results by performing recognition processing on the decoded data obtained by decoding the compressed data, and the important feature map generation unit 350 generates an important feature map. In addition, the aggregation unit 360 aggregates the degree of impact for each block.

ステップS3004において、有効領域判定部2810は、現在の有効領域及び無効領域について、境界位置内側のブロックと外側のブロックとの間で集計値の差分を算出し、算出した集計値の差分が所定の閾値以上であるか否かを判定する。 In step S3004, valid area determination section 2810 calculates the difference in the total values between the blocks inside the boundary position and the blocks outside the boundary position for the current valid area and the invalid area. It is determined whether or not it is equal to or greater than the threshold.

ステップS3004において、所定の閾値未満であると判定した場合には(ステップS3004においてNoの場合には)、ステップS3006に進む。 If it is determined in step S3004 that it is less than the predetermined threshold value (No in step S3004), the process proceeds to step S3006.

一方、ステップS3004において、所定の閾値以上であると判定した場合には(ステップS3004においてYesの場合には)、ステップS3005に進む。 On the other hand, if it is determined in step S3004 that it is equal to or greater than the predetermined threshold value (Yes in step S3004), the process proceeds to step S3005.

ステップS3005において、有効領域判定部2810は、境界位置外側のブロックを有効領域に含める。 In step S3005, valid area determination section 2810 includes blocks outside the boundary position in the valid area.

ステップS3006において、量子化値設定部330は、圧縮レベル(量子化値)を上げ、ステップS3007に進む。 In step S3006, quantization value setting section 330 increases the compression level (quantization value), and proceeds to step S3007.

ステップS3007において、量子化値設定部330は、圧縮レベル(量子化値)が上限を超えたか否かを判定し、上限を超えていないと判定した場合には(ステップS3007においてNoの場合には)、ステップS3002に戻る。 In step S3007, quantization value setting section 330 determines whether or not the compression level (quantization value) exceeds the upper limit. ) and returns to step S3002.

一方、ステップS3007において、上限を超えたと判定した場合には(ステップS3007においてYesの場合には)、ステップS3008に進む。 On the other hand, if it is determined in step S3007 that the upper limit has been exceeded (if Yes in step S3007), the process proceeds to step S3008.

ステップS3008において、無効化画像生成部2830は、現在の有効領域に基づいて、無効化画像データを生成する。 In step S3008, invalidation image generation section 2830 generates invalidation image data based on the current valid area.

ステップS3009において、画像圧縮装置130は、無効化画像データに対して圧縮処理を行い、圧縮データを格納する。なお、画像圧縮装置130では、例えば、有効領域を拡張した際の量子化値を用いて、無効化画像データに対して圧縮処理を行う。 In step S3009, the image compression device 130 compresses the invalidated image data and stores the compressed data. Note that the image compression device 130 performs compression processing on invalidated image data using, for example, a quantization value when the valid area is expanded.

以上の説明から明らかなように、第9の実施形態に係る解析装置は、はじめに最小限の有効領域を設定しておき、量子化値を上げた際の、境界位置の隣接ブロック間の集計値の差分に応じて、徐々に有効領域を拡張していく。 As is clear from the above description, the analysis apparatus according to the ninth embodiment first sets the minimum effective area, and when the quantization value is increased, the total value between adjacent blocks at the boundary position The effective area is gradually expanded in accordance with the difference between .

これにより、第9の実施形態に係る解析装置によれば、量子化値を上げたことによる認識精度の低下を、有効領域の拡張によりカバーすることが可能となり、より大きな量子化値を最適な量子化値として圧縮処理を行うことが可能となる。 As a result, according to the analysis apparatus according to the ninth embodiment, it is possible to compensate for the decrease in recognition accuracy due to the increase in the quantization value by extending the effective region. Compression processing can be performed as a quantized value.

この結果、第9の実施形態によれば、上記第1の実施形態と同様の効果を奏するとともに、上記第1の実施形態よりも、圧縮データのデータサイズをより削減することができる。 As a result, according to the ninth embodiment, the same effects as those of the first embodiment can be obtained, and the data size of the compressed data can be further reduced than that of the first embodiment.

[その他の実施形態]
上記第1の実施形態では、最小の量子化値から最大の量子化値まで全てを用いて圧縮処理を行うものとして説明した。しかしながら、圧縮処理に用いる量子化値は、これに限られず、最小の量子化値から最大の量子化値までの間に含まれる所定数の量子化値を用いて圧縮処理を行ってもよい。所定数の量子化値とは、最適な量子化値を決定しうる数の量子化値を指し、少なくとも2以上の量子化値を指す。
[Other embodiments]
In the first embodiment described above, compression processing is performed using all quantized values from the minimum quantized value to the maximum quantized value. However, the quantization value used for compression processing is not limited to this, and compression processing may be performed using a predetermined number of quantization values included between the minimum quantization value and the maximum quantization value. The predetermined number of quantization values refers to the number of quantization values that can determine the optimum quantization value, and refers to at least two quantization values.

また、上記第1の実施形態では、画像データに1のオブジェクトが含まれるものとして説明した。しかしながら、画像データには複数のオブジェクトが含まれていてもよい。この場合、画像データ内の複数のオブジェクトについて、同時に、CNN部構造情報を取得し、複数のオブジェクトについて同時に圧縮レベルを決定してもよい。あるいは、画像データ内の複数のオブジェクトについて、個別に、CNN部構造情報を取得し、オブジェクトごとに圧縮レベルを決定した後に、各オブジェクトの圧縮レベルをマージすることで、画像データ全体の圧縮レベルを決定してもよい。 Further, in the first embodiment, the image data includes one object. However, the image data may contain multiple objects. In this case, the CNN structure information may be obtained for multiple objects in the image data at the same time, and the compression levels may be determined for the multiple objects at the same time. Alternatively, for a plurality of objects in the image data, the CNN structure information is individually acquired, the compression level is determined for each object, and then the compression level of each object is merged to obtain the compression level of the entire image data. may decide.

また、上記第3の実施形態では、疑似圧縮データを生成する際の画像処理として、ローパスフィルタを用いたフィルタリング処理を例に挙げて説明した。しかしながら、疑似圧縮データを生成する際の画像処理は、これに限定されない。 Further, in the above-described third embodiment, filtering processing using a low-pass filter has been described as an example of image processing for generating pseudo-compressed data. However, the image processing for generating pseudo-compressed data is not limited to this.

例えば、画像データ全体をフーリエ変換し、高周波成分をカットしたうえで、逆フーリエ変換してもよい。あるいは、画像データをブロック単位でフーリエ変換し、高周波成分をカットしたうえで、逆フーリエ変換してもよい。 For example, the entire image data may be Fourier-transformed, high-frequency components cut, and then inverse Fourier-transformed. Alternatively, the image data may be Fourier-transformed on a block-by-block basis, high-frequency components cut, and then inverse Fourier-transformed.

あるいは、画像データ全体をDCT変換し、量子化したうえで、逆DCT変換してもよい。あるいは、画像データをブロック単位でDCT変換し、量子化したうえで、逆DCT変換してもよい。 Alternatively, the entire image data may be DCT-transformed, quantized, and then inversely DCT-transformed. Alternatively, image data may be DCT-transformed block by block, quantized, and then inversely DCT-transformed.

また、上記第7~第9のいずれかの実施形態、あるいは、上記第7~第9のいずれかの実施形態を組み合わせた実施形態において、認識結果への影響度が大きい領域と小さい領域とに分離し、
・認識結果への影響度が大きい領域に対しては、上記第1~第6のいずれかの実施形態、あるいは、上記第1~第6のいずれかの実施形態を組み合わせた実施形態を適用し、
・認識結果への影響度が小さい領域に対しては、高圧縮の量子化値を適用してもよい(あるいは、無効領域としてもよい)。
Further, in any one of the seventh to ninth embodiments, or an embodiment combining any of the seventh to ninth embodiments, an area having a large influence on the recognition result and an area having a small influence separate,
- Any one of the first to sixth embodiments or an embodiment combining any one of the first to sixth embodiments is applied to an area that has a large influence on the recognition result. ,
- A highly compressed quantization value may be applied to an area having a small influence on the recognition result (or may be an invalid area).

なお、上記各実施形態において算出される圧縮レベルや、有効領域または無効領域を示す情報は、圧縮処理が行われることでデータサイズの削減が期待できる画像データに対する前処理の処理内容を決定するための情報として用いてもよい。ここでいう前処理には、例えば、画像データから色情報を削減する処理や、画像データから高周波成分を削減する処理等が含まれる。 It should be noted that the compression level calculated in each of the above embodiments and the information indicating the effective area or the ineffective area are used to determine the details of preprocessing for image data that can be expected to reduce the data size by performing compression processing. You may use it as information of The preprocessing referred to here includes, for example, processing for reducing color information from image data, processing for reducing high-frequency components from image data, and the like.

なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。 It should be noted that the present invention is not limited to the configurations shown here, such as combinations with other elements, etc., in the configurations described in the above embodiments. These points can be changed without departing from the gist of the present invention, and can be determined appropriately according to the application form.

100 :圧縮処理システム
120 :解析装置
130 :画像圧縮装置
310 :入力部
320 :CNN部
330 :量子化値設定部
340 :出力部
350 :重要特徴マップ生成部
360 :集計部
370 :量子化値決定部
420 :集計結果
810 :最大量子化値設定部
820 :量子化値決定部
910 :グループ情報
1110 :画像処理部
1410 :位置判定部
1420 :量子化値設定部
1430 :出力部
2110 :無効領域判定部
2120 :無効化画像生成部
2300 :無効化画像データ
2510 :初期無効化画像生成部
2520 :有効領域判定部
2530 :無効化画像生成部
2810 :有効領域判定部
2820 :初期有効領域設定部
2830 :無効化画像生成部
100: Compression processing system 120: Analysis device 130: Image compression device 310: Input unit 320: CNN unit 330: Quantization value setting unit 340: Output unit 350: Important feature map generation unit 360: Aggregation unit 370: Quantization value determination Unit 420: Aggregation result 810: Maximum quantization value setting unit 820: Quantization value determination unit 910: Group information 1110: Image processing unit 1410: Position determination unit 1420: Quantization value setting unit 1430: Output unit 2110: Invalid area determination Unit 2120: invalidation image generation unit 2300: invalidation image data 2510: initial invalidation image generation unit 2520: effective area determination unit 2530: invalidation image generation unit 2810: effective area determination unit 2820: initial effective area setting unit 2830: Invalidation image generator

Claims (11)

画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各領域の認識結果への影響度を示す情報を格納する格納部と、
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報に基づいて、前記画像データの各領域の圧縮レベルを決定する決定部と
を有する解析装置。
Recognition of each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed on image data at different compression levels. a storage unit for storing information indicating the degree of influence on the result;
and a determination unit that determines the compression level of each area of the image data based on information indicating the degree of influence of each area of the decoded data corresponding to the different compression levels on the recognition result.
前記復号データに対して認識処理が行われることで算出された、前記復号データの各領域の認識結果への影響度を示すマップを生成するマップ生成部と、
生成された前記マップに基づいて、前記復号データの各領域の認識結果への影響度を、圧縮処理が行われる際に用いられるブロック単位で集計する集計部と、を更に有し、
前記格納部は、前記ブロック単位で集計した集計値を、前記各領域の認識結果への影響度を示す情報として格納する、請求項1に記載の解析装置。
a map generation unit that generates a map indicating the degree of influence of each area of the decoded data on the recognition result, which is calculated by performing recognition processing on the decoded data;
a tallying unit that tallies, based on the generated map, the degree of influence of each region of the decoded data on the recognition result for each block used when compression processing is performed;
2. The analysis apparatus according to claim 1, wherein said storage unit stores the aggregated value aggregated for each block as information indicating the degree of influence of each area on the recognition result.
前記格納部は、
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報を、複数のグループに分類した場合の各グループに、圧縮レベルが対応付けられたグループ情報を格納し、
前記決定部は、
所定の圧縮レベルに対応する、各領域の認識結果への影響度を示す情報が、前記各グループのいずれに属するかを判定し、判定したグループに対応付けられた圧縮レベルを、前記画像データの各領域の圧縮レベルとして決定する、請求項1または2に記載の解析装置。
The storage unit is
Group information associated with a compression level is stored for each group when the information indicating the degree of influence on the recognition result of each region of the decoded data corresponding to the different compression levels is classified into a plurality of groups. death,
The decision unit
It is determined to which of the groups the information indicating the degree of influence of each region on the recognition result corresponding to the predetermined compression level belongs, and the compression level associated with the determined group is stored in the image data. 3. The analyzing apparatus according to claim 1, wherein the compression level of each area is determined.
前記決定部は、
画像データに対して画像処理が行われることで生成された疑似圧縮データに対して、認識処理が行われることで算出された、該疑似圧縮データの各領域の認識結果への影響度を示す情報が、前記各グループのいずれに属するかを判定し、判定したグループに対応付けられた圧縮レベルを、前記画像データの各領域の圧縮レベルとして決定する、請求項3に記載の解析装置。
The decision unit
Information indicating the degree of influence of each region of pseudo-compressed data on the recognition result, calculated by performing recognition processing on pseudo-compressed data generated by performing image processing on image data 4. The analyzing apparatus according to claim 3, further comprising: determining to which of the groups each of the image data belongs, and determining a compression level associated with the determined group as the compression level of each area of the image data.
前記決定部は、
異なる画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各領域の認識結果への影響度を示す情報が、所定の閾値を超えないように、前記異なる画像データそれぞれの各領域の圧縮レベルを決定する、請求項1に記載の解析装置。
The decision unit
Each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed at different compression levels for different image data. 2. The analyzing apparatus according to claim 1, wherein the compression level of each area of each of said different image data is determined so that the information indicating the degree of influence on the recognition result does not exceed a predetermined threshold.
前記決定部は、
所定のブロック単位で集計した集計値のうち、基準となるブロックの集計値と、他のブロックの集計値とを比較し、該基準となるブロックの圧縮レベルと、比較結果とに基づいて、他のブロックの圧縮レベルを決定する、請求項2に記載の解析装置。
The decision unit
Of the aggregated values aggregated in units of predetermined blocks, the aggregated value of the reference block is compared with the aggregated value of other blocks, and based on the compression level of the reference block and the comparison result, other 3. The analysis apparatus of claim 2, determining a compression level for blocks of .
前記決定部は、
誤った認識結果が出力される直前に出力された、正しい認識結果に対する前記復号データの各領域の認識結果への影響度を示す情報に重み係数をかけ、予め設定された圧縮レベルに加算することで、前記画像データの各領域の圧縮レベルを決定する、請求項1に記載の解析装置。
The decision unit
Multiplying information indicating the degree of influence of each region of the decoded data on the recognition result with respect to the correct recognition result output immediately before the erroneous recognition result is output by a weighting factor and adding the result to a preset compression level. 2. The apparatus of claim 1, wherein determining a compression level for each region of said image data.
誤った認識結果が出力される直前に出力された、正しい認識結果に対する前記復号データの各領域の認識結果への影響度を示す情報を取得し、無効領域を判定する無効領域判定部と、
画像データのうち、前記無効領域と判定された領域を無効化することで、無効化画像データを生成する無効化画像生成部と
を更に有する、請求項1に記載の解析装置。
an invalid area determination unit that acquires information indicating the degree of influence on the recognition result of each area of the decoded data with respect to the correct recognition result output immediately before the erroneous recognition result is output, and determines an invalid area;
2. The analysis apparatus according to claim 1, further comprising: an invalidated image generating unit that generates invalidated image data by invalidating the area determined as the invalid area in the image data.
画像データのうち、所定の無効領域を無効化することで、無効化画像データを生成する無効化画像生成部を更に有し、
前記格納部は、
前記無効化画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの無効化画像データの有効領域に含まれる各ブロックの集計値を格納し、
前記無効化画像生成部は、
前記無効化画像データの有効領域に含まれる各ブロックの集計値のうち、有効領域と無効領域との境界位置内側に位置するブロックの集計値が所定の条件を満たす場合、有効領域を拡張した新たな無効化画像データを生成する、請求項2に記載の解析装置。
further comprising a disabled image generation unit that generates disabled image data by disabling a predetermined disabled area in the image data;
The storage unit is
Disabled image data calculated by performing recognition processing on decoded data obtained by decoding respective compressed data when compression processing is performed on the disabled image data at different compression levels. stores the aggregate value of each block contained in the effective area of ,
The invalidation image generation unit
Among the aggregated values of the blocks included in the valid area of the invalidated image data, if the aggregated value of the blocks located inside the boundary position between the valid area and the invalid area satisfies a predetermined condition, the valid area is newly expanded to expand the aggregated value. 3. The analysis device according to claim 2, which generates invalidated image data.
画像データのうち、有効領域を判定する有効領域判定部と、
前記画像データのうち、判定された有効領域以外の無効領域を無効化することで、無効化画像データを生成する無効化画像生成部と、を更に有し、
前記格納部は、
画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各ブロックの集計値を格納し、
前記有効領域判定部は、
前記復号データの各ブロックの集計値のうち、前記有効領域と前記無効領域との境界位置を介して隣接するブロックの集計値が、所定の条件を満たす場合、該有効領域を拡張し、
前記無効化画像生成部は、
前記有効領域が拡張された拡張後の有効領域以外の無効領域を無効化することで、無効化画像データを生成する、請求項2に記載の解析装置。
an effective area determination unit that determines an effective area in image data;
a disabled image generating unit that generates disabled image data by disabling an invalid region other than the determined valid region in the image data;
The storage unit is
Aggregation of each block of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed at different compression levels for image data store the value,
The effective area determination unit
expanding the valid area when the aggregate value of blocks adjacent to each other across a boundary position between the valid area and the invalid area, among the aggregate values of each block of the decoded data, satisfies a predetermined condition;
The invalidation image generation unit
3. The analysis apparatus according to claim 2, wherein invalidated image data is generated by invalidating an invalid area other than the valid area after expansion of the valid area.
画像データに対して異なる圧縮レベルで圧縮処理が行われた場合のそれぞれの圧縮データを復号した復号データに対して、認識処理が行われることで算出された、それぞれの復号データの各領域の認識結果への影響度を示す情報を取得し、
前記異なる圧縮レベルに対応する、それぞれの復号データの各領域の認識結果への影響度を示す情報に基づいて、前記画像データの各領域の圧縮レベルを決定する、
処理をコンピュータに実行させるための解析プログラム。
Recognition of each region of each decoded data calculated by performing recognition processing on decoded data obtained by decoding each compressed data when compression processing is performed on image data at different compression levels. Get information that indicates the degree of influence on the result,
Determining the compression level of each region of the image data based on information indicating the degree of influence of each region of the decoded data corresponding to the different compression levels on the recognition result;
An analysis program for making a computer perform processing.
JP2021566651A 2019-12-25 2019-12-25 Analysis device and analysis program Active JP7310926B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/050896 WO2021130919A1 (en) 2019-12-25 2019-12-25 Analysis device and analysis program

Publications (2)

Publication Number Publication Date
JPWO2021130919A1 JPWO2021130919A1 (en) 2021-07-01
JP7310926B2 true JP7310926B2 (en) 2023-07-19

Family

ID=76573779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021566651A Active JP7310926B2 (en) 2019-12-25 2019-12-25 Analysis device and analysis program

Country Status (3)

Country Link
US (1) US20220284632A1 (en)
JP (1) JP7310926B2 (en)
WO (1) WO2021130919A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023047515A1 (en) * 2021-09-24 2023-03-30 富士通株式会社 Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program
WO2023181323A1 (en) * 2022-03-25 2023-09-28 富士通株式会社 Image processing system, image processing device, image processing method, and image processing program

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHOI, Hyomin and BAJIC, Ivan V.,HIGH EFFICIENCY COMPRESSION FOR OBJECT DETECTION,2018 IEEE Internatilnal Conference on Acoustics, Speech and Signal Processing,米国,IEEE,2018年09月13日,pp.1792-1796,<URL:https://ieeexplore.ieee.org/ document/8462653>,<DOI:10.1109/ICASSP.2018.8462653>
GALTERI, Leonardo et al.,Video Compression for Object Detection Algorithms,2018 24th International Conference on Pattern Recognition,米国,IEEE,2018年11月29日,pp.3007-3012,<URL:https://ieeexplore.ieee.org/document/8546064>,<DOI:10.1109/ICPR.2018.8546064>
SUZUKI, Satoshi et al.,IMAGE PRE-TRANSFORMATION FOR RECOGNITION-AWARE IMAGE COMPRESSION,2019 IEEE International Conference on Image Processing,米国,IEEE,2019年08月26日,pp 2686-2690,<URL:https://ieeexplore.ieee.org/document/8803275>,<DOI:10.1109/ICIP.2019.8803275>

Also Published As

Publication number Publication date
US20220284632A1 (en) 2022-09-08
JPWO2021130919A1 (en) 2021-07-01
WO2021130919A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
Li et al. A deep learning approach for multi-frame in-loop filter of HEVC
KR101901355B1 (en) Method and apparatus for performing graph-based prediction using optimazation function
CN110267041B (en) Image encoding method, image encoding device, electronic device, and computer-readable storage medium
Xu et al. Non-local convlstm for video compression artifact reduction
Zhang et al. Low-rank decomposition-based restoration of compressed images via adaptive noise estimation
Moorthy et al. Efficient motion weighted spatio-temporal video SSIM index
KR101808327B1 (en) Video encoding/decoding method and apparatus using paddding in video codec
JP7310926B2 (en) Analysis device and analysis program
US20030128754A1 (en) Motion estimation method for control on the basis of scene analysis in video compression systems
JP7479137B2 (en) Signal processing device, signal processing method, system, and program
US9319680B2 (en) Image encoding apparatus and its control method
Kirmemis et al. Learned compression artifact removal by deep residual networks
Yuan et al. Block-based learned image coding with convolutional autoencoder and intra-prediction aided entropy coding
WO2021130918A1 (en) Image processing system and image processing program
CN112991192B (en) Image processing method, device, equipment and system thereof
JP5913929B2 (en) Moving picture coding apparatus, control method therefor, and computer program
JP5809574B2 (en) Encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program
JP7491388B2 (en) IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD, AND IMAGE PROCESSING PROGRAM
WO2022130497A1 (en) Analysis device, analysis method, and analysis program
Lin et al. Coding unit partition prediction technique for fast video encoding in HEVC
Ouyang et al. Towards quantized DCT coefficients restoration for compressed images
Zhang et al. Principal Component Approximation Network for Image Compression
JP7310919B2 (en) Filter generation method, filter generation device and program
US20220239935A1 (en) Video compression with adaptive iterative intra-prediction
Kırmemiş et al. Learned Compression Artifact Removal by Deep Residual Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230619

R150 Certificate of patent or registration of utility model

Ref document number: 7310926

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150