JP7409400B2 - データ処理装置及びデータ処理プログラム - Google Patents
データ処理装置及びデータ処理プログラム Download PDFInfo
- Publication number
- JP7409400B2 JP7409400B2 JP2021574421A JP2021574421A JP7409400B2 JP 7409400 B2 JP7409400 B2 JP 7409400B2 JP 2021574421 A JP2021574421 A JP 2021574421A JP 2021574421 A JP2021574421 A JP 2021574421A JP 7409400 B2 JP7409400 B2 JP 7409400B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- data
- unit
- processing
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 422
- 238000007906 compression Methods 0.000 claims description 304
- 230000006835 compression Effects 0.000 claims description 302
- 238000000034 method Methods 0.000 claims description 76
- 230000008569 process Effects 0.000 claims description 40
- 238000012937 correction Methods 0.000 claims description 36
- 238000013139 quantization Methods 0.000 description 309
- 230000008859 change Effects 0.000 description 40
- 238000010586 diagram Methods 0.000 description 36
- 238000003384 imaging method Methods 0.000 description 23
- 230000002776 aggregation Effects 0.000 description 19
- 238000004220 aggregation Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 15
- 238000013473 artificial intelligence Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 230000003247 decreasing effect Effects 0.000 description 11
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000006866 deterioration Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
画像データに対して認識処理が行われた際の、各ブロックの認識結果への影響度に基づいて圧縮レベルが決定された場合において、該圧縮レベルを用いて該画像データに対して圧縮処理を行うことで、圧縮データを生成する符号化部と、前記圧縮データを復号した復号データに対して認識処理を行った場合の認識結果が、所定の条件を満たす場合に、認識対象に対応するブロックについて、前記圧縮レベルを上げる方向に補正する補正部とを有する。
<圧縮処理システムのシステム構成>
はじめに、第1の実施形態に係るデータ処理装置を含む、圧縮処理システム全体のシステム構成について説明する。図1は、圧縮処理システムのシステム構成の一例を示す第1の図である。第1の実施形態において、圧縮処理システムが実行する処理は、
・決定量子化値マップを生成する第1のフェーズと、
・決定量子化値マップを補正し、補正後決定量子化値マップを用いて圧縮処理を行い、圧縮データを格納する第2のフェーズと
に大別することができる。
次に、解析装置120及び画像圧縮装置130及びデータ処理装置140のハードウェア構成について説明する。なお、解析装置120と画像圧縮装置130とデータ処理装置140とは、同様のハードウェア構成を有するため、ここでは、図2を用いて、これらの装置の説明をまとめて行う。
次に、解析装置120の機能構成について説明する。図3は、解析装置の機能構成の一例を示す図である。上述したように、解析装置120には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置120は、入力部310、CNN部320、量子化値設定部330、出力部340として機能する。また、解析装置120は、重要特徴マップ生成部350、集計部360、量子化値決定部370、前景判定部380として機能する。
「Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradient-based localization." The IEEE International Conference on Computer Vision (ICCV), 2017, pp. 618-626」、
等の文献に開示されている。
次に、集計結果格納部390に格納される集計結果の具体例について説明する。図4は、集計結果の具体例を示す図である。このうち、4aは、画像データ410内の各ブロックの配置例を示している。4aに示すように、本実施形態では説明の簡略化のため、画像データ410内の各ブロックは全て同じ大きさ、同じ形状であるとする。また、画像データの左上のブロックのブロック番号を"ブロック1"とし、右下のブロックのブロック番号を"ブロックm"とする。
・対応する量子化値を用いて画像データ410に対して圧縮処理を行い、
・取得した圧縮データを復号した復号データを入力することで、学習済みモデルが認識処理を行い、
・認識処理時に算出された重要特徴マップに基づいて、対応するブロックにおいて集計された、
集計値が格納される。
次に、量子化値決定部370による処理の具体例について説明する。図5は、量子化値決定部による処理の具体例を示す図である。図5において、集計値グラフ510_1~510_mは、横軸に量子化値、縦軸に集計値をとり、集計結果420に含まれる各ブロックの各量子化値の集計値をそれぞれプロットすることで生成される。
・全ブロック共通のオフセット値を用いて調整されていてもよい。
・絶対値をとって集計されていてもよい。
・注目されていないブロックの集計値に基づいて、他のブロックの集計値が加工されていてもよい。
・集計値の大きさが所定の閾値を超えた場合、あるいは、
・集計値の変化量が所定の閾値を超えた場合、あるいは、
・集計値の傾きが所定の閾値を超えた場合、あるいは、
・集計値の傾きの変化が所定の閾値を超えた場合、
のいずれかの条件を満たす場合に、各ブロックの最適な量子化値を決定し、量子化値マップを生成する。
・集計の際のブロックのサイズより、圧縮処理に用いるブロックのサイズの方が大きい場合
圧縮処理に用いるブロックに含まれる、集計の際の各ブロックの集計値に基づく量子化値の平均値(あるいは、最小値、最大値、その他の指標で加工した値)を、圧縮処理に用いる各ブロックの量子化値とする。
・集計の際のブロックのサイズより、圧縮処理に用いるブロックのサイズの方が小さい場合
集計の際のブロックに含まれる、圧縮処理に用いる各ブロックの量子化値として、集計の際のブロックの集計値に基づく量子化値を用いる。
次に、前景判定部380による処理の具体例について説明する。図6は、前景判定部による処理の具体例を示す図である。上述したように、前景判定部380には、量子化値決定部370より、各ブロックに量子化値が設定された量子化値マップ530が通知される。また、前景判定部380には、CNN部320より、オブジェクトの領域を示すバウンディングボックス(図6の例では、バウンディングボックス611、612)が通知される。
次に、画像圧縮装置130の機能構成について説明する。図7は、画像圧縮装置の機能構成の一例を示す第1の図である。上述したように、画像圧縮装置130には、画像圧縮プログラムがインストールされており、当該プログラムが実行されることで、画像圧縮装置130は、符号化部720として機能する。
・デブロッキングフィルタ(Deblocking filter:DB)、
・サンプルアダプティブオフセットフィルタ(Sample Adaptive Offset filter:SAO)、
・適応ループフィルタ(Adaptive loop filter:ALF)、
が含まれる。
次に、データ処理装置140の機能構成について説明する。図8は、データ処理装置の機能構成の一例を示す第1の図である。上述したように、データ処理装置140には、データ処理プログラムがインストールされており、当該プログラムが実行されることで、データ処理装置140は、符号化部810、復号部820、CNN部830、量子化値補正部840として機能する。
・符号化部810が、決定量子化値マップを用いて圧縮処理を行うことで圧縮データを生成した場合、かつ、
・復号部820が、当該圧縮データを復号することで生成した復号データを、CNN部830に入力した場合、
に認識処理を行うことで出力した認識結果に含まれるスコア情報を、"基準スコア情報"として、量子化値補正部840に通知する。
・符号化部810が、前景ブロックの量子化値を増減させた決定量子化値マップを用いて圧縮処理を行うことで圧縮データを生成した場合、かつ、
・復号部820が、当該圧縮データを復号することで生成した復号データを、CNN部830に入力した場合、
に認識処理を行うことで出力した認識結果に含まれるスコア情報を、"スコア情報"として、量子化値補正部840に通知する。
次に、データ処理装置140による処理の具体例について説明する。図9は、データ処理装置による処理の具体例を示す図である。図9において、横軸900は量子化値を示している。
・オブジェクトAに含まれるブロックの量子化値が"40"の場合、オブジェクトAを認識できたが、量子化値が"41"以上の場合には、オブジェクトAを認識できなかった、
・オブジェクトBに含まれるブロックの量子化値が"30"の場合、オブジェクトBを認識できたが、量子化値が"31"以上の場合にはオブジェクトBを認識できなかった、
とする。
次に、圧縮処理システム100による画像圧縮処理の流れについて説明する。図10は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第1のフローチャートである。
上記第1の実施形態では、認識結果への影響度に基づいて決定された量子化値を、認識結果に基づいて補正することで、認識精度を維持しつつ圧縮レベルを向上させるケースについて説明した。しかしながら、画像データによっては、圧縮処理を行わない状態で、既に認識精度が低い画像データも存在しうる。
はじめに、第2の実施形態に係るデータ処理装置を含む、圧縮処理システム全体のシステム構成について説明する。図11は、圧縮処理システムのシステム構成の一例を示す第2の図である。第2の実施形態において、圧縮処理システム1100が実行する処理は、
・画像データを変更する第1のフェーズと、
・変更後の画像データに基づいて決定量子化値マップを生成し、生成した決定量子化値マップを用いて圧縮処理を行うことで、圧縮データを格納する第2のフェーズと
に大別することができる。
次に、データ処理装置1110の機能構成について説明する。図12は、データ処理装置の機能構成の一例を示す第2の図である。上記第1の実施形態同様、データ処理装置1110には、データ処理プログラムがインストールされており、当該プログラムが実行されることで、データ処理装置1110は、CNN部1210、判定部1220として機能する。また、データ処理装置1110は、解析部1230、画像データ変更部1240として機能する。
次に、データ処理装置1110の解析部1230による処理の具体例について説明する。図13は、解析部による処理の具体例を示す第1の図である。図13に示すように、解析部1230は、例えば、リファイン画像生成部1310と、重要特徴指標マップ生成部1320と、特定部1340と、詳細解析部1350とを有する。
・生成したリファイン画像データを用いて認識処理を行った際のスコア情報と、正解ラベルのスコア情報を最大化したスコア情報との誤差(スコア誤差)と、
・生成したリファイン画像データと画像データとの差分である画像差分値と、
を最小化するようにCNNの学習を行う。
・予め定められた学習回数分(例えば、最大学習回数=N回分)、あるいは、
・正解ラベルのスコア情報が所定の閾値を超えるまで、あるいは、
・正解ラベルのスコア情報が所定の閾値を超え、かつ、画像差分値が所定の閾値より小さくなるまで、
行われ、推論部1313より出力される正解ラベルのスコア情報が最大化した際のリファイン画像データを、以下では、"スコア最大化リファイン画像データ"と称す。
次に、データ処理装置1110の解析部1230による処理の他の具体例について説明する。図14は、解析部による処理の具体例を示す第2の図である。図14に示すように、解析部1230は、例えば、リファイン画像生成部1310を有する。
次に、圧縮処理システム1100による画像圧縮処理の流れについて説明する。図15は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第2のフローチャートである。
上記第2の実施形態では、認識精度が低い画像データが入力された場合に、はじめに画像データを変更することで、認識精度を向上させつつ、圧縮レベルを向上させるケースについて説明した。
はじめに、第3の実施形態に係るデータ処理装置を含む、圧縮処理システム全体のシステム構成について説明する。図16及び図17は、圧縮処理システムのシステム構成の一例を示す第3及び第4の図である。第3の実施形態において、圧縮処理システムが実行する処理は、
・決定量子化値マップを生成するために、異なる圧縮レベル(量子化値)で圧縮処理を行うとともに、集計値グラフを監視する第1のフェーズと、
・集計値グラフに基づき、画像データの変更が必要であると判定した場合に、画像データを変更し、変更後の画像データに対して、同様の処理を行う第2のフェーズと、
・決定量子化値マップを生成し、生成した決定量子化値マップを用いて、変更後の画像データに対して圧縮処理を行うことで、圧縮データを格納する第3のフェーズと、
に大別することができる。
次に、データ処理装置1610の機能構成について説明する。図18は、データ処理装置の機能構成の一例を示す第3の図である。上記第2の実施形態同様、データ処理装置1610には、データ処理プログラムがインストールされており、当該プログラムが実行されることで、データ処理装置1610は、入力部1810、判定部1820として機能する。また、データ処理装置1610は、解析部1230、画像データ変更部1240として機能する。
次に、圧縮処理システム1600による画像圧縮処理の流れについて説明する。図19は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第3のフローチャートである。
上記第3の実施形態では、決定量子化値マップを生成するにあたり、各ブロックの集計値グラフを監視することで、画像データの変更が必要であるか否かを判定するケースについて説明した。
はじめに、第4の実施形態に係るデータ処理装置を含む、圧縮処理システム全体のシステム構成について説明する。図20及び図21は、圧縮処理システムのシステム構成の一例を示す第4及び第5の図である。第4の実施形態において、圧縮処理システムが実行する処理は、
・決定量子化値マップを生成し、生成した決定量子化値マップを用いて圧縮処理を行う第1のフェーズと、
・圧縮データについて認識精度を確認し、画像データを変更する第2のフェーズと、
・変更後の画像データに対して圧縮処理を行い、圧縮データを格納する第3のフェーズと
に大別することができる。
次に、データ処理装置2010の機能構成について説明する。図22は、データ処理装置の機能構成の一例を示す第4の図である。上記第2の実施形態同様、データ処理装置2010には、データ処理プログラムがインストールされており、当該プログラムが実行されることで、データ処理装置2010は、復号部2210、CNN部1210、判定部1220として機能する。また、データ処理装置2010は、解析部1230、画像データ変更部2240として機能する。
次に、圧縮処理システム2000による画像圧縮処理の流れについて説明する。図23は、圧縮処理システムによる画像圧縮処理の流れの一例を示す第4のフローチャートである。
上記第1の実施形態では、決定量子化値マップを生成した後に、各ブロックが前景ブロックであるか背景ブロックであるかを判定し、背景ブロックであると判定した場合に、当該ブロックの量子化値を最大化するものとして説明した。しかしながら、決定量子化値マップを生成する処理と、背景ブロックの量子化値を最大化する処理との間の処理順序はこれに限定されず、背景ブロックの量子化値を最大化する処理を行った後に、決定量子化値マップを生成する処理を行ってもよい。
・ビットレートを制御するアルゴリズムに基づいて決定された各量子化値、あるいは、
・フレーム内または複数のフレームにわたって固定的に設定された各ブロックの量子化値、
を大きくする方向に調整する際、調整の強さをより大きくし、小さくする方向に調整する際、調整の強さをより小さくしてもよい。
・ビットレートを制御するアルゴリズムに基づいて決定された各量子化値、あるいは、
・フレーム内または複数のフレームにわたって固定的に設定された各ブロックの量子化値、
を大きくする方向に調整する際、調整の強さをより大きくし、小さくする方向に調整する際、調整の強さをより小さくしてもよい。
・ビットレートを制御するアルゴリズムに基づいて決定された各ブロックの量子化値、あるいは、
・フレーム内または複数のフレームにわたって固定的に設定された各ブロックの量子化値、
であって、重み付け指標を用いて調整した量子化値を、他の情報に応じて更に変更してもよい。ここでいう他の情報には、圧縮データを復号して認識処理を行った際のスコア情報、分類確率、誤差情報、あるいは、オブジェクトの位置情報など、認識精度に影響する値の変化や推移状況が含まれる。なお、画像圧縮装置130では、認識精度に影響する値が維持されるように、あるいは、改善されるように、あるいは、所定の許容範囲内の低下で収まるように、量子化値を変更するものとする。また、画像圧縮装置130では、対応する画像データに対して、あるいは、対応する画像データよりも後に取得される画像データに対して、変更後の量子化値を用いて圧縮処理を行うものとする。あるいは、画像圧縮装置130では、対応する画像データと対応する画像データよりも後に取得される画像データとを含む複数の画像データに対して、変更後の量子化値を用いて圧縮処理を行うものとする。
・認識精度が低いと判定された復号データとは別の復号データまたは画像データであって、かつ、
・認識精度が低いと判定された復号データよりも、認識精度が高い復号データまたは画像データ、
が存在する場合には、スコア最大化リファイン画像を生成する代わりに、当該認識精度が高い復号データまたは画像データを用いてもよい。これにより、スコア最大化リファイン画像を生成する処理を省略することができる。
120 :解析装置
130 :画像圧縮装置
140 :データ処理装置
310 :入力部
320 :CNN部
330 :量子化値設定部
340 :出力部
350 :重要特徴マップ生成部
360 :集計部
370 :量子化値決定部
380 :前景判定部
420 :集計結果
810 :符号化部
820 :復号部
830 :CNN部
840 :量子化値補正部
1100 :圧縮処理システム
1110 :データ処理装置
1210 :CNN部
1220 :判定部
1230 :解析部
1240 :画像データ変更部
1310 :リファイン画像生成部
1320 :重要特徴指標マップ生成部
1340 :特定部
1350 :詳細解析部
1600 :圧縮処理システム
1610 :データ処理装置
2000 :圧縮処理システム
2010 :データ処理装置
2210 :復号部
2240 :画像データ変更部
Claims (9)
- 画像データに対して認識処理が行われた際の、各ブロックの認識結果への影響度に基づいて圧縮レベルが決定された場合において、該圧縮レベルを用いて該画像データに対して圧縮処理を行うことで、圧縮データを生成する符号化部と、
前記圧縮データを復号した復号データに対して認識処理を行った場合の認識結果が、所定の条件を満たす場合に、認識対象に対応するブロックについて、前記圧縮レベルを上げる方向に補正する補正部と
を有するデータ処理装置。 - 前記補正部は、
前記圧縮データを復号した復号データに対して認識処理を行った場合の認識結果が所定の条件を満たさない場合、前記認識対象に対応するブロックについて、前記圧縮レベルを下げる方向に補正する請求項1に記載のデータ処理装置。 - 前記補正部は、
前記圧縮データを復号した復号データに対して認識処理を行った場合の認識結果に含まれるスコア情報と所定の閾値とを比較することで、前記認識結果が所定の条件を満たすか否かを判定する、請求項1または2に記載のデータ処理装置。 - 前記補正部は、
前記画像データに対して認識処理を行った場合の認識結果に含まれるスコア情報と、前記圧縮データを復号した復号データに対して認識処理を行った場合の認識結果に含まれるスコア情報とを比較することで、前記認識結果が所定の条件を満たすか否かを判定する、請求項1または2に記載のデータ処理装置。 - 圧縮処理される画像データが入力された場合に、該画像データに対して認識処理が行われた場合の認識結果に含まれるスコア情報を取得し、該スコア情報に基づいて、該画像データの変更が必要か否かを判定する判定部と、
前記判定部により、前記画像データの変更が必要でないと判定された場合、入力された前記画像データを出力し、前記判定部により、前記画像データの変更が必要であると判定された場合、前記スコア情報が最大化するように、前記画像データを変更し、変更後の前記画像データを出力する変更部と
を有するデータ処理装置。 - 圧縮データを復号する復号部を更に有し、
前記判定部は、前記復号部により圧縮データが復号されることで生成された画像データに対して認識処理が行われた場合の認識結果に含まれるスコア情報を取得する、請求項5に記載のデータ処理装置。 - 圧縮処理される画像データが入力された場合に、該画像データの認識精度に関わる情報を取得し、該画像データの認識精度に関わる情報に基づいて、該画像データの変更が必要か否かを判定する判定部と、
前記判定部により、前記画像データの変更が必要でないと判定された場合、入力された前記画像データを出力し、前記判定部により、前記画像データの変更が必要であると判定された場合、前記画像データを変更し、変更後の前記画像データを出力する変更部と、を有し、
前記画像データに対して異なる圧縮レベルで圧縮処理が行われ、かつ、
各圧縮データが復号され、各復号データに対して認識処理が行われ、かつ、
各認識処理時の認識結果への影響度がブロックごとに集計された場合において、
前記判定部は、
前記ブロックごとの集計値を、前記画像データの認識結果に関わる情報として取得する、データ処理装置。 - コンピュータに、
画像データに対して認識処理が行われた際の、各ブロックの認識結果への影響度に基づいて圧縮レベルが決定された場合において、該圧縮レベルを用いて該画像データに対して圧縮処理を行うことで、圧縮データを生成し、
前記圧縮データを復号した復号データに対して認識処理を行った場合の認識結果が、所定の条件を満たす場合に、認識対象に対応するブロックについて、前記圧縮レベルを上げる方向に補正する、
処理を実行させるためのデータ処理プログラム。 - コンピュータに、
圧縮処理される画像データが入力された場合に、該画像データに対して認識処理が行われた場合の認識結果に含まれるスコア情報を取得し、該スコア情報に基づいて、該画像データの変更が必要か否かを判定し、
前記画像データの変更が必要でないと判定された場合、入力された前記画像データを出力し、前記画像データの変更が必要であると判定された場合、前記スコア情報が最大化するように、前記画像データを変更し、変更後の前記画像データを出力する、
処理を実行させるためのデータ処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/003785 WO2021152849A1 (ja) | 2020-01-31 | 2020-01-31 | データ処理装置及びデータ処理プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021152849A1 JPWO2021152849A1 (ja) | 2021-08-05 |
JPWO2021152849A5 JPWO2021152849A5 (ja) | 2022-09-16 |
JP7409400B2 true JP7409400B2 (ja) | 2024-01-09 |
Family
ID=77079801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021574421A Active JP7409400B2 (ja) | 2020-01-31 | 2020-01-31 | データ処理装置及びデータ処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220312019A1 (ja) |
JP (1) | JP7409400B2 (ja) |
WO (1) | WO2021152849A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7533622B2 (ja) | 2020-12-15 | 2024-08-14 | 富士通株式会社 | 解析装置、解析方法及び解析プログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11764806B2 (en) | 2021-09-06 | 2023-09-19 | Nec Corporation | Data compression system and method of using |
JPWO2023047516A1 (ja) * | 2021-09-24 | 2023-03-30 | ||
WO2023181323A1 (ja) * | 2022-03-25 | 2023-09-28 | 富士通株式会社 | 画像処理システム、画像処理装置、画像処理方法及び画像処理プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003124815A (ja) | 2001-10-15 | 2003-04-25 | Japan Science & Technology Corp | 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム |
JP2016025494A (ja) | 2014-07-22 | 2016-02-08 | ルネサスエレクトロニクス株式会社 | 画像受信装置、画像伝送システムおよび画像受信方法 |
JP2016046707A (ja) | 2014-08-25 | 2016-04-04 | ルネサスエレクトロニクス株式会社 | 画像通信装置、画像送信装置および画像受信装置 |
JP2017073755A (ja) | 2015-10-09 | 2017-04-13 | キヤノン株式会社 | 符号化装置及びその制御方法、プログラム並びに記憶媒体 |
-
2020
- 2020-01-31 WO PCT/JP2020/003785 patent/WO2021152849A1/ja active Application Filing
- 2020-01-31 JP JP2021574421A patent/JP7409400B2/ja active Active
-
2022
- 2022-06-13 US US17/838,321 patent/US20220312019A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003124815A (ja) | 2001-10-15 | 2003-04-25 | Japan Science & Technology Corp | 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム |
JP2016025494A (ja) | 2014-07-22 | 2016-02-08 | ルネサスエレクトロニクス株式会社 | 画像受信装置、画像伝送システムおよび画像受信方法 |
JP2016046707A (ja) | 2014-08-25 | 2016-04-04 | ルネサスエレクトロニクス株式会社 | 画像通信装置、画像送信装置および画像受信装置 |
JP2017073755A (ja) | 2015-10-09 | 2017-04-13 | キヤノン株式会社 | 符号化装置及びその制御方法、プログラム並びに記憶媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7533622B2 (ja) | 2020-12-15 | 2024-08-14 | 富士通株式会社 | 解析装置、解析方法及び解析プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021152849A1 (ja) | 2021-08-05 |
WO2021152849A1 (ja) | 2021-08-05 |
US20220312019A1 (en) | 2022-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7409400B2 (ja) | データ処理装置及びデータ処理プログラム | |
US7843995B2 (en) | Temporal and spatial analysis of a video macroblock | |
US20220284632A1 (en) | Analysis device and computer-readable recording medium storing analysis program | |
US20200213587A1 (en) | Method and apparatus for filtering with mode-aware deep learning | |
CN113196761A (zh) | 用于评估视频的主观质量的方法及装置 | |
JP5988577B2 (ja) | 画像符号化装置、画像符号化方法及びプログラム | |
US10536696B2 (en) | Image encoding device and image encoding method | |
US20180124431A1 (en) | In-loop post filtering for video encoding and decoding | |
US10123021B2 (en) | Image encoding apparatus for determining quantization parameter, image encoding method, and program | |
US11277626B2 (en) | Region of interest quality controllable video coding techniques | |
US20220277548A1 (en) | Image processing system, image processing method, and storage medium | |
WO2022130497A1 (ja) | 解析装置、解析方法及び解析プログラム | |
WO2022036678A1 (en) | Multi-level region-of-interest quality controllable video coding techniques | |
US20210306641A1 (en) | Transcoder target bitrate prediction techniques | |
US11330258B1 (en) | Method and system to enhance video quality in compressed video by manipulating bit usage | |
US20230014220A1 (en) | Image processing system, image processing device, and computer-readable recording medium storing image processing program | |
JP2022078735A (ja) | 画像処理装置、画像処理プログラム、画像認識装置、画像認識プログラム及び画像認識システム | |
US20230206611A1 (en) | Image processing device, and image processing method | |
US20230209057A1 (en) | Bit rate control system, bit rate control method, and computer-readable recording medium storing bit rate control program | |
WO2022157921A1 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
CN116760983B (zh) | 用于视频编码的环路滤波方法及装置 | |
US10715819B2 (en) | Method and apparatus for reducing flicker | |
KR20230120854A (ko) | 전자 장치의 영상 부호화 방법 | |
Lin et al. | Spatial-temporal feature guided adaptive rate control for screen content videos | |
US9998738B2 (en) | Image encoding apparatus, image encoding method and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220729 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7409400 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |