JP7075013B2 - 符号量推定装置、符号量推定方法及び符号量推定プログラム - Google Patents
符号量推定装置、符号量推定方法及び符号量推定プログラム Download PDFInfo
- Publication number
- JP7075013B2 JP7075013B2 JP2018166304A JP2018166304A JP7075013B2 JP 7075013 B2 JP7075013 B2 JP 7075013B2 JP 2018166304 A JP2018166304 A JP 2018166304A JP 2018166304 A JP2018166304 A JP 2018166304A JP 7075013 B2 JP7075013 B2 JP 7075013B2
- Authority
- JP
- Japan
- Prior art keywords
- code amount
- feature vector
- amount estimation
- feature
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2134—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
- G06F18/21343—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis using decorrelation or non-stationarity, e.g. minimising lagged cross-correlations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
このように、対象画像の局所特徴に基づいて推定した符号量を基準にして調整を行う場合、実際に調整可能な符号量よりも符号量が多くなったり、画像品質が低下したりすることがある課題がある。
以下、本発明の一実施形態に係る符号量推定装置について説明する。
以下、符号量推定装置の機能構成について、図面を参照しながら説明する。
図1は、本発明の一実施形態による符号量推定装置100の機能構成を示すブロック図である。
なお、ここで用いられるフィルタは、任意のフィルタで構わない。例えば、エッジ抽出フィルタ、平滑化フィルタ、先鋭化フィルタ、又は統計フィルタ等の、任意の線形又は非線形のフィルタを使用することができる。
なお、上記推定対象画像の符号量評価の評価方法には、任意の方法を用いることができる。
以下、符号量推定装置の動作の一例について、図面を参照しながら説明する。
図3は、本発明の一実施形態による符号量推定装置100の動作を示すフローチャートである。
次に、特徴マップ生成部103は、画像記憶部102に記憶された推定対象画像と少なくとも1つのフィルタとに基づいて、少なくとも1つの特徴マップを生成する(ステップS102)。
なお、生成される特徴マップの数も任意である。
i番目の特徴マップφiは以下の式(1)で表される。
次に、特徴ベクトル生成部104は、特徴マップ生成部103によって生成された特徴マップに基づいて特徴ベクトルを生成する(ステップS103)。
なお、特徴マップに基づいて生成される特徴ベクトルは、ベクトルではなく1階以上の任意のテンソルであってもよい。以下、説明を簡単にするため、生成される特徴ベクトルが1階のテンソルΨである場合について説明する。
例えば、統計量として平均値を用いる場合、特徴ベクトルはm個の要素を持ち、各要素は以下の式(2)のように表される。
例えば、統計量として平均値を用いる場合、この特徴ベクトルはn2個の要素を持ち、各要素は以下の式(3)のように表される。
例えば、統計量として平均値を用いる場合、この特徴ベクトルはm2個の要素を持ち、各要素は以下の式(4)のように表される。
最後に、符号量評価部105は、特徴ベクトル生成部104によって生成された特徴ベクトルに基づいて推定対象画像の符号量を評価し、推定符号量を出力する(ステップS104)。なお、推定対象画像の符号量の評価における評価方法は、任意の方法を用いることができる。また、評価値は、推定符号量でもよいし、符号量と相関のあるその他の値でもよい。最も単純には、評価値として、例えば、特徴ベクトルの各要素の重み付き線形和等が考えられる。
上記の構成を備えることにより、本発明の一実施形態による符号量推定装置100は、対象画像の大域的な特徴に基づいて符号量を推定することができる。
Claims (7)
- 推定対象画像と予め定められた少なくとも1つのフィルタとによって生成された特徴マップと、前記推定対象画像とに基づく演算によって特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトルに基づいて前記推定対象画像の符号量を評価する符号量評価部と、
を備える符号量推定装置。 - 前記特徴マップは、複数の前記フィルタによる階層的な畳み込み処理が行われることによって生成される
請求項1に記載の符号量推定装置。 - 前記フィルタは、方向別の移動平均フィルタであり、
前記特徴ベクトル生成部は、前記特徴マップと前記推定対象画像との差分を二次特徴マップとし、前記二次特徴マップの要素ごとに最も低い値を特徴ベクトルの要素とする
請求項1又は請求項2に記載の符号量推定装置。 - 前記特徴ベクトルは、前記特徴マップの統計量に基づいて生成される
請求項1又は請求項2に記載の符号量推定装置。 - 前記特徴ベクトルは、前記特徴マップどうしの相互相関に基づいて生成される
請求項1又は請求項2に記載の符号量推定装置。 - 符号量推定装置が行う符号量推定方法であって、
推定対象画像と予め定められた少なくとも1つのフィルタとによって生成された特徴マップと、前記推定対象画像とに基づく演算によって特徴ベクトルを生成する特徴ベクトル生成ステップと、
前記特徴ベクトルに基づいて前記推定対象画像の符号量を評価する符号量評価ステップと、
を有する符号量推定方法。 - 請求項1から請求項5のうちいずれか一項に記載の符号量推定装置としてコンピュータを機能させるための符号量推定プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018166304A JP7075013B2 (ja) | 2018-09-05 | 2018-09-05 | 符号量推定装置、符号量推定方法及び符号量推定プログラム |
PCT/JP2019/033213 WO2020050075A1 (ja) | 2018-09-05 | 2019-08-26 | 符号量推定装置、符号量推定方法及び符号量推定プログラム |
US17/273,271 US11595661B2 (en) | 2018-09-05 | 2019-08-26 | Encoding amount estimation apparatus, encoding amount estimation method and encoding amount estimation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018166304A JP7075013B2 (ja) | 2018-09-05 | 2018-09-05 | 符号量推定装置、符号量推定方法及び符号量推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020039088A JP2020039088A (ja) | 2020-03-12 |
JP7075013B2 true JP7075013B2 (ja) | 2022-05-25 |
Family
ID=69722630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018166304A Active JP7075013B2 (ja) | 2018-09-05 | 2018-09-05 | 符号量推定装置、符号量推定方法及び符号量推定プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11595661B2 (ja) |
JP (1) | JP7075013B2 (ja) |
WO (1) | WO2020050075A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018140158A1 (en) | 2017-01-30 | 2018-08-02 | Euclid Discoveries, Llc | Video characterization for smart enconding based on perceptual quality optimization |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100997541B1 (ko) * | 2008-10-08 | 2010-11-30 | 인하대학교 산학협력단 | 신상품 추천문제 해결을 위한 내용기반 필터링과 협업 필터링을 혼합한 사용자 프로파일 기반 이미지 추천 방법 및 장치 |
CN102292727B (zh) * | 2009-01-23 | 2013-10-23 | 日本电气株式会社 | 视频描述符生成器 |
US11259680B2 (en) * | 2016-11-23 | 2022-03-01 | The Procter & Gamble Company | Cleaning implement comprising a modified open-cell foam |
KR20180060257A (ko) * | 2016-11-28 | 2018-06-07 | 삼성전자주식회사 | 객체 인식 방법 및 장치 |
US10776982B2 (en) * | 2017-07-03 | 2020-09-15 | Artomatix Ltd. | Systems and methods for providing non-parametric texture synthesis of arbitrary shape and/or material data in a unified framework |
US11132787B2 (en) * | 2018-07-09 | 2021-09-28 | Instrumental, Inc. | Method for monitoring manufacture of assembly units |
US11080542B2 (en) * | 2018-07-27 | 2021-08-03 | International Business Machines Corporation | Sparse region-of-interest pooling for object detection |
-
2018
- 2018-09-05 JP JP2018166304A patent/JP7075013B2/ja active Active
-
2019
- 2019-08-26 WO PCT/JP2019/033213 patent/WO2020050075A1/ja active Application Filing
- 2019-08-26 US US17/273,271 patent/US11595661B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018140158A1 (en) | 2017-01-30 | 2018-08-02 | Euclid Discoveries, Llc | Video characterization for smart enconding based on perceptual quality optimization |
Non-Patent Citations (2)
Title |
---|
GATYS, Leon A. et al.,Image Style Transfer Using Convolutional Neural Networks,2016 IEEE Conference on Computer Vision and Pattern Recognition,IEEE,2016年12月12日,pp. 2414-2423 |
XU, Bin et al.,CNN-Based Rate-Distortion Modeling for H.265/HEVC,2017 IEEE Visual Communications and Image Processing,IEEE,2018年03月01日,pp. 1-4 |
Also Published As
Publication number | Publication date |
---|---|
US20210329253A1 (en) | 2021-10-21 |
WO2020050075A1 (ja) | 2020-03-12 |
US11595661B2 (en) | 2023-02-28 |
JP2020039088A (ja) | 2020-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4987086B2 (ja) | 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 | |
CN110024391B (zh) | 用于编码和解码数字图像或视频流的方法和装置 | |
CN107211131B (zh) | 对数字图像块进行基于掩码的处理的系统和方法 | |
US11356672B2 (en) | System and method for controlling video coding at frame level | |
CN110383695B (zh) | 用于对数字图像或视频流进行编码和解码的方法和装置 | |
KR20080004013A (ko) | 영상의 부호화 방법 및 장치, 복호화 방법 및 장치 | |
CN101578880A (zh) | 视频解码方法以及视频编码方法 | |
US11190775B2 (en) | System and method for reducing video coding fluctuation | |
US11134250B2 (en) | System and method for controlling video coding within image frame | |
JP7168896B2 (ja) | 画像符号化方法、及び画像復号方法 | |
JP7075013B2 (ja) | 符号量推定装置、符号量推定方法及び符号量推定プログラム | |
JP2018125713A (ja) | 予測装置およびプログラム | |
JP6454229B2 (ja) | 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム | |
JP2018182531A (ja) | 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム | |
EP3977747A1 (en) | Pre-processing for video compression | |
JP6946979B2 (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム | |
JP7075012B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP7141007B2 (ja) | 符号化装置、符号化方法及びプログラム | |
CN110896487B (zh) | 压缩图像数据的方法 | |
WO2019225344A1 (ja) | 符号化装置、画像補間システム及び符号化プログラム | |
JP4784386B2 (ja) | 復号化装置、逆量子化方法及びプログラム | |
CN105706447A (zh) | 动画图像编码设备、动画图像解码设备、动画图像编码方法、动画图像解码方法以及程序 | |
JP7406208B2 (ja) | 符号化装置、符号化方法及びプログラム | |
JP6145084B2 (ja) | サイズ判定方法、サイズ判定装置及びコンピュータプログラム | |
WO2019225337A1 (ja) | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム及び復号プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7075013 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |