JP6690254B2 - 画像符号化装置、方法及びプログラム - Google Patents
画像符号化装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6690254B2 JP6690254B2 JP2016010988A JP2016010988A JP6690254B2 JP 6690254 B2 JP6690254 B2 JP 6690254B2 JP 2016010988 A JP2016010988 A JP 2016010988A JP 2016010988 A JP2016010988 A JP 2016010988A JP 6690254 B2 JP6690254 B2 JP 6690254B2
- Authority
- JP
- Japan
- Prior art keywords
- attention
- region
- code amount
- area
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Description
以下では、本発明に係る画像符号化装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳細に説明する。
図1は、第1の実施形態に係る画像符号化装置の内部構成を示す構成図である。
R=α×Mr(Qr)+(1−α)×Me(Qe) …(1)
次に、第1の実施形態に係る画像符号化装置100における画像符号化方法の動作を、図面を参照しながら詳細に説明する。
以上のように、第1の実施形態によれば、ターゲットビットレートのみでなく、注目領域面積比率も用いて、量子化パラメータを制御することで、過大な符号量や過少な符号量が発生しうるという問題を緩和し、注目領域の面積や映像の性質の変化が発生してもビットレートの変動幅を小さくすることができる。
次に、本発明に係る画像符号化装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
図7は、第2の実施形態に係る画像符号化装置の内部構成を示す構成図である。
次に、第2の実施形態に係る画像符号化装置100Aにおける画像符号化処理の動作を、図面を参照しながら詳細に説明する。
以上のように、第2の実施形態によれば、総符号量推定部のモデルに応じた加工をデータに対して施すようにしていることで、圧縮とともに随時学習をおこなったとしても効果的な学習が可能になっている。
上述した第1及び第2の実施形態において、FB情報に含む符号量として、残差成分の伝送にかかる符号量を用いても本発明の効果は得られる。
31…QP制御部、32…注目領域符号量計算部、33…非注目領域符号量計算部、34…総符号量推定部、35及び40…モデル提供部、
41…記録部、42…注目領域符号量抽出部、43…非注目領域符号量抽出部、44…注目領域面積比率抽出部、45…注目領域学習用符号量生成部、46…非注目領域学習用符号量生成部、47…注目領域QP抽出部、48…非注目領域QP抽出部、49…モデル学習部、491…注目領域モデル学習部、492…非注目領域モデル学習部。
Claims (17)
- 注目画素を含む注目ブロックか否かを判定する注目ブロック判定手段と、
上記注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求める注目領域面積比率算出手段と、
画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力するモデル提供部と、
圧縮データのビットレートと上記注目領域面積比率とに基づいて、上記注目領域面積比率と上記注目領域モデルとを乗じた値と、非注目領域面積比率と上記非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、上記画像全体の符号量が、上記圧縮データの上記ビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定するレート制御手段と、
上記注目ブロックと上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する圧縮手段と
を備えることを特徴とする画像符号化装置。 - 上記レート制御手段が、上記ビットレートと所定の制約条件と上記注目領域面積比率とに基づいて、上記注目領域の量子化パラメータと、上記非注目領域の量子化パラメータとを決定することを特徴とする請求項1に記載の画像符号化装置。
- 上記レート制御手段は、上記ビットレートを満足させる画像全体の符号量をR、上記注目領域量子化パラメータをQr、上記非注目領域量子化パラメータをQe、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルをMr(Qr)、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルをMe(Qe)、上記注目領域面積比率をαとすると、式(A)と上記所定の制約条件とを満たす、上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを決定することを特徴とする請求項2に記載の画像符号装置。
R=α×Mr(Qr)+(1−α)×Me(Qe)…(A) - 上記レート制御手段が、
上記ビットレートと推定総符号量とを比較し、当該推定総符号量が上記ビットレートを満たすまで、上記所定の制約条件を満たす注目領域量子化パラメータ候補と非注目領域量子化パラメータ候補を生成し、上記推定総符号量が上記ビットレートを満たす上記注目領域量子化パラメータ候補と上記非注目領域量子化パラメータ候補とを検出すると、当該注目領域量子化パラメータ候補と当該非注目領域量子化パラメータ候補を、上記注目領域量子化パラメータと上記非注目領域量子化パラメータとする量子化パラメータ制御部
を有することを特徴とする請求項3に記載の画像符号化装置。 - 上記レート制御手段が、
上記注目領域量子化パラメータ候補と上記注目領域モデルとに基づいて、注目領域推定符号量を計算する注目領域符号量計算部と、
上記非注目領域量子化パラメータ候補と上記非注目領域モデルとに基づいて、非注目領域推定符号量を計算する非注目領域符号量計算部と、
上記注目領域面積比率と上記注目領域推定符号量と上記非注目領域推定符号量とに基づいて、上記推定総符号量を計算する総符号量推定部と
を有することを特徴とする請求項4に記載の画像符号化装置。 - 上記注目領域符号量計算部は、上記注目領域モデルに上記注目領域量子化パラメータ候補を与えて上記注目領域推定符号量を生成し、
上記非注目領域符号量計算部は、上記非注目領域モデルに上記非注目領域量子化パラメータ候補を与えて上記非注目領域推定符号量を生成する
ことを特徴とする請求項5に記載の画像符号化装置。 - 上記総符号量推定部は、上記注目領域推定符号量に上記注目領域面積比率を乗じ、上記非注目領域推定符号量に1から上記注目領域面積比率を減じた値を乗じることで、上記推定総符号量を生成することを特徴とする請求項5又は6に記載の画像符号化装置。
- 上記モデル提供部が、上記圧縮手段による符号化処理に得られた所定のフィードバック情報に基づいて、上記注目領域モデルと上記非注目領域モデルとを生成することを特徴とする請求項1〜7のいずれかに記載の画像符号化装置。
- 上記モデル提供部が、予め全画面を一様な量子化パラメータで符号化する期間を設け、符号化処理により得られたフィードバック情報に基づき上記注目領域モデルと上記非注目領域モデルを生成することを特徴とする請求項1〜8のいずれかに記載の画像符号化装置。
- 上記モデル提供部が、上記注目領域モデルと上記非注目領域モデルを共通モデルにより生成することを特徴とする請求項1〜9のいずれかに記載の画像符号化装置。
- 上記モデル提供部が、
上記圧縮手段による符号化処理に得られた所定のフィードバック情報を蓄積する記録部と、
上記記録部に蓄積される情報から過去の注目領域符号量を抽出する注目領域符号量抽出部と、
上記記録部に蓄積される情報から過去の非注目領域符号量を抽出する非注目領域符号量抽出部と、
上記記録部に蓄積される情報から過去の注目領域面積比率を抽出する注目領域面積比率抽出部と、
上記過去の注目領域符号量と上記過去の注目領域面積比率とに基づいて、過去の注目領域学習用符号量を計算する注目領域学習用符号量生成部と、
上記過去の非注目領域符号量と上記過去の注目領域面積比率とに基づいて、過去の非注目領域学習用符号量を計算する非注目領域学習用符号量生成部と、
上記記録部に蓄積される情報からから過去の注目領域量子化パラメータを抽出する注目領域量子化パラメータ拙出部と、
上記記録部に蓄積される情報から過去の非注目領域量子化パラメータを抽出する非注目領域量子化パラメータ抽出部と、
上記過去の注目領域学習用符号量と、上記過去の注目領域量子化パラメータと、上記過去の非注目領域学習用符号量と、上記過去の非注目領域量子化パラメータとに基づいて、上記注目領域モデルと上記非注目領域モデルを生成するモデル学習部と
を有することを特徴とする請求項1〜10のいずれかに記載の画像符号化装置。 - 上記モデル学習部は、上記過去の注目領域学習用符号量と上記過去の注目領域量子化パラメータを1組の第1のデータとして扱い、上記過去の非注目領域学習用符号量と上記過去の非注目領域量子化パラメータを1組の第2のデータとして扱い、2組の上記第1のデータ及び上記第2のデータを同等の別データとして共通モデルの学習に使用し、当該共通モデルを、上記注目領域モデルと上記非注目領域モデルとして出力することを特徴とする請求項11に記載の画像符号化装置。
- 上記モデル学習部は、
上記過去の注目領域学習用符号量と上記過去の注目領域とに基づいて、上記注目領域モデルを学習する注目領域モデル学習部と、
上記過去の非注目領域学習用符号量と上記過去の非注目領域とに基づいて、上記非注目領域モデルを学習する非注目領域モデル学習部と
を有することを特徴とする請求項11に記載の画像符号化装置。 - 上記注目領域学習用符号量生成部は、上記過去の注目領域符号量から、上記過去の注目領域面積比率を割ることで、上記過去の注目領域学習用符号量を生成し、
上記非注目領域学習用符号量生成部は、上記過去の非注目領域符号量から、1から上記過去の注目領域面積比率を減じた値を割ることで、上記過去の非注目領域学習用符号量を生成することを特徴とする請求項11〜13のいずれかに記載の画像符号化装置。 - 上記注目領域面積比率算出手段が、画像全体のなかで注目ブロックが占める割合を求めることで、上記注目領域面積比率を求めることを特徴とする請求項1〜14のいずれかに記載の画像符号化装置。
- 注目ブロック判定手段が、注目画素を含む注目ブロックか否かを判定し、
注目領域面積比率算出手段が、上記注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求め、
モデル提供部が、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力し、
レート制御手段が、圧縮データのビットレートと上記注目領域面積比率とに基づいて、上記注目領域面積比率と上記注目領域モデルとを乗じた値と、非注目領域面積比率と上記非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、上記画像全体の符号量が、上記圧縮データの上記ビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定し、
圧縮手段が、上記注目ブロックと上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する
ことを特徴とする画像符号化方法。 - コンピュータを、
注目画素を含む注目ブロックか否かを判定する注目ブロック判定手段と、
上記注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求める注目領域面積比率算出手段と、
画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力するモデル提供部と、
圧縮データのビットレートと上記注目領域面積比率とに基づいて、上記注目領域面積比率と上記注目領域モデルとを乗じた値と、非注目領域面積比率と上記非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、上記画像全体の符号量が、上記圧縮データの上記ビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定するレート制御手段と、
上記注目ブロックと上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する圧縮手段と
して機能させることを特徴とする画像符号化プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016010988A JP6690254B2 (ja) | 2016-01-22 | 2016-01-22 | 画像符号化装置、方法及びプログラム |
US15/382,595 US10536696B2 (en) | 2016-01-22 | 2016-12-16 | Image encoding device and image encoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016010988A JP6690254B2 (ja) | 2016-01-22 | 2016-01-22 | 画像符号化装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017130894A JP2017130894A (ja) | 2017-07-27 |
JP6690254B2 true JP6690254B2 (ja) | 2020-04-28 |
Family
ID=59359316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016010988A Active JP6690254B2 (ja) | 2016-01-22 | 2016-01-22 | 画像符号化装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10536696B2 (ja) |
JP (1) | JP6690254B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11039132B2 (en) * | 2018-03-06 | 2021-06-15 | Nippon Telegraph And Telephone Corporation | Code amount estimation device, code amount estimation method, and code amount estimation program |
CN110769254B (zh) * | 2019-10-10 | 2022-04-22 | 网宿科技股份有限公司 | 一种视频帧的码率配置方法、系统及设备 |
CN111918066B (zh) * | 2020-09-08 | 2022-03-15 | 北京字节跳动网络技术有限公司 | 视频编码方法、装置、设备及存储介质 |
CN112929668B (zh) * | 2021-04-07 | 2024-04-26 | 百果园技术(新加坡)有限公司 | 一种视频编码的方法、装置、设备和存储介质 |
CN115643405A (zh) * | 2022-09-29 | 2023-01-24 | 上海哔哩哔哩科技有限公司 | 基于roi区域检测的视频编码方法、装置以及计算设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8363720B2 (en) | 2009-01-26 | 2013-01-29 | Panasonic Corporation | Moving image processing device, moving image processing method and imaging apparatus |
GB201308073D0 (en) * | 2013-05-03 | 2013-06-12 | Imagination Tech Ltd | Encoding an image |
-
2016
- 2016-01-22 JP JP2016010988A patent/JP6690254B2/ja active Active
- 2016-12-16 US US15/382,595 patent/US10536696B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017130894A (ja) | 2017-07-27 |
US10536696B2 (en) | 2020-01-14 |
US20170214915A1 (en) | 2017-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6690254B2 (ja) | 画像符号化装置、方法及びプログラム | |
Li et al. | Optimal bit allocation for CTU level rate control in HEVC | |
CN101795415B (zh) | 一种视频编码中的码率控制方法及其装置 | |
JP6019189B2 (ja) | ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 | |
WO2018113191A1 (zh) | 一种码率控制方法及装置 | |
CN102640492A (zh) | 对图像边界的编码单元进行编码和解码的方法和设备 | |
US20150172680A1 (en) | Producing an Output Need Parameter for an Encoder | |
US10595028B2 (en) | Encoding/transcoding based on subjective video quality preferences | |
CN103533365B (zh) | 比特率控制方法与比特率控制系统 | |
KR20110093532A (ko) | 그래프 기반 화소 예측을 이용한 영상 부호화/복호화 시스템 및 방법 그리고 깊이 맵 부호화 시스템 및 방법 | |
CN104125460A (zh) | 用于控制视频比特率的方法和设备 | |
KR20110135044A (ko) | 3d영상 처리 장치 및 그 방법 | |
CN112437301A (zh) | 一种面向视觉分析的码率控制方法、装置、存储介质及终端 | |
JP2018201117A (ja) | 映像符号化装置、映像符号化方法およびプログラム | |
JP4921240B2 (ja) | 画像処理装置およびその方法 | |
JP2008252225A (ja) | 動画像符号化装置及び方法 | |
JP5756154B2 (ja) | 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム | |
CN111492657A (zh) | 基于脸部区域检测的光场视频压缩 | |
JP3560958B2 (ja) | 動画符号化制御方法および装置 | |
CN102202220A (zh) | 编码设备及其控制方法 | |
Fan et al. | A novel joint rate allocation scheme of multiple streams | |
JP4153454B2 (ja) | 動画像符号化装置,動画像符号化方法,動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2018186419A (ja) | トランスコーダ、トランスコード方法、及びトランスコードプログラム | |
JP5157490B2 (ja) | 目標符号量算出装置、目標符号量算出方法および目標符号量算出プログラム | |
JP4755239B2 (ja) | 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190820 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6690254 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |