JP6690254B2 - 画像符号化装置、方法及びプログラム - Google Patents

画像符号化装置、方法及びプログラム Download PDF

Info

Publication number
JP6690254B2
JP6690254B2 JP2016010988A JP2016010988A JP6690254B2 JP 6690254 B2 JP6690254 B2 JP 6690254B2 JP 2016010988 A JP2016010988 A JP 2016010988A JP 2016010988 A JP2016010988 A JP 2016010988A JP 6690254 B2 JP6690254 B2 JP 6690254B2
Authority
JP
Japan
Prior art keywords
attention
region
code amount
area
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016010988A
Other languages
English (en)
Other versions
JP2017130894A (ja
Inventor
和仁 迫水
和仁 迫水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2016010988A priority Critical patent/JP6690254B2/ja
Priority to US15/382,595 priority patent/US10536696B2/en
Publication of JP2017130894A publication Critical patent/JP2017130894A/ja
Application granted granted Critical
Publication of JP6690254B2 publication Critical patent/JP6690254B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Description

本発明は、画像符号化装置、方法及びプログラムに関し、注目領域と非注目領域とを区分して画像を符号化する画像符号化装置、方法及びプログラムに適用し得るものである。
近年、監視カメラの普及は進み、さらなる高フレームレート化、高解像度化、多視点化も望まれている。しかし、高フレームレート化、高解像度化、多視点化は、動画像のデータ量増大を引き起こし、通信コストやストレージコストの増加を招く。この問題を緩和するため、例えば、人物画像の動画像より顔領域を検出し、顔領域の圧縮に多くのビット数を配分する方式が提案されている。
特許文献1には、顔領域に多くのビット数を配分する方式が開示されている。より具体的には、特許文献1の記載技術は、注目領域と非注目領域で動画像に異なるビット数を配分することで、符号量を削減するシステムにおいて、量子化パラメータQPの決定する方法を提案している。
つまり、特許文献1の記載技術は、顔領域の面積の大きさを顔領域ごとに算出し、顔領域が大きいほど顔領域と非顔領域の品質の差を小さくする。これにより、顔領域が大きいときに顔領域にほとんどの符号量を割いてしまい、非顔領域の品質が著しく低下するという課題を解決している。
図2は、従来の画像符号化システム80の内部構成を示す構成図である。図2において、画像符号化システム80は、入力画像と注目画素とを入力データとし、ストリームを出力する。
画像符号化システム80は、入力した注目画素を含む注目ブロックを出力する注目ブロック判定部81と、注目ブロックを入力し、注目領域面積を計算し出力する注目領域面積計算部82と、注目領域面積からオフセットを求める圧縮率制御部83と、ターゲットビットレート(目標ビットレート)とオフセットから注目領域QPと非注目領域QPとを決定し出力するレート制御部84と、注目ブロックと注目領域QPと非注目領域QPとに基づき、入力画像をJPEGやH.264、H.265などの方式で圧縮しストリームを出力する圧縮部85とを有する。
また、レート制御部84は、ターゲットビットレートから非注目領域QPを生成するQP制御部811と、非注目領域QPとオフセットから注目領域QPを生成する注目領域QP算出部812とを有する。
ここで、オフセットとは、注目領域QPの値と非注目領域QPの値の差分である。
レート制御部84は、QP制御部811により決定された量子化パラメータにオフセットを加減算し、注目領域QPと非注目領域QPを生成する。
この例では、レート制御部84は、QP制御部811により決定された非注目領域QPからオフセット分減じた値を注目領域QPとして出力する場合を例示する。しかし、レート制御部84は、QP制御部811により決定された注目領域QPからオフセット分加えた値を非注目領域QPとする構成などのバリエーションも考えられる。
特許文献1の記載技術は、QP制御部の詳細な実現形態について、特に明記していないが、例えば、図2に例示したように圧縮部85から出力されるフィードバック(FB:Feed back)情報に基づき制御する方法が考えられる。
ここで、FB情報とは、例えば使用した量子化パラメータやそのときの符号量である。
具体的には、以下の2つの制御方法が考えられる。
1つ目の制御方法は、QP制御部811は、直前フレームの符号量とターゲットビットレートを比較して、直前の符号量がターゲットビットレートを満足させる符号量よりも多ければ非注目領域QPを上げて、少なければ非注目領域QPを下げるという方法である。
2つ目の制御方法は、QP制御部811は、過去の量子化パラメータと符号量のデータを用いて、量子化パラメータと符号量の関係を学習したモデルを生成し、当該モデルを使って、ターゲットビットレートを満足させる符号量を発生しうる量子化パラメータを選択する方法である。
一方、注目領域と非注目領域との量子化パラメータに差を設ける方法として次の方法が考えられる。
図3は、従来の画像符号化システム90の内部構成を示す構成図である。
図3の画像符号化システム90は、注目領域及び非注目領域のいずれか一方の領域の量子化パラメータを固定し、他方の量子化パラメータを変動させることでレート制御を行なう。
画像符号化システム90は、入力された注目画素を含む注目ブロックを出力とする注目ブロック判定部91と、ターゲットビットレートと固定QPとから注目領域QPと非注目領域QPとを決定して出力するレート制御部92と、注目ブロックと注目領域QPと非注目領域QPとに基づき、入力画像をJPEGやH.264、H.265などの方式で圧縮しストリームを出力する圧縮部93とを有する。
また、レート制御部92は、ターゲットビットレートから非注目領域QPを生成し出力するQP制御部921を有する。
この例では、注目領域QPを固定としたが、非注目領域QPを固定とするバリエーションも考えられる。
図2に例示する画像符号化システム80は、オフセットが量子化パラメータの制約条件となっているため、注目領域あるいは非注目領域の品質が保証されない代わりに、注目領域及び非注目領域の品質が著しく乖離することもない。これに対して、図3に例示する画像符号化システム90は、注目領域あるいは非注目領域の品質が保証される代わりに、注目領域と非注目領域の品質が著しく乖離することもありうる。
QP制御部921の詳細な実現形態については、特に明記しないが、例えば図3に示したように圧縮部93から出力されるFB情報に基づき制御する方法が考えられる。
具体的には、たとえば、以下の2つの制御方法が考えられる。
1つ目の制御方法は、図3のように注目領域QPを固定し、非注目領域QPを可変とする場合、QP制御部921は、直前フレームの符号量とターゲットビットレートとを比較して、直前の符号量がターゲットビットレートを満足させる符号量よりも多ければ非注目領域QPを上げて、少なければ非注目領域QPを下げるという方法である。
2つ目の制御方法は、QP制御部921は、過去の量子化パラメータと符号量のデータとを用いて、量子化パラメータと符号量の関係を学習したモデルを生成し、当該モデルを使って、ターゲットビットレートを満足させる符号量を発生しうる量子化パラメータを選択する方法である。
過大な符号量や過小な符号量は、デバイスが持つバッファや伝送路で、データの損失を発生させたり、資源を有効に活用できなかったりといった問題を引き起こすため、解決が望まれる課題である。
特開2010−193441号公報
しかしながら、上述した従来の画像符号化システムには、以下のような課題が生じ得る。
より具体的には、図2に例示する画像符号化システム80の2つのQP制御方法には、以下の課題が生じ得る。
1つ目の制御方法については、漸近的な符号量の調整となるため、急激な映像の変化や急激な注目領域面積の変化に追従できず、過大な符号量や過少な符号量が発生しうるという課題がある。
2つ目の制御方法についても、モデルはQP固定領域の存在を知らないため、学習データから離れた符号量やQPに制御しようとしたときに、予測と実測に必ず隔たりが発生し、過大な符号量や過少な符号量が発生しうるという課題がある。加えて、急激な注目領域面積の変化にも追従できず、過大な符号量や過少な符号量が発生しうるという課題もある。
また、図3に例示する画像符号化システム90の2つのQP制御方法には、以下の課題が生じ得る。
1つ目の制御方法については、漸近的な符号量の調整となるため、急激な映像の変化や急激な注目領域面積の変化に追従できず、過大な符号量や過少な符号量が発生しうるという課題がある。
2つ目の制御方法についても、モデルはQP固定領域の存在を知らないため、学習データから離れた符号量やQPに制御しようとしたときに、予測と実測に必ず隔たりが発生し、過大な符号量や過少な符号量が発生しうるという課題がある。加えて、急激な注目領域面積の変化にも追従できず、過大な符号量や過少な符号量が発生しうるという課題もある。
過大な符号量や過小な符号量は、デバイスが持つバッファや伝送路で、データの損失を発生させたり、資源を有効に活用できなかったりといった問題を引き起こすため、解決が望まれる課題である。
そのため、過大な符号量や過少な符号量が発生しうるという問題を緩和し、注目領域の面積や映像の性質の変化が発生してもビットレートの変動幅を小さくすることができる画像符号化装置、方法及びプログラムが求められている。
上記課題を解決するために、第1の本発明に係る画像符号装置は、(1)注目画素を含む注目ブロックか否かを判定する注目ブロック判定手段と、(2)注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求める注目領域面積比率算出手段と、(3)画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力するモデル提供部と、縮データのビットレートと注目領域面積比率とに基づいて、注目領域面積比率と注目領域モデルとを乗じた値と、非注目領域面積比率と非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、画像全体の符号量が、圧縮データのビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定するレート制御手段と、()注目ブロックと注目領域量子化パラメータと非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する圧縮手段とを備えることを特徴とする。
第2の本発明に係る画像符号化方法は、(1)注目ブロック判定手段が、注目画素を含む注目ブロックか否かを判定し、(2)注目領域面積比率算出手段が、注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求め、(3)モデル提供部が、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力し、)レート制御手段が、圧縮データのビットレートと注目領域面積比率とに基づいて、注目領域面積比率と注目領域モデルとを乗じた値と、非注目領域面積比率と非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、画像全体の符号量が、圧縮データのビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定し、()圧縮手段が、注目ブロックと注目領域量子化パラメータと非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮することを特徴とする。
第3の本発明に係る画像符号プログラムは、コンピュータを、(1)注目画素を含む注目ブロックか否かを判定する注目ブロック判定手段と、(2)注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求める注目領域面積比率算出手段と、(3)画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力するモデル提供部と、縮データのビットレートと所定の制約条件と注目領域面積比率とに基づいて、注目領域面積比率と注目領域モデルとを乗じた値と、非注目領域面積比率と非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、画像全体の符号量が、圧縮データのビットレート及び所定の制約条件を満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定するレート制御手段と、()注目ブロックと注目領域量子化パラメータと非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する圧縮手段として機能させることを特徴とする。
本発明によれば、過大な符号量や過少な符号量が発生しうるという問題を緩和し、注目領域の面積や映像の性質の変化が発生してもビットレートの変動幅を小さくすることができる。
第1の実施形態に係る画像符号化装置の内部構成を示す構成図である。 従来の画像符号化システムの内部構成を示す構成図である。 従来の画像符号化システムの内部構成を示す構成図である。 第1の実施形態に係る画像符号化方法の動作を示すフローチャートである。 第1の実施形態に係る注目ブロックの判定方法を説明する説明図である。 第1の実施形態に係るレート制御部による注目領域QP及び非注目領域QPの生成処理の動作を示すフローチャートである。 第2の実施形態に係る画像符号化装置の内部構成を示す構成図である。 第2の実施形態に係るレート制御部のモデル提供部における処理の動作を示すフローチャートである。
(A)第1の実施形態
以下では、本発明に係る画像符号化装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳細に説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る画像符号化装置の内部構成を示す構成図である。
なお、画像符号化装置100のハードウェア構成は、図示しないが、例えば、CPU、ROM、RAM、EEPROM、入出力インタフェース等を有する演算処理装置を適用でき、CPUが、ROMに格納される処理プログラム(画像符号化プログラム)を実行することにより実現できる。処理プログラム(画像符号化プログラム)が装置にインストールすることで画像符号化システムを構築できるようにしてもよく、その場合でも画像符号化プログラムは図1に例示する処理ブロックで示すことができる。
図1において、第1の実施形態に係る画像符号化装置100は、注目ブロック判定部1、注目領域面積比率計算部2、レート制御部3、圧縮部4を有する。
また、レート制御部3は、QP制御部31、注目領域符号量計算部32、非注目領域符号量計算部33、総符号量推定部34、モデル提供部35を有する。
画像符号化装置100は、画像信号を入力し、入力された画像データを、例えばJPEG、H.264、H.265等の圧縮方式で圧縮し、圧縮後の画像をストリームデータとして出力するものである。図1には図示しないが、画像符号化装置100は、例えば画像データを蓄積する画像メモリ等と接続しており、画像メモリ等に蓄積されている1フレームの画像に関するデータが画像符号化装置100に入力される。
注目ブロック判定部1は、注目画素を入力し、入力された注目画素を含むブロック(以下、注目ブロックと呼ぶ。)を判定するものである。注目ブロック判定部1は、判定して得られた注目ブロックを、注目領域面積比率計算部2、圧縮部4に与える。注目ブロック判定部1は、例えば1フレームの画像を単位ブロックに区分し、注目画素を含む単位ブロックを注目ブロックとして判定する。
注目領域面積比率計算部2は、注目ブロック判定部1により判定された注目ブロックを入力し、画像全体の中で注目ブロックが面積の割合を注目領域面積比率として導出するものである。また、注目領域面積比率計算部2は、導出した注目領域面積比率をレート制御部3に与える。
レート制御部3は、ターゲットビットレートと制約条件と注目領域面積比率とを入力し、これらターゲットビットレートと制約条件と注目領域面積比率に基づいて、注目領域の量子化パラメータ(QP:以下、注目領域QPと呼ぶ。)と非注目領域の量子化パラメータ(QP:以下、非注目領域QPと呼ぶ。)とを決定して圧縮部4に与える。
ここで、制約条件とは、例えばオフセットや固定量子化パラメータを含むものである。
レート制御部3は、ターゲットビットレートを満足させる画像全体の符号量をR、注目領域QPをQr、非注目領域QPをQe、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルをMr(Qr)、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルをMe(Qe)、前記注目領域面積比率をαとすると、式(1)と制約条件とを満たす注目領域QP、非注目領域QPを導出することでレートを制御する。
R=α×Mr(Qr)+(1−α)×Me(Qe) …(1)
モデル提供部35は、注目領域モデルと非注目領域モデルとを提供するものである。つまり、モデル提供部35は、注目領域モデルを注目領域符号量計算部32に出力し、非注目領域モデルを非注目領域符号量計算部33に出力する。
モデル提供部35は、例えば、後述する圧縮部4から出力されるFB(Feed Back)情報に基づいて、注目領域モデルと非注目領域とを生成する。
ここで、FB情報は、例えば、使用した量子化パラメータ(注目領域QP、非注目領域QP)やその時点の符号量(注目領域符号量、非注目領域符号量)、注目領域面積比率等を含む情報である。
つまり、モデル提供部35は、圧縮部4からのFB情報に基づき、過去の量子化パラメータや符号量のデータを用いて、量子化パラメータと符号量との関係を学習して、注目領域モデル、非注目領域モデルを生成する。なお、注目領域モデル、非注目領域モデルの学習方法は、例えば、最小二乗法を用いたフィッティングを実施できる。
また、量子化パラメータと符号量との関係モデルは、種々の方法が提供されているが、採用するモデルに応じて、量子化パラメータや符号量、注目領域面積比率以外の情報も入力してよい。
さらに、この実施形態では、注目領域モデルと非注目領域モデルとを分けているが、モデル提供部35は、注目領域モデル及び非注目領域モデルに共通の1つのモデルであっても良い。
モデル提供部35が学習用のデータとしてFB情報を取得する方法には、例えば、予め全画面を一様な量子化パラメータQPで符号化する期間を設け、当該符号化時のFB情報に基づき注目領域モデルと非注目領域モデルを生成する方法を適用できる。
QP制御部31には、ターゲットビットレートと制約条件とが入力される。また、QP制御部31には、総符号量推定部34から推定総符号量が入力される。QP制御部31は、ターゲットビットレートと推定総符号量とを比較し、当該推定総符号量が当該ターゲットビットレートを満たすまで、制約条件を満たす注目領域QP候補と非注目領域QP候補を生成する。そして、推定総符号量がターゲットビットレートを満たす注目領域QP候補と非注目領域QP候補が見つかれば、QP制御部31は、注目領域QP候補及び非注目領域QP候補を、注目領域QP及び非注目領域QPとして出力する。また、QP制御部31は、注目領域QP候補を注目領域符号量計算部32に与え、非注目領域QP候補を非注目領域符号量計算部33に与える。
注目領域符号量計算部32は、QP制御部31からの注目領域QP候補と、モデル提供部35からの注目領域モデルとに基づいて、注目領域推定符号量を導出して総符号量推定部34に与える。注目領域符号量計算部32は、例えば、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルに、注目領域QP候補を与えることで、注目領域推定符号量を生成する。
非注目領域符号量計算部33は、QP制御部31からの非注目領域QP候補と、モデル提供部35からの非注目領域モデルとに基づいて、非注目領域推定符号量を導出して総符号量推定部34に与える。非注目領域符号量計算部33は、例えば、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルに、非注目領域QP候補を与えることで、非注目領域推定符号量を生成する。
総符号量推定部34は、注目領域面積比率計算部2からの注目領域面積比率と、注目領域符号量計算部32からの注目領域推定符号量と、非注目領域符号量計算部33からの非注目領域推定符号量とに基づいて、推定総符号量を導出し、導出した推定総符号量をQP制御部31に与える。
総符号量推定部C4は、例えば、注目領域推定符号量に注目領域面積比率の値を乗じ、非注目領域推定符号量に「1から注目領域面積比率を減じた値」を乗じることで、推定総符号量を生成する。
圧縮部4は、注目ブロックと注目領域QPと非注目領域QPとに基づいて、入力された入力画像を、例えばJPEG、H.264、H.265などの圧縮方式で圧縮してストリームを出力する。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る画像符号化装置100における画像符号化方法の動作を、図面を参照しながら詳細に説明する。
図4は、第1の実施形態に係る画像符号化方法の動作を示すフローチャートである。
STEP101で、注目ブロック判定部1は、入力された注目画素に基づいて、ブロックが注目ブロックであるか否かを判定し、注目ブロック判定結果を注目ブロックとして出力する。
図5は、第1の実施形態に係る注目ブロックの判定方法を説明する説明図である。図5においてハッチが付されている領域が注目領域であることを示している。
ここで、注目ブロックの判定方法は、種々の方法を広く適用できる。例えば、変換ブロック内に1画素でも注目画素が含まれている場合、当該変換ブロックを注目ブロックとして判定するようにしてもよい。また例えば、変換ブロック内の画素数のうち、半数以上が注目領域に含まれているときに、当該変換ブロックを注目ブロックとして判定するようにしてもよい。さらに例えば、変換ブロック内のすべての画素が注目領域に含まれている場合に、当該変換ブロックを注目ブロックであると判定するようにしてもよい。いずれにしても、注目ブロックの判定方法は、ブロック内の全部又は一部の画素が注目領域に含まれている場合に、当該ブロックを注目ブロックとして判定する。
図5では、例えば縦4画素×横4画素の16画素からなる変換ブロック内の画素のうち半数以上が注目領域であるときに、当該変換ブロックを注目ブロックとして判定する場合を例示する。
STEP102で、注目領域面積比率計算部2は、画像全体のなかで注目領域が占める面積の割合を注目領域面積比率として出力する。
STEP103で、レート制御部3は、ターゲットビットレートと制約条件と注目領域面積比率とFB情報とに基づいて、注目領域QPと非注目領域QPとを導出して出力する。
STEP104で、圧縮部4は、注目ブロックに基づき、注目領域については注目領域QPで、非注目領域については非注目領域QPで、入力画像を圧縮し、ストリームを出力する。また、圧縮部4は、圧縮処理の結果として得られたFB情報は、レート制御部3のモデル提供部35に出力する。
図6は、第1の実施形態に係るレート制御部3による注目領域QP及び非注目領域QPの生成処理の動作を示すフローチャートである。図6を用いて、STEP103の処理動作を詳細に説明する。
STEP151で、QP制御部31は、制約条件を満たす注目領域QP候補と非注目領域QP候補を決めて出力する。
STEP152で、注目領域符号量計算部32は、注目領域QP候補とモデル提供部35から提供される注目領域モデルに基づき、注目領域推定符号量を算出して出力する。
STEP153で、非注目領域符号量計算部33は、非注目領域QP候補とモデル提供部35から提供される非注目領域モデルとに基づき、非注目領域推定符号量を算出し出力する。
STEP154で、総符号量推定部34は、注目領域面積比率と注目領域推定符号量、非注目領域推定符号量から推定総符号量を算出して出力する。
STEP155で、QP制御部31は、推定総符号量がターゲットビットレートを満たす符号量になっているかどうか判定する。
推定総符号量がターゲットビットレートを満たす符号量になっている場合、STEP156に進む。
推定総符号量がターゲットビットレートを満たす符号量になっていない場合、STEP157に進む。
ここで、推定総符号量がターゲットレートを満たす符号量となっているか否かの判定方法は、次のような方法を適用できる。例えば、ターゲットビットレートがT[bps]であったとして、30fpsの動画像を圧縮している場合、αを予め設定する値として、推定総符号量がT/30±α[bit]を満たす場合に、ターゲットビットレートを満たす符号量であると判定する方法がある。
なお、ターゲットビットレートを満たす符号量の決定方法については幾多の方法が提案されているが、本発明は種々の方法に依存するものではないため、ここで詳細な説明を省略する。
STEP156で、QP制御部31は、推定総符号量がターゲットビットレートを満たしている符号量になっている場合、当該注目領域QP候補及び非注目領域QP候補を、注目領域QPと非注目領域QPとして出力し、本動作を終了とする。
STEP157で、QP制御部31は、推定総符号量がターゲットビットレートを満たしていない場合、制約条件を満たす新しい注目領域QP候補と非注目領域QP候補とを生成して出力する。その後、STEP152に戻る。
ここで、新しい注目領域QP候補と非注目領域QP候補を生成する方法は、例えば、推定総符号量が、ターゲットビットレートを満たす符号量よりも大きい場合は量子化パラメータQPの値を下げて、推定総符号量が、ターゲットビットレートを満たす符号量よりも少ない場合は量子化パラメータQPの値を上げる方法を適用できる。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、ターゲットビットレートのみでなく、注目領域面積比率も用いて、量子化パラメータを制御することで、過大な符号量や過少な符号量が発生しうるという問題を緩和し、注目領域の面積や映像の性質の変化が発生してもビットレートの変動幅を小さくすることができる。
(B)第2の実施形態
次に、本発明に係る画像符号化装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
(B−1)第2の実施形態の構成
図7は、第2の実施形態に係る画像符号化装置の内部構成を示す構成図である。
図7において、第2の実施形態に係る画像符号化装置100Aは、注目ブロック判定部1、注目領域面積比率計算部2、レート制御部3A、圧縮部4を有する。
また、レート制御部3Aは、QP制御部31、注目領域符号量計算部32、非注目領域符号量計算部33、総符号量推定部34、モデル提供部40を有する。
さらに、モデル提供部40は、記録部41、注目領域符号量抽出部42、非注目領域符号量抽出部43、注目領域面積比率抽出部44、注目領域学習用符号量生成部45、非注目領域学習用符号量生成部46、注目領域QP抽出部47、非注目領域QP抽出部48、モデル学習部49を有する。モデル学習部49は、注目領域モデル学習部491、非注目領域モデル学習部492を有する。
なお、注目ブロック判定部1、注目領域面積比率計算部2、圧縮部4、QP制御部31、注目領域符号量計算部32、非注目領域符号量計算部33、総符号量推定部34は、第1の実施形態で説明したものを適用できる。
従って、第2の実施形態では、第1の実施形態とは異なる第2の実施形態に特徴的なモデル提供部40の構成を中心に説明する。
モデル提供部40は、圧縮部4から圧縮処理の結果として得られるFB情報を蓄積し、その蓄積データから過去の注目領域符号量及び非注目領域符号量を抽出して、注目領域モデル及び非注目領域モデルを生成して出力する。
記録部41は、圧縮部4からのFB情報を蓄積するものである。記録部41は、蓄積しているFB情報を蓄積データとして出力する。
注目領域符号量抽出部42は、記録部41の蓄積データから過去の注目領域符号量を抽出し、過去の注目領域符号量を注目領域学習符号量生成部45に与える。
非注目領域符号量抽出部43は、記録部41の蓄積データから過去の非注目領域符号量を抽出し、過去の非注目領域符号量を非注目領域学習符号量生成部46に与える。
注目領域面積比率抽出部44は、記録部41の蓄積データから過去の注目領域面積比率を抽出し、過去の注目領域面積比率を、注目領域符号量抽出部42及び非注目領域符号量抽出部43に与える。
注目領域学習用符号量生成部45は、過去の注目領域符号量と、過去の注目領域面積比率とに基づいて、過去の注目領域学習用符号量を導出する。また、注目領域学習符号量生成部45は、過去の注目領域学習用符号量を、モデル学習部49の注目領域モデル学習部491に与える。
非注目領域学習用符号量生成部46は、過去の非注目領域符号量と、過去の注目領域面積比率とに基づいて、過去の非注目領域学習用符号量を、モデル学習部49の非注目領域モデル学習部492に与える。
注目領域QP抽出部47は、記録部41の蓄積データから過去の注目領域QPを抽出し、過去の注目領域QPを、モデル学習部49の注目領域モデル学習部491に与える。
非注目領域QP抽出部48は、記録部41の蓄積データから過去の非注目領域QPを抽出し、過去の注目領域QPを、モデル学習部49の非注目領域モデル学習部492に与える。
モデル学習部49は、過去の注目領域学習用符号量及び過去の注目領域QPに基づいて、過去の非注目領域学習用符号量と過去の非注目領域QPとから注目領域モデルと非注目領域モデルを生成し出力するモデル学習部Eとから構成される。
モデル学習部49は、過去の注目領域学習用符号量及び過去の注目領域QPと、過去の非注目領域学習用符号量及び過去の非注目領域QPとに基づいて、注目領域モデルと非注目領域とを学習して出力するものである。
ここで、この実施形態では、モデル学習部49が、過去の注目領域QP及び過去の注目領域学習用符号量に基づいて、注目領域モデルを学習する注目領域モデル学習部491と、過去の非注目領域QP及び過去の非注目領域学習用符号量に基づいて、非注目領域モデルを学習する非注目領域モデル学習部492とを備える場合を例示する。
なお、モデル学習部49は、過去の量子化パラメータと符号量とに基づいて、注目領域モデル及び非注目領域モデルを学習して生成するものであれば、種々の方法を適用できる。
例えば、モデル学習部49は、過去の注目領域学習用符号量及び過去の注目領域QPを1組のデータとして扱い、過去の非注目領域学習用符号量及び過去の非注目領域QPをもう1組のデータとして扱い、これら2組のデータを同等の別データとして1つの共通モデルの学習に使用し、共通モデルを、注目領域モデルと非注目領域モデルとして出力して良い。
前記1つの共通モデルの学習を使用して注目領域及び非注目領域を生成する方法は、学習を支えるデータ数(ブロック数)が多いため、図7に例示する構成の場合よりも、十分な学習を行なえるという利点がある。これに対して、図7に例示する構成の場合、学習を支えるデータ数(ブロック数)は前者よりも少ないため、学習の安定性という点では前記共通モデルの学習を使用する場合より劣るが、学習が注目領域と非注目領域とにそれぞれ特化されるという利点がある。
例えば、顔領域を注目領域とする場合、顔領域の動画像の性質と非顔領域の動画像の性質が異なる可能性は十分高く、領域ごとに特化したモデルを生成ことにも一定の利点がある。
注目領域学習用符号量生成部45は、例えば、過去の注目領域符号量から、過去の注目領域面積比率の値を割ることで、過去の注目領域学習用符号量を生成する。
非注目領域学習用符号量生成部46は、例えば、過去の非注目領域符号量から、「1から過去の注目領域面積比率を減じた値」を割ることで、過去の非注目領域学習用符号量を生成する。
なお、第2の実施形態では、注目領域面積比率は、圧縮部4からのFB情報を通して、記録部41に入力されるようにしているが、注目領域面積比率計算部2から直接記録部41に直接入力される構成をとっても良い。
(B−2)第2の実施形態の動作
次に、第2の実施形態に係る画像符号化装置100Aにおける画像符号化処理の動作を、図面を参照しながら詳細に説明する。
画像符号化装置100Aは、基本的には、第1の実施形態の図4及び図6に示す処理と同様の処理を行なうため、以下では、レート制御部3Aのモデル提供部40による処理動作を詳細に説明する。
図8は、第2の実施形態に係るレート制御部3Aのモデル提供部40における処理の動作を示すフローチャートである。
STEP201で、FB情報が、記録部41に記録されて、記録部41に記録されたデータは蓄積データとして出力される。
STEP202で、注目領域符号量抽出部42は、蓄積データから過去の注目領域符号量を取り出し出力する。
STEP203で、非注目領域符号量抽出部43は、蓄積データから過去の非注目領域符号量を取り出し出力する。
STEP204で、注目領域面積比率抽出部44は、蓄積データから過去の注目領域面積比率を取り出し出力する。
STEP205で、注目領域学習用符号量生成部45は、過去の注目領域符号量と過去の注目領域面積比率とに基づいて、過去の注目領域学習用符号量を計算し出力する。
STEP206で、非注目領域学習用符号量生成部46は、過去の非注目領域符号量と過去の注目領域面積比率とに基づいて、過去の非注目領域学習用符号量を計算し出力する。
STEP207で、注目領域QP抽出部47は、蓄積データから過去の注目領域QPを取り出し出力する。
STEP208で、非注目領域QP抽出部48は、蓄積データから過去の非注目領域QPを取り出し出力する。
STEP209で、モデル学習部49は、過去の注目領域学習用符号量と過去の注目領域QPと、過去の非注目領域学習用符号量と過去の非注目領域QPとから注目領域モデルと非注目領域モデルを学習および出力する。
例えば、図7に示すように、注目領域モデル学習部491は、過去の注目領域学習用符号量と過去の注目領域QPとから注目領域モデルを学習および出力し、非注目領域モデル学習部492は、過去の非注目領域学習用符号量と過去の非注目領域QPとから非注目領域モデルを学習および出力する。
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、総符号量推定部のモデルに応じた加工をデータに対して施すようにしていることで、圧縮とともに随時学習をおこなったとしても効果的な学習が可能になっている。
これにより、映像の性質が時刻の経過とともに変化したとしても、レート制御の精度を維持することが可能である。
(C)他の実施形態
上述した第1及び第2の実施形態において、FB情報に含む符号量として、残差成分の伝送にかかる符号量を用いても本発明の効果は得られる。
上述した第1及び第2の実施形態において、注目領域を入力する構成で説明しているが、非注目領域を入力する構成でも本発明の効果は得られる。
100及び100A…画像符号化装置、1…注目ブロック判定部、2…注目領域面積比率計算部、3及び3A…レート制御部、4…圧縮部、
31…QP制御部、32…注目領域符号量計算部、33…非注目領域符号量計算部、34…総符号量推定部、35及び40…モデル提供部、
41…記録部、42…注目領域符号量抽出部、43…非注目領域符号量抽出部、44…注目領域面積比率抽出部、45…注目領域学習用符号量生成部、46…非注目領域学習用符号量生成部、47…注目領域QP抽出部、48…非注目領域QP抽出部、49…モデル学習部、491…注目領域モデル学習部、492…非注目領域モデル学習部。

Claims (17)

  1. 注目画素を含む注目ブロックか否かを判定する注目ブロック判定手段と、
    上記注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求める注目領域面積比率算出手段と、
    画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力するモデル提供部と、
    縮データのビットレートと上記注目領域面積比率とに基づいて、上記注目領域面積比率と上記注目領域モデルとを乗じた値と、非注目領域面積比率と上記非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、上記画像全体の符号量が、上記圧縮データの上記ビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定するレート制御手段と、
    上記注目ブロックと上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する圧縮手段と
    を備えることを特徴とする画像符号化装置。
  2. 上記レート制御手段が、上記ビットレートと所定の制約条件と上記注目領域面積比率とに基づいて、上記注目領域の量子化パラメータと、上記非注目領域の量子化パラメータとを決定することを特徴とする請求項1に記載の画像符号化装置。
  3. 上記レート制御手段は、上記ビットレートを満足させる画像全体の符号量をR、上記注目領域量子化パラメータをQr、上記非注目領域量子化パラメータをQe、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルをMr(Qr)、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルをMe(Qe)、上記注目領域面積比率をαとすると、式(A)と上記所定の制約条件とを満たす、上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを決定することを特徴とする請求項2に記載の画像符号装置。
    R=α×Mr(Qr)+(1−α)×Me(Qe)…(A)
  4. 上記レート制御手段が、
    記ビットレートと推定総符号量とを比較し、当該推定総符号量が上記ビットレートを満たすまで、上記所定の制約条件を満たす注目領域量子化パラメータ候補と非注目領域量子化パラメータ候補を生成し、上記推定総符号量が上記ビットレートを満たす上記注目領域量子化パラメータ候補と上記非注目領域量子化パラメータ候補とを検出すると、当該注目領域量子化パラメータ候補と当該非注目領域量子化パラメータ候補を、上記注目領域量子化パラメータと上記非注目領域量子化パラメータとする量子化パラメータ制御
    を有することを特徴とする請求項3に記載の画像符号化装置。
  5. 上記レート制御手段が、
    上記注目領域量子化パラメータ候補と上記注目領域モデルとに基づいて、注目領域推定符号量を計算する注目領域符号量計算部と、
    上記非注目領域量子化パラメータ候補と上記非注目領域モデルとに基づいて、非注目領域推定符号量を計算する非注目領域符号量計算部と、
    上記注目領域面積比率と上記注目領域推定符号量と上記非注目領域推定符号量とに基づいて、上記推定総符号量を計算する総符号量推定部と
    を有することを特徴とする請求項4に記載の画像符号化装置。
  6. 上記注目領域符号量計算部は、上記注目領域モデルに上記注目領域量子化パラメータ候補を与えて上記注目領域推定符号量を生成し、
    上記非注目領域符号量計算部は、上記非注目領域モデルに上記非注目領域量子化パラメータ候補を与えて上記非注目領域推定符号量を生成する
    ことを特徴とする請求項5に記載の画像符号化装置。
  7. 上記総符号量推定部は、上記注目領域推定符号量に上記注目領域面積比率を乗じ、上記非注目領域推定符号量に1から上記注目領域面積比率を減じた値を乗じることで、上記推定総符号量を生成することを特徴とする請求項5又は6に記載の画像符号化装置。
  8. 上記モデル提供部が、上記圧縮手段による符号化処理に得られた所定のフィードバック情報に基づいて、上記注目領域モデルと上記非注目領域モデルとを生成することを特徴とする請求項〜7のいずれかに記載の画像符号化装置。
  9. 上記モデル提供部が、予め全画面を一様な量子化パラメータで符号化する期間を設け、符号化処理により得られたフィードバック情報に基づき上記注目領域モデルと上記非注目領域モデルを生成することを特徴とする請求項〜8のいずれかに記載の画像符号化装置。
  10. 上記モデル提供部が、上記注目領域モデルと上記非注目領域モデルを共通モデルにより生成することを特徴とする請求項〜9のいずれかに記載の画像符号化装置。
  11. 上記モデル提供部が、
    上記圧縮手段による符号化処理に得られた所定のフィードバック情報を蓄積する記録部と、
    上記記録部に蓄積される情報から過去の注目領域符号を抽出する注目領域符号量抽出部と、
    上記記録部に蓄積される情報から過去の非注目領域符号量を抽出する非注目領域符号量抽出部と、
    上記記録部に蓄積される情報から過去の注目領域面積比率を抽出する注目領域面積比率抽出部と、
    上記過去の注目領域符号量と上記過去の注目領域面積比率とに基づいて、過去の注目領域学習用符号量を計算する注目領域学習用符号量生成部と、
    上記過去の非注目領域符号量と上記過去の注目領域面積比率とに基づいて、過去の非注目領域学習用符号量を計算する非注目領域学習用符号量生成部と、
    上記記録部に蓄積される情報からから過去の注目領域量子化パラメータを抽出する注目領域量子化パラメータ拙出部と、
    上記記録部に蓄積される情報から過去の非注目領域量子化パラメータを抽出する非注目領域量子化パラメータ抽出部と、
    上記過去の注目領域学習用符号量と、上記過去の注目領域量子化パラメータと、上記過去の非注目領域学習用符号量と、上記過去の非注目領域量子化パラメータとに基づいて、上記注目領域モデルと上記非注目領域モデルを生成するモデル学習部と
    を有することを特徴とする請求項〜10のいずれかに記載の画像符号化装置。
  12. 上記モデル学習部は、上記過去の注目領域学習用符号量と上記過去の注目領域量子化パラメータを1組の第1のデータとして扱い、上記過去の非注目領域学習用符号量と上記過去の非注目領域量子化パラメータを1組の第2のデータとして扱い、2組の上記第1のデータ及び上記第2のデータを同等の別データとして共通モデルの学習に使用し、当該共通モデルを、上記注目領域モデルと上記非注目領域モデルとして出力することを特徴とする請求項11に記載の画像符号化装置。
  13. 上記モデル学習部は、
    上記過去の注目領域学習用符号量と上記過去の注目領域とに基づいて、上記注目領域モデルを学習する注目領域モデル学習部と、
    上記過去の非注目領域学習用符号量と上記過去の非注目領域とに基づいて、上記非注目領域モデルを学習する非注目領域モデル学習部と
    を有することを特徴とする請求項11に記載の画像符号化装置。
  14. 上記注目領域学習用符号量生成部は、上記過去の注目領域符号量から、上記過去の注目領域面積比率を割ることで、上記過去の注目領域学習用符号量を生成し、
    上記非注目領域学習用符号量生成部は、上記過去の非注目領域符号量から、1から上記過去の注目領域面積比率を減じた値を割ることで、上記過去の非注目領域学習用符号量を生成することを特徴とする請求項11〜13のいずれかに記載の画像符号化装置。
  15. 上記注目領域面積比率算出手段が、画像全体のなかで注目ブロックが占める割合を求めることで、上記注目領域面積比率を求めることを特徴とする請求項〜14のいずれかに記載の画像符号化装置。
  16. 注目ブロック判定手段が、注目画素を含む注目ブロックか否かを判定し、
    注目領域面積比率算出手段が、上記注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求め、
    モデル提供部が、画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力し、
    レート制御手段が、圧縮データのビットレートと上記注目領域面積比率とに基づいて、上記注目領域面積比率と上記注目領域モデルとを乗じた値と、非注目領域面積比率と上記非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、上記画像全体の符号量が、上記圧縮データの上記ビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定し、
    圧縮手段が、上記注目ブロックと上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する
    ことを特徴とする画像符号化方法。
  17. コンピュータを、
    注目画素を含む注目ブロックか否かを判定する注目ブロック判定手段と、
    上記注目ブロック判定手段による判定結果に基づいて、注目領域面積比率を求める注目領域面積比率算出手段と、
    画像全体を注目領域として符号化した場合の符号量を表す注目領域モデルと、画像全体を非注目領域として符号化した場合の符号量を表す非注目領域モデルとを出力するモデル提供部と、
    縮データのビットレートと上記注目領域面積比率とに基づいて、上記注目領域面積比率と上記注目領域モデルとを乗じた値と、非注目領域面積比率と上記非注目領域モデルとを乗じた値とに基づいて画像全体の符号量を導出し、上記画像全体の符号量が、上記圧縮データの上記ビットレートを満たす、注目領域量子化パラメータと、非注目領域量子化パラメータとを決定するレート制御手段と、
    上記注目ブロックと上記注目領域量子化パラメータと上記非注目領域量子化パラメータとを用いて、所定の符号化方式により入力された画像を圧縮する圧縮手段と
    して機能させることを特徴とする画像符号化プログラム。
JP2016010988A 2016-01-22 2016-01-22 画像符号化装置、方法及びプログラム Active JP6690254B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016010988A JP6690254B2 (ja) 2016-01-22 2016-01-22 画像符号化装置、方法及びプログラム
US15/382,595 US10536696B2 (en) 2016-01-22 2016-12-16 Image encoding device and image encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016010988A JP6690254B2 (ja) 2016-01-22 2016-01-22 画像符号化装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017130894A JP2017130894A (ja) 2017-07-27
JP6690254B2 true JP6690254B2 (ja) 2020-04-28

Family

ID=59359316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016010988A Active JP6690254B2 (ja) 2016-01-22 2016-01-22 画像符号化装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US10536696B2 (ja)
JP (1) JP6690254B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11039132B2 (en) * 2018-03-06 2021-06-15 Nippon Telegraph And Telephone Corporation Code amount estimation device, code amount estimation method, and code amount estimation program
CN110769254B (zh) * 2019-10-10 2022-04-22 网宿科技股份有限公司 一种视频帧的码率配置方法、系统及设备
CN111918066B (zh) * 2020-09-08 2022-03-15 北京字节跳动网络技术有限公司 视频编码方法、装置、设备及存储介质
CN112929668B (zh) * 2021-04-07 2024-04-26 百果园技术(新加坡)有限公司 一种视频编码的方法、装置、设备和存储介质
CN115643405A (zh) * 2022-09-29 2023-01-24 上海哔哩哔哩科技有限公司 基于roi区域检测的视频编码方法、装置以及计算设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363720B2 (en) 2009-01-26 2013-01-29 Panasonic Corporation Moving image processing device, moving image processing method and imaging apparatus
GB201308073D0 (en) * 2013-05-03 2013-06-12 Imagination Tech Ltd Encoding an image

Also Published As

Publication number Publication date
JP2017130894A (ja) 2017-07-27
US10536696B2 (en) 2020-01-14
US20170214915A1 (en) 2017-07-27

Similar Documents

Publication Publication Date Title
JP6690254B2 (ja) 画像符号化装置、方法及びプログラム
Li et al. Optimal bit allocation for CTU level rate control in HEVC
CN101795415B (zh) 一种视频编码中的码率控制方法及其装置
JP6019189B2 (ja) ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化
WO2018113191A1 (zh) 一种码率控制方法及装置
CN102640492A (zh) 对图像边界的编码单元进行编码和解码的方法和设备
US20150172680A1 (en) Producing an Output Need Parameter for an Encoder
US10595028B2 (en) Encoding/transcoding based on subjective video quality preferences
CN103533365B (zh) 比特率控制方法与比特率控制系统
KR20110093532A (ko) 그래프 기반 화소 예측을 이용한 영상 부호화/복호화 시스템 및 방법 그리고 깊이 맵 부호화 시스템 및 방법
CN104125460A (zh) 用于控制视频比特率的方法和设备
KR20110135044A (ko) 3d영상 처리 장치 및 그 방법
CN112437301A (zh) 一种面向视觉分析的码率控制方法、装置、存储介质及终端
JP2018201117A (ja) 映像符号化装置、映像符号化方法およびプログラム
JP4921240B2 (ja) 画像処理装置およびその方法
JP2008252225A (ja) 動画像符号化装置及び方法
JP5756154B2 (ja) 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム
CN111492657A (zh) 基于脸部区域检测的光场视频压缩
JP3560958B2 (ja) 動画符号化制御方法および装置
CN102202220A (zh) 编码设备及其控制方法
Fan et al. A novel joint rate allocation scheme of multiple streams
JP4153454B2 (ja) 動画像符号化装置,動画像符号化方法,動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2018186419A (ja) トランスコーダ、トランスコード方法、及びトランスコードプログラム
JP5157490B2 (ja) 目標符号量算出装置、目標符号量算出方法および目標符号量算出プログラム
JP4755239B2 (ja) 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200323

R150 Certificate of patent or registration of utility model

Ref document number: 6690254

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150