JP2023063113A - 符号化装置及び方法、及び電子機器 - Google Patents
符号化装置及び方法、及び電子機器 Download PDFInfo
- Publication number
- JP2023063113A JP2023063113A JP2021173414A JP2021173414A JP2023063113A JP 2023063113 A JP2023063113 A JP 2023063113A JP 2021173414 A JP2021173414 A JP 2021173414A JP 2021173414 A JP2021173414 A JP 2021173414A JP 2023063113 A JP2023063113 A JP 2023063113A
- Authority
- JP
- Japan
- Prior art keywords
- scaling list
- quantization
- image
- inverse quantization
- encoding device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000013139 quantization Methods 0.000 claims abstract description 145
- 238000003384 imaging method Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 23
- 230000033001 locomotion Effects 0.000 description 19
- 238000012546 transfer Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000011161 development Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】 ネットワークで映像を通信する環境における低ビットレート時の画質を改善すること。【解決手段】 予測符号化により画像を符号化する符号化装置であって、符号化対象のフレーム画像に対してスケーリングリストを用いて量子化を行う量子化手段と、前記量子化手段により量子化された前記フレーム画像に対してスケーリングリストを用いて逆量子化を行う逆量子化手段と、前記量子化手段および前記逆量子化手段に、それぞれスケーリングリストを設定する設定手段と、を有し、前記設定手段は、前記逆量子化手段に、前記符号化装置により符号化された画像を復号する再生装置で用いる第1のスケーリングリストを設定し、前記量子化手段に、前記第1のスケーリングリストと異なる第2のスケーリングリストを設定する。【選択図】 図2
Description
本発明は符号化装置及び方法、及び電子機器に関し、特に予測符号化の技術に関する。
近年、カメラと再生端末をネットワークを介して通信可能に組み合わせた映像システムが、防犯や監視用途、テレビ会議システム、パーソナルコンピュータ(PC)やスマートフォンを利用したビデオチャット等で幅広く普及してきている。
これらの映像システムでは、HD解像度で30fpsの映像を512kbpsで伝送する等、大量の映像データを低いビットレートで伝送する必要が生じることがある。そのような場合、ネットワークで映像をやり取りする際には、映像データを圧縮してデータ量を大きく削減する必要があり、画質が大きく劣化する懸念がある。
一方、これらの映像システムでは、固定視点のカメラを用いることも多く、その場合、背景等の動きの無い箇所は、H.264規格で定義されたskipped macroblockを使用して符号データを大きく削減することができる(非特許文献1参照)。以下、skipped macroblockを使用して符号化するモードを「スキップモード」と呼ぶ。
図8は、従来の映像システムの一例として、監視カメラシステムの構成例を示したものであり、監視カメラ101、102、及び再生装置111、112がそれぞれネットワーク100に接続されている。
監視カメラ101は、H.264規格のBaseline Profileに準拠し、監視カメラ102はH.264規格のMain Profileに準拠した符号化を行う。また、再生装置111、112は共に、H.264規格のBaseline Profile、及びMain Profileに準拠した符号化ストリームのデコードが可能となっている。
図8に示すようなカメラシステムでは、動きが無い箇所についてスキップモードによりデータを大きく削減することで、動きがある箇所に符号を多く配分することができるため、結果として画質改善が期待できる。
ITU-T Recommendation H.264 Advanced video coding
しかしながら、映像システムに使用するカメラに搭載される画像センサによっては、デバイス由来の電気ノイズが映像に重畳されてしまい、全く動きが無い背景でも符号化対象フレームと参照フレームとの間に数値的な差異が生じてしまうことがある。その場合、動きが無い箇所であってもエンコーダがスキップモードを選択せず、符号化データが発生してしまい、低いビットレートでの限られた符号量を消費してしまう。その結果、動きがある箇所に配分できる符号量がその分少なくなり、画質が劣化してしまう。
本発明は上記問題点を鑑みてなされたものであり、ネットワークで映像を通信する環境における低ビットレート時の画質の改善を目的とする。
上記目的を達成するために、予測符号化により画像を符号化する本発明の符号化装置は、符号化対象のフレーム画像に対してスケーリングリストを用いて量子化を行う量子化手段と、前記量子化手段により量子化された前記フレーム画像に対してスケーリングリストを用いて逆量子化を行う逆量子化手段と、前記量子化手段および前記逆量子化手段に、それぞれスケーリングリストを設定する設定手段と、を有し、前記設定手段は、前記逆量子化手段に、前記符号化装置により符号化された画像を復号する再生装置で用いる第1のスケーリングリストを設定し、前記量子化手段に、前記第1のスケーリングリストと異なる第2のスケーリングリストを設定する。
本発明によれば、ネットワークで映像を通信する環境における低ビットレート時の画質を改善することができる。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
<第1実施形態>
本発明の第1実施形態について説明する。
なお、以下に説明する実施形態においては、本発明に係る画像符号化装置を適用可能な電子機器として、監視カメラシステムに接続された監視カメラを例にとって説明する。
本発明の第1実施形態について説明する。
なお、以下に説明する実施形態においては、本発明に係る画像符号化装置を適用可能な電子機器として、監視カメラシステムに接続された監視カメラを例にとって説明する。
●システム構成
図1は、図8に示すネットワークを介して通信可能に接続された監視カメラシステムに、監視カメラ103と再生装置113を追加した監視カメラシステムである。監視カメラ103はH.264規格のHigh Profileに準拠しているとともに、再生装置113はH.264規格のHigh Profileでの再生が可能となっている。H.264規格のHigh Profile以上では、ユーザー定義のスケーリングリストが使用可能となる。
図1は、図8に示すネットワークを介して通信可能に接続された監視カメラシステムに、監視カメラ103と再生装置113を追加した監視カメラシステムである。監視カメラ103はH.264規格のHigh Profileに準拠しているとともに、再生装置113はH.264規格のHigh Profileでの再生が可能となっている。H.264規格のHigh Profile以上では、ユーザー定義のスケーリングリストが使用可能となる。
ユーザー定義のスケーリングリストは、離散コサイン変換(DCT)等の直交変換後の変換係数の各々に対する量子化の精粗を、エンコーダハードウェアあるいは制御ソフトウェアの開発者が独自に設定することができる仕組みである。この仕組みを利用して高周波成分を粗く量子化することで、画像センサ由来のノイズを映像から削減することができ、動きが無い背景における符号化対象フレームと参照フレームの間の数値的な差異を無くすことができる。その結果、動きが無い箇所でエンコーダがスキップモードを選択できるようになり、動きが無い箇所ではデータ量を大きく削減し、動きがある箇所に符号量を多く配分することで、画質を改善することができる。
しかしながら、映像システムの構築コストによっては、図1に示すように、H.264規格のHigh Profileの再生が可能な再生装置113の他に、H.264規格のBaseline ProfileやMain Profileの復号までしか対応していない再生装置111、112が組み込まれていることがある。このような映像システムでは、監視カメラ103でH.264規格のHigh Profile準拠の予測符号化が可能である一方、再生装置111、112はH.264規格のHigh Profileに対応していないため、監視カメラ103からの映像を再生することができない。
特に、監視カメラシステムにおいては、システム上の再生装置すべてが、システムに接続された監視カメラすべてにアクセスできるようにする必要があるため、監視カメラ103でH.264規格のBaseline ProfileやMain Profileに準拠することが求められる場合がある。H.264規格のBaseline Profile及びMain Profileは、規格で標準定義された全周波数成分で同じ精粗具合で量子化を行うように定義されているスケーリングリストを用いるものと定められている。
このように、単純にH.264規格のHigh Profile準拠の予測符号化が可能な監視カメラ103を用いても、システムにH.264規格のHigh Profile以上に準拠していない機器が接続された場合、H.264規格のHigh Profileを使用することができない。その結果、動きが無い背景における符号化対象フレームと参照フレームの間の数値的な差異を無くすことができず、従来と同様に、動きが無い箇所でエンコーダがスキップモードを選択しづらくなってしまう。そのために、動きが無い箇所の発生データを削減できないことで、動きがある箇所に符号量を配分できずに画質が劣化してしまう、という従来と同様の課題が発生してしまう。
そこで、本実施形態では、システムにH.264規格のHigh Profile以上に準拠していない機器が接続された場合に、監視カメラ103でH.264規格のBaseline ProfileやMain Profile準拠の予測符号化を行いつつ、スキップモードが選択され易くするようにする。
●監視カメラ103の構成
図2は、本発明の第1実施形態に係る画像符号化装置を適用した監視カメラ103の機能構成例を示すブロック図である。なお、図2では、符号化に関する機能構成を重点的に示しているが、各種センサーや電源部等、一般的な監視カメラが備える構成に関しては、図示の有無にかかわらず本実施形態の監視カメラ103も備えている。また、監視カメラ103は、基本的に、図1に示す監視カメラシステムに接続された各機器に対応した、H.264規格のBaseline ProfileやMain Profileを用いて、符号化を行う。
図2は、本発明の第1実施形態に係る画像符号化装置を適用した監視カメラ103の機能構成例を示すブロック図である。なお、図2では、符号化に関する機能構成を重点的に示しているが、各種センサーや電源部等、一般的な監視カメラが備える構成に関しては、図示の有無にかかわらず本実施形態の監視カメラ103も備えている。また、監視カメラ103は、基本的に、図1に示す監視カメラシステムに接続された各機器に対応した、H.264規格のBaseline ProfileやMain Profileを用いて、符号化を行う。
レンズ201は、被写体の光学像を撮像部202の撮像面に形成する撮像光学系である。撮像部202は、撮像面に形成された光学像を、複数の画素を備える撮像素子によって光電変換し、画像を表す電気信号(画像信号)に変換する。また、撮像部202は画像信号をA/D変換し、画像データとして現像処理部203に供給する。
現像処理部203は、ノイズ除去、色補間(デモザイク)、欠陥画素補正、ホワイトバランス調整、手振れ補正や周辺光量補正、ガンマ補正、色調補正、拡大縮小、YUV形式への色変換等、予め定められた画像処理を画像データに適用する。なお、現像処理部203は、被写体検出やレンズ201のオートフォーカス制御や、自動露出制御に用いる評価値の生成等、一般的なカメラにおいて撮像画像に対して実行する各種の処理を実行することができるが、詳細については省略する。そして、現像処理部203は、画像処理後にYUV形式に変換した画像データを画像符号化回路204に供給する。
画像符号化回路204は、YUV形式の画像データを予め定められた方式で符号化し、データ量を削減した符号化データを生成する。画像符号化回路204は、例えばASICやFPGA等のハードウェア回路である。画像符号化回路204は、符号化データをIP伝送のためにパケット化し、IP送信部205を介してネットワーク経由でパケットを送信する。
IP送信部205は、画像符号化回路204から送られたパケットデータをネットワークに送信する。IP送信部205は、LANケーブル等の有線方式でネットワークにアクセスしても良いし、またWi-Fiや5Gといった無線方式でネットワークにアクセスしても良い。あるいは、IP送信部205についてはUSBケーブル等でPCやスマートフォンといった端末に接続するインターフェースとした上で、ネットワークアクセスについては端末側に任せても良い。
制御部206は、例えば1つ以上のCPUとメモリとを有する。メモリのうち、不揮発性のものにはプログラム、各種の設定値、GUIデータ等が格納されている。CPUはプログラムをメモリのワークエリアに読み込んで実施し、各部の動作を制御することにより、カメラの各種機能を実現する。
また、制御部206は、画像符号化回路204の設定レジスタにアクセスし、動作パラメータの設定を行う。また、後述するように量子化部211で用いるユーザー定義のスケーリングリストについても制御部206による設定レジスタへのアクセスを介して行う。この際に、ユーザー定義のスケーリングリストの設定については、第1実施形態においては高周波成分を粗く量子化できるものを設定するが、その他の実施形態としてH.264規格で定義されたスケーリングリストを設定しても良い。
フレームバッファ207は、現像処理部203から送られてきたYUV形式の画像データを格納する。格納された画像データは、ブロック分割部208に送られる。また、フレームバッファ207は、デブロッキングフィルタ部218から送られるローカルデコード画像を格納する。格納されたローカルデコード画像は、予測部209及び補償部217に送られる。なお、フレームバッファ207は、DRAMで構成されているものとする。
ブロック分割部208は、必要とするブロックサイズの画素データ(以下、「ブロック画素データ」と呼ぶ。)を、フレームバッファ207に格納された画像データから切り出して読み出し、内部の一時記録メモリに保存する。一時記録メモリ内に記録したブロック画素データは、予測部209に送られる。なお、一時記録メモリはSRAMで構成されているものとする。
予測部209は、ブロック分割部208から送られてきたブロック画素データに対して、予測に基づいて生成した予測画素データとの差分を取り、差分データを直交変換部210に送ると同時に、予測情報を補償部217に送る。予測については、一般的にブロック周辺の画素値に基づく画面内予測、あるいはカレントフレーム(符号化対象フレーム)とは異なる時刻のフレームに基づく画面間予測が用いられている。本件ではH.264規格で規定された映像システムで共通の予測方法を用いて画面内予測、及び画面間予測を行い、補償部217に送る予測情報は同じくH.264規格で規定された映像システムで共通の予測情報を用いる。
また、予測部209は、画面内予測を行う場合はブロック周辺の、画面間予測を行う場合はカレントフレームとは異なる時刻のフレームのローカルデコード画素を、フレームバッファ207から読み出す。
また、予測部209は、画面間予測において、カレントフレーム内のブロック画素データと、カレントフレームとは異なる時刻のフレームのローカルデコードのブロック画素データの間で差分が殆ど無い場合においては、スキップモードを用いるように構成される。ここでの差分評価の方法としては、SATD等、直交変換後の係数値を評価できる手法を用いることが望ましいが、SAD等を用いてもよい。
また、予測部209は、画面間予測において、カレントフレーム内のブロック画素データと、カレントフレームとは異なる時刻のフレームのローカルデコードのブロック画素データの間で差分が殆ど無い場合においては、スキップモードを用いるように構成される。ここでの差分評価の方法としては、SATD等、直交変換後の係数値を評価できる手法を用いることが望ましいが、SAD等を用いてもよい。
直交変換部210は、差分データに対して直交変換(例えば離散コサイン変換)を適用して変換係数を生成し、変換係数を量子化部211に出力する。
量子化部211は、量子化制御部212が出力するブロックごとの量子化パラメータ(量子化ステップサイズ)に対してスケーリングリストで変換係数ごとに重みづけした上で、変換係数を量子化する。
量子化部211は、量子化制御部212が出力するブロックごとの量子化パラメータ(量子化ステップサイズ)に対してスケーリングリストで変換係数ごとに重みづけした上で、変換係数を量子化する。
本実施形態において、量子化部211では、監視カメラ103がH.264規格のHigh Profileに準拠している特性を利用して、H.264規格のHigh Profile以上で設定可能なユーザーが定義したスケーリングリストを使用する。H.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストに対し、高周波成分をより粗く量子化するようにユーザーが定義することができる。なお、量子化部211で用いるスケーリングリストの具体例に関しては、詳細に後述する。
量子化部211は、量子化した変換係数を、符号化データ作成のために可変長符号化部214に出力するとともに、ローカルデコード画像作成のために逆量子化部215にも出力する。
量子化制御部212は、可変長符号化部214から送られてくる直前に処理したブロックの発生符号量と、符号量制御部213によって設定された目標符号量とから、ブロックごとの量子化ステップサイズを決定し、量子化部211に出力する。また、符号量制御部213は、仮想バッファに基づいて目標符号量を算出し、量子化制御部212に設定する。さらに、符号量制御部213は、画像を符号化するごとに仮想バッファへの符号データの入出力をシミュレートしつつ符号量制御を行う。
可変長符号化部214は、量子化された変換係数に対してジグザグスキャン、オルタネートスキャン等を行い、変換係数を可変長符号化し、生成した符号化データをストリーム生成部219に送る。また可変長符号化部214は、ブロックごとの発生符号量を算出して、量子化制御部212及び符号量制御部213に出力する。
逆量子化部215は、量子化部211が出力する変換係数を逆量子化し、ローカルデコード用の変換係数を生成する。ここで、逆量子化部215は量子化部211とは異なるスケーリングリストを用いて量子化パラメタに重みづけした上で変換係数を逆量子化する。本実施形態において、逆量子化部215で用いられるスケーリングリストは、H.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストである。逆量子化部215は、生成した変換係数を逆直交変換部216に出力する。
逆直交変換部216では、変換係数に直交変換部210が適用した直交変換の逆変換(逆離散コサイン変換)を適用して差分画像を生成し、生成した差分画像を補償部217に出力する。
補償部217は、フレームバッファ207に格納された復号済みのローカルデコード画像を読み出し、予測部209から送られた予測情報に従い予測画像を生成し、逆直交変換部216から送られた差分画像と加算し、補償済み画像を生成する。補償済み画像はデブロッキングフィルタ部218に送られる。
デブロッキングフィルタ部218は、対象ブロックの境界における不連続な歪みを平滑化するためのフィルタである。補償部217から送られた補償済み画像に対してデブロッキングフィルタを適用してローカルデコード画像を生成し、フレームバッファ207に送る。
ストリーム生成部219は、可変長符号化部214から送られた符号化データに、復号のために必要なパラメタを付加し、記録ストリームを生成する。また、ストリーム生成部219は、IP伝送のために記録ストリームをさらにパケット化し、IP送信部205を介してネットワーク経由でパケットを送信する。なお、パケット化については、MPEG2-TSやMMT等の規格に準拠して行う。
●ユーザー定義のスケーリングリスト
続いて、第1実施形態の量子化部211で用いるユーザー定義のスケーリングリストについて説明する。
●ユーザー定義のスケーリングリスト
続いて、第1実施形態の量子化部211で用いるユーザー定義のスケーリングリストについて説明する。
H.264規格のHigh Profile以上で使用可能なユーザー定義のスケーリングリストは、DCT等の直交変換後の変換係数の各々に対する量子化の精粗をエンコーダハードウェアあるいは制御ソフトウェアの開発者が独自に設定することができる仕組みである。
一方、H.264規格のBaseline Profile及びMain Profileは、H.264規格で標準定義されたスケーリングリストを用いるものと定められている。H.264規格で標準定義されたスケーリングリストは、全周波数成分で同じ精粗具合で量子化を行うように定義されている。
量子化部211において、H.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストを用いた場合と、高周波成分をより粗く量子化する重みを持ったユーザー定義のスケーリングリストを用いた場合の比較を、図3を用いて行う。
図3(a)は、参照フレーム画像310と符号化対象フレーム画像320との間の差分について説明する図である。枠301と枠302は、フレーム間差分を算出する領域を表し、303は差分箇所の一部を抜き出した4×4の直交変換済みの差分ブロックを表す。また、差分ブロック303は、左上の係数がDC(直流成分)の大きさを表し、それ以外はAC(交流成分)の大きさを表す。ACについては、右や下の係数になるほど高い周波数を持った成分の大きさを表す。
参照フレーム画像310と符号化対象フレーム画像320は、同じ景色をキャプチャした画像であるが、センサーノイズが互いに異なっている。そのため、同一位置(参照フレーム画像310の枠301、及び符号化対象フレーム画像320の枠302で示した位置)で差分を取り、直交変換した場合に、差分ブロック303に示すように、高周波成分に0以外の数値が発生してしまう。本来、同じ画像であれば、差分ブロック303は0のみを係数として持つので、この場合、高周波成分に発生した数値はセンサーノイズに由来するものであると見做すことができる。
図3(b)は、図3(a)の差分ブロック303に対して、量子化部211がH.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストを用いて量子化した例を示す図である。ここで、実際に係数を量子化する際に用いられる量子化ステップ値は4とし、また四捨五入によって小数点以下が丸められるものとする。全周波数成分で同じ重みとなるため、量子化部211は量子化値304で示すように全係数に対して4で除算し、結果として量子化後の差分ブロック305は高周波成分に値が残るものとなる。この場合、エンコーダは差分が残っているものと判断し、実際には同じ景色をキャプチャしているのにも関わらず、符号化対象のブロックに対してはスキップモードを選択しない。
図3(c)は、図3(a)の差分ブロック303に対して、量子化部211が高周波成分をより粗く量子化する重みを持ったスケーリングリストを用いて量子化した例を示す図である。ここでも、実際に係数を量子化する際に用いられる量子化ステップ値は4とし、また四捨五入によって小数点以下が丸められるものとする。図3(c)においては、高周波成分を粗く量子化する重みを持ったスケーリングリストを用い、量子化部211は量子化値306で示すように、高周波成分に対して大きな量子化値を用いて量子化を実施する。結果として、量子化後の差分ブロック307は高周波成分に値が残らないものとなり、エンコーダは符号化対象のブロックに対してスキップモードを選択することができる。
図3(c)のように、量子化部211がセンサーノイズ由来の高周波成分に対して粗く量子化して、動きが無い箇所に対する符号化対象フレームと参照フレームの間の数値的な差異を無くすことで、エンコーダがスキップモードを選択することが可能となる。
以上のように、本発明の第1実施形態において、ユーザー定義のスケーリングリストを利用して高周波成分を粗く量子化して、動きが無い箇所についてスキップモードを発生させ易くすることで、符号化データの発生を大きく削減することができる。これにより、動きがある箇所に符号量を多く配分することができるようになるため、低ビットレート時の画質を改善することが可能となる。
●量子化と逆量子化で異なるスケーリングリストを用いることについて
本実施形態の監視カメラは、映像システムの構成にH.264規格のMain Profile、あるいはBaseline Profileまでしか対応していない再生装置が含まれることを前提としている。そのため、画像符号化回路204がローカルデコード画像を用意する際には、逆量子化部215はH.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストしか使用することができない。
本実施形態の監視カメラは、映像システムの構成にH.264規格のMain Profile、あるいはBaseline Profileまでしか対応していない再生装置が含まれることを前提としている。そのため、画像符号化回路204がローカルデコード画像を用意する際には、逆量子化部215はH.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストしか使用することができない。
一方で、本実施形態においては、監視カメラ103がH.264規格のHigh Profileに対応していることを利用して、前述の通り量子化部211は高周波成分を粗く量子化できるユーザー定義のスケーリングリストを使用する。そのため、量子化部211と逆量子化部215は互いに異なるスケーリングリストを用いることになるが、このことが画質に及ぼす影響は図4を用いて説明するように、軽微なものと考えられる。
図4(a)は、参照フレーム画像410と符号化対象フレーム画像420との間の差分を表している。枠401と枠402はフレーム間差分を算出する領域を表し、403は差分箇所の一部を抜き出した4×4の直交変換済みの差分ブロックを表す。また、差分ブロック403は、左上の係数がDC(直流成分)の大きさを表し、それ以外はAC(交流成分)の大きさを表す。ACについては右や下の係数になるほど高い周波数を持った成分の大きさを表す。
枠401は背景の箇所を切り抜いたものである一方、枠402には移動中の自動車が含まれる。そのため、枠401と402で差分を取り、直交変換した差分ブロック403において、全ての周波数成分に値が生じる。
図4(b)は、図4(a)の差分ブロック403に対して、H.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストを用いて量子化、及び逆量子化した場合を示す図である。ここで、実際に係数を量子化する際に用いられる量子化ステップ値は4とし、また四捨五入によって小数点以下が丸められるものとする。全周波数成分で同じ重みとなるため、量子化値404で示すように量子化では全係数に対して4で除算し、逆量子化では全係数に対して4で乗算する。差分ブロック403に対して量子化値404で除算することで、量子化後の差分ブロック405が算出される。また、差分ブロック405に対して量子化値404で乗算することで、逆量子化後の差分ブロック406が算出される。
図4(c)は、図4(a)の差分ブロック403に対して、高周波成分を粗く量子化できるユーザー定義のスケーリングリストを用いて量子化し、H.264規格で標準定義された全周波数成分で同一の重みとなるスケーリングリストを用いて逆量子化した場合を示す図である。ここでも、実際に係数を量子化する際に用いられる量子化ステップ値は4とし、また四捨五入によって小数点以下が丸められるものとする。図4(c)は、高周波成分を粗く量子化する重みを持ったスケーリングリストを用いて量子化するため、量子化値407で示すように高周波成分に大きな量子化値を設定した上で全係数に対して除算する。一方で、逆量子化は規格準拠のスケーリングリストを用いるため、量子化値404で示すように逆量子化では全係数に対して4で乗算する。差分ブロック403に対して量子化値407で除算することで、量子化後の差分ブロック408が算出される。また、408に対して量子化値404で乗算することで、逆量子化後の差分ブロック409が算出される。
逆量子化後の差分ブロック406と差分ブロック409とを比較すると、DC側の2x2の範囲の係数については同じ値となっている。一方で、その他の係数値については、差分ブロック409の係数は差分ブロック406の係数に対して減衰する方向で差異が生じている。
画像として特に影響が大きいのはDC成分及びその付近の低周波成分であり、高周波成分については画像の細かな差分を表す傾向がある。そのことから、差分ブロック409に基づいて再構成されたデコード画像は、差分ブロック406に基づいて再構成されたデコード画像に対して、若干輪郭がボケたようなものになるが、復号エラーによって画像が破綻するわけではないため、画質への影響は軽微と見做すことができる。
以上のように、量子化部211と逆量子化部215は互いに異なるスケーリングリストを用いても、画質への影響は軽微なものである。すなわち、上述したようにしてユーザー定義のスケーリングリストを用いて量子化し、符号化された監視カメラ103からの映像を、再生装置111及び再生装置112において、H.264規格で標準定義されたスケーリングリストを用いて、十分な画質の映像として復号化することができる。
●処理の流れ
図5は本発明の第1実施形態に係る監視カメラ103における処理の流れを示すフローチャートである。
図5は本発明の第1実施形態に係る監視カメラ103における処理の流れを示すフローチャートである。
S501で、制御部206が量子化部211で使用するユーザー定義のスケーリングリストの情報を画像符号化回路204に設定する。ここで、制御部206は、H.264規格で標準定義されたスケーリングリストに対して、高周波成分を粗く量子化するユーザー定義のスケーリングリストを画像符号化回路204に設定する。
S502で、画像符号化回路204が、撮像部202によってキャプチャされ現像処理部203によって現像された符号化対象フレームを符号化すると共に、ネットワークへの転送のためのパケット化を行う。ここで、量子化部211が量子化処理を行う際は、制御部206によって設定されたユーザー定義のスケーリングリストを用いる。
S503で、画像符号化回路204はローカルデコードを行い、フレームバッファ207にローカルデコード画像を格納する。ここで、画像符号化回路204を構成する逆量子化部215が逆量子化処理を行う際は、H.264規格で標準定義されたスケーリングリストを用いる。
S504で、IP送信部205は画像符号化回路204でパケット化された符号化データをネットワークに送信する。
S505で、全フレームのネットワークへの送信が完了したかを判定し、完了していない場合はS502に戻り、完了した場合は監視カメラ103の撮影動作を終了する。
以上説明したように本実施形態によれば、映像システムの構成によってH.264規格のHigh Profile以上を使用できない場合であっても、スキップモードの発生頻度を増やすことができ、動きが無い箇所はデータを大きく削減することが可能となる。そして、動きが無い箇所でデータを削減できた分だけ、動きがある箇所に符号量を多く配分することができるため、結果として低ビットレート時の画質改善が可能となる。
なお、本実施形態では映像システムの一例として監視カメラを挙げたが、その他の形態を実現するためにも用いることができる。例えば、PCにUSB接続するタイプのWEBカメラや、ラップトップPCに搭載のカメラ、またテレビ会議用の機材に備え付けられたカメラ等に、本発明を適用しても良い。
<第2実施形態>
次に、本発明における第2実施形態について説明を行う。
第2実施形態においては、量子化で用いるスケーリングリストについて、逆量子化時と同じH.264規格で標準定義されたものを用いるか、あるいはユーザー定義のものを用いるか、を選択できるものとしている。
次に、本発明における第2実施形態について説明を行う。
第2実施形態においては、量子化で用いるスケーリングリストについて、逆量子化時と同じH.264規格で標準定義されたものを用いるか、あるいはユーザー定義のものを用いるか、を選択できるものとしている。
第1実施形態においては、常に量子化と逆量子化で異なるスケーリングリストを用いていた。これは低ビットレート時ではスキップモードを増やすことで動きがある箇所に符号量を多く配分することが重要であり、またスケーリングリストが異なることによる画質への影響が十分に小さいと見做せるためである。
一方で、高ビットレート時においては、スキップモードを増やさずとも十分な符号量を動きがある箇所に配分することができるため、スケーリングリストが異なることによる画質への影響は十分に小さくはあるが、極力そのデメリットを排除する。そのため、転送ビットレート応じて、量子化時のスケーリングリストを選択できるようにする。
本実施形態では、ネットワーク転送のためのビットレートが十分に高い場合は、逆量子化時と同じスケーリングリストを、逆にビットレートが低い場合は、逆量子化時とは異なるスケーリングリストを、制御部206が画像符号化回路204に設定する。例えば、夜間でネットワークトラフィックが混雑していない場合は、スキップモードを増やさずとも十分な画質を維持できるビットレートを確保できるため、逆量子化時と同じスケーリングリストを制御部206が画像符号化回路204に設定する。逆に、昼間等でネットワークトラフィックが混雑する場合は、低ビットレートとなってしまい、スキップモードを増やさないと十分な画質を維持できないため、逆量子化時と異なるスケーリングリストを制御部206が画像符号化回路204に設定する。
また、映像システムを構築する上で、イントラのネットワークを用いる等で予めビットレートが分かっていれば、ユーザー定義のスケーリングリストについてシステム稼働前にカメラに設定しておくこともできる。例えばネットワークをリッチにしてFHD30Pで16Mbpsといった高いビットレートが確保できる場合は、逆量子化と同じスケーリングリストを制御部206が画像符号化回路204に設定する。逆にネットワークにコストをかけることができず、HD30Pで1Mbpsといった低いビットレートになってしまう場合は、逆量子化と異なるスケーリングリストを制御部206が画像符号化回路204に設定する。
●処理の流れ
図6は、本発明の第2実施形態に係る画像符号化装置の処理の流れを示すフローチャートである。
なお、画像符号化装置の構成については、第1実施形態と同じであるため、ここでの説明は省略する。
図6は、本発明の第2実施形態に係る画像符号化装置の処理の流れを示すフローチャートである。
なお、画像符号化装置の構成については、第1実施形態と同じであるため、ここでの説明は省略する。
まず、S601で、転送ビットレートが予め決められたビットレートよりも低いか否かを判定する。S601で、転送ビットレートが予め決められたビットレートよりも低いと判定されなかった場合、S602において、制御部206は逆量子化時と同じH.264規格で標準定義されたスケーリングリストを量子化部211に設定する。一方、S601で、転送ビットレートが低いと判定された場合、S603において、制御部206は逆量子化時と異なる高周波成分を粗く量子化するユーザー定義のスケーリングリストを量子化部211に設定する。
以降の処理は、図5で説明した処理と同様であるため、同じ参照番号を付して説明を省略する。
以上説明したように第2実施形態によれば、転送ビットレートに応じて、量子化で用いるスケーリングリストとして、逆量子化のものと同じH.264規格で標準定義されたものを用いるか、あるいはユーザー定義のものを用いるか、を選択することができる。これにより、低ビットレート時にはスキップモードを増やすことで画質劣化を抑制でき、また高ビットレート時には量子化と逆量子化でスケーリングリストが異なることによる画質への影響を排除することができる。
<第3実施形態>
次に、本発明の第3実施形態について説明する。
上述した第1及び第2実施形態では、映像ネットワークにH.264規格のHigh Profileの再生ができない再生装置111、112が組み込まれている場合について説明した。これに対し、第3実施形態では、映像ネットワークにH.264規格のHigh Profileの再生ができない再生装置が組み込まれているかどうかに応じて、量子化部211に設定するスケーリングリストを変更する。
次に、本発明の第3実施形態について説明する。
上述した第1及び第2実施形態では、映像ネットワークにH.264規格のHigh Profileの再生ができない再生装置111、112が組み込まれている場合について説明した。これに対し、第3実施形態では、映像ネットワークにH.264規格のHigh Profileの再生ができない再生装置が組み込まれているかどうかに応じて、量子化部211に設定するスケーリングリストを変更する。
●処理の流れ
図7は、本発明の第3実施形態に係る画像符号化装置の処理の流れを示すフローチャートである。
なお、画像符号化装置の構成については、第1実施形態と同じであるため、ここでの説明は省略する。
図7は、本発明の第3実施形態に係る画像符号化装置の処理の流れを示すフローチャートである。
なお、画像符号化装置の構成については、第1実施形態と同じであるため、ここでの説明は省略する。
まず、S701において、監視カメラ103が接続された映像ネットワークに、H.264規格のHigh Profileの再生ができない再生装置が組み込まれているかどうかを判定する。ここでは、例えば、映像ネットワークの設計者が不図示の操作部を介してH.264規格のHigh Profileの再生ができない再生装置の有無を入力しても良いし、映像ネットワークに接続された再生装置と通信を行って、各再生装置が準拠している復号化方法を判定しても良い。
S701で、H.264規格のHigh Profileの再生ができない再生装置が組み込まれていると判定されると、S702に進んで、転送ビットレートが予め決められたビットレートよりも低いか否かを判定する。転送ビットレートが予め決められたビットレートよりも低いと判定された場合には、S703に進み、制御部206は、量子化部211に高周波成分を粗く量子化するユーザー定義のスケーリングリストを設定し、逆量子化部215に、H.264規格で標準定義されたスケーリングリストを設定する。一方、転送ビットレートが予め決められたビットレートよりも低いと判定されなかった場合には、S704に進み、制御部206は量子化部211及び逆量子化部215共に、H.264規格で標準定義されたスケーリングリストを設定する。
また、S701でH.264規格のHigh Profileの再生ができない再生装置が組み込まれていないと判定された場合、S705に進んで、転送ビットレートが予め決められたビットレートよりも低いか否かを判定する。転送ビットレートが予め決められたビットレートよりも低いと判定されなかった場合には、S704に進み、制御部206は量子化部211及び逆量子化部215共に、H.264規格で標準定義されたスケーリングリストを設定する。一方、転送ビットレートが予め決められたビットレートよりも低いと判定された場合には、S706に進み、量子化部211及び逆量子化部215共に、高周波成分を粗く量子化するユーザー定義のスケーリングリストを画像符号化回路204に設定する。これにより、H.264規格のHigh Profileを用いて符号化が行われることになる。
以降の処理は、図5で説明した処理と同様であるため、同じ参照番号を付して説明を省略する。
以上説明したように第3実施形態によれば、映像ネットワークに接続された機器及び転送ビットレートに応じて、量子化及び逆量子化で用いるスケーリングリストを選択することにより、より画質の劣化を抑制することが可能となる。
<他の実施形態>
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
201:レンズ、202:撮像部、203:現像処理部、204:画像符号化回路、205:IP送信部、206:制御部、207:フレームバッファ、208:ブロック分割部、209:予測部、210:直交変換部、211:量子化部、212:量子化制御部、213:符号量制御部、214:可変長符号化部、215:逆量子化部、216:逆直交変換部、217:補償部、218:デブロッキングフィルタ部、219:ストリーム生成部
Claims (11)
- 予測符号化により画像を符号化する符号化装置であって、
符号化対象のフレーム画像に対してスケーリングリストを用いて量子化を行う量子化手段と、
前記量子化手段により量子化された前記フレーム画像に対してスケーリングリストを用いて逆量子化を行う逆量子化手段と、
前記量子化手段および前記逆量子化手段に、それぞれスケーリングリストを設定する設定手段と、を有し、
前記設定手段は、前記逆量子化手段に、前記符号化装置により符号化された画像を復号する再生装置で用いる第1のスケーリングリストを設定し、前記量子化手段に、前記第1のスケーリングリストと異なる第2のスケーリングリストを設定することを特徴とする符号化装置。 - 前記第1のスケーリングリストは、前記予測符号化の規格で予め定義されたスケーリングリストであって、前記第2のスケーリングリストは、任意に設定可能なスケーリングリストであることを特徴とする請求項1に記載の符号化装置。
- 前記第1のスケーリングリストは、全周波数成分に同一の重みかけるスケーリングリストであって、前記第2のスケーリングリストは、高周波成分を粗く量子化するスケーリングリストであることを特徴とする請求項1または2に記載の符号化装置。
- 前記符号化装置と前記再生装置は通信可能に接続され、接続した通信のビットレートが予め決められたビットレートよりも低い場合に、前記設定手段は、前記量子化手段に前記第2のスケーリングリストを設定し、前記逆量子化手段に前記第1のスケーリングリストを設定することを特徴とする請求項1乃至3のいずれか1項に記載の符号化装置。
- 前記接続した通信のビットレートが予め決められたビットレートよりも低くない場合、前記設定手段は、前記量子化手段および前記逆量子化手段に前記第1のスケーリングリストを設定することを特徴とする請求項4に記載の符号化装置。
- 前記符号化装置は、H.264規格のHigh Profile以上に準拠し、前記再生装置は、H.264規格のHigh Profile以上に準拠していないことを特徴とする請求項1乃至5のいずれか1項に記載の符号化装置。
- 前記符号化装置はH.264規格のHigh Profile以上に準拠し、
前記再生装置がH.264規格のHigh Profile以上に準拠しているかどうかを判定する判定手段を更に有し、
前記再生装置がH.264規格のHigh Profile以上に準拠してる場合であって、
前記接続した通信のビットレートが予め決められたビットレートよりも低い場合に、前記設定手段は、前記量子化手段および前記逆量子化手段に前記第2のスケーリングリストを設定し、
前記接続した通信のビットレートが予め決められたビットレートよりも低くない場合に、前記設定手段は、前記量子化手段および前記逆量子化手段に前記第1のスケーリングリストを設定する
ことを特徴とする請求項4または5に記載の符号化装置。 - 撮像手段と、
請求項1乃至7のいずれか1項に記載の符号化装置と、
前記符号化装置により符号化された画像を出力する出力手段と
を有することを特徴とする電子機器。 - 予測符号化により画像を符号化する符号化方法であって、
量子化手段が、符号化対象のフレーム画像に対してスケーリングリストを用いて量子化を行う量子化工程と、
逆量子化手段が、前記量子化工程で量子化された前記フレーム画像に対してスケーリングリストを用いて逆量子化を行う逆量子化工程と、
設定手段が、前記逆量子化手段に、符号化された画像を復号する再生装置で用いる第1のスケーリングリストを設定し、前記量子化手段に、前記第1のスケーリングリストと異なる第2のスケーリングリストを設定する設定工程と
を有することを特徴とする符号化方法。 - コンピュータを、請求項1乃至7のいずれか1項に記載の符号化装置の各手段として機能させるためのプログラム。
- 請求項10に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021173414A JP2023063113A (ja) | 2021-10-22 | 2021-10-22 | 符号化装置及び方法、及び電子機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021173414A JP2023063113A (ja) | 2021-10-22 | 2021-10-22 | 符号化装置及び方法、及び電子機器 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023063113A true JP2023063113A (ja) | 2023-05-09 |
Family
ID=86270301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021173414A Pending JP2023063113A (ja) | 2021-10-22 | 2021-10-22 | 符号化装置及び方法、及び電子機器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023063113A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023033488A (ja) * | 2019-03-14 | 2023-03-10 | 株式会社三洋物産 | 遊技機 |
JP2023033489A (ja) * | 2019-03-14 | 2023-03-10 | 株式会社三洋物産 | 遊技機 |
-
2021
- 2021-10-22 JP JP2021173414A patent/JP2023063113A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023033488A (ja) * | 2019-03-14 | 2023-03-10 | 株式会社三洋物産 | 遊技機 |
JP2023033489A (ja) * | 2019-03-14 | 2023-03-10 | 株式会社三洋物産 | 遊技機 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6862633B2 (ja) | レート制御方法及びレート制御装置 | |
JP4799438B2 (ja) | 画像記録装置、画像記録方法、画像符号化装置、及びプログラム | |
KR20140110221A (ko) | 비디오 인코더, 장면 전환 검출 방법 및 비디오 인코더의 제어 방법 | |
JPWO2006082690A1 (ja) | 画像符号化方法および画像符号化装置 | |
JPWO2006098226A1 (ja) | 符号化装置および符号化装置を備えた動画像記録システム | |
JP2015508954A (ja) | オブジェクト検出情報に基づく符号化 | |
JP6875821B2 (ja) | 画像符号化装置、撮像装置、画像符号化方法およびプログラム | |
US11343513B2 (en) | Image encoding method and decoding method, encoder, decoder, and storage medium | |
KR20210024624A (ko) | 이미지 인코딩 방법, 디코딩방법, 인코더 및 디코더 | |
JP2023063113A (ja) | 符号化装置及び方法、及び電子機器 | |
JP2002223443A (ja) | トランスコーディング方法およびトランスコーディング装置 | |
JP7343817B2 (ja) | 符号化装置、符号化方法、及び符号化プログラム | |
JP2015050661A (ja) | 符号化装置、符号化装置の制御方法、及び、コンピュータプログラム | |
CN115428451A (zh) | 视频编码方法、编码器、系统以及计算机存储介质 | |
CN118140477A (zh) | 用于复合参考模式的双边匹配 | |
JP2015128239A (ja) | 画像符号化装置、撮像装置、画像符号化方法、及びプログラム | |
JP2018085660A (ja) | 画像符号化装置 | |
JP2019102861A (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム | |
JP2007336260A (ja) | 映像監視装置 | |
JP2008199521A (ja) | 画像処理装置およびその方法 | |
JP4747109B2 (ja) | 演算量調整装置 | |
JP2018191136A (ja) | 符号化装置、符号化方法およびプログラム | |
JP2024149190A (ja) | 符号化装置及び方法、及び電子機器 | |
US20240080483A1 (en) | Systems and methods for warp sample selection and grouping | |
JP4626644B2 (ja) | 符号化装置、符号化方法、プログラム、及び、撮像装置 |