JP6179183B2 - 情報処理装置、プログラム、及び画像処理方法 - Google Patents

情報処理装置、プログラム、及び画像処理方法 Download PDF

Info

Publication number
JP6179183B2
JP6179183B2 JP2013102860A JP2013102860A JP6179183B2 JP 6179183 B2 JP6179183 B2 JP 6179183B2 JP 2013102860 A JP2013102860 A JP 2013102860A JP 2013102860 A JP2013102860 A JP 2013102860A JP 6179183 B2 JP6179183 B2 JP 6179183B2
Authority
JP
Japan
Prior art keywords
encoding
image
unit
range
mosaic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013102860A
Other languages
English (en)
Other versions
JP2014225726A (ja
Inventor
将太郎 石川
将太郎 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013102860A priority Critical patent/JP6179183B2/ja
Publication of JP2014225726A publication Critical patent/JP2014225726A/ja
Application granted granted Critical
Publication of JP6179183B2 publication Critical patent/JP6179183B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、情報処理装置、プログラム、及び画像処理方法に関する。
近年、防犯意識の高まりから監視カメラを設置する店舗や住宅が増えている。繁華街に近い地域では、店舗や住宅だけでなく、駅構内や街頭などにも監視カメラが設置されていることもある。こうした監視カメラの設置は、防犯に役立つ一方で一般市民のプライバシーを侵害する恐れがある。そのため、防犯効果とプライバシーの保護とを両立させる監視カメラの運用方法が検討されている。監視カメラによるプライバシーの侵害を回避又は緩和する方法としては、例えば、被写体の人物が特定されないように、監視カメラで撮影された動画像の中で人物の顔を含む範囲にモザイクを施す方法などが考えられる。
監視カメラが出力する動画像のデータは、所定の動画符号化方式に従って符号化され、監視用のコンピュータなどへ送信される。例えば、Motion JPEG(Joint Photographic Experts Group)やH.264/AVC(Advanced Video Coding)などの規格で定義される動画符号化方式が利用される。Motion JPEG方式で符号化される動画像にモザイクを施す方法としては、事前にモザイクを施す範囲の高周波成分を減衰しておき、高周波成分を減衰した動画像をエンコーダに入力するモザイク化方法が提案されている。
上記のモザイク化方法では、モザイクを施す範囲の高周波成分を減衰する際に画素値を周波数領域へ変換する処理、高周波成分の減衰処理、及び逆変換処理などが実行される。上記のモザイク化方法を適用すると、これらの処理がエンコーダの前段で実行されることになるが、画素値を周波数領域へ変換する処理などはエンコーダ内部でも実行される。
例えば、Motion JPEG方式のエンコーダは、動画像に含まれる各動画フレームを一定サイズのマクロブロックに分割した上で、マクロブロック毎に画素値を直交変換する。さらに、Motion JPEG方式のエンコーダは、データサイズを圧縮するために高周波成分に対応するDCT(Discrete Cosine Transform)係数を除去する。このように、上記のモザイク化方法ではエンコーダの前段で実行する処理とエンコーダ内部で実行する処理とが一部で重複しており、モザイク化により増加する処理量が大きい。
ところで、上記のモザイク化方法はMotion JPEG方式のエンコーダを想定しているが、Motion JPEG方式のエンコーダを利用するよりもH.264/AVC方式のエンコーダを利用する方が同等の画質を得るためのビットレートを低く抑えることができる。これは、H.264/AVC方式のエンコーダがフレーム間予測符号化を利用しているためである。フレーム間予測符号化は、異なる動画フレームの中で類似するマクロブロックを検出し、検出したマクロブロックの動きを示す動き情報及び両マクロブロックの差分情報を利用して符号化する方法である。
なお、プライバシーを配慮した映像の符号化方法として、映像を受信する映像受信機毎に異なるプライバシーレベルを設定しておき、プライバシーレベルに応じてカメラの稼働範囲や符号化レートを決定する方法が提案されている。
国際公開第2005/081515号 特開2004−260424号公報
上記のモザイク化方法はマクロブロックの高周波成分を減衰させてモザイク化する方法を提案しているが、フレーム間予測符号化により生成される差分情報の高周波成分を減衰させても、復元された画像はほとんどモザイクにならない。つまり、差分情報の高周波成分を減衰させても、マクロブロック間で類似する部分をモザイク化したことにならず、結果として復元した画像がほとんどモザイク化されない。なお、H.261、MPEG(Moving Picture Experts Group)-1、MPEG-2/H.262、H.263、MPEG-4 Part2方式などについても同様である。
そこで、1つの側面では、本発明は、フレーム間予測を用いる符号化方式で符号化される動画像のモザイク化をより少ない処理負担で実現することが可能な情報処理装置、プログラム、及び画像処理方法を提供することを目的とする。
上記課題を解決するため、1つの側面によれば、動画像に含まれる複数の動画フレームを複数の画像領域に分け、画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により当該画像領域を符号化する符号化部と、動画フレーム内の指定された範囲に含まれる画像領域については当該画像領域の内容に依らず第2の符号化方法により符号化し、設定した閾値よりも高い周波数成分を当該画像領域から除去するように符号化部を制御する制御部と、を有する情報処理装置が提供される。
また、上記課題を解決するため、他の1つの側面によれば、動画像に含まれる複数の動画フレームを複数の画像領域に分け、画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により当該画像領域を符号化するコンピュータに、動画フレーム内の指定された範囲に含まれる画像領域については当該画像領域の内容に依らず第2の符号化方法により符号化し、設定した閾値よりも高い周波数成分を当該画像領域から除去する処理を実行させるプログラムが提供される。
また、上記課題を解決するため、他の1つの側面によれば、動画像に含まれる複数の動画フレームを複数の画像領域に分け、画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により当該画像領域を符号化するコンピュータが、動画フレーム内の指定された範囲に含まれる画像領域については当該画像領域の内容に依らず第2の符号化方法により符号化し、設定した閾値よりも高い周波数成分を当該画像領域から除去する工程を含む画像処理方法が提供される。
以上説明したように、1つの側面では、本発明は、フレーム間予測を用いる符号化方式で符号化される動画像のモザイク化をより少ない処理負担で実現することが可能になる。
第1実施形態に係る情報処理装置の一例を示した図である。 第2実施形態に係る監視システムの一例を示した図である。 第2実施形態に係るエンコーダの動作の一例を示した第1の図である。 第2実施形態に係るエンコーダの動作の一例を示した第2の図である。 第2実施形態に係るエンコーダのハードウェアの一例を示した図である。 第2実施形態に係るエンコーダが有する機能の一例を示した図である。 第2実施形態に係るエンコーダの符号化部が有する機能について説明するための図である。 第2実施形態に係るエンコーダの制御部が有する機能について説明するための図である。 第2実施形態に係るエンコーダの記憶部に格納される粒度設定用テーブルの一例を示した図である。 第2実施形態に係るエンコーダのモザイク粒度設定部が有する機能について説明するための第1の図である。 第2実施形態に係るエンコーダのモザイク粒度設定部が有する機能について説明するための第2の図である。 第2実施形態に係るエンコーダの非参照領域設定部が有する機能について説明するための図である。 第2実施形態に係るデコーダが有する機能の一例を示した図である。 第2実施形態に係る符号化処理の流れについて説明するための第1のフロー図である。 第2実施形態に係る符号化処理の流れについて説明するための第2のフロー図である。 第2実施形態の一変形例に係る周波数範囲の調整方法について説明するためのフロー図である。 第3実施形態に係るモザイク範囲の自動認識方法の一例を示した図である。 第3実施形態に係る符号化処理の流れについて説明するための図である。
以下に添付図面を参照しながら、実施形態について説明する。なお、本明細書及び図面において実質的に同一の機能を有する要素については、同一の符号を付することにより重複説明を省略する場合がある。
<1.第1実施形態>
第1実施形態について説明する。
図1を参照しながら、第1実施形態に係る情報処理装置10について説明する。図1は、第1実施形態に係る情報処理装置の一例を示した図である。図1に示すように、情報処理装置10は、符号化部11及び制御部12を有する。
なお、情報処理装置10は、図示しないRAM(Random Access Memory)などの揮発性記憶装置や、図示しないHDD(Hard Disk Drive)フラッシュメモリなどの不揮発性記憶装置を有していてもよい。
符号化部11及び制御部12は、CPU(Central Processing Unit)やDSP(Digital Signal Processor)などのプロセッサであってもよい。符号化部11及び制御部12は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのプロセッサ以外の電子回路であってもよい。例えば、符号化部11及び制御部12は、揮発性記憶装置や不揮発性記憶装置に記憶されているプログラムを実行することが可能である。
(符号化部11)
符号化部11は、動画像に含まれる各動画フレームFL1、FL2、FL3、…を複数の画像領域に分ける。さらに、符号化部11は、画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により画像領域を符号化する。例えば、符号化部11は、動画フレームFL1、FL2、FL3、…をサイズが16×16画素のマクロブロックに分割し、各マクロブロックの画素値を符号化する。この例ではマクロブロックを画像領域の単位として採用している。もちろん、画像領域の設定はこの例に限定されない。
例えば、動画フレームFL1がIピクチャ(Intra picture)、動画フレームFL2がBピクチャ(Bi-directional predictive picture)、動画フレームFL3がPピクチャ(Predictive picture)である場合について考える。この場合、動画フレームFL1の各マクロブロックに対してはフレーム間予測符号化が行われず、フレーム内予測符号化を利用して画素値の符号化が行われる。つまり、符号化部11は、動画フレームFL1に含まれる各マクロブロックを第2の符号化方法により符号化する。
なお、フレーム間予測符号化とは、異なる動画フレーム間で類似するマクロブロックを検出し、検出したマクロブロックの動きを考慮して符号化対象のマクロブロックを符号化する方法である。一方、フレーム内予測符号化とは、同じ動画フレーム内における隣接画素間の相関を考慮して符号化対象の画素値を符号化する方法である。
動画フレームFL2及びFL3に対してはフレーム間予測符号化が行われる。動画フレームFL2に対しては、例えば、動画フレームFL1及びFL3を参照フレームとする符号化が行われる。また、動画フレームFL3に対しては、例えば、動画フレームFL1を参照フレームとする符号化が行われる。なお、参照フレームの選択方法はこれに限定されない。また、動画フレームFL2及びFL3に含まれるマクロブロックの符号化方法は、マクロブロック毎に設定することができる。
例えば、参照フレーム内に類似するマクロブロックがある場合、符号化対象のマクロブロックは第1の符号化方法により符号化される。それ以外の場合、符号化対象のマクロブロックは第2の符号化方法により符号化される。つまり、符号化部11は、動画フレームFL2及びFL3に含まれる各マクロブロックを、その内容に応じて選択される第1の符号化方法又は第2の符号化方法により符号化する。
(制御部12)
制御部12は、動画フレーム内の指定された範囲Rに含まれる画像領域については当該画像領域の内容に依らず第2の符号化方法により符号化するように符号化部11を制御する。範囲Rはモザイク化の対象となる範囲である。なお、範囲Rは、利用者が設定してもよいし、物体認識技術を利用して自動検出した所定の被写体を含む範囲であってもよい。
例えば、動画フレームFL2のマクロブロックを符号化する場合、符号化部11は、その内容に応じて第1の符号化方法又は第2の符号化方法を選択して符号化処理を行う。但し、符号化対象のマクロブロックが範囲Rに含まれる場合、制御部12は、そのマクロブロックを符号化する際に符号化部11が第2の符号化方法を選択するように制御する。従って、範囲Rに含まれるマクロブロックは、本来第1の符号化方法により符号化されるものであっても、その内容に依らず第2の符号化方法により符号化される。
図1の例には、オブジェクトが移動する様子を撮影した動画像の動画フレームFL1、FL2、FL3が示されている。このオブジェクトの一部は、動画フレームFL1、FL2、FL3の全てに含まれている。そのため、この一部を含む動画フレームFL2及びFL3のマクロブロックを符号化する場合には第1の符号化方法が利用できる。しかし、動画フレームFL3においてはオブジェクトの一部が範囲Rに含まれているため、その一部を含むマクロブロックについては第2の符号化方法により符号化が行われる。
制御部12は、範囲Rに含まれる画像領域について、設定した閾値よりも高い周波数成分を当該画像領域から除去するように符号化部11を制御する。
符号化処理の中で、符号化部11は、例えば、マクロブロックの画素値を直交変換した上で許容可能な画質を維持できる範囲内で高周波成分を除去する。この処理により、高周波成分が除去された分だけデータサイズが圧縮される。このように、範囲Rに含まれないマクロブロックについては画質の劣化を抑制しつつデータサイズを圧縮するために高周波成分が除去される。しかし、範囲Rに含まれるマクロブロックはモザイク化の対象とされる部分である。そのため、制御部12は、範囲Rに含まれるマクロブロックについて、画質が劣化するように設定した閾値を基準に高周波成分を符号化部11に除去させる。
(効果)
ここで、仮に、図1に示した動画フレームFL3の範囲Rに含まれるオブジェクトの一部をフレーム間予測符号化した場合について考える。図1の例において、このオブジェクトの一部を含む参照フレーム(FL1)のマクロブロックは範囲Rに含まれていないため、このマクロブロックに対しては画質が劣化しない範囲で高周波成分の除去が行われる。このマクロブロックを参照してフレーム間予測符号化を行うと、動画フレームFL3の範囲Rに含まれる符号化対象のマクロブロックは、画質が劣化していないマクロブロックを参照する差分情報に符号化される。この場合、いくら符号化対象のマクロブロックから高周波成分を除去しても、画質が劣化していないマクロブロックが復号時に参照されるため、モザイク化の効果が十分に得られない。
しかし、上記の制御部12によれば、範囲Rに含まれるマクロブロックの符号化方法が第2の符号化方法に制御されるため、画質が劣化するように設定した閾値を基準に高周波成分を除去することでモザイク化の効果が得られる。また、符号化部11が実行する符号化処理の中でモザイク化の処理も実行されているため、事前に動画像に対してモザイク化の処理を施しておく方法に比べると少ない処理負担でモザイク化が実現される。
以上説明したように、第1実施形態によれば、範囲Rに含まれる画像領域が第2の符号化方法に固定され、この画像領域についてはフレーム間予測符号化が行われない。そのため、範囲Rに含まれる画像領域の高周波成分を除去することで、範囲Rに含まれる画像領域の画質を効果的に劣化させることが可能になり、モザイク化が実現される。
<2.第2実施形態>
次に、第2実施形態について説明する。
[2−1.システム]
図2〜図4を参照しながら、第2実施形態に係る監視システム100について説明する。図2は、第2実施形態に係る監視システムの一例を示した図である。図3は、第2実施形態に係るエンコーダの動作の一例を示した第1の図である。図4は、第2実施形態に係るエンコーダの動作の一例を示した第2の図である。
図2に示すように、監視システム100は、撮像装置101と、エンコーダ102a、102bと、端末装置103と、デコーダ105a、105bと、表示装置106a、106bとを含む。また、エンコーダ102a、102bは、それぞれネットワーク104a、104bを介してデコーダ105a、105bと接続される。
なお、図1には、一例として2台のエンコーダ102a、102b及び2台のデコーダ105a、105bを含むシステムが例示されているが、各装置の台数はこの例に限定されない。また、図1の例では1台の撮像装置101しか記載されていないが、2台以上の撮像装置101が監視システム100に含まれていてもよい。また、以下の説明では、エンコーダ102a、102bを区別せずにエンコーダ102と呼ぶ場合がある。さらに、デコーダ105a、105bを区別せずにデコーダ105と呼ぶ場合がある。
(撮像装置101)
撮像装置101は、動画像を撮像することが可能な装置の一例である。撮像装置101は、レンズなどの光学系、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子、及び撮像素子が出力した電気信号を動画像データに変換する信号処理回路を有する。なお、撮像装置101は、H.264/AVCなどの動画符号化方式で動画像データを符号化しないものとする。撮像装置101により撮像された動画像データは、エンコーダ102a、102bに入力される。
(エンコーダ102a、102b)
エンコーダ102aは、所定の動画符号化方式で動画像データを符号化する装置の一例である。所定の動画符号化方式としては、例えば、H.261、MPEG-1、MPEG-2/H.262、H.263、MPEG-4 Part2、H.264/AVCなどの方式が適用可能である。これらの動画符号化方式ではフレーム間予測符号化が利用される。フレーム間予測符号化は、異なる動画フレームの中で類似するマクロブロックを検出し、検出したマクロブロックの動きを示す動き情報及び両マクロブロックの差分情報を利用して符号化する方法である。
ここで、図3の例を参照しながら、ある動画フレーム(以下、参照フレーム)FL2を参照して他の動画フレーム(以下、対象フレーム)FL1を符号化する方法について説明する。なお、図3における対象フレームFL1の枡目はそれぞれマクロブロックを表す。また、対象フレームFL1は、マクロブロック毎に符号化されるものとする。
いま、対象フレームFL1に含まれるオブジェクトOBJの一部に対応するマクロブロックMB1に注目する。このマクロブロックMB1をフレーム間予測符号化する場合、エンコーダ102aは、参照フレームFL2の中でマクロブロックMB1の画像と類似する部分(図3の例では領域MB2)を抽出する。そして、エンコーダ102aは、参照フレームFL2の中でマクロブロックMB1の位置から領域MB2の位置への移動量及び方向を示す動きベクトルMVを算出する。さらに、エンコーダ102aは、対象フレームFL1のマクロブロックMB1と、参照フレームFL2の領域MB2との差分を計算して差分信号を生成する。
上記のように異なる動画フレーム間で類似するマクロブロックを検出し、検出したマクロブロックの動きを示す動きベクトルMV及び差分信号を生成する処理がフレーム間予測符号化の中心的な処理になる。
動きベクトルMV及び差分信号が得られると、エンコーダ102aは、差分信号を直交変換して周波数領域の信号を生成する(S1)。例えば、エンコーダ102aは、差分信号にDCTを施してDCT係数を生成する。さらに、エンコーダ102aは、DCT係数を量子化する(S2)。このとき、エンコーダ102aは、高周波成分のDCT係数を0にしてデータ圧縮を実現する。そして、エンコーダ102aは、動きベクトルMVを利用してエントロピー符号化を行い(S3)、マクロブロックMB1に対応する符号列を出力する。なお、S3の処理に他の可逆圧縮符号化を適用することも可能である。
フレーム間予測符号化を利用して符号化されるマクロブロックに対しては、上記のような符号化処理が施される。但し、フレーム間予測符号化を利用せずに符号化されるマクロブロックに対しても直交変換(S1)や量子化(S2)の処理は実行される。この場合、図4に示すように、対象フレームFL1のマクロブロックMB1に含まれる各画素の画素値(A)が直交変換(例えば、DCT)され、DCT係数(B)が生成される。そして、エンコーダ102aは、高周波成分のDCT係数を0にしてデータ圧縮を実現する。なお、データ圧縮を目的とする場合には、画質の劣化が生じないようにDCT係数を0にする高周波成分の範囲が決定される。但し、モザイク範囲については画質が劣化するように高周波成分の範囲が設定される。
再び図1を参照する。エンコーダ102aは、撮像装置101から動画像データが入力されると、入力された動画像データを所定の動画符号化方式で符号化する。このとき、エンコーダ102aは、動画像データをモザイク化することができる。例えば、モザイク化の対象範囲(以下、モザイク範囲)などが指定された場合、エンコーダ102aは、動画像データを符号化する工程の中でモザイク範囲をモザイク化する。なお、エンコーダ102bはエンコーダ102aと同じ機能を有する。
(端末装置103)
端末装置103は、ユーザが利用する操作端末の一例である。例えば、エンコーダ102a、102bに対するモザイク範囲の指定は、端末装置103を利用して行われる。図1の例では、エンコーダ102aに対して端末装置103からモザイク化の指示(モザイク範囲の指定など)が行われている。一方、エンコーダ102bに対しては端末装置103からモザイク化の指示が行われていない。この場合、撮像装置101からエンコーダ102aに入力された動画像データはモザイク化されるが、エンコーダ102bに入力された動画像データはモザイク化されない。このように、端末装置103を介してエンコーダ102a、102bに指示を与えることで、動画像データに施すモザイク処理の内容を設定することができる。
(ネットワーク104a、104b)
ネットワーク104a、104bは、有線通信網、無線通信網、及びこれらを組み合わせた通信網である。また、ネットワーク104a、104bは、WAN(Wide Area Network)などの広域型ネットワークであってもよいし、LAN(Local Area Network)などの局地型ネットワークであってもよい。なお、ネットワーク104bはネットワーク104aと同じネットワークであってもよいし、異なるネットワークであってもよい。図1の例では、エンコーダ102aにより符号化された動画像データはネットワーク104aを介してデコーダ105aに入力される。一方、エンコーダ102bにより符号化された動画像データはネットワーク104bを介してデコーダ105bに入力される。
(デコーダ105a、105b)
デコーダ105aは、所定の動画符号化方式で動画像データを復号する装置の一例である。デコーダ105aは、エンコーダ102aが符号化に利用した動画符号化方式に従い、エンコーダ102aにより符号化された動画像データを復号して符号化前の動画像データを復元する。なお、デコーダ105bはデコーダ105aと同じ機能を有する。デコーダ105aにより復元された動画像データは表示装置106aに入力される。一方、デコーダ105bにより復元された動画像データは表示装置106bに入力される。
(表示装置106a、106b)
表示装置106a、106bは、動画像データを表示可能な装置の一例である。表示装置106a、106bとしては、例えば、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、ELD(Electro-Luminescence Display)などのディスプレイ装置を利用することができる。例えば、表示装置106a、106bは、それぞれ異なる場所に設置され、異なるユーザが利用する。表示装置106aにはデコーダ105aにより復元された動画像データが表示される。一方、表示装置106bにはデコーダ105bにより復元された動画像データが表示される。
(応用例)
上記のように、監視システム100は、エンコーダ102a、102bにそれぞれ異なるモザイク処理の設定を行うことができる。そのため、同じ撮像装置101が撮影した動画像データに対してモザイク処理の内容が異なる複数の動画像データを作成することが可能になる。例えば、表示装置106aを利用する監視者には被写体の顔を見る権限がなく、表示装置106bを利用する監視者には被写体の顔を見る権限があるような場合に、表示装置106aだけに顔部分をモザイク化した動画像データを表示させることができる。また、モザイク化の有無だけでなく、モザイク範囲が異なる複数の動画像データを生成することもできる。
ここでは、撮像装置101による撮影範囲を監視するシステムを例に挙げたが、例えば、テレビジョン放送用の動画像データと編集用の動画像データとを区別してモザイク範囲を設定した複数の動画像データを生成するシステムなどに応用することも可能である。また、防犯用の監視システムに限らず、自動車ナンバー自動読取装置などを管理するシステムなどに応用することも可能である。
また、図1の例ではエンコーダ102a、102bを別体のように記載したが、1台のコンピュータが搭載する複数のプロセッサコアや複数のスレッドを利用してエンコーダ102a、102bの機能を実現することもできる。また、撮像装置101にエンコーダ102a、102bの機能を搭載してもよい。
上記のような応用例についても第2実施形態の技術的範囲に含まれる。但し、以下では、説明の都合上、図1の例を念頭に置いて説明を進めることにする。
[2−2.エンコーダ]
ここで、エンコーダ102について、さらに説明する。
(ハードウェア)
まず、図5を参照しながら、エンコーダ102が有する機能を実現することが可能なハードウェアについて説明する。図5は、第2実施形態に係るエンコーダのハードウェアの一例を示した図である。
エンコーダ102が有する機能は、例えば、図5に示す情報処理装置のハードウェア資源を用いて実現することが可能である。つまり、当該各要素の機能は、コンピュータプログラムを用いて図5に示すハードウェアを制御することにより実現される。なお、このハードウェアの形態は任意であり、例えば、パーソナルコンピュータ、携帯電話、スマートフォン、PHS(Personal Handy-phone System)、PDA(Personal Digital Assistant)などの携帯情報端末、ゲーム機、各種通信装置がこれに含まれる。
図5に示すように、このハードウェアは、主に、CPU902と、ROM(Read Only Memory)904と、RAM906と、ホストバス908と、ブリッジ910と、を有する。さらに、このハードウェアは、外部バス912と、インターフェース914と、入力部916と、出力部918と、記憶部920と、ドライブ922と、接続ポート924と、通信部926と、を有する。
CPU902は、演算処理装置又は制御装置として機能し、ROM904、RAM906、記憶部920、又はリムーバブル記録媒体928に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。ROM904は、CPU902に読み込まれるプログラムや演算に用いるデータなどを格納する記憶装置の一例である。RAM906には、例えば、CPU902に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータなどが一時的又は永続的に格納される。
これらの要素は、例えば、高速なデータ伝送が可能なホストバス908を介して相互に接続される。一方、ホストバス908は、例えば、ブリッジ910を介して比較的データ伝送速度が低速な外部バス912に接続される。また、入力部916としては、例えば、マウス、キーボード、タッチパネル、タッチパッド、ボタン、スイッチ、及びレバーなどが用いられる。さらに、入力部916としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラが用いられることもある。
出力部918としては、例えば、CRT、LCD、PDP、ELDなどのディスプレイ装置が用いられる。また、出力部918として、スピーカやヘッドホンなどのオーディオ出力装置、プリンタ、携帯電話、又はファクシミリなどが用いられることもある。つまり、出力部918は、情報を視覚的又は聴覚的に出力することが可能な装置である。
記憶部920は、各種のデータを格納するための装置である。記憶部920としては、例えば、HDDなどの磁気記憶デバイスが用いられる。また、記憶部920として、SSD(Solid State Drive)やRAMディスクなどの半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイスなどが用いられてもよい。
ドライブ922は、着脱可能な記録媒体であるリムーバブル記録媒体928に記録された情報を読み出し、又はリムーバブル記録媒体928に情報を書き込む装置である。リムーバブル記録媒体928としては、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどが用いられる。また、リムーバブル記録媒体928として、非接触型IC(Integrated Circuit)チップを搭載したICカードや電子機器などが用いられてもよい。
接続ポート924は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS−232Cポート、又は光オーディオ端子など、外部接続機器930を接続するためのポートである。外部接続機器930としては、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダなどが用いられる。
通信部926は、ネットワーク932に接続するための通信デバイスである。通信部926としては、例えば、有線又は無線LAN用の通信回路、WUSB(Wireless USB)用の通信回路、光通信用の通信回路やルータ、ADSL(Asymmetric Digital Subscriber Line)用の通信回路やルータ、携帯電話ネットワーク用の通信回路などが用いられる。通信部926に接続されるネットワーク932は、有線又は無線により接続されたネットワークであり、例えば、インターネット、LAN、放送網、衛星通信回線などを含む。
(機能)
次に、図6〜図12を参照しながら、エンコーダ102の機能について説明する。図6は、第2実施形態に係るエンコーダが有する機能の一例を示した図である。図6に示すように、エンコーダ102は、符号化部111及び制御部CTLを有する。以下、符号化部111及び制御部CTLの機能について、それぞれ説明する。
(符号化部111の機能について)
符号化部111は、所定の動画符号化方式に従って動画像データを符号化する要素である。符号化部111には、撮像装置101から動画像データに含まれる動画フレームが入力される。ここで、符号化部111の機能について、図7を参照しながら、さらに説明する。なお、以下の説明においては、符号化部111に入力された動画フレームを入力画像と呼ぶ場合がある。図7は、第2実施形態に係るエンコーダの符号化部が有する機能について説明するための図である。
図7に示すように、符号化部111は、マクロブロック(MB)生成部121、減算器122、直交変換部123、量子化部124、エントロピー符号化部125、逆量子化部126、及び逆直交変換部127を有する。さらに、符号化部111は、加算器128、フレームメモリ129、イントラ予測画像生成部130、インター予測画像生成部131、動きベクトル演算部132、スイッチ133、及びイントラ予測モード導出部134を有する。
マクロブロック生成部121は、入力された動画フレームを16×16画素のマクロブロックに分割する。マクロブロック生成部121により生成されたマクロブロックは、減算器122、及び動きベクトル演算部132に入力される。以下、マクロブロック単位の画像データをブロックデータと呼ぶ場合がある。減算器122は、マクロブロック生成部121から入力されたブロックデータと、スイッチ133を介してイントラ予測画像生成部130又はインター予測画像生成部131から入力された予測画像のデータとの差分を演算して差分信号を生成する。
減算器122により生成された差分信号は、直交変換部123に入力される。直交変換部123は、減算器122から入力された差分信号に対して所定の直交変換を施す。所定の直交変換としては、DCTやカルーネン・レーベ変換などがある。以下、説明の都合上、所定の直交変換としてDCTを利用する場合を想定して説明を進める。この場合、直交変換部123によりDCT係数が生成される。直交変換部123により生成されたDCT係数は、量子化部124に入力される。
量子化部124は、予め用意された量子化テーブルを参照し、直交変換部123から入力されたDCT係数を量子化する。量子化部124により量子化されたDCT係数(以下、量子化データ)は、エントロピー符号化部125及び逆量子化部126に入力される。
エントロピー符号化部125は、量子化データに可変長符号化及び算術符号化などの可逆符号化処理を施して符号化信号を生成する。可変長符号化としては、例えば、CAVLC(Context-Adaptive Variable Length Coding)などが利用可能である。算術符号化としては、例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)などが利用可能である。
また、エントロピー符号化部125は、イントラ予測モード導出部134により選択されたイントラ予測モードに関する情報やインター予測画像生成部131が動き補償に用いる動きベクトルMVの情報を符号化する。例えば、イントラ予測モードに関する情報には、輝度及び色差の符号化単位とするマクロブロックサイズ、プレーンモード、平均モード、水平モード、垂直モード、PCM(Pulse Code Modulation)信号を用いるモードなどの情報が含まれる。エントロピー符号化部125は、符号化したモード情報及び動きベクトルMVの情報を符号化信号のヘッダ部分に付加して出力する。
逆量子化部126は、量子化部124から入力された量子化データを逆量子化する。逆量子化部126から出力されたデータ(以下、復元DCT係数)は、逆直交変換部127に入力される。逆直交変換部127は、復元DCT係数に逆DCT変換を施して差分信号を復元する。逆直交変換部127により復元された差分信号は、加算器128に入力される。
加算器128は、インター予測画像生成部131により動き補償されたブロックデータと復元された差分信号とを加算する。この加算処理により、動き補償された参照フレームのデータが生成される。加算器128により生成された参照フレームのデータはフレームメモリ129に格納される。なお、フレームメモリ129の前段にデブロッキングフィルタを配置して参照フレームのデータからブロック歪が除去されるようにしてもよい。
イントラ予測画像生成部130は、同じフレーム内の周辺画素から予測画像のブロックデータを生成する。つまり、イントラ予測画像生成部130は、フレームメモリ129に格納された参照フレームをもとにフレーム内予測符号化の処理を実行して予測画像のブロックデータを生成する。このとき、イントラ予測画像生成部130は、イントラ予測モード導出部134により選択されたイントラ予測モードで処理を実行する。
なお、イントラ予測モード導出部134は、符号化のコストを計算するために予め用意したコスト関数を用いて候補となる全てのイントラ予測モードについてコスト関数値を算出し、コスト関数値が最小となるイントラ予測モードを選択する。
インター予測画像生成部131は、フレームメモリ129から読み出した参照フレームのデータと、動きベクトル演算部132により算出された動きベクトルとを用いて動き補償し、予測画像のブロックデータを生成する。
なお、動きベクトル演算部132は、フレームメモリ129から読み出した参照フレームのデータと、マクロブロック生成部121により生成されたブロックデータとを用いて動きベクトルを算出する。この動きベクトルは、ブロックデータが示すマクロブロックと、これに類似する参照フレーム内の領域との相対的な位置関係を示す情報である。
スイッチ133は、イントラ予測画像生成部130又はインター予測画像生成部131により生成された予測画像を選択的に減算器122及び加算器128へと入力する。なお、フレーム内予測(イントラ予測)符号化が行われる場合にはイントラ予測画像生成部130により予測画像のデータが生成され、フレーム間予測(インター予測)符号化が行われる場合にはインター予測画像生成部131により予測画像が生成される。そのため、スイッチ133は、符号化の方法に応じてイントラ予測画像生成部130又はインター予測画像生成部131を選択する。例えば、Iピクチャ、Bピクチャ、及びPピクチャがイントラ予測の対象となり、Bピクチャ及びPピクチャがインター予測の対象となる。
上記のように、符号化部111は、フレーム内予測符号化及びフレーム間予測符号化を併用して動画像データに含まれる動画フレームをマクロブロック単位で符号化する。また、符号化部111は、複数の動画フレームに類似したマクロブロックを含む場合に、インター予測画像生成部131などの機能を利用してフレーム間予測符号化を行う。
例えば、監視カメラの映像は背景がほとんど変化しないため、動画フレームに含まれるほとんどのマクロブロックに対してフレーム間予測符号化が行われる。そのため、このような映像に対しては高いデータ圧縮率を実現することができる。
但し、エンコーダ102においては、制御部CTLにより符号化部111の動作が制御される。そのため、複数の動画フレーム間で類似度の高いマクロブロックが存在しても、制御部CTLによりフレーム内予測符号化が指定された場合には、対象のマクロブロックに対してフレーム内予測符号化が行われる。また、イントラ予測モード導出部134により好適なイントラ予測モードが選択された場合でも、制御部CTLによりイントラ予測モードが指定された場合には、対象のマクロブロックに対して、指定されたイントラ予測モードで符号化が行われる。
このように、符号化部111は、画像の内容に応じて好適な符号化方法を選択して符号化処理を実行すると共に、制御部CTLによる制御に応じてマクロブロック毎に設定を変更することができる。
(制御部CTLの機能について)
次に、図6、図8〜図12を参照しながら、制御部CTLの機能について説明する。
図8は、第2実施形態に係るエンコーダの制御部が有する機能について説明するための図である。図9は、第2実施形態に係るエンコーダの記憶部に格納される粒度設定用テーブルの一例を示した図である。
図10は、第2実施形態に係るエンコーダのモザイク粒度設定部が有する機能について説明するための第1の図である。図11は、第2実施形態に係るエンコーダのモザイク粒度設定部が有する機能について説明するための第2の図である。図12は、第2実施形態に係るエンコーダの非参照領域設定部が有する機能について説明するための図である。
図6に示すように、制御部CTLは、モザイク範囲設定部112と、符号化方法設定部113と、符号化単位サイズ設定部114と、記憶部115と、モザイク粒度設定部116と、非参照ブロック設定部117とを有する。
(モザイク範囲設定部112)
モザイク範囲設定部112は、端末装置103からモザイク範囲の情報を取得する。そして、モザイク範囲設定部112は、図8の(A)及び(B)に示すように、取得した情報が示すモザイク範囲に対応するマクロブロックをモザイク化の対象に決定する。
なお、端末装置103によりマクロブロック単位でモザイク範囲が指定されている場合、モザイク範囲設定部112は、指定されたモザイク範囲のマクロブロックをそのままモザイク化の対象に決定する。モザイク化の対象として決定されたマクロブロック単位のモザイク範囲の情報は、符号化方法設定部113、符号化単位サイズ設定部114、モザイク粒度設定部116、及び非参照ブロック設定部117に入力される。
(符号化方法設定部113)
符号化方法設定部113は、モザイク範囲に含まれるマクロブロックの符号化方法をフレーム内予測符号化に設定する。つまり、符号化方法設定部113は、モザイク範囲に含まれるマクロブロックについてフレーム内予測符号化を行うように符号化部111を制御する。
例えば、符号化方法設定部113は、イントラ予測画像生成部130、インター予測画像生成部131、動きベクトル演算部132、スイッチ133、及びイントラ予測モード導出部134などの動作を制御する。かかる制御により、モザイク範囲に含まれるマクロブロックについては符号化方法がフレーム内予測符号化に固定される。
(符号化単位サイズ設定部114)
符号化単位サイズ設定部114は、モザイク範囲に含まれるマクロブロックに対してフレーム内予測符号化を行う際の符号化単位サイズを設定する。フレーム内予測符号化を行う符号化単位サイズとしては、例えば、16×16画素の他に、8×8画素や4×4画素を選択することもできる。なお、同じモザイク範囲においては、選択した符号化単位サイズは固定される。
符号化単位サイズは、通常、符号化部111のイントラ予測モード導出部134によりコスト関数値を用いて選択される。しかし、符号化単位サイズ設定部114は、イントラ予測モード導出部134を制御して、モザイク範囲に含まれるマクロブロックに対して所定の符号化単位サイズを選択して設定する。
所定の符号化単位サイズは、予め設定されていてもよいし、端末装置103を介して設定されてもよい。かかる制御により、モザイク範囲に含まれるマクロブロックについてはイントラ予測モードとして設定される符号化単位サイズが固定される。
(記憶部115、モザイク粒度設定部116)
記憶部115は、制御部CTLが処理に利用するデータを保持するための記憶装置の一例である。記憶部115は、粒度設定用テーブル115aを有する。粒度設定用テーブル115aは、設定されたモザイク粒度と、カットする高周波成分の範囲を決める閾値との関係を示す情報である。ここで言うモザイク粒度とは、画質を劣化させる度合いを示す指標である。
モザイク粒度設定部116は、粒度設定用テーブル115aを参照してカット対象の周波数範囲を設定する。そして、モザイク範囲設定部112は、符号化部111を制御し、モザイク範囲に含まれるマクロブロックについて、設定した周波数範囲のDCT係数をカットさせる。このとき、モザイク粒度設定部116は、主に符号化部111が有する量子化部124の動作を制御する。なお、モザイク粒度の設定は、予め用意された設定が適用されてもよいし、端末装置103を利用して設定されてもよい。
粒度設定用テーブル115aは、例えば、図9のように設定される。図9の例では、モザイク粒度が「大」の場合に、カット対象の周波数範囲がDC成分以外の範囲に設定される。この場合、モザイク範囲設定部112は、符号化部111を制御して、図10に示すように、モザイク範囲に含まれるマクロブロックについてDC成分以外のDCT係数を0にさせる。この処理によりDC成分だけが残るため、図11に示すように、そのマクロブロックの平均画素値に相当する一様な画像が得られる。
図9の例では、モザイク粒度「中」及び「小」が設定されている。モザイク粒度が「中」の場合、カット対象の周波数範囲はF1>Th11、かつ、F2>Th21の範囲に設定される。なお、F1及びF2はそれぞれ水平方向及び垂直方向の周波数成分を表す。また、Th11及びTh21は0以上の値に予め設定される。但し、Th11及びTh21はモザイクを実現する上で十分な画質の劣化が得られるように設定される。この場合、DC成分以外の周波数成分もカットされずに残るため、モザイク粒度「大」の場合に比べて、モザイク処理後の画像に元画像の雰囲気が幾分か残されることになる。
また、モザイク粒度が「小」の場合、カット対象の周波数範囲はF1>Th12、かつ、F2>Th22の範囲に設定される。但し、Th12はTh12>Th11である。Th22はTh22>Th21である。この場合も、Th12及びTh22はモザイクを実現する上で十分な画質の劣化が得られるように設定される。しかし、モザイク粒度が「中」の場合よりも多くの高周波成分が残されるため、モザイク粒度「中」の場合に比べて、モザイク処理後の画像に元画像の雰囲気がより多く残されることになる。
なお、図9の例ではモザイク粒度を3段階に設定できる仕組みを示したが、モザイク粒度の設定方法はこれに限定されない。例えば、2段階又は4段階以上にモザイク粒度を設定できるような仕組みにしてもよいし、モザイク粒度を実数又は整数などの数値で設定できる仕組みにしてもよい。
モザイク粒度を数値Xで設定できる仕組みにする場合には、例えば、カット対象の周波数範囲をF1>Th1及びF2>Th2とし、数値Xが大きくなるにつれてTh1及びTh2が大きくなるような仕組みにすればよい。但し、Th1及びTh2に上限を設け、モザイクを実現する上で十分な画質の劣化が得られる範囲でTh1及びTh2が変化するような仕組みにするとよい。
(非参照ブロック設定部117)
非参照ブロック設定部117は、符号化部111がフレーム間予測符号化を行う際に、モザイク範囲に含まれるマクロブロックを参照しないように設定する。このとき、非参照ブロック設定部117は、主に符号化部111が有する動きベクトル演算部132の動作を制御する。つまり、非参照ブロック設定部117は、モザイク範囲に含まれるマクロブロックを指し示す動きベクトルを生成しないように制御する。
上記のように、モザイク範囲に含まれるマクロブロックは画質が劣化させられる。そのため、画質が劣化したマクロブロックを参照して復号すると、復号対象のマクロブロックがモザイク範囲に含まれないマクロブロックである場合でも、復号後のマクロブロックの画質が劣化した状態になってしまう。
そこで、図12に示すように、モザイク範囲を含む参照フレームFL2を参照する場合、符号化対象のマクロブロックMB1と類似するマクロブロックMB2が参照フレームFL2に存在しても、それがモザイク範囲内に位置する場合には参照しないように設定する。かかる設定により、モザイク化に起因して復号時にモザイク範囲外のマクロブロックに画質の劣化が生じることを抑制できる。
以上、エンコーダ102について説明した。
[2−3.デコーダ]
次に、デコーダ105について、さらに説明する。なお、デコーダ105の機能は、エンコーダ102と同じハードウェアを用いて実現可能である。そのため、デコーダ105のハードウェアについては説明を省略する。
(機能について)
図13を参照しながら、デコーダ105の機能について説明する。図13は、第2実施形態に係るデコーダが有する機能の一例を示した図である。
図13に示すように、デコーダ105は、エントロピー復号部151、逆量子化部152、逆直交変換部153、加算器154、フレームメモリ155、イントラ予測画像生成部156、インター予測画像生成部157、及びスイッチ158を有する。
エントロピー復号部151は、エンコーダ102において量子化データに可変長符号化及び算術符号化などの可逆符号化処理を施して生成された符号化信号を復号する。さらに、エントロピー復号部151は、ヘッダ部分を参照し、エンコーダ102において選択されたイントラ予測モードに関する情報や動きベクトルMVの情報を復号処理により抽出する。
エントロピー復号部151により抽出されたイントラ予測モードに関する情報は、イントラ予測画像生成部156に入力される。また、エントロピー復号部151により抽出された動きベクトルMVの情報はインター予測画像生成部157に入力される。
逆量子化部152は、エントロピー復号部151により復元された量子化データを逆量子化する。逆量子化部152から出力されたデータ(復元DCT係数)は、逆直交変換部153に入力される。逆直交変換部153は、復元DCT係数に逆DCT変換を施して差分信号を復元する。逆直交変換部153により復元された差分信号は、加算器154に入力される。
加算器154は、インター予測画像生成部157により動き補償されたブロックデータと復元された差分信号とを加算する。この加算処理により、動き補償された参照フレームのデータが生成される。加算器154により生成された参照フレームのデータはフレームメモリ155に格納される。
なお、フレームメモリ155の前段にデブロッキングフィルタを配置して参照フレームのデータからブロック歪が除去されるようにしてもよい。また、フレームメモリ155に格納されるデータは復号画像として出力される。
イントラ予測画像生成部156は、同じフレーム内の周辺画素から予測画像のブロックデータを生成する。つまり、イントラ予測画像生成部156は、フレームメモリ155に格納された参照フレームをもとにフレーム内予測符号化の処理を実行して予測画像のブロックデータを生成する。このとき、イントラ予測画像生成部156は、エントロピー復号部151により入力されたイントラ予測モードで処理を実行する。
一方、インター予測画像生成部157は、フレームメモリ155から読み出した参照フレームのデータと、エントロピー復号部151により入力された動きベクトルMVとを用いて動き補償し、予測画像のブロックデータを生成する。
スイッチ158は、イントラ予測画像生成部156又はインター予測画像生成部157により生成された予測画像を選択的に加算器154へと入力する。なお、フレーム内予測(イントラ予測)符号化が行われる場合にはイントラ予測画像生成部156により予測画像のデータが生成され、フレーム間予測(インター予測)符号化が行われる場合にはインター予測画像生成部157により予測画像が生成される。スイッチ158は、符号化の方法に応じてイントラ予測画像生成部156又はインター予測画像生成部157を選択する。例えば、Iピクチャ、Bピクチャ、及びPピクチャがイントラ予測の対象となり、Bピクチャ及びPピクチャがインター予測の対象となる。
以上、デコーダ105について説明した。
[2−4.符号化処理の流れ]
次に、図14及び図15を参照しながら、第2実施形態に係る符号化処理の流れについて説明する。図14は、第2実施形態に係る符号化処理の流れについて説明するための第1のフロー図である。図15は、第2実施形態に係る符号化処理の流れについて説明するための第2のフロー図である。
(S101)モザイク範囲設定部112は、指定されたモザイク範囲の情報を端末装置103から取得する。モザイク範囲の情報は、例えば、マクロブロック単位又は画素単位で指定される。なお、モザイク範囲は予め設定されていてもよい。また、モザイク範囲は、矩形や円形などの所定の形状で指定されるようにしてもよいし、ユーザが端末装置103上で入力した自由な形状で指定されるようにしてもよい。
(S102)モザイク範囲設定部112は、S101で取得した情報に基づき、指定されたモザイク範囲に対応するマクロブロック(MB)をモザイク処理の対象とするマクロブロックに決定する。
例えば、モザイク範囲はマクロブロック以外の単位で指定されている場合、モザイク範囲設定部112は、モザイク範囲を含むマクロブロックをモザイク処理の対象とするマクロブロックに決定する。一方、マクロブロック単位でモザイク範囲が指定されている場合、モザイク範囲設定部112は、モザイク範囲に指定されたマクロブロックをそのままモザイク処理の対象とするマクロブロックに決定する。
(S103)モザイク粒度設定部116は、指定されたモザイク粒度の情報を端末装置から取得する。モザイク粒度は、画質の劣化度合いを示す指標である。例えば、モザイク粒度が「大」の場合には直流成分を残してマクロブロックの高周波成分が除去され、モザイク範囲内の被写体像がほとんど認識できない程度に画質が劣化される。
なお、モザイク粒度と、画質の劣化度合いを決定するカット対象の周波数範囲との関係は、記憶部115に予め格納された粒度設定用テーブル115aに基づいて決定される。モザイク粒度設定部116は、粒度設定用テーブル115aを参照して、指定されたモザイク粒度に対応するカット対象の周波数範囲を決定する。
(S104)動画フレーム単位で処理のループが開始される。処理対象の動画フレームを変更しながら、S105からS113(図15)までの処理が実行される。そして、処理対象とした全ての動画フレームについて処理が終了した場合に、S113(図15)以降に処理が進む。以下、ある処理対象の動画フレームに関する処理について述べる。
(S105)制御部CTLは、処理対象の動画フレームに含まれる1つのマクロブロックを選択する。なお、ここでは一例として1つ1つのマクロブロックを順次処理する方法を想定して説明を進めるが、独立した処理については複数のマクロブロックを同時並行で処理する方法なども考えられる。
(S106)制御部CTLは、S105で選択したマクロブロックがモザイク範囲内のマクロブロックであるか否かを判定する。S105で選択したマクロブロックがモザイク範囲内のマクロブロックである場合、処理はS107に進む。この場合、マクロブロックを符号化する処理の中でモザイク処理が実行される。
一方、S105で選択したマクロブロックがモザイク範囲内のマクロブロックでない場合、処理はS110に進む。この場合は、マクロブロックを符号化する処理の中でモザイク処理は実行されない。但し、他のマクロブロックのモザイク化に起因する画質の劣化を抑制する処理が実行される。
(S107)符号化方法設定部113は、S105で選択されたマクロブロックの符号化方法をフレーム内予測符号化に設定する。つまり、符号化方法設定部113は、このマクロブロックを符号化する際にフレーム間予測を行わないように符号化部111の動作を制御する。かかる制御により、このマクロブロックに対するモザイク化が、より確実に実現される。
(S108)符号化単位サイズ設定部114は、S105で選択されたマクロブロックの符号化単位サイズを設定された符号化単位サイズに固定する。マクロブロックの画像内容によってはマクロブロックのサイズを可変にするイントラ予測モードが導出されることがある。しかし、モザイク範囲内のマクロブロック毎に符号化単位サイズが異なると、不均一なモザイクが生じてしまう可能性がある。さらに、マクロブロックの符号化単位サイズによってモザイク効果が異なる場合がある。そのため、符号化単位サイズ設定部114は、マクロブロックの画像内容に依らず、予め設定された符号化単位サイズで符号化されるように符号化部111を制御する。
(S109)モザイク粒度設定部116は、S103で決定したカット対象の周波数範囲を符号化処理の中でカットするように符号化部111を制御する。
かかる制御により、指定されたモザイク粒度に対応する劣化度合いでマクロブロックの画像が劣化され、所望のモザイク効果が得られる。また、モザイク範囲外のマクロブロックに対して行われる通常の符号化処理と同じ符号化処理の中でモザイク処理が実現されるため、モザイク化によりエンコーダ102にかかる処理負担の増大を抑制することができる。S109の処理を終えると、処理は図15のS111に進む。
(S110)非参照ブロック設定部117は、参照フレームに含まれるモザイク範囲内のマクロブロックを参照しないように設定する。モザイク範囲外のマクロブロックについては、マクロブロックの画像内容に応じてフレーム間予測が行われる。その際、参照フレームにモザイク範囲が存在し、そのモザイク範囲内の画質が劣化したマクロブロックを参照すると、復号時にモザイク範囲外のマクロブロックにも画質の劣化が生じてしまう。そこで、非参照ブロック設定部117は、フレーム間予測を行う際にモザイク範囲内のマクロブロックを参照しないように符号化部111を制御する。S110の処理を終えると、処理は図15のS111に進む。
(S111)符号化部111は、マクロブロックの符号化処理を実行する。モザイク範囲内のマクロブロックを処理する場合、符号化部111は、制御部CTLによる制御に応じてマクロブロックの符号化処理を実行する。
一方、モザイク範囲外のマクロブロックを処理する場合、符号化部111は、マクロブロックの画像内容に応じてフレーム間予測又はフレーム内予測に基づく符号化処理を実行する。但し、フレーム間予測を行う場合、符号化部111は、制御部CTLによる制御に応じて、参照フレームのモザイク範囲内にあるマクロブロックを参照せずに符号化処理を実行する。
(S112)エンコーダ102は、符号化対象の動画フレームに含まれる全てのマクロブロックについて処理を終了したか否かを判定する。符号化対象の動画フレームに含まれる全てのマクロブロックについて処理を終了した場合、処理はS113に進む。一方、符号化対象の動画フレームに含まれる全てのマクロブロックについて処理を終了していない場合、処理は図14のS105に進む。この場合、S105の処理で未処理のマクロブロックが選択される。
(S113)S113に処理が進んだ場合、処理対象となる他の動画フレームが選択され、S105以降の処理が再び実行される。但し、処理対象となる動画フレームについて全て処理が終了した場合には、符号化に係る一連の処理が終了する。
以上、符号化処理の流れについて説明した。
(変形例:画像内容に応じたカット対象周波数の調整)
ここで、図16を参照しながら、第2実施形態の一変形例について説明する。図16は、第2実施形態の一変形例に係る周波数範囲の調整方法について説明するためのフロー図である。
この変形例は、高周波成分が少ないマクロブロックを自動判定し、そのマクロブロックについて、より確実に画像内容が隠匿されるようにカット対象の周波数範囲を調整する方法である。この方法は、主にモザイク粒度設定部116の機能により実現される。
(S121)モザイク粒度設定部116は、カット対象の周波数範囲におけるDCT係数の絶対値和を計算する。例えば、モザイク粒度設定部116は、符号化部111が有する直交変換部123が対象のマクロブロックについてDCT変換した後で、直交変換部123から高周波成分に対応するDCT係数を取得して、その絶対値和を計算する。
(S122)モザイク粒度設定部116は、S121で計算した絶対値和が所定値よりも大きいか否かを判定する。この所定値は、高周波成分を大幅にカットしないとモザイク効果が得られない状態を判定するための閾値である。
例えば、複数のサンプル画像を利用して上記絶対値和とモザイク効果との関係を確認して、粒度設定用テーブル115aに基づく高周波成分のカットによりモザイク効果が得られる場合の絶対値和を決定し、その値が所定値に設定される。絶対値和が所定値よりも大きい場合、カット対象の周波数範囲の調整に係る一連の処理は終了する。一方、絶対値和が所定値よりも小さい場合、処理はS123に進む。
(S123)モザイク粒度設定部116は、カット対象の周波数範囲をDC成分を除く全ての周波数範囲に変更する。かかる変更により、DC成分以外の周波数成分が符号化の過程で除去されるため、そのマクロブロックは一様な画像内容となり、モザイク範囲に含まれる画像内容は最大限に隠匿される。S123の処理を終えると、カット対象の周波数範囲の調整に係る一連の処理は終了する。
以上、第2実施形態の一変形例について説明した。なお、粒度設定用テーブル115aに基づいてDC成分以外の周波数範囲がカット対象の周波数範囲に設定される場合には図16の調整処理が実行されないように、さらに変形することも可能である。また、高周波成分に対応するDCT係数の絶対値和をDC成分のDCT係数で割った値を利用してS122の判定処理を実行するように変形してもよい。
以上説明したように、第2実施形態によれば、指定されたモザイク範囲のマクロブロックが通常行われる符号化処理の過程でモザイク化される。また、画像内容に応じてフレーム間予測を行うエンコーダを利用してモザイク処理が実現される。そのため、フレーム間予測を用いる高効率な符号化方式で符号化される動画像のモザイク化をより少ない処理負担で実現することが可能になる。
<3.第3実施形態>
次に、第3実施形態について説明する。第2実施形態の説明はモザイク範囲が端末装置103を利用して指定されることを前提としていた。しかし、モザイク範囲の指定は物体認識技術を利用して自動的に行うことも可能である。第3実施形態は、モザイク範囲の指定を自動的に行う方法を提案するものである。
[3−1.モザイク範囲の自動認識方法]
まず、図17を参照しながら、第3実施形態に係るモザイク範囲の自動認識方法について説明する。図17は、第3実施形態に係るモザイク範囲の自動認識方法の一例を示した図である。
図17の例は、撮像装置101が物体認識技術を利用して被写体の一部領域を所定の対象物として検出し、その検出結果を利用してモザイク範囲を決定する方法を示している。例えば、撮像装置101は、撮像範囲(A)の中から、所定の対象物(例えば、ナンバープレートや顔など)を含む範囲(以下、検出範囲)を検出する。そして、撮像装置101は、撮像範囲(A)の中で検出範囲を特定する情報を算出する。
例えば、対象物を含む矩形範囲を検出範囲として検出する場合、撮像装置101は、撮像範囲(A)の一頂点を原点とする検出範囲の頂点座標P1及びP2を算出する。なお、対象物の種類は端末装置103により指定される。
この例において、撮像装置101により算出された検出範囲の頂点座標P1及びP2は、動画像データと共にエンコーダ102に入力される。エンコーダ102は、(B)又は(C)に示すように頂点座標P1及びP2に基づいてモザイク範囲を設定する。検出範囲をモザイク範囲とするか(B)、或いは、検出範囲以外の範囲をモザイク範囲とするか(C)を指定するモザイク化方法の情報は端末装置103により指定される。モザイク範囲が決まると、第2実施形態の方法を適用して動画像のモザイク化が実現される。かかる方法により、対象物を指定するだけで自動的にモザイク処理が実行される。
なお、物体認識は、次の手順で実行される。まず、撮像画像から特徴量が抽出される。次いで、予め用意された特徴量のデータベースを参照し、抽出した特徴量と、対象物の特徴量とが照合される。このデータベースは、対象物毎に用意された多数のサンプル画像に基づいて特徴量を抽出してインデックスを付した情報を登録して作成される。次いで、抽出した特徴量に対応する対象物の特徴量が検出された場合に、その対象物が物体認識の結果として出力される。
第3実施形態には任意の物体認識技術を適用可能であるが、例えば、SIFT(Scale Invariant Feature Transform)法など様々な技術が適用できる。
以上、モザイク範囲の自動認識方法について説明した。
[3−2.符号化処理の流れ]
次に、図18を参照しながら、第3実施形態に係る符号化処理の流れについて説明する。図18は、第3実施形態に係る符号化処理の流れについて説明するための図である。
(S201)端末装置103から撮像装置101に対して物体認識の対象物が指定される。なお、対象物の種類が予め撮像装置101に設定されていてもよい。この場合、端末装置103から撮像装置101への対象物の指定は省略される。
(S202)端末装置103からエンコーダ102に対してモザイク化方法が指定される。例えば、撮像装置101により検出された検出範囲をモザイク範囲に設定するか、或いは、検出範囲以外の範囲をモザイク範囲に設定するかを指定するモザイク化方法がエンコーダ102に入力される。なお、複数の対象物が指定される場合などでは、対象物毎に検出範囲のモザイク化方法が指定されてもよい。
(S203、S204)撮像装置101は、指定された対象物に対する物体認識を実行する。そして、撮像装置101は、撮像範囲における検出範囲を特定する情報(位置情報)をエンコーダ102に入力する。例えば、撮像装置101は、撮像範囲の一頂点を原点とする検出範囲の頂点座標をエンコーダ102に入力する。
(S205、S206)エンコーダ102は、指定されたモザイク化方法に従って検出範囲又は検出範囲以外の範囲をモザイク化する。エンコーダ102が実行するモザイク処理は、上記の第2実施形態に係るモザイク処理と同じである。そして、エンコーダ102は、モザイク化した動画像を出力する。S206の処理を終えると、一連の符号化処理は終了する。
以上、符号化処理の流れについて説明した。
以上説明したように、第3実施形態によれば、モザイク範囲が自動認識されるため、モザイク範囲を指定する操作負担が低減される。さらに、各種のトラッキング技術と組み合わせることにより、指定した対象物が移動しても、その対象物を含む範囲を自動追跡してモザイク化することが可能になる。
なお、上記の例では撮像装置101が物体認識を行う方法を示したが、撮像装置101から入力された動画像データを利用してエンコーダ102が物体認識の処理を実行するように変形してもよいし、他の装置が物体認識の処理を実行するように変形してもよい。
以上、添付図面を参照しながら実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、様々な変形例や修正例に想到し得ることは明らかであり、こうした変形例や修正例についても当然に本発明の技術的範囲に属することは言うまでもない。
10 情報処理装置
11 符号化部
12 制御部
R 範囲
FL1、FL2、FL3 動画フレーム

Claims (8)

  1. 動画像に含まれる複数の動画フレームを複数の画像領域に分け、前記画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により当該画像領域を符号化する符号化部と、
    前記動画フレーム内の指定された範囲に含まれる前記画像領域については当該画像領域の内容に依らず前記第2の符号化方法により符号化し、前記第2の符号化方法により符号化された、前記指定された範囲に含まれる前記画像領域から、設定した閾値よりも高い周波数成分を除去するように前記符号化部を制御する制御部と、
    を有する
    情報処理装置。
  2. 撮像画像の中で所定種類の被写体を含む範囲を認識可能な撮像装置から、前記被写体を含む範囲の位置情報を取得し、当該位置情報に基づいて前記被写体を含む範囲又は当該範囲を除外した範囲を前記動画フレーム内の指定された範囲に指定する指定部をさらに有する
    請求項1に記載の情報処理装置。
  3. モザイクの粒度と前記閾値とを対応付ける情報を記憶する記憶部と、
    前記記憶部に記憶された情報を参照し、指定された前記モザイクの粒度に応じて前記閾値を設定する設定部と、
    をさらに有する
    請求項1又は2に記載の情報処理装置。
  4. 前記制御部は、前記符号化部が前記動画フレームを前記複数の画像領域に分ける際、前記指定された範囲に含まれる前記画像領域については所定の符号化単位サイズに固定する
    請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 前記制御部は、前記符号化部が前記フレーム間予測符号化を行う際に、前記指定された範囲に含まれる前記画像領域を参照させない
    請求項1〜4のいずれか1項に記載の情報処理装置。
  6. 前記制御部は、前記指定された範囲に含まれる1つの前記画像領域について高周波成分の絶対値の総和が所定値よりも小さい場合には当該画像領域について直流成分以外の周波数成分を除去させる
    請求項1〜5のいずれか1項に記載の情報処理装置。
  7. 動画像に含まれる複数の動画フレームを複数の画像領域に分け、前記画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により当該画像領域を符号化する際に、
    前記動画フレーム内の指定された範囲に含まれる前記画像領域については当該画像領域の内容に依らず前記第2の符号化方法により符号化し、前記第2の符号化方法により符号化された、前記指定された範囲に含まれる前記画像領域から、設定した閾値よりも高い周波数成分を除去する
    処理をコンピュータに実行させるプログラム。
  8. コンピュータが、
    動画像に含まれる複数の動画フレームを複数の画像領域に分け、前記画像領域の内容に応じて、フレーム間予測符号化を含む第1の符号化方法又はフレーム間予測符号化を含まない第2の符号化方法により当該画像領域を符号化する際に、
    前記動画フレーム内の指定された範囲に含まれる前記画像領域については当該画像領域の内容に依らず前記第2の符号化方法により符号化し、前記第2の符号化方法により符号化された、前記指定された範囲に含まれる前記画像領域から、設定した閾値よりも高い周波数成分を除去す
    画像処理方法。
JP2013102860A 2013-05-15 2013-05-15 情報処理装置、プログラム、及び画像処理方法 Expired - Fee Related JP6179183B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013102860A JP6179183B2 (ja) 2013-05-15 2013-05-15 情報処理装置、プログラム、及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013102860A JP6179183B2 (ja) 2013-05-15 2013-05-15 情報処理装置、プログラム、及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2014225726A JP2014225726A (ja) 2014-12-04
JP6179183B2 true JP6179183B2 (ja) 2017-08-16

Family

ID=52124107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013102860A Expired - Fee Related JP6179183B2 (ja) 2013-05-15 2013-05-15 情報処理装置、プログラム、及び画像処理方法

Country Status (1)

Country Link
JP (1) JP6179183B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6659495B2 (ja) * 2016-08-19 2020-03-04 株式会社東芝 撮像装置および送信方法
EP3340623B1 (en) 2016-12-20 2023-04-12 Axis AB Method of encoding an image including a privacy mask
EP3340624B1 (en) * 2016-12-20 2019-07-03 Axis AB Encoding a privacy masked image
CN111368593B (zh) * 2018-12-25 2023-11-28 北京右划网络科技有限公司 一种马赛克处理方法、装置、电子设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2947581B2 (ja) * 1990-01-30 1999-09-13 日本電気ホームエレクトロニクス株式会社 Dct圧縮動画データの記録・再生方式
JP4199712B2 (ja) * 2004-08-18 2008-12-17 日本電信電話株式会社 復号映像の量子化誤差低減方法及びその装置と、その量子化誤差低減方法の実現に用いられる復号映像の量子化誤差低減プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007158706A (ja) * 2005-12-05 2007-06-21 Fujifilm Corp 動画生成装置、動画生成方法、及びプログラム
JP4793856B2 (ja) * 2005-12-22 2011-10-12 Kddi株式会社 画像スクランブル装置および画像デスクランブル装置
JP2007281766A (ja) * 2006-04-05 2007-10-25 Alpine Electronics Inc 画像送信装置及びその送信方法
JP5316869B2 (ja) * 2009-03-27 2013-10-16 カシオ計算機株式会社 画像処理装置、画像処理方法、及びプログラム
JP6034010B2 (ja) * 2011-10-24 2016-11-30 ソニー株式会社 符号化装置、符号化方法、およびプログラム

Also Published As

Publication number Publication date
JP2014225726A (ja) 2014-12-04

Similar Documents

Publication Publication Date Title
CN103716625B (zh) 图像处理设备和方法
TWI723849B (zh) 圖像解碼裝置、方法及電腦可讀取記錄媒體
TWI475891B (zh) Image processing apparatus and method, program and recording medium
US20120287998A1 (en) Image processing apparatus and method
CN101990098A (zh) 图像处理设备和方法
CN101682784A (zh) 用于帧内预测的自适应参考图片数据生成
CN104038762A (zh) 视频编码器、检测场景改变和控制视频编码器的方法
CN104380732A (zh) 图像处理装置及方法
CN102714718A (zh) 图像处理装置、方法和程序
JP2011223337A (ja) 画像処理装置および方法
WO2011155377A1 (ja) 画像処理装置および方法
WO2011152315A1 (ja) 画像処理装置および方法
CN103155564A (zh) 图像处理装置和方法
CN113330743A (zh) 编码器、解码器及去块效应滤波器自适应的对应方法
US20130216150A1 (en) Image processing device, image processing method, and program
JP6179183B2 (ja) 情報処理装置、プログラム、及び画像処理方法
WO2010035735A1 (ja) 画像処理装置および方法
WO2012008388A1 (ja) 符号化装置および符号化方法、並びに、復号装置および復号方法
CN102934439A (zh) 图像处理设备和方法
WO2012005195A1 (ja) 画像処理装置および方法
KR20140030535A (ko) 영상 부호화 장치, 영상 부호화 방법, 영상 복호화 장치 및 영상 복호화 방법
JP2007134755A (ja) 動画像符号化装置及び画像記録再生装置
WO2012077575A1 (ja) 符号化装置および符号化方法、並びに復号装置および復号方法
JP4655791B2 (ja) 符号化装置、符号化方法およびそのプログラム
WO2024216412A1 (zh) 一种编码方法、编码器以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170703

R150 Certificate of patent or registration of utility model

Ref document number: 6179183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees