JP2010193441A - 動画像処理装置、動画像処理方法および撮像装置 - Google Patents

動画像処理装置、動画像処理方法および撮像装置 Download PDF

Info

Publication number
JP2010193441A
JP2010193441A JP2010013382A JP2010013382A JP2010193441A JP 2010193441 A JP2010193441 A JP 2010193441A JP 2010013382 A JP2010013382 A JP 2010013382A JP 2010013382 A JP2010013382 A JP 2010013382A JP 2010193441 A JP2010193441 A JP 2010193441A
Authority
JP
Japan
Prior art keywords
specific target
area
compression
face
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010013382A
Other languages
English (en)
Other versions
JP5285632B2 (ja
Inventor
Shozo Fujii
省造 藤井
Hidemi Oka
秀美 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2010013382A priority Critical patent/JP5285632B2/ja
Publication of JP2010193441A publication Critical patent/JP2010193441A/ja
Application granted granted Critical
Publication of JP5285632B2 publication Critical patent/JP5285632B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】改善された動画像圧縮技術を提供する。
【解決手段】動画像処理装置200は、顔検出部3(特定対象検出部)、圧縮率制御部4および量子化部9(動画像圧縮部)を含む。顔検出部3は、入力画像に含まれている人物の顔を検出して顔領域を抽出する。圧縮率制御部4は、入力画像全体に対する顔領域の面積比が相対的に大きい場合には顔領域における圧縮率の下げ幅が小さくなり、入力画像全体に対する顔領域の面積比が相対的に小さい場合には顔領域における圧縮率の下げ幅が大きくなるように、顔検出部3で抽出された顔領域における圧縮率を下げるための圧縮制御指示を生成および出力する。量子化部9は、圧縮率制御部4から与えられた圧縮制御指示に従って顔領域の量子化処理を行う。
【選択図】図1

Description

本発明は、動画像を圧縮する動画像処理装置に関するものである。
近年、動画像圧縮方式として、MPEG2(ITU−T H.262)やMPEG−4AVC/H.264規格など、高効率の動画像圧縮方式の発達が著しい。ビデオカメラの分野やレコーダの分野においてもこれらの動画像圧縮技術が用いられている。これらの分野ではビットレートの増加を抑えながら画質を改善するために、入力画像の中で視聴者の注目領域となる部分の圧縮率を低く抑えて画質を改善し、その他の部分の圧縮率を高く設定してビットレートを抑える方法が開発されている。特に、人物の顔部分を注目領域として保護して圧縮する方法が従来から盛んに検討され、提案されてきた。これらの技術は、色情報の特徴や輝度平均などから人物の顔を検出するものである。しかし、特徴が同じであれば顔以外の領域も注目領域と誤認して保護してしまうという課題があった。
一方、新しい技術として、人物の顔をオブジェクトとして捉え、目、鼻、口などの構成物とそれらの相互の位置関係とから人物の顔を検出する顔オブジェクト検出技術が開発され、ビデオカメラやスチルカメラの分野で光学系のオートフォーカスや露出制御などに利用されるようになってきた。顔オブジェクト検出では顔を正しく検出する確度が高く、また、特定人物との照合を行う顔認証技術への展開も進むと期待されている。そこで、これらの顔オブジェクト検出技術を動画像圧縮技術に組み合わせて、人物の顔部分を高い確率で高画質に圧縮する動画像処理装置が提案され始めている。代表的な例として、特開2005−109606号公報が挙げられる。その基本的な構成を従来例として以下に説明する。
図13は、従来の動画像処理装置の構成を示すものである。以下、従来の動画像処理装置において、入力画像データに人物の顔が含まれる場合の動作について説明する。従来の動画像処理装置は、動画像圧縮部100、画像メモリ101および顔オブジェクト検出部102を備えている。
圧縮するべき入力画像データは、動画像圧縮部100および画像メモリ101に与えられる。顔オブジェクト検出部102は、画像メモリ101から入力画像データを取得し、顔オブジェクト検出処理を開始する。具体的には、入力画像データに含まれる顔部分をオブジェクトとして捉え、目、鼻、口などの顔の特徴的構成物とそれらの相互の位置関係とから人物の顔を検出する。さらに、背景部分を取り除き、顔領域を抽出および特定して、顔検出情報を出力する。図14は、従来の顔検出情報を示す図であり、入力画像データの中で顔部分が適切に検出されていることを示している。
1フレーム分のデータの処理がDCT(Discrete Cosine Transform)部108で開始される時点で、量子化部103は、顔オブジェクト検出部102から顔検出情報を受け取る。DCTに続く量子化処理で顔検出情報を用い、顔部分の圧縮率を他の部分より下げる。なお、特開2005−109606号公報には、その具体的な方法ないし詳細な技術が提案されていない。
一般的に、量子化部103が実行する量子化処理はマクロブロック単位で進行する。いま、1つのマクロブロックの量子化を開始しようとするとき、量子化部103は、そのマクロブロックの16画素×16画素の矩形範囲内に顔検出情報が示す領域を含むかどうかを判断する。含む場合は、そのマクロブロックを顔保護マクロブロックとして識別する。含まない場合は、そのマクロブロックをその他のマクロブロックとして識別する。量子化しようとするマクロブロックが顔保護マクロブロックであったとき、量子化部103は、基準量子化指標Q0から予め設定された量子化指標変動幅を減じる。例えば、量子化指標変動幅が「3」であればQ0−3を量子化指標Qとして採用する。他方、量子化しようとするマクロブロックが顔保護マクロブロックでなかったとき、基準量子化指標Q0に量子化指標変動幅を加えたQ0+3を量子化指標Qとして採用する。
図15は、従来の顔保護領域を示す図である。1フレーム分のデータの圧縮処理が完了した時点で、顔検出情報が示す領域は顔保護マクロブロックで埋め尽くされるので、結果的に図15に示すような顔保護領域が形成されることになる。そして、顔保護領域の内部では外部よりも「6」だけ小さな量子化指標Q(=Q0−3)が使用されているから、圧縮率が低く、圧縮歪みが低減して、注目領域である人物の顔画像を高画質に圧縮できる。
次に、フレーム単位の処理の相互関係を説明する。
図16は、従来のフレーム単位の処理のタイミングチャートを示すものである。図16に示すように、画像メモリ101への第1フレームの入力画像データの蓄積が完了した矢印Aのタイミングで、顔オブジェクト検出部102による顔オブジェクト検出処理が開始される。第1フレームの入力画像データを対象とした顔オブジェクト検出処理は、第2フレームの入力画像データを画像メモリ101に蓄積するのに必要な時間よりも長い処理時間を要し、第3フレームの入力画像データが画像メモリ101に蓄積されている途中で終了している。量子化部103は、第4フレームの入力画像データの圧縮処理開始時点である図中矢印Bのタイミングで第1フレームについての顔検出情報を受け取り、DCT部108で準備された周波数領域データの量子化に使用する。即ち、顔オブジェクト検出処理の処理時間が長く、フレーム毎に顔オブジェクト検出処理を実行できず間欠的動作であったとしても、図16に示す通り、顔検出情報を用いた圧縮処理が実現可能となっている。
最後に、顔保護領域の面積が大きい場合のビットレート制御について説明する。顔保護領域の面積が大きい場合、基準量子化指標Q0よりも小さい量子化指標Q0−3を用いて量子化する面積が広く、量子化指標Q0+3を用いて量子化する面積が狭い。その結果、圧縮データのデータ量が増加してビットレートが高くなり、バッファメモリ111に一時記憶されるデータ量も増加することになる。ビットレート制御部115は圧縮データのビットレートが高くなりすぎた場合、あるいはバッファメモリ111が一時記憶するデータ量が増加しすぎた場合、基準量子化指標Q0を再計算して適切な値に更新する。具体的には、基準量子化指標Q0をより大きな値に変更する。これにより、顔保護領域の圧縮率がその他の領域の圧縮率よりも低いという特徴を保持したまま全体の圧縮率を適度に高くでき、ひいては適切なビットレートを達成することができる。再生機に内蔵されたデコーダのバッファを破綻させることのない適切なストリームを作成するために基準量子化指標Q0で圧縮率を調整する技術は、標準化された技術としてMPEG2およびH.264/AVCでも採用されている。
特開2005−109606号公報
従来の方法によると、顔保護領域の面積が大きい場合、上述したように、ビットレート制御部115は、平均的ビットレートをほぼ一定に保つため基準量子化指標Q0を上げる。しかし、基準量子化指標Q0自体を上げると、顔検出情報を用いて量子化指標をQ0からQ0−3に補正した意義が失われる。即ち、画面の大半を占める顔保護領域の圧縮率はほとんど下がらず、面積の少ない顔以外の領域の圧縮率が大きく上がることとなる。その結果、顔保護領域の画質はほとんど改善されないにもかかわらず、その他の領域の画質が大きく悪化する。本発明は、こうした問題を解決しうる改善された動画像圧縮技術を提供することを目的とする。
すなわち、本発明は、
入力画像の中で、特定対象が含まれている領域を特定対象領域として検出する特定対象検出部と、
前記入力画像をその位置に応じて異なる圧縮率で圧縮可能な動画像圧縮部と、
前記入力画像全体に対する前記特定対象領域の面積比が相対的に大きい場合には前記特定対象領域における圧縮率の下げ幅が小さくなり、前記入力画像全体に対する前記特定対象領域の面積比が相対的に小さい場合には前記特定対象領域における前記圧縮率の下げ幅が大きくなるように、前記特定対象検出部で検出された前記特定対象領域における前記圧縮率を下げるための圧縮制御指示を前記動画像圧縮部に対して出力する圧縮率制御部と、
を備えた、動画像処理装置を提供する。
別の側面において、本発明は、
入力画像の中で、特定対象が含まれている領域を特定対象領域として検出する特定対象検出工程と、
前記入力画像全体に対する前記特定対象領域の面積比が相対的に大きい場合には前記特定対象領域における圧縮率の下げ幅が小さくなり、前記入力画像全体に対する前記特定対象領域の面積比が相対的に小さい場合には前記特定対象領域における前記圧縮率の下げ幅が大きくなるように、前記特定対象検出工程で検出された前記特定対象領域における前記圧縮率を下げるための圧縮制御指示を生成および出力する圧縮率制御工程と、
前記圧縮率制御工程で生成された前記圧縮制御指示に従って前記特定対象領域の圧縮処理を行う動画像圧縮工程と、
を含む、動画像処理方法を提供する。
さらに別の側面において、本発明は、
被写体を撮像する撮像部と、
前記撮像部の出力を処理することによって、処理された画像データを生成する画像生成部と、
前記画像生成部で生成された前記画像データを入力画像データとして取得し、取得した入力画像データから圧縮データを生成する、上記本発明の動画像処理装置と、
を備えた、撮像装置を提供する。
本発明者らは、どのようにすれば特定対象(典型的には、人物の顔)の画質を改善できるのか鋭意検討を進めた。その結果、顔が画面に大きく映っている場合と、顔が画面に小さく映っている場合とで、一律に圧縮率を下げることが妥当でない点に気が付いた。顔が画面に大きく映っている場合においても、目、鼻、口などの特徴的構成物の近傍は、高い空間周波数を有していると思われる。しかし、顔の大半を占めるそれ以外の部分(例えば、額、頬、顎など)は、相対的に低い空間周波数を有する。従って、このような場合には、圧縮率をあまり下げなくても顔を十分鮮明に再生しうる圧縮データを作成できる。他方、顔が画面に小さく映っている場合には、圧縮率を十分に下げないと、再生したときに顔が鮮明に映らない。
本発明では、入力画像全体に対する特定対象領域(典型的には、顔領域)の面積比が相対的に大きい場合には、特定対象領域における圧縮率の下げ幅を小さくする。他方、入力画像全体に対する特定対象領域の面積比が相対的に小さい場合には、特定対象領域における圧縮率の下げ幅を大きくする。このようにすれば、平均的ビットレートをほぼ一定に保つため基準量子化指標Q0を上げたとしても、小さく映った顔(特定対象)については圧縮率を十分に下げることが可能である。従って、小さく映った顔を鮮明に映しだすことができる圧縮データを確実に作成できる。他方、大きく映った顔については、基準量子化指標Q0を上げた結果として圧縮率が殆ど下がらなかったとしても、顔を十分に認識できる画質を維持できる。
本発明の一実施の形態における動画像処理装置の構成を示すブロック図 本発明の一実施の形態における保護単位ブロックの構成を示す図 本発明の一実施の形態における顔領域と顔拡大領域と顔保護領域との相互関係を示す図 本発明の一実施の形態における顔保護マップの構成を示す図 本発明の一実施の形態におけるマクロブロックの処理順を示す図 本発明の一実施の形態におけるフレーム単位の処理のタイミングチャート 本発明の一実施の形態における顔領域と入力画像とのずれを示す図 本発明の他の実施の形態における顔保護領域が大きい場合の入力画像と顔保護領域との関係を示す図 本発明の他の実施の形態における顔保護領域が大きい場合の顔保護マップの構成を示す図 本発明のその他の実施の形態における大きさが異なる顔保護領域がある場合の入力画像と顔保護領域との関係を示す図 本発明のその他の実施の形態における顔保護マップの構成を示す図 実施の形態1および2で説明した動画像処理装置を用いたビデオカメラの構成を示すブロック図 従来の動画像処理装置の構成を示す図 従来例の顔検出情報を示す図 従来例の顔保護領域を示す図 従来例のフレーム単位の処理のタイミングチャート 顔保護領域と入力画像とのずれを示す図
以下、本発明を実施するための形態について、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1における動画像処理装置の構成を示すブロック図である。なお、図1は動画像処理装置の典型的な構成を表しているに過ぎず、全ての要素が不可欠というわけではない。
図1に示すように、動画像処理装置200は、動画像圧縮部1、画像メモリ2、顔検出部3および圧縮率制御部4を備えている。入力画像データは動画像圧縮部1と画像メモリ2にそれぞれ供給され、画像メモリ2の出力は顔検出部3に供給される。顔検出部3は、入力画像データ中の顔を特定対象として検出し(抽出し)、顔検出情報を出力する。圧縮率制御部4は、顔検出部3からの顔検出情報を基に、顔保護指示を生成し、出力する。「顔保護指示」とは、顔検出部3で抽出された顔領域における圧縮率を下げるための圧縮制御指示を意味する。
動画像圧縮部1は、参照メモリ5、動き補償部6、減算器7、DCT部8、量子化部9、符号化部10、バッファメモリ11、逆量子化部12、逆DCT部13、加算器14およびビットレート制御部15を備えている。入力画像データは、減算器7、DCT部8、量子化部9および符号化部10を経て圧縮され、バッファメモリ11に蓄積される。ビットレート制御部15は、バッファメモリ11を管理するとともに、最適な基準量子化指標Q0を作成し、作成した基準量子化指標Q0を量子化部9に供給する。量子化部9の出力は、逆量子化部12、逆DCT部13および加算器14を経て復号化される。復号化された画像データは、参照画像データとして参照メモリ5に記憶される。動き補償部6は、復号化された画像データを参照メモリ5から取得するとともに、復号化された画像データと入力画像データとを用いて予測画像データを作成し、それを減算器7に出力する。
以下、本発明の実施の形態1の動画像処理装置200の動作について詳細に説明する。まず、基本動作として、入力画像データに人物の顔が含まれない場合について説明する。
入力画像データは画像メモリ2に蓄積され、1フレーム分蓄積されてから、顔検出部3が顔オブジェクト検出処理を実行し、その結果の顔検出情報を圧縮率制御部4に供給する。いま、入力画像データに人物の顔が含まれていないため、空の顔検出情報が圧縮率制御部4に供給される。圧縮率制御部4は、空の顔検出情報を取得したら、保護すべき顔が存在しない旨の顔保護指示を出力する。
動画像圧縮部1は、入力画像データの動画像圧縮を実行する。MPEG2規格に従い、また、フレーム構造で圧縮を行うものとする。動き補償部6は、参照メモリ5に記憶された参照画像データと入力画像データを用いて動きベクトル探索を行い、参照画像データの中から最適な部分を切り出して予測画像データとして出力する。減算器7は、予測画像データと入力画像データの差分を残差データとして算出する。DCT部8は、残差データを直交変換の一種である離散コサイン変換して周波数領域データ(DCT係数)を生成および出力する。量子化部9は、保護すべき顔が存在しない旨の顔保護指示を取得した場合には、ビットレート制御部15から与えられた基準量子化指標Q0をそのまま量子化指標Qとして採用し、基準量子化指標Q0に従って周波数領域データを量子化する。具体的には、量子化指標Qを乗じた量子化行列を用いて周波数領域データを量子化する。量子化されたデータは符号化部10で可変長符号化され、バッファメモリ11に一時格納された後に圧縮データとして出力される。
一方、量子化部9の出力は、逆量子化部12および逆DCT部13で逆変換の処理を受け、加算器14で動き補償部6の予測画像データに加算される。これにより、復号化された画像データが得られ、次のフレーム以降の圧縮処理のための参照画像データとして参照メモリ5に記憶される。ビットレート制御部15は、バッファメモリ11の転送動作を制御するとともに、最適な基準量子化指標Q0を決定する。具体的には、圧縮データを適切なビットレートで外部へ出力させながら、バッファメモリ11に圧縮データが溜まり過ぎてオーバーフローしないように、あるいは外部へ出力するべき圧縮データが枯渇しないように、フレーム単位で基準量子化指標Q0を決定する。
量子化部9での量子化指標Qは、量子化のステップ幅を決める指標である。量子化指標Qが大きいほど量子化ステップ幅が大きくなる。即ち、量子化指標Qを大きくすると圧縮率が高くなって、データ量が減少する一方、圧縮歪みが増加する。量子化部9が基準量子化指標Q0をそのまま量子化指標Qに用いている場合、ビットレート制御部15は量子化指標Q0によって圧縮データのビットレートを直接制御することができる。
次に、入力画像データに人物の顔が含まれる場合について説明する。
顔検出部3は、入力画像データに対して顔オブジェクト検出処理を行う。具体的には、入力画像データに含まれる顔画像部分をオブジェクトとして捉え、目、鼻、口などの顔の特徴的構成物とそれらの相互の位置関係とから人物の顔を検出する。さらに、人物の顔を含む領域(顔領域)を矩形領域として特定して、顔領域の中心座標と、顔領域の大きさとで構成された顔検出情報を圧縮率制御部4に出力する。圧縮率制御部4は、1フレーム分の画像を保護単位ブロックに区切って管理する。
図2は、保護単位ブロックの構成を示す図である。図2に示す例では、ハイビジョン画像を想定して、横1920画素、縦1080画素を1フレーム分の画像データとして取り扱っている。なお、本実施の形態1では、入力画像データとしてハイビジョン画像を用いるとしたが、本発明はこれに限定されず、入力画像データとしてどのような画素数のデータであってもよい。図2に示すように、圧縮率制御部4は、1フレーム分の画像を縦9個、横15個の領域に分割し、総計135個の保護単位ブロックとして管理している。1つの保護単位ブロックは、縦8個、横8個、総計64個のマクロブロックより構成されている。圧縮率制御部4は、1フレーム分の処理を開始する時点で顔検出部3から顔検出情報を受け取り、顔領域を矩形領域として復元し、さらに復元した顔領域を拡大して顔拡大領域を算出する。
図3は、顔領域と顔拡大領域と顔保護領域との相互関係を示すものである。本実施の形態1では、図3に示すように、顔領域を中心座標に対して縦1.5倍、横2倍に拡大して顔拡大領域を算出している。圧縮率制御部4は、顔拡大領域を含む保護単位ブロックを顔保護領域に決定し、決定した顔保護領域を顔保護マップとして内部に保持する。
図4は、本実施の形態1における顔保護マップの構成を示す図である。図4に示すように、顔保護マップは、1つの保護単位ブロックを1ビットの情報で管理するように構成されている、即ち、縦9ビット、横15ビット、総計135ビットの情報で構成されている。具体的には、顔保護領域を「1」で、それ以外の領域を「0」で記憶している。
図5は、マクロブロックの処理順を示すものである。1フレームの圧縮処理が開始されると、図5に示すように、左から1マクロブロックずつ右方向に処理が進む。最上段のマクロブロック1行分の処理が終了すると、2段目のマクロブロックの処理がまた左から右方向に進んでいく。圧縮率制御部4は、各段の左端のマクロブロックの処理開始時点で顔保護マップから対応する1行分15ビットの情報を取り出す。8マクロブロックの処理が進むごとに、顔保護マップから取り出した情報を1ビットシフトさせる。そして、最上位ビットの値によって、該当するマクロブロックが顔保護領域であるかどうかを判断する。つまり、最上位ビットが1であれば顔保護領域であると判断して顔保護指示を出力する。量子化部9は、ビットレート制御部15から供給された基準量子化指標Q0から予め設定された量子化指標変動幅(例えば、数値「3」)を減じた値を量子化指標Qとして採用し、該当するマクロブロックの量子化処理を実行する。上記説明から理解できるように、本実施の形態1において、「量子化指標変動幅」は、顔保護領域以外の領域の圧縮率に対する、顔保護領域の圧縮率の下げ幅を規定する値である。
以上の処理により、図3に示した顔保護領域に属するマクロブロックでは量子化指標Qがその他の領域よりも、例えば「3」小さな値となる。量子化指標Qを小さくすると量子化ステップが小さくなる。これにより、該当するマクロブロックの圧縮率が下がり、顔保護領域の画質改善が実現される。
次に、フレーム単位の処理の相互関係を説明する。
図6は、本実施の形態1のフレーム単位の処理のタイミングチャートを示すものである。図6に示すように、画像メモリ2への第1フレームの入力画像データの蓄積が完了した矢印Aのタイミングで、顔検出部3による顔オブジェクト検出処理が開始される。第1フレームの入力画像データを対象とした顔オブジェクト検出処理は、第2フレームの入力画像データを画像メモリ2に蓄積するのに必要な時間よりも長い処理時間を要し、第3フレームの入力画像データが画像メモリ2に蓄積されている途中で終了している。圧縮率制御部4は、第3フレームの入力画像データの圧縮処理終了後、図中矢印Bのタイミングで第1フレームの顔検出情報を受け取り、符号Cに示す期間で顔保護マップを作成する。圧縮率制御部4は、作成した顔保護マップを保持して、続く第4フレームおよび第5フレームの入力画像データに対する圧縮処理で量子化部9に顔保護指示を供給する。即ち、上述した従来例と同じく顔オブジェクト検出処理の処理時間が長く、フレーム毎に顔オブジェクト検出処理を実行できず間欠的動作であったとしても、顔検出情報を用いた圧縮処理が実現可能である。また、図6の符号Dに示すように、第1フレームで得た顔検出情報を第5フレームの圧縮処理に使用するなど、顔検出情報と実際の顔の位置や大きさがずれている可能性があることも従来例と同じである。
図7は、本実施の形態1の顔検出情報と入力画像とのずれを示す図であり、第1フレームで得た顔検出情報を第5フレームの入力画像データの圧縮処理に適用した状態を想定している。図7中において、顔領域は入力画像の実際の顔の位置とずれている。しかし、本実施の形態1では、顔拡大領域を導入しているので、実際の顔の位置は顔保護領域に収まっている。これにより、確実に顔部分の画質を改善できる。なお、MPEG2規格ではIピクチャー(Intra-Picture)、Pピクチャー(Predictive-Picture)、Bピクチャー(Bi-directional Predictive-Picture)の並べ替えが発生し、圧縮処理順が入力画像順と異なる。ただし、図6では、説明の簡単化のため並べ替え済みの画像が入力されるものとした。
従来の動画像処理装置では、マクロブロック単位に顔領域を含むかどうかの判定処理を行う必要がある。一般に、1つのマクロブロックの処理時間は短く、高速処理が要求される。そのため、マイクロプロセッサなどに軽微な処理を追加する程度では従来の方法を実現できず、専用のハードウェアが必要になるという課題があった。また、図16の符号Cに示したように、第1フレームで得た顔検出情報を第5フレームの圧縮処理に使用するなど圧縮処理する画像データと使用する顔検出情報に時間差がある場合、図17に示すように顔検出情報と実際の顔の位置や大きさがずれている可能性があり、顔の一部で画質が悪化するという課題を有していた。
これに対し、本実施の形態1では、複数のマクロブロックからなる保護単位ブロックを用いて圧縮率を下げるかどうか判断する圧縮率制御部4を設けている。具体的に、動画像圧縮部1(詳細には量子化部9)は、入力画像をマクロブロック単位で量子化することによってマクロブロック毎に異なる圧縮率で入力画像を圧縮可能である。圧縮率制御部4は、入力画像を複数のマクロブロックからなる保護単位ブロックに分割し、顔検出部3で抽出された顔領域を含む保護単位ブロックにおける圧縮率を下げるように動画像圧縮部1の量子化部9に圧縮制御指示を出力する。
上記構成によれば、顔領域を含むかどうかの判断処理回数が大幅に減少する。図13の従来例では1フレームあたり8160回の判断処理が必要であったが、本実施の形態1では135回に減少し1.7%の処理量にまで削減している。顔領域が矩形であれば算術演算と論理和演算のみで顔保護マップを生成することも可能である。さらに、135回の判断処理および顔保護マップの作成処理は、図6の符号Cに示すように、1フレーム分の圧縮処理と次フレームの圧縮処理の間に完了すればよく、高速処理は要求されない。高速性が求められるマクロブロック単位の処理に、単にビット確認と量子化指標Qの調整のみという極めて簡易な処理を追加するだけで足りる。そのため、本実施の形態1を実施するのに高速処理のための専用ハードウェアの追加は必須でない。動画像圧縮部1の各処理ブロックを構成するディジタルシグナルプロセッサあるいはマイクロプロセッサの処理の一部に、上述した各処理を組み込むことで、本実施の形態1を極めて容易、安価に実現できる。
また、圧縮率制御部4は、顔領域を拡大した顔拡大領域を抽出し、顔拡大領域を含む保護単位ブロックにおける圧縮率を下げるように量子化部9に圧縮制御指示を出力する。即ち、顔拡大領域を求めて顔保護領域を決定する構成としたので、圧縮率を下げるべき顔保護範囲を拡大して、髪、顔輪郭、首など顔近傍部分まで画質改善することができる。また、図7に示したように、圧縮処理中の画像の顔部分の位置や大きさが顔検出情報とずれていても、ほとんどの場合に顔保護領域の範囲に顔部分を収めて画質改善することができる。
なお、本実施の形態1の説明では入力画像に人物の顔が1つ含まれる場合について説明したが、複数の顔が含まれる場合にも同じ処理で同じ効果が得られることは言うまでもない。
また、本実施の形態1では、顔保護領域とするかどうかの判断処理を図6の符号Cに示す期間で実行および完了し、その結果を顔保護マップとして保持する方法を説明したが、その他どのような処理タイミング、保持手法を用いてもよい。本実施の形態1によれば、1つの保護単位ブロックに対して1回顔保護領域とするかどうか判断するだけなので、その保護単位ブロックに含まれる個々のマクロブロックで個別に判断処理する必要がなく、判断結果の総数が極めて少ない。そのため、図6のタイミングチャートや顔保護マップ以外の方法を用いても同様に簡易な構成で本実施の形態1を実現することができる。
本実施の形態1では保護単位ブロックを64個のマクロブロックから構成されるとしたが、他の大きさで構成してもよい。例えば、1つの保護単位ブロックを縦4マクロブロック、横4マクロブロックの16マクロブロックで構成しうる。この場合、1フレームを縦17個、横30個の総計510個の保護単位ブロックで構成することとなる。そのため、保護単位ブロックを顔保護領域とするかどうかの判断処理を上述した従来例に対して約6.3%の軽微な処理量で実現できる。
本実施の形態1では、圧縮率制御部4が図3に示すように顔領域を中心座標に対して縦1.5倍、横2倍に拡大して顔拡大領域を求めるとしたが、その他の拡大方法を採用してもよい。倍率による拡大ではなく、縦の長さ、横の長さに拡張分を加算する方式とすることもできる。入力画面の中で顔部分が移動するとき、その移動速度がある程度以下であれば圧縮率を下げて画質改善する効果が大きい。しかし、移動速度がある程度以上速ければ撮影時のブレが生じて顔部分の画像の情報量が大きく減少することから、圧縮率を下げて画質改善を図る必要性が乏しくなる。改善効果が見込める上限速度は、動画像圧縮部1の圧縮効率とビットレートに依存する。図6に示したように、本実施の形態1の場合では、顔保護領域の決定に使用したフレームと圧縮処理されるフレームとの間に最大4フレームの時間差がある。そのため、画質改善する必要がある顔の移動速度で4フレーム分の移動量を補う程度に顔拡大領域の倍率または加算量を設定したとき、最も効率よい画質改善効果が得られる。
なお、本実施の形態1では、圧縮率制御部4が顔保護領域のマクロブロックの圧縮率を下げるとしたが、顔保護領域以外のマクロブロックの圧縮率を上げる処理もあわせて実装する構成としてもよい。また、動画像圧縮部1は入力画像データをフレーム構造で圧縮するとしたが、フィールド構造で圧縮する構成としてもよい。この場合、圧縮率制御部4は、フィールド構造の顔保護マップを保持することとなる。動画像圧縮部1はMPEG2規格に従う動画像圧縮処理を実行するように構成されているが、MPEG−4 AVC/H.264規格やその他の動画像圧縮方式に従うものとしてもよい。
続いて、入力画像全体に対する顔保護領域の面積比に応じて、圧縮率を調整する方法について説明する。具体的には、顔保護領域の面積比が相対的に大きい場合には、顔保護領域における圧縮率の下げ幅を小さくする。顔保護領域の面積比が相対的に小さい場合には、顔保護領域における圧縮率の下げ幅を大きくする。つまり、以下に説明する技術は、小さく映った顔の圧縮率を優先的に下げて、小さく映った顔を鮮明に再生できるようにすることを趣旨としている。大きく映った顔の圧縮率も下げるものの、その下げ幅をある程度制限する。
なお、「圧縮率の下げ幅」とは、顔保護指示(圧縮制御指示)が作成および出力されなかったと仮定した場合における、その顔保護領域の圧縮率(基準圧縮率)からの下げ幅を意味する。より詳細には、ビットレート制御部15から量子化部9に供給された基準量子化指標Q0と、その顔保護領域の圧縮処理に実際に用いられる量子化指標Qとの差分によって、圧縮率の下げ幅が特定される。また、「圧縮率の下げ幅」が、顔保護領域以外の領域の圧縮率に対する下げ幅を意味することもある。
図8は、顔保護領域が大きい場合の顔保護領域の例を示すものであり、図9は、その場合の顔保護マップの構成を示すものである。図8では、入力画像に2人の人物の顔が大きく映っている例を示している。顔Aの保護領域と顔Bの保護領域とから、顔保護マップは、図9のような形態となっている。
圧縮率制御部4は、顔保護マップ作成後、直ちに顔保護領域の総面積を算出する。具体的には、保護単位ブロックの数で顔保護領域の総面積を求めるものとする。圧縮率制御部4には、表1に示すように、顔保護領域の総面積と保護比率との対応関係を記述した定義表が予め格納されている。表1の定義表を参照することにより、顔保護領域の総面積から保護比率を定める。保護比率を所定の量子化指標最大変動幅に乗じて量子化指標変動幅を決定する。ここで、「保護比率」とは、その顔保護領域の圧縮率の下げ幅を調整するために用いられるパラメータである。保護比率が大きければ大きいほど、その顔保護領域の圧縮率が下がる。「量子化指標最大変動幅」とは、圧縮率の最大の下げ幅を規定する値を意味する。
図8および図9の例の場合、顔保護領域の総面積は保護単位ブロック90個であるから表1より保護比率が0.4と定まる。例えば、量子化指標最大変動幅が予め「6」と定義されていれば、6に0.4を乗じて得た値(6×0.4=2.4)を四捨五入して量子化指標の下げ幅を「2」と決定する。
Figure 2010193441
マクロブロックの処理が開始されると、圧縮率制御部4は、顔保護マップから処理するべきマクロブロックが顔保護領域にあるかどうかを判断する。顔保護領域にあるときには、量子化指標を「2」下げることを意味する顔保護指示を量子化部9に与える。量子化部9は、顔保護指示に従ってビットレート制御部15から与えられた基準量子化指標Q0から「2」を減じて量子化指標Qを設定し、設定した量子化指標Qを用いて顔保護領域の量子化処理を実行する。他方、顔保護領域以外の領域の量子化処理には、基準量子化指標Q0をそのまま用いる。このようにすれば、顔保護領域の圧縮率を低くして画質改善を実現できる。表1では、顔保護領域の総面積が大きいほど保護比率を低く設定している。表1は、顔保護領域の総面積が大きい場合には圧縮率の下げ幅が小さくなるように顔保護指示を出力し、顔保護領域の総面積が小さい場合には圧縮率の下げ幅が大きくなるように顔保護指示を出力するという動作を端的に表している。なお、表1によれば、顔保護領域であったとしても、基準量子化指標Q0をそのまま用いることもある(保護比率がゼロの場合)。
入力画像に含まれる顔の総面積が大きい場合、ビットレートを目的の値に制御しあるいはバッファメモリ11の破綻を防止しながら、顔保護領域の画質を一方的に改善し続けることは技術的に不可能である。仮に、量子化指標変動幅を大きく設定しても、既に従来技術の課題として上述したように、顔保護領域の画質はほとんど改善されず、逆にその他の領域の大幅な画質悪化が目立つという逆効果を生じる。
これに対し、本実施の形態1によれば、顔保護領域の総面積が小さい場合には保護比率を高くして量子化指標を大きく下げる。これにより、従来技術と同様に顔部分の画質改善を実現する。他方、顔保護領域の総面積が大きくて逆効果になってしまう場合には、保護比率を小さくして量子化指標の下げ幅を小さくする。これにより、顔保護領域以外の領域の極端な画質劣化を防止できる。即ち、本実施の形態1において、圧縮率制御部4は、入力画像全体に対する顔保護領域(言い換えれば、顔領域)の面積比が小さければ小さいほど、顔保護領域における圧縮率の下げ幅を段階的に大きくする。その結果、顔の総面積に応じて常に最適の画質が得られる。
また、入力画像に複数の顔保護領域が存在する場合においても、入力画像全体の面積に対する複数の顔保護領域の総面積の比率に基づいて、圧縮率制御部4で顔保護指示(圧縮制御指示)が作成される。具体的には、顔保護領域の総面積が相対的に大きい場合には圧縮率の下げ幅が小さくなり、顔保護領域の総面積が相対的に小さい場合には圧縮率の下げ幅が大きくなるように、顔保護指示が作成される。このようにすれば、複数の顔保護領域とそれ以外の領域とを互いに異なる圧縮率で適切に圧縮できる。
なお、表1のような定義表を用いて保護比率を求める代わりに、下記式1のような算術式によって保護比率を求めてもよい。式1では、保護比率がR、顔保護領域の総面積がSで表されている。例えば、S=90のときR=0.33となり、このときの量子化指標変動幅は「2」となる。また、表1および式1によれば、顔保護領域の総面積に対して保護比率が直線的に変化する。ただし、動画像圧縮部1の量子化指標と量子化ステップとの関係に依存して、顔保護領域の総面積と保護比率との関係が、非線形の特性を有していてもよい。
(式1)
R=(135−S)/135
また、保護比率を顔保護領域の総面積から求める代わりに、顔領域の総面積、あるいは顔拡大領域の総面積から求めてもよい。
本実施の形態1において、動画像圧縮部1は、(i)入力画像からマクロブロック単位の周波数領域データ(DCT係数)を生成するDCT部8、(ii)周波数領域データを量子化する量子化部9、および(iii)入力画像から得られた圧縮データの平均的ビットレートが予め定められた範囲内に収まるように、量子化部9で実行するべき量子化処理における量子化ステップを規定するための基準量子化指標Q0を量子化部9に供給するビットレート制御部15を備えている。圧縮率制御部4は、顔保護指示(圧縮制御指示)として、基準量子化指標Q0を補正するための量子化指標変動幅を量子化部9に与える。量子化部9は、顔保護領域における圧縮率を下げるように、圧縮率制御部4から与えられた量子化指標変動幅を基準量子化指標Q0から減ずることによって得た量子化指標Qを量子化処理で使用する。具体的には、量子化指標Qを量子化マトリクスに乗じる。表1を参照して説明したように、圧縮率制御部4は、予め定められた量子化指標最大変動幅に、顔保護領域の面積比に対応して定められた保護比率を乗じることによって、量子化部9に与えるべき量子化指標変動幅を算出する。このような処理を行うことによって、顔保護領域とそれ以外の領域とを互いに異なる圧縮率で適切に圧縮できる。
なお、本実施の形態1では、圧縮率制御部4が、同一画面に含まれる顔保護領域の総面積を求め、その総面積が大きい場合には圧縮率の下げ幅を抑制する形態について説明した。しかし、本発明はこれに限定されず、例えば図13の従来例に本実施の形態を組み合わせることも可能である。例えば、保護単位ブロックを1マクロブロックとして、顔保護領域の総面積が大きい場合に圧縮率の下げ幅を抑制するとしてもよい。そのようにすれば、最適な画質改善を実現することができる。
(実施の形態2)
本発明の実施の形態2における動画像処理装置の構成は、図1に示す本発明の実施の形態1の構成と同一である。また、その動作は、圧縮率制御部4の処理内容のみが異なるものである。
以下、その相違点を中心に動作について説明する。
圧縮率制御部4が図6の符号Cのタイミングで顔検出部3から顔検出情報を受け取り、顔保護領域を特定することは上述した本発明の実施の形態1と同じである。図10は、互いに大きさが異なる複数の顔保護領域がある場合の入力画像と顔保護領域との関係を示している。圧縮率制御部4は、顔Aの顔保護領域と顔Bの顔保護領域とを特定するとともに、それぞれの顔保護領域の面積を個別に算出する。圧縮率制御部4には、表2に示すように、顔保護領域の面積と量子化指標最大変動幅との対応関係を記述した定義表が予め格納されている。つまり、本実施の形態2では、顔保護領域の面積に応じて、量子化指標最大変動幅が変化している。表2の定義表を参照することにより、顔保護領域の面積から顔保護領域毎にそれぞれの量子化指標最大変動幅を定め、顔保護マップに登録する。
Figure 2010193441
図11は、本実施の形態2における顔保護マップの構成を示す図である。顔保護マップは、保護単位ブロックごとに量子化指標最大変動幅を1桁の数値として格納する構成となっている。いま、顔Aの顔保護領域の面積は「42」であるから、表2より、量子化指標最大変動幅を「6」として図11の顔保護マップの顔Aの顔保護領域に登録する。顔Bの顔保護領域の面積は「9」であるから、表2より、量子化指標最大変動幅を「9」として顔保護マップの顔Bの顔保護領域に登録する。複数の顔保護領域が重複する部分では、量子化指標最大変動幅の大きい方を採用する。完成した顔保護マップにおいて、値「0」は顔保護領域以外の領域を示し、「0」以外の数値は量子化指標最大変動幅を示している。
圧縮率制御部4は、一方で実施の形態1と同じく顔保護領域の総面積から保護比率を算出する。図10の例では、顔保護領域の総面積は「48」であるから、表1より、保護比率は「0.6」となる。以上の処理により、図10の入力画像に対して、保護比率「0.6」と、図11に示す保護単位ブロックごとの量子化指標最大変動幅とが準備される。
マクロブロックの処理が開始されると、圧縮率制御部4は、顔保護マップから処理するべきマクロブロックが顔保護領域にあるかどうかを判断する。顔保護領域にあるときには、その保護単位ブロックの量子化指標最大変動幅に保護比率を乗じて四捨五入し、得られた量子化指標変動幅を顔保護指示として量子化部9に与える。図11の例の場合は、顔Aの顔保護領域では量子化指標変動幅として「4」が、顔Bの顔保護領域では量子化指標変動幅として「5」が指示されることになる。量子化部9は、顔保護指示に従って、ビットレート制御部15から与えられた基準量子化指標Q0を補正し、これにより量子化指標Qを設定する。具体的には、与えられた量子化指標変動幅を基準量子化指標Q0から減じることによって量子化指標Qを設定する。そして、設定した量子化指標Qを用いて量子化処理を実行する。図11の例では、顔Aの顔保護領域のマクロブロックを量子化するための量子化指標Qとして、基準量子化指標Q0から「4」を減じた値Q0−4を用いる。顔Bの顔保護領域のマクロブロックを量子化するための量子化指標Qとして、基準量子化指標Q0から「5」を減じた値Q0−5を用いる。
以上のように、顔保護領域の圧縮率を低くして画質改善を実現できる。表2では、面積が小さい顔保護領域ほど量子化指標最大変動幅を大きく設定している。表2は、個々の顔領域の面積に応じてその面積が小さい顔領域の方がより圧縮率の下げ幅が大きくなるように顔保護指示を出力するという動作を端的に表している。
同一画像内に面積の大きな顔部分と小さな顔部分があった場合、視聴者は、図10の顔Aのように大きな顔の方に注目しやすい。しかし、大きな顔部分の画像は頬や額など平坦部分が多くて単位面積当たりの情報量が少ないため、圧縮歪みも出にくい。そのため、大きな顔部分の圧縮率を下げて画質改善する必要性が乏しく、また、圧縮率を大きく下げても元々の圧縮歪みが少ないので画質の改善程度も少ない。他方、小さな顔部分の画像は目、鼻、口などの特徴的構成物が密集しているため高周波数成分が多く、単位面積当たりの情報量が多いから圧縮歪みも発生しやすいという特徴がある。そのため、注目点でなくとも画質劣化が目立ちやすく、圧縮率を大きく下げる必要がある。
また、顔の総面積が同じでも、小さな顔が多数ある場合と大きな顔が1つある場合とでは、小さな顔が多数ある方が圧縮歪みが目立ちやすい。小さな顔が多数ある場合には、より圧縮率を下げた画質改善が望ましい。本実施の形態2では、個々の顔保護領域の面積を調べ、面積が小さい顔保護領域の方がより圧縮率の下げ幅が大きくなるようにしている。即ち、画質改善の必要性が少ない大きな顔保護領域では圧縮率の下げ幅を抑え、画質改善の必要性が高い小さな顔保護領域では圧縮率の下げ幅を大きくする。このようにすれば、ビットレートの無駄を減らして小さな顔から大きな顔まで最適な画質を実現することができる。
顔部分の大小によって、圧縮歪みの発生程度および目立ち方は異なる。上述した従来の動画像処理装置では、複数の顔保護領域を均一に保護するため、個々の顔画像を適切に画質改善することができないという課題があった。
本実施の形態2において、圧縮率制御部4は、入力画像に複数の顔保護領域が存在する場合に、顔保護領域の面積を個別に調査する。そして、相対的に小さい面積を有する顔保護領域における圧縮率の下げ幅が大きくなり、相対的に大きい面積を有する顔保護領域における圧縮率の下げ幅が小さくなるように、複数の顔保護領域に個別に対応した複数の圧縮制御指示を生成する。具体的に、圧縮率制御部4は、入力画像全体の面積に対する複数の顔保護領域の総面積の比率と、個々の顔保護領域の面積とに基づいて、複数の顔保護領域に個別に対応した内容の圧縮制御指示を生成する。その結果、互いに異なる面積を有する複数の顔が映った場合にも、個々の顔画像の画質を適切に改善できる。
また、表2に示すように、入力画像に複数の顔保護領域が存在する場合に、相対的に小さい面積を有する顔保護領域における圧縮率の下げ幅が大きくなり、相対的に大きい面積を有する顔保護領域における圧縮率の下げ幅が小さくなるように、顔保護領域の面積に対応する形で複数の量子化指標最大変動幅が準備されている。この構成によっても、顔の大きさ(面積)に応じて、個々の顔画像の画質を適切に改善できる。
また、入力画像に互いに異なる面積を有する複数の顔保護領域が存在し、かつ大きい面積を有する顔保護領域と小さい面積を有する顔保護領域との重複部分が存在する場合、その重複部分に対する量子化指標最大変動幅として、小さい面積を有する顔保護領域に対する量子化指標最大変動幅を使用する。そのため、大小複数の顔が重なって映った場合でも、顔の大きさ(面積)に応じて、個々の顔画像の画質を適切に改善できる。もちろん、表2に示す量子化指標最大変動幅をそのまま量子化指標の下げ幅として用いてもよい。つまり、複数の顔保護領域が存在したとしても、それらの総面積については考慮しないような実施の形態も適宜採用できる。
なお、本実施の形態2では、圧縮率制御部4が、入力画像に含まれる個々の顔保護領域の面積を調べ、その面積が小さい顔保護領域の方がより圧縮率の下げ幅が大きくなるように顔保護指示を出力する形態について説明したが、本発明はこれに限定されない。例えば、実施の形態1における圧縮率制御部4で入力画像に含まれる個々の顔保護領域の面積を調べ、その面積が小さい顔保護領域の方がより圧縮率の下げ幅が大きくなるように顔保護指示を出力してもよい。また、従来例のように、顔保護領域の面積をマクロブロック単位で調べ、その面積が小さい顔保護領域の方がより圧縮率の下げ幅が大きくなるように量子化処理を行ってもよい。
また、表1に示す定義表および表2に示す定義表を組み合わせることによって、単一の定義表で実施の形態2を実現できるようにしてもよい。実施の形態1で説明したように、量子化指標変動幅を算出するための計算式が準備されていてもよい。
なお、本実施の形態1および2において、特定対象として、人物の顔を検出する場合について説明したが、本発明はこれに限定されない。例えば、動物や、動く物等を特定対象として検出し、その特定対象について本実施形態1および2で説明した圧縮制御を行ってもよい。また、特定対象を検出するための技術として、オブジェクト検出技術に代えて、色情報の特徴や輝度平均などから特定対象を検出する技術を採用してもよい。
(撮像装置の実施の形態)
図12は、ビデオカメラの典型的な構成を示すブロック図である。ビデオカメラ300は、例えば、光学系20、撮像素子25、ADC30(Analog-Digital Converter)、画像処理部40、コントローラ70、バッファ71、マイクロホン50、音声処理部60、システムエンコーダ72、システムデコーダ73、カードスロット81、液晶ディスプレイ82、スピーカ83、操作部84および電源75を備えている。光学系20および撮像素子25は、被写体を撮像する撮像部を構成している。画像処理部40は、画像前処理部41、画像圧縮部42および画像伸張部43を含む。ADC30および画像前処理部41は、撮像部の出力を処理することによって、処理された画像データを生成する画像生成部を構成している。具体的には、ADC30でアナログ信号からデジタル信号に変換された画像データに対して、ガンマ補正およびホワイトバランス補正等の各種画像処理を行い、処理された画像データを生成する。画像圧縮部40は、画像生成部としての画像前処理部41で生成された画像データを入力画像データとして取得し、取得した入力画像データを圧縮符号化することによって圧縮データを生成する。圧縮データは、カードスロット81に装着されたメモリカード80等のストレージに格納される。図12中の画像圧縮部40を、実施の形態1および2で説明した動画像処理装置によって構成しうる。
本明細書で説明した動画像処理装置によれば、入力画像を保護単位ブロックに分割して管理するからマクロブロック単位の処理を極めて簡素に実現できる。また、顔拡大領域を求めることにより顔近傍部分の画質も改善するとともに、顔領域と実際の顔の位置がずれていても顔画像の画質を改善することができる。また、顔保護領域の総面積によって圧縮率の下げ幅を制御するから、顔保護領域の面積が大きい場合にも画面内に画質劣化部分を目立たせることがない。また、複数の顔が含まれる画像に対して個々の顔保護領域の面積によって個別に圧縮率の下げ幅を制御するから個々の顔保護領域を適切に画質改善することができる。従って、本発明は、動画像を圧縮して記録するデジタルビデオレコーダ、デジタルビデオカメラ等の撮像装置に有利に適用されうる。
1 動画像圧縮部
2 画像メモリ
3 顔検出部
4 圧縮率制御部
5 参照メモリ
6 動き補償部
7 減算器
8 DCT部
9 量子化部
10 符号化部
11 バッファメモリ
12 逆量子化部
13 逆DCT部
14 加算器
15 ビットレート制御部
20 光学系
25 撮像素子
30 ADC
40 画像処理部40
41 画像前処理部
200 動画像処理装置
300 ビデオカメラ

Claims (14)

  1. 入力画像の中で、特定対象が含まれている領域を特定対象領域として検出する特定対象検出部と、
    前記入力画像をその位置に応じて異なる圧縮率で圧縮可能な動画像圧縮部と、
    前記入力画像全体に対する前記特定対象領域の面積比が相対的に大きい場合には前記特定対象領域における圧縮率の下げ幅が小さくなり、前記入力画像全体に対する前記特定対象領域の面積比が相対的に小さい場合には前記特定対象領域における前記圧縮率の下げ幅が大きくなるように、前記特定対象検出部で検出された前記特定対象領域における前記圧縮率を下げるための圧縮制御指示を前記動画像圧縮部に対して出力する圧縮率制御部と、
    を備えた、動画像処理装置。
  2. 前記動画像圧縮部は、前記入力画像をマクロブロック単位で量子化することによって前記マクロブロック毎に異なる圧縮率で前記入力画像を圧縮可能であり、
    前記圧縮率制御部は、前記入力画像を複数の前記マクロブロックからなる保護単位ブロックに分割し、前記特定対象検出部で検出された前記特定対象領域を含む前記保護単位ブロックにおける前記圧縮率を下げるように前記動画像圧縮部に前記圧縮制御指示を出力する、請求項1に記載の動画像処理装置。
  3. 前記圧縮率制御部は、前記特定対象領域を拡大した特定対象拡大領域を抽出し、前記特定対象拡大領域を含む前記保護単位ブロックにおける前記圧縮率を下げるように前記動画像圧縮部に前記圧縮制御指示を出力する、請求項2に記載の動画像処理装置。
  4. 前記圧縮率制御部は、前記入力画像全体に対する前記特定対象領域の面積比が小さければ小さいほど、前記特定対象領域における前記圧縮率の下げ幅を段階的に大きくする、請求項1〜3のいずれか1項に記載の動画像処理装置。
  5. 前記圧縮率制御部は、前記入力画像に複数の前記特定対象領域が存在する場合に、前記入力画像全体の面積に対する複数の前記特定対象領域の総面積の比率に基づいて、前記圧縮制御指示を生成する、請求項1〜4のいずれか1項に記載の動画像処理装置。
  6. 前記圧縮率制御部は、前記入力画像に複数の前記特定対象領域が存在する場合に、前記特定対象領域の面積を個別に調査し、相対的に小さい面積を有する前記特定対象領域における前記圧縮率の下げ幅が大きくなり、相対的に大きい面積を有する前記特定対象領域における前記圧縮率の下げ幅が小さくなるように、複数の前記特定対象領域に個別に対応した複数の前記圧縮制御指示を生成する、請求項1〜4のいずれか1項に記載の動画像処理装置。
  7. 前記圧縮率制御部は、前記入力画像全体の面積に対する複数の前記特定対象領域の総面積の比率と、個々の前記特定対象領域の面積とに基づいて、複数の前記特定対象領域に個別に対応した内容の前記圧縮制御指示を生成する、請求項6に記載の動画像処理装置。
  8. 前記動画像圧縮部は、(i)前記入力画像からマクロブロック単位の周波数領域データを生成するDCT部と、(ii)前記周波数領域データを量子化する量子化部と、(iii)前記入力画像から得られた圧縮データの平均的ビットレートが予め定められた範囲内に収まるように、前記量子化部で実行するべき量子化処理における量子化ステップを規定するための基準量子化指標を前記量子化部に供給するビットレート制御部と、を含み、
    前記圧縮率制御部は、前記圧縮制御指示として、前記基準量子化指標を補正するための量子化指標変動幅を前記量子化部に与え、
    前記量子化部は、前記特定対象領域における前記圧縮率を下げるように、前記圧縮率制御部から与えられた前記量子化指標変動幅を前記基準量子化指標から減ずることによって得た量子化指標を前記量子化処理で使用する、請求項1〜7のいずれか1項に記載の動画像処理装置。
  9. 前記圧縮率制御部は、予め定められた量子化指標最大変動幅に、前記特定対象領域の前記面積比に対応して定められた保護比率を乗じることによって、前記量子化部に与えるべき前記量子化指標変動幅を算出する、請求項8に記載の動画像処理装置。
  10. 前記入力画像に複数の前記特定対象領域が存在する場合に、相対的に小さい面積を有する前記特定対象領域における前記圧縮率の下げ幅が大きくなり、相対的に大きい面積を有する前記特定対象領域における前記圧縮率の下げ幅が小さくなるように、前記特定対象領域の面積に対応する形で複数の前記量子化指標最大変動幅が準備されている、請求項9に記載の動画像処理装置。
  11. 前記入力画像に互いに異なる面積を有する複数の前記特定対象領域が存在し、かつ大きい面積を有する前記特定対象領域と小さい面積を有する前記特定対象領域との重複部分が存在する場合、その重複部分に対する前記量子化指標最大変動幅として、小さい面積を有する前記特定対象領域に対する前記量子化指標最大変動幅を使用する、請求項10に記載の動画像処理装置。
  12. 前記特定対象検出部は、前記入力画像に含まれる顔オブジェクトを検出し、前記特定対象領域として顔検出領域を抽出する、請求項1〜11のいずれか1項に記載の動画像処理装置。
  13. 入力画像の中で、特定対象が含まれている領域を特定対象領域として検出する特定対象検出工程と、
    前記入力画像全体に対する前記特定対象領域の面積比が相対的に大きい場合には前記特定対象領域における圧縮率の下げ幅が小さくなり、前記入力画像全体に対する前記特定対象領域の面積比が相対的に小さい場合には前記特定対象領域における前記圧縮率の下げ幅が大きくなるように、前記特定対象検出工程で検出された前記特定対象領域における前記圧縮率を下げるための圧縮制御指示を生成および出力する圧縮率制御工程と、
    前記圧縮率制御工程で生成された前記圧縮制御指示に従って前記特定対象領域の圧縮処理を行う動画像圧縮工程と、
    を含む、動画像処理方法。
  14. 被写体を撮像する撮像部と、
    前記撮像部の出力を処理することによって、処理された画像データを生成する画像生成部と、
    前記画像生成部で生成された前記画像データを入力画像データとして取得し、取得した入力画像データから圧縮データを生成する、請求項1〜11のいずれか1項に記載の動画像処理装置と、
    を備えた、撮像装置。
JP2010013382A 2009-01-26 2010-01-25 動画像処理装置、動画像処理方法および撮像装置 Active JP5285632B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010013382A JP5285632B2 (ja) 2009-01-26 2010-01-25 動画像処理装置、動画像処理方法および撮像装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009014005 2009-01-26
JP2009014005 2009-01-26
JP2010013382A JP5285632B2 (ja) 2009-01-26 2010-01-25 動画像処理装置、動画像処理方法および撮像装置

Publications (2)

Publication Number Publication Date
JP2010193441A true JP2010193441A (ja) 2010-09-02
JP5285632B2 JP5285632B2 (ja) 2013-09-11

Family

ID=42354143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010013382A Active JP5285632B2 (ja) 2009-01-26 2010-01-25 動画像処理装置、動画像処理方法および撮像装置

Country Status (2)

Country Link
US (1) US8363720B2 (ja)
JP (1) JP5285632B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011091510A (ja) * 2009-10-20 2011-05-06 Canon Inc 画像処理装置およびその制御方法
JP2012239085A (ja) * 2011-05-12 2012-12-06 Canon Inc 画像処理装置、画像処理方法
US9183446B2 (en) 2011-06-09 2015-11-10 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2015207909A (ja) * 2014-04-21 2015-11-19 日本電信電話株式会社 エンコード方法、エンコード装置及びエンコードプログラム
US9210433B2 (en) 2011-06-13 2015-12-08 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2016100771A (ja) * 2014-11-21 2016-05-30 三菱電機株式会社 動画像処理装置、監視システム及び動画像処理方法
TWI613910B (zh) * 2014-12-03 2018-02-01 安訊士有限公司 用於訊框序列之影像編碼的方法和編碼器
US10536696B2 (en) 2016-01-22 2020-01-14 Oki Electric Industry Co., Ltd. Image encoding device and image encoding method
WO2022213809A1 (zh) * 2021-04-07 2022-10-13 百果园技术(新加坡)有限公司 视频编码的方法、装置、设备和存储介质

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792864B1 (en) * 2006-06-14 2010-09-07 TransUnion Teledata, L.L.C. Entity identification and/or association using multiple data elements
CN102728820B (zh) * 2011-03-31 2015-05-20 沈阳铸造研究所 一种振动电渣熔铸方法及其专用设备
US8306267B1 (en) * 2011-05-09 2012-11-06 Google Inc. Object tracking
TWI502999B (zh) * 2012-12-07 2015-10-01 Acer Inc 影像處理方法及應用該方法之電子裝置
JP6383251B2 (ja) * 2013-12-27 2018-08-29 キヤノン株式会社 撮像装置及びその制御方法、プログラム、並びに記憶媒体
US10841476B2 (en) * 2014-07-23 2020-11-17 Orcam Technologies Ltd. Wearable unit for selectively withholding actions based on recognized gestures
CN105163188A (zh) * 2015-08-31 2015-12-16 小米科技有限责任公司 视频内容处理方法、装置及设备
WO2017066737A1 (en) * 2015-10-16 2017-04-20 Tribune Broadcasting Company, Llc Video-production system with metadata-based dve feature
CN107801026B (zh) * 2017-11-09 2019-12-03 京东方科技集团股份有限公司 图像压缩方法及装置、图像压缩及解压缩系统
JP6996300B2 (ja) * 2018-01-04 2022-01-17 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
CN110570316A (zh) * 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 训练损伤识别模型的方法及装置
US20210385549A1 (en) 2018-12-20 2021-12-09 Lg Electronics Inc. Video transmitting device
US11575896B2 (en) * 2019-12-16 2023-02-07 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001313943A (ja) * 2000-04-28 2001-11-09 Canon Inc 画像符号化装置及びその方法並びに記憶媒体
JP2004179997A (ja) * 2002-11-27 2004-06-24 Sony Corp 双方向コミュニケーションシステム,映像通信装置,および映像通信装置の映像データ配信方法
JP2007329788A (ja) * 2006-06-09 2007-12-20 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2008092174A (ja) * 2006-09-29 2008-04-17 Fujifilm Corp 撮像装置
JP2009005239A (ja) * 2007-06-25 2009-01-08 Sony Computer Entertainment Inc 符号化処理装置および符号化処理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3086396B2 (ja) * 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
JP3966461B2 (ja) * 2002-08-09 2007-08-29 株式会社リコー 電子カメラ装置
JP2005109606A (ja) 2003-09-29 2005-04-21 Sony Corp 信号処理方法、信号処理装置、記録装置、再生装置
US8331436B2 (en) * 2006-05-01 2012-12-11 Georgia Tech Research Corporation Expert system and method for elastic encoding of video according to regions of interest

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001313943A (ja) * 2000-04-28 2001-11-09 Canon Inc 画像符号化装置及びその方法並びに記憶媒体
JP2004179997A (ja) * 2002-11-27 2004-06-24 Sony Corp 双方向コミュニケーションシステム,映像通信装置,および映像通信装置の映像データ配信方法
JP2007329788A (ja) * 2006-06-09 2007-12-20 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2008092174A (ja) * 2006-09-29 2008-04-17 Fujifilm Corp 撮像装置
JP2009005239A (ja) * 2007-06-25 2009-01-08 Sony Computer Entertainment Inc 符号化処理装置および符号化処理方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011091510A (ja) * 2009-10-20 2011-05-06 Canon Inc 画像処理装置およびその制御方法
US8873869B2 (en) 2009-10-20 2014-10-28 Canon Kabushiki Kaisha Image processing apparatus and control method for the same
JP2012239085A (ja) * 2011-05-12 2012-12-06 Canon Inc 画像処理装置、画像処理方法
US9066101B2 (en) 2011-05-12 2015-06-23 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US9183446B2 (en) 2011-06-09 2015-11-10 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US9210433B2 (en) 2011-06-13 2015-12-08 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2015207909A (ja) * 2014-04-21 2015-11-19 日本電信電話株式会社 エンコード方法、エンコード装置及びエンコードプログラム
JP2016100771A (ja) * 2014-11-21 2016-05-30 三菱電機株式会社 動画像処理装置、監視システム及び動画像処理方法
TWI613910B (zh) * 2014-12-03 2018-02-01 安訊士有限公司 用於訊框序列之影像編碼的方法和編碼器
US9936217B2 (en) 2014-12-03 2018-04-03 Axis Ab Method and encoder for video encoding of a sequence of frames
US10536696B2 (en) 2016-01-22 2020-01-14 Oki Electric Industry Co., Ltd. Image encoding device and image encoding method
WO2022213809A1 (zh) * 2021-04-07 2022-10-13 百果园技术(新加坡)有限公司 视频编码的方法、装置、设备和存储介质

Also Published As

Publication number Publication date
JP5285632B2 (ja) 2013-09-11
US8363720B2 (en) 2013-01-29
US20100189175A1 (en) 2010-07-29

Similar Documents

Publication Publication Date Title
JP5285632B2 (ja) 動画像処理装置、動画像処理方法および撮像装置
CN110139035B (zh) 用于热管理和功率管理的方法和电子装置
US8488009B2 (en) Image processing apparatus, image processing method, and program
JP5583992B2 (ja) 信号処理装置
US20110298942A1 (en) Video image pickup device
JP2007235291A (ja) 適応量子化装置及び適応量子化プログラム
JP2012257198A (ja) 立体画像符号化装置、その方法、および立体画像符号化装置を有する撮像装置
JP2011188243A5 (ja)
JP2015115903A (ja) 撮像装置、撮像装置の制御方法、コンピュータプログラム
US9930352B2 (en) Reducing noise in an intraframe appearance cycle
JP2007028598A (ja) 圧縮符号化装置及び圧縮符号化方法
JP2023052939A (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、および復号プログラム
JP2009218965A (ja) 画像処理装置、それを搭載した撮像装置、および画像再生装置
JPH08275049A (ja) 撮像装置
JP4700992B2 (ja) 画像処理装置
JP2003333370A (ja) 信号処理装置
JP4185413B2 (ja) フリッカ低減量子化器、フリッカ低減量子化方法、及びそのプログラム
JP2005295371A (ja) ブロックノイズ除去装置
JP2014110509A (ja) 画像符号化装置及び画像符号化方法
JP2008227876A (ja) 撮像装置
JP2010183180A (ja) 画像処理装置、およびそれを搭載した撮像装置
JP2007288446A (ja) 動画像復号装置
JP2015019319A (ja) 符号化装置、符号化方法及びプログラム
JP2006129067A (ja) 動画像符号化装置及び方法
JP2006081066A (ja) 画像生成装置および画像生成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120801

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130531

R150 Certificate of patent or registration of utility model

Ref document number: 5285632

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150