JP2012191450A - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP2012191450A
JP2012191450A JP2011053543A JP2011053543A JP2012191450A JP 2012191450 A JP2012191450 A JP 2012191450A JP 2011053543 A JP2011053543 A JP 2011053543A JP 2011053543 A JP2011053543 A JP 2011053543A JP 2012191450 A JP2012191450 A JP 2012191450A
Authority
JP
Japan
Prior art keywords
quantization
unit
correction amount
quantization code
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011053543A
Other languages
English (en)
Inventor
Koji Mada
浩二 磨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011053543A priority Critical patent/JP2012191450A/ja
Publication of JP2012191450A publication Critical patent/JP2012191450A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】
顔等の注目部分を選択的に高画質化する。
【解決手段】
顔検出部(116)は、入力画像に顔の有無とその確からしさを検出する。顔検出保持部(119)は、顔検出部で検出される顔検出領域と信頼度を保持する。量子化設定補正部(117)は、顔検出保持部(119)に保持される情報に従い、量子化制御部で求められた量子化コードを補正する。補正量保持部(120)は、量子化設定補正部(117)が量子化コードを補正した領域とその補正量、及び顔検出の信頼度を次のフレームのために保持する。
【選択図】 図1

Description

本発明は画像符号化装置に関し、特に撮像された静止画あるいは動画などの画像情報を圧縮符号化する画像符号化装置に関する。
近年、記録媒体としてハードディスク又は不揮発性メモリを用いて高画質の動画記録を行うビデオカメラが製品化されている。このようなビデオカメラでは、動画像圧縮方式として、例えばMPEG4 part−10:AVC(ISO/IEC 14496−10、別名H.264)が採用され、圧縮符号化されたビデオストリームが記録媒体に記録される。
顔検出技術の進歩により、撮影中の被写体人物の顔を即時に検出し、色々な撮像処理に応用できるにようになってきた。例えば、顔を美しく見せるような色処理を施したり、顔の情報量を増やして高画質化処理を行うものがある。顔の高画質化処理の例としては、顔検出で人物の顔領域を特定し、その領域の符号化劣化を抑える技術が知られており、この技術により、注視領域である人物の顔を高画質化することができる。撮影画像中の顔を高画質化する技術が、特許文献1に記載されている。
特開2010−278797号公報
特許文献1に記載の技術では、顔部分を高画質化する際の高画質化の程度が一様であった。例えば、顔検出時の顔の状態がどのような場合でも、高画質化すると決めた顔に対し顔領域の量子化コード又は量子化ステップを一定量下げるようにしている。
一方、撮影される顔の状態は様々である。例えば、顔を正確に捉えている場合もあれば、焦点が合っていない場合、手ぶれしている場合もある。すなわち、動画撮影中に時々刻々と変化する被写体の顔の状態は、様々である。
そのため、焦点が合っていない場合や手ぶれしている場合に、顔領域の符号化劣化が目立ちにくいにも関わらず、必要以上に量子化コードを下げて符号化してしまうことがある。これでは、顔領域に符号量を過剰に割り当てることになり、その結果として画面全体の画質が劣化してしまう。
本発明は、このような不都合を解決する画像符号化装置を提示することを目的とする。
本発明に係る画像符号化装置は、入力画像を量子化する量子化部と、当該量子化部の出力をエントロピー符号化し、符号化ストリームを出力するエントロピー符号化部と、エントロピー符号化の発生符号量から、次の入力画像の符号化に用いる量子化コードを求め、前記量子化部に設定する量子化制御部とを備える画像符号化装置であって、前記入力画像に所定オブジェクトの有無とその確からしさを検出するオブジェクト検出部と、前記オブジェクト検出部の検出結果を保持するオブジェクト検出結果保持部と、前記オブジェクト検出の有無とその確からしさを用いて、前記量子化制御部で求められた量子化コードを量子化コード補正量だけ補正する量子化設定補正部と、前記量子化コードを補正した領域とその補正量、及び前記オブジェクト検出の確からしさを保持する補正量保持部とを備えることを特徴とする。
本発明によれば、入力画像中で所定オブジェクトを、画面全体の画質を損ねることなく選択的に高画質化することができる。
本発明の第1実施例の概略構成ブロック図を示す。 顔検出を用いた量子化設定補正部の基本処理を示すフローチャートである。 MBごとの量子化設定補正部の処理を示すフローチャートである。 顔検出保持部の保持内容例を示す。 顔検出の信頼度と量子化コード補正量との関係例を示す表である。 量子化設定補正部の補正処理を示すフローチャートである。 量子化設定補正部による、所定MBに対する量子化コード補正処理を示す折れ線グラフ例である。 本発明の第2実施例の概略構成ブロック図を示す。 第2実施例の信頼度調整部の処理を示すフローチャートである。 3人の検出された顔領域と位置関係の一例を示す。 本発明の第3実施例の概略構成ブロック図を示す。 笑顔度と量子化コード補正量との関係例を示す表である。 本発明の第4実施例の概略構成ブロック図を示す。 特定人物検出の類似度と量子化コード補正量との関係例を示す表である。
以下、図面を参照して、本発明の実施例を詳細に説明する。
図1は、本発明に係る画像符号化装置の一実施例の概略構成ブロック図を示す。
符号化部100は、入力画像を符号化単位ブロックであるマクロブロック(以後、MBと略す)単位で量子化し、動き予測及び動き補償を行った後、エントロピー符号化して、符号化ストリームを生成する。
加算器101は、入力画像の画素値と予測に用いられる参照画素値との予測誤差を算出する。直交変換部102は、加算器101から出力される予測誤差値を直交変換、例えば離散コサイン変換し、変換係数を出力する。量子化部103は、量子化制御部114の指示に従い、直交変換部102からの変換係数を量子化する。
逆量子化部104及び逆直交変換部105は、量子化部103の出力を逆量子化及び逆直交変換する。これにより、予測誤差値を復元できる。加算器106は、復元された予測誤差値に参照画素値を加算することで、局所的な復号結果である画素値を生成する。
加算器106から出力される画素値はイントラ予測部107に供給され、また、ループフィルタ108を介してフレームメモリ109に記憶される。
符号化にイントラ予測が用いられる場合、イントラ予測部107は、加算器106の出力画素値と隣接するMBから所定の参照画素値を生成する。イントラ予測では、スイッチ112は、イントラ予測部107からの参照画素値を選択する。先に説明したように、加算器101は、入力画像の、隣接するMBの画素値と、選択された参照画素値との誤差(予測誤差)を算出する。
符号化にインター予測が用いられる場合、動き検出部110は、過去に符号化済みの、フレームメモリ109に記憶される先行フレーム(又はフィールド)の参照画素値を用いて、入力画像におけるMBの動きベクトルを検出する。動き補償部111は、参照画像において、算出された動きベクトルで表される画素値を参照画素値として出力する。インター予測では、スイッチ112は、動き補償部111の出力(参照画素値)を選択する。加算器101は、後続するフレーム(又はフィールド)におけるMBの画素値と、選択された参照画素値との誤差(フレーム間の予測誤差)を算出する。
エントロピー符号化部113は、量子化部103の出力および動き補償部111により求められた動きベクトルをエントロピー符号化し、ストリームとして出力する。
複雑度算出部115は、原画像データに対する複雑度を算出し、符号化レート設定部118は符号化設定レートを設定する。量子化制御部114は、複雑度算出部115からの複雑度情報、符号化レート設定部118からの符号化設定レート及び符号化部113からの発生符号量に従い量子化パラメータを算出し、量子化設定補正部117に量子化コードを設定する。
複雑度算出部115による複雑度情報は例えば、MPEG2 Test Model 5に示された画像符号化方式で、知られている。Test Model 5では、画面内の目標発生符号量、実際の発生符号量によるフィードバック制御、及び原画像データの複雑度情報に従い量子化コードを制御することで、符号化レートを制御する。
Test Model 5は、3ステップによって構成されるアルゴリズムからなり、各ステップは次のような機能を持っている。
ステップ1では、前に符号化した同じタイプのピクチャにおける画面の複雑さを示すパラメータである複雑度情報を使って、次に符号化するピクチャの目標符号量を決定する。
ステップ2では、ステップ1で決まったピクチャに対する目標符号量と実際の発生符号量との差を押さえるために、量子化コードをMBごとにフィードバック制御により求める。
ステップ3では、ステップ2で決まった量子化コードを、各MBの絵柄の特徴に応じて変化させることによって視覚特性を向上させる。Test Model 5におけるステップ3では、具体的には、各MBの複雑度情報を求め、複雑な絵柄の部分では量子化コードを大きくして粗く量子化し、平坦部では量子化コードを小さくして細かく量子化する。こうすることで、視覚特性を利用した量子化コードを求めることができる。これは、人間の視覚特性が複雑な絵柄においては圧縮に伴うゆがみを感知しにくいことを利用している。
顔検出部116は、入力画像の中に人物の顔を検出する。人物の顔が含まれているかどうかは、例えば顔の輪郭及び構成要素(目や鼻、口など)で判断できる。入力画像の中に顔の要素が含まれている場合、顔検出部116は、検出した顔の位置とその領域の大きさを量子化設定補正部117に通知する。顔検出で人物の顔領域を特定し、顔領域の符号化劣化を抑えることで、注視領域である人物の顔を高画質化することができる。
量子化設定補正部117は、顔検出部116によって検出された顔領域に対して、量子化制御部114による量子化コード設定を変更する。
図2は、顔検出を用いた量子化設定補正部117の基本処理を示すフローチャートである。S201で、量子化設定補正部117は、量子化制御部114で設定された量子化コード設定を取得する。S202で、量子化設定補正部117は、顔検出部116で検出された顔領域の情報を取得する。S203で、量子化設定補正部117は、顔検出部116で顔が検出されたか否かを判定し、顔が検出されている場合にはS204に、そうでない場合にはS205に分岐する。S204で、量子化設定補正部117は、取得した顔領域の量子化コード設定から所定値である量子化コード補正量Nを減算して、補正する。S205で、量子化設定補正部117は、補正した量子化コード設定を量子化部103に通知する。
このように、量子化設定補正部117は、検出された顔領域に対して、量子化コードを小さくして細かく量子化するように量子化コードを補正する。これにより、量子化部103は、より小さい量子化コードで入力値を量子化することになり、顔領域の画質が高画質化する。
顔検出保持部119は、顔検出部116より顔が検出されたMBの座標と信頼度を対にして、顔検出情報として保持する。量子化設定補正部117は、顔検出保持部119に保持される顔検出情報を用いて、MB単位で量子化設定を補正する。補正量保持部120は、量子化設定補正部117により補正された量子化設定を保持する。
図3は、MBごとの量子化設定補正部117の処理を示すフローチャートである。S301で、量子化設定補正部117は、注目するMB(以下、注目MBと略す)に対して、量子化制御部114で設定された量子化コード設定を取得する。S302で、量子化設定補正部117は、注目MBが顔検出部116で検出された顔領域であるかどうかを、顔検出保持部119の保持値を参照して判定する。図4は、顔検出保持部119の保持内容例を示す。顔が検出されたMBの座標401と信頼度402が対になって保持されている。
顔検出の信頼度は、顔検出の確からしさを示す指数又は指標である。本実施例では、顔検出された領域(MB単位)で輪郭や構成要素(目や鼻、口など)などの要素が正しく抽出できるほど、その領域が顔である可能性が高く、信頼度が高いとする。実際の顔検出処理では、上記の要素を用いて点数を算出し、信頼度をNレベルに分けて決定するが、本実施例では簡単のために、「信頼度:高」、「信頼度:中」及び「信頼度:低」の3レベルとしている。
S303では、顔が検出されているか否かを判定し、検出されている場合、S304に、そうでなければS306に分岐する。
S304で、量子化設定補正部117は、顔検出部116で検出された顔領域の信頼度を顔検出保持部119より取得する。S305で、量子化設定補正部117は、信頼度に基づいて、顔検出領域の量子化コードを下げるように量子化コード補正量を更新する。保持された顔領域が画面上で連続する場合、量子化設定補正部117は、保持された量子化コード補正量に対して、量子化コード補正量を更新する。量子化コード補正量の決定方法は、後で詳細に説明する。
他方、S306では、量子化設定補正部117は、顔検出保持部119に保持された顔領域と信頼度に基づいて、量子化コードを上げるように量子化コード補正量を更新する。量子化コード補正量の決定方法は、後で詳細に説明する。
S307では、量子化設定補正部117は、S301で取得された量子化コードに対して、顔領域の量子化コードを量子化コード補正量だけ下げた量子化コードを算出する。そして、量子化設定補正部117は、顔検出領域である注目MBの座標と量子化コード補正量とを補正量保持部120に保持させる。
S308では、量子化設定補正部117は、S307で算出した量子化コード設定を量子化部103に通知する。
図5(A)は、顔検出された場合の、信頼度と量子化コード補正量との関係を示し、図5(B)は、顔検出されない場合の、保持された信頼度と量子化コード補正量との関係を示す。
図5(A)において、502は、注目MBにおける信頼度を示す。503は、顔が検出された場合の、注目MBの単位時間あたりの量子化コード補正量の増加幅を示す。信頼度が低の場合は単位時間あたりの量子化コード補正量の増加幅を小さくし、信頼度が高いほど、単位時間あたりに量子化コードを大きく下げる。504は、各信頼度の最大量子化コード補正量(又は、最大補正量)である。信頼度が高いほど、量子化コードを大きく下げて顔領域を高画質化する。
例えば、信頼度が所定値以上の場合の、量子化コードを下げる第1の単位時間あたりの量子化コード補正量は、所定値より低い場合の、量子化コードを下げる第2の単位時間あたりの補正量よりも大きい。第1の単位時間あたりの量子化コード補正量による補正の最大値(第1の最大補正量)は、第1の単位時間あたりの量子化コード補正量による補正の最大値(第2の最大補正量)よりも大きい。
図5(B)において、505は、顔が検出されなかった場合で、補正量保持部120に注目MBの量子化コード補正量が保持されているときの信頼度である。506は、顔が検出されなかった場合で、補正量保持部120に注目MBの量子化コード補正量が保持されているときの、注目MBの単位時間あたりの量子化コード補正量の減少幅又は減少量である。顔検出の信頼度が低の場合、単位時間あたりの量子化コード補正量の減少幅を少なくする。顔検出の信頼度が中の場合、単に時間あたりの量子化コード補正量の減少幅を増やしている。顔検出の信頼度が高い場合、単位時間あたりの量子化コード補正量の減少幅を少なくしている。これは、前フレームの信頼度が高く、本フレームで顔検出がされない場合、前フレームで検出された顔領域の付近に、まだ人物の顔が存在している可能性があるからである。顔検出の信頼度がどの区分又はレベルに相当するかは、各区分を区別する所定の閾値又は所定値との比較で判別される。
例えば、信頼度が高と中を区別する閾値を第1の所定値とし、中と低を区別する閾値を第2の所定値とする。そして、信頼度が高、中及び低の場合の、保持していた量子化コード補正量を減らす単位時間あたりの補正量をそれぞれ、第3、第4及び第5の単位時間あたりの補正量とする。このとき、第3の単位時間あたりの補正量を第4の単位時間あたりの補正量よりも小さくし、第4の単位時間あたりの補正量を第5の単位時間あたりの補正量よりも大きくする。
図6は、量子化設定補正部117の補正処理を示すフローチャートである。図6を参照して、顔検出の有無による注目MBの量子化コード補正量の決定方法を説明する。
S601で、量子化設定補正部117は、注目MBが検出された顔領域であればS602に、そうでなければS605に分岐する。
S602で、量子化設定補正部117は、注目MBの顔検出の信頼度に基づき、図5で示す量子化コード補正量だけ量子化コード補正量を更新する。
S603で、量子化設定補正部117は、更新された量子化コード補正量が、図5で示す注目MBの信頼度の最大量子化コード補正量を超えていればS604に分岐し、そうでなければ処理を終える。
S604では、量子化設定補正部117は、量子化コード補正量を、図5で示す注目MBの信頼度の最大量子化コード補正量に更新する。
S605で、量子化設定補正部117は、前フレーム上で注目MBと同じ座標のMBの量子化コード補正量と顔検出の信頼度を取得する。
S606で、量子化設定補正部117は、前フレームの、注目MBと同じ座標のMBの量子化コードが補正されている場合にS607に分岐し、そうでない場合に処理を終える。
S607で、量子化設定補正部117は、顔検出されていない場合の量子化コード補正量だけ量子化コードを補正する。
S608で、量子化設定補正部117は、量子化コード補正量が0未満の場合にS609に分岐し、そうでない場合に処理を終える。
S609では、量子化設定補正部117は、量子化コード補正量を0とする。
S610では、量子化設定補正部117は、更新した補正量を補正量保持部120に保持させる。
図7は、量子化設定補正部117による、所定MBに対する量子化コード補正処理を示す折れ線グラフ例である。横軸は時間を示し、縦軸は量子化部103に設定する量子化コード補正量を示す。この量子化コード補正量は、図3に示す各信頼度における量子化コードの補正量更新処理により決定されている。
図7を参照して、所定のMBに対する量子化コード補正処理の一例を説明する701は、所定MBが「顔検出有り、信頼度が低」と判定された期間である。702は、所定MBが「顔検出有り、信頼度が中」と判定された期間である。703は、所定MBが「顔検出有り、信頼度が高」と判定された期間である。704は、所定MBが「顔検出有り、信頼度が中」と判定された期間である。705は、所定MBが「顔検出有り、信頼度が高」と判定された期間である。706は、所定MBが「顔検出無し」と判定された期間である。
期間701では、所定MBが「顔検出有り、信頼度が低」と判定されたので、最大量子化コード補正量(ここでは、2)まで量子化コード補正量を1ずつ増加していく。
期間702では、所定MBが「顔検出有り、信頼度が中」と判定されたので、量子化コード補正量の増加幅2で量子化コード補正量を更新し、量子化コードの補正を行う。
期間703では、所定MBが「顔検出有り、信頼度が高」と判定されたので、量子化コード補正量の増加幅3で量子化コード補正量を更新し、量子化コードの補正を行う。
期間704では、所定MBが「顔検出有り、信頼度が中」と判定されたのと、直前の量子化コード補正量が信頼度”中”の最大補正量(=8)を超えているので、補正量8で量子化コードの補正を行う。
期間705では、所定MBが「顔検出有り、信頼度が高」と判定されたので、最大補正量(=12)まで量子化コード補正量を3ずつ増加していく。
期間706では、所定MBが「顔検出無し」と判定されたので、保持されている顔領域に対して、保持されている期間705の信頼度に基づいて、量子化コード補正量の減少幅1で量子化コード補正量を更新し、量子化コードの補正を行う。
このように、顔検出の信頼度に応じて量子化コードの設定を細かく制御するので、入力画像に含まれる顔の状態に応じた高画質化処理を行うことができる。すなわち、焦点が合っていない場合や手ぶれしている場合には、量子化コード補正量が少なくなるのに対し、顔を正確に捉えているときは量子化コードを補正して顔の符号化劣化を防ぐことができる。これにより、ユーザに対して高画質の画像を提供できる。
また、本実施例では、顔検出の信頼度に応じて、図5に示す表のように最大補正量を決定しているが、量子化部によって設定された量子化コードに応じて、各信頼度の最大補正量を変化させてもよい。
画像中で注目するオブジェクトの例として、顔を例示したが、本発明は、これらに限定されない。顔検出部116は、入力画像に所定オブジェクトの有無とその確からしさを検出するオブジェクト検出部の一具体例である。顔検出保持部119は、オブジェクト検出部の検出結果を保持するオブジェクト検出結果保持部の一例である。上記実施例の顔認識の信頼度は、オブジェクト認識の確からしさの一例である。
図8は、本発明の第2実施例の概略構成ブロック図を示す。本実施例は、複数の顔が同時に検出される場合にも対応可能である。要素800〜820は、図1に示す実施例の要素100〜120に対応する。図8に示す実施例は、図1に示す実施例に対して信頼度調整部821が追加されている。
信頼度調整部821は、顔検出部816によって複数の顔が同時に検出された場合、各顔の画質が均一になるように各顔領域の信頼度を調整し、量子化設定補正部817に通知する。
図9は、信頼度調整部821の処理を示すフローチャートである。S901で、信頼度調整部821は、顔検出部816から複数の顔領域(MB単位)とそれらの顔検出の信頼度を取得する。
S902で、信頼度調整部821は、検出された複数の顔領域間のMB単位の間隔が所定距離以内になっている場合にS903に、そうでない場合にS904に分岐する。分岐条件となる所定距離は、例えば、検出された顔領域の1/2のサイズである。
S903で、信頼度調整部821は、互いに近接している顔領域の信頼度を調整する。具体的には、互いに近接している顔領域の信頼度のうち最も信頼度の高い値を、近接している他の顔領域にも適用する。
S904で、信頼度調整部821は、顔領域及び信頼度を量子化設定補正部817に通知し、処理を終了する。
画面内に3人が撮像されている場合を例に、信頼度調整の有無による量子化設定補正の相違を説明する。図10は、3人の検出された顔領域と位置関係の一例を示す。r1は、人物1の顔領域1の中心から領域端までの距離である。r2は、人物2の顔領域2の中心から領域端までの距離である。r3は、人物3の顔領域3の中心から領域端までの距離である。L12は、顔領域1と顔領域2の中心間の間隔である。L23は、顔領域2と顔領域3の中心間の間隔である。L13は、顔領域1と顔領域3の中心間の間隔である。
このとき、顔領域1と顔領域2の距離はL12−(r1+r2)である。顔領域2と顔領域3の距離はL23−(r2+r3)である。顔領域1と顔領域3の距離はL13−(r1+r3)である。
ここで、顔領域1と顔領域2の距離は、所定距離以下、すなわち、顔領域のサイズ以下であり、顔領域2と顔領域3の距離及び顔領域1と顔領域3の距離が所定距離以上、即ち顔領域のサイズ以上であるとする。顔領域1の信頼度が高、顔領域2の信頼度が中、顔領域3の信頼度が中であるとする。
信頼度調整無しの場合の、顔領域1,2が互いに近接しながら、それらの信頼度の相違により顔領域1,2に対する量子化コードが異なるものになってしまう。これに対し、本実施例では、信頼度調整部821による信頼度調整により、顔領域1,2については、最も信頼度の高い顔領域1の信頼度に調整される。すなわち、顔領域2の信頼度が中から高に調整される。この結果、所定距離以内に近接する顔領域1,2の信頼度が一致し、従って、信頼度に応じて決定される良識かコードも一致するので、互いに同画質で量子化されることになる。
このようにすることで、複数の顔が検出された場合に、互いに近接している顔領域については最も高い信頼度に合わせるので、同程度の画質で符号化できる。
図11は、本発明の第3実施例の概略構成ブロック図を示す。本実施例では、顔検出ではなく笑顔検出を用いる。要素1100〜1115,1117〜1120は、図1に示す実施例の要素100〜115,117〜120に対応する。図1に示す実施例の顔検出部116の代わりに、笑顔検出部1116を具備する。
笑顔は、目や口の形、顔のしわなど、顔全体に分布する特徴から識別できる。例えば、口角が上がる、目尻が下がるなどの変化が、笑顔の特徴である。笑顔検出部1116は、これらの変化を統計的識別手法により総合的に解析することで、笑顔の度合いを示す笑顔度を測定する。本実施例では、理解を容易にするため、笑顔度を「高」、「中」及び「低」の3段階とする。
図12(A)及び(B)は、笑顔検出部1116により検出される笑顔度と、量子化設定補正部1117の量子化コード補正量との関係例を示す。図12(A)は、笑顔検出された場合の笑顔度と量子化コード補正量の関係の一例を示し、図12(B)は、笑顔検出されなかった場合の、保持された笑顔度と量子化コード補正量の関係の一例を示す。
1201は、注目MBにおける笑顔検出の笑顔度を示す。1202は、笑顔が検出された場合の、注目MBの単位時間あたりの量子化コード補正量の増加幅を示す。笑顔検出の笑顔度が低い場合、単位時間あたりの量子化コード補正量の増加幅を少なくし、笑顔検出の笑顔度が高いほど、単位時間あたりの量子化コードを大きく下げるようにしている。このような量子化コード補正量の制御により、笑顔部分の高画質化を促進する。
1203は、各笑顔度に対する最大量子化コード補正量である。笑顔度が高いほど、量子化コードを大きく下げて、顔領域を高画質化する。
1204は、笑顔が検出されなかった場合で、補正量保持部1120に注目MBの量子化コード補正量が保持されている場合の笑顔度である。
1205は、笑顔が検出されなかった場合で、補正量保持部1120に注目MBの量子化コード補正量が保持されている場合の、注目MBの単位時間あたりの量子化コード補正量の減少幅である。
笑顔度が低い場合、単位時間あたりの量子化コード補正量の減少幅を少なくし、笑顔度が中の場合は、量子化コードの補正量の減少幅も増えていくが、笑顔度が高いと、単位時間あたりの量子化コード補正量の減少幅を少なくする。これは、前フレームの顔検出の笑顔度が高く、本フレームで笑顔検出がされない場合、前フレームで顔検出された領域の付近に、まだ笑顔であった人物が存在している可能性があるからである。
このように量子化コード補正量を制御することで、入力画像の中で重要な領域として扱われる笑顔領域に対して、笑顔の度合いに応じて高画質化することができる。
画像中で注目するオブジェクトの例として、ここでは笑顔を例示したが、本発明は、これらに限定されず、笑顔検出部1116は、入力画像に所定オブジェクトの有無とその確からしさを検出するオブジェクト検出部の一具体例である。顔検出保持部1119は、オブジェクト検出部の検出結果を保持するオブジェクト検出結果保持部の一例である。
図13は、本発明の第4実施例の概略構成ブロック図を示す。本実施例では、顔検出ではなく、特定人物検出を用いる。本実施例では、顔検出のみでなく、更に特定人かどうかを検出する。要素1300〜1315,1317〜1320は、図1に示す実施例の要素100〜115,117〜120に対応する。図1に示す実施例の顔検出部116の代わりに、特定人物検出部1316を具備する。
予め入力された特定人物の顔情報データ(目、鼻、耳、口の形状と、互いの位置関係を数値化したもの)を用いて、入力画像に特定人物がいるどうかを判断できる。特定人物検出部1316は、入力画像からこれらの顔情報データを取得し、両者を照合して特定人物の類似度を示す特定人物信頼度を算出する。本実施例では、理解を容易にするため、特定人物信頼度を「高」、「中」及び「低」の3段階とする。
図14(A)及び(B)は、特定人物検出部1316により検出される特定人物検出の類似度と、量子化コード補正量との関係例を示す。図14(A)は、特定人物検出された場合の特定人物検出情報と量子化コード補正量との関係の一例を示す。図14(B)は、特定人物検出されなかった場合の、保持された特定人物検出の類似度と量子化コード補正量との関係の一例を示す。
1401は、注目MBにおける特定人物検出の類似度を示す。1402は、特定人物が検出された場合の、注目MBの単位時間あたりの量子化コード補正量の増加幅を示す。特定人物検出の類似度が低い場合、単位時間あたりの量子化コード補正量の増加幅を少なくし、特定人物検出の類似度が高いほど、単位時間あたりの量子化コードを大きく下げるようにしている。これにより、特定人物の顔領域の高画質化を促進する。
1403は、各類似度に対する最大量子化コード補正量である。特定人物検出の類似度が高いほど、量子化コードを大きく下げて、顔領域の高画質化を可能としている。
1404は、特定人物が検出されなかった場合で、補正量保持部1320に注目MBの量子化コード補正量が保持されているときの特定人物の類似度である。
1405は、特定人物が検出されなかった場合で、補正量保持部1320に注目MBの量子化コード補正量が保持されているときの、注目MBの単位時間あたりの量子化コード補正量の減少幅である。
特定人物の顔検出の類似度が低い場合、単位時間あたりの量子化コード補正量の減少幅を少ない。類似度が中の場合は、量子化コード補正量の減少幅を増やすが、類似度が高いと、単位時間あたりの量子化コード補正量の減少幅を少なくする。これは、前フレームでの類似度が高いが、本フレームで特定人物検出がされない場合、前フレームの顔検出領域の付近に、まだ人物特定された人物が存在している可能性があるからである。
このようにすることで、入力画像の中で、特定人物の顔領域をその類似の度合いに応じて高画質化することができる。
画像中で注目するオブジェクトの例として、ここでは特定人物を例示したが、本発明は、これらに限定されず、特定人物検出部1316は、入力画像に所定オブジェクトの有無とその確からしさを検出するオブジェクト検出部の一具体例である。顔検出保持部1319は、オブジェクト検出部の検出結果を保持するオブジェクト検出結果保持部の一例である。

Claims (14)

  1. 入力画像を量子化する量子化部と、
    当該量子化部の出力をエントロピー符号化し、符号化ストリームを出力するエントロピー符号化部と、
    エントロピー符号化の発生符号量から、次の入力画像の符号化に用いる量子化コードを求め、前記量子化部に設定する量子化制御部
    とを備える画像符号化装置であって、
    前記入力画像に所定オブジェクトの有無とその確からしさを検出するオブジェクト検出部と、
    前記オブジェクト検出部の検出結果を保持するオブジェクト検出結果保持部と、
    前記オブジェクト検出の有無とその確からしさを用いて、前記量子化制御部で求められた量子化コードを量子化コード補正量だけ補正する量子化設定補正部と、
    前記量子化コードを補正した領域とその補正量、及び前記オブジェクト検出の確からしさを保持する補正量保持部
    とを備えることを特徴とする画像符号化装置。
  2. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出された場合、検出された領域に対して、単位時間ごとに前記量子化コード補正量を更新して、前記量子化制御部で求められた量子化コードを補正するとともに、前記量子化コードを補正した領域とその補正量、及び前記オブジェクト検出の確からしさを前記補正量保持部に保持させることを特徴とする請求項1に記載の画像符号化装置。
  3. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出された場合、その確からしさに応じて、検出された領域に対して、前記量子化コード補正量を時間に対して変化させることを特徴とする請求項1に記載の画像符号化装置。
  4. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出され、その確からしさが所定値よりも高い場合、検出された領域に対して、前記量子化コードを時間に対して下げる第1の単位時間あたりの補正量を用いて、前記量子化制御部で求められた前記量子化コードを補正し、第1の最大補正量まで前記量子化コード補正量を更新することを特徴とする請求項3に記載の画像符号化装置。
  5. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出され、その確からしさが所定値よりも低い場合、検出された領域に対して、前記量子化コードを時間に対して下げる第2の単位時間あたりの補正量を用いて、前記量子化制御部で求められた前記量子化コードを補正し、第2の最大補正量まで前記量子化コード補正量を更新することを特徴とする請求項3又は4に記載の画像符号化装置。
  6. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出されず、前記補正量保持部に前記量子化コード補正量が保持される場合、保持していた前記量子化コード補正量を減少させて、再び補正量保持部に保持させることを特徴とする請求項1に記載の画像符号化装置。
  7. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出されず、前記補正量保持部に前記量子化コード補正量が存在する場合、保持されているオブジェクト認識の確からしさに応じて、保持していた量子化コード補正量の単位時間ごとの減少量を変化させることを特徴とする請求項6に記載の画像符号化装置。
  8. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出されず、前記補正量保持部に前記量子化コード補正量が存在する場合で、保持されているオブジェクト認識の確からしさが第1の所定値よりも高いときには、保持していた前記量子化コード補正量を時間に対して減らす第3の単位時間あたりの補正量を用いて、前記量子化コード補正量を更新することを特徴とする請求項7に記載の画像符号化装置。
  9. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出されず、前記補正量保持部に前記量子化コード補正量が存在する場合で、保持されているオブジェクト認識の確からしさが第1の所定値よりも低く、第2の所定値よりも大きいときには、保持していた前記量子化コード補正量を時間に対して減らす第4の単位時間あたりの補正量を用いて、前記量子化コード補正量を更新することを特徴とする請求項7又は8に記載の画像符号化装置。
  10. 前記量子化設定補正部は、前記オブジェクト検出部で前記所定オブジェクトが検出されず、前記補正量保持部に前記量子化コード補正量が存在する場合で、保持されているオブジェクト認識の確からしさが第2の所定値よりも低いとき、保持していた前記量子化コード補正量を時間に対して減らす第5の単位時間あたりの補正量を用いて前記量子化コード補正量を更新することを特徴とする請求項7乃至9の何れか1項に記載の画像符号化装置。
  11. 前記量子化設定補正部は、前記オブジェクト検出部で複数の前記所定オブジェクトが検出された場合、複数の前記所定オブジェクトのうち最も確からしさの高い値を他のオブジェクトの確からしさにも適用し、各オブジェクトの前記量子化コードを補正することを特徴とする請求項1に記載の画像符号化装置。
  12. 前記所定オブジェクトは顔であり、その確からしさは顔の正確な抽出の度合いを示す信頼度であることを特徴とする請求項1乃至11の何れか1項に記載の画像符号化装置。
  13. 前記所定オブジェクトは笑顔であり、その確からしさは笑顔の度合いを示す笑顔度であることを特徴とする請求項1乃至11の何れか1項に記載の画像符号化装置。
  14. 前記所定オブジェクトは特定人物であり、その確からしさは特定人物との類似度であることを特徴とする請求項1乃至11の何れか1項に記載の画像符号化装置。
JP2011053543A 2011-03-10 2011-03-10 画像符号化装置 Withdrawn JP2012191450A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011053543A JP2012191450A (ja) 2011-03-10 2011-03-10 画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011053543A JP2012191450A (ja) 2011-03-10 2011-03-10 画像符号化装置

Publications (1)

Publication Number Publication Date
JP2012191450A true JP2012191450A (ja) 2012-10-04

Family

ID=47084135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011053543A Withdrawn JP2012191450A (ja) 2011-03-10 2011-03-10 画像符号化装置

Country Status (1)

Country Link
JP (1) JP2012191450A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016025494A (ja) * 2014-07-22 2016-02-08 ルネサスエレクトロニクス株式会社 画像受信装置、画像伝送システムおよび画像受信方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016025494A (ja) * 2014-07-22 2016-02-08 ルネサスエレクトロニクス株式会社 画像受信装置、画像伝送システムおよび画像受信方法

Similar Documents

Publication Publication Date Title
CN110267041B (zh) 图像编码方法、装置、电子设备和计算机可读存储介质
JP6286718B2 (ja) 高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理
US9118912B2 (en) Object-aware video encoding strategies
JP5285632B2 (ja) 動画像処理装置、動画像処理方法および撮像装置
US10205953B2 (en) Object detection informed encoding
US20080240571A1 (en) Real-time face detection using temporal differences
Fischer et al. Video coding for machines with feature-based rate-distortion optimization
US8983217B2 (en) Stereo image encoding apparatus, its method, and image pickup apparatus having stereo image encoding apparatus
JPWO2009037828A1 (ja) 画像符号化装置および画像復号化装置
JP5766877B2 (ja) 類似度、視覚的品質、および関心に基づくフレーム符号化選択
Shen et al. A novel H. 264 rate control algorithm with consideration of visual attention
JP4189358B2 (ja) 画像符号化装置及び方法
US9319682B2 (en) Moving image encoding apparatus, control method therefor, and non-transitory computer readable storage medium
US9432694B2 (en) Signal shaping techniques for video data that is susceptible to banding artifacts
US9565404B2 (en) Encoding techniques for banding reduction
JP2012191450A (ja) 画像符号化装置
CN113810692B (zh) 对变化和移动进行分帧的方法、图像处理装置及程序产品
US20140362927A1 (en) Video codec flashing effect reduction
US8126277B2 (en) Image processing method, image processing apparatus and image pickup apparatus using the same
JP5913929B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP5063548B2 (ja) 符号化装置および符号化方法
US20090074260A1 (en) Image processing apparatus
JP2014200078A (ja) 動画像符号化装置及びその制御方法
JP2014110509A (ja) 画像符号化装置及び画像符号化方法
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140513