JP2010233186A - 電子カメラ及び符号化方法 - Google Patents

電子カメラ及び符号化方法 Download PDF

Info

Publication number
JP2010233186A
JP2010233186A JP2009081530A JP2009081530A JP2010233186A JP 2010233186 A JP2010233186 A JP 2010233186A JP 2009081530 A JP2009081530 A JP 2009081530A JP 2009081530 A JP2009081530 A JP 2009081530A JP 2010233186 A JP2010233186 A JP 2010233186A
Authority
JP
Japan
Prior art keywords
image
block
electronic camera
encoding
macroblock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009081530A
Other languages
English (en)
Inventor
Kenji Yoshihara
賢士 吉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2009081530A priority Critical patent/JP2010233186A/ja
Publication of JP2010233186A publication Critical patent/JP2010233186A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 画像に対する圧縮率を変化させずに画質の向上を図る。
【解決手段】 第1画像に含まれるオブジェクトを検出する検出部と、検出されたオブジェクトに基づいて、検出されたオブジェクトを含む領域を分割する際に用いるブロックを、大きさの異なる複数種類のブロックのいずれかから設定するブロック設定部と、オブジェクトを含む領域を分割した各ブロックと、第1画像よりも前、又は後に取り込まれる第2画像とを用いて動きベクトルを求めて、第1画像及び前記第2画像間の動き予測を行い、動き予測における予測誤差を符号化する画像符号化部と、を備えたことを特徴とする。
【選択図】 図1

Description

本発明は、取り込まれる画像信号を圧縮符号化して記憶する電子カメラ及び符号化方法に関する。
取得される画像の画質を向上させる方法としては、画像に対して施される画像処理、又は画像に対して施される符号化処理のいずれか一方の処理を改善することが考えられる。画像処理により画質を向上させる場合、画像から人物の顔などのオブジェクトを検出し、検出されたオブジェクトに基づいた高画質化処理を画像に対して実行することが挙げられる(特許文献1参照)。
一方、符号化処理により画質を向上させる場合には、例えば画像から人物の顔などのオブジェクトを検出し、検出されたオブジェクトが占める領域に対しては低圧縮率を用い、それ以外の領域に対しては高圧縮率を用いる、所謂ROI(Region Of Intarest)機能による圧縮符号化処理を施すことが挙げられる(特許文献2参照)。
特開2005−63406号公報 特開2001−145101号公報
しかしながら、上述した画像処理を動画像に適用した場合、オブジェクトの動きに起因して発生するボケを改善することが難しく、動画像の画質を向上させることは難しい。そこで、動画像の画質を向上させるために、上述した圧縮符号化処理を適用することを考えると、オブジェクトの動きに起因するボケの発生を抑止することができるが、オブジェクトが占める領域に対する圧縮率と、それ以外の領域に対する圧縮率との違いから結果的に画質を悪化させてしまう虞があるという問題がある。
本発明は、画像に対する圧縮率を変化させなくても、画質の向上を図ることができるようにした電子カメラ及び符号化プログラムを提供することを目的とする。
上述した課題を解決するために、本発明の電子カメラは、第1画像に含まれるオブジェクトを検出する検出部と、前記検出されたオブジェクトに基づいて、予め設定された異なる複数種類のブロックから、少なくとも前記オブジェクトを含む領域を分割する際に用いるブロックを設定するブロック設定部と、前記設定部により設定されたブロックを用いて分割された少なくとも前記オブジェクトを含む領域と、前記第1画像よりも前、又は後に取り込まれる第2画像とを用いて動きベクトルを求めるとともに、求めた動きベクトルを利用して前記第1画像及び前記第2画像間の動き予測を行い、該動き予測における予測誤差を符号化する画像符号化部と、を備えたことを特徴とする。
また、前記設定部は、前記複数種類のブロックから、長手方向が前記オブジェクトの長手方向と同一方向となるブロックを選択することが好ましい。
また、前記設定部は、前記複数種類のブロックから、長手方向が前記オブジェクトの長手方向と直交するブロックを選択することが好ましい。
また、前記設定部は、前記オブジェクトの輪郭が含まれるブロックと、前記オブジェクトの輪郭よりも内側の領域が含まれるブロックとを、それぞれ異なる種類のブロックから選択することが好ましい。
この場合、前記設定部は、前記オブジェクトの輪郭よりも内側の領域が含まれるブロックとして、前記オブジェクトの輪郭が含まれるブロックのブロックサイズよりも小さいブロックを選択することが好ましい。
また、本発明の符号化方法は、第1画像に含まれるオブジェクトを検出する検出工程と、前記検出されたオブジェクトに基づいて、予め設定された異なる複数種類のブロックから、少なくとも前記オブジェクトを含む領域を分割する際に用いるブロックを設定する設定工程と、前記ブロックごとに分割された前記オブジェクトを含む領域と、前記第1画像よりも前、又は後に取り込まれる第2画像とを用いて動きベクトルを求めるとともに、求めた動きベクトルを利用して前記第1画像及び前記第2画像間の動き予測を行い、該動き予測における予測誤差を符号化する符号化工程と、をコンピュータに実行させることが可能なものである。
本発明によれば、画像から検出されるオブジェクトに応じたブロックを用いて分割することで、動き予測における予測誤差を高精度に求めることができるので、画像の圧縮率を一定にした場合であっても、得られる画像の画質を劣化させる虞がない。
デジタルカメラの構成の概略を示す図である。 フレーム画像に対するオブジェクト検出を示す図である。 フレーム画像を16×16画素のマクロブロックに分割した場合を示す図である。 フレーム画像を8×8画素のマクロブロックに分割した場合を示す図である。 フレーム画像を16×16画素、16×8画素、8×16画素及び8×8画素のいずれかのマクロブロックに分割した場合を示す図である。 画像符号化回路の構成の概略を示す図である。 動画像撮影の際のデジタルカメラ10の内部の処理の流れを示すフローチャートである。 フレーム画像を16×16画素及び16×8画素のマクロブロックに分割した場合を示す図である。 フレーム画像を16×16画素及び8×16画素のマクロブロックに分割した場合を示す図である。
以下、本実施形態の電子カメラの一例としてデジタルカメラ10を例に挙げて説明する。なお、このデジタルカメラ10は、静止画像の撮影の他に、動画像を撮影することが可能である。以下、静止画像の撮影を静止画撮影、動画像の撮影を動画撮影と称して説明する。
図1に示すように、デジタルカメラ10は、撮像光学系15を介して取り込まれる被写体光を撮像素子21により光電変換し、光電変換後の信号電荷を画像信号として出力する。以下では、デジタルカメラ10を用いて画像データを取得する行為を撮影と称し、該撮影時に実行されるデジタルカメラ10の内部の処理を撮像と称して説明する。
撮像光学系15は、図示を省略した撮像レンズ、ズームレンズやフォーカスレンズなどを含むレンズ群から構成される。ズームレンズは選択された撮影倍率となるように光軸Lに沿って移動する。フォーカスレンズは被写体像の焦点調節の際に光軸Lに沿って微小移動する。このレンズ群を構成するズームレンズやフォーカスレンズなどは、図示を省略したレンズ駆動機構によって駆動制御される。
撮像素子21は、例えばCCD(Charge Coupled Device)やCMOS(Complementary Metal−Oxide Semiconductor)などから構成される。撮像素子21は、撮像光学系15によって取り込まれる被写体光を受光し、受光した光量を信号電荷に変換(光電変換)して、変換した信号電荷を蓄積する。
ドライバ22は、撮像素子21を駆動制御する。撮像素子21の駆動制御とは、撮像素子21の各画素に対する信号電荷の蓄積及び蓄積された信号電荷の出力の他に、被写体光を受光する画素と、受光しない画素とを制御する、所謂間引き制御を行うことが挙げられる。なお、間引き制御が行われることで得られる画像データは、後述するLCD37にスルー画像を表示させる際に用いられる。以下、撮像素子21から出力される信号電荷を画像信号と称して説明する。
AFE(Analog Front End)回路23は、図示しないAGC回路やCDS回路を含んで構成される。AFE回路23は、入力された画像信号に対してゲインコントロール、雑音除去などのアナログ処理を施す。このアナログ処理が施された画像信号は、DFE回路24に出力される。
DFE(Digital Front End)回路24は、AFE回路23によってアナログ処理が施された画像信号をデジタル信号に変換する。符号25は、タイミングジェネレータ(TG)であり、このTG25により、ドライバ22、AFE回路23及びDFE回路24の駆動タイミングが制御される。バッファメモリ31は、DFE回路24によってデジタル化された画像信号が1コマ毎にまとめられて記憶される。なお、このバッファメモリ31には、複数コマの画像信号を記憶することが可能となっている。
画像処理回路32は、バッファメモリ31に記憶された画像信号に対して、画像処理を実行する。この画像処理については周知であることから、詳細は記載しないが、例えば色補間処理、ホワイトバランス補正処理、輪郭補償処理、階調変換処理、色空間変換処理などが挙げられる。なお、画像処理済みの画像信号は、バッファメモリ31に記録される。なお、本実施形態では、画像処理済みの画像信号をバッファメモリ31に記録しているが、これに限定される必要はなく、画像処理済みの画像信号を複数記録するためのメモリをバッファメモリ31とは別に設けることも可能である。
画像符号化回路33は、画像処理済みの画像信号に対して符号化処理(圧縮処理)を施す。なお、この画像符号化回路33の詳細については、後述するが、この画像符号化回路33によって、静止画撮影により取得された画像データ(以下、静止画像データ)や、動画撮影により取得された画像データ(以下、動画像データ)が、圧縮符号化される。
例えば、画像符号化回路33にて符号化処理された静止画像データは、静止画像データよりも低品質となるサムネイル画像データや、デジタルカメラ10の機種情報、撮影情報などの付帯情報等と1つのファイル(静止画像ファイル)にまとめられ、記憶媒体35に記憶される。なお、符号36は、メディアスロットである。ここで、上述したサムネイル画像データは、静止画像データとは異なる画像サイズにリサイズ処理された後に、符号化処理された画像データである。同様にして、画像符号化回路33にて符号化処理された動画像データは、デジタルカメラ10の機種情報、撮影情報などの付帯情報等と1つのファイル(動画像ファイル)にまとめられ、記憶媒体35に記憶される。
LCD37は、表示装置の一形態であって、撮影待機状態時に取り込まれるスルー画像や、静止画撮影や動画撮影時に得られた画像を表示する。また、この他に、LCD37には、デジタルカメラ10の設定を行う際の設定用の画像を表示する。なお、符号38は、LCD37の駆動制御を行う表示制御回路である。
CPU41は、内蔵メモリ42に記憶された制御プログラム(図示省略)を実行することで、デジタルカメラ10の各部を統括的に制御する。このCPU41は、バス43を介して、バッファメモリ31、画像処理回路32、画像符号化回路33、メディアスロット36、表示制御回路38及び内蔵メモリ42に接続される。CPU41には、レリーズボタン44や設定操作部45からの操作信号が入力可能となっている。
このCPU41は、上述した制御プログラムを実行することで、オブジェクト検出部51及びマクロブロック設定部52の機能を有する。オブジェクト検出部51は、動画像撮影を行っている際に、バッファメモリ31に格納された画像処理済みの画像データを用いてオブジェクト検出を行う。動画像撮影においては、所定時間毎に画像が取得されていく。以下、所定時間毎に取得される各画像をフレーム画像と称して説明する。
図2に示すように、例えば被写体が人物となる動画撮影の場合、このオブジェクト検出部51によって人物の顔(符号55に示す領域)がオブジェクトとして検出される他、目(符号56,57に示す領域)、口(符号58に示す領域)など顔を構成する要素もオブジェクトとして検出される。なお、このオブジェクト検出としては、例えば周知の特徴量抽出を用いればよい。このオブジェクト検出によってオブジェクトが検出されると、検出されたオブジェクトが含まれる矩形の領域(以下、オブジェクト領域)に含まれる画素のアドレスデータが内蔵メモリ42に記録される。
マクロブロック設定部52は、動画像を構成するフレーム画像FIを分割する際に用いるマクロブロックの設定を行う。なお、このマクロブロックは、後述する動きベクトルを検出する際に用いられる。このマクロブロックとしては、例えば16×16画素、8×16画素、16×8画素、8×8画素のいずれかのブロックサイズのマクロブロックが挙げられる。マクロブロック設定部52は、オブジェクト検出部51によって検出されたオブジェクトに基づいて、フレーム画像を分割する際に用いるマクロブロックを設定する。詳細には検出されたオブジェクトが人物の顔となる場合には、検出された顔の大きさや向き、顔を構成する目、口等の大きさや向きなどに基づいて決定される。
図3に示すように、16×16画素のマクロブロック61でフレーム画像FIを分割した場合、マクロブロック61に基づく分割数は少ないので、符号化処理を施したときの符号量が少なく、フレーム画像FIに対する符号化処理の効率は向上する。しかしながら、目や口などがオブジェクトとして検出された場合には、これらオブジェクトはマクロブロック61に占める割合が小さいことから、後述する動きベクトルの検出の際には、これらオブジェクトに対する動きベクトルの検出精度が低下する。
一方、図4に示すように、8×8画素のマクロブロック62でフレーム画像FIを分割した場合、例えば目や口など、サイズの小さいオブジェクトの場合には、マクロブロック62に占める割合が大きくなる。このような場合には、これらオブジェクトに対する動きベクトルの検出精度は向上する。しかしながら、マクロブロックのサイズが小さいと、分割により生成されるマクロブロックの数、つまりフレーム画像FIを符号化したときの符号量が多くなり、結果的に符号化処理の効率が低下する。
そこで、マクロブロック設定部52は、フレーム画像FIから検出されるオブジェクトの大きさや形状に合わせて使用するマクロブロックの大きさを設定する。図5に示すように、まず、フレーム画像FIを16×16画素のマクロブロック61に分割する。そして、検出されたオブジェクトが含まれる領域のうち、顔の輪郭が含まれている領域、つまり、ハッチング領域B1に対しては8×16画素のマクロブロック63となるように、ハッチング領域B2に対しては16×8画素のマクロブロック64となるように、それぞれの領域を分割する。なお、8×16画素のマクロブロックや、16×8画素のマクロブロックは、例えば圧縮率との兼ね合いで8×8画素のマクロブロックが使用できない場合に用いられることが多い。このため、図5に示す領域B1や領域B2は、16×8画素のマクロブロックや8×16画素のマクロブロックではなく、8×8画素のマクロブロックとなるように分割してもよい。
さらに、顔がオブジェクトとして検出される場合には、目、口など顔を構成する要素もオブジェクトとして検出されている。このようなオブジェクトの内側にオブジェクトが位置している場合には、オブジェクトの内側の領域を、オブジェクトの内側に位置するオブジェクトの大きさや形状、さらにはその個数に応じて分割する。なお、図5においては、顔の内側の領域を8×8画素のマクロブロック62に分割した場合を示す。マクロブロック設定部52は、フレーム画像FIを分割したときのマクロブロックのブロックサイズと、その位置とを示す情報がブロック設定情報として画像符号化回路33に出力される。
なお、このマクロブロック設定部52によるブロックサイズの設定は、フレーム画像FI全体を対象とする必要はない。例えばMpeg4規格や、H.264/AVC規格などを用いた符号化処理の場合には、画像に含まれる(画像から検出される)オブジェクト毎に動き検出を行うことが可能である。このような場合には、フレーム画像FIからオブジェクト領域を抜き出した画像に対して、上述したブロックサイズの設定を行うことも可能である。
以下、図6を用いて、画像符号化回路33の構成について説明する。なお、図6に示す画像符号化回路33は、H.264/AVC規格に基づいて画像を符号化するための回路の一例を示す。以下、動画像データが入力される場合について説明する。
この画像符号化回路33には、符号化する順番に各フレーム画像の並べ替えが行われた動画像データが入力される。動画像は複数のフレーム画像から構成されるが、これらフレーム画像のタイプは、同一フレーム内の情報のみで符号化が行われるIピクチャと、時間的に前のフレーム画像との差分を利用して符号化が行われるPピクチャ、及び時間的に後の(局所復号化された)フレーム画像との差分も利用して符号化が実行されるBピクチャとからなる。Bピクチャは時間的に後のフレーム画像を参照するため、符号化の順番は参照するフレーム画像よりも後になる。
符号化順に並び替えられたフレーム画像は、マクロブロック単位毎に符号化される。以下、符号化される際のマクロブロックのブロックサイズは、マクロブロック設定部52にて設定されたブロックサイズと同一の場合について説明する。これらフレーム画像のうち、Iピクチャは、後述するイントラ予測部74においてフレーム内の画素情報からマクロブロック内の画素が予測され、予測画素と実際の画素(現画素)の差分データが直交変換部66へ出力される。
また、画像フレームがBピクチャ又はPピクチャは、後述するインター予測部76において算出される予測画像と現画像との差分データが直交変換部66へ出力される。
この画像符号化回路33は、減算部65、直交変換部66、量子化部67、エントロピー符号化部68、逆量子化部69、逆直交変換部70、加算部71、ループフィルタ72、フレームメモリ73、イントラ予測部74、動き検出部75、インター予測部76及びスイッチ77を備えている。
上述したように、減算部65は、入力される動画像データから予測画像データを減算した差分データを直交変換部66に出力する。直交変換部66は、マクロブロック毎に離散コサイン変換(DCT)などの直交変換を行い、入力される差分データを周波数成分に変換し、量子化部67へ与える。量子化部67は、変換された周波数成分データを量子化する。量子化部67において量子化した動画像データは、エントロピー符号化部68及び逆量子化部69へ出力される。
エントロピー符号化部68は、量子化した画像データを可変長符号化もしくは算術符号化し、符号化結果としての画像データ(符号化データ)を出力する。逆量子化部69は、量子化部67で量子化した動画像データを逆量子化し、周波数成分に復号化する。逆直交変換部70は、複合化した動画像データを逆直交変換し、予測誤差画像データに復号する。
加算部71は、PピクチャもしくはBピクチャの予測誤差画像データが出力された場合に、予測誤差画像データとインター予測部76からの予測画像データとを加算する。この加算により、フレーム画像が再生成される。
ループフィルタ72は、再生成されたフレーム画像に対するブロック歪みを除去し、該フレームメモリ73に格納する。この画像は、参照画像データとして使用される。
イントラ予測部74は、フレームメモリ73に保存された参照画像データを用いてフレーム内予測処理を行い、予測画像データを生成する。なお、このフレーム内予測処理は、周知であることからその詳細は省略する。
インター予測部75は、フレームメモリ73に保存された参照画像データを用いて、動き検出部76によって検出された動きベクトルに基づいたフレーム間予測処理を行い、予測画像データを生成する。なお、このフレーム間予測処理については、周知であることから、ここでは、その詳細を省略する。
動き検出部76は、入力された動画像データにおける動きベクトルを検出し、検出した動きベクトルをインター予測部75とエントロピー符号化部68へ出力する。この動き検出部76には、動画像データが入力される他、マクロブロック設定部52によって設定されたブロック設定情報が入力される。
動き検出部76は、ブロック設定情報に基づいて入力された動画像データを分割する。そして、動き検出部76は、参照画像データをフレームメモリ73から読み出し、該参照画像データと入力された動画像データとを用いた相関演算を行って動きベクトルを求める。なお、相関演算としては、周知のブロックマッチングが用いられる。動きベクトルを求めた後、動き検出部76は、求めた動きベクトルと使用された参照画像が入力画像に対して前方の画像であるか、後方の画像であるか、その前後の画像であるかを示す参照方向情報をインター予測部75に出力する。この動き検出部76によって検出された動きベクトルを用いて、インター予測部75によるフレーム間予測処理が実行される。
スイッチ77は、マクロブロック単位でフレーム内予測処理、またはフレーム間予測処理のどちらを用いるか選択するための選択部として機能する。イントラ予測部74からの出力とインター予測部75からの出力の一方を選択して、選択された予測画像データを減算器65、加算部71へ出力する。
図6は、動画像撮影の際のデジタルカメラ10の内部の処理の流れを示すフローチャートである。
ステップS101は、動画像を取得する処理である。動画像撮影を行うと、所定時間毎に撮像素子21からアナログの画像信号が出力される。このアナログの画像信号は、AFE回路23及びDFE回路24を経ることにより、デジタルの画像信号に変換され、バッファメモリ31に記憶される。
ステップS102は、画像処理である。画像処理については、周知であることから、ここでは、その詳細を省略する。この画像処理が施された画像データは、バッファメモリ31に記録される。
ステップS103は、オブジェクト検出を行う処理である。CPU41は、バッファメモリ31に記録された画像データを読み出してオブジェクト検出を実行する。このオブジェクト検出によりオブジェクトが検出されることにより、オブジェクト領域に含まれる画素のアドレスデータが内蔵メモリ42に記録される。これにより、例えば人物を被写体とした場合には、人物の顔全体をオブジェクトとして認識する他に、顔を構成する目や口の領域もオブジェクトとして認識される(図2参照)。
ステップS104は、ブロックサイズを設定する処理である。ステップS103の処理によって、画像中のオブジェクトが検出されている。CPU41は、内蔵メモリ42から、画素のアドレスデータを参照して、対応する画像を分割する際に用いるブロックサイズを設定する。
まず、フレーム画像FIを、16×16画素のマクロブロック61に分割する。ステップS103において、オブジェクトとして顔や、目、口が検出された場合、CPUは、顔の境界となる画素のアドレスデータを内蔵メモリ42から読み出す。これにより、顔の境界となる画素61a〜61jが含まれるマクロブロックが特定される。このうち、マクロブロック61〜61jとなる領域(図5で示す領域B1)に対しては、16×16画素ではなく、8×16画素のマクロブロック63に設定する。同様にして、マクロブロック61a〜61d(図5で示す領域B2)に対しては、16×16画素ではなく、16×8画素のマクロブロック64に設定する。
また、顔の内側の領域に対しては、目、口などのオブジェクトが検出されることから、この領域は、オブジェクトが集まっている領域であることから、ブロックサイズを大きくすると、これらオブジェクトに対する動きベクトルを精度良く検出することができない。このため、この領域に対しては、上述した16×16画素、8×16画素或いは16×8画素のいずれのブロックサイズではなく、8×8画素のマクロブロック62が設定される。このようにして、フレーム画像FIを分割するときに用いられるマクロブロックがそれぞれ設定される。
ステップS105は、符号化処理である。この符号化処理は、周知の符号化処理が実行されるため、ここでは詳細を省略する。例えば画像符号化回路33は、フレーム画像に基づいた予測処理を実行する。実行される予測処理がインター予測処理であれば、動き検出部76による動きベクトルの検出処理が実行される。動き検出部76においては、ブロックサイズ設定部52よって設定されたマクロブロックを用いて分割した画像データと、フレームメモリ73に記憶された参照画像データとを用いた相関演算(ブロックマッチング)が実行される。なお、上述したように、動き検出部76においては、分割されたマクロブロックごとに合わせた動き検出が実行される。つまり、オブジェクトが複数検出されれば、検出されたオブジェクトの大きさや他のオブジェクトとの相対位置などに基づいて、マクロブロックの大きさが設定されるので、検出されたオブジェクトに対する動きベクトルを高精度に検出することができる。
また、従来では、予測処理としてインター予測処理を実行する場合、動き検出においては、ブロックサイズを変えながらブロックマッチングを複数回行い、最も評価値の高くなる場合の動きベクトルを検出していることから、動きベクトルを検出する処理の処理時間が長くなる。しかしながら、本実施形態においては、予め画像からオブジェクトを検出し、検出されたオブジェクトに合わせてブロックサイズを設定することで、マクロブロックのブロックサイズを変更する必要はなく、また、動き検出における処理時間を短縮することができる。
また、本実施形態では、フレーム画像から検出されるオブジェクトの大きさに合わせたマクロブロックが用いることで、動き検出を高精度に実行できることから、オブジェクトの領域に対する圧縮率と他の領域に対する圧縮率とを変えなくとも画質の向上を図ることが可能となる。また、フレーム画像をオブジェクトに合わせたブロックサイズで分割することから、マクロブロックのブロックサイズとして、大きいブロックサイズを用いた場合に生じるオブジェクトのボケの発生を抑止することができる。
本実施形態では、マクロブロック設定部52は、オブジェクト領域を異なる3種類のマクロブロックを用いてフレーム画像を分割しているが、これに限定されるものではなく、長手方向が、オブジェクトの長手方向と同一方向となるマクロブロックを用いてもよいし、オブジェクトの長手方向と直交する方向のマクロブロックを用いることも可能である。例えば、例えばX方向を長手方向となるオブジェクト71の場合には、16×8画素のマクロブロック64(図8参照)や8×16画素のマクロブロック63(図9参照)を用いればよい。
例えば圧縮率を高く設定した場合には、フレーム画像FI内の高周波成分がカットされることから、画像中のオブジェクトはボケてしまう。このオブジェクトのボケを効果的に防止する場合には、8×16画素のマクロブロック63を用いずに、16×8画素のマクロブロック64が設定すればよい。また、逆に、Y方向が長手方向となるオブジェクトの場合には、同様の理由から、8×16画素のマクロブロック63を用いればよい。
本実施形態では、画像処理回路32と、画像符号化回路33とを異なる装置として記載しているが、画像符号化回路33の機能を有する画像処理回路32を予め設けることができれば、これらを別々に設ける必要はない。
本実施形態では、マクロブロックのブロックサイズとして、16×16画素、8×8画素、8×16画素、16×8画素の4種類について記載しているが、H.264/AVC規格の場合には、これらブロックサイズの他に、4×4画素、4×8画素、8×4画素のブロックサイズを用いることができる。
本実施形態では、オブジェクト検出にて検出されるオブジェクトとして、人物の顔、目、鼻、口、眉などの顔を構成するパーツとしているが、この他に、自動車、自転車、電車、飛行機、船などの輸送機器の場合が挙げられることから、オブジェクトとしては、人物の顔に限定されるものではない。
本実施形態では、デジタルカメラを例に説明したが、これに限定される必要はなく、例えば、カメラ機能を有する携帯型電話機、携帯型ゲーム端末機などの携帯型端末機に、本発明を用いることが可能である。また、図1のオブジェクト検出部51、マクロブロック設定部52や、図6の画像符号化回路33の機能を備えた画像処理装置や画像符号化装置であってもよい。さらに、図1のオブジェクト検出部51、マクロブロック設定部52や画像符号化回路33の機能をコンピュータに実行させることが可能な符号化プログラムであってもよい。この符号化プログラムは、メモリカード、磁気ディスク、光学ディスクなどの、コンピュータが読み取り可能な記憶媒体に記憶されていることが好ましい。
10…デジタルカメラ、21…撮像素子、31…バッファメモリ、32…画像処理回路、33…画像符号化回路、35…記憶媒体、41…CPU、42…内蔵メモリ、51…オブジェクト検出部、52…マクロブロック設定部、74…イントラ予測部、75…インター予測部、76…動き検出部

Claims (6)

  1. 第1画像に含まれるオブジェクトを検出する検出部と、
    前記検出されたオブジェクトに基づいて、予め設定された異なる複数種類のブロックから、少なくとも前記オブジェクトを含む領域を分割する際に用いるブロックを設定するブロック設定部と、
    前記設定部により設定されたブロックを用いて分割された少なくとも前記オブジェクトを含む領域と、前記第1画像よりも前、又は後に取り込まれる第2画像とを用いて動きベクトルを求めるとともに、求めた動きベクトルを利用して前記第1画像及び前記第2画像間の動き予測を行い、該動き予測における予測誤差を符号化する画像符号化部と、
    を備えたことを特徴とする電子カメラ。
  2. 請求項1に記載の電子カメラにおいて、
    前記設定部は、前記複数種類のブロックから、長手方向が前記オブジェクトの長手方向と同一方向となるブロックを選択することを特徴とする電子カメラ。
  3. 請求項1に記載の電子カメラにおいて、
    前記設定部は、前記複数種類のブロックから、長手方向が前記オブジェクトの長手方向と直交するブロックを選択することを特徴とする電子カメラ。
  4. 請求項1に記載の電子カメラにおいて、
    前記設定部は、前記オブジェクトの輪郭が含まれるブロックと、前記オブジェクトの輪郭よりも内側の領域が含まれるブロックとを、それぞれ異なる種類のブロックから選択することを特徴とする電子カメラ。
  5. 請求項4に記載の電子カメラにおいて、
    前記設定部は、前記オブジェクトの輪郭よりも内側の領域が含まれるブロックとして、前記オブジェクトの輪郭が含まれるブロックのブロックサイズよりも小さいブロックを選択することを特徴とする電子カメラ。
  6. 第1画像に含まれるオブジェクトを検出する検出ステップと、
    前記検出されたオブジェクトに基づいて、予め設定された異なる複数種類のブロックから、少なくとも前記オブジェクトを含む領域を分割する際に用いるブロックを設定する設定ステップと、
    前記設定工程により設定されたブロックを用いて分割された少なくとも前記オブジェクトを含む領域と、前記第1画像よりも前、又は後に取り込まれる第2画像とを用いて動きベクトルを求めるとともに、求めた動きベクトルを利用して前記第1画像及び前記第2画像間の動き予測を行い、該動き予測における予測誤差を符号化する符号化ステップと、
    を備えたことを特徴とする符号化方法。
JP2009081530A 2009-03-30 2009-03-30 電子カメラ及び符号化方法 Withdrawn JP2010233186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009081530A JP2010233186A (ja) 2009-03-30 2009-03-30 電子カメラ及び符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009081530A JP2010233186A (ja) 2009-03-30 2009-03-30 電子カメラ及び符号化方法

Publications (1)

Publication Number Publication Date
JP2010233186A true JP2010233186A (ja) 2010-10-14

Family

ID=43048539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009081530A Withdrawn JP2010233186A (ja) 2009-03-30 2009-03-30 電子カメラ及び符号化方法

Country Status (1)

Country Link
JP (1) JP2010233186A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021193811A (ja) * 2020-01-23 2021-12-23 株式会社ニコン 撮像素子、及び撮像装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021193811A (ja) * 2020-01-23 2021-12-23 株式会社ニコン 撮像素子、及び撮像装置

Similar Documents

Publication Publication Date Title
EP2073531A1 (en) Method and apparatus for creating a combined image
WO2009139123A1 (ja) 画像処理装置およびそれを搭載した撮像装置
JP2007135182A (ja) 撮像装置および撮像方法
JP6149707B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像撮影装置
TWI327026B (en) Image processing device and program
WO2009098741A1 (ja) 撮像装置、集積回路及び撮像方法
JP2019068248A (ja) 画像処理装置、画像処理方法、及びプログラム
JP6083162B2 (ja) 画像処理装置、撮像装置及び画像処理プログラム
JP5044922B2 (ja) 撮像装置及びプログラム
JP5583439B2 (ja) 画像符号化装置及びカメラシステム
US8405745B2 (en) Image processing apparatus, image processing method, and program
KR20100061311A (ko) 촬상장치 및 촬상장치의 제어 방법
JP6231816B2 (ja) 撮像装置およびその制御方法、プログラム並びに記憶媒体
JP4310282B2 (ja) 画像符号化装置および符号化方法
JP2010233186A (ja) 電子カメラ及び符号化方法
US10516896B2 (en) Encoding device, encoding method, and storage medium
US9955135B2 (en) Image processing apparatus, image processing method, and program wherein a RAW image to be subjected to special processing is preferentially subjected to development
JP6152642B2 (ja) 動画像圧縮装置、動画像復号装置およびプログラム
JP5165084B2 (ja) 画像符号化装置
JP2011254393A (ja) 符号化装置、符号化方法及びプログラム
JP5370345B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP5158167B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP2011029690A (ja) 電子カメラ及び画像符号化方法
JP2013175803A (ja) 画像処理装置およびカメラ
JP2013123090A (ja) 画像処理装置、撮像装置およびプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120605