JP2005311502A - 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ - Google Patents
画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ Download PDFInfo
- Publication number
- JP2005311502A JP2005311502A JP2004122896A JP2004122896A JP2005311502A JP 2005311502 A JP2005311502 A JP 2005311502A JP 2004122896 A JP2004122896 A JP 2004122896A JP 2004122896 A JP2004122896 A JP 2004122896A JP 2005311502 A JP2005311502 A JP 2005311502A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image signal
- prediction residual
- encoding
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】画像信号をVBRを適用して符号化するに際し、ビットレートを精度良く制御する。
【解決手段】 変換係数決定部31は、仮想バッファ占有量計算部から入力される仮想バッファ占有量buf(n)に基づき、変換係数k(n)を決定する。乗算部32は、予測残差予想部から入力される予想予測残差PRED(n)に、変換係数決定部31で決定された変換係数k(n)を乗算することにより、n番目の画像を符号化するときの目標符号量BIT_TGT(n)を算出する。本発明は、ディジタルビデオカメラに適用することができる。
【選択図】図4
【解決手段】 変換係数決定部31は、仮想バッファ占有量計算部から入力される仮想バッファ占有量buf(n)に基づき、変換係数k(n)を決定する。乗算部32は、予測残差予想部から入力される予想予測残差PRED(n)に、変換係数決定部31で決定された変換係数k(n)を乗算することにより、n番目の画像を符号化するときの目標符号量BIT_TGT(n)を算出する。本発明は、ディジタルビデオカメラに適用することができる。
【選択図】図4
Description
本発明は、画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラに関し、特に、画像信号を所望のビットレートで圧縮符号化する場合に用いて好適な画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラに関する。
例えば、動画像データをディジタル化して情報記録媒体に記録したり、インタネット等に代表されるネットワークを介して伝送したりする場合、そのデータ量が膨大であることから、動画像データを圧縮符号化することが行われている。動画像データの代表的な符号化方式としては、動き補償予測符号化方式を挙げることができる。
動き補償予測符号化方式の具体的なものとしては、MPEG(Moving picture experts group)符号化方式がある。MPEG方式では、1フレームまたは1フィールドが、16ライン×16画素で構成されるマクロブロックに分割され、このマクロブロック単位で、動き補償予測符号化が行われる。
動き補償予測符号化方式は、画像の時間軸方向の相関を利用する符号化方法であり、参照する画像(参照画像)に対する、符号化対象の画像(被符号化画像)の動きベクトルを検出し、その動きベクトルにしたがって、既に符号化されて復号された参照画像を動き補償することにより、予測画像を生成する。そして、この予測画像に対する、被符号化画像の予測残差を求め、この予測残差と動きベクトルを符号化することにより、動画像の情報量が圧縮される。
動き補償予測符号化方式には、大別して、イントラ符号化と、インター符号化の2種類の符号化方式がある。イントラ符号化では、符号化対象のマクロブロックに関して、被符号化画像の情報がそのまま符号化され、インター符号化では、被符号化画像に時間的に前後する画像を参照画像として、その参照画像から生成される予測画像と、自身の情報との差分が符号化される。
MPEG方式では、各画像が、Iピクチャ(Intra coded picture)、Pピクチャ(Predictive coded picture)、またはBピクチャ(Bidirectionally predictive picture)のうちのいずれかとして符号化される。また、MPEG方式では、GOP(Group of picture)単位で処理が行われる。
被符号化画像を符号化する符号化装置には、復号時においてオーバーフローまたはアンダーフローの発生を抑止するために、仮想的なバッファ(以下、仮想バッファと記述する)が設けられている。この仮想バッファを符号化装置側で考える場合には、符号化によって生じた符号量が符号化のたびに蓄積される一方、所定の転送レートにしたがって減算されていく。符号化装置ではこの仮想バッファの保持する符号量(以下、占有量と記述する)を監視し、仮想バッファの占有量に基づいてビットレートや符号圧縮率を制御することが行われている。
符号圧縮率の制御方法としては、CBR(Constant Bit Rate)とVBR(Variable Bit Rate)が知られている。
CBRを適用した場合、GOP単位でのビットレートが固定されているので、情報記録媒体に最大で何時間分の映像を記録できるかなどの情報を正確に見積もることができる。しかしながら、符号化する画像の複雑さ等に応じて符号量を増減させることができないので効率が悪く、画質的にも良好ではない場合があるという問題がある。
VBRを適用する場合、例えば、仮想バッファの占有量が上昇してきたときには量子化スケールを通常時よりも大きくし、仮想バッファの占有量が下降してきたときには量子化スケールを通常時よりも小さくする方法が知られている。しかしながら、量子化スケールの増減は整数単位でしか行うことができないので、発生符号量は階段状にしか制御ができず、きめ細かい制御が困難であるという問題がある。またこの方法の場合、実際の発生符号量の増減にややおくれて圧縮率の制御が追従するため、画質として必ずしも最適にならない場合が多い。
この問題を解決するため、従来から、実際の符号化に先立ち、符号化しようとする画像の発生符号量を正確に見積もり、見積もり結果に基づいて圧縮率を制御することが行われている。
例えば、発生符号量を正確に見積もるためには、実際の符号化に先立って、圧縮率に関わるパラメータを仮に設定して、符号化を行う方法がある。しかしながら、このような方法を用いると、実際の符号化で必要とされる演算量の倍の演算を行う必要があるので効率が悪いという問題があった。
なお、実際の符号化で必要とされる演算量の倍の演算を行うことなく、画像の予測残差に基づいて発生符号量を見積もることのできる発明が、本出願人により既に提案済である(特許文献1参照)。
ところで、MPEGの一種としての、例えばMPEG2(ISO/IEC13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像および順次走査画像の双方、並びに標準解像度画像および高精細画像を網羅する標準で、プロフェッショナル用途およびコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
MPEG2方式は、主としてテレビジョン放送用に適合する高画質符号化を対象としていたが、MPEG1方式よりも低いビットレート、換言すれば、MPEG1方式よりも高い圧縮率の符号化方式には対応していなかった。
そこで、MPEG1方式よりも高い圧縮率の符号化方式に対するニーズに応えるべくしてMPEG4符号化方式の標準化が行われ、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。
更に、近年、当初テレビ会議用の画像符号化を目的として、H.264(ITU-T Q6/16VCEG)という標準の規格化が進んでいる。H.264は、MPEG2方式やMPEG4方式といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。
また、現在、MPEG4の活動の一環として、このH.264をベースに、H.264ではサポートされない機能も取り入れて、より高い符号化効率を実現する標準化がJVT(Joint Video Team)によって行われている。以下、JVTにより標準化が行われている符号化方式を、JVT CodecまたはH.264|MPEG4-AVC(Advanced Video Coding)と記述する。
動画像を符号化する際、MPEGなどで定められた規格の範囲内の復号化器での安全な復号を保証するために、VBVバッファ(MPEG4-AVCではCPBバッファ)とよばれる仮想バッファを符号化器内に設置し、この仮想バッファの占有量を監視しながら発生符号量の調整をする必要がある。
上記の具体例として、仮想バッファの占有量を監視し、今から符号化するピクチャの最大サイズを制限することで、発生符号量が多くなりすぎるのを抑止しようとする技術が従来よりあった。この方式をもちいると、仮想バッファの占有量が大きくなって来ると突然ピクチャの最大サイズが制限されるため、画質に与える影響も少なくなかった。
一方、VBRでの符号化を行っている場合、ある程度以上のレートになったらCBRとして動作させ、その上限レートを制限することで仮想バッファの占有量が上がらないようにする技術が従来よりあった。この方式を用いると、仮想バッファにまだ余裕があるにもかかわらずレートが制限されてしまい、画質劣化が無視できなかった。
本発明はこのような状況に鑑みてなされたものであり、あらかじめCBRの上限レートを設定しなくても規格に準拠した復号化装置での安全な復号の保証が可能であって、かつ、VBRで符号化できるため画質劣化と符号化効率の悪化を最小に抑えられるようにすることを目的とする。
本発明の画像信号処理装置は、設定された目標符号量に従い、動画を構成する画像に対応する画像信号を圧縮符号化する符号化手段と、符号化手段によって発生された符号量を監視するためのバッファの占有量を検出する検出手段と、検出手段によって検出された占有量に基づいて変換係数を決定する決定手段と、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想手段と、予測残差予想手段によって予想された予想予測残差と、決定手段によって決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定手段とを含むことを特徴とする。
前記バッファは、画像信号処理装置の後段における転送処理、記録処理、または復号処理のうちの少なくとも1つが考慮された仮想バッファであるようにすることができる。
前記設定手段は、可変ビットレート方式を採用し、予測残差予想手段によって予想された予想予測残差と、決定手段によって決定された変換係数との乗算結果を、画像に対応する画像信号を圧縮符号化するときの目標符号量に設定するようにすることができる。
前記決定手段は、占有量を、占有量と変換係数との対応関係を示す関数に代入して、変換係数を決定するようにすることができる。
占有量と変換係数との対応関係を示す前記関数は、指数を用いた関数とすることができる。
前記設定手段は、可変ビットレート方式を採用し、予測残差予想手段によって予想された予想予測残差と、決定手段によって決定された変換係数とを変数とする関数を用いて、画像に対応する画像信号を圧縮符号化するときの目標符号量に設定するようにすることができる。
前記所定の符号化方式は、MPEG方式とすることができる。
前記所定の符号化方式は、MPEG4-AVC方式とすることができる。
本発明の画像信号処理方法は、設定された目標符号量に従い、動画を構成する画像に対応する画像信号を圧縮符号化する符号化ステップと、符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップと、検出ステップの処理で検出された占有量に基づいて変換係数を決定する決定ステップと、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップと、予測残差予想ステップの処理で予想された予想予測残差と、決定ステップの処理で決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定ステップとを含むことを特徴とする。
本発明の記録媒体のプログラムは、設定された目標符号量に従い、動画を構成する画像に対応する画像信号を圧縮符号化する符号化ステップと、符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップと、検出ステップの処理で検出された占有量に基づいて変換係数を決定する決定ステップと、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップと、予測残差予想ステップの処理で予想された予想予測残差と、決定ステップの処理で決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定ステップとを含むことを特徴とする。
本発明のプログラムは、設定された目標符号量に従い、動画を構成する画像に対応する画像信号を圧縮符号化する符号化ステップと、符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップと、検出ステップの処理で検出された占有量に基づいて変換係数を決定する決定ステップと、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップと、予測残差予想ステップの処理で予想された予想予測残差と、決定ステップの処理で決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定ステップとを含む処理をコンピュータに実行させることを特徴とする。
本発明のビデオカメラは、被写体の動画を撮影し、画像信号を生成する撮影手段と、設定された目標符号量に従い、撮影手段によって撮影された動画を構成する画像に対応する画像信号を圧縮符号化する符号化手段と、符号化手段によって発生された符号量を監視するためのバッファの占有量を検出する検出手段と、検出手段によって検出された占有量に基づいて変換係数を決定する決定手段と、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想手段と、予測残差予想手段によって予想された予想予測残差と、決定手段によって決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定手段と、符号化手段によって圧縮符号化された画像信号を情報記録媒体に記録する記録手段とを含むことを特徴とする。
本発明においては、発生された符号量を監視するためのバッファの占有量が検出され、検出された占有量に基づいて変換係数が決定される。また、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差が予想され、予想された予想予測残差と、決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量が設定される。さらに、設定された目標符号量に従い、動画を構成する画像に対応する画像信号が圧縮符号化される。
本発明によれば、あらかじめCBRを用いる上限レートを設定しなくても所定の規格内の復号化器での安全な復号の保証が可能であって、かつ仮想バッファを生かすVBR形式で符号化でき、また発生符号量の多寡に高速に追従する制御を行うことができる。
以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加されたりする発明の存在を否定するものではない。
請求項1に記載の画像信号処理装置(例えば、図1の画像信号処理装置1)は、設定された目標符号量に従い、動画を構成する画像に対応する画像信号を圧縮符号化する符号化手段(例えば、図1の符号化部5)と、符号化手段によって発生された符号量を監視するためのバッファ(例えば、仮想バッファ)の占有量を検出する検出手段(例えば、図1の仮想バッファ占有量計算部6)と、検出手段によって検出された占有量に基づいて変換係数(例えば、変換係数k)を決定する決定手段(例えば、図4の変換係数決定部31)と、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想手段(例えば、図1の予測残差予想部3)と、予測残差予想手段によって予想された予想予測残差と、決定手段によって決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定手段(例えば、図4の乗算部32)とを含むことを特徴とする。
請求項9に記載の画像信号処理方法は、設定された目標符号量に従い、動画を構成する画像に対応する画像信号を圧縮符号化する符号化ステップ(例えば、図6のステップS4)と、符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップ(例えば、図6の仮想バッファ占有量計算部6による図9のステップS31)と、検出ステップの処理で検出された占有量に基づいて変換係数を決定する決定ステップ(例えば、図4の変換係数決定部31による図9のステップS31)と、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップ(例えば、図6のステップS2)と、予測残差予想ステップの処理で予想された予想予測残差と、決定ステップの処理で決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定ステップ(例えば、図9のステップS32)とを含むことを特徴とする。
請求項12に記載のビデオカメラ(例えば、図10のディジタルビデオカメラ200)は、被写体の動画を撮影し、画像信号を生成する撮影手段(例えば、図10のカメラ部201)と、設定された目標符号量に従い、撮影手段によって撮影された動画を構成する画像に対応する画像信号を圧縮符号化する符号化手段(例えば、図1の符号化部5)と、符号化手段によって発生された符号量を監視するためのバッファの占有量を検出する検出手段(例えば、図1の仮想バッファ占有量計算部6)と、検出手段によって検出された占有量に基づいて変換係数を決定する決定手段(例えば、図4の変換係数決定部31)と、画像に対応する画像信号が圧縮符号化される前に、画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想手段(例えば、図1の予測残差予想部3)と、予測残差予想手段によって予想された予想予測残差と、決定手段によって決定された変換係数とに基づき、画像に対応する画像信号を圧縮符号化するときの目標符号量を設定する設定手段(例えば、図4の乗算部32)と、符号化手段によって圧縮符号化された画像信号を情報記録媒体に記録する記録手段(例えば、図10の媒体I/F204)とを含むことを特徴とする。
なお、本発明の記録媒体に記録されているプログラム、および本発明のプログラムの請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係は、上述した本発明の画像信号情報処理方法のものと同様であるので、その記載は省略する。
以下、本発明の一実施の形態について説明する。図1は、本発明を適用した画像信号処理装置の構成例を示している。この画像信号処理装置1は、入力される動画像信号(以下、被符号化画像信号と記述する)を圧縮符号化して、被符号化画像信号よりもデータ量やビットレートの小さな符号化画像信号を生成するものであり、擬似予測残差生成部2、予測残差予想部3、目標符号量決定部4、符号化部5、および仮想バッファ占有量計算部6から構成される。
擬似予測残差生成部2は、入力される被符号化画像信号に基づき、後段の符号化部5において被符号化画像信号が実際に符号化されるときに算出される予測残差SADの擬似的な値(以下、擬似予測残差BDと記述する)を算出して予測残差予想部3に出力する。以下、n番目の画像(フレーム画像またはフィールド画像)の被符号化画像信号に対応する擬似予測残差をBD(n)と記述する。
予測残差予想部3は、擬似予測残差生成部2から入力された、n番目の画像に対応する擬似予測残差BD(n)を、n−1番目以前の画像の被符号化画像信号に対応する擬似予測残差BD(n-1-S)および予測残差SAD(n-1-S)(Sは0以上の正数)に基づいて補正し、その補正結果として得られた予想予測残差PRED(n)を目標符号量決定部4に出力する。
目標符号量決定部4は、予測残差予想部3から入力された予想予測残差PRED(n)、および仮想バッファ占有量計算部6で計算されたn番目の画像が符号化される直前の仮想バッファ占有量buf(n)に基づき、VBR(Variable Bit Rate)を適用して、n番目の画像を符号化するときに場合における目標符号量BIT_TGT(n)を決定し、符号化部5に出力する。なお、VBRを適用したことにより、限界レート付近でも仮想バッファの許す範囲内でVBRに近い特性で動作できるため、画質が急激に変動することを抑止できる。
符号化部5は、動き補償予測符号化方式を適用した、例えば、MPEG2方式、MPEG4方式、MPEG4-AVC方式等の符号化装置であり、入力された被符号化画像信号を、発生符号量が目標符号量決定部4から入力される目標符号量BIT_TGTに近づくように圧縮符号化し、符号化画像信号を生成する。また、符号化部5は、圧縮符号化の処理過程で算出した実際の予測残差SADを予測残差予想部3に出力する。さらに、符号化部5は、n番目の画像を符号化したときの符号化画像信号の符号量(以下、発生符号量BIT(n))を仮想バッファ占有量計算部6に出力する。
仮想バッファ占有量計算部6は、符号化部5から入力される発生符号量BITに基づき、符号化部5に設けられている符号化信号が復号される際にオーバーフローやアンダーフローが発生しないように発生符号量を制御するための仮想バッファの占有量buf(n)を算出して、目標符号量決定部4に出力する。なお、符号化部5に設けられている仮想バッファは、MPEG2ではVBVバッファ、MPEG4-AVCではCPBバッファと称されている復号化器側の仮想モデルを、等価的に符号化器側で考えた場合のバッファ(いわゆる、エンコーダバッファ)を指す。
仮想バッファ占有量計算部6によるn番目の画像を符号化するときの仮想バッファ占有量buf(n)の算出は、現状の仮想バッファ占有量buf(n-1)に、n−1番目の画像を符号化したときの発生符号量BIT(n-1)を加算する処理と、現状の仮想バッファ占有量buf(n-1)から、画像の再生間隔(例えばフレーム画像の場合、1/30秒間)毎、符号化部5の後段の記録装置または復号装置(いずれも不図示)に転送する符号量(通常は固定値)を減算するステップにより行われる。ただし、仮想バッファ占有量buf(n)の算出は、上述したステップによるもの以外であっても構わない。
図2は、擬似予測残差生成部2の構成例を示している。図2の構成例において、イントラ予測部11は、入力された被符号化画像信号をフレーム内予測を適用してエンコードし、それをデコードしてイントラ予測画像を生成し、差分器13に出力する。インター予測部12は、入力された被符号化画像信号にフレーム間予測を適用してエンコードし、それをデコードしてインター予測画像を生成し、差分器14に出力する。なお、イントラ予測部11およびインター予測部12は、例えば、MPEG2方式やMPEG4方式、MPEG4-AVC方式等が適用される符号化部5に内蔵されたイントラ予測部およびインター予測部(いずれも不図示)のように、数多くの複数の予測モードを備えたものと同等の精度である必要はなく、より少ない予測モードで簡易的にイントラ予測画像あるいはインター予測画像を生成できればよい。
差分器13は、イントラ予測部11によって生成されたイントラ予測画像とそれに対応する被符号化画像信号の画像(すなわち、当該イントラ予測画像の元となった画像)との差分を算出し、その結果をイントラ予測残差として比較部15に出力する。差分器14は、インター予測部12によって生成されたインター予測画像とそれに対応する被符号化画像信号の画像(すなわち、当該インター予測画像の元となった画像)との差分を算出し、その結果をインター予測残差として比較部15に出力する。比較部15は、差分器13から入力されたイントラ予測残差と差分器14から入力されたインター予測残差とをマクロブロック毎に比較し、その値の小さい方を擬似予測残差BDに採用して後段の予測残差予想部3に出力する。なおここでの比較はマクロブロックの単位に限定することなく、被符号化画像を任意の単位で分割した領域ごとに行ってもよい。
図3は、予測残差予想部3の構成例を示している。図3の構成例において、擬似予測残差生成部2からのn(n=1,2,…)番目の画像に対応する擬似予測残差BD(n)は、予測残差計算部21および遅延部22に入力される。予測残差計算部21は、次式(1)に示されるように、遅延部22によって1画像分だけ遅延されたn−1番目の画像の被符号化画像信号に対応する擬似予測残差BD(n-1)と、符号化部5によって実際に計算されたn−1番目の画像の被符号化画像信号に対応する予測残差SAD(n-1)との差に調整係数Gを乗算した値G(SAD(n-1)−BD(n-1))を、擬似予測残差生成部2から入力されたn番目の画像に対応する擬似予測残差BD(n)に加算することにより、n番目の画像の被符号化画像信号に対応する予想予測残差PRED(n)を算出する。なお、調整係数Gは、1以下の正数であり、例えば0.9とする。
PRED(n)=BD(n)+G(SAD(n-1)−BD(n-1)) …(1)
PRED(n)=BD(n)+G(SAD(n-1)−BD(n-1)) …(1)
なお、n−1番目の画像の被符号化画像信号に対応する擬似予測残差BD(n-1)と予測残差SAD(n-1)との代わりに、n−1番目以前の、例えばn−2番目の画像の被符号化画像信号に対応する擬似予測残差BD(n-2)と予測残差SAD(n-2)とを用いるようにしてもよい。
図4は、目標符号量決定部4の構成例を示している。図4の構成例において、変換係数決定部31は、仮想バッファ占有量計算部6から入力される、n番目の画像に対応する被符号化画像信号を符号化する直前の仮想バッファ占有量buf(n)に基づき、変換係数k(n)を決定する。乗算部32は、次式(2)に示すように、予測残差予想部3から入力される予想予測残差PRED(n)に、変換係数決定部31で決定された変換係数k(n)を乗算することにより、n番目の画像に対応する被符号化画像信号を符号化するときの目標符号量BIT_TGT(n)を算出する。
BIT_TGT(n)=k(n)・PRED(n) …(2)
BIT_TGT(n)=k(n)・PRED(n) …(2)
変換係数決定部31では、具体的には、例えば、図5に示すような、仮想バッファ占有量buf(n)と変換係数kとの対応関係を示す関数や対応テーブルを用いて、仮想バッファ占有量buf(n) に対応する変換係数k(n)を決定する。なお、図5の横軸は仮想バッファ占有量buf(n)を示し、縦軸は変換係数kを示している。両者の対応関係を示す曲線41は、仮想バッファ占有量buf(n)が0のとき、変換係数kが基準値(最大値)となり、仮想バッファ占有量buf(n)が最大値のとき、変換係数kが最小値となって、且つ、仮想バッファ占有量buf(n)が増加したときに、変換係数kが減少するようになされており、例えば次式(3)に示すような指数を用いた関数ことができる。
m=( a^(MAX_CPB / 1000000) - 1 ) / k(0)
k(n)=(-1 / m)×( a^(buf(n) / 1000000) - 1 ) + k(0) …(3)
m=( a^(MAX_CPB / 1000000) - 1 ) / k(0)
k(n)=(-1 / m)×( a^(buf(n) / 1000000) - 1 ) + k(0) …(3)
ここで、MAX_CPBはVBVバッファ(MPEG2のとき)、またはCPBバッファ(MPEG4-AVCのとき)の最大サイズであり、使用する圧縮方式のプロファイルに定められている値に設定する。なお、ここに代入する際の単位はビット(bits)である。もちろん、意図的にこのMAX_CPBの値を規格で定められた値からずらし、動作を調整してもよい。aは曲線41の曲がりの程度を調整するための値であり、例えばa=1.4とする。式(3)に示されたように、指数関数を用いれば、仮想バッファ占有量buf(n)が小さいうちは変換係数kを比較的大きな値に維持することができるので、目標符号量BIT_TGTが比較的大きな値となって画質の劣化を抑止することができる。また、仮想バッファ占有量buf(n)が最大値に近づくほど変換係数kを急激に減少させることができるので、目標符号量BIT_TGTが比較的小さな値となってなるべく画質を落とさないように発生符号量を抑えることができる。ただし、指数関数以外の関数を用いるようにしても構わない。
このように、実際の符号化に先立って、予想予測残差PREDに基づいて変換係数kを調節することができるので、フィードフォワード動作となり、レスポンスが早く、シーケンスの動的な変化やシーンチェンジに追従し易い特性を持たせることができる。
なお、符号化する画像のピクチャタイプごとに仮想バッファ占有量buf(n)の値が大きく変動して使い難い場合には、次式(4)に示すように、仮想バッファ占有量buf(n)にフィルタ処理を施したbuf(n)'を用いればよい。
buf(n)'=(1−b)・buf(n)'+b・buf(n) …(4)
ここで、bはフィルタ処理の利き具合を調整する0以上1以下の任意の値である。なお、式(4)に示されたフィルタ処理以外のフィルタ処理を採用してもよい。
buf(n)'=(1−b)・buf(n)'+b・buf(n) …(4)
ここで、bはフィルタ処理の利き具合を調整する0以上1以下の任意の値である。なお、式(4)に示されたフィルタ処理以外のフィルタ処理を採用してもよい。
ところで、式(2)は、「発生符号量は予測残差に比例する」という仮定に基づいたもっとも簡単な例を示したものであるが、例えば「発生符号量は予測残差の関数である」という考えに基づいてさらに一般化すれば、式(2)、式(3)の代わりに次式(5)に示すような、仮想バッファ占有量buf(n)と予想予測残差PRED(n)とをパラメータ変数とする関数fを用いることもできる。この関数内部で仮想バッファ占有量buf(n)の値によって予想予測残差PRED(n)から目標符号量BIT_TGT(n)を算出する場合の特性が最適に変化するようにしておけば、目標符号量BIT_TGT(n)を仮想バッファ占有量buf(n)の値に応じてさらに最適に算出することも可能である。
BIT_TGT(n)=f(buf(n), PRED(n)) …(5)
BIT_TGT(n)=f(buf(n), PRED(n)) …(5)
次に、画像信号処理装置1による、n番目の画像に対応する被符号化画像信号を圧縮符号化する画像圧縮処理について、図6のフローチャートを参照して説明する。
ステップS1において、擬似予測残差生成部2は、入力されたn番目の画像に対応する被符号化画像信号に基づき、n番目の画像に対応する擬似予測残差BD(n)を算出して予測残差予想部3に出力する。このステップS1の処理について、図7のフローチャートを参照して詳述する。
ステップS11において、イントラ予測部11は、入力されたn番目の画像の被符号化画像信号に対し、フレーム内予測を適用してエンコードし、それをデコードしてイントラ予測画像を生成し、差分器13に出力する。これと同時に、インター予測部12は、入力されたn番目の画像の被符号化画像信号に対し、フレーム間予測を適用してエンコードし、それをデコードしてインター予測画像を生成し、差分器14に出力する。
ステップS12において、差分器13は、イントラ予測部11によって生成されたイントラ予測画像と、その原画であるn番目の画像との差分を算出し、その結果をイントラ予測残差として比較部15に出力する。これと同時に、差分器14は、インター予測部12によって生成されたインター予測画像と、その原画であるn番目の画像との差分を算出し、その結果をインター予測残差として比較部15に出力する。
ステップS13において、比較部15は、差分器13から入力されたイントラ予測残差と差分器14から入力されたインター予測残差とを、画像のマクロブロック毎に比較して、その値の小さい方を擬似予測残差BD(n)に採用して後段の予測残差予想部3に出力する。以上で、ステップS1の処理の詳述を終了する。
図6に戻る。ステップS2において、予測残差予想部3は、擬似予測残差生成部2から入力された、n番目の画像に対応する擬似予測残差BD(n)を、n−1番目の画像の被符号化画像信号に対応する擬似予測残差BD(n-1)と、符号化部5から入力された、n−1番目の画像の被符号化画像信号に対する実際の予測残差SAD(n-1)に基づいて補正し、その補正結果として得られた予想予測残差PRED(n)を目標符号量決定部4に出力する。このステップS2の処理について、図8のフローチャートを参照して詳述する。
ステップS21において、予測残差計算部21は、n−1番目の画像の被符号化画像信号に対する実際の予測残差SAD(n-1)を符号化部5から取得するとともに、n−1番目の画像の被符号化画像信号に対応する擬似予測残差BD(n-1)を遅延部22から取得する。ステップS22において、予測残差計算部21は、n番目の画像に対応する擬似予測残差BD(n)を擬似予測残差生成部2から取得する。
ステップS23において、予測残差計算部21は、式(1)に示されたように、遅延部22によって1画像分だけ遅延されたn−1番目の画像の被符号化画像信号に対応する擬似予測残差BD(n-1)と、符号化部5から入力されているn−1番目の画像の被符号化画像信号に対応する予測残差SAD(n-1)との差に調整係数Gを乗算した値G(SAD(n-1)−BD(n-1))を、擬似予測残差生成部2から入力されたn番目の画像に対応する擬似予測残差BD(n)に加算して、n番目の画像の被符号化画像信号に対応する予想予測残差PRED(n)を算出する。以上で、ステップS2の処理の詳述を終了する。
図6に戻る。ステップS3において、目標符号量決定部4は、予測残差予想部3から入力されたn番目の画像に対応する予想予測残差PRED(n)と、仮想バッファ占有量計算部6によって計算された仮想占有量buf(n)に基づき、n番目の画像に対応する目標符号量BIT_TGT(n)を決定して符号化部5に出力する。ステップS3の処理について、図9のフローチャートを参照して詳述する。
ステップS31において、変換係数決定部31は、仮想バッファ占有量計算部6から入力された、n番目の画像に対応する被符号化画像信号を符号化する直前の仮想バッファ占有量buf(n)を、例えば式(3)に代入して、変換係数k(n)を決定する。ステップS32において、乗算部32は、式(2)に示されたように、予測残差予想部3から入力された予想予測残差PRED(n)に、変換係数決定部31で決定された変換係数k(n)を乗算することにより、n番目の画像に対応する被符号化画像信号を符号化するときの目標符号量BIT_TGT(n)を算出する。以上で、ステップS3の処理の詳述を終了する。
図6に戻る。ステップS4において、符号化部5は、入力されたn番目の画像に対応する被符号化画像信号を、目標符号量決定部4から入力された目標符号量BIT_TGT(n)と発生符号量が近くなるように圧縮符号化し、符号化画像信号を生成する。また、符号化部5は、圧縮符号化の処理過程で算出した実際の予測残差SADを予測残差予想部3に出力し、符号化画像信号に対応する発生符号量BITを仮想バッファ占有量計算部6に出力する。
なお、目標符号量BIT_TGT(n)と発生符号量が近くなるように圧縮符号化する方法については、任意の方法を適用することができる。例えば、MPEG2 TM5 Step2に採用されている、マクロブロック毎に発生符号量を逐一監視して圧縮率を調整し、目標符号量を達成しようとするアルゴリズムを用いて符号化を行う方法を適用することができる。
また例えば、MPEG2 TM5 Step2においてはピクチャタイプ毎に独立して設けられている仮想バッファ(目標とする符号量と発生符号量の差を示すもの)を単一の仮想バッファにまとめて、各ピクチャで共通な単一の仮想バッファが使用される方法等を適用すれば、符号化部5の動作を安定させることができるのでさらに効果的である。なお、この方法については、本出願人が既に提案済であって特開2003-230151号公報として開示されている。
ただし、特開2003-230151号公報では、特にピクチャのグローバルコンプレクシティの比に基づき、異なるピクチャタイプ間における発生ビット量の差を正規化しようとしているが、符号化部5では、予想された予測残差から直接的に目標符号量を算出している。
Iピクチャを符号化する場合、次式(6−1)を用いて仮想バッファ占有量djを算出し、次式(7−1)を用いて、仮想バッファ占有量djを量子化スケールコードQiに変換する。Pピクチャを符号化する場合、次式(6−2)を用いて仮想バッファ占有量djを算出し、次式(7−2)を用いて、仮想バッファ占有量djを量子化スケールコードQpに変換する。Bピクチャを符号化する場合、次式(6−3)を用いて仮想バッファ占有量djを算出し、次式(7−3)を用いて、仮想バッファ占有量djを量子化スケールコードQbに変換する。
dj=d0+B(j−1)−(Ti・(j−1))/MB_COUNT
…(6−1)
dj=d0+(Last_Ibit/Tp)・(B(j−1)−(Tp・(j−1))/MB_COUNT)
…(6−2)
dj=d0+(Last_Ibit/Tb)・(B(j−1)−(Tb・(j−1))/MB_COUNT)
…(6−3)
Qi=dj×QP/r …(7−1)
Qp=dj×QP/r …(7−2)
Qb=dj×QP/r+c …(7−3)
dj=d0+B(j−1)−(Ti・(j−1))/MB_COUNT
…(6−1)
dj=d0+(Last_Ibit/Tp)・(B(j−1)−(Tp・(j−1))/MB_COUNT)
…(6−2)
dj=d0+(Last_Ibit/Tb)・(B(j−1)−(Tb・(j−1))/MB_COUNT)
…(6−3)
Qi=dj×QP/r …(7−1)
Qp=dj×QP/r …(7−2)
Qb=dj×QP/r+c …(7−3)
ただし、d0は、仮想バッファの初期占有量であり、B(j−1)は、符号化する画像のj−1番目のマクロブロックまでの発生符号量の総和であり、Last_Ibitは最後に符号化されたIピクチャの発生符号量であり、Ti,Tp,Tbは、それぞれI,P,Bピクチャの目標符号量であり、MB_COUNTは、符号化する画像のマクロブロック数である。また、QPは、MPEG2 TM5で推奨されている値(具体的には31)であり、rは、リアクションパラメータであり、cは補正値(例えば、2)である。
なお、式(6−2)において(Last_Ibit/Tp)を乗算していること、および式(6−3)において(Last_Ibit/Tb)を乗算していることが、単一の仮想バッファを使用することに対する補正である。また、式(7−3)において、補正値cを加算しているように、ピクチャタイプに応じて符号化時の相対的な重み付けを変更するようにしてもよい。
以上で、n番目の画像に対応する被符号化画像信号が符号化されたことになる。そして、次のn+1番目の画像が存在する場合には、n+1番目の画像に対応する被符号化画像信号に対する画像圧縮処理として、ステップS1以降の処理が行われることになる。以上で、画像圧縮処理の説明を終了する。
以上説明したように、本発明を適用した画像信号処理装置1によれば、符号化部5において発生符号量の上限を設定することなく、仮想バッファの占有量が許す範囲で発生符号量を制限することが可能となる。また、仮想バッファの容量が大きいほど高いレートを実現することが可能となる。したがって、特に、符号化部5がMPEG4-AVCに従うものである場合、その仮想バッファの容量は、MPEG2に従う符号化装置のものに比較して大きいので、比較的高いレートを実現できて画質の低下が抑止される。
なお、符号化画像信号は、仮想バッファの容量が許す限り、符号化部5の後段に設けられる記憶装置や復号装置等によって取り出される最大転送レートを一時的に超えてもよく、予め上限レートが設定された場合に比較して、転送効率が高く、画質も高いものとなる。
また、本発明を適用した画像信号処理装置1によれば、仮想バッファの占有量に対応して目標符号量を決定し、目標符号量に基づいて発生符号量を制御するようにしたので、仮想バッファの占有量に直接対応して量子化スケールを段階的に変化させることに比較し、より連続的でスムーズな細やかな発生符号量の制御が可能となる。さらに、連続的でスムーズな細やかな発生符号量の制御ができるので、I,P,Bピクチャの発生符号量のバランスが崩れ難くなり、よって画質の低下が抑止される。
ところで、本発明は、ディジタルビデオカメラにも適用することができる。図10は、本発明を適用したディジタルビデオカメラの構成例を示している。このディジタルビデオカメラ200は、被写体を撮影して被符号化画像信号を取得し、取得した被符号化画像信号を、上述した画像信号処理装置1と同様に、圧縮符号化して符号化画像信号を生成し、生成した符号化画像信号を記録媒体に記録するものである。
ディジタルビデオカメラ200は、大別すると、カメラ部201、カメラDSP(Digital Signal Processor)202、および制御部205から構成される。さらに、ディジタルビデオカメラ200は、SDRAM(Synchronous Dynamic Random Access Memory)203、媒体インタフェース(I/F)204、操作部206、LCD(Liquid Crystal Display)コントローラ207、LCD208、外部インタフェース(I/F)209、および着脱可能な記録媒体210から構成される。
記録媒体210は、半導体メモリを用いたいわゆるメモリカード、記録可能なDVD(Digital Versatile Disc)や記録可能なCD(Compact Disc)等の光記録媒体、磁気ディスクなどの種々のものを用いるようにすることが考えられるが、本実施の形態においては、記録媒体210として例えばメモリカードを用いるものとして説明する。
カメラ部201は、光学ブロック211、CCD(Charge Coupled Device)212、前処理回路213、光学ブロック用ドライバ214、CCD用ドライバ215、およびタイミング生成回路216から構成される。ここで、光学ブロック211は、レンズ、フォーカス機構、シャッタ機構、絞り(アイリス)機構などを備えたものである。
制御部205は、CPU(Central Processing Unit)251、RAM(Random Access Memory)252、フラッシュROM(Read Only Memory)253、および計時回路254が、システムバス255を介して接続されているマイクロコンピュータであり、ディジタルビデオカメラ200の各部を制御することができるものである。
RAM252は、処理の途中結果を一時記憶する等、主に作業領域として用いられるものである。フラッシュROM253は、CPU251において実行する種々のプログラムや、処理に必要になるデータなどが記憶されたものである。また、計時回路254は、現在年月日、現在曜日、現在時刻を出力することができるものである。
制御部205は、画像の撮影時においては光学ブロック用ドライバ214を制御し、光学ブロック211を動作させるための駆動信号を形成させて光学ブロック211を動作させる。これに対応して、光学ブロック211は、フォーカス機構、シャッタ機構、絞り機構を制御することにより、被写体の光画像を取得して、これをCCD212に集光する。
CCD212は、光学ブロック211からの画像を光電変換して出力するものであり、CCDドライバ215からの駆動信号に応じて動作し、光学ブロック211からの被写体の光画像を取り込むとともに、制御部205によって制御されるタイミング生成回路216からのタイミング信号に基づいて、取り込んだ被写体の画像(画像情報)を電気信号として前処理回路213に供給する。なお、上述のように、タイミング生成回路216は、制御部205からの制御に応じて、所定のタイミングを提供するタイミング信号を形成するものである。また、CCDドライバ215は、タイミング生成回路216からのタイミング信号に基づいて、CCD212に供給する駆動信号を形成するものである。
前処理回路213は、CCD212から入力された電気信号の画像情報に対して、CDS(Correlated Double Sampling)処理を行って、S/Nを良好に保つようにするとともに、AGC(Automatic Gain Control)処理を行って、利得を制御し、そして、A/D(Analog/Digital)変換を行って、ディジタル信号とされた画像データ(以下、被符号化画像信号と記述する)を形成し、カメラDSP202に出力する。
DSP202のAF AE AWB処理部221は、カメラ部201から供給された被符号化画像信号に対して、AF(Auto Focus)、AE(Auto Exposure)、AWB(Auto White Balance)等のカメラ信号処理を施す。圧縮部222は、種々のカメラ信号処理が施された被符号化画像信号を圧縮符号化して符号化画像信号を生成する。なお、圧縮部222は、図1の画像信号処理装置1と同様に構成され、また同様に動作するものであるので、その詳細な説明は省略する。
圧縮部222によって生成された符号化画像信号は、システムバス255、および媒体I/F204を介して記録媒体210に記録される。解凍部223は、操作部206に対するユーザの操作入力に応じて記録媒体210から読み出された符号化画像信号の解凍処理(伸張処理)を行い、解凍後の画像信号を、システムバス255を介してLCDコントローラ207に供給する。LCDコントローラ207は、供給された画像信号をLCD208に適したフォーマットに変換してLCD208に供給する。これにより、記録媒体210に記録されている符号化画像信号に応じた画像が、LCD208の表示画面に表示される。
外部I/F209は、例えば外部のパーソナルコンピュータと接続して、パーソナルコンピュータから符号化画像信号の供給を受けたり、記録媒体210に記録されている符号化画像信号を外部のパーソナルコンピュータ等に供給したりする。また、外部I/F209に通信モジュールを接続することにより、例えば、インタネット等のネットワークに接続して、ネットワークを通じて種々のデータを授受したりする。なお、外部I/F209は、IEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)などの有線用インタフェースとして設けることも可能であるし、光や電波による無線インタフェースとして設けることも可能である。すなわち、外部I/F209は、有線、無線のいずれのインタフェースであってもよい。
ところで、一連の処理は、画像信号処理装置1やディジタルビデオカメラ200のようにハードウェアによって実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図11に示されるように構成された汎用のパーソナルコンピュータ300に、記録媒体等からインストールされる。
図11に示されたパーソナルコンピュータ300は、CPU301を内蔵している。CPU301にはバス304を介して、入出力インタフェース305が接続されている。バス304には、ROM302およびRAM303が接続されている。
入出力インタフェース305には、ユーザが操作コマンドを入力するキーボード、マウス、リモートコントローラなどの入力デバイスよりなる入力部306、映像や音声を出力する出力部307、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部308、インタネットに代表されるネットワークを介して通信処理を実行する通信部309、および記録媒体311に対してデータを読み書きするドライブ310が接続されている。
上述した一連の処理をパーソナルコンピュータ300に実行させるプログラムは、記録媒体311に格納された状態でパーソナルコンピュータに供給され、ドライブ310によって読み出されて記憶部308に内蔵されるハードディスクドライブにインストールされている。記憶部308にインストールされているプログラムは、入力部306に入力されるユーザの操作に対応するCPU301の指令によって、記憶部308からRAM303にロードされて実行される。
なお、本明細書において、プログラムを記述するステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
1 画像信号処理装置, 2 擬似予測残差生成部, 3 予測残差予想部, 4 目標符号量決定部, 5 符号化部, 11 イントラ予測部, 12 インター予測部, 13,14 差分器, 15 比較部, 21 予測残差計算部, 31 変換係数決定部, 32 乗算部, 201 カメラ部, 222 圧縮部, 301 CPU, 311 記録媒体
Claims (12)
- 動画を表示するための画像信号を所定の符号化方式に従って圧縮符号化する画像信号処理装置において、
設定された目標符号量に従い、動画を構成する画像に対応する前記画像信号を圧縮符号化する符号化手段と、
前記符号化手段によって発生された符号量を監視するためのバッファの占有量を検出する検出手段と、
前記検出手段によって検出された前記占有量に基づいて変換係数を決定する決定手段と、
前記画像に対応する画像信号が圧縮符号化される前に、前記画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想手段と、
前記予測残差予想手段によって予想された予想予測残差と、前記決定手段によって決定された前記変換係数とに基づき、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量を設定する設定手段と
を含むことを特徴とする画像信号処理装置。 - 前記バッファは、前記画像信号処理装置の後段における転送処理、記録処理、または復号処理のうちの少なくとも1つが考慮された仮想バッファである
ことを特徴とする請求項1に記載の画像信号処理装置。 - 前記設定手段は、可変ビットレート方式を採用し、前記予測残差予想手段によって予想された前記予想予測残差と、前記決定手段によって決定された前記変換係数との乗算結果を、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量に設定する
ことを特徴とする請求項1に記載の画像信号処理装置。 - 前記決定手段は、前記占有量を、前記占有量と前記変換係数との対応関係を示す関数に代入して、前記変換係数を決定する
ことを特徴とする請求項1に記載の画像信号処理装置。 - 前記占有量と前記変換係数との対応関係を示す前記関数は、指数を用いた関数である
ことを特徴とする請求項4に記載の画像信号処理装置。 - 前記設定手段は、可変ビットレート方式を採用し、前記予測残差予想手段によって予想された前記予想予測残差と、前記決定手段によって決定された前記変換係数とを変数とする関数を用いて、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量に設定する
ことを特徴とする請求項1に記載の画像信号処理装置。 - 前記所定の符号化方式は、MPEG(Moving Picture Experts Group)方式である
ことを特徴とする請求項1に記載の画像信号処理装置。 - 前記所定の符号化方式は、MPEG4-AVC(Advanced Video Coding)方式である
ことを特徴とする請求項1に記載の画像信号処理装置。 - 動画を表示するための画像信号を所定の符号化方式に従って圧縮符号化する画像信号処理方法において、
設定された目標符号量に従い、動画を構成する画像に対応する前記画像信号を圧縮符号化する符号化ステップと、
前記符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップと、
前記検出ステップの処理で検出された前記占有量に基づいて変換係数を決定する決定ステップと、
前記画像に対応する画像信号が圧縮符号化される前に、前記画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップと、
前記予測残差予想ステップの処理で予想された予想予測残差と、前記決定ステップの処理で決定された前記変換係数とに基づき、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量を設定する設定ステップと
を含むことを特徴とする画像信号処理方法。 - 動画を表示するための画像信号を所定の符号化方式に従って圧縮符号化するためのプログラムであって、
設定された目標符号量に従い、動画を構成する画像に対応する前記画像信号を圧縮符号化する符号化ステップと、
前記符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップと、
前記検出ステップの処理で検出された前記占有量に基づいて変換係数を決定する決定ステップと、
前記画像に対応する画像信号が圧縮符号化される前に、前記画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップと、
前記予測残差予想ステップの処理で予想された予想予測残差と、前記決定ステップの処理で決定された前記変換係数とに基づき、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量を設定する設定ステップと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。 - 動画を表示するための画像信号を所定の符号化方式に従って圧縮符号化するためのプログラムであって、
設定された目標符号量に従い、動画を構成する画像に対応する前記画像信号を圧縮符号化する符号化ステップと、
前記符号化ステップの処理で発生された符号量を監視するためのバッファの占有量を検出する検出ステップと、
前記検出ステップの処理で検出された前記占有量に基づいて変換係数を決定する決定ステップと、
前記画像に対応する画像信号が圧縮符号化される前に、前記画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想ステップと、
前記予測残差予想ステップの処理で予想された予想予測残差と、前記決定ステップの処理で決定された前記変換係数とに基づき、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量を設定する設定ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。 - 撮影した動画に対応する画像信号を所定の符号化方式に従って圧縮符号化し、情報記録媒体に記録するビデオカメラにおいて、
被写体の動画を撮影し、前記画像信号を生成する撮影手段と、
設定された目標符号量に従い、前記撮影手段によって撮影された前記動画を構成する画像に対応する前記画像信号を圧縮符号化する符号化手段と、
前記符号化手段によって発生された符号量を監視するためのバッファの占有量を検出する検出手段と、
前記検出手段によって検出された前記占有量に基づいて変換係数を決定する決定手段と、
前記画像に対応する画像信号が圧縮符号化される前に、前記画像に対応する画像信号が圧縮符号化される過程で算出される予測残差を予想する予測残差予想手段と、
前記予測残差予想手段によって予想された予想予測残差と、前記決定手段によって決定された前記変換係数とに基づき、前記画像に対応する画像信号を圧縮符号化するときの前記目標符号量を設定する設定手段と、
前記符号化手段によって圧縮符号化された前記画像信号を前記情報記録媒体に記録する記録手段と
を含むことを特徴とするビデオカメラ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004122896A JP2005311502A (ja) | 2004-04-19 | 2004-04-19 | 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004122896A JP2005311502A (ja) | 2004-04-19 | 2004-04-19 | 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005311502A true JP2005311502A (ja) | 2005-11-04 |
Family
ID=35439799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004122896A Withdrawn JP2005311502A (ja) | 2004-04-19 | 2004-04-19 | 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005311502A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008022405A (ja) * | 2006-07-14 | 2008-01-31 | Sony Corp | 画像処理装置および方法、並びに、プログラム |
-
2004
- 2004-04-19 JP JP2004122896A patent/JP2005311502A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008022405A (ja) * | 2006-07-14 | 2008-01-31 | Sony Corp | 画像処理装置および方法、並びに、プログラム |
US8432964B2 (en) | 2006-07-14 | 2013-04-30 | Sony Corporation | Image processing device, method, and program |
US9077968B2 (en) | 2006-07-14 | 2015-07-07 | Sony Corporation | Image processing apparatus and method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8634458B2 (en) | Image processing apparatus | |
EP1949705B1 (en) | Image signal processing apparatus | |
JP5173409B2 (ja) | 符号化装置および符号化装置を備えた動画像記録システム | |
JP2006352509A (ja) | 画像データ処理装置、画像データ処理方法およびプログラム | |
US8675979B2 (en) | Transcoder, method of transcoding, and digital recorder | |
US8488681B2 (en) | Image capturing apparatus, control method therefor, program, and storage medium | |
JP2000197048A (ja) | 符号化レ―ト制御装置及び情報符号化装置 | |
JP4795223B2 (ja) | 画像処理装置 | |
JP5649296B2 (ja) | 画像符号化装置 | |
US20070253485A1 (en) | Picture Signal Processing Device, Picture Signal Processing Method, Recording Medium, Program, and Video Camera | |
US8116577B2 (en) | Encoding method, encoding device, encoding process program, and recording medium on which encoding process program is recorded | |
JP2005080151A (ja) | 符号化装置および符号化方法、撮像装置および画像処理方法、並びに、プログラム | |
JP2005311502A (ja) | 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ | |
JP2005151344A (ja) | データ処理装置およびその方法と符号化装置 | |
KR100987922B1 (ko) | 선택적 참조영상을 이용한 움직임 보상기법을 적용한 동영상 압축부호화장치및 복호화 장치와 움직임 보상을 위한 선택적 참조영상 결정방법 | |
JP2005303577A (ja) | 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ | |
JP2003023637A (ja) | 画像符号化方法および画像符号化装置 | |
JP4759360B2 (ja) | 画像処理装置 | |
JP2005303578A (ja) | 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ | |
JP4626644B2 (ja) | 符号化装置、符号化方法、プログラム、及び、撮像装置 | |
JP4747109B2 (ja) | 演算量調整装置 | |
JP4765961B2 (ja) | デジタル動画像記録装置 | |
JP2008153946A (ja) | 画像符号化装置 | |
JP2008271336A (ja) | 画像処理装置 | |
JP2006148535A (ja) | 画像信号処理装置および方法、プログラム、並びにビデオカメラ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070703 |