JP4556774B2 - 映像信号処理方法 - Google Patents

映像信号処理方法 Download PDF

Info

Publication number
JP4556774B2
JP4556774B2 JP2005162179A JP2005162179A JP4556774B2 JP 4556774 B2 JP4556774 B2 JP 4556774B2 JP 2005162179 A JP2005162179 A JP 2005162179A JP 2005162179 A JP2005162179 A JP 2005162179A JP 4556774 B2 JP4556774 B2 JP 4556774B2
Authority
JP
Japan
Prior art keywords
frame
ias
intra
picture
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005162179A
Other languages
English (en)
Other versions
JP2006340033A (ja
Inventor
鵬 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005162179A priority Critical patent/JP4556774B2/ja
Publication of JP2006340033A publication Critical patent/JP2006340033A/ja
Application granted granted Critical
Publication of JP4556774B2 publication Critical patent/JP4556774B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、圧縮符号化としてフレーム内符号化とフレーム間符号化とが選択的になされる符号化方法に対して適用される映像信号処理方法に関する。
動画像の符号化として、現フレームの前および/または後のフレームのローカル復号信号と、現フレームとの差分を符号化する動き補償フレーム間予測符号化が知られている。例えばMPEG 2(Moving Picture Experts Group Phase 2)、MPEG-4 AVC(またはH.264)符号
化は、この種の符号化方法である。
例えばMPEG 2においては、ピクチャタイプとして、Iピクチャ(Intra-coded picture:イントラ符号化画像) 、Pピクチャ(Predictive-coded picture :順方向予測符号化画像)、Bピクチャ(Bidirectionally predictive-coded picture :両方向予測符号化画像)が知られている。
Iピクチャ(Intra-coded picture:イントラ符号化画像) は、符号化されるときその画像1枚の中だけで閉じた情報を使用するものである。従って、復号時には、Iピクチャ自身の情報のみで復号できる。
Pピクチャ(Predictive-coded picture :順方向予測符号化画像)は、予測画像(差分をとる基準となる画像)として、時間的に前の既に復号されたIピクチャまたはPピクチャを使用するものである。動き補償された予測画像との差を符号化するか、差分を取らずに符号化するか、効率の良い方をマクロブロック単位で選択する。
Bピクチャ(Bidirectionally predictive-coded picture :両方向予測符号化画像)は、予測画像(差分をとる基準となる画像)として、時間的に前の既に復号されたIピクチャまたはPピクチャ、時間的に後ろの既に復号されたIピクチャまたはPピクチャ、並びにこの両方から作られた補間画像の3種類を使用する。この3種類のそれぞれの動き補償後の差分の符号化と、イントラ符号化の中で、最も効率の良いものをマクロブロック単位で選択する。
従って、マクロブロックタイプとしては、フレーム内符号化(Intra) マクロブロックと、過去から未来を予測する順方向(Forward) フレーム間予測マクロブロックと、未来から過去を予測する逆方向(Backward)フレーム間予測マクロブロックと、前後両方向から予測する両方向マクロブロックとがある。Iピクチャ内の全てのマクロブロックは、フレーム内符号化マクロブロックである。また、Pピクチャ内には、フレーム内符号化マクロブロックと順方向フレーム間予測マクロブロックとが含まれる。Bピクチャ内には、上述した4種類の全てのタイプのマクロブロックが含まれる。
例えば下記の特許文献1には、符号化モードを決定することが記載されている。この特許文献1では、符号化モード決定器において、外部からのピクチャタイプがIピクチャの場合は、符号化モードをフレーム内符号化モードに決定し、ピクチャタイプがPピクチャの場合には、符号化モードをフレーム内符号化モードと順方向予測モードの何れかに決定し、ピクチャタイプがBピクチャの場合には、符号化モードをフレーム内フレームモード、順方向予測モード、逆方向予測モードおよび両方向予測モードの中の何れかに決定することが記載されている。
特開2000−106675号公報
PピクチャおよびBピクチャは、符号化・復号のために他のフレームの情報を必要とする。誤りの伝搬を防止すると共に、ランダムアクセス機能を実現するために、外部からの符号化モード決定器に対して供給されるピクチャタイプとしてフレーム内の情報のみを使用するIピクチャが周期的に挿入されている。以下の記載では、フレーム内符号化をイントラ符号化と称し、フレーム内符号化がなされるピクチャタイプを「イントラピクチャ」と称し、フレーム間符号化をインター符号化と称し、フレーム間符号化がなされるピクチャタイプを「インターピクチャ」と称する。
映像信号のストリーム中にイントラピクチャを配置する方法として、図1に示すような複数の方法が提案されている。下記特許文献2には、シーンチェンジを考慮してイントラピクチャを挿入することが記載されている。
特開平8−98179号公報
図1Aに示す方法は、イントラピクチャを常に固定周期Tで挿入する方法である。この方法では、シーンチェンジが考慮されない。イントラピクチャが0番目フレーム、1番目フレームT、2番目フレーム2T、3番目フレーム3T、・・・に設定される。
図1Bに示す方法は、シーンチェンジを考慮した方法であって、周期T毎のフレーム0,T,2T,・・・と、シーンチェンジを検出したフレームSi(i=0,1,2,・・・)とにイントラピクチャを挿入する。
図1Cは、イントラピクチャが固定周期Tで配置される。シーンチェンジSi(i=0,1,2,・・・)が検出されると、周期Tを計測するカウンタがリセットされる。図1Cに示す例では、0,T,S0,S0+T,S0+2T,・・・,S1,S1+T,・・・にそれぞれイントラピクチャが挿入される。
図1Dは、図1Bに示す方法のように、周期T毎のフレーム0,T,2T,・・・と、シーンチェンジを検出したフレームSi(i=0,1,2,・・・)とにイントラピクチャの挿入位置を設定する。但し、このように設定したイントラピクチャ挿入位置の中で、シーンチェンジの位置に近いイントラピクチャの位置がキャンセルされる。
図1Dの例において、nTおよび(m−1)Tの位置は、キャンセルされ、その近くのシーンチェンジ検出フレームS0およびS1がイントラピクチャの挿入位置に設定される。すなわち、キャンセルするか否かの判定の所定のしきい値をThとすると、|S0−nT|<Thの関係にあるために、nTの位置がキャンセルされ、|S1−(m−1)T|<Thの関係にあるために、(m−1)Tの位置がキャンセルされる。
図1Eは、図1Cに示す方法のように、シーンチェンジが検出されると、周期Tをカウントするカウンタがリセットされ、カウントが再度開始される。このように設定されたイントラピクチャ挿入位置の中で、しきい値Thより間隔が短い場合には、シーンチェンジの検出位置が優先される。図1Eにおいて、|S0−(n−1)T|<Thの関係にあるために、(n−1)Tの位置がキャンセルされ、|S1−(m−1)T|<Thの関係にあるために、(m−1)Tの位置がキャンセルされる。
上述した周期的にイントラピクチャを挿入する方法は、画像がイントラピクチャに適しているか否かの考慮が全くされていない方法であり、符号化の効率が悪い問題がある。また、シーンチェンジを検出する方法は、画像に対する考慮が払われているが、シーンチェンジの発生がイントラ符号化に適しているとは限らない。したがって、シーンチェンジを検出する方法も、符号化の効率が悪い問題がある。例えばビットレートが固定の場合、符号化の効率が悪いことは、復号画像の画質が悪いことを意味する。
したがって、この発明の目的は、符号化効率を向上させ、画質を向上させることが可能な映像信号処理方法を提供することにある。
上述した課題を解決するために、この発明は、ビデオデータに対する符号化方法として、フレーム内符号化とフレーム間符号化の一方が設定可能とされ、ほぼ周期的なフレーム内符号化位置を決定する映像信号処理方法において、
各フレームに関してシーンチェンジを検出するステップと、
シーンチェンジが検出されたフレームをフレーム内符号化位置に設定するステップと、
時間的に前のフレーム内符号化位置に対してデフォルトインターバル後のデフォルト位置を含む連続する複数フレームからなるサーチウインドウを設定するステップと、
サーチウインドウ内の各フレームのビデオデータからスコアIASを演算するステップと、
サーチウインドウ内のスコアIASが最大のフレームをフレーム内符号化位置に設定するステップとからなり、
スコアIASは、IAS1、IAS2およびIAS3から求められ、
IAS1は、現フレームの動きの大きさまたは強度を示す値であり、IAS2は、前フレームと比較した現フレームの動きの大きさを示す値であり、IAS3は、現フレームにお
いて求められた動きベクトルの中で、残差がしきい値より大きい動きベクトルの割合を示す値である映像信号処理方法である。
この発明において、好ましくは、デフォルトインターバル後のデフォルト位置において最大となり、デフォルト位置に対する距離が大きくなるにしたがって小さくなる重み付け係数を乗じた重み付けスコアIASに基づいてフレーム内符号化位置が設定される。
この発明によれば、イントラピクチャのインターバルに関する制限を満たすことができる場合に、R(Rate)−D(Distortion)性能を上げることができる。R−D性能は、横軸にビットレートをとり、縦軸に輝度信号の信号対雑音比をとって、テストシーケンスに対してシミュレーションを行った結果の曲線で表され、シミュレーション結果を評価する特性である。
以下、この発明の一実施形態について図面を参照して説明する。一実施形態では、各フレームについてイントラピクチャ、すなわち、イントラ符号化に適した画像か否かを決定するものである。イントラピクチャは、リフレッシュの目的で周期的に挿入される場合と、イントラ符号化の方が効率が良いために挿入される場合とがある。
周期的にイントラピクチャを挿入する場合に、どの位置にイントラピクチャを配置すべきかは、スコアIAS(Intra Advantage Score)に基づいて決定される。また、スコアI
ASおよび相関値CORに基づいて決定された、周期的でない位置にイントラピクチャが配置される。後者のイントラピクチャの決定は、本実施形態の説明においては、シーンチェンジの検出に基づいてなされるものとして説明されている。
図2は、この発明の一実施形態による映像信号処理装置の構成を示す。参照符号1が処理装置の全体を示す。処理装置1に対してオーサリングツール等のアプリケーション10からインターバル制限情報が供給される。インターバル制限情報は、イントラピクチャの挿入する間隔に関しての制限情報であり、例えば許容される最小および最大の間隔が指定される。オーサリングツールは、テキスト、音声、動画等のデータを編集して一つのソフトウェアを作成するためのツールである。アプリケーション10としては、オーサリングツールに限らず、符号化方式を変換するためのトランスコードツール等の他のものを使用できる。
フレーム毎に区切られた入力ビデオデータVIがフレームバッファ2に蓄積される。フレームバッファ2は、ピクチャタイプを決定するのに必要な時間ビデオデータを遅延させるのに使用される。フレームバッファ2から読み出されたビデオデータがコーディング部3に供給され、符号化される。コーディング部3は、MPEG 2、MPEG-4 AVC(またはH.264)
等の符号化を行う。また、他の符号化でも良い。コーディング部3からの符号化ビデオデータVOが出力データとして取り出される。
フレームバッファ2に対して動き検出部(MEと表す)4がアクセスし、評価値MEIを生成する。動き評価部4は、符号化対象の現フレームを複数の画素からなるブロックに分割し、現フレームの直前の参照フレームの参照ブロックとの間で、対応する位置の画素値の差分が演算され、差分の絶対値が1ブロックにわたって集計され、ブロック集計値が演算される。ブロックマッチングによる動きベクトルの検出方法と同様に、参照ブロックの位置は、所定の範囲内で動かされ、ブロック集計値の最小のものがそのブロックに関する残差とされ、残差を発生するブロックの位置が動きベクトルとして検出される。ブロック残差が1フレーム分合計されることによって評価値MEIが生成される。ブロック残差は、輝度データおよび二つの色差データのそれぞれについて計算され、マクロブロック単位で求められる。
評価値MEIおよび動きベクトルMVがシーンチェンジ検出部5およびピクチャタイプ決定部6に供給される。シーンチェンジ検出部5は、後述するように、評価値MEIおよび動きベクトルMVを使用して求められたスコアIASと、フレームバッファ2に蓄積されている画像情報から求められた相関値CORからシーンチェンジを検出する。検出されたシーンチェンジ情報SCIがピクチャタイプ決定部6およびコーディング部3に供給される。なお、本明細書において、シーンチェンジは、見てシーンが変化する画像の意味よりも、イントラ符号化に適した画像を意味し、シーンチェンジ検出部5は、第2のまたは他のイントラ決定部としての機能を有する。但し、シーンチェンジの検出方法としては、フレームの状態遷移を見る方法等の種々の方法を使用できる。
第1のピクチャタイプ決定部6は、評価値MEIと動きベクトルMVとシーンチェンジ情報SCIに基づいてイントラピクチャを決定する。アプリケーション10からのインターバル制限情報例えばインターバルの最小値および最大値がピクチャタイプ決定部6に供給され、インターバル制限を満たす範囲でイントラピクチャが決定される。イントラピクチャ情報NIがインターピクチャを決定する第2のピクチャタイプ決定部7およびコーディング部3に供給される。
ピクチャタイプ決定部7は、イントラピクチャ情報NIに基づいてインターピクチャタイプ、すなわち、他のフレームを参照して符号化するピクチャタイプ例えばMPEG 2におけるPピクチャタイプまたはBピクチャタイプを決定する。一例として、イントラピクチャ例えばIピクチャの後の次に決定されるIピクチャまでの間に、表示画像の順序で(BBPBBPBBPBBPBB)の14ピクチャが続くように、インターピクチャが決定される。ピクチャタイプ決定部7からのインターピクチャ情報NRがコーディング部3に供給される。
コーディング部3は、フレームバッファ2からのビデオデータを符号化する。シーンチェンジ情報SCI、イントラピクチャ情報NIおよびインターピクチャ情報NRを使用してピクチャタイプが決定される。前述したように、イントラピクチャの場合では、マクロブロックの種類がイントラ符号化マクロブロックのみであるが、インターピクチャのPピクチャおよびBピクチャの場合では、複数のマクロブロックのタイプが存在するので、ピクチャタイプ決定部7は、インターピクチャに関してマクロブロックのタイプを決定する。
コーディング部3は、MPEG 2の例では、図3に示す構成を有している。図3において、参照符号31がフレームバッファ2からのビデオデータが入力される端子を示す。入力ビデオデータがフレームメモリ32に蓄積される。フレームメモリ32に蓄積されたビデオデータを使用して動き検出部33がブロックマッチングによって動きベクトルを検出する。動きベクトルが動き補償部43に供給される。
フレームメモリ32からのオリジナルピクチャの画素データと動き補償部43からのローカル復号画像の画素データとが減算器34にて減算され、画素の差分値が計算される。フレームメモリ32の出力データが入力端子aに供給され、減算器34の出力データが入力端子bに供給されるスイッチ部SW1が設けられている。
スイッチ部SW1は、ピクチャタイプ決定部6および7の出力NIおよびNRによって制御される。イントラピクチャの場合では、スイッチ部SW1が常に入力端子aを選択する状態とされる。インターピクチャの場合では、マクロブロック単位でスイッチ部SW1が入力端子aおよびbの一方を選択する。
スイッチ部SW1で選択されたビデオデータまたは差分データがDCT(Discrete Cosine Transform:離散コサイン変換)部35に供給される。DCT部35において発生した
DCT係数データが量子化部36に供給される。量子化部36において量子化されたデータがジグザクスキャンでもって可変長符号化部37に対して出力され、ハフマン符号化がなされる。可変長符号化部37の出力が出力端子38に取り出される。図示しないが、出力データは、バッファリング部に供給され、出力データのレートがほぼ一定となるように、量子化部36の量子化ステップが制御される。
量子化部36の出力データが逆量子化部39を介して逆DCT部40に供給される。逆DCT部40の出力データが加算器41に供給され、加算器41の出力データがフレームメモリ42に蓄積される。フレームメモリ42の出力データが動き補償部43に供給される。動き補償部43の出力データが減算器34に供給されると共に、スイッチ部SW2を介して加算器41に供給される。
逆量子化部39、逆DCT部40、加算器41、フレームメモリ42および動き補償部43は、ローカル復号装置を構成し、動き補償部43の出力にローカル復号データが得られる。スイッチ部SW2は、ピクチャタイプ決定部6からの出力NIによって、イントラ符号化の場合には、オフとされ、インター符号化の場合にオンとされる。
なお、図3に示されるコーディング部3は、一例であって、図示以外の他の構成も可能である。また、MPEG 2の符号化のコーディング部に限らず、MPEG-4 AVC(またはH.264)符
号化を行うコーディング部に対してもこの発明を適用できる。
この発明の一実施形態におけるスコアIASについて説明する。IASは、次式で示される3個の部分からなる値である。
IAS=f(IAS1,IAS2,IAS3) (1)
関数fの一例は、下記に示す係数α,β,γを使用した重み付け加算である。例えばα+β+γ=1の関係とされている。各係数は、アプリケーション等に応じて設定されている。IASの値が大きいピクチャほど、イントラ符号化に適したピクチャと判断される。
IAS=α・IAS1+β・IAS2+γ・IAS3 (2)
IAS1は、現フレームの動きの大きさまたは動きの強度であり、例えば下記の式(3
)によって計算される。
IAS1=max(min(1,SADi /SMADi),0) (3)
式(3)において、min()は、()内の値の小さい方を選択することを意味し、max()は、()内の値の大きい方を選択することを意味する。SMADでSADを割り算するのは、SADの正規化のためである。動きの大きさとSADの間には、強い関係が存在する。
残差の絶対値和SAD(Sum Absolute Difference)は、下記の式(4)で計算される値
である。SADは、イントラ符号化が適しているか否かを示す画像の差分情報量を示す。
Figure 0004556774
式(4)において、Ri,jは、それぞれ動き補償のみで復元された復元画像の画素であ
り、Qi,jは、オリジナル画像の画素(i,j) のレベルである。集計される範囲を規定する
iおよびjは、フレーム内の水平方向の画素番号および垂直方向の画素番号に対応する値である。IAS1が大きいことは、動きが大きいフレームを意味するので、そのフレーム
は、インター符号化に不向きなことを意味している。
残差の平均絶対値和SMAD(Sum Mean Absolute Difference)は、下記の式(5)で計算される値である。集計される範囲を規定するiおよびjは、フレーム内の水平方向の画素数および垂直方向の画素数に対応する値である。SMADが大きい場合には、SADも大きくなるので、SADをSMADによって正規化している。一実施形態では、SADおよびSMADが評価値MEIに含まれ、また、オリジナル画像の現フレームと直前のフレームとの差分が演算される。
Figure 0004556774
式(5)において、μi,jは、下記の式(6)で表されるブロック内画素の平均値であ
る。
Figure 0004556774
式(6)において、集計される範囲を規定するxおよびyは、画素(i,j) が含まれるブロックの水平方向の画素番号および垂直方向の画素番号に対応する値である。ブロックサイズは、(4×4)(8×8)等に設定される。
IAS2は、前フレームと比較した動きの大きさであり、例えば下記の式(7)によっ
て計算され、前フレームと比較して動きが大きい場合には、大きな値となる。このようにフレーム間で動きが大きく変化するフレームは、インター符号化に適していない、すなわち、イントラ符号化に適していることを意味する。
IAS2=max(min(3,SADi /SADi-1),0) (7)
式(7)において、min()は、()内の値の小さい方を選択することを意味し、max()は、()内の値の大きい方を選択することを意味する。動きの強さの比とSADの比との間には、強い関係が存在する。
IAS3は、動き検出のアンマッチングレシオであり、例えば下記の式(8)によって
計算される。
IAS3=max(min(1,NumUnMatchingMV1/NumUnMatchingMVThreshold),0)
・・・(8)
式(8)において、NumUnMatchingMV1は、現フレームにおいて求められた動きベクトルの内で、残差がしきい値であるUnMatchingMVThresholdよりも大きい動きベクトルの
個数である。動きベクトルは、マクロブロック単位で求められる。ブロックマッチングで動きベクトルを求める場合、差分値の最小値が残差として検出される。残差をしきい値UnMatchingMVThresholdと比較して、しきい値より大きいマクロブロック数がumUnMatchingMV1である。NumUnMatchingMVThresholdおよびUnMatchingMVThresholdは、フレー
ムサイズと関係した所定の数である。IAS3が大きいことは、イントラ符号化が適して
いることを意味する。
イントラピクチャタイプを決定するピクチャタイプ決定部6の処理を図4のフローチャートを参照して説明する。最初のステップST1において、サーチウインドウサイズが計算される。 サーチウインドウサイズは、アプリケーション10からのインターバル制限
の情報と、フレームバッファ2の容量に基づいて計算される。
ステップST2において、サーチウインドウサイズとデフォルトのイントラピクチャ位置とに基づいてサーチウインドウの境界が計算される。サーチウインドウによって、可能なイントラピクチャの範囲が設定される。サーチウインドウサイズは、一例として、(サーチウインドウサイズ=デフォルトのイントラ間隔)で計算される。
ステップST3において、二つの変数が初期値に設定される。すなわち、処理の開始のフレームの番号を0とした場合に、変数iBestIASおよびiBestフレームがそれぞれ−1で
あると初期設定される。 ステップST4において、サーチウインドウ内の各フレームF
(i)に関する処理が開始する。−1では、一列の数(>0)中で最大値を探す場合、初期値を設定する(実は、−2,−3,・・・全部できる)。iBestフレームは、設定しな
くても良い。
ステップST5において、フレームF(i)がシーンチェンジSCであるか否かが判定される。例えばシーンチェンジが発生したフレームがシーンチェンジSCとされる。シーンチェンジの場合には、ステップST6において、フレームF(i)がイントラピクチャとして設定され、処理が終了する。
ステップST5において、フレームF(i)がシーンチェンジSCでないと判定されると、ステップST7において、スコアIAS(i)が計算される。ステップST8において、フレームF(i)とデフォルトイントラピクチャ位置との距離d(i)が計算される。デフォルトイントラピクチャ位置が前に決定されたイントラピクチャ位置からデフォルトフレームインターバルN0フレーム後とされる。例えばN0=15である。この例では、i=14であれば、d(14)=−1であり、i=16であれば、d(16)=+1である。ステップST9において、計算されたIAS(i)と距離d(i)に応じて重み付けがなされた評価値W-IAS(i)が計算される。
ステップST10において、W-IAS(i)およびiBestIASが比較される。iBestIASは、そのフレームの前のフレームまでの処理で求められた最大のIASの値である。W-IAS(i)がiBestIASより大きい場合には、ステップST11において、iBestIASがW-IAS(i)とされ、iBestフレームがiとされる。そして、ステップST12において、そのフレームの処理が
終了する。若し、ステップST10において、W-IAS(i)がiBestIAS以下と判定されると、ステップST12に処理が移る。
サーチウインドウ内の各フレームに関して、ステップST4〜ST12までの処理を行った結果、iBestフレームのフレームF(i)がイントラピクチャとして設定される。
図5は、この発明の一実施形態によるイントラピクチャを決定する処理の一例を示す。横軸が時間を示し、横軸上に付加されている垂直線がフレームバッファ内のフレームを表す。サーチウインドウの範囲がデフォルトイントラフレーム位置に対して±4フレームとされている。各フレーム位置に対して付加されている数字は、ピクチャタイプ決定部6において計算された重み付けIAS(W-IAS(i))の一例である。図5の例は、シーンチェンジが発生しない例である。なお、デフォルトイントラ位置に対して前後に等しい幅のサーチウインドウに限らず、前後が不均等の幅を有するサーチウインドウを設定することができる。
サーチウインドウ内の例えば最初のフレームからW-IAS(i)の値が計算される。サーチウインドウ内で、W-IAS(i)=80が最大であるので、このフレームが新たなイントラピクチャとして設定される。
重み付けIAS(W-IAS(i))は、IAS(i)とd(i)とから下記の式(9)によって計算される。
W-IAS(i)=IAS(i)×(MAXD−|d(i)|) / MAXD (9)
式(1)のIAS(i)に乗じられる右辺の項が重み付け係数である。MAX Dは、サーチウインドウ内で全ての|d(i)|に対して、MAX D>N0+d(i)(N0は、デフォルトのイントラピクチャ位置で例えばN0=15である)の関係にある所定の定数である。MAX Dは、アプリケーション10によって適切な値例えば19に設定される。
式(1)から分かるように、デフォルトイントラピクチャ位置(d(i)=0)で重み付け係数が最大の1となり、デフォルトイントラピクチャ位置から離れるにしたがって1より重み付け係数が小さくなる。
図6は、テスト用のビデオシーケンスに対して上述した方法を適用してイントラピクチャを決定した場合のイントラピクチャの分布の一例を示す。横軸がイントラピクチャの間隔、すなわち、設定された連続するイントラピクチャ位置の間隔を示す。図6の縦軸は、決定されたイントラピクチャの個数のカウント値を示している。図6から分かるように、イントラピクチャの間隔がデフォルト値N0例えば15に集中したものとなる。
上述したこの発明の一実施形態による処理のいくつかの例について、図7を参照して説明する。図7A〜図7Eにおいて、横軸が時間軸であり、黒いドットおよび四角のドットがピクチャタイプ決定部6が上述した処理によって決定したイントラピクチャのフレームを示す。すなわち、サーチウインドウ内にシーンチェンジが存在せず且つサーチウインドウに対応して重み付けIASが最大であるフレームか、またはシーンチェンジのフレームがイントラピクチャと決定される。
白いドットは、イントラピクチャ位置と一旦設定されたが、キャンセルされた位置を示す。すなわち、デフォルトイントラピクチャ位置であるが、重み付けIASがより小さいためにキャンセルされたか、または最大の重み付けIASを有するが、シーンチェンジによってキャンセルされたフレームを示す。このように、シーンチェンジがサーチウインドウ内に存在するか否かと無関係に、シーンチェンジが検出されたフレームがイントラピクチャと設定される。
図7Aに示す第1の例では、イントラピクチャF1に対してN0フレーム(デフォルトイントラインターバル)後のデフォルトイントラピクチャ位置F2が設定され、サーチウインドウWND1内でデフォルトイントラピクチャ位置F2における重み付けIASが最大であるために、デフォルトイントラピクチャ位置F2がイントラピクチャに設定される。次のN0フレーム後の位置(ここではフレームと同じ意味である)F3に関して設定されたサーチウインドウWND2において、デフォルトイントラピクチャ位置F3以外で位置F4が最大の重み付けIASを有するので、位置F4がイントラピクチャとして設定される。
図7Bに示す第2の例では、第1の例と同様に、サーチウインドウWND1において、デフォルト位置F2がイントラピクチャとして設定される。次のサーチウインドウWND2において、最大の重み付けIASを有する位置F4がサーチウインドウWND2内で検出されたシーンチェンジ位置F5によってキャンセルされる。
図7Cに示す第3の例では、サーチウインドウWND1において、最大の重み付けIASを有する位置F2がサーチウインドウWND1内で検出されたシーンチェンジ位置F6によってキャンセルされる。次のサーチウインドウWND21は、位置F6からN0フレーム後のデフォルトイントラピクチャ位置F7を基準にして設定される。サーチウインドウWND21内で位置F8が最大の重み付けIASを有するので、位置F8がイントラピクチャに設定される。
図7Dに示す第4の例では、サーチウインドウWND1において、最大の重み付けIASを有する位置F9がイントラピクチャに設定される。位置F9からN0フレーム後のデフォルトイントラピクチャ位置がF10である。位置F10を中心とするサーチウインドウWND22において、最大の重み付けIASを有する位置F11がサーチウインドウWND22内で検出されたシーンチェンジ位置F12によってキャンセルされる。
図7Eに示す第5の例では、第4の例と同様に、サーチウインドウWND1において、最大の重み付けIASを有する位置F9がイントラピクチャに設定される。位置F9からN0フレーム経過する前に、シーンチェンジが検出され、シーンチェンジ検出位置F13がイントラピクチャに設定される。位置F13からN0フレーム後のデフォルト位置F14を中心として次のサーチウインドウWND23が設定される。サーチウインドウWND23において、最大の重み付けIASを有する位置F15がイントラピクチャに設定される。
次に、上述したシーンチェンジ検出部5に適用できるイントラ決定部について説明する。図8は、シーンチェンジ検出部5の構成を示す。入力ビデオデータVIがフレームバッファ2に蓄積される。フレームバッファ2は、ピクチャタイプを決定するのに必要な時間ビデオデータを遅延させるのに使用される。フレームバッファ2から読み出されたビデオデータがコーディング部(図示しない)に供給され、符号化される。動き検出部4からIAS演算部51に対して評価値MEIおよび動きベクトルMVが供給され、一実施形態について上述したようにIASが求められる。IASがイントラ決定部53に供給される。
フレームバッファ2に対して相関値(CORと表記する)演算部52が接続されている。COR演算部52によって演算されたCORがイントラ決定部53に供給される。スコアIASは、動き検出の結果に基づいて計算されたもので、動きに基づいた要素である。相関値CORは、後述するように、数学に基づいて計算したもので、統計に基づいた要素である。イントラ決定部53は、イントラ符号化が適しているフレームを決定する。このフレームがシーンチェンジとして扱われ、シーンチェンジ情報SCIがピクチャタイプ決定部6(図2参照)に供給される。
図9は、シーンチェンジ検出部5の処理の流れを示すフローチャートである。ステップST21において、i番目のフレームに関してIAS(i)を計算するために必要な値IAS1(i)、IAS2(i)およびIAS3(i)が評価値MEIおよび動きベクトルM
Vに基づいて計算される。ステップST22において、IAS(i)が計算される。3個の部分IAS1(i)とIAS2(i)とIAS3(i)は、それぞれ式(3)、式(7)
および式(8)にしたがって、ステップST21で計算され、式(2)にしたがってIAS(i)がステップST22で計算される。前述したように、IASの値が大きいフレームは、イントラ符号化に適したフレームである。
ステップST23において、現フレームと直前のフレーム間の相関の程度を示す相関値COR(i)が取得される。COR演算部52によってCOR(i)が演算される。ステップST24において、IAS(i)および相関値COR(i)からイントラフラグIF(i)が計算される。
相関値CORは、フレーム間相関が高いほど大きな値となる。すなわち、相関値CORが大きいフレームは、インター符号化に適していると言える。数学的に相関値は、下記の式(10)によって演算される。
Figure 0004556774
相関値CORは、下記の式(11)によって演算される。
Figure 0004556774
式(10)および式(11)において、covが共分散を意味し、σが標準偏差を意味し
、μが平均値を意味し、Eが期待値を意味する。期待値Eについて説明すると、Xが値x1,x2,・・・を有するランダムな変数で、それぞれが生じる確率をp1,p2,・・・とすると、期待値は、下記の式(12)によって計算される。
Figure 0004556774
式(11)において、Oi,m.n は、オリジナルピクチャのフレームiの画素(m,n)のレ
ベルを表す。μiは、下記の式(13)によって計算される平均値である。なお、1フレ
ーム前のフレーム(i-1)についても同様である。
Figure 0004556774
式(13)において、Σの範囲x,yおよびm,nは、フレームi内の全画素である。また、Nは、フレーム内の画素数である。
ステップST24におけるイントラフラグIF(i)の計算について図10を参照して説明する。図10は、横軸にIAS(例えば0<=IAS(i))をとり、縦軸に相関値COR(例えば0<=COR(i)<=1)をとったグラフである。IAS(i)およびCOR(i)が求められていると、図10の2次元座標上で、そのフレームのイントラフラグF(i)の点(IAS(i),COR(i))が決定される。
図10において、イントラ符号化とインター符号化を振り分けるために、しきい値としての線61が描かれる。しきい値は、IASおよびCORによって設定されている。線61は、IASおよびCORが共に小さい時に、所定のIASの位置から立ち上がる線61aと、所定の傾きの線61bと、所定のIASの位置からCOR=1まで立ち上がる線61cとを連結したものとされている。図10に示す境界を示す線61は、一例であって、線61aを破線61dで示すように、線61bと連続した線としても良い。IASおよびCORが共に小さい範囲は、誤差の影響を受けやすく、その範囲をインター符号化により処理して発生データ量を少なくすることが好ましいので、線61aが設定されている。
ステップST25において、イントラフラグIF(i)が真かどうかが判定される。ここで、IF(i)が真であることは、線61より下側にイントラフラグF(i)が位置することを意味する。そのようなフレームは、相関値CORが低いか、またはIASの値が大きいものであり、ステップST26において、イントラ符号化に適したフレーム、すなわち、シーンチェンジと判定される。
ステップST25において、イントラフラグIF(i)が真でない、すなわち、線61より上側にイントラフラグF(i)が位置すると判定されると、そのフレームは、イントラ符号化に適していないものと判定され、処理が終了する。
この発明は、上述したこの発明の実施形態に限定されるものでは無く、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。例えば、図10においては、しきい値を全体としては、1次関数(直線)でもって描いているが、2次関数(曲線)でしきい値を規定しても良い。また、この発明は、圧縮符号化としては、MPEG 2、MPEG-4 AVC(
またはH.264)符号化以外の符号化を使用しても良い。また、この発明において符号化処理は、ハードウェアによる処理に限らず、ソフトウェアによる処理によって実現するようにしても良い。
従来のイントラピクチャの周期的な配置方法の複数の例を示す略線図である。 この発明による映像信号処理装置の一実施形態の構成を示すブロック図である。 この発明を適用できるコーディング部の一例のブロック図である。 この発明の一実施形態の処理の流れを示すフローチャートである。 この発明の一実施形態のイントラピクチャの位置を決定する処理の説明に用いる略線図である。 この発明の一実施形態をテスト用のシーケンスに適用した場合のイントラピクチャの間隔の発生数の例を示すグラフである。 この発明の一実施形態の処理の複数の例を示す略線図である。 この発明の一実施形態におけるシーンチェンジ検出部に使用できるイントラ決定部の一例のブロック図である。 図8の構成の処理の流れを示すフローチャートである。 IASおよびCORによってイントラ/インターを判定するためのグラフの一例を示す略線図である。
符号の説明
2・・・フレームバッファ
3・・・コーディング部
4・・・動き検出部
5・・・シーンチェンジ検出部
6・・・ピクチャタイプ(イントラ)決定部
7・・・ピクチャタイプ(インター)決定部
10・・・アプリケーション
51・・・IAS演算部
52・・・COR演算部
53・・・イントラ決定部

Claims (3)

  1. ビデオデータに対する符号化方法として、フレーム内符号化とフレーム間符号化の一方が設定可能とされ、ほぼ周期的なフレーム内符号化位置を決定する映像信号処理方法において、
    各フレームに関してシーンチェンジを検出するステップと、
    シーンチェンジが検出されたフレームをフレーム内符号化位置に設定するステップと、
    時間的に前のフレーム内符号化位置に対してデフォルトインターバル後のデフォルト位置を含む連続する複数フレームからなるサーチウインドウを設定するステップと、
    上記サーチウインドウ内の各フレームのビデオデータからスコアIASを演算するステップと、
    上記サーチウインドウ内の上記スコアIASが最大のフレームをフレーム内符号化位置に設定するステップとからなり、
    上記スコアIASは、IAS1 、IAS2 およびIAS3 から求められ、
    上記IAS1 は、現フレームの動きの大きさまたは動きの強度を示す値であり、上記I
    AS2 は、前フレームと比較した現フレームの動きの大きさを示す値であり、上記IAS3 は、現フレームにおいて求められた動きベクトルの中で、残差がしきい値より大きい動きベクトルの割合を示す値である映像信号処理方法。
  2. 請求項1において、
    上記デフォルトインターバルは、アプリケーションによって設定される映像信号処理方法。
  3. 請求項1において、
    上記デフォルトインターバル後のデフォルト位置において最大となり、上記デフォルト位置に対する距離が大きくなるにしたがって小さくなる重み付け係数を乗じた重み付けスコアIASに基づいて上記フレーム内符号化位置を設定する映像信号処理方法。
JP2005162179A 2005-06-02 2005-06-02 映像信号処理方法 Expired - Fee Related JP4556774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005162179A JP4556774B2 (ja) 2005-06-02 2005-06-02 映像信号処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005162179A JP4556774B2 (ja) 2005-06-02 2005-06-02 映像信号処理方法

Publications (2)

Publication Number Publication Date
JP2006340033A JP2006340033A (ja) 2006-12-14
JP4556774B2 true JP4556774B2 (ja) 2010-10-06

Family

ID=37560174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005162179A Expired - Fee Related JP4556774B2 (ja) 2005-06-02 2005-06-02 映像信号処理方法

Country Status (1)

Country Link
JP (1) JP4556774B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05308628A (ja) * 1992-04-30 1993-11-19 Olympus Optical Co Ltd 動画像符号化装置
JPH0646409A (ja) * 1992-07-23 1994-02-18 Sony Corp 画像信号符号化装置及び画像信号符号化方法
JPH0654315A (ja) * 1992-07-31 1994-02-25 Canon Inc 動画像符号化方法及び装置
JPH08102965A (ja) * 1994-09-30 1996-04-16 Sony Corp 画像符号化装置
JPH10304374A (ja) * 1997-04-25 1998-11-13 Sharp Corp 動画像符号化装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05308628A (ja) * 1992-04-30 1993-11-19 Olympus Optical Co Ltd 動画像符号化装置
JPH0646409A (ja) * 1992-07-23 1994-02-18 Sony Corp 画像信号符号化装置及び画像信号符号化方法
JPH0654315A (ja) * 1992-07-31 1994-02-25 Canon Inc 動画像符号化方法及び装置
JPH08102965A (ja) * 1994-09-30 1996-04-16 Sony Corp 画像符号化装置
JPH10304374A (ja) * 1997-04-25 1998-11-13 Sharp Corp 動画像符号化装置

Also Published As

Publication number Publication date
JP2006340033A (ja) 2006-12-14

Similar Documents

Publication Publication Date Title
JP4851741B2 (ja) ソース画像のシーケンスを符号化する方法及び装置
KR100987765B1 (ko) 동영상 부호화기에서의 예측 수행 방법 및 장치
JP5234241B2 (ja) 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
JPH0870460A (ja) 動き大小に適応する動き補償符号化方法及びその装置
KR20100137502A (ko) 효율성과 주관적 품질의 개선을 지원하는 예측 프레임 선택을 위한 방법 및 장치
JP2007329693A (ja) 画像符号化装置、及び画像符号化方法
JP4391810B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
US8325807B2 (en) Video coding
WO2010109564A1 (ja) 画像符号化装置及び画像符号化方法
JP4130617B2 (ja) 動画像符号化方法および動画像符号化装置
JP4452733B2 (ja) 動画像符号化における動き評価装置,方法およびそのプログラム並びにその記録媒体
JP3888533B2 (ja) 画像特徴に応じた画像符号化装置
JP4556774B2 (ja) 映像信号処理方法
JP4556773B2 (ja) 映像信号処理方法
JP2000261809A (ja) 画像特徴に応じた画像符号化装置
JP4911625B2 (ja) 画像処理装置、およびそれを搭載した撮像装置
JP3738511B2 (ja) 動画像符号化方式
JP2007529144A (ja) マクロブロック符号化時にノイズを防止する方法
JP4697802B2 (ja) 動画像予測符号化方法および装置
JP2005303555A (ja) 動画像符号化装置および動画像符号化方法
JP3700801B2 (ja) 画像符号化装置および画像符号化方法
JP4561701B2 (ja) 動画像符号化装置
JP2005303362A (ja) 画像符号化装置及びプログラム
JP4829951B2 (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100413

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100712

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees