JP2008005183A - 映画素材に適した映像符号化方法および符号化装置 - Google Patents

映画素材に適した映像符号化方法および符号化装置 Download PDF

Info

Publication number
JP2008005183A
JP2008005183A JP2006172144A JP2006172144A JP2008005183A JP 2008005183 A JP2008005183 A JP 2008005183A JP 2006172144 A JP2006172144 A JP 2006172144A JP 2006172144 A JP2006172144 A JP 2006172144A JP 2008005183 A JP2008005183 A JP 2008005183A
Authority
JP
Japan
Prior art keywords
field
frame
encoding
inter
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006172144A
Other languages
English (en)
Inventor
Hideki Fukuda
秀樹 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006172144A priority Critical patent/JP2008005183A/ja
Publication of JP2008005183A publication Critical patent/JP2008005183A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】テレシネ変換されたビデオ信号を効率的に圧縮符号化処理し、低ビットレートでも高画質の映像データを得る。
【解決手段】ビデオ信号を圧縮符号化処理する装置であって、フレーム間差分量に基づいてテレシネ変換パターンを検出する手段101を具備し、テレシネ変換パターンにしたがってフレーム内符号化、あるいは、前方向フレーム間予測符号化、あるいは、両方向フレーム間予測符号化を選択する。
【選択図】図1

Description

本発明は、テレビ信号などの映像信号を圧縮符号化する方法および装置に関する。
デジタル映像信号を記録メディアに記録する際にMPEG符号化方式を用いてデータ圧縮して得られたビデオストリームを記録することが一般的に用いられている(非特許文献1、2参照)。MPEG符号化方式はフレーム内符号化(Iピクチャ)、前方向フレーム間予測符号化(Pピクチャ)、両方向フレーム間予測符号化(Bピクチャ)を行う。ここで、Iピクチャを先頭としたフレーム群をグループオブピクチャ(以下、GOPと略す)と呼ぶ。Pピクチャは直前のIピクチャまたはPピクチャを参照画像として予測符号化し、Bピクチャは直前、直後に位置するIピクチャまたはPピクチャを参照画像として予測符号化する。Iピクチャはフレーム内で独立に符号化される。
MPEG2符号化方式は8×8画素のブロック単位に離散コサイン変換(DCT)を行うが、インタレースビデオ信号の圧縮符号化に適するようにDCTを行うブロックをフレームで構成するフレームDCTモードと、フィールドで構成するフィールドDCTモードとが選択できる。DCTモードは16×16画素のマクロブロック単位で選択可能である。図11にDCTモードを示す。○がトップフィールドの画素、●がボトムフィールドの画素である。図11(a)はフレームDCTモードでのブロック化、図11(b)はフィールドDCTモードでのブロック化である。フレームDCTモードはトップフィールドとボトムフィールドをあわせてブロック化し、8×8画素のブロック1101、1102、1103、1104をDCTブロックとしてDCT処理する。フィールドDCTモードはトップフィールドとボトムフィールドで各々ブロック化し、ブロック1111、1112、1113、1114をDCTブロックとしてDCT処理する。DCTモードの選択方法としては、フレーム単位でブロック化した場合のブロック分散値の大きさとフィールド単位でブロック化したときの分散値の大きさとを比較し、小さい方を選択する。
また、フレーム間予測方法についても、フレーム単位の予測モードとフィールド単位の予測モードを併せ持ち、マクロブロック単位に選択が可能である。図3(a)を用いてMPEG2のフレーム予測モードとフィールド予測モードについて説明する。なお、図3(a)はフレーム構造符号化の場合であるが、ピクチャ構造については後述する。
図3(a)はフレーム301をIピクチャ、フレーム302、303をBピクチャ、フレーム304をPピクチャとした例である。フレーム301はトップフィールド301t、ボトムフィールド301bからなり、フレーム302はトップフィールド302t、ボトムフィールド302bからなり、フレーム303はトップフィールド303t、ボトムフィールド303bからなり、フレーム304はトップフィールド304t、ボトムフィールド304bからなる。トップフィールドはフレームの奇数ラインからなり、ボトムフィールドはフレームの偶数ラインからなる。
まず、フレーム301のIピクチャは他のフレームを用いることなくフレーム301内のみで独立符号化される。
フレーム304のPピクチャは直前のIピクチャであるフレーム301を参照画像として予測符号化される。ここでフレーム予測モードは、フレーム301を参照画像としてフレーム単位で予測符号化するものである。フィールド予測モードは、各フィールドで予測符号化する。つまり、トップフィールド304tをトップフィールド301tとボトムフィールド301bを参照画像として予測符号化する。同様に、ボトムフィールド304bはトップフィールド301tとボトムフィールド301bを参照画像として予測符号化する。これら予測モードは16×16画素のマクロブロックと呼ばれる単位ごとに決定することができる。
次に、フレーム302はBピクチャとして符号化されるが、Iピクチャであるフレーム301とPピクチャであるフレーム304を参照画像とする。Bピクチャの予測方向のモードとしては、フレーム301を参照画像とする前方向予測モード、フレーム304を参照画像とする後方向予測モード、フレーム301および304から生成した補間画像を参照画像とする両方向予測(補間予測)モードの3つのモードをマクロブロック単位に切り替えることができる。
また、Pピクチャと同様にフレーム単位で予測符号化するフレーム予測モードとフィールド単位で予測符号化するフィールド予測モードとがある。したがって、予測方向モードとあわせて6つの予測モードをマクロブロック単位に切り替えることができる。
これら予測モードは予測誤差信号の大きさによって選択され、予測誤差信号の小さな予測モードを選択することで効率的な予測符号化を行うことができる。
また、前述したのはフレーム単位にピクチャを構成するフレーム構造符号化であるが、各フィールドごとにピクチャを構成して符号化するフィールド構造符号化も可能である。フレーム構造符号化とフィールド構造符号化はフレーム単位に選択することができる。フィールド構造の場合の予測符号化について図3(b)を用いて説明する。
図3(b)はトップフィールド301tをIピクチャとし、ボトムフィールド301bをPピクチャ、フィールド302t、302b、303t、303bをBピクチャ、フィールド304tおよび304bをPピクチャとした例である。
まず、フィールド301tのIピクチャは他のフレーム、フィールドを用いることなくフィールド301t内のみで独立符号化される。
フィールド301bのPピクチャは直前のIピクチャであるフィールド301tを参照画像としてフィールド間予測符号化される。
次にフィールド304tのPピクチャは、Iピクチャであるフィールド301tおよびPピクチャであるフィールド301bを参照画像としてフィールド間予測符号化する。
フィールド304bのPピクチャは、フィールド304tおよびフィールド301bを参照画像としてフィールド間予測符号化する。つまり、トップフィールドおよびボトムフィールドで直前にあるIピクチャまたはPピクチャを参照画像として予測符号化する。
次に、フィールド302t、302b、303t、303bはBピクチャとして符号化されるが、直前と直後に位置するIピクチャまたはPピクチャを参照画像としてフィールド間予測符号化される。Bピクチャの予測方向のモードは、フィールド301t、または301bを参照画像とする前方向予測モード、フィールド304t、またはフィールド304bを参照画像とする後方向予測モード、フィールド301tまたは301b、および304tまたは304bから生成した補間画像を参照画像とする両方向予測(補間予測)モードの3つのモードをマクロブロック単位に切り替えることができる。
これら予測モードは予測誤差信号の大きさによって選択され、予測誤差信号の小さな予測モードを選択することで効率的な予測符号化を行うことができる。
なお、フィールド構造符号化の場合のDCTはフィールド単位で行われる。
ところで、Iピクチャ、Pピクチャ、Bピクチャといったピクチャタイプを決定する方法として、所定の周期にしたがって決定する方法が一般的である。
図5に従来のピクチャタイプの一例を示す。Pピクチャの間隔GOP_Mを3としており、フレーム513をIピクチャとし、フレーム516、519はPピクチャとし、残りのフレームはBピクチャとしている。
図7にピクチャタイプを決定するフローチャートを示している。ここで、nはIピクチャから数えたフレーム数、mはPピクチャから数えたフレーム数、GOP_NはIピクチャの所定の周期フレーム数、GOP_MはPピクチャの所定の周期フレーム数である。GOP_NはGOP_Mの整数倍としている。例えば、GOP_N=15、GOP_M=3とする。つまり、3フレームごとにPピクチャとなるが、15フレームごとにはIピクチャとなり、これ以外のフレームはBピクチャとなる。
以下、ピクチャタイプの決定処理フローを各ステップにしたがって順に説明する。
(ステップ701) 過去のPピクチャからのフレーム数mがGOP_M以上であるか判断する。GOP_M以上の場合はステップ702へ、そうでない場合はステップ708へ進む。
(ステップ702) 過去のIピクチャからのフレーム数nがGOP_N以上であるか判断する。GOP_N以上の場合はステップ703へ、そうで無い場合は、ステップ707へ進む。
(ステップ703) ピクチャタイプをIピクチャとする。ステップ704へ進む。
(ステップ704) nを0にリセットする。ステップ705へ進む。
(ステップ705) mを0にリセットする。ステップ706へ進む。
(ステップ706) n、mを1つずつ加算していく。終了。
(ステップ707) ピクチャタイプをPピクチャとする。ステップ705へ進む。
(ステップ708) ピクチャタイプをBピクチャとする。ステップ706へ進む。
さらに、参照画像(IピクチャまたはPピクチャ)の周期(GOP_M、GOP_N)を適応的に決定する符号化方法が提案されている。
例えば、フレーム間予測誤差信号の大きさに従って予測効率を求め、予測効率が低いと参照フレーム間隔を小さくし、予測効率が高いと参照フレーム間隔を大きくすることにより効率的な符号化が実現できることが開示されている(例えば、特許文献1参照)。
また、入力された画像の特性を示す画像特性パラメータとして、動きベクトルの分布検出、フラッシュ映像検出、ディゾルブ映像検出、フェード映像検出などを行った結果にしたがって参照フレーム間隔を決定する方法が開示されている(例えば、特許文献2参照)。
また、入力映像の符号化に先立って簡易的な動き検出を行い、この結果にしたがって参照フレーム間隔を決定する方法が開示されている(例えば、特許文献3参照)。
いずれも、映像の絵柄の動きが大きくなるとPピクチャの間隔を小さくし、動きが小さくなるとPピクチャの間隔を大きくしている。これは、動きが大きく、かつフレーム間距離が大きくなると、動き量が相対的に大きくなるために、より広い動き検出範囲が必要になる、さらには、予測効率が低下する、といった問題を解決するために提案されたものである。
ところで、フレームレートが24Hzのフィルム映画素材を60Hzのインターレースビデオ信号に変換する際にフレームレートの変換がなされる。この変換はテレシネ変換、あるいは23変換、23プルダウンなどと呼ばれる。テレシネ変換は、フィルムの1コマを2フィールドに変換することと、3フィールドに変換することを交互に繰り返す。
図2にテレシネ変換の様子を示す。テレシネ変換は、フィルムのコマ201、202、203、204をインタレース信号のフレーム221、222、223、224、225の5フレーム(10フィールド)に変換する。まず、フィルムの1コマ201の奇数ラインをフレーム221のトップフィールド211tとし、偶数ラインをボトムフィールド211bとする。同様に、コマ202の奇数ラインはフレーム222のトップフィールド212t、偶数ラインはボトムフィールド212bとする。さらにコマ202の奇数ラインはフレーム223のトップフィールド213tとする。つまり、フレーム222のトップフィールド212tとフレーム223のトップフィールド213tは同じであり、トップフィールド212tと213tはコピーフィールドであると呼ぶ。フィルムのコマ202は3フィールドに変換されたことになる。
次に、フィルムのコマ203の偶数ラインはフレーム223のボトムフィールド213bに、奇数ラインはフレーム224のトップフィールド214tとする。同様に、フィルムのコマ204の偶数ラインはフレーム224のボトムフィールド214bとし、奇数ラインはフレーム225のトップフィールド215tとする。さらに、コマ204の偶数ラインはフレーム225のボトムフィールド215bとする。つまり、ボトムフィールド214bと215bはコピーフィールドであり、フィルムのコマ204は3フィールドに変換される。
テレシネ変換はこのようにフィルム4コマをインタレースビデオ信号5フレーム(10フィールド)に変換することを繰り返すことである。
テレシネ変換されたインタレースビデオ信号を効率的に圧縮符号化する方法として、テレシネ変換の逆変換(逆テレシネ変換、逆23変換、逆23プルダウン)を行ってから符号化する方法が提案されている(例えば、特許文献4、5参照)。つまり、60フィールド(30フレーム)のインタレース信号からコピーフィールドを検出し、一方のコピーフィールドを削除することで、元の24コマの信号に変換してから圧縮符号化するのである。これにより符号化処理する画面数を減らすことができ、圧縮効率が上げることができる。
特許第3604864号公報 特開2002−10270号公報 特開2000−261809号公報 特開平10−304379号公報 特開2000−341685号公報 ISO/IEC 13818−2(MPEG2ビデオ) ISO/IEC 11172−2(MPEG1ビデオ)
しかしながら、テレシネ映像を高効率に圧縮符号化する際に、逆テレシネ変換を行うためには専用ハードウェアが必要であり、コストアップにつながるという課題を有していた。また、一般のテレビ信号などでは外部から混入するノイズの影響を受けるなどして必ずしも逆テレシネ変換が正しく行うことができず、逆に誤った変換によって再生映像が不自然な動きになるなどの課題も有していた。
さらに、動き量にしたがって参照フレーム間隔を決定する方法では、テレシネ変換された映像に対しては必ずしも最適な参照フレーム間隔ではなく予測符号化効率を高めることができていないという課題も有していた。
そこで、本発明は上記のような問題点に鑑みてなされたもので、テレシネ変換されたインタレース信号の符号化効率をコストアップすることなく向上させ、高画質に圧縮符号化する符号化方法および符号化装置を提供することを目的とする。
この発明(請求項1)に係る符号化装置は、インタレースビデオ信号を圧縮符号化する装置であって、フレームまたはフィールド内符号化手段と、前方向フレームまたはフィールド間予測符号化手段と、両方向フレームまたはフィールド間予測符号化手段と、コピーフィールド検出手段とを具備し、前記コピーフィールドの検出結果にしたがって、前記フレームまたはフィールド内符号化手段と前記前方向フレームまたはフィールド間予測符号化手段と前期両方向フレームまたはフィールド間予測符号化手段のうちいずれか一つを選択して符号化処理するように構成したものである。
この発明(請求項2)は、請求項1記載の符号化装置において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドを属するフレームをフレーム内符号化、または前方向フレーム間予測符号化とするように構成したものである。
この発明(請求項3)は、請求項1記載の符号化装置において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドをフィールド内符号化、または前方向フィールド間予測符号化とするように構成したものである。
この発明(請求項4)は、請求項1記載の符号化装置において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方が属するフレームを参照フレームとし、他方のフィールドが属するフレームをフレーム間予測符号化するように構成したものである。
この発明(請求項5)は、請求項1記載の符号化装置において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照フィールドとし、他方のフィールドをフィールド間予測符号化するように構成したものである。
この発明(請求項6)に係る符号化装置は、テレシネ変換されたインターレースビデオ信号を圧縮符号化する装置であって、フレームまたはフィールド内符号化手段と、前方向フレームまたはフィールド間予測符号化手段と、両方向フレームまたはフィールド間予測符号化手段と、テレシネ変換パターン検出手段とを具備し、テレシネ変換パターンにしたがって前記フレームまたはフィールド内符号化手段と前記前方向フレームまたはフィールド間予測符号化手段と前記両方向フレーム間予測符号化手段のうちいずれか一つを選択して符号化処理するように構成したものである
この発明(請求項7)は、請求項6記載の符号化装置において、テレシネ変換パターンを検出する手段は、ビデオフレームが同一のフィルムコマから変換されたものであるか、異なるフィルムコマから変換されたものであるかを検出するように構成したものである。
この発明(請求項8)は、請求項6記載の符号化装置において、テレシネ変換パターンを検出する手段は、ビデオフレームまたはフィールド間の信号レベル差を演算する手段を具備したものである。
この発明(請求項9)は、請求項7記載の符号化装置において、ビデオフレームが同一のフィルムコマから変換されたものである場合、該ビデオフレームをフレームまたはフィールド内符号化、または前方向フレームまたはフィールド間予測符号化するように構成したものである。
この発明(請求項10)に係る符号化装置は、テレシネ変換されたインターレースビデオ信号を圧縮符号化する装置であって、フィールド単位で符号化処理する手段とフレーム単位で符号化処理する手段と、テレシネ変換パターンを検出する手段とを具備し、テレシネ変換パターンにしたがってフレーム単位で符号化処理するか、フィールド単位で符号化処理するかを選択するように構成したものである。
この発明(請求項11)は、請求項10記載の符号化装置において、フレーム単位で複数の画素からなるブロックに分割する手段と、フィールド単位で複数の画素かなるブロックに分割する手段と、前記フレーム単位でブロック化するかフィールド単位でブロック化するかを選択する手段と、選択されたブロックを周波数変換して符号化する手段を具備し、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム単位でブロック化することが選ばれやすくし、そうでない場合はフィールド単位でブロック化することが選ばれやすくするように構成したものである。
この発明(請求項12)は、請求項10記載の符号化装置において、フレーム単位で複数の画素からなるブロックに分割する手段と、フィールド単位で複数の画素かなるブロックに分割する手段と、前記フレーム単位でブロック化するかフィールド単位でブロック化するかを選択する手段と、選択されたブロック単位で参照画像から予測処理する手段を具備し、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム単位でブロック化することが選ばれやすくし、そうでない場合はフィールド単位でブロック化することが選ばれやすくするように構成したものである。
この発明(請求項13)は、請求項10記載の符号化装置において、フレーム内符号化処理する手段と、フレーム間予測符号化処理する手段と、フィールド内符号化処理する手段と、フィールド間予測符号化処理する手段と、フレーム内符号化処理、フレーム間予測符号化処理、フィールド内符号化処理、およびフィールド間予測符号化処理のうちいずれか1つを選択する手段を具備し、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム内符号化処理もしくはフレーム間予測符号化処理することが選ばれやすくし、そうでない場合はフィールド内符号化処理もしくはフィールド間予測符号化処理することが選ばれやすくするようにするようにしたものである。
この発明(請求項14)は、請求項10記載の符号化装置において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照画像とし、他方のフィールドを予測符号化し、同一フィルムコマからなるビデオフレームはフレーム単位で符号化処理し、異なるフィルムコマからなるビデオフレームはフィールド単位で符号化処理するよう構成したものである。
この発明(請求項15)に係る符号化方法は、インタレースビデオ信号を圧縮符号化する方法であって、フレームまたはフィールド内符号化ステップと、前方向フレームまたはフィールド間予測符号化ステップと、両方向フレームまたはフィールド間予測符号化ステップと、コピーフィールド検出ステップとを具備し、前記コピーフィールドの検出結果にしたがって、前記フレームまたはフィールド内符号化ステップと前記前方向フレームまたはフィールド間予測符号化ステップと前記両方向フレームまたはフィールド間予測符号化ステップのうちいずれか一つを選択して符号化処理するようにしたものである。
この発明(請求項16)は、請求項15記載の符号化方法において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方が属するフレームを参照フレームとし、他方のフィールドが属するフレームをフレーム間予測符号化するようにしたものである。
この発明(請求項17)は、請求項15記載の符号化方法において、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照フィールドとし、他方のフィールドをフィールド間予測符号化するようにしたものである。
この発明(請求項18)に係る符号化方法は、テレシネ変換されたインターレースビデオ信号を圧縮符号化する方法であって、フレームまたはフィールド内符号化ステップと、前方向フレームまたはフィールド間予測符号化ステップと、両方向フレームまたはフィールド間予測符号化ステップと、テレシネ変換パターン検出ステップとを具備し、テレシネ変換パターンにしたがって前記フレームまたはフィールド内符号化ステップと前記前方向フレームまたはフィールド間予測符号化ステップと前記両方向フレームまたはフィールド間予測符号化ステップのうちいずれか一つを選択して符号化処理するようにしたものである。
この発明(請求項19)に係る符号化方法は、テレシネ変換されたインターレースビデオ信号を圧縮符号化する方法であって、フィールド単位で符号化処理するステップとフレーム単位で符号化処理するステップと、テレシネ変換パターンを検出するステップとを具備し、テレシネ変換パターンにしたがってフレーム単位で符号化処理するか、フィールド単位で符号化処理するかを選択するようにしたものである。
以上のようにこの発明(請求項1)によれば、コピーフィールドの検出結果にしたがって、フレームまたはフィールド内符号化と前方向フレームまたはフィールド間予測符号化と両方向フレームまたはフィールド間予測符号化のうちいずれか一つを選択するように構成したので、コピーフィールドを利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項2)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドを属するフレームをフレーム内符号化、または前方向フレーム間予測符号化とするように構成したので、コピーフィールドに対する予測誤差信号を小さくすることで効率的にフレーム間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項3)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドをフィールド内符号化、または前方向フィールド間予測符号化とするように構成したので、コピーフィールドに対する予測誤差信号を小さくすることで効率的にフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項4)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方が属するフレームを参照フレームとし、他方のフィールドが属するフレームをフレーム間予測符号化するように構成したので、コピーフィールドに対するフレーム間予測誤差信号を小さくすることができ、効率的に圧縮符号化できるので、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項5)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照フィールドとし、他方のフィールドをフィールド間予測符号化するように構成したので、コピーフィールドに対するフィールド間予測誤差信号を小さくすることができ、効率的に圧縮符号化できるので、低ビットレートにおいても高画質の映像を得ることが可能となる。この発明(請求項6)によれば、テレシネ変換されたインターレースビデオ信号のテレシネ変換パターンにしたがってフレームまたはフィールド内符号化と前方向フレームまたはフィールド間予測符号化と両方向フレームまたはフィールド間予測符号化のうちいずれか一つを選択するように構成したので、テレシネ変換パターンを利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項7)によれば、テレシネ変換パターンを検出する手段は、ビデオフレームが同一のフィルムコマから変換されたものであるか、異なるフィルムコマから変換されたものであるかを検出するように構成したので、テレシネ変換におけるフィールドコピー処理を利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項8)によれば、テレシネ変換パターンを検出する手段は、ビデオフレームまたはフィールド間の信号レベル差を演算する手段を具備するようにしたので、ビデオ信号からテレシネ変換パターンを正確に検出し、テレシネ変換におけるフィールドコピー処理を利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項9)によれば、ビデオフレームが同一のフィルムコマから変換されたものである場合、該ビデオフレームをフレームまたはフィールド内符号化、または前方向フレームまたはフィールド間予測符号化するように構成したので、テレシネ変換におけるフィールドコピー処理を利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項10)によれば、テレシネ変換パターンにしたがってフレーム単位で符号化処理するか、フィールド単位で符号化処理するかを選択するように構成したので、フレーム、フィールド処理を最適化することができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項11)によれば、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム単位でブロック化して周波数変換されやすくし、そうでない場合はフィールド単位でブロック化して周波数変換されやすくしたので、垂直方向の相関性が高いブロックに対して周波数変換することができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項12)によれば、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム単位でブロック化して予測符号化されやすくし、そうでない場合はフィールド単位でブロック化して予測符号化されやすくしたので、相関性の高いブロック間での予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項13)によれば、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム内符号化処理もしくはフレーム間予測符号化処理することが選ばれやすくし、そうでない場合はフィールド内符号化処理もしくはフィールド間予測符号化処理することが選ばれやすくしたので、相関性の高い画像単位で圧縮符号化処理することができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項14)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照画像とし、他方のフィールドを予測符号化し、同一フィルムコマからなるビデオフレームはフレーム単位で符号化処理し、異なるフィルムコマからなるビデオフレームはフィールド単位で符号化処理するように構成したので、コピーフィールドに対する予測効率を高めるとともに、相関性の高い画像単位で圧縮符号化処理することができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項15)によれば、前記コピーフィールドの検出結果にしたがって、フレームまたはフィールド内符号化と前方向フレームまたはフィールド間予測符号化と両方向フレームまたはフィールド間予測符号化のうちいずれか一つを選択するようにしたので、コピーフィールドを利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項16)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方が属するフレームを参照フレームとし、他方のフィールドが属するフレームをフレーム間予測符号化するようにしたので、コピーフィールドに対する予測誤差信号を小さくすることで効率的にフレーム間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項17)によれば、第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照フィールドとし、他方のフィールドをフィールド間予測符号化するようにしたので、コピーフィールドに対する予測誤差信号を小さくすることで効率的にフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項18)によれば、テレシネ変換パターンにしたがってフレームまたはフィールド内符号化と前方向フレームまたはフィールド間予測符号化と両方向フレームまたはフィールド間予測符号化のうちいずれか一つを選択するようにしたので、テレシネ変換パターンを利用した効率的なフレームまたはフィールド間予測符号化を行うことができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
この発明(請求項19)よれば、テレシネ変換パターンにしたがってフレーム単位で符号化処理するか、フィールド単位で符号化処理するかを選択するようにしたので、フレーム、フィールド処理を最適化することができ、低ビットレートにおいても高画質の映像を得ることが可能となる。
以下、本発明の実施の形態について説明する。
(実施の形態1)
図1は本発明の実施の形態1であるビデオ符号化装置の実施例を説明するためのブロック図である。
この符号化装置は、フレーム遅延器100、テレシネ変換パターン検出器101、ピクチャタイプ決定器102、セレクタ103、フレーム内符号化部104、前方向フレーム間予測符号化部105、両方向フレーム間予測符号化部106とから構成され、MPEG2ビデオストリームを出力する符号化装置である。
フレーム値延器100はメモリから構成され、入力ビデオ信号をいったん蓄積することで1フレーム以上の遅延を行う。
セレクタ103は入力フレームをフレーム内符号化部104にてフレーム内符号化処理してIピクチャとするか、前方向フレーム間予測符号化部105で前方向フレーム間予測符号化処理してPピクチャとするか、両方向フレーム間予測符号化部106で両方向フレーム間予測符号化処理してBピクチャとするかを選択するためのセレクタであり、ピクチャタイプ決定器102によって制御される。
テレシネ変換パターン検出器101は、フレーム間差分値の大きさなどでコピーフィールドを検出しテレシネ変換における変換パターンを検出するものである。
図6にテレシネ変換パターン検出器101の一例を示す。これは、第1のフィールドメモリ601、第2のフィールドメモリ602、絶対値差分演算部603、比較器604から構成されコピーフィールドを検出するものである。入力された画像信号は、第1のフィールドメモリ601に格納された後、次に、第2のフィールドメモリ602に格納される。つまり、第2のフィールドメモリ602の出力は入力画像に対して1フレーム期間遅延する。絶対値差分演算部603は入力画像と1フレーム期間遅延させたフィールドとの絶対値差分を累積し、各フィールドのフレーム間差分値を計算する。比較器604は各フィールドのフレーム間差分値と所定のしきい値Dtとの比較を行い、フレーム間差分値が所定値以下であれば、コピーフィールドとして検出する。
なお、テレシネ変換パターン検出器101の一例を示したが、コピーフィールドの検出に用いる所定のしきい値Dtは過去のフレーム間差分値の大きさにしたがって更新するなどしてもよい。例えば、過去のフレーム間差分値が平均的に大きな場合はしきい値を大きくするなどする。こうすることでノイズが混入した映像においてもコピーフィールドを検出することができる。
また、テレシネ変換は5フレーム周期になされるので、この周期性を利用してもよい。例えば、5フレームごとにトップフィールドでのコピーフィールド、およびボトムフィールドでのコピーフィールドが存在するので、この周期に同期してフレーム間差分値のしきい値Dtを決定する。周期性からコピーフィールドが検出される可能性が高い場合は、しきい値Dtを小さくすることで、コピーフィールド検出を精度よくおこなうことができる。
次に、ピクチャタイプ決定器102はnフレーム(例えばn=15)ごとにIピクチャとし、mフレーム(例えばm=3)ごとにPピクチャとし、残りをBピクチャとするように周期的にピクチャタイプを決定するが、これに加えて、テレシネ変換パターン検出器101の出力によってもピクチャタイプを決定する。すなわち、テレシネ変換パターン検出によって互いにコピーフィールドの関係にあるフレームである場合は、いずれか一方のフレームを参照フレームとし、他方のフレームをフレーム間予測符号化するようにピクチャタイプを決定する。図8にピクチャタイプ決定器102における各フレームのピクチャタイプ決定フローチャートを示す。図8で、mはIまたはPピクチャから数えたフレーム数、nはIピクチャから数えたフレーム数、GOP_MはPピクチャの基本周期(フレーム数)、GOP_NはIピクチャの基本周期(フレーム数)であり、ピクチャタイプptypeを決定する。周期的にピクチャタイプを決定する方法は、図7に示した従来方法のフローチャートと同様であるが、ステップ802が追加されていることが異なる。以下、GOP_N=15フレーム、GOP_M=3フレームとした場合の例を説明する。
図8のピクチャタイプ決定フローチャートの各ステップを説明する。
(ステッ701) 過去のPピクチャからのフレーム数mがGOP_M以上であるか判断する。GOP_M以上の場合はステップ702へ、そうでない場合はステップ802へ進む。
(ステップ702) 過去のIピクチャからのフレーム数nがGOP_N以上であるか判断する。GOP_N以上の場合はステップ703へ、そうで無い場合は、ステップ707へ進む。
(ステップ703) ピクチャタイプをIピクチャとする。ステップ704へ進む。
(ステップ704) nを0にリセットする。ステップ705へ進む。
(ステップ705) mを0にリセットする。ステップ706へ進む。
(ステップ706) n、mを1つずつ加算していく。終了。
(ステップ707) ピクチャタイプをPピクチャとする。ステップ705へ進む。
(ステップ802) 現在のフレームのトップフィールドもしくはボトムフィールドがコピーフィールドであるかどうかの判定を行う。コピーフィールドでない場合はステップ708へ、コピーフィールドである場合はステップ702へ進む。
(ステップ708) ピクチャタイプをBピクチャとする。ステップ706へ進む。
上記のように、mがGOP_M(3フレーム)未満の場合、従来は常にBピクチャとしていたが、本発明の符号化装置では現在のフレームのトップフィールドもしくはボトムフィールドがコピーフィールドである場合は、IピクチャまたはPピクチャとする。
図5に、テレシネ変換パターンの一例と、従来の周期的に決定されたピクチャタイプを示す。ここで、フレーム513のトップフィールド503tはフレーム512のトップフィールド502tのコピーフィールドとし、フレーム515のボトムフィールド505bはフレーム514のボトムフィールド504bのコピーフィールドである。同様にフレーム518のトップフィールド508t、フレーム520のボトムフィールド510bはコピーフィールドである。ここで、従来はフレーム513をIピクチャとし、フレーム516、519をPピクチャとし、残りをBピクチャとなる。
次に、図4(a)に、図5と同じテレシネ変換パターンの映像に対して、本発明の符号化装置によって決定したピクチャタイプを示す。
ここで、フレーム423のトップフィールド413tはフレーム422のトップフィールド412tのコピーフィールドとし、フレーム425のボトムフィールド415bはフレーム424のボトムフィールド414bのコピーフィールドである。同様にフレーム428のトップフィールド418t、フレーム430のボトムフィールド420bはコピーフィールドである。
図8に示した本発明のピクチャタイプ決定方法によれば、コピーフィールド413tをもつフレーム423はIピクチャとし、フレーム425、428、430はPピクチャとし、残りをBピクチャとする。
Bピクチャとしたフレーム424の参照画像はIピクチャとしたフレーム423とPピクチャとしたフレーム425であるが、Bピクチャのボトムフィールド414bとPピクチャのボトムフィールド415bはコピーフィールドの関係にあるので、Bピクチャのボトムフィールド414bの予測誤差信号はほぼ0とすることができる。
したがって、フレーム424のBピクチャのうちボトムフィールド414bに対する符号量を大きく削減することが可能となる。
同様に、Bピクチャであるフレーム427のトップフィールド417t、フレーム429のボトムフィールド419bの符号量を従来よりも大きく削減することが可能となる。
これにより、従来符号化よりも効率的に符号量を削減することができ、高画質な圧縮符号化を実現することができる。なお、各フレームはフィールド構造で符号化するとしてもよい。すなわち、互いにコピーフィールドでの関係にある場合、いずれか一方のフィールドを参照フィールドとし、他方のフィールドをフィールド間予測符号化するようにピクチャタイプを決定する。
図12(a)に各フィールドに対するピクチャタイプを示している。ピクチャタイプの決定方法は図8のフローチャートと同様にフレーム単位で各フィールドのピクチャ単位を決定すればよい。なお、Iフレームに対しては、トップフィールドをIピクチャ、ボトムフィールドをPピクチャとしている。
Bピクチャとしたフィールド414bの参照画像はIピクチャとしたフィールド413tとPピクチャとした413b、415t、415bであるが、フィールド414bとPピクチャのフィールド415bはコピーフィールドの関係にあるので、フィールド414bの予測誤差信号はほぼ0とすることができる。したがって、フィールド414bに対する符号量を大きく削減することが可能となる。
これにより、従来符号化よりも効率的に符号量を削減することができ、高画質な圧縮符号化を実現することができる。
(実施の形態2)
図10は、本発明の実施の形態2であるビデオ符号化装置の実施例を説明するためのピクチャタイプ決定のフローチャートである。
本発明の実施の形態2のビデオ符号化装置ブロック図は、本発明の実施の形態1と同様であるが、ピクチャタイプ決定器102の動作内容が異なる。以下、図10のピクチャタイプ決定フローチャートの各ステップを説明する。
(ステップ701) 過去のPピクチャからのフレーム数mがGOP_M以上であるか判断する。GOP_M以上の場合はステップ702へ、そうでない場合はステップ1002へ進む。
(ステップ702) 過去のIピクチャからのフレーム数nがGOP_N以上であるか判断する。GOP_N以上の場合はステップ703へ、そうで無い場合は、ステップ707へ進む。
(ステップ703) ピクチャタイプをIピクチャとする。ステップ704へ進む。
(ステップ704) nを0にリセットする。ステップ705へ進む。
(ステップ705) mを0にリセットする。ステップ706へ進む。
(ステップ706) n、mを1つずつ加算していく。終了。
(ステップ707) ピクチャタイプをPピクチャとする。ステップ705へ進む。
(ステップ1002) 次のフレームのトップフィールドが現フレームのトップフィールドのコピーであるか、もしくは現在のフレームのボトムフィールドが前フレームのボトムフィールドのコピーであるかの判定を行う。いずれもコピーフィールドでない場合はステップ708へ、どちらかがコピーフィールドである場合はステップ702へ進む。
(ステップ708) ピクチャタイプをBピクチャとする。ステップ706へ進む。
なお、ステップ1002において次フレームのトップフィールドがコピーフィールドであることを検出するためには、フレーム遅延器100によってセレクタへの入力を1フレーム以上遅延させればよい。
従来のビデオ符号化装置では、mがGOP_M以下の場合は常にBピクチャとしていたが、本発明の実施の形態2の符号化装置では、次フレームのトップフィールドが現フレームのトップフィールドのコピーである場合、もしくは現フレームのボトムフィールドが前フレームのボトムフィールドのコピーである場合は、IピクチャまたはPピクチャとする。
次に、図4(b)に、従来例として示した図5と同じテレシネ変換パターンの映像に対して、本発明の実施の形態2の符号化装置によって決定したピクチャタイプを示す。
ここで、フレーム453のトップフィールド443tはフレーム452のトップフィールド442tのコピーフィールドであり、フレーム455のボトムフィールド445bはフレーム454のボトムフィールド444bのコピーフィールドである。同様にフレーム458のトップフィールド448t、フレーム460のボトムフィールド450bはコピーフィールドである。
図10に示した本発明のピクチャタイプ決定方法によれば、コピーフィールド442tをもつフレーム452はIピクチャとし、フレーム455、457、460はPピクチャとし、残りをBピクチャとする。
例えば、Bピクチャとしたフレーム453の符号化において、参照画像はIピクチャとしたフレーム452とPピクチャとしたフレーム455であるが、Bピクチャのトップフィールド443tはIピクチャのトップフィールド442tのコピーフィールドであるので、予測誤差信号はほぼ0とすることができる。したがって、フレーム453のBピクチャのうちトップフィールド443tに対する符号量を大きく削減することが可能となる。
さらに、Iピクチャとしたフレーム452はフィルムの1つのコマに対応する。つまり、トップフィールド442tとボトムフィールド442bは同一時刻の映像信号(プログレッシブフレーム)である。同様に、ピクチャとしたフレーム455、457、460はフィルム1コマに対応し、それぞれトップ/ボトムフィールドは同一時刻のフレームである。
一般的にインターレース信号のフレームはトップフィールドとボトムフィールドは1/60秒の時間的ずれがあるので、1/60秒の絵柄の動き、あるいは変化が含まれる。つまり、フレーム内において時間的変化と空間的変化の両方をあわせて持った信号である。例えば、フレーム453、454、456、458、459はインタレースのフレーム信号である。
一方、フレーム452、455、457、460のトップ/ボトムフィールドは同一時刻の信号であるので、フレーム内における時間的変化はなく空間的な信号変化のみとなる。これは通常のインタレースビデオ信号のフレームと比べてフレーム内の信号の相関性が高いことを意味する。圧縮符号化は信号の相関性を利用して行われるので、信号の相関性が高いとより効率的に圧縮することが可能である。
また、Pピクチャの符号化において、フィールド間の時間的ずれはないのでフレーム単位での予測符号化を行うことで効率的な符号化を行うことができる。
以上のように、テレシネ変換パターンにしたがってピクチャタイプを決定することで、Iピクチャのフレーム内相関を高めることで圧縮効率を向上させ、Pピクチャにおいてはフレーム内相関を高めるとともにフレーム間予測効率を向上させることができ、さらにBピクチャではコピーフィールドを利用して効率的な予測符号化を実現することができる。
なお、テレシネ変換パターンの検出としてコピーフィールドを検出する方法を説明したが、これに限定されるものではない。例えば、フレーム内のトップフィールドとボトムフィールド間の時間的なズレを検出することによってテレシネ変換パターンを検出してもよい。トップ/ボトムフィールドが同一時刻の信号であるとして検出した場合、そのフレームをIピクチャまたはPピクチャとし、同一時刻でない信号の場合はBピクチャとすればよい。これにより、実施の形態2と同様の効果を得ることができる。なお、フィールド間の時間的なズレの検出にはトップフィールドとボトムフィールド間の差分、あるいは相関係数などを算出すればよい。
なお、DCTをフレーム単位またはフィールド単位で行うかのDCTモード選択において、トップ/ボトムフィールドが同一時刻である場合は、フレームDCTモードを選択しやすくなるように制御してもよい。また、逆に同一時刻でない場合は、フィールドDCTモードを選択しやすいようにしてもよい。
なお、Pピクチャにおいてトップ/ボトムフィールドが同一時刻である場合は、フレーム単位での予測をフィールド単位予測よりも選択しやすくしてもよい。
(実施の形態3)
図13は、本発明の実施の形態3であるビデオ符号化装置のブロック図である。
本発明の実施の形態3のビデオ符号化装置は、本発明の実施の形態2と同様であるが、ピクチャ構造決定器1301を備えている点が異なる。ピクチャタイプ決定器102のピクチャタイプ決定フローチャートは図10の同じである。
ピクチャ構造決定器1301はピクチャタイプ決定器102によって選択された各符号化手段104、105、106で処理するフレームをフレーム構造とするか、フィールド構造として符号化するかを決定し、各符号化手段104、105、106を制御するものである。ピクチャ構造決定器1301は、同一のフィルムコマからなるフレームの場合はフレーム構造とし、そうでないフレームはフィールド構造になるようにする。
図12(b)に本発明の実施の形態3によって選択されたピクチャタイプおよびピクチャ構造の例を示している。
このように同一のフィルムコマなるフレームはフレーム内の相関が高いためフレーム単位で符号化した方が圧縮効率が高い。一方、異なるフィルムコマからなるフレームはフレーム内の相関性が低いためフィールド単位で符号化するほうが圧縮効率は高まり、より低レートで高画質の映像を得ることが可能となる。
また、図12(c)にあるようにIピクチャのフレーム、Pピクチャのフレームはフレーム構造とし、Bピクチャのフレームはフィールド構造としてもよい。
Bピクチャとしたフィールド443tはコピーフィールドの関係にあるフレーム452を参照画像とすることで予測効率は高まり、フィールド443bはフレーム452と455を参照画像として両方向予測することで符号化効率が高めることができる。このようにテレシネ変換パターンによって決定したピクチャタイプによって一意的にフレーム構造/フィールド構造を決定することで、フレーム構造/フィールド構造の選択が簡素化できる。
(実施の形態4)
図9は、本発明の実施の形態4であるビデオ符号化装置の実施例を説明するためのブロック図である。実施の形態1のビデオ符号化装置と同様にテレシネ変換パターンにしたがってピクチャタイプを決定するが、符号化モード制御901を備えており、符号化モード制御901がフレーム内符号化処理部904、前方向フレーム間予測符号化処理部905、両方向フレーム間予測符号化処理部906を制御することが異なる。
符号化モード制御901はテレシネ変換パターンにしたがって各ピクチャタイプでの符号化モード選択動作を制御する。
以下、各ピクチャタイプにおける動作を説明する。
まず、Iピクチャの場合、対象フレームがテレシネ変換パターン検出からフィルムの同一コマから構成されたフレーム(プログレッシブフレーム)であると判断した場合は、DCTモード選択におけるフレームDCTモードを選択しやすくする。DCTモード選択はフレーム単位でブロック化した場合の信号分散値とフィールド単位でブロック化した場合の信号分散値を比較し、分散値の小さい方を選択すればよい。ここで、プログレッシブフレームの場合はフィールドDCTブロックの信号分散値に対して所定の正のオフセット、あるいは1以上の所定倍率をかけるなどして、フィールドDCTブロックの信号分散値が大きくなるように重み付ける。これにより、プログレッシブフレームの場合はフレームDCTモードを選択しやすいようにする。ところで、フィールドDCTモードは、トップフィールドとボトムフィールドの時刻が異なることから絵柄が変化している場合はフィールド単位でブロック化するほうが有効である。しかし、フィールド単位のブロック化は偶数ラインおき、あるいは奇数ラインおきでブロックを構成するので、ブロックの垂直画素間の距離が2ラインになり垂直方向の相関性は低下する。一方、フレーム内で動きがない場合はフレームDCTモードが有効である。これはブロックの垂直画素間の距離が1ラインであり、垂直方向の相関性が高いので圧縮効率が高まるのである。
このように、フィルムの1コマから構成されるフレームであればフレームDCTモードを選択することで、効率的に圧縮することができる。
対象フレームがプログレッシブフレームであることを検出するためには、トップフィールドとボトムフィールド間の差分、相関係数などを検出すればよいが、コピーフィールドの検出結果から検出してもよい。例えば、トップフィールドのコピーフィールドが検出された場合、コピー元のトップフィールドをもつフレームはプログレッシブフレームである。2つのトップフィールドが同一時刻の信号であるということは、このトップフィールドの時間的間に位置するボトムフィールドもまた同一時刻の信号であると判断できるからである。つまり、コピー元のトップフィールドとボトムフィールドで構成されるフレームはプログレッシブフレームと判断できる。同様にボトムフィールドがコピーフィールドであるフレームもプログレッシブフレームとして判断できる。
また、通常のテレシネ変換パターンは図2にあるように、プログレッシブフレームが3フレーム続いた後、インタレースフレームが2フレーム続くことから、コピーフィールドの検出位置と変換パターンからプログレッシブフレームを検出してもよい。
また、実施の形態2で説明したビデオ符号化装置では、テレシネ変換パターンにしたがって決定したIピクチャはプログレッシブフレームとなるので、常にフレームDCTを選択しやすくしてもよい。
次にPピクチャの場合について説明する。Iピクチャと同様にフィルムの同一コマから構成されたフレーム(プログレッシブフレーム)であればフレームDCTを選択しやすいようにDCTモード選択において重み付けを行う。また、予測モード選択はフレーム間予測モードとフィールド間予測モードとをマクロブロック単位に選択することができるが、プログレッシブフレームの場合は、フレーム間予測モードを選択しやすいようにする。予測モード選択は予測誤差信号の分散、絶対値総和などを評価値として、評価値の小さい方を選択するが、プログレッシブフレームの場合は、フィールド間予測の評価値を大きくなるように重み付けるなどすればよい。
フィールド間予測モードはトップフィールド、ボトムフィールドで異なる動きをしている場合に有効であるが、各々のフィールドに対する動きベクトル量を伝送する必要があり、動きベクトル符号量はフレーム間予測モードよりも多くなる。したがって、フィルムの同一コマからなるフレームである場合はフレーム間予測により符号化する方が効率よく圧縮することができるのである。
対象フレームがプログレッシブフレームであることを検出する方法はIピクチャの場合と同様である。また、実施の形態2で説明したビデオ符号化装置では、テレシネ変換パターンにしたがって決定したPピクチャはプログレッシブフレームとなるので、常にフレームDCTモード、およびフレーム間予測モードを選択するようにしてもよい。
次にBピクチャの場合について説明する。
テレシネ変換パターンにしたがって予測モードを制御する。図4(b)を用いて予測モードの制御例を説明する。Bピクチャであるフレーム453を例にする。フレーム453のトップフィールド443tはIピクチャであるフレーム452のトップフィールド442tのコピーフィールドである。この場合、トップフィールド443tはフレーム452を参照画像とする前方予測モードを選択する。こうすることでトップフィールド443tの予測誤差信号は0とすることができ符号量を削減することができる。また、トップフィールド442tを参照画像としたフィールド間予測モードを選択してもよい。ボトムフィールド443bについては、同様にフレーム452を参照画像としてもよいし、フレーム452およびフレーム455を参照画像としてもよい。トップフィールド443tとボトムフィールド443bとを各々フィールド構造として符号化してもよい。フィールド構造とすることで、それぞれのフィールドに最適な参照画像を選択することができる。
以上のように、テレシネ変換パターンにしたがって、DCTモード、予測モードといった符号化モードを選択制御することで効率的な圧縮符号化を実現することができる。
なお、MPEG2符号化方式に適用した場合を説明したが、これに限らずMPEG4などフレーム内符号化、フレーム間予測符号化を行う符号化方式であれば何でも構わない。
なお、本発明の実施の形態として符号化装置を説明したが、ソフトウェアのプログラムとして実現してよい。各ブロックを処理ステップとして置き換えればよい。
本発明にかかるビデオ符号化装置および符号化方法は、映画フィルム素材をテレシネ変換して得られたビデオ信号をテレシネ変換パターンに従って効率的に圧縮符号化するので、長時間で高画質な記録が必要な録画装置、あるいは、限られた伝送レートの伝送路においても高画質な映像を伝送するといった用途にも適用できる。
本発明の実施の形態1による記録装置を説明するためのブロック図 フィルムコマをビデオフレームに変換するテレシネ変換パターンの図 MPEG2符号化方式のピクチャタイプ、および、フレーム予測とフィールド予測を示した図 本発明の実施の形態1および実施の形態2によるテレシネ変換パターンとピクチャタイプを説明した図 従来例のピクチャタイプを説明した図 本発明の実施の形態1のテレシネ変換パターン検出器の構成例を説明するためのブロック図 従来例のピクチャタイプ決定フローチャート 本発明の実施の形態1のピクチャタイプ決定フローチャート 本発明の実施の形態4によるビデオ符号化装置を説明するためのブロック図 本発明の実施の形態2のピクチャタイプ決定フローチャート MPEG2符号化方式のDCTモードのブロック化を示した図 本発明の実施の形態1および実施の形態3によるピクチャタイプおよびピクチャ構造を説明した図 本発明の実施の形態3であるビデオ符号化装置のブロック図
符号の説明
100 フレーム遅延器
101 テレシネ変換パターン検出器
102 ピクチャタイプ決定器
103 セレクタ
104 フレーム内符号化部
105 前方向フレーム間予測符号化部
106 両方向フレーム間予測符号化部
201、202、203、204 フィルムのコマ
211t、212t、213t、214t、215t トップフィールド
211b、212b、213b、214b、215b ボトムフィールド
221、222、223、224、225 フレーム
301 Iピクチャのフレーム(Iフレーム)
301t Iフレームのトップフィールド
301b Iフレームのボトムフィールド
302、303 Bピクチャのフレーム(Bフレーム)
302t、303t Bフレームのトップフィールド
302b、303b Bフレームのボトムフィールド
304 Pピクチャのフレーム(Pフレーム)
304t Pフレームのトップフィールド
304b Pフレームのボトムフィールド
411t、412t、413t、414t、415t、416t、417t、418t、419t、420t トップフィールド
411b、412b、413b、414b、415b、416b、417b、418b、419b、420b ボトムフィールド
421、422、423、424、425、426、427、428、429、430 フレーム
431t、432t、433t、434t、435t、436t、437t、438t、439t、440t トップフィールド
431b、432b、433b、434b、435b、436b、437b、438b、439b、440b ボトムフィールド
451、452、453、454、455、456、457、458、459、450 フレーム
501t、502t、503t、504t、505t、506t、507t、508t、509t、510t トップフィールド
501b、502b、503b、504b、505b、506b、507b、508b、509b、510b ボトムフィールド
511、512、513、514、515、516、517、518、519、520 フレーム
601 第1のフィールドメモリ
602 第2のフィールドメモリ
603 絶対値差分演算部
604 比較器
701 Pピクチャの挿入周期をチェックするステップ
702 Iピクチャの挿入周期をチェックするステップ
703 ピクチャタイプをIピクチャに設定するステップ
704 Iピクチャからの数えるフレームカウンタnをリセットするステップ
705 I、Pピクチャからの数えるフレームカウンタmをリセットするステップ
706 フレームカウンタn、mをイクリメントするステップ
707 ピクチャタイプをPピクチャに設定するステップ
708 ピクチャタイプをBピクチャに設定するステップ
802 コピーフィールドをチェックするステップ
901 符号化モード制御部
904 フレーム内符号化部
905 前方向フレーム間予測符号化部
906 両方向フレーム間予測符号化部
1002 コピーフィールドをチェックするステップ
1101、1102、1103、1104 フレームDCTモードのDCTブロック
1111、1112 フィールドDCTモードのトップフィールドのDCTブロック
1113、1114 フィールドDCTモードのボトムフィールドのDCTブロック

Claims (19)

  1. インタレースビデオ信号を圧縮符号化する装置であって、フレームまたはフィールド内符号化手段と、前方向フレームまたはフィールド間予測符号化手段と、両方向フレームまたはフィールド間予測符号化手段と、コピーフィールド検出手段とを具備し、前記コピーフィールドの検出結果にしたがって、前記フレームまたはフィールド内符号化手段と前記前方向フレームまたはフィールド間予測符号化手段と前記両方向フレームまたはフィールド間予測符号化手段のうちいずれか一つを選択して符号化処理することを特徴とする符号化装置。
  2. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドを属するフレームをフレーム内符号化、または前方向フレーム間予測符号化とすることを特徴とする請求項1記載の符号化装置。
  3. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドをフィールド内符号化、または前方向フィールド間予測符号化とすることを特徴とする請求項1記載の符号化装置。
  4. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方が属するフレームを参照フレームとし、他方のフィールドが属するフレームをフレーム間予測符号化することを特徴とする請求項1記載の符号化装置。
  5. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照フィールドとし、他方のフィールドをフィールド間予測符号化することを特徴とする請求項1記載の符号化装置。
  6. テレシネ変換されたインターレースビデオ信号を圧縮符号化する装置であって、フレームまたはフィールド内符号化手段と、前方向フレームまたはフィールド間予測符号化手段と、両方向フレームまたはフィールド間予測符号化手段と、テレシネ変換パターン検出手段とを具備し、テレシネ変換パターンにしたがって前記フレームまたはフィールド内符号化手段と前記前方向フレームまたはフィールド間予測符号化手段と前記両方向フレームまたはフィールド間予測符号化手段のうちいずれか一つを選択して符号化処理することを特徴とする符号化装置。
  7. テレシネ変換パターンを検出する手段は、ビデオフレームが同一のフィルムコマから変換されたものであるか、異なるフィルムコマから変換されたものであるかを検出することを特徴とする請求項6記載の符号化装置。
  8. テレシネ変換パターンを検出する手段は、ビデオフレームまたはフィールド間の信号レベル差分を演算する手段を具備することを特徴とする請求項6記載の符号化装置。
  9. ビデオフレームが同一のフィルムコマから変換されたものである場合、該ビデオフレームをフレームまたはフィールド内符号化、または前方向フレームまたはフィールド間予測符号化することを特徴とする請求項7記載の符号化装置。
  10. テレシネ変換されたインターレースビデオ信号を圧縮符号化する装置であって、フィールド単位で符号化処理する手段とフレーム単位で符号化処理する手段と、テレシネ変換パターンを検出する手段とを具備し、テレシネ変換パターンにしたがってフレーム単位で符号化処理するか、フィールド単位で符号化処理するかを選択することを特徴とする符号化装置。
  11. フレーム単位で複数の画素からなるブロックに分割する手段と、フィールド単位で複数の画素かなるブロックに分割する手段と、前記フレーム単位でブロック化するかフィールド単位でブロック化するかを選択する手段と、選択されたブロックを周波数変換して符号化する手段を具備し、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム単位でブロック化することが選ばれやすくし、そうでない場合はフィールド単位でブロック化することが選ばれやすくするようにすることを特徴とする請求項10記載の符号化装置。
  12. フレーム単位で複数の画素からなるブロックに分割する手段と、フィールド単位で複数の画素かなるブロックに分割する手段と、前記フレーム単位でブロック化するかフィールド単位でブロック化するかを選択する手段と、選択されたブロック単位で参照画像から予測処理する手段を具備し、
    ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム単位でブロック化することが選ばれやすくし、そうでない場合はフィールド単位でブロック化することが選ばれやすくするようにすることを特徴とする請求項10記載の符号化装置。
  13. フレーム内符号化処理する手段と、フレーム間予測符号化処理する手段と、1つのフレームをフィールドに分割してフィールド内符号化処理する手段と、フィールド間予測符号化処理する手段と、フレーム内符号化処理、フレーム間予測符号化処理、フィールド内符号化処理、およびフィールド間予測符号化処理のうちいずれか1つを選択する手段を具備し、ビデオフレームが同一のフィルムコマから変換されたものである場合、フレーム内符号化処理もしくはフレーム間予測符号化処理することが選ばれやすくし、そうでない場合はフィールド内符号化処理もしくはフィールド間予測符号化処理することが選ばれやすくするようにすることを特徴とする請求項10記載の符号化装置。
  14. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照画像とし、他方のフィールドを予測符号化し、同一フィルムコマからなるビデオフレームはフレーム単位で符号化処理し、異なるフィルムコマからなるビデオフレームはフィールド単位で符号化処理することを特徴とする請求項10記載の符号化装置。
  15. インタレースビデオ信号を圧縮符号化する方法であって、フレームまたはフィールド内符号化ステップと、前方向フレームまたはフィールド間予測符号化ステップと、両方向フレームまたはフィールド間予測符号化ステップと、コピーフィールド検出ステップとを具備し、前記コピーフィールドの検出結果にしたがって、前記フレームまたはフィールド内符号化ステップと前記前方向フレームまたはフィールド間予測符号化ステップと前記両方向フレームまたはフィールド間予測符号化ステップのうちいずれか一つを選択して符号化処理することを特徴とする符号化方法。
  16. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方が属するフレームを参照フレームとし、他方のフィールドが属するフレームをフレーム間予測符号化することを特徴とする請求項15記載の符号化方法。
  17. 第1のフィールドが第2のフィールドのコピーフィールドである場合、前記第1のフィールドまたは前記第2のフィールドのいずれか一方を参照フィールドとし、他方のフィールドをフィールド間予測符号化することを特徴とする請求項15記載の符号化方法。
  18. テレシネ変換されたインターレースビデオ信号を圧縮符号化する方法であって、フレームまたはフィールド内符号化ステップと、前方向フレームまたはフィールド間予測符号化ステップと、両方向フレームまたはフィールド間予測符号化ステップと、テレシネ変換パターン検出ステップとを具備し、テレシネ変換パターンにしたがって前記フレームまたはフィールド内符号化ステップと前記前方向フレームまたはフィールド間予測符号化ステップと前記両方向フレームまたはフィールド間予測符号化ステップのうちいずれか一つを選択して符号化処理することを特徴とする符号化方法。
  19. テレシネ変換されたインターレースビデオ信号を圧縮符号化する方法であって、フィールド単位で符号化処理するステップとフレーム単位で符号化処理するステップと、テレシネ変換パターンを検出するステップとを具備し、テレシネ変換パターンにしたがってフレーム単位で符号化処理するか、フィールド単位で符号化処理するかを選択することを特徴とする符号化方法。
JP2006172144A 2006-06-22 2006-06-22 映画素材に適した映像符号化方法および符号化装置 Pending JP2008005183A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006172144A JP2008005183A (ja) 2006-06-22 2006-06-22 映画素材に適した映像符号化方法および符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006172144A JP2008005183A (ja) 2006-06-22 2006-06-22 映画素材に適した映像符号化方法および符号化装置

Publications (1)

Publication Number Publication Date
JP2008005183A true JP2008005183A (ja) 2008-01-10

Family

ID=39009211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006172144A Pending JP2008005183A (ja) 2006-06-22 2006-06-22 映画素材に適した映像符号化方法および符号化装置

Country Status (1)

Country Link
JP (1) JP2008005183A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015005136A1 (ja) * 2013-07-12 2015-01-15 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法
CN104350496A (zh) * 2012-05-30 2015-02-11 汤姆逊许可公司 用于数字媒体的大规模更新的方法和装置
JP2016026460A (ja) * 2011-04-11 2016-02-12 インテル コーポレイション ビデオ形式の検出
CN113570422A (zh) * 2021-09-26 2021-10-29 腾讯科技(深圳)有限公司 创意指导信息的生成方法、装置、计算机设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016026460A (ja) * 2011-04-11 2016-02-12 インテル コーポレイション ビデオ形式の検出
CN104350496A (zh) * 2012-05-30 2015-02-11 汤姆逊许可公司 用于数字媒体的大规模更新的方法和装置
WO2015005136A1 (ja) * 2013-07-12 2015-01-15 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法
CN113570422A (zh) * 2021-09-26 2021-10-29 腾讯科技(深圳)有限公司 创意指导信息的生成方法、装置、计算机设备和存储介质
CN113570422B (zh) * 2021-09-26 2022-02-08 腾讯科技(深圳)有限公司 创意指导信息的生成方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN101322413B (zh) 视频流中的自适应图片组结构
JP4014263B2 (ja) 映像信号変換装置及び映像信号変換方法
KR100391027B1 (ko) 비디오정보를예측부호화하는방법및장치
JP4391809B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
KR100504641B1 (ko) 화상 부호화 장치 및 화상 부호화 방법
US20020101924A1 (en) Video data processing apparatus, video data encoding apparatus, and methods thereof
JPH07109990B2 (ja) 適応型フレーム間予測符号化方法及び復号方法
JP2000261810A (ja) フェード検出装置及び情報符号化装置
JP4391810B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP3593929B2 (ja) 動画像符号化方法及び動画像符号化装置
JP4669239B2 (ja) ビデオデータを符号化するための装置および方法
JP2008005183A (ja) 映画素材に適した映像符号化方法および符号化装置
JP3450384B2 (ja) 動画像符号化装置
JP2006203597A (ja) ディジタル画像復号装置及び方法
JPH07193818A (ja) 画像処理方法および画像処理装置
US10856002B2 (en) Method, device and system for method of encoding a sequence of frames in a video stream
JP4718736B2 (ja) 動画像符号化装置
JP3690259B2 (ja) 動画像高速符号化装置及び動画像高速符号化方法
JP4871848B2 (ja) 動画像再符号化装置
JP4762860B2 (ja) 動画像符号化装置
JP2004015351A (ja) 符号化装置及び方法、プログラム、記録媒体
JP2011129979A (ja) 画像処理装置
JP3590976B2 (ja) 動画像圧縮装置
JP2006311078A (ja) 高能率符号化記録装置
JP6181242B2 (ja) 画像復号化方法