JP4315521B2 - Video compression encoding method and apparatus, and video compression encoding / decoding system - Google Patents
Video compression encoding method and apparatus, and video compression encoding / decoding system Download PDFInfo
- Publication number
- JP4315521B2 JP4315521B2 JP14891999A JP14891999A JP4315521B2 JP 4315521 B2 JP4315521 B2 JP 4315521B2 JP 14891999 A JP14891999 A JP 14891999A JP 14891999 A JP14891999 A JP 14891999A JP 4315521 B2 JP4315521 B2 JP 4315521B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- field
- image
- time stamp
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、 MPEG(Moving Picture Experts Group) 方式に代表される動画像圧縮符号化方法及びその装置、並びに動画像圧縮符号化/復号化システムに関し、より詳しくは逆 3:2プルダウン処理時のタイムスタンプ作成の技術に関する。
【0002】
【従来の技術】
逆 3:2プルダウン処理は、 3:2プルダウン処理されたNTSC信号から冗長なフィールドを間引く処理である。ところで、 3:2プルダウン処理とは、映画フィルム等の24フレームで1秒相当の動画像情報を30フレームで1秒相当のNTSCテレビジョン信号に変換する技術である。
【0003】
図9は映画フィルムのフレームをNTSCテレビジョン信号に変換する 3:2プルダウン処理の手順を示す模式図である。図9(a) は原フィルムの 4/24(1/6)秒相当の4フレームを示しており、順にF0, F1, F2, F3フレームとする。この原フィルムの4フレームF0, F1, F2, F3をNTSCテレビジョン信号に直接変換した場合、図9(b) に示すようにそれぞれのフレームがトップフィールド(奇数フィールド)t0, t1, t2, t3とボトムフィールド(偶数フィールド)b0, b1, b2, b3とで構成される。即ち、原フィルムのフレームF0はNTSCテレビジョン信号のフィールドt0, b0に、原フィルムのフレームF1はNTSCテレビジョン信号のフィールドt1, b1に、原フィルムのフレームF2はNTSCテレビジョン信号のフィールドt2, b2に、原フィルムのフレームF3はNTSCテレビジョン信号のフィールドt3, b3にそれぞれ変換される。
【0004】
そして、原フィルムのフレームF0, F1, F2, F3から得られたNTSCテレビジョン信号のフィールドt0, b0, t1, b1, t2, b2, t3, b3を、図9(c) に示されているように、フィールドt0とb2とを重複して使用することによりt0, b0, t0, b1, t1, b2, t2, b2, t3, b3の配列として10フィールド、即ちf0, f1, f2, f3, f4の5フレームに再構成する。従って、NTSCテレビジョン信号に変換後のフレームf0はフィールドt0, b0で、フレームf1はフィールドt0, b1で、フレームf2はフィールドt1, b2で、フレームf3はフィールドt2, b2で、フレームf4はフィールドt3, b3でそれぞれ構成される。
【0005】
以上のようにして、24フレームで1秒相当の映画フィルムの動画像情報が30フレーム(60フィールド)で1秒相当のNTSCテレビジョン信号に変換される。ところで、このようにして得られたテレビジョン信号をMPEG-2方式で動画像圧縮符号化する場合には、連続する10フィールドに2フィールド含まれる冗長なフィールドを間引く処理、即ち逆 3:2プルダウン処理を行なう必要がある。
【0006】
図10は、従来のMPEG-2方式による動画像圧縮符号化装置の構成例を示すブロック図である。図10において、参照符号1及び2は第1及び第2のフィールドメモリを示している。第1のフィールドメモリ1は入力されたデジタルの映像信号を1フィールド分遅延させる。参照符号4は第1のフィールドメモリからの出力を第2のフィールドメモリ2へ入力するか否かを切替えるスイッチを示しており、この切替えスイッチ4の出力、換言すれば第1のフィールドメモリ1の出力を第2のフィールドメモリ2が1フィールド分遅延させる。従って、第2のフィールドメモリ2の出力は第1のフィールドメモリ1への入力とは2フィールドの遅延が生じる。
【0007】
参照符号3は第1のフィールドメモリ1への入力と第2のフィールドメモリ2からの出力(第1のフィールドメモリ1への入力とは2フィールド遅延している)とを比較して1フィールド分の差分が所定値よりも小さい場合、より具体的には実質的に同一である場合に切替えスイッチ4の出力を無信号に、それ以外の場合に切替えスイッチ4の出力を第1のフィールドメモリ1の出力にして第2のフィールドメモリ2へ入力されるように切替える相関検出回路を示している。
【0008】
参照符号5は映像信号を圧縮処理するビデオエンコーダを、100 はビデオエンコーダ5の出力データを解析してプレゼンテーションタイムスタンプ(以下、PTS という) を計算する PTS解析回路を、101 はビデオエンコーダ5から出力された圧縮データを PTS解析回路100 が PTSの解析を行なっている間、保持しておくバッファメモリを、9はバッファメモリ101 が保持している圧縮データをパケット化し、それに PTS解析回路100 が算出したPTS を付加して出力する PTS付加回路である。
【0009】
なお、第1のフィールドメモリ1、第2のフィールドメモリ2、相関検出回路3、切替えスイッチ4により逆 3:2プルダウン処理部50が構成される。この逆 3:2プルダウン処理部50は、入力されるビデオデータの各フィールドを2フィールド前のフィールドと比較し、両者の差分が所定値よりも小さい場合、即ち相関が大きい場合に同一のフィールドであると判定して切替えスイッチ4を無信号側に切替えることにより、冗長なフィールドを除去する逆 3:2プルダウン処理を行なう。
【0010】
ビデオエンコーダ5には切替えスイッチ4の出力信号が入力されており、切替えスイッチ4が無信号側に切替えられた時点で、ビデオエンコーダ5はこれから入力されるフレームの第1フィールドを復号時にもう一度繰り返して出力するためのRFR(Repeat First Field) フラグを有効にした上でMPEG-2ビデオエレメンタリー圧縮符号化処理を行なう。
【0011】
MPEG-2のビデオエレメンタリー圧縮符号化処理では動画像の相関を利用した圧縮符号化処理を行なうため、符号化後のフレームの配列(以下、ピクチャ並びという)は原信号のピクチャ並びとは異なる順序となる。その状態を図11の模式図に、IまたはPピクチャが現れる周期が3である場合の代表的な例を示す。なお、Iピクチャ(Intra coded picture) はフレーム内符号化ピクチャと称され、1フレームのみで独立して符号化される。また、Pピクチャ(Predictive coded picture)は前方向予測符号化ピクチャと称され、Iピクチャから前方向予測により符号化される。なおこの他に、前後のI及びPピクチャを参照画像として予測符号化される双方向予測符号化ピクチャと称されるBピクチャ(Bidirectionally predictive coded picture)も存在する。
【0012】
図11(a) に示されている 3:2プルダウン処理済NTSC信号、図11(b) に示されている逆 3:2プルダウン処理及び図11(f) に示されている再生画像において、t0,t1…はフレーム0,1…のトップフィールドを、b0,b1…はフレーム0、1…のボトムフィールドをそれぞれ表わしている。また、(c) に示されているビデオ符号化処理及び(e) に示されている復号化処理において、たとえばB0,I2,P5はピクチャタイプ(B、I、P) とフレーム番号(0、2、6)とをそれぞれ示している。
【0013】
図11(a) に示されている 3:2プルダウン処理済のNTSC信号には4フィールドの周期で1フィールド(t0, b2, t4, b6, t8, b10)が重複して付加されている。この信号をデジタル変換した信号が図10に示されているビデデータ入力であり、重複している冗長なフィールドが逆 3:2プルダウン処理部50によって除去され、ビデオエンコーダ5によりビデオ符号化処理が行なわれる。
【0014】
ビデオエンコーダ5によるビデオ符号化処理では、Bピクチャはその前後のI及びPピクチャを参照画像として予測符号化されるため、参照すべきI及びPピクチャが先に符号化され、その後にBピクチャが符号化される。このため、詳細は後述するが、I,PピクチャとBピクチャの順序が入れ替わる。
【0015】
PTS解析回路100 は、ビデオエンコーダ5から出力されるエンコードデータを逐次解析してピクチャタイプ(I,PまたはB)、 RFFフラグ、フレーム周期を抽出し、これらに基づいて PTSを算出する。
【0016】
しかし、I,Pピクチャに関しては、それよりも後ろのBピクチャの RFFフラグの状態が判明しなければ PTSを算出することができない。たとえば、図11(c) に示されているI2ピクチャのPTS を算出するためには、それに先行するB0,B1ピクチャの RFFフラグを確認し、 RFFフラグが有効”1”であれば、1フィールド分のPTS を加算しなければならない。なお、図11に示されている例では、I2ピクチャのPTS は、図11(d) に示されているようにB0ピクチャの RFF フラグが有効であるため、フィールド数換算で5フィールドとなる。
【0017】
このように、I,PピクチャのPTS は次のI,Pピクチャの直前のBピクチャの情報がわからなければ確定しないため、それまでの間、データを保持して遅延出力するバッファメモリ101 が必要となる。
【0018】
従って、バッファメモリ101 は、 PTS解析回路100 がPTS を確定した時点でデータが読み出されるように制御される。バッファメモリ101 から読み出されたデータは PTS付加回路9でパケット化され、 PTS解析回路100 で算出されているPTS が付加されて出力される。
【0019】
また、コンピュータなどの汎用計算機と組み合わせて動画像圧縮符号化装置を構成する場合の一例としては、エレメンタリーストリームを作成するビデオエンコーダ5までを、即ち逆 3:2プルダウン処理部50とビデオエンコーダ5とを専用ハードウェアで構成し、それ以降の PTS解析回路100 及び PTS付加回路9の機能をソフトウェア処理により行なう構成が可能である。
【0020】
しかしこのような場合にも、同様の処理手順が必要であり、 PTS解析回路100 に対応するソフトウェアでエンコード結果を逐次解析しつつ PTS付加回路9に対応するソフトウェアでエンコードデータをパケット化すると共に PTS解析回路100 に対応するソフトウェアで算出したPTS を付加してビデオPES(Packetized Elementary Stream) を出力する。
【0021】
その後、図示していないオーディオエンコーダでエンコードしてPTS を付加したオーディオPES と、タイムスタンプの基準参照値となるSCR(System Clock Reference) と、前述のビデオPES とを図示していない多重化器で多重化してシステムストリームが作成される。このようにして作成されたシステムストリームは、復号化装置により、ビデオとオーディオのPTS 及びSCR を用いて映像と音声の同期を取りながら再生される。
【0022】
【発明が解決しようとする課題】
従来の動画像圧縮符号化装置は、以上のように構成されていたので、あるピクチャデータのタイムスタンプ情報を確定する際に、そのピクチャデータよりも後から出力されるピクチャデータの情報が必要であるため、後から出力されるピクチャデータまでの全データを保持しておくためのバッファメモリが必要になる。しかも、そのバッファメモリの容量は最大符号化レートを想定し、最大のI,Pピクチャ間隔を想定して設定されるため、大容量が必要であるという問題点があった。
【0023】
また一方では、実際に使用する符号化レート、実際のI,Pピクチャ間隔が通常は想定した最大値以下になるため、メモリの一部が冗長となって有効に使えないという問題点もあった。
【0024】
更に、パーソナルコンピュータ等の汎用コンピュータに逆 3:2プルダウン処理部50とビデオエンコーダ5とを専用ハードウェアで構成したボードを接続し、それ以降の PTS解析回路100 及び PTS付加回路9の機能をソフトウェア処理により行なう構成を採る場合においても、コンピュータの内部メモリにバッファメモリ101 に対応するメモリ容量が要求される。
【0025】
本発明はこのような事情に鑑みてなされたものであり、大容量で冗長なバッファメモリを設ける必要の無い動画像圧縮符号化方法及びその装置、並びに動画像圧縮符号化/復号化システムの提供を目的とする。
【0026】
【課題を解決するための手段】
本発明の請求項1に記載した動画像圧縮符号化方法は、原動画像の各フレームを1フレームが2フィールドで構成される動画像に変換し、その動画像の連続する所定数のフレームを1単位として各1単位のフレーム中の特定のフィールドを重複させることにより予め時間軸を調整してなる画像信号中の重複したフィールドを検出して一方の冗長なフィールドを削除するステップと、フィールドが削除されたことを示すフィールド削除情報を出力するステップと、冗長なフィールドが削除された後の画像信号を圧縮符号化するステップと、前記画像信号がフレーム単位で圧縮符号化される時点のフィールド数にフィールド削除回数を加えた累積フィールド数を計数すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力するステップと、計数された累積フィールド数とピクチャタイプ情報とを記憶するステップと、出力されたピクチャタイプ情報に基づいて、ピクチャタイプ情報別に記憶してある累積フィールド数の内の圧縮符号化されたピクチャタイプ情報に対応する累積フィールド数の中で最も古い累積フィールド数を順次選択するステップと、選択した累積フィールド数を基準周波数のクロック数に換算することで時間情報を計数するステップと、選択された累積フィールド数を削除するステップと、計数された時間情報を圧縮符号化された画像信号のフレーム単位に付加するステップとを含むことを特徴とする。
【0027】
このような請求項1に記載した本発明の動画像圧縮符号化方法では、画像データを圧縮符号化する時点で計数した時間情報と圧縮符号化後のピクチャタイプ情報を保持し、圧縮符号化処理された画像データのフレームのピクチャタイプ情報と同一のピクチャタイプ情報に対応する時間情報が選択されて時刻情報が確定される。従って、ある画像データのフレームの時間情報を計算するために、それ以降のフレームのフィールド削除情報である RFFフラグを検出した後に時間情報を計算するというような複雑な処理を行なわずとも済む。
【0028】
本発明の請求項2に記載した動画像圧縮符号化方法は、原動画像の各フレームを1フレームが2フィールドで構成される動画像に変換し、その動画像の連続する所定数のフレームを1単位として各1単位のフレーム中の特定のフィールドを重複させることにより予め時間軸を調整してなる画像信号中の重複したフィールドを検出して一方の冗長なフィールドを削除するステップと、フィールドが削除されたことを示すフィールド削除情報を出力するステップと、冗長なフィールドが削除された後の画像信号を圧縮符号化するステップと、時間情報を表すタイムスタンプの基準となるクロックを生成するステップと、生成したクロックを計数することにより、画像データをフレーム単位で圧縮符号化する時点のタイムスタンプを算出すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力するステップと、算出したタイムスタンプとピクチャタイプ情報とを記憶し、圧縮符号化された後の画像データのピクチャタイプ情報に対応するタイムスタンプを記憶してあるタイムスタンプの内の、圧縮符号化された後の画像データのピクチャタイプ情報と同じピクチャタイプ情報の中で最も古いタイムスタンプから順次選択するステップと、圧縮符号化後の各フレームのデータに選択したタイムスタンプを付加するステップとを含むことを特徴とする。
【0029】
本発明の請求項3に記載した動画像圧縮符号化装置は、原動画像の各フレームを1フレームが2フィールドで構成される動画像に変換し、その動画像の連続する所定数のフレームを1単位として各1単位のフレーム中の特定のフィールドを重複させることにより予め時間軸を調整してなる画像信号中の重複したフィールドを検出して一方の冗長なフィールドを削除し、フィールドが削除されたことを示すフィールド削除情報及び冗長なフィールドが削除された後の画像信号を出力するフィールド間引き手段と、該フィールド間引き手段から出力される画像信号及びフィールド削除情報を入力し、画像信号を圧縮符号化すると共に、圧縮処理したフィールド数及びフィールド削除情報を出力する圧縮符号化手段と、該圧縮符号化手段へ入力される画像信号の圧縮符号化された後の各フレームの他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力すると共に、前記フィールド間引き手段への入力時点での累積フィールド数を算出するフィールド数算出手段と、該フィールド数算出手段が算出した累積フィールド数とピクチャタイプ情報とを記憶し、前記圧縮符号化手段から出力されるピクチャタイプ情報に対応する累積フィールド数を記憶してある累積フィールド数の内の、前記圧縮符号化手段が出力するピクチャタイプ情報と同じピクチャタイプ情報の中で最も小さい累積フィールド数から順次選択するフィールド数選択手段と、前記累積フィールド数を時間を表わすタイムスタンプに換算するタイムスタンプ換算手段と、圧縮符号化後の各フレームのデータに前記タイムスタンプ換算手段が換算したタイムスタンプを付加する時間情報付加手段とを備えることを特徴とする。
【0030】
このような請求項3に記載の動画像圧縮符号化装置では、圧縮符号化手段へ入力される時点でカウントされた累積フィールド数と圧縮符号化後のピクチャタイプ情報とを保持しておき、圧縮符号化処理手段から出力されるピクチャタイプ情報と同一のピクチャタイプ情報に対応する累積フィールド数を選択するという単純な換算で時間情報が算出される。従って、ある画像データのフレームの時間情報を計算するために、それ以降のフレームのフィールド削除情報である RFFフラグを検出した後に時間情報を計算するというような複雑な処理を行なわずとも済む。
【0031】
本発明の請求項4に記載した動画像圧縮符号化装置は、原動画像の各フレームを1フレームが2フィールドで構成される動画像に変換し、その動画像の連続する所定数のフレームを1単位として各1単位のフレーム中の特定のフィールドを重複させることにより予め時間軸を調整してなる画像信号中の重複したフィールドを検出して一方の冗長なフィールドを削除し、フィールドが削除されたことを示すフィールド削除情報及び冗長なフィールドが削除された後の画像信号を出力するフィールド間引き手段と、該フィールド間引き手段から出力される画像信号及びフィールド削除情報を入力し、画像信号を圧縮符号化すると共に、圧縮処理したフィールド数及びフィールド削除情報を出力する圧縮符号化手段と、時間情報を表わすタイムスタンプの基準となるクロックを生成するクロック生成手段と、前記クロック生成手段が生成するクロックを計数することにより、画像データがフレーム単位で前記圧縮符号化手段へ入力される時点のタイムスタンプを算出すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力するタイムスタンプ算出手段と、該タイムスタンプ算出手段が算出したタイムスタンプとピクチャタイプ情報とを記憶し、前記圧縮符号化手段から出力されるピクチャタイプ情報に対応するタイムスタンプを記憶してあるタイムスタンプの内の、前記圧縮符号化手段から出力されるピクチャタイプ情報と同じピクチャタイプ情報のタイムスタンプの中で最も古いタイムスタンプから順次選択するタイムスタンプ選択手段と、圧縮符号化後の各フレームのデータに前記タイムスタンプ選択手段が選択したタイムスタンプを付加するタイムスタンプ付加手段とを備えることを特徴とする。
【0033】
このような請求項4に記載の動画像圧縮符号化装置では、圧縮符号化手段へ入力される時点でカウントされたタイムスタンプと圧縮符号化後のピクチャタイプ情報とを保持しておき、圧縮符号化処理手段から出力されるピクチャタイプ情報と同一のピクチャタイプ情報に対応するタイムスタンプを選択することによりタイムスタンプが確定される。従って、ある画像データのフレームのタイムスタンプを計算するために、それ以降のフレームのフィールド削除情報である RFFフラグを検出した後にタイムスタンプを計算するというような複雑な処理を行なわずとも済む。
【0034】
本発明の請求項5に記載した動画像圧縮符号化/復号化システムは、原動画像の各フレームを1フレームが2フィールドで構成される動画像に変換し、その動画像の連続する所定数のフレームを1単位として各1単位のフレーム中の特定のフィールドを重複させることにより予め時間軸を調整してなる画像信号中の重複したフィールドを検出して一方の冗長なフィールドを削除し、フィールドが削除されたことを示すフィールド削除情報及び冗長なフィールドが削除された後の画像信号を出力するフィールド間引き手段と、該フィールド間引き手段から出力される画像信号及びフィールド削除情報を入力し、画像信号をフレーム単位で独立して圧縮符号化されるフレーム内符号化ピクチャであるIピクチャと、該Iピクチャとのフレーム間の相関特性を利用して圧縮符号化される前方向予測符号化ピクチャであるPピクチャと、前記I及びPピクチャとのフレーム間の相関特性を利用して圧縮符号化される双方向予測符号化ピクチャであるBピクチャとに圧縮符号化すると共に、圧縮処理したフィールド数及びフィールド削除情報を出力する圧縮符号化手段と、該圧縮符号化手段へ入力される画像信号の符号化後のIピクチャまたはPピクチャの繰返し周期を取得すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報とフィールド削除情報とを抽出する情報抽出手段と、該情報抽出手段で取得、抽出したIピクチャまたはPピクチャの繰返し周期とピクチャタイプ情報とから、当該ピクチャタイプがIピクチャまたはPピクチャである場合は、1つ前のIピクチャまたはPピクチャの累積フィールド数に繰返し周期分のフィールド数と1つ前のIピクチャまたはPピクチャの次のBピクチャから当該ピクチャまでのフィールド削除回数とを加算して当該ピクチャの累積フィールド数とし、当該ピクチャタイプがBピクチャでありかつ1つ前のピクチャタイプがIピクチャまたはPピクチャである場合は、2つ前のIピクチャまたはPピクチャの累積フィールド数に”2”と2つ前のIピクチャまたはPピクチャの次のBピクチャから当該ピクチャまでのBピクチャフィールド削除回数とを加算して当該ピクチャの累積フィールド数とし、当該ピクチャタイプがBピクチャでありかつ1つ前のピクチャタイプがBピクチャである場合は、1つ前のBピクチャの累積フィールド数に”2”と当該ピクチャのフィールド削除回数とを加算して当該ピクチャの累積フィールド数とするフィールド数予測手段と、累積フィールド数を画像のタイムスタンプに換算するタイムスタンプ換算手段と、前記圧縮符号化手段により圧縮符号化された後のデータに画像のタイムスタンプを付加して画像パケットデータを出力する画像タイムスタンプ付加手段と、音声データに音声のタイムスタンプを付加して音声パケットデータを出力する音声タイムスタンプ付加手段と、前記画像タイムスタンプ付加手段から出力される画像パケットデータと前記音声タイムスタンプ付加手段から出力される音声パケットデータと基準となるタイムスタンプとを多重化して出力する多重化手段と、前記多重化手段で多重化されたデータを画像パケットデータと音声パケットデータに分離するデータ分離手段と、音声パケットデータから音声のタイムスタンプを抽出して音声の同期合わせ処理を行なう音声同期合わせ処理手段と、音声パケットデータを復号して出力する音声復号手段と、画像パケットデータから抽出した画像のタイムスタンプと基準のタイムスタンプとの差分に時間軸のフィルタ処理を行なう時間軸フィルタ手段と、該時間軸フィルタ手段から出力される値で画像の同期合わせ処理を行なう画像同期合わせ処理手段と、画像パケットデータを復号して出力する画像復号手段とを備えたことを特徴とする。
【0035】
このような請求項5に記載の動画像圧縮符号化/復号化システムでは、符号化時にI,Pピクチャのタイムスタンプが計算される。従って、それ以降に現れるBピクチャの RFFフラグを検出した後にタイムスタンプを計算するといった複雑な処理を行なわずとも済む。また、復号化時には安定な同期合わせ処理が行なわれる。
【0037】
本発明の請求項6に記載した動画像圧縮符号化/復号化システムは、請求項5の動画像圧縮符号化/復号化システムにおいて、前記時間軸フィルタ手段は、画像パケットデータから抽出した画像のタイムスタンプと基準のタイムスタンプとの差分を所定数のピクチャ分加算し、加算結果を前記所定数で除算した商を差分として時間軸のフィルタ処理を行なうべくなしてあり、前記所定数を、フィールド削除情報の繰り返しピクチャ周期と、IピクチャまたはPピクチャの繰り返しピクチャ周期との公倍数とすることを特徴とする。
【0038】
本発明の請求項7に記載した動画像圧縮符号化/復号化システムは、請求項5の動画像圧縮符号化/復号化システムにおいて、前記時間軸フィルタ手段は、画像パケットデータから抽出した画像のタイムスタンプと基準のタイムスタンプとの差分を所定数のピクチャ分加算し、加算結果を前記所定数で除算した商を差分として時間軸のフィルタ処理を行なうべくなしてあり、前記所定数を、フィールド削除情報の繰り返しピクチャ周期と、IピクチャまたはPピクチャの繰り返しピクチャ周期との最小公倍数とすることを特徴とする。
【0039】
このような請求項5、6及び7に記載の本発明の動画像圧縮符号化/復号化システムでは、応答の速い同期合わせ処理が行なわれる。
【0040】
【発明の実施の形態】
以下、本発明に係る動画像圧縮符号化装置及び動画像圧縮符号化/復号化システムを、それぞれの実施の形態を示す図面に基づき具体的に説明する。なお、以下の説明において参照する各図中と、従来例の説明において参照した各図中とで同一符号で示されている部分は同一または相当部分を示す。
【0041】
実施の形態1.
図1は本発明に係る動画像圧縮符号化装置の構成例を示すブロック図である。図1において、参照符号1及び2は第1及び第2のフィールドメモリを示している。第1のフィールドメモリ1は入力されたデジタルの映像信号を1フィールド分遅延させる。参照符号4は第1のフィールドメモリからの出力を第2のフィールドメモリ2へ入力するか否かを切替えるスイッチを示しており、この切替えスイッチ4の出力、換言すれば第1のフィールドメモリ1の出力を第2のフィールドメモリ2が1フィールド分遅延させる。従って、第2のフィールドメモリ2の出力は第1のフィールドメモリ1への入力とは2フィールドの遅延が生じる。
【0042】
参照符号3は第1のフィールドメモリ1への入力と第2のフィールドメモリ2からの出力(第1のフィールドメモリ1への入力とは2フィールド遅延している)とを比較して1フィールド分の差分が所定値よりも小さい場合、より具体的には実質的に同一である場合に切替えスイッチ4の出力を無信号に、それ以外の場合に切替えスイッチ4の出力を第1のフィールドメモリ1の出力にして第2のフィールドメモリ2へ入力されるように切替える相関検出回路を示している。
【0043】
参照符号5は映像信号を圧縮処理するビデオエンコーダを、6はビデオエンコーダ5が出力する圧縮データのフィールド数をカウントするフィールド数カウント回路を、7はフィールド数入替回路を、8はフィールド数入替回路7による処理結果をPTS に換算する PTS換算回路を、9はビデオデコーダ5が出力する圧縮データに PTS換算回路8が換算したPTS を付加して出力する PTS付加回路をそれぞれ示している。
【0044】
次に、図1に示されている本発明に係る動画像圧縮符号化装置の動作について説明する。なお、第1のフィールドメモリ1、第2のフィールドメモリ2、相関検出回路3、切替えスイッチ4により逆 3:2プルダウン処理部50が構成される。この逆 3:2プルダウン処理部50は構成及び動作共に従来と同様であり、入力されるビデオデータの各フィールドを2フィールド前のフィールドと比較し、両者の差分が所定値よりも小さい場合、即ち相関が大きい場合に同一のフィールドであると判定して切替えスイッチ4を無信号側に切替えることにより、冗長なフィールドを除去する逆 3:2プルダウン処理を行なう。
【0045】
ビデオエンコーダ5には切替えスイッチ4の出力信号が入力されており、切替えスイッチ4が無信号側に切替えられた時点で、ビデオエンコーダ5はこれから入力されるフレームの第1フィールドを復号時にもう一度繰り返して出力するためのフィールド削除情報であるRFF(Repeat First Field) フラグを有効にした上でMPEG-2ビデオエレメンタリー圧縮符号化処理を行ない、その結果として生成されるビデオエレメンタリストリームをパケット化しつつ PTS付加回路9へ出力する。
【0046】
また、ビデオエンコーダ5は、フレーム単位でビデオデータが入力される都度、入力データの符号化後のピクチャタイプ(I,P,B)及び RFFフラグの有無をフィールド数カウント回路6へ出力する。なお、ピクチャタイプはフィールド数入替回路7へも出力される。
【0047】
フィールド数カウント回路6は図2のフローチャートに示すような処理シーケンスを実行する。まず、フィールド数カウント回路6は累積フィールド数Fを初期化し (ステップS11)、次にビデオエンコーダ5へフレーム単位でビデオデータが入力される都度 (ステップS12)、入力データの符号化後のピクチャタイプ(I,P,B)と RFFフラグの有無とをビデオエンコーダ5から取得し (ステップS13)、既にカウントしている現ピクチャの累積フィールド数とピクチャタイプとをフィールド数入替回路7へ出力する (ステップS13)。
【0048】
そして、フィールド数カウント回路6は、 RFFフラグが有効である場合は (ステップS14 で”YES") 、そのピクチャのフィールド数を”3”としてカウンとし (ステップS15)、無効である場合は (ステップS14 で”NO")、”2”としてカウンとし (ステップS16)、現ピクチャの累積フィールド数に加算することにより、次に取得するピクチャの累積フィールド数として保持する (ステップS17)。
【0049】
フィールド数入替回路7には、I,Pピクチャの最大周期分とビデオエンコーダ5でのI,Pピクチャの最大遅延時間に相当するピクチャ数分のピクチャタイプと累積フィールド数とを格納するレジスタが構成されている。たとえば、I,Pピクチャの最大周期が3であり、I,Pピクチャのエンコード最大遅延時間が0.4 フレームである場合には、両者の加算値”3.4 ”が切り上げられて4ピクチャ分のレジスタがフィールド数入替回路7に構成される。そして、これらのレジスタに、フィールド数カウント回路6から出力されるピクチャの累積フィールド数とピクチャタイプとが順次格納される。
【0050】
フィールド数カウント回路6は図3のフローチャートに示すような処理シーケンスを実行する。フィールド数入替回路7は、ビデオエンコーダ5へフレーム単位でビデオデータが入力される都度 (ステップS21)、ビデオエンコーダ5から出力されるピクチャタイプを取得すると (ステップS22)、そのピクチャが出力されるタイミングにおいて、レジスタに格納されている同一のピクチャタイプで最も古いピクチャに対応する累積フィールド数を出力する (ステップS23)。なお、累積フィールド数を出力したレジスタはクリアされ (ステップS24)、新たな情報を格納するための準備が行なわれる。
【0051】
PTS換算回路8は、フィールド数入替回路7から出力された累積フィールド数が入力されると、下記の式(1) からPTS を算出して PTS付加回路9へ出力する。 PTSは90kHz のカウント数であり、映像はNTSC信号とし、フレーム周波数は29.97Hz である。
【0052】
PTS = 累積フィールド数×1/29.97 ×1/2 ×90000 …(1)
【0053】
PTS付加回路9は、ビデオエンコーダ5から出力されるビデオエレメンタリストリームをパケット化しつつ、 PTS換算回路8から出力されるPTS を付加することによりビデオPES(Packetized Elementary Stream) を出力する。
【0054】
実施の形態2.
ところで、上述した実施の形態1では本発明に係る動画像圧縮符号化装置は PTSを算出するための構成として、図1に示すように、フィールド数カウント回路6とフィールド数入替回路7と PTS換算回路8とを備えているが、他の構成を採ることも勿論可能である。そのような構成を有する本発明に係る動画像圧縮符号化装置を実施の形態2として以下に説明する。
【0055】
図4は PTSを算出するための構成として上述の実施の形態1とは異なる構成を有する本発明に係る動画像圧縮符号化装置の構成例を示すブロック図である。なお、上述の実施の形態1においては、フィールド数カウント回路6とフィールド数入替回路7と PTS換算回路8とで PTSを算出する構成としているが、この実施の形態2においては、 90kHz分周器10と PTSカウント回路11と PTS入替回路12とで PTSを算出する構成としている。
【0056】
90kHz分周器10はシステムの基準クロックである27MHz のクロックを分周することによりPTS の基準となる90kHz のクロック信号を発生して PTSカウント回路11へ入力する。
【0057】
PTSカウント回路11では、ビデオエンコーダ5から出力されるエンコード開始情報をトリガとして、 90kHz分周器10から入力されているクロック信号のカウントをスタートする。そして、 PTSカウント回路11は、ビデオエンコーダ5に映像データが入力された時点でフレーム毎に入力データが圧縮符号化された後のピクチャタイプを取得し、取得した時点のカウント値をそのピクチャのPTS としてピクチャタイプと共に PTS入替回路12へ出力する。
【0058】
PTS入替回路12には、I,Pピクチャの最大周期分とビデオエンコーダ5でのI,Pピクチャ最大遅延時間とを合わせた数に相当するピクチャのピクチャタイプと累積フィールド数とを格納するレジスタが構成されている。たとえば、I,Pピクチャの最大周期が3であり、I,Pピクチャのエンコード最大遅延時間が 0.4フレームである場合には、両者の加算値”3.4 ”を切り上げた4ピクチャ分のレジスタが PTS入替回路12に構成されている。そして、これらの各レジスタに、 PTSカウント回路11から出力される各ピクチャのPTS とピクチャタイプとが順次格納される。
【0059】
PTS入替回路l2は、ビデオエンコーダ5から出力されるピクチャタイプを取得すると、それに対応するピクチャが出力されるタイミングで、レジスタに格納してある同一のピクチャタイプの内の最も古いピクチャに対応するPTS を出力する。なお、 PTS入替回路12はPTS を出力した後は、それに対応するレジスタをクリアして新たな情報を格納できるように準備する。
【0060】
PTS付加回路9は、ビデオエンコーダ5から出力されるビデオエレメンタリストリームをパケット化しつつ、 PTS入替回路l2から出力されたPTS を付加することによりビデオPES(Packetized Elementary Stream) を出力する。
【0061】
実施の形態3.
ところで、上述した実施の形態1及び2の本発明に係る動画像圧縮符号化装置では、ビデオエンコーダ5へ入力される時点の累積フィールド数またはPTS を取得することにより PTSを算出する構成としているが、他の構成、たとえばビデオエンコーダ5から出力されたデータを解析してPTS を簡易予測するような構成を採ることも可能である。そのような構成を有する本発明に係る動画像圧縮符号化/復号化システムを実施の形態3として以下に詳細に説明する。
【0062】
図5はビデオエンコーダ5から出力されたデータを解析してPTS を簡易予測するような構成を有する本発明に係る動画像圧縮符号化/復号化システムの構成例を示すブロック図である。なお、逆 3:2プルダウン処理部50、ビデオエンコーダ5及び PTS付加回路9が備えられていることは図1及び図4に示されている実施の形態1及び2と同様であり、また PTS換算回路8が備えられていることは図1に示されている実施の形態1と同様である。
【0063】
図5において、参照符号13はビデオエンコーダ5によりエンコードされたデータから情報を抽出する情報抽出回路を、14は情報抽出回路13が抽出した情報に基づいて累積フィールド数を予測するフィールド数簡易予測回路をそれぞれ示しており、このフィールド数簡易予測回路14が予測したフィールド数が PTS換算回路8 に与えられてPTS に換算され、その結果が PTS付加回路9へ出力される。
【0064】
また、参照符号15は音声データを圧縮符号化するオーディオエンコーダを、16はオーディオエンコーダ15が圧縮符号化したオーディオデータをパケット(PES) 化してPTS を付加する PTS付加回路を、26はタイムスタンプの基準参照値となるSCR(System Clock Reference) を発生させる SCR作成回路を、17は PTS付加回路9及び16が作成したビデオPES データとオーディオPES データと SCR作成回路26が作成したSCR とを多重化する多重化回路をそれぞれ示している。
【0065】
そして、多重化回路17から出力された多重化圧縮データが磁気ディスク等の記録媒体に記録装置18により記録される。
【0066】
一方、参照符号19は記憶装置18が記録媒体から読み出したデータをビデオPES データ、オーディオPES データ及びSCR に分離する分離回路を、20は分離回路19により分離されたオーディオPES データを復号化するオーディオデコーダを、21は分離回路19により分離されたビデオPES データを復号化するビデオデコーダを、22は分離回路19により分離されたSCR から基準の時刻を発生する基準時刻生成回路を、23はオーディオエンコーダ20が符号化したオーディオ PTSと基準時刻生成回路22が生成した基準時刻とを比較して差分を出力するオーディオ PTS比較回路を、24はビデオエンコーダ21が符号化したビデオ PTSと基準時刻生成回路22が生成した基準時刻とを比較して差分を出力するビデオ PTS比較回路を、25はビデオ PTS比較回路24が出力したビデオ PTSの差分値に時間軸上のフィルタをかけて映像と音声との同期制御情報とする PTS差分フィルタである。
【0067】
情報抽出回路13は、ビデオエンコーダ5からI,Pピクチャの周期Mを取得し、ビデオエンコーダ5で符号化されたデータからピクチャタイプと RFFフラグとを抽出してフィールド数簡易予測回路14へ出力する。
【0068】
フィールド数簡易予測回路14では、図6のフローチャートに示すような処理シーケンスで現ピクチャの累積フィールド数を予測する。図6に示されているシーケンスの概略は、まず、フィールド数簡易予測回路14は、I,Pピクチャの周期とビデオエンコーダ5から出力されている現ピクチャのピクチャタイプとから、圧縮符号化処理の前後で生じるピクチャ順序の並べ替えを予測計算した累積フィールド数を算出する。更に、フィールド数簡易予測回路14は、現ピクチャの RFFフラグが有効である場合は既に予測計算してある現ピクチャの累積フィールド数に”1”を加算した結果を新たに現ピクチャの累積フィールド数とする。具体的には以下のようになる。
【0069】
たとえば、I,Pピクチャの周期Mが3である場合に、図6に示すシーケンスにより予測される累積フィールド数を図7及び図8の模式図に示す。なお、図7及び図8は本来は図7の右端と図8の左端とが接続する一枚の図である。
【0070】
図7及び図8において、動画像圧縮符号化装置へ入力されるNTSC信号がフィルム素材から 3:2プルダウン変換されたものであり、第1のフィールドメモリ1、第2のフィールドメモリ2、相関検出回路3、切替えスイッチ4で構成される逆 3:2プルダウン処理部50において逆 3:2プルダウン処理が行なわれた場合、 RFFフラグが1フレームおきに有効となってビデオエンコーダ5へ入力される(行2)。そして、ビデオエンコーダ5では、入力画像がB,B,I,B,B,P…のピクチャタイプ順でエンコードされる(行1)。この場合の正しい累積フィールド数は行3に示されているような値となる。
【0071】
ビデオエンコーダ5での符号化処理では、前後のI及びPピクチャを参照画像としてBピクチャを予測符号化するため、I,PピクチャとBピクチャの順序が入れ替わり(行4) 、 RFFフラグ及び正しい累積フィールド数もそれに応じて行5、行6に示されているようになる。
【0072】
図6に示すシーケンスにより予測された累積フィールド数を行11に示す。図6に示すように、一つ前のIまたはPピクチャの累積フィールド数IP(行7) と、2つ前のIピクチャまたはPピクチャの累積フィールド数IP1(行8) と、IまたはPピクチャの間に挟まれたBピクチャの RFFフラグの有効回数BR(行9) と、IまたはPピクチャの間に挟まれた一つ前のBピクチャの RFFフラグの有効回数BR1(行10) と、IまたはPピクチャの周期Mとから、各ピクチャの累積フィールド数F(行11) が予測される。
【0073】
図6の予測シーケンスでは、まず前述の各変数の初期設定が行なわれる (ステップS31)。具体的には、、予測フィールド数Fは”0”に、前I,Pピクチャの累積フィールド数IPは”−2”に、前々I,Pピクチャの累積フィールド数IP1 は”−8”に、I,Pピクチャに挟まれたBピクチャの RFFフラグの有効回数BRは”0”に前の連続するBピクチャの RFFフラグの有効回数BR1 は”0”に、I,Pピクチャの周期Mは”3”にそれぞれ初期設定される。
【0074】
次に、ビデオエンコーダ5のデータ出力からピクチャタイプと RFF フラグとが取得される (ステップS32)。この取得されたピクチャタイプがIまたはPピクチャであった場合は (ステップS33 で”YES") 、下記式(2) により一つ前のIまたはPピクチャの累積フィールド数IPに現ピクチャと一つ前のIまたはPピクチャ間のフィールド数(2×M)を加え、その間の RFF有効回数(BR)を加えることにより累積フィールド数Fの予測値が求められる (ステップS34)。
【0075】
F = IP+2×M+BR …(2)
【0076】
次に、現ピクチャの RFFフラグが有効な場合にのみ (ステップS35 で”YES") 、累積フィールド数Fに”1”が加えられ (ステップS36)、現ピクチャの予測累積フィールド数Pとして出力される (ステップS38)。なおこの際、IP1 がIP(行8) に、IPがF(行7) に、BR1 がBR(行10) に、 BR が”0”(行9) にそれぞれ置換される (ステップS37)。
【0077】
次に、ビデオエンコーダ5のデータ出力から取得されたピクチャタイプがBピクチャであり (ステップS33 で”NO")、しかもIまたはPピクチャのすぐ次に取得された場合は (ステップS41 で”YES") 、下記式(3) により二つ前のIまたはPピクチャの累積フィールド数IPに、現ピクチャと二つ前のIまたはPピクチャ間の圧縮符号化前のフィールド数として”2”を加え、更に二つ前のIまたはPピクチャと一つ前のIまたはPピクチャ間のBピクチャの RFF有効回数(BR1) を加える (ステップS42)。
【0078】
F = IP1 +2+BR1 …(3)
【0079】
そして、現ピクチャの RFFフラグが有効な場合にのみ (ステップS43 で”YES") 、Fに”1”が加えられて現ピクチャの累積フィールド数Fとして出力されると共に、 RFFフラグが有効な場合はBRに”1”が加えられる (ステップS44)。
【0080】
次に、ビデオエンコーダ5のデータ出力から取得されたピクチャタイプがBピクチャであり (ステップS33 で”NO")、しかも一つ前のピクチャがBピクチャである場合は (ステップS41 で”NO")、累積フィールド数Fに”2”が加えられる (ステップS45)。
【0081】
そして、現ピクチャの RFFフラグが有効な場合にのみ (ステップS43 で”YES") 、Fに”1”が加えられて現ピクチャの累積フィールド数Fとして出力されると共に、 RFFフラグが有効な場合はBRに”1”が加えられる (ステップS44)。
【0082】
このようにしてフィールド数簡易予測回路14が予測した累積フィールド数(行11) は、正しい累積フィールド数に比較して±1フィールドの差分が生じる(行l2) 。その理由は、 RFFフラグの有効、無効をそのピクチャの累積フィールド数に反映させることにあり、I,Pピクチャの繰返し周期3フレームと RFFフラグの繰返し周期2フレームとの最小公倍数6フレームにおいて±1フィールドの差分が繰返される。そして、復号時に PTS差分フィルタ25により時間軸上のフィルタをかけることにより、±1フィールド以下の実用上問題の無い高い精度で同期合わせを行なうことができる。
【0083】
また、このような予測方法を採る場合は、フィルム素材から 3:2プルダウン処理が行なわれずにNTSC信号に変換された画像データ、即ち原信号から直接得られたNTSC信号である画像データが入力された場合には逆3:2 プルダウン処理部50での逆 3:2プルダウン処理は行なわれないため、 RFFフラグは無効のままである。このため、I,Pピクチャの周期とピクチャタイプとから予測計算された累積フィールド数と正しい累積フィールド数との差分は”0”となり、不要なオフセットが生じることはない。
【0084】
このようにフィールド数簡易予測回路14から出力された現ピクチャの予測累積フィールド数は、 PTS換算回路8で式(1) により、フィールド数からPTS に変換されて PTS付加回路9へ出力される。
【0085】
PTS付加回路9は、ビデオエンコーダ5からのビデオエレメンタリストリームをパケット化しつつ、 PTS換算回路8から出力されるPTS を付加することによりビデオPES(Paeketized Elementary Stream) を出力する。
【0086】
一方、オーディオデータはオーディオエンコーダ15で圧縮符号化され、 PTS付加回路16でオーディオデータのPTS が付加されてパケット(PES) 化される。
【0087】
また、タイムスタンプの基準参照値となるSCR(System Clock Reference) が SCR作成回路26により作成されて多重化回路17へ出力される。
【0088】
ビデオPES データ、オーディオPES データ及びSCR は、多重化回路17で多重化されて一つのデータとされて記録装置18により光磁気ディスク等の記録媒体に記録される。
【0089】
記録装置18により記録媒体から読み出されたデータは、分離回路19によりビデオPES データ、オーディオPES データ及びSCR に分離され、オーディオPES データはオーディオデコーダ20で復号され、ビデオPES データはビデオデコーダ21で復号され、 SCRは基準時刻作成回路22へ入力される。
【0090】
ビデオPES データがビデオデコーダ21で復号されると、I,PピクチャはBピクチャの参照画像になるため、行13に示すように、ピクチャの順序が入替わって符号化する前の並びに戻り、累積フィールド数差分(行14) もそれに応じて入替わる。
【0091】
基準時刻生成回路22では、分離回路19から入力されるSCR を参照して基準時刻を生成する。基準時刻は図7及び図8に示されていいる正しい累積フィールド数(行3、行6) に相当するため、行14の累積フィールド数差分は予測累積フィールド数(行1)と基準時刻のフィールド数換算値との差分に等しい。
【0092】
オーディオ PTS比較回路23では、オーディオデコーダ20が抽出したオーディオPTS と基準時刻とが比較され、その差分値が出力される。オーディオデコーダ20では、その差分値を”0”とするように同期合わせ処理が行なわれる。
【0093】
同様にビデオ PTS比較回路24では、ビデオデコーダ21が抽出したビデオPTS と基準時刻とが比較されてその差分値が出力される。このビデオ PTS比較回路24から出力される差分値を PTS差分フィルタ25が6ピクチャ分保持し、6ピクチャ分毎の平均値を算出する。この算出結果は図7及び図8の行15に示されている。なお、初期値は”0”である。
【0094】
この算出結果が1フィールド相当の時間で除算され、その商に対応する数だけのフィールド数の同期合わせ制御がビデオデコーダ21で行なわれる。また、上述の除算の剰余がオーディオPTS 比較回路23へ入力されてオーディオPTS と基準時刻との差分値に加算される。この加算結果はオーディオデコーダ20へ入力され、その差分値が”0”となるように同期合わせ処理が行なわれる。即ち、1フィールド以下の端数は音声の同期合せ処理を制御することにより、音声を映像に同期させる。
【0095】
このような同期合わせ処理が行なわれることにより、映像の符号化時にPTS を簡易予測した場合にも、映像と音声とを同期させることが可能になる。
【0096】
また、 PTS差分フィルタ25が平均するピクチャ数は6ピクチャ分としてあるが、これは RFFフラグのピクチャ周期である2とI,Pピクチャ周期であるM=3との公倍数である。このように、 PTS差分フィルタ25が平均するピクチャ数を公倍数とすることにより、累積フィールド数差分の平均値がl/6 フィールド(行15) で一定になり、安定した同期合わせ処理を行なうことができるという効果もある。
【0097】
更に、 PTS差分フィルタ25が平均するピクチャ数を前述の公倍数の内の最小値、即ち最小公倍数である”6”とすることにより、応答牲が迅速な同期合わせ処理を行なうことができるという効果がある。
【0098】
【発明の効果】
以上に詳述したように本発明の動画像圧縮符号化方法及びその装置、並びに動画像圧縮符号化/復号化システムによれば、圧縮符号化手段から出力されるデータを一時格納するための大量で冗長なメモリを設ける必要が無くなるため、安価で効率的な動画像圧縮符号化装置及び動画像圧縮符号化/復号化システムを得ることができる。
【0099】
また請求項1に記載の本発明の動画像圧縮符号化方法によれば、画像データを圧縮符号化する時点で計数した時間情報と圧縮符号化後のピクチャタイプ情報を保持し、圧縮符号化処理された画像データのフレームのピクチャタイプ情報と同一のピクチャタイプ情報に対応する時間情報が選択されて時刻情報が確定されるため、ある画像データのフレームの時間情報を計算するために、それ以降のフレームのフィールド削除情報である RFFフラグを検出した後に時間情報を計算するというような複雑な処理が不要になる。
【0100】
更に請求項2及び3に記載の本発明の動画像圧縮符号化装置によれば、圧縮符号化手段へ入力される時点でカウントされた累積フィールド数と圧縮符号化後のピクチャタイプ情報とを保持しておき、圧縮符号化処理手段から出力されるピクチャタイプ情報と同一のピクチャタイプ情報に対応する累積フィールド数を選択するという単純な換算で時間情報が算出可能になる。このため、ある画像データのフレームの時間情報を計算するために、それ以降のフレームのフィールド削除情報である RFFフラグを検出した後に時間情報を計算するというような複雑な処理が不要になり、簡易な構成の動画像圧縮符号化装置を得ることができる。
【0101】
また更に請求項4及び5に記載の本発明の動画像圧縮符号化装置によれば、圧縮符号化手段へ入力される時点でカウントされたタイムスタンプと圧縮符号化後のピクチャタイプ情報とを保持しておき、圧縮符号化処理手段から出力されるピクチャタイプ情報と同一のピクチャタイプ情報に対応するタイムスタンプを選択することによりタイムスタンプが確定される。このため、ある画像データのフレームのタイムスタンプを計算するために、それ以降のフレームのフィールド削除情報である RFFフラグを検出した後にタイムスタンプを計算するというような複雑な処理が不要になり、簡易な構成の動画像圧縮符号化装置を得ることができる。
【0102】
更に請求項6に記載の本発明の動画像圧縮符号化/復号化システムによれば、符号化時にはI,Pピクチャのタイムスタンプを計算するために、それ以降に現れるBピクチャの RFFフラグを検出した後にタイムスタンプを計算するといった複雑な処理を行なう必要がない動画像圧縮符号化/復号化システムを得ることができる。
【0103】
また、請求項7,8及び9に記載の本発明の動画像圧縮符号化/復号化システムによれば、応答の速い同期合わせ処理を行なう動画像圧縮符号化/復号化システムを得ることができる。
【0104】
また請求項8及び9に記載の本発明の動画像圧縮符号化/復号化システムによれば、符号化時には安定な同期合わせ処理を行なうことができる動画像圧縮符号化/復号化システムを得ることができる。
【図面の簡単な説明】
【図1】 実施の形態1の本発明に係る動画像圧縮符号化装置の構成例を示すブロック図である。
【図2】 実施の形態1の本発明に係る動画像圧縮符号化装置のフィールド数カウント回路の処理シーケンスを示すフローチャートである。
【図3】 実施の形態1の本発明に係る動画像圧縮符号化装置のフィールド数入替回路の処理シーケンスを示すフローチャートである。
【図4】 実施の形態2の本発明に係る動画像圧縮符号化装置の構成例を示すブロック図である。
【図5】 実施の形態3の本発明に係る動画像圧縮符号化/復号化システムの構成例を示すブロック図である。
【図6】 実施の形態3の本発明に係る動画像圧縮符号化/復号化システムのフィールド数簡易予測回路の処理シーケンスを示すフローチャートである。
【図7】 実施の形態3の本発明に係る動画像圧縮符号化/復号化システムのフィールド数簡易予測回路により予測される累積フィールド数を示す模式図である。
【図8】 実施の形態3の本発明に係る動画像圧縮符号化/復号化システムのフィールド数簡易予測回路により予測される累積フィールド数を示す模式図である。
【図9】 3:2プルダウン処理の手順を示す模式図である。
【図10】 従来のMPEG-2方式による動画像圧縮符号化装置の構成例を示すブロック図である。
【図11】 従来のMPEG-2方式による動画像圧縮符号化処理を行なった場合のフレームの配列符号化前後の状態を示す模式図である。
【符号の説明】
5 ビデオエンコーダ、6 フィールド数カウント回路、7 フィールド数入替回路、8 PTS換算回路、9 PTS付加回路、10 90kHz分周器、11 PTSカウント回路、12 PTS入替回路、13 情報抽出回路、14 フィールド数簡易予測回路、15 オーディオエンコーダ、16 PTS付加回路、17 多重化回路、18 記録装置、19 分離回路、20 オーディオデコーダ、21 ビデオデコーダ、22 基準時刻生成回路、23 オーディオ PTS比較回路、24 ビデオ PTS比較回路、25 PTS差分フィルタ、26 SCR作成回路、50 逆3:2 プルダウン処理部。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a moving picture compression coding method and apparatus represented by the MPEG (Moving Picture Experts Group) system, and a moving picture compression coding / decoding system. More specifically, the present invention relates to a time for inverse 3: 2 pulldown processing. It is related to the technology of stamp making.
[0002]
[Prior art]
Inverse 3: 2 pull-down processing is processing for thinning out redundant fields from the NTSC signal subjected to 3: 2 pull-down processing. By the way, 3: 2 pull-down processing is a technique for converting moving image information equivalent to 1 second in 24 frames such as movie film into an NTSC television signal equivalent to 1 second in 30 frames.
[0003]
FIG. 9 is a schematic diagram showing the procedure of 3: 2 pull-down processing for converting a motion picture film frame into an NTSC television signal. FIG. 9 (a) shows four frames corresponding to 4/24 (1/6) second of the original film, which are F0, F1, F2, and F3 frames in order. When four frames F0, F1, F2, and F3 of this original film are directly converted into NTSC television signals, as shown in FIG. 9 (b), each frame is a top field (odd field) t0, t1, t2, t3. And bottom field (even field) b0, b1, b2, b3. That is, the frame F0 of the original film is in the fields t0 and b0 of the NTSC television signal, the frame F1 of the original film is in the fields t1 and b1 of the NTSC television signal, and the frame F2 of the original film is the field t2 of the NTSC television signal. In b2, the frame F3 of the original film is converted into fields t3 and b3 of the NTSC television signal, respectively.
[0004]
Then, the fields t0, b0, t1, b1, t2, b2, t3, b3 of the NTSC television signal obtained from the frames F0, F1, F2, F3 of the original film are shown in FIG. 9 (c). Thus, by using the fields t0 and b2 redundantly, 10 fields as an array of t0, b0, t0, b1, t1, b2, t2, b2, t3, b3, that is, f0, f1, f2, f3, Reconfigure to 5 frames of f4. Therefore, the frame f0 converted to the NTSC television signal is the fields t0 and b0, the frame f1 is the fields t0 and b1, the frame f2 is the fields t1 and b2, the frame f3 is the fields t2 and b2, and the frame f4 is the field f4 It consists of t3 and b3.
[0005]
As described above, motion picture information of a movie film corresponding to 1 second in 24 frames is converted into an NTSC television signal corresponding to 1 second in 30 frames (60 fields). By the way, when the television signal obtained in this way is compressed and encoded by the MPEG-2 system, the process of thinning out redundant fields included in two consecutive 10 fields, that is, inverse 3: 2 pull-down. It is necessary to perform processing.
[0006]
FIG. 10 is a block diagram showing a configuration example of a conventional moving picture compression encoding apparatus based on the MPEG-2 system. In FIG. 10,
[0007]
[0008]
[0009]
The
[0010]
The output signal of the
[0011]
In MPEG-2 video elementary compression coding, compression coding processing using correlation of moving images is performed, so the frame arrangement after encoding (hereinafter referred to as picture arrangement) is different from the picture arrangement of the original signal. In order. A typical example of this state is shown in the schematic diagram of FIG. 11 when the period in which an I or P picture appears is three. Note that an I picture (Intra coded picture) is called an intra-frame coded picture, and is coded independently in only one frame. A P picture (Predictive coded picture) is called a forward predictive coded picture, and is encoded from an I picture by forward prediction. In addition to this, there is a B picture (Bidirectionally predictive coded picture) called a bidirectional predictive coded picture that is predictively coded using the preceding and following I and P pictures as reference pictures.
[0012]
In the 3: 2 pull-down processed NTSC signal shown in FIG. 11 (a), the inverse 3: 2 pull-down processing shown in FIG. 11 (b) and the playback image shown in FIG. 11 (f), t0, t1,... represent the top fields of
[0013]
One field (t0, b2, t4, b6, t8, b10) is redundantly added with a period of 4 fields to the 3: 2 pull-down processed NTSC signal shown in FIG. 11 (a). A signal obtained by digitally converting this signal is the bidet data input shown in FIG. 10, and redundant redundant fields are removed by the inverse 3: 2 pull-
[0014]
In the video encoding process by the
[0015]
The
[0016]
However, for I and P pictures, PTS cannot be calculated unless the state of the RFF flag of the B picture behind it is known. For example, in order to calculate the PTS of the I2 picture shown in FIG. 11 (c), the RFF flag of the B0 and B1 pictures preceding it is confirmed. If the RFF flag is valid “1”, one field The PTS of minutes must be added. In the example shown in FIG. 11, the PTS of the I2 picture is 5 fields in terms of the number of fields because the RFF flag of the B0 picture is valid as shown in FIG. 11 (d).
[0017]
Thus, since the PTS of the I and P pictures is not determined unless the information of the B picture immediately before the next I or P picture is known, the
[0018]
Therefore, the
[0019]
In addition, as an example of the case where a moving image compression encoding apparatus is configured in combination with a general-purpose computer such as a computer, up to the
[0020]
However, even in such a case, the same processing procedure is necessary. While encoding results are sequentially analyzed by software corresponding to the
[0021]
After that, an audio PES encoded with an audio encoder (not shown) and added with PTS, an SCR (System Clock Reference) serving as a reference reference value for a time stamp, and the video PES described above are connected with a multiplexer (not shown). A system stream is created by multiplexing. The system stream created in this manner is reproduced by the decoding device while synchronizing video and audio using video and audio PTS and SCR.
[0022]
[Problems to be solved by the invention]
Since the conventional moving image compression coding apparatus is configured as described above, when determining the time stamp information of certain picture data, information on the picture data output after the picture data is necessary. For this reason, a buffer memory for holding all data up to the picture data to be output later is required. In addition, since the capacity of the buffer memory is set assuming the maximum encoding rate and the maximum I / P picture interval, there is a problem that a large capacity is required.
[0023]
On the other hand, since the encoding rate actually used and the actual I / P picture interval are usually less than the assumed maximum value, there is a problem that a part of the memory becomes redundant and cannot be used effectively. .
[0024]
In addition, a general-purpose computer such as a personal computer is connected to a board composed of dedicated 3: 2 pull-
[0025]
The present invention has been made in view of such circumstances, and provides a moving image compression encoding method and apparatus, and a moving image compression encoding / decoding system that do not require a large-capacity and redundant buffer memory. With the goal.
[0026]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided a moving image compression encoding method, wherein each frame of an original moving image is converted into a moving image in which one frame is composed of two fields, and a predetermined number of consecutive frames of the moving image are converted into one. Detecting a duplicate field in an image signal obtained by adjusting a time axis in advance by duplicating a specific field in each unit frame as a unit, and deleting one redundant field; A step of outputting field deletion information indicating that the image signal has been deleted, a step of compressing and encoding the image signal after the redundant field is deleted, and the number of fields at the time when the image signal is compressed and encoded in units of frames. Cumulative field count plus field delete count Total And outputting picture type information identifying the type of image data defining the order of arrangement with respect to other frames after the frame is compression encoded and counted Cumulative field count And picture type information are stored for each picture type information based on the output picture type information. Cumulative field count Corresponding to compression-encoded picture type information Cumulative field count Oldest of Cumulative field number Selecting sequentially, Counting the time information by converting the selected cumulative field number to the reference frequency clock number, deleting the selected cumulative field number, and counting Of adding the time information thus made to a frame unit of a compression-encoded image signal And It is characterized by including.
[0027]
In such a moving image compression encoding method according to the first aspect of the present invention, the time information counted when the image data is compression encoded and the picture type information after the compression encoding are held, and the compression encoding process is performed. The time information corresponding to the same picture type information as the picture type information of the frame of the image data thus selected is selected, and the time information is determined. Therefore, in order to calculate time information of a frame of certain image data, it is not necessary to perform a complicated process such as calculating time information after detecting an RFF flag which is field deletion information of a subsequent frame.
[0028]
The moving image compression encoding method according to
[0029]
A moving image compression encoding apparatus according to
[0030]
[0031]
According to a fourth aspect of the present invention, there is provided a moving picture compression encoding apparatus that converts each frame of an original moving picture into a moving picture having one frame consisting of two fields, and a predetermined number of consecutive frames of the moving picture are converted into one. By duplicating a specific field in each unit frame as a unit, a duplicate field in the image signal obtained by adjusting the time axis in advance is detected, and one redundant field is deleted, and the field is deleted. Field deletion information indicating that this is the case and a field thinning means for outputting an image signal after redundant fields are deleted, and an image signal and field deletion information output from the field thinning means are input, and the image signal is compressed and encoded And a compression encoding means for outputting the number of fields subjected to compression processing and field deletion information, and a time star representing time information. A clock generation unit that generates a clock serving as a reference for the image; and a time stamp at which the image data is input to the compression encoding unit in units of frames by counting the clocks generated by the clock generation unit A time stamp calculating means for outputting picture type information for specifying a type of image data defining an arrangement order with respect to another frame after the frame is compression-encoded, and a time stamp calculated by the time stamp calculating means And the picture type information, and a time stamp corresponding to the picture type information output from the compression encoding means is stored. Among the time stamps of the same picture type information as the picture type information output from the compression encoding means A time stamp selecting means; and a time stamp adding means for adding the time stamp selected by the time stamp selecting means to the data of each frame after compression encoding.
[0033]
[0034]
Claims of the
[0035]
[0037]
Claims of the
[0038]
Claims of the
[0039]
[0040]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, a moving picture compression coding apparatus and a moving picture compression coding / decoding system according to the present invention will be described in detail with reference to the drawings showing the respective embodiments. In addition, in each figure referred in the following description and each figure referred in description of a prior art example, the part shown with the same code | symbol shows the same or equivalent part.
[0041]
FIG. 1 is a block diagram showing a configuration example of a moving image compression coding apparatus according to the present invention. In FIG. 1,
[0042]
[0043]
[0044]
Next, the operation of the moving picture compression encoding apparatus according to the present invention shown in FIG. 1 will be described. The
[0045]
The output signal of the
[0046]
Further, each time video data is input in units of frames, the
[0047]
The field
[0048]
When the RFF flag is valid (“YES” in step S14), the field
[0049]
The field
[0050]
The field
[0051]
The
[0052]
PTS = Cumulative field number x 1 / 29.97 x 1/2 x 90000 (1)
[0053]
The
[0054]
By the way, in the first embodiment described above, as shown in FIG. 1, the moving picture compression coding apparatus according to the present invention calculates the PTS, as shown in FIG. 1, the field
[0055]
FIG. 4 is a block diagram showing a configuration example of a moving image compression encoding apparatus according to the present invention having a configuration different from that of the first embodiment as a configuration for calculating the PTS. In the first embodiment, the PTS is calculated by the field
[0056]
The 90
[0057]
The
[0058]
The
[0059]
When the PTS replacement circuit l2 acquires the picture type output from the
[0060]
The
[0061]
By the way, in the moving picture compression encoding apparatus according to the present invention of
[0062]
FIG. 5 is a block diagram showing a configuration example of a moving image compression encoding / decoding system according to the present invention having a configuration for simply predicting PTS by analyzing data output from the
[0063]
In FIG. 5,
[0064]
[0065]
The multiplexed compressed data output from the multiplexing
[0066]
On the other hand,
[0067]
The
[0068]
The field number
[0069]
For example, when the period M of I and P pictures is 3, the number of accumulated fields predicted by the sequence shown in FIG. 6 is shown in the schematic diagrams of FIGS. 7 and 8 are originally a diagram in which the right end of FIG. 7 and the left end of FIG. 8 are connected.
[0070]
7 and 8, the NTSC signal input to the moving image compression coding apparatus is obtained by performing 3: 2 pulldown conversion from the film material, and includes the
[0071]
In the encoding process in the
[0072]
The accumulated field number predicted by the sequence shown in FIG. As shown in FIG. 6, the cumulative field number IP of the previous I or P picture (line 7), the cumulative field number IP1 (line 8) of the previous I picture or P picture, and the I or P picture The effective number BR (line 9) of the RFF flag of the B picture sandwiched between the two, and the effective number BR1 (line 10) of the RFF flag of the previous B picture sandwiched between the I or P picture, From the period M of the I or P picture, the cumulative field number F (row 11) of each picture is predicted.
[0073]
In the prediction sequence of FIG. 6, first, the above-described variables are initially set (step S31). Specifically, the predicted field number F is “0”, the previous I and P picture cumulative field number IP is “−2”, and the previous I and P picture cumulative field number IP1 is “−8”. The effective frequency BR of the RFF flag of the B picture sandwiched between the I and P pictures is “0”, the effective frequency BR1 of the RFF flag of the previous consecutive B picture is “0”, and the cycle M of the I and P pictures is Initially set to “3”.
[0074]
Next, the picture type and the RFF flag are acquired from the data output of the video encoder 5 (step S32). If the acquired picture type is an I or P picture (“YES” in step S33), the current picture and the current picture are added to the previous I or P picture cumulative field number IP by the following equation (2). By adding the number of fields (2 × M) between the previous I or P pictures and adding the effective RFF number (BR) between them, a predicted value of the cumulative number of fields F is obtained (step S34).
[0075]
F = IP + 2 x M + BR (2)
[0076]
Next, only when the RFF flag of the current picture is valid (“YES” in step S35), “1” is added to the cumulative field number F (step S36) and output as the predicted cumulative field number P of the current picture. (Step S38). At this time, IP1 is replaced with IP (line 8), IP is replaced with F (line 7), BR1 is replaced with BR (line 10), and BR is replaced with “0” (line 9) (step S37).
[0077]
Next, when the picture type acquired from the data output of the
[0078]
F = IP1 + 2 + BR1 (3)
[0079]
Only when the RFF flag of the current picture is valid (“YES” in step S43), “1” is added to F and output as the cumulative field number F of the current picture, and when the RFF flag is valid “1” is added to BR (step S44).
[0080]
Next, when the picture type obtained from the data output of the
[0081]
Only when the RFF flag of the current picture is valid (“YES” in step S43), “1” is added to F and output as the cumulative field number F of the current picture, and when the RFF flag is valid “1” is added to BR (step S44).
[0082]
The cumulative field number (line 11) predicted by the simple field
[0083]
In addition, when such a prediction method is adopted, image data that has been converted to an NTSC signal without being subjected to 3: 2 pull-down processing from film material, that is, image data that is an NTSC signal obtained directly from the original signal is input. In such a case, the inverse 3: 2 pull-down process in the inverse 3: 2 pull-
[0084]
Thus, the predicted cumulative field number of the current picture output from the field number
[0085]
The
[0086]
On the other hand, the audio data is compressed and encoded by the
[0087]
Also, an SCR (System Clock Reference) serving as a reference reference value for the time stamp is generated by the
[0088]
The video PES data, the audio PES data, and the SCR are multiplexed by the multiplexing
[0089]
The data read from the recording medium by the
[0090]
When the video PES data is decoded by the
[0091]
The reference
[0092]
The audio
[0093]
Similarly, the video
[0094]
This calculation result is divided by the time corresponding to one field, and the
[0095]
By performing such synchronization processing, video and audio can be synchronized even when PTS is simply predicted during video encoding.
[0096]
The number of pictures averaged by the
[0097]
Further, by setting the number of pictures averaged by the
[0098]
【The invention's effect】
As described above in detail, according to the moving image compression encoding method and apparatus and the moving image compression encoding / decoding system of the present invention, a large amount of data for temporarily storing data output from the compression encoding means is used. Therefore, there is no need to provide a redundant memory, so that an inexpensive and efficient moving image compression encoding apparatus and moving image compression encoding / decoding system can be obtained.
[0099]
According to the moving image compression encoding method of the present invention as set forth in
[0100]
Furthermore, according to the moving image compression coding apparatus of the present invention as set forth in
[0101]
Furthermore, according to the moving image compression coding apparatus of the present invention as set forth in
[0102]
Furthermore, according to the moving picture compression encoding / decoding system of the present invention as set forth in
[0103]
In addition, according to the moving image compression encoding / decoding system of the present invention as set forth in
[0104]
Further, according to the moving image compression encoding / decoding system of the present invention as set forth in
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of a moving image compression coding apparatus according to the present invention in a first embodiment.
FIG. 2 is a flowchart showing a processing sequence of a field number counting circuit of the moving picture compression coding apparatus according to the first embodiment of the present invention.
FIG. 3 is a flowchart showing a processing sequence of a field number replacement circuit of the moving image compression coding apparatus according to the first embodiment of the present invention.
4 is a block diagram illustrating a configuration example of a moving image compression coding apparatus according to the present invention in
FIG. 5 is a block diagram illustrating a configuration example of a moving image compression encoding / decoding system according to the present invention in
FIG. 6 is a flowchart showing a processing sequence of a simple prediction circuit for the number of fields of a moving image compression encoding / decoding system according to the present invention in
FIG. 7 is a schematic diagram showing the cumulative number of fields predicted by the simple number-of-fields prediction circuit of the moving image compression encoding / decoding system according to the present invention in the third embodiment.
FIG. 8 is a schematic diagram showing the cumulative number of fields predicted by the simple number-of-fields prediction circuit of the moving image compression encoding / decoding system according to the present invention in the third embodiment.
FIG. 9 is a schematic diagram showing a procedure of 3: 2 pull-down processing.
FIG. 10 is a block diagram illustrating a configuration example of a moving picture compression encoding apparatus according to a conventional MPEG-2 system.
FIG. 11 is a schematic diagram showing a state before and after frame sequence encoding when a moving image compression encoding process according to the conventional MPEG-2 method is performed.
[Explanation of symbols]
5 video encoder, 6 field count circuit, 7 field number replacement circuit, 8 PTS conversion circuit, 9 PTS additional circuit, 10 90kHz frequency divider, 11 PTS count circuit, 12 PTS replacement circuit, 13 information extraction circuit, 14 field number Simple prediction circuit, 15 audio encoder, 16 PTS additional circuit, 17 multiplexing circuit, 18 recording device, 19 separation circuit, 20 audio decoder, 21 video decoder, 22 reference time generation circuit, 23 audio PTS comparison circuit, 24 video PTS comparison Circuit, 25 PTS differential filter, 26 SCR creation circuit, 50 inverse 3: 2 pull-down processor.
Claims (7)
フィールドが削除されたことを示すフィールド削除情報を出力するステップと、
冗長なフィールドが削除された後の画像信号を圧縮符号化するステップと、
前記画像信号がフレーム単位で圧縮符号化される時点のフィールド数にフィールド削除回数を加えた累積フィールド数を計数すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力するステップと、
計数された累積フィールド数とピクチャタイプ情報とを記憶するステップと、
出力されたピクチャタイプ情報に基づいて、ピクチャタイプ情報別に記憶してある累積フィールド数の内の圧縮符号化されたピクチャタイプ情報に対応する累積フィールド数の中で最も古い累積フィールド数を順次選択するステップと、
選択した累積フィールド数を基準周波数のクロック数に換算することで時間情報を計数するステップと、
選択された累積フィールド数を削除するステップと、
計数された時間情報を圧縮符号化された画像信号のフレーム単位に付加するステップと を含むことを特徴とする動画像圧縮符号化方法。By converting each frame of the original moving image into a moving image in which one frame is composed of two fields, and overlapping a specific field in each unit frame with a predetermined number of consecutive frames of the moving image as one unit. Detecting a duplicate field in an image signal obtained by adjusting a time axis in advance and deleting one redundant field;
Outputting field deletion information indicating that the field has been deleted;
Compressing and encoding the image signal after the redundant field is removed;
Wherein together with the image signal to count the cumulative number field plus Field Delete number to the number of times which is compression-encoded in frame units, defines the sequence order for another frame after the frame has been compression-encoded Outputting picture type information identifying the type of image data to be performed;
Storing the counted cumulative field number and picture type information;
Based on the output picture type information, the oldest cumulative field number among the cumulative field numbers corresponding to the compression-coded picture type information among the cumulative field numbers stored for each picture type information is sequentially selected. Steps,
Counting time information by converting the selected cumulative field number to the reference frequency clock number;
Deleting the selected cumulative field number;
Moving picture compression encoding method characterized by including the step of adding the counted time information to the frame of the compressed encoded image signal.
フィールドが削除されたことを示すフィールド削除情報を出力するステップと、
冗長なフィールドが削除された後の画像信号を圧縮符号化するステップと、
時間情報を表すタイムスタンプの基準となるクロックを生成するステップと、
生成したクロックを計数することにより、画像データをフレーム単位で圧縮符号化する時点のタイムスタンプを算出すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力するステップと、
算出したタイムスタンプとピクチャタイプ情報とを記憶し、圧縮符号化された後の画像データのピクチャタイプ情報に対応するタイムスタンプを記憶してあるタイムスタンプの内の、圧縮符号化された後の画像データのピクチャタイプ情報と同じピクチャタイプ情報の中で最も古いタイムスタンプから順次選択するステップと、
圧縮符号化後の各フレームのデータに選択したタイムスタンプを付加するステップと
を含むことを特徴とする動画像圧縮符号化方法。 By converting each frame of the original moving image into a moving image in which one frame is composed of two fields, and overlapping a specific field in each unit frame with a predetermined number of consecutive frames of the moving image as one unit. Detecting a duplicate field in an image signal obtained by adjusting a time axis in advance and deleting one redundant field;
Outputting field deletion information indicating that the field has been deleted;
Compressing and encoding the image signal after the redundant field is removed;
Generating a clock as a reference for a time stamp representing time information;
By counting the generated clocks, a time stamp at the time of compressing and encoding the image data in units of frames is calculated, and at the same time, the image data defining the arrangement order with respect to other frames after the frames are compressed and encoded Outputting picture type information identifying the type; and
An image after compression encoding among the time stamps storing the time stamp corresponding to the picture type information of the image data after storing the calculated time stamp and picture type information after compression encoding Sequentially selecting from the oldest time stamp among the same picture type information as the picture type information of the data;
Adding a selected time stamp to the data of each frame after compression encoding;
A moving image compression encoding method comprising:
該フィールド間引き手段から出力される画像信号及びフィールド削除情報を入力し、画像信号を圧縮符号化すると共に、圧縮処理したフィールド数及びフィールド削除情報を出力する圧縮符号化手段と、
該圧縮符号化手段へ入力される画像信号の圧縮符号化された後の各フレームの他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力すると共に、前記フィールド間引き手段への入力時点での累積フィールド数を算出するフィールド数算出手段と、
該フィールド数算出手段が算出した累積フィールド数とピクチャタイプ情報とを記憶し、前記圧縮符号化手段から出力されるピクチャタイプ情報に対応する累積フィールド数を記憶してある累積フィールド数の内の、前記圧縮符号化手段が出力するピクチャタイプ情報と同じピクチャタイプ情報の中で最も小さい累積フィールド数から順次選択するフィールド数選択手段と、
前記累積フィールド数を時間を表わすタイムスタンプに換算するタイムスタンプ換算手段と、
圧縮符号化後の各フレームのデータに前記タイムスタンプ換算手段が換算したタイムスタンプを付加する時間情報付加手段と
を備えることを特徴とする動画像圧縮符号化装置。By converting each frame of the original moving image into a moving image in which one frame is composed of two fields, and overlapping a specific field in each unit frame with a predetermined number of consecutive frames of the moving image as one unit. A duplicate field in an image signal obtained by adjusting the time axis in advance is detected, one redundant field is deleted, field deletion information indicating that the field has been deleted, and an image after the redundant field is deleted A field thinning means for outputting a signal;
A compression encoding means for inputting an image signal and field deletion information output from the field thinning means, compressing and encoding the image signal, and outputting the number of compressed fields and field deletion information;
Outputs picture type information that specifies the type of image data that defines the arrangement order of each frame after the compression encoding of the image signal input to the compression encoding means with respect to other frames, and the field thinning means Field number calculating means for calculating the cumulative number of fields at the time of input to
The accumulated field number and the picture type information calculated by the field number calculating means are stored, and the accumulated field number corresponding to the picture type information output from the compression encoding means is stored. Field number selection means for sequentially selecting from the smallest cumulative field number in the same picture type information as the picture type information output by the compression encoding means;
Time stamp conversion means for converting the cumulative field number into a time stamp representing time;
A moving image compression coding apparatus comprising: time information addition means for adding a time stamp converted by the time stamp conversion means to data of each frame after compression encoding.
該フィールド間引き手段から出力される画像信号及びフィールド削除情報を入力し、画像信号を圧縮符号化すると共に、圧縮処理したフィールド数及びフィールド削除情報を出力する圧縮符号化手段と、
時間情報を表わすタイムスタンプの基準となるクロックを生成するクロック生成手段と、
前記クロック生成手段が生成するクロックを計数することにより、画像データがフレーム単位で前記圧縮符号化手段へ入力される時点のタイムスタンプを算出すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報を出力するタイムスタンプ算出手段と、
該タイムスタンプ算出手段が算出したタイムスタンプとピクチャタイプ情報とを記憶し、前記圧縮符号化手段から出力されるピクチャタイプ情報に対応するタイムスタンプを記憶してあるタイムスタンプの内の、前記圧縮符号化手段から出力されるピクチャタイプ情報と同じピクチャタイプ情報のタイムスタンプの中で最も古いタイムスタンプから順次選択するタイムスタンプ選択手段と、
圧縮符号化後の各フレームのデータに前記タイムスタンプ選択手段が選択したタイムスタンプを付加するタイムスタンプ付加手段と
を備えることを特徴とする動画像圧縮符号化装置。By converting each frame of the original moving image into a moving image in which one frame is composed of two fields, and overlapping a specific field in each unit frame with a predetermined number of consecutive frames of the moving image as one unit. A duplicate field in an image signal obtained by adjusting the time axis in advance is detected, one redundant field is deleted, field deletion information indicating that the field has been deleted, and an image after the redundant field is deleted A field thinning means for outputting a signal;
A compression encoding means for inputting an image signal and field deletion information output from the field thinning means, compressing and encoding the image signal, and outputting the number of compressed fields and field deletion information;
Clock generating means for generating a clock that is a reference of a time stamp representing time information;
By counting the clocks generated by the clock generation means, a time stamp at the time when the image data is input to the compression encoding means in a frame unit is calculated, and another time after the frame is compression encoded A time stamp calculating means for outputting picture type information for specifying a type of image data defining an arrangement order with respect to a frame;
The time stamp calculated by the time stamp calculating means and picture type information are stored, and the compression code among the time stamps storing time stamps corresponding to the picture type information output from the compression encoding means is stored. A time stamp selecting means for sequentially selecting from the oldest time stamp among the time stamps of the same picture type information as the picture type information output from the converting means;
And a time stamp adding means for adding the time stamp selected by the time stamp selecting means to the data of each frame after the compression coding.
該フィールド間引き手段から出力される画像信号及びフィールド削除情報を入力し、画像信号をフレーム単位で独立して圧縮符号化されるフレーム内符号化ピクチャであるIピクチャと、該Iピクチャとのフレーム間の相関特性を利用して圧縮符号化される前方向予測符号化ピクチャであるPピクチャと、前記I及びPピクチャとのフレーム間の相関特性を利用して圧縮符号化される双方向予測符号化ピクチャであるBピクチャとに圧縮符号化すると共に、圧縮処理したフィールド数及びフィールド削除情報を出力する圧縮符号化手段と、
該圧縮符号化手段へ入力される画像信号の符号化後のIピクチャまたはPピクチャの繰返し周期を取得すると共に、そのフレームが圧縮符号化された後の他のフレームに対する配列順序を規定する画像データのタイプを特定するピクチャタイプ情報とフィールド削除情報とを抽出する情報抽出手段と、
該情報抽出手段で取得、抽出したIピクチャまたはPピクチャの繰返し周期とピクチャタイプ情報とから、
当該ピクチャタイプがIピクチャまたはPピクチャである場合は、1つ前のIピクチャまたはPピクチャの累積フィールド数に繰返し周期分のフィールド数と1つ前のIピクチャまたはPピクチャの次のBピクチャから当該ピクチャまでのフィールド削除回数とを加算して当該ピクチャの累積フィールド数とし、
当該ピクチャタイプがBピクチャでありかつ1つ前のピクチャタイプがIピクチャまたはPピクチャである場合は、2つ前のIピクチャまたはPピクチャの累積フィールド数に”2”と2つ前のIピクチャまたはPピクチャの次のBピクチャから当該ピクチャまでのBピクチャフィールド削除回数とを加算して当該ピクチャの累積フィールド数とし、
当該ピクチャタイプがBピクチャでありかつ1つ前のピクチャタイプがBピクチャである場合は、1つ前のBピクチャの累積フィールド数に”2”と当該ピクチャのフィールド削除回数とを加算して当該ピクチャの累積フィールド数とするフィールド数予測手段と、 累積フィールド数を画像のタイムスタンプに換算するタイムスタンプ換算手段と、
前記圧縮符号化手段により圧縮符号化された後のデータに画像のタイムスタンプを付加して画像パケットデータを出力する画像タイムスタンプ付加手段と、
音声データに音声のタイムスタンプを付加して音声パケットデータを出力する音声タイムスタンプ付加手段と、
前記画像タイムスタンプ付加手段から出力される画像パケットデータと前記音声タイムスタンプ付加手段から出力される音声パケットデータと基準となるタイムスタンプとを多重化して出力する多重化手段と、
前記多重化手段で多重化されたデータを画像パケットデータと音声パケットデータに分離するデータ分離手段と、
音声パケットデータから音声のタイムスタンプを抽出して音声の同期合わせ処理を行なう音声同期合わせ処理手段と、
音声パケットデータを復号して出力する音声復号手段と、
画像パケットデータから抽出した画像のタイムスタンプと基準のタイムスタンプとの差分に時間軸のフィルタ処理を行なう時間軸フィルタ手段と、
該時間軸フィルタ手段から出力される値で画像の同期合わせ処理を行なう画像同期合わせ処理手段と、
画像パケットデータを復号して出力する画像復号手段と
を備えたことを特徴とする動画像圧縮符号化/復号化システム。By converting each frame of the original moving image into a moving image in which one frame is composed of two fields, and overlapping a specific field in each unit frame with a predetermined number of consecutive frames of the moving image as one unit. A duplicate field in an image signal obtained by adjusting the time axis in advance is detected, one redundant field is deleted, field deletion information indicating that the field has been deleted, and an image after the redundant field is deleted A field thinning means for outputting a signal;
An image signal output from the field decimation means and field deletion information are input, and an I-picture that is an intra-frame coded picture in which the image signal is independently compression-coded in units of frames, and the frame between the I picture Bidirectional predictive coding that is compression-encoded using a correlation characteristic between frames of a P picture that is a forward-predictive encoded picture that is compression-encoded using the correlation characteristics of the I and P pictures Compression encoding means for compressing and encoding a B picture that is a picture and outputting the number of compressed fields and field deletion information;
Image data that obtains a repetition period of an I-picture or P-picture after encoding of an image signal input to the compression encoding means and defines an arrangement order with respect to other frames after the frame is compression-encoded Information extracting means for extracting picture type information and field deletion information for specifying the type of
From the repetition period and picture type information of the I picture or P picture acquired and extracted by the information extraction means,
If the picture type is an I picture or P picture, the cumulative field number of the previous I picture or P picture is calculated from the number of fields corresponding to the repetition period and the B picture next to the previous I picture or P picture. Add the number of field deletions to the picture to make the cumulative field number of the picture,
When the picture type is a B picture and the previous picture type is an I picture or a P picture, “2” is added to the number of accumulated fields of the previous I picture or P picture and the previous I picture Or, by adding the B picture field deletion count from the B picture next to the P picture to the picture, the cumulative field number of the picture is obtained.
If the picture type is a B picture and the previous picture type is a B picture, add “2” and the number of field deletions of the picture to the cumulative number of fields of the previous B picture. A field number predicting means for the number of accumulated fields of a picture, a time stamp converting means for converting the accumulated number of fields into a time stamp of an image,
Image time stamp adding means for adding an image time stamp to the data after being compressed and encoded by the compression encoding means and outputting image packet data;
Voice time stamp adding means for adding voice time stamp to voice data and outputting voice packet data;
Multiplexing means for multiplexing and outputting the image packet data output from the image time stamp adding means, the audio packet data output from the audio time stamp adding means, and a reference time stamp;
Data separating means for separating the data multiplexed by the multiplexing means into image packet data and audio packet data;
Voice synchronization processing means for extracting voice time stamps from voice packet data and performing voice synchronization processing;
Voice decoding means for decoding and outputting voice packet data;
Time axis filter means for performing time axis filtering on the difference between the time stamp of the image extracted from the image packet data and the reference time stamp;
Image synchronization alignment processing means for performing image synchronization alignment processing with values output from the time axis filter means;
A video compression encoding / decoding system comprising: image decoding means for decoding and outputting image packet data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14891999A JP4315521B2 (en) | 1999-05-27 | 1999-05-27 | Video compression encoding method and apparatus, and video compression encoding / decoding system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14891999A JP4315521B2 (en) | 1999-05-27 | 1999-05-27 | Video compression encoding method and apparatus, and video compression encoding / decoding system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000341685A JP2000341685A (en) | 2000-12-08 |
JP4315521B2 true JP4315521B2 (en) | 2009-08-19 |
Family
ID=15463604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14891999A Expired - Fee Related JP4315521B2 (en) | 1999-05-27 | 1999-05-27 | Video compression encoding method and apparatus, and video compression encoding / decoding system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4315521B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003018596A (en) * | 2001-07-03 | 2003-01-17 | Sony Corp | Method and apparatus for image information conversion, image information conversion program, and recording medium |
JP4543299B2 (en) * | 2001-08-06 | 2010-09-15 | ソニー株式会社 | Encoding control device, encoding control method, encoding control program, and encoding control program storage medium |
EP2346261A1 (en) * | 2009-11-18 | 2011-07-20 | Tektronix International Sales GmbH | Method and apparatus for multiplexing H.264 elementary streams without timing information coded |
-
1999
- 1999-05-27 JP JP14891999A patent/JP4315521B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000341685A (en) | 2000-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3039624B2 (en) | Audio / video synchronous playback device | |
JP3094999B2 (en) | Audio / video synchronous playback device | |
KR100290331B1 (en) | Synchronous playback device for audio-video signals | |
CN101076121B (en) | Stream generating apparatus, imaging apparatus, data processing apparatus and stream generating method | |
US6078725A (en) | Apparatus for a synchronized playback of audio-video signals | |
JP3197766B2 (en) | MPEG audio decoder, MPEG video decoder and MPEG system decoder | |
US7058129B2 (en) | Decoding method and apparatus and recording method and apparatus for moving picture data | |
KR101132043B1 (en) | Decoder and decoding method | |
JP3932546B2 (en) | MPEG video editing apparatus and MPEG video editing method | |
JP2005318502A (en) | Video recording device for recording variable frame rate, multiplexing method, video coding method, program, and recording medium | |
JP2009268129A (en) | Video recording apparatus, multiplexing method, program, and recording medium | |
JP4812171B2 (en) | Data receiving method and data receiving apparatus | |
JPH11346370A (en) | Encoding method, encoder, decoding method, decoder and recording medium | |
JP4315521B2 (en) | Video compression encoding method and apparatus, and video compression encoding / decoding system | |
US20020037052A1 (en) | Image-coding apparatus and image-coding method, data-coding appartus and data-coding method, data-recording apparatus and data-recording medium | |
JP2894958B2 (en) | Image decoding method and apparatus | |
JP2002010254A (en) | Feature point detection method and record reproduction device | |
JP3807053B2 (en) | Video / audio synchronization method and video / audio signal recording / reproducing apparatus | |
JP2001352521A (en) | Information recorder | |
JP4342977B2 (en) | Recording / reproducing apparatus, control method for recording / reproducing apparatus, control program for recording / reproducing apparatus, and recording medium storing control program for recording / reproducing apparatus | |
JPH11252058A (en) | Multiplexing device and its method | |
JPH08186822A (en) | Image decoder | |
JPH08205170A (en) | Decoding device and encoding device for dynamic image | |
KR100258926B1 (en) | Real time bitstream editing circuit in moving picture encoding apparatus | |
JP2004200798A (en) | Mpeg transport stream generating apparatus and mpeg stream recording- reproducing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090519 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090519 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130529 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140529 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |