JPWO2004014085A1 - データ処理装置およびデータ処理方法 - Google Patents

データ処理装置およびデータ処理方法 Download PDF

Info

Publication number
JPWO2004014085A1
JPWO2004014085A1 JP2004525828A JP2004525828A JPWO2004014085A1 JP WO2004014085 A1 JPWO2004014085 A1 JP WO2004014085A1 JP 2004525828 A JP2004525828 A JP 2004525828A JP 2004525828 A JP2004525828 A JP 2004525828A JP WO2004014085 A1 JPWO2004014085 A1 JP WO2004014085A1
Authority
JP
Japan
Prior art keywords
image
moving image
picture
data
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004525828A
Other languages
English (en)
Other versions
JP4192149B2 (ja
Inventor
尋紀 稲垣
尋紀 稲垣
福田 秀樹
秀樹 福田
近藤 敏志
敏志 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2004014085A1 publication Critical patent/JPWO2004014085A1/ja
Application granted granted Critical
Publication of JP4192149B2 publication Critical patent/JP4192149B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

動画像に特に動きの激しい画像が含まれるような場合であっても符号化効率を低下することなく動画像データを圧縮符号化するデータ処理装置等を提供する。動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られる。装置(100)は、動画像データを格納するメモリ(101)と、2つのフィールド画像の動画像データに基づいて、動画像の変化の程度を示すパラメータを算出する算出部(108)と、算出されたパラメータに基づいて、画面内および前方向予測符号化方式によって圧縮符号化される画像単位、および、画像単位を規定するピクチャ構造を決定する決定部(109)と、メモリに格納された動画像データを、決定されたピクチャ構造にしたがって圧縮符号化し、圧縮データを生成する処理部(102−107,110)とを備えている。

Description

本発明は、動画像データを高能率に圧縮する動画像符号化技術に関する。
動画像データを高能率に圧縮する符号化技術として、画面内符号化、前方向予測符号化および双方向予測符号化のいずれかを選択して符号化するMPEG1、MPEG2等が知られている。
このような動画像符号化技術を用いて符号化すると、動画像には、多くの場合、画面内符号化方式によって圧縮符号化された画像(以下、「Iピクチャ」と称する)と、前方向予測符号化方式によって圧縮符号化された画像(以下、「Pピクチャ」と称する)と、双方向予測符号化方式によって圧縮符号化された画像(以下、「Bピクチャ」と称する)とが混在する。Iピクチャは、時間方向の予測を用いることなくその画像のデータのみを用いて符号化される。Pピクチャは、前に位置するIピクチャまたはPピクチャを参照して予測符号化される。一方、Bピクチャは、前後に位置するIピクチャおよびPピクチャを参照して予測符号化される。参照される画像は参照画像と呼ばれ、各ピクチャタイプにしたがって予測に用いる参照画像が設定される。
図1は、双方向予測による動画像データの予測構造を示す。図中のI、PおよびBは、それぞれIピクチャ、PピクチャおよびBピクチャを示す。図示される予測構造における符号化順序は、I1、P4、B2、B3、P7、B5およびB6である。図1において、ピクチャI1は画面内符号化される。ピクチャP4は、ピクチャI1を参照画像として前方向予測符号化される。ピクチャB2およびB3は、ピクチャI1とピクチャP4を参照画像として双方向予測符号化される。さらに、ピクチャP7はピクチャP4を参照画像として前方向予測符号化され、ピクチャB5およびB6は、それぞれピクチャP4およびP7の2枚のピクチャを参照画像として双方向予測符号化される。
通常、Iピクチャ、PピクチャおよびBピクチャは周期的に配置される。図2は、Iピクチャ、PピクチャおよびBピクチャの配置を示す。一般に、IピクチャはNフレームおきに配置され、Iピクチャ同士の間にはMフレームおきにPピクチャが配置される。このとき、Iピクチャとその直後のPピクチャとの間、またはPピクチャとその直後のPピクチャとの間には(M−1)枚のBピクチャが設けられる。図3(a)、(b)および(c)は、それぞれ、M=1、M=2およびM=3の場合における動画像データ入力時と符号化時の各ピクチャタイプの順序との対応関係を示す。
図3(a)に示すように、M=1の場合は、動画像はIピクチャとPピクチャのみで構成されており、Bピクチャが存在しない。したがって、動画像内の画像の符号化順序は変更されず、符号化時の処理遅延は発生しない。次に、図3(b)に示すように、M=2の場合にはIピクチャ(またはPピクチャ)とその直後のPピクチャとの間には1枚のBピクチャが存在する。この場合には、Bピクチャの符号化開始までに1フレームの処理遅延が生じる。Bピクチャは、その前後に位置する参照画像(IピクチャおよびPピクチャ)が符号化されるまでは符号化を開始できないため、入力時の各ピクチャタイプの順序を変更してBピクチャを符号化しなければならないからである。
図3(c)に示すように、M=3の場合は、Iピクチャ(またはPピクチャ)とその直後のPピクチャとの間には2枚のBピクチャが存在する。この場合には、図3(b)と同様の理由により、Bピクチャの符号化開始までには2フレームの遅延が生じる。
Bピクチャを用いる理由は、前方向予測と後方向予測とを組み合わせた双方向予測を用いることにより予測効率を向上できるからである。また、Bピクチャは、IピクチャやPピクチャのように、後に続く予測符号化において参照画像として利用されることがないため、予測符号化時の誤差が伝播することがない。従って、IピクチャやPピクチャに比べて少ない割当て符号量で符号化しても視覚的に画質の劣化が目立ちにくいという利点もある。一方、Bピクチャを用いると、Pピクチャの前方向予測における参照画像の間隔Mは、Bピクチャが挿入される分だけ離れることになり、特に動きが速い動画像に対しては予測が当たりにくいという欠点がある。
これらに鑑みれば、動画像データの特性に応じて前方向予測における参照画像の間隔Mを動的に切り替えることによって符号化効率を向上させることができる。
前方向予測における参照画像の間隔Mを動的に切り替えて符号化を行う従来の技術として、例えば日本国特開平9−294266号公報、特開平10−304374号公報および特開2001−128179号公報に記載の技術が挙げられる。
特開平9−294266号公報には、符号化されたフレームの動きベクトルをスケーリングし、その大きさが次に符号化するフレームの動き探索範囲内に収まるように参照画像の間隔Mを制御する技術が記載されている。
特開平10−304374号公報には、符号化ブロックで得られる予測誤差またはアクティビティを用いてフレーム間予測の予測効率を算出し、この予測効率に応じて参照画像の間隔Mを制御する技術が記載されている。
特開2001−128179号公報には、各ピクチャタイプの発生符号量または符号化複雑度を用いてフレーム間予測性能を算出し、この予測性能に応じて参照画像の間隔Mを制御する技術が記載されている。
参照画像の間隔Mを切り替える以外にも、1フレームの画像が2つのフィールド画像から構成されるインターレース方式の動画像に対しては、ピクチャ構造を切り替えることによって参照画像を切り替え、符号化効率を向上させることができる。ピクチャ構造は符号化を行う単位であり、各符号化画像に対してフレーム構造またはフィールド構造を選択することができる。ピクチャ構造としてフレーム構造が選択されると、フレーム画像単位で符号化が行われる。一方、フィールド構造が選択されると、1フレームを構成する第1フィールド画像と第2フィールド画像のそれぞれを単位として符号化が行われる。
以下では、画面内符号化が行われるフィールド画像をIフィールド、前方向予測符号化が行われるフィールド画像をPフィールド、双方向予測符号化が行われるフィールド画像をBフィールドと称する。また、第1フィールド画像のタイプに着目して、第1フィールド画像がIフィールドであるフレームをIフレーム、PフィールドであるフレームをPフレーム、BフィールドであるフレームをBフレームと称する。
図4(a)、(b)および(c)は、フィールド構造におけるピクチャタイプと参照画像との関係を示す。図4(a)はIフレーム、図4(b)はPフレーム、図4(c)はBフレームを示す。図4(a)のIフレームでは、第1フィールド画像および第2フィールド画像を共にIフィールドとするタイプと、第1フィールド画像をIフィールド、第2フィールド画像をPフィールドとするタイプのいずれかが選択される。第2フィールド画像をPフィールドにする場合には、同じフレーム内の第1フィールド画像を参照画像とする。図4(b)のPフレームでは、第1フィールド画像については直前に符号化されたIフィールドまたはPフィールドを予測符号化の参照画像とする。第2フィールド画像については、同じフレーム内の第1フィールド画像(直前のフィールド画像)を参照画像として用いることができる。この結果、第2フィールド画像に対する参照画像の間隔が1フィールドになるため、特に動きの速い画像に対して予測効率を向上させることができる。図4(c)のBフレームでは、第1フィールド画像および第2フィールド画像ともに、前後のフレームのIフィールドまたはPフィールドを予測符号化の参照画像とする。
近年は、動画像の動きが特に速い場合であっても、十分な品質を保持した圧縮符号化を実現するとともに、より効率的に圧縮符号化する技術が求められている。これらを実現するためには、動画像の動きが速いか否かの判定や、十分な品質を保持し、データサイズを小さくするための符号化制御等を改善する必要があり、従来の技術では十分ではない。
本発明の目的は、動画像データの圧縮符号化において、動画像の動きの速さをより確実に判定すること、および、特に動きの速い画像が含まれるような場合であっても、符号化方式および符号化単位を動的に切り替える制御を行うことにより、十分な品質を保持した効率的な圧縮符号化を実現することである。
本発明によるデータ処理装置は、動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化する。前記動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られる。データ処理装置は、前記動画像データを格納するメモリと、前記2つのフィールド画像の動画像データに基づいて、前記動画像の変化の程度を示すパラメータを算出する算出部と、前記算出部によって算出された前記パラメータに基づいて、画面内符号化方式および前方向予測符号化方式によって圧縮符号化される画像単位、および、前記所定の画像単位を規定するピクチャ構造を決定する決定部と、前記メモリに格納された前記動画像データを、前記決定部によって決定された前記ピクチャ構造にしたがって圧縮符号化し、圧縮データを生成する処理部とを備えている。
ある好ましい実施形態において、前記算出部は、前記2つのフィールド画像間の前記動画像データの変化量に基づいて時間方向変化量を求め、および、前記2つのフィールド画像の各々について画像内の前記動画像データの変化量に基づいて空間方向変化量を求め、前記時間方向変化量および前記空間方向変化量に基づいて前記パラメータを算出する。
ある好ましい実施形態において、前記2つのフィールド画像は、前記フレーム画像の奇数ラインに対応する第1フィールド画像および偶数ラインに対応する第2フィールド画像であり、前記算出部は、前記フレーム画像内で互いに隣接する前記第1フィールド画像のラインおよび前記第2フィールド画像のラインを特定して、各ラインの画像データの差分に基づいて前記時間方向変化量を算出し、かつ、前記算出部は、前記第1フィールド画像および前記第2フィールド画像の各画像内で隣接するラインを特定して、各ラインの画像データの差分に基づいて前記空間方向変化量を算出する。
ある好ましい実施形態において、前記算出部は、各フレーム画像を複数のブロックに分割して、前記ブロックごとの画像データに基づいて前記時間方向変化量および前記空間方向変化量を算出し、各ブロックの時間方向変化量および各空間方向変化量に基づいて、全てのブロック数に対する前記動画像の変化量が所定量以上のブロックの比を前記パラメータとして算出する。
ある好ましい実施形態において、前記決定部は、前記パラメータが所定の閾値よりも大きい場合には、前記ピクチャ構造をフィールド構造に決定し、前記処理部は、前記動画像データを前記フィールド画像単位で圧縮符号化する。
ある好ましい実施形態において、前記決定部は、前記画面内符号化方式によって圧縮符号化するフィールド画像の数および前記前方向予測符号化方式によって圧縮符号化するフィールド画像の数の少なくとも一方を増加する。
ある好ましい実施形態において、前記決定部は、フィールド画像を前記画面内符号化方式または前記前方向予測符号化方式のみによって圧縮符号化する。
ある好ましい実施形態において、前記決定部は、前記算出部によって算出された前記パラメータが前記所定の閾値よりも小さくなった場合には、前記ピクチャ構造をフレーム構造に決定し、前記処理部は、前記動画像データを前記フレーム画像単位で圧縮符号化する。
ある好ましい実施形態において、前記決定部は、前方向予測符号化方式によって圧縮符号化される第1画像と前記第1画像を参照して予測符号化される第2画像とが連続している場合には、前記第2画像のピクチャ構造をフィールド構造に決定し、連続していない場合には前記第2画像のピクチャ構造をフレーム構造に決定する。
ある好ましい実施形態において、前記決定部は、前方向予測符号化方式によって圧縮符号化される第1画像と前記第1画像を参照して予測符号化される第2画像とが連続している場合には、前記第2画像のピクチャ構造をフレーム構造またはフィールド構造に決定し、連続していない場合には前記第2画像のピクチャ構造をフレーム構造に決定する。
ある好ましい実施形態において、前記決定部は、画面内符号化方式によって圧縮符号化される複数の画像または前方向予測符号化方式によって圧縮符号化される複数の画像に基づいて決定される周期に応じて、前記前方向予測符号化方式によって圧縮符号化される画像のピクチャ構造を決定する。
ある好ましい実施形態において、前記決定部は、画面内符号化方式によって圧縮符号化される前記複数の画像に基づいて決定される周期に応じて、前記前方向予測符号化方式によって圧縮符号化される画像のピクチャ構造を決定する。
ある好ましい実施形態において、前記決定部は、前方向予測符号化方式によって圧縮符号化される前記複数の画像に基づいて決定される周期に応じて、前記前方向予測符号化方式によって圧縮符号化される画像のピクチャ構造を決定する。
ある好ましい実施形態において、前記決定部は、画面内符号化方式によって圧縮符号化される第1画像と、前記第1画像を参照して前方向予測符号化方式によって圧縮符号化される第2画像とが連続している場合には、前記第1画像のピクチャ構造をフィールド構造に決定し、かつ、前記第1画像を構成する第1フィールド画像および第2フィールド画像のうち、前記第1フィールド画像を画面内符号化方式によって圧縮符号化し、前記第2フィールド画像を前方向予測符号化方式によって圧縮符号化することを決定する。
ある好ましい実施形態において、前記決定部は、画面内符号化方式によって圧縮符号化される画像のピクチャ構造を、画面内符号化方式によって圧縮符号化された直前の画像または前方向予測符号化方式によって圧縮符号化された直前の画像のピクチャ構造に一致させることを決定する。
ある好ましい実施形態において、前記決定部は、画面内符号化方式によって圧縮符号化される画像のピクチャ構造を、画面内符号化方式によって圧縮符号化される直後の画像または前方向予測符号化方式によって圧縮符号化される直後の画像のピクチャ構造に一致させることを決定する。
ある好ましい実施形態において、前記決定部は、双方向予測符号化方式によって圧縮符号化される第1画像のピクチャ構造を、前記第1画像によって参照される参照画像のピクチャ構造に一致させることを決定する。
本発明によれば、データ処理システムは、上述のデータ処理装置と、前記データ処理装置の処理部によって生成された前記圧縮データを伝送媒体上に送信する送信部とを備えている。
本発明によれば、データ処理システムは、上述のデータ処理装置と、前記データ処理装置の処理部によって生成された前記圧縮データを記録媒体に記録する記録部とを備えている。
本発明による他のデータ処理装置は、動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化する。前記動画像は、複数のフレーム画像を連続的に表示して得られる。データ処理装置は、前記動画像データを格納するメモリと、連続する2つのフレーム画像間の前記動画像データの変化量を示す時間方向変化量、および、前記2つのフレーム画像の各々について画像内の前記動画像データの変化量を示す空間方向変化量を算出し、前記時間方向変化量および前記空間方向変化量に基づいて、前記動画像の変化の程度を示すパラメータを算出する算出部と、前記算出部によって算出された前記パラメータに基づいて、前記複数のフレーム画像の各々について圧縮符号化方式を決定する決定部と、前記メモリに格納された前記動画像データを、前記決定部によって決定された方式にしたがって圧縮符号化し、圧縮データを生成する処理部とを備えている。
ある好ましい実施形態において、前記動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られ、前記2つのフィールド画像は、前記フレーム画像の奇数ラインに対応する第1フィールド画像および偶数ラインに対応する第2フィールド画像であり、前記算出部は、前記フレーム画像内で互いに隣接する前記第1フィールド画像のラインおよび前記第2フィールド画像のラインを特定して、各ラインの画像データの差分に基づいて前記時間方向変化量を算出し、かつ、前記算出部は、前記第1フィールド画像および前記第2フィールド画像の各画像内で隣接するラインを特定して、各ラインの画像データの差分に基づいて前記空間方向変化量を算出する。
ある好ましい実施形態において、前記算出部は、前記2つのフレーム画像における同じ位置の2つのラインを特定して、各ラインの画像データの差分に基づいて前記時間方向変化量を算出し、かつ、前記2つのフレーム画像の一方の画像内で隣接するラインを特定して、各ラインの画像データの差分に基づいて前記空間方向変化量を算出する。
ある好ましい実施形態において、前記決定部は、前記画面内符号化方式によって圧縮符号化するフレーム画像の数および前記前方向予測符号化方式によって圧縮符号化するフレーム画像の数の少なくとも一方を増加する。
ある好ましい実施形態において、前記決定部は、前記フレーム画像を前記画面内符号化方式または前記前方向予測符号化方式のいずれかのみによって圧縮符号化する。
本発明によれば、データ処理システムは、上述のデータ処理装置と、前記データ処理装置の処理部によって生成された前記圧縮データを伝送媒体上に送信する送信部とを備えている。
本発明によれば、データ処理システムは、上述のデータ処理装置と、前記データ処理装置の処理部によって生成された前記圧縮データを記録媒体に記録する記録部とを備えている。
本発明によれば、データ処理方法は、動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化する。前記動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られる。データ処理方法は、前記動画像データを格納するステップと、前記2つのフィールド画像の動画像データに基づいて、前記動画像の変化の程度を示すパラメータを算出するステップと、算出された前記パラメータに基づいて、画面内符号化方式および前方向予測符号化方式によって圧縮符号化される画像単位、および、前記所定の画像単位を規定するピクチャ構造を決定するステップと、前記動画像データを、決定された前記ピクチャ構造にしたがって圧縮符号化し、圧縮データを生成するステップとを包含する。
また、本発明によれば、他のデータ処理方法は、動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化する。前記動画像は、複数のフレーム画像を連続的に表示して得られる。データ処理方法は、前記動画像データを格納するステップと、連続する2つのフレーム画像間の前記動画像データの変化量を示す時間方向変化量、および、前記2つのフレーム画像の各々について画像内の前記動画像データの変化量を示す空間方向変化量を算出するステップと、前記時間方向変化量および前記空間方向変化量に基づいて、前記動画像の変化の程度を示すパラメータを算出するステップと、算出された前記パラメータに基づいて、前記複数のフレーム画像の各々について圧縮符号化方式を決定するステップと、格納された前記動画像データを、決定された方式にしたがって圧縮符号化し、圧縮データを生成するステップとを包含する。
図1は、双方向予測による動画像データの予測構造を示す図である。
図2は、Iピクチャ、PピクチャおよびBピクチャの配置を示す図である。
図3(a)〜(c)は、それぞれM=1〜3の場合における動画像データ入力時および符号化時の各ピクチャタイプの順序の対応関係を示す図である。
図4(a)はIフレームの参照関係を示す図であり、(b)はPフレームの参照関係を示す図であり、(c)はBフレームの参照関係を示す図である。
図5は、本実施形態における動画像符号化装置100の機能ブロックの構成を示す図である。
図6は、動画像符号化装置100の処理の流れを示すフローチャートである。
図7は、時間方向変化量(A)および空間方向変化量(B)の概念を示す図である。
図8は、フレーム画像を複数のブロックに分割したときの例を示す図である。
図9は、予測方法決定部109がフレーム画像単位で符号化方式を決定し、圧縮符号化を行うピクチャ構造を決定する処理の手順を示すフローチャートである。
図10は、フレーム画像単位で符号化方式を決定する処理の手順を示すフローチャートである。
図11は、圧縮符号化を行うピクチャ構造を決定する処理の手順を示すフローチャートである。
図12(a)は、フレーム構造によって圧縮符号化されたピクチャデータのデータ構造を示す図であり、(b)は、フィールド構造によって圧縮符号化されたフレーム画像データのデータ構造を示す図である。
図13は、変化度パラメータと圧縮データのピクチャ構造との関係を示す図である。
図14は、所定の周期でフレーム画像の符号化方式を決定し、圧縮符号化を行うピクチャ構造を決定する処理の手順を示すフローチャートである。
図15(a)は、符号化システム10の機能ブロックの構成を示す図であり、(b)は、復号化システム11の機能ブロックの構成を示す図である。
以下、添付の図面を参照しながら、本発明の実施形態を説明する。
図5は、本実施形態における動画像符号化装置100の機能ブロックの構成を示す。動画像符号化装置100は、テレビ信号等の動画像信号に基づいて得られる動画像データを、例えばMPEG2規格に基づいて圧縮符号化し、圧縮データを出力する。動画像データは、動画像を表すデータであり、個々のフレーム画像のデータを含む。また動画像データは、音声に関する音声データを含んでいてもよい。動画像は、複数のフレーム画像や音声が連続的に表示されることにより視聴の対象となる。
以下、動画像符号化装置100の構成を説明する。動画像符号化装置100は、入力画像用メモリ101と、復号画像用メモリ102と、動きベクトル検出部103と、動き補償予測部104と、DCT/量子化部105と、逆量子化/逆DCT部106と、可変長符号化部107と、変化度パラメータ算出部108と、予測方法決定部109と、符号化順序制御部110とを有する。
入力画像用メモリ101は、受け取った動画像信号を動画像データとして符号化時まで格納する。動画像データは、連続した複数の画像を特定できる形式でメモリ101に格納されている。また、メモリ101は、符号化順序に起因する各画像の処理遅延に対して十分な枚数分の画像データを格納できる。この結果、動画像符号化装置100において動画像データを圧縮符号化するとき、各画像データの符号化順序が入力順序に対して変更された場合でも、処理を継続できる。例えば、図3(c)に示すピクチャタイプの並びに対しては、入力画像用メモリ101は少なくとも4フレーム画像分の画像データを格納できる。動画像データは、後述する符号化順序制御部110で指定される符号化順序に従って符号化される。
復号画像用メモリ102は、逆量子化/逆DCT部106で復号された画像データと、動き補償予測部104で得られた動き補償予測画像データとを加算した復号画像データを格納する。復号画像データは、後に、動きベクトル検出部103および動き補償予測部104において参照画像の画像データとして用いられる。
動きベクトル検出部103は、復号用画像用メモリ102に格納されている画像データを参照して、入力画像用メモリ101内の画像データの画像が動いた(変化した)量を動きベクトルとして検出する。
動き補償予測部104は、動きベクトル検出部103で検出された動きベクトルおよび復号画像用メモリ102内の復号画像データを用いて動き補償予測画像データを生成する。
DCT/量子化部105は、予測誤差データを離散コサイン(Discrete Cosine Transform;DCT)変換し、指定された量子化値によって量子化する。予測誤差データは、入力画像用メモリ101内の画像データと動き補償予測部104によって生成された動き補償予測画像データとの差分に相当する。なお、DCT/量子化部105は、動き補償予測画像データを用いることなく、入力画像データそのものを処理することも可能である。
逆量子化/逆DCT部106は、処理対象の画像をIピクチャおよびPピクチャとして処理する場合に、DCT/量子化部105で得られた符号化データに対して逆量子化および逆離散コサイン変換を行い、参照画像として用いるための復号画像を生成する。
可変長符号化部107は、DCT/量子化部105で離散コサイン変換され、量子化されたデータ、および、動きベクトル検出部103で検出された動きベクトルに関する動き位置情報を可変長符号化し、圧縮データを出力する。
変化度パラメータ算出部108は、入力画像用メモリ101に格納されている各画像の画像データに対して、画像特徴量から得られる時間方向変化量および空間方向変化量を用いて変化度パラメータを算出する。ここで、画像特徴量とは、画像内の各座標の画素データ(例えば輝度データ)の値をいい、画像データを構成する要素である。また、変化度パラメータとは、動画像を構成する複数の画像を比較したときに、表示される各画像の内容に関する変化の程度(激しさまたは速さ)を示すパラメータである。変化度パラメータ算出部108のより具体的な処理は後に詳述する。
予測方法決定部109は、変化度パラメータ算出部108によって算出された変化度パラメータに基づいて、符号化する画像の参照画像およびピクチャ構造を決定する。
符号化順序制御部110は、予測方法決定部109において決定された予測方法に従って、入力画像用メモリ101に格納されている画像データの符号化順序を制御する。
本発明による動画像符号化装置100の主要な特徴の一つは、変化度パラメータ算出部108および予測方法決定部109において行われる処理にある。そこで、以下では動画像符号化装置100の動作を説明しながら、これらの構成要素の処理を詳細に説明する。なお、参照符号102〜107、110によって示される他の構成要素については、特に説明する場合を除き、包括的に「処理部」と称することとする。
また、以下では、動画像はインターレース方式の映像であるとして説明する。したがって、1つのフレーム画像は2つのフィールド画像から構成される。
図6は、動画像符号化装置100の処理の流れを示す。まず、ステップ601において、動画像符号化装置100は動画像信号を受け取り、動画像データとして入力画像用メモリ101に格納する。次に、ステップ602において、変化度パラメータ算出部108は、複数の画像の動画像データに基づいて、変化度パラメータを算出する。具体的には、まず、変化度パラメータ算出部108は、フレーム画像を構成する第1フィールド画像および第2フィールド画像間の画像データの変化量に基づいて時間方向変化量を求める。さらに、変化度パラメータ算出部108は、第1フィールド画像および第2フィールド画像のそれぞれについて、画像内の画像データの変化量に基づいて空間方向変化量を求める。その後、変化度パラメータ算出部108は、時間方向変化量および空間方向変化量に基づいて変化度パラメータを算出する。以下、図面を参照しながら、より詳しく説明する。
なお、本実施形態では、時間方向変化量および空間方向変化量を計算する対象となるフレーム画像は、IピクチャまたはPピクチャとして圧縮符号化される候補画像とする。候補画像は動画像符号化装置100において予め定められた規則に基づいて仮に決定されている。例えば、入力された動画像データに含まれるフレーム画像のうち、NフレームおきにIピクチャの候補画像が決定され、Iピクチャ同士の間でMフレームおきにPピクチャの候補画像が決定される。なお、各フレーム画像が最終的にI,P,Bピクチャのいずれになるかは、動画像符号化装置100の一連の処理によって後に決定される。
図7は、時間方向変化量(A)および空間方向変化量(B)の概念を示す。まず、フレーム画像は、2つのフィールド画像によって構成される。便宜的に、第1フィールド画像をフレーム画像の奇数ライン(図の黒色のライン)に対応する画像とし、第2フィールド画像をフレーム画像の偶数ライン(図の白色のライン)に対応する画像とする。
時間方向変化量Dt(A)は、フレーム画像内で垂直方向に互いに隣接する2画素の画像データの差分(A)を加算して平均した値として求めることができる。「隣接する2画素」は、第1フィールド画像の画素および第2フィールド画像の画素である。一方、空間方向変化量Ds(B)は、第1フィールド内および第2フィールド内で、それぞれ垂直方向に隣接する2画素の画像データの差分(B)を加算して平均した値として求めることができる。
変化度パラメータ算出部108は、(数1)および(数2)により、時間方向変化量Dtおよび空間方向変化量Dsを算出する。
Figure 2004014085
ここで、F(x,y)は画面内の座標(x,y)における画素値(例えば輝度)を表し、NtおよびNsはそれぞれ(数1)および(数2)において加算される差分データの個数を表す。動画像の動き(変化)が小さい場合は、時間方向変化量Dtは空間方向変化量Dsに比べて相対的に小さくなる。これは、フィールド相関よりもフレーム相関が強いということを表す。一方、動画像の動きが速くなるにつれて時間方向変化量Dtが大きくなり、フレーム相関に対してフィールド相関が強くなる。ここで、対象とする画像の変化度パラメータCfの値は、(数1)および(数2)で求めた時間方向変化量Dtおよび空間方向変化量Dsを用いて、(数3)により算出することができる。
Figure 2004014085
ただし、Aは変化度パラメータCfの取りうる値を調整するための定数であり、1より大きい数とする。
(数3)から理解されるように、時間方向変化量Dtが大きいほど変化度パラメータCfの値は大きくなる。逆に言えば、変化度パラメータCfが大きいほど動画像の動きが速い。特に、1つのフレーム画像を構成する2つのフィールド画像の画像データに基づいて変化度パラメータCfを算出することにより、極めて動きが速い動画に対しても十分対応できる。
また、時間方向変化量のみに基づいて動画像の動きの速さを判断すると、動画像内のオブジェクトが1画素ずれただけでも動きが速いと判断してしまうことがあるが、さらに空間方向変化量に基づいて判断することにより、わずかな画素のずれの影響は低減される。よって動画像の動きの速さをより正確に判断できる。
なお、(数1)および(数2)においては、時間方向変化量Dtおよび空間方向変化量Dsを求める際に差分の絶対値平均を用いたが、(数4)および(数5)のように差分の2乗平均を用いてもよい。(数4)および(数5)における各項の意味は(数1)および(数2)と同じである。また、差分量を用いた他の算出式によって時間方向変化量Dtおよび空間方向変化量Dsを求めてもよい。
Figure 2004014085
ここまでは、図7を参照しながら、フレーム画像またはフィールド画像全体の画素データを用いて時間方向変化量および空間方向変化量を求め、変化度パラメータCfの値を求める手順を説明した。しかし、変化度パラメータCfは他の手順によっても求めることができる。以下、その手順を説明する。
図8は、フレーム画像を複数のブロックに分割したときの例を示す。変化度パラメータ算出部108は、フレーム画像を複数のブロック(例えば16×16画素)に分割して、ブロックごとに(数6)および(数7)により時間方向変化量Dt_blkおよび空間方向変化量Ds_blkを算出する。時間方向変化量Dt_blkは、ブロック内で垂直方向に互いに隣接する2画素の画像データの差分を加算して平均した値として求めることができる。一方、空間方向変化量Ds_blkは、各ブロック内の奇数ラインに対応するフィールド内および偶数ラインに対応するフィールド内で、それぞれ垂直方向に隣接する画素同士の差分(B)を加算して平均した値として求めることができる。
Figure 2004014085
ただし、F(x,y)はブロック内の座標(x,y)における画素データを表し、Nt_blkおよびNs_blkはそれぞれ(数6)および(数7)において加算される差分データの個数を表す。
変化度パラメータ算出部108は、求めた時間方向変化量Dt_blkおよび空間方向変化量Ds_blkを用いて、ブロックごとにフィールド相関が高いか否かを(数8)により判定する。(数8)を満たす場合、そのブロックはフィールド相関が高いブロックと考えられ、動画像の動き(変化)が速いことを意味する。
Figure 2004014085
ただし、(数8)におけるK1およびK2は定数とする。
変化度パラメータ算出部108は、フィールド相関が高いと判定したブロックの数をカウントし、“High_blks”として保持する。そして、変化度パラメータ算出部108は、カウントしたブロック数High_blksと、判定に用いた全てのブロックの数(“All_blks”)との比を(数9)により算出し、これをそのフレーム画像の変化度パラメータCfとする。
Figure 2004014085
なお、(数6)および(数7)においては、ブロックの時間方向変化量Dt_blkおよび空間方向変化量Ds_blkを求める際に差分の絶対値平均を用いたが、(数10)および(数11)のように差分の2乗平均を用いてもよい。(数10)および(数11)における各項の意味は(数6)および(数7)と同じである。また、差分量を用いた他の算出式によってブロックの時間方向変化量Dt_blkおよび空間方向変化量Ds_blkを求めてもよい。例えば、MPEG2等の符号化において、マクロブロック(16×16画素のブロック)のDCTモード(フレームDCTとフィールドDCT)を決定する際に用いる評価値をそれぞれ、時間方向変化量Dt_blkおよび空間方向変化量Ds_blkとして使用することも可能である。
Figure 2004014085
なお、(数9)においては、フィールド相関が高いと判定されたブロックの割合を変化度パラメータCfとしているが、フィールド相関が高いと判定されたブロック数(“High_blks”の値)そのものを変化度パラメータCfとしてもよい。
以上のようにして、変化度パラメータ算出部108は、1つのフレーム画像を構成する2つのフィールド画像の画像データに基づいて変化度パラメータCfを算出する。
次に図6のステップ603において、予測方法決定部109は、算出した変化パラメータに基づいて、圧縮符号化を行うフレーム画像ごとに符号化方式を決定する。この処理により、各フレーム画像が最終的にIピクチャ、PピクチャおよびBピクチャのいずれに圧縮符号化されるかが決定され、同時に図2に示すMの値が決定される。続いて、ステップ604において、予測方法決定部109は、動画像データを構成する画像について圧縮符号化を行うピクチャ構造を決定する。
以下、予測方法決定部109が実行するステップ603および604の処理を詳しく説明する。図9は、フレーム画像単位で符号化方式を決定し、圧縮符号化を行うピクチャ構造を決定する処理の手順を示す。図9は、ステップ901〜914の処理から構成されている。このうち、ステップ901および902は上述の変化度パラメータ算出部108によって実行される処理であり、処理の流れを明確にするために記載している。予測方法決定部109は、ステップ903以降の処理を実行する。
図9のステップ903〜914のうち、ステップ903〜910がフレーム画像ごとに符号化方式を決定する処理であり、ステップ911〜914が圧縮符号化を行うピクチャ構造を決定する処理である。
まず、フレーム画像ごとに符号化方式を決定するためのステップ903〜910の処理を説明する。ステップ903において、予測方法決定部109は、変化度パラメータ算出部108によって算出された変化度パラメータCfが第1の閾値TH1よりも大きいか否かを判断する。変化度パラメータCfが第1の閾値TH1よりも大きい場合には、動画像の動きが速いとしてステップ904に進み、そうでない場合にはステップ907に進む。
ステップ904において、予測方法決定部109は、図2に示す参照画像の間隔Mを所定の値(例えば1)だけ小さくし、IピクチャとPピクチャとの間隔またはPピクチャとPピクチャとの間隔をより狭くする。これにより、動画像符号化装置100は、IピクチャまたはPピクチャとして符号化するフレーム画像の出現頻度を多くすることができ、動きが速い動画像に対応することができる。
ただし、間隔を変更した後の参照画像の間隔Mが小さくなりすぎると(例えば0になると)不都合が生じるので、その値を制限する必要がある。そこで、ステップ905において、予測方法決定部109は変更後のMの値が最小値Mminよりも小さいか否かを判断する。Mの値が最小値Mminよりも小さい場合にはステップ906に進み、そうでない場合にはステップ911に進む。ステップ906では、予測方法決定部109は、変更後のMの値を最小値Mminに設定してステップ911に進む。
ステップ907では、予測方法決定部109は、変化度パラメータCfの値を第2の閾値TH2と比較する。変化度パラメータCfの値が第2の閾値TH2よりも小さい場合には、ステップ908へ進み、小さくない場合にはステップ911に進む。ステップ908では、予測方法決定部109は、図2に示す参照画像の間隔Mを所定の値(例えば1)だけ大きくし、IピクチャとPピクチャとの間隔またはPピクチャとPピクチャとの間隔をより大きくする。これにより動きが遅い動画像であっても効率的な符号化が可能になる。
ただし、変更後の参照画像の間隔Mが大きくなりすぎると、入力画像用メモリ101の容量、符号化時の処理遅延量等に関する不都合が生じるので、その値を制限する必要がある。そこで、ステップ909において、予測方法決定部109は変更後のMの値が最大値Mmaxよりも大きいか否かを判断する。Mの値が最大値Mmaxよりも大きい場合にはステップ910に進み、そうでない場合にはステップ911に進む。ステップ910では、予測方法決定部109は、変更後のMの値を最大値Mmaxに設定してステップ911に進む。 以上説明した処理により、予測方法決定部109は、IピクチャとPピクチャとの間隔またはPピクチャとPピクチャとの間隔を決定することができる。この結果、特に、変化度パラメータが大きいとき、すなわち動画像信号の時間的変化が空間的変化よりも相対的に大きいときに、予測方法決定部109は参照画面の間隔Mを小さくして予測効率の低下を防止できる。
なお、ステップ901および902では、IピクチャまたはPピクチャとして圧縮符号化される画像について変化度パラメータCfを算出するとしており、Bピクチャを考慮していない。これは、Bピクチャは参照画面として使用されることはなく、ここまでの処理を行う必要がないからである。ただし、Bピクチャの変化度パラメータを算出し、そのパラメータを用いて参照画面の間隔を決定することは可能である。
次に、圧縮符号化を行うピクチャ構造を決定するためのステップ911〜914の処理を説明する。まず「ピクチャ構造を決定する」とは、圧縮符号化する画像の単位をフレーム画像にするか、または、フレーム画像を構成する各フィールド画像にするかを決定することをいう。前者のピクチャ構造は「フレーム構造」と呼ばれ、後者のピクチャ構造は「フィールド構造」と呼ばれる。
まず、ステップ911では、予測方法決定部109は、ステップ902において算出された変化度パラメータCfが、第3の閾値TH3よりも大きいか否かを判断する。変化度パラメータCfが、第3の閾値TH3よりも大きい場合にはステップ912に進み、そうでない場合にはステップ913に進む。ステップ912では、予測方法決定部109は、その変化度パラメータが算出されたフレーム画像以降に符号化する画像のピクチャ構造をフィールド構造で符号化するように設定する。その理由は、動画像の変化が激しいと考えられるため、予測効率の低下を防ぐ必要があるからである。動画像の動きが速い場合にフィールド画像単位で圧縮符号化することにより予測を的確に行うことができ、圧縮符号化後の動画像の品質を高く維持できる。その後、処理は終了する。
一方、ステップ913では、変化度パラメータCfを第4の閾値TH4と比較する。変化度パラメータCfが第4の閾値TH4よりも小さい場合にはステップ914に進み、そうでない場合には処理を終了する。ステップ914では、予測方法決定部109は、以後符号化する画像のピクチャ構造をフレーム構造で符号化するように設定し、処理を終了する。
以上の動作により、特に、変化度パラメータが大きいとき、すなわち動画像データの時間的変化が空間的変化より大きいとき、IピクチャまたはPピクチャをフィールド構造とすることによって予測効率の低下を防ぐことができる。なおBピクチャについては、直前に符号化されるIピクチャまたはPピクチャのピクチャ構造と同じ構造で符号化すればよい。または、変化度パラメータCfを用いて直接Bピクチャのピクチャ構造を決定してもよいし、ピクチャ構造を固定してもよい。
なお、図9の処理では、IピクチャまたはPピクチャの候補画像の変化度パラメータを算出し、その画像のピクチャ構造をフレーム構造またはフィールド構造に切り替えるとして説明したが、いずれか一方のピクチャ構造のみを切り替えるとしてもよい。
以上、図9を参照しながら、図6のステップ603および604に関連する処理を詳細に説明した。図9のステップ901〜914は、予測方法決定部109がステップ603および604の処理を連続的に実現する処理手順であるが、予測方法決定部109は、ステップ603に対応する処理のみ、またはステップ604に対応する処理のみを独立して行うことができる。図10は、ステップ603に対応する、フレーム画像単位で符号化方式を決定する処理の手順を示し、図11は、ステップ604に対応する、圧縮符号化を行うピクチャ構造を決定する処理の手順を示す。図10および図11に示す各ステップのうち、図9に示すステップと同じステップには同じ参照符号を付している。図から明らかなように、全てのステップは図9に含まれているので、各図の説明は省略する。
次に、図6のステップ605では、予測方法決定部109において決定された符号化方式にしたがって、かつ、同じく決定されたピクチャ構造で、処理部がメモリに格納された動画像データを圧縮符号化して圧縮データを生成する。例えば、ピクチャ構造がフレーム構造であり、かつ、各フレーム画像が図3(c)上段(“入力順”)に示すようにI,B,Pピクチャとして圧縮符号化される場合には、符号化順序制御部110は、図3(c)下段(“符号化順”)に示す順序で符号化を行うことを決定する。すると、動きベクトル検出部103およびDCT/量子化部105はその順序でフレーム画像の画像データを読み出して処理し、その後、さらに他の構成要素において処理されて、I,B,Pピクチャを含む圧縮データが生成される。
そして図6のステップ606において、全ての動画像データについて圧縮符号化が終了するまで、繰り返しステップ602〜605の処理を繰り返す。以上のようにして、動画像データから圧縮データが生成される。
図12(a)および(b)は、生成された圧縮データに含まれるピクチャデータのデータ構造を示す。図12(a)は、フレーム構造によって圧縮符号化されたピクチャデータのデータ構造を示す。図から理解されるように、ピクチャヘッダの次に画像データが配置される。ピクチャヘッダは、主としてピクチャタイプフィールドとピクチャ構造フィールドを含む。ピクチャタイプフィールドには、そのピクチャデータのピクチャがIピクチャ、BピクチャまたはPピクチャのいずれであるかを示すピクチャタイプが記述される。またピクチャ構造フィールドには、そのピクチャデータのピクチャがフレーム構造かフィールド構造かを示す情報が記述される。図12(a)では、ピクチャ構造フィールドには「フレーム構造」であることを示す情報が記述される。画像データは、第1フィールド画像のデータと第2フィールド画像のデータとを混在して含んでおり、圧縮符号化された画像データが再生されたときにフィールドが分離される。
一方、図12(b)は、フィールド構造によって圧縮符号化されたピクチャ(フレーム画像)データのデータ構造を示す。このデータ構造は、第1フィールド用ピクチャヘッダから順に、第1フィールド画像データ、第2フィールド用ピクチャヘッダおよび第2フィールド画像データを含む。第1フィールド画像は、第1フィールド用ピクチャヘッダと第1フィールド画像データに基づいて取得できる。同様に、第2フィールド画像は、第2フィールド用ピクチャヘッダと第2フィールド画像データに基づいて取得できる。ピクチャヘッダのデータ構造は、先に説明したフレーム構造の場合と同様、ピクチャタイプフィールドとピクチャ構造フィールドとを含む。ただしピクチャタイプはフィールドごとに特定されるので、Iフレームの場合には、第1フィールド用ピクチャヘッダには「Iフィールド」であることを示すピクチャタイプが記述され、第2フィールド用ピクチャヘッダには「Iフィールド」または「Pフィールド」であることを示すピクチャタイプが記述される。ピクチャ構造フィールドには、それぞれ、いずれのフィールドであるかを示す情報が記述される。
図13は、変化度パラメータと圧縮データのピクチャ構造との関係を示す。図でI、BおよびPは、それぞれIピクチャ、BピクチャおよびPピクチャを示す。I、BおよびPの後の数字は、先頭のIピクチャからのフレーム番号を示す。また、実線で囲まれたピクチャ(I1、B2、P3等)のピクチャ構造はフレーム構造であり、破線で囲まれたピクチャ(P4〜P6)のピクチャ構造はフィールド構造とする。
図13において、まず、先頭部分のピクチャI1、B2、P3は、M=2かつフレーム構造で符号化されている。このとき符号化順序は、ピクチャI1、P3、B2である。
ところが、後続のピクチャP4のピクチャ構造は、フィールド構造に変更されている。これは、ピクチャP3に関連して算出された変化度パラメータCfが、Cf>TH1かつCf>TH3を満たしたからである。この結果、参照画像の間隔MはM=2からM=1に変更され(図9のステップ904)、さらにピクチャ構造はフィールド構造とされる(ステップ912)。よって、最終的に参照画像の間隔は1フィールドとなり、動きの速い画像に対しても予測効率を保つことが可能となる。
次に、ピクチャP4およびP5をフィールド単位で符号化する過程において、ピクチャP5に関連して算出された変化度パラメータCfがCf<TH4を満たしたので、ピクチャ構造がフィールド構造からフレーム構造に変更される(ステップ914)。さらに、ピクチャP6に関連して算出された変化度パラメータCfがCf<TH2を満たしたので、参照画面の間隔MがM=1からM=2に変更されている(ステップ907)。
以上の処理の結果、Pピクチャに関して、M=1のときはピクチャ構造をフィールド構造に設定し、M≧2のときはピクチャ構造をフレーム構造に設定することができる。ただし、これは例であり、例えばM=1のとき、Iピクチャの第1フィールドをIフィールドとし、第2フィールドをPフィールドとしてもよい。他の例としてM=1であってもM≧2であっても、すなわちMの値にかかわらず、Pピクチャのピクチャ構造をフレーム構造にしてもよい。また、Iピクチャ/Pピクチャのピクチャ構造を、直前のIピクチャまたはPピクチャのピクチャ構造に一致させてもよい。さらに、Bピクチャのピクチャ構造を、参照するIピクチャまたはPピクチャのピクチャ構造に一致させてもよい。
また、上述の閾値TH1〜TH4について、TH1=TH3およびTH2=TH4と設定することによって、より簡単な制御を実現できる。図13に示す例では、M=2かつフレーム構造である状態1およびM=1かつフィールド構造状態2の間の切り替えのみで足り、処理を単純化できる。
ここではM=2とM=1の切替えについて示したが、例えばM=3とM=1のようにMの値を2以上離して切り替えてもよいし、M=3、M=2およびM=1等のようにMの値を3段階以上切り替えてもよい。
次に、図14を参照しながら、予測方法決定部109が各ピクチャの符号化方式およびピクチャ構造を決定する際の他の処理を説明する。図14は、所定の周期でフレーム画像の符号化方式を決定し、圧縮符号化を行うピクチャ構造を決定する処理の手順を示す。「所定の周期」とは、例えば、あるIピクチャから次のIピクチャまでの周期(図2の間隔N)、Pピクチャの周期(図2の間隔M)、それらの整数倍の周期を表すである。
なお、先の例と同様、「Iピクチャ」および「Pピクチャ」はIピクチャおよびPピクチャとして圧縮符号化される候補画像を意味する。なお、Iピクチャから次のIピクチャまでに存在するピクチャのうち、先頭のIピクチャ、後続の複数のP,Bピクチャからなるピクチャ群はGOP(Group of Picture)と呼ばれる。GOPは動画像の再生時間にすると約0.5秒の長さである。以下では、「周期」はIピクチャから次のIピクチャまでの周期(すなわちGOPの周期)であるとして説明する。
まず、ステップ1401において、変化度パラメータ算出部108は符号化を行う画像がGOP先頭の候補画像(先頭画像)であるか否かを判断する。先頭画像である場合にはステップ1402に進み、先頭画像でない場合にはステップ1403に進む。ステップ1402では、変化度パラメータ算出部108はパラメータSumCfの値を0に初期化し、ステップ1403に進む。パラメータSumCfは、変化度パラメータCfの総和を保持するために用いられる。
ステップ1403では、変化度パラメータ算出部108は、画像の変化度パラメータCfを算出し、次のステップ1404においてパラメータSumCfの値と加算して、その結果によってパラメータSumCfを更新する。ステップ1405では、変化度パラメータ算出部108は、現在処理の対象になっている画像がGOP周期の最後の候補画像であるか否かを判断する。その画像が最後の候補画像である場合にはステップ1406に進み、そうでない場合には図14に示す処理を終了して、これまでの符号化条件を変更することなくその画像を圧縮符号化する。そしてその画像の次の画像に対して、再びステップ1401からの処理が行われる。
ステップ1406では、予測方法決定部109は、以下の手順によって符号化条件を決定する。まず、ステップ1406において、予測方法決定部109はパラメータSumCfの値が第5の閾値TH5よりも大きいか否かを判断する。パラメータSumCfの値が閾値TH5よりも大きい場合にはステップ1407に進み、そうでない場合にはステップ1410に進む。
ステップ1407では、予測方法決定部109は、次の周期以降に含まれる参照画像(IピクチャまたはPピクチャ)の間隔Mを所定の値(例えば1)だけ小さく設定する。これは、現在の周期に含まれる画像の傾向に基づいて、次の周期の画像に対して符号化条件を設定することを意味する。
その後、ステップ1408において、予測方法決定部109は変更後のMの値が最小値Mminよりも小さいか否かを判断する。Mの値が最小値Mminよりも小さい場合にはステップ1409に進み、小さくない場合にはステップ1414に進む。ステップ1409では、予測方法決定部109は、変更後のMの値を最小値Mminに設定してステップ1414に進む。ステップ1408および1409は、図9のステップ905および906と同じ理由から設けられている。
ステップ1410では、予測方法決定部109は、パラメータSumCfの値を第6の閾値TH6と比較する。パラメータSumCfの値が閾値TH6よりも小さい場合にはステップ1411に進み、そうでない場合にはステップ1414に進む。
ステップ1411では、予測方法決定部109は、次の周期以降に含まれる参照画像の間隔Mを所定の値(例えば1)だけ大きく設定する。すなわち、ステップ1407で説明したとおり、現在の周期に含まれる画像の傾向に基づいて、次の周期の画像に対して符号化条件を設定する。
ステップ1412において、予測方法決定部109は変更後のMの値が最大値Mmaxよりも大きいか否かを判断する。Mの値が最大値Mmaxよりも大きい場合にはステップ1413に進み、そうでない場合にはステップ1414に進む。ステップ1413では、予測方法決定部109は、変更後のMの値を最大値Mmaxに設定してステップ1414に進む。
ステップ1414〜1417は、次の周期の画像の符号化条件であるピクチャ構造を決定する処理である。ステップ1414では、予測方法決定部109はパラメータSumCfの値と第7の閾値と比較する。パラメータSumCfの値が閾値TH7よりも大きい場合にはステップ1415に進み、そうでない場合にはステップ1416に進む。
ステップ1415では、次の周期以降に含まれる画像であって、指定したピクチャタイプの画像をフィールド構造で符号化するように設定する。パラメータSumCfの値が閾値TH7よりも大きく各画像の変化が激しいと考えられるため、次の周期に関して予測効率の低下を防ぐ必要があるからである。
一方、ステップ1416では、パラメータSumCfの値を第8の閾値TH8と比較する。変化度パラメータCfが第8の閾値TH8よりも小さい場合にはステップ1417に進み、そうでない場合には処理を終了する。ステップ1417では、予測方法決定部109は、次の周期以降に含まれる画像であって、指定したピクチャタイプの画像をフレーム構造で符号化するように設定し、処理を終了する。
以上の動作により、特に、変化度パラメータが大きいとき、すなわち動画像データの時間的変化が空間的変化に対して相対的に大きいとき、参照画像の間隔Mを小さくするとともにIピクチャまたはPピクチャをフィールド構造にすることよって、予測効率の低下を防止できる。
次に、圧縮データが生成された後の取り扱いを説明する。図15(a)は、符号化システム10の機能ブロックの構成を示す。符号化システム10は、符号化装置100と、送信部150と、記録部151とを備えている。符号化システム10は、例えば放送局において放送設備として構築される。編集された動画像は動画像符号化装置100によって圧縮データに変換され、送信部150から電波、伝送線等の伝送媒体を介して各家庭に伝送される。または、動画像符号化装置100から出力された圧縮データは、記録部151によって記録媒体200に記録される。記録媒体200は、例えば光ディスク等の光記録媒体、SDメモリカード等の半導体記録媒体、ハードディスク等の磁気記録媒体を含む。従来の画質と同程度の画質であれば、圧縮データのデータ量はより少なくなるので、伝送に必要な帯域、伝送時間等を低減でき、または記録媒体200に必要な記録容量が低減できる。
また、符号化システム10は汎用PCを用いても実現される。動画像符号化装置100は、例えばPCに組み込まれたエンコーダボードである。入力される動画像信号がテレビ信号の場合には、PC10は、テレビ番組に関する圧縮データを、ハードディスクドライブ151内のハードディスク200に記録する。
一方、図15(b)は、復号化システム11の機能ブロックの構成を示す。復号化システム11は、受信部160と、読み出し部161と、復号化装置300と、表示部170とを含む。復号化システム11は、例えばテレビ視聴者の家庭に構築された映像・音響システムとして構築される。このとき受信部160は、圧縮データが搬送されている電波を受信するためのアンテナであり、または圧縮データが搬送されている放送信号を受信するためのセットトップボックスの受信ポートである。読み出し部161は、記録媒体200に記録された圧縮データを読み出すためのドライブ装置、メモリカードスロット(図示せず)等である。復号化装置300は、圧縮データのデコード機能を備えており、例えば圧縮データがMPEG規格に準拠して生成されているときは、図12に示すデータ構造を解析し、解析結果に基づいてデコードが可能なMPEGデコーダである。ただし、本発明ではデコード機能を特に問題にしないので、復号化装置300の説明は省略する。表示部170はスピーカを有するテレビである。視聴者は、復号化システム11において圧縮データを受信し、または記録媒体200から読み出してデコードし、動画像を視聴できる。
以上、動画像符号化装置100の構成および動作を説明した。本発明による画像符号化装置100は、動画像の変化の程度を示す変化度パラメータに基づいて、IピクチャとPピクチャおよび/またはPピクチャ同士の間隔を動的に制御する。さらに、ピクチャ構造をフレーム構造とフィールド構造をも動的に切り替えて、符号化効率を向上させることができる。よって、動画像符号化装置100によって生成された圧縮データを従来の符号化装置によって生成された圧縮データと比較すると、同じデータ量であれば再生画像の品質は高く、また同じ画質であればデータ量がより少なくなる。よって、本発明によれば、十分な品質を保持した圧縮符号化を実現するとともに、より効率的に圧縮符号化を実現できる。
なお、これまでの説明で言及した閾値TH1〜TH8の具体的な値は、動画像符号化装置100を製造するメーカーがその装置の仕様に応じて自由に決定することができる。または、必要とされる圧縮データの品質に応じて自由に決定することができる。
また、動画像符号化装置100による処理対象の動画像はインターレース方式の映像であるとして説明したが、本発明はプログレッシブ方式の映像に対しても適用できる。ただしプログレッシブ方式の映像の場合には、フィールド画像が存在せずフレーム画像のみが存在するため、例えば1/60秒ごとに表示される連続する2枚のフレーム画像を用いて、本明細書において説明した第1フィールドおよび第2フィールドとして取り扱うことができる。このように取り扱う場合には、(数1)等におけるF(x,y)を第1フレーム画像の画素値G(x,y)に置き換え、F(x,y+1)を第2フレーム画像の画素値G(x,y)に置き換えればよい。また(数2)等では、F(x,y)を第1フレーム画像の画素値G(x,y)に置き換え、F(x,y+2)を第1フレーム画像の画素値G(x,y+1)に置き換えればよい。これにより、インターレース方式について説明した方法と全く同じ処理を行って時間方向変化量および空間方向変化量を求めることができる。
データ処理装置100の上述の処理は、コンピュータプログラムに基づいて行われる。例えば、圧縮データを生成する処理は、図6、9、14に示すフローチャートに基づいて記述されたコンピュータプログラムを実行することによって実現される。コンピュータプログラムは、光ディスクに代表される光記録媒体、SDメモリカード、EEPROMに代表される半導体記録媒体、フレキシブルディスクに代表される磁気記録媒体等の記録媒体に記録することができる。なお、光ディスク装置100は、記録媒体を介してのみならず、インターネット等の電気通信回線を介してもコンピュータプログラムを取得できる。
本発明によれば、十分な品質を保持しつつ、より効率的に動画像データの圧縮符号化を行うことができるデータ処理装置および方法が提供される。本発明は、圧縮符号化されたデータの記録、伝送、再生等を行うデータ処理の用途において有用である。

Claims (28)

  1. 動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化するデータ処理装置であって、
    前記動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られ、
    前記動画像データを格納するメモリと、
    前記2つのフィールド画像の動画像データに基づいて、前記動画像の変化の程度を示すパラメータを算出する算出部と、
    前記算出部によって算出された前記パラメータに基づいて、画面内符号化方式および前方向予測符号化方式によって圧縮符号化される画像単位、および、前記所定の画像単位を規定するピクチャ構造を決定する決定部と、
    前記メモリに格納された前記動画像データを、前記決定部によって決定された前記ピクチャ構造にしたがって圧縮符号化し、圧縮データを生成する処理部と
    を備えたデータ処理装置。
  2. 前記算出部は、前記2つのフィールド画像間の前記動画像データの変化量に基づいて時間方向変化量を求め、および、前記2つのフィールド画像の各々について画像内の前記動画像データの変化量に基づいて空間方向変化量を求め、前記時間方向変化量および前記空間方向変化量に基づいて前記パラメータを算出する、請求項1に記載のデータ処理装置。
  3. 前記2つのフィールド画像は、前記フレーム画像の奇数ラインに対応する第1フィールド画像および偶数ラインに対応する第2フィールド画像であり、
    前記算出部は、前記フレーム画像内で互いに隣接する前記第1フィールド画像のラインおよび前記第2フィールド画像のラインを特定して、各ラインの動画像データの差分に基づいて前記時間方向変化量を算出し、かつ、前記算出部は、前記第1フィールド画像および前記第2フィールド画像の各画像内で隣接するラインを特定して、各ラインの動画像データの差分に基づいて前記空間方向変化量を算出する、請求項2に記載のデータ処理装置。
  4. 前記算出部は、各フレーム画像を複数のブロックに分割して、前記ブロックごとの動画像データに基づいて前記時間方向変化量および前記空間方向変化量を算出し、各ブロックの時間方向変化量および各空間方向変化量に基づいて、全てのブロック数に対する前記動画像の変化量が所定量以上のブロックの比を前記パラメータとして算出する、請求項2に記載のデータ処理装置。
  5. 前記決定部は、前記パラメータが所定の閾値よりも大きい場合には、前記ピクチャ構造をフィールド構造に決定し、
    前記処理部は、前記動画像データを前記フィールド画像単位で圧縮符号化する、請求項1〜4のいずれかに記載のデータ処理装置。
  6. 前記決定部は、前記画面内符号化方式によって圧縮符号化するフィールド画像の数および前記前方向予測符号化方式によって圧縮符号化するフィールド画像の数の少なくとも一方を増加する、請求項5に記載のデータ処理装置。
  7. 前記決定部は、フィールド画像を前記画面内符号化方式または前記前方向予測符号化方式のみによって圧縮符号化する、請求項6に記載のデータ処理装置。
  8. 前記決定部は、前記算出部によって算出された前記パラメータが前記所定の閾値よりも小さくなった場合には、前記ピクチャ構造をフレーム構造に決定し、
    前記処理部は、前記動画像データを前記フレーム画像単位で圧縮符号化する、請求項7に記載のデータ処理装置。
  9. 前記決定部は、前方向予測符号化方式によって圧縮符号化される第1画像と前記第1画像を参照して予測符号化される第2画像とが連続している場合には、前記第2画像のピクチャ構造をフィールド構造に決定し、連続していない場合には前記第2画像のピクチャ構造をフレーム構造に決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  10. 前記決定部は、前方向予測符号化方式によって圧縮符号化される第1画像と前記第1画像を参照して予測符号化される第2画像とが連続している場合には、前記第2画像のピクチャ構造をフレーム構造またはフィールド構造に決定し、連続していない場合には前記第2画像のピクチャ構造をフレーム構造に決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  11. 前記決定部は、画面内符号化方式によって圧縮符号化される複数の画像または前方向予測符号化方式によって圧縮符号化される複数の画像に基づいて決定される周期に応じて、前記前方向予測符号化方式によって圧縮符号化される画像のピクチャ構造を決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  12. 前記決定部は、画面内符号化方式によって圧縮符号化される前記複数の画像に基づいて決定される周期に応じて、前記前方向予測符号化方式によって圧縮符号化される画像のピクチャ構造を決定する、請求項11に記載のデータ処理装置。
  13. 前記決定部は、前方向予測符号化方式によって圧縮符号化される前記複数の画像に基づいて決定される周期に応じて、前記前方向予測符号化方式によって圧縮符号化される画像のピクチャ構造を決定する、請求項11に記載のデータ処理装置。
  14. 前記決定部は、画面内符号化方式によって圧縮符号化される第1画像と、前記第1画像を参照して前方向予測符号化方式によって圧縮符号化される第2画像とが連続している場合には、前記第1画像のピクチャ構造をフィールド構造に決定し、かつ、前記第1画像を構成する第1フィールド画像および第2フィールド画像のうち、前記第1フィールド画像を画面内符号化方式によって圧縮符号化し、前記第2フィールド画像を前方向予測符号化方式によって圧縮符号化することを決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  15. 前記決定部は、画面内符号化方式によって圧縮符号化される画像のピクチャ構造を、画面内符号化方式によって圧縮符号化された直前の画像または前方向予測符号化方式によって圧縮符号化された直前の画像のピクチャ構造に一致させることを決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  16. 前記決定部は、画面内符号化方式によって圧縮符号化される画像のピクチャ構造を、画面内符号化方式によって圧縮符号化される直後の画像または前方向予測符号化方式によって圧縮符号化される直後の画像のピクチャ構造に一致させることを決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  17. 前記決定部は、双方向予測符号化方式によって圧縮符号化される第1画像のピクチャ構造を、前記第1画像によって参照される参照画像のピクチャ構造に一致させることを決定する、請求項1〜4のいずれかに記載のデータ処理装置。
  18. 請求項1〜4のいずれかに記載のデータ処理装置と、
    前記データ処理装置の処理部によって生成された前記圧縮データを伝送媒体上に送信する送信部と
    を備えた、データ処理システム。
  19. 請求項1〜4のいずれかに記載のデータ処理装置と、
    前記データ処理装置の処理部によって生成された前記圧縮データを記録媒体に記録する記録部と
    を備えた、データ処理システム。
  20. 動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化するデータ処理装置であって、
    前記動画像は、複数のフレーム画像を連続的に表示して得られ、
    前記動画像データを格納するメモリと、
    連続する2つのフレーム画像間の前記動画像データの変化量を示す時間方向変化量、および、前記2つのフレーム画像の各々について画像内の前記動画像データの変化量を示す空間方向変化量を算出し、前記時間方向変化量および前記空間方向変化量に基づいて、前記動画像の変化の程度を示すパラメータを算出する算出部と、
    前記算出部によって算出された前記パラメータに基づいて、前記複数のフレーム画像の各々について圧縮符号化方式を決定する決定部と、
    前記メモリに格納された前記動画像データを、前記決定部によって決定された方式にしたがって圧縮符号化し、圧縮データを生成する処理部と
    を備えたデータ処理装置。
  21. 前記動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られ、
    前記2つのフィールド画像は、前記フレーム画像の奇数ラインに対応する第1フィールド画像および偶数ラインに対応する第2フィールド画像であり、
    前記算出部は、前記フレーム画像内で互いに隣接する前記第1フィールド画像のラインおよび前記第2フィールド画像のラインを特定して、各ラインの動画像データの差分に基づいて前記時間方向変化量を算出し、かつ、前記算出部は、前記第1フィールド画像および前記第2フィールド画像の各画像内で隣接するラインを特定して、各ラインの動画像データの差分に基づいて前記空間方向変化量を算出する、請求項20に記載のデータ処理装置。
  22. 前記算出部は、前記2つのフレーム画像における同じ位置の2つのラインを特定して、各ラインの動画像データの差分に基づいて前記時間方向変化量を算出し、かつ、前記2つのフレーム画像の一方の画像内で隣接するラインを特定して、各ラインの動画像データの差分に基づいて前記空間方向変化量を算出する、請求項20に記載のデータ処理装置。
  23. 前記決定部は、前記画面内符号化方式によって圧縮符号化するフレーム画像の数および前記前方向予測符号化方式によって圧縮符号化するフレーム画像の数の少なくとも一方を増加する、請求項22に記載のデータ処理装置。
  24. 前記決定部は、前記フレーム画像を前記画面内符号化方式または前記前方向予測符号化方式のいずれかのみによって圧縮符号化する、請求項22に記載のデータ処理装置。
  25. 請求項21に記載のデータ処理装置と、
    伝送媒体を介して、前記データ処理装置の処理部によって生成された前記圧縮データを送信する送信部と
    を備えた、データ処理システム。
  26. 請求項21に記載のデータ処理装置と、
    前記データ処理装置の処理部によって生成された前記圧縮データを記録媒体に記録する記録部と
    を備えた、データ処理システム。
  27. 動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化する方法であって、
    前記動画像は、各々が2つのフィールド画像から構成される複数のフレーム画像を連続的に表示して得られ、
    前記動画像データを格納するステップと、
    前記2つのフィールド画像の動画像データに基づいて、前記動画像の変化の程度を示すパラメータを算出するステップと、
    算出された前記パラメータに基づいて、画面内符号化方式および前方向予測符号化方式によって圧縮符号化される画像単位、および、前記所定の画像単位を規定するピクチャ構造を決定するステップと、
    前記動画像データを、決定された前記ピクチャ構造にしたがって圧縮符号化し、圧縮データを生成するステップと
    を包含するデータ処理方法。
  28. 動画像を表す動画像データを、画面内符号化方式、前方向予測符号化方式および双方向予測符号化方式のいずれかによって所定の画像単位で圧縮符号化するデータ処理方法であって、
    前記動画像は、複数のフレーム画像を連続的に表示して得られ、
    前記動画像データを格納するステップと、
    連続する2つのフレーム画像間の前記動画像データの変化量を示す時間方向変化量、および、前記2つのフレーム画像の各々について画像内の前記動画像データの変化量を示す空間方向変化量を算出するステップと、
    前記時間方向変化量および前記空間方向変化量に基づいて、前記動画像の変化の程度を示すパラメータを算出するステップと、
    算出された前記パラメータに基づいて、前記複数のフレーム画像の各々について圧縮符号化方式を決定するステップと、
    格納された前記動画像データを、決定された方式にしたがって圧縮符号化し、圧縮データを生成するステップと
    を包含するデータ処理方法。
JP2004525828A 2002-08-05 2003-08-01 データ処理装置およびデータ処理方法 Expired - Fee Related JP4192149B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002227108 2002-08-05
JP2002227108 2002-08-05
PCT/JP2003/009843 WO2004014085A1 (ja) 2002-08-05 2003-08-01 データ処理装置およびデータ処理方法

Publications (2)

Publication Number Publication Date
JPWO2004014085A1 true JPWO2004014085A1 (ja) 2006-09-21
JP4192149B2 JP4192149B2 (ja) 2008-12-03

Family

ID=31492205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004525828A Expired - Fee Related JP4192149B2 (ja) 2002-08-05 2003-08-01 データ処理装置およびデータ処理方法

Country Status (6)

Country Link
US (1) US7929604B2 (ja)
EP (1) EP1507417A4 (ja)
JP (1) JP4192149B2 (ja)
KR (1) KR100636465B1 (ja)
CN (1) CN100518327C (ja)
WO (1) WO2004014085A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8254467B2 (en) * 2008-10-30 2012-08-28 Sensio Technologies Inc. Method and system for scaling compressed image frames
CN104253804B (zh) * 2013-06-28 2017-12-12 广州华多网络科技有限公司 一种传输图像数据的方法及装置
JP6761002B2 (ja) * 2018-07-23 2020-09-23 ファナック株式会社 データ管理装置、データ管理プログラム及びデータ管理方法
CN115396733A (zh) * 2022-09-02 2022-11-25 上海洛塔信息技术有限公司 视频帧传输方法、装置、设备、存储介质及产品

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3257052B2 (ja) * 1991-07-30 2002-02-18 ソニー株式会社 画像信号の高能率符号化装置及びその方法
US5666461A (en) 1992-06-29 1997-09-09 Sony Corporation High efficiency encoding and decoding of picture signals and recording medium containing same
JP3876392B2 (ja) * 1996-04-26 2007-01-31 富士通株式会社 動きベクトル探索方法
JP3604864B2 (ja) * 1997-04-25 2004-12-22 シャープ株式会社 動画像符号化装置
JP2000102017A (ja) * 1998-09-24 2000-04-07 Mitsubishi Electric Corp 画像符号化装置および画像符号化方式
JP3804745B2 (ja) * 1999-08-20 2006-08-02 Kddi株式会社 フレーム構造/フィールド構造切替式画像符号化装置
US6973126B1 (en) * 1999-03-05 2005-12-06 Kdd Corporation Video coding apparatus according to a feature of a video picture
US6115076A (en) * 1999-04-20 2000-09-05 C-Cube Semiconductor Ii, Inc. Compressed video recording device with non-destructive effects addition
JP3531532B2 (ja) * 1999-05-18 2004-05-31 日本電気株式会社 動画像符号化装置、及び方法
JP3757088B2 (ja) * 1999-10-26 2006-03-22 日本電気株式会社 動画像符号化装置および方法
JP2002010259A (ja) * 2000-06-21 2002-01-11 Mitsubishi Electric Corp 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体
JP2002016924A (ja) * 2000-06-27 2002-01-18 Nec Corp トランスコーダ装置およびトランスコード方法

Also Published As

Publication number Publication date
US7929604B2 (en) 2011-04-19
EP1507417A4 (en) 2010-09-29
JP4192149B2 (ja) 2008-12-03
CN100518327C (zh) 2009-07-22
KR100636465B1 (ko) 2006-10-19
WO2004014085A1 (ja) 2004-02-12
KR20040035763A (ko) 2004-04-29
EP1507417A1 (en) 2005-02-16
US20050226326A1 (en) 2005-10-13
CN1613261A (zh) 2005-05-04

Similar Documents

Publication Publication Date Title
US9432681B2 (en) Image decoding device and method thereof using inter-coded predictive encoding code
CN110177274B (zh) 选择运动向量精度
US8787453B2 (en) Image decoding device, image encoding device, and method thereof
CN102986211A (zh) 视频编码中的速率控制
US20120033737A1 (en) Image processing device and method
JP4192149B2 (ja) データ処理装置およびデータ処理方法
KR20060043050A (ko) 영상 신호의 인코딩 및 디코딩 방법
JP2001169290A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化システム
JP2018088688A (ja) 復号化方法
US20050201458A1 (en) Image encoding system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080826

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080919

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees