JP3864461B2 - 映像データ圧縮装置およびその方法 - Google Patents

映像データ圧縮装置およびその方法 Download PDF

Info

Publication number
JP3864461B2
JP3864461B2 JP22965096A JP22965096A JP3864461B2 JP 3864461 B2 JP3864461 B2 JP 3864461B2 JP 22965096 A JP22965096 A JP 22965096A JP 22965096 A JP22965096 A JP 22965096A JP 3864461 B2 JP3864461 B2 JP 3864461B2
Authority
JP
Japan
Prior art keywords
data
picture
video data
difficulty
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22965096A
Other languages
English (en)
Other versions
JPH1075451A (ja
Inventor
寛司 三原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP22965096A priority Critical patent/JP3864461B2/ja
Priority to US08/918,813 priority patent/US5933532A/en
Priority to EP19970306674 priority patent/EP0827343B1/en
Priority to DE69739816T priority patent/DE69739816D1/de
Priority to KR19970044603A priority patent/KR19980019201A/ko
Publication of JPH1075451A publication Critical patent/JPH1075451A/ja
Application granted granted Critical
Publication of JP3864461B2 publication Critical patent/JP3864461B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、非圧縮映像データを圧縮符号化する映像データ圧縮装置およびその方法に関する。
【0002】
【従来の技術および発明が解決しようとする課題】
非圧縮のディジタル映像データをMPEG(moving picture experts group)等の方法により、Iピクチャー(intra coded picture) 、Bピクチャー(bi-directionaly predictive coded picture)およびPピクチャー(predictive coded picture)から構成されるGOP(group of pictures) 単位に圧縮符号化して光磁気ディスク(MOディスク;magneto-optical disc)等の記録媒体に記録する際には、圧縮符号化後の圧縮映像データのデータ量(ビット量)を、伸長復号後の映像の品質を高く保ちつつ記録媒体の記録容量以下、あるいは、通信回線の伝送容量以下にする必要がある。
【0003】
このために、まず、非圧縮映像データを予備的に圧縮符号化して圧縮符号化後のデータ量を見積もり(1パス目)、次に、見積もったデータ量に基づいて圧縮率を調節し、圧縮符号化後のデータ量が記録媒体の記録容量以下になるように圧縮符号化する(2パス目)方法が採られる(以下、このような圧縮符号化方法を「2パスエンコード」とも記す)。
【0004】
しかしながら、2パスエンコードにより圧縮符号化を行うと、同じ非圧縮映像データに対して同様な圧縮符号化処理を2回施す必要があり、時間がかかってしまう。また、1回の圧縮符号化処理で最終的な圧縮映像データを算出することができないために、撮影した映像データをそのまま実時間的(リアルタイム)に圧縮符号化し、記録することができない。
【0005】
本発明は上述した従来技術の問題点に鑑みてなされたものであり、2パスエンコードによらずに、所定のデータ量以下に音声・映像データを圧縮符号化することができる映像データ圧縮装置およびその方法を提供することを目的とする。
また、本発明は、ほぼ実時間的に映像データを圧縮符号化することができ、しかも、伸長復号後に高品質な映像を得ることができる映像データ圧縮装置およびその方法を提供することを目的とする。
また、本発明は、2パスエンコードによらずに、圧縮符号化後のデータ量を見積もって圧縮率を調節し、圧縮符号化処理を行うことができる映像データ圧縮装置およびその方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するために、第1の観点の発明の符号化装置は、映像データを符号化処理して符号化映像データを生成する符号化装置であって、上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出手段と、上記映像データを所定ピクチャ分遅延させる遅延手段と、上記符号化映像データのデータレートに対するGOP単位の上記実難度データの比率が所定しきい値より大きい場合に、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの実難度データに対する P ピクチャの実難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの実難度データに対する B ピクチャの実難度データの比率と比例するように更新する重み付け係数更新手段と、ピクチャタイプ毎の上記実難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプごとに算出する目標データ量算出手段と、上記目標データ量算出手段により算出された上記目標データ量となるように、上記遅延手段により遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段とを有する。
【0007】
第2の観点の発明の符号化装置は、映像データを符号化処理して符号化映像データを生成する符号化装置であって、上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出手段と、上記映像データから、上記映像データの動きの大きさを検出する動き検出手段と、上記映像データを所定ピクチャ分遅延させる遅延手段と、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記実難度データ算出手段により算出された上記実難度データの値が大きい絵柄の上記映像データのうち、上記動き検出手段により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出手段により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新手段と、ピクチャタイプ毎の上記実難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ算出手段と、上記目標データ算出手段により算出された上記目標データ量となるように、上記遅延手段より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段とを有する。
【0008】
第3の観点の発明の符号化装置は、映像データを符号化処理して符号化映像データを生成する符号化装置であって、上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出手段と、上記統計量算出手段により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延手段と、上記統計量算出手段により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出手段と、上記符号化映像データのデータレートに対するGOP単位の上記近似難度データの比率が所定しきい値より大きい場合に、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する P ピクチャの近似難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する B ピクチャの近似難度データの比率と比例するように更新する重み付け係数更新手段と、ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出手段と、上記目標データ量算出手段により算出された上記目標データ量となるように、上記遅延手段より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段とを有する。
【0009】
第4の観点の発明の符号化装置は、映像データを符号化処理して符号化映像データを生成する符号化装置であって、上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出手段と、上記映像データから、上記映像データの動きの大きさを検出する動き検出手段と、上記統計量算出手段により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延手段と、上記統計量算出手段により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出手段と、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記近似実難度データ算出手段により算出された上記近似実難度データの値が大きい絵柄の上記映像データのうち、上記動き検出手段により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出手段により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新手段と、ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出手段と、上記目標データ量算出手段により算出された上記目標データ量となるように、上記遅延手段より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段とを有する。
【0010】
第5の観点の発明の符号化方法は、映像データを符号化処理して符号化映像データを生成する符号化方法であって、上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出工程と、上記映像データを所定ピクチャ分遅延させる遅延工程と、上記符号化映像データのデータレートに対するGOP単位の上記実難度データの比率が所定しきい値より大きい場合に、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの実難度データに対する P ピクチャの実難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの実難度データに対する B ピクチャの実難度データの比率と比例するように更新する重み付け係数更新工程と、ピクチャタイプ毎の上記実難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程とを有する。
【0011】
第6の観点の発明の符号化方法は、映像データを符号化処理して符号化映像データを生成する符号化方法であって、上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出工程と、上記映像データから、上記映像データの動きの大きさを検出する動き検出工程と、上記映像データを所定ピクチャ分遅延させる遅延工程と、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記実難度データ算出工程により算出された上記実難度データの値が大きい絵柄の上記映像データのうち、上記動き検出工程により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出工程により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新工程と、ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程とを有する。
【0012】
第7の観点の発明の符号化方法は、映像データを符号化処理して符号化映像データを生成する符号化方法であって、上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出工程と、上記統計量算出工程により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延工程と、上記統計量算出工程により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出工程と、上記符号化映像データのデータレートに対するGOP単位の上記近似難度データの比率が所定しきい値より大きい場合に、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する P ピクチャの近似難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する B ピクチャの近似難度データの比率と比例するように更新する重み付け係数更新工程と、ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程とを有する。
【0013】
第8の観点の発明の符号化方法は、映像データを符号化処理して符号化映像データを生成する符号化方法であって、上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出工程と、上記映像データから、上記映像データの動きの大きさを検出する動き検出工程と、上記統計量算出工程により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延工程と、上記統計量算出工程により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出工程と、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記近似実難度データ算出工程により算出された上記近似難度データの値が大きい絵柄の上記映像データのうち、上記動き検出工程により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出工程により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新工程と、ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程とを有する。
【0017】
【発明の実施の形態】
第1実施形態
以下、本発明の第1の実施形態を説明する。
MPEG方式といった映像データの圧縮符号化方式により、高い周波数成分が多い絵柄、あるいは、動きが多い絵柄といった難度(difficulty)が高い映像データを圧縮符号化すると、一般的に圧縮に伴う歪みが生じやすくなる。このため、難度が高い映像データは低い圧縮率で圧縮符号化する必要があり、難度が高いデータを圧縮符号化して得られる圧縮映像データに対しては、難度が低い絵柄の映像データの圧縮映像データに比べて、多くの目標データ量を配分する必要がある。
【0018】
このように、映像データの難度に対して適応的に目標データ量を配分するためには、従来技術として示した2パスエンコード方式が有効である。しかしながら、2パスエンコード方式は、実時間的な圧縮符号化に不向きである。
第1の実施形態として示す簡易2パスエンコード方式は、かかる2パスエンコード方式の問題点を解決するためになされたものであり、非圧縮映像データを予備的に圧縮符号化して得られる圧縮映像データの難度データから非圧縮映像データの難度を算出し、予備的な圧縮符号化により算出した難度に基づいて、FIFOメモリ等により所定の時間だけ遅延した非圧縮映像データの圧縮率を適応的に制御することができる。
【0019】
図1は、本発明に係る映像データ圧縮装置1の構成を示す図である。
図1に示すように、映像データ圧縮装置1は、圧縮符号化部10およびホストコンピュータ20から構成され、圧縮符号化部10は、エンコーダ制御部12、動き検出器(motion estimator)14、簡易2パス処理部16、第2のエンコーダ(encoder) 18から構成され、簡易2パス処理部16は、FIFOメモリ160および第1のエンコーダ162から構成される。
映像データ圧縮装置1は、これらの構成部分により、編集装置およびビデオテープレコーダ装置等の外部機器(図示せず)から入力される非圧縮映像データVINに対して、上述した簡易2パスエンコードを実現する。
【0020】
映像データ圧縮装置1において、ホストコンピュータ20は、映像データ圧縮装置1の各構成部分の動作を制御する。また、ホストコンピュータ20は、簡易2パス処理部16のエンコーダ162が非圧縮映像データVINを予備的に圧縮符号化して生成した圧縮映像データのデータ量、DCT処理後の映像データの直流成分(DC成分)の値および交流成分(AC成分)の電力値を制御信号C16を介して受け、受けたこれらの値に基づいて圧縮映像データの絵柄の難度を算出する。さらに、ホストコンピュータ20は、算出した難度に基づいて、エンコーダ18が生成する圧縮映像データの目標データ量Tj を制御信号C18を介してピクチャーごとに割り当て、エンコーダ18の量子化回路166(図3)に設定し、エンコーダ18の圧縮率をピクチャー単位に適応的に制御する。
【0021】
エンコーダ制御部12は、非圧縮映像データVINのピクチャーの有無をホストコンピュータ20に通知し、さらに、非圧縮映像データVINのピクチャーごとに圧縮符号化のための前処理を行う。つまり、エンコーダ制御部12は、入力された非圧縮映像データを符号化順に並べ替え、ピクチャー・フィールド変換を行い、非圧縮映像データVINが映画の映像データである場合に3:2プルダウン処理(映画の24フレーム/秒の映像データを、30フレーム/秒の映像データに変換し、冗長性を圧縮符号化前に取り除く処理)等を行い、映像データS12として簡易2パス処理部16のFIFOメモリ160およびエンコーダ162に対して出力する。
動き検出器14は、非圧縮映像データの動きベクトルの検出を行し、エンコーダ制御部12およびエンコーダ162,18に対して出力する。
【0022】
簡易2パス処理部16において、FIFOメモリ160は、エンコーダ制御部12から入力された映像データS12を、例えば、非圧縮映像データVINが、L(Lは整数)ピクチャー入力される時間だけ遅延し、遅延映像データS16としてエンコーダ18に対して出力する。
【0023】
図2は、図1に示した簡易2パス処理部16のエンコーダ162の構成を示す図である。
エンコーダ162は、例えば、図2に示すように、加算回路164、DCT回路166、量子化回路(Q)168、可変長符号化回路(VLC)170、逆量子化回路(IQ)172、逆DCT(IDCT)回路174、加算回路176および動き補償回路178から構成される一般的な映像データ用圧縮符号化器であって、入力される映像データS12をMPEG方式等により圧縮符号化し、圧縮映像データのピクチャーごとのデータ量等をホストコンピュータ20に対して出力する。
【0024】
加算回路164は、加算回路176の出力データを映像データS12から減算し、DCT回路166に対して出力する。
DCT回路166は、加算回路164から入力される映像データを、例えば、16画素×16画素のマクロブロック単位に離散コサイン変換(DCT)処理し、時間領域のデータから周波数領域のデータに変換して量子化回路168に対して出力する。また、DCT回路166は、DCT後の映像データのDC成分の値およびAC成分の電力値をホストコンピュータ20に対して出力する。
【0025】
量子化回路168は、DCT回路166から入力された周波数領域のデータを、固定の量子化値Qで量子化し、量子化データとして可変長符号化回路170および逆量子化回路172に対して出力する。
可変長符号化回路170は、量子化回路168から入力された量子化データを可変長符号化し、可変長符号化の結果として得られた圧縮映像データのデータ量を、制御信号C16を介してホストコンピュータ20に対して出力する。
逆量子化回路172は、可変長符号化回路168から入力された量子化データを逆量子化し、逆量子化データとして逆DCT回路174に対して出力する。
【0026】
逆DCT回路174は、逆量子化回路172から入力される逆量子化データに対して逆DCT処理を行い、加算回路176に対して出力する。
加算回路176は、動き補償回路178の出力データおよび逆DCT回路174の出力データを加算し、加算回路164および動き補償回路178に対して出力する。
動き補償回路178は、加算回路176の出力データに対して、動き検出器14から入力される動きベクトルに基づいて動き補償処理を行い、加算回路176に対して出力する。
【0027】
図3は、図1に示したエンコーダ18の構成を示す図である。
図3に示すように、エンコーダ18は、図2に示したエンコーダ162に、量子化制御回路180を加えた構成になっている。エンコーダ18は、これらの構成部分により、ホストコンピュータ20から設定される目標データ量Tj に基づいて、FIFOメモリ160によりLピクチャー分遅延された遅延映像データS16に対して動き補償処理、DCT処理、量子化処理および可変長符号化処理を施して、MPEG方式等の圧縮映像データVOUTを生成し、外部機器(図示せず)に出力する。
【0028】
エンコーダ18において、量子化制御回路180は、可変長量子化回路170が出力する圧縮映像データVOUTのデータ量を順次、監視し、遅延映像データS16の第j番目のピクチャーから最終的に生成される圧縮映像データのデータ量が、ホストコンピュータ20から設定された目標データ量Tj に近づくように、順次、量子化回路168に設定する量子化値Qj を調節する。
また、可変長量子化回路170は、圧縮映像データVOUTを外部に出力する他に、遅延映像データS16を圧縮符号化して得られた圧縮映像データVOUTの実際のデータ量Sj を制御信号C18を介してホストコンピュータ20に対して出力する。
【0029】
以下、第1の実施形態における映像データ圧縮装置1の簡易2パスエンコード動作を説明する。
図4(A)〜(C)は、第1の実施形態における映像データ圧縮装置1の簡易2パスエンコードの動作を示す図である。
エンコーダ制御部12は、映像データ圧縮装置1に入力された非圧縮映像データVINに対して、エンコーダ制御部12により符号化順にピクチャーを並べ替える等の前処理を行い、図4(A)に示すように映像データS12としてFIFOメモリ160およびエンコーダ162に対して出力する。
なお、エンコーダ制御部12によるピクチャーの順番並べ替えにより、図4等に示すピクチャーの符号化の順番と伸長復号後の表示の順番とは異なる。
【0030】
FIFOメモリ160は、入力された映像データS12の各ピクチャーをLピクチャー分だけ遅延し、エンコーダ18に対して出力する。
エンコーダ162は、入力された映像データS12のピクチャーを予備的に順次、圧縮符号化し、第j(jは整数)番目のピクチャーを圧縮符号化して得られた圧縮符号化データのデータ量、DCT処理後の映像データのDC成分の値、および、AC成分の電力値をホストコンピュータ20に対して出力する。
【0031】
例えば、エンコーダ18に入力される遅延映像データS16は、FIFOメモリ160によりLピクチャーだけ遅延されているので、図4(B)に示すように、エンコーダ18が、遅延映像データS16の第j(jは整数)番目のピクチャー(図4(B)のピクチャーa)を圧縮符号化している際には、エンコーダ162は、映像データS12の第j番目のピクチャーからLピクチャー分先の第(j+L)番目のピクチャー(図4(B)のピクチャーb)を圧縮符号化していることになる。従って、エンコーダ18が遅延映像データS16の第j番目のピクチャーの圧縮符号化を開始する際には、エンコーダ162は映像データS12の第j番目〜第(j+L−1)番目のピクチャー(図4(B)の範囲c)の圧縮符号化を完了しており、これらのピクチャーの圧縮符号化後の実難度データDj ,Dj+1 ,Dj+2 ,…,Dj+L-1 は、ホストコンピュータ20により既に算出されている。
【0032】
ホストコンピュータ20は、下に示す式1により、エンコーダ18が遅延映像データS16の第j番目のピクチャーを圧縮符号化して得られる圧縮映像データに割り当てる目標データ量Tj を算出し、算出した目標データ量Tj を量子化制御回路180に設定する。
【0033】
【数1】
Figure 0003864461
【0034】
但し、式1において、Djは映像データS12の第j番目のピクチャーの実難度データであり、R’j は、映像データS12,S16の第j番目〜第(j+L−1)番目のL個のピクチャに割り当てられる目標データ量の映像データ全体における平均であり、R’jの初期値(R’1)は、圧縮映像データの各ピクチャーに平均して割り当て可能な目標データであり、下に示す式2で表され、エンコーダ18が圧縮映像データを1ピクチャー分生成する度に、式3に示すように更新される。
【0035】
【数2】
Figure 0003864461
【0036】
【数3】
Figure 0003864461
【0037】
なお、式3中の数値ビットレート(Bit rate)は、通信回線の伝送容量や、記録媒体の記録容量に基づいて決められる1秒当たりのデータ量(ビット量)を示し、ピクチャーレート(Picture rate)は、映像データに含まれる1秒当たりのピクチャーの数(30枚/秒(NTSC),25枚/秒(PAL))を示し、数値Fj+L は、ピクチャータイプに応じて定められるピクチャー当たりの平均データ量を示す。
エンコーダ18のDCT回路166は、入力される遅延映像データS16の第j番目のピクチャーをDCT処理し、量子化回路168に対して出力する。
量子化回路168は、DCT回路166から入力された第j番目のピクチャーの周波数領域のデータを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化し、量子化データとして可変長符号化回路170に対して出力する。
可変長符号化回路170は、量子化回路168から入力された第j番目のピクチャーの量子化データを可変長符号化して、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成して出力する。
【0038】
同様に、図4(B)に示すように、エンコーダ18が、遅延映像データS16の第(j+1)番目のピクチャー(図4(C)のピクチャーa’)を圧縮符号化している際には、エンコーダ162は、映像データS12の第(j+1)番目〜第(j+L)番目のピクチャー(図4(C)の範囲c’)の圧縮符号化を完了し、これらのピクチャーの実難度データDj+1 ,Dj+2 ,Dj+3 ,・・・,Dj+L は、ホストコンピュータ20により既に算出されている。
【0039】
ホストコンピュータ20は、式1により、エンコーダ18が遅延映像データS16の第(j+1)番目のピクチャーを圧縮符号化して得られる圧縮映像データに割り当てる目標データ量Tj+1 を算出し、エンコーダ18の量子化制御回路180に設定する。
【0040】
エンコーダ18は、ホストコンピュータ20から量子化制御回路180に設定された目量データ量Tj に基づいて第(j+1)番目のピクチャーを圧縮符号化し、目標データ量Tj+1 に近いデータ量の圧縮映像データVOUTを生成して出力する。
さらに以下、同様に、映像データ圧縮装置1は、遅延映像データS16の第k番目のピクチャーを、量子化値Qk (k=j+2,j+3,…)をピクチャーごとに変更して順次、圧縮符号化し、圧縮映像データVOUTとして出力する。
【0041】
以上説明したように、第1の実施形態に示した映像データ圧縮装置1によれば、短時間で非圧縮映像データVINの絵柄の難度を算出し、算出した難度に応じた圧縮率で適応的に非圧縮映像データVINを圧縮符号化することができる。つまり、第1の実施形態に示した映像データ圧縮装置1によれば、2パスエンコード方式と異なり、ほぼ実時間的に、非圧縮映像データVINの絵柄の難度に基づいて適応的に非圧縮映像データVINを圧縮符号化をすることができ、実況放送といった実時間性を要求される用途に応用可能である。
なお、第1の実施形態に示した他、本発明に係るデータ多重化装置1は、エンコーダ162が圧縮符号化した圧縮映像データのデータ量を、そのまま難度データとして用い、ホストコンピュータ20の処理の簡略化を図る等、種々の構成を採ることができる。
【0042】
第2実施形態
第1の実施形態に示した簡易2パスエンコード方式によれば、実時間かつ、絵柄の難度に応じた適応的な非圧縮映像データに対する圧縮符号化処理が可能である。しかしながら、第1の実施形態に示した簡易2パスエンコード方式を用いた場合、実時間性が厳しく要求される場合には、FIFOメモリ160の遅延時間を大きくすることができず、真に適切な目標データ量Tj の算出が難しく、圧縮映像データVOUTを伸長復号して得られる映像の品質が低下してしまう可能性がある。
【0043】
第2の実施形態においては、第1の実施形態に示した映像データ圧縮装置1(図1)を用い、ホストコンピュータ20の処理内容を変更して、FIFOメモリ160の遅延時間を長くしなくても適切な目標データ量Tj の値を得ることができるように、非圧縮映像データをLピクチャー分、予備的に圧縮符号化して得られた圧縮映像データの第j番目のピクチャー〜第(j+L−1)番目のピクチャーの実難度データDj 〜Dj+L-1 から、圧縮映像データの第(j+L)番目のピクチャー〜第(j+L+B)番目のピクチャー(Bは整数)の難度データ(予測難度データ)Dj+L 〜Dj+L+B を算出し、実際に得られた難度データDj 〜Dj+L-1 (実難度データ)および予測によって得られた難度データD’j+L 〜D’j+L+B に基づいて、第1の実施形態に示した簡易2パスエンコード方式よりも適切な目標データ量Tj の値を得ることができる圧縮符号化方式(予測簡易2パスエンコード方式)を説明する。
【0044】
まず、第2の実施形態で説明する予測簡易2パスエンコード方式を概念的に説明する。
予測簡易2パスエンコード方式は、徐々に絵柄が難しくなってゆく、つまり、徐々に圧縮符号化時のDCT処理後の高い周波数成分が多くなり、動きが速くなってゆく非圧縮映像データの絵柄は、さらに難しくなってゆき、逆に、徐々に絵柄が難しくなくなって(簡単になって)ゆく非圧縮映像データの絵柄は、さらに簡単になってゆくであろうと予測可能であることを前提する。
【0045】
つまり、予測簡易2パスエンコード方式は、ホストコンピュータ20が、この前提に基づいて、さらに絵柄が難しくなってゆくと予測される場合には、さらに絵柄が難しいピクチャーに備えて、その時点で圧縮符号化しているピクチャーに割り当てる目標データ量を節約し、逆に、さらに絵柄が簡単になってゆくと予測される場合には、その時点で圧縮符号化しているピクチャーに割り当てる目標データ量を増やすようにエンコーダ18に対する圧縮率の制御を行う。
【0046】
さらに、予測簡易2パスエンコード方式の概念的な説明を続ける。
映像データは、一般的に、時間方向および空間方向について相関性が高く、映像データの圧縮符号化は、これらの相関性に着目し、冗長性を除くことにより行われる。
時間方向について相関性が高いということは、現時点の非圧縮映像データのピクチャーの難度とそれ以降の非圧縮映像データのピクチャーの難度とが近いということを意味する。また、難度の増減の傾向も、現時点までの難度の増減の傾向がそれ以降も続くことが多い。
【0047】
具体例を挙げると、カメラが静止状態からゆっくりとカメラを水平方向に回し初め、最後に一定の回転速度で回転しながら、静止している物体を撮影する場合の非圧縮映像データの絵柄を考える。最初はカメラが停止状態であるため、静止映像が撮影され、絵柄の難度は低くなる。次に、カメラを回し始めて1〜2秒後に一定の回転速度になると仮定すると、カメラを回し始めて1〜2秒間は絵柄の難度は高くなる傾向を示す。この状態を、映像データ圧縮装置1側から見ると、数GOP分の圧縮映像データを生成する間、入力される非圧縮映像データの絵柄の難度が高くなる傾向が続くことになる。
【0048】
従って、この具体例に示したような場合には、非圧縮映像データの絵柄の難度が増大傾向を示した場合に、それ以降の絵柄の難度が増大傾向を示すと予測するのは妥当である。以下に説明する予測簡易2パスエンコード方式は、このような難度および難度の増減傾向の時間的相関性を積極的に利用して、圧縮映像データの各ピクチャーに対して、第1の実施形態に示した簡易2パスエンコード方式においてよりも適切な目標データ量の割り当てを行おうとするものである。
【0049】
以下、第2の実施形態における映像データ圧縮装置1の予測簡易2パスエンコードの動作を説明する。
図5(A)〜(C)は、第2の実施形態における映像データ圧縮装置1の予測簡易2パスエンコードの動作を示す図である。
エンコーダ制御部12は、第1の実施形態においてと同様に、映像データ圧縮装置1に入力された非圧縮映像データVINに対して、エンコーダ制御部12により符号化順にピクチャーを並べ替える等の前処理を行い、図5(A)に示すように映像データS12としてFIFOメモリ160およびエンコーダ162に対して出力する。
【0050】
FIFOメモリ160は、第1の実施形態においてと同様に、入力された映像データS12の各ピクチャーをLピクチャー分だけ遅延し、エンコーダ18に対して出力する。
エンコーダ162は、第1の実施形態においてと同様に、入力された映像データS12のピクチャーを予備的に順次、圧縮符号化し、第j(jは整数)番目のピクチャーを圧縮符号化して得られた圧縮符号化データのデータ量、DCT処理後の映像データのDC成分の値およびAC成分の電力値をホストコンピュータ20に対して出力する。ホストコンピュータ20は、エンコーダ162から入力されたこれらの値に基づいて、実難度データDj を順次、算出する。
【0051】
例えば、エンコーダ18に入力される遅延映像データS16は、FIFOメモリ160によりLピクチャーだけ遅延されているので、図5(B)に示すように、エンコーダ18が、遅延映像データS16の第j番目のピクチャー(図5(B)のピクチャーa)を圧縮符号化している際には、エンコーダ162は、第1の実施形態においてと同様に、映像データS12の第j番目のピクチャーからLピクチャー分先の第(j+L)番目のピクチャー(図5(B)のピクチャーb)を圧縮符号化していることになる。
【0052】
従って、エンコーダ18が遅延映像データS16の第j番目のピクチャーの圧縮符号化を開始する際には、エンコーダ162は映像データS12の第(j−A)番目〜第(j+L−1)番目のピクチャー(図5(B)の範囲c、但し、図5はA=0の場合を示す)の圧縮符号化を完了し、これらのピクチャーの圧縮符号化後のデータ量、および、DCT処理後の映像データのDC成分の値およびAC成分の電力値をホストコンピュータ20に対して出力している。ホストコンピュータ20は、エンコーダ162から入力されたこれらの値に基づいて、難度データ(実難度データ、図5(B)の範囲d)Dj-A ,Dj-A+1 ,…,Dj ,Dj+1 ,Dj+2 ,…,Dj+L-1 の算出を既に終了している。なお、Aは整数であり、正負を問わない。
【0053】
ホストコンピュータ20は、実難度データDj-A ,Dj-a+1 ,…,Dj ,Dj+1 ,Dj+2 ,…,Dj+L-1 に基づいて、映像データS12の第(j+L)番目〜第(j+L+B)番目のピクチャーの圧縮符号化後の難度データ(予測難度データ、図5(B)の範囲e)D’j+L ,D’j+L+1 ,D’j+L+2 ,…,D’j+L+B を予測し、下に示す式4により、遅延映像データS16の第j番目のピクチャーの圧縮符号化後の目標データ量Tj を算出する。従って、遅延映像データS16の第j番目のピクチャーの圧縮符号化後の目標データ量Tj を算出するために、実難度データと予測難度データとを含めて、図5(B)の範囲cの(A+L+B+1)ピクチャー分の難度データを用いることになる。なお、予測難度データDj ’は、例えば、実難度データDj を直線近似し、近似により得られた直線を外挿する等の方法により算出されうる。
【0054】
【数4】
Figure 0003864461
【0055】
なお、式4の各記号は、式1の各記号に同じである。
エンコーダ18は、第1の実施形態と同様に、ホストコンピュータ20により量子化制御回路180に設定された目標データ量Tj に基づいて、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成して出力する。
さらに、ホストコンピュータ20は、図5(B)に示した動作と同様に、遅延映像データS16の第(j+1)番目のピクチャー(図5(C)のピクチャーa’)に対しても、映像データS12の第(j+L+1)番目のピクチャー(図5(C)のピクチャーb’)以前の図5(C)の範囲d’の実難度データDj-A+1 ,Dj-A+2 ,…,Dj ,Dj+1 ,Dj+2 ,…,Dj+L 、および、図5(C)の範囲e’に示す予測難度データ、D’j+L+1 ,D’j+L+2 ,D’j+L+3 ,…,D’j+L+B+1 、つまり、図5(C)の範囲c’に示す実難度データと予測難度データとに基づいて、遅延映像データS16の第(j+1)番目のピクチャーの圧縮符号化後の目標データ量Tj+1 を算出する。エンコーダ18は、ホストコンピュータ20が算出した目量データ量Tj+1 に基づいて、遅延映像データS16の第(j+1)番目のピクチャーを圧縮符号化し、目標データ量Tj+1 に近いデータ量の圧縮符号化データVOUTを生成する。
なお、以上の映像データ圧縮装置1の予測簡易2パスエンコード動作は、遅延映像データS16の第(j+1)番目のピクチャーに対しても同様である。
【0056】
以下、図6を参照して、第2の実施形態における映像データ圧縮装置1の動作を整理して説明する。
図6は、第2の実施形態における映像データ圧縮装置1(図1)の動作を示すフローチャートである。
図6に示すように、ステップ102(S102)において、ホストコンピュータ20は、式1等に用いられる数値j,R’1 を、j=−(L−1),R’1 =(Bit rate ×(L+B))/Picture rate として初期化する。
【0057】
ステップ104(S104)において、ホストコンピュータ20は、数値jが0より大きいか否かを判断する。数値jが0より大きい場合にはS106の処理に進み、小さい場合にはS110の処理に進む。
ステップ106(S106)において、エンコーダ162は、映像データS12の第(j+L)番目のピクチャーを圧縮符号化し、実難度データDj+L を生成する。
【0058】
ステップ108(S108)において、ホストコンピュータ20は数値jをインクリメントする(j=j+1)。
ステップ110(S110)において、ホストコンピュータ20は、遅延映像データS16に第j番目のピクチャーが存在するか否かを判断する。第j番目のピクチャーが存在する場合にはS112の処理に進み、存在しない場合には圧縮符号化処理を終了する。
【0059】
ステップ112(S112)において、ホストコンピュータ20は、数値jが数値Aよりも大きいか否かを判断する。数値jが数値Aよりも大きい場合にはS114の処理に進み、小さい場合にはS116の処理に進む。
ステップ114(S114)において、ホストコンピュータ20は、実難度データDj-A 〜Dj+L-1 に基づいて、予測難度データD’j+L 〜D’j+L+B を算出する。
ステップ116(S116)において、ホストコンピュータ20は実難度データD1 〜Dj+L-1 から、予測難度データD’j+L 〜D’j+L+B を算出する。
【0060】
ステップ118(S118)において、ホストコンピュータ20は、式4を用いて目標データ量Tj を算出し、エンコーダ18の量子化制御回路180に設定する。さらに、エンコーダ18は、量子化制御回路180に設定された目標データ量Tj に基づいて遅延映像データS16の第j番目のピクチャーを圧縮符号化し、第j番目のピクチャーから実際に得られた圧縮映像データのデータ量Sj をホストコンピュータ20に対して出力する。
ステップ120(S120)において、ホストコンピュータ20は、エンコーダ18からのデータ量Sj を記憶し、さらに、映像データS12の第(j+L)番目のピクチャーの実難度データDj+L を出力する。
【0061】
ステップ122(S122)において、エンコーダ18は、遅延映像データS16の第j番目を圧縮符号化して得られた圧縮映像データVOUTを外部に出力する。
ステップ124(S124)において、ホストコンピュータ20は、ピクチャータイプに応じて、式3中に用いられる数値Fj+L を算出する。
ステップ126(S126)において、ホストコンピュータ20は、式3に示した演算(R’j+1 =R’j −Sj +Fj+L )を行う。
【0062】
以上説明したように、第2の実施形態に示した映像データ圧縮装置1による予測簡易2パスエンコードによれば、短時間で非圧縮映像データVINの絵柄の難度を算出し、算出した難度に基づいて予測した難度をさらに用いて適応的に非圧縮映像データVINを圧縮符号化することができ、簡易2パスエンコード方式に比べて、より適切な目標データ量を圧縮映像データの各ピクチャーに割り当てることが可能である。従って、予測簡易2パスエンコード方式による圧縮映像データを伸長復号した場合、簡易2パスエンコード方式による圧縮映像データを伸長復号した場合に比べて、より高品質な映像を得ることができる。
【0063】
第3実施形態
以下、本発明の第3の実施形態として、編集処理により、複数の非圧縮映像データ(以下、非圧縮映像データをシーンとも記す)を連続的に接続して1つの非圧縮映像データ(編集映像データ)とし、この複数のシーンからなる編集映像データを、第1の実施形態に示した映像データ圧縮装置1(図1)を用いた簡易2パスエンコード方式により圧縮符号化する方法を説明する。
【0064】
図7(A)〜(C)は、第2の実施形態における予測簡易2パスエンコード方式、および、第3の実施形態における改良予測簡易2パスエンコード方式による、シーンチェンジの前後のピクチャーに対する圧縮符号化を示す図である。
第2の実施形態に示した予測簡易2パスエンコード方式は、図7(A)に示すように入力される映像データに含まれるピクチャー間の時間的な相関性を利用し、圧縮映像データのピクチャーそれぞれのデータ量を予測する。しかしながら、図7(B)に示すタイミングでシーンチェンジ(scene change)が生じた場合、シーンチェンジの前後では、ピクチャー間に相関性がないので、図7(C)に示すように、シーンチェンジの前の難度データに基づいてシーンチェンジの後のピクチャーに対する目標データ量Tj を算出することとなり、第2の実施形態に示した予測簡易2パスエンコード方式の効果を得ることができないばかりか、却って、伸長復号後の映像の品質が悪化してしまう可能性がある。
【0065】
つまり、具体例を挙げると、予測簡易2パスエンコード方式において、絵柄が簡単なシーンが入力されている間にシーンチェンジが生じ、絵柄が難しいシーンに代わった場合、ホストコンピュータ20は、シーンチェンジ後も、入力される編集映像データの難度データの値を小さく予測するにも関わらず、実際には、絵柄が難しいピクチャーが入力され、後のシーンの各ピクチャーに割り当てるデータ量が不足してしまう。このように、割り当てるデータ量が不足した場合、シーンチェンジ部分の圧縮映像データに著しい符号化歪みが生じ、伸長復号して得られる映像の品質が著しく低下してしまう。
【0066】
第3の実施形態に示す予測簡易2パスエンコード方式(改良予測簡易2パスエンコード方式)は、かかる観点からなされたものであって、シーンチェンジの前後等において編集映像データの時間的な相関性が失われた場合に、編集映像データの時間的な相関性が失われた部分に生じる難度データの予測に基づくデータ量の割り当てに起因する悪影響を除去し、さらに、シーンチェンジ直後のピクチャーに割り当てる符号量を精度よく予測し、効率的な圧縮符号化を行うことを目的とする。
【0067】
この目的を達成するために、改良予測簡易2パスエンコード方式は、第2の実施形態に示した映像データ圧縮装置1(図1)を用いた予測簡易2パスエンコード方式を改良し、シーンチェンジを検出し、圧縮映像データのピクチャーに割り当てるデータ量の算出に用いることができなくなったシーンチェンジ前の実難度データではなく、シーンチェンジ後に求めた実難度データを用いて、可能な限り正確に、その後の所定数のピクチャーの難度を予測する。
【0068】
まず、図8および図9を参照して、改良予測簡易2パスエンコード方式を概念的に説明する。
図8(A)〜(C)は、エンコーダ制御部12(図1)による編集映像データのピクチャーの順序の入れ替え処理、および、ホストコンピュータ20によるピクチャーの種類(ピクチャータイプ)の変更処理を示す図である。
図9は、編集映像データのシーンチェンジ部分付近の実難度データの値の経時的な変化を例示する図である。なお、図9において、Iピクチャー、PピクチャーおよびBピクチャーは、編集映像データを圧縮符号化した後のピクチャータイプを示す。
【0069】
編集映像データのシーンチェンジが圧縮符号化後にPピクチャーとなるピクチャー(以下、「圧縮符号化後にPピクチャーとなるピクチャー」等を、単に「Pピクチャー」等とも記す)で生じると、エンコーダ制御部12(図1)が、図8(A),(B)に示すように編集映像データのピクチャーの順序を並び替えた映像データS12からエンコーダ162およびホストコンピュータ20が生成する実難度データDj の値は、例えば、図9に示すように変化する。つまり、シーンチェンジの直後、編集映像データの先頭のPピクチャーの実難度データDj は、このピクチャーから生成される圧縮映像データのPピクチャーが、前方のピクチャーを参照することができないため増加し、Iピクチャーとほぼ、同様の処理によって生成されることになる。従って、シーンの先頭のPピクチャーの実難度データDj の値は、例えば、Iピクチャーの難度データDj と同程度の値になる。
【0070】
従って、ホストコンピュータ20は、エンコーダ162が生成する圧縮映像データのピクチャータイプシーケンスに基づいて、実難度データDj の値の経時的な変化を監視し、例えば、Pピクチャーの実難度データDj の値が、直前のPピクチャーの実難度データDj の1.5倍以上になった場合、直前のIピクチャーの実難度データDj の0.7倍以上になった場合、あるいは、第2の実施形態に示した予測簡易2パスエンコード方式においてと同じ方法でホストコンピュータ20が予測した値に比べ、実際の実難度データの値が1.5倍以上になった場合に、そのPピクチャーに対応する編集映像データのピクチャーでシーンチェンジが生じたと判断することができる。
【0071】
しかしながら、編集映像データのシーンチェンジが圧縮符号化後にIピクチャーとなるピクチャーで生じると、ホストコンピュータ20が生成する実難度データDj の値はほとんど変化しないことがあり、逆に、シーンチェンジ後の編集映像データの絵柄が単純な場合等には、かえって、実難度データDj の値が減少する可能性がある。また、シーンチェンジ前の編集映像データの絵柄が複雑で、シーンチェンジ後の編集映像データの絵柄が平坦である場合、あるいは、シーンチェンジ前後の編集映像データに非常に動きが大きい場合等には、Pピクチャーの実難度データDj の値が顕著に増加しない場合がある。しかしながら、事実上、シーンチェンジの直後は後方のピクチャーのみしか参照できないので、シーンチェンジ直後のBピクチャーの実難度データDj の値は、Pピクチャーの実難度データDj の値と同程度にまで増大する。
【0072】
従って、ホストコンピュータ20は、実難度データDj の値の経時的な変化を監視し、例えば、Bピクチャーの実難度データDj の値が、直前のBピクチャーの実難度データDj の1.5倍以上になった場合、あるいは、予測した値と比べ実際の実難度データDj の値が1.5倍以上になった場合に、そのBピクチャーの直前のIピクチャーおよびPピクチャーに対応する編集映像データのピクチャーでシーンチェンジが生じたと判断することができる。
なお、Pピクチャーの実難度データDj の変化に基づいてシーンチェンジを検出する方法、および、Bピクチャーの実難度データDj の変化に基づいてシーンチェンジを検出する方法を併用することにより、ホストコンピュータ20は、シーンチェンジの検出を確実に行うことができる。
【0073】
一方、シーンチェンジの発生により、編集映像データのシーンチェンジ以前のピクチャーとシーンチェンジ以降のピクチャーの相関性はなくなるので、第2の実施形態に示した予測簡易2パスエンコード方式におけるシーンチェンジ以前の実難度データDj を用いた、シーンチェンジ以降のピクチャーに対する予測難度データD’j は意味を有さなくなる。
しかしながら、編集映像データのシーンチェンジ直後の数枚のピクチャーは、それ以降のピクチャーと充分な相関性を有し、従って、シーンチェンジ直後の数枚のピクチャーの実難度データDj に基づいて、それ以降の所定枚数のピクチャーの難度データDj の値を予測することが可能である。
【0074】
さらに、第2の実施形態に示した予測簡易2パスエンコード方式においては、式4に示したように目標データ量Tj を算出する。従って、目標データ量Tj を算出するためには、下に示す式5において定義される総和値Sumj を用いればよく、必ずしも個々の予測難度データD’j を求める必要はない。
【0075】
【数5】
Figure 0003864461
【0076】
式5において定義した総和値Sumj を用いると、式4は、下に示す式6に書き換えることができる。
【0077】
【数6】
Figure 0003864461
【0078】
つまり、ホストコンピュータ20は、個々の予測難度データD’j ではなく、総和値Sumj を予測することができさえすれば、目標データ量Tj を算出することができる。
【0079】
第3の実施形態における改良予測簡易2パスエンコード方式において、ホストコンピュータ20は、シーンチェンジ直後に生成した実難度データDj に基づいて総和値Sumj を予測し、予測した総和値Sumj に基づいて、目標データ量Tj を精度よく算出する。続いて所定数の編集映像データのピクチャーが入力される間、ホストコンピュータ20は、その後に生成した実難度データDj に基づいて、総和値Sumj の値を順次、補正する。さらに、ホストコンピュータ20は、シーンチェンジ以降、さらに所定数のピクチャーが入力され、充分な数の実難度データDj を生成した後には、第2の実施形態に示した予測簡易2パスエンコード方式においてと同じ方法により、目標データ量Tj を生成する。
【0080】
次に、第3の実施形態における映像データ圧縮装置1(図1)の動作を説明する。なお、説明の簡略化のために、第3の実施形態においても、図7に示したように、映像データ圧縮装置1は、第2の実施形態においてと同じピクチャータイプシーケンス(N=15,M=3;Nは1GOPに含まれるピクチャー数、MはPピクチャーの間のBピクチャー数)に編集映像データを圧縮符号化し、第2の実施形態においてと同様に、15個のピクチャーの実難度データDj から、次の15個のピクチャーの予測難度データD’j を生成する場合を例に説明する。
【0081】
エンコーダ制御部12は、第1の実施形態および第2の実施形態においてと同様の処理を行い、例えば、図8(A)に示したピクチャータイプシーケンスで入力される非圧縮映像データのピクチャーの順番を、図8(B)に示すように、エンコーダ162およびエンコーダ18における圧縮符号化に適した順番、つまり、Bピクチャーが直後のIピクチャーまたはPピクチャーの後ろになる順番に入れ替えて、映像データS12としてエンコーダ162およびFIFOメモリ160に対して出力する。従って、例えば、図8(A)に示したように、第1のシーンのデータと第2のシーンのデータとの間のシーンチェンジがBピクチャーに圧縮符号化されるべきピクチャーであっても、エンコーダ162およびエンコーダ18に入力される後ろのシーンの最初のピクチャータイプは必ずPピクチャーまたはIピクチャーになる。
FIFOメモリ160は、第1の実施形態および第2の実施形態においてと同様に、例えば、入力される編集映像データを15ピクチャー分、遅延してエンコーダ18に対して出力する。
【0082】
エンコーダ162は、第1の実施形態および第2の実施形態においてと同様に、シーンチェンジの有無にかかわらず、映像データS12をピクチャータイプシーケンスI,B,B,P,B,B,P,B,B,P,B,B,P,B,B,P,B,Bで圧縮符号化し、実難度データDj を生成してホストコンピュータ20に対して出力する。エンコーダ162が生成する実難度データDj の値の経時的な変化は、例えば、図9に示したようになり、一般的に、シーンチェンジが発生した直後の後ろのシーンの最初のPピクチャーの実難度データの値は、他のPピクチャーの実難度データの値と比べて大きくなる。
【0083】
ホストコンピュータ20は、エンコーダ162から入力される実難度データの値の経時的な変化を監視し、第3の実施形態において上述したように、実難度データDj の値が、直前のPピクチャーの実難度データDj-1 の、例えば1.5倍(実用的には1.4倍〜1.8倍の間の値とすると好適)以上の値を示すPピクチャーを検出する等の方法によりPピクチャーでシーンチェンジが発生したことを判断する。シーンチェンジを検出した場合、ホストコンピュータ20はさらに、図8(C)に示したように、後ろのシーンの最初のPピクチャーを前のシーンの最後のピクチャーを参照しないIピクチャーに変更し、前のシーンの最後のIピクチャーをPピクチャーに変更するように、エンコーダ18を制御して編集映像データのシーンチェンジの前後の部分を圧縮符号化する際のピクチャータイプシーケンスを変更させる。
【0084】
なお、シーンチェンジが生じてもIピクチャー自体のデータ量には大きな変化は生じるとは限らない。しかし、ホストコンピュータ20は、第3の実施形態において上述したように、Bピクチャーの実難度データの値の経時的な変化を監視し、例えば、直前のBピクチャーの実難度データの1.5倍の値の実難度データを有するBピクチャーを検出する等の方法により、Iピクチャーでシーンチェンジが生じたことを判断することができる。
【0085】
図10は、ホストコンピュータ20が、編集映像データにシーンチェンジが発生する場合に、実難度データD1 〜D15に基づいて予測難度データD’16〜D’30を算出する方法、および、編集映像データにシーンチェンジが発生しない場合の予測難度データD’16〜D’30を算出する方法を示す図である。
ホストコンピュータ20は、編集映像データにシーンチェンジが発生しない場合には、エンコーダ162から得られたデータから、図10中に○印で示す実難度データD1 〜D15を生成し、生成した実難度データD1 〜D15に基づいて、図10中に×印で示す予測難度データD’16〜D’30をピクチャーの種類(ピクチャータイプ)ごとに算出する。
【0086】
つまり、編集映像データにシーンチェンジが発生しない場合には、ホストコンピュータ20は、Bピクチャーの実難度データD2 ,D3 ,…,D13,D14の値を、図10中の点線Aで直線近似して外挿し、Bピクチャーの予測難度データD’16,D’17,…,D’29,D’30を生成し、Iピクチャーの実難度データD4 、および、必要に応じてこれ以前のIピクチャーの実難度データDj の値を直線近似して外挿し、Iピクチャーの予測難度データD’18を生成し、Pピクチャーの実難度データD1 ,D7 ,…,D12、および、必要に応じてこれ以前のPピクチャーの実難度データDj の値を直線近似して外挿し、Pピクチャーの予測難度データD’15,D’21,…,D’27を生成する。さらに、ホストコンピュータ20は、これらの実難度データDj および予測難度データD’j を用いて、第2の実施形態に示した予測簡易2パス方式により目標データ量Tj を算出する。
【0087】
以下、ホストコンピュータ20が、Pピクチャーで編集映像データのシーンチェンジを検出した場合の処理内容を、段階に分けて説明する。
第1段階
ホストコンピュータ20が、Pピクチャーでシーンチェンジが発生したことを検出した場合、図10中に●で示すPピクチャーの実難度データD15のみからでは、ピクチャー間の動きの量等によって左右されるBピクチャーおよびPピクチャーの難度を予測することができない。そこで、ホストコンピュータ20は、予め実験等により求められたIピクチャー、PピクチャーおよびBピクチャーの実難度データの値の比率(i:p:b)を用いて、式5に定義した総和値Sumj を求める。
【0088】
つまり、ホストコンピュータ20は、第(j+1)番目(図10においてはj=1)のピクチャーに対する目標データ量を算出するために、例えば、下に示す予め求めたIピクチャー、PピクチャーおよびBピクチャーの実難度データの値の比率(i:p:b)を用いた式7に、シーンチェンジが生じたPピクチャーの実難度データDj+15を代入して、第(j+1)番目のピクチャーに対する目標データ量Tj+1 の算出に用いる総和値Sumj+1 を予測し、さらに、予測した総和値Sumj+1 を式4に代入して、第(j+1)番目のピクチャーに対する目標データ量Tj+1 を算出する。
【0089】
【数7】
Figure 0003864461
【0090】
式7においては、シーンチェンジが発生したPピクチャーの実難度データDj+15の値が、第3の実施形態において上述したように、直後のIピクチャーの実難度データDj+18と等しいことを前提とし、ホストコンピュータ20が、予め求めた比率(i:p:b)、および、1GOPに含まれるIピクチャー、PピクチャーおよびBピクチャーの枚数を乗じた係数を、シーンチェンジ後に最初に算出したPピクチャーの実難度データDj+15に乗算し、さらに、所定の定数αを加算して総和値Sumj+1 を算出することを意味している。
【0091】
なお、式7においては、定数αは、実験等により予め求められる所定の値をとり、図10中の第(j+15)番目のPピクチャーの直後、つまり、シーンチェンジ直後の第(j+16)番目および第(j+17)番目のBピクチャーが、前方予測または後方予測のみにより生成されるために、他のBピクチャーに比べてデータ量が多いことを見越したマージンとしての意味を有する。
【0092】
ホストコンピュータ20が、式7により求めた総和値Sumj を用いて、第(j+15)番目〜第(j+30)番目の難度データの直線予測を変更したと仮定すると、予測難度データD’j+15〜D’j+30の値は、シーンチェンジにより増加し、図10中に点線Bで示した値になる。ただし、目標データ量Tj の算出のためには総和値Sumj の値のみを予測すればよく、また、後述するように、定数αの値は、第(j+2)番目のピクチャーに対する総和値Sumj+1 を算出する際に補正されるので、ホストコンピュータ20は、シーンチェンジが発生しない場合と異なり、シーンチェンジが発生した場合、難度データの予測をピクチャーの種類(ピクチャータイプ)別に敢えて行わない。
【0093】
第2段階
ホストコンピュータ20が、第(j+2)番目のピクチャーに対する目標データ量Tj+2 を算出する際には、第(j+16)番目のBピクチャーの実難度データDj+16が算出されている。図10に示した例においては、第(j+16)番目のBピクチャーは、後ろのシーンに属するが、図8(A),(B)に示したように、エンコーダ制御部12がピクチャーの順序を入れ替えているため、第(j+16)番目のBピクチャーが、前のシーンに属している可能性があり、また、前方予測または後方予測のみにより生成されているため、ホストコンピュータ20は、第(j+16)番目のBピクチャーの実難度データDj+16を、第(j+2)番目のピクチャーに対する目標データ量Tj+2 を算出する際の総和値Sumj+2 の予測に用いることはできない。
【0094】
しかしながら、式7において、定数αとしてマージンを考慮した2枚のBピクチャーの内の最初の1枚のBピクチャーの実難度データDj+16の値を用いて、式7の定数αを補正することは可能である。そこで、ホストコンピュータ20は、下に式8として示すように、式7の定数αを、実難度データDj+16に基づいて補正して定数α’を算出し、さらに精度が高い総和値Sumj+2 を予測することができる。ホストコンピュータ20は、予測した総和値Sumj+2 を式4に代入して、第(j+2)番目のピクチャーに対する目標データ量Tj+2 を算出する。
【0095】
【数8】
Figure 0003864461
【0096】
第3段階
ホストコンピュータ20が、第(j+3)番目のピクチャーに対する目標データ量Tj+3 を算出する際には、第(j+17)番目のBピクチャーの実難度データDj+17が算出されている。従って、式7において、定数αとしてマージンを考慮した2枚のBピクチャーの両方、つまり、図8(A)〜(C)に示したピクチャータイプシーケンスにおいて、IピクチャーおよびPピクチャーに挟まれる1組のBピクチャー全ての実難度データDj+16,Dj+16の値が判明したので、下に式9として示すように、式7の定数αあるいは式8の定数α’は不要になる。
【0097】
【数9】
Figure 0003864461
【0098】
第4段階
ホストコンピュータ20が、第(j+4)番目のピクチャーに対する目標データ量Tj+3 を算出する際には、第(j+18)番目のIピクチャーの実難度データDj+18が算出されている。この段階で、図10に示した例においては、シーンチェンジ以降の全ての種類(ピクチャータイプ)のピクチャーの実難度データDi の値が判明する。そこで、式7〜式9において用いられた予め求められた比率(i:p:b)の値を、ホストコンピュータ20が実際に算出したIピクチャーの実難度データDj+18、Pピクチャーの実難度データDj+15およびPピクチャーの実難度データDj+16(Dj+17)に置き換えることが可能になる。
【0099】
このように、ホストコンピュータ20は、予め求めた比率(i:p:b)を、実際の比率〔Dj+18:Dj+15:Dj+16(Dj+17)〕に置換した式9を用いて、さらに精度よく総和値Sumj+18を予測し、式4に代入して第(j+4)番目のピクチャーに対する目標データ量Tj+4 を算出する。
【0100】
第5段階
第4段階と同様に、第(j+5)番目以降の数枚(例えば6〜9枚)のピクチャーに対する目標データ量Tj+3 を算出し、予測難度データD’i の算出に充分な数量の実難度データDi が得られた後は、ホストコンピュータ20は、シーンチェンジが発生しない場合と同様に、直線近似により予測難度データD’i を算出し、算出した予測難度データD’i を式4に代入して、目標データ量Ti を算出する。
【0101】
ホストコンピュータ20が、第3の実施形態において上述したように、Iピクチャーの実難度データDi の変化に基づいて、Iピクチャーでシーンチェンジが発生したと判断した場合、Pピクチャーでシーンチェンジが発生したと判断した場合と同じ処理、つまり、上述した第1段階〜第5段階の処理を行うことにより、各ピクチャーに対する目標データ量Ti を算出することができる。
【0102】
一方、ホストコンピュータ20が、第3の実施形態において上述したように、Bチャネルの実難度データDi の値の変化に基づいて、Iピクチャーでシーンチェンジが発生したと判断した場合、ホストコンピュータ20は、Pピクチャーでシーンチェンジが発生したと判断した場合における第1段階または第2段階の処理を行うことができない。従って、Bチャネルの実難度データDi の値の変化に基づいてIピクチャーでシーンチェンジが発生したと判断した場合、ホストコンピュータ20は、Pピクチャーでシーンチェンジが発生したと判断した場合における第2段階または第3段階の処理を行い、各ピクチャーに対する目標データ量Ti を算出する。
【0103】
以上説明した総和値Sumi の予測および目標データ量Ti の算出に係る処理の内容を、フローチャートを参照して、さらに説明する。
図11および図12は、第3の実施形態における改良予測簡易2パスエンコード方式における総和値Sumi の予測および目標データ量Ti の算出に係る処理内容を示すフローチャート図である。
【0104】
なお、図11および図12において、データSC_Flagは、過去15ピクチャー以内にシーンチェンジが生じている場合にはシーンチェンジの位置を示し、これ以外の場合には0に設定される。また、データI_Flagの値は、図8(A)〜(C)に示したピクチャータイプシーケンスにおいて、Iピクチャーの直後、3ピクチャーに対する処理が終了するまでは1となり、それ以外の場合には0になる。また、係数Ith1,Ith2,Pth,Bthは、シーンチェンジの検出の際に、それぞれIピクチャー、PピクチャーおよびBピクチャーの値を判断するために用いる係数を示す。
【0105】
図11に示すように、ステップ100(S100)において、ホストコンピュータ20は、エンコーダ162から所定のデータを得て、実難度データDi を生成する。
ステップ102(S102)において、ホストコンピュータ20は、データSC_Flagの値が0であるか否かを判断する。データSC_Flagの値が0である場合にはS200(図12)の処理に進み、0でない場合にはS104の処理に進む。
【0106】
ステップ104(S104)において、ホストコンピュータ20は、第i番目のピクチャーの種類(ピクチャータイプ)を判断し、第i番目のピクチャーがBピクチャー、Pピクチャー、Iピクチャーである場合には、それぞれS106,S120,S128の処理に進む。
ステップ106(S106)において、ホストコンピュータ20は、データI_Flagの値が0であるか否かを判断する。データI_Flagの値が0である場合にはS110の処理に進み、0でない場合にはS108の処理に進む。
ステップ108(S108)において、ホストコンピュータ20は、Bピクチャーの実難度データDi が予測難度データD’i ×Bthより大きいか否かを判断し、大きい場合にはS112の処理に進み、小さい場合にはS110の処理に進む。
【0107】
ステップ110(S110)において、ホストコンピュータ20は、シーンチェンジが発生しない場合と同じ処理を行って、予測難度データD’i を算出する。
ステップ112(S112)において、ホストコンピュータ20は、データSC_Flagの値を1にする。
ステップ114(S114)において、ホストコンピュータ20は、第i番目のピクチャーが、シーンチェンジ後の1枚目のBピクチャーである場合には、式8により総和値Sumi を算出し、シーンチェンジ後の2枚目のBピクチャーである場合には、式9により総和値Sumi を算出する。
【0108】
ステップ116(S116)において、ホストコンピュータ20は、予測した総和値Sumi または予測難度データD’i を式4に代入して、第i番目のピクチャーに対する目標データ量Ti (target bit) を算出する。
ステップ118(S118)において、ホストコンピュータ20は、データiをインクリメントする。
【0109】
ステップ120(S120)において、ホストコンピュータ20は、Pピクチャーの実難度データDi が予測難度データD’i ×Pthより大きいか否かを判断し、大きい場合にはS122の処理に進み、小さい場合にはS110の処理に進む。
ステップ122(S122)において、ホストコンピュータ20は、データSC_Flagにデータiを代入する。
ステップ124(S124)において、ホストコンピュータ20は、データI_Flagの値を0にする。
ステップ126(S126)において、ホストコンピュータ20は、式7を用いて、総和値Sumi を予測する。
【0110】
ステップ128(S220)において、ホストコンピュータ20は、Iピクチャーの実難度データDi が予測難度データD’i ×Ith1〜予測難度データD’i ×Ith2の範囲外か否かを判断し、範囲外の場合にはS130の処理に進み、範囲内の場合にはS110の処理に進む。
ステップ130(S130)において、ホストコンピュータ20は、データSC_Flagにデータiを代入する。
ステップ132(S132)において、ホストコンピュータ20は、データI_Flagの値を1にして、S126の処理に進む。
【0111】
図12に示すように、ステップ200(S200)において、ホストコンピュータ20は、データiからデータSC_Flagを減算した値が1,2,3〜9,9以上である場合にそれぞれ、S202,S204,S206,S210の処理に進む。
ステップ202(S202)において、ホストコンピュータ20は、式8により総和値Sumi を予測し、S116(図11)の処理に進む。
ステップ204(S204)において、ホストコンピュータ20は、式9により総和値Sumi を予測し、S116(図11)の処理に進む。
【0112】
ステップ206(S206)において、ホストコンピュータ20は、式9の於ける予め求めた比率(i:p:b)を、算出した実難度データに置換する。
ステップ208(S208)において、ホストコンピュータ20は、比率(i:p:b)を、算出した実難度データに置換した式9を用いて、総和値Sumi を予測する。
【0113】
ステップ210(S210)において、ホストコンピュータ20は、ピクチャー(i−SC_Flag)枚分の実難度データを用いて、直線近似を行い、総和値Sumi (予測難度データD’i )を算出する。
ステップ212(S212)において、ホストコンピュータ20は、(i−SC_Flag)=15であるか否かを判断する。(i−SC_Flag)=15である場合にはS214の処理に進み、(i−SC_Flag)=15でない場合にはS110(図11)の処理に進む。
【0114】
ホストコンピュータ20は、以上説明した処理により生成した目標データ量Tj を、エンコーダ18の量子化制御回路180に設定する。
エンコーダ18は、第1の実施形態および第2の実施形態においてと同様に、ホストコンピュータ20から設定された目標データ量Tj に基づいて、図8(C)に示すように、後ろのシーンの最初のPピクチャーが、前のシーンの最後のピクチャーを参照しないように、Iピクチャーに変更し、前のシーンの最後のIピクチャーをPピクチャーに変更して圧縮符号化し、圧縮映像データVOUTとして出力する。
【0115】
以上、第3の実施形態に示した改良予測簡易2パスエンコード方式によれば、シーンチェンジやカメラフラッシュ等を含む映像データにより多くのデータ量を割り当てて圧縮符号化可能である上に、シーンチェンジやカメラフラッシュの前後に発生する符号化歪みを顕著に低減することができる。従って、第3の実施形態に示した改良予測簡易2パスエンコード方式によって生成した圧縮映像データを伸長復号して得られる映像の品質を向上させることができる。
【0116】
なお、第3の実施形態においては、N=15,M=3のピクチャーシーケンスに対する処理に適合する式7〜式9を例示したが、式7〜式9を適切に変更する(式7〜式9中の係数4,10をピクチャーシーケンスに合わせて変更する)ことにより、他のピクチャーシーケンスに対しても、改良予測簡易2パスエンコードを適用することができる。
【0117】
第4実施形態
以下、本発明の第4の実施形態として、第3の実施形態に示した改良予測簡易2パスエンコード方式のシーンチェンジ検出方法の変形例を説明する。
まず、本発明の第4の実施形態におけるシーンチェンジ検出方法の原理を説明する。
【0118】
映像データ圧縮装置1(図1)が、シーンチェンジ付近の編集映像データから、第2の実施形態および第3の実施形態にそれぞれ示した予測簡易2パスエンコード方式および改良予測簡易2パスエンコード方式において、映像データのピクチャー間の時間的相関性を用いて生成される予測難度データDj ’は、実難度データDj-1 以前の映像データの難度の変化の傾向をよく反映しており、その実難度データDj との誤差は、シーンチェンジがないかぎり非常に少なくなる。例えば、図10に示した場合においては、予測難度データD16’は、15個の実難度データD1 〜D15に基づいて、これらの1つ先のピクチャーの難度を予測した値であり、シーンチェンジがない場合には、精度が非常に高いと期待できる。
【0119】
図13は、シーンチェンジがPピクチャーで生じた場合に、その前後における実難度データDj (○印)と予測難度データD’j (×印)との関係を、圧縮符号化の順に例示する図である。
一方、図13に示すように、シーンチェンジがPピクチャーで生じた場合、シーンチェンジ直後のPピクチャーの実難度データDj は、多くの場合、前方のピクチャーを参照した圧縮符号化ができなくなるために、予測難度データDj ’よりも大幅に大きな値となる。
【0120】
逆に、シーンチェンジ部分のPピクチャーの実難度データDj は、例えば、シーンチェンジ前の絵柄に比べて、シーンチェンジ後の絵柄が平坦である場合等には、予測難度データDj ’よりも大幅に小さな値となる場合もある。
また、シーンチェンジ直後のBピクチャーの実難度データDj の値は、後方のピクチャーのみを参照して圧縮符号化されるために、予測難度データDj ’に比べて大幅に、例えばPピクチャー並みに大きくなる。
【0121】
図14は、シーンチェンジがIピクチャーで生じた場合に、その前後における実難度データDj (○印)と予測難度データD’j (×印)との関係を、圧縮符号化の順に例示する図である。
また、図14に示すように、シーンチェンジが、第j(16)番目のIピクチャーで生じた場合、シーンチェンジ前後のIピクチャーには時間的相関関係がないので、シーンチェンジ直後のIピクチャーの予測難度データDj ’と実難度データDj との間に誤差が生じる。
【0122】
しかしながら、Iピクチャーは、元々、他のピクチャーを参照せずに圧縮符号化されるので、Pピクチャーでシーンチェンジが生じた場合に比べて、予測難度データDj ’と実難度データDj との差は少ない。
一方、シーンチェンジ直後のBピクチャーの実難度データDj の値は、Pフレームでシーンチェンジが生じた場合と同様に、予測難度データDj ’に比べて大幅に大きくなる。
【0123】
このように、PピクチャーおよびIピクチャーの予測難度データDj ’と難度データDj の値に大きな誤差が生じない場合であっても、Bピクチャー自体の予測難度データDj ’と難度データDj の値に大きな誤差が生じた場合には、その直前のIピクチャーまたはPピクチャーでシーンチェンジが生じたと判断することができる。
【0124】
第4の実施形態に示すシーンチェンジ検出方法は、以上説明した実難度データDj と予測難度データDj ’との関係を利用しており、第3の実施形態にそれぞれ示した改良簡易2パスエンコード方式において、より正確にシーンチェンジの検出を可能とする。つまり、第4の実施形態に示すシーンチェンジ検出方法は、第3の実施形態に示した映像データ圧縮装置1を用いた改良予測簡易2パスエンコード方式において、予測難度データDj ’と実難度データDj との値を比較してシーンチェンジを正確に検出するようになっている。
【0125】
具体的には、第4の実施形態におけるシーンチェンジの検出は、Iピクチャーの実難度データDjIに対する予測難度データDjI’の比の値(DjI/DjI’)、および、Pピクチャーの実難度データDjpに対する予測難度データDjp’の比の値(Djp/Djp’)が、所定の閾値の範囲外にある場合〔ThI1<(Dj /Dj ’)または(DjP/DjP’)<ThI2,Thp1<(DjP/DjP’)または(Dj /Dj ’)<Thp2。ただし、ThI1>1>ThI2>0,Thp1>1>Thp2>0〕には、シーンチェンジの発生をそのピクチャーで検出する。但し、通常、PピクチャーのPピクチャーの実難度データDjpに対する予測難度データDjp’の比の値(Djp/Djp’)が、加減値ThP2以下になることは殆どない。
【0126】
また、第4の実施形態におけるシーンチェンジ検出方法は、IピクチャーおよびPピクチャーの実難度データDjI,DjPに対する予測難度データDjI’,DjP’の比の値が、上記所定の閾値の範囲内である場合であっても、Bピクチャーの実難度データDjBに対する予測難度データDjB’の比の値(DjB/DjB’)が、所定の範囲外にある場合に〔ThB <(DjB/DjB’)。但し、ThB >1〕、シーンチェンジの発生を、そのBピクチャーの直前のIピクチャーまたはPピクチャーでシーンチェンジが生じたと検出する。
【0127】
次に、第4の実施形態における映像データ圧縮装置1(図1)の動作を説明する。
エンコーダ制御部12は、第1の実施形態〜第3の実施形態においてと同様に、非圧縮映像データのピクチャーを、例えば、図8(A)に示した順番から図8(B)に示した順番に入れ替える。
FIFOメモリ160は、第1の実施形態〜第3の実施形態においてと同様に、例えば、入力される編集映像データを15ピクチャー分、遅延する。
エンコーダ162は、第1の実施形態〜第3の実施形態においてと同様に、シーンチェンジの有無にかかわらず、映像データS12を圧縮符号化し、実難度データDj を生成する。
【0128】
ホストコンピュータ20は、エンコーダ162から入力される実難度データDj と予測難度データDj ’とを比較し、第4の実施形態において上述したように、PピクチャーおよびIピクチャーの予測難度データDj ’の実難度データDj に対する比の値、および、Bピクチャーの予測難度データDj ’の実難度データDj に対する比の値が、上記所定の範囲外となる位置でシーンチェンジが発生したことを検出する。
【0129】
シーンチェンジを検出した場合、ホストコンピュータ20はさらに、第3の実施形態においてと同様に、後ろのシーンの最初のPピクチャーを前のシーンの最後のピクチャーを参照しないIピクチャーに変更し(図8(C))、前のシーンの最後のIピクチャーをPピクチャーに変更するように、ピクチャータイプシーケンスを変更させる。
【0130】
ホストコンピュータ20は、第3の実施形態においてと同様に、編集映像データにシーンチェンジが発生しない場合には、エンコーダ162から得られたデータから実難度データDj を生成し、予測難度データD’16〜D’30をピクチャータイプごとに算出する。
また、ホストコンピュータ20は、シーンチェンジが発生した場合には、シーンチェンジ前後でピクチャーの相関性がなくなるので、第3の実施形態においと同様に、シーンチェンジ直後の所定数枚のピクチャーの実難度データDj から、式6により、総和値Sumj (式5)を算出し、算出した総和値Sumj に基づいて、目標データ量Tj を算出する。
エンコーダ12は、圧縮符号化後のデータ量が、ホストコンピュータ20が生成した目標データ量Tj が示す値に近くなるように遅延された非圧縮映像データS16を圧縮符号化し、圧縮映像データVOUTとして出力する。
【0131】
以下、フローチャートを参照して、第4の実施形態に示した映像データ圧縮装置1のホストコンピュータ20によるシーンチェンジ検出処理の内容をさらに説明する。
図15は、第4の実施形態における映像データ圧縮装置1(図1)のホストコンピュータ20によるシーンチェンジ検出処理の内容を示すフローチャート図である。
【0132】
図15に示すように、ステップ300(S300)において、ホストコンピュータ20は、第j番目の実難度データDj を算出する。
ステップ302(S302)において、ホストコンピュータ20は、第j番目のピクチャーがあるか否かを判断する。第j番目のピクチャーがある場合には、S304の処理に進み、ない場合には処理を終了する。
ステップ304(S304)において、ホストコンピュータ20は、第j番目のピクチャーのピクチャータイプを判断する。第j番目のピクチャーのピクチャータイプがBピクチャー、IピクチャーまたはPピクチャーである場合、それぞれ、S306,S316,S320の処理に進む。
【0133】
ステップ306(S306)において、ホストコンピュータ20は、数値B_countをインクリメントする。
ステップ308(S308)において、ホストコンピュータ20は、数値B_countの値が1であるか否かを判断する。数値B_countの値が1である場合には、S312の処理に進み、数値B_countの値が1でない場合には、S310の処理に進む。
【0134】
ステップ310(S310)において、ホストコンピュータ20は、シーンチェンジが発生しなかったと判断する。
ステップ312(S312)において、ホストコンピュータ20は、Bピクチャーから生成した予測難度データDj ’と実難度データDj との比の値を算出し、Dj >ThB ×Dj ’(DjB/DjB’>ThB )であるか否かを判断する。Dj >ThB ×Dj ’である場合、S310の処理に進み、Dj >ThB ×Dj ’でない場合、S314の処理に進む。
ステップ314(S314)において、ホストコンピュータ20は、直前のIピクチャーまたはPピクチャー〔第(j−1)番目のピクチャー〕でシーンチェンジが発生したと判定する。
【0135】
ステップ316(S316)において、ホストコンピュータ20は、数値B_countの値をゼロクリアする。
ステップ318(S318)において、ホストコンピュータ20は、Pピクチャーから生成した予測難度データDj ’と実難度データDj との比の値を算出し、Dj >ThP1×Dj ’またはDj <ThP2×Dj ’であるか否かを判断する。Dj >ThP1×Dj ’またはDj <ThP2×Dj ’である場合、S324の処理に進み、Dj >ThP1×Dj ’またはDj <ThP2×Dj ’でない場合、S310の処理に進む。
【0136】
ステップ320(S320)において、ホストコンピュータ20は、ホストコンピュータ20は、数値B_countの値をゼロクリアする。
ステップ322(S322)において、ホストコンピュータ20は、Iピクチャーから生成した予測難度データDj ’と実難度データDj との比の値を算出し、Dj >ThI1×Dj ’またはDj <ThI2×Dj ’であるか否かを判断する。Dj >ThI1×Dj ’またはDj <ThI2×Dj ’である場合、S324の処理に進み、Dj >ThI1×Dj ’またはDj <ThI2×Dj ’でない場合、S310の処理に進む。
【0137】
ステップ324(S324)において、ホストコンピュータ20は、第j番目のピクチャーでシーンチェンジが発生したとを判断する。
ステップ326(S326)において、ホストコンピュータ20は、実難度データDj までを用いて、次の予測難度データDj+1 を算出する。
ステップ328(S328)において、ホストコンピュータ20は、数値jをインクリメントする。
【0138】
なお、第4の実施形態においては、予測難度データDj ’の予測方法として、第3の実施形態に示した直線近似を用いたが、予測難度データDj ’の予測方法は、これに限らず、例えば、実難度データDj の差分値に基づいて、実難度データDj の変化を予測することにより予測難度データDj ’を算出する方法を採ってもよい。
また、第4の実施形態においては、シーンチェンジを検出する際に、Bピクチャーの前のピクチャーがIピクチャーであろうとPピクチャーであろうと、同じBピクチャーの予測難度データDj ’と実難度データDj との比較の際に、同じ閾値ThB を用いたが、前のピクチャーのピクチャータイプに応じて、閾値を変更してもよい。
【0139】
以上第4の実施形態において説明したシーンチェンジの検出方法によれば、第3の実施形態に示した実難度データDj の経時的な変化の監視によっては、検出しにくかったIピクチャーでのシーンチェンジ、あるいは、シーンチェンジの前の絵柄が難しく、シーンチェンジ後の絵柄が優しい場合のPピクチャーでのシーンチェンジを、確実に検出することができる。従って、第3の実施形態に示したシーンチェンジの検出方法を採用する場合に比べて、圧縮符号化後の映像データの品質を向上させることができる。
【0140】
第5実施形態
以下、本発明の第5の実施形態を説明する。
第1の実施形態に示した簡易2パスエンコード方式、および、第2の実施形態に示した予測簡易2パスエンコード方式は、入力される非圧縮映像データに、ほぼ1GOP分(例えば、0.5秒)程度の遅延を与えるだけで圧縮符号化し、適切なデータ量の圧縮映像データを生成することができる優れた方式である。
【0141】
しかしながら、これらの方式は、エンコーダーを2つ必要とする。一般に、映像データを圧縮符号化するエンコーダーは大規模のハードウェアを必要とし、集積回路化しても非常に高価であり、しかも、サイズが大きい。従って、これらの方式がエンコーダーを2つ必要とすることは、これらの方式を実現する装置の低コスト化、小型化および省電力化を妨げる。また、圧縮符号化に要する時間遅延は、短ければ短いほど望ましいが、実難度データDj および予測難度データDj ’の算出処理および予備的な圧縮符号化処理そのものが数ピクチャー分の処理時間を要するので、これらの処理自体が、時間遅延の短縮化を妨げる原因となる。
【0142】
第5の実施形態は、かかる問題点を解決するためになされたものであって、1つのエンコーダを用いるのみで、簡易2パスエンコード方式および予測簡易2パスエンコード方式と同等に適切なデータ量の圧縮映像データを生成することができ、しかも、処理に要する時間遅延がより短い映像データ圧縮方式を提供することを目的とする。
【0143】
図16は、第5の実施形態における本発明に係る映像データ圧縮装置2の構成の概要を示す図である。
図17は、図16に示した映像データ圧縮装置2の圧縮符号化部24の詳細な構成を示す図である。
なお、図16および図17において、映像データ圧縮装置2の構成部分のうち、第1の実施形態および第2の実施形態において説明した映像データ圧縮装置1(図1,図2)の構成部分と同一のものには同一の符号を付して示してある。
【0144】
図16に示すように、映像データ圧縮装置2は、映像データ圧縮装置1(図1,図2)の圧縮符号化部10を、圧縮符号化部10からエンコーダ162を除いた圧縮符号化部24で置換し、エンコーダ制御部12をエンコーダ制御部22で置換し、バッファメモリ(buffer)182を付加した構成を採る。
図17に示すように、圧縮符号化部24は、映像並び替え回路220、走査変換・マクロブロック化回路222および統計量算出回路224から構成され、圧縮符号化部24の他の構成部分は、圧縮符号化部10と同一の構成を採る。
【0145】
エンコーダ制御部22は、エンコーダ制御部12と同様に、非圧縮映像データVINのピクチャーの有無をホストコンピュータ20に通知し、さらに、非圧縮映像データVINのピクチャーごとに圧縮符号化のための前処理を行う。
エンコーダ制御部22において、映像並び替え回路220は、入力された非圧縮映像データを符号化順に並べ替える。
【0146】
走査変換・マクロブロック化回路222は、ピクチャー・フィールド変換を行い、非圧縮映像データVINが映画の映像データである場合に3:2プルダウン処理等を行う。
統計量算出回路224は、映像並び替え回路220および走査変換・マクロブロック化回路222により処理され、Iピクチャーに圧縮符号化されるピクチャーからフラットネス(flatness)およびイントラAC(intra AC)等の統計量を算出する。
【0147】
映像データ圧縮装置2は、これらの構成部分により、非圧縮映像データの統計量(フラットネス,イントラAC)および動き予測の予測誤差量(ME残差)を非圧縮映像データVINの絵柄の難度の代わりに用いて、映像データ圧縮装置1(図1,図2)と同様に適応的に目標データ量Tj を算出して、高精度なフィードフォワード制御を行うことにより、非圧縮映像データVINを適切なデータ量の圧縮映像データに圧縮符号化する。
なお、映像データ圧縮装置2においては、動き検出器14およびエンコーダ制御部22の統計量算出回路224により、予め検出された指標データに基づいて目標データ量Tj が定めるられることから、以下、映像データ圧縮装置2における圧縮符号化方式を、フィード・フォワード・レート・コントロール(FFRC; feed foward rate control)方式と呼ぶことにする。
【0148】
なお、ME残差は、圧縮されるピクチャーと、参照ピクチャーの映像データとの差分値の絶対値和あるいは自乗値和として定義され、動き検出器14により、圧縮後にPピクチャーおよびBピクチャーとなるピクチャーから算出され、映像の動きの速さおよび絵柄の複雑さを表し、フラットネスと同様に、難度および圧縮後のデータ量と相関性を有する。
【0149】
Iピクチャーについては、他のピクチャーの参照なしに圧縮符号化されるため、ME残差を求めることができず、ME残差に代わるパラメータとして、フラットネスおよびイントラACを用いる。
また、フラットネスは、映像データ圧縮装置2を実現するために、映像の空間的な平坦さを表す指標として新たに定義されたパラメータであって、映像の複雑さを指標し、映像の絵柄の難しさ(難度)および圧縮後のデータ量と相関性を有する。
また、イントラACは、映像データ圧縮装置2を実現するために、MPEG方式におけるDCT処理単位のDCTブロックごとの映像データとの分散値の総和として新たに定義したパラメータであって、フラットネスと同様に、映像の複雑さを指標し、映像の絵柄の難しさおよび圧縮後のデータ量と相関性を有する。
【0150】
以下、ME残差、フラットネスおよびイントラACについて説明する。
第1の実施形態および第2の実施形態において説明した簡易2パスエンコード方式および予測簡易2パスエンコード方式において、実難度データDj は映像の絵柄の難しさを示し、目標データ量Tj は実難度データDj に基づいて算出される。
【0151】
また、エンコーダ18が生成する圧縮映像データのデータ量を、目標データ量Tj が示す値に近づけるために、量子化回路168(図2,図17)において量子化値Qj の制御が行われる。従って、映像データを圧縮符号化せずに得られ、実難度データDj と同様に映像データの絵柄の複雑さ(難しさ)を適切に示すパラメータを、エンコーダ18の量子化回路168における量子化処理以前に得ることができれば、エンコーダ162(図1)を省略し、処理遅延時間の短縮するという目的を達成することができる。ME残差、フラットネスおよびイントラACは、実難度データDj と強い相関を有するので、このような目的を達成するために適切である。
【0152】
ME残差と実難度データD j との関係
他のピクチャーを参照して圧縮符号化処理し、PピクチャーおよびBピクチャーを生成する際には、動き検出器14は、圧縮対象となるピクチャー(入力ピクチャー)と参照されるピクチャー(参照ピクチャー)との間の差分値の絶対値和あるいは自乗値和が最小となるように動きベクトルを求める。ME残差は、動きベクトルを求める際の2つのピクチャー間の誤差成分の電力パワーとして定義される。
【0153】
図18は、映像データ圧縮装置1,2により、Pピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
図19は、映像データ圧縮装置1,2により、Bピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
なお、図18および図19は、CCIRにより規格化された標準画像[cheer (cheer leaders), mobile (mobile and calender), tennis (table tennis), diva(diva with noise)] およびその他の画像(resort)を実際にMPEG2方式により圧縮符号化した場合に得られるME残差と実難度データDj との関係を示すグラフであり、図18および図19において、グラフの縦軸(difficulty)が実難度データDj を示し、横軸(me resid)がME残差を示す。
図18および図19を参照して分かるように、ME残差は実難度データDj と非常に強い相関関係を有する。従って、圧縮後にPピクチャーまたはBピクチャーとなるピクチャーの実難度データDj の代わりに、ME残差は、目標データ量Tj の生成に用いられ得る。
【0154】
フラットネスと実難度データD j との関係
図20は、フラットネスの計算方法を示す図である。
フラットネスは、まず、図20に示すように、MPEG方式においてDCT処理の単位となるDCTブロックそれぞれを、2画素×2画素の小ブロックに分割し、次に、これらの小ブロック内の対角の画素のデータ(画素値)の差分値を算出し、差分値を所定の閾値と比較し、さらに、差分値が閾値よりも小さくなる小ブロック総数をピクチャーごとに求めることにより算出される。
なお、フラットネスの値は、映像の絵柄が空間的に複雑であるほど小さくなり、平坦であれば大きくなる。
【0155】
図21は、映像データ圧縮装置1,2により、Iピクチャーを生成する際のフラットネスと実難度データDj との相関関係を示す図である。
なお、図21は、図18および図19と同様に、CCIRにより規格化された標準画像およびその他の画像を実際にMPEG2方式により圧縮符号化した場合に得られるフラットネスと実難度データDj との関係を示すグラフであり、図21において、グラフの縦軸(difficulty)が実難度データDj を示し、横軸(flatness)がフラットネスを示す。
図21に示すように、フラットネスと実難度データDj には、強い負の相関関係があり、実難度データDj は、フラットネスを一次関数に代入する等の方法により近似可能であることがわかる。
【0156】
イントラACと実難度データD j との関係
イントラACは、DCTブロックごとに、DCTブロック内の画素それぞれの画素値と、DCTブロック内の画素値の平均値との差分の絶対値の総和として算出される。つまり、イントラACは、下の式10により求めることができる。
【0157】
【数10】
Figure 0003864461
【0158】
図22は、映像データ圧縮装置1,2により、Iピクチャーを生成する際のイントラACと実難度データDj との相関関係を示す図である。
なお、図22は、図18および図19と同様に、CCIRにより規格化された標準画像およびその他の画像を実際にMPEG2方式により圧縮符号化した場合に得られるイントラACと実難度データDj との関係を示すグラフであり、図22において、グラフの縦軸(difficulty)が実難度データDj を示し、横軸(intra AC)がイントラACを示す。
図22に示すように、イントラACと実難度データDj との間には強い正の相関関係があり、実難度データDj は、イントラACを一次関数に代入する等の方法により近似可能であることがわかる。
【0159】
Pピクチャーについては下に示す式11により、Bピクチャーについては下に示す式12により、実難度データDj はME残差により近似される。また、Iピクチャーについては、式11および式12と同様の近似式により実難度データDj は、フラットネスおよびイントラACまたはこれらのいずかにより近似される。
【0160】
【数11】
Figure 0003864461
【0161】
【数12】
Figure 0003864461
【0162】
さらに、第1の実施形態に示した簡易2パスエンコード方式においては、これらの近似により得られた実難度データDj を、式1または式4に代入することにより目標データ量Tj が算出される。
あるいは、第2の実施形態に示した予測簡易2パスエンコード方式においては、これらの近似により得られた実難度データDj から予測難度データDj ’が算出され、実難度データDj および予測難度データDj ’を式4に代入することにより目標データ量Tj が算出される。
【0163】
以下、実難度データDj をME残差、フラットネスおよびイントラACで近似し、簡易2パスエンコード方式により非圧縮映像データを圧縮符号化する場合を例に、映像データ圧縮装置2の動作を説明する。
エンコーダ制御部22において、映像並び替え回路220は、非圧縮映像データVINを符号化順にピクチャーを並べ替え、走査変換・マクロブロック化回路222は、ピクチャー・フィールド変換等を行い、統計量算出回路224は、Iピクチャーに圧縮符号化されるピクチャーに対して、図20および式10に示した演算処理を行い、フラットネスおよびイントラAC等の統計量を算出する。
【0164】
動き検出器14は、PピクチャーおよびBピクチャーに圧縮符号化されるピクチャーについて動きベクトルを生成し、さらに、ME残差を算出する。
FIFOメモリ160は、入力された映像データをLピクチャー分だけ遅延する。
【0165】
ホストコンピュータ20は、動き検出器14が生成したME残差に対して式11および式12に示した演算処理を行って実難度データDj を近似し、式11および式12と同様な演算処理を行って、フラットネスおよびイントラACにより実難度データDj を近似する。
さらに、ホストコンピュータ20は、近似した実難度データDj を式1または式4に代入し、目標データ量Tj を算出し、算出した目標データ量Tj をエンコーダ18の量子化制御回路180に設定する。
【0166】
エンコーダ18のDCT回路166は、遅延した映像データの第j番目のピクチャーをDCT処理する。
量子化回路168は、DCT回路166から入力された第j番目のピクチャーの周波数領域のデータを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化する。
可変長符号化回路170は、量子化回路168から入力された第j番目のピクチャーの量子化データを可変長符号化して、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成して、バッファメモリ182を介して外部に出力する。
【0167】
なお、MPEGのTM5方式等においては、マクロブロックの量子化値(MQUANT)を算出するために、下の式13に示すアクティビティ(activity)という統計量が用いられる。アクティビティは、フラットネスおよびイントラACと同様に、実難度データDj と強い相関関係を有するので、これらパラメータの代わりにアクティビティを用いて、実難度データDj を近似し、圧縮符号化を行うように映像データ圧縮装置2を構成してもよい。
【0168】
【数13】
Figure 0003864461
【0169】
また、以上、第1の実施形態に示した簡易2パスエンコードを行う場合を例に、映像データ圧縮装置2の動作を説明したが、映像データ圧縮装置2は、予測簡易2パスエンコードを行いうることはいうまでもない。
また、第5の実施形態に示した映像データ圧縮装置2に対しても、第1の実施形態および第2の実施形態に示した映像データ圧縮装置1に対してと同様の変形が可能である。
【0170】
第6実施形態
以下、本発明の第6の実施形態を説明する。
第5の実施形態に示したFFRC方式においては、統計的に求められた指標データ(統計量)、つまり、ME残差、フラットネス、イントラACおよびアクティビティを、式11および式12等の一次関数に代入して実難度データDj を近似する。
これらの指標データと難度データDj とは、図18、図19、図21および図22に示したように、強い相関関係を有するが、映像データの絵柄によっては、上記一次関数から若干の誤差が生じる。
【0171】
第6の実施形態における映像データ圧縮装置2の処理は、かかる問題点を解決するためになされたものであり、映像データの絵柄等に応じて、式11および式12等に示した重み付け係数ap ,aB 等を、適応的に刻一刻と調節して、第5の実施形態においてより高い精度で実難度データDj を指標データで近似することができ、より高い品質の圧縮映像データを生成することができるように改良されている。
【0172】
以下、第6の実施形態における映像データ圧縮装置2の処理の概要を説明する。
映像データ圧縮装置2(図16)のエンコーダ18が、1ピクチャー分の圧縮符号化を終了するたびに、ホストコンピュータ20には、生成した圧縮映像データの1ピクチャー分のデータ量が判明し、さらに、圧縮符号化時の量子化値Qj の平均値、および、以下に説明するグローバルコンプレクシティ(GC; global complexity) を算出することができる。
グローバルコンプレクシティは、MPEGのTM5において、圧縮映像データのデータ量と量子化値Qj とを乗算した値として、下の式14−1〜式14−3に示すように定義され、映像の絵柄の複雑さを示す。
【0173】
【数14】
Figure 0003864461
【0174】
なお、式14−1〜式14−3において、SI ,SB ,Sp は、それぞれIピクチャー、BピクチャーおよびPピクチャーのデータ量を示し、QI ,QB ,Qp は、それぞれIピクチャー、BピクチャーおよびPピクチャーを生成する際の量子化値Qj の平均値を示し、XI ,XB ,Xp は、それぞれIピクチャー、BピクチャーおよびPピクチャーのグローバルコンプレクシティを示す。
式14−1〜式14−3に示したグローバルコンプレクシティは、実難度データDj とは必ずしも一致しないが、量子化値Qj の平均値が極端に大きかったり小さかったりしない限り、実難度データDj とほぼ一致する。
【0175】
ここで、Iピクチャー、PピクチャーおよびBピクチャーの指標データ、例えばイントラAC(他のパラメータでも可)およびME残差と、グローバルコンプレクシティとが比例関係にあるとすると、これらの指標データとグローバルコンプレクシティとの比例係数εI ,εP ,εB は、下の式15−1〜式15−3により算出できる。
【0176】
【数15】
Figure 0003864461
【0177】
各ピクチャータイプの実難度データDj は、式15−1〜式15−3により算出した比例係数εI ,εP ,εB を用いて、下の式16−1〜式16−3に示すように近似され、算出される。
【0178】
【数16】
Figure 0003864461
【0179】
ホストコンピュータ20が、式15−1〜式15−3に示したように、比例係数εI ,εP ,εB を、エンコーダ18がピクチャーを1枚圧縮符号化するたびに算出して最適化し、式16−1〜式16−3により各ピクチャータイプの実難度データDj の値を求めることにより、映像データの絵柄に関わらず、指標データにより実難度データDj を、常に最適に近似することができる。
【0180】
ホストコンピュータ20は、式15−1〜式15−3および式16−1〜式16−3に示したように近似された実難度データDj に対して、式1または式4に示した演算処理を行って目標データ量Tj を算出する。
なお、MPEGのTM5におけるように、実難度データDj に基づいて定める値に対して、意図的に、実際に算出する目標データ量Tj の値を一定の比率で変更する場合には、下の式17−1〜式17−3により、目標データ量Tj を算出することができる。
【0181】
【数17】
Figure 0003864461
【0182】
なお、式17−1〜式17−3全ての分母において、DI,P,B は、エンコーダ18に入力される前のFIFOメモリ160にバッファリングされているLピクチャー分の非圧縮映像データから生成された指標データにより近似された実難度データDj を示し、Rj は、第j番目のピクチャー以降のL枚のピクチャーに割り当てることができるデータ量の平均値を示す。
【0183】
以下、図23を参照して、第6の実施形態における映像データ圧縮装置2の処理内容を説明する。
図23は、第6の実施形態における映像データ圧縮装置2(図16,図17)の圧縮符号化処理の内容を、ピクチャーの符号化順に示す図である。
エンコーダ制御部22は、第5の実施形態においてと同様に、非圧縮映像データVINを符号化順にピクチャーを並べ替え、ピクチャー・フィールド変換等を行い、Iピクチャーに圧縮符号化される第(j+L)番目のピクチャーからフラットネスおよびイントラAC等の統計量を算出する(図23a)。
【0184】
動き検出器14は、第1の実施形態〜第5の実施形態においてと同様に、PピクチャーおよびBピクチャーに圧縮符号化される第(j+L)番目のピクチャーについて動きベクトルを生成し、さらに、ME残差を算出する(図23a)。
FIFOメモリ160は、第1の実施形態〜第5の実施形態においてと同様に、入力された映像データをLピクチャー分だけ遅延する。
ホストコンピュータ20は、動き検出器14が生成したME残差に対して式16−1および式16−2に示した演算処理を行って実難度データDj を近似し、式16−3に示した演算処理を行って、イントラAC等により実難度データDj を近似する(図23b)。
さらに、ホストコンピュータ20は、近似した実難度データDj を式1あるいは式17−1〜式17−3に代入し、目標データ量Tj を算出して、エンコーダ18の量子化制御回路180に設定する(図23c)。
【0185】
エンコーダ18のDCT回路166は、第1の実施形態〜第5の実施形態においてと同様に、遅延した映像データの第j番目のピクチャーをDCT処理する。
量子化回路168は、DCT回路166から入力された第j番目のピクチャーの周波数領域のデータを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化するとともに、第j番目のピクチャーの圧縮符号化に用いた量子化値Qj の平均値を算出し、ホストコンピュータ20に対して出力する。
可変長符号化回路170は、第1の実施形態〜第5の実施形態においてと同様に、量子化回路168から入力された第j番目のピクチャーの量子化データを可変長符号化して、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成し、バッファメモリ182を介して出力する。
【0186】
エンコーダ18が、第j番目のピクチャーの圧縮符号化を終了すると、ホストコンピュータ20は、量子化制御回路180から入力される第j番目のピクチャーに対する量子化値Qj の平均値と、圧縮符号化された第j番目のピクチャーのデータ量とに基づいて、式14−1〜式14−3に示したようにグローバルコンプレクシティを算出する(図23d)。
さらに、ホストコンピュータ20は、算出したグローバルコンプレクシティにより、式15−1〜式15−3に示したように比例係数εI ,εP ,εB を更新する(図23e)。更新された比例係数εI ,εP ,εB は、次のピクチャーの圧縮符号化の際の変換式(式16−1〜式16−3)に反映される。
【0187】
図24を参照して、第6の実施形態におけるホストコンピュータ20の処理内容をさらに説明する。
図24は、第6の実施形態における映像データ圧縮装置2のホストコンピュータ20(図18)の処理内容を示すフローチャート図である。
図24に示すように、ステップ300(S300)において、ホストコンピュータ20は、第(j+L)番目のピクチャーのME残差あるいはイントラAC等の指標データ(統計量)をエンコーダ制御部22または動き検出器14から取り込む。
【0188】
ステップ302(S302)において、ホストコンピュータ20は、第(j+L)番目のピクチャーがいずれのピクチャータイプに圧縮符号化されるかを判断する。第(j+L)番目のピクチャーがIピクチャーに圧縮符号化される場合にはS304の処理に進み、Pピクチャーに圧縮符号化される場合にはS306の処理に進み、Bピクチャーに圧縮符号化される場合にはS308の処理に進む。
【0189】
ステップ304(S304)、ステップ306(S306)およびステップ308(S308)それぞれにおいて、ホストコンピュータ20は、式16−1〜式16−3により実難度データDj を近似する。
ステップ310(S310)において、ホストコンピュータ20は、近似した実難度データDj を用いて、式1あるいは式17−1〜式17−3により、目標データ量Tj を算出する。
ステップ312(S312)において、エンコーダ18は、第j番目のピクチャーを圧縮符号化する。
【0190】
ステップ314(S314)において、ホストコンピュータ20は、エンコーダ18が圧縮した第j番目のピクチャーのデータ量、および、量子化制御回路180が量子化回路168に設定する量子化値Qj の平均値から、グローバルコンプレクシティXI ,XB ,Xp 〔X(I,B,P)〕を算出する。
【0191】
ステップ316(S316)において、ホストコンピュータ20は、第j番目のピクチャーがいずれのピクチャータイプに圧縮符号化されたかを判断する。第j番目のピクチャーがIピクチャーに圧縮符号化された場合にはS318の処理に進み、Pピクチャーに圧縮符号化された場合にはS320の処理に進み、Bピクチャーに圧縮符号化された場合にはS320の処理に進む。
ステップ318(S318)、ステップ320(S320)およびステップ322(S322)それぞれにおいて、ホストコンピュータ20は、式15−1〜式15−3により比例係数εI ,εP ,εB を更新する。
ステップ324(S324)において、ホストコンピュータ20は、数値jをインクリメントする。
【0192】
なお、第5の実施形態においてと同様に、例えば、下の式18に示すように、実難度データDj と、比例係数εI ,εP ,εB と指標データとの乗算値との間にオフセット(δP )が存在する場合がある。このような場合には、下の式19に示すように、グローバルコンプレクシティXI ,XB ,Xp からオフセット値δI ,δB ,δP を減算した値を指標データで除算することにより、比例係数εI ,εP ,εB を算出することができる。
【0193】
【数18】
Figure 0003864461
【0194】
【数19】
Figure 0003864461
【0195】
また、第6の実施形態に示した映像データ圧縮装置2の動作についても、第5の実施形態等に示したものと同様な変形が可能である。
以上述べたように、第6の実施形態における映像データ圧縮装置2の動作によれば、第5の実施形態に示した映像データ圧縮装置2の動作と同じ効果を得られる他、第5の実施形態におけるよりもさらに正確な目標データ量Tj が算出でき、この結果、圧縮映像データの品質を向上させることができる。
【0196】
第7実施形態
以下、本発明の第7の実施形態を説明する。
MPEG方式等のTM5(test model 5)の処理の第1段階(ステップ1)においては、式14−1〜式14−3(第6の実施形態)に示したグローバルコンプレクシティXI ,Xp ,XB 〔X(I,P,B)〕を用いて、圧縮後のピクチャーそれぞれに割り当てる目標データ量Tj が算出される。
【0197】
グローバルコンプレクシティXI ,Xp ,XB から目標データ量Tj を求める際には、式17−1〜式17−3が用いられる。式17−1〜式17−3には、ピクチャーの種類(ピクチャータイプ)ごとに目標データ量Tj に異なった重み付けを行うために、Kp ,KB という係数が導入されている。式17−1〜式17−3を参照してわかるように、重み付け係数Kp ,KB の値をそれぞれ大きくすればするほど、Iピクチャーの目標データ量Tj と比較して、PピクチャおよびBピクチャーの目標データ量Tj が少なくなる。
【0198】
例えば、MPEG方式のTM5においては、重み付け係数Kp ,KB は固定値であり、それぞれ1.0,1.4(Kp =1.0,KB =1.4、デフォルト値)である。つまり、MPEG方式のTM5においては、Pピクチャーには、IピクチャーのグローバルコンプレクシティXI に対するPピクチャーのグローバルコンプレクシティXp の比率の通りの目標データ量Tj が与えられ、Bピクチャーには、IピクチャーのグローバルコンプレクシティXI に対するBピクチャーのグローバルコンプレクシティXB の比率よりも意図的に小さい目標データ量Tj が与えられる。
【0199】
多くの場合、固定の重み付け係数Kp ,KB を用いることにより、各ピクチャータイプに対して適切な値の目標データ量Tj が算出される。しかしながら、固定値の重み付け係数Kp ,KB は、圧縮語のデータレートの値、および、非圧縮映像データの絵柄によっては、最適な値でなくなる可能性がある。
【0200】
一方、「MPEG圧縮効率の理論解析とその符号量制御への応用」(甲藤,太田、信学技報 IE95-10, DSP95-10 (1995-04) p71〜p78 ;文献1)において、非圧縮映像データの動きの大きさ、絵柄の複雑さに応じて、重み付け係数Kp ,KB (式17−1〜式17−3;第6の実施形態)を最適化することにより、圧縮映像データの品質を改善することができる旨が報告されている。しかしながら、文献1には、圧縮映像データのデータレートおよび非圧縮映像データの動きに応じて重み付け係数Kp ,KB を変更する方法は開示されいない。
【0201】
また、実際には、圧縮映像データのデータレートを充分高い値にすることができる場合は、重み付け係数Kp ,KB の値にデフォルト値を用いて目標データ量Tj を求める場合に、圧縮映像データの品質が最良になる。一方、圧縮映像データのデータレートを充分高い値にすることができない場合は、重み付け係数Kp ,KB の値を非圧縮映像データの動きの大きさ、絵柄の複雑さに応じて、重み付け係数Kp ,KB を最適化して目標データ量Tj を求める方が、圧縮映像データの品質が向上する。
【0202】
具体的には、例えば、動きが大きくても絵柄が簡単な映像データを圧縮符号化する際には、重み付け係数Kp ,KB を変更するよりもデフォルト値とした方が圧縮映像データの品質が結果として向上する。また、動きが小さい映像データを圧縮符号化する場合は、Iピクチャーに多くのデータ量を割り当てるような重み付け係数Kp ,KB 、つまり、値が大きい重み付け係数Kp ,KB を用いると圧縮映像データの品質が向上する。逆に、動きが大きい映像データを圧縮符号化する場合は、PピクチャーおよびBピクチャーに多くのデータ量を割り当てるような重み付け係数Kp ,KB 、つまり、値が小さい重み付け係数Kp ,KB を用いると圧縮映像データの品質が向上する。
【0203】
第7の実施形態においては、映像データ圧縮装置1,2(図1〜図3,図16,図17)を改良し、これらと同様にFFRC方式により映像データを圧縮する装置であって、ピクチャータイプごとの目標データ量Tj を算出する際に用いられる重み付け係数Kp ,KB を、非圧縮映像データの動き・絵柄に応じて適応的に変更・調節し、圧縮映像データの品質を改善した映像データ圧縮装置3を説明する。
【0204】
図25は、第7の実施形態における本発明に係る映像データ圧縮装置3の構成を示す図である。
図26は、図25に示したエンコーダ26の構成を示す図である。
図25に示すように、映像データ圧縮装置3は、映像データ圧縮装置2(図16,図17)のエンコーダ18を、エンコーダ26で置換した構成を採る。
なお、図25および図26においては、映像データ圧縮装置3の構成部分の内、図1〜図3に示した映像データ圧縮装置1および図16,図17に示した映像データ圧縮装置2の構成部分と同一のものには同一の符号を付してある。
【0205】
また、図26に示すように、エンコーダ26は、量子化制御回路180の代わりに、グローバルコンプレクシティ算出回路(GC算出回路)262、目標データ量算出(Tj 算出)回路264および量子化インデックス生成回路266を含む量子化制御部260を有し、ホストコンピュータ20によらずに、実難度データDj またはグローバルコンプレクシティXI ,Xp ,XB に基づいて目標データ量Tj を算出可能に構成されている。
映像データ圧縮装置3は、これらの構成部分により、第5の実施形態および第6の実施形態において説明したFFRC方式により非圧縮映像データを圧縮符号化し、出力する。
【0206】
以下、量子化制御部260の各構成部分の動作を説明する。
GC算出回路262は、可変長符号化回路170から出力される圧縮映像データのデータ量SI ,Sp ,SB と、量子化回路168が量子化に用いた量子化値の平均値QI ,Qp ,QB とに基づいて、式14−1〜式14−3(第6実施形態)に示したように、各ピクチャータイプのグローバルコンプレクシティXI ,Xp ,XB を算出し、目標データ量算出回路264、量子化インデックス生成回路266、および、必要に応じてホストコンピュータ20に対して出力する。
【0207】
目標データ量算出回路264は、例えば、MPEG方式のTM5の第1段階(ステップ1)と同様に、GC算出回路262から入力されたグローバルコンプレクシティXI ,Xp ,XB により各ピクチャータイプの実難度データDj を近似し、式17−1〜式17−3(第6実施形態)に示したように、各ピクチャータイプのピクチャーそれぞれの目標データ量Tj を算出し、量子化インデックス生成回路266に対して出力する。
【0208】
具体例を挙げて上述したように、例えば、動きが大きくても絵柄が簡単な映像データを圧縮符号化する際には、重み付け係数Kp ,KB を変更するよりもデフォルト値とし、符号化難度が高い(実難度データDj の値が大きい)絵柄の映像データの内、動きが小さい部分を圧縮符号化する際には重み付け係数Kp ,KB の値を大きくし、逆に、動きが大きい映像データを圧縮符号化する際には、重み付け係数Kp ,KB の値を比較的、小さくすることが望ましい。
【0209】
式20、式21−1および式21−2を参照して、目標データ量算出回路264における重み付け係数Kp ,KB の更新処理の内容をさらに説明する。
重み付け係数Kp ,KB を、どの程度変更すべきかを判断するために、下に示す圧縮映像データVOUTのデータレートに対する実難度データDj の比率xというパラメータを導入する。
【0210】
【数20】
Figure 0003864461
【0211】
ただし、式20において、bitrate は、1秒間当たりの発生データ量(データレート)であり、Nは1GOP当たりのピクチャーの枚数であり、picture rateは1秒間あたりのピクチャーの枚数である。
【0212】
また、非圧縮映像データの動きの大小は、Iピクチャーの実難度データDI に対するPピクチャーの実難度データDP の比率(DI /Dp )、および、Iピクチャーの実難度データDI に対するBピクチャーの実難度データDB の比率(DI /DB )により判断することができる。
従って、目標データ量算出回路264は、例えば、最新のIピクチャーの実難度データDI とPピクチャーの実難度データDp との比率(DI /Dp )に比例するようにPピクチャーの重み付け係数Kp を算出し、最新のIピクチャーの実難度データDI とBピクチャーの実難度データDB との比率(DI /DB )に比例するようにBピクチャーの重み付け係数KB を算出する。
【0213】
図27は、目標データ量算出回路264(図26)が算出するPピクチャーおよびBピクチャーの重み付け係数Kp ,KB を示す図である。
しかしながら、非圧縮映像データの絵柄の複雑さおよび動きの大きさによっては、単純に重み付け係数Kp ,KB と比率(DI /Dp ,DI /DB )とを比例させた場合、重み付け係数Kp ,KB の値が極端に大きくなりすぎる場合および小さくなりすぎる場合がある。従って、比率x(式20)に所定の閾値δ1 ,δ2 ,δ3 (δ1 <δ2 ,δ3 )を設ける。
【0214】
比率xが閾値δ1 よりも小さい場合には、圧縮映像データVOUTのデータレートが充分に大きい、あるいは、非圧縮映像データの絵柄が単純または動きが小さいと判断できるので、重み付け係数Kp ,KB の値が小さくなりすぎないように(但し、割り当てられるデータ量は多くなりすぎる)、デフォルト値を用いる。一方、非圧縮映像データの絵柄が複雑であるにもかかわらず、動きがごく少ない場合には、Iピクチャーの実難度データDI の値は、PピクチャーおよびBピクチャーの実難度データDP ,DB に比べて非常に大きくなる。
【0215】
これらの場合に対応するために、重み付け係数Kp ,KB が必要以上に大きくなりすぎる(但し、割り当てられるデータ量は少なくなりすぎる)ので、Pピクチャーについて比率xに閾値δ3 、Bピクチャーについて比率xに閾値δ2 を設け、比率xがこれらの閾値δ3 ,δ2 を超える部分について、重み付け係数Kp ,KB を上限値Lp ,LB として制限する。
なお、重み付け係数Kp ,KB と比率xとの関係は、それぞれ閾値δ1 〜閾値δ3 および閾値δ1 〜閾値δ2 の範囲内で、下の式21−1および式21−2に示す通りとなる。
【0216】
【数21】
Figure 0003864461
【0217】
目標データ量算出回路264は、PピクチャーおよびBピクチャーの重み付け係数Kp ,KB を、以上述べたように、それぞれ閾値δ1 〜閾値δ3 および閾値δ1 〜閾値δ2 の範囲内で式21−1および式21−2を用いて算出し、これらの範囲外ではデフォルト値または上限値Lp ,LB (=DI /Dp ,DI /DB )に制限する。
【0218】
量子化インデックス生成回路266は、例えば、MPEG方式のTM5の第2段階および第3段階(ステップ2,ステップ3)と同様に、目標データ量算出回路264から入力された目標データ量Tj 、および、GC算出回路262から入力されたグローバルコンプレクシティXI ,Xp ,XB から量子化インデックスを生成し、量子化回路168に対して出力する。
【0219】
なお、量子化インデックスは、量子化回路168において、量子化処理の単位となるマクロブロックごとに変化する量子化値Qj の組み合わせを示すインデックスとして用いられるデータであって、量子化値Qj と1対1に対応する。つまり、量子化インデックス生成回路266から量子化インデックスを受けた量子化回路168は、受けた量子化インデックスが示す量子化値Qj の組み合わせに変換し、DCT回路166から入力される映像データを量子化する。
【0220】
以下、映像データ圧縮装置3(図25,図26)の動作を説明する。
動き検出器14は、第1の実施形態〜第6の実施形態においてと同様に、動きベクトルの生成等を行う。
エンコーダ制御部22は、第5の実施形態および第6の実施形態においてと同様に、ピクチャーの並び替え等の前処理を行う。
FIFOメモリ160は、第1の実施形態〜第7の実施形態においてと同様に、入力された映像データをLピクチャー分だけ遅延する。
【0221】
エンコーダ26(図26)が、1ピクチャー分の圧縮符号化を終了するたびに、量子化制御部260のGC算出回路262は、量子化インデックス生成回路266の量子化インデックスから量子化値Qj の平均値を算出し、量子化値Qj の平均値および圧縮映像データのデータ量を、式14−1〜式14−3(第6実施形態)に代入し、グローバルコンプレクシティXI ,Xp ,XB を算出する。
【0222】
目標データ量算出回路264は、圧縮映像データの目標データ量算出回路264は、最も新しく生成された各ピクチャータイプのピクチャーの実難度データDj (DI ,DP ,DB )に基づいて、式20、式21−2および式21−2に示した処理を行い、各ピクチャータイプの重み付け係数Kp ,KB を更新し、式17−1〜式17−3(第6実施形態)に示したように、次のピクチャーの目標データ量Tj を算出する。
【0223】
量子化インデックス生成回路266は、算出された目標データ量Tj およびグローバルコンプレクシティXI ,Xp ,XB に基づいて、量子化インデックスを算出し、エンコーダ26の量子化回路168に設定する。
DCT回路166は、第1の実施形態〜第6の実施形態においてと同様に、次のピクチャーに対してDCT処理を行う。
【0224】
量子化回路168は、DCT処理された映像データを、設定された量子化インデックスを量子化値Qj に変換し、変化により得られた量子化値Qj により量子化処理を行う。
可変長符号化回路170は、第1の実施形態〜第6の実施形態においてと同様に、可変長符号化を行い、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成し、バッファメモリ182を介して出力する。
【0225】
なお、映像データ圧縮装置3の目標データ量算出回路264を、実難度データDj の代わりに、GC算出回路262から入力されるグローバルコンプレクシティXI ,Xp ,XB を用いて重み付け係数Kp ,KB の更新を行うように変形することができる。
また、このような場合、式21−1および式21−2において用いられる比率(DI /Dp ,DI /DB )を、グローバルコンプレクシティXI ,Xp ,XB を用いた(XI /Xp ,XI /XB )に置き換えることも可能である。
【0226】
また、第7の実施形態においては、図27に示したように、重み付け係数Kp ,KB と比率xとの所定の範囲内の関係を、一次関数(式21−1,式21−2)で表したが、この範囲の重み付け係数Kp ,KB と比率xの関係を表すためにより適切な関数があれば、目標データ量算出回路264が、その関数を用いて重み付け係数Kp ,KB を更新するように変形してもよい。
また、第7の実施形態として示した映像データ圧縮装置3の処理の内容は、第1の実施形態〜第6の実施形態に示した映像データ圧縮装置1,2(図1〜図3,図16,図17)にも応用可能である。
【0227】
また、第7の実施形態に示した比率xの定義式(式20)、および、重み付け係数Kp ,KB の算出式(式21−1,式21−2)は例示であって、同様な意味を有する他のパラメータを、他の数式により算出するように目標データ量算出回路264の動作を変形することも可能である。
また、比率xと重み付け係数Kp ,KB との関係を、予め実験等により求めておき、これらの数値の関係を示すテーブルを作成し、比率xに基づいてテーブルを参照することにより、重み付け係数Kp ,KB を得るように目標データ量算出回路264の処理内容を変形してもよい。
【0228】
また、映像データ圧縮装置3において量子化制御部260が行った処理を、映像データ圧縮装置1,2においてホストコンピュータ20が行うことも可能である。
また、第7の実施形態に示した映像データ圧縮装置3に対しては、第1の実施形態〜第6の実施形態に示した変形が可能である。
【0229】
第8実施形態
以下、本発明の第8の実施形態を説明する。
ここまでに、第5の実施形態および第6の実施形態として、指標データ(統計量)、つまり、フラットネス、イントラAC、アクティビティおよびME残差を用い、圧縮映像データの品質の向上と、圧縮符号化処理の実時間性とを両立させるフィード・フォワード・レート・コントロール(FFRC)方式を説明した。また、第3の実施形態および第4の実施形態として、簡易2パスエンコード方式または予測簡易2パスエンコード方式を改良して、編集映像データを圧縮符号化するために好適な改良予測簡易2パスエンコード方式を説明した。
【0230】
第8の実施形態においては、これらの実施形態に示したFFRC方式および改良予測簡易2パスエンコード方式を組み合わせ、映像データ圧縮装置2(図16,図17)を用い、これらの方式両方の特徴を兼ね備え、実難度データDj を得るためのエンコーダが不要で、しかも、編集映像データに含まれる映像データ(シーン)の境界(シーンチェンジ)部分の圧縮映像データの品質が低下することがない映像データ圧縮方式(改良FFRC方式)を説明する。
【0231】
改良予測簡易2パスエンコード方式においては、実難度データDj が時間的に大きく変化する部分をシーンチェンジ部分として検出し、ピクチャータイプシーケンスを変更して圧縮符号化を行う。このようなシーンチェンジの検出は、FFRC方式においても、実難度データDj の代わりに指標データにより近似した実難度データDj の経時的な変化を監視することにより可能である。
【0232】
しかしながら、シーンチェンジの有無を判断するためには、シーンチェンジ部分の前後、1GOP程度の範囲の指標データの時間的変化を監視する必要があり、映像データ圧縮装置2において、動き検出器14が指標データを算出した後、かなりの時間が経過した後にシーンチェンジ部分の検出が可能となり、実際には、エンコーダ18における圧縮符号化処理の直前になって、初めて、シーンチェンジ部分の検出が可能となる可能性もある。
従って、ホストコンピュータ20は、処理時間を確保するために、指標データによる実難度データDj の近似する処理(第5の実施形態において示した式11,式12等、および、第6の実施形態において示した式16−1〜式16−3)を、シーンチェンジの検出の前にほぼ終了している必要がある。
【0233】
第8の実施形態における映像データ圧縮装置2は、シーンチェンジの検出結果が確定していない状態で、指標データあるいはグローバルコンプレクシティによる実難度データDj の近似処理を仮に行い、仮に算出した実難度データDj の内、シーンチェンジに伴う変更を要する部分だけを、シーンチェンジの有無およびピクチャータイプシーケンスの変更の有無が確定した後に補正し、目標データ量Tj を算出する処理を行う。
【0234】
以下、N枚〔説明の簡略化のために、以下、例えばN=L(LはFIFOメモリ160の遅延時間に対応するピクチャー数)とする〕のピクチャーのME残差の算出を行う度に、このN枚のピクチャーに対するピクチャータイプシーケンスを最終的に決定する場合を例として、第8の実施形態における映像データ圧縮装置2の圧縮符号化処理の内容を説明する。なお、ピクチャータイプシーケンスの決定に用いられるN枚のピクチャーは、ピクチャータイプシーケンスの決定する処理の処理単位であり、必ずしもエンコーダ18におけるピクチャータイプシーケンスと一致していなくてもよく、また、通常のGOPと異なり、先頭がIピクチャーでなくともよい。また、以下、このようなN枚のピクチャ一1組を、レート・コントロールGOP(RGCOP;rate control GOP )とも記す。
【0235】
図28は、第8の実施形態における映像データ圧縮装置2(図16,図17)の圧縮符号化動作を符号化順に示す図である。
動き検出器14は、第1の実施形態〜第7の実施形態においてと同様に、PピクチャーおよびBピクチャーに圧縮符号化される第(j+N)番目のピクチャーについて動きベクトルを生成し、さらに、ME残差を算出する(図23a)。
エンコーダ制御部22は、第5の実施形態〜第7の実施形態においてと同様に、ピクチャーの並び替え等の前処理を行い、さらに、フラットネス、イントラACおよびアクティビティ等の指標データを算出する。
FIFOメモリ160は、第1の実施形態〜第7の実施形態においてと同様に、入力された映像データをLピクチャー分だけ遅延する。
【0236】
映像データ圧縮装置2(図16,図17)の1ピクチャー分の圧縮符号化が終了するたびに、ホストコンピュータ20には、第5の実施形態〜第7の実施形態においてと同様に、エンコーダ制御部22が算出したフラットネス、イントラACおよびアクティビティ、および、動き検出器14が算出したME残差(統計量)が入力される。ホストコンピュータ20は、これらの指標データを記憶する(図28a)。さらに、ホストコンピュータ20は、シーンチェンジが発生しておらず、ピクチャーシーケンスに変更が生じないと仮定して、第6の実施形態においてと同様に、最適化された比例係数εI ,εP ,εB (第6の実施形態に示した式14−1〜式14−3)を用いて、式16−1〜式16−3により、シーンチェンジがないと仮定した場合の実難度データDj の値を近似し、予測する(図28b)。
【0237】
具体的には、ホストコンピュータ20は、第1のRGCOPのIピクチャーからN枚目のピクチャーはIピクチャーに圧縮符号化され、Mの整数倍(n×M)番目のピクチャーはPピクチャーに圧縮符号化され、これら以外のピクチャーはBピクチャーに圧縮符号化されると仮定し、それぞれIピクチャー、PピクチャーおよびBピクチャーに圧縮符号化されるピクチャーから生成された指標データ、および、比例係数εI ,εP ,εB を、式16−1〜式16−3に代入して実難度データDj を近似し、算出する。但し、Mは、エンコーダ18におけるシーンチェンジがない場合のPピクチャーの間隔を示す。
【0238】
つまり、例えば、ホストコンピュータ20は、前のRGCOP(第1のRGCOP;RGCOP#1)のIピクチャーを基準としてピクチャーの枚数を計数し、エンコーダ18が、第2のRGCOP(RGCOP#2)の各ピクチャーをいずれのピクチャータイプに圧縮符号化するかを仮定し、仮定したピクチャータイプに応じて、式16−1〜式16−3に示したように、指標データにより実難度データDj の値を近似し、予測する。
【0239】
なお、RGCOP内にシーンチェンジ部分が存在する確率は、比較的、少ないと考えられるので、ホストコンピュータ20は、予測した実難度データDj に基づいて、ほとんどのRGCOPに対する目標データ量Tj を算出することになる(図28f)。
また、実難度データDj は、式1(第1の実施形態)、式4(第2の実施形態)または式17−1〜式17−3(第6の実施形態)の分母の計算に用いられるのみであり、また、後述するように、ホストコンピュータ20は、ピクチャータイプシーケンスの変更の有無が確定した段階で補正を行うので、常に、目標データ量Tj の値を正確に算出することができる。
【0240】
第2のRGCOP(RGCOP#2)の各ピクチャーの実難度データDj の算出が終了すると、算出した実難度データDj または指標データに対して、第3の実施形態および第4の実施形態に示した方法を適用することにより、ホストコンピュータ20は、第2のRGCOPにおけるシーンチェンジを検出することができる。第2のRGCOPにおけるシーンチェンジの有無に応じて、ホストコンピュータ20は、シーンチェンジの有無に応じて、エンコーダ18を制御してピクチャータイプシーケンスの変更〔図8(C)〕を行う。
このようなホストコンピュータ20の処理により、ピクチャータイプシーケンスの変更の有無が分かり、各ピクチャーをいずれのピクチャータイプに圧縮符号化するかが確定する(図28c)。
【0241】
ホストコンピュータ20は、ピクチャータイプシーケンスに変更がある場合には、記憶した指標データおよび変更後のピクチャータイプに基づいて、第2のRGCOPについて実難度データDj の値を補正して、正しい実難度データDj を算出し(図28d)、さらに、式1、式4または式17−1〜式17−3を用いて、各ピクチャータイプに応じた第(N+1)番目のピクチャーの目標データ量TN+1 (target bit)を算出し(図28e)、エンコーダ18の量子化制御回路180に設定する。
【0242】
具体的には、図8(C)に示したように、ホストコンピュータ20は、圧縮後にPピクチャーではなく、Iピクチャーになるように変更されたピクチャーの指標データを、式16−1の代わりに式16−2に代入し、逆に、圧縮後にIピクチャーではなく、Pピクチャーになるように変更されたピクチャーの指標データを、式16−2の代わりに式16−1に代入して実難度データDj の値を補正する。
【0243】
エンコーダ18のDCT回路166は、第1の実施形態〜第7の実施形態においてと同様に、DCT処理を行う。
量子化回路168は、DCT処理された映像データを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化し、量子化値Qj の平均値を算出する。
可変長符号化回路170は、第1の実施形態〜第7の実施形態においてと同様に、変長符号化を行い、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成し、バッファメモリ182を介して出力する。
【0244】
エンコーダ18が、第j番目のピクチャーの圧縮符号化を終了すると、ホストコンピュータ20は、量子化値Qj の平均値と、圧縮符号化された第j番目のピクチャーのデータ量とに基づいて、式14−1〜式14−3に示したようにグローバルコンプレクシティを算出する。
さらに、ホストコンピュータ20は、算出したグローバルコンプレクシティにより、式15−1〜式15−3に示したように比例係数εI ,εP ,εB を更新し、最適化する。第6の実施形態においてと同様に、更新された比例係数εI ,εP ,εB は、次のピクチャーの圧縮符号化の際の変換式(式16−1〜式16−3)に反映される。
【0245】
図29を参照して、第8の実施形態におけるホストコンピュータ20の処理内容をさらに説明する。
図29は、第8の実施形態における映像データ圧縮装置2のホストコンピュータ20(図16)の処理内容を示すフローチャート図である。なお、図7においては、第6の実施形態に示したグローバルコンプレクシティの算出処理等は省略されている。
【0246】
図29に示すように、第8の実施形態におけるホストコンピュータ20の処理は、第1段階(S400)および第2段階(S420)に分かれており、第1段階においては、シーンチェンジがなく、ピクチャータイプシーケンスに変更がない仮定して実難度データDj を予測する処理が行われ、第2段階においては、シーンチェンジが生じ、ピクチャータイプシーケンスが変更された場合に、実難度データDj の値を補正する処理が行われる。
【0247】
第1段階(S400;S402〜S412)は、シーンチェンジがない場合の実難度データDj を予測する処理であって、第1段階のステップ402(S402)において、ホストコンピュータ20は、第(j+L)番目のピクチャーのME残差あるいはイントラAC等の指標データ(統計量)をエンコーダ制御部22または動き検出器14から取り込み、記憶する。
ステップ404(S404)において、ホストコンピュータ20は、第〔j+L(j+N)〕番目のピクチャーがBピクチャーに圧縮符号化されるか否かを判断する。第(j+L)番目のピクチャーがBピクチャーに圧縮符号化される場合にはS406の処理に進み、Bピクチャーに圧縮符号化されない場合にはS408の処理に進む。
【0248】
ステップ406(S406)において、ホストコンピュータ20は、第(j+L)番目のピクチャーがBピクチャーに圧縮符号化されると予測し、式16−3により実難度データDj を近似し、算出する。
ステップ408(S408)において、ホストコンピュータ20は、前のRGCOPにおいてIピクチャーに圧縮符号化されるピクチャーから、現在のRGCOPの第(j+L)番目のピクチャーまでの間のピクチャーの枚数(間隔)が、N枚であるか否かを判断する。間隔がN枚である場合には、S412の処理に進み、N枚でない場合にはS410の処理に進む。
【0249】
ステップ410(S410)において、ホストコンピュータ20は、第(j+L)番目のピクチャーがPピクチャーに圧縮符号化されると予測し、式16−2により実難度データDj を近似し、算出する。
ステップ412(S412)において、ホストコンピュータ20は、第(j+L)番目のピクチャーがIピクチャーに圧縮符号化されると予測し、式16−1により実難度データDj を近似し、算出する。
【0250】
第2段階(S420;S422〜S434)は、第1段階で予測した実難度データDj を補正する処理であって、第2段階のステップ422(S422)において、ホストコンピュータ20は、新たなRGCOPが始まったか否かを判断し、始まらない場合にはS430の処理に進み、始まった場合にはS424の処理に進む。
ステップ424(S424)において、ホストコンピュータ20は、Iピクチャーの位置が変わるようにピクチャータイプシーケンスが変更されたか否かを判断し、Iピクチャーの位置が変わるようにピクチャータイプシーケンスが変更された場合にはS426の処理に進み、変更されない場合にはS430の処理に進む。
【0251】
ステップ426(S426)において、ホストコンピュータ20は、新たにIピクチャーに圧縮符号化されるピクチャーについて、式16−1により実難度データDj を近似し、算出する。
ステップ428(S428)において、ホストコンピュータ20は、新たにPピクチャーに圧縮符号化されるピクチャーについて、式16−2により実難度データDj を近似し、算出する。
【0252】
ステップ430(S430)において、ホストコンピュータ20は、式1、式4または式17−1〜式17−3により、第j番目のピクチャーに対する目標データ量Tj を算出し、エンコーダ18(図16,図17)の量子化制御回路180に設定する。
ステップ432(S432)において、エンコーダ18は、量子化制御回路180に設定された目標データ量Tj に基づいて第j番目のピクチャーを圧縮符号化する。
ステップ434(S434)において、ホストコンピュータ20は、数値jをインクリメントする。
【0253】
なお、第8の実施形態においては、映像データ圧縮装置2のホストコンピュータ20は、シーンチェンジがあった場合に、圧縮後のピクチャーが変更されたピクチャーの実難度データDj のみを補正する処理を行うが、処理時間に余裕があれば、ピクチャータイプシーケンスが確定した後に、全てのピクチャーの実難度データDj を算出するように変形することができる。
また、第8の実施形態に示した映像データ圧縮装置2の動作についても、第3の実施形態〜第7の実施形態に示したものと同様な変形が可能である。
また、第1の実施形態〜第7の実施形態においてそれぞれ説明した映像データ圧縮装置1,2,3(図1〜図3,図16,図17,図25,図26)の処理内容は、互いに矛盾を生じない限り、組み合わせることが可能である。
【0254】
以上述べたように、第8の実施形態における映像データ圧縮装置2の動作によれば、第5の実施形態〜第7の実施形態に示した映像データ圧縮装置2の動作と同じ効果を得られる他、これらの実施形態におけるよりもさらに正確な目標データ量Tj が算出でき、しかも、シーンチェンジ部分の圧縮映像データの品質が低下しない。
【0255】
【発明の効果】
以上説明したように、本発明に係る映像データ圧縮装置およびその方法によれば、2パスエンコードによらずに、所定のデータ量以下に音声・映像データを圧縮符号化することができる。
また、本発明に係る映像データ圧縮装置およびその方法によれば、ほぼ実時間的に映像データを圧縮符号化することができ、しかも、伸長復号後に高品質な映像を得ることができる。
また、本発明に係る映像データ圧縮装置およびその方法によれば、2パスエンコードによらずに、圧縮符号化後のデータ量を見積もって圧縮率を調節し、圧縮符号化処理を行うことができる。
【図面の簡単な説明】
【図1】本発明に係る映像データ圧縮装置の構成を示す図である。
【図2】図1に示した簡易2パス処理部のエンコーダの構成を示す図である。
【図3】図1に示したエンコーダの構成を示す図である。
【図4】(A)〜(C)は、第1の実施形態における映像データ圧縮装置の簡易2パスエンコードの動作を示す図である。
【図5】(A)〜(C)は、第2の実施形態における映像データ圧縮装置の予測簡易2パスエンコードの動作を示す図である。
【図6】第2の実施形態における映像データ圧縮装置(図1)の動作を示すフローチャートである。
【図7】(A)〜(C)は、第2の実施形態における予測簡易2パスエンコード方式、および、第3の実施形態における改良予測簡易2パスエンコード方式による、シーンチェンジの前後のピクチャーに対する圧縮符号化を示す図である。
【図8】(A)〜(C)は、エンコーダ制御部(図1)による編集映像データのピクチャーの順序の入れ替え処理、および、ホストコンピュータによるピクチャータイプの変更処理を示す図である。
【図9】編集映像データのシーンチェンジ部分付近の実難度データの値の経時的な変化を例示する図である。
【図10】ホストコンピュータ(図1)が、編集映像データにシーンチェンジが発生する場合に、実難度データD1 〜D15に基づいて予測難度データD’16〜D’30を算出する方法、および、編集映像データにシーンチェンジが発生しない場合の予測難度データD’16〜D’30を算出する方法を示す図である。
【図11】第3の実施形態における改良予測簡易2パスエンコード方式における総和値Sumi の予測および目標データ量Ti の算出に係る処理内容を示す第1のフローチャート図である。
【図12】第3の実施形態における改良予測簡易2パスエンコード方式における総和値Sumi の予測および目標データ量Ti の算出に係る処理内容を示す第2のフローチャート図である。
【図13】シーンチェンジがPピクチャーで生じた場合に、その前後における実難度データDj (○印)と予測難度データD’j (×印)との関係を、圧縮符号化の順に例示する図である。
【図14】シーンチェンジがIピクチャーで生じた場合に、その前後における実難度データDj (○印)と予測難度データD’j (×印)との関係を、圧縮符号化の順に例示する図である。
【図15】第4の実施形態における映像データ圧縮装置(図1)のホストコンピュータによるシーンチェンジ検出処理の内容を示すフローチャート図である。
【図16】第5の実施形態における本発明に係る映像データ圧縮装置の構成の概要を示す図である。
【図17】図16に示した映像データ圧縮装置の圧縮符号化部の詳細な構成を示す図である。
【図18】図1および図16に示した映像データ圧縮装置により、Pピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
【図19】図1および図16に示した映像データ圧縮装置により、Bピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
【図20】フラットネスの計算方法を示す図である。
【図21】図1および図16に示した映像データ圧縮装置により、Iピクチャーを生成する際のフラットネスと実難度データDj との相関関係を示す図である。
【図22】図1および図16に映像データ圧縮装置により、Iピクチャーを生成する際のイントラACと実難度データDj との相関関係を示す図である。
【図23】第6の実施形態における映像データ圧縮装置(図17)の圧縮符号化処理の内容を、ピクチャーの符号化順に示す図である。
【図24】第6の実施形態における映像データ圧縮装置のホストコンピュータ(図17)の処理内容を示すフローチャート図である。
【図25】第7の実施形態における本発明に係る映像データ圧縮装置の構成を示す図である。
【図26】図25に示したエンコーダの構成を示す図である。
【図27】目標データ量算出回路(図26)が算出するPピクチャーおよびBピクチャーの重み付け係数Kp ,KB を示す図である。
【図28】第8の実施形態における映像データ圧縮装置(図17)の圧縮符号化動作を符号化順に示す図である。
【図29】第8の実施形態における映像データ圧縮装置のホストコンピュータ(図17)の処理内容を示すフローチャート図である。
【符号の説明】
1,2…映像データ圧縮装置、10,24…圧縮符号化部、12,22…エンコーダ制御部、14…動き検出器、16…簡易2パス処理部、160…FIFOメモリ、162,18,26…エンコーダ、260…量子化制御部、262…GC算出回路、264…目標データ量算出回路、266…量子化インデックス生成回路、164…加算回路、166…DCT回路、168…量子化回路、170…可変長符号化回路、172…逆量子化回路、174…逆DCT回路、176…加算回路、178…動き補償回路、180…量子化制御回路、182…バッファメモリ、20…ホストコンピュータ。

Claims (11)

  1. 映像データを符号化処理して符号化映像データを生成する符号化装置において、
    上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出手段と、
    上記映像データを所定ピクチャ分遅延させる遅延手段と、
    上記符号化映像データのデータレートに対するGOP単位の上記実難度データの比率が所定しきい値より大きい場合に、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの実難度データに対する P ピクチャの実難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの実難度データに対する B ピクチャの実難度データの比率と比例するように更新する重み付け係数更新手段と、
    ピクチャタイプ毎の上記実難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプごとに算出する目標データ量算出手段と、
    上記目標データ量算出手段により算出された上記目標データ量となるように、上記遅延手段により遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段と
    を有する符号化装置。
  2. 上記重み付け係数更新手段は、上記重み付け係数が所定の上限値を超える部分について、上記重み付け係数を上限値に制限する
    請求項1に記載の符号化装置。
  3. 上記符号化映像データのデータレートに対するGOP単位の上記実難度データの比率は、次式に示されるパラメータxである
    請求項1に記載の符号化装置。
    Figure 0003864461
    Bitrate:1秒あたりの発生ビット量(データレート)
    N:1GOPあたりのピクチャ枚数
    Picture_rate:1秒あたりのピクチャ枚数
  4. 映像データを符号化処理して符号化映像データを生成する符号化装置において、
    上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出手段と、
    上記映像データから、上記映像データの動きの大きさを検出する動き検出手段と、
    上記映像データを所定ピクチャ分遅延させる遅延手段と、
    上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記実難度データ算出手段により算出された上記実難度データの値が大きい絵柄の上記映像データのうち、上記動き検出手段により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出手段により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新手段と、
    ピクチャタイプ毎の上記実難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ算出手段と、
    上記目標データ算出手段により算出された上記目標データ量となるように、上記遅延手段より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段と
    を有する符号化装置。
  5. 上記動き検出手段は、Iピクチャの実難度データに対するPピクチャの実難度データの比率及びIピクチャの実難度データに対するBピクチャの実難度データの比率から、上記映像データの動きの大きさを検出する
    請求項に記載の符号化装置。
  6. 映像データを符号化処理して符号化映像データを生成する符号化装置において、
    上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出手段と、
    上記統計量算出手段により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延手段と、
    上記統計量算出手段により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出手段と、
    上記符号化映像データのデータレートに対するGOP単位の上記近似難度データの比率が所定しきい値より大きい場合に、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する P ピクチャの近似難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する B ピクチャの近似難度データの比率と比例するように更新する重み付け係数更新手段と、
    ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出手段と、
    上記目標データ量算出手段により算出された上記目標データ量となるように、上記遅延手段より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段と
    を有する符号化装置。
  7. 映像データを符号化処理して符号化映像データを生成する符号化装置において、
    上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出手段と、
    上記映像データから、上記映像データの動きの大きさを検出する動き検出手段と、
    上記統計量算出手段により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延手段と、
    上記統計量算出手段により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出手段と、
    上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記近似実難度データ算出手段により算出された上記近似実難度データの値が大きい絵柄の上記映像データのうち、上記動き検出手段により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出手段により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新手段と、
    ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新手段により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延手段により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延手段により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出手段と、
    上記目標データ量算出手段により算出された上記目標データ量となるように、上記遅延手段より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化手段と
    を有する符号化装置。
  8. 映像データを符号化処理して符号化映像データを生成する符号化方法において、
    上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出工程と、
    上記映像データを所定ピクチャ分遅延させる遅延工程と、
    上記符号化映像データのデータレートに対するGOP単位の上記実難度データの比率が所定しきい値より大きい場合に、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの実難度データに対する P ピクチャの実難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの実難度データに対する B ピクチャの実難度データの比率と比例するように更新する重み付け係数更新工程と、
    ピクチャタイプ毎の上記実難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、
    上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程と
    を有する符号化方法。
  9. 映像データを符号化処理して符号化映像データを生成する符号化方法において、
    上記映像データを符号化処理することにより、上記映像データの絵柄の難度を示す実難度データをピクチャ単位又はGOP単位で算出する実難度データ算出工程と、
    上記映像データから、上記映像データの動きの大きさを検出する動き検出工程と、
    上記映像データを所定ピクチャ分遅延させる遅延工程と、
    上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記実難度データ算出工程により算出された上記実難度データの値が大きい絵柄の上記映像データのうち、上記動き検出工程により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出工程により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新工程と、
    ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記実難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の実難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、
    上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程と
    を有する符号化方法。
  10. 映像データを符号化処理して符号化映像データを生成する符号化方法において、
    上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出工程と、
    上記統計量算出工程により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延工程と、
    上記統計量算出工程により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出工程と、
    上記符号化映像データのデータレートに対するGOP単位の上記近似難度データの比率が所定しきい値より大きい場合に、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対する P ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する P ピクチャの近似難度データの比率と比例するように更新し、上記目標データ量に対する B ピクチャの重み付け係数を、 I ピクチャの近似難度データに対する B ピクチャの近似難度データの比率と比例するように更新する重み付け係数更新工程と、
    ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、
    上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程と
    を有する符号化方法。
  11. 映像データを符号化処理して符号化映像データを生成する符号化方法において、
    上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎又はGOP毎に算出する統計量算出工程と、
    上記映像データから、上記映像データの動きの大きさを検出する動き検出工程と、
    上記統計量算出工程により上記統計量が算出された上記映像データを所定ピクチャ分遅延させる遅延工程と、
    上記統計量算出工程により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより、上記映像データの近似難度データをピクチャ毎又はGOP毎に算出する近似難度データ算出工程と、
    上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる目標データ量に対してピクチャタイプ毎に異なった重み付けを行う重み付け係数の値を、上記近似実難度データ算出工程により算出された上記近似難度データの値が大きい絵柄の上記映像データのうち、上記動き検出工程により検出された動きが小さい絵柄には上記重み付け係数が大きくなるように、かつ、上記動き検出工程により検出された動きが大きい絵柄には上記重み付け係数が小さくなるように更新する重み付け係数更新工程と、
    ピクチャタイプ毎の上記近似難度データと上記重み付け係数更新工程により更新されたピクチャタイプ毎の上記重み付け係数とを利用して、上記遅延工程により遅延された上記映像データの複数ピクチャ分に割り当てることのできるデータ量に対して符号化対象ピクチャの上記近似難度データと上記遅延工程により遅延された上記映像データの複数ピクチャ分の近似難度データとの比率を乗じることにより、上記遅延工程により遅延された上記映像データを符号化処理する際に割り当てる上記目標データ量をピクチャタイプ毎に算出する目標データ量算出工程と、
    上記目標データ量算出工程により算出された上記目標データ量となるように、上記遅延工程より遅延された上記映像データをピクチャタイプに応じて符号化処理する符号化工程と
    を有する符号化方法。
JP22965096A 1996-08-30 1996-08-30 映像データ圧縮装置およびその方法 Expired - Fee Related JP3864461B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP22965096A JP3864461B2 (ja) 1996-08-30 1996-08-30 映像データ圧縮装置およびその方法
US08/918,813 US5933532A (en) 1996-08-30 1997-08-26 Video data compression apparatus and method of same
EP19970306674 EP0827343B1 (en) 1996-08-30 1997-08-29 Video data compression apparatus and method
DE69739816T DE69739816D1 (de) 1996-08-30 1997-08-29 Vorrichtung und Verfahren zur Videodatenkompression
KR19970044603A KR19980019201A (ja) 1996-08-30 1997-08-30

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22965096A JP3864461B2 (ja) 1996-08-30 1996-08-30 映像データ圧縮装置およびその方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005351360A Division JP2006148953A (ja) 2005-12-05 2005-12-05 映像データ圧縮装置およびその方法

Publications (2)

Publication Number Publication Date
JPH1075451A JPH1075451A (ja) 1998-03-17
JP3864461B2 true JP3864461B2 (ja) 2006-12-27

Family

ID=16895529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22965096A Expired - Fee Related JP3864461B2 (ja) 1996-08-30 1996-08-30 映像データ圧縮装置およびその方法

Country Status (5)

Country Link
US (1) US5933532A (ja)
EP (1) EP0827343B1 (ja)
JP (1) JP3864461B2 (ja)
KR (1) KR19980019201A (ja)
DE (1) DE69739816D1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6337879B1 (en) * 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
KR100756596B1 (ko) 1997-07-08 2007-09-10 소니 가부시끼 가이샤 비디오 데이터 부호화 장치 및 비디오 데이터 부호화 방법
US7343617B1 (en) 2000-02-29 2008-03-11 Goldpocket Interactive, Inc. Method and apparatus for interaction with hyperlinks in a television broadcast
US7120924B1 (en) 2000-02-29 2006-10-10 Goldpocket Interactive, Inc. Method and apparatus for receiving a hyperlinked television broadcast
US7367042B1 (en) 2000-02-29 2008-04-29 Goldpocket Interactive, Inc. Method and apparatus for hyperlinking in a television broadcast
JP4769392B2 (ja) * 2001-09-25 2011-09-07 キヤノン株式会社 信号処理装置
US20040202249A1 (en) * 2003-04-08 2004-10-14 Newsoft Technology Corporation Real-time MPEG video encoding method of maintaining synchronization between video and audio
US7391916B2 (en) * 2003-05-21 2008-06-24 Silicon Integrated Systems Corp. Quantization matrix adjusting method for quality improvement
US7388995B2 (en) * 2003-05-21 2008-06-17 Silicon Integrated Systems Corp. Quantization matrix adjusting method for avoiding underflow of data
US7373004B2 (en) * 2003-05-23 2008-05-13 Silicon Integrated Systems Corp. Apparatus for constant quality rate control in video compression and target bit allocator thereof
JP4629329B2 (ja) * 2003-11-28 2011-02-09 株式会社日立製作所 動き検出可能な映像信号切替装置
US7574055B2 (en) * 2004-09-07 2009-08-11 Lexmark International, Inc. Encoding documents using pixel classification-based preprocessing and JPEG encoding
JP4543971B2 (ja) * 2005-03-07 2010-09-15 ソニー株式会社 符号化方法、符号化装置、符号化処理のプログラム及び符号化処理のプログラムを記録した記録媒体
US8116577B2 (en) 2005-03-07 2012-02-14 Sony Corporation Encoding method, encoding device, encoding process program, and recording medium on which encoding process program is recorded
JP2008004980A (ja) * 2006-06-20 2008-01-10 Fujitsu Ltd 符号化装置、符号化方法、プログラム記録媒体、プログラム、シーン変化検知装置、およびシーン変化検知方法
CA2664668C (en) * 2006-10-10 2014-04-01 Nippon Telegraph And Telephone Corporation Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program
JP5212373B2 (ja) 2007-09-12 2013-06-19 ソニー株式会社 画像処理装置及び画像処理方法
JP4569840B2 (ja) 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
US8238423B2 (en) * 2007-09-12 2012-08-07 Sony Corporation Image processing apparatus and method
JP5212372B2 (ja) * 2007-09-12 2013-06-19 ソニー株式会社 画像処理装置及び画像処理方法
US7876968B2 (en) * 2007-10-15 2011-01-25 Himax Technologies Limited Apparatus of compressing image data and a method thereof
TWI436648B (zh) * 2008-06-05 2014-05-01 Nippon Telegraph & Telephone 影像編碼量控制方法、影像編碼量控制裝置,影像編碼量控制程式及記錄有該程式之電腦可讀取之記錄媒體
US8270745B2 (en) * 2008-06-27 2012-09-18 Sony Corporation Image processing device and image processing method
JP5472105B2 (ja) * 2008-06-27 2014-04-16 ソニー株式会社 画像処理装置及び画像処理方法
BRPI0904320A2 (pt) 2008-06-27 2015-06-30 Sony Corp Dispositivo e método de processamento de imagem
BRPI0904325A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo e método de processamento de imagem.
JP4878052B2 (ja) * 2008-12-04 2012-02-15 日本電信電話株式会社 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
US8879623B2 (en) 2009-09-02 2014-11-04 Sony Computer Entertainment Inc. Picture-level rate control for video encoding a scene-change I picture
US8681858B2 (en) * 2009-12-23 2014-03-25 General Instrument Corporation Rate control for two-pass encoder
JP2011259248A (ja) * 2010-06-09 2011-12-22 Sony Corp 画像処理装置および方法、並びにプログラム
WO2015095166A2 (en) * 2013-12-16 2015-06-25 Arris Enterprises, Inc. Producing an output need parameter for an encoder
US10419760B2 (en) 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5170264A (en) * 1988-12-10 1992-12-08 Fuji Photo Film Co., Ltd. Compression coding device and expansion decoding device for a picture signal
CA2068751C (en) * 1991-05-24 1998-05-19 Tokumichi Murakami Image coding system
US5144424A (en) * 1991-10-15 1992-09-01 Thomson Consumer Electronics, Inc. Apparatus for video data quantization control
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
JP3265818B2 (ja) * 1994-04-14 2002-03-18 松下電器産業株式会社 動画符号化方法
KR0186142B1 (ko) * 1995-12-28 1999-05-01 구자홍 가변율 부호화기의 비트율 할당 방법 및 장치

Also Published As

Publication number Publication date
JPH1075451A (ja) 1998-03-17
EP0827343A2 (en) 1998-03-04
EP0827343B1 (en) 2010-03-24
EP0827343A3 (en) 2006-04-05
US5933532A (en) 1999-08-03
DE69739816D1 (de) 2010-05-06
KR19980019201A (ja) 1998-06-05

Similar Documents

Publication Publication Date Title
JP3864461B2 (ja) 映像データ圧縮装置およびその方法
KR100512389B1 (ko) 영상데이터의 압축장치 및 그 방법
KR100756596B1 (ko) 비디오 데이터 부호화 장치 및 비디오 데이터 부호화 방법
EP1445958A1 (en) Quantization method and system, for instance for video MPEG applications, and computer program product therefor
EP1515564A2 (en) Systems and methods for adaptively filtering DCT coefficients in a video encoder
JPH0898179A (ja) 画像符号化装置
JP3960451B2 (ja) シーン特性検出型動画像符号化装置
EP1143737A2 (en) Image encoding apparatus and method, video camera, image recording apparatus, and image transmission apparatus
EP1382208A1 (en) Dynamic complexity prediction and regulation of mpeg2 decoding in a media processor
JPH08102938A (ja) 画像符号化装置
JP3765129B2 (ja) 符号化装置および符号化方法
JP3800965B2 (ja) データレート変換装置
JP3879134B2 (ja) 符号化装置およびその方法
JP3765130B2 (ja) 符号化装置および符号化方法
JP3918208B2 (ja) 映像データ圧縮装置およびその方法
JP2002354484A (ja) 符号化画像のレート変換方法、及び符号化画像レート変換装置
JP2006148953A (ja) 映像データ圧縮装置およびその方法
JPH1066092A (ja) 映像データ圧縮装置およびその方法
JPH1075452A (ja) 映像データ圧縮装置およびその方法
JPH07284097A (ja) 画像符号化方法及び画像符号化装置
JPH1066084A (ja) 映像データ圧縮装置およびその方法
JPH09284772A (ja) 映像データ圧縮装置およびその方法
JP2006136010A (ja) 映像データ圧縮装置およびその方法
EP1944980A2 (en) Bit rate control algorithm
JP4264790B2 (ja) 統計多重制御装置、画像符号化装置、統計多重システム、統計多重制御方法および符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060302

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060529

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131013

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees