WO2002080572A1 - Image processing apparatus, image processing method, image processing program, and recording medium - Google Patents

Image processing apparatus, image processing method, image processing program, and recording medium Download PDF

Info

Publication number
WO2002080572A1
WO2002080572A1 PCT/JP2002/003060 JP0203060W WO02080572A1 WO 2002080572 A1 WO2002080572 A1 WO 2002080572A1 JP 0203060 W JP0203060 W JP 0203060W WO 02080572 A1 WO02080572 A1 WO 02080572A1
Authority
WO
WIPO (PCT)
Prior art keywords
activity
field
frame
data
image processing
Prior art date
Application number
PCT/JP2002/003060
Other languages
English (en)
French (fr)
Inventor
Akira Sugiyama
Haruo Togashi
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to US10/473,441 priority Critical patent/US20040131116A1/en
Priority to JP2002577443A priority patent/JPWO2002080572A1/ja
Publication of WO2002080572A1 publication Critical patent/WO2002080572A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4342Demultiplexing isochronously with video sync, e.g. according to bit-parallel or bit-serial interface formats, as SDI
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23602Multiplexing isochronously with the video sync, e.g. according to bit-parallel or bit-serial interface formats, as SDI

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

明 細 画像処理装置、 画像処理方法、 画像処理プログラムおよび記録媒体 技術分野
この発明は、 画像信号をブロック単位で量子化して画像信号の圧縮符 号化を行い、 その際に、 フレーム毎の符号量が一定量以下になるように 発生符号量を制御する画像処理装置、 画像処理方法、 画像処理プログラ ムおよび記録媒体に関する。 背景技術
従来から、 画像データの圧縮符号化方式として、 画像データを所定画 素数から成るブロック単位で量子化を行うことで圧縮符号化するものが 知られている。 例えば M P E G 2 (Moving Pictures Experts Group 2) では、 このような圧縮符号化方式が採用されている。 MP EG 2では、 画像データを所定画素数から成るブロック単位で D C T (Discrete Cosi ne Transform)し、 得られた D C T係数に対して量子化を行うことで、 画像データを圧縮符号化する。 MP E G 2では、 量子化の際の量子化ス テツプが量子化スケールにより指定されて、 D CT係数の圧縮符号化が 行われる。
従来より、 例えばこの MP E G 2の圧縮符号化において、 圧縮する画 像の複雑さや滑らかさを示すァクティビティ (Activity)という指数を算 出し、 このアクティビティに基づく適応量子化を用いて画質の最適化を 図る方法が知られている。
これは、 圧縮処理による画質劣化が視覚的に目立ちやすい、 画像が単 調で滑らかな領域 (以下、 平坦領域という) では、 量子化ステップの細 かい量子化スケールを用いて細かく量子化し、 これと反対に、 画質劣化 の目立ちにくい画像が複雑な領域では、 量子化ステップの粗い量子化ス ケ一ルを用いて粗く量子化を行なう手法であり、 限られた符号量の中で 画質の最適化を図る有効な手法である。
ところで、 画像データの圧縮を行なう場合、 上述したように、 各画像 の領域を所定サイズの画素ブロックに分割し、 各プロック毎に量子化や D C Tを行なうことになる。 M P E G 2による規格では、 8画素 x 8ラ ィンのブロックが最小処理単位として規定される。 この 8画素 X 8ライ ンのブロックで D C Tを行ない、 この D C Tにより得られた D C T係数 を、 1 6画素 X 1 6ラインのマクロブロック単位で量子化するように規 定されている。
一方、 上述したアクティビティの算出を行なう単位としては、 明確な 規定はないものの、 M P E G 2の T M 5 (Tes t Mode l 5)においては、 D C Tブロックと同様の 8画素 X 8ラインのサブブロックで処理すること が提案されている。
以下、 M P E G 2の T M 5で採用された 「視覚特性を考慮した適応量 子化」 におけるァクティビティの算出方法について説明する。
先ず、 適応量子化とは、 例えば 1フレーム単体での発生符号量を制御 するために、 画像の状態によって異なる量子化スケール Q j を用いて量 子化を行うように、 量子化スケール Q j を各マクロブロック毎のァクテ イビティにより変化させて、 高画質を達成するものである。 例えば、 視 覚的に画質劣化の目立ちやすい画像の平坦領域では、 より細かい量子化 ステップを有する量子化スケール Q j を用いて量子化を行い、 画質劣化 の比較的目立ちにくい絵柄の複雑な画像領域で、 より粗い量子化ステツ プを有する量子化スケール Q j を用いて量子化を行うように、 ァクティ ビティにより量子化スケール Q j を変化させる。 アクティビティは、 予測誤差でなく、 原画における輝度信号の画素値 を用い、 フレーム D C T符号化モードにおける 4個のブロックと、 フィ —ルド D C T符号化モードにおける 4個のブロックとの合計 8個のブロ ックの画素値を用いて算出される。 例えば、 j番目のマクロブロックに ついて、 以下の式 ( 1 ) 〜式 (3) で与えられる演算を、 式 (3) 、 式 ( 2) 、 式 ( 1 ) の順に行なうことにより、 アクティビティ act)が求め られる。
act) = 1 + min[sblk=l, 8] (var_sblk) · · · ( 1 )
var_sblk = 1/64 ∑ [k=l, 64] (Pk ― Pavg)2 - · · ( 2)
Pavg = 1/64 ∑ [k=l, 64] Pk · · · ( 3 )
ここで、 Pkは、 原画の輝度信号ブロック内の画素値であり、 式 ( 3) では 8x8のブロック内の 6 4個の画素値を合計し、 これを 6 4で割る ことにより、 ブロック内の画素値 Pkの平均値 Pavgを求めている。 次に、 式 ( 2) では、 平均値 Pavgと画素値 Pkそれぞれとの差分をとり、 8x8 のブロック内の平均差分値 var_sblkを算出している。 さらに、 式 ( 1 ) において、 平均差分値 var— sblkの最小値を採用し、 j番目のマクロプロ ックのアクティビティ actjを求める。 なお、 ここで最小値を採用するの は、 マクロブロック内の一部だけでも平坦な部分のある場合には、 この マクロプロックに対する量子化を細かくする必要があるからである。 そして、 MP E G 2の TM 5では、 以上のようにして求めた各マクロ ブロックのアクティビティ act)から、 「2. 0」 〜 「0. 5」 の範囲の 値をとる正規化アクティビティ Nactj を、 次の式 (4) より求める。 Nac t j = (2xac t j + avg_ac t)/(ac tj + 2xavg_ac t) · · · (4)
ここで、 「avg_act」 は、 現在処理中のフレーム (ピクチャ) の 1つ 前に符号化したフレームにおけるアクティビティ actjの平均値 (平均ァ クテイビティ) である。 そして、 視覚特性を考慮した量子化スケール niQuantj は、 1フレーム の発生符号量を制御するために別途求められた量子化スケール Qi に基 づいて、 次の (5 ) 式で与えられる。
Figure imgf000006_0001
5 )
このような量子化スケール mquantjを用いて各マクロブロックの量子 化を行なうことにより、 1フレームの全体の符号量を所定の範囲内に保 ちながら、 そのフレームにおける画像の平坦度や複雑度に応じた最適な 量子化を行ない、 限られた符号量を有効に用いて画像の品位をできるだ け劣化させることなく効率的な画像圧縮を行なう。
ところで、 フレーム間でシーンチェンジがあった場合には、 シーンチ ェンジの前後で画像の状態が大きく変化することになり、 フレーム間の 相関性が損なわれることになる。
第 1図 A、 第 1図 B、 第 1図 Cおよび第 1図 Dは、 従来技術により正 規化ァクティビティ Nactjを求める場合の一例の処理を示す。 第 1図 A は、 フレーム信号であり、 一組の口一およびハイで 1フレームが示され る。 第 1図 Bは、 入力されるピクチャを示す。 1 ピクチャが 1フレーム に対応する。 インタレース走査では、 1フレームが前半の第 1フィール ドおよび後半の第 2フィールドの 2フィールドからなる。
このような入力ピクチャに対して正規化ァクティビティ Nactjを求め る場合について説明する。 上述したように、 MP E G 2では、 ブロック 単位で処理を行うため、 ライン毎に入力された画像信号をブロックデー 夕に変換し、 所定画素サイズのブロックを形成する必要がある。 1 6画 素 X 1 6ラインでブロックを形成する場合、 あるフレームの第 2フィ一 ルドの最初の 8ラインのデ一夕が入力されて、 当該フレームの最初のブ ロックが形成可能となる。 したがって、 入力ピクチャに対する正規化ァ クティビティ Nactjが求められるまでには、 第 1図 Cに示されるように, 入力ピクチャに対して、 少なくとも 1フィールド ( 0. 5フレーム) + 8ライン分のディ レイが発生する。
入力ピクチャに対する 0 · 5フィールド + 8ライン分のディ レイ後に、 第 (N— 1 ) ピクチャの平均アクティ ビティ avg_actが、 第 (N— 1 ) ピクチャの 1フレームすなわち第 1および第 2フィールドを用いて計算 される。 この第 (N— 1 ) ピクチャの平均アクティ ビティ avg_actを用 いて求められた正規化アクティ ビティ Nactjに基づき上述の式 ( 5 ) で 求められた量子化スケール mquantjが算出される。 この量子化スケール m quan により次の第 Nピクチヤの量子化が行われ、 出力ピクチャが生成 される (第 1図 D) 。
ここで、 入力ピクチャにおいて、 第 Nピクチヤから第 (N+ 1 ) ピク チヤに移行する際にシーンチェンジが発生した場合について考える。 こ の場合、 第 1図 Dに示されるように、 シーンチェンジ後の入力ピクチャ である第 (N+ 1 ) ピクチャは、 シーンチェンジ前の出力ピクチャ (第 Nピクチャ) の平均アクティ ビティ avg_actにより求められた正規化ァ クティ ビティ Nactjに基づき得られた量子化スケール mquantjを用いて量 子化され、 出力ピクチャとされる。
このように、 上述の従来技術による方法では、 正規化アクティビティ Nactjを得る際に、 1つ前に符号化したフレームの平均ァクティ ビティ a vg— actを用いている。 フレーム間でのシーンチェンジなどのように、 フ レーム間の相関性が損なわれた場合に、 シーンチェンジ前のフレームか ら求めた平均ァクティ ビティ avg_actを用いてシーンチェンジ後のフレ ームのアクティビティを正規化すると、 シーンチェンジ後のフレームを 正規化するために用いられた平均ァクティビティ avg_actは、 シーンチ ェンジ後のフレームの平均ァクティ ビティ avg_actとしては間違った値 となってしまう。 そのため、 シーンチェンジ後のフレームでは、 ァクテ ィビティの正規化を最適に行えず、 却って画質の劣化を生じてしまうと いう問題点があった。
したがって、 この発明の目的は、 1フレーム内の発生符号量を制御す る際に、 適応量子化を用いて画質の最適化を行う場合に、 フレーム間で シーンチェンジが発生しても正確に適応量子化を行うことができる画像 処理装置、 画像処理方法、 画像処理プログラムおよび記録媒体を提供す ることにある。 発明の開示
この発明は、 上述した課題を解決するために、 画像データの第 1フィ ールドから平均アクティビティを算出する平均ァクティビティ算出手段 と、 平均ァクティビティ算出手段により第 1フィールドから算出された 平均アクティビティを、 第 1フィールドと、 第 1フレームと同一フレー ムの第 2フィールドとに適用して正規化ァクティビティを算出する正規 化アクティビティ算出手段と、 正規化アクティビティ算出手段により算 出された正規化ァクティビティを用いて第 1フィールドおよび第 2フィ —ルドを量子化する量子化手段とを有することを特徴とする画像処理装 置である。
また、 この発明は、 画像デ一夕の第 1フィールドから平均ァクテイビ ティを算出する平均アクティビティ算出のステップと、 平均ァクテイビ ティ算出のステップにより第 1フィールドから算出された平均ァクティ ビティを、 第 1フィールドと、 第 1フレームと同一フレームの第 2フィ 一ルドとに適用して正規化ァクティビティを算出する正規化ァクティビ ティ算出のステップと、 正規化ァクティビティ算出のステップにより算 出された正規化ァクティビティを用いて第 1フィールドおよび第 2フィ ールドを量子化する量子化のステツプとを有することを特徴とする画像 処理方法である。
また、 この発明は、 画像データを量子化する画像処理方法をコンビュ 一夕装置に実行させる画像処理プログラムにおいて、 画像処理方法は、 画像デ一夕の第 1フィールドから平均ァクティビティを算出する平均ァ クテイビティ算出のステップと、 平均アクティビティ算出のステップに より第 1フィールドから算出された平均アクティビティを、 第 1フィー ルドと、 第 1フレームと同一フレームの第 2フィールドとに適用して正 規化ァクティビティを算出する正規化ァクティビティ算出のステップと、 正規化ァクティビティ算出のステップにより算出された正規化ァクティ ビティを用いて第 1フィールドおよび第 2フィールドを量子化する量子 化のステップとを有することを特徴とする画像処理プログラムである。
また、 この発明は、 画像データを量子化する画像処理方法をコンビュ 一夕装置に実行させる画像処理プログラムが記録された記録媒体におい て、 画像処理方法は、 入力された画像データの第 1フィールドから平均 アクティビティを算出する平均アクティビティ算出のステップと、 平均 アクティビティ算出のステップにより第 1フィールドから算出された平 均アクティビティを、 第 1フィールドと、 第 1フレームと同一フレーム の第 2フィールドとに適用して正規化ァクティビティを算出する正規化 アクティビティ算出のステップと、 正規化ァクティビティ算出のステツ プにより算出された正規化ァクティビティを用いて第 1フィールドおよ び第 2フィールドを量子化する量子化のステップとを有することを特徴 とする記録媒体である。
上述したように、 この発明は、 画像データの第 1フィールドから算出 された平均ァクティビティが第 1フィールドと、 第 1フレームと同一フ レームの第 2フィールドとに適用されて算出された正規化ァクティビテ ィを用いて第 1フィールドおよび第 2フィールドを量子化するようにし ているため、 1フレームの画像データの量子化を、 自分自身の画像デ一 夕に基づく正規化ァクティビティを用いて、 小さいシステムディレイで 行うことができる。 図面の簡単な説明
第 1図 A、 第 1図 B、 第 1図 Cおよび第 1図 Dは、 従来技術により正 規化ァクティビティ Nac を求める場合の一例の処理を示すタイムチヤ ート、 第 2図 A、 第 2図 B、 第 2図(:、 第 2図 D、 第 2図 Eおよび第 2 図 Fは、 この発明の実施の第 1の形態により正規化ァクティビティ Nac t )を求める場合の一例の処理を示すタイムチャート、 第 3図 A、 第 3図 B、 第 3図 C、 第 3図 D、 第 3図 Eおよび第 3図 Fは、 正規化を行なう フレームの平均ァクティビティ avg_ac tを予め算出して当該フレームの アクティビティを正規化する場合の一例の処理を示すタイムチャート、 第 4図 Aおよび第 4図 Bは、 この発明の実施の一形態が適用されたディ ジタル V T Rの一例の構成を示すブロック図、 第 5図 A、 第 5図 Bおよ び第 5図 Cは、 M P E Gエンコーダの一例の構成をより具体的に示すブ ロック図、 第 6図 A、 第 6図 Bおよび第 6図 Cは、 M P E Gエンコーダ の各部において転送されるストリ一ムの構成例を示す略線図、 第 7図 A, 第 7図 Bおよび第 7図 Cは、 M P E Gエンコーダの各部において転送さ れるストリームの構成例を示す略線図、 第 8図 Aおよび第 8図 Bは、 M P E Gエンコーダの各部において転送されるストリームの構成例を示す 略線図、 第 9図 Aおよび第 9図 Bは、 M P E Gエンコーダの各部におい て転送されるストリームの構成例を示す略線図、 第 1 0図 A、 第 1 0図 Bおよび第 1 0図 Cは、 M P E Gエンコーダの各部において転送される ストリームの構成例を示す略線図、 第 1 1図 A、 第 1 1図 Bおよび第 1 1図 Cは、 M P E Gエンコーダの各部において転送されるストリームの 構成例を示す略線図、 第 1 2図は、 M P E Gエンコーダの各部において 転送されるストリームの構成例を示す略線図、 第 1 3図は、 M P E Gェ ンコーダの処理をソフトウエアで行う場合の一例のフローチヤ一ト、 第 1 4図は、 この発明の実施の一形態でァクティビティを算出する場合の ブロック化を説明するための図である。 発明を実施するための最良の形態
以下、 この発明について、 図面を参照しながら説明する。 この発明で は、 あるフレームの正規化アクティビティ Nac t jを、 当該フレームの第 1フィールドの画像デ一夕から求めた平均ァクティビティ avg_ac tを用 いて算出するようにしている。 なお、 この発明の実施の一形態において も、 平均ァクティビティ avg_ac tおよび正規化ァクティビティ Nac t jは、 従来の技術で式 ( 1 ) 〜式 (5 ) を用いて既に説明した方法に基づき算 出することができる。
第 2図 A、 第 2図 B、 第 2図 C、 第 2図 D、 第 2図 Eおよび第 2図 F は、 この発明の実施の第 1の形態により正規化ァクティビティ Nac t jを 求める場合の一例の処理を示す。 第 2図 Aは、 フレーム信号であり、 一 組のローおよびハイで 1フレームが示される。 第 2図 Bは、 入力される ピクチャを示す。 1ピクチャが 1フレームに対応する。 イン夕レース走 査では、 1フレームが前半の第 1フィールドおよび後半の第 2フィ一ル ドの 2フィールドからなる。 ここでは、 第 Nピクチヤに対する処理につ いて考える。 また、 1 6画素 X 1 6ラインのマクロブロック単位で、 平 均アクティビティ avg_ac tが算出されるものとする。
第 1フィールドのデータだけを用いて計算を行うため、 第 1フィ一ル ドの最初の 8ラインが入力されバッファに溜め込まれた時点でマクロブ ロックの第 1フィ一ルド分の最初のデータが得られ、 平均ァクティビテ ィ avg— actの計算を開始することができる。 したがって、 第 Nピクチヤ が入力されてから計算開始までのディ レイは、 第 2図 Cに示されるよう に、 最小で 8ライン分となる。
第 Nピクチャの第 1フィールドのデータが全て入力され、 当該第 1フ ィ一ルドの平均アクティ ビティ avg_actが算出されると、 算出結果が第 1および第 2フィールドに適用され、 第 Nピクチャの正規化ァクティ ビ ティ Nactjが求められる (第 2図 E) 。 この正規化アクティビティ Nactj と、 後述する方法により別途に求められた量子化スケール Qjにより上 述した式 ( 5) の演算が行われ、 視覚特性を考慮した量子化スケール mq auntjが算出される。 この量子化スケール mqauntjにより、 当該第 Nピク チヤが量子化される。
第 Nピクチヤの正規化ァクティ ビティ Nactjが第 Nピクチヤの第 1 フ ィールドの平均ァクティ ビティ avg_actだけから求められているので、 第 Nピクチヤが入力されてから、 視覚特性を考慮した量子化スケール mq auntjにより第 Nピクチヤの適応量子化が行われるまでのディ レイは、 第 2図 Fに示されるように、 0. 5フレーム + αとなる。
ここで、 入力ピクチャにおいて、 第 Νピクチヤから第 (N+ 1 ) ピク チャに移行する際にシーンチェンジが発生したことを考える。 この発明 によれば、 上述のように、 第 Νピクチヤ自身の第 1フィールドから算出 された平均アクティ ビティ avg_actを用いて、 第 Nピクチヤの正規化ァ クテイ ビティ Nactjが求められる。 つまり、 この発明では、 従来技術で 説明したように、 正規化ァクティ ビティ Nactjを求める際に前のフレー ムの平均ァクティ ビティを用いないため、 フレーム間でシーンチェンジ があった場合にも、 適正に正規化ァクティ ビティ Nactjを算出すること ができる。 これにより、 シーンチェンジ直後の画質の劣化を防止できる < したがって、 例えばフレーム単位で編集を行なうような場合にも、 良好 な画質を得ることができる。
なお、 正規化を行なうフレームの平均ァクティビティ avg_ac tを予め 算出し、 これに基づいて当該フレームのァクティビティを正規化すると いう方法も考えられる。 この方法によれば、 フレーム間のシーンチェン ジにかかわらず、 最適な平均アクティビティ avg— ac tを用いてァクティ ビティの正規化を行なうことが可能となる。
第 3図 A、 第 3図 B、 第 3図 C、 第 3図 D、 第 3図 Eおよび第 3図 F は、 この正規化を行なうフレームの平均ァクティビティ avg— ac tを予め 算出して当該フレームのアクティビティを正規化する場合の一例の処理 を示す。 ここで、 第 3図 Aおよび第 3図 Bは、 上述の第 1図 Aおよび第 1図 Bと同一である。 この第 3図の例では、 第 3図 Dに示されるように. 量子化を行うピクチャ (例えば第 Nピクチヤ) のデータ全てが、 すなわ ち、 第 Nピクチヤの第 1および第 2フィールドがバッファに格納された ら、 バッファに格納されたデータを用いて当該ピクチャの平均ァクティ ビティ avg_ac tを算出している。
この場合でも、 当該ピクチャ (第 Nピクチャ) が入力されてから少な くとも 0 . 5フィールド + 8ライン分のディレイの後に、 平均ァクティ ビティ avg— ac tの計算が行われる (第 3図 Cおよび第 3図 D ) 。 そして, 求められた当該ピクチヤの平均ァクティビティ avg— ac tを用いて自分自 身の正規化アクティビティ Nac t jを求めている。
自分自身のデータに基づき計算された平均ァクティビティ avg_ac tを 用いて該ピクチャの正規化ァクティビティ Nac t jを求めるため、 例えば 第 Nピクチヤの直後にシーンチェンジが発生ししても、 適正な正規化ァ クテイビティ Nac t jを算出できる (第 3図 E ) 。
しかしながら、 この場合には、 当該ピクチャの第 1および第 2フィー ルド全てのデータを用いて平均ァクティビティ avg_ac tを計算した後、 当該ピクチャのアクティビティの正規化を開始することになるため、 平 均ァクティビティ avgjc tの計算から正規化までのディレイ (システム ディレイ) が大きくなつてしまう。
第 3図 A、 第 3図 B、 第 3図(:、 第 3図 D、 第 3図 Eおよび第 3図 F の例では、 第 Nピクチヤが入力されてから 0 . 5フレーム + 8ラインの ディレイの後に平均ァクティビティ avg_ac tの計算が開始される。 さら に、 第 Nピクチヤの第 1および第 2フィールド全ての平均ァクティビテ ィ avg_ac tが計算された後に、 アクティビティの正規化が行われるので, 少なくとも 1フレーム分のディレイが加算される。 すなわち、 全体のデ ィレイ量 (システムディレイ) は、 第 3図 Fに示されるように、 少なく とも 1 . 5フレーム + ひとなってしまう。
このようにシステムディレイが大きくなると、 例えばリアルタイム編 集などの用途には向いていないといえ、 特に放送局用の映像機器として 使用するには問題があると思われる。 また、 1ピクチャ分の平均ァクテ イビティ avg— ac tが計算された後に、 当該ピクチャの正規化が行われる ので、 当該ピクチャの第 1および第 2フィールドのデ一夕を保持するた めのバッファメモリも必要となり、 必要なバッファメモリの容量が増加 してしまう。
これに対し、 上述の第 2図 A、 第 2図 B、 第 2図 C、 第 2図 D、 第 2 図 Eおよび第 2図 Fを用いて説明したこの発明による方法では、 平均ァ クテイビティを第 1フィールドだけから求めているので、 正規化ァクテ イビティを算出するフレーム (2フィールド) 全体から平均ァクテイビ ティを算出する場合に比べて、 短い演算時間で実現でき、 システムディ レイを短縮できる。 したがって、 画像圧縮処理の時間を短縮でき、 V T Rやエンコーダなどの各種動作処理に対する時間的制約を軽減すること が可能となる。 なお、 VTR等におけるシーンチェンジは、 特別な編集処理を行なわ ない限り、 通常はフレーム単位で生じるものであるので、 各フレームの 第 1フィールドを用いて当該フレームを処理することで、 シーンチェン ジの影響を受けないようにし得るものである。
次に、 この発明の実施の一形態について説明する。 なお、 以下に説明 する実施の一形態は、 この発明の好適な具体例であり、 技術的に好まし い種々の限定が付されているが、 この発明の範囲は、 以下の説明におい て、 特に本発明を限定する旨の記載がない限り、 これらの態様に限定さ れないものとする。
第 4図 Aおよび第 4図 Bは、 この発明の実施の一形態が適用されたデ イジタル VTRの一例の構成を示す。 このディジタル VTRは、 MP E G方式により圧縮符号化されたディジ夕ルビデオ信号を記録媒体に直接 的に記録することができるようにしたものである。
先ず、 このディジ夕ル VTRにおける記録系の構成および処理動作に ついて説明する。 この記録系に外部より入力される信号は、 S D I (Ser ial Data Inter face)信号および S D T I (Serial Data Transport Inte rface)信号の 2種類のシリアルディジ夕ルイン夕ーフェイス信号、 アナ 口グインターフェイス信号および制御信号である外部基準信号 R E Fで ある。
なお、 S D Iは、 (4 : 2 : 2 ) コンポーネントビデオ信号とデイジ 夕ルオーディォ信号と付加的データとを伝送するために、 SMP TEに よって規定されたインターフェイスである。 また、 S DT Iは、 デイジ タルビデオ信号が MP E G方式で圧縮符号化されたストリームである M P E Gエレメン夕リストリーム (以下、 MP E G E Sと称する) が伝 送されるイン夕一フェイスである。 E Sは、 4 : 2 : 2のコンポーネン トであり、 また、 上述したように、 全て I ピクチャのストリームであり, 1 GO P = 1ピクチャの関係を有する。 S D T I — C P (Content Packa ge)のフォーマッ トでは、 MP EG E Sがアクセスユニッ トへ分離さ れ、 また、 フレーム単位のパケットにパッキングされている。 S DT I 一 C Pでは、 十分な伝送帯域 (クロックレートで 2 7 MHzまたは 3 6 M Hz、 ストリームビットレートで 2 7 0M bpsまたは 3 6 0 M bps) を使 用しており、 1フレーム期間で、 バースト的に E Sを送ることが可能で ある。
S D Iにより伝送される S D I信号は、 S D I入力部 1 0 1に入力さ れる。 また、 アナログビデオ信号からなるアナログ入力信号がアナログ 入力部 1 20に入力される。 アナログ入力部 1 2 0では、 入力されたァ ナログ入力信号をディジ夕ル信号に変換し、 例えば上述の SD I フォー マットにマッピングして出力する。 アナログ入力信号が変換され S D I フォーマットにマッピングされたこの S D I信号は、 S D I入力部 1 0 1に供給される。
S D I入力部 1 0 1では、 供給された S D I信号をシリアル信号から パラレル信号に変換して出力すると共に、 S D I信号に含まれる入力の 位相基準である入力同期信号を抽出し、 タイミングジェネレータ TG 1 0 2に出力する。
また、 SD I入力部 1 0 1は、 変換したパラレル信号からビデオ信号 とオーディオ信号とを分離する。 分離されたビデオ入力信号とオーディ ォ入力信号は、 それぞれ MP EGエンコーダ 1 0 3とディレイ回路 1 0 4に出力される。
タイミングジェネレータ TG 1 02は、 入力された外部基準信号 R E Fから基準同期信号を抽出する。 タイミングジェネレータ TGでは、 こ の基準同期信号と S D I入力部 1 0 1から供給された入力同期信号との うち、 所定に指定された基準信号に同期して、 このディジタル VTRで 必要なタイミング信号を生成し、 タイミングパルスとして各ブロックに 供給する。
MP EGエンコーダ 1 0 3は、 入力されたビデオ入力信号を、 DCT 変換して係数データに変換し、 係数データを量子化した後、 可変長符号 化する。 MP E Gエンコーダ 1 0 3から出力される可変長符号化 (VL C) データは、 MP E G 2に準拠したエレメンタリストリーム (E S) である。 この出力は、 記録側のマルチフォーマットコンバータ (以下、 記録側 MF Cと称する) 1 0 6の一方の入力端に供給される。
ディレイ回路 1 04は、 入力されたオーディオ入力信号を、 非圧縮デ 一夕のままで、 MP E Gエンコーダ 1 0 3でのビデオ信号に対する処理 のディレイに合わせるためのディレイラインの働きをするものである。 このディレイ回路 1 04で所定に遅延されたオーディォ信号は、 E C C エンコーダ 1 0 7に出力される。 これは、 この実施の一形態によるディ ジ夕ル VTRにおいて、 オーディォ信号が非圧縮信号として扱われるた めである。
外部から SDT Iにより伝送され供給された S DT I信号は、 S DT I入力部 1 0 5に入力される。 S DT I信号は、 S DT I入力部 1 0 5 で同期検出される。 そして、 バッファに一旦溜め込まれ、 エレメンタリ ストリームが抜き出される。 抜き出されたエレメン夕リストリームは、 記録側 MF C 1 0 6の他方の入力端に供給される。 同期検出されて得ら れた同期信号は、 上述したタイミングジェネレータ TG 1 02に供給さ れる (図示しない) 。
なお、 SDT I入力部 1 0 5では、 さらに、 入力された SDT I信号 からディジ夕ルオーディォ信号を抽出する。 抽出されたディジ夕ルオー ディォ信号は、 E C Cエンコーダ 1 0 7に供給される。
このように、 この実施の一形態によるディジタル VTRは、 SD I入 力部 1 0 1から入力されるベースバンドのビデオ信号と独立して、 MP EG E Sを直接的に入力することができる。
記録側 MF C回路 1 0 6は、 ストリームコンバータとセレクタとを有 し、 SD I入力部 1 0 1および SDT I入力部 1 0 5から供給された M P EG E Sのうち、 何れかが選択され、 選択された MP EG E Sの D C T係数を、 1マクロブロックを構成する複数の D C Τプロックを通 して周波数成分毎にまとめ、 まとめた周波数成分を低周波数成分から順 に並び替える。 MP EG E Sの係数が並べ替えられたストリームを、 以下、 変換エレメンタリス卜リームと称する。 このように MP EG E Sを再配置することにより、 サーチ再生時にもなるベく多くの D C係数 と低次の AC係数を拾い、 サーチ画の品位向上に貢献している。 変換ェ レメン夕リストリームは、 ECCエンコーダ 1 07に供給される。
E C Cエンコーダ 1 0 7は、 大容量のメインメモリが接続され (図示 しない) 、 パッキングおよびシャフリング部、 オーディオ用外符号ェン コーダ、 ビデオ用外符号エンコーダ、 内符号エンコーダ、 オーディオ用 シャフリング部およびビデオ用シャフリング部などを内蔵する。 また、 E C Cエンコーダ 1 0 9は、 シンクブロック単位で I Dを付加する回路 や、 同期信号を付加する回路を含む。 なお、 実施の第 1の形態では、 ビ デォ信号およびオーディォ信号に対するエラー訂正符号としては、 積符 号が使用される。 積符号は、 ビデオ信号またはオーディオ信号の 2次元 配列の縦方向に外符号の符号化を行い、 その横方向に内符号の符号化を 行い、 データシンポルを 2重に符号化するものである。 外符号および内 符号としては、 リードソロモンコード(Reed-Solomon code) を使用でき る。
E C Cエンコーダ 1 0 7には、 MF C回路 1 06から出力された変換 エレメンタリストリ一ムが供給されると共に、 0丁 1入カ部 1 0 5ぉ よびディ レイ回路 1 0 4から出力されたオーディォ信号が供給される。 E C Cエンコーダ 1 0 7では、 供給された変換エレメンタリストリーム 及びオーディォ信号に対してシャフリング及びエラ一訂正符号化を施し. シンクブロック毎に I Dおよび同期信号を付加し記録データとして出力 する。
E C Cエンコーダ 1 0 7から出力された記録データは、 記録アンプを 含むイコライザ E Q 1 0 8で記録 R F信号に変換される。 記録 R F信号 は、 回転ヘッ ドが所定に設けられた回転ドラム 1 0 9に供給され、 磁気 テープ 1 1 0上に記録される。 回転ドラム 1 0 9には、 実際には、 隣接 するトラックを形成するへッ ドのアジマスが互いに異なる複数の磁気へ ッ ドが取り付けられている。
記録デ一夕に対して必要に応じてスクランブル処理を行っても良い。 また、 記録時にディジタル変調を行っても良く、 さらに、 パーシャル, レスポンスクラス 4とビ夕ビ符号を使用しても良い。 なお、 イコライザ 1 0 8は、 記録側の構成と再生側の構成とを共に含む。
次に、 このディジタル V T Rにおける再生系の構成および処理動作に ついて説明する。 再生時には、 磁気テープ 1 1 0から回転ドラム 1 0 9 で再生された再生信号が再生アンプなどを含むィコライザ 1 0 8の再生 側の構成に供給される。 イコライザ 1 0 8では、 再生信号に対して、 等 化や波形整形などがなされる。 また、 ディジタル変調の復調、 ビ夕ビ復 号等が必要に応じてなされる。 イコライザ 1 0 8の出力は、 E C Cデコ —ダ 1 1 1に供給される。
E C Cデコーダ 1 1 1は、 上述した E C Cエンコーダ 1 0 7と逆の処 理を行うもので、 大容量のメインメモリと、 内符号デコーダ、 オーディ ォ用およびビデオ用それぞれのデシャフリング部ならびに外符号デコ一 ダを含む。 さらに、 E C Cデコーダ 1 1 1は、 ビデオ用として、 デシャ フリングおよびデパッキング部、 データ補間部を含む。 同様に、 オーデ ィォ用として、 オーディォ A U X分離部とデ一夕補間部を含む。
E C Cデコーダ 1 1 1では、 再生データに対して同期検出を行い、 シ ンクブロックの先頭に付加されている同期信号を検出してシンクブロッ クを切り出す。 再生データは、 シンクブロック毎の内符号のエラー訂正 がなされ、 その後、 シンクブロックに対して I D補間処理がなされる。 I Dが補間された再生デ一夕は、 ビデオデータとオーディォデ一夕とに 分離される。 ビデオデータおよびオーディオデータは、 それぞれデシャ フリング処理され、 記録時にシャフリングされたデータ順が元に戻され る。 デシャフリングされたデータは、 それぞれ外符号のエラー訂正が行 われる。
E C Cデコーダ 1 1 1において、 エラ一訂正能力を超え、 訂正できな いエラーがあるデ一夕に関しては、 エラーフラグがセットされる。 ここ で、 ビデオデータのエラ一に関しては、 エラ一を含むデータを指し示す 信号 E R Rが出力される。
エラー訂正された再生オーディォデ一夕は、 S D T I出力部 1 1 5に 供給されると共に、 ディレイ回路 1 1 4で所定の遅延を与えられて S D I出力部 1 1 6に供給される。 ディレイ回路 1 1 4は、 後述する M P E Gデコーダ 1 1 3でのビデオデータの処理による遅延を吸収するために 設けられる。
一方、 エラ一訂正されたビデオデータは、 再生変換エレメン夕リスト リームとして再生側 M F C回路 1 1 2に供給される。 上述した信号 E R Rも、 再生側 M F C回路 1 1 2に供給される。 再生側 M F C 1 1 2は、 上述した記録側 M F C 1 0 6と逆の処理を行うものであって、 ストリ一 ムコンバータを含む。 ストリームコンバータでは、 記録側のストリーム コンバータと逆の処理がなされる。 すなわち、 D C Tブロックに跨がつ て周波数成分毎に並べられていた D C T係数を、 D CTブロック毎に並 び替える。 これにより、 再生信号が MP E G 2に準拠したエレメンタリ ストリームに変換される。 このとき、 E C Cデコーダ 1 1 1から信号 E RRが供給された場合は、 対応するデータを MP EG 2に完全に準拠す る信号に置き換えて出力する。
再生側 MF C回路 1 1 2から出力された MP E G E Sは、 MP E G デコーダ 1 1 3および S DT I出力部 1 1 5に供給される。 MP E Gデ コーダ 1 1 3は、 供給された MP E G E Sを復号し、 非圧縮の元のビ デォ信号に戻す。 すなわち、 MP E Gデコーダ 1 1 3は、 供給された M P E G E Sに対して逆量子化処理と、 逆 D CT処理とを施す。 復号さ れたビデオ信号は、 S D I出力部 1 1 6に供給される。
上述したように、 50 1出カ部 1 1 6には、 E C Cデコーダ 1 1 1で ビデオデータと分離されたオーディオデータがディレイ 1 1 4を介して 供給されている。 30 1出カ部 1 1 6では、 供給されたビデオデータと オーディオデータとを、 S D Iのフォーマットにマッピングし、 S D I フォーマツトのデータ構造を有する S D I信号へ変換される。 この S D I信号が外部に出力される。
一方、 S DT I出力部 1 1 5には、 上述したように、 E C Cデコーダ 1 1 1でビデオデータと分離されたオーディオデータが供給されている' S DT I出力部 1 1 5では、 供給された、 エレメン夕リストリームとし てのビデオデータと、 オーディオデータとを S D T I のフォーマツ卜に マッピングし、 S DT I フォーマツ 卜のデータ構造を有する S DT I信 号へ変換されるこの S DT I信号が外部に出力される。
なお、 システムコントローラ 1 1 7 (第 4図 Aおよび第 4図 B中では, シスコン 1 1 7と略記) は、 例えばマイクロコンピュータからなり、 信 号 S Y I〇により各ブロックと通信を行うことにより、 このディジ夕 ル VT Rの全体の動作を制御する。 サーポ 1 1 8は、 信号 SY— S Vに よりシステムコントローラ 1 1 7と互いに通信を行いながら、 信号 S V — I〇により、 磁気テープ 1 1 0の走行制御や回転ドラム 1 0 9の駆動 制御などを行う。
第 5図 A、 第 5図 Bおよび第 5図 Cは、 上述した MP E Gエンコーダ 1 0 3の一例の構成を、 より具体的に示す。 また、 第 5図 A、 第 5図 B および第 5図 Cの各部において転送されるストリームの構成例を、 第 6 図 A、 第 6図 Bおよび第 6図 C、 第 7図 A、 第 7図 Bおよび第 7図 C、 第 8図 Aおよび第 8図 B、 第 9図 Aおよび第 9図 B、 第 1 0図 A、 第 1 0図 Bおよび第 1 0図 C、 第 1 1図 A、 第 1 1図 Bおよび第 1 1図 C、 ならびに、 第 1 2図にそれぞれ示す。
MP EGエンコーダ 1 0 3は、 入カフィ一ルドアクティビティ平均化 処理部 1 0 3 A、 プリエンコード処理部 1 0 3 Bおよびェンコ一ド部 1 0 3 Cからなる。 入力フィールドァクティビティ平均化処理部 1 0 3 A では、 入力されたビデオデータのアクティビティの平均値が求められて プリェンコ一ド処理部 1 03 Bに渡される。 プリェンコ一ド処理部 1 0 3 Bでは、 このアクティビティの平均値を用いて入力ビデオデ一夕の量 子化による発生符号量が見積もられる。 この見積もり結果に基づき、 ェ ンコード部 1 0 3 Cにおいて、 符号量制御しながら入力ビデオデータに 対する実際の量子化が行われ、 量子化されたビデオデータに対しさらに 可変長符号化がなされ、 MP EG E Sとされて出力される。
なお、 タイミングジェネレータ TG 2 2 0は、 例えば第 4図 Aおよび 第 4図 Bのタイミングジェネレータ TG 1 0 3から供給された水平同期 信号 HD、 垂直同期信号 VDおよびフィールド同期信号 F LDに基づき, MP EGエンコーダ 1 0 3内で必要とされるタイミング信号を生成し出 力する。 また、 C PU I /Fブロック 2 2 1は、 第 4図 Aおよび第 4 図 Bのシステムコントローラ 1 1 7とのインターフェイスであり、 C P U I Z Fブロック 2 2 1を介してやりとりされた制御信号やデータに より、 M P E Gエンコーダ 1 0 3における動作が制御される。
先ず、 入力フィールドァクティビティ平均化処理部 1 0 3 Aの処理に ついて説明する。 S D I入力部 1 0 1から出力され M P E Gエンコーダ 1 0 3に入力されたビデオデータは、 入力部 2 0 1に供給され、 メイン メモリ 2 0 3に格納するのに適したィン夕一フェイスに変換されると共 に、 パリティチェックがなされる。 入力部 2 0 1から出力されたビデオ データは、 ヘッダ作成部 2 0 2に供給され、 垂直ブランキング区間など を禾 ij用して M P E Gに ける、 s equence—heade r 、 quan t i zer— ma t r i x' gop_header などの各ヘッダが抽出される。 抽出された各ヘッダは、 メ インメモリ 2 0 3に格納される。 これらのヘッダは、 主に、 C P U I Fブロック 2 2 1から指定される。 また、 ヘッダ作成部 2 0 2におい て、 垂直ブランキング区間以外では、 入力部 2 0 1から供給されたビデ ォデータがメインメモリ 2 0 3に格納される。
メインメモリ 2 0 3は、 画像のフレームメモリであり、 ビデオデータ の再配列やシステムディ レイの吸収などが行われる。 ビデオデータの再 配列は、 例えば図示されないァドレスコントローラによりメインメモリ 2 0 3からの読み出しァドレスを制御されることによりなされる。 なお, 図中、 メインメモリ 2 0 3のブロック中に記載される 8ライン、 0 . 5 フレームおよび 1 フレームは、 ディ レイ値であり、 メインメモリ 2 0 3 からのリードタイミングが示される。 これらは、 タイミングジエネレー 夕 T G 2 2 0の指令に基づき適切に制御される。
ラス夕スキャンノブロックスキャン変換部 2 0 4は、 ライン毎にメイ ンメモリ 2 0 3に格納されたビデオデータを、 M P E Gで扱うマクロブ ロック毎に切り出して後段のァクティビティ部 2 0 5に送る。 この実施 の一形態では、 上述したように、 第 1フィールドだけを用いてァクティ ビティの計算を行うため、 ラス夕スキャンノブロックスキヤン変換部 2 0 4から出力されるマクロブロックは、 第 1フィールド分のビデオデー タにより構成される。
ラスタスキャン Zブロックスキャン変換部 2 0 4から出力データとし て出力されたストリームは、 第 6図 Aに一例が示されるように、 垂直お よび水平方向のマクロプロックのァドレス情報が先頭に配され、 所定サ ィズの空き領域の後ろに、 1マクロブロック分の画像データが格納され る。
なお、 ストリームは、 例えば 8ビットを 1ワードとして、 5 7 6ヮー ドのデ一夕長を有し、 後半の 5 1 2ワード (デ一夕部と称する) が 1マ クロブロック分の画像データを格納する領域に割り当てられている。 前 半の 6 4ワード (ヘッダ部と称する) は、 先頭に上述のマクロブロック のアドレス情報が格納され、 その他の部分は、 後段の各部にて埋め込ま れるデ一夕やフラグなどのため空き領域とされる。
M P E Gで扱うマクロブロックは、 1 6画素 X 1 6ラインのマトリク スである。 一方、 この M P E Gエンコーダ 1 0 3では、 第 3図 A、 第 3 図 B、 第 3図 C、 第 3図 D、 第 3図 Eおよび第 3図 Fを用いて上述した ように、 第 1フィールドだけによるアクティビティを求める処理を行う < そのため、 第 1フィールドの 8ラインまでがメインメモリ 2 0 3に格納 された時点で処理を開始することができる。 なお、 実際には、 タイミン グジェネレータ T G 2 2 0からの指令にて処理が適切に開始される。
アクティビティ部 2 0 5は、 マクロブロック毎のアクティビティを計 算する。 この M P E Gエンコーダ 1 0 3においては、 第 1フィールドだ けからアクティビティが計算され、 その計算結果がフィールドァクティ ビティ信号 f i e l d ac tとして出力される。 信号 f i e l d ac tは、 平均化部 2 0 6に供給され、 1フィールド分が積算され、 その平均値 avg_ac tが求 められる。 平均値 avg_ac tは、 後述するプリエンコード処理部 1 0 3 B のアクティビティ部 2 0 9に供給される。 アクティビティ部 2 0 9では, 第 1および第 2フィ一ルドの平均値 avg— ac tを共に用いてプリェンコ一 ド処理が行われる。
したがって、 第 1フィ一ルドにおけるァクティ ビティの平均値 avg_ac tが判明した後、 その平均値を用いて、 適応量子化を考慮したプリェン コード処理を行うことが可能となる。
次に、 プリエンコード処理部 1 0 3 Bについて説明する。 ラスタスキ ヤン ブロックスキャン変換部 2 0 7 Aは、 上述したラスタスキャンノ ブロックスキャン変換部 2 0 4と基本的には同様の処理を行う。 但し、 このラスタスキャン Zブロックスキャン変換部 2 0 7 Aは、 符号量の見 積もりを行うプリェンコ一ド処理のために行われるため、 第 1フィール ドおよび第 2フィールドのビデオデ一夕が共に必要とされる。 そのため. ラス夕スキャン Zブロックスキャン変換部 2 0 7 Aでは、 第 2フィール ドの 8ラインまでがメインメモリ 2 0 3に格納された時点で、 M P E G で扱う 1 6画素 x l 6ラインのサイズのマクロブロックを構成すること が可能となり、 この時点で処理を開始することができる。 なお、 実際に は、 タイミングジェネレータ T G 2 2 0からの指令によって、 処理が適 切に開始される。
ラス夕スキャンノブロックスキャン変換部 2 0 7 Aから出力されたビ デォデ一夕は、 D C Tモード部 2 0 8に供給される。 D C Tモード部 2 0 8は、 フィールド D C T符号化モードおよびフレーム D C T符号化モ 一ドの何れを用いて符号化するかを決める。
ここでは、 実際に符号化するのではなく、 垂直方向に隣接した画素間 差分値の絶対値和をフィールド D C T符号化モードで計算したものと、 フレーム D C T符号化モードで計算したものとが比較され、 その値が小 さい符号化モードが選択される。 選択結果は、 D CTモードタイプデー 夕 dct_typとしてス卜リーム中に一時的にフラグとして挿入され、 後段 に伝えられる。 D C Tモードタイプデータ dct— typは、 第 6図 Bに示さ れるように、 ヘッダ部中の空き領域の後端側に格納される。
アクティビティ部 2 0 9は、 上述したアクティビティ部 2 0 5と、 基 本的には同様の処理を行う。 ただし、 このアクティビティ部 2 0 9では、 上述のように、 プリエンコード処理を行うためのもので、 第 1フィール ドおよび第 2フィールドのデータが共に用いられて、 マクロブロック毎 のアクティビティが計算される。 アクティビティ部 2 0 9により、 先ず, アクティビティ actが求められ、 第 6図 Cに示されるように、 ヘッダ部 のマクロブロックアドレスに続けて格納される。 次に、 このァクテイビ ティ actと上述した平均化部 2 0 6から得られるフィールドアクテイビ ティの平均値 avg_actとを用いて、 正規化ァクティビティ Nactが求めら れる。
正規化ァクティビティ Nactは、 正規化ァクティビティデータ norm— act として、 第 7図 Aに示されるように、 ストリーム中のヘッダ部に一時的 にフラグとして挿入され、 後段に伝えられる。 なお、 上述のァクテイビ ティ actは、 ストリーム中で、 正規化アクティビティデータ norm— actに 上書きされる。
アクティビティ部 2 0 9の出力は、 D CT部 2 1 0 Aに供給される。 D C T部 2 1 0 Aでは、 供給されたマクロブロックを 8画素 X 8画素か らなる D C Tブロックに分割し、 D C Tブロックに対して 2次元 D C T が行われ、 D CT係数が生成される。 D CT係数は、 第 7図 Bに示され るように、 ストリームのデ一夕部に格納され、 量子化テーブル部 2 1 1 Aに供給される。 量子化テーブル部 2 1 1 Aでは、 DCT部 2 1 O Aで変換された DC T係数に対して量子化マトリクス(quantizer— matrix)による量子化が行 われる。 量子化テーブル部 2 1 1 Aで量子化された DC T係数は、 第 7 図 Cに示されるように、 ストリームのデータ部に格納され、 出力される c 量子化テーブル部 2 1 1 Aの出力は、 複数の Q— n (量子化) 部 2 1 2, 2 1 2、 · · · 、 VL C部 2 1 3、 2 1 3、 · · ·、 積算部∑ 2 14、 2 1 4、 · · ·、 ならびに、 積算部∑ 2 1 5、 2 1 5、 · · · とからな る多段階の量子化部に供給される。 量子化テーブル部 2 1 1 Aで量子化 された D CT係数は、 この多段階ステップの量子化部で多段階に量子化 される。
DCT係数は、 Q— n部 2 1 2、 2 1 2、 · · · において、 それぞれ 異なった量子化スケール(quant izer_scale) Qを用いて量子化される。 なお、 量子化スケール Qの値は、 例えば MP E G 2の規格によって予め 決められており、 Q— n部 2 1 2、 2 1 2、 · · · は、 この規格に基づ き、 例えば 3 1個の量子化器で構成される。 このとき、 n = 3 1であつ て、 Q— n部 2 1 2、 2 1 2、 · · ' は、 Q— 1部、 Q— 2部、 · · ·, Q— 3 1部である。 そして、 各量子化器がそれぞれに割り振られた量子 化スケール Qnを用いて、 D CT係数の量子化が合計で 3 1ステップ、 行われる。 以下では、 Q_n部 2 1 2、 2 1 2、 · · · のそれぞれに対 応する量子化スケール値を量子化スケール Qn値とする。
Q— n部 2 1 2、 2 1 2、 · · · において、 それぞれの量子化スケー ル Q n値により量子化が行われる。 このとき、 上述のアクティビティ部 2 0 9で得られた正規化ァクティビティデータ norm— actを用いて次の式 (6) により求めた、 視覚特性を考慮した量子化スケールである mqaunt により適応量子化が行われる。
mqaunt = Q n xnorm act · · · ( 6 Q— n部 2 1 2、 2 1 2、 · · · において適応量子化された、 量子化 スケール Q n毎の D C T係数は、 それぞれ第 8図 Aに示されるようにス トリーム中のデータ部に格納され、 VL C部 2 1 3、 2 1 3、 · · · に それぞれ供給される。 量子化スケール Qn毎の DCT係数は、 VL C部 2 1 3、 2 1 3、 · · ' において、 ジグザグスキャンなどのスキヤニン グが施され、 2次元ハフマンコードなどに基づく VL Cテーブルが参照 されてそれぞれ可変長符号化される。
VL C部 2 1 3、 2 1 3、 · · ·で可変長符号化されたデータは、 第 8図 Bに示されるようにストリーム中のデータ部に格納され、 それぞれ 出力される。 VL C部 2 1 3、 2 1 3、 · · · の出力は、 それぞれ対応 する積算部∑ 2 1 4、 2 1 4、 · · · に供給される。
積算部∑ 2 14、 2 14、 · · ·では、 それぞれマクロブロック毎に 発生符号量が積算される。 上述のように 3 1種類の量子化器を用いる場 合には、 それぞれに対応する 3 1種類の発生符号量がマクロブロック毎 に得られることになる。 マクロブロック毎の発生符号量は、 第 9図 Aに 示されるように、 積算部∑ 2 14、 2 1 4、 · · · において積算された 発生符号量がストリーム中のヘッダ部に、 各々格納される。 すなわち、 Q_ 1部 2 1 2〜Q— n部 2 1 2のそれぞれの量子化による発生符号量 が、 マクロブロック毎に、 ストリームのヘッダ部に格納される。 なお、 ストリームのデータ部は、 削除される。 このマクロブロック毎のストリ ームは、 メインメモリ 20 3に供給される。
また、 積算部∑ 2 14、 2 14、 · · ·から出力されたマクロブロッ ク毎の発生符号量は、 それぞれ積算部∑ 2 1 5、 2 1 5、 · · · に供給 される。 積算部∑ 2 1 5、 2 1 5、 · · · は、 上述した視覚特性を考慮 した quantizer_scale ( = mquant) で量子化した場合のマクロブロック 毎の発生符号量に対応する符号量を、 積算部∑ 2 14で求めたマクロブ ロック毎の発生符号量の中から選択し、 それを 1フレーム分積算する。 積算部∑ 2 1 5、 2 1 5、 · · ·で量子化スケール Q n毎にそれぞれ
1フレーム分積算された値は、 そのフレームにおける発生符号量 (フレ ームデ一夕レート) とされて、 第 9図 Bに示されるように、 nワードの ストリームとして後述するレートコントロール部 2 1 7に供給される。 なお、 上述のように 3 1種類の量子化器を用いる場合には、 それぞれに 対応する 3 1種類の発生符号量がフレーム毎に得られることになる。
発生符号量を求める方法を、 より具体的に説明する。 例えば、 「Q—
4部 2 1 2による発生符号量」 は、 次のようにして求められる。
例えば、
norm_ac t [1」 =1.3
norm— ac t [2] =1.5
norm— act [3] =0· 8
norm— act [4] =1.0 である場合、
mqaunt [l]=4xl.3 = 5.2
: Q— 5部 2 1 2による発生符号量を、 第 9図 Aのヘッダ部から求める, mqaunt [2]=4xl.5=6.0
: Q— 6部 2 1 2による発生符号量を、 第 9図 Aのヘッダ部から求める, mqaunt [3]=4x0.8=3.2
: Q— 3部 2 1 2による発生符号量を、 第 9図 Aのヘッダ部から求める < mqaunt [4]=4xl.0=4.0
: Q— 4部 2 1 2による発生符号量を、 第 9図 Aのヘッダ部から求める, 以上を、 1フレーム分、 積算する。 これを、 Q— 1部 2 1 2〜Q n部 2 1 2に対してそれぞれ行い、 1フレーム分の発生符号量を求める。
次に、 エンコード処理部 1 0 3 Cについて説明する。 エンコード処理 部 1 0 3 Cでは、 最終的なエンコード処理が行われる。 上述したように、 プリエンコード処理部 1 0 3 Bにおいて、 様々な量子化を行った場合の 1フレーム分の発生符号量が見積もられる。 エンコード処理部 1 0 3 C では、 この 1フレーム分で見積もられた発生符号量に基づき、 予め設定 された目標発生符号量を絶対に超えないようにエンコードが行われ、 M P E G E Sが出力される。
エンコード処理部 1 0 3 Cで用いられるデータは、 既にメインメモリ 2 0 3に格納されているが、 上述したように、 プリエンコード処理部 1 0 3 Bにより様々な量子化を行った場合の 1フレームにおける発生符号 量が見積もられた時点で処理を開始することができる。 エンコード処理 部 1 0 3 Cの各部における処理は、 上述と同様に、 タイミングジエネレ 一夕 T G 2 2 0からの指令に基づき適切に開始される。
メインメモリ 2 0 3から読み出されたビデオデータは、 ラスタスキヤ ンノブロックスキャン変換部 2 0 7 Bにおいて、 上述のラス夕スキャン ノブロックスキヤン変換部 2 0 7 Aと同様の処理をされて 1 6画素 X 1 6ラインのマクロブロックが切り出される。 切り出されたマクロブロッ クは、 第 1 0図 Aに示されるように、 上述した第 9図 Aに示されるへッ ダ部に対応するデータ部に格納され、 D C Tモード部 2 1 6に供給され る。
D C Tモード部 2 1 6では、 上述の D C Tモード部 2 0 8と同様に、 フィールド D C T符号化モードおよびフレーム D C T符号化モードのう ち何れを用いて符号化するかが決められる。 このとき、 既に D C Tモー ド部 2 0 8において符号化モードが決められ、 その結果が D C Tタイプ データ dc t t ypとしてストリーム中に一時的に挿入されている (第 1 0 図 A参照) 。 D C Tモード部 2 1 6では、 ストリームからこの D C Τ夕 ィプデータ dct— typを検出し、 検出された D C Tタイプデータ dct— typに 基づきフィールド符号化モードおよびフレーム符号化モードを切り換え る。 D C Tモード部 2 1 6の出力を第 1 0図 Bに示す。
D CTモード部 2 1 6から出力されたマクロブロックは、 DCT部 2
1 0 Bに供給され、 上述の D C T部 2 1 O Aと同様にして 8画素 X 8画 素の DCTブロック単位で 2次元 D CTされる。 2次元 DCTされた D
CT係数は、 第 1 0図 Cに示されるように、 ストリ一ム中のデータ部に 格納されて、 D C T部 2 1 0 Bから出力される。
量子化テーブル部 2 1 1 Bは、 上述の量子化テーブル部 2 1 1 Aと同 様に構成することができ、 DCT部 2 1 0 Bで変換された DC T係数に 対して量子化マトリクスによる量子化が行われる。 量子化テーブル部 2
1 1 Bで量子化された DC T係数は、 第 1 1図 Aに示されるように、 ス トリーム中のデ一夕部に格納されてレートコントロール部 2 1 7に供給 される。
レートコントロール部 2 1 7では、 上述したプリエンコード処理部 1 03 Bにおいて積算部∑ 2 1 5、 2 1 5、 · · ·で得られた、 各量子化 スケール Q n毎のフレームデータレー卜の中から、 システムコント口一 ラ 1 1 7により設定される 1フレーム当たりの最大発生符号量を超えな いもので、 且つ、 最も設定値に近いものが選択される。 そして、 選択さ れたフレームデータレートに対応する量子化器において用いられたマク ロブロック毎の量子化スケール(mquant)が、 ストリーム中に挿入された 正規化ァクティビティデータ norm_actから再度求められ、 量子化部 2 1 8に供給される。
マクロブロック毎の量子化スケールは、 第 1 1図 Bに示されるように. ストリーム中のへッダ部の後端側に qauntiser sea 1 eとして格納され、 量子化部 2 1 8に伝えられる。
なお、 1フレーム当たりの最大発生符号量は、 例えばシステムコント ローラ 1 1 7により設定され、 C PU I ZF 2 2 1を介してレートコ ントロール部 2 1 7に伝えられる。
また、 この際、 システムコントローラ 1 1 7で設定され C P U I / F 2 2 1を介して伝えられる、 1フレームあたりの最大発生符号量と、 上述したストリーム中に挿入された正規化ァクティビテイデー夕 norm_a ctから求められたマクロブロック毎の量子化スケール(mqaunt)による発 生符号量との差分を超えない範囲で、 マクロブロック毎に量子化スケー ル(mquant)の値を 1サイズ小さくするようにできる。 これにより、 シス テムコントローラ 1 1 7で設定され C P U I 2 2 1を介して伝え られる 1フレーム当たりの最大発生符号量に近付け、 高画質を実現する ことが可能である。
量子化部 2 1 8では、 レートコントロール部 2 1 7により上述のよう にして指定される量子化スケール(Quantizes_scale)をストリーム中か ら取り出し、 取り出された量子化スケールに基づき量子化テーブル部 2 1 1 Bで量子化された D C T係数の量子化が行われる。 このとき、 レー トコントロール部 2 1 7から与えられる量子化スケールは、 正規化ァク ティビティデータ norm— actから求められた量子化スケール(mquant)の値 であるため、 視覚特性が考慮された適応量子化が行われることになる。 量子化部 2 1 8で量子化された D C T係数は、 第 1 1図 Cに示される ようにストリーム中のデータ部に格納され、 VL C部 2 1 9に供給され る。 量子化され VL C部 2 1 9に供給された D CT係数は、 ジグザグス キャンなどのスキャンエングが施され、 2次元ハフマンコードに基づく VL Cテーブルが参照されてそれぞれ可変長符号化される。 さらに、 可 変長符号に対して、 バイ ト単位で整列するようにビットシフ卜が施され, MP EG E Sとされて出力される。
このとき、 ¥1 (:部2 1 9までストリームの前半部を構成していたへ ッダ部が第 1 2図に示されるようにスライス層以下の MP EGのヘッダ 情報が格納される MP EGのヘッダ部にすげ替えられて出力される。 可 変長符号は、 ストリームの後半側のデータ部に格納される。
なお、 上述では、 MP E Gエンコーダ 1 0 3における処理がハードウ エアにより行われるように説明したが、 これはこの例に限定されない。 MP EGエンコーダ 1 0 3の処理は、 ソフトウエアによっても同様に実 現可能なものである。 例えば、 コンピュータ装置にビデオ信号のアナ口 グおよびディジタルの入力インタ一フェイスを設け、 コンピュータ上に 搭載されたソフトウエアにより C PUおよびメモリなどを利用して実行 することができる。 また、 上述のディジタル VTRの構成において、 M P EGエンコーダ 1 0 3を C PUおよびメモリに置き換えたような構成 としてもよい。
このソフトウェアは、 例えば C D _ R〇M (Compact Disc-Read Only Memory)といった記録媒体にプログラムデ一夕として記録されて提供さ れる。 このソフトウエアが記録された記録媒体をコンピュータ装置に装 填し、 所定の操作を行うことで当該ソフトウェアがコンピュータ装置に インストールされ、 当該ソフトウエアによる処理を実行することが可能 な状態とされる。 なお、 コンピュータ装置の構成は、 極めて周知である ため、 ここでは説明を省略する。
第 1 3図は、 MP EGエンコーダ 1 0 3の処理をソフトウエアで行う 場合の一例のフローチヤ一トである。 このフローチャートによる処理は. 上述したハードウエアによる処理と同様なものであるので、 以下では、 上述したハードウェアにおける処理を考慮しながら、 概略的に説明する, ステップ S 1〜S 7は、 上述の入力フィールドァクティ ビティ平均化処 理部 1 0 3 Aによる処理に対応する。 ステップ S 1 1〜 S 2 1は、 上述 のプリエンコード処理部 1 0 3 Bに対応する。 また、 ステップ S 3 1〜 S 3 8は、 上述のエンコード処理部 1 0 3 Cに対応する。
最初のステップ S 1で、 ビデオデ一夕が取り込まれる。 次のステップ S 2で、 取り込まれたビデオデータから、 垂直ブランキング区間で MP EGにおける各ヘッダが抽出されメモリに格納される。 垂直ブランキン グ区間以外では、 取り込まれたビデオデータがメモリに格納される。 ステップ S 3では、 ビデオデ一夕がラス夕スキャンからブロックスキ ヤンへと変換され、 マクロブロックが切り出される。 これは、 例えばメ モリに格納されたビデオデータを読み出す際の読み出しァドレスを制御 することでなされる。 ステップ S 4で、 マクロブロックに切り出された ビデオデータに対して第 1フィールドによるァクティ ビティ計算がなさ れ、 計算結果のァクティ ビティ (^11) (&(^)がステップ S 5で積算さ れ、 積算値 sumとしてメモリに格納される。 これらステップ S 3〜S 5 までの処理は、 ステップ S 6において第 1フィールドの最終マクロブロ ックの処理が終了したと判断されるまで繰り返される。 すなわち、 積算 値 sumは、 1フィールド分のマクロブロックのアクティ ビティの合計と なる。
ステツプ S 6において 1フィールドの最終マクロブロックまで処理が 終了したと判断されたら、 ステップ S 7で、 メモリに格納された積算値 sumが 1フィ一ルド分のマクロブロック数で除され、 1フィ一ルド分の ァクティ ビティが平均化されたフィールドアクティビティの平均値 Act i bity(avg_act)が求められ、 メモリに格納される。
フィールドァクティ ビティの平均値 Actibity(avg— act)が求められる と、 処理はステップ S 1 1に移行する。 ステップ S 1 1では、 上述のス テツプ S 3と同様に、 メモリに格納されたビデオデータがラスタスキヤ ンからブロックスキャンへと変換され、 マクロブロックが切り出される c 次のステップ S 1 2で、 D CTをフィールド DC T符号化モードおよ びフレーム D C T符号化モードの何れで行うかが選択され、 選択結果が D CTモードタイプデータ dcし typとしてメモリに格納される。 ステツ プ S 1 3では、 第 1および第 2フィールドが共に用いられて、 マクロブ ロック毎のァクティビティが計算され、 上述のステップ S 7で求められ メモリに格納されたフィ一ルドアクティビティの平均値 Actibity(avg— a ct)を用いて正規化ァクティ ビティ Actibi ty(norm_act)が求められる。 求められた正規化ァクティビティ Actibity(norm_act)は、 メモリに格納 される。
次のステツプ S 1 4で、 上述のステツプ S 1 1でビデオデータから切 り出されたマクロブロックが 8画素 X 8画素からなる D C Tブロックに 分割され、 この D C Tブロックに対して 2次元 D C Tが行われる。 2次 元 D CTにより D CTブロックが変換された D C T係数は、 ステップ S 1 5で量子化テーブル(quantizer— table)による量子化がなされ、 処理 はステップ S 1 6に移行される。
ステップ S 1 6〜S 2 0の処理を、 量子化スケール(quant izer_scal e)Q n値それぞれについて行うように繰り返すことで、 上述の Q— n部 2 1 2、 2 1 2、 • • • i VL C部 2 1 3、 2 1 3、 · · · 、 積算部∑ 2 1 4、 2 1 4、 · · · 、 ならびに、 積算部∑ 2 1 5、 2 1 5、 · · · に相当する処理が行われる。 すなわち、 ステップ S 1 6で、 D C T係数 に対して量子化スケール Q= 1での量子化が行われ、 ステツプ S 1 7で. VL Cテーブルが参照されて量子化された D CT係数が可変長符号化さ れる。 そして、 ステップ S 1 8で可変長符号化によるマクロブロックに おける発生符号量が計算され、 ステップ S 1 9で、 ステップ S 1 8で求 められたマクロブロック毎の発生符号量が 1フレーム分、 積算される。 ステップ S 2 0で次の量子化スケール Q nがあるか否かが判断され、 次 の量子化スケール Q nがあると判断されたら、 処理はステップ S 1 6に 戻され、 次の量子化スケール Q nに基づく処理が行われる。 量子化スケ ール Q n毎の 1 フレーム分の発生符号量は、 それぞれメモリに格納され る。
ステップ S 2 0で、 全ての量子化スケール Q nの値についてフレーム における発生符号量の積算値が求められたとされれば、 ステップ S 2 1 で、 1フレームの最終マクロブロック (M B ) まで処理が終了したかど うかが判断され、 最終マクロプロックまでの処理が終了していなければ, 処理がステップ S 1 1に戻される。 最終マクロブロックまでの処理が終 了され 1フレーム分の発生符号量が見積もられれば、 ステップ S 3 1に 移行され、 実際のエンコード処理が行われる。
ステップ S 3 1では、 上述のステツプ S 1 1 と同様に、 メモリに格納 されたビデオデータがラス夕スキャンからプロックスキャンへと変換さ れ、 マクロブロックが切り出される。 次のステップ S 3 2では、 上述の ステップ S 1 2でメモリに格納された D C Tモードタイプデータ dc t— ty pに基づき D C T符号化モードが設定される。
ステップ S 3 3では、 ステップ S 3 1でビデオデータから切り出され たマクロブロックが 8画素 X 8画素からなる D C Tブロックに分割され, この D C Tブロックに対して次元 D C Tが行われる。 2次元 D C Tによ り D C Tブロックが変換された D C T係数は、 ステップ S 3 4で量子化 テーブル(quan t i ze r_t ab l e)による量子化がなされ、 処理はステツプ S
3 5に移行される。
ステップ S 3 5では、 上述したステツプ S 1 1〜S 2 1において見積 もられた、 量子化スケール Q n毎の 1フレーム分の発生符号量に基づき. 実際のェンコ一ド処理において発生される符号量の制御を行うために、 後述するステップ S 3 6で用いられる量子化スケール Q nがマクロブロ ック毎に設定される。
そして、 処理はステップ S 3 6に移行され、 ステップ S 3 5で設定さ れた量子化スケール Q nを用いて、 ステップ S 3 4で量子化テーブルを 用いて量子化された D C T係数の量子化が行われる。 ステップ S 3 6で 量子化された D C T係数は、 次のステツプ S 3 7で V L Cテーブルが参 照され可変長符号化される。 そして、 ステップ S 3 8で 1フレームの最 終マクロブロックまで処理が行われたか否かが判断され、 1フレームの 最終マクロブロックまで処理されていないと判断されれば、 処理がステ ップ S 3 1に戻され、 次のマクロブロックに対する量子化処理および可 変長符号化処理が行われる。 一方、 ステップ S 3 7で、 1フレームの最 終マクロプロックまで処理が行われたと判断されれば、 1フレーム分の エンコード処理が終了したとされる。
なお、 上述では、 ステツプ S 1 1〜 S 2 1までのプリェンコ一ド処理 と、 ステップ S 3 1〜S 3 8までのェンコ一ド処理とを別々の処理とし て説明したが、 これはこの例に限定されない。 例えば、 ステップ S 1 1 〜S 2 1において発生符号量の見積もりにより得られたデータをメモリ に格納し、 そこから実際のエンコード処理により得られるデータを選択 して取り出すようにする。 これにより、 ステップ S 3 1〜 S 3 8の処理 をステップ S 1 1〜 S 2 1による処理に含まれるループとして組み込む ことができる。
第 1 4図は、 この発明の実施の一形態でァクティビティを算出する場 合のブロック化を説明するための図である。 この実施の一形態では、 第 1フィールドだけのアクティ ビティを算出する場合、 8画素 x 4ライン のサブブロック単位で演算を行なう。
第 1 4図の左側は、 1 6画素 X 1 6ラインからなる 1マクロブ口ック を示す。 第 1 4図の左側は、 1フレームにおいて構成されるマクロプロ ックを示し、 例えば斜線が付されているラインが第 2フィールドのライ ンであり、 他が第 1フィールドのラインである。 このマクロブロックが 8画素 x8ライン D CTブロックに 4分割される。 さらに、 第 1 4図の 右側に一例が示されるように、 第 1フィールドを構成する成分 (ライ ン) が取り出され、 8画素 x4ラインからなる 4つのサブブロックを得 る。 この第 1フィールドのデータからなるサブブロックについて、 以下 に示す演算によってフィ一ルドアクティ ビティ field_actが算出される なお、 この実施の一形態では、 上述したように、 メインメモリ 2 0 3 に第 1フィールドの 8ライン分が格納された時点で処理が開始される。 したがって、 実際には、 1 6画素 xl 6ラインのマクロブロックから第 1フィ一ルドのデ一夕からなる 8画素 x4ラインのサブブロックが取り 出されるわけではなく、 第 1フィールドの 8ライン分がメインメモリ 2 0 3に格納された時点で、 ラス夕スキャンノブロックスキャン変換部 2 04によりブロックデータに変換された 8画素 x4ラインからなる 4つ のサブブロックが得られることになる。
先ず、 8画素 x4ラインのサブブロック毎に、 各画素の輝度レベル値 (Y k) の平均値 (P) が次式 (7) により求められる。
P = 1/32Σ [k=l, 32]Yk · · · ( 7 )
すなわち、 サブブロック内の 8画素 x4ライン = 3 2個の輝度レベル 値 (Y k) を合計し、 それを 「3 2」 で割ることにより、 平均値 (P) が求められる。
次に、 8画素 x4ラインのサブブロック毎に輝度レベル値 (Y k) と 平均値 (P) との差分値が二乗され、 さらにその二乗された差分値の平 均差分値 (var— sblk) が次式 (8) により求められる。
var sblk = 1/32 ∑ [k-1, 32] (Yk - P)2 · · · (7) 1マクロブロックは、 4個のサブブロックから構成されるので、 4個 の平均差分値 (var_sblk) の中から最小値が求められる。 この最小値が 当該マクロブロックにおけるフィールドアクティビティ Π e 1 d—ac tとし て採用される (式 (8) ) 。
field— act = 1 +min [sblk=l, 4] (var_sblk) · · · (8)
以上のような演算処理が各マクロブロック毎に繰り返される。 このよ うにして、 第 1フィールドにおけるフィールドアクティビティ field_ac t の平均値 (f ield_avg_act ) が求められる。 (式 (9) )
f i e 1 d_avg_ac t = 1/MBnum ∑ [m=l , MBnumj f i e 1 d_ac t [m] · · · (9)
なお、 ここで値 MBnum は、 1フレームにおけるマクロブロックの総数 を示している。
この後、 従来技術で既に説明した式 ( 1 ) 〜式 (5) に基づく計算を 行い、 アクティビティの正規化を行い、 マクロブロック毎のァクテイビ ティを考慮した適応量子化を行なう。
なお、 上述したフィールドアクティビティ f ield_actの演算方法は一 例であり、 他の方法を用いて算出してもよい。
なお、 この発明が適用された MP E Gエンコーダ 1 0 3は、 放送業務 用 VTRに適したものとするため、 イントラピクチャのみに対応し、 さ らに、 1フレーム当たりのデータ量が設定された値を絶対に超えないよ うに符号量制御されている。 そのため、 上述したプリエンコード処理部 1 0 3 Bによるプリェンコ一ド処理が行われているため、 上述の第 3図 Fに示したシステムディレイに対してさらに 1フレーム分のディレイが 追加される。 しかしながら、 この 1フレーム分のディレイは、 プリェン コード処理での符号量制御によるものであって、 この発明の、 当該ピク チヤの第 1フィールドから求めた平均ァクティビティを用いて、 マクロ ブロック毎のアクティビティを考慮した適応量子化を行う、 という主旨 に関わるものではない。 すなわち、 プリエンコード処理を行った場合に は、 この発明による第 2図 A、 第 2図 B、 第 2図(:、 第 2図 D、 第 2図 Eおよび第 2図 Fのタイミングのみならず、 従来技術で説明した第 1図 A、 第 1図 B、 第 1図 Cおよび第 1図 D、 ならびに、 フレーム間のシ一 ンチェンジに対応可能な他の方法である第 3図 A、 第 3図 B、 第 3図 C, 第 3図 D、 第 3図 Eおよび第 3図 Fのタイミングに対して、 それぞれ 1 フレームのディレイがなされることになり、 この実施の形態の利点を覆 すものではない。
なお、 上述では、 画像デ一夕の符号化方式として画像をブロック単位 で D C Tして符号化する M P E G 2方式を採用しているが、 これはこの 例に限定されない。 画像データをブロック単位で符号化する符号化方式 であれば、 他の符号化方式を用いることも可能である。
また、 上述では、 この発明の適用される例として、 ディジタル V T R を説明しているが、 これはこの例に限定されない。 この発明は、 画像デ 一夕をブロック符号化を用いて圧縮符号化する他の画像処理装置、 例え ば伝送のために画像データを圧縮符号化する画像伝送装置にも適用する ことが可能である。
以上説明したように、 この実施の形態では、 あるフレームの正規化ァ クテイビティを算出する場合、 そのフレームの第 1フィールドの画像デ 一夕から求めた平均ァクティビティを用いて正規化ァクティビティを算 出するようにしている。 このように、 この実施の形態では、 正規化ァク テイビティの算出の際に前のフレームの平均ァクティビティを用いない ため、 フレーム間でシーンチェンジがあった場合にも適正に正規化ァク テイビティを算出することができ、 画質の劣化を生じない。
また、 フレーム (2フィールド) 全体から平均アクティビティを算出 して正規化ァクティ ビティを求める方法に比べて、 演算時間を短くする ことができ、 システムディ レイを短縮できる。
さらに、 正規化ァクティ ビティを求めるための 1フレーム分のバッフ ァが不要なため、 メモリ容量が節約できる。
またそのため、 システムディ レイの制約がある編集用の V T Rにこの 発明を適用することで、 視覚特性を考慮した画質の最適化を行うことが 可能となる。

Claims

請 求 の 範 囲
1 . 画像データの第 1フィールドから平均アクティビティを算出する平 均ァクティビティ算出手段と、
上記平均ァクティビティ算出手段により上記第 1フィールドから算出 された上記平均アクティビティを、 該第 1フィールドと、 該第 1フレー ムと同一フレームの第 2フィールドとに適用して正規化ァクティビティ を算出する正規化ァクティビティ算出手段と、
上記正規化ァクティビティ算出手段により算出された上記正規化ァク ティビティを用いて上記第 1フィールドおよび上記第 2フィールドを量 子化する量子化手段と
を有することを特徴とする画像処理装置。
2 . 請求の範囲第 1項に記載の画像処理装置において、
上記平均ァクティビティ算出手段は、 上記画像データを複数の領域に 分割して形成されるブロックが構成されるための最小限の上記画像デー 夕が入力されたら上記ァクティビティの算出を開始し、 上記ァクティビ ティを上記第 1フィールドで積算して上記平均ァクティビティを算出す るようにしたことを特徴とする画像処理装置。
3 . 請求の範囲第 1項に記載の画像処理装置において、
上記アクティビティ算出手段は、 M P E Gで扱われるマクロブロック の上記第 1フィ一ルドに対応するデータだけを用いて上記ァクティビテ ィを算出することを特徴とする画像処理装置。
4 . 画像デ一夕の第 1フィールドから平均アクティビティを算出する平 均アクティビティ算出のステップと、
上記平均ァクティビティ算出のステップにより上記第 1フィールドか ら算出された上記平均アクティビティを、 該第 1フィールドと、 該第 1 フレームと同一フレームの第 2フィールドとに適用して正規化ァクティ ビティを算出する正規化ァクティビティ算出のステップと、
上記正規化ァクティビティ算出のステツプにより算出された上記正規 化ァクティビティを用いて上記第 1フィ一ルドおよび上記第 2フィール ドを量子化する量子化のステップと
を有することを特徴とする画像処理方法。
5 . 画像データを量子化する画像処理方法をコンピュータ装置に実行さ せる画像処理プログラムにおいて、
上記画像処理方法は、
画像データの第 1フィールドから平均アクティビティを算出する平均 アクティビティ算出のステップと、
上記平均ァクティビティ算出のステップにより上記第 1 フィールドか ら算出された上記平均アクティビティを、 該第 1フィールドと、 該第 1 フレームと同一フレームの第 2フィールドとに適用して正規化ァクティ ビティを算出する正規化ァクティビティ算出のステップと、
上記正規化ァクティビティ算出のステップにより算出された上記正規 化ァクティビティを用いて上記第 1フィールドおよび上記第 2フィール ドを量子化する量子化のステップと
を有することを特徴とする画像処理プログラム。
6 . 画像データを量子化する画像処理方法をコンピュータ装置に実行さ せる画像処理プログラムが記録された記録媒体において、
上記画像処理方法は、
入力された画像データの第 1フィールドから平均アクティビティを算 出する平均アクティビティ算出のステップと、
上記平均ァクティビティ算出のステップにより上記第 1フィールドか ら算出された上記平均アクティビティを、 該第 1フィールドと、 該第 1 フレームと同一フレームの第 2フィールドとに適用して正規化ァクティ ビティを算出する正規化ァクティ ビティ算出のステップと、
上記正規化ァクティビティ算出のステップにより算出された上記正規 化ァクティビティを用いて上記第 1フィールドおよび上記第 2フィ一ル ドを量子化する量子化のステップと
を有することを特徴とする記録媒体。
PCT/JP2002/003060 2001-03-29 2002-03-28 Image processing apparatus, image processing method, image processing program, and recording medium WO2002080572A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US10/473,441 US20040131116A1 (en) 2001-03-29 2002-03-28 Image processing apparatus, image processing method, image processing program, and recording medium
JP2002577443A JPWO2002080572A1 (ja) 2001-03-29 2002-03-28 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2001-95298 2001-03-29
JP2001095298 2001-03-29
JP2001-156818 2001-05-25
JP2001156818 2001-05-25

Publications (1)

Publication Number Publication Date
WO2002080572A1 true WO2002080572A1 (en) 2002-10-10

Family

ID=26612508

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2002/003063 WO2002080575A1 (en) 2001-03-29 2002-03-28 Image processing apparatus, image processing method, image processing program, and recording medium
PCT/JP2002/003060 WO2002080572A1 (en) 2001-03-29 2002-03-28 Image processing apparatus, image processing method, image processing program, and recording medium

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/003063 WO2002080575A1 (en) 2001-03-29 2002-03-28 Image processing apparatus, image processing method, image processing program, and recording medium

Country Status (3)

Country Link
US (2) US7289676B2 (ja)
JP (2) JPWO2002080572A1 (ja)
WO (2) WO2002080575A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005337A (ja) * 2006-06-23 2008-01-10 Canon Inc 画像符号化装置及び画像符号化方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126283B1 (en) * 2005-10-13 2012-02-28 Maxim Integrated Products, Inc. Video encoding statistics extraction using non-exclusive content categories
JP4529919B2 (ja) * 2006-02-28 2010-08-25 日本ビクター株式会社 適応量子化装置及び適応量子化プログラム
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
CN102567961B (zh) * 2010-12-30 2016-05-18 意法半导体研发(深圳)有限公司 感知块屏蔽估算系统
US9787989B2 (en) * 2013-06-11 2017-10-10 Blackberry Limited Intra-coding mode-dependent quantization tuning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0795564A (ja) * 1993-09-20 1995-04-07 Toshiba Corp 動画像符号化装置
JPH0818959A (ja) * 1994-07-04 1996-01-19 Matsushita Electric Ind Co Ltd 画像信号符号化方法及び画像信号符号化装置
JPH11177989A (ja) * 1997-10-10 1999-07-02 Internatl Business Mach Corp <Ibm> 2つのエンコーダ及び統計分析を使用するビデオ・シーケンスのリアルタイム符号化方法及び装置
JP2000138938A (ja) * 1998-10-30 2000-05-16 Sony Corp 画像圧縮符号化方法及び装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05167998A (ja) * 1991-12-16 1993-07-02 Nippon Telegr & Teleph Corp <Ntt> 画像の符号化制御処理方法
KR100213015B1 (ko) * 1994-03-31 1999-08-02 윤종용 양자화 방법 및 회로
US5506844A (en) * 1994-05-20 1996-04-09 Compression Labs, Inc. Method for configuring a statistical multiplexer to dynamically allocate communication channel bandwidth
JPH0965339A (ja) * 1995-08-18 1997-03-07 Mitsubishi Electric Corp 画像ブロック動き検出装置
US6192075B1 (en) * 1997-08-21 2001-02-20 Stream Machine Company Single-pass variable bit-rate control for digital video coding
US6885702B1 (en) * 1997-10-06 2005-04-26 Telediffusion De France Method for spatial synchronization of a digitally coded video image and/or for identification of the syntax of a video sequence
JPH11346365A (ja) 1998-04-03 1999-12-14 Matsushita Electric Ind Co Ltd 符号化圧縮方法、および符号化圧縮装置
US6480539B1 (en) * 1999-09-10 2002-11-12 Thomson Licensing S.A. Video encoding method and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0795564A (ja) * 1993-09-20 1995-04-07 Toshiba Corp 動画像符号化装置
JPH0818959A (ja) * 1994-07-04 1996-01-19 Matsushita Electric Ind Co Ltd 画像信号符号化方法及び画像信号符号化装置
JPH11177989A (ja) * 1997-10-10 1999-07-02 Internatl Business Mach Corp <Ibm> 2つのエンコーダ及び統計分析を使用するビデオ・シーケンスのリアルタイム符号化方法及び装置
JP2000138938A (ja) * 1998-10-30 2000-05-16 Sony Corp 画像圧縮符号化方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005337A (ja) * 2006-06-23 2008-01-10 Canon Inc 画像符号化装置及び画像符号化方法

Also Published As

Publication number Publication date
JPWO2002080575A1 (ja) 2004-07-22
US20040131116A1 (en) 2004-07-08
WO2002080575A1 (en) 2002-10-10
JPWO2002080572A1 (ja) 2004-07-22
US7289676B2 (en) 2007-10-30
US20040114816A1 (en) 2004-06-17

Similar Documents

Publication Publication Date Title
US8411741B2 (en) Picture processing apparatus, picture processing method, picture processing program and recording medium
US6862402B2 (en) Digital recording and playback apparatus having MPEG CODEC and method therefor
JP3298915B2 (ja) 符号化装置
JPH04358486A (ja) 高能率符号化信号処理装置
US7286715B2 (en) Quantization apparatus, quantization method, quantization program, and recording medium
JP2002359853A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
WO2002080572A1 (en) Image processing apparatus, image processing method, image processing program, and recording medium
JP3900155B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム、ならびに、量子化制御装置、量子化制御方法および量子化制御プログラム
JP4135427B2 (ja) 画像処理装置および方法、ならびに、画像処理プログラム
US6549677B1 (en) Data conversion method and apparatus and signal recording and reproduction apparatus utilizing same
JP3763276B2 (ja) 信号処理装置および方法、記録装置および方法、ならびに、記録再生装置および方法
JP2004056677A (ja) 画像情報符号化装置及び画像情報符号化方法
JP3273601B2 (ja) 符号化装置および方法、データ記録再生装置および方法、並びに記録媒体
JP2003169330A (ja) 信号処理装置および方法、記録装置および方法、ならびに、記録再生装置および方法
JP2003153264A (ja) 符号化装置および符号化方法、並びにそれを使用した画像データ記録装置
JPH10136362A (ja) データ圧縮装置およびディジタルビデオ信号処理装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2002577443

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 10473441

Country of ref document: US