JP2002152759A - 画像情報変換装置および画像情報変換方法 - Google Patents
画像情報変換装置および画像情報変換方法Info
- Publication number
- JP2002152759A JP2002152759A JP2000344491A JP2000344491A JP2002152759A JP 2002152759 A JP2002152759 A JP 2002152759A JP 2000344491 A JP2000344491 A JP 2000344491A JP 2000344491 A JP2000344491 A JP 2000344491A JP 2002152759 A JP2002152759 A JP 2002152759A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image information
- frame
- average value
- scene change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
(57)【要約】
【課題】 MPEG2画像圧縮情報を入力し、MPEG
4画像圧縮情報を出力する際、IピクチャからP−VO
Pへと変換するときに生じる画像劣化を回避する。 【解決手段】 シーンチェンジ検出部21は、各VOP
に対するコンプレキシティの推定値に基づいて、MPE
G2ビットストリームにおけるIピクチャをMPEG4
ビットストリームにおけるP−VOPに変換するとき、
シーンチェンジが含まれるか否かの検出を行う。GOV
構造決定部22は、シーンチェンジ検出部21において
シーンチェンジが検出された場合、MPEG2ビットス
トリームにおけるIピクチャから、MPEG4ビットス
トリームのP−VOPへの変換を行わないことを決定す
る。
4画像圧縮情報を出力する際、IピクチャからP−VO
Pへと変換するときに生じる画像劣化を回避する。 【解決手段】 シーンチェンジ検出部21は、各VOP
に対するコンプレキシティの推定値に基づいて、MPE
G2ビットストリームにおけるIピクチャをMPEG4
ビットストリームにおけるP−VOPに変換するとき、
シーンチェンジが含まれるか否かの検出を行う。GOV
構造決定部22は、シーンチェンジ検出部21において
シーンチェンジが検出された場合、MPEG2ビットス
トリームにおけるIピクチャから、MPEG4ビットス
トリームのP−VOPへの変換を行わないことを決定す
る。
Description
【0001】
【発明の属する技術分野】本発明は、画像情報変換装置
および画像情報変換方法に関し、特に、離散コサイン変
換等の直交変換と動き補償とによって圧縮された画像情
報(ビットストリーム)を衛星放送、ケーブルTV、イ
ンターネット等のネットワークメディアを介して受信す
る際、あるいは、光ディスクおよび光磁気ディスク等の
記録媒体上で処理する際に用いられる画像情報変換装置
および画像情報変換方法に関するものである。
および画像情報変換方法に関し、特に、離散コサイン変
換等の直交変換と動き補償とによって圧縮された画像情
報(ビットストリーム)を衛星放送、ケーブルTV、イ
ンターネット等のネットワークメディアを介して受信す
る際、あるいは、光ディスクおよび光磁気ディスク等の
記録媒体上で処理する際に用いられる画像情報変換装置
および画像情報変換方法に関するものである。
【0002】
【従来の技術】近年、画像情報をディジタルデータとし
て取り扱う際、画像情報特有の冗長性を利用し、効率の
高い情報の伝送および蓄積を目的とした、例えば離散コ
サイン変換等の直交変換と動き補償により圧縮する方式
に準拠した装置が、放送局などの情報配信および一般家
庭における情報受信の双方において普及しつつある。
て取り扱う際、画像情報特有の冗長性を利用し、効率の
高い情報の伝送および蓄積を目的とした、例えば離散コ
サイン変換等の直交変換と動き補償により圧縮する方式
に準拠した装置が、放送局などの情報配信および一般家
庭における情報受信の双方において普及しつつある。
【0003】特に、MPEG(Moving Picture Experts
Group:動画像符号化専門家会合)によって標準化され
ているMPEG2は、汎用画像符号化方式としてISO
/IEC 13818−2に定義されており、飛び越し
走査画像および順次走査画像の双方、並びに標準解像度
画像および高精細画像を網羅している。そのためMPE
G2は、プロフェッショナル用途からコンシューマ用途
まで、広範なアプリケーションに今後とも用いられるも
のと予想される。
Group:動画像符号化専門家会合)によって標準化され
ているMPEG2は、汎用画像符号化方式としてISO
/IEC 13818−2に定義されており、飛び越し
走査画像および順次走査画像の双方、並びに標準解像度
画像および高精細画像を網羅している。そのためMPE
G2は、プロフェッショナル用途からコンシューマ用途
まで、広範なアプリケーションに今後とも用いられるも
のと予想される。
【0004】このようなMPEG2圧縮方式を用いるこ
とにより、例えば720×480画素を持つ標準解像度
の飛び越し走査画像であれば4〜8Mbpsの符号量
(以下、ビットレートと記す。)を、1920×108
8画素を持つ高解像度の飛び越し走査画像であれば18
〜22Mbpsのビットレートを割り当てることで、高
い圧縮率と良好な画質の実現が可能である。
とにより、例えば720×480画素を持つ標準解像度
の飛び越し走査画像であれば4〜8Mbpsの符号量
(以下、ビットレートと記す。)を、1920×108
8画素を持つ高解像度の飛び越し走査画像であれば18
〜22Mbpsのビットレートを割り当てることで、高
い圧縮率と良好な画質の実現が可能である。
【0005】MPEG2は、主として放送用に適合する
高画質符号化を対象としていたが、MPEG1よりも低
いビットレート、つまり、より高い圧縮率の符号化方式
には対応していなかった。ところが携帯端末の普及とと
もに、今後より高い圧縮率の符号化方式のニーズは高ま
ると予想されたことからMPEG4符号化方式の標準化
が行われ、画像符号化方式に関しては、1998年12
月にISO/IEC14496−2として国際標準に承
認されている。
高画質符号化を対象としていたが、MPEG1よりも低
いビットレート、つまり、より高い圧縮率の符号化方式
には対応していなかった。ところが携帯端末の普及とと
もに、今後より高い圧縮率の符号化方式のニーズは高ま
ると予想されたことからMPEG4符号化方式の標準化
が行われ、画像符号化方式に関しては、1998年12
月にISO/IEC14496−2として国際標準に承
認されている。
【0006】ところで、ディジタル放送に対応するよう
に一旦符号化されたMPEG2画像圧縮情報(以下、M
PEG2ビットストリームと記す。)を携帯端末等で処
理するためには、より低いビットレートのMPEG4画
像圧縮情報(以下、MPEG4ビットストリームと記
す。)に変換することが要求される。
に一旦符号化されたMPEG2画像圧縮情報(以下、M
PEG2ビットストリームと記す。)を携帯端末等で処
理するためには、より低いビットレートのMPEG4画
像圧縮情報(以下、MPEG4ビットストリームと記
す。)に変換することが要求される。
【0007】かかる要求に応える画像情報変換装置(ト
ランスコーダ)として、“Field-to-Frame Transcoding
with Spatial and Temporal Downsampling”(Susie J
Wee,John G.Apostlopoulos,and Nick Feamster,ICIP'9
9、これを以下、文献1と呼ぶ)において、図5に示す
装置が提案されている。
ランスコーダ)として、“Field-to-Frame Transcoding
with Spatial and Temporal Downsampling”(Susie J
Wee,John G.Apostlopoulos,and Nick Feamster,ICIP'9
9、これを以下、文献1と呼ぶ)において、図5に示す
装置が提案されている。
【0008】図5に示す画像情報変換装置101は、ピ
クチャタイプ判別部111と、MPEG2画像情報(I
ピクチャおよびPピクチャ)復号化部112と、間引き
部113と、ビデオメモリ114と、MPEG4画像情
報(I/P−VOP)符号化部115と、動きベクトル
合成部116と、動きベクトル検出部117とを備えて
いる。ここで、MPEG4におけるVOP(Video Obje
ct Plane)とは、MPEG2におけるフレームに相当す
るものである。
クチャタイプ判別部111と、MPEG2画像情報(I
ピクチャおよびPピクチャ)復号化部112と、間引き
部113と、ビデオメモリ114と、MPEG4画像情
報(I/P−VOP)符号化部115と、動きベクトル
合成部116と、動きベクトル検出部117とを備えて
いる。ここで、MPEG4におけるVOP(Video Obje
ct Plane)とは、MPEG2におけるフレームに相当す
るものである。
【0009】まず、ピクチャタイプ判別部111は、飛
び越し走査のMPEG2画像圧縮情報(以下、MPEG
2ビットストリームと記す。)における各フレームのデ
ータを入力し、MPEG2画像情報(以下、Iピクチャ
およびPピクチャと記す。)に関するものか、Bピクチ
ャに関するものであるかを判別する。ピクチャタイプ判
別部111は、前者のみを後続のMPEG2画像情報復
号化部112へと出力する。
び越し走査のMPEG2画像圧縮情報(以下、MPEG
2ビットストリームと記す。)における各フレームのデ
ータを入力し、MPEG2画像情報(以下、Iピクチャ
およびPピクチャと記す。)に関するものか、Bピクチ
ャに関するものであるかを判別する。ピクチャタイプ判
別部111は、前者のみを後続のMPEG2画像情報復
号化部112へと出力する。
【0010】MPEG2画像情報復号化部112におけ
る処理は、通常のMPEG2画像情報復号化部と同様で
あるが、Bピクチャに関するデータはピクチャタイプ判
別部111において廃棄されるため、MPEG2画像情
報復号化部112における機能としてはIピクチャおよ
びPピクチャのみを復号可能であればよい。
る処理は、通常のMPEG2画像情報復号化部と同様で
あるが、Bピクチャに関するデータはピクチャタイプ判
別部111において廃棄されるため、MPEG2画像情
報復号化部112における機能としてはIピクチャおよ
びPピクチャのみを復号可能であればよい。
【0011】間引き部113は、MPEG2画像情報復
号化部112からの画像値を入力し、水平方向に1/2
の間引き処理を施し、垂直方向に第1フィールド、もし
くは第2フィールドのどちらか一方のデータのみを残
し、他方を廃棄する処理を施すことによって、入力した
画像情報の1/4の大きさを持つ順次走査画像を生成す
る。
号化部112からの画像値を入力し、水平方向に1/2
の間引き処理を施し、垂直方向に第1フィールド、もし
くは第2フィールドのどちらか一方のデータのみを残
し、他方を廃棄する処理を施すことによって、入力した
画像情報の1/4の大きさを持つ順次走査画像を生成す
る。
【0012】ところで、例えば、MPEG2画像情報復
号化部112から入力したMPEG2ビットストリーム
がNTSC(National Television System Committee)
の規格に準拠した画像、つまり720×480画素、3
0Hzの飛び越し走査画像であった場合、間引き部11
3における間引き処理後の画枠は360×240画素に
なる。ところが、後続のMPEG4画像情報符号化部1
15において符号化を行う際、マクロブロック単位の処
理を行うには、水平方向、垂直方向ともに、その画素数
が16の倍数である必要がある。したがって、間引き部
113は、さらに、そのための画素の補填または廃棄を
行う。すなわち、上記の場合においては、例えば、水平
方向の右端、もしくは左端の8ラインを廃棄して352
×240画素とする。
号化部112から入力したMPEG2ビットストリーム
がNTSC(National Television System Committee)
の規格に準拠した画像、つまり720×480画素、3
0Hzの飛び越し走査画像であった場合、間引き部11
3における間引き処理後の画枠は360×240画素に
なる。ところが、後続のMPEG4画像情報符号化部1
15において符号化を行う際、マクロブロック単位の処
理を行うには、水平方向、垂直方向ともに、その画素数
が16の倍数である必要がある。したがって、間引き部
113は、さらに、そのための画素の補填または廃棄を
行う。すなわち、上記の場合においては、例えば、水平
方向の右端、もしくは左端の8ラインを廃棄して352
×240画素とする。
【0013】間引き部113によって生成された順次走
査画像は、ビデオメモリ114に蓄積された後、MPE
G4画像情報符号化部115によって符号化処理が施さ
れ、MPEG4ビットストリームとして出力される。
査画像は、ビデオメモリ114に蓄積された後、MPE
G4画像情報符号化部115によって符号化処理が施さ
れ、MPEG4ビットストリームとして出力される。
【0014】入力となるMPEG2ビットストリーム中
の動きベクトル情報は、動きベクトル合成部116に供
給されて、間引き後の画像情報に対する動きベクトルに
マッピングされる。
の動きベクトル情報は、動きベクトル合成部116に供
給されて、間引き後の画像情報に対する動きベクトルに
マッピングされる。
【0015】動きベクトル検出部117は、動きベクト
ル合成部116において合成された動きベクトル値に基
づいて、高精度の動きベクトルを検出する。
ル合成部116において合成された動きベクトル値に基
づいて、高精度の動きベクトルを検出する。
【0016】文献1に示される画像情報変換装置101
は、入力されたMPEG2ビットストリームの1/2×
1/2の大きさを持つ順次走査画像のMPEG4ビット
ストリームを生成する装置である。すなわち、例えば入
力となるMPEG2ビットストリームがNTSC規格に
準拠している場合、出力されるMPEG4ビットストリ
ームは、SIFサイズ(352×240)となってい
る。画像情報変換装置101は、間引き部113におけ
る動作の変更を行うことで、これ以外の画枠、例えば上
記の例で、約1/4×1/4の画枠であるQSIF(1
76×112画素)サイズの画像に変換することも可能
である。
は、入力されたMPEG2ビットストリームの1/2×
1/2の大きさを持つ順次走査画像のMPEG4ビット
ストリームを生成する装置である。すなわち、例えば入
力となるMPEG2ビットストリームがNTSC規格に
準拠している場合、出力されるMPEG4ビットストリ
ームは、SIFサイズ(352×240)となってい
る。画像情報変換装置101は、間引き部113におけ
る動作の変更を行うことで、これ以外の画枠、例えば上
記の例で、約1/4×1/4の画枠であるQSIF(1
76×112画素)サイズの画像に変換することも可能
である。
【0017】さらに、また、画像情報変換装置101
は、MPEG2画像情報復号化部112における処理と
して、水平方向、垂直方向それぞれについて入力したM
PEG2ビットストリーム内の8次の離散コサイン変換
係数のうちのすべてを用いた復号処理を行うほか、水平
方向のみ、あるいは水平方向、垂直方向ともに8次の離
散コサイン変換係数のうちの低域成分のみを用いた復号
処理を行い、画質劣化を最小限に抑えながら復号処理に
伴う演算量とビデオメモリ容量とを削減している。
は、MPEG2画像情報復号化部112における処理と
して、水平方向、垂直方向それぞれについて入力したM
PEG2ビットストリーム内の8次の離散コサイン変換
係数のうちのすべてを用いた復号処理を行うほか、水平
方向のみ、あるいは水平方向、垂直方向ともに8次の離
散コサイン変換係数のうちの低域成分のみを用いた復号
処理を行い、画質劣化を最小限に抑えながら復号処理に
伴う演算量とビデオメモリ容量とを削減している。
【0018】ところで、図5に示した画像情報変換装置
101では、MPEG4画像情報符号化部115におけ
る符号量制御がMPEG4ビットストリームにおける画
質を決定する大きな要因となる。ISO/IEC 14
496−2においては、符号量制御の方式は、特に規定
されておらず、各ベンダがアプリケーションに応じて演
算量および出力画質の観点から最適と考えられる方式を
用いることができる。以下では、代表的な符号量制御方
式として、MPEG2 Test Model5(IS
O/IEC JTC1/SC29/WG11 N040
0)に規定されている方式について説明する。
101では、MPEG4画像情報符号化部115におけ
る符号量制御がMPEG4ビットストリームにおける画
質を決定する大きな要因となる。ISO/IEC 14
496−2においては、符号量制御の方式は、特に規定
されておらず、各ベンダがアプリケーションに応じて演
算量および出力画質の観点から最適と考えられる方式を
用いることができる。以下では、代表的な符号量制御方
式として、MPEG2 Test Model5(IS
O/IEC JTC1/SC29/WG11 N040
0)に規定されている方式について説明する。
【0019】符号量制御の動作は、目標符号量(ターゲ
ットビットレート)、およびGOP(Group Of Picture
s)構成を入力変数として、まず、第1ステップとして
各ピクチャヘのビット配分を行う。ここで、GOPと
は、タイプの異なる複数のピクチャがある規制に基づい
て並んでいるグループを示している。次に、仮想バッフ
ァを用いたレート制御を行い、最後に、視覚特性を考慮
したマクロブロック毎の適応量子化を行う。この符号量
制御の動作を図6に示す。
ットビットレート)、およびGOP(Group Of Picture
s)構成を入力変数として、まず、第1ステップとして
各ピクチャヘのビット配分を行う。ここで、GOPと
は、タイプの異なる複数のピクチャがある規制に基づい
て並んでいるグループを示している。次に、仮想バッフ
ァを用いたレート制御を行い、最後に、視覚特性を考慮
したマクロブロック毎の適応量子化を行う。この符号量
制御の動作を図6に示す。
【0020】ステップS101において、MPEG4画
像情報符号化部115は、GOP内の各ピクチャに対す
る割り当てビット量を、割り当て対象ピクチャを含め、
まだ復号化されていないピクチャに対して割り当てられ
るビット量(以下、これをRとする)に基づいて配分す
る。この配分をGOP内の符号化ピクチャ順に繰り返
す。この際、以下に述べる2つの仮定を用いて各ピクチ
ャヘの符号量割り当てを行う。
像情報符号化部115は、GOP内の各ピクチャに対す
る割り当てビット量を、割り当て対象ピクチャを含め、
まだ復号化されていないピクチャに対して割り当てられ
るビット量(以下、これをRとする)に基づいて配分す
る。この配分をGOP内の符号化ピクチャ順に繰り返
す。この際、以下に述べる2つの仮定を用いて各ピクチ
ャヘの符号量割り当てを行う。
【0021】まず第1に、各ピクチャを符号化する際に
用いる平均量子化スケールコードと発生符号量との積
は、画面が変化しない限りピクチャタイプ毎に一定値と
なると仮定する。そこで、各ピクチャを符号化した後、
各ピクチャタイプ毎に、画面の複雑さを示す変数Xi、
Xp、およびXb(grobal complexity measure)を以
下に示す式(1)乃至(3)により更新する。
用いる平均量子化スケールコードと発生符号量との積
は、画面が変化しない限りピクチャタイプ毎に一定値と
なると仮定する。そこで、各ピクチャを符号化した後、
各ピクチャタイプ毎に、画面の複雑さを示す変数Xi、
Xp、およびXb(grobal complexity measure)を以
下に示す式(1)乃至(3)により更新する。
【0022】
【数1】
【0023】ここでSi、Sp、およびSbは、ピクチ
ャ符号化時の発生符号ビット量であり、Qi、Qp、お
よびQbは、ピクチャ符号化時の平均量子化スケールコ
ードである。また、初期値は、目標符号量(ターゲット
ビットレート)bit_rate[bits/sec]
を用いて、以下に示す式(4)乃至(6)で表される値
とする。
ャ符号化時の発生符号ビット量であり、Qi、Qp、お
よびQbは、ピクチャ符号化時の平均量子化スケールコ
ードである。また、初期値は、目標符号量(ターゲット
ビットレート)bit_rate[bits/sec]
を用いて、以下に示す式(4)乃至(6)で表される値
とする。
【0024】
【数2】
【0025】第2に、Iピクチャの量子化スケールコー
ドを基準としたP、Bピクチャの量子化スケールコード
の比率Kp、Kbが式(7)に定めた値となる場合に常
に全体の画質が最適化されると仮定する。
ドを基準としたP、Bピクチャの量子化スケールコード
の比率Kp、Kbが式(7)に定めた値となる場合に常
に全体の画質が最適化されると仮定する。
【0026】
【数3】
【0027】すなわち、Bピクチャの量子化スケールコ
ードは、IおよびPピクチャの量子化スケールコードの
常に1.4倍である。これは、BピクチャをIおよびP
ピクチャに比較して多少粗めに符号化することにより、
Bピクチャで節約できる符号量をI,Pピクチャに加え
ると、I,Pピクチャの画質が改善され、これを参照す
るBピクチャの画質も改善されることを想定している。
ードは、IおよびPピクチャの量子化スケールコードの
常に1.4倍である。これは、BピクチャをIおよびP
ピクチャに比較して多少粗めに符号化することにより、
Bピクチャで節約できる符号量をI,Pピクチャに加え
ると、I,Pピクチャの画質が改善され、これを参照す
るBピクチャの画質も改善されることを想定している。
【0028】上記2つの仮定より、GOPの各ピクチャ
に対する割り当てビット量(Ti,Tp,Tb)は、式
(8)乃至(10)に示す値とする。
に対する割り当てビット量(Ti,Tp,Tb)は、式
(8)乃至(10)に示す値とする。
【0029】
【数4】
【0030】ここで、NpおよびNbは、GOP内でま
だ符号化されていないP,Bピクチャの枚数である。
だ符号化されていないP,Bピクチャの枚数である。
【0031】このようにして求めた割当符号量に基づい
て、各ピクチャをステップS101および102にした
がって符号化する毎にGOP内の未符号化ピクチャに対
して割り当てられるビット量Rを、以下に示す式(1
1)によって更新する。
て、各ピクチャをステップS101および102にした
がって符号化する毎にGOP内の未符号化ピクチャに対
して割り当てられるビット量Rを、以下に示す式(1
1)によって更新する。
【0032】
【数5】
【0033】また、GOPの最初のピクチャを符号化す
る際には、式(12)によりRを更新する。式(12)
において、Nは、GOP内のピクチャ数を表している。
シーケンスの最初におけるRの初期値は、0とする。
る際には、式(12)によりRを更新する。式(12)
において、Nは、GOP内のピクチャ数を表している。
シーケンスの最初におけるRの初期値は、0とする。
【0034】
【数6】
【0035】ステップS102では、ステップS101
において式(8)乃至(10)により求められた各ピク
チャに対する割当ビット量(Ti,Tp,Tb)と、実
際の発生符号量を一致させるため、各ピクチャ毎に独立
に設定した3種類の仮想バッファの容量に基づいて、量
子化スケールコードをマクロブロック単位のフィードバ
ック制御で求める。まず、j番目のマクロブロック符号
化に先立ち、仮想バッファの占有量を式(13)乃至
(15)によって求める。
において式(8)乃至(10)により求められた各ピク
チャに対する割当ビット量(Ti,Tp,Tb)と、実
際の発生符号量を一致させるため、各ピクチャ毎に独立
に設定した3種類の仮想バッファの容量に基づいて、量
子化スケールコードをマクロブロック単位のフィードバ
ック制御で求める。まず、j番目のマクロブロック符号
化に先立ち、仮想バッファの占有量を式(13)乃至
(15)によって求める。
【0036】
【数7】
【0037】式(13)乃至(15)において、
d0 i、d0 p、およびd0 bは、各仮想バッファの初
期占有量を示し、Bjは、ピクチャの先頭からj番目の
マクロブロックまでの発生ビット量を示し、MB_cn
tは、1ピクチャ内のマクロブロック数を示している。
各ピクチャ符号化終了時の仮想バッファ占有量(d
MB_c nt i,dMB_cnt p,
dMB_cnt b)は、それぞれ同一のピクチャタイプ
であり、次のピクチャに対する仮想バッファ占有量の初
期値(d0 i,d0 p,d0 b)として用いられる。
d0 i、d0 p、およびd0 bは、各仮想バッファの初
期占有量を示し、Bjは、ピクチャの先頭からj番目の
マクロブロックまでの発生ビット量を示し、MB_cn
tは、1ピクチャ内のマクロブロック数を示している。
各ピクチャ符号化終了時の仮想バッファ占有量(d
MB_c nt i,dMB_cnt p,
dMB_cnt b)は、それぞれ同一のピクチャタイプ
であり、次のピクチャに対する仮想バッファ占有量の初
期値(d0 i,d0 p,d0 b)として用いられる。
【0038】次に、j番目のマクロブロックに対する量
子化スケールコードQjを式(16)により計算する。
子化スケールコードQjを式(16)により計算する。
【0039】
【数8】
【0040】ただし、式(16)において、rは、リア
クションパラメータと呼ばれるフィードバックループの
応答を制御する変数であり、続いて示す式(17)によ
り与えられるものである。
クションパラメータと呼ばれるフィードバックループの
応答を制御する変数であり、続いて示す式(17)によ
り与えられるものである。
【0041】
【数9】
【0042】なお、符号化開始時における仮想バッファ
の初期値は、式(18)乃至(20)に示す値である。
の初期値は、式(18)乃至(20)に示す値である。
【0043】
【数10】
【0044】ステップS103では、ステップS102
で求められた量子化スケールコードを視覚的に劣化の目
立ちやすい平坦部において、より細かく量子化し、比較
的劣化の目立ちにくい絵柄の複雑な部分で粗く量子化す
るように各マクロブロック毎のアクティビィティと呼ば
れる変数によって変化させている。
で求められた量子化スケールコードを視覚的に劣化の目
立ちやすい平坦部において、より細かく量子化し、比較
的劣化の目立ちにくい絵柄の複雑な部分で粗く量子化す
るように各マクロブロック毎のアクティビィティと呼ば
れる変数によって変化させている。
【0045】アクティビティは、原画の輝度信号画素値
を用い、フレーム離散コサイン変換モードにおける4個
のブロックと、フィールド離散コサイン変換モードにお
ける4個のブロックとの、合計8ブロックの画素値を用
いて、以下に示す式(21)で与えられる。
を用い、フレーム離散コサイン変換モードにおける4個
のブロックと、フィールド離散コサイン変換モードにお
ける4個のブロックとの、合計8ブロックの画素値を用
いて、以下に示す式(21)で与えられる。
【0046】
【数11】
【0047】ここで、Pkは、原画の輝度信号ブロック
内画素値である。式(21)において最小値を採るの
は、マクロブロック内の一部だけでも平坦部分のある場
合には量子化を細かくするためである。
内画素値である。式(21)において最小値を採るの
は、マクロブロック内の一部だけでも平坦部分のある場
合には量子化を細かくするためである。
【0048】さらに、以下に示す式(22)により、そ
の値が0.5〜2の範囲である正規化アクティビティN
actjを求める。
の値が0.5〜2の範囲である正規化アクティビティN
actjを求める。
【0049】
【数12】
【0050】式(22)において、avg−actは、
直前に符号化したピクチャでのactjの平均値を示し
ている。
直前に符号化したピクチャでのactjの平均値を示し
ている。
【0051】視覚特性を考慮した量子化スケールコード
mquantjは、ステップS102で得られた量子化
スケールコードQjに基づいて、以下に示す式(23)
で与えられる。
mquantjは、ステップS102で得られた量子化
スケールコードQjに基づいて、以下に示す式(23)
で与えられる。
【0052】
【数13】
【0053】ところで、「MPEG圧縮効率の理論解析
とその符号量制御への応用」(信学技報、IE−95,
DSP95−10,1995年5月、以下、これを文献
2と記す。)にも記述されているように、MPEG2
Test Model5で定められている符号量制御方
式は、MPEG2画像符号化部において、必ずしも良好
な画質を与えるものではない。
とその符号量制御への応用」(信学技報、IE−95,
DSP95−10,1995年5月、以下、これを文献
2と記す。)にも記述されているように、MPEG2
Test Model5で定められている符号量制御方
式は、MPEG2画像符号化部において、必ずしも良好
な画質を与えるものではない。
【0054】文献2では、特に、GOP内における各フ
レーム毎の最適な符号量配分を与える手法として、以下
の方式を提案している。
レーム毎の最適な符号量配分を与える手法として、以下
の方式を提案している。
【0055】NI,NP,およびNBをGOP内におい
てまだ符号化されていないI,PおよびBピクチャの枚
数とし、これらに割り当てられる符号量をRI,RP,
RBとすれば、以下の式(24)に示すような固定レー
ト条件が成立する。
てまだ符号化されていないI,PおよびBピクチャの枚
数とし、これらに割り当てられる符号量をRI,RP,
RBとすれば、以下の式(24)に示すような固定レー
ト条件が成立する。
【0056】
【数14】
【0057】それぞれのフレームにおける量子化ステッ
プサイズをQI,QP,QBとし、mを量子化ステップ
サイズと再生誤差分散を関係付ける次数とすれば、すな
わち、量子化ステップサイズをm乗したものの平均値の
最小化が再生誤差分散を最低にすると仮定すれば、以下
に示す式(25)を最小にすることによって、GOP内
における各フレーム毎の最適な符号量配分を与える。
プサイズをQI,QP,QBとし、mを量子化ステップ
サイズと再生誤差分散を関係付ける次数とすれば、すな
わち、量子化ステップサイズをm乗したものの平均値の
最小化が再生誤差分散を最低にすると仮定すれば、以下
に示す式(25)を最小にすることによって、GOP内
における各フレーム毎の最適な符号量配分を与える。
【0058】
【数15】
【0059】なお、それぞれのフレームにおける平均ス
ケールQおよび符号量Rは、MPEG2 Test M
odel5においても用いられる媒体変数としての各フ
レームのコンプレキシティXと、以下に示す式(26)
のように関係付けられる。
ケールQおよび符号量Rは、MPEG2 Test M
odel5においても用いられる媒体変数としての各フ
レームのコンプレキシティXと、以下に示す式(26)
のように関係付けられる。
【0060】
【数16】
【0061】したがって、式(24)の拘束条件の下で
式(26)を考慮に入れて、式(25)を最小にするよ
うなRI,RP,RBをラグランジェの未定乗数法を用
いて算出すると、最適なRI,RP,RBとして、以下
に示す式(27)乃至(29)のような値が求められ
る。
式(26)を考慮に入れて、式(25)を最小にするよ
うなRI,RP,RBをラグランジェの未定乗数法を用
いて算出すると、最適なRI,RP,RBとして、以下
に示す式(27)乃至(29)のような値が求められ
る。
【0062】
【数17】
【0063】α=1として、式(27)乃至(29)
と、MPEG2 Test Model5で定められた
符号量制御方式における上述の式(8)乃至(9)との
関係は、以下の通りである。すなわち、式(27)乃至
(29)は、符号量制御の媒介変数であるKp,Kbを
各フレームのコンプレキシティXI,XP、XBに応じ
て、以下に示す式(30)のように適応的に算出してい
る。
と、MPEG2 Test Model5で定められた
符号量制御方式における上述の式(8)乃至(9)との
関係は、以下の通りである。すなわち、式(27)乃至
(29)は、符号量制御の媒介変数であるKp,Kbを
各フレームのコンプレキシティXI,XP、XBに応じ
て、以下に示す式(30)のように適応的に算出してい
る。
【0064】
【数18】
【0065】文献2では、上式の1/(1+m)の値を
0.6〜1.2に設定することで良好な画質が得られる
ことが示されている。
0.6〜1.2に設定することで良好な画質が得られる
ことが示されている。
【0066】しかし、上述した図5に示す画像情報変換
装置101では、MPEG2 Test Model5
において定められた手法を用いて符号量制御を行った場
合、GOP内でシーンチェンジ等が起こる場合のコンプ
レキシティの変化に対応できないため、安定した符号量
制御が困難となり、画質劣化を生じることがある。
装置101では、MPEG2 Test Model5
において定められた手法を用いて符号量制御を行った場
合、GOP内でシーンチェンジ等が起こる場合のコンプ
レキシティの変化に対応できないため、安定した符号量
制御が困難となり、画質劣化を生じることがある。
【0067】そこで、図7に示す画像情報変換装置10
2が提案されている。画像情報変換装置102は、図5
に示す画像情報変換装置101の構成に加え、圧縮情報
解析部118と、情報バッファ119と、コンプレキシ
ティ算出部120と、MPEG4画像情報(I/P−V
OP)符号化部121とを備えている。ここで、図5に
示す画像情報変換装置101と同様の機能を有する構成
については、同一符号を付して詳細な説明は省略する。
2が提案されている。画像情報変換装置102は、図5
に示す画像情報変換装置101の構成に加え、圧縮情報
解析部118と、情報バッファ119と、コンプレキシ
ティ算出部120と、MPEG4画像情報(I/P−V
OP)符号化部121とを備えている。ここで、図5に
示す画像情報変換装置101と同様の機能を有する構成
については、同一符号を付して詳細な説明は省略する。
【0068】圧縮情報解析部118、復号処理に用いら
れた量子化スケールのフレーム全体にわたる平均値Q
と、MPEG2ビットストリームにおいて当該フレーム
に割り当てられた総符号量(ビット数)Bとを解析し、
必要な情報を情報バッファ119に伝送する。
れた量子化スケールのフレーム全体にわたる平均値Q
と、MPEG2ビットストリームにおいて当該フレーム
に割り当てられた総符号量(ビット数)Bとを解析し、
必要な情報を情報バッファ119に伝送する。
【0069】情報バッファ119は、MPEG2ビット
ストリームにおけるI/Pピクチャの発生符号量(ビッ
ト数)および平均量子化スケールを蓄積する。
ストリームにおけるI/Pピクチャの発生符号量(ビッ
ト数)および平均量子化スケールを蓄積する。
【0070】コンプレキシティ算出部120は、情報バ
ッファ119に格納されたフレーム毎の情報QおよびB
から、MPEG4画像圧縮情報(以下、MPEG4ビッ
トストリームと記す。)の各VOPに対するコンプレキ
シティXの推定値を上述した式(20)により算出す
る。
ッファ119に格納されたフレーム毎の情報QおよびB
から、MPEG4画像圧縮情報(以下、MPEG4ビッ
トストリームと記す。)の各VOPに対するコンプレキ
シティXの推定値を上述した式(20)により算出す
る。
【0071】圧縮情報解析部118において、復号処理
に用いられた量子化スケールのフレーム全体にわたる平
均値Q、およびMPEG2ビットストリームにおいて、
当該フレームに割り当てられた総符号量(ビット数)B
は、情報バッファ119に格納される。
に用いられた量子化スケールのフレーム全体にわたる平
均値Q、およびMPEG2ビットストリームにおいて、
当該フレームに割り当てられた総符号量(ビット数)B
は、情報バッファ119に格納される。
【0072】コンプレキシティ算出部120において
は、情報バッファ119に格納されたフレーム毎の情報
QおよびBから、当該フレームに対するコンプレキシテ
ィXを以下の式(31)により算出する。
は、情報バッファ119に格納されたフレーム毎の情報
QおよびBから、当該フレームに対するコンプレキシテ
ィXを以下の式(31)により算出する。
【0073】
【数19】
【0074】上述の式(31)によって算出された当該
フレームに対するコンプレキシティXは、1GOV分バ
ッファリングされた後、MPEG4画像情報符号化部1
5に符号量制御のための媒介変数として伝送される。こ
のため、1GOV分の遅延が必要となる。この遅延は遅
延バッファとしてのビデオメモリ114を用いて実現さ
れる。
フレームに対するコンプレキシティXは、1GOV分バ
ッファリングされた後、MPEG4画像情報符号化部1
5に符号量制御のための媒介変数として伝送される。こ
のため、1GOV分の遅延が必要となる。この遅延は遅
延バッファとしてのビデオメモリ114を用いて実現さ
れる。
【0075】以下では、式(31)において算出された
GOV内の各フレームに対するコンプレキシティXがM
PEG4画像情報符号化部15においてどの様に用いら
れるかについて述べる。なお、以下では、ピクチャタイ
プ判別部10が装置内に存在せず、フレームレートの変
換を行わない場合も考慮することにする。
GOV内の各フレームに対するコンプレキシティXがM
PEG4画像情報符号化部15においてどの様に用いら
れるかについて述べる。なお、以下では、ピクチャタイ
プ判別部10が装置内に存在せず、フレームレートの変
換を行わない場合も考慮することにする。
【0076】式(30)によって求められたKp、Kb
は、I−VOPに対する理想的な平均量子化スケールQ
i_idealに対するP−VOP/B−VOPに対す
る理想的な平均量子化スケールQp_idealとQ
b_idealとの比が、以下の式(32)であること
である。
は、I−VOPに対する理想的な平均量子化スケールQ
i_idealに対するP−VOP/B−VOPに対す
る理想的な平均量子化スケールQp_idealとQ
b_idealとの比が、以下の式(32)であること
である。
【0077】
【数20】
【0078】MPEG2 Test Model5にお
いては、式(30)のように適応的にKp、Kbを算出
することを行わず、式(7)に示したような固定値を用
いている。
いては、式(30)のように適応的にKp、Kbを算出
することを行わず、式(7)に示したような固定値を用
いている。
【0079】式(30)および式(32)から、任意の
VOP1と、任意のVOP2とに対するコンプレキシテ
ィをそれぞれX1,X2とし、理想的な量子化スケール
をQ 1_ideal、Q2_idealとすれば、以下
の式(33)に示すようになる。
VOP1と、任意のVOP2とに対するコンプレキシテ
ィをそれぞれX1,X2とし、理想的な量子化スケール
をQ 1_ideal、Q2_idealとすれば、以下
の式(33)に示すようになる。
【0080】
【数21】
【0081】あるいはまた、MPEG2 Test M
odel5のように式(7)に示した固定値を用いたい
場合には、式(33)の代わりに以下の式(34)を用
いればよい。
odel5のように式(7)に示した固定値を用いたい
場合には、式(33)の代わりに以下の式(34)を用
いればよい。
【0082】
【数22】
【0083】ここで、GOV内の未符号化されたVOP
に対して割り当てられる総符号量(ビット数)をRと
し、Rが各VOPに対して、R1、R2、・・・、Rn
と割り当てられるとき、当該GOVに対する画質が最適
化されるものとする。このとき、RとR1、R2、・・
・、Rnの間には、以下の式(35)に示す関係式が成
り立つ。
に対して割り当てられる総符号量(ビット数)をRと
し、Rが各VOPに対して、R1、R2、・・・、Rn
と割り当てられるとき、当該GOVに対する画質が最適
化されるものとする。このとき、RとR1、R2、・・
・、Rnの間には、以下の式(35)に示す関係式が成
り立つ。
【0084】
【数23】
【0085】任意のVOPkに対する平均量子化スケー
ルQk、割当符号量Rk,コンプレキシティXkの間に
は、以下に示す式(36)で表される関係が成り立つ。
ルQk、割当符号量Rk,コンプレキシティXkの間に
は、以下に示す式(36)で表される関係が成り立つ。
【0086】
【数24】
【0087】ここで、式(36)を考慮して、式(3
5)を変形すると以下に示す式(37)を得る。
5)を変形すると以下に示す式(37)を得る。
【0088】
【数25】
【0089】式(37)において、K(X1,X2)
は、式(33)に示した値を用いても、式(34)に示
した値を用いてもよいが、前者の方が画像に応じたより
最適な符号量配分を実現することが可能である。
は、式(33)に示した値を用いても、式(34)に示
した値を用いてもよいが、前者の方が画像に応じたより
最適な符号量配分を実現することが可能である。
【0090】その際、1/(1+m)の値を1.0と設
定することで指数演算が不要となるため、高速な実行が
可能となる。また、1/(1+m)の値を1.0以外に
設定する場合にも、予めテーブルを持ち、これを参照し
て指数演算を行うことで高速な実行が可能となる。
定することで指数演算が不要となるため、高速な実行が
可能となる。また、1/(1+m)の値を1.0以外に
設定する場合にも、予めテーブルを持ち、これを参照し
て指数演算を行うことで高速な実行が可能となる。
【0091】式(37)における各VOPに対するコン
プレキシティXkは、MPEG4画像符号化によるもの
であるが、MPEG2画像符号化による各フレームに対
するコンプレキシティと、MPEG4画像符号化による
各フレームに対するコンプレキシティが等しいと仮定す
れば、コンプレキシティ算出部20に格納されたXkを
用いることで、式(37)によって当該VOPに対する
目標符号量を算出することを可能としている。
プレキシティXkは、MPEG4画像符号化によるもの
であるが、MPEG2画像符号化による各フレームに対
するコンプレキシティと、MPEG4画像符号化による
各フレームに対するコンプレキシティが等しいと仮定す
れば、コンプレキシティ算出部20に格納されたXkを
用いることで、式(37)によって当該VOPに対する
目標符号量を算出することを可能としている。
【0092】図8に、画像情報変換装置102が目標符
号量を算出する処理を示す。
号量を算出する処理を示す。
【0093】ステップS111において、MPEG2画
像情報復号化部112は、GOP内の各フレームに対す
る平均量子化スケールQ、および割当符号量(ビット
数)Bを抽出する。
像情報復号化部112は、GOP内の各フレームに対す
る平均量子化スケールQ、および割当符号量(ビット
数)Bを抽出する。
【0094】ステップS112において、コンプレキシ
ティ算出部120は、GOP内の各フレームに対する平
均量子化スケールQと割当符号量(ビット数)Bとの積
の演算によりコンプレキシティXを算出する。
ティ算出部120は、GOP内の各フレームに対する平
均量子化スケールQと割当符号量(ビット数)Bとの積
の演算によりコンプレキシティXを算出する。
【0095】続いて、ステップS113において、MP
EG4画像情報符号化部121は、コンプレキシティX
に応じた目標符号量(ターゲットビットレート)の算出
を行う。
EG4画像情報符号化部121は、コンプレキシティX
に応じた目標符号量(ターゲットビットレート)の算出
を行う。
【0096】画像情報変換装置102は、入力されたM
PEG2ビットストリームの1/2×1/2の大きさを
持つ順次走査画像のMPEG4ビットストリームを生成
する装置である。すなわち、例えば入力となるMPEG
2ビットストリームがNTSC規格に準拠している場
合、出力されるMPEG4ビットストリームは、SIF
サイズ(352×240)となっている。画像情報変換
装置102は、間引き部113における動作の変更を行
うことで、これ以外の画枠、例えば上記の例で、約1/
4×1/4の画枠であるQSIF(176×112画
素)サイズの画像に変換することも可能である。
PEG2ビットストリームの1/2×1/2の大きさを
持つ順次走査画像のMPEG4ビットストリームを生成
する装置である。すなわち、例えば入力となるMPEG
2ビットストリームがNTSC規格に準拠している場
合、出力されるMPEG4ビットストリームは、SIF
サイズ(352×240)となっている。画像情報変換
装置102は、間引き部113における動作の変更を行
うことで、これ以外の画枠、例えば上記の例で、約1/
4×1/4の画枠であるQSIF(176×112画
素)サイズの画像に変換することも可能である。
【0097】さらに、また、画像情報変換装置102
は、MPEG2画像情報復号化部112における処理と
して、水平方向、垂直方向それぞれについて入力したM
PEG2ビットストリーム内の8次の離散コサイン変換
係数のうちのすべてを用いた復号処理を行うほか、水平
方向のみ、あるいは水平方向、垂直方向ともに8次の離
散コサイン変換係数のうちの低域成分のみを用いた復号
処理を行い、画質劣化を最小限に抑えながら復号処理に
伴う演算量とビデオメモリ容量とを削減している。
は、MPEG2画像情報復号化部112における処理と
して、水平方向、垂直方向それぞれについて入力したM
PEG2ビットストリーム内の8次の離散コサイン変換
係数のうちのすべてを用いた復号処理を行うほか、水平
方向のみ、あるいは水平方向、垂直方向ともに8次の離
散コサイン変換係数のうちの低域成分のみを用いた復号
処理を行い、画質劣化を最小限に抑えながら復号処理に
伴う演算量とビデオメモリ容量とを削減している。
【0098】ところで、図7に示した画像情報変換装置
を用いて、GOP構造が、例えばn=15;m=3のM
PEG2ビットストリームの変換を行った場合、出力と
して得られるのはGOV構造がn=5;m=1のMPE
G4ビットストリームである。このようなビットストリ
ームは、I−VOPの数が多いため、符号化効率が低
く、良好な画質が得られない場合があったが、入力とな
るMPEG2ビットストリームにおいてIピクチャであ
った画像をMPEG4ビットストリームのP−VOPに
変換し、GOVの進展を行うことによって解決すること
ができる。
を用いて、GOP構造が、例えばn=15;m=3のM
PEG2ビットストリームの変換を行った場合、出力と
して得られるのはGOV構造がn=5;m=1のMPE
G4ビットストリームである。このようなビットストリ
ームは、I−VOPの数が多いため、符号化効率が低
く、良好な画質が得られない場合があったが、入力とな
るMPEG2ビットストリームにおいてIピクチャであ
った画像をMPEG4ビットストリームのP−VOPに
変換し、GOVの進展を行うことによって解決すること
ができる。
【0099】また、画像情報変換装置102では、元々
Iピクチャであった画像には動きベクトルが存在しない
が、直前のPピクチャで用いられていた動きベクトルに
基づいて、一定のサーチレンジ内で動き検出を行うこと
で当該VOPに対する高精度の動きベクトルを算出する
ことによって、画像劣化を解消している。
Iピクチャであった画像には動きベクトルが存在しない
が、直前のPピクチャで用いられていた動きベクトルに
基づいて、一定のサーチレンジ内で動き検出を行うこと
で当該VOPに対する高精度の動きベクトルを算出する
ことによって、画像劣化を解消している。
【0100】さらに、IピクチャをP−VOPに変換し
た場合について考えると、元々のコンプレキシティは、
Iピクチャに関するものであるから、変換後のコンプレ
キシティとして不適切な値であるという問題があった
が、画像情報変換装置102は、直前のPピクチャに対
するコンプレキシティを用いることで、画像劣化を解消
している。
た場合について考えると、元々のコンプレキシティは、
Iピクチャに関するものであるから、変換後のコンプレ
キシティとして不適切な値であるという問題があった
が、画像情報変換装置102は、直前のPピクチャに対
するコンプレキシティを用いることで、画像劣化を解消
している。
【0101】
【発明が解決しようとする課題】ところが、MPEG2
Test Model5では、GOP内におけるIピ
クチャ、PピクチャおよびBピクチャに対する画像の複
雑さを表す変数としてのコンプレキシティXi、Xp、
Xbは、一定であると仮定しているが、実際に、MPE
G4画像情報符号化部115において、MPEG2 T
est Model5で定められた手法によって符号量
制御を行った場合、GOP内にシーンチェンジを含む場
合や、GOP内で景色が著しく変化するような場合で
は、この仮定が成り立たず、安定した符号量制御の妨げ
となり、画像劣化を引き起こす要因ともなる。
Test Model5では、GOP内におけるIピ
クチャ、PピクチャおよびBピクチャに対する画像の複
雑さを表す変数としてのコンプレキシティXi、Xp、
Xbは、一定であると仮定しているが、実際に、MPE
G4画像情報符号化部115において、MPEG2 T
est Model5で定められた手法によって符号量
制御を行った場合、GOP内にシーンチェンジを含む場
合や、GOP内で景色が著しく変化するような場合で
は、この仮定が成り立たず、安定した符号量制御の妨げ
となり、画像劣化を引き起こす要因ともなる。
【0102】ところで、入力されたMPEG2ビットス
トリームにおけるIピクチャが、MPEG4ビットスト
リームにおいて、P−VOPに変換される場合について
考える。
トリームにおけるIピクチャが、MPEG4ビットスト
リームにおいて、P−VOPに変換される場合について
考える。
【0103】図9に、入力したMPEG2ビットストリ
ームにおけるIピクチャをMPEG4ビットストリーム
におけるP−VOPに変換して出力する様子を模式的に
示した。図9において、2番目のIピクチャであるI1
をP−VOPに変換する場合について考える。このと
き、符号量制御のためのパラメータとしてのコンプレキ
シティとして、I1に対しては直前のPピクチャである
P3のコンプレキシティXP3が適用される。
ームにおけるIピクチャをMPEG4ビットストリーム
におけるP−VOPに変換して出力する様子を模式的に
示した。図9において、2番目のIピクチャであるI1
をP−VOPに変換する場合について考える。このと
き、符号量制御のためのパラメータとしてのコンプレキ
シティとして、I1に対しては直前のPピクチャである
P3のコンプレキシティXP3が適用される。
【0104】ここで、I1がシーンチェンジを含む画像
である場合、I1には多くの符号量が割り当てられなけ
ればならない。しかしながら、上述のようにI1に対す
るコンプレキシティとしては、直前のフレームであるP
3のコンプレキテイXP3が用いられるため、I1には
十分な符号量が割り当てられず、画質劣化の原因とな
る。
である場合、I1には多くの符号量が割り当てられなけ
ればならない。しかしながら、上述のようにI1に対す
るコンプレキシティとしては、直前のフレームであるP
3のコンプレキテイXP3が用いられるため、I1には
十分な符号量が割り当てられず、画質劣化の原因とな
る。
【0105】そこで、本発明は、このような従来の実情
に鑑みて提案されたものであり、第1の画像圧縮情報を
入力し、第2の画像圧縮情報を出力する画像情報変換装
置および画像情報変換方法において、第1の画像圧縮情
報を第2の画像圧縮情報へと変換する際に生じる画像の
劣化を回避することを実現する画像情報変換装置および
画像情報変換方法を提供することを目的とする。
に鑑みて提案されたものであり、第1の画像圧縮情報を
入力し、第2の画像圧縮情報を出力する画像情報変換装
置および画像情報変換方法において、第1の画像圧縮情
報を第2の画像圧縮情報へと変換する際に生じる画像の
劣化を回避することを実現する画像情報変換装置および
画像情報変換方法を提供することを目的とする。
【0106】
【課題を解決するための手段】上述した目的を達成する
ために、本発明にかかる画像情報変換装置は、第1の画
像圧縮情報を入力し、第2の画像圧縮情報を出力する画
像情報変換装置において、第1の画像圧縮情報および第
2の画像圧縮情報は、少なくとも画像内符号化画像と画
像間予測符号化画像とを有し、入力した第1の画像圧縮
情報の各フレームに対する画面の複雑さを表す変数に基
づいて出力する第2の画像圧縮情報の各フレームに対す
る目標符号量を算出する際、第1の画像圧縮情報におけ
る画像内符号化画像を第2の画像圧縮情報における画像
間予測符号化画像へと変換するに先立って、変換される
予定のフレームにシーンチェンジが含まれるか否かを検
出するシーンチェンジ検出手段を備えることを特徴とす
る。
ために、本発明にかかる画像情報変換装置は、第1の画
像圧縮情報を入力し、第2の画像圧縮情報を出力する画
像情報変換装置において、第1の画像圧縮情報および第
2の画像圧縮情報は、少なくとも画像内符号化画像と画
像間予測符号化画像とを有し、入力した第1の画像圧縮
情報の各フレームに対する画面の複雑さを表す変数に基
づいて出力する第2の画像圧縮情報の各フレームに対す
る目標符号量を算出する際、第1の画像圧縮情報におけ
る画像内符号化画像を第2の画像圧縮情報における画像
間予測符号化画像へと変換するに先立って、変換される
予定のフレームにシーンチェンジが含まれるか否かを検
出するシーンチェンジ検出手段を備えることを特徴とす
る。
【0107】また、本発明にかかる画像情報変換方法
は、第1の画像圧縮情報を入力し、第2の画像圧縮情報
を出力する画像情報変換方法において、第1の画像圧縮
情報および第2の画像圧縮情報は、少なくとも画像内符
号化画像と画像間予測符号化画像とを有し、入力した第
1の画像圧縮情報の各フレームに対する画面の複雑さを
表す変数に基づいて出力する第2の画像圧縮情報の各フ
レームに対する目標符号量を算出する際、第1の画像圧
縮情報における画像内符号化画像を第2の画像圧縮情報
における画像間予測符号化画像へと変換するに先立っ
て、変換される予定のフレームにシーンチェンジが含ま
れるか否かを検出することを特徴とする。
は、第1の画像圧縮情報を入力し、第2の画像圧縮情報
を出力する画像情報変換方法において、第1の画像圧縮
情報および第2の画像圧縮情報は、少なくとも画像内符
号化画像と画像間予測符号化画像とを有し、入力した第
1の画像圧縮情報の各フレームに対する画面の複雑さを
表す変数に基づいて出力する第2の画像圧縮情報の各フ
レームに対する目標符号量を算出する際、第1の画像圧
縮情報における画像内符号化画像を第2の画像圧縮情報
における画像間予測符号化画像へと変換するに先立っ
て、変換される予定のフレームにシーンチェンジが含ま
れるか否かを検出することを特徴とする。
【0108】ここで、上記第1の画像圧縮情報におい
て、各フレームに割り当てられた符号量と平均量子化ス
ケールとの積を当該フレームに対する画面の複雑さを表
す変数とし、画面の複雑さを表す変数を用いてシーンチ
ェンジが含まれるか否かを検出し、変換される予定のフ
レームにシーンチェンジが含まれることを検出した場合
には、上記画像内符号化画像から上記画像間予測符号化
画像への変換を制限することがあげられる。
て、各フレームに割り当てられた符号量と平均量子化ス
ケールとの積を当該フレームに対する画面の複雑さを表
す変数とし、画面の複雑さを表す変数を用いてシーンチ
ェンジが含まれるか否かを検出し、変換される予定のフ
レームにシーンチェンジが含まれることを検出した場合
には、上記画像内符号化画像から上記画像間予測符号化
画像への変換を制限することがあげられる。
【0109】特に、入力した第1の画像圧縮情報におい
て、画像内符号化画像の画面の複雑さを表す変数から直
前の画像内符号化画像の画面の複雑さを表す変数を引い
たときの絶対値が予め定められた所定の閾値よりも大き
いとき、変換される予定のフレームにシーンチェンジが
含まれるとする。
て、画像内符号化画像の画面の複雑さを表す変数から直
前の画像内符号化画像の画面の複雑さを表す変数を引い
たときの絶対値が予め定められた所定の閾値よりも大き
いとき、変換される予定のフレームにシーンチェンジが
含まれるとする。
【0110】
【本発明の実施の形態】以下、図面を参照しながら、本
発明の実施の形態について具体的に説明する。
発明の実施の形態について具体的に説明する。
【0111】本発明にかかる画像情報変換装置は、入力
したMPEG2画像圧縮情報の各フレームに対するコン
プレキシティに基づいて出力するMPEG4画像圧縮情
報の各フレームに対する目標符号量を算出する際、上記
画像内符号化画像から画像間予測符号化画像への変換に
先立って、変換される予定のフレームにシーンチェンジ
が含まれるか否かを検出し、シーンチェンジを検出した
場合には、画像内符号化画像から画像間予測符号化画像
への変換を制限することにより、画像内符号化画像から
画像間予測符号化画像へと変換するときに生じる画像の
劣化を回避するものである。
したMPEG2画像圧縮情報の各フレームに対するコン
プレキシティに基づいて出力するMPEG4画像圧縮情
報の各フレームに対する目標符号量を算出する際、上記
画像内符号化画像から画像間予測符号化画像への変換に
先立って、変換される予定のフレームにシーンチェンジ
が含まれるか否かを検出し、シーンチェンジを検出した
場合には、画像内符号化画像から画像間予測符号化画像
への変換を制限することにより、画像内符号化画像から
画像間予測符号化画像へと変換するときに生じる画像の
劣化を回避するものである。
【0112】本発明の第1の実施の形態として、図1に
示す画像情報変換装置1は、ピクチャタイプ判別部11
と、圧縮情報解析部12と、MPEG2画像情報復号化
部13と、間引き部14と、ビデオメモリ15と、MP
EG4画像情報符号化部16と、動きベクトル合成部1
7と、動きベクトル検出部18と、情報バッファ19
と、コンプレキシティ算出部20と、シーンチェンジ検
出部21と、GOV構造決定部22とを備えている。
示す画像情報変換装置1は、ピクチャタイプ判別部11
と、圧縮情報解析部12と、MPEG2画像情報復号化
部13と、間引き部14と、ビデオメモリ15と、MP
EG4画像情報符号化部16と、動きベクトル合成部1
7と、動きベクトル検出部18と、情報バッファ19
と、コンプレキシティ算出部20と、シーンチェンジ検
出部21と、GOV構造決定部22とを備えている。
【0113】ピクチャタイプ判別部11は、飛び越し走
査のMPEG2画像圧縮情報(以下、MPEG2ビット
ストリームと記す。)における各フレームのデータを入
力し、画像内符号化画像(以下、Iピクチャと記
す。)、前方予測符号化画像(以下、Pピクチャと記
す。)、双方向予測符号化画像(以下、Bピクチャと記
す。)の何れのピクチャに関するものであるかを判別す
る。ピクチャタイプ判別部11は、IピクチャおよびP
ピクチャ(以下、I/Pピクチャと記す。)に関する情
報は、後段の圧縮情報解析部12に伝送するが、Bピク
チャに関する情報は破棄する。
査のMPEG2画像圧縮情報(以下、MPEG2ビット
ストリームと記す。)における各フレームのデータを入
力し、画像内符号化画像(以下、Iピクチャと記
す。)、前方予測符号化画像(以下、Pピクチャと記
す。)、双方向予測符号化画像(以下、Bピクチャと記
す。)の何れのピクチャに関するものであるかを判別す
る。ピクチャタイプ判別部11は、IピクチャおよびP
ピクチャ(以下、I/Pピクチャと記す。)に関する情
報は、後段の圧縮情報解析部12に伝送するが、Bピク
チャに関する情報は破棄する。
【0114】圧縮情報解析部12は、復号処理に用いら
れた量子化スケールのフレーム全体にわたる平均値Q
と、MPEG2ビットストリームにおいて当該フレーム
に割り当てられた総符号量(ビット数)Bとを解析し、
必要な情報を情報バッファ19に伝送する。
れた量子化スケールのフレーム全体にわたる平均値Q
と、MPEG2ビットストリームにおいて当該フレーム
に割り当てられた総符号量(ビット数)Bとを解析し、
必要な情報を情報バッファ19に伝送する。
【0115】情報バッファ19は、MPEG2ビットス
トリームにおけるI/Pピクチャの発生符号量(ビット
数)および平均量子化スケールを蓄積する。
トリームにおけるI/Pピクチャの発生符号量(ビット
数)および平均量子化スケールを蓄積する。
【0116】コンプレキシティ算出部20は、情報バッ
ファ19に格納されたフレーム毎の情報QおよびBか
ら、MPEG4画像圧縮情報(以下、MPEG4ビット
ストリームと記す。)の各VOPに対するコンプレキシ
ティXの推定値を以下に示す式(38)により算出す
る。ここで、VOP(Video Object Plane)とは、MP
EG2におけるフレームに相当するものである。
ファ19に格納されたフレーム毎の情報QおよびBか
ら、MPEG4画像圧縮情報(以下、MPEG4ビット
ストリームと記す。)の各VOPに対するコンプレキシ
ティXの推定値を以下に示す式(38)により算出す
る。ここで、VOP(Video Object Plane)とは、MP
EG2におけるフレームに相当するものである。
【0117】
【数26】
【0118】MPEG2画像情報復号化部13は、MP
EG2ビットストリームにおけるI/Pピクチャに関す
る情報の復号処理を行う。MPEG2画像情報復号化部
13は、通常のMPEG2画像情報復号化部と同様であ
るが、Bピクチャに関するデータは、ピクチャタイプ判
別部11において廃棄されるため、MPEG2画像情報
復号化部13は、少なくともI/Pピクチャを復号可能
であればよい。
EG2ビットストリームにおけるI/Pピクチャに関す
る情報の復号処理を行う。MPEG2画像情報復号化部
13は、通常のMPEG2画像情報復号化部と同様であ
るが、Bピクチャに関するデータは、ピクチャタイプ判
別部11において廃棄されるため、MPEG2画像情報
復号化部13は、少なくともI/Pピクチャを復号可能
であればよい。
【0119】間引き部14は、MPEG2画像情報復号
化部13からの画像値を入力し、水平方向に1/2の間
引き処理を施し、垂直方向に第1フィールド、もしくは
第2フィールドのどちらか一方のデータのみを残し、他
方を廃棄する処理を施すことによって、入力した画像情
報の1/4の大きさを持つ順次走査画像を生成する。
化部13からの画像値を入力し、水平方向に1/2の間
引き処理を施し、垂直方向に第1フィールド、もしくは
第2フィールドのどちらか一方のデータのみを残し、他
方を廃棄する処理を施すことによって、入力した画像情
報の1/4の大きさを持つ順次走査画像を生成する。
【0120】ところで、例えば、MPEG2画像情報復
号化部13から入力したMPEG2ビットストリームが
NTSC(National Television System Committee)の
規格に準拠した画像、つまり720×480画素、30
Hzの飛び越し走査画像であった場合、間引き部14に
おける間引き処理後の画枠は360×240画素にな
る。ところが、後続のMPEG4画像情報符号化部16
において符号化を行う際、マクロブロック単位の処理を
行うには、水平方向、垂直方向ともに、その画素数が1
6の倍数である必要がある。したがって、間引き部14
は、さらに、そのための画素の補填または廃棄を行う。
すなわち、上記の場合においては、例えば、水平方向の
右端、もしくは左端の8ラインを廃棄して352×24
0画素とする。ここで、MPEG4画像情報をI/P−
VOPと記すものとする。
号化部13から入力したMPEG2ビットストリームが
NTSC(National Television System Committee)の
規格に準拠した画像、つまり720×480画素、30
Hzの飛び越し走査画像であった場合、間引き部14に
おける間引き処理後の画枠は360×240画素にな
る。ところが、後続のMPEG4画像情報符号化部16
において符号化を行う際、マクロブロック単位の処理を
行うには、水平方向、垂直方向ともに、その画素数が1
6の倍数である必要がある。したがって、間引き部14
は、さらに、そのための画素の補填または廃棄を行う。
すなわち、上記の場合においては、例えば、水平方向の
右端、もしくは左端の8ラインを廃棄して352×24
0画素とする。ここで、MPEG4画像情報をI/P−
VOPと記すものとする。
【0121】間引き部14によって生成された順次走査
画像は、ビデオメモリ15に蓄積された後、MPEG4
画像情報符号化部16によって符号化処理が施され、M
PEG4ビットストリームとして出力される。
画像は、ビデオメモリ15に蓄積された後、MPEG4
画像情報符号化部16によって符号化処理が施され、M
PEG4ビットストリームとして出力される。
【0122】入力となるMPEG2ビットストリーム中
の動きベクトル情報は、動きベクトル合成部17に供給
されて、間引き後の画像情報に対する動きベクトルにマ
ッピングされる。
の動きベクトル情報は、動きベクトル合成部17に供給
されて、間引き後の画像情報に対する動きベクトルにマ
ッピングされる。
【0123】動きベクトル検出部18は、動きベクトル
合成部17において合成された動きベクトル値に基づい
て、高精度の動きベクトルを検出する。
合成部17において合成された動きベクトル値に基づい
て、高精度の動きベクトルを検出する。
【0124】画像情報変換装置1は、入力されたMPE
G2ビットストリームの1/2×1/2の大きさを持つ
順次走査画像のMPEG4ビットストリームを生成する
装置である。すなわち、例えば入力となるMPEG2ビ
ットストリームがNTSC規格に準拠している場合、出
力されるMPEG4ビットストリームは、SIFサイズ
(352×240)となっている。画像情報変換装置1
は、間引き部14における動作の変更を行うことで、こ
れ以外の画枠、例えば上記の例で、約1/4×1/4の
画枠であるQSIF(176×112画素)サイズの画
像に変換することも可能である。
G2ビットストリームの1/2×1/2の大きさを持つ
順次走査画像のMPEG4ビットストリームを生成する
装置である。すなわち、例えば入力となるMPEG2ビ
ットストリームがNTSC規格に準拠している場合、出
力されるMPEG4ビットストリームは、SIFサイズ
(352×240)となっている。画像情報変換装置1
は、間引き部14における動作の変更を行うことで、こ
れ以外の画枠、例えば上記の例で、約1/4×1/4の
画枠であるQSIF(176×112画素)サイズの画
像に変換することも可能である。
【0125】さらに、また、画像情報変換装置1は、M
PEG2画像情報復号化部13における処理として、水
平方向、垂直方向それぞれについて入力したMPEG2
ビットストリーム内の8次の離散コサイン変換係数のう
ちのすべてを用いた復号処理を行うほか、水平方向の
み、あるいは水平方向、垂直方向ともに8次の離散コサ
イン変換係数のうちの低域成分のみを用いた復号処理を
行い、画質劣化を最小限に抑えながら復号処理に伴う演
算量とビデオメモリ容量とを削減している。
PEG2画像情報復号化部13における処理として、水
平方向、垂直方向それぞれについて入力したMPEG2
ビットストリーム内の8次の離散コサイン変換係数のう
ちのすべてを用いた復号処理を行うほか、水平方向の
み、あるいは水平方向、垂直方向ともに8次の離散コサ
イン変換係数のうちの低域成分のみを用いた復号処理を
行い、画質劣化を最小限に抑えながら復号処理に伴う演
算量とビデオメモリ容量とを削減している。
【0126】圧縮情報解析部12において、復号処理に
用いられた量子化スケールのフレーム全体にわたる平均
値Q、およびMPEG2ビットストリームにおいて、当
該フレームに割り当てられた総符号量(ビット数)B
は、情報バッファ19に格納される。
用いられた量子化スケールのフレーム全体にわたる平均
値Q、およびMPEG2ビットストリームにおいて、当
該フレームに割り当てられた総符号量(ビット数)B
は、情報バッファ19に格納される。
【0127】コンプレキシティ算出部20においては、
情報バッファ19に格納されたフレーム毎の情報Qおよ
びBから、当該フレームに対するコンプレキシティXを
以下の式(39)により算出する。
情報バッファ19に格納されたフレーム毎の情報Qおよ
びBから、当該フレームに対するコンプレキシティXを
以下の式(39)により算出する。
【0128】
【数27】
【0129】上述の式(39)によって算出された当該
フレームに対するコンプレキシティXは、1GOV分バ
ッファリングされた後、MPEG4画像情報符号化部1
6に符号量制御のための媒介変数として伝送される。こ
のため、1GOV分の遅延が必要となる。この遅延は遅
延バッファとしてのビデオメモリ15を用いて実現され
る。
フレームに対するコンプレキシティXは、1GOV分バ
ッファリングされた後、MPEG4画像情報符号化部1
6に符号量制御のための媒介変数として伝送される。こ
のため、1GOV分の遅延が必要となる。この遅延は遅
延バッファとしてのビデオメモリ15を用いて実現され
る。
【0130】以下では、式(39)において算出された
GOV内の各フレームに対するコンプレキシティXがM
PEG4画像情報符号化部16においてどの様に用いら
れるかについて述べる。なお、以下では、ピクチャタイ
プ判別部11が装置内に存在せず、フレームレートの変
換を行わない場合も考慮することにする。
GOV内の各フレームに対するコンプレキシティXがM
PEG4画像情報符号化部16においてどの様に用いら
れるかについて述べる。なお、以下では、ピクチャタイ
プ判別部11が装置内に存在せず、フレームレートの変
換を行わない場合も考慮することにする。
【0131】以下に示す式(40)によって求められる
Kp、Kbは、I−VOPにおける理想的な平均量子化
スケールQi_idealに対するP−VOPと、B−
VOPににおける理想的な平均量子化スケールQ
p_idealとQb_idealとの比が、以下の式
(41)であることである。
Kp、Kbは、I−VOPにおける理想的な平均量子化
スケールQi_idealに対するP−VOPと、B−
VOPににおける理想的な平均量子化スケールQ
p_idealとQb_idealとの比が、以下の式
(41)であることである。
【0132】
【数28】
【0133】
【数29】
【0134】MPEG2 Test Model5にお
いては、式(40)のように適応的にKp、Kbを算出
することを行わず、以下に示す式(42)のような固定
値を用いている。
いては、式(40)のように適応的にKp、Kbを算出
することを行わず、以下に示す式(42)のような固定
値を用いている。
【0135】
【数30】
【0136】式(40)および式(41)から、任意の
VOP1と、任意のVOP2とに対するコンプレキシテ
ィをそれぞれX1,X2とし、理想的な量子化スケール
をQ 1_ideal、Q2_idealとすれば、以下
の式(43)に示すようになる。
VOP1と、任意のVOP2とに対するコンプレキシテ
ィをそれぞれX1,X2とし、理想的な量子化スケール
をQ 1_ideal、Q2_idealとすれば、以下
の式(43)に示すようになる。
【0137】
【数31】
【0138】あるいはまた、MPEG2 Test M
odel5のように式(42)に示した固定値を用いた
い場合には、式(43)に代えて以下の式(44)を用
いればよい。
odel5のように式(42)に示した固定値を用いた
い場合には、式(43)に代えて以下の式(44)を用
いればよい。
【0139】
【数32】
【0140】ここで、GOV内の未符号化されたVOP
に対して割り当てられる総符号量(ビット数)をRと
し、Rが各VOPに対して、R1、R2、・・・、Rn
と割り当てられるとき、当該GOVに対する画質が最適
化されるものとする。このとき、RとR1、R2、・・
・、Rnの間には、以下の式(45)に示す関係式が成
り立つ。
に対して割り当てられる総符号量(ビット数)をRと
し、Rが各VOPに対して、R1、R2、・・・、Rn
と割り当てられるとき、当該GOVに対する画質が最適
化されるものとする。このとき、RとR1、R2、・・
・、Rnの間には、以下の式(45)に示す関係式が成
り立つ。
【0141】
【数33】
【0142】任意のVOPkに対する平均量子化スケー
ルQk、割当符号量Rk,コンプレキシティXkの間に
は、以下に示す式(46)で表される関係が成り立つ。
ルQk、割当符号量Rk,コンプレキシティXkの間に
は、以下に示す式(46)で表される関係が成り立つ。
【0143】
【数34】
【0144】ここで、Rは各フレーム全体に対する割当
符号量(ビット数)であっても、輝度信号(ビット数)
に対する割当符号量であっても、輝度および色差信号に
対する割当符号量(ビット数)であってもよい。さら
に、式(46)を考慮して、式(45)を変形すると以
下に示す式(47)を得る。
符号量(ビット数)であっても、輝度信号(ビット数)
に対する割当符号量であっても、輝度および色差信号に
対する割当符号量(ビット数)であってもよい。さら
に、式(46)を考慮して、式(45)を変形すると以
下に示す式(47)を得る。
【0145】
【数35】
【0146】式(47)において、K(X1,X2)
は、式(43)に示した値を用いても、式(44)に示
した値を用いてもよいが、前者の方が画像に応じたより
最適な符号量配分を実現することが可能である。
は、式(43)に示した値を用いても、式(44)に示
した値を用いてもよいが、前者の方が画像に応じたより
最適な符号量配分を実現することが可能である。
【0147】その際、1/(1+m)の値を1.0と設
定することで、指数演算を行うことが不要となるため、
高速な実行が可能となる。また、1/(1+m)の値を
1.0以外に設定する場合にも、予めテーブルを持ち、
これを参照して指数演算を行うことで高速な実行が可能
となる。
定することで、指数演算を行うことが不要となるため、
高速な実行が可能となる。また、1/(1+m)の値を
1.0以外に設定する場合にも、予めテーブルを持ち、
これを参照して指数演算を行うことで高速な実行が可能
となる。
【0148】式(47)における各VOPに対するコン
プレキシティXkは、MPEG4画像符号化によるもの
であるが、MPEG2画像符号化による各フレームに対
するコンプレキシティと、MPEG4画像符号化による
各フレームに対するコンプレキシティが等しいと仮定す
れば、コンプレキシティ算出部20に格納されたXkを
用いることで、式(47)によって当該VOPに対する
目標符号量を算出することを可能としている。
プレキシティXkは、MPEG4画像符号化によるもの
であるが、MPEG2画像符号化による各フレームに対
するコンプレキシティと、MPEG4画像符号化による
各フレームに対するコンプレキシティが等しいと仮定す
れば、コンプレキシティ算出部20に格納されたXkを
用いることで、式(47)によって当該VOPに対する
目標符号量を算出することを可能としている。
【0149】図2に、画像情報変換装置1が目標符号量
を算出する処理を示す。
を算出する処理を示す。
【0150】ステップS1において、MPEG2画像情
報復号化部13は、GOP内の各フレームに対する平均
量子化スケールQ、および割当符号量(ビット数)Bを
抽出する。
報復号化部13は、GOP内の各フレームに対する平均
量子化スケールQ、および割当符号量(ビット数)Bを
抽出する。
【0151】ステップS2において、コンプレキシティ
算出部20は、コンプレキシティXを算出する。
算出部20は、コンプレキシティXを算出する。
【0152】続いて、ステップS3において、MPEG
4画像情報符号化部16は、コンプレキシティXに応じ
た目標符号量(ターゲットビットレート)の算出を行
う。コンプレキシティ算出部20においては、式(4
6)により算出された出力されるMPEG4ビットスト
リームにおける、各VOPに対するコンプレキシティの
推定値が蓄積されている。
4画像情報符号化部16は、コンプレキシティXに応じ
た目標符号量(ターゲットビットレート)の算出を行
う。コンプレキシティ算出部20においては、式(4
6)により算出された出力されるMPEG4ビットスト
リームにおける、各VOPに対するコンプレキシティの
推定値が蓄積されている。
【0153】シーンチェンジ検出部21は、この各VO
Pに対するコンプレキシティの推定値に基づいて、入力
されたMPEG2ビットストリームにおけるIピクチャ
をPピクチャに相当するMPEG4ビットストリームの
P−VOPに変換する際に、シーンチェンジが含まれて
いるか否かの検出を行う。
Pに対するコンプレキシティの推定値に基づいて、入力
されたMPEG2ビットストリームにおけるIピクチャ
をPピクチャに相当するMPEG4ビットストリームの
P−VOPに変換する際に、シーンチェンジが含まれて
いるか否かの検出を行う。
【0154】図3に、入力したMPEG2ビットストリ
ームにおけるIピクチャをMPEG4ビットストリーム
におけるP−VOPに変換して出力する様子を模式的に
示した。
ームにおけるIピクチャをMPEG4ビットストリーム
におけるP−VOPに変換して出力する様子を模式的に
示した。
【0155】図3において、I0,I1は、MPEG2
ビットストリームにおけるIピクチャを表し、P0,P
1,P2,P3,P4,P5は、MPEG2ビットスト
リームにおけるPピクチャを表している。さらに、X
I0,XI1は、Iピクチャにおける画面の複雑さを表
す変数としてのコンプレキシティを表し、XP0,XP
1,XP2,XP3,XP4,XP5は、Pピクチャに
おける画面の複雑さを表す変数としてのコンプレキシテ
ィを表している。
ビットストリームにおけるIピクチャを表し、P0,P
1,P2,P3,P4,P5は、MPEG2ビットスト
リームにおけるPピクチャを表している。さらに、X
I0,XI1は、Iピクチャにおける画面の複雑さを表
す変数としてのコンプレキシティを表し、XP0,XP
1,XP2,XP3,XP4,XP5は、Pピクチャに
おける画面の複雑さを表す変数としてのコンプレキシテ
ィを表している。
【0156】ここで、2番目のIピクチャであるI1を
MPEG4ビットストリームのP−VOPへと変換する
場合について考える。このとき、I1がシーンチェンジ
を含む画像である場合、変換時の画質劣化を防止するた
め、I1にはより多くの符号量が割り当てられる必要が
ある。そこでI1がシーンチェンジを含むか否かを検出
する。
MPEG4ビットストリームのP−VOPへと変換する
場合について考える。このとき、I1がシーンチェンジ
を含む画像である場合、変換時の画質劣化を防止するた
め、I1にはより多くの符号量が割り当てられる必要が
ある。そこでI1がシーンチェンジを含むか否かを検出
する。
【0157】画像情報変換装置1におけるシーンチェン
ジ検出部21は、予め定められた閾値THに対し、入力
したMPEG2ビットストリームにおけるIピクチャの
コンプレキシティXI1から、入力したMPEG2ビッ
トストリームの直前のIピクチャのコンプレキシティX
I0を引いたときの絶対値が予め定められた所定の閾値
よりも大きいとき、I1においてシーンチェンジが検出
されたとする。
ジ検出部21は、予め定められた閾値THに対し、入力
したMPEG2ビットストリームにおけるIピクチャの
コンプレキシティXI1から、入力したMPEG2ビッ
トストリームの直前のIピクチャのコンプレキシティX
I0を引いたときの絶対値が予め定められた所定の閾値
よりも大きいとき、I1においてシーンチェンジが検出
されたとする。
【0158】したがって、シーンチェンジ検出部21
は、以下に示す式(48)が成立するとき、I1にシー
ンチェンジが含まれると判断する。
は、以下に示す式(48)が成立するとき、I1にシー
ンチェンジが含まれると判断する。
【0159】
【数36】
【0160】シーンチェンジ検出部21においてシーン
チェンジが検出された場合、GOV構造決定部22は、
MPEG2ビットストリームにおけるIピクチャから、
MPEG4ビットストリームのP−VOPへの変換を行
わないことを決定する。
チェンジが検出された場合、GOV構造決定部22は、
MPEG2ビットストリームにおけるIピクチャから、
MPEG4ビットストリームのP−VOPへの変換を行
わないことを決定する。
【0161】続いて、シーンチェンジ検出部21および
GOV構造決定部22における一連の動作を図4に示
す。
GOV構造決定部22における一連の動作を図4に示
す。
【0162】ステップS11において、MPEG2画像
情報復号化部13において、GOP内の各フレームに対
する平均量子化スケールQおよび割当符号量(ビット
数)Bを抽出する。
情報復号化部13において、GOP内の各フレームに対
する平均量子化スケールQおよび割当符号量(ビット
数)Bを抽出する。
【0163】ステップS12において、各フレームに対
するコンプレキシティXを平均量子化スケールQと割当
符号量(ビット数)Bとの積の演算により算出する。
するコンプレキシティXを平均量子化スケールQと割当
符号量(ビット数)Bとの積の演算により算出する。
【0164】ステップS13において、予め定められた
閾値THに対し、入力したMPEG2ビットストリーム
におけるIピクチャのコンプレキシティXI1から、こ
のMPEG2ビットストリームの直前のIピクチャのコ
ンプレキシティXI0を引いたときの絶対値が予め定め
られた所定の閾値よりも大きいか否かの判別を行う。
閾値THに対し、入力したMPEG2ビットストリーム
におけるIピクチャのコンプレキシティXI1から、こ
のMPEG2ビットストリームの直前のIピクチャのコ
ンプレキシティXI0を引いたときの絶対値が予め定め
られた所定の閾値よりも大きいか否かの判別を行う。
【0165】所定の閾値よりも小さいとき、ステップS
14において、GOV構造決定部22は、Iピクチャか
らP−VOPへの変換を行う。
14において、GOV構造決定部22は、Iピクチャか
らP−VOPへの変換を行う。
【0166】所定の閾値よりも大きいとき、ステップS
15において、GOV構造決定部22は、Iピクチャか
らP−VOPへの変換を行わない。
15において、GOV構造決定部22は、Iピクチャか
らP−VOPへの変換を行わない。
【0167】したがって、以上詳細に説明したように、
シーンチェンジ検出部21においてシーンチェンジが検
出された場合、GOV構造決定部22は、入力されたM
PEG2ビットストリームにおけるIピクチャからPピ
クチャに相当するMPEG4ビットストリームのP−V
OPへの変換を行わないことにより、IピクチャからP
−VOPへと変換する際に生じる画質劣化を回避するこ
とができる。
シーンチェンジ検出部21においてシーンチェンジが検
出された場合、GOV構造決定部22は、入力されたM
PEG2ビットストリームにおけるIピクチャからPピ
クチャに相当するMPEG4ビットストリームのP−V
OPへの変換を行わないことにより、IピクチャからP
−VOPへと変換する際に生じる画質劣化を回避するこ
とができる。
【0168】シーンチェンジ検出の仕方は、式(48)
のように、コンプレキシティXを用いた方法に限らな
い。例えば、図3に示したIピクチャ、I0およびI1
における画素値の平均値をMean_I0,Mean_I
1としたとき、これらの差の絶対値が予め定められた閾
値THよりも大きいとき、I1にシーンチェンジが含ま
れることを検出してもよい。
のように、コンプレキシティXを用いた方法に限らな
い。例えば、図3に示したIピクチャ、I0およびI1
における画素値の平均値をMean_I0,Mean_I
1としたとき、これらの差の絶対値が予め定められた閾
値THよりも大きいとき、I1にシーンチェンジが含ま
れることを検出してもよい。
【0169】つまり、以下の式(49)が成立するか否
かによって、シーンチェンジの有無を検出してもよい。
かによって、シーンチェンジの有無を検出してもよい。
【0170】
【数37】
【0171】ここでMean_I0およびMean_I1
は、全画素値の平均値のほかに、所定の符号化単位とし
ての各マクロブロックの直流成分のフレーム全体にわた
る平均値であっても、輝度信号成分の画素の平均値に関
するものであっても、輝度新合成分の画素の平均値およ
び色差信号成分の画素の平均値に関するものであっても
よい。
は、全画素値の平均値のほかに、所定の符号化単位とし
ての各マクロブロックの直流成分のフレーム全体にわた
る平均値であっても、輝度信号成分の画素の平均値に関
するものであっても、輝度新合成分の画素の平均値およ
び色差信号成分の画素の平均値に関するものであっても
よい。
【0172】以上、画像情報変換装置1においては、入
力されたMPEG2ビットストリームと、出力されるM
PEG4ビットストリームとを対象としてきたが、入力
および出力ともこれらのビットストリームに限らず、例
えばMPEG−1や、H.263等のビットストリーム
であってもよい。
力されたMPEG2ビットストリームと、出力されるM
PEG4ビットストリームとを対象としてきたが、入力
および出力ともこれらのビットストリームに限らず、例
えばMPEG−1や、H.263等のビットストリーム
であってもよい。
【0173】
【発明の効果】以上詳細に説明したように、本発明にか
かる画像情報変換装置は、第1の画像圧縮情報を入力
し、第2の画像圧縮情報を出力する画像情報変換装置に
おいて、第1の画像圧縮情報および第2の画像圧縮情報
は、少なくとも画像内符号化画像と画像間予測符号化画
像とを有し、入力した第1の画像圧縮情報の各フレーム
に対する画面の複雑さを表す変数に基づいて出力する第
2の画像圧縮情報の各フレームに対する目標符号量を算
出する際、第1の画像圧縮情報における画像内符号化画
像を第2の画像圧縮情報における画像間予測符号化画像
へと変換するに先立って、変換される予定のフレームに
シーンチェンジが含まれるか否かを検出するシーンチェ
ンジ検出手段を備える。
かる画像情報変換装置は、第1の画像圧縮情報を入力
し、第2の画像圧縮情報を出力する画像情報変換装置に
おいて、第1の画像圧縮情報および第2の画像圧縮情報
は、少なくとも画像内符号化画像と画像間予測符号化画
像とを有し、入力した第1の画像圧縮情報の各フレーム
に対する画面の複雑さを表す変数に基づいて出力する第
2の画像圧縮情報の各フレームに対する目標符号量を算
出する際、第1の画像圧縮情報における画像内符号化画
像を第2の画像圧縮情報における画像間予測符号化画像
へと変換するに先立って、変換される予定のフレームに
シーンチェンジが含まれるか否かを検出するシーンチェ
ンジ検出手段を備える。
【0174】また、本発明にかかる画像情報変換方法
は、第1の画像圧縮情報を入力し、第2の画像圧縮情報
を出力する画像情報変換方法において、第1の画像圧縮
情報および第2の画像圧縮情報は、少なくとも画像内符
号化画像と画像間予測符号化画像とを有し、入力した第
1の画像圧縮情報の各フレームに対する画面の複雑さを
表す変数に基づいて出力する第2の画像圧縮情報の各フ
レームに対する目標符号量を算出する際、第1の画像圧
縮情報における画像内符号化画像を第2の画像圧縮情報
における画像間予測符号化画像へと変換するに先立っ
て、変換される予定のフレームにシーンチェンジが含ま
れるか否かを検出することを特徴とする。
は、第1の画像圧縮情報を入力し、第2の画像圧縮情報
を出力する画像情報変換方法において、第1の画像圧縮
情報および第2の画像圧縮情報は、少なくとも画像内符
号化画像と画像間予測符号化画像とを有し、入力した第
1の画像圧縮情報の各フレームに対する画面の複雑さを
表す変数に基づいて出力する第2の画像圧縮情報の各フ
レームに対する目標符号量を算出する際、第1の画像圧
縮情報における画像内符号化画像を第2の画像圧縮情報
における画像間予測符号化画像へと変換するに先立っ
て、変換される予定のフレームにシーンチェンジが含ま
れるか否かを検出することを特徴とする。
【0175】ここで、上記第1の画像圧縮情報におい
て、各フレームに割り当てられた符号量と平均量子化ス
ケールとの積を当該フレームに対する画面の複雑さを表
す変数とし、画面の複雑さを表す変数を用いてシーンチ
ェンジが含まれるか否かを検出し、変換される予定のフ
レームにシーンチェンジが含まれることを検出した場合
には、上記画像内符号化画像から上記画像間予測符号化
画像への変換を制限することがあげられる。
て、各フレームに割り当てられた符号量と平均量子化ス
ケールとの積を当該フレームに対する画面の複雑さを表
す変数とし、画面の複雑さを表す変数を用いてシーンチ
ェンジが含まれるか否かを検出し、変換される予定のフ
レームにシーンチェンジが含まれることを検出した場合
には、上記画像内符号化画像から上記画像間予測符号化
画像への変換を制限することがあげられる。
【0176】特に、入力した第1の画像圧縮情報におい
て、画像内符号化画像の画面の複雑さを表す変数から直
前の画像内符号化画像の画面の複雑さを表す変数を引い
たときの絶対値が予め定められた所定の閾値よりも大き
いとき、変換される予定のフレームにシーンチェンジが
含まれるとする。
て、画像内符号化画像の画面の複雑さを表す変数から直
前の画像内符号化画像の画面の複雑さを表す変数を引い
たときの絶対値が予め定められた所定の閾値よりも大き
いとき、変換される予定のフレームにシーンチェンジが
含まれるとする。
【0177】したがって、本発明にかかる画像情報変換
装置および画像情報変換方法によれば、第1の画像圧縮
情報を第2の画像圧縮情報へと変換する際の画像の劣
化、特に、第1の画像圧縮情報における画像内符号化画
像から第2の画像圧縮情報における画像間予測符号化画
像へと変換するときに生じる画像の劣化を回避すること
が可能である。
装置および画像情報変換方法によれば、第1の画像圧縮
情報を第2の画像圧縮情報へと変換する際の画像の劣
化、特に、第1の画像圧縮情報における画像内符号化画
像から第2の画像圧縮情報における画像間予測符号化画
像へと変換するときに生じる画像の劣化を回避すること
が可能である。
【図1】本発明の実施の形態として示す画像情報変換装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図2】本発明の実施の形態として示す画像情報変換装
置におけるシーンチェンジ検出部およびGOV構造決定
部がシーンチェンジを検出する動作について示すフロー
チャートである。
置におけるシーンチェンジ検出部およびGOV構造決定
部がシーンチェンジを検出する動作について示すフロー
チャートである。
【図3】本発明の実施の形態として示す画像情報変換装
置が、入力したMPEG2ビットストリームにおけるI
ピクチャをMPEG4ビットストリームにおけるP−V
OPに変換して出力する様子を模式的に示す模式図であ
る。
置が、入力したMPEG2ビットストリームにおけるI
ピクチャをMPEG4ビットストリームにおけるP−V
OPに変換して出力する様子を模式的に示す模式図であ
る。
【図4】本発明の実施の形態として示す画像情報変換装
置におけるシーンチェンジ検出部およびGOV構造決定
部の動作を示すフローチャートである。
置におけるシーンチェンジ検出部およびGOV構造決定
部の動作を示すフローチャートである。
【図5】従来の画像情報変換装置の構成を示すブロック
図である。
図である。
【図6】従来の画像情報変換装置がMPEG2画像情報
復号化部において抽出された各フレームに対するコンプ
レキシティXを用いて、MPEG4画像情報符号化部に
おいて符号量制御を行う動作について示したフローチャ
ートである。
復号化部において抽出された各フレームに対するコンプ
レキシティXを用いて、MPEG4画像情報符号化部に
おいて符号量制御を行う動作について示したフローチャ
ートである。
【図7】従来の画像情報変換装置の構成を示すブロック
図である。
図である。
【図8】従来の画像情報変換装置におけるシーンチェン
ジ検出部およびGOV構造決定部がシーンチェンジを検
出する動作について示すフローチャートである。
ジ検出部およびGOV構造決定部がシーンチェンジを検
出する動作について示すフローチャートである。
【図9】入力されたMPEG2ビットストリームにおけ
るIピクチャを、MPEG4ビットストリームにおける
P−VOPに変換して出力する場合を模式的に示す模式
図である。
るIピクチャを、MPEG4ビットストリームにおける
P−VOPに変換して出力する場合を模式的に示す模式
図である。
1 画像情報変換装置、11 ピクチャタイプ判別部、
12 圧縮情報解析部、13 MPEG2画像情報復号
化部、14 間引き部、15 ビデオメモリ、16 M
PEG4画像情報符号化部、17 動きベクトル合成
部、18 動きベクトル検出部、19 情報バッファ、
20 コンプレキシティ算出部、21 シーンチェンジ
検出部、22 GOV構造決定部
12 圧縮情報解析部、13 MPEG2画像情報復号
化部、14 間引き部、15 ビデオメモリ、16 M
PEG4画像情報符号化部、17 動きベクトル合成
部、18 動きベクトル検出部、19 情報バッファ、
20 コンプレキシティ算出部、21 シーンチェンジ
検出部、22 GOV構造決定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 輝彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 矢ヶ崎 陽一 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 KK01 KK41 LA05 LA07 LB05 MA00 MA23 MB00 MC11 MC32 MC38 ME01 NN01 PP05 PP06 PP14 SS01 SS02 SS08 SS11 TA16 TB04 TC01 TC02 TC04 TC14 TC18 TC36 TC38 TD03 TD05 TD12 UA34
Claims (30)
- 【請求項1】 第1の画像圧縮情報を入力し、第2の画
像圧縮情報を出力する画像情報変換装置において、 上記第1の画像圧縮情報および上記第2の画像圧縮情報
は、少なくとも画像内符号化画像と画像間予測符号化画
像とを有し、 上記入力した第1の画像圧縮情報の各フレームに対する
画面の複雑さを表す変数に基づいて上記出力する第2の
画像圧縮情報の各フレームに対する目標符号量を算出す
る際、第1の画像圧縮情報における画像内符号化画像を
第2の画像圧縮情報における画像間予測符号化画像へと
変換するに先立って、変換される予定のフレームにシー
ンチェンジが含まれるか否かを検出するシーンチェンジ
検出手段を備えることを特徴とする画像情報変換装置。 - 【請求項2】 上記シーンチェンジ検出手段は、変換さ
れる予定のフレームにシーンチェンジが含まれることを
検出した場合には、上記第1の画像圧縮情報における画
像内符号化画像から上記第2の画像圧縮情報における画
像間予測符号化画像への変換を制限することを特徴とす
る請求項1記載の画像情報変換装置。 - 【請求項3】 上記シーンチェンジ検出手段は、上記第
1の画像圧縮情報において、各フレームに割り当てられ
た符号量と平均量子化スケールとの積を当該フレームに
対する上記画面の複雑さを表す変数とし、上記画面の複
雑さを表す変数を用いてシーンチェンジが含まれるか否
かを検出することを特徴とする請求項2記載の画像情報
変換装置。 - 【請求項4】 上記シーンチェンジ検出手段は、上記入
力した第1の画像圧縮情報において、上記画像内符号化
画像の画面の複雑さを表す変数から直前の画像内符号化
画像の画面の複雑さを表す変数を引いたときの絶対値が
予め定められた所定の閾値よりも大きいとき、シーンチ
ェンジが含まれるとすることを特徴とする請求項3記載
の画像情報変換装置。 - 【請求項5】 上記入力した第1の画像圧縮情報におけ
る各フレームに対して割り当てられた符号量は、各フレ
ームに割り当てられた符号量全体であることを特徴とす
る請求項3記載の画像情報変換装置。 - 【請求項6】 上記入力した第1の画像圧縮情報におけ
る各フレームに対して割り当てられた符号量は、少なく
とも輝度信号成分の符号量を含むことを特徴とする請求
項3記載の画像情報変換装置。 - 【請求項7】 上記入力した第1の画像圧縮情報におけ
る各フレームに対して割り当てられた符号量は、輝度信
号成分に関する符号量および色差信号成分に関する符号
量を含むことを特徴とする請求項6記載の画像情報変換
装置。 - 【請求項8】 上記シーンチェンジ検出手段は、各フレ
ームの画素の平均値を用いて変換される予定のフレーム
にシーンチェンジが含まれるか否かを検出することを特
徴とする請求項2記載の画像情報変換装置。 - 【請求項9】 上記シーンチェンジ検出手段は、上記画
像内符号化画像の画素の平均値から直前の画像内符号化
画像の画素の平均値を引いたときの絶対値が予め決めら
れた所定の閾値よりも大きいとき、シーンチェンジが含
まれるとすることを特徴とする請求項8記載の画像情報
変換装置。 - 【請求項10】 上記画像内符号化画像の画素の平均値
は、少なくとも輝度信号成分の画素の平均値を含むこと
を特徴とする請求項8記載の画像情報変換装置。 - 【請求項11】 上記画像内符号化画像の画素の平均値
は、輝度信号成分の画像の平均値および色差信号成分の
画素の平均値を含むことを特徴とする請求項10記載の
画像情報変換装置。 - 【請求項12】 上記シーンチェンジ検出手段は、各フ
レームに含まれる所定の符号化単位の直流成分の平均値
を用いて変換される予定のフレームにシーンチェンジが
含まれるか否かを検出することを特徴とする請求項2記
載の画像情報変換装置。 - 【請求項13】 上記シーンチェンジ検出手段は、上記
画像内符号化画像の所定の符号化単位の直流成分の平均
値から直前の画像内符号化画像の所定の符号化単位の直
流成分の平均値を引いたときの絶対値が予め決められた
所定の閾値よりも大きいとき、シーンチェンジが含まれ
るとすることを特徴とする請求項10記載の画像情報変
換装置。 - 【請求項14】 上記画像内符号化画像の所定の符号化
単位の直流成分の平均値は、少なくとも輝度信号成分の
所定の符号化単位の直流成分の平均値を含むことを特徴
とする請求項12記載の画像情報変換装置。 - 【請求項15】 上記画像内符号化画像の所定の符号化
単位の直流成分の平均値は、輝度信号成分の所定の符号
化単位の直流成分の平均値および色差信号成分の所定の
符号化単位の直流成分の平均値を含むことを特徴とする
請求項14記載の画像情報変換装置。 - 【請求項16】 第1の画像圧縮情報を入力し、第2の
画像圧縮情報を出力する画像情報変換方法において、 上記第1の画像圧縮情報および上記第2の画像圧縮情報
は、少なくとも画像内符号化画像と画像間予測符号化画
像とを有し、 上記入力した第1の画像圧縮情報の各フレームに対する
画面の複雑さを表す変数に基づいて上記出力する第2の
画像圧縮情報の各フレームに対する目標符号量を算出す
る際、上記第1の画像圧縮情報における画像内符号化画
像を上記第2の画像圧縮情報における画像間予測符号化
画像へと変換するに先立って、変換される予定のフレー
ムにシーンチェンジが含まれるか否かを検出することを
特徴とする画像情報変換方法。 - 【請求項17】 変換される予定のフレームにシーンチ
ェンジが含まれることを検出した場合には、上記画像内
符号化画像から上記画像間予測符号化画像への変換を制
限することを特徴とする請求項16記載の画像情報変換
方法。 - 【請求項18】 上記第1の画像圧縮情報において、各
フレームに割り当てられた符号量と平均量子化スケール
との積を当該フレームに対する上記画面の複雑さを表す
変数とし、上記画面の複雑さを表す変数を用いてシーン
チェンジが含まれるか否かを検出することを特徴とする
請求項17記載の画像情報変換方法。 - 【請求項19】 上記入力した第1の画像圧縮情報にお
いて、上記画像内符号化画像の画面の複雑さを表す変数
から直前の画像内符号化画像の画面の複雑さを表す変数
を引いたときの絶対値が予め定められた所定の閾値より
も大きいとき、シーンチェンジが含まれるとすることを
特徴とする請求項18記載の画像情報変換方法。 - 【請求項20】 上記入力した第1の画像圧縮情報にお
ける各フレームに対して割り当てられた符号量は、各フ
レームに割り当てられた符号量全体であることを特徴と
する請求項18記載の画像情報変換方法。 - 【請求項21】 上記入力した第1の画像圧縮情報にお
ける各フレームに対して割り当てられた符号量は、少な
くとも輝度信号成分の符号量を含むことを特徴とする請
求項18記載の画像情報変換方法。 - 【請求項22】 上記入力した第1の画像圧縮情報にお
ける各フレームに対して割り当てられた符号量は、輝度
信号成分に関する符号量および色差信号成分に関する符
号量を含むことを特徴とする請求項21記載の画像情報
変換方法。 - 【請求項23】 各フレームの画素の平均値を用いて変
換される予定のフレームにシーンチェンジが含まれるか
否かを検出することを特徴とする請求項17記載の画像
情報変換方法。 - 【請求項24】 上記画像内符号化画像の画素の平均値
から直前の画像内符号化画像の画像の平均値を引いた絶
対値が予め決められた所定の閾値よりも大きいとき、シ
ーンチェンジが含まれるとすることを特徴とする請求項
23記載の画像情報変換方法。 - 【請求項25】 上記画像内符号化画像の画素の平均値
は、少なくとも輝度信号成分の画素の平均値を含むこと
を特徴とする請求項23記載の画像情報変換方法。 - 【請求項26】 上記画像内符号化画像の画素の平均値
は、輝度信号成分の画素の平均値および色差信号成分の
画素の平均値を含むことを特徴とする請求項25記載の
画像情報変換方法。 - 【請求項27】 各フレームに含まれる所定の符号化単
位の直流成分の平均値を用いて変換される予定のフレー
ムにシーンチェンジが含まれるか否かを検出することを
特徴とする請求項17記載の画像情報変換方法。 - 【請求項28】 上記画像内符号化画像の所定の符号化
単位の直流成分の平均値から直前の画像内符号化画像の
所定の符号化単位の直流成分の平均値を引いたときの絶
対値が予め決められた所定の閾値よりも大きいとき、シ
ーンチェンジが含まれるとすることを特徴とする請求項
25記載の画像情報変換方法。 - 【請求項29】 上記画像内符号化画像の所定の符号化
単位の直流成分の平均値は、少なくとも輝度信号成分の
所定の符号化単位の直流成分の平均値を含むことを特徴
とする請求項27記載の画像情報変換方法。 - 【請求項30】 上記画像内符号化画像の所定の符号化
単位の直流成分の平均値は、輝度信号成分の所定の符号
化単位の直流成分の平均値および色差信号成分の所定の
符号化単位の直流成分の平均値を含むことを特徴とする
請求項29記載の画像情報変換方法。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000344491A JP2002152759A (ja) | 2000-11-10 | 2000-11-10 | 画像情報変換装置および画像情報変換方法 |
US09/986,435 US6888889B2 (en) | 2000-11-10 | 2001-11-08 | Image information conversion apparatus and image information conversion method |
US10/986,301 US20050089096A1 (en) | 2000-11-10 | 2004-11-12 | Image information conversion apparatus and image information conversion method |
US11/113,295 US7319721B2 (en) | 2000-11-10 | 2005-04-25 | Image information conversion apparatus and image information conversion method |
US11/113,299 US7515636B2 (en) | 2000-11-10 | 2005-04-25 | Image information conversion apparatus and image information conversion method |
US11/113,290 US7421023B2 (en) | 2000-11-10 | 2005-04-25 | Image information conversion apparatus and image information conversion method |
US11/113,291 US7460598B2 (en) | 2000-11-10 | 2005-04-25 | Image information conversion apparatus and image information conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000344491A JP2002152759A (ja) | 2000-11-10 | 2000-11-10 | 画像情報変換装置および画像情報変換方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002152759A true JP2002152759A (ja) | 2002-05-24 |
Family
ID=18818679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000344491A Withdrawn JP2002152759A (ja) | 2000-11-10 | 2000-11-10 | 画像情報変換装置および画像情報変換方法 |
Country Status (2)
Country | Link |
---|---|
US (6) | US6888889B2 (ja) |
JP (1) | JP2002152759A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009232148A (ja) * | 2008-03-24 | 2009-10-08 | Mega Chips Corp | トランスコーダ |
WO2016203539A1 (ja) * | 2015-06-16 | 2016-12-22 | 三菱電機株式会社 | 画像符号化方式変換装置及び画像符号化方式変換方法 |
CN110166771A (zh) * | 2018-08-01 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、计算机设备和存储介质 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7012959B2 (en) * | 2000-05-25 | 2006-03-14 | Sony Corporation | Picture information conversion method and apparatus |
JP2002152759A (ja) * | 2000-11-10 | 2002-05-24 | Sony Corp | 画像情報変換装置および画像情報変換方法 |
JP4403737B2 (ja) * | 2003-08-12 | 2010-01-27 | 株式会社日立製作所 | 信号処理装置及びこれを用いた撮像装置 |
KR100987765B1 (ko) * | 2003-09-30 | 2010-10-13 | 삼성전자주식회사 | 동영상 부호화기에서의 예측 수행 방법 및 장치 |
JP4470431B2 (ja) * | 2003-10-01 | 2010-06-02 | ソニー株式会社 | データ処理装置およびその方法 |
JP4185011B2 (ja) * | 2004-03-30 | 2008-11-19 | 株式会社東芝 | 画像処理装置、画像処理方法および画像処理プログラム |
JP4335779B2 (ja) * | 2004-10-28 | 2009-09-30 | 富士通マイクロエレクトロニクス株式会社 | 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法 |
JP2006279262A (ja) * | 2005-03-28 | 2006-10-12 | Pioneer Electronic Corp | 符号化映像変換装置、変換方法及びそのプログラム |
JP2008022405A (ja) * | 2006-07-14 | 2008-01-31 | Sony Corp | 画像処理装置および方法、並びに、プログラム |
US9407925B2 (en) | 2008-10-30 | 2016-08-02 | Vixs Systems, Inc. | Video transcoding system with quality readjustment based on high scene cost detection and method for use therewith |
US20100296579A1 (en) * | 2009-05-22 | 2010-11-25 | Qualcomm Incorporated | Adaptive picture type decision for video coding |
KR20110063004A (ko) * | 2009-12-04 | 2011-06-10 | 삼성전자주식회사 | 키 프레임 추출 장치 및 방법과 이를 이용한 방송 녹화 장치 및 방법 |
ES2627431T3 (es) * | 2010-05-12 | 2017-07-28 | Nippon Telegraph And Telephone Corporation | Método y aparato de control de cantidad de código |
FR2965347B1 (fr) | 2010-09-29 | 2015-04-03 | Moving Magnet Tech | Capteur de position ameliore |
US10630991B2 (en) | 2015-12-15 | 2020-04-21 | Nippon Telegraph And Telephone Corporation | Image difference detection device, method for detecting image difference, and computer program |
CN111918068B (zh) * | 2020-08-05 | 2022-03-08 | 电子科技大学 | 基于视频序列特征和QP-λ修正的时域率失真优化方法 |
CN114339196A (zh) * | 2020-09-30 | 2022-04-12 | 华为技术有限公司 | 一种视频编码方法、装置、设备及介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5828832A (en) * | 1996-07-30 | 1998-10-27 | Itt Industries, Inc. | Mixed enclave operation in a computer network with multi-level network security |
GB2318246B (en) * | 1996-10-09 | 2000-11-15 | Sony Uk Ltd | Processing digitally encoded signals |
US6731684B1 (en) * | 1998-09-29 | 2004-05-04 | General Instrument Corporation | Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder |
US6658157B1 (en) * | 1999-06-29 | 2003-12-02 | Sony Corporation | Method and apparatus for converting image information |
US6590938B1 (en) * | 1999-09-30 | 2003-07-08 | Conexant Systems, Inc. | DCT domain conversion of a higher definition signal to lower definition signal |
US6587506B1 (en) * | 1999-11-02 | 2003-07-01 | Matsushita Electric Industrial Co., Ltd. | Video editing apparatus, video editing method, and data storage medium for a video editing program |
US6574279B1 (en) * | 2000-02-02 | 2003-06-03 | Mitsubishi Electric Research Laboratories, Inc. | Video transcoding using syntactic and semantic clues |
US7012959B2 (en) * | 2000-05-25 | 2006-03-14 | Sony Corporation | Picture information conversion method and apparatus |
US6647061B1 (en) * | 2000-06-09 | 2003-11-11 | General Instrument Corporation | Video size conversion and transcoding from MPEG-2 to MPEG-4 |
US6934334B2 (en) * | 2000-10-02 | 2005-08-23 | Kabushiki Kaisha Toshiba | Method of transcoding encoded video data and apparatus which transcodes encoded video data |
JP4517495B2 (ja) * | 2000-11-10 | 2010-08-04 | ソニー株式会社 | 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法 |
JP2002152759A (ja) * | 2000-11-10 | 2002-05-24 | Sony Corp | 画像情報変換装置および画像情報変換方法 |
KR100433516B1 (ko) * | 2000-12-08 | 2004-05-31 | 삼성전자주식회사 | 트랜스코딩 방법 |
US7088780B2 (en) * | 2001-05-11 | 2006-08-08 | Mitsubishi Electric Research Labs, Inc. | Video transcoder with drift compensation |
US7006511B2 (en) * | 2001-07-17 | 2006-02-28 | Avaya Technology Corp. | Dynamic jitter buffering for voice-over-IP and other packet-based communication systems |
JP4346868B2 (ja) * | 2002-06-17 | 2009-10-21 | 株式会社日立製作所 | 動画符号化装置、及び動画記録再生装置、及び動画再生装置、及び動画符号化方法ならびに動画記録再生方法 |
US7203237B2 (en) * | 2003-09-17 | 2007-04-10 | Texas Instruments Incorporated | Transcoders and methods |
JP4345688B2 (ja) * | 2005-02-24 | 2009-10-14 | 株式会社日立製作所 | 内燃機関の診断装置および制御装置 |
-
2000
- 2000-11-10 JP JP2000344491A patent/JP2002152759A/ja not_active Withdrawn
-
2001
- 2001-11-08 US US09/986,435 patent/US6888889B2/en not_active Expired - Fee Related
-
2004
- 2004-11-12 US US10/986,301 patent/US20050089096A1/en not_active Abandoned
-
2005
- 2005-04-25 US US11/113,295 patent/US7319721B2/en not_active Expired - Fee Related
- 2005-04-25 US US11/113,291 patent/US7460598B2/en not_active Expired - Fee Related
- 2005-04-25 US US11/113,290 patent/US7421023B2/en not_active Expired - Fee Related
- 2005-04-25 US US11/113,299 patent/US7515636B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009232148A (ja) * | 2008-03-24 | 2009-10-08 | Mega Chips Corp | トランスコーダ |
WO2016203539A1 (ja) * | 2015-06-16 | 2016-12-22 | 三菱電機株式会社 | 画像符号化方式変換装置及び画像符号化方式変換方法 |
JPWO2016203539A1 (ja) * | 2015-06-16 | 2017-08-31 | 三菱電機株式会社 | 画像符号化方式変換装置及び画像符号化方式変換方法 |
CN110166771A (zh) * | 2018-08-01 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、计算机设备和存储介质 |
CN110166771B (zh) * | 2018-08-01 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US7319721B2 (en) | 2008-01-15 |
US20020106024A1 (en) | 2002-08-08 |
US6888889B2 (en) | 2005-05-03 |
US20050089096A1 (en) | 2005-04-28 |
US20050190840A1 (en) | 2005-09-01 |
US7421023B2 (en) | 2008-09-02 |
US20050190838A1 (en) | 2005-09-01 |
US7460598B2 (en) | 2008-12-02 |
US7515636B2 (en) | 2009-04-07 |
US20050190839A1 (en) | 2005-09-01 |
US20050190841A1 (en) | 2005-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4517495B2 (ja) | 画像情報変換装置及び画像情報変換方法並びに符号化装置及び符号化方法 | |
US7421023B2 (en) | Image information conversion apparatus and image information conversion method | |
US6870886B2 (en) | Method and apparatus for transcoding a digitally compressed high definition television bitstream to a standard definition television bitstream | |
US20070132784A1 (en) | Circuit and method for modifying a region of an encoded image | |
JP2001145113A (ja) | 画像情報変換装置及び方法 | |
US6498816B1 (en) | Circuit and method for formatting each of a series of encoded video images into respective regions | |
JP2002152752A (ja) | 画像情報変換装置及び方法 | |
JP2002125227A (ja) | 画像情報変換装置及び方法 | |
JP4517475B2 (ja) | 画像情報変換装置及び方法並びに符号化装置及び方法 | |
JP4517453B2 (ja) | 画像情報変換装置及び方法並びに符号化装置及び方法 | |
JP4608801B2 (ja) | 画像情報変換装置及び方法 | |
JP4517465B2 (ja) | 画像情報変換装置及び方法並びに符号化装置及び方法 | |
US7012959B2 (en) | Picture information conversion method and apparatus | |
JP4517468B2 (ja) | 画像情報変換装置及び方法並びに符号化装置及び方法 | |
JP2001346214A (ja) | 画像情報変換装置及び方法 | |
JP4505992B2 (ja) | 画像情報変換装置及び方法 | |
JPH10271512A (ja) | 画像信号符号化装置及び方法、画像信号復号装置及び方法、並びに記録媒体 | |
JP2001339720A (ja) | 画像情報変換装置及び方法 | |
JP4507418B2 (ja) | 画像情報変換装置及び画像情報変換方法 | |
JP2003087797A (ja) | 画像情報変換装置及び方法、画像情報変換プログラム、並びに記録媒体 | |
JP2002232891A (ja) | 画像情報変換装置及び方法 | |
JP2003134519A (ja) | 画像情報符号化装置及び方法 | |
JP2002152728A (ja) | 画像情報変換装置及び方法 | |
JP2002125234A (ja) | 画像情報変換装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080205 |