JP2002185969A - 動画像符号化データの形式変換方法及び装置 - Google Patents

動画像符号化データの形式変換方法及び装置

Info

Publication number
JP2002185969A
JP2002185969A JP2001298641A JP2001298641A JP2002185969A JP 2002185969 A JP2002185969 A JP 2002185969A JP 2001298641 A JP2001298641 A JP 2001298641A JP 2001298641 A JP2001298641 A JP 2001298641A JP 2002185969 A JP2002185969 A JP 2002185969A
Authority
JP
Japan
Prior art keywords
data format
side information
format
moving image
converting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001298641A
Other languages
English (en)
Inventor
Noboru Yamaguchi
昇 山口
Toshimitsu Kaneko
敏充 金子
Tomoya Kodama
知也 児玉
Takeshi Mita
雄志 三田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001298641A priority Critical patent/JP2002185969A/ja
Publication of JP2002185969A publication Critical patent/JP2002185969A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】高速に形式変換することを可能にすると共に、
圧縮された動画像の内容を高速に解析してインデキシン
グを行い、構造化データに変換することを可能にする形
式変換装置を提供する。 【解決手段】第1の動画像符号化データ形式であるMP
EG2形式のビットストリームA1をMPEG2デコー
ダ12によりデコードして得られた再生動画像信号A2
及びサイド情報A3をサイズ変換部13により第2の動
画像符号化データ形式であるMPEG4形式に適した形
態に変換し、変換後の再生画像信号A4を変換後のサイ
ド情報A5に含まれる動きベクトル情報を利用してMP
EG4エンコーダ14によってエンコードすることによ
りMPEG4形式のビットストリームA6を得ると同時
に、インデキシング部16によりサイド情報A5に含ま
れる動きベクトルを利用してインデキシング処理を行
い、構造化データA7を得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、1つの動画像符号
化データ形式のビットストリームを他の動画像符号化デ
ータ形式のビットストリームへ変換する動画像符号化デ
ータの形式変換方法及び装置に関する。
【0002】
【従来の技術】動画像符号化の国際標準方式としては、
ISO/IEC JTC1/SC29/WG11のMP
EG1,MPEG2及びMPEG4が知られている。こ
れらの方式の動画像符号化データ形式はそれぞれ異なっ
ている。このような異なる動画像符号化データ形式間で
ビットストリームを高速に変換する技術は形式変換(ト
ランスコード)技術とである。この形式変換技術は、変
換元のビットストリームを一旦デコードしてから再び変
換先の方式でエンコードする再符号化によることにより
形式変換を行う。
【0003】MPEG2形式からMPEG4形式へのト
ランスコードを行う従来の形式変換装置では、MPEG
2ストリーム蓄積部に蓄積されているMPEG2ストリ
ームは、MPEG2デコーダによってデコードされる。
【0004】一般に、MPEG2デコーダで復号される
動画像信号とMPEG4エンコーダでエンコードされる
動画像信号では、画面サイズが異なる。このため、MP
EG2デコーダで再生された動画像信号は、サイズ変換
部によって画面サイズを変換される。
【0005】MPEG4エンコーダは、サイズ変換部か
らの動画像信号をMPEG4形式でエンコードすること
によってMPEG4ストリームを生成し、それをMPE
G4ストリーム蓄積部に蓄積する。このとき、エンコー
ダにおいて動きベクトルの検出が行われ、この動きベク
トルに基づいて画像が再構成される。
【0006】このように従来のトランスコード技術で
は、MPEG2形式からMPEG4形式への変換を行う
とき、動きベクトルを検出する処理を行わなくてはなら
ない。このため、形式変換に要する時間が長くなってし
まう。
【0007】
【発明が解決しようとする課題】上述したように、従来
のトランスコード技術ではある動画像符号化データ形式
のストリームを他の動画像符号化データ形式のストリー
ムに変換する際、元の動画像データ形式のストリームを
フルデコードした後、再生動画像信号のサイズ変換を行
ってから再びエンコードする必要があるため、高速の形
式変換処理を行うことが難しいという問題点があった。
【0008】従って、本発明の目的はある動画像符号化
データ形式のビットストリームを他の動画像符号化デー
タ形式のビットストリームへ高速に変換することができ
る動画像符号化データの形式変換方法及び装置を提供す
ることにある。
【0009】さらに、本発明の他の目的は動画像符号化
データのストリームを高速に形式変換することを可能に
すると共に、圧縮された動画像信号の内容を高速に解析
してインデキシング処理を行って構造化データに変換す
ることを可能にすることである。
【0010】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は第1の動画像符号化データ形式のビットス
トリームを第2の動画像符号化データ形式のビットスト
リームへ変換する際、第1の動画像符号化データ形式の
ビットストリームをデコードして得られた再生画像信号
及びサイド情報を第2の動画像符号化データ形式に適し
た形態に変換し、変換後の再生画像信号を変換後のサイ
ド情報に含まれる動きベクトル情報を利用してエンコー
ドすることにより第2の動画像符号化データ形式のビッ
トストリームを得るようにしたことを特徴とする。
【0011】さらに、第1の動画像符号化データ形式の
ビットストリームをデコードして得られるサイド情報を
利用してインデキシング処理を行う際、変換後の再生画
像信号及びサイド情報を第2の動画像符号化データ形式
に適した形態に変換すると同時にインデキシング処理を
行うことを特徴とする。また、このインデキシングに際
してサイド情報に含まれる動きベクトルの分布を解析し
てカット検出を行うことを特徴とする。
【0012】さらに、本発明によると第1の動画像符号
化データ形式のビットストリームをデコードし、再生画
像信号及びサイド情報を出力する処理と、再生画像信号
とサイド情報を第2の動画像符号化データ形式に適した
形態に変換する処理と、変換後の再生画像信号を変換後
のサイド情報に含まれる動きベクトル情報を利用してエ
ンコードすることにより第2の動画像符号化データ形式
のビットストリームを得る処理と、さらにはサイド情報
を利用したインデキシング処理をコンピュータに実行さ
せるためのプログラム製品が提供される。
【0013】さらに、本発明によると第1動画像符号化
データ形式のビットストリームをデコードして得られる
サイド情報を利用してインデクシング処理を行う際に解
析された、第1の動画像符号化データの構造化情報を利
用して、再生画像信号およびサイド情報を第2の動画像
符号化データ形式に適した形態への変換を行うと共に、
前記構造化情報を利用してエンコードすることにより第
2の動画像符号化データ形式のビットストリームを得る
ようにしたことを特徴とする。
【0014】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して説明する。
【0015】(形式変換装置の全体構成)本発明の第1
の実施形態として、MPEG2形式の動画像符号化デー
タのビットストリームをMPEG4形式の動画像符号化
データのビットストリームへ形式変換(トランスコー
ド)する形式変換装置を説明する。
【0016】図1において、MPEG2ストリーム蓄積
部11に蓄積されているMPEG2ストリームA1は、
MPEG2デコーダ12によってデコード(動画像復号
化)される。これにより、再生動画像信号A2とサイド
情報A3がMPEG4エンコーダ14に適した形態に変
換される。例えば画面サイズやフレーム間隔がMPEG
4エンコーダ14に適した値に変換される。
【0017】サイド情報A3は、MPEG2ストリーム
を復号する過程で得られる内部情報であるデコードピク
チャのタイムスタンプや各マクロブロック(MB)のモ
ード情報及び動きベクトル情報を含む。
【0018】MPEG2デコーダ12から出力される再
生動画像信号A2及びサイド情報A3は、サイズ変換部
13に入力される。MPEG2デコーダ12によって再
生される動画像信号A2とMPEG4エンコーダ14に
よってエンコードされる動画像信号A6の画面サイズが
異なる。このため、サイズ変換部13は、MPEG2復
号動画像信号A2をMPEG4の画面サイズに変換す
る。また、サイズ変換部13はサイド情報A3もMPE
G4エンコーダ14に適した形式に変換する。
【0019】サイズ変換部13から出力される変換後の
動画像信号A4及びサイド情報A5は、MPEG4エン
コーダ14によりエンコード(動画像符号化)される。
これにより得られたMPEG4ストリームA6はMPE
G4ストリーム蓄積部15に蓄積される。
【0020】また、本実施形態では、MPEG2デコー
ダ12から出力される動画像信号A2は、例えば、シー
ン変化に対応する画像にタグを付けるインデキシング処
理にかけられる。すなわち、インデキシング部16はM
PEG2デコーダ12から出力されるサイド情報A3か
ら動きベクトル情報を抽出し、この動きベクトルに基づ
いて後述するようにインデキシングを行う。インデキシ
ング部16から出力される構造化データA7は、構造化
データ蓄積部17に蓄積される。
【0021】図1は、MPEG2ストリーム蓄積部11
に蓄積されたMPEG2ストリームファイルA1から、
MPEG4ストリーム蓄積部15に蓄積されるべきMP
EG4ストリームA6への変換を示している。しかしな
がら、本発明は、ネットワークからMPEG2ストリー
ムが供給されたり、ネットワークへMPEG4ストリー
ムを供給する形態にも適用できる。
【0022】次に、本実施形態の特徴部分であるサイズ
変換部13及びインデキシング部16を説明する前に、
MPEGエンコーダ及びMPEGデコーダを説明する。
動画像符号化の国際標準方式であるMPEG1,MPE
G2およびMPEG4では、符号化の基本方式として動
き補償(MC)と離散コサイン変換(DCT)を組み合
わせたMC+DCT方式が採用されている。以下、三木
編著、“MPEG−4のすべて”第3章、工業調査会、
1998)を参照して、MPEG4検証モデルに従って
説明する。
【0023】(MPEGエンコーダ)図2は、MPEG
エンコーダとして用いられるMC+DCT方式のエンコ
ーダ(動画像符号化装置)の基本構成を示している。輝
度信号のマクロブロック(MB)(16×16画素)の
単位で行う復号化処理を説明する。
【0024】動画像信号201は減算部202に入力さ
れる。減算部202は、動画像信号201と予測信号2
03との差分を計算する。この減算部202の出力信号
204は離散コサイン変換部205に供給される。符号
化モードがフレーム内符号化モードの場合に、動き補償
予測部206で生成される動き補償予測信号207がフ
レーム内/フレーム間切り替え部208を介して減算部
202に供給される。一方、符号化モードがフレーム間
符号化モードの場合には、予測信号203は零とされ、
減算部202は差分信号でなく、入力動画像信号201
をそのまま出力する。フレーム内モードとフレーム間モ
ードとの切り替えは、動きベクトル検出部209によっ
て決定される。この動きベクトル検出部209が、モー
ド判定信号210をフレーム内/フレーム間切り替え部
209に供給することによってモードが切換えられる。
動き補償予測部206は、フレームメモリ211に蓄積
されている符号化済みのフレーム信号212と、動きベ
クトル検出部209によって検出された動きベクトル情
報213とに基づいて動き補償予測信号207を生成す
る。
【0025】減算部202の出力信号204は、離散コ
サイン変換部205により離散コサイン変換され、これ
により得られたDCT係数が量子化部214によって量
子化される。量子化されたDCT係数は、可変長符号化
部215によって可変長符号化されると共に、逆量子化
部216により逆量子化される。逆量子化されたDCT
係数は、逆離散コサイン変換部217により逆離散コサ
イン変換される。これにより、減算部202の出力信号
204に対応する再生信号218が生成される。加算部
219は、逆離散コサイン変換部217からの再生信号
218と予測信号203とを加算し、局部復号画像信号
を生成する。局部復号画像信号は、フレームメモリ21
1に蓄積される。
【0026】可変長符号化部215は、量子化部214
からの量子化DCT係数、並びに動きベクトル情報21
3及び符号化モード情報等のサイド情報を可変長符号化
する。この後、符号化情報がマルチプレクサ221によ
って多重化されることによって、動画像符号化データの
ビットストリーム220が生成される。なお、図2では
量子化部214から可変長符号化部215への入力線は
示されているが、それ以外の入力線は省略されている。
ビットストリーム220は、例えば図1のMPEG2ス
トリーム蓄積部11に蓄積されたり、あるいは図示しな
いネットワークへ送出される。
【0027】(MPEGデコーダ)図3は、図2のエン
コーダに対応するMPEGデコーダとして用いられるM
C+DCT方式のデコーダ(動画像復号化装置)の構成
を示している。MPEGデコーダにより圧縮された動画
像符号化データであるビットストリーム301は可変長
符号復号化部302に入力される。可変長符号復号化部
302は量子化DCT係数303やサイド情報304を
復号する。量子化DCT係数303は、逆量子化部30
5によって逆量子化された後、逆離散コサイン変換部3
06に入力される。逆離散コサイン変換部306は量子
化DCT係数303を逆離散コサイン変換し、画像信号
307を再生する。
【0028】現マクロブロックがサイド情報304によ
りフレーム内符号化モードを示している場合には、フレ
ーム内/フレーム間切り替え部312は、動き補償予測
部309からの動き補償予測信号311をオフにする。
このため、加算部308は、フレーム内/フレーム間切
り替え部312からの信号を供給されないので、加算部
308は、逆離散コサイン変換部306から供給される
画像信号307をそのまま再生画像信号314として出
力する。
【0029】一方、現マクロブロックがフレーム間符号
化モードの場合には、フレーム内/フレーム間切り替え
部312は、動き補償予測部309からの動き補償予測
信号311をオンにする。このため、加算部308は、
フレーム内/フレーム間切り替え部312からの動き補
償予測信号313と逆離散コサイン変換部306からの
動き補償予測誤差信号307とを加算し、加算信号を再
生動画像信号314として出力する。このようにして生
成される再生動画像信号314の一部は、フレームメモ
リ310に蓄積される。フレームメモリ310に蓄積さ
れた再生動画像信号は、動き補償予測部309に供給さ
れる。
【0030】次に、図4のフローチャートを用いて本実
施形態の形式変換装置の処理手順を説明する。
【0031】まず、MPEG4エンコーダ14は要求す
るフレームのタイムスタンプ(demandTS)の初
期値を例えば0に設定する(ステップS101)。この
後、MPEG2ストリーム蓄積部11に蓄積されている
MPEG2ストリームA1がMPEG2デコーダ12内
のストリームバッファに読み込まれる(スプS10
2)。
【0032】次に、ステップS102で読み込んだスト
リームがMPEG2ストリームA1の終端かが判定され
る(ステップS103)。この判定がYESであると、
トランスコード処理が終了する。判定がNOであると、
MPEG2デコーダ12がMPEG2ストリームA1を
デコードし(ステップS104)、動画像信号A2とサ
イド情報A3とを再生する。
【0033】次に、動画像信号A2のピクチャのタイム
スタンプcurTSがサイド情報A3から抽出される(ステ
ップS105)。このタイムスタンプcurTSと要求
フレームのタイムスタンプdemandTSが比較される(ステ
ップS106)。タイムスタンプcurTSがタイムスタン
プdemandTSより小さい場合には、処理はステップS10
2に戻り、ステップS105までの処理を繰り返す。タ
イムスタンプcurTSがタイムスタンプdemandTSより大き
い場合には、ピクチャに対応する再生動画像信号A2と
サイド情報A3がサイズ変換部13に供給される。
【0034】次に、サイズ変換部13は、MPEG2デ
コーダ12より供給される動画像信号A2とサイド情報
A3をMPEG4エンコーダ14に適合した形態にサイ
ズ変換しる。変換後の動画像信号A4とサイド情報A5
はMPEG4エンコーダ14に供給される(ステップS
107)。このステップS107でのサイズ変換の具体
例は後述する。
【0035】次に、MPEG4エンコーダ14は、サイ
ズ変換部13からの変換サイド情報A5に含まれる動き
ベクトル情報を用いて、サイズ変換部13からの変換動
画像信号A4をエンコード(圧縮符号化)する(ステッ
プS108)。具体的には、サイズ変換部13からのサ
イド情報A5に含まれる動きベクトル情報はMPEG4
エンコーダ14内の動きベクトル検出部209(図2)
に破線で示すように供給される。動きベクトル検出部2
09は動きベクトル情報で示される動きベクトルの周囲
を再度探索する。これにより、エンコード処理の中で最
も処理量の大きい動きベクトル検出の処理量が大幅に削
減できる。
【0036】次に、MPEG4エンコーダ14によって
得られたMPEG4ストリームA6は、例えばMPEG
4ストリーム蓄積部15へ出力される(ステップS10
9)。さらにMPEG4エンコーダ14によって決定さ
れるフレームスキップ間隔に応じた次の要求フレームの
タイムスタンプ(demandTS)が求められる(ステップS
110)。この後、処理がステップS102に戻り、上
記の処理が繰り返えされる。
【0037】(サイズ変換部13)図5、図6及び図7
を参照してサイズ変換部13を詳細に説明する。一般
に、MPEG4エンコーダ14はフレームスキップを行
うために、図5に示されるようにMPEG2デコーダ1
2の出力(動画像信号A2及びサイド情報A3)が全て
サイズ変換部13に供給されるのではなく、MPEG4
エンコーダ14が必要とする出力だけがサイズ変換部1
3に供給される。従って、必要とする動画像信号だけが
図11と同様な画面サイズの変換を行えばよい。このた
め、MPEG2デコーダ12の出力フレームレートとM
PEG4エンコーダ14の入力フレームレートが異なる
場合は、画面サイズの変換処理が削減される。
【0038】さらに、先に述べたようにサイズ変換部1
3は、MPEG2デコーダ12からのサイド情報A3
(マクロブロック毎のモード情報と動きベクトル情報)
をMPEG4エンコーダ14に適した形態に変換する。
この変換後のサイド情報A5がMPEG4エンコーダ1
4に供給される。
【0039】サイズ変換部13が画面サイズを変換する
場合には、マクロブロックの数も変わる。図6は、画面
サイズ変換前後のマクロブロックアドレスの対応付けを
示している。図6において、アドレス(h,v)=(0
〜3,0〜2)は、サイズ変換後のマクロブロックのア
ドレスである。一例として、サイズ変換前のマクロブロ
ックのアドレス(H,V)とサイズ変換後のマクロブロ
ックのアドレス(h,v)との対応関係を以下の式で計
算すると、図6中に示されているような対応付けが得ら
れる。ここで、(int)とは小数点以下を切り捨てて
いることを示す。
【0040】H=(int)(7×h/4) V=(int)(5×v/3) 図6のように画面サイズ変換前後でのマクロブロックの
対応付けが実行された後、図7に例示されるようなフレ
ーム間隔に応じた動きベクトルのスケーリング処理が行
われる。図7において、画面サイズ変換後のマクロブロ
ックMB_a,MB_b,MB_cに対応する画面サイ
ズ変換前のマクロブロックは、MB_A,MB_B,M
B_Cとする。このとき、画面サイズ変換後のマクロブ
ロックMB_a,MB_b,MB_cに割り当てられる
動きベクトル3a,3b,3cは動きベクトル2a,2
b,2cを画面サイズ比に応じてスケーリングすること
により得られる。なお、動きベクトル2a,2b,2c
は画面サイズ変換前のマクロブロックMB_A,MB_
B,MB_Cの動きベクトル1a,1b,1cをフレー
ム間隔比に応じてスケーリングして得られる。ここで、
画面サイズ変換前のマクロブロックMB_A,MB_
B,MB_Cに動きベクトルが存在しない場合には,画
面サイズ変換後のマクロブロックMB_a,MB_b,
MB_cの動きベクトルも無いことにする。
【0041】先に述べたように、MPEG4エンコーダ
14の動きベクトル検出部209(図2)は、動きベク
トル3a,3b,3cの近傍(例えば,±1画素)を探
索することにより,少ない処理量で動きベクトル検出が
実行可能となる。なお、動きベクトル3a,3b,3c
が存在しない場合には、ゼロベクトルを基準としてゼロ
ベクトルの周囲の数画素(例えば、±16画素)が探索
される。
【0042】(インデキシング部16)次に、図8及び
図9を参照してインデキシング部16を説明する。本実
施形態は、MPEG2形式からMPEG4形式への形式
変換および動画像信号のインデキシングを行い、構造化
データを出力する。
【0043】図1におけるインデキシング部16は、M
PEG2デコーダ12からのサイド情報A3から動きベ
クトル情報を抽出し、図9に示す動きベクトル取りだし
部902に供給する。この動きベクトル取り出し部90
2は、動きベクトル情報に応じてインデキシング(カッ
ト検出、即ち場面の転換カットの検出)を行う。
【0044】図8のフローチャートを参照して、本実施
形態におけるインデキシング処理手順を説明する。
【0045】まず、MPEG4エンコーダ14が要求す
るフレームのタイムスタンプ(demandTS)の初期値が例
えば0に設定される(ステップS201)。この後、M
PEG2ストリーム蓄積部11に蓄積されているMPE
G2ストリームA1がMPEG2デコーダ12内のスト
リームバッファに読み込まれる(ステップS202)。
【0046】次に、ステップS202において読み込ん
だストリームがMPEG2ストリームA1の終端である
かが判定される(ステップS203)。この判定がYE
Sであると、トランスコード処理が終了する。判定がN
Oであれば、MPEG2デコーダ12によってMPEG
2ストリームA1がデコードされる(ステップS20
4)。これにより、動画像信号A2とサイド情報A3が
再生される。ここまでの処理は、図4中のステップS1
01〜S104の処理と同じである。
【0047】次に、インデキシング部16は、サイド情
報A3に含まれる動きベクトルを利用したインデキシン
グを行う(ステップS205)。ステップS205で得
られたインデキシング結果と対応するサムネールが構造
化データとして構造化データ蓄積部17に出力される
(ステップS206)。サムネールはインデキシング結
果に対応する画像を縮小した画像である。この構造化デ
ータにより、ユーザはMPEG2ストリームA1やMP
EG4ストリームA6のカット位置と、その内容を容易
に確認することが可能となる。
【0048】以降の処理は、図4中に示したステップS
105〜S110の処理と同様である。すなわち、ステ
ップS206の後、MPEG2デコーダ12によって得
られた動画像信号A2のピクチャのタイムスタンプcurT
Sがサイド情報A3から抽出される(ステップS20
7)。このタイムスタンプcurTSと要求フレームのタイ
ムスタンプdemandTSとが比較される(ステップS20
8)。タイムスタンプcurTSがタイムスタンプdemandTS
より小さい場合には、処理はステップS202に戻り、
ステップS207までの処理が繰り返えされる。タイム
スタンプcurTSがタイムスタンプdemandTSより大きい場
合には、ピクチャに対応する再生動画像信号A2とサイ
ド情報A3がサイズ変換部13に供給される。
【0049】次に、サイズ変換部13は、MPEG2デ
コーダ12より供給される動画像信号A2とサイド情報
A3をMPEG4エンコーダ14に適合した形態にサイ
ズ変換し、変換後の動画像信号A4とサイド情報A5を
MPEG4エンコーダ14に供給する(ステップS20
9)。
【0050】次に、MPEG4エンコーダ14は、サイ
ズ変換部13からの変換後のサイド情報A5に含まれる
動きベクトル情報を利用して、サイズ変換後の動画像信
号A4をエンコード(圧縮符号化)する(ステップS2
10)。
【0051】次に、MPEG4エンコーダ14によって
得られたMPEG4ストリームA6は、例えばMPEG
4ストリーム蓄積部15へ出力される(ステップS21
1)。さらにMPEG4エンコーダ14で決定されるフ
レームスキップ間隔に応じた次の要求フレームのタイム
スタンプdemandTSが求められる(ステップS212)。
この後、処理は、ステップS202に戻り、上記の処理
が繰り返えされる。
【0052】次に、図9を参照して動きベクトルを利用
したインデキシング(カット検出)の概要を説明する。
図9は、インデキシンク部16のうちの動きベクトルの
値と尤度比のテーブルとを用いてカットの検出、例えば
シーン変化の検出を行う処理部を示している。ここで動
きベクトルを用いてカットを検出するのは、動きベクト
ルの分布がカットの有無により大きく変化する性質があ
るからである。例えば、同一ショット内の連続したフレ
ームにおいては背景やオブジェクト内の動きが連続して
いることから、隣接するマクロブロックの動きベクトル
は類似していることが多い。
【0053】しかし、カットを挟んだフレーム間では予
測が当たらないために、動きベクトルが存在しない(画
像間予測符号化が使われない)ことが多くなる。予測を
使っている場合でも周囲のマクロブロックとは大きく異
なる動きベクトルが生じやすくなる。また、Bピクチャ
においては、未来と過去の参照画像のうちカットが含ま
れる方向の画像の予測が使われにくい傾向がある。
【0054】図9において、動画像データ入力部901
はMPEGにより圧縮された動画像データの取り込みを
行う。動きベクトル取り出し部902は、動画像信号を
部分的もしくは全体的にデコードし、動きベクトルデー
タを抽出する。対数尤度比変換部903は、動きベクト
ル取り出し部902により取り出された動きベクトルデ
ータから、差分動きベクトル−尤度比変換テーブル90
4を用いてフレーム毎のカット有無の評価値を算出す
る。差分動きベクトルは、符号化順において現マクロブ
ロックと手前のマクロブロックとの動きベクトルの差分
ベクトルである。また、対数尤度比が評価値として用い
られる。フレーム当たりの対数尤度比は、フレーム内の
マクロブロック毎に差分動きベクトルの尤度比の対数を
算出し、結果の対数を加算することによって求められ
る。
【0055】差分動きベクトル−尤度比変換テーブル9
04は、処理前に予め作成しておく必要がある。そのた
めには、カット点が既に分かっている動画像データを用
いて、カットがあるときの差分動きベクトルViの出現
回数Nc(Vi)およびカットがないときのViの出現
回数Nn(Vi)が算出される。このとき、Viの尤度
比は次式により算出される。
【0056】
【数1】
【0057】最後に、しきい値処理部905は、対数尤
度比変換部903から出力されるフレーム当たりの対数
尤度比と予め設定されたしきい値とを比較する。フレー
ムがカットである尤度比がしきい値を上回っていた場合
には、カットがあったこと示し、そうでない場合は、し
きい値処理部905が、カット無しを示すカットデータ
を出力する。
【0058】次に、本発明の他の実施形態に係る動画像
符号化データの形式変換装置を図10〜図13を参照し
て説明する。
【0059】本実施形態では、MPEG2形式からMP
EG4形式ヘ動画像符号化が変換されるとき、動画像デ
ータの解析処理の結果を利用して動画像符号化が高画質
にMPEG4形式へ変換される。
【0060】図10に示すインデクシング部16は、M
PEG4デコーダ12からの供給されるサイド情報A3
から動きベクトル情報を抽出し、図9を参照して説明し
た処理に従ってインデクシングを行う。この際、図11
に示すように動きベクトルの分布が求められ、インデッ
キシングが行われている。つまり、インデクシング部1
6は、フレーム間の予測があたるか否かを示す情報A8
を求める。この情報A8は、図1のサイズ変換部13や
MPEG4エンコーダ14の処理を開始する前に求めて
おく。これにより、サイズ変換部13やMPEG4エン
コーダ14での処理は適切に切り替えることが可能とな
る。
【0061】具体的には、インデクシング部16が、図
12に図示される位置でカット点(場面の転換カット)
を検出すると、順方向ベクトル1bは信頼できないの
で、次のような方法が取られる。
【0062】a)サイズ変換されて得られた動きベクト
ル3bの周囲がMPEG4エンコーダ14によって再探
索される範囲が通常よりも広く設定される。これによ
り、より信頼性の高い動きベクトルが検出される。
【0063】b)サイズ変換部13で動きベクトルを求
めずにMPEG4エンコーダ14が、強制的にフレーム
内符号化を行う。
【0064】より高速にMPEG2形式からMPEG4
形式へ動画像符号化を変換したい場合には、動きベクト
ル検出処理の処理量が端折られるため強制的にフレーム
内符号化が行われた方が望ましい。
【0065】図13(a)〜(d)は、動きベクトルの
分布の例を示している。図13(a)は、放射状に分布
する動きベクトルを示している。図13(b)は、揃っ
て分布している動きベクトルを示している。図13
(c)は、ばらばらに分布する動きベクトルを示してい
る。図13(d)は、ほとんどベクトルが存在しない状
態を示している。
【0066】上記のように複数のグループに分類された
動きベクトルの分布の情報A8をサイズ変換部13やM
PEG−4エンコーダ14に供給することによって、各
グループ毎に適切な動きベクトルの再探索範囲が設定で
きる。これにより、固定の再探索範囲よりも適切な動き
ベクトルが得られ、高画質なMPEG−4エンコードが
実行される。具体的には、図13(a)および(c)の
ように動きベクトルがばらついている場合、図13
(b)および(d)と比較して再探索範囲をより広く設
定すればよい。また、複数のグループに分類された動き
ベクトルの分布の情報A8をサイズ変換部13やMPE
G4エンコーダ14に供給することによって、各グルー
プ毎に適切な画面サイズの変換処理方法が選択できる。
これにより、MPEG4エンコーダ14により高画質な
MPEG−4エンコードが実行される。具体的には、図
13(a)および(c)のように動きベクトルがばらつ
いている場合、図13(b)および(d)と比較してダ
ウンサンプリング時のフィルタを強くかければよい。即
ち、動きベクトルの分布に応じて予測状態を示す情報A
8によりMPEG4エンコーダ14が制御され、フィル
タの強度が情報A8に従って切り替えられる。
【0067】ここで、図14(a)、(b)に示される
ように、カットオフ周波数(fc)が低い場合をフィル
タが強いと呼ぶ。図14(a)よりも(b)の方がフィ
ルタが掛かっていることになる。
【0068】以上説明したように、本発明によればビデ
オの圧縮方式を他の圧縮方式に変換(例えば、MPEG
2形式からMPEG4形式に変換)する際に、変換元の
方式の動きベクトル情報を利用することで、変換先の方
式のエンコード処理を大幅に削減することができ、更に
この動きベクトル情報を利用したインデキシングも並行
して実行可能となる。MPEG4形式に変換する際にイ
ンデクシング結果を利用することで、高画質に形式変換
を行うことが可能となる。
【0069】
【発明の効果】以上説明したように、本発明によればビ
デオの圧縮方式を他の圧縮方式に変換(例えば、MPE
G2形式からMPEG4形式に変換)する際に、変換元
の方式の動きベクトル情報を利用することで、変換先の
方式のエンコード処理を大幅に削減することができ、更
にこの動きベクトル情報を利用したインデキシング処理
も並行して実行可能となる。
【図面の簡単な説明】
【図1】 本発明の一実施形態に係る動画像符号化デー
タの形式変換装置のブロック回路を示す。
【図2】 動画像符号化装置のブロック回路を示す。
【図3】 動画像復号化装置のブロック回路を示す。
【図4】 同実施形態におけるサイズ変換に注目した処
理手順を示すフローチャートである。
【図5】 同実施形態におけるサイズ変換部の動作を説
明する図である。
【図6】 同実施形態におけるサイズ変換部でのマクロ
ブロックアドレスのスケーリングを説明する図である。
【図7】 同実施形態におけるサイズ変換部での動きベ
クトルのスケーリングを説明する図である。
【図8】 同実施形態におけるインデキシングに注目し
た処理手順を示すフローチャートである。
【図9】 同実施形態における動きベクトルを利用した
インデキシング部のブロック回路を示す。
【図10】 本発明の他の実施形態に係る動画像符号化
データの形式変換装置のブロック回路を示す。
【図11】 カット点を説明するための図である。
【図12】 途中にカット点があった場合のサイズ変換
部による動きベクトルのスケーリングを説明する図であ
る。
【図13】 動きベクトルの分布の種類を説明する図で
ある。
【図14】 フィルタ強度を説明する図である。
【符号の説明】
11…MPEG2ストリーム蓄積部 12…MPEG2デコーダ 13…サイズ変換部 14…MPEG4エンコーダ 15…MPEG4ストリーム蓄積部 16…インデキシング部 17…構造化データ蓄積部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 児玉 知也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 三田 雄志 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5C059 KK41 LB05 MA00 MA04 MA05 MA23 MC11 MC38 ME01 NN01 PP04 TA63 TA69 TC12 TD04 UA02 UA05 UA11 5J064 AA03 BA04 BA09 BA16 BB10 BB13 BC01 BC02 BC08 BC11 BC16 BC25 BC29

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】第1の動画像符号化データ形式のビットス
    トリームを第2の動画像符号化データ形式のビットスト
    リームへ変換する方法であって、 前記第1の動画像符号化データ形式のビットストリーム
    をデコードし、再生画像信号及びサイド情報を出力する
    ステップと、 前記再生画像信号及びサイド情報を前記第2の動画像符
    号化データ形式に適した形態に変換するステップと、 変換後の再生画像信号を変換後のサイド情報に含まれる
    動きベクトル情報を利用してエンコードすることにより
    前記第2の動画像符号化データ形式のビットストリーム
    を得るステップとを有することを特徴とする動画像符号
    化データの形式変換方法。
  2. 【請求項2】第1の動画像符号化データ形式のビットス
    トリームを第2の動画像符号化データ形式のビットスト
    リームへ変換する装置であって、 前記第1の動画像符号化データ形式のビットストリーム
    をデコードし、再生画像信号及びサイド情報を出力する
    デコード手段と、 前記デコード手段により得られた再生画像信号及びサイ
    ド情報を前記第2の動画像符号化データ形式に適した形
    態に変換するサイズ変換手段と、 前記サイズ変換手段により得られた変換後の再生画像信
    号を変換後のサイド情報に含まれる動きベクトル情報を
    利用してエンコードすることにより前記第2の動画像符
    号化データ形式のビットストリームを得るエンコード手
    段とを有することを特徴とする動画像符号化データの形
    式変換装置。
  3. 【請求項3】前記デコード手段により得られるサイド情
    報を利用してインデキシング処理を行うインデキシング
    手段を有し、該インデキシング手段は前記サイズ変換手
    段が前記再生画像信号及びサイド情報を前記第2の動画
    像符号化データ形式に適した形態に変換する変換すると
    同時にインデキシング処理を行うことを特徴とする請求
    項2記載の動画像符号化データの形式変換装置。
  4. 【請求項4】前記インデキシング手段は、前記サイド情
    報に含まれる動きベクトルの分布を解析してカット検出
    を行うことを特徴とする請求項3記載の動画像符号化デ
    ータの形式変換装置。
  5. 【請求項5】第1の動画像符号化データ形式のビットス
    トリームを第2の動画像符号化データ形式のビットスト
    リームへ変換する処理をコンピュータに実行させるため
    のプログラム製品であって、 前記第1の動画像符号化データ形式のビットストリーム
    をデコードし、再生画像信号及びサイド情報を出力する
    処理と、前記再生画像信号及びサイド情報を前記第2の
    動画像符号化データ形式に適した形態に変換する処理
    と、変換後の再生画像信号を変換後のサイド情報に含ま
    れる動きベクトル情報を利用してエンコードすることに
    より前記第2の動画像符号化データ形式のビットストリ
    ームを得る処理とをコンピュータに実行させるためのプ
    ログラム製品。
  6. 【請求項6】第1の動画像符号化データ形式のビットス
    トリームを第2の動画像符号化データ形式のビットスト
    リームへ変換する処理をコンピュータに実行させるため
    のプログラム製品であって、 前記第1の動画像符号化データ形式のビットストリーム
    をデコードし、再生画像信号及びサイド情報を出力する
    処理と、前記再生画像信号及びサイド情報を前記第2の
    動画像符号化データ形式に適した形態に変換する処理
    と、変換後の再生画像信号を変換後のサイド情報に含ま
    れる動きベクトル情報を利用してエンコードすることに
    より前記第2の動画像符号化データ形式のビットストリ
    ームを得る処理と、前記サイド情報を利用したインデキ
    シング処理とをコンピュータに実行させるためのプログ
    ラム製品。
  7. 【請求項7】第1の動画像符号化データ形式のビットス
    トリームを第2の動画像符号化データ形式のビットスト
    リームへ変換する手法であって、 前記第1の動画像符号化データ形式のビットストリーム
    をデコードし、再生画像信号およびサイド情報を出力す
    るデコード手段と、 前記デコード手段により得られた再生画像信号およびサ
    イド情報を前記第2の動画像符号化データ形式に適した
    形態に変換するサイズ変換手段と、 前記サイズ変換手段により得られた変換後の再生画像を
    変換後のサイド情報に含まれる動きベクトル情報を利用
    してエンコードすることにより前記第2の動画像符号化
    データ形式のビットストリームを得るエンコード手段
    と、 前記デコード手段により得られるサイド情報を利用して
    動画像の解析を行なうことによってインデクシング処理
    を行うインデクシング手段と、 を具備し、前記インデクシング手段において該動画像を
    解析することにより得られた構造化情報を利用して、前
    記第2の動画像符号化データ形式のビットストリームを
    得ることを特徴とする動画像符号化データの形式変換手
    法。
  8. 【請求項8】前記サイズ変換手段は、前記構造化情報を
    利用して再生画像信号およびサイド情報を前記第2の動
    画像符号化データ形式に適した形態に変換することを特
    徴とする請求項7記載の動画像符号化データの形式変換
    装置。
  9. 【請求項9】前記サイズ変換手段は、再生画像信号を前
    記第2の動画像符号化データ形式に適した形態に変換す
    る際に、ダウンサンプリング時のフィルタの強さを切り
    替えることを特徴とする請求項8記載の動画像符号化デ
    ータの形式変換装置。
  10. 【請求項10】前記エンコード手段は、変換後のサイド
    情報に含まれる動きベクトルの周囲を再探索する手段を
    有し、前記構造化情報を利用して再探索の範囲を切り替
    えることを特徴とする請求項8記載の動画像符号化デー
    タの形式変換装置。
JP2001298641A 2000-10-02 2001-09-27 動画像符号化データの形式変換方法及び装置 Pending JP2002185969A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001298641A JP2002185969A (ja) 2000-10-02 2001-09-27 動画像符号化データの形式変換方法及び装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000302665 2000-10-02
JP2000-302665 2000-10-02
JP2001298641A JP2002185969A (ja) 2000-10-02 2001-09-27 動画像符号化データの形式変換方法及び装置

Publications (1)

Publication Number Publication Date
JP2002185969A true JP2002185969A (ja) 2002-06-28

Family

ID=26601392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001298641A Pending JP2002185969A (ja) 2000-10-02 2001-09-27 動画像符号化データの形式変換方法及び装置

Country Status (1)

Country Link
JP (1) JP2002185969A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002247588A (ja) * 2001-02-21 2002-08-30 Sony Corp 動きベクトル変換方法及び変換装置
JP2006270823A (ja) 2005-03-25 2006-10-05 Tama Tlo Kk 画像レート変換方法及び画像レート変換装置
JP2010525634A (ja) * 2007-04-13 2010-07-22 アイファロ メディア, ゲーエムベーハー ビデオ検出システムおよびビデオ検出方法
US7792373B2 (en) 2004-09-10 2010-09-07 Pioneer Corporation Image processing apparatus, image processing method, and image processing program
US8139877B2 (en) 2006-03-09 2012-03-20 Pioneer Corporation Image processing apparatus, image processing method, and computer-readable recording medium including shot generation

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002247588A (ja) * 2001-02-21 2002-08-30 Sony Corp 動きベクトル変換方法及び変換装置
US7792373B2 (en) 2004-09-10 2010-09-07 Pioneer Corporation Image processing apparatus, image processing method, and image processing program
JP2006270823A (ja) 2005-03-25 2006-10-05 Tama Tlo Kk 画像レート変換方法及び画像レート変換装置
US8139877B2 (en) 2006-03-09 2012-03-20 Pioneer Corporation Image processing apparatus, image processing method, and computer-readable recording medium including shot generation
JP2010525634A (ja) * 2007-04-13 2010-07-22 アイファロ メディア, ゲーエムベーハー ビデオ検出システムおよびビデオ検出方法

Similar Documents

Publication Publication Date Title
US6934334B2 (en) Method of transcoding encoded video data and apparatus which transcodes encoded video data
US8170097B2 (en) Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in series with video
KR101610419B1 (ko) 화상 신호 복호 장치, 화상 신호 복호 방법, 화상 신호 부호화 장치, 화상 신호 부호화 방법 및 기록 매체
EP1359764B1 (en) Video encoding method with fading compensation
EP1359770B1 (en) Signaling for fading compensation in video encoding
WO2009073077A1 (en) An extension to the avc standard to support the encoding and storage of high resolution digital still pictures in parallel with video
JP3855522B2 (ja) 動画変換装置
KR100312421B1 (ko) 영상시스템에서의압축동영상변환장치및그방법
JP2002027469A (ja) ビットストリーム変換方法、ビットストリーム変換装置およびプログラム記録媒体
JP4274653B2 (ja) 動画像合成装置および動画像合成方法
JP3623056B2 (ja) 動画像圧縮装置
JP2002185969A (ja) 動画像符号化データの形式変換方法及び装置
JP3599942B2 (ja) 動画像符号化方法、及び動画像符号化装置
JP4224662B2 (ja) 画像符号化装置および方法、画像復号装置および方法、ならびに画像処理装置
JPH10276437A (ja) 階層的動画像信号符号化/復号化方法及び装置
JP3822821B2 (ja) 画像再生表示装置
JP2003016454A (ja) 物体認識装置及び物体認識方法
JP2001268581A (ja) 画像予測復号化方法,画像予測復号化装置,画像予測符号化方法,画像予測符号化装置,及びデータ記憶媒体
JPH08163561A (ja) 画像データ圧縮装置
JP2002016924A (ja) トランスコーダ装置およびトランスコード方法
JPH0993133A (ja) 符号化形式変換装置
JP3652889B2 (ja) 映像符号化方法、映像符号化装置、記録媒体、及び映像通信システム
KR100327102B1 (ko) 영상시스템에서의압축동영상변환방법
JPH1066092A (ja) 映像データ圧縮装置およびその方法
JPH07298270A (ja) 動き補償フレーム間予測符号化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060404