JPWO2009008177A1 - トランスコーダ、トランスコード方法、デコーダ、およびデコード方法 - Google Patents
トランスコーダ、トランスコード方法、デコーダ、およびデコード方法 Download PDFInfo
- Publication number
- JPWO2009008177A1 JPWO2009008177A1 JP2008551593A JP2008551593A JPWO2009008177A1 JP WO2009008177 A1 JPWO2009008177 A1 JP WO2009008177A1 JP 2008551593 A JP2008551593 A JP 2008551593A JP 2008551593 A JP2008551593 A JP 2008551593A JP WO2009008177 A1 JPWO2009008177 A1 JP WO2009008177A1
- Authority
- JP
- Japan
- Prior art keywords
- video data
- compression
- motion vector
- compression encoding
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Abstract
圧縮符号化方式の異なる映像データ間でのトランスコードを、回路規模を増大させずにかつ高速に行うことができる、トランスコーダおよびトランスコード方法を提供する。デコーダ(1)、シンタックス変換部(2)、エンコーダ(3)を備えたトランスコーダを用いる。デコーダ(1)は、MPEG2方式に従って圧縮符号化された映像データを復号し、これから、MPEG2方式に従って作成されている動きベクトルを抽出し、さらに動きベクトル以外の映像データに対しては逆量子化を行う。シンタックス変換部(2)は、デコーダ(1)からの映像データのシンタックスをH.264方式に変換する。エンコーダ(3)は、シンタックス変換後の映像データを量子化し、これと抽出された動きベクトルとをH.264方式に従って圧縮符号化する。エンコーダ(3)は、さらに、この得られたデータに、動きベクトルがMPEG2に従って作成されていることを示す識別子を付加する。
Description
本発明は、映像データをトランスコードするためのトランスコーダおよびトランスコード方法、さらには、トランスコードして得られた映像データを再生するためのデコーダおよびデコード方法に関する。
従来から、映像を圧縮符号化する方式の一つとして、MPEG2方式が知られている。MPEG2方式は、画質の劣化を抑制しつつ、映像データを圧縮できることから、DVD、デジタル放送といった種々の分野で広く利用されている。
近年においては、H.264方式という新たな圧縮符号化方式も開発されている。H.264方式によれば、MPEG2方式よりも、さらに高い圧縮率で映像を圧縮符号化できる。例えば、MPEG2方式と、H.264方式とによって、同一の映像データを同程度の画質で圧縮符号化した場合、H.264方式によって圧縮符号化された映像データのデータ量は、MPEG2方式によるそれの半分程度となる。さらに、H.264方式は、「Blu−Ray Disc」や、動画再生機能を備えた各種の携帯端末装置において、標準動画形式として採用されている。
但し、放送事業者、番組制作者、映画製作者等は、過去の膨大な映像資産をMPEG2方式によって圧縮符号化している。よって、MPEG2方式によって圧縮符号化された映像データを、H.264方式によって再度圧縮符号化するトランスコーダ(符号変換装置)の開発が求められている。
MPEG2方式によって圧縮符号化された映像データ(MPEG2映像データ)を、H.264方式によって圧縮符号化された映像データ(H.264映像データ)にトランスコードするトランスコーダとしては、クローズドループアーキテクチャを利用したトランスコーダが知られている(例えば、特開2007−104231号公報参照。)。特開2007−104231号公報に開示のトランスコーダは、デコーダと、エンコーダとを備えている。
デコーダは、元のMPEG2映像データに対して、可変長復号化(VLD)、逆量子化、およびIDCT(逆離散コサイン変換)を順に行い、再生映像を生成する。再生映像は、エンコーダのバッファメモリに出力される。エンコーダは、バッファメモリに蓄積された再生映像をフレーム毎に抽出し、抽出した再生映像に対して、DCT(離散コサイン変換)、量子化、および可変長符号化を行い、H.264映像データを作成する。また、エンコーダは、抽出した再生映像に対して動き補償を行うため、参照ピクチャを蓄積する参照メモリを用いて動きベクトルを生成し、生成した動きベクトルに対しても可変長符号化を行う。さらに、動き情報の生成において、エンコーダは、MPEG2映像データ中の動き情報も参照する。
このように、特開2007−104231号公報に開示のトランスコーダによれば、MPEG2映像データをH.264映像データにトランスコードでき、データ量を元のMPEG2映像データのデータ量の半分以下とできる。よって、例えば、ハードディスクレコーダが上記のトランスコーダを備えている場合は、ハードディスク容量が節約され、より多くのタイトルの録画が可能となる。また、伝送速度の低いネットワーク内においても、画質の優れた映像を伝送することが可能となる。
その他、オープンループアーキテクチャを採用したトランスコーダも知られている(例えば、特許第3244399号公報参照)。このトランスコーダは、元の映像データを可変復号化および逆量子化し、得られたデータに対して、量子化ステップ値Qを変えて量子化を行い、そして可変符号化を実行する。この結果、元の映像データよりもデータ量が圧縮された新たな映像データが生成される。
しかしながら、クローズドループアーキテクチャを利用した前者のトランスコーダでは、上述したように、バッファメモリや参照メモリが不可欠であり、多くのメモリリソースが必要となる。また、上記のトランスコーダの実現には、大規模な回路が必要となる。これらの点から、前者のトランスコーダには、安いコストでそれを提供でないという問題がある。
さらに、前者のトランスコーダでは、デコーダは、可変長復号化、逆量子化および逆DCTを行う必要があり、又、エンコーダは、DCT、量子化および可変長符号化を行う必要がある。このため、上記のトランスコーダにおいて、処理の高速化は難しく、トランスコードを完了するまでの時間が、元の映像データの再生時間よりも長くなってしまう場合もある。
一方、オープンループアーキテクチャを利用した後者のトランスコーダでは、デコーダによる逆DCTとエンコーダによるDCTとは行われない。このため、メモリリソースは必要なく、さらに回路規模も小さくてすむため、コストの上昇は抑制される。また、トランスコードの高速化も容易に達成できる。
しかし、後者のトランスコーダは、圧縮符号化方式の変更を目的としたものではなく、MPEG2映像データのデータ量の圧縮のみを目的としたものである。つまり、後者のトラスコーダでは、異なる圧縮符号化方式間でのシンタックスや動き補償の相違を考慮したトランスコードは行われず、MPEG2映像データからH.264映像データへのトランスコードは不可能である。
本発明の目的は、上記問題を解決し、安いコストで、且つ、高速で、圧縮符号化方式の異なる映像データ間でのトランスコードを行うことができ得る、トランスコーダおよびトランスコード方法、このトランスコーダによって得られた映像データをデコードするデコーダおよびデコード方法を提供することにある。
上記目的を達成するために本発明におけるトランスコーダは、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、デコーダと、シンタックス変換部と、エンコーダとを備え、前記デコーダは、前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換し、前記エンコーダは、シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化し、さらに、前記第2の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とする。
上記目的を達成するために本発明におけるトランスコード方法は、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、(a)前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、(b)前記(a)の工程で復号された前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、(c)前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、(d)前記(c)の工程で逆量子化された前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換する工程と、(e)前記(d)の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、(f)前記(e)の工程で量子化された前記映像データと、前記(b)の工程で抽出された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化する工程と、(g)前記(f)の工程で前記第2の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とする。
上記目的を達成するために本発明におけるデコーダは、上記のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第1の圧縮符号化方式に従って動き補償を行うことを特徴とする。
上記目的を達成するために本発明におけるデコード方法は、上記のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、(a)前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第1の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、(b)前記(a)の工程において、前記識別子が付加されていると判定された場合に、前記第1の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とする。
本発明によれば、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを、第2の圧縮符号化方式に従って再符号化することができる。このとき、元の映像データの動きベクトルはそのまま利用され、再度作成されないため、従来のクローズドループアーキテクチャを利用する場合のように、大きなメモリリソースや回路規模は要求されない。よって、本発明によれば、トランスコードにかかるコストの上昇は抑制される。また、本発明では、DCT(離散コサイン変換)やIDCT(逆離散コサイン変換)を行うことなく、トランスコードが可能であるため、処理時間の短縮化も図られる。
本発明におけるトランスコーダは、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、デコーダと、シンタックス変換部と、エンコーダとを備え、前記デコーダは、前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換し、前記エンコーダは、シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化し、さらに、前記第2の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とする。
本発明におけるトランスコード方法は、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、(a)前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、(b)前記(a)の工程で復号された前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、(c)前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、(d)前記(c)の工程で逆量子化された前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換する工程と、(e)前記(d)の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、(f)前記(e)の工程で量子化された前記映像データと、前記(b)の工程で抽出された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化する工程と、(g)前記(f)の工程で前記第2の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とする。
また、本発明は、上記本発明におけるトランスコーダを具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明におけるトランスコーダを得ることができる。さらに、このプログラムを記録した記憶媒体も、本発明の一実施形態である。
また、本発明におけるデコーダは、上記のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第1の圧縮符号化方式に従って動き補償を行うことを特徴とする。
本発明におけるデコード方法は、上記のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、(a)前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第1の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、(b)前記(a)の工程において、前記識別子が付加されていると判定された場合に、前記第1の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とする。
また、本発明は、上記本発明におけるデコーダを具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明におけるデコーダを得ることができる。さらに、このプログラムを記録した記憶媒体も、本発明の一実施形態である。
本発明において、前記第1の圧縮符号化方式としては、MPEG2方式が挙げられる。また、前記第2の圧縮符号化方式としては、H.264方式が挙げられる。
以下、本発明の一実施形態にかかるトランスコーダ、トランスコード方法、デコーダ、デコード方法について、図1〜図8を参照しながら説明する。
[トランスコーダおよびトランスコード方法についての説明]
最初に、本実施の形態におけるトランスコーダの構成について図1〜図5を用いて説明する。図1は、本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図である。図1に示すように、本実施の形態におけるトランスコーダは、デコーダ1と、シンタックス変換部2と、エンコーダ3とを備えている。この構成により、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データは、復号され、第2の圧縮符号化方式に従って再度圧縮符号化される。本実施の形態において、第1の圧縮符号化方式はMPEG2方式であり、第2の圧縮符号化方式はH.264方式である。
最初に、本実施の形態におけるトランスコーダの構成について図1〜図5を用いて説明する。図1は、本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図である。図1に示すように、本実施の形態におけるトランスコーダは、デコーダ1と、シンタックス変換部2と、エンコーダ3とを備えている。この構成により、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データは、復号され、第2の圧縮符号化方式に従って再度圧縮符号化される。本実施の形態において、第1の圧縮符号化方式はMPEG2方式であり、第2の圧縮符号化方式はH.264方式である。
デコーダ1は、復号部4と、逆量子化部5とを備えている。復号部4は、トランスコード対象となる変換元の映像データを復号し、圧縮符号化される前のデータを生成する。本実施の形態では、対象となる映像データは、MPEG2方式に従って、例えばハフマン符号化によって圧縮符号化された、MPEG2映像データ(MPEG2 ES(Elementary Stream))である。復号部4は、可変長符号復号(VLD:Variable Length Decoding)を実行する。
また、復号部4は、復号した映像データから、MPEG2方式に従って作成されている動きベクトルを抽出し、抽出した動きベクトルをエンコーダ3に直接入力する。動きベクトルについては、図2〜図5を用いて後述する。
逆量子化部5は、復号された映像データに対して逆量子化を行う。但し、逆量子化部5による逆量子化は、動きベクトル以外の復号された映像データに対してのみ行われる。逆量子化部5は、逆量子化した映像データをシンタックス変換部2に入力する。
シンタックス変換部2は、デコーダ2の逆量子化部5が入力した映像データのシンタックスをH.264方式によって規定されたシンタックスに変換する。MPEG2方式では、ピクチャが符号化の単位になっているのに対し、H.264方式では、スライスが符号化の単位になっているため(図2参照)、これに合わせてシンタックスが変換される。
具体的には、シンタックス変換部2は、変換元のMPEG2映像データのシーケンスヘッダ(SH:Sequence Head)や、各ピクチャの先頭に付加されているピクチャヘッダを抽出する(図2参照)。そして、シンタックス変換部2は、これらから、H.264方式で規定された、シーケンスパラメータセット(SPS:Sequence Parameter Set)や、ピクチャパラメータセット(PPS:Picture Parameter Set)を作成する。
SPSおよびPPSの中には、それぞれ番号が付加されている。各スライス(図2参照)に付加されているスライスヘッダの中でPPS番号を指定することによって、どのPPSを用いられるかが識別される。また、PPSの中でSPS番号を指定することによって、各スライスが、どのシーケンスに属するかが識別される。また、シンタックス変換部2は、これらのパラメータセットを、これらを参照するデータの前に配置する。
さらに、シンタックス変換部2は、SEI(Supplemental Enhancement Information)や、AUデリミタ(Access Unit Delimiter)の付加を行うこともできる。SEIは、各ピクチャのタイミング情報やランダム・アクセス情報等の付加情報を含むヘッダである。AUデリミタは、ピクチャの先頭を特定するための符号である。
エンコーダ3は、量子化部6と、符号化部7とを備えている。量子化部6は、シンタックス変換部2によってシンタックスが変換された映像データに対して、設定された量子化ステップ値で量子化を行う。符号化部7は、量子化部6によって量子化された映像データと、デコーダ1から入力された動きベクトルとを合わせ、これらをH.264方式に従って圧縮符号化する。
具体的には、符号化部7は、CAVLC(コンテキスト適応型か変調符号化方式:Context-AdaptiveVariable Length Coding)、またはCABAC(コンテキスト適応型2値算術符号化方式:Context-Adaptive Binary Arithmetic Coding)に従って、圧縮符号化を実行する。
さらに、符号化部7は、再符号化した映像データに、動きベクトルがMPEG2方式に従って作成されていること(つまり、動きベクトルについてはH.264方式に従って作成されていないこと)を示す識別子を付加する。そして、符号化部7が再符号化した映像データ(H.264 ES(Elementary Stream))は外部へと出力される。
また、本実施の形態では、エンコーダ3は、ビットレート制御部8を備えている。ビットレート制御部8は、デコーダ1の復号部4が復号したデータと、エンコーダ3の符号化部7が圧縮符号化して作成した映像データとに基づいて、目標となるビットレートを求める。そして、ビットレート制御部8は、求められたビットレートを達成するための量子化ステップ値(除算値)を設定し、設定した量子化ステップ値を量子化部6に入力する。量子化ステップ値が入力されると、量子化部6は、入力された値で量子化を実行する。
ここで、図2〜図5を用いて、動きベクトルについて具体的に説明する。先ず、動きベクトルを含むMPEG2映像データの全体構成について説明する。図2は、MPEG2映像データのデータ構造を示す図である。図2に示すように、MPEG2映像データは、シーケンスレイヤ、GOP(Group of Picture)レイヤ、ピクチャレイヤ、スライスレイヤ、マクロブロックレイヤ、およびブロックレイヤといった6つのレイヤ(階層)によって構成されている。
シーケンスレイヤを構成するシーケンスは、1つ以上のGOPと、それに対応するシーケンスヘッドと、1つのシーケンスエンドコード(終了符号)とで形成されている。シーケンスヘッド中には、動画像シーケンスの特徴を特定する情報、例えば、画面の縦横のサイズ、アスペクト比、画像レート、量子化マトリクスなどが含まれている。
GOPレイヤを構成するGOPは、複数の画面(ピクチャ)の集合によって構成されている。ピクチャとしては、フレーム内符号化によって得られるIピクチャと、双方向予測符号化によって得られるBピクチャと、順方向予測符号化によって得られるPピクチャとの三種類がある。
ピクチャレイヤを構成するピクチャは、一枚の動画像フレームによって構成されている。図示していないが、各ピクチャには、ピクチャヘッダが付加されている。ピクチャヘッド中には、ピクチャの表示順序を示す番号や、ピクチャの種類を特定する符号等が含まれている。
スライスレイヤを構成するスライスは、一枚のピクチャを帯状に断片化して得られたものであり、複数個のマクロブロック(MB)の集合体である。また、マクロブロックレイヤは、スライスの一部である一つのマクロブロックによって構成されている。マクロブロックは、16画素×16ラインの正方形の画素ブロックであり、輝度ブロックYと、対応する2つの8画素×8ラインの色差ブロック(Cb、Cr)とによって構成されている。さらに、マクロブロックは、DCTの処理単位である8画素×8ラインのブロックに細分化され、このブロックがブロックレイヤを構成している。
図2には、MPEG2映像データが開示されているが、H.264映像データも略同様のデータ構造を備えている。但し、上述したように、H.264方式では、スライスが符号化の単位になるため、一つのピクチャに、異なる種類のスライスが混在することもある。さらに、H.264方式では、DCTの処理単位は、4画素×4ラインであり、マクロブロックはさらに細分化される。
また、MPEG2方式およびH.264方式の両方において動き補償が行われる。そして、動画像フレームを分割して得られた動き補償ブロック毎に、動きベクトルが求められ、動きベクトルの符号化が行われる。動き補償ブロックのサイズとしては、MPEG2方式では16×16のみが認められている。一方、H.264では、動き補償ブロックのサイズとしては、16×16に加え、16×8、8×16、8×8、8×4、4×8、4×4も認められている。
動き補償を行うために必要な情報は、マクロブロックレイヤに付加される。図3は、動き補償に必要な情報の一例を示す図である。図3に示すように、MPEG2方式およびH.264方式の両方において、マクロブロックレイヤには、動き補償を特定するために、各動き補償ブロックの参照ピクチャ番号と、各動き補償ブロックの動きベクトルとが付加される。
また、動き補償を行うため、MPEG2方式およびH.264方式のどちらであっても、予測補間信号の生成が行われる。予測補間信号は、整数画素の画素精度よりも低い画素精度を持った信号であり、参照ピクチャの画素値から生成される。但し、両方式において、予測補間信号の生成方法は異なっている。この点について、図4および図5を用いて以下に説明する。
図4は、第1の圧縮符号化方式(MPEG2方式)における予測補間信号の生成を説明する図である。図5は、第2の圧縮符号化方式(H.264方式)における予測補間信号の生成を説明する図である。
図4に示すように、MPEG2方式では、予測補間信号の生成は、2タップ(tap)フィルターを用い、隣接する整数画素信号(□)の中間点では両者の平均値を求めることによって(○)、または、4つの整数画素信号の中央ではこれらの平均値を求めることによって(◇)行われている。MPEG2方式では、動きベクトルは、基本的に半画素精度で表現されている。
一方、図5に示すように、H.264方式では、予測補間信号の生成は、6タップ(tap)フィルターを用いて行われている。具体的には、2つの整数画素信号(□)の、水平方向の中間位置にある(1/2)画素信号(○)は、水平方向に並ぶ6つの整数画素信号に6タップフィルタリング処理を施すことによって作成される。同様に、2つの整数画素信号(□)の、垂直方向の中間位置にある(1/2)画素信号(○)は、垂直方向に並ぶ6つの整数画素信号に6タップフィルタリング処理を施すことによって作成される。
また、4つの整数画素信号(□)の中間位置にある(1/2)画素信号(◇)は、水平方向または垂直方向に並ぶ6つの(1/2)画素信号(○)に6タップフィルタリング処理を施すことによって作成される。(1/2)画素信号を作成した後、平均値フィルターによって(1/4)画素信号(●および◆)が作成される。
このように、予測補間信号の生成において、H.264方式は、MPEG2方式と大きく異なっている。H.264方式では、MPEG2方式に比べて、動きベクトルの予測精度が向上するため、より精度の高い動き補償が可能となる。但し、このため、MPEG2方式に沿って作成された動きベクトルを、H.264方式に沿って作成された動きベクトルに完全にトランスコードするには、従来のクローズドループアーキテクチャを利用するトランスコーダのように、バッファメモリや参照メモリが必要となる。即ち、MPEG2映像データを逆量子化した後、さらに、IDCT(逆離散コサイン変換)を行い、そして、得られた画像をメモリ上に展開しなければ、再符号化は困難である。
これに対して、本実施の形態では、図1に示したように、デコーダ1は、動きベクトルについては、復号した後、そのままエンコーダ3へと出力する。本実施の形態において、予測補間信号が改めて作成されることはない。そして、エンコーダ3は、動きベクトルについては、そのまま再符号化する。このため、本実施の形態におけるトランスコーダでは、従来のクローズドループアーキテクチャを利用する場合のように、大きなメモリリソースや回路規模が要求されることはない。
次に、本実施の形態におけるトランスコード方法について図6を用いて説明する。図6は、本発明の実施の形態におけるトランスコード方法における流れを説明するフロー図である。本実施の形態におけるトランスコード方法は、図1に示した本実施の形態におけるトランスコーダを動作させることによって実施される。このため、以下の説明においては、適宜図1を参酌しながら、図1に示すトランスコーダの動作と共に説明する。
図6に示すように、先ず、変換元のMPEG2映像データ(MPEG2 ES)がデコーダ1に入力されると、デコーダ1の復号部4は、可変長符号復号(VLD:Variable Length Decoding)を実行する(ステップS1)。さらに、復号部4は、復号されたMPEG2映像データから、動きベクトルのみを抽出し、抽出した動きベクトルについては、エンコーダ3に入力する(ステップS2)。復号部4は、動きベクトル以外の映像データについては、逆量子化部5に入力する。
続いて、逆量子化部5は、入力された映像データに対して、逆量子化を実行する(ステップS3)。また、逆量子化部5は、逆量子化して得られた映像データをシンタックス変換部2に入力する。次に、シンタックス変換部2は、逆量子化された映像データに対して、シンタックスの変換を実行する(ステップS4)。これにより、H.264方式で規定された、シーケンスパラメータセットや、ピクチャパラメータセット等が作成され、これらが映像データに組み込まれる。シンタックスが変換された映像データは、エンコーダ3を構成する量子化部6に入力される。
次に、量子化部6は、映像データが入力されると、この映像データに対して、設定された量子化ステップ値で量子化を実行する(ステップS5)。このとき、量子化ステップ値の設定は、ビットレート制御部8によって行われる。ビットレート制御部8は、上述したように、目標となるビットレートが達成されるように量子化ステップ値(除算値)を設定している。また、量子化部6は、量子化された映像データを、エンコーダ3を構成する符号化部7に入力する。
その後、符号化部7は、量子化された映像データに対して、H.264方式に従って再度圧縮符号化を実行する(ステップS6)。また、符号化部7は、再度圧縮符号化した映像データに、識別子を付加する。この識別子は、動きベクトルがトランスコード前の圧縮符号化方式(MPEG2方式)に従って作成されていることを示すものであり、映像データのユーザ領域に書き込まれている。
このように、ステップS1〜ステップS6の実行により、H.264方式に従って再度圧縮符号化された(トランスコードされた)映像データが得られることとなる。また、上述したように、トランスコードの際に大きなメモリリソースや回路規模は要求されないため、本実施の形態によれば、トランスコードにかかるコストの上昇は抑制される。また、本実施の形態では、DCTやIDCTを行うことなく、トランスコードが可能であるため、処理時間の短縮化も図られる。
また、本実施の形態におけるトランスコーダは、コンピュータに、図6に示すステップS1〜S6を行わせるプログラムをインストールし、このプログラムを実行することによっても、実現することができる。この場合、コンピュータのCPU(central processing unit)は、デコーダ1、シンタックス変換部2、エンコーダ3として機能し、処理を行なう。
ところで、ステップS6(図6参照)の実行後にエンコーダ3(図1参照)から出力される映像データは、動きベクトルがMPEG2方式に従って作成されているため、厳密には、完全なH.264映像データではない。よって、デコーダが、トランスコードされた映像データを再生する際に、H.264方式に従って動き補償を行うと画質が劣化する可能性がある。
但し、このトランスコードされた映像データには上述した識別子が付加されている。従って、このトランスコードされた映像データをデコードする場合は、デコーダ側で識別子の有無を判定し、識別子が存在する場合は、トランスコード前の符号化方式に従って動き補償が実行されるようにすれば良い。この場合、画質を劣化させることなく映像が再生される。本実施の形態におけるデコーダおよびデコード方法について、以下に説明する。
[デコーダおよびデコード方法についての説明]
次に、本実施の形態におけるデコーダおよびデコード方法について図7および図8を用いて説明する。本実施の形態におけるデコーダおよびデコード方法は、本実施の形態におけるトランスコーダおよびトランスコード方法によって再符号化された映像データから再生画像を生成することができる。
次に、本実施の形態におけるデコーダおよびデコード方法について図7および図8を用いて説明する。本実施の形態におけるデコーダおよびデコード方法は、本実施の形態におけるトランスコーダおよびトランスコード方法によって再符号化された映像データから再生画像を生成することができる。
最初に、本実施の形態におけるデコーダの構成について図7を用いて説明する。図7は、本発明の実施の形態におけるデコーダの概略構成を示すブロック図である。図7に示すように、デコーダは、再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部14を備えている。また、デコーダは、その他に、復号部11、逆量子化部12、IDCT部13、フレームメモリ15、画面内予測部16、およびフィルター17も備えている。
復号部11は、H.264映像データ(H.264 ES)が入力されると、これを復号(エントロピー復号)し、復号した映像データを逆量子化部12に入力する。逆量子部12は、復号された映像データを逆量子化し、逆量子化した映像データをIDCT部13に入力する。IDCT部13は、逆量子化された映像データに対してIDCT(逆離散コサイン変換)を実行し、画素値で構成された映像データを出力する。
フィルター17は、デブロッキングフィルターであり、IDCT部13が出力した映像データに対して、ブロック歪の除去を行っている。フィルター17によってブロック歪が除去された映像データは、外部に再生画像として出力されると共に、フレームメモリ15に蓄積される。画面内予測部16は、元のデータが画面内予測符号化によって作成されている場合に、IDCT部13が出力した映像データに基づいて動画像フレームを作成する。
動き補償部14は、フレームメモリ15に蓄積されている動画像フレームを用いて、動き補償を実行し、動画像フレームを作成する。画面内予測部16が作成した動画像フレームと、動き補償部14が作成した動画像フレームとは、再生順序に応じて、IDCT部13が出力した映像データに組み込まれる。
また、通常、動き補償部14は、H.264用のデコーダに備えられた動き補償部と同様に、H.264方式に従って動き補償を実行する。但し、本実施の形態においては、動き補償部14は、動き補償の実行による動画像フレームの作成機能に加え、識別子の有無を判定する機能も備えている。さらに、動き補償部14は、識別子が付加されていると判定した場合は、トランスコードされる前の圧縮符号化方式、即ち、MPEG2方式に従って動き補償を実行する機能も備えている。
なお、動き補償部14は、識別子が付加されていないと判定した場合は、上述したように、H.264方式に従って動き補償を実行する。「識別子」は、図1に示した本実施の形態におけるトランスコーダが作成した識別子であって、動きベクトルについてはMPEG2方式に従って作成されていることを示すものである。
ここで、本実施の形態におけるデコード方法について図8を用いて説明する。図8は、本発明の実施の形態におけるデコード方法における流れを説明するフロー図である。本実施の形態におけるデコード方法は、図7に示した本実施の形態におけるデコーダを動作させることによって実施される。このため、以下の説明においては、適宜図7を参酌しながら、図7に示すデコーダの動作と共に説明する。また、図8は、デコード方法における全工程のうち動き補償に関する工程、即ち、動き補償部14によって実行される工程のみを図示している。
図8に示すように、動き補償部14は、映像データが入力されると、入力された映像データが、トランスコーダによって付加された「識別子」を含んでいるかどうかの判定を行なう(ステップS11)。
ステップS11の判定の結果、「識別子」が含まれている場合は、動き補償部14は、MPEG2方式に従って動き補償を実行する(ステップS12)。具体的には、動き補償部14は、ステップS12においては、動きベクトルが半画素精度であることを前提にして、動画像フレームを生成する。
一方、「識別子」が含まれていない場合は、動き補償部14は、通常のH.264用のデコーダに備えられた動き補償部と同様に、H.264方式に従って動き補償を実行する(ステップS13)。具体的には、動き補償部14は、ステップS13においては、6タップフィルタリング処理による予測補間信号から動きベクトルが生成されていることを前提にして、動画像フレームを生成する。
なお、ステップS11における判定は、映像データの入力開始時に行われる。また、ステップS12およびS13は、図7に示したデコーダへの映像データの入力が終了するまで行われる。
このように、本実施の形態におけるデコーダまたはデコード方法を用いれば、本実施の形態におけるトランスコーダおよびトランスコード方法によって再度圧縮符号化された映像データを再生することができる。また、本実施の形態におけるデコーダまたはデコード方法によれば、本実施の形態におけるトランスコーダおよびトランスコード方法によって再度圧縮符号化された映像データ以外のH.264映像データについても、再生することができる。
また、本実施の形態におけるデコーダは、コンピュータに、図8に示すステップS11〜S13、復号処理、逆量子化処理、IDCT処理、画面内予測処理、およびデブロッキングフィルタリング処理を行わせるプログラムをインストールし、このプログラムを実行することによっても、実現することができる。この場合、コンピュータのCPU(central processing unit)は、復号部11、逆量子化部12、IDCT部13、動き補償部14、画面内予測部16として機能し、処理を行なう。また、コンピュータのメモリがフレームメモリ15として機能する。
本発明におけるトランスコーダおよびトランスコーダ方法は、各種の映像機器に有用であり、産業上の利用可能性を有するものである。また、本発明におけるデコーダおよびデコード方法は、本発明におけるトランスコーダまたはトランスコード方法が再度圧縮符号化した映像データを再生するためのデコーダおよびデコード方法として、産業上の利用可能性を有している。
本発明は、映像データをトランスコードするためのトランスコーダおよびトランスコード方法、さらには、トランスコードして得られた映像データを再生するためのデコーダおよびデコード方法に関する。
従来から、映像を圧縮符号化する方式の一つとして、MPEG2方式が知られている。MPEG2方式は、画質の劣化を抑制しつつ、映像データを圧縮できることから、DVD、デジタル放送といった種々の分野で広く利用されている。
近年においては、H.264方式という新たな圧縮符号化方式も開発されている。H.264方式によれば、MPEG2方式よりも、さらに高い圧縮率で映像を圧縮符号化できる。例えば、MPEG2方式と、H.264方式とによって、同一の映像データを同程度の画質で圧縮符号化した場合、H.264方式によって圧縮符号化された映像データのデータ量は、MPEG2方式によるそれの半分程度となる。さらに、H.264方式は、「Blu−Ray Disc」や、動画再生機能を備えた各種の携帯端末装置において、標準動画形式として採用されている。
但し、放送事業者、番組制作者、映画製作者等は、過去の膨大な映像資産をMPEG2方式によって圧縮符号化している。よって、MPEG2方式によって圧縮符号化された映像データを、H.264方式によって再度圧縮符号化するトランスコーダ(符号変換装置)の開発が求められている。
MPEG2方式によって圧縮符号化された映像データ(MPEG2映像データ)を、H.264方式によって圧縮符号化された映像データ(H.264映像データ)にトランスコードするトランスコーダとしては、クローズドループアーキテクチャを利用したトランスコーダが知られている(例えば、特開2007−104231号公報参照。)。特開2007−104231号公報に開示のトランスコーダは、デコーダと、エンコーダとを備えている。
デコーダは、元のMPEG2映像データに対して、可変長復号化(VLD)、逆量子化、およびIDCT(逆離散コサイン変換)を順に行い、再生映像を生成する。再生映像は、エンコーダのバッファメモリに出力される。エンコーダは、バッファメモリに蓄積された再生映像をフレーム毎に抽出し、抽出した再生映像に対して、DCT(離散コサイン変換)、量子化、および可変長符号化を行い、H.264映像データを作成する。また、エンコーダは、抽出した再生映像に対して動き補償を行うため、参照ピクチャを蓄積する参照メモリを用いて動きベクトルを生成し、生成した動きベクトルに対しても可変長符号化を行う。さらに、動き情報の生成において、エンコーダは、MPEG2映像データ中の動き情報も参照する。
このように、特開2007−104231号公報に開示のトランスコーダによれば、MPEG2映像データをH.264映像データにトランスコードでき、データ量を元のMPEG2映像データのデータ量の半分以下とできる。よって、例えば、ハードディスクレコーダが上記のトランスコーダを備えている場合は、ハードディスク容量が節約され、より多くのタイトルの録画が可能となる。また、伝送速度の低いネットワーク内においても、画質の優れた映像を伝送することが可能となる。
その他、オープンループアーキテクチャを採用したトランスコーダも知られている(例えば、特許第3244399号公報参照)。このトランスコーダは、元の映像データを可変復号化および逆量子化し、得られたデータに対して、量子化ステップ値Qを変えて量子化を行い、そして可変符号化を実行する。この結果、元の映像データよりもデータ量が圧縮された新たな映像データが生成される。
しかしながら、クローズドループアーキテクチャを利用した前者のトランスコーダでは、上述したように、バッファメモリや参照メモリが不可欠であり、多くのメモリリソースが必要となる。また、上記のトランスコーダの実現には、大規模な回路が必要となる。これらの点から、前者のトランスコーダには、安いコストでそれを提供でないという問題がある。
さらに、前者のトランスコーダでは、デコーダは、可変長復号化、逆量子化および逆DCTを行う必要があり、又、エンコーダは、DCT、量子化および可変長符号化を行う必要がある。このため、上記のトランスコーダにおいて、処理の高速化は難しく、トランスコードを完了するまでの時間が、元の映像データの再生時間よりも長くなってしまう場合もある。
一方、オープンループアーキテクチャを利用した後者のトランスコーダでは、デコーダによる逆DCTとエンコーダによるDCTとは行われない。このため、メモリリソースは必要なく、さらに回路規模も小さくてすむため、コストの上昇は抑制される。また、トランスコードの高速化も容易に達成できる。
しかし、後者のトランスコーダは、圧縮符号化方式の変更を目的としたものではなく、MPEG2映像データのデータ量の圧縮のみを目的としたものである。つまり、後者のトラスコーダでは、異なる圧縮符号化方式間でのシンタックスや動き補償の相違を考慮したトランスコードは行われず、MPEG2映像データからH.264映像データへのトランスコードは不可能である。
本発明の目的は、上記問題を解決し、安いコストで、且つ、高速で、圧縮符号化方式の異なる映像データ間でのトランスコードを行うことができ得る、トランスコーダおよびトランスコード方法、このトランスコーダによって得られた映像データをデコードするデコーダおよびデコード方法を提供することにある。
上記目的を達成するために本発明におけるトランスコーダは、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、デコーダと、シンタックス変換部と、エンコーダとを備え、前記デコーダは、前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換し、前記エンコーダは、シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化し、さらに、前記第2の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とする。
上記目的を達成するために本発明におけるトランスコード方法は、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、(a)前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、(b)前記(a)の工程で復号された前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、(c)前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、(d)前記(c)の工程で逆量子化された前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換する工程と、(e)前記(d)の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、(f)前記(e)の工程で量子化された前記映像データと、前記(b)の工程で抽出された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化する工程と、(g)前記(f)の工程で前記第2の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とする。
上記目的を達成するために本発明におけるデコーダは、上記のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第1の圧縮符号化方式に従って動き補償を行うことを特徴とする。
上記目的を達成するために本発明におけるデコード方法は、上記のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、(a)前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第1の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、(b)前記(a)の工程において、前記識別子が付加されていると判定された場合に、前記第1の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とする。
本発明によれば、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを、第2の圧縮符号化方式に従って再符号化することができる。このとき、元の映像データの動きベクトルはそのまま利用され、再度作成されないため、従来のクローズドループアーキテクチャを利用する場合のように、大きなメモリリソースや回路規模は要求されない。よって、本発明によれば、トランスコードにかかるコストの上昇は抑制される。また、本発明では、DCT(離散コサイン変換)やIDCT(逆離散コサイン変換)を行うことなく、トランスコードが可能であるため、処理時間の短縮化も図られる。
本発明におけるトランスコーダは、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、デコーダと、シンタックス変換部と、エンコーダとを備え、前記デコーダは、前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換し、前記エンコーダは、シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化し、さらに、前記第2の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とする。
本発明におけるトランスコード方法は、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、(a)前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、(b)前記(a)の工程で復号された前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、(c)前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、(d)前記(c)の工程で逆量子化された前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換する工程と、(e)前記(d)の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、(f)前記(e)の工程で量子化された前記映像データと、前記(b)の工程で抽出された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化する工程と、(g)前記(f)の工程で前記第2の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とする。
また、本発明は、上記本発明におけるトランスコーダを具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明におけるトランスコーダを得ることができる。さらに、このプログラムを記録した記憶媒体も、本発明の一実施形態である。
また、本発明におけるデコーダは、上記のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第1の圧縮符号化方式に従って動き補償を行うことを特徴とする。
本発明におけるデコード方法は、上記のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、(a)前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第1の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、(b)前記(a)の工程において、前記識別子が付加されていると判定された場合に、前記第1の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とする。
また、本発明は、上記本発明におけるデコーダを具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明におけるデコーダを得ることができる。さらに、このプログラムを記録した記憶媒体も、本発明の一実施形態である。
本発明において、前記第1の圧縮符号化方式としては、MPEG2方式が挙げられる。また、前記第2の圧縮符号化方式としては、H.264方式が挙げられる。
以下、本発明の一実施形態にかかるトランスコーダ、トランスコード方法、デコーダ、デコード方法について、図1〜図8を参照しながら説明する。
[トランスコーダおよびトランスコード方法についての説明]
最初に、本実施の形態におけるトランスコーダの構成について図1〜図5を用いて説明する。図1は、本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図である。図1に示すように、本実施の形態におけるトランスコーダは、デコーダ1と、シンタックス変換部2と、エンコーダ3とを備えている。この構成により、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データは、復号され、第2の圧縮符号化方式に従って再度圧縮符号化される。本実施の形態において、第1の圧縮符号化方式はMPEG2方式であり、第2の圧縮符号化方式はH.264方式である。
最初に、本実施の形態におけるトランスコーダの構成について図1〜図5を用いて説明する。図1は、本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図である。図1に示すように、本実施の形態におけるトランスコーダは、デコーダ1と、シンタックス変換部2と、エンコーダ3とを備えている。この構成により、動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データは、復号され、第2の圧縮符号化方式に従って再度圧縮符号化される。本実施の形態において、第1の圧縮符号化方式はMPEG2方式であり、第2の圧縮符号化方式はH.264方式である。
デコーダ1は、復号部4と、逆量子化部5とを備えている。復号部4は、トランスコード対象となる変換元の映像データを復号し、圧縮符号化される前のデータを生成する。本実施の形態では、対象となる映像データは、MPEG2方式に従って、例えばハフマン符号化によって圧縮符号化された、MPEG2映像データ(MPEG2 ES(Elementary Stream))である。復号部4は、可変長符号復号(VLD:Variable Length Decoding)を実行する。
また、復号部4は、復号した映像データから、MPEG2方式に従って作成されている動きベクトルを抽出し、抽出した動きベクトルをエンコーダ3に直接入力する。動きベクトルについては、図2〜図5を用いて後述する。
逆量子化部5は、復号された映像データに対して逆量子化を行う。但し、逆量子化部5による逆量子化は、動きベクトル以外の復号された映像データに対してのみ行われる。逆量子化部5は、逆量子化した映像データをシンタックス変換部2に入力する。
シンタックス変換部2は、デコーダ2の逆量子化部5が入力した映像データのシンタックスをH.264方式によって規定されたシンタックスに変換する。MPEG2方式では、ピクチャが符号化の単位になっているのに対し、H.264方式では、スライスが符号化の単位になっているため(図2参照)、これに合わせてシンタックスが変換される。
具体的には、シンタックス変換部2は、変換元のMPEG2映像データのシーケンスヘッダ(SH:Sequence Head)や、各ピクチャの先頭に付加されているピクチャヘッダを抽出する(図2参照)。そして、シンタックス変換部2は、これらから、H.264方式で規定された、シーケンスパラメータセット(SPS:Sequence Parameter Set)や、ピクチャパラメータセット(PPS:Picture Parameter Set)を作成する。
SPSおよびPPSの中には、それぞれ番号が付加されている。各スライス(図2参照)に付加されているスライスヘッダの中でPPS番号を指定することによって、どのPPSを用いられるかが識別される。また、PPSの中でSPS番号を指定することによって、各スライスが、どのシーケンスに属するかが識別される。また、シンタックス変換部2は、これらのパラメータセットを、これらを参照するデータの前に配置する。
さらに、シンタックス変換部2は、SEI(Supplemental Enhancement Information)や、AUデリミタ(Access Unit Delimiter)の付加を行うこともできる。SEIは、各ピクチャのタイミング情報やランダム・アクセス情報等の付加情報を含むヘッダである。AUデリミタは、ピクチャの先頭を特定するための符号である。
エンコーダ3は、量子化部6と、符号化部7とを備えている。量子化部6は、シンタックス変換部2によってシンタックスが変換された映像データに対して、設定された量子化ステップ値で量子化を行う。符号化部7は、量子化部6によって量子化された映像データと、デコーダ1から入力された動きベクトルとを合わせ、これらをH.264方式に従って圧縮符号化する。
具体的には、符号化部7は、CAVLC(コンテキスト適応型か変調符号化方式:Context-AdaptiveVariable Length Coding)、またはCABAC(コンテキスト適応型2値算術符号化方式:Context-Adaptive Binary Arithmetic Coding)に従って、圧縮符号化を実行する。
さらに、符号化部7は、再符号化した映像データに、動きベクトルがMPEG2方式に従って作成されていること(つまり、動きベクトルについてはH.264方式に従って作成されていないこと)を示す識別子を付加する。そして、符号化部7が再符号化した映像データ(H.264 ES(Elementary Stream))は外部へと出力される。
また、本実施の形態では、エンコーダ3は、ビットレート制御部8を備えている。ビットレート制御部8は、デコーダ1の復号部4が復号したデータと、エンコーダ3の符号化部7が圧縮符号化して作成した映像データとに基づいて、目標となるビットレートを求める。そして、ビットレート制御部8は、求められたビットレートを達成するための量子化ステップ値(除算値)を設定し、設定した量子化ステップ値を量子化部6に入力する。量子化ステップ値が入力されると、量子化部6は、入力された値で量子化を実行する。
ここで、図2〜図5を用いて、動きベクトルについて具体的に説明する。先ず、動きベクトルを含むMPEG2映像データの全体構成について説明する。図2は、MPEG2映像データのデータ構造を示す図である。図2に示すように、MPEG2映像データは、シーケンスレイヤ、GOP(Group of Picture)レイヤ、ピクチャレイヤ、スライスレイヤ、マクロブロックレイヤ、およびブロックレイヤといった6つのレイヤ(階層)によって構成されている。
シーケンスレイヤを構成するシーケンスは、1つ以上のGOPと、それに対応するシーケンスヘッドと、1つのシーケンスエンドコード(終了符号)とで形成されている。シーケンスヘッド中には、動画像シーケンスの特徴を特定する情報、例えば、画面の縦横のサイズ、アスペクト比、画像レート、量子化マトリクスなどが含まれている。
GOPレイヤを構成するGOPは、複数の画面(ピクチャ)の集合によって構成されている。ピクチャとしては、フレーム内符号化によって得られるIピクチャと、双方向予測符号化によって得られるBピクチャと、順方向予測符号化によって得られるPピクチャとの三種類がある。
ピクチャレイヤを構成するピクチャは、一枚の動画像フレームによって構成されている。図示していないが、各ピクチャには、ピクチャヘッダが付加されている。ピクチャヘッド中には、ピクチャの表示順序を示す番号や、ピクチャの種類を特定する符号等が含まれている。
スライスレイヤを構成するスライスは、一枚のピクチャを帯状に断片化して得られたものであり、複数個のマクロブロック(MB)の集合体である。また、マクロブロックレイヤは、スライスの一部である一つのマクロブロックによって構成されている。マクロブロックは、16画素×16ラインの正方形の画素ブロックであり、輝度ブロックYと、対応する2つの8画素×8ラインの色差ブロック(Cb、Cr)とによって構成されている。さらに、マクロブロックは、DCTの処理単位である8画素×8ラインのブロックに細分化され、このブロックがブロックレイヤを構成している。
図2には、MPEG2映像データが開示されているが、H.264映像データも略同様のデータ構造を備えている。但し、上述したように、H.264方式では、スライスが符号化の単位になるため、一つのピクチャに、異なる種類のスライスが混在することもある。さらに、H.264方式では、DCTの処理単位は、4画素×4ラインであり、マクロブロックはさらに細分化される。
また、MPEG2方式およびH.264方式の両方において動き補償が行われる。そして、動画像フレームを分割して得られた動き補償ブロック毎に、動きベクトルが求められ、動きベクトルの符号化が行われる。動き補償ブロックのサイズとしては、MPEG2方式では16×16のみが認められている。一方、H.264では、動き補償ブロックのサイズとしては、16×16に加え、16×8、8×16、8×8、8×4、4×8、4×4も認められている。
動き補償を行うために必要な情報は、マクロブロックレイヤに付加される。図3は、動き補償に必要な情報の一例を示す図である。図3に示すように、MPEG2方式およびH.264方式の両方において、マクロブロックレイヤには、動き補償を特定するために、各動き補償ブロックの参照ピクチャ番号と、各動き補償ブロックの動きベクトルとが付加される。
また、動き補償を行うため、MPEG2方式およびH.264方式のどちらであっても、予測補間信号の生成が行われる。予測補間信号は、整数画素の画素精度よりも低い画素精度を持った信号であり、参照ピクチャの画素値から生成される。但し、両方式において、予測補間信号の生成方法は異なっている。この点について、図4および図5を用いて以下に説明する。
図4は、第1の圧縮符号化方式(MPEG2方式)における予測補間信号の生成を説明する図である。図5は、第2の圧縮符号化方式(H.264方式)における予測補間信号の生成を説明する図である。
図4に示すように、MPEG2方式では、予測補間信号の生成は、2タップ(tap)フィルターを用い、隣接する整数画素信号(□)の中間点では両者の平均値を求めることによって(○)、または、4つの整数画素信号の中央ではこれらの平均値を求めることによって(◇)行われている。MPEG2方式では、動きベクトルは、基本的に半画素精度で表現されている。
一方、図5に示すように、H.264方式では、予測補間信号の生成は、6タップ(tap)フィルターを用いて行われている。具体的には、2つの整数画素信号(□)の、水平方向の中間位置にある(1/2)画素信号(○)は、水平方向に並ぶ6つの整数画素信号に6タップフィルタリング処理を施すことによって作成される。同様に、2つの整数画素信号(□)の、垂直方向の中間位置にある(1/2)画素信号(○)は、垂直方向に並ぶ6つの整数画素信号に6タップフィルタリング処理を施すことによって作成される。
また、4つの整数画素信号(□)の中間位置にある(1/2)画素信号(◇)は、水平方向または垂直方向に並ぶ6つの(1/2)画素信号(○)に6タップフィルタリング処理を施すことによって作成される。(1/2)画素信号を作成した後、平均値フィルターによって(1/4)画素信号(●および◆)が作成される。
このように、予測補間信号の生成において、H.264方式は、MPEG2方式と大きく異なっている。H.264方式では、MPEG2方式に比べて、動きベクトルの予測精度が向上するため、より精度の高い動き補償が可能となる。但し、このため、MPEG2方式に沿って作成された動きベクトルを、H.264方式に沿って作成された動きベクトルに完全にトランスコードするには、従来のクローズドループアーキテクチャを利用するトランスコーダのように、バッファメモリや参照メモリが必要となる。即ち、MPEG2映像データを逆量子化した後、さらに、IDCT(逆離散コサイン変換)を行い、そして、得られた画像をメモリ上に展開しなければ、再符号化は困難である。
これに対して、本実施の形態では、図1に示したように、デコーダ1は、動きベクトルについては、復号した後、そのままエンコーダ3へと出力する。本実施の形態において、予測補間信号が改めて作成されることはない。そして、エンコーダ3は、動きベクトルについては、そのまま再符号化する。このため、本実施の形態におけるトランスコーダでは、従来のクローズドループアーキテクチャを利用する場合のように、大きなメモリリソースや回路規模が要求されることはない。
次に、本実施の形態におけるトランスコード方法について図6を用いて説明する。図6は、本発明の実施の形態におけるトランスコード方法における流れを説明するフロー図である。本実施の形態におけるトランスコード方法は、図1に示した本実施の形態におけるトランスコーダを動作させることによって実施される。このため、以下の説明においては、適宜図1を参酌しながら、図1に示すトランスコーダの動作と共に説明する。
図6に示すように、先ず、変換元のMPEG2映像データ(MPEG2 ES)がデコーダ1に入力されると、デコーダ1の復号部4は、可変長符号復号(VLD:Variable Length Decoding)を実行する(ステップS1)。さらに、復号部4は、復号されたMPEG2映像データから、動きベクトルのみを抽出し、抽出した動きベクトルについては、エンコーダ3に入力する(ステップS2)。復号部4は、動きベクトル以外の映像データについては、逆量子化部5に入力する。
続いて、逆量子化部5は、入力された映像データに対して、逆量子化を実行する(ステップS3)。また、逆量子化部5は、逆量子化して得られた映像データをシンタックス変換部2に入力する。次に、シンタックス変換部2は、逆量子化された映像データに対して、シンタックスの変換を実行する(ステップS4)。これにより、H.264方式で規定された、シーケンスパラメータセットや、ピクチャパラメータセット等が作成され、これらが映像データに組み込まれる。シンタックスが変換された映像データは、エンコーダ3を構成する量子化部6に入力される。
次に、量子化部6は、映像データが入力されると、この映像データに対して、設定された量子化ステップ値で量子化を実行する(ステップS5)。このとき、量子化ステップ値の設定は、ビットレート制御部8によって行われる。ビットレート制御部8は、上述したように、目標となるビットレートが達成されるように量子化ステップ値(除算値)を設定している。また、量子化部6は、量子化された映像データを、エンコーダ3を構成する符号化部7に入力する。
その後、符号化部7は、量子化された映像データに対して、H.264方式に従って再度圧縮符号化を実行する(ステップS6)。また、符号化部7は、再度圧縮符号化した映像データに、識別子を付加する。この識別子は、動きベクトルがトランスコード前の圧縮符号化方式(MPEG2方式)に従って作成されていることを示すものであり、映像データのユーザ領域に書き込まれている。
このように、ステップS1〜ステップS6の実行により、H.264方式に従って再度圧縮符号化された(トランスコードされた)映像データが得られることとなる。また、上述したように、トランスコードの際に大きなメモリリソースや回路規模は要求されないため、本実施の形態によれば、トランスコードにかかるコストの上昇は抑制される。また、本実施の形態では、DCTやIDCTを行うことなく、トランスコードが可能であるため、処理時間の短縮化も図られる。
また、本実施の形態におけるトランスコーダは、コンピュータに、図6に示すステップS1〜S6を行わせるプログラムをインストールし、このプログラムを実行することによっても、実現することができる。この場合、コンピュータのCPU(central processing unit)は、デコーダ1、シンタックス変換部2、エンコーダ3として機能し、処理を行なう。
ところで、ステップS6(図6参照)の実行後にエンコーダ3(図1参照)から出力される映像データは、動きベクトルがMPEG2方式に従って作成されているため、厳密には、完全なH.264映像データではない。よって、デコーダが、トランスコードされた映像データを再生する際に、H.264方式に従って動き補償を行うと画質が劣化する可能性がある。
但し、このトランスコードされた映像データには上述した識別子が付加されている。従って、このトランスコードされた映像データをデコードする場合は、デコーダ側で識別子の有無を判定し、識別子が存在する場合は、トランスコード前の符号化方式に従って動き補償が実行されるようにすれば良い。この場合、画質を劣化させることなく映像が再生される。本実施の形態におけるデコーダおよびデコード方法について、以下に説明する。
[デコーダおよびデコード方法についての説明]
次に、本実施の形態におけるデコーダおよびデコード方法について図7および図8を用いて説明する。本実施の形態におけるデコーダおよびデコード方法は、本実施の形態におけるトランスコーダおよびトランスコード方法によって再符号化された映像データから再生画像を生成することができる。
次に、本実施の形態におけるデコーダおよびデコード方法について図7および図8を用いて説明する。本実施の形態におけるデコーダおよびデコード方法は、本実施の形態におけるトランスコーダおよびトランスコード方法によって再符号化された映像データから再生画像を生成することができる。
最初に、本実施の形態におけるデコーダの構成について図7を用いて説明する。図7は、本発明の実施の形態におけるデコーダの概略構成を示すブロック図である。図7に示すように、デコーダは、再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部14を備えている。また、デコーダは、その他に、復号部11、逆量子化部12、IDCT部13、フレームメモリ15、画面内予測部16、およびフィルター17も備えている。
復号部11は、H.264映像データ(H.264 ES)が入力されると、これを復号(エントロピー復号)し、復号した映像データを逆量子化部12に入力する。逆量子部12は、復号された映像データを逆量子化し、逆量子化した映像データをIDCT部13に入力する。IDCT部13は、逆量子化された映像データに対してIDCT(逆離散コサイン変換)を実行し、画素値で構成された映像データを出力する。
フィルター17は、デブロッキングフィルターであり、IDCT部13が出力した映像データに対して、ブロック歪の除去を行っている。フィルター17によってブロック歪が除去された映像データは、外部に再生画像として出力されると共に、フレームメモリ15に蓄積される。画面内予測部16は、元のデータが画面内予測符号化によって作成されている場合に、IDCT部13が出力した映像データに基づいて動画像フレームを作成する。
動き補償部14は、フレームメモリ15に蓄積されている動画像フレームを用いて、動き補償を実行し、動画像フレームを作成する。画面内予測部16が作成した動画像フレームと、動き補償部14が作成した動画像フレームとは、再生順序に応じて、IDCT部13が出力した映像データに組み込まれる。
また、通常、動き補償部14は、H.264用のデコーダに備えられた動き補償部と同様に、H.264方式に従って動き補償を実行する。但し、本実施の形態においては、動き補償部14は、動き補償の実行による動画像フレームの作成機能に加え、識別子の有無を判定する機能も備えている。さらに、動き補償部14は、識別子が付加されていると判定した場合は、トランスコードされる前の圧縮符号化方式、即ち、MPEG2方式に従って動き補償を実行する機能も備えている。
なお、動き補償部14は、識別子が付加されていないと判定した場合は、上述したように、H.264方式に従って動き補償を実行する。「識別子」は、図1に示した本実施の形態におけるトランスコーダが作成した識別子であって、動きベクトルについてはMPEG2方式に従って作成されていることを示すものである。
ここで、本実施の形態におけるデコード方法について図8を用いて説明する。図8は、本発明の実施の形態におけるデコード方法における流れを説明するフロー図である。本実施の形態におけるデコード方法は、図7に示した本実施の形態におけるデコーダを動作させることによって実施される。このため、以下の説明においては、適宜図7を参酌しながら、図7に示すデコーダの動作と共に説明する。また、図8は、デコード方法における全工程のうち動き補償に関する工程、即ち、動き補償部14によって実行される工程のみを図示している。
図8に示すように、動き補償部14は、映像データが入力されると、入力された映像データが、トランスコーダによって付加された「識別子」を含んでいるかどうかの判定を行なう(ステップS11)。
ステップS11の判定の結果、「識別子」が含まれている場合は、動き補償部14は、MPEG2方式に従って動き補償を実行する(ステップS12)。具体的には、動き補償部14は、ステップS12においては、動きベクトルが半画素精度であることを前提にして、動画像フレームを生成する。
一方、「識別子」が含まれていない場合は、動き補償部14は、通常のH.264用のデコーダに備えられた動き補償部と同様に、H.264方式に従って動き補償を実行する(ステップS13)。具体的には、動き補償部14は、ステップS13においては、6タップフィルタリング処理による予測補間信号から動きベクトルが生成されていることを前提にして、動画像フレームを生成する。
なお、ステップS11における判定は、映像データの入力開始時に行われる。また、ステップS12およびS13は、図7に示したデコーダへの映像データの入力が終了するまで行われる。
このように、本実施の形態におけるデコーダまたはデコード方法を用いれば、本実施の形態におけるトランスコーダおよびトランスコード方法によって再度圧縮符号化された映像データを再生することができる。また、本実施の形態におけるデコーダまたはデコード方法によれば、本実施の形態におけるトランスコーダおよびトランスコード方法によって再度圧縮符号化された映像データ以外のH.264映像データについても、再生することができる。
また、本実施の形態におけるデコーダは、コンピュータに、図8に示すステップS11〜S13、復号処理、逆量子化処理、IDCT処理、画面内予測処理、およびデブロッキングフィルタリング処理を行わせるプログラムをインストールし、このプログラムを実行することによっても、実現することができる。この場合、コンピュータのCPU(central processing unit)は、復号部11、逆量子化部12、IDCT部13、動き補償部14、画面内予測部16として機能し、処理を行なう。また、コンピュータのメモリがフレームメモリ15として機能する。
本発明におけるトランスコーダおよびトランスコーダ方法は、各種の映像機器に有用であり、産業上の利用可能性を有するものである。また、本発明におけるデコーダおよびデコード方法は、本発明におけるトランスコーダまたはトランスコード方法が再度圧縮符号化した映像データを再生するためのデコーダおよびデコード方法として、産業上の利用可能性を有している。
Claims (10)
- 動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、
デコーダと、シンタックス変換部と、エンコーダとを備え、
前記デコーダは、前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、
前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換し、
前記エンコーダは、
シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、
量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化し、
さらに、前記第2の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とするトランスコーダ。 - 前記第1の圧縮符号化方式がMPEG2方式であり、前記第2の圧縮符号化方式がH.264方式である請求項1に記載のトランスコーダ。
- 動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、
(a)前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、
(b)前記(a)の工程で復号された前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、
(c)前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、
(d)前記(c)の工程で逆量子化された前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換する工程と、
(e)前記(d)の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、
(f)前記(e)の工程で量子化された前記映像データと、前記(b)の工程で抽出された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化する工程と、
(g)前記(f)の工程で前記第2の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とするトランスコード方法。 - 前記第1の圧縮符号化方式がMPEG2方式であり、前記第2の圧縮符号化方式がH.264方式である請求項3に記載のトランスコード方法。
- 前記請求項1に記載のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、
前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、
前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第1の圧縮符号化方式に従って動き補償を行うことを特徴とするデコーダ。 - 前記第1の圧縮符号化方式がMPEG2方式であり、前記第2の圧縮符号化方式がH.264方式である請求項5に記載のデコーダ。
- 前記請求項3に記載のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、
(a)前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第1の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、
(b)前記(a)の工程において、前記識別子が付加されていると判定された場合に、前記第1の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とするデコード方法。 - 前記第1の圧縮符号化方式がMPEG2方式であり、前記第2の圧縮符号化方式がH.264方式である請求項7に記載のデコード方法。
- 動き補償フレーム間差分符号化を行う第1の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第2の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法をコンピュータによって実行するためのプログラムであって、
(a)前記第1の圧縮符号化方式に従って圧縮符号化された前記映像データを復号するステップと、
(b)前記(a)のステップで復号された前記映像データから、前記第1の圧縮符号化方式に従って作成されている動きベクトルを抽出するステップと、
(c)前記動きベクトル以外の復号された前記映像データを逆量子化するステップと、
(d)前記(c)のステップで逆量子化された前記映像データのシンタックスを前記第2の圧縮符号化方式によって規定されたシンタックスに変換するステップと、
(e)前記(d)のステップでシンタックスが変換された前記映像データを設定された圧縮率で量子化するステップと、
(f)前記(e)のステップで量子化された前記映像データと、前記(b)のステップで抽出された前記動きベクトルとを合わせ、これらを前記第2の圧縮符号化方式に従って圧縮符号化するステップと、
(g)前記(f)のステップで前記第2の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第1の圧縮符号化方式に従って作成されていることを示す識別子を付加するステップとをコンピュータに実行させることを特徴とするプログラム。 - 前記請求項3に記載のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法をコンピュータによって実行するためのプログラムであって、
(a)前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第1の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定するステップと、
(b)前記(a)のステップにおいて、前記識別子が付加されていると判定された場合に、前記第1の圧縮符号化方式に従って動き補償を行うステップとをコンピュータに実行させることを特徴とするプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007182477 | 2007-07-11 | ||
JP2007182477 | 2007-07-11 | ||
PCT/JP2008/001863 WO2009008177A1 (ja) | 2007-07-11 | 2008-07-10 | トランスコーダ、トランスコード方法、デコーダ、およびデコード方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2009008177A1 true JPWO2009008177A1 (ja) | 2010-09-02 |
Family
ID=40228368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008551593A Withdrawn JPWO2009008177A1 (ja) | 2007-07-11 | 2008-07-10 | トランスコーダ、トランスコード方法、デコーダ、およびデコード方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20100020883A1 (ja) |
EP (1) | EP2077670A4 (ja) |
JP (1) | JPWO2009008177A1 (ja) |
CN (1) | CN101569203A (ja) |
WO (1) | WO2009008177A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8578058B2 (en) * | 2010-03-10 | 2013-11-05 | International Business Machines Corporation | Real-time multi-block lossless recompression |
US8457311B1 (en) * | 2010-04-27 | 2013-06-04 | Adobe Systems Incorporated | Protecting video as it is decoded by a codec |
JP2012034138A (ja) * | 2010-07-29 | 2012-02-16 | Toshiba Corp | 信号処理装置及び信号処理方法 |
EP2618580B1 (en) * | 2010-09-16 | 2018-08-01 | Panasonic Intellectual Property Management Co., Ltd. | Image decoding device and image encoding device, methods therefor, programs thereof, integrated circuit, and transcoding device |
BR122014031521B1 (pt) * | 2011-02-10 | 2022-08-23 | Velos Media International Limited | Dispositivo e método de processamento de imagem |
AU2016269467B2 (en) * | 2011-02-10 | 2018-08-16 | Sony Group Corporation | Image Processing Device and Image Processing Method |
TWI463438B (zh) * | 2011-03-07 | 2014-12-01 | Ind Tech Res Inst | 特徵點描述壓縮方法及特徵點描述壓縮裝置 |
JP5341952B2 (ja) * | 2011-05-30 | 2013-11-13 | 株式会社東芝 | ビデオサーバ及びデータ収録再生方法 |
US20130279597A1 (en) * | 2012-04-24 | 2013-10-24 | Magnum Semiconductor, Inc. | Apparatuses and methods for bitstream bitstuffing |
JP2017183910A (ja) * | 2016-03-29 | 2017-10-05 | 富士通株式会社 | 画像符号化装置及び画像符号化方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3244399B2 (ja) | 1994-03-25 | 2002-01-07 | 三洋電機株式会社 | 圧縮動画像符号信号の情報量変換回路、及び方法 |
JP2002152755A (ja) * | 2000-11-09 | 2002-05-24 | Nippon Telegr & Teleph Corp <Ntt> | 映像ストリーム間のトランスコード方法、およびトランスコーダ、並びにトランスコード方法のプログラムを記録した記録媒体 |
KR100604032B1 (ko) * | 2003-01-08 | 2006-07-24 | 엘지전자 주식회사 | 복수 코덱을 지원하는 장치와 방법 |
US8312499B2 (en) * | 2004-09-13 | 2012-11-13 | Lsi Corporation | Tunneling information in compressed audio and/or video bit streams |
JP2006295503A (ja) * | 2005-04-08 | 2006-10-26 | Pioneer Electronic Corp | 再符号化装置、再符号化方法、および再符号化用プログラム |
JP2006295502A (ja) * | 2005-04-08 | 2006-10-26 | Pioneer Electronic Corp | 再符号化装置、再符号化方法、および再符号化用プログラム |
JP4534935B2 (ja) | 2005-10-04 | 2010-09-01 | 株式会社日立製作所 | トランスコーダ、記録装置及びトランスコード方法 |
-
2008
- 2008-07-10 WO PCT/JP2008/001863 patent/WO2009008177A1/ja active Application Filing
- 2008-07-10 EP EP08776822A patent/EP2077670A4/en not_active Withdrawn
- 2008-07-10 US US12/441,645 patent/US20100020883A1/en not_active Abandoned
- 2008-07-10 CN CNA2008800011545A patent/CN101569203A/zh active Pending
- 2008-07-10 JP JP2008551593A patent/JPWO2009008177A1/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP2077670A4 (en) | 2011-09-28 |
EP2077670A1 (en) | 2009-07-08 |
US20100020883A1 (en) | 2010-01-28 |
CN101569203A (zh) | 2009-10-28 |
WO2009008177A1 (ja) | 2009-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2009008177A1 (ja) | トランスコーダ、トランスコード方法、デコーダ、およびデコード方法 | |
JP4643454B2 (ja) | 動画像復号装置及び動画像復号方法 | |
JP4927207B2 (ja) | 符号化方法、復号化方法及び装置 | |
KR101435095B1 (ko) | 영상 부호화 장치, 영상 복호 장치, 영상 부호화 방법, 영상 복호 방법 및 프로그램을 기록한 컴퓨터 판독 가능한 정보 기록 매체 | |
TWI679881B (zh) | 動態影像預測解碼方法 | |
JP5090158B2 (ja) | 映像情報記録装置、映像情報記録方法、映像情報記録プログラム、及び映像情報記録プログラムを記録した記録媒体 | |
KR101147744B1 (ko) | 비디오 트랜스 코딩 방법 및 장치와 이를 이용한 pvr | |
JP4799547B2 (ja) | それぞれマルチマクロブロックを含む予測ピクチャおよび非予測ピクチャを使用した、ピクチャシーケンスのエンコーディング方法およびエンコーディング装置 | |
JP2013524669A (ja) | 高効率な動画像符号化のためのスーパーブロック | |
KR20060109290A (ko) | 화상 복호 장치 및 화상 복호 방법과 화상 복호 프로그램 | |
TW201215156A (en) | Image decoding device, image encoding device, and method and program thereof | |
WO2012120909A1 (ja) | 動画像復号化装置および動画像復号化方法 | |
KR20050062836A (ko) | 트랜스코딩 방법 및 장치 | |
CN100401780C (zh) | 在视频解码器中动态选择变换尺寸的方法和系统 | |
WO2012120908A1 (ja) | 動画像符号化装置および動画像符号化方法 | |
JP4318019B2 (ja) | 画像処理装置および方法、記録媒体、並びにプログラム | |
JP4604805B2 (ja) | ビデオ情報変換装置及びプログラム | |
WO2017082304A1 (ja) | 情報圧縮装置、情報圧縮方法、記録媒体、及び、符号化装置 | |
JP2006197186A (ja) | 画像符号化装置及び電池駆動復号器 | |
US20120147972A1 (en) | Image decoding apparatus, image decoding method, image encoding apparatus, image encoding method, and program | |
WO2022209032A1 (ja) | 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム | |
RU2772813C1 (ru) | Видеокодер, видеодекодер и соответствующие способы кодирования и декодирования | |
JP2010045705A (ja) | 符号化データ編集方法、編集装置、プログラム、及び媒体 | |
WO2020054190A1 (ja) | 変換装置、復号装置、変換方法および復号方法 | |
JP2004312689A (ja) | Mpegビデオ復号化方法及びmpegビデオ復号化器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20111205 |