JPWO2009008177A1

JPWO2009008177A1 - トランスコーダ、トランスコード方法、デコーダ、およびデコード方法

Info

Publication number: JPWO2009008177A1
Application number: JP2008551593A
Authority: JP
Inventors: 進吾宮内; 松浦　隆治; 隆治松浦
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2007-07-11
Filing date: 2008-07-10
Publication date: 2010-09-02
Also published as: EP2077670A4; EP2077670A1; US20100020883A1; CN101569203A; WO2009008177A1

Abstract

圧縮符号化方式の異なる映像データ間でのトランスコードを、回路規模を増大させずにかつ高速に行うことができる、トランスコーダおよびトランスコード方法を提供する。デコーダ（１）、シンタックス変換部（２）、エンコーダ（３）を備えたトランスコーダを用いる。デコーダ（１）は、ＭＰＥＧ２方式に従って圧縮符号化された映像データを復号し、これから、ＭＰＥＧ２方式に従って作成されている動きベクトルを抽出し、さらに動きベクトル以外の映像データに対しては逆量子化を行う。シンタックス変換部（２）は、デコーダ（１）からの映像データのシンタックスをＨ．２６４方式に変換する。エンコーダ（３）は、シンタックス変換後の映像データを量子化し、これと抽出された動きベクトルとをＨ．２６４方式に従って圧縮符号化する。エンコーダ（３）は、さらに、この得られたデータに、動きベクトルがＭＰＥＧ２に従って作成されていることを示す識別子を付加する。

Description

本発明は、映像データをトランスコードするためのトランスコーダおよびトランスコード方法、さらには、トランスコードして得られた映像データを再生するためのデコーダおよびデコード方法に関する。

従来から、映像を圧縮符号化する方式の一つとして、ＭＰＥＧ２方式が知られている。ＭＰＥＧ２方式は、画質の劣化を抑制しつつ、映像データを圧縮できることから、ＤＶＤ、デジタル放送といった種々の分野で広く利用されている。

近年においては、Ｈ．２６４方式という新たな圧縮符号化方式も開発されている。Ｈ．２６４方式によれば、ＭＰＥＧ２方式よりも、さらに高い圧縮率で映像を圧縮符号化できる。例えば、ＭＰＥＧ２方式と、Ｈ．２６４方式とによって、同一の映像データを同程度の画質で圧縮符号化した場合、Ｈ．２６４方式によって圧縮符号化された映像データのデータ量は、ＭＰＥＧ２方式によるそれの半分程度となる。さらに、Ｈ．２６４方式は、「Ｂｌｕ−ＲａｙＤｉｓｃ」や、動画再生機能を備えた各種の携帯端末装置において、標準動画形式として採用されている。

但し、放送事業者、番組制作者、映画製作者等は、過去の膨大な映像資産をＭＰＥＧ２方式によって圧縮符号化している。よって、ＭＰＥＧ２方式によって圧縮符号化された映像データを、Ｈ．２６４方式によって再度圧縮符号化するトランスコーダ（符号変換装置）の開発が求められている。

ＭＰＥＧ２方式によって圧縮符号化された映像データ（ＭＰＥＧ２映像データ）を、Ｈ．２６４方式によって圧縮符号化された映像データ（Ｈ．２６４映像データ）にトランスコードするトランスコーダとしては、クローズドループアーキテクチャを利用したトランスコーダが知られている（例えば、特開２００７−１０４２３１号公報参照。）。特開２００７−１０４２３１号公報に開示のトランスコーダは、デコーダと、エンコーダとを備えている。

デコーダは、元のＭＰＥＧ２映像データに対して、可変長復号化（ＶＬＤ）、逆量子化、およびＩＤＣＴ（逆離散コサイン変換）を順に行い、再生映像を生成する。再生映像は、エンコーダのバッファメモリに出力される。エンコーダは、バッファメモリに蓄積された再生映像をフレーム毎に抽出し、抽出した再生映像に対して、ＤＣＴ（離散コサイン変換）、量子化、および可変長符号化を行い、Ｈ．２６４映像データを作成する。また、エンコーダは、抽出した再生映像に対して動き補償を行うため、参照ピクチャを蓄積する参照メモリを用いて動きベクトルを生成し、生成した動きベクトルに対しても可変長符号化を行う。さらに、動き情報の生成において、エンコーダは、ＭＰＥＧ２映像データ中の動き情報も参照する。

このように、特開２００７−１０４２３１号公報に開示のトランスコーダによれば、ＭＰＥＧ２映像データをＨ．２６４映像データにトランスコードでき、データ量を元のＭＰＥＧ２映像データのデータ量の半分以下とできる。よって、例えば、ハードディスクレコーダが上記のトランスコーダを備えている場合は、ハードディスク容量が節約され、より多くのタイトルの録画が可能となる。また、伝送速度の低いネットワーク内においても、画質の優れた映像を伝送することが可能となる。

その他、オープンループアーキテクチャを採用したトランスコーダも知られている（例えば、特許第３２４４３９９号公報参照）。このトランスコーダは、元の映像データを可変復号化および逆量子化し、得られたデータに対して、量子化ステップ値Ｑを変えて量子化を行い、そして可変符号化を実行する。この結果、元の映像データよりもデータ量が圧縮された新たな映像データが生成される。

しかしながら、クローズドループアーキテクチャを利用した前者のトランスコーダでは、上述したように、バッファメモリや参照メモリが不可欠であり、多くのメモリリソースが必要となる。また、上記のトランスコーダの実現には、大規模な回路が必要となる。これらの点から、前者のトランスコーダには、安いコストでそれを提供でないという問題がある。

さらに、前者のトランスコーダでは、デコーダは、可変長復号化、逆量子化および逆ＤＣＴを行う必要があり、又、エンコーダは、ＤＣＴ、量子化および可変長符号化を行う必要がある。このため、上記のトランスコーダにおいて、処理の高速化は難しく、トランスコードを完了するまでの時間が、元の映像データの再生時間よりも長くなってしまう場合もある。

一方、オープンループアーキテクチャを利用した後者のトランスコーダでは、デコーダによる逆ＤＣＴとエンコーダによるＤＣＴとは行われない。このため、メモリリソースは必要なく、さらに回路規模も小さくてすむため、コストの上昇は抑制される。また、トランスコードの高速化も容易に達成できる。

しかし、後者のトランスコーダは、圧縮符号化方式の変更を目的としたものではなく、ＭＰＥＧ２映像データのデータ量の圧縮のみを目的としたものである。つまり、後者のトラスコーダでは、異なる圧縮符号化方式間でのシンタックスや動き補償の相違を考慮したトランスコードは行われず、ＭＰＥＧ２映像データからＨ．２６４映像データへのトランスコードは不可能である。

本発明の目的は、上記問題を解決し、安いコストで、且つ、高速で、圧縮符号化方式の異なる映像データ間でのトランスコードを行うことができ得る、トランスコーダおよびトランスコード方法、このトランスコーダによって得られた映像データをデコードするデコーダおよびデコード方法を提供することにある。

上記目的を達成するために本発明におけるトランスコーダは、動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、デコーダと、シンタックス変換部と、エンコーダとを備え、前記デコーダは、前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換し、前記エンコーダは、シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化し、さらに、前記第２の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とする。

上記目的を達成するために本発明におけるトランスコード方法は、動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、（ａ）前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、（ｂ）前記（ａ）の工程で復号された前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、（ｃ）前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、（ｄ）前記（ｃ）の工程で逆量子化された前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換する工程と、（ｅ）前記（ｄ）の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、（ｆ）前記（ｅ）の工程で量子化された前記映像データと、前記（ｂ）の工程で抽出された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化する工程と、（ｇ）前記（ｆ）の工程で前記第２の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とする。

上記目的を達成するために本発明におけるデコーダは、上記のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第１の圧縮符号化方式に従って動き補償を行うことを特徴とする。

上記目的を達成するために本発明におけるデコード方法は、上記のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、（ａ）前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第１の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、（ｂ）前記（ａ）の工程において、前記識別子が付加されていると判定された場合に、前記第１の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とする。

本発明によれば、動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを、第２の圧縮符号化方式に従って再符号化することができる。このとき、元の映像データの動きベクトルはそのまま利用され、再度作成されないため、従来のクローズドループアーキテクチャを利用する場合のように、大きなメモリリソースや回路規模は要求されない。よって、本発明によれば、トランスコードにかかるコストの上昇は抑制される。また、本発明では、ＤＣＴ（離散コサイン変換）やＩＤＣＴ（逆離散コサイン変換）を行うことなく、トランスコードが可能であるため、処理時間の短縮化も図られる。

図１は、本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図である。図２は、ＭＰＥＧ２映像データのデータ構造を示す図である。図３は、動き補償に必要な情報の一例を示す図である。図４は、第１の圧縮符号化方式（ＭＰＥＧ２方式）における予測補間信号の生成を説明する図である。図５は、第２の圧縮符号化方式（Ｈ．２６４方式）における予測補間信号の生成を説明する図である。図６は、本発明の実施の形態におけるトランスコード方法における流れを説明するフロー図である。図７は、本発明の実施の形態におけるデコーダの概略構成を示すブロック図である。図８は、本発明の実施の形態におけるデコード方法における流れを説明するフロー図である。

本発明におけるトランスコーダは、動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、デコーダと、シンタックス変換部と、エンコーダとを備え、前記デコーダは、前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換し、前記エンコーダは、シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化し、さらに、前記第２の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とする。

本発明におけるトランスコード方法は、動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、（ａ）前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、（ｂ）前記（ａ）の工程で復号された前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、（ｃ）前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、（ｄ）前記（ｃ）の工程で逆量子化された前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換する工程と、（ｅ）前記（ｄ）の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、（ｆ）前記（ｅ）の工程で量子化された前記映像データと、前記（ｂ）の工程で抽出された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化する工程と、（ｇ）前記（ｆ）の工程で前記第２の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とする。

また、本発明は、上記本発明におけるトランスコーダを具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明におけるトランスコーダを得ることができる。さらに、このプログラムを記録した記憶媒体も、本発明の一実施形態である。

また、本発明におけるデコーダは、上記のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第１の圧縮符号化方式に従って動き補償を行うことを特徴とする。

本発明におけるデコード方法は、上記のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、（ａ）前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第１の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、（ｂ）前記（ａ）の工程において、前記識別子が付加されていると判定された場合に、前記第１の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とする。

また、本発明は、上記本発明におけるデコーダを具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明におけるデコーダを得ることができる。さらに、このプログラムを記録した記憶媒体も、本発明の一実施形態である。

本発明において、前記第１の圧縮符号化方式としては、ＭＰＥＧ２方式が挙げられる。また、前記第２の圧縮符号化方式としては、Ｈ．２６４方式が挙げられる。

以下、本発明の一実施形態にかかるトランスコーダ、トランスコード方法、デコーダ、デコード方法について、図１〜図８を参照しながら説明する。

［トランスコーダおよびトランスコード方法についての説明］
最初に、本実施の形態におけるトランスコーダの構成について図１〜図５を用いて説明する。図１は、本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図である。図１に示すように、本実施の形態におけるトランスコーダは、デコーダ１と、シンタックス変換部２と、エンコーダ３とを備えている。この構成により、動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データは、復号され、第２の圧縮符号化方式に従って再度圧縮符号化される。本実施の形態において、第１の圧縮符号化方式はＭＰＥＧ２方式であり、第２の圧縮符号化方式はＨ．２６４方式である。

デコーダ１は、復号部４と、逆量子化部５とを備えている。復号部４は、トランスコード対象となる変換元の映像データを復号し、圧縮符号化される前のデータを生成する。本実施の形態では、対象となる映像データは、ＭＰＥＧ２方式に従って、例えばハフマン符号化によって圧縮符号化された、ＭＰＥＧ２映像データ（MPEG2 ES(Elementary Stream)）である。復号部４は、可変長符号復号（ＶＬＤ：Variable Length Decoding）を実行する。

また、復号部４は、復号した映像データから、ＭＰＥＧ２方式に従って作成されている動きベクトルを抽出し、抽出した動きベクトルをエンコーダ３に直接入力する。動きベクトルについては、図２〜図５を用いて後述する。

逆量子化部５は、復号された映像データに対して逆量子化を行う。但し、逆量子化部５による逆量子化は、動きベクトル以外の復号された映像データに対してのみ行われる。逆量子化部５は、逆量子化した映像データをシンタックス変換部２に入力する。

シンタックス変換部２は、デコーダ２の逆量子化部５が入力した映像データのシンタックスをＨ．２６４方式によって規定されたシンタックスに変換する。ＭＰＥＧ２方式では、ピクチャが符号化の単位になっているのに対し、Ｈ．２６４方式では、スライスが符号化の単位になっているため（図２参照）、これに合わせてシンタックスが変換される。

具体的には、シンタックス変換部２は、変換元のＭＰＥＧ２映像データのシーケンスヘッダ（ＳＨ：Sequence Head）や、各ピクチャの先頭に付加されているピクチャヘッダを抽出する（図２参照）。そして、シンタックス変換部２は、これらから、Ｈ．２６４方式で規定された、シーケンスパラメータセット（ＳＰＳ：Sequence Parameter Set）や、ピクチャパラメータセット（ＰＰＳ：Picture Parameter Set）を作成する。

ＳＰＳおよびＰＰＳの中には、それぞれ番号が付加されている。各スライス（図２参照）に付加されているスライスヘッダの中でＰＰＳ番号を指定することによって、どのＰＰＳを用いられるかが識別される。また、ＰＰＳの中でＳＰＳ番号を指定することによって、各スライスが、どのシーケンスに属するかが識別される。また、シンタックス変換部２は、これらのパラメータセットを、これらを参照するデータの前に配置する。

さらに、シンタックス変換部２は、ＳＥＩ（Supplemental Enhancement Information）や、ＡＵデリミタ（Access Unit Delimiter）の付加を行うこともできる。ＳＥＩは、各ピクチャのタイミング情報やランダム・アクセス情報等の付加情報を含むヘッダである。ＡＵデリミタは、ピクチャの先頭を特定するための符号である。

エンコーダ３は、量子化部６と、符号化部７とを備えている。量子化部６は、シンタックス変換部２によってシンタックスが変換された映像データに対して、設定された量子化ステップ値で量子化を行う。符号化部７は、量子化部６によって量子化された映像データと、デコーダ１から入力された動きベクトルとを合わせ、これらをＨ．２６４方式に従って圧縮符号化する。

具体的には、符号化部７は、ＣＡＶＬＣ（コンテキスト適応型か変調符号化方式：Context-AdaptiveVariable Length Coding）、またはＣＡＢＡＣ（コンテキスト適応型２値算術符号化方式：Context-Adaptive Binary Arithmetic Coding）に従って、圧縮符号化を実行する。

さらに、符号化部７は、再符号化した映像データに、動きベクトルがＭＰＥＧ２方式に従って作成されていること（つまり、動きベクトルについてはＨ．２６４方式に従って作成されていないこと）を示す識別子を付加する。そして、符号化部７が再符号化した映像データ（H.264 ES（Elementary Stream））は外部へと出力される。

また、本実施の形態では、エンコーダ３は、ビットレート制御部８を備えている。ビットレート制御部８は、デコーダ１の復号部４が復号したデータと、エンコーダ３の符号化部７が圧縮符号化して作成した映像データとに基づいて、目標となるビットレートを求める。そして、ビットレート制御部８は、求められたビットレートを達成するための量子化ステップ値（除算値）を設定し、設定した量子化ステップ値を量子化部６に入力する。量子化ステップ値が入力されると、量子化部６は、入力された値で量子化を実行する。

ここで、図２〜図５を用いて、動きベクトルについて具体的に説明する。先ず、動きベクトルを含むＭＰＥＧ２映像データの全体構成について説明する。図２は、ＭＰＥＧ２映像データのデータ構造を示す図である。図２に示すように、ＭＰＥＧ２映像データは、シーケンスレイヤ、ＧＯＰ（Group of Picture）レイヤ、ピクチャレイヤ、スライスレイヤ、マクロブロックレイヤ、およびブロックレイヤといった６つのレイヤ（階層）によって構成されている。

シーケンスレイヤを構成するシーケンスは、１つ以上のＧＯＰと、それに対応するシーケンスヘッドと、１つのシーケンスエンドコード（終了符号）とで形成されている。シーケンスヘッド中には、動画像シーケンスの特徴を特定する情報、例えば、画面の縦横のサイズ、アスペクト比、画像レート、量子化マトリクスなどが含まれている。

ＧＯＰレイヤを構成するＧＯＰは、複数の画面（ピクチャ）の集合によって構成されている。ピクチャとしては、フレーム内符号化によって得られるＩピクチャと、双方向予測符号化によって得られるＢピクチャと、順方向予測符号化によって得られるＰピクチャとの三種類がある。

ピクチャレイヤを構成するピクチャは、一枚の動画像フレームによって構成されている。図示していないが、各ピクチャには、ピクチャヘッダが付加されている。ピクチャヘッド中には、ピクチャの表示順序を示す番号や、ピクチャの種類を特定する符号等が含まれている。

スライスレイヤを構成するスライスは、一枚のピクチャを帯状に断片化して得られたものであり、複数個のマクロブロック（ＭＢ）の集合体である。また、マクロブロックレイヤは、スライスの一部である一つのマクロブロックによって構成されている。マクロブロックは、１６画素×１６ラインの正方形の画素ブロックであり、輝度ブロックＹと、対応する２つの８画素×８ラインの色差ブロック（Ｃｂ、Ｃｒ）とによって構成されている。さらに、マクロブロックは、ＤＣＴの処理単位である８画素×８ラインのブロックに細分化され、このブロックがブロックレイヤを構成している。

図２には、ＭＰＥＧ２映像データが開示されているが、Ｈ．２６４映像データも略同様のデータ構造を備えている。但し、上述したように、Ｈ．２６４方式では、スライスが符号化の単位になるため、一つのピクチャに、異なる種類のスライスが混在することもある。さらに、Ｈ．２６４方式では、ＤＣＴの処理単位は、４画素×４ラインであり、マクロブロックはさらに細分化される。

また、ＭＰＥＧ２方式およびＨ．２６４方式の両方において動き補償が行われる。そして、動画像フレームを分割して得られた動き補償ブロック毎に、動きベクトルが求められ、動きベクトルの符号化が行われる。動き補償ブロックのサイズとしては、ＭＰＥＧ２方式では１６×１６のみが認められている。一方、Ｈ．２６４では、動き補償ブロックのサイズとしては、１６×１６に加え、１６×８、８×１６、８×８、８×４、４×８、４×４も認められている。

動き補償を行うために必要な情報は、マクロブロックレイヤに付加される。図３は、動き補償に必要な情報の一例を示す図である。図３に示すように、ＭＰＥＧ２方式およびＨ．２６４方式の両方において、マクロブロックレイヤには、動き補償を特定するために、各動き補償ブロックの参照ピクチャ番号と、各動き補償ブロックの動きベクトルとが付加される。

また、動き補償を行うため、ＭＰＥＧ２方式およびＨ．２６４方式のどちらであっても、予測補間信号の生成が行われる。予測補間信号は、整数画素の画素精度よりも低い画素精度を持った信号であり、参照ピクチャの画素値から生成される。但し、両方式において、予測補間信号の生成方法は異なっている。この点について、図４および図５を用いて以下に説明する。

図４は、第１の圧縮符号化方式（ＭＰＥＧ２方式）における予測補間信号の生成を説明する図である。図５は、第２の圧縮符号化方式（Ｈ．２６４方式）における予測補間信号の生成を説明する図である。

図４に示すように、ＭＰＥＧ２方式では、予測補間信号の生成は、２タップ（ｔａｐ）フィルターを用い、隣接する整数画素信号（□）の中間点では両者の平均値を求めることによって（○）、または、４つの整数画素信号の中央ではこれらの平均値を求めることによって（◇）行われている。ＭＰＥＧ２方式では、動きベクトルは、基本的に半画素精度で表現されている。

一方、図５に示すように、Ｈ．２６４方式では、予測補間信号の生成は、６タップ（ｔａｐ）フィルターを用いて行われている。具体的には、２つの整数画素信号（□）の、水平方向の中間位置にある（１／２）画素信号（○）は、水平方向に並ぶ６つの整数画素信号に６タップフィルタリング処理を施すことによって作成される。同様に、２つの整数画素信号（□）の、垂直方向の中間位置にある（１／２）画素信号（○）は、垂直方向に並ぶ６つの整数画素信号に６タップフィルタリング処理を施すことによって作成される。

また、４つの整数画素信号（□）の中間位置にある（１／２）画素信号（◇）は、水平方向または垂直方向に並ぶ６つの（１／２）画素信号（○）に６タップフィルタリング処理を施すことによって作成される。（１／２）画素信号を作成した後、平均値フィルターによって（１／４）画素信号（●および◆）が作成される。

このように、予測補間信号の生成において、Ｈ．２６４方式は、ＭＰＥＧ２方式と大きく異なっている。Ｈ．２６４方式では、ＭＰＥＧ２方式に比べて、動きベクトルの予測精度が向上するため、より精度の高い動き補償が可能となる。但し、このため、ＭＰＥＧ２方式に沿って作成された動きベクトルを、Ｈ．２６４方式に沿って作成された動きベクトルに完全にトランスコードするには、従来のクローズドループアーキテクチャを利用するトランスコーダのように、バッファメモリや参照メモリが必要となる。即ち、ＭＰＥＧ２映像データを逆量子化した後、さらに、ＩＤＣＴ（逆離散コサイン変換）を行い、そして、得られた画像をメモリ上に展開しなければ、再符号化は困難である。

これに対して、本実施の形態では、図１に示したように、デコーダ１は、動きベクトルについては、復号した後、そのままエンコーダ３へと出力する。本実施の形態において、予測補間信号が改めて作成されることはない。そして、エンコーダ３は、動きベクトルについては、そのまま再符号化する。このため、本実施の形態におけるトランスコーダでは、従来のクローズドループアーキテクチャを利用する場合のように、大きなメモリリソースや回路規模が要求されることはない。

次に、本実施の形態におけるトランスコード方法について図６を用いて説明する。図６は、本発明の実施の形態におけるトランスコード方法における流れを説明するフロー図である。本実施の形態におけるトランスコード方法は、図１に示した本実施の形態におけるトランスコーダを動作させることによって実施される。このため、以下の説明においては、適宜図１を参酌しながら、図１に示すトランスコーダの動作と共に説明する。

図６に示すように、先ず、変換元のＭＰＥＧ２映像データ（MPEG2 ES）がデコーダ１に入力されると、デコーダ１の復号部４は、可変長符号復号（ＶＬＤ：Variable Length Decoding）を実行する（ステップＳ１）。さらに、復号部４は、復号されたＭＰＥＧ２映像データから、動きベクトルのみを抽出し、抽出した動きベクトルについては、エンコーダ３に入力する（ステップＳ２）。復号部４は、動きベクトル以外の映像データについては、逆量子化部５に入力する。

続いて、逆量子化部５は、入力された映像データに対して、逆量子化を実行する（ステップＳ３）。また、逆量子化部５は、逆量子化して得られた映像データをシンタックス変換部２に入力する。次に、シンタックス変換部２は、逆量子化された映像データに対して、シンタックスの変換を実行する（ステップＳ４）。これにより、Ｈ．２６４方式で規定された、シーケンスパラメータセットや、ピクチャパラメータセット等が作成され、これらが映像データに組み込まれる。シンタックスが変換された映像データは、エンコーダ３を構成する量子化部６に入力される。

次に、量子化部６は、映像データが入力されると、この映像データに対して、設定された量子化ステップ値で量子化を実行する（ステップＳ５）。このとき、量子化ステップ値の設定は、ビットレート制御部８によって行われる。ビットレート制御部８は、上述したように、目標となるビットレートが達成されるように量子化ステップ値（除算値）を設定している。また、量子化部６は、量子化された映像データを、エンコーダ３を構成する符号化部７に入力する。

その後、符号化部７は、量子化された映像データに対して、Ｈ．２６４方式に従って再度圧縮符号化を実行する（ステップＳ６）。また、符号化部７は、再度圧縮符号化した映像データに、識別子を付加する。この識別子は、動きベクトルがトランスコード前の圧縮符号化方式（ＭＰＥＧ２方式）に従って作成されていることを示すものであり、映像データのユーザ領域に書き込まれている。

このように、ステップＳ１〜ステップＳ６の実行により、Ｈ．２６４方式に従って再度圧縮符号化された（トランスコードされた）映像データが得られることとなる。また、上述したように、トランスコードの際に大きなメモリリソースや回路規模は要求されないため、本実施の形態によれば、トランスコードにかかるコストの上昇は抑制される。また、本実施の形態では、ＤＣＴやＩＤＣＴを行うことなく、トランスコードが可能であるため、処理時間の短縮化も図られる。

また、本実施の形態におけるトランスコーダは、コンピュータに、図６に示すステップＳ１〜Ｓ６を行わせるプログラムをインストールし、このプログラムを実行することによっても、実現することができる。この場合、コンピュータのＣＰＵ（central processing unit）は、デコーダ１、シンタックス変換部２、エンコーダ３として機能し、処理を行なう。

ところで、ステップＳ６（図６参照）の実行後にエンコーダ３（図１参照）から出力される映像データは、動きベクトルがＭＰＥＧ２方式に従って作成されているため、厳密には、完全なＨ．２６４映像データではない。よって、デコーダが、トランスコードされた映像データを再生する際に、Ｈ．２６４方式に従って動き補償を行うと画質が劣化する可能性がある。

但し、このトランスコードされた映像データには上述した識別子が付加されている。従って、このトランスコードされた映像データをデコードする場合は、デコーダ側で識別子の有無を判定し、識別子が存在する場合は、トランスコード前の符号化方式に従って動き補償が実行されるようにすれば良い。この場合、画質を劣化させることなく映像が再生される。本実施の形態におけるデコーダおよびデコード方法について、以下に説明する。

［デコーダおよびデコード方法についての説明］
次に、本実施の形態におけるデコーダおよびデコード方法について図７および図８を用いて説明する。本実施の形態におけるデコーダおよびデコード方法は、本実施の形態におけるトランスコーダおよびトランスコード方法によって再符号化された映像データから再生画像を生成することができる。

最初に、本実施の形態におけるデコーダの構成について図７を用いて説明する。図７は、本発明の実施の形態におけるデコーダの概略構成を示すブロック図である。図７に示すように、デコーダは、再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部１４を備えている。また、デコーダは、その他に、復号部１１、逆量子化部１２、ＩＤＣＴ部１３、フレームメモリ１５、画面内予測部１６、およびフィルター１７も備えている。

復号部１１は、Ｈ．２６４映像データ（H.264 ES）が入力されると、これを復号（エントロピー復号）し、復号した映像データを逆量子化部１２に入力する。逆量子部１２は、復号された映像データを逆量子化し、逆量子化した映像データをＩＤＣＴ部１３に入力する。ＩＤＣＴ部１３は、逆量子化された映像データに対してＩＤＣＴ（逆離散コサイン変換）を実行し、画素値で構成された映像データを出力する。

フィルター１７は、デブロッキングフィルターであり、ＩＤＣＴ部１３が出力した映像データに対して、ブロック歪の除去を行っている。フィルター１７によってブロック歪が除去された映像データは、外部に再生画像として出力されると共に、フレームメモリ１５に蓄積される。画面内予測部１６は、元のデータが画面内予測符号化によって作成されている場合に、ＩＤＣＴ部１３が出力した映像データに基づいて動画像フレームを作成する。

動き補償部１４は、フレームメモリ１５に蓄積されている動画像フレームを用いて、動き補償を実行し、動画像フレームを作成する。画面内予測部１６が作成した動画像フレームと、動き補償部１４が作成した動画像フレームとは、再生順序に応じて、ＩＤＣＴ部１３が出力した映像データに組み込まれる。

また、通常、動き補償部１４は、Ｈ．２６４用のデコーダに備えられた動き補償部と同様に、Ｈ．２６４方式に従って動き補償を実行する。但し、本実施の形態においては、動き補償部１４は、動き補償の実行による動画像フレームの作成機能に加え、識別子の有無を判定する機能も備えている。さらに、動き補償部１４は、識別子が付加されていると判定した場合は、トランスコードされる前の圧縮符号化方式、即ち、ＭＰＥＧ２方式に従って動き補償を実行する機能も備えている。

なお、動き補償部１４は、識別子が付加されていないと判定した場合は、上述したように、Ｈ．２６４方式に従って動き補償を実行する。「識別子」は、図１に示した本実施の形態におけるトランスコーダが作成した識別子であって、動きベクトルについてはＭＰＥＧ２方式に従って作成されていることを示すものである。

ここで、本実施の形態におけるデコード方法について図８を用いて説明する。図８は、本発明の実施の形態におけるデコード方法における流れを説明するフロー図である。本実施の形態におけるデコード方法は、図７に示した本実施の形態におけるデコーダを動作させることによって実施される。このため、以下の説明においては、適宜図７を参酌しながら、図７に示すデコーダの動作と共に説明する。また、図８は、デコード方法における全工程のうち動き補償に関する工程、即ち、動き補償部１４によって実行される工程のみを図示している。

図８に示すように、動き補償部１４は、映像データが入力されると、入力された映像データが、トランスコーダによって付加された「識別子」を含んでいるかどうかの判定を行なう（ステップＳ１１）。

ステップＳ１１の判定の結果、「識別子」が含まれている場合は、動き補償部１４は、ＭＰＥＧ２方式に従って動き補償を実行する（ステップＳ１２）。具体的には、動き補償部１４は、ステップＳ１２においては、動きベクトルが半画素精度であることを前提にして、動画像フレームを生成する。

一方、「識別子」が含まれていない場合は、動き補償部１４は、通常のＨ．２６４用のデコーダに備えられた動き補償部と同様に、Ｈ．２６４方式に従って動き補償を実行する（ステップＳ１３）。具体的には、動き補償部１４は、ステップＳ１３においては、６タップフィルタリング処理による予測補間信号から動きベクトルが生成されていることを前提にして、動画像フレームを生成する。

なお、ステップＳ１１における判定は、映像データの入力開始時に行われる。また、ステップＳ１２およびＳ１３は、図７に示したデコーダへの映像データの入力が終了するまで行われる。

このように、本実施の形態におけるデコーダまたはデコード方法を用いれば、本実施の形態におけるトランスコーダおよびトランスコード方法によって再度圧縮符号化された映像データを再生することができる。また、本実施の形態におけるデコーダまたはデコード方法によれば、本実施の形態におけるトランスコーダおよびトランスコード方法によって再度圧縮符号化された映像データ以外のＨ．２６４映像データについても、再生することができる。

また、本実施の形態におけるデコーダは、コンピュータに、図８に示すステップＳ１１〜Ｓ１３、復号処理、逆量子化処理、ＩＤＣＴ処理、画面内予測処理、およびデブロッキングフィルタリング処理を行わせるプログラムをインストールし、このプログラムを実行することによっても、実現することができる。この場合、コンピュータのＣＰＵ（central processing unit）は、復号部１１、逆量子化部１２、ＩＤＣＴ部１３、動き補償部１４、画面内予測部１６として機能し、処理を行なう。また、コンピュータのメモリがフレームメモリ１５として機能する。

本発明におけるトランスコーダおよびトランスコーダ方法は、各種の映像機器に有用であり、産業上の利用可能性を有するものである。また、本発明におけるデコーダおよびデコード方法は、本発明におけるトランスコーダまたはトランスコード方法が再度圧縮符号化した映像データを再生するためのデコーダおよびデコード方法として、産業上の利用可能性を有している。

本発明の実施の形態におけるトランスコーダの概略構成を示すブロック図ＭＰＥＧ２映像データのデータ構造を示す図動き補償に必要な情報の一例を示す図第１の圧縮符号化方式（ＭＰＥＧ２方式）における予測補間信号の生成を説明する図第２の圧縮符号化方式（Ｈ．２６４方式）における予測補間信号の生成を説明する図本発明の実施の形態におけるトランスコード方法における流れを説明するフロー図本発明の実施の形態におけるデコーダの概略構成を示すブロック図本発明の実施の形態におけるデコード方法における流れを説明するフロー図

Claims

動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコーダであって、
デコーダと、シンタックス変換部と、エンコーダとを備え、
前記デコーダは、前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号し、復号した前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出し、抽出した前記動きベクトルを前記エンコーダに入力し、そして、前記動きベクトル以外の復号した前記映像データに対しては逆量子化を行い、逆量子化した前記映像データを前記シンタックス変換部に入力し、
前記シンタックス変換部は、前記デコーダが入力した前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換し、
前記エンコーダは、
シンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行い、
量子化された前記映像データと、前記デコーダから入力された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化し、
さらに、前記第２の圧縮符号化方式に従って圧縮符号化したデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加することを特徴とするトランスコーダ。
前記第１の圧縮符号化方式がＭＰＥＧ２方式であり、前記第２の圧縮符号化方式がＨ．２６４方式である請求項１に記載のトランスコーダ。
動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法であって、
（ａ）前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号する工程と、
（ｂ）前記（ａ）の工程で復号された前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出する工程と、
（ｃ）前記動きベクトル以外の復号された前記映像データを逆量子化する工程と、
（ｄ）前記（ｃ）の工程で逆量子化された前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換する工程と、
（ｅ）前記（ｄ）の工程でシンタックスが変換された前記映像データに対して、設定された量子化ステップ値で量子化を行う工程と、
（ｆ）前記（ｅ）の工程で量子化された前記映像データと、前記（ｂ）の工程で抽出された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化する工程と、
（ｇ）前記（ｆ）の工程で前記第２の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加する工程とを有することを特徴とするトランスコード方法。
前記第１の圧縮符号化方式がＭＰＥＧ２方式であり、前記第２の圧縮符号化方式がＨ．２６４方式である請求項３に記載のトランスコード方法。
前記請求項１に記載のトランスコーダによる再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコーダであって、
前記再度の圧縮符号化によって得られた映像データに含まれる動きベクトルに基づいて動き補償を行う動き補償部を備え、
前記動き補償部は、前記トランスコーダが、前記再度の圧縮符号化によって得られた映像データに対して、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加しているかどうか判定し、前記識別子が付加されている場合は、前記第１の圧縮符号化方式に従って動き補償を行うことを特徴とするデコーダ。
前記第１の圧縮符号化方式がＭＰＥＧ２方式であり、前記第２の圧縮符号化方式がＨ．２６４方式である請求項５に記載のデコーダ。
前記請求項３に記載のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法であって、
（ａ）前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第１の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定する工程と、
（ｂ）前記（ａ）の工程において、前記識別子が付加されていると判定された場合に、前記第１の圧縮符号化方式に従って動き補償を行う工程とを有することを特徴とするデコード方法。
前記第１の圧縮符号化方式がＭＰＥＧ２方式であり、前記第２の圧縮符号化方式がＨ．２６４方式である請求項７に記載のデコード方法。
動き補償フレーム間差分符号化を行う第１の圧縮符号化方式に従って圧縮符号化された映像データを復号し、これを第２の圧縮符号化方式に従って再度圧縮符号化するトランスコード方法をコンピュータによって実行するためのプログラムであって、
（ａ）前記第１の圧縮符号化方式に従って圧縮符号化された前記映像データを復号するステップと、
（ｂ）前記（ａ）のステップで復号された前記映像データから、前記第１の圧縮符号化方式に従って作成されている動きベクトルを抽出するステップと、
（ｃ）前記動きベクトル以外の復号された前記映像データを逆量子化するステップと、
（ｄ）前記（ｃ）のステップで逆量子化された前記映像データのシンタックスを前記第２の圧縮符号化方式によって規定されたシンタックスに変換するステップと、
（ｅ）前記（ｄ）のステップでシンタックスが変換された前記映像データを設定された圧縮率で量子化するステップと、
（ｆ）前記（ｅ）のステップで量子化された前記映像データと、前記（ｂ）のステップで抽出された前記動きベクトルとを合わせ、これらを前記第２の圧縮符号化方式に従って圧縮符号化するステップと、
（ｇ）前記（ｆ）のステップで前記第２の圧縮符号化方式に従って圧縮符号化されたデータに、前記動きベクトルは前記第１の圧縮符号化方式に従って作成されていることを示す識別子を付加するステップとをコンピュータに実行させることを特徴とするプログラム。
前記請求項３に記載のトランスコード方法による再度の圧縮符号化によって得られた映像データから、再生画像を生成するデコード方法をコンピュータによって実行するためのプログラムであって、
（ａ）前記再度の圧縮符号化によって得られた映像データに、それに含まれる動きベクトルが前記第１の圧縮符号化方式に従って作成されていることを示す識別子が、付加されているかどうか判定するステップと、
（ｂ）前記（ａ）のステップにおいて、前記識別子が付加されていると判定された場合に、前記第１の圧縮符号化方式に従って動き補償を行うステップとをコンピュータに実行させることを特徴とするプログラム。