JP2011151524A - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
JP2011151524A
JP2011151524A JP2010009739A JP2010009739A JP2011151524A JP 2011151524 A JP2011151524 A JP 2011151524A JP 2010009739 A JP2010009739 A JP 2010009739A JP 2010009739 A JP2010009739 A JP 2010009739A JP 2011151524 A JP2011151524 A JP 2011151524A
Authority
JP
Japan
Prior art keywords
picture
encoding
code stream
encoded code
neighborhood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010009739A
Other languages
English (en)
Inventor
Takahiro Fukuhara
隆浩 福原
Kazuhiko Sayama
和彦 佐山
Masakazu Yoshimoto
正和 吉本
Junichi Ogikubo
純一 荻窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010009739A priority Critical patent/JP2011151524A/ja
Publication of JP2011151524A publication Critical patent/JP2011151524A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】データ変換処理を、画質の低減を抑制しながら、より高速に行うことができるようにする。
【解決手段】分割部111は、オリジナルの符号化コードストリームを分割し、デコーダ112は、分割された各符号化コードストリームを復号し、エンコーダ113は、復号されて得られた各画像データを新たな符号化方式で符号化し、近傍デコーダ116は、オリジナルの符号化データの、近傍デコード開始ピクチャ検出部114および近傍デコード終了ピクチャ検出部115によりバッファ残量に基づいて検出された開始ピクチャ点と終了ピクチャ点との間を復号し、近傍エンコーダ117は、復号されて得られた各画像データを新たな符号化方式で符号化し、合成部118は、各符号化コードストリームを合成する。本発明は、例えば、画像処理装置に適用することができる。
【選択図】図1

Description

本発明は、画像処理装置および方法に関し、特に、画像データが符号化された符号化データに対する符号化方式の変換、若しくは、画像データの符号化を、画質の低減を抑制しながら、より高速に行うことができるようにした画像処理装置および方法に関する。
ISO(International Organization for Standardization)/IEC(International Electrotechnical Commission)で標準化された符号化方式には、例えば、JPEG(Joint Photographic Experts Group)、JPEG2000、MPEG-2(Moving Picture Experts Group - 2)、MPEG-4、およびH.264(AVC(Advanced Video Coding))等がある。
これらの各フォーマットで圧縮保存されたファイルが、コンテンツの種類の増加に伴って急増するものと予想される。従って、これらの異なるフォーマット間の変換(トランスコード)技術の確立が急務である。
MPEG系のトランスコード技術に関しては、基本的なアルゴリズムが類似している(DCT(Discrete Cosine Transform)変換、可変長符号化、動き補償予測等)ので比較的容易ということもあり、これまで多くの研究成果が報告されている。既に実用化レベルでもBlu-Ray DiscレコーダにおいてMPEG-2→H.264にトランスコードする実装が行われ、従来のDVDレコーダよりも長時間録画が可能になっている。
これに対して、デジタルシネマ規格(DCI(Digital Cinema Initiative)規格)はハリウッド大手8社のスタジオが策定したフォーマットで、画像コーデックとしてはISO/IEC規格のJPEG2000を採用している。このデジタルシネマ規格に従って世界各国の映画館でデジタルシネマが普及しつつある。従って、今後JPEG2000で圧縮されたコンテンツを放送局から映像配信するために、MPEG-2に変換する場合や、Blu-Ray Discに記録するためにH.264に変換するニーズが急増すると予想される。
この場合、JPEG2000とMPEG系とでは全くアルゴリズムが異なるので、JPEG2000デコード+MPEG系エンコードが必須となる。
ところで、近年においては、エンコードやデコードをより高速に処理を行うために、入力画像を複数のシーケンスに分割して、個々のシーケンス毎にトランスコードを同時並行的に実行する処理が報告されている(例えば、特許文献1参照)。
特開2005−176069号公報
しかしながら、特許文献1に記載の方法の場合、エンコードの際に、シーンチェンジを検出するための解析・分析処理が余計に必要であった。また、シーンチェンジを必要としない場合でも、先頭データからシーンチェンジよりも前のデータを重複部としてエンコードする必要があるので、これについても冗長性が大きかった。更に、分割ポイントがシーンチェンジに依存しているため、トランスコードの速度が、シーンチェンジ数の大小によって影響される恐れがあった。
本発明は、このような状況に鑑みて提案されたものであり、画像データが符号化された符号化データに対する符号化方式の変換、若しくは、画像データの符号化を、画質の低減を抑制しながら、より高速に行うことができるようにすることを目的とする。
本発明の一側面は、画像データが所定の符号化方式により符号化された符号化コードストリームを複数に分割する分割手段と、前記分割手段により分割された各符号化コードストリームを復号する復号手段と、前記復号手段により復号されて得られた復号画像データを、前記符号化方式と異なる他の符号化方式により符号化する符号化手段と、前記符号化手段による符号化の際のバッファ残量に基づいて、前記分割手段が前記符号化コードストリームを分割した分割位置近傍の復号対象範囲を決定する決定手段と、前記分割手段により分割された各符号化コードストリームの、前記決定手段により決定された前記復号対象範囲を復号する近傍復号手段と、前記近傍復号手段により復号されて得られた復号画像データを、前記他の符号化方式により符号化する近傍符号化手段とを備える画像処理装置である。
前記決定手段は、前記復号対象範囲の開始ピクチャと終了ピクチャとを決定し、前記近傍復号手段は、前記分割手段により分割された各符号化コードストリームの、前記決定手段により決定された前記開始ピクチャから最終ピクチャまでと、先頭ピクチャから前記決定手段により決定された前記終了ピクチャまでを、それぞれ復号することができる。
前記決定手段は、前記最終ピクチャの前の所定の範囲において、前記バッファ残量が最大となるイントラピクチャを前記開始ピクチャに決定することができる。
前記決定手段は、前記先頭ピクチャの後の所定の範囲において、前記バッファ残量が最小となるイントラピクチャを前記終了ピクチャに決定することができる。
前記決定手段は、前記最終ピクチャの前の所定の範囲において、シーンチェンジが発生するピクチャを前記開始ピクチャに決定することができる。
前記決定手段は、前記先頭ピクチャの後の所定の範囲において、シーンチェンジが発生するピクチャを前記終了ピクチャに決定することができる。
前記符号化手段により符号化されて得られた各符号化コードストリーム、並びに、前記近傍符号化手段により符号化されて得られた各符号化コードストリームを、互いのピクチャを揃えて合成する合成手段をさらに備えることができる。
本発明の一側面は、また、画像処理装置の画像処理方法であって、前記画像処理装置の分割手段が、画像データが所定の符号化方式により符号化された符号化コードストリームを複数に分割し、前記画像処理装置の復号手段が、分割された各符号化コードストリームを復号し、前記画像処理装置の符号化手段が、復号されて得られた復号画像データを、前記符号化方式と異なる他の符号化方式により符号化し、前記画像処理装置の決定手段が、符号化の際のバッファ残量に基づいて、前記符号化コードストリームが分割された分割位置近傍の復号対象範囲を決定し、前記画像処理装置の近傍復号手段が、分割された各符号化コードストリームの、決定された前記復号対象範囲を復号し、前記画像処理装置の近傍符号化手段が、復号されて得られた復号画像データを、前記他の符号化方式により符号化する画像処理方法である。
本発明の他の側面は、画像データを複数に分割する分割手段と、前記分割手段により分割された各画像データを符号化する符号化手段と、前記符号化手段による符号化の際のバッファ残量に基づいて、前記分割手段が前記画像データを分割した分割位置近傍の符号化対象範囲を決定する決定手段と、前記分割手段により分割された各画像データの、前記決定手段により決定された前記符号化対象範囲を符号化する近傍符号化手段とを備える画像処理装置である。
前記決定手段は、前記符号化対象範囲の開始ピクチャと終了ピクチャとを決定し、前記近傍符号化手段は、前記分割手段により分割された各画像データの、前記決定手段により決定された前記開始ピクチャから最終ピクチャまでと、先頭ピクチャから前記決定手段により決定された前記終了ピクチャまでを、それぞれ符号化することができる。
前記決定手段は、前記最終ピクチャの前の所定の範囲において、前記バッファ残量が最大となるイントラピクチャを前記開始ピクチャに決定することができる。
前記決定手段は、前記先頭ピクチャの後の所定の範囲において、前記バッファ残量が最小となるイントラピクチャを前記終了ピクチャに決定することができる。
前記決定手段は、前記最終ピクチャの前の所定の範囲において、シーンチェンジが発生するピクチャを前記開始ピクチャに決定することができる。
前記決定手段は、前記先頭ピクチャの後の所定の範囲において、シーンチェンジが発生するピクチャを前記終了ピクチャに決定することができる。
前記符号化手段により符号化されて得られた各符号化コードストリーム、並びに、前記近傍符号化手段により符号化されて得られた各符号化コードストリームを、互いのピクチャを揃えて合成する合成手段をさらに備えることができる。
本発明の他の側面は、また、画像処理装置の画像処理方法であって、前記画像処理装置の分割手段が、画像データを複数に分割し、前記画像処理装置の符号化手段が、分割された各画像データを符号化し、前記画像処理装置の決定手段が、符号化の際のバッファ残量に基づいて、前記画像データが分割された分割位置近傍の符号化対象範囲を決定し、前記画像処理装置の近傍符号化手段が、分割された各画像データの、決定された前記符号化対象範囲を符号化する画像処理方法である。
本発明の一側面においては、画像データが所定の符号化方式により符号化された符号化コードストリームが複数に分割され、分割された各符号化コードストリームが復号され、復号されて得られた復号画像データが、符号化方式と異なる他の符号化方式により符号化され、符号化の際のバッファ残量に基づいて、符号化コードストリームが分割された分割位置近傍の復号対象範囲が決定され、分割された各符号化コードストリームの、決定された復号対象範囲が復号され、復号されて得られた復号画像データが、他の符号化方式により符号化される。
本発明の他の側面においては、画像データが複数に分割され、分割された各画像データが符号化され、符号化の際のバッファ残量に基づいて、画像データが分割された分割位置近傍の符号化対象範囲が決定され、分割された各画像データの、決定された符号化対象範囲が符号化される。
本発明によれば、画像を処理することができる。特に、画像データが符号化された符号化データに対する符号化方式の変換、若しくは、画像データの符号化を、画質の低減を抑制しながら、より高速に行うことができる。
本発明を適用した変換装置の主な構成例を示すブロック図である。 図1のデコーダの主な構成例を示すブロック図である。 サブバンドの構成例を示す図である。 各サブバンド中のコードブロックの例を示す図である。 ビットプレーンの例を説明する図である。 符号化パスの例を説明する図である。 係数の走査の例を説明する図である。 図1のエンコーダの主な構成例を示すブロック図である。 近傍エンコードの範囲の設定方法を説明する図である。 トランスコードの様子の例を説明する図である。 変換処理の流れの例を説明するフローチャートである。 近傍エンコードの範囲の、他の設定方法を説明する図である。 本発明を適用した変換装置の他の構成例を示すブロック図である。 トランスコードの様子の他の例を説明する図である。 変換処理の流れの他の例を説明するフローチャートである。 本発明を適用した変換装置の、さらに他の構成例を示すブロック図である。 変換処理の流れの、さらに他の例を説明するフローチャートである。 本発明を適用した変換装置の、さらに他の構成例を示すブロック図である。 トランスコードの様子の例を説明する図である。 変換処理の流れの、さらに他の例を説明するフローチャートである。 本発明を適用したパーソナルコンピュータの構成例を示すブロック図である。
以下、発明を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(変換装置)
2.第2の実施の形態(変換装置)
3.第3の実施の形態(変換装置)
4.第4の実施の形態(変換装置)
5.第5の実施の形態(パーソナルコンピュータ)
<1.第1の実施の形態>
[変換装置の構成]
図1は、本発明を適用した変換装置の一実施の形態の構成を表している。
図1に示される変換装置100は、画像データがJPEG2000(Joint Photographic Experts Group 2000)方式で符号化された符号化データを受け付け、その符号化データの符号化方式をMPEG-4(AVC(Advanced Video Coding))方式に変換し、出力する変換処理を実行する装置である。
図1に示されるように、変換装置100は、変換処理部101とバッファメモリ102を有する。バッファメモリ102は、変換処理部101の各処理部が利用可能な共通のメモリ領域を有する。
変換処理部101は、分割部111、デコーダ112−1乃至デコーダ112−3、エンコーダ113−1乃至エンコーダ113−3を有する。また、変換処理部101は、近傍デコード開始ピクチャ検出部114−1、近傍デコード終了ピクチャ検出部115−1、近傍デコード開始ピクチャ検出部114−2、および近傍デコード終了ピクチャ検出部115−2を有する。
さらに、変換処理部101は、近傍デコーダ116−1、近傍デコーダ116−2、近傍エンコーダ117−1、近傍エンコーダ117−2、および、合成部118を有する。
分割部111は、入力される符号化コードストリーム(矢印131)を、時間方向(ピクチャの並び順)に3つに分割する。つまり、3つに分割された各符号化コードストリームは、元の符号化コードストリームが対応するベースバンドの画像データの、互いに異なる部分(ピクチャ)に対応する。
そして、分割部111は、その3つのうち1番目の符号化コードストリームをデコーダ112−1および近傍デコーダ116−1に供給する(矢印132−1)。
また、分割部111は、3つのうち2番目の符号化コードストリームをデコーダ112−2、近傍デコーダ116−1、および近傍デコーダ116−2に供給する(矢印132−2)。
さらに、分割部111は、3つのうち3番目の符号化コードストリームをデコーダ112−3、および近傍デコーダ116−2に供給する(矢印132−3)。
なお、以下において、矢印132−1乃至矢印132−3を互いに区別して説明する必要が無い場合、単に矢印132と称する。
デコーダ112−1乃至デコーダ112−3は、それぞれ、入力されたJPEG2000方式で符号化された符号化コードストリームを復号する。デコーダ112−1乃至デコーダ112−3は、互いに並行して動作することができる。なお、デコーダ112−1乃至デコーダ112−3を互いに区別して説明する必要が無い場合、単にデコーダ112と称する。
デコーダ112−1は、復元されたベースバンドの画像データをエンコーダ113−1に供給する(矢印133−1)。デコーダ112−2は、復元されたベースバンドの画像データをエンコーダ113−2に供給する(矢印133−2)。デコーダ112−3は、復元されたベースバンドの画像データをエンコーダ113−3に供給する(矢印133−3)。
なお、以下において、矢印133−1乃至矢印133−3を互いに区別して説明する必要が無い場合、単に矢印133と称する。
エンコーダ113−1乃至エンコーダ113−3は、それぞれ、入力されたベースバンドの画像データをMPEG-4(AVC)方式で符号化する。エンコーダ113−1乃至エンコーダ113−3は、互いに並行して動作することができる。なお、エンコーダ113−1乃至エンコーダ113−3を互いに区別して説明する必要が無い場合、単にエンコーダ113と称する。
以上のように、デコーダ112は、JPEG2000方式で符号化された3つの符号化コードストリームを、互いに並行して復号することができる。エンコーダ113は、3つのベースバンドの画像データを、互いに並行して、MPEG-4(AVC)方式で符号化することができる。
つまり、変換処理部101は、3つの符号化コードストリームに対して符号化方式を変換する変換処理を、互いに並行に行うことができる。したがって、変換処理部101は、より高速に符号化コードストリームの符号化方式を他の符号化方式に変換することができる。
分割部111は、このように、より高速に変換処理を行う事ができるように、入力された符号化コードストリームを3つに分割する。なお、この符号化コードストリームの分割位置は任意である。一般的には、分割部111が、入力される符号化コードストリームを、所定のデータ単位(例えば所定のピクチャ数)毎に分割し、3つずつ並列化する。
もちろん、分割部111が、例えば各デコーダ112の処理能力等に応じて、データ単位(例えばピクチャ数)を変えながら分割を行うようにしてもよい。
いずれにしても、分割部111は、分割した符号化コードストリームを3並列化し、互いに異なるデコーダ112に供給する。
[デコーダの構成]
次に、デコーダ112について説明する。図2は、デコーダ112の主な構成例を示すブロック図である。
図2に示されるように、デコーダ112は、EBCOT(Embedded Block Coding with Optimized Truncation)151を有する。また、デコーダ112は、ビットプレーン合成部152、コードブロック合成部153、逆量子化部154、およびウェーブレット逆変換部155を有する。また、EBCOT151は、算術復号部161およびビットモデリング部162を有する。
ここで、JPEG2000方式の符号化について説明する。
JPEG2000方式の符号化においては、まず、画像データは、ウェーブレット変換される。ウェーブレット変換は、画像の垂直方向および水平方向のそれぞれに対して、画像データを低域成分と高域成分に分離する分析フィルタリングを行う処理である。この分析フィルタリングは、例えば5×3ウェーブレット変換フィルタを用いて行われる。なお、このようなフィルタリング処理が、垂直方向および水平方向の両方において低域成分として分離されたサブバンドに対して再帰的に所定回数繰り返される。これは、画像のエネルギーの多くが低域成分に集中しているからである。
図3は、分割レベル数4のウェーブレット変換処理により生成されるサブバンドの構成例を示す図である。
まず、画像全体について分析フィルタリングが行われ、1LL(図示せず)、1HL、1LH、および1HHの各サブバンドが生成される。次に、生成されたサブバンド1LLに対して再度分析フィルタリングが行われ、2LL(図示せず)、2HL、2LH、および2HHの各サブバンドが生成される。
さらに、生成されたサブバンド2LLに対して再度分析フィルタリングが行われ、3LL、3HL、3LH、および3HHの各サブバンドが生成される。さらに、生成されたサブバンド3LLに対して再度分析フィルタリングが行われ、4LL、4HL、4LH、および4HHの各サブバンドが生成される。
このように、分割レベル数4まで分析フィルタリングが行われると、13個のサブバンドが生成される。図3に示されるように、分割レベルが1つ上位に進むごとに、サブバンドのサイズは、縦方向および横方向にそれぞれ2分の1となる。
つまり、例えば横方向に1920画素の画像のベースバンドの画像データが1回分析フィルタリングされると、横方向に960画素のサブバンドが4つ(1LL,1HL,1LH,1HH)生成される。さらに、サブバンド1LLが1回分析フィルタリングされると、横方向に480画素のサブバンドが4つ(2LL,2HL,2LH,2HH)が生成される。さらに、サブバンド2LLが1回分析フィルタリングされると、横方向に240画素のサブバンドが4つ(3LL,3HL,3LH,3HH)が生成される。さらに、サブバンド3LLが1回分析フィルタリングされると、横方向に120画素のサブバンドが4つ(4LL,4HL,4LH,4HH)が生成される。
なお、ウェーブレット変換の分割レベル数は任意である。
以上のように画像データがウェーブレット変換されて得られた係数データ(ウェーブレット係数)は、量子化される。なお、JPEG2000の規格では、可逆圧縮の場合、量子化処理は省略される。
さらに、係数データは、予め定められた所定の大きさの矩形の、エントロピ符号化の処理単位であるコードブロックに分割される。JPEG2000の規格上の定義によって、コードブロックの縦・横サイズはどのサブバンドにおいても一定である。但し画像(サブバンド)の両端や上端・下端などでは、同じサイズのコードブロックが取れないケースも多々ある。
図4は、各サブバンド中のコードブロックの位置関係の例を示したものである。ここでは分割レベル数3の場合について説明する。例えば64×64画素程度のサイズのコードブロックが、分割後のすべてのサブバンド中に生成される。例えば、最も分割レベルが低い1HHのサブバンドの大きさが例えば640×320画素であるとすると、64×64画素のコードブロックは合計50個存在することになる。後段の各処理部は、このコードブロック毎に処理を行う。もちろん、このコードブロックのサイズ(画素数)は任意である。
次に、コードブロック毎の係数データは、ビットの位毎のビットプレーンに展開される。
ビットプレーンは、所定の数のウェーブレット係数よりなる係数群(例えば後述するコードブロック)を、1ビット毎、つまり位毎に分割(スライス)したものである。つまり、ビットプレーンは、それぞれが複数ビットのビット深度を持つ複数のデータの、互いに同一の位のビット(係数ビット)の集合である。したがって、展開されるビットプレーン数は、各係数のビット深度に依存する。
図5にその具体例を示す。図5の左図は縦4個、横4個の計16個の係数を示している。この16個の係数のうち、絶対値が最大のものは13で、2進数で1101と表現される。このような係数群が、絶対値を示す4枚のビットプレーン(絶対値のビットプレーン)と、符号を示す1枚のビットプレーン(符号のビットプレーン)に展開される。つまり、図5中左の係数群は、図5中右に示されるように、4枚の絶対値のビットプレーンと1枚の符号のビットプレーンに展開される。ここで、絶対値のビットプレーンの要素はすべて0か1の値をとる。また、符号を示すビットプレーンの要素は、係数の値が正であることを示す値、係数の値が0であることを示す値、または係数の値がマイナスを示す値のいずれかをとる。
なお、このようにビットプレーンとされる係数群における係数の数は任意である。以下においては、処理単位を統一することで各部における処理を容易にするために、コードブロック毎にビットプレーン展開されるものとして説明する。
このようにビットプレーン展開された係数データは、係数の最上位ビット(MSB:Most Significant Bit)から最下位ビット(LSB:Less Significant Bit)に向かう順に、符号化(EBCOT)される。
このEBCOTにおいては、所定の大きさのブロック毎にそのブロック内の係数の統計量を測定しながら符号化が行われる。この係数データ(量子化係数)は、コードブロック単位に、エントロピ符号化される。各コードブロックは、最上位ビット(MSB)から最下位ビット(LSB)方向にビットプレーン毎に独立して符号化される。コードブロックの縦横のサイズは4から256までの2のべき乗で、通常使用される大きさは、32x32、64x64、または128x32等がある。量子化係数値がnビットの符号付き2進数で表されていて、bit 0からbit n-1がLSBからMSBまでのそれぞれのビットを表すとする。残りの1ビットは符号である。コードブロックの符号化は、MSB側のビットプレーンから順番に、次の3種類の符号化パスによって行われる。
(1)Significant Propagation Pass
(2)Magnitude Refinement Pass
(3)Cleanup Pass
3つの符号化パスの用いられる順序は、図6で示される。最初にBit-plane(n-1)(MSB)がCleanup Passによって符号化される。続いて順次LSB側に向かい、各ビットプレーンの符号化が、3つの符号化パスをSignificant Propagation Pass、Magnitude Refinement Pass、Cleanup Passの順序で用いて行われる。
ただし、実際にはMSB側から何番目のビットプレーンで初めて1が出てくるかをヘッダに書き、MSB側から連続するオール0のビットプレーン(ゼロビットプレーンと呼ぶ)は符号化しない。この順序で3種類の符号化パスを繰返し用いて符号化し、任意のビットプレーンの、任意の符号化パス迄で符号化を打ち切ることにより、符号量と画質のトレードオフを取る(レート制御を行う)。
次に、係数の走査(スキャニング)について図7を用いて説明する。コードブロックは高さ4個の係数毎にストライプ(stripe)に分けられる。ストライプの幅はコードブロックの幅に等しい。スキャン順とは、1個のコードブロック内の、すべての係数をたどる順番で、コードブロック中では上のストライプから下のストライプへの順序、ストライプの中では、左の列から右の列へ向かっての順序、列の中では上から下へという順序である。各符号化パスにおいてコードブロック中のすべての係数が、このスキャン順で処理される。
以下、3つの符号化パスについて述べる。以下はいずれもJPEG-2000規格書(参考文献:ISO/IEC 15444-1, Information technology-JPEG 2000, Part 1:Core coding system)に記述されている内容である。
(1)Significance Propagation Pass(SPパス):
あるビットプレーンを符号化するSignificance Propagation Passでは、8近傍の少なくとも1つの係数が有意(significant)であるようなnon-significant係数のビットプレーンの値を算術符号化する。その符号化したビットプレーンの値が1である場合は、符号が+であるか、−であるかを続けてMQ符号化する。
ここでsignificanceというJPEG2000特有の用語について説明する。significanceとは、各係数に対して符号化器が持つ状態で、significanceの初期値はnon-significantを表す0、その係数で1が符号化されたときにsignificantを表す1に変化し、以降常に1であり続けるものである。従って、significanceとは有効桁の情報を既に符号化したか否かを示すフラグとも言える。あるビットプレーンでsignificantになれば、以降のビットプレーンではsignificantになったままである。
(2)Magnitude Refinement Pass(MRパス):
ビットプレーンを符号化するMagnitude Refinement Passでは、ビットプレーンを符号化する Significance Propagation Passで、且つ符号化していないsignificantな係数のビットプレーンの値をMQ符号化する。
(3)Cleanup Pass(CUパス):
ビットプレーンを符号化するCleanup Passでは、ビットプレーンを符号化するSignificance Passで、且つ符号化していないnon-significantな係数のビットプレーンの値をMQ符号化する。その符号化したビットプレーンの値が1である場合は符号が+であるか−であるか(Sign情報)を続けてMQ符号化する。
尚、以上の3つの符号化パスでのMQ符号化では、ケースに応じて、ZC(Zero Coding)、RLC(Run-Length Coding)、SC(Sign Coding)、およびMR(Magnitude Refinement)が使い分けられる。ここでMQ符号化と呼ばれる算術符号が用いられる。MQ符号化は、JBIG2(参考文献:ISO/IEC FDIS 14492, “Lossy/Lossless Coding of Bi-level Images”, March 2000)で規定された学習型の2値算術符号である。
EBCOTにおいては、ビットモデリングと、算術符号化が行われる。ビットモデリングが行われると、制御情報、シンボル、およびコンテキスト等の情報が生成され、それらのデータ群を用いてMQ符号化が行われる。
図2に戻り、デコーダ112は、このように符号化されて得られた符号化コードストリームをJPEG2000方式で復号し、ベースバンドの画像データを復元する。
算術復号部161およびビットモデリング部162は、EBCOT151として動作し、入力されるコードストリームに対して、JPEG2000規格で定められたEBCOTと呼ばれるエントロピ復号を行う。
算術復号部161は、入力される符号化コードストリームを復号し、コンテキストをビットモデリング部162に供給する(矢印171)。ビットモデリング部162は、ビットプレーンに展開されたウェーブレット係数を生成する。ビットモデリング部162は、生成したビットプレーン毎の係数データを、ビットプレーン合成部152に供給する(矢印172)。
ビットプレーン合成部152は、ビットプレーンに展開されたウェーブレット係数を合成する。ビットプレーン合成部152は、ビットプレーンを合成したウェーブレット係数を、コードブロック合成部153に供給する(矢印173)。
コードブロック合成部153は、供給されたコードブロック単位の係数データを合成し、サブバンド毎の係数データを生成する。コードブロック合成部153は、それを逆量子化部154に供給する(矢印174)。
逆量子化部154は、供給された係数データに対して逆量子化を行う。逆量子化部154は、逆量子化した係数データをウェーブレット逆変換部155に供給する(矢印175)。
ウェーブレット逆変換部155は、供給されたウェーブレット係数をウェーブレット逆変換し、ベースバンドの画像データを生成する。ウェーブレット逆変換部155は、生成したベースバンドの画像データを、エンコーダ113に出力する(矢印133)。
[エンコーダの構成]
次に、エンコーダ113について説明する。図8は、エンコーダ113の主な構成例を示すブロック図である。
図8に示されるエンコーダ113は、例えば、H.264及びMPEG4 Part10(Advanced Video Coding)(以下H.264/AVCと記す)方式で画像を圧縮符号化する。
エンコーダ113は、A/D(Analog / Digital)変換部201、画面並べ替えバッファ202、演算部203、直交変換部204、量子化部205、可逆符号化部206、および蓄積バッファ207を有する。
また、エンコーダ113は、逆量子化部208、逆直交変換部209、演算部210、デブロックフィルタ211、およびフレームメモリ212を有する。さらに、エンコーダ113は、選択部213、イントラ予測部214、動き予測補償部215、および選択部216を有する。さらに、エンコーダ113は、レート制御部217を有する。
A/D変換部201は、入力された画像データをA/D変換し、画面並べ替えバッファ202に出力し、記憶させる。画面並べ替えバッファ202は、記憶した表示の順番のフレームの画像を、GOP(Group of Picture)構造に応じて、符号化のためのフレームの順番に並べ替える。
演算部203は、画面並べ替えバッファ202から読み出された画像から、選択部216により選択された、イントラ予測部214または動き予測補償部215からの予測画像を減算し、その差分情報を直交変換部204に出力する。
直交変換部204は、演算部203からの差分情報に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その変換係数を出力する。量子化部205は、直交変換部204が出力する変換係数を量子化する。
量子化部205の出力となる、量子化された変換係数は、可逆符号化部206に入力される。可逆符号化部206は、その量子化された変換係数に対して、可変長符号化、算術符号化等の可逆符号化を施す。
可逆符号化部206は、イントラ予測を示す情報などをイントラ予測部214から取得し、インター予測モードを示す情報などを動き予測補償部215から取得する。なお、イントラ予測を示す情報は、以下、イントラ予測モード情報とも称する。また、インター予測を示す情報モードを示す情報は、以下、インター予測モード情報とも称する。
可逆符号化部206は、量子化された変換係数を符号化するとともに、イントラ予測を示す情報やインター予測モードを示す情報、および量子化パラメータなどを、符号化データのヘッダ情報の一部とする(多重化する)。可逆符号化部206は、符号化して得られた符号化データを蓄積バッファ207に供給して蓄積させる。
例えば、可逆符号化部206においては、可変長符号化または算術符号化等の可逆符号化処理が行われる。可変長符号化としては、H.264/AVC方式で定められているCAVLC(Context-Adaptive Variable Length Coding)などがあげられる。算術符号化としては、CABAC(Context-Adaptive Binary Arithmetic Coding)などがあげられる。
蓄積バッファ207は、可逆符号化部206から供給された符号化データを、一時的に保持し、所定のタイミングにおいて、H.264/AVC方式で符号化された符号化画像として出力する。
また、量子化部205において量子化された変換係数は、逆量子化部208にも入力される。逆量子化部208は、その量子化された変換係数を、量子化部205による量子化に対応する方法で逆量子化し、得られた変換係数を、逆直交変換部209に供給する。
逆直交変換部209は、供給された変換係数を、直交変換部204による直交変換処理に対応する方法で逆直交変換する。逆直交変換された出力は、演算部210に供給される。演算部210は、逆直交変換部209より供給された逆直交変換結果、すなわち、復元された差分情報に、選択部216から供給される予測画像を加算し、局部的に復号された画像(復号画像)を得る。その加算結果は、デブロックフィルタ211に供給される。
デブロックフィルタ211は、復号画像のブロック歪を除去する。デブロックフィルタ211は、その歪除去結果をフレームメモリ212に供給し、参照画像として蓄積させる。なお、デブロックフィルタ211によるブロック歪の除去は、不要であれば省略される。
フレームメモリ212は、所定のタイミングにおいて、蓄積されている参照画像を、選択部213に供給する。
選択部213は、イントラ予測の場合、フレームメモリ212から供給された参照画像を、イントラ予測部214に供給する。また、選択部213は、インター予測の場合、フレームメモリ212から供給された参照画像を、動き予測補償部215に供給する。
また、このエンコーダ113においては、例えば、画面並べ替えバッファ202からのIピクチャ、Bピクチャ、およびPピクチャが、イントラ予測(イントラ処理とも称する)する画像として、イントラ予測部214に供給される。また、例えば、画面並べ替えバッファ202から読み出されたBピクチャおよびPピクチャが、インター予測(インター処理とも称する)する画像として、動き予測補償部215に供給される。
イントラ予測部214は、画面並べ替えバッファ202から読み出されたイントラ予測する画像とフレームメモリ212から供給された参照画像に基づいて、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。
イントラ予測部214において、当該ブロック/マクロブロックに対して適用されたイントラ予測モードに関する情報は、可逆符号化部206に伝送され、符号化データにおけるヘッダ情報の一部とされる。
H.264画像情報符号化方式において、輝度信号に対しては、イントラ4×4予測モード、イントラ8×8予測モード及びイントラ16×16予測モードが定義されている。また、色差信号に関しては、それぞれのマクロブロックごとに、輝度信号とは独立した予測モードを定義することが可能である。
イントラ4×4予測モードについては、それぞれの4×4輝度ブロックに対して1つのイントラ予測モードが定義されることになる。イントラ8×8予測モードについては、それぞれの8×8輝度ブロックに対して1つのイントラ予測モードが定義されることになる。イントラ16×16予測モード、並びに、色差信号に対しては、1つのマクロブロックに対してそれぞれ1つの予測モードが定義されることになる。
イントラ予測部214は、予測画像を生成したイントラ予測モードに対してコスト関数値を算出し、算出したコスト関数値が最小値を与えるイントラ予測モードを、最適イントラ予測モードとして選択する。イントラ予測部214は、最適イントラ予測モードで生成された予測画像を、選択部216に供給する。
動き予測補償部215は、インター符号化が行われる画像について、画面並べ替えバッファ202から供給される画像情報(入力画像)とフレームメモリ212から供給される参照フレームとなる画像情報(復号画像)とを取得し、動きベクトルを算出する。
動き予測補償部215は、算出した動きベクトル情報に応じて動き補償処理を行い、インター予測画像情報を生成する。動き予測補償部215は、生成した予測画像情報を、選択部216に供給する。
なお、動き予測補償部215は、算出した動きベクトルを示す動きベクトル情報を可逆符号化部206に供給する。この動きベクトル情報は、可逆符号化部206により、符号化データに含められる(多重化される)。
選択部216は、イントラ符号化を行う画像の場合、イントラ予測部214の出力を演算部203および演算部210に供給し、インター符号化を行う画像の場合、動き予測補償部215の出力を演算部203および演算部210に供給する。
レート制御部217は、蓄積バッファ207に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部205の量子化動作のレートを制御する。
[分割位置近傍処理]
図1に戻り、エンコーダ113−1は、生成されたMPEG-4(AVC)方式の符号化コードストリームを合成部118に供給する(矢印134−1)。エンコーダ113−2は、生成されたMPEG-4(AVC)方式の符号化コードストリームを合成部118に供給する(矢印134−2)。エンコーダ113−3は、生成されたMPEG-4(AVC)方式の符号化コードストリームを合成部118に供給する(矢印134−3)。なお、以下において、矢印134−1乃至矢印134−3を互いに区別して説明する必要が無い場合、単に矢印134と称する。
以上のように、分割されて符号化方式が変換された、新たな符号化方式(MPEG-4)の符号化コードストリームは、合成部118に供給されて、互いに合成され、1つの符号化コードストリームに戻される。
ただし、分割部111における符号化コードストリームの分割は、容易に行う事ができるように、例えば単に所定のデータ単位(例えば所定のピクチャ数)毎に行うのみである。つまり、分割部111は、例えば画像の内容を解析し、分割位置が符号化コードストリームにとって適切であるか否かといった高度な判断処理を行うようなことはしない。例えば、分割部111は、負荷を低減させるために、分割位置が、画質劣化が許容されやすいシーンチェンジであるか否かといった判定は行わない。
そのため、分割位置の画像の内容によっては、分割された各符号化コードストリームの両端近傍のフレームにおいて生じた画質劣化が、視覚的により大きく影響を与えてしまう恐れがあった。
また、MPEG系の符号化では、符号化効率を向上させるために、一般にLong GOP構造を持ったエンコードが行われる。そのため、エンコーダとデコーダの間で共通の仮想バッファ残量の制御が行われ、そのバッファ残量がオーバーフローやアンダーフローを起こさないような制御が行われる。そのため、分割位置近傍のフレームの符号化のために、バッファ制御などの画質制御が影響を受けやすく、分割位置によっては画質劣化が不要に増大する恐れもある。
そこで、変換処理部101は、この分割位置近傍のフレームについて、改めて適切に変換処理を行う。つまり、変換処理部101は、変換処理として、分割位置近傍の変換処理の為の復号処理である近傍デコードと、近傍デコードされて得られた画像データを符号化する符号化処理である近傍エンコードとを、改めて適切に行う。そして、変換処理部101は、その変換処理により得られた符号化コードストリームを、合成部118による符号化ストリームの合成の際に、対応する位置に上書きするように合成する。このようにして変換処理部101は、分割された符号化コードストリームの両端近傍のフレームの、変換処理による画質劣化を低減させる。
以上のような変換処理のために、エンコーダ113−1は、バッファメモリ102のバッファ残量を近傍デコード開始ピクチャ検出部114−1に供給する(矢印135−1)。
また、エンコーダ113−2は、バッファメモリ102のバッファ残量を近傍デコード終了ピクチャ検出部115−1および近傍デコード開始ピクチャ検出部114−2に供給する(矢印135−2および矢印135−3)。
さらに、エンコーダ113−3は、バッファメモリ102のバッファ残量を近傍デコード終了ピクチャ検出部115−2に供給する(矢印135−4)。
以下において、矢印135−1乃至矢印135−4を互いに区別して説明する必要が無い場合、単に矢印135と称する。
近傍デコード開始ピクチャ検出部114−1は、エンコーダ113−1から供給されるバッファ残量(矢印135−1)に基づいて、開始ピクチャ点(P1)を検出する。この開始ピクチャ点(P1)は、1番目の符号化コードストリームと2番目の符号化コードストリームとの分割位置近傍の変換処理の為の復号処理である近傍デコードの開始ピクチャ点である。近傍デコード開始ピクチャ検出部114−1は、検出した開始ピクチャ点(P1)を近傍デコーダ116−1に通知する(矢印136−1)。
近傍デコード終了ピクチャ検出部115−1は、エンコーダ113−2から供給されるバッファ残量(矢印135−2)に基づいて、終了ピクチャ点(P2)を検出する。この終了ピクチャ点(P2)は、1番目の符号化コードストリームと2番目の符号化コードストリームとの分割位置近傍の変換処理の為の復号処理である近傍デコードの終了ピクチャ点である。近傍デコード終了ピクチャ検出部115−1は、検出した終了ピクチャ点(P2)を近傍デコーダ116−1に通知する(矢印136−2)。
近傍デコード開始ピクチャ検出部114−2は、エンコーダ113−2から供給されるバッファ残量(矢印135−3)に基づいて、開始ピクチャ点(P3)を検出する。この開始ピクチャ点(P3)は、2番目の符号化コードストリームと3番目の符号化コードストリームとの分割位置近傍の変換処理の為の復号処理である近傍デコードの開始ピクチャ点である。近傍デコード開始ピクチャ検出部114−2は、検出した開始ピクチャ点(P3)を近傍デコーダ116−2に通知する(矢印136−3)。
近傍デコード終了ピクチャ検出部115−2は、エンコーダ113−3から供給されるバッファ残量(矢印135−4)に基づいて、終了ピクチャ点(P4)を検出する。この終了ピクチャ点(P4)は、2番目の符号化コードストリームと3番目の符号化コードストリームとの分割位置近傍の変換処理の為の復号処理である近傍デコードの終了ピクチャ点である。近傍デコード終了ピクチャ検出部115−2は、検出した終了ピクチャ点(P4)を近傍デコーダ116−2に通知する(矢印136−4)。
なお、以下において、近傍デコード開始ピクチャ検出部114−1および近傍デコード開始ピクチャ検出部114−2を互いに区別して説明する必要が無い場合、単に近傍デコード開始ピクチャ検出部114と称する。
また、以下において、近傍デコード終了ピクチャ検出部115−1および近傍デコード終了ピクチャ検出部115−2を互いに区別して説明する必要が無い場合、単に近傍デコード終了ピクチャ検出部115と称する。
さらに、以下において、矢印136−1乃至矢印136−4を互いに区別して説明する必要が無い場合、単に矢印136と称する。
[近傍デコードの開始ピクチャ・終了ピクチャの検出]
次に、以上の近傍デコードの開始ピクチャ点と終了ピクチャ点の決定手段について説明する。図9は、バッファメモリ102のバッファ残量データ(iVbvOccupancy)のエンコードピクチャに伴う推移を示した図である。
図9に示されるグラフ301乃至グラフ303のそれぞれにおいて、横軸がエンコード対象のピクチャ番号(右方向に行くほど時間が後になる)であり、縦軸がバッファ残量の大きさ(バイト数)である。大きい値になるほど仮想バッファに余裕があり、小さい値になるほど余裕がなくなることを示している。オーバーフローはこのバッファ量が基準値を溢れる場合を意味し、逆にアンダーフローはバッファの残りが無くなってしまう場合を意味する。
図9に示されるグラフ301(Encode Log1)は、エンコーダ113−1から供給されるバッファ残量の値の推移を示している。また、グラフ302(Encode Log2)は、エンコーダ113−2から供給されるバッファ残量の値の推移を示している。
近傍デコード開始ピクチャ検出部114−1は、1番目の符号化コードストリームの最終ピクチャから予め定められた所定のピクチャ数(N1)の範囲でiVbvOccupancyの値が最大になるイントラピクチャを検出する。そして、近傍デコード開始ピクチャ検出部114−1は、検出したピクチャを開始ピクチャ点(P1)と定める。
近傍デコード終了ピクチャ検出部115−1は、2番目の符号化コードストリームの先頭ピクチャから予め定められた所定のピクチャ数(N2)の範囲でiVbvOccupancyの値が最小になるイントラピクチャを検出する。そして、近傍デコード終了ピクチャ検出部115−1は、検出したピクチャを終了ピクチャ点(P2)と定める。
以上のように、近傍デコード(すなわち近傍エンコード)の開始ピクチャ点として、iVbvOccupancyの値が最大になるピクチャが設定される。また、終了ピクチャ点として、iVbvOccupancyの値が最小になるピクチャが設定される。この理由は、近傍エンコードに使用可能なバッファ残量の余裕が大きくなるからである。MPEG系のエンコードでは、バッファ残量の余裕が大きいほど、エンコードの途中で符号量の発生が多いピクチャが出現した場合にも、画質を即座に落とす必要がないため、安定した画質制御が実現できる。
したがって、変換処理部101は、以上のように、iVbvOccupancyの差ができるだけ大きくなるピクチャ間で近傍エンコードが行われるように、近傍デコードの開始ピクチャ点と終了ピクチャ点を定める。このようにすることにより、変換処理部101は、画質制御を安定化させ、変換処理による画質劣化を低減させることができる。
また、MPEG系のLong GOP構造を持ったエンコードでは、IBBPBBPBBPBBPBBのようにイントラピクチャ(I)の後に、Bピクチャ、Pピクチャが使われる。上述した構造の場合、1枚のIピクチャ、4枚のPピクチャ、10枚のBピクチャから構成されている。従ってGOP=15となる。従って、1秒間に30ピクチャ表示される動画の場合、その1秒分にGOPが2個存在することになる。
Iピクチャは、他のピクチャを参照することなく、このピクチャだけで完全な1枚の画像として成立する。これに対して、PピクチャとBピクチャは、隣接するピクチャからの参照が必要となる。そのため、ピクチャ単位でのデコードに対応するためには、開始ピクチャ点(P1)と終了ピクチャ点(P2)はIピクチャでなければならない。つまり、開始ピクチャ点(P1)と終了ピクチャ点(P2)は、イントラピクチャに限定される。
近傍デコード開始ピクチャ検出部114−2も、近傍デコード開始ピクチャ検出部114−1と同様に処理を行う。つまり、近傍デコード開始ピクチャ検出部114−2は、2番目の符号化コードストリームの最終ピクチャから予め定められた所定のピクチャ数(N1)の範囲でiVbvOccupancyの値が最大になるイントラピクチャを検出する。そして、近傍デコード開始ピクチャ検出部114−2は、検出したピクチャを開始ピクチャ点(P3)と定める。
図示は省略するが、近傍デコード終了ピクチャ検出部115−2も、近傍デコード終了ピクチャ検出部115−1と同様に処理を行う。つまり、近傍デコード終了ピクチャ検出部115−2は、3番目の符号化コードストリームの先頭ピクチャから予め定められた所定のピクチャ数(N2)の範囲でiVbvOccupancyの値が最小になるイントラピクチャを検出する。そして、近傍デコード終了ピクチャ検出部115−2は、検出したピクチャを終了ピクチャ点(P4)と定める。
つまり、開始ピクチャ点(P3)および終了ピクチャ点(P4)も、開始ピクチャ点(P1)および終了ピクチャ点(P2)と同様に、イントラピクチャに限定される。
[近傍デコード]
図1に戻り、次に、以上のように定義された区間において行われる近傍デコードについて説明する。
近傍デコーダ116−1は、分割部111から供給された(矢印132−1)1番目の符号化コードストリームの開始ピクチャ点(P1)から最終ピクチャまでをJPEG2000方式で復号する。この開始ピクチャ点(P1)は、上述したように、近傍デコード開始ピクチャ検出部114−1により検出されたものである。
また、近傍デコーダ116−1は、分割部111から供給された(矢印132−2)2番目の符号化コードストリームの先頭ピクチャから終了ピクチャ点(P2)までを復号する。この終了ピクチャ点(P2)は、上述したように、近傍デコード終了ピクチャ検出部115−1により検出されたものである。
なお、近傍デコーダ116−1は、JPEG2000方式のデコーダであり、その詳細な構成は、デコーダ112と同様であるので、その説明は省略する。
この1番目の符号化コードストリームや2番目の符号化コードストリームはJPEG2000方式で符号化されているので、完全にピクチャ単位で復号処理を行うことができる。
これに対して、エンコーダ113−1やエンコーダ113−2により符号化された、変換処理後の符号化コードストリームは、Long GOP構造のMPEG系のコードストリームであるので、正確に1ピクチャ単位で独立して復号することができない。つまり、周囲の参照ピクチャが必要になる。
そのため、近傍デコーダ116−1は、より高画質な復号画像を得るために、変換処理後の符号化コードストリームではなく、分割部111から供給されたオリジナルの符号化コードストリームを復号する。
近傍デコーダ116−2も、2番目の符号化コードストリームと3番目の符号化コードストリームとの分割位置近傍について、近傍デコーダ116−1と同様の処理を行う。
近傍デコーダ116−2は、分割部111から供給された(矢印132−2)2番目の符号化コードストリームの開始ピクチャ点(P3)から最終ピクチャまでをJPEG2000方式で復号する。この開始ピクチャ点(P3)は、上述したように、近傍デコード開始ピクチャ検出部114−2により検出されたものである。
また、近傍デコーダ116−2は、分割部111から供給された(矢印132−3)3番目の符号化コードストリームの先頭ピクチャから終了ピクチャ点(P4)までを復号する。この終了ピクチャ点(P4)は、近傍デコード終了ピクチャ検出部115−2により検出されたものである。
なお、近傍デコーダ116−2は、近傍デコーダ116−1と同様に、JPEG2000方式のデコーダであり、その詳細な構成は、デコーダ112と同様であるので、その説明は省略する。
近傍デコーダ116−1の場合と同様の理由から、近傍デコーダ116−2は、より高画質な復号画像を得るために、分割部111から供給されたオリジナルの符号化コードストリームを復号する。
近傍デコーダ116−1は、以上のように復号して得られたベースバンドの画像データを近傍エンコーダ117−1に供給する(矢印137−1)。同様に、近傍デコーダ116−2は、以上のように復号して得られたベースバンドの画像データを近傍エンコーダ117−2に供給する(矢印137−2)。
なお、以下において、近傍デコーダ116−1および近傍デコーダ116−2を互いに区別して説明する必要が無い場合、単に近傍デコーダ116と称する。また、以下において、矢印137−1および矢印137−2を互いに区別して説明する必要が無い場合、単に矢印137と称する。
[近傍エンコード]
次に、近傍デコードされて得られた画像データに対する近傍エンコードについて説明する。
近傍エンコーダ117−1は、近傍デコーダ116−1において復号されて得られたベースバンドの画像データに対して、エンコーダ113と同様に、MPEG系のLong GOP構造を持ったエンコードを行い、符号化コードストリームを生成する。
なお、近傍エンコーダ117−1は、MPEG-4(AVC)方式のエンコーダであり、その詳細な構成は、エンコーダ113と同様であるので、その説明は省略する。
近傍エンコーダ117−1は、生成した符号化コードストリームを合成部118に供給する(矢印138−1)。
近傍エンコーダ117−2は、近傍デコーダ116−2において復号されて得られたベースバンドの画像データに対して、エンコーダ113と同様に、MPEG系のLong GOP構造を持ったエンコードを行い、符号化コードストリームを生成する。
なお、近傍エンコーダ117−2は、近傍エンコーダ117−1の場合と同様に、MPEG-4(AVC)方式のエンコーダであり、その詳細な構成は、エンコーダ113と同様であるので、その説明は省略する。
近傍エンコーダ117−2は、生成した符号化コードストリームを合成部118に供給する(矢印138−2)。
なお、以下において、近傍エンコーダ117−1および近傍エンコーダ117−2を互いに区別して説明する必要が無い場合、単に近傍エンコーダ117と称する。また、以下において、矢印138−1および矢印138−2を互いに区別して説明する必要が無い場合、単に矢印138と称する。
[合成処理]
合成部118は、エンコーダ113から供給される各符号化コードストリームと、近傍エンコーダ117から供給される各符号化コードストリームとを、互いのピクチャを対応させるように並べて合成し、1つの符号化コードストリームを生成する。
図10は、その符号化コードストリームの合成の様子の例を説明する図である。
図10において、符号化コードストリーム311(コードストリーム1)は、エンコーダ113−1により生成される、1番目のオリジナルの符号化コードストリームがトランスコードされた符号化コードストリームである。符号化コードストリーム312(コードストリーム2)は、エンコーダ113−2により生成される、2番目のオリジナルの符号化コードストリームがトランスコードされた符号化コードストリームである。符号化コードストリーム313(コードストリーム3)は、エンコーダ113−3により生成される、3番目のオリジナルの符号化コードストリームがトランスコードされた符号化コードストリームである。
また、画像データ314(D1)は、近傍デコーダ116−1により、1番目のオリジナルの符号化コードストリームが、開始ピクチャ点(P1)から最終ピクチャまでの区間で近傍デコードされて得られたベースバンドの画像データである。画像データ315(D2)は、近傍デコーダ116−1により、2番目のオリジナルの符号化コードストリームが、先頭ピクチャから終了ピクチャ点(P2)までの区間で近傍デコードされて得られたベースバンドの画像データである。
さらに、符号化コードストリーム316(E1)は、近傍エンコーダ117−1により、画像データ314(D1)および画像データ315(D2)が近傍エンコードされて得られた符号化コードストリームである。
また、画像データ317(D3)は、近傍デコーダ116−2により、2番目のオリジナルの符号化コードストリームが、開始ピクチャ点(P3)から最終ピクチャまでの区間で近傍デコードされて得られたベースバンドの画像データである。画像データ318(D4)は、近傍デコーダ116−2により、3番目のオリジナルの符号化コードストリームが、先頭ピクチャから終了ピクチャ点(P4)までの区間で近傍デコードされて得られたベースバンドの画像データである。
さらに、符号化コードストリーム319(E2)は、近傍エンコーダ117−2により、画像データ317(D3)および画像データ318(D4)が近傍エンコードされて得られた符号化コードストリームである。
合成部118は、符号化コードストリーム311乃至符号化コードストリーム313を、そのピクチャ順に連結する(ピクチャ順に並ぶように互いの先頭と終端を繋ぎ合わせる)。この、符号化コードストリーム311乃至符号化コードストリーム313が連結された1つの符号化コードストリームを連結結果と称する。
合成部118は、この連結結果に、符号化コードストリーム316(E1)と符号化コードストリーム319(E2)を、さらに合成する。
このとき、合成部118は、互いが対応するピクチャを揃えるように位置合わせをして合成を行う。
つまり、合成部118は、連結結果に含まれる、符号化コードストリーム316(E1)が対応するピクチャと同一のピクチャに対応する部分を、その符号化コードストリーム316(E1)に置き換える。
同様に、合成部118は、連結結果に含まれる、符号化コードストリーム319(E2)が対応するピクチャと同一のピクチャに対応する部分を、その符号化コードストリーム319(E2)に置き換える。
つまり、連結結果の、開始ピクチャ点(P1)から終了ピクチャ点(P2)に相当する部分が符号化コードストリーム316(E1)に置き換えられる。また、連結結果の、開始ピクチャ点(P3)から終了ピクチャ点(P4)に相当する部分が符号化コードストリーム319(E2)に置き換えられる。
ここで、符号化コードストリーム311の、符号化コードストリーム316に含まれないピクチャの部分を、符号化コードストリーム311’とする。また、符号化コードストリーム312の、符号化コードストリーム316および符号化コードストリーム319に含まれないピクチャの部分を、符号化コードストリーム312’とする。さらに、符号化コードストリーム313の、符号化コードストリーム319に含まれないピクチャの部分を、符号化コードストリーム313’とする。
図10に示されるように、符号化コードストリーム311’の終端と符号化コードストリーム316の先頭が連結される。また、符号化コードストリーム316の終端と符号化コードストリーム312’の先頭が連結される。さらに、符号化コードストリーム312’の終端と符号化コードストリーム319の先頭が連結される。また、符号化コードストリーム319の終端と、符号化コードストリーム313’の先頭が連結される。
このように、最終的な符号化コードストリームは、これらの符号化コードストリームが、そのピクチャ順に連結されたもの(ピクチャ順に並ぶように互いの先頭と終端が繋ぎ合わせられたもの)となる。
合成部118は、このような最終的な符号化コードストリームを生成すると、それを変換装置100の外部に出力する(矢印139)。
なお、この合成処理は、合成部118内において行われるのではなく、合成部118が各符号化コードストリームを、上述した合成結果(図10に示される最終的な符号化コードストリーム)のように出力することにより行われるようにしてもよい。つまり、結果として、合成部118から出力される符号化コードストリームが、上述したように合成された状態となっていればよい。
[処理の流れ]
以上のような変換処理の流れの例を、図11のフローチャートを参照して説明する。
符号化方式を変換する変換処理の対象となる符号化コードストリームが与えられると変換処理が開始される。変換処理が開始されると、分割部111は、ステップS101において、符号化コードストリームの一部または全部を、例えば所定のデータ単位(例えば所定のピクチャ数)毎に分割する。
ステップS102において、デコーダ112は、分割された各符号化コードストリームを、その符号化方式に対応する復号方式で復号する。ステップS103において、エンコーダ113は、得られた各復号画像データを新たな符号化方式により符号化する。
ステップS104において、近傍デコード開始ピクチャ検出部114は、新たな符号化方式による各符号化時のバッファ残量に基づいて、各近傍デコードの開始ピクチャ点を決定する。
ステップS105において、近傍デコード終了ピクチャ検出部115は、新たな符号化方式による各符号化時のバッファ残量に基づいて、各近傍デコードの終了ピクチャ点を決定する。
ステップS106において、近傍デコーダ116は、オリジナルの符号化コードストリームの、開始ピクチャ点と終了ピクチャ点との間をステップS102の場合と同様の復号方式で復号する。
ステップS107において、近傍エンコーダ117は、ステップS106の処理により得られた復号画像データを、ステップS103の場合と同様の符号化方式で符号化する。
ステップS108において、合成部118は、新たな符号化方式の符号化コードストリームを、それぞれのピクチャ同士の関係に従って並べて統合(合成)する。
ステップS109において、変換装置100は、全ての符号化コードストリームを処理したか否かを判定し、未処理の部分が存在すると判定された場合、処理をステップS101に戻し、それ以降の処理を繰り返す。
ステップS109において、全ての符号化コードストリームを処理したと判定された場合、変換処理を終了する。
以上のように、変換装置100は、画質の低減を抑制しながら、より高速に、符号化方式の変換処理(トランスコード)を行うことができる。
例えば、変換装置100は、既にエンコードされた符号化コードストリームを、他のフォーマットの符号化コードストリームにトランスコードすることができる。より具体的には、例えば、変換装置100は、デジタルシネマコンテンツをJPEG2000で圧縮したものを、Blu-Ray Discに記録するためのH.264にトランスコードすることができる。
また、従来は、分散エンコードした後に生成された符号化コードストリームを隣接ピクチャ領域で統合する際に、画質の変化や劣化が問題とされてきた。しかしながら、本発明では隣接ピクチャ領域でのバッファ残量データの最大点と最小点間で近傍エンコードを行うことで、安定した画質を提供することができる。
これは、MPEG系のエンコードでは、バッファ残量の余裕が大きいほど、エンコードの途中で符号量の発生が多いピクチャが出現した場合にも、画質を即座に落とす必要がないため、安定した画質制御が実現できるという利点を巧みに利用したものである。
また近傍エンコードを行う際の入力画像を得る際、近傍デコーダ116が、オリジナルの符号化コードストリームをイントラ符号化(例えばJPEG2000)するので、近傍エンコーダ117は、1ピクチャ単位の精度の画像を得ることができる。また近傍デコーダ116が、オリジナルの符号化コードストリームを直接デコードするので、その間に変換が入らず、オリジナルの符号化コードストリームの画質を維持することができる。
なお、オリジナルの符号化コードストリームの符号化方式、および、変換後の符号化コードストリームの符号化方式は、上述した符号化方式以外であってもよい。
また、以上においては、変換処理の並列数を3としたが、この並列数は任意である。この並列数を増大させるほど、変換処理が速度は向上する。また、例えば、マルチコアを搭載したCPUにより、上述した変換処理を行う場合、各サブコアを用いて、分割された各符号化コードストリームに対する変換処理を並列に実行させるようにしてもよい。
さらに、以上においては、分割された符号化コードストリームの所定の範囲内で、開始ピクチャ点(P1およびP3)および終了ピクチャ点(P2およびP4)が検索されるように説明した。しかしながら、開始ピクチャ点および終了ピクチャ点の設定方法は、これに限らず、他の方法であっても良い。
例えばiVbvOccupancyの値が、予め定められた所定の閾値以上となる、若しくは、閾値より大きくなるピクチャを開始ピクチャ点とし、予め定められた所定の閾値以下となる、若しくは、閾値より小さくなるピクチャを終了ピクチャ点としてもよい。
図12は、バッファメモリ102のバッファ残量データ(iVbvOccupancy)のエンコードピクチャに伴う推移を示した、図9と同様の図である。例えば、図12に示されるグラフ331(Encode Log1)のように、エンコーダ113−1から供給されるバッファ残量の値が推移するとする。また、例えば、図12に示されるグラフ332(Encode Log2)のように、エンコーダ113−2から供給されるバッファ残量の値が推移するとする。
近傍デコード開始ピクチャ検出部114−1は、各ピクチャのiVbvOccupancyの値が、予め定められた所定の閾値Th1以上となる(若しくは、閾値Th1より大きくなる)ピクチャを検出する。
このとき、近傍デコード開始ピクチャ検出部114−1は、図12の矢印341に示されるように、1番目の符号化コードストリームの最終ピクチャから、先頭ピクチャに向かって1ピクチャずつiVbvOccupancyの値を確認する。つまり、近傍デコード開始ピクチャ検出部114−1は、時間方向と逆向きに(ピクチャの並び順を遡る向きに)各ピクチャのiVbvOccupancyの値の確認を進める。
そして、近傍デコード開始ピクチャ検出部114−1は、iVbvOccupancyの値が閾値Th1以上となる(若しくは、閾値Th1より大きくなる)ピクチャを検出すると、その最初に検出されたピクチャを、開始ピクチャ点(P1)と定める。
つまり、iVbvOccupancyの値が閾値Th1以上となる(若しくは、閾値Th1より大きくなる)、最終ピクチャに最も近いピクチャが、開始ピクチャ点(P1)に指定される。
近傍デコード終了ピクチャ検出部115−1は、各ピクチャのiVbvOccupancyの値が、予め定められた所定の閾値Th2以下となる(若しくは、閾値Th2より小さくなる)ピクチャを検出する。
このとき、近傍デコード終了ピクチャ検出部115−1は、図12の矢印342に示されるように、2番目の符号化コードストリームの先頭ピクチャから、最終ピクチャに向かって1ピクチャずつiVbvOccupancyの値を確認する。つまり、近傍デコード終了ピクチャ検出部115−1は、時間方向に(ピクチャの並び順に)各ピクチャのiVbvOccupancyの値の確認を進める。
そして、近傍デコード終了ピクチャ検出部115−1は、iVbvOccupancyの値が閾値Th2以下となる(若しくは、閾値Th2より小さくなる)ピクチャを検出すると、その最初に検出されたピクチャを、終了ピクチャ点(P2)と定める。
つまり、iVbvOccupancyの値が閾値Th2以下となる(若しくは、閾値Th2より小さくなる)、先頭ピクチャに最も近いピクチャが、終了ピクチャ点(P2)に指定される。
近傍デコード開始ピクチャ検出部114−2も、近傍デコード開始ピクチャ検出部114−1の場合と同様に処理を行う。つまり、近傍デコード開始ピクチャ検出部114−2は、各ピクチャのiVbvOccupancyの値が、予め定められた所定の閾値Th3以上となる(若しくは、閾値Th3より大きくなる)ピクチャを検出する。
このとき、近傍デコード開始ピクチャ検出部114−2は、図12の矢印343に示されるように、2番目の符号化コードストリームの最終ピクチャから、先頭ピクチャに向かって1ピクチャずつiVbvOccupancyの値を確認する。つまり、近傍デコード開始ピクチャ検出部114−2は、時間方向と逆向きに(ピクチャの並び順を遡る向きに)各ピクチャのiVbvOccupancyの値の確認を進める。
そして、近傍デコード開始ピクチャ検出部114−2は、iVbvOccupancyの値が閾値Th3以上となる(若しくは、閾値Th3より大きくなる)ピクチャを検出すると、その最初に検出されたピクチャを、開始ピクチャ点(P3)と定める。
つまり、iVbvOccupancyの値が閾値Th3以上となる(若しくは、閾値Th3より大きくなる)、最終ピクチャに最も近いピクチャが、開始ピクチャ点(P3)に指定される。
近傍デコード終了ピクチャ検出部115−2も、近傍デコード終了ピクチャ検出部115−1の場合と同様に処理を行う。つまり、近傍デコード終了ピクチャ検出部115−2は、各ピクチャのiVbvOccupancyの値が、予め定められた所定の閾値Th4以下となる(若しくは、閾値Th4より小さくなる)ピクチャを検出する。
このとき、近傍デコード終了ピクチャ検出部115−2は、2番目の符号化コードストリームの先頭ピクチャから、最終ピクチャに向かって1ピクチャずつiVbvOccupancyの値を確認する。つまり、近傍デコード終了ピクチャ検出部115−2は、時間方向に(ピクチャの並び順に)各ピクチャのiVbvOccupancyの値の確認を進める。
そして、近傍デコード終了ピクチャ検出部115−1は、iVbvOccupancyの値が閾値Th4以下となる(若しくは、閾値Th4より小さくなる)ピクチャを検出すると、その最初に検出されたピクチャを、終了ピクチャ点(P4)と定める。
つまり、iVbvOccupancyの値が閾値Th4以下となる(若しくは、閾値Th4より小さくなる)、先頭ピクチャに最も近いピクチャが、終了ピクチャ点(P4)に指定される。
このように、近傍デコード開始ピクチャ検出部114および近傍デコード終了ピクチャ検出部115は、iVbvOccupancyの差が十分にあれば画質制御は十分に安定化されると考え、その基準を満たすような閾値を予め設ける。このようにすることにより、近傍デコード開始ピクチャ検出部114および近傍デコード終了ピクチャ検出部115は、開始ピクチャ点および終了ピクチャ点をより早期に検出することができる可能性が生じる。
また、このような検出方法において、開始ピクチャ点および終了ピクチャ点がより早期に検出される場合、近傍デコードが行われる区間がより狭くなることになる。つまり、近傍デコードおよび近傍エンコードの処理時間や負荷も軽減される。
つまり、以上のように閾値に基づいて開始ピクチャ点および終了ピクチャ点が決定されることにより、変換装置100、変換処理のさらなる高速化や負荷のさらなる低減を実現することができる可能性がある。
また、閾値に基づいて開始ピクチャ点および終了ピクチャ点を決定するようにすることにより、画質制御の安定化が、閾値に基づく所定の基準で確保されることになる。例えばグラフ333に示されるような、開始ピクチャ点P1と終了ピクチャ点P2との間の近傍エンコードのVbv遷移において、閾値で指定されるiVbvOccupancyの差が必ず生じる。つまり、変換装置100が画質制御のさらなる安定化を実現することができる可能性が向上する。
<2.第2の実施の形態>
[変換装置の他の構成]
第1の実施の形態においては、変換装置100の入力を符号化コードストリームとしたが、これに限らず、ベースバンドの画像データを入力とするようにしてもよい。
図13は、その場合の変換装置の主な構成例を示すブロック図である。
図13に示される変換装置400は、入力されるベースバンドの画像データを、所定の符号化方式で符号化された符号化コードストリームに変換する装置である。つまり、変換装置400は、符号化装置でもある。
変換装置400は、第1の実施の形態において説明した変換装置100と基本的に同様の構成を有するが、変換処理部101の代わりに変換処理部401を有する。
変換処理部401は、基本的に変換処理部101と同様の構成を有するが、入力がベースバンドの画像データであるので、復号処理に関する処理部を有していない。つまり、変換処理部401においては、変換処理部101が有するデコーダ112および近傍デコーダ116が省略される。
この場合、分割部111は、入力された(矢印431)ベースバンドの画像データを所定のデータ単位(例えば所定のピクチャ数)毎に分割する。そして分割部111は、その分割された各画像データを、エンコーダ113と近傍エンコーダ117に供給する(矢印432−1乃至矢印432−3)。
エンコーダ113は、供給された画像データを符号化すると、符号化コードストリームを合成部118に供給する(矢印434−1乃至矢印434−3)。
また、エンコーダ113−1は、バッファメモリ102のバッファ残量を、近傍エンコード開始ピクチャ検出部414−1に供給する(矢印435−1)。エンコーダ113−2は、バッファメモリ102のバッファ残量を、近傍エンコード終了ピクチャ検出部415−1および近傍エンコード開始ピクチャ検出部414−2に供給する(矢印435−2および435−3)。エンコーダ113−3は、バッファメモリ102のバッファ残量を、近傍エンコード終了ピクチャ検出部415−2に供給する(矢印435−4)。
近傍エンコード開始ピクチャ検出部414−1は、図1の近傍デコード開始ピクチャ検出部114−1に対応する。近傍エンコード開始ピクチャ検出部414−2は、図1の近傍デコード開始ピクチャ検出部114−2に対応する。
近傍エンコード終了ピクチャ検出部415−1は、図1の近傍デコード終了ピクチャ検出部115−1に対応する。近傍エンコード終了ピクチャ検出部415−2は、図1の近傍デコード終了ピクチャ検出部115−2に対応する。
上述したように、変換装置400の場合、近傍デコードが行われないので、近傍デコードの開始ピクチャ点や終了ピクチャ点の代わりに、近傍エンコードの開始ピクチャ点や終了ピクチャ点が検出されるが、これらの処理は実質的に等価である。つまり、変換装置400の場合も、開始ピクチャ点と終了ピクチャ点の検出方法は、変換装置100の場合と同様である。
つまり、近傍エンコード開始ピクチャ検出部414−1は、図1の近傍デコード開始ピクチャ検出部114−1と同様の処理を行う。近傍エンコード開始ピクチャ検出部414−2は、図1の近傍デコード開始ピクチャ検出部114−2と同様の処理を行う。
さらに、近傍エンコード終了ピクチャ検出部415−1は、図1の近傍デコード終了ピクチャ検出部115−1と同様の処理を行う。近傍エンコード終了ピクチャ検出部415−2は、図1の近傍デコード終了ピクチャ検出部115−2と同様の処理を行う。
以下において、近傍エンコード開始ピクチャ検出部414−1および近傍エンコード開始ピクチャ検出部414−2を互いに区別して説明する必要が無い場合、単に、近傍エンコード開始ピクチャ検出部414と称する。また、近傍エンコード終了ピクチャ検出部415−1および近傍エンコード終了ピクチャ検出部415−2を互いに区別して説明する必要が無い場合、単に、近傍エンコード終了ピクチャ検出部415と称する。
近傍エンコード開始ピクチャ検出部414および近傍エンコード終了ピクチャ検出部415は、検出した開始ピクチャ点若しくは終了ピクチャ点を示す情報を、近傍エンコーダ117に供給する(矢印436−1乃至矢印436−4)。
近傍エンコーダ117は、分割部111から供給される画像データを、開始ピクチャ点から終了ピクチャ点まで符号化するが、この処理は、図1の場合と実質的に等価である。近傍エンコーダ117は、生成した符号化コードストリームを合成部118に供給する(矢印438−1および矢印438−2)。
合成部118は、図1の場合と同様に、各部から供給される符号化コードストリームを合成し、1つの符号化コードストリームを生成し、出力する(矢印439)。
[合成処理]
この場合の合成処理の様子の例を図14に示す。
図14において、符号化コードストリーム461(コードストリーム1)は、エンコーダ113−1により生成される、1番目の画像データが符号化された符号化コードストリームである。符号化コードストリーム462(コードストリーム2)は、エンコーダ113−2により生成される、2番目の画像データが符号化された符号化コードストリームである。符号化コードストリーム463(コードストリーム3)は、エンコーダ113−3により生成される、3番目の画像データが符号化された符号化コードストリームである。
また、符号化コードストリーム464(E1)は、近傍エンコーダ117−1により、画像データが近傍エンコードされて得られた符号化コードストリームである。
さらに、符号化コードストリーム465(E2)は、近傍エンコーダ117−2により、画像データが近傍エンコードされて得られた符号化コードストリームである。
合成部118は、符号化コードストリーム461乃至符号化コードストリーム463を、そのピクチャ順に連結する(ピクチャ順に並ぶように互いの先頭と終端を繋ぎ合わせる)。この、符号化コードストリーム461乃至符号化コードストリーム463が連結された1つの符号化コードストリームを連結結果と称する。
合成部118は、この連結結果に、符号化コードストリーム466(E1)と符号化コードストリーム469(E2)を、さらに合成する。
このとき、合成部118は、互いが対応するピクチャを揃えるように位置合わせをして合成を行う。
つまり、合成部118は、連結結果に含まれる、符号化コードストリーム466(E1)が対応するピクチャと同一のピクチャに対応する部分を、その符号化コードストリーム466(E1)に置き換える。
同様に、合成部118は、連結結果に含まれる、符号化コードストリーム469(E2)が対応するピクチャと同一のピクチャに対応する部分を、その符号化コードストリーム469(E2)に置き換える。
つまり、連結結果の、開始ピクチャ点(P1)から終了ピクチャ点(P2)に相当する部分が符号化コードストリーム466(E1)に置き換えられる。また、連結結果の、開始ピクチャ点(P3)から終了ピクチャ点(P4)に相当する部分が符号化コードストリーム469(E2)に置き換えられる。
ここで、符号化コードストリーム461の、符号化コードストリーム466に含まれないピクチャの部分を、符号化コードストリーム461'とする。また、符号化コードストリーム462の、符号化コードストリーム466および符号化コードストリーム469に含まれないピクチャの部分を、符号化コードストリーム462'とする。さらに、符号化コードストリーム463の、符号化コードストリーム469に含まれないピクチャの部分を、符号化コードストリーム463'とする。
図14に示されるように、符号化コードストリーム461'の終端と符号化コードストリーム466の先頭が連結される。また、符号化コードストリーム466の終端と符号化コードストリーム462'の先頭が連結される。さらに、符号化コードストリーム462'の終端と符号化コードストリーム469の先頭が連結される。また、符号化コードストリーム469の終端と、符号化コードストリーム463'の先頭が連結される。
このように、最終的な符号化コードストリームは、これらの符号化コードストリームが、そのピクチャ順に連結されたもの(ピクチャ順に並ぶように互いの先頭と終端が繋ぎ合わせられたもの)となる。
つまり、合成部118は、基本的に図1の場合と同様に符号化ストリームを合成する。
図13に戻り、合成部118は、このような最終的な符号化コードストリームを生成すると、それを変換装置400の外部に出力する(矢印439)。
なお、この場合も、合成処理は、合成部118内において行われるのではなく、合成部118が各符号化コードストリームを、上述した合成結果(図14に示される最終的な符号化コードストリーム)のように出力することにより行われるようにしてもよい。つまり、結果として、合成部118から出力される符号化コードストリームが、上述したように合成された状態となっていればよい。
[処理の流れ]
以上のような変換処理の流れの例を、図15のフローチャートを参照して説明する。この場合も、各処理は、基本的に図11のフローチャートを参照して説明した場合と同様に実行される。ただし、復号に関する処理は省略される。
すなわち、画像データが与えられ、変換処理が開始されると、分割部111は、ステップS401において、画像データの一部または全部を、例えば所定のデータ単位(例えば所定のピクチャ数)毎に分割する。
ステップS402において、エンコーダ113は、分割された各画像データを符号化する。
ステップS403において、近傍エンコード開始ピクチャ検出部414は、各符号化時のバッファ残量に基づいて、各近傍エンコードの開始ピクチャ点を決定する。
ステップS404において、近傍エンコード終了ピクチャ検出部415は、各符号化時のバッファ残量に基づいて、各近傍エンコードの終了ピクチャ点を決定する。
ステップS405において、近傍エンコーダ117は、画像データの開始ピクチャ点から終了ピクチャ点までのピクチャを、ステップS402の場合と同様の符号化方式で符号化する。
ステップS406において、合成部118は、符号化処理により得られた符号化コードストリームを、それぞれのピクチャ同士の関係に従って並べて統合(合成)する。
ステップS407において、変換装置400は、全ての画像データを処理したか否かを判定し、未処理の部分が存在すると判定された場合、処理をステップS401に戻し、それ以降の処理を繰り返す。
ステップS407において、全ての符号化コードストリームを処理したと判定された場合、変換処理を終了する。
以上のように、変換装置400は、変換装置100の場合と同様に、画質の低減を抑制しながら、より高速に、変換処理(トランスコード)を行うことができる。
なお、変換後の符号化コードストリームの符号化方式は、上述した符号化方式以外であってもよい。また、この場合も、変換処理の並列数は任意である。
さらに、この場合も、第1の実施の形態の場合と同様に、閾値を用いて開始ピクチャ点と終了ピクチャ点の設定が行われるようにしてもよい。つまり、iVbvOccupancyの値が、予め定められた所定の閾値以上となる、若しくは、閾値より大きくなるピクチャが開始ピクチャ点とされるようにしてもよい。同様に、iVbvOccupancyの値が、予め定められた所定の閾値以下となる、若しくは、閾値より小さくなるピクチャが終了ピクチャ点とされるようにしてもよい。
この場合、近傍エンコード開始ピクチャ検出部414−1は、1番目の符号化コードストリームの最終ピクチャから先頭ピクチャに向かって、各ピクチャのiVbvOccupancyの値を確認する。そして、そのiVbvOccupancyの値が予め定められた所定の閾値Th1以上となる(若しくは、閾値Th1より大きくなる)ピクチャが検出された場合、近傍エンコード開始ピクチャ検出部414−1は、その最初に検出されたピクチャを、開始ピクチャ点(P1)と定める。
同様に、近傍エンコード終了ピクチャ検出部415−1は、2番目の符号化コードストリームの先頭ピクチャから終了ピクチャに向かって、各ピクチャのiVbvOccupancyの値を確認する。そして、そのiVbvOccupancyの値が予め定められた所定の閾値Th2以下となる(若しくは、閾値Th2より小さくなる)ピクチャが検出された場合、近傍エンコード終了ピクチャ検出部415−1は、その最初に検出されたピクチャを、終了ピクチャ点(P2)と定める。
同様に、近傍エンコード開始ピクチャ検出部414−2は、2番目の符号化コードストリームの最終ピクチャから先頭ピクチャに向かって、各ピクチャのiVbvOccupancyの値を確認する。そして、そのiVbvOccupancyの値が予め定められた所定の閾値Th3以上となる(若しくは、閾値Th3より大きくなる)ピクチャが検出された場合、近傍エンコード開始ピクチャ検出部414−2は、その最初に検出されたピクチャを、開始ピクチャ点(P3)と定める。
同様に、近傍エンコード終了ピクチャ検出部415−2は、3番目の符号化コードストリームの先頭ピクチャから終了ピクチャに向かって、各ピクチャのiVbvOccupancyの値を確認する。そして、そのiVbvOccupancyの値が予め定められた所定の閾値Th4以下となる(若しくは、閾値Th4より小さくなる)ピクチャが検出された場合、近傍エンコード終了ピクチャ検出部415−2は、その最初に検出されたピクチャを、終了ピクチャ点(P4)と定める。
このようにすることにより、変換装置400が画質制御のさらなる安定化を実現することができる可能性が向上する。
<3.第3の実施の形態>
[変換装置の他の構成]
以上の実施の形態においては、開始ピクチャ点と終了ピクチャ点を検出する範囲を、予め定められた範囲(N1またはN2)としたが、これに限らず、変換装置がこの範囲を設定するようにしてもよい。
図16は、その場合の変換装置の構成例を示すブロック図である。
図16に示される変換装置500は、図1の変換装置100と基本的に同様の構成を有し、同様の処理を行う。
ただし、変換装置500の、変換処理部101に対応する変換処理部501は、変換処理部101の構成に加え、範囲設定部511を有する。
範囲設定部511は、分割部111からオリジナルの符号化コードストリーム(分割されたものであっても分割される前のものであってもよい)を取得する(矢印541)。範囲設定部511は、取得したその符号化コードストリームに関するパラメータ(例えば、ピクチャ数)に基づいて、開始ピクチャ点や終了ピクチャ点を検出する範囲の長さ(例えばピクチャ数)をそれぞれ設定する。
例えば、範囲設定部511は、オリジナルの符号化コードストリームのピクチャ数の1割を開始ピクチャ点や終了ピクチャ点を検出する範囲とすることができる。
近傍デコードや近傍エンコードは、基本的に、冗長処理となる。したがって、その区間は、画質に影響を与えない範囲で、できるだけ短いほど望ましい。
例えば、開始ピクチャ点や終了ピクチャ点の検出範囲を不要に長くし、符号化コードストリームの大部分が近傍デコードや近傍エンコードされるようにすると、変換処理効率が不要に低減してしまう恐れがある。
逆に、開始ピクチャ点や終了ピクチャ点の検出範囲が短すぎると、iVbvOccupancyの値が十分に大きなピクチャや、十分に小さいピクチャを検出することができなくなる恐れがある。その場合、バッファ残量の差が十分に大きくない範囲で近傍デコード(近傍エンコード)を行わなければならなくなり、不要な画質劣化を招く恐れがある。
つまり、この開始ピクチャ点や終了ピクチャ点の検出範囲の長さは、基本的に任意ではあるが、長すぎても短すぎても望ましくない。そこで、範囲設定部511が、例えば符号化コードストリームの長さ(ピクチャ数)を基準として、この開始ピクチャ点や終了ピクチャ点の検出範囲の長さを決定するようにする。このようにすることにより、開始ピクチャ点や終了ピクチャ点の検出範囲の長さが、符号化コードストリームの長さに対して不自然な割合となることを抑制することができる。
もちろん、範囲設定部511が、これ以外の任意の方法で開始ピクチャ点や終了ピクチャ点の検出範囲の長さを決定するようにしてもよい。
範囲設定部511は、各開始ピクチャ点を検出する範囲と各終了ピクチャ点を検出する範囲を、それぞれ、独立に設定することができる。つまり、開始ピクチャ点を検出する範囲と終了ピクチャ点を検出する範囲は、互いに同じ長さ(ピクチャ数)であってもよいし、互いに異なる長さであってもよい。また、各開始ピクチャ点(各終了ピクチャ点)を検出する範囲の長さが互いに異なるようにすることもできる。
範囲設定部511は、設定した範囲の長さを、近傍デコード開始ピクチャ検出部114および近傍デコード終了ピクチャ検出部115に供給する(矢印542)。近傍デコード開始ピクチャ検出部114および近傍デコード終了ピクチャ検出部115は、それぞれ、設定された範囲内で、開始ピクチャ点若しくは終了ピクチャ点を検出する。
[処理の流れ]
この場合の変換処理の流れの例を、図17のフローチャートを参照して説明する。
この場合も、変換処理は、基本的に図11のフローチャートを参照して説明した場合と同様に実行される。
ステップS501において、分割部111は、図11のステップS101の場合と同様に、符号化コードストリームを分割する。
ステップS502において、範囲設定部511は、開始ピクチャ点と終了ピクチャ点の検索範囲を設定する。
ステップS503乃至ステップS510の各処理は、図11のステップS102乃至ステップS109の各処理と同様に実行される。
以上のように、変換装置500は、画質の低減を抑制しながら、より高速に、符号化方式の変換処理(トランスコード)を行うことができる。
なお、このような範囲設定部511は、図13に示される変換装置400にも、上述した場合と同様の方法で適用することができる。
<4.第4の実施の形態>
[変換装置の他の構成]
以上においては、バッファ残量が最大または最小になるイントラピクチャを開始ピクチャ点または終了ピクチャ点とするように説明した。しかしながら、開始ピクチャ点および終了ピクチャ点は、シーンチェンジが発生するピクチャに設定されるようにしてもよい。
図18は、その場合の変換装置の構成例を示すブロック図である。
図18に示される変換装置600は、図1の変換装置100と基本的に同様の構成を有し、同様の処理を行う。
ただし、変換装置600の、変換処理部101に対応する変換処理部601は、変換処理部101の構成に加え、シーンチェンジ検出部611を有する。
シーンチェンジ検出部611は、分割部111からオリジナルの符号化コードストリーム(分割されたものであっても分割される前のものであってもよい)を取得する(矢印641)。そして、シーンチェンジ検出部611は、取得したそのオリジナルの符号化コードストリームに含まれるシーンチェンジが発生するピクチャを特定する。さらに、シーンチェンジ検出部611は、特定したそのピクチャの位置を、近傍デコード開始ピクチャ検出部114および近傍デコード終了ピクチャ検出部115に供給する(矢印642)。
近傍デコード開始ピクチャ検出部114は、シーンチェンジ検出部611から供給されたその情報に基づいて、シーンチェンジが発生した、符号化コードストリームの最終ピクチャに最も近いピクチャを、開始ピクチャ点に設定する。
同様に、近傍デコード終了ピクチャ検出部115は、シーンチェンジ検出部611から供給されたその情報に基づいて、シーンチェンジが発生した、符号化コードストリームの先頭ピクチャに最も近いピクチャを、終了ピクチャ点に設定する。
図19おいて、符号化コードストリーム661(コードストリーム1)は、図10の符号化コードストリーム311(コードストリーム1)に対応する。符号化コードストリーム662(コードストリーム1)は、図10の符号化コードストリーム312(コードストリーム1)に対応する。符号化コードストリーム663(コードストリーム1)は、図10の符号化コードストリーム313(コードストリーム1)に対応する。
これらの符号化コードストリームにおいて、シーンチェンジ検出部611が、シーンチェンジ発生ピクチャ(SC1乃至SC8)を検出するとする。
近傍デコード開始ピクチャ検出部114−1は、符号化コードストリーム661(コードストリーム1)の、最終ピクチャに最も近いシーンチェンジ発生ピクチャSC3を開始ピクチャ点(P1)に設定する。
近傍デコード終了ピクチャ検出部115−1は、符号化コードストリーム662(コードストリーム2)の、先頭ピクチャに最も近いシーンチェンジ発生ピクチャSC4を終了ピクチャ点(P2)に設定する。
近傍デコード開始ピクチャ検出部114−2は、符号化コードストリーム662(コードストリーム2)の、最終ピクチャに最も近いシーンチェンジ発生ピクチャSC6を開始ピクチャ点(P3)に設定する。
近傍デコード終了ピクチャ検出部115−2は、符号化コードストリーム663(コードストリーム3)の、先頭ピクチャに最も近いシーンチェンジ発生ピクチャSC7を終了ピクチャ点(P4)に設定する。
近傍デコーダ116−1は、1番目のオリジナルの符号化コードストリーム661の開始ピクチャ点(P1)から最終ピクチャまでを復号し、ベースバンドの画像データ664を生成する。
また、近傍デコーダ116−1は、2番目のオリジナルの符号化コードストリーム662の先頭ピクチャから終了ピクチャ点(P2)までを復号し、ベースバンドの画像データ665を生成する。
近傍エンコーダ117−1は、画像データ664および画像データ665を符号化し、符号化コードストリーム666(E1)を生成する。
同様に、近傍デコーダ116−2は、2番目のオリジナルの符号化コードストリーム662の開始ピクチャ点(P3)から最終ピクチャまでを復号し、ベースバンドの画像データ667を生成する。
また、近傍デコーダ116−2は、3番目のオリジナルの符号化コードストリーム663の先頭ピクチャから終了ピクチャ点(P4)までを復号し、ベースバンドの画像データ668を生成する。
近傍エンコーダ117−2は、画像データ667および画像データ668を符号化し、符号化コードストリーム669(E2)を生成する。
合成部118は、図10の場合と同様に、これらの符号化データを合成し、最終的な符号化コードストリームを生成する。
図19に示されるように、符号化コードストリーム661'の終端と符号化コードストリーム666の先頭が連結される。また、符号化コードストリーム666の終端と符号化コードストリーム662'の先頭が連結される。さらに、符号化コードストリーム662'の終端と符号化コードストリーム669の先頭が連結される。また、符号化コードストリーム669の終端と、符号化コードストリーム663'の先頭が連結される。
なお、図10の場合と同様に、符号化コードストリーム661'は、符号化コードストリーム661の、符号化コードストリーム666に含まれないピクチャの部分を示す。また、符号化コードストリーム662'は、符号化コードストリーム662の、符号化コードストリーム666および符号化コードストリーム669に含まれないピクチャの部分を示す。さらに、符号化コードストリーム663'は、符号化コードストリーム663の、符号化コードストリーム669に含まれないピクチャの部分を示す。
このように、最終的な符号化コードストリームは、これらの符号化コードストリームが、そのピクチャ順に連結されたもの(ピクチャ順に並ぶように互いの先頭と終端が繋ぎ合わせられたもの)となる。
合成部118は、このような最終的な符号化コードストリームを生成すると、それを変換装置100の外部に出力する(矢印639)。
なお、この場合も、合成処理は、合成部118内において行われるのではなく、合成部118が各符号化コードストリームを、上述した合成結果(図19に示される最終的な符号化コードストリーム)のように出力することにより行われるようにしてもよい。
シーンチェンジが発生するピクチャでは、そのシーンチェンジによって画像の内容の不連続が発生している。したがって、近傍エンコードされた符号化コードストリームの両端を、このようなピクチャとすることにより、符号化コードストリームの合成による、その継ぎ目における視覚的な違和感を低減させることができる。
[処理の流れ]
この場合の変換処理の流れの例を、図20のフローチャートを参照して説明する。
この場合も、変換処理は、基本的に図11のフローチャートを参照して説明した場合と同様に実行される。
ステップS601において、分割部111は、図11のステップS101の場合と同様に、符号化コードストリームを分割する。
ステップS602において、シーンチェンジ検出部611は、シーンチェンジが発生するピクチャを検出する。
ステップS603において、デコーダ112は、分割された各符号化コードストリームを、その符号化方式に対応する復号方式で復号する。ステップS604において、エンコーダ113は、得られた各復号画像データを新たな符号化方式により符号化する。
ステップS605において、近傍デコード開始ピクチャ検出部114は、各符号化コードストリームの、最終ピクチャに最も近いシーンチェンジ発生ピクチャを近傍デコードの開始ピクチャ点に決定する。
また、ステップS606において、近傍デコード終了ピクチャ検出部115は、各符号化コードストリームの、先頭ピクチャに最も近いシーンチェンジ発生ピクチャを近傍デコードの終了ピクチャ点に決定する。
ステップS608において、近傍デコーダ116は、オリジナルの符号化コードストリームの、開始ピクチャ点と終了ピクチャ点との間をステップS603の場合と同様の復号方式で復号する。
ステップS608において、近傍エンコーダ117は、ステップS607の処理により得られた復号画像データを、ステップS103の場合と同様の符号化方式で符号化する。
ステップS609において、合成部118は、新たな符号化方式の符号化コードストリームを、それぞれのピクチャ同士の関係に従って並べて統合(合成)する。
ステップS610において、変換装置600は、全ての符号化コードストリームを処理したか否かを判定し、未処理の部分が存在すると判定された場合、処理をステップS601に戻し、それ以降の処理を繰り返す。
ステップS610において、全ての符号化コードストリームを処理したと判定された場合、変換処理を終了する。
以上のように、変換装置600は、画質の低減を抑制しながら、より高速に、符号化方式の変換処理(トランスコード)を行うことができる。
なお、オリジナルの符号化コードストリームの符号化方式、および、変換後の符号化コードストリームの符号化方式が上述した符号化方式以外であってもよいことや、並列数が任意であることは、第1の実施の形態の場合と同様である。また、第2の実施の形態のように、入力を画像データとしてもよい。
さらに、各近傍デコード開始ピクチャ検出部114が、シーンチェンジが発生するピクチャと、バッファ残量が最大になるイントラピクチャとのいずれか一方を、開始ピクチャ点として選択することができるようにしてもよい。
同様に、各近傍デコード終了ピクチャ検出部115が、それぞれ、シーンチェンジが発生するピクチャと、バッファ残量が最小になるイントラピクチャとのいずれか一方を、終了ピクチャ点として選択することができるようにしてもよい。
さらに、シーンチェンジが発生するピクチャである開始ピクチャ点若しくは終了ピクチャ点と、バッファ残量が最大または最小になるイントラピクチャである開始ピクチャ点若しくは終了ピクチャ点とが混在することができるようにしてもよい。
以上においては、先頭ピクチャ若しくは最終ピクチャに最も近いシーンチェンジ発生ピクチャが、開始ピクチャ点若しくは終了ピクチャ点に設定されるように説明した。しかしながら、その他のシーンチェンジ発生ピクチャが、開始ピクチャ点若しくは終了ピクチャ点に設定されるようにしてもよい。
<5.第5の実施の形態>
[パーソナルコンピュータ]
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。この場合、例えば、図21に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。
図21において、パーソナルコンピュータ700のCPU(Central Processing Unit)701は、ROM(Read Only Memory)702に記憶されているプログラムに従って各種の処理を実行する。また、CPU701は、記憶部713からRAM(Random Access Memory)703にロードされたプログラムに従って各種の処理を実行する。RAM703にはまた、CPU701が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU701、ROM702、およびRAM703は、バス704を介して相互に接続されている。このバス704にはまた、入出力インタフェース710も接続されている。
入出力インタフェース710には、キーボード、マウスなどよりなる入力部711が接続されている。また、入出力インタフェース710には、CRT(Cathode Ray Tube)ディスプレイやLCD(Liquid Crystal Display)等のディスプレイ、並びにスピーカなどよりなる出力部712が接続されている。さらに、入出力インタフェース710には、フラッシュメモリ等SSD(Solid State Drive)やハードディスクなどよりなる記憶部713が接続されている。
また、入出力インタフェース710には、有線LAN(Local Area Network)や無線LANのインタフェースやモデムなどよりなる通信部714が接続されている。通信部714は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース710にはまた、必要に応じてドライブ715が接続される。ドライブ715には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア721が適宜装着される。ドライブ715に装着されたそれらのリムーバブルメディア721から読み出されたコンピュータプログラムは、必要に応じて記憶部713にインストールされる。
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
この記録媒体は、例えば、図21に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、リムーバブルメディア721により構成される。
このリムーバブルメディア721には、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)が含まれる。また、このリムーバブルメディア721には、光ディスク(CD-ROM(Compact Disc - Read Only Memory),DVD(Digital Versatile Disc)を含む)も含まれる。さらに、このリムーバブルメディア721には、光磁気ディスク(MD(Mini Disc)を含む)や半導体メモリも含まれる。
さらに、この記録媒体は、例えば、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM702や、記憶部713に含まれるハードディスクなどにより構成される。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数のデバイス(装置)により構成される装置全体を表すものである。
また、以上において、1つの装置(または処理部)として説明した構成が、複数の装置(または処理部)として構成されるようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成が、まとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成が付加されるようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部が他の装置(または他の処理部)の構成に含まれるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明は、例えば、アーカイブシステム、放送局の画像圧縮装置、画像データベース、画像のトランスコード装置、医用画像の記録システム、ネットワークサーバ、ノンリニア編集装置、ゲーム機、およびテレビ受像機システムに適用することができる。また、本発明は、HDDレコーダや、PC上のオーサリング・ツールまたはそのソフトウェア・モジュール等にも適用することができる。
100 変換装置, 101 変換処理部, 111 分割部, 112 デコーダ, 113 エンコーダ, 114 近傍デコード開始ピクチャ検出部, 115 近傍デコード終了ピクチャ検出部, 116 近傍デコーダ, 117 近傍エンコーダ, 118 合成部, 400 変換装置, 414 近傍エンコード開始ピクチャ検出部, 415 近傍エンコード終了ピクチャ検出部, 500 変換装置, 511 範囲設定部, 600 変換装置, 611 シーンチェンジ検出部

Claims (16)

  1. 画像データが所定の符号化方式により符号化された符号化コードストリームを複数に分割する分割手段と、
    前記分割手段により分割された各符号化コードストリームを復号する復号手段と、
    前記復号手段により復号されて得られた復号画像データを、前記符号化方式と異なる他の符号化方式により符号化する符号化手段と、
    前記符号化手段による符号化の際のバッファ残量に基づいて、前記分割手段が前記符号化コードストリームを分割した分割位置近傍の復号対象範囲を決定する決定手段と、
    前記分割手段により分割された各符号化コードストリームの、前記決定手段により決定された前記復号対象範囲を復号する近傍復号手段と、
    前記近傍復号手段により復号されて得られた復号画像データを、前記他の符号化方式により符号化する近傍符号化手段と
    を備える画像処理装置。
  2. 前記決定手段は、前記復号対象範囲の開始ピクチャと終了ピクチャとを決定し、
    前記近傍復号手段は、前記分割手段により分割された各符号化コードストリームの、前記決定手段により決定された前記開始ピクチャから最終ピクチャまでと、先頭ピクチャから前記決定手段により決定された前記終了ピクチャまでを、それぞれ復号する
    請求項1に記載の画像処理装置。
  3. 前記決定手段は、前記最終ピクチャの前の所定の範囲において、前記バッファ残量が最大となるイントラピクチャを前記開始ピクチャに決定する
    請求項2に記載の画像処理装置。
  4. 前記決定手段は、前記先頭ピクチャの後の所定の範囲において、前記バッファ残量が最小となるイントラピクチャを前記終了ピクチャに決定する
    請求項2に記載の画像処理装置。
  5. 前記決定手段は、前記最終ピクチャの前の所定の範囲において、シーンチェンジが発生するピクチャを前記開始ピクチャに決定する
    請求項2に記載の画像処理装置。
  6. 前記決定手段は、前記先頭ピクチャの後の所定の範囲において、シーンチェンジが発生するピクチャを前記終了ピクチャに決定する
    請求項2に記載の画像処理装置。
  7. 前記符号化手段により符号化されて得られた各符号化コードストリーム、並びに、前記近傍符号化手段により符号化されて得られた各符号化コードストリームを、互いのピクチャを揃えて合成する合成手段をさらに備える
    請求項1に記載の画像処理装置。
  8. 画像処理装置の画像処理方法であって、
    前記画像処理装置の分割手段が、画像データが所定の符号化方式により符号化された符号化コードストリームを複数に分割し、
    前記画像処理装置の復号手段が、分割された各符号化コードストリームを復号し、
    前記画像処理装置の符号化手段が、復号されて得られた復号画像データを、前記符号化方式と異なる他の符号化方式により符号化し、
    前記画像処理装置の決定手段が、符号化の際のバッファ残量に基づいて、前記符号化コードストリームが分割された分割位置近傍の復号対象範囲を決定し、
    前記画像処理装置の近傍復号手段が、分割された各符号化コードストリームの、決定された前記復号対象範囲を復号し、
    前記画像処理装置の近傍符号化手段が、復号されて得られた復号画像データを、前記他の符号化方式により符号化する
    画像処理方法。
  9. 画像データを複数に分割する分割手段と、
    前記分割手段により分割された各画像データを符号化する符号化手段と、
    前記符号化手段による符号化の際のバッファ残量に基づいて、前記分割手段が前記画像データを分割した分割位置近傍の符号化対象範囲を決定する決定手段と、
    前記分割手段により分割された各画像データの、前記決定手段により決定された前記符号化対象範囲を符号化する近傍符号化手段と
    を備える画像処理装置。
  10. 前記決定手段は、前記符号化対象範囲の開始ピクチャと終了ピクチャとを決定し、
    前記近傍符号化手段は、前記分割手段により分割された各画像データの、前記決定手段により決定された前記開始ピクチャから最終ピクチャまでと、先頭ピクチャから前記決定手段により決定された前記終了ピクチャまでを、それぞれ符号化する
    請求項9に記載の画像処理装置。
  11. 前記決定手段は、前記最終ピクチャの前の所定の範囲において、前記バッファ残量が最大となるイントラピクチャを前記開始ピクチャに決定する
    請求項10に記載の画像処理装置。
  12. 前記決定手段は、前記先頭ピクチャの後の所定の範囲において、前記バッファ残量が最小となるイントラピクチャを前記終了ピクチャに決定する
    請求項10に記載の画像処理装置。
  13. 前記決定手段は、前記最終ピクチャの前の所定の範囲において、シーンチェンジが発生するピクチャを前記開始ピクチャに決定する
    請求項10に記載の画像処理装置。
  14. 前記決定手段は、前記先頭ピクチャの後の所定の範囲において、シーンチェンジが発生するピクチャを前記終了ピクチャに決定する
    請求項10に記載の画像処理装置。
  15. 前記符号化手段により符号化されて得られた各符号化コードストリーム、並びに、前記近傍符号化手段により符号化されて得られた各符号化コードストリームを、互いのピクチャを揃えて合成する合成手段をさらに備える
    請求項9に記載の画像処理装置。
  16. 画像処理装置の画像処理方法であって、
    前記画像処理装置の分割手段が、画像データを複数に分割し、
    前記画像処理装置の符号化手段が、分割された各画像データを符号化し、
    前記画像処理装置の決定手段が、符号化の際のバッファ残量に基づいて、前記画像データが分割された分割位置近傍の符号化対象範囲を決定し、
    前記画像処理装置の近傍符号化手段が、分割された各画像データの、決定された前記符号化対象範囲を符号化する
    画像処理方法。
JP2010009739A 2010-01-20 2010-01-20 画像処理装置および方法 Withdrawn JP2011151524A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010009739A JP2011151524A (ja) 2010-01-20 2010-01-20 画像処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010009739A JP2011151524A (ja) 2010-01-20 2010-01-20 画像処理装置および方法

Publications (1)

Publication Number Publication Date
JP2011151524A true JP2011151524A (ja) 2011-08-04

Family

ID=44538137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010009739A Withdrawn JP2011151524A (ja) 2010-01-20 2010-01-20 画像処理装置および方法

Country Status (1)

Country Link
JP (1) JP2011151524A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449272A (zh) * 2017-07-04 2022-05-06 三星电子株式会社 使用多核变换的视频解码/编码方法和设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449272A (zh) * 2017-07-04 2022-05-06 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
CN114449271A (zh) * 2017-07-04 2022-05-06 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
CN114554203A (zh) * 2017-07-04 2022-05-27 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
CN114449271B (zh) * 2017-07-04 2023-09-22 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
CN114554203B (zh) * 2017-07-04 2023-09-22 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
CN114449272B (zh) * 2017-07-04 2023-09-26 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
US12003750B2 (en) 2017-07-04 2024-06-04 Samsung Electronics Co., Ltd. Video decoding method and apparatus using multi-core transform, and video encoding method and apparatus using multi-core transform

Similar Documents

Publication Publication Date Title
US9838715B2 (en) Image processing apparatus and method
CN107087170B (zh) 编码设备、编码方法、解码设备和解码方法
JP4656190B2 (ja) 情報処理装置および方法
WO2004015998A1 (en) System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
KR20060109290A (ko) 화상 복호 장치 및 화상 복호 방법과 화상 복호 프로그램
JP2011130410A (ja) 符号化方法、復号化方法及び装置
KR20130018241A (ko) 화상 처리 장치 및 방법, 및 프로그램
JP2013038758A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
EP1649697A1 (en) Intra coding video data methods and apparatuses
JP2015019152A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
EP2077670A1 (en) Transcoder, transcoding method, decoder, and decoding method
US20160234523A1 (en) Video encoding device, video transcoding device, video encoding method, video transcoding method, and video stream transmission system
JP7413557B2 (ja) サインデータハイディング関連映像デコーディング方法及びその装置
JP2010093669A (ja) 情報処理装置および方法
US8189687B2 (en) Data embedding apparatus, data extracting apparatus, data embedding method, and data extracting method
US8611418B2 (en) Decoding a progressive JPEG bitstream as a sequentially-predicted hybrid video bitstream
JP5950157B2 (ja) 画像処理装置および方法、並びに、プログラム
CN110324639B (zh) 用于视频数据的高效熵编码的技术
JP5817125B2 (ja) 画像処理装置および方法
JP2011082629A (ja) 画像符号化方法、画像復号化方法、画像符号化装置、及び画像復号化装置、並びにプログラム
JP5080304B2 (ja) 秘匿データが挿入された画像データの表示方式
JP2018125882A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP2011151524A (ja) 画像処理装置および方法
CN115552910A (zh) 用于残差编码的图像解码方法及其装置
JP2011055023A (ja) 画像符号化装置及び画像復号化装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130402