JP2013243477A - 画像処理装置および方法、並びに、プログラム - Google Patents

画像処理装置および方法、並びに、プログラム Download PDF

Info

Publication number
JP2013243477A
JP2013243477A JP2012114679A JP2012114679A JP2013243477A JP 2013243477 A JP2013243477 A JP 2013243477A JP 2012114679 A JP2012114679 A JP 2012114679A JP 2012114679 A JP2012114679 A JP 2012114679A JP 2013243477 A JP2013243477 A JP 2013243477A
Authority
JP
Japan
Prior art keywords
encoded data
unit
rate
frame
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012114679A
Other languages
English (en)
Other versions
JP2013243477A5 (ja
JP5950157B2 (ja
Inventor
Takahiro Fukuhara
隆浩 福原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2012114679A priority Critical patent/JP5950157B2/ja
Priority to CN2013101696190A priority patent/CN103426189A/zh
Priority to US13/891,367 priority patent/US20130308697A1/en
Publication of JP2013243477A publication Critical patent/JP2013243477A/ja
Publication of JP2013243477A5 publication Critical patent/JP2013243477A5/ja
Application granted granted Critical
Publication of JP5950157B2 publication Critical patent/JP5950157B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができるようにする。
【解決手段】本技術の画像処理装置は、画像データの一部のフレームが符号化された第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームが符号化された第3の符号化データと、第2の符号化データとを統合し、高フレームレート符号化データを生成する統合部とを備える。本技術は、例えば、画像処理装置に適用することができる。
【選択図】図1

Description

本技術は、画像処理装置および方法、並びに、プログラムに関し、特に、1の画像データ若しくはその符号化データから複数種類のフレームレートの符号化データを、より容易に生成することができるようにした画像処理装置および方法、並びに、プログラムに関する。
従来、事実上のデジタルシネマの国際規格とも言えるDCI(Digital Cinema Initiative)規格では、2Kx1Kの解像度のフレームレートが24Pと48Pに規定され、4kx2Kの解像度のフレームレートを24Pに規定されている。
従来は、低フレームレート(LFR)用の24Pのファイルと、高フレームレート(HFR)用の48Pのファイルとが、互いに独立したファイルとして扱われていた。従って、映画館等でLFR用の映画とHFR用の映画を取り扱う場合、両方のファイルを用意する必要がある。
一般的に画像データは容量低減のために符号化して保存される(例えば特許文献1参照)。1の画像データに対してLFR用の符号化データと、HFR用の符号化データを生成する場合、互いに独立して生成すると、同じフレーム画像を2度符号化する場合があり、冗長な処理により負荷が不要に増大する恐れがある。
そこで、HFR用の符号化データから、LFRに対応するフレームのデータのみを抽出することにより、LFR用の符号化データを生成する方法が考えられる。この場合、各フレームの画像は1度しか符号化されないので、LFR用の符号化データとHFR用の符号化データを1の画像データからそれぞれ生成する場合よりも、符号化処理の負荷の不要な増大を抑制することができる。
特開2004−166254号公報
しかしながら、LFR用の符号化データとHFR用の符号化データとで、要求されるビットレートが異なる場合がある。その場合、上述したようにHFR用符号化データからLFR用符号化データを単純に抽出する方法では、要求されるビットレート条件を満たすことができず、実現することができない恐れがあった。
本技術は、このような状況に鑑みて提案されたものであり、1の画像データ若しくはその符号化データから複数種類のフレームレートの符号化データを、より容易に生成することを目的とする。
本技術の一側面は、画像データの一部のフレームを符号化して、第1の符号化データを生成する第1の符号化部と、前記第1の符号化部が生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成する第2の符号化部と、前記レート制御部により生成された前記第2の符号化データと、前記第2の符号化部により生成された前記第3の符号化データとを統合し、高フレームレート符号化データを生成する統合部とを備える画像処理装置である。
前記ビットレートは、1フレーム当たりのビット量であるようにすることができる。
前記レート制御部は、各フレームについて、前記第1の符号化データの一部を必要に応じて切り捨てることにより、前記1フレーム当たりのビット量を制御することができる。
前記レート制御部は、各フレームについて、前記第1の符号化データの一部を、より重要でない方から順に必要量分切り捨てることができる。
前記第1の符号化部は、前記一部のフレームの画像データを、周波数帯域毎の係数データに変換する変換部と、前記変換部により得られた前記係数データを、所定数の前記係数データ毎に生成される、互いに同一のビット位置の値の集合であるビットプレーン毎に符号化するビットプレーン符号化部とを備え、前記レート制御部は、前記第1の符号化データのビットプレーンを、最下位から順に必要数分切り捨てることができる。
前記第1の符号化部は、前記変換部により得られた前記係数データを所定数毎にまとめたコードブロックを生成するコードブロック生成部と、前記コードブロック生成部により生成された前記コードブロック毎に、前記ビットプレーンを生成するビットプレーン生成部とをさらに備え、前記ビットプレーン符号化部は、前記ビットプレーン生成部により生成された、前記コードブロック毎のビットプレーンを、最下位から順に必要数分切り捨てることができる。
前記第2の符号化部は、前記第1の符号化部と同様の符号化方式により前記画像データを符号化することができる。
前記第1の符号化部および前記第2の符号化部は、それぞれ、前記画像データのフレームをJPEG2000方式により符号化することができる。
前記第1の符号化部は、前記第1のビットレートおよび前記第2のビットレートに応じて符号化パスのレイヤを設定し、前記レート制御部は、前記レイヤを必要数分切り捨てることにより、前記第1の符号化データのビットレートを制御し、前記低フレームレート符号化データおよび前記第2の符号化データを生成することができる。
予め設定されたフレームレートに応じて、前記画像データの一部のフレームを前記第1の符号化部に分配し、その他のフレームを前記第2の符号化部に分配するフレーム分配部をさらに備えることができる。
前記フレーム分配部は、前記第1の符号化部に分配するフレーム、若しくは、前記第2の符号化部に分配するフレームの内、少なくともいずれか一方に、分配先毎のグループを識別する識別情報を付加することができる。
前記レート制御部により生成された前記低フレームレート符号化データを記憶する記憶部をさらに備えることができる。
本技術の一側面は、また、画像処理装置の画像処理方法において、前記画像処理装置が、画像データの一部のフレームを符号化して、第1の符号化データを生成し、生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成し、前記画像データの他のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成し、生成された前記第2の符号化データと前記第3の符号化データとを統合し、高フレームレート符号化データを生成する画像処理方法である。
本技術の一側面は、さらに、コンピュータを、画像データの一部のフレームを符号化して、第1の符号化データを生成する第1の符号化部と、前記第1の符号化部が生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成する第2の符号化部と、前記レート制御部により生成された前記第2の符号化データと、前記第2の符号化部により生成された前記第3の符号化データとを統合し、高フレームレート符号化データを生成する統合部として機能させるためのプログラムである。
本技術の他の側面は、画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成する選択部と、前記選択部により生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにするレート制御部とを備える画像処理装置である。
前記目標ビットレートを決定する決定部をさらに備え、前記レート制御部は、各フレームレートの符号化データのビットレートを、前記決定部により決定された目標ビットレートにすることができる。
前記画像データを符号化し、前記符号化データを生成する符号化部をさらに備え、前記選択部は、前記符号化部により生成された前記符号化データから複数のフレームレートの符号化データを生成することができる。
レート制御部によりそれぞれの目標ビットレートに制御された各フレームレートの符号化データを復号する復号部をさらに備えることができる。
本技術の他の側面は、また、画像処理装置の画像処理方法において、前記画像処理装置が、画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成し、生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにする画像処理方法である。
本技術の他の側面は、さらに、コンピュータを、画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成する選択部と、前記選択部により生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにするレート制御部として機能させるためのプログラムである。
本技術の一側面においては、画像データの一部のフレームが符号化されて、第1の符号化データが生成され、生成された第1の符号化データのビットレートが制御され、第1のビットレートの低フレームレート符号化データと、第1のビットレートと異なる第2のビットレートの第2の符号化データとが生成され、画像データの他のフレームが符号化されて、第2のビットレートの第3の符号化データが生成され、生成された第2の符号化データと第3の符号化データとが統合され、高フレームレート符号化データが生成される。
本技術の他の側面においては、画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データが生成され、生成された各フレームレートの符号化データのビットレートが、それぞれの目標ビットレートにされる。
本技術によれば、画像を処理することが出来る。特に、1の画像データ若しくはその符号化データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
画像符号化装置の主な構成例を示すブロック図である。 LFRとHFRのピクチャ配列の関係の例を説明する図である。 LFR符号化部の主な構成例を示す図である。 サブバンドの構成例を示す図である。 サブバンドの構成例を示す図である。 各サブバンド中のコードブロックの例を示す図である。 ビットプレーンの例を説明する図である。 符号化パスの例を説明する図である。 係数の走査の例を説明する図である。 レイヤを説明する図である。 レイヤの構成例を説明する図である。 プログレッション機能の例を説明する図である。 プログレッション機能の他の例を説明する図である。 レート制御の様子の例を説明する図である。 複数FR符号化処理の流れの例を説明するフローチャートである。 符号化処理の流れの例を説明するフローチャートである。 画像符号化装置の主な構成例を示すブロック図である。 複数FR符号化処理の流れの例を説明するフローチャートである。 画像復号装置の主な構成例を示すブロック図である。 LFR復号部の主な構成例を示す部六図である。 複数FR復号処理の流れの例を説明するフローチャートである。 復号処理の流れの例を説明するフローチャートである。 CODマーカセグメントの構成例を示す図である。 Scodパラメータの例を示す図である。 コンピュータの主な構成例を示すブロック図である。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(画像符号化装置)
2.第2の実施の形態(画像符号化装置)
3.第3の実施の形態(画像復号装置)
4.第4の実施の形態(応用例)
5.第5の実施の形態(コンピュータ)
<1.第1の実施の形態>
[1−1冗長な処理]
事実上のデジタルシネマの国際規格とも言えるDCI(Digital Cinema Initiative)規格では、2Kx1Kの解像度のフレームレートを24Pと48P、4kx2Kの解像度のフレームレートを24Pに規定している。従来、低フレームレート(LFR)用の24Pのファイルと、高フレームレート(HFR)用の48Pのファイルとが、互いに独立したファイルとして扱われていた。従って、映画館等でLFR用の映画とHFR用の映画を取り扱う場合、両方のファイルを用意する必要がある。
しかしながら、この場合、両ファイルは、フレームレートが異なるだけなので、互いに同じフレームを含むことも十分に考えられる。すなわち、両ファイルは冗長性が高く、両ファイルを同時に記憶することは、不要に多くの記憶容量を必要とする。
特に動画像データの場合、データ量が多く、一般的には、容量低減の為に符号化されて保存される場合が多いが、符号化データであってもそのデータ量は多い。例えばDCI規格である250MbpsでエンコードされたJPEG2000符号化データの場合の、2時間のデータ量は、250Mbps×3,600秒×2時間 = 1,800 Gbyte (1.8TB)にもなる。そのため、上述したような冗長性はできるだけ低減させることが望ましい。
そこで、共通のフレームは、一方のみを記憶し、他方を省略する方法が考えられた。例えば、LFRのフレームが全てHFRのフレームに含まれる場合、HFR用のデータのみを保存し、LFR用のデータが必要なときは、HFR用のデータから必要部分を抽出して生成するようにする。このようにすることにより、冗長性を低減し、データ量の不要な増大を抑制することができる。
しかしながら、LFR用のデータと、HFR用のデータとで、要求されるビットレート(目標ビットレート)が異なる場合がある。また、フレームレートが異なるため、仮にビットレートが共通であっても、1フレーム当たりに要求されるビット量(目標ビット量)は異なる場合がある。
この1フレーム当たりの目標ビット量は、要求されるビットレートやフレームレートに応じて決定されるため、様々であり、例えばLFRの方がHFRよりも多くなる場合もあるし、少なくなる場合も考えられる。
このように、目標ビットレートが共通でない場合に、上述したようにデータを共有すると、再生画像の画質が低減する恐れがある。
例えば、上述したようにLFRの全てのフレームがHFRのフレームに含まれ、LFRのデータは、HFRのデータから抽出するとする。この場合、LFRとHFRの共通フレームの目標ビット量をLFRに揃えると、LFRの再生画像は問題ないが、HFRの再生画像において、ビット量がフレーム毎に大きく変化し、視聴者の視覚に違和感を生じさせ、視聴者に画質の低下と感じさせてしまう恐れがある。
逆に、共通フレームの目標ビット量をHFRの目標ビット量に揃えると、HFRの再生画像に問題は無いが、例えば、LFRの1フレーム当たりの目標ビット量が、HFRの1フレーム当たりの目標ビット量より多い場合、LFRのビットレートが不要に低減しており、再生画像の画質が不要に低減する。逆に、LFRの1フレーム当たりの目標ビット量が、HFRの1フレーム当たりの目標ビット量より少ない場合、LFRのビットレートが目標ビットレートを上回ることになり、データ伝送等において遅延時間が許容範囲を超える等の不具合を生じる恐れがあった。
そのため、各画像データのレートを調整する必要が生じる。そのため、結局、共通のフレームのデータをそれぞれ符号化したり復号したりしなければならず、処理の冗長性が高くなることにより不要に負荷が増大し、実現が困難になる恐れがあった。特に、伝送したデータを即時的に(リアルタイムに)再生する場合等においては、符号化や復号等の処理の遅延時間の低減が要求され、実現がより困難になる恐れがあった。
[1−2複数フレームレートの符号化データの生成]
そこで、画像データの一部のフレームを符号化して、第1の符号化データを生成し、その第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データを生成するとともに、第1のビットレートと異なる第2のビットレートの第2の符号化データを生成し、その画像データの、第1の符号化データに含まれるフレーム以外のフレームを符号化して、第2のビットレートの第3の符号化データを生成し、第2の符号化データのフレームと、第3の符号化データのフレームとを統合し、高フレームレート符号化データを生成するようにする。
このようにすることにより、画像処理装置は、負荷の大きな符号化や復号の冗長性を低減させることができる。つまり、画像処理装置は、1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
なお、上述したビットレートは、1フレーム当たりのビット量とすることにより、各フレームのビット量を揃えることができ、再生画像の視覚的な違和感を抑制することができる。
なお、レート制御においては、各フレームについて、第1の符号化データの一部を必要に応じて切り捨てることにより、1フレーム当たりのビット量を制御するようにしてもよい。このようにすることにより、符号化データのビットレート制御を容易に実現することができる。
また、レート制御においては、各フレームについて、第1の符号化データの一部を、より重要でない方から順に必要量分切り捨てるようにしてもよい。例えば、一部のフレームの画像データを、周波数帯域毎の係数データに変換し、得られた係数データを、所定数の係数データ毎に生成される、互いに同一のビット位置の値の集合であるビットプレーン毎に符号化し、そのビットプレーンを、最下位から順に必要数分切り捨てるようにしてもよい。このようにすることにより、より重要なデータをレート制御の為に切り捨ててしまうことを抑制することができ、レート制御による画質低減を抑制することができる。
さらに、符号化の際には、係数データを所定数毎にまとめたコードブロックを生成し、そのコードブロック毎に、ビットプレーンを生成するようにしてもよい。この場合、レート調整においては、コードブロック毎のビットプレーンが、最下位から順に必要数分切り捨てられる。このようにすることにより、より容易に所望のレート制御を行うことができる。
なお、第1の符号化データを生成する符号化と、第3の符号化データを生成する符号化とは、互いに同様の符号化方式を適用するようにしてもよい。このようにすることにより、第2の符号化データと第3の符号化データとの統合が容易になる。またこれらの符号化の符号化方式をJPEG2000方式としてもよい。JPEG2000方式の場合、フレーム毎に独立して符号化を行うので、フレーム単位のレート制御やフレームの統合等が容易になる。また、後述するように符号化データのレート制御も容易に実現することができる。
また、符号化において、第1のビットレートおよび第2のビットレートに応じて符号化パスのレイヤを設定し、レイヤを必要数分切り捨てることにより、第1の符号化データのビットレートを制御し、低フレームレート符号化データおよび第2の符号化データを生成するようにしてもよい。このようにすることによりレート制御をより容易にすることができる。
予め設定されたフレームレートに応じて、画像データの各フレームを仕分けするようにしてもよい。また、このような仕分けにおいて、仕分ける各フレームの内、少なくともいずれか一方に、グループを識別する識別情報を付加するようにしてもよい。このようにすることにより、フレーム統合されたデータから一部のフレームを抽出する際に、その識別情報を利用することができ、処理がより容易になる。
レート制御部により生成された低フレームレート符号化データを記憶するようにしてもよい。
また、画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成し、生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートに合わせるようにしてもよい。このようにすることにより、1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
また、目標ビットレートを決定するようにしてもよい。これにより任意の目標ビットレートへの変換をより容易に行うことができる。
さらに、画像データを符号化し、符号化データを生成したり、目標ビットレートに制御された符号化データを復号したりしてもよい。
もちろん、これらの処理をソフトウエアにより実現するようにしてもよい。
[1−3画像符号化装置]
以下に、より具体的な例を説明する。図1は、画像符号化装置の主な構成例を示すブロック図である。図1に示される画像符号化装置100は、本技術を適用した画像処理装置であって、入力された高フレームレート(HFR)の動画像データ(HFR画像データ)を符号化し、高フレームレート(HFR)の符号化データを生成する。また、画像符号化装置100は、HFR画像データの一部のフレームの符号化データを用いて、低フレームレート(LFR)の符号化データを生成する。
その際、画像符号化装置100は、それぞれ所望のビットレートで、HFRの符号化データおよびLFRの符号化データの両方を容易に生成することができる。
図1に示されるように、画像符号化装置100は、ビットレート決定部101、ピクチャ選択部102、符号化部103、レート制御部104、コードストリーム統合部105、および記憶部106を有する。
ビットレート決定部101は、LFR用およびHFR用のそれぞれの目標ビットレートを決定する。ビットレート決定部101は、決定したこれらの目標ビットレートを示す制御情報を符号化部103およびレート制御部104に供給し、それらの動作を制御する。
ピクチャ選択部102は、入力される高フレームレートの画像データ(HFR画像データ)の供給先をそのピクチャ毎に制御する。ピクチャ選択部102は、低フレームレート(LFR)に属するフレーム(LFRおよびHFRで共通のフレーム)(LFR)の画像データをLFR符号化部111に供給し、残りのフレーム(HFRのみに属するフレーム)(HFR-LFR)の画像データをHFR符号化部112に供給する。
符号化部103は、ピクチャ選択部102から供給される各フレームの画像データを、例えばJPEG2000方式で符号化する。符号化部103は、ビットレート決定部101により決定された目標ビットレートを用いて符号化を行う。例えば、符号化部103は、図1に示されるように、LFR符号化部111およびHFR符号化部112を有する。
LFR符号化部111は、ピクチャ選択部102から供給されるLFRおよびHFRで共通のフレームの画像データ(LFR)を符号化する。その際、LFR符号化部111は、ビットレート決定部101が決定したLFR用のビットレートとHFR用のビットレートの内の高い方のビットレート、若しくはそれ以上のビットレートを目標値として符号化を行う。LFR符号化部111は、生成した符号化データ(LFR)をレート制御部104に供給する。
HFR符号化部112は、ピクチャ選択部102から供給されるHFRのみに属するフレームの画像データ(HFR-LFR)を符号化する。その際、HFR符号化部112は、ビットレート決定部101が決定したHFR用のビットレートを目標値として符号化を行う。HFR符号化部112は、生成したHFR用の符号化データ(HFR-LFR)をコードストリーム統合部105に供給する。
レート制御部104は、LFR符号化部111から供給される符号化データ(LFR)のビットレートをフレーム毎に適宜制御する。つまり、レート制御部104は、符号化データのフレーム毎のビット量を適宜調整する。例えば、レート制御部104は、ビットレート決定部101が決定した目標ビットレートを用いて、符号化データのレート制御を行う。
詳細については後述するが、レート制御部104は、符号化データのより不要な部分を切り捨てることによりレート制御を行う。つまり、レート制御部104は、この切り捨てるデータ量を制御することにより、レート制御を行う。符号化データの一部を切り捨てるのみであるので、このレート制御処理は、非常に負荷を小さく実現することができる。つまり、レート制御部104は、より容易にレート制御を行うことができる。
レート制御部104は、共通フレームの符号化データのビットレートを制御することにより、LFR用の符号化データ(LFR符号化データ)とHFR用の符号化データを生成する。レート制御部104は、生成したLFR符号化データを画像符号化装置100の外部に出力するか、若しくは、記憶部106に供給して記憶させる。また、レート制御部104は、生成したHFR用の符号化データをコードストリーム統合部105に供給する。
レート制御部104は、ビットレート決定部101により決定されたLFR用の目標ビットレートおよびHFR用の目標ビットレートの内、少なくともいずれか一方を用いて、適宜、レート制御を行う。
例えば、LFR符号化部111によりLFR用の目標ビットレートを目標値として符号化された場合、レート制御部104は、その符号化データをLFR符号化データとし、さらに、その符号化データのビットレートをHFR用の目標ビットレートに変換したHFR用の符号化データを生成する。
また、例えば、LFR符号化部111によりHFR用の目標ビットレートを目標値として符号化された場合、レート制御部104は、その符号化データをHFR用の符号化データとし、さらに、その符号化データのビットレートをLFR用の目標ビットレートに変換したLFR符号化データを生成する。
さらに、例えば、LFR符号化部111によりLFR用およびHFR用の目標ビットレートよりも高いビットレートを目標値として符号化された場合、レート制御部104は、その符号化データのビットレートをLFR用の目標ビットレートに変換したLFR符号化データを生成するとともに、その符号化データのビットレートをHFR用の目標ビットレートに変換したHFR用の符号化データを生成する。
図1に示されるように、レート制御部104は、例えば、LFRレート制御部121およびHFRレート制御部122を有する。
LFRレート制御部121は、ビットレート決定部101により決定されたLFR用の目標ビットレートを用いて、LFR符号化部111から供給される符号化データのビットレートを適宜制御し、LFR符号化データを生成する。LFRレート制御部121は、生成したLFR符号化データを、画像符号化装置100の外部に出力したり、記憶部106に供給して記憶させたりする。
HFRレート制御部122は、ビットレート決定部101により決定されたHFR用の目標ビットレートを用いて、LFR符号化部111から供給される符号化データのビットレートを適宜制御し、HFR用の符号化データ(LFR)を生成する。HFRレート制御部122は、生成したHFR用の符号化データ(LFR)を、コードストリーム統合部105に供給する。
コードストリーム統合部105は、HFR符号化部112から供給されるHFR用の符号化データ(HFR-LFR)と、HFRレート制御部122から供給されるHFR用の符号化データ(LFR)とを統合し、1のコードストリームを生成する。HFR用の符号化データ(HFR-LFR)と、HFR用の符号化データ(LFR)とは、共通のHFR画像データを符号化して生成された符号化データであり、互いに異なるフレームの画像データを符号化して生成されたものである。つまり、これらの符号化データを、適切な順で統合して1のコードストリームとすることにより、HFR画像データの全フレームを符号化した符号化データ(HFR符号化データ)が得られる。
なお、統合される両符号化データのビットレートは、それぞれ、HFR符号化部112若しくはHFRレート制御部122において、HFR用の目標ビットレートを用いて制御されている。したがって、これらの符号化データ間に大きなビットレートの差は無い。したがって、これらが統合されて生成されたHFR符号化データの再生画像におけるフレーム間のビット量の大きな変化による視覚的な違和感は抑制される。
コードストリーム統合部105は、生成したコードストリーム(HFR符号化データ)を、画像符号化装置100の外部に出力するか、若しくは、記憶部106に供給し、記憶させる。
記憶部106は、LFRレート制御部121から供給されるLFR符号化データやコードストリーム統合部105から供給されるHFR符号化データを記憶することができる。記憶部106が、これらの符号化データの内、いずれか一方のみを記憶するようにしてもよいし、両方を記憶するようにしてもよい。例えば、HFR符号化データからLFR符号化データを生成することができる場合、HFR符号化データのみ記憶部106に記憶されるようにしてもよい。
また、LFR符号化データやHFR符号化データを記憶する必要が無い場合、この記憶部106を省略するようにしてもよい。
次にピクチャ選択について説明する。図2は、LFRとHFRのピクチャ配列の関係の例を説明する図である。
図2に示される四角の列は、画像データを示しており、各四角は、各フレームを表している。「H」と記載された四角は、HFR(High Frame Rate)のみに属するフレームを示し、「L」と記載された四角は、HFRおよびLFR(Low Frame Rate)の両方に属するフレームを示す。つまり、HFRは、図2に記載の全てのフレームにより構成され、LFRは、その内の一部のフレームにより構成される。なお、図2中の「H」および「L」の表記は、以上のような意味をもつものであり、実際のフレーム画像の絵を表すものではない。
また、図2の例におけるLFRおよびHFRの具体的なフレームレートは、以下のとおりである。「24P」は、24フレーム毎秒のプログレッシブ画像を示し、「60P」は、60フレーム毎秒のプログレッシブ画像を示す。
Low Frame Rate=24P
High Frame Rate=60P
また、LFRの目標ビットレート(Bit_LFR)と、HFRの目標ビットレート(Bit_HFR)の例を以下に2つ示す。
(Case-1):
Bit_HFR=500Mbps/60P=8.33Mb/pic
Bit_LFR=250Mbps/24P=10.42Mb/pic
つまり、この場合、Bit_HFR < Bit_LFRになる。つまり、LFRの符号化データの方が、HFRの符号化データよりも、1ピクチャ当たりの目標ビット量が多い。したがって、図2の「L」のピクチャ(共通フレーム)を、LFRの目標ビットレートで符号化すると、HFRの符号化データのビットレートが500Mbpsを超えてしまう恐れがある。従って、この場合、共通フレームのビットレートは、他のフレームと同様に8.33Mbpsに低下させなければならない。
(Case-2):
Bit_HFR=500Mbps/60P=8.33Mb/pic
Bit_LFR=150Mbps/24P=6.25Mb/pic
つまり、この場合、Bit_HFR > Bit_LFRになる。つまり、LFRの符号化データの方が、HFRの符号化データよりも、1ピクチャ当たりの目標ビット量が少ない。したがって、図2の「L」のピクチャ(共通フレーム)を、LFRの目標ビットレートで符号化すると、HFRの符号化データのビットレートが500Mbpsに達しない恐れがある。従って、この場合、共通フレームのビットレートは、他のフレームと同様に8.33Mbpsに増大させなければならない。
レート制御方法の具体例については、後述する。その前に、図1の符号化部103(LFR符号化部111およびHFR符号化部112)について説明する。
[1−4符号化部]
図3は、LFR符号化部111の主な構成例を示す図である。なお、HFR符号化部112は、符号化するフレームや目標ビットレートが異なる場合があるのみで、基本的には、LFR符号化部111と同様の構成を有し、同様の処理を行う。したがって、以下においては、LFR符号化部111の構成を説明し、そのLFR符号化部111の説明をHFR符号化部112にも適用することができるものとし、HFR符号化部112についての説明を省略する。
LFR符号化部111は、JPEG2000方式と同様のプログレッション構造を有するコードストリームを生成するように符号化を行う。LFR符号化部111がJPEG2000方式により画像を符号化するようにしてもよい。図3に示されるように、LFR符号化部111は、DCレベルシフト部131、ウェーブレット変換部132、量子化部133、コードブロック化部134、およびビットプレーン展開部135を有する。
DCレベルシフト部131は、後段のウェーブレット変換を効率的に行うために、矢印161のようにLFR符号化部111に入力されたHFR画像データのDC成分のレベルシフトを行う。例えば、RGB信号が正の値(符号無しの整数)を持っている。そこで、DCレベルシフト部131は、そのことを利用し、原信号のダイナミックレンジを半分にするレベルシフトを行うことで、圧縮効率の向上を図る。従って、YCbCr信号の色差データCbや色差データCrの様に符号(正負両方あり)の整数値を持つ信号を原信号とする場合には、このレベルシフトは行われない。
ウェーブレット変換部132は、通常低域フィルタと高域フィルタから構成されるフィルタバンクによって実現される。また、デジタルフィルタは通常複数タップ長のインパルス応答(フィルタ係数)を有するので、ウェーブレット変換部132は、フィルタリングが行えるだけの入力画像を予めバッファリングするバッファを有する。
ウェーブレット変換部132は、矢印162のようにDCレベルシフト部131より出力された画像データを、フィルタリングに最低限必要なデータ量以上取得すると、そのDCレベルシフト後の画像データに対して、所定のウェーブレット変換フィルタを用いてフィルタリングを行い、ウェーブレット係数を生成する。なお、ウェーブレット変換部132は、画像の垂直方向および水平方向のそれぞれに対して、画像データを低域成分と高域成分に分離するフィルタリングを行う。
そして、ウェーブレット変換部132は、このようなフィルタリング処理を、垂直方向および水平方向の両方において低域成分として分離されたサブバンドに対して再帰的に所定回数繰り返す。これは、例えば図4に示されるように、画像のエネルギーの多くが低域成分に集中しているからである。
図4は、サブバンドの構成例を示す図である。図4に示されるように、分割レベル数1の状態においても分割レベル数3の状態においても、画像のエネルギーの多くは、低域成分に集中している。
図5は、分割レベル数4のウェーブレット変換処理により生成されるサブバンドの構成例を示す図である。
この場合、ウェーブレット変換部132は、まず、画像全体をフィルタリングし、サブバンド1LL(図示せず)、1HL、1LH、および1HHを生成する。次に、ウェーブレット変換部132は、生成されたサブバンド1LLに対して再度フィルタリングを行い、2LL(図示せず)、2HL、2LH、および2HHを生成する。さらに、ウェーブレット変換部132は、生成されたサブバンド2LLに対して再度フィルタリングを行い、3LL、3HL、3LH、および3HHを生成する。さらに、ウェーブレット変換部132は、生成されたサブバンド3LLに対して再度フィルタリングを行い、4LL、4HL、4LH、および4HHを生成する。
このように、分割レベル数4まで分析フィルタリングが行われると、13個のサブバンドが生成される。図5に示されるように、分割レベルが1つ上位に進むごとに、サブバンドのサイズは、縦方向および横方向にそれぞれ2分の1となる。
つまり、例えば横方向に1920画素の画像のベースバンドの画像データが1回分析フィルタリングされると、横方向に960画素のサブバンドが4つ(1LL,1HL,1LH,1HH)生成される。さらに、サブバンド1LLが1回分析フィルタリングされると、横方向に480画素のサブバンドが4つ(2LL,2HL,2LH,2HH)が生成される。さらに、サブバンド2LLが回分析フィルタリングされると、横方向に240画素のサブバンドが4つ(3LL,3HL,3LH,3HH)が生成される。さらに、サブバンド3LLが1回分析フィルタリングされると、横方向に120画素のサブバンドが4つ(4LL,4HL,4LH,4HH)が生成される。
なお、ウェーブレット変換の分割レベル数は任意である。
ウェーブレット変換部132は、フィルタリングにより得られたウェーブレット係数を、サブバンド毎に、矢印163に示されるように量子化部133に供給する。量子化部133は、供給されたウェーブレット係数を量子化する。この量子化の方法は任意であるが、量子化ステップサイズで除算するスカラ量子化が一般的である。量子化部133は、量子化により得られた量子化係数を、矢印164に示されるように、コードブロック化部134に供給する。なお、これより後段においては、ウェーブレット係数の代わりに量子化係数が供給されることになるが、この量子化係数もウェーブレット係数の場合と基本的に同様に扱われる。したがって、以下においては、必要でない限りその点についての説明は省略し、単に係数または係数データと称する。
なお、LFR符号化部111が、復号処理により元のデータを完全に復元可能な可逆符号化方式により画像データを符号化する場合、この量子化部133の処理は省略され、矢印165に示されるように、ウェーブレット変換部132の出力がコードブロック化部134に供給される。
ウェーブレット係数は、コードブロック化部134で、エントロピ符号化の処理単位である所定の大きさのコードブロックに分割される。図6は各サブバンド中のコードブロックの位置関係を示したものである。例えば64×64画素程度のサイズのコードブロックが、分割後のすべてのサブバンド中に生成される。後段の各処理部は、このコードブロック毎に処理を行う。
コードブロック化部134は、矢印166に示されるように、各コードブロックをビットプレーン展開部135に供給する。ビットプレーン展開部135は、係数データを、ビットの位毎のビットプレーンに展開する。
ビットプレーンは、所定の数のウェーブレット係数よりなる係数群を、1ビット毎、つまり位毎に分割(スライス)したものである。つまり、ビットプレーンは、その係数群の互いに同一の位のビット(係数ビット)の集合である。
図7にその具体例を示す。図7の左図は縦4個、横4個の計16個の係数を示している。この16個の係数のうち、絶対値が最大のものは13で、2進数で1101と表現される。ビットプレーン展開部135は、このような係数群を、絶対値を示す4枚のビットプレーン(絶対値のビットプレーン)と、符号を示す1枚のビットプレーン(符号のビットプレーン)に展開する。つまり、図7中左の係数群は、図7中右に示されるように、4枚の絶対値のビットプレーンと1枚の符号のビットプレーンに展開される。ここで、絶対値のビットプレーンの要素はすべて0か1の値をとる。また、符号を示すビットプレーンの要素は、係数の値が正であることを示す値、係数の値が0であることを示す値、または係数の値がマイナスを示す値のいずれかをとる。
LFR符号化部111は、さらに、ビットモデリング部136、算術符号化部137、符号量加算部138、レート制御部139、ヘッダ生成部140、およびパケット生成部141を有する。
ビットプレーン展開部135は、展開したビットプレーンを、矢印167に示されるように、ビットモデリング部136に供給する。
ビットモデリング部136および算術符号化部137は、EBCOT(Embedded Coding with Optimized Truncation)部151として動作し、入力される係数データに対して、JPEG2000規格で定められたEBCOTと呼ばれるエントロピ符号化を行う。EBCOTは、所定の大きさのブロック毎にそのブロック内の係数の統計量を測定しながら符号化を行う手法である。
ビットモデリング部136は、JPEG2000規格で定められた手順に従って、係数データに対してビットモデリングを行い、矢印168に示されるように、制御情報、シンボル、およびコンテキスト等の情報を算術符号化部137に供給する。算術符号化部137は、係数のビットプレーンを算術符号化する。
コードブロックの縦横のサイズは4から256まで2のべき乗で、通常使用される大きさは、32×32、64×64、128×32等がある。係数値がnビットの符号付き2進数で表されていて、bit0からbit(n−2)がLSBからMSBまでのそれぞれのビットを表すとする。残りの1ビットは符号を示す。符号ブロックの符号化は、MSB側のビットプレーンから順番に、次の3種類の符号化パスによって行われる。
(1)Significant Propagation Pass
(2)Magnitude Refinement Pass
(3)Cleanup Pass
3つの符号化パスの用いられる順序は、図8で示される。最初にBit-plane(n-1)(MSB)がCleanup Passによって符号化される。続いて順次LSB側に向かい、各ビットプレーンの符号化が、3つの符号化パスをSignificant Propagation Pass、Magnitude Refinement Pass、Cleanup Passの順序で用いて行われる。
ただし、実際にはMSB側から何番目のビットプレーンで初めて1が出てくるかをヘッダに書き、MSB側から連続するオール0のビットプレーン(ゼロビットプレーンと称する)は符号化しない。この順序で3種類の符号化パスを繰返し用いて符号化し、任意のビットプレーンの、任意の符号化パス迄で符号化を打ち切ることにより、符号量と画質のトレードオフを取る(レート制御を行う)。
次に、係数の走査(スキャニング)について図9を用いて説明する。コードブロックは高さ4個の係数毎にストライプ(stripe)に分けられる。ストライプの幅はコードブロックの幅に等しい。スキャン順とは、1個のコードブロック内の、すべての係数をたどる順番で、コードブロック中では上のストライプから下のストライプへの順序、ストライプの中では、左の列から右の列へ向かっての順序、列の中では上から下へという順序である。各符号化パスにおいてコードブロック中のすべての係数が、このスキャン順で処理される。
以下、3つの符号化パスについて述べる。以下はいずれもJPEG-2000規格書(参考文献:ISO/IEC 15444-1, Information technology-JPEG 2000, Part 1:Core coding system)に記述されている内容である。
(1)Significance Propagation Pass(SPパス):
あるビットプレーンを符号化するSignificance Propagation Passでは、8近傍の少なくとも1つの係数が有意(significant)であるようなnon-significant係数のビットプレーンの値を算術符号化する。その符号化したビットプレーンの値が1である場合は、符号が+であるか、−であるかを続けてMQ符号化する。
ここでsignificanceというJPEG2000特有の用語について説明する。significanceとは、各係数に対して符号化器が持つ状態で、significanceの初期値はnon-significantを表す0、その係数で1が符号化されたときにsignificantを表す1に変化し、以降常に1であり続けるものである。従って、significanceとは有効桁の情報を既に符号化したか否かを示すフラグとも言える。あるビットプレーンでsignificantになれば、以降のビットプレーンではsignificantになったままである。
(2)Magnitude Refinement Pass(MRパス):
ビットプレーンを符号化するMagnitude Refinement Passでは、ビットプレーンを符号化する Significance Propagation Passで、且つ符号化していないsignificantな係数のビットプレーンの値をMQ符号化する。
(3)Cleanup Pass(CUパス):
ビットプレーンを符号化するCleanup Passでは、ビットプレーンを符号化するSignificance Passで、且つ符号化していないnon-significantな係数のビットプレーンの値をMQ符号化する。その符号化したビットプレーンの値が1である場合は符号が+であるか−であるか(Sign情報)を続けてMQ符号化する。
尚、以上の3つの符号化パスでのMQ符号化では、ケースに応じて、ZC(Zero Coding)、RLC(Run-Length Coding)、SC(Sign Coding)、およびMR(Magnitude Refinement)が使い分けられる。ここでMQ符号化と呼ばれる算術符号が用いられる。MQ符号化は、JBIG2(参考文献:ISO/IEC FDIS 14492, “Lossy/Lossless Coding of Bi-level Images”, March 2000)で規定された学習型の2値算術符号である。
図3に戻り、算術符号化部137は、生成したコードストリームを、矢印169に示されるように、符号量加算部138に供給する。符号量加算部138は、そのコードストリームの符号量をカウントし、累積する。
そして、符号量加算部138は、そのコードストリームを、矢印172および矢印173に示されるように、ヘッダ作成部140およびパケット生成部141に供給するとともに、矢印170に示されるように、符号量の累積値をレート制御部139に供給する。レート制御部139は、供給された符号量の累積値に基づいて、矢印171に示されるように、EBCOT部151を制御し、累積値が目標符号量に達した時点で符号化を終了させる。つまり、レート制御部139は、発生符号量の制御(コードストリームのレート制御)を行う。
パケット生成部141は、供給されたコードストリームをパケット化する。ヘッダ生成部140は、そのパケットのヘッダ情報を生成し、そのヘッダ情報を矢印174に示されるように、パケット生成部141に供給する。パケット生成部141は、そのヘッダ情報を用いてパケット化を行う。
このパケットの概念を図10に示す。図10に示される例では、ウェーブレット変換を3回施した例で、その結果、最低域のPacket-1から最高域のPacket-4までの4個のパケットが生成されることを示している。従って、これら個々のパケット内のサブバンド中に存在する、すべての符号ブロックの符号化コードストリームが、パケット毎にパッキングされることになる。
また図11は、符号化パスを、レイヤ1乃至レイヤLのL個のレイヤに分割したケースを図示したものである。あるコードブロックで、レイヤnの先頭の符号化パスはレイヤ(n−1)の最終後尾の符号化パスの直後に位置する。したがって、レイヤ数が増えるごとにコードストリームの符号量が増加する。つまり復号画像の画質が向上する(解像度は変化しない)。
したがって、復号時に、レイヤ1からどのレイヤまでを復号するかを制御することにより、復号画像の画質を制御することができる。以下において、特に説明をしない限り、「画質」は、このレイヤ(つまり各画素の情報量)に依存する復号画像の視覚的品質のことを示すものとする。
なお、どのコードブロックのどの符号化パスでレイヤの境界を切るかは、エンコーダ(画像符号化装置100)により設定することができる。以上のパケット内のサブバンド中に存在する、すべてのコードブロックのコードストリームが、パケット毎にパッキングされることになる。
生成されたパケットは矢印175に示されるように、外部に出力される。
LFR符号化部103は、上述したようにJPEG2000方式で画像データを符号化し、解像度やレイヤ等について、JPEG2000のプログレッション機能を持たせたコードストリームを生成する。
JPEG2000の符号化における特徴として、ビットプレーンと、ウェーブレット変換によって生成されるサブバンドとがある。これらによってプログレッションの定義が可能になる。
プログレッションとは、同じカテゴリに属する符号語の順番である。例えば同じ解像度レベルに属する異なるレイヤの符号語を集めれば、画像サイズが同一で画質が異なる画像を生成することができる。逆に同じレイヤに属する異なる解像度レベルの符号語を集めれば、画質が同じで画像サイズが異なる画像を生成することができる。つまり、復号画像の拡張性を実現するためのデータ構造である。
JPEG2000では、このように所定の要素について、コードストリームから一部のデータのみを復号することができる。これにより、1つのコードストリームから多様な復号画像を容易に得ることができる。つまり、コードストリームにこのようなプログレッション構造を持たせることにより、より多様な用途に使用することができるようになり、コードストリームの利便性が向上する。
例えば、1つのコードストリームから、大画面の表現力が豊かな高性能の液晶ディスプレイに対しては、高解像度かつ高ビットレートの復号画像を提供し、小画面で画像処理能力が低い携帯電話機等に対しては、低解像度かつ低ビットレートの復号画像を提供する、といったことも、復号するレイヤやサブバンド等のプログレッションの要素の選択により、容易に実現することができる。
なお、このようなプログレッション構造は、復号処理だけでなく、復号画像の画像サイズや画質等を変化させる変換処理(トランスコード)においても利用することができる。つまり、上述した復号処理の場合と同様に、レイヤやサブバンド等のプログレッションの要素を選択するだけで、容易に、復号画像の画像サイズや画質を変化させたコードストリームを生成する(すなわちトランスコードする)ことができる。
JPEG2000の場合、プログレッションの要素には、解像度レベル、レイヤ、ポジション、およびコンポーネントの4つが存在する。
解像度レベルは、図4で図示したように、ウェーブレット変換に伴って生成されるレベルである。つまり、解像度レベルは、復号画像の画像サイズを定義するものである。レイヤは、図11で図示した通り、ビットプレーン方向のレベルで画質を左右する要素である。また、コンポーネントは、例えばYCbCrのような異なる成分からなる場合に定義されるものである(YCbCrやRGBの場合、コンポーネント数は、3になる)。最後にポジションであるが、これはJPEG2000の特徴の1つのタイリングに関係するもので、画面を複数の矩形ブロックに分割エンコード・デコードする場合の、各タイルの個数や位置を定義する。
以上のようにプログレッションの要素が複数存在する場合、要素毎の階層構造が形成される。JPEG2000のPart-1の場合、上述した要素を使ったLRCP(Layer Resolution-level Component Position Progression)、RLCP(Resolution-level Layer Component Position Progression)、RPCL(Resolution-level Position Component Layer)、PCRL(Position Component Resolution-level Layer)、およびCPRL(Component Position Resolution-level Layer)の5通りの階層構造が用意されている。
図12はLRCPの順番にJPEG2000の符号語を並べた符号化コードストリームを、その順番にデコードした時に生成されるデコード画像を図示したものである。このプログレッション構造の場合、以下の順番にパケットが並んでいる。すなわち、最上位階層がレイヤ(全レイヤ数=L)、その1つ下の階層が解像度レベル(N(max)が最大解像度レベル)、さらにその1つ下の階層がコンポーネント(Csizはコンポーネント総数)、最下位階層がポジションとなるように、符号語が並べられている。なお、以下においては、ポジション(P)についての説明は省略している。
for each l = 0, …, L-1
for each r = 0, …, N(max)
for each i = 0, …, Csiz-1
{ packet for component(i), resolution-level(r), layer(l) }
この場合、最上位階層がレイヤであるので、復号画像は、図12に示される画像181、画像182、画像183、画像184の順のように、徐々に画質が向上していくように表示される。
図13はRLCPの順番にJPEG2000の符号語を並べた符号化コードストリームを、その順番にデコードした際に生成されるデコード画像を図示したものである。このプログレッション構造の場合、以下の順番にパケットが並んでいる。すなわち、最上位階層が解像度レベル、その1つ下の階層がレイヤ、さらにその1つ下の階層がコンポーネント、最下位階層がポジションとなるように、符号語が並べられている。なお、以下においては、ポジション(P)についての説明は省略している。
for each r = 0, …, N(max)
for each l = 0, …, L-1
for each i = 0, …, Csiz-1
{ packet for component(i), resolution-level(r), layer(l) }
この場合、最上位階層が解像度レベルであるので、復号画像は、図13に示される画像191、画像192、画像193、画像194の順のように、徐々に画像サイズ(解像度)が大きくなるように表示される。
このように、プログレッションの各要素の階層構造に応じて、コードストリームの復号処理の順序が異なり、復号画像の表示のされ方も変化する。その他のRPCL、PCRL、およびCPRLについても同様に、それぞれの階層構造に応じた順序で復号処理が進められる。
[1−5レート制御]
次に、レート制御について説明する。図14は、レート制御の様子の例を説明する図である。まず、上述した(Case-1)の場合(Bit_HFR < Bit_LFR)について説明する。上述したように、この場合のBit_HFRとBit_LFRは、以下のとおりとする。
Bit_HFR=500Mbps/60P=8.33Mbits/pic
Bit_LFR=250Mbps/24P=10.42Mbits/pic
この場合、図2に示されるように、1秒間60ピクチャの中でLの24ピクチャをこのまま含めると、上述したようにHFRのビットレートが500Mbpsを超えてしまう。従ってLの24ピクチャも8.33Mbits/picに削減する必要がある。
図14において、CB0、CB1,・・・・・・・CBnはコードブロックの番号である。JPEG2000のEBCOT符号化を用いれば、上位MSBから下位LSBに至るビットプレーン毎に、符号量を制御することができる。
例えば、最上位ビットプレーンの(1)乃至(14)(図14中では、丸囲み数字で示す。以下同じ。)のビットプレーンの発生符号量が、上記のBit_LFRであるとする。また、(1)乃至(9)までのビットプレーンの発生符号量が、上記のBit_HFRであるとする。
この場合、レート制御部104は、(10)乃至(14)のビットプレーンの発生符号量を切り捨てることで、ビットレートをBit_LFRからBit_HFRに低減することができる。この様に、レート制御部104は、高いビットレートでエンコードされた符号化コードストリームを(デコード+再エンコード)することなく、コードストリームレベルでの操作によって変換することができる。
次に(Case-2)について説明する。上述したように、この場合のBit_HFRとBit_LFRは、以下のとおりとする。
Bit_HFR=500Mbps/60P=8.33Mb/pic
Bit_LFR=150Mbps/24P=6.25Mb/pic
この場合、Bit_LFR < Bit_HFRであるので、図14の(1)乃至(6)のビットプレーンの発生符号量がBit_LFRであるとすると、60Pの動画の内の24Pのピクチャの発生符号量が小さいため、HFRのビットレートが500Mbpsに達しない。従って、Lピクチャの符号化において、発生符号量を(1)乃至(9)の8.33Mbps(Bit_HFRと同値)に増加させるようにすればよい。これによって60Pのビットレートを維持することができる。
以上のように、本技術によれば、動画像信号を、低フレームレート用のビットレートと高フレームレートのビットレートを満たしながら同時並行的にエンコードを行い、低フレームレート用の符号化コードストリームと、高フレームレート用の符号化コードストリームを生成するので、高フレームレートのコードストリームの一部を抽出することで、低フレームレートのコードストリームを抽出する効果がある。
従って、従来の様に低フレームレートと高フレームレートのコードストリームを別々に記憶・保持しておく必要が無いので、ハードディスクやメモリ等の容量を削減する効果がある。その結果、ハード機器ではコストダウンの効果もある。
すなわち、画像符号化装置100は、1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
なお、以上においては、画像データを符号化して2つのフレームレートの符号化データを生成する場合について説明したが、フレームレート(符号化データ)の種類は任意であり、3つ以上であってもよい。例えば、1の画像データから3つ以上の互いに異なるフレームレートの符号化データが生成されるようにしてもよい。
[1−6処理の流れ]
次に、画像符号化装置100により実行される各処理について説明する。最初に、図15のフローチャートを参照して、複数FR符号化処理の流れの例を説明する。
複数FR符号化処理が開始されると、ビットレート決定部101は、ステップS101において、フレームレート(FR)毎に目標ビットレートを決定する。
ステップS102において、ピクチャ選択部102は、処理対象のピクチャがLFR用のピクチャであるか否かを判定する。LFR用のピクチャであると判定された場合、処理は、ステップS103に進む。
ステップS103において、LFR符号化部111は、LFRの方がHFRよりも目標ビットレートが高いか否かを判定する。LFRの方がHFRよりも目標ビットレートが高いと判定された場合、処理は、ステップS104に進む。
ステップS104において、LFR符号化部111は、処理対象にピクチャの画像データを、ステップS101において決定されたLFR用の目標ビットレートを用いて符号化する。この符号化処理の詳細については、後述する。
符号化が終了すると、ステップS105において、LFRレート制御部121は、ステップS104の処理により得られた処理対象のピクチャの符号化データをLFR符号化データとして出力する。
また、ステップS106において、HFRレート制御部122は、ステップS104の処理により得られた処理対象のピクチャの符号化データのビットレートを、HFR用の目標ビットレートに近づけるように制御する。
ステップS107において、コードストリーム統合部105は、ステップS106の処理によりビットレートが制御された処理対象のピクチャの符号化データを、HFR符号化データとして出力する。
ステップS107の処理が終了すると、処理は、ステップS114に進む。
また、ステップS103において、LFRの方がHFRよりも目標ビットレートが低いと判定された場合、処理は、ステップS108に進む。
ステップS108において、LFR符号化部111は、処理対象のピクチャの画像データを、ステップS101において決定されたHFR用の目標ビットレートを用いて符号化する。この符号化処理の詳細については、後述する。
ステップS109において、コードストリーム統合部105は、ステップS108の処理により得られた処理対象のピクチャの符号化データを、HFR符号化データとして出力する。
また、ステップS110において、LFRレート制御部121は、ステップS108の処理により得られた符号化データのビットレートを、LFR用の目標ビットレートに近づけるように制御する。
ステップS111において、LFRレート制御部121は、ステップS110においてビットレートが制御された処理対象のピクチャの符号化データを、LFR符号化データとして出力する。
ステップS111の処理が終了すると、処理は、ステップS114に進む。
また、ステップS102において、処理対象のピクチャがLFR用のピクチャでないと判定された場合、処理は、ステップS112に進む。
ステップS112において、HFR符号化部112は、処理対象のピクチャの画像データを、ステップS101において決定されたHFR用の目標ビットレートを用いて符号化する。この符号化処理の詳細については、後述する。
ステップS113において、コードストリーム統合部105は、ステップS112の処理により得られた処理対象のピクチャの符号化データを、HFR符号化データとして出力する。
ステップS113の処理が終了すると、処理は、ステップS114に進む。
ステップS114において、ピクチャ選択部102は、全てのピクチャを処理したか否かを判定する。未処理のピクチャが存在すると判定された場合、処理は、ステップS102に戻る。すなわち、ステップS102乃至ステップS114の各処理が、ピクチャ毎に行われる。
なお、ピクチャ毎に目標ビットレートを変える場合、このループ処理にステップS101を含めても良い。その場合、ステップS114において、未処理のピクチャが存在すると判定された場合、処理は、ステップS101に戻る。
ステップS114において、全てのピクチャを処理したと判定された場合、複数FR符号化処理が終了する。
次に、図16のフローチャートを参照して、図15のステップS104、ステップS108、およびステップS112において実行される符号化処理の流れの例を説明するフローチャートである。どのステップで実行する場合も、目標ビットレートが異なる以外は、基本的に同様の処理が実行される。
符号化処理が開始されると、ステップS131において、DCレベルシフト部131は、自身が対応する入力系統より入力された画像データのDCレベルをシフトする。ステップS132において、ウェーブレット変換部132は、DCレベルがシフトされた画像データをウェーブレット変換する。
ステップS133において、量子化部133は、非可逆符号化方式の場合、ステップS132において生成されたウェーブレット係数を量子化する。なお、可逆符号化方式の場合、この処理は省略される。
ステップS134において、コードブロック化部134は、量子化された係数をコードブロック単位で分割する。ステップS135において、ビットプレーン展開部135は、そのコードブロック毎の係数をビットプレーンに展開する。
ステップS136において、EBCOT部151は、ビットプレーン展開された係数を符号化する。ステップS137において、レート制御部139は、符号量加算部138において加算された符号量等を用いて、発生符号量のレートを、ビットレート決定部101により決定された目標ビットレートに近づけるように制御する。
ステップS138において、ヘッダ生成部140は、パケットヘッダを生成する。ステップS139において、パケット生成部141は、パケットを生成する。ステップS140において、符号化部103は、そのパケットを外部に出力する。
ステップS140の処理が終了すると、符号化処理が終了し、処理は、図15のステップS104、ステップS108、若しくはステップS112に戻る。
以上のように各処理を実行することにより、画像符号化装置100は、1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
<2.第2の実施の形態>
[2−1画像符号化装置]
なお、ピクチャ選択は、符号化の後であってもよい。図17は、画像符号化装置の、他の構成例を示すブロック図である。
図17に示される画像符号化装置200は、本技術を適用した画像処理装置であり、図1の画像符号化装置100と同様に、1の画像データから複数のフレームレートの符号化データを生成する装置である。
図17に示されるように、画像符号化装置200は、ビットレート決定部201、符号化部202、レート制御部203、および記憶部204を有する。
ビットレート決定部201は、図1のビットレート決定部101の場合と同様に、LFR用およびHFR用のそれぞれの目標ビットレートを決定する。ビットレート決定部201は、決定したこれらの目標ビットレートを示す制御情報を符号化部202およびレート制御部203に供給し、これらの動作を制御する。
符号化部202は、画像符号化装置200に入力される高フレームレートの画像データ(HFR画像データ)を、例えばJPEG2000方式で符号化する。符号化部202は、ビットレート決定部201により決定されたLFR用の目標ビットレート、および、HFR用の目標ビットレートの内、高い方のビットレートを用いて符号化を行う。符号化部202は、符号化して得られた高フレームレートの符号化データ(HFR符号化データ)を、レート制御部203に供給する。
レート制御部203は、符号化部202により生成されたHFR符号化データから、一部のフレームのデータを抽出し、低フレームレートの符号化データ(LFR符号化データ)を生成する。レート制御部203は、そのLFR符号化データのビットレートと、HFR符号化データのビットレートを、それぞれ、ビットレート決定部201により決定された目標ビットレートを用いて変換する。レート制御部203は、ビットレートを制御したLFR符号化データとHFR符号化データをそれぞれ画像符号化装置200の外部に出力するか、若しくは、記憶部204に供給し、記憶させる。一方を出力し、他方を記憶部204に記憶させても良い。
レート制御部203は、図17に示されるように、ピクチャ選択部211、LFRレート制御部212、およびHFRレート制御部213を有する。
ピクチャ選択部211は、符号化部202から供給されるHFR符号化データから、LFRに属するフレームのデータを検出し、抽出する。ピクチャ選択部211は、抽出したデータ(一部のフレームのデータ)を、LFR符号化データとしてLFRレート制御部212に供給する。
なお、それとともに、ピクチャ選択部211は、符号化部202から供給されたHFR符号化データ(全てのフレームのデータ)をHFRレート制御部213に供給する。
LFRレート制御部212は、ピクチャ選択部211から供給されるLFR符号化データのビットレートを、ビットレート決定部201により決定されたLFR用の目標ビットレートに近づけるように制御する。LFRレート制御部212は、ビットレートを制御したLFR符号化データを、画像符号化装置200の外部に出力するか、若しくは、記憶部204に供給し、記憶させる。
なお、符号化部202においてLFR用の目標ビットレートを用いて符号化が行われた場合、このLFRレート制御部212は、省略することができる。その場合、ピクチャ選択部211から出力されたLFR符号化データは、画像符号化装置200の外部に出力されるか、若しくは、記憶部204に供給し、記憶される。
HFRレート制御部213は、ピクチャ選択部211から供給されるHFR符号化データのビットレートを、ビットレート決定部201により決定されたHFR用の目標ビットレートに近づけるように制御する。HFRレート制御部213は、ビットレートを制御したHFR符号化データを、画像符号化装置200の外部に出力するか、若しくは、記憶部204に供給し、記憶させる。
なお、符号化部202においてHFR用の目標ビットレートを用いて符号化が行われた場合、このHFRレート制御部213は、省略することができる。その場合、ピクチャ選択部211から出力されたHFR符号化データは、画像符号化装置200の外部に出力されるか、若しくは、記憶部204に供給し、記憶される。
記憶部204は、記憶部106と同様の記憶部であり、LFRレート制御部212から供給されるLFR符号化データや、HFRレート制御部213から供給されるHFR符号化データを記憶することができる。記憶部204が、これらの符号化データの内、いずれか一方のみを記憶するようにしてもよいし、両方を記憶するようにしてもよい。例えば、HFR符号化データからLFR符号化データを生成することができる場合、HFR符号化データのみ記憶部204に記憶されるようにしてもよい。
また、LFR符号化データやHFR符号化データを記憶する必要が無い場合、この記憶部204を省略するようにしてもよい。
このように、ピクチャの選択を符号化処理より後段で行うようにすることにより、画像符号化装置200は、画像符号化装置100の場合と同様に、1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
また、図17に示されるように、画像符号化装置200の方が、画像符号化装置100よりも、処理部の構造を簡易化することができる。これにより、ハードウエアにより画像符号化装置の各処理部を実現する場合、回路規模や製造コストの増大を抑制することができる。また、画像符号化装置をソフトウエアにより実現する場合、各処理が容易になる。さらに、この符号化やレート制御による遅延時間の増大を抑制することができる。
[2−2処理の流れ]
次に、画像符号化装置200により実行される処理の流れについて説明する。図18のフローチャートを参照して、画像符号化装置200による複数FR符号化処理の流れの例を説明する。
複数FR符号化処理が開始されると、ビットレート決定部201は、ステップS201において、フレームレート(FR)毎に目標ビットレートを決定する。
ステップS202において、符号化部202は、LFRの方がHFRよりも目標ビットレートが高いか否かを判定する。LFRの方がHFRよりも目標ビットレートが高いと判定された場合、処理は、ステップS203に進む。
ステップS203において、符号化部202は、処理対象のピクチャの画像データを、ステップS201において決定されたLFR用の目標ビットレートを用いて、図16のフローチャートを参照して説明したように、符号化する。
ステップS204において、ピクチャ選択部211は、処理対象のピクチャがLFRに属するピクチャであるか否かを判定する。LFRに属するピクチャであると判定された場合、処理は、ステップS205に進む。
ステップS205において、LFRレート制御部212は、処理対象のピクチャの符号化データをLFR符号化データとして出力する。
ステップS206において、HFRレート制御部213は、処理対象のピクチャの符号化データのビットレートを、ステップS201において決定されたHFR用の目標ビットレートに近づけるように制御する。
ステップS207において、HFRレート制御部213は、ステップS206の処理によりビットレートが制御された処理対象のピクチャの符号化データを、HFR符号化データとして出力する。
ステップS207の処理が終了すると、処理はステップS217に進む。
また、ステップS204において、処理対象のピクチャがLFRに属さないピクチャであると判定された場合、処理は、ステップS208に進む。
ステップS208において、HFRレート制御部213は、処理対象のピクチャの符号化データのビットレートを、ステップS201において決定されたHFR用の目標ビットレートに近づけるように制御する。
ステップS209において、HFRレート制御部213は、ステップS208の処理によりビットレートが制御された処理対象のピクチャの符号化データを、HFR符号化データとして出力する。
ステップS209の処理が終了すると、処理はステップS217に進む。
また、ステップS202において、LFRの方がHFRよりも目標ビットレートが低いと判定された場合、処理は、ステップS210に進む。
ステップS210において、符号化部202は、処理対象のピクチャの画像データを、ステップS201において決定されたHFR用の目標ビットレートを用いて、図16のフローチャートを参照して説明したように、符号化する。
ステップS211において、ピクチャ選択部211は、処理対象のピクチャがLFRに属するピクチャであるか否かを判定する。LFRに属するピクチャであると判定された場合、処理は、ステップS212に進む。
ステップS212において、LFRレート制御部212は、処理対象のピクチャの符号化データのビットレートを、ステップS201において決定されたLFR用の目標ビットレートに近づけるように制御する。
ステップS213において、LFRレート制御部212は、ステップS212の処理によりビットレートが制御された処理対象のピクチャの符号化データを、LFR符号化データとして出力する。
ステップS213の処理が終了すると、処理はステップS217に進む。
また、ステップS211において、処理対象のピクチャがLFRに属さないピクチャであ4ると判定された場合、処理は、ステップS214に進む。
ステップS214において、HFRレート制御部213は、処理対象のピクチャの符号化データをHFR符号化データとして出力する。
ステップS215において、LFRレート制御部212は、処理対象のピクチャの符号化データのビットレートを、ステップS201において決定されたLFR用の目標ビットレートに近づけるように制御する。
ステップS216において、LFRレート制御部212は、ステップS215の処理によりビットレートが制御された処理対象のピクチャの符号化データを、LFR符号化データとして出力する。
ステップS216の処理が終了すると、処理はステップS217に進む。
ステップS217において、ピクチャ選択部102は、全てのピクチャを処理したか否かを判定する。未処理のピクチャが存在すると判定された場合、処理は、ステップS202に戻る。すなわち、ステップS202乃至ステップS216の各処理(分岐で選択されたなかった一部の処理を除く)が、ピクチャ毎に行われる。
なお、ピクチャ毎に目標ビットレートを変える場合、このループ処理にステップS201を含めても良い。その場合、ステップS217において、未処理のピクチャが存在すると判定された場合、処理は、ステップS201に戻る。
ステップS217において、全てのピクチャを処理したと判定された場合、複数FR符号化処理が終了する。
以上のように各処理を実行することにより、画像符号化装置200は、1の動画像データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
<3.第3の実施の形態>
[3−1画像復号装置]
なお、第2の実施の形態において説明したようなレート制御は、符号化データに対してであれば、どの段階でも行うことができる。つまり、例えば、画像復号装置において復号する前の符号化データに対して同様のレート制御を行うこともできる。以下、その場合について説明する。
図19は、画像復号装置の主な構成例を示すブロック図である。図19に示される画像復号装置300は、本技術を適用した画像処理装置であり、1の符号化データから複数のフレームレートの符号化データを生成し、さらにそれらを復号する装置である。
画像復号装置300に入力される符号化データや、記憶部301に記憶されている符号化データは、所定のビットレートである高ビットフレーム(HFR)の画像データが符号化された符号化データ(HFR符号化データ)である。画像復号装置300は、そのHFR符号化データを復号し、HFRの画像データ(HFR画像データ)と、HFRよりもビットレートが低い所定のビットレートである低ビットフレーム(LFR)の画像データ(LFR)画像データを生成し、出力する。
その際、画像復号装置300は、HFR符号化データのビットレートを、HFR用の目標ビットレートに近づけるように制御するとともに、LFR符号化データのビットレートを、LFR用の目標ビットレートに近づけるように制御する。これにより、画像復号装置300は、複数の、所望のビットレートの、所望のフレームレートの画像データを得ることができる。
なお、以下において、図2を参照して説明した場合と同様に、LFRに属するフレームは、全てHFRに属するものとする。また、画像復号装置300に入力される符号化データは、画像符号化装置100や画像符号化装置200が行う符号化方式(例えばJPEG2000方式)により符号化されているものとする。
図19に示されるように、画像復号装置300は、記憶部301、ビットレート決定部302、レート制御部303、および復号部304を有する。
記憶部301は、画像データが符号化された符号化データを記憶し、所定のタイミング、若しくは、要求に基づいて、記憶している符号化データをビットレート決定部302やレート制御部303に供給する。記憶部301は、画像復号装置300に入力された符号化データを記憶してもよいし、予め符号化データを記憶していても良い。
ビットレート決定部302は、画像復号装置300に入力された符号化データ、若しくは、記憶部301から読み出した符号化データを取得し、その符号化データについて、HFR用のビットレートと、LFR用のビットレートを、それぞれ決定する。
ビットレート決定部302は、決定したビットレートを示す制御情報をレート制御部303に供給し、その動作を制御する。
レート制御部303は、供給されるHFR符号化データからLFR符号化データを生成し、そのHFR符号化データのビットレートを、ビットレート決定部302により決定されたHFR用の目標ビットレートに近づけるように制御するとともに、生成したLFR符号化データのビットレートを、ビットレート決定部302により決定されたLFR用の目標ビットレートに近づけるように制御する。
図19に示されるように、レート制御部303は、ピクチャ選択部311、LFRレート制御部312、および、HFRレート制御部313を有する。
ピクチャ選択部311は、供給されたHFR符号化データから、LFRに属するフレームのデータを検出し、抽出する。ピクチャ選択部311は、抽出したデータ(一部のフレームのデータ)を、LFR符号化データとしてLFRレート制御部312に供給する。
なお、それとともに、ピクチャ選択部311は、供給されたHFR符号化データ(全てのフレームのデータ)をHFRレート制御部313に供給する。
LFRレート制御部312は、ピクチャ選択部311から供給されるLFR符号化データのビットレートを、ビットレート決定部302により決定されたLFR用の目標ビットレートに近づけるように制御する。LFRレート制御部312は、ビットレートを制御したLFR符号化データを、復号部304に供給する。
HFRレート制御部313は、ピクチャ選択部311から供給されるHFR符号化データのビットレートを、ビットレート決定部302により決定されたHFR用の目標ビットレートに近づけるように制御する。HFRレート制御部313は、ビットレートを制御したHFR符号化データを、復号部304に供給する。
復号部304は、レート制御部303(LFRレート制御部312およびHFRレート制御部313)から供給される符号化データ(LFR符号化データおよびHFR符号化データ)を復号する。
図19に示されるように、復号部304は、LFR復号部321およびHFR復号部322を有する。
LFR復号部321は、LFRレート制御部312から供給されるLFR符号化データを、その符号化方式に対応する方法で復号する。例えば、LFR復号部321は、JPEG2000方式により符号化されているLFR符号化データを、そのJPEG2000方式により復号し、画像データを生成する。LFR復号部321は、生成した画像データ(LFR画像データ)を画像復号装置300の外部に出力する。なお、LFR復号部321は、この画像データを記憶部301に記憶させても良い。
HFR復号部322は、HFRレート制御部313から供給されるHFR符号化データを、その符号化方式に対応する方法で復号する。例えば、HFR復号部322は、JPEG2000方式により符号化されているHFR符号化データを、そのJPEG2000方式により復号し、画像データを生成する。HFR復号部322は、生成した画像データ(HFR画像データ)を画像復号装置300の外部に出力する。なお、HFR復号部322は、この画像データを記憶部301に記憶させても良い。
[3−2復号部]
次に、図19の復号部304(LFR復号部321およびHFR復号部322)について説明する。
図20は、LFR復号部321の主な構成例を示す図である。なお、HFR復号部322は、符号化するフレームや目標ビットレートが異なる場合があるのみで、基本的には、LFR復号部321と同様の構成を有し、同様の処理を行う。したがって、以下においては、LFR復号部321の構成を説明し、そのLFR復号部321の説明をHFR復号部322にも適用することができるものとし、HFR復号部322についての説明を省略する。
図20に示されるように、LFR復号部321は、パケット解読部351、算術復号部352、ビットモデリング部353、ビットプレーン合成部354、コードブロック合成部355、ウェーブレット逆変換部356、およびDCレベル逆シフト部357を有する。
パケット解読部351は、矢印361に示されるように、外部から供給される、若しくは、記憶部301から読み出されるパケットを解読し、矢印362に示されるように、コードストリームを算術復号部352に供給する。
算術復号部352およびビットモデリング部353は、EBCOT部371として動作し、入力されるコードストリームに対して、例えばJPEG2000規格等で定められたEBCOTと呼ばれるエントロピ復号を行う。
算術復号部352は、算術符号化部137に対応する方法でコードストリームを復号し、矢印363に示されるように、コンテキストをビットモデリング部353に供給する。ビットモデリング部353は、ビットモデリング部136に対応する方法で、ビットプレーンに展開されたウェーブレット係数を生成する。ビットモデリング部353は、生成したビットプレーン毎の係数データを、矢印364に示されるように、ビットプレーン合成部354に供給する。
ビットプレーン合成部354は、ビットプレーンに展開されたウェーブレット係数を合成する。ビットプレーン合成部354は、ビットプレーンを合成したウェーブレット係数を、矢印365に示されるように、コードブロック合成部355に供給する。
コードブロック合成部355は、供給されたビットプレーンを用いてコードブロック単位の係数データを生成し、さらにそれらを合成し、サブバンド毎の係数データを生成する。コードブロック合成部355は、矢印366に示されるように、それをウェーブレット逆変換部356に供給する。
ウェーブレット逆変換部356は、供給されたウェーブレット係数をウェーブレット逆変換し、ベースバンドの画像データを生成する。ウェーブレット逆変換部356は、生成したベースバンドの画像データを、矢印367に示されるように、DCレベル逆シフト部357に供給する。
DCレベル逆シフト部357は、その画像データのDC成分に対して、DCレベルシフト部131においてシフトした分を元に戻すDCレベル逆シフト処理を必要に応じて行う。DCレベル逆シフト部357は、DCレベル逆シフト処理後の画像データ(復号画像データ)を、矢印368に示されるように、画像復号装置300の外部に出力する。
以上のように符号化データを復号することにより、画像復号装置300は、1の符号化データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
[3−3処理の流れ]
次に、画像復号装置300により実行される各種処理の流れについて説明する。まず、図21のフローチャートを参照して、複数FR復号処理の流れの例を説明する。
複数FR復号処理が開始されると、ビットレート決定部302は、ステップS301において、例えば、供給されるHFR符号化データのヘッダ情報やユーザ指示等に基づいて、フレームレート(FR)毎に目標ビットレートを決定する。
ステップS302において、ピクチャ選択部311は、LFRの方がHFRよりも目標ビットレートが高いか否かを判定する。LFRの方がHFRよりも目標ビットレートが高いと判定された場合、処理は、ステップS303に進む。
ステップS303において、ピクチャ選択部311は、処理対象のピクチャがLFRに属するピクチャであるか否かを判定する。LFRに属するピクチャであると判定された場合、処理は、ステップS304に進む。
ステップS304において、LFR復号部321は、処理対象のピクチャの符号化データを復号する。この復号処理の詳細は、後述する。LFR復号部321は、このように得られたLFR画像データを出力する。
ステップS305において、HFRレート制御部313は、処理対象のピクチャの符号化データを、ステップS301において決定されたHFR用の目標ビットレートに近づけるように制御する。
ステップS306において、HFR復号部322は、処理対象のピクチャの符号化データを復号する。この復号処理の詳細は、後述する。HFR復号部322は、このように得られたHFR画像データを出力する。
ステップS306の処理が終了すると、処理は、ステップS314に進む。
また、ステップS303において、処理対象のピクチャがLFRに属さないピクチャであると判定された場合、処理は、ステップS307に進む。
ステップS307において、HFRレート制御部313は、処理対象のピクチャの符号化データを、ステップS301において決定されたHFR用の目標ビットレートに近づけるように制御する。
ステップS308において、HFR復号部322は、処理対象のピクチャの符号化データを復号する。この復号処理の詳細は、後述する。HFR復号部322は、このように得られたHFR画像データを出力する。
また、ステップS302において、LFRの方がHFRよりも目標ビットレートが低いと判定された場合、処理は、ステップS309に進む。
ステップS309において、ピクチャ選択部311は、処理対象のピクチャがLFRに属するピクチャであるか否かを判定する。LFRに属するピクチャであると判定された場合、処理は、ステップS310に進む。
ステップS310において、HFR復号部322は、処理対象のピクチャの符号化データを復号する。この復号処理の詳細は、後述する。HFR復号部322は、このように得られたHFR画像データを出力する。
ステップS311において、LFRレート制御部312は、処理対象のピクチャの符号化データを、ステップS301において決定されたLFR用の目標ビットレートに近づけるように制御する。
ステップS312において、LFR復号部321は、処理対象のピクチャの符号化データを復号する。この復号処理の詳細は、後述する。LFR復号部321は、このように得られたLFR画像データを出力する。
ステップS312の処理が終了すると、処理は、ステップS314に進む。
また、ステップS309において、処理対象のピクチャがLFRに属さないピクチャであると判定された場合、処理は、ステップS313に進む。
ステップS313において、HFR復号部322は、処理対象のピクチャの符号化データを復号する。この復号処理の詳細は、後述する。HFR復号部322は、このように得られたHFR画像データを出力する。
次に、図21のステップS304、ステップS308、ステップS310、ステップS312、若しくはステップS313において実行される復号処理の詳細な流れの例を、図22のフローチャートを参照して説明する。
復号処理が開始されると、パケット解読部351は、ステップS331において、取得されたパケットから符号化データを抽出する。
ステップS332において、EBCOT部371は、ステップS331において抽出された符号化データを復号する。ステップS333において、ビットプレーン合成部354は、その復号により得られた係数データのビットプレーンを合成し、コードブロック毎の係数データを生成する。ステップS334において、コードブロック合成部355は、そのコードブロック毎の係数データのコードブロックを合成し、サブバンド毎の係数データを生成する。
ステップS335において、ウェーブレット逆変換部356は、そのサブバンド毎の係数データをウェーブレット逆変換し、ベースバンドの画像データを生成する。なお、係数データが量子化されている場合、係数データに対して、その量子化に対応する逆量子化を行ってからウェーブレット逆変換を行う。
ステップS336において、DCレベル逆シフト部337は、そのウェーブレット逆変換により得られたベースバンドの画像データのDCレベルを逆シフトする。
ステップS337において、DCレベル逆シフト部337は、DCレベル逆シフト処理が施された画像データを復号画像データとして出力する。例えば、この復号画像データが例えば図示せぬディスプレイに出力され、その画像が表示される。
ステップS337の処理が終了すると、復号処理が終了し、処理は、図21のステップS304、ステップS308、ステップS310、ステップS312、若しくはステップS313に戻る。
以上のように各処理を実行することにより、画像復号装置300は、1の符号化データから複数種類のフレームレートの符号化データを、より容易に生成することができる。
<4.第4の実施の形態>
[4−1レイヤ制御]
なお、本技術は、図12で図示したレイヤを用いて、ビットレートの制御をより容易に行うようにすることができる。
例えば、第1の実施の形態の(Case-1)において、各レイヤのビットレートを以下のように設定する。
レイヤ1乃至レイヤM : Bit_HFR(8.33Mbits/pic)
レイヤ1乃至レイヤL : Bit_LFR(10.42Mbits/pic)
つまり、以上のようなビットレートとなるように、符号化の際にレイヤを設定する。このようにすることにより、レート制御の際、低ビットレートに削減するときは、レイヤM乃至レイヤLまでに存在するレイヤを切り捨てる操作を行えばよい。(Case-2)の場合も同様に考えれば良い。
[4−2情報伝送]
JPEG2000符号化コードストリーム中に、LFR及びHFRのピクチャを識別するためのフラグを定義するようにしてもよい。この場合、JPEG2000のピクチャヘッダ内の、マーカセグメントの未使用ビットを用いるのが適当である。例えば、図23はCODマーカセグメントの例を示し、図24はCODマーカ内のScodパラメータの例を示す。
図24に示される表において、上から2行目乃至7行目のパラメータは既にJPEG2000 Part1で定義済みのパラメータであるので、これらのビットを使うことはできない。そこで、図24の表において斜線で示される部分のように、以下の様に定義してLFRとHFRのピクチャを識別することができるようにする。
xxxx 0xxx High frame rate used
xxxx 1xxx Low frame rate used
また、これ以外でもピクチャヘッダ内の空きビットを用いれば、同様の効果を得ることは言うまでもない。
なお、本技術は、デジタルシネマの用途等で、従来の低フレームレート(LFR:例えば24P)に加えて高フレームレート(HFR:例えば48P、60Pなど)で、動画像信号を同時にエンコードする装置、例えば、デジタルシネマ用エンコーダ装置、デジタルシネマ用編集装置、アーカイブシステム、放送局の画像伝送装置、画像データベース、医用画像の記録システム、ゲーム機、テレビ受像機システム、Blu Ray Discレコーダ・プレイヤ、自由視点テレビ、臨場感TV会議システム、PC上のオーサリング・ツールまたはそのソフトウェア・モジュール等に適用することができる。
<5.第5の実施の形態>
[コンピュータ]
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図25は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図25に示されるコンピュータ400において、CPU(Central Processing Unit)401、ROM(Read Only Memory)402、RAM(Random Access Memory)403は、バス404を介して相互に接続されている。
バス404にはまた、入出力インタフェース410も接続されている。入出力インタフェース410には、入力部411、出力部412、記憶部413、通信部414、およびドライブ415が接続されている。
入力部411は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部412は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部413は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部414は、例えば、ネットワークインタフェースよりなる。ドライブ415は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア421を駆動する。
以上のように構成されるコンピュータでは、CPU401が、例えば、記憶部413に記憶されているプログラムを、入出力インタフェース410およびバス404を介して、RAM403にロードして実行することにより、上述した一連の処理が行われる。RAM403にはまた、CPU401が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ(CPU401)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア421に記録して適用することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア421をドライブ415に装着することにより、入出力インタフェース410を介して、記憶部413にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部414で受信し、記憶部413にインストールすることができる。その他、プログラムは、ROM402や記憶部413に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
なお、本技術は以下のような構成も取ることができる。
(1) 画像データの一部のフレームを符号化して、第1の符号化データを生成する第1の符号化部と、
前記第1の符号化部が生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、
前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成する第2の符号化部と、
前記レート制御部により生成された前記第2の符号化データと、前記第2の符号化部により生成された前記第3の符号化データとを統合し、高フレームレート符号化データを生成する統合部と
を備える画像処理装置。
(2) 前記ビットレートは、1フレーム当たりのビット量である
前記(1)に記載の画像処理装置。
(3) 前記レート制御部は、各フレームについて、前記第1の符号化データの一部を必要に応じて切り捨てることにより、前記1フレーム当たりのビット量を制御する
前記(2)に記載の画像処理装置。
(4) 前記レート制御部は、各フレームについて、前記第1の符号化データの一部を、より重要でない方から順に必要量分切り捨てる
前記(3)に記載の画像処理装置。
(5) 前記第1の符号化部は、
前記一部のフレームの画像データを、周波数帯域毎の係数データに変換する変換部と、
前記変換部により得られた前記係数データを、所定数の前記係数データ毎に生成される、互いに同一のビット位置の値の集合であるビットプレーン毎に符号化するビットプレーン符号化部と
を備え、
前記レート制御部は、前記第1の符号化データのビットプレーンを、最下位から順に必要数分切り捨てる
前記(4)に記載の画像処理装置。
(6) 前記第1の符号化部は、
前記変換部により得られた前記係数データを所定数毎にまとめたコードブロックを生成するコードブロック生成部と、
前記コードブロック生成部により生成された前記コードブロック毎に、前記ビットプレーンを生成するビットプレーン生成部と
をさらに備え、
前記ビットプレーン符号化部は、前記ビットプレーン生成部により生成された、前記コードブロック毎のビットプレーンを、最下位から順に必要数分切り捨てる
前記(5)に記載の画像処理装置。
(7) 前記第2の符号化部は、前記第1の符号化部と同様の符号化方式により前記画像データを符号化する
前記(6)に記載の画像処理装置。
(8) 前記第1の符号化部および前記第2の符号化部は、それぞれ、前記画像データのフレームをJPEG2000方式により符号化する
前記(7)に記載の画像処理装置。
(9) 前記第1の符号化部は、前記第1のビットレートおよび前記第2のビットレートに応じて符号化パスのレイヤを設定し、
前記レート制御部は、前記レイヤを必要数分切り捨てることにより、前記第1の符号化データのビットレートを制御し、前記低フレームレート符号化データおよび前記第2の符号化データを生成する
前記(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 予め設定されたフレームレートに応じて、前記画像データの一部のフレームを前記第1の符号化部に分配し、その他のフレームを前記第2の符号化部に分配するフレーム分配部をさらに備える
前記(1)乃至(9)のいずれかに記載の画像処理装置。
(11) 前記フレーム分配部は、前記第1の符号化部に分配するフレーム、若しくは、前記第2の符号化部に分配するフレームの内、少なくともいずれか一方に、分配先毎のグループを識別する識別情報を付加する
前記(10)に記載の画像処理装置。
(12) 前記レート制御部により生成された前記低フレームレート符号化データを記憶する記憶部をさらに備える
前記(1)乃至(11)のいずれかに記載の画像処理装置。
(13) 画像処理装置の画像処理方法において、
前記画像処理装置が、
画像データの一部のフレームを符号化して、第1の符号化データを生成し、
生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成し、
前記画像データの他のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成し、
生成された前記第2の符号化データと前記第3の符号化データとを統合し、高フレームレート符号化データを生成する
画像処理方法。
(14) コンピュータを、
画像データの一部のフレームを符号化して、第1の符号化データを生成する第1の符号化部と、
前記第1の符号化部が生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、
前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成する第2の符号化部と、
前記レート制御部により生成された前記第2の符号化データと、前記第2の符号化部により生成された前記第3の符号化データとを統合し、高フレームレート符号化データを生成する統合部と
して機能させるためのプログラム。
(15) 画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成する選択部と、
前記選択部により生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにするレート制御部と
を備える画像処理装置。
(16) 前記目標ビットレートを決定する決定部をさらに備え、
前記レート制御部は、各フレームレートの符号化データのビットレートを、前記決定部により決定された目標ビットレートにする
前記(15)に記載の画像処理装置。
(17) 前記画像データを符号化し、前記符号化データを生成する符号化部をさらに備え、
前記選択部は、前記符号化部により生成された前記符号化データから複数のフレームレートの符号化データを生成する
前記(15)または(16)に記載の画像処理装置。
(18) レート制御部によりそれぞれの目標ビットレートに制御された各フレームレートの符号化データを復号する復号部をさらに備える
前記(15)乃至(17)のいずれかに記載の画像処理装置。
(19) 画像処理装置の画像処理方法において、
前記画像処理装置が
画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成し、
生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにする
画像処理方法。
(20) コンピュータを、
画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成する選択部と、
前記選択部により生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにするレート制御部と
して機能させるためのプログラム。
100 画像符号化装置, 101 ビットレート決定部, 102 ピクチャ選択部, 103 符号化部, 104 レート制御部, 105 コードストリーム統合部, 106 記憶部, 111 LFR符号化部, 112 HFR符号化部, 121 LFRレート制御部, 122 HFRレート制御部, 131 DCレベルシフト部, 132 ウェーブレット変換部, 133 量子化部, 134 コードブロック化部, 135 ビットプレーン展開部, 136 ビットモデリング部, 137 算術符号化部, 138 符号量加算部, 139 レート制御部, 140 ヘッダ生成部, 141 パケット生成部, 151 EBCOT部, 200 画像符号化装置, 201 ビットレート制御部, 202 符号化部, 203 レート制御部, 204 記憶部, 211 ピクチャ選択部, 212 LFRレート制御部, 213 HFRレート制御部, 300 画像復号装置, 301 記憶部, 302 ビットレート決定部, 303 レート制御部, 304 復号部, 311 ピクチャ選択部, 312 LFRレート制御部, 313 HFRレート制御部, 321 LFR復号部, 322 HFR復号部, 351 パケット解読部, 352 算術復号部, 353 ビットモデリング部, 354 ビットプレーン合成部, 355 コードブロック合成部, 356 ウェーブレット逆変換部, 357 DCレベル逆シフト部, 371 EBCOT部

Claims (20)

  1. 画像データの一部のフレームを符号化して、第1の符号化データを生成する第1の符号化部と、
    前記第1の符号化部が生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、
    前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成する第2の符号化部と、
    前記レート制御部により生成された前記第2の符号化データと、前記第2の符号化部により生成された前記第3の符号化データとを統合し、高フレームレート符号化データを生成する統合部と
    を備える画像処理装置。
  2. 前記ビットレートは、1フレーム当たりのビット量である
    請求項1に記載の画像処理装置。
  3. 前記レート制御部は、各フレームについて、前記第1の符号化データの一部を必要に応じて切り捨てることにより、前記1フレーム当たりのビット量を制御する
    請求項2に記載の画像処理装置。
  4. 前記レート制御部は、各フレームについて、前記第1の符号化データの一部を、より重要でない方から順に必要量分切り捨てる
    請求項3に記載の画像処理装置。
  5. 前記第1の符号化部は、
    前記一部のフレームの画像データを、周波数帯域毎の係数データに変換する変換部と、
    前記変換部により得られた前記係数データを、所定数の前記係数データ毎に生成される、互いに同一のビット位置の値の集合であるビットプレーン毎に符号化するビットプレーン符号化部と
    を備え、
    前記レート制御部は、前記第1の符号化データのビットプレーンを、最下位から順に必要数分切り捨てる
    請求項4に記載の画像処理装置。
  6. 前記第1の符号化部は、
    前記変換部により得られた前記係数データを所定数毎にまとめたコードブロックを生成するコードブロック生成部と、
    前記コードブロック生成部により生成された前記コードブロック毎に、前記ビットプレーンを生成するビットプレーン生成部と
    をさらに備え、
    前記ビットプレーン符号化部は、前記ビットプレーン生成部により生成された、前記コードブロック毎のビットプレーンを、最下位から順に必要数分切り捨てる
    請求項5に記載の画像処理装置。
  7. 前記第2の符号化部は、前記第1の符号化部と同様の符号化方式により前記画像データを符号化する
    請求項6に記載の画像処理装置。
  8. 前記第1の符号化部および前記第2の符号化部は、それぞれ、前記画像データのフレームをJPEG2000方式により符号化する
    請求項7に記載の画像処理装置。
  9. 前記第1の符号化部は、前記第1のビットレートおよび前記第2のビットレートに応じて符号化パスのレイヤを設定し、
    前記レート制御部は、前記レイヤを必要数分切り捨てることにより、前記第1の符号化データのビットレートを制御し、前記低フレームレート符号化データおよび前記第2の符号化データを生成する
    請求項1に記載の画像処理装置。
  10. 予め設定されたフレームレートに応じて、前記画像データの一部のフレームを前記第1の符号化部に分配し、その他のフレームを前記第2の符号化部に分配するフレーム分配部をさらに備える
    請求項1に記載の画像処理装置。
  11. 前記フレーム分配部は、前記第1の符号化部に分配するフレーム、若しくは、前記第2の符号化部に分配するフレームの内、少なくともいずれか一方に、分配先毎のグループを識別する識別情報を付加する
    請求項10に記載の画像処理装置。
  12. 前記レート制御部により生成された前記低フレームレート符号化データを記憶する記憶部をさらに備える
    請求項1に記載の画像処理装置。
  13. 画像処理装置の画像処理方法において、
    前記画像処理装置が、
    画像データの一部のフレームを符号化して、第1の符号化データを生成し、
    生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成し、
    前記画像データの他のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成し、
    生成された前記第2の符号化データと前記第3の符号化データとを統合し、高フレームレート符号化データを生成する
    画像処理方法。
  14. コンピュータを、
    画像データの一部のフレームを符号化して、第1の符号化データを生成する第1の符号化部と、
    前記第1の符号化部が生成した前記第1の符号化データのビットレートを制御し、第1のビットレートの低フレームレート符号化データと、前記第1のビットレートと異なる第2のビットレートの第2の符号化データとを生成するレート制御部と、
    前記画像データの、前記第1の符号化部が符号化するフレーム以外のフレームを符号化して、前記第2のビットレートの第3の符号化データを生成する第2の符号化部と、
    前記レート制御部により生成された前記第2の符号化データと、前記第2の符号化部により生成された前記第3の符号化データとを統合し、高フレームレート符号化データを生成する統合部と
    して機能させるためのプログラム。
  15. 画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成する選択部と、
    前記選択部により生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにするレート制御部と
    を備える画像処理装置。
  16. 前記目標ビットレートを決定する決定部をさらに備え、
    前記レート制御部は、各フレームレートの符号化データのビットレートを、前記決定部により決定された目標ビットレートにする
    請求項15に記載の画像処理装置。
  17. 前記画像データを符号化し、前記符号化データを生成する符号化部をさらに備え、
    前記選択部は、前記符号化部により生成された前記符号化データから複数のフレームレートの符号化データを生成する
    請求項15に記載の画像処理装置。
  18. レート制御部によりそれぞれの目標ビットレートに制御された各フレームレートの符号化データを復号する復号部をさらに備える
    請求項15に記載の画像処理装置。
  19. 画像処理装置の画像処理方法において、
    前記画像処理装置が
    画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成し、
    生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにする
    画像処理方法。
  20. コンピュータを、
    画像データが符号化された符号化データから、フレームレートに応じた割合でフレーム毎にデータを選択することにより、複数のフレームレートの符号化データを生成する選択部と、
    前記選択部により生成された各フレームレートの符号化データのビットレートを、それぞれの目標ビットレートにするレート制御部と
    して機能させるためのプログラム。
JP2012114679A 2012-05-18 2012-05-18 画像処理装置および方法、並びに、プログラム Expired - Fee Related JP5950157B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012114679A JP5950157B2 (ja) 2012-05-18 2012-05-18 画像処理装置および方法、並びに、プログラム
CN2013101696190A CN103426189A (zh) 2012-05-18 2013-05-09 图像处理设备、图像处理方法及程序
US13/891,367 US20130308697A1 (en) 2012-05-18 2013-05-10 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012114679A JP5950157B2 (ja) 2012-05-18 2012-05-18 画像処理装置および方法、並びに、プログラム

Publications (3)

Publication Number Publication Date
JP2013243477A true JP2013243477A (ja) 2013-12-05
JP2013243477A5 JP2013243477A5 (ja) 2015-04-09
JP5950157B2 JP5950157B2 (ja) 2016-07-13

Family

ID=49581291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012114679A Expired - Fee Related JP5950157B2 (ja) 2012-05-18 2012-05-18 画像処理装置および方法、並びに、プログラム

Country Status (3)

Country Link
US (1) US20130308697A1 (ja)
JP (1) JP5950157B2 (ja)
CN (1) CN103426189A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3055993B1 (en) 2013-10-10 2020-03-18 Dolby Laboratories Licensing Corp. Displaying dci and other content on an enhanced dynamic range projector
US9598011B2 (en) 2014-01-09 2017-03-21 Northrop Grumman Systems Corporation Artificial vision system
EP3041233A1 (en) * 2014-12-31 2016-07-06 Thomson Licensing High frame rate-low frame rate transmission technique
JP2016163131A (ja) * 2015-02-27 2016-09-05 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および画像データ配信方法
EP3884662A4 (en) * 2018-12-25 2021-12-08 Zhejiang Dahua Technology Co., Ltd. IMAGE PROCESSING SYSTEMS AND METHODS
CN115633176B (zh) * 2022-12-08 2023-03-21 北京蔚领时代科技有限公司 动态调整画面群组长度的方法、装置和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165098A (ja) * 2000-11-27 2002-06-07 Sony Corp 画像符号化装置及び画像符号化方法
JP2004166254A (ja) * 2002-10-25 2004-06-10 Sony Corp 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP2005064897A (ja) * 2003-08-13 2005-03-10 Kddi Corp 動画像圧縮符号化装置
JP2005110185A (ja) * 2003-09-08 2005-04-21 Sony Corp 画像符号化装置及び方法
JP2005143105A (ja) * 2003-10-31 2005-06-02 Canon Inc デジタルビデオ圧縮
JP2005236895A (ja) * 2004-02-23 2005-09-02 Sony Corp 画像符号化装置及び方法、並びに画像復号装置及び方法
JP2009200645A (ja) * 2008-02-19 2009-09-03 Ricoh Co Ltd 画像伝送装置
JP2011239066A (ja) * 2010-05-07 2011-11-24 Sony Corp 画像処理装置および方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6181821B1 (en) * 1997-04-30 2001-01-30 Massachusetts Institute Of Technology Predictive source encoding and multiplexing
US6023296A (en) * 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system
US6690833B1 (en) * 1997-07-14 2004-02-10 Sarnoff Corporation Apparatus and method for macroblock based rate control in a coding system
US6100940A (en) * 1998-01-21 2000-08-08 Sarnoff Corporation Apparatus and method for using side information to improve a coding system
US7024046B2 (en) * 2000-04-18 2006-04-04 Real Time Image Ltd. System and method for the lossless progressive streaming of images over a communication network
EP1349393A1 (en) * 2002-03-15 2003-10-01 Ricoh Company Image compression device, image decompression device, image compression/decompression device, program for executing on a computer to perform functions of such devices, and recording medium storing such a program
JP3743384B2 (ja) * 2002-04-19 2006-02-08 ソニー株式会社 画像符号化装置及び方法、並びに画像復号装置及び方法
US7738554B2 (en) * 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
JP4442392B2 (ja) * 2004-11-05 2010-03-31 カシオ計算機株式会社 画像処理装置及び画像処理方法
TW200746655A (en) * 2005-11-18 2007-12-16 Sony Corp Encoding device and method, decoding device and method, and transmission system
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US20090238479A1 (en) * 2008-03-20 2009-09-24 Pawan Jaggi Flexible frame based energy efficient multimedia processor architecture and method
US8189933B2 (en) * 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8345749B2 (en) * 2009-08-31 2013-01-01 IAD Gesellschaft für Informatik, Automatisierung und Datenverarbeitung mbH Method and system for transcoding regions of interests in video surveillance
JP5817125B2 (ja) * 2011-01-21 2015-11-18 ソニー株式会社 画像処理装置および方法
US8615140B2 (en) * 2011-11-18 2013-12-24 Canon Kabushiki Kaisha Compression of image data in accordance with depth information of pixels
JP5924943B2 (ja) * 2012-01-06 2016-05-25 キヤノン株式会社 撮像装置および撮像装置の制御方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165098A (ja) * 2000-11-27 2002-06-07 Sony Corp 画像符号化装置及び画像符号化方法
JP2004166254A (ja) * 2002-10-25 2004-06-10 Sony Corp 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP2005064897A (ja) * 2003-08-13 2005-03-10 Kddi Corp 動画像圧縮符号化装置
JP2005110185A (ja) * 2003-09-08 2005-04-21 Sony Corp 画像符号化装置及び方法
JP2005143105A (ja) * 2003-10-31 2005-06-02 Canon Inc デジタルビデオ圧縮
JP2005236895A (ja) * 2004-02-23 2005-09-02 Sony Corp 画像符号化装置及び方法、並びに画像復号装置及び方法
JP2009200645A (ja) * 2008-02-19 2009-09-03 Ricoh Co Ltd 画像伝送装置
JP2011239066A (ja) * 2010-05-07 2011-11-24 Sony Corp 画像処理装置および方法

Also Published As

Publication number Publication date
US20130308697A1 (en) 2013-11-21
JP5950157B2 (ja) 2016-07-13
CN103426189A (zh) 2013-12-04

Similar Documents

Publication Publication Date Title
US8953898B2 (en) Image processing apparatus and method
US9838715B2 (en) Image processing apparatus and method
JP4656190B2 (ja) 情報処理装置および方法
JP4888729B2 (ja) 符号化装置および方法、並びに、復号装置および方法
US9955176B2 (en) Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
JP4780172B2 (ja) 情報処理装置および方法
JP5660361B2 (ja) 画像処理装置および方法、並びにプログラム
JP4124792B2 (ja) 符号化方法及び復号化方法及び符号化装置及び復号化装置
JP5950157B2 (ja) 画像処理装置および方法、並びに、プログラム
US8605793B2 (en) Information processing device and method, and program
Descampe et al. JPEG XS, a new standard for visually lossless low-latency lightweight image compression
JP2004254133A (ja) 動画再生システム、動画再生装置、動画送信装置、動画再生方法、プログラム、及び、記録媒体
US8908985B2 (en) Image processing including encoding information concerning the maximum number of significant digits having largest absolute value of coefficient data in groups
Richter et al. JPEG-XS—A high-quality mezzanine image codec for video over IP
US8331708B2 (en) Method and apparatus for a multidimensional discrete multiwavelet transform
JP5817125B2 (ja) 画像処理装置および方法
US20110069897A1 (en) Image processing device and method
JP2011147050A (ja) 画像処理装置および方法
JP2001112004A (ja) 動画像符号化装置及び動画像復号装置、並びに動画像符号化方法及び動画像復号方法
JP2011239066A (ja) 画像処理装置および方法
Kaur A review of region-of-interest coding techniques of JPEG2000
JP2011151524A (ja) 画像処理装置および方法
Demaude et al. Using interframe correlation in a low-latency and lightweight video codec
JP2006246241A (ja) スケーラブルトランスコード方法及び装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160525

R151 Written notification of patent or utility model registration

Ref document number: 5950157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees