JP6497874B2 - 画像処理装置、画像処理方法、及びプログラム - Google Patents

画像処理装置、画像処理方法、及びプログラム Download PDF

Info

Publication number
JP6497874B2
JP6497874B2 JP2014174494A JP2014174494A JP6497874B2 JP 6497874 B2 JP6497874 B2 JP 6497874B2 JP 2014174494 A JP2014174494 A JP 2014174494A JP 2014174494 A JP2014174494 A JP 2014174494A JP 6497874 B2 JP6497874 B2 JP 6497874B2
Authority
JP
Japan
Prior art keywords
frame
encoding
bit rate
rate
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014174494A
Other languages
English (en)
Other versions
JP2016051926A5 (ja
JP2016051926A (ja
Inventor
木村 真琴
真琴 木村
咲 樋渡
咲 樋渡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014174494A priority Critical patent/JP6497874B2/ja
Priority to US14/835,013 priority patent/US10129551B2/en
Publication of JP2016051926A publication Critical patent/JP2016051926A/ja
Publication of JP2016051926A5 publication Critical patent/JP2016051926A5/ja
Application granted granted Critical
Publication of JP6497874B2 publication Critical patent/JP6497874B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は画像処理装置、画像処理方法、及びプログラムに関し、特に時間階層識別子を用いる技術に関する。
動画像の圧縮記録の符号化方式であるHEVC(High Efficiency Video Coding)では、動画像を低品質のものから高品質のものに階層的に符号化するスケーラブル映像符号化が拡張仕様として採用されている。スケーラブル映像符号化は、階層化される情報の種類の観点から、空間スケーラビリティ、時間スケーラビリティ、SNR(Signal to Noise Ratio)スケーラビリティに分類されることもある。ここで時間スケーラビリティは、時間的な規模(スケール)の変化、即ち画像符号化においては単位時間ごとのフレーム数(フレームレート)に対応して、階層化する技術である。そして、階層構造であるデータの一部を切り出すことでフレームレートを調整することができる。即ち、複数のフレームレートを実現可能なように動画像を符号化することで、ネットワーク送信や再生(復号)処理といった、環境により異なる制限事項に合わせてフレームレートの柔軟な切り替えが可能になる。
上述した時間スケーラビリティに対応した階層符号化を実現するため、HEVCでは、動画像の各フレームに、時間的な階層における各階層を識別するための情報である時間階層識別子(Temporal ID)を設けて符号化することが規定されている。各階層のフレームは、設定されたTemporal IDの値、及びそれより小さい値に対応するフレームを参照して再生可能な構成となっている。そしてこのTemporal IDをもとに、時間的な階層を選択して再生(復号及び表示)を行う。
以下、図9(a)を用いて、Temporal IDと選択的に再生可能な動画像のフレームレートの関係を説明する。図9(a)には、Iフレーム、Pフレーム、又はBフレームからなるフレームを、4つの階層に分けて示している。図9(a)の各階層に存在するフレームには、上から、Temporal ID=3、Temporal ID=2、Temporal ID=1、Temporal ID=0が付与されている。このようにしてTemporal IDを付与されて符号化されたフレームを、送信時および再生時にTemporal IDに基づいて選択することで、図9(a)では4種類のフレームレートの動画像を形成可能である。例えば、Temporal ID=0のみ(図9(a)の904で示したフレーム群)を選択した場合、フレームレートは7.5FPS(Frames Per Second,フレーム/秒)となる。また、Temporal ID=0、1(図9(a)の904と903とで示したフレーム群)を選択した場合、フレームレートは15FPSとなる。さらに、Temporal ID=0、1、2(図9(a)の902〜904で示したフレーム群)を選択した場合のフレームレートは30FPSとなる。そして、Temporal ID=0、1、2、3の全ての階層(図9(a)の901〜904で示したフレーム群)を選択した場合のフレームレートは60FPSとなる。このように、Temporal IDに基づいて、動画像を再生する際のフレームレートを受信側で選択することができる。
次に、送信側においてフレームレートを制御する技術として、動画像の各フレームに、フレーム間の処理の優先度を付与し、当該優先度に基づいた伝送を行う技術がある(特許文献1)。特許文献1では、画面内参照フレーム(以下、Iフレーム)、画面間参照フレーム(以下、Pフレーム)、双方向画面間参照フレーム(以下、Bフレーム)といったフレームの予測形式(以下、フレームタイプ)に応じて各フレームに関する処理の優先度を付与する。ここで優先度の大きさは、予測画像として使用されるフレーム間の依存関係に基づく。即ち、IフレームはPフレームとBフレームの双方から参照されうるために、3つのフレームタイプのうち最大の優先度となり、Bフレームは参照画像として使用されないために最低の優先度となる。そして、PフレームはBフレームから参照されうるため、Iフレームの優先度より小さくBフレームの優先度より大きい、中程度の優先度となる。
そして特許文献1の技術では、各フレームに付与した優先度に応じて一時的にフレームを間引く(即ちフレームレートを低下させる)ことで、通信経路の伝送状況に基づいたビットレート制御を行う。具体的には、通信経路の伝送状況(即ち実効ビットレート)に応じて閾値未満の低優先度のフレームを間引いて伝送する。伝送されるフレームは(1)全フレーム、(2)[優先度:高](Iフレーム)及び[優先度:中](Pフレーム)のみ、(3)[優先度:高](Iフレーム)のみ、というように各フレームの優先度と通信経路の伝送状況とに応じて閾値を用いて選択される。
特許3519722号公報
上述したように特許文献1は、各フレームに対応するフレームタイプに基づいて付与された優先度と、通信経路の伝送状況とに基づいて、実効伝送レートを超えそうな場合に優先度のより低いフレームを切り捨てることにより、送信フレームレートを制御する。そして、優先度の数はフレームタイプの種類の数に基づいて制限されている。
このため、特許文献1に記載のように送信側でフレームレート制御された動画像データを、Temporal IDに基づいて再生のためにフレームレートを選択する場合、以下のような課題がある。例えば、図9(b)に示すようにTemporal ID=1の階層がBフレームであって、且つ、各フレームタイプに対してIフレーム[優先度:高]、Pフレーム[優先度:中]、Bフレーム[優先度:低]のように優先度が設定されていると仮定する。この場合、特許文献1の方法では、Temporal ID=1の階層に含まれるBフレーム群は、その優先度がTemporal ID=2の階層に含まれるPフレーム群の優先度よりも低いため、送信の際に優先的に間引かれてしまう可能性がある。従って、Temporal ID=1のBフレームが間引かれたことで、図9(b)のフレーム群912に示した30FPSでの正常な再生ができなくなる。
さらに、図9(b)に示すように、フレーム群911のうち各フレーム914〜917は、間引かれたフレーム群912のBフレームを参照フレームとしているため、これらの各フレーム914〜917も再生できない。このように、Temporal ID=2のフレームが、間引かれたTemporal ID=1のフレームを参照する場合、Temporal ID=2フレームも再生できなくなるため、フレーム群911で示した60FPSでの正常な再生もできなくなる。
以上のように、特許文献1の方法を用いると、Temporal IDに基づいて時間スケーラビリティ符号化された動画像データを、所望のビットレートやフレームレートに制御することが難しいという課題がある。
上述の課題を解決するため、本発明の画像処理装置は、以下の構成を有する。即ち、複数の階層に基づいて、動画像を構成する各フレームを符号化することが可能な画像処理装置であって、符号化対象のフレームに対応する階層を示す情報を取得する取得手段と、前記取得手段によって取得された情報に基づいて、動画像を構成する各フレームを符号化する符号化手段と、前記符号化手段によって符号化された動画像の符号化データを送信する送信手段とを有し、前記複数の階層に含まれる第1の階層に対応するフレーム群によって、第1のフレームレートの動画像を構成可能であり、前記第1の階層に対応するフレーム群と、前記第1の階層とは異なる第2の階層に対応するフレーム群とによって前記第1のフレームレートよりも高い第2のフレームレートの動画像を構成可能であり、前記第1の階層に対応するフレーム群と、前記第2の階層に対応するフレーム群と、前記第1及び第2の階層とは異なる第3の階層に対応するフレーム群とによって前記第2のフレームレートよりも高い第3のフレームレートの動画像を構成可能であり、前記符号化手段は、前記取得手段によって取得された情報に基づいて、符号化対象のフレームが前記第2の階層又は前記第3の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化された動画像のビットレートを、第1のビットレート以下とするための制限を行い、符号化対象のフレームが前記第1の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化された動画像のビットレートを前記第1のビットレート以下とするための制限を行わずに前記第1のビットレートを超えることを可能として、前記動画像を構成する各フレームを符号化し、前記制限を行う場合において、前記第3の階層に対応するフレームのビットレートを削減する割合は、前記第2の階層に対応するフレームのビットレートを削減する割合よりも大きく、前記第1のビットレートは、符号化対象のフレームを符号化した符号データを伝送する通信経路の実際のビットレートである実効伝送レートである
通信経路の実効伝送レート及びTemporal ID等を考慮して適応的なビットレート制御及びフレームレート制御を実現可能である。
実施形態1におけるフレーム単位の符号化処理を示したフローチャート 実施形態1におけるIフレーム、Pフレーム、Bフレームからなる各フレームレートに対応する階層の説明図 実施形態1における符号化パラメータ決定処理を示したフローチャート 実施形態1におけるIフレーム、Pフレームからなる各フレームレートに対応する階層の説明図 実施形態1におけるビットレート推移の説明図 実施形態2におけるフレーム単位の符号化処理を示したフローチャート 実施形態2における符号化パラメータ決定処理を示したフローチャート 実施形態1及び実施形態2に係る動画像送受信システムの構成例を示すブロック図 時間階層識別子と各フレームレート階層とに係る説明図 画像処理装置に適用可能なコンピュータのハードウェアの構成例を示すブロック図 実施形態1における画像送信装置800の構成例を示すブロック図
以下、添付の図面を参照して、本発明をその実施形態の一例に基づいて詳細に説明する。尚、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。
[実施形態1]
以下、本実施形態に係る画像処理装置について、図面を参照して説明する。まず、本実施形態における画像処理システムの構成について、図8を用いて説明する。図8は、撮影した動画像に対応する動画像データを、通信経路を介して送信し、これを受信した側で表示を行うための動画像送受信システムの機能ブロック図であり、動画像送信装置800(画像処理装置)と動画像受信装置810とを含む。尚、図8の各処理部(801〜803、811〜813)は1つの物理的な回路(ハードウェア)によって構成されていてもよいし、複数の回路で構成されていてもよい。また、いくつかの処理部を統合して1つの回路としてもよい。
動画像送信装置800は、本実施形態における画像処理装置の一例である。動画像送信装置800において、カメラ等の撮像部801は被写体を撮影して動画像データを作成し、符号化部802へ出力する。撮像部801は所定時間毎にフレーム単位で画像を撮像し、複数フレームで構成される動画像データを生成する。そして、符号化部802は、H.264やHEVC等の動画像符号化方式で、撮像部801によって作成された動画像データを圧縮して符号化データを生成し、ネットワーク送信部803へ出力する。ネットワーク送信部803は、符号化部802によって出力された符号化データを、通信経路を介して動画像受信装置810に転送する。次に動画像受信装置810において、ネットワーク受信部811は符号化データを受信し、復号部812へ出力する。復号部812は、ネットワーク受信部811から出力された符号化データに復号(伸張)処理を施し、動画像データを生成(再生)する。そして表示制御部813は、復号部812によって生成された動画像データを、TV受信機やPCモニタ、携帯機器のディスプレイ等に可視画像として表示させるよう制御する。尚、図示していないが動画像送信装置800及び動画像受信装置810はそれぞれ記憶装置を有し、この記憶装置を各種設定用の記憶領域や一時記憶用のバッファ領域として使用しながら処理を進める。
符号化部802によって符号化された後の動画像のデータ量は、符号化時に用いられた量子化パラメータ(QP:Quantization Parameter)等の符号化パラメータ(画質設定)により変動する。尚、符号化時に用いるQPが大きいほど量子化ステップが大きくなるため、符号化された符号データのデータ量(符号量)は小さくなるが、画質劣化が大きくなる(画質が低下する)。一方、符号化時に用いるQPが小さいほど、画質劣化が小さくなるが、符号量は大きくなる。
また、仮に符号化時に用いる符号化パラメータを固定にしたとしても、符号化対象の動画像の内容に依存した予測のしやすさに従って、符号化部802によって符号化された後の動画像データのデータ量は変動する。加えて、通信経路の実際の伝送レート(実効伝送レート)は、通信経路の混雑状況、あるいは無線通信であれば電波状況のような環境要因によって変動する可能性がある。例えば、通信経路の実効伝送レートが符号化後の動画像データのビットレートを下回る場合、動画像送信装置800は動画像データを符号化した符号化データを伝送することが出来ない。この場合、受信側の表示制御部813によって表示を制御される表示部820は、通信経路の実効伝送レートが動画像データのビットレート以上に回復するまでの間、何も再生されないか、部分的に途切れ途切れの動画像データしか再生できないといった状況が生じる。
尚、表示部820は図8において動画像受信装置810の外部にあるがこれに限定されず、動画像受信装置810の内部に構成されていてもよい。
次に、図2を用いて本実施形態における動画像データのフレーム構成について説明する。図2には、Iフレーム、Pフレーム、及びBフレームが、3つの階層(Temporal ID=0、1、2)に分けて示されている。ここで、Temporal IDとは、動画像の各フレームに付与される、時間的な階層における各階層を識別するための情報である時間階層識別子(時間的階層の識別子)のことである。図中の矢印は、フレーム間の予測の方向(即ち、当該フレームが予測のために参照するフレーム)を示している。尚、動画像符号化方式としてHEVCを用いた場合、複数のIフレームを跨いだ予測が可能である。このため、フレーム間予測に際しては、Iフレームではなく、予測の自由度を制限されたIDR(Instantaneous Decoding Refresh)フレームを用いるのが好ましい。ただし本実施形態ではIフレームとIDRフレームとを区別せず、便宜的にどちらもIフレームと記述する。
図2に示すように、各フレームは時間順(再生順)に、フレーム201(Iフレーム、以下Iと略記)、フレーム202(Bフレーム、以下Bと略記)、フレーム203(Pフレーム、以下Pと略記)と続く。以下、フレーム204(B)、205(P)、206(B)、207(P)、208(B)、209(P)、210(B)、211(P)、212(B)、213(P)の順となる。全てのフレームには、当該フレームの属するTemporal IDが付与される。本実施形態においては、各フレーム202、204、206、208、210、及び212には、それぞれTemporal ID=2が付与されている。また、各フレーム203、207、及び211にはそれぞれTemporal ID=1が付与され、各フレーム201、205、209、及び213にはそれぞれTemporal ID=0が付与されている。
次に、動画像データを所定の時間的階層を境界として、低フレームレート層、中間フレームレート層、又は高フレームレート層の何れかに分類する階層選択処理について説明する。本実施形態では、Temporal ID=0(最小値)であるフレーム群の階層を低フレームレート層214と分類する。さらに、Temporal ID=1の階層を中間フレームレート層215、Temporal ID=2の階層を高フレームレート層216とそれぞれ分類する。
本実施形態では、低フレームレート層214を区別するためのTemporal IDの第1の閾値(第1の時間的階層閾値)は、0に規定される。また、中間フレームレート層215を区別するためのTemporal IDの第2の閾値(第2の時間的階層閾値)は1に、それぞれ規定される。即ち、Temporal IDが第1の閾値(0)より小さいフレームを低フレームレート層214に分類し、Temporal IDが第1の閾値以上であって且つ第2の閾値(1)より小さいフレームを中間フレームレート層215に分類する。本実施形態では各フレームレート層は、それぞれ1つのTemporal IDの層から構成されるが、これに限定されるものではない。1つのフレームレート層を複数のTemporal IDの層で構成してもよい。例えば、図9(a)のフレーム群902(Temporal ID≦2)とフレーム群903(Temporal ID≦1)の二つの層を、中間フレームレート層としてもよい。尚、閾値の決定方法は、外部からユーザによる指定に基づいて決定しても良いし、所定のアルゴリズムに基づいて決定しても良いし、予め決定しておいた所定値を用いてもよい。
次に、図1及び図11を用いて、階層選択処理を施された各階層の符号化処理について説明する。図11は、本実施形態における動画像送信装置800の各処理部を示す機能ブロック図である。図1は、本実施形態における動画像送信装置800で実行される符号化処理のフローチャートである。撮像部801による動画の撮影が開始されると図1の処理が開始される。
符号化処理が開始されると、符号化部802のフレーム取得部1101は、撮像部801が撮影した動画像データに対応する符号化対象のフレームを、動画像送信装置800の記憶装置から取得する(ステップS101)。フレーム取得部1101は複数のフレームを保持可能なバッファを含んでもよい。次に、属性情報取得部1102は、ステップS101において取得された符号化対象のフレームに対応するTemporal IDであって、全体制御部1107によって設定されたTemporal IDを記憶装置から読み出す(取得する)(ステップS102)。尚、属性情報取得部1102は、全体制御部1107によって設定されたTemporal IDを、記憶装置を介さずに受け取ってもよい。そして、属性情報取得部1102は、ステップS102で読み出したTemporal IDに基づいて、符号化対象のフレームが属するフレーム群を判定する(ステップS103)。ここで、本実施形態において属性情報取得部1102は、図2に示すTemporal ID=0、1、2のうちいずれかを、符号化対象のフレームが属するフレーム群として判定し、符号化対象のフレームが属するフレーム群に関する情報を取得する。また、ステップS102又はステップS103において属性情報取得部1102は、再生順序と符号化順序とに基づいて、フレームの順序を並び替えてフレーム取得部1101から読み出しても構わない。
次に、制御方法決定部1103は、ステップS103において属性情報取得部1102によって取得された、符号化対象のフレームが属するフレーム群に基づいて、ビットレート制御方法を決定する(ステップS104)。これにより、Temporal IDに基づいてビットレート制御方法を決定することができる。
ここでビットレート制御方法としては、動画像送信装置800が符号化対象のフレームを符号化した後、動画像受信装置810へ転送する際の通信経路の実効伝送レートに基づき、階層ごとにビットレートを制御する方法が挙げられる。また、ユーザによる指示によって設定された目標画質に基づいて階層ごとにビットレートを制御する方法、動画像受信装置810内のバッファ(不図示)の残容量に基づいて階層ごとにビットレートを制御する方法等が挙げられる。また、ネットワーク送信部803に含まれる送信バッファ(不図示)の蓄積量(充填率)に基づきビットレートを制御してもよい。尚、これに限定されず、制御方法決定部1103は、前述した制御方法のうち少なくとも一つの方法を決定すればよい。本実施形態では、制御方法決定部1103は、通信経路の実効伝送レートに基づく制御方法をビットレート制御方法として決定する場合について説明する。より具体的には、本実施形態では、所定の閾値より大きいTemporal IDを有すフレームのビットレートが、実効伝送レートを超えないように、符号化時のビットレートを制御する方法を用いる。
次に、パラメータ決定部1104は、ステップS104において決定されたビットレート制御方法に基づいて、符号化対象のフレーム以前に符号化されたフレームに関する符号化履歴データ(過去の符号化履歴データ)を記憶装置から読み出す(ステップS105)。符号化履歴データには、複数のフレームで構成される一連の動画シーケンスの符号化に用いた符号化パラメータ(画質パラメータ)としてQPに関する情報が含まれる。さらに、符号化履歴データには、符号化パラメータに対応付けられた発生符号量(符号化後のデータ量)、累積発生符号量、及びIフレーム、Pフレーム、及びBフレームごとの平均発生符号量等に関する情報が含まれる。例えば、符号化履歴データには、各Temporal IDに対応する階層の、Iフレーム、Pフレーム、及びBフレームの発生符号量(又は平均発生符号量)、対応するQP(もしくは平均QP)、又は累積発生符号量のうち少なくともいずれかが、符号化に際して記憶装置に保持される。尚、本実施形態はこれらに限定されず、パラメータ決定部1104は符号化パラメータに対応する他の情報を記憶装置に保持しておき、これを読み出しても構わない。ステップS105の処理後、パラメータ決定部1104は、ステップS104において決定されたビットレート制御方法と、ステップS105において読み出された過去の符号化履歴データとに基づいて、符号化パラメータを決定する(ステップS106)。
そして、データ符号化部1105は、ステップS106においてパラメータ決定部1104によって決定された符号化パラメータを用いて、フレーム取得部1101によって取得された符号化対象フレームを符号化する(ステップS107)。また、ステップS107においてデータ符号化部1105は、再生順序と符号化順序とに基づいて、フレームの順序を並び替えてフレーム取得部1101から読み出すことにより、符号化対象フレームを符号化しても構わない。
そして、履歴データ保持部1106は、ステップS107において符号化対象のフレームが符号化された後の発生符号量(データ量)、及び符号化において用いられた符号化パラメータを、符号化履歴データとして更新する(ステップS108)。そして、符号化部802は、符号化対象のフレームが動画像データの最終フレームでない場合(ステップS109のNo)、ステップS101に進み、次のフレームの符号化処理に移行する。以上の処理を、動画像データの最終フレームになるまで繰り返し、最終フレームになったら(ステップS109のYes)、符号化処理を終了する。
さらに、図1におけるステップS106で決定される符号化パラメータであるQPの設定処理のフローチャートを図3に示す。本フローの実行に先立って、動画像送信装置800はネットワーク送信部803による送信に関する現在の実効伝送レートあるいは許容できる実効伝送レートを特定しておくものとする。図1におけるステップS106の処理が開始されると、パラメータ決定部1104は、符号化対象のフレームのTemporal IDが、所定の閾値以下であるか否かを判定する(ステップS301)。ここで、本実施形態では所定の閾値を第一の閾値(=0)とする。
まず、ステップS301において、符号化対象のフレームのTemporal IDが0である場合(ステップS301のYes)について説明する。この場合、パラメータ決定部1104は、画質を最優先した低いQPであるQP1を、符号化対象のフレームを符号化する場合に用いるQPとして設定する(ステップS302)。尚、ステップS302でQP1を設定したが、これに限定されない。即ち、符号化履歴データとして保持されている、符号化対象のフレーム以前に符号化されたフレームのうちTemporal ID=0であるフレームのQPを、そのまま符号化対象のフレームのQPとして利用してもよい。尚、ステップS302におけるQPの設定処理は、実効伝送レートの値に依存せず行われる。
一方、ステップS301において、符号化対象のフレームのTemporal IDが0でない場合(ステップS301のNo)、パラメータ決定部1104はステップS303の処理を行う。ステップS303においてパラメータ決定部1104は、符号化履歴データから算出された現時点(符号化対象のフレーム)までの平均ビットレートが、実効伝送レートを超えているか否かを判定する。ステップS303において平均ビットレートが実効伝送レートを超えている場合(ステップS303のYes)、パラメータ決定部1104はステップS304の処理を行う。ステップS304においてパラメータ決定部1104は、平均ビットレートの超過量と、平均ビットレートが実効伝送レート以下になるような符号化履歴データのQPに対応する発生符号量とに基づいて、符号化対象のフレームを符号化する時に用いるQPを設定する。尚、ステップS303においてパラメータ決定部1104は、符号量を最優先した高いQPであるQP2を、符号化対象のフレームを符号化する場合に用いるQPとして設定する。
また、ステップS303において平均ビットレートが実効伝送レートを超えていない場合(ステップS303のNo)、パラメータ決定部1104はステップS305の処理を行う。ステップS305においてパラメータ決定部1104は、符号化履歴データに保持されている、符号化対象のフレーム以前のフレームを符号化する際に用いられた過去のQPに基づくQP3を、符号化対象のフレームを符号化する場合のQPとして設定する。尚、QP3を過去のQPと等しい値としてもよい。
そして、各ステップS302、S304、又はS305によってQPを設定した後、QPの設定処理を終了する。尚、各ステップS304、及びステップS305において用いられた各量子化パラメータQP2、及びQP3は、QP3≦QP2である。
次に、図1、及び図3のフローチャートで制御されるビットレートの遷移の一例を、図5に示す。尚、符号化対象の動画像データのフレーム構成は図4に示すものとする。図5において、横軸は各フレームを再生する再生時刻を示し、縦軸は各フレームの符号化時のビットレートを示す。尚、図5ではTemporal IDを単にIDと標記している。
時刻T0におけるフレーム401はTemporal ID=0(所定の閾値=0以下)であるため、符号化部802のパラメータ決定部1104は、図3のステップS301においてYesと判定し、ステップS302において画質優先のQPを設定する。
続く時刻T1におけるフレーム402は、Temporal ID=2(所定の閾値=0より大きい)であり、且つ符号化履歴データから算出される現時点でまでの平均ビットレートである時刻T0の時点で平均ビットレートが、実効伝送レートを超えている。このため符号化部802のパラメータ決定部1104は、ステップS301においてNoと判定し、ステップ303においてYesと判定するため、ステップS304において、平均ビットレートの超過量に基づくQPを設定する。
続く時刻T2におけるフレーム403はTemporal ID=1(所定の閾値=0より大きい)であり、且つ時刻T1の時点で平均ビットレートは実効伝送レート以下である。このため符号化部802のパラメータ決定部1104は、ステップS301においてNoと判定し、ステップS303においてNoと判定するため、ステップS305の処理を行う。ステップS305において符号化部802のパラメータ決定部1104は、過去の符号化履歴データに保持されている、符号化対象のフレームより前に符号化されたフレームに対するQPと同一のQPを、符号化対象のフレームのQPとして設定する。
以上の処理によって図5に示すように、所定の閾値以下のTemporal IDを有す階層については、画質を優先するため当該フレームの符号化時のビットレート(もしくは当該フレームまでの平均ビットレート)が実効伝送レートを超えることが許容される。また、所定の閾値より大きいTemporal IDを有す階層については、符号化時のビットレート(もしくは当該フレームまでの平均ビットレート)が実効伝送レートを超えないように制御される。これにより、局所的には符号化時のビットレートが実効伝送レートを超えつつも、全階層(Temporal IDが0から2の全フレーム)に対する平均ビットレートは実効伝送レート以下に抑えることができる。即ち、本実施形態により、平均ビットレートを平準化することが可能である。
本実施形態のような制御を行わず、Temporal IDの異なる階層であっても、フレームタイプが同じであれば同じ優先度で間引いた場合、次のような問題が生じるかもしれない。例えば、図9(b)のTemporal ID=1の階層のBフレームとTemporal ID=2の階層のBフレームとが同じ優先度で間引いてしまうと、Temporal ID=1、2に関して30FPS、60FPSが得られない。しかしながら、本実施形態によりTemporal IDと通信経路の状況に基づいて量子化パラメータを設定し、ビットレートを制御することができる。これにより、Temporal IDを考慮して所望のフレームレートに制御しつつ、所望のビットレートに制御することができる。
尚、本実施形態において、図3のステップS301においてTemporal IDと比較する所定の閾値は第1の閾値であるとしたが、これに限定されず、第1の閾値とは異なる第2の閾値としてもよい。
尚、本実施形態では、通信経路の実効伝送レートに基づく制御方法について説明したが、通信経路の実効伝送レートに限定されない。即ち、動画像受信装置810において受信された所定時間当たりのデータ量を計測して動画像送信装置800にフィードバックするようにして動画像送信装置800がこれに基づきQPを決定してもよい。また、動画像送信装置800において出力された所定時間当たりの符号化データのデータ量を計測したり、送信バッファの容量から送信された符号化データのデータ量を算出したりし、これに基づきQPを決定してもよい。
[実施形態2]
上述した実施形態1では、図3において、所定の閾値以下のTemporal IDが付与されたフレーム(図4のフレーム401)で発生したビットレートの超過量を直後のフレーム(図4のフレーム402)で調整する制御である。本実施形態では、発生したビットレートの超過量を、所定の閾値より大きい階層に属するフレームの、Temporal IDに応じて分配することで平均ビットレートを調整する。本実施形態に係る動画像送受信システムの構成に関しては、実施形態1と同じ構成を利用できるため、ここでの説明を省略する。
まず、図6は、本実施形態における符号化処理フローチャートである。尚、図6のステップS601以外の各処理は図1のそれと同様であるため、ここでの説明を省略する。ステップS601において符号化部802は、符号化対象のフレームが属するフレーム群、過去の符号化履歴データ、及び後述の重み付け係数に基づいて、符号化対象のフレームを符号化する際に用いる符号化パラメータ(QP)を決定する。
次に、図6におけるステップS601で決定される符号化パラメータであるQPの設定フローチャートを図7に示す。図6におけるステップS601の処理が開始されると、符号化部802は符号化対象フレームのTemporal IDが所定の閾値以下であるか否かを判定する(ステップS701)。ここで、本実施形態では所定の閾値は第1の閾値(=0)とする。
まず、ステップS701において、符号化対象のフレームのTemporal IDが閾値以下(即ち、Temporal ID=0)である場合(ステップS701のYes)、ステップS702の処理を行う。ステップS702において符号化部802は、画質を最優先した低いQPを、符号化対象フレームに対応するQPとして設定し、処理を終了する。尚、ステップS702において、符号化履歴データに保持されている、符号化対象のフレーム以前に符号化されたフレームのうち同じTemporal ID(即ち、Temporal ID=0)のフレームのQPをそのまま利用してもよい。
一方、ステップS701において、符号化対象フレームのTemporal IDが閾値より大きい場合(ステップS701のNo)、符号化部802はステップS703の処理を行う。即ち、ステップS703において符号化部802は、符号化履歴データから算出された現時点までの平均ビットレートが実効伝送レートを超えているか否かを判定する。そして、ステップS703において平均ビットレートが実効伝送レートを超えている場合(ステップS703のYes)、符号化部802は符号化対象のフレームの目標ビットレートを算出する(ステップS704)。
以下、ステップS704における目標ビットレートの算出方法について説明する。ここで、目標ビットレートの決定には平均ビットレートの超過量初期値、及び符号化対象フレームのTemporal IDを用いることとする。また、平均ビットレートの超過量初期値は、Temporal IDが所定の閾値以下であるフレームの、符号化直後の実効伝送レートに対する平均ビットレートの超過量を表す。平均ビットレートが実行伝送レートを超過していない場合、超過量初期値は0となる。尚、Temporal IDが所定の閾値より大きいフレームの符号化直後の平均ビットレートの超過量と区別するため、超過量初期値と呼称する。
まず、ビットレートの超過量に応じたフレーム毎のビットレート削減量をTemporal IDに応じた重み付けで決定する。重み付け係数をα(0≦α<0.5)、超過量初期値をBとすると、Temporal ID=1のフレーム群でαBだけ平均ビットレートを削減するように、各フレームに対する目標符号量を決定する。同様にTemporal ID=2のフレーム群で(1−α)Bだけ平均ビットレートをさらに削減するように、各フレームの目標符号量を決定する。本実施形態では、αを0≦α<0.5とすることで、Temporal ID=1のフレーム群における平均ビットレートの削減量よりも、Temporal ID=2のフレーム群における平均ビットレートの削減量が多くなるように重み付けしている。即ち、Temporal IDに応じた重み付けを行っている。
図4を用いてさらに説明する。フレーム401の符号化完了時点(符号化直後)の平均ビットレートの超過量初期値Bに対して、各フレーム402、404の符号化終了時点でそれぞれ(1−α)B/2だけ平均ビットレートが削減されるように、各フレームの目標符号量を設定する。これは、Temporal ID=2のフレーム群(フレーム402、404の2つ)でαBだけ平均ビットレートを削減するための設定値である。同様にフレーム403の符号化終了時点でαBだけ平均ビットレートが削減されるように、フレーム403に対する目標符号量を決定する。即ち、ステップ704の処理により、平均ビットレートは、各フレーム402、403の符号化終了時点では実効伝送レートを超えうるが、フレーム404の符号化終了時点で実効伝送レートを下回ることとなる。
次に、ステップS705により、ステップS704において設定された目標符号量以下となるように、符号化履歴データに保持された当該フレーム群のQPと対応する発生符号量に基づいて符号化対象のフレームのQPを決定し、処理を終了する。
また、ステップS703において平均ビットレートが実効伝送レートを超えていない場合(ステップS703のNo)、符号化部802はステップS706の処理を行う。ステップS706において符号化部802は、符号化履歴データに保持されている過去のQPを、符号化対象のフレームのQPとして設定し、処理を終了する。
以上の処理によってTemporal ID=0の階層については、画質を優先するため当該フレームの符号化時のビットレート(もしくは当該フレームまでの平均ビットレート)が実効伝送レートを超えることが許容される。しかしながら、ここで発生した平均ビットレートの超過分は、Temporal ID≧1の階層のフレームの符号化時に重み付けして反映される。これにより、次のTemporal ID=0の階層のフレームの符号化までには平均ビットレートが実効伝送レートを下回るように制御される。従って実施例1と同様に、局所的には符号化時のビットレートが実効伝送レートを超えつつも、全階層(Temporal IDが0から2の全フレーム)に対する平均ビットレートは実効伝送レートを超えることはない。
また、本実施形態によりTemporal IDと通信経路の状況とに基づいて量子化パラメータを設定し、ビットレートを制御することができる。これにより、Temporal IDを考慮して所望のフレームレートに制御しつつ、所望のビットレートに制御することができる。
尚、本実施形態で示した重み付けの方法は、一例であり、これに限定されない。即ち、図9(a)に示すフレーム構造の場合、Temporal ID=0のフレームで発生したビットレートの超過量を、Temporal ID=1、2、3のフレームで調整するように制御してもよい。また、重み付けにおいて各階層に属するフレーム数を加味してもよい。例えば、フレーム数の比から決定される重み付け係数をβ(0≦β≦1)とする。Temporal ID=1の階層の1フレームと、Temporal ID=2の階層の2フレームとで平均ビットレートを調整する場合、β=1/2と定義し、Temporal ID=1のフレーム群でαβBだけ平均ビットレートを削減してもよい。同様にTemporal ID=2のフレーム群で(1−αβ)Bだけ平均ビットレートをさらに削減するようにしてもよい。
[実施形態3]
図8に示した各処理部はハードウェアでもって構成しているものとして上記実施形態では説明した。しかし、これらの図に示した各処理部で行う処理をコンピュータプログラムでもって構成しても良い。以下、図10を用いて本実施形態について説明する。図10は、上記各実施形態に係る画像処理システムに適用可能なコンピュータのハードウェアの構成例を示すブロック図である。
CPU1001は、RAM1002やROM1003に格納されているコンピュータプログラムやデータを用いてコンピュータ全体の制御を行うと共に、上記各実施形態に係る画像処理システムが行うものとして上述した各処理を実行する。即ち、CPU1001は、図8に示した各処理部として機能することになる。
RAM1002は、外部記憶装置1006からロードされたコンピュータプログラムやデータ、I/F(インターフェース)1007を介して外部から取得したデータなどを一時的に記憶するためのエリアを有する。更に、RAM1002は、CPU1001が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1002は、例えば、ピクチャメモリとして割り当てたり、その他の各種のエリアを適宜提供したりすることができる。
ROM1003には、本コンピュータの設定データや、ブートプログラムなどが格納されている。操作部1004は、キーボードやマウスなどにより構成されており、本コンピュータのユーザが操作することで、各種の指示をCPU1001に対して入力することができる。出力部1005は、CPU1001による処理結果を表示する。また出力部1005は例えば液晶ディスプレイで構成される。
外部記憶装置1006は、ハードディスクドライブ装置に代表される、大容量情報記憶装置である。外部記憶装置1006には、OS(オペレーティングシステム)や、図8に示した各部の機能をCPU1001に実現させるためのコンピュータプログラムが保存されている。更には、外部記憶装置1006には、処理対象としての各画像データが保存されていても良い。
外部記憶装置1006に保存されているコンピュータプログラムやデータは、CPU1001による制御に従って適宜、RAM1002にロードされ、CPU1001による処理対象となる。I/F1007には、LANやインターネット等のネットワーク、投影装置や表示装置などの他の機器を接続することができ、本コンピュータはこのI/F1007を介して様々な情報を取得したり、送出したりすることができる。1008は上述の各部を繋ぐバスである。
上述の構成からなる作動は前述のフローチャートで説明した処理をCPU1001が中心となってその制御を行う。
[その他の実施形態]
実施形態1及び実施形態2では、Temporal ID=0である低フレームレート層のみ(第1の閾値以下のTemporal IDを持つフレームのみ)、符号化時のビットレートが実効伝送レートを超えることを許容したが、これに限定されるものではない。例えば、Temporal ID=0、1からなる中間フレームレート層のフレームのみ(第2の閾値以下の時間階層識別子を持つフレームのみ)、符号化時のビットレートが実効伝送レートを超えることを許容してもよい。この場合はその他のフレームの符号化時にその超過量を調整するように制御することが可能である。
また、実施形態1及び実施形態2では、局所的には符号化時のビットレートが実効伝送レートを超えつつも、全階層(Temporal IDが0から2の全フレーム)に対する平均ビットレートは実効伝送レートを超えないように符号化される。即ち、Temporal IDに対応する各層は、各々可変ビットレートで符号化されているが、これに限定されるものではない。各フレームレート層に各々目標ビットレートを設定し、閾値以下のTemporal IDについては目標ビットレートに対して固定ビットレートで符号化し、その他のフレームレート層を可変ビットレートで符号化するようにしてもよい。
例えば、図2における高フレームレート層216、中間フレームレート層215、低フレームレート層214の順に、目標ビットレートを40Mbps、20Mbps、10Mbpsと段階的に設定する。低フレームレート層214は10Mbpsに収まるように符号化パラメータを決定し、固定ビットレートで符号化する。中間フレームレート層215は20Mbpsに納まるように符号化パラメータを決定し、可変ビットレートで符号化する。同様に高フレームレート層216は40Mbpsに収まるように符号化パラメータを決定し、可変ビットレートで符号化する。
これにより、低フレームレート層に対しては平均ビットレートが実効伝送レートを超えないように、その他のフレームレート層に対しては局所的には実効伝送レートを超えることを許容した符号化が各々行われる。即ち、局所的には符号化時のビットレートが実効伝送レートを超えつつも、低フレームレート層(Temporal ID=0の階層)の平均ビットレートは実効伝送レートを超えないように符号化することが可能となる。これにより、通信経路の実効伝送レートや受信側の処理能力に応じて送信および受信可能なフレームレート層を容易に選択することも可能となる。例えば、実効伝送レートが10Mbpsを維持している限りは、低フレームレート層214の伝送を保証する、といった処理が可能となる。
上述した実施形態1及び実施形態2において、図8に示す動画像送信装置800は、撮像部801、符号化部802、及びネットワーク送信部803を有しているが、これに限定されない。即ち、撮像部801と符号化部802とが分離して、異なる装置が各処理部を備えていても構わない。
上述した実施形態1及び実施形態2において、図11に示す符号化部802の各処理部は、1つの物理的な回路によって構成されていてもよいし、複数の回路で構成されていてもよい。また、図11に示す符号化部802の各処理部は、1つの全体制御部1107によって制御されても構わないし、複数の制御部によって制御されても構わない。また、全体制御部1107が符号化部802外の処理部(例えば、撮像部801及びネットワーク送信部803)を制御しても構わないし、符号化部802外に備わる全体制御部1107が符号化部802の各処理部を制御しても構わない。
上述した実施形態1及び実施形態2においては、符号化パラメータとしてQPの制御方法に言及したが、これに限定されるものではない。所定のQPに対する量子化結果である量子化係数の打ち切り処理(量子化係数を切捨てる処理)を加えてもよい。例えば、実効伝送レートが所定の打ち切り閾値を超えると、量子化係数の打ち切り処理を適用するように制御することで、画質を低下するかわりに符号化時のビットレートを下げることが可能となる。また、イントラ予測の予測モード決定アルゴリズムや、インター予測の動きベクトル決定アルゴリズムを適応的に切り替える処理を加えてもよい。例えば、実効伝送レートが所定の閾値を超えると、決定アルゴリズムを切り替える、あるいはアルゴリズムが決定したパラメータを強制的に上書きするような処理を加えてもよい。
同様に予測ブロックサイズや符号化ブロックサイズを決定するアルゴリズムを加えてよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
800 動画像送信装置
801 撮像部
802 符号化部
803 ネットワーク送信部

Claims (11)

  1. 複数の階層に基づいて、動画像を構成する各フレームを符号化することが可能な画像処理装置であって、
    符号化対象のフレームに対応する階層を示す情報を取得する取得手段と、
    前記取得手段によって取得された情報に基づいて、動画像を構成する各フレームを符号化する符号化手段と、
    前記符号化手段によって符号化された動画像の符号化データを送信する送信手段と
    を有し、
    前記複数の階層に含まれる第1の階層に対応するフレーム群によって、第1のフレームレートの動画像を構成可能であり、
    前記第1の階層に対応するフレーム群と、前記第1の階層とは異なる第2の階層に対応するフレーム群とによって前記第1のフレームレートよりも高い第2のフレームレートの動画像を構成可能であり、
    前記第1の階層に対応するフレーム群と、前記第2の階層に対応するフレーム群と、前記第1及び第2の階層とは異なる第3の階層に対応するフレーム群とによって前記第2のフレームレートよりも高い第3のフレームレートの動画像を構成可能であり、
    前記符号化手段は、
    前記取得手段によって取得された情報に基づいて、
    符号化対象のフレームが前記第2の階層又は前記第3の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化された動画像のビットレートを、第1のビットレート以下とするための制限を行い、
    符号化対象のフレームが前記第1の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化された動画像のビットレートを前記第1のビットレート以下とするための制限を行わずに前記第1のビットレートを超えることを可能として、
    前記動画像を構成する各フレームを符号化し、
    前記制限を行う場合において、前記第3の階層に対応するフレームのビットレートを削減する割合は、前記第2の階層に対応するフレームのビットレートを削減する割合よりも大きく、
    前記第1のビットレートは、符号化対象のフレームを符号化した符号データを伝送する通信経路の実際のビットレートである実効伝送レートである
    ことを特徴とする画像処理装置。
  2. 符号化対象のフレームが前記第1の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化対象のフレームより前に符号化された1以上の過去フレームのビットレートに基づかない符号化パラメータを用いる
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記符号化手段は、符号化対象のフレームより前に符号化された1以上の過去フレームのビットレートに基づく符号化パラメータを用いて、符号化対象のフレームを符号化することで、前記第1のビットレート以下とするための制限を行う
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記1以上の過去フレームのビットレートに基づく符号化パラメータは、前記1以上の過去のフレームの符号化後のデータ量に基づく符号化パラメータである
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記1以上の過去フレームのビットレートに基づく符号化パラメータは、前記1以上の過去のフレームのうちのいずれかを符号化するために用いた符号化パラメータである
    ことを特徴とする請求項3又は4に記載の画像処理装置。
  6. 前記符号化パラメータは量子化パラメータを含む
    ことを特徴とする請求項2〜5のいずれか1項に記載の画像処理装置。
  7. 前記符号化手段は、前記第1の階層のフレームの符号化時のビットレートが、前記第1のビットレートよりも大きい場合に、前記第2及び第3の階層のフレームの符号化時のビットレートが、前記第1のビットレート以下になるように、前記第2の階層のフレームを符号化する
    ことを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。
  8. 前記符号化対象のフレームに対応する階層に属するフレーム群をビットレート制御するための制御方法を決定する決定手段を有し、
    前記決定手段は、
    前記符号化データを伝送する通信経路の実際のビットレートである実効伝送レートに基づいて階層ごとにビットレートを制御する方法、
    目標の画質に基づいて階層ごとにビットレートを制御する方法、
    符号化データを受信する装置における記憶手段の記憶可能な残量に基づいて階層ごとにビットレートを制御する方法、及び
    送信対象の符号化データを記憶する送信バッファの蓄積量に基づいてビットレートを制御する方法のうち、
    少なくともいずれか1つを前記制御方法として決定する
    ことを特徴とする請求項1〜7のいずれか1項に記載の画像処理装置。
  9. 前記決定手段は、前記取得手段によって取得された情報に基づいて、前記符号化対象のフレームを符号化するためのビットレート制御の方法を決定し、当該ビットレート制御の方法に基づいて、前記符号化対象のフレームを符号化するための符号化パラメータを決定する
    ことを特徴とする請求項8に記載の画像処理装置。
  10. 複数の階層に基づいて、動画像を構成する各フレームを符号化することが可能な画像処理方法であって、
    符号化対象のフレームに対応する階層を示す情報を取得する取得工程と、
    前記取得工程において取得された情報に基づいて、動画像を構成する各フレームを符号化する符号化工程と、
    前記符号化工程において符号化された動画像の符号化データを送信する送信工程と
    を有し、
    前記複数の階層に含まれる第1の階層に対応するフレーム群によって、第1のフレームレートの動画像を構成可能であり、
    前記第1の階層に対応するフレーム群と、前記第1の階層とは異なる第2の階層に対応するフレーム群とによって前記第1のフレームレートよりも高い第2のフレームレートの動画像を構成可能であり、
    前記第1の階層に対応するフレーム群と、前記第2の階層に対応するフレーム群と、前記第1及び第2の階層とは異なる第3の階層に対応するフレーム群とによって前記第2のフレームレートよりも高い第3のフレームレートの動画像を構成可能であり、
    前記符号化工程において、
    前記取得工程において取得された情報に基づいて、
    符号化対象のフレームが前記第2の階層又は前記第3の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化された動画像のビットレートを、第1のビットレート以下とするための制限を行い、
    符号化対象のフレームが前記第1の階層に対応する場合、その符号化対象のフレームの符号化処理において、符号化された動画像のビットレートを前記第1のビットレート以下とするための制限を行わずに前記第1のビットレートを超えることを可能として、
    前記動画像を構成する各フレームを符号化し、
    前記制限を行う場合において、前記第3の階層に対応するフレームのビットレートを削減する割合は、前記第2の階層に対応するフレームのビットレートを削減する割合よりも大きく、
    前記第1のビットレートは、符号化対象のフレームを符号化した符号データを伝送する通信経路の実際のビットレートである実効伝送レートである
    ことを特徴とする画像処理方法。
  11. コンピュータを、請求項1〜9のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2014174494A 2014-08-28 2014-08-28 画像処理装置、画像処理方法、及びプログラム Active JP6497874B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014174494A JP6497874B2 (ja) 2014-08-28 2014-08-28 画像処理装置、画像処理方法、及びプログラム
US14/835,013 US10129551B2 (en) 2014-08-28 2015-08-25 Image processing apparatus, image processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014174494A JP6497874B2 (ja) 2014-08-28 2014-08-28 画像処理装置、画像処理方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2016051926A JP2016051926A (ja) 2016-04-11
JP2016051926A5 JP2016051926A5 (ja) 2017-09-07
JP6497874B2 true JP6497874B2 (ja) 2019-04-10

Family

ID=55404100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014174494A Active JP6497874B2 (ja) 2014-08-28 2014-08-28 画像処理装置、画像処理方法、及びプログラム

Country Status (2)

Country Link
US (1) US10129551B2 (ja)
JP (1) JP6497874B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019162231A1 (en) * 2018-02-26 2019-08-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selective quantization parameter transmission

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3519722B2 (ja) 1997-03-17 2004-04-19 松下電器産業株式会社 データ処理方法及びデータ処理装置
US6639943B1 (en) * 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US8879857B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
EP1938618A2 (en) 2005-09-29 2008-07-02 Thomson Research Funding Corporation Method and apparatus for constrained variable bit rate (vbr) video encoding
CA2644753A1 (en) * 2006-03-03 2007-09-13 Vidyo, Inc. System and method for providing error resilience, random access and rate control in scalable video communications
BRPI0809585A2 (pt) * 2007-04-17 2014-09-23 Thomson Licensing Decodificador de referência hipotética para codificação de vídeo multivisualização
KR20100030648A (ko) * 2007-06-26 2010-03-18 노키아 코포레이션 시간 레이어 스위칭 포인트들을 표시하는 시스템 및 방법
JP2009182442A (ja) * 2008-01-29 2009-08-13 Univ Of Fukui 動画像符号化・復号システム、並びにそれに用いる動画像符号化装置および動画像復号装置
JP2010011154A (ja) 2008-06-27 2010-01-14 Pioneer Electronic Corp 画像生成装置及び画像再生装置
JP5151763B2 (ja) * 2008-07-22 2013-02-27 日本電気株式会社 映像配信システム、映像配信装置、映像受信装置、映像配信方法、映像受信方法及びプログラム
US9036567B2 (en) * 2010-02-03 2015-05-19 Qualcomm Incorporated Logical channel mapping for increased utilization of transmission resources
CN103200399B (zh) 2012-01-04 2016-08-31 北京大学 基于可伸缩视频编码的控制视频质量波动的方法及装置

Also Published As

Publication number Publication date
US10129551B2 (en) 2018-11-13
JP2016051926A (ja) 2016-04-11
US20160065977A1 (en) 2016-03-03

Similar Documents

Publication Publication Date Title
JP6463041B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CA2975904C (en) Method and system for smart adaptive video streaming driven by perceptual quality-of-experience estimations
US8542734B2 (en) Multi-view video encoding apparatus and method
KR101809306B1 (ko) 낮은 레이턴시 레이트 제어 시스템 및 방법
US9215466B2 (en) Joint frame rate and resolution adaptation
JP4755093B2 (ja) 画像符号化方法および画像符号化装置
KR100786132B1 (ko) 적응적으로 세분화된 gop 구조를 이용한 계층적b픽쳐-기반 동영상 부호화 및 복호화 방법
JP5766877B2 (ja) 類似度、視覚的品質、および関心に基づくフレーム符号化選択
US6333948B1 (en) Video coding apparatus, video coding method and storage medium containing video coding program
CN103650509A (zh) 基于照相机和背景运动的参考帧缓冲区的自适应配置
JP2011512047A (ja) メタデータを使用してより低い複雑さの複数ビットレートビデオ符号化を実行する方法及び装置
JP2012170042A (ja) 画像符号化装置と画像復号装置およびその方法とプログラム
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
US9351004B2 (en) Multiview video coding reference picture selection under a one reference picture constraint
US20090304077A1 (en) Refresh method and apparatus
JP7449941B2 (ja) 異なる圧縮レベルでのビデオコーディングのためのサイド情報
US20120195364A1 (en) Dynamic mode search order control for a video encoder
US20110299605A1 (en) Method and apparatus for video resolution adaptation
JP2006148409A (ja) フレームレート変換方法
JP6497874B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6089846B2 (ja) 映像配信システム及びデコーダ並びに映像配信方法
JP2011216986A (ja) 映像送信システム、送信装置及び中継装置
JP6999633B2 (ja) ビデオ記録システム内の複数のカメラの間での適応的ストレージ
JP4490046B2 (ja) 画像符号化装置及び画像符号化方法
JP2018191334A (ja) 画像符号化装置と画像符号化方法およびプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170728

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180920

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181023

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190118

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190312

R151 Written notification of patent or utility model registration

Ref document number: 6497874

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151