JP6527384B2 - 映像符号化装置及びプログラム - Google Patents

映像符号化装置及びプログラム Download PDF

Info

Publication number
JP6527384B2
JP6527384B2 JP2015096384A JP2015096384A JP6527384B2 JP 6527384 B2 JP6527384 B2 JP 6527384B2 JP 2015096384 A JP2015096384 A JP 2015096384A JP 2015096384 A JP2015096384 A JP 2015096384A JP 6527384 B2 JP6527384 B2 JP 6527384B2
Authority
JP
Japan
Prior art keywords
video
encoding
coding
unit
predetermined value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015096384A
Other languages
English (en)
Other versions
JP2016213698A (ja
Inventor
境田 慎一
慎一 境田
俊枝 三須
俊枝 三須
市ヶ谷 敦郎
敦郎 市ヶ谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2015096384A priority Critical patent/JP6527384B2/ja
Publication of JP2016213698A publication Critical patent/JP2016213698A/ja
Application granted granted Critical
Publication of JP6527384B2 publication Critical patent/JP6527384B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は映像符号化装置に関し、特に、2種類以上の空間解像度の映像を圧縮符号化して多重化する装置及びプログラムに関する。
近年、放送分野において、8K(空間解像度7680×4320)、4K(空間解像度3840×2160)といった超高精細映像の開発・応用が進んでいる。しかしながら、放送(配信)する映像は、超高精細解像度の映像のみでは十分ではない場合があり、受信側の機器の状態(放送用受信機やテレビの受信機能、ディスプレイの解像度等)に応じて、8K単独の放送だけではなく、8Kと4Kの同時放送や、さらには2Kを含む放送等、同一コンテンツを複数の解像度で伝送することが求められる場合が想定される。
このような超高精細映像の伝送の際には、高効率な圧縮符号化技術が不可欠になる。映像の圧縮符号化技術として、MPEG(Moving Picture Experts Group)-2やAVC(Advanced Video Coding)/H.264、HEVC(High Efficiency Video Coding)/H.265などの方式が開発・標準化され利用されている。伝送の際には、このような圧縮符号化方式を適切に選択して使用する。
また、複数の映像を同時に伝送するには、各映像信号を圧縮符号化し、これらを多重して多重化ストリームとして伝送路に送信することが行われる。しかしながら、使用できる伝送路には帯域(ビットレート)等の制約があることから、帯域を有効に利用できる効率的な圧縮符号化と多重化が求められている。
圧縮符号化で、画質を一定に保つ場合、圧縮符号化する映像内容・絵柄に依って発生する情報量は変動する。この方式はVBR(Variable Bit Rate)と呼ばれる。一方、放送など伝送路の帯域が定まっている場合には、発生情報量を一定に保つように発生情報量を制御する。この方式はCBR(Constant Bit Rate)と呼ばれる。さらに、伝送路の帯域に制約がある中で複数コンテンツを伝送する場合には、各コンテンツの発生情報量の総和を一定に保つような制御を施す技術がある。これは統計多重符号化と呼ばれ、狭い帯域でできるだけ高い画質を保つ場合に、できるだけ無駄なく帯域を使用するために利用される。
また、同一コンテンツの複数解像度での伝送には、通常の圧縮符号化方式の拡張として、階層符号化技術が開発されている。これは、複数(例えば2種類)の空間解像度の同一の映像を一つのストリームとして圧縮符号化し、復号側で一部のみを復号すると解像度の低い映像のみが得られ、ストリームすべてを復号すると解像度の高い映像も得られる機能を有する圧縮符号化方式である。
一方、既存の放送方式である地上波や衛星波の伝送帯域には、世界で定められたチャンネルプランによる制限や技術的な限界にともなう制限があり、複数の空間解像度の超高精細映像を伝送可能な帯域が十分に確保できない場合がある。この場合、伝送可能な情報量(ビットレート)に対して、各映像の圧縮符号化による発生情報量の総和が瞬時的に超過し、結果として映像に劣化や破たんが生じるおそれがある。
このような課題に対して、映像信号のGOP(Group Of Picture)の位相を各チャネル間でずらすことにより、多重化後の目標発生情報量を一定とした、多チャンネル符号化装置が提案されている(特許文献1)。
特許文献1に記載の多チャンネル符号化装置においては、各チャンネルのIピクチャ(イントラピクチャ)の符号化を時間軸上に分散させるとともに、多重化ストリームが所定の符号レートを上回る可能性があることを検出すると、Iピクチャ禁止信号が出力され、Iピクチャ禁止信号を受けた構造決定部がすべての画像符号化部によるフレーム内符号化を禁止し、フレーム内符号化以外の予測符号化を行わせる構成としている。
特許第3147859号公報
以上述べたように、超高精細映像を伝送するのに十分でない帯域で複数の超高精細映像を圧縮符号化して伝送する場合、復号した映像に大きな劣化や破たんが生じる場合がある。
特に、放送システムにおいては、同一コンテンツを異なる解像度で伝送することが想定され、同一コンテンツであるから映像の各フレームにおける情報量の多寡が一致し、圧縮符号化による瞬時の発生情報量の総和が、伝送路の帯域を越える確率がより高くなる。
特許文献1の符号化装置は、多重化ストリームが所定の符号レートを上回る可能性があることを検出すると、Iピクチャ符号化を禁止するものであるが、Iピクチャ禁止信号が出力されている間は、全てのチャネルでIピクチャを消滅させるため、全体としてIピクチャが減少し、画像が劣化するおそれがある。また、特許文献1では、通常は単に順次巡回的にIピクチャの配置をずらしているだけであり、最適なIピクチャの配置方法について開示されていない。さらに、同一コンテンツを異なる解像度で配信する場合について検討されておらず、階層符号化への応用についても考慮されていない。
また、従来の映像符号化装置として、複数のフレームの情報を纏めたバッファを用意して、伝送路の帯域内での符号化をおこなうものもあるが、バッファ容量に応じて量子化を制御して総計の発生情報量を減らすものであり、ある時間区間で情報量を平坦化させるため、画質の低下や処理時間の遅れが生じる可能性がある。
従って、上記のような問題点に鑑みてなされた本発明の目的は、複数の映像を圧縮符号化して多重化する際に、映像を劣化させることなく、伝送路の帯域内での映像伝送を可能とした映像符号化装置及びプログラムを提供することにある。
上記課題を解決するために本発明に係る映像符号化装置は、複数の異なる解像度の同一映像を、同時に圧縮符号化し、多重化する映像符号化装置において、高解像度映像を符号化する第1の映像符号化部と、前記第1の映像符号化部への入力映像信号をダウンコンバートした低解像度映像を符号化する第2の映像符号化部とを有する複数の映像符号化部と、前記複数の映像符号化部の出力を多重化するとともに、前記複数の映像符号化部で発生する符号化情報を統計多重により多重化した結果生じる合計の瞬時的な符号化情報量が所定値を超えたときに指令を出力する多重化部と、前記指令に基づいて、前記複数の映像符号化部の一部の映像符号化部の符号化時の動き推定・補償の参照構造の位相を変更するGOP制御部と、を備え、前記瞬時的な符号化情報量が所定値を超えたとき、前記複数の映像符号化部のうちの一部の映像の符号化時の動き推定・補償の参照構造の位相を所定フレーム数ずらして発生する符号化情報量が前記所定値以内かを判断し、所定値以内であれば当該ずらした位相に前記参照構造を設定し、所定値を超えていればさらに所定フレーム数ずらすことを繰り返して、同一時刻で発生する符号化情報量を前記所定値以下に平滑化することを特徴とする。
上記課題を解決するために本発明に係る映像符号化装置は、複数の異なる解像度の同一映像を、同時に圧縮符号化し、多重化する映像符号化装置であって、前記圧縮符号化は、基本とする映像から解像度の高い映像を予測する構造を有する圧縮符号化である映像符号化装置において、基本とする映像を符号化する映像符号化部と解像度の高い映像を符号化する映像符号化部を含む複数の映像符号化部と、前記基本とする映像を符号化する映像符号化部の出力を復号して、解像度の低い映像を生成する局所復号部と、前記解像度の低い映像を拡大して前記解像度の高い映像を符号化する映像符号化部に出力するアップコンバート部と、前記複数の映像符号化部の出力を多重化するとともに、前記複数の映像符号化部で発生する符号化情報を統計多重により多重化した結果生じる合計の瞬時的な符号化情報量が所定値を超えたときに指令を出力する多重化部と、前記指令に基づいて、前記複数の映像符号化部の一部の映像符号化部の符号化時の動き推定・補償の参照構造の位相を変更するGOP制御部と、を備え、前記解像度の高い映像を符号化する映像符号化部は、前記アップコンバート部で拡大された映像の対応フレームを、解像度の高い映像を符号化する映像符号化の際の予測候補の一つとして使用するものであり、前記瞬時的な符号化情報量が所定値を超えたとき、前記複数の映像符号化部のうちの一部の映像の符号化時の動き推定・補償の参照構造の位相を所定フレーム数ずらして発生する符号化情報量が前記所定値以内かを判断し、所定値以内であれば当該ずらした位相に前記参照構造を設定し、所定値を超えていればさらに所定フレーム数ずらすことを繰り返して、同一時刻で発生する符号化情報量を前記所定値以下に平滑化することを特徴とする。
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記映像符号化装置として機能させることを特徴とする。
本発明における映像符号化装置によれば、超高精細映像を伝送するのに十分でない帯域で、複数の超高精細映像を圧縮符号化し伝送する際に、映像を劣化させることなく(イントラピクチャを減少させることなく)、瞬時的な総発生符号量を平滑化して、帯域内での伝送を可能とすることができ、画質の劣化や破たんを防ぐことができる。また、映像自体の処理時刻はずれないので、複数の映像間での遅延差は発生しない。
さらに、本発明により、階層符号化を行う場合においては、基本階層のIピクチャを拡張階層の符号化で有効活用することにより、拡張階層の画質を向上させることができる。
実施の形態1の映像符号化装置のブロック図である。 従来の2つの画像のGOP構造と情報発生量を示す図である。 実施の形態1の2つの画像のGOP構造と情報発生量を示す図である。 GOP構造の位相を制御するフローチャートである。 実施の形態2の映像符号化装置のブロック図である。 従来の階層符号化のGOP構造と参照関係を示す図である。 実施の形態2の階層符号化のGOP構造と参照関係を示す図である。
以下、本発明の実施の形態について説明する。以降の説明では、高解像度映像としての入力信号は、8Kや4Kのような超高精細度映像を想定して説明するが、高解像度映像は8K,4Kに限定されるものではない。また、説明を簡略にするため、ここでは、2種類の異解像度の同一映像(コンテンツ)を伝送すると仮定するが、本発明は2種類の異解像度映像に限定されない。
伝送帯域に制限がある中で、2種類の映像の全体の符号化情報量を一定に保って伝送する方式として、次の3通りが考えられる。
(1)それぞれの映像を独自にCBR符号化し、一定のビットレートに保つ方法
(2)2種類の映像の統計多重により、一定のビットレートに保つ方法
(3)階層符号化を利用したうえで、一定のビットレートに保つ方法
(1)の方法は、通常のCBR符号化をそれぞれの映像に適用するものであり、2映像間での情報の相互関係は無く、合計の発生符号量を積極的に減らしたり、調整することにはならないので、本発明では採用しない。
(2)の方法は、統計多重により符号量を2つの映像に適切に配分するものであり、本発明の実施の形態1として説明する。
(3)の方法は、2つの映像を1つのストリームとして符号量を配分するものであり、本発明の実施の形態2として説明する。
(実施の形態1)
図1に、統計多重を利用した映像符号化装置100のブロック図を示す。映像符号化装置100は、第1映像符号化部110と、第2映像符号化部120と、多重化部130と、GOP制御部140とを備える。
第1入力信号(第1の入力信号)である高解像度映像は、第1映像符号化部110に入力される。第1映像符号化部110では、第1入力信号の高解像度映像を圧縮符号化する。圧縮符号化技術としては、例えばISO/IECで標準化されているMPEG-2やMPEG-4 AVCやMPEG-H HEVCなどのフレーム間予測を用いる任意の符号化技術が利用できる。第1映像符号化部110は、符号化された映像信号を多重化部130に出力するとともに、符号化された映像信号のGOPの構造(符号化時の動き推定・補償の参照構造)に関する情報を、GOP制御部140に出力する。
第2入力信号(第2の入力信号)である低解像度映像は、第2映像符号化部120に入力される。第1入力信号と第2入力信号が同一の映像コンテンツである場合は、高解像度映像を低解像度映像に変換するダウンコンバート部150を設け、第1入力信号をダウンコンバートして、第2入力信号を作成することができる。
ダウンコンバート部150は、第1入力信号としての高解像度映像を、例えば、水平、垂直共に1/2の解像度に縮小して、低解像度映像を作成する。縮小時に適用するフィルタについては、Lanczos3など既存のものを使用可能であり、特にダウンコンバートの方式を問わない。
第2映像符号化部120では、第2入力信号の低解像度映像を圧縮符号化する。圧縮符号化技術としては、例えばISO/IECで標準化されているMPEG-2やMPEG-4 AVCやMPEG-H HEVCなどのフレーム間予測を用いる任意の符号化技術が利用できるが、第1映像符号化部110と同じGOPの処理単位を用いる方式の符号化技術であることが望ましい。第2映像符号化部120は、符号化された映像信号を多重化部130に出力するとともに、符号化された映像信号のGOPの構造(符号化時の動き推定・補償の参照構造)に関する情報を、GOP制御部140に出力する。
多重化部130は、第1映像符号化部110と第2映像符号化部120の出力である2つの符号化された映像信号を、多重化して送出する。また、多重化部130は、第1映像符号化部110及び第2映像符号化部120で発生する符号化情報量を観測し、合計の瞬時的な発生情報量が閾値を超えたときに、GOP制御部140へ指令を出力する。なお、閾値は、伝送路の帯域(ビットレート)以下に瞬時的な総発生情報量を抑えることができるよう、上限値となる所定の値として設定される。
GOP制御部140は、第1映像符号化部110と第2映像符号化部120から映像符号化のGOPの構造情報を受けて、第1映像符号化部110と第2映像符号化部120のGOP構造の相互関係を管理している。また、多重化部130からの指令に基づいて、第1映像符号化部110と第2映像符号化部120の少なくとも一方に制御信号を出力し、第1映像符号化部110及び/又は第2映像符号化部120の符号化処理の際のGOP構造(符号化時の動き推定・補償の参照構造)の位相を変化させる制御を行う。
GOP制御部140の動作について、より詳細に説明する。
GOP(Group Of Picture)は、映像の圧縮・伸長の処理単位であり、一般に、フレーム間予測を行わずにイントラ予測により符号化されるイントラピクチャ(I)と、時間方向に過去のフレームからのみ予測する順方向予測のインターピクチャ(P)と、時間方向に複数のフレームから予測する双方向予測のインターピクチャ(B)の3種類から構成される。GOPの構造としては例えば、IBBPBBPBBIBBP・・・のように、ある周期でIおよびPを挿入し、その間はBとする構造や、IBBBBBBBBIBB・・・のようにIとBのみからなる構造があげられ、イントラピクチャから次のイントラピクチャまでの間を1つのGOPと定義する。また、GOP内の動き推定・補償の参照関係(参照構造)をGOP構造と呼ぶこととする。イントラピクチャの挿入周期は0.5秒や1秒など定期的にするのが一般的であるが、映像のカットチェンジ時に強制的にイントラピクチャにするなどの制御が行われることもある。イントラピクチャはフレーム間予測を行わない分、符号化による発生情報量が多くなる傾向にある。
同一コンテンツの高解像度映像と低解像度映像は、元は同じ映像であるから、GOP構造及びイントラピクチャの位置(位相)が同じであれば、各ピクチャでの発生情報量の傾向はほぼ同じになる。図2は、従来技術により、例えば同じIBBP・・・のGOP構造で高解像度映像と低解像度映像を符号化した場合の発生情報量を示したものである。この場合、図2のようにIで情報量が多くなり、次いでP、Bの順に符号化による情報が発生する。高解像度映像と低解像度映像を同時に符号化伝送する場合、図2のような傾向の発生情報量であると、同じ時刻(フレーム)に同じように情報量の増減が生じる。
そこで、本発明は、統計多重を行う多重化部130において同時刻(フレーム)での高解像度映像と低解像度映像の符号化発生情報量を観測し、両者の総和が閾値を超えた場合に、高解像度映像と低解像度映像の少なくとも一方のGOPの参照関係を変化させる指令をGOP制御部140に出力する。GOP制御部140は、第1映像符号化部110及び/又は第2映像符号化部120に制御信号を出力して、映像に対する符号化時の動き推定・補償の参照構造を変化させる。具体的には、動き推定・補償の参照関係の周期構造(例えば、IBBP等の組合せ)を変化させることなく、基準となるイントラピクチャの時刻(フレーム)をずらす。このことをGOP構造の位相をずらす、又は位相を変化させるということとする。
図3は、低解像度映像のイントラピクチャの時刻を、高解像度映像よりも2フレーム分遅らせた例である。GOPの周期構造を変えることなく、2つの映像のイントラピクチャの時刻をずらすことで、同時刻の発生情報量の総和を減らし、発生情報量を平滑化することが可能になる。
なお、符号化装置や多重化装置では、発生情報量の総計を複数フレームやGOP単位で実施するためにバッファを設けることがある。そのため、GOP構造を変化させるかどうかの判断は、通常バッファが設けられる多重化部130で行うことが望ましく、バッファが複数の符号化部に設けられた場合は、複数のバッファ内の情報量を参照して判断しても良い。
次に、GOP構造の位相を変化させるか否か、および何フレームずらすかを決める手順について説明する。
図4に、符号化部のGOP構造の位相を制御するためのフローチャートを示す。
まず、ステップ1(S1)では、第1映像符号化部110及び第2映像符号化部120で、高解像度映像及び低解像度映像をそれぞれ圧縮符号化する。最初の段階では、それぞれの映像符号化部でそれまで使用されていたGOP構造と連続性を持って映像符号化を行う。
ステップ2(S2)において、第1映像符号化部110及び第2映像符号化部120の同時刻(フレーム)での符号化発生情報量を合計し、両者の総和と閾値とを比較する。ここで発生情報量の総和が閾値を超えた場合は、ステップ3(S3)に移る。なお、発生情報量の総和が閾値を超えない場合は、いったん終了し、S1とS2を繰り返して、発生情報量の総和について、引き続き監視を行う。
ステップ3(S3)では、GOP構造の位相の変化量を設定する。すなわち、予め決められた所定のフレーム数(1回あたりのシフト量)だけ、イントラピクチャ(I)をずらすGOP位相の制御信号を出力する。映像符号化装置としては、発生情報量の総和が閾値を超えたとき、多重化部130が、映像符号化部のGOP構造の位相を変更することの指令を出力し、GOP制御部140が、この指令に基づいて第1映像符号化部110及び/又は第2映像符号化部120に対してGOP構造(動き推定・補償の参照構造)の位相を所定フレーム数変更する制御信号を出力する。例えば、GOP制御部140が、第2映像符号化部120に対して、GOPのイントラピクチャの位置を所定のフレーム数(例えば、1フレーム)ずらす制御信号を出力する。この位置(位相)のずらし方は、一方を他方より遅らせても、進めても良く、また、1回あたり何フレームずらしても構わない。
次に、ステップ4(S4)では、映像符号化部(例えば、第2映像符号化部120)において、符号化処理のGOP位相、すなわち、イントラピクチャ(I)の位置(時刻)を、S3で設定されたフレームに変更する制御を行う。そして、再度、S1に戻る。
S1では、映像フレームに対して新しく設定されたGOP構造(動き推定・補償の参照構造)に従って映像符号化を行い、S2において、新しい設定に基づく第1映像符号化部110及び第2映像符号化部120の符号化発生情報量の総和と閾値とを比較する。
この比較結果について、依然として発生情報量の総和が閾値を超えていた場合は、引き続き、S3→S4→S1→S2の処理を繰り返す。なお、処理を繰り返すごとに、映像符号化の際のイントラピクチャの位置は、所定のフレーム数ずつずれていく。
S2の比較結果について、その際のフレームごとの発生情報量和の最大値が予め定めた閾値以下であれば、GOP構造の位相をそのフレーム分だけずらすことに決定して、終了する。
なお、最終的に、GOP構造の位相を変更した後に符号化された信号は、多重化部130で多重化されて出力される。また、S2の発生情報量の総和の監視は、その後も引き続き行われる。
図4のフローチャートにおいては、S3の判断条件を発生情報量が閾値を超えたときとしたが、発生情報量が閾値以上となったときとしても良く、発生情報量が伝送路の帯域を超過することを検出する条件を適宜設定してよい。
この実施の形態において、入力信号は、2種類の異解像度の同一映像(コンテンツ)としたが、3種類以上の異解像度の映像であっても良い。このとき、映像符号化装置には、入力数に応じた映像符号化部を設ける。また、符号化発生情報量の総和が閾値を超えたときは、複数の映像符号化部のうち任意のGOP構造の位相を調整することができる。このとき、映像符号化部ごとに位相のずらし方を設定することができ、例えば、第1映像符号化部のイントラピクチャ(I)の位置を基準として、第2映像符号化部はイントラピクチャの位置を、第1の所定のフレーム数(例えば、1フレーム)ずつずらし、第3映像符号化部はイントラピクチャの位置を、第2の所定のフレーム数(例えば、2フレーム)ずつずらして、符号化発生情報量の総和を調整することができる。
また、この実施の形態においては、2種類の異解像度の映像が、異なるコンテンツの映像であっても同様に、帯域内での伝送を可能とするとの作用・効果が得られる。さらに、第1入力信号と第2入力信号の解像度が同じ場合であっても、映像符号化装置として同様に効果がある。
(実施の形態2)
以下に、本発明の実施の形態2について説明をする。本発明の実施の形態2の映像符号化装置は、階層符号化を利用するものである。
図5に、階層符号化を利用した映像符号化装置200のブロック図を示す。映像符号化装置200は、第1映像符号化部110と、第2映像符号化部120と、多重化部130と、GOP制御部140と、基本階層映像局所復号部160と、アップコンバート部170とを備える。
第1入力信号(第1の入力信号)である高解像度映像は、第1映像符号化部110に入力される。第1映像符号化部110では、第1入力信号の高解像度映像を圧縮符号化するが、ここでは、高解像度映像は階層符号化の拡張階層(EL:Enhancement Layer)として第1映像符号化部110へ送られ、第1映像符号化部110は拡張階層符号化処理を行う。その際、基本階層の映像(基本階層の符号化信号を復号し、アップコンバート部170で拡大した映像)は、拡張階層符号化の際の予測候補の一つとして使用することができる。圧縮符号化技術としては、例えばISO/IECで標準化されているMPEG-2やMPEG-4 AVCやMPEG-H HEVCなどのフレーム間予測を用いる任意の符号化技術が利用できる。第1映像符号化部110は、符号化された映像信号(拡張階層符号化信号)を多重化部130に出力するとともに、符号化された映像信号のGOPの構造(符号化時の動き推定・補償の参照構造)に関する情報を、GOP制御部140に出力する。
第2入力信号(第2の入力信号)である低解像度映像は、第2映像符号化部120に入力される。第1入力信号と第2入力信号が同一の映像コンテンツである場合は、高解像度映像を低解像度映像に変換するダウンコンバート部150を設け、第1入力信号をダウンコンバートして、第2入力信号を作成することができる。
ダウンコンバート部150は、第1入力信号としての高解像度映像を、例えば、水平、垂直共に1/2の解像度に縮小して、低解像度映像を作成する。縮小時に適用するフィルタについては、Lanczos3など既存のものを使用可能であり、特にダウンコンバートの方式を問わない。
第2映像符号化部120では、第2入力信号の低解像度映像を圧縮符号化するが、ここでは、低解像度映像は階層符号化の基本階層(BL:Base Layer)として第2映像符号化部120に送られ、第2映像符号化部120は基本階層符号化処理を行う。圧縮符号化技術としては、例えばISO/IECで標準化されているMPEG-2やMPEG-4 AVCやMPEG-H HEVCなどのフレーム間予測を用いる任意の符号化技術が利用できるが、第1映像符号化部110と同じGOPの構成を用いる方式の符号化技術であることが望ましい。第2映像符号化部120は、符号化された映像信号(基本階層符号化信号)を多重化部130と基本階層映像局所復号部160に出力するとともに、符号化された映像信号のGOPの構造(符号化時の動き推定・補償の参照構造)に関する情報を、GOP制御部140に出力する。
基本階層映像局所復号部160は、第2映像符号化部120の出力である基本階層の符号化信号を復号し、第2入力信号の低解像度映像(基本階層)を生成する。ただし、生成された映像は、符号化により情報圧縮された後に復号されるため、符号化時のGOP構造(I,P,Bのいずれで圧縮されたか等)の影響をうけており、第2入力信号の低解像度映像を完全に復元するものではない。
アップコンバート部170は、基本階層映像局所復号部160で復号して得られた低解像度映像(基本階層)をアップコンバートし、元の解像度に拡大して、第2符号化部(拡張階層符号化部)110に出力する。拡大時に使用するフィルタはLanczos3など既存の方式を使用可能で、特に方式を問わない。なお、拡大された映像は、元の映像を縮小し、符号化及び復号処理を行った後、拡大処理されたものであるので、元の映像とは同一にはならない。
多重化部130とGOP制御部140の動作は、基本的には実施の態様1と同じである。すなわち、多重化部130は、第1映像符号化部110と第2映像符号化部120の出力である2つの符号化された映像信号を、多重化して送出する。また、多重化部130は、第1映像符号化部110及び第2映像符号化部120で発生する符号化情報量(同時刻(フレーム)での基本階層映像と拡張階層映像の符号化発生情報量)を観測し、合計の瞬時的な発生情報量が閾値を超えたときに、GOP制御部140へ指令を出力する。
GOP制御部140は、第1映像符号化部110と第2映像符号化部120から映像符号化のGOPの構造情報を受けて、第1映像符号化部110と第2映像符号化部120のGOP構造の相互関係を管理している。また、多重化部130からの指令に基づいて、第1映像符号化部110と第2映像符号化部120の少なくとも一方に制御信号を出力し、第1映像符号化部110及び/又は第2映像符号化部120の符号化処理の際のGOP構造(符号化時の動き推定・補償の参照構造)の位相を所定のフレーム数だけ変化させる制御を行う。
階層符号化について、図6に基づいて、簡単に説明する。階層符号化は上記のMPEG-2やMPEG-4 AVCやMPEG-H HEVCなどの符号化技術の拡張として規格化されている方式を用いることができる。例えば、MPEG-H HEVCでは、基本階層の符号化信号を復号しアップコンバート部170で拡大された映像は、拡張階層符号化の際の予測候補の一つとして使用される。図6の矢印は、動き推定・補償の参照関係を示している。階層符号化の場合、基本階層(BL)は通常の符号化と同様の処理を施されるが、拡張階層(EL)に関しては、BLからの予測とELの他フレームからの予測で構成される。
図7は、拡張階層映像のイントラピクチャの時刻を基本階層映像よりも1フレーム分遅らせた例である。2つの映像のイントラピクチャの時刻をずらすことで同じ時刻の発生情報量の総和を減らすことが可能になる。なお、GOP構造の位相を変化させるかどうかの判断、及び、何フレーム分ずらすかの決定は、図4のフローチャートに従って同様に行うことができる。発生情報量と閾値との比較は、通常バッファが設けられる多重化部130で行うことが望ましいが、両方の符号化出力のバッファが設けられる第1映像符号化部(拡張階層符号化部)で実施することも可能である。
また、図7の太線の囲いで示すように、ELのBピクチャの予測にBLのIピクチャやPピクチャを使用するフレームがある。図6の従来の階層符号化処理のように、GOP構造がBLとELで同一の場合には、ELのBはBLのBからの予測となるが、本発明(図7)では、IやPからの予測を行うことで、Bからの予測よりも高い画質の参照フレームを使用することができ、結果的にELのBの画質が向上する効果がある。
GOP構造の位相を変更した後に符号化された信号は、多重化部130で多重されて出力される。
この実施の形態において、入力信号は、基本階層映像と拡張階層映像の2種類の異解像度の同一映像(コンテンツ)としたが、さらに、中間の階層映像を加えて、3種類以上の異解像度の映像を対象としても良い。このとき、映像符号化装置には、入力数に応じた映像符号化部を設けるとともに、下位の映像符号化部には、映像符号化した信号を復号する局所復号部と、復号された映像をアップコンバートして上位の階層の映像符号化部へ出力するアップコンバート部をそれぞれ設ける。また、符号化発生情報量の総和が閾値を超えたときは、複数の映像符号化部のうち任意のGOP構造の位相を調整することができる。このとき、映像符号化部ごとに位相のずらし方を設定することができ、符号化発生情報量の総和を調整することができる。
なお、この実施の形態2において、HEVCの階層符号化処理を利用する場合は、2種類の異解像度の映像が、異なるコンテンツの映像であっても、映像符号化装置として同様に機能することができる。
なお、上述した映像符号化装置として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、映像符号化装置の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックやステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
100 映像符号化装置
110 第1映像符号化部
120 第2映像符号化部
130 多重化部
140 GOP制御部
150 ダウンコンバート部
160 基本階層映像局所復号部
170 アップコンバート部
200 映像符号化装置

Claims (3)

  1. 複数の異なる解像度の同一映像を、同時に圧縮符号化し、多重化する映像符号化装置において、
    高解像度映像を符号化する第1の映像符号化部と、前記第1の映像符号化部への入力映像信号をダウンコンバートした低解像度映像を符号化する第2の映像符号化部とを有する複数の映像符号化部と、
    前記複数の映像符号化部の出力を多重化するとともに、前記複数の映像符号化部で発生する符号化情報を統計多重により多重化した結果生じる合計の瞬時的な符号化情報量が所定値を超えたときに指令を出力する多重化部と、
    前記指令に基づいて、前記複数の映像符号化部の一部の映像符号化部の符号化時の動き推定・補償の参照構造の位相を変更するGOP制御部と、
    を備え、
    前記瞬時的な符号化情報量が所定値を超えたとき、前記複数の映像符号化部のうちの一部の映像の符号化時の動き推定・補償の参照構造の位相を所定フレーム数ずらして発生する符号化情報量が前記所定値以内かを判断し、所定値以内であれば当該ずらした位相に前記参照構造を設定し、所定値を超えていればさらに所定フレーム数ずらすことを繰り返して、同一時刻で発生する符号化情報量を前記所定値以下に平滑化することを特徴とする映像符号化装置。
  2. 複数の異なる解像度の同一映像を、同時に圧縮符号化し、多重化する映像符号化装置であって、前記圧縮符号化は、基本とする映像から解像度の高い映像を予測する構造を有する圧縮符号化である映像符号化装置において、
    基本とする映像を符号化する映像符号化部と解像度の高い映像を符号化する映像符号化部を含む複数の映像符号化部と、
    前記基本とする映像を符号化する映像符号化部の出力を復号して、解像度の低い映像を生成する局所復号部と、
    前記解像度の低い映像を拡大して前記解像度の高い映像を符号化する映像符号化部に出力するアップコンバート部と、
    前記複数の映像符号化部の出力を多重化するとともに、前記複数の映像符号化部で発生する符号化情報を統計多重により多重化した結果生じる合計の瞬時的な符号化情報量が所定値を超えたときに指令を出力する多重化部と、
    前記指令に基づいて、前記複数の映像符号化部の一部の映像符号化部の符号化時の動き推定・補償の参照構造の位相を変更するGOP制御部と、
    を備え、
    前記解像度の高い映像を符号化する映像符号化部は、前記アップコンバート部で拡大された映像の対応フレームを、解像度の高い映像を符号化する映像符号化の際の予測候補の一つとして使用するものであり、
    前記瞬時的な符号化情報量が所定値を超えたとき、前記複数の映像符号化部のうちの一部の映像の符号化時の動き推定・補償の参照構造の位相を所定フレーム数ずらして発生する符号化情報量が前記所定値以内かを判断し、所定値以内であれば当該ずらした位相に前記参照構造を設定し、所定値を超えていればさらに所定フレーム数ずらすことを繰り返して、同一時刻で発生する符号化情報量を前記所定値以下に平滑化することを特徴とする映像符号化装置。
  3. コンピュータを、請求項1又は2に記載の映像符号化装置として機能させるためのプログラム。
JP2015096384A 2015-05-11 2015-05-11 映像符号化装置及びプログラム Expired - Fee Related JP6527384B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015096384A JP6527384B2 (ja) 2015-05-11 2015-05-11 映像符号化装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015096384A JP6527384B2 (ja) 2015-05-11 2015-05-11 映像符号化装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2016213698A JP2016213698A (ja) 2016-12-15
JP6527384B2 true JP6527384B2 (ja) 2019-06-05

Family

ID=57552067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015096384A Expired - Fee Related JP6527384B2 (ja) 2015-05-11 2015-05-11 映像符号化装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6527384B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07193820A (ja) * 1993-12-27 1995-07-28 Toshiba Corp 映像高能率符号化方式及び映像高能率符号化装置
JP3147859B2 (ja) * 1998-06-12 2001-03-19 日本電気株式会社 映像信号の多チャネル符号化装置
JP3866538B2 (ja) * 2001-06-29 2007-01-10 株式会社東芝 動画像符号化方法及び装置
JP2010034939A (ja) * 2008-07-30 2010-02-12 Victor Co Of Japan Ltd 動画像符号化装置および動画像符号化方法
JP5197428B2 (ja) * 2009-02-20 2013-05-15 キヤノン株式会社 画像符号化装置及び画像符号化方法

Also Published As

Publication number Publication date
JP2016213698A (ja) 2016-12-15

Similar Documents

Publication Publication Date Title
KR100329892B1 (ko) 다수의 비디오 프레임 스트림 처리 방법 및 그 장치
JP4109113B2 (ja) ビデオ伝送におけるビットストリーム間の切換
US6408096B2 (en) Method for computational graceful degradation in an audiovisual compression system
US7706447B2 (en) Switching between bit-streams in video transmission
US10341660B2 (en) Video compression apparatus and video playback apparatus
US20100091842A1 (en) Coding rate conversion apparatus, coding rate conversion method, and integrated circuit
US20160127728A1 (en) Video compression apparatus, video playback apparatus and video delivery system
KR102198120B1 (ko) 비디오 인코딩 방법, 비디오 인코딩 디바이스, 비디오 디코딩 방법, 비디오 디코딩 디바이스, 프로그램, 및 비디오 시스템
US10531094B2 (en) Image processing device and moving image transmission method
KR20140110221A (ko) 비디오 인코더, 장면 전환 검출 방법 및 비디오 인코더의 제어 방법
US8948242B2 (en) Encoding device and method and multimedia apparatus including the encoding device
JP5640979B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP5979406B2 (ja) 画像処理装置、画像処理方法、および画像処理システム
JP2015171114A (ja) 動画像符号化装置
JP3519673B2 (ja) 動画データ作成装置及び動画符号化装置
US6040875A (en) Method to compensate for a fade in a digital video input sequence
WO2011108146A1 (ja) 画像符号化装置、画像符号化復号化システム、画像符号化方法、画像表示方法
JP6527384B2 (ja) 映像符号化装置及びプログラム
JP6677230B2 (ja) 映像符号化装置、映像復号装置、映像システム、映像符号化方法、及び映像符号化プログラム
JP6241565B2 (ja) 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム
KR100626419B1 (ko) 비디오 전송에서 비트 스트림들간의 교환
JPH11234671A (ja) 信号処理装置
JP2005072995A (ja) レート変換装置
JP4346732B2 (ja) ビデオ・フレームの多重ストリームを処理する方法及びシステム
JP4745293B2 (ja) 画像データの符号化方法および符号化装置、復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190510

R150 Certificate of patent or registration of utility model

Ref document number: 6527384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees