JP6577426B2 - トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置 - Google Patents

トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置 Download PDF

Info

Publication number
JP6577426B2
JP6577426B2 JP2016146775A JP2016146775A JP6577426B2 JP 6577426 B2 JP6577426 B2 JP 6577426B2 JP 2016146775 A JP2016146775 A JP 2016146775A JP 2016146775 A JP2016146775 A JP 2016146775A JP 6577426 B2 JP6577426 B2 JP 6577426B2
Authority
JP
Japan
Prior art keywords
frame
bit stream
intra
unit
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016146775A
Other languages
English (en)
Other versions
JP2018019186A (ja
Inventor
圭 河村
圭 河村
佳隆 木谷
佳隆 木谷
内藤 整
整 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2016146775A priority Critical patent/JP6577426B2/ja
Publication of JP2018019186A publication Critical patent/JP2018019186A/ja
Application granted granted Critical
Publication of JP6577426B2 publication Critical patent/JP6577426B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置に関する。
イントラ予測(フレーム内予測)またはインター予測(フレーム間予測)と、残差変換と、エントロピー符号化とを用いた動画像符号化方式が提案されている。そのような動画像符号化により生成される動画像のビットストリームから設定の異なる動画像のビットストリームを生成することをトランスコードと呼ぶ。例えば、解像度は同一のままビットレートのみを削減する場合や、解像度を縮小した映像を生成する場合にトランスコードが利用される。
原動画像のビットストリームのトランスコードにより得られる画質と、原動画像を直接エンコードすることにより得られる画質と、を比較すると、一般的にトランスコード画質のほうが低い。したがって、トランスコードにおいては、直接エンコードの結果に近いほど性能が良いと言える。トランスコーダの符号化性能を改善するために、トランスコーダの符号化部の符号化性能を改善することがまず考えられる。しかしながら、符号化部の性能が改善されたとしても、得られるのは符号化部に入力される動画像(=トランスコーダの復号部から出力される動画像)を正確に再現できるビットストリームであり、これが原動画像をより良く再現できているという保証はない。したがって、符号化部単体の符号化性能の改善とは異なる方式が必要となる。
従来では、動画像に含まれるフレームのうちイントラフレームが最も高画質であると考えられていた。したがって、トランスコードにおいて入力ビットストリームのイントラフレームが、出力ビットストリームでもイントラフレームとして符号化されていると、トランスコードによる劣化が少ないということになる。例えば、特許文献1には、入出力ビットストリームでイントラフレームを揃えることが開示されている。これを含め符号化構造を入出力ビットストリームで一致させることを、符号化構造を引き継ぐと表現する。
特開2000−092497号公報
しかしながら、入力ビットストリームの符号化構造を単純に引き継ぐと、入力ビットストリームに含まれるより高画質なインターフレームを劣化させ、画質劣化が大きくなる虞がある。
本発明はこうした課題に鑑みてなされたものであり、その目的は、ビットストリームをパースすることなくトランスコードの際のイントラフレームを決定できる技術の提供にある。
本発明のある態様は、トランスコードシステムに関する。このトランスコードシステムは、動画像のビットストリームを取得する手段と、取得されたビットストリームとは設定の異なる新たなビットストリームを出力する手段と、取得されたビットストリームから高位シンタックスの復号により得られる情報を抽出する手段と、抽出された情報に基づいて、新たなビットストリームにおいてイントラフレームとされるべきフレームを特定する手段と、を備える。
なお、以上の構成要素の任意の組み合わせや、本発明の構成要素や表現を装置、方法、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で相互に置換したものもまた、本発明の態様として有効である。
本発明によれば、ビットストリームをパースすることなくトランスコードの際のイントラフレームを決定できる。
実施の形態に係るトランスコード装置を備えるケーブルテレビシステムの構成を示す模式図である。 入力ビットストリームにおけるフレームの階層構造の一例を示す説明図である。 入力ビットストリームおよび出力ビットストリームの構造を示す説明図である。 図1のトランスコード装置の機能および構成を示すブロック図である。 図4の順番保持部の一例を示すデータ構造図である。 図4のフレーム構造制御部における一連の処理を示すフローチャートである。
以下、各図面に示される同一または同等の構成要素、部材、処理、信号には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。
実施の形態に係るトランスコード装置は、入力されたビットストリームのNAL(Network Abstraction Layer )ヘッダを復号して得られる情報のうち符号化構造とフレーム種別とフレームごとの発生符号量とを抽出する。トランスコード装置の符号化部は、入力ビットストリームのうち、イントラフレームに限定せずより画質の高いと推定されるフレームを出力ビットストリームのイントラフレームとして符号化を行う。動き補償予測の有効度合いが低い動画像では入力ビットストリームのイントラフレームの画質がインターフレームの画質よりも高いと推定され、動き補償予測の有効度合いが高い動画像では入力ビットストリームのインターフレームの画質がイントラフレームの画質よりも高いと推定される。より画質の高いフレームを出力ビットストリームのイントラフレームとすることで、トランスコードにおける画質の劣化を抑制できる。
図1は、実施の形態に係るトランスコード装置100を備えるケーブルテレビシステム10の構成を示す模式図である。ケーブルテレビシステム10は、放送事業者サーバ12と、センター設備14と、ケーブルネットワーク16と、エンドユーザ18と、を備える。放送事業者サーバ12は放送事業者により運営され、比較的高解像度または高ビットレートの動画像を有線または無線によりセンター設備14に提供する。センター設備14は放送事業者サーバ12およびケーブルネットワーク16と接続される。センター設備14は、実施の形態に係るトランスコード装置100を備える。センター設備14は放送事業者サーバ12から動画像を取得し、取得された動画像の設定すなわち解像度やビットレートを、トランスコード装置100を利用してケーブルネットワーク16の仕様に合うよう変更する。センター設備14は、トランスコードの結果得られた動画像をケーブルネットワーク16に送信する。複数のエンドユーザ18のそれぞれはケーブルネットワーク16と接続され、ケーブルネットワーク16から取得された動画像をセットトップボックスや他の復号装置を使用して再生する。例えば、放送事業者サーバ12が送信する動画像の解像度は4K、ビットレートは25Mbpsであり、センター設備14からケーブルネットワーク16に送信される動画像の解像度はHD(High Definition)、ビットレートは10Mbpsである。
なお、ケーブルテレビシステム10は一例であり、実施の形態に係るトランスコード装置100は動画像の復号およびそれに続く符号化を含む任意のシステムやサービスに適用可能である。そのようなシステムやサービスでは、ケーブルネットワーク16の代わりにインターネットや電話網などが用いられてもよい。
また、本実施の形態ではレート制御を行い、特に固定ビットレートを採用する。しかしながら、固定ビットレート以外の他のレート制御を採用する場合にも本実施の形態に係る技術的思想を適用できることは、本明細書に触れた当業者には明らかである。
より具体的には、放送事業者サーバ12は動画像を符号化して入力ビットストリームBSIを生成する。トランスコード装置100は放送事業者サーバ12から入力ビットストリームBSIを取得し、取得された入力ビットストリームBSIを復号し、設定を変えて符号化することで出力ビットストリームBSTを生成する。トランスコード装置100は生成された出力ビットストリームBSTをケーブルネットワーク16に出力する。エンドユーザ18はケーブルネットワーク16から出力ビットストリームBSTを取得し、それを復号する。入力ビットストリームBSI、出力ビットストリームBSTはいずれもHEVC(High Efficiency Video Coding)に準拠した構造を有する。
図2は、入力ビットストリームBSIにおけるフレームの階層構造の一例を示す説明図である。図2において、横軸は表示の順番(以下、表示順フレーム番号と称す)を示す。各ブロック内の上段はイントラフレームすなわちIフレーム(Intra Frame)であるかインターフレームすなわちBフレーム(Bi-directional Frame)であるかの別を示すフレーム種別を示し、下段は符号化の順番(復号の順番でもあり、以下復号順フレーム番号と称す)を示す。
図2に示される階層構造では、Bフレームが再帰的に参照される。参照される回数の多いフレームほど量子化値(Quantization Parameter, QP)を小さく設定し、全く参照されないフレームは量子化値を相対的に大きく設定する(QP1<QP2<QP3<QP4<QP5)ことで、符号量削減と実現される画質とのトレードオフが実現される。これにより、高い符号化性能を実現できる。なお、図2中で参照関係を高さ方向に拡張しているが、これを階層と呼ぶ。例えば、復号順フレーム番号が3、6、11、14のフレームは同じ階層に属する。復号順フレーム番号が3、6のフレームは、復号順フレーム番号が2のフレームよりも階層が深いと呼ぶ。
階層構造における浅い階層のBフレームは参照回数が多いため、Iフレームが属する階層の量子化値からそのBフレームが属する階層の量子化値への増分を小さく設定する。さらに、動き補償予測がよく当たる場合、誤差(残差)信号は主に参照フレーム(例えばIフレーム)における量子化誤差に起因する。そのため、BフレームのビットはIフレームの量子化誤差を削減することになる。結果として、Iフレームよりも高画質なBフレームが送られる場合が生じる。このように、入力ビットストリームBSIのBフレームがIフレームよりも高画質となる場合、符号化構造を単純に引き継ぐと、入力ビットストリームBSIに含まれるより高画質なBフレームが劣化し、画質の劣化が大きくなる。これに対して本実施の形態では、入力ビットストリームBSIから高画質のBフレームを検出し、検出されたBフレームを出力ビットストリームBSTにおけるIフレームとする。これにより、画質の劣化を低減または除去できる。
図3は、入力ビットストリームBSIおよび出力ビットストリームBSTの構造を示す説明図である。入力ビットストリームBSI、出力ビットストリームBSTはいずれもHEVCに準拠するので、同様の構造を有する。ビットストリームは、複数のシーケンス(Coded Video Sequence, CVS)と、EoB(End of bitstream NAL unit)から構成される。CVSは、複数のGOP(Group of Pictures)と、EoS(End of Sequence NAL unit)から構成される。GOPは、複数のアクセスユニット(Access Unit, AU)から構成される。AUは、複数のネットワーク抽象レイヤユニット(Network Abstraction Layer Unit, NALU)から構成される。
NALUは、NALヘッダと、RBSP(Raw Byte Sequence Payload)と、RBSPトレイリングビットと、を含む。NALヘッダは、2バイト(16ビット)の固定長であり、NALUのタイプを示すNALUタイプ(Nal_unit_type(6ビット))を含む。NALUは映像符号化レイヤ(video coding layer, VCL)と非映像符号化レイヤ(non-VCL)との2つに大別される。VCLには、TRAIL(Trailing Picture Slice)、TSA(Temporal Sub-layer Access Slice)、STSA(Step-wise Temporal Sub-layer Access Slice)、RADL(Random Access Decodable Leading Slice)、RASL(Random Access Skipped Leading Slice)、BLA(Broken Link Access Slice)、IDR(Instantaneous Decoding Refresh Slice)、CRA(Clean Random Access Slice)等が含まれる。non−VCLには、VUI(Video Usability Information)、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)、VPS(Video Parameter Set)、PTSEI(Picture Timing Supplemental Enhancement Information)等が含まれる。ビットストリームのうち、NALヘッダおよび各種パラメータセット、SEIは高位シンタックスに含まれるが、例えばVCLのRBSPは高位シンタックスに含まれない。
TRAIL、TSA、STSA、RADL、RASL、BLAはBフレームに対応し、IDR、CRAはIフレームに対応する。本実施の形態に係るトランスコード装置100は入力ビットストリームBSIからNALヘッダを抽出して復号する。復号結果に含まれるNALUタイプがTRAIL、TSA、STSA、RADL、RASL、BLAのいずれかである場合、トランスコード装置100は対応するフレームの種別をBフレームと決定する。復号結果に含まれるNALUタイプがIDR、CRAのいずれかである場合、トランスコード装置100は対応するフレームの種別をIフレームと決定する。すなわち、NALUタイプはインターフレームであるかイントラフレームであるかの別を示す情報として利用される。
図4は、図1のトランスコード装置100の機能および構成を示すブロック図である。ここに示す各ブロックは、ハードウエア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解される。
トランスコード装置100は、復号部102と、符号化部104と、フレーム構造制御部106と、を備える。復号部102は、入力ビットストリームBSIを取得し、取得された入力ビットストリームBSIを復号して動画像を再構成し、再構成動画像を符号化部104に出力する。符号化部104は、復号部102で生成された再構成動画像を取得し、取得された再構成動画像を符号化することで新たなビットストリームである出力ビットストリームBSTを生成し、生成された出力ビットストリームBSTをケーブルネットワーク16へ出力する。符号化部104では、入力ビットストリームBSIの解像度やビットレートとは異なる解像度やビットレートの出力ビットストリームBSTが生成される。フレーム構造制御部106は、入力ビットストリームBSIを取得し、取得された入力ビットストリームBSIの高位シンタックスに基づいて出力ビットストリームBSTのフレーム構造を制御する。なお、解像度を変更する場合は、復号部102と符号化部104との間に解像度変換部が挿入される。
復号部102は、エントロピー復号部108と、第1フレームバッファ110と、第1インループフィルタ112と、第1逆量子化・逆変換部114と、第1インター予測部116と、第1イントラ予測部118と、第1加算部120と、を含む。
エントロピー復号部108は入力ビットストリームBSIを受信し、受信した入力ビットストリームBSIをエントロピー復号し、レベル値とサイド情報とを取り出す。なお、ビットストリームからサイド情報およびレベル値を得る処理はパース(parse)処理と称される。このようにして得られたサイド情報およびレベル値を用いて画素値を再構成することは、復号処理と称される。
入力ビットストリームBSIが表す動画像のフレームは複数のブロックに分割されている。ブロックのサイズは様々であり、複数のブロックは四分木構造を有する。本実施の形態におけるフレームのブロックへの分割は、HEVCにおけるブロック分割に準じる。すなわち、もっとも大きな処理サイズであるCTU(Coding Tree Unit)のサイズは64×64であり、これを繰り返し四分割した32×32、16×16、8×8のサイズが存在する。
サイド情報は、復号部102やエンドユーザ18に設けられた復号装置において使用される、画素値の再構成に必要な情報であり、イントラ予測またはインター予測の何れを使用したかを示す予測モード、動き情報、量子化値、ブロックサイズ等の関連情報を含む。
第1逆量子化・逆変換部114は、エントロピー復号部108におけるパース処理の結果得られるレベル値をブロックごとに逆量子化および逆変換して誤差信号を生成する。第1加算部120は、処理対象ブロックがイントラ予測されたものであるかインター予測されたものであるかに応じて、第1インター予測部116または第1イントラ予測部118のいずれか一方が出力する処理対象ブロックの予測画像と第1逆量子化・逆変換部114によって生成された処理対象ブロックの誤差信号とを加算し、処理対象ブロックを再生する。第1加算部120は、再生された処理対象ブロックを第1イントラ予測部118と第1インループフィルタ112とに出力する。
第1インター予測部116には、第1フレームバッファ110から以前のフレームの画像データが入力される。第1インター予測部116は、以前のフレームに基づくフレーム間予測により処理対象ブロックの予測画像を生成し、出力する。第1イントラ予測部118は再生されたブロックを使用してフレーム内予測を行い処理対象ブロックの予測画像を生成し、出力する。第1インループフィルタ112は例えばデブロックフィルタである。第1インループフィルタ112は、フレームに対応する局所復号画像を生成して第1フレームバッファ110に出力する。この局所復号画像は、第1インター予測部116におけるフレーム間予測に使用されると同時に、再構成動画像のフレームとして符号化部104に出力される。
符号化部104は、第2フレームバッファ122と、第2インループフィルタ124と、第2インター予測部126と、第2イントラ予測部128と、減算部130と、第2加算部132と、変換・量子化部134と、第2逆変換・逆量子化部136と、エントロピー符号化部138と、選択部140と、を含む。復号部102から出力された再構成動画像のフレームは、ブロックごとに減算部130と第2インター予測部126と第2イントラ予測部128とに入力される。
第2インター予測部126には、第2フレームバッファ122から以前のフレームの画像データが入力される。第2インター予測部126は、以前のフレームに基づくフレーム間予測により処理対象ブロックの予測画像を生成し、出力する。第2イントラ予測部128には、処理対象フレームの既に処理したブロックの画像データが第2加算部132から入力される。第2イントラ予測部128は、処理対象フレームの他のブロックに基づき、処理対象ブロックの予測画像を生成し、出力する。選択部140は、フレーム構造制御部106によって制御され、処理対象ブロックにフレーム間予測を適用するか、フレーム内予測を適用するか、をフレームごとに選択する。選択部140は選択結果に基づく予測画像を減算部130および第2加算部132に出力する。
減算部130は、ブロック単位で符号化対象の画像と予測画像との誤差信号を生成する。減算部130は、処理対象ブロックと、第2インター予測部126が出力した予測画像または第2イントラ予測部128が出力した予測画像と、の誤差を示す誤差信号を出力する。変換・量子化部134は、ブロック単位で誤差信号を変換(例えば、直交変換)および量子化し、レベル値を生成する。変換・量子化部134は、生成されたレベル値をエントロピー符号化部138および第2逆変換・逆量子化部136に出力する。エントロピー符号化部138は、変換・量子化部134によって生成されたレベル値とサイド情報とをエントロピー符号化して、出力ビットストリームBSTを生成し、出力する。
第2逆変換・逆量子化部136は、変換・量子化部134における処理とは逆の処理を行って誤差信号を生成(再生成)する。第2加算部132は、第2逆変換・逆量子化部136が出力する誤差信号と、選択部140が出力する予測画像と、を加算して処理対象ブロックを生成し、第2イントラ予測部128と第2インループフィルタ124とに出力する。第2インループフィルタ124は、処理対象フレームに対応する局所復号画像を生成して第2フレームバッファ122に出力する。この局所復号画像は、第2インター予測部126におけるフレーム間予測に使用される。
フレーム構造制御部106は、抽出部142と、特定部144と、順番保持部154と、を含む。抽出部142は、入力ビットストリームBSIを取得し、取得された入力ビットストリームBSIから高位シンタックスの復号により得られる情報を抽出する。特定部144は、入力ビットストリームBSIにおいてIフレームであったかBフレームであったかによらずに、抽出部142によって抽出された情報に基づいて出力ビットストリームBSTにおいてIフレームとされるべきフレームを特定する。順番保持部154は、入力ビットストリームBSIのフレームごとに復号順フレーム番号と表示順フレーム番号と画質の指標とを対応付けて保持する。
抽出部142は、部分抽出部146と、部分復号部148と、を有する。部分抽出部146は、入力ビットストリームBSIを取得する。部分抽出部146は、取得された入力ビットストリームBSIから、NALヘッダとPPSに対応するNALUとPTSEIに対応するNALUとを抽出する。
部分復号部148は、部分抽出部146によって抽出されたNALヘッダを復号する。部分復号部148は、復号結果に含まれるNALUタイプからフレーム種別を決定する。部分復号部148は、入力ビットストリームBSIに含まれるNALヘッダの並びおよび各NALヘッダを解析することで、復号順フレーム番号を特定する。復号順フレーム番号は、入力ビットストリームBSIにおけるフレームの並びを表し、任意の番号から開始して1フレームごとに加算されていく。部分復号部148は、部分抽出部146によって抽出されたNALUを復号し、PTSEIを取得する。部分復号部148は、取得されたPTSEIを解析することで、表示順フレーム番号を特定する。
部分復号部148は、NALヘッダ間のビットストリーム部分の符号量を測定する。符号量は、画質に依存して変化するので、フレームの画質の指標となる。ただし、IフレームとBフレームとでは符号化方式が異なるので、それらの間での符号量の単純な比較は意味が無い。部分復号部148は、部分抽出部146によって抽出されたNALUを復号し、PPSを取得する。部分復号部148は、取得されたPPSに記載された量子化値を特定する。量子化値は、一般に小さいほど対応するフレームの画質が良いと言えるので、フレームの画質の指標となる。
このようにして、部分復号部148は、入力ビットストリームBSIのフレームごとに復号順フレーム番号と表示順フレーム番号とフレーム種別と符号量と量子化値とを特定し、順番保持部154に登録すると共に判定部150に出力する。
図5は、順番保持部154の一例を示すデータ構造図である。図5に示される例は図2に示されるフレーム構造に対応する。順番保持部154は、復号順フレーム番号と表示順フレーム番号とフレーム種別と符号量と量子化値とを対応付けて保持する。f_intraは、入力ビットストリームBSIに含まれるあるIフレームの復号順フレーム番号を示す自然数である。Mはf_intraで特定されるIフレームの表示順フレーム番号を示す自然数である。
図4に戻り、特定部144は、判定部150と、イントラ特定部152と、を有する。判定部150は、入力ビットストリームBSIのBフレームの量子化値および符号量に基づいて、該Bフレームを出力ビットストリームBSTにおけるIフレームとすべきか否かを判定する。イントラ特定部152は、判定部150においてIフレームとすべきと判定された場合、判定対象のBフレームを、出力ビットストリームBSTにおいてIフレームとされるべきフレームとして特定する。イントラ特定部152は、特定されたフレームがIフレームとなるよう、すなわち特定されたフレームについて第2イントラ予測部128からの予測画像が選択されるよう、選択部140を制御する。その結果、符号化部104では、入力ビットストリームBSIから出力ビットストリームBSTを生成する際、特定されたフレームはIフレームとして符号化される。
より具体的には、判定部150はまず、入力ビットストリームBSIのBフレームの量子化値に基づいて、該Bフレームを出力ビットストリームBSTにおけるIフレームとすべきか否かを判定する。判定部150は、任意の手段により外部から与えられる自然数Nを取得する。判定部150は、順番保持部154を参照し、Iフレームの量子化値と、該Iフレームから復号順に数えてN番目となる判定対象のBフレームの量子化値と、の差分を算出する。判定部150は、算出された差分が所定のしきい値以上の場合には、判定対象のBフレームを出力ビットストリームBSTにおけるIフレームとすべきでないと判定する。そのように判定された場合、判定対象のBフレームはIフレームとして特定されない。この場合、判定部150は、変数f_startをIフレームの復号順フレーム番号(=f_intra)に設定する。判定部150は、算出された差分がしきい値未満の場合には、判定対象のBフレームを出力ビットストリームBSTにおけるIフレームとすべきであると判定する。
次に判定部150は、判定対象のBフレームが量子化値に関してIフレームとすべきと判定された場合に、符号量に基づいて判定対象のBフレームを出力ビットストリームBSTにおけるIフレームとすべきか否かを判定する。判定部150は、判定対象のBフレームの符号量が所定の範囲に入る場合には判定対象のBフレームをIフレームとすべきと判定し、該符号量が所定の範囲から外れる場合にはすべきでないと判定する。所定の範囲の上限値をth1、下限値をth2と表記する。判定部150は、順番保持部154を参照し、判定対象のBフレームの符号量を取得する。判定部150は、取得された符号量が[th2、th1)に含まれる場合、変数f_startを判定対象のBフレームの復号順フレーム番号(=f_intra+N)に設定する。判定部150は、取得された符号量が[th2、th1)に含まれない場合、変数f_startをIフレームの復号順フレーム番号(=f_intra)に設定する。判定部150は、設定された変数f_startをイントラ特定部152に出力する。
イントラ特定部152は、判定部150から変数f_startを取得する。イントラ特定部152は、順番保持部154を参照し、取得された変数f_startを復号順フレーム番号とするフレームの表示順フレーム番号を特定する。復号部102から符号化部104へ、再構成動画像のフレームが表示順に渡される。イントラ特定部152は、符号化部104において現在符号化されているフレームの表示順フレーム番号を監視する。イントラ特定部152は、監視対象の表示順フレーム番号が、変数f_startから特定された表示順フレーム番号と一致する場合、監視対象の表示順フレーム番号で特定されるフレームについて第2イントラ予測部128からの予測画像が選択されるよう、選択部140を制御する。なお、出力ビットストリームBSTにおけるIフレームの後続フレームの構造は、図2に示される階層構造に準じる。その結果、入力ビットストリームBSI中のIフレームは出力ビットストリームBSTではBフレームとなる。
N=1である場合を例として説明する。判定部150は、順番保持部154を参照し、復号順フレーム番号=f_intraで特定されるIフレームの量子化値QP1を取得する。判定部150は、順番保持部154を参照し、復号順フレーム番号=f_intra+N=f_intra+1で特定される判定対象のBフレームの量子化値QP2を取得する。判定部150は、取得された2つの量子化値の差分(QP2−QP1)を算出する。判定部150は、算出された差分(QP2−QP1)としきい値(例えば、2)との大小関係により、判定対象のBフレームを出力ビットストリームBSTにおけるIフレームとすべきか否かを決定する。なお、N=2の場合はしきい値を3としてもよい。より一般的には、復号順フレーム番号=f_intra+Nで特定される判定対象のBフレームが属する階層の深さに対応する、例えば比例するしきい値が設定されてもよい。
QP2−QP1≧2の場合、判定部150はf_start=f_intraを出力する。QP2−QP1<2の場合、判定部150は、順番保持部154を参照し、復号順フレーム番号=f_intra+N=f_intra+1で特定される判定対象のBフレームの符号量xyを取得する。th2≦xy<th1の場合、判定部150はf_start=f_intra+1を出力する。xy<th2またはxy≧th1の場合、判定部150はf_start=f_intraを出力する。イントラ特定部152は、f_start=f_intraが出力された場合は、表示順フレーム番号としてMを特定する。イントラ特定部152は、f_start=f_intra+1が出力された場合は、表示順フレーム番号としてM+8を特定する。同様にN=2の場合には、表示順フレーム番号としてMまたはM+4が特定される。
以上の構成によるトランスコード装置100の動作を説明する。
図6は、図4のフレーム構造制御部106における一連の処理を示すフローチャートである。フレーム構造制御部106は、入力ビットストリームBSIから高位シンタックスを抽出する(S602)。フレーム構造制御部106は、抽出された高位シンタックスを復号する(S604)。フレーム構造制御部106は、復号結果からフレームごとに復号順フレーム番号と表示順フレーム番号とフレーム種別と符号量と量子化値とを特定する(S606)。フレーム構造制御部106は、注目するIフレームの量子化値とそのIフレームから復号順で所定数離れたBフレームの量子化値との差分としきい値とを比較する(S608)。差分≧しきい値の場合(S608のYES)、フレーム構造制御部106は注目するIフレームの表示順フレーム番号を特定する(S614)。差分<しきい値(S608のNO)の場合、フレーム構造制御部106はBフレームの符号量と範囲[th2、th1)とを比較する(S610)。符号量が範囲[th2、th1)に属さない場合(S610のNO)、処理はステップS614に進む。符号量が範囲[th2、th1)に属する場合(S610のYES)、フレーム構造制御部106はBフレームの表示順フレーム番号を特定する(S612)。フレーム構造制御部106は、入力ビットストリームBSIの再符号化の際、ステップS612またはステップS614で特定された表示順フレーム番号のフレームについてイントラ予測を選択する(S616)。
上述の実施の形態において、保持部の例は、ハードディスクや半導体メモリである。また、本明細書の記載に基づき、各部を、図示しないCPUや、インストールされたアプリケーションプログラムのモジュールや、システムプログラムのモジュールや、ハードディスクから読み出したデータの内容を一時的に記憶する半導体メモリなどにより実現できることは本明細書に触れた当業者には理解される。
本実施の形態に係るトランスコード装置100によると、動画像のビットストリームのトランスコードにおいて、入力ビットストリームの高位シンタックスを復号することで得られる情報に基づいて出力ビットストリームにおけるイントラフレームが選択される。したがって、イントラフレームの選択のために、入力ビットストリーム全体をパースする必要はない。その結果、処理の負荷を低減しつつ、より画質の高いフレームをイントラフレームとして特定することでトランスコードにおける画質の劣化を抑制できる。
また、本実施の形態に係るトランスコード装置100では、入力ビットストリームBSIのBフレームの方がIフレームよりも画質が良いと判定される場合、当該Bフレームは出力ビットストリームBSTにおいてIフレームとして符号化される。したがって、画質によらずにIフレームを引き継ぐ場合と比較して、出力ビットストリームBSTの画質の劣化を低減または除去できる。
また、本実施の形態に係るトランスコード装置100では、符号量が[th2、th1)に属する場合にBフレームが、そうでない場合にIフレームが、出力ビットストリームBSTにおけるIフレームとして特定される。これは、本発明者の当業者としての以下の知見に基づく。
(1)Bフレームの符号量が多すぎる場合は参照フレームとの差分が多すぎる、すなわち予測が当たっていないことを意味し、したがって当該Bフレームの画質は低い場合が多い。
(2)Bフレームの符号量が少なすぎる場合は参照フレームの画質とBフレームの画質とはほぼ同じであり、したがって、Bフレームを新たなIフレームとすることによる画質劣化抑制効果は比較的小さい。
また、本実施の形態に係るトランスコード装置100では、発生符号量に基づく判定に優先して量子化値に基づく判定が行われる。Bフレームの量子化値がIフレームの量子化値よりも十分に大きい場合、Bフレームの符号量如何に関わらず、Bフレームの画質は比較的悪いことが予想される。したがって、そのような場合には符号量による判定を行わずIフレームを引き継ぐこととすることで、処理量を低減できる。
以上、実施の形態に係るトランスコード装置100の構成と動作について説明した。この実施の形態は例示であり、各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解される。
実施の形態では、まず量子化値に関して判定対象のBフレームを出力ビットストリームBSTにおけるIフレームとすべきか否かを判定する場合について説明したが、これに限られない。例えば、量子化値に関する判定は無くてもよい。
実施の形態では、入力ビットストリームBSIのフレームが階層構造を有する場合について説明したが、これに限られず、入力ビットストリームBSIのフレームはイントラフレームおよびインターフレームを含む任意の構造を有してもよい。
実施の形態では、トランスコード装置100が復号部102と符号化部104とフレーム構造制御部106とを備える場合を説明したが、これに限られない。例えば、システムは、復号部102と同様の機能を有する復号装置と、該復号装置とは別体の符号化装置であって符号化部104と同様の機能を有する符号化装置と、を備える。復号装置と符号化装置とは有線(例えば、HD−SDI)または無線により接続され、復号装置は入力ビットストリームBSIを取得し、復号装置から符号化装置へ再構成動画像が送信され、符号化装置は出力ビットストリームBSTを出力する。フレーム構造制御部106と同様の機能は、復号装置に設けられてもよく、または符号化装置に設けられてもよく、または一部が復号装置に、残りが符号化装置に設けられてもよい。
10 ケーブルテレビシステム、 12 放送事業者サーバ、 14 センター設備、 16 ケーブルネットワーク、 18 エンドユーザ、 100 トランスコード装置。

Claims (8)

  1. トランスコードシステムであって、
    動画像のビットストリームを取得する手段と、
    取得された前記ビットストリームとは設定の異なる新たなビットストリームを出力する手段と、
    取得された前記ビットストリームから高位シンタックスの復号により得られる情報を抽出する手段と、を備え、
    抽出された前記情報は、フレームごとにインターフレームであるかイントラフレームであるかの別を示す情報と画質の指標とを含み、
    前記トランスコードシステムはさらに、
    取得された前記ビットストリームのインターフレームの画質の指標に基づいて、該インターフレームを前記新たなビットストリームにおけるイントラフレームとすべきか否かを判定する手段と、
    イントラフレームとすべきと判定された場合、判定対象の前記インターフレームを、前記新たなビットストリームにおけるイントラフレームとして特定する手段と、を備えるトランスコードシステム。
  2. 前記出力する手段は、取得された前記ビットストリームから前記新たなビットストリームを生成する際、前記特定する手段によって特定された判定対象の前記インターフレームをイントラフレームとして符号化する請求項1に記載のトランスコードシステム。
  3. 前記抽出する手段は、
    取得された前記ビットストリームから前記高位シンタックスを抽出する手段と、
    抽出された前記高位シンタックスを復号する手段と、を含む請求項1または2に記載のトランスコードシステム。
  4. 抽出された前記情報は、フレームごとに復号順フレーム番号を含み、
    前記判定する手段は、取得された前記ビットストリームのイントラフレームの復号順フレーム番号に所定の自然数Nを足して得られる復号順フレーム番号のインターフレームについて判定を行う請求項1から3のいずれか一項に記載のトランスコードシステム。
  5. 前記判定する手段は、取得された前記ビットストリームのインターフレームの画質の指標が所定の範囲に入る場合には該インターフレームを前記新たなビットストリームにおけるイントラフレームとすべきと判定し、該指標が前記範囲から外れる場合にはすべきでないと判定する請求項1から4のいずれか一項に記載のトランスコードシステム。
  6. 前記画質の指標は対応するフレームの符号量と対応するフレームの量子化値とを含み、
    前記判定する手段は、取得された前記ビットストリームのインターフレームの量子化値に基づいて、該インターフレームを前記新たなビットストリームにおけるイントラフレームとすべきか否かを判定し、かつ、量子化値に関してイントラフレームとすべきと判定された場合に、符号量に基づいて該インターフレームを前記新たなビットストリームにおけるイントラフレームとすべきか否かを判定し、
    量子化値に関してイントラフレームとすべきでないと判定された場合、該インターフレームはイントラフレームとして特定されない請求項1から5のいずれか1項に記載のトランスコードシステム。
  7. トランスコード方法であって、
    動画像のビットストリームを取得することと、
    取得された前記ビットストリームとは設定の異なる新たなビットストリームを出力することと、
    取得された前記ビットストリームから高位シンタックスの復号により得られる情報を抽出することと、を含み、
    抽出された前記情報は、フレームごとにインターフレームであるかイントラフレームであるかの別を示す情報と画質の指標とを含み、
    前記トランスコード方法はさらに、
    取得された前記ビットストリームのインターフレームの画質の指標に基づいて、該インターフレームを前記新たなビットストリームにおけるイントラフレームとすべきか否かを判定することと、
    イントラフレームとすべきと判定された場合、判定対象の前記インターフレームを、前記新たなビットストリームにおけるイントラフレームとして特定することと、を含むトランスコード方法。
  8. 請求項1から6のいずれか1項に記載のトランスコードシステムとしてコンピュータを機能させるプログラムを有することを特徴とするコンピュータ可読記録媒体。
JP2016146775A 2016-07-26 2016-07-26 トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置 Active JP6577426B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016146775A JP6577426B2 (ja) 2016-07-26 2016-07-26 トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016146775A JP6577426B2 (ja) 2016-07-26 2016-07-26 トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置

Publications (2)

Publication Number Publication Date
JP2018019186A JP2018019186A (ja) 2018-02-01
JP6577426B2 true JP6577426B2 (ja) 2019-09-18

Family

ID=61076388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016146775A Active JP6577426B2 (ja) 2016-07-26 2016-07-26 トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置

Country Status (1)

Country Link
JP (1) JP6577426B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102271118B1 (ko) * 2020-01-22 2021-06-30 주식회사 아틴스 영상 저장 장치 및 방법

Also Published As

Publication number Publication date
JP2018019186A (ja) 2018-02-01

Similar Documents

Publication Publication Date Title
CN114467304A (zh) 用于视频编码技术的时间信令
JP5223769B2 (ja) 復号装置および方法、プログラム、並びに記録媒体
US20130003838A1 (en) Lossless Coding and Associated Signaling Methods for Compound Video
JP7268107B2 (ja) ビジュアル・メディア・データ処理方法
WO2008060732A2 (en) Techniques for variable resolution encoding and decoding of digital video
US9247261B2 (en) Video decoder with pipeline processing and methods for use therewith
US20140016703A1 (en) Methods and devices for controlling spatial access granularity in compressed video streams
JP2011130410A (ja) 符号化方法、復号化方法及び装置
US20150092862A1 (en) Modified hevc transform tree syntax
US10306244B2 (en) Method for encoding/decoding image and device using same
US9088800B2 (en) General video decoding device for decoding multilayer video and methods for use therewith
EP2942964B1 (en) Image encoding/decoding method and device and non-transitory computer-readable recording medium
US8243798B2 (en) Methods and apparatus for scalable video bitstreams
US9025660B2 (en) Video decoder with general video decoding device and methods for use therewith
JP6577426B2 (ja) トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置
CN114073084A (zh) 在视频码流中有效发信号通知图片大小和分区信息的方法和装置
JP6566864B2 (ja) ビットストリーム変換装置、ビットストリーム変換方法、配信システム及びコンピュータ可読記録媒体
KR102020953B1 (ko) 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템
JP4875285B2 (ja) 編集装置および方法
CN110636296B (zh) 视频解码方法、装置、计算机设备以及存储介质
US20220400261A1 (en) Processing video using masking windows
JP7378035B2 (ja) 変換装置、復号装置、変換方法および復号方法
JP6574148B2 (ja) トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体および符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190716

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190822

R150 Certificate of patent or registration of utility model

Ref document number: 6577426

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150