JP2019097157A - 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ - Google Patents

補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ Download PDF

Info

Publication number
JP2019097157A
JP2019097157A JP2018191946A JP2018191946A JP2019097157A JP 2019097157 A JP2019097157 A JP 2019097157A JP 2018191946 A JP2018191946 A JP 2018191946A JP 2018191946 A JP2018191946 A JP 2018191946A JP 2019097157 A JP2019097157 A JP 2019097157A
Authority
JP
Japan
Prior art keywords
frame
image data
image
encoding
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018191946A
Other languages
English (en)
Other versions
JP2019097157A5 (ja
JP6975121B2 (ja
Inventor
ヴィクトル エドパルム,
Edpalm Viktor
ヴィクトル エドパルム,
ハンプス リンス,
Hampus Linse
ハンプス リンス,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axis AB
Original Assignee
Axis AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axis AB filed Critical Axis AB
Publication of JP2019097157A publication Critical patent/JP2019097157A/ja
Publication of JP2019097157A5 publication Critical patent/JP2019097157A5/ja
Application granted granted Critical
Publication of JP6975121B2 publication Critical patent/JP6975121B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • H04N23/683Vibration or motion blur correction performed by a processor, e.g. controlling the readout of an image memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/60Noise processing, e.g. detecting, correcting, reducing or removing noise
    • H04N25/61Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4"

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Studio Devices (AREA)

Abstract

【課題】補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダを提供する。【解決手段】符号化するための方法およびエンコーダ306は、ビデオ捕捉デバイス104によって捕捉された第1の画像データ304aを受信するステップと、第1の画像データ304aを第1の補助フレーム308aの画像データとして使用するステップと、第1の補助フレーム308aをイントラフレームとして符号化するステップと、第1のフレーム310aを第1の補助フレーム308aを参照するインターフレームとして符号化するステップとを備える。第1のフレーム310aの動きベクトルが、第1の画像データ304a〜dに適用されることになる第1の画像変換を表す。【選択図】図3

Description

本発明は、ビデオ符号化の分野に関する。詳細には、本発明は、補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダに関する。
ビデオ捕捉デバイス、またはビデオカメラは、示されるためにディスプレイに転送される前に、または、たとえば、ソフトウェアによってさらに処理されるように、符号化および復号される、デジタル画像のストリーム、またはフレームを捕捉するために使用される。ビデオ捕捉デバイスの光学システムの欠陥または限界により、復号されたデジタル画像は、幾何学的な歪みを示す場合がある。望まれない歪みの別の例は、ビデオ捕捉デバイスの振動によって生じる場合がある。これらのタイプの歪みは、オペレータの作業またはビデオ分析ソフトウェアからの出力の品質が符号化されたビデオストリームの品質に左右される可能性がある監視状況において不利であり得る。
今日、多くの監視システムは、ビデオストリームを符号化する前に、捕捉されたビデオストリーム内のデジタル画像の複雑な変換を可能にする。そのような複雑な変換の例は、スティッチング(stitching)、歪み除去(dewarping)、デジタルパンティルトズーム(DPTZ:Digital Pan Tilt Zoom)、電気画像安定化(EIS:electrical image stabilization)、樽形歪曲補正(BDC:barrel distortion correction)などを含む。これらの変換は、特殊なハードウェアを必要とし、メモリ帯域幅など、調査システムリソース上の重い負荷である。副作用として、これらの変換は、捕捉されたデジタル画像の元に視野の部分を除去する場合、ならびにデジタル画像の部分を歪める場合がある。
したがって、この文脈内で改善の必要性が存在する。
上記に照らして、したがって、上記で論じた問題を克服するかまたは少なくとも緩和することが本発明の目的である。具体的には、ビデオストリームの捕捉されたフレームの複雑な変換が必要とされるとき、ビデオ捕捉システムのリソース上の負荷を低減し、最初に捕捉された画像データの検索を円滑にする符号化方法およびエンコーダを提供することが目的である。
本発明の第1の態様によれば、上記の目的は、ビデオストリームをビデオコーティングフォーマットで符号化するための方法であって、ビデオコーティングフォーマットが、補助フレームを符号化されたビデオストリーム内に含めることをサポートし、補助フレームが、符号化されたビデオストリーム内の別のフレームによって参照され、前記別のフレームを補完する画像データを備え、補助フレームの画像データが、符号化されたビデオストリームを復号するときに示されることは意図されず、代わりに、画像データが示されることを達成するために、前記別のフレームとともに使用されることが意図され、前記方法が、
ビデオ捕捉デバイスによって捕捉された第1の画像データを受信するステップと、
第1の画像データを第1の補助フレームの画像データとして使用するステップと、
第1の補助フレームをイントラフレームとして符号化するステップと、
第1のフレームを第1の補助フレームを参照するインターフレームとして符号化するステップであって、第1のフレームの動きベクトルが、第1の画像データに適用されることになる第1の画像変換を表す、符号化するステップと
を備える、方法によって達成される。
補助フレームは、一般に、符号化されたビデオストリーム内の(マスタ画像としても知られている)別のフレームを補完する画像データのストレージを意味する。言い換えれば、前記別のフレームは補助フレームを参照する。補助フレームは、その補助フレームが補完するフレームの表示を助けるために様々な形態で使用され得るが、一般に、そのようなものとして表示されない。補助フレームは、補助画像、補助画像項目、非表示フレーム、補助ピクチャなどと呼ばれることもある。補助フレームの知られているアプリケーションは、補助フレームをアルファプレーンまたは深度マップ用に使用することを含む。
第1のフレーム(および、第2のフレーム、第3のフレームの下のフレーム)も、したがって、マスタ画像またはマスタフレームと呼ばれることがある。
「第1のフレームの動きベクトルが、第1の画像データに適用されることになる第1の画像変換を表す」(および、第2のフレーム、第3のフレームの同様の表現など)は、一般に、動きベクトルが、一般に連続的な画像変換において一定の座標に対して画像変換をサンプリングすることを意味する。サンプリング座標は、一般に、下記でさらに説明するように、第1のフレームに関して使用されるマクロブロックサイズによって判定される。
たとえば、H.265符号化規格(および、GoogleのVP10など、他のさらに新しい符号化規格)内では、フレームは、フレームがユーザに表示されないことを意味する「非表示」としてタグ付けされ得る。H.265では、たとえば、タグ付けは、スライスヘッダ内のpic_output_flagを偽にセットするか、またはSEIヘッダ内のno_display_flagを真にセットすることによって行うことができる。
本発明者らは、そのような補助フレームが、補助フレームを参照するフレームとともに、(ビデオ捕捉デバイスによって捕捉された)生の画像データに関する複雑な画像変換が必要とされる、ビデオストリームの効率的な符号化を提供するために、通常の符号化/圧縮データに加えて、複雑な画像変換に関するデータを記憶するために使用され得ることを実現した。本発明により、符号化プロセスが開始する前に、生の画像データは(たとえば、樽形歪曲補正または同様の補正のために)前処理されなくてよく、これは、たとえば、ビデオ捕捉デバイスのリソース上の負荷を低減し、ハードウェアまたはソフトウェアがそのような前処理ステップを実行する必要を除去する。
上記の方法は、エンコーダによって使用されるビデオコーディングフォーマットの規格に従うため、本実施形態は、符号化されたビデオストリームがそのようなビデオコーディングフォーマットをサポートする標準的なビデオストリームデコーダによって復号され得るという点でさらに有利であり得る。さらなる利点は、補助フレームの画像データは、ビデオ捕捉デバイスによって捕捉された生の画像データであるため、このデータは、符号化されたビデオストリーム内に含まれ、後で、必要に応じて、カスタムデコーダによって検索され得ることであり得る。
いくつかの実施形態によれば、この方法は、ビデオ捕捉デバイスによって捕捉された第2の画像データを受信するステップと、第2の補助フレームを第1の補助フレームを参照するインターフレームとして符号化するステップであって、第2の画像データと第1の画像データとの間の比較に基づいて行われる、符号化するステップと、第2のフレームを第2の補助フレームを参照するインターフレームとして符号化するステップであって、第2のフレームの動きベクトルが、第2の画像データに適用されることになる第2の画像変換を表す、符号化するステップとをさらに備える。
本明細書で説明するビデオ符号化フォーマットなど、いくつかのビデオ圧縮規格は、イントラフレーム、たとえば、Iフレーム、およびインターフレーム、たとえば、PフレームまたはBフレームの観点から実装される時間的ビデオ圧縮を規定する。イントラフレームは、基本的に、符号化されることになる画像フレーム内の情報のみを使用して符号化される画像フレームである。さらに、イントラフレームは、符号化されることになる画像フレームに関して捕捉されたすべての画像データから算出される。したがって、イントラフレームは、時々、フルフレームと呼ばれる。予測フレームまたは差分フレームとも呼ばれるインターフレームは、前に(かつ、オプションで、後に)符号化されたフレームからの情報ならびに現在符号化されているフレームからの情報に基づき、すなわち、インターフレームは、前の(かつ、オプションで、後の)画像フレーム内の時間的に冗長な情報を利用するとして説明され得る。このタイプのコーデック(圧縮規格)を実装するエンコーダは、一般に、イントラフレームを、その後に、所定の数のインターフレームを、次いで、新しいイントラフレームを、その後に、同じ数のインターフレームを生成する。イントラフレームの後にいくつかのインターフレームが続くこのシーケンスの長さは、グループオブピクチャ長(GOP−length)と呼ばれることが多い。いくつかの圧縮規格、たとえば、H.265の場合、GOP長は、符号化の間に調整され得る。
本実施形態に関して、第2の補助フレームの符号化は、時間的ビデオ圧縮を利用する。第2の補助フレームの符号化は、したがって、前の、第1の補助フレーム内の時間的に冗長な情報を利用する。符号化された第2の補助フレームは、したがって、第1の補助フレームの画像データ(すなわち、第1の画像データ)および第1の補助フレーム内に存在しない画像コンテンツを記述する画像データの関係で第2の画像データの動きベクトル変位と(残差値とも呼ばれる)予測誤差の両方を包含し得る。
上記の開示された実施形態は、反復的な様式で実行され得ることに留意されたい、これは、この実施形態が、定義されたGOP長に応じて、ビデオ捕捉デバイスによって捕捉された第3の画像データ、第4の画像データなどに対して繰り返されてよいことを意味する。この後で、当業者が理解するように、イントラフレームの後にいくつかのインターフレームが続く新しいシーケンスが開始され得る。
いくつかの実施形態によれば、第2の画像変換は第1の画像変換に等しい。この実施形態は、前記第2のフレームの動きベクトルは、第1のフレームの動きベクトルに等しい可能性があり、したがって、再度判定/算出されなくてよいという点で、第2のフレームを符号化するときに有利であり得る。結果として、符号化プロセスの複雑性が低減され得る。たとえば、いくつかの実施形態では、第2のフレームを符号化するステップは、第1のフレームを複写し、第1のフレームの複写の参照先を第2の補助フレームとする(reference〜to)ことを備える。他の実施形態では、第1のフレームの動きベクトルは、複写され、第2のフレームの動きベクトルとして使用される。第1のフレームおよび第2のフレームの動きベクトルが事前に算出される、さらに別の実施形態では、第1のフレームおよび第2のフレームをそれぞれ符号化するステップは、事前に算出された動きベクトルを(たとえば、エンコーダのメモリ、またはエンコーダに接続されたデバイスのメモリから)検索することを備える。第1の画像変換および第2の画像変換は等しいため、(たとえば、ビデオ記録デバイスの一定のレンズ歪みによる)特定のビデオ記録デバイスに関する動きベクトルは、事前に算出され、そのビデオ記録デバイスによって記録されたすべての画像データに関して使用され得る。
いくつかの実施形態によれば、第1の画像変換および第2の画像変換は、ビデオ記録デバイスのレンズによって生じる第1の画像データおよび第2の画像データの歪みを少なくとも部分的に中和する。そのような歪みの例は、樽形歪曲(barrel distortion)、糸巻き型歪曲(pincushion distortion)、陣笠型歪曲(mustache distortion)、およびビデオ記録デバイスの広角レンズによって生じる歪みで得あり得る。この実施形態では、第1の画像変換および第2の画像変換は、一般に等しいが、たとえば、ビデオ捕捉デバイスの画像センサーの機能性の不整により、小さな差異が生じる場合がある。いくつかの実施形態では、そのような不整は無視され、第1の画像変換および第2の画像変換は等しいと仮定される。
いくつかの実施形態によれば、第2の画像変換は、第1の画像変換とは異なる。これは、符号化方法の柔軟性を高める。
いくつかの実施形態によれば、第1の画像変換および第2の画像変換は、電気画像安定化(EIS)、およびデジタルパンティルトズーム(DPTZ)のうちの1つに関する。
いくつかの実施形態によれば、第1のフレームを符号化するステップは、第1の画像データに適用されることになる第1の画像変換を判定するステップと、第1のフレームの動きベクトルに関して判定されたマクロブロックサイズに従って第1の画像変換をサンプリングすることによって、第1の画像変換を表す動きベクトルを算出するステップとを備える。この実施形態は、当然、第2のフレーム、第3のフレームなどにも適用され得る。この実施形態では、画像変換は、画像エリア全体にわたって均一な方法でサンプリングされ、これは、サンプリングプロセスの複雑性を低減し得る。
いくつかの実施形態によれば、第1のフレームを符号化するステップは、第1の画像データに適用されることになる第1の画像変換を判定するステップと、第1のフレームの動きベクトルに関して判定された複数のマクロブロックサイズに従って第1の画像変換をサンプリングすることによって、第1の画像変化を表す動きベクトルを算出するステップとを備える。この実施形態は、第2のフレーム、第3のフレームなどにも適用され得る。この実施形態では、画像変換は、画像エリア全体にわたって不均一な方法でサンプリングされ、これは、サンプリングプロセスの(たとえば、画像変換の性質に基づく)柔軟性および適応性を増大し得る。
いくつかの実施形態によれば、ビデオコーディングフォーマットは、高効率画像ファイルフォーマット、アドバンストビデオコーディング、H.264、高効率ビデオコーディング、H.265、H.266、VP9、VP10およびAV1のうちの1つである。しかしながら、本明細書で説明するように、補助フレームをサポートする任意のビデオコーディングフォーマットが本発明によって網羅されることに留意されたい。
本発明の第2の態様によれば、上記の目的は、処理能力を有するデバイスによって実行されると、第1の態様の方法を実行するように適合されたコンピュータコード命令を備えたコンピュータ可読媒体を備えるコンピュータプログラム製品によって達成される。
第3の態様によれば、上記の目的は、ビデオ捕捉デバイスによって捕捉されたビットストリームをビデオコーティングフォーマットで符号化するように適用されたエンコーダであって、ビデオコーティングフォーマットが、補助フレームを符号化されたビデオストリーム内に含めることをサポートし、補助フレームが、符号化されたビデオストリーム内の別のフレームによって参照され、前記別のフレームを補完する画像データを備え、補助フレームの画像データが、符号化されたビデオストリームを復号するときに示されることは意図されず、代わりに、画像データが示されることを達成するために前記別のフレームのデータとともに使用されることが意図され、前記エンコーダが、
ビデオ捕捉デバイスによって捕捉された第1の画像データを受信することと、
第1の画像データを第1の補助フレームの画像データとして使用することと、
第1の補助フレームをイントラフレームとして符号化することと、
第1のフレームを第1の補助フレームを参照するインターフレームとして符号化することであって、第1のフレームの動きベクトルが、第1の画像データに適用されることになる第1の画像変換を表す、符号化することと
を行うようにさらに適合される、エンコーダによって達成される。
第2のおよび第3の態様は、一般に、第1の態様と同じ特徴および利点を有する。本発明は、別段に明記されていない限り、特徴のすべての可能な組合せに関することにさらに留意されよう。
本発明の上記の、ならびに追加の目的、特徴、および利点は、同様の要素に関して同じ参照番号が使用される添付の図面を参照して、以下の本発明の好ましい実施形態の例示的かつ非限定的な詳細な説明を通してよりよく理解されよう。
ビデオ捕捉デバイスのレンズによって生じる画像データの歪みの一例を概略的に示す図である。 図1の画像データの歪みを中和するように算出された動きベクトルを概略的に示す図である。 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法の第1の実施形態を概略的に示す図である。 補助フレームをサポートするビデオコーティングフォーマットでビデオストリームを符号化するための方法の第2の実施形態を概略的に示す図である。 補助フレームをサポートするビデオコーティングフォーマットでビデオストリームを符号化するための方法の第3の実施形態を概略的に示す図である。 補助フレームをサポートするビデオコーティングフォーマットでビデオストリームを符号化するための方法の第4の実施形態を概略的に示す図である。
本発明は、次に、本発明の実施形態が示される添付の図面を参照して以下でより十分に説明される。本明細書で開示するシステムおよびデバイスは、動作の間に説明される。
本発明は、補助フレームを符号化されたビデオストリーム内に含めることをサポートするビデオコーティングフォーマットに対して、エンコーダ内の画像データの複雑な変換を処理する新しい方法を提供することを目的とする。そのような複雑な変換の例は、画像データを捕捉するビデオ捕捉デバイスのレンズによって生じる画像データの歪みを(少なくとも部分的に)中和するための変換を含む。幾何光学において、歪みは、シーン内の直線が画像内で直線状態にとどまる直線投影からの偏差である。樽形歪曲と呼ばれるタイプの歪みが示される図1では、そのような歪みは簡素化されている。シーン102は、直線のグリッドに簡素化されている。カメラ104がシーンを捕捉するとき、出力、または画像データ106は、グリッドが球体(または、たる)の周囲にマッピングされているように見える。ビデオ捕捉デバイス104のレンズによって生じる他のタイプの同様の歪みは、ピンクション歪み、陣笠型歪曲、およびビデオ捕捉デバイスの広角レンズ(魚眼レンズ)によって生じる歪みを含む。これらのタイプの歪みは、静的であることが多く、これは、第1の捕捉されたフレーム(または、画像)が後で捕捉されるフレームと同じように歪むことになることを意味する。しかしながら、歪みのいくつかの小さな差異は、たとえば、ビデオ捕捉デバイス104の画像センサーの機能性の不整により起こる場合がある。
先行技術では、レンズ歪み、または下記で詳細に述べる他のタイプの歪みは、符号化プロセスが開始する前に、歪んだ画像データ106を捕捉されたシーンと同様のものに変換し戻す特殊なハードウェアによって軽減されることが多い。この方法は、リソース集約型ではないが、捕捉されたシーンの部分を失わせることもある。
図2は、例として、歪んだ画像データ106と元のシーン102との間のマッピング方式202を示す。マッピング方式202の矢印の長さおよび方向は、ビデオ捕捉デバイス104のレンズによって生じる歪みを中和するために、矢印の起点における画素/マクロブロックがどのように移動されるべきかを表す。図2のマッピング方式202は完全ではないことに留意されたい。
図3〜図4は、図1の例、すなわち、樽形歪曲に従って捕捉されたシーンを歪めるカメラシステムに関する、補助フレームを符号化されたビデオストリーム内に含めることをサポートするビデオコーティングフォーマットでビデオストリームを符号化するための方法の実施形態を簡素化する。この例は、他のタイプのレンズ歪みに容易に移行され得る。
図3は、ビデオストリーム304a〜dの捕捉された画像データがビデオ捕捉デバイスのレンズによる樽形歪曲を受けている、ビデオストリーム304a〜dをもたらすビデオ捕捉デバイス104によって捕捉されたシーン302を示す。図3の下の部分は、本発明による樽形歪曲補正(BDC)が行われる、ビデオ捕捉デバイス104によって捕捉された第1の画像データ(または、フレーム、画像など)304aの符号化を示す。
エンコーダ306は、第1の画像データ304aを受信する。第1の画像データ304aは、次いでイントラフレームとして符号化される、第1の補助フレーム308aの画像データとして使用される。エンコーダは、第1の補助フレーム308aを参照する第1のフレーム310aも符号化する。上記で説明したように、第1の補助フレーム308aの画像データ(すなわち、第1の画像データ304a)は、第1のフレーム310aが後で復号されるとき、第1のフレーム310aのデータを補完することになる。第1のフレーム310aは、補助フレーム308aを参照するインターフレームとして符号化される。第1のフレーム310aの(図3の第1のフレーム310a内に矢印によって概略的に示される)動きベクトルは、第1の画像データ304aを望まれるように出現させるために、第1の画像データ304aに適用されるべき画像変換(transformation)(画像変換(transform)、画像変換方程式など)(この場合、樽形歪曲補正)に関する情報を使用することによって判定され、動きベクトル310は画像変換を表している。
第1のフレーム310a(第2のフレーム、第3のフレームなど)の動きベクトルは、多くの方法で判定され得る。いくつかの実施形態によれば、動きベクトルは、第1の画像データに適用されることになる第1の画像変換(この場合、逆樽形歪曲(inverted barrel distortion))を判定し、第1のフレームの動きベクトルに関して判定されたマクロブロックサイズに従って第1の画像変換をサンプリングすることによって、第1の画像変換を表す動きベクトルを算出することによって判定される。たとえば、画像変換が、ある画素が5個の画素を右に移動し、3個の画素を下に移動すべきであるという結果を出す場合、この画素の実際の移動は、サンプリングサイズ(マクロブロックサイズ)および近傍の画素に対する変換に基づいて判定される。他の実施形態によれば、サンプリングのために複数のマクロブロックサイズが使用され、マッピング方式の特定のエリアに使用されるマクロブロックサイズは、画像変換がその対応するエリアに対してどのようになりそうかに左右される。たとえば、マクロブロックサイズは、16×16から4×4まで変化し得る。この実施形態は、動きベクトルに関するビットレートのコストを低減することになり、効率的な方法で、非常に不整である画像変換のローカルエリアに対して最も多くのビットを使用し、変換がより均一であるローカルエリアに対してより少ないビットを使用することができる。
動きベクトルに関するビットレートのコストをさらに低減するために、サンプリングは、補助フレーム内の画像データのより平滑な変換を達成する目的で、より小さなサイズのマクロブロックに関する動きベクトルを算出するために受信された動きベクトル間の補間をデコーダに任せるように、よりスパースに行われ(マクロブロックのサイズを増大し)てよい。これは、符号化されたビットストリーム内に補間パラメータを含めること、またはインターフレームのヘッダ内にフラグをセットすることなどによって達成され得る。
他の実施形態によれば、動きベクトルを達成するための画像変換のサンプリングは、補助フレーム内の画像データの対応するエリア内の詳細のレベルに基づいて行われる。たとえば、(任意の適切なエッジ検出アルゴリズムを使用して判定され得る)高度な直線を備えた画像データ内のローカルエリアの場合、画像変換の対応するエリアに対してより密度の高いサンプリング(より小さなマクロブロックサイズ)が必要とされ得る。より低度な線を有するエリアの場合、よりスパースなサンプリングが採用され得る。
サンプリングは、たとえば、近傍サンプリング(nearest neighbour sampling)、バイリニアサンプリング(bilinear sampling)、またはバイキュービックサンプリング(bicubic sampling)によって行われ得る。これらの2つの実施形態は、ビデオ捕捉デバイス104によって捕捉された画像データの歪みが時間の間に変更し得る場合に有利であり得、動きベクトルの柔軟な算出方法を提供する。
いくつかの実施形態によれば、第1のフレーム310aの動きベクトルは事前に算出される。図3の例では、ビデオ記録デバイス104のレンズによって生じる樽形歪曲は事前に知られ得る。この場合、樽形歪曲を中和する(したがって、BDCを提供する)動きベクトルは、事前に算出され、たとえば、エンコーダによってアクセス可能なメモリ内に記憶され得る。この場合、第1のフレーム310aを符号化するステップは、事前に算出された動きベクトルを検索することと、これらの動きベクトルを第1のフレーム310aの動きベクトルとして使用することとを備える。この実施形態は、複雑性がより少ない符号化プロセスを提供し、これはやはり時間効率もよい可能性がある。
上記で説明したように、本発明の利点は、エンコーダによって使用されるビデオコーディングフォーマット(たとえば、H.265)をサポートする標準的なデコーダが、図3に従ってビデオストリームを復号することである。デコーダは、第1の補助フレーム308aの画像データのBDCを達成し、したがって、捕捉されたシーン302と同様のものにするために、第1のフレーム310aの動きベクトルを第1の補助フレーム308aの歪んだ画像データに適用することになる。さらに、第1の補助フレーム308aの画像データはビデオ捕捉デバイス104によって捕捉された生の画像データであるため、このデータは、必要に応じて、後でカスタムデコーダによって検索され得る。これは、たとえば、ビデオ捕捉デバイス104によって捕捉された生データの部分がBDCの間に除去されるが、これらの除去された部分は、潜在的に、関心ある情報を含み得る監視状況において有利であり得る。
図4は、図3で説明した方法の拡張を示し、ここで、ビデオストリーム304a〜dのすべての4つの捕捉された画像フレーム(画像データ)がエンコーダ306によって符号化される。図4では、第1の画像データ304aは、符号化された第1のフレーム310aおよび符号化された第1の補助フレーム308aを達成するために、図3で説明したように符号化される。第1の画像データ304aを符号化した後で、エンコーダ306は、ビデオ捕捉デバイス104によって捕捉された第2の画像データ304bを受信する。第2の補助フレーム308bは、前の画像フレーム、この場合、第1の補助フレーム308a内の時間的に冗長な情報を利用するために、第1の補助フレーム308aを参照するインターフレーム(たとえば、Pフレーム)として有利に符号化される。第2の補助フレームの符号化は、したがって、いくつかの実施形態によれば、第2の画像データ304bと第1の画像データ304aとの間の比較に基づいて行われる。図4では、符号化された第2の補助フレーム308bは、動きベクトルによって概略的に表されているが、第1の補助フレームの画像データ304a内に存在しないが、第2の画像データ304b内に存在する画像コンテンツを表す画像データおよび/または予測誤差(残差値とも呼ばれる)は、当然、符号化された第2の補助フレーム308b内に含まれてもよい。
他の実施形態によれば、やはり第2の補助フレーム308bがIフレームとして符号化される。
エンコーダ306は、第2のフレーム310bを第2の補助フレーム308bを参照するインターフレームとして継続的に符号化し、第2のフレーム310bの動きベクトルは、第2の画像データ304bに適用されることになる第2の画像変換を表す。上記で説明したように、第2の画像データ304bに適用されることになる画像変換は、第1の画像データ304aに適用されることになる画像変換と同じ、たとえば、BDCであり得る。この場合、第2のフレーム310bを符号化するステップは、第1のフレーム310aを複写し、第1のフレームの複写の参照先を第2の補助フレーム308bとすることを備える。これは、効率的で複雑性の低い符号化プロセスを提供し得る。他の実施形態によれば、第2のフレーム310bの動きベクトルは、上記で説明したように、事前に算出され、第2のフレーム310bを符号化するステップは、事前に算出された動きベクトルを検索することを備える。動きベクトルは、当然、第2のフレーム310bに関しても(上記で説明したように)個別に算出され得、これは、図6とともに下記でさらに説明される。
図3では、第2の画像データ304bに関する上記の符号化プロセスは、第3の画像データ304cに関して反復される。上記で説明したように、イントラ符号化された補助フレームの後にいくつかのインターフレーム符号化された補助フレームが続くことは、エンコーダ306に関するグループオブピクチャ長(GOP−length)をセットすることによって判定され得る。この場合、GOP長は、2つのフル画像(Iフレーム、イントラフレーム)の間の距離は2であると定義する。
第4の画像データ304dに関して、図3とともに上記で説明した符号化プロセスがさらに再び採用され、このようにして、イントラフレーム符号化された第4の補助フレーム308dをもたらす。
図4では、括弧内の数字は、符号化された補助フレーム308(AF)および「正規の」フレーム310(RF)が符号化されたビデオストリーム内に含まれる順序を記述する。図4の例では、この順序は、AF1 308a、RF1 310a、AF2 308b、RF2 310b、AF3 308c、RF3 310c、AF4 308d、RF4 310dである。
図5〜図6は、ビデオ捕捉デバイス104によって捕捉された画像データ504a〜dに適用される必要があり得る別のタイプの画像変換について説明する。図5〜図6の例では、電気画像安定化(EIS)が適用されている。これは、たとえば、高い柱または交通量が多い道路付近の道路標識の上など、露出したロケーション内に取り付けられた監視カメラに必要な場合がある。この場合、カメラは、風または往来によってぶれる場合がある。図5の上の部分に示すように、シーン502内の(垂直方向に移動しない)被写体は、第1の捕捉された画像データ504aと第2の捕捉された画像データ504bとの間で垂直方向に移動しており、これは、EISが適用されない場合、ビデオをぼやけさせる可能性がある。
図5の下の部分には、第1の画像データ504aの符号化プロセスを示す。符号化プロセスは、この場合、動きベクトルが符号化の間に算出される必要があることを除いて、図3の第1の画像データ304aに関して説明した符号化プロセスと変わらない。EISを達成するために適用される必要がある画像変換は、Axis Communicationsによって開発されたEISアルゴリズムまたは当業者に知られている他の適切なアルゴリズムを使用して算出され得る。次いで、上記で説明したように、画像変換をサンプリングすることによって、動きベクトルが判定され得る。
図6は、両方の捕捉された画像データ504a〜bに関してエンコーダ306によって実行される符号化プロセスを示す。図6に示すように、第1の画像フレーム602aに関する動きベクトルは、第2の画像フレーム602bに関する動きベクトルとは異なる。言い換えれば、第1の画像変換および第2の画像変換は異なる。第1の画像変換および第2の画像変換は、この場合、EISに関するが、デジタルパンティルトズーム(DPTZ)など、他の画像変換が等しく可能である。これ以外に、符号化プロセスは、図4とともに説明した符号化プロセスと同様である。
エンコーダ306は、したがって、上記で説明したように、ビデオストリーム304a〜d、504a〜bを符号化するように適合される。エンコーダ306は、ビデオストリーム304a〜d、504a〜bの画像データを受信するために、ビデオ捕捉デバイス104内に直接的に提供されてよく、またはビデオ捕捉デバイス104にワイヤでまたはワイヤレスに接続されてもよい。エンコーダ306は、事前に算出された動きベクトルを検索するためのメモリを備えてよいか、またはメモリに接続されてよい。エンコーダ306は、画像変換および/または画像変換からのサンプル動きベクトルを算出するための処理ユニットを備え得る。代替として、または追加で、エンコーダは、画像変換および/または動きベクトルを算出/判定するように適合された個別の算出ユニットからそのような画像変換および/または動きベクトルを受信するように適合され得る。エンコーダは、一般に、上記で説明したように、受信された画像データを符号化するための1つまたはいくつかの処理ユニット(たとえば、CPU)を備える。CPUは、たとえば、CPUによって実行されると、上記で説明した実施形態のうちのいずれかの符号化方法を実行するように適合された命令で、コンピュータ可読記憶媒体からインストールされたソフトウェアを実行するように適合され得る。エンコーダは、符号化されたビデオストリームを復号するように適合されたデコーダに符号化されたビデオストリームをワイヤレスにまたはワイヤで送信するようにさらに適合され得る。
上記で開示したシステム(たとえば、エンコーダ306)および方法は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組合せとして実装され得る。ハードウェア実装形態では、上記の説明で言及した機能ユニットまたは構成要素間のタスクの分割は、必ずしも物理的なユニットへの分割に対応せず、反対に、1つの物理的構成要素は、複数の機能を有する場合があり、1つのタスクは、いくつかの物理的構成要素によって協働して実行され得る。いくつかの構成要素またはすべての構成要素は、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装され得るか、またはハードウェアとして、もしくは特定用途向け集積回路として実装され得る。そのようなソフトウェアは、コンピュータ記憶媒体(または、非一時的媒体)および通信媒体(または、一時的媒体)を備え得るコンピュータ可読媒体上に分散されてよい。当業者によく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ命令、プログラムモジュール、または他のデータなど、情報を記憶するための任意の方法または技術で実装される、揮発性および不揮発性、取り外し可能および取り外し不可能な媒体の両方を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリもしくは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)もしくは他の光ディスクストレージ、磁気かセット、磁気テープ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、または所望の情報を記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を含むが、これらに限定されない。
当業者は、上述の実施形態を多くの方法で修正し、上記の実施形態で示したような本発明の利点を依然として使用することができることを諒解されよう。たとえば、補助フレームおよび補助フレームを補完するフレームを符号化する順序は、任意の適切な方法で変更されてよい。たとえば、GOP内のすべての補助フレームは、符号化されたビデオストリーム内の符号化された補助フレームとインターレースする補助フレームを参照するインター符号化されたフレームを含める前にまず符号化され得る。また、ビデオ記録デバイスのレンズによって生じる画像データの歪みを少なくとも部分的に中和する画像変換(たとえば、BDC)ならびに他の画像変換(たとえば、EIS)の両方が特定の画像データに適用される必要があり得る。したがって、本発明は、示した実施形態に限定されるべきではなく、添付の請求項によってのみ定義されるべきである。さらに、当業者が理解するように、示した実施形態は組み合わせられてよい。

Claims (14)

  1. ビデオストリームをビデオコーティングフォーマットで符号化するための方法であって、前記ビデオコーティングフォーマットが、補助フレームを符号化された前記ビデオストリーム内に含めることをサポートし、前記補助フレームが、符号化された前記ビデオストリーム内の別のフレームによって参照され、前記別のフレームを補完する画像データを備え、前記補助フレームの前記画像データが、符号化された前記ビデオストリームを復号するときに示されることは意図されず、代わりに、画像データが示されることを達成するために、前記別のフレームのデータとともに使用されることが意図される方法において、
    ビデオ捕捉デバイスによって捕捉された生画像データである第1の画像データを受信するステップと、
    前記第1の画像データを第1の補助フレームの画像データとして使用するステップと、
    前記第1の補助フレームをイントラフレームとして符号化するステップと、
    第1のフレームを前記第1の補助フレームを参照するインターフレームとして符号化するステップであって、前記第1のフレームの動きベクトルが、前記第1の画像データに適用されることになる第1の画像変換を表す、符号化するステップと
    を備える、方法。
  2. 前記ビデオ捕捉デバイスによって捕捉された生の画像データである第2の画像データを受信するステップと、
    第2の補助フレームを前記第1の補助フレームを参照するインターフレームとして符号化するステップであって、前記第2の画像データと前記第1の画像データとの間の比較に基づいて行われる、符号化するステップと、
    第2のフレームを前記第2の補助フレームを参照するインターフレームとして符号化するステップであって、前記第2のフレームの動きベクトルが、前記第2の画像データに適用されることになる第2の画像変換を表す、符号化するステップと
    をさらに備える、請求項1に記載の方法。
  3. 前記第2の画像変換が前記第1の画像変換に等しい、請求項2に記載の方法。
  4. 前記第1の画像変換と前記第2の画像変換とが異なる、請求項2に記載の方法。
  5. 前記第1の画像変換および前記第2の画像変換が、前記ビデオ記録デバイスのレンズによって生じる前記第1の画像データおよび前記第2の画像データの歪みを少なくとも部分的に中和する、請求項3または4に記載の方法。
  6. 前記歪みが、樽形歪曲、糸巻き型歪曲、陣笠型歪曲、および前記ビデオ記録デバイスの広角レンズによって生じる歪みのうちの1つである、請求項5に記載の方法。
  7. 前記第2のフレームを前記符号化するステップが、前記第1のフレームを複写し、前記第1のフレームの前記複写の参照先を前記第2の補助フレームとすることを備える、請求項3に記載の方法。
  8. 前記第1の画像変換および前記第2の画像変換が、電気画像安定化、デジタルパンティルトズーム(DPTZ)のうちの1つに関する、請求項3または4に記載の方法。
  9. 前記第1のフレームを前記符号化するステップが、
    前記第1の画像データに適用されることになる第1の画像変換を判定するステップと、
    前記第1のフレームの前記動きベクトルに関して判定されたマクロブロックサイズに従って前記第1の画像変換をサンプリングすることによって、前記第1の画像変換を表す動きベクトルを算出するステップと
    を備える、請求項1から8のいずれか一項に記載の方法。
  10. 前記第1のフレームを前記符号化するステップが、
    前記第1の画像データに適用されることになる第1の画像変換を判定するステップと、
    前記第1のフレームの前記動きベクトルに関して判定された複数のマクロブロックサイズに従って前記第1の画像変換をサンプリングすることによって、前記第1の画像変換を表す動きベクトルを算出するステップと
    を備える、請求項1から8のいずれか一項に記載の方法。
  11. 前記第1のフレームおよび前記第2のフレームの前記動きベクトルが事前に算出され、前記第1のフレームおよび前記第2のフレームをそれぞれ前記符号化するステップが、前記事前に算出された動きベクトルを検索することを備える、請求項3に記載の方法。
  12. 前記ビデオコーティングフォーマットが、高効率画像ファイルフォーマット、アドバンストビデオコーディング、H.264、高効率画像ビデオコーディング、H.265、H.266、VP9、VP10、およびAV1のうちの1つである、請求項1から11のいずれか一項に記載の方法。
  13. 処理能力を有するデバイスによって実行されると、請求項1から12のいずれか一項に記載の方法を実行するように適合された命令を備えたコンピュータ可読記憶媒体を備えるコンピュータプログラム製品。
  14. ビデオ捕捉デバイスによって捕捉されたビデオストリームをビデオコーティングフォーマットで符号化するように適合されたエンコーダであって、前記ビデオコーティングフォーマットが、補助フレームを符号化された前記ビデオストリーム内に含めることをサポートし、前記補助フレームが、符号化された前記ビデオストリーム内の別のフレームによって参照され、前記別のフレームを補完する画像データを備え、前記補助フレームの前記画像データが、符号化された前記ビデオストリームを復号するときに示されることが意図されず、代わりに、画像データが示されることを達成するために前記別のフレームのデータとともに使用されることが意図されるエンコーダにおいて、
    前記ビデオ捕捉デバイスによって捕捉された生の画像データである第1の画像データを受信することと、
    前記第1の画像データを第1の補助フレームの画像データとして使用することと、
    前記第1の補助フレームをイントラフレームとして符号化することと、
    第1のフレームを前記第1の補助フレームを参照するインターフレームとして符号化することであって、前記第1のフレームの動きベクトルが、前記第1の画像データに適用されることになる第1の画像変換を表す、符号化することと
    を行うように適合される、エンコーダ。
JP2018191946A 2017-10-18 2018-10-10 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ Active JP6975121B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17197036.1A EP3474548A1 (en) 2017-10-18 2017-10-18 Method and encoder for encoding a video stream in a video coding format supporting auxiliary frames
EP17197036.1 2017-10-18

Publications (3)

Publication Number Publication Date
JP2019097157A true JP2019097157A (ja) 2019-06-20
JP2019097157A5 JP2019097157A5 (ja) 2021-02-18
JP6975121B2 JP6975121B2 (ja) 2021-12-01

Family

ID=60186021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018191946A Active JP6975121B2 (ja) 2017-10-18 2018-10-10 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ

Country Status (6)

Country Link
US (1) US10798418B2 (ja)
EP (1) EP3474548A1 (ja)
JP (1) JP6975121B2 (ja)
KR (1) KR102161888B1 (ja)
CN (1) CN109688413B (ja)
TW (1) TWI743402B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021064936A (ja) * 2019-09-20 2021-04-22 アクシス アーベー トランスコーディングをしないポストマスキング
JP2021064938A (ja) * 2019-09-23 2021-04-22 アクシス アーベー ビデオエンコーディング方法、及び、エンコードされたビデオのファイルサイズを減らす方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3745706B1 (en) * 2019-05-29 2021-06-30 Axis AB System and method for video processing with picture stabilization and predictive compression
CN111131857A (zh) * 2019-12-31 2020-05-08 北京金山云网络技术有限公司 图像压缩方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62299187A (ja) * 1986-06-18 1987-12-26 Fujitsu Ltd 動画像符号化処理方式
JP2017120980A (ja) * 2015-12-28 2017-07-06 Kddi株式会社 インター予測装置、インター予測方法、動画像符号化装置、動画像復号装置及びコンピュータ可読記録媒体
WO2017154563A1 (ja) * 2016-03-07 2017-09-14 ソニー株式会社 符号化装置および符号化方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2208950A1 (en) 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US6757326B1 (en) * 1998-12-28 2004-06-29 Motorola, Inc. Method and apparatus for implementing wavelet filters in a digital system
US6414992B1 (en) 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
US6795585B1 (en) * 1999-07-16 2004-09-21 Eastman Kodak Company Representing digital images in a plurality of image processing states
US6775407B1 (en) * 2000-08-02 2004-08-10 Eastman Kodak Company Producing a final modified digital image using a source digital image and a difference digital image
CN101494790B (zh) * 2001-10-17 2012-05-23 松下电器产业株式会社 动态图像编码方法及装置
US7646817B2 (en) * 2003-03-28 2010-01-12 Microsoft Corporation Accelerating video decoding using a graphics processing unit
US7706626B2 (en) * 2005-12-20 2010-04-27 Carestream Health, Inc. Digital image reconstruction using inverse spatial filtering
CN101127900A (zh) * 2006-08-17 2008-02-20 上海乐金广电电子有限公司 利用基本层的图像信号的编码/解码方法及装置
US9344682B2 (en) * 2006-10-02 2016-05-17 Telefonaktiebolaget L M Ericsson Multi-media management
US8023562B2 (en) * 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
JP5154361B2 (ja) 2008-10-20 2013-02-27 三星電子株式会社 撮像装置及び撮像装置の制御方法
JP2010199656A (ja) * 2009-02-23 2010-09-09 Panasonic Corp 動画撮像装置
US8542737B2 (en) * 2010-03-21 2013-09-24 Human Monitoring Ltd. Intra video image compression and decompression
JP5631229B2 (ja) 2011-01-31 2014-11-26 キヤノン株式会社 撮像装置、その制御方法及びプログラム
CN103167283B (zh) * 2011-12-19 2016-03-02 华为技术有限公司 一种视频编码方法及设备
US9560353B2 (en) 2012-01-27 2017-01-31 Sun Patent Trust Video encoding method, video encoding device, video decoding method and video decoding device
US9807411B2 (en) * 2014-03-18 2017-10-31 Panasonic Intellectual Property Management Co., Ltd. Image coding apparatus, image decoding apparatus, image processing system, image coding method, and image decoding method
US9609275B2 (en) * 2015-07-08 2017-03-28 Google Inc. Single-stream transmission method for multi-user video conferencing
AU2015207825A1 (en) 2015-07-28 2017-02-16 Canon Kabushiki Kaisha Method, apparatus and system for encoding video data for selected viewing conditions
US20180130022A1 (en) * 2016-11-04 2018-05-10 Ihab Ayoub Message management system and method
EP3396952B1 (en) * 2017-04-25 2019-04-17 Axis AB Method and image processing unit for forming a video stream
US10728573B2 (en) * 2017-09-08 2020-07-28 Qualcomm Incorporated Motion compensated boundary pixel padding
EP3499870B1 (en) * 2017-12-14 2023-08-23 Axis AB Efficient blending using encoder
EP3591972A1 (en) * 2018-07-02 2020-01-08 Axis AB Method and system for encoding video with overlay

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62299187A (ja) * 1986-06-18 1987-12-26 Fujitsu Ltd 動画像符号化処理方式
JP2017120980A (ja) * 2015-12-28 2017-07-06 Kddi株式会社 インター予測装置、インター予測方法、動画像符号化装置、動画像復号装置及びコンピュータ可読記録媒体
WO2017154563A1 (ja) * 2016-03-07 2017-09-14 ソニー株式会社 符号化装置および符号化方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021064936A (ja) * 2019-09-20 2021-04-22 アクシス アーベー トランスコーディングをしないポストマスキング
JP7122350B2 (ja) 2019-09-20 2022-08-19 アクシス アーベー トランスコーディングをしないポストマスキング
JP2021064938A (ja) * 2019-09-23 2021-04-22 アクシス アーベー ビデオエンコーディング方法、及び、エンコードされたビデオのファイルサイズを減らす方法

Also Published As

Publication number Publication date
US20190116382A1 (en) 2019-04-18
EP3474548A1 (en) 2019-04-24
US10798418B2 (en) 2020-10-06
CN109688413B (zh) 2021-10-22
CN109688413A (zh) 2019-04-26
KR20190043465A (ko) 2019-04-26
JP6975121B2 (ja) 2021-12-01
TW201924352A (zh) 2019-06-16
KR102161888B1 (ko) 2020-10-05
TWI743402B (zh) 2021-10-21

Similar Documents

Publication Publication Date Title
JP6975121B2 (ja) 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ
CN107646194B (zh) 用于视频运动补偿的装置和方法
US10848771B2 (en) Encoding and decoding a video signal
EP3648059B1 (en) Video processing device and method for determining motion metadata for an encoded video
CN113056910A (zh) 用于视频编码的运动矢量预测子索引编码
CN114466192A (zh) 图像/视频超分辨率
JP6209026B2 (ja) 画像符号化装置及びその制御方法
CN114157870A (zh) 编码方法、介质及电子设备
CN116723183A (zh) 一种基于轻量化的视频文件设备及处理方法
JP2018085660A (ja) 画像符号化装置
WO2023092256A1 (zh) 一种视频编码方法及其相关装置
JP6539580B2 (ja) インター予測装置、インター予測方法、動画像符号化装置、動画像復号装置及びコンピュータ可読記録媒体
Eichenseer et al. Coding of distortion-corrected fisheye video sequences using H. 265/HEVC
JP6942504B2 (ja) 符号化装置、撮像装置、符号化方法、及びプログラム
US20230412815A1 (en) Camera system and method for encoding two video image frames captured by a respective one of two image sensors
US20230262274A1 (en) video processing method of image quality compensation
CN113132721B (zh) 视频编码方法、装置、可读存储介质及电子设备
US20230015232A1 (en) Video processing apparatus, video processing system and video processing method
JP2023120155A (ja) オーバレイを含むビデオストリームの符号化
JP2021044706A (ja) 画像符号化装置及びその制御方法及びプログラム
CN116723331A (zh) 一种基于轻量化的实时视频图像设备及处理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210105

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210428

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211105

R150 Certificate of patent or registration of utility model

Ref document number: 6975121

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150