JP6908797B1 - 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ - Google Patents

高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ Download PDF

Info

Publication number
JP6908797B1
JP6908797B1 JP2021065873A JP2021065873A JP6908797B1 JP 6908797 B1 JP6908797 B1 JP 6908797B1 JP 2021065873 A JP2021065873 A JP 2021065873A JP 2021065873 A JP2021065873 A JP 2021065873A JP 6908797 B1 JP6908797 B1 JP 6908797B1
Authority
JP
Japan
Prior art keywords
picture
refresh
area
pictures
global motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021065873A
Other languages
English (en)
Other versions
JP2021108483A (ja
Inventor
ルー ユエフェン
ルー ユエフェン
アマー イハブ
アマー イハブ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATI Technologies ULC
Original Assignee
ATI Technologies ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATI Technologies ULC filed Critical ATI Technologies ULC
Application granted granted Critical
Publication of JP6908797B1 publication Critical patent/JP6908797B1/ja
Publication of JP2021108483A publication Critical patent/JP2021108483A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/017Head mounted
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0015Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy
    • H04L1/0017Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy where the mode-switching is based on Quality of Service requirement
    • H04L1/0018Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy where the mode-switching is based on Quality of Service requirement based on latency requirement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • H04L43/087Jitter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/507Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/0101Head-up displays characterised by optical features
    • G02B2027/014Head-up displays characterised by optical features comprising information/image processing systems
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/0093Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00 with means for monitoring data relating to the user, e.g. head-tracking, eye-tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Optics & Photonics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Quality & Reliability (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】グローバルモーション推定値に応じて、適応的にイントラリフレッシュ符号化をする方法を提供する。【解決手段】方法は、ビデオ符号化システムにおいて、ピクチャの第1セットに関連するグローバルモーション推定値が特定の閾値を超えないと決定したことに応じて、ピクチャのリフレッシュ領域の位置がピクチャの第1セット内の前のピクチャのリフレッシュ領域の位置に対して空間的にシフトするように、第1セット内の各ピクチャをイントラリフレッシュ符号化することと、ピクチャの第2セットに関連するグローバルモーション推定値が特定の閾値を超えていると決定したことに応じて、第2セット内の各ピクチャのリフレッシュ領域の位置が、第2セットに関連するグローバルモーション推定値の方向にあるピクチャエッジに隣接して固定されるように、第2セット内の各ピクチャをイントラリフレッシュ符号化することと、を含む。【選択図】図1

Description

(関連出願の相互参照)
本願は、2016年4月29日に出願された米国仮特許出願第62/329,602号、及び、2016年6月21日に出願された米国特許出願第15/188,067号に基づく優先権を主張し、その内容の全体が本明細書に参考として援用される。
ブロックベースのビデオコーディングは、連続するピクチャのビデオブロック間の空間的及び時間的冗長性を使用して、ビデオの効率的な符号化を提供する。通常、ピクチャのストリームは、例えば順方向予測ピクチャ(Pピクチャ)及び双方向予測ピクチャ(Bピクチャ)等のように、全体がイントラコーディングされたピクチャ(Iピクチャ)、及び、インターコーディング又は予測されたピクチャのセットとしてコーディングされる。Iピクチャは全体がイントラコーディングされるが、Pピクチャ及びBピクチャは少なくとも部分的に予測的にインターコーディングされるので、Iピクチャの符号化には、Pピクチャ及びBピクチャよりも大幅に多くの数のビットを要する。したがって、これらのコーディングされたピクチャを含む送信ビットストリームのビットレート、ジッタ及びレイテンシに悪影響を及ぼす可能性がある。レイテンシ及びジッタを改善する1つのアプローチは、ピクチャの残りの領域が予測的にインターコーディングされている間に、ピクチャのセットの各ピクチャの領域をイントラコーディング又は「リフレッシュ」する、イントラリフレッシュモードの実行である。イントラリフレッシュモードでは、ピクチャ間のモーション予測は、既にリフレッシュされたセットの前のピクチャの領域(この領域は、通常、「クリーン」領域と呼ばれる)に制限され、未だリフレッシュされていない前のピクチャの領域(この領域は、通常、「ダーティ」領域と呼ばれる)の使用が抑制される。従来のイントラリフレッシュモードでは、全体がイントラコーディングされた領域(すなわち、「リフレッシュ」領域)は固定サイズであり、イントラリフレッシュセットのピクチャの連続するピクチャ間で位置が移動する。イントラリフレッシュ技術の目的は、結果として得られる符号化ビットストリームのビットレートを平滑化することであるが、従来のイントラリフレッシュ技術におけるリフレッシュ領域の位置の移動は、レンダリングされたピクチャの透視図を表す「カメラ」の実質的な動き(モーション)を伴う仮想現実(VR)アプリケーション又は他のアプリケーションにおいてよく発生するように、表示されたコンテンツのグローバルモーションの存在下で、大幅なビットレート変動又はジッタがよく発生する可能性がある。
本開示は、添付図面を参照することによってより良く理解され、その多数の特徴及び利点が当業者に明らかになる。異なる図面における同じ参照記号の使用は、類似又は同一のアイテムを示す。
いくつかの実施形態によるモーション適応型イントラリフレッシュ符号化技術、及び、この技術と従来のイントラリフレッシュ符号化技術との比較を示す図である。 いくつかの実施形態による、ピクチャに関連するグローバルモーション推定に基づいて、コーディングされるピクチャのリフレッシュ領域の幅を動的に設定する技術を示す図である。 いくつかの実施形態による、モーション適応型イントラリフレッシュコーディングを利用するビデオ処理システムを示すブロック図である。 いくつかの実施形態による、ビデオストリームのデュアルモードイントラリフレッシュコーディングの方法を示すフロー図である。
仮想現実(VR)及び拡張現実(AR)システムは、通常、ヘッドマウントディスプレイ(HMD)装置を介してVR又はARコンテンツをユーザに表示する場合に、「臨場感」に依拠する。この臨場感を提供する上での重要な要素の1つは、VR又はARコンテンツを含むピクチャのコーディング(符号化)、送信、デコーディング(復号化)及び表示に伴うレイテンシ又はジッタである。したがって、符号化されたビデオストリームを表すビットストリームの送信におけるレイテンシ又はジッタを低減することにより、ビデオ処理パイプラインにおける全体的なレイテンシ及びジッタの対応する低減がもたらされ、VR及びARアプリケーションにおける「臨場感」が向上し得る。この目的のために、例えば、ピクチャがレンダリングされた透視図を表す仮想カメラのコンテンツ又は他のモーションを表示するのに用いられるHMD装置のモーション等に起因する、表示コンテンツに存在するグローバルモーションの要因となる「モーション適応型イントラリフレッシュモード」を使用するビデオ処理システムについて以下に説明する。少なくとも1つの実施形態では、ビデオ処理システムは、ピクチャ又はピクチャのセットに対するグローバルモーションの推定値を算出する。このグローバルモーションの推定値は、例えば、HMD装置自体のモーションセンサデータから算出されてもよいし、ピクチャ内のコンテンツのモーションや連続するピクチャ間のコンテンツのモーションの分析から算出されてもよい。
グローバルモーションの推定値が十分なグローバルモーションを表さない場合、ビデオ処理システムは、イントラリフレッシュセットのピクチャのうち連続するピクチャ間でリフレッシュ領域の位置が移動する従来のイントラリフレッシュモードを使用する。しかし、グローバルモーション推定が十分なグローバルモーションを表す場合、ビデオ処理システムは、平滑化されたビットレートを有しており、これにより送信レイテンシを低減するビットストリームの結果として得られる部分を提供するように、このグローバルモーションの原因となるイントラリフレッシュモードを実行する。このモーション適応型イントラリフレッシュモードにおいて、ビデオ処理システムは、モーション適応型イントラリフレッシュモードが基本方向(すなわち、0、90、180及び270度)のみに制限され、イントラリフレッシュ符号化の際に、ピクチャが、リフレッシュ領域(すなわち、イントラ符号化された領域)を、固定又はピクチャの特定されたエッジに隣接する表示領域とする実施形態における、グローバルモーション推定方向にあるピクチャのエッジ(又はその主運動成分(primary motion component))を識別する。より詳細に説明するように、符号化されたピクチャのリフレッシュ領域を、新たなコンテンツが導入される可能性が最も高いピクチャのエッジ領域に固定することにより、イントラリフレッシュセットにおける後続のピクチャのモーションベクトル探索プロセスは、より効率的になり、したがって、平均ビットレートが改善され、ビットレートの平滑化が改善される。
説明を容易にするために、ピクチャが水平に配置された領域に分割されたイントラリフレッシュモードの実行について以下に示す。さらに、ユーザがHMD装置又は他のVR関連ディスプレイを使用するときのグローバルモーションは、通常、垂直面よりも水平面において頻繁に見られるため、以下の例における水平に配置された領域は、視点運動(perspective motion)とよく一致する。しかし、本明細書に記載されているものと同じ技術を、ピクチャ内で垂直に配置された領域を使用する実施態様においても適用することができ、さらに、ピクチャを領域に論理的に分割することによって、状況によっては、ピクチャの水平配置領域と、他の画像の垂直配置領域と、を切り替えることができる。
図1は、いくつかの実施形態によるビデオ処理システム100においてイントラリフレッシュ符号化を行うためのデュアルモードアプローチを示す図である。示された例において、ビデオ処理システム100は、ユーザの頭部104に装着されるヘッドマウントディスプレイ(HMD)装置102によって部分的に実装される。ビデオ処理システム100は、ピクチャをVR又はARビデオストリームにレンダリング及び符号化するビデオ符号化サブシステム(図1には示されていない)を含み、得られた符号化ビットストリームがHMD装置102に送信される。HMD装置102は、符号化されたビットストリームを復号化して、HMD装置102で表示されるピクチャの表現を復元する。
HMD装置102がユーザの頭部104に装着されると、HMD装置102は、X軸、Y軸又はZ軸(すなわち、ロール、ヨー、ピッチ)のうち1つ以上の周囲の回転と、X方向、Y方向又はZ方向のうち1つ以上の平行移動とを含む頻繁且つ大幅なモーションを受ける可能性がある。通常、ビデオ処理システム100は、HMD装置102の現在の姿勢を表す仮想カメラの視点からピクチャコンテンツを含むようにピクチャをレンダリングし、ユーザが動き回るのに伴ってHMD装置102の姿勢が変化するのにつれて仮想カメラの視点を更新することによって、この動き(モーション)を、ユーザに提示されるビデオコンテンツに組み込む。HMD装置102のモーションと、レンダリングされた表示コンテンツへのこのモーションの対応する組み込みとは、カメラ運動(この場合、「仮想」カメラの運動は、ユーザの頭部104の姿勢、したがってユーザの視点を表す)によって引き起こされるコンテンツ内に存在する広域の運動又はモーションである、一般に「グローバルモーション」と呼ばれるものをもたらす。このグローバルモーションの結果は、連続したピクチャに亘って、「新たな」コンテンツ(すなわち、前のピクチャに存在しないコンテンツ)が表示パネルの一方の端部又は側面に出現しやすくなり、「古い」コンテンツが他方の端部又は側面において表示パネルから離れるように動く可能性がある。説明のために、ユーザの頭部104が左から右へ回転する場合、この動作中に提示されるピクチャのシーケンスは、(ユーザの視点が右に移動するにつれて)右から入る新たなコンテンツと、左側の視野外にスライドする、既に表示されているコンテンツと、を示している。逆に、ユーザの頭部が右から左に回転する場合、この動作中に提示されるピクチャのシーケンスは、(ユーザの視点が左に移動するにつれて)左から入る新たなコンテンツと、右側の視野外にスライドする、既に表示されているコンテンツと、を示している。ユーザの頭部104を上下に回転させることも同様に、(ユーザが上を向いているか又は下を向いているかによって)上端又は下端における新たなコンテンツのシフト又はスライドを示し、反対側の端部における古いコンテンツの外部へのシフト又はスライドを示す。
従来のイントラリフレッシュ符号化スキームにおいて、グローバルモーションを組み込むピクチャのレンダリングは、通常、得られた符号化ビットストリームの送信において、符号化の効率の低下、したがってレイテンシの増加につながる。説明のために、図1は、4つのピクチャのシーケンスに関する2つの従来のイントラリフレッシュ符号化シナリオ、すなわち、最悪の場合のシナリオ112と、最良の場合のシナリオ114と、を示している。両方のシナリオについて、4つのピクチャのセットに対するグローバルモーション推定が、左から右への水平方向の(すなわち、ユーザの視点に対して右方向を有する)グローバルモーションベクトル106(「MV」とも呼ばれる)として表されると想定する。なお、ビデオコーデックのコンテキストにおける「モーションベクトル」という用語は、一般に、現在のピクチャ内のブロックから参照ピクチャ内の一致するブロックを向くベクトルを指すが、「グローバルモーションベクトル」という用語は、本明細書で使用されるように、グローバルモーションにおいて表される仮想カメラのモーションの方向を指している。図1について、最悪の場合のシナリオ112は、ピクチャ間のリフレッシュ領域のシフトパターンがグローバルモーションベクトルMVの方向と同じであるシナリオを表しており、最良の場合のシナリオ114は、リフレッシュ領域のシフト方向がグローバルモーションベクトルMVの方向と反対であるシナリオを表している。
上述したように、従来のイントラリフレッシュ符号化処理では、イントラリフレッシュセットの連続したピクチャの各々に対するリフレッシュ領域の位置は、イントラリフレッシュセットの前の画像内のリフレッシュ領域の位置に対して特定のシフト方向又はパターンで空間的にシフトする。すなわち、従来のイントラリフレッシュモードでは、ピクチャ内のリフレッシュ領域の位置は、イントラリフレッシュセット又はサイクル内のそのピクチャの位置のみに基づいている。説明のために、4つのピクチャのイントラリフレッシュセットの場合、第1ピクチャのリフレッシュ領域は、一方の端部(エッジ)に隣接しており、シフト方向において第1ピクチャを4分割したうちの1番目を占めることができ、当該セットの第2ピクチャのリフレッシュ領域は、シフト方向において第2ピクチャを4分割したうちの2番目を占めることができ、当該セットの第3ピクチャのリフレッシュ領域は、シフト方向において第3ピクチャを4分割したうちの3番目を占めることができ、当該セットの第4ピクチャのリフレッシュ領域は、シフト方向において第4ピクチャを4分割したうちの最後(4番目)を占めることができる。各ピクチャの他の領域は、「クリーン」又は「ダーティ」の何れかに分類される。符号化ピクチャの各領域の、リフレッシュ(R)領域、クリーン(C)領域又はダーティ(D)領域としての分類は、領域を符号化及び復号化することができる方法を表す。イントラ符号化されているリフレッシュ領域は、復号化される他のピクチャ又は領域を参照する必要がない。しかしながら、リフレッシュ領域の符号化には最も多くのビットが必要になるため、リフレッシュ領域の送信には、3つの領域のうち最大のビットレートが必要になる。ピクチャのクリーン領域を符号化するときのモーションベクトル探索範囲は、イントラリフレッシュされた領域へのインターピクチャエラーの伝搬を回避するために、前のピクチャのリフレッシュ領域及びクリーン領域(もしあれば)のみに制限される。対照的に、ピクチャのダーティ領域を符号化するときのモーションベクトル探索範囲は制限されず(フリー)、前のピクチャの全ての領域を包含することができる。したがって、前のピクチャ内の一致するブロックは、前のピクチャのダーティ領域にあり、したがって、現在のピクチャのクリーン領域の評価対象であるブロックのモーションベクトル探索範囲外になる可能性があるので、評価対象であるブロックは、その後イントラ符号化又はインター符号化されるが、ブロックマッチングが失敗又は最適ではないので、イントラ符号化された場合と同様のビット数を有する。しかし、この同じブロックが現在のピクチャのダーティ領域に位置する場合、一致するブロックを参照することは、前のピクチャにおいて制限又は限定もなく、したがって、モーションベクトル及び残差としてインター符号化される。このように、ピクチャのダーティ領域を符号化するためのビットレートは、通常、クリーン領域を符号化するためのビットレート以下である。すなわち、リフレッシュ領域を符号化するために必要なビットレベル(すなわち、ビット数)を「I」とし、クリーン又は「制限された」領域を符号化するために必要なビットレベルを「Pr」とし、ダーティ又は「フリー」領域を符号化するために必要なビットレベルを「Pf」として用いると、これらのビットレベル間の関係は、概して、I>>Pr>=Pfとして要約される。
(初期サイクル以外の典型的なイントラリフレッシュのサイクル全体を表す)最悪の場合のシナリオ112において、イントラリフレッシュセットは、ピクチャ1〜4で示された4つのピクチャを備える。このセットには4つのピクチャが存在するため、各ピクチャは、図1の例において水平に配置された領域として示されている4つの領域に論理的に区分される。上述したように、最悪の場合のシナリオ112では、(文字「R」で示される)リフレッシュ領域のシフトパターンがピクチャ間で左から右になるように、イントラリフレッシュ符号化モードが設定される。したがって、ピクチャ1を符号化する場合、左端の領域は、リフレッシュ領域として完全にイントラ符号化される。ピクチャ1の残りの3つの領域は、現在リフレッシュされておらず、以前リフレッシュされたイントラリフレッシュセットの前のピクチャ内の領域に空間的に対応してもいない領域を表しているので、ピクチャ1の残りの領域は、(文字「D」で示される)ダーティ領域とみなされ、したがって、このようにインター符号化される。ピクチャ2を符号化する場合、イントラリフレッシュの位置が中央左側の領域まで右にシフトし、これにより、中央左側の領域は、リフレッシュ領域として完全にイントラ符号化される。ピクチャ2の左端の領域は、ピクチャ1のリフレッシュ領域に対応する(すなわち、ピクチャ2の左端の領域は、リフレッシュされた前のピクチャの領域に対応する)ため、(文字「C」で示される)クリーン領域として識別され、インター符号化されるが、ピクチャ2の中央右側の領域及び右端の領域は、ピクチャ1内のリフレッシュされた領域へのブロック検索に限定されないため、ダーティ領域として識別され、インター符号化される。ピクチャ3を符号化する場合、ピクチャ1及びピクチャ2に対してリフレッシュ領域が再び右にシフトするので、ピクチャ3の中央右側の領域がピクチャ3のリフレッシュ領域として完全にイントラ符号化されるが、左端の領域及び中央左側の領域がクリーン領域としてインター符号化され、右端の領域はダーティ領域としてインター符号化される。リフレッシュ領域がピクチャ1、2、3に対して再び右にシフトすることによって、ピクチャ4の右端の領域がリフレッシュ領域として完全にイントラ符号化される。ピクチャ4の左端、中央左側及び中央右側の領域は、ピクチャ1〜3においてリフレッシュされた領域に対応しており、したがってクリーン領域としてインター符号化され、マークされる。
最悪の場合のシナリオ112のピクチャ1〜4にも示されるように、ピクチャ1〜4に対応する時間ピクチャに対するHMD装置102のグローバルモーションは、(図1において跳躍するジャガーのアイコンによって表される)新たなコンテンツがピクチャの右端からシフトインされ、古いコンテンツがピクチャの左端からシフトアウトされる。この新たなコンテンツの右から左への方向(左から右へのグローバルモーションから得られる)は、ピクチャ1〜4におけるリフレッシュ領域のシフト方向と反対であり、したがって、非効率的な符号化をもたらす。説明のために、ピクチャ1の場合、リフレッシュ領域Rはイントラ符号化される。しかしながら、ピクチャ1の右端の領域は、全て新たなコンテンツを有するので、その符号化効率は、完全にイントラ符号化された場合と基本的に同じであり、イントラ符号化される2つの領域がビットレベルIを有し、2つのダーティ領域がビットレベルPfを有することになる。ピクチャ2において、中央左側の領域は、リフレッシュ領域としてイントラ符号化される。しかし、全て新たなコンテンツが右端の領域に再び取り込まれたため、ピクチャ2の右端の領域もイントラ符号化され、2つの領域がビットレベルIでイントラ符号化され、クリーン領域がビットレベルPrでイントラ符号化され、ダーティ領域がビットレベルPfでイントラ符号化される。ピクチャ3を符号化すると、状況がさらに悪化する。このピクチャでは、中央右側の領域はリフレッシュ領域として符号化され、したがってビットレベルIを必要とする。ピクチャ1及びピクチャ2と同様に、グローバルモーション(MV)によって新たなコンテンツが右側にシフトしているため、ピクチャ3の右端の領域もビットレベルIでイントラ符号でなければならない。さらに、ピクチャ3の中央左側の領域は、ピクチャ2のリフレッシュ領域ピクチャ及びクリーン領域には存在しないコンテンツから実質的に構成されているため、ピクチャ3の中央左側の領域は、同様に、ビットレベルIで主にイントラ符号化されなければならない。ピクチャ3の左端の領域は、前のピクチャのダーティ領域からの新たなコンテンツを含まないので、ビットレベルPrでインター符号化される。ピクチャ4の場合、ピクチャ4のリフレッシュ領域は、グローバルモーションによって全て新たなコンテンツが取り込まれている領域に一致し、他の領域は、前の画像のクリーン領域に既に存在するコンテンツを含むので、ピクチャ4のリフレッシュ領域を除く全てがビットレベルPrでインター符号化されるのが可能になることから、符号化に必要なビット数が軽くなる。このように、最悪の場合のシナリオ112においてピクチャ1〜4を符号化すると、2つのピクチャの各々が、ビットレベルI領域で符号化される2つの領域を有し、1つのピクチャがビットレベルIで符号化される3つの領域を有することになり、したがって、大幅に変化するビットレートで符号化されたビットストリーム部がもたらされる。
最良の場合のシナリオ114のためのイントラリフレッシュセットは、同様に4つの水平に配置された領域に論理的に区分された、ピクチャ1、ピクチャ2、ピクチャ3及びピクチャ4として表される4つのピクチャを含む。さらに、最良の場合のシナリオ114では、従来のイントラリフレッシュ符号化モードは、リフレッシュ領域がピクチャ間で右から左にシフトするように設定される。したがって、ピクチャ1を符号化する場合、右端の領域がリフレッシュ領域としてイントラ符号化され、ピクチャ2を符号化する場合、中央右側の領域がリフレッシュ領域としてイントラ符号化され、ピクチャ3を符号化する場合、中央左側の領域がリフレッシュ領域としてイントラ符号化され、ピクチャ4を符号化する場合、左端の領域がリフレッシュ領域としてイントラ符号化される。しかし、最悪の場合のシナリオ112とは異なり、最良の場合のシナリオ114では、リフレッシュ領域のシフト方向は、新たなコンテンツが表示されるために取り込まれる方向に従う。ピクチャ1〜4の各々の領域を符号化するために結果として得られるビットレベルが図1に示されている。したがって、図示するように、最良の場合のシナリオ114は、ビットレベルIで符号化された2つの領域をそれぞれ有する3つのピクチャと、ビットレベルIで符号化された1つの領域を有する1つのピクチャと、を必要とする。したがって、最良の場合のシナリオ114は、最悪の場合のシナリオ112と比較して、4つのピクチャの符号化された表現の送信に関していくらか平滑なビットレートを示しているが、最良の場合のシナリオ114のビットレートは、かなりジッタなままであり、結果として得られる符号化された表示ストリームのレイテンシ又はジッタに悪影響を及ぼし得る。
本明細書で説明するモーション適応型イントラリフレッシュ符号化技術については、例示的なシナリオ116は、このプロセスを、シナリオ112,114に示されたのと同様の4つのピクチャセットに適用することを示している。しかしながら、リフレッシュ領域の位置がイントラリフレッシュセットの各ピクチャ間で特定の方向にシフトするシナリオ112,114によって表される従来のイントラリフレッシュ符号化処理と異なり、モーション適応型イントラリフレッシュ符号化処理は、ピクチャのリフレッシュ領域を、ピクチャに関連するグローバルモーションの方向にあるピクチャエッジに直接隣接する領域に選択する。上述したように、図1の例において、グローバルモーションは左から右であり、したがって、右端は、グローバルモーションの方向における表示の端部として識別される。さらに、この例の目的として、グローバルモーションベクトルMVの大きさ及び方向は、4つのピクチャ全てに亘って一定である、すなわち、ピクチャ1〜4の各々が、同じグローバルモーション推定値を有すると想定される。このような想定は、グローバルモーションがビデオシーケンス内では孤立して現れ難いが、ピクチャグループ間で継続するという事実に基づいている。
右端がグローバルモーションの方向のエッジとして識別されるため、ピクチャ1〜4の各々の右端の領域(すなわち、右端に隣接する領域)が、ピクチャ毎にリフレッシュされる領域として選択される。このように、ピクチャ1〜4の各々の右端の領域には、グローバルモーションによって新たなコンテンツが取り込まれ、また、グローバルモーションを考慮して右端の領域がピクチャ1〜4の各々のリフレッシュ領域として選択されるので、ビットレベルIのリフレッシュ領域としてのピクチャ1〜4の各々の右端の領域のイントラ符号化は、リフレッシュイントラ符号化要件と、新たに取り込まれたコンテンツをイントラ符号化する必要性と、の両方を満たすように作用する。さらに、リフレッシュ領域がピクチャ間の固定位置にあり、この固定位置は新たなコンテンツが生じる場所であるため、クリーン領域は、従来のイントラリフレッシュ技術を表すシナリオ112,114におけるクリーン領域の一部をイントラ符号化する必要性と比較して、新たなコンテンツと同じ方向にピクチャを横切ってシフトし、各ピクチャのクリーン領域をインター符号化することが可能になる。得られたビットレート符号化プロファイルは、シナリオ116のピクチャ1〜4の下に示されている。示されているように、ピクチャ1〜4は、モーション適応型イントラリフレッシュ技術を使用してイントラ符号化される2つ以上の領域を必要とせず、したがって、従来の方法と比較して、結果として得られる符号化ビットストリームに対してより平滑なビットレートがもたらされる。
シナリオ116の例は、所定のピクチャの領域が等しい幅であり、特定の領域タイプのサイズがピクチャに亘って一定であると想定されているが、通常、1つ以上の要因に基づいてリフレッシュ領域のサイズを動的に調整し、次に同じイントラリフレッシュセット内の連続するピクチャのクリーン領域及びダーティ領域のサイズが変化することが有益である。特に、ピクチャのリフレッシュ領域の幅を、グローバルモーションによって当該ピクチャの対応するエッジから取り込まれた新たなコンテンツの「幅」と一致させるように選択することは、リフレッシュ領域の最適な設定をもたらし得る。例示すると、取り込まれた新たなコンテンツの幅がリフレッシュ領域の幅よりも大きい場合、その新たなコンテンツの一部は、リフレッシュ領域のイントラ符号化によってカバーされず、このため、新たなコンテンツの一部をカバーするように隣接領域の少なくとも一部がイントラ符号化される必要があることから、狭いリフレッシュ領域には利点がない。逆に、リフレッシュ領域が、グローバルモーションによってピクチャ内に取り込まれた新たなコンテンツの幅よりも広い場合、完全にイントラ符号化されたピクチャコンテンツの量は、不必要に大きくなる。さらに、1つのピクチャ内のC領域が前のピクチャ内のD領域の一部をカバーするように、C領域が拡張されてもよい。これは、前のピクチャのD領域をモーションベクトル検索に使用することができないため、C領域の符号化効率に影響を与える。このように、リフレッシュ領域の幅は、リフレッシュ領域が固定されたピクチャのエッジから新たなコンテンツが取り込まれるレートを表すグローバルモーション推定値に一致する場合に、符号化効率の最適化又は向上をもたらし得る。
図2は、ピクチャストリームのモーション適応型イントラリフレッシュ符号化の間におけるリフレッシュ領域の動的構成の一例を示す図である。図示した例において、ビデオストリームは、ピクチャ1〜6で表される6つのピクチャを有するイントラリフレッシュセットを含む。符号202は、各ピクチャに対応するグローバルモーションベクトルMVの大きさを示している。各ピクチャに対する特定のグローバルモーションベクトルMVは、例えば、ピクチャに対応する時間におけるHMD装置102のモーションから決定される。さらに、この例では、各ピクチャ1〜6のグローバルモーションベクトルMVは、左から右へのモーションとなるように決定される。したがって、本明細書に記載のモーション適応型イントラリフレッシュ技術を使用して、各ピクチャ1〜6のリフレッシュ領域が、右端に隣接する領域に固定される。
ピクチャ1を符号化する場合、このピクチャの右端のリフレッシュ領域R1は、このピクチャに対して決定されたグローバルモーションの大きさに基づいて、幅がW1に設定される。さらに、ピクチャ1がこのイントラリフレッシュセットにおける第1ピクチャであるため、ピクチャ1の残りの領域はダーティ領域D1である。ピクチャ2を符号化する場合、このピクチャの右端のリフレッシュ領域R2は、このピクチャ画像に対して決定されたグローバルモーションの大きさに基づいて、幅がW2に設定される。また、ピクチャ1のリフレッシュ領域R1は、グローバルモーションにより左方向にシフトして、ピクチャ2のクリーン領域C1となる。したがって、ピクチャ2の残りは、ダーティ領域D2である。ピクチャ3については、リフレッシュ領域R3は、対応するグローバルモーションの大きさに基づいて、幅がW3に設定される。ピクチャ2のリフレッシュ領域R2及びクリーン領域C1は、グローバルモーションによって左方向にシフトしてクリーン領域C2となり、ピクチャ3の残りはダーティ領域D3となる。同様の処理により、ピクチャ4については、幅W4を有する例示されたリフレッシュ領域R4と、クリーン領域C2及びリフレッシュ領域R3から得られるクリーン領域C3と、ダーティ領域D4と、が得られる。ピクチャ5については、幅W5を有する例示されたリフレッシュ領域R5と、クリーン領域C3及びリフレッシュ領域R4から得られるクリーン領域C4と、ダーティ領域D5と、が得られる。ピクチャ6については、幅W6を有する例示されたリフレッシュ領域R6と、クリーン領域C4及びリフレッシュ領域R5から得られるクリーン領域C5と、が得られる。
図3は、本開示の少なくとも1つの実施形態によるビデオ処理システム100の例示的な実装例を示す図である。図示した例において、ビデオ処理システム100は、ビデオ生成サブシステム302と、HMD装置304(HMD装置102の一実施形態)と、を含み、これらは、例えば有線通信リンク、無線リンク又はこれらの組み合わせを含む送信リンク306を介して接続されている。有線通信リンクの例には、イーサネット(登録商標)リンク、ユニバーサルシリアルバス(USB)リンク、高解像度マルチメディアインタフェース(HDMI(登録商標))リンク等が含まれる。無線通信リンクの例には、IEEE802.11ローカルエリアネットワーク、Bluetooth(登録商標)パーソナルエリアネットワーク等が含まれる。ビデオ生成サブシステム302は、ビデオソース308と、グローバルモーション推定モジュール310と、モード制御モジュール312と、エンコーダ314と、リンクインタフェース316と、を含む。HMD装置304は、リンクインタフェース318と、デコーダ320と、ディスプレイ制御装置322と、1つ以上のディスプレイパネル(例えば、左目用ディスプレイパネル324及び右目用ディスプレイパネル326等)と、を含む。さらに、いくつかの実施形態では、HMD装置304は、1つ以上のモーションベースのセンサ(例えば、ジャイロスコープ330、加速度計332及び磁力計334等)を有する慣性計測装置(IMU)328を含む。他の例には、構造化光センサ、レーザセンサ等が含まれる。
全体的な概要として、ビデオ生成サブシステム302は、VR/ARコンテンツを表すピクチャストリームをレンダリングし、ピクチャストリーム340を符号化ビットストリーム342に符号化し、符号化ビットストリームをHMD装置304に送信するように動作する。そして、HMD装置304のデコーダ320は、符号化ビットストリーム342を復号化して、ディスプレイ制御装置322及びディスプレイパネル324,326を介してユーザに表示するために提供されるピクチャストリーム340(又はその損失のある表現)を取得するように動作する。このために、ビデオソース308は、ピクチャストリームをレンダリングするよう動作する。このように、ビデオソース308は、例えば、IMU328によって又は他の頭部追跡機構を用いて計測されるHMD装置304のモーション又は姿勢に少なくとも部分的に基づいて、VR/ARコンテンツを表すピクチャをレンダリングするVR/ARアプリケーションを実行する1つ以上のプロセッサを備える。エンコーダ314は、符号化ビットストリーム342を生成するためにピクチャを符号化するように動作し、符号化ビットストリーム342は、送信リンク306を介した送信のためにリンクインタフェース316に提供される。
符号化処理の間、エンコーダ314は、デュアルモードエンコーダを含むことができ、エンコーダ314は、リフレッシュ領域の位置がイントラリフレッシュセットのピクチャ間でシフトする従来のイントラリフレッシュ符号化モード、又は、本明細書で説明するモーション適応型イントラリフレッシュモードで動作するように構成されている。それに応じてエンコーダ314を構成するために、グローバルモーション推定モジュール310は、更新されたグローバルモーション推定値を繰り返し取得し、更新されたグローバルモーション推定値の各々をモード制御モジュール312に提供する。次いで、モード制御モジュール312は、グローバルモーション推定値から、従来のイントラリフレッシュモード又はモーション適応型イントラリフレッシュモードの何れを実行するかを決定し、それに応じて、モード構成信号344を介してエンコーダ314を構成する。さらに、モーション適応型イントラリフレッシュモードが実行される場合、モード制御モジュール312は、エンコーダ314によって符号化される現在のピクチャについてのリフレッシュ領域の特性(リフレッシュ領域がピクチャのどのエッジに隣接しているか、及び、リフレッシュ領域の幅を含む)をさらに決定し、これらのパラメータを、リフレッシュ領域構成信号346を介してエンコーダ314に通知することができる。
図4は、グローバルモーション推定モジュール310、モード制御モジュール312、及びエンコーダ314の動作の方法400をより詳細に示すフロー図である。ピクチャの符号化を開始する前に、ブロック402において、エンコーダ314、モード制御モジュール312及びグローバルモーション推定モジュール310は、関連するパラメータで初期化される。例示のために、いくつかの実施形態では、エンコーダ314は、特定の数Nのピクチャをイントラリフレッシュセットに実装するように構成されており、モード制御モジュール312は、グローバルモーション推定に適用される特定の閾値と、テンポラリ変数Xと、を1に設定するように構成されている。初期化後、ビデオソース308は、ストリーム340用のピクチャのレンダリングを開始し、レンダリングされた各ピクチャは、ブロック404の繰り返しにおいてエンコーダ314に受信される。
ピクチャのレンダリング及び受信と同時に、ブロック406において、グローバルモーション推定モジュール310は、現在のピクチャの繰り返しiに対するグローバルモーション推定値MV(i)を決定する。ブロック405で表されるように、一実施形態において、グローバルモーション推定モジュール310は、IMU328の1つ以上のモーションベースのセンサからのセンサデータに基づいて、グローバルモーション推定値MV(i)を決定する。例示のために、IMU328は、HMD装置304の現在の姿勢、及び、HMD装置304の姿勢の現在の変化を決定するために、ジャイロスコープ330、加速度計332又は磁力計334の1つ以上を周期的にサンプリングし、グローバルモーション推定モジュール310は、この情報からグローバルモーション推定値MV(i)(例えば、ディスプレイパネル324,326の表示空間に対する任意の回転運動の対応する並進移動への変換を含む)を決定する。或いは、ブロック407で表されるように、グローバルモーション推定モジュール310は、現在のピクチャ及び1つ以上の前のピクチャを用いて符号化される現在のピクチャのモーションに基づく分析を採用した様々なグローバルモーション技術を用いて、グローバルモーション推定値MV(i)を決定する。
本明細書で説明するように、モーション適応型イントラリフレッシュモードは、イントラリフレッシュ符号化ピクチャのリフレッシュ領域を、そのピクチャのグローバルモーションの方向にあるピクチャエッジに隣接する領域に「固定」する。しかし、グローバルモーションは、ピクチャの4つのエッジを表す4つの基本方位と平行でない方向を有し得ることが理解されるであろう。例示のために、図1を簡単に参照すると、グローバルモーション推定値MV(i)は、(ユーザの視点に対して)右方向及び下方向の両方向を有するモーションベクトル120によって表される。このような状況では、グローバルモーション推定モジュール310は、グローバルモーション推定値MV(i)の主方向成分(すなわち、4つの基本軸のうち1つと平行であり、最大の大きさを有するグローバルモーション推定値MV(i)の方向成分)を使用する。例示のために、モーションベクトル120は水平方向成分122及び垂直方向成分124の両方を有し、水平方向成分122の方が大きいため、水平方向成分122がグローバルモーション推定値MV(i)として使用される。或いは、垂直方向のモーションよりも水平方向のモーションに起因して取り込まれるコンテンツに対してユーザが敏感である可能性が高いことから、グローバルモーション推定値の水平方向成分がデフォルトでMV(i)として使用される。
ブロック408において、モード制御モジュール312は、グローバルモーション推定値MV(i)を受信し、このグローバルモーションの大きさを、モードをモーション適応型イントラリフレッシュ符号化モードに切り替えるのに十分であるとみなされる最小のグローバルモーションを表す特定の閾値と比較する。この閾値は、モデリング、実験等によって決定され、場合によっては、閾値に対する様々な値の影響のフィードバック又は他の分析に基づいて経時的に変更される。グローバルモーション推定値MV(i)の大きさがこの閾値を超えない場合、モード制御モジュール312は、モード構成信号344を介してエンコーダ314を構成して、ブロック404において受信されたピクチャを符号化するために従来のイントラリフレッシュモードを使用する。このように構成されたことに応じて、エンコーダ314は、ブロック410において、現在のイントラリフレッシュセット内のピクチャの位置を表す変数Xによって特定されたピクチャ内のリフレッシュ領域の位置によって、ピクチャをイントラリフレッシュ符号化する。ブロック412において、変数Xは、セットの次のリフレッシュ位置にシフトされる(すなわち、Xは、(X+1)MOD Nに設定される)。
ブロック408に戻ると、グローバルモーション推定値MV(i)の大きさが閾値を超える場合、モード制御モジュール312は、モード構成信号344を介してエンコーダ314を構成し、モーション適応型イントラリフレッシュモードをピクチャに対して使用する。この目的のために、ブロック414において、モード制御モジュール312は、グローバルモーション推定値MV(i)の方向(又は、グローバルモーション推定値MV(i)の主成分の方向)にあるピクチャエッジを識別する。例示のために、左から右へのグローバルモーションはピクチャの右端の選択をもたらし、右から左へのグローバルモーションはピクチャの左端の選択をもたらす。同様に、垂直に配置されたリフレッシュ領域を実装することができ、上方向のグローバルモーションはピクチャの上端の選択をもたらし、下方向のグローバルモーションはピクチャの下端の選択をもたらす。さらに、このモーション適応型イントラリフレッシュ技術は、基本方向(すなわち、純粋に右左又は上下)のモーションに限定されない。例示のために、例えば、左上から右下、右下から左上、右上から左下、左下から右上等のモーションに対して、同じアプローチを使用することができる。ブロック416において、モード制御モジュール312は、グローバルモーション推定値MV(i)(又はその主方向成分)の大きさに基づいて、ピクチャに対して符号化されるリフレッシュ領域の幅を決定する。特に、リフレッシュ領域の幅は、グローバルモーション推定値の大きさ、ピクチャレート、ピクチャの解像度等の関数としてのピクセル数に関して計算される。ピクチャエッジ及びリフレッシュ領域の幅が決定されると、モード制御モジュール312は、これらのパラメータを、リフレッシュ領域構成信号346を介してエンコーダ314に通知する。
ブロック418において、エンコーダ314は、リフレッシュ領域構成パラメータを用いてピクチャをイントラリフレッシュ符号化して、結果として得られる符号化ストリームを表すビットストリーム部を生成し、このビットストリーム部を、HMD装置304に送信される符号化ビットストリーム342に組み込む。この符号化処理において、エンコーダ314は、識別されたピクチャエッジ及び識別されたリフレッシュ領域の幅を使用して、識別されたピクチャエッジに隣接する領域であって、示されたリフレッシュ領域に対応する幅を有する領域をイントラ符号化する。ピクチャの残りの部分は、上述したように、ダーティ領域又はクリーン領域の一方又は両方として符号化される。
方法400は、イントラリフレッシュモードが各ピクチャ間で切り替えられる1つの実施形態を示しているが、他の実施形態では、モード間の切り替えは、イントラリフレッシュセットの完了にリンクされる。すなわち、モード間の切り替えは、1つのイントラリフレッシュセット/サイクルの完了と、次のイントラリフレッシュセット/サイクルの開始と、の間にのみ生じるように制限することができ、これにより、イントラリフレッシュセット用に選択されたモードは、当該セット内の各ピクチャに適用される。
いくつかの実施形態では、上述した技術の特定の態様は、ソフトウェアを実行する処理システムの1つ以上の処理装置によって実施される。ソフトウェアは、格納されるか、または非一時的なコンピュータ可読記憶媒体に記憶され、又は、当該記憶媒体上で有形に実施される実行可能命令の1つ以上のセット含む。ソフトウェアは、1つ以上の処理装置によって実行されると、1つ以上のプロセッサを操作して、上述した技術の1つ以上の態様を実行させるための命令又は特定のデータを含むことができる。非一時的なコンピュータ可読記憶媒体には、例えば、磁気若しくは光学ディスク記憶装置、フラッシュメモリ等のソリッドステート記憶装置、キャッシュ、ランダムアクセスメモリ(RAM)、又は、他の不揮発性メモリ装置等が含まれる。実行可能命令は、非一時的なコンピュータ可読記憶媒体に、ソースコード、アセンブリ言語コード、オブジェクトコード、又は、1つ以上のプロセッサによって解釈されるか他の方法で実行可能な他の命令フォーマットで記憶されている。
概要において上述した活動又は要素の全てが必要なわけではなく、特定の活動又は装置の一部を不要としてもよいこと、1つ以上のさらなる活動を実行することができること、又は、上述したものに加えて他の要素を含んでもよいことに留意されたい。さらに、活動が列挙されている順序は、必ずしもこれらが実行される順序ではない。また、これらの概念は、特定の実施形態を参照して説明されている。しかし、当業者であれば、以下の特許請求の範囲に記載された本発明の範囲から逸脱することなく、様々な修正及び変更を行うことができるのを理解するであろう。したがって、明細書及び図面は、限定的な意味ではなく例示的な意味で考慮されるべきであり、このような変更の全ては、本発明の範囲内に含まれることが意図される。
利益、他の利点、及び、問題の解決手段について、特定の実施形態に関して上述されている。しかし、利益、利点又は解決手段を発生させるか、より顕著になる可能性のある機能は、何れか又は全ての請求項の重要な、必須の、不可欠な特徴と解釈されるべきではない。さらに、開示された発明は、本明細書の教示の利益を有する当業者には明らかであるが、異なる方法であるが同等の方法で修正及び実行することができるため、上記に開示された特定の実施形態は例示に過ぎない。以下の特許請求の範囲に記載されるもの以外の、本明細書に示された構造又は設計の詳細に制限はない。したがって、上述した特定の実施形態について変更又は修正を加えることが可能であり、このような変形例の全てが、開示された発明の範囲内にあると考えられることは明白である。したがって、本明細書にて求められる保護は、以下の特許請求の範囲に記載されている。

Claims (6)

  1. ビデオ符号化システムにおいて、
    ピクチャの第1セットに関連するグローバルモーション推定値が特定の閾値を超えないと決定したことに応じて、前記ピクチャのリフレッシュ領域の位置が前記ピクチャの第1セット内の前のピクチャのリフレッシュ領域の位置に対して空間的にシフトするように、前記第1セット内の各ピクチャをイントラリフレッシュ符号化することと、
    ピクチャの第2セットに関連するグローバルモーション推定値が前記特定の閾値を超えていると決定したことに応じて、前記第2セット内の各ピクチャのリフレッシュ領域の位置が、前記第2セットに関連するグローバルモーション推定値の方向にあるピクチャエッジに隣接して固定されるように、前記第2セット内の各ピクチャをイントラリフレッシュ符号化することと、を含む、
    方法。
  2. 前記ピクチャの第1セットのリフレッシュ領域が同じ幅を有し、
    前記ピクチャの第2セットに関連する前記グローバルモーション推定値が複数のグローバルモーション推定値を含み、各グローバルモーション推定値は、前記第2セットの対応するピクチャに関連しており、
    前記第2セットのピクチャのリフレッシュ領域は、そのピクチャに関連する前記グローバルモーション推定値に基づいている、
    請求項1の方法。
  3. 前記第1セット及び前記第2セットのピクチャのイントラリフレッシュ符号化された表現を含む符号化ビットストリームを、ヘッドマウントディスプレイ(HMD)装置(304)に送信すること、をさらに含む、
    請求項1の方法。
  4. 前記HMD装置において、レンダリングされたピクチャのセットを生成するために、前記符号化ビットストリームを復号化することと、
    前記HMD装置のディスプレイパネルにおいて、前記レンダリングされたピクチャのセットを表示することと、をさらに含む、
    請求項3の方法。
  5. 第1時間での前記HMD装置のモーションに基づいて、前記ピクチャの第1セットに関連する前記グローバルモーション推定値を決定することと、
    第2時間での前記HMD装置のモーションに基づいて、前記ピクチャの第2セットに関連する前記グローバルモーション推定値を決定することと、をさらに含む、
    請求項4の方法。
  6. 前記第1セットのピクチャのコンテンツのモーション分析に基づいて、前記第1セットに関連する前記グローバルモーション推定値を決定することと、
    前記第2セットのピクチャのコンテンツのモーション分析に基づいて、前記第2セットに関連する前記グローバルモーション推定値を決定することと、をさらに含む、
    請求項1の方法。
JP2021065873A 2016-04-29 2021-04-08 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ Active JP6908797B1 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662329602P 2016-04-29 2016-04-29
US62/329,602 2016-04-29
US15/188,067 2016-06-21
US15/188,067 US10652572B2 (en) 2016-04-29 2016-06-21 Motion-adaptive intra-refresh for high-efficiency, low-delay video coding
JP2018555753A JP6867406B2 (ja) 2016-04-29 2017-04-28 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018555753A Division JP6867406B2 (ja) 2016-04-29 2017-04-28 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ

Publications (2)

Publication Number Publication Date
JP6908797B1 true JP6908797B1 (ja) 2021-07-28
JP2021108483A JP2021108483A (ja) 2021-07-29

Family

ID=60158697

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018555753A Active JP6867406B2 (ja) 2016-04-29 2017-04-28 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ
JP2021065873A Active JP6908797B1 (ja) 2016-04-29 2021-04-08 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018555753A Active JP6867406B2 (ja) 2016-04-29 2017-04-28 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ

Country Status (6)

Country Link
US (1) US10652572B2 (ja)
EP (1) EP3449632A4 (ja)
JP (2) JP6867406B2 (ja)
KR (1) KR102239856B1 (ja)
CN (1) CN109076227A (ja)
WO (1) WO2017185187A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106488229B (zh) * 2015-09-01 2022-01-21 恩智浦美国有限公司 具有可调整帧内刷新率的视频编码器
CN109496431A (zh) * 2016-10-13 2019-03-19 富士通株式会社 图像编码/解码方法、装置以及图像处理设备
US20190156792A1 (en) * 2017-01-10 2019-05-23 Shenzhen Royole Technologies Co., Ltd. Method and system for adjusting display content and head-mounted display
GB2569107B (en) * 2017-11-29 2022-04-06 Displaylink Uk Ltd Managing display data
EP3522539A1 (en) * 2018-02-01 2019-08-07 Vrije Universiteit Brussel Method and apparatus for compensating motion for a holographic video stream
EP3657799B1 (en) * 2018-11-22 2020-11-04 Axis AB Method for intra refresh encoding of a plurality of image frames
WO2020188149A1 (en) * 2019-03-21 2020-09-24 Nokia Technologies Oy A method, an apparatus and a computer program product for video encoding and video decoding
US11039149B2 (en) * 2019-08-01 2021-06-15 Qualcomm Incorporated Dynamic video insertion based on feedback information
EP3829169B1 (en) * 2019-11-29 2021-10-13 Axis AB Method for intra refresh encoding of a plurality of image frames using convex and concave distribution functions
CN114630122B (zh) 2021-03-19 2023-04-28 杭州海康威视数字技术股份有限公司 基于自适应帧内刷新机制的解码、编码方法及相关设备
CN112911294B (zh) * 2021-03-22 2024-10-15 杭州灵伴科技有限公司 一种使用imu数据的视频编码、解码方法,xr设备和计算机存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11289542A (ja) * 1998-02-09 1999-10-19 Matsushita Electric Ind Co Ltd 画像符号化装置、画像符号化方法、および画像符号化プログラムを記録した記録媒体
EP0935396A3 (en) 1998-02-09 2004-08-11 Matsushita Electric Industrial Co., Ltd. Video coding method and apparatus
DE102005029127A1 (de) * 2005-06-23 2007-04-19 On Demand Microelectronics Ag Verfahren und Vorrichtung zur optimierten prädiktiven Videocodierung
JP4851911B2 (ja) * 2006-10-23 2012-01-11 富士通株式会社 符号化装置、符号化プログラムおよび符号化方法
CN101621685B (zh) * 2008-07-04 2011-06-15 株式会社日立制作所 编码装置和编码方法
US9897805B2 (en) * 2013-06-07 2018-02-20 Sony Interactive Entertainment Inc. Image rendering responsive to user actions in head mounted display
US9930360B2 (en) * 2011-11-08 2018-03-27 Texas Instruments Incorporated Method, system and apparatus for intra-refresh in video signal processing
JP2013165340A (ja) * 2012-02-09 2013-08-22 Sony Corp 画像処理装置と画像処理方法
US9100636B2 (en) * 2012-09-07 2015-08-04 Intel Corporation Motion and quality adaptive rolling intra refresh
US20140294072A1 (en) * 2013-03-27 2014-10-02 Magnum Semiconductor, Inc. Apparatuses and methods for staggered-field intra-refresh
JP2015106747A (ja) 2013-11-28 2015-06-08 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US9529200B2 (en) 2014-03-10 2016-12-27 Ion Virtual Technology Corporation Method and system for reducing motion blur when experiencing virtual or augmented reality environments

Also Published As

Publication number Publication date
EP3449632A4 (en) 2019-12-11
KR102239856B1 (ko) 2021-04-13
US20170318308A1 (en) 2017-11-02
US10652572B2 (en) 2020-05-12
JP6867406B2 (ja) 2021-04-28
KR20190003548A (ko) 2019-01-09
WO2017185187A1 (en) 2017-11-02
JP2019519964A (ja) 2019-07-11
CN109076227A (zh) 2018-12-21
JP2021108483A (ja) 2021-07-29
EP3449632A1 (en) 2019-03-06

Similar Documents

Publication Publication Date Title
JP6908797B1 (ja) 高効率、低遅延ビデオコーディングのためのモーション適応型イントラリフレッシュ
JP6410918B2 (ja) パノラマ映像コンテンツの再生に使用するシステム及び方法
EP2857957B1 (en) Master device, client device, and screen mirroring method thereof
US10748250B2 (en) Method and apparatus for managing immersive data
US8542734B2 (en) Multi-view video encoding apparatus and method
US20160291917A1 (en) Screen splicing system and video data stream processing method
KR20140021952A (ko) 멀티뷰 비디오 시퀀스 코딩을 위한 적응형 프레임 예측 방법
JP2017505021A (ja) 画像処理方法及び装置
JP2023139221A (ja) ビデオ処理方法、ビデオ処理装置および符号ストリーム生成方法
US10116943B2 (en) Adaptive video compression for latency control
JP2018522430A (ja) ユーザヘッドセットへの球状ビデオ帯域幅を減少させる方法および装置
JP2006148409A (ja) フレームレート変換方法
JP7138653B2 (ja) ビデオからの画像生成
US20190014326A1 (en) Imu enhanced reference list management and encoding
JP2006014242A (ja) 双方向画像通信装置、その処理方法及びクライアント装置並びにプログラム
US8331704B2 (en) Coding method and coding apparatus
JP6497874B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2009111762A (ja) 画像符号化装置及び画像復号装置
JP2022046467A (ja) 画像復号装置、画像復号方法、及び画像復号プログラム
JP6610115B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
EP4281728A1 (en) Updating a map for use in localising a mobile device
US20130329009A1 (en) Image encoding apparatus
JP2006203556A (ja) 動きベクトル検出装置、動き補償装置、動きベクトル検出方法、及びコンピュータプログラム
KR101521890B1 (ko) 다시점 비디오 스트리밍 시스템 및 그 제공방법
JP6490945B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210409

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210701

R150 Certificate of patent or registration of utility model

Ref document number: 6908797

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150