JP6026443B2 - ビデオ・ビットストリーム中の描画方向情報 - Google Patents

ビデオ・ビットストリーム中の描画方向情報 Download PDF

Info

Publication number
JP6026443B2
JP6026443B2 JP2013557715A JP2013557715A JP6026443B2 JP 6026443 B2 JP6026443 B2 JP 6026443B2 JP 2013557715 A JP2013557715 A JP 2013557715A JP 2013557715 A JP2013557715 A JP 2013557715A JP 6026443 B2 JP6026443 B2 JP 6026443B2
Authority
JP
Japan
Prior art keywords
direction information
information
image
bitstream
persistence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013557715A
Other languages
English (en)
Other versions
JP2014511647A (ja
Inventor
ジル・ボイス
スティーブン・チッポリ
ジョナサン・レノックス
シュテファン・ヴェンガー
ダニー・ホン
Original Assignee
ヴィディオ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴィディオ・インコーポレーテッド filed Critical ヴィディオ・インコーポレーテッド
Publication of JP2014511647A publication Critical patent/JP2014511647A/ja
Application granted granted Critical
Publication of JP6026443B2 publication Critical patent/JP6026443B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願の記載
本出願は、発明の名称を「ビデオ・ビットストリームにおける描画方向情報」とした、2011年3月10日出願の米国仮特許出願番号61/451,303の優先権を主張し、その開示内容は引用により全体として本明細書に取り込む。
本願は、ビデオ符号化に関し、より具体的には、ビデオ・ビットストリーム内部の再構築されたビデオ・ビットストリームの空間的方向に関する情報の表現に関する。
特定のビデオ符号化標準は、ビデオ会議およびデジタルTV環境のコンテキストで考案されたものであり、キャプチャされたまたは再構築されたビデオ信号の空間解像度および方向は、キャプチャ/エンコーダおよびデコーダ/ディスプレイの場所で同一である可能性がある。例えば、TV信号は、風景フォーマットで4:3または16:9のアスペクト比でキャプチャすることができ、やはり風景フォーマットで描画される(しかし、受信側のTVではアスペクト比をユーザの嗜好に基づいて調整してもよい)。偶然にも、ITU−TのRec.H.261、H.262、H.263、H.264(これらは全て、Place de Nations、CH−1211 Geneva 20、SwitzerlandにあるITU(International Telecommunication Union)、または、www.itu.intで入手可能)、ならびに、MPEG−1ビジュアル(正式にはISO/IEC11172−2として知られている)、およびMPEG−4ビジュアル(正式にはISO/IEC14496−2として知られている)(1、ch.de la Voie−Creuse、Case postale 56、CH−1211 Geneva 20、SwitzerlandにあるISO(International Organization for Standardization)または、www.iso.orgで入手可能)(これらは全て、引用により全体として本明細書に取り込む)を含む、特定のビデオ圧縮標準には、キャプチャされたビデオ信号の空間的方向に関する情報が含まれていない。
コンピュータ・ベースのデコーダ/描画装置に接続されたスクリーンの利用により、それらがPC(Personal コンピュータ)、セット・トップ・ボックス、携帯電話およびタブレット・コンピュータのようなモバイル装置、または他の任意の同様な装置であろうと、ビデオ・イメージを当該装置の固有の方向でない方向に、例えば当該イメージをスクリーンの「ウィンドウ」に置くことにより描画することができる。上述の装置の一部では、本質的にそれらがハンドヘルドであるという形態的な要因のため、または技術的手段(スイベル・モニタ)により、2方向以上での視聴が可能である。オペレーティング・システムおよびGUIでは、再構築されたビデオ信号の「固有の」方向には無関心かもしれない。
上述したことは、概念的には、キャプチャ側にも同様に当てはまる。今日、TVおよびビデオ会議の視覚信号は風景モードでキャプチャすることができるが(大部分がそうである)、カメラをそのキャプチャ軸回りに回転し、それにより別の方向でキャプチャすることを行わない技術的な理由はない。それを行うには、自然な視聴体験を可能とするために描画装置が再構築画像を回転する必要がありうる。
ビデオ・ビットストリームにおいて、(再構築後に)描画すべきビデオ・ビットストリームの方向の指示を可能とする機構がなければ、描画装置は描画方向に関して十分な情報を得たうえでの決定を行うことができず、これが悪いユーザ体験につながりうる。
さらに、制作中にカメラを回転させるのは、映画プロデューサの芸術表現に関する選択肢である。忠実な視聴体験のためには、ビデオ内容がシーケンス中に変化しうるので当該回転をビデオ内容と同期する必要がある。これにより、所望の機能を提供できない、拡張JFIF標準(1、ch.de la Voie−Creuse、Case postale 56、CH−1211 Geneva 20、SwitzerlandにあるISO(International Organization for Standardization)または、www.iso.orgで入手可能であり引用により本明細書に取り込まれる、ISO/IEC10918−5ドラフト)で知られるもののような、ファイル・フォーマット・ベースの方向情報が生成される。カメラ方向をビデオ内容と有意義に同期するためには、方向情報がビデオ・ビットストリームにおいて利用可能である必要がある。
したがって、ビデオ・ビットストリームにおいて、再構築すべきビットストリームの方向の信号送信を可能とする機構を設けることが望ましい。
開示した発明特定事項では、ビデオ・ビットストリーム内部において、再構築後のビットストリームから生ずるビデオ信号の方向を示す副次的情報を提供する。
1態様では、ビデオ・ビットストリーム内の1ビットにより、「人物」モードおよび「風景」モードの何れかを示す。
同一または別の態様では、ビデオ・ビットストリーム内の2ビットにより、風景モードからの0/90/180/270度の偏差を示す。同一または別の態様では、ビデオ・ビットストリーム内の2ビットにより、人物モードからの0/90/180/270度の偏差を示す。
同一または別の態様では、ビデオ・ビットストリーム内の2ビットにより、最後の既知のカメラ位置からの0/90/180/270度の偏差を示す。
同一または別の態様では、ビデオ・ビットストリーム内の2ビットにより、重力軸からの0/90/180/270度の偏差を示す。図7A、7B、7C、7Dは、重力軸(701)に関して0、90、180、および270度の位置にあるカメラを示す。図7Bでは、重力軸(701)はまた、カメラの自然な方向である。
同一または別の態様では、適切なエントロピ符号化の枠組みに従って符号化されビットストリーム内に配置された整数または浮動小数点により、風景、人物からの方向変化の程度、最後の既知のカメラ位置からの方向変化の程度、または重力軸からの方向変化の程度を示す。
同一または別の態様では、ビデオ・ビットストリーム内の2ビット(または、適切なエントロピ符号化の枠組みに従って符号化されビットストリームに配置された整数または浮動小数点)により、カメラの自然な方向または不特定の方向からの0/90/180/270度(または、整数もしくは浮動小数点により示される別の角度)の偏差を示す。
同一または別の態様では、1ビットで左右反転を示す。
同一または別の態様では、1ビットで上下反転を示す。
同一または別の態様では、持続性情報が、整数値または浮動小数点値として符号化され、時間、フレーム間隔、または画像順序カウント間隔(picture order count interval)のうち何れか1つで測定した回転情報の持続性を示す。
同一または別の態様では、上述のビットまたはエントロピ符号化された数値の何れかが、ビデオ・ビットストリーム内の補助強化情報メッセージで符号化される。
同一または別の態様では、上述のビットまたはエントロピ符号化された数値の何れかが、パラメータ集合の視覚的使用性情報(VUI)部分で符号化される。当該パラメータ集合を、ビデオ・ビットストリーム内に配置することができ、または、帯域外で運搬することができる。
開示した発明特定事項のさらなる特徴、性質、および様々な利点は、下記の発明を実施するための形態および添付図面からより明らかになる。
本発明の1実施形態に従うシステムの概略図である。 キャプチャされ描画されたシーンの概略図である。 本発明の1実施形態に従うビデオ・ビットストリームの概略図である。 本発明の1実施形態に従う方向情報の例示的な表現の概略図である。 本発明の1実施形態に従う人物モードおよび風景モードで符号化されたキャプチャされたシーンの概略図である。 本発明の諸実施形態に従うコンピュータ・システムの概略図である。 重力軸に関して配向されたカメラの概略図である。
図面は、本開示に取り込まれ、その一部を構成する。図面全体にわたって、同一の参照番号および文字は、特に明記しない限り、図示した実施形態の同様な特徴、要素、構成要素または部分を示すために用いる。さらに、開示した発明特定事項を、図面を参照して詳細に説明するが、その説明は例示的な実施形態に関連して行う。
図1は、開示した発明特定事項の適用例として、ビデオ会議システムの関係する部分を示す。カメラ(101)はシーンをキャプチャする。当該カメラは、手動で、または、電動カメラ・ヘッド(103)により、そのキャプチャ軸(102)の回りに回転することができる(カメラ・ヘッドは、任意であるため、点線で示してある)。(図示したように)カメラ(101)内、カメラ・ヘッド(103)内、または別の適切な場所に配置したセンサ(104)を使用してカメラ(101)のキャプチャ方向を特定することができる。あるいは、カメラ回転のオープン・ループ(センサなし)制御が実装されるときは、カメラ・ヘッドが直接に方向を与えることもできる。例えば、操作者が手動でカメラを水平(風景)方向に設定し、カメラ・ヘッドがステッピング・モータを用いてカメラを回転することが可能である。ここで、各ステップは例えば1度の回転に相当する。モータに送信されたステッパ・パルスを計測することで、カメラ・ヘッドはセンサなしにカメラの方向を「知る」。カメラが固定位置にあることも同様に可能である。ここで、風景位置以外の任意の位置(画像の水平走査線に垂直な重力軸)で、開示された技術が利用されている。
上記カメラ(101)にはビデオエンコーダ(105)が接続されている。ビデオエンコーダ(105)は方向決定モジュール(106)を備えることができる。方向決定モジュール(106)はセンサ(104)、またはカメラ・ヘッド(103)もしくは他の任意の適切な装置からその入力(107)を受け取ることができ、または、方向決定モジュール(106)は、例えばシーンの水平線、シーン内の人の方向、落下物が示す重力の方向等を観察することにより、当該方向をビデオ内容から導くことができる。方向決定モジュールに方向符号化モジュール(108)を接続することができる。方向符号化モジュール(108)は、方向決定モジュール(106)により決定される方向をビデオ・ビットストリーム内の適切な位置にエンコードすることができる。これを行うために、方向符号化モジュール(108)はエンコーダ(104)内のビットストリーム生成(109)の残部と対話して、例えば、ビットストリーム内の方向指示ビットの正しい位置を決定することができる。方向情報を1つまたは複数のビットとして表現できる例については後述する。本明細書で説明した様々なモジュールは、ハードウェアおよびソフトウェアの任意の適切な組合せを含むことができる。
上記エンコーダ(105)の出力は、符号化されたビデオ・ビットストリーム(110)であり、当該ビデオ・ビットストリーム(110)は、一定の中間ステップ(例えば、ファイル・フォーマットへの組込み、パケット化、例えばネットワークを介しての配信、逆パケット化等)の後、デコーダ(111)に到達することができる。
上記デコーダ(111)において、方向デコード・モジュール(112)は方向情報を表現するビットをビットストリームから抽出することができる。方向デコード・モジュール外でのデコード・プロセスの残部は通常通りに処理され、結果は、一般に風景モードにおける一連のキャプチャされた解像度のイメージである。
上記方向デコード・モジュール(112)は、例えば方向情報エンコードの逆プロセスに従うことによって、ビットストリーム内の方向情報をデコードすることができる。結果の情報を、例えば、デコードされた画素の行列を必ずしも風景方向にはないウィンドウ内に正確に配置できる(場合によってはソフトウェア・ベースの)描画器(113)が利用できるようにすることができる。別の使用形態は、方向変換をGPU(Graphics Processing Unit)(114)により実施させることであり、これは、メインCPUの処理割当量の観点から有利であり、または、描画器がGPU可能な携帯電話で実行されているといった特定のシナリオでの電力節約の観点から有利でありうる。GPU(114)で方向情報を利用可能とする別の利点は、GPU(114)が、色空間変換またはリサイズのような作業を実施するために、符号化されたビデオ・ビットストリームの再構築画像の画素でとにかく動作しなければならないかもしれないことである。このケースでは、GPU(114)は、幾つかの実装形態において、どのような大量のサイクルまたはメモリ・アクセスをも発生させることなく方向を変更することができ、これにより、バッテリの寿命やCPUサイクルの節約が支援される。さらに別の利用形態には、カメラ・ヘッド(102)と同様に、(スイベル・スクリーンとしても知られる)物理的に回転可能なスクリーン上で描画することがある。さらに別の形態を、ここでより詳細に検討する。描画装置(116)はタブレットPCまたは携帯電話であってもよく、これらは、重力軸(118)に対するスクリーン(115)の位置を決定するための内部センサ(117)を有することができる。どのようにユーザが自分の装置を保持するかに応じて、装置(116)のスクリーン(115)は、例えば風景モードまたは人物モードにある。図示した装置(116)は人物モードでのスクリーン(115)を示し、これは、図示した例示的な装置に対しては「自然な」方向である。下記で説明するように、描画装置の内部センサ(117)と方向情報が、ビデオ・ビットストリーム(110)内で利用可能であり方向デコーダ(112)によりデコードされ、カメラ(101)または描画装置(116)の方向に関わらずユーザが常に(方向の視点から)視覚的に好ましい再構築画像を受け取ることを保証することができる。
図2は、人物モードおよび風景モードのみに着目した、キャプチャ方向および描画方向の4つの異なる構成を示す。
第1のシーンでは、カメラ(201)は風景モードでキャプチャし、表示方向(202)も風景モードである。カメラ(201)およびディスプレイ(202)の方向は同一であり、画像を、開示した技術を使用してまたは使用せずに適切に描画することができる。
第2のシーンでは、カメラ(203)は人物モードでキャプチャするために時計回りに90度回転している。提示した開示した発明特定事項を使用しないと、(利用可能な最大画面サイズに拡大した後の)描画結果はディスプレイ(204)に示すように見えるはずである。具体的には、画像は90度回転したように見え、人が利用するには有用でない。
シーン3では、カメラ(205)は再び90度回転しているが、開示した発明特定事項に従う方向情報はビットストリーム内に提示されている。ビットストリームデコーダは、キャプチャ方向が回転していることを知らなくともよい。しかし、既に説明したように、方向デコーダは、ビットストリームを描画すべき方向を当該ビットストリームから決定している。方向デコーダは描画情報を描画器に転送することができる。描画器はこの情報を使用して、再構築イメージを回転し(かつ、必要に応じて拡大し)、再構築イメージを視聴者に対して好ましいようにディスプレイ(206)上に提示してもよい。
シーン4では、カメラ(207)およびスクリーン(208)の両方が90度回転している。開示した発明特定事項がなく、描画装置が方向センサを有さないときは、再構築画像は正しく描画されるはずである。しかし、ますます、ハンドヘルド装置は方向センサを備えており、ユーザ・インタフェースは再構築されたビデオを含みうるスクリーン内容を回転し、その結果、上のディスプレイ(206)で示したものと同様に、視覚的に好ましくない回転イメージが描画されることとなる。しかし、方向情報がビットストリーム内で利用可能であるときは、方向デコーダはこの情報をデコードし描画器に転送することができ、描画器は画像を視覚的に好ましい方向に表示することができる(208)。
直接再構築画像を「真っ直ぐに」描画することにより視覚的に好ましい結果を実現することは、視聴者の視点からは、開示した発明特定事項の1つの応用例にすぎない。次に、別の例示的な使用を説明する。一部のビデオ内容に対しては、画像をもとの方向とは異なる方向で(例えば、風景モードではなく人物モードで)符号化することが符号化効率に関して有利でありうることが分かっている。正方形でない画像に対しては、この方向の変更により画像のサイズが変化する。これは、多くの最近のビデオ符号化標準がサポートできるものである。図5を参照すると、4:3の風景フォーマット(501)でのシーンが示されている。エンコーダは、マクロブロック(502)に対する通常のラスタ走査順を用いて、このシーンを(方向変換のない)キャプチャされたものとして処理することができる。各正方形は大きさが4x3であるマクロブロックの画像のうちの1つのマクロブロックを示し、図示した整数値は走査順を表す。しかし、1実施形態によれば、エンコーダは処理前にイメージを、ここでは例えば時計回りに90度だけ、回転することができる。本例では、画像の大きさは3x4のマクロブロックに変化している。この人物イメージおよび風景イメージの両方を、通常の符号化手段および示したマクロブロックの走査順を用いて、符号化することができる。マクロブロック間予測(cross−macroblock prediction)の特性は方向を変更すると変化する可能性があり、結果の回転画像を符号化するのに必要なビット数も変化する可能性がある。エンコーダは、例えば、2つ、3つ、またはそれより多くの様々な回転(例えば、0、90、180、および270度の回転)をテストして、最小数のビットを利用する符号化イメージを選択することができる。これらのビットおよび回転情報により、デコーダはイメージを適切な方向に再構築することができる。これは、視覚的体験に対して重要であるだけでなく、画像間予測を使用するときに参照するための再構築画像を使用するのにも重要である。
図3を参照し、引用により本明細書に取り込まれるITU−T Rec.H.264を用いると、例えば、方向情報(301)を(標準的な構文および意味を適切に修正した後)ビットストリームの様々な部分に配置することができる。1つの位置は、視覚的使用性情報(VUI)データ構造(302)であることができ、これは、シーケンス・パラメータ集合(SPS)(303)のオプションの部分である。視覚的使用性情報は、現在標準化されており、描画器が再構築イメージを適切に描画するのを支援する画素アスペクト比または色空間情報のようなフィールドを含む。方向情報はこのカテゴリに適合する。パラメータ集合に方向情報を含めることには、情報が紛失し易くないという利点がある。情報の紛失は、SEIメッセージには容易に起こりうることである(下記を参照)。
H.264ビットストリームの別の適切な部分は、標準化されたまたはベンダ固有の補助強化情報(SEI)メッセージ(305)に存在するはずである。SEIメッセージを、ビデオ・シーケンス内部において、スライス(304)または画像境界に配置することができる。SEIメッセージを利用することには、(H.264で定義される)ビデオ・シーケンス内部で、または、シーケンス・パラメータ集合を変更することなく単一のシーケンスを超えて、様々な方向情報を信号送信できるという利点がある。これは、カメラの方向がシーケンスの中で変化する可能性があり方向情報をビデオのビットと同期して送信すべきときに、望ましい。しかし、SEIメッセージが確実に運搬されるとは想定されず、その結果、方向情報が紛失する可能性があり、上述したようにビデオ内容が視覚的に好ましくないように描画する結果となりうる。
前述の選択肢は、相互に排他的なものではなく、幾つかのシナリオでは、SEIメッセージがパラメータ集合に存在する情報を上書きすることにより、双方を同時に使用するための合理的な設計上の選択事項でありうる。
ビデオ符号化のビットストリームのフォーマットに応じて、GOPまたは画像ヘッダ、スライスヘッダ、画像パラメータ集合等のような、ビットストリーム内の他の場所も同様に適切でありうる。H.264標準(およびそれに類するもの)ベースの実装に対しては、符号化の効率をサポートするのに適した方向情報の位置は、例えば画像パラメータ集合のような、デコード・プロセスに必要なビットストリームの部分でありうる。このケースでは、SEIメッセージまたはVUIの使用は得策ではない。なぜならば、デコードの後に参照画像を生成するためには、デコーダが画像ごとに、方向を変更する必要があるかどうかを知る必要があるからである。
図4を参照すると、方向情報をビットストリームにおいて様々なフォーマットで表現することができる。そのうち幾つかを以下で説明する。当該フォーマットは、とりわけ、その方向を示す粒度と、方向をビットストリームで符号化するのに必要な結果のビット数とにおいて、相違する。
1つのフォーマットを、「風景」モードまたは「人物」モード(402)を示す単一のビット(401)で符号化することができる。風景に対するTV信号の従来の優先度が与えられると、「人物」は時計回り90度のカメラ回転を示すことができる。上の図2と関連して上述した利用シナリオに対しては、この情報は述べた機能を提供するのに既に十分である。
別のフォーマットは2ビット(403)から成り、例えば反時計回りに0、90、180、270度(404)の回転を示す。この情報を、重力軸に対して、過去に受け取った方向情報に対して、または別のコンテキストで、推論することができる。この情報を、標準化する(したがって、方向情報がビットストリーム内に見つかるとき暗黙的に仮定される)か、または、明示的に信号送信することができる。例えば、ビット(405)は、(0に設定されるとき)「重力軸に対して絶対的」または(1に設定されるとき)「以前の方向に対して相対的」と示すことができる。漸進的な情報符号化は、方向の動的な変化が期待されるときに最も適切であり、方向情報はSEIメッセージで符号化される。
より細かい粒度の回転角度も可能である。例えば、9ビットの整数(407)を使用して、(9ビットの数字が提供する512個の値空間のうち360個の値を用いて)0度から359度の間の回転を1度の粒度で示すことができる。
同様に、浮動小数点を使用することができる。
幾つかの応用例では、鏡面イメージを正確に描画するために、画像の左右または上下への反転を信号送信することが得策でありうる。
上述した回転の表現の全ては、幾つかの環境では、回転情報の持続性、および/または、デコーダが回転情報のリフレッシュまたは更新を受け取ることを期待できる周波数を示す情報から利益を享受することができる。これは、SEIメッセージのNALユニット・ヘッダ内のnal_ref_idcフィールドが示すように、SEIメッセージの転送優先度が破棄可能なNALユニットであることを示す0である必要があるためSEIメッセージが紛失する可能性が高いことを考慮すれば、特に有用でありうる。例えば持続性情報で指定される間隔のタイムアウトを通じて回転情報を含むSEIメッセージが紛失した可能性を認識するに至ったデコーダは、例えば回転が変化しなかったと仮定することによって、過去の回転変化の統計的頻度分析に基づいて適切に対応することができる。持続性情報を任意の適切なエントロピ符号化フォーマット(即ち、整数、浮動小数点、CABAC符号化した整数)で表現することができ、例えば時間(ミリ秒)、フレーム間隔、または画像順序カウント間隔で測定することができる。
上述の情報の全てを、直接ビットストリームに配置することができ、または、使用中のビデオ圧縮技術のエントロピ符号化枠組みを用いてエントロピ符号化することができる。例えば、H.264のコンテキストでは、値を二値符号化するか、または、CA−VLC、またはCABACのエントロピ符号化機構に従って暗号化することができる。
開示した発明特定事項によれば、本明細書に記載の回転情報符号化技術をハードウェアおよびソフトウェアの任意の適切な組合せを用いて実装できること理解される。前述の速度推定および制御技術を実装し操作するためのソフトウェア(即ち、命令)をコンピュータ読取可能媒体で提供することができる。当該コンピュータ読取可能媒体は、限定ではなく、ファームウェア、メモリ、記憶装置、マイクロコントローラ、マイクロプロセッサ、集積回路、ASIC、オンラインでダウンロード可能な媒体、および他の利用可能な媒体を含むことができる。
コンピュータ・システム
上述のビデオ符号化の方法を、コンピュータ読取可能命令を用いてコンピュータ・ソフトウェアとして実装することができ、コンピュータ読取可能媒体に物理的に格納することができる。コンピュータ・ソフトウェアを任意の適切なコンピュータ言語を用いてエンコードすることができる。ソフトウェア命令を様々な種類のコンピュータで実行することができる。例えば、図6は、本開示の諸実施形態を実装するのに適したコンピュータ・システム600を示す。
図6に示すコンピュータ・システム600の構成要素は本質的に例示的なものであって、本開示の諸実施形態を実装するコンピュータ・ソフトウェアの使用範囲または機能範囲に関して何ら限定を示唆しようとするものではない。また、諸構成要素の構成が、コンピュータ・システムの例示的な実施形態で示した構成要素のどの1つまたは組合せに関してどのような依存性または要件も有するとは解釈すべきでない。コンピュータ・システム600は、多くの物理的な形態を有することができる。当該形態には、集積回路、プリント基板、(携帯電話またはPDAのような)小型ハンドヘルド装置、パーソナル・コンピュータ、またはスーパー・コンピュータが含まれる。
上記コンピュータ・システム600は、ディスプレイ632、1つまたは複数の入力装置633(例えば、キーパッド、キーボード、マウス、スタイラス・ペン等)、1つまたは複数の出力装置634(例えば、スピーカ)、1つまたは複数の記憶装置635、様々な種類の記憶媒体636を備える。
システム・バス640は多種多様なサブシステムを接続する。当業者が理解するように、「バス」とは共通の機能を果たす複数のデジタル信号線をいう。システム・バス640は数種のバス構造のうち任意のものであることができる。当該バス構造には、メモリ・バス、周辺バス、および様々なバス・アーキテクチャを用いたローカル・バスが含まれる。限定ではなく例として、かかるアーキテクチャには、ISA(Industry Standard Architecture)バス、拡張ISA(EISA)バス、MCA(Micro Channel Architecture)バス、VLB(Video Electronics Standards Association local)バス、PCI(Peripheral Component Interconnect)バス、PCI−X(PCI−Express)バス、およびAGP(Accelerated Graphics Port)バスが含まれる。
プロセッサ(複数可)601(中央演算装置またはCPUとも呼ばれる)は、場合によっては、命令、データ、またはコンピュータ・アドレスを一時的に局所的に記憶するためのキャッシュ・メモリ・ユニット602を含む。プロセッサ(複数可)601は、メモリ603を含む記憶装置に接続される。メモリ603は、RAM(random access memory)604およびROM(read−only memory)605を含む。当業界で公知なように、ROM605はデータおよび命令を単方向でプロセッサ(複数可)601に転送するように動作し、RAM604は一般にデータおよび命令を双方向に転送するように使用される。これらの種類のメモリは両方とも、後述するコンピュータ読取可能媒体のうち任意の適切なものを含むことができる。
固定記憶部608はまた、場合によっては記憶制御ユニット607を介して、プロセッサ(複数可)601に双方向的に接続される。固定記憶部608は追加のデータ記憶容量を提供し、後述するコンピュータ読取可能媒体のうち何れかを備えることもできる。記憶部608を使用してオペレーティング・システム609、EXEC610、アプリケーション・プログラム612、データ611等を格納することができる。記憶部608は、一般には、主記憶より低速な(ハード・ディスクのような)二次記憶媒体である。記憶部608内部に保持された情報は、適切な場合は、メモリ603内の仮想メモリとして標準的な形で取り込むことができることは理解されよう。
上記プロセッサ(複数可)601はまた、グラフィック制御621、ビデオ・インタフェース622、入力インタフェース623、出力インタフェース624、記憶インタフェース625のような様々なインタフェースに接続され、これらのインタフェースは適切な装置に接続される。一般に、入出力装置は、ビデオ・ディスプレイ、トラック・ボール、マウス、キーボード、マイクロフォン、タッチ・センシティブ・ディスプレイ、トランスデューサ・カード・リーダ(transducer card reader)、磁気テープ・リーダもしくは紙テープ・リーダ、タブレット、スタイラス・ペン、音声認識器もしくは手書き認識器、生体認証装置、または他のコンピュータのうち何れかであることができる。ネットワーク・インタフェース620を用いて、プロセッサ(複数可)601を別のコンピュータまたは通信ネットワーク630に接続することができる。かかるネットワーク・インタフェース620により、CPU610が、上述の方法を実施する過程で情報をネットワーク630から受け取り、または、情報を当該ネットワークに出力できることが考慮されている。さらに、本開示の方法の実施形態を、CPU601で単独で実施することができ、または、インターネットのようなネットワーク630を介して、処理の一部を共有するリモートCPU601と協働して実行することができる。
様々な実施形態によれば、ネットワーク環境において、即ち、コンピュータ・システム600がネットワーク630に接続されているとき、コンピュータ・システム600は、やはりネットワーク630に接続されている他の装置と通信することができる。ネットワーク・インタフェース620を介して、通信をコンピュータ・システム600に対して送受信することができる。例えば、別の装置からの要求または応答のような、1つまたは複数のパケットの形で入ってくる通信を、ネットワーク・インタフェース620でネットワーク630から受信することができ、メモリ603内の選択されたセクションに格納して処理することができる。別の装置への要求または応答のような、1つまたは複数のパケットの形で出ていく通信も、メモリ603の選択されたセクションに格納することができ、ネットワーク・インタフェース620でネットワーク630に送出することができる。プロセッサ(複数可)601は、処理用にメモリ603に格納したこれらの通信パケットにアクセスすることができる。
さらに、本開示の諸実施形態は、様々なコンピュータ実行型の動作を実施するためのコンピュータ・コードを格納したコンピュータ読取可能媒体を有するコンピュータ記憶製品に関する。当該媒体およびコンピュータ・コードは、本開示の目的に特に設計され構築されたものであることができ、または、コンピュータ・ソフトウェア業界の当業者に公知であり利用可能であるものであることができる。コンピュータ読取可能媒体の例には、ハード・ディスク、フロッピ・ディスク、および磁気テープのような磁気媒体、CD−ROMおよびホログラフィック装置のような光媒体、光ディスクのような光磁気媒体、ASIC(application−specific integrated circuit)、PLD(programmable logic device)ならびにROMおよびRAM装置のような、プログラム・コードを格納し実行するように特に構成されたハードウェア装置が含まれるがこれらに限らない。コンピュータ・コードの例には、コンパイラが生成したもののような機械コード、インタプリタを用いてコンピュータにより実行される高レベルなコードを含むファイル、が含まれる。本明細書で開示した発明特定事項に関連して使用される「コンピュータ読取可能媒体」という用語は送信媒体、搬送波、または他の一時的信号を包含しないことは当業者には理解される。
限定ではなく例として、アーキテクチャ600を有するコンピュータ・システムは、プロセッサ(複数可)601がメモリ603のような1つまたは複数の有形のコンピュータ読取可能媒体で具体化されたソフトウェアを実行した結果としての機能を提供することができる。本開示の様々な実施形態を実装するソフトウェアをメモリ603に格納してプロセッサ(複数可)601により実行することができる。コンピュータ読取可能媒体は、具体的なニーズに従って、1つまたは複数のメモリ装置を含むことができる。メモリ603はソフトウェアを、大容量記憶装置(複数可)635のような1つまたは複数の他のコンピュータ読取可能媒体から、または、通信インタフェースを介して1つまたは複数の他のソースから、読み取ることができる。当該ソフトウェアにより、プロセッサ(複数可)601に本明細書に記載の特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。当該プロセスには、メモリ603に格納されたデータ構造を定義すること、当該ソフトウェアにより定義されたプロセスに従ってかかるデータ構造を修正することが含まれる。追加または代替として、コンピュータ・システムは、ロジックを回路においてハードワイヤードしまたはそうでなければ具体化した結果としての機能を提供することができる。当該ロジックは、ソフトウェアの代わりにまたはソフトウェアとともに、本明細書に記載の特定のプロセスまたは特定のプロセスの特定の部分を実行するように動作させることができる。必要に応じて、ソフトウェアへの言及がロジックを包含することができ、逆も成り立つ。必要に応じて、コンピュータ読取可能媒体への言及が、実行用のソフトウェアを格納する(IC(integrated circuit)のような)回路、実行用のロジックを具体化する回路、またはその両方を包含することができる。本開示は、ハードウェアおよびソフトウェアの任意の適切な組合せを包含する。
本開示では幾つかの例示的な実施形態を説明したが、変更、並び、および様々な代替的な均等物が存在し、これらは本開示の範囲内にある。したがって、本明細書では明示的には図示または説明しなかったが、本開示の原理を具体化し従って本開示の趣旨および範囲内にある多数のシステムおよび方法を当業者が考案できることは理解される。
101 カメラ
102 キャプチャ軸
103 カメラ・ヘッド
105 ビデオエンコーダ
116 描画装置

Claims (9)

  1. 少なくとも1つの入力画像の方向をエンコーダで決定するステップと、
    方向情報を符号化されたビデオのビットストリームに含まれる補助強化情報(SEI)メッセージでエンコードするステップと、
    を含み、
    前記方向情報は前記入力画像の全ての画素についての上下反転を示す単一のビットを含み、前記方向情報の持続性に関する持続性情報がフレーム数または画像順序カウント間隔のうち少なくとも1つを含む、
    ビデオエンコードの方法。
  2. 符号化されたビデオのビットストリームに含まれる補助強化情報(SEI)メッセージから方向情報を取り出すステップと、
    前記符号化されたビデオのビットストリームをデコードして、一連の画像を生成するステップと、
    を含み、
    前記方向情報は前記一連の画像のうち少なくとも1つの画像の全ての画素についての上下反転を示す単一のビットを含み、前記方向情報の持続性に関する持続性情報がフレーム数または画像順序カウント間隔のうち少なくとも1つを含む、
    ビデオデコードの方法。
  3. 前記方向情報を使用して少なくとも1つの再構築ビデオ画像を描画するステップをさらに含む、請求項2に記載の方法。
  4. 方向情報を決定するように構成された方向決定モジュールと、
    前記方向決定モジュールに接続され、前記方向決定モジュールにより決定された前記方向情報をエンコードするように構成された方向符号化モジュールと、
    前記方向符号化モジュールに接続され、方向情報を含む少なくとも1つの補助強化情報(SEI)メッセージを符号化されたビデオのビットストリームに含めるように構成されたビットストリーム生成モジュールと、
    を備え、
    前記方向情報は入力画像の全ての画素についての上下反転を示す単一のビットを含み、前記方向情報の持続性に関する持続性情報がフレーム数または画像順序カウント間隔のうち少なくとも1つを含む、
    ビデオエンコードのためのシステム。
  5. 前記方向決定モジュールは、方向を示す入力をハンドヘルド装置の一部であるセンサおよびカメラ・ヘッドのうち少なくとも1つから受け取る、請求項4に記載のシステム。
  6. 符号化されたビデオのビットストリームから、方向情報を含む補助強化情報(SEI)メッセージを抽出し前記方向情報をデコードし、前記符号化されたビデオのビットストリームをデコードして、一連の画像を生成するように構成された方向デコード・モジュールを備え、
    前記方向情報は前記一連の画像のうち少なくとも1つの画像の全ての画素についての上下反転を示す単一のビットを含み、前記方向情報の持続性に関する持続性情報がフレーム数または画像順序カウント間隔のうち少なくとも1つを含む、
    ビデオデコードのためのシステム。
  7. 前記方向デコード・モジュールは、前記ビットストリームから抽出されデコードされた前記方向情報に従って少なくとも1つの再構築画像を描画するように構成された描画器に接続された、請求項6に記載のシステム。
  8. 前記描画器はグラフィックス・プロセッシング・ユニットを備える、請求項7に記載のシステム。
  9. 請求項1、2、または3のうち一項に記載の方法を実施するための命令を含む、非一時的なコンピュータ読取可能媒体。
JP2013557715A 2011-03-10 2012-01-11 ビデオ・ビットストリーム中の描画方向情報 Active JP6026443B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161451303P 2011-03-10 2011-03-10
US61/451,303 2011-03-10
PCT/US2012/020890 WO2012121802A1 (en) 2011-03-10 2012-01-11 Render-orientation information in video bitstream

Publications (2)

Publication Number Publication Date
JP2014511647A JP2014511647A (ja) 2014-05-15
JP6026443B2 true JP6026443B2 (ja) 2016-11-16

Family

ID=46795581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013557715A Active JP6026443B2 (ja) 2011-03-10 2012-01-11 ビデオ・ビットストリーム中の描画方向情報

Country Status (7)

Country Link
US (2) US9743099B2 (ja)
EP (1) EP2684294A4 (ja)
JP (1) JP6026443B2 (ja)
CN (1) CN103416002B (ja)
AU (1) AU2012226283B2 (ja)
CA (1) CA2829290C (ja)
WO (1) WO2012121802A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013128078A1 (en) 2012-02-29 2013-09-06 Nokia Corporation Method and apparatus for rendering items in a user interface
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
US20130188922A1 (en) * 2012-01-23 2013-07-25 Research In Motion Limited Multimedia File Support for Media Capture Device Position and Location Timed Metadata
KR101995258B1 (ko) * 2012-05-14 2019-07-02 삼성전자 주식회사 카메라를 구비하는 휴대단말기의 동영상 촬영장치 및 방법
US9438818B2 (en) 2012-06-20 2016-09-06 Qualcomm Incorporated Device and method for multimedia communications with picture orientation information
US9479782B2 (en) * 2012-09-28 2016-10-25 Qualcomm Incorporated Supplemental enhancement information message coding
US11716300B2 (en) * 2013-02-13 2023-08-01 Guy Ravine Techniques for optimizing the display of videos
US9467700B2 (en) 2013-04-08 2016-10-11 Qualcomm Incorporated Non-entropy encoded representation format
KR20160126985A (ko) 2014-02-27 2016-11-02 톰슨 라이센싱 비디오의 방향을 결정하기 위한 방법 및 장치
US10447747B2 (en) 2014-03-25 2019-10-15 Qualcomm Incorporated Video orientation negotiation
US20160330453A1 (en) * 2015-05-05 2016-11-10 Cisco Technology, Inc. Parameter Set Header
US12108091B2 (en) * 2016-05-16 2024-10-01 Zte Corporation Media data processing method, apparatus and system
CN107395950B (zh) * 2016-05-16 2021-11-09 西安电子科技大学 媒体数据处理方法和装置及系统
EP3542530B1 (en) 2016-11-17 2023-04-05 Intel Corporation Suggested viewport indication for panoramic video
CN112702523B (zh) 2016-11-17 2022-05-06 英特尔公司 解码器、视频处理方法、系统和装置
FR3070087B1 (fr) * 2017-08-11 2019-08-09 Renault S.A.S. Procede d’affichage d’images sur un ecran de vehicule automobile
US11575941B2 (en) * 2021-03-23 2023-02-07 Tencent America LLC Parallel processing in video coding
US11895336B2 (en) 2021-04-02 2024-02-06 Qualcomm Incorporated Picture orientation and quality metrics supplemental enhancement information message for video coding
BR112023018967A2 (pt) * 2021-04-02 2023-10-17 Qualcomm Inc Orientação de imagem e métricas de qualidade mensagem de informações de aprimoramento suplementar para codificação de vídeo

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703515A (en) * 1985-08-26 1987-10-27 Xerox Corporation Image rotation
JPH06102855A (ja) * 1991-12-19 1994-04-15 Nintendo Co Ltd 動画表示装置およびそれに用いられる外部記憶装置
JPH08336069A (ja) 1995-04-13 1996-12-17 Eastman Kodak Co 電子スチルカメラ
US6466624B1 (en) 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
JP4186091B2 (ja) * 1999-07-30 2008-11-26 ソニー株式会社 電子スチルカメラ
JP3343104B2 (ja) 2000-07-06 2002-11-11 松下電送システム株式会社 画像処理装置及び画像処理方法
GB0116113D0 (en) * 2001-06-30 2001-08-22 Hewlett Packard Co Tilt correction of electronic images
JP3821020B2 (ja) * 2002-03-08 2006-09-13 日本ビクター株式会社 記録方法、記録装置、記録媒体、再生装置及び伝送方法並びにコンピュータプログラム
TW564373B (en) 2002-09-19 2003-12-01 Via Tech Inc Partial image rotation device and method
US7502507B2 (en) 2002-10-31 2009-03-10 Microsoft Corporation Active embedded interaction code
JP2005328279A (ja) * 2004-05-13 2005-11-24 Canon Inc 記録装置
KR101170799B1 (ko) 2005-05-21 2012-08-02 삼성전자주식회사 영상 압축 방법 및 그 장치와 영상 복원 방법 및 그 장치
EP1964411B1 (en) 2005-12-22 2017-01-11 Thomson Licensing Method and apparatus for optimization of frame selection for flexible macroblock ordering (fmo) video encoding
US7884860B2 (en) * 2006-03-23 2011-02-08 Panasonic Corporation Content shooting apparatus
JP2007267197A (ja) * 2006-03-29 2007-10-11 Fujitsu Ltd 画像処理方法、画像処理装置、および印刷物
JP2007328693A (ja) 2006-06-09 2007-12-20 Canon Inc 画像回転装置
US7724296B2 (en) * 2006-06-21 2010-05-25 Sony Ericsson Mobile Communications Ab Device and method for adjusting image orientation
US20080002963A1 (en) * 2006-06-28 2008-01-03 Media Tek Inc. Systems and methods for capturing images of objects
WO2008001441A1 (fr) * 2006-06-28 2008-01-03 Fujitsu Limited Dispositif vidéo portatif
US7974307B2 (en) 2006-11-30 2011-07-05 Vestel Elektronik Sanayi Ve Ticaret A.S. Methods and apparatus for data decoding/encoding and for searching for/inserting stuffing bytes
JP2009094741A (ja) * 2007-10-05 2009-04-30 Samsung Techwin Co Ltd 撮像装置、撮像方法及びプログラム
KR101490689B1 (ko) * 2008-05-27 2015-02-06 삼성전자주식회사 카메라 파라미터를 이용한 스테레오스코픽 영상데이터스트림 생성 방법 및 그 장치와 스테레오스코픽 영상복원 방법 및 그 장치
US20100027663A1 (en) 2008-07-29 2010-02-04 Qualcomm Incorporated Intellegent frame skipping in video coding based on similarity metric in compressed domain
US8406569B2 (en) 2009-01-19 2013-03-26 Sharp Laboratories Of America, Inc. Methods and systems for enhanced dynamic range images and video from multiple exposures
CN104768031B (zh) * 2009-01-26 2018-02-09 汤姆森特许公司 用于视频解码的装置
US8363721B2 (en) 2009-03-26 2013-01-29 Cisco Technology, Inc. Reference picture prediction for video coding
US20100254617A1 (en) 2009-04-01 2010-10-07 Qualcomm Incorporated Apparatus and method to rotate an image
WO2010124136A1 (en) 2009-04-24 2010-10-28 Delta Vidyo, Inc. An efficient video skimmer
US9124874B2 (en) * 2009-06-05 2015-09-01 Qualcomm Incorporated Encoding of three-dimensional conversion information with two-dimensional video sequence
US20120106622A1 (en) 2010-11-03 2012-05-03 Mediatek Inc. Method and Apparatus of Slice Grouping for High Efficiency Video Coding

Also Published As

Publication number Publication date
EP2684294A1 (en) 2014-01-15
AU2012226283B2 (en) 2016-09-15
EP2684294A4 (en) 2014-08-20
JP2014511647A (ja) 2014-05-15
US20120230429A1 (en) 2012-09-13
CA2829290A1 (en) 2012-09-13
CN103416002B (zh) 2015-04-01
US20170324971A1 (en) 2017-11-09
CA2829290C (en) 2017-10-17
AU2012226283A1 (en) 2013-09-05
US10027970B2 (en) 2018-07-17
US9743099B2 (en) 2017-08-22
WO2012121802A1 (en) 2012-09-13
CN103416002A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
JP6026443B2 (ja) ビデオ・ビットストリーム中の描画方向情報
US11699211B2 (en) Spherical rotation for encoding wide view video
US10587857B2 (en) Method and apparatus having video decoding function with syntax element parsing for obtaining rotation information of content-oriented rotation applied to 360-degree image content or 360-degree video content represented in projection format
CN107454468B (zh) 对沉浸式视频进行格式化的方法、装置和流
JP6263830B2 (ja) 圧縮ビデオデータにおいて複数の関心領域の指標を含めるための技術
US20140092439A1 (en) Encoding images using a 3d mesh of polygons and corresponding textures
US20190394484A1 (en) Method and apparatus for predictive coding of 360-degree video dominated by camera motion
US20240233190A1 (en) Partial decoding and reconstruction of submeshes
JP2024516634A (ja) クラウドソーシングを使用したホログラフィックまたはライトフィールド・ビューの生成のための方法、装置および媒体
US10484714B2 (en) Codec for multi-camera compression
US20240355001A1 (en) Distortion information for each iteration of vertices reconstruction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161012

R150 Certificate of patent or registration of utility model

Ref document number: 6026443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250