JP2007079664A - 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置 - Google Patents

3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置 Download PDF

Info

Publication number
JP2007079664A
JP2007079664A JP2005263270A JP2005263270A JP2007079664A JP 2007079664 A JP2007079664 A JP 2007079664A JP 2005263270 A JP2005263270 A JP 2005263270A JP 2005263270 A JP2005263270 A JP 2005263270A JP 2007079664 A JP2007079664 A JP 2007079664A
Authority
JP
Japan
Prior art keywords
dimensional
composition information
graphics
depth value
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005263270A
Other languages
English (en)
Other versions
JP4809025B2 (ja
Inventor
Gene Cheung
チョン ジーン
Takashi Sakamoto
崇 阪本
Wai Tian Tan
シャン タン ウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Priority to JP2005263270A priority Critical patent/JP4809025B2/ja
Publication of JP2007079664A publication Critical patent/JP2007079664A/ja
Application granted granted Critical
Publication of JP4809025B2 publication Critical patent/JP4809025B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Generation (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】3次元モデルを2次元にレンダリングする際に、重要なオブジェクトにより多くのビットを割り当てることで、人間が見たときの視覚上の品質を向上させる。
【構成・動作】3次元モデルから取り出した例えば奥行き情報によりビットバジェットの配分を決める。
【選択図】図2

Description

本発明の実施形態はビデオエンコーディングの分野に関する。
携帯情報端末(PDA)や携帯電話のようなさまざまなモバイルクライアントが、ストリーミングビデオコンテンツを表示するためのディスプレイ画面を備えている。無線ネットワーク(例えば3G無線ネットワーク)の帯域幅の拡大とともに、ストリーミングビデオが無線メディアの大部分を占めるであろうと考えられていた。しかし、それに反して、これまで最も急成長しているアプリケーションは、3次元(3D)グラフィクスモデルに基づくモバイルネットワークゲームの領域にある。例えば、韓国や日本のような国々では、モバイルネットワークゲームの利用が増大しているため、モバイル電子機器を用いたモバイルネットワークゲームにアクセスすることへの要望が多い。
モバイルネットワークゲームは、リアルタイムの対話性を必要とし、これにより、現在の3G無線ネットワークのリアルタイムメカニズムに対して、適時に大量のデータを配信可能でなければならないという厳しい要求が課せられる。さらに、通常のモバイルクライアントは、計算資源が限定された低消費電力で軽量の装置であり、高品質グラフィクスに通常必要な毎秒数百万トライアングルをレンダリングする能力はない。そのため、現在のモバイルオンラインゲームは、通常、グループのサイズおよび対話性が制限され、視覚上の品質が簡略化されすぎている。
モバイルオンラインゲームの品質を改善するためには、無線ネットワーク技術における根本的進歩と、モバイルコンピューティングハードウェアにおける抜本的高速化が必要である。しかし、ゲーム観戦者はモバイルクライアントユーザのなかで大きなしかも成長している集団を形成している。ゲーム観戦者は、アクションを見ることのみに興味のある非参戦者としてネットワークゲームにアクセスするユーザである。このようなネットワークゲームはモバイルネットワークゲームに限定されない。例えば、ゲーム観戦者は、3Dグラフィクスをレンダリングするのに十分なハードウェアを備えたホームパーソナルコンピュータからネットワークゲームにアクセスするかもしれない。ネットワークゲームが成熟するにつれて、高度な技術を持つプレーヤは、そうしたプレーヤを忠実に追いかけ、対戦している自分たちのヒーローを、マルチキャストチャネルにおいてを集団で観戦するファン層を獲得する。
現在、モバイルネットワークゲーム観戦者は、活動的なゲーム参戦者と同じ制限を受けている。具体的には、ネットワークゲームを観戦するためには、観戦者のモバイルクライアントは、通常、3Dグラフィクスを表示するために必要なハードウェア要件を満たさなければならない。しかし、上述のように、通常のモバイルクライアントは、3Dグラフィクスをレンダリングすることが可能なハードウェアを含んでいない。したがって、モバイルゲーム観戦者は、しばしば、あまり魅力的でなくまた簡略化しすぎたグラフィクスしかもっていないために、観戦するにはあまり魅力のないモバイルオンラインゲームを眺めるだけしかできない。
3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置である本発明の各種の実施形態がここに記載される。一実施形態では、少なくとも1つの3次元オブジェクトを表現する3次元モデルが受信される。この3次元モデルは2次元フレームにレンダリングされる。この2次元フレームについてのコンポジション情報が3次元モデルから抽出される。2次元フレームとコンポジション情報に基づいてビットストリームがエンコーディングされる。
以下、本発明の種々の実施形態について詳細に説明する。その例が添付図面に示される。本発明は、これらの実施形態に関連して説明されるが、本発明をこれらの実施形態に限定することを意図しないことが理解されるであろう。逆に、本発明は、特許請求の範囲の請求項によって定義される本発明の精神、範囲内に含まれ得る代替形態、変更形態および均等な形態を包含することを意図している。さらに、本発明の以下の説明では、本発明の十分な理解を提供するためにいくつかの具体的詳細事項が記載される。他の事例では、周知の方法、手続き、コンポーネント、および回路は、本発明の態様を不必要に分かりにくくすることがないように、詳細には記載されていない。
本発明の態様はコンピュータシステムで実装できる。コンピュータシステムは、一般に、情報および命令を処理するプロセッサと、情報および命令を記憶するランダムアクセス(揮発性)メモリ(RAM)と、静的な情報および命令を記憶する読み出し専用(不揮発性)メモリ(ROM)と、情報および命令を記憶する磁気式または光学式のディスクおよびディスクドライブのようなデータ記憶装置と、情報をコンピュータユーザに対して表示するディスプレイ装置(例えばモニタ)のような任意選択のユーザ出力装置と、情報およびコマンド選択をプロセッサに送信する英数字キーおよびファンクションキーを含む任意選択のユーザ入力装置(例えばキーボード)と、ユーザ入力情報およびコマンド選択をプロセッサに送信するカーソル制御装置(例えばマウス)のような任意選択のユーザ入力装置とを含む。
図1は、本発明の一実施形態によるゲーム観戦者ビデオエンコーディング・モバイルネットワーク100(以下、ネットワーク100という)のブロック図を示している。ネットワーク100は、コアネットワーク104およびモバイルマルチキャストサポート112を含む。コアネットワーク104は、ゲームプレーヤ102、ポータル106、ゲームサーバ108およびグラフィクス−ビデオエンコーダ(graphics-to-video encoder)110を含む。ゲームプレーヤ102は、有線接続を用いてコアネットワーク104に接続されてもよいし、また無線接続を用いて接続されてもよい。一実施形態では、ゲームプレーヤは、ポータル106経由で許可を取得しオンラインゲームに登録する。こうして、ゲームプレーヤ102は、ゲームサーバ108経由でサーバ−クライアントモデルでゲームに参戦する。ゲームサーバ108は、3次元(3D)ゲームプレイ(例えば3Dモデルを用いたゲーム)をゲームプレーヤ102に提供するように動作可能である。ゲームサーバ108は、ゲームプレーヤ102およびグラフィクス−ビデオエンコーダ110へ、更新されたゲームイベントを送信する。なお、任意の人数のゲームプレーヤ102がコアネットワーク104にアクセスしてもよいことが理解されるべきである。
グラフィクス−ビデオエンコーダ110はグレンコーダ(grencoder)とも呼ばれるが、これは更新されたゲームイベントをエンコーディングビットストリームに変換するコンピュータシステムである。一実施形態では、このビットストリームは、モバイルマルチキャストサポート112を用いて、興味を持っているゲーム観戦者114および116へストリーミングされる。しかし、無線データ通信を送信するための任意の方法または技法を用いてもよいことが理解されるべきである。一実施形態では、モバイルマルチキャストサポート112は3G無線規格を利用し、ビットストリームを観戦者114および観戦者116に送信するために、ゲートウェイGPRS (General Packet Radio Service)サポートノード(GGSN (ゲートウエイGPRSサポートノード、Gateway GPRS Support Node))、GPRS服務サポートノード(Serving GPRS Support Node (SGSN))、複数のUMTS (Universal Mobile Technology System)地上無線アクセスネットワーク(UMTS Terrestrial Radio Access network (UTRAN))ノード、および複数のユーザ機器(UE)を含む。しかし、いかなる無線規格を用いてもよいことが理解されるべきである。一実施形態では、ユーザ機器はモバイルクライアントである。一実施形態では、モバイルクライアントは携帯情報端末である。別の実施形態では、モバイルクライアントは携帯電話である。
図2は、本発明の一実施形態によるグレンコーダ110のブロック図を示している。グレンコーダ110は、グラフィクスレンダリングユニット210、コンポジション情報抽出部220、およびビデオエンコーダ230を含む。一実施形態では、グレンコーダ110は、3次元グラフィクスから2次元ビデオへのエンコードのためのプロセスを実行するように動作可能である。
グラフィクスレンダリングユニット210は、サーバ(例えば、図1のゲームサーバ108)から3Dモデルを受信する。グラフィクスレンダリングユニット210は、3Dモデルのオブジェクトの3D表現を2D平面上にレンダリングし、生の2次元(2D)フレーム(215)を生成する。レンダリングはラスタ化とも呼ばれる。一実施形態では、これはグラフィクスレンダリングユニット210のフレームバッファ中で実行される。
コンポジション情報抽出部220は、3Dモデルからコンポジション情報225を抽出することにより、エンコードされたビットストリーム235の視覚上の品質を改善するように動作可能である。グラフィクスレンダリングユニット210は、2Dフレーム215を生成している元の3Dモデル205にアクセスすることによって、エンコーディングソースのシーンコンポジション情報にアクセスすることができる。このコンポジション情報は通常、ビデオエンコーダから利用可能である。一実施形態では、コンポジション情報は3Dモデル205のオブジェクトの奥行き値を含む。オブジェクトの奥行き値は、どちらのオブジェクトがカメラにより近いか、したがってどちらのオブジェクトが覆い隠されており、どちらのオブジェクトが覆い隠されていないかを識別するために用いられる。カメラに近い方のオブジェクトが関心を持たれる、つまり重要なオブジェクトでもあると仮定することによって、奥行き値は重要な領域も明らかにする。なお、コンポジション情報は他の要素を含んでよいことが理解されるべきである。他のファクタとしては、以下のものに限定されないが、動き、テクスチャ、形、フォグ、照明、および他の意味情報が挙げられる。一実施形態では、コンポジション情報抽出部220は、重要な領域の視覚上の品質を改善するために、コンポジション情報225をビデオエンコーダ230へ送信する。別の実施形態では、コンポジション情報抽出部220は、重要な領域を識別するために、コンポジション情報225に基づいて重み付け係数を生成する。そして、重要な領域の視覚上の品質を改善するために、重み付け係数がビデオエンコーダ230へ送信される。
ビデオエンコーダ230は、エンコードされたビットストリーム235を生成するために、2Dフレーム215およびコンポジション情報225を受信する。コンポジション情報225は、2Dフレーム215の重要な領域を識別するために用いられる。ビデオエンコーダ230は、重要な領域により多くのビットを割り当てるモード選択ストラテジを適用するように構成され、それにより、エンコードされたビットストリーム235の視覚上の品質を改善する。その後、ビットストリームはパケット化され、関心を持っている観戦者(例えば、図1のゲーム観戦者114および116)へ送信される。なお、ビデオエンコーダ230は、MPEG (Moving Pictures Experts Group)ビデオエンコーダのような、いかなる規格準拠ビデオエンコーダであってもよいことが理解されるべきである。
図3は、本発明の一実施形態による、3次元グラフィクスから2次元ビデオへのエンコーディングのためのプロセス300のフローチャートを示している。図3中の各ステップの動作は以下の通りである。
310 少なくとも1つの3次元オブジェクトを表現する3次元モデルを受信する
320 3次元モデルを2次元フレームにレンダリングする
330 2次元フレームのためのコンポジション情報を3次元モデルから抽出する
340 コンポジション情報に基づいて重み付け係数を生成する
350 2次元フレームおよび重み付け係数に基づいてビットストリームをエンコーディングする
一実施形態では、プロセス300は、図1および図2のグレンコーダ110のようなコンピュータ可読およびコンピュータ実行可能命令の制御下で、プロセッサおよび電子コンポーネント(例えばコンピュータシステム)によって実行される。具体的なステップがプロセス300に開示されているが、このようなステップは例示に過ぎない。すなわち、本発明の実施形態は、種々の他のステップまたは図3に記載されたステップの変形を実行するのに十分に適合している。
ステップ310で、少なくとも1つの3Dオブジェクトを表現する3Dモデルが受信される。一実施形態では、3Dモデルはサーバ(例えば、図1のゲームサーバ108)から受信される。一実施形態では、3DモデルはOpenGLに準拠している。OpenGLは、Silicon Graphics Inc.主導で策定されたグラフィクスのための業界規格であり、グラフィクスプログラマがさまざまな種類のコンピューティングプラットフォーム上で容易にコンパイルおよび最適化が可能なソフトウェアを書くことを可能にするアプリケーションプログラミングインタフェース(API)のセットを提供する。別の実施形態では、3DモデルはOpenGL ES(組み込み機器用OpenGL (OpenGL embedded system))に準拠している。OpenGL ESは、モバイルネットワークゲームにとって本質的と考えられるOpenGL APIのサブセットである。フルサイズのOpenGLではなくOpenGL ESを用いることで、グラフィクス仕様をサポートするためのハードウェアメーカの負担が軽くなるとともに、ハードウェアメーカがより少数のAPIに特化できるようにする。
ステップ320で、3Dモデルが2Dフレームにレンダリングされる。一実施形態では、2Dフレームをレンダリングするためにいかなる標準的なラスタ化を用いてもよい。一実施形態では、2Dフレームは、ある種のMPEGエンコーダに要求される16の倍数の幅および高さを有する。
ステップ330で、2Dフレームについてのコンポジション情報が3Dモデルから抽出される。一実施形態では、コンポジション情報は2Dフレームのピクセルについての奥行き値を示す奥行き情報を含む。なお、コンポジション情報としては、以下のものに限定されないが、動き情報(例えばモーションベクトル)、テクスチャ情報、オブジェクト形状情報、照明情報、フォグ情報、および他の意味情報が挙げられることが理解されるべきである。また、ステップ330は、ステップ320の前または後のいずれにおいても実行できることが理解されるべきである。
3Dオブジェクトが2D平面にマッピングされる際のラスタ化中に奥行き情報を抽出する一実施形態では、マッピングされる各ピクセルについての奥行き値を、オブジェクト覆い隠しの判定のために、Zバッファ法を用いて計算することができる。3DオブジェクトがOpenGL ES APIで表現されている場合、ラスタ化後の特定のAPIについて、元のAPIを呼び出す前にまずフレームバッファから各ピクセル(j, k)に対する奥行き値d(j, k)を抽出するAPIラッパが書かれる。したがって、本発明の実施形態は、OpenGL ESをサポートしているいかなるモバイルネットワークゲーム開発者でも容易に採用することができ、ゲーム開発者は、グレンコーディング用の奥行き値を求めるために、ゲームソフトウェアにいかなる変更も加える必要がない。
ステップ340で、コンポジション情報に基づいて重み付け係数が生成される。一実施形態では、重み付け係数は、2Dフレームの少なくとも1つのマクロブロックについて生成される。重み付け係数は、ビデオエンコーディング中にビット割当てを補助するために用いられる。例えば、重み付け係数は、2Dフレームの全マクロブロックについて生成されてもよい。より大きい重み付け係数を有するマクロブロックが、重要な領域(例えば、他のマクロブロックよりも重要である領域)として指示される。例えば、人物の画像を表現する2Dフレームでは、高い重み付け係数を有するマクロブロックが人物(例えば前景)を表現し、他方、より低い重み付け係数を有するマクロブロックが背景を表現することができる。ビデオエンコーディング中には、背景を表現するマクロブロックに比べてより大きい割合のビットを人物を表現するマクロブロックに割り当て、それにより、同じビット数を用いながら、2Dフレームの見かけの解像度を向上させることができる。
図4は、本発明の一実施形態による重み付け係数を生成するためのプロセスのフローチャートを示している。
図4の各ステップの動作は以下の通りである。
410 マクロブロックについての平均奥行き値を当該マクロブロック中のピクセルの奥行き値に基づいて求める
420 マクロブロックについての分散奥行き値を当該マクロブロック中のピクセルの奥行き値に基づいて求める
430 マクロブロックについての重み付け係数を平均奥行き値および分散奥行き値に基づいて生成する
一実施形態では、プロセス400は、図1および図2のグレンコーダ110のようなコンピュータ可読およびコンピュータ実行可能命令の制御下で、プロセッサおよび電子コンポーネント(例えばコンピュータシステム)によって実行される。具体的なステップがプロセス400に開示されているが、このようなステップは例示に過ぎない。すなわち、本発明の実施形態は、種々の他のステップまたは図4に記載されたステップの変形を実行するのに十分適合している。
プロセス400のステップ410で、マクロブロックについての平均奥行き値が当該マクロブロック中のピクセルの奥行き値に基づいて求められる。MPEGの用語では、マクロブロックとは16ピクセル×16ピクセルのピクセルグループであり、2Dフレーム/ピクチャはオーバーラップしないマクロブロックから構成される。一実施形態では、レート制約の下で歪みの総量が最小化されるように、N個のマクロブロック(MB)からなるグループに属する各MBに対して1つのエンコーディングモードが選択される。例えば、1行のMB同士の相互依存性は、ビデオ規格h.263バージョン2 (h.263+)において線形にモデル化されているので、各MBのレートおよび歪み、すなわちRi()およびDi()は、MBiのモードmiおよび前のMBi-1のモードmi-1(利用可能であれば)のみに依存する。したがって、モード選択問題は、次の最適化として定式化することができる。
Figure 2007079664
ただし、以下の条件が成立しているものとする。

Figure 2007079664
ここで、h.263v2の場合、予測(P)フレームに対する可能なモードセット
Figure 2007079664
Figure 2007079664
であり、RsはN個のMBに対するビットレート制約である。
元の制約問題を解く代わりに、次のような対応するラグランジアン、すなわち無制約問題を解くのが通例である。
Figure 2007079664
ここで、λoは所与の値のラグランジュ乗数である。式(2)の最適解{mi o}が、
Figure 2007079664
と定義される動作レート(operational rate)Rs oがRsに等しくなるλoが存在するような最適解であれば、{mi o}は式(1)の最適解でもあることを容易に示すことができる。このようなλoが存在しない場合は、Rsにできるだけ近いRs oを与えるようなλoを採用することが望ましい。その理由は、式(2)の近似解として{mi o}を用いる際の近似誤差は| Rs o - Rs |に比例するからである。量子化パラメータQが与えられると適当なλoを経験的に求めることができることがわかっている。λoが与えられると、式(2)は通常、トレリスをたどり、その中で最短経路を求めることにより解かれる。
各ピクセル(j, k)の利用可能な奥行き値d(j, k)が与えられた場合、各MBiの重みwiは、当該MBについての重要さの程度を反映させて計算することができる。wiが与えられると、元のラグランジアンの代わりに、以下の修正ラグランジアンを解くことができる。
Figure 2007079664
このようにすると、ペナルティ関数λ(wi)Ri()の厳しさを制御する乗数λ(wi)はMBiの重みwiに依存する(このように、乗数λ(wi)は変数をとるので、乗数関数とも呼ぶ)。以下では、どのようにしてピクセル奥行き値d(j, k)をMBの重みwiにマッピングし、また適切な乗数関数λ(wi)を決めるか、を説明する。
各ピクセル(j,k)の奥行き値d(j, k)が与えられたとき、16×16のMBiの各々についての重みwiを、MBiの重要さの程度を反映するように計算する必要がある。そのため、先ず、反奥行き値(anti-depth value)を、最大奥行き値からピクセル奥行きを引いた結果であるスカラー差(つまり、dmax−d(j, k))と定義する。一般に、カメラにより近い(つまり、反奥行き値が大きい)オブジェクトの表面ほど観戦者の関心を引く可能性が高い。したがって、或るMB内の反奥行き値の平均は、そのMB内のオブジェクトの表面がカメラにどのくらい近いと考えられるかの良好な指標となるであろう。実際、ピクセルの反奥行き値平均の2乗を、カメラに近いオブジェクトの重要性を強調するために用いることができるだろう。
ステップ420で、ピクセルの奥行き値に基づいて、マクロブロックについての分散奥行き値を求める。観察者はオブジェクトの形状を識別しようとするので、オブジェクトのエッジが重要となることが多い。MB内のオブジェクトのエッジは、ピクセル奥行き値の分散にしばしば反映される。
一例として、図5において、頂点ではなく底面の方がカメラに近い円錐オブジェクト510を考える。図5は、本発明の一実施形態による、2D平面上に射影された例示的な3Dオブジェクト510を示している。このとき、MB3およびMB4は大きな反奥行き値平均を有し、一方MB1およびMB2は大きなピクセル奥行き値分散を有する。
上記の2つの考察に基づき、wiはMBi内の反奥行き値平均の2乗にMBi内の奥行き値の分散を加えたものに等しいという公式をここで採用する。
他のMBを犠牲にして重要な領域にビットをより多く分配する程度を制御するため、γ≧1が、どのMBもビットバジェット、つまりビットの総割当量、のうちγ/Nより多くのシェアを取らないような乗数係数として定義される(Nは領域の個数であることに注意)。この分配制御を達成するため、オフセット重みviをvi=wi+woffとして定義する。ここでwoffはオフセットパラメータである。平均として、各MBiはビットバジェット全体のうち
Figure 2007079664
の割合を占める。ここで、
Figure 2007079664
はN個のMBのオフセット重みの平均である。γの定義により、
Figure 2007079664
を得る。式(4)の不等式は、オフセットパラメータwoffを次式のように定義することによって満足される。
Figure 2007079664
ここで、
Figure 2007079664
かつ
Figure 2007079664
である。
このビット分配ストラテジを用いることにより、次式のように、ビットバジェットRsはN個のMBに完全に使い尽くされる。
Figure 2007079664
ステップ430で、平均奥行き値および分散奥行き値に基づいて、マクロブロックに対する重み付け係数が生成される。重み付け係数は乗数関数λ(wi)とも呼ぶ。
式(2)の元のラグランジアン最適化に対して、最適解{m }が式(1)の元の制約付き最適化のRsに等しいか非常に近い動作レート
Figure 2007079664
を有するように、λoが事前に選択されると仮定する。ここで目標は、それぞれのMBiの重みwiに対して、式(3)の修正ラグランジアン最適化を実行する場合にビットバジェットRs
Figure 2007079664
の割合が利用されることになる乗数λ(w)を求めることである。これは、式(3)の解{mi *}から動作レート
Figure 2007079664
がRs oと同じになることを意味する。この要件を有することには、λに対して従来導出されたどの公式も、本発明の修正されたレート−歪み最適化が適用されたとき、同じ意図された動作レートを有するという利益がある。
マッピングλ(wi)を導出するためには、λおよびレートRの理論的特徴づけが必要である。ラグランジュ乗数λは、次式のように、歪み−レート関数の傾きに負号を付けたものに対応する。


Figure 2007079664
エントロピー制約スカラー量子化に対する典型的な高レート近似曲線は次式のように書くことができる。
Figure 2007079664
ここで、aおよびbは、レート−歪み関数をパラメータ化した定数である。したがって、λは次式のようにRと指数関数的に関係する。
Figure 2007079664
式(9)の1つの解釈は、N個のMBに対して動作レートRs 0を達成するには、式(9)によって適当な乗数λoが求められるということである。ところが、パラメータa、bも意図されたレートRs oも判っていない。しかし、
Figure 2007079664
から、N個のMBに対して平均としてMB当たり(1/N)Rs oのビット消費となることが分かる。そこで、MBiに対してターゲット利用率
Figure 2007079664
を達成するには、動作レートが
Figure 2007079664
となるλ(wi)を求め、それを式(3)でなされているようにMBiのみに適用することで、平均として
Figure 2007079664
を消費することになる。
N個のMBに対して
Figure 2007079664
ビットを消費するλ(wi)を求めるには、λoに関してRs oについて解き、式(9)に代入する。
Figure 2007079664
式(9)を見ればb/a≧λoであることが分かる。b/a=αλo(ここでα≧1)とすれば、次式を得る。
Figure 2007079664
図3に戻って、ステップ350で、2Dフレームおよびコンポジション情報に基づいてビットストリームがエンコーディングされる。一実施形態では、ビットストリームは、そのビットストリームのマクロブロックに対する重み付け係数(例えばλ(wi))を利用してエンコーディングされる。一実施形態では、その後、ビットストリームは、モバイルマルチキャストサポートを用いて、関心を持っているゲーム観戦者へストリーミングされる。
本発明の種々の実施形態が、3次元グラフィクスから2次元ビデオへのエンコーディングを改善するための方法および装置を提供する。本発明は、規格に準拠したビデオにおけるモバイルネットワークゲームシーケンスを多数のゲーム観戦者にストリーミングするための方法および装置を提供する。グレンコーダが、入力として3Dゲームグラフィクスを受け取り、h.263+ビデオエンコーディング中にインテリジェントなモード選択を実行することによって、ビデオ中の重要な領域の視覚上の品質を高める。重要な領域は、3Dオブジェクトがラスタ化中に2Dサーフェスに射影される時に利用可能となるフレームバッファ内のピクセルのコンポジション情報(例えば奥行き値)を抽出することによって識別される。
以上、本発明の実施形態として、3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置について説明した。本発明は特定の実施形態において説明されているが、本発明は、そのような実施形態によって限定されると解釈されるべきではなく、添付の特許請求項に従って解釈されるべきであることが理解されるべきである。
本発明の一実施形態によるゲーム観戦者ビデオエンコーディングおよびモバイルネットワークのブロック図。 本発明の一実施形態によるグラフィクス−ビデオエンコーダのブロック図。 本発明の一実施形態による3次元グラフィクスから2次元ビデオへのエンコーディングのためのプロセスのフローチャート。 本発明の一実施形態による重み付け係数を生成するためのプロセスのフローチャート。 本発明の一実施形態による2次元(2D)平面上に射影された例示的な3次元(3D)オブジェクトを示す図。
符号の説明
100 ネットワーク
102 プレーヤ
104 コアネットワーク
106 ポータル
108 ゲームサーバ
110 グラフィクス−ビデオエンコーダ
112 モバイルマルチキャストサポート
114、116 ゲーム観戦者
205 3Dモデル
210 グラフィクスレンダリングユニット
215 2Dフレーム
220 コンポジション情報抽出部
225 コンポジション情報
230 ビデオエンコーダ
235 エンコードされたビットストリーム
510 円錐オブジェクト
MB1、MB2、MB3、MB4 マクロブロック


Claims (10)

  1. 3次元グラフィクスから2次元ビデオへのエンコーディングのための以下のステップを含む方法(300)、
    (ア)少なくとも1つの3次元オブジェクトを表現する3次元モデル(205)を受信する(310)、
    (イ)前記3次元モデル(205)を2次元フレーム(215)にレンダリングする(320)、
    (ウ)前記3次元モデル(205)から前記2次元フレーム(215)に対するコンポジション情報(225)を抽出する(330)、
    (エ)前記2次元フレーム(215)および前記コンポジション情報(225)に基づいてビットストリーム(235)をエンコーディングする(350)。
  2. 前記コンポジション情報(225)に基づいて重み付け係数を生成し(340)、それによって、前記ビットストリーム(235)が前記重み付け係数を利用してエンコーディングされるステップを含む、請求項1に記載の方法。
  3. 前記重み付け係数の生成(340)は、エンコーディングパラメータを選択するために前記2次元フレーム(215)の少なくとも1つのマクロブロックに対して適用される、請求項2に記載の方法。
  4. 前記コンポジション情報(225)は、前記マクロブロックのピクセルについての奥行き値を示す奥行き情報を含む、請求項3に記載の方法。
  5. 前記重み付け係数の生成(340)は以下のステップを含む請求項4に記載の方法、
    (オ)前記ピクセルの前記奥行き値に基づいて前記マクロブロックについての平均奥行き値を求める(410)、
    (カ)前記ピクセルの前記奥行き値に基づいて前記マクロブロックについての分散奥行き値を求める(420)、
    (キ)前記平均奥行き値および前記分散奥行き値に基づいて前記マクロブロックについての前記重み付け係数を生成する(430)。
  6. 前記コンポジション情報(225)は、前記2次元フレーム(215)のピクセルについてのモーションベクトルを示す動き情報を含む、請求項1に記載の方法。
  7. 前記コンポジション情報(225)は、前記2次元フレーム(215)のピクセルについてのテクスチャを示すテクスチャ情報を含む、請求項1に記載の方法。
  8. 前記ビットストリームをモバイルクライアントへ送信するステップを含む、請求項2に記載の方法。
  9. 前記モバイルクライアントは携帯情報端末である、請求項8に記載の方法。
  10. 以下の(a)から(c)を設けたグラフィクス−ビデオエンコーダ、
    (a) 3次元モデルを2次元フレームにレンダリングするグラフィクスレンダリングユニット、
    (b) 前記グラフィクスレンダリングユニットに結合され、前記3次元モデルから前記2次元フレームについてのコンポジション情報を抽出するコンポジション情報抽出部、
    (c) 前記グラフィクスレンダリングユニットおよび前記コンポジション情報抽出部に結合され、前記2次元フレームおよび前記コンポジション情報に基づいてビットストリームをエンコーディングするビデオエンコーダ。

JP2005263270A 2005-09-12 2005-09-12 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置 Expired - Fee Related JP4809025B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005263270A JP4809025B2 (ja) 2005-09-12 2005-09-12 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005263270A JP4809025B2 (ja) 2005-09-12 2005-09-12 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置

Publications (2)

Publication Number Publication Date
JP2007079664A true JP2007079664A (ja) 2007-03-29
JP4809025B2 JP4809025B2 (ja) 2011-11-02

Family

ID=37939941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005263270A Expired - Fee Related JP4809025B2 (ja) 2005-09-12 2005-09-12 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置

Country Status (1)

Country Link
JP (1) JP4809025B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015104849A1 (en) * 2014-01-09 2015-07-16 Square Enix Holdings Co., Ltd. Video gaming device with remote rendering capability
US11727591B2 (en) 2020-07-29 2023-08-15 Samsung Electronics Co., Ltd. Method and apparatus with image depth estimation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002369205A (ja) * 2001-06-06 2002-12-20 Matsushita Electric Ind Co Ltd 動画像生成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002369205A (ja) * 2001-06-06 2002-12-20 Matsushita Electric Ind Co Ltd 動画像生成装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015104849A1 (en) * 2014-01-09 2015-07-16 Square Enix Holdings Co., Ltd. Video gaming device with remote rendering capability
JP2016509485A (ja) * 2014-01-09 2016-03-31 株式会社スクウェア・エニックス・ホールディングス 遠隔描画能力を有するビデオゲーム装置
US9901822B2 (en) 2014-01-09 2018-02-27 Square Enix Holding Co., Ltd. Video gaming device with remote rendering capability
US11727591B2 (en) 2020-07-29 2023-08-15 Samsung Electronics Co., Ltd. Method and apparatus with image depth estimation

Also Published As

Publication number Publication date
JP4809025B2 (ja) 2011-11-02

Similar Documents

Publication Publication Date Title
JP5491517B2 (ja) 3次元コンピュータ生成仮想環境のビデオ表現を提供する方法及び装置
US7426304B2 (en) Method and device for three-dimensional graphics to two-dimensional video encoding
EP2364190B1 (en) Centralized streaming game server
JP5833599B2 (ja) プログラム、記録媒体及び符号化方式決定方法
US11503313B2 (en) Systems and methods for rendering and pre-encoded load estimation based encoder hinting
TW201501761A (zh) 以遊戲者之注意區域爲基礎改善視訊串流的速率控制位元分配
Stengel et al. A distributed, decoupled system for losslessly streaming dynamic light probes to thin clients
JP4809025B2 (ja) 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置
Shi et al. Towards Full-scene Volumetric Video Streaming via Spatially Layered Representation and NeRF Generation
Tian et al. Quantization Parameter and Lagrange Multiplier Determination for Virtual Reality 360 Video Source Coding
TW201501763A (zh) 動畫配信伺服器、動畫播放裝置、控制方法、程式、及記錄媒體

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080812

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091130

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110804

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110818

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140826

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4809025

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees