JP7432005B2 - 二次元画像の三次元化方法、装置、機器及びコンピュータプログラム - Google Patents
二次元画像の三次元化方法、装置、機器及びコンピュータプログラム Download PDFInfo
- Publication number
- JP7432005B2 JP7432005B2 JP2022559723A JP2022559723A JP7432005B2 JP 7432005 B2 JP7432005 B2 JP 7432005B2 JP 2022559723 A JP2022559723 A JP 2022559723A JP 2022559723 A JP2022559723 A JP 2022559723A JP 7432005 B2 JP7432005 B2 JP 7432005B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel point
- dimensional image
- transition
- image
- depth value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 196
- 238000004590 computer program Methods 0.000 title claims description 7
- 230000007704 transition Effects 0.000 claims description 203
- 230000000875 corresponding effect Effects 0.000 claims description 108
- 238000012545 processing Methods 0.000 claims description 97
- 230000008569 process Effects 0.000 claims description 95
- 238000009877 rendering Methods 0.000 claims description 44
- 230000005012 migration Effects 0.000 claims description 38
- 238000013508 migration Methods 0.000 claims description 38
- 230000015654 memory Effects 0.000 claims description 23
- 230000008439 repair process Effects 0.000 claims description 23
- 230000002596 correlated effect Effects 0.000 claims description 22
- 238000005538 encapsulation Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 17
- 230000035945 sensitivity Effects 0.000 claims description 15
- 230000000007 visual effect Effects 0.000 claims description 10
- 230000000717 retained effect Effects 0.000 claims description 7
- 238000010186 staining Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 6
- 238000006073 displacement reaction Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005429 filling process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/261—Image signal generators with monoscopic-to-stereoscopic image conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/261—Image signal generators with monoscopic-to-stereoscopic image conversion
- H04N13/268—Image signal generators with monoscopic-to-stereoscopic image conversion based on depth image-based rendering [DIBR]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/128—Adjusting depth or disparity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/15—Processing image signals for colour aspects of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/257—Colour aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/261—Image signal generators with monoscopic-to-stereoscopic image conversion
- H04N13/264—Image signal generators with monoscopic-to-stereoscopic image conversion using the relative movement of objects in two video frames or fields
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/286—Image signal generators having separate monoscopic and stereoscopic modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/286—Image signal generators having separate monoscopic and stereoscopic modes
- H04N13/289—Switching between monoscopic and stereoscopic modes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
Description
本願は、2020年8月24日に中国特許局に提出された、出願番号が第202010856161.6号である中国特許出願に基づいて提出されるものであり、当該中国特許出願の優先権を主張し、当該中国特許出願の全ての内容が参照として本願に援用される。
二次元画像に対して深度認識処理を実行して、前記二次元画像の各画素点の深度値を取得するステップと、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得するステップと、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定するステップと、
前記各視角の移行画像の各画素点の色彩値に基づいて、対応する前記視角の移行画像を生成するステップと、
前記複数の視角の移行画像を順次にカプセル化して、三次元ビデオを取得するステップと、を含む。
二次元画像に対して深度認識処理を実行して、前記二次元画像の各画素点の深度値を取得するように構成される深度モジュールと、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得するように構成される移行モジュールと、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定するように構成される色彩決定モジュールと、
前記各視角の移行画像の各画素点の色彩値に基づいて、対応する前記視角の移行画像を生成するように構成される生成モジュールと、
複数の前記視角の移行画像を順次にカプセル化して、三次元ビデオを取得するように構成されるカプセル化モジュールと、を備える。
ヒューマン・コンピュータ・インタラクション・インターフェイスに二次元画像を表示するステップと、
前記二次元画像の三次元化操作に応答して、前記二次元画像に基づいて生成された三次元ビデオを再生するステップと、を含み、
ここで、前記ビデオは、本願実施例に係る二次元画像の三次元化方法によって取得されたものである。
ヒューマン・コンピュータ・インタラクション・インターフェイスに二次元画像を表示するように構成される表示モジュールと、
前記二次元画像の三次元化操作に応答して、前記二次元画像に基づいて生成された三次元ビデオを再生するように構成される再生モジュールと、を備え、
ここで、前記ビデオは、本願実施例に係る二次元画像の三次元化方法によって取得されたものである。
実行可能命令を記憶するように構成されるメモリと、
前記メモリに記憶されている実行可能命令を実行することにより、本願実施例に係る二次元画像の三次元化方法を実現するように構成されるプロセッサと、を備える。
1)深度マップ:三次元コンピュータ図形及びコンピュータビジョンでは、深度マップは、シーン対象の表面から視点までの距離に関連する情報を含む、画像又は画像チャネルであり、深度マップは、三次元形状のシミュレーション又は三次元形状の再構築に使用され、深度マップは、三次元スキャナによって生成することができる。
2)画素:デジタル画像は、画像の行方向及び列方向上のグレースケール又は色彩を記録した二次元信号であり、画素は、コンピュータ画像の最小論理単位である。
3)深度推定:画像に基づいて当該画像の深度情報を推定し、深度推定は、画像内容の理解、焦点、焦点外れ及び明暗の変化に基づいて行われることができ、画像内容の理解に基づく深度推定方法は主に、画像内の各対象をブロックに分類し、その後、各カテゴリの対象について、それぞれの適切な方法を使用して深度情報を推定する。
Norm(D)=(D-D.min)/(D.max-D.min) (1)
ここで、D.maxは、深度マップの全ての画素点の最大深度値を指し、Dminは、深度マップの全ての画素点の最小深度値を指し、Norm(D)は正則化処理結果である。
max(abs(D(i,j)-D(i+1,j)),abs(D(i,j)-D(i-1,j)),abs(D(i,j)-D(i,j+1)),abs(D(i,j)-D(i,j-1)))<差値閾値 (2)
ここで、abs(D(i,j)-D(i+1,j)は、画素点(i,j)の深度値の正則化処理結果と画素点(i+1,j)の深度値の正則化処理結果との間の絶対差値であり、abs(D(i,j)-D(i-1,j))は、画素点(i,j)の深度値の正則化処理結果と画素点(i-1,j)の深度値の正則化処理結果との間の絶対差値であり、abs(D(i,j)-D(i,j+1))は、画素点(i,j)の深度値の正則化処理結果と画素点(i,j+1)の深度値の正則化処理結果との間の絶対差値であり、abs(D(i,j)-D(i,j-1))は、画素点(i,j)の深度値の正則化処理結果と画素点(i,j-1)の深度値の正則化処理結果との間の絶対差値である。
D=(1/Norm(D))-0.5 (3)
ここで、Norm(D)は、画素点の正則化処理結果であり、Dは更新深度値であり、減算に使用されるパラメータは0.5に限定されず、上記の式(3)による更新処理後に取得される深度値は、-0.5~0.5である。更新深度値が大きいほど、視距離が小さくなり、つまり、画素の距離が近いことを意味し、視距離は、視点と画像内の対象との間の距離を表し、遠景の対象の視距離は近景の対象の視距離よりも大きい。
300 ネットワーク
400 端末
410 プロセッサ
420 ネットワークインターフェース
430 ユーザインターフェース
431 出力装置
432 入力装置
440 バスシステム
450 メモリ
451 オペレーティングシステム
452 ネットワーク通信モジュール
453 表示モジュール
454 入力処理モジュール
455 二次元画像の三次元化装置
4551 深度モジュール
4552 移行モジュール
4553 色彩決定モジュール
4554 生成モジュール
4555 カプセル化モジュール
4556 表示モジュール
4557 再生モジュール
Claims (15)
- 電子機器によって実行される、二次元画像の三次元化方法であって、
二次元画像に対して深度認識処理を実行して、前記二次元画像の各画素点の深度値を取得するステップと、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得するステップと、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定するステップと、
前記各視角の移行画像の各画素点の色彩値に基づいて、対応する前記視角の移行画像を生成するステップと、
前記複数の視角の移行画像を順次にカプセル化して、三次元ビデオを取得するステップと、を含み、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定する前に、前記二次元画像の三次元化方法は、
前記深度認識処理により取得された前記二次元画像の各画素点の深度値を、元の深度値として使用するステップと、
前記二次元画像の各画素点の元の深度値に対して深度修復処理を実行して、前記二次元画像の各画素点の修復深度値を取得するステップと、
各画素点の修復深度値に基づいて、対応する元の深度値を置き換えるステップと、を更に含み、
前記二次元画像の各画素点の元の深度値に対して深度修復処理を実行して、前記二次元画像の各画素点の修復深度値を取得する前記ステップは、
前記二次元画像の各画素点の元の深度値に基づいて、前記二次元画像のエッジ画素点及び前記二次元画像の非エッジ画素点を決定するステップと、
前記エッジ画素点に基づいて、前記二次元画像における、中央値置き換えが必要な置き換え対象画素点と、中央値置き換えを必要としない保留画素点とを決定するステップと、
前記置き換え対象画素点の連通領域内の全ての非エッジ画素点の元の深度値に対して降順整列処理を実行し、降順整列結果の中央値を前記置き換え対象画素点の修復深度値として使用するステップと、
前記保留画素点の元の深度値を前記保留画素点の修復深度値として保留するステップと、を含む、二次元画像の三次元化方法。 - 前記二次元画像の各画素点の元の深度値に基づいて、前記二次元画像のエッジ画素点及び前記二次元画像の非エッジ画素点を決定する前記ステップは、
前記二次元画像の任意の画素点について、
前記画素点の元の深度値の正則化処理結果と、少なくとも1つの隣接画素点の元の深度値の正則化処理結果との間の絶対差値が、差値閾値以上である場合、前記画素点を前記非エッジ画素点として決定し、
前記画素点の元の深度値の正則化処理結果と、各隣接画素点の元の深度値の正則化処理結果との間の絶対差値が、前記差値閾値よりも小さい場合、前記画素点を前記エッジ画素点として決定する、ステップを含み、
前記隣接画素点は、前記任意の画素点の隣接位置にある画素点である、
請求項1に記載の二次元画像の三次元化方法。 - 前記エッジ画素点に基づいて、前記二次元画像における、中央値置き換えが必要な置き換え対象画素点と、中央値置き換えを必要としない保留画素点とを決定する前記ステップは、
前記二次元画像の任意の画素点について、
前記画素点の連通領域内に少なくとも1つのエッジ画素点が存在する場合、前記画素点が前記置き換え対象画素点であると決定し、
前記画素点の連通領域内にエッジ画素点が存在しない場合、前記画素点が前記保留画素点であると決定する、ステップを含む、
請求項1に記載の二次元画像の三次元化方法。 - 前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得する前記ステップは、
前記二次元画像の各画素点の深度値を更新して、前記二次元画像の各画素点の更新深度値を取得するステップであって、前記更新深度値は、画素点に対応する修復深度値と負の相関がある、ステップと、
前記複数の視角とそれぞれ1対1で対応する複数の移動パラメータを決定するステップであって、前記移動パラメータは、水平移動パラメータ及び垂直移動パラメータを含む、ステップと、
前記各視角について、
設定された移動感度パラメータ、前記更新深度値、前記水平移動パラメータ、及び前記二次元画像の幅と正相関する水平移動ベクトルを決定し、
前記設定された移動感度パラメータ、前記更新深度値、前記垂直移動パラメータ、及び前記二次元画像の高さと正相関する垂直移動ベクトルを決定し、
前記視角の移行画像画布における前記二次元画像の各画素点の対応する原位置を取得し、前記原位置を起点として前記水平移動ベクトル及び前記垂直移動ベクトルに従って変位処理を実行して、前記移行画像画布における前記二次元画像の各画素点の移行位置を取得する、ステップと、を含む、
請求項1に記載の二次元画像の三次元化方法。 - 前記各視角の移行結果は、前記視角の移行画像画布における、前記二次元画像の各画素点が移行される移行位置を含み、前記移行画像画布のサイズと前記二次元画像のサイズは同じであり、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定する前記ステップは、
前記各視角の移行画像の各画素点を染色対象画素点として使用し、前記各視角の移行画像画布における各染色対象画素点に対して以下の処理、すなわち、
前記染色対象画素点の寄与画素点を決定することであって、前記寄与画素点は、前記二次元画像において、移行位置が前記染色対象画素点の連通領域内にある画素点である、ことと、
前記視角の移行画像画布における前記二次元画像の各画素点の移行位置、及び前記二次元画像の各画素点の深度値に基づいて、前記染色対象画素点に対応する前記寄与画素点の寄与重みを決定することと、
各前記寄与画素点の寄与重みに基づいて、各前記寄与画素点の色彩値に対して加重処理を実行して、前記染色対象画素点の色彩値を取得することと、を実行するステップを含む、
請求項1に記載の二次元画像の三次元化方法。 - 前記複数の視角の移行画像を順次にカプセル化して、三次元ビデオを取得する前記ステップは、
前記二次元画像の各画素点の深度値に基づいて、前記各視角の移行画像に対して空白画素補填処理を実行するステップと、
前記各視角の移行画像の空白画素補填結果に対してガウスぼかし処理を実行して、ガウスぼかし画像を取得するステップと、
前記各視角のガウスぼかし画像を順次にカプセル化して、三次元ビデオを取得するステップと、を含む、
請求項1に記載の二次元画像の三次元化方法。 - 前記二次元画像の各画素点の深度値に基づいて、前記各視角の移行画像に対して空白画素補填処理を実行する前記ステップは、
前記各視角の移行画像における各染色対象画素点について、
前記染色対象画素点の連通領域内に前記染色対象画素点に対応する寄与画素点がない場合、前記染色対象画素点の位置を空白位置として決定するステップと、
前記移行画像の各空白位置について、
前記空白位置を中心として、前記二次元画像の一部の画素点の深度値に基づいて、前記空白位置の連通領域内で前記染色対象画素点の参照画素点を検索し、
前記参照画素点の色彩値に基づいて、前記染色対象画素点に対して色値補填処理を実行する、ステップと、を含む、
請求項6に記載の二次元画像の三次元化方法。 - 前記空白位置を中心として、前記二次元画像の一部の画素点の深度値に基づいて、前記空白位置の連通領域内で前記染色対象画素点の参照画素点を検索する前記ステップは、
前記空白位置を起点とした複数の検索方向グループを決定するステップであって、各検索方向グループに含まれる第1方向は、第2方向の反対である、ステップと、
各検索方向グループについて、前記空白位置の連通領域内の第1方向において、前記空白位置に最も近い非空白位置の画素点を決定し、前記空白位置の連通領域内の第2方向において、前記空白位置に最も近い非空白位置の画素点を決定し、前記第1方向で決定された画素点と前記第2方向で決定された画素点との間の画素距離を決定するステップと、
複数の検索方向グループにおける最小画素距離に対応する2つの画素点を決定するステップと、
前記二次元画像の一部の画素点の深度値に基づいて、前記2つの画素点のレンダリング深度値を決定し、レンダリング深度値の大きい方の画素点を前記染色対象画素点の参照画素点として決定するステップと、を含む、
請求項7に記載の二次元画像の三次元化方法。 - 前記各視角の移行結果は、前記視角の移行画像画布における、前記二次元画像の各画素点が移行される移行位置を含み、前記移行画像画布のサイズと前記二次元画像のサイズは同じであり、
前記一部の画素点は、目標画素点の寄与画素点であり、
前記二次元画像の一部の画素点の深度値に基づいて、前記2つの画素点のレンダリング深度値を決定する前記ステップは、
前記2つの画素点のうちのいずれか1つを目標画素点として使用し、以下の処理、すなわち、
前記目標画素点の寄与画素点を決定することであって、前記寄与画素点は、前記二次元画像において、前記移行位置が前記目標画素点の連通領域内にある画素点である、ことと、
前記視角の移行画像画布における前記寄与画素点の移行位置に基づいて、前記目標画素点に対する前記寄与画素点の寄与重みを決定することと、
前記寄与画素点の寄与重みに基づいて、前記寄与画素点の深度値に対して加重処理を実行して、前記2つの画素点のレンダリング深度値を取得することと、を実行するステップを含む、
請求項8に記載の二次元画像の三次元化方法。 - 電子機器によって実行される、二次元画像の三次元化方法であって、
ヒューマン・コンピュータ・インタラクション・インターフェイスに二次元画像を表示するステップと、
前記二次元画像の三次元化操作に応答して、前記二次元画像に基づいて生成された三次元ビデオを再生するステップと、を含み、
前記三次元ビデオは、請求項1ないし9のいずれか一項に記載の二次元画像の三次元化方法によって取得されたものである、二次元画像の三次元化方法。 - 二次元画像の三次元化装置であって、
二次元画像に対して深度認識処理を実行して、前記二次元画像の各画素点の深度値を取得するように構成される深度モジュールと、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得するように構成される移行モジュールと、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定するように構成される色彩決定モジュールと、
前記各視角の移行画像の各画素点の色彩値に基づいて、対応する前記視角の移行画像を生成するように構成される生成モジュールと、
複数の前記視角の移行画像を順次にカプセル化して、三次元ビデオを取得するように構成されるカプセル化モジュールと、を備え、
前記深度モジュールは、前記色彩決定モジュールが前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定する前に、
前記深度認識処理により取得された前記二次元画像の各画素点の深度値を、元の深度値として使用することと、
前記二次元画像の各画素点の元の深度値に対して深度修復処理を実行して、前記二次元画像の各画素点の修復深度値を取得することと、
各画素点の修復深度値に基づいて、対応する元の深度値を置き換えることと、を行うようにさらに構成され、
前記二次元画像の各画素点の元の深度値に対して深度修復処理を実行して、前記二次元画像の各画素点の修復深度値を取得することは、
前記二次元画像の各画素点の元の深度値に基づいて、前記二次元画像のエッジ画素点及び前記二次元画像の非エッジ画素点を決定することと、
前記エッジ画素点に基づいて、前記二次元画像における、中央値置き換えが必要な置き換え対象画素点と、中央値置き換えを必要としない保留画素点とを決定することと、
前記置き換え対象画素点の連通領域内の全ての非エッジ画素点の元の深度値に対して降順整列処理を実行し、降順整列結果の中央値を前記置き換え対象画素点の修復深度値として使用することと、
前記保留画素点の元の深度値を前記保留画素点の修復深度値として保留することと、を含む、二次元画像の三次元化装置。 - 電子機器であって、
実行可能命令を記憶するように構成されるメモリと、
前記メモリに記憶されている実行可能命令を実行することにより、請求項1ないし9のいずれか一項に記載の二次元画像の三次元化方法又は請求項10に記載の二次元画像の三次元化方法を実行するように構成されるプロセッサと、を備える、電子機器。 - コンピュータに、請求項1ないし9のいずれか一項に記載の二次元画像の三次元化方法又は請求項10に記載の二次元画像の三次元化方法を実行させる、コンピュータプログラム。
- 電子機器によって実行される、二次元画像の三次元化方法であって、
二次元画像に対して深度認識処理を実行して、前記二次元画像の各画素点の深度値を取得するステップと、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得するステップと、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定するステップと、
前記各視角の移行画像の各画素点の色彩値に基づいて、対応する前記視角の移行画像を生成するステップと、
前記複数の視角の移行画像を順次にカプセル化して、三次元ビデオを取得するステップと、を含み、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得する前記ステップは、
前記二次元画像の各画素点の深度値を更新して、前記二次元画像の各画素点の更新深度値を取得するステップであって、前記更新深度値は、画素点に対応する修復深度値と負の相関がある、ステップと、
前記複数の視角とそれぞれ1対1で対応する複数の移動パラメータを決定するステップであって、前記移動パラメータは、水平移動パラメータ及び垂直移動パラメータを含む、ステップと、
前記各視角について、
設定された移動感度パラメータ、前記更新深度値、前記水平移動パラメータ、及び前記二次元画像の幅と正相関する水平移動ベクトルを決定し、
前記設定された移動感度パラメータ、前記更新深度値、前記垂直移動パラメータ、及び前記二次元画像の高さと正相関する垂直移動ベクトルを決定し、
前記視角の移行画像画布における前記二次元画像の各画素点の対応する原位置を取得し、前記原位置を起点として前記水平移動ベクトル及び前記垂直移動ベクトルに従って変位処理を実行して、前記移行画像画布における前記二次元画像の各画素点の移行位置を取得する、ステップと、を含む、二次元画像の三次元化方法。 - 二次元画像の三次元化装置であって、
二次元画像に対して深度認識処理を実行して、前記二次元画像の各画素点の深度値を取得するように構成される深度モジュールと、
前記二次元画像に対して複数の視角の移行処理を実行して、前記二次元画像の各視角に対応する移行結果を取得するように構成される移行モジュールと、
前記二次元画像の各画素点の深度値及び前記二次元画像の各視角に対応する移行結果に基づいて、前記各視角に対応する移行画像の各画素点の色彩値を決定するように構成される色彩決定モジュールと、
前記各視角の移行画像の各画素点の色彩値に基づいて、対応する前記視角の移行画像を生成するように構成される生成モジュールと、
複数の前記視角の移行画像を順次にカプセル化して、三次元ビデオを取得するように構成されるカプセル化モジュールと、を備え、
前記移行モジュールは、
前記二次元画像の各画素点の深度値を更新して、前記二次元画像の各画素点の更新深度値を取得することであって、前記更新深度値は、画素点に対応する修復深度値と負の相関がある、ことと、
前記複数の視角とそれぞれ1対1で対応する複数の移動パラメータを決定することであって、前記移動パラメータは、水平移動パラメータ及び垂直移動パラメータを含む、ことと、
前記各視角について、
設定された移動感度パラメータ、前記更新深度値、前記水平移動パラメータ、及び前記二次元画像の幅と正相関する水平移動ベクトルを決定し、
前記設定された移動感度パラメータ、前記更新深度値、前記垂直移動パラメータ、及び前記二次元画像の高さと正相関する垂直移動ベクトルを決定し、
前記視角の移行画像画布における前記二次元画像の各画素点の対応する原位置を取得し、前記原位置を起点として前記水平移動ベクトル及び前記垂直移動ベクトルに従って変位処理を実行して、前記移行画像画布における前記二次元画像の各画素点の移行位置を取得する、ことと、を行うようにさらに構成される、二次元画像の三次元化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856161.6 | 2020-08-24 | ||
CN202010856161.6A CN111970503B (zh) | 2020-08-24 | 2020-08-24 | 二维图像的三维化方法、装置、设备及计算机可读存储介质 |
PCT/CN2021/104972 WO2022042062A1 (zh) | 2020-08-24 | 2021-07-07 | 二维图像的三维化方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023519728A JP2023519728A (ja) | 2023-05-12 |
JP7432005B2 true JP7432005B2 (ja) | 2024-02-15 |
Family
ID=73390078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022559723A Active JP7432005B2 (ja) | 2020-08-24 | 2021-07-07 | 二次元画像の三次元化方法、装置、機器及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US12113953B2 (ja) |
EP (1) | EP4099692A4 (ja) |
JP (1) | JP7432005B2 (ja) |
CN (1) | CN111970503B (ja) |
WO (1) | WO2022042062A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111970503B (zh) | 2020-08-24 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 二维图像的三维化方法、装置、设备及计算机可读存储介质 |
CN113891057A (zh) * | 2021-11-18 | 2022-01-04 | 北京字节跳动网络技术有限公司 | 视频的处理方法、装置、电子设备和存储介质 |
CN114820368B (zh) * | 2022-04-27 | 2024-08-02 | 广东职业技术学院 | 一种基于3d扫描的破损陶瓷图像修复方法及系统 |
CN115205456A (zh) * | 2022-07-01 | 2022-10-18 | 维沃移动通信有限公司 | 三维模型构建方法、装置、电子设备及存储介质 |
CN115760551A (zh) * | 2022-11-01 | 2023-03-07 | 影石创新科技股份有限公司 | 全景图像处理方法、装置、计算机设备、介质和程序产品 |
CN115861572B (zh) * | 2023-02-24 | 2023-05-23 | 腾讯科技(深圳)有限公司 | 一种三维建模方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900825A (zh) | 2018-08-16 | 2018-11-27 | 电子科技大学 | 一种2d图像到3d图像的转换方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7391920B2 (en) * | 2003-11-04 | 2008-06-24 | Fujifilm Corporation | Image processing method, apparatus, and program |
US7573475B2 (en) * | 2006-06-01 | 2009-08-11 | Industrial Light & Magic | 2D to 3D image conversion |
US8947422B2 (en) * | 2009-09-30 | 2015-02-03 | Disney Enterprises, Inc. | Gradient modeling toolkit for sculpting stereoscopic depth models for converting 2-D images into stereoscopic 3-D images |
JP2011139281A (ja) * | 2009-12-28 | 2011-07-14 | Sony Corp | 三次元画像生成装置、三次元画像表示装置、三次元画像生成方法およびプログラム |
US20110304618A1 (en) * | 2010-06-14 | 2011-12-15 | Qualcomm Incorporated | Calculating disparity for three-dimensional images |
US9210405B2 (en) * | 2012-03-22 | 2015-12-08 | Qualcomm Technologies, Inc. | System and method for real time 2D to 3D conversion of video in a digital camera |
CN102724529B (zh) * | 2012-05-28 | 2014-08-06 | 清华大学 | 虚拟视点视频序列的生成方法及生成装置 |
CN102790896A (zh) * | 2012-07-19 | 2012-11-21 | 彩虹集团公司 | 一种2d转3d的转换方法 |
US9736449B1 (en) * | 2013-08-12 | 2017-08-15 | Google Inc. | Conversion of 2D image to 3D video |
CN105513112B (zh) * | 2014-10-16 | 2018-11-16 | 北京畅游天下网络技术有限公司 | 图像处理方法和装置 |
US9721385B2 (en) * | 2015-02-10 | 2017-08-01 | Dreamworks Animation Llc | Generation of three-dimensional imagery from a two-dimensional image using a depth map |
CN106341676B (zh) * | 2016-09-29 | 2017-06-16 | 济南大学 | 基于超像素的深度图像预处理和深度空洞填充方法 |
CN111193919B (zh) * | 2018-11-15 | 2023-01-13 | 中兴通讯股份有限公司 | 一种3d显示方法、装置、设备及计算机可读介质 |
CN110390712B (zh) * | 2019-06-12 | 2023-04-25 | 创新先进技术有限公司 | 图像渲染方法及装置、三维图像构建方法及装置 |
EP4058983A4 (en) * | 2019-11-12 | 2024-08-07 | Geomagical Labs Inc | METHOD AND SYSTEM FOR SCENE IMAGE MODIFICATION |
CN111970503B (zh) * | 2020-08-24 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 二维图像的三维化方法、装置、设备及计算机可读存储介质 |
-
2020
- 2020-08-24 CN CN202010856161.6A patent/CN111970503B/zh active Active
-
2021
- 2021-07-07 EP EP21859902.5A patent/EP4099692A4/en active Pending
- 2021-07-07 JP JP2022559723A patent/JP7432005B2/ja active Active
- 2021-07-07 WO PCT/CN2021/104972 patent/WO2022042062A1/zh unknown
-
2022
- 2022-12-08 US US18/077,549 patent/US12113953B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900825A (zh) | 2018-08-16 | 2018-11-27 | 电子科技大学 | 一种2d图像到3d图像的转换方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4099692A1 (en) | 2022-12-07 |
WO2022042062A1 (zh) | 2022-03-03 |
CN111970503B (zh) | 2023-08-22 |
EP4099692A4 (en) | 2023-08-30 |
JP2023519728A (ja) | 2023-05-12 |
US20230113902A1 (en) | 2023-04-13 |
CN111970503A (zh) | 2020-11-20 |
US12113953B2 (en) | 2024-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7432005B2 (ja) | 二次元画像の三次元化方法、装置、機器及びコンピュータプログラム | |
CN109671126B (zh) | 使用神经网络预测分块位移图 | |
CN109771951B (zh) | 游戏地图生成的方法、装置、存储介质和电子设备 | |
JP7026222B2 (ja) | 画像生成ネットワークの訓練および画像処理方法、装置、電子機器、ならびに媒体 | |
US11328481B2 (en) | Multi-resolution voxel meshing | |
JP2017091523A (ja) | 3dレンダリング方法及び3dレンダリング装置 | |
CN106575158B (zh) | 环境映射虚拟化机构 | |
JP2023029984A (ja) | 仮想イメージを生成するための方法、装置、電子機器及び可読記憶媒体 | |
US20210407125A1 (en) | Object recognition neural network for amodal center prediction | |
KR20190100305A (ko) | 혼합 현실에서 동적 가상 콘텐츠들을 생성하기 위한 디바이스 및 방법 | |
EP3942530A1 (en) | High resolution real-time artistic style transfer pipeline | |
US9959672B2 (en) | Color-based dynamic sub-division to generate 3D mesh | |
KR20230013099A (ko) | 실시간 깊이 맵을 사용한 지오메트리 인식 증강 현실 효과 | |
CN114494550B (zh) | 基于WebGPU的渲染方法、电子设备及存储介质 | |
WO2022026603A1 (en) | Object recognition neural network training using multiple data sources | |
CN115311395A (zh) | 三维场景渲染方法、装置及设备 | |
Tenze et al. | altiro3d: scene representation from single image and novel view synthesis | |
JP7387029B2 (ja) | ソフトレイヤ化および深度認識インペインティングを用いた単画像3d写真技術 | |
CN111563956A (zh) | 一种二维图片的三维显示方法、装置、设备及介质 | |
Kolivand et al. | Livephantom: Retrieving virtual world light data to real environments | |
Canessa et al. | altiro3D: Scene representation from single image and novel view synthesis | |
CN118827947A (zh) | 虚拟视点合成方法及相关装置 | |
CN116912425A (zh) | 基于三维重建的可视化场景搭建方法以及相关设备 | |
WO2020026670A1 (ja) | 画像生成装置、画像生成方法、およびプログラム | |
Dumale et al. | Stereo Image Transformation Employing Novel View Synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220929 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7432005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |