JP7354417B2 - ビデオ通話用の顔ベースのフレームパッキング - Google Patents
ビデオ通話用の顔ベースのフレームパッキング Download PDFInfo
- Publication number
- JP7354417B2 JP7354417B2 JP2022509165A JP2022509165A JP7354417B2 JP 7354417 B2 JP7354417 B2 JP 7354417B2 JP 2022509165 A JP2022509165 A JP 2022509165A JP 2022509165 A JP2022509165 A JP 2022509165A JP 7354417 B2 JP7354417 B2 JP 7354417B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- video
- packing
- video frame
- rectangles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234345—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Description
図1は、符号化されたビデオが生成される例示的な環境100のブロック図を示す。図示の環境100は、ビデオサーバ101、ユーザデバイス115a、115n、およびネットワーク105を含む。ユーザ125a、125nは、個々のユーザデバイス115a、115nに関連付けられ得る。いくつかの実施形態では、環境100は、図1に示されていない他のサーバまたはデバイスを含み得る。図1および残りの図では、参照番号の後の文字、例えば「115a」は、その特定の参照番号を有する構成要素への参照を表している。本文中の参照番号に続く文字のないもの、例えば「115」は、その参照番号を有する構成要素の実施形態への一般的な参照を表す。
図2は、符号化されたビデオを生成する例示的なコンピューティングデバイス200のブロック図を示す。コンピューティングデバイス200は、ユーザデバイス115またはビデオサーバ101であり得る。コンピューティングデバイス200は、プロセッサ235、メモリ237、通信ユニット239、カメラ241、ディスプレイ243、およびストレージデバイス247を含み得る。コンピューティングデバイス200の種類に応じて、追加の構成要素が存在してもよく、また、従前の構成要素の一部が省略されてもよい。ビデオアプリケーション103は、メモリ237に格納され得る。いくつかの実施形態では、コンピューティングデバイス200は、電池など、図面に記載されていない他の構成要素を含み得る。コンピューティングデバイス200の構成要素は、バス220によって通信可能に接続され得る。バス220は、コンピューティングデバイス200の様々な部分の間で信号を伝送する通信バスであり得る。
図4は、ビデオを符号化するための例示的な方法400のフローチャートを示す。方法400は、ユーザデバイス115、ビデオサーバ101、または部分的にユーザデバイス115および部分的にビデオサーバ101などのコンピューティングデバイス200に格納されたビデオアプリケーション103によって実行される。
Claims (17)
- ビデオを符号化する方法であって、
人の顔を含むビデオフレームをキャプチャするステップと、
前記ビデオフレーム内の顔を検出するステップと、
前記ビデオフレームを複数の矩形に分割するステップと、前記複数の矩形は、顔に対応する画素を有する顔矩形を含んでおり、
前記複数の矩形に基づいて前記ビデオフレームをパッキングするステップと、ここで、前記複数の矩形の他の矩形と比較して、パッキングされた前記ビデオフレーム内のより多数の画素が、前記顔矩形に割り当てられ、前記ビデオフレームをパッキングする前記ステップは、パッキングを記述するメタデータを生成することを含み、前記メタデータは、パッキングする前記ステップの前の前記ビデオフレーム内の顔の中心の位置である顔変換の中心と、パッキングする前記ステップの前の前記顔矩形のサイズである顔変換のx/yスケールとを記述し、
複数の前記ビデオフレーム間の顔の動きが動きの量の閾値を下回っている限り、前記メタデータを再計算することなく、前記複数の矩形に基づいて1つまたは複数の後続フレームをパッキングすることによってパッキングを継続するステップと、
パッキングされた前記ビデオフレームを符号化するステップと、を含み、ここで、符号化された前記ビデオフレームは、パッキングを記述する前記メタデータを含んでいる、方法。 - 前記メタデータは、前記顔矩形の中心およびスケールの記述を含む、請求項1に記載の方法。
- 前記ビデオフレームをパッキングした後、前記複数の矩形の各々の周囲にパディング画素を追加するステップをさらに含む、請求項1に記載の方法。
- 前記ビデオフレームをパッキングするステップは、前記ビデオフレームをソーステクスチャとして使用することを含む、請求項1に記載の方法。
- 前記複数の矩形が、顔の左方の矩形、顔の右方の矩形、顔の上方の矩形、または顔の下方の矩形のうちの少なくとも1つをさらに含む、請求項1に記載の方法。
- 符号化された前記ビデオフレームを受信機に送信するステップをさらに含み、
ここで、前記メタデータは、逆パッキングを実行して、表示画面上の対応する位置に前記複数の矩形を表示するために前記受信機によって読み取り可能であり、
ここで、前記対応する位置は、顔の左方の位置、顔の右方の位置、顔の上方の位置、または顔の下方の位置のうちの少なくとも1つを含む、請求項1に記載の方法。 - 前記ビデオフレームが第1のビデオフレームであり、方法はさらに、
第2のビデオフレームを含む前記1つまたは複数の後続のフレームをキャプチャするステップと、
前記第2のビデオフレームを含む前記1つまたは複数の後続のフレームの各ビデオフレーム内の動き量が動き量の閾値を満たしたことに応答して、前記第2のビデオフレームを含む前記1つまたは複数の後続のフレームの各ビデオフレームに対して顔検出、パッキング、および符号化を実行するステップと、を含む、請求項1に記載の方法。 - 顔を検出するステップは、ビデオフレーム上で赤緑青(RGB)顔追跡を実行することを含む、請求項1に記載の方法。
- 前記複数の矩形に基づいて1つまたは複数の後続フレームをパッキングすることは、
人の顔を含む前記1つまたは複数の後続のフレームを分割するステップと、
1つまたは複数の後続の矩形を生成するステップと、
前記1つまたは複数の後続の矩形に基づいて前記1つまたは複数の後続のフレームをパッキングするステップと、
パッキングを記述する前記メタデータを使用して、1つまたは複数の後続のビデオフレームを符号化するステップと、を含む、請求項1に記載の方法。 - 1つまたは複数のコンピュータによる実行時に、前記1つまたは複数のコンピュータに処理を実行させる命令が格納された非一時的なコンピュータ可読記憶媒体であって、前記処理は、
人の顔を含むビデオフレームをキャプチャするステップと、
前記ビデオフレーム内の顔を検出するステップと、
前記ビデオフレームを複数の矩形に分割するステップと、前記複数の矩形は、顔に対応する画素を有する顔矩形を含んでおり、
前記複数の矩形に基づいて前記ビデオフレームをパッキングするステップと、ここで、前記複数の矩形の他の矩形と比較して、パッキングされた前記ビデオフレーム内のより多数の画素が、前記顔矩形に割り当てられ、前記ビデオフレームをパッキングする前記ステップは、パッキングを記述するメタデータを生成することを含み、前記メタデータは、パッキングする前記ステップの前の前記ビデオフレーム内の顔の中心の位置である顔変換の中心と、パッキングする前記ステップの前の前記顔矩形のサイズである顔変換のx/yスケールとを記述し、
複数の前記ビデオフレーム間の顔の動きが動きの量の閾値を下回っている限り、前記メタデータを再計算することなく、前記複数の矩形に基づいて1つまたは複数の後続フレームをパッキングすることによってパッキングを継続するステップと、
パッキングされた前記ビデオフレームを符号化するステップと、を含み、ここで、符号化された前記ビデオフレームは、パッキングを記述する前記メタデータを含んでいる、コンピュータ可読記憶媒体。 - 前記メタデータは、前記顔矩形の中心およびスケールの記述を含む、請求項10に記載のコンピュータ可読記憶媒体。
- 前記処理がさらに、前記ビデオフレームをパッキングした後、前記複数の矩形の各々の周囲にパディング画素を追加するステップをさらに含む、請求項10に記載のコンピュータ可読記憶媒体。
- 前記複数の矩形が、顔の左方の矩形、顔の右方の矩形、顔の上方の矩形、または顔の下方の矩形のうちの少なくとも1つをさらに含む、請求項10に記載のコンピュータ可読記憶媒体。
- システムであって、
1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサによる実行時に、前記1つまたは複数のプロセッサに処理を実行させる命令を格納するメモリと、を備え、前記処理は、
人の顔を含むビデオフレームをキャプチャするステップと、
前記ビデオフレーム内の顔を検出するステップと、
前記ビデオフレームを複数の矩形に分割するステップと、前記複数の矩形は、顔に対応する画素を有する顔矩形を含んでおり、
前記複数の矩形に基づいて前記ビデオフレームをパッキングするステップと、ここで、前記複数の矩形の他の矩形と比較して、パッキングされた前記ビデオフレーム内のより多数の画素が、前記顔矩形に割り当てられ、前記ビデオフレームをパッキングする前記ステップは、パッキングを記述するメタデータを生成することを含み、前記メタデータは、パッキングする前記ステップの前の前記ビデオフレーム内の顔の中心の位置である顔変換の中心と、パッキングする前記ステップの前の前記顔矩形のサイズである顔変換のx/yスケールとを記述し、
複数の前記ビデオフレーム間の顔の動きが動きの量の閾値を下回っている限り、前記メタデータを再計算することなく、前記複数の矩形に基づいて1つまたは複数の後続フレームをパッキングすることによってパッキングを継続するステップと、
パッキングされた前記ビデオフレームを符号化するステップと、を含み、ここで、符号化された前記ビデオフレームは、パッキングを記述する前記メタデータを含んでいる、システム。 - 前記メタデータは、前記顔矩形の中心およびスケールの記述を含む、請求項14に記載のシステム。
- 前記処理がさらに、前記ビデオフレームをパッキングした後、前記複数の矩形の各々の周囲にパディング画素を追加するステップをさらに含む、請求項14に記載のシステム。
- 前記複数の矩形が、顔の左方の矩形、顔の右方の矩形、顔の上方の矩形、または顔の下方の矩形のうちの少なくとも1つをさらに含む、請求項14に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962888414P | 2019-08-16 | 2019-08-16 | |
US62/888,414 | 2019-08-16 | ||
PCT/US2019/059200 WO2021034338A1 (en) | 2019-08-16 | 2019-10-31 | Face-based frame packing for video calls |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022544570A JP2022544570A (ja) | 2022-10-19 |
JP7354417B2 true JP7354417B2 (ja) | 2023-10-02 |
Family
ID=68655676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022509165A Active JP7354417B2 (ja) | 2019-08-16 | 2019-10-31 | ビデオ通話用の顔ベースのフレームパッキング |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220279191A1 (ja) |
EP (1) | EP3811626B1 (ja) |
JP (1) | JP7354417B2 (ja) |
CN (1) | CN114616834B (ja) |
WO (1) | WO2021034338A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11736455B1 (en) * | 2020-07-01 | 2023-08-22 | Amazon Technologies, Inc. | Techniques for performing video-based verification |
CN115968544A (zh) * | 2020-08-24 | 2023-04-14 | 谷歌有限责任公司 | 浏览器中的实时虚拟远程传送 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346145A (ja) | 2002-04-08 | 2003-12-05 | Mitsubishi Electric Information Technology Centre Europa Bv | 画像あるいは一連の画像内の1つあるいは複数の色領域を検出しかつ/または追跡するための方法および装置 |
JP2006197505A (ja) | 2005-01-17 | 2006-07-27 | Sony Corp | カメラ制御装置、カメラシステム、電子会議システムおよびカメラ制御方法 |
JP2013031038A (ja) | 2011-07-29 | 2013-02-07 | Brother Ind Ltd | 通信装置、映像取得方法、及び映像取得プログラム |
WO2019094184A1 (en) | 2017-11-07 | 2019-05-16 | Interdigital Vc Holdings, Inc. | Method, apparatus and stream for encoding/decoding volumetric video |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2395779A (en) * | 2002-11-29 | 2004-06-02 | Sony Uk Ltd | Face detection |
KR100539923B1 (ko) * | 2003-02-10 | 2005-12-28 | 삼성전자주식회사 | 화상통화시 화자의 영상을 구분하여 차등적 부호화할 수있는 비디오 엔코더 및 이를 이용한 비디오신호의 압축방법 |
US9554111B2 (en) * | 2010-03-08 | 2017-01-24 | Magisto Ltd. | System and method for semi-automatic video editing |
US9502073B2 (en) * | 2010-03-08 | 2016-11-22 | Magisto Ltd. | System and method for semi-automatic video editing |
DE102010054494B3 (de) * | 2010-12-14 | 2011-10-20 | Alfelder Kunststoffwerke Herm. Meyer Gmbh | Dichtscheibe zur Induktionsversiegelung eines Behälters |
US20170337711A1 (en) * | 2011-03-29 | 2017-11-23 | Lyrical Labs Video Compression Technology, LLC | Video processing and encoding |
US20150134418A1 (en) * | 2013-11-08 | 2015-05-14 | Chon Hock LEOW | System and Method for Providing Real-time Location Previews |
US20150264404A1 (en) * | 2014-03-17 | 2015-09-17 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
CN103905821A (zh) * | 2014-04-23 | 2014-07-02 | 深圳英飞拓科技股份有限公司 | 能够识别人脸的视频编码方法及装置 |
US10140517B2 (en) * | 2014-08-06 | 2018-11-27 | Dropbox, Inc. | Event-based image classification and scoring |
JP2016143310A (ja) * | 2015-02-04 | 2016-08-08 | ソニー株式会社 | 情報処理装置、画像処理方法及びプログラム |
CN109475294B (zh) * | 2016-05-06 | 2022-08-19 | 斯坦福大学托管董事会 | 用于治疗精神障碍的移动和可穿戴视频捕捉和反馈平台 |
US10264282B2 (en) * | 2016-06-27 | 2019-04-16 | Mediatek Inc. | Method and apparatus of inter coding for VR video using virtual reference frames |
CN106131670B (zh) * | 2016-07-12 | 2019-04-05 | 一块互动(北京)科技有限公司 | 一种自适应视频编码方法及终端 |
KR101969082B1 (ko) * | 2016-10-06 | 2019-04-16 | 주식회사 카이 | 다수의 카메라를 이용한 최적의 구형 영상 획득 방법 |
US10939120B1 (en) * | 2017-12-14 | 2021-03-02 | Amazon Technologies, Inc. | Video upload in limited bandwidth |
CN109063626B (zh) * | 2018-07-27 | 2020-11-03 | 深圳市践一科技有限公司 | 动态人脸识别方法和装置 |
-
2019
- 2019-10-31 US US17/632,455 patent/US20220279191A1/en active Pending
- 2019-10-31 EP EP19809261.1A patent/EP3811626B1/en active Active
- 2019-10-31 CN CN201980101670.3A patent/CN114616834B/zh active Active
- 2019-10-31 WO PCT/US2019/059200 patent/WO2021034338A1/en unknown
- 2019-10-31 JP JP2022509165A patent/JP7354417B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346145A (ja) | 2002-04-08 | 2003-12-05 | Mitsubishi Electric Information Technology Centre Europa Bv | 画像あるいは一連の画像内の1つあるいは複数の色領域を検出しかつ/または追跡するための方法および装置 |
JP2006197505A (ja) | 2005-01-17 | 2006-07-27 | Sony Corp | カメラ制御装置、カメラシステム、電子会議システムおよびカメラ制御方法 |
JP2013031038A (ja) | 2011-07-29 | 2013-02-07 | Brother Ind Ltd | 通信装置、映像取得方法、及び映像取得プログラム |
WO2019094184A1 (en) | 2017-11-07 | 2019-05-16 | Interdigital Vc Holdings, Inc. | Method, apparatus and stream for encoding/decoding volumetric video |
Non-Patent Citations (1)
Title |
---|
Mingliang Chen; Weiyao Lin; Xiaozhen Zheng; Xu Chen,A New Algorithm for Compressing Massive Region-of-Interest Location Information in Videos,2013 IEEE International Conference on Multimedia and Expo Workshops (ICMEW),米国,IEEE,2013年07月15日,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6618444 |
Also Published As
Publication number | Publication date |
---|---|
JP2022544570A (ja) | 2022-10-19 |
US20220279191A1 (en) | 2022-09-01 |
EP3811626A1 (en) | 2021-04-28 |
CN114616834B (zh) | 2024-04-02 |
CN114616834A (zh) | 2022-06-10 |
EP3811626B1 (en) | 2022-12-07 |
WO2021034338A1 (en) | 2021-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10515480B1 (en) | Automated three dimensional model generation | |
KR102387566B1 (ko) | 경계 아티팩트들을 방지하는 시스템 및 방법 | |
CN116342622A (zh) | 视频流的图像分割和修改 | |
JP7354417B2 (ja) | ビデオ通話用の顔ベースのフレームパッキング | |
JP2018537748A (ja) | 可変の計算量を用いた画像のライトフィールドレンダリング | |
US11949848B2 (en) | Techniques to capture and edit dynamic depth images | |
WO2022104026A1 (en) | Consistency measure for image segmentation processes | |
US11223792B2 (en) | Summing-up video frames to enhance image brightness | |
KR20240008915A (ko) | 모션 블러 완화를 위한 선택적 이미지 피라미드 계산 | |
US20220172440A1 (en) | Extended field of view generation for split-rendering for virtual reality streaming | |
KR20240009993A (ko) | 멀티레벨 특징 추적을 위한 직접 스케일 레벨 선택 | |
US11373273B2 (en) | Method and device for combining real and virtual images | |
KR102559721B1 (ko) | 사용자의 시야 영역에 따라 영상을 선택적으로 복원하는 전자 장치의 제어 방법 | |
US11869274B2 (en) | Face-based frame rate upsampling for video calls | |
WO2018214492A1 (zh) | 用户体验数据的处理方法、装置、电子设备和计算机存储介质 | |
WO2018123202A1 (ja) | 動画像処理装置、表示装置、動画像処理方法、および制御プログラム | |
WO2021237736A1 (zh) | 图像处理方法、装置和系统,计算机可读存储介质 | |
US20240112358A1 (en) | Deep learning model for high resolution predictions | |
CN110753931A (zh) | 基于面部特征点的点头动作识别的系统和方法 | |
US20240135673A1 (en) | Machine learning model training using synthetic data for under-display camera (udc) image restoration | |
US20240119570A1 (en) | Machine learning model training using synthetic data for under-display camera (udc) image restoration | |
US11323682B2 (en) | Electronic device, content processing device, content processing system, image data output method, and image processing method | |
WO2023069124A1 (en) | Image light redistribution based on machine learning models | |
CN117135330A (zh) | 模型训练以及图像处理方法、装置和电子设备 | |
CN117882374A (zh) | 用于图像中细化图块的渐进渲染的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7354417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |