JP2022544570A - ビデオ通話用の顔ベースのフレームパッキング - Google Patents
ビデオ通話用の顔ベースのフレームパッキング Download PDFInfo
- Publication number
- JP2022544570A JP2022544570A JP2022509165A JP2022509165A JP2022544570A JP 2022544570 A JP2022544570 A JP 2022544570A JP 2022509165 A JP2022509165 A JP 2022509165A JP 2022509165 A JP2022509165 A JP 2022509165A JP 2022544570 A JP2022544570 A JP 2022544570A
- Authority
- JP
- Japan
- Prior art keywords
- rectangles
- face
- video
- video frame
- packing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012856 packing Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000015654 memory Effects 0.000 claims description 33
- 238000001514 detection method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 description 21
- 210000000887 face Anatomy 0.000 description 21
- 238000012549 training Methods 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000001815 facial effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000010267 cellular communication Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234345—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Abstract
Description
図1は、符号化されたビデオが生成される例示的な環境100のブロック図を示す。図示の環境100は、ビデオサーバ101、ユーザデバイス115a、115n、およびネットワーク105を含む。ユーザ125a、125nは、個々のユーザデバイス115a、115nに関連付けられ得る。いくつかの実施形態では、環境100は、図1に示されていない他のサーバまたはデバイスを含み得る。図1および残りの図では、参照番号の後の文字、例えば「115a」は、その特定の参照番号を有する構成要素への参照を表している。本文中の参照番号に続く文字のないもの、例えば「115」は、その参照番号を有する構成要素の実施形態への一般的な参照を表す。
図2は、符号化されたビデオを生成する例示的なコンピューティングデバイス200のブロック図を示す。コンピューティングデバイス200は、ユーザデバイス115またはビデオサーバ101であり得る。コンピューティングデバイス200は、プロセッサ235、メモリ237、通信ユニット239、カメラ241、ディスプレイ243、およびストレージデバイス247を含み得る。コンピューティングデバイス200の種類に応じて、追加の構成要素が存在してもよく、また、従前の構成要素の一部が省略されてもよい。ビデオアプリケーション103は、メモリ237に格納され得る。いくつかの実施形態では、コンピューティングデバイス200は、電池など、図面に記載されていない他の構成要素を含み得る。コンピューティングデバイス200の構成要素は、バス220によって通信可能に接続され得る。バス220は、コンピューティングデバイス200の様々な部分の間で信号を伝送する通信バスであり得る。
図4は、ビデオを符号化するための例示的な方法400のフローチャートを示す。方法400は、ユーザデバイス115、ビデオサーバ101、または部分的にユーザデバイス115および部分的にビデオサーバ101などのコンピューティングデバイス200に格納されたビデオアプリケーション103によって実行される。
Claims (20)
- ビデオを符号化する方法であって、
人の顔を含むビデオフレームをキャプチャするステップと、
前記ビデオフレーム内の顔を検出するステップと、
前記ビデオフレームを複数の矩形に分割するステップと、前記複数の矩形は、顔に対応する画素を有する顔矩形を含んでおり、
前記複数の矩形に基づいて前記ビデオフレームをパッキングするステップと、ここで、前記複数の矩形の他の矩形と比較して、パッキングされた前記ビデオフレーム内のより多数の画素が、前記顔矩形に割り当てられ、
パッキングされた前記ビデオフレームを符号化するステップと、を含み、ここで、符号化された前記ビデオフレームは、パッキングを記述するメタデータを含んでいる、方法。 - 前記メタデータは、前記顔矩形の中心およびスケールの記述を含む、請求項1に記載の方法。
- 前記メタデータは、顔変換の中心および顔変換のx/yスケールを記述する、請求項1に記載の方法。
- 前記ビデオフレームをパッキングした後、前記複数の矩形の各々の周囲にパディング画素を追加するステップをさらに含む、請求項1に記載の方法。
- 前記ビデオフレームをパッキングするステップは、前記ビデオフレームをソーステクスチャとして使用することを含む、請求項1に記載の方法。
- 前記複数の矩形が、顔の左方の矩形、顔の右方の矩形、顔の上方の矩形、または顔の下方の矩形のうちの少なくとも1つをさらに含む、請求項1に記載の方法。
- 符号化された前記ビデオフレームを受信機に送信するステップをさらに含み、
ここで、前記メタデータは、逆パッキングを実行して、表示画面上の対応する位置に前記複数の矩形を表示するために前記受信機によって読み取り可能であり、
ここで、対応する位置は、顔の左方の位置、顔の右方の位置、顔の上方の位置、または顔の下方の位置のうちの少なくとも1つを含む、請求項1に記載の方法。 - 前記ビデオフレームが第1のビデオフレームであり、方法はさらに、
n-1番目のビデオフレームを介して第2のビデオフレームをキャプチャするステップと、
n-1番目のビデオフレームを介した前記第2のビデオフレームの各ビデオフレーム内の動き量が動き量の閾値を満たしたことに応答して、n-1番目のビデオフレームを介した前記第2のビデオフレームの各ビデオフレームに対して顔検出、パッキング、および符号化を実行するステップと、を含む、請求項1に記載の方法。 - 顔を検出するステップは、ビデオフレーム上で赤緑青(RGB)顔追跡を実行することを含む、請求項1に記載の方法。
- 前記ビデオフレームが第1のビデオフレームであり、方法はさらに
人の顔を含む後続のフレームを分割するステップと、
後続の複数の矩形を生成するステップと、
前記後続の複数の矩形に基づいて前記後続のフレームをパッキングするステップと、
パッキングを記述する前記メタデータを使用して、前記後続のビデオフレームを符号化するステップと、を含む、請求項1に記載の方法。 - 1つまたは複数のコンピュータによる実行時に、前記1つまたは複数のコンピュータに処理を実行させる命令が格納された非一時的なコンピュータ可読媒体であって、前記処理は、
人の顔を含むビデオフレームをキャプチャするステップと、
前記ビデオフレーム内の顔を検出するステップと、
前記ビデオフレームを複数の矩形に分割するステップと、前記複数の矩形は、顔に対応する画素を有する顔矩形を含んでおり、
前記複数の矩形に基づいて前記ビデオフレームをパッキングするステップと、ここで、前記複数の矩形の他の矩形と比較して、パッキングされた前記ビデオフレーム内のより多数の画素が、前記顔矩形に割り当てられ、
パッキングされた前記ビデオフレームを符号化するステップと、を含み、ここで、符号化された前記ビデオフレームは、パッキングを記述するメタデータを含んでいる、コンピュータ可読媒体。 - 前記メタデータは、前記顔矩形の中心およびスケールの記述を含む、請求項11に記載のコンピュータ可読媒体。
- 前記メタデータは、顔変換の中心および顔変換のx/yスケールを記述する、請求項11に記載のコンピュータ可読媒体。
- 前記処理がさらに、前記ビデオフレームをパッキングした後、前記複数の矩形の各々の周囲にパディング画素を追加するステップをさらに含む、請求項11に記載のコンピュータ可読媒体。
- 前記複数の矩形が、顔の左方の矩形、顔の右方の矩形、顔の上方の矩形、または顔の下方の矩形のうちの少なくとも1つをさらに含む、請求項11に記載のコンピュータ可読媒体。
- システムであって、
1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサによる実行時に、前記1つまたは複数のプロセッサに処理を実行させる命令を格納するメモリと、を備え、前記処理は、
人の顔を含むビデオフレームをキャプチャするステップと、
前記ビデオフレーム内の顔を検出するステップと、
前記ビデオフレームを複数の矩形に分割するステップと、前記複数の矩形は、顔に対応する画素を有する顔矩形を含んでおり、
前記複数の矩形に基づいて前記ビデオフレームをパッキングするステップと、ここで、前記複数の矩形の他の矩形と比較して、パッキングされた前記ビデオフレーム内のより多数の画素が、前記顔矩形に割り当てられ、
パッキングされた前記ビデオフレームを符号化するステップと、を含み、ここで、符号化された前記ビデオフレームは、パッキングを記述するメタデータを含んでいる、システム。 - 前記メタデータは、前記顔矩形の中心およびスケールの記述を含む、請求項16に記載のシステム。
- 前記メタデータは、顔変換の中心および顔変換のx/yスケールを記述する、請求項16に記載のシステム。
- 前記処理がさらに、前記ビデオフレームをパッキングした後、前記複数の矩形の各々の周囲にパディング画素を追加するステップをさらに含む、請求項16に記載のシステム。
- 前記複数の矩形が、顔の左方の矩形、顔の右方の矩形、顔の上方の矩形、または顔の下方の矩形のうちの少なくとも1つをさらに含む、請求項16に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962888414P | 2019-08-16 | 2019-08-16 | |
US62/888,414 | 2019-08-16 | ||
PCT/US2019/059200 WO2021034338A1 (en) | 2019-08-16 | 2019-10-31 | Face-based frame packing for video calls |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022544570A true JP2022544570A (ja) | 2022-10-19 |
JP7354417B2 JP7354417B2 (ja) | 2023-10-02 |
Family
ID=68655676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022509165A Active JP7354417B2 (ja) | 2019-08-16 | 2019-10-31 | ビデオ通話用の顔ベースのフレームパッキング |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220279191A1 (ja) |
EP (1) | EP3811626B1 (ja) |
JP (1) | JP7354417B2 (ja) |
CN (1) | CN114616834B (ja) |
WO (1) | WO2021034338A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11736455B1 (en) * | 2020-07-01 | 2023-08-22 | Amazon Technologies, Inc. | Techniques for performing video-based verification |
CN115968544A (zh) * | 2020-08-24 | 2023-04-14 | 谷歌有限责任公司 | 浏览器中的实时虚拟远程传送 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346145A (ja) * | 2002-04-08 | 2003-12-05 | Mitsubishi Electric Information Technology Centre Europa Bv | 画像あるいは一連の画像内の1つあるいは複数の色領域を検出しかつ/または追跡するための方法および装置 |
JP2006197505A (ja) * | 2005-01-17 | 2006-07-27 | Sony Corp | カメラ制御装置、カメラシステム、電子会議システムおよびカメラ制御方法 |
JP2013031038A (ja) * | 2011-07-29 | 2013-02-07 | Brother Ind Ltd | 通信装置、映像取得方法、及び映像取得プログラム |
WO2019094184A1 (en) * | 2017-11-07 | 2019-05-16 | Interdigital Vc Holdings, Inc. | Method, apparatus and stream for encoding/decoding volumetric video |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2395779A (en) * | 2002-11-29 | 2004-06-02 | Sony Uk Ltd | Face detection |
KR100539923B1 (ko) * | 2003-02-10 | 2005-12-28 | 삼성전자주식회사 | 화상통화시 화자의 영상을 구분하여 차등적 부호화할 수있는 비디오 엔코더 및 이를 이용한 비디오신호의 압축방법 |
US9554111B2 (en) * | 2010-03-08 | 2017-01-24 | Magisto Ltd. | System and method for semi-automatic video editing |
US9502073B2 (en) * | 2010-03-08 | 2016-11-22 | Magisto Ltd. | System and method for semi-automatic video editing |
DE102010054494B3 (de) * | 2010-12-14 | 2011-10-20 | Alfelder Kunststoffwerke Herm. Meyer Gmbh | Dichtscheibe zur Induktionsversiegelung eines Behälters |
US20170337711A1 (en) * | 2011-03-29 | 2017-11-23 | Lyrical Labs Video Compression Technology, LLC | Video processing and encoding |
US20150134418A1 (en) * | 2013-11-08 | 2015-05-14 | Chon Hock LEOW | System and Method for Providing Real-time Location Previews |
US20150264404A1 (en) * | 2014-03-17 | 2015-09-17 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
CN103905821A (zh) * | 2014-04-23 | 2014-07-02 | 深圳英飞拓科技股份有限公司 | 能够识别人脸的视频编码方法及装置 |
US10140517B2 (en) * | 2014-08-06 | 2018-11-27 | Dropbox, Inc. | Event-based image classification and scoring |
JP2016143310A (ja) * | 2015-02-04 | 2016-08-08 | ソニー株式会社 | 情報処理装置、画像処理方法及びプログラム |
CN109475294B (zh) * | 2016-05-06 | 2022-08-19 | 斯坦福大学托管董事会 | 用于治疗精神障碍的移动和可穿戴视频捕捉和反馈平台 |
US10264282B2 (en) * | 2016-06-27 | 2019-04-16 | Mediatek Inc. | Method and apparatus of inter coding for VR video using virtual reference frames |
CN106131670B (zh) * | 2016-07-12 | 2019-04-05 | 一块互动(北京)科技有限公司 | 一种自适应视频编码方法及终端 |
KR101969082B1 (ko) * | 2016-10-06 | 2019-04-16 | 주식회사 카이 | 다수의 카메라를 이용한 최적의 구형 영상 획득 방법 |
US10939120B1 (en) * | 2017-12-14 | 2021-03-02 | Amazon Technologies, Inc. | Video upload in limited bandwidth |
CN109063626B (zh) * | 2018-07-27 | 2020-11-03 | 深圳市践一科技有限公司 | 动态人脸识别方法和装置 |
-
2019
- 2019-10-31 US US17/632,455 patent/US20220279191A1/en active Pending
- 2019-10-31 EP EP19809261.1A patent/EP3811626B1/en active Active
- 2019-10-31 CN CN201980101670.3A patent/CN114616834B/zh active Active
- 2019-10-31 WO PCT/US2019/059200 patent/WO2021034338A1/en unknown
- 2019-10-31 JP JP2022509165A patent/JP7354417B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346145A (ja) * | 2002-04-08 | 2003-12-05 | Mitsubishi Electric Information Technology Centre Europa Bv | 画像あるいは一連の画像内の1つあるいは複数の色領域を検出しかつ/または追跡するための方法および装置 |
JP2006197505A (ja) * | 2005-01-17 | 2006-07-27 | Sony Corp | カメラ制御装置、カメラシステム、電子会議システムおよびカメラ制御方法 |
JP2013031038A (ja) * | 2011-07-29 | 2013-02-07 | Brother Ind Ltd | 通信装置、映像取得方法、及び映像取得プログラム |
WO2019094184A1 (en) * | 2017-11-07 | 2019-05-16 | Interdigital Vc Holdings, Inc. | Method, apparatus and stream for encoding/decoding volumetric video |
Non-Patent Citations (1)
Title |
---|
MINGLIANG CHEN; WEIYAO LIN; XIAOZHEN ZHENG; XU CHEN: "A New Algorithm for Compressing Massive Region-of-Interest Location Information in Videos", 2013 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO WORKSHOPS (ICMEW), JPN6023007686, 15 July 2013 (2013-07-15), US, ISSN: 0005002811 * |
Also Published As
Publication number | Publication date |
---|---|
JP7354417B2 (ja) | 2023-10-02 |
US20220279191A1 (en) | 2022-09-01 |
EP3811626A1 (en) | 2021-04-28 |
CN114616834B (zh) | 2024-04-02 |
CN114616834A (zh) | 2022-06-10 |
EP3811626B1 (en) | 2022-12-07 |
WO2021034338A1 (en) | 2021-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102379640B1 (ko) | 스트리밍 데이터의 인터렉티브 실시간 시각화 | |
CN109716781B (zh) | 用于视频流的实时绘制的系统、装置、介质和方法 | |
CN116342622A (zh) | 视频流的图像分割和修改 | |
US11450085B2 (en) | Binarization of a video stream | |
US11778209B2 (en) | Content-based client side video transcoding | |
US11949848B2 (en) | Techniques to capture and edit dynamic depth images | |
US20220294961A1 (en) | Parallel high dynamic exposure range sensor | |
US11354884B2 (en) | Color extraction of a video stream | |
EP3811626B1 (en) | Face-based frame packing for video calls | |
US11869274B2 (en) | Face-based frame rate upsampling for video calls | |
CN109716770B (zh) | 用于图像压缩的方法和系统以及非暂时性计算机可读介质 | |
WO2018123202A1 (ja) | 動画像処理装置、表示装置、動画像処理方法、および制御プログラム | |
US20240112358A1 (en) | Deep learning model for high resolution predictions | |
JP2021526747A (ja) | 安全かつデバイス間で一貫性のあるビデオ圧縮 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7354417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |