JP2022546081A - パーソナルデバイスによって支援されるtvストリーミング及びレンダリングコンテンツの中心窩最適化 - Google Patents
パーソナルデバイスによって支援されるtvストリーミング及びレンダリングコンテンツの中心窩最適化 Download PDFInfo
- Publication number
- JP2022546081A JP2022546081A JP2022513488A JP2022513488A JP2022546081A JP 2022546081 A JP2022546081 A JP 2022546081A JP 2022513488 A JP2022513488 A JP 2022513488A JP 2022513488 A JP2022513488 A JP 2022513488A JP 2022546081 A JP2022546081 A JP 2022546081A
- Authority
- JP
- Japan
- Prior art keywords
- display
- video
- roi
- server
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009877 rendering Methods 0.000 title claims description 6
- 238000005457 optimization Methods 0.000 title 1
- 230000006835 compression Effects 0.000 claims abstract description 17
- 238000007906 compression Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 21
- 238000003384 imaging method Methods 0.000 claims description 9
- 238000005094 computer simulation Methods 0.000 claims description 8
- 238000010295 mobile communication Methods 0.000 claims description 4
- 230000001052 transient effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241001112258 Moca Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000001931 thermography Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/193—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4728—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Ophthalmology & Optometry (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Controls And Circuits For Display Device (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
Claims (21)
- 少なくとも1つのディスプレイと、
第1のカメラ及び第2のカメラを含み、前記ディスプレイと前記ディスプレイを閲覧するユーザとの間に配置可能な少なくとも1つのデバイスと、
前記ディスプレイに提示するために圧縮ビデオを送信するように構成された少なくとも1つのサーバと、を備え、
前記デバイスが、
前記第1のカメラを使用して、第1の画像を生成することであって、前記第1の画像が前記ディスプレイの画像を含む、前記第1の画像を生成することと、
前記第2のカメラを使用して、第2の画像を生成することであって、前記第2の画像が前記ユーザの画像を含む、前記第2の画像を生成することと、のために実行可能な命令でプログラムされており、
前記サーバ及び/または前記デバイスが、
前記第1のカメラ及び前記第2のカメラからの前記画像に少なくとも部分的に基づいて、前記ディスプレイでの前記ユーザの注視点(POG)を特定することと、
少なくとも部分的に前記POGに基づいて、前記ビデオの関心領域(ROI)を特定することと、のために実行可能な命令でプログラムされており、
前記サーバが、
前記ビデオを圧縮し、前記ビデオを送信して前記ディスプレイに提示することであって、前記圧縮が、前記ROIが前記ROI外の前記ビデオのエリアよりも高い解像度及び/または画質で前記ディスプレイに提示されるような圧縮である、前記提示することのために実行可能な命令でプログラムされている、
システム。 - 前記デバイスは、モバイル通信デバイスを含む、請求項1に記載のシステム。
- 前記デバイスは、タブレットコンピュータを含む、請求項1に記載のシステム。
- 前記デバイスは、コンピュータシミュレーションコントローラを含む、請求項1に記載のシステム。
- 前記デバイスは、眼鏡を含む、請求項1に記載のシステム。
- 前記サーバは、
前記ROI内のビデオのフレームを、前記ROI外の前記ビデオのフレームのエリアより高度に圧縮しない命令でプログラムされている、請求項1に記載のシステム。 - 前記サーバは、
ビデオの「N」フレームにおいて、前記POGを使用して特定された前記ROIを少なくとも部分的に使用して、それぞれの投機的ROIを特定することであって、「N」がゼロより大きい整数である、前記特定することと、
少なくとも部分的に前記それぞれの投機的ROIに基づいて前記ビデオの「N」フレームを圧縮することと、を行う命令でプログラムされている、請求項1に記載のシステム。 - 少なくとも1つのプロセッサと、
少なくとも1つのコンピュータメモリであって、前記少なくとも1つのコンピュータメモリは、一時的信号ではなく、
デバイス上の第1のカメラを使用してユーザを画像化することであって、前記デバイスはディスプレイ上にない、前記ユーザを画像化することと、
前記デバイス上の第2のカメラを使用して前記ディスプレイを画像化することと、
少なくとも部分的に前記画像に基づいて、前記ディスプレイ上の注視点(POG)を決定することと、
前記POGを少なくとも1つのリモートサーバに送信して、前記サーバが、少なくとも1つのビデオフレームの前記POGに関連する関心領域(ROI)を使用するのを促進することであって、前記少なくとも1つのビデオフレームがまた、前記ROI外の少なくとも1つのエリアを含み、前記サーバが第1の圧縮を使用して前記ROIを圧縮し、第2の圧縮を使用して前記ROI外の前記エリアを圧縮できるようにする、前記促進することと、を行うために、前記少なくとも1つのプロセッサによって実行可能な命令を含む、前記少なくとも1つのコンピュータメモリと、
を備える、システム。 - 前記デバイスは、モバイル通信デバイスを含む、請求項8に記載のシステム。
- 前記デバイスは、タブレットコンピュータを含む、請求項8に記載のシステム。
- 前記デバイスは、コンピュータシミュレーションコントローラを含む、請求項8に記載のシステム。
- 前記デバイスは、眼鏡を含む、請求項8に記載のシステム。
- 前記サーバを備えており、前記サーバは、
前記第1の圧縮を使用して前記ROIを圧縮し、前記第2の圧縮を使用して前記ROI外の前記エリアを圧縮する命令でプログラムされている、請求項8に記載のシステム。 - 前記サーバは、
ビデオの「N」フレームにおいて、前記POGを使用して特定された前記ROIを少なくとも部分的に使用して、それぞれの投機的ROIを特定することであって、「N」がゼロより大きい整数である、前記特定することと、
少なくとも部分的に前記それぞれの投機的ROIに基づいて前記ビデオの「N」フレームを圧縮することと、を行う命令でプログラムされている、請求項13に記載のシステム。 - モバイルデバイスを使用して、ディスプレイを閲覧するユーザの画像を生成することと、
前記モバイルデバイスを使用して、前記ディスプレイの画像を生成することと、
前記画像を使用して、前記ユーザが見ている前記ディスプレイ上の位置を特定することと、
ネットワークを介して、少なくとも1つのサーバまたは少なくとも1つのコンピュータシミュレーションコンソールに、前記位置を送信することと、
を含む、方法。 - 前記サーバまたは前記コンソールは、
ビデオを圧縮し、前記ビデオを送信して前記ディスプレイに提示することであって、前記圧縮は、前記ユーザが見ている前記ディスプレイ上の前記位置に提示されることになるビデオが、前記ユーザが見ている前記ディスプレイ上の前記位置の外側のビデオよりも高い解像度及び/または画質で前記ディスプレイ上に提示されるような圧縮である、前記提示すること、を行う命令でプログラムされている、請求項15に記載の方法。 - 前記モバイルデバイスは、モバイル通信デバイスを含む、請求項15に記載の方法。
- 前記モバイルデバイスは、タブレットコンピュータを含む、請求項15に記載の方法。
- 前記モバイルデバイスは、ビデオゲームコントローラを含む、請求項15に記載の方法。
- 前記サーバまたは前記コンソールは、
ビデオの「N」フレームにおいて、前記ユーザが見ている前記ディスプレイ上の前記位置を少なくとも部分的に使用して、それぞれの投機的関心領域(ROI)を特定することであって、「N」がゼロより大きい整数である、前記特定することと、
少なくとも部分的に前記それぞれの投機的ROIに基づいて前記ビデオの「N」フレームを圧縮することと、を行う命令でプログラムされている、請求項15に記載の方法。 - 前記コンピュータシミュレーションコンソールは、
前記ディスプレイに対する注視点を決定することと、
前記POGを使用して、前記POG外の前記提示されるビデオ画像のレンダリング解像度/レンダリング品質を低減させることと、を行う命令でプログラムされている、請求項15に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/556,127 US11106929B2 (en) | 2019-08-29 | 2019-08-29 | Foveated optimization of TV streaming and rendering content assisted by personal devices |
US16/556,127 | 2019-08-29 | ||
PCT/US2020/047992 WO2021041538A2 (en) | 2019-08-29 | 2020-08-26 | Foveated optimization of tv streaming and rendering content assisted by personal devices |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022546081A true JP2022546081A (ja) | 2022-11-02 |
JP7339435B2 JP7339435B2 (ja) | 2023-09-05 |
Family
ID=74679794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022513488A Active JP7339435B2 (ja) | 2019-08-29 | 2020-08-26 | パーソナルデバイスによって支援されるtvストリーミング及びレンダリングコンテンツの中心窩最適化 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11106929B2 (ja) |
EP (1) | EP4022381A4 (ja) |
JP (1) | JP7339435B2 (ja) |
CN (1) | CN114556188A (ja) |
WO (1) | WO2021041538A2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056335A (ja) * | 2002-07-18 | 2004-02-19 | Sony Corp | 情報処理装置および方法、表示装置および方法、並びにプログラム |
WO2014103732A1 (ja) * | 2012-12-26 | 2014-07-03 | ソニー株式会社 | 画像処理装置および画像処理方法、並びにプログラム |
US20180192058A1 (en) * | 2016-12-29 | 2018-07-05 | Sony Interactive Entertainment Inc. | Foveated video link for vr, low latency wireless hmd video streaming with gaze tracking |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6252989B1 (en) * | 1997-01-07 | 2001-06-26 | Board Of The Regents, The University Of Texas System | Foveated image coding system and method for image bandwidth reduction |
US20030067476A1 (en) * | 2001-10-04 | 2003-04-10 | Eastman Kodak Company | Method and system for displaying an image |
US20050018911A1 (en) * | 2003-07-24 | 2005-01-27 | Eastman Kodak Company | Foveated video coding system and method |
US8793620B2 (en) | 2011-04-21 | 2014-07-29 | Sony Computer Entertainment Inc. | Gaze-assisted computer interface |
GB0704421D0 (en) | 2007-03-08 | 2007-04-18 | Mcintosh John R | The fan watch camera |
JP5351006B2 (ja) * | 2009-12-24 | 2013-11-27 | 京セラ株式会社 | 携帯端末及び表示制御プログラム |
US8687840B2 (en) * | 2011-05-10 | 2014-04-01 | Qualcomm Incorporated | Smart backlights to minimize display power consumption based on desktop configurations and user eye gaze |
US9897805B2 (en) | 2013-06-07 | 2018-02-20 | Sony Interactive Entertainment Inc. | Image rendering responsive to user actions in head mounted display |
KR101885295B1 (ko) * | 2011-12-26 | 2018-09-11 | 엘지전자 주식회사 | 전자기기 및 그 제어방법 |
WO2013168171A1 (en) * | 2012-05-10 | 2013-11-14 | Umoove Services Ltd. | Method for gesture-based operation control |
US9996150B2 (en) | 2012-12-19 | 2018-06-12 | Qualcomm Incorporated | Enabling augmented reality using eye gaze tracking |
US20150193658A1 (en) * | 2014-01-09 | 2015-07-09 | Quentin Simon Charles Miller | Enhanced Photo And Video Taking Using Gaze Tracking |
CN103824308A (zh) * | 2014-02-11 | 2014-05-28 | 广州中国科学院先进技术研究所 | 一种无线多媒体传感器网络中的图像处理方法 |
US9934573B2 (en) * | 2014-09-17 | 2018-04-03 | Intel Corporation | Technologies for adjusting a perspective of a captured image for display |
US10567641B1 (en) * | 2015-01-19 | 2020-02-18 | Devon Rueckner | Gaze-directed photography |
US9900602B2 (en) * | 2015-08-20 | 2018-02-20 | Citrix Systems, Inc. | Optimizing remote graphics delivery and presentation |
US10401952B2 (en) | 2016-03-31 | 2019-09-03 | Sony Interactive Entertainment Inc. | Reducing rendering computation and power consumption by detecting saccades and blinks |
US10560680B2 (en) * | 2017-01-28 | 2020-02-11 | Microsoft Technology Licensing, Llc | Virtual reality with interactive streaming video and likelihood-based foveation |
US10643307B2 (en) * | 2017-11-10 | 2020-05-05 | Intel Corporation | Super-resolution based foveated rendering |
US10848768B2 (en) * | 2018-06-08 | 2020-11-24 | Sony Interactive Entertainment Inc. | Fast region of interest coding using multi-segment resampling |
-
2019
- 2019-08-29 US US16/556,127 patent/US11106929B2/en active Active
-
2020
- 2020-08-26 WO PCT/US2020/047992 patent/WO2021041538A2/en unknown
- 2020-08-26 JP JP2022513488A patent/JP7339435B2/ja active Active
- 2020-08-26 CN CN202080071821.8A patent/CN114556188A/zh active Pending
- 2020-08-26 EP EP20857265.1A patent/EP4022381A4/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056335A (ja) * | 2002-07-18 | 2004-02-19 | Sony Corp | 情報処理装置および方法、表示装置および方法、並びにプログラム |
WO2014103732A1 (ja) * | 2012-12-26 | 2014-07-03 | ソニー株式会社 | 画像処理装置および画像処理方法、並びにプログラム |
US20180192058A1 (en) * | 2016-12-29 | 2018-07-05 | Sony Interactive Entertainment Inc. | Foveated video link for vr, low latency wireless hmd video streaming with gaze tracking |
Also Published As
Publication number | Publication date |
---|---|
WO2021041538A2 (en) | 2021-03-04 |
CN114556188A (zh) | 2022-05-27 |
EP4022381A2 (en) | 2022-07-06 |
WO2021041538A3 (en) | 2021-04-01 |
JP7339435B2 (ja) | 2023-09-05 |
EP4022381A4 (en) | 2023-09-06 |
US11106929B2 (en) | 2021-08-31 |
US20210064904A1 (en) | 2021-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10681342B2 (en) | Behavioral directional encoding of three-dimensional video | |
US11050810B2 (en) | Method and apparatus for transmitting and receiving image data for virtual-reality streaming service | |
US11025959B2 (en) | Probabilistic model to compress images for three-dimensional video | |
US10270825B2 (en) | Prediction-based methods and systems for efficient distribution of virtual reality media content | |
US11024083B2 (en) | Server, user terminal device, and control method therefor | |
KR101945082B1 (ko) | 미디어 컨텐츠 송신 방법, 미디어 컨텐츠 송신 장치, 미디어 컨텐츠 수신 방법, 및 미디어 컨텐츠 수신 장치 | |
US20160005435A1 (en) | Automatic generation of video and directional audio from spherical content | |
US11635802B2 (en) | Combined light intensity based CMOS and event detection sensor for high speed predictive tracking and latency compensation in virtual and augmented reality HMD systems | |
US20160227280A1 (en) | Content that reacts to viewers | |
KR102164686B1 (ko) | 타일 영상의 영상 처리 방법 및 장치 | |
JP7339435B2 (ja) | パーソナルデバイスによって支援されるtvストリーミング及びレンダリングコンテンツの中心窩最適化 | |
US10425696B2 (en) | User placement of closed captioning | |
US10805676B2 (en) | Modifying display region for people with macular degeneration | |
US10650702B2 (en) | Modifying display region for people with loss of peripheral vision | |
US20190018640A1 (en) | Moving audio from center speaker to peripheral speaker of display device for macular degeneration accessibility | |
US11863902B2 (en) | Techniques for enabling high fidelity magnification of video | |
US11431952B2 (en) | User selection of virtual camera location to produce video using synthesized input from multiple cameras | |
KR102114466B1 (ko) | 영상 컨텐츠 내 관심 영역 정보를 이용한 영상 디스플레이 방법 및 장치 | |
US20230222754A1 (en) | Interactive video playback techniques to enable high fidelity magnification | |
US20240094977A1 (en) | Field of vision audio control for physical or mix of physical and extended reality media displays in a spatially mapped space | |
CN116418937A (zh) | 视频分辨率调整方法、装置、存储介质以及电子设备 | |
JP2024532717A (ja) | Vr放送ストリームを通じたテレプレゼンス |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230824 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7339435 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |