TWI786572B - 沉浸式媒體提供方法、獲取方法、裝置、設備及存儲介質 - Google Patents
沉浸式媒體提供方法、獲取方法、裝置、設備及存儲介質 Download PDFInfo
- Publication number
- TWI786572B TWI786572B TW110109841A TW110109841A TWI786572B TW I786572 B TWI786572 B TW I786572B TW 110109841 A TW110109841 A TW 110109841A TW 110109841 A TW110109841 A TW 110109841A TW I786572 B TWI786572 B TW I786572B
- Authority
- TW
- Taiwan
- Prior art keywords
- resolution
- zoom
- information
- immersive media
- media content
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000003860 storage Methods 0.000 title claims abstract description 36
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 20
- 238000009877 rendering Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000002093 peripheral effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/61—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
- H04L65/612—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/756—Media network packet handling adapting media to device capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/04—Protocols specially adapted for terminals or networks with limited capabilities; specially adapted for terminal portability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2387—Stream processing in response to a playback request from an end-user, e.g. for trick-play
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25808—Management of client data
- H04N21/25825—Management of client data involving client display capabilities, e.g. screen resolution of a mobile phone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25808—Management of client data
- H04N21/25833—Management of client data involving client hardware characteristics, e.g. manufacturer, processing or storage capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Graphics (AREA)
- Library & Information Science (AREA)
- Computer Security & Cryptography (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Container Filling Or Packaging Operations (AREA)
Abstract
一種沉浸式媒體提供方法,由伺服器執行且包括:在沉浸式媒體內容的檔案格式資訊中添加解析度描述資訊和解析度選擇策略資訊;根據所述沉浸式媒體內容的所述解析度描述資訊以及所述解析度選擇策略資訊,確定提供給用戶端的目標解析度;以及向所述用戶端發送所述目標解析度的沉浸式媒體檔案。還提供沉浸式媒體提供裝置、沉浸式媒體獲取方法與裝置、電腦設備及電腦可讀存儲介質。
Description
本揭示係關於音視訊技術領域,特別是關於一種沉浸式媒體提供方法、獲取方法、裝置、設備及存儲介質。
沉浸式媒體(Immersive Media)也稱為浸入式媒體,其目的是通過音視訊技術使使用者產生身臨其境的視聽體驗。
在沉浸式媒體傳輸方案中,業界已支持在伺服器端準備多種不同解析度的檔案軌道,但並未給出該多種不同解析度的檔案軌道的選擇規則。一種方式是隨機選擇某一解析度的檔案軌道下發給用戶端,另一種方式是將多種解析度的檔案軌道全部下發給用戶端。
但是,上述兩種方式均無法兼顧使用者體驗和頻寬資源的利用率。
本揭示實施例提供了一種沉浸式媒體提供方法、獲取方法、裝置、設備及存儲介質,可以根據用戶端能力自我調整地選擇沉浸式媒體內容的解析度,從而在保證用戶體驗的前提下,提升頻寬資源的利用率。所述技術方案如下:
一方面,本揭示實施例提供了一種沉浸式媒體提供方法,由伺服器執行,所述方法包括:在沉浸式媒體內容的檔案格式資訊中添加解析度描述資訊和解析度選擇策略資訊;根據所述沉浸式媒體內容的所述解析度描述資訊以及所述解析度選擇策略資訊,確定提供給所述用戶端的目標解析度;以及向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
另一方面,本揭示實施例提供了一種沉浸式媒體獲取方法,由終端執行,所述方法包括:接收來自伺服器的目標解析度的沉浸式媒體檔案,其中所述沉浸式媒體檔案的沉浸式媒體內容的檔案格式資訊包括解析度描述資訊和解析度選擇策略資訊,所述解析度描述資訊用於定義所述沉浸式媒體內容的候選解析度,所述解析度選擇策略資訊用於定義所述沉浸式媒體內容的解析度選擇策略;以及根據所述檔案格式資訊呈現所述沉浸式媒體檔案。
又一方面,本揭示實施例提供了一種沉浸式媒體提供裝置,包括:添加模組,用於在沉浸式媒體內容的檔案格式資訊中添加解析度描述資訊和解析度選擇策略資訊;解析度選擇模組,用於根據所述沉浸式媒體內容的所述解析度描述資訊以及所述解析度選擇策略資訊,確定提供給用戶端的目標解析度;以及檔案發送模組,用於向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
又一方面,本揭示實施例提供了一種沉浸式媒體獲取裝置,包括:檔案接收模組,用於接收來自伺服器的目標解析度的沉浸式媒體檔案,其中所述沉浸式媒體檔案的沉浸式媒體內容的檔案格式資訊包括解析度描述資訊和解析度選擇策略資訊,所述解析度描述資訊用於定義所述沉浸式媒體內容的候選解析度,所述解析度選擇策略資訊用於定義所述沉浸式媒體內容的解析度選擇策略;以及呈現模組,用於根據所述檔案格式資訊呈現所述沉浸式媒體檔案。
又一方面,本揭示實施例提供了一種電腦設備,所述電腦設備包括處理器和記憶體,所述記憶體中存儲有處理器可執行指令,所述處理器可執行指令由所述處理器執行時,實現上述沉浸式媒體提供方法或沉浸式媒體獲取方法。
所述電腦設備為伺服器或終端。
又一方面,本揭示實施例提供了一種電腦可讀存儲介質,所述電腦可讀存儲介質中存儲有處理器可執行指令,所述處理器可執行指令由一個或一個以上處理器執行時,實現上述沉浸式媒體提供方法。
又一方面,本揭示實施例提供了一種電腦可讀存儲介質,所述電腦可讀存儲介質中存儲有處理器可執行指令,所述處理器可執行指令由一個或一個以上處理器執行時,實現上述沉浸式媒體獲取方法。
又一方面,本揭示實施例提供了一種電腦程式產品,所述電腦程式產品被處理器執行時,用於實現上述沉浸式媒體提供方法。
又一方面,本揭示實施例提供了一種電腦程式產品,所述電腦程式產品被處理器執行時,用於實現上述沉浸式媒體獲取方法。
應當理解的是,以上的一般描述和後文的細節描述僅是示例性和解釋性的,並不能限制本揭示。
這裡將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本揭示相一致的所有實施方式。相反,它們僅是與如所附申請專利範圍中所詳述的、本揭示的一些方面相一致的方法的例子。
本揭示實施例提供的技術方案可應用於任何沉浸式媒體播放場景中,如沉浸式媒體點播或直播場景。
請參考第1圖,其示出了本揭示一個實施例提供的實施環境的示意圖。該實施環境可以實現成為沉浸式媒體播放系統。如第1圖所示,該實施環境可以包括:終端10和伺服器20。
終端10可以是諸如手機、平板電腦、多媒體播放設備、電視機、放映機、顯示器、可穿戴設備、個人電腦(Personal Computer,PC)等電子設備。終端10中可以安裝運行具有沉浸式媒體播放功能的用戶端。例如,該用戶端可以與伺服器20進行交互,從伺服器20請求獲取沉浸式媒體內容,並對該獲取到的沉浸式媒體內容進行播放。
伺服器20用於提供沉浸式媒體內容。伺服器20可以是一台伺服器,也可以是由多台伺服器組成的伺服器集群,或者是一個雲計算服務中心。
終端10和伺服器20之間可通過網路30進行互相通信。該網路30可以是有線網路,也可以是無線網路。
終端10和伺服器20之間還可以包括一個或多個中間節點,如內容傳遞網路(Content Delivery Network,CDN)或其它中繼設備或路由設備,本揭示實施例對此不作限定。
如第2圖所示,其示出了沉浸式媒體播放系統的端到端處理流程的示意圖。該處理流程可以包括:內容獲取與製作21、沉浸媒體編碼/檔案封裝22、沉浸媒體傳輸23、沉浸媒體解碼/檔案解封裝24、沉浸媒體渲染25等主要技術環節。其中,內容獲取與製作21、沉浸媒體編碼/檔案封裝22、沉浸媒體傳輸23等技術環節可以由伺服器執行,沉浸媒體解碼/檔案解封裝24、沉浸媒體渲染25等技術環節可以由終端(如用戶端)執行。
如第3圖所示,其示出了沉浸式媒體播放系統的系統處理架構的示意圖,包括從伺服器31到終端32(用戶端)的沉浸式媒體內容的處理及表述、檔案格式和傳輸信令。
現實世界的聲音-視覺場景通過音訊感測器、攝像設備(如普通攝像頭、立體攝像頭、光場攝像頭)以及傳感設備(如包括雷射雷達)採集,轉化為一系列的資料信號後製作成虛擬實境內容呈現給使用者觀看。攝像設備部署在特定的位置獲取一定空間內視訊/圖像內容,音訊可以通過不同的麥克風配置來獲取,視訊/圖像和音訊在時間和空間內保持同步。對於視訊/圖像內容製作,可分為3DoF(Degree of Freedom,自由度)及3DoF+視訊製作和6DoF視訊製作。其中,DoF是指用戶在觀看沉浸式媒體時支援的運動並產生內容交互的自由度。
3DoF視訊製作由一組攝像機或一個帶有多個攝像頭和感測器的攝像設備錄製而成。攝像頭通常可以獲取在設備中心周圍所有方向的內容。
3DoF+視訊製作結合3DoF視訊與深度資訊製作而成。
6DoF視訊製作主要由相機陣列拍攝得到的點雲、光場等形式的內容製作而成。6DoF媒體需要在編碼前進行特定處理,例如點雲媒體在編碼前需要切割、映射等過程。
採集的音訊/視訊被編碼成相應音視訊碼流,當使用點雲資料或光場資訊表示採集視訊,需要採用其對應的編碼方式(如點雲編碼)。然後,按一定格式(如ISO基媒體檔案格式(ISO Base Media File Format,ISOBMFF)或者其它國際標準體系)將編碼的媒體封裝在檔案容器中並結合媒體的描述資訊/結合描述媒體內容屬性的中繼資料和視窗中繼資料,根據一個特定的媒體檔案格式組成一個媒體檔案或者組成一個初始化片段和媒體片段。
在伺服器31中,存儲了媒體呈現描述/信令資訊和媒體檔案資源。媒體呈現描述/信令資訊給用戶端提供了足夠的通知資訊,使得對應的媒體內容在一種傳輸機制下被交付到播放器並進行消費。用戶端可以根據終端狀態,例如頭部/眼部/位置追蹤、網路輸送量等,通過品質/視點自我調整動態請求媒體檔案資源。
媒體檔案通過傳輸機制,例如動態自我調整流媒體傳輸(Dynamic Adaptive Streaming over HTTP,DASH)、智能媒體傳輸(Smart Media Transport,SMT)傳輸給使用者終端32。使用者終端32接收到媒體檔案後,對檔案進行解封裝、解碼、拼接/合成、渲染等一系列處理後可顯示虛擬實境內容。
如第4圖所示,其示出了基於沉浸式媒體應用的用戶端參考模型的示意圖,其定義了用戶端的各功能組件。
使用者終端通過遠端伺服器推薦或使用者自己需求的方式對媒體檔案選擇,從遠端伺服器下載或接收遠端伺服器推送的媒體檔案,經過並由解析器41、解碼器42、轉換器43、渲染器44等一系列元件進行處理後,實現虛擬實境媒體內容的顯示。同時,使用者終端可以依據使用者需求進行遠端渲染。
解析器41:解析器41提供對媒體檔案或分片的處理,提取基本流以及解析中繼資料,解析出的中繼資料用於渲染。解析器41可依據使用者動作進行動態的資訊處理(如用戶頭動、位置的跟蹤資訊),如動態選擇下載的媒體分片。
解碼器42:解碼器42用於解碼解析器41提供的媒體流,並將解碼流輸出到轉換器43。
轉換器43:轉換器43根據解析器41提供的中繼資料,將解碼後的媒體轉換為球形/3D(3 Dimensional,三維)視訊。例如3DoF時將平面影像對應為球形,在基於映射、投影的6DoF處理時將2D(2 Dimensional,二維)資訊流重建成3D資料。如果有必要,可使用解析器41解析轉換的中繼資料。
渲染器44:渲染器44使用解碼的信令、渲染中繼資料、以及視窗的資訊(或者考慮其他的可能的資訊)對視訊/音訊進行渲染。3DoF和3DoF+主要基於當前視點、視差、深度資訊等對球形媒體內容進行渲染,6DoF對當前視點對視窗內的3D媒體內容進行渲染。
傳感裝置45:傳感裝置45依據使用者的移動獲取當前視窗的方向以及使用者的位置資訊,並回饋給使用者終端的解析器41。使用者終端可依據視窗、視窗的方向以及使用者的位置資訊選擇下載適當的媒體,或者解析器41依據視窗、使用者位置資訊選擇適當的媒體檔案。
遠程渲染平台46:遠端渲染平台46部署在遠端伺服器,依據使用者終端回饋的視窗、視窗的方向以及使用者的位置資訊或者媒體檔案中的渲染中繼資料進行渲染,使用者終端依據遠端渲染平台的渲染媒體直接顯示。
另外,在本揭示實施例中,沉浸式媒體的解析度與沉浸式媒體的主觀品質、沉浸式媒體的客觀品質、沉浸式媒體的清晰度等同。
沉浸式媒體的解析度可以包括8K、4K、2K、1080p、720p等多種不同解析度稱謂。上述各種解析度稱謂所代表的典型解析度數值(即水準x垂直方向的像素數)示例性如下表1所示:
表1:解析度介紹
解析度 | 水準x垂直方向的像素數 | 別稱 | 常用設備 |
8K | 7680 x 4320 | 8K UHD | 電視 |
影院4K | 4096 x [垂直不固定] | 4K | 放映機 |
UHD | 3840 x 2160 | 4K,Ultra HD,Ultra-High Definition | 電視,顯示器 |
2K | 2048 x [垂直不固定] | 無 | 放映機 |
1080p | 1920 x 1080 | Full HD,FHD,HD,High Definition | 電視,顯示器 |
720p | 1280 x 720 | HD,High Definition | 電視,顯示器 |
下面將通過幾個實施例,對本揭示技術方案進行詳細的介紹說明。
請參考第5A圖,其示出了本揭示一個實施例提供的沉浸式媒體提供方法的流程圖。該方法可應用於第1圖所示的實施環境中。該方法可以包括如下幾個步驟(501~504):
步驟501,用戶端獲取自身的能力資訊,該能力資訊用於指示用戶端所在設備的沉浸式媒體播放能力。
能力資訊可以包括以下至少一項:設備能力資訊、使用者權限資訊、使用者頻寬資訊。其中,設備能力資訊用於體現用戶端所在設備的處理能力,如沉浸式媒體內容的渲染能力,設備能力資訊可以用於指示用戶端所在設備支援的最大解析度,以此告知伺服器該用戶端所在設備能夠渲染播放的最大解析度。使用者權限資訊用於體現用戶端對應的用戶權限,如用戶端中登錄的使用者帳號的等級和/或權限資訊,使用者權限資訊可以用於指示用戶端對應的用戶權限所支援的最大解析度,以此告知伺服器該用戶端的使用者有權限觀看的最大解析度。使用者頻寬資訊用於體現用戶端的頻寬能力,如使用者頻寬資訊用於指示用戶端對應的用戶頻寬上限。
當然,上述介紹的能力資訊僅是示例性和解釋性的,在一些其它實施例中,能力資訊還可以包括其它資訊,本揭示實施例對此不作限定。例如,能力資訊還可以包括使用者網路資訊,以此告知伺服器該用戶端所使用的網路類型,如蜂窩網路或無線保證(Wireless Fidelity,WiFi)網路。
步驟502,用戶端向伺服器發送能力資訊。
用戶端通過與伺服器之間的網路連接,向伺服器發送能力資訊。相應地,伺服器接收來自用戶端的能力資訊。
另外,能力資訊可以攜帶在請求消息(如沉浸式媒體播放請求,用於請求播放沉浸式媒體內容)中發送,也可以單獨發送,本揭示實施例對此不作限定。
步驟503,伺服器根據沉浸式媒體內容的解析度選擇策略和能力資訊,從沉浸式媒體內容的候選解析度中,確定提供給用戶端的目標解析度。
伺服器端存儲有沉浸式媒體內容,以及該沉浸式媒體內容的解析度選擇策略。該沉浸式媒體內容包括至少一種候選解析度。該沉浸式媒體內容可以包括多種候選解析度,伺服器結合該沉浸式媒體內容的解析度選擇策略和用戶端發送的能力資訊,從該沉浸式媒體內容的多種候選解析度中,確定提供給用戶端的目標解析度。其中,目標解析度可以是該多種候選解析度中的其中一種解析度。
沉浸式媒體內容的解析度選擇策略可以預先設定並存儲在伺服器端。該解析度選擇策略可以是從沉浸式媒體內容的多個候選解析度中,篩選出滿足上述能力資訊要求的候選解析度,然後從該滿足上述能力資訊要求的候選解析度中,選取最大解析度作為目標解析度。
例如,沉浸式媒體內容的候選解析度由大到小包括:8K、4K、2K、1080p和720p。假設用戶端的能力資訊包括:用戶端所在設備支援渲染的最大解析度為4K,用戶端對應的用戶權限為普通權限,該普通權限所支持的最大解析度為2K;則伺服器選擇2K作為目標解析度。
又例如,沉浸式媒體內容的候選解析度由大到小包括:8K、4K、2K、1080p和720p。假設用戶端的能力資訊包括:用戶端所在設備支援渲染的最大解析度為4K,用戶端對應的用戶權限為高級權限,該高級權限所支持的最大解析度為8K,且用戶端對應的用戶頻寬上限為10mbps,該用戶頻寬上限所支持的最大解析度為4K;則伺服器選擇4K作為目標解析度。
步驟504,伺服器向用戶端發送目標解析度的沉浸式媒體檔案。
沉浸式媒體內容可以包括上述多種候選解析度的檔案軌道,伺服器確定出目標解析度之後,將該目標解析度的檔案軌道封裝為沉浸式媒體檔案並下發給用戶端。伺服器通過與用戶端之間的網路連接,向用戶端發送該沉浸式媒體內容的目標解析度的沉浸式媒體檔案。相應地,用戶端接收來自伺服器的目標解析度的沉浸式媒體檔案。
如第5A圖所示,本揭示實施例還包括如下步驟505:
步驟505,用戶端播放目標解析度的沉浸式媒體檔案。
用戶端在接收到目標解析度的沉浸式媒體檔案之後,可以對該沉浸式媒體檔案進行播放。
請參考第5B圖,其示出了本揭示一個實施例提供的沉浸式媒體提供方法的流程圖。該方法可應用於第1圖所示的實施環境中,特別是,可應用於第1圖的伺服器20中。該方法可以包括如下幾個步驟(511~513):
步驟511,在沉浸式媒體內容的檔案格式資訊中添加解析度描述資訊和解析度選擇策略資訊;其中,解析度描述資訊和解析度選擇策略資訊同本揭示其餘的實施例,在此不再贅述。
步驟512,根據所述沉浸式媒體內容的所述解析度描述資訊以及所述解析度選擇策略資訊,確定提供給用戶端的目標解析度;
步驟513,向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
請參考第5C圖,其示出了本揭示一個實施例提供的沉浸式媒體提供方法的流程圖。該方法可應用於第1圖所示的實施環境中,特別是,可應用於第1圖的終端10中。所述方法包括如下幾個步驟(521~522):
步驟521,接收來自伺服器的目標解析度的沉浸式媒體檔案,所述沉浸式媒體檔案的沉浸式媒體內容的檔案格式資訊包括解析度描述資訊和解析度選擇策略資訊,其中,所述解析度描述資訊用於定義所述沉浸式媒體內容的候選解析度,所述解析度選擇策略資訊用於定義所述沉浸式媒體內容的解析度選擇策略;
步驟522,根據所述檔案格式資訊呈現所述沉浸式媒體檔案。
綜上所述,本揭示實施例提供的技術方案,通過根據用戶端的能力資訊和沉浸式媒體內容的解析度選擇策略,從沉浸式媒體內容的候選解析度中,選擇目標解析度的沉浸式媒體檔案發送給用戶端;提供了一種根據用戶端能力自我調整地選擇沉浸式媒體內容的解析度的技術方案,能夠實現從滿足用戶端能力資訊要求的候選解析度中,選擇最大解析度提供給用戶端,從而在保證用戶體驗的前提下,提升頻寬資源的利用率。
為了實現上述第5A圖-第5C圖實施例所介紹的功能,需要定義沉浸式媒體內容的解析度選擇策略和候選解析度。在示例性實施例中,沉浸式媒體內容的檔案格式資訊包括:解析度選擇策略資訊和解析度描述資訊。其中,解析度選擇策略資訊用於定義沉浸式媒體內容的解析度選擇策略,解析度描述資訊用於定義沉浸式媒體內容的候選解析度。針對不同的沉浸式媒體內容,可以在其檔案格式資訊中分別定義不同的解析度選擇策略和/或定義不同的候選解析度,從而提升針對不同沉浸式媒體內容進行解析度自我調整選擇時的靈活性。
在示例性實施例中,解析度選擇策略資訊包括:縮放策略類型欄位,用於指示沉浸式媒體內容所採用的解析度選擇策略的類型(或稱為標識)。當該縮放策略類型欄位取不同的值時,表示採用不同的解析度選擇策略。各種解析度選擇策略對應的值可以進行預定義或預配置,本揭示實施例對此不作限定。
例如,縮放策略類型欄位的值為第一數值,表示解析度選擇策略為設備能力允許條件下,觀看品質優先;縮放策略類型欄位的值為第二數值,表示解析度選擇策略為設備能力允許條件下,用戶頻寬限制內觀看品質優先。示例性地,第一數值為0,第二數值為1。當然,上述介紹的解析度選擇策略僅是示例性和解釋性的,在本揭示實施例中,對解析度選擇策略的數量、內容及對應的值均不作限定,這可以結合實際情況進行靈活設定。
解析度選擇策略資訊還可以包括:縮放策略描述欄位,用於提供解析度選擇策略的文本描述。縮放策略類型欄位所指示的解析度選擇策略,可能會需要用到一些描述資訊,如使用者頻寬限制等,這些描述資訊可以在縮放策略描述欄位中進行說明。解析度選擇策略資訊還可以包括:縮放策略描述長度欄位,用於指示縮放策略描述欄位中的文本描述的長度。
在示例性實施例中,解析度描述資訊包括:數量指示欄位和縮放比例指示欄位。數量指示欄位用於指示沉浸式媒體內容包括的縮放區域的數量,縮放比例指示欄位用於指示縮放區域的縮放比例。其中,不同的縮放區域對應於不同的候選解析度。同一個全方向的沉浸式媒體內容(如全方向視訊)的球面區域或投影圖像上的2D區域,其可能存在一個或者多個縮放區域,其中,不同縮放區域的視訊資料具有不同的解析度或品質。上述縮放比例是指縮放區域相對於原始區域(也即上述球面區域或2D區域)的縮放比例。
縮放比例指示欄位取不同的值時,表示不同的縮放比例。各種縮放比例對應的值可以進行預定義或預配置,本揭示實施例對此不作限定。例如,縮放比例指示欄位的值為0,表示縮放區域相對於原始區域未進行縮放;縮放比例指示欄位的值為1,表示縮放區域在寬、高上分別為原始區域的1/2;縮放比例指示欄位的值為2,表示縮放區域在寬、高上分別為原始區域的1/4;縮放比例指示欄位的值為3,表示縮放區域在寬、高上分別為原始區域的1/6;縮放比例指示欄位的值為4,表示縮放區域在寬、高上分別為原始區域的1/8。當然,上述介紹的縮放比例僅是示例性和解釋性的,在本揭示實施例中,對縮放比例的數量、取值及對應的值均不作限定,這可以結合實際情況進行靈活設定。
解析度描述資訊還包括以下欄位中的至少一種:縮放演算法類型欄位、縮放符號類型欄位、縮放區欄位型別欄位,以及縮放區域描述欄位。縮放演算法類型欄位用於指示縮放區域的縮放演算法類型,縮放符號類型欄位用於指示縮放區域的邊界符號類型,縮放區欄位型別欄位用於指示縮放區域的類型,縮放區域描述欄位用於提供縮放區域的文本描述。
下面,以擴展ISOBMFF數據盒的形式舉例,對沉浸式媒體內容的解析度選擇策略和候選解析度的定義方式進行介紹說明。沉浸式媒體內容的檔案格式資訊可以包括如下的縮放區域結構:
aligned(8) class RegionWiseZoomingStruct() {
unsigned int(8) num_regions;
unsigned int(8) zoom_strategy_type;
unsigned int(8) zoom_ strategy_description_length;
string zoom_strategy_description;
for (i = 0; i < num_regions; i++) {
unsigned int(32) zoom_reg_width[i];
unsigned int(32) zoom_reg_height[i];
unsigned int(32) zoom_reg_top[i];
unsigned int(32) zoom_reg_left[i];
unsigned int(8) zoom_ratio;
unsigned int(8) zoom_algorithm_type;
unsigned int(8) zoom_symbolization_type;
unsigned int(8) zoom_area_type;
string zoom_description;
}
}
縮放區域結構RegionWiseZoomingStruct中各欄位語義如下:
num_regions:即上文介紹的數量指示欄位,用於指示沉浸式媒體內容包括的縮放區域的數量。例如,該欄位可以指示對應于同一個全方向視訊的球面區域或投影圖像上的2D區域的縮放區域的數量。可能存在一個或者多個縮放區域,其中,不同縮放區域的視訊資料具有不同的解析度或品質。
zoom_strategy_type:即上文介紹的縮放策略類型欄位,用於指示沉浸式媒體內容所採用的解析度選擇策略。例如,該欄位可以指示選擇不同解析度或品質的縮放區域的策略類型,示例可以如下表2所示:
表2:縮放策略類型欄位
取值 | 描述 |
0 | 解析度選擇策略為設備能力允許條件下,觀看品質優先 |
1 | 解析度選擇策略為設備能力允許條件下,用戶頻寬限制內觀看品質優先 |
2~255 | 未定義 |
zoom_ strategy_description_length:即上文介紹的縮放策略描述長度欄位,用於指示縮放策略描述欄位中的文本描述的長度。例如,該欄位可以指示縮放策略描述部分的長度,以位元組為單位。
zoom_strategy_description:即上文介紹的縮放策略描述欄位,用於提供解析度選擇策略的文本描述。例如,該欄位可以是以空字元結尾的UTF-8字串,提供縮放策略(即解析度選擇策略)的文本描述。
zoom_reg_width[i]、zoom_reg_height[i]、zoom_reg_top[i]、zoom_reg_left[i]:分別定義第i個縮放區域的寬、高、垂直偏移和水準偏移,i為正整數。
zoom_ratio:即上文介紹的縮放比例指示欄位,用於指示縮放區域的縮放比例。該欄位允許選取的數值,指示系統支援的不同縮放比例。示例性地,該欄位的值與縮放比例之間的對應關係可以如下表3所示:
表3:縮放比例指示欄位
取值 | 描述 |
0 | 表示縮放區域相對於原始區域未進行縮放 |
1 | 表示縮放區域在寬、高上分別為原始區域的1/2 |
2 | 表示縮放區域在寬、高上分別為原始區域的1/4 |
3 | 表示縮放區域在寬、高上分別為原始區域的1/6 |
4 | 表示縮放區域在寬、高上分別為原始區域的1/8 |
5~255 | 未定義 |
為便於理解上述縮放比例指示欄位在實際應用中的取值,做如下舉例說明:
假設原始視訊軌道A對應8K解析度,即7680 x 4320解析度,則該原始視訊軌道A對應的zoom_ratio為0。
假設通過視訊降採樣後,得到4K(3840 x 2160)解析度和1080p(1920 x 1080)解析度的視訊軌道B與C。由7680 x 4320、3840 x 2160、1920 x 1080的數學關係不難得知,視訊軌道B對應的縮放區域在寬、高分別為原始區域的1/2,視訊軌道C對應的縮放區域在寬、高分別為原始區域的1/4。因此,視訊軌道B對應的zoom_ratio為1,視訊軌道C對應的zoom_ratio為2。
假設通過視訊降採樣後,得到影院4K(假設為4096 x 2160)解析度和2K(假設為2048 x 1080)解析度的視訊軌道B與C。此時,即使B與C對應的縮放區域的寬、高在數學上並不嚴格等於原始區域的1/2與1/4。但為了避免窮舉,認為視訊軌道B與視訊軌道C在寬、高上近似為原始視訊的1/2與1/4。此時視訊軌道B對應的zoom_ratio依然為1,視訊軌道C對應的zoom_ratio依然為2。
zoom_algorithm_type:即上文介紹的縮放演算法類型欄位,用於指示縮放區域的縮放演算法類型。
zoom_symbolization_type:即上文介紹的縮放符號類型欄位,用於指示縮放區域的邊界符號類型。
zoom_area_type:即上文介紹的縮放區欄位型別欄位,用於指示縮放區域的類型。示例性地,該欄位的值與縮放區欄位型別之間的對應關係可以如下表4所示:
表4:縮放區欄位型別欄位
取值 | 描述 |
0 | 導演剪輯的縮放區域,即根據內容提供者的創作意圖縮放視訊 |
1 | 根據觀看統計資料的測量結果選擇的縮放區域 |
2~239 | 保留 |
240~255 | 未定義 |
zoom_description:即上文介紹的縮放區域描述欄位,以空字元結尾的UTF-8字串,用於提供縮放區域的文本描述。
在本揭示實施例中,通過在沉浸式媒體內容的檔案格式資訊中添加欄位,來定義沉浸式媒體內容的解析度選擇策略和候選解析度,使得伺服器端能夠根據該檔案格式資訊,為用戶端提供合適解析度的沉浸式媒體檔案,為實現上述基於用戶端能力的解析度自我調整選擇提供技術支援。
下面結合一個例子對本揭示技術方案進行介紹說明。
伺服器端存儲視訊檔案,假設未縮放的視訊解析度為8K,視訊檔案中包含多種解析度(也即多種清晰度)的視訊檔案軌道,zoom_ratio分別為0(對應8K解析度)、1(對應4K解析度)、2(對應1080p解析度)。
伺服器設定清晰度選擇策略為1,即設備能力允許條件下,一定頻寬限制內觀看品質優先,頻寬限制為10mbps,在zoom_strategy_description中描述為“Limit bandwidth:10mbps”。
用戶端(或稱為播放器端)向伺服器端發送能力資訊,假設A使用者設備可以消費8K視訊,為普通使用者;B使用者設備可以消費4K視訊,為高級使用者;C使用者設備可以消費8K視訊,為高級使用者。例如,高級用戶比普通用戶具有更高的優先順序。
伺服器根據上述能力資訊以及解析度選擇策略,決定:
1、A用戶為普通用戶,需受到10mbps頻寬限制,發送給A使用者的視訊應為8K解析度以下且頻寬小於10mbps的視訊(本實施例中假設為4K視訊)。該視訊對應zoom_ratio為1的檔案軌道。因此伺服器將zoom_ratio為1的檔案軌道重新封裝為視訊檔案,發送給使用者A。
2、B用戶為高級用戶,不受10mbps頻寬限制,發送給B使用者的視訊應為其能消費的最高解析度視訊,即4K視訊。因此伺服器將zoom_ratio為1的檔案軌道重新封裝為視訊檔案,發送給使用者B。
3、C用戶為高級用戶,不受10mbps頻寬限制,發送給C使用者的視訊應為其能消費的最高解析度視訊,即8K視訊。因此伺服器將zoom_ratio為0的檔案軌道重新封裝為視訊檔案,發送給使用者C。
用戶A、B、C分別消費其收到的視訊檔案。
需要說明的是,在上述實施例中,縮放比例取值及對應的視訊解析度不局限於給出的例子。伺服器端可根據已存儲的不同解析度的視訊檔案,選擇合適的發送給對應用戶。另外,伺服器端可能未必存儲有所有可能的縮放比例對應解析度的視訊檔案。在這種情況下,可根據已有的不同解析度的視訊檔案及縮放比例指示的解析度,選擇符合條件的最接近目標視訊解析度的視訊檔案發送給對應使用者。
還需要說明的是,在上述實施例中,關於各欄位的名稱和描述僅是示例性和解釋性的,在實現上述各欄位所定義功能的前提下,各欄位的名稱和描述可以結合實際情況進行設定,但都應當落入本揭示保護範圍之內。
還需要說明的是,在上述實施例中,僅從伺服器和用戶端交互的角度,對本揭示技術方案進行了介紹說明。上述有關伺服器執行的步驟,可以單獨實現成為伺服器側的沉浸式媒體提供方法;上述有關用戶端執行的步驟,可以單獨實現成為用戶端側的沉浸式媒體獲取方法。
下述為本揭示裝置實施例,可以用於執行本揭示方法實施例。對於本揭示裝置實施例中未披露的細節,請參照本揭示方法實施例。
請參考第6A圖,其示出了本揭示一個實施例提供的沉浸式媒體提供裝置的方塊圖。該裝置具有實現上述沉浸式媒體提供方法示例的功能,所述功能可以由硬體實現,也可以由硬體執行相應的軟體實現。該裝置可以是上文介紹的伺服器,也可以設置在伺服器上。該裝置600可以包括:資訊接收模組610、解析度選擇模組620和檔案發送模組630。
資訊接收模組610用於接收來自用戶端的能力資訊,所述能力資訊用於指示所述用戶端所在設備的沉浸式媒體播放能力。
解析度選擇模組620用於根據沉浸式媒體內容的解析度選擇策略和所述能力資訊,從所述沉浸式媒體內容的候選解析度中,確定提供給所述用戶端的目標解析度。
檔案發送模組630用於向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
在示例性實施例中,所述沉浸式媒體內容的檔案格式資訊包括:解析度描述資訊和解析度選擇策略資訊;其中,所述解析度描述資訊用於定義所述沉浸式媒體內容的候選解析度;所述解析度選擇策略資訊用於定義所述沉浸式媒體內容的解析度選擇策略。
在示例性實施例中,所述解析度選擇策略資訊包括:縮放策略類型欄位,用於指示所述沉浸式媒體內容所採用的解析度選擇策略的類型。
在示例性實施例中,所述縮放策略類型欄位的值為第一數值,表示所述解析度選擇策略為設備能力允許條件下,觀看品質優先;所述縮放策略類型欄位的值為第二數值,表示所述解析度選擇策略為設備能力允許條件下,用戶頻寬限制內觀看品質優先。
在示例性實施例中,所述解析度選擇策略資訊還包括:縮放策略描述欄位,用於提供所述解析度選擇策略的文本描述;縮放策略描述長度欄位,用於指示所述縮放策略描述欄位中的所述文本描述的長度。
在示例性實施例中,所述解析度描述資訊包括:數量指示欄位,用於指示所述沉浸式媒體內容包括的縮放區域的數量;縮放比例指示欄位,用於指示所述縮放區域的縮放比例;其中,不同的縮放區域對應於不同的候選解析度。
在示例性實施例中,所述縮放比例指示欄位的值為0,表示所述縮放區域相對於原始區域未進行縮放;所述縮放比例指示欄位的值為1,表示所述縮放區域在寬、高上分別為原始區域的1/2;所述縮放比例指示欄位的值為2,表示所述縮放區域在寬、高上分別為原始區域的1/4;所述縮放比例指示欄位的值為3,表示所述縮放區域在寬、高上分別為原始區域的1/6;所述縮放比例指示欄位的值為4,表示所述縮放區域在寬、高上分別為原始區域的1/8。
在示例性實施例中,所述解析度描述資訊還包括:縮放演算法類型欄位,用於指示所述縮放區域的縮放演算法類型;縮放符號類型欄位,用於指示所述縮放區域的邊界符號類型;縮放區欄位型別欄位,用於指示所述縮放區域的類型;縮放區域描述欄位,用於提供所述縮放區域的文本描述。
在示例性實施例中,所述能力資訊包括以下至少一項:設備能力資訊,用於指示所述用戶端所在設備支援的最大解析度;使用者權限權限資訊,用於指示所述用戶端對應的用戶權限權限所支持的最大解析度;使用者頻寬資訊,用於指示所述用戶端對應的用戶頻寬上限。
綜上所述,本揭示實施例提供的技術方案,通過根據用戶端的能力資訊和沉浸式媒體內容的解析度選擇策略,從沉浸式媒體內容的候選解析度中,選擇目標解析度的沉浸式媒體檔案發送給用戶端;提供了一種根據用戶端能力自我調整地選擇沉浸式媒體內容的解析度的技術方案,能夠實現從滿足用戶端能力資訊要求的候選解析度中,選擇最大解析度提供給用戶端,從而在保證用戶體驗的前提下,提升頻寬資源的利用率。
請參考第6B圖,其示出了本揭示一個實施例提供的沉浸式媒體提供裝置的方塊圖。該裝置具有實現上述沉浸式媒體提供方法示例的功能,所述功能可以由硬體實現,也可以由硬體執行相應的軟體實現。該裝置可以是上文介紹的伺服器,也可以設置在伺服器上。該裝置600’可以包括:添加模組640、解析度選擇模組650和檔案發送模組660。
添加模組640用於在沉浸式媒體內容的檔案格式資訊中添加解析度描述資訊和解析度選擇策略資訊。
解析度選擇模組650用於根據所述沉浸式媒體內容的所述解析度描述資訊以及所述解析度選擇策略資訊,確定提供給用戶端的目標解析度;
檔案發送模組660,用於向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
請參考第7A圖,其示出了本揭示一個實施例提供的沉浸式媒體獲取裝置的方塊圖。該裝置具有實現上述沉浸式媒體獲取方法示例的功能,所述功能可以由硬體實現,也可以由硬體執行相應的軟體實現。該裝置可以是上文介紹的終端,也可以設置在終端上。該裝置700可以包括:資訊獲取模組710、資訊發送模組720和檔案接收模組730。
資訊獲取模組710用於獲取用戶端的能力資訊,所述能力資訊用於指示所述用戶端所在設備的沉浸式媒體播放能力。
資訊發送模組720用於向伺服器發送所述能力資訊。
檔案接收模組730用於接收來自所述伺服器的目標解析度的沉浸式媒體檔案,所述目標解析度是基於沉浸式媒體內容的解析度選擇策略和所述能力資訊,從所述沉浸式媒體內容的候選解析度中確定的。
在示例性實施例中,所述能力資訊包括以下至少一項:設備能力資訊,用於指示所述用戶端所在設備支援的最大解析度;使用者權限權限資訊,用於指示所述用戶端對應的用戶權限權限所支持的最大解析度;使用者頻寬資訊,用於指示所述用戶端對應的用戶頻寬上限。
請參考第7B圖,其示出了本揭示一個實施例提供的沉浸式媒體獲取裝置的方塊圖。該裝置具有實現上述沉浸式媒體獲取方法示例的功能,所述功能可以由硬體實現,也可以由硬體執行相應的軟體實現。該裝置可以是上文介紹的終端,也可以設置在終端上。該裝置700’可以包括:檔案接收模組740和呈現模組750。
檔案接收模組740用於接收來自伺服器的目標解析度的沉浸式媒體檔案,所述沉浸式媒體檔案的沉浸式媒體內容的檔案格式資訊包括解析度描述資訊和解析度選擇策略資訊,其中,所述解析度描述資訊用於定義所述沉浸式媒體內容的候選解析度,所述解析度選擇策略資訊用於定義所述沉浸式媒體內容的解析度選擇策略;
呈現模組750用於根據所述檔案格式資訊呈現所述沉浸式媒體檔案。
綜上所述,本揭示實施例提供的技術方案,通過根據用戶端的能力資訊和沉浸式媒體內容的解析度選擇策略,從沉浸式媒體內容的候選解析度中,選擇目標解析度的沉浸式媒體檔案發送給用戶端;提供了一種根據用戶端能力自我調整地選擇沉浸式媒體內容的解析度的技術方案,能夠實現從滿足用戶端能力資訊要求的候選解析度中,選擇最大解析度提供給用戶端,從而在保證用戶體驗的前提下,提升頻寬資源的利用率。
需要說明的是,上述實施例提供的裝置,在實現其功能時,僅以上述各功能模組的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能模組完成,即將設備的內部結構劃分成不同的功能模組,以完成以上描述的全部或者部分功能。另外,上述實施例提供的裝置與方法實施例屬於同一構思,其具體實現過程詳見方法實施例,這裡不再贅述。
請參考第8圖,其示出了本揭示一個實施例提供的伺服器的結構方塊圖。該伺服器可用於執行上述實施例中提供的沉浸式媒體提供方法。具體來講:
伺服器800包括中央處理單元(Central Processing Unit ,CPU)801、包括隨機存取記憶體(Random Access Memory ,RAM)802和唯讀記憶體(Read Only Memory,ROM)803的系統記憶體804,以及連接系統記憶體804和中央處理單元801的系統匯流排805。伺服器800還包括説明電腦內的各個器件之間傳輸資訊的基本輸入/輸出系統(I/O(Input/Output)系統)806,和用於存儲作業系統813、應用程式814和其他程式模組812的大容量存儲裝置807。
基本輸入/輸出系統806包括有用於顯示資訊的顯示器808和用於使用者輸入資訊的諸如滑鼠、鍵盤之類的輸入裝置809。其中顯示器808和輸入裝置809都通過連接到系統匯流排805的輸入輸出控制器810連接到中央處理單元801。基本輸入/輸出系統806還可以包括輸入輸出控制器810,以用於接收和處理來自鍵盤、滑鼠、或電子觸控筆等多個其他設備的輸入。類似地,輸入輸出控制器810還提供輸出到顯示幕、印表機或其他類型的輸出設備。
大容量存儲裝置807通過連接到系統匯流排805的大容量存儲控制器(未示出)連接到中央處理單元801。大容量存儲裝置807及其相關聯的電腦可讀介質為伺服器800提供非易失性存儲。也就是說,大容量存儲裝置807可以包括諸如硬碟或者唯讀光碟(Compact Disc Read-Only Memory,CD-ROM)驅動器之類的電腦可讀介質(未示出)。
不失一般性,電腦可讀介質可以包括電腦存儲介質和通信介質。電腦存儲介質包括用於存儲諸如電腦可讀指令、資料結構、程式模組或其他資料等資訊的任何方法或技術實現的易失性和非易失性、可移動和不可移動介質。電腦存儲介質包括RAM、ROM、可擦除可程式設計唯讀記憶體(Erasable Programmable Read Only Memory,EPROM)、電可擦可程式設計唯讀記憶體(Electrically Erasable Programmable Read Only Memory,EEPROM)、快閃記憶體或其他固態記憶體技術,CD-ROM、高密度數位視訊光碟(Digital Video Disc,DVD)或其他光學存儲、磁帶盒、磁帶、磁片存儲或其他磁性存放裝置。當然,本揭示所屬技術領域中具有通常知識者可知電腦存儲介質不局限於上述幾種。上述的系統記憶體804和大容量存儲裝置807可以統稱為記憶體。
根據本揭示的各種實施例,伺服器800還可以通過諸如網際網路等網路連接到網路上的遠端電腦運行。也即伺服器800可以通過連接在系統匯流排805上的網路介面單元811連接到網路812,或者說,也可以使用網路介面單元811來連接到其他類型的網路或遠端電腦系統(未示出)。
所述記憶體還包括電腦程式,該電腦程式存儲於記憶體中,且經配置以由一個或者一個以上處理器執行,以實現上述沉浸式媒體提供方法。
請參考第9圖,其示出了本揭示一個實施例提供的終端900的結構方塊圖。該終端900可以是諸如手機、平板電腦、多媒體播放設備、電視機、放映機、顯示器、可穿戴設備、PC等電子設備。該終端可用於實施上述實施例中提供的沉浸式媒體獲取方法。具體來講:
通常,終端900包括有:處理器901和記憶體902。
處理器901可以包括一個或多個處理核心,比如4核心處理器、8核心處理器等。處理器901可以採用數位信號處理(Digital Signal Processing,DSP)、現場可程式設計閘陣列(Field Programmable Gate Array,FPGA)、可程式設計邏輯陣列(Programmable Logic Array,PLA)中的至少一種硬體形式來實現。處理器901也可以包括主處理器和輔助處理器,主處理器是用於對在喚醒狀態下的資料進行處理的處理器,也稱中央處理器(Central Processing Unit,CPU);輔助處理器是用於對在待機狀態下的資料進行處理的低功耗處理器。在一些實施例中,處理器901可以集成有影像處理器(Graphics Processing Unit,GPU), GPU用於負責顯示幕所需要顯示的內容的渲染和繪製。一些實施例中,處理器901還可以包括人工智慧(Artificial Intelligence,AI)處理器,該AI處理器用於處理有關機器學習的計算操作。
記憶體902可以包括一個或多個電腦可讀存儲介質,該電腦可讀存儲介質可以是非易失性的。記憶體902還可包括高速隨機存取記憶體,以及非易失性記憶體,比如一個或多個磁片存放裝置、快閃記憶體存放裝置。在一些實施例中,記憶體902中的非易失性的電腦可讀存儲介質用於存儲至少一個指令,至少一段程式、代碼集或指令集,所述至少一條指令、至少一段程式、代碼集或指令集,且經配置以由一個或者一個以上處理器執行,以實現上述沉浸式媒體獲取方法。
在一些實施例中,終端900還可包括有:週邊設備介面903和至少一個週邊設備。處理器901、記憶體902和週邊設備介面903之間可以通過匯流排或信號線相連。各個週邊設備可以通過匯流排、信號線或電路板與週邊設備介面903相連。具體地,週邊設備包括:射頻電路904、觸摸顯示螢幕905、攝像頭906、音訊電路907、定位元件908和電源909中的至少一種。
本揭示所屬技術領域中具有通常知識者可以理解第9圖中示出的結構並不構成對終端900的限定,可以包括比圖示更多或更少的元件,或者組合某些元件,或者採用不同的元件佈置。
在示例性實施例中,還提供了一種電腦設備,所述電腦設備包括處理器和記憶體,所述記憶體中存儲有處理器可執行指令,所述指令由一個或一個以上處理器執行時,實現上述沉浸式媒體提供方法或沉浸式媒體獲取方法。其中,所述電腦設備可包括第8圖所示的伺服器和第9圖所示的終端。
在示例性實施例中,還提供了一種電腦可讀存儲介質,所述電腦可讀存儲介質中存儲有處理器可執行指令,所述指令由一個或一個以上處理器執行時,實現上述沉浸式媒體提供方法。其中,所述一個或一個以上處理器可以位於伺服器中。
在示例性實施例中,還提供了一種電腦可讀存儲介質,所述電腦可讀存儲介質中存儲有處理器可執行指令,所述指令由一個或一個以上處理器執行時,實現上述沉浸式媒體獲取方法。其中,所述一個或一個以上處理器可以位於終端中。
該電腦可讀存儲介質還可以包括:唯讀記憶體(Read Only Memory, ROM)、隨機存取記憶體(Random Access Memory, RAM)、固態硬碟(Solid State Drives, SSD)或光碟等。其中,隨機存取記憶體可以包括電阻式隨機存取記憶體(Resistance Random Access Memory, ReRAM)和動態隨機存取記憶體(Dynamic Random Access Memory, DRAM)。
根據本揭示的一個方面,提供了一種電腦程式產品或電腦程式,該電腦程式產品或電腦程式包括電腦指令,該電腦指令存儲在電腦可讀存儲介質中。伺服器的處理器從電腦可讀存儲介質讀取該電腦指令,處理器執行該電腦指令,使得該伺服器執行上述沉浸式媒體提供方法。終端的處理器從電腦可讀存儲介質讀取該電腦指令,處理器執行該電腦指令,使得該終端執行上述沉浸式媒體獲取方法。
應當理解的是,在本文中提及的“多個”是指兩個或兩個以上。“和/或”描述關聯物件的關聯關係,表示可以存在三種關係,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。符號“/”一般表示前後關聯物件是一種“或”的關係。另外,本文中描述的步驟編號,僅示例性示出了步驟間的一種可能的執行先後順序,在一些其它實施例中,上述步驟也可以不按照編號順序來執行,如兩個不同編號的步驟同時執行,或者兩個不同編號的步驟按照與圖示相反的循序執行,本揭示實施例對此不作限定。以上所述僅為本揭示的示例性實施例,並不用以限制本揭示,凡在本揭示的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本揭示的保護範圍之內。
雖然本揭示已用較佳實施例揭露如上,然其並非用以限定本揭示,本揭示所屬技術領域中具有通常知識者在不脫離本揭示之精神與範圍內,可作各種之更動與潤飾,因此本揭示之保護範圍當視後附之申請專利範圍所界定者為準。
10、32、900:終端
20、31、800:伺服器
21:內容獲取與製作
22:沉浸媒體編碼/檔案封裝
23:沉浸媒體傳輸
24:沉浸媒體解碼/檔案解封裝
25:沉浸媒體渲染
30、812:網路
41:解析器
42:解碼器
43:轉換器
44:渲染器
45:傳感裝置
46:遠程渲染平台
501-505、511-513、521-522:步驟
600、600’、700、700’:裝置
610:資訊接收模組
620、650:解析度選擇模組
630、660:檔案發送模組
640:添加模組
710:資訊獲取模組
720:資訊發送模組
730、740:檔案接收模組
750:呈現模組
801:中央處理單元
802:隨機存取記憶體
803:唯讀記憶體
804:系統記憶體
805:系統匯流排
806:基本輸入/輸出系統
807:大容量存儲裝置
808:顯示器
809:輸入裝置
810:輸入輸出控制器
811:網路介面單元
813:作業系統
814:應用程式
815:其他程式模組
901:處理器
902:記憶體
903:週邊設備介面
904:射頻電路
905:觸摸顯示螢幕
906:攝像頭
907:音訊電路
908:定位元件
909:電源
[第1圖]顯示本揭示一個實施例提供的實施環境的示意圖。
[第2圖]顯示本揭示一個實施例提供的沉浸式媒體播放系統的端到端處理流程的示意圖。
[第3圖]顯示本揭示一個實施例提供的沉浸式媒體播放系統的系統處理架構的示意圖。
[第4圖]顯示本揭示一個實施例提供的基於沉浸式媒體應用的用戶端參考模型的示意圖。
[第5A圖]顯示本揭示一個實施例提供的沉浸式媒體提供方法的流程圖。
[第5B圖]顯示本揭示一個實施例提供的沉浸式媒體提供方法的流程圖。
[第5C圖]顯示本揭示一個實施例提供的沉浸式媒體提供方法的流程圖。
[第6A圖]顯示本揭示一個實施例提供的沉浸式媒體提供裝置的方塊圖。
[第6B圖]顯示本揭示一個實施例提供的沉浸式媒體提供裝置的方塊圖。
[第7A圖]顯示本揭示一個實施例提供的沉浸式媒體獲取裝置的方塊圖。
[第7B圖]顯示本揭示一個實施例提供的沉浸式媒體獲取裝置的方塊圖。
[第8圖]顯示本揭示一個實施例提供的伺服器的結構方塊圖。
[第9圖]顯示本揭示一個實施例提供的終端的結構方塊圖。
511-513:步驟
Claims (17)
- 一種沉浸式媒體提供方法,由伺服器執行,所述方法包括:接收來自用戶端的能力資訊,其中所述能力資訊用於指示所述用戶端所在設備的沉浸式媒體播放能力;根據所述沉浸式媒體內容的解析度選擇策略資訊和所述能力資訊,以及所述沉浸式媒體內容的案格式資訊中包括的解析度描述資訊,從所述沉浸式媒體內容的多個候選解析度中,確定提供給所述用戶端的目標解析度,其中所述解析度描述資訊包括數量指示欄位和縮放比例指示欄位,所述數量指示欄位用於指示所述沉浸式媒體內容包括的縮放區域的數量,所述縮放比例指示欄位用於指示所述縮放區域相對於原始區域的縮放比例,不同的縮放區域對應於不同的候選解析度,所述目標解析度是所述多個候選解析度中滿足所述能力資訊要求的候選解析度中的最大解析度;以及向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
- 如請求項1之方法,其中所述解析度描述資訊用於定義所述沉浸式媒體內容的所述多個候選解析度,所述解析度選擇策略資訊用於定義所述沉浸式媒體內容的解析度選擇策略。
- 如請求項2之方法,其中所述解析度選擇策略資訊包括:縮放策略類型欄位,用於指示所述沉浸式媒體內容所採用的解析度選擇策略的類型。
- 如請求項3之方法,其中所述縮放策略類型欄位的值為第一數值,表示所述解析度選擇策略為設備能力允許條件下,觀看品質優先; 所述縮放策略類型欄位的值為第二數值,表示所述解析度選擇策略為設備能力允許條件下,用戶頻寬限制內觀看品質優先。
- 如請求項3之方法,其中所述解析度選擇策略資訊還包括:縮放策略描述欄位,用於提供所述解析度選擇策略的文本描述;以及縮放策略描述長度欄位,用於指示所述縮放策略描述欄位元中的所述文本描述的長度。
- 如請求項2之方法,其中所述解析度描述資訊包括:所述縮放比例指示欄位的值為0,表示所述縮放區域相對於原始區域未進行縮放;所述縮放比例指示欄位的值為1,表示所述縮放區域在寬、高上分別為原始區域的1/2;所述縮放比例指示欄位的值為2,表示所述縮放區域在寬、高上分別為原始區域的1/4;所述縮放比例指示欄位的值為3,表示所述縮放區域在寬、高上分別為原始區域的1/6;所述縮放比例指示欄位的值為4,表示所述縮放區域在寬、高上分別為原始區域的1/8。
- 如請求項1至6中任一項之方法,其中所述能力資訊包括以下至少一項:設備能力資訊,用於指示所述用戶端所在設備支援的最大解析度;使用者權限資訊,用於指示所述用戶端對應的用戶權限所支持的最大解析度;以及 使用者頻寬資訊,用於指示所述用戶端對應的用戶頻寬上限。
- 一種沉浸式媒體獲取方法,由終端執行,所述方法包括:獲取用戶端的能力資訊,其中所述能力資訊用於指示所述用戶端所在設備的沉浸式媒體播放能力;向伺服器發送所述能力資訊;以及接收來自伺服器的目標解析度的沉浸式媒體檔案,其中所述目標解析度是根據所述沉浸式媒體內容的解析度選擇策略資訊和所述能力資訊,以及所述沉浸式媒體內容的案格式資訊中包括的解析度描述資訊,從所述沉浸式媒體內容的多個候選解析度中確定的,所述解析度描述資訊包括數量指示欄位和縮放比例指示欄位,所述數量指示欄位用於指示所述沉浸式媒體內容包括的縮放區域的數量,所述縮放比例指示欄位用於指示所述縮放區域相對於原始區域的縮放比例,不同的縮放區域對應於不同的候選解析度,所述目標解析度是所述多個候選解析度中滿足所述能力資訊要求的候選解析度中的最大解析度。
- 如請求項8之方法,其中所述能力資訊包括以下至少一項:設備能力資訊,用於指示所述用戶端所在設備支援的最大解析度;使用者權限資訊,用於指示所述用戶端對應的用戶權限所支持的最大解析度;以及使用者頻寬資訊,用於指示所述用戶端對應的用戶頻寬上限。
- 如請求項8之方法,其中所述解析度選擇策略資訊包括:縮放策略類型欄位,用於指示所述沉浸式媒體內容所採用的解析度選擇策略的類型。
- 如請求項10之方法,其中所述縮放策略類型欄位的值為第一數值,表示所述解析度選擇策略為設備能力允許條件下,觀看品質優先;所述縮放策略類型欄位的值為第二數值,表示所述解析度選擇策略為設備能力允許條件下,用戶頻寬限制內觀看品質優先。
- 如請求項8之方法,其中所述解析度選擇策略資訊包括:縮放策略描述欄位,用於提供所述解析度選擇策略的文本描述;以及縮放策略描述長度欄位,用於指示所述縮放策略描述欄位元中的所述文本描述的長度。
- 如請求項8之方法,其中所述縮放比例指示欄位的值為0,表示所述縮放區域相對於原始區域未進行縮放;所述縮放比例指示欄位的值為1,表示所述縮放區域在寬、高上分別為原始區域的1/2;所述縮放比例指示欄位的值為2,表示所述縮放區域在寬、高上分別為原始區域的1/4;所述縮放比例指示欄位的值為3,表示所述縮放區域在寬、高上分別為原始區域的1/6;所述縮放比例指示欄位的值為4,表示所述縮放區域在寬、高上分別為原始區域的1/8。
- 一種沉浸式媒體提供裝置,包括:資訊接收模組,用於接收來自用戶端的能力資訊,其中所述能力資訊用於指示所述用戶端所在設備的沉浸式媒體播放能力; 解析度選擇模組,用於根據所述沉浸式媒體內容的解析度選擇策略資訊和所述能力資訊,以及所述沉浸式媒體內容的案格式資訊中包括的解析度描述資訊,從所述沉浸式媒體內容的多個候選解析度中,確定提供給所述用戶端的目標解析度,其中所述解析度描述資訊包括數量指示欄位和縮放比例指示欄位,所述數量指示欄位用於指示所述沉浸式媒體內容包括的縮放區域的數量,所述縮放比例指示欄位用於指示所述縮放區域相對於原始區域的縮放比例,不同的縮放區域對應於不同的候選解析度,所述目標解析度是所述多個候選解析度中滿足所述能力資訊要求的候選解析度中的最大解析度;以及檔案發送模組,用於向所述用戶端發送所述目標解析度的沉浸式媒體檔案。
- 一種沉浸式媒體獲取裝置,包括:資訊獲取模組,用於獲取用戶端的能力資訊,其中所述能力資訊用於指示所述用戶端所在設備的沉浸式媒體播放能力;資訊發送模組,用於向伺服器發送所述能力資訊;以及檔案接收模組,用於接收來自伺服器的目標解析度的沉浸式媒體檔案,其中所述目標解析度是根據所述沉浸式媒體內容的解析度選擇策略資訊和所述能力資訊,以及所述沉浸式媒體內容的案格式資訊中包括的解析度描述資訊,從所述沉浸式媒體內容的多個候選解析度中確定的,所述解析度描述資訊包括數量指示欄位和縮放比例指示欄位,所述數量指示欄位用於指示所述沉浸式媒體內容包括的縮放區域的數量,所述縮放比例指示欄位用於指示所述縮放區域相對於原始區域的縮放比例,不同的縮放區域對應於不同的候選解析度,所述目標解析度是所述多個候選解析度中滿足所述能力資訊要求的候選解析度中的最大解析度。
- 一種電腦設備,包括處理器和記憶體,所述記憶體中存儲有處理器可執行指令,所述處理器可執行指令由所述處理器執行時,實現如請求項1至13中任一項之方法。
- 一種電腦可讀存儲介質,存儲有處理器可執行指令,所述處理器可執行指令由一個或一個以上處理器執行時,實現如請求項1至13中任一項之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010211178.6 | 2020-03-24 | ||
CN202010211178.6A CN113453046B (zh) | 2020-03-24 | 2020-03-24 | 沉浸式媒体提供方法、获取方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202137770A TW202137770A (zh) | 2021-10-01 |
TWI786572B true TWI786572B (zh) | 2022-12-11 |
Family
ID=77806310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110109841A TWI786572B (zh) | 2020-03-24 | 2021-03-18 | 沉浸式媒體提供方法、獲取方法、裝置、設備及存儲介質 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220182687A1 (zh) |
EP (1) | EP4009644A4 (zh) |
CN (2) | CN115225937B (zh) |
TW (1) | TWI786572B (zh) |
WO (1) | WO2021190221A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116347183A (zh) * | 2020-06-04 | 2023-06-27 | 腾讯科技(深圳)有限公司 | 一种沉浸媒体的数据处理方法及相关装置 |
CN113891117B (zh) * | 2021-09-29 | 2023-02-14 | 腾讯科技(深圳)有限公司 | 沉浸媒体的数据处理方法、装置、设备及可读存储介质 |
CN114257838B (zh) * | 2021-11-29 | 2024-04-16 | 新奥特(北京)视频技术有限公司 | 一种视频数据处理方法、装置、电子设备和存储介质 |
CN115314723B (zh) * | 2022-06-17 | 2023-12-12 | 百果园技术(新加坡)有限公司 | 一种初始档位视频流传输方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105933726A (zh) * | 2016-05-13 | 2016-09-07 | 乐视控股(北京)有限公司 | 虚拟现实终端及其视频分辨率的适应方法及装置 |
CN106713895A (zh) * | 2014-11-26 | 2017-05-24 | 索尼公司 | 处理内容的方法和设备 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6492985B1 (en) * | 1999-07-06 | 2002-12-10 | Internet Pictures Corporation | Presenting manipulating and serving immersive images |
US8458753B2 (en) * | 2006-02-27 | 2013-06-04 | Time Warner Cable Enterprises Llc | Methods and apparatus for device capabilities discovery and utilization within a content-based network |
CN101163245B (zh) * | 2007-11-27 | 2010-09-29 | 北京中星微电子有限公司 | 一种图像处理方法及装置 |
US20090184962A1 (en) * | 2008-01-22 | 2009-07-23 | Dell Product L.P. | Systems and Methods for Managing Video Resolution in a Multiple-Output Information Handling System |
CN101420604A (zh) * | 2008-11-20 | 2009-04-29 | 华为技术有限公司 | 一种媒体提供、下载方法及系统 |
US8947492B2 (en) * | 2010-06-18 | 2015-02-03 | Microsoft Corporation | Combining multiple bit rate and scalable video coding |
JP5684033B2 (ja) * | 2011-04-11 | 2015-03-11 | オリンパス株式会社 | 撮像装置及び内視鏡装置の作動方法 |
US20140082661A1 (en) * | 2012-03-06 | 2014-03-20 | Google Inc. | Low latency video storyboard delivery with selectable resolution levels |
CN103369355A (zh) * | 2012-04-10 | 2013-10-23 | 华为技术有限公司 | 一种在线媒体数据转换的方法、播放视频方法及相应装置 |
CN103493500A (zh) * | 2012-09-04 | 2014-01-01 | 华为终端有限公司 | 媒体播放方法、控制点和终端 |
CN105306986B (zh) * | 2013-05-14 | 2016-09-07 | 广东云海云计算科技有限公司 | 集成基本数据、正常数据解扰的dvb条件接收装置 |
CN103825912A (zh) * | 2014-03-24 | 2014-05-28 | 联想(北京)有限公司 | 一种数据传输方法、电子设备及服务器 |
GB2558086B (en) * | 2014-03-25 | 2019-02-20 | Canon Kk | Methods, devices, and computer programs for improving streaming of partitioned timed media data |
EP2961182A1 (en) * | 2014-06-27 | 2015-12-30 | Alcatel Lucent | Method, system and device for navigating in ultra high resolution video content by a client device |
US20180270515A1 (en) * | 2015-10-01 | 2018-09-20 | Vid Scale, Inc. | Methods and systems for client interpretation and presentation of zoom-coded content |
KR102173635B1 (ko) * | 2016-05-26 | 2020-11-03 | 브이아이디 스케일, 인크. | 뷰포트 적응형 360도 비디오 전달의 방법 및 장치 |
CN107566854B (zh) * | 2016-06-30 | 2020-08-07 | 华为技术有限公司 | 一种媒体内容的获取和发送方法及装置 |
KR102545195B1 (ko) * | 2016-09-12 | 2023-06-19 | 삼성전자주식회사 | 가상 현실 시스템에서 컨텐트 전송 및 재생 방법 및 장치 |
WO2018049321A1 (en) * | 2016-09-12 | 2018-03-15 | Vid Scale, Inc. | Method and systems for displaying a portion of a video stream with partial zoom ratios |
EP4415354A2 (en) * | 2017-03-23 | 2024-08-14 | Vid Scale, Inc. | Metrics and messages to improve experience for 360-degree adaptive streaming |
CN107087212B (zh) * | 2017-05-09 | 2019-10-29 | 杭州码全信息科技有限公司 | 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 |
US10887379B2 (en) * | 2017-09-20 | 2021-01-05 | Verizon Patent And Licensing Inc. | Dynamically determining a content delivery network from which to receive content |
US20190104326A1 (en) * | 2017-10-03 | 2019-04-04 | Qualcomm Incorporated | Content source description for immersive media data |
CN108462899B (zh) * | 2018-03-19 | 2021-04-30 | 海信视像科技股份有限公司 | 基于设备能力的流媒体码流自适应传输方法、播放设备及播放系统 |
GB2573543B (en) * | 2018-05-09 | 2021-10-27 | Advanced Risc Mach Ltd | Graphics Processing |
US20190045248A1 (en) * | 2018-05-31 | 2019-02-07 | Intel Corporation | Super resolution identifier mechanism |
CN109218763A (zh) * | 2018-11-12 | 2019-01-15 | 青岛海信传媒网络技术有限公司 | 一种流媒体视频切换的方法及智能电视 |
CN110572656B (zh) * | 2019-09-19 | 2021-11-19 | 江苏视博云信息技术有限公司 | 一种编码方法、图像处理方法、装置、系统、存储介质及设备 |
-
2020
- 2020-03-24 CN CN202210831058.5A patent/CN115225937B/zh active Active
- 2020-03-24 CN CN202010211178.6A patent/CN113453046B/zh active Active
-
2021
- 2021-02-23 EP EP21777160.9A patent/EP4009644A4/en active Pending
- 2021-02-23 WO PCT/CN2021/077360 patent/WO2021190221A1/zh unknown
- 2021-03-18 TW TW110109841A patent/TWI786572B/zh active
-
2022
- 2022-02-24 US US17/679,877 patent/US20220182687A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106713895A (zh) * | 2014-11-26 | 2017-05-24 | 索尼公司 | 处理内容的方法和设备 |
CN105933726A (zh) * | 2016-05-13 | 2016-09-07 | 乐视控股(北京)有限公司 | 虚拟现实终端及其视频分辨率的适应方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113453046A (zh) | 2021-09-28 |
EP4009644A1 (en) | 2022-06-08 |
EP4009644A4 (en) | 2023-03-15 |
US20220182687A1 (en) | 2022-06-09 |
CN113453046B (zh) | 2022-07-12 |
TW202137770A (zh) | 2021-10-01 |
CN115225937A (zh) | 2022-10-21 |
WO2021190221A1 (zh) | 2021-09-30 |
CN115225937B (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6979035B2 (ja) | 仮想現実メディアコンテンツのストリーミングを向上させる方法、デバイス及びコンピュータプログラム | |
TWI786572B (zh) | 沉浸式媒體提供方法、獲取方法、裝置、設備及存儲介質 | |
JP7058273B2 (ja) | 情報処理方法および装置 | |
US20200145736A1 (en) | Media data processing method and apparatus | |
US11632571B2 (en) | Media data processing method and apparatus | |
US20200092600A1 (en) | Method and apparatus for presenting video information | |
WO2019202207A1 (en) | Processing video patches for three-dimensional content | |
CN111869222B (zh) | 基于http的dash客户端网元、方法及介质 | |
US20200336803A1 (en) | Media data processing method and apparatus | |
US20200145716A1 (en) | Media information processing method and apparatus | |
CN107438203B (zh) | 用于建立和接收清单的方法、网络设备及终端 | |
US20230360678A1 (en) | Data processing method and storage medium | |
JP2019125865A (ja) | 情報処理装置および方法 | |
WO2023169003A1 (zh) | 点云媒体的解码方法、点云媒体的编码方法及装置 | |
WO2019138927A1 (ja) | 情報処理装置および方法 | |
JP2021521676A (ja) | 仮想現実アプリケーションにおいて特定のメッセージをシグナリングするためのシステム及び方法 |