CN115529451A - 数据的传输方法及装置、存储介质、电子设备 - Google Patents
数据的传输方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN115529451A CN115529451A CN202110713207.3A CN202110713207A CN115529451A CN 115529451 A CN115529451 A CN 115529451A CN 202110713207 A CN202110713207 A CN 202110713207A CN 115529451 A CN115529451 A CN 115529451A
- Authority
- CN
- China
- Prior art keywords
- panoramic video
- visual angle
- target
- source data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 230000005540 biological transmission Effects 0.000 title abstract description 34
- 230000033001 locomotion Effects 0.000 claims abstract description 102
- 230000000007 visual effect Effects 0.000 claims description 171
- 238000004891 communication Methods 0.000 claims description 20
- 230000026058 directional locomotion Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102100033587 DNA topoisomerase 2-alpha Human genes 0.000 description 1
- 101000801505 Homo sapiens DNA topoisomerase 2-alpha Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/215—Motion-based segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234381—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种数据的传输方法及装置、存储介质、电子设备,属于云服务领域。其中,该方法包括:获取待传输的全景视频源数据;在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;向所述播放端传输所述全景视频目标数据。通过本发明,解决了相关技术在切换全景视频的视角时容易卡顿的技术问题,避免了视角切换时临时传输高清数据导致的切换延迟,在保持较好的观看体验的同时降低编码码率,减少传输代价。
Description
技术领域
本发明涉及云服务领域,具体而言,涉及一种数据的传输方法及装置、存储介质、电子设备。
背景技术
相关技术中,VR(Virtual Reality,虚拟现实)服务器和客户端之间进行数据传输时,可以采用omaf-dash(Omni-directional Media Application Format,全景媒体的应用格式)),进行全景视频的tile(图像块)编码和传输。Omaf-dash协议把视频在空域内切割成多个tile,在时域按照一定时间间隔,每个tile对应一定时长的视频被编码打包成一个碎片的mp4文件。
相关技术中,传输高清的码流会产生较大传输代价,且在重点区域切换视角播放的时候由于临时重新传输的数据较多,传输较慢,导致观看体验不佳。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种数据的传输方法及装置、存储介质、电子设备。
根据本发明实施例的一个方面,提供了一种数据的传输方法,包括:获取待传输的全景视频源数据;在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;向所述播放端传输所述全景视频目标数据。
进一步,在所述全景视频源数据内检测目标物体的运动轨迹包括:在所述全景视频源数据的多个图像帧中定位与预设图片匹配的第一目标物体;在所述多个图像帧中分别生成包含所述第一目标物体的候选区域;检测多个所述候选区域的移动轨迹,并将多个所述候选区域的移动轨迹确定为所述第一目标物体的运动轨迹。
进一步,在所述全景视频源数据内检测目标物体的运动轨迹包括:检测所述全景视频源数据内的M个第二目标物体;基于所述第二目标物体的区域框面积和/或所述第二目标物体距离中心点的距离对所述M个第二目标物体进行排序,得到目标序列;在所述目标序列选择若干个符合预定条件的N个第二目标物体,并在所述全景视频源数据内检测所述N个第二目标物体的运动轨迹,其中,N≤M,M,N均为正整数。
进一步,获取播放端的视角切换方向包括:接收所述播放端发送的视角切换信息,其中,所述视角切换信息用于指示所述播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;基于所述视角切换信息解析所述播放端的视角切换方向。
进一步,基于所述视角切换信息解析所述播放端的视角切换方向包括:基于所述视角切换模式确定所述播放端的视角移动范围,其中,所述视角切换模式包括:注视模式,定向移动模式,闪动模式;在所述视角移动范围内定位所述视角移动方向,并将所述视角移动方向确定为所述播放端的视角切换方向。
进一步,获取播放端的视角切换方向包括:按照预设周期持续检测所述播放端的播放视角;若在所述预设周期内持续检测到所述播放端的播放视角沿着同一方向定向移动,将所述预设周期内所述播放视角的平均移动方向输出为所述播放端的视角切换方向。
进一步,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据包括:从所述全景视频源数据中提取所述目标源数据;按照第一量化参数QP值对所述全景视频源数据中的目标源数据进行编码,得到第一子数据,以及按照第二QP值对所述全景视频源数据中除所述目标源数据之外的源数据进行编码,得到第二子数据,其中,所述第一QP值小于所述第二QP值;组合所述第一子数据和所述第二子数据,得到所述全景视频目标数据。
进一步,在对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据之前,所述方法还包括:判断所述运动轨迹和所述视角切换方向的角度差是否小于预设阈值;若所述运动轨迹和所述视角切换方向的角度差小于预设阈值,确定所述运动轨迹与所述视角切换方向匹配;若所述运动轨迹和所述视角切换方向的角度差大于或等于预设阈值,确定所述运动轨迹与所述视角切换方向不匹配。
根据本发明实施例的一个方面,提供了另一种数据的传输方法,包括:向服务器发送视角切换信息,其中,所述视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;接收所述服务器传输的全景视频目标数据,其中,所述全景视频目标数据是所述服务器根据所述视角切换信息和全景视频源数据内目标物体的运动轨迹生成的;在本地播放所述全景视频目标数据。
根据本发明实施例的另一个方面,提供了一种数据的传输装置,包括:获取模块,用于获取待传输的全景视频源数据;处理模块,用于在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;编码模块,用于若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;输出模块,用于向所述播放端传输所述全景视频目标数据。
进一步,所述处理模块包括:定位单元,用于在所述全景视频源数据的多个图像帧中定位与预设图片匹配的第一目标物体;生成单元,用于在所述多个图像帧中分别生成包含所述第一目标物体的候选区域;第一检测单元,用于检测多个所述候选区域的移动轨迹,并将多个所述候选区域的移动轨迹确定为所述第一目标物体的运动轨迹。
进一步,所述处理模块包括:第二检测单元,用于检测所述全景视频源数据内的M个第二目标物体;排序单元,用于基于所述第二目标物体的区域框面积和/或所述第二目标物体距离中心点的距离对所述M个第二目标物体进行排序,得到目标序列;第三检测单元,用于在所述目标序列选择若干个符合预定条件的N个第二目标物体,并在所述全景视频源数据内检测所述N个第二目标物体的运动轨迹,其中,N≤M,M,N均为正整数。
进一步,所述处理模块包括:接收单元,用于接收所述播放端发送的视角切换信息,其中,所述视角切换信息用于指示所述播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;解析单元,用于基于所述视角切换信息解析所述播放端的视角切换方向。
进一步,所述解析单元包括:确定子单元,用于基于所述视角切换模式确定所述播放端的视角移动范围,其中,所述视角切换模式包括:注视模式,定向移动模式,闪动模式;定位子单元,用于在所述视角移动范围内定位所述视角移动方向,并将所述视角移动方向确定为所述播放端的视角切换方向。
进一步,所述处理模块包括:第四检测单元,用于按照预设周期持续检测所述播放端的播放视角;输出单元,用于若在所述预设周期内持续检测到所述播放端的播放视角沿着同一方向定向移动,将所述预设周期内所述播放视角的平均移动方向输出为所述播放端的视角切换方向。
进一步,所述编码模块包括:提取单元,用于从所述全景视频源数据中提取所述目标源数据;编码单元,用于按照第一量化参数QP值对所述全景视频源数据中的目标源数据进行编码,得到第一子数据,以及按照第二QP值对所述全景视频源数据中除所述目标源数据之外的源数据进行编码,得到第二子数据,其中,所述第一QP值小于所述第二QP值;组合单元,用于组合所述第一子数据和所述第二子数据,得到所述全景视频目标数据。
进一步,所述装置还包括:判断模块,用于在所述编码模块对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据之前,判断所述运动轨迹和所述视角切换方向的角度差是否小于预设阈值;确定模块,用于若所述运动轨迹和所述视角切换方向的角度差小于预设阈值,确定所述运动轨迹与所述视角切换方向匹配;若所述运动轨迹和所述视角切换方向的角度差大于或等于预设阈值,确定所述运动轨迹与所述视角切换方向不匹配。
根据本发明实施例的另一个方面,提供了另一种数据的传输装置,包括:发送模块,用于向服务器发送视角切换信息,其中,所述视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;接收模块,用于接收所述服务器传输的全景视频目标数据,其中,所述全景视频目标数据是所述服务器根据所述视角切换信息和全景视频源数据内目标物体的运动轨迹生成的;播放模块,用于在本地播放所述全景视频目标数据
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
根据本发明实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
通过本发明,获取待传输的全景视频源数据,在全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向,若运动轨迹与视角切换方向匹配,对全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,向播放端传输全景视频目标数据,通过在切换前的传输阶段预先检测目标物体的运动轨迹和播放端的视角切换方向,对运动轨迹与视角切换方向匹配的目标源数据进行编码,基于视频内物体的运动轨迹和播放视角调整视频编码的码率,全景视频目标数据对应画面的分辨率大于全景视频源数据中除全景视频目标数据之外的其他数据对应画面的分辨率,解决了相关技术在切换全景视频的视角时容易卡顿的技术问题,避免了视角切换时临时传输高清数据导致的切换延迟,在保持较好的观看体验的同时降低编码码率,减少传输代价。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种服务器的硬件结构框图;
图2是根据本发明实施例的一种数据的传输方法的流程图;
图3是本发明实施例的三种观看模式的原理示意图;
图4是本发明实施例基于人眼特点的全景视频编码原理图;
图5是根据本发明实施例的另一种数据的传输方法的流程图;
图6是根据本发明实施例的一种数据的传输装置的结构框图;
图7是实施本发明实施例的一种电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本发明实施例一所提供的方法实施例可以在计算机、VR设备、服务器或者类似的数据存储设备中执行。以运行在服务器上为例,图1是本发明实施例的一种服务器的硬件结构框图。如图1所示,服务器可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述服务器还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述服务器的结构造成限定。例如,服务器还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储服务器程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种数据的传输方法对应的服务器程序,处理器102通过运行存储在存储器104内的服务器程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种数据的传输方法,图2是根据本发明实施例的一种数据的传输方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取待传输的全景视频源数据;
在本实施例中,全景视频源数据是编码前的原始数据,需要在服务端进行编码后再传输至播放端(全景视频呈现端)。
步骤S204,在全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;
可选的,目标物体的运动轨迹是全景视频中目标物体的动态移动方向,如全景视频源数据包括三个图像帧,按照时序分别是帧1,帧2,帧3,目标物体在帧1,帧2,帧3内的位置分别是左下角,中心点,右上角,则目标物体在全景视频源数据内的运动轨迹为:左下角-中心点-右上角。
通常定向移动模式和注视模式下有较大的概率更关注视频内的移动物体,通过目标检测算法和跟踪算法能够定位到视频内的运动物体,对视频内的物体的运动情况和观看模式调整视频编码的码率分配,能够使用更低的码率获得较好观看体验。
步骤S206,若运动轨迹与视角切换方向匹配,对全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,目标源数据是包括目标物体的数据;
步骤S208,向播放端传输全景视频目标数据。
可选的,该播放端可以是VR设备(如眼镜,头盔等),裸眼显示设备等。
通过上述步骤,获取待传输的全景视频源数据,在全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向,若运动轨迹与视角切换方向匹配,对全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,向播放端传输全景视频目标数据,通过在切换前的传输阶段预先检测目标物体的运动轨迹和播放端的视角切换方向,对运动轨迹与视角切换方向匹配的目标源数据进行编码,基于视频内物体的运动轨迹和播放视角调整视频编码的码率,全景视频目标数据对应画面的分辨率大于全景视频源数据中除全景视频目标数据之外的其他数据对应画面的分辨率,解决了相关技术在切换全景视频的视角时容易卡顿的技术问题,避免了视角切换时临时传输高清数据导致的切换延迟,在保持较好的观看体验的同时降低编码码率,减少传输代价。
在实施例中,可以检测全景视频中的一个或者多个目标物体。
在一个实施方式中,在全景视频源数据内检测目标物体的运动轨迹包括:在全景视频源数据的多个图像帧中定位与预设图片匹配的第一目标物体;在多个图像帧中分别生成包含第一目标物体的候选区域;检测多个候选区域的移动轨迹,并将多个候选区域的移动轨迹确定为第一目标物体的运动轨迹。
在一个示例中,首先用分割算法在多个图像帧的各个图像帧上生成小的区域,这些小的区域为最基础的子区域,然后根据这些区域之间的相似性进行区域合并,衡量相似性的标准可以是颜色,纹理和大小等。不断叠加这种小区域,直到全部合并到一块,然后给每个区域做一个外切的矩形,就得到了多个可能是物体的区域方框,区域方框的区域即候选区域。然后将不同的候选区域放大到同一尺寸,采集卷积网络对候选区域进行分类,找出符合条件的候选区域,对于卷积网络,要求输出的向量维度一样,这样支持向量机(supportvector machines,SVM)才可以分类,为了保证输出维度一样,就必须保证卷积网络的输入的图片大小一致,通过SVM进行物体的分类,这样就从图像帧中检测出第一目标物体,并会预测出这个物体与预设图片匹配的概率。检测出以后,对候选区域做进一步分类和校准,得到最终的检测结果,选取概率大于门限值的候选区域作为最终输出的候选区域。
可选的,该第一目标物体可以是全景视频中的主角头像,如在影片中,主角往往是用户最关注的点,预设图片是全景视频中用户最关注的人物(如主角)的底图,用户在观看全景视频时,会更加关注主角在剧情场景中的移动,主角在全景视频中的运动轨迹,很有可能是用户实际的视角切换轨迹。
在实施例的另一个实施方式中,在全景视频源数据内检测目标物体的运动轨迹包括:检测全景视频源数据内的M个第二目标物体;基于第二目标物体的区域框面积和/或第二目标物体距离中心点的距离对M个第二目标物体进行排序,得到目标序列;在目标序列选择若干个符合预定条件的N个第二目标物体,并在全景视频源数据内检测N个第二目标物体的运动轨迹,其中,N≤M,M,N均为正整数。
在一个示例中,全景视频中包括,5个元素,可以是视频中的道具,人物,布景等,分别是物体1,物体2,物体3,物体4,物体5,采用多目标跟踪算法检测全景视频源数据内的5个第二目标物体,其中,物体1,物体2,物体3,物体4,物体5的区域框面积分别是1.0,2.2,0.8,3.2,1.2,基于区域框面积进行排序,得到目标序列:物体4,物体2,物体5,物体1,物体3,然后在目标序列选择TOP2,将物体4和物体2作为符合预定条件的两个第二目标物体,在全景视频源数据内检测物体4和物体2的运动轨迹。
在本实施例中,可以在播放端或服务端来获取视角切换方向。在一个实施场景中,在播放端计算视角切换方向,获取视角切换信息,然后将其发送至服务端。获取播放端的视角切换方向包括:接收播放端发送的视角切换信息,其中,视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;基于视角切换信息解析播放端的视角切换方向。
可选的,基于视角切换信息解析播放端的视角切换方向包括:基于视角切换模式确定播放端的视角移动范围,其中,视角切换模式包括:注视模式,定向移动模式,闪动模式;在视角移动范围内定位视角移动方向,并将视角移动方向确定为播放端的视角切换方向。
其中,视角移动范围可以是角度范围,也可以是一个区域范围,注视模式的视角移动范围为一个0度(在原地),或者是半径小于第一阈值的第一圆形区域,定向移动模式的视角移动范围为20度(可以是10~180度内的一个值),或者是一个圆心角为20度的扇形区域,闪动模式的视角移动范围为360度,或者是半径大于第二阈值的第二圆形区域,通过先确定一个视角移动范围,然后在视角移动范围内定位视角移动方向,可以缩短视角移动方向的定位时间,此外,如果视角移动方向没在视角切换模式的视角移动范围内,说明用户临时变更了注视模式或者是用户执行了与观看视频不相关的动作,判断当前周期获得视角切换信息无效,需要重新获取视角切换信息。
在本实施例的一个实施方式中,由服务端基于播放端实时反馈的播放视角,计算视角切换方向。获取播放端的视角切换方向包括:按照预设周期持续检测播放端的播放视角;若在预设周期内持续检测到播放端的播放视角沿着同一方向定向移动,将预设周期内播放视角的平均移动方向输出为播放端的视角切换方向。
在本实施例中,视角切换模式与用户的观看模式对应,即观看全景视频的状态,如注视模式,定向移动模式和闪动模式等。在一个示例中,视角切换模式包括注视模式,定向移动模式和闪动模式。图3是本发明实施例的三种观看模式的原理示意图,注视模式指视角长时间不变化的观看模式,表示观看者正在观看某个固定视角的内容;定向移动模式也可以理解为追视模式,表示视角沿着某个方向定向移动的观看模式,代表观看者正在追视视频内某个移动的物体或者正在扫视整个视频;闪动模式指视角没有固定的移动方向,表示观看者当前可能在随机浏览全景视频的内容。本实施例基于三种观看模式结合人眼的特点执行编码过程中的码率分配,在人眼关注的区域分配更高的码率,例如注视模式下人眼能够更好的关注到视野内的细节,因此可以判断为注视模式的情况下,对当前关注区域分配更高的码率进行编码,保留更多的细节;在定向移动模式下,用户对与移动方向一致的物体细节更加关注,但是对和移动方向不一致的区域则会产生运动模糊,因此在定向移动的情况下对与移动方向不一致的区域分配较低的码率,在节省码率的同时,也不影响实际的观看体验;在闪动模式下人眼基本无法关注细节,可以对整个画面分配较低的码率。
图4是本发明实施例基于人眼特点的全景视频编码原理图,基于人眼特点的全景视频编码算法,全景视频可以采用基于fov(Field of Vision,视角)的视频播放格式。通过新增对全景视频源数据的预处理,通过目标检测算法或多目标跟踪算法得到全景视频内运动物体的轨迹,此外,播放端也新增了观看模式的检测功能,播放端每次返回视角变化的信息的同时还返回当前的观看模式的信息(如通过标志位进行标识,0代表注视模式,1代表定向移动模式,2代表闪动模式)。目标检测算法和多目标跟踪算法根据对实时性和算力的要求选用适当的基于深度学习的模型进行。播放端判断观看模式的过程包括:设定一个时长timestay,作为预设周期,当经过这个固定时长没有检测到fov的改变则认为当前处于注视模式,当在固定时长内持续检测到fov的改变,且沿着同一个方向(可以设置一个允许的偏移范围,如所有方向角度差最大不超过20度,角度差可以是一个设定阈值,小于该设定阈值则认为方向一致,否则认定方向不一致),则认为处于定向移动模式,如果不属于以上两种情况则认为属于闪动模式。进一步的,在定向移动模式下,取当前时长timestay内的平均fov移动方向mvavg作为播放端的视角切换方向。
在本实施例的一个实施方式中,对全景视频源数据中的目标源数据进行编码,生成全景视频目标数据包括:从全景视频源数据中提取目标源数据;按照第一量化参数QP值对全景视频源数据中的目标源数据进行编码,得到第一子数据,以及按照第二QP值对全景视频源数据中除目标源数据之外的源数据进行编码,得到第二子数据,其中,第一QP值小于第二QP值;组合第一子数据和第二子数据,得到全景视频目标数据。由于第一QP值小于第二QP值,因此采用第一QP值编码得到第一子数据是高清数据,采用第二QP值编码得到第二子数据是低清数据。
在一个示例中,高清数据是指分辨率大于或等于720p,且码率大于或等于3072kbps的视频数据,分辨率小于720p,或码率小于3072kbps的视频数据为低清数据。
在本实施例的一个实施方式中,在获取待传输的全景视频源数据之后,还包括:确定该播放端的视角切换模式,其中,该视角切换模式用于指示播放端的视角切换范围;若播放端为第一视角切换模式,基于第一码率对全景视频源数据进行编码,若播放端为第二视角切换模式,基于第二码率对全景视频源数据进行编码,其中,第一视角切换模式的视角切换范围小于第二视角切换模式的视角切换范围,第一码率大于第二码率,可选的,第一视角切换模式为注视模式,第二视角切换模式为闪动模式。
在一个实例中,设定一个QP(量化参数,Quantizer Parameter)减退值qpcut,当处于注视模式下,对播放视角的tile采用正常的QP进行编码;当处于定向移动状态下,对运动轨迹与视角切换方向匹配的物体所在的tile采用正常QP进行编码,未匹配到的tile内所有编码树单元(Coding Tree Unit,CTU)采用QP+qpcut进行编码,节省码率;对闪动模式下,所有tile的所有CTU采用QP+qpcut进行编码,qpcut为正数。
在本实施例中,在对全景视频源数据中的目标源数据进行编码,生成全景视频目标数据之前,还包括:判断运动轨迹和视角切换方向的角度差是否小于预设阈值;若运动轨迹和视角切换方向的角度差小于预设阈值,确定运动轨迹与视角切换方向匹配;若运动轨迹和视角切换方向的角度差大于或等于预设阈值,确定运动轨迹与视角切换方向不匹配。
可选的,以预设阈值为20度为例,通过匹配视频内物体的移动轨迹,差小于20度则认为移动方向一致。
图5是根据本发明实施例的另一种数据的传输方法的流程图,与图2所示的实施例对应,应用在与服务器对应的视频播放客户端,如图5所示,该流程包括如下步骤:
步骤S502,向服务器发送视角切换信息,其中,视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;
步骤S504,接收服务器传输的全景视频目标数据,其中,全景视频目标数据是服务器根据视角切换信息和全景视频源数据内目标物体的运动轨迹生成的;
步骤S506,在本地播放全景视频目标数据。
在播放端新增观看模式的检测步骤,每次返回视角移动方向的时候也需要返回当前的观看模式的信息,发送给服务器,服务器根据视角切换信息和全景视频源数据内目标物体的运动轨迹从待传输的全景视频源数据中提取全景视频目标数据。
基于本实施例的方案,提出了一种基于人眼特点的全景视频编码算法,全景视频包括注视模式、定向移动模式和快速的闪动模式,由于在不同的模式下人眼对细节的敏感度不相同,在定向移动模式和注视模式下有较大的概率更关注视频内的移动物体,通过目标检测算法和跟踪算法能够定位到视频内的运动物体,基于视频内的物体的运动情况和观看模式调整视频编码的码率,能够使用更低的码率获得较好的观看体验。本实施例基于视频内容和视角变化的模式进行码率分配,在保持较好的观看体验的同时降低码率,减少传输代价。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种数据的传输装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本发明实施例的一种数据的传输装置的结构框图,如图6所示,该装置包括:获取模块60,处理模块62,编码模块64,输出模块66,其中,
获取模块60,用于获取待传输的全景视频源数据;
处理模块62,用于在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;
编码模块64,用于若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;
输出模块66,用于向所述播放端传输所述全景视频目标数据。
可选的,所述处理模块包括:定位单元,用于在所述全景视频源数据的多个图像帧中定位与预设图片匹配的第一目标物体;生成单元,用于在所述多个图像帧中分别生成包含所述第一目标物体的候选区域;第一检测单元,用于检测多个所述候选区域的移动轨迹,并将多个所述候选区域的移动轨迹确定为所述第一目标物体的运动轨迹。
可选的,所述处理模块包括:第二检测单元,用于检测所述全景视频源数据内的M个第二目标物体;排序单元,用于基于所述第二目标物体的区域框面积和/或所述第二目标物体距离中心点的距离对所述M个第二目标物体进行排序,得到目标序列;第三检测单元,用于在所述目标序列选择若干个符合预定条件的N个第二目标物体,并在所述全景视频源数据内检测所述N个第二目标物体的运动轨迹,其中,N≤M,M,N均为正整数。
可选的,所述处理模块包括:接收单元,用于接收所述播放端发送的视角切换信息,其中,所述视角切换信息用于指示所述播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;解析单元,用于基于所述视角切换信息解析所述播放端的视角切换方向。
可选的,所述解析单元包括:确定子单元,用于基于所述视角切换模式确定所述播放端的视角移动范围,其中,所述视角切换模式包括:注视模式,定向移动模式,闪动模式;定位子单元,用于在所述视角移动范围内定位所述视角移动方向,并将所述视角移动方向确定为所述播放端的视角切换方向。
可选的,所述处理模块包括:第四检测单元,用于按照预设周期持续检测所述播放端的播放视角;输出单元,用于若在所述预设周期内持续检测到所述播放端的播放视角沿着同一方向定向移动,将所述预设周期内所述播放视角的平均移动方向输出为所述播放端的视角切换方向。
可选的,所述编码模块包括:提取单元,用于从所述全景视频源数据中提取所述目标源数据;编码单元,用于按照第一量化参数QP值对所述全景视频源数据中的目标源数据进行编码,得到第一子数据,以及按照第二QP值对所述全景视频源数据中除所述目标源数据之外的源数据进行编码,得到第二子数据,其中,所述第一QP值小于所述第二QP值;组合单元,用于组合所述第一子数据和所述第二子数据,得到所述全景视频目标数据。
可选的,所述装置还包括:判断模块,用于在所述编码模块对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据之前,判断所述运动轨迹和所述视角切换方向的角度差是否小于预设阈值;确定模块,用于若所述运动轨迹和所述视角切换方向的角度差小于预设阈值,确定所述运动轨迹与所述视角切换方向匹配;若所述运动轨迹和所述视角切换方向的角度差大于或等于预设阈值,确定所述运动轨迹与所述视角切换方向不匹配。
本实施例还提供了另一种数据的传输装置,包括:发送模块,用于向服务器发送视角切换信息,其中,所述视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;接收模块,用于接收所述服务器传输的全景视频目标数据,其中,所述全景视频目标数据是所述服务器根据所述视角切换信息和全景视频源数据内目标物体的运动轨迹生成的;播放模块,用于在本地播放所述全景视频目标数据。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本申请实施例还提供了一种电子设备,图7是本发明实施例的一种电子设备的结构图,如图7所示,包括处理器71、通信接口72、存储器73和通信总线74,其中,处理器71,通信接口72,存储器73通过通信总线74完成相互间的通信,存储器73,用于存放计算机程序;处理器71,用于执行存储器73上所存放的程序时,实现如下步骤:获取待传输的全景视频源数据;在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;向所述播放端传输所述全景视频目标数据。
进一步,在所述全景视频源数据内检测目标物体的运动轨迹包括:在所述全景视频源数据的多个图像帧中定位与预设图片匹配的第一目标物体;在所述多个图像帧中分别生成包含所述第一目标物体的候选区域;检测多个所述候选区域的移动轨迹,并将多个所述候选区域的移动轨迹确定为所述第一目标物体的运动轨迹。
进一步,在所述全景视频源数据内检测目标物体的运动轨迹包括:检测所述全景视频源数据内的M个第二目标物体;基于所述第二目标物体的区域框面积和/或所述第二目标物体距离中心点的距离对所述M个第二目标物体进行排序,得到目标序列;在所述目标序列选择若干个符合预定条件的N个第二目标物体,并在所述全景视频源数据内检测所述N个第二目标物体的运动轨迹,其中,N≤M,M,N均为正整数。
进一步,获取播放端的视角切换方向包括:接收所述播放端发送的视角切换信息,其中,所述视角切换信息用于指示所述播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;基于所述视角切换信息解析所述播放端的视角切换方向。
进一步,基于所述视角切换信息解析所述播放端的视角切换方向包括:基于所述视角切换模式确定所述播放端的视角移动范围,其中,所述视角切换模式包括:注视模式,定向移动模式,闪动模式;在所述视角移动范围内定位所述视角移动方向,并将所述视角移动方向确定为所述播放端的视角切换方向。
进一步,获取播放端的视角切换方向包括:按照预设周期持续检测所述播放端的播放视角;若在所述预设周期内持续检测到所述播放端的播放视角沿着同一方向定向移动,将所述预设周期内所述播放视角的平均移动方向输出为所述播放端的视角切换方向。
进一步,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据包括:从所述全景视频源数据中提取所述目标源数据;按照第一量化参数QP值对所述全景视频源数据中的目标源数据进行编码,得到第一子数据,以及按照第二QP值对所述全景视频源数据中除所述目标源数据之外的源数据进行编码,得到第二子数据,其中,所述第一QP值小于所述第二QP值;组合所述第一子数据和所述第二子数据,得到所述全景视频目标数据。
进一步,在对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据之前,所述方法还包括:判断所述运动轨迹和所述视角切换方向的角度差是否小于预设阈值;若所述运动轨迹和所述视角切换方向的角度差小于预设阈值,确定所述运动轨迹与所述视角切换方向匹配;若所述运动轨迹和所述视角切换方向的角度差大于或等于预设阈值,确定所述运动轨迹与所述视角切换方向不匹配。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据的传输方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据的传输方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (13)
1.一种数据的传输方法,其特征在于,包括:
获取待传输的全景视频源数据;
在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;
若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;
向所述播放端传输所述全景视频目标数据。
2.根据权利要求1所述的方法,其特征在于,在所述全景视频源数据内检测目标物体的运动轨迹包括:
在所述全景视频源数据的多个图像帧中定位与预设图片匹配的第一目标物体;
在所述多个图像帧中分别生成包含所述第一目标物体的候选区域;
检测多个所述候选区域的移动轨迹,并将多个所述候选区域的移动轨迹确定为所述第一目标物体的运动轨迹。
3.根据权利要求1所述的方法,其特征在于,在所述全景视频源数据内检测目标物体的运动轨迹包括:
检测所述全景视频源数据内的M个第二目标物体;
基于所述第二目标物体的区域框面积和/或所述第二目标物体距离中心点的距离对所述M个第二目标物体进行排序,得到目标序列;
在所述目标序列选择若干个符合预定条件的N个第二目标物体,并在所述全景视频源数据内检测所述N个第二目标物体的运动轨迹,其中,N≤M,M,N均为正整数。
4.根据权利要求1所述的方法,其特征在于,获取播放端的视角切换方向包括:
接收所述播放端发送的视角切换信息,其中,所述视角切换信息用于指示所述播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;
基于所述视角切换信息解析所述播放端的视角切换方向。
5.根据权利要求4所述的方法,其特征在于,基于所述视角切换信息解析所述播放端的视角切换方向包括:
基于所述视角切换模式确定所述播放端的视角移动范围,其中,所述视角切换模式包括:注视模式,定向移动模式,闪动模式;
在所述视角移动范围内定位所述视角移动方向,并将所述视角移动方向确定为所述播放端的视角切换方向。
6.根据权利要求1所述的方法,其特征在于,获取播放端的视角切换方向包括:
按照预设周期持续检测所述播放端的播放视角;
若在所述预设周期内持续检测到所述播放端的播放视角沿着同一方向定向移动,将所述预设周期内所述播放视角的平均移动方向输出为所述播放端的视角切换方向。
7.根据权利要求1所述的方法,其特征在于,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据包括:
从所述全景视频源数据中提取所述目标源数据;
按照第一量化参数QP值对所述全景视频源数据中的目标源数据进行编码,得到第一子数据,以及按照第二QP值对所述全景视频源数据中除所述目标源数据之外的源数据进行编码,得到第二子数据,其中,所述第一QP值小于所述第二QP值;
组合所述第一子数据和所述第二子数据,得到所述全景视频目标数据。
8.根据权利要求1所述的方法,其特征在于,在对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据之前,所述方法还包括:
判断所述运动轨迹和所述视角切换方向的角度差是否小于预设阈值;
若所述运动轨迹和所述视角切换方向的角度差小于预设阈值,确定所述运动轨迹与所述视角切换方向匹配;若所述运动轨迹和所述视角切换方向的角度差大于或等于预设阈值,确定所述运动轨迹与所述视角切换方向不匹配。
9.一种数据的传输方法,其特征在于,包括:
向服务器发送视角切换信息,其中,所述视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;
接收所述服务器传输的全景视频目标数据,其中,所述全景视频目标数据是所述服务器根据所述视角切换信息和全景视频源数据内目标物体的运动轨迹生成的;
在本地播放所述全景视频目标数据。
10.一种数据的传输装置,其特征在于,包括:
获取模块,用于获取待传输的全景视频源数据;
处理模块,用于在所述全景视频源数据内检测目标物体的运动轨迹,以及获取播放端的视角切换方向;
编码模块,用于若所述运动轨迹与所述视角切换方向匹配,对所述全景视频源数据中的目标源数据进行编码,生成全景视频目标数据,其中,所述目标源数据是包括所述目标物体的数据;
输出模块,用于向所述播放端传输所述全景视频目标数据。
11.一种数据的传输装置,其特征在于,包括:
发送模块,用于向服务器发送视角切换信息,其中,所述视角切换信息用于指示播放端当前的视角切换模式,以及在当前视角切换模式下的视角移动方向;
接收模块,用于接收所述服务器传输的全景视频目标数据,其中,所述全景视频目标数据是所述服务器根据所述视角切换信息和全景视频源数据内目标物体的运动轨迹生成的;
播放模块,用于在本地播放所述全景视频目标数据。
12.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至9中任一项所述的方法步骤。
13.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1至9中任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110713207.3A CN115529451A (zh) | 2021-06-25 | 2021-06-25 | 数据的传输方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110713207.3A CN115529451A (zh) | 2021-06-25 | 2021-06-25 | 数据的传输方法及装置、存储介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115529451A true CN115529451A (zh) | 2022-12-27 |
Family
ID=84693454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110713207.3A Pending CN115529451A (zh) | 2021-06-25 | 2021-06-25 | 数据的传输方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115529451A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106454401A (zh) * | 2016-10-26 | 2017-02-22 | 乐视网信息技术(北京)股份有限公司 | 一种播放视频的方法及装置 |
CN108322727A (zh) * | 2018-02-28 | 2018-07-24 | 北京搜狐新媒体信息技术有限公司 | 一种全景视频传输方法及装置 |
US20180367802A1 (en) * | 2017-06-19 | 2018-12-20 | Shenzhen Boyan Technology Ltd. | Optimized coding method for omnidirectional video, computer readable storage medium and computer device |
CN109672897A (zh) * | 2018-12-26 | 2019-04-23 | 北京数码视讯软件技术发展有限公司 | 全景视频编码方法及装置 |
US20190313079A1 (en) * | 2018-04-04 | 2019-10-10 | Alibaba Group Holding Limited | Method, Computer Storage Media, and Client for Switching Scenes of Panoramic Video |
CN111182218A (zh) * | 2020-01-07 | 2020-05-19 | 影石创新科技股份有限公司 | 全景视频处理方法、装置、设备及存储介质 |
-
2021
- 2021-06-25 CN CN202110713207.3A patent/CN115529451A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106454401A (zh) * | 2016-10-26 | 2017-02-22 | 乐视网信息技术(北京)股份有限公司 | 一种播放视频的方法及装置 |
US20180367802A1 (en) * | 2017-06-19 | 2018-12-20 | Shenzhen Boyan Technology Ltd. | Optimized coding method for omnidirectional video, computer readable storage medium and computer device |
CN108322727A (zh) * | 2018-02-28 | 2018-07-24 | 北京搜狐新媒体信息技术有限公司 | 一种全景视频传输方法及装置 |
US20190313079A1 (en) * | 2018-04-04 | 2019-10-10 | Alibaba Group Holding Limited | Method, Computer Storage Media, and Client for Switching Scenes of Panoramic Video |
CN109672897A (zh) * | 2018-12-26 | 2019-04-23 | 北京数码视讯软件技术发展有限公司 | 全景视频编码方法及装置 |
CN111182218A (zh) * | 2020-01-07 | 2020-05-19 | 影石创新科技股份有限公司 | 全景视频处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110602554B (zh) | 封面图像确定方法、装置及设备 | |
CN106060515B (zh) | 全景媒体文件推送方法及装置 | |
US20180146198A1 (en) | Predicting and verifying regions of interest selections | |
CN110121098B (zh) | 视频播放方法、装置、存储介质和电子装置 | |
US11184646B2 (en) | 360-degree panoramic video playing method, apparatus, and system | |
CN110691259A (zh) | 视频播放方法、系统、装置、电子设备及存储介质 | |
CN108632666B (zh) | 一种视频检测方法及视频检测设备 | |
CN103870559A (zh) | 一种基于播放的视频获取信息的方法及设备 | |
CN112291634B (zh) | 视频处理方法及装置 | |
CN109783680B (zh) | 图像推送方法、图像获取方法、装置及图像处理系统 | |
CN111131817A (zh) | 屏幕共享方法、设备、存储介质及屏幕共享系统 | |
CN112468806B (zh) | 一种用于云vr平台的全景视频传输优化方法 | |
CN111507342A (zh) | 一种图像处理方法、装置、系统及存储介质 | |
CN111402301B (zh) | 积水检测方法及装置、存储介质及电子装置 | |
CN112163993A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111494947B (zh) | 摄像机移动轨迹确定方法、装置、电子设备及存储介质 | |
CN112948627B (zh) | 一种报警视频生成方法、显示方法和装置 | |
CN116828262B (zh) | 一种视频信号分流方法及装置 | |
CN115529451A (zh) | 数据的传输方法及装置、存储介质、电子设备 | |
CN114501051B (zh) | 直播对象的标记显示方法和装置、存储介质及电子设备 | |
CN116168045A (zh) | 扫变镜头的分割方法和系统、存储介质及电子设备 | |
CN114449346B (zh) | 视频处理方法、装置、设备以及存储介质 | |
CN110418150A (zh) | 一种信息提示方法、设备、系统及计算机可读存储介质 | |
CN111988520B (zh) | 一种画面切换方法、装置、电子设备及存储介质 | |
CN109999490B (zh) | 一种降低联网云应用延迟的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |