CN113810755A - 全景视频预览的方法、装置、电子设备及存储介质 - Google Patents

全景视频预览的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113810755A
CN113810755A CN202111082975.XA CN202111082975A CN113810755A CN 113810755 A CN113810755 A CN 113810755A CN 202111082975 A CN202111082975 A CN 202111082975A CN 113810755 A CN113810755 A CN 113810755A
Authority
CN
China
Prior art keywords
resolution
tile data
panoramic video
tile
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111082975.XA
Other languages
English (en)
Other versions
CN113810755B (zh
Inventor
施振磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111082975.XA priority Critical patent/CN113810755B/zh
Publication of CN113810755A publication Critical patent/CN113810755A/zh
Application granted granted Critical
Publication of CN113810755B publication Critical patent/CN113810755B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开提供了全景视频预览的方法、装置、电子设备及存储介质,涉及图像处理领域,尤其涉及计算机视觉、全景视频图像技术领域。具体实现方案为:获取待预览的第一时刻对应的第一分辨率的瓦片数据;利用该第一分辨率的瓦片数据生成该第一时刻对应的全景视频截图;根据第一视角从该全景视频截图中选取预览区域;以瓦片数据覆盖该预览区域为原则,获取该第一时刻对应的第二分辨率的瓦片数据,该第二分辨率高于该第一分辨率;根据该第二分辨率的瓦片数据生成该预览区域对应的全景视频预览图。该方案可以快速生成用户待预览时刻的小窗口预览图,该预览图清晰,画面不失真、不扭曲,可有效帮助用户快速、精确定位到感兴趣的全景视频播放时间点。

Description

全景视频预览的方法、装置、电子设备及存储介质
技术领域
本公开涉及图像处理技术领域,尤其涉及计算机视觉、全景视频图像技术等领域,具体涉及一种全景视频预览的方法、装置、电子设备及存储介质。
背景技术
全景视频是一种用3D摄像机进行全方位360度进行拍摄的视频,用户在观看视频的时候,可以随意调节视频上下左右基于不同的视角进行观看,全景视频提供了一种很新鲜的视觉体验,可以让用户得到实现身临其境的体验。
在全景视频的观看过程中,经常会出现用户想跳过当前不感兴趣的播放内容,直接切换到感兴趣内容的情况。但是,由于用户并不了解全景视频每个时间段的播放内容,没办法精确选到自己想看的部分。现有的全景视频观看软件或相关技术生成全景视频预览图较慢,且预览图不能清楚地展示视频中的具体内容,不能帮助用户快速、精确定位到自己感兴趣的全景视频播放时间点。
发明内容
本公开提供了一种全景视频预览的方法、装置、电子设备、可读存储介质以及计算机程序产品,可以为用户提供全景视频的高清、高精度预览。
根据本公开的一方面,提供了一种全景视频预览的方法,该方法可以包括以下步骤:
获取待预览的第一时刻对应的第一分辨率的瓦片数据;
利用该第一分辨率的瓦片数据生成该第一时刻对应的全景视频截图;
根据第一视角从该全景视频截图中选取预览区域;
以瓦片数据覆盖该预览区域为原则,获取该第一时刻对应的第二分辨率的瓦片数据,该第二分辨率高于该第一分辨率;
根据该第二分辨率的瓦片数据生成该预览区域对应的全景视频预览图。
根据本公开的第二方面,提供了一种全景视频预览的装置,该装置可以包括:
第一获取模块,用于获取待预览的第一时刻对应的第一分辨率的瓦片数据;
第一生成模块,用于利用该第一分辨率的瓦片数据生成该第一时刻对应的全景视频截图;
预览区域选取模块,用于根据第一视角从该全景视频截图中选取预览区域;
第二获取模块,用于以瓦片数据覆盖该预览区域为原则,获取该第一时刻对应的第二分辨率的瓦片数据,该第二分辨率高于该第一分辨率;
第二生成模块,用于根据该第二分辨率的瓦片数据生成该预览区域对应的全景视频预览图。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现本公开任一实施例中的方法。
本公开的技术,先获取与待预览的第一时刻对应的低分辨率的瓦片数据,基于此生成低分辨率的全景视频截图,然后从中确定预览区域,再获取覆盖该预览区域的第一时刻的高分辨率瓦片图,然后基于该高分辨率瓦片图生成与用户想预览的区域对应的全景视频预览图。通过上述技术,可以快速、精准生成用户待预览时刻的小窗口的预览图,该预览图可以清楚地显示全景视频中用户关注视角内的内容,画面不失真、不扭曲,该预览图可以用来帮助用户快速、精确定位到自己感兴趣的全景视频播放时间点。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一实施例的全景视频预览的硬件实体示意图;
图2是根据本公开一实施例中的全景视频截图的示意图;
图3是根据本公开一实施例的全景视频预览的方法的流程示意图;
图4是根据本公开一实施例的原始截图雪碧图的示意图;
图5是根据本公开一实施例的球形模型示意图;
图6是根据本公开一实施例的全景视频瓦片获取方法的示意图;
图7是根据本公开一实施例的符合第一视角的全景视频预览图;
图8是根据本公开一实施例的全景视频预览示意图;
图9是根据本公开一实施例的全景视频预览的装置示意图;
图10是用来实现本公开实施例的全景视频预览的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1是应用于本公开一实施例的全景视频预览的硬件实体示意图,图1中包括:服务器101(如由多个服务器构成的服务器集群)、各终端(终端110-终端140),比如台式机,PC机,手机,一体机等类型。其中,各终端可以通过有线网络或者无线网络与服务器101进行视频信息交互。
上述图1的例子只是实现本公开实施例的一个系统架构实例,本公开实施例并不限于上述图1所述的系统结构,基于该系统架构,提出本公开各个实施例。
针对普通视频的预览技术相对已经比较成熟,在观看普通视频时,如果用户想获得视频某一时刻的播放内容,可以将鼠标或进度条等拖动到感兴趣的时间点,即可获得该时间点对应视频截图的缩略图,从该缩略图中,用户可以清晰地看到视频中的内容。
但是,如果直接获取全景视频对应时间点截图的缩略图,用户可能无法从该缩略图中看清全景视频的播放内容。这是由于,第一,全景视频是全方位360度拍摄的视频,截图的画面非常大,缩小后会不易看清其中包括的内容;第二,如图2所示,全景视频截图如果直接展示出来时是有畸变的,画面中的建筑物、动物、人物都出现了扭曲和畸变,用户无法从中看清具体内容,且观看这种畸变的预览图会导致用户体验很差。
根据本公开的实施例,提供了一种全景视频预览的方法,图3是根据本公开一实施例的全景视频预览的方法的流程示意图,具体包括:
S301、获取待预览的第一时刻对应的第一分辨率的瓦片数据;
一示例中,待预览时刻即是用户想要预览的全景视频中某一时刻,可以通过用户的鼠标位置或用户拖拉进度条的位置获得,此处不做限定。瓦片数据是利用多层级瓦片技术处理过的原始全景视频截图(以下简称原始截图),因为每张原始截图都有对应的截取时间,比如截取自全景视频的10分20秒,或截取自全景视频的5分2秒等等,相应的,基于原始截图得到的瓦片图也有对应的截取时间。获取第一时刻对应的瓦片数据即是获取与第一时刻最接近的截取时间对应的瓦片数据,如果有两个截取时间与第一时刻相差的时间相等,则从中任选一个。第一分辨率是预先指定的某一分辨率,可以选取低于指定分辨率的作为第一分辨率,比如预先指定分辨率是1280×1024,如果已生成的瓦片图有小于或等于该分辨率的,则获取对应的瓦片图;如果存在多类小于该分辨率的,比如有640×1024以及640×512的瓦片图,则优先获取分辨率最小的。
一示例中,瓦片数据是服务端利用多层级瓦片技术切分多张原始全景视频截图后得到的不同时间、不同分辨率的瓦片数据,该多张原始全景视频截图是间隔预定时间截取全景视频后得到的。具体地,服务端在获得原始全景视频后,先根据指定的起止时间和间隔时间从视频文件中读取帧数据,生成该原始截图,此时该原始截图的分辨率等于原始全景视频的分辨率。获得截图后,连同对应的截取时刻一起储存,可以选择用雪碧图的形式进行储存,即根据指定的拼接行数和拼接列数,排列原始截图,并将排列好的拼图的字节序列写入图片文件,生成的雪碧图如图4所示。
储存好后,用多层级瓦片技术对不同截取时刻的原始截图分别进行操作。多层级瓦片技术是一种多分辨率的层次存储方式,将同一张图以不同的分辨率进行存储,分辨率从低到高,相应的瓦片数也是逐级递增。先将全景视频的截图按照从左到右,从上到下的顺序进行分割,分割成大小相同的若干张小图片。其中分辨率较低的全景视频截图和高分辨率的全景视频截图的内容是一样的,差别在于分辨率不同。比如:低分辨率的全景图片的分辨率为:512X 256,高分辨率的全景图片的分辨率为:8192X 4096,把该高分辨率的全景图片按照8行16列分割成128张分辨率为512X 512的瓦片图,具体可参考图5,图5展示的是某一时刻的原始截图按照最高分辨率进行切分和存储的模式,图中的线条是瓦片图的切分线。实际应用中,会生成多个级别的瓦片图,比如用1张分辨率为512X 256全景图片(作为第一级)+2张分辨率为512X 512的瓦片图(作为第二级)+8张分辨率为512X 512的瓦片图(作为第三级)+32张分辨率为512X 512的瓦片图(作为第四级)+128张分辨率为512X 512的瓦片图(作为第五级)。
按照上述方法,将多个时刻的原始截图采用多级瓦片技术进行存储,最终每张全景视频截图都可以得到不同级别分辨率的瓦片图,同一级别中瓦片图的分辨率相同,级别越高、分辨率越高,对应的瓦片图个数越高。通过多级瓦片技术,得到不同分辨率的全景视频截图,在实际应用中,可以根据不同的需求获取不同分辨率的全景视频截图数据,如传输速率较差时获取分辨率较低的瓦片,传输速率较好时获取分辨率较高的瓦片,分辨率较低的瓦片可以保证显示速度,分辨率较高的瓦片保证显示效果。
S302、利用该第一分辨率的瓦片数据生成该第一时刻对应的全景视频截图;
一示例中,基于第一分辨率的瓦片数据,生成一张截取时间与第一时刻接近的全景视频截图,该全景视频截图的分辨率较低。
S303、根据第一视角从该全景视频截图中选取预览区域;
一示例中,如图5所示,把第一分辨率的瓦片数据生成的较低分辨率的全景视频截图加载到球形模型上,截取第一视角范围内的图片作为预览区域。具体地,可以先基于第一视角确定用户的凝视点,然后以凝视点为中心扩展出一个固定的视角范围ABCD,比如左右各60度、上下各45度,该范围对应着球形模型上的面即为预览区域。基于预览区域,只显示在用户可视范围内的瓦片图,可以实现无延迟显示。
一示例中,该第一视角可以是用户的当前视角,也可以是包含全景视频中某一预定对象的视角。对于前者,可以获取用户的即时观看视角,将该视角的中心点确定为凝视点,将该视角对应的范围作为预览区域;对于后者,可以通过分析用户的历史观看数据或其余相关的用户数据,得到用户一直在追踪的感兴趣对象,然后将该感兴趣对象的中心设置为用户的凝视点,再用上述方法得到包含该感兴趣对象的预览区域。采用该示例,可以锁定用户感兴趣的预览区域,保证基于该预览区域最终能够生成符合用户实际需要的视频预览图。
一示例中,在用户观看全景视频的期间,当第一视角发生变化时(比如:用户在观看全景视频转动视角时),可以基于变化后的第一视角实时展示改变视角的预览图画面。
S304、以瓦片数据覆盖该预览区域为原则,获取该第一时刻对应的第二分辨率的瓦片数据,该第二分辨率高于该第一分辨率;
一示例中,获取第一时刻对应的第二分辨率的瓦片数据,该瓦片数据需要覆盖该预览区域,具体地,可以获取部分和全部位于该预览区域内的第二分辨率的瓦片数据,如图6所示,虚线表示预览区域,瓦片A1-A3全部位于预览区域内,瓦片A4-A6部分位于预览区域内,最终需要获取第二分辨率的A1-A6瓦片数据。采用该示例,可以精准选出符合第一视角的相关瓦片数据,为接下来生成全景视频预览图做好数据准备。
一示例中,根据用户的凝视点,预览区域就是以凝视点为中心的某一固定范围(比如左右各60度、上下各45度的范围)。当采用第四级瓦片图的策略时,第四级瓦片图分为4行8列,每列图片占据360/8=45度的水平视角,即用户每次最多只能看到3列图片,每行图片占据180/4=45度的垂直视角,即用户每次最多只能看到2行图片,若用户当前的预览区域是第3、4、5三列、第2、3两行,则只获取这三列的6张瓦片图,就可以生成基于第一视角的预览图。
一示例中,获取第二分辨率的瓦片数据,该第二分辨率需要高于第一分辨率,即第二分别率的瓦片数据是相对高分辨率的瓦片数据。因为在之前利用多层级瓦片技术处理原始截图时,生成了多种分辨率的瓦片图,即存在多种高于第一分辨率的瓦片图,具体可以采用如下手段确定将哪一分辨率作为第二分辨率:
首先,获取与服务端之间的数据传输阈值,即计算出在不卡顿的情况下,与服务端之间数据传输的最大值是多少;
然后,根据数据传输阈值确定第二分辨率,即根据数据传输的最大值,确定以哪种分辨率传输瓦片数据时,既能达到数据清晰程度最大化,又能不发生卡顿;
最后,从该服务端获取该第一时刻对应的该第二分辨率的瓦片数据,即基于上一步中确定的分辨率,从服务端获取第一时刻对应的该分辨率的瓦片数据。通过该示例,考虑网络传输综合情况,动态调整瓦片数据的具体分辨率,既可以保证后续预览图能达到最高清晰度,又能保证传输不卡顿,不会有预览图延迟生成的情况发生。
S305、根据该第二分辨率的瓦片数据生成该预览区域对应的全景视频预览图。
一示例中,生成全景图的具体步骤如下:首先,利用该第二分辨率的瓦片数据,生成局部全景图,即将第二分辨率的多张瓦片图按照顺序拼合,得到一张高清晰度的全景视频截图的局部全景图,该局部全景图覆盖了预览区域。然后,保留该局部全景图中预览区域对应的部分,即将预览区域之外的部分裁减掉,可以使用专门的渲染插件将局部全景图渲染到球面上,然后去掉预览区域之外的部分;最后,将该局部全景图的保留部分映射生成矩形的二维图片,将该矩形二维图片作为该预览区域对应的全景视频预览图,生成结果如图7所示,通过上述裁剪手段去掉了用户感兴趣区域外的部分,通过映射去掉了全景图中的形变和扭曲,生成了符合第一视角的全景视频预览图。
一示例中,如图8所示,在全景视频播放的过程中,可以在进度条上方生成用户待预览的第一时刻对应的预览图,可以看出,该预览图与当前全景视频播放帧相比,有着较小的视角,且消除了全景视频中的形变。该视角如上述实施例中所述,是基于用户的当前视角或用户感兴趣的视频中国对象生成的,可以更清晰地展示全景视频中的内容,为用户可以根据该展示内容快速、精确定位到自己感兴趣的时间点。
在预览图生成的过程中,一般都是在用户端进行相应图片的处理,因为如果将生成预览图的步骤放在服务端完成,会造成服务端压力过大的问题。但是,因为用户视角范围内的图片大约占整个全景图片的1/8到1/6左右,如果直接将全景视频的高清截图传给用户端,然后再由用户端对该高清截图进行剪裁处理生成预览图,往往会由于高清截图数据量过大,造成传输时间变长,全景图加载显示在球模型耗时变长,流畅性降低,导致预览图生成很慢,用户需要等待很久才能看到预览图。但是,如果未了保证流畅性,将低分辨率的全景视频截图传给用户端,又会造成预览图模糊。如何在保证图片分辨率的前提下,还要能实现无延迟显示,是亟待解决的问题。
采用上述实施例,先获取与待预览的第一时刻对应的低分辨率的瓦片数据,基于此生成低分辨率的全景视频截图,然后从中确定预览区域,再获取覆盖该预览区域的第一时刻的高分辨率瓦片图,然后基于该分辨率瓦片图生成与用户想预览的区域对应的全景视频预览图。通过上述技术,可以快速、精准生成用户待预览时刻的小窗口的预览图,该预览图可以清楚地显示全景视频中用户关注视角内的内容,画面不失真、不扭曲;另,上述技术中先获取低分辨率的全景视频截图,再利用该低分辨率全景视频截图确定的预览区域精准获取对应区域的高分辨率瓦片图,可以减少冗余图片数据传输造成的数据传输压力和延迟,在提高预览图清晰度的同时,也提高了预览图生成的速度,使用此预览图可以帮助用户快速、精确定位到自己感兴趣的全景视频播放时间点。
根据本公开另一实施例的全景视频预览的方法实施例,具体包括:
获取本地存储的待预览的第一时刻对应的第一分辨率的瓦片数据;或获取服务端存储的待预览的第一时刻对应的第一分辨率的瓦片数据。
一示例中,可以从本地直接获取第一时刻对应的瓦片数据。因为在全景视频播放的过程中,本地会将获得的视频相关数据储存在本地,从中查找是否有与第一时刻对应的第一分辨率瓦片数据,或与第一时刻对应的分辨率高于第一分辨率的瓦片数据,如有,则基于这些从本地直接获取的瓦片数据进行后续处理。如果在本地找不到与第一时刻对应的第一分辨率的瓦片数据,再向服务端请求获取相关数据。采用该示例,可以优先从本地获取生成预览图的素材,进一步加快了预览图的生成速度。
一示例中,从服务端获取第一时刻对应的第一分辨率的瓦片数据可以包括:获取服务端存储的满足预设时间规则的第一分辨率的瓦片数据后储存在本地;从满足预设时间规则的第一分辨率的瓦片数据中筛选出该第一时刻对应的瓦片数据。在具体实施过程中,如果向服务端获取瓦片数据,可以在保证数据传输流畅的前提下,多获取一些相关的瓦片数据储存在本地,以供之后使用。比如,获取第一时刻附近的多份第一分辨率的瓦片数据,或是获取与第一时刻相距0秒、5秒、10秒的多份第一分辨率的瓦片数据,即获取满足预设时间规则的第一分辨率的瓦片数据。获取多份第一分辨率的瓦片数据并储存在本地后,从中选出第一时刻对应的第一分辨率的瓦片数据,用于之后的处理。采用该示例,在保证传输不卡顿延迟的前提下,从服务端多获得一些瓦片图储存在本地,如果之后正好用到已经下载到本地的相关图片,可以直接从本地获取,节省了数据传输的时间,进一步加快了生成缩略图的速度。
如图9所示,本公开的实施例中提供一种全景视频预览的装置900,该装置包括:
第一获取模块901,用于获取待预览的第一时刻对应的第一分辨率的瓦片数据;
第一生成模块902,用于利用该第一分辨率的瓦片数据生成该第一时刻对应的全景视频截图;
预览区域选取模块903,用于根据第一视角从该全景视频截图中选取预览区域;
第二获取模块904,用于以瓦片数据覆盖该预览区域为原则,获取该第一时刻对应的第二分辨率的瓦片数据,该第二分辨率高于该第一分辨率;
第二生成模块905,用于根据该第二分辨率的瓦片数据生成该预览区域对应的全景视频预览图。
其中,该装置的第一获取模块具体包括:
本地获取单元,用于获取本地存储的待预览的第一时刻对应的第一分辨率的瓦片数据;或
服务端获取单元,用于获取服务端存储的待预览的第一时刻对应的第一分辨率的瓦片数据。
该装置的该服务端获取单元用于:
获取服务端存储的满足预设时间规则的第一分辨率的瓦片数据后储存在本地;
从该满足预设时间规则的第一分辨率的瓦片数据中筛选出该第一时刻对应的瓦片数据。
上述全景视频预览的装置中的第二获取模块,用于:在该第一时刻对应的第二分辨率的瓦片数据中,获取部分和全部位于该预览区域内的第二分辨率的瓦片数据。
上述全景视频预览的装置中的第二获取模块,也用于:获取与服务端之间的数据传输阈值;根据该数据传输阈值确定第二分辨率;从该服务端获取该第一时刻对应的该第二分辨率的瓦片数据。
上述全景视频预览的装置中的第二生成模块,用于:利用该第二分辨率的瓦片数据,生成局部全景图;
保留该局部全景图中该预览区域对应的部分;
将保留后的该局部全景图映射生成矩形图片,作为该预览区域对应的全景视频预览图。
上述全景视频预览的装置还包括第一视角获取模块,用于:
获取用户的当前视角作为第一视角;或
获取包含该全景视频中预定对象的视角作为第一视角。
上述全景视频预览的装置,其中,瓦片数据是服务端利用多层级瓦片技术切分多张原始全景视频截图后得到的不同时间、不同分辨率的瓦片数据,该多张原始全景视频截图是间隔预定时间截取全景视频后得到的。
本公开实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图10所示,设备1000包括计算单元1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理,例如方法:利用第一分辨率的瓦片数据生成第一时刻对应的全景视频截图。例如,在一些实施例中,方法生成全景视频截图、生成全景视频预览图等可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时,可以执行上文描述的方法全景视频预览方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行全景视频预览方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (19)

1.一种全景视频预览的方法,包括:
获取待预览的第一时刻对应的第一分辨率的瓦片数据;
利用所述第一分辨率的瓦片数据生成所述第一时刻对应的全景视频截图;
根据第一视角从所述全景视频截图中选取预览区域;
以瓦片数据覆盖所述预览区域为原则,获取所述第一时刻对应的第二分辨率的瓦片数据,所述第二分辨率高于所述第一分辨率;
根据所述第二分辨率的瓦片数据生成所述预览区域对应的全景视频预览图。
2.根据权利要求1所述的方法,其中,所述获取待预览的第一时刻对应的第一分辨率的瓦片数据,包括:
获取本地存储的待预览的第一时刻对应的第一分辨率的瓦片数据;或
获取服务端存储的待预览的第一时刻对应的第一分辨率的瓦片数据。
3.根据权利要求2所述的方法,其中,所述获取服务端存储的待预览的第一时刻对应的第一分辨率的瓦片数据,包括:
获取服务端存储的满足预设时间规则的第一分辨率的瓦片数据后储存在本地;
从所述满足预设时间规则的第一分辨率的瓦片数据中筛选出所述第一时刻对应的瓦片数据。
4.根据权利要求1所述的方法,其中,以瓦片数据覆盖所述预览区域为原则,获取所述第一时刻对应的第二分辨率的瓦片数据,包括:
在所述第一时刻对应的第二分辨率的瓦片数据中,获取部分和全部位于所述预览区域内的第二分辨率的瓦片数据。
5.根据权利要求1所述的方法,其中,所述获取所述第一时刻对应的第二分辨率的瓦片数据,包括:
获取与服务端之间的数据传输阈值;
根据所述数据传输阈值确定第二分辨率;
从所述服务端获取所述第一时刻对应的所述第二分辨率的瓦片数据。
6.根据权利要求1所述的方法,其中,所述根据所述第二分辨率的瓦片数据生成所述预览区域对应的全景视频预览图,包括:
利用所述第二分辨率的瓦片数据,生成局部全景图;
保留所述局部全景图中所述预览区域对应的部分;
将保留后的所述局部全景图映射生成矩形图片,作为所述预览区域对应的全景视频预览图。
7.根据权利要求1所述的方法,还包括:
获取用户的当前视角作为第一视角;或
获取包含所述全景视频中预定对象的视角作为第一视角。
8.根据权利要求1所述的方法,其中,所述瓦片数据是服务端利用多层级瓦片技术切分多张原始全景视频截图后得到的不同时间、不同分辨率的瓦片数据,所述多张原始全景视频截图是间隔预定时间截取全景视频后得到的。
9.一种全景视频预览的装置,包括:
第一获取模块,用于获取待预览的第一时刻对应的第一分辨率的瓦片数据;
第一生成模块,用于利用所述第一分辨率的瓦片数据生成所述第一时刻对应的全景视频截图;
预览区域选取模块,用于根据第一视角从所述全景视频截图中选取预览区域;
第二获取模块,用于以瓦片数据覆盖所述预览区域为原则,获取所述第一时刻对应的第二分辨率的瓦片数据,所述第二分辨率高于所述第一分辨率;
第二生成模块,用于根据所述第二分辨率的瓦片数据生成所述预览区域对应的全景视频预览图。
10.根据权利要求9所述的装置,其中,所述第一获取模块,包括:
本地获取单元,用于获取本地存储的待预览的第一时刻对应的第一分辨率的瓦片数据;或
服务端获取单元,用于获取服务端存储的待预览的第一时刻对应的第一分辨率的瓦片数据。
11.根据权利要求10所述的装置,其中,所述服务端获取单元,用于:
获取服务端存储的满足预设时间规则的第一分辨率的瓦片数据后储存在本地;
从所述满足预设时间规则的第一分辨率的瓦片数据中筛选出所述第一时刻对应的瓦片数据。
12.根据权利要求9所述的装置,其中,所述第二获取模块,用于:
在所述第一时刻对应的第二分辨率的瓦片数据中,获取部分和全部位于所述预览区域内的第二分辨率的瓦片数据。
13.根据权利要求9所述的装置,其中,所述第二获取模块,用于:
获取与服务端之间的数据传输阈值;
根据所述数据传输阈值确定第二分辨率;
从所述服务端获取所述第一时刻对应的所述第二分辨率的瓦片数据。
14.根据权利要求9所述的装置,其中,所述第二生成模块,用于:
利用所述第二分辨率的瓦片数据,生成局部全景图;
保留所述局部全景图中所述预览区域对应的部分;
将保留后的所述局部全景图映射生成矩形图片,作为所述预览区域对应的全景视频预览图。
15.根据权利要求9所述的装置,还包括第一视角获取模块,用于:
获取用户的当前视角作为第一视角;或
获取包含所述全景视频中预定对象的视角作为第一视角。
16.根据权利要求9所述的装置,其中,所述瓦片数据是服务端利用多层级瓦片技术切分多张原始全景视频截图后得到的不同时间、不同分辨率的瓦片数据,所述多张原始全景视频截图是间隔预定时间截取全景视频后得到的。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-8所述方法的步骤。
CN202111082975.XA 2021-09-15 2021-09-15 全景视频预览的方法、装置、电子设备及存储介质 Active CN113810755B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111082975.XA CN113810755B (zh) 2021-09-15 2021-09-15 全景视频预览的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111082975.XA CN113810755B (zh) 2021-09-15 2021-09-15 全景视频预览的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113810755A true CN113810755A (zh) 2021-12-17
CN113810755B CN113810755B (zh) 2023-09-05

Family

ID=78895447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111082975.XA Active CN113810755B (zh) 2021-09-15 2021-09-15 全景视频预览的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113810755B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116069435A (zh) * 2023-03-14 2023-05-05 南京维赛客网络科技有限公司 在虚拟场景中动态加载图片资源的方法、系统及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120293607A1 (en) * 2011-05-17 2012-11-22 Apple Inc. Panorama Processing
EP2824883A1 (en) * 2013-07-12 2015-01-14 Alcatel Lucent A video client and video server for panoramic video consumption
CN106331528A (zh) * 2016-10-24 2017-01-11 宇龙计算机通信科技(深圳)有限公司 一种拍摄处理方法及图像拍摄设备
CN107071268A (zh) * 2017-01-20 2017-08-18 深圳市圆周率软件科技有限责任公司 一种多目全景相机全景拼接方法及系统
CN107205122A (zh) * 2017-08-03 2017-09-26 哈尔滨市舍科技有限公司 多分辨率全景视频直播拍照系统与方法
CN107426502A (zh) * 2017-09-19 2017-12-01 北京小米移动软件有限公司 拍摄方法及装置、电子设备
CN108769739A (zh) * 2018-06-27 2018-11-06 哈尔滨市舍科技有限公司 从全景视频中获取图片和短视频的方法
CN109792562A (zh) * 2016-09-26 2019-05-21 杜比实验室特许公司 视频数据的基于内容的流分割
CN109814703A (zh) * 2017-11-21 2019-05-28 百度在线网络技术(北京)有限公司 一种显示方法、装置、设备和介质
US10521926B1 (en) * 2018-03-21 2019-12-31 Facebook Technologies, Llc Tileable non-planar structured light patterns for wide field-of-view depth sensing
CN112351307A (zh) * 2020-10-26 2021-02-09 咪咕视讯科技有限公司 一种截图方法、服务器、终端设备及计算机可读存储介质
CN112822564A (zh) * 2021-01-06 2021-05-18 鹏城实验室 一种基于视点的全景视频自适应流媒体传输方法及系统
CN113362438A (zh) * 2021-06-30 2021-09-07 北京百度网讯科技有限公司 全景渲染的方法、装置、电子设备、介质及程序
US20220239719A1 (en) * 2019-10-14 2022-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Immersive viewport dependent multiparty video communication

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120293607A1 (en) * 2011-05-17 2012-11-22 Apple Inc. Panorama Processing
EP2824883A1 (en) * 2013-07-12 2015-01-14 Alcatel Lucent A video client and video server for panoramic video consumption
CN109792562A (zh) * 2016-09-26 2019-05-21 杜比实验室特许公司 视频数据的基于内容的流分割
CN106331528A (zh) * 2016-10-24 2017-01-11 宇龙计算机通信科技(深圳)有限公司 一种拍摄处理方法及图像拍摄设备
CN107071268A (zh) * 2017-01-20 2017-08-18 深圳市圆周率软件科技有限责任公司 一种多目全景相机全景拼接方法及系统
CN107205122A (zh) * 2017-08-03 2017-09-26 哈尔滨市舍科技有限公司 多分辨率全景视频直播拍照系统与方法
CN107426502A (zh) * 2017-09-19 2017-12-01 北京小米移动软件有限公司 拍摄方法及装置、电子设备
CN109814703A (zh) * 2017-11-21 2019-05-28 百度在线网络技术(北京)有限公司 一种显示方法、装置、设备和介质
US10521926B1 (en) * 2018-03-21 2019-12-31 Facebook Technologies, Llc Tileable non-planar structured light patterns for wide field-of-view depth sensing
CN108769739A (zh) * 2018-06-27 2018-11-06 哈尔滨市舍科技有限公司 从全景视频中获取图片和短视频的方法
US20220239719A1 (en) * 2019-10-14 2022-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Immersive viewport dependent multiparty video communication
CN112351307A (zh) * 2020-10-26 2021-02-09 咪咕视讯科技有限公司 一种截图方法、服务器、终端设备及计算机可读存储介质
CN112822564A (zh) * 2021-01-06 2021-05-18 鹏城实验室 一种基于视点的全景视频自适应流媒体传输方法及系统
CN113362438A (zh) * 2021-06-30 2021-09-07 北京百度网讯科技有限公司 全景渲染的方法、装置、电子设备、介质及程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗传飞;孔德辉;刘翔凯;徐科;杨浩;: "智慧家庭的VR全景视频业务实现", 电信科学, no. 10 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116069435A (zh) * 2023-03-14 2023-05-05 南京维赛客网络科技有限公司 在虚拟场景中动态加载图片资源的方法、系统及存储介质

Also Published As

Publication number Publication date
CN113810755B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
US11303881B2 (en) Method and client for playing back panoramic video
CN112738541B (zh) 画面显示方法、装置及电子设备
US20220277481A1 (en) Panoramic video processing method and apparatus, and storage medium
CN109829964B (zh) Web增强现实的渲染方法和装置
CN113223130B (zh) 一种路径漫游方法、终端设备以及计算机存储介质
CN112653898B (zh) 用户形象生成方法、相关装置及计算机程序产品
CN113655975B (zh) 图像显示方法、装置、电子设备和介质
CN110710203B (zh) 用于生成和渲染沉浸式视频内容的方法、系统和介质
CN112634414A (zh) 地图显示方法及装置
CN115482325A (zh) 画面渲染方法、装置、系统、设备及介质
CN113810755A (zh) 全景视频预览的方法、装置、电子设备及存储介质
US20180018398A1 (en) Positioning content in computer-generated displays based on available display space
CN114168793A (zh) 主播展示方法、装置、设备和存储介质
CN116828215B (zh) 一种降低本地算力负荷的视频渲染方法及系统
CN112261408B (zh) 用于头戴显示设备的图像处理方法、装置及电子设备
CN113691835B (zh) 视频植入方法、装置、设备及计算机可读存储介质
US11910068B2 (en) Panoramic render of 3D video
CN115834930A (zh) 视频帧传输方法、装置、电子设备及存储介质
CN113784217A (zh) 视频播放方法、装置、设备和存储介质
CN109814703B (zh) 一种显示方法、装置、设备和介质
CN110662099B (zh) 用于显示弹幕的方法和装置
CN113873327A (zh) 一种视频流呈现方法、装置、设备以及存储介质
CN114820908B (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN114332416B (zh) 图像处理方法、装置、设备和存储介质
CN111277886B (zh) 全景视频的视场控制方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant