WO2023236666A1

WO2023236666A1 - 媒体信息处理方法及其装置、存储介质

Info

Publication number: WO2023236666A1
Application number: PCT/CN2023/089286
Authority: WO
Inventors: 陈奇; 王魏强; 张晓渠
Original assignee: 中兴通讯股份有限公司
Priority date: 2022-06-08
Filing date: 2023-04-19
Publication date: 2023-12-14
Also published as: CN117241105A

Abstract

本申请公开了一种媒体信息处理方法及其装置、存储介质。其中，一种媒体信息处理方法，包括：接收多个媒体信息流；获取接收到的目标媒体信息包的第一显示时间戳；将第一显示时间戳作为各个媒体信息流的起始显示时间戳；根据起始显示时间戳对各个媒体信息流进行信息分片，得到多个媒体分片信息，其中，媒体分片信息对应有分片序号，具有相同的分片序号的所有媒体分片信息具有相同的媒体时长；将所有目标媒体分片信息进行聚合，得到自由视点媒体分片信息，其中，目标媒体分片信息为具有相同的分片序号的媒体分片信息。

Description

媒体信息处理方法及其装置、存储介质

相关申请的交叉引用

本申请基于申请号为202210642307.6、申请日为2022年6月8日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及视频技术领域，尤其是一种媒体信息处理方法及其装置、计算机存储介质。

背景技术

随着5G技术和高速互联网的快速发展，元宇宙和全真互联网迅速来临，沉浸媒体应用得到快速发展，目前创新的自由视点技术可以让观众自由选择任意时刻的360度任意观看视角，提升用户沉浸式的体验感，用户在观看视频的过程中可以自由切换视角，但是由于多机位拍摄的同一时刻画面各视角的视频流到达媒体服务器会存在较大的时间差，因此无法确保整体画面的良好画质，大大的影响了用户的体验效果。

发明内容

本申请实施例提供了一种媒体信息处理方法及其装置、计算机存储介质，能够提升用户的视频体验效果。

第一方面，本申请实施例提供了一种媒体信息处理方法，包括：接收多个媒体信息流，其中，所述媒体信息流包括多个媒体信息包；获取接收到的目标媒体信息包的第一显示时间戳，其中，所述目标媒体信息包为所有所述媒体信息包中第一个被接收的媒体信息包；将所述第一显示时间戳作为各个所述媒体信息流的起始显示时间戳；根据所述起始显示时间戳对各个所述媒体信息流进行信息分片，得到各个所述媒体信息流的多个媒体分片信息，其中，所述媒体分片信息对应有分片序号，具有相同的所述分片序号的所有所述媒体分片信息具有相同的媒体时长；将所有所述媒体信息流中的目标媒体分片信息进行聚合，得到自由视点媒体分片信息，其中，所述目标媒体分片信息为具有相同的所述分片序号的所述媒体分片信息。

第二方面，本申请实施例还提供了一种媒体信息处理装置，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如前面所述的媒体信息处理方法。

第三方面，本申请实施例还提供了一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行如前面所述的媒体信息处理方法。

本申请实施例中，通过将获取到的目标媒体信息包的第一显示时间戳统一设置为各个媒体信息流的起始显示时间戳，以解决各个媒体信息流同一时刻画面到达媒体服务器不一致的缺陷，进而在这种情况下根据起始显示时间戳对各个媒体信息流进行信息分片得到多个媒体分片信息，将所有媒体信息流中的具有相同的分片序号的媒体分片信息进行聚合，以得到完整的自由视点媒体分片信息，从而在保证画质的同时，避免视频画面在用户进行视角切换的过程中出现大范围地空间跳跃；因此，本申请实施例使得用户能够实现自由视点间的无缝切换，提升用户的视频体验效果，从而可以弥补相关方法中的技术空白。

附图说明

图1是本申请一个实施例提供的媒体信息处理方法的流程图；

图2a是本申请一个实施例提供的多个媒体信息流在进行对齐前的示意图；

图2b是本申请一个实施例提供的多个媒体信息流在进行对齐后的示意图；

图3是本申请另一个实施例提供的媒体信息处理方法中，得到各个媒体信息流的多个媒体分片信息的流程图；

图4是本申请一个实施例提供的媒体信息处理方法中，得到各个媒体信息流的多个媒体分片信息之前的流程图；

图5是本申请一个实施例提供的媒体信息处理方法中，得到自由视点媒体分片信息的流程图；

图6是本申请一个实施例提供的用于执行媒体信息处理方法的媒体服务器的示意图；

图7是本申请本申请一个实施例提供的对齐模块执行媒体信息处理方法的流程图；

图8是本申请另一个实施例提供的多个媒体信息流的示意图；

图9是本申请一个实施例提供的拼接模块执行媒体信息处理方法的流程图；

图10是本申请一个实施例提供的媒体信息处理装置的示意图。

具体实施方式

为了使本申请的目的、技术方法及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

目前，为了改善多机位拍摄的同一时刻画面各视角的视频流到达媒体服务器会存在较大的时间差的问题，相关技术中将各个机位的视频流压缩后拼接成一幅超高分辨率的大图画面，再进行图像校正，这样对用户的网络带宽要求比较高，且随着机位数的增多，为了适配用户播放器的分辨率，需要降低机位的分辨率，这大大的影响了用户的体验效果。

基于此，本申请提供了一种媒体信息处理方法及其装置、计算机存储介质及计算机程序产品。其中一个实施例的媒体信息处理方法，包括：接收多个媒体信息流，其中，媒体信息流包括多个媒体信息包；获取接收到的目标媒体信息包的第一显示时间戳，其中，目标媒体信息包为所有媒体信息包中第一个被接收的媒体信息包；将第一显示时间戳作为各个媒体信息流的起始显示时间戳；根据起始显示时间戳对各个媒体信息流进行信息分片，得到各个媒体信息流的多个媒体分片信息，其中，媒体分片信息对应有分片序号，具有相同的分片序号的所有媒体分片信息具有相同的媒体时长；将所有媒体信息流中的目标媒体分片信息进行聚合，得到自由视点媒体分片信息，其中，目标媒体分片信息为具有相同的分片序号的媒体分片信息。该实施例中，通过将获取到的目标媒体信息包的第一显示时间戳统一设置为各个媒体信息流的起始显示时间戳，以解决各个媒体信息流同一时刻画面到达媒体服务器不一致的缺陷，进而在这种情况下根据起始显示时间戳对各个媒体信息流进行信息分片得到多个媒体分片信息，将所有媒体信息流中的具有相同的分片序号的媒体分片信息进行聚合，以得到完整的自由视点媒体分片信息，从而在保证画质的同时，避免视频画面在用户进行视角切换的过程中出现大范围地空间跳跃；因此，本申请实施例使得用户能够实现自由视点间的无缝切换，提升用户的视频体验效果，从而可以弥补相关方法中的技术空白。

下面结合附图，对本申请实施例作进一步阐述。

如图1所示，图1是本申请一个实施例提供的媒体信息处理方法的流程图，该媒体信息处理方法可以包括但不限于步骤S110至步骤S150。

步骤S110：接收多个媒体信息流，其中，媒体信息流包括多个媒体信息包。

本步骤中，通过接收多个媒体信息流，以便于在后续步骤中对所接收到的多个媒体信息流进行彼此间的准确区分，从而确定哪个媒体信息流中的媒体信息包为第一个被接收的媒体信息包。

在一实施例中，步骤S110至步骤S150及其相关步骤的执行主体可以由本领域技术人员根据具体情况进行选择设置，此处并未限定。例如，以用于统筹管理各个媒体信息流的媒体服务器作为执行主体，也就是说，通过媒体服务器接收多个媒体信息流，并基于多个媒体信息流执行以下步骤S120至S150及其相关步骤，在媒体服务器中可以设置相应的功能模块以执行对应的步骤，以达到更好的统筹效果，因此可以在媒体服务器中设置收流模块，用于从自由视点前端各个机位上拉取媒体信息流并添加到收流模块中的收流缓存队列中；又如，设置其他的服务器、节点、模块或设备等作为统筹管理媒体服务器的一方，即通过统筹管理媒体服务器以间接地对多个媒体信息流进行处理，那么对应的服务器、节点、模块或设备也可以作为步骤S110至步骤S150及其相关步骤的执行主体。需要说明的是，本申请以下各实施例中主要以“媒体服务器”作为步骤S110至步骤S150及其相关步骤的执行主体进行描述，但并不作为唯一限制。

在一实施例中，媒体服务器是下一代网络的重要设备，该设备在控制设备(例如软交换设备、应用服务器等)的控制下，提供在IP网络上实现各种业务所需的媒体资源功能，包括业务音提供、会议、交互式应答、通知、统一消息、高级语音业务等。在应用服务器里，可以但不限于使用MSML(Media Server Markup Language,媒体服务器标记语言)向媒体服务器发送放音等命令。媒体服务器具有较好的可裁剪性，可灵活实现一种或多种功能，包括但不限于有:

双音多频(Dual-Tone Multi Frequency,DTMF)信号的采集与解码功能：按照控制设备发来的相关操作参数的规定，从DTMF话机上接收DTMF信号，封装在信令中传给控制设备；

录音通知的发送功能：按照控制设备的要求，用规定的语音向用户播放规定的录音通知；

会议功能：支持多个RTP流的音频混合功能，支持不同编码格式的混音；

不同编解码算法间的转换功能：支持G.711、G.723、G.729等多种语音编解码算法，并可实现编解码算法之间的转换；

自动语音合成功能：将若干个语音元素或字段级连起来构成一条完整的语音提示通知，该语音提示通知为固定的或可变的；

动态语音播放/录制功能：包括音乐保持、Follow-me语音服务等；

音信号的产生与发送功能：提供拨号音、忙音、回铃音、等待音和空号音等基本信号音；

资源的维护与管理功能：以本地或/和远程两种方式，提供对媒体资源以及设备本身的维护、管理，如数据配置、故障管理等。

媒体服务器至少具有如下特性中的一种：

先进性：可以采用ITU-T的H.248和SIP标准协议等；

兼容性：能够方便的在不同厂家的软交换系统完成互通；

高可靠性：网关提供双电源，支持热插拔；定位于电信级设备，系统拥塞保护；

易维护性：支持与SNMP网管进行通信，能够在线维护系统、管理资源、事后分析等；

高扩展性和易升级性：独立的应用层可以为用户定制各种增值服务，并且能够对系统进行在线更新，最大限度的满足用户的需要；

灵活性：灵活的组网方式和强大的综合接入能力，可以为用户提供多种解决方案。

在一实施例中，对于每个机位的媒体信息流的接收情况不作限定，也就是说，对于不同机位的媒体信息流的接收方式可以为相同的，也可以根据具体设置情况选择对应的方式进行接收，例如以实时消息传输协议(Real Time Messaging Protocol，RTMP)的方式拉取场景中所选定的机位的媒体信息流，也就是说，本申请实施例中确保能够接收多个媒体信息流即可，具体接收方式此处并未限定，由于不需要限制媒体信息流的传输方式，所以同样适用于以其他方式拉取媒体信息流的应用场景。

在一实施例中，媒体信息流和每个媒体信息流中的媒体信息包的接收时机、个数可以不作限定，而是在具体场景中进行相应设置。例如，在一场馆中通常可以设置超过50个的机位，对应有超过50个的媒体信息流待接收，由于用户需要在特定时间才会进入场馆中进行观看，因此可以将所选定的媒体信息流的发送时间或者播放时间设置在该特定时间附近，以便于用户能够在特定时间观看视频。

步骤S120：获取接收到的目标媒体信息包的第一显示时间戳，其中，目标媒体信息包为所有媒体信息包中第一个被接收的媒体信息包。

本步骤中，由于需要解决各个媒体信息流同一时刻画面到达媒体服务器不一致的缺陷，也就是说，对于所有媒体信息流而言，无论到达媒体服务器的先后顺序如何，都需要对所有媒体信息流进行同步，那么为了避免出现媒体信息流的遗漏或者不匹配，至少需要找出第一个被接收的媒体信息包作为起始点进行改善，所以通过从所有媒体信息包中找出第一个被接收的媒体信息包，并以之作为目标媒体信息包，获取该目标媒体信息包的第一显示时间戳，以便于在后续步骤中将所有媒体信息包的显示时间戳与目标媒体信息包的第一显示时间戳进行对齐，以解决各个媒体信息流同一时刻到达媒体服务器不一致的缺陷。

在一实施例中，获取接收到的目标媒体信息包的第一显示时间戳的方式可以为多种，此处并未限定。例如，将所有媒体信息包的显示时间戳进行汇总，然后对所有的显示时间戳进行比较，从而从中获取到目标媒体信息包的第一显示时间戳。

步骤S130：将第一显示时间戳作为各个媒体信息流的起始显示时间戳。

本步骤中，通过将第一显示时间戳作为各个媒体信息流的起始显示时间戳，使得各个媒体信息流的显示时间戳能够被同步为起始显示时间戳，那么所有媒体信息流的显示时间戳均会保持一致，从而能够解决各个媒体信息流同一时刻到达媒体服务器不一致的缺陷，以便于在后续步骤中根据起始显示时间戳对各个媒体信息流进行信息分片、聚合。

以下给出一种具体示例以说明上述各实施例的工作原理及流程。

示例一：

如图2a和图2b所示，图2a是本申请一个实施例提供的多个媒体信息流在进行对齐前的示意图，图2b是本申请一个实施例提供的多个媒体信息流在进行对齐后的示意图，作为示例给出了3个机位分别对应的媒体信息流的示意图，每个机位中的媒体信息流包括多个重复的分片。

以媒体服务器为例，在将所有媒体信息包收入到收流缓存队列中的情况下，遍历收流缓存队列中的各个媒体信息包，判断当前媒体信息包是否为收到的第一个媒体信息包，若是则强制设置所有机位的第一个分片的startpts，其中，startpts是当前分片的第一个显示时间戳(Presentation Time Stamp，PTS)，即接收到的当前分片的第一个媒体信息包(即当前媒体信息包)的PTS，否则将该媒体信息包存储到对应机位的链表中，然后可以再针对另一个媒体信息包重复上述判断流程，直至找到所需求的第一个媒体信息包。

如图2a所示，给出了在未修改起始显示时间戳的情况下的各个机位的媒体信息流的示意图，方框中的数字表示当前媒体信息包的PTS，从中可以看出，分片时长为6s，机位1的第一个分片PTS范围为[0～540000)，startpts为0，机位2的第一个分片PTS范围为[7200～547200)，startpts为7200，机位3的第一个分片PTS范围为[3600～543600)，startpts为3600；由于各个机位起始分片的PTS范围不一致，因此终端在进行机位间切换时会出现画面的大范围空间跳跃的问题。

如图2b所示，给出了在修改起始显示时间戳的情况下的各个机位的媒体信息流的示意图，以首个收到机位2的媒体信息包(即收流缓存队列中的第一个媒体信息包为机位2的媒体信息包)为例进行说明，分片时长为6s，从中可以看出，相比于机位原来的媒体信息流，机位1的第一个分片PTS范围为[0～547200)，startpts为7200，机位2的第一个分片PTS范围为[7200～547200)，startpts为7200，机位3的第一个分片PTS范围为[3600～547200)，startpts为7200，这样各个机位的第二个分片的startpts则均为547200，也就是说，由于各个机位的第二个分片的startpts为相同的，且分片时长也是相同的，那么从各个机位的第二个分片开始，各个机位后续的各个分片可以保证为分别对应对齐的，那么其在同一时刻到达媒体服务器则是一致的，因此可以解决各个媒体信息流同一时刻到达媒体服务器不一致的缺陷。

步骤S140：根据起始显示时间戳对各个媒体信息流进行信息分片，得到各个媒体信息流的多个媒体分片信息，其中，媒体分片信息对应有分片序号，具有相同的分片序号的所有媒体分片信息具有相同的媒体时长；

本步骤中，由于在步骤S130中已经确定了各个媒体信息流的起始显示时间戳，因此可以进一步根据起始显示时间戳对各个媒体信息流进行信息分片，得到各个媒体信息流的多个媒体分片信息，并且通过分片序号对各个媒体分片信息进行区分，其中具有相同的分片序号的所有媒体分片信息具有相同的媒体时长，因此对于不同的媒体信息流而言，通过比较各自的分片序号即可以确认得到同一时间段的媒体分片信息，以便于在后续步骤中对将同一时间段的各个媒体分片信息聚合为一个完整的自由视点分片。

如图3所示，本申请的一个实施例，对步骤S140进行进一步说明，步骤S140包括但不限于步骤S141和S142。

步骤S141：对于各个媒体信息流，获取当前接收到的媒体信息包的第二显示时间戳。

步骤S142：当根据第二显示时间戳和起始显示时间戳确定满足信息分片条件，根据当前接收到的媒体信息包进行初始信息分片，将第二显示时间戳作为新的起始显示时间戳，根据新的起始显示时间戳进行后续信息分片。

本步骤中，通过获取当前接收到的媒体信息包的第二显示时间戳，以便于将第二显示时间戳与对齐的起始显示时间戳进行比较以确定是否满足信息分片条件，若满足则可以根据当前接收到的媒体信息包进行初始信息分片，同时以符合条件的第二显示时间戳作为新的起始显示时间戳进行后续信息分片，从而能够得到当前接收到的媒体信息包的完整的各个媒体分片信息，以便于在后续步骤中对将同一时间段的各个媒体分片信息聚合为一个完整的自由视点分片。

在一实施例中，信息分片条件可以根据具体场景进行相应设置，此处并未作出限定。例如，信息分片条件可以包括但不限于为：第二显示时间戳与起始显示时间戳之差和预设时间基准的比值，大于或等于预设分片时长，其中，预设时间基准可以但不限于为对应的媒体信息流的时间基准，当所有媒体信息包的时长相同，则可以但不限于将媒体信息包的时长设置为预设分片时长，两个显示时间戳的差值用于衡量第二显示时间戳与起始显示时间戳之间的差异程度，也就是说，第二显示时间戳足够大以进一步实现后续信息分片，那么当第二显示时间戳与起始显示时间戳之差和预设时间基准的比值小于预设分片时长时，则可以确定不需要对当前接收到的媒体信息包进行信息分片。

在一实施例中，获取当前接收到的媒体信息包的第二显示时间戳的方式可以为多种，此处并未限定。例如，将所有媒体信息包的显示时间戳进行汇总，然后对所有的显示时间戳进行比较，从而从中获取到当前接收到的媒体信息包的第二显示时间戳。

在一实施例中，在根据新的起始显示时间戳进行后续信息分片之后，可以依照步骤S142的方式继续进行接下来的信息分片，也就是说，在清楚后续信息分片的时长的情况下，可以根据该信息分片的时长、上一个起始显示时间戳以及预设时间基准确定下一个起始显示时间戳，从而能够基于下一个起始显示时间戳进行更后续的信息分片。

如图4所示，本申请的一个实施例，对步骤S141至S142之前的步骤进行进一步说明，还包括但不限于步骤S160至S180。

步骤S160：检测是否存在第一目标媒体信息流，其中，第一目标媒体信息流为满足断流恢复条件的媒体信息流。

步骤S170：当检测到存在第一目标媒体信息流，获取第一目标媒体信息流所对应的第二显示时间戳与多个第二目标媒体信息流所对应的起始显示时间戳之间的差值，其中，第二目标媒体信息流为不满足断流恢复条件的媒体信息流。

步骤S180：将第一目标媒体信息流的起始显示时间戳和分片序号，更新为目标差值所对应的第二目标媒体信息流的起始显示时间戳和分片序号，其中，目标差值为所有差值中数值最小的一个。

本步骤中，由于断流恢复会影响到对媒体信息包进行的后续信息分片，因此在步骤S160中通过检测是否存在满足断流恢复条件的第一目标媒体信息流以进一步判断断流恢复情况，并且当检测到存在第一目标媒体信息流，获取第一目标媒体信息流所对应的第二显示时间戳与多个第二目标媒体信息流所对应的起始显示时间戳之间的差值，即考虑满足断流恢复条件的第一目标媒体信息流与所有不满足断流恢复条件的第二目标媒体信息流之间的显示时间戳的差异，从所有第二目标媒体信息流中选择目标差值所对应的第二目标媒体信息流的起始显示时间戳和分片序号，作为更新第一目标媒体信息流的起始显示时间戳和分片序号的依据，而由于目标差值为所有差值中数值最小的一个，因此可以将第一目标媒体信息流的起始显示时间戳和分片序号更新为最近邻的媒体信息流的起始显示时间戳和分片序号，这样可以降低后续进行信息分片的难度，即尽量进行更少次数的信息分片，可以降低网络带宽要求。

在一实施例中，断流恢复条件可以根据具体场景进行相应设置，此处并未作出限定。例如，断流恢复条件可以但不限于包括：第二显示时间戳与上一个接收到的媒体信息包的显示时间戳之差和预设时间基准的比值，大于预设超时时长，其中，预设时间基准可以但不限于为对应的媒体信息流的时间基准，通过将第二显示时间戳与上一个接收到的媒体信息包的显示时间戳之差进行比较，可以衡量当前接收到的媒体信息包的第二显示时间戳与最近接收到的媒体信息包的显示时间戳之间的差异，以便于较好地确定第二显示时间戳的实际超时程度，可以理解地是，当第二显示时间戳与上一个接收到的媒体信息包的显示时间戳之差和预设时间基准的比值小于或等于预设超时时长时，则可以确定不需要对当前接收到的媒体信息包进行断流恢复。

步骤S150：将所有媒体信息流中的目标媒体分片信息进行聚合，得到自由视点媒体分片信息，其中，目标媒体分片信息为具有相同的分片序号的媒体分片信息。

本步骤中，通过将获取到的目标媒体信息包的第一显示时间戳统一设置为各个媒体信息流的起始显示时间戳，以解决各个媒体信息流同一时刻画面到达媒体服务器不一致的缺陷，进而在这种情况下根据起始显示时间戳对各个媒体信息流进行信息分片得到多个媒体分片信息，将所有媒体信息流中的具有相同的分片序号的媒体分片信息进行聚合，以得到完整的自由视点媒体分片信息，从而在保证画质的同时，避免视频画面在用户进行视角切换的过程中出现大范围地空间跳跃；因此，本申请实施例使得用户能够实现自由视点间的无缝切换，提升用户的视频体验效果，从而可以弥补相关方法中的技术空白。

在一实施例中，目标媒体分片信息可以但不限于为分片序号非1的媒体分片信息，参照图2a和图2b的示例可知，各个机位的媒体信息流中的第一个媒体分片信息的显示时间戳是被修改为第一个被接收的媒体信息包的第一显示时间戳的，在这种情况下各个机位的第一个媒体分片信息(即分片序号为1的媒体分片信息)的时长是不对应相同的，若直接对分片序号为1的媒体分片信息进行聚合则不对应，因此可以从分片序号为2的媒体分片信息开始进行聚合，以便于得到可靠稳定的自由视点媒体分片信息。

在一实施例中，无需像相关技术一样将各个机位的视频流压缩后拼接成一幅超高分辨率的大图画面再进行图像校正，而是根据相应的显示时间戳对媒体信息流进行信息分片并基于媒体信息流中的目标媒体分片信息进行聚合，得到最终的自由视点媒体分片信息，因此能够大大地降低对于网络带宽的要求，对于用户而言更加适用，而且采用本申请实施例的媒体分片信息拼接方式，也不需要考虑各个机位的分辨率的实际影响，即不需要通过适配用户播放的分辨率而降低各个机位的分辨率，因此能够进一步地提升用户的体验效果。

如图5所示，本申请的一个实施例，对步骤S150进行进一步说明，步骤S150包括但不限于步骤S151至S153。

步骤S151：依次遍历各个媒体信息流中的目标媒体分片信息。

步骤S152:判断当前目标媒体分片信息是否为断流恢复后的第一个媒体分片信息。

步骤S153：若当前目标媒体分片信息不为断流恢复后的第一个媒体分片信息，对当前目标媒体分片信息进行聚合。

本步骤中，通过遍历各个媒体信息流中的目标媒体分片信息以判断当前目标媒体分片信息是否为断流恢复后的第一个媒体分片信息，按照上述实施例的相关评述可知，由于断流恢复后的第一个媒体分片信息与各个机位的第一个显示时间戳被修改的媒体分片信息相类似，也不能够较好地适用于进行聚合，因此当判断当前目标媒体分片信息不为断流恢复后的第一个媒体分片信息，才选择对当前目标媒体分片信息进行聚合，以便于得到可靠稳定的自由视点媒体分片信息，也就是说，针对断流恢复情况，至少到断流恢复后的第二个媒体分片信息起才对其进行聚合，这样得到自由视点媒体分片信息效果更好。

本申请的一个实施例，在步骤S151至S153的基础上，对步骤S150进行进一步说明，步骤S150还包括但不限于步骤S154。

步骤S154：若当前目标媒体分片信息为断流恢复后的第一个媒体分片信息，不对当前目标媒体分片信息进行聚合。

本步骤中，由于断流恢复后的第一个媒体分片信息与各个机位的第一个显示时间戳被修改的媒体分片信息相类似，也不能够较好地适用于进行聚合，因此当判断当前目标媒体分片信息为断流恢复后的第一个媒体分片信息，则不对当前目标媒体分片信息进行聚合，以免其影响到自由视点媒体分片信息的整体聚合过程，也就是说，针对断流恢复情况，至少到断流恢复后的第二个媒体分片信息起才对其进行聚合，这样得到自由视点媒体分片信息效果更好。

以下给出多种具体示例以说明上述各实施例的工作原理及流程。

示例二：

如图6所示，图6为本申请一个实施例提供的用于执行媒体信息处理方法的媒体服务器的示意图。

参照图6，媒体服务器可以但不限于包括收流模块、对齐模块和拼接模块，其中：

收流模块用于从自由视点前端各个机位拉取媒体流(即图6所示的机位1媒体流、机位2媒体流、机位3媒体流…机位n媒体流)，添加到收流缓存队列中；

对齐模块，用于取出收流缓存队列中的媒体流，并对其进行对齐处理后再分片；

拼接模块，用于将各个机位按照相同的分片序号聚合成一个完整的自由视点分片。

根据上述示例可知，通过收流模块、对齐模块和拼接模块的配合，使得用户能够实现自由视点间的无缝切换，提升用户的视频体验效果，从而可以弥补相关方法中的技术空白。

示例三：

以下具体针对示例二中的对齐模块的工作原理及流程进行详细说明。

如图7所示，图7为本申请一个实施例提供的对齐模块执行媒体信息处理方法的流程图。

参照图7，对齐模块可以但不限于执行如下步骤。

步骤a：遍历收流缓存队列中的各个媒体信息包，判断当前媒体信息包是否为收到的第一个媒体信息包，若是则强制设置所有机位的第一个分片的startpts为接收到的第一个媒体信息包(即当前媒体信息包)的PTS之后，再进入步骤b，否则不做任何处理，直接进入步骤b。

步骤b：将媒体信息包分别存储到对应机位的链表中。

步骤c：根据(curpts-lastpts)/timebase>overtime这一公式判断该机位是否存在断流恢复的场景，若是则进入步骤d，否则进入步骤e，其中，curpts表示该机位的当前媒体信息包的PTS，lastpts表示该机位的上个媒体包的PTS，timebase表示媒体流的时基，overtime表示预设的超时时间。

步骤d：计算出curpts与其他正常机位的startpts的差值diffpts，找到最小的diffpts所对应的机位的startpts以及segno(segno是指分片序号，从1开始递增)，将其设置为断流恢复机位中的相应信息；具体地，参照图8，图8为本申请另一个实施例提供的多个媒体信息流的示意图，方框中的数字表示当前媒体信息包的PTS值，从中可以看出，机位1的startpts为0时，segno为1，机位2的startpts为540000时，segno为2，机位3的startpts为108000时，segno为3，而机位1出现断流情形，则计算其与机位2、机位3相应的媒体信息包之间的PTS差值，与机位2之间的为1083600-540000＝543600，与机位3之间的为1083600-1080000＝3600，也就是说，将机位3所对应的机位信息startpts以及segno设置为机位1中的相应信息，这样机位1在断流恢复后能够与机位3保持对齐，而当机位2的下个媒体信息包PTS＝1080000到达时，机位2切换到下一个分片，startpts以及segno也与机位3保持对齐，这样就保证了机位1断流恢复后能够与其他机位对齐。

步骤e：根据(curpts-startpts)/timebase>＝min_seg_duration这一公式判断该机位是否已经满足分片的条件，若是则直接分片，分片以segno命名，待segno加1后进入步骤a，否则不做任何处理直接进入步骤a，其中，min_seg_duration表示预设的分片时长。

示例四：

以下具体针对示例二中的拼接模块的工作原理及流程进行详细说明。

如图9所示，图9为本申请一个实施例提供的拼接模块执行媒体信息处理方法的流程图。

参照图9，拼接模块可以但不限于执行如下步骤。

步骤a：扫描分片信息，判断将要聚合的分片序号n是否为1，若否则进入步骤b；若是则将分片序号加1后再次进入步骤a，由于各个机位的第一个分片强制对齐后时长不一致，所以不对各个机位的第一个分片进行聚合操作。

步骤b：依次遍历各机位相同序号的分片，也即依次遍历各机位的分片序号为n的分片，判断该分片是否为断流恢复后的第一个分片，若是则再次进入步骤b，否则进入步骤c。

步骤c：聚合该机位的分片为自由视点媒体分片信息，并判断是否扫描完所有机位分片序号为n的分片，若是则分片序号加1后进入步骤a，否则进入步骤b。

结合上述各个示例可知，本申请实施例在初始化阶段强制设置所有机位起始分片的第一个PTS，在运行阶段按照分片时长进行切片并递增分片序号，当监控到机位存在断流恢复的场景时，重新计算出该机位当前分片的第一个PTS以及分片序号，然后根据分片序号将同一时间段的所有机位信息聚合为一个完整的自由视点分片，供用户选择视角进行播放，能够解决各机位码流同一时刻画面到达媒体服务端不一致的问题，避免用户在进行视角切换的过程中视频画面出现大范围空间跳跃，同时保证了画质，也能降低终端设备的带宽以及性能要求，使得用户实现自由视点间的无缝切换，提升用户的视频体验效果。

本申请实施例的方法可以被广泛应用于VR、虚拟视点场景下等的全景视频生成。

另外，如图10所示，本申请的一个实施例还公开了一种媒体信息处理装置100，包括：至少一个处理器110；至少一个存储器120，用于存储至少一个程序；当至少一个程序被至少一个处理器110执行时实现如前面任意实施例中的媒体信息处理方法。

另外，本申请的一个实施例还公开了一种计算机可读存储介质，其中存储有计算机可执行指令，计算机可执行指令用于执行如前面任意实施例中的媒体信息处理方法。

此外，本申请的一个实施例还公开了一种计算机程序产品，包括计算机程序或计算机指令，计算机程序或计算机指令存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取计算机程序或计算机指令，处理器执行计算机程序或计算机指令，使得计算机设备执行如前面任意实施例中的媒体信息处理方法。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

Claims

一种媒体信息处理方法，包括：

接收多个媒体信息流，其中，所述媒体信息流包括多个媒体信息包；

获取接收到的目标媒体信息包的第一显示时间戳，其中，所述目标媒体信息包为所有所述媒体信息包中第一个被接收的媒体信息包；

将所述第一显示时间戳作为各个所述媒体信息流的起始显示时间戳；

根据所述起始显示时间戳对各个所述媒体信息流进行信息分片，得到各个所述媒体信息流的多个媒体分片信息，其中，所述媒体分片信息对应有分片序号，具有相同的所述分片序号的所有所述媒体分片信息具有相同的媒体时长；

将所有所述媒体信息流中的目标媒体分片信息进行聚合，得到自由视点媒体分片信息，其中，所述目标媒体分片信息为具有相同的所述分片序号的所述媒体分片信息。
根据权利要求1所述的媒体信息处理方法，其中，所述根据所述起始显示时间戳对各个所述媒体信息流进行信息分片，包括：

对于各个所述媒体信息流，获取当前接收到的所述媒体信息包的第二显示时间戳，当根据所述第二显示时间戳和所述起始显示时间戳确定满足信息分片条件，根据当前接收到的所述媒体信息包进行初始信息分片，将所述第二显示时间戳作为新的起始显示时间戳，根据所述新的起始显示时间戳进行后续信息分片。
根据权利要求2所述的媒体信息处理方法，其中，所述信息分片条件包括：

所述第二显示时间戳与所述起始显示时间戳之差和预设时间基准的比值，大于或等于预设分片时长。
根据权利要求2所述的媒体信息处理方法，其中，所述根据所述起始显示时间戳对各个所述媒体信息流进行信息分片之前，所述媒体信息处理方法，还包括：

检测是否存在第一目标媒体信息流，其中，所述第一目标媒体信息流为满足断流恢复条件的所述媒体信息流；

当检测到存在所述第一目标媒体信息流，获取所述第一目标媒体信息流所对应的所述第二显示时间戳与多个第二目标媒体信息流所对应的所述起始显示时间戳之间的差值，其中，所述第二目标媒体信息流为不满足所述断流恢复条件的所述媒体信息流；

将所述第一目标媒体信息流的所述起始显示时间戳和所述分片序号，更新为目标差值所对应的所述第二目标媒体信息流的所述起始显示时间戳和所述分片序号，其中，所述目标差值为所有所述差值中数值最小的一个。
根据权利要求4所述的媒体信息处理方法，其中，所述断流恢复条件包括：

所述第二显示时间戳与上一个接收到的所述媒体信息包的显示时间戳之差和预设时间基准的比值，大于预设超时时长。
根据权利要求1所述的媒体信息处理方法，其中，所述目标媒体分片信息为所述分片序号非1的所述媒体分片信息。
根据权利要求6所述的媒体信息处理方法，其中，所述将所有所述媒体信息流中的目标媒体分片信息进行聚合，包括：

依次遍历各个所述媒体信息流中的所述目标媒体分片信息；

判断当前所述目标媒体分片信息是否为断流恢复后的第一个所述媒体分片信息；

若当前所述目标媒体分片信息不为断流恢复后的第一个所述媒体分片信息，对当前所述目标媒体分片信息进行聚合。
根据权利要求7所述的媒体信息处理方法，其中，所述将所有所述媒体信息流中的目标媒体分片信息进行聚合，还包括：

若当前所述目标媒体分片信息为断流恢复后的第一个所述媒体分片信息，不对当前所述目标媒体分片信息进行聚合。
一种媒体信息处理装置，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如权利要求1至8任意一项所述的媒体信息处理方法。
一种计算机可读存储介质，存储有计算机可执行指令，其中，所述计算机可执行指令用于执行权利要求1至8任意一项所述的媒体信息处理方法。