CN111836071A - 一种基于云会议的多媒体处理方法、装置及存储介质 - Google Patents

一种基于云会议的多媒体处理方法、装置及存储介质 Download PDF

Info

Publication number
CN111836071A
CN111836071A CN202010689113.2A CN202010689113A CN111836071A CN 111836071 A CN111836071 A CN 111836071A CN 202010689113 A CN202010689113 A CN 202010689113A CN 111836071 A CN111836071 A CN 111836071A
Authority
CN
China
Prior art keywords
time
receiving
multimedia
time stamp
time information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010689113.2A
Other languages
English (en)
Other versions
CN111836071B (zh
Inventor
唐国华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Net Cloud Service Co Ltd
Original Assignee
G Net Cloud Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Net Cloud Service Co Ltd filed Critical G Net Cloud Service Co Ltd
Priority to CN202010689113.2A priority Critical patent/CN111836071B/zh
Publication of CN111836071A publication Critical patent/CN111836071A/zh
Application granted granted Critical
Publication of CN111836071B publication Critical patent/CN111836071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请提供的一种基于云会议的多媒体处理方法、装置及存储介质,涉及云会议技术领域。根据至少1个所述客户端传输的多媒体流,录制多媒体数据;获取接收所述多媒体流中多个采样帧的接收时间戳;根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;将所述时间信息写入所述多媒体数据,获取多媒体文件。通过采样帧的接收时间戳以及采样帧携带的传输时间戳获取准确的多媒体文件的时间信息,解决了云会议多媒体回放过程中的时间戳异常情况对多媒体回放的影响,提高了多媒体回放的正确率。

Description

一种基于云会议的多媒体处理方法、装置及存储介质
技术领域
本申请涉及云会议技术领域,具体而言,涉及一种基于云会议的多媒体处理方法、装置及存储介质。
背景技术
现有的音视频录制采用客户端录制的方法,客户端的音视频录制方法需要将录制的音视频保存在用户终端上然后在录制完成之后,进行上传。在音视频上传完成之后,由上传者通知用户上传地址,用户通过自己的终端设备将音视频完全下载后并进行解压缩才能进行播放,当音视频文件较大时,会造成大量的时间浪费同时消耗带宽。
云会议是基于云计算技术的一种高效、便捷、低成本的会议形式,可在世界各地使用多种终端方式如电话、手机、电脑、专用终端等通过共享音频、视频、终端桌面、文档、白板等进行远程沟通和远程协助。云端音视频的录制指的是在服务器端使用云计算技术对客户端生成的音频和视频数据进行录制然后通过播放器回放。在云会议过程,多个云会议客户端对应一个云端,即云端录制是一个服务器同时录制一场云会议中的多个端同时产生的音频和视频,能够达到实时、快捷的播放视频内容。
在现实情况下,由于云会议的场景复杂,在音视频回放的过程中,可能会出现一些异常的情况,对音视频回放的正确性产生影响。
发明内容
为了解决现有技术中存在的问题,本申请提供了一种基于云会议的多媒体处理方法、装置及存储介质。
为实现上述目的,本申请采用的技术方案为:
本申请第一方面提供一种基于云会议的多媒体处理方法,包括:
根据至少1个所述客户端传输的多媒体流,录制多媒体数据;
获取接收所述多媒体流中多个采样帧的接收时间戳;
根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;
将所述时间信息写入所述多媒体数据,获取多媒体文件。
可选地,所述根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息,包括:
获取所述采样帧中任意相邻两帧的所述接收时间戳和所述传输时间戳;
根据相邻两帧的所述接收时间戳和所述传输时间戳,分别计算接收时间差、传输时间差;
根据所述接收时间差、所述传输时间差,计算修正时间信息;
根据所述修正时间信息修正所述接收时间戳,获取所述时间信息。
可选地,所述根据所述接收时间差、所述传输时间差,计算所述修正的时间信息,包括:
根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转;
若存在所述时间戳反转,则根据预设算法、以及预设时钟频率,计算所述修正的时间信息。
可选地,所述方法还包括:
接收所述多媒体流的第一帧时,记录所述第一帧的接收时间戳、以及所述第一帧的传输时间戳。
可选地,所述根据所述修正时间信息修正所述接收时间戳,获取所述时间信息之前,还包括:
根据预设映射关系,获取当前帧的所述接收时间戳、与所述第一帧的所述接收时间戳之间的映射时间;
根据所述修正时间信息修正所述接收时间戳,获取所述时间信息,包括:
根据所述修正时间信息、所述映射时间修正所述接收时间戳,获取所述时间信息。
可选地,所述多媒体流为音频流时,根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转之后,还包括:
若时间戳未反转,则根据所述传输时间戳以及预设时钟频率,对所述多媒体流进行补包;
若时间戳反转,则根据所述接收时间戳以及预设时钟频率,对所述多媒体流进行补包。
本申请第二方面提供一种基于云会议的多媒体处理装置,包括:录制模块、获取模块、写入模块;
所述录制模块,用于根据至少1个所述客户端传输的多媒体流,录制多媒体数据;
所述获取模块,用于获取接收所述多媒体流中多个采样帧的接收时间戳;根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;
所述写入模块,用于将所述时间信息写入所述多媒体数据,获取多媒体文件。
可选地,所述获取模块,用于获取所述采样帧中任意相邻两帧的所述接收时间戳和所述传输时间戳;
根据相邻两帧的所述接收时间戳和所述传输时间戳,分别计算接收时间差、传输时间差;
根据所述接收时间差、所述传输时间差,计算修正时间信息;
根据所述修正时间信息修正所述接收时间戳,获取所述时间信息。
可选地,所述获取模块,用于根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转;
若存在所述时间戳反转,则根据预设算法、以及预设时钟频率,计算所述修正的时间信息。
可选地,所述装置还包括:记录模块;
所述记录模块,用于接收所述多媒体流的第一帧时,记录所述第一帧的接收时间戳、以及所述第一帧的传输时间戳。
可选地,所述获取模块,用于根据预设映射关系,获取当前帧的所述接收时间戳、与所述第一帧的所述接收时间戳之间的映射时间;
根据所述修正时间信息、所述映射时间修正所述接收时间戳,获取所述时间信息。
可选地,所述多媒体流为音频流时,所述装置还包括:补包模块;
所述补包模块,用于若时间戳未反转,则根据所述传输时间戳以及预设时钟频率,对所述多媒体流进行补包;
若时间戳反转,则根据所述接收时间戳以及预设时钟频率,对所述多媒体流进行补包。
本申请第三方面提供一种基于云会议的多媒体处理装置,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述装置运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行上述第一方面提供的方法。
本申请第四方面提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面提供的方法。
本申请提供的基于云会议的多媒体处理方法、装置及存储介质中,根据至少1个所述客户端传输的多媒体流,录制多媒体数据;获取接收所述多媒体流中多个采样帧的接收时间戳;根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;将所述时间信息写入所述多媒体数据,获取多媒体文件。通过采样帧的接收时间戳以及采样帧携带的传输时间戳获取准确的多媒体文件的时间信息,解决了多媒体回放过程中的时间戳异常情况对多媒体回放的影响,提高了多媒体回放的正确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的一种基于云会议的多媒体处理方法的流程示意图;
图2为本申请另一实施例提供的一种基于云会议的多媒体处理方法的流程示意图;
图3为本申请另一实施例提供的一种基于云会议的多媒体处理方法的流程示意图;
图4为本申请一实施例提供的一种基于云会议的多媒体处理装置示意图;
图5为本申请另一实施例提供的一种基于云会议的多媒体处理装置示意图;
图6为本申请另一实施例提供的一种基于云会议的多媒体处理装置示意图;
图7为本申请一实施例提供的一种基于云会议的多媒体处理装置结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
云会议是基于云计算技术的一种高效、便捷、低成本的会议形式,可在世界各地使用多种终端方式如电话、手机、电脑、专用终端等通过共享音频、视频、终端桌面、文档、白板等进行远程沟通和远程协助。云端音视频的录制指的是在服务器端使用云计算技术对客户端生成的音频和视频数据进行录制然后通过播放器回放。在云会议过程,多个云会议客户端对应一个云端,即云端录制是一个服务器同时录制一场云会议中的多个端同时产生的音频和视频。在复杂的云会议环境下,要保证录制回放的正确性需要设法解决可能导致回放异常的一些特殊场景。
录制的最终结果是生成可播放多媒体文件,多媒体文件可以包括视频和/或音频,如MP4、M3U8、FLV等格式的文件。多媒体文件的每一帧播放由这一帧对应的时间信息决定,本申请实施例中,这些多媒体文件的每一帧的显示时机可以通过媒体文件中每一帧数据的显示时间戳PTS(Presentation Time Stamp,简称PTS)决定。PTS用来“告诉”播放器该在什么时候显示这一帧的数据。一般情况下PTS值是编码之后视频文件根据录制时间自己生成的,但在某些情况下,为了满足设计需求,需要对PTS值进行修正。
PTS是一个时间衡量值,它的单位跟播放它的视频流中时间基相关。时间基是播放程序ffmpeg(fast forward mpeg,简称ffmpeg)中的一个时间衡量单位,用time_base表示,如time_base={1,90000},表示把一秒钟分成90000等份,每一份是1/90000秒。一般播放的流媒体中流默认的时间基就是time_base={1,90000},PTS和时间基一起作用才能用来表达通常的时间值。时间的衡量是有起点的,在客户端时间基跟采样频率(预设时钟频率)相关,PTS的值以一个随机值为起点,然后以时间基为单元逐渐递增。如time_base={1,90000},PTS起始值为161979300,当前值为162069300,则表示的当前时间为(162069300-161979300)/90000=1秒。
音视频录制过程中容易出现PTS错误导致回放不正确,可能由于以下因素导致:1、音视频文件的PTS未从0开始;2、视频文件的时间戳反转和时间戳重置;3、音频文件补包不正确;4、音视频文件的PTS多段衔接不正确。
本申请实施例提供一种基于云会议的多媒体处理方法,用于解决上述技术问题。图1为本申请一实施例提供的一种基于云会议的多媒体处理方法的流程示意图。该方法的执行主体可以是云会议系统中的云端服务器,如图1所示,该方法包括:
S101、根据至少1个所述客户端传输的多媒体流,录制多媒体数据。
在本申请实施例中,多媒体数据可以包括视频和/或音频。云会议过程中,多个客户端对应一个云端,本申请实施例中,根据至少1个客户端传输的多媒体流,录制多媒体数据,即云端录制可以是云端服务器同时录制一场云会议中的多个端同时产生的音频和/或视频。
一般多媒体数据的录制需要解码后编码,在编码的时候PTS会自动生成,这样就不需要对PTS进行额外的处理。本申请实施例的云端录制视频,录的是不需要再进行解码、编码的多媒体流,例如H264流,所以需要在封装多媒体数据包的时候设置PTS值。
最简单的PTS设置方法就是把多媒体数据包中的时间戳设置为PTS值,例如,H264包的时间戳是从客户端传过来的,是每个H264包根据采样时钟在采样时刻设置进去的,能正确标识该帧显示的时间。需要说明的是,本申请实施例中,封装多媒体数据包时设置的PTS值也可以称为采样帧携带的传输时间戳。
S102、获取接收所述多媒体流中多个采样帧的接收时间戳。
在本申请实施例中,云端服务器接收到一帧一帧的多媒体数据,根据预设规则采样获取其中的采样帧,该采样帧携带有传输时间戳。另外,云端服务器还会记录接收到该采样帧的时间,记为接收时间戳。
S103、根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息。
需要说明的是,在本申请实施例中,采样帧携带的传输时间戳是由客户端传输时记录的,采样帧的接收时间戳是由云端服务器在接收时记录的,采样帧携带的传输时间戳和采样帧的接收时间戳属于不同的两个时间序列。根据两个时间序列可以计算获取准确的时间信息,进而记录每一帧对应的时间信息。
S104、将所述时间信息写入所述多媒体数据,获取多媒体文件。
在本实施例中,将时间信息写入多媒体数据,最终获取得到多媒体文件。
本申请提供的基于云会议的多媒体处理方法,根据至少1个所述客户端传输的多媒体流,录制多媒体数据;获取接收所述多媒体流中多个采样帧的接收时间戳;根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;将所述时间信息写入所述多媒体数据,获取多媒体文件。通过采样帧的接收时间戳以及采样帧携带的传输时间戳获取准确的多媒体文件的时间信息,解决了云会议多媒体回放过程中的时间戳异常情况对多媒体回放的影响,提高了多媒体回放的正确率。
其中,传输时间戳和采样帧的接收时间戳属于不同的两个时间序列,为了避免由于时间序列不同,导致多媒体文件的播放异常,可以利用接收时间戳以及采样帧携带的传输时间戳对采样帧的时间序列进行修正,最终获取得到正确的时间信息。
图2为本申请另一实施例提供的一种基于云会议的多媒体处理方法的流程示意图。如图2所示,在本申请一些实施例中,步骤S103、根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息,包括:
S1031、获取所述采样帧中任意相邻两帧的所述接收时间戳和所述传输时间戳。
在本申请实施例中,云端服务器获取每一帧从客户端传输的多媒体流,可以是获取多媒体流中相邻两帧的接收时间戳和传输时间戳。由于云端服务器和客户端所使用的时间序列不同,因此相邻两帧的接收时间戳和传输时间戳存在差异。
S1032、根据相邻两帧的所述接收时间戳和所述传输时间戳,分别计算接收时间差、传输时间差。
云端服务器分别对获取的多媒体流中相邻两帧的接收时间戳和传输时间戳作差,即用上一帧的接收时间戳减去下一帧的接收时间戳,获取接收时间差,上一帧的传输时间戳减去下一帧的传输时间戳,获取传输时间差。
可以理解的是,在本实施例中传输时间戳和接收时间戳分别是由客户端和云端服务器的时间序列记录的,可能存在差异。但是即使时间序列存在差异,相邻两帧之间的时间差包括接收时间差以及传输时间差应该是一致的。
相邻两帧之间的传输时间差DT的单位为采样时钟的单位,视频采样频率为90000,即每1/90000秒采样一个数据,相邻两帧之间的接收时间差DU以毫秒为单位,所以需要把DT转换为毫秒,即用DT除以90得到毫秒值,这样DT和DU的单位都是毫秒。
因此,在完全理想情况下,相邻两帧之间的传输时间差DT和相邻两帧之间的接收时间差DU是相等的,客户端发送两帧数据F1和F2的时间差和云端服务器接收F1和F2的时间差是相等的。如果DU等于DT,则完全可以用DU代替DT来设置PTS,但是在实际复杂的网络环境中,多媒体流数据可能因为网络拥塞堵塞而丢失或者延迟,这些都是不可预知的,所以DU不能代替DT。
S1033、根据所述接收时间差、所述传输时间差,计算修正时间信息。
由于DU和DT可能会存在一些细小的差异,在本申请实施例中,使用接收时间差DU以及传输时间差DT对时间信息进行修正。示例性地,在本实施例中,相对于数据帧时间戳反转和重置情况,DU的变化是很小的,利用接收时间差、传输时间差结合作为时间戳反转和重置情况的判断条件。
将时间戳反转和重置的传输时间戳进行时间修正,得到修正时间信息。
S1034、根据所述修正时间信息修正所述接收时间戳,获取所述时间信息。
需要说明的是,传输时间戳以及接收时间戳都可以用来决定多媒体文件的播放顺序。在本实施例中,利用修正时间信息修正接收时间戳,获取得到正确的时间信息。
需要说明的是,在本申请实施例中,该时间信息可以是修正后的PTS时间序列。具体可以是将接收时间戳修正后的PTS时间序列重新写入各帧携带的传输时间戳,从而获取具有准确时间信息的多媒体文件。
图3为本申请另一实施例提供的一种基于云会议的多媒体处理方法的流程示意图。如图3所示,在本申请一些实现方式中,步骤S1033、所述根据所述接收时间差、所述传输时间差,计算所述修正的时间信息,包括:
S301、根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转。
在本申请实施例中,时间戳反转具体为,网络传输中的实时数据包(Real-TimeProcess,简称RTP)的时间戳的字段可以是32位的无符号整形值,这个字段最大值是4294967295,超出之后时间戳会反转从溢出值开始。示例性地,当Max=4294967295,时间戳PTS=MAX+1时,PTS的值发生溢出,PTS的值变为0。这种场景,在当视频开启的时间比较长的情况下是特别容易出现的。
客户端在采样视频数据的时候,采样时钟是规律的不断往前走,时间戳是不断往上递增的。但是在某些异常情况下,如客户端崩溃拉起,这会导致采样被重置,从而使时间戳变成了新的时间系列,这样时钟重置导致产生的新的时间戳就不能同重置前的时间戳进行计算。重置后的采样时间戳是从一个随机数重新开始的,所以在云端服务器侧也没直观的条件去判断是否发生了重置。
需要说明的是,在本申请实施中,时间戳反转和时间戳重置的处理方式相同。
接收时间差DU、以及传输时间差DU在完全理想的情况下,二者是相等的。而在实际复杂的网络环境中,数据可能因为网络拥塞堵塞而丢失或者延迟,因此DU不能代替DT。但相对于数据帧时间戳反转和重置情况,DU的变化是很小的。示例性地,如果业务需求能容忍的延迟是5秒,即DU和DT即使不相等,但允许的最大误差为5秒也就是5000毫秒,设最大误差MT(MaxTime)为5000,则可以认为DU-DT的绝对值是不可能大于MT的,一旦大于MT则认为时间戳发生了反转或者已被重置。即时间戳发生了反转或者已被重置的判断条件为|DU-DT|>MT。
需要说明的是,本申请实施例中最大误差MT的值可以根据业务需求来进行设定,本实施例对此不做限制。
S302、若存在所述时间戳反转,则根据预设算法、以及预设时钟频率,计算所述修正的时间信息。
当判断时间戳发生了反转或者已被重置之后,后面的时间戳系列是一个新的系列,对于一个新的时间戳系列,需要将其与前一个时间戳系列接续起来。在本申请实施例中,当判断时间戳发生反转或者重置后,将时间戳发生反转或者重置前,最后一个采样帧携带的传输时间戳记为LT。正常情况下对于时钟频率为90000的数据,两个连续帧的时间戳差值为90000,LT的下一个时间戳应该是LT+90000,所以对新的时间戳系列使用,T‘=Tn‘-T1‘的映射公式得到映射到以0为起始的时间戳的值之后,用于设置PTS的时间戳,即修正的时间信息CT可以是:CT=LT+90000+T。修正后得到的PTS就是对时间戳反转和时间戳重置修正之后的正确结果。
需要说明的是,在本申请实施例中,T1‘表示时间戳反转之后,云端服务器接收到第一个采样帧的接收时间戳,Tn‘可以表示时间戳反转之后,云端服务器接收到第n个采样帧的接收时间戳。
时钟频率并不是固定的,可以根据业务需求进行适当地调整。在本实施例中,将时钟频率表示为FT,则修正的时间信息CT=LT+FT+T‘,这样得到的修正的时间信息CT就是对时间戳反转和时间戳重置修正之后的正确结果。
可选地,在上述实施例的基础上,为了解决多媒体数据从0开始的问题,该方法还包括:接收所述多媒体流的第一帧时,记录所述第一帧的接收时间戳、以及所述第一帧的传输时间戳。
需要说明的是,在本申请实施例中,客户端所传输的采样帧数据并不是从0开始的时间戳序列,因此采样帧携带的传输时间戳也并不是从0开始。为了使采样帧的时间序列从0开始,需要记录第一帧的接收时间戳、以及第一帧的传输时间戳,以进行时间戳的映射。
可选地,所述根据所述修正时间信息修正所述接收时间戳,获取所述时间信息之前,还包括:
根据预设映射关系,获取当前帧的接收时间戳、与第一帧的接收时间戳之间的映射时间;根据修正时间信息修正接收时间戳,获取时间信息,包括:根据修正时间信息、映射时间修正接收时间戳,获取时间信息。
需要说明的是,在本申请实施例中,记第一个采样帧的时间戳(采样帧携带的传输时间戳)为P1,建立线性映射关系P=Pn-P1,Pn为云端服务器每次收到对应采样帧的时间戳,P为转换到以0起始的时间戳。这样计算之后的P,不仅可以用于修正MP4的时间信息,同样可以用于设置其他如M3U8、flv等可播放媒体文件格式的时间信息。
在本申请实施例中,对于多段视频的衔接问题,其处理方式和时间戳发生反转或者重置的处理方式相同。
多段视频的衔接,即多段录制指的是在录制的过程中,允许用户暂停录制,即在客户端设置开启录制和暂停录制的按钮,当用户想录制时则开启录制,此时录制服务器和客户端同时接收采样帧数据,当用户暂停录制时,客户端继续接收采样帧数据,但录制服务器不再接收采样帧数据,只有等用户再开启录制时,服务器和当前的客户端同步接收数据,即暂停录制时段的数据对云端服务器是被过滤掉的。这种情况下对于云端服务器来说,采样帧数据因为数据的断裂让时间戳发生了跳变,如果暂停之后继续录制的情况下不对时间戳进行调整,则录制下来的视频在播放的时候暂停的这一段数据是空白的,播放效果可能是黑屏也可能是停在上一帧不动。如果暂停的时间很长,那只能在毫无意义的情况下增加录制文件的大小、占用云端服务器的资源。所以对于暂停录制的这一段应该去掉,暂停后重新开启录制的这一段需同前一段拼接起来形成一个完整的有内容的视频,这个就是采样帧时间戳的拼接。
在本实施例中,将多段录制造成的时间戳跳变当作时钟被重置来处理,即没段录制开始的第一帧都可以当作新的第一帧来处理,相应地,多段录制导致时间跳变的处理算法也是CT=LT+FT+T‘。
可选地,在本申请一些实现方式中,当所述多媒体流为音频流时,根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转之后,还包括:
若时间戳未反转,则根据所述传输时间戳以及预设时钟频率,对所述多媒体流进行补包;若时间戳反转,则根据所述接收时间戳以及预设时钟频率,对所述多媒体流进行补包。
对于多媒体数据,视频出现的时间戳错误,具体可以是PTS错误一样,音频也会出现,但它们的处理方法有所区别。在云会议的音频录制过程中,音频需要编解码,所以音频的PTS由编码器产生,但编码器产生的PTS来源于编码前的音频数据帧AVFrame的值,AVFrame是ffmpeg的一个帧结构,里面决定PTS的关键数据是一帧音频的样本数nb_samples和采样率(时钟频率)sample_rate。在采样率固定的情况下,样本数按比例等价于时间。示例性地,采样率8k的自适应多速率编解码(Adaptive Multi-Rate Codec,简称AMR),40毫秒的数据就是320个样本,即8K采样率的情况下,320个样本等价于40毫秒的时间。把320个8K的AMR样本转码成8K的AAC音频编码,那同等采样率下320个样本即使变成了AAC编码的数据了但依然是40ms,只是AAC编码一帧是1024个样本即1024/8毫秒,所以在时间基为90000的情况下编码之后的PTS=90000*(1024/8000)=11520,如果编码器设置时间基为8000,则PTS就是样本的个数。
所以要保证音频PTS计算准确,只需保证样本个数准确。在网络传输过程中,如果因为网络环境问题导致丢包使样本个数减少,如果不采取措施的话,音频总时间会减小。在云会议回放过程中,以音频为整场录制回放的时间轴,所以音频样本个数的增多和减少都是至关重要的。要保证音频时间的准确,需要解决音频补包的准确性问题。所以同视频一样需要解决音频数据包时间反转、时钟重置、多段录制的时间跳变的问题。
音频的PTS由样本数决定,音频的样本数受补包数的支配,音频补包的多少依赖于相邻两个包之间的传输时间差DT和服务器接收到数据包的接收时间差DU。
同视频一样,音频数据中时间戳的反转和时间戳的重置的判断条件满足|DU-DT|>MT,和视频不一样的是当满足条件|DU-DT|>MT时,音频是要进行补包处理。当|DU-DT|>MT时,采样时间戳和之前的时间戳系列已不属于同一个系列,不能再使用采样时间戳来进行计算,应以服务器接收数据帧的时间来暂时替代。FT为预设时钟频率,即FT为固定采样音频数据帧的时间,因为音频需要多流合流混音,而合流混音是每FT毫秒的时间合一次然后输出,对于云端服务器来说可以认为每FT毫秒时间应该能接收到一个音频包,如果FT=40毫秒,则可以认为一个包在时间上代表40毫秒,录制的音频文件要想在播放时还原整个录制现场,必须时间长度上等同于录制现场的时间,并且音频时间轴上排布的包要同现场实时采样时的包在同一个时间轴上对齐,所以录制的时候音频的时间轴上有包排包,没包补包。
需要说明的是,在本申请实施例中,当时间戳未反转时,则根据传输时间戳以及预设时钟频率,对多媒体流进行补包。
示例性地,由于客户端的预设时钟频率固定,因此客户端在固定的时间点会采集得到一个采样帧,可以是40ms、80ms、120ms、160ms…,得到一个采样帧,当客户端在40ms得到一个采样帧后,下一个得到采样帧的时间为120ms时,则需要在40ms-160ms之间进行补包。需要说明的是,本申请实施中,所补的数据包具体可以是静默音频数据包。
当时间戳未反转时,所补充的数据包的个数FC=DT/FT。需要说明的是,DT表示连续两个采样帧传输时间戳的差值,示例性地,若客户端应该每40ms得到一个采样帧,当某种情况下,得到的采样帧的时间为40ms、120ms时,则DT=120ms-40ms,FT为预设时钟频率。
当时间戳反转时,即|DU-DT|>MT时,则根据接收时间戳以及预设时钟频率,对多媒体流进行补包。具体表示为:补包个数FC=DU/FT。
其中,DU为云端服务器接收到连续两个数据帧的差值,即接收时间戳的差值。
同视频一样,音频也要考虑多段录制的PTS衔接问题。音频的PTS衔接主要是断裂处如何补包的问题。新一段音频录制开启的时候,无论有没有音频包,音频都算是已经开始了,此时云端服务器记录开启录制的时间为LU,而此时可能没有音频的采样帧传输过来,所以没有LT。等新一段录制的第一个音频的采样帧进入云端服务器,记其采样帧的接收时间为CU,则音频数据要完成PTS衔接,需要补充的数据包个数为:FC=(CU-LU)/FT。
可以理解的是,本申请实施例提供的基于云会议的多媒体处理方法,通过对音频数据帧的补包操作,以及对音视频数据帧的时间戳反转以及重置后的时间戳修正操作,解决了云会议多媒体回放过程中的时间戳异常情况对多媒体回放的影响,提高了多媒体回放的正确率。
本申请实施例提供一种基于云会议的多媒体处理装置,用于执行前述一种基于云会议的多媒体处理方法。图4为本申请实施例提供的基于云会议的多媒体处理装置示意图,如图4所示,该基于云会议的多媒体处理装置,包括:录制模块401、获取模块402、写入模块403。
所述录制模块401,用于根据至少1个所述客户端传输的多媒体流,录制多媒体数据。
所述获取模块402,用于获取接收所述多媒体流中多个采样帧的接收时间戳;根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息。
所述写入模块403,用于将所述时间信息写入所述多媒体数据,获取多媒体文件。
可选地,所述获取模块402,用于获取所述采样帧中任意相邻两帧的所述接收时间戳和所述传输时间戳;根据相邻两帧的所述接收时间戳和所述传输时间戳,分别计算接收时间差、传输时间差;根据所述接收时间差、所述传输时间差,计算修正时间信息;根据所述修正时间信息修正所述接收时间戳,获取所述时间信息。
可选地,所述获取模块402,用于根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转;若存在所述时间戳反转,则根据预设算法、以及预设时钟频率,计算所述修正的时间信息。
图5为本申请另一实施例提供的基于云会议的多媒体处理装置示意图,如图5所示,该装置还包括:记录模块404;
所述记录模块404,用于接收所述多媒体流的第一帧时,记录所述第一帧的接收时间戳、以及所述第一帧的传输时间戳。
可选地,所述获取模块402,用于根据预设映射关系,获取当前帧的所述接收时间戳、与所述第一帧的所述接收时间戳之间的映射时间;根据所述修正时间信息、所述映射时间修正所述接收时间戳,获取所述时间信息。
图6为本申请另一实施例提供的基于云会议的多媒体处理装置示意图,如图6所示,该装置还包括:补包模块405;
所述补包模块405,用于若时间戳未反转,则根据所述传输时间戳以及预设时钟频率,对所述多媒体流进行补包;若时间戳反转,则根据所述接收时间戳以及预设时钟频率,对所述多媒体流进行补包。
图7为本申请实施例提供的基于云会议的多媒体处理装置的结构示意图,对应于一种基于云会议的多媒体处理方法;该基于云会议的多媒体处理装置可以包括:处理器710、存储介质720和总线730,存储介质720存储有处理器710可执行的机器可读指令,当电子设备运行时,处理器710与存储介质720之间通过总线730通信,处理器710执行机器可读指令,以执行上述方法实施例的步骤。具体实现方式和技术效果类似,这里不再赘述。
本申请实施例提供了一种存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法。
上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于云会议的多媒体处理方法,其特征在于,包括:
根据至少1个客户端传输的多媒体流,录制多媒体数据;
获取接收所述多媒体流中多个采样帧的接收时间戳;
根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;
将所述时间信息写入所述多媒体数据,获取多媒体文件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息,包括:
获取所述采样帧中任意相邻两帧的所述接收时间戳和所述传输时间戳;
根据相邻两帧的所述接收时间戳和所述传输时间戳,分别计算接收时间差、传输时间差;
根据所述接收时间差、所述传输时间差,计算修正时间信息;
根据所述修正时间信息修正所述接收时间戳,获取所述时间信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述接收时间差、所述传输时间差,计算所述修正的时间信息,包括:
根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转;
若存在所述时间戳反转,则根据预设算法、以及预设时钟频率,计算所述修正的时间信息。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
接收所述多媒体流的第一帧时,记录所述第一帧的接收时间戳、以及所述第一帧的传输时间戳。
5.根据权利要求4所述的方法,其特征在于,所述根据所述修正时间信息修正所述接收时间戳,获取所述时间信息之前,还包括:
根据预设映射关系,获取当前帧的所述接收时间戳、与所述第一帧的所述接收时间戳之间的映射时间;
根据所述修正时间信息修正所述接收时间戳,获取所述时间信息,包括:
根据所述修正时间信息、所述映射时间修正所述接收时间戳,获取所述时间信息。
6.根据权利要求2所述的方法,其特征在于,所述多媒体流为音频流时,根据所述接收时间差、所述传输时间差,判断是否存在时间戳反转之后,还包括:
若时间戳未反转,则根据所述传输时间戳以及预设时钟频率,对所述多媒体流进行补包;
若时间戳反转,则根据所述接收时间戳以及预设时钟频率,对所述多媒体流进行补包。
7.一种基于云会议的多媒体处理装置,其特征在于,包括:录制模块、获取模块、写入模块;
所述录制模块,用于根据至少1个客户端传输的多媒体流,录制多媒体数据;
所述获取模块,用于获取接收所述多媒体流中多个采样帧的接收时间戳;根据所述接收时间戳、以及所述采样帧携带的传输时间戳,获取时间信息;
所述写入模块,用于将所述时间信息写入所述多媒体数据,获取多媒体文件。
8.根据权利要求7所述的装置,其特征在于,所述获取模块,用于获取所述采样帧中任意相邻两帧的所述接收时间戳和所述传输时间戳;
根据相邻两帧的所述接收时间戳和所述传输时间戳,分别计算接收时间差、传输时间差;
根据所述接收时间差、所述传输时间差,计算修正时间信息;
根据所述修正时间信息修正所述接收时间戳,获取所述时间信息。
9.一种基于云会议的多媒体处理装置,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述装置运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1-6任一项所述方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-6任一项所述方法的步骤。
CN202010689113.2A 2020-07-16 2020-07-16 一种基于云会议的多媒体处理方法、装置及存储介质 Active CN111836071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010689113.2A CN111836071B (zh) 2020-07-16 2020-07-16 一种基于云会议的多媒体处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010689113.2A CN111836071B (zh) 2020-07-16 2020-07-16 一种基于云会议的多媒体处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111836071A true CN111836071A (zh) 2020-10-27
CN111836071B CN111836071B (zh) 2021-01-05

Family

ID=72924418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010689113.2A Active CN111836071B (zh) 2020-07-16 2020-07-16 一种基于云会议的多媒体处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111836071B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399134A (zh) * 2021-01-21 2021-02-23 全时云商务服务股份有限公司 一种云会议录制的自管理发布方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1561642A (zh) * 2001-09-29 2005-01-05 皇家飞利浦电子股份有限公司 恢复mpeg-2传输流中节目时基并实现音频/视频同步的鲁棒方法
CN101151901A (zh) * 2005-03-25 2008-03-26 汤姆森特许公司 向数字数据流服务器发送命令的方法和用于实施该方法的装置
CN102075803A (zh) * 2010-12-22 2011-05-25 Tcl通力电子(惠州)有限公司 一种播放音视频同步的方法
CN103535027A (zh) * 2010-12-20 2014-01-22 通用仪表公司 处理编码视频帧的序列的方法
CN103621102A (zh) * 2011-05-12 2014-03-05 英特尔公司 用于音频与视频同步的技术
US20150195427A1 (en) * 2014-01-03 2015-07-09 Mstar Semiconductor, Inc. Decoder and decoding method for audio video stream synchronization
CN106063165A (zh) * 2013-12-23 2016-10-26 高通股份有限公司 将定时传输流用于接收机侧设备间通信
CN106507217A (zh) * 2016-10-27 2017-03-15 腾讯科技(北京)有限公司 视频流的时间戳的处理方法和装置
CN107113462A (zh) * 2014-11-20 2017-08-29 松下电器(美国)知识产权公司 发送方法、接收方法、发送装置以及接收装置
US20170373779A1 (en) * 2015-03-11 2017-12-28 Kabushiki Kaisha Toshiba Transmitting system, multiplexing apparatus, and leap second correction method
US20180122426A1 (en) * 2015-07-22 2018-05-03 Arris Enterprises Llc Metadata recordation and navigation for stitched content
CN109217965A (zh) * 2018-09-26 2019-01-15 杭州当虹科技股份有限公司 一种基于时间戳的SDIOverIP接收系统间同步方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1561642A (zh) * 2001-09-29 2005-01-05 皇家飞利浦电子股份有限公司 恢复mpeg-2传输流中节目时基并实现音频/视频同步的鲁棒方法
CN101151901A (zh) * 2005-03-25 2008-03-26 汤姆森特许公司 向数字数据流服务器发送命令的方法和用于实施该方法的装置
CN103535027A (zh) * 2010-12-20 2014-01-22 通用仪表公司 处理编码视频帧的序列的方法
US10659721B2 (en) * 2010-12-20 2020-05-19 Arris Enterprises Llc Method of processing a sequence of coded video frames
CN102075803A (zh) * 2010-12-22 2011-05-25 Tcl通力电子(惠州)有限公司 一种播放音视频同步的方法
CN103621102A (zh) * 2011-05-12 2014-03-05 英特尔公司 用于音频与视频同步的技术
CN106063165A (zh) * 2013-12-23 2016-10-26 高通股份有限公司 将定时传输流用于接收机侧设备间通信
US20150195427A1 (en) * 2014-01-03 2015-07-09 Mstar Semiconductor, Inc. Decoder and decoding method for audio video stream synchronization
CN107113462A (zh) * 2014-11-20 2017-08-29 松下电器(美国)知识产权公司 发送方法、接收方法、发送装置以及接收装置
US20170373779A1 (en) * 2015-03-11 2017-12-28 Kabushiki Kaisha Toshiba Transmitting system, multiplexing apparatus, and leap second correction method
US20180122426A1 (en) * 2015-07-22 2018-05-03 Arris Enterprises Llc Metadata recordation and navigation for stitched content
CN106507217A (zh) * 2016-10-27 2017-03-15 腾讯科技(北京)有限公司 视频流的时间戳的处理方法和装置
CN109217965A (zh) * 2018-09-26 2019-01-15 杭州当虹科技股份有限公司 一种基于时间戳的SDIOverIP接收系统间同步方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卓志峰: ""基于MPEG-2标准的音视频同步实现"", 《中国优秀硕士学位论文全文数据库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399134A (zh) * 2021-01-21 2021-02-23 全时云商务服务股份有限公司 一种云会议录制的自管理发布方法及系统
CN112399134B (zh) * 2021-01-21 2021-04-09 全时云商务服务股份有限公司 一种云会议录制的自管理发布方法及系统

Also Published As

Publication number Publication date
CN111836071B (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
US11240543B2 (en) Synchronizing playback of segmented video content across multiple video playback devices
JP7260687B2 (ja) 送信方法および送信装置
EP2547062B1 (en) Media streaming with adaptation
US20130336379A1 (en) System and Methods for Encoding Live Multimedia Content with Synchronized Resampled Audio Data
JP2006115477A (ja) メディアストリームから得られるメディアの提示を行う方法およびシステム
CN109168083B (zh) 一种流媒体实时播放方法及装置
US11563962B2 (en) Seamless content encoding and transmission
CN111182315A (zh) 一种多媒体文件拼接方法、装置、设备及介质
CN108259998B (zh) 播放器及播放控制方法、装置、电子设备及播放系统
CN110662017B (zh) 一种视频播放质量检测方法和装置
WO2016008131A1 (en) Techniques for separately playing audio and video data in local networks
CN111836071B (zh) 一种基于云会议的多媒体处理方法、装置及存储介质
US20130064308A1 (en) Coding and decoding synchronized compressed video bitstreams
CN115134622A (zh) 视频数据对齐方法、装置、设备及存储介质
CN110753259B (zh) 视频数据的处理方法、装置、电子设备及计算机可读介质
CN113873176B (zh) 一种媒体文件合并方法及装置
CN114257771B (zh) 一种多路音视频的录像回放方法、装置、存储介质和电子设备
CN109218809B (zh) 一种流媒体的播放方法和装置
US20100076944A1 (en) Multiprocessor systems for processing multimedia data and methods thereof
CN111131868B (zh) 基于播放器的视频录制方法及装置
WO2017092435A1 (zh) 音视频实时传输方法及装置、传输流打包方法及复用器
CN115514739B (zh) 小程序平台与在线课堂进行多媒体数据交互的方法和装置
WO2015011841A1 (ja) 符号化装置、符号化方法、および符号化プログラム
KR100643981B1 (ko) 주문형 비디오 컨텐츠 녹화 방법
CN114339267A (zh) 文件轮播推流方法、装置及直播推流服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 100010 room 203-35, 2 / F, building 2, No.1 and 3, Qinglong Hutong, Dongcheng District, Beijing

Patentee after: G-NET CLOUD SERVICE Co.,Ltd.

Address before: Room 1102, Ninth Floor, Pengyuan International Building, Building 4, No. 1 Courtyard, Shangdi East Road, Haidian District, Beijing

Patentee before: G-NET CLOUD SERVICE Co.,Ltd.

CP02 Change in the address of a patent holder