CN114448954A - 一种静音处理方法以及装置、存储介质、电子装置 - Google Patents

一种静音处理方法以及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN114448954A
CN114448954A CN202111653961.9A CN202111653961A CN114448954A CN 114448954 A CN114448954 A CN 114448954A CN 202111653961 A CN202111653961 A CN 202111653961A CN 114448954 A CN114448954 A CN 114448954A
Authority
CN
China
Prior art keywords
rtp
preset
mute
timestamp
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111653961.9A
Other languages
English (en)
Inventor
刘郁松
李全忠
何国涛
蒲瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Original Assignee
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Puqiang Times Zhuhai Hengqin Information Technology Co ltd filed Critical Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority to CN202111653961.9A priority Critical patent/CN114448954A/zh
Publication of CN114448954A publication Critical patent/CN114448954A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

本申请公开了一种静音处理方法以及装置、存储介质、电子装置。该方法包括在预设RTP时间戳可用的情况下,根据所述预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;如果需要进行静音补齐处理,则补齐所述当前语音数据。本申请解决了对于有缺陷的音频数据无法较好地补齐静音的技术问题。通过本申请实现了对于录音数据流的静音检测以及补齐处理,从而在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。

Description

一种静音处理方法以及装置、存储介质、电子装置
技术领域
本申请涉及语音处理技术领域,具体而言,涉及一种静音处理方法以及装置、存储介质、电子装置。
背景技术
在呼叫中心中,通话录音是呼叫中心行业的管理要求,需要对坐席和客户通话进行全程录音,以用于投诉取证、问题核实、行业监管等需要。
通话录音对齐是对录音质量的重要要求,当对齐出现问题时,导致录音不可用。
针对相关技术中对于有缺陷的音频数据无法较好地补齐静音的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种静音处理方法以及装置、存储介质、电子装置,以解决对于有缺陷的音频数据无法较好地补齐静音的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种静音处理方法。
根据本申请的静音处理方法包括:在预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;如果需要进行静音补齐处理,则补齐所述当前语音数据。
进一步地,所述预设RTP时间戳通过在发送终端发送目标RTP包时在包头中写入RTP包中语音流写入时的时间戳确定;所述预设RTP包的接收时间包括:当所述发送终端的所述时间戳不可用时,通过接收终端根据接收时间补充的时间戳信息。
进一步地,所述根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:根据预设RTP时间戳检测当前语音数据中先后接收到的至少两个RTP时间戳,计算两个RTP包的时间差;根据所述两个RTP包的时间差确定是否进行静音补齐处理。
进一步地,所述根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理包括:根据预设RTP包的接收时间检测所述当前语音数据中先后接收到的至少两个RTP接收时间,计算两个RTP包的时间差;根据所述两个两个RTP包的时间差确定是否进行静音补齐处理。
进一步地,所述在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
进一步地,所述在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理包括:在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
进一步地,所述如果需要进行静音补齐处理,则补齐所述当前语音数据,包括:如果在所述预设RTP包中间出现数据缺失则需要进行静音补齐处理,并补齐所述当前语音数据,以防止当前语音数据出现错位,其中所述当前语音数据包括录音数据,其中所述RTP包中间出现数据缺失至少包括如下之一的情况:网络不稳定、终端开启噪音、终端开启静音抑制、终端呼叫保持、终端呼叫等待时、发送终端不发送语音流的情况下。
为了实现上述目的,根据本申请的另一方面,提供了一种静音处理装置。
根据本申请的静音处理装置包括:第一检测模块,用于在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;第二检测模块,用于在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;处理模块,用于如果需要进行静音补齐处理,则补齐所述当前语音数据。
在本申请实施例中静音处理方法以及装置、存储介质、电子装置,采用在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理的方式,通过在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理,达到了如果需要进行静音补齐处理,则补齐所述当前语音数据的目的,从而实现了静音检测以及补齐的技术效果,进而解决了对于有缺陷的音频数据无法较好地补齐静音的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的静音处理方法的硬件结构示意图;
图2是根据本申请实施例的静音处理方法流程示意图;
图3是根据本申请实施例的静音处理装置结构示意图;
图4是根据本申请实施例的静音处理方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
在呼叫中心中的通话录音对齐是对录音质量的重要要求,当通话录音对齐出现问题时会导致录音播放时说话双方时间轴错位,说话双方上下文不一致,说话重叠、答非所问澄清情况,导致录音数据不可用。本申请实施例中以录音为例进行详细说明。
在基于RTP的通话语音传输技术中,当出现以下情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
1)网络不稳定。RTP传输基于UDP技术,为不可靠传输技术,RTP包存在丢失的可能。当出现长时间的RTP包丢失问题,对应的语音流将不可获取,需要在录音保存时进行补齐。
2)终端开启噪音/静音抑制。该功能有利于减少网络传输流量,提高通话质量。但是由于终端不发送静音语音流、噪音语音流,导致正常通话出现语音流缺失,需要在录音保存时进行补齐。
3)呼叫保持、呼叫等待时,终端不发送语音流。需要在录音保存时进行补齐。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,是根据本申请实施例的静音处理方法的硬件结构示意图,其中,包括:坐席200、客户100,所述坐席200与所述客户100之间是基于RTP的通话语音传输,在所述客户100作为发送端在每次发送时具有(携带)RTP时间戳,所述坐席200作为接收端具有RTP包接收时间。
可以理解,RTP协议基于UDP传输,采用分段封包传输技术。终端在发送RTP包时在包头中写入该RTP包中语音流写入时的时间戳,该时间戳由语音流发送方写入。
由于发送时间是单调递增,当接收到RTP包时,取接收时的当前时间作为RTP包的时间戳,即当发送方时间戳不可用时,通过接收方根据接收时间补充时间戳信息。
如图2所示,该方法包括如下的步骤S201至步骤S203:
步骤S201,在预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;
步骤S202,在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;
步骤S203,如果需要进行静音补齐处理,则补齐所述当前语音数据。
从以上的描述中,可以看出,本申请实现了如下技术效果:
采用在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理的方式,通过在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理,达到了如果需要进行静音补齐处理,则补齐所述当前语音数据的目的,从而实现了静音检测以及补齐的技术效果,进而解决了对于有缺陷的音频数据无法较好地补齐静音的技术问题。
上述步骤S201中判断语音数据中的预设RTP时间戳是否可用,在所述预设RTP时间戳可用的情况下,会按照所述预设RTP时间戳检测当前语音数据中是否进行静音补齐处理。也就是说,先进行是否存在静音的判断,之后再根据判断结果决定是否进行静音补齐处理。由于RTP协议基于UDP传输,采用分段封包传输技术,所以发送终端在发送RTP包时在包头中写入该RTP包中语音流写入时的时间戳,则当前的时间戳由语音数据流发送终端(方)写入。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现网络不稳定的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现终端开启噪音/静音抑制的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现呼叫保持、呼叫等待时,终端不发送语音流等的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
上述步骤S202中判断语音数据中的在所述预设RTP时间戳是否可用(有效),在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理。当RTP时间戳错误时,需要通话静音依然能够被检测。所以,考虑到时间是单调递增,当接收到RTP包时,取接收时的当前时间作为RTP包的时间戳,即当发送方时间戳不可用时,由接收方(端)根据接收时间补充时间戳信息。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现网络不稳定的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现终端开启噪音/静音抑制的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现呼叫保持、呼叫等待时,终端不发送语音流等的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
上述步骤S203中根据预设的判断条件,如果判断需要进行静音补齐处理,则补齐所述当前语音数据。
在一种具体实施方式中,根据预设的判断条件中的RTP时间戳判断需要进行静音补齐处理,则补齐所述当前语音数据。
在一种具体实施方式中,根据预设的判断条件中的预设RTP包判断需要进行静音补齐处理,则补齐所述当前语音数据。
在一种具体实施方式中,根据预设的判断条件中的根据预设的判断条件中的RTP时间戳和/或预设RTP包判断需要进行静音补齐处理,则补齐所述当前语音数据。
作为本实施例中的优选,所述预设RTP时间戳通过在发送终端发送目标RTP包时在包头中写入RTP包中语音流写入时的时间戳确定;所述预设RTP包的接收时间包括:当所述发送终端的所述时间戳不可用时,通过接收终端根据接收时间补充的时间戳信息。
具体实施时,预先配置所述预设RTP时间戳通过在发送终端发送目标RTP包时在包头中写入RTP包中语音流写入时的时间戳确定。同时,所述预设RTP包的接收时间包括:当所述发送终端的所述时间戳不可用时,通过接收终端根据接收时间补充的时间戳信息。
作为本实施例中的优选,所述根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:根据预设RTP时间戳检测当前语音数据中先后接收到的至少两个RTP时间戳,计算两个RTP包的时间差;根据所述两个RTP包的时间差确定是否进行静音补齐处理。
具体实施时,至少两个RTP时间戳是指时间前后顺序上的不同时间戳。根据预设RTP时间戳检测当前语音数据中先后接收到的至少两个RTP时间戳,计算两个RTP包的时间差;根据所述两个RTP包的时间差确定是否进行静音补齐处理。进一步,如果两次没有差值,则认为没有静音数据流,如果两次有差值,则认为有静音数据流。需要注意的是,上述检测以及补齐方式均是实时的。
作为本实施例中的优选,所述根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理包括:根据预设RTP包的接收时间检测所述当前语音数据中先后接收到的至少两个RTP接收时间,计算两个RTP包的时间差;根据所述两个两个RTP包的时间差确定是否进行静音补齐处理。
具体实施时,至少两个RTP接收时间是指时间前后顺序上的不同时间包括,根据预设RTP包的接收时间检测所述当前语音数据中先后接收到的至少两个RTP接收时间,计算两个RTP包的时间差;根据所述两个两个RTP包的时间差确定是否进行静音补齐处理。进一步,如果两次没有差值,则认为没有静音数据流,如果两次有差值,则认为有静音数据流。需要注意的是,上述检测以及补齐方式均是实时的。
作为本实施例中的优选,所述在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
具体实施时,在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理。进一步,在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
如果两个RTP包的时间差等于RTP包的封装的语音流长度,则说明此RTP包中间没有包缺失等现象,所以不需要通过静音进行语音补充。如果时间戳大于封装的语音流长度,则说明RTP包中间出现缺失,需要补充静音,避免录音出现错位。
作为本实施例中的优选,所述在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理包括:在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
具体实施时,在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理表明当前两次相同并没有静音数据流。进一步地,在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理,表明当前两次不相同且存在静音数据流。通过比对先后接收到的两个RTP接收时间即可计算出来两个RTP包的时间差,如果两个RTP包的时间差约等于RTP包的封装的语音流长度,则说明此RTP包中间没有包缺失等现象,所以不需要通过静音进行语音补充。如果时间戳大于封装的语音流长度,则说明RTP包中间出现缺失,需要补充静音,避免录音出现错位。
作为本实施例中的优选,所述如果需要进行静音补齐处理,则补齐所述当前语音数据,包括:如果在所述预设RTP包中间出现数据缺失则需要进行静音补齐处理,并补齐所述当前语音数据,以防止当前语音数据出现错位,其中所述当前语音数据包括录音数据,其中所述RTP包中间出现数据缺失至少包括如下之一的情况:网络不稳定、终端开启噪音、终端开启静音抑制、终端呼叫保持、终端呼叫等待时、发送终端不发送语音流的情况下。
具体实施时,针对网络不稳定、终端开启噪音、终端开启静音抑制、终端呼叫保持、终端呼叫等待时、发送终端不发送语音流的任一一种或者多种情况下,则认为预设RTP包中间出现数据缺失则需要进行静音补齐处理,并补齐所述当前语音数据。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述方法的静音处理装置,如图3所示,该装置包括:
第一检测模块301,用于在预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;
第二检测模块302,用于在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;
处理模块303,用于如果需要进行静音补齐处理,则补齐所述当前语音数据。
本申请实施例的所述第一检测模块301中判断语音数据中的预设RTP时间戳是否可用,在所述预设RTP时间戳可用的情况下,会按照所述预设RTP时间戳检测当前语音数据中是否进行静音补齐处理。也就是说,先进行是否存在静音的判断,之后再根据判断结果决定是否进行静音补齐处理。由于RTP协议基于UDP传输,采用分段封包传输技术,所以发送终端在发送RTP包时在包头中写入该RTP包中语音流写入时的时间戳,则当前的时间戳由语音数据流发送终端(方)写入。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现网络不稳定的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现终端开启噪音/静音抑制的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现呼叫保持、呼叫等待时,终端不发送语音流等的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
本申请实施例的所述第二检测模块302中判断语音数据中的在所述预设RTP时间戳是否可用(有效),在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理。当RTP时间戳错误时,需要通话静音依然能够被检测。所以,考虑到时间是单调递增,当接收到RTP包时,取接收时的当前时间作为RTP包的时间戳,即当发送方时间戳不可用时,由接收方(端)根据接收时间补充时间戳信息。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现网络不稳定的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现终端开启噪音/静音抑制的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
在一种具体实施方式中,在基于RTP的通话语音传输技术中,当出现呼叫保持、呼叫等待时,终端不发送语音流等的情况时,需要在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
本申请实施例的所述处理模块303中根据预设的判断条件,如果判断需要进行静音补齐处理,则补齐所述当前语音数据。
在一种具体实施方式中,根据预设的判断条件中的RTP时间戳判断需要进行静音补齐处理,则补齐所述当前语音数据。
在一种具体实施方式中,根据预设的判断条件中的预设RTP包判断需要进行静音补齐处理,则补齐所述当前语音数据。
在一种具体实施方式中,根据预设的判断条件中的根据预设的判断条件中的RTP时间戳和/或预设RTP包判断需要进行静音补齐处理,则补齐所述当前语音数据。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
为了更好的理解上述静音处理方法流程,以下结合优选实施例对上述技术方案进行解释说明,但不用于限定本发明实施例的技术方案。
本申请实施例中的静音处理方法,提供了至少两种基于时间点的静音检测和补齐技术,包括基于RTP时间戳的静音检测和补齐技术以及基于RTP包接收时间的静音检测和补齐技术,通过上述静音处理方法,在基于RTP的通话语音传输技术中,当出现网络不稳定、终端开启噪音/静音抑制、呼叫保持、呼叫等待时,终端不发送语音流等情况时,可以在保存录音时使用静音进行补齐避免由于语音流缺失造成录音错位。
如图4所示,是本申请实施例中静音处理方法的流程示意图,实现的具体过程包括如下步骤:
步骤S401,判断预设RTP时间戳是否可用。
所述预设RTP时间戳通过在发送终端发送目标RTP包时在包头中写入RTP包中语音流写入时的时间戳确定。
步骤S402,在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中进行静音补齐处理。
步骤S403,在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理。
根据预设RTP时间戳检测当前语音数据中先后接收到的至少两个RTP时间戳,计算两个RTP包的时间差;根据所述两个RTP包的时间差确定是否进行静音补齐处理。
步骤S404,判断预设RTP包是否可用。
所述预设RTP包的接收时间包括:当所述发送终端的所述时间戳不可用时,通过接收终端根据接收时间补充的时间戳信息步骤S405,在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据进行静音补齐处理。
步骤S406,在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理。
根据预设RTP包的接收时间检测所述当前语音数据中先后接收到的至少两个RTP接收时间,计算两个RTP包的时间差;
根据所述两个两个RTP包的时间差确定是否进行静音补齐处理。
步骤S407,如果需要进行静音补齐处理,则补齐所述当前语音数据。
在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;
在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
所述在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理包括:
在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;
在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种静音处理方法,其特征在于,包括:
在预设RTP时间戳可用的情况下,根据所述预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;
在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;
如果需要进行静音补齐处理,则补齐所述当前语音数据。
2.根据权利要求1所述的方法,其特征在于:
所述预设RTP时间戳通过在发送终端发送目标RTP包时在包头中写入RTP包中语音流写入时的时间戳确定;
所述预设RTP包的接收时间包括:当所述发送终端的所述时间戳不可用时,通过接收终端根据接收时间补充的时间戳信息。
3.根据权利要求2所述的方法,其特征在于,所述根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:
根据预设RTP时间戳检测当前语音数据中先后接收到的至少两个RTP时间戳,计算两个RTP包的时间差;
根据所述两个RTP包的时间差确定是否进行静音补齐处理。
4.根据权利要求2所述的方法,其特征在于,所述根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理包括:
根据预设RTP包的接收时间检测所述当前语音数据中先后接收到的至少两个RTP接收时间,计算两个RTP包的时间差;
根据所述两个两个RTP包的时间差确定是否进行静音补齐处理。
5.根据权利要求1所述的方法,其特征在于,在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:
在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;
在所述预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
6.根据权利要求1所述的方法,其特征在于,在所述预设RTP时间戳不可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理包括:
在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差等于RTP包的封装的语音流长度,则不需要进行静音补齐处理;
在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据中两个RTP包的时间差大于RTP包的封装的语音流长度,则需要进行静音补齐处理。
7.根据权利要求5或6所述的方法,其特征在于,所述如果需要进行静音补齐处理,则补齐所述当前语音数据,包括:
如果在所述预设RTP包中间出现数据缺失则需要进行静音补齐处理,并补齐所述当前语音数据,以防止当前语音数据出现错位,其中所述当前语音数据包括录音数据,其中所述RTP包中间出现数据缺失至少包括如下之一的情况:网络不稳定、终端开启噪音、终端开启静音抑制、终端呼叫保持、终端呼叫等待时、发送终端不发送语音流的情况下。
8.一种静音处理装置,其特征在于,包括:
第一检测模块,用于在预设RTP时间戳可用的情况下,根据预设RTP时间戳检测当前语音数据中是否进行静音补齐处理;
第二检测模块,用于在所述预设RTP时间戳不可用的情况下,则根据预设RTP包的接收时间检测所述当前语音数据是否进行静音补齐处理;
处理模块,用于如果需要进行静音补齐处理,则补齐所述当前语音数据。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项所述的方法。
CN202111653961.9A 2021-12-30 2021-12-30 一种静音处理方法以及装置、存储介质、电子装置 Pending CN114448954A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111653961.9A CN114448954A (zh) 2021-12-30 2021-12-30 一种静音处理方法以及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111653961.9A CN114448954A (zh) 2021-12-30 2021-12-30 一种静音处理方法以及装置、存储介质、电子装置

Publications (1)

Publication Number Publication Date
CN114448954A true CN114448954A (zh) 2022-05-06

Family

ID=81366576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111653961.9A Pending CN114448954A (zh) 2021-12-30 2021-12-30 一种静音处理方法以及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN114448954A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1355984A (zh) * 1999-06-18 2002-06-26 艾利森电话股份有限公司 实时分组通信中时间戳的估计
US20070121597A1 (en) * 2005-09-12 2007-05-31 Eung-Don Lee Apparatus and method for processing VoIP packet having multiple frames
CN101014001A (zh) * 2006-11-13 2007-08-08 陈哲 Rtp报文修补装置、rtp报文排序方法和填补方法
US20080117901A1 (en) * 2006-11-22 2008-05-22 Spectralink Method of conducting an audio communications session using incorrect timestamps
US20090225791A1 (en) * 2008-03-05 2009-09-10 Nobuyuki Nagafuji Ip stream communicating system, ip stream receiving apparatus and reception processing timing sync method for use in ip stream receiving apparatus
CN101715046A (zh) * 2008-09-29 2010-05-26 索尼株式会社 电子设备、内容再现方法和程序
CN102833436A (zh) * 2012-08-31 2012-12-19 电子科技大学 实现voip代理的方法以及系统
CN104025607A (zh) * 2011-12-26 2014-09-03 索尼公司 用于异步网络上的多媒体内容的同步传输的装置和方法
CN106452663A (zh) * 2015-08-11 2017-02-22 阿里巴巴集团控股有限公司 基于rtp协议的网络通话数据传输方法及通信设备
CN108174008A (zh) * 2017-12-22 2018-06-15 天津七二通信广播股份有限公司 一种用于通信语音传输系统的语音包存储方法
KR101904817B1 (ko) * 2017-12-21 2018-10-05 (주) 미스터멘션 통화 내용 음성-텍스트 변환 녹취록 생성 시스템
CN108933786A (zh) * 2018-07-03 2018-12-04 公安部第研究所 用于改善无线数字通信系统接收方密文语音质量的方法
US11212333B1 (en) * 2015-05-29 2021-12-28 Ribbon Communications Operating Company, Inc. Methods and apparatus for synchronizing transcoded and/or transrated RTP packets

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1355984A (zh) * 1999-06-18 2002-06-26 艾利森电话股份有限公司 实时分组通信中时间戳的估计
US20070121597A1 (en) * 2005-09-12 2007-05-31 Eung-Don Lee Apparatus and method for processing VoIP packet having multiple frames
CN101014001A (zh) * 2006-11-13 2007-08-08 陈哲 Rtp报文修补装置、rtp报文排序方法和填补方法
US20080117901A1 (en) * 2006-11-22 2008-05-22 Spectralink Method of conducting an audio communications session using incorrect timestamps
US20090225791A1 (en) * 2008-03-05 2009-09-10 Nobuyuki Nagafuji Ip stream communicating system, ip stream receiving apparatus and reception processing timing sync method for use in ip stream receiving apparatus
CN101715046A (zh) * 2008-09-29 2010-05-26 索尼株式会社 电子设备、内容再现方法和程序
CN104025607A (zh) * 2011-12-26 2014-09-03 索尼公司 用于异步网络上的多媒体内容的同步传输的装置和方法
CN102833436A (zh) * 2012-08-31 2012-12-19 电子科技大学 实现voip代理的方法以及系统
US11212333B1 (en) * 2015-05-29 2021-12-28 Ribbon Communications Operating Company, Inc. Methods and apparatus for synchronizing transcoded and/or transrated RTP packets
CN106452663A (zh) * 2015-08-11 2017-02-22 阿里巴巴集团控股有限公司 基于rtp协议的网络通话数据传输方法及通信设备
KR101904817B1 (ko) * 2017-12-21 2018-10-05 (주) 미스터멘션 통화 내용 음성-텍스트 변환 녹취록 생성 시스템
CN108174008A (zh) * 2017-12-22 2018-06-15 天津七二通信广播股份有限公司 一种用于通信语音传输系统的语音包存储方法
CN108933786A (zh) * 2018-07-03 2018-12-04 公安部第研究所 用于改善无线数字通信系统接收方密文语音质量的方法

Similar Documents

Publication Publication Date Title
CN106921996B (zh) 一种层2统计量的统计方法、cu及du
US6658027B1 (en) Jitter buffer management
EP3080915B1 (en) Redundant encoding
US20080186872A1 (en) Method for Analyzing Errors of a Data Stream, Particularly a Real-Time Data Stream, in a Data Network, Communication System, and Monitoring Computer
CN109644162B (zh) 媒体缓冲
CN103763073B (zh) 一种丢包重传的方法及终端
JP2002084338A (ja) データ送信装置、データ受信装置、およびデータ通信システム
CN105827697A (zh) 用户离线检测方法和用户离线检测系统
US9603051B2 (en) Systems and methods for push-to-talk voice communication over voice over internet protocol networks
CN107534589A (zh) 去抖动缓冲器更新
CN111447603A (zh) 数据传输方法及装置
CN111601178B (zh) 视频数据处理方法、装置和电子设备
JP2005269217A (ja) Sipサーバ
US20020091495A1 (en) Monitoring traffic in telecommunications networks
US8224984B2 (en) Method for quality analysis during transmission of real-time critical data in packet-oriented network
CN114448954A (zh) 一种静音处理方法以及装置、存储介质、电子装置
CN103354588A (zh) 录放音采样率的确定方法、装置及系统
US11070665B2 (en) Voice over internet protocol processing method and related network device
CN105591879A (zh) 数据传输方法及装置
CN102932568B (zh) 嵌入式VoIP电话系统及实现VoIP电话语音质量管理的方法
CN104427287A (zh) 数据处理方法及设备
CN108234658A (zh) 一种感知服务器集群健康状况的方法、装置和服务器
CN110781034B (zh) 分布式监管方法和系统
US8379675B2 (en) Jitter buffering control for controlling storage locations of a jitter buffer, and a method therefor
CN102255793B (zh) 一种处理双音多频的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination