CN102916938B - 一种基于rtp协议多路语音合成的方法 - Google Patents

一种基于rtp协议多路语音合成的方法 Download PDF

Info

Publication number
CN102916938B
CN102916938B CN201210337297.1A CN201210337297A CN102916938B CN 102916938 B CN102916938 B CN 102916938B CN 201210337297 A CN201210337297 A CN 201210337297A CN 102916938 B CN102916938 B CN 102916938B
Authority
CN
China
Prior art keywords
rtp
bag
road
voice
rtp bag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210337297.1A
Other languages
English (en)
Other versions
CN102916938A (zh
Inventor
梁平
李剑
汤湛成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PCI Technology Group Co Ltd
Original Assignee
PCI Suntek Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PCI Suntek Technology Co Ltd filed Critical PCI Suntek Technology Co Ltd
Priority to CN201210337297.1A priority Critical patent/CN102916938B/zh
Publication of CN102916938A publication Critical patent/CN102916938A/zh
Application granted granted Critical
Publication of CN102916938B publication Critical patent/CN102916938B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于RTP协议多路语音合成的方法,可用于当代呼叫系统语音监控。此方法首先,分析各路语音RTP包中的序号,时间戳,同步源标识(SSRC),统计相关的丢包率,音频采样周期等,再综合分析每路之间的差异;其次,根据上述统计结果,对每路语音的RTP包进行填充修补;最后,提取各路修补好的语音RTP包的载荷数据进行叠加取均值合成各种格式的音频文件。解决了语音抖动和不同步问题。

Description

一种基于RTP协议多路语音合成的方法
技术领域
本发明涉及通讯领域,特别是涉及一种基于RTP协议多路语音合成的方法。
背景技术
当代是以信息技术为主流的时代,VOIP技术以其运营成本低廉,且进入门槛低越来越受到人们的欢迎。在呼叫系统中,有录音监控的需求。一种可以直接进行语音录制,但这种受厂家的限制。另一种采用网络抓包工具直接采集RTP包。如一次电话会话的过程会产生两路RTP流,一路是用户呼入的,另一路是座席呼出的。由于两方所使用的设备不一样以及网络环境也存在差异,这就不能直接将这两路直接合并,如何对所抓取的包转换成音质可靠的语音这个课题急需解决。
发明内容
本发明所要解决的技术问题是提一种基于RTP协议多路语音合成的方法,提供一种严谨可靠的方法消除语音抖动和不同步问题,使所抓取的RTP包转换成音质可靠的语音。
为实现上述发明目的,本发明提供提一种基于RTP协议多路语音合成的方法,包括:
根据网络监控工具所抓取的RTP文件进行静态处理,经过分析、处理、合成三个步骤生成各种格式的语音文件;
在“分析”步骤中,根据序号,时间戳,同步源标识(SSRC)以及RTP包到达网络接口卡时间对每路RTP包进行分析,从序列号和RTP包到达网络接口卡时间统计丢包率,及RTP包发送率,根据时间戳统计语音的采样周期以及静音期,再统计各路RTP包个数差值;
在“处理”步骤中,根据上述的统计结果对各路RTP包进行不同的修补插包,其中插包总数依据此公式计算T=S+N(T:静音包总数,S:不同路RTP之间的差值,N:由于丢包必须添加的静音包数目);
第一步先比较各路之间RTP的差值,根据业内对于8kHz采样的话音信号,采用每隔20ms构成一个数据块的原理并根据日常的经验只有差值在75和300范围内才将差值赋予给S,否则将S设置为0;N的值在“分析“步骤中已经算出;
第二步处理各路RTP包,优先将丢失的包N修补上,修补S包根据如下策略进行,P=N/S(P:每隔多少RTP包,N:某路RTP包总数,S:不同路RTP之间的差值),若P大于0,则按每隔此值对某路RTP插入一个静音包,也就是均匀修补。
在“合成”步骤中,提取权利各路修补好的RTP包的载荷数据进行叠加取均值合成各种格式的音频文件。
由上述方案可以看出,本发明中对多路RTP进行分析、处理、合成三个步骤可以对所抓取的包转换成音质可靠的语音,在实际的使用中,可以将这三步组成为三段流水线,可以提高效率,节省成本,且便于部署,易于实现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一中系统结构示意图;
图2为本发明实施例一中分析流程示意图;
图3为本发明实施例一中处理流程示意图;
图4为本发明实施例一中合成流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一,参见图1,图2,图3,图4。
本发明提供提一种基于RTP协议多路语音合成的方法,提供一种严谨可靠的方法消除语音抖动和不同步问题,使所抓取的RTP包转换成音质可靠的语音,系统整体的工作过程参见图1。
在“分析”过程中参见图2,具体包括以下步骤:
步骤1,系统读取某一路RTP文件;
步骤2,系统判断RTP包序号是否连续;否,则将发生不连续的处的起始和结束序号存入统计数据库,继续步骤3,是,则直接继续步骤3;
步骤3.系统判断RTP包时间戳以此判断是否存在静音,是,则保存静音期的起始和结束序号。继续步骤4,否,则直接继续步骤4;
步骤4,系统判断RTP是否读取完,否,则转到步骤1,是,则结束分析。
在“处理”步骤中参见图3,具体包括以下步骤:
步骤1,系统读取各个RTP文件,计算RTP包数目的差值;
步骤2,系统从统计数据库读取统计结果和由步骤1获取的RTP包数目的差值,根据上述的统计结果对各路RTP包进行不同的修补插包,其中插包总数依据此公式计算T=S+N(T:静音包总数,S:不同路RTP之间的差值,N:由于丢包必须添加的静音包数目);
步骤3,系统判断各路RTP是否处理结束,否,则转步骤1,是,则结束处理;
在“合成”步骤中参见图4,具体包括以下步骤:
步骤1,系统同时读取各路RTP包载荷取和再均值;
步骤2,系统将经过步骤1处理过的数据流送入音频编码器处理;
步骤3,系统判断各路RTP包是否读取完毕,否,则将将剩余的RTP送入音频编码器处理,是,则结束合成。
由上可见,本发明提供的一种基于RTP协议多路语音合成的方法,有以下优点。
(1)便于部署,降低成本
本发明将多路RTP包合成语音操作过程,合理地分为分析,处理,合成三个步骤,降低开发的难度和成本。
(2)各个模块简洁,高效
模块内高内聚,模块间低耦合,可以采用多线程和流水线等技术,加快语音合成。
(3)提供稳定清晰的语音合成服务
使用内建严谨的算法,可以使系统长时间可靠运行,又有较高的容错性,即使语音的RTP包出现丢包,系统也能提供清晰的语音。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明以一种简单可靠的方式处理各路语音RTP包,消除VOIP中常见的语音抖动和不同步问题,通过又借助流水线的理念将处理过程分段,可以显著提高软件的运行效率。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种基于RTP协议多路语音合成的方法,其特征在于,此方法根据网络监控工具所抓取的RTP文件进行静态处理,经过分析、处理、合成三个步骤生成各种格式的语音文件;
在所述分析步骤中,根据序号,时间戳,同步源标识(SSRC)以及RTP包到达网络接口卡时间对每路RTP包进行分析,从序列号和RTP包到达网络接口卡时间统计丢包率,及RTP包发送率,根据时间戳统计语音的采样周期以及静音期,再统计各路RTP包个数差值;
在所述处理步骤中,根据统计结果对各路RTP包进行不同的修补插包;
在所述合成步骤中,提取各路修补好的RTP包的载荷数据进行叠加取均值合成各种格式的音频文件;
所述分析步骤包括:
步骤1,系统读取某一路RTP文件;
步骤2,系统判断RTP包序号是否连续;否,则将发生不连续的处的起始和结束序号存入统计数据库,继续步骤3,是,则直接继续步骤3;
步骤3.系统判断RTP包时间戳以此判断是否存在静音,是,则保存静音期的起始和结束序号,继续步骤4,否,则直接继续步骤4;
步骤4,系统判断RTP是否读取完,否,则转到步骤1,是,则结束分析;
所述处理步骤包括:
步骤1,系统读取各个RTP文件,计算RTP包数目的差值,所述差值在75和300范围内;
步骤2,系统从统计数据库读取统计结果和由步骤1获取的RTP包数目的差值,根据上述的统计结果对各路RTP包进行不同的修补插包,其中插包总数依据此公式计算T=S+N,T为静音包总数,S为不同路RTP之间的差值,N为由于丢包必须添加的静音包数目;
步骤3,系统判断各路RTP是否处理结束,否,则转步骤1,是,则结束处理;
所述合成步骤包括:
步骤1,系统同时读取各路RTP包的载荷取和再均值;
步骤2,系统将经过步骤1处理过的数据流送入音频编码器处理;
步骤3,系统判断各路RTP包是否读取完毕,否,则将将剩余的RTP送入音频编码器处理,是,则结束合成。
CN201210337297.1A 2012-09-08 2012-09-08 一种基于rtp协议多路语音合成的方法 Active CN102916938B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210337297.1A CN102916938B (zh) 2012-09-08 2012-09-08 一种基于rtp协议多路语音合成的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210337297.1A CN102916938B (zh) 2012-09-08 2012-09-08 一种基于rtp协议多路语音合成的方法

Publications (2)

Publication Number Publication Date
CN102916938A CN102916938A (zh) 2013-02-06
CN102916938B true CN102916938B (zh) 2015-11-25

Family

ID=47615172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210337297.1A Active CN102916938B (zh) 2012-09-08 2012-09-08 一种基于rtp协议多路语音合成的方法

Country Status (1)

Country Link
CN (1) CN102916938B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512874A (zh) * 2017-02-27 2018-09-07 上海谦问万答吧云计算科技有限公司 一种在线答疑数据的同步方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1549536A (zh) * 2003-05-09 2004-11-24 ��Ϊ�������޹�˾ 用rtp数据包的时戳进行排序以消除其抖动延时的方法
CN1937544A (zh) * 2006-11-13 2007-03-28 陈哲 Ip电话监听系统
CN101014001A (zh) * 2006-11-13 2007-08-08 陈哲 Rtp报文修补装置、rtp报文排序方法和填补方法
CN101188525A (zh) * 2007-11-27 2008-05-28 华为技术有限公司 一种语音流的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1549536A (zh) * 2003-05-09 2004-11-24 ��Ϊ�������޹�˾ 用rtp数据包的时戳进行排序以消除其抖动延时的方法
CN1937544A (zh) * 2006-11-13 2007-03-28 陈哲 Ip电话监听系统
CN101014001A (zh) * 2006-11-13 2007-08-08 陈哲 Rtp报文修补装置、rtp报文排序方法和填补方法
CN101188525A (zh) * 2007-11-27 2008-05-28 华为技术有限公司 一种语音流的处理方法及装置

Also Published As

Publication number Publication date
CN102916938A (zh) 2013-02-06

Similar Documents

Publication Publication Date Title
RU2010127310A (ru) Система и способ сжатия интерактивного потокового видео
CN102226944A (zh) 混音方法及设备
EP3097657A1 (en) Efficiently mixing voip data
CN109218794B (zh) 远程作业指导方法及系统
EP1844593A4 (en) SIGNALING BUFFER PARAMETERS TO INDICATE THE BUFFER ARCHITECTURE OF A RECEIVER
WO2018184277A1 (zh) 一种基于推流终端网络状况的优化方法和系统以及推流终端
EA200500540A1 (ru) Телефонный терминал, обеспечивающий связь между телефоном и сетью передачи данных
CN102594694A (zh) 数据分流方法和设备
MX356487B (es) Metodo y sistema para modificar comportamiento de la parte que llama.
CN102065231A (zh) 多路数据融合装置及其实现方法、多路音频数据处理系统
CN102355484B (zh) 一种音频数据传输的方法
CN104167210A (zh) 一种轻量级的多方会议混音方法和装置
WO2018204117A1 (en) Web real-time communication from an audiovisual file
CN102916938B (zh) 一种基于rtp协议多路语音合成的方法
CN107453936A (zh) 一种诊断语音时延的方法和网关设备
CN102271196B (zh) 一种低码率语音网关通讯系统
CN103188403B (zh) 语音网关在线监听方法
CN100507215C (zh) 矿山救援可视化指挥装置
CN101867764A (zh) 移动多方视频通话系统
CN105763484A (zh) 基于流组合压缩的信令流汇聚装置及其方法
CN203289656U (zh) 一种语音通话装置及系统
CN101193168B (zh) 媒体终端转换器、网络电话维护系统及方法
CN101442575A (zh) 一种网络语音系统的实现方法
CN104184570A (zh) 通讯系统和方法
CN202340257U (zh) 基于有线的远距离数话同传设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 306, zone 2, building 1, Fanshan entrepreneurship center, Panyu energy saving technology park, No. 832 Yingbin Road, Donghuan street, Panyu District, Guangzhou City, Guangdong Province

Patentee after: Jiadu Technology Group Co.,Ltd.

Address before: No.4, Jiangong Road, Tianhe Software Park, Guangzhou, Guangdong 510665

Patentee before: PCI-SUNTEKTECH Co.,Ltd.

CP03 Change of name, title or address