CN111371534B - 一种数据重传方法、装置、电子设备和存储介质 - Google Patents
一种数据重传方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111371534B CN111371534B CN202010481962.9A CN202010481962A CN111371534B CN 111371534 B CN111371534 B CN 111371534B CN 202010481962 A CN202010481962 A CN 202010481962A CN 111371534 B CN111371534 B CN 111371534B
- Authority
- CN
- China
- Prior art keywords
- data frame
- data
- sample
- recovery capability
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000003860 storage Methods 0.000 title claims abstract description 26
- 238000011084 recovery Methods 0.000 claims abstract description 162
- 238000012545 processing Methods 0.000 claims abstract description 55
- 238000012549 training Methods 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 abstract description 23
- 238000013473 artificial intelligence Methods 0.000 abstract description 21
- 230000005540 biological transmission Effects 0.000 abstract description 19
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 229910052982 molybdenum disulfide Inorganic materials 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/12—Arrangements for detecting or preventing errors in the information received by using return channel
- H04L1/16—Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
- H04L1/18—Automatic repetition systems, e.g. Van Duuren systems
- H04L1/1809—Selective-repeat protocols
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/12—Arrangements for detecting or preventing errors in the information received by using return channel
- H04L1/16—Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
- H04L1/1607—Details of the supervisory signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/12—Arrangements for detecting or preventing errors in the information received by using return channel
- H04L1/16—Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
- H04L1/18—Automatic repetition systems, e.g. Van Duuren systems
- H04L1/1829—Arrangements specially adapted for the receiver end
- H04L1/1848—Time-out mechanisms
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
本申请提供一种数据重传方法、装置、电子设备和存储介质,属于互联网技术领域,涉及人工智能和云技术,用以提高数据传输的信道利用率。本申请实施例发送端设备将数据帧发送给接收端设备,并获得数据帧的数据恢复能力;其中数据恢复能力用于表示接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧、与未接收到的数据帧之间的差异度;发送设备接收到接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。由于本申请在确定请求重传的数据帧的数据恢复能力未达到设定条件时,发送端设备再重传数据帧,从而节省了网络的带宽资源,同时减少了网络往返发送数据帧的时延,提升了数据传输的效率。
Description
技术领域
本申请涉及互联网技术领域,特别涉及一种数据重传方法、装置、电子设备和存储介质。
背景技术
由于互联网是非可靠的传输网络,通过互联网传输音频数据时,传输网络的不稳定性会导致传输过程中出现丢包现象,从而导致接收端接收到的音频卡顿或不连贯,收听体验较差。
现有技术中解决音频传输过程中的丢包现象,是由接收端设备在确定出现丢包时,向发送端设备请求重传丢失的数据包;发送端设备在发送数据报文后,需要等待接收端设备返回的状态报告,如果状态报告表示发送成功,则发送端设备继续发送后续的数据报文;如果状态报告表示发送失败,则发送端设备重传丢失的数据包。由于现有技术中接收端设备在每次数据包丢失后均需要向发送端发送重传请求,发送端设备在接收到重传请求后再重新发送丢失的数据包,在将丢失的数据包重传后再发送下一个数据包。因此目前的数据重传方式会大大增加发送端与接收端之间重传数据包的次数,导致网络时延较大且信道利用率较低。
发明内容
本申请实施例提供一种数据重传方法、装置、电子设备和存储介质,用以提高数据传输的信道利用率。
第一方面,本申请实施例提供一种数据重传方法,包括:
发送端设备将数据帧发送给接收端设备,并获得所述数据帧的数据恢复能力;其中所述数据恢复能力用于表示所述接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧、与未接收到的数据帧之间的差异度;
所述发送设备接收到所述接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。
第二方面,本申请实施例提供一种数据重传装置,包括:
获取单元,用于将数据帧发送给接收端设备,并获得所述数据帧的数据恢复能力;其中所述数据恢复能力用于表示所述接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧、与未接收到的数据帧之间的差异度;
确定单元,用于接收到所述接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请提供的数据重传方法。
第四方面,本申请实施例提供一种计算机可读介质,存储有计算机可执行指令,所述计算机可执行指令用于执行本申请提供的数据重传方法。
本申请有益效果:
由于本申请实施例中发送端设备在发送数据帧时,获取数据帧的数据恢复能力,能够预测在丢失该数据帧时,接收端设备根据接收到的数据帧进行恢复处理后得到的恢复数据帧与该数据帧的差异,从而在收到接收端设备发送的重传请求时,发送端设备根据请求重传的数据帧的数据恢复能力判断是否需要进行重传,在确定请求重传的数据帧的数据恢复能力未达到设定条件时,发送端设备再重传数据帧,而不是对接收端发送重传请求的所有数据帧都进行重传,从而节省了网络的带宽资源,同时减少了网络往返发送数据帧的时延,提升了数据传输的效率。
附图说明
图1为本申请实施例中的一种可选的应用场景示意图;
图2为本申请实施例中的一种数据重传方法流程示意图;
图3为本申请实施例中的一种全连接的BP神经网络的示意图;
图4为本申请实施例中的一种预测模型的训练过程流程图;
图5为本申请实施例中的一种完整的数据重传方法的交互流程图;
图6为本申请实施例中的一种数据重传装置的结构示意图;
图7为本申请实施例中的一种电子设备的结构示意图;
图8为本申请实施例中的一种计算装置的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
下面对文中出现的一些术语进行解释:
1、本申请实施例中术语“丢包”,是指一个或多个数据包的数据无法通过网络传输到达目的地。
2、本申请实施例中术语“语音编码”,是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输,语音编码的基本方法可分为波形编码、参量编码(音源编码)和混合编码。对语音进行编码的目的是为了将语音数字化,并利用人的发声过程中存在的冗余度和人的听觉特性来降低编码率。
3、本申请实施例中术语“线谱对”,是线性预测系数的一种推演参数。线谱对参数具有非常好的量化特性和插值特性,因而在声码器研究中获得广泛的应用。
4、本申请实施例中术语“基音周期”,声带振动的频率称为基频,相应的周期就称为基音周期,它由声带逐渐开启到面积最大(约占基音周期的50%)、逐渐关闭到完全闭合(约占基音周期的35%)、完全闭合(约占基音周期的15%)三部分组成。
5、本申请实施例中术语“基于网际互连协议网络的语音通话方式(Voice overInternet Protocol,VoIP)”,为通过语音的压缩算法把语音数据进行编码压缩处理后,按照网络传输协议标准进行打包,经过IP网络把数据包发送到目的IP地址,再把语音数据包解析并解压缩处理后,恢复原来的语音信号,从而达到通过互联网传送语音信号的目的。
6、本申请实施例中术语“平均意见值(Mean Opinion Score,MOS)”,是用以衡量通信系统语音质量的重要指标。在国际标准中,统一使用MOS值来评价系统接收到的压缩语音质量:5表示优、4表示好、3表示可以接受、2表示差、1表示糟糕;常用的MOS值评价方法包括主观MOS值评价和客观MOS值评价。其中主观MOS值评价采用ITU-T P.800和P.830建议书,由不同的人分别对原始语料和经过系统处理后有衰退的语料进行主观感觉对比,得出MOS值后求平均值;而客观MOS值评价则采用ITU-T P.862建议书提供的主观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)方法,由专门的仪器或软件进行测试。
7、本申请实施例中术语“PESQ”,是一种对客观MOS值的评价方法,由于PESQ算法考虑了整个信号传输过程的中断和衰减,能够给出精确的预测MOS值,可以用于编解码或系统评估、选择和优化。
8、本申请实施例中术语“自动重传请求(Automatic Repeat Request,ARQ)”,通过接收端请求发送端重传出错的数据报文,来恢复出错的报文,是通信中用于处理信道所带来差错的方法之一。
9、本申请中的数据恢复能力,表示根据已经接收到的数据帧获得未接收到的数据帧的能力,数据恢复能力越高,恢复的数据帧越接近实际数据帧,反之数据恢复能力越低,恢复的数据帧和实际数据帧之间的差异越大。因此数据恢复能力可以用数据恢复处理得到的恢复数据帧与实际数据帧之间的差异度来表示,该差异度可以是表示恢复数据帧与实际数据帧之间差异的参数值,也可以是以一个阈值来区分恢复数据帧是否可用的指示信息,例如恢复数据帧与实际数据帧之间差异的参数值大于阈值时,说明恢复数据帧不可用,则对应的数据恢复能力可以用指示信息0表示,反之,恢复数据帧与实际数据帧之间差异的参数值小于等于阈值时,说明恢复数据帧可用,对应的数据恢复能力可以用指示信息1表示。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
随着终端设备的普及,音频传输业务应用的场景越来越多,例如用户使用通信终端与其它用户通过即时通讯应用程序进行音视频通话,或用户观看其它用户的直播等。由于互联网是非可靠的传输网络,承载在互联网上的音频应用,如VoIP、语音广播、音视频通话等音频传输过程中,容易出现丢包现象,使得音频数据中的一个或多个数据包的数据无法传输到接收端设备,从而导致接收端接收到的音频卡顿或不连贯,收听体验较差。
目前为解决音频传输业务中的丢包问题,采用的方式包括前向纠错(forwarderror correction,FEC)、丢包隐藏(Packet Loss Concealment,PLC)、ARQ自动重传请求等。
其中,PLC是常规语音解码器自带的一种丢包隐藏技术,其原理是基于丢包帧之前相邻语音帧的特征进行复制或外延处理恢复丢包帧位置的语音帧的语音特征,从而使丢包帧得到一定程度的恢复,但在丢包帧位置的语音帧与相邻语音帧的语音特征相差较大时,PLC恢复的效果并不理想;
ARQ是通信中用于处理信道所带来差错的方法之一,ARQ重传主要包括停等式丢包重传方式、回退N帧丢包重传方式以及选择性重传方式等方式 ,但由于现有的丢包重传机制中接收端设备在每次数据包丢失后均需要向发送端设备发送重传请求,发送端设备在接收到重传请求后再重新发送丢失的数据包,需要占用较多的网络带宽资源,增加发送端设备与接收端设备之间传输数据包的次数,导致网络的时延较大且信道利用率较低,故上述的丢包重传机制效率较低。
有鉴于此,本申请实施例提供一种数据重传方法,发送端设备在将数据帧发送给接收设备时,获取数据帧的数据恢复能力;数据帧的数据恢复能力表示接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧与未接收到的数据帧之间的差异度;发送端设备接收到接收端设备发送的重传请求时,确定请求重传的数据帧的数据恢复能力没有未达到设定条件,发送端设备向接收端设备重传数据帧。发送端设备在发送数据帧时,获取数据帧的数据恢复能力,能够预测在丢失该数据帧时,接收端设备根据接收到的数据帧进行恢复处理后得到的恢复数据帧与该数据帧的差异,从而在收到接收端设备发送的重传请求时,发送端设备根据请求重传的数据帧的数据恢复能力判断是否需要进行重传,在确定请求重传的数据帧的数据恢复能力未达到设定条件时,发送端设备再重传数据帧,而不是对接收端发送重传请求的所有数据帧都进行重传。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
如图1所示,其为本申请实施例示例性的一种应用场景的示意图。该应用场景图中包括发送端设备11和接收端设备12,发送端设备11与接收端设备12之间可以通过通信网络进行通信。
在本申请实施例中,发送端设备11可以为终端设备或服务器,发送端设备11为终端设备时,接收端设备12为服务器;发送端设备11为服务器时,接收端设备12为终端设备;其中图1以发送端设备11为终端设备,接收端设备12为服务器为例。
例如,用户通过终端设备上安装的即时通讯类软件的客户端,与其它用户进行音频通话或视频通话时,客户端将用户输入的音频发送给服务器,该应用场景中,发送端设备11为用户使用的终端设备,接收端设备12为服务器。
或者,用户通过终端设备上安装的社交类软件的客户端,观看其它用户的直播,服务器将其它用户直播中的音频发送给用户使用的客户端,该应用场景中,发送端设备11为服务器,接收端设备12为终端设备。
需要说明的是,发送端设备11与接收端设备12之间通过网络进行通信连接,该网络可以为局域网、广域网等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
可选的,发送端设备11对音频数据进行语音编码后,将编码后的数据帧发送给接收端设备12,同时发送端设备11根据当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征,确定当前发送的数据帧的数据恢复能力;接收端设备12在检测到未接收到数据帧时,向发送端设备11发送重传请求,同时启动计时器;发送端设备11在接收到接收端设备12发送的重传请求后,若确定请求重传的数据帧的数据恢复能力未达到设定条件,则发送端设备11向接收端设备12重传数据帧,否则,发送端设备11不作处理;接收端设备12在计时器的预设时间到达时,确定未收到发送端设备11重传的数据帧,则接收端设备12根据未收到的数据帧的前一数据帧进行数据恢复处理,并将数据恢复处理得到的恢复数据帧作为未收到的数据帧,从而恢复丢失的数据帧。从而节省了发送端设备11与接收端设备12之间网络的带宽资源,同时减少了发送端设备11与接收端设备12之间往返发送数据帧的网络时延,提升了数据传输的效率。
下面结合上述描述的应用场景,参考图2-图5来描述本申请示例性实施方式提供的数据重传方法。需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。
云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
其中,云技术中还包括人工智能云服务技术领域,所谓人工智能云服务,一般也被称作是AIaaS(AI as a Service,AI即服务)。这是目前主流的一种人工智能平台的服务方式,具体来说AIaaS平台会把几类常见的AI服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过API接口的方式来接入使用平台提供的一种或者是多种人工智能服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自己专属的云人工智能服务。本申请实施例提供的数据重传方法可以基于上述的云技术实现,具体实施中,发送端设备可以基于云技术中人工智能云服务确定当前发送的数据帧的数据恢复能力,从而在接收到接收端设备发送的重传请求后,若确定请求重传的数据帧的数据恢复能力未达到设定条件,则向接收端设备重传数据帧。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本申请实施例还涉及人工智能与机器学习,用以实现本申请实施例中发送端设备确定当前发送的数据帧的数据恢复能力。
如图2所示,为本申请实施例提供的数据重传方法流程示意图,该方法可以包括以下步骤:
步骤S21、发送端设备将数据帧发送给接收端设备,并获得数据帧的数据恢复能力;其中数据恢复能力用于表示接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧、与未接收到的数据帧之间的差异度;
步骤S22、发送设备接收到接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。
需要说明的是,本申请实施例以数据帧为语音数据帧为例,说明本申请实施例的数据重传方法。
一种可选的实施方式为,发送端设备通过编码器对原始语音序列进行语音编码,将模拟信号转化成数字信号,并向接收端设备发送编码后的语音数据帧,从而完成音频数据的传输。
在发送端设备向接收端设备发送数据帧时,发送端设备从编码器中提取当前发送的数据帧的语音特征,其中,语音特征可以包括数据帧的线谱对、基音周期和增益等参数中的部分或全部。
需要说明的是,线谱对反映了语音信号中隐含的音谱特征;基音周期反映了语音的音调;增益是用于调节信号强度的参数。
发送端设备在向接收端设备发送每个数据帧时,均需要提取每个数据帧的语音特征,并将提取出的语音特征缓存在预设的第一存储空间中。
针对当前发送的数据帧,提取当前发送的数据帧的语音特征,并从预设的第一存储空间中获取上一次发送的数据帧的语音特征;发送端设备根据当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征,确定当前发送的数据帧的数据恢复能力。
其中,当前发送的数据帧的数据恢复能力为发送端设备预测的根据上一次发送的数据帧的语音特征恢复得到的恢复数据帧与当前发送的数据帧之间的差异度。由于发送端设备在发送数据帧时,确定当前发送的数据帧的数据恢复能力,可以预测在该数据帧丢包时,若不对该数据帧进行重传,而是由接收端设备进行数据恢复处理的效果,从而在接收到接收端设备发送的重传请求时,根据请求重传的数据帧的数据恢复能力判断发送端是否重传数据帧。
具体的,如果数据帧的数据恢复能力的值较大,表示通过数据恢复处理得到的恢复数据帧与丢失的数据帧之间的差异较大,则此时需要对数据帧进行重传;如果数据帧的数据恢复能力的值较小,表示通过数据恢复处理得到的恢复数据帧与丢失的数据帧之间的差异较小,可以由接收端设备进行数据恢复处理,而不需要发送端设备进行重传。
实施中,本申请实施例的数据帧的数据恢复能力可以为,根据上一次发送的数据帧进行数据恢复处理得到的恢复数据帧的MOS值与当前发送的数据帧的MOS值的差值。
需要说明的是,本申请实施例中数据帧的MOS值可以为客观MOS值,客观数据帧的MOS值可以通过PESQ工具进行检测得到;
例如,PESQ可以是ITU-TP.862建议书提供的客观MOS值评价方法。
一种可选的实施方式为,根据下列方式确定数据帧的数据恢复能力:
将当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征输入已训练的预测模型,通过已训练的预测模型对当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行非线性变换,得到当前发送的数据帧的数据恢复能力。
在具体实施中,预测模型可以为全连接的BP神经网络,包括输入层,隐藏层和输出层,其中隐藏层的层数可以选用技术人员的经验数值,或通过训练过程寻找适用的隐藏层层数,下面以包括一层隐藏层的全连接BP神经网络为例,对确定当前发送的数据帧的数据恢复能力的方式进行介绍:
如图3所示,全连接的BP神经网络包括输入层、隐藏层和输出层;
采用输入层对输入的当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行预处理,其中,预处理可以为以下两种方式:
方式1、对输入的当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行归一化处理,并将归一化处理后的当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征转换为向量形式,得到输入特征向量。
方式2、直接将输入的当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征转换为向量形式,得到输入特征向量。
需要说明的是,对输入的当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征的预处理过程也可以在将当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征输入到BP神经网络之前由发送端设备的预处理单元执行。
全连接的BP神经网络中输入层的每个节点与隐藏层的每个节点均相互连接,隐藏层的每个节点与输出层的每个节点之间均相互连接。隐藏层的每个节点的输出值,是根据输入层所有节点的输出值、当前节点与输入层所有节点的权值、当前节点的偏差值以及激活函数来确定的,而输出层的输出值,是根据隐藏层所有节点的输出值、输出层节点与隐藏层所有节点的权值以及激活函数来确定的。
例如,根据下列公式确定隐藏层或输出层每个节点的输出值:
其中,Yk为隐藏层或输出层中节点k的输出值,Wik为隐藏层或输出层中节点k与上一层节点i之间的权重值,Bk为节点k的偏差值,f()为激活函数。
在具体实施中,激活函数可以选择sigmoid函数。
例如,假设输入层包括26个节点,当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征包括:10个当前发送的数据帧的线谱对参数、10个上一次发送的数据帧的线谱对参数、当前发送的数据帧的基音周期和上一次发送的数据帧的基音周期、当前发送的数据帧的固定码书增益和上一次发送的数据帧的固定码书增益、当前发送的数据帧的自适应增益和上一次发送的数据帧的自适应增益,共26个输入特征参数。
假设对输入的当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行预处理后得到的输入特征向量为:
隐藏层根据对应的第一变换矩阵,对输入特征向量进行非线性变换确定隐藏层的输出向量;例如,假设隐藏层包括64个节点,则第一变换矩阵如下:
输出层的输出为当前发送的数据帧的数据恢复能力,本申请实施例中将输出层的节点数量设置为1;根据对应的第二变换矩阵,对隐藏层的输出向量进行非线性变换确定当前发送的数据帧的数据恢复能力;例如,第二变换矩阵如下:
需要说明的是,转换矩阵是由不同权重值w组成的矩阵。
本申请实施例还提供一种预测模型的训练过程,如图4所示,预测模型的训练过程包括以下步骤:
步骤S41、从训练样本数据集中选取训练样本;
训练样本数据可以为技术人员测试使用的样本数据,也可以是收集得到的发送端与接收端之间历史传输实际使用的样本数据,本申请中不做限制。
训练样本包括第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的第二数据帧样本的数据恢复能力;第一数据帧样本与第二数据帧样本为历史发送的语音序列中的相邻两个数据帧,且第一数据样本为第二数据帧样本的前一帧,第二数据帧样本的数据恢复能力为根据第一数据帧样本进行数据恢复处理得到的恢复数据帧、与第二数据帧样本之间的差异度。
一种可能的实施方式为,根据下列方式确定训练样本中预先标注的第二数据帧样本的数据恢复能力:
对第二数据帧样本进行语音质量检测,获取第二数据帧样本对应的语音质量参数,其中,语音质量检测可以为PESQ检测,语音质量参数可以为MOS值。
具体实施中,可以对第二数据帧样本通过解码器进行解码处理后,使用PESQ工具检测解码后的第二数据帧样本对应的MOS值。
根据第一数据帧样本进行PLC数据恢复处理,得到恢复数据帧样本,具体实施中,对第一数据帧样本的语音特征进行复制或外延处理,从而获得恢复数据帧样本。
在得到恢复数据帧样本后,对恢复数据帧样本进行语音质量检测,获取恢复数据帧样本对应的语音质量参数,具体的,可以通过解码器对恢复数据帧样本进行解码处理,并使用PESQ工具检测解码后的恢复数据帧样本对应的MOS值。
根据恢复数据帧样本对应的语音质量参数与第二数据帧样本对应的语音质量参数,确定预先标注的第二数据帧样本的数据恢复能力。
具体的,将恢复数据帧样本对应的MOS值与第二数据帧样本对应的MOS值之间的差值的绝对值作为预先标注的第二数据帧样本的数据恢复能力。
例如,根据下列方式确定预先标注的第二数据帧样本的数据恢复能力:
其中,R为预先标注的第二数据帧样本的数据恢复能力,MOSr为数据帧样本对应的MOS值,MOS2为第二数据帧样本对应的MOS值。
步骤S42、将训练样本包含的第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的第二数据帧样本的数据恢复能力输入到初始预测模型,获得初始预测模型输出的第二数据帧样本的数据恢复能力;
步骤S43、根据损失函数确定训练样本中预先标注的第二数据帧样本的数据恢复能力、与通过初始预测模型得到的第二数据帧样本的数据恢复能力的损失值;
具体实施中,损失函数可以为均方误差函数,但不限于此。
步骤S44、判断损失值是否在预设的收敛范围中,若否,执行步骤S45;若是,执行步骤S46;
步骤S45、通过初始预测模型的反向传播过程,调整初始预测模型的变换矩阵中的模型参数,并返回步骤S41;
具体实施中,可以基于梯度下降算法对模型参数进行调整,其中模型参数包括但不限于权重值w和偏差值B。
步骤S46、确定初始预测模型训练完成,得到已训练的预测模型。
一种可选的实施方式为,发送端设备在获得当前发送的数据帧的数据恢复能力后,将当前发送的数据帧和数据恢复能力的映射关系存储到预设的第二存储空间中。
接收端设备在预设时长内未接收到发送端发送的数据帧时,向发送端发送重传请求。具体的,重传请求可以为数据帧的否认字符(Negative Acknowledge,NACK),接收端设备向发送端设备发送NACK状态报文,表示接收端设备未收到该状态报文对应的数据帧,请求发送端设备重传该数据帧。
发送端设备在接收到接收端设备发送的重传请求后,根据预存的数据帧和数据恢复能力的映射关系,确定请求重传的数据帧的数据恢复能力,判断请求重传的数据帧的数据恢复能力是否达到设定条件,若请求重传的数据帧的数据恢复能力未达到设定条件,则发送端设备向接收端设备重传数据帧,否则,发送端设备不作处理。
一种可选的实施方式为,设定条件为数据恢复能力小于预设阈值,在数据恢复能力小于预设阈值时,表示预测的数据恢复处理得到的恢复数据帧与丢失的数据帧之间的差异较小,数据恢复效果较好,则发送端设备不需要重传该数据帧,而是由接收端设备进行PLC数据恢复处理,恢复丢失的数据帧;
而当数据恢复能力不小于预设阈值时,表示预测的数据恢复处理得到的恢复数据帧与丢失的数据帧之间的差异较大,接收端设备进行PLC数据恢复的效果较差,并不能解决数据帧丢包带来的音频卡顿或不连贯的问题,则需要发送端设备重传数据帧。
一种可选的实施方式为,接收端设备在向发送端设备发送NACK状态报文同时,启动计时器,在计时器的预设时间到达后,仍未收到发送的端设备重传的数据帧,则接收端设备根据丢包的数据帧的前一数据帧进行PLC数据恢复处理,得到恢复数据帧,并将恢复数据帧放置到丢包的数据帧对应的位置,从而恢复丢包的数据帧。
如图5所示,为本申请实施例一种完整的数据重传方法的交互流程图,包括以下步骤:
步骤S501、发送端设备通过编码器对原始语音序列进行数据编码;
步骤S502、发送端设备向接收端设备发送数据帧;
步骤S503、发送端设备提取当前发送的数据帧的语音特征,并从预设的第一存储空间中获取上一次发送的数据帧的语音特征;
步骤S504、发送端设备将当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征输入已训练的预测模型,通过已训练的预测模型对当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行非线性变换,得到当前发送的数据帧的数据恢复能力;
步骤S505、发送端设备将当前发送的数据帧和数据恢复能力的映射关系存储到预设的第二存储空间中;
步骤S506、接收端设备确定未接收到第i帧数据帧;
步骤S507、接收端设备向发送端设备发送重传第i帧数据帧的重传请求;
步骤S508、发送端设备根据预存的数据帧和数据恢复能力的映射关系,确定请求重传的第i帧数据帧的数据恢复能力;
步骤S509、发送端设备确定第i帧数据帧的数据恢复能力大于预设阈值;
步骤S510、发送端设备向接收端设备重传第i帧数据帧;
步骤S511、接收端设备将接收到的发送端设备重传的第i帧数据帧放置到丢包的数据帧对应的位置。
另外,当发送端设备确定第i帧数据帧的数据恢复能力不大于预设阈值时,发送端设备不做处理,接收端设备在确定预设时长内未收到发送端设备重传的数据帧时,根据第i-1帧数据帧进行数据恢复处理,得到恢复数据帧,并将恢复数据帧放置到丢包的数据帧对应的位置。
基于同一发明构思,本申请实施例中还提供了一种数据重传装置,由于上述装置解决问题的原理与数据重传方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图6所示,为本申请实施例提供的数据重传装置600的结构示意图,包括:
获取单元601,用于将数据帧发送给接收端设备,并获得数据帧的数据恢复能力;其中数据恢复能力用于表示接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧、与未接收到的数据帧之间的差异度;
确定单元602,用于接收到接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。
可选的,数据帧为语音数据帧;
获取单元601具体用于:
根据当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征,确定当前发送的数据帧的数据恢复能力。
可选的,获取单元601具体用于:
将当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征输入已训练的预测模型,通过已训练的预测模型对当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行非线性变换,得到当前发送的数据帧的数据恢复能力;
其中,对预测模型进行训练时使用的训练样本中包含第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的第二数据帧样本的数据恢复能力;第一数据帧样本与第二数据帧样本为历史发送的语音序列中的相邻两个数据帧,且第一数据样本为第二数据帧样本的前一帧,第二数据帧样本的数据恢复能力为根据第一数据帧样本进行数据恢复处理得到的恢复数据帧、与第二数据帧样本之间的差异度。
可选的,预测模型包括输入层、至少一个隐藏层和输出层;获取单元601具体用于:
采用输入层,对当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行预处理得到输入特征向量;
采用至少一个隐藏层,根据隐藏层对应的变换矩阵,对输入特征向量进行非线性变换得到当前发送的数据帧的数据恢复能力;其中变换矩阵是在对预测模型训练过程中确定的;
采用输出层,将确定出的当前发送的数据帧的数据恢复能力输出。
可选的,数据重传装置600还包括训练单元603,用于:
根据下列方式对预测模型进行训练:
从训练样本数据集中选取训练样本;
将训练样本包含的第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的第二数据帧样本的数据恢复能力输入初始预测模型,获得初始预测模型输出的第二数据帧样本的数据恢复能力;其中,初始预测模型是根据变换矩阵,对由第一数据帧样本的语音特征和第二数据帧样本的语音特征预处理得到的样本特征向量进行非线性变换处理,得到第二数据帧样本的数据恢复能力;
基于损失函数对初始预测模型的变换矩阵中的模型参数进行调整,直到训练样本中预先标注的第二数据帧样本的数据恢复能力、与通过初始预测模型得到的第二数据帧样本的数据恢复能力的损失值在预设范围内,得到已训练的预测模型。
可选的,训练单元603具体用于:
根据下列方式确定预先标注的第二数据帧样本的数据恢复能力:
对第二数据帧样本进行语音质量检测,获取第二数据帧样本对应的语音质量参数;
根据第一数据帧样本进行PLC数据恢复处理,得到恢复数据帧样本;并对恢复数据帧样本进行语音质量检测,获取恢复数据帧样本对应的语音质量参数;
根据恢复数据帧样本对应的语音质量参数与第二数据帧样本对应的语音质量参数,确定预先标注的第二数据帧样本的数据恢复能力。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
所属技术领域的技术人员能够理解,本申请的每个方面可以实现为系统、方法或程序产品。因此,本申请的每个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,本申请实施例还提供一种电子设备,参阅图7所示,电子设备700可以至少包括至少一个处理器701、以及至少一个存储器702。其中,存储器702存储有程序代码,当程序代码被处理器701执行时,使得处理器701执行本说明书上述描述的根据本申请各种示例性实施方式的内容推荐方法中的步骤。例如,处理器701可以执行如图2中所示的步骤。
在一些可能的实施方式中,本申请实施例还提供一种计算装置,可以至少包括至少一个处理单元、以及至少一个存储单元。其中,存储单元存储有程序代码,当程序代码被处理单元执行时,使得处理单元执行本说明书上述描述的根据本申请各种示例性实施方式的服务调用方法中的步骤。例如,处理单元可以执行如图2中所示的步骤。
下面参照图8来描述根据本申请的这种实施方式的计算装置800。图8的计算装置800仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8,计算装置800以通用计算装置的形式表现。计算装置800的组件可以包括但不限于:上述至少一个处理单元801、上述至少一个存储单元802、连接不同系统组件(包括存储单元802和处理单元801)的总线803。
总线803表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元802可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)821或高速缓存存储单元822,还可以进一步包括只读存储器(ROM)823。
存储单元802还可以包括具有一组(至少一个)程序模块824的程序/实用工具825,这样的程序模块824包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置800也可以与一个或多个外部设备804(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置800交互的设备通信,或与使得该计算装置800能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口805进行。并且,计算装置800还可以通过网络适配器806与一个或者多个网络(例如局域网(LAN),广域网(WAN)或公共网络,例如因特网)通信。如图所示,网络适配器806通过总线803与用于计算装置800的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置800使用其它硬件或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的内容推荐方法的每个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的内容推荐方法中的步骤,例如,计算机设备可以执行如图2中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (14)
1.一种数据重传方法,其特征在于,该方法包括:
发送端设备将数据帧发送给接收端设备,并获得所述数据帧的数据恢复能力;其中所述数据恢复能力用于表示所述接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧与未接收到的数据帧之间的差异度;
所述发送端 设备接收到所述接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。
2.如权利要求1所述的方法,其特征在于,所述数据帧为语音数据帧;
所述获得所述数据帧的数据恢复能力,具体包括:
根据当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征,确定当前发送的数据帧的数据恢复能力。
3.如权利要求2所述的方法,其特征在于,所述根据当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征,确定当前发送的数据帧的数据恢复能力,具体包括:
将当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征输入已训练的预测模型,通过已训练的预测模型对当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行非线性变换,得到当前发送的数据帧的数据恢复能力;
其中,对预测模型进行训练时使用的训练样本中包含第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的所述第二数据帧样本的数据恢复能力;所述第一数据帧样本与所述第二数据帧样本为历史发送的语音序列中的相邻两个数据帧,且所述第一数据帧样本为所述第二数据帧样本的前一帧,所述第二数据帧样本的数据恢复能力为根据第一数据帧样本进行数据恢复处理得到的恢复数据帧、与所述第二数据帧样本之间的差异度。
4.如权利要求3所述的方法,其特征在于,所述预测模型包括输入层、至少一个隐藏层和输出层;所述已训练的预测模型得到所述当前发送的数据帧的数据恢复能力,具体包括:
采用所述输入层,对所述当前发送的数据帧的语音特征以及所述上一次发送的数据帧的语音特征进行预处理得到输入特征向量;
采用至少一个隐藏层,根据隐藏层对应的变换矩阵,对所述输入特征向量进行非线性变换得到所述当前发送的数据帧的数据恢复能力;其中所述变换矩阵是在对所述预测模型训练过程中确定的;
采用所述输出层,将确定出的所述当前发送的数据帧的数据恢复能力输出。
5.如权利要求4所述的方法,其特征在于,根据下列方式对所述预测模型进行训练:
从训练样本数据集中选取训练样本;
将所述训练样本包含的第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的所述第二数据帧样本的数据恢复能力输入初始预测模型,获得所述初始预测模型输出的所述第二数据帧样本的数据恢复能力;其中,所述初始预测模型是根据变换矩阵,对由所述第一数据帧样本的语音特征和第二数据帧样本的语音特征预处理得到的样本特征向量进行非线性变换处理,得到所述第二数据帧样本的数据恢复能力;
基于损失函数对所述初始预测模型的变换矩阵中的模型参数进行调整,直到训练样本中预先标注的所述第二数据帧样本的数据恢复能力、与通过所述初始预测模型得到的所述第二数据帧样本的数据恢复能力的损失值在预设范围内,得到所述已训练的预测模型。
6.如权利要求5所述的方法,其特征在于,根据下列方式确定预先标注的所述第二数据帧样本的数据恢复能力:
对所述第二数据帧样本进行语音质量检测,获取所述第二数据帧样本对应的语音质量参数;
根据所述第一数据帧样本进行丢包隐藏PLC数据恢复处理,得到恢复数据帧样本;并对所述恢复数据帧样本进行语音质量检测,获取所述恢复数据帧样本对应的语音质量参数;
根据所述恢复数据帧样本对应的语音质量参数与所述第二数据帧样本对应的语音质量参数,确定预先标注的所述第二数据帧样本的数据恢复能力。
7.一种数据重传装置,其特征在于,包括:
获取单元,用于将数据帧发送给接收端设备,并获得所述数据帧的数据恢复能力;其中所述数据恢复能力用于表示所述接收端设备根据接收到的数据帧进行数据恢复处理得到的恢复数据帧与未接收到的数据帧之间的差异度;
确定单元,用于接收到所述接收端设备的重传请求时,确定请求重传的数据帧的数据恢复能力未达到设定条件时重传数据帧。
8.如权利要求7所述的装置,其特征在于,所述数据帧为语音数据帧;
所述获取单元具体用于:
根据当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征,确定当前发送的数据帧的数据恢复能力。
9.如权利要求8所述的装置,其特征在于,所述获取单元具体用于:
将当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征输入已训练的预测模型,通过已训练的预测模型对当前发送的数据帧的语音特征以及上一次发送的数据帧的语音特征进行非线性变换,得到当前发送的数据帧的数据恢复能力;
其中,对预测模型进行训练时使用的训练样本中包含第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的所述第二数据帧样本的数据恢复能力;所述第一数据帧样本与所述第二数据帧样本为历史发送的语音序列中的相邻两个数据帧,且所述第一数据帧样本为所述第二数据帧样本的前一帧,所述第二数据帧样本的数据恢复能力为根据第一数据帧样本进行数据恢复处理得到的恢复数据帧、与所述第二数据帧样本之间的差异度。
10.如权利要求9所述的装置,其特征在于,所述预测模型包括输入层、至少一个隐藏层和输出层;所述获取单元具体用于:
采用所述输入层,对所述当前发送的数据帧的语音特征以及所述上一次发送的数据帧的语音特征进行预处理得到输入特征向量;
采用至少一个隐藏层,根据隐藏层对应的变换矩阵,对所述输入特征向量进行非线性变换得到所述当前发送的数据帧的数据恢复能力;其中所述变换矩阵是在对所述预测模型训练过程中确定的;
采用所述输出层,输出所述当前发送的数据帧的数据恢复能力。
11.如权利要求10所述的装置,其特征在于,还包括模型训练单元,用于根据下列方式对所述预测模型进行训练:
从训练样本数据集中选取训练样本;
将所述训练样本包含的第一数据帧样本的语音特征、第二数据帧样本的语音特征、以及预先标注的所述第二数据帧样本的数据恢复能力输入初始预测模型,获得所述初始预测模型输出的所述第二数据帧样本的数据恢复能力;其中,所述初始预测模型是根据变换矩阵,对由所述第一数据帧样本的语音特征和第二数据帧样本的语音特征预处理得到的样本特征向量进行非线性变换处理,得到所述第二数据帧样本的数据恢复能力;
基于损失函数对所述初始预测模型的变换矩阵中的模型参数进行调整,直到训练样本中预先标注的所述第二数据帧样本的数据恢复能力、与通过所述初始预测模型得到的所述第二数据帧样本的数据恢复能力的损失值在预设范围内,得到所述已训练的预测模型。
12.如权利要求11所述的装置,其特征在于,所述模型训练单元具体用于:
根据下列方式确定预先标注的所述第二数据帧样本的数据恢复能力:
对所述第二数据帧样本进行语音质量检测,获取所述第二数据帧样本对应的语音质量参数;
根据所述第一数据帧样本进行丢包隐藏PLC数据恢复处理,得到恢复数据帧样本;并对所述恢复数据帧样本进行语音质量检测,获取所述恢复数据帧样本对应的语音质量参数;
根据所述恢复数据帧样本对应的语音质量参数与所述第二数据帧样本对应的语音质量参数,确定预先标注的所述第二数据帧样本的数据恢复能力。
13.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~6中任一所述方法的步骤。
14.一种计算机可读存储介质,其特征在于,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行权利要求1~6中任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010481962.9A CN111371534B (zh) | 2020-06-01 | 2020-06-01 | 一种数据重传方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010481962.9A CN111371534B (zh) | 2020-06-01 | 2020-06-01 | 一种数据重传方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111371534A CN111371534A (zh) | 2020-07-03 |
CN111371534B true CN111371534B (zh) | 2020-09-18 |
Family
ID=71212535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010481962.9A Active CN111371534B (zh) | 2020-06-01 | 2020-06-01 | 一种数据重传方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111371534B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112491508B (zh) * | 2020-11-24 | 2021-11-30 | 广州技象科技有限公司 | 基于传输进程自适应的数据传输方法及装置 |
CN112532349B (zh) * | 2020-11-24 | 2022-02-18 | 广州技象科技有限公司 | 基于解码异常的数据处理方法及装置 |
CN112511276B (zh) * | 2020-11-24 | 2021-11-30 | 广州技象科技有限公司 | 数据处理方法及装置 |
CN112511277B (zh) * | 2020-11-24 | 2021-08-06 | 广州技象科技有限公司 | 数据处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110855510A (zh) * | 2020-01-16 | 2020-02-28 | 灵长智能科技(杭州)有限公司 | 数据传输优化方法、装置、设备及介质 |
CN111082896A (zh) * | 2019-12-11 | 2020-04-28 | 深圳市优必选科技股份有限公司 | 一种数据传输方法及发送、接收装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2391785C2 (ru) * | 2005-12-15 | 2010-06-10 | Интердиджитал Текнолоджи Корпорейшн | Способ и устройство для выбора комбинации транспортных форматов |
CN101221765B (zh) * | 2008-01-29 | 2011-02-02 | 北京理工大学 | 一种基于语音前向包络预测的差错隐藏方法 |
US9312989B2 (en) * | 2008-07-07 | 2016-04-12 | Cisco Technology, Inc. | Importance-based FEC-aware error-repair scheduling |
CN101562512B (zh) * | 2009-05-27 | 2012-02-08 | 西安电子科技大学 | 基于fec的选择重传系统及其重传方法 |
CN104751851B (zh) * | 2013-12-30 | 2018-04-27 | 联芯科技有限公司 | 一种基于前后向联合估计的丢帧差错隐藏方法及系统 |
CN106937134B (zh) * | 2015-12-31 | 2021-03-02 | 深圳市潮流网络技术有限公司 | 一种数据传输的编码方法、编码发送装置及系统 |
CN106067847B (zh) * | 2016-05-25 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
CN108011686B (zh) * | 2016-10-31 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 信息编码帧丢失恢复方法和装置 |
CN110534120B (zh) * | 2019-08-31 | 2021-10-01 | 深圳市友恺通信技术有限公司 | 一种移动网络环境下的环绕声误码修复方法 |
-
2020
- 2020-06-01 CN CN202010481962.9A patent/CN111371534B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111082896A (zh) * | 2019-12-11 | 2020-04-28 | 深圳市优必选科技股份有限公司 | 一种数据传输方法及发送、接收装置 |
CN110855510A (zh) * | 2020-01-16 | 2020-02-28 | 灵长智能科技(杭州)有限公司 | 数据传输优化方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111371534A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111371534B (zh) | 一种数据重传方法、装置、电子设备和存储介质 | |
CN110620892B (zh) | 视频通信中的视频标注技术 | |
WO2018077083A1 (zh) | 音频帧丢失恢复方法和装置 | |
CN110401834B (zh) | 一种基于深度学习的自适应视频编码方法 | |
CN112820306B (zh) | 语音传输方法、系统、装置、计算机可读存储介质和设备 | |
CN111312264B (zh) | 语音传输方法、系统、装置、计算机可读存储介质和设备 | |
CN111464262B (zh) | 数据处理方法、装置、介质及电子设备 | |
CN111935550B (zh) | 一种基于时效性的数据包调度方法、装置及电子设备 | |
US11646042B2 (en) | Digital voice packet loss concealment using deep learning | |
US20210089863A1 (en) | Method and apparatus for recurrent auto-encoding | |
Grassucci et al. | Generative AI meets semantic communication: Evolution and revolution of communication tasks | |
CN116437089B (zh) | 一种基于关键目标的深度视频压缩方法 | |
CN116705004A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
Dong et al. | Innovative semantic communication system | |
CN114842857A (zh) | 语音处理方法、装置、系统、设备及存储介质 | |
CN115206330A (zh) | 音频处理方法、音频处理装置、电子设备和存储介质 | |
CN115767146A (zh) | 数据流控制方法、系统、装置、电子设备及存储介质 | |
CN117793078B (zh) | 一种音频数据的处理方法、装置、电子设备和存储介质 | |
CN113936669A (zh) | 数据传输方法、系统、装置、计算机可读存储介质及设备 | |
CN118350416B (zh) | 基于大模型的多模态语义通信方法、系统、设备及介质 | |
CN113823297A (zh) | 语音数据处理方法、装置、设备及存储介质 | |
US20240223218A1 (en) | System and method for location based error correcting and video transcribing code selection | |
WO2024212339A1 (zh) | 业务信息传输方法、装置、电子设备、存储介质 | |
CN118803242A (zh) | 图像编码方法、图像解码方法及相关设备 | |
CN117692094A (zh) | 编码方法、解码方法、编码装置、解码装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |