WO2008151579A1

WO2008151579A1 - Procédé, dispositif et système permettant d'obtenir le masquage du paquet de perte

Info

Publication number: WO2008151579A1
Application number: PCT/CN2008/071313
Authority: WO
Inventors: Wuzhou Zhan; Dongqi Wang
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2007-06-14
Filing date: 2008-06-13
Publication date: 2008-12-18
Also published as: EP2200018B1; CN101325631B; CN101325631A; US20100049506A1; US20100049510A1; EP2200018A2; EP2200019A2; EP2133867A4; US8600738B2; EP2133867A1; EP2200018A3; US20100049505A1; EP2200019A3

Description

一种实现丢包隐藏的方法、装置及系统

技术领域

本发明涉及网络通信技术领域，尤指一种估计基音周期的方法和装置、一种对基音周期进行微调的方法和装置以及实现丢包隐藏的方法、装置及系统。

发明背景

最初， IP 网络是为传输包含较大的数据包且不需要实吋可靠传送的数据流而设计的。而现在 IP网络中也传输语音数据。语音的传输需要实时可靠地传送较小的语音包，当一个语音包在传输过程中被丢弃时，通常没有时间重新传送该被丢弃的包。另外， 3 一个语音包经过了一段较长的路由而在需要播放时不能及时到达时，这个包巳经失去了存在的意义。因此在基于 IP网络协议的语音（VoIP, Voice over Internet Protocol ) 系统中，语音包不能及时到达或不能到达时，都被认为该语音包丢失了。

网络传输过程中的丢包是在网络传输语音数据时服务质量下降的主要原因。而 £包隐藏技术是指通过合成的数据包补偿丢失的包，来减小传输过程中的丢包对语音质量的影响。如果没有有效的语音丢包隐藏技术，即使是设计和管理得最好的 TP网络也不能提供长话级品质的通信。而设计良好的解决丢包问题的技术，能很大程度上提卨语音传输的质量。因此在现有技术中，不同的机制被用来隐藏由于丢包引起的影响。例如以基音波形替代为基础的丢包隐藏方法。

基音波形替代是一种基于接收端的处理技术，它根据语音的特点对丢失的数据帧进行补偿。下面介绍基音波形替代技术的原理、实现过程以及存在的缺点。

在语音信号中，一般清音从波形上看是杂乱无章的，而浊音在波形上则表现出周期性。基音波形替代的主要原理是：首先，利用丢失帧前一帧的信息，即波形缺口位胥的前一帧的信号来估计出缺口之前信号波形对应的基音周期？，然后，用缺口位置之前的，长度为 P的一段波形来补偿波形的缺口。

在现有技术中一般使用自相关分析的方法来获得基音波形替代方法中所使用的基音周期 P。自相关分析是一种常用的语音时域波形分析方法， ώ相关函数来定义。相关函数可用来测定信号间的时域相似性，当进行相关的两个信号完全不同吋，相关函数的值接近于零；当进行相关的两个信号的波形相同时，则会在超前或滞后处出现峰值。因此，自相关函数可用于研究信号本身，如波形的同步性、周期性等等。

但是在利用基音波形补偿丢失帧的方法中存在如下的缺点：

1) 采用自相关分析的方法估计出的浊音基音周期 Ρ不够准确。使用相关方法均以自相关函数取极值时对应的基音周期为最终的基音周期，但以此得到的基音周期有 nj' 能为实际基音周期所对应频率的 1/N倍处（N为大于 1的整数）；另外佔计基音周期的初衷本是要获得最接近丢失帧处的数据的基音周期，但在使用自相关方法计算基音周期时，通常需要使用缺口之前至少 22. 5ms (对应基音周期为最小基音周期，既 2. 5ms的情况）的信号。这些因素将导致计算基音周期时会产生一定的误差，在使用有误差的基音数据填充丢失帧的数据时，在拼接处的相位就会发生突变。

2 ) 在现有技术中只使用丢失帧之前的数据，即历史数据进行填充。由于音频信号中的基音周期也是逐渐变化的，因此距离丢失帧越远的数据与丢失帧的相关性越弱，只用丢失帧之前的数据对丢失帧进行补偿，也有可能在丢失帧和其之后的帧相连的地方发生相位不连续的现象。

3 ) 当丢失帧发生在有语音渐变的地方时，只用丢失帧的前一基音周期数据对 £失帧数据进行恢复，则会发生幅度不连续的现象。

发明内容

鉴于上述现有技术所存在的问题，本发明实施例提供了一种基音周期的估计方法，该方法能够消除估计基音周期时存在的倍频问题。

本发明实施例提供了一种基音周期的估计装置，该装置能够消除估计基音周期时存在的倍频问题。

本发明实施例还提供了一种基音周期的微调方法，该方法能够减小估计基音周期的误差。

本发明实施例还提供了一种基音周期的微调装置，该装置能够减小估计基音周期的误差。

本发明实施例提供了一种实现丢包隐藏的方法，该方法增强了恢复的 ¾失帧数 ffi 丢失帧之后的数据之间的相关性。

本发明实施例提供了一种实现丢包隐藏的装置，该装置增强了恢复的丢失帧数据 ¾ 丢失帧之后的数据之间的相关性。

本发明实施例公开了一种实现丢包隐藏的接收端系统，该系统增强了恢复的丢失帧数据与丢失帧之后的数据之间的相关性。

为达到上述目的，本发明的技术方案具体是这样实现的：

本发明实施例公幵了一种基音周期的估计方法，该方法包括以下歩骤：

获取历史数据的初始基音周期；从所述初始基音周期所对应频率的一个以上的大于 1的整数倍频率所分别对应的基音周期中，选择所对应频率小于或等于最小可能基音周期所对应频率的基音周期作为候选基音周期，并从所述初始基音周期和所述候选基音周期中选择一个基音周期作为所述历史数据的最终估计基音周期。

本发明实施例公开了一种基音周期的估计装置，读装置包括：初始基音周期获取单元和选择单元，其中，

初始基音周期获取单元，用于获取历史数据的初始基音周期，并发送给选择 'ϊυ^ 选择单元，从所述初始基音周期所对应频率的一个以上的大于 1的整数倍频率所分别对应的基音周期中，选择所对应频率小于或等于最小可能基音周期所对应频率的基咅周期作为候选基音周期，并从初始基音周期和候选基音周期中选择一个基音周期作为所述己知语音数据的最终估计基音周期。

本发明实施例公开了一种基音周期的微调方法，该方法包括：

获取丢失数据之前或丢失数据之后的历史数据的初始基音周期；

在所述历史数据靠近丢失数据的一端，设置长度为预设值的模板窗；

设置长度与所述模板窗长度相同的滑动窗，并使所述滑动窗靠近丢失数据的端点在预设点周围的预设范围内滑动，所述预设点是所述已知数据中与所述模板窗靠近丢失数据的端点距离初始基音周期长度的点；

在所述滑动窗所能滑动的预设点周围的预设范围内，计算所述模板窗中的数据与所述滑动窗中数据的匹配值，并从中査找出最佳的匹配值，并将具有所述最佳匹配值吋的模板窗与滑动窗的对应端点之间的距离作为微调后的基音周期。

本发明实施例公开了一种基音周期的微调装置，该装置包括：初始基音周期获取单元，设置单元和计算单元，其中，

初始基音周期获取单元，用于获取丢失数据之前或丢失数据之后的已知数据获取初始基音周期，并发送给设置单元；

设置单元，用于接收所述初始基音周期获取单元发送的初始基音周期，并在所述己知数据靠近丢失数据的一端，设置长度为预设值的模板窗，设置长度与所述模板窗长度相同的滑动窗，并使所述滑动窗靠近丢失数据的端点在预设点周围的预设范围内滑动；所述预设点是所述巳知数据中与所述模板窗靠近丢失数据的端点距离初始基音周期长度的点；

计算单元，用于在所述滑动窗所能滑动的预设点周围的预设范围内，计算模板窗中的数据与滑动窗中数据的匹配值，并从中查找出最佳匹配值，并将具有最佳匹配值吋的模板窗与滑动窗的对应端点之间的距离作为微调后的基音周期。

本发明实施例公开了一种实现丢包隐藏的方法，该方法包括：

利用所述丢失数据之前的所述已知数据中的一个基音周期数据，填充 £失帧主缓冲区；

利用所述丢失数据之后的所述己知数据中的一个基音周期数据，或利用所述 ·£失数据之前的所述已知数据中的一个基音周期数据，填充丢失帧临时缓冲区；

对所述丢失帧主缓冲区和所述丢失帧临时缓冲区中的数据进行叠加处理，并 ffl所述叠加处理后的数据补偿丢失帧。

本发明实施例公开了一种实现丢包隐藏的装置，该装置包括：主处理单元、丢失帧主缓冲区和丢失帧临时缓冲区，其中，

主处理单元，用于利用丢失数据之前的已知数据中的一个基音周期数据，填充 £失帧主缓冲区，并利用丢失数据之后的已知数据中的一个基音周期数据，或利用丢失数据之前的己知数据中的一个基音周期数据，填充丢失帧临时缓冲区；并将丢失帧主缓冲和丢失帧临时缓冲区中的数据进行叠加处理后，用所述叠加处理后的数据补偿失帧；丢失帧主缓冲区，用于存储主处理模块所填充的数据，其长度与丢失数据长度相等; 丢失帧临时缓冲区，用于辅助存储主处理模块所填充的数据，其长度与丢失数据长度相等。

本发明实施例公幵了一种实现丢包隐藏的接收端系统，该接收端系统中包括：丢失帧检测器、解码器单元、历史缓冲区、延迟单元和实现丢包隐藏单元，其巾：

丢失帧检测器，用于接收网络侧传输过来的比特流，并判断是否有数据帧丢失，且若丢失帧检测器没有检测到数据帧丢失，则丢失帧检测器将完好的数据帧传送给所述解码器单元进行解码，若丢失帧检测器检测到有数据帧丢失，则发送丢失数据帧的信号给所述实现丢包隐藏单元；

解码器单元，用于对丢失帧检测器发送的完整数据帧进行解码，并将解码后的数据帧发送至所述历史缓冲区；

历史缓冲区，用于存储所述解码器单元发送的数据帧。

延迟单元，用于控制所述历史缓冲区中的数据帧延迟输出；

实现丢包隐藏单元，用于恢复丢失的数据帧，并将恢复的数据帧放置在历史缓冲区中与所述丢失的数据帧相对应的位置上，且所述实现丢包隐藏单元的工作过程包括：利用丢失数据之前的已知数据中的一个基音周期数据，填充丢失帧主缓冲区；利用所述丢失数据之后的己知数据中的一个基音周期数据，或利用所述丢失数据之前的所述己知数据中的一个基音周期数据，填充丢失帧临吋缓冲区；

对所述丢失帧主缓冲区和所述丢失帧临时缓冲区中的数据进行叠加处 ί¾ , 并用所述叠加处理后的数据补偿丢失帧。

由上述技术方案可见，本发明实施例中，通过从初始基音周期所对应频率的一个以上的人 J - I 的整数倍频率所分别对应的基音周期中，选择所对应频率小于成等于 S小可能基音周期所对；、 V：频的基音周期作为候选基音周期，并从初始基音周期和候选基音周期中选择一个基音周 !Pj作为所述已知语音数据的最终估计基音周期的技术方案，能够消除估计基音周期时存在的倍频问题。本发明实施例中，通过在与初始基音周期对应的匹配点附近査找最佳匹配点，并根据最住匹配的位 a对估计的初始基音周期进行微调的技术方案，减小了估计基音周期的误差。本发明实施例中，利数据中的一个基音周期数据，填充丢失帧主缓冲区，利川当前数据中的一个基音周期数据，成利 w 历史数据中的一个基音周期数据，填充丢失帧临时缓冲区，对丢失帧主缓冲和丢失帧临时缓冲 κ 中的数据进行叠加处理，并用所述叠加处理后的数据补偿丢失帧的技术方案增强了恢的丢失帧数据丢失帧之后的数据之间的相关性，进而改善了恢复的丢失帧数据与 ¾火帧之后的数据之问相位的连续性。

附图简要说明

图 1是本发明实施例中倍频点的示意图；

图 2是本发明实施例一种估计基音周期的方法的流程图；

图 3是本发明实现图 2所示方法的一个具体实施例的流程图；

图 4是本发明实施例一种估计基音周期的装置的结构框图；

图 5是本发明实施例对丢失帧之前的数据的基音周期进行微调的示意 i冬 I：图 6是本发明实施例一种对基音周期进行微调的方法的流程图：

图 7是本发明实施例对丢失帧之后的数据的基音周期进行微调的示意图：图 8是本发明实施例对基音周期进行微调的装置的结构框图；

图 9是本发明实施例一种结合历史数据和当前数据实现丢包隐藏的方法的流程图；图 10是本发明实施例对当前帧进行平滑处理的示意图；

图 11是本发明实施例用当前数据反向填充丢失数据的示意图；

图 12是本发明实施例在基音缓冲区中査找与给定波形最匹配的波形的示意图图 13是本发明实施例对恢复的丢失帧数据进行幅度平滑处理后的示意图：图 14是本发明实施例一种实现丢包隐藏的装置的结构框图；

图 15是本发明实施例实现丢包隐藏的装置在接收端系统中的外部连接示意图；图 16是本发明实施例在实际系统中应用实现丢包隐藏的方法的流程图。

实施本发明的方式

本发明实施例主要通过对现有的丢包隐藏技术进行改进，以减小现有技术对丢火帧进行补偿时存在的基音周期估计误差，相位不连续，幅度不连续等问题。

首先描述本发明对现有的基音周期估计方法进行改进的实施例。

前面提到过浊音是具有周期性的，且周期为（P ) , 即基音周期为 p，冈此，历史缓冲区（HB) 中的采样点数据 X的周期性可用公式（1 ) 表示：

x(m) X x(m+P) ( ) 并且由于周期函数的自相关函数与该周期函数具有相同的周期特性，因此现有的 ^ 因周期估计方法中所涉及的滑动窗（SW) 中的采样点信号与模版窗（TW ) 屮的采样点信号的相关函数 CR的公式-

W

CR (k) =∑[SW (m, k) * TW (m)]

可用公式（3 ) 表示：

CR(k)=CR(k+P) ( _{3 )} 因此，现有技术中利用自相关分析来计算基音周期的方法查找到最佳配点有可能是干扰倍频点。

图 1是本发明实施例中倍频点的示意图。如图 1所示，通过自相关分析方法得到 S 佳匹配点为 k3，但图 1中的这段波形的真实基音周期的最佳匹配点为 kl , 即所查找到的最佳匹配点 k3对应的频率有是 kl处所对应频率的 1/N，其中 N是大丁 1的整数。因此，此时所估计的 k3处所对应的基音周期为 kl处所对应的基音周期的 N倍，即为真实基音周期的整数倍。针对该问题本发明实施例给出了如下的解决方案。

图 2是本发明实施例一种估计基音周期的方法的流程图。如图 2所示，包括以下骤：

步骤 201，获取己知语音数据的初始基音周期。

在本步骤中，可以利用自相关分析方法估计出一个基音周期值，并将该基音周期值设置为初始基音周期。

具体的，可以设定某一长度的语音数据是 HB中的一段数据，即丢失帧之前的一段数据。将 TW的尾部与 HB中数据的尾部对齐， TW在 HB中的起始位置对应设置为 R。将 TW的位置保持不变，而 SW的起始位置（L)从 HB的起始位置开始滑动，在 SW的滑动过程中计算 SW中的采样点和 TW中的采样点的自相关值，以搜索最佳匹配点，在最佳匹配点处 SW中的采样点信号与 TW中的采样点信号的自相关值最大。则最佳匹 ftl点和 TW的起始位置 R之间的距离 P即为所估计的基音周期，本发明实施例中，可以将估计所得到的基因周期设置为初始基因周期。

歩骤 202 , 从所述初始基音周期所对应频率的一个以上的大于 1的整数倍频率所分别对应的基音周期中，选择所对应频率小于或等于最小可能基音周期（2.5ms ) 所对应频率的基音周期作为候选基音周期，并从所述初始基音周期和所述候选基音周期中选择 —个基音周期作为所述已知语音数据的最终估计基音周期。

在本歩骤中，将初始基音周期对应频率的一个以上的整数倍频率所分别对应的基音周期作为候选基音周期的实现过程可以是：査找出所有大于最小可能基咅周期的初始基音周期的因数，作为候选基音周期。

例如，当初始基音周期为 12ms，而最小可能基音周期为 2. 5ms时，所有大于 2. 5ms 的 12ras的因数为 6ms、 4ms禾口 3ms ₀

本步骤中，可以根据与初始基音周期以及各个候选基音周期对应的匹配值来进行选择。

通过图 2所示的方案可以消除现有技术估计基音周期时存在的倍频问题。

图 3是本发明实现图 2所示方法的一个具体实施例的流程图。如图 3所示，包括以下步骤：

步骤 301，利用自相关分析方法，査找出最佳匹配点，获得与最佳匹配点对应的基音周期 P0，初始化最佳基音周期 BP，令 BP=P0，并记录相应的匹配值 BC。

本歩骤中，最佳匹配点 BK是在搜索过程中于匹配值的最大值 BC ( Bcs Corr )对应的 k点的位置， BC可如公式（4 ) 所示：

BC =max{corr(k)|l < k < MaxPitch— MinPitch} _{( 4 )} 其中， MaxPitch是最大可能基音周期长度数据中的采样点个数， MinPi tch是 i¾小可能基音周期长度数据中的采样点个数。

歩骤 302，初始化 N，令 N=l。

本歩骤中， N表示最佳基音周期发生在 P0点对应频率的 N倍处，当 Ν= ί，则表示最佳基音周期 ΒΡ = Ρ0。步骤 303，令 ^1， P=P0/N，即设真实的基音周期 P对应的频率为 P0对应的频率的 N倍。

歩骤 304，判断步骤 303中所得到的 P是否大于或等于最小可能基音周期，是则执行步骤 305，否则结束本流程。

本步骤中，检测 P 是否大于等于最小可能基音周期。通常最小能基音周期取

2. 5ms , 在 8kHz的采样速率下，对应 20个采样点。如果 P 小于最小可能基周期，则当前的 BP值即为所要估计的最佳基音周期，结束本流程。

歩骤 305，获取与 P对应的匹配值 BC '。

具体的，假设 BC(k)对应的匹配值为最佳匹配值，那么对应的基因周期 P和 K的关系为：

P = Pmax-(k-l) k = l-(Pmax-Pmin) ( 5 )

歩骤 306，判断 BC ' 是否满足预设的条件，是则执行步骤 307，否则 M到歩骤 303。在本步骤中，预设条件可以为 BC ' a X BC，其中 a是一个常数，其经验值取 0. 85。步骤 307，更新最佳基音周期（BP ) , 令 BP=P, 并执行步骤 303。

通过上述流程，就可以査找出所有大于最小可能基音周期的初始基音周期的因数，并逐个进行比较选择出一个最佳的 BP。但在上述过程中，可能有两个以上的冈数的匹配值都满足大于或等于 0. 85BC的条件，在图 7所示的流程中最终选择出来的是倍频; g大的因数，即值最小的因数。当然也可以将图 7所示的流程设置为：当有一个因数的配值满足条件时，便认为该因数是最佳基音周期，结束流程。

在步骤 307中，较佳地，也可以用当前的 BC ' 更新 BC , 即令 BC BC '，这样毎次进行比较的时候，不是一直与初始基音周期 P0相比较，而是与上一次的比较过程中选择出来的较佳值进行比较。

更进一歩的，考虑到自相关方法本身存在的误差，在步骤 303或歩骤 305中， PJ'以先在 P值附近的一定范围内选择一个匹配值最大的点 P '，用 P ' 代替 P，对 P进行修 J K，以减少误差带来的影响。其具体过程可以是：在与 P对应的 k点的附近进行搜索，找出匹配值 BC最大的点 k '，与 k ' 对应的基音周期即为 P ' ， 8KHZ采样速率下，对 k点附近的 3个点进行搜索可以获得较好的效果。

图 4是本发明实施例一种估计基音周期的装置的结构框图。如图 4所示，该装覽包括：初始基音周期获取单元 401和选择单元 402。

初始基音周期获取单元 401，用于获取巳知语音数据的初始基音周期，并发送给选择单元 402。

选择单元 402，从初始基音周期所对应频率的一个以上的大于 1的整数倍频率所分别对应的基音周期中，选择所对应频率小于或等于最小可能基音周期所对应频率的基音周期作为候选基音周期，并从初始基音周期和候选基音周期屮选择一个基音周期作为所述巳知语音数据的最终估计基音周期。

在图 4中选择单元 402包括：计算模块 403和比较模块 404，其中，

计算模块 403，用于分别计算出与初始基音周期和各个候选基音周期对应的匹配值，并发送给比较模块 404;

比较模块 404，用于对所接收到的与初始基音周期和各个候选基音周期对应的匹配值进行比较，从中选择出一个最佳匹配值，并将该最佳匹配值所对应的基音周期作为所述已知语音数据的最终估计基音周期。

图 4中的选择单元 402还可以进一步用于，对于每一个候选基音周期，在该候选甚音周期所对应的匹配点周围的预设范围内进行搜索，查找出一个匹配值为最佳匹配值的匹配点，并用该匹配点对应的基音周期替换该候选基音周期；并从初始基周期以及所述替换后的候选基音周期中选择一个基音周期作为所述巳知语音数据的最终佔计基音周期。

前面提到过估计基音周期的初衷本是要获得最接近丢失帧处的数据的基音周期，但在使用自相关方法计算基音周期的时，却需要使用丢失帧之前至少 22. 5ms的采样数据，因此，在计算距离丢失帧起始处最近一段数据的基音周期时，会产生一定的误差。因此，接下结合图 5和图 6来描述本发明通过对已获得的基音周期进行微调来减小估计误差的技术方案。

图 5是本发明实施例对丢失帧之前的数据的基音周期进行微调的示意图。在图 5中，所示信号是 HB中音频信号。图 6是本发明实施例一种对基音周期进行微调的方法的流程图。如图 6所示，包括以下歩骤：

歩骤 601，获取丢失数据之前或丢失数据之后的己知数据的初始基音周期。

在本步骤中，获取 HB中数据的初始基音周期 P0。 P0可以利用自相关分析方法获取的基音周期，也可以是经过图 1所示的方法进行消除倍频处理的基音周期，还可以足 ffl 其他方法获得的基音周期。

歩骤 602，在所述已知数据靠近丢失数据的一端，设置长度为预设值的 TW。

与本步骤对应，在图 5中，从 HB的最后一个采样点开始向前取 I 个采样点数的一段数据作为 TW。 HB的长度为 LEN， TW的起始点为 ^ST，末尾点为 ^Ετ，则有：

S_T=LEN-L+1

E_T— LEN ( g ) 在本歩骤中， L的长度较佳地，取 0. 55 X P0左右的值，但不少于 0. 25 X TO。

步骤 603, 设置长度与 TW长度相同的 SW，并使所述 SW靠近丢失数据的端点在预设点周围的预设范围内滑动，所述预设点是巳知数据中与 TW靠近丢失数据的端点距离初始基音周期长度的点。

与本步骤对应，在图 5中：在历史缓冲区 HB中设置一个长度也为 L的 SW，并使 SW 的末尾点在 Z点附近的预设范围内滑动， Z点是距离 TW的^£1端点一个初始 ¾音周期 TO 长度的点。 SW的起始点为 ^Ss，末尾点为 ^Es， Z点与 HB的末尾点，也就是与 TW的末尾点 ^Ετ之间的距离为 P0，即 = — ^PQ， ^Es在 [z— R， ^Z+^R]的预设范围内滑动。

歩骤 604，在所述 SW的滑动过程中，计算 TW中的数据与 SW中数据的匹配值，并从中査找出最佳的匹配值，并将具有最佳匹配值时的 TW与 SW的对应端点之间的距离作为微调后的基音周期。

在本歩骤中，在 SW的滑动过程中，计算 SW与 TW的匹配值，査找出其屮的最仕匹配值，即査找出一个与 TW最为相似的 SW的位置，并将此时的 TW与 SW的对应端点之间的距离 P1作为最终估计的基音周期。其中，计算 TW与 SW的匹配值时，可以采用自 411 关分析的方法，如采用公式（2 ) 计算 SW与 TW的匹配值。为了减小计算的复杂度，也可以计算 SW中采样点与 TW中对应的采样点的幅度差值的绝对值的总和（BMV)，如公式 ( 7 ) 所示：

BMV (i)

其中 x ( i ) 表示 HB中的第 i个数据。

用公式（7 )进行计算时，匹配值与 BMV成反比，因此査找最小的 BMV， a[J Bes tBMV =min (BMV ( i ) )， — R≤i≤R。

另外，在步骤 604中，作为一种优选的方案，建议先从中间位置 i - 0处丌始，然后再向两侧进行搜索来查找最佳的匹配值。即首先计算 i = 0处 BMV的值，并作为 S初的 BestBMV,然后再计算 i⁼士 1 ， i= ± 2，…， i= ± R处对应的 BMV值，并与 Besl.BMV 依次进行比较，如果小于 BestBMV, 则将 BestBMV值更新为 BMV值。

通过上述步骤可以估计出一个较为接近真实值的基音周期 Pl。

在估计丢失帧之后的数据的基音周期时，可以用上述方法对初始的有误差的基音周期进行微调，以达到减小误差的目的。

图 7是本发明实施例对丢失帧之后的数据的基音周期进行微调的示意^。在图 7中，首先利用丢失数据之后的一段己知数据获取初始基音周期 PO。 po可以利 ffl 相关分析方法获取的基音周期，也可以是经过图 1所示的方法进行消除倍频处理的基音周期，还可以是用其他方法获得的基音周期。在丢失数据之后的一段巳知数据的长度不足以利用自相关分析等方法计算出其基音周期时，可用丢失数据之前的已知数据的 ffi音周期代荇 P0。然后在所述丢失数据之后的数据的起始位置开始向后取 L个采样点数的一段数据作为 TW。 L的长度较佳地，取 0. 55 X PO左右的值，但在所述丢失数据之后的知数据的长度不够 0. 55 X P0时，可以适当的减小 L的长度，但较佳地， L不少于 0. 25 X TO。设置长度与 TW相同的 SW,并使 SW的起始端点在 Z点的预设范围 [^Z― ^R' ^{Z + R}J内滑动，

Z点是距离 TW的 ^ST端点一个初始基音周期 P0长度的点, SW的起始点为 ^Ss，末尾点为 ^H s。在 SW的滑动过程中，计算 TW中的数据与 SW中数据的匹配值，査找出其中的最佳匹 K 值，即査找出一个与 TW最为相似的 SW的位置，并将此时的 TW与 SW的对应端点之间的距离 P1作为最终估计的基音周期。计算 TW与 SW的匹配值时，可以釆用相关分析的方法，如采用公式（2 ) 计算 SW与 TW的匹配值。为了减小计算的复杂度，也可以计算 S 中采样点与 TW中对应的采样点的 BMV,如公式（7 )所示，此时的最佳匹配值对应的最小值。

在图 7所示的实施例中，对丢失帧之后的数据的基音周期进行微调时，较佳地， TW 的长度 L取大于 0. 25 X P0，因此从图 7可以看出，较佳地，在所获得的丢失帧之后的数据的长度大于或等于 1. 25 X P0时才进行基音周期的微调。

图 8是本发明实施例对基音周期进行微调的装置的结构框图。如图 8所示，该装青包括：初始基音周期获取单元 801，设置单元 802和计算单元 803，其中，

初始基音周期获取单元 801，用于获取丢失数据之前或丢失数据之后的已知数据获取初始基音周期，并发送给设置单元 802 ;

设置单元 802，用于接收初始基音周期获取单元 801发送的初始基咅周期，并在所述已知数据靠近丢失数据的一端，设置长度为预设值的 TW，设置长度与 TW L：度相同的 SW, 并使 SW靠近丢失数据的端点在预设点周围的预设范围内滑动；所述预设点是匕知数据中与 TW靠近丢失数据的端点距离初始基音周期长度的点；

计算单元 803，用于在所述 SW所能滑动的预设点周围的预设范围内，计算 TW屮的数据与 SW中数据的匹配值，并从中査找出最佳匹配值，并将具有最佳匹配值时的 TW与 SW的对应端点之间的距离作为微调后的基音周期。

在本歩骤中，计算 TW中的数据与 sw中数据的匹配值可以是：计算 TW中的数

SW 中数据的相关值，并取匹配值为与相关值成正比的数值；或计算 TW 巾的数据与 SW 中对应数据的幅度差值的绝对值的总和，并取匹配值为与所述幅度差值的绝对值的总和成反比的数值。

到此为止给出了本发明估计基音周期的具体实施例，接下来描述本发明如何补 ^：丢失帧，即如何进行丢包隐藏处理的过程。

在现有技术中只使用丢失帧之前的数据，即历史数据进行填充。山于咅频信号中的基音周期也是逐渐变化的，因此距离丢失帧越远的数据与丢失帧的相关性越弱，现冇技术中只用丢失帧之前的数据对丢失帧进行补偿，有可能在丢失帧和其之后的帧相连的地方发生相位不连续的现象。

但是具体的情况是：当有数据帧丢失时，在系统延时允许的情况下可以等到接收到下一个完好的数据帧时，结合历史数据和在丢失帧后所接收到的当前数据进行丢包隐藏处理。因此在本发明实施例中给出一种结合历史数据和当前数据进行丢包隐藏处理的方案，其中历史数据指丢失帧之前的数据，当前数据指丢失帧之后的数据。

图 9是本发明实施例一种结合历史数据和当前数据实现丢包隐藏的方法的流程图。如图 9所示，包括以下步骤：

步骤 901，估计历史数据的基音周期 ΡΡ。

在本步骤中，可以利用自相关分析方法估计出 ΡΡ，也可以先用自相关分析方法估计出一个初始基音周期，然后用图 1和图 6所示的本发明实施例的方法对初始基音周期进行倍频消除和微调修正后再作为本实施例中的 ΡΡ。

歩骤 902 , 对历史数据进行平滑处理。

在本步骤中，对历史数据的最后 ΡΡ/4数据进行平滑处理的方法具体可以为：将 ΠΒ 中最后一个基音周期之前的四分之一基音周期数据乘以上升窗，将 ΗΒ最四分之 · 基音周期数据乘以下降窗，并将上述两个 1 Z4基音周期的数据做叠加，然后用叠加得到的 1 /4基音周期数据替换掉 ΗΒ中最后 1/4基音周期中的内容，以保证 ΗΒ中的前帧原始信号和填充的丢失帧信号之间的平滑过渡。所述上升窗和下降窗，最为简单的情况，可以采用如下面公式定义的窗：

上升窗

=

，下降窗

其中， ^为要加窗信号的长度， ί为要加窗信号的对应的第 i个采样点对应的下标。歩骤 903，将平滑后的历史数据中的最后一个 PP长度的数据放到一个专川的基音缓冲区（PB) 中。

专用 PB的长度与 PP相等。

步骤 904，用 PB中的数据填充与丢失帧长度相等的丢失帧主缓冲区（LMB )。

在本歩骤中，用 PB中的数据填充 LMB时，需要一个偏移指针（P— 0FFSKT ) 协助。所述 P— OFFSET, 用于指示下一次从 PB中取数据时，应该从什么位置丌始取数据，以保证和己填充数据拼接处的平滑。在使用 PB中的数据来恢复丢失的数据帧时，每取山 - - 段数据，就需要将指针 P— OFFSET向右移动相应的长度，如果发现从 PJFFSET到 PB结尾的数据不够所需要的数据时，则 P— OFFSET重新置 0，并从 PB的开始位 S接^取数据；如果仍然不够所需的数据，则重复这个步骤，直至取到所需的所有数据。

步骤 905，当前数据是否满足预设的条件，是则执行步骤 905; 否则执行歩骤 9K)。在本歩骤中，所指的预设条件是：当前数据的长度，即丢失帧之后的第 -个完好帧的起始位置起到当前收到的数据长度，是否满足对当前帧进行平滑处理的要求。图 10 是本发明实施例对当前帧进行平滑处理的示意图。参照图 10，对当前数据进行平滑处理的过程是：将当前数据第一个基音周期 Ρ之后的 1/4基音周期数据乘以下降窗，将前数据开始的第一个 1/4基音周期数据乘以上升窗，然后将上述两个 Ρ/4 L:度的数据进行叠加，并用叠加后的 P/4长度数据替换当前数据开始的第一个 1/4基音周期的数据。这样处理的目的与步骤 902中对历史数据进行平滑处理的目的相同，是为了在使用 ¾前数据反向填充丢失帧时，保证当前数据的原始信号和丢失帧信号之间的平滑过渡。

在本歩骤中由于还不知道当前数据的基音周期，因此可以使用历史数据的基音周期

PP来进行判断，比如将判断条件设置为当前数据的长度 Date- SZ满足- Date-SZ^PP + PP/4

歩骤 906，估计当前数据的基音周期（NP);

在本歩骤中，可以利用自相关分析方法估计出 NP，也可以先用自相关分析方法估计出一个初始基音周期，然后用图 1和图 6所示的本发明实施例的方法对初始基音周期进行倍频消除或微调修正后再作为本实施例中的 NP。步骤 907，对当前数据进行平滑处理。

在本步骤中，用图 10所示的方法对当前数据进行平滑处理。

步骤 908 ,将平滑后的当前数据中的开始的一个 NP长度的数据放到一个专用的基 ΪΤ- 缓冲区 PB 1中。

歩骤 909，用 PB1中的数据反向填充与丢失帧长度相等的丢失帧临时缓冲区（i m )。执行步骤 913。

在本步骤中，用 PB 1中的数据反向填充 LTB的过程与歩骤 1304中用 PB中的数据埗充 LMB的过程类似，只是填充的方向相反，因此称为 "反向填充"。

图 1 1是本发明实施例用当前数据反向填充丢失数据的示意图。在图 1 1中，比较了用历史数据最后的 PP长度的数据填充丢失数据段和用当前数据开始的 NP长度数据填充丢失数据段的过程，可以看出用历史数据填充的方向是从左到右，而用当前数据填充的方向是从右到左。

步骤 910，从当前数据的起始位置开始取长度为 L的一段数据 Da teA , 并在基 ΰ·缓冲区 PB中査找与 DateA最匹配的一段 L长度的数据 DateB , 将 DateB的起始点记为；^。

图 12是本发明实施例在基音缓冲区中査找与给定波形最匹配的波形的示意图。如图 12所示，在 PB中设置一个长度为 L的 SW， SW的起始端点 ^Ss从 PB的起始端点 ·始逐渐向右滑动一直到 PB 的末尾端点，并 SW 的滑动过程中计算 SW 中的数据和给定数据

DateA 的匹配值。当 SW的起始端点向右滑动一定距离后，其末尾端点 ^E s会超出 PB 的区域范围，即 SW起始端点到 PB末尾端点的长度 M小于 L , 此时，复制 PB起始位 S起的 L-M长度的数据拼接到 PB的末尾，以满足匹配的要求。然后用 SW中拼接起来的 L长度的数据与给定数据 Dat eA进行匹配计算。

在本步骤中，其中， L可以取 0. 55 X PP的值。

步骤 91 1，将基音缓冲区 PB中 St点之后的 PP/4长度数据 Dat eB乘上 ^个下降窗，将当前数据起始位置幵始的 PP/4长度数据 DateA乘上一个上升窗之后，将上述两个乘窗之后的 PP/4长度数据进行叠加，并用叠加后的数据替换当前数据起始位：的 P1V4长度数据。

本步骤中的操作可以保证当前数据和丢失数据之间的平滑连接。

歩骤 912，从 PB的 S t点之前，取长度与丢失数据长度相同的数据，放入 L'1'B中。在本歩骤中，当 PB中 St点到 PB的起始端点的长度小于所需数据的长度，即小于丢失数据长度时，从 PB的末尾点开始继续向左取数据，直至能够取到所需长度的数据。歩骤 913，将丢失帧主缓冲区 LMB中的数据乘上一个下降窗，同时将丢失帧临时缓冲区 LTB中数据乘上一个上升窗，并将上述两个乘窗的数据进行叠加，将叠加后的数据作为恢复的丢失帧填充到丢失帧处。

到此为止，便完成了结合历史数据和当前数据进行丢包隐藏处理的过程。

当然，在图 9所示的流程中，可以不需要歩骤 905的判断歩骤，在歩骤 904之] fi ¾ 接执行步骤 906、 907、 908、 909和 913，或在步骤 904之后直接执行歩骤 910、 91 1 、 912和 913。

在上述流程的歩骤 910中，在 ΡΒ中査找与 DateA最匹配的 DateB时，可以利用在骤 904中得到的 PB的 P— OFFSET的位置，即将初始的匹配点设置为 P— 0F SFJ,然后在 P— OFFSET的位置附近査找最佳匹配的点 St，这样可以减少匹配的次数，从而减少计算里。

如果丢失帧正好位于浊音和清音的过渡段时，用图 9所示的方法恢复丢失帧，可能还会出现能量异常变化的情况，因此在本发明实施例中进一步需要根据 £失帧的前后帧能量的变化来对丢失帧的幅度进行平滑处理，以实现波形的渐变。

首先取当前数据开始处的 L个样点，并计算这 L个样点的能量值（EN)。然后在中査找和这 L个样点最匹配的 L个样点，并计算基音缓冲区中的这 L个样点的能量 EP。最后，根据丢失帧的前后帧能量的变化情况，对图 9所示的方法最终恢复的 ΐ失帧数 ¾ 幅度进行平滑，以达到能量平稳过渡的目的。

计算 L个样点的能量时，可以取 L个样点的幅度的平方求和的方法。

设丢失帧的前后帧能量的比值为 ER (Energy Ratio ) , 则 ER = EN / RP, 用 x表示所恢复丢失帧数据的序列， X ( i )表示序列 X中的第 i个数据，帧长为 FRAME— SZ, 则可以公式（8 ) 对所恢复的丢失帧数据逐点进行能量修正：

X (i) = x (i) x (ix ^sq^rt(ER) -l _{+ 1)} i < i < FRAME SZ

FRAME— SZ + 1 一 _{( 8 )} 其中，函数 sqrt表示求平方根。

图 13是本发明实施例对恢复的丢失帧数据进行幅度平滑处理后的示意图。从图 ! 3 可以看出，在进行幅度平滑处理之前，所恢复的丢失帧与当前帧的连接处能 ¾变化较大，但在进行幅度平滑处理之后，恢复的丢失帧与当前帧的连接处能量变化变得比较平稳。

除了上述根据丢失帧的前帧和后帧的能量比值来对丢失帧的幅度进行平滑处理之夕卜，还可以根据丢失帧的前帧和后帧中匹配波形的最大幅度差的比值来进行幅度的平滑处理，比如也可以利用公式（8 )对恢复丢失帧的幅度进行平滑处理，只是，此时的位置处应该是丢失帧的前帧和后帧中匹配波形的最大幅度差的比值。

在上述对幅度进行平滑处理的过程中，较佳地，在 EP〉 EN吋，才进行幅度的平滑处理。

图 14是本发明实施例一种实现丢包隐藏的装置的结构框图。如图 14所示，该装 H 主要包括：主处理单元 1401、丢失帧主缓冲区 1402、丢失帧临时缓冲区 1403，其屮：主处理单元 1401，用于利用历史数据中的最后一个基音周期数据，填充 £失帧主缓冲区 1402，并利用当前数据中的第一个基音周期数据，或利用历史数据中的最后一个基音周期数据，填充丢失帧临时缓冲区 1403 ; 并将丢失帧主缓冲区 1402和失帧临时缓冲区 1403中的数据进行叠加处理后，用所述叠加处理后的数据补偿丢失帧。

丢失帧主缓冲区 1402，用于存储主处理单元 1401所填充的数据。

丢失帧临时缓冲区 1403，用于存储主处理单元 1401所填充的数据。

丢失帧主缓冲区 1402和丢失帧临时缓冲区 1403的长度等于丢失帧的长度。

此外，图 14所示的装置还包括：历史数据处理单元 1405当前数据处理单元 M06, 所述主处理单元包括：基音缓冲区 1407、平滑处理模块 1408和幅度平泔模块 14(M。

历史数据处理单元 1405，用于获取历史数据的基音周期，并将历史数据屮的最后 - 个基音周期数据进行平滑处理后，发送给主处理单元 1401。

当前数据处理单元 1406，用于获取当前数据的基音周期，并将当前数据中的第一个基音周期数据进行平滑处理后，发送给主处理单元 1401。

主处理单元 1401 利用历史数据中的最后一个基音周期数据，填充丢火帧临时缓冲区 1403的实现过程可以是：主处理单元 1401将历史数据中的最后一个基音周期数据存入基音缓冲区 1407，并从当前数据中的第一个基音周期数据的起始位置丌始取长度为预设值的第一数据；在基音缓冲区 1407 中査找与第一数据最为匹配的第二数据；获取基音缓冲区 1407 中的第二数据的起始点之前的长度与丢失帧临时缓冲区长度相等的第三数据；用所述第三数据填充丢失帧临时缓冲区 1403。

平滑处理模块 1408，用于将基音缓冲区 1407中的第二数据的起始点之后的长度为预设值的数据乘上一个下降窗，将所述当前数据起始位置开始的长度为预设值的数据乘上一个上升窗，然后将上述两个乘窗之后的数据进行叠加处理，并用叠加后的数据荇换当前数据起始位置开始的长度为预设值的数据。

幅度平滑模块 1404，用于获取丢失数据之前的已知数据和丢失数据之后的知数中相互匹配的两组数据之间的比例系数，并根据所述比例系数对所述叠加处理后的数据的幅度进行平滑处理；主处理单元 1401利用所述经过幅度平滑处理后数据补偿丢失帧。

在图 14所示的实施例中，主处理单元 1401还可以进一歩用于判断前数据的长度是否大于或等于预设值，是则，所述主处理单元 1401 利用丢失数据之后的知数¾中的第一个基音周期数据，填充丢失帧临时缓冲区 1403 ; 否则，所述主处理单元 1401利用丢失数据之前的已知数据中的最后一个基音周期数据，填充丢失帧临时缓冲区 1403。

图 9和图 14所示的实施例中，通过结合当前数据和历史数据恢复丢失帧数据，进而完成丢包隐藏处理。由于在丢包隐藏处理过程中利用丢失帧之后的数据帧，即当前数据对丢失帧进行恢复，因此增强了所恢复的丢失帧数据与丢失帧之后的数据之间的相关性，进而提高了所恢复的语音数据的质量。另外，对恢复的丢失帧数据进进行幅度平滑处理的过程也更进一歩的提高了所恢复的语音数据的质量。

接下来进一歩说明图 9所示的丢包隐藏方法和图 14所示的实现丢包隐 ¾的装置在具体系统中是如何应用和工作的。

图 15是本发明实施例实现丢包隐藏的装置在接收端系统中的外部连接示意阁，木发明实施例提供的接收端系统具体可以为一种解码器。如图 15所示，该接收端系统中包括：丢失帧检测器 1501、解码器单元 1502、历史缓冲区 1503、延迟单元 1504和¾现丢包隐藏单元 1505。

在图 15中，丢失帧检测器 1501接收到从网络上传输过来的比特流后，判断是冇数据帧丢失，如果没有数据帧丢失，则丢失帧检测器 1501将完好的语音帧传送给解码器 1502进行解码，然后解码器 1502将解码后的数据送入到历史缓冲区 1503，延迟单元 1504对历史缓冲区 1503中的数据延迟一定时间后输出。如果丢失帧检测器 1501检测到有数据帧丢失，就发送 "丢失语音帧"的信号给实现丢包隐藏单元 1505，然后实现丢包隐藏单元 1505使用本发明实施例所述的丢包隐藏方法，获取恢复的丢失帧数据， Λ.将恢复的丢失帧数据放置在历史缓冲区 1503中与丢失帧相对应的位 S上。在图 15所示的系统中，在满足延迟要求的条件下，实现丢包隐藏单元 1501 需要根据丢失帧之前的历史数据和丢失帧之后的一帧或者多帧数据进行丢包隐藏处理，但在复杂的网络条件下，丟失帧之前的帧和丢失帧之后的数据帧是否丢失并不是巳知或固定的，因此实现包隐藏单元 1505可通过丢失帧检测器 1501 获得在进行丢包隐藏处理时所需的帧的状态信息。然后实现丢包隐藏的装置 1505利用历史缓冲区 1503中的数据，并结合与丢失帧相关的前后帧的状态，合成丢失的音频帧。图 16是本发明实施例在实际系统中应用实现丢包隐藏的方法的流程图。如图！6所示，包括以下步骤；

歩骤 1601，接收端系统收到新的语音数据帧。

步骤 1602，接收端系统判断当前接收到的新的语音数据帧是否为坏帧，是则执行骤 1606，否则执行步骤 1603。

步骤 1603，接收端系统对接收到当前帧进行解码处理。

步骤 1604，接收端系统判断当前帧的前一帧是否丢失，是则执行歩骤 1606，否则执行步骤 1605。

骤 1605，用当前帧更新历史缓冲区，执行歩骤 1608。

步骤 1606，用丢包隐藏处理方法恢复丢失帧。

步骤 1607，用恢复的丢失帧和 /或当前帧更新历史缓冲区。

歩骤 1608，将历史缓冲区中数据延迟一段之间。

在本步骤中，延迟的时间可以根据应用场景进行设定。例如，系统要求的延迟时 ί 为 1帧或更多帧对应的时间时，考虑到进行前帧平滑时最大的可能叠加长度为最大可能基音周期（最大可能基音周期一般为 15ms ) 的 0. 25倍，即 3. 75m_S，因此可以在满足系统延迟要求的情况下，适当增加延迟时间。比如当 lm_S数据对应的采样点的个数为时，则可以使用的延迟时间为一帧对应的时间和 CEIU 3. 75 X SP / F AME_SZ ) X FRAME . SZ 个采样点对应的时间中的大者，其中 CEIL 的意义为取大于给定浮点数的最小整数， FRAME— SZ为一帧数据中的采样点个数。

例如，当系统的帧长为 5ms时，可以设定延迟时间为 5ms，即对应一帧的延迟时间；如果当前系统的帧长为 2ms，则可以设定延迟时间为 MAX ( 2， CEIL ( 3. 75 / 2 ) X 2 ) = 4ms, 即对应两帧的延迟时间。

步骤 1609，输出历史缓冲区中的数据。

步骤 1610, 判断是否还有其它的数据帧需要接收，是则转到步骤 1601继续执行，否则结束本流程。

在实际应用当中，需要根据系统的延时允许时间来决定是否应用本发明 ¾施例屮给出的结合历史数据和当前数据恢复丢失帧的方法来进行丢包隐藏处理。例如当有一个数据帧丢失时，如果系统的延时时间允许，则等待下一帧，如果下一帧是完好的帧，则可以利用本发明实施例给出的结合历史数据和当前数据恢复丢失帧的方法对 £失帧进行隐藏处理，如果下一帧数据仍然丢失了，则在系统的延时时间允许的情况下，继续等待下一帧的数据。在连续丢帧的情况下，且系统时延条件不允许继续等待时，利用历史数据进行丢包隐藏处理。

综上所述，本发明实施例中，通过从初始基音周与所有大于最小可能基音周期的初始基音周期的因数中选择一个数值作为估计的最佳基音周期的技术方案，能够消除佔计基音周期时存在的倍频问题。本发明实施例中，通过在初始基音周期的附近查找最 ft匹配点，并根据最佳匹配点的位置对估计的初始基音周期进行微调的技术方案，减小了估计基音周期的误差。本发明实施例中，利用历史数据中的最后一个基咅周期数据，填充丢失帧主缓冲区，利用当前数据中的第一个基音周期数据，或利用历史数 '屮的最后一个基音周期数据，填充丢失帧临时缓冲区，对丢失帧主缓冲区和丢失帧临时缓冲区中的数据进行叠加处理，并用所述叠加处理后的数据补偿丢失帧的技术方案增强了恢复的 -£ 失帧数据与丢失帧之后的数据之间的相关性，进而改善了恢复的丢失帧数据与丢失帧之后的数据之间相位的连续性。并且，在本发明实施例中还通过对所恢复的丢失帧的幅度进行平滑处理的技术方案，使得所恢复的丢失帧与当前帧的连接处的能量变化变得〒- 稳。

以上所述，仅为本发明的较佳实施例而己，并非用于限定本发明的保护范围，凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求

1、一种基音周期的估计方法，其特征在于，该方法包括以下歩骤：

获取历史数据的初始基音周期；

从所述初始基音周期所对应频率的一个以上的大于 1的整数倍频率所分別对应的基音周期中，选择所对应频率小于或等于最小可能基音周期所对应频率的基音周期作为候选基音周期，并从所述初始基音周期和所述候选基音周期中选择一个基音周期作为所述历史数据的最终估计基音周期。

2、如权利要求 1所述的方法，其特征在于，所述从所述初始基音周期以及所述候选基音周期中选择一个基音周期作为所述历史数据的最终估计基音周期的歩骤包栝：在所述历史数据的一端，设置长度为预设值的模板窗：设置长度与所述模板窗长度相同的滑动窗，并令所述滑动窗在所述历史数据的长度范围内滑动；

当所述滑动窗与所述模板窗的对应端点之间的距离与所述初始基 ·ΐί周期的长度相等时，取所述滑动窗中数据与所述模板窗中数据的匹配值为与所述初始基音周期对应的匹配值；当所述滑动窗与所述模板窗的对应端点之间的距离与所述一个候选基音周期的长度相等时，取所述滑动窗中数据与所述模板窗中数据的匹配值为与该候选基音周期对应的匹配值；

从所述初始基音周期所对应的匹配值以及各候选基音周期所对应的匹配值中选择出一个最佳匹配值，并将该最佳匹配值所对应的基音周期作为所述历史数据的最终估计基音周期。

3、如权利要求 2所述的方法，其特征在于，所述从所述初始基咅周期所对应的配值以及各候选基音周期所对应的匹配值中选择出一个最佳匹配值的歩骤包括：

将所述初始基音周期所对应的匹配值设置为所述最佳匹配值的初始值，然后按照前向顺序判断每一个候选基音周期所对应的匹配值是否优于所述初始基音周期所对应的匹配值，是则用该候选基音周期所对应的匹配值更新最佳匹配值，最终得到一个最佳匹配值；或

将所述初始基音周期所对应的匹配值设置为最佳匹配值的初始值，然后按照前向顺序判断每一个候选基音周期所对应的匹配值是否优于当前的最佳匹配值，足则用该候选基音周期所对应的匹配值更新所述最佳匹配值，最终得到一个最佳匹配值。

4、如权利要求 3所述的方法，其特征在于，

所述候选基音周期所对应的匹配值优于初始基音周期所对应的匹配值具体为：所述候选基音周期所对应的匹配值与初始基音周期所对应的匹配值的比值在预定范围内；

所述候选基音周期所对应的匹配值优于当前的最佳匹配值具体为：

所述候选基音周期所对应的匹配值与当前的最佳匹配值的比值在预定范闱内。

5、如权利要求 1所述的方法，其特征在于，该方法在所述从所述初始基音周期和所述候选基音周期中选择一个基音周期作为所述已知语音数据的最终估计基音周期之前进一步包括：

在所述历史数据的一端，设置长度为预设值的模板窗；设置长度与所述模板窗长度相同的滑动窗，并令所述滑动窗在所述已知语音数据的长度范围内滑动；

当所述滑动窗与所述模板窗的对应端点之间的距离与一个候选基音周期的长度相等时，取所述滑动窗中数据与所述模板窗中数据的匹配值为与所述候选基音周期对应的匹配值，并取所述滑动窗的起始端点或末尾端点的当前位置为与该候选基咅周期对、'、/.的匹配点；

对于每一个候选基音周期，使所述滑动窗的起始端点或末尾端点在该候选基音周期所对应的匹配点周围的预设范围内滑动，并在该候选基音周期所对应的匹配点周围的预设范围内，査找出所述滑动窗中数据与模板窗中数据的匹配值为最佳匹配值吋的滑动窗的位置，并用此时的所述滑动窗与所述模板窗对应端点之间的语音数据长度^换该候选基音周期；

所述选择一个基音周期作为最终估计的基音周期具体为：

从所述初始基音周期以及所述替换后的候选基音周期中选择一个基音周期作为最终估计的基音周期。

6、如权利要求 5所述的方法，其特征在于，所述在候选基音周期所对应的匹配点周围的预设范围内，查找出滑动窗中数据与模板窗中数据的匹配值为最佳匹配值时的滑动窗的位置具体为：

从所述候选基音周期对应的匹配点开始向该匹配点两侧的预设范围进行査找。

7、如权利要求 2至 6中任一项所述的方法，其特征在于，所述滑动窗屮数据与所述模板窗中数据的匹配值是所述滑动窗中数据与所述模板窗中数据的相关值。

8、一种基音周期的估计装置，其特征在于，该装置包括：初始基音周期获取 .儿和选择单元，其中，

初始基音周期获取单元，用于获取历史数据的初始基音周期，并发送给选择 ^儿；选择单元，从所述初始基音周期所对应频率的一个以上的大于 1的整数倍频率所分别对应的基音周期中，选择所对应频率小于或等于最小可能基音周期所对应频率的基音周期作为候选基音周期，并从初始基音周期和候选基音周期中选择一个基音周期作为所述已知语音数据的最终估计基音周期。

9、如权利要求 8所述的装置，其特征在于，所述选择单元包括：计算模块和比较模块，其中，

计算模块，用于分别计算出与所述初始基音周期和各个候选基音周期对应的匹配值，并发送给比较模块；

比较模块，用于对所接收到的与所述初始基音周期和各个候选基音周期对应的匹配值进行比较，从中选择出一个最佳匹配值，并将该最佳匹配值所对应的基音周期作为所述巳知语音数据的最终估计基音周期。

10、如权利要求 8所述的装置，其特征在于，所述选择单元进一歩用于，对于甸一个候选基音周期，在该候选基音周期所对应的匹配点周围的预设范围内进行搜索，査找出一个匹配值为最佳匹配值的匹配点，用该匹配点对应的基音周期替换 ¾候选基音 J 期；

并从所述初始基音周期以及所述替换后的候选基音周期中选择一个基周期作为所述己知语音数据的最终估计的基音周期。

1 1、一种基音周期的微调方法，其特征在于，该方法包括：

设置长度与所述模板窗长度相同的滑动窗，并使所述滑动窗靠近丢失数据的端点在预设点周围的预设范围内滑动，所述预设点是所述已知数据中与所述模板窗靠近¾大数据的端点距离初始基音周期长度的点；

在所述滑动窗所能滑动的预设点周围的预设范围内，计算所述模板窗屮的数据所述滑动窗中数据的匹配值，并从中査找出最佳的匹配值，并将具有所述最佳匹配值时的模板窗与滑动窗的对应端点之间的距离作为微调后的基音周期。

12、如权利要求 11所述的方法，其特征在于，所述在滑动窗所能滑动的预设点周围的预设范围内，计算所述模板窗中的数据与所述滑动窗中数据的匹配值，并找出 g 佳匹配值是，从所述预设点开始向该预设点两侧的预设范围进行查找。

13、如权利要求 11所述的方法，其特征在于，所述计算所述模板窗屮的数据 ^所述滑动窗中数据的匹配值，并从中查找出最佳的匹配值的步骤包括：计算所述模板窗中的数据与所述滑动窗中数据的相关值，并取匹配值为相关伹，取匹配值中最大的值作为最佳匹配值；或

计算所述模板窗中的数据与所述滑动窗中对应数据的幅度差值的绝对值的总和，并取匹配值为所述幅度差值的绝对值的总和，取匹配值中最小的值作为最佳匹配值。

14、如权利要求 11所述的方法，其特征在于，获取所述丢失数据之后的所述巳知数据的初始基音周期包括：获取所述丢失数据之前的所述已知数据的初始基音周期，并将所获取的丢失数据之前的己知数据的初始基音周期作为所述丢失数据之后的巳知数据的初始基音周期。

15、一种基音周期的微调装置，其特征在于，该装置包括：初始基音周期获取单，设置单元和计算单元，其中，

初始基音周期获取单元，用于获取丢失数据之前或丢失数据之后的己知数据获取初始基音周期，并发送给设置单元；

设置单元，用于接收所述初始基音周期获取单元发送的初始基音周期，并在所述知数据靠近丢失数据的一端，设置长度为预设值的模板窗，设置长度与所述模板窗长度相同的滑动窗，并使所述滑动窗靠近丢失数据的端点在预设点周围的预设范围内滑动；所述预设点是所述已知数据中与所述模板窗靠近丢失数据的端点距离初始基音周期长度的点；

计算单元，用于在所述滑动窗所能滑动的预设点周围的预设范围内，计算模板窗中的数据与滑动窗中数据的匹配值，并从中査找出最佳匹配值，并将具有最佳匹配值时的模板窗与滑动窗的对应端点之间的距离作为微调后的基音周期。

16、如权利要求 15所述的装置，其特征在于，所述初始基音周期获取^元，用于获取丢失数据之前的已知数据的初始基音周期，将所获取的丢失数据之前的己知数 ¾；的初始基音周期作为丢失数据之后的巳知数据的初始基音周期，并发送给所述设置单元。

17、一种实现丢包隐藏的方法，其特征在于，该方法包括：

利用所述丢失数据之前的所述已知数据中的一个基音周期数据，填充丢失帧主缓冲区；

利用所述丢失数据之后的所述巳知数据中的一个基音周期数据，或利川所述丢失数据之前的所述已知数据中的一个基音周期数据，填充丢失帧临时缓冲区；

18、如权利要求 17所述的方法，其特征在于，

所述丢失数据之前的已知数据中的一个基音周期数据具体为：

丢失数据之前的已知数据中的最后一个基音周期数据；

所述丢失数据之后的巳知数据中的一个基音周期数据具体为：

丢失数据之后的己知数据中的第一个基音周期数据。

19、如权利要求 18所述的方法，其特征在于，在所述利用丢失数据之前的己知数据中的最后一个基音周期数据，填充所述丢失帧主缓冲区之前进一歩包括：

对所述丢失数据之前的巳知数据中的最后一个基音周期数据进行平滑处理。

20、如权利要求 18所述的方法，其特征在于，在所述利用丢失数据之后的已知数据中的第一个基音周期数据，填充丢失帧临时缓冲区之前进一歩包括- 对丢失数据之后的已知数据中的第一个基音周期数据进行平滑处理。

21、如权利要求 20所述的方法，其特征在于，所述对丢失数据之后的已知数据' 1' 的第一个基音周期数据进行平滑处理的步骤包括：将丢失数据之后的巳知数据第一个 S 音周期之后的预设长度数据乘以下降窗，将丢失数据之后的已知数据起始的第一个预设长度数据乘以上升窗后，将所述两个乘窗后的预设长度的数据进行叠加，并用叠加后的数据替换丢失数据之后的已知数据中起始的第一个预设长度数据。

22、如权利要求 18所述的方法，其特征在于，利用丢失数据之后的知数据中的第个基音周期数据，对丢失帧临时缓冲区进行填充是进行反向填充。

23、如权利要求 18所述的方法，其特征在于，所述利用丢失数据之前的已知数据中的最后一个基音周期数据，填充所述丢失帧临时缓冲区包括：

将在丢失数据之前的已知数据中的最后一个基音周期数据存入基咅缓冲区，并从所述丢失数据之后的所述已知数据的起始位置开始取长度为预设值的第一数据；

在所述基音缓冲区中査找与所述第一数据最为匹配的第二数据；

获取所述基音缓冲区中的所述第二数据的起始点之前的长度与所述 -2：·火帧临时缓冲区长度相等的第三数据；

将所述第三数据存入所述丢失帧临时缓冲区。

24、如权利要求 23所述的方法，其特征在于，该方法进一步包括：对¾火数据之后的己知数据起始位置开始的长度为预设值的数据进行平滑处理。

25、如权利要求 24所述的方法，其特征在于，所述对丢失数据之后的所述已知数据起始位置开始的长度为预设值的数据进行平滑处理的步骤包括：将所述基音缓冲区中的从所述第二数据的起始点开始的长度为预设值的数据乘上一个下降窗，将 ί·失数据之后的已知数据起始位置开始的长度为预设值的数据乘上一个上升窗，然后将 h述两个乘窗之后的数据进行叠加，并用所述叠加后的数据替换丢失数据之后的所述已知数据起始位置开始的长度为预设值的数据。

26、如权利要求 23所述的方法，其特征在于，在所述利用所述丢失数据之前的所述已知数据中的最后一个基音周期数据，填充所述丢失帧主缓冲区的歩骤进步包拈：利用偏移指针指示所述最后一个基音周期数据的当前位置，每次从偏移指针指示的当前位置取数据填充所述丢失帧主缓冲区，并实时更新偏移指针的位 S;

所述在所述基音缓冲区中查找与所述第一数据最为匹配的所述第二数据的歩骤包括：从所述基音缓冲区中的所述偏移指针指示的相应位置周围的预设范围内杏找与所述第一数据最为匹配的所述第二数据。

27、如权利要求 18所述的方法，其特征在于，所述对所述丢失帧: t缓冲区和所述丢失帧临时缓冲区中的数据进行叠加处理的步骤包括：将所述丢失帧主缓冲区的数据乘上一个下降窗，将所述丢失帧临时缓冲区中的数据乘上一个上升窗，并将所述丢失帧主缓冲区和所述丢失帧临时缓冲区中的乘窗后的数据进行叠加。

28、如权利要求 17所述的方法，其特征在于，在对丢失帧主缓冲区和丢失帧临吋缓冲区中的数据进行叠加处理之后，并在用所述叠加处理后的数据补偿丢失帧之前进- 步包括：

将在所述丢失数据之前的所述已知数据中的最后一个基音周期数据存入所述基音缓冲区，并从所述丢失数据之后的所述已知数据的起始位置开始取长度为预设值的数据；

在所述基音缓冲区中查找与所述长度为预设值的数据最为匹配的数据；

获取所述长度为预设值的数据和所述查找的匹配数据之间的比例系数；

根据所述比例系数对所述进行叠加处理后的数据的幅度进行平滑处理；

用所述经过幅度平滑处理的数据补偿丢失帧。

29、如权利要求 28所述的方法，其特征在于，所述比例系数是所述长度为预设值的数据的能量和所述査找的匹配数据的能量的比值，或所述长度为预设值的数据中的最大幅度差和所述査找的匹配数据中的最大幅度差的比值。

30、如权利要求 18所述的方法，其特征在于，该方法在所述丢失数据之后的匕知数据的长度大于或等于预设值时，利用丢失数据之后的已知数据中的第一个基音周期数据，填充所述丢失帧临时缓冲区；否则，利用丢失数据之前的已知数据中的最后一个基音周期数据，填充所述丢失帧临时缓冲区。

31、如权利要求 30所述的方法，其特征在于，所述预设值是丢失数据之前的已知数据的基音周期的 5/4倍。

32、一种实现丢包隐藏的装置，其特征在于，该装置包括：主处理单兀、丢失帧缓冲区和丢失帧临时缓冲区，其中，

主处理单元，用于利用丢失数据之前的已知数据中的一个基音周期数据，填充丢失帧主缓冲区，并利用丢失数据之后的巳知数据中的一个基音周期数据，或利用丢失数据之前的己知数据中的一个基音周期数据，填充丢失帧临时缓冲区；并将丢失帧主缓冲区和丢失帧临时缓冲区中的数据进行叠加处理后，用所述叠加处理后的数据补偿丢失帧；丢失帧主缓冲区，用于存储主处理模块所填充的数据，其长度与丢失数据长度相等-, 丢失帧临时缓冲区，用于辅助存储主处理模块所填充的数据，其长度与丢失数据长度相等。

33、如权利要求 32所述的装置，其特征在于，所述主处理单元是利用失数据之前的已知数据中的最后一个基音周期数据，填充丢失帧主缓冲区，并利用丢失数据之^ 的已知数据中的第一个基音周期数据，或利用丢失数据之前的已知数据中的 t后一个基音周期数据，填充丢失帧临时缓冲区。

'34、如权利要求 32所述的装置，其特征在于，该装置进一歩包括：历史数据处理单元和当前数据处理单元，其中：

历史数据处理单元，用于获取丢失数据之前的巳知数据的基音周期，并将丢失数掂之前的己知数据中的最后一个基音周期数据发送给主处理单元；

当前数据处理单元，用于获取丢失数据之后的已知数据的基音周期，并将丢失数据之后的己知数据中的第一个基音周期数据发送给主处理单元。

35、如权利要求 34所述的装置，其特征在于，

所述历史数据处理单元，进一步用于将丢失数据之前的已知数据中的最后一个基音周期数据进行平滑处理后，再发送给主处理单元；和 /或

所述当前数据处理单元，进一步用于将丢失数据之前的己知数据中的第一个基周期数据进行平滑处理后，再发送给主处理单元。

36、如权利要求 32所述的装置，其特征在于，所述主处理单元包括：基音缓冲区，用于存储所述丢失数据之前的己知数据中的最后一个基音周期数据；所述主处理单元，用于将所述丢失数据之前的所述已知数据中的最后 ···个基音周期数据存入基音缓冲区，并从所述丢失数据之后的所述已知数据中的第 - 个基 ΰ周期数据的起始位置丌始取长度为预设值的第一数据；在所述基音缓冲区中査找与所述第一数据最为匹配的第二数据；获取所述基音缓冲区中的所述第二数据的起始点之前的长度与 -£ 失帧临时缓冲区长度相等的第三数据；用所述第三数据填充所述丢失帧临时缓冲区。

37、如权利要求 36所述的装置，其特征在于，所述主处理单元进一歩包括：平^ 处理模块，用于将所述基音缓冲区中的第二数据的起始点开始的长度为预设值的数据乘上一个下降窗，将丢失数据之后的已知数据起始位置开始的长度为预设值的数据乘上个上升窗，然后将上述两个乘窗之后的数据进行叠加处理，并用所述叠加的数据荇换丢失数据之后的已知数据起始位置开始的长度为预设值的数据。

38、如权利要求 32所述的装置，其特征在于，所述主处理单元进一步包括：幅度平滑模块，用于获取所述丢失数据之前的所述己知数据和所述丢失数据之后的所述巳知数据中相互匹配的两组数据之间的比例系数，并根据所述比例系数对所述叠加处理后的数据的幅度进行平滑处理；

所述主处理单元利用所述经过幅度平滑处理后数据补偿丢失帧。

39、如权利要求 32所述的装置，其特征在于，所述主处理单元进 ·歩用丁-，判断所述丢失数据之后的己知数据的长度是否大于或等于预设值，是则，所述主处理模块用于利用丢失数据之后的巳知数据中的第一个基音周期数据，填充 2：·火帧临时缓冲区：否则，所述主处理模块用于利用丢失数据之前的已知数据中的最后一个基音周期数据，填充丢失帧临时缓冲区。

40、一种实现丢包隐藏的接收端系统，其特征在于，该接收端系统中包括：丢失帧检测器、解码器单元、历史缓冲区、延迟单元和实现丢包隐藏单元，其中：

丢失帧检测器，用于接收网络侧传输过来的比特流，并判断是否有数据帧 £失，且若丢失帧检测器没有检测到数据帧丢失，则丢失帧检测器将完好的数据帧传送给所述解码器单元进行解码，若丢失帧检测器检测到有数据帧丢失，则发送丢失数据帧的信号给所述实现丢包隐藏单元；

历史缓冲区，用于存储所述解码器单元发送的数据帧。延迟单元，用于控制所述历史缓冲区中的数据帧延迟输出；

实现丢包隐藏单元，用于恢复丢失的数据帧，并将恢复的数据帧放 S在历史缓冲区中与所述丢失的数据帧相对应的位置上，且所述实现丢包隐藏单元的工作过程包括：利用丢失数据之前的已知数据中的一个基音周期数据，填充丢失帧 ΐ缓冲 1 _; 利用所述丢失数据之后的巳知数据中的一个基音周期数据，或利用所述 £失数据之前的所述己知数据中的一个基音周期数据，填充丢失帧临时缓冲区；

对所述丢失帧主缓冲区和所述丢失帧临时缓冲区中的数据进行叠加处理，并用所述叠加处理后的数据补偿丢失帧。