CN107910014A

CN107910014A - 回声消除的测试方法、装置及测试设备

Info

Publication number: CN107910014A
Application number: CN201711182046.XA
Authority: CN
Inventors: 王展; 胡小鹏
Original assignee: Suzhou Keda Technology Co Ltd
Current assignee: Suzhou Keda Technology Co Ltd
Priority date: 2017-11-23
Filing date: 2017-11-23
Publication date: 2018-04-13
Anticipated expiration: 2037-11-23
Also published as: CN107910014B

Abstract

本发明公开了一种回声消除的测试方法、装置及测试设备，其中，方法包括：获取待测音频信号；对待测音频信号的进行语音识别，以获取待测音频信号中的语音信息；提取语音信息的特征；将语音信息的特征与参考音频信号的语音特征进行比对；根据比对结果确定待测音频信号的语音分值；利用语音分值计算得到待测设备的回声消除质量分值。该方法是基于待测音频中的语音信息的特征进行回声消除质量的评价，能够避免多场景下不同语境环境对待测音频信号的影响，具有较高的灵活性，而语音信息的特征与外界环境的干扰无关，仅仅取决于待测设备自身的性能，能够提高回声消除的测试效果，以及可信度使得客观评价的结果更能够符合人的主观评价。

Description

回声消除的测试方法、装置及测试设备

技术领域

本发明涉及回声处理技术领域，具体涉及一种回声消除的测试方法、装置及测试设备。

背景技术

声学回声是指远端设备(或近端设备)的扬声器播放出来的声音，被远端设备(或近端设备)的麦克风拾取，然后传输到近端设备(或远端设备)，由近端设备(或远端设备)的扬声器播放出来的声音。回声能否被近端用户听到取决于两个因素：一个是回声的能量，另外一个是近端说话到近端播放远端声音的延时。一般地，当近端说话到听到回声的延时达到30毫秒以上且回声具有一定的能量时，就会感觉到回声的存在，严重时将影响通话效果。

现有技术中，消除回声的通常做法是在远端增加回声消除(Automatic EchoCancellation，简称为AEC)功能。回声消除的效果取决于多种因素，除了跟人的主观感受指标如谈话的清晰度、可懂度、是否拖尾、是否有回声、是否响亮、交流是否流畅等有关外，还跟如房间的大小、回声路径是否被改编、是否双讲、喇叭音量的大小等参数设置和回声的处理能力密切相关。

目前，以视频会议测试为例，对声音质量的评价可分为主观测试、客观测试。主观测试以评价者的主观感受为基础，且重复性、稳定性差，费时费力。此外，常用的音频客观算法有POLQA(ITU-T P.863)、PEAQ(ITU-R BS.1387)、PESQ(ITU-T P.862.2)等。这些算法都是用来评测声音的损伤程度，即采用比较待测声音与源信号的相似度来评价回声消除后质量的方法。然而，上述算法仅客观对比待测声音与源信号的相似程度，灵活性较低，不能满足多场景下不同语境环境对待测声音的影响。

发明内容

有鉴于此，本发明实施例提供了一种回声消除的测试方法、装置及测试设备，以解决现有回声消除的测试方法灵活性低的问题。

本发明第一方面提供了一种回声消除的测试方法，包括以下步骤：

获取待测音频信号，所述待测音频信号为由经过待测设备进行回声消除处理后的音频信号；

对所述待测音频信号的进行语音识别，以获取所述待测音频信号中的语音信息；

提取所述语音信息的特征；

将所述语音信息的特征与参考音频信号的语音特征进行比对；

根据比对结果确定所述待测音频信号的语音分值，其中，所述语音分值用于表示所述语音信息的特征与所述参考音频信号的语音特征的相似度；

利用所述语音分值计算得到所述待测设备的回声消除质量分值。

可选地，还包括：检测所述待测音频信号的能量分布；

根据所述能量分布确定出所述待测音频信号的能量分值；

其中，利用所述能量分值和所述语音分值计算得到所述待测设备的回声消除质量分值。

可选地，根据所述能量分布确定出所述待测音频信号的能量分值包括：

根据所述能量分布提取音量特征，所述音量特征包括：残留声音的位置、残留声音的长度、残留声音的音量大小、音量损失程度、语句的流畅度、语句的音量平滑度；

确定所述音量特征对应的第一评分值；

根据所述第一评分值计算得到所述能量分值。

可选地，所述根据所述第一评分值计算得到所述能量分值，采用如下公式计算：

其中，S₁为所述能量分值；m为音量特征的个数；A_1i为不同所述音量特征对应的所述第一评分值；f_1i为不同所述音量特征对应的权值。

可选地，提取得到所述语音信息的特征包括：语音内容、语音文字个数。

可选地，所述根据比对结果确定所述待测音频信号的语音分值，采用如下公式计算：

其中，S₂为所述语音分值；n为语音信息的特征的个数；A_2j为不同所述语音信息的特征对应的第二评分值；f_2j为不同所述语音信息的特征对应的权值。

可选地，所述利用所述能量分值和所述语音分值计算得到所述待测设备的回声消除质量分值，采用如下公式计算：

其中，S为所述待测设备的回声消除质量分值；S₁为所述能量分值；f_S1为所述能量分值对应的权值；S₂为所述语音分值；f_S2为所述语音分值对应的权值。

本发明第二方面提供了一种回声消除的测试装置，包括：

获取单元，用于获取待测音频信号，所述待测音频信号为由经过待测设备进行回声消除处理后的音频信号；

语音识别单元，用于对所述待测音频信号的进行语音识别，以获取所述待测音频信号中的语音信息；

提取单元，用于提取所述语音信息的特征；

比对单元，用于将所述语音信息的特征与参考音频信号的语音特征进行比对；

第一确定单元，用于根据比对结果确定所述待测音频信号的语音分值，其中，所述语音分值用于表示所述语音信息的特征与所述参考音频信号的语音特征的相似度；

第一计算单元，用于利用所述语音分值计算得到所述待测设备的回声消除质量分值。

本发明第三方面提供了一种测试设备，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行本发明第一方面或第一方面中任一项所述的回声消除的测试方法。

本发明第四方面提供了一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行本发明第一方面或第一方面中任一项所述的回声消除的测试方法。

本发明提供的技术方案，具有以下优点：

1.本发明实施例提供的回声消除的测试方法，通过提取待测音频信号中的语音信息的特征，将该语音信息的特征与参考音频信号的语音特征进行比对，确定待测设备的回声消除质量分值。该方法是基于待测音频中的语音信息的特征进行回声消除质量的评价，能够避免多场景下不同语境环境对待测音频信号的影响(例如，混响，外界噪声或采集设备本身的性能对待测音频信号造成的影响，但是上述影响并不是由于回声消除失效所导致的)，具有较高的灵活性；且语音信息的评价在于回声消除后的语音可懂度和回声消除失效后的语音残留程度，能够提高回声消除的测试效果，以及可信度，使得客观评价的结果更能够符合人的主观评价。

2.本发明实施例提供的回声消除的测试方法，通过将待测音频信号的能量分布与语音特征结合，从多个方面评价待测设备的回声消除效果，能够极大程度地还原待测音频信号本身的性质，从而提高了该测试方法的准确度。

3.本发明实施例提供的回声消除的测试方法，通过对能量分布中的音量特征的量化处理，并对量化后的结果结合语言环境确定能量分值；即通过从待测音频信号中提取代表能量的若干音量特征进行量化，能够解决回声消除的测试方法中待测音频信号的量化难的问题，可以降低回声消除测试方法的难度。

4.本发明实施例提供的回声消除的测试方法，通过对语音信息中的文字内容，个数或文字组成的单句的完整度进行量化，将不确定的语音信息转化成确定的文字特征，从而能够实现对语音信息的量化，降低待测音频信号的量化处理的难度。

5.本发明实施例提供的回声消除的测试方法，通过将语音分值与能量分值结合，并基于语言环境进行回声消除质量分值的确定，具有较高的准确性与可信度；此外，通过对语音特征以及能量特征进行量化，从而能够对长拷测试数据进行分析，具有较宽的应用领域。

6.本发明实施例提供的回声消除的测试装置，通过提取待测音频信号中的语音信息的特征，将该语音信息的特征与参考音频信号的语音特征进行比对，确定待测设备的回声消除质量分值。该装置是基于待测音频中的语音信息的特征进行回声消除质量的评价，能够避免多场景下不同语境环境对待测音频信号的影响，具有较高的灵活性；且语音信息的评价在于回声消除后的语音可懂度和回声消除失效后的语音残留程度，能够提高回声消除的测试效果，以及可信度，使得客观评价的结果更能够符合人的主观评价。

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点，附图是示意性的而不应理解为对本发明进行任何限制，在附图中：

图1示出了本发明实施例1中回声消除的测试方法的一个具体示意的方法流程图；

图2示出了本发明实施例2中回声消除的测试方法的一个具体示意的方法流程图；

图3示出了本发明实施例3中回声消除的测试方法的一个具体示意的方法流程图；

图4示出了本发明实施例4中回声消除的测试方法的一个具体示意的测试环境；

图5示出了本发明实施例5中回声消除的测试装置的一个具体示意的结构示意图；

图6示出了本发明实施例5中回声消除的测试装置的另一个具体示意的结构示意图；

图7示出了本发明实施例6中测试设备的一个具体示意的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例中的回声消除的测试方法可以应用于单讲和双讲的音频通信模式中。其中，单讲即只有远端说话的情形；由于只有远端说话，从麦克风采集进来的语音信号只包含远端的回声，而不包含近端的语音。双讲即有多方同时说话的情形；由于有多方同时说话，从麦克风采集进来的语音信号就包含了远端的回声和近端的语音，两者混合在一起。

实施例1

本实施例提供一种回声消除的测试方法，可用于回声消除的测试装置中。如图1所示，该方法包括以下步骤：

步骤S11，获取待测音频信号，待测音频信号为由经过待测设备进行回声消除处理后的音频信号。

回声消除的测试装置可以从实际音频通信的环境中获取待测音频信号；也可以是通过人为搭建一个回声消除的测试环境；或者是事先存储在回声消除的测试装置中；只需保证该待测音频信号由经过待测设备经过回声消除处理后的音频信号即可。

步骤S12，对待测音频信号的进行语音识别，以获取待测音频信号中的语音信息。

回声消除的测试装置对获取的待测音频信号进行语音识别之前，可以先将待测音频信号中的干扰信号去除。例如，可以通过降噪处理，去除待测音频信号中的噪音。在对去除噪音之后的待测音频信号进行语音识别，以获取其中的语音信息。

步骤S13，提取语音信息的特征。

其中，语音信息的特征可以是待测音频信号中的文字内容，文字个数，与文字相关的段落或句子的特征。

步骤S14，将语音信息的特征与参考音频信号的语音特征进行比对。

参考音频信号为预先存储在回声消除的测试装置中的一段语音，该语音中无回声，为纯粹的音频信息。

通过将提取出的语音信息的特征依次与该参考音频信号的语音特征进行比对，确定待测音频信号与参考音频信号之间的关于语音部分的回声消除结果。

步骤S15，根据比对结果确定待测音频信号的语音分值，其中，语音分值用于表示语音信息的特征与参考音频信号的语音特征的相似度。

回声消除的测试装置可以对比对的结果进行归一化处理，使得所有语音信息的特征的比对结果符合同一评价标准，从而能够得到待测音频信号的语音分值；此外，回声消除的测试装置也可以在各语音信息的特征的比对过程中，进行同一评价标准的处理。只需保证对应于各个语音信息的语音分值是在同一评价标准下得出的。

步骤S16，利用语音分值计算得到待测设备的回声消除质量分值。

其中，待测设备的回声消除质量分值可以是由语音分值决定，也可以是由语音分值和待测音频信号中的其他参量的分值组合之后得到。例如，可以是由语音信息的特征与能量信息的特征的组合，确定该待测设备的回声消除质量分值。

通过提取待测音频信号中的语音信息的特征，将该语音信息的特征与参考音频信号的语音特征进行比对，确定待测设备的回声消除质量分值。该方法是基于待测音频中的语音信息的特征进行回声消除质量的评价，能够避免多场景下不同语境环境对待测音频信号的影响，具有较高的灵活性；且语音信息的评价在于回声消除后的语音可懂度和回声消除失效后的语音残留程度，能够提高回声消除的测试效果，以及可信度，使得客观评价的结果更能够符合人的主观评价。

实施例2

本实施例提供一种回声消除的测试方法，可用于回声消除的测试装置中。如图2所示，该方法包括以下步骤：

步骤S21，获取待测音频信号，待测音频信号为由经过待测设备进行回声消除处理后的音频信号。

与实施例1步骤S11相同，在此不再赘述。

步骤S22，对待测音频信号进行语音识别，以获取待测音频信号中的语音信息。

与实施例1步骤S12相同，在此不再赘述。

步骤S23，提取语音信息的特征。

回声消除的测试装置采用脉冲编码调制(Pulse Code Modulation，简称为PCM)对待测音频信号进行量化，提取出待测音频信号的特征；即通过语音识别提取语音信息的特征。该语音信息的特征包括语音内容，语音文字个数等等。

其中，对语音识别的量化方法选自但并不限于PCM，只需保证回声消除的测试装置能够从待测音频信号中获取语音信息即可。

需要说明的是，对于不同的音频通话场景(单讲或双讲)，所提取的语音信的特征的个数可以相同，也可以不同。在下文的描述中，对应于单讲与双讲，以相同个数的语音信息的特征为例进行详细描述。

步骤S24，将语音信息的特征与参考音频信号的语音特征进行比对。

回声消除的测试装置通过语音识别获得的语音信息的特征，例如，语音信息的特征可以为：语音文字个数以及语音内容。将语音信息的特征与参考音频信号的语音特征进行比对，可以计算待测音频信号的语音文字个数的残留率(对应于单讲)，语音文字个数的正确率(对应于双讲)，语音内容的句子完整度得出语音文字个数，语音内容对应的第二评分值等等。

其中，语音文字个数的残留率，用于表示在AEC端无音频信号产生的情况下(单讲)，回声消除的测试装置识别出的文字个数，与参考音频信号中语句序列的总字数的比值；语音文字个数正确率等于识别出的正确文字个数除以参考音频信号中语句序列的总字数；语音内容的句子完整度等于识别出的单句中的正确文字个数除以该单句的在参考音频信号中语句序列的字数。可以将上述计算结果进行归一化处理，得到对应的第二评分值。

此外，对于不同的音频通话场景(单讲或双讲)，不同的语境对回声消除的测试结果也会产生影响。因此，在对回声消除质量的评价过程中，综合考虑语境的不同，会较大地提高回声消除的测试准确性。

上述每个语音信息的特征，在不同的音频通话场景(单讲或双讲)中，针对不同的语境对每个语音信息的特征进行对应第二评分值的计算。

表1对应于语音信息特征的第二评分值的计算(单讲)

	连续语句	简短语句	第二评分值
				语音文字个数	A₂₁₁	A₂₁₂	A₂₁
语音内容	A₂₂₁	A₂₂₂	A₂₂

如表1所示，连续语句与简短语句是用于表示在单讲场景下的语境分类，即对应于连续语句，得出对应于语音文字个数的得分值A₂₁₁，对应于简短语句，得出对应于语音文字个数的得分值A₂₁₂，最后，对应于语音文字个数的第二评分值为A₂₁＝A₂₁₁+A₂₁₂。其中，对应于每个语境的语音信息特征的得分值计算如下，例如：A₂₁₁＝语音文字个数的残留率×连续语句的权值；A₂₁₂＝语音文字个数的残留率×简短语句的权值。连续语句或简短语句的权值取决于在待测音频信号中，各占的比例。即，连续语句占的比例多，对应的权值大；反之，对应的权值小。

语音内容对应的第二评分值的计算同上。

表2对应于语音信息特征的第二评分值的计算(双讲)

	前插话	中插话	后插话	连续插话	第二评分值
						语音文字个数	A₂₁₁	A₂₁₂	A₂₁₃	A₂₁₄	A₂₁
语音内容	A₂₂₁	A₂₂₂	A₂₂₃	A₂₂₄	A₂₂

如表2所示，前插话、中插话、后插话以及连续插话是用于表示在双讲场景下的语境分类，即对应于前插话，得出对应于语音文字个数的得分值A₂₁₁；对应于中插话，得出对应于语音文字个数的得分值A₂₁₂；对应于后插话，得出对应于语音文字个数的得分值A₂₁₃；对应于连续插话，得出对应于语音文字个数的得分值A₂₁₄；最后，对应于语音文字个数的第二评分值为A₂₁＝A₂₁₁+A₂₁₂+A₂₁₃+A₂₁₄。具体计算过程与单讲场景类似。

步骤S25，根据比对结果确定待测音频信号的语音分值，其中，语音分值用于表示语音信息的特征与参考音频信号的语音特征的相似度。

回声消除的测试装置根据比对结果能够确定出对应于语音信息的特征与参考音频信号的语音特征的相似程度。即通过语音分值表示该相似程度，相似程度越高，语音分值越大；相似程度越低，语音分值越小。

其中，该每个语音信息的特征可以对应于一个语音分值，最后用所有语音分值的均值表示待测音频信号的语音分值。也可以在进行语音分值的计算中，综合考虑每个语音信息的特征在待测音频信号中的比重，即可以用不同的权值表示不同的语音信息特征的比重。

对于单讲或双讲，语音分值S₂采用如下公式计算：

即，依次计算每个语音信息的特征与其对应的权值的乘积，再对所有乘积求和后除以权值和得到加权平均值，即可计算出语音分值S₂。

步骤S26，检测待测音频信号的能量分布。

回声消除的测试装置在获取待测音频信号之后，检测出其能量分布。其中，能量用dB表示，能量分布是通过计算获得每个PCM采样点的dB值，从而在时间轴上的获得声音的能量分布变化趋势。低频部分包含的能量大，高频部分包含的能量小。

步骤S27，根据能量分布确定出待测音频信号的能量分值。

回声消除的测试装置对能量分布进行计算分析，就能够得到声音的时长(语音的采样点总数与采样率的比值)、音量、间隔(相邻语音头和尾间的采样点总数与采样率的比值)等数据。

通过对上述数据进行分析，即可确定出待测音频信号的能量分值。例如，可以在回声消除的测试装置中预先存储对应于上述声音数据的分值表，对应于不同的数值范围，相应的分值不同；因此，在计算出具体的数值之后，通过查找分值表，即可获知对应的分值。

也可以通过对上述声音数据进行归一化处理，使其符合同一评价标准，计算出的分值是在同一标准下得出的。

步骤S28，利用能量分值和语音分值计算得到待测设备的回声消除质量分值。

回声消除的测试装置对计算得出的能量分值以及语音分值进行综合分析计算，可以得到待测设备的回声消除质量分值。

例如，可以将能量分值与语音分值累加，得到对应的回声消除质量分值；也可以将能量分值与语音分值计算平均值，得到对应的回声消除质量分值；也可以在能量分值的计算过程中引入与语音分值的计算相同的权值，即在能量分值的计算中综合引入权值，最后得出回声消除质量分值。

需要说明的是，步骤S22至步骤S25，与步骤S26至步骤S27可以同时进行，也可以在步骤S22至步骤S25执行完成之后，再执行步骤S26至步骤S27；或者，在步骤S26至步骤S27执行完成之后，再执行步骤S22至步骤S25。总之，只需保证在计算待测设备的回声消除质量分值时，语音分值以及能量分值已经计算完成。

此外，本实施例中，所有权值的设置可以根据实际使用情况进行相应的调整。

实施例3

本实施例提供一种回声消除的测试方法，可用于回声消除的测试装置中。如图3所示，该方法包括以下步骤：

步骤S31，获取待测音频信号，待测音频信号为由经过待测设备进行回声消除处理后的音频信号。

与实施例2步骤S21相同，在此不再赘述。

步骤S32，对待测音频信号进行语音识别，以获取待测音频信号中的语音信息。

与实施例2步骤S22相同，在此不再赘述。

步骤S33，提取语音信息的特征。

与实施例2步骤S23相同，在此不再赘述。

步骤S34，将语音信息的特征与参考音频信号的语音特征进行比对。

与实施例2步骤S24相同，在此不再赘述。

步骤S35，根据比对结果确定待测音频信号的语音分值，其中，语音分值用于表示语音信息的特征与参考音频信号的语音特征的相似度。

与实施例2步骤S25相同，在此不再赘述。

步骤S36，检测待测音频信号的能量分布。

与实施例2步骤S26相同，在此不再赘述。

步骤S37，根据能量分布确定出待测音频信号的能量分值。

回声消除的测试装置从能量分布中提取出音量特征，并计算相应的音量特征对应的第一评分值，再对第一评分值进行计算后得到能量分值。具体地，步骤S37包括以下步骤：

步骤S371，根据能量分布提取音量特征。

其中，音量特征包括：残留声音的位置、残留声音的长度、残留声音的音量大小、音量损失程度、语句的流畅度、语句的音量平滑度等等。

需要说明的是，对于不同的音频通话场景(单讲或双讲)，所提取的音量特征的个数可以相同，也可以不同。在下文的描述中，对应于单讲与双讲，以相同个数的音量特征为例进行详细描述。

步骤S372，确定音量特征对应的第一评分值。

回声消除的测试装置通过提取能量分布中的残余声音，对残余声音进行量化后得到上述音量特征的具体数值。

其中，各音量特征对应的第一评分值的计算与实施例2中各语音信息的特征对应的第二评分值的计算相同，在此不再赘述。

步骤S373，根据第一评分值计算得到能量分值。

其中，可以采用如下公式计算能量分值：

步骤S38，利用能量分值和语音分值计算得到待测设备的回声消除质量分值。

在回声消除的测试装置获得能量分值与语音分值之后，可以根据上述两个分值，计算该待测设备的回声消除质量分值。具体地，采用如下公式计算：

上述关于回声消除质量分值的计算公式中，f_S1和f_S2的具体取值，取决于在回声消除的测试方法中，能量分布与语音识别的所占比重的大小。例如，语音识别在该测试方法中所占比重较大，则设置f_S2＞f_S1。

未在本实施例中详细描述的细节，请参照实施例1与实施例2，在此不再赘述。

实施例4

本实施例提供一种回声消除的测试方法的具体应用实例，可用于回声消除的测试装置中。其中，本实施例中的搭建的音频通信环境的测试系统如图4所示。

具体实施方式为：在被测系统的信源端和AEC端之间建立一个音频通信，然后使用测试装置向被测系统播放声音，取代麦克风或其它声音采集设备将声音输出至信源端的Audio_In端口1；同时从AEC端的Audio_Out端口2采集AEC端播放的声音；然后，测试装置将采集到的声音与模拟AEC端说话的声音进行延时、混音，并将混音后的声音播放至AEC端的Audio_In端口3；同时，消除测试装置从信源端的Audio_Out端口4采集声音。

测试装置将从信源端的Audio_Out端口4采集到的声音进行降噪处理，计算处理后声音的能量分布，以及进行语音识别，获取声音中的语音信息。最后根据声音的能量分布和语音信息评估被测设备的AEC质量。

该测试装置支持XLR、TRS、Line、HDMI等多种支持音频的接口，可以播放或者采集PCM、WAV、MP4、MP3等多种音频格式。此外，其支持实时的声音延时控制和多路声音的混音。

具体测试过程如下：首先使用测试设备中的语音识别模块获取参考音频信号的语句序列；使用延时计算模块计算待测音频信号的声音延时；使用采集模块采集待测音频信号；使用声音降噪模块降低待测音频信号中的噪声；使用声音能量检测模块获取降噪后的声音能量分布，通过声音能量分布能够对单讲AEC失效时的残留声音的音量大小、长度、语音位置进行分析、量化；对双讲AEC后声音的音量损失程度、语句的流畅度、语句的音量平滑度进行分析、量化；使用语音识别模块对降噪后的声音数据进行语音识别，获取AEC后声音中的文字，通过识别后的文字内容、文字个数、句子完整度对单讲AEC失效时的语句残留内容进行量化，对双讲AEC后语音的完整度进行量化；根据不同权值(连续语句、简短语句的权值不同；双讲AEC中不同双讲场景的权值不同)；通过质量评估模块量化、评估回声消除质量。

其中，利用语音识别模块输出的语句与参考语句进行对比，通过句子个数、文字个数、文字相似度、丢字位置等特征对双讲回声抵消场景下的回声消除质量进行量化。

利用语音识别模块输出的语句获取单讲回声抵消场景下回声中的句子长度、文字个数等特征对单讲回声抵消场景下的回声失效程度进行量化。

此外，该测试设备支持模拟、数字音频接口，可以播放参考声音，包括需要AEC消除的声音和AEC后需要保留的声音，并同时采集AEC端播放的声音和经过AEC后的声音。

本实施例提供了一套整体的测试设备，能够为AEC测试提供稳定、可靠的测试环境，并简化了AEC的测试操作，提升了AEC的测试效率；实现了AEC测试结果的客观量化，为AEC自动化测试提供了可能，大大提高了AEC测试的效率；并能够实现AEC长拷测试的数据收集分析。

实施例5

本实施例提供一种回声消除的测试装置，可用于执行实施例1至实施例4中的回声消除的测试方法。如图5所示，该装置包括：

获取单元51，用于获取待测音频信号，待测音频信号为由经过待测设备进行回声消除处理后的音频信号。

语音识别单元52，用于对待测音频信号的进行语音识别，以获取待测音频信号中的语音信息。

提取单元53，用于提取语音信息的特征。

比对单元54，用于将语音信息的特征与参考音频信号的语音特征进行比对。

第一确定单元55，用于根据比对结果确定待测音频信号的语音分值，其中，语音分值用于表示语音信息的特征与参考音频信号的语音特征的相似度。

第一计算单元56，用于利用语音分值计算得到待测设备的回声消除质量分值。

通过提取待测音频信号中的语音信息的特征，将该语音信息的特征与参考音频信号的语音特征进行比对，确定待测设备的回声消除质量分值。该装置是基于待测音频中的语音信息的特征进行回声消除质量的评价，能够避免多场景下不同语境环境对待测音频信号的影响，具有较高的灵活性；且语音信息的评价在于回声消除后的语音可懂度和回声消除失效后的语音残留程度，能够提高回声消除的测试效果，以及可信度，使得客观评价的结果更能够符合人的主观评价。

作为本实施例的一种可选实施方式，如图6所示，该装置还包括：

检测单元57，用于检测待测音频信号的能量分布。

第二确定单元58，用于根据能量分布确定出待测音频信号的能量分值。

第二计算单元59，用于利用能量分值和语音分值计算得到待测设备的回声消除质量分值。

实施例6

图7是本发明实施例提供的测试设备的硬件结构示意图，如图7所示，该设备包括一个或多个处理器61以及存储器62，图7中以一个处理器61为例。

测试设备还可以包括：音频图像显示器(未示出)，用于显示音频的能量分布图像。处理器61、存储器62和音频图像显示器可以通过总线或者其他方式连接，图7中以通过总线连接为例。

处理器61可以为中央处理器(Central Processing Unit，CPU)。处理器61还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器62作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本申请实施例中的回声消除的测试方法对应的程序指令/模块。处理器61通过运行存储在存储器62中的非暂态软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述实施例中，回声消除测试的测试方法。

存储器62可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据回声消除的测试装置的使用所创建的数据等。此外，存储器62可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器62可选包括相对于处理器61远程设置的存储器，这些远程存储器可以通过网络连接至回声消除的测试装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器62中，当被所述一个或者多个处理器61执行时，执行实施例1至实施例4中回声消除的测试方法。

上述产品可执行本发明实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，具体可参见实施例1至实施例4中的相关描述。

实施例7

本发明实施例还提供了一种非暂态计算机存储介质，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述回声消除的测试方法实施例中的处理方法。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种回声消除的测试方法，其特征在于，包括以下步骤：

提取所述语音信息的特征；

2.根据权利要求1所述的测试方法，其特征在于，还包括：

检测所述待测音频信号的能量分布；

根据所述能量分布确定出所述待测音频信号的能量分值；

3.根据权利要求2所述的测试方法，其特征在于，根据所述能量分布确定出所述待测音频信号的能量分值包括：

确定所述音量特征对应的第一评分值；

根据所述第一评分值计算得到所述能量分值。

4.根据权利要求3所述的测试方法，其特征在于，所述根据所述第一评分值计算得到所述能量分值，采用如下公式计算：

<mrow> <msub> <mi>S</mi> <mn>1</mn> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>A</mi> <mrow> <mn>1</mn> <mi>i</mi> </mrow> </msub> <mo>&times;</mo> <msub> <mi>f</mi> <mrow> <mn>1</mn> <mi>i</mi> </mrow> </msub> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>f</mi> <mrow> <mn>1</mn> <mi>i</mi> </mrow> </msub> </mrow> </mfrac> <mo>;</mo> </mrow>

5.根据权利要求1所述的测试方法，其特征在于，提取得到所述语音信息的特征包括：语音内容、语音文字个数。

6.根据权利要求5所述的测试方法，其特征在于，所述根据比对结果确定所述待测音频信号的语音分值，采用如下公式计算：

<mrow> <msub> <mi>S</mi> <mn>2</mn> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>A</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>&times;</mo> <msub> <mi>f</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>f</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> </mrow> </mfrac> <mo>;</mo> </mrow>

7.根据权利要求2至6中任一项所述的测试方法，其特征在于，所述利用所述能量分值和所述语音分值计算得到所述待测设备的回声消除质量分值，采用如下公式计算：

<mrow> <mi>S</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>S</mi> <mn>1</mn> </msub> <mo>&times;</mo> <msub> <mi>f</mi> <mrow> <mi>S</mi> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>S</mi> <mn>2</mn> </msub> <mo>&times;</mo> <msub> <mi>f</mi> <mrow> <mi>S</mi> <mn>2</mn> </mrow> </msub> </mrow> <mrow> <msub> <mi>f</mi> <mrow> <mi>S</mi> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>f</mi> <mrow> <mi>S</mi> <mn>2</mn> </mrow> </msub> </mrow> </mfrac> <mo>;</mo> </mrow>

8.一种回声消除的测试装置，其特征在于，包括：

提取单元，用于提取所述语音信息的特征；

9.一种测试设备，其特征在于，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求1至7中任一项所述的回声消除的测试方法。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行权利要求1至7中任一项所述的回声消除的测试方法。