CN104851423B

CN104851423B - 一种声音信息处理方法及装置

Info

Publication number: CN104851423B
Application number: CN201410056789.2A
Authority: CN
Inventors: 张笑为; 纪大为
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2014-02-19
Filing date: 2014-02-19
Publication date: 2021-04-13
Anticipated expiration: 2034-02-19
Also published as: CN104851423A

Abstract

本发明公开了一种声音信息处理方法和装置，解决了不能从实质上消除无关声音对通话的干扰，从而导致通话质量不高的技术问题，声音信息方法包括：所述第一电子设备根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息；对所述第一声音信息进行处理，确定所述第一声音信息包括M个子声音信息，M为大于等于1的正整数；将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数。

Description

一种声音信息处理方法及装置

技术领域

本发明涉及电子技术领域，尤其涉及一种声音信息处理方法及装置。

背景技术

随着通信技术的发展，通过电子设备的语音通话越来越方便，可以实现多人通话，传输语音消息，电话会议等等，但是在通话或录制语音消息过程中，可能会存在有我们不希望传进通话中的说话声。比如，在家参与公司电话会议时，家里的电视，小孩等无关声音会传输给对端电子设备，对端电子设备也会传输无关声音，在这种情况下，声音参入到电话会议，使通话受到干扰。

现有技术仅仅从降噪的方面提高通话质量，或者在通话中通过人为不断在静音与非静音之间切换的方式减少无关声音掺入通话声音中的可能性，或者选择安静的环境，但是这并不能从实质上消除无关声音对通话的干扰，从而导致现有技术通话质量不高。

发明内容

本发明实施例提供一种声音信息处理方法及装置，解决了现有技术中不能从实质上消除无关声音对通话的干扰，从而导致通话质量不高的技术问题。

第一方面，提供了一种声音信息处理方法，应用于第一电子设备，所述方法包括：

所述第一电子设备根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息；

对所述第一声音信息进行处理，确定所述第一声音信息包括M个子声音信息，M为大于等于1的正整数；

将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数。

可选的，在所述将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配之前，所述方法还包括：

获取至少一个声音信息，提取所述至少一个声音信息的声音特征参数形成所述至少一个预设声音信息。

可选的，提取所述至少一个声音信息的声音特征形成所述至少一个预设声音信息，进一步包括：

将所述声音特征参数与所述第一电子设备中的声音信息库进行匹配，确定出与所述至少一个声音信息匹配的用户标识并与联系人列表相关联。

可选的，所述声音信息库中的声音特征，具体为：

在所述第一电子设备与第二电子设备处于通讯状态时，所述第一电子设备获取由所述第二电子设备发送的传输声音信息，提取出所述传输声音信息的声音特征参数与所述第二电子设备的用户标识关联存储而形成的声音特征参数。

可选的，在所述将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配之后，所述方法还包括：

获得所述M个子声音信息中与所述至少一个预设声音信息不匹配的Q个子声音信息，Q为小于M的正整数；

将所述Q个子声音信息与所述声音信息库中的声音信息进行声音特征匹配，获得所述Q个子声音信息中不匹配的K个子声音信息，K为小于等于Q的正整数；

将所述K个子声音信息与K个联系人进行关联，获得K个关联；

将所述K个关联存储到所述声音信息库，以更新所述声音信息库，k为小于等于Q的正整数。

可选的，所述第一电子设备根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息，具体为：

在所述第一电子设备与对端电子设备处于通话状态时，开启所述声音采集模块，采集当前范围内的第一声音信息，和/或

在所述第一电子设备获得用于生成语音消息的控制操作时，开启所述声音采集模块，采集当前范围内的第一声音信息。

第二方面，本发明实施例还提供了一种装置，应用于第一电子设备，所述装置包括：

采集单元，用于根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息；

确定单元，用于对所述第一声音信息进行处理，确定所述第一声音信息包括M个子声音信息，M为大于等于1的正整数；

第一匹配单元，用于将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数。

可选的，所述装置还包括：

获取单元，用于获取至少一个声音信息，提取所述至少一个声音信息的声音特征参数形成所述至少一个预设声音信息。

可选的，所述获取单元具体用于：

可选的，所述声音信息库中的声音特征，具体为：

可选的，所述装置还包括：

获得单元，用于获得所述M个子声音信息中与所述至少一个预设声音信息不匹配的Q个子声音信息，Q为小于M的正整数；

第二匹配单元，用于将所述Q个子声音信息与所述声音信息库中的声音信息进行声音特征匹配，获得所述Q个子声音信息中不匹配的K个子声音信息，K为小于等于Q的正整数；

关联单元，用于将所述K个子声音信息与K个联系人进行关联，获得K个关联；

更新单元，用于将所述K个关联存储到所述声音信息库，以更新所述声音信息库，k为小于等于Q的正整数。

可选的，采集单元具体为：

通话采集单元，用于在所述第一电子设备与对端电子设备处于通话状态时，开启所述声音采集模块，采集当前范围内的第一声音信息，和/或

语音消息采集单元，用于在所述第一电子设备获得用于生成语音消息的控制操作时，开启所述声音采集模块，采集当前范围内的第一声音信息。

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

本发明实施例中的技术方案在开启声音采集模块，采集当前范围内的语音（比如通话的话筒处于持续采集状态或录制一段语音消息）后，对采集的第一声音信息进行处理，确定第一声音信息包括M个子声音信息后，只将与预设声音信息的声音特征匹配的子声音信息传输给对端电子设备，因此能够保证传输给对端电子设备的声音为需要传输的声音，能够消除现有技术中通话质量不高的技术问题，从而能够有效的消除通话中的干扰声音，方便用户在各种环境中都能保证通话质量。

附图说明

图1为本发明实施例中的声音信息处理方法的流程图；

图2为本发明实施例中的装置的模块图。

具体实施方式

本发明通过本发明实施例提供了一种声音信息处理方法及装置，解决了现有技术中不能从实质上消除无关声音对通话的干扰，从而导致通话质量不高的技术问题。

本申请实施例中的技术方案为减缓上述用判断通话请求重要性的信息量小的问题，总体思路如下：

所述第一电子设备根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息；对所述第一声音信息进行处理，确定所述第一声音信息包括M个子声音信息，M为大于等于1的正整数；将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数。

只将与预设声音信息的声音特征匹配的子声音信息传输给对端电子设备，因此能够保证传输的给对端电子设备的声音为需要传输的声音。能够消除现有技术中通话质量不高的技术问题，从而能够有效的除去通话中的干扰声音，方便用户在各种环境中都能保持通话质量。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本发明一实施例提供了一种声音信息处理方法，应用于第一电子设备，第一电子设备为可以与对端电子设备通信的电子设备，比如手机，PDA(个人数字助理)，笔记本电脑，台式电脑等等，因此本发明不限定第一电子设备具体为何种电子设备。

参考图1所示，图1为本发明实施例中的声音信息处理方法的流程图，该声音信息处理方法包括如下步骤：

S101、第一电子设备根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息；

在S101中，第一指令可以为对端电子设备与第一电子设备进行语音类通信时，比如，电话请求，QQ语音请求，QQ视频请求时，请求被接受时生成的开启声音采集模块的指令，在这种实施场景下，第一声音信息具体为持续采集对端电子设备与第一电子设备处于通话状态下的声音信息。

第一指令也可以为第一电子设备获得用于生成语音消息的控制操作时，第一电子设备在控制操作下开启声音采集模块，当在这种实施场景下，第一声音信息具体为录制的一段语音消息。

S102、对第一声音信息进行处理，确定第一声音信息包括M个子声音信息，M为大于等于1的正整数。

可选的，对第一声音信息进行处理的实施方式为对第一声音信息进行声纹识别，识别出第一声音信息中包括的不同个体的声音信息，比如在录制一段5分钟的语音消息的过程中有多个个体产生声音，在语音消息录制完成后，对第一声音信息进行声纹识别，确定出第一声音信息中包括A个体，B个体以及C个体三个子声音信息，其中，在声纹识别过程中，由于说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征，而且语音采集装置造价低廉，只需电话/手机或麦克风即可，无需特殊的设备；且声纹与说话语言无关，与方言腔调无关，不涉及隐私问题，能够准确的识别出不同个体的声音信息，因此选择声纹识别方式能使后述与至少一个预设声音信息进行匹配时匹配结果更准确。

根据声纹识别对第一信息进行处理的过程包括：声音信号处理和声纹特征提取，以确定第一声音信息中包括的子声音信息，在声纹识别中最常用的是宽带声纹图，宽带声纹图是用带宽为300HZ的带通滤波器分析出来的声纹。宽带声纹图的横坐标为时间，纵坐标为频率，浓淡表示音强。每一字的声纹前部是清辅音的频谱，后部是元音频谱；元音频谱中由加强的纵线条构成的水平方向的黑带为共振峰，共振峰的数量、走向及其频率是声纹分析的重要特征，当然，也可以使用窄带声纹图等等。

在具体实施过程中，对第一声音信息的处理以确定第一声音信息包括M个子声音信息的实施方式还可以为，比如，波形识别。

S103、将M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输N个子声音信息，其中N为大于等于1且为小于等于M的正整数。

在S103中，声音特征匹配可以为声纹匹配，也可以为波形匹配等，因此，在本发明中具体使用何种声音特征匹配方式在此不进行限定。一个子声音信息为一个个体的声音信息，子声音信息可以为一个个体的声纹信息，波形信息等。

至少一个预设声音信息可以设定为需要传输的子声音信息，相反的也可以为禁止传输的子声音信息。进一步，在具体实施过程中，至少一个预设声音信息可以通过如下方式获得：首先，获取至少一个声音信息，提取至少一个声音信息的声音特征参数形成所述至少一个预设声音信息，提取的声音特征参数可以为声纹特征参数，也可以为声音波形参数等等。

具体的，以至少一个预设声音信息为需要传输的子声音信息为例，至少一个预设声音信息可以为预定义的第一电子设备对应用户的声音特征参数，也可以为用户选择的多个用户的声音特征参数。

下面对两种实施方式下确定出需要传输的N子声音信息的实施方式进行解释说明。

第一种实施方式：

当至少一个预设声音信息预定义为第一电子设备对应用户的声音特征参数时，在录制声音信息或与对端电子设备处于通话状态之前获取的第一电子设备对应用户的声音信息，并从中获取第一电子设备对应用户的声音特征参数形成预设声音信息。将M个子声音信息与第一电子设备对应用户的声音特征参数进行声音特征匹配，以使在S103中匹配结果为第一电子设备对应用户的子声音信息并传输给对端电子设备。比如，第一声音信息为录制的一段语音消息，其中，这段语音消息包括第一电子设备对应用户的子声音信息，还包括在录制过程中，旁边其他用户的间断性的声音信息，即不属于第一电子设备对应用户的子声音信息，因此，匹配结果为与第一电子设备对应用户的声音特征匹配的子声音信息传输给对端电子设备，而旁边其他用户的间断性声音信息的声音特征由于与第一电子设备对应用户的声音特征不匹配，因此不进行传输或进行消音处理。

第二种实施方式：

当至少一个预设声音信息为用户选择的多个用户的声音特征参数时，则在这种实施方式下，第一电子设备包括一声音信息库，在提取至少一个声音信息的声音特征形成至少一个声音信息后，将提取的声音特征参数与第一电子设备中的声音信息库声音特征参数进行匹配，确定出与至少一个声音信息匹配的用户标识，并与联系人列表关联，以使能向用户呈现可以屏蔽的联系人列表。

具体来讲，至少一个声音信息可以为第一声音信息，也可以为在采集第一声音信息之前采集的声音信息，假如至少一个声音信息为包括第一电子设备对应用户的声音信息，以及其他用户“小王”和“小李”的声音信息，获取该至少一个声音信息后，提取第一电子设备对应用户的声音特征参数，以及“小王”的声音特征参数和“小李”的声音特征参数，均与第一电子设备中的声音信息库进行匹配，确定出三个声音特征参数对应的用户标识并与联系人列表相关联，向用户呈现的列表为“本人”“小王”，“小李”，因此，可以使用户从呈现的列表中选择需要屏蔽或需要传输的用户声音信息，比如，通过用户的选择结果确定需要传输的用户声音信息为“本人”和“小王”的声音信息，因此，确定出至少一个预设声音信息为“本人”和“小王”的声音特征参数。

进一步，在第二种实施方式下，第一电子设备包括的声音信息库中的声音特征具体为：在第一电子设备与对端电子设备处于通讯状态时，第一电子设备获取由第二电子设备发送的传输声音信息，提取出传输声音信息的声音特征参数与第二电子设备的用户标识关联存储而形成的声音特征参数。

比如，在第一电子设备与联系人列表中“小刘”处于通话状态时，获取对端电子设备的发送的传输声音信息，提取传输声音信息中的声音特征参数与用户标识“小刘”关联存储，形成声音信息库中的一个声音特征参数。从而可以通过这种实施方式获取联系人列表中的每一个用户的声音特征参数，从而实现自动更新声音信息库，方便快捷。

当然，在具体实施过程中，也可以手动录制并与用户标识关联存储的方式增加声音信息库中的声音特征参数。

进一步，在第二种实施方式下的执行S103之后，因为M个子声音信息中一部分声音信息与至少一个预设声音信息不匹配是可能是因为声音信息库中不存在这部分声音信息，但是这部分信息为需要传输或需要禁止传输的声音信息。因此，需要在当前对声音信息库进行更新，以使能够使至少一个预设声音信息满足用户需求，也可以更方便的更新声音信息库中的声音特征参数。

具体实施方式为：获得M个子声音信息中与至少一个预设声音信息不匹配的Q个子声音信息，Q为小于M的正整数；将Q个子声音信息与声音信息库中的声音信息进行声音特征匹配，获得Q个子声音信息中不匹配的K个子声音信息，K为小于等于Q的正整数；将K个子声音信息与K个联系人进行关联，获得K个关联；将K个关联存储到声音信息库，以更新声音信息库，k为小于等于Q的正整数。

比如，在将M个子声音信息与之前的至少一个预设声音信息部匹配的声音信息与声音信息库进行匹配后，以第一显示方式向用户呈现出从声音信息库匹配到的结果，以及以与第一显示方式不同的第二显示方式向用户呈现M个子声音信息中不能从声音信息库匹配中匹配成功的K个子声音信息。其中，第一显示方式为显示用户标识，第二显示方式可以为以提示信息的方式提示存在没有匹配成功的K个子声音信息，用户可以选择分别试听匹配不成功的K个子声音信息确定这K个子声音信息的发音用户，则可以根据用户的手动操作与K个联系人关联存储。进一步，在将K个子声音信息与K个联系人关联存储之后。可以更新以第一显示方式向用户呈现出从声音信息库匹配到的结果。比如，之前以第一显示方式呈现的匹配结果为“本人”，“小王”，以及第二显示方式呈现“匹配失败子声音”，在将“匹配失败子声音”与“小张”关联或，以第一显示方式呈现的匹配结果为“本人”，“小王”“小张”。由此，可以更加满足用户需求，使预设声音信息更准确，声音信息库更完善。

基于同一发明构思，本发明实施例提供了一种装置，该装置可以应用于第一电子设备，第一电子设备为可以与对端电子设备通信的电子设备，比如手机，PDA(个人数字助理)，笔记本电脑，台式电脑等等，因此本发明不限定第一电子设备具体为何种电子设备。

参考图2所示，该装置包括如下结构：

采集单元201，用于根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息；

确定单元202，用于对所述第一声音信息进行处理，确定所述第一声音信息包括M个子声音信息，M为大于等于1的正整数；

第一匹配单元203，用于将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数。

进一步，在具体实施过程中，该装置还包括：

具体的，所述获取单元具体用于：

在具体实施过程中，所述声音信息库中的声音特征，具体为：

进一步，在具体实施过程中，所述装置还包括：

在具体实施过程中，采集单元201具体为：

本实施例中的电子设备与前述声音信息处理方法是基于同一发明构思下的两个方面，在前面已经对方法的实施过程作了详细的描述，所以本领域技术人员可根据前述描述清楚的了解本实施例中的电子设备的结构及实施过程，为了说明书的简洁，在此就不再赘述了。

上述本申请实施例中的技术方案，至少具有如下的技术效果或优点：

具体来讲，本申请实施例中的声音信息处理方法对应的计算机程序指令可以被存储在光盘，硬盘，U盘等存储介质上，当存储介质中的与声音信息处理方法对应的计算机程序指令被一电子设备读取或被执行时，包括如下步骤：

可选的，所述声音信息库中的声音特征，具体为：

将所述K个子声音信息与K个联系人进行关联，获得K个关联；

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种声音信息处理方法，应用于第一电子设备，所述方法包括：

将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配；当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数；

其中，在所述将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配之后，获得所述M个子声音信息中与所述至少一个预设声音信息不匹配的Q个子声音信息，Q为小于M的正整数；

将所述Q个子声音信息与声音信息库中的声音信息进行声音特征匹配，获得所述Q个子声音信息中不匹配的K个子声音信息，K为小于等于Q的正整数；

将所述K个子声音信息与K个联系人进行关联，获得K个关联；

2.如权利要求1所述的方法，其特征在于，在所述将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配之前，所述方法还包括：

3.如权利要求2所述的方法，其特征在于，提取所述至少一个声音信息的声音特征形成所述至少一个预设声音信息，进一步包括：

4.如权利要求3所述的方法，其特征在于，所述声音信息库中的声音特征，具体为：

5.如权利要求1-4中任一权项所述的方法，其特征在于，所述第一电子设备根据接收到的第一指令开启声音采集模块，采集当前范围内的第一声音信息，具体为：

6.一种声音信息处理装置，应用于第一电子设备，所述装置包括：

第一匹配单元，用于将所述M个子声音信息与至少一个预设声音信息进行声音特征匹配，当匹配结果为N个子声音信息时，传输所述N个子声音信息，其中N为大于等于1且为小于等于M的正整数；

第二匹配单元，用于将所述Q个子声音信息与声音信息库中的声音信息进行声音特征匹配，获得所述Q个子声音信息中不匹配的K个子声音信息，K为小于等于Q的正整数；

7.如权利要求6所述的装置，其特征在于，所述装置还包括：

8.如权利要求7所述的装置，其特征在于，所述获取单元具体用于：

9.如权利要求8所述的装置，其特征在于，所述声音信息库中的声音特征，具体为：

10.如权利要求6-9中任一权项所述的装置，其特征在于，采集单元具体为：