CN107171816A

CN107171816A - 电话会议中的数据处理方法及装置

Info

Publication number: CN107171816A
Application number: CN201710476792.3A
Authority: CN
Inventors: 陈翔
Original assignee: Goertek Techology Co Ltd
Current assignee: Goertek Techology Co Ltd
Priority date: 2017-06-21
Filing date: 2017-06-21
Publication date: 2017-09-15

Abstract

本发明公开了一种电话会议中的数据处理方法及装置，该方法包括：获取第一会议处理设备发送的至少一条语音信息；其中，所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户；识别所述至少一条语音信息的声纹特征；确定分别与所述至少一条语音信息的声纹特征对应的用户标识；发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备，以供所述第二会议处理设备输出任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。本发明中保障了及时有效地分辨出不同发言用户的语音信息。

Description

电话会议中的数据处理方法及装置

技术领域

本发明属于通信技术领域，具体地说，涉及一种电话会议中的数据处理方法及装置。

背景技术

电话会议是一种普遍使用的远程会议方式，电话会议可以实现不同地点的会议人员参与会议的目的。

但是，当同一个会议室中，不同的发言用户同时发言时，位于另一会议室的与会人员并不能及时有效地分辨该会议室中不同的发言用户的发言内容。

发明内容

有鉴于此，本发明提供了一种电话会议中的数据处理方法及装置，用以解决现有技术中无法有效分辨发言的不同用户的技术问题。

为了解决上述技术问题，本发明的第一方面，提供一种电话会议中的数据处理方法，所述方法包括：

获取第一会议处理设备发送的至少一条语音信息；其中，所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户；

识别所述至少一条语音信息的声纹特征；

确定分别与所述至少一条语音信息的声纹特征对应的用户标识；

发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备，以供所述第二会议处理设备输出任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

优选地，所述发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备包括：

发送所述至少一条语音信息至第二会议处理设备，以供所述第二会议处理设备输出所述至少一条语音信息；

接收到所述第二会议处理设备针对任一语音信息的标识获取请求时，发送所述任一语音信息对应的用户标识至所述第二会议处理设备，以供所述第二会议处理设备输出所述任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

优选地，所述确定分别与所述至少一条语音信息的声纹特征对应的用户标识之后，所述方法还包括：

将每一条语音信息的语音标识与其对应的用户标识保存至映射表中；

所述接收到所述第二会议处理设备针对任一语音信息的标识获取请求时，发送所述任一语音信息对应的用户标识至所述第二会议处理设备包括：

接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时，根据所述任一语音信息的语音标识查找所述映射表，确定所述任一语音信息对应的用户标识；

发送所述任一语音信息对应的用户标识至所述第二会议处理设备。

本发明的第二方面提供一种电话会议中的数据处理方法，所述方法包括：

接收至少一条语音信息及其对应的用户标识；其中，所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户，所述用户标识为服务器识别所述至少一条语音信息的声纹特征，并对应所述至少一条语音信息的声纹特征查找获得。

输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识。

优选地，所述接收至少一条语音信息及其对应的用户标识包括：

接收所述至少一条语音信息；发送针对任一条语音信息的标识获取请求至服务端；

接收所述服务端发送的所述任一条语音信息对应的用户标识。

优选地，所述输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识包括：

在不同扬声器中输出不同语音信息；

在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。

本发明的第三方面提供一种电话会议中的数据处理装置，所述装置包括：

第一获取模块，用于获取第一会议处理设备发送的至少一条语音信息；其中，所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户；

第一识别模块，用于识别所述至少一条语音信息的声纹特征；

第一确定模块，用于确定分别与所述至少一条语音信息的声纹特征对应的用户标识；

第一发送模块，用于发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备，以供所述第二会议处理设备输出任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

优选地，所述第一发送模块包括：

第一发送单元，用于发送所述至少一条语音信息至第二会议处理设备，以供所述第二会议处理设备输出所述至少一条语音信息；

第二发送单元，用于接收到所述第二会议处理设备针对任一语音信息的标识获取请求时，发送所述任一语音信息对应的用户标识至所述第二会议处理设备，以供所述第二会议处理设备输出所述任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

优选地，所述装置还包括：

第一映射模块，用于将每一条语音信息的语音标识与其对应的用户标识保存至映射表中；

所述第二发送单元包括：

查找子单元，用于接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时，根据所述任一语音信息的语音标识查找所述映射表，确定所述任一语音信息对应的用户标识；

发送子单元，用于发送所述任一语音信息对应的用户标识至所述第二会议处理设备。

本发明的第四方面提供一种电话会议中的数据处理装置，所述装置包括：

第一接收模块，用于接收至少一条语音信息及其对应的用户标识；其中所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户，所述用户标识为服务器识别所述至少一条语音信息的声纹特征，并对应所述至少一条语音信息的声纹特征查找获得。

第一输出模块，用于输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识。

优选地，所述第一接收模块包括：

第一接收单元，用于接收所述至少一条语音信息；

第三发送单元，用于发送针对任一条语音信息的标识获取请求至服务端；

第二接收单元，用于接收所述服务端发送的所述任一条语音信息对应的用户标识。

优选地，所述第一输出模块包括：

第一输出单元，用于在不同扬声器中输出不同语音信息；

第二输出单元，用于在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。

本发明中，第一会议室中的第一会议处理设备可以采集至少一条语音信息，进行分离后，发送至服务端。服务端接收已分离的至少一条语音信息，可以识别所述至少一条语音信息的声纹特征，以分别确定与所述至少一条语音信息的声纹特征对应的用户标识。每一条语音信息对应一个用户，进而获得声纹特征对应的用户标识后，可以利用该用户标识来标识对应语音信息的用户身份。在发送所述至少一条语音信息及其对应的用户标识至第二会议室中的第二会议处理设备之后，第二会议处理设备可以根据每一条语音信息的声纹特征确定其用户标识，进而可以将任一用户的语音信息以及对应的用户标识在第二会议室中显示，第二会议室中的与会人员即可以确定语音信息的用户的身份，实现了用户身份与语音信息的统一显示，可以有效分辨发言的不同用户。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种电话会议中的数据处理方法的一个实施例的流程图；

图2是本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图；

图3是本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图；

图4是本发明实施例的一种电话会议中的数据处理装置的一个实施例的结构示意图；

图5是本发明实施例的一种电话会议中的数据处理装置的又一个实施例的结构示意图；

图6是本发明实施例的一种电话会议中的数据处理装置的又一个实施例的结构示意图；

图7是本申请实施例的一种电话会议中的数据处理系统的一个实施例的结构示意图。

具体实施方式

以下将配合附图及实施例来详细说明本发明的实施方式，藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。

本发明实施例主要应用于电话会议场景中，所述电话会议场景具体可以是实际的存在两个及以上数量的会议室。

在电话会议场景中，通常存在两个及以上数量的会议室，当一个会议室的与会人员发言时，其他会议室的与会人员并不能确定该发言用户的身份。尤其在一个会议室中，存在多个发言用户时，其他会议是的与会人员在确定发言用户的身份时可能存在更多困难。在这种情形下，其他与会人员如不能及时确定至少一个发言用户的身份时，会造成其他会议室中的与会人员不能及时有效地分辨不同发言用户的发言内容。为了解决以上问题，发明人提出了本发明的技术方案。

本发明实施例中，在第一会议室中的至少一个用户发言时，第一会议室中的第一会议处理设备可以采集所述至少一个用户的语音信息，并将采集的语音信息进行分离后发送至服务器。服务器在接收到分离的至少一个用户的语音信息之后，可以识别出所述至少一个用户的声纹特征，并确定出分别与所述至少一条语音信息的声纹特征对应的用户标识，进而用户标识可以用于标识用户的语音信息。之后，服务器再将所述至少一条语音信息以及其对应的用户标识发送至第二会议室中的第二会议处理设备，此时，第二处理设备即可以输出任一条语音信息，并对应输出任一条语音信息的用户标识。由此第二会议室中的与会人员即可以确知每一条语音信息的发言用户，进而可以及时有效分辨出任一发言用户的发言内容，保障了有效发言。

如图1所示为本发明实施例的一种电话会议中的数据处理方法的一个实施例的流程图，该方法可以包括以下几个步骤：

101：获取第一会议处理设备发送的至少一条语音信息。

其中，所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户。

所述第一会议处理设备可以位于第一会议室中，所述第一会议处理设备可以采集第一会议室中至少一个用户的语音数据。

可选地，所述第一会议处理设备可以包括声源定位器。所述声源定位器可以采集至少一个用户的语音数据，以及获取所述至少一个用户的方向信息。所述声源定位器可以利用麦克风阵列技术将所述至少一个用户的语音数据根据所述至少一个用户的方向信息分离成所述至少一条语音信息。每一条语音信息对应一个用户。

可选地，在分离出每一条语音信息时，可以为每一条语音信息生成一个可以用于表示该语音信息名称的语音标识，用以从形式上区分每一条语音信息。例如，第一条语音信的语音标识可以为V001，第二条语音信息的语音标识可以为V002，该语音标识仅是示意性的，任何能够代表某一条语音信息的名称，用以区别每一条语音信息名称的字串均可。

本发明实施例的方法主要应用于服务器中，可选地，所述服务器可以是普通服务器，也可以是云服务器。所述服务器与所述第一会议处理设备之间通过网络连接，进而可以进行各种数据的传输工作。

102：识别所述至少一条语音信息的声纹特征。

103：确定分别与所述至少一条语音信息的声纹特征对应的用户标识。

每一条语音信息均可以利用声纹识别算法进行声纹识别。

可选地，可以通过声纹识别算法，计算出所述至少一条语音信息的声纹特征。所述声纹识别算法可以包括MFCC(Mel-Frequency Cepstral Coefficients，mel频率倒谱系数)算法、LPC(linear predictive coding,，线性预测编码)算法等。

语音信息的声纹特征可以代表某一条语音信息的内部含义，声纹特征不同时可以代表不同的内容，可以从内容上区分每一条语音信息。

可选地，可以预先建立一个声纹识别库，可以包含所有用户的声纹特征以及对应的用户标识，并且在所述声纹识别库中，声纹特征与用户标识一一对应。在识别出所述至少一条语音信息的声纹特征后，可以将所述至少一条语音信息的声纹特征与所述声纹识别库中的所有声纹特征进行匹配，以获得匹配的声纹特征以及与该匹配的声纹特征对应的用户标识，进而可以确定所述至少一条语音信息对应的用户标识。

104：发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备，以供所述第二会议处理设备输出任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

每一条语音信息与用户标识一一对应，在获取所述至少一条语音信息以及其对应的用户标识后，将其发送至第二会议室中的第二会议处理设备，可以使所述第二会议室中的第二会议处理设备对应输出所述任一条语音信息及其用户标识。

可选地，可以使用扬声器输出所述任一条语音信息，可以使用显示屏对应输出所述任一条语音信息对应的用户标识。所述扬声器与所述显示屏可以一一对应，以使所述显示屏中显示的用户标识与扬声器中播放的语音信息的对应关系更加明确。

本发明实施例中，主要通过服务端执行第一会议室的第一会议处理设备采集的至少一个语音信息的识别工作，确定出至少一个语音信息的用户标识后，可以将语音信息以及其对应的用户标识发送至第二会议的第二会议处理设备中，在第二会议室中将任一条语音信息及其对应的用户标识显示。语音信息与用户标识的对应显示，可以使第二会议室中的用户可以及时有效地分辨出每一条语音信息的发言用户，保障了有效发言。

作为一个实施例，所述发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备可以包括：

发送所述至少一条语音信息至第二会议处理设备，以供所述第二会议处理设备输出所述至少一条语音信息。

可选地，所述标识获取请求可以指针对任一条语音信息的用户标识的获取请求。

第二会议处理设备位于第二会议室中，可以接收服务器发送的所述至少一条语音信息。每一条语音信息均有对应的用户标识。第二会议处理设备接收到所述至少一条语音信息时，并不能确定所述至少一条语音信息与用户标识的对应关系。因此，在第二会议处理设备接收到任一语音信息时，可以发送标识获取请求至服务端。可选地，可以在接收到所述至少一条语音信息时，第二会议处理设备可以生成一条与所述语音信息相关的标识获取请求，以从服务端获取所述语音信息的用户标识。

本发明实施例中，服务端在发送至少一条语音信息至第二会议处理设备后，第二会议处理设备并不及时播放该语音信息，而是先发送针对任一语音信息的标识获取请求，以使服务器确定所述任一语音信息的用户标识，进而可以确保至少一条语音信息在显示时可以同时显示用户标识，可以提高显示的同步性，确保第二会议室中的用户可以及时有效分辨第一会议处理设备发送的每一条语音信息的发言用户，保障了有效发言。

作为又一个实施例，所述确定分别与所述至少一条语音信息的声纹特征对应的用户标识之后，所述方法还可以包括：

将每一条语音信息的语音标识与其对应的用户标识保存至映射表中。

每一条语音信息的语音标识是指可以每一条语音信息的名称，可以从名称上区分每一条语音信息。所述语音标识可以是所述第一会议处理设备在分离出每一条语音信息后，为所述每一条语音信息生成的。一个语音标识可以用于唯一标识一条语音信息。

可选地，所述语音标识可以是所述语音信息的名称，可以通过语音标识查找到对应的语音信息。服务端接收至少一条语音信息时，可以一并接收该语音信息的语音标识。例如，某一条语音信息的名称为0001.MP4，则可以将该条语音信息的语音标识设置为0001。

所述每一条语音信息的用户标识可以用于标识用户的身份，例如该用户标识可以是用户的姓名、用户的职位等信息。当服务端接收到至少一条语音信息时，并不能确定该条语音信息的用户标识，可以识别出每一条语音信息的声纹特征，并根据该声纹特征确定每一条语音信息对应的用户标识。

所述接收到所述第二会议处理设备针对任一语音信息的标识获取请求时，发送所述任一语音信息对应的用户标识至所述第二会议处理设备可以包括：

接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时，根据所述任一语音信息的语音标识查找所述映射表，确定所述任一语音信息对应的用户标识。

服务端向所述第二会议处理设备发送语音信息时，第二会议处理设备可以获取到语音信息的语音标识，例如，当所述语音标识为语音信息的名称时，即可以获取语音信息的名称。第二会议处理设备生成的标识获取请求中即可以包括所述语音标识。所述语音标识可以用于唯一标识某一条语音信息，并在映射表中与所述用户标识建立对应关系。因此，可以通过语音信息的语音标识从所述映射表中查找到与所述语音信息对应的用户标识。

本发明实施例中，服务端在为每一条语音信息的声纹特征生成对应的声纹标识后，将每一条语音信息的语音标识与其对应的用户标识保存至映射表中，在接收到针对任一语音信息的用户标识获取请求时，可以迅速查找到该任一语音信息的用户标识。进而可以提高所述语音信息以及用户标识的显示速度，能够及时有效地分辨出每条语音信息的发言用户，进一步保障了发言的有效性。

如图2所示，为本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图，该方法可以包括以下几个步骤：

201：采集至少一个用户发出的语音数据。

本发明实施例主要应用于第一会议室的第一会议处理设备中。

可选地，第一会议处理设备可以包括声源定位器。该声源定位器可以采集至少一个用户发出的语音数据。所述语音数据被采集时，每一个用户的语音信息均被融合为一条语音数据。所述声源定位器可以采集每一个用户的方位信息，其中所述方位信息可以包括角度信息和距离信息。声源定位器可以利用麦克风阵列技术计算用户的角度和距离，从而实现对用户的跟踪以及后续的语音定向获取，具有较强的抗干扰能力，可以精确捕捉用户的语音信息。

202：将所述语音数据进行语音分离，以获取分别对应至少一个用户的至少一条语音信息。

所述语音数据在采集时包含了多个用户的语音信息，将所述语音数据进行语音分离先是确定出用户的方位信息，再根据用户的方位信息利用麦克风阵列技术将所述语音数据进行分离。其中，所述方位信息可以包括角度信息以及距离信息。

每一用户的发言均被分离成对应的语音信息，所述语音信息即可以与用户相对应。

可选地，在将所述语音数据进行语音分离时，可以为获取到的对应至少一个用户的至少一条语音信息生成至少一个语音标识。每一条语音信息对应一个语音标识。所述语音标识用于标识所述语音信息的名称。

203：发送所述至少一条语音信息至服务器，以供所述服务器确定所述至少一条语音信息的声纹特征对应的用户标识，并发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备输出所述任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

第一会议处理设备发送所述至少一条语音信息至服务器。服务器可以识别所述至少一条语音信息的语音的声纹特征每一用户，并将所述声纹特征与服务器中预先建立的声纹特征库进行匹配，进而可以从声纹特征库中查找与所述声纹特征对应的用户标识，以确定所述第一会议处理设备发送的所述至少一条语音信息的用户标识。其中，所述声纹特征库中预先存储了所述至少一个用户的声纹特征以及其对应的用户标识。

所述第二会议处理设备可以输出所述至少一条语音信息中的任一条语音信息，同时，还可以输出所述至少一条语音信息对应的用户标识。

本发明实施例中，第一会议室中的第一会议处理设备将采集的至少一个用户的语音数据进行分离，获得至少一个用户的至少一条语音信息，可以使服务端针对每一条语音信息进行识别处理，并确定相应的用户标识，是后续分开显示至少一条语音信息以及对应的用户标识的基础，确保了能够及时有效分辨出所述至少一条语音信息的发言用户。

如图3所示，为本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图，该方法可以包括以下几个步骤：

301：接收至少一条语音信息及其对应的用户标识。

其中，所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得，每一条语音信息对应一个用户，所述用户标识为服务器识别所述至少一条语音信息的声纹特征，并对应所述至少一条语音信息的声纹特征查找获得。

第二会议处理设备可以接收服务端发送的至少一条语音信息及其对应的用户标识。所述至少一条语音信息由第一会议处理设备采集的语音数据并分离获得的。

可选地，所述第一会议处理设备可以包括声源定位器，并利用所述生源定位器采集语音数据，所述声源定位器还可以采集至少一个用户的定位信息，进而可以将采集的所述语音数据按照所述至少一个用户的定位信息确定分离出所述至少一条语音信息。

可选地，第一会议处理设备发送所述至少一条语音信息至服务端后，服务端可以识别出所述至少一条语音信息的声纹特征，进而可以确定出与所述声纹特征对应的用户标识，即可以确定所述至少一条语音信息的用户标识。

302：输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识。

可选地，可以使用扬声器输出所述每一条语音信息，可以使用显示器对应输出所述每一条语音信息对应的用户标识。其中，所述扬声器与所述显示器一一对应。

可选地，所述第二会议处理设备中可以包括多组扬声器与显示器，在所述语音信息输出相应的信息时，可以先获取所述第一会议处理设备中每一组扬声器与显示器的使用信息，可以选择空闲的一组扬声器与显示器输出每一条语音信息，以及对应输出所述每一条语音信息对应的用户标识。在所述扬声器与显示器均处于使用状态中时，可选择任一组扬声器与显示器输出接收的语音信息以及对应的用户标识。

本发明实施例中，第二会议室中的第二会议处理设备，在接收到至少一条语音信息以及其对应的用户标识后，将每一条语音信息以及其对应的用户标识对应输出，可以使第二会议室中的与会人员及时有效地分辨出第一会议室中每一条语音信息的用户，确保了发言的有效性。

作为一个实施例，所述接收至少一条语音信息及其对应的用户标识可以包括：

接收所述至少一条语音信息；

发送针对任一条语音信息的标识获取请求至服务端；

所述输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识可以包括：

在不同扬声器中输出不同语音信息；

本发明实施例中，针对不同用户的语音信息，可以将每一个用户的语音信息通过一组扬声器播放以及对应的用户标识在显示器显示，确保了语音信息的顺利播放，可以确保语音信息在第二会议室播放时，能够及时显示其对应的用户标识，可以实现有效播放每一个用户的语音信息，保障了语音信息能够被及时有效地分辨出其对应的发言用户，明确发言用户的发言内容。

如图4所示，为本发明实施例提供的一种电话会议中的数据处理装置的一个实施例的结构示意图，该装置可以包括以下几个模块：

第一获取模块401：用于获取第一会议处理设备发送的至少一条语音信息。

本发明实施例的装置主要应用于服务器中，可选地，所述服务器可以是普通服务器，也可以是云服务器。所述服务器与所述第一会议处理设备之间通过网络连接，进而可以进行各种数据的传输工作。

第一识别模块402：用于识别所述至少一条语音信息的声纹特征。

第一确定模块403：用于确定分别与所述至少一条语音信息的声纹特征对应的用户标识。

每一条语音信息均可以利用声纹识别算法进行声纹识别。

第一发送模块404：用于发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备，以供所述第二会议处理设备输出任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

本发明实施例中，主要通过服务端执行第一会议室的第一会议处理设备采集的至少一个语音信息的识别工作，确定出至少一个语音信息的用户标识后，可以将语音信息以及其对应的用户标识发送至第二会议的第二会议处理设备中，在第二会议室中将任一条语音信息及其对应的用户标识显示。语音信息与用户标识的对应显示，可以使第二会议室中的用户可以及时有效地分辨出第一会议处理设备发送的每一条语音信息的发言用户，保障了有效发言。

作为一个实施例，所述第一发送模块可以包括：

第一发送单元，用于发送所述至少一条语音信息至第二会议处理设备，以供所述第二会议处理设备输出所述至少一条语音信息。

第二会议处理设备位于第二会议室中，可以接收服务器发送的所述至少一条语音信息。每一条语音信息均有对应的用户标识。第二会议处理设备接收到所述至少一条语音信息时，并不能确定所述至少一条语音信息与用户标识的对应关系。因此，在第二会议处理设备接收到任一语音信息时，可以发送标识获取请求至服务端。

可选地，可以在接收到所述至少一条语音信息时，第二会议处理设备可以生成一条与所述语音信息相关的标识获取请求，以从服务端获取所述语音信息的用户标识。

本发明实施例中，服务端在发送至少一条语音信息至第二会议处理设备后，第二会议处理设备并不及时播放该语音信息，而是先发送针对任一语音信息的标识获取请求，以使服务器确定所述任一语音信息的用户标识，进而可以确保至少一条语音信息在显示时可以同时显示用户标识，可以提高显示的同步性，确保第二会议室中的用户可以及时有效分辨每一条语音信息的发言用户，保障了有效发言。

作为又一个实施例，所述装置还可以包括：

第一映射模块，用于将每一条语音信息的语音标识与其对应的用户标识保存至映射表中。

所述第二发送单元可以包括：

本发明实施例中，服务端在为每一条语音信息的声纹特征生成对应的声纹标识后，将每一条语音信息的语音标识与其对应的用户标识保存至映射表中，在接收到针对任一语音信息的用户标识获取请求时，可以迅速查找到该任一语音信息的用户标识。能够及时有效地分辨出每条语音信息的发言用户，进一步保障了发言的有效性。

如图5所示，为本发明实施例提供的一种电话会议中的数据处理装置的又一个实施例的结构示意图，该装置可以包括以下几个模块：

第一采集模块501：用于采集至少一个用户发出的语音数据。

第一处理模块502：用于将所述语音数据进行语音分离，以获取分别对应所述至少一个用户的至少一条语音信息。

第二发送模块503：用于发送所述至少一条语音信息至服务器，以供所述服务器确定所述至少一条语音信息的声纹特征对应的用户标识，并发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备，由所述第二会议处理设备输出所述任一条语音信息时，对应输出所述任一条语音信息对应的用户标识。

如图6所示，为本发明实施例提供的一种电话会议中的数据处理装置的又一个实施例的结构示意图，该装置可以包括以下几个模块：

第一接收模块601：用于接收至少一条语音信息及其对应的用户标识。

第一输出模块602：用于输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识。

可选地，所述第二处理会议设备中可以包括多组扬声器与显示器，在所述语音信息输出相应的信息时，可以先获取所述第一会议处理设备中每一组扬声器与显示器的使用信息，可以选择空闲的一组扬声器与显示器输出每一条语音信息，以及对应输出所述每一条语音信息对应的用户标识。在所述扬声器与显示器均处于使用状态中时，可选择任一组扬声器与显示器输出接收的语音信息以及对应的用户标识。

作为一个实施例，所述第一接收模块可以包括：

第一接收单元，用于接收所述至少一条语音信息。

第三发送单元，用于发送针对任一条语音信息的标识获取请求至服务端。

所述第一输出模块可以包括：

第一输出单元，用于在不同扬声器中输出不同语音信息。

如图7所示，本发明实施例还提供了一种电话会议中的数据处理系统，该电话会议中的数据处理系统可以包括第一会议处理设备701、第二会议处理设备703以及服务器702。

其中，所述第一会议处理设备配置如图5所示的电话会议中的数据处理装置，所述第二会议处理设备配置如图6所示的电话会议中的数据处理装置，以及所述服务器配置有如图4所示的电话会议中的数据处理装置。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信息和载波。

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解，硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语，故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内，本领域技术人员能够在一定误差范围内解决所述技术问题，基本达到所述技术效果。此外，“耦接”一词在此包含任何直接及间接的电性耦接手段。因此，若文中描述一第一装置耦接于一第二装置，则代表所述第一装置可直接电性耦接于所述第二装置，或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本发明的较佳实施方式，然所述描述乃以说明本发明的一般原则为目的，并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的商品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的商品或者系统中还存在另外的相同要素

上述说明示出并描述了本发明的若干优选实施例，但如前所述，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述申请构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.一种电话会议中的数据处理方法，其特征在于，包括：

识别所述至少一条语音信息的声纹特征；

2.根据权利要求1所述的方法，其特征在于，所述发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备包括：

3.根据权利要求2所述的方法，其特征在于，所述确定分别与所述至少一条语音信息的声纹特征对应的用户标识之后，所述方法还包括：

4.一种电话会议中的数据处理方法，其特征在于，包括：

5.根据权利要求4所述的方法，其特征在于，所述接收至少一条语音信息及其对应的用户标识包括：

接收所述服务端发送的所述任一条语音信息对应的用户标识；

所述输出每一条语音信息，并对应输出所述每一条语音信息对应的用户标识包括：

在不同扬声器中输出不同语音信息；

6.一种电话会议中的数据处理装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述第一发送模块包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

所述第二发送单元包括：

9.一种电话会议中的数据处理装置，其特征在于，包括：

10.根据权利要求9所述的装置，其特征在于，所述第一接收模块包括：

第一接收单元，用于接收所述至少一条语音信息；

第二接收单元，用于接收所述服务端发送的所述任一条语音信息对应的用户标识；

所述第一输出模块包括：

第一输出单元，用于在不同扬声器中输出不同语音信息；