CN107171816A - 电话会议中的数据处理方法及装置 - Google Patents

电话会议中的数据处理方法及装置 Download PDF

Info

Publication number
CN107171816A
CN107171816A CN201710476792.3A CN201710476792A CN107171816A CN 107171816 A CN107171816 A CN 107171816A CN 201710476792 A CN201710476792 A CN 201710476792A CN 107171816 A CN107171816 A CN 107171816A
Authority
CN
China
Prior art keywords
voice messaging
user
processing equipment
mark
meeting processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710476792.3A
Other languages
English (en)
Inventor
陈翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN201710476792.3A priority Critical patent/CN107171816A/zh
Publication of CN107171816A publication Critical patent/CN107171816A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1827Network arrangements for conference optimisation or adaptation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences

Abstract

本发明公开了一种电话会议中的数据处理方法及装置,该方法包括:获取第一会议处理设备发送的至少一条语音信息;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户;识别所述至少一条语音信息的声纹特征;确定分别与所述至少一条语音信息的声纹特征对应的用户标识;发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。本发明中保障了及时有效地分辨出不同发言用户的语音信息。

Description

电话会议中的数据处理方法及装置
技术领域
本发明属于通信技术领域,具体地说,涉及一种电话会议中的数据处理方法及装置。
背景技术
电话会议是一种普遍使用的远程会议方式,电话会议可以实现不同地点的会议人员参与会议的目的。
但是,当同一个会议室中,不同的发言用户同时发言时,位于另一会议室的与会人员并不能及时有效地分辨该会议室中不同的发言用户的发言内容。
发明内容
有鉴于此,本发明提供了一种电话会议中的数据处理方法及装置,用以解决现有技术中无法有效分辨发言的不同用户的技术问题。
为了解决上述技术问题,本发明的第一方面,提供一种电话会议中的数据处理方法,所述方法包括:
获取第一会议处理设备发送的至少一条语音信息;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户;
识别所述至少一条语音信息的声纹特征;
确定分别与所述至少一条语音信息的声纹特征对应的用户标识;
发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
优选地,所述发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备包括:
发送所述至少一条语音信息至第二会议处理设备,以供所述第二会议处理设备输出所述至少一条语音信息;
接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备,以供所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
优选地,所述确定分别与所述至少一条语音信息的声纹特征对应的用户标识之后,所述方法还包括:
将每一条语音信息的语音标识与其对应的用户标识保存至映射表中;
所述接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备包括:
接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时,根据所述任一语音信息的语音标识查找所述映射表,确定所述任一语音信息对应的用户标识;
发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
本发明的第二方面提供一种电话会议中的数据处理方法,所述方法包括:
接收至少一条语音信息及其对应的用户标识;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户,所述用户标识为服务器识别所述至少一条语音信息的声纹特征,并对应所述至少一条语音信息的声纹特征查找获得。
输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识。
优选地,所述接收至少一条语音信息及其对应的用户标识包括:
接收所述至少一条语音信息;发送针对任一条语音信息的标识获取请求至服务端;
接收所述服务端发送的所述任一条语音信息对应的用户标识。
优选地,所述输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识包括:
在不同扬声器中输出不同语音信息;
在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。
本发明的第三方面提供一种电话会议中的数据处理装置,所述装置包括:
第一获取模块,用于获取第一会议处理设备发送的至少一条语音信息;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户;
第一识别模块,用于识别所述至少一条语音信息的声纹特征;
第一确定模块,用于确定分别与所述至少一条语音信息的声纹特征对应的用户标识;
第一发送模块,用于发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
优选地,所述第一发送模块包括:
第一发送单元,用于发送所述至少一条语音信息至第二会议处理设备,以供所述第二会议处理设备输出所述至少一条语音信息;
第二发送单元,用于接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备,以供所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
优选地,所述装置还包括:
第一映射模块,用于将每一条语音信息的语音标识与其对应的用户标识保存至映射表中;
所述第二发送单元包括:
查找子单元,用于接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时,根据所述任一语音信息的语音标识查找所述映射表,确定所述任一语音信息对应的用户标识;
发送子单元,用于发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
本发明的第四方面提供一种电话会议中的数据处理装置,所述装置包括:
第一接收模块,用于接收至少一条语音信息及其对应的用户标识;其中所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户,所述用户标识为服务器识别所述至少一条语音信息的声纹特征,并对应所述至少一条语音信息的声纹特征查找获得。
第一输出模块,用于输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识。
优选地,所述第一接收模块包括:
第一接收单元,用于接收所述至少一条语音信息;
第三发送单元,用于发送针对任一条语音信息的标识获取请求至服务端;
第二接收单元,用于接收所述服务端发送的所述任一条语音信息对应的用户标识。
优选地,所述第一输出模块包括:
第一输出单元,用于在不同扬声器中输出不同语音信息;
第二输出单元,用于在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。
本发明中,第一会议室中的第一会议处理设备可以采集至少一条语音信息,进行分离后,发送至服务端。服务端接收已分离的至少一条语音信息,可以识别所述至少一条语音信息的声纹特征,以分别确定与所述至少一条语音信息的声纹特征对应的用户标识。每一条语音信息对应一个用户,进而获得声纹特征对应的用户标识后,可以利用该用户标识来标识对应语音信息的用户身份。在发送所述至少一条语音信息及其对应的用户标识至第二会议室中的第二会议处理设备之后,第二会议处理设备可以根据每一条语音信息的声纹特征确定其用户标识,进而可以将任一用户的语音信息以及对应的用户标识在第二会议室中显示,第二会议室中的与会人员即可以确定语音信息的用户的身份,实现了用户身份与语音信息的统一显示,可以有效分辨发言的不同用户。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种电话会议中的数据处理方法的一个实施例的流程图;
图2是本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图;
图3是本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图;
图4是本发明实施例的一种电话会议中的数据处理装置的一个实施例的结构示意图;
图5是本发明实施例的一种电话会议中的数据处理装置的又一个实施例的结构示意图;
图6是本发明实施例的一种电话会议中的数据处理装置的又一个实施例的结构示意图;
图7是本申请实施例的一种电话会议中的数据处理系统的一个实施例的结构示意图。
具体实施方式
以下将配合附图及实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明实施例主要应用于电话会议场景中,所述电话会议场景具体可以是实际的存在两个及以上数量的会议室。
在电话会议场景中,通常存在两个及以上数量的会议室,当一个会议室的与会人员发言时,其他会议室的与会人员并不能确定该发言用户的身份。尤其在一个会议室中,存在多个发言用户时,其他会议是的与会人员在确定发言用户的身份时可能存在更多困难。在这种情形下,其他与会人员如不能及时确定至少一个发言用户的身份时,会造成其他会议室中的与会人员不能及时有效地分辨不同发言用户的发言内容。为了解决以上问题,发明人提出了本发明的技术方案。
本发明实施例中,在第一会议室中的至少一个用户发言时,第一会议室中的第一会议处理设备可以采集所述至少一个用户的语音信息,并将采集的语音信息进行分离后发送至服务器。服务器在接收到分离的至少一个用户的语音信息之后,可以识别出所述至少一个用户的声纹特征,并确定出分别与所述至少一条语音信息的声纹特征对应的用户标识,进而用户标识可以用于标识用户的语音信息。之后,服务器再将所述至少一条语音信息以及其对应的用户标识发送至第二会议室中的第二会议处理设备,此时,第二处理设备即可以输出任一条语音信息,并对应输出任一条语音信息的用户标识。由此第二会议室中的与会人员即可以确知每一条语音信息的发言用户,进而可以及时有效分辨出任一发言用户的发言内容,保障了有效发言。
如图1所示为本发明实施例的一种电话会议中的数据处理方法的一个实施例的流程图,该方法可以包括以下几个步骤:
101:获取第一会议处理设备发送的至少一条语音信息。
其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户。
所述第一会议处理设备可以位于第一会议室中,所述第一会议处理设备可以采集第一会议室中至少一个用户的语音数据。
可选地,所述第一会议处理设备可以包括声源定位器。所述声源定位器可以采集至少一个用户的语音数据,以及获取所述至少一个用户的方向信息。所述声源定位器可以利用麦克风阵列技术将所述至少一个用户的语音数据根据所述至少一个用户的方向信息分离成所述至少一条语音信息。每一条语音信息对应一个用户。
可选地,在分离出每一条语音信息时,可以为每一条语音信息生成一个可以用于表示该语音信息名称的语音标识,用以从形式上区分每一条语音信息。例如,第一条语音信的语音标识可以为V001,第二条语音信息的语音标识可以为V002,该语音标识仅是示意性的,任何能够代表某一条语音信息的名称,用以区别每一条语音信息名称的字串均可。
本发明实施例的方法主要应用于服务器中,可选地,所述服务器可以是普通服务器,也可以是云服务器。所述服务器与所述第一会议处理设备之间通过网络连接,进而可以进行各种数据的传输工作。
102:识别所述至少一条语音信息的声纹特征。
103:确定分别与所述至少一条语音信息的声纹特征对应的用户标识。
每一条语音信息均可以利用声纹识别算法进行声纹识别。
可选地,可以通过声纹识别算法,计算出所述至少一条语音信息的声纹特征。所述声纹识别算法可以包括MFCC(Mel-Frequency Cepstral Coefficients,mel频率倒谱系数)算法、LPC(linear predictive coding,,线性预测编码)算法等。
语音信息的声纹特征可以代表某一条语音信息的内部含义,声纹特征不同时可以代表不同的内容,可以从内容上区分每一条语音信息。
可选地,可以预先建立一个声纹识别库,可以包含所有用户的声纹特征以及对应的用户标识,并且在所述声纹识别库中,声纹特征与用户标识一一对应。在识别出所述至少一条语音信息的声纹特征后,可以将所述至少一条语音信息的声纹特征与所述声纹识别库中的所有声纹特征进行匹配,以获得匹配的声纹特征以及与该匹配的声纹特征对应的用户标识,进而可以确定所述至少一条语音信息对应的用户标识。
104:发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
每一条语音信息与用户标识一一对应,在获取所述至少一条语音信息以及其对应的用户标识后,将其发送至第二会议室中的第二会议处理设备,可以使所述第二会议室中的第二会议处理设备对应输出所述任一条语音信息及其用户标识。
可选地,可以使用扬声器输出所述任一条语音信息,可以使用显示屏对应输出所述任一条语音信息对应的用户标识。所述扬声器与所述显示屏可以一一对应,以使所述显示屏中显示的用户标识与扬声器中播放的语音信息的对应关系更加明确。
本发明实施例中,主要通过服务端执行第一会议室的第一会议处理设备采集的至少一个语音信息的识别工作,确定出至少一个语音信息的用户标识后,可以将语音信息以及其对应的用户标识发送至第二会议的第二会议处理设备中,在第二会议室中将任一条语音信息及其对应的用户标识显示。语音信息与用户标识的对应显示,可以使第二会议室中的用户可以及时有效地分辨出每一条语音信息的发言用户,保障了有效发言。
作为一个实施例,所述发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备可以包括:
发送所述至少一条语音信息至第二会议处理设备,以供所述第二会议处理设备输出所述至少一条语音信息。
接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备,以供所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
可选地,所述标识获取请求可以指针对任一条语音信息的用户标识的获取请求。
第二会议处理设备位于第二会议室中,可以接收服务器发送的所述至少一条语音信息。每一条语音信息均有对应的用户标识。第二会议处理设备接收到所述至少一条语音信息时,并不能确定所述至少一条语音信息与用户标识的对应关系。因此,在第二会议处理设备接收到任一语音信息时,可以发送标识获取请求至服务端。可选地,可以在接收到所述至少一条语音信息时,第二会议处理设备可以生成一条与所述语音信息相关的标识获取请求,以从服务端获取所述语音信息的用户标识。
本发明实施例中,服务端在发送至少一条语音信息至第二会议处理设备后,第二会议处理设备并不及时播放该语音信息,而是先发送针对任一语音信息的标识获取请求,以使服务器确定所述任一语音信息的用户标识,进而可以确保至少一条语音信息在显示时可以同时显示用户标识,可以提高显示的同步性,确保第二会议室中的用户可以及时有效分辨第一会议处理设备发送的每一条语音信息的发言用户,保障了有效发言。
作为又一个实施例,所述确定分别与所述至少一条语音信息的声纹特征对应的用户标识之后,所述方法还可以包括:
将每一条语音信息的语音标识与其对应的用户标识保存至映射表中。
每一条语音信息的语音标识是指可以每一条语音信息的名称,可以从名称上区分每一条语音信息。所述语音标识可以是所述第一会议处理设备在分离出每一条语音信息后,为所述每一条语音信息生成的。一个语音标识可以用于唯一标识一条语音信息。
可选地,所述语音标识可以是所述语音信息的名称,可以通过语音标识查找到对应的语音信息。服务端接收至少一条语音信息时,可以一并接收该语音信息的语音标识。例如,某一条语音信息的名称为0001.MP4,则可以将该条语音信息的语音标识设置为0001。
所述每一条语音信息的用户标识可以用于标识用户的身份,例如该用户标识可以是用户的姓名、用户的职位等信息。当服务端接收到至少一条语音信息时,并不能确定该条语音信息的用户标识,可以识别出每一条语音信息的声纹特征,并根据该声纹特征确定每一条语音信息对应的用户标识。
所述接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备可以包括:
接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时,根据所述任一语音信息的语音标识查找所述映射表,确定所述任一语音信息对应的用户标识。
发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
服务端向所述第二会议处理设备发送语音信息时,第二会议处理设备可以获取到语音信息的语音标识,例如,当所述语音标识为语音信息的名称时,即可以获取语音信息的名称。第二会议处理设备生成的标识获取请求中即可以包括所述语音标识。所述语音标识可以用于唯一标识某一条语音信息,并在映射表中与所述用户标识建立对应关系。因此,可以通过语音信息的语音标识从所述映射表中查找到与所述语音信息对应的用户标识。
本发明实施例中,服务端在为每一条语音信息的声纹特征生成对应的声纹标识后,将每一条语音信息的语音标识与其对应的用户标识保存至映射表中,在接收到针对任一语音信息的用户标识获取请求时,可以迅速查找到该任一语音信息的用户标识。进而可以提高所述语音信息以及用户标识的显示速度,能够及时有效地分辨出每条语音信息的发言用户,进一步保障了发言的有效性。
如图2所示,为本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
201:采集至少一个用户发出的语音数据。
本发明实施例主要应用于第一会议室的第一会议处理设备中。
可选地,第一会议处理设备可以包括声源定位器。该声源定位器可以采集至少一个用户发出的语音数据。所述语音数据被采集时,每一个用户的语音信息均被融合为一条语音数据。所述声源定位器可以采集每一个用户的方位信息,其中所述方位信息可以包括角度信息和距离信息。声源定位器可以利用麦克风阵列技术计算用户的角度和距离,从而实现对用户的跟踪以及后续的语音定向获取,具有较强的抗干扰能力,可以精确捕捉用户的语音信息。
202:将所述语音数据进行语音分离,以获取分别对应至少一个用户的至少一条语音信息。
所述语音数据在采集时包含了多个用户的语音信息,将所述语音数据进行语音分离先是确定出用户的方位信息,再根据用户的方位信息利用麦克风阵列技术将所述语音数据进行分离。其中,所述方位信息可以包括角度信息以及距离信息。
每一用户的发言均被分离成对应的语音信息,所述语音信息即可以与用户相对应。
可选地,在将所述语音数据进行语音分离时,可以为获取到的对应至少一个用户的至少一条语音信息生成至少一个语音标识。每一条语音信息对应一个语音标识。所述语音标识用于标识所述语音信息的名称。
203:发送所述至少一条语音信息至服务器,以供所述服务器确定所述至少一条语音信息的声纹特征对应的用户标识,并发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
第一会议处理设备发送所述至少一条语音信息至服务器。服务器可以识别所述至少一条语音信息的语音的声纹特征每一用户,并将所述声纹特征与服务器中预先建立的声纹特征库进行匹配,进而可以从声纹特征库中查找与所述声纹特征对应的用户标识,以确定所述第一会议处理设备发送的所述至少一条语音信息的用户标识。其中,所述声纹特征库中预先存储了所述至少一个用户的声纹特征以及其对应的用户标识。
所述第二会议处理设备可以输出所述至少一条语音信息中的任一条语音信息,同时,还可以输出所述至少一条语音信息对应的用户标识。
本发明实施例中,第一会议室中的第一会议处理设备将采集的至少一个用户的语音数据进行分离,获得至少一个用户的至少一条语音信息,可以使服务端针对每一条语音信息进行识别处理,并确定相应的用户标识,是后续分开显示至少一条语音信息以及对应的用户标识的基础,确保了能够及时有效分辨出所述至少一条语音信息的发言用户。
如图3所示,为本发明实施例的一种电话会议中的数据处理方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
301:接收至少一条语音信息及其对应的用户标识。
其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户,所述用户标识为服务器识别所述至少一条语音信息的声纹特征,并对应所述至少一条语音信息的声纹特征查找获得。
第二会议处理设备可以接收服务端发送的至少一条语音信息及其对应的用户标识。所述至少一条语音信息由第一会议处理设备采集的语音数据并分离获得的。
可选地,所述第一会议处理设备可以包括声源定位器,并利用所述生源定位器采集语音数据,所述声源定位器还可以采集至少一个用户的定位信息,进而可以将采集的所述语音数据按照所述至少一个用户的定位信息确定分离出所述至少一条语音信息。
可选地,第一会议处理设备发送所述至少一条语音信息至服务端后,服务端可以识别出所述至少一条语音信息的声纹特征,进而可以确定出与所述声纹特征对应的用户标识,即可以确定所述至少一条语音信息的用户标识。
302:输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识。
可选地,可以使用扬声器输出所述每一条语音信息,可以使用显示器对应输出所述每一条语音信息对应的用户标识。其中,所述扬声器与所述显示器一一对应。
可选地,所述第二会议处理设备中可以包括多组扬声器与显示器,在所述语音信息输出相应的信息时,可以先获取所述第一会议处理设备中每一组扬声器与显示器的使用信息,可以选择空闲的一组扬声器与显示器输出每一条语音信息,以及对应输出所述每一条语音信息对应的用户标识。在所述扬声器与显示器均处于使用状态中时,可选择任一组扬声器与显示器输出接收的语音信息以及对应的用户标识。
本发明实施例中,第二会议室中的第二会议处理设备,在接收到至少一条语音信息以及其对应的用户标识后,将每一条语音信息以及其对应的用户标识对应输出,可以使第二会议室中的与会人员及时有效地分辨出第一会议室中每一条语音信息的用户,确保了发言的有效性。
作为一个实施例,所述接收至少一条语音信息及其对应的用户标识可以包括:
接收所述至少一条语音信息;
发送针对任一条语音信息的标识获取请求至服务端;
接收所述服务端发送的所述任一条语音信息对应的用户标识。
所述输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识可以包括:
在不同扬声器中输出不同语音信息;
在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。
本发明实施例中,针对不同用户的语音信息,可以将每一个用户的语音信息通过一组扬声器播放以及对应的用户标识在显示器显示,确保了语音信息的顺利播放,可以确保语音信息在第二会议室播放时,能够及时显示其对应的用户标识,可以实现有效播放每一个用户的语音信息,保障了语音信息能够被及时有效地分辨出其对应的发言用户,明确发言用户的发言内容。
如图4所示,为本发明实施例提供的一种电话会议中的数据处理装置的一个实施例的结构示意图,该装置可以包括以下几个模块:
第一获取模块401:用于获取第一会议处理设备发送的至少一条语音信息。
其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户。
所述第一会议处理设备可以位于第一会议室中,所述第一会议处理设备可以采集第一会议室中至少一个用户的语音数据。
可选地,所述第一会议处理设备可以包括声源定位器。所述声源定位器可以采集至少一个用户的语音数据,以及获取所述至少一个用户的方向信息。所述声源定位器可以利用麦克风阵列技术将所述至少一个用户的语音数据根据所述至少一个用户的方向信息分离成所述至少一条语音信息。每一条语音信息对应一个用户。
可选地,在分离出每一条语音信息时,可以为每一条语音信息生成一个可以用于表示该语音信息名称的语音标识,用以从形式上区分每一条语音信息。例如,第一条语音信的语音标识可以为V001,第二条语音信息的语音标识可以为V002,该语音标识仅是示意性的,任何能够代表某一条语音信息的名称,用以区别每一条语音信息名称的字串均可。
本发明实施例的装置主要应用于服务器中,可选地,所述服务器可以是普通服务器,也可以是云服务器。所述服务器与所述第一会议处理设备之间通过网络连接,进而可以进行各种数据的传输工作。
第一识别模块402:用于识别所述至少一条语音信息的声纹特征。
第一确定模块403:用于确定分别与所述至少一条语音信息的声纹特征对应的用户标识。
每一条语音信息均可以利用声纹识别算法进行声纹识别。
可选地,可以通过声纹识别算法,计算出所述至少一条语音信息的声纹特征。所述声纹识别算法可以包括MFCC(Mel-Frequency Cepstral Coefficients,mel频率倒谱系数)算法、LPC(linear predictive coding,,线性预测编码)算法等。
语音信息的声纹特征可以代表某一条语音信息的内部含义,声纹特征不同时可以代表不同的内容,可以从内容上区分每一条语音信息。
可选地,可以预先建立一个声纹识别库,可以包含所有用户的声纹特征以及对应的用户标识,并且在所述声纹识别库中,声纹特征与用户标识一一对应。在识别出所述至少一条语音信息的声纹特征后,可以将所述至少一条语音信息的声纹特征与所述声纹识别库中的所有声纹特征进行匹配,以获得匹配的声纹特征以及与该匹配的声纹特征对应的用户标识,进而可以确定所述至少一条语音信息对应的用户标识。
第一发送模块404:用于发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
每一条语音信息与用户标识一一对应,在获取所述至少一条语音信息以及其对应的用户标识后,将其发送至第二会议室中的第二会议处理设备,可以使所述第二会议室中的第二会议处理设备对应输出所述任一条语音信息及其用户标识。
可选地,可以使用扬声器输出所述任一条语音信息,可以使用显示屏对应输出所述任一条语音信息对应的用户标识。所述扬声器与所述显示屏可以一一对应,以使所述显示屏中显示的用户标识与扬声器中播放的语音信息的对应关系更加明确。
本发明实施例中,主要通过服务端执行第一会议室的第一会议处理设备采集的至少一个语音信息的识别工作,确定出至少一个语音信息的用户标识后,可以将语音信息以及其对应的用户标识发送至第二会议的第二会议处理设备中,在第二会议室中将任一条语音信息及其对应的用户标识显示。语音信息与用户标识的对应显示,可以使第二会议室中的用户可以及时有效地分辨出第一会议处理设备发送的每一条语音信息的发言用户,保障了有效发言。
作为一个实施例,所述第一发送模块可以包括:
第一发送单元,用于发送所述至少一条语音信息至第二会议处理设备,以供所述第二会议处理设备输出所述至少一条语音信息。
第二发送单元,用于接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备,以供所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
可选地,所述标识获取请求可以指针对任一条语音信息的用户标识的获取请求。
第二会议处理设备位于第二会议室中,可以接收服务器发送的所述至少一条语音信息。每一条语音信息均有对应的用户标识。第二会议处理设备接收到所述至少一条语音信息时,并不能确定所述至少一条语音信息与用户标识的对应关系。因此,在第二会议处理设备接收到任一语音信息时,可以发送标识获取请求至服务端。
可选地,可以在接收到所述至少一条语音信息时,第二会议处理设备可以生成一条与所述语音信息相关的标识获取请求,以从服务端获取所述语音信息的用户标识。
本发明实施例中,服务端在发送至少一条语音信息至第二会议处理设备后,第二会议处理设备并不及时播放该语音信息,而是先发送针对任一语音信息的标识获取请求,以使服务器确定所述任一语音信息的用户标识,进而可以确保至少一条语音信息在显示时可以同时显示用户标识,可以提高显示的同步性,确保第二会议室中的用户可以及时有效分辨每一条语音信息的发言用户,保障了有效发言。
作为又一个实施例,所述装置还可以包括:
第一映射模块,用于将每一条语音信息的语音标识与其对应的用户标识保存至映射表中。
每一条语音信息的语音标识是指可以每一条语音信息的名称,可以从名称上区分每一条语音信息。所述语音标识可以是所述第一会议处理设备在分离出每一条语音信息后,为所述每一条语音信息生成的。一个语音标识可以用于唯一标识一条语音信息。
可选地,所述语音标识可以是所述语音信息的名称,可以通过语音标识查找到对应的语音信息。服务端接收至少一条语音信息时,可以一并接收该语音信息的语音标识。例如,某一条语音信息的名称为0001.MP4,则可以将该条语音信息的语音标识设置为0001。
所述每一条语音信息的用户标识可以用于标识用户的身份,例如该用户标识可以是用户的姓名、用户的职位等信息。当服务端接收到至少一条语音信息时,并不能确定该条语音信息的用户标识,可以识别出每一条语音信息的声纹特征,并根据该声纹特征确定每一条语音信息对应的用户标识。
所述第二发送单元可以包括:
查找子单元,用于接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时,根据所述任一语音信息的语音标识查找所述映射表,确定所述任一语音信息对应的用户标识;
发送子单元,用于发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
服务端向所述第二会议处理设备发送语音信息时,第二会议处理设备可以获取到语音信息的语音标识,例如,当所述语音标识为语音信息的名称时,即可以获取语音信息的名称。第二会议处理设备生成的标识获取请求中即可以包括所述语音标识。所述语音标识可以用于唯一标识某一条语音信息,并在映射表中与所述用户标识建立对应关系。因此,可以通过语音信息的语音标识从所述映射表中查找到与所述语音信息对应的用户标识。
本发明实施例中,服务端在为每一条语音信息的声纹特征生成对应的声纹标识后,将每一条语音信息的语音标识与其对应的用户标识保存至映射表中,在接收到针对任一语音信息的用户标识获取请求时,可以迅速查找到该任一语音信息的用户标识。能够及时有效地分辨出每条语音信息的发言用户,进一步保障了发言的有效性。
如图5所示,为本发明实施例提供的一种电话会议中的数据处理装置的又一个实施例的结构示意图,该装置可以包括以下几个模块:
第一采集模块501:用于采集至少一个用户发出的语音数据。
本发明实施例主要应用于第一会议室的第一会议处理设备中。
可选地,第一会议处理设备可以包括声源定位器。该声源定位器可以采集至少一个用户发出的语音数据。所述语音数据被采集时,每一个用户的语音信息均被融合为一条语音数据。所述声源定位器可以采集每一个用户的方位信息,其中所述方位信息可以包括角度信息和距离信息。声源定位器可以利用麦克风阵列技术计算用户的角度和距离,从而实现对用户的跟踪以及后续的语音定向获取,具有较强的抗干扰能力,可以精确捕捉用户的语音信息。
第一处理模块502:用于将所述语音数据进行语音分离,以获取分别对应所述至少一个用户的至少一条语音信息。
所述语音数据在采集时包含了多个用户的语音信息,将所述语音数据进行语音分离先是确定出用户的方位信息,再根据用户的方位信息利用麦克风阵列技术将所述语音数据进行分离。其中,所述方位信息可以包括角度信息以及距离信息。
每一用户的发言均被分离成对应的语音信息,所述语音信息即可以与用户相对应。
可选地,在将所述语音数据进行语音分离时,可以为获取到的对应至少一个用户的至少一条语音信息生成至少一个语音标识。每一条语音信息对应一个语音标识。所述语音标识用于标识所述语音信息的名称。
第二发送模块503:用于发送所述至少一条语音信息至服务器,以供所述服务器确定所述至少一条语音信息的声纹特征对应的用户标识,并发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,由所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
第一会议处理设备发送所述至少一条语音信息至服务器。服务器可以识别所述至少一条语音信息的语音的声纹特征每一用户,并将所述声纹特征与服务器中预先建立的声纹特征库进行匹配,进而可以从声纹特征库中查找与所述声纹特征对应的用户标识,以确定所述第一会议处理设备发送的所述至少一条语音信息的用户标识。其中,所述声纹特征库中预先存储了所述至少一个用户的声纹特征以及其对应的用户标识。
所述第二会议处理设备可以输出所述至少一条语音信息中的任一条语音信息,同时,还可以输出所述至少一条语音信息对应的用户标识。
本发明实施例中,第一会议室中的第一会议处理设备将采集的至少一个用户的语音数据进行分离,获得至少一个用户的至少一条语音信息,可以使服务端针对每一条语音信息进行识别处理,并确定相应的用户标识,是后续分开显示至少一条语音信息以及对应的用户标识的基础,确保了能够及时有效分辨出所述至少一条语音信息的发言用户。
如图6所示,为本发明实施例提供的一种电话会议中的数据处理装置的又一个实施例的结构示意图,该装置可以包括以下几个模块:
第一接收模块601:用于接收至少一条语音信息及其对应的用户标识。
其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户,所述用户标识为服务器识别所述至少一条语音信息的声纹特征,并对应所述至少一条语音信息的声纹特征查找获得。
第二会议处理设备可以接收服务端发送的至少一条语音信息及其对应的用户标识。所述至少一条语音信息由第一会议处理设备采集的语音数据并分离获得的。
可选地,所述第一会议处理设备可以包括声源定位器,并利用所述生源定位器采集语音数据,所述声源定位器还可以采集至少一个用户的定位信息,进而可以将采集的所述语音数据按照所述至少一个用户的定位信息确定分离出所述至少一条语音信息。
可选地,第一会议处理设备发送所述至少一条语音信息至服务端后,服务端可以识别出所述至少一条语音信息的声纹特征,进而可以确定出与所述声纹特征对应的用户标识,即可以确定所述至少一条语音信息的用户标识。
第一输出模块602:用于输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识。
可选地,可以使用扬声器输出所述每一条语音信息,可以使用显示器对应输出所述每一条语音信息对应的用户标识。其中,所述扬声器与所述显示器一一对应。
可选地,所述第二处理会议设备中可以包括多组扬声器与显示器,在所述语音信息输出相应的信息时,可以先获取所述第一会议处理设备中每一组扬声器与显示器的使用信息,可以选择空闲的一组扬声器与显示器输出每一条语音信息,以及对应输出所述每一条语音信息对应的用户标识。在所述扬声器与显示器均处于使用状态中时,可选择任一组扬声器与显示器输出接收的语音信息以及对应的用户标识。
本发明实施例中,第二会议室中的第二会议处理设备,在接收到至少一条语音信息以及其对应的用户标识后,将每一条语音信息以及其对应的用户标识对应输出,可以使第二会议室中的与会人员及时有效地分辨出第一会议室中每一条语音信息的用户,确保了发言的有效性。
作为一个实施例,所述第一接收模块可以包括:
第一接收单元,用于接收所述至少一条语音信息。
第三发送单元,用于发送针对任一条语音信息的标识获取请求至服务端。
第二接收单元,用于接收所述服务端发送的所述任一条语音信息对应的用户标识。
所述第一输出模块可以包括:
第一输出单元,用于在不同扬声器中输出不同语音信息。
第二输出单元,用于在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。
本发明实施例中,针对不同用户的语音信息,可以将每一个用户的语音信息通过一组扬声器播放以及对应的用户标识在显示器显示,确保了语音信息的顺利播放,可以确保语音信息在第二会议室播放时,能够及时显示其对应的用户标识,可以实现有效播放每一个用户的语音信息,保障了语音信息能够被及时有效地分辨出其对应的发言用户,明确发言用户的发言内容。
如图7所示,本发明实施例还提供了一种电话会议中的数据处理系统,该电话会议中的数据处理系统可以包括第一会议处理设备701、第二会议处理设备703以及服务器702。
其中,所述第一会议处理设备配置如图5所示的电话会议中的数据处理装置,所述第二会议处理设备配置如图6所示的电话会议中的数据处理装置,以及所述服务器配置有如图4所示的电话会议中的数据处理装置。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信息和载波。
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素
上述说明示出并描述了本发明的若干优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.一种电话会议中的数据处理方法,其特征在于,包括:
获取第一会议处理设备发送的至少一条语音信息;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户;
识别所述至少一条语音信息的声纹特征;
确定分别与所述至少一条语音信息的声纹特征对应的用户标识;
发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
2.根据权利要求1所述的方法,其特征在于,所述发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备包括:
发送所述至少一条语音信息至第二会议处理设备,以供所述第二会议处理设备输出所述至少一条语音信息;
接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备,以供所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
3.根据权利要求2所述的方法,其特征在于,所述确定分别与所述至少一条语音信息的声纹特征对应的用户标识之后,所述方法还包括:
将每一条语音信息的语音标识与其对应的用户标识保存至映射表中;
所述接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备包括:
接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时,根据所述任一语音信息的语音标识查找所述映射表,确定所述任一语音信息对应的用户标识;
发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
4.一种电话会议中的数据处理方法,其特征在于,包括:
接收至少一条语音信息及其对应的用户标识;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户,所述用户标识为服务器识别所述至少一条语音信息的声纹特征,并对应所述至少一条语音信息的声纹特征查找获得。
输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识。
5.根据权利要求4所述的方法,其特征在于,所述接收至少一条语音信息及其对应的用户标识包括:
接收所述至少一条语音信息;发送针对任一条语音信息的标识获取请求至服务端;
接收所述服务端发送的所述任一条语音信息对应的用户标识;
所述输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识包括:
在不同扬声器中输出不同语音信息;
在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。
6.一种电话会议中的数据处理装置,其特征在于,包括:
第一获取模块,用于获取第一会议处理设备发送的至少一条语音信息;其中,所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户;
第一识别模块,用于识别所述至少一条语音信息的声纹特征;
第一确定模块,用于确定分别与所述至少一条语音信息的声纹特征对应的用户标识;
第一发送模块,用于发送所述至少一条语音信息及其对应的用户标识至第二会议处理设备,以供所述第二会议处理设备输出任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
7.根据权利要求6所述的装置,其特征在于,所述第一发送模块包括:
第一发送单元,用于发送所述至少一条语音信息至第二会议处理设备,以供所述第二会议处理设备输出所述至少一条语音信息;
第二发送单元,用于接收到所述第二会议处理设备针对任一语音信息的标识获取请求时,发送所述任一语音信息对应的用户标识至所述第二会议处理设备,以供所述第二会议处理设备输出所述任一条语音信息时,对应输出所述任一条语音信息对应的用户标识。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一映射模块,用于将每一条语音信息的语音标识与其对应的用户标识保存至映射表中;
所述第二发送单元包括:
查找子单元,用于接收到所述第二会议处理设备针对所述任一语音信息的标识获取请求时,根据所述任一语音信息的语音标识查找所述映射表,确定所述任一语音信息对应的用户标识;
发送子单元,用于发送所述任一语音信息对应的用户标识至所述第二会议处理设备。
9.一种电话会议中的数据处理装置,其特征在于,包括:
第一接收模块,用于接收至少一条语音信息及其对应的用户标识;其中所述至少一条语音信息为所述第一会议处理设备将采集的至少一个用户的语音数据进行语音分离获得,每一条语音信息对应一个用户,所述用户标识为服务器识别所述至少一条语音信息的声纹特征,并对应所述至少一条语音信息的声纹特征查找获得。
第一输出模块,用于输出每一条语音信息,并对应输出所述每一条语音信息对应的用户标识。
10.根据权利要求9所述的装置,其特征在于,所述第一接收模块包括:
第一接收单元,用于接收所述至少一条语音信息;
第三发送单元,用于发送针对任一条语音信息的标识获取请求至服务端;
第二接收单元,用于接收所述服务端发送的所述任一条语音信息对应的用户标识;
所述第一输出模块包括:
第一输出单元,用于在不同扬声器中输出不同语音信息;
第二输出单元,用于在任一个扬声器对应的显示器中输出所述任一个扬声器输出的语音信息对应的用户标识。
CN201710476792.3A 2017-06-21 2017-06-21 电话会议中的数据处理方法及装置 Pending CN107171816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710476792.3A CN107171816A (zh) 2017-06-21 2017-06-21 电话会议中的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710476792.3A CN107171816A (zh) 2017-06-21 2017-06-21 电话会议中的数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN107171816A true CN107171816A (zh) 2017-09-15

Family

ID=59819074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710476792.3A Pending CN107171816A (zh) 2017-06-21 2017-06-21 电话会议中的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN107171816A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108597525A (zh) * 2018-04-25 2018-09-28 四川远鉴科技有限公司 语音声纹建模方法及装置
CN108648758A (zh) * 2018-03-12 2018-10-12 北京云知声信息技术有限公司 医疗场景中分离无效语音的方法及系统
CN108962272A (zh) * 2018-06-21 2018-12-07 湖南优浪语音科技有限公司 拾音方法和系统
CN109445740A (zh) * 2018-09-30 2019-03-08 Oppo广东移动通信有限公司 音频播放方法、装置、电子设备及存储介质
CN109741754A (zh) * 2018-12-10 2019-05-10 上海思创华信信息技术有限公司 一种会议语音识别方法及系统、存储介质及终端
CN109785855A (zh) * 2019-01-31 2019-05-21 秒针信息技术有限公司 语音处理方法及装置、存储介质、处理器
CN111199741A (zh) * 2018-11-20 2020-05-26 阿里巴巴集团控股有限公司 声纹识别方法、声纹验证方法、装置、计算设备及介质
CN111739553A (zh) * 2020-06-02 2020-10-02 深圳市未艾智能有限公司 会议声音采集、会议记录以及会议记录呈现方法和装置
WO2021139592A1 (zh) * 2020-01-09 2021-07-15 上海擎感智能科技有限公司 用于信息处理的方法、设备和计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN102968991A (zh) * 2012-11-29 2013-03-13 华为技术有限公司 一种语音会议纪要的分类方法、设备和系统
CN104252464A (zh) * 2013-06-26 2014-12-31 联想(北京)有限公司 信息处理方法和装置
CN105096937A (zh) * 2015-05-26 2015-11-25 努比亚技术有限公司 语音数据处理方法及终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN102968991A (zh) * 2012-11-29 2013-03-13 华为技术有限公司 一种语音会议纪要的分类方法、设备和系统
CN104252464A (zh) * 2013-06-26 2014-12-31 联想(北京)有限公司 信息处理方法和装置
CN105096937A (zh) * 2015-05-26 2015-11-25 努比亚技术有限公司 语音数据处理方法及终端

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648758A (zh) * 2018-03-12 2018-10-12 北京云知声信息技术有限公司 医疗场景中分离无效语音的方法及系统
CN108648758B (zh) * 2018-03-12 2020-09-01 北京云知声信息技术有限公司 医疗场景中分离无效语音的方法及系统
CN108597525A (zh) * 2018-04-25 2018-09-28 四川远鉴科技有限公司 语音声纹建模方法及装置
CN108962272A (zh) * 2018-06-21 2018-12-07 湖南优浪语音科技有限公司 拾音方法和系统
CN109445740A (zh) * 2018-09-30 2019-03-08 Oppo广东移动通信有限公司 音频播放方法、装置、电子设备及存储介质
CN109445740B (zh) * 2018-09-30 2022-05-20 Oppo广东移动通信有限公司 音频播放方法、装置、电子设备及存储介质
CN111199741A (zh) * 2018-11-20 2020-05-26 阿里巴巴集团控股有限公司 声纹识别方法、声纹验证方法、装置、计算设备及介质
CN109741754A (zh) * 2018-12-10 2019-05-10 上海思创华信信息技术有限公司 一种会议语音识别方法及系统、存储介质及终端
CN109785855A (zh) * 2019-01-31 2019-05-21 秒针信息技术有限公司 语音处理方法及装置、存储介质、处理器
CN109785855B (zh) * 2019-01-31 2022-01-28 秒针信息技术有限公司 语音处理方法及装置、存储介质、处理器
WO2021139592A1 (zh) * 2020-01-09 2021-07-15 上海擎感智能科技有限公司 用于信息处理的方法、设备和计算机存储介质
CN111739553A (zh) * 2020-06-02 2020-10-02 深圳市未艾智能有限公司 会议声音采集、会议记录以及会议记录呈现方法和装置
CN111739553B (zh) * 2020-06-02 2024-04-05 深圳市未艾智能有限公司 会议声音采集、会议记录以及会议记录呈现方法和装置

Similar Documents

Publication Publication Date Title
CN107171816A (zh) 电话会议中的数据处理方法及装置
US11893995B2 (en) Generating additional synthesized voice output based on prior utterance and synthesized voice output provided in response to the prior utterance
US11152006B2 (en) Voice identification enrollment
CN104246878B (zh) 音频用户交互辨识和上下文精炼
Xiao et al. Microsoft speaker diarization system for the voxceleb speaker recognition challenge 2020
US8204759B2 (en) Social analysis in multi-participant meetings
US20200312315A1 (en) Acoustic environment aware stream selection for multi-stream speech recognition
Renals et al. Recognition and understanding of meetings the AMI and AMIDA projects
US6996526B2 (en) Method and apparatus for transcribing speech when a plurality of speakers are participating
CN110021302A (zh) 一种智能办公会议系统及会议记录方法
CN109506568A (zh) 一种基于图像识别和语音识别的声源定位方法及装置
Triantafyllopoulos et al. Deep speaker conditioning for speech emotion recognition
CN109378006A (zh) 一种跨设备声纹识别方法及系统
US11294995B2 (en) Method and apparatus for identity authentication, and computer readable storage medium
CN105872619A (zh) 一种视频播放记录的匹配方法及匹配装置
CN107918771A (zh) 人物识别方法和佩戴式人物识别系统
CN109935226A (zh) 一种基于深度神经网络的远场语音识别增强系统及方法
Zhu et al. Gaussian filter for TDOA based sound source localization in multimedia surveillance
WO2022161264A1 (zh) 音频信号处理、会议记录与呈现方法、设备、系统及介质
KR102580828B1 (ko) 멀티 채널 보이스 활동 검출
US20220366927A1 (en) End-To-End Time-Domain Multitask Learning for ML-Based Speech Enhancement
Papayiannis et al. Detecting Media Sound Presence in Acoustic Scenes.
US11862168B1 (en) Speaker disambiguation and transcription from multiple audio feeds
CN114155845A (zh) 服务确定方法、装置、电子设备及存储介质
CN108053828A (zh) 确定控制指令的方法、装置和家用电器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170915