CN105096937A - 语音数据处理方法及终端 - Google Patents

语音数据处理方法及终端 Download PDF

Info

Publication number
CN105096937A
CN105096937A CN201510274283.3A CN201510274283A CN105096937A CN 105096937 A CN105096937 A CN 105096937A CN 201510274283 A CN201510274283 A CN 201510274283A CN 105096937 A CN105096937 A CN 105096937A
Authority
CN
China
Prior art keywords
vocal print
print feature
terminal
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510274283.3A
Other languages
English (en)
Inventor
张圣杰
申世安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201510274283.3A priority Critical patent/CN105096937A/zh
Publication of CN105096937A publication Critical patent/CN105096937A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种语音数据处理方法及终端,方法包括:第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。

Description

语音数据处理方法及终端
技术领域
本发明涉及通信领域的语音处理技术,尤其涉及一种语音数据处理方法及终端。
背景技术
目前终端在进行语音通信时,参与通信的两个终端往往是基于对端的终端标识如终端的电话号码来完成对另一方终端的识别,这种识别仅仅限于两个终端参与语音通信的场景,对于多个终端参与的语音通信场景中,如何对语音数据中的语音的来源终端也即来源终端的用户进行识别,进而基于识别出的用户来对多终端语音场景中的业务功能进行扩展,相关技术尚无有效解决方案。
发明内容
本发明实施例提供一种语音数据处理方法及终端,能够对语音数据中的语音的来源终端也即来源终端的用户进行识别,进而对多终端语音场景中的业务功能进行扩展,提升用户体验。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种语音数据处理方法,所述方法包括:
第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
优选地,所述方法还包括:
所述第一终端从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
优选地,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令,包括:
所述语音数据中承载有至少两个所述用户的语音;
当确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音。
优选地,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
优选地,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述基于与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
本发明实施例提供一种终端,所述终端包括:
语音获取模块,用于获取语音数据;
声纹提取模块,用于从所述获取的语音数据中提取出声纹特征,
声纹匹配模块,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
声纹关联模块,用于存储所述预设声纹特征与用户的信息的一一对应关系;
声纹识别模块,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
响应模块,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
优选地,所述语音获取模块,还用于从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
所述声纹提取模块,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
所述声纹关联模块,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
优选地,所述响应模块,还用于当所述声纹识别模块确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音;
其中,所述语音数据中承载有至少两个所述用户的语音。
优选地,所述响应模块包括:
采集单元,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
加密单元,用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
优选地,所述响应模块包括:触发单元、滤除单元、编辑单元;
所述触发单元,用于基于所述操作指令触发所述滤除单元和/或所述编辑单元;其中,
所述滤除单元,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
本发明实施例中,第一终端处于多终端的语音通信场景中时,可以基于从多终端语音通信场景中获取的语音数据中提取出声纹特征,与第一终端中预设声纹特征匹配,进而得到提取出的声纹特征对应的目标用户的信息,这就克服了多终端语音通信场景中无法识别语音的来源用户(也即目标用户)的问题;同时,第一终端可以基于提取出的目标用户的声纹特征、和/或来源目标用户的信息,对多终端的语音通信场景进行功能扩展,例如提示当前语音的来源用户、与来源用户基于声纹特征进行加密通信,或基于声纹特征对语音数据进行编辑,满足了用户在多终端的语音通信场景中的需求,提升了用户体验。
附图说明
图1是本发明实施例中语音数据处理的实现流程示意图一;
图2a至图2c是本发明实施例中终端的结构示意图;
图3是本发明实施例中语音数据处理的实现流程示意图二。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例记载一种语音数据处理方法,可以应用于第一终端(如智能手机),如图1所示,包括以下步骤:
步骤S101,第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征。
步骤S102,基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息。
作为一个示例,预设声纹特征与用户的信息的一一对应关系可以在第一终端用户的历史通话过程中,基于所接收语音数据提取声纹特征得到,例如,第一终端在与第二终端进行点对点的语音通信时,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;基于所提取出的第二终端的用户的声纹特征,建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
作为又一个示例,预设声纹特征与用户的信息的一一对应关系可以由第一终端用户直接对第二终端的用户进行语音采集(例如由第一终端用户持有第一终端对第二终端的用户进行面对面的语音采集,或者第一终端接收第二终端发送的承载有第二终端用户语音的语音数据)得到语音数据,从所述第二终端的用户的声纹特征;基于所提取出的第二终端的用户的声纹特征,建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
步骤S103,基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
作为步骤S103的一个示例,在多终端的语音通信场景中,所述语音数据中承载有至少两个所述用户的语音;当第一终端确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音;例如,第一终端与用户A持有的第二终端A、以及用户B持有的第二终端B进行电话会议时,第一终端对接收的语音数据进行声纹特征提取,当提出的声纹特征与用户A的预设声纹特征匹配时,表明用户A当前是电话会议的发言者,第一终端可以在自身的图形界面中呈现诸如“当前发言者是用户A”的提示信息,直至在接收的语音数据中不能提取出用户A的声纹特征,表明用户A在电话会议中的发言结束;对于用户B发言以及用户A、B同时发言的情况,第一终端基于上述处理同样能够对发言的用户在图形界面上提示,从而便于第一终端用户了解会议的发言者的情况。
作为步骤S103的又一个示例,第一终端提取出的声纹可以用于第一终端与目标用户持有的第三终端进行加密通信;在前述的电话会议场景中,当第一终端的用户期望将第一终端采集的信息(例如语音、短消息、图片等)向目标用户加密发送时,可以将所述提取出的目标用户的声纹特征对信息进行加密;并基于与所述提取出的声纹特征对应的目标用户的信息(承载有与目标用户的第二终端可用的通信方式),向所述目标用户对应的第三终端发送加密后的信息;当目标用户的第三终端接收到所述加密后的信息,利用第三用户的预设声纹特征信息对接收的信息解密,得到第一终端采集的信息,确保了用于使所述第三终端基于所述目标用户的声纹特征进行解密操作;一个典型的应用场景是微信群聊和QQ群聊,第一终端可以向目标用户发送基于目标用于的声纹特征加密的信息,这样,即使该信息被其他终端接收也无法解密,提升了多设备通信的隐私安全。
作为步骤S103的又一个示例,在前述的电话会议场景中,第一终端接收到语音数据后,基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据,例如,当用户A电话会议中的发言涉密不便播放时,第一终端可以基于用户A的声纹特征将语音数据中用户A的语音滤除;
又例如,第一终端用户需要在用户A的语音数据与用户B的语音数据中插入已经提前采集的用户C的语音数据时,基于所述提取出的声纹特征与预设用户A、B的声纹特征匹配,确定所述语音数据中承载有用户A、B的语音的数据段,在用户A的数据段、用户B的语音的数据段中插入用户C的语音数据;这样对语音数据中的声纹特征进行提取,并基于预设的声纹特征语音数据中的语音对应的目标用户进行识别,可以以目标用户为单位对语音数据进行编辑处理。
本发明实施例还记载一种终端100,如图2a所示,所述终端100包括:
语音获取模块110,用于获取语音数据;
声纹提取模块120,用于从所述获取的语音数据中提取出声纹特征,
声纹匹配模块130,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
声纹关联模块140,用于存储所述预设声纹特征与用户的信息的一一对应关系;
声纹识别模块150,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块140存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
响应模块160,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
作为一个示例,所述语音获取模块110,还用于从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
所述声纹提取模块120,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
所述声纹关联模块140,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
作为一个示例,所述响应模块160,还用于当所述声纹识别模块150确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音;其中,所述语音数据中承载有至少两个所述用户的语音。
作为一个示例,如图2b所示,所述响应模块160包括:
采集单元1601,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
加密单元1602(与采集单元1601连接),用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行解密操作。
作为一个示例,如图2c所示,所述响应模块160包括:触发单元1603、滤除单元1604、编辑单元1605;
所述触发单元,用于基于所述操作指令触发所述滤除单元1604和/或所述编辑单元1605;其中,
所述滤除单元1604,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述编辑单元1605,用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
实际应用中,语音获取模块110可由终端中的支持通信的专用集成电路模块,以直接接收语音数据,通信的类型包括:蜂窝通信、WiFi通信,语音获取模块110可由终端中的支持音频采集的专用集成电路实现;声纹提取模块120、声纹匹配模块130、声纹识别模块150可由终端设备中的处理器,数字信号处理器(DSP)实现;声纹关联模块140可以存储介质(如闪存、硬盘、卡型存储器)、结合处理器或数字信号处理器(DSP)实现。
下面再结合电话会议场景中对语音数据进行特征提取,并对电话会议中的当前发言者进行提示的处理进行说明。
具体的实现过程如图3所示,包括以下步骤:
步骤S201,终端的图形界面呈现声纹提取开关,提示用户根据自身需要自行选择是否打开。
步骤S202,当用户打开上述开关,并通讯录中的联系人进行语音通话时,终端开始自动提取通话用户声纹数据。
语音获取模块110实时采集来自参与电话会议的其他终端语音数据,发送到声纹提取模块120进行声纹特征提取;
提取声纹特征的实现方式包括:基音频谱及其轮廓、基音帧的能量、基音共振峰的出现频率及其轨迹;线性预测倒谱、线谱对、自相关和对数面积比、MFCC、感知线性预测以及小波变换技术等。
步骤S203,建立提取的声纹特征与当前进行语音通话的联系人的对应关系,把声纹特征与联系人的对应关系数据通过文件的形式进行存储。
通过多次执行步骤S202至步骤S203,声纹关联模块140可以建立通讯录中所有联系人与联系人的声纹特征的对应关系。
步骤S204,进入会议电话模式,对当前通话中对方发言者的声纹特征进行实时提取,与已保存的联系人的声纹特征匹配,得到通讯录中当前发言者的信息。
匹配中适配的语音模型包括:矢量化模型、随机模型、神经网络模型。
步骤S205,显示当前发言者的信息。
本发明实施例还记载一种计算机存储介质,所述计算机存储介质中存储有可执行指令,所述可执行指令用于执行图1或图3所示的语音数据处理流程。
本发明实施例中,第一终端处于多终端的语音通信场景中时,可以基于从多终端语音通信场景中获取的语音数据中提取出声纹特征,与第一终端中预设声纹特征匹配,进而得到提取出的声纹特征对应的目标用户的信息,这就克服了多终端语音通信场景中无法识别语音的来源用户(也即目标用户)的问题;同时,第一终端可以基于提取出的目标用户的声纹特征、和/或来源目标用户的信息,对多终端的语音通信场景进行功能扩展,例如提示当前语音的来源用户、与来源用户基于声纹特征进行加密通信,或基于声纹特征对语音数据进行编辑,满足了用户在多终端的语音通信场景中的需求,提升了用户体验。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、随机存取存储器(RAM,RandomAccessMemory)、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种语音数据处理方法,其特征在于,所述方法包括:
第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述第一终端从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
3.如权利要求1所述的方法,其特征在于,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令,包括:
所述语音数据中承载有至少两个所述用户的语音;
当确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户对应的语音。
4.如权利要求1所述的方法,其特征在于,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
5.如权利要求1至4任一项所述的方法,其特征在于,所述基于与提取出的声纹特征响应操作指令,包括:
基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述基于与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
6.一种终端,其特征在于,所述终端包括:
语音获取模块,用于获取语音数据;
声纹提取模块,用于从所述获取的语音数据中提取出声纹特征,
声纹匹配模块,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
声纹关联模块,用于存储所述预设声纹特征与用户的信息的一一对应关系;
声纹识别模块,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
响应模块,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
7.如权利要求6所述的终端,其特征在于,
所述语音获取模块,还用于在所述声纹提取模块从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
所述声纹提取模块,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
所述声纹关联模块,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
8.如权利要求6所述的终端,其特征在于,
所述响应模块,还用于当所述声纹识别模块确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户对应的语音;
其中,所述语音数据中承载有至少两个所述用户的语音。
9.如权利要求6所述的终端,其特征在于,所述响应模块包括:
采集单元,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
加密单元,用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
10.如权利要求6至9任一项所述的终端,其特征在于,所述响应模块包括:触发单元、滤除单元和编辑单元;
所述触发单元,用于基于所述操作指令触发所述滤除单元和/或所述编辑单元;其中,
所述滤除单元,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述编辑单元,用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
CN201510274283.3A 2015-05-26 2015-05-26 语音数据处理方法及终端 Pending CN105096937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510274283.3A CN105096937A (zh) 2015-05-26 2015-05-26 语音数据处理方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510274283.3A CN105096937A (zh) 2015-05-26 2015-05-26 语音数据处理方法及终端

Publications (1)

Publication Number Publication Date
CN105096937A true CN105096937A (zh) 2015-11-25

Family

ID=54577223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510274283.3A Pending CN105096937A (zh) 2015-05-26 2015-05-26 语音数据处理方法及终端

Country Status (1)

Country Link
CN (1) CN105096937A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105719659A (zh) * 2016-02-03 2016-06-29 努比亚技术有限公司 基于声纹识别的录音文件分离方法及装置
CN106128465A (zh) * 2016-06-23 2016-11-16 成都启英泰伦科技有限公司 一种声纹识别系统及方法
CN106782498A (zh) * 2016-11-30 2017-05-31 广东欧珀移动通信有限公司 语音信息播放方法、装置及终端
CN107104994A (zh) * 2016-02-22 2017-08-29 华硕电脑股份有限公司 语音识别方法、电子装置及语音识别系统
CN107171816A (zh) * 2017-06-21 2017-09-15 歌尔科技有限公司 电话会议中的数据处理方法及装置
WO2017181752A1 (zh) * 2016-04-22 2017-10-26 中兴通讯股份有限公司 一种建立无线局域网的方法、装置及终端
CN108159702A (zh) * 2017-12-06 2018-06-15 广东欧珀移动通信有限公司 基于多人语音游戏处理方法和装置
CN109243447A (zh) * 2018-10-12 2019-01-18 西安蜂语信息科技有限公司 语音发送触发方法及装置
CN109410955A (zh) * 2018-12-07 2019-03-01 广州势必可赢网络科技有限公司 一种语音数据的保密方法、系统、装置及存储介质
CN109427017A (zh) * 2017-08-24 2019-03-05 中兴通讯股份有限公司 一种提示方法及装置
CN109524013A (zh) * 2018-12-18 2019-03-26 北京猎户星空科技有限公司 一种语音处理方法、装置、介质和智能设备
CN109727601A (zh) * 2018-12-24 2019-05-07 联想(北京)有限公司 一种信息处理方法及装置
WO2019127057A1 (zh) * 2017-12-26 2019-07-04 海能达通信股份有限公司 组呼的语音信号处理方法、通讯终端以及计算机存储介质
CN110362204A (zh) * 2019-07-11 2019-10-22 Oppo广东移动通信有限公司 信息提示方法、装置、存储介质及增强现实设备
CN110574103A (zh) * 2018-06-29 2019-12-13 华为技术有限公司 一种语音控制方法、可穿戴设备及终端
CN110688640A (zh) * 2019-09-03 2020-01-14 深圳市声扬科技有限公司 一种基于声纹识别的数据处理方法、装置、系统及服务器
CN108364654B (zh) * 2018-01-30 2020-10-13 网易乐得科技有限公司 语音处理方法、介质、装置和计算设备
CN111862947A (zh) * 2020-06-30 2020-10-30 百度在线网络技术(北京)有限公司 用于控制智能设备的方法、装置、电子设备和计算机存储介质
WO2021017982A1 (zh) * 2019-07-29 2021-02-04 华为技术有限公司 一种声纹识别的方法及设备
CN112970061A (zh) * 2018-11-14 2021-06-15 惠普发展公司,有限责任合伙企业 基于策略许可的内容
CN113051426A (zh) * 2021-03-18 2021-06-29 深圳市声扬科技有限公司 音频信息分类方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030846A (zh) * 2006-03-02 2007-09-05 积体数位股份有限公司 可携式声纹密码锁远程传输系统及其方法
US20110069140A1 (en) * 2002-11-08 2011-03-24 Verizon Services Corp. Facilitation of a conference call
CN102064937A (zh) * 2011-01-10 2011-05-18 杭州电子科技大学 基于声纹的通话双方语音加解密方法
CN102985965A (zh) * 2010-05-24 2013-03-20 微软公司 声纹标识
CN103780866A (zh) * 2012-10-22 2014-05-07 联想移动通信科技有限公司 一种视频控制装置、方法与视频终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110069140A1 (en) * 2002-11-08 2011-03-24 Verizon Services Corp. Facilitation of a conference call
CN101030846A (zh) * 2006-03-02 2007-09-05 积体数位股份有限公司 可携式声纹密码锁远程传输系统及其方法
CN102985965A (zh) * 2010-05-24 2013-03-20 微软公司 声纹标识
CN102064937A (zh) * 2011-01-10 2011-05-18 杭州电子科技大学 基于声纹的通话双方语音加解密方法
CN103780866A (zh) * 2012-10-22 2014-05-07 联想移动通信科技有限公司 一种视频控制装置、方法与视频终端

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105719659A (zh) * 2016-02-03 2016-06-29 努比亚技术有限公司 基于声纹识别的录音文件分离方法及装置
CN107104994A (zh) * 2016-02-22 2017-08-29 华硕电脑股份有限公司 语音识别方法、电子装置及语音识别系统
WO2017181752A1 (zh) * 2016-04-22 2017-10-26 中兴通讯股份有限公司 一种建立无线局域网的方法、装置及终端
CN106128465A (zh) * 2016-06-23 2016-11-16 成都启英泰伦科技有限公司 一种声纹识别系统及方法
CN106782498A (zh) * 2016-11-30 2017-05-31 广东欧珀移动通信有限公司 语音信息播放方法、装置及终端
CN106782498B (zh) * 2016-11-30 2019-12-10 Oppo广东移动通信有限公司 语音信息播放方法、装置及终端
CN107171816A (zh) * 2017-06-21 2017-09-15 歌尔科技有限公司 电话会议中的数据处理方法及装置
CN109427017A (zh) * 2017-08-24 2019-03-05 中兴通讯股份有限公司 一种提示方法及装置
CN108159702A (zh) * 2017-12-06 2018-06-15 广东欧珀移动通信有限公司 基于多人语音游戏处理方法和装置
CN108159702B (zh) * 2017-12-06 2021-08-20 Oppo广东移动通信有限公司 基于多人语音游戏处理方法和装置
WO2019127057A1 (zh) * 2017-12-26 2019-07-04 海能达通信股份有限公司 组呼的语音信号处理方法、通讯终端以及计算机存储介质
CN108364654B (zh) * 2018-01-30 2020-10-13 网易乐得科技有限公司 语音处理方法、介质、装置和计算设备
CN110574103B (zh) * 2018-06-29 2020-10-23 华为技术有限公司 一种语音控制方法、可穿戴设备及终端
CN110574103A (zh) * 2018-06-29 2019-12-13 华为技术有限公司 一种语音控制方法、可穿戴设备及终端
CN109243447A (zh) * 2018-10-12 2019-01-18 西安蜂语信息科技有限公司 语音发送触发方法及装置
CN112970061A (zh) * 2018-11-14 2021-06-15 惠普发展公司,有限责任合伙企业 基于策略许可的内容
CN109410955A (zh) * 2018-12-07 2019-03-01 广州势必可赢网络科技有限公司 一种语音数据的保密方法、系统、装置及存储介质
CN109524013A (zh) * 2018-12-18 2019-03-26 北京猎户星空科技有限公司 一种语音处理方法、装置、介质和智能设备
CN109524013B (zh) * 2018-12-18 2022-07-22 北京猎户星空科技有限公司 一种语音处理方法、装置、介质和智能设备
CN109727601A (zh) * 2018-12-24 2019-05-07 联想(北京)有限公司 一种信息处理方法及装置
CN110362204A (zh) * 2019-07-11 2019-10-22 Oppo广东移动通信有限公司 信息提示方法、装置、存储介质及增强现实设备
WO2021017982A1 (zh) * 2019-07-29 2021-02-04 华为技术有限公司 一种声纹识别的方法及设备
CN110688640A (zh) * 2019-09-03 2020-01-14 深圳市声扬科技有限公司 一种基于声纹识别的数据处理方法、装置、系统及服务器
CN111862947A (zh) * 2020-06-30 2020-10-30 百度在线网络技术(北京)有限公司 用于控制智能设备的方法、装置、电子设备和计算机存储介质
CN113051426A (zh) * 2021-03-18 2021-06-29 深圳市声扬科技有限公司 音频信息分类方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105096937A (zh) 语音数据处理方法及终端
KR101954550B1 (ko) 음량조절 방법, 시스템, 디바이스 및 컴퓨터 저장매체
CN103888581B (zh) 一种通信终端及其记录通话信息的方法
CN103000175A (zh) 一种语音识别的方法及移动终端
CN111182390B (zh) 音量数据处理方法、装置、计算机设备及存储介质
US10021634B2 (en) Method and device for switching SIM cards of communication terminal and computer storage medium
CN103491257A (zh) 一种在通话过程中发送联系人信息的方法及系统
CN104202469A (zh) 管理通话连接的方法、装置和终端
CN105280187A (zh) 一种家庭情绪管理的装置和方法
CN104078045A (zh) 一种识别的方法及电子设备
CN103249034A (zh) 一种获取联系人信息的方法和装置
CN101211615A (zh) 一种对特定人的语音进行自动录制的方法、系统及设备
CN106953962B (zh) 一种通话录音方法及装置
CN111343348A (zh) 互动式语音应答菜单的应用方法、系统、装置及存储介质
CN104394258B (zh) 对通讯对象的联系方式变化进行处理的方法和装置
CN103945063A (zh) 一种耳机模式切换装置和切换方法,以及移动终端
CN113159000A (zh) 人脸识别方法、装置及系统
CN103813031A (zh) 呼叫处理方法及装置
CN105722062B (zh) 一种备用机及其主备机的切换方法
CN105072243A (zh) 来电提示方法和装置
CN104767880A (zh) 一种通信号码管理方法
CN115831138A (zh) 一种音频信息处理方法、装置和电子设备
CN101848259A (zh) 一种数字家庭固定电话的语音处理方法及系统
CN106874312B (zh) 用户界面的获取方法及装置
CN105407232A (zh) 来电提醒方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125