CN109147797A - 基于声纹识别的客服方法、装置、计算机设备及存储介质 - Google Patents

基于声纹识别的客服方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109147797A
CN109147797A CN201811214527.9A CN201811214527A CN109147797A CN 109147797 A CN109147797 A CN 109147797A CN 201811214527 A CN201811214527 A CN 201811214527A CN 109147797 A CN109147797 A CN 109147797A
Authority
CN
China
Prior art keywords
verified
voice
user
vocal print
print feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811214527.9A
Other languages
English (en)
Other versions
CN109147797B (zh
Inventor
冯智斌
安栋
刘继鹏
伍朗
魏斌斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811214527.9A priority Critical patent/CN109147797B/zh
Priority claimed from CN201811214527.9A external-priority patent/CN109147797B/zh
Priority to PCT/CN2018/123559 priority patent/WO2020077841A1/zh
Publication of CN109147797A publication Critical patent/CN109147797A/zh
Application granted granted Critical
Publication of CN109147797B publication Critical patent/CN109147797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies

Abstract

本发明公开了一种基于声纹识别的客服方法、装置、计算机设备及存储介质。该基于声纹识别的客服方法包括获取待验证语音,待验证语音包括用户标识和至少一种实时验证信息;从待验证语音中提取待验证声纹特征;根据用户标识将待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果;若第一验证结果和第二验证结果均表明验证通过,则根据用户标识获取与用户身份相关联的历史关键信息;根据历史关键信息得到提示内容;根据提示内容引导用户进行操作。采用该基于声纹识别的客服方法能够让用户在使用电话客服系统时大幅度提高处理效率,快速解决问题。

Description

基于声纹识别的客服方法、装置、计算机设备及存储介质
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种基于声纹识别的客服方法、装置、计算机设备及存储介质。
【背景技术】
目前电话客服系统在对用户进行身份验证时,采用的是根据用户手动输入的身份证号以及相关的验证密码等验证方式实现身份验证。用户在用手机拨通客服电话后需要频繁地重复听-按键-听的操作,给用户带来了不便,影响用户的通话效率。另外,电话客服系统在提示、引导用户进行操作的过程中效率较低,原本用户很容易就能解决的问题需要在电话客服系统按照冗余的流程一步步地操作,需要花费较多的时间才能解决问题。
【发明内容】
有鉴于此,本发明实施例提供了一种基于声纹识别的客服方法、装置、计算机设备及存储介质,用以解决通过电话客服系统解决用户问题时效率过低的问题。
第一方面,本发明实施例提供了一种基于声纹识别的客服方法,包括:
获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
从所述待验证语音中提取待验证声纹特征;
根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
根据所述历史关键信息得到提示内容;
根据所述提示内容引导用户进行操作。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述从所述待验证语音中提取待验证声纹特征之前,所述方法还包括:
获取待注册语音,所述待注册语音包括所述用户标识;
提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果,包括:
将所述待验证语音转换为相对应的待验证文本,所述待验证文本包括与所述待验证语音相对应的至少一种所述实时验证信息;
将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述根据所述用户标识获取与所述用户身份相关联的历史关键信息之前,所述方法还包括:
根据所述用户标识查找历史录音,采用语音转文本接口将所述历史录音转换为相对应的文本,得到历史通话记录;
查找预设的关键信息表,基于语义将所述历史通话记录与预设的关键信息表进行匹配,得到与所述用户身份相关联的所述历史关键信息,并将所述历史关键信息存储在数据库中;
所述根据所述用户标识获取与所述用户身份相关联的历史关键信息,包括:
根据所述用户标识查询数据库,在所述数据库中获取与所述用户身份相关联的历史关键信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述历史关键信息得到提示内容,根据所述提示内容引导用户进行操作,包括:
将所述历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
根据所述历史关键信息确定每个所述提示内容的优先级;
根据所述优先级确定所述提示内容的提示次序,并按所述提示次序向用户提示所述提示内容,引导用户进行操作。
上述技术方案中的一个技术方案具有如下有益效果:
本发明实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,可以准确地验证用户身份。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
第二方面,本发明实施例提供了一种基于声纹识别的客服装置,包括:
待验证语音获取模块,用于获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
待验证声纹特征提取模块,用于从所述待验证语音中提取待验证声纹特征;
第一验证结果获取模块,用于根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
第二验证结果获取模块,用于根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
历史关键信息获取模块,用于若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
提示内容获取模块,用于根据所述历史关键信息得到提示内容;
引导操作模块,用于根据所述提示内容引导用户进行操作。
第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于声纹识别的客服方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,包括:计算机可执行指令,当所述计算机可执行指令被运行时,用以执行第一方面任一项所述的基于声纹识别的客服方法。
上述技术方案中的一个技术方案具有如下有益效果:
本发明实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一实施例中基于基于声纹识别的客服方法的一流程图;
图2是本发明一实施例中基于基于声纹识别的客服装置的一示意图;
图3是本发明一实施例中计算机设备的一示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1示出本实施例中基于声纹识别的客服方法的一流程图。该基于声纹识别的客服方法可应用在电话客服系统中,用于实现验证用户身份,引导用户快速解决问题的功能,具体可应用在安装在计算机设备上的电话客服系统中。其中,该计算机设备是可与用户进行人机交互的设备,包括但不限于电脑、智能手机和平板等设备。如图1所示,该基于声纹识别的客服方法包括如下步骤:
S10:获取待验证语音,待验证语音包括用户标识和至少一种实时验证信息。
其中,待验证语音是用户发出的用于在电话客服系统中进行用户身份验证的语音。用户标识是指用于唯一识别用户身份的标识。实时验证信息是指在预设时间内电话客服系统要求用户通过语音方式输入的验证信息。用户标识和实时验证信息可以提高用户身份验证的准确性和真实性,能够帮助电话客服系统快速确认用户身份。
S20:从待验证语音中提取待验证声纹特征。
在一实施例中,从待验证语音中提取的待验证声纹特征具体可以是MFCC(Mel-frequency cepstral coefficients,梅尔频率倒谱系数)或i-vector等的待验证声纹特征。
S30:根据用户标识将待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果。
在一实施例中,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。具体地,待验证声纹特征和标准声纹特征进行相似度匹配可以是将待验证声纹特征的特征向量与标准声纹特征的特征向量作余弦相似度的计算,根据计算结果判断待验证声纹特征和标准声纹特征之间的相似程度,根据该相似程度与预设阈值得到第一验证结果。第一验证结果能够有效验证用户身份的准确性。
S40:根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果。
在一实施例中,通过至少一种实时验证信息判断用户输入的语音是否与电话客服系统要求验证的信息相同,对用户身份进行验证,得到第二验证结果。该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。
S50:若第一验证结果和第二验证结果均表明验证通过,则根据用户标识获取与用户身份相关联的历史关键信息。
其中,历史关键信息是从用户的历史通话记录得到的,是代表用户在历史通话记录中的与客服服务内容相关的关键信息,能够通过该历史关键信息判断用户经常需要解决的问题类型。
在一实施例中,当第一验证结果和第二验证结果均表明验证通过时,则可以认为该用户身份是既准确又真实的,此时就可以根据用户标识获取与用户身份相关联的历史关键信息。
S60:根据历史关键信息得到提示内容。
在一实施例中,历史关键信息代表历史通话记录中的与客服服务内容相关的关键信息,则可以根据历史关键信息通过预设的映射关系得到与历史关键信息相关的提示内容。
S70:根据提示内容引导用户进行操作。
在一实施例中,在步骤S20之前,在从待验证语音中提取待验证声纹特征之前,还包括如下步骤:
S21:获取待注册语音,待注册语音包括用户标识。
其中,该待注册语音也包括用户标识,即通过用户标识可以判断待注册语音的用户。
S22:提取待注册语音的声纹特征,得到与用户标识相关联的标准声纹特征。
其中,标准声纹特征是区别于待验证声纹特征,用于判断与待验证声纹特征是否属于同一用户的参考标准。
在一实施例中,在待注册语音中提取的声纹特征具体可以是MFCC(Mel-frequencycepstral coefficients,梅尔频率倒谱系数)或i-vector等的标准声纹特征。该标准声纹特征与用户标识相关联,能够基于用户标识准确地判断与待验证声纹特征是否属于同一用户。
S23:根据用户标识,将标准声纹特征以文件的形式存储在数据库中,注册标准声纹特征。
步骤S21-S23中,通过注册标准声纹特征,利用了每个用户不同的声纹特征以实现基于声纹的用户身份识别。在电话客服系统中采用该声纹识别方法时,与标准声纹特征进行相似度匹配成功的待验证声纹特征才认为待验证声纹特征与标准声纹特征是属于同一个用户。该声纹识别验证方式在电话客服系统上能够有效保证用户身份的准确性。
可以理解地,标准声纹特征可以是以文件的形式存储在数据库中,每个标准声纹特征的文件对应一个用户标识。
在一实施例中,步骤S40中,根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,具体包括如下步骤:
S41:将待验证语音转换为相对应的待验证文本,待验证文本包括与待验证语音相对应的至少一种实时验证信息。
可以理解地,待验证语音所包含的含义是无法直接识别的,需要将待验证语音转换为相对应的待验证文本,转换的过程可以采用语音转文本接口。同样地,转换得到的待验证文本也包括与待验证语音相对应的至少一种实时验证信息,用于进行实时验证。
S42:将待验证文本中的实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度。
其中,标准校验文本是用于判断与待验证文本是否属于同一用户的参考标准。
在一实施例中,电话客服系统要求用户在10s内输入“精益求精”,则用户需要按要求输入“精益求精”。用户将输入的待验证文本与标准校验文本的“精益求精”进行匹配,获取实时匹配相似度。
S43:根据实时匹配相似度对用户身份进行验证,得到第二验证结果。
在一实施例中,实时匹配相似度反映的是用户在预设时间段内是否完成了实时验证信息的有效验证,根据实时匹配相似度对用户身份进行验证,得到第二验证结果,能够有效保证用户身份的真实性。
步骤S41-S43中,采用了通过验证实时验证信息的方式,该方式能够有效避免利用用户录音等非用户实时进行电话客服的情况,能够有效保证用户身份的真实性。
在一实施例中,在步骤S50中,在根据用户标识获取与用户身份相关联的历史关键信息之前,还包括如下步骤:
S51:根据用户标识查找历史录音,采用语音转文本接口将历史录音转换为相对应的文本,得到历史通话记录;
在一实施例中,每个用户标识对应有该用户在电话客服系统的历史录音,对查找到的历史录音进行语言转文本的处理,得到对应的历史通话记录,以文本形式存在的历史通话记录便于计算机设备直接进行数据处理。
S52:查找预设的关键信息表,基于语义将历史通话记录与预设的关键信息表进行匹配,得到与用户身份相关联的历史关键信息,并将历史关键信息存储在数据库中;
在一实施例中,根据用户标识获取与用户身份相关联的历史关键信息,包括:
根据用户标识查询数据库,在数据库中获取与用户身份相关联的历史关键信息。
其中,关键信息表存储的是与客服服务内容相关的关键词。
在一实施例中,考虑实际通话内容的多样性(但都是指向某些客服服务内容),可以基于开源的语义分析接口,结合关键信息表在历史通话记录中得到历史关键信息。具体可以是先对历史通话记录进行语义分析,确定用户想表达的实际内容,再与关键信息表进行匹配,得到与客服服务内容相关的历史关键信息。基于语义将历史通话记录与预设的关键信息表进行匹配,可以将用户的历史通话记录采用历史关键信息的形式进行简要表示,有助于提高存储的性能以及数据处理的效率。
在一实施例中,步骤S60和S70中,根据历史关键信息得到提示内容,根据提示内容引导用户进行操作,具体包括如下步骤:
S61:将历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
可以理解地,历史关键信息是从用户的历史通话记录得到的,是代表用户在历史通话记录中的与客服服务内容相关的关键信息,将历史关键信息按客服服务内容进行划分,可以明确得到用户所需的至少一个提示内容。
S71:根据历史关键信息确定每个提示内容的优先级;
S72:根据优先级确定提示内容的提示次序,并按提示次序向用户提示内容,引导用户进行操作。
步骤S71-S72中,优先级可以根据历史关键信息出现的次数以及每个历史关键信息所对应的提示内容的权重决定。有了优先级即可确定提示内容的提示次序,并按提示次序向用户提示内容,引导用户进行操作。能够让用户在使用电话客服系统时大幅度提高处理效率,快速解决问题。
本发明实施例的技术方案具有以下有益效果:
本发明实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
基于实施例中所提供的基于声纹识别的客服方法,本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
图2示出与实施例中基于声纹识别的客服方法一一对应的基于声纹识别的客服装置的原理框图。如图2所示,该基于声纹识别的客服装置包括待验证语音获取模块10、待验证声纹特征提取模块20、第一验证结果获取模块30、第二验证结果获取模块40、历史关键信息获取模块50、提示内容获取模块60和引导操作模块70。其中,待验证语音获取模块10、待验证声纹特征提取模块20、第一验证结果获取模块30、第二验证结果获取模块40、历史关键信息获取模块50、提示内容获取模块60和引导操作模块70的实现功能与实施例中基于声纹识别的客服方法对应的步骤一一对应,为避免赘述,本实施例不一一详述。
待验证语音获取模块10,用于获取待验证语音,待验证语音包括用户标识和至少一种实时验证信息。
待验证声纹特征提取模块20,用于从待验证语音中提取待验证声纹特征。
第一验证结果获取模块30,用于根据用户标识将待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果。
第二验证结果获取模块40,用于根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果。
历史关键信息获取模块50,用于若第一验证结果和第二验证结果均表明验证通过,则根据用户标识获取与用户身份相关联的历史关键信息。
提示内容获取模块60,用于根据历史关键信息得到提示内容。
引导操作模块70,用于根据提示内容引导用户进行操作。
可选地,基于声纹识别的客服装置还包括待注册语音获取单元、标准声纹特征获取单元和注册单元。
待注册语音获取单元,用于获取待注册语音,待注册语音包括用户标识。
标准声纹特征获取单元,用于提取待注册语音的声纹特征,得到与用户标识相关联的标准声纹特征。
注册单元,用于根据用户标识,将标准声纹特征以文件的形式存储在数据库中,注册标准声纹特征。
可选地,第二验证结果获取模块40包括待验证文本获取单元、实时匹配相似度获取单元和第二验证结果获取单元。
待验证文本获取单元,用于将待验证语音转换为相对应的待验证文本,待验证文本包括与待验证语音相对应的至少一种实时验证信息。
实时匹配相似度获取单元,用于将待验证文本中的实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度。
第二验证结果获取单元,用于根据实时匹配相似度对用户身份进行验证,得到第二验证结果。
可选地,基于声纹识别的客服装置还包括历史通话记录获取单元和历史关键信息存储单元。
历史通话记录获取单元,用于根据用户标识查找历史录音,采用语音转文本接口将历史录音转换为相对应的文本,得到历史通话记录。
历史关键信息存储单元,用于查找预设的关键信息表,基于语义将历史通话记录与预设的关键信息表进行匹配,得到与用户身份相关联的历史关键信息,并将历史关键信息存储在数据库中。
可选地,根据用户标识获取与用户身份相关联的历史关键信息,包括:
根据用户标识查询数据库,在数据库中获取与用户身份相关联的历史关键信息。
可选地,提示内容获取模块60包括提示内容获取单元,用于将历史关键信息按客服服务内容进行划分,得到至少一个提示内容。
可选地,引导操作模块70包括优先级确定单元和引导操作单元。
优先级确定单元,用于根据历史关键信息确定每个提示内容的优先级。
引导操作单元,用于根据优先级确定提示内容的提示次序,并按提示次序向用户提示内容,引导用户进行操作。
由于本实施例中的各单元能够执行实施例中所示的基于声纹识别的客服方法,本实施例未详细描述的部分,可参考对实施例中基于声纹识别的客服方法的相关说明。
本发明实施例的技术方案具有以下有益效果:
本发明实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
本实施例提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现实施例中基于声纹识别的客服方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器执行时实现实施例中基于声纹识别的客服装置中各模块/单元的功能,为避免重复,此处不一一赘述。
图3是本发明一实施例提供的计算机设备的示意图。如图3所示,该实施例的计算机设备80包括:处理器81、存储器82以及存储在存储器82中并可在处理器81上运行的计算机程序83,该计算机程序83被处理器81执行时实现实施例中的基于声纹识别的客服方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器81执行时实现实施例中基于声纹识别的客服装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备80可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括,但不仅限于,处理器81、存储器82。本领域技术人员可以理解,图3仅仅是计算机设备80的示例,并不构成对计算机设备80的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器81可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器82可以是计算机设备80的内部存储单元,例如计算机设备80的硬盘或内存。存储器82也可以是计算机设备80的外部存储设备,例如计算机设备80上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器82还可以既包括计算机设备80的内部存储单元也包括外部存储设备。存储器82用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器82还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于声纹识别的客服方法,其特征在于,所述方法包括:
获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
从所述待验证语音中提取待验证声纹特征;
根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
根据所述历史关键信息得到提示内容;
根据所述提示内容引导用户进行操作。
2.根据权利要求1所述的方法,其特征在于,在所述从所述待验证语音中提取待验证声纹特征之前,所述方法还包括:
获取待注册语音,所述待注册语音包括所述用户标识;
提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
3.根据权利要求1所述的方法,其特征在于,所述根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果,包括:
将所述待验证语音转换为相对应的待验证文本,所述待验证文本包括与所述待验证语音相对应的至少一种所述实时验证信息;
将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
4.根据权利要求1所述的方法,其特征在于,在所述根据所述用户标识获取与所述用户身份相关联的历史关键信息之前,所述方法还包括:
根据所述用户标识查找历史录音,采用语音转文本接口将所述历史录音转换为相对应的文本,得到历史通话记录;
查找预设的关键信息表,基于语义将所述历史通话记录与预设的关键信息表进行匹配,得到与所述用户身份相关联的所述历史关键信息,并将所述历史关键信息存储在数据库中;
所述根据所述用户标识获取与所述用户身份相关联的历史关键信息,包括:
根据所述用户标识查询数据库,在所述数据库中获取与所述用户身份相关联的历史关键信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述历史关键信息得到提示内容,所述根据所述提示内容引导用户进行操作,包括:
将所述历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
根据所述历史关键信息确定每个所述提示内容的优先级;
根据所述优先级确定所述提示内容的提示次序,并按所述提示次序向用户提示所述提示内容,引导用户进行操作。
6.一种基于声纹识别的客服装置,其特征在于,所述装置包括:
待验证语音获取模块,用于获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
待验证声纹特征提取模块,用于从所述待验证语音中提取待验证声纹特征;
第一验证结果获取模块,用于根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
第二验证结果获取模块,用于根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
历史关键信息获取模块,用于若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
提示内容获取模块,用于根据所述历史关键信息得到提示内容;
引导操作模块,用于根据所述提示内容引导用户进行操作。
7.根据权利要求6所述的装置,其特征在于,所述基于声纹识别的客服装置,还包括:
待注册语音获取单元,用于获取待注册语音,所述待注册语音包括所述用户标识;
标准声纹特征获取单元,用于提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
注册单元,用于根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
8.根据权利要求6所述的装置,其特征在于,所述第二验证结果获取模块,包括:
待验证文本获取单元,用于将所述待验证语音转换为相对应的待验证文本,所述待验证文本包括与所述待验证语音相对应的至少一种所述实时验证信息;
实时匹配相似度获取单元,用于将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
第二验证结果获取单元,用于根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于声纹识别的客服方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于声纹识别的客服方法的步骤。
CN201811214527.9A 2018-10-18 2018-10-18 基于声纹识别的客服方法、装置、计算机设备及存储介质 Active CN109147797B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811214527.9A CN109147797B (zh) 2018-10-18 基于声纹识别的客服方法、装置、计算机设备及存储介质
PCT/CN2018/123559 WO2020077841A1 (zh) 2018-10-18 2018-12-25 基于声纹识别的客服方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811214527.9A CN109147797B (zh) 2018-10-18 基于声纹识别的客服方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109147797A true CN109147797A (zh) 2019-01-04
CN109147797B CN109147797B (zh) 2024-05-07

Family

ID=

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110099047A (zh) * 2019-04-12 2019-08-06 平安科技(深圳)有限公司 注册信息处理方法、装置、计算机设备和存储介质
CN110111796A (zh) * 2019-06-24 2019-08-09 秒针信息技术有限公司 识别身份的方法及装置
CN110166634A (zh) * 2019-06-06 2019-08-23 深圳前海微众银行股份有限公司 用户身份辅助识别方法、装置、设备及可读存储介质
CN111105783A (zh) * 2019-12-06 2020-05-05 中国人民解放军61623部队 一种基于人工智能的综合客服系统
CN111161745A (zh) * 2019-12-26 2020-05-15 珠海格力电器股份有限公司 一种智能设备的唤醒方法、装置、设备及介质
CN111192587A (zh) * 2019-12-27 2020-05-22 拉克诺德(深圳)科技有限公司 语音数据匹配方法、装置、计算机设备及存储介质
CN111243605A (zh) * 2020-01-13 2020-06-05 北京三快在线科技有限公司 业务处理方法、装置、设备及存储介质
CN111312257A (zh) * 2019-12-16 2020-06-19 五八有限公司 一种多账号的识别方法、装置、电子设备及存储介质
CN111586019A (zh) * 2020-04-30 2020-08-25 中国银行股份有限公司 身份认证方法、装置及服务设备
WO2020181824A1 (zh) * 2019-03-12 2020-09-17 平安科技(深圳)有限公司 声纹识别方法、装置、设备以及计算机可读存储介质
CN112580007A (zh) * 2019-09-29 2021-03-30 北京安云世纪科技有限公司 一种验证方法及装置
CN112738344A (zh) * 2020-12-28 2021-04-30 北京三快在线科技有限公司 一种识别用户身份的方法、装置、存储介质及电子设备
CN112802479A (zh) * 2021-01-07 2021-05-14 北京小米松果电子有限公司 语音验证方法、装置以及存储介质
WO2021135549A1 (zh) * 2020-05-22 2021-07-08 平安科技(深圳)有限公司 事项办理权限授权方法、装置、计算机设备及存储介质
CN113098850A (zh) * 2021-03-24 2021-07-09 北京嘀嘀无限科技发展有限公司 一种语音验证方法、装置和电子设备
CN113241080A (zh) * 2021-06-10 2021-08-10 思必驰科技股份有限公司 自动注册声纹识别方法和装置
CN113676527A (zh) * 2021-08-10 2021-11-19 未鲲(上海)科技服务有限公司 信息推送方法、装置、设备及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413100A (zh) * 2010-09-25 2012-04-11 盛乐信息技术(上海)有限公司 声纹密码图片提示的声纹认证系统及其实现方法
CN102708867A (zh) * 2012-05-30 2012-10-03 北京正鹰科技有限责任公司 一种基于声纹和语音的防录音假冒身份识别方法及系统
CN104658533A (zh) * 2013-11-20 2015-05-27 中兴通讯股份有限公司 一种终端解锁的方法、装置及终端
CN105185379A (zh) * 2015-06-17 2015-12-23 百度在线网络技术(北京)有限公司 声纹认证方法和装置
CN106302339A (zh) * 2015-05-25 2017-01-04 腾讯科技(深圳)有限公司 登录验证方法和装置、登录方法和装置
CN106506524A (zh) * 2016-11-30 2017-03-15 百度在线网络技术(北京)有限公司 用于验证用户的方法和装置
CN106648082A (zh) * 2016-12-09 2017-05-10 厦门快商通科技股份有限公司 一种模拟真人互动的智能服务设备及方法
CN107221331A (zh) * 2017-06-05 2017-09-29 深圳市讯联智付网络有限公司 一种基于声纹的身份识别方法和设备
CN107331400A (zh) * 2017-08-25 2017-11-07 百度在线网络技术(北京)有限公司 一种声纹识别性能提升方法、装置、终端及存储介质
CN107330706A (zh) * 2017-06-06 2017-11-07 上海航动科技有限公司 一种基于人工智能的电营客服系统及商业运营模式
CN107517207A (zh) * 2017-03-13 2017-12-26 平安科技(深圳)有限公司 服务器、身份验证方法及计算机可读存储介质
CN107977557A (zh) * 2017-11-30 2018-05-01 广州势必可赢网络科技有限公司 一种基于声纹识别的电子合同签署服务认证协议及服务器
CN107995360A (zh) * 2017-11-27 2018-05-04 广东欧珀移动通信有限公司 通话处理方法及相关产品
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108305633A (zh) * 2018-01-16 2018-07-20 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质
CN108319829A (zh) * 2017-01-11 2018-07-24 中兴通讯股份有限公司 一种声纹验证方法和装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413100A (zh) * 2010-09-25 2012-04-11 盛乐信息技术(上海)有限公司 声纹密码图片提示的声纹认证系统及其实现方法
CN102708867A (zh) * 2012-05-30 2012-10-03 北京正鹰科技有限责任公司 一种基于声纹和语音的防录音假冒身份识别方法及系统
CN104658533A (zh) * 2013-11-20 2015-05-27 中兴通讯股份有限公司 一种终端解锁的方法、装置及终端
CN106302339A (zh) * 2015-05-25 2017-01-04 腾讯科技(深圳)有限公司 登录验证方法和装置、登录方法和装置
CN105185379A (zh) * 2015-06-17 2015-12-23 百度在线网络技术(北京)有限公司 声纹认证方法和装置
CN106506524A (zh) * 2016-11-30 2017-03-15 百度在线网络技术(北京)有限公司 用于验证用户的方法和装置
CN106648082A (zh) * 2016-12-09 2017-05-10 厦门快商通科技股份有限公司 一种模拟真人互动的智能服务设备及方法
CN108319829A (zh) * 2017-01-11 2018-07-24 中兴通讯股份有限公司 一种声纹验证方法和装置
CN107517207A (zh) * 2017-03-13 2017-12-26 平安科技(深圳)有限公司 服务器、身份验证方法及计算机可读存储介质
CN107221331A (zh) * 2017-06-05 2017-09-29 深圳市讯联智付网络有限公司 一种基于声纹的身份识别方法和设备
CN107330706A (zh) * 2017-06-06 2017-11-07 上海航动科技有限公司 一种基于人工智能的电营客服系统及商业运营模式
CN107331400A (zh) * 2017-08-25 2017-11-07 百度在线网络技术(北京)有限公司 一种声纹识别性能提升方法、装置、终端及存储介质
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN107995360A (zh) * 2017-11-27 2018-05-04 广东欧珀移动通信有限公司 通话处理方法及相关产品
CN107977557A (zh) * 2017-11-30 2018-05-01 广州势必可赢网络科技有限公司 一种基于声纹识别的电子合同签署服务认证协议及服务器
CN108305633A (zh) * 2018-01-16 2018-07-20 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020181824A1 (zh) * 2019-03-12 2020-09-17 平安科技(深圳)有限公司 声纹识别方法、装置、设备以及计算机可读存储介质
CN110099047B (zh) * 2019-04-12 2021-09-07 平安科技(深圳)有限公司 注册信息处理方法、装置、计算机设备和存储介质
CN110099047A (zh) * 2019-04-12 2019-08-06 平安科技(深圳)有限公司 注册信息处理方法、装置、计算机设备和存储介质
CN110166634A (zh) * 2019-06-06 2019-08-23 深圳前海微众银行股份有限公司 用户身份辅助识别方法、装置、设备及可读存储介质
CN110111796A (zh) * 2019-06-24 2019-08-09 秒针信息技术有限公司 识别身份的方法及装置
CN110111796B (zh) * 2019-06-24 2021-09-17 秒针信息技术有限公司 识别身份的方法及装置
CN112580007B (zh) * 2019-09-29 2023-01-10 北京安云世纪科技有限公司 一种验证方法及装置
CN112580007A (zh) * 2019-09-29 2021-03-30 北京安云世纪科技有限公司 一种验证方法及装置
CN111105783A (zh) * 2019-12-06 2020-05-05 中国人民解放军61623部队 一种基于人工智能的综合客服系统
CN111312257A (zh) * 2019-12-16 2020-06-19 五八有限公司 一种多账号的识别方法、装置、电子设备及存储介质
CN111161745A (zh) * 2019-12-26 2020-05-15 珠海格力电器股份有限公司 一种智能设备的唤醒方法、装置、设备及介质
CN111192587A (zh) * 2019-12-27 2020-05-22 拉克诺德(深圳)科技有限公司 语音数据匹配方法、装置、计算机设备及存储介质
CN111243605A (zh) * 2020-01-13 2020-06-05 北京三快在线科技有限公司 业务处理方法、装置、设备及存储介质
CN111586019A (zh) * 2020-04-30 2020-08-25 中国银行股份有限公司 身份认证方法、装置及服务设备
WO2021135549A1 (zh) * 2020-05-22 2021-07-08 平安科技(深圳)有限公司 事项办理权限授权方法、装置、计算机设备及存储介质
CN112738344A (zh) * 2020-12-28 2021-04-30 北京三快在线科技有限公司 一种识别用户身份的方法、装置、存储介质及电子设备
CN112738344B (zh) * 2020-12-28 2022-12-09 北京三快在线科技有限公司 一种识别用户身份的方法、装置、存储介质及电子设备
CN112802479A (zh) * 2021-01-07 2021-05-14 北京小米松果电子有限公司 语音验证方法、装置以及存储介质
CN113098850A (zh) * 2021-03-24 2021-07-09 北京嘀嘀无限科技发展有限公司 一种语音验证方法、装置和电子设备
CN113241080A (zh) * 2021-06-10 2021-08-10 思必驰科技股份有限公司 自动注册声纹识别方法和装置
CN113676527A (zh) * 2021-08-10 2021-11-19 未鲲(上海)科技服务有限公司 信息推送方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2020077841A1 (zh) 2020-04-23

Similar Documents

Publication Publication Date Title
US10957339B2 (en) Speaker recognition method and apparatus, computer device and computer-readable medium
WO2021120631A1 (zh) 智能交互方法、装置、电子设备及存储介质
CN108564954B (zh) 深度神经网络模型、电子装置、身份验证方法和存储介质
CN110334241B (zh) 客服录音的质检方法、装置、设备及计算机可读存储介质
WO2019085575A1 (zh) 一种声纹认证方法、账号注册方法及装置
CN107481720B (zh) 一种显式声纹识别方法及装置
US20180342241A1 (en) Method and Apparatus of Recognizing Field of Semantic Parsing Information, Device and Readable Medium
WO2017197953A1 (zh) 基于声纹的身份识别方法及装置
WO2018149209A1 (zh) 语音识别方法、电子设备以及计算机存储介质
CN107517207A (zh) 服务器、身份验证方法及计算机可读存储介质
CN109660509A (zh) 基于人脸识别的登录方法、装置、系统和存储介质
CN109428719A (zh) 一种身份验证方法、装置及设备
JP7153004B2 (ja) コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体
CN102413100A (zh) 声纹密码图片提示的声纹认证系统及其实现方法
WO2018214895A1 (zh) 数据处理方法、数据处理装置、存储设备及网络设备
CN110047467B (zh) 语音识别方法、装置、存储介质及控制终端
KR20160011709A (ko) 지불 확인을 위한 방법, 장치 및 시스템
CN109559735B (zh) 一种基于神经网络的语音识别方法、终端设备及介质
WO2020082673A1 (zh) 发票检验方法、装置、计算设备和存储介质
CN109003611B (zh) 用于车辆语音控制的方法、装置、设备和介质
CN110544468B (zh) 应用唤醒方法、装置、存储介质及电子设备
CN107766868A (zh) 一种分类器训练方法及装置
US20230274282A1 (en) Transaction tracking and fraud detection using voice and/or video data
CN108804525A (zh) 一种智能回答方法及装置
CN113707157B (zh) 基于声纹识别的身份验证方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant