CN113194210B - 一种语音通话接入方法及装置 - Google Patents

一种语音通话接入方法及装置 Download PDF

Info

Publication number
CN113194210B
CN113194210B CN202110486449.3A CN202110486449A CN113194210B CN 113194210 B CN113194210 B CN 113194210B CN 202110486449 A CN202110486449 A CN 202110486449A CN 113194210 B CN113194210 B CN 113194210B
Authority
CN
China
Prior art keywords
client
voice
call
age
characteristic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110486449.3A
Other languages
English (en)
Other versions
CN113194210A (zh
Inventor
黄康
徐梓丞
杨晓明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202110486449.3A priority Critical patent/CN113194210B/zh
Publication of CN113194210A publication Critical patent/CN113194210A/zh
Application granted granted Critical
Publication of CN113194210B publication Critical patent/CN113194210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/523Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing with call distribution or queueing
    • H04M3/5232Call distribution algorithms
    • H04M3/5235Dependent on call type or called number [DNIS]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种语音通话接入方法及装置,包括获取客户拨打客服电话时输入的语音和电话号码;将语音作为语音识别模型的输入,在语音识别模型中对所述语音进行处理,输出客户的年龄范围;基于电话号码,确定数据库中是否存在与电话号码对应的客户基本信息;若存在,且确定客户基本信息与客户的年龄范围匹配时,根据客户基本信息,或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。在本方案中,直接利用训练好的语音识别模型对客户输入的语音进行处理,确定客户的年龄范围;进而根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。

Description

一种语音通话接入方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种语音通话接入方法及装置。
背景技术
随着银行智能客服系统的不断发展,使得银行智能客服系统所能够提供的服务也越来越多。常通过电话进入银行智能客服系统,以咨询和/或办理一定的业务。由于老年客户的说话语速较慢,且操作较慢,因此需要银行智能客服系统中的人工客服来为老年客户提供业务服务。
目前,老年客户需要多次根据语音提示进行按键选择或者语音提示进行回答,然后才能与人工客服进行语音通话,由于现有的进入人工客服的流程对于老年客户来说比较繁琐,从而导致老年客户无法快速接入人工客服,进而影响客户的通话体验。
发明内容
有鉴于此,本发明实施例提供一种语音通话接入方法及装置,以解决现有技术中老年客户无法快速接入人工客服,进而影响客户的通话体验的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例一方面公开了一种语音通话接入方法,所述方法包括:
获取客户拨打客服电话时输入的语音和电话号码;
将所述语音作为语音识别模型的输入,在所述语音识别模型中对所述语音进行处理,输出客户的年龄范围,所述语音识别模型由历史数据进行训练得到;
基于所述电话号码,确定数据库中是否存在与所述电话号码对应的客户基本信息;
若存在,且确定所述客户基本信息与所述客户的年龄范围匹配时,根据客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中。
可选的,还包括:
若确定数据库中不存在与所述电话号码对应的客户基本信息,根据所述客户的年龄范围将客户的通话接入相应通话级别的语音通话中,所述通话级别用于指示接入通话的速度。
可选的,所述根据所述客户的年龄范围将客户的电话接入相应的语音通话中,包括:
判断所述客户的年龄范围是否大于或等于第一年龄阈值;
若大于或等于,将客户的通话接入通话级别高的语音通话中;
若小于,将客户的通话接入通话级别低的语音通话中。
可选的,所述由历史数据进行训练得到语音识别模型的过程,包括:
获取历史数据,所述历史数据包括多个历史语音和与每一历史语音对应的年龄;
对所述历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据;
利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的语音识别模型。
可选的,所述根据客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中,包括:
判断所述客户基本信息中的年龄或者所述客户的年龄范围是否大于或等于第一年龄阈值;
若大于或等于,将客户的通话接入通话级别高的语音通话中;
若小于,将客户的通话接入通话级别低的语音通话中。
本发明实施例另一方面示出了一种语音通话接入装置,所述装置包括:
获取单元,用于获取客户拨打客服电话时输入的语音和电话号码;
语音识别模型,用于将所述语音作为语音识别模型的输入,在所述语音识别模型中对所述语音进行处理,输出客户的年龄范围,所述语音识别模型由构建单元训练得到;
确定单元,用于基于所述电话号码,确定数据库中是否存在与所述电话号码对应的客户基本信息;
第一接入单元,用于若存在,且确定所述客户基本信息与所述客户的年龄范围匹配时,根据客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中。
可选的,还包括:
第二接入单元,用于若确定数据库中不存在与所述电话号码对应的客户基本信息,根据所述客户的年龄范围将客户的通话接入相应通话级别的语音通话中,所述通话级别用于指示接入通话的速度。
可选的,所述第二接入单元,具体用于:判断所述客户的年龄范围是否大于或等于第一年龄阈值;若大于或等于,将客户的通话接入通话级别高的语音通话中;若小于,将客户的通话接入通话级别低的语音通话中。
可选的,所述构建单元,具体用于:获取历史数据,所述历史数据包括多个历史语音和与每一历史语音对应的年龄;对所述历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据;利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的语音识别模型。
可选的,所述第一接入单元,具体用于:判断所述客户基本信息中的年龄或者所述客户的年龄范围是否大于或等于第一年龄阈值;若大于或等于,将客户的通话接入通话级别高的语音通话中;若小于,将客户的通话接入通话级别低的语音通话中。
基于上述本发明实施例提供的一种语音通话接入方法及装置,该方法包括:获取客户拨打客服电话时输入的语音和电话号码;将语音作为语音识别模型的输入,在语音识别模型中对所述语音进行处理,输出客户的年龄范围,语音识别模型由历史数据进行训练得到;基于电话号码,确定数据库中是否存在与电话号码对应的客户基本信息;若存在,且确定客户基本信息与客户的年龄范围匹配时,根据客户基本信息,或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。在本发明实施例中,利用训练好的语音识别模型对客户输入的语音进行处理,从而得到客户的年龄范围;从数据库中确定是否存在与电话号码对应的客户基本信息;若存在,将客户的年龄范围和客户基本信息进行匹配,从而确定语音识别模型处理得到的客户的年龄范围是否更加准确。在确定客户的年龄范围和客户基本信息匹配时,根据客户基本信息或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。若不存在,直接根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例示出的多个客户终端、多个客服终端和服务器的应用架构图;
图2为本发明实施例示出的一种语音通话接入方法的流程示意图;
图3为本发明实施例示出的一种语音通话接入装置的结构示意图;
图4为本发明实施例示出的另一种语音通话接入装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例中,利用训练好的语音识别模型对客户输入的语音进行处理,从而得到客户的年龄范围;从数据库中确定是否存在与电话号码对应的客户基本信息;若存在,将客户的年龄范围和客户基本信息进行匹配,从而确定语音识别模型处理得到的客户的年龄范围是否更加准确。在确定客户的年龄范围和客户基本信息匹配时,根据客户基本信息或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。若不存在,直接根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
参见图1,为本发明实施例提供的多个客户终端、多个客服终端和服务器的应用架构图。
多个客户终端至少包括客户终端12、客户终端13和客户终端14,多个客服终端至少包括客服终端15和客服终端16,其中客服终端15为通话级别高的终端,客服终端16为通话级别低的终端。
其中,服务器11为银行智能客服系统的服务器。
基于该应用架构实现针对语音通话接入的过程包括:
客户通过客户终端12拨打银行服务热线,并通过语音输入选择对应的语言类型和咨询的业务。
服务器10获取客户通过客户终端12拨打客服电话时输入的语音和电话号码。将语音作为语音识别模型的输入,在语音识别模型中对所述语音进行处理,得到客户的年龄范围。
服务器20,基于电话号码,确定数据库中是否存在与电话号码对应的客户基本信息;若存在,且确定客户基本信息与客户的年龄范围匹配时,根据客户基本信息,或者客户的年龄范围确定客户的通话为通话级别高的通话,并将客户的通话接入相应通话级别的客服终端15中,与客服终端15的客服进行语音通话中。
需要说明的是,客户除了可以通过客户终端12拨打人工客服电话时,还可以利用其他客户终端拨打人工客服电话,比如,客户终端13等,银行智能客服系统的服务器11处理其他客户终端的语音通话接入的过程与上述处理客户终端12的语音通话接入过程相同,可相互参见,本发明实施例不加以限制。
在本发明实施例中,利用训练好的语音识别模型对客户输入的语音进行处理,从而得到客户的年龄范围;从数据库中确定是否存在与电话号码对应的客户基本信息;若存在,将客户的年龄范围和客户基本信息进行匹配,在确定客户的年龄范围和客户基本信息匹配时,根据客户基本信息或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。若不存在,直接根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
参见图2,为本发明实施例示出的一种语音通话接入方法的流程示意图,该方法包括:
步骤S201:获取客户拨打客服电话时输入的语音和电话号码。
可选的,客户通过客户终端拨打客服电话,并通过语音输入选择对应的语言类型和咨询的业务。
在具体实现步骤S201的过程中,获取客户输入的语音,并获取客户拨打客服电话的电话号码,也就是说,获取客户拨打客服电话时使用的客户终端所对应的电话号码。
步骤S202:将语音作为语音识别模型的输入,在语音识别模型中对语音进行处理,输出客户的年龄范围。
在步骤S202中,语音识别模型由历史数据进行训练得到。
在具体实现步骤S202的过程中,利用语音识别模型对输入的语音进行处理,得到与该语音对应的年龄范围。
步骤S203:基于所述电话号码,确定数据库中是否存在与所述电话号码对应的客户基本信息,若存在,则执行步骤S204,若不存在,则执行步骤S206。
在具体实现步骤S203的过程中,遍历数据库,查找数据库中是否存在与所述电话号码对应的客户基本信息,若存在,则执行步骤S204,若不存在,则执行步骤S206。
需要说明的是,客户基本信息至少包括客户的年龄和客户图像。
步骤S204:确定所述客户基本信息与所述客户的年龄范围是否匹配,若匹配,则执行步骤S205,若不匹配,则执行步骤S207。
在具体实现步骤S204的过程中,为了更准确的确定客户的年龄,需要判断客户基本信息中的年龄是否处于所述客户的年龄范围内,若处于,则执行步骤S205,若不处于,则执行步骤S207。
可选的,基于上述步骤S204所示出匹配方式外,还可以利用其他的方式进行匹配,将客户的年龄范围与客户图像进行匹配,具体的,利用图像识别技术识别客户图像,确定客户图像对应的年龄;再判断客户图像对应的年龄是否处于所述客户的年龄范围内,若处于,则执行步骤S205,若不处于,则执行步骤S207。
步骤S205:根据客户基本信息或者客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中。
在步骤S205中,通话级别用于指示接入通话的速度。
在具体实现步骤S205的过程中,将所述客户的通话接入与所述客户基本信息的年龄或者客户的年龄范围确定客户的通话级别,并将客户的通话接入相应通话级别的客服终端中,与客服终端的客服进行语音通话。
需要说明的是,年龄范围和客户基本信息的年龄均可分为两个部分,比如可分为0-59岁,和60岁以上,其中60岁以上包括60岁。
每一部分的年龄范围均对应一个通话级别,每一部分的客户基本信息的年龄也均对应一个通话级别;每一通话级别对应一定数量的客服。
步骤S206:根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。
在具体实现步骤S206的过程中,根据客户的年龄范围确定客户的通话级别,并将客户的通话接入相应通话级别的客服终端中,与客服终端的客服进行语音通话。
步骤S207:根据客户基本信息将所述客户的通话接入相应通话级别的语音通话中。
在具体实现步骤S207的过程中,根据客户基本信息确定客户的通话级别,并将客户的通话接入相应通话级别的客服终端中,与客服终端的客服进行语音通话。
在本发明实施例中,利用训练好的语音识别模型对客户输入的语音进行处理,从而得到客户的年龄范围;从数据库中确定是否存在与电话号码对应的客户基本信息;若存在,将客户的年龄范围和客户基本信息进行匹配,从而确定语音识别模型处理得到的客户的年龄范围是否更加准确。在确定客户的年龄范围和客户基本信息匹配时,根据客户基本信息或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。若不存在,直接根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
基于上述本发明实施例示出的语音通话接入方法,在步骤S102由历史数据进行训练得到语音识别模型的过程,包括以下步骤:
步骤S11:获取历史数据。
在步骤S11中,所述历史数据包括多个历史语音和与每一历史语音对应的年龄。
在本发明实施例中,声音有不同的语音物理属性,其中,语音物理属性包括音质、音长、音高、音强、语速等语音特征。不同的人会有不同的声音特征,在语音图谱上体现的就是参数的差异,且每一发音人的言语习惯不同,使得不同人在不同年龄段的说话习惯和语音特征也会存在较大差异。因此可通过通话人的语音物理属性和通话人的说话内容的特征参数,来预测通话人的年龄范围。
在具体实现步骤S11的过程中,采集历史时间段内客户进行客服通话的历史语音,以及客户年龄。
需要说明的是,历史时间段是一个具体的时间段,例如2018年的1月到2020年12月这一时间段。
步骤S12:对历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据。
在步骤S12中,语音特征数据包括音质、音长、音高、音强、语速等相关特征数据。
在具体实现步骤S12的过程中,首先对采集到的历史语音进行抗噪处理,得到语音的物理属性;并根据语音的物理属性进行声纹特征提取,得到声音数据的音质、音长、音高、音强、语速等相关特征数据;接着根据每一语音通话将客户的说话内容进行语音语义转换,以对说话的内容进行独热编码one-hot编码,得到语音内容特征数据。
步骤S13:利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的语音识别模型。
在具体实现步骤S13的过程中,首先先对内容特征数据进行PCA降维(PrincipalComponent Analysis,主成分分析);接着将降维后的内容特征数据和语音特征数据分为两部分,一部分的降维后的内容特征数据和语音特征数据用作训练集,另一部分的降维后的内容特征数据和语音特征数据用作测试集;然后根据历史数据中的客户年龄对训练集和测试集中的数据标注对应的客户年龄。最后,利用标注年龄后的训练集先对循环神经网络模型进行训练学习,得到初始语音识别模型;再利用测试集对初始语音识别模型进行优化训练,得到训练完成的语音识别模型。
在本发明实施例中,获取历史数据;对历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据。利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的语音识别模型。以便于后续利用训练好的语音识别模型对客户输入的语音进行处理,确定客户的年龄范围。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
基于上述本发明实施例示出的语音通话接入方法,在步骤S105根据客户基本信息或者客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中的过程中,包括:
步骤S21:判断所述客户基本信息中的年龄或者所述客户的年龄范围是否大于或等于第一年龄阈值,若大于或等于,则执行步骤S22,若小于,则执行步骤S23。
在具体实现步骤S21的过程中,为了更好的确定客户是否为老年人,需要对预测得到的年龄范围进行判断,以确定所述客户基本信息中的年龄是否大于或等于第一年龄阈值,或者,客户的年龄范围是否大于或等于第一年龄阈值,若所述客户基本信息中的年龄或者客户的年龄范围大于或等于第一年龄阈值,则执行步骤S22,若所述客户基本信息中的年龄或者客户的年龄范围小于第一年龄阈值,则执行步骤S23。
需要说明的是,第一年龄阈值可设置为60。
步骤S22:将客户的通话接入通话级别高的语音通话中。
在具体实现步骤S32的过程中,在所述客户基本信息中的年龄或者客户的年龄范围大于或等于第一年龄阈值时,确定客户的通话级别为高,此时说明客户为老年人,并为客户提供快速进入人工客服的功能,即将客户的通话接入相应通话级别高的客服终端中,与客服终端的客服进行语音通话。
需要说明的是,通话级别高用于将客户的客服通话快速接入,也就是说,优先对该客户进行人工服务。
步骤S23:将客户的通话接入通话级别低的语音通话中。
在具体实现步骤S23的过程中,在所述客户基本信息中的年龄或者客户的年龄范围小于第一年龄阈值时,确定客户的通话级别为低,将客户的通话接入相应通话级别低的客服终端中,与客服终端的客服进行语音通话。
需要说明的是,通话级别低用于跟据需要人工客服,且小于第一年龄阈值的客户数量确定客服通话接入的速度。
在本发明实施例中,判断客户基本信息中的年龄或者客户的年龄范围是否大于或等于第一年龄阈值,在确定客户基本信息中的年龄或者客户的年龄范围是否大于或等于第一年龄阈值,说明客户为老年客户,此时确定客户的通话级别为高,此时说明客户为老年人,并为客户提供快速进入人工客服的功能,即将客户的通话接入相应通话级别高的客服终端中,与客服终端的客服进行语音通话。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
基于上述本发明实施例示出的语音通话接入方法,在步骤S106根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中的过程中,包括:
步骤S31:判断客户的年龄范围是否大于第一年龄阈值,若大于,则执行步骤S32,若小于,则执行步骤S33。
在具体实现步骤S31的过程中,为了更好的确定客户是否为老年人,需要对预测得到的年龄范围进行判断,以确定客户的年龄范围是否大于或等于第一年龄阈值,若客户的年龄范围大于或等于第一年龄阈值,则执行步骤S32,若客户的年龄范围小于第一年龄阈值,则执行步骤S33。
需要说明的是,第一年龄阈值可设置为60。
步骤S32:将客户的通话接入通话级别高的语音通话中。
在具体实现步骤S32的过程中,在所述客户的年龄范围大于或等于第一年龄阈值时,确定客户的通话级别为高,此时说明客户为老年人,并为客户提供快速进入人工客服的功能,即将客户的通话接入相应通话级别高的客服终端中,与客服终端的客服进行语音通话。
需要说明的是,通话级别高用于将客户的客服通话快速接入,也就是说,优先对该客户进行人工服务。
步骤S33:将客户的通话接入通话级别低的语音通话中。
在具体实现步骤S33的过程中,在客户的年龄范围小于第一年龄阈值时,确定客户的通话级别为低,将客户的通话接入相应通话级别低的客服终端中,与客服终端的客服进行语音通话。
需要说明的是,通话级别低用于跟据需要人工客服,且小于第一年龄阈值的客户数量确定客服通话接入的速度。
在本发明实施例中,判断客户的年龄范围是否大于或等于第一年龄阈值,在确定客户的年龄范围是否大于或等于第一年龄阈值,说明客户为老年客户,此时确定客户的通话级别为高,此时说明客户为老年人,并为客户提供快速进入人工客服的功能,即将客户的通话接入相应通话级别高的客服终端中,与客服终端的客服进行语音通话。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
与上述本发明实施例公开的语音通话接入方法相比,本发明实施例还对应柜面交易的授权装置,如图3所示,为本发明实施例公开的一种语音通话接入装置的结构示意图,该语音通话接入装置包括:
获取单元301,用于获取客户拨打客服电话时输入的语音和电话号码。
语音识别模型302,用于将所述语音作为语音识别模型的输入,在所述语音识别模型中对所述语音进行处理,输出客户的年龄范围,所述语音识别模型由构建单元305训练得到。
确定单元303,用于基于所述电话号码,确定数据库中是否存在与所述电话号码对应的客户基本信息。
第一接入单元304,用于若存在,且确定所述客户基本信息与所述客户的年龄范围匹配时,根据客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中。
需要说明的是,上述本发明实施例公开的语音通话接入装置中的各个单元具体的原理和执行过程,与上述本发明实施示出的语音通话接入方法相同,可参见上述本发明实施例公开的语音通话接入方法中相应的部分,这里不再进行赘述。
在本发明实施例中,利用训练好的语音识别模型对客户输入的语音进行处理,从而得到客户的年龄范围;从数据库中确定是否存在与电话号码对应的客户基本信息;若存在,将客户的年龄范围和客户基本信息进行匹配,从而确定语音识别模型处理得到的客户的年龄范围是否更加准确。在确定客户的年龄范围和客户基本信息匹配时,根据客户基本信息或者客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
可选的,基于上述本发明实施例示出的语音通话接入装置,结合图3,参见图4,语音通话接入装置还进一步设置有第二接入单元306。
第二接入单元306,用于若确定数据库中不存在与所述电话号码对应的客户基本信息,根据所述客户的年龄范围将客户的通话接入相应通话级别的语音通话中,所述通话级别用于指示接入通话的速度。
在本发明实施例中,利用训练好的语音识别模型对客户输入的语音进行处理,从而得到客户的年龄范围;从数据库中确定是否存在与电话号码对应的客户基本信息。若不存在,直接根据客户的年龄范围将客户的通话接入相应通话级别的语音通话中。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
可选的,基于上述本发明实施例示出的语音通话接入装置,所述第二接入单元306,具体用于:判断所述客户的年龄范围是否大于或等于第一年龄阈值;若大于或等于,将客户的通话接入通话级别高的语音通话中;若小于,将客户的通话接入通话级别低的语音通话中。
在本发明实施例中,判断客户的年龄范围是否大于或等于第一年龄阈值,在确定客户的年龄范围是否大于或等于第一年龄阈值,说明客户为老年客户,此时确定客户的通话级别为高,此时说明客户为老年人,并为客户提供快速进入人工客服的功能,即将客户的通话接入相应通话级别高的客服终端中,与客服终端的客服进行语音通话。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
可选的,基于上述本发明实施例示出的语音通话接入装置,所述构建单元305,具体用于:获取历史数据,所述历史数据包括多个历史语音和与每一历史语音对应的年龄;对所述历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据;利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的语音识别模型。
在本发明实施例中,获取历史数据;对历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据。利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的语音识别模型。以便于后续利用训练好的语音识别模型对客户输入的语音进行处理,确定客户的年龄范围。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
可选的,基于上述本发明实施例示出的语音通话接入装置,所述第一接入单元304,具体用于:判断所述客户基本信息中的年龄或者所述客户的年龄范围是否大于或等于第一年龄阈值;若大于或等于,将客户的通话接入通话级别高的语音通话中;若小于,将客户的通话接入通话级别低的语音通话中。
在本发明实施例中,判断客户基本信息中的年龄或者客户的年龄范围是否大于或等于第一年龄阈值,在确定客户基本信息中的年龄或者客户的年龄范围是否大于或等于第一年龄阈值,说明客户为老年客户,此时确定客户的通话级别为高,此时说明客户为老年人,并为客户提供快速进入人工客服的功能,即将客户的通话接入相应通话级别高的客服终端中,与客服终端的客服进行语音通话。能够将老年客户的电话快速接入人工客服,从而节约老年客户的时间,且能够提高通话体验。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种语音通话接入方法,其特征在于,所述方法包括:
获取客户拨打客服电话时输入的语音和电话号码;
将所述语音作为语音识别模型的输入,在所述语音识别模型中对所述语音进行处理,输出客户的年龄范围,所述语音识别模型由历史数据进行训练得到;
基于所述电话号码,确定数据库中是否存在与所述电话号码对应的客户基本信息;
若存在,则确定所述客户基本信息中的年龄与所述客户的年龄是否匹配,或者利用图像识别技术识别所述客户基本信息中的客户图像,确定所述客户图像对应的年龄,再确定所述客户图像对应的年龄与所述客户的年龄是否匹配;
若匹配,则根据所述客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中;所述通话级别用于指示接入人工客服通话的速度;
所述由历史数据进行训练得到语音识别模型的过程,包括:
获取历史数据,所述历史数据包括多个历史语音和与每一历史语音对应的年龄;
对所述历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据,包括:对采集到的所述历史语音进行抗噪处理,得到语音的物理属性;并根据所述语音的物理属性进行声纹特征提取,得到包含音质、音长、音高、音强和语速的语音特征数据;根据每一语音通话将客户的说话内容进行语音语义转换,并对语音语义转换后的说话内容进行one-hot编码,得到语音内容特征数据;
利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的所述语音识别模型,包括:对所述内容特征数据进行PCA降维;将降维后的内容特征数据和所述语音特征数据分为两部分,一部分的降维后的所述内容特征数据和所述语音特征数据用作训练集,另一部分的降维后的所述内容特征数据和所述语音特征数据用作测试集;根据所述历史数据中的客户年龄对训练集和测试集中的数据标注对应的客户年龄;利用标注年龄后的所述训练集先对循环神经网络模型进行训练学习,得到初始语音识别模型;利用所述测试集对所述初始语音识别模型进行优化训练,得到训练完成的所述语音识别模型。
2.根据权利要求1所述的方法,其特征在于,还包括:
若确定数据库中不存在与所述电话号码对应的客户基本信息,根据所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中。
3.根据权利要求2所述的方法,其特征在于,所述根据所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中,包括:
判断所述客户的年龄范围是否大于或等于第一年龄阈值;
若大于或等于,将客户的通话接入通话级别高的语音通话中;
若小于,将客户的通话接入通话级别低的语音通话中。
4.根据权利要求1所述的方法,其特征在于,所述根据所述客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中,包括:
判断所述客户基本信息中的年龄或者所述客户的年龄范围是否大于或等于第一年龄阈值;
若大于或等于,将客户的通话接入通话级别高的语音通话中;
若小于,将客户的通话接入通话级别低的语音通话中。
5.一种语音通话接入装置,其特征在于,所述装置包括:
获取单元,用于获取客户拨打客服电话时输入的语音和电话号码;
语音识别模型,用于将所述语音作为语音识别模型的输入,在所述语音识别模型中对所述语音进行处理,输出客户的年龄范围,所述语音识别模型由构建单元训练得到;
确定单元,用于基于所述电话号码,确定数据库中是否存在与所述电话号码对应的客户基本信息;若存在,则确定所述客户基本信息中的年龄与所述客户的年龄是否匹配,或者利用图像识别技术识别所述客户基本信息中的客户图像,确定所述客户图像对应的年龄,再确定所述客户图像对应的年龄与所述客户的年龄是否匹配;
第一接入单元,用于若匹配,则根据所述客户基本信息,或者所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中;所述通话级别用于指示接入人工客服通话的速度;
所述构建单元,具体用于:
获取历史数据,所述历史数据包括多个历史语音和与每一历史语音对应的年龄;
对所述历史数据中的历史语音进行异常数据处理,并提取语音特征数据和内容特征数据,包括:对采集到的所述历史语音进行抗噪处理,得到语音的物理属性;并根据所述语音的物理属性进行声纹特征提取,得到包含音质、音长、音高、音强和语速的语音特征数据;根据每一语音通话将客户的说话内容进行语音语义转换,并对语音语义转换后的说话内容进行one-hot编码,得到语音内容特征数据;
利用所述历史数据中的年龄、语音特征数据和内容特征数据对循环神经网络模型进行训练学习,得到训练完成的所述语音识别模型,包括:对所述内容特征数据进行PCA降维;将降维后的内容特征数据和所述语音特征数据分为两部分,一部分的降维后的所述内容特征数据和所述语音特征数据用作训练集,另一部分的降维后的所述内容特征数据和所述语音特征数据用作测试集;根据所述历史数据中的客户年龄对训练集和测试集中的数据标注对应的客户年龄;利用标注年龄后的所述训练集先对循环神经网络模型进行训练学习,得到初始语音识别模型;利用所述测试集对所述初始语音识别模型进行优化训练,得到训练完成的所述语音识别模型。
6.根据权利要求5所述的装置,其特征在于,还包括:
第二接入单元,用于若确定数据库中不存在与所述电话号码对应的客户基本信息,根据所述客户的年龄范围将所述客户的通话接入相应通话级别的语音通话中。
7.根据权利要求6所述的装置,其特征在于,所述第二接入单元,具体用于:判断所述客户的年龄范围是否大于或等于第一年龄阈值;若大于或等于,将客户的通话接入通话级别高的语音通话中;若小于,将客户的通话接入通话级别低的语音通话中。
8.根据权利要求5所述的装置,其特征在于,所述第一接入单元,具体用于:判断所述客户基本信息中的年龄或者所述客户的年龄范围是否大于或等于第一年龄阈值;若大于或等于,将客户的通话接入通话级别高的语音通话中;若小于,将客户的通话接入通话级别低的语音通话中。
CN202110486449.3A 2021-04-30 2021-04-30 一种语音通话接入方法及装置 Active CN113194210B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110486449.3A CN113194210B (zh) 2021-04-30 2021-04-30 一种语音通话接入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110486449.3A CN113194210B (zh) 2021-04-30 2021-04-30 一种语音通话接入方法及装置

Publications (2)

Publication Number Publication Date
CN113194210A CN113194210A (zh) 2021-07-30
CN113194210B true CN113194210B (zh) 2023-02-24

Family

ID=76983398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110486449.3A Active CN113194210B (zh) 2021-04-30 2021-04-30 一种语音通话接入方法及装置

Country Status (1)

Country Link
CN (1) CN113194210B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114726635B (zh) * 2022-04-15 2023-09-12 北京三快在线科技有限公司 权限验证方法、装置、电子设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109660680A (zh) * 2019-02-06 2019-04-19 刘兴丹 一种选择性接入语音通话的方法、装置
CN110427472A (zh) * 2019-08-02 2019-11-08 深圳追一科技有限公司 智能客服匹配的方法、装置、终端设备及存储介质
CN111683181A (zh) * 2020-04-27 2020-09-18 平安科技(深圳)有限公司 基于语音的用户性别年龄识别方法、装置及计算机设备
CN111816188A (zh) * 2020-06-23 2020-10-23 漳州龙文维克信息技术有限公司 用于智能机器人的人机语音交互方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102834842B (zh) * 2010-03-23 2016-06-29 诺基亚技术有限公司 用于确定用户年龄范围的方法和装置
CN101944359B (zh) * 2010-07-23 2012-04-25 杭州网豆数字技术有限公司 一种面向特定人群的语音识别方法
CN102402985A (zh) * 2010-09-14 2012-04-04 盛乐信息技术(上海)有限公司 提高声纹识别安全性的声纹认证系统及其实现方法
US9349372B2 (en) * 2013-07-10 2016-05-24 Panasonic Intellectual Property Corporation Of America Speaker identification method, and speaker identification system
CN110459214B (zh) * 2014-01-20 2022-05-13 华为技术有限公司 语音交互方法及装置
US10347244B2 (en) * 2017-04-21 2019-07-09 Go-Vivace Inc. Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response
CN111739516A (zh) * 2020-06-19 2020-10-02 中国—东盟信息港股份有限公司 一种针对智能客服通话的语音识别系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109660680A (zh) * 2019-02-06 2019-04-19 刘兴丹 一种选择性接入语音通话的方法、装置
CN110427472A (zh) * 2019-08-02 2019-11-08 深圳追一科技有限公司 智能客服匹配的方法、装置、终端设备及存储介质
CN111683181A (zh) * 2020-04-27 2020-09-18 平安科技(深圳)有限公司 基于语音的用户性别年龄识别方法、装置及计算机设备
CN111816188A (zh) * 2020-06-23 2020-10-23 漳州龙文维克信息技术有限公司 用于智能机器人的人机语音交互方法

Also Published As

Publication number Publication date
CN113194210A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
US11811970B2 (en) Voice and speech recognition for call center feedback and quality assurance
CN109451188B (zh) 差异性自助应答的方法、装置、计算机设备和存储介质
CN110751943A (zh) 一种语音情绪识别方法、装置以及相关设备
CN111833871A (zh) 基于意图识别的智能外呼系统及其方法
CN110110038A (zh) 话务预测方法、装置、服务器及存储介质
CN109145050B (zh) 一种计算设备
CN111554302A (zh) 基于声纹识别的策略调整方法、装置、终端及存储介质
CN113194210B (zh) 一种语音通话接入方法及装置
CN111179936B (zh) 通话录音监控方法
CN111986651A (zh) 一种人机交互方法、装置及智能交互终端
CN113596270A (zh) 基于智能语音客服的外呼策略配置方法、装置及设备
CN113240345A (zh) 客户服务满意度的管理方法及装置、存储介质及电子设备
CN111046366B (zh) 用户身份识别方法、装置和电子设备
CN107154996B (zh) 来电拦截方法、装置、存储介质及终端
CN113793623B (zh) 音效设置方法、装置、设备以及计算机可读存储介质
CN110765242A (zh) 一种客服信息的提供方法,装置及系统
CN114446325A (zh) 基于情绪识别的信息推送方法、装置、计算机设备及介质
CN115379054A (zh) 一种外呼的话术处理方法及装置
US11196864B1 (en) Analyzing voice response to telephone call to assign appropriate agent
CN113593580A (zh) 一种声纹识别方法及装置
CN114036379A (zh) 一种客服推荐方法、装置、电子设备及可读存储介质
CN117240964B (zh) 一种通话过程中的语音识别方法
CN112151070B (zh) 一种语音检测的方法、装置及电子设备
CN111818230A (zh) 一种基于客户按键信息提取关键信息的方法
CN116645225A (zh) 保险服务的营销辅助方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant