CN112714220A - 业务处理方法、装置、计算设备及计算机可读存储介质 - Google Patents

业务处理方法、装置、计算设备及计算机可读存储介质 Download PDF

Info

Publication number
CN112714220A
CN112714220A CN201911024888.1A CN201911024888A CN112714220A CN 112714220 A CN112714220 A CN 112714220A CN 201911024888 A CN201911024888 A CN 201911024888A CN 112714220 A CN112714220 A CN 112714220A
Authority
CN
China
Prior art keywords
voice data
short sentence
preset
recognition model
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911024888.1A
Other languages
English (en)
Other versions
CN112714220B (zh
Inventor
施文驰
齐希
陈永刚
毕晓庆
储晶星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Zhejiang Innovation Research Institute Co ltd
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911024888.1A priority Critical patent/CN112714220B/zh
Publication of CN112714220A publication Critical patent/CN112714220A/zh
Application granted granted Critical
Publication of CN112714220B publication Critical patent/CN112714220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明实施例涉及通信技术领域,公开了一种业务处理方法、装置、计算设备,该方法通过将第一语音数据和第二语音数据分别转换为多个第一短句和多个第二短句,将第一短句和第二短句进行组合,得到对话,如果第一短句中包含预设话术,则将第一短句之后的对话依次输入预设的第二识别模型,若所述第二识别模型输出的结果包含预设的确定信息,处理所述第一短句对应的业务。通过上述方式,本发明实施例实现了根据用户语音信息进行业务处理的目的。

Description

业务处理方法、装置、计算设备及计算机可读存储介质
技术领域
本发明实施例涉及通信技术领域,具体涉及一种业务处理方法、装置、计算设备及计算机可读存储介质。
背景技术
外呼营销是根据市场客户的需求产生的一种营销方式。通过外呼营销可以提高销售部门的销售效率,避免客户流失。图1示出了通信运营商外呼营销的流程图,如图1所示,话务员向用户推销产品,并询问用户是否有办理的意愿,如果用户有办理意愿,话务员经过外呼营销系统向用户发送短信,以提示用户回复短信中的验证码,话务员将用户回复的验证码输入外呼营销系统,如果验证码与外呼营销系统发送的验证码匹配,则确定用户办理该业务,业务办理成功;如果用户没有办理意愿或用户回复的验证码与外呼营销系统发送的验证码不匹配,则该用户损失。
在实现本发明实施例的过程中,发明人发现:现有技术中外呼营销的方式流程繁琐,从而使一些有意愿办理业务的客户因为该繁琐的流程放弃了业务办理,造成用户损失。
发明内容
鉴于上述问题,本发明实施例提供了一种业务处理方法、装置、计算设备及计算机存储介质,克服了上述问题。
根据本发明实施例的一个方面,提供了一种业务处理方法,所述方法包括:
获取第一语音数据及第二语音数据,所述第一语音数据包含第一语音数据的时间信息,所述第二语音数据包含第二语音数据的时间信息;
将所述第一语音数据转换为多个第一短句,并根据所述第一语音数据的时间信息记录所述第一短句对应的时刻;
将所述第二语音数据转换为多个第二短句,并根据所述第二语音数据的时间信息记录所述第二短句对应的时刻;
根据所述第一短句的时刻和所述第二短句的时刻,将所述第一短句和第二短句组成对话;
将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型;
若所述第二识别模型输出的结果包含预设的确定信息,处理所述第一短句对应的业务。
进一步的,将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型,包括:
将多个第一短句对应的时刻将相邻的M个所述第一短句组成特征短句,将所述特征短句输入预设的第一识别模型用于确认是否包含预设话术;所述M为大于1的自然数;
当所述特征短句包含预设话术,所述第一识别模型输出的结果为包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型。
进一步的,所述将所述第一语音数据转换为多个第一短句,包括:
将获取的第一语音数据切分为语音片段,每一语音片段包含的语音帧的帧数相同;
提取每一个语音片段的波纹信息;
将所述波纹信息转换为音素;
将所有语音片段对应的音素识别为文本;
将相邻间隔间的所述文本组成一个第一短句,以得到多个第一短句。
进一步的,获取第一语音数据及第二语音数据之前,所述方法还包括:
获取历史第一语音数据;
根据所述历史第一语音信息得到历史特征短句;对所述历史特征短句进行标识,得到指示标识;
将所述历史特征短句和所述指示标识之间的对应关系作为第一训练数据;
根据所述第一训练数据训练第一二分类器,得到第一识别模型。
进一步的,获取第一语音数据及第二语音数据之前,所述方法还包括:
获取历史第一语音数据和历史第二语音数据;
根据所述历史第一语音数据和所述历史第二语音数据得到历史对话;
对所述历史对话进行标识,得到确认标识;
将所述历史对话和所述确认标识之间的对应关系作为第二训练数据;
根据所述第二训练数据训练第二二分类器,得到第二识别模型。
进一步的,所述获取第一语音数据集第二语音数据包括:
通过第一声道获取第一语音数据,通过第二声道获取第二语音数据。
所述方法进一步包括:若所述第二识别模型输出的结果不包含预设的确定信息,则不处理所述第一短句对应的业务。
本发明实施例还提出了一种业务处理装置,所述装置包括:
获取模块,用于获取第一语音数据及第二语音数据,所述第一语音数据包含第一语音数据的时间信息,所述第二语音数据包含第二语音数据的时间信息;
转换模块,用于将获取的第一语音数据转换为多个第一短句,并根据所述第一语音数据的时间信息记录所述第一短句对应的时刻;将获取的第二语音数据转换为多个第二短句,并根据所述第二语音数据的时间信息记录所述第二短句对应的时刻;
组合模块,用于根据所述第一短句的时刻和所述第二短句的时刻,将所述第一短句和第二短句组成对话;
识别模块,用于将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型;
处理模块,用于当所述第二识别模型输出的结果包含预设的确定信息时,处理所述第一短句对应的业务。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行一种业务处理方法对应的操作。
根据本发明实施例的还一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行一种业务处理方法对应的操作。
本发明实施例将第一语音数据和第二语音数据分别转换为多个第一短句和多个第二短句,将相邻的第一短句和第二短句组合,得到对话,如果第一短句中包含预设话术,则将第一短句对应的时刻之后的对话依次输入预设的第二识别模型,如果第一短句之后的对话包含预设的确认信息,则处理该业务。通过本发明实施例,能够根据第一语音数据和第二语音数据确定用户的办理意愿,与现有技术中需要用户发送验证码的方式相比,流程简单,避免了客户的操作,从而减少了有办理业务意愿的用户的流失。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了现有技术中通信运营商外呼营销的流程图;
图2示出了本发明第一实施例提供的一种业务处理方法的流程图;
图3示出了本发明第二实施例提供的一种业务处理方法的流程图;
图4示出了本发明第三实施例提供的一种业务办理的确认装置的功能框图;
图5示出了本发明第四实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例的应用场景是外呼营销,外呼营销是指话务员通过呼叫用户号码的方式向用户推销业务。在话务员与用户通话过程中,为了保证通话的质量,通话会被录音。话务员向用户推销某一种业务,用户针对该业务向话务员表达办理意愿,话务员接收到用户的办理意愿后,通话结束。业务办理后台根据通话录音判断该会话中是否包含话务员推销的业务,如果包含,则根据该对话录音判断用户针对该推销的业务的办理意愿,如果包含办理意愿,则业务办理后台自动为用户办理业务。下面通过各具体实施例对本发明整体构思做具体说明。
图2示出了本发明第一实施例的一种业务处理方法的流程图,如图2所示,该方法包括以下步骤:
步骤101:获取第一语音数据及第二语音数据,所述第一语音数据包含第一语音数据的时间信息,所述第二语音数据包含第二语音数据的时间信息。
在本步骤中,第一语音数据为话务员的语音信息,比如:话务员为了向客户推销某种业务,向客户介绍产品的具体信息等;第二语音数据为用户的语音信息,比如:用户在听到话务员的业务介绍后,会对该业务进行询问,以及确认是否办理该业务等等。当话务员通过话务员操作系统与用户进行对话时,话务员操作系统对整个对话过程进行录音。执行本发明实施例的装置从话务员操作系统的存储装置中获取录音文件,得到第一语音数据及第二语音数据。
在一种可选的方式中,在对整个对话过程进行录音时,使用双声道进行录音,第一声道对话务员的语音信息进行录音,第二声道对用户的语音信息进行录音。相应的,在获取第一语音数据时,通过第一声道获取第一语音数据,在获取第二语音数据时,通过第二声道获取第二语音数据。
在获取语音数据的过程中,系统会记录每个语音数据的发生时间,比如系统在记录话务员的第一语音数据时,会将第一语音数据的时间信息进行记录,并把该时间和第一语音数据进行关联;系统在记录客户的第二语音数据时,会将第二语音数据的时间信息进行记录,并把该时间和第二语音数据进行关联。
步骤102:将所述第一语音数据转换为多个第一短句,并根据所述第一语音数据的时间信息记录所述第一短句对应的时刻;将所述第二语音数据转换为多个第二短句,并根据所述第二语音数据的时间信息记录所述第二短句对应的时刻。
第一语音数据和第二语音数据为两个声道的语音信息,为了便于区分语音信息的角色并降低语音噪声,对于两个声道的语音信息分别进行转换。第一语音数据转换为文本的转换方式和第二语音数据转换为文本的转换方式相同,以第一语音数据转换为文本为例,转换过程为:将第一语音数据切分为语音片段,每一语音片段包含的语音帧的帧数相同;提取每一语音片段的波纹信息;将波纹信息转换为音素;将所有语音片段对应的音素识别为文本;将相邻间隔间的所述文本组成第一短句。其中,语音信息是根据语音帧切分为语音片段的,每一语音片段中包含的语音帧的帧数可以由本领域技术人员在实施本发明实施例时人为设置。语音片段中包含有波纹信息,根据该波纹信息,将每一语音片段识别为对应的音素,音素是表示语音的最小单位,多个音素可以组成一个音节。在一种实施方式中,波纹信息通过隐式马尔可夫模型识别为音素,通过卷积神经网络将所有语音片段对应的音素识别为文本。由于在语音中存在停顿,转换为文本之后,文本之间存在间隔,根据该间隔确定文本中的多个第一短句。同时,根据所述第一语音数据的时间信息记录所述多个第一短句对应的时刻,根据所述第二语音数据的时间信息记录所述多个第二短句对应的时刻。即在进行语音片段识别的过程中,需要记录切片之后的每个短句对应的时刻,以便于后续再进行短句组合时,能够按照先后顺序进行组合。
优选的,可以将M个相邻的第一短句组成特征短句,M为大于1的自然数。在本步骤中,M的取值可以由本领域技术人员在实施本发明实施例时人为设置,M的最大值不能超过对话中包含的第一短句的总数,一般全部的第一短句可以组合成为多个特征短句。在一些实施例中,M的取值为3,即将相邻的3个第一短句组合,得到形式为“三元组”的特征短句,此处的“三元组”指每一特征短句中包含三个第一短句。以M取值为3为例,第一短句为A1A2A3A4A5,则特征短句为A1A2A3、A2A3A4、A3A4A5
步骤103:根据所述第一短句的时刻和所述第二短句的时刻,将所述第一短句和第二短句组成对话。
在本步骤中,第一短句的时间信息用于指示第一短句对应的第一语音数据发生的先后顺序。第二短句的时间信息用于指示第二短句对应的第二语音数据发生的先后顺序。在一种实施方式中,第一语音数据的时间和第二语音数据的时间均按照北京时间进行记录,根据语音之间的停顿的时刻,每一次停顿记录一次语音信息的时间,每一次记录作为一条语音信息。第一语音数据的时间和第二语音数据的时间具有连续性,以一段对话中有三条第一语音数据和两条第二语音数据为例,每一条第一语音数据的时刻分别为10点20分15秒、10点20分50秒、10点21分10秒,每一条第二对应的时刻分别为10点20分25秒、10点20分58秒。在另一种实施方式中,按照通话的时间顺序进行标注,例如,话务员在一段1分钟时长的通话过程中一共说了三句话,每一句话对应的时刻分别在1秒、30秒和55秒,用户在该通话过程中说了两句话,每一句话对应的时刻分别为25秒和45秒。值得说明的是,在本发明实施例中所记录的时间是每一句话开始的时刻。
按照第一短句的时刻和第二短句的时刻将第一短句和第二短句组合,得到对话。优选的,本发明实施例中,优先采用三元组的方式对对话进行组合,将相邻的对话组成多个对话三元组。也可以采用其他多元组的方式进行组合,比如:将相邻的N个第一短句和第二短句合并,得到多个对话,每一个对话包括至少一个第一短句和至少一个第二短句。以第一短句对应的第一语音数据的时间,第二短句对应的第二语音数据的时间为例,由于第一语音数据的时间和第二语音数据的时间具有连续性,因此,按照时间顺序将第一短句和第二短句组合,得到组合短句。组合短句是话务员和用户对话的整个过程中包含的所有第一短句和第二短句。在将相邻的N个组合短句合并时,N的取值可以由本领域技术人员在实施本发明实施例时人为设置,N的最大值不能超过对话中包含的所有第一短句和第二短句的总数,一般全部的组合短句可以组合成为多个对话。以N等于3为例,组合短句为Q1A1Q2A2A3Q3,其中,Q表示第一短句,A表示第二短句,则对话分别为:Q1A1Q2、A1Q2A2、Q2A2A3、A2A3Q3
步骤104:将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二模型。
在本步骤中,预设的第一识别模型和预设的第二识别模型都是通过训练分类模型得到的,具体的训练过程在下一个实施例中进行说明,在此不再赘述。预设话术是指话务员可能会推销的业务对应的特定话术,例如,预设话术可以是“现在为您办理彩铃业务,同意的话请回复1”、“现在为您办理来电提醒,同意的话请回复1”等业务对应的话术。
将第一短句输入预设的第一识别模型,第一识别模型输出该特征短句所对应的输出结果,该输出结果可以是一个指示标识,该指示标识用于指示特征短句中是否包含预设话术;该输出结果也可以是一个二维概率向量,每一维分别用于指示包含预设话术和不包含预设话术的概率,两维概率的加和为1。如果两个概率值中的最大值对应的类别为包含预设话术,则说明第一短句中包含预设话术,否则,第一短句中不包含预设话术。具体输出结果的形式是本领域技术人员在训练第一识别模型是进行设计的,本发明实施例并不以此为限。在一些实施方式中,也可以将所有第一短句按照顺序信息排序,其中,第一短句的顺序信息为特征短句中顺序最小的第一短句对应的顺序信息。由于在将第一短句合并成特征短句时,将第一短句按照顺序信息进行合并,所以,在每一个特征短句中,顺序最小的第一短句对应的顺序信息为特征短句的顺序信息。
将排序后的特征短句依次输入第一识别模型,直至输出结果表示包含预设话术,并不再输入其他的特征短句。例如,特征短句排列之后,得到的特征短句的顺序为S1、S2、S3、S4、S5,当输入S3的时候,输出结果表示包含预设话术,则不再输入S4和S5进行识别。
确定包含预设话术的第一短句后,第一短句之后的对话根据第一短句和对话中时间最早的第一短句或第二短句的顺序信息确定。对话对应的时间为对话中时间最小的对话对应的时间。由于在将第一短句和第二短句组合成对话时,第一短句和第二短句按照时间顺序进行组合,所以,在每一个对话中,时间最小的对话对应的时间为第一个第一短句对应的时间。根据时间顺序,确定第一时间之后的所有对话。为了便于描述,将第一时间之后的所有对话标记为目标对话。应理解,目标对话包括第一时间对应的对话,例如,对话为Q1A1Q2A2A3Q3A4A5Q4,其中,Q表示第一短句,A表示第二短句,以M=N=3为例,特征短句分别为:A1A2A3、A2A3A4、A3A4A5,对话分别为:Q1A1Q2、A1Q2A2、Q2A2A3、A2A3Q3、A3Q3A4、Q3A4A5、A4A5Q4,包含预设话术的特征短句为A2A3A4,目标对话为A2A3Q3、A3Q3A4、Q3A4A5、A4A5Q4。将目标对话输入预设的第二识别模型。
步骤105:若所述第二识别模型输出的结果包含预设的确定信息,处理所述第一短句对应的业务;否则,则不处理所述业务。
在本步骤中,预设的确认信息是用户针对话务员询问的业务作出的表达自己办理业务的意愿的特定词语,确认信息与话务员使用的预设话术相对应,例如,话务员使用的预设话术为“现在为您办理彩铃业务,同意的话请回复1”,则确认信息可以是“1”。将每一个目标对话输入第二识别模型后,第二识别模型均会输出一个输出结果,该输出结果用于指示输入的目标对话中是否包含确认信息。例如,输出结果为确认标识,包含确认信息的确认标识为第一确认标识,不包含确认信息的确认标识为第二确认标识,第一确认标识和第二确认标识为不同的确认标识。确认标识的形式可以由本领域技术人员进行定义,应理解,第二识别模型和步骤105中的第一识别模型为两个独立的模型,因此,确认标识和指示标识的形式可以相同也可以不同。具体的确认标识的形式与训练第二识别模型时对历史对话的确认标识相同。第二识别模型的训练过程请参考下面实施例的描述,在此不做赘述。
在一种实施方式中,将所有目标对话按照目标对话的顺序信息排序,将排序后的目标对话依次输入第二识别模型,直至得到用于指示包含确认信息的输出结果,则处理业务,并不再输入其他的目标对话。例如,目标对话排列之后,得到的目标对话的顺序为M1、M2、M3、M4、M5,当输入M3的时候,输出结果指示M3包含确认信息,则不再输入M4和M5进行识别。如果输入所有的目标对话后,输出结果均指示不包含确认信息,则不处理业务。
本发明实施例将第一语音数据和第二语音数据分别转换为多个第一短句和多个第二短句,将相邻的第一短句和第二短句组合,得到对话,如果第一短句中包含预设话术,则将第一短句之后的对话依次输入预设的第二识别模型,如果第一短句之后的对话包含预设的确认信息,则处理该业务。通过本发明实施例,能够根据第一语音数据和第二语音数据确定用户的办理意愿,与现有技术中需要用户发送验证码的方式相比,流程简单,避免了客户的操作,从而减少了有办理业务意愿的用户的流失。同时进一步的,通过将第一短句组合成特征短句,将第一短句和第二短句组合成对话,根据特征短句和对话确定用户的办理意愿,相较于根据每一个第一短句和第二短句确定用户办理的办理意愿,效率更高;预设的第一识别模型和预设的第二识别模型是训练得到的模型,包含了历史所有第一语音和第二语音,识别效果更好;此外,在确定了包含预设话术的特征短句之后,仅需要对发生在该特征短句之后的对话进行识别,无需对该特征短句之前的对话进行识别,从而提高了识别的效率。
图3示出了本发明第二实施例的一种业务处理方法的流程图,本发明实施例与第一实施例的不同之处在于,在步骤101之前,本实施例还包括如图3所示的以下步骤:
步骤100:训练第一识别模型,以及,训练第二识别模型。
在本步骤中,训练第一识别模型包括以下步骤:获取历史第一语音数据;根据历史第一语音数据得到历史特征短句;对历史特征短句进行标识,得到指示标识,包含预设话术的历史第一特征信息对应的指示标识为第一指示标识,不包含预设话术的历史第一特征信息对应的标识为第二指示标识;将历史特征短句和指示标识之间的对应关系作为第一训练数据;根据第一训练数据训练第一二分类器,得到第一识别模型。在训练过程中,获得的历史第一语音数据中包含多个独立的会话,每一个独立的会话中话务员的语音信息作为一个历史第一语音数据。根据历史第一语音数据得到历史特征短句的过程可以参考第一实施例中的步骤101~步骤103的描述,在此不再赘述。在进行训练时,第一二分类器学习特征短句和指示标识的对应关系,并通过损失函数更新第一二分类器的参数,直至损失函数最小,将损失函数最小的参数及第一二分类器的结构作为第一识别模型。所使用的第一二分类器可以是机器学习中的任何一种有监督的二分类器,例如,支持向量机等。
训练第二识别模型包括:获取历史第一语音数据和历史第二语音数据;根据历史第一语音数据和历史第二语音数据得到历史对话;对历史对话进行标识,得到确认标识,包含确认信息的历史第二特征信息对应的确认标识为第一确认标识,不包含确认信息的所述历史第二特征信息对应的确认标识为第二确认标识;将历史对话和所述确认标识之间的对应关系作为第二训练数据;根据第二训练数据训练第二二分类器,得到第二识别模型。根据历史第二语音数据得到历史对话的过程可以参考第一实施例中的步骤101~步骤103的描述,在此不再赘述。应理解,第一识别模型和第二识别模型是两个独立的模型,因此,第一二分类器和第二二分类器可以是有监督机器学习算法中的同一种二分类器,也可以是不同种二分类器。
本发明实施例通过训练二分类模型得到第一识别模型和第二识别模型,第一识别模型和第二识别模型中分别包含了历史第一语音数据和历史第二语音数据的特征,因此,通过第一识别模型和第二识别模型对用户办理用户意愿进行识别时,识别结果更加准确。
图4示出了本发明第三实施例的一种业务处理装置的功能框图,如图4所示,该装置包括:
获取模块301,用于获取第一语音数据及第二语音数据,所述第一语音数据包含第一语音数据的时间信息,所述第二语音数据包含第二语音数据的时间信息;
转换模块302,用于将获取的第一语音数据转换为多个第一短句,并根据所述第一语音数据的时间信息记录所述第一短句对应的时刻;将获取的第二语音数据转换为多个第二短句,并根据所述第二语音数据的时间信息记录所述第二短句对应的时刻;
组合模块303,
用于根据第一短句的时刻和第二短句的时刻,将所述第一短句和第二短句组成对话;
识别模块304,用于将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型;
处理模块305,用于当所述第二识别模型输出的结果包含预设的确定信息时,处理所述第一短句对应的业务。
可选的,转化模块302进一步用于:将获取的第一语音数据切分为语音片段,每一语音片段包含的语音帧的帧数相同;提取每一个语音片段的波纹信息;将所述波纹信息转换为音素;将所有语音片段对应的音素识别为文本;将相邻间隔间的所述文本组成一个第一短句,以得到多个第一短句。
可选的,识别模块304,还用于将多个第一短句对应的时刻将相邻的M个所述第一短句组成特征短句,将所述特征短句输入预设的第一识别模型用于确认是否包含预设话术;所述M为大于1的自然数;
当所述特征短句包含预设话术,所述第一识别模型输出的结果为包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型。
可选的,所述装置还包括第一训练模块306,用于实现以下功能:
获取历史第一语音数据;
根据所述历史第一语音数据得到历史特征短句;
对所述历史特征短句进行标识,得到指示标识;
将所述历史特征短句和所述指示标识之间的对应关系作为第一训练数据;
所述第一训练数据训练第一二分类器,得到第一识别模型。
可选的,所述装置还包括第二训练模块307,用于实现以下功能:
获取历史第一语音数据和历史第二语音数据;
根据所述历史第一语音数据和所述历史第二语音数据得到历史对话;
对所述历史对话进行标识,得到确认标识;
将所述历史对话和所述确认标识之间的对应关系作为第二训练数据;
根据所述第二训练数据训练第二二分类器,得到第二识别模型。
可选的,获取模块301进一步用于:通过第一声道获取第一语音数据,通过第二声道获取第二语音数据。
本发明实施例将第一语音数据和第二语音数据分别转换为多个第一短句和多个第二短句,将相邻的第一短句和第二短句组合,得到对话,如果第一短句中包含预设话术,则将第一短句对应时刻之后的对话依次输入预设的第二识别模型,如果第一短句对应的时刻之后的对话包含预设的确认信息,则处理该业务。通过本发明实施例,能够根据第一语音数据和第二语音数据确定用户的办理意愿,与现有技术中需要用户发送验证码的方式相比,流程简单,避免了客户的操作,从而减少了有办理业务意愿的用户的流失;将第一短句组合成特征短句,将第一短句和第二短句组合成对话,根据特征短句和对话确定用户的办理意愿,相较于根据每一个第一短句和第二短句确定用户办理的办理意愿,效率更高;预设的第一识别模型和预设的第二识别模型是训练得到的模型,包含了历史所有第一语音和第二语音,识别效果更好;此外,在确定了包含预设话术的特征短句之后,仅需要对发生在该特征短句之后的对话进行识别,无需对该特征短句之前的对话进行识别,从而提高了识别的效率。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的一种业务处理方法。
图5示出了本发明第四实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述一种业务处理方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行图2中的步骤101~步骤106、图3中的步骤100~步骤106,以及实现图4中的模块301~模块308的功能。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种业务处理方法,其特征在于,所述方法包括:
获取第一语音数据及第二语音数据,所述第一语音数据包含第一语音数据的时间信息,所述第二语音数据包含第二语音数据的时间信息;
将所述第一语音数据转换为多个第一短句,并根据所述第一语音数据的时间信息记录所述第一短句对应的时刻;
将所述第二语音数据转换为多个第二短句,并根据所述第二语音数据的时间信息记录所述第二短句对应的时刻;
根据所述第一短句的时刻和所述第二短句的时刻,将所述第一短句和第二短句组成对话;
将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型;
若所述第二识别模型输出的结果包含预设的确定信息,处理所述第一短句对应的业务。
2.根据权利要求1所述的方法,其特征在于,将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型,包括:
将多个第一短句对应的时刻将相邻的M个所述第一短句组成特征短句,将所述特征短句输入预设的第一识别模型用于确认是否包含预设话术;所述M为大于1的自然数;
当所述特征短句包含预设话术,所述第一识别模型输出的结果为包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一语音数据转换为多个第一短句,包括:
将获取的第一语音数据切分为语音片段,每一语音片段包含的语音帧的帧数相同;
提取每一个语音片段的波纹信息;
将所述波纹信息转换为音素;
将所有语音片段对应的音素识别为文本;
将相邻间隔间的所述文本组成一个第一短句,以得到多个第一短句。
4.根据权利要求1所述的方法,其特征在于,获取第一语音数据及第二语音数据之前,所述方法还包括:
获取历史第一语音数据;
根据所述历史第一语音信息得到历史特征短句;对所述历史特征短句进行标识,得到指示标识;
将所述历史特征短句和所述指示标识之间的对应关系作为第一训练数据;
根据所述第一训练数据训练第一二分类器,得到第一识别模型。
5.根据权利要求1所述的方法,其特征在于,获取第一语音数据及第二语音数据之前,所述方法还包括:
获取历史第一语音数据和历史第二语音数据;
根据所述历史第一语音数据和所述历史第二语音数据得到历史对话;
对所述历史对话进行标识,得到确认标识;
将所述历史对话和所述确认标识之间的对应关系作为第二训练数据;
根据所述第二训练数据训练第二二分类器,得到第二识别模型。
6.根据权利要求1所述的方法,其特征在于,所述获取第一语音数据集第二语音数据包括:
通过第一声道获取第一语音数据,通过第二声道获取第二语音数据。
7.如权利要求1所述的方法,其特征在于,所述方法进一步包括:若所述第二识别模型输出的结果不包含预设的确定信息,则不处理所述第一短句对应的业务。
8.一种业务处理装置,其特征在于,所述装置包括:
获取模块,用于获取第一语音数据及第二语音数据,所述第一语音数据包含第一语音数据的时间信息,所述第二语音数据包含第二语音数据的时间信息;
转换模块,用于将获取的第一语音数据转换为多个第一短句,并根据所述第一语音数据的时间信息记录所述第一短句对应的时刻;将获取的第二语音数据转换为多个第二短句,并根据所述第二语音数据的时间信息记录所述第二短句对应的时刻;
组合模块,用于根据所述第一短句的时刻和所述第二短句的时刻,将所述第一短句和第二短句组成对话;
识别模块,用于将所述第一短句输入预设的第一识别模型,若所述第一识别模型输出的结果包含预设话术,按照时间顺序将所述第一短句之后的对话依次输入预设的第二识别模型;
处理模块,用于当所述第二识别模型输出的结果包含预设的确定信息时,处理所述第一短句对应的业务。
9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7任意一项所述的一种业务处理方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7任一项所述的一种业务处理方法对应的操作。
CN201911024888.1A 2019-10-25 2019-10-25 业务处理方法、装置、计算设备及计算机可读存储介质 Active CN112714220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911024888.1A CN112714220B (zh) 2019-10-25 2019-10-25 业务处理方法、装置、计算设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911024888.1A CN112714220B (zh) 2019-10-25 2019-10-25 业务处理方法、装置、计算设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112714220A true CN112714220A (zh) 2021-04-27
CN112714220B CN112714220B (zh) 2022-06-14

Family

ID=75540832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911024888.1A Active CN112714220B (zh) 2019-10-25 2019-10-25 业务处理方法、装置、计算设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112714220B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254696A (zh) * 2016-08-02 2016-12-21 北京京东尚科信息技术有限公司 外呼结果确定方法、装置及系统
US20180288230A1 (en) * 2017-03-29 2018-10-04 International Business Machines Corporation Intention detection and handling of incoming calls
CN109274841A (zh) * 2018-08-24 2019-01-25 平安科技(深圳)有限公司 电话销售方法、系统及平台和计算机可读存储介质
CN109462707A (zh) * 2018-11-13 2019-03-12 平安科技(深圳)有限公司 基于自动外呼系统的语音处理方法、装置和计算机设备
CN110351443A (zh) * 2019-06-17 2019-10-18 深圳壹账通智能科技有限公司 智能外呼处理方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254696A (zh) * 2016-08-02 2016-12-21 北京京东尚科信息技术有限公司 外呼结果确定方法、装置及系统
US20180288230A1 (en) * 2017-03-29 2018-10-04 International Business Machines Corporation Intention detection and handling of incoming calls
CN109274841A (zh) * 2018-08-24 2019-01-25 平安科技(深圳)有限公司 电话销售方法、系统及平台和计算机可读存储介质
CN109462707A (zh) * 2018-11-13 2019-03-12 平安科技(深圳)有限公司 基于自动外呼系统的语音处理方法、装置和计算机设备
CN110351443A (zh) * 2019-06-17 2019-10-18 深圳壹账通智能科技有限公司 智能外呼处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN112714220B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN109658923B (zh) 基于人工智能的语音质检方法、设备、存储介质及装置
US10592611B2 (en) System for automatic extraction of structure from spoken conversation using lexical and acoustic features
CN111241357A (zh) 对话训练方法、装置、系统及存储介质
CN111259132A (zh) 话术推荐方法、装置、计算机设备和存储介质
CN111261162B (zh) 语音识别方法、语音识别装置及存储介质
US20110172989A1 (en) Intelligent and parsimonious message engine
CN110610705B (zh) 一种基于人工智能的语音交互提示器
CN110890088B (zh) 语音信息反馈方法、装置、计算机设备和存储介质
CN111739519A (zh) 基于语音识别的对话管理处理方法、装置、设备及介质
CN110704590B (zh) 扩充训练样本的方法和装置
CN110704618B (zh) 确定对话数据对应的标准问题的方法及装置
CN109544104A (zh) 一种招聘数据处理方法及装置
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN109003600B (zh) 消息处理方法及装置
US20150179165A1 (en) System and method for caller intent labeling of the call-center conversations
CN110111778B (zh) 一种语音处理方法、装置、存储介质及电子设备
CN109559744B (zh) 语音数据的处理方法、装置及可读存储介质
CN108962228B (zh) 模型训练方法和装置
CN110750626B (zh) 一种基于场景的任务驱动的多轮对话方法及系统
WO2021135140A1 (zh) 匹配情感极性的词语采集
JPWO2014208298A1 (ja) 文章分類装置、文章分類方法、及び文章分類プログラム
CN112714220B (zh) 业务处理方法、装置、计算设备及计算机可读存储介质
CN111414732A (zh) 文本风格转换方法、装置、电子设备及存储介质
CN116127011A (zh) 意图识别方法、装置、电子设备及存储介质
CN112101046B (zh) 一种基于通话行为的会话分析方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231226

Address after: No.19, Jiefang East Road, Hangzhou, Zhejiang Province, 310000

Patentee after: CHINA MOBILE GROUP ZHEJIANG Co.,Ltd.

Patentee after: China Mobile (Zhejiang) Innovation Research Institute Co.,Ltd.

Patentee after: CHINA MOBILE COMMUNICATIONS GROUP Co.,Ltd.

Address before: No. 19, Jiefang East Road, Hangzhou, Zhejiang Province, 310016

Patentee before: CHINA MOBILE GROUP ZHEJIANG Co.,Ltd.

Patentee before: CHINA MOBILE COMMUNICATIONS GROUP Co.,Ltd.