CN113035191A - 语音交互方法、装置、存储介质和计算机设备 - Google Patents

语音交互方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN113035191A
CN113035191A CN202110219613.4A CN202110219613A CN113035191A CN 113035191 A CN113035191 A CN 113035191A CN 202110219613 A CN202110219613 A CN 202110219613A CN 113035191 A CN113035191 A CN 113035191A
Authority
CN
China
Prior art keywords
conversation
user
client
label
voice interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110219613.4A
Other languages
English (en)
Other versions
CN113035191B (zh
Inventor
胡小伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangyulaite Digital Technology Shanghai Co ltd
Shenzhen Lian Intellectual Property Service Center
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202110219613.4A priority Critical patent/CN113035191B/zh
Publication of CN113035191A publication Critical patent/CN113035191A/zh
Application granted granted Critical
Publication of CN113035191B publication Critical patent/CN113035191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请涉及语音交互技术领域,揭示了一种语音交互方法、装置、存储介质和计算机设备,其中方法包括:当监测到用户在客户端上发起业务请求时,根据业务请求为用户开启语音交互模式;获取用户在语音交互模式下产生的各个对话进程,为各个对话进程设置对话标签,并生成对话进程与对话标签的对照表;当监测到用户异常退出且后续重新进入客户端时,提取用户的对话标签并在客户端上进行显示;响应于用户点击客户端上目标对话标签的点击事件,根据目标对话标签从对照表中查询对应的目标对话进程,继续执行目标对话进程,从而通过对话标签的方式对对话进程进行区分,既能保证用户数据的正常流转,也能保证各个对话进程的健壮性,减少数据交互错误。

Description

语音交互方法、装置、存储介质和计算机设备
技术领域
本申请涉及到语音交互技术领域,特别是涉及到一种语音交互方法、装置、存储介质和计算机设备。
背景技术
语音交互指的是与电子设备进行对话,让它们能按照你的要求替你做事情。如今,语音界面无处不在,我们可以在智能手机、电视、智慧家居和其他一系列产品中接触到它,语音交互功能正快速的渗入我们日常生活中。
现有客户端与语音交互平台之间主要通过作业号进行交互,作业号能够标识唯一的用户,从而能通过语音的方式控制整个对话进程。但是如果客户端在异常退出的情况下,无法及时通知语音交互平台整个对话进程需要结束掉,此时后端的对话进程还在进行中,因此当用户重新进入客户端,并再次发起及新建对话进程后,会导致多个对话进程同时处理中,且多个对话进程中可能存在相同的处理事项,进而导致整个对话进程及页面展示错乱。
发明内容
本申请的主要目的为提供一种语音交互方法、装置、存储介质和计算机设备,旨在解决用户在重新进入客户端,并再次发起及新建对话进程后,由于多个对话进程同时处理中,导致整个对话进程及页面展示错乱的技术问题。
为了实现上述发明目的,本申请提出一种语音交互方法,包括如下步骤:
当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
在一实施例中,所述当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示的步骤,包括:
当所述用户因网络断开、网速低于阈值或当前对话进程卡顿而异常退出时,将处于运行状态的对话进程设置为挂起状态;
当监测到所述用户后续重新进入客户端时,从所述对照表中提取挂起状态的对话进程的对话标签,将所述挂起状态的对话进程对应的对话标签在所述客户端上进行显示。
在一实施例中,所述从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示的步骤,包括:
从所述对照表中提取所述用户的所有对话标签;
获取所述所有对话进程的时间节点;
根据所述时间节点将所述所有对话标签以倒序顺序进行排序,将所述所有对话标签依照所述排序显示在所述客户端上。
在一实施例中,所述获取所述用户在所述语音交互模式下产生的各个对话进程的步骤之后,还包括:
获取所述各个对话进程的语音信息;
将所述语音信息转换为文本信息,并对所述文本信息进行语义解析,根据语义解析结果查找出所述文本信息相应的界面,将所述界面在客户端上进行展示。
在一实施例中,所述对所述文本信息进行语义解析的步骤,包括:
将所述文本信息进行分词,得到多个字词;
从所述多个字词中筛选得到所述文本信息的关键词;
对所述关键词进行语义解析,得到所述文本信息的语义解析结果。
在一实施例中,所述从所述多个字词中筛选得到所述文本信息的关键词的步骤,包括:
获取属性词表,所述属性词表包括若干个属性词;
利用所述属性词表对所述多个字词进行去噪处理,以删除无实质意义的字词,得到所述文本信息的关键词。
在一实施例中,所述利用所述属性词表对所述多个字词进行去噪处理的步骤,包括:
对每一个所述字词进行预处理,得到每一个字词的词序列;
根据所述属性词表以及词序列的长度从所述多个字词的词序列中筛选出目标词序列,其中,所述目标词序列对应的字词为所述关键词。
本申请还提供一种语音交互装置,包括:
监测模块,用于当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
生成模块,用于获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
显示模块,用于当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
执行模块,用于响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的语音交互方法、装置、存储介质和计算机设备,当监测到用户在客户端上发起业务请求时,根据业务请求为用户开启语音交互模式,以通过语音交互方式快速便捷地完成用户所需办理的业务;然后获取用户在语音交互模式下产生的各个对话进程,为各个对话进程设置对话标签,并生成对话进程与对话标签的对照表,以通过对话标签的数据方式进行交互,对各个对话进程进行区分,既能保证用户数据在各个终端之间正常流转,也能保证各个对话进程的健壮性,减少数据交互错误,提升用户体验;当监测到用户异常退出且后续重新进入客户端时,从对照表中提取用户的对话标签并在客户端上进行显示;响应于用户点击客户端上任一对话标签的点击事件,响应点击事件确定的目标对话标签,根据目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程,从而在用户重新进入客户端后,为用户自动显示退出前的对话标签,以便用户获取所需的对话进程,完成该对话进程的修改或后续操作。
附图说明
图1为本申请一实施例的语音交互方法的流程示意图;
图2为本申请一实施例的语音交互装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例中提供的一种语音交互方法,该语音交互方法包括步骤:
S1、当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
S2、获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
S3、当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
S4、响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
本实施例中,用户可通过登录客户端发起业务请求,该业务请求可包括贷款业务请求、还款业务请求、信息查询请求等请求类型,当语音交互平台接收到用户的业务请求时,根据所述业务请求为所述用户开启语音交互模式,并建立用户与业务请求的对应关系,以区分不同用户,便于后续查找。在语音交互模式中,将各个处理事项所需填写的信息通过问答的形式完成录入,并将用户语音交互过程中的每个对话进程进行预先保存,为每个对话进程设置对话标签,生成所述对话进程与对话标签的对照表,以当用户异常退出或客户端当前对话进程挂掉时,根据所述对话标签找到所需的对话进程,完成后续处理事项。其中,所述对话标签可以文本、数字、时间或图片的方式进行表示,例如,当前对话进程的目的是完成个人信息填写时,则其对应的对话标签可以是“个人信息”的形式;当对话标签以时间的形式进行表示时,则各个对话标签为各个对话进程异常退出时的时间节点。
当监测到所述用户重新进入客户端以完成后续处理事项时,获取所述用户的用户信息,根据所述用户信息从对照表中获取该用户在退出前的至少一个对话进程的对话标签,将所述对话标签在客户端上进行显示,并获取用户从客户端上选择的对话标签,确定目标对话标签,从预存的对照表中查询该目标对话标签所对应的对话进程,得到目标对话进程,并将客户端当前显示的界面跳转至该目标对话进程对应的界面,继续执行目标对话进程,以完成后续处理事项。例如,当监测到用户重新进入客户端时,获取到该用户在上次异常退出前正在处理的对话进程的对话标签有“个人信息”、“上传资料”这两个时,当用户选择“上传资料”这一对话标签时,则获取“上传资料”对应的对话进程,将客户端当前显示的界面跳转至“上传资料”对应的界面,继续完成资料上传。
具体的,本申请的语音交互平台可包括CSP(自助服务平台)、IDP(对话引擎平台)、AST(视频贷款辅助系统)、MCS(云视频媒体交互系统),开启语音模式后,可将MQ的消息推送事件发送至IDP/AST,经过IDP/AST处理后传递给MCS,MCS通过PaPhoneSDK进行语音播报,PaPhoneSDK还进行客户语音收集,ASR(语音识别系统)进行语音转义,AST系统通过模型处理后将对话进程回传给CSP,CSP接收到对话进程后,为对话进程设置对话标签,因此可通过对话标签的方式来判断对话进程,从而保证整个数据能通过客户的维度进行提交,也能保证对话的唯一性。即使后台存在一个对话进程在运行,同时在启动新的一个对话进程的情况下,由于两个对话进程的对话标签不一样,CSP发送事件给IDP/AST系统里面会携带对话标签,IDP/AST系统就能正确处理并进行事件回传,CSP也能通过对话标签对对话进程进行过滤,从而解决同一客户存在多个对话进程出现的话术播报重复以及客户端页面展示错误的问题,提高了业务流程的健壮性。
本申请的语音交互方法,当监测到用户在客户端上发起业务请求时,根据业务请求为用户开启语音交互模式,以通过语音交互方式快速便捷地完成用户所需办理的业务;然后获取用户在语音交互模式下产生的各个对话进程,为各个对话进程设置对话标签,并生成对话进程与对话标签的对照表,以通过对话标签的数据方式进行交互,对各个对话进程进行区分,既能保证用户数据在各个终端之间正常流转,也能保证各个对话进程的健壮性,减少数据交互错误,提升用户体验;当监测到用户异常退出且后续重新进入客户端时,从对照表中提取用户的对话标签并在客户端上进行显示;响应于用户点击客户端上任一对话标签的点击事件,响应点击事件确定的目标对话标签,根据目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程,从而在用户重新进入客户端后,为用户自动显示退出前的对话标签,以便用户获取所需的对话进程,完成该对话进程的修改或后续操作。
在一实施例中,在步骤S2中,所述获取所述用户在所述语音交互模式下产生的各个对话进程的步骤之后,还可包括:
获取所述各个对话进程的语音信息;
将所述语音信息转换为文本信息,并对所述文本信息进行语义解析,根据语义解析结果查找出所述文本信息相应的界面,将所述界面在客户端上进行展示。
本实施例对接收到的语音信息进行语音识别,并将接收到的语音信息转换为文本信息,然后对文本信息进行自然语言处理和语义理解,以从文本信息中得到用户用语音表达的操作信息和实体信息的语义解析结果,根据该语义解析结果处理相应事项,如完成信息的填写、资料的上传以及信息的查询等。当然,在另一实施例中,语音信息中还可包括客户端所需跳转至的界面,例如,当用户在对话过程中含有类似“我要贷款”的语音信息时,则根据该语音信息查询到贷款所对应的贷款界面,将当前客户端显示的界面自动跳转至贷款界面,以辅助用户完成贷款业务,操作简单、方便。
所述语音信息转换为文本信息时,可检测所述语音信息的语言类型;获取与所述语言类型匹配的语音标准化模型,并利用所述语音标准化模型对所述语音信息进行处理,生成标准化语音信息;将所述标准化语音信息转换成文本信息。其中,语言类型可以是普通话、英语、粤语、潮州话、客家话等类型。可以使用专用的语音检测工具来检测语音信息的语言类型,检测语言类型时,将语音信息发送给各个方言检测工具所在的服务器,并在对应的服务器上对语音信息进行检测,根据检测结果确定语音的语言类型。本实施例中,语音标准化模型可以是训练完成后的神经网络模型,用于指将语音信息标准化,使其更容易被识别,所述语音标准化模型还可以去除语音的情绪指示部分,使得处理后的标准化语音信息更容易被识别。
在一实施例中,所述对所述文本信息进行语义解析的步骤,可具体包括:
将所述文本信息进行分词,得到多个字词;
从所述多个字词中筛选得到所述文本信息的关键词;
对所述关键词进行语义解析,得到所述文本信息的语义解析结果。
本实施例对文本信息进行语义解析时,可先对文本信息进行分词,从分词后的多个字词中提取出关键词,并基于该关键词进行语义解析,以减少所需语义解析的数据,提高语义解析效率。例如,当用户说“我要贷款一百万时”,经过分词为“我”、“要”、“贷款”、“一百万”,其中,真正提供了信息的关键词为“贷款”、“一百万”,对该关键词进行语义解析,根据语义解析结果,为用户办理贷款业务,如跳转至贷款界面。
其中,为使语义解析结果更加符合用户的需要,可增加对关键词权重的设置,语义解析前,先判断各关键词的权重,再按照各关键词的权重进行语义解析,以得到对应的结果。例如,相比于“一百万”,“贷款”显然是更为明确的信息,则“贷款”设置较大的权重值,而为“一百万”设置较小的权重值,而语义解析结果依照命中关键词的权重值排序,将更加符合用户的需要,因此将当前界面显示为贷款申请界面。
在一实施例中,所述从所述多个字词中筛选得到所述文本信息的关键词的步骤,可具体包括:
获取属性词表,所述属性词表包括若干个属性词;
利用所述属性词表对所述多个字词进行去噪处理,以删除无实质意义的字词,得到所述文本信息的关键词。
本实施例中,属性词,也称“非谓形容词”、“区别词”,是从传统语法中名词、动词、形容词中脱离出来的一类新兴词类。属性词与所饰词语存在着较密切的语义结构关系,表示人、事物的属性或特征,具有区别或分类的作用,少数属性词在修饰动词时表示动作的方式或性质。本实施例从多个字词中筛选得到所述文本信息的关键词时,可利用属性词表对所述多个字词进行去噪处理,以删除无实质意义的字词,得到所述文本信息的关键词,且该关键词为属性词,更符合文本信息的语义信息。
此外,还可进一步判断文本信息是为有效信息或者是无效信息。具体地,判断文本信息是否为有效信息或者是无效信息时,可以对文本信息进行分词,根据分词后的语义进行判断。在实际应用中,用户的发音可能会不标准,可以将明显有歧义的字词认为是无效信息或含有无效信息;又或者所在的环境可能还会有其他的声源,比如电视的声音,或嘈杂环境下其他人的说话声,为避免这些无效信息干扰到语音识别,需要对转换后的文本信息加以判断,判断文本信息是否为有效信息。如果文本信息是无效信息,则提示用户该文本信息无效需重新输入,当该文本信息有效时,则直接以该文本信息的分词结果作为关键字进行语义解析,显示相应界面或处理后续进程。
在一实施例中,所述利用所述属性词表对所述多个字词进行去噪处理的步骤,可具体包括:
对每一个所述字词进行预处理,得到每一个字词的词序列;
根据所述属性词表以及词序列的长度从所述多个字词的词序列中筛选出目标词序列,其中,所述目标词序列对应的字词为所述关键词。
本实施例中,对每一个所述字词依次进行分词处理及去停用词处理,从而得到每一个字词的词序列;其中,分词处理可以采用结巴分词工具;其中,停用词是指没有具体意义,对分类没有多大作用的虚词,包括连词、介词、语气词、标点符号等,例如,可以利用停用词表来剔除停用词,即分词后通过匹配停用词表,将匹配到的停用词去掉,在本实施例中,可以采用通用停用词表或者对通用停用词表进行修改,从而得到所需的停用词表。
对于每一个字词的词序列,首先判断其长度是否小于预设值,若是,则确认为全局信息,不参与属性匹配,并进行保留,以避免全局情感信息的损失,若词序列的长度大于等于预设值,则遍历属性词表,与该字词的词序列进行匹配,若匹配到属性词,则保留;若未匹配到任何属性词,则认为是无关序列,确认删除;通过上述属性匹配的方法,经过属性匹配去噪后,保留下的将是与语音信息相关的文本,实现文本的去燥处理。
在一实施例中,在步骤S3中,所述当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示的步骤,可具体包括:
当所述用户因网络断开、网速低于阈值或当前对话进程卡顿而异常退出时,将处于运行状态的对话进程设置为挂起状态;
当监测到所述用户后续重新进入客户端时,从所述对照表中提取挂起状态的对话进程的对话标签,将所述挂起状态的对话进程对应的对话标签在所述客户端上进行显示。
本申请的用户异常退出可以是网络断开、网速低于阈值或当前对话进程卡顿导致强制退出客户端,当监测到用户异常退出时,将后台处于运行状态中的至少一个对话进程进行挂起,并设置为挂起状态,当监测到用户后续重新进入客户端时,则将挂起状态的对话进程对应的对话标签在客户端上进行显示,以方便用户选择,完成后续处理事项。
在一实施例中,在步骤S3中,所述从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示的步骤,可具体包括:
从所述对照表中提取所述用户的所有对话标签;
获取所述所有对话进程的时间节点;
根据所述时间节点将所述所有对话标签以倒序顺序进行排序,将所述所有对话标签依照所述排序显示在所述客户端上。
本实施例可获取各个对话进程的时间节点,根据各个对话进程的时间节点对从对照表中提取到的所有对话标签进行排序,排序时,可将距离当前时间节点最近的对话进程对应的对话标签排在前列,将距离当前时间节点较远的对话进程的对话标签排在后面,并优先显示时间节点排在前列的对话标签,以便快速查询用户所需的对话进程。
参照图2,本申请实施例中还提供一种语音交互装置,包括:
监测模块1,用于当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
生成模块2,用于当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
显示模块3,用于当监测到所述用户异常退出,并后续重新进入客户端时,将所述用户的所有对话标签在所述客户端上进行显示;
执行模块4,用于响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
本实施例中,用户可通过登录客户端发起业务请求,该业务请求可包括贷款业务请求、还款业务请求、信息查询请求等请求类型,当语音交互平台接收到用户的业务请求时,根据所述业务请求为所述用户开启语音交互模式,并建立用户与业务请求的对应关系,以区分不同用户,便于后续查找。在语音交互模式中,将各个处理事项所需填写的信息通过问答的形式完成录入,并将用户语音交互过程中的每个对话进程进行预先保存,为每个对话进程设置对话标签,生成所述对话进程与对话标签的对照表,以当用户异常退出或客户端当前对话进程挂掉时,根据所述对话标签找到所需的对话进程,完成后续处理事项。其中,所述对话标签可以文本、数字、时间或图片的方式进行表示,例如,当前对话进程的目的是完成个人信息填写时,则其对应的对话标签可以是“个人信息”的形式;当对话标签以时间的形式进行表示时,则各个对话标签为各个对话进程异常退出时的时间节点。
当监测到所述用户重新进入客户端以完成后续处理事项时,获取所述用户的用户信息,根据所述用户信息从对照表中获取该用户在退出前的至少一个对话进程的对话标签,将所述对话标签在客户端上进行显示,并获取用户从客户端上选择的对话标签,确定目标对话标签,从预存的对照表中查询该目标对话标签所对应的对话进程,得到目标对话进程,并将客户端当前显示的界面跳转至该目标对话进程对应的界面,继续执行目标对话进程,以完成后续处理事项。例如,当监测到用户重新进入客户端时,获取到该用户在上次异常退出前正在处理的对话进程的对话标签有“个人信息”、“上传资料”这两个时,当用户选择“上传资料”这一对话标签时,则获取“上传资料”对应的对话进程,将客户端当前显示的界面跳转至“上传资料”对应的界面,继续完成资料上传。
具体的,本申请的语音交互平台可包括CSP(自助服务平台)、IDP(对话引擎平台)、AST(视频贷款辅助系统)、MCS(云视频媒体交互系统),开启语音模式后,可将MQ的消息推送事件发送至IDP/AST,经过IDP/AST处理后传递给MCS,MCS通过PaPhoneSDK进行语音播报,PaPhoneSDK还进行客户语音收集,ASR(语音识别系统)进行语音转义,AST系统通过模型处理后将对话进程回传给CSP,CSP接收到对话进程后,为对话进程设置对话标签,因此可通过对话标签的方式来判断对话进程,从而保证整个数据能通过客户的维度进行提交,也能保证对话的唯一性。即使后台存在一个对话进程在运行,同时在启动新的一个对话进程的情况下,由于两个对话进程的对话标签不一样,CSP发送事件给IDP/AST系统里面会携带对话标签,IDP/AST系统就能正确处理并进行事件回传,CSP也能通过对话标签对对话进程进行过滤,从而解决同一客户存在多个对话进程出现的话术播报重复以及客户端页面展示错误的问题,提高了业务流程的健壮性。
如上所述,可以理解地,本申请中提出的所述语音交互装置的各组成部分可以实现如上所述语音交互方法任一项的功能,具体结构不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于关系抽取模型、药物发现模型等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音交互方法。
上述处理器执行上述的语音交互方法,包括:
当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种语音交互方法,包括步骤:
当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本申请的最大有益效果在于:
本申请的语音交互方法、装置、存储介质和计算机设备,当监测到用户在客户端上发起业务请求时,根据业务请求为用户开启语音交互模式,以通过语音交互方式快速便捷地完成用户所需办理的业务;然后获取用户在语音交互模式下产生的各个对话进程,为各个对话进程设置对话标签,并生成对话进程与对话标签的对照表,以通过对话标签的数据方式进行交互,对各个对话进程进行区分,既能保证用户数据在各个终端之间正常流转,也能保证各个对话进程的健壮性,减少数据交互错误,提升用户体验;当监测到用户异常退出且后续重新进入客户端时,从对照表中提取所述用户的对话标签并在客户端上进行显示;响应于用户点击客户端上任一对话标签的点击事件,响应点击事件确定的目标对话标签,根据目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程,从而在用户重新进入客户端后,为用户自动显示退出前的对话标签,以便用户获取所需的对话进程,完成该对话进程的修改或后续操作。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种语音交互方法,其特征在于,包括:
当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
2.根据权利要求1所述的方法,其特征在于,所述当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示的步骤,包括:
当所述用户因网络断开、网速低于阈值或当前对话进程卡顿而异常退出时,将处于运行状态的对话进程设置为挂起状态;
当监测到所述用户后续重新进入客户端时,从所述对照表中提取挂起状态的对话进程的对话标签,将所述挂起状态的对话进程对应的对话标签在所述客户端上进行显示。
3.根据权利要求1所述的方法,其特征在于,所述从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示的步骤,包括:
从所述对照表中提取所述用户的所有对话标签;
获取所述所有对话标签对应的对话进程的时间节点;
根据所述时间节点将所述所有对话标签以倒序顺序进行排序,将所述所有对话标签依照所述排序显示在所述客户端上。
4.根据权利要求1所述的方法,其特征在于,所述获取所述用户在所述语音交互模式下产生的各个对话进程的步骤之后,还包括:
获取所述各个对话进程的语音信息;
将所述语音信息转换为文本信息,并对所述文本信息进行语义解析,根据语义解析结果查找出所述文本信息相应的界面,将所述界面在客户端上进行展示。
5.根据权利要求4所述的方法,其特征在于,所述对所述文本信息进行语义解析的步骤,包括:
将所述文本信息进行分词,得到多个字词;
从所述多个字词中筛选得到所述文本信息的关键词;
对所述关键词进行语义解析,得到所述文本信息的语义解析结果。
6.根据权利要求5所述的方法,其特征在于,所述从所述多个字词中筛选得到所述文本信息的关键词的步骤,包括:
获取属性词表,所述属性词表包括若干个属性词;
利用所述属性词表对所述多个字词进行去噪处理,以删除无实质意义的字词,得到所述文本信息的关键词。
7.根据权利要求6所述的方法,其特征在于,所述利用所述属性词表对所述多个字词进行去噪处理的步骤,包括:
对每一个所述字词进行预处理,得到每一个字词的词序列;
根据所述属性词表以及词序列的长度从所述多个字词的词序列中筛选出目标词序列,其中,所述目标词序列对应的字词为所述关键词。
8.一种语音交互装置,其特征在于,包括:
监测模块,用于当监测到用户在客户端上发起业务请求时,根据所述业务请求为所述用户开启语音交互模式;
生成模块,用于获取所述用户在所述语音交互模式下产生的各个对话进程,为所述各个对话进程设置对话标签,并生成所述对话进程与对话标签的对照表;
显示模块,用于当监测到所述用户异常退出且后续重新进入客户端时,从所述对照表中提取所述用户的对话标签并在所述客户端上进行显示;
执行模块,用于响应于用户点击客户端上任一对话标签的点击事件,响应所述点击事件确定的目标对话标签,根据所述目标对话标签从所述对照表中查询对应的目标对话进程,继续执行所述目标对话进程。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述语音交互方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述语音交互方法的步骤。
CN202110219613.4A 2021-02-26 2021-02-26 语音交互方法、装置、存储介质和计算机设备 Active CN113035191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110219613.4A CN113035191B (zh) 2021-02-26 2021-02-26 语音交互方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110219613.4A CN113035191B (zh) 2021-02-26 2021-02-26 语音交互方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN113035191A true CN113035191A (zh) 2021-06-25
CN113035191B CN113035191B (zh) 2023-11-10

Family

ID=76461959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110219613.4A Active CN113035191B (zh) 2021-02-26 2021-02-26 语音交互方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN113035191B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356797A (ja) * 2000-06-14 2001-12-26 Nippon Telegr & Teleph Corp <Ntt> 対話制御方法及びシステム及び対話制御プログラムを格納した記憶媒体
CN102685337A (zh) * 2011-03-17 2012-09-19 中兴通讯股份有限公司 VoiceXml呼叫控制实现方法及装置
CN106802951A (zh) * 2017-01-17 2017-06-06 厦门快商通科技股份有限公司 一种用于智能对话的话题抽取方法及系统
US10141006B1 (en) * 2016-06-27 2018-11-27 Amazon Technologies, Inc. Artificial intelligence system for improving accessibility of digitized speech
CN110335606A (zh) * 2019-08-07 2019-10-15 广东电网有限责任公司 一种用于工器具管控的语音交互装置
CN110620812A (zh) * 2019-08-15 2019-12-27 平安普惠企业管理有限公司 交互信息的推送方法、装置、计算机设备和存储介质
CN110704582A (zh) * 2019-09-20 2020-01-17 联想(北京)有限公司 一种信息处理方法及装置、设备
US20200075007A1 (en) * 2018-08-31 2020-03-05 Kyoto University Voice interaction system, voice interaction method, program, learning model generation apparatus, and learning model generation method
CN111599360A (zh) * 2020-05-12 2020-08-28 Oppo广东移动通信有限公司 唤醒控制方法、装置、存储介质及电子设备
CN111724775A (zh) * 2019-03-22 2020-09-29 华为技术有限公司 一种语音交互方法及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356797A (ja) * 2000-06-14 2001-12-26 Nippon Telegr & Teleph Corp <Ntt> 対話制御方法及びシステム及び対話制御プログラムを格納した記憶媒体
CN102685337A (zh) * 2011-03-17 2012-09-19 中兴通讯股份有限公司 VoiceXml呼叫控制实现方法及装置
US10141006B1 (en) * 2016-06-27 2018-11-27 Amazon Technologies, Inc. Artificial intelligence system for improving accessibility of digitized speech
CN106802951A (zh) * 2017-01-17 2017-06-06 厦门快商通科技股份有限公司 一种用于智能对话的话题抽取方法及系统
US20200075007A1 (en) * 2018-08-31 2020-03-05 Kyoto University Voice interaction system, voice interaction method, program, learning model generation apparatus, and learning model generation method
CN111724775A (zh) * 2019-03-22 2020-09-29 华为技术有限公司 一种语音交互方法及电子设备
CN110335606A (zh) * 2019-08-07 2019-10-15 广东电网有限责任公司 一种用于工器具管控的语音交互装置
CN110620812A (zh) * 2019-08-15 2019-12-27 平安普惠企业管理有限公司 交互信息的推送方法、装置、计算机设备和存储介质
CN110704582A (zh) * 2019-09-20 2020-01-17 联想(北京)有限公司 一种信息处理方法及装置、设备
CN111599360A (zh) * 2020-05-12 2020-08-28 Oppo广东移动通信有限公司 唤醒控制方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN113035191B (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN108153800B (zh) 信息处理方法、信息处理装置以及记录介质
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
US9436681B1 (en) Natural language translation techniques
US20220254507A1 (en) Knowledge graph-based question answering method, computer device, and medium
CN108538294B (zh) 一种语音交互方法及装置
EP3232336A1 (en) Method and device for recognizing stop word
CN110347810B (zh) 对话式检索回答方法、装置、计算机设备及存储介质
CN109766556B (zh) 一种语料修复的方法和装置
US20220050968A1 (en) Intent resolution for chatbot conversations with negation and coreferences
CN110825840B (zh) 词库扩充方法、装置、设备及存储介质
CN112364622A (zh) 对话文本分析方法、装置、电子装置及存储介质
CN106021532B (zh) 关键词的显示方法和装置
CN110750626B (zh) 一种基于场景的任务驱动的多轮对话方法及系统
CN112579751A (zh) 用户信息填入方法、装置以及计算机设备
CN110489740B (zh) 语义解析方法及相关产品
CN111858894A (zh) 语义缺失的识别方法及装置、电子设备、存储介质
CN109800430B (zh) 一种语义理解方法及系统
CN111552783A (zh) 内容分析查询方法、装置、设备和计算机存储介质
CN113035191B (zh) 语音交互方法、装置、存储介质和计算机设备
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN110727764A (zh) 一种话术生成方法、装置及话术生成设备
CN116304046A (zh) 对话数据的处理方法、装置、存储介质及电子设备
CN108877781B (zh) 一种智能语音搜索影片的方法及系统
CN112395402A (zh) 基于深度模型的推荐话术生成方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231013

Address after: Room 820, 8th floor, No. 390-408 Beijing East Road, Huangpu District, Shanghai, 200001

Applicant after: Guangyulaite Digital Technology (Shanghai) Co.,Ltd.

Address before: Room 202, Block B, Aerospace Micromotor Building, No. 7 Langshan 2nd Road, Xili Street, Nanshan District, Shenzhen City, Guangdong Province, 518057

Applicant before: Shenzhen LIAN intellectual property service center

Effective date of registration: 20231013

Address after: Room 202, Block B, Aerospace Micromotor Building, No. 7 Langshan 2nd Road, Xili Street, Nanshan District, Shenzhen City, Guangdong Province, 518057

Applicant after: Shenzhen LIAN intellectual property service center

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: PING AN PUHUI ENTERPRISE MANAGEMENT Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant