CN111291157B - 应答响应方法、装置、终端及存储介质 - Google Patents

应答响应方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111291157B
CN111291157B CN202010072994.3A CN202010072994A CN111291157B CN 111291157 B CN111291157 B CN 111291157B CN 202010072994 A CN202010072994 A CN 202010072994A CN 111291157 B CN111291157 B CN 111291157B
Authority
CN
China
Prior art keywords
information
main flow
intention
state
state machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010072994.3A
Other languages
English (en)
Other versions
CN111291157A (zh
Inventor
李金龙
陈曦
黄艺驰
卢莎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Merchants Bank Co Ltd
Original Assignee
China Merchants Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Merchants Bank Co Ltd filed Critical China Merchants Bank Co Ltd
Priority to CN202010072994.3A priority Critical patent/CN111291157B/zh
Publication of CN111291157A publication Critical patent/CN111291157A/zh
Application granted granted Critical
Publication of CN111291157B publication Critical patent/CN111291157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种应答响应方法、装置、终端和计算机可读存储介质,应答响应方法通过在接收到语音信息时,将语音信息转化为文本信息;获取状态机中语音信息相关的状态机信息;基于文本信息和状态机信息,确定执行节点并生成与节点对应的语义信息;基于语义信息进行应答,即本申请通过在电话机器人应答系统中引入状态机,将主流程状态和流程中状态进行隔离,即同一层级主流程状态可以相互跳转,或者跳转到流程中状态,而流程中状态无法向主流程状态跳转,从而实现区分用户意图归属于主流程状态还是流程中状态,明确了机器人应答执行节点,提升复杂业务场景下的电话机器人对话理解能力,从而提高了电话机器人应答准确率。

Description

应答响应方法、装置、终端及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种应答响应方法、装置、终端及计算机可读存储介质。
背景技术
近年来,随着业务发展和客户需求变化,电话服务平台的不足逐渐突显,人工接听话务压力不断提升,电话客服机器人产品应需而生。电话机器人通过运用语音识别、语义理解和语音合成技术为拨打客服热线的用户提供咨询类、查办类等自动应答服务。市面上常见的电话机器人大多基于关键词匹配或基于意图识别结合语义提槽这两种方案进行应答。基于关键词匹配的方案能识别理解的内容比较简单,并且关键词需要人为制定和编写,从而导致基于关键词匹配的方案识别准确率受限、维护成本高;基于意图识别结合语义提槽的方案,当识别得到的意图在主流程和子流程均有包括但又因为用户口语化表达导致无法对提取的语义进行槽位填充时,电话机器人无法区分识别得到的意图属于主流程还是子流程中的意图,从而导致基于意图识别结合语义提槽的方案容易出现答非所问的情况。
发明内容
本申请的主要目的在于提供一种应答响应方法、装置、终端及计算机存储介质,旨在解决现有技术中电话客服机器人应答准确率低、应答系统维护成本高的技术问题。
为实现上述目的,本申请实施例提供一种应答响应方法,所述应答响应方法的步骤包括:
在接收到语音信息时,将所述语音信息转化为文本信息;
获取状态机中所述语音信息相关的状态机信息;
基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;
基于所述语义信息进行应答。
可选地,所述状态机包括主流程状态,所述获取状态机中所述语音信息相关的状态机信息的步骤包括:
获取所述状态机的拓扑结构;
获取所述状态机的所述主流程状态;
将所述拓扑结构和所述主流程状态中的主流程意图作为所述状态机信息。
可选地,所述基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息的步骤包括:
提取所述文本信息的意图信息和/或槽位信息,获得标准意图;
基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息。
可选地,所述提取所述文本信息的意图信息和/或槽位信息,获得标准意图的步骤包括:
比对所述文本信息和第一预设关键词;
提取所述文本信息中与所述第一预设关键词相同的信息,作为所述文本信息的意图信息;
和/或,
比对所述文本信息和第二预设关键词;
提取所述文本信息中与所述第二预设关键词相同的信息,作为所述文本信息的槽位信息;
通过预设方式处理所述意图信息和/或槽位信息,获得所述标准意图。
可选地,所述状态机还包括所述主流程状态下的流程中状态,所述基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息的步骤包括:
判断所述标准意图的属性信息,所述属性信息包括所述主流程状态和/或所述主流程状态下的流程中状态;
基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息。
可选地,所述基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息的步骤包括:
若所述属性信息为所述主流程状态和所述主流程状态下的流程中状态,则判断所述标准意图在所述状态机中上一轮主流程意图和已保存的交互主流程意图是否相同;
若所述上一轮主流程意图和所述已保存的交互主流程意图相同,则执行所述主流程状态下的流程中状态的下一个节点,然后生成语义信息;
若所述上一轮主流程意图和所述已保存的交互主流程意图不相同,则执行所述主流程状态的下一个节点,然后生成语义信息。
可选地,所述基于所述语义信息进行应答的步骤包括:
将所述语义信息按照预设方式转化为应答文本;
语音输出所述应答文本以进行应答。
本申请还提供一种应答响应装置,所述应答响应装置包括:
转化模块,用于在接收到语音信息时,将所述语音信息转化为文本信息;
获取模块,用于获取状态机中所述语音信息相关的状态机信息;
生成模块,用于基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;
应答模块,用于基于所述语义信息进行应答。
可选地,所述获取模块包括:
第一获取子模块,用于获取所述状态机的拓扑结构;
第二获取子模块,用于获取所述状态机的所述主流程状态;
第三获取子模块,用于将所述拓扑结构和所述主流程状态中的主流程意图作为所述状态机信息。
可选地,所述生成模块包括:
提取子模块,用于提取所述文本信息的意图信息和/或槽位信息,获得标准意图;
确定子模块,用于基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息。
可选地,所述提取子模块包括:
第一比对单元,用于比对所述文本信息和第一预设关键词;
第一提取单元,用于提取所述文本信息中与所述第一预设关键词相同的信息,作为所述文本信息的意图信息;
第二比对单元,用于比对所述文本信息和第二预设关键词;
第二提取单元,用于提取所述文本信息中与所述第二预设关键词相同的信息,作为所述文本信息的槽位信息;
处理单元,用于通过预设方式处理所述意图信息和/或槽位信息,获得所述标准意图。
可选地,所述确定子模块包括:
判断单元,用于判断所述标准意图的属性信息,所述属性信息包括所述主流程状态和/或所述主流程状态下的流程中状态;
确定单元,用于基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息。
可选地,所述确定单元包括:
判断子单元,用于若所述属性信息为所述主流程状态和所述主流程状态下的流程中状态,则判断所述标准意图在所述状态机中上一轮主流程意图和已保存的交互主流程意图是否相同;
第一确定子单元,用于若所述上一轮主流程意图和所述已保存的交互主流程意图相同,则执行所述主流程状态下的流程中状态的下一个节点,然后生成语义信息;
第二确定子单元,用于若所述上一轮主流程意图和所述已保存的交互主流程意图不相同,则执行所述主流程状态的下一个节点,然后生成语义信息。
可选地,所述应答模块包括:
转化子模块,用于将所述语义信息按照预设方式转化为应答文本;
输出子模块,用于语音输出所述应答文本以进行应答。
本申请还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的应答响应程序,所述应答响应程序被所述处理器执行时实现如上所述的应答响应方法的步骤。
本申请还提供一种计算机存储介质,所述计算机存储介质上存储有应答响应程序,所述应答响应程序被处理器执行时实现如上所述的应答响应方法的步骤。
本申请公开了一种应答响应方法、装置、终端和计算机可读存储介质,所述应答响应方法通过在接收到语音信息时,将所述语音信息转化为文本信息;获取状态机中所述语音信息相关的状态机信息;基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;基于所述语义信息进行应答,即本申请通过在电话机器人应答系统中引入状态机,将主流程状态和流程中状态进行隔离,即同一层级主流程状态可以相互跳转,或者跳转到流程中状态,而流程中状态无法向主流程状态跳转,从而实现区分意图归属于主流程状态还是流程中状态,明确了应答执行节点,提升复杂业务场景下的电话机器人对话理解能力,从而提高了电话机器人应答准确率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一个可选的终端的硬件结构示意图;
图2为本申请应答响应方法第一实施例的流程示意图;
图3为本申请应答响应方法第二实施例的流程示意图;
图4为本申请应答响应方法第三实施例的流程示意图;
图5为本申请应答响应方法第四实施例的流程示意图;
图6为本申请应答响应方法第五实施例的流程示意图;
图7为本申请应答响应方法第六实施例的流程示意图;
图8为本申请应答响应方法第七实施例的应用场景示意图;
图9为本申请应答响应方法第八实施例的流程示意图;
图10为本申请应答响应装置的功能模块示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
如图1所示,图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。
本申请实施例终端可以是固定终端,如物联网智能设备,包括智能空调、智能电灯、智能电源、智能路由器等智能家居;也可以是移动终端,包括智能手机、可穿戴的联网AR/VR装置、智能音箱、自动驾驶汽车等诸多联网设备。
如图1所示,该应答响应系统的架构设计包括节点和服务器,其设备结构可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,该应答响应系统还可以包括用户接口、网络接口、摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。用户接口可以包括显示屏(Display)、触摸屏、摄像头(包括AR/VR设备)等,可选用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口、蓝牙接口、探针接口、3G/4G/5G联网通信接口等)。
本领域技术人员可以理解,图1中示出的应答响应系统结构并不构成对应答响应系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及提前唤醒程序。操作系统是管理和控制应答响应系统硬件和软件资源的程序,支持应答响应程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与应答响应系统中其它硬件和软件之间通信。
在图1所示的应答响应系统中,处理器1001用于执行存储器1005中存储的应答响应程序,实现以下步骤:
在接收到语音信息时,将所述语音信息转化为文本信息;
获取状态机中所述语音信息相关的状态机信息;
基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;
基于所述语义信息进行应答。
进一步地,处理器1001可以调用存储器1005中存储的应答响应程序,还执行以下操作:
获取所述状态机的拓扑结构;
获取所述状态机的所述主流程状态;
将所述拓扑结构和所述主流程状态中的主流程意图作为所述状态机信息。
进一步地,处理器1001可以调用存储器1005中存储的应答响应程序,还执行以下操作:
提取所述文本信息的意图信息和/或槽位信息,获得标准意图;
基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息。
进一步地,处理器1001可以调用存储器1005中存储的应答响应程序,还执行以下操作:
比对所述文本信息和第一预设关键词;
提取所述文本信息中与所述第一预设关键词相同的信息,作为所述文本信息的意图信息;
和/或,
比对所述文本信息和第二预设关键词;
提取所述文本信息中与所述第二预设关键词相同的信息,作为所述文本信息的槽位信息;
通过预设方式处理所述意图信息和/或槽位信息,获得所述标准意图。
进一步地,处理器1001可以调用存储器1005中存储的应答响应程序,还执行以下操作:
判断所述标准意图的属性信息,所述属性信息包括所述主流程状态和/或所述主流程状态下的流程中状态;
基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息。
进一步地,处理器1001可以调用存储器1005中存储的应答响应程序,还执行以下操作:
若所述属性信息为所述主流程状态和所述主流程状态下的流程中状态,则判断所述标准意图在所述状态机中上一轮主流程意图和已保存的交互主流程意图是否相同;
若所述上一轮主流程意图和所述已保存的交互主流程意图相同,则执行所述主流程状态下的流程中状态的下一个节点,然后生成语义信息;
若所述上一轮主流程意图和所述已保存的交互主流程意图不相同,则执行所述主流程状态的下一个节点,然后生成语义信息。
进一步地,处理器1001可以调用存储器1005中存储的应答响应程序,还执行以下操作:
将所述语义信息按照预设方式转化为应答文本;
语音输出所述应答文本以进行应答。
基于上述硬件结构,提出本申请应答响应方法的各个实施例。
参照图2,本申请应答响应方法第一实施例提供一种应答响应方法,所述方法包括:
步骤S10,在接收到语音信息时,将语音信息转化为文本信息;
在本申请公开的技术方案中,语音信息指的是用户咨询语音信息,文本信息指的是与用户咨询语音信息对应的文字信息,可以理解的是,可以通过语音识别技术对语音信息进行识别,从而转化为文本信息。
步骤S20,获取状态机中语音信息相关的状态机信息;
在本申请公开的技术方案中,状态机指的是状态转移图,一个状态机图中只描述一个事物,该事物有多个状态,不同的动作作用到状态上导致状态的转换。引入状态机的作用是将主流程状态和流程中状态进行隔离,即同一层级主流程状态可以相互跳转,或者跳转到流程中状态,而流程中状态无法向主流程状态跳转,从而实现区分用户意图归属于主流程状态还是流程中状态,明确了机器人的应答执行节点,从而提升复杂业务场景下的电话机器人对话理解能力和应答准确率。
步骤S30,基于文本信息和所述状态机信息,确定执行节点并生成与节点对应的语义信息;
执行节点指的是状态机的流程转移点,状态机的主流程和子流程都属于执行节点,并且,通过执行节点可以获得状态机的流程转移方向。与节点对应的语义信息指的是与执行节点相关联的已存储的信息。
步骤S40,基于语义信息进行应答。
语音信息所要表达的意图的信息为语义信息。
本申请的应用场景可以是,随着业务发展和客户需求变化,电话服务平台的不足逐渐突显,人工接听话务压力不断提升,电话客服机器人产品应需而生。电话机器人通过运用语音识别、语义理解和语音合成技术为拨打客服热线的用户提供咨询类、查办类等自动应答服务。市面上常见的电话机器人大多基于关键词匹配或基于意图识别结合语义提槽这两种方案进行应答。然而,基于关键词匹配的方案能识别理解的内容比较简单,并且关键词需要人为制定和编写,从而导致基于关键词匹配的方案识别准确率受限、维护成本高;基于意图识别结合语义提槽的方案,当识别得到的意图在主流程和子流程均有包括但又因为用户口语化表达导致无法对提取的语义进行槽位填充时,电话机器人无法区分识别得到的意图属于主流程还是子流程中的意图,从而导致基于意图识别结合语义提槽的方案容易出现答非所问的情况,因此使用应答响应方法来提高电话机器人的应答准确率,减少用户咨询时间,提升用户咨询效率和解决问题的效率。
在本实施例中,在接收到语音信息时,将所述语音信息转化为文本信息;获取状态机中所述语音信息相关的状态机信息;基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;基于所述语义信息进行应答,即本申请通过在电话机器人应答系统中引入状态机,将主流程状态和流程中状态进行隔离,即同一层级主流程状态可以相互跳转,或者跳转到流程中状态,而流程中状态无法向主流程状态跳转,从而实现区分意图归属于主流程状态还是流程中状态,明确了机器人应答执行节点,提升复杂业务场景下的电话机器人对话理解能力,从而提高了电话机器人应答准确率。
进一步地,在本申请应答响应方法第二实施例中,参照图3,步骤S20包括:
步骤S21,获取状态机的拓扑结构;
在本申请公开的技术方案中,状态机由主流程状态和主流程状态下的流程中状态两部分组成。状态机信息包括拓扑结构和主流程状态中的主流程意图两部分信息。拓扑结构是指状态机中各个主流程状态和主流程状态下的流程中状态相互连接的形式,通过拓扑结构可以获得状态机的状态转移流程。
步骤S22,获取状态机的主流程状态;
主流程状态可以为一个,也可以为多个,主流程状态在状态转移过程中可以划分为预设个数的流程中状态,即各个主流程状态下可以包括一个流程中状态,也可以包括多个流程中状态,预设个数在实施过程中可灵活设置,此处不做限制。
步骤S23,将拓扑结构和主流程状态中的主流程意图作为状态机信息。
在本实施例中,获取状态机的拓扑结构、主流程状态,然后作为与语音信息相关的状态机信息,有利于后续结合文本信息确定执行节点。
进一步地,在本申请应答响应方法第三实施例中,参照图4,步骤S30包括:
步骤S31,提取文本信息的意图信息和/或槽位信息,获得标准意图;
在本申请公开的技术方案中,标准意图指的是将用户的语音信息转化为文本信息,然后提取文本信息的意图信息和槽位信息其中一个信息或两种信息的组合,从而获得的更加接近用户语音信息、更加准确代表用户意图的意图。
步骤S32,基于标准意图、拓扑结构和主流程意图,确定执行节点并生成与节点对应的语义信息。
在本实施例中,意图信息加槽位信息是电话机器人对话管理中常用技术之一。为了可以正确理解电话服务渠道中用户的意图,需要提前收集对话文本数据,分析数据在语义层面的特征。具体来说就是标注人员按照预先指定的业务协议规范,提取用户在表达意图时提及的具有辨识度的关键词,包括意图信息和对应的槽位信息。在电话客服机器人对话场景下,标注内容主要包含业务节点、动作、对象、属性4个部分,业务节点表示数据所属意图,动作包括查询、办理、取消、修改、重置等,对象即具体的业务,比如余额、积分、账单等,属性即附属信息,如卡类型、月份、金额等。例如:文本数据“查一下上个月的账单”标注为“{“业务节点”:“账单查询”,“动作”:“查询”,“对象”:“账单”,“属性”:“上个月”}”。当客户的表述较为模糊,比如说“查账单”,其中缺少了必须的时间属性,电话机器人会追加一轮询问,时间槽位填充后再进行查询操作。意图识别加语义提槽的方式在一定程度上提升了电话机器人语义识别的准确率,并具有简单的多轮能力,适用于槽位定义清晰明确的业务场景。但是,在对话过程中,客户口语化表述会导致一些业务流程下无法进行语义提槽来澄清客户意图。例如,在办理“开通短信”业务时,机器人回复“开通短信业务需要按月收费”,用户此时会说“为什么要收费”或者“要收费啊,太贵了”等,这类表述无法提取语义槽(即无法获得槽位信息),标注时只能确定文本的意图信息,归为“抱怨短信收费”。但是,在实际业务场景中,“抱怨短信收费”既可能出现在主流程,比如客户一进线就对电话机器人说“抱怨短信收费”,也可能出现在“开通短信”业务子流程中,而由于“抱怨短信收费”是一个业务意图,并不是“开通短信”流程的一个语义槽,而基于意图信息结合槽位信息的对话管理方案无法区分是在主流程还是子流程中,会导致系统误判,比如在“开通短信”流程中,当客户“抱怨短信收费”时会跳出“开通短信”流程进入到主流程,从而答非所问。因此,获得标准意图之后,再根据状态机的拓扑结构和状态机主流程状态中的主流程意图,从而可以更加准确地确定执行节点。
在本实施例中,通过提取文本信息的意图信息和/或槽位信息,获得标准意图;再基于标准意图、拓扑结构和主流程意图,确定执行节点并生成与节点对应的语义信息,从而提高了机器人意图理解的准确性和流程执行的准确性,减少用户咨询时间,提升用户咨询效率和解决问题的效率。
进一步地,在本申请应答响应方法第四实施例中,参照图5,步骤S31包括:
步骤S311,比对文本信息和第一预设关键词;
步骤S312,提取文本信息中与第一预设关键词相同的信息,作为文本信息的意图信息;
步骤S313,和/或,比对文本信息和第二预设关键词;
在本申请公开的技术方案中,获得第一预设关键词和第二预设关键词的方法是,例如,标注人员按照预先指定的业务协议规范,提取用户在表达意图时提及的具有辨识度的关键词,可以为查询账单、取消彩铃、购买流量包等,在实施过程中可灵活设置,此处不做限制。
步骤S314,提取文本信息中与第二预设关键词相同的信息,作为文本信息的槽位信息;
步骤S315,通过预设方式处理意图信息和/或槽位信息,获得标准意图。
在本实施例中,提取文本信息的意图信息和/或槽位信息,获得标准意图的方法是,通过比对文本信息和第一预设关键词,然后提取文本信息中与第一预设关键词相同的信息,作为文本信息的意图信息;通过比对文本信息和第二预设关键词;再提取文本信息中与第二预设关键词相同的信息,作为文本信息的槽位信息;或者同时比对文本信息和第一预设关键词、文本信息和第二预设关键词,从而获得文本信息的意图信息和槽位信息;即可以由意图信息获得标准意图,也可以由槽位信息获得标准意图,也可以由意图信息结合槽位信息获得标准意图,在实施过程中可灵活设置,此处不做限制。再通过预设方式处理意图信息和/或槽位信息。
在本实施例中,通过提取文本信息的意图信息和/或槽位信息,获得标准意图;再结合拓扑结构和主流程意图,有利于确定执行节点并生成与节点对应的语义信息,从而提高了机器人意图理解的准确性和流程执行的准确性,减少用户咨询时间,提升用户咨询效率和解决问题的效率。
进一步地,在本申请应答响应方法第五实施例中,参照图6,步骤S32包括:
步骤S321,判断标准意图的属性信息,属性信息包括主流程状态和/或主流程状态下的流程中状态;
在本申请公开的技术方案中,主流程状态指的是状态机中的主流程,即有子流程分支的流程;主流程状态下的流程中状态指的是状态机中的子流程。可以理解的是,主流程和子流程是一组相对概念,即在一个流程中,有子流程作为分支的流程即为主流程;主流程下的一个或多个分支即为子流程。参照图8,抱怨短信消费(在图8中与“核身”处于平行位置)、开通短信、核身这3个意图属于主流程状态(主流程);流程中状态1-1、流程中状态1-M1、抱怨短信收费(在图8中与“流程中状态2-M2”处于平行位置)、流程中状态2-M2、流程中状态N-1、流程中状态N-MN这6个意图属于流程中状态(子流程)。
步骤S322,基于属性信息,确定执行节点并生成与节点对应的语义信息。
在本实施例中,状态转移过程中执行顺序在主流程状态之后的状态为主流程状态下的流程中状态,一个主流程状态下可以有一个流程中状态,也可以有多个流程中状态,流程中状态的个数在实施过程中可灵活设置,此处不做限制。
进一步地,在本申请应答响应方法第六实施例中,参照图7,步骤S322包括:
步骤S01,若属性信息为主流程状态和主流程状态下的流程中状态,则判断标准意图在状态机中上一轮主流程意图和已保存的交互主流程意图是否相同;
在本申请公开的技术方案中,当标准意图同时属于主流程状态和流程中状态时,则会造成机器人无法确定下一个执行节点。因此需要判断标准意图在状态机中上一轮主流程意图和已保存的交互主流程意图是否相同。
步骤S02,若上一轮主流程意图和已保存的交互主流程意图相同,则执行主流程状态下的流程中状态的下一个节点,然后生成语义信息;
步骤S03,若上一轮主流程意图和已保存的交互主流程意图不相同,则执行主流程状态的下一个节点,然后生成语义信息。
在本实施例中,如果上一轮主流程意图和已保存的交互主流程意图相同,则执行主流程状态下的流程中状态的下一个节点,然后生成语义信息;如果上一轮主流程意图和已保存的交互主流程意图不相同,则执行主流程状态的下一个节点,然后生成语义信息。
在本实施例中,通过区分意图归属于主流程状态还是流程中状态,明确了机器人应答执行节点,提升复杂业务场景下的电话机器人对话理解能力,从而提高了电话机器人应答准确率。
进一步地,在本申请应答响应方法第七实施例中,参照图8,本申请的实施整体过程是:应答响应程序接收到客户的咨询电话后,例如客户说“怎么我12月份的短信费这么花了这么多钱啊”,将客户的语音信息转化为文本信息“我、12月份、短信费、高”,然后通过意图信息和槽位信息的填充后(意图输入),获得标准意图为“抱怨短信收费”;并且会将标准意图记录并保存下来作为本轮对话的交互主流程意图;通过状态机的拓扑结构可得,状态机中意图为“抱怨短信收费”出现在主流程状态和流程中状态,参照图8,即出现了无法明确需要执行在图8中与“核身”处于平行位置的“抱怨短信消费”(“流程中状态1-1”、“流程中状态1-M1”的上一流程),还是执行在图8中与“流程中状态2-M2”处于平行位置的“抱怨短信收费”。因此需要结合拓扑结构和主流程意图来确定下一步的执行节点:查询已保存的交互主流程意图和标准意图在状态机中上一轮主流程意图,如果标准意图在状态机中上一轮主流程意图为“开通短信”、已保存的交互主流程意图为“开通短信”,即上一轮主流程意图和已保存的交互主流程意图相同,那么执行主流程状态“开通短信”下的流程中状态“抱怨短信消费”的下一个节点,然后生成语义信息;如果标准意图在状态机中上一轮主流程意图为“开通短信”、已保存的交互主流程意图为“开通彩铃”,即上一轮主流程意图和已保存的交互主流程意图不相同,则执行主流程状态“抱怨短信收费”的下一个节点,然后生成语义信息,再根据语义信息查询与语义信息对应问题的解决方案,并将解决方案转化为应答文本,最后通过语音输出应答文本以进行应答。
进一步地,在本申请应答响应方法第八实施例中,参照图9,步骤S40包括:
步骤S41,将语义信息按照预设方式转化为应答文本;
步骤S42,语音输出应答文本以进行应答。
在本实施例中,根据语义信息查询与语义信息对应问题的解决方案,并将解决方案转化为应答文本,最后通过语音输出应答文本以进行应答。
此外,参照图10,本发明实施例还提出一种应答响应装置,应答响应装置包括:
转化模块,用于在接收到语音信息时,将所述语音信息转化为文本信息;
获取模块,获取状态机中所述语音信息相关的状态机信息;
生成模块,用于基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;
应答模块,用于基于所述语义信息进行应答。
本申请还提供一种终端,所述终端包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的应答响应程序,所述应答响应程序被所述处理器执行时实现上述应答响应方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有应答响应程序,所述应答响应程序被处理器执行时实现上述的应答响应方法的步骤。
在本申请应答响应方法、装置、终端及可读存储介质的实施例中,包含了上述应答响应方法各实施例的全部技术特征,说明书拓展和解释内容与上述应答响应方法各实施例基本相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (6)

1.一种应答响应方法,其特征在于,所述应答响应方法包括以下步骤:
在接收到语音信息时,将所述语音信息转化为文本信息;
获取状态机中所述语音信息相关的状态机信息;
基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;
基于所述语义信息进行应答;
其中,所述状态机包括主流程状态和所述主流程状态下的流程中状态,所述获取状态机中所述语音信息相关的状态机信息的步骤包括:
获取所述状态机的拓扑结构;
获取所述状态机的所述主流程状态;
将所述拓扑结构和所述主流程状态中的主流程意图作为所述状态机信息;
所述基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息的步骤包括:
提取所述文本信息的意图信息和/或槽位信息,获得标准意图;
基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息;
所述基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息的步骤包括:
判断所述标准意图的属性信息,所述属性信息包括所述主流程状态和/或所述主流程状态下的流程中状态;
基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息;
所述基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息的步骤包括:
若所述属性信息为所述主流程状态和所述主流程状态下的流程中状态,则判断所述标准意图在所述状态机中上一轮主流程意图和已保存的交互主流程意图是否相同;
若所述上一轮主流程意图和所述已保存的交互主流程意图相同,则执行所述主流程状态下的流程中状态的下一个节点,然后生成语义信息;
若所述上一轮主流程意图和所述已保存的交互主流程意图不相同,则执行所述主流程状态的下一个节点,然后生成语义信息。
2.如权利要求1所述的应答响应方法,其特征在于,所述提取所述文本信息的意图信息和/或槽位信息,获得标准意图的步骤包括:
比对所述文本信息和第一预设关键词;
提取所述文本信息中与所述第一预设关键词相同的信息,作为所述文本信息的意图信息;
和/或,
比对所述文本信息和第二预设关键词;
提取所述文本信息中与所述第二预设关键词相同的信息,作为所述文本信息的槽位信息;
通过预设方式处理所述意图信息和/或槽位信息,获得所述标准意图。
3.如权利要求1所述的应答响应方法,其特征在于,所述基于所述语义信息进行应答的步骤包括:
将所述语义信息按照预设方式转化为应答文本;
语音输出所述应答文本以进行应答。
4.一种应答响应装置,其特征在于,所述应答响应装置包括:
转化模块,用于在接收到语音信息时,将所述语音信息转化为文本信息;
获取模块,用于获取状态机中所述语音信息相关的状态机信息;
生成模块,用于基于所述文本信息和所述状态机信息,确定执行节点并生成与所述节点对应的语义信息;
应答模块,用于基于所述语义信息进行应答;
所述获取模块,还用于获取所述状态机的拓扑结构;获取所述状态机的主流程状态;将所述拓扑结构和所述主流程状态中的主流程意图作为所述状态机信息;
所述生成模块,还用于提取所述文本信息的意图信息和/或槽位信息,获得标准意图;基于所述标准意图、所述拓扑结构和所述主流程意图,确定执行节点并生成与所述节点对应的语义信息;
所述生成模块,还用于判断所述标准意图的属性信息,所述属性信息包括所述主流程状态和/或所述主流程状态下的流程中状态;基于所述属性信息,确定执行节点并生成与所述节点对应的语义信息;
所述生成模块,还用于若所述属性信息为所述主流程状态和所述主流程状态下的流程中状态,则判断所述标准意图在所述状态机中上一轮主流程意图和已保存的交互主流程意图是否相同;若所述上一轮主流程意图和所述已保存的交互主流程意图相同,则执行所述主流程状态下的流程中状态的下一个节点,然后生成语义信息;若所述上一轮主流程意图和所述已保存的交互主流程意图不相同,则执行所述主流程状态的下一个节点,然后生成语义信息。
5.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的应答响应程序,所述应答响应程序被所述处理器执行时实现如权利要求1至3中任一项所述的应答响应方法的步骤。
6.一种存储介质,其特征在于,所述存储介质上存储有应答响应程序,所述应答响应程序被处理器执行时实现如权利要求1至3中任一项所述的应答响应方法的步骤。
CN202010072994.3A 2020-01-21 2020-01-21 应答响应方法、装置、终端及存储介质 Active CN111291157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010072994.3A CN111291157B (zh) 2020-01-21 2020-01-21 应答响应方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010072994.3A CN111291157B (zh) 2020-01-21 2020-01-21 应答响应方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN111291157A CN111291157A (zh) 2020-06-16
CN111291157B true CN111291157B (zh) 2023-08-08

Family

ID=71018103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010072994.3A Active CN111291157B (zh) 2020-01-21 2020-01-21 应答响应方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111291157B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866086B (zh) * 2021-01-06 2023-01-31 招商银行股份有限公司 智能外呼的信息推送方法、装置、设备及存储介质
CN113127618B (zh) * 2021-04-16 2023-09-01 北京奇艺世纪科技有限公司 一种数据处理方法、装置、电子设备及存储介质
CN115453897A (zh) * 2022-08-18 2022-12-09 青岛海尔科技有限公司 意图指令的确定方法及装置、存储介质及电子装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109514586A (zh) * 2019-01-30 2019-03-26 第四范式(北京)技术有限公司 实现智能客服机器人的方法及系统
CN109858019A (zh) * 2018-12-28 2019-06-07 北京百度网讯科技有限公司 对话状态跟踪方法及装置、存储介质及语义识别系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009048434A1 (en) * 2007-10-11 2009-04-16 Agency For Science, Technology And Research A dialogue system and a method for executing a fully mixed initiative dialogue (fmid) interaction between a human and a machine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858019A (zh) * 2018-12-28 2019-06-07 北京百度网讯科技有限公司 对话状态跟踪方法及装置、存储介质及语义识别系统
CN109514586A (zh) * 2019-01-30 2019-03-26 第四范式(北京)技术有限公司 实现智能客服机器人的方法及系统

Also Published As

Publication number Publication date
CN111291157A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN111291157B (zh) 应答响应方法、装置、终端及存储介质
CN110377720B (zh) 智能多轮交互方法和系统
CN109086026B (zh) 播报语音的确定方法、装置和设备
CN111261151B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN103578463A (zh) 自动化测试方法及测试装置
CN110138980B (zh) 一种智能外呼方法、装置、存储介质和服务器
CN116483980A (zh) 人机交互方法、装置及系统
CN108899015B (zh) 一种向通话中的用户提供语音反馈信息的方法和装置
CN112511591B (zh) 一种医院接口数据交互的实现方法、装置、设备和介质
CN105279168A (zh) 支持自然语言的数据查询方法、开放平台及用户终端
CN113840040B (zh) 一种人机协作的外呼方法、装置、设备及存储介质
CN112035630A (zh) 结合rpa和ai的对话交互方法、装置、设备及存储介质
CN105427857A (zh) 生成文字记录的方法及系统
CN107680598B (zh) 基于好友声纹通讯录的信息交互方法、装置及其设备
CN107506407B (zh) 一种文件分类、调用的方法及装置
CN111258940B (zh) 配置方法、业务审核方法及系统、设备、存储介质
CN115563262B (zh) 机器语音外呼场景中对话数据的处理方法及相关装置
CN110764684A (zh) 基于语音触屏融合的即时交互方法、系统、存储介质、车载终端
CN111580916A (zh) 基于客户端的数据处理方法、装置、设备和存储介质
CN111949776B (zh) 一种用户标签评估的方法、装置和电子设备
CN100452710C (zh) 一种短信机器人系统
CN104580640A (zh) 一种终端
CN113868396A (zh) 基于知识图谱的任务类智能对话构建方法及系统
CN114724561A (zh) 一种语音打断方法、装置、计算机设备及存储介质
CN112744475B (zh) 垃圾桶机器人的分类控制方法、垃圾桶机器人及芯片

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant