CN113779206A - 一种数据处理方法、装置、电子设备和存储介质 - Google Patents

一种数据处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113779206A
CN113779206A CN202011256153.4A CN202011256153A CN113779206A CN 113779206 A CN113779206 A CN 113779206A CN 202011256153 A CN202011256153 A CN 202011256153A CN 113779206 A CN113779206 A CN 113779206A
Authority
CN
China
Prior art keywords
intention
user
list
intent
user request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011256153.4A
Other languages
English (en)
Inventor
马浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202011256153.4A priority Critical patent/CN113779206A/zh
Publication of CN113779206A publication Critical patent/CN113779206A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提出了一种数据处理方法、装置、电子设备和计算机存储介质,该方法包括:获取至少一个用户的意图反馈数据集,所述至少一个用户包括第一用户,所述意图反馈数据集包括至少一次意图反馈数据,所述至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;识别所述第一用户的第一意图,所述第一意图表示当前用户请求对应的意图;从所述意图反馈数据集获取与所述第一意图相关的目标意图反馈数据;生成所述当前用户请求的应答信息,所述应答信息包括所述目标意图反馈数据。

Description

一种数据处理方法、装置、电子设备和存储介质
技术领域
本申请涉及自然语言处理领域,尤其涉及一种数据处理方法、装置、电子设备和计算机存储介质。
背景技术
自然语言理解(Natural Language Understanding,NLU)模块是智能应答系统中的核心模块;NLU模块的主要功能是识别用户意图,得到NLU识别结果,其它模块则基于NLU识别结果进行引导或者应答。
相关技术中,在用户与智能应答系统交互时,智能应答系统基于NLU识别结果,将应答类型通常分为两种:第一种是意图精准的正常应答,第二种是意图模糊的澄清反问;其中,澄清反问是由于用户意图表达不清楚,造成NLU识别意图模糊,进而,基于可能意图列表中的每个意图,进行澄清反问。然而,对于两种不同的应答类型,智能应答系统根据NLU识别结果给出的系统应答是固定的;这是由于智能应答系统中识别模型在训练完成后,识别效果是固定的;因而,智能应答系统根据识别模型输出的识别结果,进行应答和反问,使得应答和反问的效果也是相对固定的,无法动态地、有针对性地按照用户反馈,调整应答、反问策略。
发明内容
本申请提供一种数据处理方法、装置、电子设备和计算机存储介质。
本申请的技术方案是这样实现的:
本申请实施例提供了一种数据处理方法,所述方法包括:
获取至少一个用户的意图反馈数据集,所述至少一个用户包括第一用户,所述意图反馈数据集包括至少一次意图反馈数据,所述至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;
识别所述第一用户的第一意图,所述第一意图表示当前用户请求对应的意图;
从所述意图反馈数据集获取与所述第一意图相关的目标意图反馈数据;
生成所述当前用户请求的应答信息,所述应答信息包括所述目标意图反馈数据。
在一些实施例中,所述获取至少一个用户的意图反馈数据集,包括:
获取所述至少一个用户中每个用户的意图数据和对应的用户意图;所述意图数据包括:本次用户请求和上次用户请求;
在所述本次用户请求对应的用户意图和上次用户请求对应的用户意图都精确,且所述本次用户请求对应的用户意图和上次用户请求对应的用户意图发生意图切换的情况下,生成所述至少一个用户的意图反馈数据集。
在一些实施例中,所述生成所述至少一个用户的意图反馈数据集,包括:
确定所述本次用户请求对应的用户意图的反馈类型;
根据所述反馈类型,将所述本次用户请求对应的用户意图放入所述上次用户请求对应的用户意图的意图列表中,并控制所述本次用户请求对应的用户意图的热度值增加;
根据所述意图列表和所述热度值,生成所述至少一个用户的意图反馈数据集。
在一些实施例中,所述意图列表包括:澄清反问意图列表、精细化引导意图列表或递进引导意图列表;其中,所述澄清反问意图列表包括对所述上次用户请求对应的用户意图纠正后的意图;所述精细化引导意图列表包括对所述上次用户请求对应的用户意图补充后的意图;所述递进引导意图列表包括对所述上次用户请求对应的用户意图递进引导后的意图。
在一些实施例中,所述根据所述反馈类型,将所述本次用户请求对应的用户意图放入所述上次用户请求对应的用户意图的意图列表中,包括:
在所述上次用户请求没有业务词,所述本次用户请求有业务词的情况下,将所述本次用户请求对应的用户意图放入澄清反问意图列表中;
在所述上次用户请求的业务词与所述本次用户请求的业务词至少部分相同的情况下,将所述本次用户请求对应的用户意图放入精细化引导意图列表中;
在所述上次用户请求的业务词与所述本次用户请求的业务词完全不同的情况下,将所述本次用户请求对应的用户意图放入递进引导意图列表中。
在一些实施例中,所述生成所述当前用户请求的应答信息,包括:
确定所述第一意图的识别结果类型;
根据所述识别结果类型,获取所述第一意图的意图列表;
根据所述当前用户请求和所述第一意图的意图列表,生成所述当前用户请求的应答信息。
在一些实施例中,所述根据所述当前用户请求和所述第一意图的意图列表,生成所述当前用户请求的应答信息,包括:
在所述识别结果类型为意图精准的情况下,获取所述第一意图的意图列表中每个意图的热度值;
根据所述热度值和意图相似度,生成所述当前用户请求的应答信息;所述意图相似度表示所述意图列表中每个意图与所述当前用户请求之间的相似度。
在一些实施例中,所述获取所述第一意图的意图列表中每个意图的热度值,包括:
在所述第一意图的澄清反问意图列表满足第一设定条件的情况下,获取所述澄清反问意图列表中每个意图的热度值;
在所述第一意图的澄清反问意图列表不满足第一设定条件、且所述精细化引导意图列表满足第二设定条件的情况下,获取所述精细化引导意图列表中每个意图的热度值;
在所述第一意图的精细化引导意图列表不满足第二设定条件、且所述递进引导意图列表满足第三设定条件的情况下,获取所述递进引导意图列表中每个意图的热度值。
在一些实施例中,所述根据所述热度值和意图相似度,生成所述当前用户请求的应答信息,包括:
根据所述热度值和意图相似度,计算所述意图列表中每个意图的权值;
获取权值大于设定阈值的第一目标意图,根据所述第一目标意图生成所述当前用户请求的应答信息。
在一些实施例中,所述根据所述当前用户请求和所述第一意图的意图列表,生成所述当前用户请求的应答信息,包括:
在所述识别结果类型为意图模糊的情况下,遍历可能意图列表中的每个近似意图;所述可能意图列表包括预先确定的所述第一意图的近似意图;
获取所述每个近似意图的澄清反问意图列表中每个意图的热度值;
根据所述热度值和意图相似度,生成所述当前用户请求的应答信息,所述意图相似度表示所述澄清反问意图列表中每个意图与所述当前用户请求之间的相似度。
在一些实施例中,所述根据所述热度值和意图相似度,生成所述当前用户请求的应答信息,包括:
根据所述热度值和意图相似度,计算所述澄清反问意图列表中每个意图的权值;
获取权值大于设定阈值的第二目标意图,根据所述第二目标意图生成所述当前用户请求的应答信息。
本申请实施例还提出了一种数据处理装置,所述装置包括第一获取模块、识别模块、第二获取模块和生成模块,其中,
第一获取模块,用于获取至少一个用户的意图反馈数据集,所述至少一个用户包括第一用户,所述意图反馈数据集包括至少一次意图反馈数据,所述至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;
识别模块,用于识别所述第一用户的第一意图,所述第一意图表示当前用户请求对应的意图;
第二获取模块,用于从所述意图反馈数据集获取与所述第一意图相关的目标意图反馈数据;
生成模块,用于生成所述当前用户请求的应答信息,所述应答信息包括所述目标意图反馈数据。
本申请实施例提供一种电子设备,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述一个或多个技术方案提供的数据处理方法。
本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后能够实现前述一个或多个技术方案提供的数据处理方法。
本申请实施例提出了一种数据处理方法、装置、电子设备和计算机存储介质,该方法包括:获取至少一个用户的意图反馈数据集,所述至少一个用户包括第一用户,所述意图反馈数据集包括至少一次意图反馈数据,所述至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;识别所述第一用户的第一意图,所述第一意图表示当前用户请求对应的意图;从所述意图反馈数据集获取与所述第一意图相关的目标意图反馈数据;生成所述当前用户请求的应答信息,所述应答信息包括所述目标意图反馈数据。如此,在不修改识别模型的前提下,通过收集用户反馈的意图生成意图反馈数据集,并基于该意图反馈数据集动态的调整应答和引导策略,引导用户获取更加精细的应答或者递进应答。
附图说明
图1是本申请实施例中的一种数据处理方法的流程示意图;
图2为本申请实施例的数据处理系统的结构示意图;
图3为本申请实施例中的另一种数据处理方法的流程示意图;
图4为本申请实施例的数据处理装置的组成结构示意图;
图5为本申请实施例的电子设备的结构示意图。
具体实施方式
以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本申请,并不用于限定本申请。另外,以下所提供的实施例是用于实施本申请的部分实施例,而非提供实施本申请的全部实施例,在不冲突的情况下,本申请实施例记载的技术方案可以任意组合的方式实施。
需要说明的是,在本申请实施例中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其它要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元,例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,I和/或J,可以表示:单独存在I,同时存在I和J,单独存在J这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括I、J、R中的至少一种,可以表示包括从I、J和R构成的集合中选择的任意一个或多个元素。
例如,本申请实施例提供的数据处理方法包含了一系列的步骤,但是本申请实施例提供的数据处理方法不限于所记载的步骤,同样地,本申请实施例提供的数据处理设备包括了一系列模块,但是本申请实施例提供的数据处理设备不限于包括所明确记载的模块,还可以包括为获取相关时序数据、或基于时序数据进行处理时所需要设置的模块。
本申请实施例可以应用于终端设备和服务器组成的计算机系统中,并可以与众多其它通用或专用计算系统环境或配置一起操作。这里,终端设备可以是瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统,等等,服务器可以是服务器计算机系统小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
智能应答系统是人机交互的核心技术之一,常见的应用场景主要是智慧客服。通过构建智能应答系统,机器人可以快速找到与用户问题相匹配的答案并自动回答,从而大大减少人力成本;进一步地,智能应答系统除了提供专业领域的问答功能外,还可实现闲聊、私人助手等应答服务。
Figure BDA0002773157000000071
表1
相关技术中,在用户与智能应答系统交互时,智能应答系统的应答类型通常分为两种:一种是意图精准的正常应答,另一种是意图模糊的澄清反问;如表1所示,对于用户问题“我要修改订单”,其应答类型为意图精准的正常应答;对于用户问题“我花75元,怎么退给我69元”,其应答类型为意图模糊的澄清反问。
相关技术中,用户与智能应答系统的交互主要存在以下缺点:
1)相关技术中,在用户意图不明的情况下,一旦NLU识别结果为意图精准,将无法触发澄清反问;即,部分情况下,用户并没有表达明确业务,但是识别结果却为意图精准,并直接给出固定的系统应答;然而,该系统应答并不准确,会导致用户体验差。这里,通过表2对这种情况进行说明,可以看出,对于用户问题“我的地址不对,需要改一下”,NLU识别结果并没有区分是订单地址不对、发票地址不对,还是账户地址不对;如果用户之后并未反馈或者补充业务,说明系统应答是正确的,但是如果用户在应答之后反馈或者补充业务,说明系统应答是不准确的,会导致用户体验差。
Figure BDA0002773157000000081
表2
2)相关技术中,智能应答系统给出的澄清反问并没有针对性;即,只能对识别模型得到的可能意图列表中的每个意图,进行澄清反问。由于可能意图列表只是多个近似意图的集合,并且该可能意图列表基本是不变的,会导致澄清反问无法针对性地进行调整;这里,通过表3对这种情况进行说明,可以看出,对于用户问题“我的地址不对”,按照识别模型得到的可能意图列表中并没有针对性地反问“地址”相关意图;并且,这个可能意图列表是相对固定的,如果用户反馈了其它业务,无法动态的调整反问。
Figure BDA0002773157000000082
Figure BDA0002773157000000091
表3
3)相关技术中,智能应答系统在应答后,无法动态的引导用户获取更加精细的应答或者递进应答;而对于应答的引导,主要基于人工配置的答案知识库,也是相对固定的;即,无法基于用户反馈进行动态调整,用户体验提升有限。
相关技术中,如果要解决以上技术问题,都需要重新进行人工参与;比如,人工标注语料调整识别模型重新训练;比如,人工调整答案知识库;这样,虽然能在一定程度上修复上述技术问题;但是,这种修复措施的修复周期长、效果有限且成本高。
针对上述技术问题,提出以下各实施例。
在本申请的一些实施例中,数据处理方法可以利用数据处理装置中的处理器实现,上述处理器可以为特定用途集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(DigitalSignal Processing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)、中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。
图1是本申请实施例中的一种数据处理方法的流程示意图,该数据处理方法可以应用于智能应答系统中,如图1所示,该方法包括如下步骤:
步骤100:获取至少一个用户的意图反馈数据集,至少一个用户包括第一用户,意图反馈数据集包括至少一次意图反馈数据,至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息。
本申请实施例中,至少一个用户包括通过智能应答系统进行问题咨询的每个用户;其中,智能应答系统可以通过对话框的方式显示界面,用户可以通过在对话框中直接输入所要咨询的问题,也可以通过点击显示在对话框中的一些链接进行问题咨询;这里,对智能应答系统的应用领域不作限制。
在一些实施例中,对用户所咨询问题的类型不作限制;假设以电商客服智能应答系统为例,用户所咨询问题可以是与商品信息相关的问题,也可以是与物流信息相关的问题。
本申请实施例中,意图反馈数据集包括每个用户的意图反馈数据;其中,意图反馈数据表示用户基于上次咨询问题的应答结果进行反馈的本次咨询问题。
在一种实施方式中,通过实时收集每个用户输入的问题咨询,并确定每个用户输入的问题咨询是否满足设定条件,在满足设定条件的情况下,获取至少一个用户的意图反馈数据集。
在一些实施例中,获取至少一个用户的意图反馈数据集,可以包括:获取至少一个用户中每个用户的意图数据和对应的用户意图;意图数据包括:本次用户请求和上次用户请求;在本次用户请求对应的用户意图和上次用户请求对应的用户意图都精确,且本次用户请求对应的用户意图和上次用户请求对应的用户意图发生意图切换的情况下,生成至少一个用户的意图反馈数据集。
本申请实施例中,本次用户请求表示当前用户本次通过智能应答系统进行问题咨询的请求;上次用户请求表示当前用户上次通过智能应答系统进行问题咨询的请求;通过依次获取每个用户的意图数据和对应的用户意图,并确定在每个用户的意图数据和对应的用户意图均满足上述条件的情况下,对意图反馈数据集进行更新,进而,生成对应的意图反馈数据集。
在一些实施例中,可以通过智能应答系统中的NLU识别每个用户的意图数据对应的用户意图;在NLU识别完成后,确定当前用户的问题咨询是否为首次输入,若当前用户的问题咨询为首次输入,即,在意图数据仅存在本次用户请求而不存在上次用户请求的情况下,说明本次用户请求并非用户的意图反馈数据;进而,无法生成当前用户的意图反馈数据集,结束意图反馈数据集的更新流程。
在一些实施例中,若用户1本次用户请求为“我要修改订单地址”;且用户1上次用户请求为“我要修改订单”;可以看出,本次用户请求“我要修改订单地址”是对上次用户请求“我要修改订单”进一步反馈的业务;即,用户1本次用户请求不为首次输入;若用户1在本次用户请求之前并未进行其它业务的问题咨询,说明用户1本次用户请求为首次输入,并非用户1进一步反馈的业务;这种情况下,无法获取到用户1的反馈意图,因而,结束意图反馈数据集的更新流程。
在一些实施例中,确定本次用户请求对应的用户意图和上次用户请求对应的用户意图是否都精确;若本次用户请求对应的用户意图和上次用户请求对应的用户意图中有任何一个用户意图不精确,结束意图反馈数据集的更新流程,以确保意图反馈数据集的精确性。
在一些实施例中,若用户2本次用户请求为“我要修改订单地址”,且用户2上次用户请求为“我要修改地址”;其中,用户2本次用户请求的意图为“修改订单地址”,识别结果类型为意图精准;用户2上次用户请求的意图可能为“修改订单地址”或“修改账户地址”,识别结果类型为意图模糊;由于用户2上次用户请求的意图不精准,无法保证意图反馈数据集的准确性,结束意图反馈数据集的更新流程。
在一些实施例中,确定本次用户请求对应的用户意图和上次用户请求对应的用户意图是否发生意图切换;如果意图发生切换,可以基于切换后的意图对后续用户输入请求对应的意图进行引导和反问;如果意图没有发生切换,说明本次用户请求对应的用户意图和上次用户请求对应的用户意图相同,而基于相同意图对后续用户输入请求对应的意图进行引导和反问是没有意义的,结束意图反馈数据集的更新流程。
在一些实施例中,若用户3本次用户请求为“我要修改订单商品信息”,且用户3上次用户请求为“我要修改订单信息”;其中,用户3本次用户请求的意图为“修改订单商品”;用户3上次用户请求的意图为“修改订单”;可见,用户3本次用户请求与上次用户请求发生了意图切换,这种情况下,对意图反馈数据集进行更新,后续可以基于意图反馈数据集中切换后的意图对其它用户输入相关请求的意图进行引导和反问。
在一些实施例中,生成至少一个用户的意图反馈数据集,可以包括:确定本次用户请求对应的用户意图的反馈类型;根据反馈类型,将本次用户请求对应的用户意图放入上次用户请求对应的用户意图的意图列表中,并控制本次用户请求对应的用户意图的热度值增加;根据意图列表和热度值,生成至少一个用户的意图反馈数据集。
本申请实施例中,本次用户请求对应的用户意图的反馈类型包括:对上次用户请求对应的用户意图的纠正、对上次用户请求对应的用户意图的补充或对上次用户请求对应的用户意图的递进引导。根据本次用户请求对应的用户意图和上次用户请求对应的用户意图之间的关系可以确定本次用户请求对应的用户意图的反馈类型。
在一些实施例中,可以预先获取业务词词表;业务词词表主要包含能区分用户问题咨询请求对应的意图所属的业务范畴的关键词;这里,业务词词表可以通过人工梳理确定,也可以通过其它方式确定,本申请实施例不作限制。
在一些实施例中,业务词词表中的业务词可以包括:订单、发票、订单地址、发票地址、账户地址、订单配送时间、订单商品、售后、返回时间、余额、账单记录等。
在一些实施例中,可以通过分词工具或分词算法对本次用户请求和上次用户请求进行分词,获取本次用户请求和上次用户请求的分词结果,从分词结果中获取业务词。
在一些实施例中,当分词结果中未获取到本次用户请求和上次用户请求的业务词时,将无法判断本次用户请求对应的用户意图的反馈类型,结束意图反馈数据集的更新流程。
在一些实施例中,使用的分词工具或分词算法可以根据实际应用场景进行设置,本申请实施例不作限制;例如,可以是pkuseg分词工具、结巴分词算法等。
在一些实施例中,根据反馈类型,将本次用户请求对应的用户意图放入上次用户请求对应的用户意图的意图列表中,可以包括:在上次用户请求没有业务词,本次用户请求有业务词的情况下,将本次用户请求对应的用户意图放入澄清反问意图列表中(规则1);在上次用户请求的业务词与本次用户请求的业务词至少部分相同的情况下,将本次用户请求对应的用户意图放入精细化引导意图列表中(规则2);在上次用户请求的业务词与本次用户请求的业务词完全不同的情况下,将本次用户请求对应的用户意图放入递进引导意图列表中(规则3)。
在一些实施例中,意图列表可以包括:澄清反问意图列表、精细化引导意图列表或递进引导意图列表;其中,澄清反问意图列表包括对上次用户请求对应的用户意图纠正后的意图;精细化引导意图列表包括对上次用户请求对应的用户意图补充后的意图;递进引导意图列表包括对上次用户请求对应的用户意图递进引导后的意图。
在一些实施例中,若上次用户请求的意图为“修改订单地址”,本次用户请求的意图为“修改发票地址”;由于“订单地址”与“发票地址”分别表示不同的地址,即,本次用户请求的意图与本次用户请求的意图不相同,可见,意图“修改发票地址”是对意图“修改订单地址”进行纠正后的意图;进而,将本次用户请求的意图“修改发票地址”放入上次用户请求的意图“修改订单地址”的澄清反问意图列表中。
在一些实施例中,若上次用户请求的意图为“修改订单”,本次用户请求的意图为“修改订单配送时间”;由于订单可以包括:订单地址、订单商品、订单配送时间等信息;可见“订单配送时间”是对与“订单”的进一步补充,进而,将本次用户请求的意图“修改订单配送时间”放入上次用户请求的意图“修改订单”的精细化引导意图列表中。
在一些实施例中,若上次用户请求的意图为“售后处理进度和周期”,本次用户请求的意图为“售后返回时间”;由于“售后返回时间”是在“售后处理进度和周期”的基础上递进引导出的其它意图;进而,将本次用户请求的意图“售后返回时间”放入上次用户请求的意图“售后处理进度和周期”的递进引导意图列表中。
在一些实施例中,每个用户意图具有对应的意图列表;其中,本次用户请求对应的用户意图的热度值均对应一个计数器;当本次用户请求对应的用户意图放入上次用户请求对应的用户意图的意图列表中时,则控制对应的计数器的计数相应增加;根据意图列表和热度值,生成用户的意图反馈数据集。下面通过表4对生成用户的意图反馈数据集的过程进行说明。
从表4可以看出,在上次用户请求“我的地址不对,需要改一下”没有业务词,且本次用户请求“我是说发票地址填错了,要改发票”有业务词“发票地址”和“发票”的情况下,触发规则1,将本次用户请求对应的用户意图“修改发票地址”放入上次用户请求对应的用户意图“修改订单地址”的澄清反问意图列表中,并控制本次用户请求对应的用户意图“修改发票地址”的热度值在原始数值N的基础上加1;其中,N为大于或等于0的整数。
在上次用户请求“我要改订单信息”有业务词“订单”,且本次用户请求“怎么改订单里面的商品信息”有业务词“订单”和“商品”的情况下,触发规则2,将本次用户请求对应的用户意图“修改订单商品”放入上次用户请求对应的用户意图“修改订单”的精细化引导意图列表中,并控制本次用户请求对应的用户意图“修改订单商品”的热度值在原始数值N的基础上加1;其中,N为大于或等于0的整数。
在上次用户请求“我要查询售后处理进度”有业务词“售后”和“处理进度”,且本次用户请求“没人来取售后商品”有业务词“售后商品”的情况下,触发规则3,将本次用户请求对应的用户意图“售后返回时间”放入上次用户请求对应的用户意图“售后处理进度和周期”的递进引导意图列表中,并控制本次用户请求对应的用户意图“售后返回时间”的热度值在原始数值N的基础上加1;其中,N为大于或等于0的整数。
Figure BDA0002773157000000141
Figure BDA0002773157000000151
表4
在意图反馈数据集中,针对每个用户意图分类,并放入对应意图列表的三个类型的列表:澄清反问意图列表、精细化引导意图列表、递进引导意图列表;每个意图分类的三个类型的列表可能存在一个或多个为空的情况;列表中的每个意图,都有实时统计的热度值,即,表示反馈意图的触发次数;这里,可以保留固定周期内的热度值,例如,保留两周内或一周内统计的热度值,从而保证反馈数据集的时效性。下面通过表5对最终生成的意图反馈数据集进行说明。
Figure BDA0002773157000000152
Figure BDA0002773157000000161
表5
从表5可以看出,对于用户意图“修改订单地址”,在澄清反问意图列表中,有“修改发票地址”和“修改账户地址”两个意图;且意图“修改发票地址”对应的热度值为630,意图“修改账户地址”对应的热度值为272;在精细化引导意图列表中为空;在递进引导意图列表中,有“取消订单”这个意图;且该意图对应的热度值为1133。
对于用户意图“修改订单”,在澄清反问意图列表中为空;在精细化引导意图列表中有“修改订单地址”、“修改订单商品”和“修改订单配送时间”三个意图;且意图“修改订单地址”对应的热度值为2201,意图“修改订单商品”对应的热度值为821,意图“修改订单配送时间”对应的热度值为2157;在递进引导意图列表中,有“取消订单”这个意图;且该意图对应的热度值为601。
对于用户意图“售后处理进度和周期”,在澄清反问意图列表中为空;在精细化引导意图列表中为空;在递进引导意图列表中,有“售后返回时间”这个意图;且该意图对应的热度值为195。
步骤101:识别第一用户的第一意图,第一意图表示当前用户请求对应的意图。
本申请实施例中,第一用户表示当前通过智能应答系统进行问题咨询的用户,可以通过NLU模块识别当前用户进行问题咨询的用户意图,得到识别结果。
其中,NLU意图识别是针对已知的训练语料;例如,语料格式为(x,y)格式的元组列表,其中x为训练语料,y为期望输出类别或者意图;采用选定的算法构建一个识别模型,而后基于构建的识别模型对未知的文本进行分类;这里,未知的文本表示当前用户进行问题咨询的数据文本。
在一些实施例中,通过NLU意图识别的处理流程如下:获取训练数据,按照固定的格式进行分词处理;抽取所需要的特征,形成特征向量;抽取的特征向量与对应的期望输出用于训练识别模型;对新输入的数据采取同样的特征抽取,得到用于识别的特征向量;使用训练好的识别模型,对新输入的数据抽取的特征进行识别,并返回识别结果。
步骤102:从意图反馈数据集获取与第一意图相关的目标意图反馈数据。
本申请实施例中,在识别第一用户的第一意图后,若生成的意图反馈数据集中存储有第一意图的意图列表,则在意图反馈数据集中获取第一意图的意图列表;其中,目标意图反馈数据表示第一意图的意图列表中的意图数据。
在一些实施例中,对于第一意图,其在意图反馈数据集中对应的用户请求可以与当前用户请求的内容不完全相同;例如,当前用户请求为“我的地址不对,需要改一下”;而意图反馈数据集中第一意图对应的可以用户请求为“我要修改订单地址”或“如何修改订单地址”;而这些用户请求对应的用户意图均为“修改订单地址”。
本申请实施例中,在第一意图的识别结果类型为意图精准的情况下,第一意图的意图列表包括:第一意图的澄清反问意图列表、第一意图的精细化引导意图列表和第一意图的递进引导意图列表;其中,第一意图包括的三个列表可能存在其中一个或两个为空的情况;目标意图反馈数据的获取按照优先级从高到低的顺序依次为:第一意图的澄清反问意图列表、第一意图的精细化引导意图列表和第一意图的递进引导意图列表。
在一种实施方式中,对于第一意图M,若澄清反问意图列表中包括意图M01和意图M02;精细化引导意图列表为空,且递进引导意图列表包括意图M21、意图M22和意图M23这三个意图;则首先获取意图M01和意图M02这两个意图,再获取意图M21、意图M22和意图M23这三个意图。
本申请实施例中,在第一意图的识别结果类型为意图模糊的情况下,第一意图的意图列表为第一意图的澄清反问意图列表。
在一些实施例中,对于目标意图反馈数据的获取方式本申请实施例不作限定,可以通过人工输入的方式进行获取,也可以通过其它方式进行获取。
步骤103:生成当前用户请求的应答信息,应答信息包括目标意图反馈数据。
在一些实施例中,应答信息表示基于意图反馈数据集得到的应答结果,根据该应答结果可以生成对应的反问列表;该反问列表可以对智能应答系统本身给出的应答结果进行补充。
在一些实施例中,生成当前用户请求的应答信息,可以包括:确定第一意图的识别结果类型;根据识别结果类型,获取第一意图的意图列表;根据当前用户请求和第一意图的意图列表,生成当前用户请求的应答信息。
本申请实施例中,第一意图的识别结果类型分为两种:第一种是意图精准,第二种是意图模糊;其中,在意图精准的情况下,第一意图表示一个明确的意图;在意图模糊的情况下,第一意图表示与第一用户进行问题咨询的用户意图相似的至少一个意图的集合。
在一种实施方式中,当用户问题为“我的地址不对”时,若识别结果为意图精准,则第一意图为“修改订单地址”这一个明确的意图;若识别结果为意图模糊,则第一意图为“修改订单地址”、“如何取消订单”和“服务单修改”这三个意图的集合。
在一些实施例中,根据当前用户请求和第一意图的意图列表,生成当前用户请求的应答信息,可以包括:在识别结果类型为意图精准的情况下,获取第一意图的意图列表中每个意图的热度值;根据热度值和意图相似度,生成当前用户请求的应答信息;意图相似度表示意图列表中每个意图与当前用户请求之间的相似度。
本申请实施例中,在第一意图的识别结果类型为意图精准的情况下,获取第一意图的意图列表;这里,可以按照优先级顺序依次获取第一意图的澄清反问意图列表、精细化引导意图列表或递进引导意图列表。
在一些实施例中,获取第一意图的意图列表中每个意图的热度值,可以包括:在第一意图的澄清反问意图列表满足第一设定条件的情况下,获取澄清反问意图列表中每个意图的热度值;在第一意图的澄清反问意图列表不满足第一设定条件、且精细化引导意图列表满足第二设定条件的情况下,获取精细化引导意图列表中每个意图的热度值;在第一意图的精细化引导意图列表不满足第二设定条件、且递进引导意图列表满足第三设定条件的情况下,获取递进引导意图列表中每个意图的热度值。
本申请实施例中,第一设定条件表示第一意图的澄清反问意图列表不为空,且当前用户请求不存在业务词;第二设定条件表示第一意图的细化引导意图列表不为空,第三设定条件表示第一意图的递进引导意图列表不为空。
在一些实施例中,根据热度值和意图相似度,生成当前用户请求的应答信息,可以包括:根据热度值和意图相似度,计算意图列表中每个意图的权值;获取权值大于设定阈值的第一目标意图,根据第一目标意图生成当前用户请求的应答信息。
本申请实施例中,根据公式(1)计算意图列表中每个意图的权值,过滤并获取大于设定阈值的当前用户请求。
f(A)=lg(count(A))*similar(A,T) (1)
这里,A表示意图列表中的每个意图,T表示当前用户请求,count(A)表示意图A对应的热度值,similar(A,T)表示意图A与当前用户请求T的相似度。
在一些实施例中,可以调用相似度模型进行意图列表中每个意图与当前用户请求之间相似度的计算;这里,可以根据实际应用场景对不同的相似度模型进行调用,例如,可以调用深度语义匹配模型(Deep Structured Semantic Models,DSSM)计算相似度,也可以调用其它匹配模型计算相似度。
在一些实施例中,首先确定第一意图的澄清反问意图列表中每个意图当前用户请求之间的意图相似度,根据澄清反问意图列表中每个意图的热度值和意图相似度,计算澄清反问意图列表中每个意图的权值,获取大于设定阈值的第一目标意图。这里,对于设定阈值的设置可以根据实际应用场景进行设置,本申请实施例不作限制。
在一些实施例中,如果在澄清反问意图列表中获取到第一目标意图,则根据第一目标意图在预先配置的答案知识库中匹配对应的答案,生成当前用户请求的应答信息。如果在澄清反问意图列表中未获取到第一目标意图,则计算精细化引导意图列表中每个意图的权值,获取大于设定阈值的第一目标意图;根据第一目标意图生成当前用户请求的应答信息。如果在精细化引导意图列表未获取到第一目标意图,则计算递进引导意图列表中每个意图的权值,获取大于设定阈值的第一目标意图;根据第一目标意图生成当前用户请求的应答信息。
下面通过表6对根据第一目标意图生成当前用户请求的应答信息进行说明。
Figure BDA0002773157000000201
表6
从表6可以看出,由于用户意图“修改订单地址”的澄清反问意图列表中意图“修改发票地址”和意图“修改账户地址”的权值均大于设定阈值1,因而,可以根据这两个意图生成应答信息“怎么修改发票地址”和“如何修改个人账户地址”;最终推送的系统应答为原始推送结果与应答信息的结合。
在一些实施例中,根据当前用户请求和第一意图的意图列表,生成当前用户请求的应答信息,可以包括:在识别结果类型为意图模糊的情况下,遍历可能意图列表中的每个近似意图;可能意图列表包括预先确定的第一意图的近似意图;获取每个近似意图的澄清反问意图列表中每个意图的热度值;根据热度值和意图相似度,生成当前用户请求的应答信息,意图相似度表示澄清反问意图列表中每个意图与当前用户请求之间的相似度。
在一些实施例中,根据热度值和意图相似度,生成当前用户请求的应答信息,可以包括:根据热度值和意图相似度,计算澄清反问意图列表中每个意图的权值;获取权值大于设定阈值的第二目标意图,根据第二目标意图生成当前用户请求的应答信息。
本申请实施例中,在每个近似意图的澄清反问意图列表不为空,且当前用户请求不存在业务词的情况下,则按照公式(1)计算可能意图列表中的每个近似意图的权值,获取权值大于设定阈值的第二目标意图;根据第二目标意图生成当前用户请求的应答信息。下面通过表7对根据第二目标意图生成当前用户请求的应答信息进行说明。
Figure BDA0002773157000000211
表7
从表7可以看出,对于可能意图列表包括的近似意图“修改订单地址”、“如何取消订单”和“服务单修改”;其中,近似意图“修改订单地址”的澄清反问意图列表中意图“修改发票地址”和意图“修改账户地址”的权值均大于设定阈值1,可以根据这两个意图生成应答信息“怎么修改发票地址”和“如何修改个人账户地址”;而近似意图“如何取消订单”和“服务单修改”均无澄清反问意图列表,则直接根据近似意图生成应答信息“能否取消订单”和“把换货改成退货”;最终推送的系统应答为原始推送结果与应答信息的结合。
本申请实施例提出了一种数据处理方法、装置、电子设备和计算机存储介质,该方法包括:获取至少一个用户的意图反馈数据集,至少一个用户包括第一用户,意图反馈数据集包括至少一次意图反馈数据,至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;识别第一用户的第一意图,第一意图表示当前用户请求对应的意图;从意图反馈数据集获取与第一意图相关的目标意图反馈数据;生成当前用户请求的应答信息,应答信息包括目标意图反馈数据。如此,在不修改识别模型的前提下,通过收集用户反馈的意图生成意图反馈数据集,并基于该意图反馈数据集动态的调整应答和引导策略,确保用户获取更加精细的应答或者递进应答,提高了用户体验。
为了能够更加体现本申请的目的,在本申请上述实施例的基础上,进行进一步的举例说明。
图2为本申请实施例的数据处理系统的结构示意图,如图2所示,该系统包括两个模块和一个数据集:反馈收集模块、意图反馈数据集和动态补充应答模块;其中,反馈收集模块用于收集每个用户的意图数据和对应的用户意图,进而,生成意图反馈数据集;意图反馈数据集中包括每个用户针对上次意图反馈的纠正意图、补充意图、递进引导意图等意图反馈数据;动态补充应答模块用于调用意图反馈数据集中与当前用户问题咨询对应意图相关的目标意图数据,并根据目标意图数据动态的调整当前用户的系统应答和引导策略。
图3为本申请实施例中的另一种数据处理方法的流程示意图,如图3所示,相关技术中智能应答系统包括用户输入、NLU模块、答案知识库和系统应答这四大部分;其处理流程为:用户输入本次问题咨询请求至NLU模块,NLU模块输出本次问题咨询请求的意图识别结果,在答案知识库中匹配意图识别结果对应的答案,生成用户本次问题咨询请求的系统应答。
本申请实施例在此基础上加入反馈收集模块、意图反馈数据集和动态补充应答模块;其中,反馈收集模块可以收集上述处理流程中任一个阶段的数据;首先,获取用户本次问题咨询请求,判断本次问题咨询请求是否为首次输入,在判断结果为是的情况下,跳出该流程;在判断结果为否的情况下,获取本次问题咨询请求的上次问题咨询请求,并判断本次问题咨询请求和上次问题咨询请求的意图是否精准,在判断结果为否的情况下,跳出该流程;在判断结果为是的情况下,判断本次问题咨询请求和上次问题咨询请求是否发生意图切换,在判断结果为否的情况下,跳出该流程;在判断结果为是的情况下,更新意图反馈数据集。
动态补充应答模块首先获取本次问题咨询请求和对应意图的识别结果类型;在识别结果类型为意图精准的情况下,调用意图反馈数据集,生成引导反问列表;在识别结果类型为意图模糊的情况下,调用意图反馈数据集,生成补充引导反问列表;根据反问列表中的意图生成应答信息,最终推送的系统应答为原始推送结果与应答信息的结合。
图4为本申请实施例的数据处理装置的组成结构示意图,如图4所示,装置包括:第一获取模块400、识别模块401、第二获取模块402和生成模块403,其中:
第一获取模块400,用于获取至少一个用户的意图反馈数据集,至少一个用户包括第一用户,意图反馈数据集包括至少一次意图反馈数据,至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;
识别模块401,用于识别第一用户的第一意图,第一意图表示当前用户请求对应的意图;
第二获取模块402,用于从意图反馈数据集获取与第一意图相关的目标意图反馈数据;
生成模块403,用于生成当前用户请求的应答信息,应答信息包括目标意图反馈数据。
在一些实施例中,第一获取模块400,用于获取至少一个用户的意图反馈数据集,包括:
获取至少一个用户中每个用户的意图数据和对应的用户意图;意图数据包括:本次用户请求和上次用户请求;
在本次用户请求对应的用户意图和上次用户请求对应的用户意图都精确,且本次用户请求对应的用户意图和上次用户请求对应的用户意图发生意图切换的情况下,生成至少一个用户的意图反馈数据集。
在一些实施例中,第一获取模块400,用于生成至少一个用户的意图反馈数据集,包括:
确定本次用户请求对应的用户意图的反馈类型;
根据反馈类型,将本次用户请求对应的用户意图放入上次用户请求对应的用户意图的意图列表中,并控制本次用户请求对应的用户意图的热度值增加;
根据意图列表和热度值,生成至少一个用户的意图反馈数据集。
在一些实施例中,意图列表包括:澄清反问意图列表、精细化引导意图列表或递进引导意图列表;其中,澄清反问意图列表包括对上次用户请求对应的用户意图纠正后的意图;精细化引导意图列表包括对上次用户请求对应的用户意图补充后的意图;递进引导意图列表包括对上次用户请求对应的用户意图递进引导后的意图。
在一些实施例中,第一获取模块400,用于根据反馈类型,将本次用户请求对应的用户意图放入上次用户请求对应的用户意图的意图列表中,包括:
在上次用户请求没有业务词,本次用户请求有业务词的情况下,将本次用户请求对应的用户意图放入澄清反问意图列表中;
在上次用户请求的业务词与本次用户请求的业务词至少部分相同的情况下,将本次用户请求对应的用户意图放入精细化引导意图列表中;
在上次用户请求的业务词与本次用户请求的业务词完全不同的情况下,将本次用户请求对应的用户意图放入递进引导意图列表中。
在一些实施例中,生成模块403,用于生成当前用户请求的应答信息,包括:
确定第一意图的识别结果类型;
根据识别结果类型,获取第一意图的意图列表;
根据当前用户请求和第一意图的意图列表,生成当前用户请求的应答信息。
在一些实施例中,生成模块403,用于根据当前用户请求和第一意图的意图列表,生成当前用户请求的应答信息,包括:
在识别结果类型为意图精准的情况下,获取第一意图的意图列表中每个意图的热度值;
根据热度值和意图相似度,生成当前用户请求的应答信息;意图相似度表示意图列表中每个意图与当前用户请求之间的相似度。
在一些实施例中,生成模块403,用于获取第一意图的意图列表中每个意图的热度值,包括:
在第一意图的澄清反问意图列表满足第一设定条件的情况下,获取澄清反问意图列表中每个意图的热度值;
在第一意图的澄清反问意图列表不满足第一设定条件、且精细化引导意图列表满足第二设定条件的情况下,获取精细化引导意图列表中每个意图的热度值;
在第一意图的精细化引导意图列表不满足第二设定条件、且递进引导意图列表满足第三设定条件的情况下,获取递进引导意图列表中每个意图的热度值。
在一些实施例中,生成模块403,用于根据热度值和意图相似度,生成当前用户请求的应答信息,包括:
根据热度值和意图相似度,计算意图列表中每个意图的权值;
获取权值大于设定阈值的第一目标意图,根据第一目标意图生成当前用户请求的应答信息。
在一些实施例中,生成模块403,用于根据当前用户请求和第一意图的意图列表,生成当前用户请求的应答信息,包括:
在识别结果类型为意图模糊的情况下,遍历可能意图列表中的每个近似意图;可能意图列表包括预先确定的第一意图的近似意图;
获取每个近似意图的澄清反问意图列表中每个意图的热度值;
根据热度值和意图相似度,生成当前用户请求的应答信息,意图相似度表示澄清反问意图列表中每个意图与当前用户请求之间的相似度。
在一些实施例中,生成模块403,用于根据热度值和意图相似度,生成当前用户请求的应答信息,包括:
根据热度值和意图相似度,计算澄清反问意图列表中每个意图的权值;
获取权值大于设定阈值的第二目标意图,根据第二目标意图生成当前用户请求的应答信息。
在实际应用中,上述第一获取模块400、识别模块401、第二获取模块402和生成模块403均可以由位于电子设备中的处理器实现,该处理器可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
另外,在本实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)或processor(处理器)执行本实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
具体来讲,本实施例中的一种数据处理方法对应的计算机程序指令可以被存储在光盘、硬盘、U盘等存储介质上,当存储介质中的与一种数据处理方法对应的计算机程序指令被一电子设备读取或被执行时,实现前述实施例的任意一种数据处理方法。
基于前述实施例相同的技术构思,参见图5,其示出了本申请提供的电子设备500,可以包括:存储器501和处理器502;其中,
存储器501,用于存储计算机程序和数据;
处理器502,用于执行存储器中存储的计算机程序,以实现前述实施例的任意一种数据处理方法。
在实际应用中,上述存储器501可以是易失性存储器(volatile memory),例如RAM;或者非易失性存储器(non-volatile memory),例如ROM、快闪存储器(flash memory)、硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,并向处理器502提供指令和数据。
上述处理器502可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的数据处理设备,用于实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述
本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (14)

1.一种数据处理方法,其特征在于,所述方法包括:
获取至少一个用户的意图反馈数据集,所述至少一个用户包括第一用户,所述意图反馈数据集包括至少一次意图反馈数据,所述至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;
识别所述第一用户的第一意图,所述第一意图表示当前用户请求对应的意图;
从所述意图反馈数据集获取与所述第一意图相关的目标意图反馈数据;
生成所述当前用户请求的应答信息,所述应答信息包括所述目标意图反馈数据。
2.根据权利要求1所述的方法,其特征在于,所述获取至少一个用户的意图反馈数据集,包括:
获取所述至少一个用户中每个用户的意图数据和对应的用户意图;所述意图数据包括:本次用户请求和上次用户请求;
在所述本次用户请求对应的用户意图和上次用户请求对应的用户意图都精确,且所述本次用户请求对应的用户意图和上次用户请求对应的用户意图发生意图切换的情况下,生成所述至少一个用户的意图反馈数据集。
3.根据权利要求2所述的方法,其特征在于,所述生成所述至少一个用户的意图反馈数据集,包括:
确定所述本次用户请求对应的用户意图的反馈类型;
根据所述反馈类型,将所述本次用户请求对应的用户意图放入所述上次用户请求对应的用户意图的意图列表中,并控制所述本次用户请求对应的用户意图的热度值增加;
根据所述意图列表和所述热度值,生成所述至少一个用户的意图反馈数据集。
4.根据权利要求3所述的方法,其特征在于,所述意图列表包括:澄清反问意图列表、精细化引导意图列表或递进引导意图列表;其中,所述澄清反问意图列表包括对所述上次用户请求对应的用户意图纠正后的意图;所述精细化引导意图列表包括对所述上次用户请求对应的用户意图补充后的意图;所述递进引导意图列表包括对所述上次用户请求对应的用户意图递进引导后的意图。
5.根据权利要求4所述的方法,其特征在于,所述根据所述反馈类型,将所述本次用户请求对应的用户意图放入所述上次用户请求对应的用户意图的意图列表中,包括:
在所述上次用户请求没有业务词,所述本次用户请求有业务词的情况下,将所述本次用户请求对应的用户意图放入澄清反问意图列表中;
在所述上次用户请求的业务词与所述本次用户请求的业务词至少部分相同的情况下,将所述本次用户请求对应的用户意图放入精细化引导意图列表中;
在所述上次用户请求的业务词与所述本次用户请求的业务词完全不同的情况下,将所述本次用户请求对应的用户意图放入递进引导意图列表中。
6.根据权利要求1所述的方法,其特征在于,所述生成所述当前用户请求的应答信息,包括:
确定所述第一意图的识别结果类型;
根据所述识别结果类型,获取所述第一意图的意图列表;
根据所述当前用户请求和所述第一意图的意图列表,生成所述当前用户请求的应答信息。
7.根据权利要求6所述的方法,其特征在于,所述根据所述当前用户请求和所述第一意图的意图列表,生成所述当前用户请求的应答信息,包括:
在所述识别结果类型为意图精准的情况下,获取所述第一意图的意图列表中每个意图的热度值;
根据所述热度值和意图相似度,生成所述当前用户请求的应答信息;所述意图相似度表示所述意图列表中每个意图与所述当前用户请求之间的相似度。
8.根据权利要求7所述的方法,其特征在于,所述获取所述第一意图的意图列表中每个意图的热度值,包括:
在所述第一意图的澄清反问意图列表满足第一设定条件的情况下,获取所述澄清反问意图列表中每个意图的热度值;
在所述第一意图的澄清反问意图列表不满足第一设定条件、且所述精细化引导意图列表满足第二设定条件的情况下,获取所述精细化引导意图列表中每个意图的热度值;
在所述第一意图的澄清反问意图列表不满足第一设定条件、所述第一意图的精细化引导意图列表不满足第二设定条件、且所述递进引导意图列表满足第三设定条件的情况下,获取所述递进引导意图列表中每个意图的热度值。
9.根据权利要求7所述的方法,其特征在于,所述根据所述热度值和意图相似度,生成所述当前用户请求的应答信息,包括:
根据所述热度值和意图相似度,计算所述意图列表中每个意图的权值;
获取权值大于设定阈值的第一目标意图,根据所述第一目标意图生成所述当前用户请求的应答信息。
10.根据权利要求6所述的方法,其特征在于,所述根据所述当前用户请求和所述第一意图的意图列表,生成所述当前用户请求的应答信息,包括:
在所述识别结果类型为意图模糊的情况下,遍历可能意图列表中的每个近似意图;所述可能意图列表包括预先确定的所述第一意图的近似意图;
获取所述每个近似意图的澄清反问意图列表中每个意图的热度值;
根据所述热度值和意图相似度,生成所述当前用户请求的应答信息,所述意图相似度表示所述澄清反问意图列表中每个意图与所述当前用户请求之间的相似度。
11.根据权利要求10所述的方法,其特征在于,所述根据所述热度值和意图相似度,生成所述当前用户请求的应答信息,包括:
根据所述热度值和意图相似度,计算所述澄清反问意图列表中每个意图的权值;
获取权值大于设定阈值的第二目标意图,根据所述第二目标意图生成所述当前用户请求的应答信息。
12.一种数据处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取至少一个用户的意图反馈数据集,所述至少一个用户包括第一用户,所述意图反馈数据集包括至少一次意图反馈数据,所述至少一次意图反馈数据中每次意图反馈数据表示:针对上次用户请求的应答结果的用户回复信息;
识别模块,用于识别所述第一用户的第一意图,所述第一意图表示当前用户请求对应的意图;
第二获取模块,用于从所述意图反馈数据集获取与所述第一意图相关的目标意图反馈数据;
生成模块,用于生成所述当前用户请求的应答信息,所述应答信息包括所述目标意图反馈数据。
13.一种电子设备,其特征在于,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至11任一项所述的方法。
14.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11任一项所述的方法。
CN202011256153.4A 2020-11-11 2020-11-11 一种数据处理方法、装置、电子设备和存储介质 Pending CN113779206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011256153.4A CN113779206A (zh) 2020-11-11 2020-11-11 一种数据处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011256153.4A CN113779206A (zh) 2020-11-11 2020-11-11 一种数据处理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113779206A true CN113779206A (zh) 2021-12-10

Family

ID=78835299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011256153.4A Pending CN113779206A (zh) 2020-11-11 2020-11-11 一种数据处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113779206A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010034695A (ja) * 2008-07-25 2010-02-12 Toshiba Corp 音声応答装置及び方法
WO2018000279A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 基于导流的意图识别方法和系统
CN110188183A (zh) * 2019-06-04 2019-08-30 软通智慧科技有限公司 一种智能问答知识库的更新方法、装置、设备和存储介质
CN110427461A (zh) * 2019-08-06 2019-11-08 腾讯科技(深圳)有限公司 智能问答信息处理方法、电子设备及计算机可读存储介质
CN111739506A (zh) * 2019-11-21 2020-10-02 北京沃东天骏信息技术有限公司 一种应答方法、终端及存储介质
WO2020220340A1 (zh) * 2019-04-30 2020-11-05 北京字节跳动网络技术有限公司 对象推荐方法及装置、存储介质与终端设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010034695A (ja) * 2008-07-25 2010-02-12 Toshiba Corp 音声応答装置及び方法
WO2018000279A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 基于导流的意图识别方法和系统
WO2020220340A1 (zh) * 2019-04-30 2020-11-05 北京字节跳动网络技术有限公司 对象推荐方法及装置、存储介质与终端设备
CN110188183A (zh) * 2019-06-04 2019-08-30 软通智慧科技有限公司 一种智能问答知识库的更新方法、装置、设备和存储介质
CN110427461A (zh) * 2019-08-06 2019-11-08 腾讯科技(深圳)有限公司 智能问答信息处理方法、电子设备及计算机可读存储介质
CN111739506A (zh) * 2019-11-21 2020-10-02 北京沃东天骏信息技术有限公司 一种应答方法、终端及存储介质

Similar Documents

Publication Publication Date Title
WO2019128426A1 (en) Method for training model and information recommendation system
US20170329856A1 (en) Method and device for selecting data content to be pushed to terminal, and non-transitory computer storage medium
WO2015120798A1 (en) Method for processing network media information and related system
CN104951428A (zh) 用户意图识别方法及装置
JP6199517B1 (ja) 決定装置、決定方法および決定プログラム
CN111340148A (zh) 一种业务分类模型的训练方法、业务分类方法以及终端
WO2018137420A1 (zh) 一种信息推荐列表的生成方法及装置
WO2020170593A1 (ja) 情報処理装置及び情報処理方法
CN112070545B (zh) 用于优化信息触达的方法、装置、介质和电子设备
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN111402864A (zh) 语音处理方法及电子设备
CN111259272A (zh) 搜索结果排序方法及装置
WO2016151333A1 (en) Computer system for calculating translation costs
CN110377803B (zh) 信息处理方法以及装置
CN108241735A (zh) 一种数据分析方法及设备
CN113779206A (zh) 一种数据处理方法、装置、电子设备和存储介质
CN111949697A (zh) 基于搜索引擎的数据处理方法、装置、终端及介质
KR20210090706A (ko) 정렬
CN108959327B (zh) 一种业务处理方法、装置及计算机可读存储介质
CN115186179A (zh) 保险产品推送方法和装置
CN115391659A (zh) 新闻推荐方法、装置、电子设备及计算机可读存储介质
CN111400512B (zh) 一种筛选多媒体资源的方法及装置
CN110232590B (zh) 一种方案的生成方法及设备
CN113536778A (zh) 标题的生成方法、装置和计算机可读存储介质
CN111782776A (zh) 一种通过填槽实现意图识别的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination