CN111008268A - 基于对话系统获取与用户问句对应的反问句的方法和装置 - Google Patents

基于对话系统获取与用户问句对应的反问句的方法和装置 Download PDF

Info

Publication number
CN111008268A
CN111008268A CN201911054861.7A CN201911054861A CN111008268A CN 111008268 A CN111008268 A CN 111008268A CN 201911054861 A CN201911054861 A CN 201911054861A CN 111008268 A CN111008268 A CN 111008268A
Authority
CN
China
Prior art keywords
clause
question
standard
sentence
reversing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911054861.7A
Other languages
English (en)
Other versions
CN111008268B (zh
Inventor
姚开盛
胡翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911054861.7A priority Critical patent/CN111008268B/zh
Publication of CN111008268A publication Critical patent/CN111008268A/zh
Application granted granted Critical
Publication of CN111008268B publication Critical patent/CN111008268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供了一种基于对话系统获取与用户问句对应的反问句的方法和装置,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;从所述第一问句拆分出第三子句和第四子句;确定所述第三子句与所述第一子句是否匹配;在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;获取所述第二问句与所述第一标准问题的相似度;在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。

Description

基于对话系统获取与用户问句对应的反问句的方法和装置
技术领域
本说明书实施例涉及机器学习技术领域,更具体地,涉及一种基于对话系统获取与用户问句对应的反问句的方法和装置。
背景技术
最近,人们越来越关注如何用机器学习来更好地构建对话系统。对话系统通过计算机算法实现人与机器的交流,包括问答型、任务型和闲聊型三个类型。对于上述几种类型的对话系统,通常由用户提出问题,并由对话系统进行回复。在一些情况中,用户提出的问题往往是模糊的,对话系统很难直接从标问库中找到匹配的标准问题、并基于该标准问题的答案进行回复。在该情况中,需要由对话系统对用户提出反问,以明确用户的问题,从而便于找到匹配的标准问题。在现有技术中,用于对用户问句提出反问的模型通常采用监督学习模型,如RNN模型等,为了训练该反问模型,通常需要对多个用户输入问题进行聚类,并基于该聚类结果对用户的输入问题进行标注,以将用户问句进行结构化表示,如将用户的问题标注为几个部分:场景,意图,关键信息等,从而基于该标注样本进行对所述反问模型的训练。另外,在现有技术中,通过基于人工标注训练的模型获取的对用户问句的反问可能具有非常多的数量和类型,这将对系统中后续的机器学习算法的处理增加困难。
因此,需要一种更有效的基于对话系统对用户问句提出反问的方案。
发明内容
本说明书实施例旨在提供一种更有效的基于对话系统对用户问句提出反问的方案,以解决现有技术中的不足。
为实现上述目的,本说明书一个方面提供一种基于对话系统获取与用户问句对应的反问句的方法,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,其中所述第一子句为第一类型子句,所述第二子句为第二类型子句,所述方法包括:
获取第一用户的第一问句;
从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句;
确定所述第三子句与所述第一子句是否匹配;
在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;
获取所述第二问句与所述第一标准问题的相似度;
在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
在一个实施例中,所述第一类型为业务类型,所述第二类型为用户意图类型。
在一个实施例中,从所述第一问句拆分出第三子句和第四子句包括,通过将所述第一问句输入预定模型,以由所述预定模型输出从所述第一问句拆分的第三子句和第四子句,其中所述预定模型以所述对话系统中预设的多个标准问题及从各个标准问题拆分的子句为训练样本得到训练。
在一个实施例中,确定所述第三子句与所述第一子句是否匹配包括,在所述对话系统中预设了对用户问句中的业务类型子句进行标准化的情况中,确定所述第三子句与所述第一子句是否匹配。
在一个实施例中,在所述第一反问模块中预设有与所述第一子句对应的第一组关键词,其中,确定所述第三子句与所述第一子句是否匹配包括,获取所述第三子句包括的第二组关键词,确定所述第二组关键词与所述第一组关键词是否匹配。
在一个实施例中,所述第一反问模块中还预设有与所述第一子句对应的第一反问句,其中,基于所述第一子句获取与所述第一问句对应的反问句包括,从所述第一反问模块中获取所述第一反问句作为针对所述第一问句的反问句。
在一个实施例中,确定所述第三子句与所述第一子句是否匹配包括,通过将第三子句与所述第一子句输入预定语义分析模型,以确定所述第三子句的语义与所述第一子句的语义是否匹配。
在一个实施例中,获取所述第二问句与所述第一标准问题的相似度包括,通过将所述第二问句与所述第一标准问题输入预定语义分析模型,以确定第二问句的语义与所述第一标准问题的语义的相似度。
在一个实施例中,基于所述第一子句获取与所述第一问句对应的反问句包括,以所述第一子句作为与所述第一问句对应的反问句。
本说明书另一方面提供一种基于对话系统获取与用户问句对应的反问句的装置,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,其中所述第一子句为第一类型子句,所述第二子句为第二类型子句,所述装置包括:
第一获取单元,配置为,获取第一用户的第一问句;
拆分单元,配置为,从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句;
确定单元,配置为,确定所述第三子句与所述第一子句是否匹配;
合并单元,配置为,在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;
第二获取单元,配置为,获取所述第二问句与所述第一标准问题的相似度;
第三获取单元,配置为,在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
在一个实施例中,所述拆分单元还配置为,通过将所述第一问句输入预定模型,以由所述预定模型输出从所述第一问句拆分的第三子句和第四子句,其中所述预定模型以所述对话系统中预设的多个标准问题及从各个标准问题拆分的子句为训练样本得到训练。
在一个实施例中,所述确定单元还配置为,在所述对话系统中预设了对用户问句中的业务类型子句进行标准化的情况中,确定所述第三子句与所述第一子句是否匹配。
在一个实施例中,在所述第一反问模块中预设有与所述第一子句对应的第一组关键词,其中,所述确定单元还包括,获取子单元,配置为,获取所述第三子句包括的第二组关键词,确定子单元,配置为,确定所述第二组关键词与所述第一组关键词是否匹配。
在一个实施例中,所述第一反问模块中还预设有与所述第一子句对应的第一反问句,其中,所述第三获取单元还配置为,从所述第一反问模块中获取所述第一反问句作为针对所述第一问句的反问句。
在一个实施例中,所述确定单元还配置为,通过将第三子句与所述第一子句输入预定语义分析模型,以确定所述第三子句的语义与所述第一子句的语义是否匹配。
在一个实施例中,所述第二获取单元还配置为,通过将所述第二问句与所述第一标准问题输入预定语义分析模型,以确定第二问句的语义与所述第一标准问题的语义的相似度。
在一个实施例中,所述第三获取单元还配置为,以所述第一子句作为与所述第一问句对应的反问句。
本说明书另一方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一项方法。
本说明书另一方面提供一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一项方法。
通过根据本说明书实施例的基于对话系统对用户问句提出反问的方案,巧妙地通过对用户问句和标准问题的子句划分来获取模糊问题的反问,并同时使得所述反问是基于标准问题子句的归一化的反问,有利于对话系统中后续的基于机器学习算法的处理,同时相比于现有技术也节省了人力成本,加快了获取反问的速度。
附图说明
通过结合附图描述本说明书实施例,可以使得本说明书实施例更加清楚:
图1示出根据本说明书实施例的对话系统示意图;
图2示出了在图1所示的对话系统中获取反问句的过程示意图;
图3示出根据本说明书实施例的一种基于对话系统获取与用户问句对应的反问句的方法流程图;
图4示出根据本说明书实施例的反问模块的示意图;
图5示出根据本说明书一个实施例的一种基于对话系统获取与用户问句对应的反问句的装置500。
具体实施方式
下面将结合附图描述本说明书实施例。
图1示出根据本说明书实施例的对话系统示意图。如图1中所示,所述对话系统中预设了与N个标准问题对应的M个反问模块,反问模块1,反问模块2,…,反问模块M,每个反问模块中包括第一部分和第二部分两部分,其中,第一部分包括从相应的标准问题拆分的业务子句(子句1),第二部分包括从相应的标准问题拆分的意图子句(子句2),这里,由于一个标准问题可以通过至少一种拆分方式进行拆分,因此,这里M≥N。当用户向该对话系统输入其询问问题之后,在对话系统中对该询问问题按照业务和意图进行拆分,从而获取与用户问句对应的子句3(业务子句)和子句4(意图子句)。然后,假设在该对话系统中预设了对用户问句中的业务子句进行标准化(即,归一到标准问题中的业务子句),则对话系统基于每个反问模块中的子句1和子句2执行图中所示的四个步骤:确定子句3与子句1是否匹配;在匹配的情况中,合并子句1与子句4;确定合并句与相应标准问题是否相似;在相似的情况中,基于子句1获取反问句。从而,可从M个反问模块获取P个反问句,其中P<M。在后续中,对话系统中还可以将该P个反问句输入预定模型以输出预定数目的反问句以用于输出给用户。
图2示出了在图1所示的对话系统中获取反问句的过程示意图。如图2中所示,在步骤21,接收用户输入的第一问句;在步骤22,将第一问句拆分为子句3和子句4;在步骤23,从各个标准问题的子句1和子句2获取标问1的子句1和子句2;在步骤24,确定标问1的子句1与子句3是否匹配,在不匹配的情况中,回到步骤23,获取另一个标问的子句1和子句2;在步骤25,在标问1的子句1与子句3匹配的情况中,合并该子句1与子句4;在步骤26,确定合并句与相应标准问题是否近似,在不近似的情况中,回到步骤23,获取另一个标问的子句1和子句2;在步骤27,在合并句与相应标准问题近似的情况中,输出子句1作为用户问句的反问句。
可以理解,上述对于图1和图2的描述仅仅是示意性的,而不是说明性的。例如,对用户问句的拆分不限于基于业务和意图进行拆分,而可以基于句子结构进行拆分,等等。下面将详细描述上述基于对话系统获取与用户问句对应的反问句的过程。
图3示出根据本说明书实施例的一种基于对话系统获取与用户问句对应的反问句的方法流程图,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,其中所述第一子句为第一类型子句,所述第二子句为第二类型子句,所述方法包括:
步骤S302,获取第一用户的第一问句;
步骤S304,从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句;
步骤S306,确定所述第三子句与所述第一子句是否匹配;
步骤S308,在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;
步骤S310,获取所述第二问句与所述第一标准问题的相似度;
步骤S312,在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
在现有技术中,通常在对话系统中都预设有多个标准问题,在本说明书实施例中,可对标准问题进行拆分获取与该标准问题对应的第一子句和第二子句,例如,可基于标准问题中的业务和诉求分别获取与业务对应的第一子句和与用户意图(诉求)对应的第二子句。例如对于标准问题“开通花呗收钱需要审核多久”,可从其获取“开通花呗收钱”和“审核多久”两个子句,其中,“开通花呗收钱”与业务相关,“审核多久”与用户提问的意图(诉求)相关。可以理解,对标问的拆分不限于只拆分成一种形式,另外,对标问的拆分不限于基于业务和用户意图进行,例如,对于标问“花呗自动还款扣款顺序”,可以获取子句“花呗”和“自动还款”,也可以获取子句“花呗自动还款”和“扣款顺序”等等,例如,可基于用户的提问方式进行相应的对标问的拆分。从而,可基于N个标准问题获取M个反问模块,其中M≥N。
图4示出根据本说明书实施例的反问模块的示意图。如图4所示,该反问模块包括模块标识,例如图中的“11384”,该模块标识例如可以与标准问题编号相对应,以表示该反问模块是与相应的标准问题相对应的。另外,该反问模块中包括第一子句单元41和第二子句单元42,该第一子句单元41例如包括:与业务对应的子句1:“开通花呗收钱”;与该子句1对应的关键词:*(开通|申请)*(花呗收钱|花呗)*;以及与该子句对应的反问句1:“开通花呗收钱?”。类似地,第二子句单元42例如包括:与业务对应的子句2:“审核多久”;与该子句对应的关键词:*审核*(多久|多长时间)*;以及与该子句对应的反问句2:“需要审核多久?”。其中,对于反问模块中的关键词和反问句的使用将在下文详细描述。
在步骤S302,获取第一用户的第一问句。
所述对话系统通常包括提问界面,第一用户可通过在该提问界面通文字或语音等形式向对话系统提出问题。例如,所述第一问句为“我开通花呗需要审核多长”,该问题对于对话系统来说不能与任一个标准问题相匹配,因此属于模糊问题。从而,为了明确该问题,确定该问题所对应的标问,对话系统可通过图3所示的方法提出反问,以使得该问题变得更加清楚。
在步骤S304,从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句。
与上述第一子句和第二子句类似地,所述第三子句可以是与业务相关的子句,所述第四子句可以是与用户意图相关的子句。例如,对于上述第一问句“我开通花呗需要审核多长”,可拆分成子句3“我开通花呗”和子句4“需要审核多长”。
对所述第一问句的拆分可通过预定语义模型进行。例如,在通过人工标注获取各个标准问题的拆分子句(业务子句和意图子句)之后,可以以各个标准问题及其拆分子句为训练样本训练所述预定语义模型,从而使得该预定语义模型可基于业务和意图对所述第一问句进行拆分,从而输出与第一问句对应的子句3和子句4。
在步骤S306,确定所述第三子句与所述第一子句是否匹配。
在获取第一问句的子句3和子句4之后,可如图1中所示,基于对话系统中的各个反问模块进行该步骤以及后续的步骤。这里以图4所示的模块“11384”作为所述第一反问模块的示例进行描述。可以理解,所述第一反问模块可以为所述M个反问模块中的任一模块。
在一个实施例中,对于图4所示的模块“11384”,所述第三子句可以为模块“11384”中子句3和子句4中的任一个。例如,所述第三子句为其中的子句3,则需要获取子句3“我开通花呗”与该模块中的子句1“开通花呗收钱”的匹配度。所述第三子句也可以为其中的子句4,则需要获取子句4“需要审核多长”与该模块中的子句2“需要审核多久”的匹配度。
在一个实施例中,在所述对话系统中预设了对用户问句中的业务类型子句进行标准化的情况中,对于图4所示的模块“11384”,所述第三子句仅可以为模块“11384”中的业务子句,即子句3。
在一个实施例中,如图4所示的反问模块中所示,在该反问模块的每个子句单元中预设有与相应子句对应的一组关键词,例如,如上文所述,与其中子句1对应的一组关键词包括,*(开通|申请)*(花呗收钱|花呗)*,与其中子句2对应的一组关键词包括,*审核*(多久|多长时间)*。从而,为了确定子句3与子句1是否匹配,可首先获取子句3中的关键词,从而可通过确定子句3中是否包括与子句1对应的一组关键词中的每两个*之间的关键词,而确定子句3与子句1是否匹配,其中“|”表示其两边的关键词可任选一个。具体是,从子句3“我开通花呗”可获取关键词:开通、花呗,显然,子句3中包括子句1对应的一组关键词中每两个*之间的一个关键词,因此,可确定,子句3与子句1是匹配的。
在一个实施例中,可将子句3和子句1共同输入预定语义分析模型,从而确定子句3与子句1的相似度是否大于预定阈值,在确定所述相似度大于预定阈值的情况中,可确定子句3与子句1是匹配的。
可以理解,确定子句3与子句1是否匹配不限于上述方式,在一个实施例中,可通过人工的方式确定子句3与子句1是否匹配,所述对话系统可接收该人工确定结果,从而基于该人工确定结果确定子句3与子句1是否匹配。在一个实施例中,对话系统还可以基于子句3与子句1的嵌入向量确定子句3与子句1是否匹配,等等。
在步骤S308,在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句。
如上文所述,当第三子句为所述子句3的情况中,第四子句即为所述子句4“需要审核多长”,从而,可将子句1与子句4进行合并,从而获取合并句,即第二问句“开通花呗收钱需要审核多长”。
在步骤S310,获取所述第二问句与所述第一标准问题的相似度。
也就是说,获取第二问句“开通花呗收钱需要审核多长”与图4所示模块对应的标准问题“开通花呗收钱需要审核多久”之间的相似度。可通过本领域已知的方式获取所述相似度。例如,在一个实施例中,可将该第二问句和相应的标准问题共同输入预定语义分析模型,从而输出二者的相似度。或者,在一个实施例中,可由人工判断所述第二问句与所述第一标准问题是否相似,从而基于人工输入获取所述第二问句与所述第一标准问题的相似度。
在步骤S312,在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
例如,在确定第二问句“开通花呗收钱需要审核多长”相应标准问题“开通花呗收钱需要审核多久”的相似度大于预定阈值的情况中,可基于该标准问题中的子句1(即开通花呗收钱)获取与所述第一问句对应的反问句。例如,可直接以该子句1作为所述反问句,即“开通花呗收钱?”,通过由对话系统向第一用户提出该反问,例如当第一用户点击该反问时,则可以明确所述第一问句与花呗收钱业务相关,从而进一步明确了该第一问句。可以理解,所述反问句不限于为子句1本身,而可以基于子句1获取反问句,例如,该反问句可以为全部所述标准问题,或者所述反问句可以为“您是指开通花呗收钱么?”,等等。
在一个实施例中,如图4中所示,在反问模块的每个子句单元中可预设相应的反问句,例如,在第一子句单元中,可预设相应的反问句“开通花呗收钱?”,从而,在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,可直接从与子句1对应的第一子句单元中获取相应的反问句“开通花呗收钱?”,作为与第一问句对应的反问句。
图5示出根据本说明书一个实施例的一种基于对话系统获取与用户问句对应的反问句的装置500,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,其中所述第一子句为第一类型子句,所述第二子句为第二类型子句,所述装置包括:
第一获取单元51,配置为,获取第一用户的第一问句;
拆分单元52,配置为,从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句;
确定单元53,配置为,确定所述第三子句与所述第一子句是否匹配;
合并单元54,配置为,在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;
第二获取单元55,配置为,获取所述第二问句与所述第一标准问题的相似度;
第三获取单元56,配置为,在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
在一个实施例中,所述拆分单元52还配置为,通过将所述第一问句输入预定模型,以由所述预定模型输出从所述第一问句拆分的第三子句和第四子句,其中所述预定模型以所述对话系统中预设的多个标准问题及从各个标准问题拆分的子句为训练样本得到训练。
在一个实施例中,所述确定单元53还配置为,在所述对话系统中预设了对用户问句中的业务类型子句进行标准化的情况中,确定所述第三子句与所述第一子句是否匹配。
在一个实施例中,在所述第一反问模块中预设有与所述第一子句对应的第一组关键词,其中,所述确定单元53还包括,获取子单元531,配置为,获取所述第三子句包括的第二组关键词,确定子单元532,配置为,确定所述第二组关键词与所述第一组关键词是否匹配。
在一个实施例中,所述第一反问模块中还预设有与所述第一子句对应的第一反问句,其中,所述第三获取单元56还配置为,从所述第一反问模块中获取所述第一反问句作为针对所述第一问句的反问句。
在一个实施例中,所述确定单元53还配置为,通过将第三子句与所述第一子句输入预定语义分析模型,以确定所述第三子句的语义与所述第一子句的语义是否匹配。
在一个实施例中,所述第二获取单元55还配置为,通过将所述第二问句与所述第一标准问题输入预定语义分析模型,以确定第二问句的语义与所述第一标准问题的语义的相似度。
在一个实施例中,所述第三获取单元56还配置为,以所述第一子句作为与所述第一问句对应的反问句。
本说明书另一方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一项方法。
本说明书另一方面提供一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一项方法。
通过根据本说明书实施例的基于对话系统对用户问句提出反问的方案,巧妙地通过对用户问句和标准问题的子句划分来获取模糊问题的反问,并同时使得所述反问是基于标准问题子句的归一化的反问,有利于对话系统中后续的基于机器学习算法的处理,同时相比于现有技术也节省了人力成本,加快了获取反问的速度。
需要理解,本文中的“第一”,“第二”等描述,仅仅为了描述的简单而对相似概念进行区分,并不具有其他限定作用。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (20)

1.一种基于对话系统获取与用户问句对应的反问句的方法,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,其中所述第一子句为第一类型子句,所述第二子句为第二类型子句,所述方法包括:
获取第一用户的第一问句;
从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句;
确定所述第三子句与所述第一子句是否匹配;
在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;
获取所述第二问句与所述第一标准问题的相似度;
在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
2.根据权利要求1所述的方法,其中,所述第一类型为业务类型,所述第二类型为用户意图类型。
3.根据权利要求2所述的方法,其中,从所述第一问句拆分出第三子句和第四子句包括,通过将所述第一问句输入预定模型,以由所述预定模型输出从所述第一问句拆分的第三子句和第四子句,其中所述预定模型以所述对话系统中预设的多个标准问题及从各个标准问题拆分的子句为训练样本得到训练。
4.根据权利要求3所述的方法,其中,确定所述第三子句与所述第一子句是否匹配包括,在所述对话系统中预设了对用户问句中的业务类型子句进行标准化的情况中,确定所述第三子句与所述第一子句是否匹配。
5.根据权利要求1所述的方法,其中,在所述第一反问模块中预设有与所述第一子句对应的第一组关键词,其中,确定所述第三子句与所述第一子句是否匹配包括,获取所述第三子句包括的第二组关键词,确定所述第二组关键词与所述第一组关键词是否匹配。
6.根据权利要求1所述的方法,其中,所述第一反问模块中还预设有与所述第一子句对应的第一反问句,其中,基于所述第一子句获取与所述第一问句对应的反问句包括,从所述第一反问模块中获取所述第一反问句作为针对所述第一问句的反问句。
7.根据权利要求1所述的方法,其中,确定所述第三子句与所述第一子句是否匹配包括,通过将第三子句与所述第一子句输入预定语义分析模型,以确定所述第三子句的语义与所述第一子句的语义是否匹配。
8.根据权利要求1所述的方法,其中,获取所述第二问句与所述第一标准问题的相似度包括,通过将所述第二问句与所述第一标准问题输入预定语义分析模型,以确定第二问句的语义与所述第一标准问题的语义的相似度。
9.根据权利要求1所述的方法,其中,基于所述第一子句获取与所述第一问句对应的反问句包括,以所述第一子句作为与所述第一问句对应的反问句。
10.一种基于对话系统获取与用户问句对应的反问句的装置,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,其中所述第一子句为第一类型子句,所述第二子句为第二类型子句,所述装置包括:
第一获取单元,配置为,获取第一用户的第一问句;
拆分单元,配置为,从所述第一问句拆分出第三子句和第四子句,其中,所述第三子句为所述第一类型子句,所述第四子句为所述第二类型子句;
确定单元,配置为,确定所述第三子句与所述第一子句是否匹配;
合并单元,配置为,在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;
第二获取单元,配置为,获取所述第二问句与所述第一标准问题的相似度;
第三获取单元,配置为,在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。
11.根据权利要求10所述的装置,其中,所述第一类型为业务类型,所述第二类型为用户意图类型。
12.根据权利要求11所述的装置,其中,所述拆分单元还配置为,通过将所述第一问句输入预定模型,以由所述预定模型输出从所述第一问句拆分的第三子句和第四子句,其中所述预定模型以所述对话系统中预设的多个标准问题及从各个标准问题拆分的子句为训练样本得到训练。
13.根据权利要求12所述的装置,其中,所述确定单元还配置为,在所述对话系统中预设了对用户问句中的业务类型子句进行标准化的情况中,确定所述第三子句与所述第一子句是否匹配。
14.根据权利要求10所述的装置,其中,在所述第一反问模块中预设有与所述第一子句对应的第一组关键词,其中,所述确定单元还包括,获取子单元,配置为,获取所述第三子句包括的第二组关键词,确定子单元,配置为,确定所述第二组关键词与所述第一组关键词是否匹配。
15.根据权利要求10所述的装置,其中,所述第一反问模块中还预设有与所述第一子句对应的第一反问句,其中,所述第三获取单元还配置为,从所述第一反问模块中获取所述第一反问句作为针对所述第一问句的反问句。
16.根据权利要求10所述的装置,其中,所述确定单元还配置为,通过将第三子句与所述第一子句输入预定语义分析模型,以确定所述第三子句的语义与所述第一子句的语义是否匹配。
17.根据权利要求10所述的装置,其中,所述第二获取单元还配置为,通过将所述第二问句与所述第一标准问题输入预定语义分析模型,以确定第二问句的语义与所述第一标准问题的语义的相似度。
18.根据权利要求10所述的装置,其中,所述第三获取单元还配置为,以所述第一子句作为与所述第一问句对应的反问句。
19.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
20.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
CN201911054861.7A 2019-10-31 2019-10-31 基于对话系统获取与用户问句对应的反问句的方法和装置 Active CN111008268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911054861.7A CN111008268B (zh) 2019-10-31 2019-10-31 基于对话系统获取与用户问句对应的反问句的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911054861.7A CN111008268B (zh) 2019-10-31 2019-10-31 基于对话系统获取与用户问句对应的反问句的方法和装置

Publications (2)

Publication Number Publication Date
CN111008268A true CN111008268A (zh) 2020-04-14
CN111008268B CN111008268B (zh) 2021-05-18

Family

ID=70111457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911054861.7A Active CN111008268B (zh) 2019-10-31 2019-10-31 基于对话系统获取与用户问句对应的反问句的方法和装置

Country Status (1)

Country Link
CN (1) CN111008268B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130322636A1 (en) * 2009-05-29 2013-12-05 Stmicroelectronics, Inc. Diffusing Acoustical Crosstalk
CN105975460A (zh) * 2016-05-30 2016-09-28 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
CN107330471A (zh) * 2017-07-05 2017-11-07 百度在线网络技术(北京)有限公司 反馈内容的问题定位方法和装置、计算机设备、存储介质
CN108170739A (zh) * 2017-12-18 2018-06-15 深圳前海微众银行股份有限公司 问题匹配方法、终端和计算机可读存储介质
CN108345608A (zh) * 2017-01-24 2018-07-31 北京搜狗科技发展有限公司 一种搜索方法、装置及设备
CN108737057A (zh) * 2018-04-27 2018-11-02 南京邮电大学 基于深度学习的多载波认知noma资源分配方法
CN108959327A (zh) * 2017-05-27 2018-12-07 中国移动通信有限公司研究院 一种业务处理方法、装置及计算机可读存储介质
CN109766421A (zh) * 2018-12-28 2019-05-17 上海汇付数据服务有限公司 智能问答系统以及方法
US20190171712A1 (en) * 2017-12-05 2019-06-06 discourse.ai, Inc. Computer-based Interlocutor Understanding Using Classifying Conversation Segments
CN109871473A (zh) * 2019-02-01 2019-06-11 上海核工程研究设计院有限公司 一种对工程文件和数据库建立全文检索文档的方法
CN110019753A (zh) * 2019-01-24 2019-07-16 阿里巴巴集团控股有限公司 针对用户问句输出反问问句的方法和装置
CN110188180A (zh) * 2019-05-31 2019-08-30 三角兽(北京)科技有限公司 相似问题的确定方法、装置、电子设备及可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130322636A1 (en) * 2009-05-29 2013-12-05 Stmicroelectronics, Inc. Diffusing Acoustical Crosstalk
CN105975460A (zh) * 2016-05-30 2016-09-28 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
CN108345608A (zh) * 2017-01-24 2018-07-31 北京搜狗科技发展有限公司 一种搜索方法、装置及设备
CN108959327A (zh) * 2017-05-27 2018-12-07 中国移动通信有限公司研究院 一种业务处理方法、装置及计算机可读存储介质
CN107330471A (zh) * 2017-07-05 2017-11-07 百度在线网络技术(北京)有限公司 反馈内容的问题定位方法和装置、计算机设备、存储介质
US20190171712A1 (en) * 2017-12-05 2019-06-06 discourse.ai, Inc. Computer-based Interlocutor Understanding Using Classifying Conversation Segments
CN108170739A (zh) * 2017-12-18 2018-06-15 深圳前海微众银行股份有限公司 问题匹配方法、终端和计算机可读存储介质
CN108737057A (zh) * 2018-04-27 2018-11-02 南京邮电大学 基于深度学习的多载波认知noma资源分配方法
CN109766421A (zh) * 2018-12-28 2019-05-17 上海汇付数据服务有限公司 智能问答系统以及方法
CN110019753A (zh) * 2019-01-24 2019-07-16 阿里巴巴集团控股有限公司 针对用户问句输出反问问句的方法和装置
CN109871473A (zh) * 2019-02-01 2019-06-11 上海核工程研究设计院有限公司 一种对工程文件和数据库建立全文检索文档的方法
CN110188180A (zh) * 2019-05-31 2019-08-30 三角兽(北京)科技有限公司 相似问题的确定方法、装置、电子设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TING-EN LIN: "A post-processing method for detecting unknown intent of dialogue system via pre-trained deep neural network classifier", 《KNOWLEDGE-BASED SYSTEM》 *
张爱军: "基于本体的智能答疑系统的研究与实现", 《计算机应用与软件》 *

Also Published As

Publication number Publication date
CN111008268B (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN112365894B (zh) 基于ai的复合语音交互方法、装置及计算机设备
CN109543020B (zh) 问询处理方法及系统
CN111767366A (zh) 问答资源挖掘方法、装置、计算机设备及存储介质
CN110890088B (zh) 语音信息反馈方法、装置、计算机设备和存储介质
CN111143530B (zh) 一种智能答复方法及装置
Windiatmoko et al. Developing facebook chatbot based on deep learning using rasa framework for university enquiries
CN111078856A (zh) 一种群聊对话处理方法、装置及电子设备
CN116824278A (zh) 图像内容分析方法、装置、设备和介质
CN112199486A (zh) 一种办公场景的任务型多轮对话方法及系统
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN110727783B (zh) 一种基于对话系统对用户问句提出反问的方法和装置
CN112581297B (zh) 基于人工智能的信息推送方法、装置及计算机设备
CN113903361A (zh) 基于人工智能的语音质检方法、装置、设备及存储介质
CN111414732A (zh) 文本风格转换方法、装置、电子设备及存储介质
CN111008268B (zh) 基于对话系统获取与用户问句对应的反问句的方法和装置
CN113282725A (zh) 对话交互的方法、装置、电子设备及存储介质
CN111783425A (zh) 基于句法分析模型的意图识别方法及相关装置
CN114186048A (zh) 基于人工智能的问答回复方法、装置、计算机设备及介质
CN112800191B (zh) 一种基于图片的问答方法、设备及计算机可读存储介质
CN112989001B (zh) 一种问答处理方法、装置、介质及电子设备
CN111310847B (zh) 训练要素分类模型的方法和装置
CN114896380A (zh) 自然语言问答方法、系统、装置及电子设备
CN114401346A (zh) 基于人工智能的应答方法、装置、设备及介质
CN113010664A (zh) 一种数据处理方法、装置及计算机设备
CN111883111A (zh) 话术训练处理方法、装置、计算机设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant