CN111177355B - 基于搜索数据的人机对话交互方法、装置和电子设备 - Google Patents
基于搜索数据的人机对话交互方法、装置和电子设备 Download PDFInfo
- Publication number
- CN111177355B CN111177355B CN201911403103.1A CN201911403103A CN111177355B CN 111177355 B CN111177355 B CN 111177355B CN 201911403103 A CN201911403103 A CN 201911403103A CN 111177355 B CN111177355 B CN 111177355B
- Authority
- CN
- China
- Prior art keywords
- query
- statement
- sentences
- preset
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000003993 interaction Effects 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 40
- 230000015654 memory Effects 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000002787 reinforcement Effects 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90324—Query formulation using system suggestions
- G06F16/90328—Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Abstract
本申请公开了一种基于搜索数据的人机对话交互方法、装置和电子设备,涉及人工智能技术领域,其中,方法包括:获取用户输入的对话语句;获取与对话语句匹配的查询语句,并基于预设查询词图获取与查询语句对应的多个关联查询语句;通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句;根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。由此,解决人机对话中的回复内容不够丰富,对话效果不够好的技术问题,通过查询词图中查询语句的关联性提供高质量的回复内容候选列表,从而提供更丰富并且反映用户兴趣的内容。
Description
技术领域
本申请涉及计算机技术中的人工智能技术领域,尤其涉及一种基于搜索数据的人机对话交互方法、装置和电子设备。
背景技术
随着人工智能技术的不断发展,通过与智能设备进行对话来满足用户需求是用户生活中越来越常见的一种交互方式。
相关技术中,人机对话中的回复内容不够丰富,对话效果比较差。
发明内容
本申请的第一个目的在于提出一种基于搜索数据的人机对话交互方法。
本申请的第二个目的在于提出一种基于搜索数据的人机对话交互装置。
本申请的第三个目的在于提出一种电子设备。
本申请的第四个目的在于提出一种存储有计算机指令的非瞬时计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种基于搜索数据的人机对话交互方法,包括以下步骤:
获取用户输入的对话语句;
获取与所述对话语句匹配的查询语句,并基于预设查询词图获取与所述查询语句对应的多个关联查询语句;
通过预设算法对所述对话语句和所述多个关联查询语句进行处理,从所述多个关联查询语句中确定目标查询语句;
根据预设生成回复模型对所述目标查询语句进行处理,生成回复语句提供给所述用户。
为达上述目的,本申请第二方面实施例提出了一种基于搜索数据的人机对话交互装置,包括:
第一获取模块,用于获取用户输入的对话语句;
第一获取模块,用于获取用户输入的对话语句;
第二获取模块,用于获取与所述对话语句匹配的查询语句;
第三获取模块,用于基于预设查询词图获取与所述查询语句对应的多个关联查询语句;
处理模块,用于通过预设算法对所述对话语句和所述多个关联查询语句进行处理,从所述多个关联查询语句中确定目标查询语句;
生成模块,用于根据预设生成回复模型对所述目标查询语句进行处理,生成回复语句提供给所述用户。
为达上述目的,本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例描述的基于搜索数据的人机对话交互方法。
为达上述目的,本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述实施例描述的基于搜索数据的人机对话交互方法。
上述申请中的一个实施例具有如下优点或有益效果:
获取用户输入的对话语句;获取与对话语句匹配的查询语句,并基于预设查询词图获取与查询语句对应的多个关联查询语句;通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句;根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。由此,解决人机对话中的回复内容不够丰富,对话效果不够好的技术问题,通过查询词图中查询语句的关联性提供高质量的回复内容候选列表,从而提供更丰富并且反映用户兴趣的内容。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的基于搜索数据的人机对话交互方法的流程图;
图2是根据本申请第一实施例的查询词图的示例图;
图3是根据本申请第二实施例的基于搜索数据的人机对话交互方法的流程图;
图4是根据本申请第三实施例的基于搜索数据的人机对话交互装置的结构示意图;
图5是根据本申请第四实施例的基于搜索数据的人机对话交互装置的结构示意图;
图6是根据本申请第五实施例的基于搜索数据的人机对话交互装置的结构示意图;
图7是用来实现本申请实施例的基于搜索数据的人机对话交互方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的基于搜索数据的人机对话交互方法、装置和电子设备。
为了解决现有技术中人机对话中的回复内容不够丰富,对话效果不够好的技术问题,本方案通过获取用户输入的对话语句;获取与对话语句匹配的查询语句,并基于预设查询词图获取与查询语句对应的多个关联查询语句;通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句;根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户,实现通过查询词图中查询语句的关联性提供高质量的回复内容候选列表,从而提供更丰富并且反映用户兴趣的内容。
具体而言,图1是根据本申请第一实施例的基于搜索数据的人机对话交互方法的流程图。
如图1所示,该方法包括:
步骤101,获取用户输入的对话语句。
步骤102,获取与对话语句匹配的查询语句,并基于预设查询词图获取与查询语句对应的多个关联查询语句。
在实际应用中,用户可以通过文字或者语音等方式与智能设备进行对话交互,从而智能设备可以获取用户输入的对话语句(即对话闲聊语句),比如“听说最近波音飞机出事了”“华为P30手机不错”,“我平时很喜欢练瑜伽”等等,其中,对话语句可以根据用户需求、表达习惯等用户个性化特征进行输入。
进一步地,可以在数据库中查询与对话语句匹配的查询语句、或者是在服务器中进行查找与对话语句匹配的查询语句等等,需要说明的是,这个查询语句能够在预设查询词图中找到对应的语句节点,以及对话语句与查询语句相同时表示对话语句也可以在预设查询词图中找到对应的语句节点。
从而,可以基于预设查询词图获取与查询语句对应的多个关联查询语句,可以理解的是,查询语句和关联查询语句之间的关系是基于互联网用户搜索行为日志建立的,因此它们极有可能是围绕一个搜索意图或语义主题的,然后基于查询语句1对应多个关联查询语句A、B和C之间的相关性可以构建预设查询词图,可以直接从多个搜索查询日志中提取相关数据进行分析构建预设查询词图。
举例而言,如图2所示,对话语句“听说最近波音飞机出事了”,匹配的查询语句为“波音副总裁道歉”,查询语句在预设查询词图中找到对应的语句节点“波音副总裁道歉”,以及通过语句节点“波音副总裁道歉”可以基于预设查询词图获取与查询语句对应的多个关联查询语句,比如为“波音飞机坠机”、“波音CEO道歉”和“印度尼西亚波音737坠机”等。
步骤103,通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句。
步骤104,根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。
具体地,在获取多个关联查询语句后可以从多个关联查询语句确定目标查询语句,并根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。
更具体地,通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句的方式有很多种,比如通过分类模型、强化学习等方式进行处理获取目标查询语句。
作为一种示例,获取对话语句对应的上下文语句,并对上下文语句进行编码处理得到上下文语句向量,从预设数据库中获取与多个关联查询语句对应的多个关联查询向量,通过基于强化学习的相似度计算模型对上下文语句向量和多个关联查询向量进行计算对话语句和多个关联查询语句的关联分数值,根据关联分数值从多个关联查询语句中确定目标查询语句。
作为另一种示例,获取对话语句对应的搜索向量,从预设数据库中获取与多个关联查询语句对应的多个关联查询向量,通过分类模型对搜索向量分别与各个关联查询向量依次进行处理,得到对话语句与每一个关联查询语句对应的多个分类类别,从多个分类类别确定目标类别,根据目标类别确定目标查询语句。
需要说明的是,预先通过预设神经网络比如图神经网络,卷积神经网络等等对预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库。
继续以图2为例,在确定多个关联查询语句,比如为“波音飞机坠机”、“波音CEO道歉”和“印度尼西亚波音737坠机”后,获取“印度尼西亚波音737坠机”作为目标查询语句,并且为了保证对话的流畅性,获取的目标查询语句不可以直接作为回复语句提供给用户,需要通过预设的生成回复模型进行相关表达方式的处理生成回复语句提供给用户“波音CEO道歉,因为印度尼西亚波音737坠机事件”。
综上,本申请实施例的基于搜索数据的人机对话交互方法,获取用户输入的对话语句;获取与对话语句匹配的查询语句,并基于预设查询词图获取与查询语句对应的多个关联查询语句;通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句;根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。由此,解决人机对话中的回复内容不够丰富,对话效果不够好的技术问题,通过查询词图中查询语句的关联性提供高质量的回复内容候选列表,从而提供更丰富并且反映用户兴趣的内容。
为了实现上述实施例,图3是根据本申请第二实施例的基于搜索数据的人机对话交互方法的流程图。
步骤201,获取多个搜索查询日志,基于多个搜索查询日志获取多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本。
步骤202,根据多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建预设查询词图。
步骤203,通过预设神经网络对预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库。
具体地,本申请可以基于搜索数据预先建立查询词图,可以基于用户标识、查询时间内的搜索查询语句实时构建,也可以直接从搜索查询日志中提取相关数据进行分析。
具体地,获取多个搜索查询日志,基于多个搜索查询日志获取多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本,根据多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建预设查询词图。
举例而言,获取查询语句样本为“波音副总裁道歉”对应的多个关联查询语句样本为“波音CEO道歉”、“波音飞机坠机”、“波音董事长”和“印度尼西亚波音737坠机”等,基于查询语句样本为“波音副总裁道歉”对应的多个关联查询语句样本为“波音CEO道歉”、“波音飞机坠机”、“波音董事长”和“印度尼西亚波音737坠机”等构建预设查询词图。
可以理解的是,上述仅仅是一个示例,查询词图是基于多个查询语句样本,以及查询语句样本分别对应的多个关联查询语句样本的关联性进行构建的,因此,查询词图是基于搜索数据进行建立的,图中的各个查询语句的关联性的查询是可以获取非常准确的答案的,因此可以提高对话效果。
为了处理效率,可以预先通过预设神经网络比如图神经网络、卷积神经网络等对预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库。
步骤204,获取用户输入的对话语句,对对话语句进行切词处理得到多个搜索词语,计算多个搜索词语分别与预设查询词图中各个查询语句之间的相似度。
步骤205,对多个相似度进行加权处理得到对话语句与各个查询语句之间相似分数值,根据相似分数值从各个查询语句中确定与对话语句匹配的查询语句。
具体地,用户可以通过文字或者语音等方式与智能设备进行对话交互,从而智能设备可以获取用户输入的对话语句,比如“听说最近波音飞机出事了”“华为P30手机不错”,“我平时很喜欢练瑜伽”等等,其中,对话语句可以根据用户需求、表达习惯等用户个性化特征进行输入。
进一步地,对对话语句进行切词处理得到多个搜索词语,计算多个搜索词语分别与预设查询词图中各个查询语句之间的相似度,以及对多个相似度进行加权处理得到对话语句与各个查询语句之间相似分数值,根据相似分数值从各个查询语句中确定与对话语句匹配的查询语句,也就是说,相似分数值越高表示该查询语句与对话语句匹配程度越高,即将对话语句映射到查询词图中的语句节点越准确。
步骤206,获取对话语句对应的上下文语句,并对上下文语句进行编码处理得到上下文语句向量,从预设数据库中获取与多个关联查询语句对应的多个关联查询向量。
步骤207,通过基于强化学习的相似度计算模型对上下文语句向量和多个关联查询向量进行计算对话语句和多个关联查询语句的关联分数值,根据关联分数值从多个关联查询语句中确定目标查询语句。
可以理解的是,对话语句可能不是第一次输入的语句,因此为了提高回复的准确性,可以获取对话语句对应的上下文语句,并对上下文语句进行编码处理得到上下文语句向量,以及从预设数据库中获取与多个关联查询语句对应的多个关联查询向量,最后通过强化学习算法对上下文语句向量和多个关联查询向量进行计算对话语句和多个关联查询语句的关联分数值,根据关联分数值从多个关联查询语句中确定目标查询语句。
可以理解的是,关联分数值越高,表示对话语句和关联查询语句的关联性越强,从而可以将关联分数值最高对应的关联查询语句作为目标查询语句。
举例而言,比如对话语句为“他为啥道歉”,这时候需要获取对话语句对应的上下文语句来进行处理,获取到的目标查询语句为“印度尼西亚波音737坠机”以满足用户需求,提高对话效果。
步骤208,根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。
为了保证对话的流畅性,获取的目标查询语句不可以直接作为回复语句提供给用户,需要通过预设的生成回复模型进行相关表达方式的处理生成回复语句提供给用户“因为印度尼西亚波音737坠机事件”。
综上,本申请实施例的基于搜索数据的人机对话交互方法,获取多个搜索查询日志,基于多个搜索查询日志获取多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本,根据多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建预设查询词图,通过预设神经网络对预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库,获取用户输入的对话语句,获取与对话语句匹配的查询语句,对对话语句进行切词处理得到多个搜索词语,计算多个搜索词语分别与预设查询词图中各个查询语句之间的相似度,对多个相似度进行加权处理得到对话语句与各个查询语句之间相似分数值,根据相似分数值从各个查询语句中确定与对话语句匹配的查询语句,获取对话语句对应的上下文语句,并对上下文语句进行编码处理得到上下文语句向量,从预设数据库中获取与多个关联查询语句对应的多个关联查询向量,通过强化学习算法对上下文语句向量和多个关联查询向量进行计算对话语句和多个关联查询语句的关联分数值,根据关联分数值从多个关联查询语句中确定目标查询语句,根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。由此,解决人机对话中的回复内容不够丰富,对话效果不够好的技术问题,通过查询词图中查询语句的关联性提供高质量的回复内容候选列表,从而提供更丰富并且反映用户兴趣的内容。
为了实现上述实施例,本申请还提出了一种基于搜索数据的人机对话交互装置,图4是根据本申请第四实施例的基于搜索数据的人机对话交互装置的结构示意图,如图4所示,该基于搜索数据的人机对话交互装置包括:第一获取模块401、第二获取模块402、第三获取模块403、处理模块404和生成模块405,其中,
第一获取模块401,用于获取用户输入的对话语句。
第二获取模块402,用于获取与所述对话语句匹配的查询语句。
第三获取模块403,用于基于预设查询词图获取与所述查询语句对应的多个关联查询语句。
处理模块404,用于通过预设算法对所述对话语句和所述多个关联查询语句进行处理,从所述多个关联查询语句中确定目标查询语句。
生成模块405,用于根据预设生成回复模型对所述目标查询语句进行处理,生成回复语句提供给所述用户。
在本申请的一个实施例中,如图5所示,在图4的基础上,还包括:第四获取模块406、第五获取模块407和构建模块408。
第四获取模块406,用于获取多个搜索查询日志。
第五获取模块407,用于基于所述多个搜索查询日志获取多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本。
构建模块408,用于根据所述多个查询语句样本,以及所述与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建所述预设查询词图。
在本申请的一个实施例中,第二获取模块402,具体用于:对所述对话语句进行切词处理得到多个搜索词语;计算所述多个搜索词语分别与所述预设查询词图中各个查询语句之间的相似度;对多个相似度进行加权处理得到所述对话语句与所述各个查询语句之间相似分数值;根据所述相似分数值从所述各个查询语句中确定与所述对话语句匹配的查询语句。
在本申请的一个实施例中,如图6所示,在图5的基础上,还包括:存储模块409。
存储模块409,用于通过预设神经网络对所述预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库。
在本申请的一个实施例中,处理模块404,具体用于:获取所述对话语句对应的上下文语句,并对所述上下文语句进行编码处理得到上下文语句向量;从预设数据库中获取与所述多个关联查询语句对应的多个关联查询向量;通过强化学习算法对所述上下文语句向量和所述多个关联查询向量进行计算所述对话语句和所述多个关联查询语句的关联分数值;根据所述关联分数值从所述多个关联查询语句中确定目标查询语句。
需要说明的是,前述对基于搜索数据的人机对话交互方法的解释说明,也适用于本发明实施例的基于搜索数据的人机对话交互装置,其实现原理类似,在此不再赘述。
综上,本申请实施例的基于搜索数据的人机对话交互装置,获取用户输入的对话语句;获取与对话语句匹配的查询语句,并基于预设查询词图获取与查询语句对应的多个关联查询语句;通过预设算法对对话语句和多个关联查询语句进行处理,从多个关联查询语句中确定目标查询语句;根据预设生成回复模型对目标查询语句进行处理,生成回复语句提供给用户。由此,解决人机对话中的回复内容不够丰富,对话效果不够好的技术问题,通过查询词图中查询语句的关联性提供高质量的回复内容候选列表,从而提供更丰富并且反映用户兴趣的内容。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的基于搜索数据的人机对话交互的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的基于搜索数据的人机对话交互方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的停车位数据的有效性识别的方法对应的程序指令/模块(例如,附图4所示的第一获取模块401、第二获取模块402、第三获取模块403、处理模块404和生成模块405)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的基于搜索数据的人机对话交互方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
执行停车位数据的有效性识别的方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (10)
1.一种基于搜索数据的人机对话方法,其特征在于,包括以下步骤:
获取用户输入的对话语句;
获取与所述对话语句匹配的查询语句,并基于预设查询词图获取与所述查询语句对应的多个关联查询语句;
通过预设算法对所述对话语句和所述多个关联查询语句进行处理,从所述多个关联查询语句中确定目标查询语句;
根据预设生成回复模型对所述目标查询语句进行处理,生成回复语句提供给所述用户;
其中,在所述获取与所述对话语句匹配的查询语句之前,还包括:
获取多个搜索查询日志;
基于所述多个搜索查询日志获取多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本;
根据所述多个查询语句样本,以及所述与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建所述预设查询词图。
2.如权利要求1所述的方法,其特征在于,所述获取与所述对话语句匹配的查询语句,包括:
对所述对话语句进行切词处理得到多个搜索词语;
计算所述多个搜索词语分别与所述预设查询词图中各个查询语句之间的相似度;
对多个相似度进行加权处理得到所述对话语句与所述各个查询语句之间相似分数值;
根据所述相似分数值从所述各个查询语句中确定与所述对话语句匹配的查询语句。
3.如权利要求1所述的方法,其特征在于,在所述根据所述多个查询语句样本,以及所述与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建所述预设查询词图之后,还包括:
通过预设神经网络对所述预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库。
4.如权利要求3所述的方法,其特征在于,所述通过预设算法对所述对话语句和所述多个关联查询语句进行处理,从所述多个关联查询语句中确定目标查询语句,包括:
获取所述对话语句对应的上下文语句,并对所述上下文语句进行编码处理得到上下文语句向量;
从所述预设数据库中获取与所述多个关联查询语句对应的多个关联查询向量;
通过基于强化学习的相似度计算模型对所述上下文语句向量和所述多个关联查询向量进行计算所述对话语句和所述多个关联查询语句的关联分数值;
根据所述关联分数值从所述多个关联查询语句中确定目标查询语句。
5.一种基于搜索数据的人机对话交互装置,其特征在于,包括:
第一获取模块,用于获取用户输入的对话语句;
第二获取模块,用于获取与所述对话语句匹配的查询语句;
第三获取模块,用于基于预设查询词图获取与所述查询语句对应的多个关联查询语句;
处理模块,用于通过预设算法对所述对话语句和所述多个关联查询语句进行处理,从所述多个关联查询语句中确定目标查询语句;
生成模块,用于根据预设生成回复模型对所述目标查询语句进行处理,生成回复语句提供给所述用户;
其中,所述的装置,还包括:
第四获取模块,用于获取多个搜索查询日志;
第五获取模块,用于基于所述多个搜索查询日志获取多个查询语句样本,以及与每个查询语句样本分别对应的多个关联查询语句样本;
构建模块,用于根据所述多个查询语句样本,以及所述与每个查询语句样本分别对应的多个关联查询语句样本的关联性构建所述预设查询词图。
6.如权利要求5所述的装置,其特征在于,所述第二获取模块,具体用于:
对所述对话语句进行切词处理得到多个搜索词语;
计算所述多个搜索词语分别与所述预设查询词图中各个查询语句之间的相似度;
对多个相似度进行加权处理得到所述对话语句与所述各个查询语句之间相似分数值;
根据所述相似分数值从所述各个查询语句中确定与所述对话语句匹配的查询语句。
7.如权利要求5所述的装置,其特征在于,还包括:
存储模块,用于通过预设神经网络对所述预设查询词图中的各个查询语句进行处理,生成各个查询语句向量存储在预设数据库。
8.如权利要求7所述的装置,其特征在于,所述处理模块,具体用于:
获取所述对话语句对应的上下文语句,并对所述上下文语句进行编码处理得到上下文语句向量;
从预设数据库中获取与所述多个关联查询语句对应的多个关联查询向量;
通过基于强化学习的相似度计算模型对所述上下文语句向量和所述多个关联查询向量进行计算所述对话语句和所述多个关联查询语句的关联分数值;
根据所述关联分数值从所述多个关联查询语句中确定目标查询语句。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911403103.1A CN111177355B (zh) | 2019-12-30 | 2019-12-30 | 基于搜索数据的人机对话交互方法、装置和电子设备 |
US16/986,631 US20210200813A1 (en) | 2019-12-30 | 2020-08-06 | Human-machine interaction method, electronic device, and storage medium |
JP2020150476A JP7395445B2 (ja) | 2019-12-30 | 2020-09-08 | 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911403103.1A CN111177355B (zh) | 2019-12-30 | 2019-12-30 | 基于搜索数据的人机对话交互方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111177355A CN111177355A (zh) | 2020-05-19 |
CN111177355B true CN111177355B (zh) | 2021-05-28 |
Family
ID=70654188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911403103.1A Active CN111177355B (zh) | 2019-12-30 | 2019-12-30 | 基于搜索数据的人机对话交互方法、装置和电子设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210200813A1 (zh) |
JP (1) | JP7395445B2 (zh) |
CN (1) | CN111177355B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737411A (zh) * | 2020-05-20 | 2020-10-02 | 华为技术有限公司 | 人机对话中的响应方法、对话系统及存储介质 |
CN111708876B (zh) * | 2020-06-16 | 2023-07-18 | 北京百度网讯科技有限公司 | 生成信息的方法和装置 |
CN111966782B (zh) * | 2020-06-29 | 2023-12-12 | 百度在线网络技术(北京)有限公司 | 多轮对话的检索方法、装置、存储介质及电子设备 |
CN111767379B (zh) * | 2020-06-29 | 2023-06-27 | 北京百度网讯科技有限公司 | 图像问答方法、装置、设备以及存储介质 |
CN111914565A (zh) * | 2020-07-15 | 2020-11-10 | 海信视像科技股份有限公司 | 电子设备及用户语句的处理方法 |
CN112989011B (zh) * | 2021-04-26 | 2021-08-24 | 广州思迈特软件有限公司 | 数据查询方法、数据查询装置和电子设备 |
CN113553414B (zh) * | 2021-06-30 | 2023-08-25 | 北京百度网讯科技有限公司 | 智能对话方法、装置、电子设备和存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661484A (zh) * | 2008-08-29 | 2010-03-03 | 株式会社理光 | 一种查询方法及系统 |
JP5314504B2 (ja) | 2009-06-01 | 2013-10-16 | 日本電信電話株式会社 | 検索装置、検索プログラムおよび検索方法 |
CN105528349B (zh) * | 2014-09-29 | 2019-02-01 | 华为技术有限公司 | 知识库中问句解析的方法及设备 |
US9703860B2 (en) * | 2014-10-06 | 2017-07-11 | International Business Machines Corporation | Returning related previously answered questions based on question affinity |
WO2018227462A1 (en) * | 2017-06-15 | 2018-12-20 | Microsoft Technology Licensing, Llc | Method and apparatus for intelligent automated chatting |
US10268779B2 (en) * | 2017-08-09 | 2019-04-23 | International Business Machines Corporation | Sharing server conversational context between multiple cognitive engines |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
US10803059B2 (en) * | 2018-01-30 | 2020-10-13 | Verizon Patent And Licensing Inc. | Searching using query graphs |
CN109284357B (zh) * | 2018-08-29 | 2022-07-19 | 腾讯科技(深圳)有限公司 | 人机对话方法、装置、电子设备及计算机可读介质 |
CN109543195B (zh) * | 2018-11-19 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种文本翻译的方法、信息处理的方法以及装置 |
CN110019844A (zh) * | 2019-02-20 | 2019-07-16 | 众安信息技术服务有限公司 | 一种保险行业知识图谱问答系统构建方法及装置 |
KR20200135607A (ko) * | 2019-05-22 | 2020-12-03 | 삼성전자주식회사 | 학습 네트워크 모델 기반의 언어 처리 방법 및 장치 |
EP3819809A1 (en) * | 2019-11-08 | 2021-05-12 | PolyAI Limited | A dialogue system, a method of obtaining a response from a dialogue system, and a method of training a dialogue system |
KR20210061141A (ko) * | 2019-11-19 | 2021-05-27 | 삼성전자주식회사 | 자연어 처리 방법 및 장치 |
-
2019
- 2019-12-30 CN CN201911403103.1A patent/CN111177355B/zh active Active
-
2020
- 2020-08-06 US US16/986,631 patent/US20210200813A1/en not_active Abandoned
- 2020-09-08 JP JP2020150476A patent/JP7395445B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN111177355A (zh) | 2020-05-19 |
US20210200813A1 (en) | 2021-07-01 |
JP2021111334A (ja) | 2021-08-02 |
JP7395445B2 (ja) | 2023-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177355B (zh) | 基于搜索数据的人机对话交互方法、装置和电子设备 | |
KR102532396B1 (ko) | 데이터 세트 처리 방법, 장치, 전자 기기 및 저장 매체 | |
KR102565673B1 (ko) | 시멘틱 표현 모델의 생성 방법, 장치, 전자 기기 및 저장 매체 | |
CN111241245B (zh) | 人机交互处理方法、装置及电子设备 | |
CN111241819B (zh) | 词向量生成方法、装置及电子设备 | |
CN113553414B (zh) | 智能对话方法、装置、电子设备和存储介质 | |
CN111324727A (zh) | 用户意图识别方法、装置、设备和可读存储介质 | |
CN111259671A (zh) | 文本实体的语义描述处理方法、装置及设备 | |
CN111079945B (zh) | 端到端模型的训练方法及装置 | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN111783468A (zh) | 文本处理方法、装置、设备和介质 | |
KR102630243B1 (ko) | 구두점 예측 방법 및 장치 | |
US20210209312A1 (en) | Dialogue interaction method and apparatus, device, and storage medium | |
CN112163405A (zh) | 问题的生成方法和装置 | |
CN114416943A (zh) | 对话模型的训练方法、装置、电子设备及存储介质 | |
CN111984774A (zh) | 搜索方法、装置、设备以及存储介质 | |
CN114444462B (zh) | 模型训练方法及人机交互方法、装置 | |
CN111797216A (zh) | 检索项改写方法、装置、设备以及存储介质 | |
CN111738015A (zh) | 文章情感极性分析方法、装置、电子设备及存储介质 | |
CN111708800A (zh) | 查询方法、装置及电子设备 | |
CN111966781A (zh) | 数据查询的交互方法及装置、电子设备和存储介质 | |
US20220005461A1 (en) | Method for recognizing a slot, and electronic device | |
CN112559715B (zh) | 态度的识别方法、装置、设备及存储介质 | |
CN112232089B (zh) | 语义表示模型的预训练方法、设备和存储介质 | |
CN112270169B (zh) | 对白角色预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |