CN111831801B - 一种人机对话方法及系统 - Google Patents
一种人机对话方法及系统 Download PDFInfo
- Publication number
- CN111831801B CN111831801B CN202010464036.0A CN202010464036A CN111831801B CN 111831801 B CN111831801 B CN 111831801B CN 202010464036 A CN202010464036 A CN 202010464036A CN 111831801 B CN111831801 B CN 111831801B
- Authority
- CN
- China
- Prior art keywords
- word
- word set
- grammatical
- user
- context
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供的人机对话方法及系统,包括:根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;接收用户的当前咨询内容,确定当前咨询内容包含的语句词关系;若语句词关系符合预设条件,则利用当前咨询内容更新背景记忆信息;根据更新后的第一语法词集合从知识库中进行问题匹配,将所对应的答案反馈给用户。本发明实施例通过将用户的当前咨询内容与初始咨询内容进行判别,提出了一种人机对话过程中背景信息记忆和传递方法,克服了主要要素缺乏导致无法回答或不能准确回答问题的缺陷,有效满足人机对话过程中实时交互问答要求,为农业技术咨询人机交互用户体验和精准性的提升提供有效解决方案。
Description
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种人机对话方法及系统。
背景技术
随着人工智能技术的发展,农业技术服务软硬件机器人在自动化、全天候提供远程技术咨询服务方面优势凸显,越来越成为一种主流的农业技术服务方式。
当前,相关人机智能对话系统及终端产品在应用过程中,在应对叙述全面的咨询问题时表现尚可。但由于农户潜意识将机器人服务认为是类人智能服务,因此在对话过程中,存在大量的省略指代、隐含语义等交谈方式。据统计,在实际应用过程中,约有45%的咨询问题需要结合对话上文背景信息进行理解。而当前系统产品难以满足真实对话场景中对于对话历史语境信息的要求。如果不结合对话过程中的背景信息来理解当前咨询问题,系统仅凭当前用户咨询信息,将无法全面掌握咨询问题要素和真实意图,导致系统回复不准确、答非所问。这也是当前系统难以保证对话的可持续性,以及用户体验感不高的重要原因。
发明内容
本发明实施例提供一种人机对话方法及系统,针对当前人机对话过程中,缺乏对上文背景信息记忆,从而导致对当前咨询问题理解不充分、对话回答不准确的问题提供解决方法。
第一方面,本发明实施例提供一种人机对话方法,主要包括:根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;该第一语法词集合包括主语词集、谓语词集和宾语词集;接收用户的当前咨询内容,确定当前咨询内容包含的语句词关系;若语句词关系符合预设条件,则利用当前咨询内容更新背景记忆信息;根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
作为可选地,若语句词关系不符合预设条件,则获取当前咨询内容的第二语法词集合;获取第一语法词集合和第二语法词集合的语境符合度;若语境符合度大于符合度阈值,则将第一语法词集合嵌入至第二语法词集合,构成第三语法词集合;根据第三语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
作为可选地,若语境符合度小于符合度阈值,则通过系统引导的方式,获取回答咨询问题的关键要素,并结合第二语法词集合构成第四语法词集合;根据第四语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
作为可选地,上述获取第一语法词集合和第二语法词集合的语境符合度,主要包括:构建咨询语境词库;基于咨询语境词库,分别获取第一语法词集合和第二语法词集合的词语编码,分别记为第一词语编码和第二词语编码;利用语境符合度计算公式计算第一语法词集合和第二语法词集合的语境符合度;
上述语境符合度计算公式为:
F(C,D)=as*max[f(SC,SD)]+av*max[f(VC,VD)]+ao*max[f(OC,OD)]
其中,C为第一语法词集合;D为第二语法词集合;S、V、O分别表示主语词集、谓语词集和宾语词集;a为不同句子成分的权重,as、av和ao分别为句子成分中的主语成分权重、谓语成分权重和宾语成分权重,且as>av>ao;sC、VC、OC分别为第一语法词集合中的主语词集、谓语词集和宾语词集;sD、VD、OD分别为第二语法词集合中的主语词集、谓语词集和宾语词集;f(X,Y)为词语X、Y的语境相似度;X、Y为S、V、O中的词;i为两个词语编码X和Y从左至右不相同码段的位置;k表示词语编码码段的数量。
作为可选地,上述构建咨询语境词库,主要包括:
在咨询问答语料的基础上,通过语法词提取获取咨询词集;将咨询词集按照咨询问题的范围和类型进行分类,对每一分类进行编码。
作为可选地,上述将咨询词集按照咨询问题的范围和类型进行分类,并对每一分类进行编码,主要包括:
将所述咨询词集中的所有词按照咨询问题的范围和类型,进行至少两级分类。
作为可选地,在上述将咨询词集按照咨询问题的范围大小进行分类,对每一分类进行编码之后,还包括:在获取的编码上设置附加码。
作为可选地,上述预设条件可以为:所述语句词关系中包含有主谓关系词和/或动宾关系词。
第二方面,本发明实施例提供一种人机对话系统,主要包括咨询主题创建模块、语句词关系生成模块、语句词关系判别模块和答案反馈模块,其中:
咨询主题创建模块主要用于根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;上述第一语法词集合包括主语词集、谓语词集和宾语词集;语句词关系生成模块主要用于接收用户的当前咨询内容,确定当前咨询内容包含的语句词关系;语句词关系判别模块主要用于对语句词关系进行判别;若语句词关系符合预设条件,则利用当前咨询内容更新背景记忆信息;答案反馈模块主要用于根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
作为可选地,本发明实施例提供的人机对话系统,还包括语境符合度运算模块和词集合嵌入模块,其中:
若语句词关系判别模块获取语句词关系不符合预设条件,咨询主题创建模块则获取当前咨询内容的第二语法词集合;语境符合度运算模块主要用于获取第一语法词集合和第二语法词集合的语境符合度;若语境符合度大于符合度阈值,词集合嵌入模块则将第一语法词集合嵌入至第二语法词集合,构成第三语法词集合;答案反馈模块还可以用于根据第三语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现如第一方面任一所述的人机对话方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面任一所述的人机对话方法的步骤。
本发明实施例提供的人机对话方法及系统,通过将用户的当前咨询内容与背景记忆信息进行判别,提出了一种轻量级人机对话过程中背景信息记忆和传递方法,克服了主要要素缺乏导致无法回答或不能准确回答问题的缺陷,能有效满足人机对话过程中实时交互问答要求,为农业技术咨询人机交互系统装备的精准性、实用性的提升提供有效解决方案。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种人机对话方法流程示意图;
图2为本发明实施例提供的一种人机对话系统的结构示意图;
图3为本发明实施例提供的另一种人机对话方法流程示意图;
图4为本发明实施例提供的一种电子设备的实体结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为克服或部分解决现有技术中存在的人机对话过程中,缺乏对上文背景信息记忆,从而导致对当前咨询问题理解不充分,对话回答不准确的问题,如图1所示,本发明实施例提供一种人机对话方法,包括但不限于以下步骤:
S1,根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;第一语法词集合包括主语词集、谓语词集和宾语词集;
S2,接收用户的当前咨询内容,确定当前咨询内容包含的语句词关系;
S3,若语句词关系符合预设条件,则利用当前咨询内容更新背景记忆信息;
S4,根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
由于在人机对话过程中,特别是在农业技术服务人机会话过程中,用户的首次提问,一般包含有较为全面的咨询对象、咨询内容等信息,在本发明实施例中,可以将背景记忆信息设置为人机会话过程中用户的第一次咨询语句。作为可选地,也可以将背景记忆信息设置为当前对话内容之前的任一次对话内容,对此本实施例不作具体的限定。
进一步地,从用户的初始咨询内容中抽取出用户所要咨询的农业技术咨询问题中所包含的咨询对象、对象动作、对象内容等词句,即获取组成农业技术咨询问题中各词语的主谓关系(简称SBV)、动宾关系(简称VOB)、定中关系(简称ATT)、核心关系(简称HED)等。进一步地,可以根据词关系获得背景记忆信息的第一语法词集合C,可以表示如下:
C(S,V,O)=[SC(s1,s2,...)、VC(v1,v2,...)、OC(o1,o2,...)]
其中,Sc为主语词集,含有主语及主语修饰语;Vc为谓语词集;Oc为宾语词集,含宾语及宾语修饰语。
在本发明实施例中可以采用针对中文的依存句法分析法和/或语义角色分析法,从用户的初始咨询内容中抽取出词。其中,依存句法分析方法(dependency syntacticparsing,简称DSP)可以采用以下四种模型中的任一种来实现,包括:生成式句法分析模型、判别式句法分析模型、决策式句法分析模型以及约束满足句法分析模型。语义角色分析法,又称语义角色标注法(semantic role labeling,简称SRL),本发明实施例可以根据实际需要选择基于短语结构树的语义角色标注方法、基于浅层句法分析结果的语义角色标注方法和基于依存句法分析结果的语义角色标注方法等三种中的任一种来实现词的抽取。
进一步地,在通过人机对话终端接收到用户的咨询请求后,首先提取出用户的第一语法词集合。根据对话的开展,可以在每一次获取到用户的当前咨询内容后,通过设置一个多个判断条件来判断用户的当前咨询内容是否围绕背景记忆信息进行的。若判断出用户的当前咨询内容满足判断条件,即当前咨询内容是围绕背景记忆信息进行的,则利用当前咨询内容更新背景记忆信息,并根据该当前咨询内容所对应的语法词集合进行问题匹配,并最终将匹配的问题所对应的答案反馈给用户。
作为可选的,上述预设条件可以是通过上述实施例的方法,如采用依存句法分析法和/或语义角色分析法,对当前咨询内容进行关键词的提取,获取到与当前咨询内容所对应的语法词集合D。
进一步地,可以确定出语法词集合D中相关语句词关系,所述语句词关系可以是语法上的或者词义上的关联关系。在获取到当前咨询内容包含的语句词关系后。判断所获取的语句词关系是否符合预设条件。若符合,则利用当前咨询内容更新背景记忆信息,即在下一次用户的咨询请求分析时,以本次的当前对话内容作为其背景记忆信息,并以当前咨询内容所对应的语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
需要说明的是,第一语法词集合来自于用户的初次咨询,并作为对话过程中的背景记忆信息向下传递,在每次用户提出新的问题时,均以之前提问时确定的背景记忆信息进行语境符合度评估。在进行问题匹配时,需要根据当前用户咨询的主谓宾缺失情况,确定当前用户咨询语句如何处理后,再进行知识库问题匹配和答案反馈。
本发明实施例提供的人机对话方法,通过将用户的当前咨询内容与背景记忆信息进行判别,提出了一种轻量级人机对话过程中背景信息记忆和传递方法,克服了语句中的问题要素缺乏导致无法回答或不能准确回答问题的缺陷,有效的满足了人机对话过程中实时交互问答要求,为农业技术咨询人机交互用户体验和精准性的提升提供有效解决方案。
基于上述实施例的内容,作为一种可选实施例,若语句词关系不符合预设条件,则获取当前咨询内容的第二语法词集合;获取第一语法词集合和第二语法词集合的语境符合度;若语境符合度大于符合度阈值,则将第一语法词集合嵌入至第二语法词集合,构成第三语法词集合;根据第三语法词集合从所述知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
具体地,若确定语句词关系不符合预设条件,即在获取到当前咨询内容包含的语句词关系后,确认其主谓关系、动宾关系缺乏后,需要进一步地判断出当前咨询内容的当前对话主题是否围绕背景记忆信息进行的。
在本发明实施例中,通过获取当前咨询内容所对应的第二语法词集合D,
D(S,V,O,...)=[Sd(s1,s2...)、Vd(v1,v2...)、Od(o1,o2...),...]。
进一步地,计算出第一语法词集合C与第二语法词集合D的语境符合度。当语境符合度大于预设阈值时,则说明当前咨询内容是围绕着背景记忆信息进行的,则将第一语法词集合C嵌入至第二语法词集合D,以构成第三语法词集合Dn,
Dn(S,V,O,...)=C(S,V,O)+D(S,V,O,...)=(SC+SD,VC+VD,OC+OD,...)
其中,当S、V、O缺失时,其对应的词集赋值为0。例如,若第二语法词集合中,不存在宾语词集(即O缺失)时,则OD=0。当D中S存在时,Dn(S)=D(S)。在获取到第三语法词集合Dn后,则根据Dn从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
本发明实施例提供的人机对话方法,通过设定语境符合度阈值,在当前咨询内容中出现隐含、省略等语句时,通过将其对应的第二语法词集合与初始咨询内容所对应的第一语法词集合进行语境符合度计算,以确定当前咨询内容是否围绕背景记忆信息进行。若是,则将当前咨询内容嵌入至第一语法词集合,以更准确的获取用户当前真实的咨询问题,从而实现对该问题的解答。
基于上述实施例的内容,作为一种可选实施例,若语境符合度小于符合度阈值,则向用户进行咨询问题引导。
具体地,若语境符合度小于预设阈值时,则说明当前咨询内容不是围绕着背景记忆信息进行的,此时系统可以通过人机对话方式主动引导用户进行咨询问题表述。例如,向用户发送选择性或提示性的问题,以引导用户更准确的表达其咨询的主要内容以及真实想法。作为可选地,也可以提示用户是否切入至人工服务台,通过人工接入的方式获取其咨询内容以及真实想法。
本发明实施例提供的人机对话方法,在获取到当前咨询内容并非围绕背景记忆信息进行时,利用系统进行咨询引导,有效的促进了农业技术咨询人机交互用户体验和精准性的提升。
基于上述实施例的内容,作为一种可选实施例,上述获取第一语法词集合和第二语法词集合的语境符合度,具体可以包括:
构建咨询语境词库;基于咨询语境词库,分别获取第一语法词集合和第二语法词集合的词语编码,分别记为第一词语编码和第二词语编码;利用语境符合度计算公式计算第一语法词集合和第二语法词集合的语境符合度。
其中,语境符合度计算公式为:
F(C,D)=as*max[f(sC,sD)]+av*max[f(VC,VD)]+aO*max[f(OC,OD)]
其中,C为第一语法词集合;D为第二语法词集合;S、V、O分别表示主语词集、谓语词集和宾语词集;a为不同句子成分的权重,as、av和ao分别为句子成分中的主语成分权重、谓语成分权重和宾语成分权重,且as>av>ao;sC、VC、OC分别为第一语法词集合中的主语词集、谓语词集和宾语词集;sD、VD、OD分别为第二语法词集合中的主语词集、谓语词集和宾语词集;X、Y为S、V、O中的词;i为两个词语编码X和Y从左至右不相同码段的位置;k表示词语编码码段的数量。
需要说明的是,由于as、av和ao分别为句子成分中的主语成分权重、谓语成分权重和宾语成分权重,在本实施例中可以设as>av>ao,即设置主语成分权重最高,谓语成分权重次之,再次则为宾语成分权重,但其不作为对本实施例保护范围的限定。
在本发明实施例中,可以预先构建咨询语境词库,其构建方法可以是:在咨询问答语料的基础上,通过语法词提取获取咨询词集;将咨询词集按照咨询问题的范围大小进行分类,对每一分类进行编码。
例如,将咨询词集中的所有词进行四级分类;对一级分类、二级分类和三级分类采用大写字母顺序编码;对四级分类采用至少两位阿拉伯数字顺序编码。
本发明实施例所建立的应用于农业技术的咨询语境词库主要用于实现农业技术咨询词语的词间关系映射。在常见咨询问答语料的基础上,通过词关系分析方法对常见咨询问答语料进行词的提取,获取咨询词集。可以按照咨询问题进行多级分类,以对词关系进行精细化划分。例如可以按照一级分类、二级分类、三级分类、四级分类进行类别划分,并可以通过附加顺序码进行个体区别。
作为可选地,一级分类可以用一位大写字母表示,如从“A”顺序编码,其中用“A”表示“种植类”、用“B”表示“养殖类”。二级分类,也可以用一位大写字母表示,从“A”顺序编码。如种植类下含有果树类、蔬菜类、食用菌等分类,其中用“A”表示“果树类”、用“B”表示“蔬菜类”。三级分类,也可以用一位大写字母表示,从“A”开始顺序编码,如蔬菜类下含有种类品种、栽培管理、植保病害、加工储运、市场销售等,其中“种类品种”用“A”表示。四级分类,则可以用至少两位阿拉伯数字表示,从“01”开始顺序编码。如种类品种下含有番茄、茄子、辣椒等分类,其中“番茄”用“01”表示。
由于从一级分类至四级分类,其所包含的类别越来越多,在本发明实施例中通过将一至三级分类采用大写字母顺序编码,对四级分类采用至少两位阿拉伯数字顺序编码,在保证编码的唯一性的同时,为进行用户的当前咨询内容是否与背景记忆信息相匹配提供的便利,有效的提供了人机对话的效率。
基于上述实施例的内容,作为一种可选实施例,在将咨询词集按照咨询问题的范围和类型进行分类,对每一分类进行编码之后,还可以包括:在获取的编码上设置附加码。
例如:用“e”、“s”两种不同的小写字母(也可以用数字“1”和“2”等)表示附加码。具有附加码e所对应的词,表示同义词;具有附加码“s”所对应的词,表示近义词。如果不具备同义或近义关系,则附加码为空。例如,采用本发明实施例所提供的编码方法对番茄进行操作,所获取的编码为:“ABA01e”,其一级分类编码为“A”、二级分类编码为“B”、三级分类编码为“A”、四级分类编码为“01”、附加码为“e”。例如,采取上述编码方式对西红柿进行编码为“ABA01e”。
本发明实施例提供的人机对话方法,通过增设附加码,进一步的提供了编码的效率,也更加有效的提供了人机对话的效率。
基于上述实施例的内容,作为一种可选实施例,上述预设条件可以为:语句词关系中包含主谓关系词和/或动宾关系词。
本发明实施例提供的人机对话方法主要是针对用户在咨询对话过程中可能会出现咨询对象、咨询内容隐含省略的问题,通过对初次对话主语词集、谓语词集、宾语词集的背景记忆信息存储,来应对二次对话可能出现的咨询问题要素缺失。同时根据对话过程中出现的三种情况,进行信息自动补全。重点在于对话背景信息的记忆传递策略。可以理解为:步骤S3具体可以分三种情况:
(1)若所述语句词关系符合预设条件1(即主谓关系、动宾关系具备),用当前咨询内容去更新背景记忆信息作为本轮对话记忆信息向下传递,最后将当前咨询内容主题词序列传递给咨询问答模块进行回答,更新后的背景记忆信息继续向下传递,用于下一条用户咨询的语境符合度评估;
(2)若所述语句词关系符合预设条件2(即主谓关系和/或动宾关系缺乏),且语境符合度大于阈值,用当前咨询语法词集和背景记忆信息进行叠加,形成表达当前用户咨询的词集,用作背景记忆信息向下传递的同时,还传递给咨询问答模块进行回答。
(3)若所述语句词关系既符合预设条件2(即主谓关系和/或动宾关系缺乏),但语境符合度小于阈值,则通过系统引导用户表达咨询问题的关键要素(包括咨询对象、对象动作、对象内容等),结合用户当前咨询语句和系统引导的关键要素,形成表达当前用户咨询的词集,用作背景记忆信息向下传递的同时,还传递给咨询问答模块进行回答。
进一步地,步骤S4的执行过程可以是:
经过S3的三种情况处理,形成新的语法词集合,然后再从知识库中进行问题匹配。
为了更清楚的说明本发明实施例的具体实施步骤,特举例说明如下:
若用户的初始咨询内容为:“番茄灰霉病是什么原因?”获取与其相关的背景记忆信息的第一语法词集合则可以是:“番茄灰霉病/是/什么原因”。
作为可选地的实施例,若用户进一步的当前咨询内容为:“辣椒叶子发黄怎么办?”对其提取的当前咨询内容包含的语句词关系集合可以是:“辣椒叶子/发/黄”,由于其符合预设条件(即主谓关系、动宾关系齐全),则利用当前咨询内容更新背景记忆信息,即将原初始咨询“草莓灰霉病/是/什么原因”替换为“辣椒叶子/发/黄”。进一步地,根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户,即根据“辣椒叶子、发、黄”从知识库中进行问题匹配。
作为可选地实施例,若用户的当前咨询内容为:“草莓呢?”,对其提取的第二语法词集合中仅包括“草莓”一词。此时可以认定第二语法词集合所对应的语句词关系中缺乏主谓关系词以及动宾关系词,即语句词关系不符合预设条件,则需要进行语境符合度的计算,并根据语境符合度与符合度阈值确定用于进行问题匹配的语法词集合。
由于番茄和草莓都属于蔬菜类,设其语境符合度大于符合度阈值,则需要将所述第一语法词集合嵌入至所述第二语法词集合,构成第三语法词集合,即将背景记忆信息与当前咨询进行叠加。作为可选地,主语叠加方法是用当前咨询主语作为叠加后的主语,其它的部分简单加和,缺乏的部分为空。处理结果是系统自动信息补全,即补全后的问题为:“草莓灰霉病是什么原因?”其对应背景记忆信息被更新为:草莓灰霉病/是/什么原因。进一步地,可以根据其对应的第三语法词集合:草莓灰霉病、是、什么原因,从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
作为可选地实施例,若用户进一步的咨询内容为:“价格?”对其提取的第二语法词集合则可以是:“价格”。由于其语句词关系中缺乏主谓关系词以及动宾关系词,即语句词关系不符合预设条件,则需要进行语境符合度的计算。根据语境符合度的比较,“价格”一词与前述的第一语法词集合中的“番茄灰霉病/是/什么原因”的语境符合度不匹配,即其语境符合度小于符合度阈值,则通过系统引导的方式向用户提问为:“您问的是辣椒价格吗?”。若用户的回答为:“是”,则获取咨询问题关键要素“辣椒、价格”构成第四语法词集合,以根据第四语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案(辣椒的当前价格)反馈给所述用户。
需要说明的是,由于中文的语法特性,在一个语句中主谓关系以及动宾关系能够一定程度上表达出该语句的真实含义,故在本实施例中设置预设条件为主谓关系以及动宾关系的缺失与否。但其仅仅视作本发明实施例的一种情况,在实际运用中可以设置为:当前咨询内容所对应的语句词关系中是否包含第一语法词集合中的主谓关系或动宾关系中的一种或多种。
本发明实施例提供一种人机对话系统,如图2所示,包括但不限于咨询主题创建模块1、语句词关系生成模块2、语句词关系判别模块3和答案反馈模块4,其中:
咨询主题创建模块1主要用于根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;第一语法词集合包括主语词集、谓语词集和宾语词集;语句词关系生成模块2主要用于接收用户的当前咨询内容,确定当前咨询内容包含的语句词关系;语句词关系判别模块3主要用于对语句词关系进行判别;若语句词关系符合预设条件,则利用与所述当前咨询内容更新背景记忆信息;答案反馈模块4用于根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
基于上述实施例的内容,作为可选的,本发明实施例提供的人机对话系统,还包括可以语境符合度运算模块和词集合嵌入模块;若语句词关系判别模块获取语句词关系不符合预设条件,则咨询主题创建模块1则获取当前咨询内容的第二语法词集合;语境符合度运算模块主要用于获取第一语法词集合和所述第二语法词集合的语境符合度;若所述语境符合度大于符合度阈值,词集合嵌入模块则将第一语法词集合嵌入至第二语法词集合,构成第三语法词集合;答案反馈模块4还用于根据第三语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给用户。
具体地,如图3所述,本发明实施例提供的人机对话系统在具体运行时,主要执行以下步骤:
首先,采用上述实施例中的方法,在咨询问答语料的基础上,通过词关系提取获取咨询词集;将咨询词集按照咨询问题的范围大小进行分类,并对每一分类进行编码,以构建应用于农业技术的咨询语境词库。
然后,再通过人机对话终端接收到用户的咨询请求后,采用依存句法分析法和/或语义角色分析法等提取出用户的背景记忆信息信息,即第一语法词集合。
随着人机对话的进行,在每次获取到用户的当前咨询内容后,对用户当前咨询信息进行提取。然后,将用户当前咨询信息与第一语法词集合中的主谓关系(SVB)、动宾关系(VOB)等进行比对。
其中,若用户当前咨询信息并不缺少SVB关系且不缺少VOB关系时,此时可以直接用当前咨询信息更新之前的背景记忆信息,并同时更新第一语法词集合,利用更新后的第一语法词集合进入至答案反馈模块,进行问题答案的匹配和反馈。
当用户当前咨询信息缺少SVB关系和/或者缺少VOB关系时,则说明当前对话内容中存在隐含语义、省略指代等表述方式,从而需要将用户当前咨询内容结合背景记忆信息进行理解,从而判断用户当前咨询内容是否是围绕着上文主题进行的。
在本发明实施例中,通过将当前咨询内容所对应的第二语法词集合与背景记忆信息所对应的第一语法词集合进行语境符合度计算,以进一步确定当前咨询内容是否围绕背景记忆信息进行。
当计算的语境符合度大于预设阈值时,则说明当前咨询内容是围绕着背景记忆信息进行,为更准确的确定用户当前的真实意思表达,将当前咨询内容嵌入至第一语法词集合,以更准确的获取用户当前真实的咨询问题,从而实现对该问题的解答。
其中,若计算的语境符合度小于预设阈值,则说明当前咨询内容不是围绕着背景记忆信息进行,则主动引导用户进行咨询问题表述。
本发明实施例提供的人机对话系统,通过将用户的当前咨询内容与背景记忆信息进行判别,提出了一种轻量级人机对话过程中背景信息记忆和传递方法,克服了主要要素缺乏导致无法回答或不能准确回答问题的缺陷,有效满足人机对话过程中实时交互问答要求,为农业技术咨询人机交互用户体验和精准性的提升提供有效解决方案。
需要说明的是,本发明实施例提供的人机对话系统,在具体运行时,可用于执行上述任一实施例中所述的人机对话方法,在此不作一一赘述。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行如下方法:根据用户的初始咨询内容作为背景记忆信息,获取所述背景记忆信息的第一语法词集合;所述第一语法词集合包括主语词集、谓语词集和宾语词集;接收用户的当前咨询内容,确定所述当前咨询内容包含的语句词关系;若所述语句词关系符合预设条件,则利用与所述当前咨询内容更新背景记忆信息;根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的人机对话方法,例如包括:根据用户的初始咨询内容,获取所述初始咨询内容作为背景记忆信息;获取所述背景记忆信息的第一语法词集合;所述第一语法词集合包括主语词集、谓语词集和宾语词集;接收用户的当前咨询内容,确定所述当前咨询内容包含的语句词关系;若所述语句词关系符合预设条件,则将所述当前咨询内容更新背景记忆信息;根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (11)
1.一种人机对话方法,其特征在于,包括:
根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;所述第一语法词集合包括主语词集、谓语词集和宾语词集;
接收用户的当前咨询内容,确定所述当前咨询内容包含的语句词关系;
若所述语句词关系符合预设条件,则利用所述当前咨询内容更新所述背景记忆信息;
所述预设条件为所述语句词关系中包含有主谓关系词和/或动宾关系词;
所述利用所述当前咨询内容更新所述背景记忆信息,包括:以所述当前咨询内容作为所述背景记忆信息;
根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户;
所述根据更新后的第一语法词集合从知识库中进行问题匹配,具体为以所述当前咨询内容所对应的语法词集合从所述知识库中进行问题匹配。
2.根据权利要求1所述的人机对话方法,其特征在于,
若所述语句词关系不符合预设条件,则获取所述当前咨询内容的第二语法词集合;
获取所述第一语法词集合和所述第二语法词集合的语境符合度;
若所述语境符合度大于符合度阈值,则将所述第一语法词集合嵌入至所述第二语法词集合,构成第三语法词集合;
根据所述第三语法词集合从所述知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
3.根据权利要求2所述的人机对话方法,其特征在于,
若所述语境符合度小于所述符合度阈值,则通过系统引导的方式,获取咨询问题关键要素,构成第四语法词集合;
根据所述第四语法词集合从所述知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
4.根据权利要求2所述的人机对话方法,其特征在于,所述获取所述第一语法词集合和所述第二语法词集合的语境符合度,包括:
构建咨询语境词库;
基于所述咨询语境词库,分别获取所述第一语法词集合和所述第二语法词集合的词语编码,分别记为第一词语编码和第二词语编码;
利用语境符合度计算公式计算所述第一语法词集合和所述第二语法词集合的语境符合度;
所述语境符合度计算公式为:
F(C,D)=as*max[f(SC,SD)]+av*max[f(VC,VD)]+ao*max[f(OC,OD)]
其中,C为第一语法词集合;D为第二语法词集合;S、V、O分别表示主语词集、谓语词集和宾语词集;a为不同句子成分的权重,as、av和ao分别为句子成分中的主语成分权重、谓语成分权重和宾语成分权重,且as>av>ao;sC、VC、OC分别为第一语法词集合中的主语词集、谓语词集和宾语词集;sD、VD、OD分别为第二语法词集合中的主语词集、谓语词集和宾语词集;f(X,Y)为词语X、Y的语境相似度;X、Y为S、V、O中的词;i为两个词语编码X和Y从左至右不相同码段的位置;k表示词语编码码段的数量。
5.根据权利要求4所述的人机对话方法,其特征在于,所述构建咨询语境词库,包括:
在咨询问答语料的基础上,通过语法词提取获取咨询词集;
将所述咨询词集按照咨询问题的范围和类型进行分类,对每一分类进行编码。
6.根据权利要求5所述的人机对话方法,其特征在于,所述将所述咨询词集按照咨询问题的范围和类型进行分类,并对每一分类进行编码,包括:
将所述咨询词集中的所有词按照咨询问题的范围和类型,进行至少两级分类。
7.根据权利要求5所述的人机对话方法,其特征在于,将所述咨询词集按照咨询问题的范围和类型进行分类,对每一分类进行编码之后,还包括:在获取的编码上设置附加码。
8.一种人机对话系统,其特征在于,包括:
咨询主题创建模块,用于根据用户的初始咨询内容,获取背景记忆信息的第一语法词集合;所述第一语法词集合包括主语词集、谓语词集和宾语词集;
语句词关系生成模块,用于接收用户的当前咨询内容,确定所述当前咨询内容包含的语句词关系;
语句词关系判别模块,用于对所述语句词关系进行判别;若所述语句词关系符合预设条件,则利用所述当前咨询内容更新所述背景记忆信息;所述预设条件为所述语句词关系中包含有主谓关系词和/或动宾关系词;所述利用所述当前咨询内容更新所述背景记忆信息,包括:以所述当前咨询内容作为所述背景记忆信息;
答案反馈模块,用于根据更新后的第一语法词集合从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户;所述根据更新后的第一语法词集合从知识库中进行问题匹配,具体为以所述当前咨询内容所对应的语法词集合从所述知识库中进行问题匹配。
9.根据权利要求8所述的人机对话系统,其特征在于,还包括语境符合度运算模块和词集合嵌入模块;
若语句词关系判别模块获取所述语句词关系不符合预设条件,所述咨询主题创建模块则获取所述当前咨询内容的第二语法词集合;
所述语境符合度运算模块,用于获取所述第一语法词集合和所述第二语法词集合的语境符合度;
若所述语境符合度大于符合度阈值,所述词集合嵌入模块则将所述第一语法词集合嵌入至所述第二语法词集合,构成第三语法词集合;
所述答案反馈模块,还用于根据所述第三语法词集合从所述知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给所述用户。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述人机对话方法的步骤。
11.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述人机对话方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464036.0A CN111831801B (zh) | 2020-05-27 | 2020-05-27 | 一种人机对话方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464036.0A CN111831801B (zh) | 2020-05-27 | 2020-05-27 | 一种人机对话方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111831801A CN111831801A (zh) | 2020-10-27 |
CN111831801B true CN111831801B (zh) | 2022-02-25 |
Family
ID=72913514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010464036.0A Active CN111831801B (zh) | 2020-05-27 | 2020-05-27 | 一种人机对话方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111831801B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380343B (zh) * | 2020-11-19 | 2024-06-25 | 平安科技(深圳)有限公司 | 问题解析方法、装置、电子设备及存储介质 |
CN112950326A (zh) * | 2021-03-17 | 2021-06-11 | 南通大学 | 一种支持深度学习工作原理的人工智能数据分析系统 |
CN113204635A (zh) * | 2021-06-08 | 2021-08-03 | 重庆电子工程职业学院 | 一种用于现代农业种植的智能咨询系统 |
CN117909485B (zh) * | 2024-03-19 | 2024-05-24 | 武汉百智诚远科技有限公司 | 基于大语言模型的法律咨询智能交互方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304437A (zh) * | 2017-09-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种自动问答方法、装置及存储介质 |
CN109189906A (zh) * | 2018-08-17 | 2019-01-11 | 国家电网有限公司客户服务中心 | 智能客服对连贯语境下多问句完整语义的识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073587B (zh) * | 2016-11-09 | 2022-05-27 | 阿里巴巴集团控股有限公司 | 一种自动问答方法、装置及电子设备 |
CN106777018B (zh) * | 2016-12-08 | 2020-05-22 | 竹间智能科技(上海)有限公司 | 一种智能聊天机器人中对输入语句的优化方法及装置 |
CN108334487B (zh) * | 2017-07-14 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 缺失语意信息补全方法、装置、计算机设备和存储介质 |
CN108304561B (zh) * | 2018-02-08 | 2019-03-29 | 北京信息职业技术学院 | 一种基于有限数据的语义理解方法、设备及机器人 |
CN110059169B (zh) * | 2019-01-25 | 2023-12-01 | 邵勃 | 基于语料标注的智能机器人聊天上下文实现方法及系统 |
CN109918494B (zh) * | 2019-03-22 | 2022-11-04 | 元来信息科技(湖州)有限公司 | 基于图的上下文关联回复生成方法、计算机及介质 |
-
2020
- 2020-05-27 CN CN202010464036.0A patent/CN111831801B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304437A (zh) * | 2017-09-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种自动问答方法、装置及存储介质 |
CN109189906A (zh) * | 2018-08-17 | 2019-01-11 | 国家电网有限公司客户服务中心 | 智能客服对连贯语境下多问句完整语义的识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111831801A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111831801B (zh) | 一种人机对话方法及系统 | |
CN106295792B (zh) | 基于多模型输出的对话数据交互处理方法及装置 | |
CN110838288B (zh) | 一种语音交互方法及其系统和对话设备 | |
US11645547B2 (en) | Human-machine interactive method and device based on artificial intelligence | |
CN107329967B (zh) | 基于深度学习的问答系统以及方法 | |
JP6819990B2 (ja) | 対話システム及びそのためのコンピュータプログラム | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
CN111241357A (zh) | 对话训练方法、装置、系统及存储介质 | |
CN110175229B (zh) | 一种基于自然语言进行在线培训的方法和系统 | |
CN111445898B (zh) | 语种识别方法、装置、电子设备和存储介质 | |
CN113051374B (zh) | 一种文本匹配优化方法及装置 | |
US20230394247A1 (en) | Human-machine collaborative conversation interaction system and method | |
CN114238607B (zh) | 深度交互式ai智能求职顾问方法、系统及存储介质 | |
CN112115242A (zh) | 一种基于朴素贝叶斯分类算法的智能客服问答系统 | |
CN112463942A (zh) | 文本处理方法、装置、电子设备及计算机可读存储介质 | |
CN113705196A (zh) | 基于图神经网络的中文开放信息抽取方法和装置 | |
CN111259124A (zh) | 对话管理方法、装置、系统及存储介质 | |
CN112905776A (zh) | 一种情感对话模型构建方法、情感对话系统及方法 | |
CN111199149A (zh) | 一种对话系统的语句智能澄清方法及系统 | |
CN115146124A (zh) | 问答系统应答方法及其装置、设备、介质、产品 | |
CN110909174B (zh) | 一种基于知识图谱的简单问答中实体链接的改进方法 | |
CN112329437A (zh) | 一种智能客服语音质检评分方法、设备及存储介质 | |
CN111723559A (zh) | 一种实时信息抽取方法及装置 | |
CN115510213A (zh) | 用于作业机械的问答方法及系统、作业机械 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |