CN108932278B - 基于语义框架的人机对话方法及系统 - Google Patents

基于语义框架的人机对话方法及系统 Download PDF

Info

Publication number
CN108932278B
CN108932278B CN201810399238.4A CN201810399238A CN108932278B CN 108932278 B CN108932278 B CN 108932278B CN 201810399238 A CN201810399238 A CN 201810399238A CN 108932278 B CN108932278 B CN 108932278B
Authority
CN
China
Prior art keywords
semantic
theme
visitor
structure tree
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810399238.4A
Other languages
English (en)
Other versions
CN108932278A (zh
Inventor
蔡振华
肖龙源
谭玉坤
李稀敏
刘晓葳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Kuaishangtong Technology Corp ltd
Original Assignee
Xiamen Kuaishangtong Technology Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Kuaishangtong Technology Corp ltd filed Critical Xiamen Kuaishangtong Technology Corp ltd
Priority to CN201810399238.4A priority Critical patent/CN108932278B/zh
Publication of CN108932278A publication Critical patent/CN108932278A/zh
Priority to PCT/CN2018/124937 priority patent/WO2019205705A1/zh
Application granted granted Critical
Publication of CN108932278B publication Critical patent/CN108932278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于语义框架的人机对话方法及系统,其根据原始语料创建主题森林结构树并利用主题森林结构树生成语义框架模型,并将主题森林结构树的实体属性映射至语义框架模型中对应的语义槽;人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至主题类型对应的语义框架模型中的语义槽中;然后将填充后的语义框架模型的语义槽的访客问题映射至主题森林结构树的实体属性中;最后主题森林结构树根据访客问题从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给访客;从而能够保证获取到准确的、完整的访客问题,以在此基础上保证答案的准确性和提高沟通效率,并且能够主动与访客进行互动,增加用户体验度。

Description

基于语义框架的人机对话方法及系统
技术领域
本发明涉及人工智能技术领域,特别是一种基于语义框架的人机对话方法及其应用该方法的系统。
背景技术
随着互联网及电子商务的普及应用,及人工智能技术的发展,智能客服越来越常见。智能客服是在大规模知识处理基础上发展起来的一项面向行业应用的,涉及大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等等,具有行业通用性,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段;同时还能够为企业提供精细化管理所需的统计分析信息,可以大大降低企业在客服方面的人工成本。
智能客服的工作原理主要是基于大数据知识处理技术的应用,即通过提取访客的关键词来判断访客的问题,然后从知识库中匹配相应的答案给访客。获得准确答案的前提,是能够提取准确和完整的问题。但是,由于中文语言问题,往往同一个问题有多种表达方法、多种用词习惯等,造成答案与问题词不达意,或者无法识别用户的问题,造成用户体验度下降。
发明内容
本发明为解决上述问题,提供了一种基于语义框架的人机对话方法及系统,其通过主题森林结构树和语义框架模型的映射关系对人机对话内容进行解析,能够保证获取到准确的、完整的访客问题,以在此基础上保证答案的准确性和提高沟通效率。
为实现上述目的,本发明采用的技术方案为:
一种基于语义框架的人机对话方法,其包括以下步骤:
a.根据原始语料创建主题森林结构树,并在所述主题森林结构树中提取每个主题类型对应的实体属性;
b.利用所述主题森林结构树生成语义框架模型,并将所述主题森林结构树的实体属性映射至所述语义框架模型中对应的语义槽;
c.人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中;
d.将填充后的语义框架模型的语义槽的访客问题映射至所述主题森林结构树的实体属性中;
e.所述主题森林结构树根据所述访客问题从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给访客。
优选的,所述的步骤d中,进一步根据映射后的主题森林结构树进行判断所述访客问题是否满足预设条件;当所述访客问题满足预设条件时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;当所述访客问题未满足预设条件时,所述主题森林结构树将判断结果反馈至前端的对话机器人。
进一步的,所述实体属性包括必要属性和可选属性,所述语义槽包括必要语义槽和可选语义槽;所述预设条件为必要属性是否完整;人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中;并将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性;再进一步根据映射后的主题森林结构树进行判断所述必要属性是否完整;当所述访客问题的必要属性完整时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;当所述访客问题的必要属性不完整时,所述主题森林结构树将缺失的必要属性反馈至前端的对话机器人,由所述对话机器人根据缺失的必要属性向访客进行追问,得到所述主题类型的所有必要属性。
优选的,所述的步骤a中进一步包括:
a1.收集原始语料,并对原始语料进行主题聚类,得到不同类型的主题;
a2.对每个主题类型进行实体关系的识别和提取,并根据所述实体关系确定每个主题类型的实体属性;
a3.根据所述实体属性,为每个类型的主题创建主题结构树,以及为所有的主题类型创建主题森林式知识库。
进一步的,所述的步骤a1中,对原始语料进行主题聚类,是利用LDA主题模型工具进行主题提取和主题分类。
进一步的,所述的步骤a2中,对每个主题类型进行实体关系的识别和提取,是通过对原始语料进行语法解析和语义解析,根据解析结果提取实体信息和标注实体信息之间的关系。
进一步的,所述的步骤a3中,所述主题结构树包括当前主题信息和主题间关联信息,根据所述主题间关联信息将所有类型的主题进行关联索引,得到主题森林式知识库。
优选的,所述的步骤c中,是通过对访客问题进行分词处理和关键词提取,根据提取的关键词进行匹配其所属的主题类型,,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中。
进一步的,所述的步骤d中,是通过将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性,并将提取的关键词与所述必要属性和可选属性进行匹配,根据匹配结果判断是否缺失必要属性。
对应的,本发明还提供一种基于语义框架的人机对话系统,其包括:
主题结构树创建模块,其根据原始语料创建主题森林结构树,并在所述主题森林结构树中提取每个主题类型对应的实体属性;
语义框架模型生成模块,其利用所述主题森林结构树生成语义框架模型,并将所述主题森林结构树的实体属性映射至所述语义框架模型中对应的语义槽;
人机对话模块,用于对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中;
问题匹配模块,用于将填充后的语义框架模型的语义槽的访客问题映射至所述主题森林结构树的实体属性中,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;
答案反馈模块,用于将匹配的问题所对应的答案反馈给访客。
本发明的有益效果是:
(1)本发明通过主题森林结构树和语义框架模型的映射关系对人机对话内容进行解析,能够保证获取到准确的、完整的访客问题,以在此基础上保证答案的准确性和提高沟通效率。
(2)本发明通过在创建主题森林式知识库时设置主题的必要属性和可选属性,并与语义框架模型中的必要语义槽和可选语义槽相映射,从而在人机对话时将访客问题进行主题匹配和必要属性的匹配以及必要属性的追问,从而能够主动与访客进行互动,增加用户体验度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种基于语义框架的人机对话方法的流程简图;
图2为本发明一种基于语义框架的人机对话系统的结构示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的一种基于语义框架的人机对话方法,其包括以下步骤:
a.根据原始语料创建主题森林结构树,并在所述主题森林结构树中提取每个主题类型对应的实体属性;
b.利用所述主题森林结构树生成语义框架模型,并将所述主题森林结构树的实体属性映射至所述语义框架模型中对应的语义槽;
c.人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中;
d.将填充后的语义框架模型的语义槽的访客问题映射至所述主题森林结构树的实体属性中;
e.所述主题森林结构树根据所述访客问题从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给访客。
其中,语义框架是知识表示的一种,框架语义学(Frame Semantics)是由美国语言学家菲尔墨(Fillmore)提出的认知语言学理论,slot是该框架中的“槽”。框架语义学首先是一种通向理解及描写词语和语法结构的意义的途径。它是从这样的假设开始的,即为了理解语言中词语的意义,我们必需先具备概念结构,即语义框架的知识。语义框架提供词语的意义在语言中存在以及在话语中使用的背景和动因。框架语义学假设,词语可以通过它所在的语言结构,选择和突出基本的语义框架的某些方面或某些实例,而这是以一定的方式(按照一定的原则)进行的。因此,解释词语的意义和功能,可以按照从基本的语义框架的描写开始直到对这些方式的特点加以了详细刻画这样的思路进行。
以汉语词典语义框架举例如下:
[词形]:走
[拼音]:zou3
[制作者]:陈群秀
[工作单号]:6
[动词类型]:他动词
[论元数目]:2
[义项数目]:10**
[义项序号]:10*
[释义]:*比喻意义的“走”。
[基本式1]:施事+走+客事
[基本式句例1]:中国坚定不移地走改革开放的道路。教师队伍的建设走上规范化、法制化的轨道。
[基本式2]:施事+走+方向
[基本式句例2]:中国足球队走向世界。国产电梯正走向世界。三大民族史诗走上书架。帆船时代走向终结。
[论旨名称]:施事
[句法功能]:主语
[语义分类]:{超类|事|物|时空}
[论旨实例]:宇宙、国民经济、工业、中国足球队、国产电梯、帆船时代、作品
[论旨名称]:客事
[句法功能]:宾语
[语义分类]:{空间|抽象物}
[论旨实例]:道路、轨道、正轨
[论旨名称]:方向
[句法功能]:状语
[语义分类]:{空间|抽象物|具体物}
[论旨标记]:向;上;朝
[论旨实例]:世界、书架、终结、光明、实施、法治、失败、稳定、卖国主义
[否定式]:不V V不了
[时态]:要1V将要V即将V就要V快要V V着V着呢正在V正在V呢V下去V下来V起来2
[备注式1]:扩展式:处所
其中,中括号内代表语义槽,冒号后面的内容代表该语义槽填充的内容,可根据需要将上述语义槽划分为必要语义槽和可选语义槽。
本实施例中:
所述的步骤a中,所述实体属性包括必要属性和可选属性。
所述的步骤b中,所述语义槽包括必要语义槽和可选语义槽。
所述的步骤c中,人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中;并将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性。
所述的步骤d中,进一步根据映射后的主题森林结构树进行判断所述访客问题是否满足预设条件;当所述访客问题满足预设条件时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;当所述访客问题未满足预设条件时,所述主题森林结构树将判断结果反馈至前端的对话机器人。本实施例中,所述预设条件为必要属性是否完整;即:根据映射后的主题森林结构树进行判断所述必要属性是否完整;当所述访客问题的必要属性完整时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;当所述访客问题的必要属性不完整时,所述主题森林结构树将缺失的必要属性反馈至前端的对话机器人,由所述对话机器人根据缺失的必要属性向访客进行追问,得到所述主题类型的所有必要属性。本实施例中,追问后重新返回步骤c进行访客问题的提取、语义槽的填充、实体属性的映射、缺失属性的判断等,并重复以上过程,直至满足所述主题森林结构树所需的全部必要属性,并从所述知识库中检索出答案给访客为止。
其中,所述的步骤a中进一步包括:
a1.收集原始语料,并对原始语料进行主题聚类,得到不同类型的主题;
a2.对每个主题类型进行实体关系的识别和提取,并根据所述实体关系确定每个主题类型的实体属性;
a3.根据所述实体属性,为每个类型的主题创建主题结构树,以及为所有的主题类型创建主题森林式知识库。
具体如下:
所述的步骤a1中,对原始语料进行主题聚类,是利用LDA主题模型工具进行主题提取和主题分类。其中,所述原始语料是指访客与客服的历史对话记录,并根据新的对话记录对所述原始语料进行定期更新或实时更新。所述LDA(Latent Dirichlet Allocation)主题模型是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。文档到主题服从多项式分布,主题到词服从多项式分布。对每一篇文档,从主题分布中抽取一个主题,从被抽到的主题所对应的单词分布中抽取一个单词;重复上述过程直至遍历文档中的每一个单词,从而得到文档的主题。所述文档即本发明中的访客与客服的对话记录。例如,将一份原始语料划分为天气查询、火车查询、航班查询等主题。
所述的步骤a2中,对每个主题类型进行实体关系的识别和提取,是通过对原始语料进行语法解析和语义解析,根据解析结果提取实体信息和标注实体信息之间的关系,可以用实体关系图进行表示。实体关系图:简记E-R图,是指以实体、关系、属性三个基本概念概括数据的基本结构。所述实体即命名实体(named entity),其包括名称(组织名、人名、地名、商品名)、表达式(日期、时间)等在内的具有明确语义信息的文本实体,在E-R图中用矩形表示,矩形框内写明实体名;比如访客作为一个实体。所述属性(Attribute),实体所具有的某一特性,一个实体可由若干个属性来刻画;在E-R图中用椭圆形表示,并用无向边将其与相应的实体连接起来;比如访客的姓名、账号、性别等,都是属性。所述关系(Relationship),是指数据对象彼此之间相互连接的方式,包括一对一关系、一对多关系、多对多关系。
所述的步骤a3中,所述主题结构树包括当前主题信息和主题间关联信息,根据所述主题间关联信息将所有类型的主题进行关联索引,得到主题森林式知识库。一个对话可能仅局限于某个领域内的单一主题,也可能同时涉及多个领域的多个主题。通过匹配对话中的访客问题所涉及的主题,当涉及单一主题时,则通过主题森林式知识库进行查找匹配的主题类型,并获取该主题类型的必要属性和可选属性进行确认问题的完整性;当涉及多个主题时,则通过主题森林式知识库进行多个主题类型的匹配,并获取多个主题类型的对应的必要属性和可选属性进行一一确认所述访客问题在每个主题类型中的完整性。
所述的步骤c中,对访客问题进行主题类型的匹配,是通过对访客问题进行分词处理和关键词提取,根据提取的关键词进行匹配其所属的主题类型,,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中。所述的步骤c中,将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中,是利用自然语言框架解析器将访客问题中的对应内容填充到语义框架模型中的每个语义槽中。
所述的步骤d中,是通过将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性,并将提取的关键词与所述必要属性和可选属性进行匹配,根据匹配结果判断是否缺失必要属性。
本实施例中,以天气查询主题为例进行说明如下:
首选,构建主题森林结构树:
根:天气查询;
必要属性1:时间;
必要属性2:地点;
可选属性1:天气类型,如下雨、下雪、雾霾等;
可选属性2:其他。
然后,根据主题森林树生成语义框架模型如下:
天气查询框架
槽(slot)1时间:
槽(slot)2地点:
槽(slot)3天气类型:
槽(slot)4其它:
接着,获取访客问题:明天北京会下雨吗?
经过天气查询语义框架模型后得到的结果如下:
语义框架:天气查询
槽(slot)1时间:明天(系统可根据当前系统日期来确定);
槽(slot)2地点:北京
槽(slot)3天气类型:下雨
槽(slot)4其它:无
语义框架模型将以上获取到的内容映射到主题森林结构树,主题森林结构树判断后,发现其已满足必要属性1和必要属性2,所以到知识库中进行问题的查询并将查询结果(答案)反馈给访客。
如图2所示,本发明还提供一种基于语义框架的人机对话系统,其包括:
主题结构树创建模块,其根据原始语料创建主题森林结构树,并在所述主题森林结构树中提取每个主题类型对应的实体属性;
语义框架模型生成模块,其利用所述主题森林结构树生成语义框架模型,并将所述主题森林结构树的实体属性映射至所述语义框架模型中对应的语义槽;
人机对话模块,用于对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中;
问题匹配模块,用于将填充后的语义框架模型的语义槽的访客问题映射至所述主题森林结构树的实体属性中,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;
答案反馈模块,用于将匹配的问题所对应的答案反馈给访客。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.一种基于语义框架的人机对话方法,其特征在于,包括以下步骤:
a.根据原始语料创建主题森林结构树,并在所述主题森林结构树中提取每个主题类型对应的实体属性;
b.利用所述主题森林结构树生成语义框架模型,并将所述主题森林结构树的实体属性映射至所述语义框架模型中对应的语义槽;
c.人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中;
d.将填充后的语义框架模型的语义槽的访客问题映射至所述主题森林结构树的实体属性中;
e.所述主题森林结构树根据所述访客问题从知识库中进行问题匹配,并将匹配的问题所对应的答案反馈给访客;
其中,所述实体属性包括必要属性和可选属性,所述语义槽包括必要语义槽和可选语义槽;人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中;并将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性;再进一步根据映射后的主题森林结构树进行判断所述必要属性是否完整;当所述访客问题的必要属性完整时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;当所述访客问题的必要属性不完整时,所述主题森林结构树将缺失的必要属性反馈至前端的对话机器人,由所述对话机器人根据缺失的必要属性向访客进行追问,得到所述主题类型的所有必要属性。
2.根据权利要求1所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤d中,进一步根据映射后的主题森林结构树进行判断所述访客问题是否满足预设条件;当所述访客问题满足预设条件时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;当所述访客问题未满足预设条件时,所述主题森林结构树将判断结果反馈至前端的对话机器人。
3.根据权利要求2所述的一种基于语义框架的人机对话方法,其特征在于:所述预设条件为必要属性是否完整。
4.根据权利要求1至3任一项所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤a中进一步包括:
a1.收集原始语料,并对原始语料进行主题聚类,得到不同类型的主题;
a2.对每个主题类型进行实体关系的识别和提取,并根据所述实体关系确定每个主题类型的实体属性;
a3.根据所述实体属性,为每个类型的主题创建主题结构树,以及为所有的主题类型创建主题森林式知识库。
5.根据权利要求4所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤a1中,对原始语料进行主题聚类,是利用LDA主题模型工具进行主题提取和主题分类。
6.根据权利要求4所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤a2中,对每个主题类型进行实体关系的识别和提取,是通过对原始语料进行语法解析和语义解析,根据解析结果提取实体信息和标注实体信息之间的关系。
7.根据权利要求4所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤a3中,所述主题结构树包括当前主题信息和主题间关联信息,根据所述主题间关联信息将所有类型的主题进行关联索引,得到主题森林式知识库。
8.根据权利要求3所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤c中,是通过对访客问题进行分词处理和关键词提取,根据提取的关键词进行匹配其所属的主题类型,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中。
9.根据权利要求8所述的一种基于语义框架的人机对话方法,其特征在于:所述的步骤d中,是通过将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性,并将提取的关键词与所述必要属性和可选属性进行匹配,根据匹配结果判断是否缺失必要属性。
10.一种基于语义框架的人机对话系统,其特征在于,包括:
主题结构树创建模块,其根据原始语料创建主题森林结构树,并在所述主题森林结构树中提取每个主题类型对应的实体属性;
语义框架模型生成模块,其利用所述主题森林结构树生成语义框架模型,并将所述主题森林结构树的实体属性映射至所述语义框架模型中对应的语义槽;
人机对话模块,用于对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的语义槽中;
问题匹配模块,用于将填充后的语义框架模型的语义槽的访客问题映射至所述主题森林结构树的实体属性中,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;
答案反馈模块,用于将匹配的问题所对应的答案反馈给访客;
其中,所述实体属性包括必要属性和可选属性,所述语义槽包括必要语义槽和可选语义槽;人机对话时,对访客问题进行主题类型的匹配,并将访客问题填充至所述主题类型对应的语义框架模型中的必要语义槽和/或可选语义槽中;并将填充后的语义框架模型的必要语义槽和可选语义槽的访客问题映射至所述主题森林结构树的必要属性和可选属性;再进一步根据映射后的主题森林结构树进行判断所述必要属性是否完整;当所述访客问题的必要属性完整时,所述主题森林结构树根据所述访客问题从知识库中进行问题匹配;
当所述访客问题的必要属性不完整时,所述主题森林结构树将缺失的必要属性反馈至前端的对话机器人,由所述对话机器人根据缺失的必要属性向访客进行追问,得到所述主题类型的所有必要属性。
CN201810399238.4A 2018-04-28 2018-04-28 基于语义框架的人机对话方法及系统 Active CN108932278B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810399238.4A CN108932278B (zh) 2018-04-28 2018-04-28 基于语义框架的人机对话方法及系统
PCT/CN2018/124937 WO2019205705A1 (zh) 2018-04-28 2018-12-28 基于语义框架的人机对话方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810399238.4A CN108932278B (zh) 2018-04-28 2018-04-28 基于语义框架的人机对话方法及系统

Publications (2)

Publication Number Publication Date
CN108932278A CN108932278A (zh) 2018-12-04
CN108932278B true CN108932278B (zh) 2021-05-18

Family

ID=64448446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810399238.4A Active CN108932278B (zh) 2018-04-28 2018-04-28 基于语义框架的人机对话方法及系统

Country Status (2)

Country Link
CN (1) CN108932278B (zh)
WO (1) WO2019205705A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932278B (zh) * 2018-04-28 2021-05-18 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统
CN109885835B (zh) * 2019-02-19 2023-06-27 广东小天才科技有限公司 一种获取用户语料中词语之间的关联关系的方法和系统
CN111858864A (zh) * 2019-04-30 2020-10-30 北京京东尚科信息技术有限公司 实现填槽的方法、装置、电子设备及可读介质
CN110138986B (zh) * 2019-04-30 2021-01-22 五竹科技(北京)有限公司 与外呼流程相关的知识图谱的构建方法、装置及存储介质
CN110427470B (zh) * 2019-07-25 2024-05-28 腾讯科技(深圳)有限公司 问答处理方法、装置及电子设备
CN111414764A (zh) * 2020-03-18 2020-07-14 苏州思必驰信息科技有限公司 对话文本的技能领域确定方法及系统
CN113326702B (zh) * 2021-06-11 2024-02-20 北京猎户星空科技有限公司 语义识别方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414310A (zh) * 2008-10-17 2009-04-22 山西大学 一种自然语言搜索的方法和装置
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN105788593A (zh) * 2016-02-29 2016-07-20 中国科学院声学研究所 生成对话策略的方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103000052A (zh) * 2011-09-16 2013-03-27 上海先先信息科技有限公司 人机互动的口语对话系统及其实现方法
US10783159B2 (en) * 2014-12-18 2020-09-22 Nuance Communications, Inc. Question answering with entailment analysis
CN104573028B (zh) * 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN105513593B (zh) * 2015-11-24 2019-09-17 南京师范大学 一种语音驱动的智能人机交互方法
CN105701253B (zh) * 2016-03-04 2019-03-26 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN105868313B (zh) * 2016-03-25 2019-02-12 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
CN105931638B (zh) * 2016-04-26 2019-12-24 北京光年无限科技有限公司 面向智能机器人的对话系统数据处理方法及装置
CN106653019B (zh) * 2016-12-07 2019-11-15 华南理工大学 一种基于用户注册信息的人机对话控制方法及系统
CN107729493A (zh) * 2017-09-29 2018-02-23 北京创鑫旅程网络技术有限公司 旅行知识图谱的构建方法、装置及旅行问答方法、装置
CN108932278B (zh) * 2018-04-28 2021-05-18 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414310A (zh) * 2008-10-17 2009-04-22 山西大学 一种自然语言搜索的方法和装置
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN105788593A (zh) * 2016-02-29 2016-07-20 中国科学院声学研究所 生成对话策略的方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于主题森林结构的对话管理模型;邬晓钧 等;《自动化学报》;20030331;第29卷(第2期);第277-281页 *
服务机器人多通道人机交互感知反馈工作机制及关键技术;赵其杰;《中国博士学位论文全文数据库》;20070115(第1期);第74-75页 *
邬晓钧 等.基于主题森林结构的对话管理模型.《自动化学报》.2003,第29卷(第2期),第277-281页. *

Also Published As

Publication number Publication date
WO2019205705A1 (zh) 2019-10-31
CN108932278A (zh) 2018-12-04

Similar Documents

Publication Publication Date Title
CN108932278B (zh) 基于语义框架的人机对话方法及系统
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN103678564B (zh) 一种基于数据挖掘的互联网产品调研系统
Ferrández et al. The QALL-ME framework: A specifiable-domain multilingual question answering architecture
Brewster et al. User-centred ontology learning for knowledge management
CN109657068B (zh) 面向智慧博物馆的文物知识图谱生成与可视化方法
CN102262634B (zh) 一种自动问答方法及系统
CN107832229A (zh) 一种基于nlp的系统测试用例自动生成方法
CN109960786A (zh) 基于融合策略的中文词语相似度计算方法
CN104503998A (zh) 针对用户查询句的类型识别方法及装置
CN113157860B (zh) 一种基于小规模数据的电力设备检修知识图谱构建方法
CN103886020A (zh) 一种房地产信息快速搜索方法
CN110929007A (zh) 一种电力营销知识体系平台及应用方法
Crane et al. ePhilology: When the Books Talk to Their Readers1
CN107480197B (zh) 实体词识别方法及装置
CN112115252A (zh) 智能辅助写作处理方法、装置、电子设备及存储介质
CN116070599A (zh) 智能化题库生成及辅助管理系统
Nguyen et al. A vietnamese question answering system
CN116341569A (zh) 基于领域知识库的专业文档智能辅助阅读方法
Lecoeuche Finding comparatively important concepts between texts
CN116304231A (zh) 基于语法解析树的查询语句生成方法和装置、设备、介质
Meštrovic Semantic matching using concept lattice
Srinivasan Chatbot application for tourism using natural language tool kit
Wang et al. Ontology-assisted deep Web source selection
Khankasikam Knowledge capture for Thai word segmentation by using CommonKADS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant