CN104750795B - 一种智能语义检索系统和方法 - Google Patents

一种智能语义检索系统和方法 Download PDF

Info

Publication number
CN104750795B
CN104750795B CN201510109472.5A CN201510109472A CN104750795B CN 104750795 B CN104750795 B CN 104750795B CN 201510109472 A CN201510109472 A CN 201510109472A CN 104750795 B CN104750795 B CN 104750795B
Authority
CN
China
Prior art keywords
result
knowledge
mapping
module
property value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510109472.5A
Other languages
English (en)
Other versions
CN104750795A (zh
Inventor
魏文轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201510109472.5A priority Critical patent/CN104750795B/zh
Publication of CN104750795A publication Critical patent/CN104750795A/zh
Application granted granted Critical
Publication of CN104750795B publication Critical patent/CN104750795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种智能语义检索系统和方法,系统包括知识库、知识管理模块、规则生成模块、信息抽取模块、验证模块、意图生成模块和对话模块;知识库存储知识图谱,知识管理模块加载并管理知识图谱;规则生成模块根据知识图谱中商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则;信息抽取模块匹配抽取规则与用户输入的自然语言,生成结构化知识;验证模块将知识图谱与结构化知识进行比对并生成验证结果;意图生成模块检测验证结果中的商品属性的取值是否有歧义;对话模块根据有歧义的验证结果生成并输出提示语句。本发明能够更加智能化的理解用户输入的检索语句,检索结果具有更高准确率。

Description

一种智能语义检索系统和方法
技术领域
本发明涉及通信技术领域,特别涉及一种智能语义检索系统和方法。
背景技术
现有技术的电子商务领域中,电子商务网站提供给用户的商品检索的方式多为关键词检索,其类似于百度或GOOGLE等检索引擎的检索模式。这种基于关键词的检索模式虽然能最大限度满足对检索结果的召回率,但是准确率却不高。用户在使用这种检索模式进行检索时,为了找到想要查询的商品,不得不一次次更换关键词,或者是采用人工从浏览的方式从大量的检索结果中查找想要的商品。因此,这种检索方式增加了用户操作的复杂度,降低了用户的检索体验。尽管大多数电商网站和购物平台对提供的检索引擎都会提供排序的优化,但是由于用户输入的多样性,很难解析出用户真正的语义意图,识别出用户检索商品的关键信息。
目前商品检索类方法基本采取基于关键词的检索方式,某些面向商品的语义检索引擎也只是针对输入端作了部分优化,通过将自然语言输入采取分词等方式,及相应信息抽取技术,抽取出相应关键词,然后利用语法分析引擎对分词结果进行理解和过滤,最后将获得的商品相关的关键词提交检索查询器,最终返回查询结果。但是这类商品语义检索的解决方案,仅限于对输入语句进行浅层的语义分析,通常只是利用了分词结果,及去除无关联的停用词来抽取相关商品的关键信息或者基于统计处理某些高频词核心词的抽取。但这种方式并没有结合句子本事的语义表征及某些概念的背景信息分析输入语句,因此对于某些语音输入的过长语句或者说某些输入的带有歧义的语句不能进行很好的处理。例如,用户输入自然语言:“我要买个抱枕作为生日礼物送给爸爸”,传统方式很难准确把握这句话的意图。再例如,用户输入自然语言“4G的ASUS平板电脑”,现有的检索工具不能很好的把握商品属性值—4G是网络制式、硬盘大小、内存大小中哪个商品属性的属性值。
发明内容
本发明所要解决的技术问题是提供一种更加智能化的理解用户输入的检索语句,检索结果具有更高准确率的智能语义检索系统和方法。
本发明解决上述技术问题的技术方案如下:一种智能语义检索系统,包括知识库、知识管理模块、规则生成模块、信息抽取模块、验证模块、意图生成模块和对话模块;
所述知识库,用于存储知识图谱,所述知识图谱包括商品的属性及其属性值以及商品属性值之间的映射关系;
所述知识管理模块,用于加载知识图谱,并通过增、改、删、查的方式对所述知识图谱进行管理;
所述规则生成模块,用于根据知识图谱中商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则;
所述信息抽取模块,用于获取用户输入的自然语言,将抽取规则与用户输入的自然语言进行匹配,生成结构化知识;
所述验证模块,用于调取知识图谱,将知识图谱与结构化知识进行比对,根据比对结果生成验证结果;
所述意图生成模块,用于检测验证结果中的商品属性的取值是否有歧义,如果是,则将验证结果发送至对话模块,如果否,则根据验证结果生成商品列表,作为最终检索结果并输出;
所述对话模块,用于根据有歧义的验证结果生成提示语句,并输出提示语句,提示语句用于提示用户重新输入自然语言。
本发明的有益效果是:一方面,本发明的语义检索系统能够更加智能化的理解用户输入的检索语句,检索结果具有更高准确率。另一方面,当系统对用于输入的检索词理解有歧义时,系统根据用户个人历史数据矫正检索结果,对于自我矫正后仍有歧义的检索结果,系统根据有歧义的检索结果生成提示语句,提示用户重新输入检索词,这样避免了用户在不知自己检索词哪里出问题的情况下一次次输入不合适的检索词,提高了检索效率。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,一种智能语义检索系统,还包括个性化历史记录库,所述个性化历史记录库,用于存储个性化历史记录,所述个性化历史记录为个体用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录;
所述验证模块,还调取个性化历史记录,将个性化历史记录与结构化知识进行比对,根据比对结果生成验证结果。
进一步,一种智能语义检索系统,所述知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
进一步,一种智能语义检索系统,所述验证模块包括第一消歧单元和第二消歧单元;
所述第一消歧单元,用于调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结果为一致,则将第一次比对后的结构化知识发送给第二消歧单元;如果比对结果为不一致,则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果作为验证结果并输出;
所述第二消歧单元,用于调取个性化历史记录,将所述个性化历史记录与第一次比对的结构化知识进行第二次比对;如果第二次比对结果为一致,则将第二次比对后的结构化知识作为验证结果并输出;如果第二次比对结果不一致,则将其进行第二次消歧处理后作为验证结果并输出。
进一步,一种智能语义检索系统,所述意图生成模块包括交叉检测单元和映射检测单元;
所述交叉检测处理单元,用于根据用户输入的自然语言中文字的字符定位判断验证结果是否有交叉,如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果判定验证结果无交叉,则将所述验证结果发送至映射检测单元;
所述映射检测单元,用于检测验证结果中的商品属性的取值是否映射正确,如果是,则根据验证结果生成商品列表,作为最终检索结果并输出;如果否,则将验证结果发送至对话模块。
一种智能语义检索方法,包括以下步骤:
步骤1:从知识库中加载知识图谱,所述知识图谱包括商品的属性及其属性值以及商品属性值之间的映射关系;
步骤2:从加载完成的知识图谱中提取商品属性值,根据商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则;
步骤3:获取用户输入的自然语言,将抽取规则与用户输入的自然语言进行匹配,生成结构化知识;
步骤4:调取知识图谱,将知识图谱与结构化知识进行比对,根据比对结果生成验证结果;
步骤5:检测验证结果中的商品属性的取值是否有歧义,如果是,则执行步骤6;如果否,则根据验证结果生成商品列表,作为最终检索结果并输出,结束检索流程;
步骤6:根据有歧义的验证结果生成提示语句,并输出提示语句;
步骤7:再次获取用户重新输入的自然语言,并执行步骤3。
进一步,一种智能语义检索方法,步骤3还包括调取个性化历史记录,将个性化历史记录与结构化知识进行比对,根据比对结果生成验证结果;所述个性化历史记录为个体用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录。
进一步,一种智能语义检索方法,所述步骤1还包括:在知识库中预先存储知识图谱;所述知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
进一步,一种智能语义检索方法,所述步骤4具体为:
步骤41:调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结果为一致,则执行步骤42;如果比对结果为不一致,则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果作为验证结果并输出,执行步骤5;
步骤42:调取个性化历史记录,将所述个性化历史记录与第一次比对后的结构化知识进行第二次比对,如果第二次比对结果为一致,则将第二次比对后的结构化知识作为验证结果并输出,执行步骤5;如果第二次比对结果不一致,则将其进行第二次消歧处理后作为验证结果并输出,执行步骤5。
进一步,一种智能语义检索方法,所述步骤5具体为:
步骤51:根据用户输入的自然语言中文字的字符定位判断验证结果是否有交叉,如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果判定验证结果无交叉,则将所述验证结果发送至映射检测单元;
步骤52:检测验证结果中的商品属性的取值是否映射正确,如果是,则根据验证结果生成商品列表,作为最终检索结果并输出;如果否,则执行步骤6。
附图说明
图1为本发明智能语义检索系统整体模块关系示意图;
图2为本发明验证模块内部单元关系示意图;
图3为本发明意图生产模块内部单元关系示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明针对用户输入的自然语言,首先会结合用户的检索习惯,以及商品概念本身的约束性,筛选出商品和符合商品最合理的筛选条件。
如图1所示,基于电子商务的智能语义检索系统,包括知识库、知识管理模块、规则生成模块、信息抽取模块、验证模块、意图生成模块和对话模块;
知识库存储知识图谱,知识图谱包括商品的属性及其属性值以及商品属性值之间的映射关系;知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
基础配置表存储根据电子商务网站的约束规则生成的商品属性及其属性值列表,不同的电子商务网站的约束规则不同,其生成的商品属性及其属性值列表也不同。
例如:京东商城中,类目属性为平板电脑的商品中,具有品牌、屏幕尺寸、价格、颜色、网络制式、操作系统等商品属性及其属性值列表。
规则配置表用于存储不同商品属性的属性值之间的映射关系,当用户输入的自然语言中出现的商品属性匹配词不能和基础配置表内存储的商品属性直接映射时,根据规则配置表中不同商品属性的属性值之间的映射关系,对用户输入的自然语言中的商品属性匹配词进行更换。
例如:品牌属性值——苹果,其对应的型号属性值{iPad,iPad2,The new iPad,iPad 4,iPad Mini,iPad Mini 2,iPad Air,iPad mini 3,iPad Air2};当用户输入的自然语言中的商品属性不能和基础配置表内存储的商品属性直接映射时,例如用户在京东商城网站上输入自然语言为:iPad Mini 2黑色的手机,由于iPad Mini 2是商品的型号属性,该商品属性并未出现在京东商城的基础配置表中的商品属性列表中,这时,将型号属性—iPad Mini2在规则配置表中进行查询,得到商品型号属性与商品品牌属性的映射关系:型号属性—iPad Mini 2属于品牌属性—苹果,根据这一映射关系将用户输入的自然语言中的匹配词“iPad Mini 2”更换为“苹果”。
知识管理模块加载知识图谱,并通过增、改、删、查的方式对知识图谱进行管理。
规则生成模块从知识管理模块中完成加载的知识图谱中提取商品属性值,根据商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则。
情况一:仅仅根据商品属性值生成生成抽取规则;
例如:根据京东商城的基础配置表中的商品属性值,生成抽取规则:从基础配置表中的商品的属性列表中读取%内的取值。
品牌抽取规则:%品牌属性值列表%
屏幕尺寸抽取规则:%数字%尺寸%
价格抽取规则:%价格属性值列表%
颜色抽取规则:%颜色属性值列表%
网络制式抽取规则:%网络制式属性值列表%
操作系统抽取规则:%操作系统属性值列表%。
根据抽取规则生成的商品属性值列表:
品牌属性值列表:{三星,华为,小米,苹果,魅族,中兴,联想}
屏幕尺寸属性值列表:{大小=[7,8,9,11],Unit=尺寸”}
价格属性值列表:{[0-199],[200-399],[400-799]}
颜色属性值列表:{红色,黄色,白色,黑色,金色,银色}
网络制式属性值列表:{电信3G,移动3G,联通4G,电信4G}
操作系统属性值列表:{IOS,Andorid,WindowsPhone}
情况二:根据商品属性值和商品属性值之间的映射关系生成抽取规则;
例如:当用户输入的自然语言为:“iPad Mini 2黑色的手机”,由于iPad Mini 2是商品的型号属性,该商品属性并未出现在京东商城的基础配置表中的商品属性列表中,这时,将型号属性—iPad Mini 2在规则配置表中进行查询,得到商品型号属性与商品品牌属性的映射关系:型号属性—iPad Mini 2属于品牌属性—苹果,从而得生成抽取规则为从品牌属性值列表中读取商品属性值—苹果。
信息抽取模块获取用户输入的自然语言,将根据抽取规则生成的商品属性值列表与用户输入的自然语言进行匹配,生成结构化知识;
例如:用户输入的自然语言为“我要买一台魅族三G手机”,将规则生成模块中根据抽取规则生成的商品属性值列表与自然语言“我要买一台魅族三G手机”进行一一匹配,得到结构化知识—{品牌:魅族,硬盘大小:3G,网络制式:3G,类目:手机,数量:1台}。
验证模块调取知识管理模块加载完成的知识图谱,将知识图谱与结构化知识进行比对,根据比对结果判断信息抽取模块抽取的结构化知识是否存在歧义;如果存在歧义,则进行消除歧义处理,并将消除歧义处理结果作为验证结果,发送给意图生成模块;如果不存在,则将比对后的结构化知识作为验证结果,发送给意图生成模块。
例如:当信息抽取模块抽取得到结构化知识为{品牌:魅族,硬盘大小:3G,网络制式:3G,类目:手机,数量:1台}时,验证模块调取知识管理模块加载完成的知识图谱中的基础配置表,将基础配置表中的商品属性及其属性值与结构化知识进行比对,发现,京东商城的基础配置表中不存在商品属性—硬盘大小和数量,同时,在规则配置表中没有硬盘大小这一商品属性与其他商品属性的映射关系,也没有数量这一商品属性与其他商品属性的映射关系,则进行消除歧义处理:删除结构化知识中的商品属性及其属性值{硬盘大小:3G,数量:1台},得到验证结果{品牌:魅族,网络制式:3G,类目:手机}。
意图生成模块对所述验证结果中的商品属性的取值进行检测,根据检测结果判断验证结果是否有歧义,如果是,则将验证结果发送至对话模块,如果否,则根据验证结果生成商品列表,作为最终检索结果并输出。
对话模块接收意图生成模块所发送的有歧义的验证结果,根据有歧义的验证结果生成提示语句,并输出提示语句,提示语句用于提示用户重新输入自然语言。信息抽取模块获取用户重新输入自然语言后进行第二轮交互。直到最终没有歧义后输出最终产品列表。
例如:当用户输入的自然语言“我要买一台魅族3G手机”时,验证结果为:{品牌:魅族3,储存卡大小:3G,类目:手机},将该验证结果与用户输入的自然语言“我要买一台魅族3G手机”进行比对,发现仍然有歧义,并得出歧义类型为交叉歧义,即“魅族3”与“3G”有交叉,将其发送至对话模块,对话模块接收有歧义的验证结果,并根据歧义类型,生成相应的提示语句,例如:请确认您是否想要一个品牌为魅族3,存储卡大小为3G的手机?
如图2所示,基于电子商务的智能语义检索系统还包括个性化历史记录库,个性化历史记录库,用于存储个性化历史记录,个性化历史记录为个体用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录;验证模块包括第一消歧单元和第二消歧单元;
第一消歧单元调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结果为一致(比对一致可能为两个原因:一是结构化知识没有歧义,二是结构化知识有歧义却没有比对出来),则将第一次比对后的结构化知识发送给第二消歧单元;如果比对结果为不一致(说明存在歧义),则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果作为验证结果并输出给意图生成模块;
第一次消歧处理为:删除掉在结构化知识中出现并且在知识图谱的基础配置表中没有出现的商品属性及其属性值。
第二消歧单元调取个性化历史记录,将个性化历史记录与第一次比对的结构化知识进行第二次比对;如果第二次比对结果为一致(说明不存在歧义),则将第二次比对后的结构化知识作为验证结果并输出给意图生成模块;如果第二次比对结果不一致(说明存在歧义),则对第二次比对后的结构化知识进行第二次消歧,并将第二次消歧处理后的结果作为验证结果并输出给意图生成模块。
第二次消歧处理为:删除掉在结构化知识中出现并且在个性化历史记录中概率较低的商品属性及其属性值。
在验证模块中,当将知识图谱与结构化知识进行比对,比对结果为一致时,由于造成比对一致可能为两个原因:一是结构化知识没有歧义,二是结构化知识有歧义却没有比对出来,因此仅仅通过知识图谱还很难判断结构化知识是否有歧义,这时则需要调取个性化历史记录,将个性化历史记录与结构化知识进行比对,从而判定结构化知识有无歧义。
例如用户输入的自然语言为“4G的华为手机”,得到的结构化知识为{品牌:华为,网络制式:3G,硬盘大小=4G,类目:手机},由于知识图谱中基础配置表中的商品属性及其属性值同时包括以下两个合法的商品属性——网络制式属性和硬盘大小属性。所以借助知识图谱无法判断哪个商品属性值信息合法。
此时,第二消歧单元调取个性化历史记录,根据个性化历史记录统计比较“4G”作为“网络制式”与“手机”共现的概率和作为“硬盘大小”与“手机”的共现概率,将概率低的商品属性值从结构化知识中删除。
个性化历史记录库可以存储在远程服务器中,当将知识图谱与结构化知识进行比对,比对结果为一致时,验证模块获取用户I D,通过用户ID向远程服务器发送请求,远程服务器接收到请求后,根据用户ID将该用户的个性化历史记录返回至验证模块。
如图3所示,意图生成模块包括交叉检测单元和映射检测单元。
交叉检测处理单元,用于根据用户输入的自然语言中文字的字符定位检测验证结果是否有交叉,如果验证结果有交叉,并根据用户输入的自然语言对有交叉的验证结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果验证结果无交叉,则将所述验证结果发送至映射检测单元;
例如,用户输入的自然语言为“我要买一台魅族3G手机”时,通过验证模块后,得到验证结果为:{品牌:魅族3,网络制式:3G,类目:手机},通过检测发现“魅族3”和“3G”有交叉。检测过程为:对用户输入的自然语言“我要买一台魅族3G手机”中的每个文字进行字符定位,魅族3的字符定位结果为自然语言的:6-8,3G的字符定位结果为自然语言的:8-9。6-8与8-9中,第6个文字“3”为重复占位,由此可知验证结果有交叉,判断有交叉后,交叉检测处理单元根据用户输入的自然语言对有交叉的验证结果进行修正,修正过程为:如上述例子所述,通过检测发现“魅族3”和“3G”有交叉后,通过与用户输入的自然语言“我要买一台魅族3G手机”进行比对,检测到交叉部分“3”划归到品牌属性值“魅族3”后,交叉部分“3”网络制式属性值中没有意义,因此,判定交叉部分“3”为网络制式属性值。将有交叉的验证结果{品牌:魅族3,网络制式:3G,类目:手机}修正为:{品牌:魅族,网络制式:3G,类目:手机}。
映射检测单元,用于检测验证结果中的商品属性的取值是否映射正确,如果是,则根据验证结果生成商品列表,作为最终检索结果并输出,如果否,则将验证结果发送至对话模块。
例如,用户输入的自然语言为“我要买一台魅族3G手机”时,通过验证模块后,得到验证结果为:{品牌:魅族,网络制式:3G,类目:手机},通过检测发现网络制式3G不明确是电信3G还是联通3G。由此可知验证结果中的商品属性的取值映射不正确,将验证结果发送给对话模块。
对话模块接收映射检测单元所发送的商品属性的取值映射不正确的验证结果,根据映射不正确的商品属性值生成提示语句,并输出提示语句,提示语句用于提示用户重新输入自然语言。
信息抽取模块获取用户重新输入自然语言后进行第二轮交互。直到最终没有歧义后输出最终产品列表。
本发明还提供一种智能语义检索方法,包括以下步骤:
步骤1:从知识库中加载知识图谱,所述知识图谱包括商品的属性及其属性值以及商品属性值之间的映射关系;
步骤2:从加载完成的知识图谱中提取商品属性值,根据商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则;
步骤3:获取用户输入的自然语言,将抽取规则与用户输入的自然语言进行匹配,生成结构化知识;
步骤4:调取知识图谱,将知识图谱与结构化知识进行比对,根据比对结果生成验证结果;
步骤5:对所述验证结果中的商品属性的取值进行检测,根据检测结果判断验证结果是否有歧义,如果是,则执行步骤6;如果否,则根据验证结果生成商品列表,作为最终检索结果并输出,结束检索流程;
步骤6:根据有歧义的验证结果生成提示语句,并输出提示语句;
步骤7:再次获取用户重新输入的自然语言,并执行步骤3。
其中,步骤3还包括调取个性化历史记录,将个性化历史记录与结构化知识进行比对,根据比对结果生成验证结果;所述个性化历史记录为个体用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录。
其中,步骤1还包括:在知识库中预先存储知识图谱;所述知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
步骤4具体为:
步骤41:调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结果为一致,则执行步骤42;如果比对结果为不一致,则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果作为验证结果并输出,执行步骤5;
步骤42:调取个性化历史记录,将所述个性化历史记录与第一次比对后的结构化知识进行第二次比对,如果第二次比对结果为一致,则将第二次比对后的结构化知识作为验证结果并输出,执行步骤5;如果第二次比对结果不一致,则将其进行第二次消歧处理后作为验证结果并输出,执行步骤5。
步骤5具体为:
步骤51:根据用户输入的自然语言中文字的字符定位判断验证结果是否有交叉,如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果判定验证结果无交叉,则将所述验证结果发送至映射检测单元;
步骤52:检测验证结果中的商品属性的取值是否映射正确,如果是,则根据验证结果生成商品列表,作为最终检索结果并输出;如果否,则执行步骤6。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种智能语义检索系统,其特征在于,包括知识库、知识管理模块、规则生成模块、信息抽取模块、验证模块、意图生成模块和对话模块;
所述知识库,用于存储知识图谱,所述知识图谱包括商品的属性及其属性值以及商品属性值之间的映射关系;
所述知识管理模块,用于加载知识图谱,并通过增、改、删、查的方式对所述知识图谱进行管理;
所述规则生成模块,用于根据知识图谱中商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则;
所述信息抽取模块,用于获取用户输入的自然语言,将抽取规则与用户输入的自然语言进行匹配,生成结构化知识;
所述验证模块,用于调取知识图谱,将知识图谱与结构化知识进行比对,根据比对结果生成验证结果;
所述意图生成模块,用于检测验证结果中的商品属性的取值是否有歧义,如果是,则将验证结果发送至对话模块,如果否,则根据验证结果生成商品列表,作为最终检索结果并输出;
所述对话模块,用于根据有歧义的验证结果生成提示语句,并输出提示语句,提示语句用于提示用户重新输入自然语言。
2.根据权利要求1所述一种智能语义检索系统,其特征在于,还包括个性化历史记录库,所述个性化历史记录库,用于存储个性化历史记录,所述个性化历史记录为个体用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录;
所述验证模块,还调取个性化历史记录,将个性化历史记录与结构化知识进行比对,根据比对结果生成验证结果。
3.根据权利要求1所述一种智能语义检索系统,其特征在于,所述知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
4.根据权利要求2所述一种智能语义检索系统,其特征在于,所述验证模块包括第一消歧单元和第二消歧单元;
所述第一消歧单元,用于调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结果为一致,则将第一次比对后的结构化知识发送给第二消歧单元;如果比对结果为不一致,则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果作为验证结果并输出;
所述第二消歧单元,用于调取个性化历史记录,将所述个性化历史记录与第一次比对的结构化知识进行第二次比对;如果第二次比对结果为一致,则将第二次比对后的结构化知识作为验证结果并输出;如果第二次比对结果不一致,则将其进行第二次消歧处理后作为验证结果并输出。
5.根据权利要求1所述一种智能语义检索系统,其特征在于,所述意图生成模块包括交叉检测单元和映射检测单元;
所述交叉检测单元,用于根据用户输入的自然语言中文字的字符定位判断验证结果是否有交叉,如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果判定验证结果无交叉,则将所述验证结果发送至映射检测单元;
所述映射检测单元,用于检测验证结果中的商品属性的取值是否映射正确,如果是,则根据验证结果生成商品列表,作为最终检索结果并输出;如果否,则将验证结果发送至对话模块。
6.一种智能语义检索方法,其特征在于,包括以下步骤:
步骤1:从知识库中加载知识图谱,所述知识图谱包括商品的属性及其属性值以及商品属性值之间的映射关系;
步骤2:从加载完成的知识图谱中提取商品属性值,根据商品属性值或商品属性值和商品属性值之间的映射关系生成抽取规则;
步骤3:获取用户输入的自然语言,将抽取规则与用户输入的自然语言进行匹配,生成结构化知识;
步骤4:调取知识图谱,将知识图谱与结构化知识进行比对,根据比对结果生成验证结果;
步骤5:检测验证结果中的商品属性的取值是否有歧义,如果是,则执行步骤6;如果否,则根据验证结果生成商品列表,作为最终检索结果并输出,结束检索流程;
步骤6:根据有歧义的验证结果生成提示语句,并输出提示语句;
步骤7:再次获取用户重新输入的自然语言,并执行步骤3。
7.根据权利要求6所述一种智能语义检索方法,其特征在于,步骤4还包括调取个性化历史记录,将个性化历史记录与结构化知识进行比对,根据比对结果生成验证结果;所述个性化历史记录为个体用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录。
8.根据权利要求6所述一种智能语义检索方法,其特征在于,所述步骤1还包括:在知识库中预先存储知识图谱;所述知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
9.根据权利要求7所述一种智能语义检索方法,其特征在于,所述步骤4具体为:
步骤41:调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结果为一致,则执行步骤42;如果比对结果为不一致,则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果作为验证结果并输出,执行步骤5;
步骤42:调取个性化历史记录,将所述个性化历史记录与第一次比对后的结构化知识进行第二次比对,如果第二次比对结果为一致,则将第二次比对后的结构化知识作为验证结果并输出,执行步骤5;如果第二次比对结果不一致,则将其进行第二次消歧处理后作为验证结果并输出,执行步骤5。
10.根据权利要求6所述一种智能语义检索方法,其特征在于,所述步骤5具体为:
步骤51:根据用户输入的自然语言中文字的字符定位判断验证结果是否有交叉,如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果判定验证结果无交叉,则将所述验证结果发送至映射检测单元;
步骤52:检测验证结果中的商品属性的取值是否映射正确,如果是,则根据验证结果生成商品列表,作为最终检索结果并输出;如果否,则执行步骤6。
CN201510109472.5A 2015-03-12 2015-03-12 一种智能语义检索系统和方法 Active CN104750795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510109472.5A CN104750795B (zh) 2015-03-12 2015-03-12 一种智能语义检索系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510109472.5A CN104750795B (zh) 2015-03-12 2015-03-12 一种智能语义检索系统和方法

Publications (2)

Publication Number Publication Date
CN104750795A CN104750795A (zh) 2015-07-01
CN104750795B true CN104750795B (zh) 2017-09-01

Family

ID=53590479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510109472.5A Active CN104750795B (zh) 2015-03-12 2015-03-12 一种智能语义检索系统和方法

Country Status (1)

Country Link
CN (1) CN104750795B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574089B (zh) * 2015-12-10 2020-08-28 百度在线网络技术(北京)有限公司 知识图谱的生成方法及装置、对象对比方法及装置
CN106484904A (zh) * 2016-10-21 2017-03-08 长沙市麓智信息科技有限公司 专利检索分析系统及其分析方法
CN108121722A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 知识库的构建方法及装置
CN107038261B (zh) * 2017-05-28 2019-09-20 海南大学 一种基于数据图谱、信息图谱和知识图谱的处理架构资源可动态抽象的语义建模方法
CN109033063B (zh) * 2017-06-09 2022-02-25 微软技术许可有限责任公司 基于知识图谱的机器推理方法、电子设备及计算机可读存储介质
CN107391682B (zh) * 2017-07-24 2020-06-09 京东方科技集团股份有限公司 知识验证方法、知识验证设备以及存储介质
CN107748754B (zh) * 2017-09-15 2021-10-26 广州唯品会研究院有限公司 一种知识图谱完善方法和装置
CN108491443B (zh) * 2018-02-13 2021-05-25 上海好体信息科技有限公司 由计算机实施的与用户对话的方法和计算机系统
CN108549662B (zh) * 2018-03-16 2021-08-06 云知声智能科技股份有限公司 多轮会话中语义解析结果的补充消解方法及装置
CN108920497B (zh) * 2018-05-23 2021-10-15 北京奇艺世纪科技有限公司 一种人机交互方法及装置
CN108876527A (zh) * 2018-06-06 2018-11-23 北京京东尚科信息技术有限公司 服务方法和服务装置、应用开放平台和存储介质
CN109063772B (zh) * 2018-08-02 2022-05-10 广东工业大学 一种基于深度学习的图像个性化语义分析方法、装置及设备
CN111104490B (zh) * 2018-10-25 2023-06-06 阿里巴巴集团控股有限公司 参数的删除方法及装置
CN109522551B (zh) * 2018-11-09 2024-02-20 天津新开心生活科技有限公司 实体链接方法、装置、存储介质及电子设备
CN109657238B (zh) * 2018-12-10 2023-10-13 宁波深擎信息科技有限公司 基于知识图谱的上下文识别补全方法、系统、终端及介质
CN110377758A (zh) * 2019-07-17 2019-10-25 江南大学 一种基于知识图谱的招投标网页信息解析方法
CN111159381B (zh) * 2019-12-31 2023-05-26 中国银行股份有限公司 数据搜索方法及装置
CN111353314A (zh) * 2020-02-28 2020-06-30 长沙千博信息技术有限公司 一种用于动漫生成的故事文本语义分析方法
CN111782781A (zh) * 2020-05-29 2020-10-16 平安科技(深圳)有限公司 一种语义分析方法、装置、计算机设备及存储介质
CN112199959B (zh) * 2020-10-15 2024-04-12 中国科学院自动化研究所 语义文化机器人系统
CN112860866B (zh) * 2021-02-09 2023-09-19 北京百度网讯科技有限公司 语义检索方法、装置、设备以及存储介质
CN113742487B (zh) * 2021-11-01 2022-03-29 北京值得买科技股份有限公司 一种商品自动化匹配方法
CN114936252B (zh) * 2022-04-24 2023-01-31 贵州财经大学 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375823A (zh) * 2010-08-13 2012-03-14 腾讯科技(深圳)有限公司 搜索结果聚合显示方法及系统
CN102402581A (zh) * 2010-10-02 2012-04-04 微软公司 基于评估状态影响用户体验
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法
CN102968495A (zh) * 2012-11-29 2013-03-13 河海大学 搜索对比关联购物信息的垂直搜索引擎及方法
CN103218719A (zh) * 2012-01-19 2013-07-24 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
CN103631948A (zh) * 2013-12-11 2014-03-12 北京京东尚科信息技术有限公司 命名实体的识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0322871D0 (en) * 2003-09-30 2003-10-29 British Telecomm A method of operating a computer network

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375823A (zh) * 2010-08-13 2012-03-14 腾讯科技(深圳)有限公司 搜索结果聚合显示方法及系统
CN102402581A (zh) * 2010-10-02 2012-04-04 微软公司 基于评估状态影响用户体验
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法
CN103218719A (zh) * 2012-01-19 2013-07-24 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
CN102968495A (zh) * 2012-11-29 2013-03-13 河海大学 搜索对比关联购物信息的垂直搜索引擎及方法
CN103631948A (zh) * 2013-12-11 2014-03-12 北京京东尚科信息技术有限公司 命名实体的识别方法

Also Published As

Publication number Publication date
CN104750795A (zh) 2015-07-01

Similar Documents

Publication Publication Date Title
CN104750795B (zh) 一种智能语义检索系统和方法
US10180967B2 (en) Performing application searches
CN102866990B (zh) 一种主题对话方法和装置
CN109670163B (zh) 信息识别方法、信息推荐方法、模板构建方法及计算设备
CN104166651B (zh) 基于对同类数据对象整合的数据搜索的方法和装置
US10235720B2 (en) Merchant identification and expense item classification from a mobile device capture of an event receipt
US8296309B2 (en) System and method for high precision and high recall relevancy searching
CN109522465A (zh) 基于知识图谱的语义搜索方法及装置
CN103457975B (zh) 获取地图兴趣点评价数据的方法和装置
CN110069610A (zh) 基于Solr的检索方法、装置、设备和存储介质
CN101477563B (zh) 一种短文本聚类的方法、系统及其数据处理装置
CN103313248A (zh) 一种识别垃圾信息的方法和装置
CN110008306A (zh) 一种数据关系分析方法、装置及数据服务系统
CN110458296B (zh) 目标事件的标记方法和装置、存储介质及电子装置
JP2022073981A (ja) ソースコード取得
US20130290138A1 (en) Search Method, Apparatus and Server for Online Trading Platform
CN103778122A (zh) 搜索方法和系统
CN110209659A (zh) 一种简历过滤方法、系统和计算机可读存储介质
CN105989125B (zh) 对无结果词进行标签识别的搜索方法和系统
CN108306878A (zh) 钓鱼网站检测方法、装置、计算机设备和存储介质
CN112148701A (zh) 一种文件检索的方法及设备
KR101683138B1 (ko) 정보검색장치 및 그 동작 방법
CN102915313B (zh) 网络搜索中的纠错关系生成方法及系统
CN107092665A (zh) 一种数据检索系统及检索方法
CN110532359A (zh) 法律条文查询方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100191, Beijing, Huayuan Road, Haidian District No. 2 peony technology building, block A, 5

Patentee after: Yunzhisheng Intelligent Technology Co., Ltd.

Address before: 100191, Beijing, Huayuan Road, Haidian District No. 2 peony technology building, block A, 5

Patentee before: Beijing Yunzhisheng Information Technology Co., Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20200403

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Co-patentee after: Xiamen yunzhixin Intelligent Technology Co., Ltd

Patentee after: Yunzhisheng Intelligent Technology Co., Ltd.

Address before: 100191, Beijing, Huayuan Road, Haidian District No. 2 peony technology building, block A, 5

Patentee before: Yunzhisheng Intelligent Technology Co., Ltd.

TR01 Transfer of patent right