CN115422377A - 一种基于知识图谱的搜索系统 - Google Patents

一种基于知识图谱的搜索系统 Download PDF

Info

Publication number
CN115422377A
CN115422377A CN202211367866.7A CN202211367866A CN115422377A CN 115422377 A CN115422377 A CN 115422377A CN 202211367866 A CN202211367866 A CN 202211367866A CN 115422377 A CN115422377 A CN 115422377A
Authority
CN
China
Prior art keywords
mix
entity
value
entities
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211367866.7A
Other languages
English (en)
Other versions
CN115422377B (zh
Inventor
张正义
刘宸
傅晓航
林方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yuchen Technology Co Ltd
Original Assignee
Zhongke Yuchen Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yuchen Technology Co Ltd filed Critical Zhongke Yuchen Technology Co Ltd
Priority to CN202211367866.7A priority Critical patent/CN115422377B/zh
Publication of CN115422377A publication Critical patent/CN115422377A/zh
Application granted granted Critical
Publication of CN115422377B publication Critical patent/CN115422377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/381Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using identifiers, e.g. barcodes, RFIDs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Abstract

本申请涉及电数字数据处理技术领域,特别是涉及一种基于知识图谱的搜索系统。该系统包括的存储器存储有知识图谱,其包括N个实体的信息;该系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现以下步骤:获取用户输入的实体EX;获取与EX匹配的实体的标签;如果LA≠∅,则输出标签包含LAk且不与EX匹配的实体;否则,获取与EX匹配的实体的属性名;如果PA≠∅,则获取与EX匹配的实体的PAb对应的属性值;遍历PA,如果PAb对应属性值均相同,则输出具有属性名PAb、PAb对应的属性值为VA1且不与EX匹配的实体。本发明实现了对与用户输入的多个实体属于同类的实体的搜索和输出。

Description

一种基于知识图谱的搜索系统
技术领域
本发明涉及电数字数据处理技术领域,特别是涉及一种基于知识图谱的搜索系统。
背景技术
当用户在用户界面上输入了多个检索词,并且想要搜索与输入的多个检索词属于同类的其他词时,现有的搜索系统为搜索包含所有检索词或者部分检索词的文本,并输出该文本,再由用户根据看到的文本判断哪些词与这些检索词属于同类。现有的搜索系统并不能在用户界面上直接显示与用户输入的多个检索词属于同类的词,用户体验感较差。如何获取与用户输入的多个检索词属于同类的其他词,是亟待解决的问题。
发明内容
本发明目的在于,提供一种基于知识图谱的搜索系统,实现了对与用户输入的多个实体属于同类的实体的搜索和输出,由此用户可直接获取与其输入的多个实体属于同类的实体,用户体验感好。
根据本发明,提供了一种基于知识图谱的搜索系统,包括存储器,所述存储器存储有知识图谱,所述知识图谱包括N个实体的信息{M1,M2,…,Mn,…,MN},Mn为第n个实体的信息,n的取值范围为1到N;Mn=(En,Ln,Pn,Vn),En为第n个实体,Ln为En的标签,Pn为En的属性名,Vn为Pn对应的属性值;Ln=(Ln1,Ln2,…,Lni,…,LnI),Lni为En的第i个标签,i的取值范围为1到I,I为En的标签数量;Pn=(Pn1,Pn2,…,Pnj,…,PnJ),Pnj为En的第j个属性名,j的取值范围为1到J,J为En的属性名数量;Vn=(Vn1,Vn2,…,Vnj,…,VnJ),Vnj为Pnj对应的属性值。
所述系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现以下步骤:
S100,获取用户输入的实体EX=(EX1,EX2,…,EXq,…,EXQ),EXq为用户输入的第q个实体,q的取值范围为1到Q,Q为用户输入的实体数量,Q≥2。
S200,获取所述知识图谱中与EX匹配的实体的标签(LX1,LX2,…,LXq,…,LXQ),其中,LXq为所述知识图谱中与EXq匹配的实体的标签。
S300,如果LX1∩LX2∩…∩LXQ=LA≠∅,LA={LA1,LA2,…,LAk,…,LAK},则输出所述知识图谱中标签包含LAk且不与EX匹配的实体;LAk为EX1,EX2,…,EXQ共有的第k个标签,k的取值为1到K,K为EX1,EX2,…,EXQ共有的标签数量;如果LX1∩LX2∩…∩LXQ=LA=∅,则进入S400。
S400,获取所述知识图谱中与EX匹配的实体的属性名(PX1,PX2,…,PXq,…,PXQ),其中,PXq为所述知识图谱中与EXq匹配的实体的属性名。
S500,如果PX1∩PX2∩…∩PXQ=PA≠∅,PA={PA1,PA2,…,PAb,…,PAB},则获取所述知识图谱中与EX匹配的实体的PAb对应的属性值{VAb1,VAb2,…,VAbq,…,VAbQ},VAbq为所述知识图谱中与EXq匹配的实体的PAb对应的属性值;PAb为EX1,EX2,…,EXQ共有的第b个属性名,b的取值为1到B,B为EX1,EX2,…,EXQ共有的属性名数量。
S600,遍历PA,如果VAb1=VAb2=…=VAbQ,则输出所述知识图谱中具有属性名PAb、PAb对应的属性值为VAb1且不与EX匹配的实体。
本发明与现有技术相比具有明显的有益效果,借由上述技术方案,本发明提供的基于知识图谱的搜索系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
本发明存储器存储的知识图谱包括各实体的标签、属性名和属性值信息,基于该知识图谱,本发明可以获取用户输入的这些实体之间具有哪些共性,比如具有相同的标签或者是具有相同的属性名和属性值,并可基于获取的共性输出知识图谱中其他也具有该共性的实体。本发明基于存储器存储的特定的知识图谱实现了对与用户输入的多个实体属于同类的实体的搜索和输出,由此用户可直接获取与其输入的多个实体属于同类的实体,用户体验感好。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于知识图谱的搜索系统的搜索方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明,提供了一种基于知识图谱的搜索系统,包括存储器,所述存储器存储有知识图谱,所述知识图谱包括N个实体的信息{M1,M2,…,Mn,…,MN},Mn为第n个实体的信息,n的取值范围为1到N;Mn=(En,Ln,Pn,Vn),En为第n个实体,Ln为En的标签,Pn为En的属性名,Vn为Pn对应的属性值;Ln=(Ln1,Ln2,…,Lni,…,LnI),Lni为En的第i个标签,i的取值范围为1到I,I为En的标签数量;Pn=(Pn1,Pn2,…,Pnj,…,PnJ),Pnj为En的第j个属性名,j的取值范围为1到J,J为En的属性名数量;Vn=(Vn1,Vn2,…,Vnj,…,VnJ),Vnj为Pnj对应的属性值。
根据本发明,搜索系统的存储器中预先存储有知识图谱,该知识图谱包括实体以及与实体的标签、属性名和属性值。本发明中各实体对应的标签可能不唯一,不同的实体之间既可能不具有相同标签,也可能具有相同的标签且相同标签的数量大于等于1。例如,知识图谱包括实体E1、E2和E3,E1的标签L1=(L11,L12,L13),E2的标签L2=(L21,L22,L23,L24),E3的标签L3=(L31),其中L11=L21,L13=L24,L31≠L11,L31≠L12,L31≠L13,L31≠L22,L31≠L23,这说明E1和E2均具有相同的标签L11(也即L21)和L13(也即L24),E1和E2均不与E3存在相同的标签。例如,城市C1实体和城市C2实体均具有直辖市和一线城市的标签,但是城市C3实体具有一线城市的标签,却不具有直辖市的标签,城市C4实体既不具有一线城市的标签,也不具有直辖市的标签。
本发明中各实体对应的属性名可能不唯一,不同的实体之间既可能不具有相同属性名,也可能具有相同的属性名但相同属性名对应的属性值却不同。例如,知识图谱包括实体E4、E5和E6,E4的属性名P4=(P41,P42),E4的属性值V4=(V41,V42),E5的属性名P5=(P51),E5的属性值V5=(V51),E6的属性名P6=(P61,P62,P63),E6的属性值V6=(V61,V62,V63),其中P41=P51=P63,V41≠V51=V63,这说明E4、E5和E6均具有相同的属性名,但是只有E5和E6具有的相同的属性名对应的属性值相同,E4虽然和E5、E6具有的相同的属性名,但E4的该相同的属性名对应的属性值却不与E5、E6的该相同的属性名对应的属性值相同。例如,知识图谱中飞机实体和小鸟实体均具有飞行高度的属性名,但是飞机实体的飞行高度的属性名对应的属性值(即飞机的飞行高度值)却不等于小鸟实体的飞行高度的属性名对应的属性值(即小鸟的飞行高度值)。
应当理解的是,本发明的知识图谱包括的实体数量很大,S100中用户输入的实体均能够在知识图谱中匹配到实体。若出现用户输入的实体不能够在知识图谱中匹配的情况,可以在用户界面上指示错误或指示无法匹配。
本发明的所述系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现搜索方法。该搜索方法如图1所示,包括以下步骤:
S100,获取用户输入的实体EX=(EX1,EX2,…,EXq,…,EXQ),EXq为用户输入的第q个实体,q的取值范围为1到Q,Q为用户输入的实体数量,Q≥2。
可选的,用户在用户界面上进行搜索,该用户界面是专用于找同类实体的界面;当用户在该专用的用户界面上完成输入多个实体的操作后,即可获取EX。可通过在用户界面上设置用于指示开始搜索的按钮的方式来判断用户在用户界面上是否完成输入,可以理解的是,用户输入的检索词即实体,当用户在用户界面上完成输入之后会点选上述指示开始搜索的按钮。
S200,获取所述知识图谱中与EX匹配的实体的标签(LX1,LX2,…,LXq,…,LXQ),其中,LXq为所述知识图谱中与EXq匹配的实体的标签。
可以理解的是,知识图谱中与EXq匹配的实体即知识图谱中的EXq。例如,用户输入的EXq为篮球实体,那么知识图谱中的篮球实体即是与用户输入的EXq匹配的实体;如果知识图谱中的篮球实体对应的标签为运动和球体,那么LXq为运动和球体的集合。
S300,如果LX1∩LX2∩…∩LXQ=LA≠∅,LA={LA1,LA2,…,LAk,…,LAK},则输出所述知识图谱中标签包含LAk且不与EX匹配的实体;LAk为EX1,EX2,…,EXQ共有的第k个标签,k的取值为1到K,K为EX1,EX2,…,EXQ共有的标签数量;如果LX1∩LX2∩…∩LXQ=LA=∅,则进入S400。
根据本发明,LXq包括的标签数量可能大于等于1。由此,LX1、LX2、…、LXQ可能不存在共有的标签,也可能存在共有的标签,而且共有的标签的数量可能大于等于1。当LX1∩LX2∩…∩LXQ=LA≠∅(空集)时,说明LX1、LX2、…、LXQ存在共有的标签,此时可将知识图谱中也具有上述共有的标签的其他实体(即不与EX匹配的实体)作为输出显示在用户界面上。
优选的,当LX1、LX2、…、LXQ共有的标签的数量为1时,在用户界面上显示知识图谱中也具有该唯一共有的标签的其他实体;而当LX1、LX2、…、LXQ共有的标签的数量为2时,将知识图谱中具有不同共有的标签的其他实体分类显示在用户界面上。例如,城市C1实体和城市C2实体均具有直辖市和2022年一线城市的标签,那么在用户界面上将知识图谱中具有直辖市标签的其他实体作为第一类别进行显示,将知识图谱中具有直辖市标签的其他实体作为第二类别进行显示。
优选的,输出所述知识图谱中标签包含LAk且不与EX匹配的实体的同时还输出包括LAk的第一文本,由此,用户即可看出输出的这些实体与输入的实体具有哪些共性(具有某一共性即说明可在某一方面被视为同类)。例如,在用户界面上将知识图谱中具有直辖市标签的其他实体作为第一类别进行显示的同时,还在用户界面上显示这些实体均为直辖市。
S400,获取所述知识图谱中与EX匹配的实体的属性名(PX1,PX2,…,PXq,…,PXQ),其中,PXq为所述知识图谱中与EXq匹配的实体的属性名。
当LX1∩LX2∩…∩LXQ=LA=∅时,说明LX1、LX2、…、LXQ不存在共有的标签,不能基于对应的标签来找出用户输入的实体的共性。但是,EX1、EX2、…、EXQ还可能存在另外的共性,比如相同的属性名和相同的属性值。因此,本发明在LX1∩LX2∩…∩LXQ=LA=∅的情况下获取了PX1,PX2,…,PXQ
S500,如果PX1∩PX2∩…∩PXQ=PA≠∅,PA={PA1,PA2,…,PAb,…,PAB},则获取所述知识图谱中与EX匹配的实体的PAb对应的属性值{VAb1,VAb2,…,VAbq,…,VAbQ},VAbq为所述知识图谱中与EXq匹配的实体的PAb对应的属性值;PAb为EX1,EX2,…,EXQ共有的第b个属性名,b的取值为1到B,B为EX1,EX2,…,EXQ共有的属性名数量。
根据本发明,相同属性名对应的属性值也可能不同,例如,珠穆拉玛峰实体的高度的属性名对应的属性值为8844.43,泰山实体的高度的属性名对应的属性值为1545。因此,本发明在PX1、PX2、…、PXQ存在共有的属性名的情况下,还获取知识图谱中与EX匹配的实体的这些共有的属性名对应的属性值。
根据本发明,如果PX1∩PX2∩…∩PXQ=PA=∅,则输出指示没有相同标签和属性名的第二文本。由此,用户可以在用户界面上得到EX1,EX2,…,EXQ之间不存在相同的标签和属性名的结论。
S600,遍历PA,如果VAb1=VAb2=…=VAbQ,则输出所述知识图谱中具有属性名PAb、PAb对应的属性值为VAb1且不与EX匹配的实体。
根据本发明,当两实体的相同的属性名对应的属性值也相同时,这两实体具有共性。例如,汉字日实体的笔画数的属性名的对应的属性值为4,汉字月实体的笔画数的属性名对应的属性为4。那么汉字日实体和汉字月实体的共性为:笔画数为4,可以输出知识图谱中具有笔画数属性名且笔画数属性名对应的属性值为4的其他实体,如汉字中。
根据本发明,当两实体具有相同的属性名时,两实体的相同的属性名对应的属性值也可能不同。例如汉字土实体的笔画数的属性名对应的属性值为3,应当理解的是,汉字土虽然也具有与汉字日、月相同的笔画数的属性名,但是汉字土不与实体日、月具有笔画数为4的共性。
可选的,如果不满足VAb1=VAb2=…=VAbQ,则输出所述知识图谱中属性名为PAb且不与EX匹配的实体。该情况主要是考虑上述例子中虽然汉字土不与实体日、月具有笔画数为4的共性,但是汉字土实体与汉字日实体、汉字月实体均具有笔画数的属性,可以判定它们均是汉字,也是一个共性。再比如,飞机实体和小鸟实体均具有飞行高度的属性名,虽然它们对应的飞行高度的属性名对应的属性值不同,但是它们都具有飞行高度的属性,可以判定它们均可以飞行,也是一个共性。
作为本发明的第一实施例,优选的,如果S300中LX1∩LX2∩…∩LXQ=LA≠∅,还进入S701。
S701,获取所述知识图谱中不与EX匹配的实体的标签与LA的交集{mix1,mix2,…,mixe,…,mixE},mixe为所述知识图谱中不与EX匹配的第e个实体的标签与LA的交集,e的取值范围为1到E,E=N-Q。
应当理解的是,当知识图谱中不与EX匹配的第e个实体的标签与LA不存在交集时,mixe=∅,mixe包括的标签数量为0;当知识图谱中不与EX匹配的第e个实体的标签与LA存在交集时,mixe≠∅,mixe包括的标签数量大于等于1。
S702,按照mixe包括的标签数量由大到小的顺序对{mix1,mix2,…,mixe,…,mixE}进行重新排列,得到{mix’1,mix’2,…,mix’e,…,mix’E},mix’e为重新排列后的第e个元素。
应当理解的是,重新排列后得到的{mix’1,mix’2,…,mix’e,…,mix’E}中的第1个元素mix’1包括的标签数量最大,重新排列后得到的{mix’1,mix’2,…,mix’e,…,mix’E}中的任一元素包括的标签数量大于等于其后元素包括的标签数量。
S703,获取{mix’1,mix’2,…,mix’e,…,mix’E}中与重新排列后的mix’1具有相同标签数量的元素数量T。
S704,输出{mix’1,mix’2,…,mix’T}对应的实体,并指示{mix’1,mix’2,…,mix’T}对应的实体为与EX具有最多相同标签数量的实体。
根据本发明,如果K≥2,那么知识图谱中可能存在同时具有LA中所有标签的其他实体,也可能存在只具有LA中部分标签的其他实体,而本发明在用户界面上显示的与{mix’1,mix’2,…,mix’T}对应的实体为与EX具有最多相同标签数量的实体,用户可以快速知晓哪些实体是与其输入的实体具有最多共性的其他实体。
作为本发明的第二实施例,优选的,如果S300中LX1∩LX2∩…∩LXQ=LA≠∅,还进入S711。
S711,获取所述知识图谱中不与EX匹配的实体的标签与LA的交集,如果交集为∅,则设置知识图谱中不与EX匹配的实体的第一匹配度为第一预设值;如果交集不为∅,则设置知识图谱中不与EX匹配的实体的第一匹配度为第二预设值,第二预设值大于第一预设值,第一预设值大于等于0。
根据本发明,如果知识图谱中不与EX匹配的实体的标签与LA不存在交集,那么其对应的第一匹配度的值(即第一预设值)较小;如果知识图谱中不与EX匹配的实体的标签与LA存在交集,那么其对应的第一匹配度的值(即第二预设值)较大。
优选的,第一预设值为0。
S712,如果PX1∩PX2∩…∩PXQ=PA≠∅,则获取所述知识图谱中不与EX匹配的实体的属性名与PA的交集,如果交集为∅,则设置知识图谱中不与EX匹配的实体的第二匹配度为第三预设值;如果交集不为∅,则设置知识图谱中不与EX匹配的实体的第二匹配度为第四预设值,第四预设值大于第三预设值,第三预设值大于等于0。
根据本发明,如果知识图谱中不与EX匹配的实体的属性名与PA不存在交集,那么其对应的第二匹配度的值(即第三预设值)较小;如果知识图谱中不与EX匹配的实体的属性名与PA存在交集,那么其对应的第二匹配度的值(即第四预设值)较大。
优选的,第三预设值为0。
S713,获取所述知识图谱中不与EX匹配的实体的目标总值,所述目标总值为对应实体的第一目标值与第二目标值之和,第一目标值为第一匹配度与第一权重之积,第二目标值为第二匹配度与第二权重之积。
根据本发明,第一目标值越大,目标总值越大;第二目标值越大,目标总值越大。第一权重与第二权重均为大于0的预设值,且第一权重与第二权重之和为1。
优选的,第一权重大于第二权重。由此,S414输出的结果会更多的参考标签的因素。
S714,输出目标总值为最大目标总值的实体。
根据本发明,最大目标总值的实体对应的第一目标值和第二目标值均较高,相应的,与用户输入的实体具有相同的标签和相同的属性名的概率越大,与用户输入的实体具有的共性越多。由此,用户可以在用户界面上看到与其输入的实体具有最多共性的实体。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明的范围由所附权利要求来限定。

Claims (8)

1.一种基于知识图谱的搜索系统,其特征在于,包括存储器,所述存储器存储有知识图谱,所述知识图谱包括N个实体的信息{M1,M2,…,Mn,…,MN},Mn为第n个实体的信息,n的取值范围为1到N;Mn=(En,Ln,Pn,Vn),En为第n个实体,Ln为En的标签,Pn为En的属性名,Vn为Pn对应的属性值;Ln=(Ln1,Ln2,…,Lni,…,LnI),Lni为En的第i个标签,i的取值范围为1到I,I为En的标签数量;Pn=(Pn1,Pn2,…,Pnj,…,PnJ),Pnj为En的第j个属性名,j的取值范围为1到J,J为En的属性名数量;Vn=(Vn1,Vn2,…,Vnj,…,VnJ),Vnj为Pnj对应的属性值;
所述系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现以下步骤:
S100,获取用户输入的实体EX=(EX1,EX2,…,EXq,…,EXQ),EXq为用户输入的第q个实体,q的取值范围为1到Q,Q为用户输入的实体数量,Q≥2;
S200,获取所述知识图谱中与EX匹配的实体的标签(LX1,LX2,…,LXq,…,LXQ),其中,LXq为所述知识图谱中与EXq匹配的实体的标签;
S300,如果LX1∩LX2∩…∩LXQ=LA≠∅,LA={LA1,LA2,…,LAk,…,LAK},则输出所述知识图谱中标签包含LAk且不与EX匹配的实体;LAk为EX1,EX2,…,EXQ共有的第k个标签,k的取值为1到K,K为EX1,EX2,…,EXQ共有的标签数量;如果LX1∩LX2∩…∩LXQ=LA=∅,则进入S400;
S400,获取所述知识图谱中与EX匹配的实体的属性名(PX1,PX2,…,PXq,…,PXQ),其中,PXq为所述知识图谱中与EXq匹配的实体的属性名;
S500,如果PX1∩PX2∩…∩PXQ=PA≠∅,PA={PA1,PA2,…,PAb,…,PAB},则获取所述知识图谱中与EX匹配的实体的PAb对应的属性值{VAb1,VAb2,…,VAbq,…,VAbQ},VAbq为所述知识图谱中与EXq匹配的实体的PAb对应的属性值;PAb为EX1,EX2,…,EXQ共有的第b个属性名,b的取值为1到B,B为EX1,EX2,…,EXQ共有的属性名数量;
S600,遍历PA,如果VAb1=VAb2=…=VAbQ,则输出所述知识图谱中具有属性名PAb、PAb对应的属性值为VAb1且不与EX匹配的实体。
2.根据权利要求1所述的系统,其特征在于,S600中,如果不满足VAb1=VAb2=…=VAbQ,则输出所述知识图谱中属性名为PAb且不与EX匹配的实体。
3.根据权利要求1所述的系统,其特征在于,S300中,如果LX1∩LX2∩…∩LXQ=LA≠∅,则还输出包括LAk的第一文本。
4.根据权利要求1所述的系统,其特征在于,S500中,如果PX1∩PX2∩…∩PXQ=PA=∅,则输出指示没有相同标签和属性名的第二文本。
5.根据权利要求1所述的系统,其特征在于,如果S300中LX1∩LX2∩…∩LXQ=LA≠∅,还进入S701;
S701,获取所述知识图谱中不与EX匹配的实体的标签与LA的交集{mix1,mix2,…,mixe,…,mixE},mixe为所述知识图谱中不与EX匹配的第e个实体的标签与LA的交集,e的取值范围为1到E,E=N-Q;
S702,按照mixe包括的标签数量由大到小的顺序对{mix1,mix2,…,mixe,…,mixE}进行重新排列,得到{mix’1,mix’2,…,mix’e,…,mix’E},mix’e为重新排列后的第e个元素;
S703,获取{mix’1,mix’2,…,mix’e,…,mix’E}中与重新排列后的mix’1具有相同标签数量的元素数量T;
S704,输出{mix’1,mix’2,…,mix’T}对应的实体,并指示{mix’1,mix’2,…,mix’T}对应的实体为与EX具有最多相同标签数量的实体。
6.根据权利要求1所述的系统,其特征在于,如果S300中LX1∩LX2∩…∩LXQ=LA≠∅,还进入S711;
S711,获取所述知识图谱中不与EX匹配的实体的标签与LA的交集,如果交集为∅,则设置知识图谱中不与EX匹配的实体的第一匹配度为第一预设值;如果交集不为∅,则设置知识图谱中不与EX匹配的实体的第一匹配度为第二预设值,第二预设值大于第一预设值,第一预设值大于等于0;
S712,如果PX1∩PX2∩…∩PXQ=PA≠∅,则获取所述知识图谱中不与EX匹配的实体的属性名与PA的交集,如果交集为∅,则设置知识图谱中不与EX匹配的实体的第二匹配度为第三预设值;如果交集不为∅,则设置知识图谱中不与EX匹配的实体的第二匹配度为第四预设值,第四预设值大于第三预设值,第三预设值大于等于0;
S713,获取所述知识图谱中不与EX匹配的实体的目标总值,所述目标总值为对应实体的第一目标值与第二目标值之和,第一目标值为第一匹配度与第一权重之积,第二目标值为第二匹配度与第二权重之积;
S714,输出目标总值为最大目标总值的实体。
7.根据权利要求6所述的系统,其特征在于,第一权重大于第二权重,第二权重大于0,第一权重与第二权重之和为1。
8.根据权利要求7所述的系统,其特征在于,第一预设值=第三预设值=0。
CN202211367866.7A 2022-11-03 2022-11-03 一种基于知识图谱的搜索系统 Active CN115422377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211367866.7A CN115422377B (zh) 2022-11-03 2022-11-03 一种基于知识图谱的搜索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211367866.7A CN115422377B (zh) 2022-11-03 2022-11-03 一种基于知识图谱的搜索系统

Publications (2)

Publication Number Publication Date
CN115422377A true CN115422377A (zh) 2022-12-02
CN115422377B CN115422377B (zh) 2022-12-27

Family

ID=84207619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211367866.7A Active CN115422377B (zh) 2022-11-03 2022-11-03 一种基于知识图谱的搜索系统

Country Status (1)

Country Link
CN (1) CN115422377B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280089A1 (en) * 2013-03-15 2014-09-18 Google Inc. Providing search results using augmented search queries
CN108268582A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 信息查询方法及装置
CN111222918A (zh) * 2020-01-04 2020-06-02 厦门二五八网络科技集团股份有限公司 关键词挖掘方法、装置、电子设备及存储介质
CN112699667A (zh) * 2020-12-29 2021-04-23 京东数字科技控股股份有限公司 一种实体相似度确定方法、装置、设备和存储介质
CN114201587A (zh) * 2022-02-18 2022-03-18 广州极天信息技术股份有限公司 一种基于本体的搜索意图表达方法及系统
US20220253477A1 (en) * 2021-02-08 2022-08-11 Adobe Inc. Knowledge-derived search suggestion

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280089A1 (en) * 2013-03-15 2014-09-18 Google Inc. Providing search results using augmented search queries
CN108268582A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 信息查询方法及装置
CN111222918A (zh) * 2020-01-04 2020-06-02 厦门二五八网络科技集团股份有限公司 关键词挖掘方法、装置、电子设备及存储介质
CN112699667A (zh) * 2020-12-29 2021-04-23 京东数字科技控股股份有限公司 一种实体相似度确定方法、装置、设备和存储介质
US20220253477A1 (en) * 2021-02-08 2022-08-11 Adobe Inc. Knowledge-derived search suggestion
CN114201587A (zh) * 2022-02-18 2022-03-18 广州极天信息技术股份有限公司 一种基于本体的搜索意图表达方法及系统

Also Published As

Publication number Publication date
CN115422377B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
AU2007229567B2 (en) Method and system for selecting answers in an answer set using a customizable table
CN112347214B (zh) 目标区域划分方法、装置、电子设备及存储介质
US20150066933A1 (en) Computer-implemented methods and systems for generating visual representations of complex and voluminous marketing and sales and other data
CN113342821A (zh) 报表配置方法、装置、设备及计算机存储介质
WO2009002952A1 (en) System and method for grouping and visualizing data
CN105518658A (zh) 用于将数据记录分组的设备、系统以及方法
WO2015103407A2 (en) Geographic information system for researching, identifying and comparing locations for economic development
CN105531706A (zh) 用于信息检索系统的搜索引擎
CN112667877A (zh) 一种基于旅游知识图谱的景点推荐方法及设备
US20160070751A1 (en) Database management system
US9959268B2 (en) Semantic modeling of geographic information in business intelligence
CN112330510A (zh) 一种志愿推荐方法、装置、服务器及计算机可读存储介质
CN106605222A (zh) 有指导的数据探索
CN102175255A (zh) 地图目标的自动优先化
CN112231452A (zh) 基于自然语言处理的问答方法、装置、设备及存储介质
US20050193003A1 (en) Method and system for processing spatially-referred information such as cartographic information, applications and apparatus implementing said method
CN112231317B (zh) 数据的查询方法、装置、电子装置和存储介质
US10614136B2 (en) Method and system for managing primary field-specific entity records required by user
CN115422377B (zh) 一种基于知识图谱的搜索系统
CN110990639B (zh) 一种教育信息化水平趋势分析的数据处理方法及装置
CN111930897B (zh) 专利检索方法、装置、电子设备及计算机可读存储介质
CN109255081B (zh) 一种基于云平台的门户业务导航方法及系统
CN112527847A (zh) 数据排序方法、装置、电子介质及存储介质
JP6954965B2 (ja) 分析装置及び分析方法
CN112966013B (zh) 知识展示方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant