CN109359178A - 一种检索方法、装置、存储介质及设备 - Google Patents
一种检索方法、装置、存储介质及设备 Download PDFInfo
- Publication number
- CN109359178A CN109359178A CN201811071465.0A CN201811071465A CN109359178A CN 109359178 A CN109359178 A CN 109359178A CN 201811071465 A CN201811071465 A CN 201811071465A CN 109359178 A CN109359178 A CN 109359178A
- Authority
- CN
- China
- Prior art keywords
- resource file
- retrieval
- entity
- similarity
- clicked
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013507 mapping Methods 0.000 claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims 1
- 206010022000 influenza Diseases 0.000 description 6
- 230000008844 regulatory mechanism Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种检索方法、装置、存储介质及设备,包括:获取检索语句,并从检索语句中确定检索实体;获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合;将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合;按照相似度从大到小的顺序显示确定的资源文件集合。通过对检索实体进行语义扩展,进而不但显示包含检索实体的检索结果,还显示包括检索实体相近或相似的实体的检索结果,从而提高了检索的准确度。
Description
技术领域
本发明涉及检索领域,特别是涉及一种检索方法、装置、存储介质及设备。
背景技术
随着互联网的发展,人们可以方便地从互联网上获得需要的信息,搜索引擎也慢慢地成为人们从互联上搜索信息的一种常用手段。其中的搜索引擎通常提供一个页面,用户在页面输入搜索语句,提交给搜索引擎后,搜索引擎就返回给用户输入的内容相关的数据信息。
但是,发明人在使用搜索引擎的过程中,发现由于搜索引擎是基于关键词的搜索和匹配,因此,当输入的搜索语句中的关键词不够或者不准确的时候,容易出现搜索的内容和想要的完全不一样的问题。
发明内容
基于此,本发明的目的在于,提供一种检索方法,其具有提高检索准确度的优点。
一种检索方法,包括如下步骤:
获取检索语句,并从检索语句中确定检索实体;
获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合;
将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合;
按照相似度从大到小的顺序显示确定的资源文件集合。
通过对检索实体进行语义扩展,进而不但显示包含检索实体的检索结果,还显示包括检索实体相近或相似的实体的检索结果,从而提高了检索的准确度。
进一步地,所述按照相似度从大到小的顺序显示确定的资源文件集合之后,还包括步骤:
获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值;
在下次显示确定的资源文件集合时,将资源文件集合中被点击的资源文件的相似度加上对应的奖赏值后作为新的相似度,再按照从大到小的顺序显示确定的资源文件集合。
通过获取用户对点击资源文件的操作反馈,从而对资源文件的显示进行自动调节,实现了自动鼓励调整机制,提高了在一定时间内对于模糊检索的准确性和具有推理能力的检索结果,从而有效防止了在一定时间内用户一直在搜索同一种或相关的资源文件时,即使输入的检索语句存在一定可能性的错误或者为复杂难以识别的检索语句,仍然可以根据资源文件的点击操作进行调整,最终获得正确的检索结果。
进一步地,所述获取用户点击资源文件的操作,并对点击的资源文件中赋予相应的奖赏值的步骤,包括:
若用户点击资源文件后,在设定时间之后关闭了浏览器,则对该被点击的资源文件赋予第一奖赏值;
若用户点击资源文件后,在设定时间之后点击了另一资源文件,则对该被点击的资源文件赋予第二奖赏值;
若用户点击资源文件后,在设定时间之前点击了另一资源文件,则对该被点击的资源文件赋予第三奖赏值;
若用户点击的资源文件为最后的点击操作,则对该被点击的资源文件赋予第四奖赏值。
进一步地,所述获取检索语句,并从检索语句中确定检索主体的步骤,包括:
对检索语句进行分词处理,获得表征检索语句的分词集合;
去除分词集合中的停用词,获得处理后的分词集合;
对处理后的分词集合中的各词进行词性标注,并将标注为名词的词确定为检索实体。
通过去除停用词和词性标注,从而减少后续工作的工作量,获得可表征检索语句的检索实体。
进一步地,所述将与检索实体的语义相似度大于第一设定阈值的实体添加到检索实体中之前,还包括:
获取检索类别信息;
根据检索类别信息,仅获得检索类别所在的知识图谱分类中的所有实体与检索实体的语义相似度。
通过根据检索类别信息,仅获得在检索类别所在的知识图谱分类中的所有实体与检索实体语义相似度,进而提高了计算的复杂度,提高检索效率。
本发明还提供一种检索装置,包括:
检索实体获取模块,用于获取检索语句,并从检索语句中确定检索实体;
检索实体扩充模块,用于获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合;
资源文件集合获取模块,用于将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合;
显示模块,用于按照相似度从大到小的顺序显示确定的资源文件集合。
通过对检索实体进行语义扩展,进而不但显示包含检索实体的检索结果,还显示包括检索实体相近或相似的实体的检索结果,从而提高了检索的准确度。
进一步地,还包括:
奖赏值获取模块,用于获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值;其中,若用户点击资源文件后,在设定时间之后关闭了浏览器,则对该被点击的资源文件赋予第一奖赏值;若用户点击资源文件后,在设定时间之后点击了另一资源文件,则对该被点击的资源文件赋予第二奖赏值;若用户点击资源文件后,在设定时间之前点击了另一资源文件,则对该被点击的资源文件赋予第三奖赏值;若用户点击的资源文件为最后的点击操作,则对该被点击的资源文件赋予第四奖赏值;
相似度确定模块,用于在下次显示确定的资源文件集合时,将资源文件集合中被点击的资源文件的相似度加上对应的奖赏值后作为新的相似度,再按照从大到小的顺序显示确定的资源文件集合。
通过获取用户对点击资源文件的操作反馈,从而对资源文件的显示进行自动调节,实现了自动鼓励调整机制,提高了在一定时间内对于模糊检索的准确性和具有推理能力的检索结果,从而有效防止了在一定时间内用户一直在搜索同一种或相关的资源文件时,即使输入的检索语句存在一定可能性的错误或者为复杂难以识别的检索语句,仍然可以根据资源文件的点击操作进行调整,最终获得正确的检索结果。
本发明还提供一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任一所述的检索方法的步骤。
本发明还提供一种计算机设备,包括储存器、处理器以及储存在所述储存器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如如上述任一所述的检索方法的步骤。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明实施例中检索方法的流程图;
图2为本发明实施例中建立的知识图谱的各实体之间的语义相似度关系图。
具体实施方式
请参阅图1,其为本发明实施例中检索方法的流程图,所述检索方法,包括如下步骤:
步骤S1:获取检索语句,并从检索语句中确定检索实体。
其中,所述检索语句可以是一个字、一个词或一句话。所述检索实体为作为检索的关键字或关键词。
步骤S2:获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合。
请参阅图2,其为本发明实施例中建立的知识图谱的各实体之间的语义相似度关系图。其中,所述知识图谱采用维基百科提供的开放知识图谱DBpedia。DBpedia的数据存储采用的是RDF的格式,即为<subject,property,object>,或者为<实体,关系,属性>,可预先对DBpedia数据的关系属性设置相关的权重关系,即获取知识图谱的各实体之间的语义相似度关系。
在一个实施例中,所述第一设定阈值可为0.9,即将与检索实体的语义相似度大于0.9的实体添加到检索实体中。如当检索实体为“感冒”时,经过语义相似度的计算,获得与“感冒”的语义相似度大于第一设定阈值的实体包括“着凉”和“流感”,进而扩充的检索实体集合则为“感冒”、“着凉”和“流感”。
步骤S3:将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合。
在一个实施例中,所述词嵌入(word embedding)的方法将扩充的检索实体集中的各实体表示到空间向量中即向量化。
在一个实施例中,所述第二设定阈值为0.6,即将与扩充的检索实体集中的各词相似度大于0.6的所有资源文件作为确定的资源文件集合。
步骤S4:按照相似度从大到小的顺序显示确定的资源文件集合。
通过对检索实体进行语义扩展,进而不但显示包含检索实体的检索结果,还显示包括检索实体相近或相似的实体的检索结果,从而提高了检索的准确度。
在一个实施例中,在步骤S1中,所述获取检索语句,并从检索语句中确定检索主体的步骤,包括:
步骤S11:对检索语句进行分词处理,获得表征检索语句的分词集合。
在一个实施例中,采用结巴分词对检索语句进行分词处理。
步骤S12:去除分词集合中的停用词,获得处理后的分词集合。
在一个实施例中,通过使用哈工大停用词词库表去除停用词,以把分词集合出现次数多但是没有实际意义的词,如“啊”、“吧”等词去除掉,减少后续工作的工作量。
步骤S13:对处理后的分词集合中的各词进行词性标注,并将标注为名词的词确定为检索实体。
在一个实施例中,在步骤S2中,所述将与检索实体的语义相似度大于第一设定阈值的实体添加到检索实体中之前,还包括:
步骤S21:获取检索类别信息。
在一个实施例中,可在使用本发明的检索方法前,要求用户注册填写其关注领域信息,或者其专业信息,其中的关注领域信息或者专业信息即为类别信息,如计算机,医学类别等。
在另一个实施例中,用户在输入检索语句后,可选择填写检索类别信息,如计算机,医学类别等。
步骤S22:根据检索类别信息,仅获得检索类别所在的知识图谱分类中的所有实体与检索实体的语义相似度。
在一个实施例中,知识图谱如DBpedia提供了将各个实体分成多个种类后的实体数据集,根据检索类别信息,仅获得在检索类别所在的知识图谱分类中的所有实体与检索实体语义相似度,进而提高了计算的复杂度,提高了检索效率。例如当检索实体为“感冒”时,根据检索类别信息判断其为属于医学方面的分类,此时,则仅仅获得知识图谱分类中的医学类别中的所有实体与检索实体的语义相似度
在一个实施例中,在步骤S4中,所述按照相似度从大到小的顺序显示确定的资源文件集合之后,还包括步骤:
步骤S41:获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值。
步骤S42:在下次显示确定的资源文件集合时,将资源文件集合中被点击的资源文件的相似度加上对应的奖赏值后作为新的相似度,再按照从大到小的顺序显示确定的资源文件集合。
在一个实施例中,所述获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值的步骤,包括:
若用户点击资源文件后,在设定时间之后关闭了浏览器,则对该被点击的资源文件赋予第一奖赏值;若用户点击资源文件后,在设定时间之后点击了另一资源文件,则对该被点击的资源文件赋予第二奖赏值;若用户点击资源文件后,在设定时间之前点击了另一资源文件,则对该被点击的资源文件赋予第三奖赏值;若用户点击的资源文件为最后的点击操作,则对该被点击的资源文件赋予第四奖赏值。
通过获取用户对点击资源文件的操作反馈,从而对资源文件的显示进行自动调节,实现了自动鼓励调整机制,提高了在一定时间内对于模糊检索的准确性和具有推理能力的检索结果,从而有效防止了在一定时间内用户一直在搜索同一种或相关的资源文件时,即使输入的检索语句存在一定可能性的错误或者为复杂难以识别的检索语句,仍然可以根据资源文件的点击操作进行调整,最终获得正确的检索结果。
其中,所述设定时间为0.2s。所述第一奖赏值、第二奖赏值和第四奖赏值均大于0,所述第三奖赏值小于0,且所述第一奖赏值>第四奖赏值>第二奖赏值,所述第一奖赏值、第二奖赏值、第三奖赏值和第四奖赏值依序为:0.3、0.1、-0.1和0.2。具体的,若用户点击了资源文件,在0.2秒之后关闭了浏览器,则证明用户对该资源文件结果非常满意,因此,在下次显示确定的资源文件集合时,将该被点击的资源文件的相似度加上0.3的奖赏值后作为该资源文件的新的相似度。若用户点击了资源文件,在0.2s之后点击了另一资源文件,则证明这个资源文件对用户来说是有用的,但是并未完成最终的检索结果,因此,在下次显示确定的资源文件集合时,将该被点击的资源文件的相似度加上0.1的奖赏值后作为该资源文件的新的相似度。若用户点击了资源文件,在0.2s之前点击了另一资源文件,则证明这个资源文件对用户来说是没有帮助的,则在下次显示确定的资源文件集合时,将该被点击的资源文件的相似度加上-0.1的奖赏值后作为该资源文件的新的相似度。若用户点击的资源文件为最后的点击操作,则说明这个检索文件解决了用户所要检索的问题,因此,在下次显示确定的资源文件集合时,将该被点击的资源文件的相似度加上0.2的奖赏值后作为该资源文件的新的相似度。
在一个实施例中,所述分类器采用基于卷积神经网络的文本分类器(Text-Convolutional Neural Networks,简称“Text-CNN”分类器),通过将资源文件和分类词分别进行标记,并采用词嵌入的方式分别进行向量化,然后使用Text-CNN的模型进行训练,从而获得所述分类器,进而使得资源文件与分类词之间能有良好的分类效果,以使资源文件与检索主体之间也有很好的分类效果。
本发明的检索方法可以运用在以教育资源中的课件资源或作业资源等的检索,如当教师在教育资源所在的网站上布置了作业或者发布了相关的课件时,学生可以通过本发明的上述检索方法对这些资源文件进行搜索。
通过对检索实体进行语义扩展,进而不但显示包含检索实体的检索结果,还显示包括检索实体相近或相似的实体的检索结果,从而提高了检索的准确度。进一步地,通过获取用户对点击资源文件的操作反馈,从而对资源文件的显示进行自动调节,实现了自动鼓励调整机制,提高了在一定时间内对于模糊检索的准确性和具有推理能力的检索结果,从而有效防止了在一定时间内用户一直在搜索同一种或相关的资源文件时,即使输入的检索语句存在一定可能性的错误或者为复杂难以识别的检索语句,仍然可以根据资源文件的点击操作进行调整,最终获得正确的检索结果。
本发明还提供一种检索装置,包括:
检索实体获取模块,用于获取检索语句,并从检索语句中确定检索实体;
检索实体扩充模块,用于获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合;
资源文件集合获取模块,用于将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合;
显示模块,用于按照相似度从大到小的顺序显示确定的资源文件集合
在一个实施例中,所述检索装置还包括:
奖赏值获取模块,用于获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值;其中,若用户点击资源文件后,在设定时间之后关闭了浏览器,则对该被点击的资源文件赋予第一奖赏值;若用户点击资源文件后,在设定时间之后点击了另一资源文件,则对该被点击的资源文件赋予第二奖赏值;若用户点击资源文件后,在设定时间之前点击了另一资源文件,则对该被点击的资源文件赋予第三奖赏值;若用户点击的资源文件为最后的点击操作,则对该被点击的资源文件赋予第四奖赏值;
相似度确定模块,用于在下次显示确定的资源文件集合时,将资源文件集合中被点击的资源文件的相似度加上对应的奖赏值后作为新的相似度,再按照从大到小的顺序显示确定的资源文件集合。
本发明还提供一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任一所述的检索方法的步骤。
本发明可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本发明还提供一种计算机设备,包括储存器、处理器以及储存在所述储存器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一所述的检索方法的步骤
通过对检索实体进行语义扩展,进而不但显示包含检索实体的检索结果,还显示包括检索实体相近或相似的实体的检索结果,从而提高了检索的准确度。进一步地,通过获取用户对点击资源文件的操作反馈,从而对资源文件的显示进行自动调节,实现了自动鼓励调整机制,提高了在一定时间内对于模糊检索的准确性和具有推理能力的检索结果,从而有效防止了在一定时间内用户一直在搜索同一种或相关的资源文件时,即使输入的检索语句存在一定可能性的错误或者为复杂难以识别的检索语句,仍然可以根据资源文件的点击操作进行调整,最终获得正确的检索结果。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (10)
1.一种检索方法,其特征在于,包括如下步骤:
获取检索语句,并从检索语句中确定检索实体;
获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合;
将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合;
按照相似度从大到小的顺序显示确定的资源文件集合。
2.根据权利要求1所述的检索方法,其特征在于,所述按照相似度从大到小的顺序显示确定的资源文件集合之后,还包括步骤:
获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值;
在下次显示确定的资源文件集合时,将资源文件集合中被点击的资源文件的相似度加上对应的奖赏值后作为新的相似度,再按照从大到小的顺序显示确定的资源文件集合。
3.根据权利要求2所述的检索方法,其特征在于,所述获取用户点击资源文件的操作,并对点击的资源文件中赋予相应的奖赏值的步骤,包括:
若用户点击资源文件后,在设定时间之后关闭了浏览器,则对该被点击的资源文件赋予第一奖赏值;
若用户点击资源文件后,在设定时间之后点击了另一资源文件,则对该被点击的资源文件赋予第二奖赏值;
若用户点击资源文件后,在设定时间之前点击了另一资源文件,则对该被点击的资源文件赋予第三奖赏值;
若用户点击的资源文件为最后的点击操作,则对该被点击的资源文件赋予第四奖赏值。
4.根据权利要求1所述的检索方法,其特征在于,所述获取检索语句,并从检索语句中确定检索主体的步骤,包括:
对检索语句进行分词处理,获得表征检索语句的分词集合;
去除分词集合中的停用词,获得处理后的分词集合;
对处理后的分词集合中的各词进行词性标注,并将标注为名词的词确定为检索实体。
5.根据权利要求1所述的检索方法,其特征在于,所述将与检索实体的语义相似度大于第一设定阈值的实体添加到检索实体中之前,还包括:
获取检索类别信息;
根据检索类别信息,仅获得检索类别所在的知识图谱分类中的所有实体与检索实体的语义相似度。
6.根据权利要求1所述的检索方法,其特征在于,所述分类器采用Text-CNN分类器。
7.一种检索装置,其特征在于,包括:
检索实体获取模块,用于获取检索语句,并从检索语句中确定检索实体;
检索实体扩充模块,用于获取知识图谱的各实体之间的语义相似度关系,并在知识图谱中获取与检索实体的语义相似度大于第一设定阈值的实体,获得扩充的检索实体集合;
资源文件集合获取模块,用于将扩充的检索实体集中的各实体向量化,并输入到分类器中,确定与扩充的检索实体集中的各词相似度大于第二设定阈值的资源文件集合;
显示模块,用于按照相似度从大到小的顺序显示确定的资源文件集合。
8.根据权利要求7所述的检索装置,其特征在于,还包括:
奖赏值获取模块,用于获取用户点击资源文件的操作,并对点击的资源文件赋予相应的奖赏值;其中,若用户点击资源文件后,在设定时间之后关闭了浏览器,则对该被点击的资源文件赋予第一奖赏值;若用户点击资源文件后,在设定时间之后点击了另一资源文件,则对该被点击的资源文件赋予第二奖赏值;若用户点击资源文件后,在设定时间之前点击了另一资源文件,则对该被点击的资源文件赋予第三奖赏值;若用户点击的资源文件为最后的点击操作,则对该被点击的资源文件赋予第四奖赏值;
相似度确定模块,用于在下次显示确定的资源文件集合时,将资源文件集合中被点击的资源文件的相似度加上对应的奖赏值后作为新的相似度,再按照从大到小的顺序显示确定的资源文件集合。
9.一种计算机可读存储介质,其上储存有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的检索方法的步骤。
10.一种计算机设备,其特征在于,包括储存器、处理器以及储存在所述储存器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的检索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811071465.0A CN109359178A (zh) | 2018-09-14 | 2018-09-14 | 一种检索方法、装置、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811071465.0A CN109359178A (zh) | 2018-09-14 | 2018-09-14 | 一种检索方法、装置、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109359178A true CN109359178A (zh) | 2019-02-19 |
Family
ID=65350706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811071465.0A Pending CN109359178A (zh) | 2018-09-14 | 2018-09-14 | 一种检索方法、装置、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359178A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110502613A (zh) * | 2019-08-12 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、智能检索方法、装置和存储介质 |
CN110688559A (zh) * | 2019-09-25 | 2020-01-14 | 中科鼎富(北京)科技发展有限公司 | 一种检索方法及装置 |
CN110781310A (zh) * | 2019-09-09 | 2020-02-11 | 深圳壹账通智能科技有限公司 | 目标概念图谱的构建方法、装置、计算机设备和存储介质 |
CN111177410A (zh) * | 2019-12-27 | 2020-05-19 | 浙江理工大学 | 基于进化R-tree的知识图谱存储和相似性检索方法 |
CN111782817A (zh) * | 2020-05-30 | 2020-10-16 | 国网福建省电力有限公司信息通信分公司 | 一种面向信息系统的知识图谱构建方法、装置及电子设备 |
CN112380352A (zh) * | 2020-10-28 | 2021-02-19 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 一种交互式检索方法、装置、计算机设备及存储介质 |
CN112597277A (zh) * | 2020-12-26 | 2021-04-02 | 中国农业银行股份有限公司 | 文档查询方法、装置、存储介质及电子设备 |
CN114491051A (zh) * | 2022-04-02 | 2022-05-13 | 四川省大数据中心 | 一种建筑用地项目审批系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102231165A (zh) * | 2011-07-11 | 2011-11-02 | 浙江大学 | 一种基于用户停留时间分析的个性化网页搜索排序方法 |
CN103440314A (zh) * | 2013-08-27 | 2013-12-11 | 北京工业大学 | 一种基于Ontology的语义检索方法 |
CN107247743A (zh) * | 2017-05-17 | 2017-10-13 | 安徽富驰信息技术有限公司 | 一种司法类案检索方法及系统 |
CN108038096A (zh) * | 2017-11-10 | 2018-05-15 | 平安科技(深圳)有限公司 | 知识库文档快速检索方法、应用服务器计算机可读存储介质 |
CN108052659A (zh) * | 2017-12-28 | 2018-05-18 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法、装置和电子设备 |
-
2018
- 2018-09-14 CN CN201811071465.0A patent/CN109359178A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102231165A (zh) * | 2011-07-11 | 2011-11-02 | 浙江大学 | 一种基于用户停留时间分析的个性化网页搜索排序方法 |
CN103440314A (zh) * | 2013-08-27 | 2013-12-11 | 北京工业大学 | 一种基于Ontology的语义检索方法 |
CN107247743A (zh) * | 2017-05-17 | 2017-10-13 | 安徽富驰信息技术有限公司 | 一种司法类案检索方法及系统 |
CN108038096A (zh) * | 2017-11-10 | 2018-05-15 | 平安科技(深圳)有限公司 | 知识库文档快速检索方法、应用服务器计算机可读存储介质 |
CN108052659A (zh) * | 2017-12-28 | 2018-05-18 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法、装置和电子设备 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110502613A (zh) * | 2019-08-12 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、智能检索方法、装置和存储介质 |
CN110502613B (zh) * | 2019-08-12 | 2022-03-08 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、智能检索方法、装置和存储介质 |
WO2021047327A1 (zh) * | 2019-09-09 | 2021-03-18 | 深圳壹账通智能科技有限公司 | 目标概念图谱的构建方法、装置、计算机设备和存储介质 |
CN110781310A (zh) * | 2019-09-09 | 2020-02-11 | 深圳壹账通智能科技有限公司 | 目标概念图谱的构建方法、装置、计算机设备和存储介质 |
CN110688559A (zh) * | 2019-09-25 | 2020-01-14 | 中科鼎富(北京)科技发展有限公司 | 一种检索方法及装置 |
CN111177410A (zh) * | 2019-12-27 | 2020-05-19 | 浙江理工大学 | 基于进化R-tree的知识图谱存储和相似性检索方法 |
CN111782817A (zh) * | 2020-05-30 | 2020-10-16 | 国网福建省电力有限公司信息通信分公司 | 一种面向信息系统的知识图谱构建方法、装置及电子设备 |
CN111782817B (zh) * | 2020-05-30 | 2022-06-14 | 国网福建省电力有限公司信息通信分公司 | 一种面向信息系统的知识图谱构建方法、装置及电子设备 |
CN112380352A (zh) * | 2020-10-28 | 2021-02-19 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 一种交互式检索方法、装置、计算机设备及存储介质 |
WO2022088409A1 (zh) * | 2020-10-28 | 2022-05-05 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 一种交互式检索方法、装置、计算机设备及存储介质 |
EP4047505A4 (en) * | 2020-10-28 | 2023-01-18 | Comac Beijing Aircraft Technology Research Institute | INTERACTIVE RETRIEVING METHOD AND DEVICE, AND COMPUTER DEVICE AND STORAGE MEDIA |
CN112597277A (zh) * | 2020-12-26 | 2021-04-02 | 中国农业银行股份有限公司 | 文档查询方法、装置、存储介质及电子设备 |
CN114491051A (zh) * | 2022-04-02 | 2022-05-13 | 四川省大数据中心 | 一种建筑用地项目审批系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359178A (zh) | 一种检索方法、装置、存储介质及设备 | |
US10642938B2 (en) | Artificial intelligence based method and apparatus for constructing comment graph | |
US11132370B2 (en) | Generating answer variants based on tables of a corpus | |
US9613024B1 (en) | System and methods for creating datasets representing words and objects | |
CN100378724C (zh) | 基于移动配置概念的句子结构分析方法及使用其的自然语言搜索方法 | |
US20160162492A1 (en) | Confidence Ranking of Answers Based on Temporal Semantics | |
US20160180242A1 (en) | Expanding Training Questions through Contextualizing Feature Search | |
US9720962B2 (en) | Answering superlative questions with a question and answer system | |
US9411878B2 (en) | NLP duration and duration range comparison methodology using similarity weighting | |
US9760828B2 (en) | Utilizing temporal indicators to weight semantic values | |
WO2006108069A2 (en) | Searching through content which is accessible through web-based forms | |
US8583580B2 (en) | Method and apparatus for identifying and extracting meaning in documents | |
US9298818B1 (en) | Method and apparatus for performing semantic-based data analysis | |
US20110016081A1 (en) | Automated Solution Retrieval | |
CN111061828B (zh) | 一种数字图书馆知识检索方法及装置 | |
CN112805715A (zh) | 识别实体属性关系 | |
US20160240095A1 (en) | Iterative Deepening Knowledge Discovery Using Closure-Based Question Answering | |
US10810266B2 (en) | Document search using grammatical units | |
Yang | Developing of an ontological interface agent with template-based linguistic processing technique for FAQ services | |
CN109522920B (zh) | 基于结合语义特征的同义判别模型的训练方法及设备 | |
US11880664B2 (en) | Identifying and transforming text difficult to understand by user | |
Sangeetha et al. | Information retrieval system for laws | |
Karpagam et al. | Deep learning approaches for answer selection in question answering system for conversation agents | |
CN112214511A (zh) | 一种基于wtp-wcd算法的api推荐方法 | |
Saany et al. | Syntax and semantics question analysis using user modelling and relevance feedback |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190219 |
|
RJ01 | Rejection of invention patent application after publication |