CN111737413A - 基于概念网语义的反馈模型信息检索方法、系统及介质 - Google Patents

基于概念网语义的反馈模型信息检索方法、系统及介质 Download PDF

Info

Publication number
CN111737413A
CN111737413A CN202010457126.7A CN202010457126A CN111737413A CN 111737413 A CN111737413 A CN 111737413A CN 202010457126 A CN202010457126 A CN 202010457126A CN 111737413 A CN111737413 A CN 111737413A
Authority
CN
China
Prior art keywords
query
document set
concept
pseudo
semantics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010457126.7A
Other languages
English (en)
Inventor
潘敏
杨杏本
刘兴红
徐琦
裴全力
周成志
赵美玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Normal University
Original Assignee
Hubei Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Normal University filed Critical Hubei Normal University
Priority to CN202010457126.7A priority Critical patent/CN111737413A/zh
Publication of CN111737413A publication Critical patent/CN111737413A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于概念网语义的反馈模型信息检索方法、系统及介质,通过提供多个查询关键词,得到伪相关文档集;根据权重检索模型和概念网的语义查询对所述伪相关文档集进行处理,得到多个目标扩展候选词;将所述多个查询关键词与所述多个目标扩展候选词进行线性融合,生成查询关键词集合;对所述查询关键词集合进行检索,得到最终检索结果。本发明公开的基于概念网语义的反馈模型信息检索方法、系统及介质使得用户查询的效率和效果大幅度提高。

Description

基于概念网语义的反馈模型信息检索方法、系统及介质
技术领域
本发明涉及信息检索技术领域,特别涉及一种基于概念网语义的反馈 模型信息检索方法、系统及介质。
背景技术
在互联网技术飞速发展的年代,网络信息呈现爆炸式增长态势,借助 搜索引擎浏览和获取所需信息已成为人们日常生活的重要组成部分。然而, 网络资源数量庞大、种类繁多,在给人们带来便利的同时也使得用户难以 高效准确的获取真正需要的信息,为了更加有效地处理日益增长的海量数 据,信息检索方法作为经典文本处理技术,已经成为信息处理技术的研究 关键点。
伪相关反馈(Pseudo Relevance Feedback,简称PRF)提供一种自动局 部分析方法,它可以自动化相关反馈的人工操作部分,用户不需要参加额 外的交互就能够获得更佳的检索性能。该方法首先进行普通的检索过程, 返回与用户初始查询最相关的文档并将其作为一个初始结果集,然后在此 基础上假设排名前N篇的文档是相关的,最后在这个假设上像前面一样进 行相关反馈。BERT模型是一种预训练语言表示的新方法,提出了一种在大量上下文相关的语言的预训练模型中,BERT通过根据前后单词的意思创建 上下文检索表达语义,开源了多种语言的源码和模型。
然而通过单一的模型得到的信息量过于庞大,得到的扩展词的精确度 也不够,因此,如果直接使用BERT对所有文档进行计算,则会出现信息 量过大、精确度不足等问题。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种基于概念 网语义的反馈模型信息检索方法、系统及介质,解决现有技术中直接使用 BERT对所有文档进行计算,则会出现信息量过大、精确度不足的技术问题。
为了达到上述目的,本发明采取了以下技术方案:
一种基于概念网语义的反馈模型信息检索方法,包括如下步骤:S1, 提供多个查询关键词,得到伪相关文档集;S2,根据权重检索模型和概念 网的语义查询对所述伪相关文档集进行处理,得到多个目标扩展候选词; S3,将所述多个查询关键词与所述多个目标扩展候选词进行线性融合,生 成查询关键词集合;S4,对所述查询关键词集合进行检索,得到最终检索 结果。
优选的,所述S1具体包括以下步骤:S11,提供多个查询关键词,得 到目标文档集;S12,将所述目标文档集运用于BM25模型,得到所述目标 文档集中每一文档的BM25得分,按得分由高至低选出前N篇文档,记为 第一文档集;S13,将所述第一文档集运用于BERT模型,得到所述第一文 档集中每一文档的BERT得分;S14,将所述目标文档集中每一文档的BM25得分与所述第一文档集中每一文档的BERT得分进行线性融合,得到第二 文档集及其每一文档的得分;S15,对所述第二文档集按得分由高至低选出 前N'篇文档,作为伪相关文档集。
优选的,所述S2具体包括以下步骤:S21,将所述伪相关文档集中全 部的词作为扩展候选词,计算每一扩展候选词本身在所述伪相关文档集中 的重要度得分,并按得分由高至低选取前m1个扩展候选词作为第一扩展候 选词集;S22,将从所述伪相关文档集中选取的第i篇文档中的扩展候选词 运用于概念网中,得到其在概念网中的语义向量,并将查询关键词运用于 概念网中,得到查询关键词在概念网中的语义向量,计算两语义向量间的语义距离;S23,计算每一扩展候选词与全部的查询关键词的语义距离,并 按语义距离由小到大选取前m2个扩展候选词作为第二扩展候选词集;S24, 将所述第一扩展候选词集与所述第二扩展候选词集进行融合,得到多个目 标扩展候选词。
优选的,所述S21中,所述扩展候选词本身在伪相关文档集中的重要 度得分计算公式为:
其中,
Figure RE-GDA0002641589020000032
表示重要度得分,V(D1)表示伪相关文档集的向量,
Figure RE-GDA0002641589020000033
表示伪相关文档集D1中的第i篇文档di中的词
Figure RE-GDA0002641589020000034
的向量,N表示伪相关文档 集合D1中文档的个数。
优选的,所述S22中,所述语义距离的计算公式为:
Figure BDA0002509764670000036
其中,
Figure BDA0002509764670000037
表示语义距离,
Figure BDA0002509764670000038
表示伪相关文档集中选取第i篇文 档中的扩展候选词
Figure BDA0002509764670000039
在概念网中的语义向量,
Figure BDA00025097646700000310
表示查询关键词在概念 网中的语义向量,N表示伪相关文档集合D1中文档的个数,Qs表示查询关 键词Q中第s个词,
Figure BDA00025097646700000311
表示
Figure BDA00025097646700000312
Figure BDA00025097646700000313
通过余弦相似度进行语义计算。
优选的,所述S23中,扩展候选词与全部的查询关键词的语义距离的 计算公式为:
Figure BDA00025097646700000314
其中,|Q|表示查询关键词的总个数,
Figure BDA00025097646700000315
表示扩展候选词,Qs表示查询 关键词Q中第s个词,
Figure BDA00025097646700000316
表示候选扩展词
Figure BDA00025097646700000317
与所有查询关键词Q的语 义距离。
优选的,所述S3中查询关键词集合的计算公式为:
Figure BDA0002509764670000041
其中,||M||表示对向量M进行归一化运算,Q表示初始用户查询词,θ 和λ是调节因子,范围为[0,1]。
优选的,所述S1中的所述多个查询关键词通过对用户提交的查询主题 进行预处理得到。
本发明为解决上述技术问题,提供又一技术方案如下:一种基于概念 网语义的反馈模型信息检索系统,所述基于概念网语义的反馈模型信息系 统包括处理器和存储器;所述存储器上存储有可被所述处理器执行的计算 机可读程序;所述处理器执行所述计算机可读程序时实现如上述任意一项 所述的基于概念网语义的反馈模型信息检索方法中的步骤。
本发明为解决上述技术问题,提供又一技术方案如下:一种计算机可 读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一 个多个程序可被一个或者多个处理器执行,以实现如上所述的基于概念网 语义的反馈模型信息检索方法中的步骤。
与现有技术相比,本发明所提供的基于概念网语义的反馈模型信息检 索方法、系统及介质通过提供多个查询关键词,得到伪相关文档集;根据 权重检索模型和概念网的语义查询对所述伪相关文档集进行处理,得到多 个目标扩展候选词;将所述多个查询关键词与所述多个目标扩展候选词进 行线性融合,生成查询关键词集合;对所述查询关键词集合进行检索,得 到最终检索结果。本发明将权重检索模型和概念网的语义查询融入到查询扩展中,使得文档得分和查询扩展词都携带语义特征,和初始查询相比具 有更高的语义相关性,能够克服多语义环境下语义混乱的不足,在实际需 要中能提取出与查询更相关更有效的信息,提高了检索的精度,节省了检 索时间。
附图说明
图1为本发明提供的基于概念网语义的反馈模型信息检索方法的一较 佳实施例的流程图;
图2为图1中所示S1的步骤流程示意图;
图3为图1中所示S2的步骤流程示意图。
具体实施方式
本发明提供一种基于概念网语义的反馈模型信息检索方法、设备及介 质,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图 并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施 例仅用以解释本发明,并不用于限定本发明。
实施例1
请参阅图1,图1为本发明提供的检索方法的一较佳实施例的流程图。 本发明提供的基于概念网语义的反馈模型信息检索方法的流程图S10,包括 如下步骤:
S1,提供多个查询关键词,得到伪相关文档集;
S2,根据权重检索模型和概念网的语义查询对所述伪相关文档集进行 处理,得到多个目标扩展候选词;
S3,将所述多个查询关键词与所述多个目标扩展候选词进行线性融合, 生成查询关键词集合;
S4,对所述查询关键词集合进行检索,得到最终检索结果。
本发明所提供的基于概念网语义的反馈模型信息检索方法通过提供多 个查询关键词,得到伪相关文档集;根据权重检索模型和概念网的语义查 询对所述伪相关文档集进行处理,得到多个目标扩展候选词;将所述多个 查询关键词与所述多个目标扩展候选词进行线性融合,生成查询关键词集 合;对所述查询关键词集合进行检索,得到最终检索结果。本发明将权重 检索模型和概念网的语义查询融入到查询扩展中,使得文档得分和查询扩展词都携带语义特征,和初始查询相比具有更高的语义相关性,能够克服 多语义环境下语义混乱的不足,在实际需要中能提取出与查询更相关更有 效的信息,提高了检索的精度,节省了检索时间。
具体地,如图2所示,所述S1具体包括以下步骤:
S11,提供多个查询关键词,得到目标文档集;
S12,将所述目标文档集运用于BM25模型,得到所述目标文档集中每 一文档的BM25得分,按得分由高至低选出前N篇文档,记为第一文档集;
S13,将所述第一文档集运用于BERT模型,得到所述第一文档集中每 一文档的BERT得分;
S14,将所述目标文档集中每一文档的BM25得分与所述第一文档集中 每一文档的BERT得分进行线性融合,得到第二文档集及其每一文档的得 分;
S15,对所述第二文档集按得分由高至低选出前N`篇文档,作为伪相关 文档集。
当用户根据相关查询主题进行检索时,信息检索系统会根据目标文档 集合建立查询索引,当用户提交相关查询主题时,系统会将查询主题进行 预处理为查询关键词Q,通过查询关键词Q能检索得到目标文档集。随后检 索系统会通过经典检索模型BM25模型来对目标文档集进行集合筛选,计 算得到目标文档集中的每一个文档的BM25得分,按得分结果从高到低排 列得到第一次查询结果,取出得分高的前N篇文档,记为第一文档集,接 着使用BERT模型对第一文档集中的每一文档再次进行评估,基于BERT 语义相似度对第一文档集中的文档中的每个句子与原始查询进行打分,得 到第二文档集及其每一文档的得分,对所述第二文档集按得分由高至低选 出前N`篇文档,作为伪相关文档集。对于N及N'的选取,本领域技术人员 可预设取值,适宜即可。
如图3所示,所述S2具体包括以下步骤:
S21,将所述伪相关文档集中全部的词作为扩展候选词,计算每一扩展 候选词本身在所述伪相关文档集中的重要度得分,并按得分由高至低选取 前m1个扩展候选词作为第一扩展候选词集;
S22,将从所述伪相关文档集中选取的第i篇文档中的扩展候选词运用 于概念网中,得到其在概念网中的语义向量,并将查询关键词运用于概念 网中,得到查询关键词在概念网中的语义向量,计算两语义向量间的语义 距离;及
S23,计算每一扩展候选词与全部的查询关键词的语义距离,并按语义 距离由小到大选取前m2个扩展候选词作为第二扩展候选词集;
S24,将所述第一扩展候选词集与所述第二扩展候选词集进行融合,得 到多个目标扩展候选词。
通过对伪相关文档集运用权重检索模型和概念网的语义查询来挑选目 标扩展候选词,相较于传统BM25模型,得到的扩展候选词精度更高,检 索效果更好。
具体地,所述S21中,所述扩展候选词本身在伪相关文档集中的重要 度得分计算公式为:
Figure BDA0002509764670000071
其中,
Figure BDA0002509764670000072
表示重要度得分,
Figure BDA0002509764670000073
表示伪相关文档集的向量,
Figure BDA0002509764670000074
表 示伪相关文档集D1中的第i篇文档di中的词
Figure BDA0002509764670000075
的向量,N表示伪相关文档集 合D1中文档的个数。
所述S22中,所述语义距离的计算公式为:
Figure BDA0002509764670000076
其中,
Figure BDA0002509764670000081
表示语义距离,
Figure BDA0002509764670000082
表示伪相关文档集中选取第i篇文 档中的扩展候选词
Figure BDA0002509764670000083
在概念网中的语义向量,
Figure BDA0002509764670000084
表示查询关键词在概念 网中的语义向量,N表示伪相关文档集合D1中文档的个数,Qs表示查询关 键词Q中第s个词,
Figure BDA0002509764670000085
表示
Figure BDA0002509764670000086
Figure BDA0002509764670000087
通过余弦相似度进行语义计算。
所述S23中,扩展候选词与全部的查询关键词的语义距离的计算公式 为:
Figure BDA0002509764670000088
其中,|Q|表示查询关键词的总个数,
Figure BDA0002509764670000089
表示扩展候选词,Qs表示查询 关键词Q中第s个词,
Figure BDA00025097646700000810
表示候选扩展词
Figure BDA00025097646700000811
与所有查询关键词Q的语 义距离。
将所述多个查询关键词与所述多个目标扩展候选词进行线性融合,生 成查询关键词集合,S3中查询关键词集合的计算公式为:
Figure BDA00025097646700000812
其中,||M||表示对向量M进行归一化运算,Q表示初始用户查询词,θ 和λ是调节因子,范围为[0,1]。θ和λ后期由信息检索领域人员进行实验 调节获得,获得其最优值。它的功能是用来平衡原查询词与扩展查询词, 以及从不同方面获得的候选扩展词之间的权重,具体实施时可设置为经验 值。
通过检索查询关键词集合,得到最终的检索结果,该检索结果依据 BM25模型、BERT模型与概念网语义查询,相较于传统的BM25模型,检 索精度更高,反馈效率更好。
本发明还提供了基于概念网语义的反馈模型的信息检索系统,包括处 理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所 述处理器执行时,实现实施例1提供的基于概念网语义的反馈模型信息检 索方法。
本实施例提供的基于概念网语义的反馈模型的信息检索系统,用于实 现基于概念网语义的反馈模型的信息检索方法,因此,上述基于概念网语 义的反馈模型的信息检索方法所具备的技术效果,基于概念网语义的反馈 模型的信息检索系统同样具备,在此不再赘述。
实施例3
本发明的实施例3提供了计算机存储介质,其上存储有计算机程序, 所述计算机程序被处理器执行时,实现实施例1基于概念网语义的反馈模 型的信息检索方法。
本实施例提供的计算机存储介质,用于实现基于概念网语义的反馈模 型的信息检索方法,因此,上述基于概念网语义的反馈模型的信息检索方 法所具备的技术效果,计算机存储介质同样具备,在此不再赘述。
综上所述,本发明提供的基于概念网语义的反馈模型的信息检索方法、 系统及介质中通过提供多个查询关键词,得到伪相关文档集;根据权重检 索模型和概念网的语义查询对所述伪相关文档集进行处理,得到多个目标 扩展候选词;将所述多个查询关键词与所述多个目标扩展候选词进行线性 融合,生成查询关键词集合;对所述查询关键词集合进行检索,得到最终 检索结果。本发明将权重检索模型和概念网的语义查询融入到查询扩展中, 使得文档得分和查询扩展词都携带语义特征,和初始查询相比具有更高的 语义相关性,能够克服多语义环境下语义混乱的不足,在实际需要中能提 取出与查询更相关更有效的信息,提高了检索的精度,节省了检索时间。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或 部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等) 来完成,所述的程序可存储于一计算机可读取的存储介质中,该程序在执 行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、 磁碟、光盘等。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术 方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于 本发明所附的权利要求的保护范围。

Claims (10)

1.一种基于概念网语义的反馈模型信息检索方法,其特征在于,包括如下步骤:
S1,提供多个查询关键词,得到伪相关文档集;
S2,根据权重检索模型和概念网的语义查询对所述伪相关文档集进行处理,得到多个目标扩展候选词;
S3,将所述多个查询关键词与所述多个目标扩展候选词进行线性融合,生成查询关键词集合;
S4,对所述查询关键词集合进行检索,得到最终检索结果。
2.根据权利要求1所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S1具体包括以下步骤:
S11,提供多个查询关键词,得到目标文档集;
S12,将所述目标文档集运用于BM25模型,得到所述目标文档集中每一文档的BM25得分,按得分由高至低选出前N篇文档,记为第一文档集;
S13,将所述第一文档集运用于BERT模型,得到所述第一文档集中每一文档的BERT得分;
S14,将所述目标文档集中每一文档的BM25得分与所述第一文档集中每一文档的BERT得分进行线性融合,得到第二文档集及其每一文档的得分;
S15,对所述第二文档集按得分由高至低选出前N'篇文档,作为伪相关文档集。
3.根据权利要求1所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S2具体包括以下步骤:
S21,将所述伪相关文档集中全部的词作为扩展候选词,计算每一扩展候选词本身在所述伪相关文档集中的重要度得分,并按得分由高至低选取前m1个扩展候选词作为第一扩展候选词集;
S22,将从所述伪相关文档集中选取的第i篇文档中的扩展候选词运用于概念网中,得到其在概念网中的语义向量,并将查询关键词运用于概念网中,得到查询关键词在概念网中的语义向量,计算两语义向量间的语义距离;及
S23,计算每一扩展候选词与全部的查询关键词的语义距离,并按语义距离由小到大选取前m2个扩展候选词作为第二扩展候选词集;
S24,将所述第一扩展候选词集与所述第二扩展候选词集进行融合,得到多个目标扩展候选词。
4.根据权利要求3所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S21中,所述扩展候选词本身在伪相关文档集中的重要度得分计算公式为:
Figure FDA0002509764660000021
其中,
Figure FDA0002509764660000022
表示重要度得分,
Figure FDA0002509764660000023
表示伪相关文档集的向量,
Figure FDA0002509764660000024
表示伪相关文档集D1中的第i篇文档di中的词
Figure FDA0002509764660000025
的向量,N表示伪相关文档集合D1中文档的个数。
5.根据权利要求3所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S22中,所述语义距离的计算公式为:
Figure FDA0002509764660000026
其中,
Figure FDA0002509764660000027
表示语义距离,
Figure FDA0002509764660000028
表示伪相关文档集中选取第i篇文档中的扩展候选词
Figure FDA0002509764660000029
在概念网中的语义向量,
Figure FDA00025097646600000210
表示查询关键词在概念网中的语义向量,N表示伪相关文档集合D1中文档的个数,Qs表示查询关键词Q中第s个词,
Figure FDA0002509764660000031
表示
Figure FDA0002509764660000032
Figure FDA0002509764660000033
通过余弦相似度进行语义计算。
6.根据权利要求3所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S23中,扩展候选词与全部的查询关键词的语义距离的计算公式为:
Figure FDA0002509764660000034
其中,|Q|表示查询关键词的总个数,
Figure FDA0002509764660000035
表示扩展候选词,Qs表示查询关键词Q中第s个词,
Figure FDA0002509764660000036
表示候选扩展词
Figure FDA0002509764660000037
与所有查询关键词Q的语义距离。
7.根据权利要求1所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S3中查询关键词集合的计算公式为:
Figure FDA0002509764660000038
其中,||M||表示对向量M进行归一化运算,Q表示初始用户查询词,θ和λ是调节因子,范围为[0,1]。
8.根据权利要求1所述的基于概念网语义的反馈模型信息检索方法,其特征在于,所述S1中的所述多个查询关键词通过对用户提交的查询主题进行预处理得到。
9.一种基于概念网语义的反馈模型信息检索系统,其特征在于,包括处理器和存储器;
所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述处理器执行所述计算机可读程序时实现如权利要求1-8任意一项所述的基于概念网语义的反馈模型信息检索方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个多个程序可被一个或者多个处理器执行,以实现如权利要求1-8任意一项所述的基于概念网语义的反馈模型信息检索方法中的步骤。
CN202010457126.7A 2020-05-26 2020-05-26 基于概念网语义的反馈模型信息检索方法、系统及介质 Withdrawn CN111737413A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010457126.7A CN111737413A (zh) 2020-05-26 2020-05-26 基于概念网语义的反馈模型信息检索方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010457126.7A CN111737413A (zh) 2020-05-26 2020-05-26 基于概念网语义的反馈模型信息检索方法、系统及介质

Publications (1)

Publication Number Publication Date
CN111737413A true CN111737413A (zh) 2020-10-02

Family

ID=72647694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010457126.7A Withdrawn CN111737413A (zh) 2020-05-26 2020-05-26 基于概念网语义的反馈模型信息检索方法、系统及介质

Country Status (1)

Country Link
CN (1) CN111737413A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612875A (zh) * 2020-12-29 2021-04-06 重庆农村商业银行股份有限公司 一种查询词自动扩展方法、装置、设备及存储介质
CN113139389A (zh) * 2021-04-29 2021-07-20 南宁师范大学 基于动态优化的图模型语义查询扩展方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN107247745A (zh) * 2017-05-23 2017-10-13 华中师范大学 一种基于伪相关反馈模型的信息检索方法及系统
CN108520033A (zh) * 2018-03-28 2018-09-11 华中师范大学 基于超空间模拟语言的增强伪相关反馈模型信息检索方法
CN109829104A (zh) * 2019-01-14 2019-05-31 华中师范大学 基于语义相似度的伪相关反馈模型信息检索方法及系统
CN110442777A (zh) * 2019-06-24 2019-11-12 华中师范大学 基于bert的伪相关反馈模型信息检索方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN107247745A (zh) * 2017-05-23 2017-10-13 华中师范大学 一种基于伪相关反馈模型的信息检索方法及系统
CN108520033A (zh) * 2018-03-28 2018-09-11 华中师范大学 基于超空间模拟语言的增强伪相关反馈模型信息检索方法
CN109829104A (zh) * 2019-01-14 2019-05-31 华中师范大学 基于语义相似度的伪相关反馈模型信息检索方法及系统
CN110442777A (zh) * 2019-06-24 2019-11-12 华中师范大学 基于bert的伪相关反馈模型信息检索方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
俞扬信 等: "基于概念网的用户个性化信息检索研究" *
沙莎 等: "一种面向元数据描述文档的概念检索方法" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612875A (zh) * 2020-12-29 2021-04-06 重庆农村商业银行股份有限公司 一种查询词自动扩展方法、装置、设备及存储介质
CN112612875B (zh) * 2020-12-29 2023-05-23 重庆农村商业银行股份有限公司 一种查询词自动扩展方法、装置、设备及存储介质
CN113139389A (zh) * 2021-04-29 2021-07-20 南宁师范大学 基于动态优化的图模型语义查询扩展方法和装置

Similar Documents

Publication Publication Date Title
CN107993724B (zh) 一种医学智能问答数据处理的方法及装置
CN110442777B (zh) 基于bert的伪相关反馈模型信息检索方法及系统
CN103136352B (zh) 基于双层语义分析的全文检索系统
US7937397B2 (en) Apparatus and method for term context modeling for information retrieval
CN106815252A (zh) 一种搜索方法和设备
WO2017215242A1 (zh) 简历搜索方法及装置
CN112612875B (zh) 一种查询词自动扩展方法、装置、设备及存储介质
CN111625624A (zh) 基于bm25+albert模型的伪相关反馈信息检索方法、系统及存储介质
CN114912449B (zh) 基于代码描述文本的技术特征关键词抽取方法与系统
CN113821646A (zh) 基于语义检索的智能化专利相似度搜索方法及装置
CN105956010B (zh) 基于分布式表征和局部排序的分布式信息检索集合选择方法
CN111737413A (zh) 基于概念网语义的反馈模型信息检索方法、系统及介质
CN110728135A (zh) 文本主题标引方法、装置、电子设备及计算机存储介质
Juan An effective similarity measurement for FAQ question answering system
KR102256007B1 (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법
JP5315726B2 (ja) 情報提供方法、情報提供装置、および情報提供プログラム
WO2012143839A1 (en) A computerized system and a method for processing and building search strings
CN111723179B (zh) 基于概念图谱的反馈模型信息检索方法、系统及介质
CN112163065A (zh) 信息检索方法、系统及介质
CN111125299B (zh) 一种基于用户行为分析的动态词库更新方法
Ofoghi et al. A semantic approach to boost passage retrieval effectiveness for question answering
CN114840639A (zh) 基于ConceptNet的信息检索查询扩展方法
Liu et al. A Chinese question answering system based on web search
CN114519132A (zh) 一种基于公式引用图的公式检索方法与装置
JP2010282403A (ja) 文書検索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201002

WW01 Invention patent application withdrawn after publication