CN114091471A - 一种基于语义的网络文档智能检索方法及系统 - Google Patents

一种基于语义的网络文档智能检索方法及系统 Download PDF

Info

Publication number
CN114091471A
CN114091471A CN202111482857.8A CN202111482857A CN114091471A CN 114091471 A CN114091471 A CN 114091471A CN 202111482857 A CN202111482857 A CN 202111482857A CN 114091471 A CN114091471 A CN 114091471A
Authority
CN
China
Prior art keywords
description
retrieval
thread
semantic
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111482857.8A
Other languages
English (en)
Inventor
张美华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai DC Science Co Ltd
Original Assignee
Shanghai DC Science Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai DC Science Co Ltd filed Critical Shanghai DC Science Co Ltd
Priority to CN202111482857.8A priority Critical patent/CN114091471A/zh
Publication of CN114091471A publication Critical patent/CN114091471A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于语义的网络文档智能检索方法及系统,在具体应用时,由于请求事项检索线程不区别对待请求事项中的深层次信息和表层信息,结合识别语义衍生检索结果和对应的目标语义衍生检索结果中每个局部段落内容确定检索误差,根据检索误差调试请求事项检索线程。能够应对不同会话状态下的请求事项语义衍生检索,具有较强的抗干扰性,即便在应对随机多变的会话状态,基于请求事项检索线程得到的语义衍生检索结果也能够与文档检索请求之间具有尽可能精准的匹配性。

Description

一种基于语义的网络文档智能检索方法及系统
技术领域
本申请涉及文档检索技术领域,特别涉及一种基于语义的网络文档智能检索方法及系统。
背景技术
随着互联网的不断进步,人们的工作和娱乐逐渐离不开网络,对于文件文档的管理也逐渐由纸质模式向网络文档模式转变。现目前,网络文档的规模和信息量越来越大,在一些业务场景下,通常需要进行网络文档的检索,然而相关的文档检索技术抗干扰性差切难以满足不同的检索需求。
发明内容
为改善相关技术中存在的技术问题,本申请提供了一种基于语义的网络文档智能检索方法及系统。
本申请提供了一种基于语义的网络文档智能检索方法,应用于网络文档智能检索系统,所述方法至少包括:
确定同一会话状态下,涵盖相同目标文档检索请求的显著性请求事项和潜在性请求事项;基于完成调试的请求事项检索线程,对所述显著性请求事项和潜在性请求事项进行语义衍生检索处理,得到涵盖所述目标文档检索请求的语义衍生检索结果;其中:所述请求事项检索线程为借助基于第二阶段性线程确定的事项语义衍生检索误差,对第一阶段性线程的线程变量进行调试得到的;所述事项语义衍生检索误差是基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定的,所述识别语义衍生检索结果是基于所述第一阶段性线程对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理得到的。
可选地,所述第一阶段性线程包括描述挖掘子线程T1、描述挖掘子线程T2和描述挖掘子线程T3,所述描述挖掘子线程T1、描述挖掘子线程T2和描述挖掘子线程T3用于对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理,得到识别语义衍生检索结果。
可选地,所述对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理,得到识别语义衍生检索结果包括:
通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行描述挖掘,得到第一显著性描述分布和第一潜在性描述分布,分别将所述第一显著性描述分布和第一潜在性描述分布传入所述描述挖掘子线程T2;
通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘,得到第二显著性描述分布和第二潜在性描述分布,并对所述第一显著性描述分布和第二显著性描述分布进行合并处理,得到第三显著性描述分布,对所述第一潜在性描述分布和第二潜在性描述分布进行合并处理,得到第三潜在性描述分布,分别将所述第三显著性描述分布和第三潜在性描述分布传入所述描述挖掘子线程T3;
通过所述描述挖掘子线程T3对所述第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理,得到识别语义衍生检索结果。
可选地,所述通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行描述挖掘包括:
通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行内容补全,根据设定的滑动平均策略对内容补全后的显著性范例请求事项和潜在性范例请求事项进行滑动平均操作;
所述通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘包括:通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行内容补全,根据设定的滑动平均策略对内容补全后的第一显著性描述分布和第一潜在性描述分布进行滑动平均操作;
所述通过所述描述挖掘子线程T3对所述第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理包括:通过所述描述挖掘子线程T3分别对所述第三显著性描述分布和第三潜在性描述分布进行内容补全,根据设定的滑动平均策略对内容补全后的第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理。
可选地,所述根据设定的滑动平均策略对内容补全后的显著性范例请求事项和潜在性范例请求事项进行滑动平均操作之后,所述方法还包括:对滑动平均操作后的显著性范例请求事项和潜在性范例请求事项进行优化操作,采用设定映射策略对优化操作后的显著性范例请求事项和潜在性范例请求事项进行信息映射;
所述根据设定的滑动平均策略对内容补全后的第一显著性描述分布和第一潜在性描述分布进行滑动平均操作之后,所述方法还包括:对滑动平均操作后的第一显著性描述分布和第一潜在性描述分布进行优化操作,采用设定映射策略对优化操作后的第一显著性描述分布和第一潜在性描述分布进行信息映射。
可选地,所述第二阶段性线程包括存在关联关系的描述挖掘子线程T4和描述挖掘子线程T5,所述存在关联关系的描述挖掘子线程T4和描述挖掘子线程T5用于基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定事项语义衍生检索误差。
可选地,基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定事项语义衍生检索误差包括:
通过所述描述挖掘子线程T4分别对所述识别语义衍生检索结果和目标语义衍生检索结果进行滑动平均操作,得到识别语义衍生检索描述分布和目标语义衍生检索描述分布,分别将所述识别语义衍生检索描述分布和目标语义衍生检索描述分布传入所述描述挖掘子线程T5;
通过所述描述挖掘子线程T5,对所述识别语义衍生检索描述分布和目标语义衍生检索描述分布进行滑动平均操作和极性精简处理,确定事项语义衍生检索误差。
可选地,所述请求事项检索线程还包括请求核验阶段性线程;所述方法得到涵盖所述目标文档检索请求的语义衍生检索结果之后,还包括:
基于所述请求核验阶段性线程,对所述语义衍生检索结果进行核验,确定所述语义衍生检索结果中的目标文档检索请求的语义匹配情况;其中,所述请求核验阶段性线程是基于每个语义衍生检索范例请求事项和对应的实际请求事项调试得到的;所述实际请求事项中实际有对应的语义衍生检索范例请求事项中目标文档检索请求的语义匹配情况。
本申请还提供了一种网络文档智能检索系统,包括存储器、处理器和网络模块;其中,所述存储器、所述处理器和所述网络模块之间直接或间接地电性连接;所述处理器通过从所述存储器中读取计算机程序并运行以实现上述方法。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述方法。
本申请的实施例提供的技术方案可以包括以下有益效果。
本申请实施例提供的基于语义的网络文档智能检索方法,该方法基于请求事项检索线程实现请求事项语义衍生检索。在调试请求事项检索线程时,基于第一阶段性线程对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理得到识别语义衍生检索结果,基于第二阶段性线程得到调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息,然后根据比较信息确定事项语义衍生检索误差,根据事项语义衍生检索误差对第一阶段性线程的线程变量进行调试。由于本申请实施例中,请求事项检索线程不区别对待请求事项中的深层次信息和表层信息,结合识别语义衍生检索结果和对应的目标语义衍生检索结果中每个局部段落内容确定检索误差,根据检索误差调试请求事项检索线程。能够应对不同会话状态下的请求事项语义衍生检索,具有较强的抗干扰性,即便在应对随机多变的会话状态,基于请求事项检索线程得到的语义衍生检索结果也能够与文档检索请求之间具有尽可能精准的匹配性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1是本申请实施例提供的一种基于语义的网络文档智能检索方法的流程图。
图2是本申请实施例提供的一种网络文档智能检索系统的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
请结合参阅图1,本申请实施例提供了一种基于语义的网络文档智能检索方法,该方法应用于网络文档智能检索系统,所述方法至少包括如下技术方案。
步骤11、确定同一会话状态下,涵盖相同目标文档检索请求的显著性请求事项和潜在性请求事项。
步骤12、基于完成调试的请求事项检索线程,对所述显著性请求事项和潜在性请求事项进行语义衍生检索处理,得到涵盖所述目标文档检索请求的语义衍生检索结果。
在实际实施时,所述请求事项检索线程为借助基于第二阶段性线程确定的事项语义衍生检索误差,对第一阶段性线程的线程变量进行调试得到的;所述事项语义衍生检索误差是基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定的,所述识别语义衍生检索结果是基于所述第一阶段性线程对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理得到的。
可以理解的是,所述第一阶段性线程包括描述挖掘子线程T1、描述挖掘子线程T2和描述挖掘子线程T3,所述描述挖掘子线程T1、描述挖掘子线程T2和描述挖掘子线程T3用于对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理,得到识别语义衍生检索结果。
对于一些示例性技术方案而言,上述所记录的对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理,得到识别语义衍生检索结果,具体可以包括如下步骤一-步骤三所记录的技术方案。
步骤一、通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行描述挖掘,得到第一显著性描述分布和第一潜在性描述分布,分别将所述第一显著性描述分布和第一潜在性描述分布传入所述描述挖掘子线程T2;
步骤二、通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘,得到第二显著性描述分布和第二潜在性描述分布,并对所述第一显著性描述分布和第二显著性描述分布进行合并处理,得到第三显著性描述分布,对所述第一潜在性描述分布和第二潜在性描述分布进行合并处理,得到第三潜在性描述分布,分别将所述第三显著性描述分布和第三潜在性描述分布传入所述描述挖掘子线程T3;
步骤三、通过所述描述挖掘子线程T3对所述第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理,得到识别语义衍生检索结果。
执行步骤一-步骤三所记录的技术方案,首先通过描述挖掘子线程T1分别对调试请求事项组的中显著性范例请求事项和潜在性范例请求事项进行描述挖掘,得到第一显著性描述分布和第一潜在性描述分布,其次通过描述挖掘子线程T2分别对第一显著性描述分布和第一潜在性描述分布进行描述挖掘,得到第三潜在性描述分布,最后通过描述挖掘子线程T3对第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理,得到识别语义衍生检索结果。这样一来,通过描述挖掘子线程对调试请求事项组的中显著性范例请求事项和潜在性范例请求事项进行逐一深度识别,这样能够得到的语义衍生检索结果的准确性及完整性。
对于一些示例性技术方案而言,步骤一中所记录的通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行描述挖掘,具体可以包括如下内容:通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行内容补全,根据设定的滑动平均策略对内容补全后的显著性范例请求事项和潜在性范例请求事项进行滑动平均操作。
对于一些示例性技术方案而言,上述所记录的根据设定的滑动平均策略对内容补全后的显著性范例请求事项和潜在性范例请求事项进行滑动平均操作之后,该方法具体还可以包括如下技术方案:对滑动平均操作后的显著性范例请求事项和潜在性范例请求事项进行优化操作,采用设定映射策略对优化操作后的显著性范例请求事项和潜在性范例请求事项进行信息映射,如此一来,能够确保后续描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘时的完整性。
可以理解,步骤二中所记录的通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘,具体可以包括:通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行内容补全,根据设定的滑动平均策略对内容补全后的第一显著性描述分布和第一潜在性描述分布进行滑动平均操作。
可以理解,在根据设定的滑动平均策略对内容补全后的第一显著性描述分布和第一潜在性描述分布进行滑动平均操作之后,所述方法还可以包括如下内容:对滑动平均操作后的第一显著性描述分布和第一潜在性描述分布进行优化操作,采用设定映射策略对优化操作后的第一显著性描述分布和第一潜在性描述分布进行信息映射。如此一来,对滑动平均操作后的第一显著性描述分布和第一潜在性描述分布进行优化操作,能够更加得到的结果更加精准。
可以理解,步骤三中所记录的通过所述描述挖掘子线程T3对所述第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理,具体可以包括:通过所述描述挖掘子线程T3分别对所述第三显著性描述分布和第三潜在性描述分布进行内容补全,根据设定的滑动平均策略对内容补全后的第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理。
对于一些示例性技术方案而言,所述第二阶段性线程包括存在关联关系的描述挖掘子线程T4和描述挖掘子线程T5,所述存在关联关系的描述挖掘子线程T4和描述挖掘子线程T5用于基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定事项语义衍生检索误差。
对于一些示例性技术方案而言,上述所记录的基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定事项语义衍生检索误差具体可以包括:通过所述描述挖掘子线程T4分别对所述识别语义衍生检索结果和目标语义衍生检索结果进行滑动平均操作,得到识别语义衍生检索描述分布和目标语义衍生检索描述分布,分别将所述识别语义衍生检索描述分布和目标语义衍生检索描述分布传入所述描述挖掘子线程T5;通过所述描述挖掘子线程T5,对所述识别语义衍生检索描述分布和目标语义衍生检索描述分布进行滑动平均操作和极性精简处理,确定事项语义衍生检索误差。如此,对识别语义衍生检索描述分布和目标语义衍生检索描述分布进行滑动平均操作和极性精简处理,能够事项语义衍生检索误差的准确性。
对于一些示例性技术方案而言,所述请求事项检索线程还包括请求核验阶段性线程;所述方法得到涵盖所述目标文档检索请求的语义衍生检索结果之后,还可以包括如下内容:基于所述请求核验阶段性线程,对所述语义衍生检索结果进行核验,确定所述语义衍生检索结果中的目标文档检索请求的语义匹配情况;其中,所述请求核验阶段性线程是基于每个语义衍生检索范例请求事项和对应的实际请求事项调试得到的;所述实际请求事项中实际有对应的语义衍生检索范例请求事项中目标文档检索请求的语义匹配情况。如此,通过请求核验阶段性线程对语义衍生检索结果进行核验,能够更全面的语义匹配情况的全面性。
综上所述,该方法基于请求事项检索线程实现请求事项语义衍生检索。在调试请求事项检索线程时,基于第一阶段性线程对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理得到识别语义衍生检索结果,基于第二阶段性线程得到调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息,然后根据比较信息确定事项语义衍生检索误差,根据事项语义衍生检索误差对第一阶段性线程的线程变量进行调试。由于本申请实施例中,请求事项检索线程不区别对待请求事项中的深层次信息和表层信息,结合识别语义衍生检索结果和对应的目标语义衍生检索结果中每个局部段落内容确定检索误差,根据检索误差调试请求事项检索线程。能够应对不同会话状态下的请求事项语义衍生检索,具有较强的抗干扰性,即便在应对随机多变的会话状态,基于请求事项检索线程得到的语义衍生检索结果也能够与文档检索请求之间具有尽可能精准的匹配性。
在上述内容的基础上,本申请还提供了一种基于语义的网络文档智能检索装置,该装置具体可以包括如下功能模块:
状态确定模块,用于确定同一会话状态下,涵盖相同目标文档检索请求的显著性请求事项和潜在性请求事项;
语义检索模块,用于基于完成调试的请求事项检索线程,对所述显著性请求事项和潜在性请求事项进行语义衍生检索处理,得到涵盖所述目标文档检索请求的语义衍生检索结果。
在上述基础上,请结合参阅图2,本申请还提供了一种网络文档智能检索系统20的硬件结构示意图,具体包括存储器21、处理器22、网络模块23和基于语义的网络文档智能检索装置。存储器21、处理器22和网络模块23之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器21中存储有基于语义的网络文档智能检索装置,所述基于语义的网络文档智能检索装置包括至少一个可以软件或固件(firmware)的形式储存于所述存储器21中的软件功能模块,所述处理器22通过运行存储在存储器21内的软件程序以及模块。
其中,所述存储器21可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器21用于存储程序,所述处理器22在接收到执行指令后,执行所述程序。
所述处理器22可能是一种集成电路芯片,具有数据的处理能力。上述的处理器22可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
网络模块23用于通过网络建立一种网络文档智能检索系统20与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
本领域技术人员公知的是,随着诸如大规模集成电路技术的电子信息技术的发展和软件硬件化的趋势,要明确划分计算机系统软、硬件界限已经显得比较困难了。因为,任何操作可以软件来实现,也可以由硬件来实现。任何指令的执行可以由硬件完成,同样也可以由软件来完成。对于某一机器功能采用硬件实现方案还是软件实现方案,取决于价格、速度、可靠性、存储容量、变更周期等非技术性因素。因此,对于电子信息技术领域的普通技术人员来说,更为直接和清楚地描述一个技术方案的方式是描述该方案中的各个操作。在知道所要执行的操作的情况下,本领域技术人员可以基于对所述非技术性因素的考虑直接设计出期望的产品。
本申请可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本申请的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本申请的各个方面。
这里参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本申请的范围由所附权利要求来限定。

Claims (10)

1.一种基于语义的网络文档智能检索方法,其特征在于,应用于网络文档智能检索系统,所述方法至少包括:
确定同一会话状态下,涵盖相同目标文档检索请求的显著性请求事项和潜在性请求事项;基于完成调试的请求事项检索线程,对所述显著性请求事项和潜在性请求事项进行语义衍生检索处理,得到涵盖所述目标文档检索请求的语义衍生检索结果;其中:所述请求事项检索线程为借助基于第二阶段性线程确定的事项语义衍生检索误差,对第一阶段性线程的线程变量进行调试得到的;所述事项语义衍生检索误差是基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定的,所述识别语义衍生检索结果是基于所述第一阶段性线程对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理得到的。
2.如权利要求1所述的方法,其特征在于,所述第一阶段性线程包括描述挖掘子线程T1、描述挖掘子线程T2和描述挖掘子线程T3,所述描述挖掘子线程T1、描述挖掘子线程T2和描述挖掘子线程T3用于对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理,得到识别语义衍生检索结果。
3.如权利要求2所述的方法,其特征在于,所述对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行语义衍生检索处理,得到识别语义衍生检索结果包括:
通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行描述挖掘,得到第一显著性描述分布和第一潜在性描述分布,分别将所述第一显著性描述分布和第一潜在性描述分布传入所述描述挖掘子线程T2;
通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘,得到第二显著性描述分布和第二潜在性描述分布,并对所述第一显著性描述分布和第二显著性描述分布进行合并处理,得到第三显著性描述分布,对所述第一潜在性描述分布和第二潜在性描述分布进行合并处理,得到第三潜在性描述分布,分别将所述第三显著性描述分布和第三潜在性描述分布传入所述描述挖掘子线程T3;
通过所述描述挖掘子线程T3对所述第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理,得到识别语义衍生检索结果。
4.如权利要求3所述的方法,其特征在于,所述通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行描述挖掘包括:
通过所述描述挖掘子线程T1分别对所述调试请求事项组中的显著性范例请求事项和潜在性范例请求事项进行内容补全,根据设定的滑动平均策略对内容补全后的显著性范例请求事项和潜在性范例请求事项进行滑动平均操作;
所述通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行描述挖掘包括:通过所述描述挖掘子线程T2分别对所述第一显著性描述分布和第一潜在性描述分布进行内容补全,根据设定的滑动平均策略对内容补全后的第一显著性描述分布和第一潜在性描述分布进行滑动平均操作;
所述通过所述描述挖掘子线程T3对所述第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理包括:通过所述描述挖掘子线程T3分别对所述第三显著性描述分布和第三潜在性描述分布进行内容补全,根据设定的滑动平均策略对内容补全后的第三显著性描述分布和第三潜在性描述分布进行语义衍生检索处理。
5.如权利要求4所述的方法,其特征在于,所述根据设定的滑动平均策略对内容补全后的显著性范例请求事项和潜在性范例请求事项进行滑动平均操作之后,所述方法还包括:对滑动平均操作后的显著性范例请求事项和潜在性范例请求事项进行优化操作,采用设定映射策略对优化操作后的显著性范例请求事项和潜在性范例请求事项进行信息映射;
所述根据设定的滑动平均策略对内容补全后的第一显著性描述分布和第一潜在性描述分布进行滑动平均操作之后,所述方法还包括:对滑动平均操作后的第一显著性描述分布和第一潜在性描述分布进行优化操作,采用设定映射策略对优化操作后的第一显著性描述分布和第一潜在性描述分布进行信息映射。
6.如权利要求1所述的方法,其特征在于,所述第二阶段性线程包括存在关联关系的描述挖掘子线程T4和描述挖掘子线程T5,所述存在关联关系的描述挖掘子线程T4和描述挖掘子线程T5用于基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定事项语义衍生检索误差。
7.如权利要求6所述的方法,其特征在于,基于调试请求事项组的识别语义衍生检索结果和对应的目标语义衍生检索结果的比较信息确定事项语义衍生检索误差包括:
通过所述描述挖掘子线程T4分别对所述识别语义衍生检索结果和目标语义衍生检索结果进行滑动平均操作,得到识别语义衍生检索描述分布和目标语义衍生检索描述分布,分别将所述识别语义衍生检索描述分布和目标语义衍生检索描述分布传入所述描述挖掘子线程T5;
通过所述描述挖掘子线程T5,对所述识别语义衍生检索描述分布和目标语义衍生检索描述分布进行滑动平均操作和极性精简处理,确定事项语义衍生检索误差。
8.如权利要求1所述的方法,其特征在于,所述请求事项检索线程还包括请求核验阶段性线程;所述方法得到涵盖所述目标文档检索请求的语义衍生检索结果之后,还包括:
基于所述请求核验阶段性线程,对所述语义衍生检索结果进行核验,确定所述语义衍生检索结果中的目标文档检索请求的语义匹配情况;其中,所述请求核验阶段性线程是基于每个语义衍生检索范例请求事项和对应的实际请求事项调试得到的;所述实际请求事项中实际有对应的语义衍生检索范例请求事项中目标文档检索请求的语义匹配情况。
9.一种网络文档智能检索系统,其特征在于,包括存储器、处理器和网络模块;其中,所述存储器、所述处理器和所述网络模块之间直接或间接地电性连接;所述处理器通过从所述存储器中读取计算机程序并运行以实现权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行时实现权利要求1-8任一项所述的方法。
CN202111482857.8A 2021-12-07 2021-12-07 一种基于语义的网络文档智能检索方法及系统 Pending CN114091471A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111482857.8A CN114091471A (zh) 2021-12-07 2021-12-07 一种基于语义的网络文档智能检索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111482857.8A CN114091471A (zh) 2021-12-07 2021-12-07 一种基于语义的网络文档智能检索方法及系统

Publications (1)

Publication Number Publication Date
CN114091471A true CN114091471A (zh) 2022-02-25

Family

ID=80306695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111482857.8A Pending CN114091471A (zh) 2021-12-07 2021-12-07 一种基于语义的网络文档智能检索方法及系统

Country Status (1)

Country Link
CN (1) CN114091471A (zh)

Similar Documents

Publication Publication Date Title
US20150095305A1 (en) Detecting multistep operations when interacting with web applications
CN114066475A (zh) 基于云支付的信息安全防护方法及服务器
CN110866382A (zh) 一种文档生成方法、装置、终端设备及介质
CN110688111A (zh) 业务流程的配置方法、装置、服务器和存储介质
US20230419710A1 (en) Information extraction from documents containing handwritten text
CN111694992A (zh) 一种数据处理方法和装置
CN108399128A (zh) 一种用户数据的生成方法、装置、服务器及存储介质
CN114091471A (zh) 一种基于语义的网络文档智能检索方法及系统
CN113781126A (zh) 一种电商业务信息处理方法及系统
CN113781275A (zh) 一种教育资源管理方法及服务器
CN114071066A (zh) 应用于大数据视频会议的信息处理方法及服务器
CN114185318A (zh) 基于人工智能的生产线信息处理方法及系统
CN114090662A (zh) 基于虚拟现实的用户信息处理方法及服务系统
CN114385697A (zh) 一种游戏推荐方法及服务器
US10360137B2 (en) Adaptive testing using dynamically determined system resources of a computer system
CN110327626B (zh) 虚拟服务器创建方法及装置
CN113448838A (zh) 代码处理方法、装置及电子设备
US20160350155A1 (en) Synthesizing inputs to preserve functionality
CN110968566A (zh) 基于迁移工具的国产化应用系统迁移方法
CN114051042B (zh) 基于restful服务的物联网接口访问认证方法及系统
CN114048419A (zh) 基于云计算的网页信息分析方法及服务器
CN111176718A (zh) 脚本上线方法、装置、存储介质及电子设备
CN113793504A (zh) 基于大数据的智能引导停车方法及服务器
CN114048385A (zh) 基于用户画像分析的数据处理方法及服务器
CN114418518A (zh) 结合智慧城市的信息处理方法及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination