CN107247756B - 基于时态推理的学术论文精准检索方法及系统 - Google Patents

基于时态推理的学术论文精准检索方法及系统 Download PDF

Info

Publication number
CN107247756B
CN107247756B CN201710395534.2A CN201710395534A CN107247756B CN 107247756 B CN107247756 B CN 107247756B CN 201710395534 A CN201710395534 A CN 201710395534A CN 107247756 B CN107247756 B CN 107247756B
Authority
CN
China
Prior art keywords
paper
time
academic
papers
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710395534.2A
Other languages
English (en)
Other versions
CN107247756A (zh
Inventor
汤庸
朱定局
毛承洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201710395534.2A priority Critical patent/CN107247756B/zh
Publication of CN107247756A publication Critical patent/CN107247756A/zh
Application granted granted Critical
Publication of CN107247756B publication Critical patent/CN107247756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于时态推理的学术论文精准检索方法及系统,所述方法包括:获取用户需要检索论文的内容关键词和时间限定条件;通过内容关键词检索论文数据库中的所有学术论文,得到的检索结果加入到第一学术论文集合;从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据;将第一学术论文集合中的每个论文的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合;将检索学术论文集合的论文作为检索结果输出至用户。本发明可通过获取学术论文上的投稿日期、出版日期来进行时态推理,精准地获得用户想要检索的限定特定时间点或时间段的学术论文集合。

Description

基于时态推理的学术论文精准检索方法及系统
技术领域
本发明涉及论文检索技术领域,尤其涉及一种基于时态推理的学术论文精准检索方法及系统。
背景技术
相关技术中,学术论文的搜索方法一般为关键字搜索,通过搜索论文的关键字,检索与之相关的学术论文,或者设定更多的搜索条件,根据搜索条件检索更加精确的论文定位,但是,对于网页上的论文资料,由于其时间参数能够更多的反应论文的性质参数,但是现有技术的学术论文检索技术只能根据论文所在的网页发布日期或论文信息上传至网页的日期来进行限定时间的学术论文检索,例如检索2015之后的学术论文,现有学术论文检索技术无法根据论文的投稿日期、接受日期、网络版上线日期、正式出版日期来进行精准检索,更无法进行这些日期的组合精准检索。
因此,现有技术需要改进。
发明内容
根据本发明实施例的一个方面,提供的一种基于时态推理的学术论文精准检索方法,包括:
获取用户需要检索论文的内容关键词和时间限定条件;
通过内容关键词检索论文数据库中的所有学术论文,使得到的检索结果加入到第一学术论文集合;
从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据;
将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合;
将检索学术论文集合的论文作为检索结果输出至用户。
基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述内容关键词为检索论文中的一个或多个关键词组,所述多个关键词组之间为“与”或“或”的关系,初始状态为“或”的关系,所述多个关键词组之间“与”的关系表示在检索论文中需同时满足多个词组的全部词组的检索,所述多个关键词组之间“或”的关系表示在检索论文中至少满足多个词组中的一个词组的检索。
基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述多个关键词组的“与”的关系表示为:A and B或A+B,所述A表示一个关键词组,B表示另一个关键词组;
所述多个关键词组的“或”的关系表示为:A or B或A B,所述A表示一个关键词组,B表示另一个关键词组。
基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述时间限定条件包括:论文投稿时间条件和/或论文出版时间条件;
所述论文投稿时间条件包括论文数据库中所有学术论文中投稿的一个或多个时间点或时间段的时间条件;
所述论文出版时间条件包括论文数据库中所有学术论文中出版的一个或多个时间点或时间段的时间条件;
所述论文投稿时间条件为出版单位收到学术论文并予以登记日期的时间条件;
所述论文出版时间条件表示学术论文公开并予以登记出版时间的时间条件。
基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述时间点表示某一自然日;
所述时间段的计算方法为:
如果为一日,则该日时间段为本日的自然日时间;
如果为一月,则该一月时间段为本月的第一日至本月的最后一日的全部自然日时间;
如果为一年,则该一年时间段为本年的第一日至本年的最后一日的全部自然日时间;
如果为多日时间段,则表示为从该多日时间段的第一日至最后一日的全部自然日时间;
如果为多月时间段,则表示为从该多月时间段内的第一月的第一日至最后一月的最后一日的全部自然日时间;
如果为多年时间段,则表示为从该多年时间段内的第一年的第一月的第一日至最后一年的最后一月的最后一日的全部自然日时间。
基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据包括:
从第一学术论文集合中,提取论文的时间信息,所述论文的时间信息包括:论文投稿时间信息和出版时间信息;
根据论文投稿时间信息,将第一学术论文集合中的符合论文投稿时间信息条件的元素加入到第二学术论文集合;
根据论文出版时间信息,将第一学术论文集合中的符合论文出版时间信息条件的元素加入到第三学术论文集合。
基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合包括:
设定检索的论文投稿时间条件,在所述第二学术论文集合中检索出符合论文投稿时间条件的元素加入第四学术论文集合,所述第四学术论文集合为符合论文投稿时间条件的论文的集合;
设定检索的论文出版时间条件,在所述第三学术论文集合中检索出符合论文出版时间条件的元素加入第五学术论文集合,所述第五学术论文集合为符合论文出版时间条件的论文的集合;
判断论文投稿时间条件与论文出版时间条件的关系;
如果是“与”的关系,则将第四学术论文集合与第五学术论文集合的交集中的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据既符合论文投稿时间条件,又符合论文出版时间条件;
如果是“或”的关系,则将第四学术论文集合与第五学术论文集合的并集的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据符合论文投稿时间条件或论文出版时间条件中的至少一个。
基于本发明实施例的另一个方面,公开一种基于时态推理的学术论文精准检索系统,包括:
数据库单元,所述数据库单元包括存储模块,用于存储学术论文,并根据检索条件生成检索论文的存储模块,所述存储模块包括:第一存储模块、第二存储模块;
关键字搜索单元,输入搜索关键字后,所述关键字搜索单元自动在所述数据库单元搜索相关关键字的学术论文,并将检索到的学术论文存放到数据库单元的第一存储模块中;
时间信息提取单元,所述时间信息提取单元用于提取通过关键字检索后存储的学术论文的时间信息,所述时间信息包括:学术论文的投稿时间、学术论文的出版时间;
时间条件搜索单元,输入时间条件后,所述时间条件搜索单元自动在所述第一存储模块中按照事件条件搜索学术论文,并将符合条件的搜索结果存储在所述第二存储模块中。
基于上述基于时态推理的学术论文精准检索系统的另一个实施例中,所述时间条件搜索单元的输入搜索条件包括两部分,分别为学术论文的投稿时间条件和学术论文的出版时间条件。
所述时间条件搜索单元的输入搜索时间条件为时间点、多个时间点、时间段、多个时间段中的一种或多种。
所述时间条件搜索单元输入搜索时间条件之间的关系包括:“与”的关系和“或”的关系;
所述“与”的关系表示为:A and B或A+B,所述A表示一个关键词组,B表示另一个关键词组;
所述“或”的关系表示为:A or B或A B,所述A表示一个关键词组,B表示另一个关键词组。
基于上述基于时态推理的学术论文精准检索系统的另一个实施例中,所述时间条件搜索单元输入搜索时间条件为:
如果是时间点,表示某一自然日;
如果是多个时间点,表示多个自然日;
如果是时间段,表示从某一自然日到另一自然日之间的多个自然日;
如果是多个时间段,表示多个包含从某一自然日到另一自然日之间的多个自然日的时间段。
与现有技术相比,本发明包括以下优点:
本发明提出的一种基于时态推理的学术论文精准检索方法及系统,通过内容关键词检索获取符合条件的学术论文集合,提取学术论文的论文时态数据后,根据时间限定条件进行检索,从而获得对学术论文的精准检索,本发明可通过获取学术论文上的投稿日期、出版日期来进行时态推理,精准地获得用户想要检索的限定了特定时间点或时间段的学术论文集合。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所使用的附图做一简单地介绍。
图1是本发明的一种基于时态推理的学术论文精准检索系统的一个实施例的结构示意图。
图2是本发明的一种基于时态推理的学术论文精准检索方法的一个实施例的流程图。
图3是本发明的一种基于时态推理的学术论文精准检索方法的另一个实施例的流程图。
图4是本发明的一种基于时态推理的学术论文精准检索方法的又一个实施例的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明的一种基于时态推理的学术论文精准检索系统的一个实施例的结构示意图,如图2所示,所述基于时态推理的学术论文精准检索系统包括:
数据库单元1,所述数据库单元1包括存储模块,用于存储学术论文,并根据检索条件生成检索论文的存储模块,所述存储模块包括:第一存储模块、第二存储模块;
关键字搜索单元2,输入搜索关键字后,所述关键字搜索单元2自动在所述数据库单元1搜索相关关键字的学术论文,并将检索到的学术论文存放到数据库单元1的第一存储模块中;
时间信息提取单元3,所述时间信息提取单元3用于提取通过关键字检索后存储的学术论文的时间信息,所述时间信息包括:学术论文的投稿时间、学术论文的出版时间;
时间条件搜索单元4,输入时间条件后,所述时间条件搜索单元4自动在所述第一存储模块中按照事件条件搜索学术论文,并将符合条件的搜索结果存储在所述第二存储模块中。
所述时间条件搜索单元4的输入搜索条件包括两部分,分别为学术论文的投稿时间条件和学术论文的出版时间条件。
所述时间条件搜索单元4的输入搜索时间条件为时间点、多个时间点、时间段、多个时间段中的一种或多种。
所述时间条件搜索单元4输入搜索时间条件之间的关系包括:“与”的关系和“或”的关系;
所述“与”的关系表示为:A and B或A+B,所述A表示一个关键词组,B表示另一个关键词组;
所述“或”的关系表示为:A or B或A B,所述A表示一个关键词组,B表示另一个关键词组。
所述时间条件搜索单元4输入搜索时间条件为:
如果是时间点,表示某一自然日;
如果是多个时间点,表示多个自然日;
如果是时间段,表示从某一自然日到另一自然日之间的多个自然日;
如果是多个时间段,表示多个包含从某一自然日到另一自然日之间的多个自然日的时间段。
图2是本发明的一种基于时态推理的学术论文精准检索方法的一个实施例的流程图,如图2所示,所述基于时态推理的学术论文精准检索方法包括:
10,获取用户需要检索论文的内容关键词和时间限定条件;
20,通过内容关键词检索论文数据库中的所有学术论文,使得到的检索结果加入到第一学术论文集合,所述第一学术论文集合中的元素为学术论文数据库中所有符合内容关键词条件的学术论文;
30,从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据,所述学术论文的时态数据为第一学术集合中所有学术论文的时间特征的集合,包括论文投稿时间数据和论文出版时间数据,论文投稿时间数据为论文的投稿日,也即是学术论文完成撰写,已投送至杂志社、出版社、网站等可被公众知晓技术的媒体,但尚未被公众知晓的时间,论文出版时间数据为论文出版日,也即是学术论文完成向公众公开,并使公众能够以合法的手段获知论文全部技术数据的时间;
40,将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合;
50,将检索学术论文集合的论文作为检索结果输出至用户。
所述内容关键词为检索论文中的一个或多个关键词组,所述多个关键词组之间为“与”或“或”的关系,初始状态为“或”的关系,所述多个关键词组之间“与”的关系表示在检索论文中需同时满足多个词组的全部词组的检索,所述多个关键词组之间“或”的关系表示在检索论文中至少满足多个词组中的一个词组的检索,比如,学术论文检索内容关键词为“北京”、“上海”,如果是“与”的关系,则第一学术论文集合中的学术论文元素满足同时包含“北京”和“上海”两个关键词,如果是“或”的关系,则第一学术论文集合中的学术论文元素满足“北京”和“上海”两个关键词的人一个即可。
所述多个关键词组的“与”的关系表示为:A and B或A+B,所述A表示一个关键词组,B表示另一个关键词组,比如,学术论文检索内容关键词为“北京”、“上海”,其检索表达式可表示为:“北京and上海”,或者“北京+上海”。
所述多个关键词组的“或”的关系表示为:A or B或A B,所述A表示一个关键词组,B表示另一个关键词组,比如,学术论文检索内容关键词为“北京”、“上海”,其检索表达式可表示为:“北京or上海”,或者“北京上海”。
所述时间限定条件包括:论文投稿时间条件和/或论文出版时间条件,在设定时间限定条件时,可设置的时间段范围包括:
设定的时间段范围是学术论文的时态数据范围内的一段时间,此时,设置的时间段范围是全部有效的时间范围;
设定的时间段范围是学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是无效的时间范围,即无法检索到符合条件的学术论文;
设定的时间段范围是一部分为学术论文的时态数据范围内的一段时间、一部分学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是部分有效时间范围,即只能在有效的时间段范围内检索到符合条件的学术论文。
所述论文投稿时间条件包括论文数据库中所有学术论文中投稿的一个或多个时间点或时间段的时间条件;
所述论文出版时间条件包括论文数据库中所有学术论文中出版的一个或多个时间点或时间段的时间条件;
所述论文投稿时间条件为出版单位收到学术论文并予以登记日期的时间条件;
所述论文出版时间条件表示学术论文公开并予以登记出版时间的时间条件。
所述时间点表示某一自然日,如果检索时间限定条件为:AA日BB时CC分DD秒或AA日BB时CC分或AA日BB时,则检索时间限定条件设置为AA日。
所述时间段的计算方法为:
如果为一日,则该日时间段为本日的自然日时间,在AA日00时00分00秒至AA日23时59分59秒范围内的检索时间限定条件的检索都是关于AA日的检索时间限定条件的检索;
如果为一月,则该一月时间段为本月的第一日至本月的最后一日的全部自然日时间;
如果为一年,则该一年时间段为本年的第一日至本年的最后一日的全部自然日时间;
如果为多日时间段,则表示为从该多日时间段的第一日至最后一日的全部自然日时间;
如果为多月时间段,则表示为从该多月时间段内的第一月的第一日至最后一月的最后一日的全部自然日时间;
如果为多年时间段,则表示为从该多年时间段内的第一年的第一月的第一日至最后一年的最后一月的最后一日的全部自然日时间;
上述日然日时间为从00时00分00秒至23时59分59秒之间的所有时间点的集合。
图3是本发明的一种基于时态推理的学术论文精准检索方法的另一个实施例的流程图,如图3所示,所述从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据包括:
101,从第一学术论文集合中,提取论文的时间信息,所述论文的时间信息包括:论文投稿时间信息和出版时间信息;
102,根据论文投稿时间信息,将第一学术论文集合中的符合论文投稿时间信息条件的元素加入到第二学术论文集合;
103,根据论文出版时间信息,将第一学术论文集合中的符合论文出版时间信息条件的元素加入到第三学术论文集合。
图4是本发明的一种基于时态推理的学术论文精准检索方法的又一个实施例的流程图,如图4所示,所述将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合包括:
201,设定检索的论文投稿时间条件,在所述第二学术论文集合中检索出符合论文投稿时间条件的元素加入第四学术论文集合,所述第四学术论文集合为符合论文投稿时间条件的论文的集合;
202,设定检索的论文出版时间条件,在所述第三学术论文集合中检索出符合论文出版时间条件的元素加入第五学术论文集合,所述第五学术论文集合为符合论文出版时间条件的论文的集合;
203,判断论文投稿时间条件与论文出版时间条件的关系;
204,如果是“与”的关系,则将第四学术论文集合与第五学术论文集合的交集中的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据既符合论文投稿时间条件,又符合论文出版时间条件;
205,如果是“或”的关系,则将第四学术论文集合与第五学术论文集合的并集的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据符合论文投稿时间条件或论文出版时间条件中的至少一个。
以上对本发明所提供的一种基于时态推理的学术论文精准检索方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于时态推理的学术论文精准检索方法,其特征在于,包括:
获取用户需要检索论文的内容关键词和时间限定条件;
在设定时间限定条件时,可设置的时间段范围包括:设定的时间段范围是学术论文的时态数据范围内的一段时间,此时,设置的时间段范围是全部有效的时间范围;设定的时间段范围是学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是无效的时间范围,即无法检索到符合条件的学术论文;设定的时间段范围是一部分为学术论文的时态数据范围内的一段时间、一部分学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是部分有效时间范围,即只能在有效的时间段范围内检索到符合条件的学术论文;
通过内容关键词检索论文数据库中的所有学术论文,使得到的检索结果加入到第一学术论文集合;
从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据;具体包括:从第一学术论文集合中,提取论文的时间信息,所述论文的时间信息包括论文投稿时间信息和出版时间信息;根据论文投稿时间信息,将第一学术论文集合中的符合论文投稿时间信息条件的元素加入到第二学术论文集合;根据论文出版时间信息,将第一学术论文集合中的符合论文出版时间信息条件的元素加入到第三学术论文集合;
将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合;具体包括:设定检索的论文投稿时间条件,在所述第二学术论文集合中检索出符合论文投稿时间条件的元素加入第四学术论文集合,所述第四学术论文集合为符合论文投稿时间条件的论文的集合;设定检索的论文出版时间条件,在所述第三学术论文集合中检索出符合论文出版时间条件的元素加入第五学术论文集合,所述第五学术论文集合为符合论文出版时间条件的论文的集合;判断论文投稿时间条件与论文出版时间条件的关系;如果是“与”的关系,则将第四学术论文集合与第五学术论文集合的交集中的元素加入到检索学术论文集合,所述检索学术论文集合中的论文的时态数据既符合论文投稿时间条件,又符合论文出版时间条件;如果是“或”的关系,则将第四学术论文集合与第五学术论文集合的并集的元素加入到检索学术论文集合,所述检索学术论文集合中的论文的时态数据符合论文投稿时间条件或论文出版时间条件中的至少一个;
所述学术论文的时态数据为第一学术集合中所有学术论文的时间特征的集合,包括论文投稿时间数据和论文出版时间数据,论文投稿时间数据为论文的投稿日,也即是学术论文完成撰写,已投送至杂志社、出版社、网站媒体,但尚未被公众知晓的时间,论文出版时间数据为论文出版日,也即是学术论文完成向公众公开,可被公众知晓,并使公众能够以合法的手段获知论文全部技术数据的时间;
将检索学术论文集合的论文作为检索结果输出至用户。
2.如权利要求1所述的基于时态推理的学术论文精准检索方法,其特征在于,所述内容关键词为检索论文中的一个或多个关键词组,所述多个关键词组之间为“与”或“或”的关系,初始状态为“或”的关系,所述多个关键词组之间“与”的关系表示在检索论文中需同时满足多个词组的全部词组的检索,所述多个关键词组之间“或”的关系表示在检索论文中至少满足多个词组中的一个词组的检索。
3.如权利要求2所述的基于时态推理的学术论文精准检索方法,其特征在于,所述多个关键词组的“与”的关系表示为:A and B或A+B,所述A表示一个关键词组,B表示另一个关键词组;
所述多个关键词组的“或”的关系表示为:A or B或A B,所述A表示一个关键词组,B表示另一个关键词组。
4.如权利要求1所述的基于时态推理的学术论文精准检索方法,其特征在于,所述时间限定条件包括:论文投稿时间条件和/或论文出版时间条件;
所述论文投稿时间条件包括论文数据库中所有学术论文中投稿的一个或多个时间点或时间段的时间条件;
所述论文出版时间条件包括论文数据库中所有学术论文中出版的一个或多个时间点或时间段的时间条件;
所述论文投稿时间条件为出版单位收到学术论文并予以登记日期的时间条件;
所述论文出版时间条件表示学术论文公开并予以登记出版时间的时间条件。
5.如权利要求4所述的基于时态推理的学术论文精准检索方法,其特征在于,所述时间点表示某一自然日;
所述时间段的计算方法为:
如果为一日,则该日时间段为本日的自然日时间;
如果为一月,则该一月时间段为本月的第一日至本月的最后一日的全部自然日时间;
如果为一年,则该一年时间段为本年的第一日至本年的最后一日的全部自然日时间;
如果为多日时间段,则表示为从该多日时间段的第一日至最后一日的全部自然日时间;
如果为多月时间段,则表示为从该多月时间段内的第一月的第一日至最后一月的最后一日的全部自然日时间;
如果为多年时间段,则表示为从该多年时间段内的第一年的第一月的第一日至最后一年的最后一月的最后一日的全部自然日时间。
6.一种基于时态推理的学术论文精准检索系统,其特征在于,包括:
数据库单元,所述数据库单元包括存储模块,用于存储学术论文,并根据检索条件生成检索论文的存储模块,所述存储模块包括:第一存储模块、第二存储模块;
关键字搜索单元,输入搜索关键字后,所述关键字搜索单元自动在所述数据库单元搜索相关关键字的学术论文,并将检索到的学术论文存放到数据库单元的第一存储模块中;
时间信息提取单元,所述时间信息提取单元用于提取通过关键字检索后存储的学术论文的时间信息,所述时间信息包括:学术论文的投稿时间、学术论文的出版时间;
时间条件搜索单元,输入时间条件后,所述时间条件搜索单元自动在所述第一存储模块中按照事件条件搜索学术论文,并将符合条件的搜索结果存储在所述第二存储模块中;
在设定时间限定条件时,可设置的时间段范围包括:设定的时间段范围是学术论文的时态数据范围内的一段时间,此时,设置的时间段范围是全部有效的时间范围;设定的时间段范围是学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是无效的时间范围,即无法检索到符合条件的学术论文;设定的时间段范围是一部分为学术论文的时态数据范围内的一段时间、一部分学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是部分有效时间范围,即只能在有效的时间段范围内检索到符合条件的学术论文;从第一学术论文集合中,提取论文的时间信息,所述论文的时间信息包括论文投稿时间信息和出版时间信息;根据论文投稿时间信息,将第一学术论文集合中的符合论文投稿时间信息条件的元素加入到第二学术论文集合;根据论文出版时间信息,将第一学术论文集合中的符合论文出版时间信息条件的元素加入到第三学术论文集合;设定检索的论文投稿时间条件,在所述第二学术论文集合中检索出符合论文投稿时间条件的元素加入第四学术论文集合,所述第四学术论文集合为符合论文投稿时间条件的论文的集合;设定检索的论文出版时间条件,在所述第三学术论文集合中检索出符合论文出版时间条件的元素加入第五学术论文集合,所述第五学术论文集合为符合论文出版时间条件的论文的集合;判断论文投稿时间条件与论文出版时间条件的关系;如果是“与”的关系,则将第四学术论文集合与第五学术论文集合的交集中的元素加入到检索学术论文集合,所述检索学术论文集合中的论文的时态数据既符合论文投稿时间条件,又符合论文出版时间条件;如果是“或”的关系,则将第四学术论文集合与第五学术论文集合的并集的元素加入到检索学术论文集合,所述检索学术论文集合中的论文的时态数据符合论文投稿时间条件或论文出版时间条件中的至少一个;所述学术论文的时态数据为第一学术集合中所有学术论文的时间特征的集合,包括论文投稿时间数据和论文出版时间数据,论文投稿时间数据为论文的投稿日,也即是学术论文完成撰写,已投送至杂志社、出版社、网站媒体,但尚未被公众知晓的时间,论文出版时间数据为论文出版日,也即是学术论文完成向公众公开,可被公众知晓,并使公众能够以合法的手段获知论文全部技术数据的时间。
7.如权利要求6所述的系统,其特征在于,所述时间条件搜索单元的输入搜索条件包括两部分,分别为学术论文的投稿时间条件和学术论文的出版时间条件;
所述时间条件搜索单元的输入搜索时间条件为时间点、多个时间点、时间段、多个时间段中的一种或多种;
所述时间条件搜索单元输入搜索时间条件之间的关系包括:“与”的关系和“或”的关系;
所述“与”的关系表示为:A and B或A+B,所述A表示一个关键词组,B表示另一个关键词组;
所述“或”的关系表示为:A or B或A B,所述A表示一个关键词组,B表示另一个关键词组。
8.如权利要求7所述的系统,其特征在于,所述时间条件搜索单元输入搜索时间条件为:
如果是时间点,表示某一自然日;
如果是多个时间点,表示多个自然日;
如果是时间段,表示从某一自然日到另一自然日之间的多个自然日;
如果是多个时间段,表示多个包含从某一自然日到另一自然日之间的多个自然日的时间段。
CN201710395534.2A 2017-05-26 2017-05-26 基于时态推理的学术论文精准检索方法及系统 Active CN107247756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710395534.2A CN107247756B (zh) 2017-05-26 2017-05-26 基于时态推理的学术论文精准检索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710395534.2A CN107247756B (zh) 2017-05-26 2017-05-26 基于时态推理的学术论文精准检索方法及系统

Publications (2)

Publication Number Publication Date
CN107247756A CN107247756A (zh) 2017-10-13
CN107247756B true CN107247756B (zh) 2021-08-06

Family

ID=60018758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710395534.2A Active CN107247756B (zh) 2017-05-26 2017-05-26 基于时态推理的学术论文精准检索方法及系统

Country Status (1)

Country Link
CN (1) CN107247756B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009278A (zh) * 2017-12-20 2018-05-08 华南师范大学 一种基于时态推理的学术关系精准判别方法和系统
CN111435376A (zh) * 2019-01-15 2020-07-21 北京京东尚科信息技术有限公司 信息处理方法及系统、计算机系统和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178786A (zh) * 2006-11-09 2008-05-14 上海晨鸟信息科技有限公司 一种利用网络资源实现剽窃和格式检查的在线论文管理方法
CN104750762A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 一种信息检索方法及装置
CN105550216A (zh) * 2015-12-03 2016-05-04 百度在线网络技术(北京)有限公司 学术研究信息的搜索方法、挖掘方法及装置
CN106354802A (zh) * 2016-08-26 2017-01-25 北京恒华伟业科技股份有限公司 一种附件检索方法及装置
CN106682113A (zh) * 2016-12-07 2017-05-17 广东小天才科技有限公司 一种习题搜索方法及设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9128983B2 (en) * 2010-10-13 2015-09-08 Aol Inc. Systems and methods for query optimization
CN104636468A (zh) * 2015-02-10 2015-05-20 广州供电局有限公司 数据查询分析方法和系统
CN105069080B (zh) * 2015-07-31 2018-06-29 中国农业科学院农业信息研究所 一种文献检索方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178786A (zh) * 2006-11-09 2008-05-14 上海晨鸟信息科技有限公司 一种利用网络资源实现剽窃和格式检查的在线论文管理方法
CN104750762A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 一种信息检索方法及装置
CN105550216A (zh) * 2015-12-03 2016-05-04 百度在线网络技术(北京)有限公司 学术研究信息的搜索方法、挖掘方法及装置
CN106354802A (zh) * 2016-08-26 2017-01-25 北京恒华伟业科技股份有限公司 一种附件检索方法及装置
CN106682113A (zh) * 2016-12-07 2017-05-17 广东小天才科技有限公司 一种习题搜索方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
论CNKI非专利文献公开日期的确定;李刚,等;《中国发明与专利》;20120131;第102-105页 *

Also Published As

Publication number Publication date
CN107247756A (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
US20210209182A1 (en) Systems and methods for improved web searching
US11204950B2 (en) Automated concepts for interrogating a document storage database
US8341167B1 (en) Context based interactive search
US20130013616A1 (en) Systems and Methods for Natural Language Searching of Structured Data
CN105740366A (zh) 微博用户兴趣推理方法及装置
US10185751B1 (en) Identifying and ranking attributes of entities
CN112559895B (zh) 一种数据处理方法、装置、电子设备及存储介质
US9760600B2 (en) Serving recurrent calendar events
Hauff et al. Placing images on the world map: a microblog-based enrichment approach
CN110609889B (zh) 基于学术网络确定对象重要性排名及选择评审专家的方法和系统
CN107247756B (zh) 基于时态推理的学术论文精准检索方法及系统
Myntti et al. Authority control in a digital repository: Preparing for linked data
CN112417175A (zh) 面向维修工单的文档检索方法、系统、计算机及存储介质
CN112202889B (zh) 信息的推送方法、装置和存储介质
JP6095487B2 (ja) 質問応答装置、及び質問応答方法
Beall Geographical research and the problem of variant place names in digitized books and other full-text resources
CN105488165B (zh) 基于索引库的数据检索方法及系统
CN115544225A (zh) 基于语义的数字档案信息关联检索方法
CN114443632A (zh) 一种学分银行学分智能转换方法及系统、计算机设备
CN113468206A (zh) 数据维护方法、装置、服务器、介质及产品
US20210157804A1 (en) Reporting and knowledge discovery for databases
CN107679154B (zh) 一种基于时间轴的历史题解题方法、系统及介质
CN101669119B (zh) 内容处理装置和内容处理方法
Zuccon et al. Retrieval of health advice on the web: AEHRC at ShARe/CLEF eHealth evaluation lab task 3
CN115168684B (zh) 一种财务档案管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant