CN113505570B - 参考文献参见落空的审校方法、装置、设备及存储介质 - Google Patents

参考文献参见落空的审校方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113505570B
CN113505570B CN202110571584.8A CN202110571584A CN113505570B CN 113505570 B CN113505570 B CN 113505570B CN 202110571584 A CN202110571584 A CN 202110571584A CN 113505570 B CN113505570 B CN 113505570B
Authority
CN
China
Prior art keywords
author
name
document
contained
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110571584.8A
Other languages
English (en)
Other versions
CN113505570A (zh
Inventor
魏巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Founder Electronics Co Ltd
Original Assignee
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Founder Electronics Co Ltd filed Critical Beijing Founder Electronics Co Ltd
Priority to CN202110571584.8A priority Critical patent/CN113505570B/zh
Publication of CN113505570A publication Critical patent/CN113505570A/zh
Application granted granted Critical
Publication of CN113505570B publication Critical patent/CN113505570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请提供一种参考文献参见落空的审校方法、装置、设备及存储介质。获取来自客户端的待审校文献的参考文献列表,并根据参考文献列表包含的至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份;若目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中,则向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。本申请可以提升参考文献参见落空的审校效率。

Description

参考文献参见落空的审校方法、装置、设备及存储介质
技术领域
本申请涉及审校技术,尤其涉及一种参考文献参见落空的审校方法、装置、设备及存储介质。
背景技术
参考文献审校是期刊论文审校中一个重要的环节。作者在编辑期刊或论文时,会出现删除参考文献列表中参考文献,但未删除正文中关于参考文献的标注的现象,这就出现了无效的参考文献的标注,也就是参考文献参见落空。而在众多格式的参考文献的标注中,“作者-出版年制”这种格式的参考文献的标注较为常见。
目前,在确定期刊或论文中是否存在参考文献参见落空的现象时,需要人为的去比对期刊或论文的正文和参考文献列表,审校效率低。
发明内容
本申请提供一种参考文献参见落空的审校方法、装置、设备及存储介质,用以实现对“作者-出版年制”格式的参考文献参见落空的高效审校。
一方面,本申请实施例提供一种参考文献参见落空的审校方法,包括:响应于接收到客户端发送的审校请求,获取待审校文献的参考文献列表,参考文献列表包含至少一参考文献条目,审校请求包含待审校文献的信息;根据至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份;若目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中,则向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。
一种可能的实施方式中,上述根据至少一参考文献条目,获取待审校文献对应的参考文献信息集合,包括:遍历每一参考文献条目,根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份,信息提取模型用于提取参考文献条目中的作者姓名和出版年份;根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合。
一种可能的实施方式中,信息提取模型包括第一子模型和第二子模型。该情况下,上述根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份,包括:将参考文献条目输入第一子模型,得到参考文献条目包含的作者姓名区域和出版年份,第一子模型用于提取参考文献条目包含的作者姓名区域和出版年份;将作者姓名区域输入第二子模型,得到参考文献条目包含的作者姓名,第二子模型用于提取作者姓名区域中包含的作者姓名。
一种可能的实施方式中,上述根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合,包括:按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合;建立作者姓名组合与出版年份的对应关系,得到待审校文献对应的参考文献信息集合。
一种可能的实施方式中,上述按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合,包括:若作者姓名是英文作者姓名,则从作者姓名提取作者的姓氏;按照预设姓名组合规则对参考文献条目包含的姓氏进行组合处理,得到参考文献条目对应的作者姓名组合。
一种可能的实施方式中,当参考文条目包含多个作者姓名时,按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合,包括:采用预设关联字符,对多个作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合。
一种可能的实施方式中,上述识别段落中包含的参考文献的标注,包括:识别段落中包含的目标出版年份;基于预设关键词,识别段落中包含的目标作者姓名。
另一方面,本申请提供一种参考文献参见落空的审校装置,包括:
获取模块,用于响应于接收到客户端发送的审校请求,获取待审校文献的参考文献列表,参考文献列表包含至少一参考文献条目,审校请求包含待审校文献的信息;
处理模块,用于根据至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;
识别模块,用于遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份;
输出模块,用于在目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中时,向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。
一种可能的实施方式中,处理模块具体用于:遍历每一参考文献条目,根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份,信息提取模型用于提取参考文献条目中的作者姓名和出版年份;根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合。
一种可能的实施方式中,信息提取模型包括第一子模型和第二子模型。该情况下,处理模块在用于根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份时,具体用于:将参考文献条目输入第一子模型,得到参考文献条目包含的作者姓名区域和出版年份,第一子模型用于提取参考文献条目包含的作者姓名区域和出版年份;将作者姓名区域输入第二子模型,得到参考文献条目包含的作者姓名,第二子模型用于提取作者姓名区域中包含的作者姓名。
一种可能的实施方式中,处理模块在用于根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合时,具体用于:按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合;建立作者姓名组合与出版年份的对应关系,得到待审校文献对应的参考文献信息集合。
一种可能的实施方式中,处理模块在用于按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合时,具体用于:若作者姓名是英文作者姓名,则从作者姓名提取作者的姓氏;按照预设姓名组合规则对参考文献条目包含的姓氏进行组合处理,得到参考文献条目对应的作者姓名组合。
一种可能的实施方式中,当参考文条目包含多个作者姓名时,处理模块在用于按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合时,具体用于:采用预设关联字符,对多个作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合。
一种可能的实施方式中,识别模块具体用于:识别段落中包含的目标出版年份;基于预设关键词,识别段落中包含的目标作者姓名。
又一方面,本申请实施例提供一种电子设备,包括:处理器、存储器及存储在存储器上的计算机程序,处理器执行计算机程序时实现如上所述的参考文献参见落空的审校方法。
又一方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行如上所述的参考文献参见落空的审校方法。
又一方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序在电子设备上运行时,使得电子设备执行如上所述的参考文献参见落空的审校方法。
本申请提供的参考文献参见落空的审校方法、装置、设备及存储介质,获取来自客户端的待审校文献的参考文献列表,并根据参考文献列表包含的至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份;若目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中,则向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。本申请实施例通过设备自动化实现对待审校文献中是否存在参考文献参见落空的审校,相比人工审校,一方面,大大提升了审校效率;另一方面,减少了参考文献参见落空出现遗漏的现象。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请提供的参考文献参见落空的审校方法的应用场景示意图;
图2为本申请一实施例提供的参考文献参见落空的审校方法的流程示意图;
图3为本申请一实施例提供的参考文献参见落空的审校装置的结构示意图;
图4为本申请一实施例提供的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
首先对本申请所涉及的名词进行解释:
参考文献落空:是指作者在编辑期刊或论文等文献时,将该文献的参考文献列表中的一些参考文献条目删除后,却并没有删除文献的正文中的与该参考文献条目对应的参考文献的标注,这就出现了无效的参考文献的标注,也就是参考文献参见落空。
作者-出版年制:是指一种文后参考文献的标注体系,即引文采用“作者-出版年制”,参考文献表按作者字顺和出版年排序。
隐马尔可夫模型:是指一种关于时序的概率模型,描述一个由隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个可观测的观测随机序列的过程,常用于分词。
斯坦福NER(Stanford NER):是一个用Java语言实现的命名实体识别程序,用于拆分作者姓名区域形成单个作者姓名。命名实体识别(NER)标注了文档中的单词序列是东西的名字,例如人名、公司名或基因、专有名称。它带有用于命名实体识别的精心设计的特征提取器,以及定义特征提取器的许多选项,尤其善于识别3类命名实体:人名、组织名、地名。
现有技术中,对于参考文献参见落空的审校是人工实现的,而人工审校参考文献参见落空主要依靠经验。某些情况下,例如当参考文献列表中包含的参考文献条目较多,和/或,正文篇幅较长时,若人工审校是否存在参考文献参见落空的情况,需要花费较长的时间,且易出现参考文献参见落空未被检出的现象。
另外,对于多种格式的参考文献的标注,其中“作者-出版年制”格式是较为常见的。
例如,“作者-出版年制”格式的参考文献的标注为“张三,2005”,其中,“张三”为此处所引用参考文献的作者,“2005”为该参考文献的出版年份。该参考文献的标注对应的参考文献列表中的参考文献条目为“张三.2005.参考文献名称,出版单位名称,所引用部分在参考文献中的段落等信息.”。若参考文献的标注为“张三,2005”,但在参考文献列表中没有找到包含作者是张三出版年份是2005的参考文献条目,就是参考文献参见落空。
因此,针对现有技术存在的问题,针对“作者-出版年制”格式的参考文献的标注,本申请提出了一种参考文献参见落空的审校方法、装置、设备及存储介质,通过电子设备遍历正文中每一段落,自动审校期刊或论文等文献中是否存在参考文献参见落空,这样既避免了参考文献参见落空未被检出的现象,还可以提升审校效率。
示例性地,图1为本申请提供的参考文献参见落空的审校方法的应用场景示意图,如图1所示,该应用场景可以包括:一个客户端(图1示出了三个客户端,分别为客户端111、客户端112、客户端113)、网络12和服务器13。其中,每个客户端11与服务器13通过网络12进行通信。
示例地,在实际应用中,当用户在客户端111进行期刊或论文等文献的审校时,此时该文献即为待审校文献,用户通过某些操作(例如通过点击界面上显示的标注有“提交”等字样的虚拟按键)触发客户端111通过网络12向服务器13发送审校请求,该审校请求中可以携带待审核文献的标识信息,例如待审核文献的名称等;相应地,服务器13接收审校请求,并根据其中携带的待审核文献的标识信息,从其内部或外部数据源获取该待审校文献的参考文献列表,之后根据参考文献列表包含的至少一参考文献条目,获取待审校文献对应的参考文献信息集合;然后,服务器13遍历待审校文献的正文中每一段落,识别段落中包含的包含目标作者姓名和目标出版年份的参考文献的标注,若目标作者姓名和目标出版年份的组合关系不包含在上述参考文献信息集合中,则服务器13向客户端111发送用于指示参考文献参见落空的审校结果,这样客户端111在接收到该审校结果后即可显示审校结果,其中,审校结果包含参考文献的标注所在的段落。用户即可在正文中找到该段落,进一步找到参考文献参见落空的参考文献的标注,对其进行删除;或者,在参考文献列表中添加该参考文献的标注对应的参考文献条目。
或者,上述审校请求中可以携带待审核文献,这样服务器13从审校请求即可获取该待审核文献。
需要说明的是,附图1仅是本申请实施例提供的一种应用场景的示意图,本申请实施例不对图1中包括的设备进行限定,也不对图1中设备之间的位置关系进行限定,例如,在图1所示的应用场景中,还可以包括数据存储设备,该数据存储设备相对服务器13可以是外部存储器,也可以是集成在服务器13中的内部存储器。另外,服务器13可以是独立的服务器,或者,也可以是服务集群等。
下面,通过具体实施例对本申请的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请一实施例提供的参考文献参见落空的审校方法的流程示意图。本申请实施例提供一种参考文献参见落空的审校方法,应用于参考文献参见落空的审校装置,该装置可以通过软件和/或硬件的方式实现。可选地,在图1所示场景中,该参考文献参见落空的审校装置可以集成于服务器中,例如参考文献参见落空的审校装置为服务器中的芯片或电路;或者,该参考文献参见落空的审校装置为服务器。接下来,以服务器作为执行主体进行示例说明。
如图2所示,该参考文献参见落空的审校方法包括如下步骤:
S201、响应于接收到客户端发送的审校请求,获取待审校文献的参考文献列表,参考文献列表包含至少一参考文献条目,审校请求包含待审校文献的信息。
实际应用中,当用户有对某文献(该文献即待审校文献)是否存在参考文献参见落空进行审校的需求时,在客户端处执行相应操作,客户端响应该操作,发送审校请求给服务器,触发服务器执行参考文献参见落空的审校的流程。其中,审校请求包含待审校文献的信息。其中,待审校文献可以包含期刊、论文等。
相应地,服务器接收审校请求,并对其做出响应。具体地,服务器解析该审校请求,获取其中包含的待审校文献的信息;基于该信息,服务器可以从内部存储介质或外部数据源,获取具有该信息指示的待审校文献,或者,该信息包含待审校文献本身,此时服务器即可通过解析审校请求获取待审校文献。
由于文献包含参考文献列表和正文,因此服务器在获取待审校文献之后,可以从待审校文献中获取参考文献列表。其中,参考文献列表包含至少一参考文献条目,参考文献条目包括作者姓名区域和出版年份等信息,作者姓名区域是由一个或多个作者姓名通过参考文献条目规则组合而成的,出版年份是对应参考文献的出版年份,但本申请不对其进行限制,也就是说,参考文献条目还可以包含出版月份等更精确的时间信息。
S202、根据至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系。
具体地,服务器通过识别各参考文献条目中的作者姓名和出版年份,得到参考文献信息集合。该参考文献信息集合包含按照预设组合形式形成的作者姓名和出版年份的组合。
示例地,参考文献条目的格式为:作者姓名.出版年份.参考文献名称。例如,待审校文献的参考文献列表中包含3个参考文献条目,具体为:
参考文献条目一:作者姓名1,作者姓名2.2010.参考文献名称一;
参考文献条目二:作者姓名3.1998.参考文献名称二;
参考文献条目三:作者姓名4,作者姓名5,作者姓名6.2020.参考文献名称三。
服务器按照预设组合形式对其中包含的作者姓名和出版年份进行组合,示例地,预设组合形式为首个作者姓名-出版年份,上述示例中参考文献条目一对应的组合为:作者姓名1-2010。
或者,若预设组合形式为作者姓名与出版年份的组合,则上述示例中参考文献条目一对应的组合为:作者姓名1-2010、作者姓名1&2010、作者姓名1&作者姓名2&2010,等等。
通过对每一参考文献条目进行上述处理,得到参考文献信息集合。
S203、遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份。
通常情况下,待审校文献的正文位于待审校文献靠前的位置,正文中存在着至少一个段落,其中每个段落中都可能包含参考文献的标注,因此服务器需遍历待审校文献的正文中每一段落,识别该段落中是否包含参考文献的标注。段落中包含的参考文献的标注即为待审校的是否存在参考文献参见落空的对象,其中包含的作者姓名和出版年份即为目标作者姓名和目标出版年份。目标作者姓名是该段落引用对应参考文献的作者姓名,目标出版年份是该段落引用对应参考文献的出版年份。
S204、若目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中,则向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。
基于参考文献信息集合中组合方式,对S203中识别出的目标作者姓名和目标出版年份进行组合,若目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中,则说明出现了参考文献参见落空的情况,这时则需要向客户端发送用于指示参考文献参见落空的审校结果,以使用户根据客户端显示的审校结果,对待审校文献进行修改,其中包括对对应段落中参考文献的标注的修改和/或对参考文献列表中参考文献目录的修改。
至于客户端显示审校结果的具体实现,本申请不予限制,例如,客户端可以通过消息提示的方式显示审校结果,或者,客户端通过不同于其他段落的颜色或字体类型等方式,提示审校结果对应的段落,等等。
若目标作者姓名和目标出版年份的组合关系包含在参考文献信息集合中,则说明出现未出现参考文献参见落空的情况,此时服务器识别该段落中包含的其他参考文献的标注,直至该段落结束,服务器识别下一段落中包含的参考文献的标注,直至正文结束。
本申请实施例提供参考文献参见落空的审校方法,获取来自客户端的待审校文献的参考文献列表,并根据参考文献列表包含的至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份;若目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中,则向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。本申请实施例通过设备自动化实现对待审校文献中是否存在参考文献参见落空的审校,相比人工审校,一方面,大大提升了审校效率;另一方面,减少了参考文献参见落空出现遗漏的现象。
在上述实施例的基础上,一种具体实现方式中,上述根据至少一参考文献条目,获取待审校文献对应的参考文献信息集合,可以包括:遍历每一参考文献条目,根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份,信息提取模型用于提取参考文献条目中的作者姓名和出版年份;根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合。
该实现方式中,服务器首先遍历待审校文献的参考文献列表中每一参考文献条目,采用预先训练好的信息提取模型提取参考文献条目中包含的作者姓名和出版年份,以获取参考文献信息集合。具体地,将参考文献条目作为信息提取模型输入参数,得到信息提取模型的输出,即该参考文献条目中的作者姓名和出版年份。示例地,如果信息提取模型对“作者姓名1,作者姓名2.2010.参考文献名称.出版单位”的参考文献条目进行信息提取,则将该参考文献条目输入信息提取模型,信息提取模型的输出为“作者姓名1”,“作者姓名2”和“2010(出版年份)”。
示例地,参考文献信息集合可以包含多个实例,其中,实例对应参考文献条目。也就是说,参考文献列表中的每一个参考文献条目在参考文献信息集合中都对应有一个实例,实例中包含一个所有可能出现的作者姓名组合的集合、出版年份。例如,参考文献信息集合中每个实例结构如下:
这样,对于S204步骤,可以首先确定目标出版年份是否包含在参考文献信息集合中,找出所有符合条件的实例,这样可以缩小查找范围;再遍历这些实例中所有作者姓名是否匹配参考文献的标注中的作者姓名。如果没有匹配到,则向客户端发送用于指示参考文献参见落空的审校结果。可选地,审校结果中可以包含该参考文献的标注所在上下文、段落号、页码等位置信息,示例如下:
<item message=”参考文献参见落空”suggestion=”请补充缺失的参考文献(Rios et al.,2003)”context=”increasing from the SE to the NW(Rios et al.,2003)”page=”8”pi=”178”>
其中,“message”表示参考文献参见落空,“suggestion”表示审校建议,“context”表示该参考文献的标注所在的上下文,“page”表示该参考文献的标注所在页码,“pi”表示该参考文献的标注所在段落。
可选地,信息提取模型可以是一个独立的模型,或者,信息提取模型可以包括多个子模型。以下以信息提取模型包含两个子模型为例进行说明。
例如,信息提取模型包括第一子模型和第二子模型,其中,第一子模型用于提取参考文献条目包含的作者姓名区域和出版年份;第二子模型用于提取作者姓名区域中包含的作者姓名。该情况下,上述根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份,可以包括:将参考文献条目输入第一子模型,得到该参考文献条目包含的作者姓名区域和出版年份;将作者姓名区域输入第二子模型,得到参考文献条目包含的作者姓名。也就是说,将第一子模型的输出作为第二子模型的输入。
一种示例中,第一子模型可以具体为训练好的隐马尔可夫模型,通过隐马尔可夫模型识别出参考文献条目中包含的作者姓名区域和出版年份。此时的作者姓名区域内可能包含有多个作者姓名,再通过机器学习得到的第二子模型将作者姓名区域拆分成单个作者姓名。其中,机器学习得到的第二子模型可以是斯坦福NER,它将每个作者姓名按类标记出来,将期刊论文等文献的一部分作为训练数据,例如可以选用具有代表性的、符合规范的文献作为训练数据,标记大量的作者姓名文本,进行斯坦福NER的训练,数据量越大,后期使用训练好的斯坦福NER识别预测数据的作者姓名的准确率越高。具体的模型训练过程可参考相关技术,此处不再赘述。
示例地,如果对“作者姓名1,作者姓名2.2010.参考文献名称.出版单位”的参考文献条目进行信息提取,将该参考文献条目作为第一子模型的输入参数,得到第一子模型输出的是“作者姓名1,作者姓名2”和“2010”,其中,“作者姓名1,作者姓名2”即表示作者姓名区域;将“作者姓名1,作者姓名2”作为第二子模型的输入,第二子模型输出的是中的“作者姓名1”和“作者姓名2”。
另外,上述根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合,可以包括:按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合;建立作者姓名组合与出版年份的对应关系,得到待审校文献对应的参考文献信息集合。该实施例中,在遍历每一参考文献条目,得到对应参考文献条目包含的作者姓名和出版年份之后,可以按照预设姓名组合规则对作者姓名进行组合处理。
可选地,考虑到参考文献条目中作者姓名顺序与作者对文献的贡献大小有关,通常排在前面的作者贡献较大,因此,在进行组合处理时,可以将第一作者姓名排在前面。例如,参考文献条目包含的作者姓名为A、B和C,若预设姓名组合规则为两两作者姓名组合,则进行组合处理后得到AB一种作者姓名组合,即该参考文献条目对应的作者姓名组合;或者,若预设姓名组合规则为随机姓名组合,则进行组合处理后得到的有A、AB、ABC共三种作者姓名组合,这三种作者姓名组合即该参考文献条目对应的作者姓名组合。然后,再建立作者姓名组合与出版年份的对应关系,得到待审校文献对应的参考文献信息集合。需明确的是,上述仅为示例说明,本申请实施例的组合方式不以上述为限制。
由于参考文献条目包含的作者姓名可以是中文作者姓名,也可以是外名作者姓名,例如英文作者姓名,因此,在按照预设姓名组合规则对作者姓名进行组合处理时,还可以结合作者姓名本身的特点。例如,预设姓名组合规则是按照中文作者姓名设置的,则对于中文作者姓名可以直接基于预设姓名组合规则进行组合处理;若作者姓名包含外文作者姓名时,则需要对外文作者姓名进行相应的处理之后才能基于预设姓名组合规则进行组合处理。这里以作者姓名为英文作者姓名为例进行示例。
一些实施例中,按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合,包括:若作者姓名是英文作者姓名,则从作者姓名提取作者的姓氏;按照预设姓名组合规则对参考文献条目包含的姓氏进行组合处理,得到参考文献条目对应的作者姓名组合。
示例地,如果作者姓名包含英文作者姓名,则将英文作者姓名拆分成姓氏和名,例如,英文作者姓名如Rubin AI,除一般名字缩写之外其余部分识别成姓氏,因为在参考文献的标注中一般只出现英文作者的姓氏,如Rubin,只对姓氏进行组合处理,得到参考文献条目对应的作者姓名组合。
当参考文献条目包含多个作者姓名时,按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合,还可以包括:采用预设关联字符,对多个作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合。其中,预设关联字符例如为“和”、“and”、“&”等。示例地,两个中文作者姓名(或英文作者姓氏)之间用“和”或“and”或“&”等预设关联字符连接,例如,作者姓名1和作者姓名2,或者,Rubin and Chen。或者,有三个或三个以上作者姓名时,除后两个作者姓名要用“和”或“and”或“&”等预设关联字符进行连接外,前面几个作者姓名之间可以使用例如“,”等预设关联字符进行连接,例如,作者姓名1,作者姓名2和作者姓名3;或者,Rubin,Chen and Ratner,等等。
进一步地,上述识别段落中包含的参考文献的标注,可以包括:识别段落中包含的目标出版年份;基于预设关键词,识别段落中包含的目标作者姓名。其中,预设关键词可以包括但不限于:中文作者姓名前一般有“根据”、“参考”、“由于”等预设关键词,而英文作者姓名前一般有“by”、“from”等预设关键词;多个作者姓名组合中的预设关键词一般有“和”或“and”或“&”等。因此,通过识别段落中的预设关键词,可以识别目标作者姓名。该实施例通过识别段落中的目标出版年份和预设关键词,可以确定参考文献的标注所在位置。
需要说明的是,识别段落中包含的参考文献的标注的具体实现方式可以有多种,本申请实施例不以上述具体实现为限制。一些实施例中,服务器可以根据段落是中文还是英文选择对应预设的匹配算法识别出参考文献的标注。在上述具体实现中,预设的匹配算法是先找到段落中的年份,再找姓名(即作者姓名)。示例地,中文姓名是2-7个汉字,英文姓名是2-20个字母;中文姓名前一般有“根据”、“参考”、“由于”等关键词,而英文姓名前一般有“by”、“from”等关键词;多个作者姓名组合一般有“和”或“and”或“&”等关键词,通过这些特征来找到作者姓名。
另外,参考文献的标注中还可能包含一些干扰信息,例如作者姓名前会有“引自”、“参照”等关键词,作者姓名后出现“等”或“et al.”等,这些干扰信息需剔除,以得到规范的参考文献的标注。
本申请通过信息提取模型等机器学习模型将每一条参考文献条目中的作者姓名、出版年份进行识别,并生成一个关于“作者-出版年制”的参考文献信息集合;再通过匹配算法在正文中识别出参考文献的标注和其中的目标作者姓名和目标出版年份;根据目标作者姓名和目标出版年份,判断参考文献的标注是否存在于参考文献信息集合中。通过运用机器学习和匹配算法,克服了人工审校的弊端,极大的提升参考文献参见落空审校的速率,并且增加了审校的准确性。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图3为本申请一实施例提供的参考文献参见落空的审校装置的结构示意图。本申请实施例提供一种参考文献参见落空的审校装置,该参考文献参见落空的审校装置可以通过软件和/或硬件的方式实现。示例地,该装置可以集成在例如服务器等电子设备上。如图3所示,参考文献参见落空的审校装置30包括:获取模块31、处理模块32、识别模块33和输出模块34。其中:
获取模块31,用于响应于接收到客户端发送的审校请求,获取待审校文献的参考文献列表,参考文献列表包含至少一参考文献条目,审校请求包含待审校文献的信息;
处理模块32,用于根据至少一参考文献条目,获取待审校文献对应的参考文献信息集合,参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;
识别模块33,用于遍历待审校文献的正文中每一段落,识别段落中包含的参考文献的标注,参考文献的标注包含目标作者姓名和目标出版年份;
输出模块34,用于在目标作者姓名和目标出版年份的组合关系不包含在参考文献信息集合中时,向客户端发送用于指示参考文献参见落空的审校结果,以使客户端显示审校结果,审校结果包含参考文献的标注所在的段落。
本申请实施例提供的装置,可用于执行图2所示实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
一些实施例中,处理模块32可以具体用于:遍历每一参考文献条目,根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份,信息提取模型用于提取参考文献条目中的作者姓名和出版年份;根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合。
可选地,信息提取模型包括第一子模型和第二子模型。该情况下,处理模块32在用于根据参考文献条目及信息提取模型,得到参考文献条目包含的作者姓名和出版年份时,具体用于:将参考文献条目输入第一子模型,得到参考文献条目包含的作者姓名区域和出版年份,第一子模型用于提取参考文献条目包含的作者姓名区域和出版年份;将作者姓名区域输入第二子模型,得到参考文献条目包含的作者姓名,第二子模型用于提取作者姓名区域中包含的作者姓名。
进一步地,处理模块32在用于根据参考文献条目包含的作者姓名和出版年份,获取待审校文献对应的参考文献信息集合时,具体用于:按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合;建立作者姓名组合与出版年份的对应关系,得到待审校文献对应的参考文献信息集合。
更进一步地,处理模块32在用于按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合时,具体用于:若作者姓名是英文作者姓名,则从作者姓名提取作者的姓氏;按照预设姓名组合规则对参考文献条目包含的姓氏进行组合处理,得到参考文献条目对应的作者姓名组合。
一些实施例中,当参考文条目包含多个作者姓名时,处理模块32在用于按照预设姓名组合规则对作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合时,具体用于:采用预设关联字符,对多个作者姓名进行组合处理,得到参考文献条目对应的作者姓名组合。
可选地,识别模块33可以具体用于:识别段落中包含的目标出版年份;基于预设关键词,识别段落中包含的目标作者姓名。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,处理模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上处理模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Digital Signal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(System-On-a-Chip,简称SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
图4为本申请一实施例提供的电子设备的结构示意图。如图4所示,该电子设备可以包括:处理器41、存储器42、通信接口43和系统总线44。其中,存储器42和通信接口43通过系统总线44与处理器41连接并完成相互间的通信,存储器42用于存储指令(包含计算机程序),通信接口43用于和其他设备进行通信,处理器41用于调用存储器中的指令以执行如上述方法实施例所述的方案。
该图4中提到的系统总线44可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线44可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口43用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。
存储器42可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器41可以是通用处理器,包括中央处理器、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行如上任一方法实施例所述的方法。
本申请实施例还提供一种运行指令的芯片,芯片用于执行如上任一方法实施例所述的方法。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,至少一个处理器可以从该计算机可读存储介质中读取计算机程序,该至少一个处理器执行所述计算机程序时可实现如上任一方法实施例所述的方法。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。在本申请的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (4)

1.一种参考文献参见落空的审校方法,其特征在于,包括:
响应于接收到客户端发送的审校请求,获取待审校文献的参考文献列表,所述参考文献列表包含至少一参考文献条目,所述审校请求包含所述待审校文献的信息;
根据所述至少一参考文献条目,获取所述待审校文献对应的参考文献信息集合,所述参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;
遍历所述待审校文献的正文中每一段落,识别所述段落中包含的目标出版年份;
基于预设关键词,识别所述段落中包含的目标作者姓名;若所述目标作者姓名和目标出版年份的组合关系不包含在所述参考文献信息集合中,则向所述客户端发送用于指示参考文献参见落空的审校结果,以使所述客户端显示所述审校结果,所述审校结果包含所述参考文献的标注所在的段落;
所述根据所述至少一参考文献条目,获取所述待审校文献对应的参考文献信息集合,包括:
遍历每一参考文献条目,将所述参考文献条目输入信息提取模型的第一子模型,得到所述参考文献条目包含的作者姓名区域和出版年份,所述第一子模型用于提取参考文献条目包含的作者姓名区域和出版年份;所述第一子模型为隐马尔可夫模型;
将所述作者姓名区域输入所述信息提取模型的第二子模型,得到所述参考文献条目包含的作者姓名,所述第二子模型用于提取作者姓名区域中包含的作者姓名;所述第二子模型为斯坦福NER;
按照预设姓名组合规则对所述作者姓名进行组合处理,得到所述参考文献条目对应的作者姓名组合;
建立所述作者姓名组合与所述出版年份的对应关系,得到所述待审校文献对应的参考文献信息集合;
所述按照预设姓名组合规则对所述作者姓名进行组合处理,得到所述参考文献条目对应的作者姓名组合,包括:
若所述作者姓名是英文作者姓名,则从所述作者姓名提取作者的姓氏;
按照预设姓名组合规则对所述参考文献条目包含的姓氏进行组合处理,得到所述参考文献条目对应的作者姓名组合;
当所述参考文条目包含多个作者姓名时,采用预设关联字符,对所述多个作者姓名进行组合处理,得到所述参考文献条目对应的作者姓名组合。
2.一种参考文献参见落空的审校装置,其特征在于,包括:
获取模块,用于获取来自客户端的待审校文献的参考文献列表,所述参考文献列表包含至少一参考文献条目;
处理模块,用于根据所述至少一参考文献条目,获取所述待审校文献对应的参考文献信息集合,所述参考文献信息集合包含参考文献条目包含的作者姓名与出版年份的组合关系;
识别模块,用于遍历所述待审校文献的正文中每一段落,识别所述段落中包含的目标出版年份;
基于预设关键词,识别所述段落中包含的目标作者姓名;所述参考文献的标注包含目标作者姓名和目标出版年份;
输出模块,用于在所述目标作者姓名和目标出版年份的组合关系不包含在所述参考文献信息集合中时,向所述客户端发送用于指示参考文献参见落空的审校结果,以使所述客户端显示所述审校结果,所述审校结果包含所述参考文献的标注所在的段落;
所述识别模块具体用于,遍历每一参考文献条目,将所述参考文献条目输入信息提取模型的第一子模型,得到所述参考文献条目包含的作者姓名区域和出版年份,所述第一子模型用于提取参考文献条目包含的作者姓名区域和出版年份;所述第一子模型为隐马尔可夫模型;
将所述作者姓名区域输入所述信息提取模型的第二子模型,得到所述参考文献条目包含的作者姓名,所述第二子模型用于提取作者姓名区域中包含的作者姓名;所述第二子模型为斯坦福NER;
按照预设姓名组合规则对所述作者姓名进行组合处理,得到所述参考文献条目对应的作者姓名组合;
建立所述作者姓名组合与所述出版年份的对应关系,得到所述待审校文献对应的参考文献信息集合;
所述识别模块,在按照预设姓名组合规则对所述作者姓名进行组合处理,得到所述参考文献条目对应的作者姓名组合时,具体用于:
若所述作者姓名是英文作者姓名,则从所述作者姓名提取作者的姓氏;
按照预设姓名组合规则对所述参考文献条目包含的姓氏进行组合处理,得到所述参考文献条目对应的作者姓名组合;
当所述参考文条目包含多个作者姓名时,采用预设关联字符,对所述多个作者姓名进行组合处理,得到所述参考文献条目对应的作者姓名组合。
3.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1所述的参考文献参见落空的审校方法。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行如权利要求1所述的参考文献参见落空的审校方法。
CN202110571584.8A 2021-05-25 2021-05-25 参考文献参见落空的审校方法、装置、设备及存储介质 Active CN113505570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110571584.8A CN113505570B (zh) 2021-05-25 2021-05-25 参考文献参见落空的审校方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110571584.8A CN113505570B (zh) 2021-05-25 2021-05-25 参考文献参见落空的审校方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113505570A CN113505570A (zh) 2021-10-15
CN113505570B true CN113505570B (zh) 2024-04-12

Family

ID=78009341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110571584.8A Active CN113505570B (zh) 2021-05-25 2021-05-25 参考文献参见落空的审校方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113505570B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101487356B1 (ko) * 2014-04-02 2015-01-30 전주대학교 산학협력단 검색논문의 참고문헌정보를 제공하는 서버 및 제공방법
CN105824791A (zh) * 2016-03-17 2016-08-03 北京信息科技大学 一种参考文献格式检查方法
TW201727513A (zh) * 2016-01-28 2017-08-01 Chia Nan Univ Of Pham Acy & Science 論文與參考文獻之比對方法、電腦程式及電腦可讀取記錄媒體
KR20180078626A (ko) * 2016-12-30 2018-07-10 주식회사 로크미디어 출판 정보 제공 시스템 및 방법
CN109086255A (zh) * 2018-07-09 2018-12-25 北京大学 一种基于深度学习的参考文献自动标注方法及系统
CN110019828A (zh) * 2017-09-13 2019-07-16 北大方正集团有限公司 基于知识图谱的参见落实校验方法及系统
CN110990593A (zh) * 2019-12-17 2020-04-10 北大方正集团有限公司 引用落空检测方法和装置
CN111460792A (zh) * 2019-01-18 2020-07-28 北大方正信息产业集团有限公司 一种辅助编校方法与装置、存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676780B2 (en) * 2002-06-10 2014-03-18 Jason Rollins System and method for citation processing, presentation and transport and for validating references
US7765199B2 (en) * 2006-03-17 2010-07-27 Proquest Llc Method and system to index captioned objects in published literature for information discovery tasks

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101487356B1 (ko) * 2014-04-02 2015-01-30 전주대학교 산학협력단 검색논문의 참고문헌정보를 제공하는 서버 및 제공방법
TW201727513A (zh) * 2016-01-28 2017-08-01 Chia Nan Univ Of Pham Acy & Science 論文與參考文獻之比對方法、電腦程式及電腦可讀取記錄媒體
CN105824791A (zh) * 2016-03-17 2016-08-03 北京信息科技大学 一种参考文献格式检查方法
KR20180078626A (ko) * 2016-12-30 2018-07-10 주식회사 로크미디어 출판 정보 제공 시스템 및 방법
CN110019828A (zh) * 2017-09-13 2019-07-16 北大方正集团有限公司 基于知识图谱的参见落实校验方法及系统
CN109086255A (zh) * 2018-07-09 2018-12-25 北京大学 一种基于深度学习的参考文献自动标注方法及系统
CN111460792A (zh) * 2019-01-18 2020-07-28 北大方正信息产业集团有限公司 一种辅助编校方法与装置、存储介质
CN110990593A (zh) * 2019-12-17 2020-04-10 北大方正集团有限公司 引用落空检测方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Comparative Study of static code Analysis tools for Vulnerability Dtection in C/C++ and Java Source Code;Arvinder Kaur(Prof.);Procedia Computer Science;20201231;第171卷;2023-2029 *
基于序列模式的汉语比较句识别方法;王素格;王凤霞;宋雅;;山西大学学报(自然科学版)(第02期);36-43 *
学术文献引文上下文自动识别研究;雷声伟;陈海华;黄永;陆伟;;图书情报工作(第17期);79-88 *
科技期刊论文参考文献核查与校对方法;宋春燕;王菊香;;编辑学报(第03期);49-50 *

Also Published As

Publication number Publication date
CN113505570A (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
USRE49576E1 (en) Standard exact clause detection
CN107247707B (zh) 基于补全策略的企业关联关系信息提取方法和装置
US9645979B2 (en) Device, method and program for generating accurate corpus data for presentation target for searching
US20220004878A1 (en) Systems and methods for synthetic document and data generation
US11816138B2 (en) Systems and methods for parsing log files using classification and a plurality of neural networks
US10482170B2 (en) User interface for contextual document recognition
CA3048356A1 (en) Unstructured data parsing for structured information
US9286526B1 (en) Cohort-based learning from user edits
CN107870915B (zh) 对搜索结果的指示
CN108664471B (zh) 文字识别纠错方法、装置、设备及计算机可读存储介质
CN112732945B (zh) 标准知识图谱构建、标准查询方法及装置
CN110795942B (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN112464927B (zh) 一种信息提取方法、装置及系统
JPWO2009048149A1 (ja) 電子文書の同等判定システムおよび同等判定方法
US11321529B2 (en) Date and date-range extractor
CN113505570B (zh) 参考文献参见落空的审校方法、装置、设备及存储介质
CN116225956A (zh) 自动化测试方法、装置、计算机设备和存储介质
CN114154480A (zh) 信息提取方法、装置、设备和存储介质
CN113434653A (zh) 处理查询语句的方法、装置、设备及存储介质
EP3640861A1 (en) Systems and methods for parsing log files using classification and a plurality of neural networks
CN111444716A (zh) 标题分词方法、终端及计算机可读存储介质
CN112836477B (zh) 代码注释文档的生成方法、装置、电子设备及存储介质
US11681862B1 (en) System and method for identifying location of content within an electronic document
JP2017117109A (ja) 情報処理装置、情報処理システム、情報検索方法、及びプログラム
CN116894443A (zh) 智能翻译系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant