CN113918705A - 带有预警和推荐功能的投稿审核方法及系统 - Google Patents

带有预警和推荐功能的投稿审核方法及系统 Download PDF

Info

Publication number
CN113918705A
CN113918705A CN202111182194.8A CN202111182194A CN113918705A CN 113918705 A CN113918705 A CN 113918705A CN 202111182194 A CN202111182194 A CN 202111182194A CN 113918705 A CN113918705 A CN 113918705A
Authority
CN
China
Prior art keywords
contribution
journal
periodical
information
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111182194.8A
Other languages
English (en)
Inventor
杨晓凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou Peoples Hospital
Original Assignee
Wenzhou Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou Peoples Hospital filed Critical Wenzhou Peoples Hospital
Priority to CN202111182194.8A priority Critical patent/CN113918705A/zh
Publication of CN113918705A publication Critical patent/CN113918705A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种带有预警和推荐功能的投稿审核方法及系统,该方法包括:读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息;判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警,否则,进一步判断所述投稿途径是否合法;如果所述投稿途径不合法,则启动非法预警,否则,提交投稿审核通过,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。系统包括:获取模块、第一预警模块、第二预警模块和推荐模块。本发明解决了人工审核人力投入过大、管理工作繁琐的问题,不仅有助于提高投稿审核效率,而且方便投稿人快速、准确查找到合法的目标投稿期刊。

Description

带有预警和推荐功能的投稿审核方法及系统
【技术领域】
本发明涉及论文投稿技术领域,具体地说,是一种带有预警和推荐功能的投稿审核方法及系统。
【背景技术】
目前我国中文期刊约1万余种,其中医学期刊约1900余种。根据CNKI数据库2020年发表论文检索结果,每年刊发期刊论文约290万篇,其中学术期刊论文约220万篇,医学期刊论文约62万篇。论文发表需求量与期刊容量之间比例严重失衡,需要泄洪口。相当比例的医务人员因为职称晋升和学位申请硬性的论文需求,或者申请基金、奖励获取、人才申报等软性论文需求,求助论文代写代投来解决,甚至发表在非法期刊。由于虚假期刊论文数据的获取比较困难,目前对于虚假期刊的发文量缺乏了解和统计,对于文章作者的地域分布也并不清楚。为了证明论文是发表在真实的期刊,将虚假期刊收录在某个期刊数据库,提供全文链接访问,是近年来新出现的欺骗作者的新手段。通常这些数据库所收录的绝大多数期刊并无实质完整内容,能提供全文访问的大部分为虚假期刊或者套刊,夹杂个别质量较差的真实期刊,造成鱼目混珠,真假难辨。
通常期刊论文的审核过程是对晋升人员提交的纸质论文资料进行核查,由于晋升论文的审查通常要在短时间内完成,工作量和工作强度比较大,由审查人员逐一分析文章内容或者通过数据库查询进行核查,审查过程中很难保证对非法期刊进行准确识别,非常难以发现非法期刊论文,并且当前科研管理部门普遍存在人员投入不足,具体管理工作繁琐等问题,难以有效开展论文投稿审查工作,以帮助员工减少受骗上当,因此,如何利用计算机技术解决论文审核中的各种问题,是当前急迫需要的。
【发明内容】
本发明的目的是针对现有技术中的不足,提供一种带有预警和推荐功能的投稿审核方法及系统,通过构建非法期刊预警逻辑架构实现模型化非法期刊识别,解决了人工审核人力投入过大、管理工作繁琐的问题,同时多次投稿审核数据存储自动形成期刊推荐列表,不仅有助于提高投稿审核效率,而且方便投稿人快速、准确查找到合法的目标投稿期刊。
为实现上述目的,第一方面,本发明提供了一种带有预警和推荐功能的投稿审核方法,包括如下步骤:
读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息;
判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警,否则,进一步判断所述投稿途径是否合法;
如果所述投稿途径不合法,则启动非法预警,否则,提交投稿审核通过,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。
优选地,所述判断所述投稿期刊是否属于预警非法期刊的步骤之前还包括,构建预警非法期刊数据库,包括如下步骤:
构建正式期刊数据库,所述正式期刊为来自官方数据库中的已知的合法期刊数据;
获取目标期刊的基本信息并将所述基本信息和所述正式期刊数据库已知的期刊基本信息进行匹配,无法完成基本信息匹配的目标期刊为非法期刊;
对完成基本信息匹配的所述目标期刊提取特征值,判断所述特征值是否大于目标预设值,如果是,则为非法期刊,否则,抽取所述目标期刊具体卷期目录文章,并与所述官方数据库中收录的与该目标期刊相同期刊的所对应卷期目录文章进行核对,核对一致,则所述目标期刊为合法期刊,如果核对不一致,则所述目标期刊为非法期刊。
优选地,所述基本信息包括期刊的名称和刊号。
优选地,所述特征值包括所述目标期刊的期数分布规律、所述目标期刊中每期文章数量以及所述目标期刊内作者信息。
优选地,所述根据所述特征值识别非法期刊的步骤包括:
读取所述目标期刊中的文章数量,并计算所述目标期刊中文章数量与所述正式期刊中文章数量的差值,判断该差值是否大于目标预设值,如果是,则判定所述目标期刊为非法期刊,否则读取所述目标期刊内文章信息;
判断所述目标期刊内文章信息异常情况次数是否大于目标预设值,如果是,则判定所述目标期刊为非法期刊,否则判定所述目标期刊为合法期刊。
优选地,所述判断所述投稿途径是否合法的步骤之前还包括,构建期刊投稿方式数据库,所述期刊投稿方式数据库包括所述正式期刊数据库中所有期刊的投稿途径,所述投稿途径包括:来自于期刊信息页面的电子邮箱和期刊网址、根据期刊ID获取的投稿链接、征稿启事以及期刊封面目录封底信息。
优选地,所述根据所述投稿人身份信息和投稿期刊推荐同类期刊列表的步骤包括:
采集审核通过的所述投稿信息作为推荐模型训练数据集,所述投稿信息包括投稿人身份信息和投稿期刊;
对所述训练数据集进行预处理,设置所述投稿信息的分类属性,所述分类属性包括:投稿人身份信息、投稿目的、稿件信息和期刊信息;
设定每一个所述分类属性的权重值,采用C4.5算法构建决策树分类模型;
接收到提交审核通过信息后,将所述投稿信息代入所述决策树分类模型生成推荐期刊列表。
优选地,所述推荐期刊列表包括一级期刊目录推荐清单、二级期刊目录推荐清单和其他期刊目录推荐清单。
第二方面,本发明提供了一种带有预警和推荐功能的投稿审核系统,包括:
获取模块,用于读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息;
第一预警模块,用于判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警;
第二预警模块,用于判断所述投稿途径是否合法;如果所述投稿途径不合法,则启动非法预警;
推荐模块,用于接收提交投稿审核通过信息,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。
优选地,所述第一预警模块包括:
第一识别单元,用于并将目标期刊基本信息和正式期刊数据库已知的期刊基本信息进行匹配,无法完成基本信息匹配的所述目标期刊为非法期刊;
第二识别单元,用于对完成基本信息匹配的所述目标期刊提取特征值,判断所述特征值是否大于目标预设值的,如果是,则为非法期刊;
第三识别单元,用于抽取通过第二识别单元后的所述目标期刊具体卷期目录文章,并与官方数据库中收录的与该目标期刊相同期刊的所对应卷期目录文章进行核对,核对一致,则所述目标期刊为合法期刊,如果核对不一致,则所述目标期刊为非法期刊。
本发明优点在于:
本发明的带有预警和推荐功能的投稿审核方法通过对投稿信息进行两次递进的非法预警审核,对投稿信息进行数据化处理和结构化处理,解决了人工审核工作繁琐管理困难的问题;本发明通过构建预警非法期刊数据库、正式期刊数据库和构建期刊投稿方式数据库实现投稿审核中非法期刊的快速准确识别,通过建立数据库实现数据的迭代更新,解决了人工审核过程中非法期刊识别难度大的问题;本发明通过对投稿审核通过的投稿信息和期刊信息进行分类处理,采用C4.5算法构建决策树分类模型,通过对投稿审核中的数据有效利用,实现了投稿期刊智能推荐的功能,不仅有助于提高投稿审核效率,而且方便投稿人快速、准确查找到合法的目标投稿期刊。
本发明的带有预警和推荐功能的投稿审核系统集投稿审核、非法期刊识别和投稿期刊推荐功能于一体,有助于建立科研诚信管理体系,提高科研管理工作的系统性和便捷性。
【附图说明】
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
附图1是本发明一实施例提供的带有预警和推荐功能的投稿审核方法流程示意图;
附图2是本发明一实施例提供的构建预警非法期刊数据库流程示意图;
附图3是本发明一实施例提供的非法期刊识别流程示意图;
附图4是本发明一实施例提供的带有预警和推荐功能的投稿审核系统框图。
【具体实施方式】
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的带有预警和推荐功能的投稿审核方法及系统,主要用于辅助科研单位投稿审核部门人员的工作处理,优化投稿审核流程,提高投稿审核效率。文章发表数量是科研单位人员晋升考察指标之一,因此需要对发表的期刊论文进行审核,审核内容主要包括文章内容的真实性和论文期刊的真实性,现有审查形式主要是对晋升人员提交的纸质论文资料进行核查,经过人工审查可以初步排查以下情况:1)无法提供原始数据,或者原始数据没有具体识别ID如住院号,2)抽查原始数据不符,3)研究内容本院没有开展,和作者专业方向不符,4)没有投稿登记和伦理审查,5)检索显示和其他文章高度相识,6)无科研经费来源。出现上述情况就要重点怀疑是否代写代投,并进一步核查期刊真实性。本发明的主要目的是解决投稿审核过程中非法期刊识别难度大的问题。
如附图1所示的实施例中,本发明提供了一种带有预警和推荐功能的投稿审核方法,具体实现的步骤包括:
S1.读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息。
S2.判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警,否则,进一步判断所述投稿途径是否合法;
S3.如果所述投稿途径不合法,则启动非法预警,否则,提交投稿审核通过,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。
本实施例通过将投稿信息中的期刊信息与预设的预警非法期刊进行匹配对比,初步判断投稿期刊是否合法,实现了投稿审核过程中非法期刊的智能识别,保证审核通过的论文投稿期刊的真实性。在一个可能的实施例中,启动非法预警的方式采用在投稿审核跳窗提示预警原因,并提供相应的操作提示,例如当投稿期刊属于预警非法期刊而产生非法预警时,跳窗提示投稿期刊为非法期刊需要重新选择投稿期刊,并根据投稿信息中的稿件信息、投稿人身份信息推荐期刊列表供投稿人选择;当因投稿途径不合法而产生非法预警时,跳窗提示因投稿途径出错导致投稿审核不通过,并提示正确的期刊投稿方式。
在一个优选的实施例中,所述预警非法期刊通过构建预警非法期刊数据库收录并存储数据,故判断所述投稿期刊是否属于预警非法期刊的步骤之前还包括,构建预警非法期刊数据库,优选的,构建预警非法期刊数据库的方法如附图2所示,通过对不同目标期刊识别过程中更新记录并存储不满足正式期刊条件的期刊建立用于非法预警的期刊数据库,具体包括如下步骤:
S11.构建正式期刊数据库,所述正式期刊为来自官方数据库中的已知的合法期刊数据;正式期刊数据库主要通过收录官方批量的已知的正式有效的期刊或者科研单位认可或指定期刊,包括但不限于:1)通过万维书刊网的期刊信息页面收录正式期刊;2)在超星期刊页面中下载总期刊页面,然后分析期刊链接获取期刊信息,其中的简介,曾用刊名,分类信息,数据库收录信息等均可以作为基本信息匹配参考因素;3)抓取CNKI期刊信息页面的期刊列表地址进而根据期刊ID获取期刊页面;4)在维普网获取期刊列表地址,通过字母A-Z分类下载期刊信息,根据期刊ID构建期刊数据库;5)通过万方数据收录期刊根据字母A-Z分类构造期刊地址,同时可以根据期刊ID构造期刊信息网址,还可获取期刊投稿地址等信息。
S12.获取目标期刊的基本信息并将所述基本信息和所述正式期刊数据库已知的期刊基本信息进行匹配,无法完成基本信息匹配的目标期刊为非法期刊;所述基本信息包括期刊的名称和刊号,通过期刊名称和刊号可以快速完成初步筛查,将一些明显属于虚假期刊或者黑名单中的期刊筛除生成初筛期刊列表,以提高后续特征值提取的操作效率。
S13.对完成基本信息匹配的所述目标期刊提取特征值,判断所述特征值是否大于目标预设值,如果是,则为非法期刊,否则,抽取所述目标期刊具体卷期目录文章,并与所述官方数据库中收录的与该目标期刊相同期刊的所对应卷期目录文章进行核对,核对一致,则所述目标期刊为合法期刊,如果核对不一致,则所述目标期刊为非法期刊。其中,所述特征值包括所述目标期刊的期数分布规律、所述目标期刊中每期文章数量以及所述目标期刊内作者信息。
本实施例解决了人工难以完成非法期刊识别的技术问题,通过数据化处理期刊信息,对识别期刊的因素进行标准化处理,从而可以提取特征值,采用计算机编程手段对初筛之后的期刊目录进行一定的规律分析为自动化识别做数据准备,然后根据分析规律生成判断规则,通过处理期刊目录信息得知,如果每期文章数量超过80篇的推断其不符合现实情况,有可能是非法期刊。整个过程通过编程实现自动化数据抓取和分析。通过特征值自动化识别后的期刊列表需要进一步配合人工识别,对期刊的具体内容进行审核,判断非法期刊的必要条件是非法期刊内容和正式期刊内容不符,或者期刊经查国家新闻出版署不存在。结合编程抓取异常信息如地址包括身份证信息、题目包括作者名字等可以快速辅助判断。
在一个优选的实施例中,选取期刊中文章数量和期刊内文章信息异常情况作为非法期刊识别的特征值,此时,如附图3所示根据所述特征值识别非法期刊的步骤包括:
S131.读取所述目标期刊中的文章数量,并计算所述目标期刊中文章数量与所述正式期刊中文章数量的差值,判断该差值是否大于目标预设值,如果是,则判定所述目标期刊为非法期刊,否则读取所述目标期刊内文章信息;实际中,如果目标期刊中的所有文章数量与正式期刊中文章数量相近,即偏差(目标期刊与正式期刊文章数量差值相对于正式期刊的比例)不超过20%,则目标期刊不会被识别为非法期刊,在另一个可行的实施例中,文章数量还可以包括通过期刊目录中的文章题目进行比对,通过判断目标期刊内文章题目与正式期刊内文章题目是否一致来识别非法期刊,对比文章题目不一致的比例应当不大于目标预设值20%(即至少满足80%文章题目一致),才能够保证目标期刊不被识别为非法期刊。
S132.判断所述目标期刊内文章信息异常情况次数是否大于目标预设值,如果是,则判定所述目标期刊为非法期刊,否则判定所述目标期刊为合法期刊。目标期刊内文章信息异常情况主要指:摘要信息中出现了作者的身份证信息、联系方式,文章题目中出现作者姓名,地址信息中包括手机号码或者身份证信息等异常情况,
进一步的,在提取特征值之前,还可以通过目标期刊每年期数分布变化规律,或者任意时间周期内期数变化规律来判断目标期刊是否为非法期刊,通常,如果目标期刊的期数在周期内变化规律与正式期刊期数在周期内变化规律有明显差异,如采用曲线分布算法对变化规律分析,差异值超过20%的目标期刊则会被识别为非法期刊。
为了进一步保证文章投稿信息的真实性,避免晋升人员提供虚假投稿信息(即虽然投稿期刊不属于非法期刊,但没有正常通过投稿而是假冒投稿资料),提高投稿审核的准确性真实性,通过非法期刊识别后本发明进一步提供了二次非法预警,即通过对投稿途径是否合法的判断启动二次非法预警。所述判断所述投稿途径是否合法的步骤之前还包括,构建期刊投稿方式数据库,所述期刊投稿方式数据库包括所述正式期刊数据库中所有期刊的投稿途径,所述投稿途径包括:来自于期刊信息页面的电子邮箱和期刊网址、根据期刊ID获取的投稿链接、征稿启事以及期刊封面目录封底信息。构建期刊投稿方式数据库的方式,主要是在构建正式期刊数据库的同时获取每一个正式的投稿地址,具体包括但不限于:从正式期刊页面信息中获取投稿地址、从正式期刊的点评页面中获取投稿地址、从正式期刊的查询系统中获取投稿地址、从期刊发布的征稿启事中获取投稿地址等。
本发明的投稿审核方法还带有推荐功能,对于提交提交投稿审核通过的情况,根据投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择,本发明采用决策树模型实现自动推荐功能,同时,通过数据积累可以不断优化模型,提高推荐的准确性,也可以由用户自定义推荐因子的权重,保证推荐的期刊列表更加有效,具体步骤包括:
采集审核通过的所述投稿信息作为推荐模型训练数据集,所述投稿信息包括投稿人身份信息和投稿期刊;
对所述训练数据集进行预处理,设置所述投稿信息的分类属性,所述分类属性包括:投稿人身份信息、投稿目的、稿件信息和期刊信息;具体的,投稿人身份信息包括但不限于:投稿人的职称(如医师、住院医师、主治医师、副主任医师、主任医师等)、投稿人的专业因素(如医师和护理群体区分;行政和临床区分;具体医学专业区分)等;投稿目的主要根据相关单位发布的专业技术资格评审刊物名录中的相关规定将期刊分为不同等级的推荐期刊;稿件信息主要包括根据稿件摘要或者文章题目等所涉及的专业领域进行期刊推荐分类;期刊信息主要根据期刊质量因素(复合影响因子、综合影响因子、H指数、被引量、下载量、基金论文量、重要检索系统收录、根据期刊作品数量和初版周期确定的容易发表因素等)进行分类;也可以根据用户需求增加或者修改分类属性,例如单位本专业历史发表的期刊数据等。需要说明的是,此处分类属性主要指期刊推荐中的参考因素,其中期刊质量因素中的影响因子(ImpactFactor,IF)是汤森路透(Thomson Reuters)出品的期刊引证报告(Journal Citation Reports,JCR)中的一项数据。即某期刊前两年发表的论文在该报告年份(JCR year)中被引用总次数除以该期刊在这两年内发表的论文总数。这是一个国际上通行的期刊评价指标。
设定每一个所述分类属性的权重值,采用C4.5算法构建决策树分类模型;实际中系统会根据投稿人身份信息自动匹配相应的权重值,也可以由投稿人自定义权重值,以满足相应的推荐需求。
接收到提交审核通过信息后,将所述投稿信息代入所述决策树分类模型生成推荐期刊列表。
C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法,从大量事例中进行提取分类规则的自上而下的决策树。本发明采用C4.5算法构建决策树分类模型,可以根据投稿审核通过的所有投稿信息进行提取分类规则,通过归纳式学习方法快速提取相应的分类规则,生成期刊推荐列表。为了提供相对全面的推荐信息,本发明的所述推荐期刊列表包括一级期刊目录推荐清单、二级期刊目录推荐清单和其他期刊目录推荐清单。
基于与本发明带有预警和推荐功能的投稿审核方法上述各个实施例相同的构思,下面对本发明实施例提供的带有预警和推荐功能的投稿审核系统进行介绍,下文描述的带有预警和推荐功能的投稿审核系统与上文描述的带有预警和推荐功能的投稿审核方法可以相互对应参照。请参考附图4,本发明实施例提供了一种带有预警和推荐功能的投稿审核系统,包括:获取模块、第一预警模块、第二预警模块和推荐模块,分别用于实现上述带有预警和推荐功能的投稿审核方法中对应实施例中的具体步骤。
其中,获取模块,用于读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息;第一预警模块,用于判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警;第二预警模块,用于判断所述投稿途径是否合法;如果所述投稿途径不合法,则启动非法预警;推荐模块,用于接收提交投稿审核通过信息,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。
在一个优选的实施例中,为了更好地解决投稿审核过程中非法期刊的识别难度大问题,本发明的第一预警模块通过构建预警非法期刊数据库,对投稿信息进行采集分析,判定投稿期刊是否为非法期刊,从而快速完成投稿审核中的第一次非法预警。具体的,所述第一预警模块包括:第一识别单元、第二识别单元和第三识别单元,用于实现多级非法期刊识别。其中,第一识别单元,用于并将目标期刊基本信息和正式期刊数据库已知的期刊基本信息进行匹配,无法完成基本信息匹配的所述目标期刊为非法期刊;第二识别单元,用于对完成基本信息匹配的所述目标期刊提取特征值,判断所述特征值是否大于目标预设值的,如果是,则为非法期刊;第三识别单元,用于抽取通过第二识别单元后的所述目标期刊具体卷期目录文章,并与官方数据库中收录的与该目标期刊相同期刊的所对应卷期目录文章进行核对,核对一致,则所述目标期刊为合法期刊,如果核对不一致,则所述目标期刊为非法期刊。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或该系统所附属的计算机程序产品。上述实施例阐明的系统具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。为了描述的方便,描述本发明带有预警和推荐功能的投稿审核系统是以功能分为各种单元或模块分别描述。当然,在实施本发明时可以把各单元或模块的功能在同一个或多个软件和/或硬件中实现。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。

Claims (10)

1.一种带有预警和推荐功能的投稿审核方法,其特征在于,包括如下步骤:
读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息;
判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警,否则,进一步判断所述投稿途径是否合法;
如果所述投稿途径不合法,则启动非法预警,否则,提交投稿审核通过,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。
2.根据权利要求1所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述判断所述投稿期刊是否属于预警非法期刊的步骤之前还包括,构建预警非法期刊数据库,包括如下步骤:
构建正式期刊数据库,所述正式期刊为来自官方数据库中的已知的合法期刊数据;
获取目标期刊的基本信息并将所述基本信息和所述正式期刊数据库已知的期刊基本信息进行匹配,无法完成基本信息匹配的目标期刊为非法期刊;
对完成基本信息匹配的所述目标期刊提取特征值,判断所述特征值是否大于目标预设值,如果是,则为非法期刊,否则,抽取所述目标期刊具体卷期目录文章,并与所述官方数据库中收录的与该目标期刊相同期刊的所对应卷期目录文章进行核对,核对一致,则所述目标期刊为合法期刊,如果核对不一致,则所述目标期刊为非法期刊。
3.根据权利要求2所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述基本信息包括期刊的名称和刊号。
4.根据权利要求3所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述特征值包括所述目标期刊的期数分布规律、所述目标期刊中每期文章数量以及所述目标期刊内作者信息。
5.根据权利要求4所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述根据所述特征值识别非法期刊的步骤包括:
读取所述目标期刊中的文章数量,并计算所述目标期刊中文章数量与所述正式期刊中文章数量的差值,判断该差值是否大于目标预设值,如果是,则判定所述目标期刊为非法期刊,否则读取所述目标期刊内文章信息;
判断所述目标期刊内文章信息异常情况次数是否大于目标预设值,如果是,则判定所述目标期刊为非法期刊,否则判定所述目标期刊为合法期刊。
6.根据权利要求5所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述判断所述投稿途径是否合法的步骤之前还包括,构建期刊投稿方式数据库,所述期刊投稿方式数据库包括所述正式期刊数据库中所有期刊的投稿途径,所述投稿途径包括:来自于期刊信息页面的电子邮箱和期刊网址、根据期刊ID获取的投稿链接、征稿启事以及期刊封面目录封底信息。
7.根据权利要求1-6任一项所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述根据所述投稿人身份信息和投稿期刊推荐同类期刊列表的步骤包括:
采集审核通过的所述投稿信息作为推荐模型训练数据集,所述投稿信息包括投稿人身份信息和投稿期刊;
对所述训练数据集进行预处理,设置所述投稿信息的分类属性,所述分类属性包括:投稿人身份信息、投稿目的、稿件信息和期刊信息;
设定每一个所述分类属性的权重值,采用C4.5算法构建决策树分类模型;
接收到提交审核通过信息后,将所述投稿信息代入所述决策树分类模型生成推荐期刊列表。
8.根据权利要求7所述的带有预警和推荐功能的投稿审核方法,其特征在于,所述推荐期刊列表包括一级期刊目录推荐清单、二级期刊目录推荐清单和其他期刊目录推荐清单。
9.一种带有预警和推荐功能的投稿审核系统,其特征在于,包括:
获取模块,用于读取投稿信息,所述投稿信息至少包括投稿途径、投稿期刊、稿件信息和投稿人身份信息;
第一预警模块,用于判断所述投稿期刊是否属于预警非法期刊,如果是,则启动非法预警;
第二预警模块,用于判断所述投稿途径是否合法;如果所述投稿途径不合法,则启动非法预警;
推荐模块,用于接收提交投稿审核通过信息,并根据所述投稿人身份信息和投稿期刊推荐同类期刊列表供投稿人选择。
10.根据权利要求9所述的带有预警和推荐功能的投稿审核系统,其特征在于,所述第一预警模块包括:
第一识别单元,用于并将目标期刊基本信息和正式期刊数据库已知的期刊基本信息进行匹配,无法完成基本信息匹配的所述目标期刊为非法期刊;
第二识别单元,用于对完成基本信息匹配的所述目标期刊提取特征值,判断所述特征值是否大于目标预设值的,如果是,则为非法期刊;
第三识别单元,用于抽取通过第二识别单元后的所述目标期刊具体卷期目录文章,并与官方数据库中收录的与该目标期刊相同期刊的所对应卷期目录文章进行核对,核对一致,则所述目标期刊为合法期刊,如果核对不一致,则所述目标期刊为非法期刊。
CN202111182194.8A 2021-10-11 2021-10-11 带有预警和推荐功能的投稿审核方法及系统 Pending CN113918705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111182194.8A CN113918705A (zh) 2021-10-11 2021-10-11 带有预警和推荐功能的投稿审核方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111182194.8A CN113918705A (zh) 2021-10-11 2021-10-11 带有预警和推荐功能的投稿审核方法及系统

Publications (1)

Publication Number Publication Date
CN113918705A true CN113918705A (zh) 2022-01-11

Family

ID=79239068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111182194.8A Pending CN113918705A (zh) 2021-10-11 2021-10-11 带有预警和推荐功能的投稿审核方法及系统

Country Status (1)

Country Link
CN (1) CN113918705A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293114A (zh) * 2022-10-08 2022-11-04 成都西南财大交子金融科技创新研究院有限公司 一种基于目标期刊智能格式修订方法及装置
CN117421428A (zh) * 2023-10-31 2024-01-19 中国人民解放军海军大连舰艇学院 基于完整期刊库的论文发表诚信评估分析方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293114A (zh) * 2022-10-08 2022-11-04 成都西南财大交子金融科技创新研究院有限公司 一种基于目标期刊智能格式修订方法及装置
CN115293114B (zh) * 2022-10-08 2023-01-10 成都西南财大交子金融科技创新研究院有限公司 一种基于目标期刊智能格式修订方法及装置
CN117421428A (zh) * 2023-10-31 2024-01-19 中国人民解放军海军大连舰艇学院 基于完整期刊库的论文发表诚信评估分析方法及系统
CN117421428B (zh) * 2023-10-31 2024-05-17 中国人民解放军海军大连舰艇学院 基于完整期刊库的论文发表诚信评估分析方法及系统

Similar Documents

Publication Publication Date Title
CN110704572B (zh) 疑似非法集资风险的预警方法、装置、设备和存储介质
CN106372225B (zh) 一种基于高价值对比库的信息处理装置及方法
CN106446070B (zh) 一种基于专利群的信息处理装置及方法
CN113918705A (zh) 带有预警和推荐功能的投稿审核方法及系统
CN102160066A (zh) 特别适用于专利文献的搜索引擎和方法
CN107273977A (zh) 用于标识匹配的方法、系统和机器可读硬件存储装置
US20160170981A1 (en) Document analysis system, document analysis method, and document analysis program
CN109492097B (zh) 一种企业新闻数据风险分类方法
CN111382948A (zh) 对企业发展潜力进行量化评估的方法及装置
CN113626700B (zh) 律师推荐方法和系统及设备
CN114049016A (zh) 指标相似性判断方法、系统、终端设备及计算机存储介质
US20190303424A1 (en) Novel and innovative computer system and method for accurately and consistently automating the coding of timekeeping activities and expenses, and automatically assessing the reasonableness of amounts of time billed for those activities and expenses, through the use of supervised and unsupervised machine learning, as well as lexical, statistical, and multivariate modelling of billing entries
CN113450928A (zh) 一种药物试验数据控制方法及系统
JP5669904B1 (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム
US20040210834A1 (en) Data management method and system for generating and verifying accurate coding information
KR102472640B1 (ko) 빅데이터 기반 특허 분석 서비스 제공 방법 및 장치
CN116108847A (zh) 知识图谱构建方法、cwe社区描述方法以及存储介质
KR101456189B1 (ko) 특허 평가 엔진을 이용한 특허 자동 평가 방법 및 평가 서버
TW201539217A (zh) 文件分析系統、文件分析方法、以及文件分析程式
CN113344527B (zh) 一体化管理存储司法建议信息的方法及平台
KR101265975B1 (ko) 미래 기술 가치 평가 시스템 및 방법
CN114511320A (zh) 一种基于数据赋权的数据交易系统及方法
KR100700376B1 (ko) 실시간 서지데이터베이스 평가 방법
CN113344750A (zh) 一种案件审判瑕疵等级的判定方法和系统
CN115620885B (zh) 一种测量工具的评价方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination