CN109685471A - 一种多语言论文智能审查系统 - Google Patents

一种多语言论文智能审查系统 Download PDF

Info

Publication number
CN109685471A
CN109685471A CN201811599018.2A CN201811599018A CN109685471A CN 109685471 A CN109685471 A CN 109685471A CN 201811599018 A CN201811599018 A CN 201811599018A CN 109685471 A CN109685471 A CN 109685471A
Authority
CN
China
Prior art keywords
unit
module
paper
library
retrieval module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811599018.2A
Other languages
English (en)
Inventor
胡森博
郝然
王晓磊
陈子桐
张富源
鲍鸿飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201811599018.2A priority Critical patent/CN109685471A/zh
Publication of CN109685471A publication Critical patent/CN109685471A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种多语言论文智能审查系统,包括输入数据检索模块、数据库单元、信息提取模块和计算模块,所述输入数据检索模块通过通讯模块一与所述数据库单元相连接,所述数据库单元通过通讯模块二与所述信息提取模块相连接,所述信息提取模块通过通讯模块三与所述计算模块相连接,所述输入数据检索模块包括段落检索模块、语句检索模块、常用词及关键词检索模块、文章结构框架检索模块、长句检索模块。有益效果:而且从论文格式角度支持论文指导教师和高校相关部门实现自动化、快速和智能的审查和评估学生论文质量,也可以将自己的论文上传至本本系统,与其他用户分享自己的写作经验及相关错误,以便更好的规范用户对于论文的写法。

Description

一种多语言论文智能审查系统
技术领域
本发明涉及计算机自动检测与编辑技术领域,具体来说,涉及一种多语言论文智能审查系统。
背景技术
由于网络信息技术、通信技术、数字图书馆和数字分布式媒体的全面崛起为信息资源能够高效的分享与传播提供的必要的条件。这些新兴网络资源变成了当代社会中存储信息资源的媒介。由于存储在网上的信息资源大多是采用开放、互享的平台来存储,使得人们能够更方便、快速、高效获取和传播这些信息。但在同一时间,它为抄袭者提供了一个理想的温床,使得抄袭变得更简洁、方便。
根据中国号201020177813.5公开了一种云检索系统,用户终端电脑通过网络与数据分类电脑连接,数据分类电脑通过接口连接数据库电脑。虽然能够提供检索服务,但是必须依赖拥有一定参考文章的分类数据库,这样只能适用于专业的论文查抄机构,每次检索也必须向查抄机构全额付费。这显然无法满足单个学生或者学校随时进行文章的检索需求。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种多语言论文智能审查系统,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
一种多语言论文智能审查系统,包括输入数据检索模块、数据库单元、信息提取模块和计算模块,所述输入数据检索模块通过通讯模块一与所述数据库单元相连接,所述数据库单元通过通讯模块二与所述信息提取模块相连接,所述信息提取模块通过通讯模块三与所述计算模块相连接;
其中,所述输入数据检索模块包括依次连接的段落检索模块、语句检索模块、常用词及关键词检索模块、文章结构框架检索模块、长句检索模块和短句检索模块,所述数据库单元包括依次连接的论文数据库、书籍库单元、论文库单元、专利库单元、公式库单元、谚语俗语库单元、谚语库单元、名人名言库单元、诗词库子库单元和中外文分词组模块,所述信息提取模块包括依次连接的题目单元、摘要单元、关键词单元、中图分类模块、文献标志符单元、子标题单元和图形图表单元,所述计算模块包括依次连接的标准化数据库、对比单元、检测单元、选择单元、添加单元、查看明细单元和修改删除单元。
进一步的,所述信息提取模块从文档中提取题目、摘要、关键词、中图分类号、文献标志符、子标题、图形、图表、作者简介和英文部分的信息并存放到标准化数据库中。
进一步的,所述中外文分词组模块用于对论文中各素材进行分词,并将中外文分词组结果保存至计算模块中,中外文分词组模块将分词结果与分词库保存的词性进行比对,确定中外文分词组结果的词性。
进一步的,所述数据库单元,用于收录分词及对应的词性,将含义相同或相近的中外文分词构成一组,以组为单位进行编号。
进一步的,所述对比单元将论文与标准化数据库进行对比,添加或选择对标准化数据库中的标准进行选择、添加、查看明细、修改或删除。
进一步的,所述检测单元用于判断当前用户待鉴定文档与数据库单元内的数据文档进行对比检测。
进一步的,所述查看明细单元是将文档的添加和修改信息进行储存记录,方便用户随时查阅修改的内容。
进一步的,所述中外文分词组模块根据文档中的分词结果进行分类中外文分词组自由向量维数,且所述中外文分词组模块自由向量维数等于对特定素材进行分词后得到的不同中外文分词组的数量。
进一步的,所述文章结构框架检索模块对文本进行分句处理,处理的句子按照在文本的位置按次序排列并保存。
本发明的有益效果为:通过各模块各功能协同作用,避免各高校的论文抄袭日益严重现象,提高本科生对于毕业论文重视程度,提升本校毕业生对毕业论文的创新性和主动性,同时可防止过度引用他人的文献,能够为广大高校学生提供专业论文格式指导,而且从论文格式角度支持论文指导教师和高校相关部门实现自动化、快速和智能的审查和评估学生论文质量,也可以将自己的论文上传至本本系统,与其他用户分享自己的写作经验及相关错误,以便更好的规范用户对于论文的写法。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种多语言论文智能审查系统的结构示意图。
图中:
1、输入数据检索模块;2、数据库单元;3、信息提取模块;4、计算模块;5、通讯模块一;6、通讯模块二;7、通讯模块三;8、段落检索模块;9、语句检索模块;10、常用词及关键词检索模块;11、文章结构框架检索模块;12、长句检索模块;13、短句检索模块;14、论文数据库;15、书籍库单元;16、论文库单元;17、专利库单元;18、公式库单元;19、谚语俗语库单元;20、谚语库单元;21、名人名言库单元;22、诗词库子库单元;23、中外文分词组模块;24、题目单元;25、摘要单元;26、关键词单元;27、中图分类模块;28、文献标志符单元;29、子标题单元;30、图形图表单元;31、标准化数据库;32、对比单元;33、检测单元;34、选择单元;35、添加单元;36、查看明细单元;37、修改删除单元。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
根据本发明的实施例,提供了一种多语言论文智能审查系统。
实施例一,
如图1所示,根据本发明实施例的多语言论文智能审查系统,包括输入数据检索模块1、数据库单元2、信息提取模块3和计算模块4,所述输入数据检索模块1通过通讯模块一5与所述数据库单元2相连接,所述数据库单元2通过通讯模块二6与所述信息提取模块3相连接,所述信息提取模块3通过通讯模块三7与所述计算模块4相连接;
其中,所述输入数据检索模块1包括依次连接的段落检索模块8、语句检索模块9、常用词及关键词检索模块10、文章结构框架检索模块11、长句检索模块12和短句检索模块13,所述数据库单元2包括依次连接的论文数据库14、书籍库单元15、论文库单元16、专利库单元17、公式库单元18、谚语俗语库单元19、谚语库单元20、名人名言库单元21、诗词库子库单元22和中外文分词组模块23,所述信息提取模块3包括依次连接的题目单元24、摘要单元25、关键词单元26、中图分类模块27、文献标志符单元28、子标题单元29和图形图表单元30,所述计算模块4包括依次连接的标准化数据库31、对比单元32、检测单元33、选择单元34、添加单元35、查看明细单元36和修改删除单元37。
实施例二,
如图1所示,所述信息提取模块3从文档中提取题目、摘要、关键词、中图分类号、文献标志符、子标题、图形、图表、作者简介和英文部分的信息并存放到标准化数据库31中,所述中外文分词组模块23用于对论文中各素材进行分词,并将中外文分词组结果保存至计算模块4中,中外文分词组模块将分词结果与分词库保存的词性进行比对,确定中外文分词组结果的词性,所述数据库单元2,用于收录分词及对应的词性,将含义相同或相近的中外文分词构成一组,以组为单位进行编号。
实施例三,
如图1所示,所述对比单元32将论文与标准化数据库31进行对比,添加或选择对标准化数据库中的标准进行选择、添加、查看明细、修改或删除,所述检测单元33用于判断当前用户待鉴定文档与数据库单元2内的数据文档进行对比检测,所述查看明细单元36是将文档的添加和修改信息进行储存记录,方便用户随时查阅修改的内容,所述中外文分词组模块23根据文档中的分词结果进行分类中外文分词组自由向量维数,且所述中外文分词组模块23自由向量维数等于对特定素材进行分词后得到的不同中外文分词组的数量,所述文章结构框架检索模块11对文本进行分句处理,处理的句子按照在文本的位置按次序排列并保存。
工作原理;用户将文档数据上传至输入数据检索模块1,信息提取模块3通过题目单元24、摘要单元25、关键词单元26、中图分类模块27、文献标志符单元28、子标题单元29和图形图表单元30将文档数据中的题目、摘要、关键词、中图分类号、文献标志符、子标题、图形、图表、作者简介和英文提取发送给计算模块4进行分析,然后根据数据库单元2进行拆分,对出现错误或语法、英语单词的误用进行标注修改,用户通过查看明细单元36进行查看修改的数据以及段落。
综上所述,借助于本发明的上述技术方案,通过各模块各功能协同作用,避免各高校的论文抄袭日益严重现象,提高本科生对于毕业论文重视程度,提升本校毕业生对毕业论文的创新性和主动性,同时可防止过度引用他人的文献,能够为广大高校学生提供专业论文格式指导,而且从论文格式角度支持论文指导教师和高校相关部门实现自动化、快速和智能的审查和评估学生论文质量,也可以将自己的论文上传至本本系统,与其他用户分享自己的写作经验及相关错误,以便更好的规范用户对于论文的写法。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种多语言论文智能审查系统,其特征在于,包括输入数据检索模块(1)、数据库单元(2)、信息提取模块(3)和计算模块(4),所述输入数据检索模块(1)通过通讯模块一(5)与所述数据库单元(2)相连接,所述数据库单元(2)通过通讯模块二(6)与所述信息提取模块(3)相连接,所述信息提取模块(3)通过通讯模块三(7)与所述计算模块(4)相连接;
其中,所述输入数据检索模块(1)包括依次连接的段落检索模块(8)、语句检索模块(9)、常用词及关键词检索模块(10)、文章结构框架检索模块(11)、长句检索模块(12)和短句检索模块(13),所述数据库单元(2)包括依次连接的论文数据库(14)、书籍库单元(15)、论文库单元(16)、专利库单元(17)、公式库单元(18)、谚语俗语库单元(19)、谚语库单元(20)、名人名言库单元(21)、诗词库子库单元(22)和中外文分词组模块(23),所述信息提取模块(3)包括依次连接的题目单元(24)、摘要单元(25)、关键词单元(26)、中图分类模块(27)、文献标志符单元(28)、子标题单元(29)和图形图表单元(30),所述计算模块(4)包括依次连接的标准化数据库(31)、对比单元(32)、检测单元(33)、选择单元(34)、添加单元(35)、查看明细单元(36)和修改删除单元(37)。
2.根据权利要求1所述的一种多语言论文智能审查系统,其特征在于,所述信息提取模块(3)从文档中提取题目、摘要、关键词、中图分类号、文献标志符、子标题、图形、图表、作者简介和英文部分的信息并存放到标准化数据库(31)中。
3.根据权利要求2所述的一种多语言论文智能审查系统,其特征在于,所述中外文分词组模块(23)用于对论文中各素材进行分词,并将中外文分词组结果保存至计算模块(4)中,中外文分词组模块将分词结果与分词库保存的词性进行比对,确定中外文分词组结果的词性。
4.根据权利要求3所述的一种多语言论文智能审查系统,其特征在于,所述数据库单元(2),用于收录分词及对应的词性,将含义相同或相近的中外文分词构成一组,以组为单位进行编号。
5.根据权利要求4所述的一种多语言论文智能审查系统,其特征在于,所述对比单元(32)将论文与标准化数据库(31)进行对比,添加或选择对标准化数据库中的标准进行选择、添加、查看明细、修改或删除。
6.根据权利要求5所述的一种多语言论文智能审查系统,其特征在于,所述检测单元(33)用于判断当前用户待鉴定文档与数据库单元(2)内的数据文档进行对比检测。
7.根据权利要求6所述的一种多语言论文智能审查系统,其特征在于,所述查看明细单元(36)是将文档的添加和修改信息进行储存记录,方便用户随时查阅修改的内容。
8.根据权利要求7所述的一种多语言论文智能审查系统,其特征在于,所述中外文分词组模块(23)根据文档中的分词结果进行分类中外文分词组自由向量维数,且所述中外文分词组模块(23)自由向量维数等于对特定素材进行分词后得到的不同中外文分词组的数量。
9.根据权利要求8所述的一种多语言论文智能审查系统,其特征在于,所述文章结构框架检索模块(11)对文本进行分句处理,处理的句子按照在文本的位置按次序排列并保存。
CN201811599018.2A 2018-12-25 2018-12-25 一种多语言论文智能审查系统 Pending CN109685471A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811599018.2A CN109685471A (zh) 2018-12-25 2018-12-25 一种多语言论文智能审查系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811599018.2A CN109685471A (zh) 2018-12-25 2018-12-25 一种多语言论文智能审查系统

Publications (1)

Publication Number Publication Date
CN109685471A true CN109685471A (zh) 2019-04-26

Family

ID=66189679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811599018.2A Pending CN109685471A (zh) 2018-12-25 2018-12-25 一种多语言论文智能审查系统

Country Status (1)

Country Link
CN (1) CN109685471A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222314A (zh) * 2020-01-03 2020-06-02 北大方正集团有限公司 版式文档的比对方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440233A (zh) * 2013-09-10 2013-12-11 青岛大学 一种科技论文标准化自动检测编辑系统
US20140355865A1 (en) * 2013-05-28 2014-12-04 Bank Of America Corporation Image overlay for duplicate image detection
CN105701076A (zh) * 2016-01-13 2016-06-22 湖南通远网络科技有限公司 一种论文抄袭检测方法及系统
CN105701077A (zh) * 2016-01-13 2016-06-22 夏峰 一种多语种文献检测方法及系统
CN107784100A (zh) * 2017-10-26 2018-03-09 苏州赛维新机电检测技术服务有限公司 一种论文检索系统
CN107885706A (zh) * 2017-11-06 2018-04-06 佛山市章扬科技有限公司 一种数据相似度检测的系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140355865A1 (en) * 2013-05-28 2014-12-04 Bank Of America Corporation Image overlay for duplicate image detection
CN103440233A (zh) * 2013-09-10 2013-12-11 青岛大学 一种科技论文标准化自动检测编辑系统
CN105701076A (zh) * 2016-01-13 2016-06-22 湖南通远网络科技有限公司 一种论文抄袭检测方法及系统
CN105701077A (zh) * 2016-01-13 2016-06-22 夏峰 一种多语种文献检测方法及系统
CN107784100A (zh) * 2017-10-26 2018-03-09 苏州赛维新机电检测技术服务有限公司 一种论文检索系统
CN107885706A (zh) * 2017-11-06 2018-04-06 佛山市章扬科技有限公司 一种数据相似度检测的系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222314A (zh) * 2020-01-03 2020-06-02 北大方正集团有限公司 版式文档的比对方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Merz et al. The Manifesto Corpus: A new resource for research on political parties and quantitative text analysis
Zaidan et al. Arabic dialect identification
Hanke et al. iLex–A database tool for integrating sign language corpus linguistics and sign language lexicography
Hinrichs et al. Trading consequences: A case study of combining text mining and visualization to facilitate document exploration
Battisti et al. A corpus for automatic readability assessment and text simplification of German
Sinclair From theory to practice
CN106294466A (zh) 分类模型构建方法、分类模型构建设备和分类方法
Tamburelli Uncovering the ‘hidden’multilingualism of Europe: an Italian case study
Schöch et al. The CLiGS Textbox: Building and Using Collections of Literary Texts in Romance Languages Encoded in TEI XML
CN109685471A (zh) 一种多语言论文智能审查系统
CN110008807A (zh) 一种合同内容识别模型的训练方法、装置及设备
Lin et al. Beyond discrete genres: Mapping news items onto a multidimensional framework of genre cues
Diab et al. Creating a large multi-layered representational repository of linguistic code switched arabic data
Glaznieks et al. From the valleys to the World Wide Web: Non-standard spellings on social network sites
Zullo et al. A pan-Atlantic “multiple modal belt”?
Chiu Measuring register characteristics
Hopf et al. A contrastive analysis of the phonologies of two Fiji English dialects: A diagnostic guide for speech–language pathologists
Ruhi et al. A platform for creating multimodal and multilingual spoken corpora for Turkic languages: Insights from the Spoken Turkish Corpus
Tseng Advancing a sociolinguistics of complexity: Spanish-speaking identities in Washington, DC
Banerjee et al. Named entity recognition on code-mixed cross-script social media content
Mayoral Asensio For a new approach to translator training: Questioning some of the concepts which inform current programme structure and content in Spain
Лукашевич et al. SentiRuEval: тестирование систем анализа тональности текстов на русском языке по отношению к заданному объекту
Stirling et al. Tense, aspect, modality and evidentiality in Australian languages: Foreword
Duan et al. A hotel review corpus for argument mining
Jatowt et al. Longitudinal analysis of historical texts' readability

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190426