CN107886309A - 文档自动审查工具 - Google Patents

文档自动审查工具 Download PDF

Info

Publication number
CN107886309A
CN107886309A CN201711344791.XA CN201711344791A CN107886309A CN 107886309 A CN107886309 A CN 107886309A CN 201711344791 A CN201711344791 A CN 201711344791A CN 107886309 A CN107886309 A CN 107886309A
Authority
CN
China
Prior art keywords
document
automatically
module
examines
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711344791.XA
Other languages
English (en)
Inventor
徐犇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Hanke Computer Info-Tech Co Ltd
Original Assignee
Sichuan Hanke Computer Info-Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Hanke Computer Info-Tech Co Ltd filed Critical Sichuan Hanke Computer Info-Tech Co Ltd
Priority to CN201711344791.XA priority Critical patent/CN107886309A/zh
Publication of CN107886309A publication Critical patent/CN107886309A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种文档自动审查工具,该工具用于文档的自动审查,其包括以下模块:文档导入模块:用于导入被审查文档;文档模型定义模块:用于定义被审查文档需求,包括文档的二义性、完整性和功能性;自然语言识别模块:识别文档中的错别字,自动分析文档的结构错误和部分逻辑冲突;文档审查单生成模块:筛选审查项,自动生成新项目的文档审查单;自动审查模块:针对文档的二义性、完整性和功能性进行自动审查;自动分析模块:根据审查结果自动生成审查报告。本发明是利用智能化的文档审查工具来代替传统的纯人工审查方式。

Description

文档自动审查工具
技术领域
本发明涉及文档处理领域,具体涉及一种文档自动审查工具。
背景技术
软件文档或者源代码文档是指与软件系统及其软件工程过程有关联的文本实体。文档的类型包括软件需求文档,设计文档,测试文档,用户手册等。其中的需求文档,设计文档和测试文档一般是在软件开发过程中由开发者写就的,而用户手册等非过程类文档是由专门的非技术类写作人员写就的。文档能提高软件开发的效率,保证软件的质量,而且在软件的使用过程中有指导、帮助、解惑的作用,尤其在维护工作中,文档是不可或缺的资料。
当前所内文档审查的工作方式为纯人工审查,效率低、工作量大。同时,传统的文档审查单由于是人工编写,导致同一份审查单重复被多个项目利用,没有进行有效的删减。
发明内容
本发明的目的在于克服现有技术的不足,提供一种文档自动审查工具,利用智能化的文档审查工具来代替传统的纯人工审查方式。
本发明的目的是通过以下技术方案来实现的:
文档自动审查工具,该工具包括以下模块:
文档导入模块:用于导入被审查文档;
文档模型定义模块:用于定义被审查文档需求,包括文档的二义性、完整性和功能性;
自然语言识别模块:识别文档中的错别字,自动分析文档的结构错误和部分逻辑冲突;
文档审查单生成模块:筛选审查项,自动生成新项目的文档审查单;
自动审查模块:针对文档的二义性、完整性和功能性进行自动审查;
自动分析模块:根据审查结果自动生成审查报告。
优选的,所述错别字包括词组拼写错误、单个汉字错误。
更进一步的,所述文档的导入方式采用的是文档内容直接输入或扫描方式;所述文档内容直接输入用于电子文档的输入,所述扫描方式用于纸质文档的输入。
更进一步的,还包括记录分析模块,所述记录分析模块记录每次文档的错误类型,并将该错误类型存储形成错误类型分析总结包括。
更进一步的,还包括修正模块,所述修正模块用于记录用户针对审查报告中的错误采用的修正方式,并将该修正方式的步骤记录形成标准修改程序,当下一次文档审查中出现类似错误时,修正模块启用该修正方式自动对该文档进行修正,并生成新的文档副本和原文档,用户可根据生成的新文档是否符合实际需求选择性适用。
更进一步的,所述标准修改程序是基于同类错误的至少3次以上的相同修正方式才会将该修正方式记录为标准修改程序。
本发明的有益效果是: 本发明设计的文档自动审查工具,省去了传统的人工修改,可以自动根据文档需求进行审查,同时生成审查报告,同时还具备错误经验积累和修正方式积累,当某一个错误经常发生时,且修改方式也相同时,则将该错误和修改方式进行匹配并生成相应的标准修改程序,当下一次文档审查到类似错误时,则审查工具对该文档的该该错误进行自动修改生成文档副本,从而节约人工修改的麻烦。
附图说明
图1本发明的流程图。
具体实施方式
下面结合具体实施例进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示:
文档自动审查工具,该工具包括以下模块:
文档导入模块:用于导入被审查文档;
文档模型定义模块:用于定义被审查文档需求,包括文档的二义性、完整性和功能性;
自然语言识别模块:识别文档中的错别字,自动分析文档的结构错误和部分逻辑冲突;
文档审查单生成模块:筛选审查项,自动生成新项目的文档审查单;
自动审查模块:针对文档的二义性、完整性和功能性进行自动审查;
自动分析模块:根据审查结果自动生成审查报告。
优选的,所述错别字包括词组拼写错误、单个汉字错误。
更进一步的,所述文档的导入方式采用的是文档内容直接输入或扫描方式;所述文档内容直接输入用于电子文档的输入,所述扫描方式用于纸质文档的输入。
更进一步的,还包括记录分析模块,所述记录分析模块记录每次文档的错误类型,并将该错误类型存储形成错误类型分析总结包括。
更进一步的,还包括修正模块,所述修正模块用于记录用户针对审查报告中的错误采用的修正方式,并将该修正方式的步骤记录形成标准修改程序,当下一次文档审查中出现类似错误时,修正模块启用该修正方式自动对该文档进行修正,并生成新的文档副本和原文档,用户可根据生成的新文档是否符合实际需求选择性适用。
更进一步的,所述标准修改程序是基于同类错误的至少3次以上的相同修正方式才会将该修正方式记录为标准修改程序。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (6)

1.文档自动审查工具,其特征在于,该工具用于文档的自动审查,其包括以下模块:
文档导入模块:用于导入被审查文档;
文档模型定义模块:用于定义被审查文档需求,包括文档的二义性、完整性和功能性;
自然语言识别模块:识别文档中的错别字,自动分析文档的结构错误和部分逻辑冲突;
文档审查单生成模块:筛选审查项,自动生成新项目的文档审查单;
自动审查模块:针对文档的二义性、完整性和功能性进行自动审查;
自动分析模块:根据审查结果自动生成审查报告。
2.根据权利要求1所述的文档自动审查工具,其特征在于,所述错别字包括词组拼写错误、单个汉字错误。
3.根据权利要求2所述的文档自动审查工具,其特征在于,所述文档的导入方式采用的是文档内容直接输入或扫描方式;所述文档内容直接输入用于电子文档的输入,所述扫描方式用于纸质文档的输入。
4.根据权利要求1所述的文档自动审查工具,其特征在于,还包括记录分析模块,所述记录分析模块记录每次文档的错误类型,并将该错误类型存储形成错误类型分析总结包括。
5.根据权利要求4所述的文档自动审查工具,其特征在于,还包括修正模块,所述修正模块用于记录用户针对审查报告中的错误采用的修正方式,并将该修正方式的步骤记录形成标准修改程序,当下一次文档审查中出现类似错误时,修正模块启用该修正方式自动对该文档进行修正,并生成新的文档副本和原文档,用户可根据生成的新文档是否符合实际需求选择性适用。
6.根据权利要求5所述的文档自动审查工具,其特征在于,所述标准修改程序是基于同类错误的至少3次以上的相同修正方式才会将该修正方式记录为标准修改程序。
CN201711344791.XA 2017-12-15 2017-12-15 文档自动审查工具 Withdrawn CN107886309A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711344791.XA CN107886309A (zh) 2017-12-15 2017-12-15 文档自动审查工具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711344791.XA CN107886309A (zh) 2017-12-15 2017-12-15 文档自动审查工具

Publications (1)

Publication Number Publication Date
CN107886309A true CN107886309A (zh) 2018-04-06

Family

ID=61770719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711344791.XA Withdrawn CN107886309A (zh) 2017-12-15 2017-12-15 文档自动审查工具

Country Status (1)

Country Link
CN (1) CN107886309A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555212A (zh) * 2019-09-06 2019-12-10 北京金融资产交易所有限公司 基于自然语言处理的文档校验方法、装置和电子设备
CN111460786A (zh) * 2020-04-09 2020-07-28 南京东大智能化系统有限公司 一种传统文档结构分析的技术方法
CN111652117A (zh) * 2020-05-29 2020-09-11 上海深杳智能科技有限公司 一种对多文档图像分割的方法及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555212A (zh) * 2019-09-06 2019-12-10 北京金融资产交易所有限公司 基于自然语言处理的文档校验方法、装置和电子设备
CN111460786A (zh) * 2020-04-09 2020-07-28 南京东大智能化系统有限公司 一种传统文档结构分析的技术方法
CN111652117A (zh) * 2020-05-29 2020-09-11 上海深杳智能科技有限公司 一种对多文档图像分割的方法及介质
CN111652117B (zh) * 2020-05-29 2023-07-04 上海深杳智能科技有限公司 一种对多文档图像分割的方法及介质

Similar Documents

Publication Publication Date Title
Carpenter Carpenter's complete Guide to the SAS Macro language
Fischbach et al. Specmate: Automated creation of test cases from acceptance criteria
US8875110B2 (en) Code inspection executing system for performing a code inspection of ABAP source codes
US9122540B2 (en) Transformation of computer programs and eliminating errors
US9965472B2 (en) Content revision using question and answer generation
CN107886309A (zh) 文档自动审查工具
CN110059006B (zh) 代码审计方法及装置
Bettenburg et al. A lightweight approach to uncover technical artifacts in unstructured data
Letsholo et al. TRAM: A tool for transforming textual requirements into analysis models
CN112416788A (zh) 一种分层规范的Web应用UI自动化测试方法
CN102298552A (zh) 基于代码查询进行源代码插桩的方法
Saini et al. Automated traceability for domain modelling decisions empowered by artificial intelligence
WO2016035273A1 (ja) テキスト処理システム、テキスト処理方法、及び、コンピュータ・プログラムが記録された記憶媒体
JP6768738B2 (ja) 学習データ生成装置、方法、およびプログラム
Clemmensen et al. Formal specification and development of an Ada compiler-a VDM case study
Sharma et al. Extracting high-level functional design from software requirements
CN103049504A (zh) 基于源代码查询的半自动插桩方法
CN112860913A (zh) 一种知识图谱的本体创建方法
JP2011096082A (ja) プログラム解析方法、プログラム解析プログラムおよびプログラム解析装置
CN114327614A (zh) 参考模型数据流记录和分析的方法及应用
Seretan et al. The ACCEPT Portal: An online framework for the pre-editing and post-editing of user-generated content
CN108628606B (zh) 一种嵌入式设备的web网管应用程序生成方法及系统
Travassos et al. A family of reading techniques for OO design inspections
Fernández-Ropero et al. Repairing business process models as retrieved from source code
CN116909533B (zh) 计算机程序语句编辑方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180406

WW01 Invention patent application withdrawn after publication