CN117194603A - 一种文档的审核方法、装置、电子设备及存储介质 - Google Patents
一种文档的审核方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117194603A CN117194603A CN202311151867.2A CN202311151867A CN117194603A CN 117194603 A CN117194603 A CN 117194603A CN 202311151867 A CN202311151867 A CN 202311151867A CN 117194603 A CN117194603 A CN 117194603A
- Authority
- CN
- China
- Prior art keywords
- inspection
- document
- checked
- data
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000001514 detection method Methods 0.000 claims abstract description 106
- 238000007689 inspection Methods 0.000 claims abstract description 82
- 238000012550 audit Methods 0.000 claims abstract description 46
- 238000012552 review Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 20
- 238000012423 maintenance Methods 0.000 claims description 18
- 238000009434 installation Methods 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 15
- 238000003062 neural network model Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013075 data extraction Methods 0.000 claims description 7
- 238000003672 processing method Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000004801 process automation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000009411 base construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Abstract
本申请公开了一种文档的审核方法、装置、电子设备及存储介质,可应用于大数据领域或金融领域。该方法包括:采集源数据,源数据包括手册类文档和手册类文档的评审流程数据;基于检查规则库对源数据进行数据抽取,得到待检查关键词;将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果;若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
Description
技术领域
本发明涉及数据管理技术领域,尤其涉及一种文档的审核方法、装置、电子设备及存储介质。
背景技术
安装手册和维护手册等手册类文档是指对产品的安装和维护进行说明的文档。由于在日常业务中,批次任务多、涉及的产品较广,各个任务的手册类文档的编写人员不尽相同,导致手册类文档的质量参差不齐;为了确保手册类文档符合质量审计的要求,需要在手册类文档发布之前进行审核以及评审流程验证操作。
目前主要通过工作人员逐一对手册类文档进行审核,由于手册类文档中的内容往往比较多,因此审核过程比较繁琐,容易出现由于人为疏忽导致失误的问题,且人工审核所需要的时间成本也较高,导致审核效率低下。
发明内容
有鉴于此,本发明实施例提供一种文档的审核方法、装置、电子设备及存储介质,以解决人工审核效率低的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种文档的审核方法,所述方法包括:
采集源数据,所述源数据包括手册类文档和手册类文档的评审流程数据;
基于检查规则库对所述源数据进行数据抽取,得到待检查关键词;所述检查规则库预先根据用户输入的检查表构建;
将所述待检查关键词输入检测模型中进行检测,得到所述待检查关键词的检测结果,所述检测模型预先根据预设样本数据训练神经网络模型得到;
若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户。
优选的,所述基于检查规则库对所述源数据进行数据抽取,得到待检查关键词,包括:
根据预设语言处理方法和预设文字识别方法,将所述源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;
基于检查规则库中的检查要素,分别从所述安装手册类文档、所述维护手册类文档和所述手册类文档的评审流程数据中,抽取所述检查要素相应的待检查关键词。
优选的,根据用户输入的检查表构建检查规则库的过程,包括:
定时接收用户输入的检查表;
提取所述检查表中的文档类型和所述文档类型对应的检查要素;
根据所述文档类型和所述文档类型对应的检查要素,构建检查规则库。
优选的,根据预设样本数据训练神经网络模型得到所述检测模型的过程,包括:
获取样本数据,所述样本数据为关键词信息;
将所述样本数据拆分为训练集和测试集;
基于所述训练集,训练神经网络模型直至所述神经网络模型收敛,得到检测模型;
利用所述测试集测试所述检测模型的检测效果;
若所述检测效果满足预设条件,则确定得到最终的检测模型;
若所述检测效果不满足预设条件,则更新所述检测模型的参数,返回执行利用所述测试集测试所述检测模型的识别效果这一步骤。
优选的,所述若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户,包括:
若所述检测结果指示所述待检查关键词不符合规则要求,则获取所述待检查关键词对应的目标源数据;
根据所述目标源数据和所述待检查关键词生成审核报告;
将所述审核报告发送至所述用户。
本发明实施例第二方面公开一种文档的审核装置,所述装置包括:
采集单元,用于采集源数据,所述源数据包括手册类文档和手册类文档的评审流程数据;
抽取单元,用于基于检查规则库对所述源数据进行数据抽取,得到待检查关键词;所述检查规则库预先根据用户输入的检查表构建;
检测单元,用于将所述待检查关键词输入检测模型中进行检测,得到所述待检查关键词的检测结果,所述检测模型预先根据预设样本数据训练神经网络模型得到;
生成单元,用于若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户。
优选的,所述抽取单元,包括:
分类模块,用于根据预设语言处理方法和预设文字识别方法,将所述源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;
抽取模块,用于基于检查规则库中的检查要素,分别从所述安装手册类文档、所述维护手册类文档和所述手册类文档的评审流程数据中,抽取所述检查要素相应的待检查关键词。
优选的,还包括:
接收单元,用于定时接收用户输入的检查表;
提取单元,用于提取所述检查表中的文档类型和所述文档类型对应的检查要素;
构建单元,用于根据所述文档类型和所述文档类型对应的检查要素,构建检查规则库。
本发明实施例第三方面公开一种存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本发明实施例第一方面公开的一种文档的审核方法。
本发明实施例第四方面公开一种电子设备,包括:存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,具体用于实现本发明实施例第一方面公开的一种文档的审核方法。
基于上述本发明实施例提供的一种文档的审核方法、装置、电子设备及存储介质,该方法包括:采集源数据,源数据包括手册类文档和手册类文档的评审流程数据;基于检查规则库对源数据进行数据抽取,得到待检查关键词;将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果;若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种文档的审核方法的流程图;
图2为本发明实施例提供的一种文档的审核方法的示意图;
图3为本发明实施例提供的一种文档的审核装置的结构框图;
图4为本发明实施例提供的一种一种电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要说明的是,本发明提供的一种文档的审核方法、装置、电子设备及存储介质可用于大数据领域或金融领域。上述仅为示例,并不对本发明提供的一种文档的审核方法、装置、电子设备及存储介质的应用领域进行限定。
由背景技术可知,目前在人工审核的过程中,容易出现由于人为疏忽导致失误的问题,且人工审核所需要的时间成本也较高,导致审核效率低下。
因此,本发明实施例提供一种文档的审核方法、装置、电子设备及存储介质,采集源数据,源数据包括手册类文档和手册类文档的评审流程数据;基于检查规则库对源数据进行数据抽取,得到待检查关键词;将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果;若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
需要说明的是,在本发明实施例中利用机器人流程自动化(Robotic ProcessAutomation,RPA)模拟人机交付,代替人工处理大量机械和重复性的键盘或鼠标操作,在手册类文档发布之前进行审核以及评审流程验证操作。在审核的具体过程中,基于自然语言处理(Natural Language Processing,NLP)技术和光学字符识别(Optical CharacterRecognition,OCR)技术,分析、理解、处理手册类文档和手册类文档的评审流程数据中的自然语言,进行理解分析识别。
参见图1,示出了本发明实施例提供的一种文档的审核方法的流程图,该文档的审核方法包括:
步骤S101:采集源数据。
在具体实现步骤S101的过程中,对于不同平台的源数据,采用RPA技术,通过定时任务采集源数据,其中,源数据包括手册类文档和手册类文档的评审流程数据。
例如:采用RPA技术,每个月(或每个星期)从配置库采集手册类文档;从IT资产管理系统中采集手册类文档的评审过程数据等。
可以理解的是,根据业务需求,每个月(或每个星期)对手册类文档和手册类文档的评审流程数据进行质量审计,采用RPA技术自动采集源数据,缩短了处理时间。
步骤S102:基于检查规则库对源数据进行数据抽取,得到待检查关键词。
在具体实现步骤S102的过程中,根据源数据的类型,从检查规则库中获取源数据对应的检查要素,基于检查要素从源数据中抽取检查要素相应的待检查关键词。
需要说明的是,根据预设语言处理方法(如NLP处理方法)和预设文字识别方法(如OCR识别方法),将源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;基于检查规则库中安装手册类文档对应的检查要素,维护手册类文档对应的检查要素,和手册类文档的评审流程数据对应的检查要素,分别从安装手册类文档、维护手册类文档和手册类文档的评审流程数据中,抽取检查要素相应的待检查关键词。
可以理解的是,根据检查规则库中源数据的类别与检查要素的对应关系,从源数据中抽取相应的待检查关键词,提高了抽取待检查关键词的准确性,
在一些具体实施例中,定时(如每3天一次)接收用户输入的检查表;提取检查表中的文档类型和文档类型对应的检查要素根据文档类型和文档类型对应的检查要素,构建检查规则库。
例如:安装手册类文档对应的检查要素有文档版本号、文档编号和修订记录等;维护手册类文档对应的检查要素有文档版本号、文档编号、修订记录和软件版本号等;手册类文档的评审流程数据对应的检查要素有是否通过评审和是否操作完成等。
在具体实现中,定时接收用户输入的检查表,在第一次接收到用户输入的检查表时,根据检查表中的检查要素和文档类型,初始化检查规则库,后续每次接收到用户输入的检查表时,若检查表中存在新增的检查要素,则根据新增的检查要素和检查要素对应的文档类型,对检查规则库进行补充更新。
可以理解的是,定时根据用户输入的检查表构建检查规则库,及时更新检查规则库中的检查要素,提高了审核文档的准确性,使审核结果更加具有可靠性。
步骤S103:将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果。
在具体实现步骤S103的过程中,将从源数据中抽取得到的待检查关键词输入预先训练的检测模型中进行检测,得到待检查关键词的检测结果。
例如:利用检测模型比较待检查关键词和检测模型中的关键词信息是否一致,如检测模型中的关键词信息指征安装类手册文档的版本号为1.1.0,待检查关键词为1.0.0,则确定待检查关键词的检测结果指示待检查关键词不符规则要求。
具体的,训练检测模型的过程如下:
获取样本数据,样本数据为关键词信息;将样本数据拆分为训练集和测试集;基于训练集,训练神经网络模型直至神经网络模型收敛,得到检测模型;利用测试集测试检测模型的检测效果。
若检测效果满足预设条件,则确定得到最终的检测模型;若检测效果不满足预设条件,则更新检测模型的参数,返回执行利用测试集测试检测模型的识别效果这一步骤。
需要说明的是,预先训练检测模型,利用检测模型对待检查关键词进行检测,提高了检测速度,缩短了检测耗时,有利于快速完成文档审核。
可以理解的是,若检测模型检测到待检查关键词符合规则要求,则确定待检查关键词对应的源数据通过审核;若检测模型检测到待检查关键词不符合规则要求,则向用户提示待检查关键词对应的源数据未通过审核,具体实现原理参见步骤S104的具体内容。
步骤S104:若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。
在具体实现步骤S104的过程中,若检测模型对待检查关键词的检测结果指示待检查关键词不符合检测模型中的规则要求,则获取待检查关键词对应的目标源数据;根据目标源数据和待检查关键词生成审核报告;将审核报告发送至用户。
在一些实施例中,基于目标源数据、待检查关键词和审核报告模板,生成审核报告。
需要说明的是,当待检查关键词不符合规则要求时,获取待检查关键词对应的目标源数据,基于目标源数据和待检查关键词生成审核报告,有利于用户快速定位不符合规则要求的源数据,缩短用户核对所需的时间,提高审核的效率。
在本发明实施例中,构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,替代了人工操作,解决了因人为操作失误造成审核出错的问题,降低了审核失误率,缩短了审核时长,提高了审核效率。
结合图1示出的内容,参见图2,示出了本发明实施例提供的一种文档的审核方法的示意图。如图2所示,审核方法包括6个步骤,规则抽取步骤、数据采集步骤、数据分类步骤、数据抽取步骤、数据识别步骤和数据上传步骤。
其中,规则抽取步骤分为构建检查规则库和训练检测模型;构建检查规则库是基于用户输入的检查表,获取检查表中包含的文档类型和文档类型对应的检查要素,基于文档类型和检查要素构建检查规则库;训练检测模型是根据样本数据训练得到。
数据采集步骤主要通过RPA技术,定时从各个平台采集待审核的源数据,其中,源数据包括手册类文档和手册类文档的评审流程数据。
数据分类步骤主要是将采集得到的源数据进行数据分类,例如分为安装类手册文档、维护类手册文档和手册类文档的评审流程数据。
数据抽取步骤主要是从安装类手册文档中抽取待检查关键词;从维护类手册文档中抽取待检查关键词,和从手册类文档的评审流程数据中抽取待检查关键词。
数据识别步骤主要是将抽取得到的待检查关键词输入检测模型进行检测,得到检测结果。
数据上传步骤是当检测结果指示待检查关键词不符合规则要求时,生成审核报告,将审核报告发送至用户,或将审核报告进行上传,以便用户查看审核报告。
在本发明实施例中,构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
与上述本发明实施例提供的一种文档的审核方法相对应,参见图3,示出了本发明实施例提供的一种文档的审核装置的结构框图,该文档的审核装置包括:采集单元301、抽取单元302、检测单元303和生成单元304。
采集单元301,用于采集源数据,源数据包括手册类文档和手册类文档的评审流程数据。
抽取单元302,用于基于检查规则库对源数据进行数据抽取,得到待检查关键词;检查规则库预先根据用户输入的检查表构建。
检测单元303,用于将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果,检测模型预先根据预设样本数据训练神经网络模型得到。
生成单元304,用于若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。
在本发明实施例中,构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
优选的,结合图3示出的内容,抽取单元302包括分类模块和抽取模块,各个模块的实现原理如下:
分类模块,用于根据预设语言处理方法和预设文字识别方法,将源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据。
抽取模块,用于基于检查规则库中的检查要素,分别从安装手册类文档、维护手册类文档和手册类文档的评审流程数据中,抽取检查要素相应的待检查关键词。
优选的,结合图3示出的内容,该文档的审核装置还包括:接收单元、提取单元和构建单元。
接收单元,用于定时接收用户输入的检查表。
提取单元,用于提取检查表中的文档类型和文档类型对应的检查要素。
构建单元,用于根据文档类型和文档类型对应的检查要素,构建检查规则库。
优选的,结合图3示出的内容,该文档的审核装置还包括:
获取单元,用于获取样本数据,样本数据为关键词信息。
拆分单元,用于将样本数据拆分为训练集和测试集。
训练单元,用于基于训练集,训练神经网络模型直至神经网络模型收敛,得到检测模型。
测试单元,用于利用测试集测试检测模型的检测效果。
确定单元,用于若检测效果满足预设条件,则确定得到最终的检测模型。
更新单元,用于若检测效果不满足预设条件,则更新检测模型的参数,返回执行测试单元。
优选的,结合图3示出的内容,生成单元304包括,
获取模块,用于若检测结果指示待检查关键词不符合规则要求,则获取待检查关键词对应的目标源数据。
生成模块,用于根据目标源数据和待检查关键词生成审核报告。
发送模块,用于将审核报告发送至用户。
本发明实施例还提供一种电子设备,请参考图4,该电子设备包括存储器401和处理器402。
其中,存储器401用于存储计算机程序。
处理器402用于执行计算机程序,具体用于实现本申请任一实施例所提供的文档的审核方法。
本申请还提供一种计算机存储介质,用于存储计算机程序,计算机程序被执行时,具体用于实现本申请任一实施例所提供的文档的审核方法。
综上所述,本发明实施例公开了一种文档的审核方法、装置、电子设备及存储介质,采集源数据,源数据包括手册类文档和手册类文档的评审流程数据;基于检查规则库对源数据进行数据抽取,得到待检查关键词;将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果;若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种文档的审核方法,其特征在于,所述方法包括:
采集源数据,所述源数据包括手册类文档和手册类文档的评审流程数据;
基于检查规则库对所述源数据进行数据抽取,得到待检查关键词;所述检查规则库预先根据用户输入的检查表构建;
将所述待检查关键词输入检测模型中进行检测,得到所述待检查关键词的检测结果,所述检测模型预先根据预设样本数据训练神经网络模型得到;
若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户。
2.根据权利要求1所述的方法,其特征在于,所述基于检查规则库对所述源数据进行数据抽取,得到待检查关键词,包括:
根据预设语言处理方法和预设文字识别方法,将所述源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;
基于检查规则库中的检查要素,分别从所述安装手册类文档、所述维护手册类文档和所述手册类文档的评审流程数据中,抽取所述检查要素相应的待检查关键词。
3.根据权利要求1所述的方法,其特征在于,根据用户输入的检查表构建检查规则库的过程,包括:
定时接收用户输入的检查表;
提取所述检查表中的文档类型和所述文档类型对应的检查要素;
根据所述文档类型和所述文档类型对应的检查要素,构建检查规则库。
4.根据权利要求1所述的方法,其特征在于,根据预设样本数据训练神经网络模型得到所述检测模型的过程,包括:
获取样本数据,所述样本数据为关键词信息;
将所述样本数据拆分为训练集和测试集;
基于所述训练集,训练神经网络模型直至所述神经网络模型收敛,得到检测模型;
利用所述测试集测试所述检测模型的检测效果;
若所述检测效果满足预设条件,则确定得到最终的检测模型;
若所述检测效果不满足预设条件,则更新所述检测模型的参数,返回执行利用所述测试集测试所述检测模型的识别效果这一步骤。
5.根据权利要求1所述的方法,其特征在于,所述若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户,包括:
若所述检测结果指示所述待检查关键词不符合规则要求,则获取所述待检查关键词对应的目标源数据;
根据所述目标源数据和所述待检查关键词生成审核报告;
将所述审核报告发送至所述用户。
6.一种文档的审核装置,其特征在于,所述装置包括:
采集单元,用于采集源数据,所述源数据包括手册类文档和手册类文档的评审流程数据;
抽取单元,用于基于检查规则库对所述源数据进行数据抽取,得到待检查关键词;所述检查规则库预先根据用户输入的检查表构建;
检测单元,用于将所述待检查关键词输入检测模型中进行检测,得到所述待检查关键词的检测结果,所述检测模型预先根据预设样本数据训练神经网络模型得到;
生成单元,用于若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户。
7.根据权利要求6所述的装置,其特征在于,所述抽取单元,包括:
分类模块,用于根据预设语言处理方法和预设文字识别方法,将所述源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;
抽取模块,用于基于检查规则库中的检查要素,分别从所述安装手册类文档、所述维护手册类文档和所述手册类文档的评审流程数据中,抽取所述检查要素相应的待检查关键词。
8.根据权利要求6所述的装置,其特征在于,还包括:
接收单元,用于定时接收用户输入的检查表;
提取单元,用于提取所述检查表中的文档类型和所述文档类型对应的检查要素;
构建单元,用于根据所述文档类型和所述文档类型对应的检查要素,构建检查规则库。
9.一种存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至5任意一项所述的文档的审核方法。
10.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,具体用于实现如权利要求1至5任意一项所述的文档的审核方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311151867.2A CN117194603A (zh) | 2023-09-07 | 2023-09-07 | 一种文档的审核方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311151867.2A CN117194603A (zh) | 2023-09-07 | 2023-09-07 | 一种文档的审核方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117194603A true CN117194603A (zh) | 2023-12-08 |
Family
ID=89001021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311151867.2A Pending CN117194603A (zh) | 2023-09-07 | 2023-09-07 | 一种文档的审核方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117194603A (zh) |
-
2023
- 2023-09-07 CN CN202311151867.2A patent/CN117194603A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256074B (zh) | 校验处理的方法、装置、电子设备和存储介质 | |
US9459950B2 (en) | Leveraging user-to-tool interactions to automatically analyze defects in IT services delivery | |
CN110297656B (zh) | 基于配置模型评审代码的方法、装置及计算机设备 | |
CA3225621A1 (en) | Ai-augmented auditing platform including techniques for automated document processing | |
CN103678109A (zh) | 一种转储文件分析方法、装置和系统 | |
CN114202755A (zh) | 基于ocr和nlp技术的交易背景真实性审核方法和系统 | |
CN110472209B (zh) | 基于深度学习的表格生成方法、装置和计算机设备 | |
CN113888480A (zh) | 一种基于mes的质量追溯方法和系统 | |
CN111353611B (zh) | 一种核电站在役检查大修检验报告自动生成系统及方法 | |
KR102269286B1 (ko) | 어노테이션 자동 진단 시스템 | |
CN109324956B (zh) | 系统测试方法、设备及计算机可读存储介质 | |
EP3635504A1 (en) | Method and system for automatic discovery of topics and trends over time | |
CN108717519B (zh) | 一种文本分类方法及装置 | |
CN106201887B (zh) | 一种离线数据任务的验证方法及装置 | |
CN116452212B (zh) | 一种智能客服商品知识库信息管理方法及系统 | |
Silva et al. | Towards making safety-critical systems safer: learning from mistakes | |
CN117194603A (zh) | 一种文档的审核方法、装置、电子设备及存储介质 | |
CN101425141B (zh) | 图像识别装置和图像识别方法 | |
Seenivasan | Exploring popular ETL testing techniques | |
EP3941035A1 (en) | Digital evidence management method and digital evidence management system | |
CN116028498B (zh) | 质量检验表单存储方法、装置、电子设备和介质 | |
US20230177472A1 (en) | Method for detecting inaccuracies and gaps and for suggesting deterioration mechanisms and actions in inspection reports | |
US11816112B1 (en) | Systems and methods for automated process discovery | |
CN117172741A (zh) | 运维工单管控系统 | |
CN115527228A (zh) | 基于自反馈服务平台的分类方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |