CN116775741A - 一种工程竣工决算的审计方法及相关装置 - Google Patents
一种工程竣工决算的审计方法及相关装置 Download PDFInfo
- Publication number
- CN116775741A CN116775741A CN202310823359.8A CN202310823359A CN116775741A CN 116775741 A CN116775741 A CN 116775741A CN 202310823359 A CN202310823359 A CN 202310823359A CN 116775741 A CN116775741 A CN 116775741A
- Authority
- CN
- China
- Prior art keywords
- data
- audit
- engineering
- completion
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012550 audit Methods 0.000 claims abstract description 105
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000013136 deep learning model Methods 0.000 claims abstract description 43
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 238000004140 cleaning Methods 0.000 claims abstract description 10
- 238000005516 engineering process Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Stored Programmes (AREA)
Abstract
本申请公开了一种工程竣工决算的审计方法及相关装置,方法包括:对待审计的工程框架合同文件进行数据清洗和数据转化,并提取工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;通过训练数据集对深度学习模型进行训练,得到最终的审计模型;将待审计的工程竣工决算审计数据输入审计模型,得到预测结果,为审计决策提供依据,从而解决了现有技术无法对非结构化数据进行审计且只能对少数的异常情况进行分析的问题。
Description
技术领域
本申请涉及工程审计技术领域,尤其涉及一种工程竣工决算的审计方法及相关装置。
背景技术
传统的审计方法通常需要审计人员对大量工程竣工决算审计数据进行人工分析,耗时且容易出错。为了提高审计效率和准确性,近年来出现了许多基于计算机技术的审计辅助方法,如基于专家系统的审计决策支持、基于数据挖掘的工程签证异常检测等。然而,这些方法在处理大规模、复杂的工程审计数据时,仍然存在一定的局限性。
目前,市场上的审计计算机辅助方法主要存在以下问题:1)只能对整理好的结构化数据进行审计分析。但企业内部的数据通常种类繁多,结构化和非结构化数据并存。即便是结构化数据也大多没有经过整理。因此能让现有系统能分析的数据非常有限;2)只有有限的分析模型,只能对特定少数的异常情况进行分析。
发明内容
本申请提供了一种工程竣工决算的审计方法及相关装置,用于解决现有技术无法对非结构化数据进行审计且只能对少数的异常情况进行分析的问题。
有鉴于此,本申请第一方面提供了一种工程竣工决算的审计方法,所述方法包括:
对待审计的工程框架合同文件进行数据清洗和数据转化,并提取所述工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;
根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于所述架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;
通过所述训练数据集对所述深度学习模型进行训练,通过优化算法调整所述深度学习模型的参数,得到最终的审计模型;
将待审计的工程竣工决算审计数据输入所述审计模型,得到预测结果,从而为审计决策提供依据。
可选地,所述对待审计的工程框架合同文件进行数据清洗和数据转化,并提取所述工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,具体包括:
将对待审计的工程框架合同文件中相似的合同关键条款、清晰度低于预设阈值的电子版工程签证表格进行剔除,并对工程结算报告中物资型号缺失的物资清单进行填充,从而进行数据清洗;
通过工程造价软件将格式为PDF文件的工程结算报告原文件转换成EXCEL文件,从而进行数据转化;
通过NLP技术提取非结构化数据的关键信息,用于建立比对结构化数据,其中,所述非结构化数据,包括:工程签证表格和工程结算表格,所述关键信息,包括:工程量和金额。
可选地,所述根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于所述架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型
采用卷积神经网络和长短时记忆网络相结合的方法构建用于审计的深度学习模型,其中,卷积神经网络用于从工程竣工决算审计数据中提取局部特征,长短时记忆网络用于处理时间序列数据。
可选地,所述将待审计的工程竣工决算审计数据输入所述审计模型,得到预测结果,具体包括:
将待审计的工程竣工决算审计数据输入所述审计模型,从而通过OCR技术提取签证表格和结算报告中的关键信息,其中,所述关键信息包括:物资工程量和物资金额,并通过NLP技术进行信息识别分类,得到签证表格和结算报告中工程量比对预测结果。
本申请第二方面提供一种工程竣工决算的审计系统,所述系统包括:
处理模块,用于对待审计的工程框架合同文件进行数据清洗和数据转化,并提取所述工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;
构建模块,用于根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于所述架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;
训练模块,用于通过所述训练数据集对所述深度学习模型进行训练,通过优化算法调整所述深度学习模型的参数,得到最终的审计模型;
审计模块,用于将待审计的工程竣工决算审计数据输入所述审计模型,得到预测结果,从而为审计决策提供依据。
可选地,所述处理模块,具体用于:
将对待审计的工程框架合同文件中相似的合同关键条款、清晰度低于预设阈值的电子版工程签证表格进行剔除,并对工程结算报告中物资型号缺失的物资清单进行填充,从而进行数据清洗;
通过工程造价软件将格式为PDF文件的工程结算报告原文件转换成EXCEL文件,从而进行数据转化;
通过NLP技术提取非结构化数据的关键信息,用于建立比对结构化数据,其中,所述非结构化数据,包括:工程签证表格和工程结算表格,所述关键信息,包括:工程量和金额。
可选地,所述构建模块,具体用于:
采用卷积神经网络和长短时记忆网络相结合的方法构建用于审计的深度学习模型,其中,卷积神经网络用于从工程竣工决算审计数据中提取局部特征,长短时记忆网络用于处理时间序列数据。
可选地,所述审计模块,具体用于:
将待审计的工程竣工决算审计数据输入所述审计模型,从而通过OCR技术提取签证表格和结算报告中的关键信息,其中,所述关键信息包括:物资工程量和物资金额,并通过NLP技术进行信息识别分类,得到签证表格和结算报告中工程量比对预测结果。
本申请第三方面提供一种工程竣工决算的审计设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的工程竣工决算的审计方法的步骤。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的工程竣工决算的审计方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种工程竣工决算的审计方法,包括:对待审计的工程框架合同文件进行数据清洗和数据转化,并提取工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;通过训练数据集对深度学习模型进行训练,通过优化算法调整深度学习模型的参数,得到最终的审计模型;将待审计的工程竣工决算审计数据输入审计模型,得到预测结果,从而为审计决策提供依据。
本实施例的工程竣工决算的审计方法,首先对工程竣工决算中的工程框架合同文件进行数据预处理建立比对结构化数据,得到用于训练模型的训练数据集,接着利用处理过的数据训练模型用于工程竣工决算的审计,从而能够自动从大量的工程竣工决算审计数据、运营数据和文本图像等非结构化数据中提取有用的特征和信息。相比现有技术,提高了审计数据类型和异常情况分析的覆盖范围,从而解决了现有技术无法对非结构化数据进行审计且只能对少数的异常情况进行分析的问题。
附图说明
图1为本申请实施例中提供的一种工程竣工决算的审计方法的流程示意图;
图2为本申请实施例中提供的一种工程竣工决算的审计系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,本申请实施例中提供的一种工程竣工决算的审计方法,包括:
步骤101、对待审计的工程框架合同文件进行数据清洗和数据转化,并提取工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;
需要说明的是,数据清洗的内容包括去除重复数据,去除异常数据,填充缺失的数据。工程竣工决算审计数据通常种类繁多,结构化和非结构化数据质量参考不齐。工程框架合同文件有很多合同关键条款基本相同,去除掉内容相差不大的文件。工程签证表格电子版拍摄不清晰的也把它剔除。工程结算报告物资清单里物资型号缺失的填充缺失的数据。
数据转换是指将原始数据转换为更适合于机器学习算法的形式。工程结算报告原文件是PDF格式,用工程造价软件把PDF文件转成EXCEL文件。将原始数据格式转化为模型容易处理的格式之后,能提高模型的训练效率。
进一步地;本领域技术人员还可以对数据进行规范化处理,工程竣工决算审计数据都是千奇百怪的,模型有的时候学起来会比较吃力。比如样本的某些表格的格式差别特别大,或者是某个样本不同特征的取值范围区别很大,那使用某个模型去表示这些样本的时候,就很容易受到这些过大或过小的数据影响。各单位在工程竣工决算中用的工程签证表格的格式各不相同。通过梳理把各表格中相同的关键字段如名称,数量等字段标注出来。规范化数据能提高模型的准确性、可靠性和可解释性。
同时,将工程签证表格和工程结算表格等非结构化数据,通过NLP技术提取关键信息如工程量和金额等用于建立比对结构化数据,为模型构建训练数据集和测试数据集。
步骤102、根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;
需要说明的是,构建深度学习模型的第一步,也是最重要的一步就是成功定义网络和架构。根据所执行任务的类型,一般倾向于使用特定类型的体系结构。本实施例考虑工程竣工决算审计中最采用卷积神经网络和长短时记忆网络相结合的方法构建用于审计的深度学习模型,其中,卷积神经网络用于从工程竣工决算审计数据中提取局部特征,长短时记忆网络用于处理时间序列数据。繁琐和耗时的工作就是工程造价文件里工程量和金额的审计。要在NLP)和长短期记忆(LSTM)更为可取。因此采用卷积神经网络和长短时记忆网络相结合的方法构建用于审计的深度学习模型,其中,卷积神经网络用于从工程竣工决算审计数据中提取局部特征,长短时记忆网络用于处理时间序列数据。
框架构建完后,然后对模型编译、评估和预测,其中,本实施例编译步骤TensorFlow深度学习框架中的一行代码model.compile()函数进行编译;并通过测试集对构建的构建模型进行评估和预测,具体的,根据业务需求挑选合适的测试样本,本实施例采用测试集中如工程签证表格,工程结算报告等进行模型测试。把测试样本提交给测试人员进行测试,测试完成后提交测试结果;从而构建用于审计的深度学习模型。
步骤103、通过训练数据集对深度学习模型进行训练,通过优化算法调整深度学习模型的参数,得到最终的审计模型;
需要说明的是,训练AI模型之前,步骤101已准备大量工程竣工决算审计方面的数据集,可以理解的是通过步骤101经过数据预处理得到的训练集对模型进行训练,并通过优化算法(如Adam优化器)不断调整模型参数,使模型在训练数据集上的预测结果与实际结果之间的误差最小。其中,模型训练主要工作包括有模型选择、模型初始化、模型评估、模型保存与部署,在此不再过多赘述。
步骤104、将待审计的工程竣工决算审计数据输入审计模型,得到预测结果,从而为审计决策提供依据。
需要说明的是,最后将待审计的工程竣工决算审计数据和审计数据输入训练好的模型中,得到预测结果,为审计决策提供依据。
本实施例的工程竣工决算的审计方法,首先对工程竣工决算中的工程框架合同文件进行数据预处理建立比对结构化数据,得到用于训练模型的训练数据集,接着利用处理过的数据训练模型用于工程竣工决算的审计,从而能够自动从大量的工程竣工决算审计数据、运营数据和文本图像等非结构化数据中提取有用的特征和信息。相比现有技术,提高了审计数据类型和异常情况分析的覆盖范围,从而解决了现有技术无法对非结构化数据进行审计且只能对少数的异常情况进行分析的问题。
以上为本申请实施例中提供的一种工程竣工决算的审计方法,以下为本申请实施例中提供的一种工程竣工决算的审计系统。
请参阅图2,本申请实施例中提供的一种工程竣工决算的审计系统,包括:
处理模块201,用于对待审计的工程框架合同文件进行数据清洗和数据转化,并提取工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;
构建模块202,用于根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;
训练模块203,用于通过训练数据集对深度学习模型进行训练,通过优化算法调整深度学习模型的参数,得到最终的审计模型;
审计模块204,用于将待审计的工程竣工决算审计数据输入审计模型,得到预测结果,从而为审计决策提供依据。
进一步地,本申请实施例中还提供了一种工程竣工决算的审计设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述方法实施例所述的工程竣工决算的审计方法的步骤。
进一步地,本申请实施例中还提供了计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述方法实施例所述的工程竣工决算的审计方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种工程竣工决算的审计方法,其特征在于,包括:
对待审计的工程框架合同文件进行数据清洗和数据转化,并提取所述工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;
根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于所述架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;
通过所述训练数据集对所述深度学习模型进行训练,通过优化算法调整所述深度学习模型的参数,得到最终的审计模型;
将待审计的工程竣工决算审计数据输入所述审计模型,得到预测结果,从而为审计决策提供依据。
2.根据权利要求1所述的工程竣工决算的审计方法,其特征在于,所述对待审计的工程框架合同文件进行数据清洗和数据转化,并提取所述工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,具体包括:
将对待审计的工程框架合同文件中相似的合同关键条款、清晰度低于预设阈值的电子版工程签证表格进行剔除,并对工程结算报告中物资型号缺失的物资清单进行填充,从而进行数据清洗;
通过工程造价软件将格式为PDF文件的工程结算报告原文件转换成EXCEL文件,从而进行数据转化;
通过NLP技术提取非结构化数据的关键信息,用于建立比对结构化数据,其中,所述非结构化数据,包括:工程签证表格和工程结算表格,所述关键信息,包括:工程量和金额。
3.根据权利要求2所述的工程竣工决算的审计方法,其特征在于,所述根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于所述架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型
采用卷积神经网络和长短时记忆网络相结合的方法构建用于审计的深度学习模型,其中,卷积神经网络用于从工程竣工决算审计数据中提取局部特征,长短时记忆网络用于处理时间序列数据。
4.根据权利要求3所述的工程竣工决算的审计方法,其特征在于,所述将待审计的工程竣工决算审计数据输入所述审计模型,得到预测结果,具体包括:
将待审计的工程竣工决算审计数据输入所述审计模型,从而通过OCR技术提取签证表格和结算报告中的关键信息,其中,所述关键信息包括:物资工程量和物资金额,并通过NLP技术进行信息识别分类,得到签证表格和结算报告中工程量比对预测结果。
5.一种工程竣工决算的审计系统,其特征在于,包括:
处理模块,用于对待审计的工程框架合同文件进行数据清洗和数据转化,并提取所述工程框架合同文件中的非结构化数据的关键信息从而建立比对结构化数据,得到用于训练模型的训练数据集和测试集;
构建模块,用于根据工程竣工决算审计中需要处理的数据类型选取构建深度学习模型的架构,基于所述架构依次进行模型编译、评估和预测,从而构建用于审计的深度学习模型;
训练模块,用于通过所述训练数据集对所述深度学习模型进行训练,通过优化算法调整所述深度学习模型的参数,得到最终的审计模型;
审计模块,用于将待审计的工程竣工决算审计数据输入所述审计模型,得到预测结果,从而为审计决策提供依据。
6.根据权利要求5所述的工程竣工决算的审计系统,其特征在于,所述处理模块,具体用于:
将对待审计的工程框架合同文件中相似的合同关键条款、清晰度低于预设阈值的电子版工程签证表格进行剔除,并对工程结算报告中物资型号缺失的物资清单进行填充,从而进行数据清洗;
通过工程造价软件将格式为PDF文件的工程结算报告原文件转换成EXCEL文件,从而进行数据转化;
通过NLP技术提取非结构化数据的关键信息,用于建立比对结构化数据,其中,所述非结构化数据,包括:工程签证表格和工程结算表格,所述关键信息,包括:工程量和金额。
7.根据权利要求6所述的工程竣工决算的审计系统,其特征在于,所述构建模块,具体用于:
采用卷积神经网络和长短时记忆网络相结合的方法构建用于审计的深度学习模型,其中,卷积神经网络用于从工程竣工决算审计数据中提取局部特征,长短时记忆网络用于处理时间序列数据。
8.根据权利要求7所述的工程竣工决算的审计系统,其特征在于,所述审计模块,具体用于:
将待审计的工程竣工决算审计数据输入所述审计模型,从而通过OCR技术提取签证表格和结算报告中的关键信息,其中,所述关键信息包括:物资工程量和物资金额,并通过NLP技术进行信息识别分类,得到签证表格和结算报告中工程量比对预测结果。
9.一种工程竣工决算的审计算设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的工程竣工决算的审计方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的工程竣工决算的审计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310823359.8A CN116775741A (zh) | 2023-07-05 | 2023-07-05 | 一种工程竣工决算的审计方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310823359.8A CN116775741A (zh) | 2023-07-05 | 2023-07-05 | 一种工程竣工决算的审计方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116775741A true CN116775741A (zh) | 2023-09-19 |
Family
ID=87987827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310823359.8A Pending CN116775741A (zh) | 2023-07-05 | 2023-07-05 | 一种工程竣工决算的审计方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116775741A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726239A (zh) * | 2024-02-18 | 2024-03-19 | 温州市建设工程咨询有限公司 | 工程质量验收实测实量方法及系统 |
-
2023
- 2023-07-05 CN CN202310823359.8A patent/CN116775741A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726239A (zh) * | 2024-02-18 | 2024-03-19 | 温州市建设工程咨询有限公司 | 工程质量验收实测实量方法及系统 |
CN117726239B (zh) * | 2024-02-18 | 2024-04-30 | 温州市建设工程咨询有限公司 | 工程质量验收实测实量方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102142205B1 (ko) | 설명 가능한 인공지능 모델링 및 시뮬레이션 시스템 및 방법 | |
CN105160038B (zh) | 一种基于审计知识库的数据分析方法及系统 | |
CN109753863A (zh) | 信号分析系统和特征提取并对其解译的方法 | |
CN101620691A (zh) | 电信业自动化数据挖掘平台 | |
Rohanizadeh et al. | A proposed data mining methodology and its application to industrial procedures | |
CN102930495B (zh) | 一种基于隐写测评的隐写分析方法 | |
CN111177655B (zh) | 一种数据处理方法、装置及电子设备 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN116775741A (zh) | 一种工程竣工决算的审计方法及相关装置 | |
CN112182056A (zh) | 一种数据检测方法、装置、设备及存储介质 | |
CN110134464A (zh) | 信息处理方法和装置 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
CN109740890A (zh) | 一种质量影响因素相关性分析方法 | |
CN115730947A (zh) | 银行客户流失预测方法及装置 | |
CN117973846A (zh) | 基于产业链的企业风险预测方法和系统 | |
CN111666748B (zh) | 一种自动化分类器的构造方法以及识别决策的方法 | |
CN117519656A (zh) | 一种基于智能制造的软件开发系统 | |
CN117371943A (zh) | 一种基于数据驱动的ai中台模型管理方法及ai中台系统 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN113792189A (zh) | 群智软件开发贡献效率评估方法、装置、设备及介质 | |
AU2020201689A1 (en) | Cognitive forecasting | |
Faqih et al. | Empirical Analysis of CI/CD Tools Usage in GitHub Actions Workflows | |
CN117150389B (zh) | 模型训练方法、运营商号卡激活预测方法及其设备 | |
CN118569741B (zh) | 一种化工自动化产品质量评估系统 | |
King | Customer churn–Irish electricty/gas market |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |