CN113657854A - 一种面向不完整数据的人机协同智能审计分析方法 - Google Patents
一种面向不完整数据的人机协同智能审计分析方法 Download PDFInfo
- Publication number
- CN113657854A CN113657854A CN202110889826.8A CN202110889826A CN113657854A CN 113657854 A CN113657854 A CN 113657854A CN 202110889826 A CN202110889826 A CN 202110889826A CN 113657854 A CN113657854 A CN 113657854A
- Authority
- CN
- China
- Prior art keywords
- audit
- data
- rule
- suspicious
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012550 audit Methods 0.000 title claims abstract description 222
- 238000004458 analytical method Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims abstract description 21
- 238000012790 confirmation Methods 0.000 claims abstract description 13
- 230000010354 integration Effects 0.000 claims description 28
- 238000002360 preparation method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000001502 supplementing effect Effects 0.000 abstract description 3
- 238000013479 data entry Methods 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种面向不完整数据的人机协同智能审计分析方法,属于数字化审计流程中的核心方法。它主要包括八个步骤,由审计人员和计算机分别完成,依次为构建审计知识图谱、数据集成和准备、确定审计主题、生成审计模型、生成疑点清单并计算合规概率、疑点确认和人工查证、补录缺失数据或查证结论、生成审计底稿。本发明突破了现有的数字化审计技术中不能面向不完整数据进行审计的局限性,可通过当前已有数据计算审核点的合规概率,帮助审计人员确定疑点重要性。审计人员在完成数据补录后,审计模型可进行新一轮的模糊匹配并输出结果,构成渐进迭代式的审核点研判过程,对审计人员快速识别和定位问题点提供了有力参考,辅助审计人员进行合规性检查。
Description
技术领域
本发明属于数字化审计领域,尤其涉及一种面向不完整数据的人机协同智能审计分析方法。
背景技术
内部审计是审计监督体系的重要组成部分,也是推动实现审计全覆盖的重要力量。智能审计分析平台依托单位内部审计部门在数字化转型背景下,以推进审计全覆盖为出发点,以实现内部审计价值增值为目标,在转变理念、搭建平台、改革机制、培养人才、改进方法等多方面探索数字化转型的实践经验(参考文献:张根银,钱立平.五措并举探索内部审计数字化转型[J].中国内部审计,2021(06):45-47.)。传统的审计流程主要包括拟定审计计划、数据准备、实施审计程序、汇总审计过程记录的问题、人工撰写审计工作底稿或审计报告。然而传统的数字化审计无法实现项目全流程的覆盖,不能对不完整数据进行有效的审计,当业务数据接入不彻底时,则会导致部分审计程序无法执行,最终影响项目审计的质量。同时,许多审计工作仍需要在现场才能实施,审计效率和成本较低,无法满足新审计要求的审计监督体系。
发明内容
本发明的目的在于针对现有技术的不足,提供一种面向不完整数据的人机协同智能审计分析方法。本发明能为内审工作提高审计工作效率,拓展审计广度与深度,形成通用的数字化审计工具和审计工作模式。
本发明的目的通过以下技术方案来实现的:一种面向不完整数据的人机协同智能审计分析方法,包括如下步骤:
步骤1:构建审计知识图谱;
步骤2:数据集成和准备:通过数据集成模块将业务数据进行接入与整合,并统一存储至中间库中,方便审计分析时进行调用;
步骤3:确定审计主题,审计主题包括项目类型、审计类型以及项目立项时间;
步骤4:依据确定的审计主题,利用审计知识图谱生成审计模型;
步骤5:计算合规概率并生成疑点清单:业务数据输入到审计模型中,审计模型对业务数据进行合规性校验得到问题数据和缺失数据字段,接着审计模型调用规则模糊匹配算法计算审核点的合规概率,合规概率未达到设定阈值的记作疑点,最后所有疑点组成疑点清单;
步骤6:疑点确认和人工查证;审计人员对生成的疑点清单中的每个疑点进行人工确认,然后对疑点进行标记;若证实为疑点则标记为有问题,若证实不是疑点则标记为无问题;若不能直接判断是否为疑点,则需要对该疑点进行人工查证获得查证结论;其中,不能直接判断的疑点包括由于缺失数据造成的疑点;
步骤7:补录数据和查证结论:人工补录不可接入数据、步骤5发现的缺失数据和步骤6获得的查证结论,审计模型根据补录的新数据针对未标记的疑点执行步骤5~6进行新一轮的规则模糊匹配和疑点确认,直到标记疑点清单的所有疑点;
步骤8:根据疑点清单的标记结果生成审计底稿。
进一步地,所述步骤5中,令r表示审核点涉及的规则,e为原子表达式,则p(r)表示r的合规概率,1-p(r)表示r的违规概率,p(e)表示e的合规概率;规则模糊匹配算法的合规概率计算规则如下:
(1)当r=e时,则存在以下三种情况:
①当e中的需求字段可直接接入或可计算且有明确值时,则有p(r)=p(e)=0;
②当e中的需求字段可识别且有带概率的值v时,则有p(r)=p(e)=v;
③当e中的需求字段缺失或计算过程中有缺失数据,则有p(r)=p(e)=0.3;
(2)当r=r1∧r2,即同时满足规则r1和规则r2时,则有p(r)=p(r1)*p(r2);
(3)当r=r1∨r2,即满足规则r1或者规则r2时,则有p(r)=1-(1-p(r1))*(1-p(r2));
(4)当r=if r1 then r2,即在满足规则r1的前提下再判断是否满足规则r2时,若同时满足规则r2,则有p(r)=1–r1*(1-p(r2));
(5)当r=r1∧r2∧r3,r3=r1.time<r2.time,其中r1.time表示规则r1发生的时间,r2.time表示规则r2发生的时间,规则r3表示规则r1和规则r2需要满足的时序关系;同时满足规则r1、r2、r3时p(r)的概率存在以下两种情况:
①当满足r1.time<r2.time时,则有p(r3)=1,因此p(r)=p(r1)*p(r2)*p(r3)=p(r1)*p(r2);
②当不满足r1.time<r2.time时,则有p(r3)=0,因此p(r)=p(r1)*p(r2)*p(r3)=0。
进一步地,所述步骤1中,通过调研单位或企业的最新内部制度、相关外部政策以及审计人员的经验,构建审计知识图谱表示模型。
进一步地,所述步骤2中,数据集成模块用于实现数据的标准化集成,通过自定义模型结构、字段的标准数据接口,完成业务数据的存储、维护、查询,满足现有业务数据的集成。
进一步地,经过数据集成模块集成后的业务数据由中间库和核心库负责存储,其中业务系统的数据存储在中间库中,而人工补录的缺失数据和查证结论,以及不可接入的数据都存储在核心库中。
进一步地,核心库是支撑审计模型的数据库,主要存储的是审计实施与分析的过程数据;由于中间库的业务数据是实时更新的,审计分析时,通过数据集成模块将所需业务数据从中间库推送至核心库,保证审计分析结果与数据版本的一致性和可追溯性。
进一步地,所述步骤4中,审计知识图谱通过确定的审计主题匹配相关的审核点实体,这些审核点实体之间的关系所组成的集合,构成审计模型。
进一步地,人工补录的数据会存储至核心库的临时数据表中,并且补录的数据仅对当前审计主题有效。
进一步地,所述步骤6中,审计人员根据问题数据和合规概率对疑点进行人工确认。
与现有的审计方法相比,本发明的技术核心在于可以面向不完整数据的项目进行审计。在审计过程中,如果存在数据缺失的情况,模型会引导审计人员对这些缺失数据进行人工补录,若存在涉密数据导致无法补录时,也可以直接补录查证结论,从而实现项目审计的全流程覆盖。其主要创新点在于以下三个方面:
(1)本发明不仅可以面向不完整数据的项目进行审计,而且在审计分析过程中,审计模型可以输出缺失数据字段,引导审计人员进行数据补录,便于模型获得完整的数据,从而提升审计的效果;
(2)本发明采用了规则模糊匹配算法,不仅可以自动生成审计疑点清单,还能得到审核点的合规概率、问题数据以及缺失数据字段等信息,同时可以明确指出审计人员应调取的不可接入数据,对审计人员快速识别和定位问题点提供有力参考,辅助审计人员进行合规性检查,形成完整的人机协同过程;
(3)审计人员在完成缺失数据或者结论的补录后,审计模型可以根据补录后的新数据进行新一轮的模糊匹配,并输出结果,形成渐进迭代式的线索研判过程。
附图说明
下面结合附图和实施例子对本发明进一步说明:
图1是本发明的人机协同的分析过程图;
图2是本发明的智能审计实施流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明,以下结合附图和具体实例进一步详细描述本发明,但不构成对本发明的限制。
本发明基于审计知识图谱的表示与构建技术,以及智能审计分析技术,利用业务系统数据和审计先验知识,设计了一种面向不完整数据的人机协同智能审计分析方法。本发明通过审计人员确定的项目审计主题,利用审计知识图谱,针对确定的审计主题生成审计模型,用于规则模糊匹配。再将业务数据输入到审计模型中,并进行规则模糊匹配。然后基于规则模糊匹配算法计算合规概率,并抛出疑点清单、问题数据以及缺失数据字段。最后审计人员对生成的审计疑点清单进行人工确认和查证。若由于数据缺失而造成的疑点,则需要由审计人员补录缺失数据或者查证结论,并针对该疑点重新执行审计模型。如图1所示,本发明包括以下步骤:
步骤1:构建审计知识图谱。通过调研单位或企业的最新内部制度,相关外部政策,以及审计人员的经验,基于这些规范数据构建审计知识图谱表示模型。
其中,审计知识图谱的构建离不开审计规范数据,这些规范数据需要依靠前期调研得到,其中审计人员经验的获取需咨询一些经验丰富的审计人员。审计知识图谱将面向内部审计应用需要,利用审计知识图谱表示模型进行审计知识抽取、融合与推理,为智能审计分析提供规范基础。通过梳理规范数据分类、层次关系、属性间的关系,利用三元组技术构建审计知识图谱,解决不同版本规范的时效性、不同来源规范的可靠性及审计业务流程知识的表示问题。
步骤2:数据集成和准备。通过数据集成模块将各业务系统的数据进行接入与整合,并统一存储至中间库中,方便审计分析时进行调用。在审计分析时,需要先完成待审计项目的数据准备工作,通过该数据集成模块将所需业务数据从中间库推送至核心库。核心库是支撑审计模型的数据库,主要存储的是审计实施与分析的过程数据。由于中间库的数据是随着各业务系统的数据实时更新的,因此将数据推送至核心库的目的是为了保证审计分析结果与数据版本的一致性和可追溯性。
其中,数据集成模块可实现数据的标准化集成,通过自定义模型结构、字段的标准数据接口,可完成各类业务数据的存储、维护、查询等操作,满足单位现有的项目数据、财务数据、采购数据等业务数据的集成,并且可根据设计好的需求数据模板自动组装数据。经过数据集成模块集成后的业务数据由中间库和核心库负责存储。其中业务系统的数据存储在中间库中,而人工补录的缺失数据和查证结论,以及不可接入的数据都存储在核心库中。业务数据包含了业务系统里的数据和其他非业务系统的数据。
步骤3:确定审计主题。审计主题包括项目类型、审计类型以及项目立项时间,由审计人员录入。对于每个审计主题,其实都映射着一个审计知识图谱的子图,而每个子图都代表着一个审计模型。
其中,不同审计主题的项目背后所涉及到的法律法规、规章制度、以及审计经验都不同,而常见的审计类型主要包括:中期审计、结题审计、终止审计等。这三个属性都是影响项目审计范围的重要指标。因此,审计人员通过它们完全可以确定每个项目的审计主题。
步骤4:生成审计模型。依据审计人员确定的审计主题,利用审计知识图谱生成审计模型,用于规则模糊匹配。
其中,对步骤3中确定的审计主题,依靠知识图谱强大的知识检索功能可以通过确定的审计主题匹配与该项目相关的规章制度、法律法规以及审计经验等审核点实体,以此来确定项目的审计范围。这些审核点实体和实体间的关系所组成的集合构成了一个知识图谱子图,即审计模型,它与每个审计主题都是一一对应的。
步骤5:计算合规概率并生成疑点清单。基于审计模型和规则模糊匹配算法可以自动对每个审核点进行计算,生成疑点清单、合规概率、问题数据以及缺失数据字段等信息。
其中,在完成审计模型的生成后,业务数据将按审计模型的数据需求输入到审计模型中,对业务数据进行合规性校验得到问题数据和缺失数据字段,接着审计模型调用规则模糊匹配算法计算审核点的合规概率,合规概率未达到设定阈值的记作疑点,最后所有疑点组成疑点清单。规则模糊匹配算法为人工查证提供数据依据,渐进交互式地解决数据不完全导致的模糊匹配问题。
规则模糊匹配算法的合规概率计算过程具体描述如下:
假设r表示为审核点涉及的规则,e为原子表达式,则p(r)表示r的合规概率,1-p(r)表示为r的违规概率,p(e)表示为e的合规概率。定义合规概率计算规则主要包括五类,具体描述如下:
(1)当r=e时,则存在以下三种情况:
①当e中的需求字段可直接接入或可计算且有明确值时,则有p(r)=p(e)=0。
②当e中的需求字段可识别且有带概率的值v时,则有p(r)=p(e)=v。
③当e中的需求字段缺失或计算过程中有缺失数据,则有p(r)=p(e)=0.3。
(2)假设r=r1∧r2,当同时满足规则r1和规则r2时,则有p(r)=p(r1)*p(r2)。
(3)假设r=r1∨r2,当满足规则r1或者规则r2时,则有p(r)=1-(1-p(r1))*(1-p(r2))。
(4)假设r=if r1 then r2,其中规则r1为前置条件,在满足规则r1的前提下再判断是否满足规则r2时,若同时满足规则r2,则有p(r)=1–r1*(1-p(r2))。
(5)假设r=r1∧r2∧r3,r3=r1.time<r2.time,其中r1.time表示规则r1发生的时间,r2.time表示规则r2发生的时间,规则r3表示规则r1和规则r2需要满足的时序关系(r1比r2早发生)。因此p(r)的概率存在以下两种情况:
①当满足r1.time<r2.time时,则有p(r3)=1,因此p(r)=p(r1)*p(r2)*p(r3)=p(r1)*p(r2)。
②当不满足r1.time<r2.time时,则有p(r3)=0,因此p(r)=p(r1)*p(r2)*p(r3)=0。
步骤6:疑点确认和人工查证。审计人员对生成的每一条疑点记录进行人工确认和查证,然后对疑点进行标记,若证实为疑点则标记为有问题,反之则标记为无问题。对无法直接判断的疑点进行人工查证获得查证结论。其中,无法直接判断的疑点包括由于数据缺失造成的疑点。
其中,审计人员对疑点清单进行筛选,若审计人员凭借审计经验、问题数据以及合规概率可以确定该疑点有无问题,则可直接标记为“有问题”或“无问题”。若不能直接判断是否为疑点时,则需要对该疑点进行人工查证,同时结合收集的缺失数据或不可接入数据进行关联分析,将数据本身和查证结论输入给审计模型,以实现迭代式的审计效果。
步骤7:补录数据或查证结论。若由于数据缺失而造成的疑点,则需要由审计人员补录不可接入数据、缺失数据和查证结论,并针对该疑点重新执行审计模型。
其中,人工补录的数据(不可接入数据、缺失数据和查证结论)会存储至核心库的临时数据表中,临时数据表是指通过人工补录且具有一定时效性的业务数据,补录的数据仅对当前审计主题有效,在审计人员完成数据的补录后,审计模型可以根据补录后的新数据执行步骤5~6进行新一轮的规则模糊匹配和疑点确认,并输出新的审计结果,形成渐进迭代式的线索研判过程,直到标记疑点清单的所有疑点。
步骤8:生成审计底稿。以人机协同的方式辅助审计人员进行审查,并辅助生成工作底稿,支持后续审计流程的开展。
其中,在完成步骤6和步骤7后,计算机可以根据已确认的疑点按照审计人员提供的底稿模板自动生成审计底稿文档,将项目名称、疑点清单、问题数据以及违规条例等信息更新至审计底稿中。
针对上述的8个步骤,实现人机协同机制,审计人员在其中主要负责疑点优先级的选择、缺失数据的补录、查证结论的输入等。而计算机则需要根据审计模型生成的疑点清单、合规概率、问题数据等进行展示,同时还需要对审计人员补录的缺失数据或结论进行渐进迭代式地分析,以得到更准确的审计分析结果。通过明确计算机与审计人员的原语类型,规范人机协同过程,实现人机标准化的自然交互,使得双方可准确而自然地传达及获取信息,具体的审计实施过程如图2所示,具体步骤概括如下:
步骤1:构建审计知识图谱。通过调研单位或企业的最新内部制度,相关外部政策,以及审计人员的经验,基于这些规范数据构建审计知识图谱表示模型。以“XX单位”为例,基于最新内部制度共梳理了涉及18个内部规范文档,其中涉及科研项目审计相关的条款共78个,除内部规章制度外,还包括2个上位法规范和5个基于审计经验的规范,最终形成规范-审核点总结文件,共133个审核点。审核点的信息主要包括:项目类型、审核点类型、一级审核点名称、二级审核点编号、二级审核点名称、二级审核点内容、字段编号、条款编号。接着将梳理的审核点信息通过neo4j图数据库去生成审计知识图谱。
步骤2:数据集成和准备。通过数据集成模块将各业务系统的数据进行接入与整合,并统一存储至中间库中,方便审计分析时进行调用。在审计分析时,需要完成待审计项目的数据准备工作,通过该数据集成模块将所需数据从中间库推送至核心库。由于数据集成的方式有很多,因此本发明并不限定数据集成的方式,只要符合数据集成的原则即可。以行为数据统一访问中间件为例,该中间件是按需个性化开发的,最后可以统一标准集成接口,并且按数据需求模板自动导入或导出数据。通过该中间件,将“XX单位”的科研管理系统、财务系统、采购系统、资产管理系统、档案管理系统等业务数据进行统一的数据集成处理并建立中间库以结构化数据的形式进行存储。
步骤3:确定审计主题。审计人员根据项目的类型和审计类型,给出对应的审计主题,对于每个审计主题,其实都映射着一个审计知识图谱的子图,而每个子图都代表着一个审计模型。本实施例中,项目属性为“自设项目”,项目类型为“科研攻关-重大项目”,审计类型设置为“结题审计”,因此通过项目属性、项目类型以及审计类型这三个信息就可以确定为一个审计主题。在审计主题确定后,即可启动审计任务开始对该项目进行审计。
步骤4:生成审计模型。依据审计人员确定的审计主题,利用审计知识图谱生成审计模型,用于规则模糊匹配。以步骤3确定的审计主题:“自设项目-科研攻关-重大项目-结题审计”为例,依靠知识图谱强大的知识检索功能可以通过该审计主题匹配与该项目相关的规章制度、法律法规以及审计经验等审核点实体,以此来确定项目的审计范围。此时,审计模型会将该主题信息作为参数传入到审计知识图谱中去检索与该主题对应的子图谱。由于子图谱是由这些审核点实体和实体间的关系所组成的集合,因此子图谱即为审计模型。通过该审计主题示例可以检索到与该项目有关的审核点共74个,例如:重大项目验收缺少结题材料、成果初审缺少项目成果初审报告、科研项目合同未经科研发展部知识产权条款审查的就对外签订等审核点。
步骤5:生成疑点清单并计算合规概率。基于审计模型和规则模糊匹配算法可以自动对每个审核点进行计算,生成疑点清单、合规概率、问题数据以及缺失数据字段等信息。审计模型在启动后会遍历每个审核点实体,并执行每个审核点方法逻辑,在进行审核点数据合规校验时,会调用规则模糊匹配算法生成疑点清单和合规概率,同时会将执行结果以及该审核点所有数据为空的字段记录保存。审计模型经过对该项目的审计,共审计了74个审核点,其中合规审核点57个,生成疑点17条。
步骤6:疑点确认和人工查证。审计人员对生成的每一条疑点记录进行人工确认和查证,然后根据查证后的结果对疑点进行标记,若证实为疑点则标记为有问题,反之则标记为无问题。基于步骤5生成的疑点清单,在经过确认和人工查证后,最终标记为有问题的疑点9条,无问题的疑点5条。
步骤7:补录缺失数据或查证结论。若由于数据缺失而造成的疑点,则需要由审计人员人工补录缺失数据或者查证结论,并针对该疑点重新执行审计模型。上述步骤5中,部分疑点是由于数据缺失造成的,例如疑点“附件无项目预算申报书”、“验收结题缺少项目验收报告”、“重大项目验收结题缺少项目总结和评价”等都是因为没有匹配到相关附件材料导致被抛出疑点。
步骤8:生成审计底稿。以人机协同的方式辅助审计人员进行审查,并辅助生成工作底稿,支持后续审计流程的开展。在完成上述所有步骤后,针对确定为有问题的疑点按照审计人员提供的底稿模板可自动生成审计底稿文档,将项目名称、疑点清单、问题数据以及违规条例等信息更新至审计底稿中。
本发明不仅能实现项目审计的全流程覆盖,弥补对不完整数据审计的技术缺陷,而且能将不同业务系统的数据进行合理的整合,同时建立一套通用的审计模型体系,可以适用于不同的审计业务场景,满足新审计要求的审计监督体系,形成一套适用于不同业务领域的智能数字化审计工具,立足于智能持续监督与智能分析决策,进行全方位、多视角、持续化的审计监督,推动审计工作向智能化、网络化、常态化和风险预警方向转型,形成覆盖全面、流程清晰、智能高效的数字化持续审计工作模式。
上述实施例仅为例示性说明本发明的原理及其功效,而非用于限制本发明的范围。任何熟于此技术的本领域技术人员均可在不违背本发明的技术原理及精神下,对实施例作修改与变化。本发明的保护范围应以权利要求书所述为准。
Claims (9)
1.一种面向不完整数据的人机协同智能审计分析方法,其特征在于,包括如下步骤:
步骤1:构建审计知识图谱。
步骤2:数据集成和准备:通过数据集成模块将业务数据进行接入与整合,并统一存储至中间库中,方便审计分析时进行调用。
步骤3:确定审计主题,审计主题包括项目类型、审计类型以及项目立项时间。
步骤4:依据确定的审计主题,利用审计知识图谱生成审计模型。
步骤5:计算合规概率并生成疑点清单:业务数据输入到审计模型中,审计模型对业务数据进行合规性校验得到问题数据和缺失数据字段,接着审计模型调用规则模糊匹配算法计算审核点的合规概率,合规概率未达到设定阈值的记作疑点,最后所有疑点组成疑点清单。
步骤6:疑点确认和人工查证;审计人员对生成的疑点清单中的每个疑点进行人工确认,然后对疑点进行标记;若证实为疑点则标记为有问题,若证实不是疑点则标记为无问题;若不能直接判断是否为疑点,则需要对该疑点进行人工查证获得查证结论;其中,不能直接判断的疑点包括由于缺失数据造成的疑点。
步骤7:补录数据和查证结论:人工补录不可接入数据、步骤5发现的缺失数据和步骤6获得的查证结论等,审计模型根据补录的新数据针对未标记的疑点执行步骤5~6进行新一轮的规则模糊匹配和疑点确认,直到标记疑点清单的所有疑点。
步骤8:根据疑点清单的标记结果生成审计底稿。
2.如权利要求1所述面向不完整数据的人机协同智能审计分析方法,其特征在于,所述步骤5中,令r表示审核点涉及的规则,e为原子表达式,则p(r)表示r的合规概率,1-p(r)表示r的违规概率,p(e)表示e的合规概率;规则模糊匹配算法的合规概率计算规则如下:
(1)当r=e时,则存在以下三种情况:
①当e中的需求字段可直接接入或可计算且有明确值时,则有p(r)=p(e)=0;
②当e中的需求字段可识别且有带概率的值v时,则有p(r)=p(e)=v;
③当e中的需求字段缺失或计算过程中有缺失数据,则有p(r)=p(e)=0.3;
(2)当r=r1∧r2,即同时满足规则r1和规则r2时,则有p(r)=p(r1)*p(r2);
(3)当r=r1∨r2,即满足规则r1或者规则r2时,则有p(r)=1-(1-p(r1))*(1-p(r2));
(4)当r=if r1 then r2,即在满足规则r1的前提下再判断是否满足规则r2时,若同时满足规则r2,则有p(r)=1–r1*(1-p(r2));
(5)当r=r1∧r2∧r3,r3=r1.time<r2.time,其中r1.time表示规则r1发生的时间,r2.time表示规则r2发生的时间,规则r3表示规则r1和规则r2需要满足的时序关系;同时满足规则r1、r2、r3时p(r)的概率存在以下两种情况:
①当满足r1.time<r2.time时,则有p(r3)=1,因此p(r)=p(r1)*p(r2)*p(r3)=p(r1)*p(r2);
②当不满足r1.time<r2.time时,则有p(r3)=0,因此p(r)=p(r1)*p(r2)*p(r3)=0。
3.如权利要求1所述面向不完整数据的人机协同智能审计分析方法,其特征在于,所述步骤1中,通过调研单位或企业的最新内部制度、相关外部政策以及审计人员的经验,构建审计知识图谱表示模型。
4.如权利要求1所述面向不完整数据的人机协同智能审计分析方法,其特征在于,所述步骤2中,数据集成模块用于实现数据的标准化集成,通过自定义模型结构、字段的标准数据接口,完成业务数据的存储、维护、查询,满足现有业务数据的集成。
5.如权利要求4所述面向不完整数据的人机协同智能审计分析方法,其特征在于,经过数据集成模块集成后的业务数据由中间库和核心库负责存储,其中业务系统的数据存储在中间库中,而人工补录的缺失数据和查证结论,以及不可接入的数据都存储在核心库中。
6.如权利要求5所述面向不完整数据的人机协同智能审计分析方法,其特征在于,核心库是支撑审计模型的数据库,主要存储的是审计实施与分析的过程数据;由于中间库的业务数据是实时更新的,审计分析时,通过数据集成模块将所需业务数据从中间库推送至核心库,保证审计分析结果与数据版本的一致性和可追溯性。
7.如权利要求1所述面向不完整数据的人机协同智能审计分析方法,其特征在于,所述步骤4中,审计知识图谱通过确定的审计主题匹配相关的审核点实体,这些审核点实体之间的关系所组成的集合,构成审计模型。
8.如权利要求1所述面向不完整数据的人机协同智能审计分析方法,其特征在于,人工补录的数据会存储至核心库的临时数据表中,并且补录的数据仅对当前审计主题有效。
9.如权利要求1所述面向不完整数据的人机协同智能审计分析方法,其特征在于,所述步骤6中,审计人员根据问题数据和合规概率对疑点进行人工确认。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110889826.8A CN113657854A (zh) | 2021-08-04 | 2021-08-04 | 一种面向不完整数据的人机协同智能审计分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110889826.8A CN113657854A (zh) | 2021-08-04 | 2021-08-04 | 一种面向不完整数据的人机协同智能审计分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113657854A true CN113657854A (zh) | 2021-11-16 |
Family
ID=78490297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110889826.8A Pending CN113657854A (zh) | 2021-08-04 | 2021-08-04 | 一种面向不完整数据的人机协同智能审计分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113657854A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562785A (zh) * | 2023-03-17 | 2023-08-08 | 广东铭太信息科技有限公司 | 审计迎审系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070111878A (ko) * | 2006-05-19 | 2007-11-22 | 유한회사 삼일회계법인 | 지능형 상시 감사 시스템 및 감사 방법 |
CN104217276A (zh) * | 2013-06-05 | 2014-12-17 | 上海宝信软件股份有限公司 | 基于规则的自动化审计方法及系统 |
CN109658061A (zh) * | 2018-12-13 | 2019-04-19 | 安徽天勤盛创信息科技股份有限公司 | 一种审计综合分析平台 |
CN111461668A (zh) * | 2020-04-08 | 2020-07-28 | 国网天津市电力公司 | 一种基于流程自动化技术的数字化审计系统及方法 |
CN112633625A (zh) * | 2020-11-04 | 2021-04-09 | 国网青海省电力公司 | 一种审计疑点自动扫描方法、装置、电子设备及存储介质 |
CN112734540A (zh) * | 2020-12-29 | 2021-04-30 | 华润水泥投资有限公司 | 一种采购业务审计系统 |
-
2021
- 2021-08-04 CN CN202110889826.8A patent/CN113657854A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070111878A (ko) * | 2006-05-19 | 2007-11-22 | 유한회사 삼일회계법인 | 지능형 상시 감사 시스템 및 감사 방법 |
CN104217276A (zh) * | 2013-06-05 | 2014-12-17 | 上海宝信软件股份有限公司 | 基于规则的自动化审计方法及系统 |
CN109658061A (zh) * | 2018-12-13 | 2019-04-19 | 安徽天勤盛创信息科技股份有限公司 | 一种审计综合分析平台 |
CN111461668A (zh) * | 2020-04-08 | 2020-07-28 | 国网天津市电力公司 | 一种基于流程自动化技术的数字化审计系统及方法 |
CN112633625A (zh) * | 2020-11-04 | 2021-04-09 | 国网青海省电力公司 | 一种审计疑点自动扫描方法、装置、电子设备及存储介质 |
CN112734540A (zh) * | 2020-12-29 | 2021-04-30 | 华润水泥投资有限公司 | 一种采购业务审计系统 |
Non-Patent Citations (1)
Title |
---|
林碧英;陈昊;吕正;孙雅娟;: "联网审计系统中审计分析模型的研究与应用", 中国高新技术企业, no. 13 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562785A (zh) * | 2023-03-17 | 2023-08-08 | 广东铭太信息科技有限公司 | 审计迎审系统 |
CN116562785B (zh) * | 2023-03-17 | 2023-12-15 | 广东铭太信息科技有限公司 | 审计迎审系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Radulovic et al. | A comprehensive quality model for linked data | |
JP5306360B2 (ja) | データ記録を一致させるシステムの分析のための方法およびシステム | |
US9053437B2 (en) | Extracting enterprise information through analysis of provenance data | |
Brockmans et al. | Semantic Alignment of Business Processes. | |
CN111190881A (zh) | 一种数据治理方法和系统 | |
Becker et al. | Decision criteria in digital preservation: What to measure and how | |
CN103226743B (zh) | 基于trl的航空装备技术成熟度评估信息处理方法 | |
CN110119395B (zh) | 大数据治理中基于元数据实现数据标准与数据质量关联处理的方法 | |
Lin et al. | Semantic classification and hash code accelerated detection of design changes in BIM models | |
CN111680153A (zh) | 一种基于知识图谱的大数据鉴真方法与系统 | |
CN115617776A (zh) | 一种数据管理系统及方法 | |
CN113190501A (zh) | 水利水电工程质量验评电子文件形成及归档方法 | |
Maté et al. | Tracing conceptual models' evolution in data warehouses by using the model driven architecture | |
CN113657854A (zh) | 一种面向不完整数据的人机协同智能审计分析方法 | |
Rubin et al. | Declarative approach for model composition | |
Hinrichs et al. | An ISO 9001: 2000 Compliant Quality Management System for Data Integration in Data Warehouse Systems. | |
Ferranti et al. | Formalizing Property Constraints in Wikidata. | |
CN114911773B (zh) | 一种通用元模型设计方法 | |
CN116578614A (zh) | 一种管道设备的数据管理方法、系统、介质及设备 | |
Alshareef et al. | Transforming data flow diagrams for privacy compliance (long version) | |
CN116228402A (zh) | 一种金融征信特征仓库技术支持系统 | |
KR20210036613A (ko) | 데이터 표준화 관리 시스템 | |
Di Mauro et al. | Crowdsourced semantic enrichment for participatory e-government | |
CN117575172B (zh) | 一种多层级统分结合的一体化社会治理信息化系统 | |
Li et al. | Analytic model and assessment framework for data quality evaluation in state grid |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |