CN112100164A - 一种智能审计方法、系统和可读存储介质 - Google Patents

一种智能审计方法、系统和可读存储介质 Download PDF

Info

Publication number
CN112100164A
CN112100164A CN202010956389.2A CN202010956389A CN112100164A CN 112100164 A CN112100164 A CN 112100164A CN 202010956389 A CN202010956389 A CN 202010956389A CN 112100164 A CN112100164 A CN 112100164A
Authority
CN
China
Prior art keywords
data
audit
module
financial
auditing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010956389.2A
Other languages
English (en)
Inventor
杨国为
杨章静
张凡龙
詹天明
黄璞
万鸣华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING AUDIT UNIVERSITY
Original Assignee
NANJING AUDIT UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING AUDIT UNIVERSITY filed Critical NANJING AUDIT UNIVERSITY
Priority to CN202010956389.2A priority Critical patent/CN112100164A/zh
Publication of CN112100164A publication Critical patent/CN112100164A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Abstract

本发明属于数据审计技术领域,公开了一种智能审计方法、系统和可读存储介质,包括采集数据;对采集数据进行处理和数据挖掘;对数据的真实性、客观性、准确性进行检验;对数据的持续性与安全性进行分析;对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;对不同类型的数据进行分别审计;对数据检验不合格、数据分析异常、审计异常的数据进行报警;将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;利用显示器显示审计报告。本发明能够简化数据的收集、分析、审计过程,全面有效的对数据进行审计,能够有效发现海量数据中隐藏的相关问题,有效提高审计效率。

Description

一种智能审计方法、系统和可读存储介质
技术领域
本发明属于数据审计技术领域,尤其涉及一种智能审计方法、系统和可读存储介质。
背景技术
目前,审计的工作职能是通过对被审计单位财务数据的检查,来监督该单位财政、财务收支的真实性、合法性及效益性。在信息化、大数据环境下财务舞弊手段更加隐蔽,各种财务问题隐藏于海量数据中,以抽样为主的传统审计方式己很难发现这些问题,己经无法满足当前审计工作的实际需要。为适应审计事业在信息化环境下的各种变化,发挥审计工作的应有作用,审计人员创新审计思维、调整审计方式成为必然。
通过上述分析,现有技术存在的问题及缺陷为:现有数据审计方法效率低下,无法对数据进行全面有效的审计,且审计效率低。
发明内容
针对现有技术存在的问题,本发明提供了一种智能审计方法、系统和可读存储介质。
本发明是这样实现的,一种智能审计方法,所述智能审计方法包括以下步骤:
步骤一,审计数据获取模块利用数据采集技术从待审计数据存放的数据中采集相关财务数据和非财务数据;数据处理模块对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据处理模块设置的数据挖掘模块利用神经网络、机器学习等数据挖掘技术获得审计数据的关联规则、分类、聚类等知识模型。
步骤二,根据知识模型,数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验;数据分析模块对通过检验的数据的持续性与安全性进行分析;
步骤三,数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;数据审计模块对不同类型的数据进行分别审计;
步骤四,报警模块对数据检验不合格、数据分析异常、审计异常的数据进行报警;存储模块利用分布式数据分别存储采集的原始数据、处理后的数据、分类数据以及分析审计数据;
步骤五,审计报告输出模将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;显示模块利用显示器显示审计报告;
所述审计数据获取模块利用数据挖掘技术采集相关财务数据和非财务数据的具体过程为:
将相关财务数据和非财务数据建立相应的数据集合,并且确定需要提取的数据特征信息;
利用近距离度量模型,确定提取的数据特征信息与待挖掘的数据之间的距离;
将距离最近的数据进行挖掘提取,建立对应的数据集和;
所述数据分析模块对通过检验的数据的持续性与安全性进行分析的具体过程为:
数据持续分析单元利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;
根据数据的变化情况生成的可视化展示图表,数据安全分析单元对数据的编辑情况、泄露情况以及未授权更改情况进行分析;
同时对数据存储、编辑的安全性进行分析。
所述步骤三中,数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据的具体过程为:
通过检验的数据,建立数据分类集合;
在数值型数据、文本型数据以及日志数据中,分别确定数据分类的特征,作为数据分类的中心点,并进行初始化操作;
确定数值型数据、文本型数据以及日志数据的分类中心点与待分类数据点之间的距离,根据确定的距离值,对待分类的数据点进行排序;
根据分类数据点的排序,选取距离最近的数据点划归为一类;
基于这些分类点,通过取组中所有向量的均值来重新计算组中心,对一组迭代重复这些步骤。
进一步,步骤一中,所述数据处理模块对获取的财务数据以及非财务数据进行清洗包括:
(1)对获取的财务数据以及非财务数据进行降维处理;并对应不同的数据清洗规则;
(2)利用对应的数据清洗规则对相关财务数据以及非财务数据进行数据清洗。
进一步,步骤一中,所述对获取的财务数据以及非财务数据进行去重包括:
首先,获取清洗后的财务数据以及非财务数据;
其次,将获取的数据分成若干个数据块;
然后,利用数据去重公式对各个数据块内部进行去重,遍历所有数据块;
最后,对任意两个数据块利用去重公式进行去重,即可。
进一步,步骤二中,所述数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验包括:
1)获取处理后的数据,并将获取的数据分别输入到数据检验模型中;
2)通过数据检验模型中的预定真实性、客观性以及准确性规则对获取的数据进行并行检验处理。
进一步,步骤1)中,所述获取处理后的数据后还需进行:根据处理后的数据的属性信息,确定的数据真实性、客观性以及准确性验证规则;并判断数据检验模型中的所述预定规则是否包含全部所述数据真实性、客观性以及准确性验证规则。
本发明的另一目的在于提供一种实施所述智能审计方法的智能审计系统,所述智能审计系统包括:
审计数据获取模块,用于利用数据挖掘技术从待审计数据存放的数据中采集相关财务数据和非财务数据;审计数据获取模块利用数据挖掘技术采集相关财务数据和非财务数据的具体过程,将相关财务数据和非财务数据建立相应的数据集合,并且确定需要提取的数据特征信息;利用近距离度量模型,确定提取的数据特征信息与待挖掘的数据之间的距离;将距离最近的数据进行挖掘提取,建立对应的数据集和;
数据处理模块,用于对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据处理模块设置的数据挖掘模块利用神经网络、机器学习等数据挖掘技术获得审计数据的关联规则、分类、聚类等知识模型;
数据检验模块,用于对处理得到的数据的真实性、客观性、准确性进行检验;
数据分析模块,包括数据持续分析单元以及数据安全分析单元;用于对通过检验的数据的持续性与安全性进行分析;数据持续分析单元利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;根据数据的变化情况生成的可视化展示图表,数据安全分析单元对数据的编辑情况、泄露情况以及未授权更改情况进行分析;同时对数据存储、编辑的安全性进行分析;
数据分类模块,用于对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据的具体过程为,通过检验的数据,建立数据分类集合;在数值型数据、文本型数据以及日志数据中,分别确定数据分类的特征,作为数据分类的中心点,并进行初始化操作;确定数值型数据、文本型数据以及日志数据的分类中心点与待分类数据点之间的距离,根据确定的距离值,对待分类的数据点进行排序;根据分类数据点的排序,选取距离最近的数据点划归为一类;基于这些分类点,通过取组中所有向量的均值来重新计算组中心,对一组迭代重复这些步骤;
数据审计模块,包括数值数据审计单元、文本数据审计单元以及日志数据审计单元;用于对不同类型的数据进行分别审计;
报警模块,用于对数据检验不合格、数据分析异常、审计异常的数据进行报警;
存储模块,用于利用分布式数据分别存储采集的原始数据、处理后的数据、分类数据以及分析审计数据;
审计报告输出模块,用于将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;
显示模块,用于利用显示器显示审计报告。
进一步,所述数据分析模块包括:
数据持续分析单元,用于利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;
数据安全分析单元,用于对数据的编辑情况、泄露情况以及未授权更改情况进行分析;同时对数据存储、编辑的安全性进行分析。
进一步,所述数据审计模块包括:
数值数据审计单元,用于对数值型数据进行审计;
文本数据审计单元,用于利用文本语义挖掘技术对文本型数据进行审计;
日志数据审计单元,用于对系统日志数据进行异常审计。
本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施所述智能审计方法。
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行所述智能审计方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
本发明通过审计数据获取模块利用数据挖掘技术从待审计数据存放的数据中采集相关财务数据和非财务数据;数据处理模块对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验;数据分析模块包括数据持续分析单元以及数据安全分析单元;用于对通过检验的数据的持续性与安全性进行分析;数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;数据审计模块包括数值数据审计单元、文本数据审计单元以及日志数据审计单元;用于对不同类型的数据进行分别审计;报警模块对数据检验不合格、数据分析异常、审计异常的数据进行报警;审计报告输出模块将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出。本发明能够简化数据的收集、分析、审计过程,全面有效的对数据进行审计,能够有效发现海量数据中隐藏的相关问题,有效提高审计效率;通过提高审计结果的可靠性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的智能审计方法流程图。
图2是本发明实施例提供的数据处理模块对获取的财务数据以及非财务数据进行清洗方法流程图。
图3是本发明实施例提供的对获取的财务数据以及非财务数据进行去重方法流程图。
图4是本发明实施例提供的数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验方法流程图。
图5是本发明实施例提供的智能审计系统结构示意图;
图中:1、审计数据获取模块;2、数据处理模块;3、数据检验模块;4、数据分析模块;5、数据分类模块;6、数据审计模块;7、报警模块;8、存储模块;9、审计报告输出模块;10、显示模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种智能审计方法、系统和可读存储介质,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的智能审计方法包括以下步骤:
S101,审计数据获取模块利用数据采集技术从待审计数据存放的数据中采集相关财务数据和非财务数据;数据处理模块对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据处理模块设置的数据挖掘模块利用神经网络、机器学习等数据挖掘技术获得审计数据的关联规则、分类、聚类等知识模型。
S102,根据知识模型,数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验;数据分析模块对通过检验的数据的持续性与安全性进行分析;
S103,数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;数据审计模块对不同类型的数据进行分别审计;
S104,报警模块对数据检验不合格、数据分析异常、审计异常的数据进行报警;存储模块利用分布式数据分别存储采集的原始数据、处理后的数据、分类数据以及分析审计数据;
S105,审计报告输出模将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;显示模块利用显示器显示审计报告。
如图2所示,步骤S101中,本发明实施例提供的数据处理模块对获取的财务数据以及非财务数据进行清洗包括:
S201,对获取的财务数据以及非财务数据进行降维处理;并对应不同的数据清洗规则;
S202,利用对应的数据清洗规则对相关财务数据以及非财务数据进行数据清洗。
如图3所示,步骤S101中,本发明实施例提供的对获取的财务数据以及非财务数据进行去重包括:
S301,获取清洗后的财务数据以及非财务数据;
S302,将获取的数据分成若干个数据块;
S303,利用数据去重公式对各个数据块内部进行去重,遍历所有数据块;
S304,对任意两个数据块利用去重公式进行去重,即可。
步骤S101中,本发明实施例提供的审计数据获取模块利用数据挖掘技术采集相关财务数据和非财务数据的具体过程为:
将相关财务数据和非财务数据建立相应的数据集合,并且确定需要提取的数据特征信息;
利用近距离度量模型,确定提取的数据特征信息与待挖掘的数据之间的距离;
将距离最近的数据进行挖掘提取,建立对应的数据集和。
步骤S102中,本发明实施例提供的所述数据分析模块对通过检验的数据的持续性与安全性进行分析的具体过程为:
数据持续分析单元利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;
根据数据的变化情况生成的可视化展示图表,数据安全分析单元对数据的编辑情况、泄露情况以及未授权更改情况进行分析;
同时对数据存储、编辑的安全性进行分析。
如图4所示,步骤S102中,本发明实施例提供的数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验包括:
S401,获取处理后的数据,并将获取的数据分别输入到数据检验模型中;
S402,通过数据检验模型中的预定真实性、客观性以及准确性规则对获取的数据进行并行检验处理。
步骤S401中,本发明实施例提供的获取处理后的数据后还需进行:根据处理后的数据的属性信息,确定的数据真实性、客观性以及准确性验证规则;并判断数据检验模型中的所述预定规则是否包含全部所述数据真实性、客观性以及准确性验证规则。
步骤S103中,本发明实施例提供的数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据的具体过程为:
通过检验的数据,建立数据分类集合;
在数值型数据、文本型数据以及日志数据中,分别确定数据分类的特征,作为数据分类的中心点,并进行初始化操作;
确定数值型数据、文本型数据以及日志数据的分类中心点与待分类数据点之间的距离,根据确定的距离值,对待分类的数据点进行排序;
根据分类数据点的排序,选取距离最近的数据点划归为一类;
基于这些分类点,通过取组中所有向量的均值来重新计算组中心,对一组迭代重复这些步骤。
如图5所示,本发明实施例提供的智能审计系统包括:
审计数据获取模块1,用于利用数据挖掘技术从待审计数据存放的数据中采集相关财务数据和非财务数据;
数据处理模块2,用于对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据处理模块设置的数据挖掘模块利用神经网络、机器学习等数据挖掘技术获得审计数据的关联规则、分类、聚类等知识模型。
数据检验模块3,用于对处理得到的数据的真实性、客观性、准确性进行检验;
数据分析模块4,包括数据持续分析单元以及数据安全分析单元;用于对通过检验的数据的持续性与安全性进行分析;
数据分类模块5,用于对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;
数据审计模块6,包括数值数据审计单元、文本数据审计单元以及日志数据审计单元;用于对不同类型的数据进行分别审计;
报警模块7,用于对数据检验不合格、数据分析异常、审计异常的数据进行报警;
存储模块8,用于利用分布式数据分别存储采集的原始数据、处理后的数据、分类数据以及分析审计数据;
审计报告输出模块9,用于将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;
显示模块10,用于利用显示器显示审计报告。
本发明实施例提供的数据分析模块包括:
数据持续分析单元,用于利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;
数据安全分析单元,用于对数据的编辑情况、泄露情况以及未授权更改情况进行分析;同时对数据存储、编辑的安全性进行分析。
本发明实施例提供的数据审计模块包括:
数值数据审计单元,用于对数值型数据进行审计;
文本数据审计单元,用于利用文本语义挖掘技术对文本型数据进行审计;
日志数据审计单元,用于对系统日志数据进行异常审计。
以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种智能审计方法,其特征在于,所述智能审计方法,包括以下步骤:
步骤一,审计数据获取模块利用数据采集技术从待审计数据存放的数据中采集相关财务数据和非财务数据;数据处理模块对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据处理模块设置的数据挖掘模块利用神经网络、机器学习等数据挖掘技术获得审计数据的关联规则、分类、聚类等知识模型;
步骤二,根据知识模型,数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验;数据分析模块对通过检验的数据的持续性与安全性进行分析;
步骤三,数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;数据审计模块对不同类型的数据进行分别审计;
步骤四,报警模块对数据检验不合格、数据分析异常、审计异常的数据进行报警;存储模块利用分布式数据分别存储采集的原始数据、处理后的数据、分类数据以及分析审计数据;
步骤五,审计报告输出模将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;显示模块利用显示器显示审计报告;
所述审计数据获取模块利用数据挖掘技术采集相关财务数据和非财务数据的具体过程为:
将相关财务数据和非财务数据建立相应的数据集合,并且确定需要提取的数据特征信息;
利用近距离度量模型,确定提取的数据特征信息与待挖掘的数据之间的距离;
将距离最近的数据进行挖掘提取,建立对应的数据集和;
所述数据分析模块对通过检验的数据的持续性与安全性进行分析的具体过程为:
数据持续分析单元利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;
根据数据的变化情况生成的可视化展示图表,数据安全分析单元对数据的编辑情况、泄露情况以及未授权更改情况进行分析;
同时对数据存储、编辑的安全性进行分析;
所述步骤三中,数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据的具体过程为:
通过检验的数据,建立数据分类集合;
在数值型数据、文本型数据以及日志数据中,分别确定数据分类的特征,作为数据分类的中心点,并进行初始化操作;
确定数值型数据、文本型数据以及日志数据的分类中心点与待分类数据点之间的距离,根据确定的距离值,对待分类的数据点进行排序;
根据分类数据点的排序,选取距离最近的数据点划归为一类;
基于这些分类点,通过取组中所有向量的均值来重新计算组中心,对一组迭代重复这些步骤。
2.如权利要求1所述智能审计方法,其特征在于,步骤一中,所述数据处理模块对获取的财务数据以及非财务数据进行清洗包括:
(1)对获取的财务数据以及非财务数据进行降维处理;并对应不同的数据清洗规则;
(2)利用对应的数据清洗规则对相关财务数据以及非财务数据进行数据清洗。
3.如权利要求1所述智能审计方法,其特征在于,步骤一中,所述对获取的财务数据以及非财务数据进行去重包括:
首先,获取清洗后的财务数据以及非财务数据;
其次,将获取的数据分成若干个数据块;
然后,利用数据去重公式对各个数据块内部进行去重,遍历所有数据块;
最后,对任意两个数据块利用去重公式进行去重,即可。
4.如权利要求1所述智能审计方法,其特征在于,步骤二中,所述数据检验模块对处理得到的数据的真实性、客观性、准确性进行检验包括:
1)获取处理后的数据,并将获取的数据分别输入到数据检验模型中;
2)通过数据检验模型中的预定真实性、客观性以及准确性规则对获取的数据进行并行检验处理。
5.如权利要求4所述智能审计方法,其特征在于,步骤1)中,所述获取处理后的数据后还需进行:根据处理后的数据的属性信息,确定的数据真实性、客观性以及准确性验证规则;并判断数据检验模型中的所述预定规则是否包含全部所述数据真实性、客观性以及准确性验证规则。
6.一种实施如权利要求1~5任意一项所述智能审计方法的智能审计系统,其特征在于,所述智能审计系统包括:
审计数据获取模块,用于利用数据挖掘技术从待审计数据存放的数据中采集相关财务数据和非财务数据;审计数据获取模块利用数据挖掘技术采集相关财务数据和非财务数据的具体过程,将相关财务数据和非财务数据建立相应的数据集合,并且确定需要提取的数据特征信息;利用近距离度量模型,确定提取的数据特征信息与待挖掘的数据之间的距离;将距离最近的数据进行挖掘提取,建立对应的数据集和;
数据处理模块,用于对获取的财务数据以及非财务数据进行清洗、去重、融合、标准化处理;数据处理模块设置的数据挖掘模块利用神经网络、机器学习等数据挖掘技术获得审计数据的关联规则、分类、聚类等知识模型;
数据检验模块,用于对处理得到的数据的真实性、客观性、准确性进行检验;
数据分析模块,包括数据持续分析单元以及数据安全分析单元;用于对通过检验的数据的持续性与安全性进行分析;数据持续分析单元利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;根据数据的变化情况生成的可视化展示图表,数据安全分析单元对数据的编辑情况、泄露情况以及未授权更改情况进行分析;同时对数据存储、编辑的安全性进行分析;
数据分类模块,用于对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据;数据分类模块对通过检验的数据基于数据类型不同分为数值型数据、文本型数据以及日志数据的具体过程为,通过检验的数据,建立数据分类集合;在数值型数据、文本型数据以及日志数据中,分别确定数据分类的特征,作为数据分类的中心点,并进行初始化操作;确定数值型数据、文本型数据以及日志数据的分类中心点与待分类数据点之间的距离,根据确定的距离值,对待分类的数据点进行排序;根据分类数据点的排序,选取距离最近的数据点划归为一类;基于这些分类点,通过取组中所有向量的均值来重新计算组中心,对一组迭代重复这些步骤;
数据审计模块,包括数值数据审计单元、文本数据审计单元以及日志数据审计单元;用于对不同类型的数据进行分别审计;
报警模块,用于对数据检验不合格、数据分析异常、审计异常的数据进行报警;
存储模块,用于利用分布式数据分别存储采集的原始数据、处理后的数据、分类数据以及分析审计数据;
审计报告输出模块,用于将数据分析、审计结果进行数据融合,生成审计报告,将数据审计报告以图表的形式进行输出;
显示模块,用于利用显示器显示审计报告。
7.如权利要求6所述智能审计系统,其特征在于,所述数据分析模块包括:
数据持续分析单元,用于利用人工智能技术对数据的持续性进行分析,并对数据的变化情况生成可视化展示图表;
数据安全分析单元,用于对数据的编辑情况、泄露情况以及未授权更改情况进行分析;同时对数据存储、编辑的安全性进行分析。
8.如权利要求6所述智能审计系统,其特征在于,所述数据审计模块包括:
数值数据审计单元,用于对数值型数据进行审计;
文本数据审计单元,用于利用文本语义挖掘技术对文本型数据进行审计;
日志数据审计单元,用于对系统日志数据进行异常审计。
9.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施如权利要求1-5任意一项所述智能审计方法。
10.一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-5任意一项所述智能审计方法。
CN202010956389.2A 2020-09-11 2020-09-11 一种智能审计方法、系统和可读存储介质 Withdrawn CN112100164A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010956389.2A CN112100164A (zh) 2020-09-11 2020-09-11 一种智能审计方法、系统和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010956389.2A CN112100164A (zh) 2020-09-11 2020-09-11 一种智能审计方法、系统和可读存储介质

Publications (1)

Publication Number Publication Date
CN112100164A true CN112100164A (zh) 2020-12-18

Family

ID=73752179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010956389.2A Withdrawn CN112100164A (zh) 2020-09-11 2020-09-11 一种智能审计方法、系统和可读存储介质

Country Status (1)

Country Link
CN (1) CN112100164A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785399A (zh) * 2021-01-12 2021-05-11 四川天行健穗金科技有限公司 一种用于财税数据的清洗方法及系统
CN113076352A (zh) * 2021-03-17 2021-07-06 远光软件股份有限公司 审计方法、电子设备及存储介质
CN113157948A (zh) * 2021-03-17 2021-07-23 国网湖北省电力有限公司 非结构化数据的审计方法、电子设备及存储介质
CN113486370A (zh) * 2021-06-25 2021-10-08 杭州天宽科技有限公司 一种安卓日志审计系统和方法
CN113673828A (zh) * 2021-07-23 2021-11-19 北京信息科技大学 一种基于知识图谱及大数据的审计数据处理方法、系统、介质及装置
CN114911798A (zh) * 2022-05-07 2022-08-16 常州机电职业技术学院 一种工程审计用信息处理集成系统及其方法
CN117333141A (zh) * 2023-11-27 2024-01-02 国网浙江省电力有限公司 电力工程的工程量自动化审计方法、系统、设备和介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785399A (zh) * 2021-01-12 2021-05-11 四川天行健穗金科技有限公司 一种用于财税数据的清洗方法及系统
CN113076352A (zh) * 2021-03-17 2021-07-06 远光软件股份有限公司 审计方法、电子设备及存储介质
CN113157948A (zh) * 2021-03-17 2021-07-23 国网湖北省电力有限公司 非结构化数据的审计方法、电子设备及存储介质
CN113486370A (zh) * 2021-06-25 2021-10-08 杭州天宽科技有限公司 一种安卓日志审计系统和方法
CN113673828A (zh) * 2021-07-23 2021-11-19 北京信息科技大学 一种基于知识图谱及大数据的审计数据处理方法、系统、介质及装置
CN114911798A (zh) * 2022-05-07 2022-08-16 常州机电职业技术学院 一种工程审计用信息处理集成系统及其方法
CN117333141A (zh) * 2023-11-27 2024-01-02 国网浙江省电力有限公司 电力工程的工程量自动化审计方法、系统、设备和介质
CN117333141B (zh) * 2023-11-27 2024-02-06 国网浙江省电力有限公司 电力工程的工程量自动化审计方法、系统、设备和介质

Similar Documents

Publication Publication Date Title
CN112100164A (zh) 一种智能审计方法、系统和可读存储介质
CN107154880B (zh) 系统监控方法及装置
CN111882446B (zh) 一种基于图卷积网络的异常账户检测方法
CN110009171B (zh) 用户行为模拟方法、装置、设备及计算机可读存储介质
CN110543903B (zh) 一种gis局部放电大数据系统的数据清洗方法及系统
KR101811270B1 (ko) 화물을 검사하는 방법 및 그 시스템
CN111539493B (zh) 一种告警预测方法、装置、电子设备及存储介质
CN110991657A (zh) 一种基于机器学习的异常样本检测方法
CN108304567B (zh) 高压变压器工况模式识别与数据分类方法及系统
Cao et al. Applying data mining in money laundering detection for the Vietnamese banking industry
KR20230030542A (ko) 랜덤 컷 포레스트 알고리즘을 이용한 ai 기반의 설비 데이터 이상 감지 시스템과 그 방법
CN111738331A (zh) 用户分类方法及装置、计算机可读存储介质、电子设备
WO2024067387A1 (zh) 基于特征变量评分的用户画像生成方法,设备、汽车及存储介质
CN114266455A (zh) 一种基于知识图谱的可视化企业风险评估方法
CN110619691B (zh) 一种板坯表面裂纹的预测方法及装置
CN116756688A (zh) 一种基于多模态融合算法的舆情风险发现方法
CN110852860A (zh) 车辆维修报销行为异常检测方法、设备及存储介质
CN107025293A (zh) 一种电力二次设备缺陷数据挖掘方法及系统
CN114312930B (zh) 基于日志数据的列车运行异常诊断方法和装置
CN113051340B (zh) 端到端海空活动目标数据规律实时挖掘方法
CN113268419B (zh) 测试用例优化信息的生成方法、装置、设备和存储介质
CN114637893A (zh) 一种fmea数据库系统及其处理方法
CN114662856A (zh) 一种大型轧机状态跟踪方法和系统
CN113515560A (zh) 车辆故障的分析方法、装置、电子设备及存储介质
CN114626433A (zh) 一种智能电能表故障预测并分类方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201218

WW01 Invention patent application withdrawn after publication