CN107766500A - 固定资产卡片的审计方法 - Google Patents
固定资产卡片的审计方法 Download PDFInfo
- Publication number
- CN107766500A CN107766500A CN201710979916.XA CN201710979916A CN107766500A CN 107766500 A CN107766500 A CN 107766500A CN 201710979916 A CN201710979916 A CN 201710979916A CN 107766500 A CN107766500 A CN 107766500A
- Authority
- CN
- China
- Prior art keywords
- data
- fixed assets
- assets card
- card
- audit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
固定资产卡片的审计方法,步骤如下:从业务系统和/或财务系统获取固定资产卡片数据,并进行特征属性数据的提取;对获得的固定资产卡片进行筛选,将包含了不合理数据的固定资产卡片剔除;将清洗后的数据分为离散型数据和连续型数据,对于连续型数据进行归一化处理,对于离散型数据进行变量数值化处理;将预处理后的数据按照比例分为训练集和测试集,利用训练集的数据来训练模型,利用测试集来评价模型,最终获得审计模型;利用得到的审计模型,将未标记的固定资产卡片数据输入审计模型中进行审计,由审计模型评估固定资产卡片的合规与否,实现自动分类。本发明结合了机器学习和大数据技术,可以提高固定资产卡片的审计效率,节约审计工作成本。
Description
技术领域
本发明属于企业信息管理技术领域,尤其涉及一种应用于企业信息管理系统(ERP)审计固定资产卡片业务的方法。
背景技术
在审计信息化系统中,根据审计标准或规则在线自动检索预警方法在审计合规性检查工作中发挥了很大的作用。经过近年来不断深化应用,审计信息化系统得到了优化和改进,随着内存计算技术、数据库分离等技术发展,系统的执行性能也得到了提升。传统的审计疑点检查是对每一个检查点根据审计标准或规则分别编写对应的计算机程序来进行检查,例如,有十个检查点就需要编写对应的十个检查程序。随着业务点不断增长,规则库也不断扩大,不仅容易引发混乱,难以维护,而且规则的配置常会受到政策法规变化的影响,但由于规则具有一定的固化性,难以及时更新,当规则变化时审计经验得不到及时积累,另外对于某些新兴业务,例如大额资金监测,暂时没有明确的规则可用,也就没法使用规则检验,导致现有的审计方法存在无法动态扩展及存在滞后性的缺陷。
同时,随着源数据量越来越大、源数据的种类也不断拓展(如固定资产卡片数据等),现有的审计合规性检查方法也需要完善和改进,主要体现在以下方面:
1、无法满足大数据的处理需求;在目前大集中部署条件下,在线审计需要处理多个网省的财务及业务方面的数据,资产卡片数据量达到千万条,而且需要对大量的半结构化数据以及非结构化数据进行数据处理,因此大数据技术的应用是必然趋势,现有的固定资产卡片的审计方法无法满足海量数据审计的需求;
2、审计技术固化,缺乏创新;“中国制造2025”作为国家战略实施以来,智能制造已成为经济社会发展的热点,在这种情势下,应改变传统的信息审计化方法,与时俱进,积极研究探索信息化背景下适应时代要求的智能审计建设,寻求更科学高效审计方法。
发明内容
本发明的目的在于提供一种结合了机器学习和大数据技术的固定资产卡片的审计方法,可以提高审计的工作效率,节约审计工作成本。
为了实现上述目的,本发明采取如下的技术解决方案:
固定资产卡片的审计方法,包括以下步骤:
数据收集及特征属性提取步骤;从业务系统和/或财务系统获取固定资产卡片数据,并进行特征属性数据的提取;
数据清洗步骤;对获得的固定资产卡片进行筛选,将包含了不合理数据的固定资产卡片剔除;
数据分类及预处理步骤;将清洗后的数据分为离散型数据和连续型数据两大类,并对不同的数据类型采用不同的方法进行数据预处理:对于连续型数据进行归一化处理,对于离散型数据进行变量数值化处理;
审计模型建立步骤;将预处理后的数据按照比例分为训练集和测试集,利用训练集的数据来训练模型,利用测试集来评价模型,最终获得审计模型;
固定资产卡片审计分类步骤;利用前一步骤得到的审计模型,将未标记的固定资产卡片数据输入审计模型中进行审计,由审计模型评估固定资产卡片的合规与否,实现自动分类。
更具体的,在数据收集及特征属性提取步骤中所收集的数据包括结构化数据、半结构化数据、非结构化数据以及实时数据。
更具体的,在数据收集及特征属性提取步骤中,从固定资产卡片中提取的特征属性数据包括:资产编码、资产类别、资产变动方式、资产状态、计量单位、数量、电压等级、预计使用年限、使用保管人、资产原值、账面净值、累计折旧额。
更具体的,在数据清洗步骤中,对包含了满足以下任一条件的特征属性数据的固定资产卡片进行剔除:资产原值≤0,或累计折旧额≤0,或账面净值<0,或资产原值-累计折旧额-账面净值<0。
更具体的,数据分类及预处理步骤中的离散型数据包括:资产类别、资产变动方式、资产状态、计量单位、电压等级、使用保管人;连续型数据包括:数量、预计使用年限、资产原值、账面净值、累计折旧额。
更具体的,在审计模型建立步骤中,审计模型采用朴素贝叶斯方法训练生成。
更具体的,在审计模型建立步骤中,采用连续型数据训练模型时,需要先将连续型数据进行区间化处理。
更具体的,在审计模型建立步骤中,审计模型采用Logistic模型训练生成。
由以上技术方案可知,本发明通过构建基于机器学习的固定资产智能审计模型,替代传统的每一个检查点都需要通过编写对应计算机程序来进行规则检查的模式,机器学习能够发现数据中隐含的新模式,无需针对每一个检查点编写审计检查规则,只需确定模型的特征值以及相关性即可,通过机器学习弥补规则中存在不足,提升合规性检查的准确性,不仅提升了审计管理的效率和审计模型的智能化水平,而且更适用于没有明确规则的业务场景,以及大数据时代下的审计工作。本发明通过借助信息化、大数据以及机器学习等技术,提升了固定资产卡片审计模型的智能化水平。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例或现有技术描述中所需要使用的附图做简单介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的流程图。
具体实施方式
为了让本发明的上述和其它目的、特征及优点能更明显,下文特举本发明实施例,并配合所附图示,做详细说明如下。
图1为本发明的流程图,如图1所示,本发明的固定资产卡片的审计方法包括以下步骤:
数据收集及特征属性提取步骤;从各业务系统和/或财务系统获取各类固定资产卡片数据,包括从财务管控系统、SAP-ERP业务系统等系统获取如关系库记录等结构化数据,日记、邮件等半结构化数据,文件、视频、音频、网络数据流等非结构化数据以及特定的实时数据,获取数据的手段包括通过ETL抽取、文件适配器提取及实时数据采集等;获得固定资产卡片数据后,进行特征属性数据的提取,从固定资产卡片中提取的特征属性数据包括:资产编码、资产类别、资产变动方式、资产状态、计量单位、数量、电压等级、预计使用年限、使用保管人、资产原值(初始购置价值)、账面净值、累计折旧额;
数据清洗步骤;对获得的固定资产卡片进行筛选,将包含了不合理的特征属性数据的固定资产卡片剔除,不合理的数据包括:资产原值≤0,或累计折旧额≤0,或账面净值<0,或资产原值-累计折旧额-账面净值<0,当固定资产卡片中存在符合以上任一条件的特征属性数据时,将该固定资产卡片剔除;更具体的,可采用Java与R语言交互的方式对数据进行清洗;
数据分类及预处理步骤;将清洗后的(特征属性)数据进行分类,分为离散型数据和连续型数据两大类,其中,离散型数据包括:资产类别、资产变动方式、资产状态、计量单位、电压等级、使用保管人,连续型数据包括:数量、预计使用年限、资产原值、账面净值、累计折旧额;对不同的数据类型采用不同的方法进行数据预处理,从而为后续模型分析提供基础:对于预计使用年限、资产原值、账面净值、累计折旧额等连续型数据进行归一化处理,将数据变为(0,1)之间的小数,通过归一化处理将数据映射到0~1范围之内,从而简化计算;对于资产类别、资产变动方式、资产状态、计量单位、电压等级等离散型数据,用简化数字来代替数据中的变量,将变量数据化,例如,对于电压等级而言,有10kV、35kV、110kV、220kV等变量,可分别数字1、2、3、4来进行替换,方便模型的参数估计;
审计模型建立步骤,利用预处理后的数据采用机器学习的方法生成审计模型;将预处理后的数据(连续型数据和离散型数据)按照比例分为训练集和测试集,例如将清洗后数据的80%归入训练集,20%归入测试集,利用训练集的数据来训练模型,利用测试集来评价模型,最终获得准确率高、运行效率快和敏感度高的审计模型;
固定资产卡片审计分类步骤;利用前一步骤得到的审计模型,将未标记的固定资产卡片(即未经过审计的正常或异常的固定资产卡片)的数据输入审计模型中进行审计,由审计模型评估固定资产卡片的合规与否,实现自动分类。
本发明的审计模型可采用朴素贝叶斯方法训练生成,或采用Logistic模型训练生成。朴素贝叶斯方法是基于贝叶斯定理与特征条件独立假设的分类方法,采用朴素贝叶斯方法训练模型的过程中,对于连续型数据,需要先进行区间化处理,使数据(变量)之间具有独立性后才能用于训练模型,如一组数据范围从1到30,可以将数据分组,分为[1,10)、[10,20)和[20,30],由此就将一组连续型数据分成三个区间段;对于离散型数据,由于离散型数据本身相互独立,此时无需进行区间化处理。朴素贝叶斯方法对于给定的待分类项,求解在待分类项出现的条件下各个类别yi出现的概率,根据条件概率p(yi|x)的大小来判断待分类项属于哪个类别,哪个条件概率p(yi|x)最大,就将此待分类项归属于哪个类别。
Logistic模型的形式为Log(p/(1-p))=βX,X=(1,X1,X2,…,Xp)’,式中的p为估计的概率,β为待估计参数,X1、X2至Xp为变量,本发明中X1、X2至Xp为固定资产卡片的特征属性数据,利用训练集的数据对β进行估计,从而得到估计模型,通过估计的模型对资产卡片进行分类。
朴素贝叶斯方法和Logistic模型为常规的分类方法或分类模型,通过训练集训练朴素贝叶斯分类器或Logistic模型,利用测试集对模型的分类结果进行敏感度分析和准确度分析,从业务视角和模型准确度来进行对比评价,最终得出准确率高、运行效率快和敏感度高的审计模型,训练和测试方法都是通过将训练集和测试集中的数据不断迭代计算最后得到模型,其过程为常规技术,此处只做简单介绍,不再进行赘述。
本发明通过采用朴素贝叶斯或逻辑斯蒂回归模型等机器学习算法来对固定资产卡片进行审计,利用机器学习技术,通过历史数据的采集、样本建立、机器人训练、训练结果测试及优化调整等,改善了资产卡片合规性检查的执行性能和精准度,有效防范公司经营风险,提高了非现场审计的工作效率,达到节约审计工作成本的目的。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽范围。
Claims (8)
1.固定资产卡片的审计方法,其特征在于,包括以下步骤:
数据收集及特征属性提取步骤;从业务系统和/或财务系统获取固定资产卡片数据,并进行特征属性数据的提取;
数据清洗步骤;对获得的固定资产卡片进行筛选,将包含了不合理数据的固定资产卡片剔除;
数据分类及预处理步骤;将清洗后的数据分为离散型数据和连续型数据,并对不同的数据类型采用不同的方法进行数据预处理:对于连续型数据进行归一化处理,对于离散型数据进行变量数据化处理;
审计模型建立步骤;将预处理后的数据按照比例分为训练集和测试集,利用训练集的数据来训练模型,利用测试集来评价模型,最终获得审计模型;
固定资产卡片审计分类步骤;利用前一步骤得到的审计模型,将未标记的固定资产卡片数据输入审计模型中进行审计,由审计模型评估固定资产卡片的合规与否,实现自动分类。
2.如权利要求1所述的固定资产卡片的审计方法,其特征在于:在数据收集及特征属性提取步骤中所收集的数据包括结构化数据、半结构化数据、非结构化数据以及实时数据。
3.如权利要求1或2所述的固定资产卡片的审计方法,其特征在于:在数据收集及特征属性提取步骤中,从固定资产卡片中提取的特征属性数据包括:资产编码、资产类别、资产变动方式、资产状态、计量单位、数量、电压等级、预计使用年限、使用保管人、资产原值、账面净值、累计折旧额。
4.如权利要求3所述的固定资产卡片的审计方法,其特征在于:在数据清洗步骤中,对包含了满足以下任一条件的特征属性数据的固定资产卡片进行剔除:资产原值≤0,或累计折旧额≤0,或账面净值<0,或资产原值-累计折旧额-账面净值<0。
5.如权利要求3所述的固定资产卡片的审计方法,其特征在于:数据分类及预处理步骤中的离散型数据包括:资产类别、资产变动方式、资产状态、计量单位、电压等级、使用保管人;连续型数据包括:数量、预计使用年限、资产原值、账面净值、累计折旧额。
6.如权利要求1所述的固定资产卡片的审计方法,其特征在于:在审计模型建立步骤中,审计模型采用朴素贝叶斯方法训练生成。
7.如权利要求6所述的固定资产卡片的审计方法,其特征在于:在审计模型建立步骤中,采用连续型数据训练模型时,需要先将连续型数据进行区间化处理。
8.如权利要求1所述的固定资产卡片的审计方法,其特征在于:在审计模型建立步骤中,审计模型采用Logistic模型训练生成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710979916.XA CN107766500A (zh) | 2017-10-19 | 2017-10-19 | 固定资产卡片的审计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710979916.XA CN107766500A (zh) | 2017-10-19 | 2017-10-19 | 固定资产卡片的审计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107766500A true CN107766500A (zh) | 2018-03-06 |
Family
ID=61269078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710979916.XA Pending CN107766500A (zh) | 2017-10-19 | 2017-10-19 | 固定资产卡片的审计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107766500A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033471A (zh) * | 2018-09-05 | 2018-12-18 | 中国信息安全测评中心 | 一种信息资产识别方法及装置 |
CN110032607A (zh) * | 2019-04-17 | 2019-07-19 | 成都市审计局 | 一种基于大数据的审计方法 |
CN110473077A (zh) * | 2019-07-23 | 2019-11-19 | 中国建设银行股份有限公司 | 固定资产异常数据的监测和提醒方法、装置及电子设备 |
CN110751452A (zh) * | 2019-09-18 | 2020-02-04 | 九江明阳电路科技有限公司 | 一种工作流程管理系统、方法及存储介质 |
CN110928537A (zh) * | 2018-09-19 | 2020-03-27 | 百度在线网络技术(北京)有限公司 | 模型评测方法、装置、设备及计算机可读介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090835A (zh) * | 2014-06-27 | 2014-10-08 | 中国人民解放军国防科学技术大学 | 基于eID和谱理论的跨平台虚拟资产交易审计方法 |
CN106600369A (zh) * | 2016-12-09 | 2017-04-26 | 广东奡风科技股份有限公司 | 基于朴素贝叶斯分类的银行金融产品实时推荐系统和方法 |
US20170286544A1 (en) * | 2015-09-16 | 2017-10-05 | RiskIQ, Inc. | Using hash signatures of dom objects to identify website similarity |
-
2017
- 2017-10-19 CN CN201710979916.XA patent/CN107766500A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090835A (zh) * | 2014-06-27 | 2014-10-08 | 中国人民解放军国防科学技术大学 | 基于eID和谱理论的跨平台虚拟资产交易审计方法 |
US20170286544A1 (en) * | 2015-09-16 | 2017-10-05 | RiskIQ, Inc. | Using hash signatures of dom objects to identify website similarity |
CN106600369A (zh) * | 2016-12-09 | 2017-04-26 | 广东奡风科技股份有限公司 | 基于朴素贝叶斯分类的银行金融产品实时推荐系统和方法 |
Non-Patent Citations (3)
Title |
---|
吕劲松 王志成 隋学深 徐权: ""基于数据挖掘的商业银行对公信贷资产质量审计研究"", 《金融研究》 * |
易仁萍 王昊 朱玉全: ""基于数据挖掘的审计模型框架"", 《中国审计》 * |
王新庄: "《会计电算化应用教程》", 29 February 1992, 电子科技大学出版社 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033471A (zh) * | 2018-09-05 | 2018-12-18 | 中国信息安全测评中心 | 一种信息资产识别方法及装置 |
CN109033471B (zh) * | 2018-09-05 | 2022-11-08 | 中国信息安全测评中心 | 一种信息资产识别方法及装置 |
CN110928537A (zh) * | 2018-09-19 | 2020-03-27 | 百度在线网络技术(北京)有限公司 | 模型评测方法、装置、设备及计算机可读介质 |
CN110928537B (zh) * | 2018-09-19 | 2023-08-11 | 百度在线网络技术(北京)有限公司 | 模型评测方法、装置、设备及计算机可读介质 |
CN110032607A (zh) * | 2019-04-17 | 2019-07-19 | 成都市审计局 | 一种基于大数据的审计方法 |
CN110473077A (zh) * | 2019-07-23 | 2019-11-19 | 中国建设银行股份有限公司 | 固定资产异常数据的监测和提醒方法、装置及电子设备 |
CN110751452A (zh) * | 2019-09-18 | 2020-02-04 | 九江明阳电路科技有限公司 | 一种工作流程管理系统、方法及存储介质 |
CN110751452B (zh) * | 2019-09-18 | 2023-11-10 | 九江明阳电路科技有限公司 | 一种工作流程管理系统、方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766500A (zh) | 固定资产卡片的审计方法 | |
CN107633265A (zh) | 用于优化信用评估模型的数据处理方法及装置 | |
CN107967485A (zh) | 用电计量设备故障分析方法及装置 | |
CN103971023B (zh) | 研发过程质量自动评估系统和方法 | |
CN107633030A (zh) | 基于数据模型的信用评估方法及装置 | |
CN108846691A (zh) | 区域性粮油市场价格监测分析预测系统及监测方法 | |
CN107633455A (zh) | 基于数据模型的信用评估方法及装置 | |
WO2021128523A1 (zh) | 一种基于科技大数据的技术成熟度判断方法和系统 | |
WO2020259391A1 (zh) | 一种数据库脚本性能测试的方法及装置 | |
WO2017071369A1 (zh) | 一种预测用户离网的方法和设备 | |
CN115794803B (zh) | 一种基于大数据ai技术的工程审计问题监测方法与系统 | |
CN109102396A (zh) | 一种用户信用评级方法、计算机设备及可读介质 | |
CN114493619A (zh) | 一种基于电力数据的企业征信标签构建方法 | |
CN105574666A (zh) | 一种基于关键数据建模的评定企业信用等级的方法及装置 | |
Liu et al. | Application of hierarchical clustering in tax inspection case-selecting | |
Zheng et al. | [Retracted] Using an Optimized Learning Vector Quantization‐(LVQ‐) Based Neural Network in Accounting Fraud Recognition | |
Sun | Intelligent data mining based on market circulation of production factors | |
Qiang et al. | [Retracted] Relationship Model between Human Resource Management Activities and Performance Based on LMBP Algorithm | |
CN106408407A (zh) | 一种综合账务管理系统 | |
CN110196797A (zh) | 适于信用评分卡系统的自动优化方法和系统 | |
CN114897345A (zh) | 一种基于员工数据自动生成指标分的方法及装置 | |
Liu et al. | Application of master data classification model in enterprises | |
CN114462705A (zh) | 一种计量物资检定计划生成方法及装置 | |
TWI550531B (zh) | 企業資源規劃績效評估系統及方法 | |
CN110209953A (zh) | 一种面向不确定性社会计算问题的计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180306 |