CN113919927A - 一种基于数据处理的审计平台 - Google Patents
一种基于数据处理的审计平台 Download PDFInfo
- Publication number
- CN113919927A CN113919927A CN202111190936.1A CN202111190936A CN113919927A CN 113919927 A CN113919927 A CN 113919927A CN 202111190936 A CN202111190936 A CN 202111190936A CN 113919927 A CN113919927 A CN 113919927A
- Authority
- CN
- China
- Prior art keywords
- module
- data
- risk
- company
- audit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 44
- 238000012550 audit Methods 0.000 claims abstract description 53
- 238000007726 management method Methods 0.000 claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 230000009193 crawling Effects 0.000 claims abstract description 11
- 238000005516 engineering process Methods 0.000 claims abstract description 11
- 238000011160 research Methods 0.000 claims abstract description 9
- 238000011161 development Methods 0.000 claims abstract description 7
- 238000012544 monitoring process Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 23
- 230000007306 turnover Effects 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000013135 deep learning Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 9
- 230000008520 organization Effects 0.000 claims description 9
- 238000013475 authorization Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000013523 data management Methods 0.000 claims description 6
- 238000007689 inspection Methods 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 238000000611 regression analysis Methods 0.000 claims description 6
- 238000013075 data extraction Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000005206 flow analysis Methods 0.000 claims description 3
- 230000007774 longterm Effects 0.000 claims description 3
- 230000002265 prevention Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims 1
- 238000012800 visualization Methods 0.000 abstract description 7
- 238000007405 data analysis Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 3
- 238000013079 data visualisation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Finance (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Animal Behavior & Ethology (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据处理的审计平台,包括审计平台本体,所述审计平台本体包括应用服务模块、数据处理和服务模块以及基础设施模块,所述应用服务模块由登录管理模块、数据查询模块、数据下载模块、算法分析模块、系统监控模块和模型管理模块组成,模型管理模块由算法模型管理模块、算法开发模块和业务模型模块组成,数据处理和服务模块由数据服务模块、预处理模块、数据爬取模块和资源库组成。本发明以爬虫、数据预处理、信息化、模型化和可视化为核心,通过大数据分析、人工智能、知识图谱、文字识别等先进技术,提高爬虫解析服务和智能化科研服务的能力,满足使用需求。
Description
技术领域
本发明涉及审计平台技术领域,尤其涉及一种基于数据处理的审计平台。
背景技术
审计平台即是利用联网服务器专用空间构建审计工作一条龙以促进审计资源整合加强信息传递,现有的审计平台,其爬虫解析服务和智能化科研服务能力效果不理想,不能满足使用需求,因此我们提出了一种基于数据处理的审计平台用于解决上述问题。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于数据处理的审计平台。
本发明提出的一种基于数据处理的审计平台,包括审计平台本体,所述审计平台本体包括应用服务模块、数据处理和服务模块以及基础设施模块,所述应用服务模块由登录管理模块、数据查询模块、数据下载模块、算法分析模块、系统监控模块和模型管理模块组成,模型管理模块由算法模型管理模块、算法开发模块和业务模型模块组成,数据处理和服务模块由数据服务模块、预处理模块、数据爬取模块和资源库组成,基础设施由Web服务器、数据库服务器、爬虫服务器、大数据存储服务器、数据预处理和分析服务器、索引服务模块、负载均衡服务器、校园网络、文献库和互联网组成。
优选地,所述数据服务模块包括索引服务模块、数据授权服务模块、数据查询服务模块、数据下载服务模块、分析服务模块、标签服务模块和数据管控服务模块。
优选地,所述预处理模块包括数据转换模块、数据清洗模块、数据去重模块、数据智能识别模块、数据补全模块、数据关联模块、数据融合模块、数据对比模块、数据标识模块和数据抽取模块。
优选地,所述数据爬取模块包括爬虫网站库、爬虫管理模块、配置管理模块和解析管理模块。
优选地,所述资源库包括财务库、舆情库、丑闻库、上市公司业务库和学术文献库。
优选地,所述财务库包括上市公司基本情况、资产负债表、利润表、现金流量表、所有者权益变动表、比率结构、偿债能力、经营能力、盈力能力、现金流分析、风险水平、公司治理综合信息、十大股东信息、股本结构信息、财务报表审计意见信息、财务报表附注信息,其中财务报表附注信息包括公司营业收入的地区构成和公司营业收入的内容构成,公司营业收入的地区构成用于推导公司是区域性公司还是全国或全球性企业,公司营业收入的内容构成用于推导公司是专业化企业还是多元化企业,其中上市公司的基本情况包括对公司文化、公司战略、公司竞争策略的介绍。
优选地,所述偿债能力包括流动比率、速动比率、现金比率、营运资金与借款比、资产负债率、利息保障倍数、经营活动产生的现金流量净额/流动负债、现金流利息保障倍数、现金流到期债务保障倍数、长期借款与总资产比和有形资产负债率等,其中流动负债包括有息债和无息债的比重结构;所述经营能力包括存货与收入比、存货周转率、营业周期、应付账款周转率、营运资金(资本)周转率、现金及现金等价物周转率、流动资产与收入比和流动资产周转率等。
优选地,所述模型管理模块进行财务舞弊预警分析,分析以下元素:
元素1:高管层面的预警信号,包括信用特征、道德价值观、个人生活方面特征、权力集中程度、人口特征、心理特征、背景特征、社会资本网络、离职率分析、薪酬激励、盈利压力、业绩承诺;
元素2:关系层面的预警信号,包括与金融机构关系、与关联企业关系、与注册会计师关系、与律师关系、与投资者和监管机构的关系;
元素3:行业层面的预警信号,包括行业生命周期、竞争程度、行业地位、技术风险、行业会计处理特点;
元素4:组织结构层面的预警信号,包括组织结构复杂程度、机构分布、董事会结构、董事会专业委员会、董事会权力;
元素5:财务结果和经营层面的预警信号,包括资产、负债、所有者权益、收入、费用、成本及相关财务指标、信用披露指标;
元素6:会计异常的预警信号,包括原始凭证异常、记账凭证异常、账簿异常;
元素7:外部监督,包括媒体监督、分析师跟踪、举报;
具体分析步骤为:
步骤11、基于历史数据、案例,利用人工智能技术深度学习,确定上述元素的权重和有效性;
步骤12、基于现有数据、材料,确定每项元素的异常程度;
步骤13、利用模糊综合评价、回归分析等数学和运筹学方法,计算预测上市公司财务舞弊指数。
优选地,所述模型管理模块进行审计风险识别和防范分析,具体分析步骤为:
步骤21、确定重大错报风险因素集及其子集,包括战略风险、经营流程风险、控制风险、会计风险、财务舞弊风险;
步骤22、确定检查风险因素集及其子集,包括客户关系维度、审计人员维度、审计方案维度、审计证据、审计程序维度、审计方法维度、审计标准维度;
步骤23、确定重大错报风险因素权重集;
步骤24、确定检查风险因素重集,基于财务舞弊和审计失败的历史数据、案例,利用人工智能技术深度学习,确定上述元素的权重和有效性;
步骤25、对重大错报风险、检查风险内涵的各因素指标进行评价或给出明确风险值,基于现有数据、材料,进行专家判断、人工智能深度学习;
步骤26、明确重大错报风险、检查风险单因素风险防范手段,利用人工智能爬取技术进行规律总结;
步骤27、利用模糊综合评价、回归分析等数学和运筹学方法,确定审计风险识别模型,审计风险=重大错报风险×检查风险,判定结果分为:较高风险;中等风险;较低风险;
步骤28、利用审计失败、财务造假案例进行人工智能模拟、训练学习。
步骤29、基于上述审计风险识别模型的单因素评价和综合评价结果,明确审计风险的单因素防范手段和综合防范措施。
本发明以爬虫、数据预处理、信息化、模型化和可视化为核心,通过大数据分析、人工智能、知识图谱、文字识别等先进技术,提高爬虫解析服务和智能化科研服务的能力,满足使用需求。
附图说明
图1为本发明提出的一种基于数据处理的审计平台的系统框图;
图2为本发明提出的一种基于数据处理的审计平台的应用服务模块的系统框图;
图3为本发明提出的一种基于数据处理的审计平台的数据处理和服务模块的系统框图;
图4为本发明提出的一种基于数据处理的审计平台的数据服务模块的系统框图;
图5为本发明提出的一种基于数据处理的审计平台的预处理模块的系统框图;
图6为本发明提出的一种基于数据处理的审计平台的数据爬取模块的系统框图;
图7为本发明提出的一种基于数据处理的审计平台的基础设施的系统框图。
具体实施方式
下面结合具体实施例对本发明作进一步解说。
实施例
参照图1-7,本实施例提出了一种基于数据处理的审计平台,包括审计平台本体,审计平台本体包括应用服务模块、数据处理和服务模块以及基础设施模块,应用服务模块由登录管理模块、数据查询模块、数据下载模块、算法分析模块、系统监控模块和模型管理模块组成,模型管理模块由算法模型管理模块、算法开发模块和业务模型模块组成,数据处理和服务模块由数据服务模块、预处理模块、数据爬取模块和资源库组成,算法模型管理模块是提供工程化的环境,完成一站式的算法/数据研发,通过把算法集中起来,构成算法模型资源池,和系统其他部分通过接口进行交互,减少算法变更对系统的影响,并通过手段来规范使用算法的方式,把日常使用的算法集中起来构成算法模块,同时规范算法模块的使用方式,方便算法的共享使用,实现基于业务场景的流程配置,支持跨多种异构存储/计算资源平台,实现算法及模型的快速部署和复制,使得算法工程师或者数据开发工程师在构建数据应用的时候从解决实际业务场景出发,组合配置多种类型的算法流程,从而快速实现和沉淀解决业务问题的工作流,依托算法模型管理功能实现跨平台多异构任务的快速部署和上线,提高工作效率,算法开发模块实现算法开发、分享、模型训练服务,通过可视化或者命令行来操作实现算法开发,用户通过调用模型和算法,然后系统将相应的算法转换成对应的计算类型调用底层计算资源平台进行运算和操作,资源库的数据是由原始库的数据经过清洗、转换、关联、比对等数据处理过程后形成的标准数据,在资源库的数据结构设计上,以原始库数据结构为基础,补充必要的数据字段;在数据表设计上,将相同表结构的数据表进行适当的合并,并保留原始库的表名以方便进行溯源;数据加工过程设计是资源库设计中最核心的部分,这部分要进行数据标准、数据元的设计,以及原始数据和标准数据元的关联设计,从而将资源库的数据处理成符合标准的数据,数据服务模块通过提供标准化、模板化的应用服务接口来对外提供数据资源的开放能力,包含面向上层业务应用和面向外部业务系统的服务,所有服务都能注册、发布和使用,主要包括数据授权、数据索引、数据查询、数据订阅、标签服务和数据可视化等数据服务功能,其中数据可视化是通用可视化分析引擎能够借助于图形化分析手段,清晰有效地通过可视化方式表达数据分析逻辑,自助式构建数据治理可视化分析和业务预警可视化分析,满足数据治理分析简洁、高效、灵活及多元化的可视化展示要求,主要展示数据治理全周期运行情况,从宏观层面分析展示数据接入、数据处理、数据管控、资源库、数据应用等的总体概况,数据处理和服务模块利用数据处理系统对接入的数据进行探查、提取、清洗、转换、关联、比对、标识、融合等数据操作,对经过处理后的数据,按照原始库、资源库、主题库、专题库的形式进行组织,形成数据资源池,并以服务的方式为上层提供数据支撑,实现对数据从接入处理到对外服务的全流程监管,基础设施由Web服务器、数据库服务器、爬虫服务器、大数据存储服务器、数据预处理和分析服务器、索引服务模块、负载均衡服务器、校园网络、文献库和互联网组成,爬虫服务器通过爬虫对关心的网站、舆情和非财务数据进行爬取,并对数据进行相关的处理。
本实施例中,数据服务模块包括索引服务模块、数据授权服务模块、数据查询服务模块、数据下载服务模块、分析服务模块、标签服务模块和数据管控服务模块,索引服务模块提供数据资源的位置检索服务,通过统一的索引服务检索接口,根据所请求的要素值通过索引服务可以快速定位到资源的所在中心、所在省市、所在系统、所在库表信息等,数据授权服务模块为用户分配各类系统功能权限和数据资源访问权限,在实际授权过程中,通过动态授权、鉴权管理等验证角色是否拥有访问数据的权限,数据查询服务模块以预设或自定义的数据项为单一查询条件或组合查询条件,通过标准化的查询功能配置和服务接口调用,建立基于条件查询的分类分目查询功能和一键式查询功能,实现按要素分类查询或基于不确定关键字的一键式全网检索,标签服务模块提供动态标签计算和静态标签计算功能,以便能够支持平台沉淀的大量历史数据的标签计算,也支持对实时流入的事件进行标签计算,其中,动态标签计算主要是针对实时流数据进行标签标识,静态标签计算主要是针对已入库的数据进行离线计算,并进行标签识别,还可基于“灾害事故、管理对象、应急环境、救援资源”等应急要素及其已有的标签构建该要素的画像,形成对要素的全方位、多角度、面向各业务场景的刻画与描述,并通过标签管理平台提供的对外服务接口提供标签画像的查询服务;
预处理模块包括数据转换模块、数据清洗模块、数据去重模块、数据智能识别模块、数据补全模块、数据关联模块、数据融合模块、数据对比模块、数据标识模块和数据抽取模块,数据清洗模块是对业务数据中不符合标准规范或者无效的数据进行相关操作,在进行数据整合之前先定义数据的清洗规则,并对符合清洗规则的数据设置数据的错误级别,当进行数据整合过程中遇到符合清洗规则的数据时,系统将把这些业务数据置为问题数据,并根据错误的严重程度进行归类,对出现的问题数据进行标记后存入问题数据库中,经确认后再决定是通过清洗转换后入库,还是直接放弃,抑或其他方式处理,对于清洗前后的数据还需进行一致性检查,以保证清洗结果集的质量,数据去重模块包括结构化去重和非结构化数据去重,结构化数据去重在指定时间窗口内,所有字段如果相同,则合并为一条记录;非结构化数据(二进制文件)去重是在指定时间窗口内,对非结构化数据指定范围计算MD5值(32字节长度),相同MD5值只保留一个原始文件,数据抽取模块对数据提取,并对原始数据进行规范化处理的过程,主要针对半结构化数据,通过数据提取过程,从这些半结构化数据中提取出盈利能力、偿债能力等相关信息,并将提取的信息以结构化形式进行存储,数据补全模块主要对数据中的缺失字段、空值进行处理填充,如针对有身份证号码信息的字段,但相应的出生年月、性别字段却是空值或缺失,则可以根据身份证号码计算出出生年月、性别进行信息回填,数据关联模块包括数据关联组件,需要完成在不同数据集之间的关联,实现在不同数据集的联动,为数据治理、业务应用的需求提供支撑,根据数据处理流程设计的要求,数据关联组件的功能包括:标准关联、字典关联、半结构化关联、关联回填,数据融合模块包括标准化去噪后的数据需要采取必要的数据融合手段,按照业务的主题库、专题库以及数据应用需要的方式组织,在数据融合的过程中,应该以合理的方式设计数据结构,保障数据应用对数据高效分析查询的同时,尽可能的减少冗余,数据对比模块通过数据比对功能实现对两个数据集中的数据内容、数据格式的比较核查,找出相同的数据或不同的数据,在业务应用场景上主要实现以下数据比对功能,数据标识模块依托标签引擎结合应急业务知识库、标签规则库对数据进行标识,标签规则库提供标签的定义、内容、版本、关联等,通过读取标签规则库的内容,对数据进行映射,通过人工或智能的方式实现对数据打标,以便提升数据的价值密度,并为上层应用提供支撑;
数据爬取模块包括爬虫网站库、爬虫管理模块、配置管理模块和解析管理模块,爬虫网站库用于相关网站库的管理,包括导入、查询和导出,爬虫管理模块用于对爬虫集群进行管理,包括爬虫任务的调度、定时更新、爬虫监控等,主要实现对数据接入任务的管理,支持数据接入任务的创建、查询、删除等功能,并可指定接入任务所使用的抽取方法、转换规则和加载方式,并根据指定类型进行任务的调度执行,配置管理模块用于对爬虫所需的各种配置进行管理,解析管理模块能够根据不同的web网站进行解析管理,包括模板管理、关键词管理等;
资源库包括财务库、舆情库、丑闻库、上市公司业务库和学术文献库,财务库包括上市公司基本情况、资产负债表、利润表、现金流量表、所有者权益变动表、比率结构、偿债能力、经营能力、盈力能力、现金流分析、风险水平、公司治理综合信息、十大股东信息、股本结构信息、财务报表审计意见信息、财务报表附注信息,其中财务报表附注信息包括公司营业收入的地区构成和公司营业收入的内容构成,公司营业收入的地区构成用于推导公司是区域性公司还是全国或全球性企业,公司营业收入的内容构成用于推导公司是专业化企业还是多元化企业,其中上市公司的基本情况包括对公司文化、公司战略、公司竞争策略的介绍,偿债能力包括流动比率、速动比率、现金比率、营运资金与借款比、资产负债率、利息保障倍数、经营活动产生的现金流量净额/流动负债、现金流利息保障倍数、现金流到期债务保障倍数、长期借款与总资产比和有形资产负债率等,其中流动负债包括有息债和无息债的比重结构,经营能力包括存货与收入比、存货周转率、营业周期、应付账款周转率、营运资金(资本)周转率、现金及现金等价物周转率、流动资产与收入比和流动资产周转率等,丑闻库通过特定的关键词和深度学习模型分析出上市公司的丑闻模型。
其中,模型管理模块进行财务舞弊预警分析,分析以下元素:
元素1:高管层面的预警信号,包括信用特征、道德价值观、个人生活方面特征、权力集中程度、人口特征、心理特征、背景特征、社会资本网络、离职率分析、薪酬激励、盈利压力、业绩承诺;
元素2:关系层面的预警信号,包括与金融机构关系、与关联企业关系、与注册会计师关系、与律师关系、与投资者和监管机构的关系;
元素3:行业层面的预警信号,包括行业生命周期、竞争程度、行业地位、技术风险、行业会计处理特点;
元素4:组织结构层面的预警信号,包括组织结构复杂程度、机构分布、董事会结构、董事会专业委员会、董事会权力;
元素5:财务结果和经营层面的预警信号,包括资产、负债、所有者权益、收入、费用、成本及相关财务指标、信用披露指标;
元素6:会计异常的预警信号,包括原始凭证异常、记账凭证异常、账簿异常;
元素7:外部监督,包括媒体监督、分析师跟踪、举报;
具体分析步骤为:
步骤11、基于历史数据、案例,利用人工智能技术深度学习,确定上述元素的权重和有效性;
步骤12、基于现有数据、材料,确定每项元素的异常程度;
步骤13、利用模糊综合评价、回归分析等数学和运筹学方法,计算预测上市公司财务舞弊指数。
其中,模型管理模块进行审计风险识别和防范分析,具体分析步骤为:
步骤21、确定重大错报风险因素集及其子集,包括战略风险、经营流程风险、控制风险、会计风险、财务舞弊风险;
步骤22、确定检查风险因素集及其子集,包括客户关系维度、审计人员维度、审计方案维度、审计证据、审计程序维度、审计方法维度、审计标准维度;
步骤23、确定重大错报风险因素权重集;
步骤24、确定检查风险因素重集,基于财务舞弊和审计失败的历史数据、案例,利用人工智能技术深度学习,确定上述元素的权重和有效性;
步骤25、对重大错报风险、检查风险内涵的各因素指标进行评价或给出明确风险值,基于现有数据、材料,进行专家判断、人工智能深度学习;
步骤26、明确重大错报风险、检查风险单因素风险防范手段,利用人工智能爬取技术进行规律总结;
步骤27、利用模糊综合评价、回归分析等数学和运筹学方法,确定审计风险识别模型,审计风险=重大错报风险×检查风险,判定结果分为:较高风险;中等风险;较低风险;
步骤28、利用审计失败、财务造假案例进行人工智能模拟、训练学习。
步骤29、基于上述审计风险识别模型的单因素评价和综合评价结果,明确审计风险的单因素防范手段和综合防范措施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种基于数据处理的审计平台,包括审计平台本体,所述审计平台本体包括应用服务模块、数据处理和服务模块以及基础设施模块,其特征在于,所述应用服务模块由登录管理模块、数据查询模块、数据下载模块、算法分析模块、系统监控模块和模型管理模块组成,模型管理模块由算法模型管理模块、算法开发模块和业务模型模块组成,数据处理和服务模块由数据服务模块、预处理模块、数据爬取模块和资源库组成,基础设施由Web服务器、数据库服务器、爬虫服务器、大数据存储服务器、数据预处理和分析服务器、索引服务模块、负载均衡服务器、校园网络、文献库和互联网组成。
2.根据权利要求1所述的一种基于数据处理的审计平台,其特征在于,所述数据服务模块包括索引服务模块、数据授权服务模块、数据查询服务模块、数据下载服务模块、分析服务模块、标签服务模块和数据管控服务模块。
3.根据权利要求1所述的一种基于数据处理的审计平台,其特征在于,所述预处理模块包括数据转换模块、数据清洗模块、数据去重模块、数据智能识别模块、数据补全模块、数据关联模块、数据融合模块、数据对比模块、数据标识模块和数据抽取模块。
4.根据权利要求1所述的一种基于数据处理的审计平台,其特征在于,所述数据爬取模块包括爬虫网站库、爬虫管理模块、配置管理模块和解析管理模块。
5.根据权利要求1所述的一种基于数据处理的审计平台,其特征在于,所述资源库包括财务库、舆情库、丑闻库、上市公司业务库和学术文献库。
6.根据权利要求5所述的一种基于数据处理的审计平台,其特征在于,所述财务库包括上市公司基本情况、资产负债表、利润表、现金流量表、所有者权益变动表、比率结构、偿债能力、经营能力、盈力能力、现金流分析、风险水平、公司治理综合信息、十大股东信息、股本结构信息、财务报表审计意见信息、财务报表附注信息,其中财务报表附注信息包括公司营业收入的地区构成和公司营业收入的内容构成,公司营业收入的地区构成用于推导公司是区域性公司还是全国或全球性企业,公司营业收入的内容构成用于推导公司是专业化企业还是多元化企业,其中上市公司的基本情况包括对公司文化、公司战略、公司竞争策略的介绍。
7.根据权利要求6所述的一种基于数据处理的审计平台,其特征在于,所述偿债能力包括流动比率、速动比率、现金比率、营运资金与借款比、资产负债率、利息保障倍数、经营活动产生的现金流量净额/流动负债、现金流利息保障倍数、现金流到期债务保障倍数、长期借款与总资产比和有形资产负债率等,其中流动负债包括有息债和无息债的比重结构;所述经营能力包括存货与收入比、存货周转率、营业周期、应付账款周转率、营运资金(资本)周转率、现金及现金等价物周转率、流动资产与收入比和流动资产周转率等。
8.根据权利要求7所述的一种基于数据处理的审计平台,其特征在于,所述模型管理模块进行财务舞弊预警分析,分析以下元素:
元素1:高管层面的预警信号,包括信用特征、道德价值观、个人生活方面特征、权力集中程度、人口特征、心理特征、背景特征、社会资本网络、离职率分析、薪酬激励、盈利压力、业绩承诺;
元素2:关系层面的预警信号,包括与金融机构关系、与关联企业关系、与注册会计师关系、与律师关系、与投资者和监管机构的关系;
元素3:行业层面的预警信号,包括行业生命周期、竞争程度、行业地位、技术风险、行业会计处理特点;
元素4:组织结构层面的预警信号,包括组织结构复杂程度、机构分布、董事会结构、董事会专业委员会、董事会权力;
元素5:财务结果和经营层面的预警信号,包括资产、负债、所有者权益、收入、费用、成本及相关财务指标、信用披露指标;
元素6:会计异常的预警信号,包括原始凭证异常、记账凭证异常、账簿异常;
元素7:外部监督,包括媒体监督、分析师跟踪、举报;
具体分析步骤为:
步骤11、基于历史数据、案例,利用人工智能技术深度学习,确定上述元素的权重和有效性;
步骤12、基于现有数据、材料,确定每项元素的异常程度;
步骤13、利用模糊综合评价、回归分析等数学和运筹学方法,计算预测上市公司财务舞弊指数。
9.根据权利要求7所述的一种基于数据处理的审计平台,其特征在于,所述模型管理模块进行审计风险识别和防范分析,具体分析步骤为:
步骤21、确定重大错报风险因素集及其子集,包括战略风险、经营流程风险、控制风险、会计风险、财务舞弊风险;
步骤22、确定检查风险因素集及其子集,包括客户关系维度、审计人员维度、审计方案维度、审计证据、审计程序维度、审计方法维度、审计标准维度;
步骤23、确定重大错报风险因素权重集;
步骤24、确定检查风险因素重集,基于财务舞弊和审计失败的历史数据、案例,利用人工智能技术深度学习,确定上述元素的权重和有效性;
步骤25、对重大错报风险、检查风险内涵的各因素指标进行评价或给出明确风险值,基于现有数据、材料,进行专家判断、人工智能深度学习;
步骤26、明确重大错报风险、检查风险单因素风险防范手段,利用人工智能爬取技术进行规律总结;
步骤27、利用模糊综合评价、回归分析等数学和运筹学方法,确定审计风险识别模型,审计风险=重大错报风险×检查风险,判定结果分为:较高风险;中等风险;较低风险;
步骤28、利用审计失败、财务造假案例进行人工智能模拟、训练学习。
步骤29、基于上述审计风险识别模型的单因素评价和综合评价结果,明确审计风险的单因素防范手段和综合防范措施。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111190936.1A CN113919927A (zh) | 2021-10-13 | 2021-10-13 | 一种基于数据处理的审计平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111190936.1A CN113919927A (zh) | 2021-10-13 | 2021-10-13 | 一种基于数据处理的审计平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113919927A true CN113919927A (zh) | 2022-01-11 |
Family
ID=79240034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111190936.1A Pending CN113919927A (zh) | 2021-10-13 | 2021-10-13 | 一种基于数据处理的审计平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113919927A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114866540A (zh) * | 2022-07-06 | 2022-08-05 | 清华大学苏州汽车研究院(吴江) | 一种企业数据运营管理系统 |
CN116821200A (zh) * | 2023-07-04 | 2023-09-29 | 大师兄(上海)云数据服务有限公司 | 一种人工智能云数据可视化分析系统及其分析方法 |
CN117216424A (zh) * | 2023-09-12 | 2023-12-12 | 深圳君南信息系统有限公司 | 基于大数据的可视化分析运营方法及系统 |
CN117520802A (zh) * | 2024-01-08 | 2024-02-06 | 国网山东省电力公司东营供电公司 | 一种电力工程现场轻量级审计事件识别方法、系统及设备 |
CN116821200B (zh) * | 2023-07-04 | 2024-10-15 | 大师兄(上海)云数据服务有限公司 | 一种人工智能云数据可视化分析系统及其分析方法 |
-
2021
- 2021-10-13 CN CN202111190936.1A patent/CN113919927A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114866540A (zh) * | 2022-07-06 | 2022-08-05 | 清华大学苏州汽车研究院(吴江) | 一种企业数据运营管理系统 |
CN114866540B (zh) * | 2022-07-06 | 2022-09-20 | 清华大学苏州汽车研究院(吴江) | 一种企业数据运营管理系统 |
CN116821200A (zh) * | 2023-07-04 | 2023-09-29 | 大师兄(上海)云数据服务有限公司 | 一种人工智能云数据可视化分析系统及其分析方法 |
CN116821200B (zh) * | 2023-07-04 | 2024-10-15 | 大师兄(上海)云数据服务有限公司 | 一种人工智能云数据可视化分析系统及其分析方法 |
CN117216424A (zh) * | 2023-09-12 | 2023-12-12 | 深圳君南信息系统有限公司 | 基于大数据的可视化分析运营方法及系统 |
CN117520802A (zh) * | 2024-01-08 | 2024-02-06 | 国网山东省电力公司东营供电公司 | 一种电力工程现场轻量级审计事件识别方法、系统及设备 |
CN117520802B (zh) * | 2024-01-08 | 2024-05-24 | 国网山东省电力公司东营供电公司 | 一种电力工程现场轻量级审计事件识别方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Loshin | The practitioner's guide to data quality improvement | |
US11532040B2 (en) | International cash management software using machine learning | |
Hall | Accounting information systems | |
US7574379B2 (en) | Method and system of using artifacts to identify elements of a component business model | |
CN113919927A (zh) | 一种基于数据处理的审计平台 | |
US11995622B2 (en) | Method of international cash management using machine learning | |
US11798100B2 (en) | Transaction counterpart identification | |
Chan et al. | Artificial intelligence in accounting and auditing | |
Sirikulvadhana | Data mining as a financial auditing tool | |
CN110222180A (zh) | 一种文本数据分类与信息挖掘方法 | |
Khadivizand et al. | Towards intelligent feature engineering for risk-based customer segmentation in banking | |
Biswas et al. | Automated credit assessment framework using ETL process and machine learning | |
Li et al. | Construction of Credit Evaluation Index System for Two‐Stage Bayesian Discrimination: An Empirical Analysis of Small Chinese Enterprises | |
Oliverio et al. | A hybrid model for fraud detection on purchase orders | |
KR20230072151A (ko) | 세무 회계 서비스 플랫폼 | |
Chiantera | Data quality and data governance in insurance corporations | |
Xie | The Application of Financial Technology in the Intelligent Management of Credit Risk Under the Background of Big Data | |
Xiong et al. | Financial Risk Control and Audit of Supply Chain under the Information Technology Environment | |
CN117726468B (zh) | 一种ai财税机器人的财税管理方法、系统及应用 | |
Kalcheva | Linked Data adoption and application within financial business processes | |
Gichohi | Leveraging on big data and advanced technologies to enhance domestic revenue mobilization | |
Ourdani et al. | Big Data and public finance sector | |
Ramesha | Machine Learning Based Approaches to Detect Loan Defaulters | |
Chen et al. | Construction of Bank Credit White List Access System Based on Grey Clustering Algorithm | |
Boczko | Information Management and Data Processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |