CN112463853B - 通过云平台进行财务数据行为筛选工作方法 - Google Patents

通过云平台进行财务数据行为筛选工作方法 Download PDF

Info

Publication number
CN112463853B
CN112463853B CN202011360633.5A CN202011360633A CN112463853B CN 112463853 B CN112463853 B CN 112463853B CN 202011360633 A CN202011360633 A CN 202011360633A CN 112463853 B CN112463853 B CN 112463853B
Authority
CN
China
Prior art keywords
abnormal data
data
abnormal
time
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011360633.5A
Other languages
English (en)
Other versions
CN112463853A (zh
Inventor
卿赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Caishu Shijiazhuang Network Technology Co ltd
Original Assignee
Chongqing Medical and Pharmaceutical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Medical and Pharmaceutical College filed Critical Chongqing Medical and Pharmaceutical College
Priority to CN202011360633.5A priority Critical patent/CN112463853B/zh
Publication of CN112463853A publication Critical patent/CN112463853A/zh
Application granted granted Critical
Publication of CN112463853B publication Critical patent/CN112463853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Abstract

本发明提出了一种通过云平台进行财务数据行为筛选工作方法,包括如下步骤:S1,在实时查询校验提取后,设置异常数据的判断区间,在判断区间之中形成标准化数据;S2,对标准化数据进行偏离度分析,分析之后通过筛选模型对异常数据进行筛选操作,并对筛选之后的异常数据进行特征评分。

Description

通过云平台进行财务数据行为筛选工作方法
技术领域
本发明涉及大数据分析领域,尤其涉及一种通过云平台进行财务数据行为筛选工作方法。
背景技术
在财务数据管理过程中,由于交易次数的增加,形成了难以计数的交易历史数据,对于交易历史数据中有多少是合规操作或者正常的交易行为,对于财务数据管理者来说通过传统的查验方式已经不能满足当前社会日益变化,日趋复杂的异常交易行为。尤其在学校,政府机关或者大型连锁企业,其交易总额和交易次数更是难以计数,通过传统的计算机累积方式或者统计学原理并不能快速准确的获取包含交易风险的交易行为,现有的数据筛选方法并不准确,且对异常财务数据的把控和查验过程并不准确。这就亟需本领域技术人员解决相应的技术问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种通过云平台进行财务数据行为筛选工作方法。
为了实现本发明的上述目的,本发明提供了一种通过云平台进行财务数据行为筛选工作方法,包括:
S1,在实时查询校验提取后,设置异常数据的判断区间,在判断区间之中形成标准化数据;
S2,对标准化数据进行偏离度分析,分析之后通过筛选模型对异常数据进行筛选操作,并对筛选之后的异常数据进行特征评分。
优选的,所述S1包括:
S1-1,对异常数据划分判断区间,计算异常数据相似度,从而生成判断区间,将异常数据通过比例缩放计算进行标准化处理,异常大量资金转入快速分散转出的交易数据ui的转换值为u′i,异常大量分散资金转入快速集中转出的交易数据vi的转换值为v′i,异常时间点交易数据xi的转换值为x′i、异常相同数额交易数据yi的转换值为y′i、异常超限额交易数据zi的转换值为z′k
将转换后的交易异常数据与时间和日期变量一起代入判断模型,在统计的任一时间和日期内计算异常数据的判断值:
Figure GDA0003616986270000021
其中,B(t,d)为异常数据在任一时间t和日期d的判断值;f(u′i;t,d)为一个异常大量资金转入快速分散转出的交易数据的时间和日期的判断值;f(v′i;t,d)为一个异常大量分散资金转入快速集中转出的交易数据的时间和日期的判断值;f(x′i;t,d)为一个异常时间点交易数据的时间和日期的判断值;f(y′i;t,d)为一个异常相同数额交易数据的时间和日期的判断值;f(z′i;t,d)为一个异常超限额交易数据的判断值;i最大为60是为了保证一分钟内每一秒的异常数据都进行实时监控判断。
优选的,所述S1包括:
S1-2,计算每一个异常数据在时间和日期上的实际和判断值的差值,通过残差平方和对离散的异常数据进行线性曲线拟合过程,从而对异常数据的风险趋势进行判断,
Figure GDA0003616986270000022
其中,W为每个异常数据的残差平方和;B0(t,d)为每个异常数据在该时间和日期的实际值;B(t,d)为每个异常数据在该时间和日期的判断值;M为统计的时间最大的时刻或者日期的最多天数。
优选的,所述S1还包括:
S1-3,然后计算异常数据的偏离度
Figure GDA0003616986270000031
其中,F为计算常数,通过调节系数λ进行调节,由于W增大,故取的计算常数F较大;通过增加异常数据准确获取值Hj,对全部N个异常数据准确获取值累加之后进行特征值e的偏离收敛,β为特征阈值。
优选的,所述S2包括:
S2-1,异常数据偏离度分析后,通过先验概率分布在异常数据中进行统计信息计算;计算异常数据先验条件概率分布,设置第一异常数据集合C与第二异常数据集合E的内部属性,其中第一异常数据集合包括ui和vi,第二异常数据集合包括xi、yi和zi,通过定义异常数据的时间类属性G和日期类属性I,在概率分布条件下分别计算条件概率
Figure GDA0003616986270000032
Figure GDA0003616986270000033
计算得到:
Figure GDA0003616986270000034
继续推导得到,
Figure GDA0003616986270000035
其中
Figure GDA0003616986270000036
表示第一异常数据集合
Figure GDA0003616986270000037
和时间类属性G和日期类属性I联合概率分布,遍历第一异常数据集合
Figure GDA0003616986270000038
和时间类属性G的全部值得到其条件概率分布
Figure GDA0003616986270000039
以及第一异常数据集合
Figure GDA00036169862700000310
和日期类属性I的全部值得到其条件概率分布
Figure GDA00036169862700000311
时间类属性条件概率Q(G),日期类属性条件概率Q(I);
然后计算:
Figure GDA00036169862700000312
继续推导得到,
Figure GDA00036169862700000313
其中
Figure GDA00036169862700000314
表示第二异常数据集合
Figure GDA00036169862700000315
和时间类属性G和日期类属性I联合概率分布,遍历第二异常数据集合
Figure GDA0003616986270000041
和时间类属性G的全部值得到其条件概率分布
Figure GDA0003616986270000042
以及第二异常数据集合
Figure GDA0003616986270000043
和日期类属性I的全部值得到其条件概率分布
Figure GDA0003616986270000044
优选的,所述S2包括:
S2-2,第一异常数据集合C中每个异常数据节点与第二异常数据集合E中每个异常数据节点时间属性和日期属性的条件信息联合概率分布值如下;
Figure GDA0003616986270000045
选取异常数据的类属性J放入大数据平台中;将第一异常数据集合C中和第二异常数据集合E的内部属性以类属性J为父节点,构造朴素贝叶斯网络。
优选的,所述S2还包括:
S2-3,将第一异常数据集合C中和第二异常数据集合E中的节点逐个放入贝叶斯网络中;若第一异常数据集合C中
Figure GDA0003616986270000046
则将
Figure GDA0003616986270000047
放入网络作为其父节点;若第二异常数据集合E中
Figure GDA0003616986270000048
则将
Figure GDA0003616986270000049
放入网络作为其父节点;从而得到用于异常数据等级筛选排序的贝叶斯网络;
优选的,所述S2包括:
S2-4,计算类属性J的概率质量函数
Figure GDA00036169862700000410
得到异常数据中属性值最突出的概率分布;
Figure GDA00036169862700000411
其中
Figure GDA00036169862700000412
表示J关联的所有第一异常数据集合C中和第二异常数据集合E节点的条件概率的乘积;由大数据平台对财务异常数据根据概率分布的情况,向贝叶斯网络中第一异常数据集合C中和第二异常数据集合E的各个属性节点赋值;轮流将异常数据的基本属性代入贝叶斯网络中通过概率质量函数;按照计算数值从大到小的顺序对异常数据排列。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
通过海量数据的学习过程,通过神经网络学习算法,提取出相对准确的异常交易行为,并通过云平台进行同步传输,从而筛选匹配后进行远程展示,实现了大数据环境下的数据异常提取和风险预警,提高了工作效率,并能够在海量财务数据管理过程中提高数据的预判性和可读性。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明总体示意图;
图2是本发明工作流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
如图1和2所示,本发明公开一种通过云平台进行财务数据行为筛选工作方法,包括如下步骤:
S1,通过云端数据库获取财务数据,对财务数据中的异常数据进行登录,然后开始初步查询,查询过程中对无效数据进行实时查询校验提取;
S2,在实时查询校验提取后,设置异常数据的判断区间,在判断区间之中形成标准化数据;
S3,对标准化数据进行偏离度分析,分析之后通过筛选模型对异常数据进行筛选操作,并对筛选之后的异常数据进行特征评分,
S4,经过特征评分之后,财务数据中异常数据的风险度通过综合风险判断模型进行判断输出。
所述S1包括:
S1-1,在云端数据库中调取财务数据,在财务数据中获取异常数据,异常数据提取过程通过初步查询过程进行数据均衡来动态请求云端数据库的财务数据,采用动态配置的方式,设置异常数据的获取阈值,根据不同财务数据的安全控制机制和权限管理要求提取不同的异常数据进行登录操作,
S1-2,在初步查询过程中,云端数据库对财务数据认证、功能访问权限信息存储在本地数据库中,进行统一财务数据认证、功能权限控制;对于财务数据对异常数据进行逻辑隔离,存放在独立数据库中;财务数据登录过程中验证用户身份并根据财务数据中异常数据访问权限信息构造该用户有权访问的异常数据集合,通过云端数据库的身份认证过程进行认证访问;如果访问失败,则返回异常数据访问失败信息;如果访问成功,则登录成功;建立用户与系统动态分配的应用服务器实例独立的通道,
S1-3,异常数据的访问和使用过程为,在根据多个异常数据,形成异常数据关系节点,查找PaaS平台资源进行转换为树结点,生成异常数据树结点列表,将空的异常数据结点集作为当前结点集,对当前的异常数据树结点集进行遍历操作,从而判断当前遍历操作的结点集的异常数据父资源信息列表是否等于预置的异常数据根结点信息列表,若等于预置的异常数据根结点信息列表,则当前遍历操作的结点集为当前异常数据权限树的根结点,若不等于预置的异常数据根结点信息列表,继续遍历异常数据标识等于当前遍历操作的结点的父资源信息列表的资源,将该资源标记为当前遍历操作的结点的异常数据父结点,
S1-4对于异常数据结点是否等于当前遍历到的结点的父资源信息列表,判断当前树结点列表是否遍历完毕;若遍历完毕检测异常数据父结点信息列表,若未遍历完毕,则将当前异常数据父结点信息列表作为当前树结点的根节点,标记递归构建异常数据业务查询树;将异常数据某一节点上分配的多个异常数据查询请求,重新分配给异常数据某一计算节点并备份,以使得所述某一计算节点和所述备份计算节点中的每一个仅被分配一个子查询;
通过结点树方式进行异常数据的查询过程,起到初步判定异常数据的作用,如果进一步进行数据提取还需要将数据进行深层次挖掘。
所述S2包括:
S2-1,经过查询校验之后,对异常数据划分判断区间,计算异常数据相似度,从而生成判断区间,将异常数据通过比例缩放计算进行标准化处理,异常大量资金转入快速分散转出的交易数据ui的转换值为u′i,异常大量分散资金转入快速集中转出的交易数据vi的转换值为v′i,异常时间点交易数据xi的转换值为x′i、异常相同数额交易数据yi的转换值为y′i、异常超限额交易数据zi的转换值为z′k
将转换后的交易异常数据与时间和日期变量一起代入判断模型,在统计的任一时间和日期内计算异常数据的判断值:
Figure GDA0003616986270000071
其中,B(t,d)为异常数据在任一时间t和日期d的判断值;f(u′i;t,d)为一个异常大量资金转入快速分散转出的交易数据的时间和日期的判断值;f(v′i;t,d)为一个异常大量分散资金转入快速集中转出的交易数据的时间和日期的判断值;f(x′i;t,d)为一个异常时间点交易数据的时间和日期的判断值;f(y′i;t,d)为一个异常相同数额交易数据的时间和日期的判断值;f(z′i;t,d)为一个异常超限额交易数据的判断值;i最大为60是为了保证一分钟内每一秒的异常数据都进行实时监控判断;
S2-2,计算每一个异常数据在时间和日期上的实际和判断值的差值,通过残差平方和对离散的异常数据进行线性曲线拟合过程,从而对异常数据的风险趋势进行判断,
Figure GDA0003616986270000081
其中,W为每个异常数据的残差平方和;B0(t,d)为每个异常数据在该时间和日期的实际值;B(t,d)为每个异常数据在该时间和日期的判断值;M为统计的时间最大的时刻或者日期的最多天数;
S2-3,然后计算异常数据的偏离度
Figure GDA0003616986270000082
其中,F为计算常数,通过调节系数λ进行调节,由于W增大,故取的计算常数F较大;通过增加异常数据准确获取值Hj,对全部N个异常数据准确获取值累加之后进行特征值e的偏离收敛,β为特征阈值。
所述S3包括:
S3-1,异常数据偏离度分析后,通过先验概率分布在异常数据中进行统计信息计算;计算异常数据先验条件概率分布,设置第一异常数据集合C与第二异常数据集合E的内部属性,其中第一异常数据集合包括ui和vi,第二异常数据集合包括xi、yi和zi,通过定义异常数据的时间类属性G和日期类属性I,在概率分布条件下分别计算条件概率
Figure GDA0003616986270000083
Figure GDA0003616986270000084
计算得到:
Figure GDA0003616986270000085
继续推导得到,
Figure GDA0003616986270000086
其中
Figure GDA0003616986270000087
表示第一异常数据集合
Figure GDA0003616986270000088
和时间类属性G和日期类属性I联合概率分布,遍历第一异常数据集合
Figure GDA0003616986270000089
和时间类属性G的全部值得到其条件概率分布
Figure GDA00036169862700000810
以及第一异常数据集合
Figure GDA00036169862700000811
和日期类属性I的全部值得到其条件概率分布
Figure GDA00036169862700000812
时间类属性条件概率Q(G),日期类属性条件概率Q(I);
然后计算:
Figure GDA0003616986270000091
继续推导得到,
Figure GDA0003616986270000092
其中
Figure GDA0003616986270000093
表示第二异常数据集合
Figure GDA0003616986270000094
和时间类属性G和日期类属性I联合概率分布,遍历第二异常数据集合
Figure GDA0003616986270000095
和时间类属性G的全部值得到其条件概率分布
Figure GDA0003616986270000096
以及第二异常数据集合
Figure GDA0003616986270000097
和日期类属性I的全部值得到其条件概率分布
Figure GDA0003616986270000098
S3-2,第一异常数据集合C中每个异常数据节点与第二异常数据集合E中每个异常数据节点时间属性和日期属性的条件信息联合概率分布值如下;
Figure GDA0003616986270000099
选取异常数据的类属性J放入大数据平台中;将第一异常数据集合C中和第二异常数据集合E的内部属性以类属性J为父节点,构造朴素贝叶斯网络;
S3-3,将第一异常数据集合C中和第二异常数据集合E中的节点逐个放入贝叶斯网络中;若第一异常数据集合C中
Figure GDA00036169862700000910
则将
Figure GDA00036169862700000911
放入网络作为其父节点;若第二异常数据集合E中
Figure GDA00036169862700000912
则将
Figure GDA00036169862700000913
放入网络作为其父节点;从而得到用于异常数据等级筛选排序的贝叶斯网络;
S3-4,计算类属性J的概率质量函数
Figure GDA00036169862700000914
得到异常数据中属性值最突出的概率分布;
Figure GDA00036169862700000915
其中
Figure GDA00036169862700000916
表示J关联的所有第一异常数据集合C中和第二异常数据集合E节点的条件概率的乘积;由大数据平台对财务异常数据根据概率分布的情况,向贝叶斯网络中第一异常数据集合C中和第二异常数据集合E的各个属性节点赋值;轮流将异常数据的基本属性代入贝叶斯网络中通过概率质量函数;按照计算数值从大到小的顺序对异常数据排列。
所述S4包括:
S4-1,结合风险度权重计算,对异常大量资金转入快速分散转出的交易数据ui进行计算:
Figure GDA0003616986270000101
其中,Ttotal为总基准时间;
Figure GDA0003616986270000102
为异常大量资金转入快速分散转出的交易数据权重的动态变化分量;Vtotal为总基准日期,U为交易数据检测时刻分量;K为交易数据检测日期分量;
S4-2,对异常大量分散资金转入快速集中转出的交易数据vi计算风险度权重,
Figure GDA0003616986270000103
其中,
Figure GDA0003616986270000104
为异常大量分散资金转入快速集中转出的交易数据vi权重的动态变化分量;
S4-3,对异常时间点交易数据xi计算风险度权重,
Figure GDA0003616986270000105
其中,
Figure GDA0003616986270000106
为异常时间点交易数据xi的动态变化分量;
S4-4,对异常相同数额交易数据yi计算风险度权重,
Figure GDA0003616986270000107
其中,
Figure GDA0003616986270000108
为异常相同数额交易数据yi的动态变化分量;
S4-5,对异常超限额交易数据zi计算风险度权重,
Figure GDA0003616986270000111
S4-6,综合风险判断模型的定义:
Figure GDA0003616986270000112
其中,
Figure GDA0003616986270000113
为异常大量资金转入快速分散转出的交易数据预测值;
Figure GDA0003616986270000114
为异常大量资金转入快速分散转出的交易数据的判断阈值,
Figure GDA0003616986270000115
为异常大量分散资金转入快速集中转出的交易数据预测值;
Figure GDA0003616986270000116
为异常大量分散资金转入快速集中转出的交易数据的判断阈值,
Figure GDA0003616986270000117
为异常时间点交易数据预测值;
Figure GDA0003616986270000118
为异常时间点交易数据的判断阈值,
Figure GDA0003616986270000119
为异常相同数额交易数据预测值;
Figure GDA00036169862700001110
为异常相同数额交易数据的判断阈值,
Figure GDA00036169862700001111
为异常超限额交易数据预测值;
Figure GDA00036169862700001112
为异常超限额交易数据的判断阈值,ε为判断校正系数。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (5)

1.一种通过云平台进行财务数据行为筛选工作方法,其特征在于,包括:
S1,在实时查询校验提取后,设置异常数据的判断区间,在判断区间之中形成标准化数据;
S2,对标准化数据进行偏离度分析,分析之后通过筛选模型对异常数据进行筛选操作,并对筛选之后的异常数据进行特征评分;
所述S2包括:
S2-1,异常数据偏离度分析后,通过先验概率分布在异常数据中进行统计信息计算;计算异常数据先验条件概率分布,设置第一异常数据集合C与第二异常数据集合E的内部属性,其中第一异常数据集合包括ui和vi,第二异常数据集合包括xi、yi和zi,通过定义异常数据的时间类属性G和日期类属性I,在概率分布条件下分别计算条件概率
Figure FDA0003616986260000011
Figure FDA0003616986260000012
计算得到:
Figure FDA0003616986260000013
继续推导得到,
Figure FDA0003616986260000014
其中
Figure FDA0003616986260000015
表示第一异常数据集合
Figure FDA0003616986260000016
和时间类属性G和日期类属性I联合概率分布,遍历第一异常数据集合
Figure FDA0003616986260000017
和时间类属性G的全部值得到其条件概率分布
Figure FDA0003616986260000018
以及第一异常数据集合
Figure FDA0003616986260000019
和日期类属性I的全部值得到其条件概率分布
Figure FDA00036169862600000110
时间类属性条件概率Q(G),日期类属性条件概率Q(I);
然后计算:
Figure FDA00036169862600000111
继续推导得到,
Figure FDA0003616986260000021
其中
Figure FDA0003616986260000022
表示第二异常数据集合
Figure FDA0003616986260000023
和时间类属性G和日期类属性I联合概率分布,遍历第二异常数据集合
Figure FDA0003616986260000024
和时间类属性G的全部值得到其条件概率分布
Figure FDA0003616986260000025
以及第二异常数据集合
Figure FDA0003616986260000026
和日期类属性I的全部值得到其条件概率分布
Figure FDA0003616986260000027
S2-2,第一异常数据集合C中每个异常数据节点与第二异常数据集合E中每个异常数据节点时间属性和日期属性的条件信息联合概率分布值如下;
Figure FDA0003616986260000028
选取异常数据的类属性J放入大数据平台中;将第一异常数据集合C中和第二异常数据集合E的内部属性以类属性J为父节点,构造朴素贝叶斯网络;
S2-3,将第一异常数据集合C中和第二异常数据集合E中的节点逐个放入贝叶斯网络中;若第一异常数据集合C中
Figure FDA0003616986260000029
则将
Figure FDA00036169862600000210
放入网络作为其父节点;若第二异常数据集合E中
Figure FDA00036169862600000211
则将
Figure FDA00036169862600000212
放入网络作为其父节点;从而得到用于异常数据等级筛选排序的贝叶斯网络。
2.根据权利要求1所述的通过云平台进行财务数据行为筛选工作方法,其特征在于,所述S1包括:
S1-1,对异常数据划分判断区间,计算异常数据相似度,从而生成判断区间,将异常数据通过比例缩放计算进行标准化处理,异常大量资金转入快速分散转出的交易数据ui的转换值为u′i,异常大量分散资金转入快速集中转出的交易数据vi的转换值为v′i,异常时间点交易数据xi的转换值为x′i、异常相同数额交易数据yi的转换值为y′i、异常超限额交易数据zi的转换值为z′k
将转换后的交易异常数据与时间和日期变量一起代入判断模型,在统计的任一时间和日期内计算异常数据的判断值:
Figure FDA0003616986260000031
其中,B(t,d)为异常数据在任一时间t和日期d的判断值;f(u′i;t,d)为一个异常大量资金转入快速分散转出的交易数据的时间和日期的判断值;f(v′i;t,d)为一个异常大量分散资金转入快速集中转出的交易数据的时间和日期的判断值;f(x′i;t,d)为一个异常时间点交易数据的时间和日期的判断值;f(y′i;t,d)为一个异常相同数额交易数据的时间和日期的判断值;f(z′i;t,d)为一个异常超限额交易数据的判断值;i最大为60是为了保证一分钟内每一秒的异常数据都进行实时监控判断。
3.根据权利要求1所述的通过云平台进行财务数据行为筛选工作方法,其特征在于,所述S1包括:
S1-2,计算每一个异常数据在时间和日期上的实际和判断值的差值,通过残差平方和对离散的异常数据进行线性曲线拟合过程,从而对异常数据的风险趋势进行判断,
Figure FDA0003616986260000032
其中,W为每个异常数据的残差平方和;B0(t,d)为每个异常数据在该时间和日期的实际值;B(t,d)为每个异常数据在该时间和日期的判断值;M为统计的时间最大的时刻或者日期的最多天数。
4.根据权利要求1所述的通过云平台进行财务数据行为筛选工作方法,其特征在于,所述S1还包括:
S1-3,然后计算异常数据的偏离度
Figure FDA0003616986260000033
其中,F为计算常数,通过调节系数λ进行调节,由于W增大,故取的计算常数F较大;通过增加异常数据准确获取值Hj,对全部N个异常数据准确获取值累加之后进行特征值e的偏离收敛,β为特征阈值。
5.根据权利要求1所述的通过云平台进行财务数据行为筛选工作方法,其特征在于,所述S2包括:
S2-4,计算类属性J的概率质量函数
Figure FDA0003616986260000041
得到异常数据中属性值最突出的概率分布;
Figure FDA0003616986260000042
其中
Figure FDA0003616986260000043
表示J关联的所有第一异常数据集合C中和第二异常数据集合E节点的条件概率的乘积;由大数据平台对财务异常数据根据概率分布的情况,向贝叶斯网络中第一异常数据集合C中和第二异常数据集合E的各个属性节点赋值;轮流将异常数据的基本属性代入贝叶斯网络中通过概率质量函数;按照计算数值从大到小的顺序对异常数据排列。
CN202011360633.5A 2020-11-27 2020-11-27 通过云平台进行财务数据行为筛选工作方法 Active CN112463853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011360633.5A CN112463853B (zh) 2020-11-27 2020-11-27 通过云平台进行财务数据行为筛选工作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011360633.5A CN112463853B (zh) 2020-11-27 2020-11-27 通过云平台进行财务数据行为筛选工作方法

Publications (2)

Publication Number Publication Date
CN112463853A CN112463853A (zh) 2021-03-09
CN112463853B true CN112463853B (zh) 2022-06-17

Family

ID=74808059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011360633.5A Active CN112463853B (zh) 2020-11-27 2020-11-27 通过云平台进行财务数据行为筛选工作方法

Country Status (1)

Country Link
CN (1) CN112463853B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216478B (zh) * 2023-09-12 2024-04-30 杭州融易算智能科技有限公司 一种财务数据批量处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102203724A (zh) * 2008-06-12 2011-09-28 加迪安分析有限公司 用于欺诈检测和分析的用户建模
JP2015174256A (ja) * 2014-03-14 2015-10-05 富士ゼロックス株式会社 障害予測システム、障害予測装置およびプログラム
CN105095482A (zh) * 2015-08-13 2015-11-25 浪潮(北京)电子信息产业有限公司 一种检测异常数据区间的数据挖掘方法及系统
CN106469353A (zh) * 2016-09-08 2017-03-01 璧垫兜 一种面向大数据的项目合作企业智慧筛选排序方法
CN109298704A (zh) * 2018-08-31 2019-02-01 江苏方天电力技术有限公司 一种基于贝叶斯网络的工业故障路径追溯方法及系统
CN109697455A (zh) * 2018-11-14 2019-04-30 清华大学 配网开关设备的故障诊断方法及装置
CN111680875A (zh) * 2020-05-06 2020-09-18 北京航空航天大学 基于概率基线模型的无人机状态风险模糊综合评价方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9349103B2 (en) * 2012-01-09 2016-05-24 DecisionQ Corporation Application of machine learned Bayesian networks to detection of anomalies in complex systems

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102203724A (zh) * 2008-06-12 2011-09-28 加迪安分析有限公司 用于欺诈检测和分析的用户建模
JP2015174256A (ja) * 2014-03-14 2015-10-05 富士ゼロックス株式会社 障害予測システム、障害予測装置およびプログラム
CN105095482A (zh) * 2015-08-13 2015-11-25 浪潮(北京)电子信息产业有限公司 一种检测异常数据区间的数据挖掘方法及系统
CN106469353A (zh) * 2016-09-08 2017-03-01 璧垫兜 一种面向大数据的项目合作企业智慧筛选排序方法
CN109298704A (zh) * 2018-08-31 2019-02-01 江苏方天电力技术有限公司 一种基于贝叶斯网络的工业故障路径追溯方法及系统
CN109697455A (zh) * 2018-11-14 2019-04-30 清华大学 配网开关设备的故障诊断方法及装置
CN111680875A (zh) * 2020-05-06 2020-09-18 北京航空航天大学 基于概率基线模型的无人机状态风险模糊综合评价方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Dynamic risk analysis using alarm databases to improve process safety and product quality: Part II—Bayesian analysis;Ankur Pariyani等;《AIChE》;20200330;第58卷(第3期);826-841页 *
基于BN的建筑施工项目隐性质量成本控制研究;邵必林等;《 西安建筑科技大学学报(自然科学版) 》;20170628;第49卷(第3期);317-321页 *
基于贝叶斯检验方法的股票定价模型比较分析——来自中国上市公司的数据证据;任燕燕等;《数理统计与管理》;20200401;第39卷(第3期);531-543页 *

Also Published As

Publication number Publication date
CN112463853A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN112102111B (zh) 一种发电厂数据智能处理系统
CN112445844B (zh) 大数据平台财务数据管理控制系统
WO2021184630A1 (zh) 基于知识图谱定位排污对象的方法及相关设备
CN111815132B (zh) 一种电力监控系统网络安全管理信息发布方法及系统
CN111737101B (zh) 基于大数据的用户行为监测方法、装置、设备及介质
CN109255523B (zh) 基于kks编码规则和大数据架构的分析指标计算平台
CN111506478A (zh) 基于人工智能实现告警管理控制的方法
CN111162949A (zh) 一种基于Java字节码嵌入技术的接口监测方法
CN112540811B (zh) 缓存数据的检测方法、装置、计算机设备和存储介质
CN112487053B (zh) 海量财务数据异常控制提取工作方法
CN108074022A (zh) 一种基于集中运维的硬件资源分析与评估方法
US11842301B1 (en) Methods for monitoring distributed energy storage safety and internet of things systems thereof
CN115409395B (zh) 一种水利施工工程的质量验收检查方法及系统
CN112016828A (zh) 基于流式大数据的工业设备健康管理云平台架构
CN117172556B (zh) 一种桥梁工程的施工风险预警方法与系统
CN112463853B (zh) 通过云平台进行财务数据行为筛选工作方法
CN115733762A (zh) 具有大数据分析能力的监控系统
CN109241190A (zh) 电力大数据混合计算架构
CN111934865A (zh) 一种基于熵值法的量子通信网络运行指标的评估方法
CN110928864A (zh) 一种科研项目管理方法及系统
CN113111095B (zh) 一种智能化信息管理方法及系统
CN112288317B (zh) 一种基于多源异构数据治理的工业大数据分析平台和方法
CN112085412B (zh) 一种资源优化分配系统及分配方法
CN114819367A (zh) 一种基于工业互联网的公共服务平台
CN113486115A (zh) 一种基于大数据的人才信息管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240322

Address after: Room 1302, Building E, Zhongchu Plaza, No. 198 Zhonghua North Street, Dongjiao Street, Xinhua District, Shijiazhuang City, Hebei Province, 050000

Patentee after: Caishu (Shijiazhuang) Network Technology Co.,Ltd.

Country or region after: China

Address before: 401331 No. 82 Middle Road, University Town, Shapingba District, Chongqing

Patentee before: CHONGQING MEDICAL AND PHARMACEUTICAL College

Country or region before: China