CN112036754A - 基于区块链的金融大数据风控平台 - Google Patents
基于区块链的金融大数据风控平台 Download PDFInfo
- Publication number
- CN112036754A CN112036754A CN202010909416.0A CN202010909416A CN112036754A CN 112036754 A CN112036754 A CN 112036754A CN 202010909416 A CN202010909416 A CN 202010909416A CN 112036754 A CN112036754 A CN 112036754A
- Authority
- CN
- China
- Prior art keywords
- financial data
- data
- class
- representing
- financial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/56—Financial cryptography, e.g. electronic payment or e-cash
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/50—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
Abstract
一种基于区块链的金融大数据风控平台,包括金融数据获取模块、金融数据检测模块、金融数据传输模块和区块链存储模块,所述金融数据获取模块用于收集金融数据,所述金融数据检测模块用于对收集的金融数据进行聚类,并判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,将判断为可疑数据的类中的金融数据舍弃,将判断为安全数据的类中的金融数据通过金融数据传输模块传输至区块链存储模块进行存储。本发明用于在区块链即将产生分叉前对挖矿成功的区块链节点进行检测和筛选,最终只允许唯一区块接入主链,从而能够有效的避免了分叉的产生,保证了区块链中数据的一致性并进一步维护了区块链的健壮性。
Description
技术领域
本发明创造涉及金融安全领域,具体涉及一种基于区块链的金融大数据风控平台。
背景技术
比特币出现之后,对金融领域带来了巨大的影响,比特币的底层技术区块链技术由于去中心化,不可篡改,去信任,集体维护等特点也受到了广泛的关注。将区块链技术和金融领域的结合是目前受到区块链研究者最多关注的方向之一,通过区块链技术的去中心化,不可篡改以及可追踪等特点能够有效的提高金融数据存储的安全性。
然而,在金融数据的获取过程中并不能保证获取的金融数据的安全性,当获取的金融数据中存在恶意数据并且这些恶意数据存入了区块链中时,将对区块链的安全性造成不可估量的危害。
发明内容
针对上述问题,本发明旨在提供一种基于区块链的金融大数据风控平台。
本发明创造的目的通过以下技术方案实现:
一种基于区块链的金融大数据风控平台,包括金融数据获取模块、金融数据检测模块、金融数据传输模块和区块链存储模块,所述金融数据获取模块用于收集金融数据,并将收集的金融数据输入到金融数据检测模块,所述金融数据检测模块用于对接收到的金融数据进行聚类,并判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,将判断为可疑数据的类中的金融数据舍弃,将判断为安全数据的类中的金融数据通过金融数据传输模块传输至区块链存储模块进行存储;所述金融数据检测模块包括金融数据分类单元和金融数据判断单元,所述金融数据分类单元用于对接收到的金融数据进行聚类,将金融数据分类单元接收到的待分类的金融数据表示为集合X,且X={xi,i=1,2,...,N},其中,xi表示集合X中的第i个金融数据,N表示金融数据集合X中的金融数据量,所述金融数据分类单元采用FCM算法将金融数据集合X中的金融数据进行分类,设C表示金融数据集合X划分的类别集合,且C={cj,j=1,2,...,c},其中,cj表示类别集合C中的第j个类,c表示类别集合C中的类别数,所述FCM算法采用聚类有效性指标Y(c)确定将金融数据集合X划分的类别数c,Y(c)的表达式为:
式中,设cl表示类别集合C中的第l个类,vl表示类cl的聚类中心,vj表示类cj的聚类中心,表示类别集合C中类的聚类中心的均值,且uij表示金融数据xi隶属于类cj的隶属度,Oijl表示金融数据xi在类cj和类cl之间的重叠度,且 其中,uil表示金融数据xi隶属于类cl的隶属度,u00表示重叠度阈值,β(cj)表示类cj对应的紧密性的修正因子,且β(cj)的值采用下列方式确定:
设类其中,表示类cj中的第k个金融数据,N(cj)表示类cj中的金融数据量,对类cj中的金融数据进行筛选,设表示金融数据隶属于类cj的隶属度,表示金融数据隶属于类别集合C中类的第二大隶属度,当时,则将类cj中的金融数据标记为1,当时,则将类cj中的金融数据标记为0;
式中,表示集合M(cj,1)中的第r个金融数据,xe表示金融数据集合X中的第e个金融数据,xa表示金融数据集合X中的第a个金融数据;所述金融数据判断单元用于判断聚类所得的各个类中的金融数据是安全数据还是可疑数据。
式中,d(c)表示给定的截断距离,ρ(xi)表示金融数据xi对应的密度调节系数,且ρ(xi)的值采用下列方式确定:
设L(xi)表示金融数据xi的局部邻域数据集合,给定正整数M,且0<M<N,将金融数据集合X中的金融数据按其和金融数据xi之间距离的绝对值由小到大进行排序组成序列l(xi),选取序列l(xi)中的前2M个金融数据加入到集合L(xi)中,设L(xi)={xit,t=1,2,...,2M},其中,xit表示集合L(xi)中的第t个金融数据;将集合L(xi)中的金融数据按其和金融数据xi之间距离的绝对值由小到大进行排序组成序列l′(xi),设ηit(xi)表示金融数据xit在序列l′(xi)中的排序;设L(xit)表示金融数据xit的局部邻域数据集合,将金融数据集合X中的金融数据按其和金融数据xit之间距离的绝对值由小到大进行排序组成序列l(xit),选取序列l(xit)中的前2M个金融数据加入到集合L(xit)中,设L(xit)={xitb,b=1,2,...,2M},其中,xitb表示集合L(xit)中的第b个金融数据;将集合L(xit)中的金融数据按其和金融数据xit之间的距离的绝对值由小到大进行排序,组成序列l′(xit),设ηi(xit)表示金融数据xi在序列l′(xit)中的排序,当min{ηit(xi),ηi(xit)}<M时,则将金融数据xit标记为金融数据xi的参考数据;
设U(xi)表示金融数据xi的参考数据集合,且U(xi)={xif,f=1,2,...,N(xi,U)},则ρ(xi)的值为:
式中,xif表示集合U(xi)中的第f个参考数据,N(xi,U)表示集合U(xi)中的参考数据量。
优选地,设V表示在金融数据集合X中选取的聚类中心集合,根据金融数据集合X中各金融数据成为聚类中心的概率值选取聚类中心,并将选取的聚类中心加入到集合V中,具体包括:
Step1:在金融数据集合X中选取具有最大概率值的金融数据为第一个聚类中心v1,并将选取的聚类中心v1加入到聚类中心集合V中;
Step2:在金融数据集合X中选取剩余的聚类中心,设xg表示金融数据集合X中第g个金融数据,定义Y(xg)表示金融数据xg成为聚类中心的权值,且Y(xg)的表达式为:
式中,γ(xg)表示金融数据xg对应的取值函数,当xg∈V时,则γ(xg)=0,当时,则γ(xg)=1,vα表示聚类中心集合V中的第α个聚类中心,N(V)表示此时聚类中心集合V中的聚类中心数,表示金融数据xg成为聚类中心的概率值;
在金融数据集合X中选取具有最大权值的金融数据为聚类中心,并将其加入到集合V中;
Step3:继续采用Step2中的方法在金融数据集合X中选取聚类中心,直到选取的聚类中心的个数等于c时停止选取聚类中心。
优选地,区块链存储模块中设置有节点检测单元,所述节点检测单元用于监测区块链节点的挖矿结果,当监测到只有一个区块链节点挖矿成功,则该区块链节点获得记账权并赚取挖矿酬金,当监测到有多个区块链节点挖矿成功时,对挖矿成功的区块链节点进行筛选,设qz表示当前挖矿成功的第z个区块链节点,且z=1,2,...,w,其中,w表示监测到的当前挖矿成功的区块链节点数,定义t(qz)表示区块链节点qz挖矿产生区块的时间,当时,则选取区块链节点qv获得记账权并赚取挖矿酬金,并将区块链节点qv产生的区块接入主链。
本发明创造的有益效果:为了保证在将收集的金融数据存入区块链存储模块之前的安全性,设置了金融数据检测模块,所述金融数据检测模块通过对接收到的金融数据进行聚类,并判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,保证了这些金融数据在进入区块链存储模块时的安全性;所述金融数据检测模块采用FCM算法对接收到的金融数据进行聚类,提出了一种新的FCM算法的聚类有效性指标,所述聚类有效性指标同时考虑当前类别集合中类的紧密型、分离性和重叠度,选取使得聚类有效性指标最小时对应的类别数即为要确定的最优类别数,传统的聚类有效性指标在衡量类的紧密性的时候,没有考虑到不同的类间尺寸对类的紧密性的影响,针对上述问题,本优选实施例在聚类有效性指标中引入了紧密性的修正因子对待检测类的紧密性进行修正,所述修正因子能够有效的消除类间不同尺寸对类的紧密性的影响,使得不同尺寸的类能够拥有相近的紧密性值,所述待检测类的紧密性的修正因子的值根据待检测类中的金融数据进行确定,为了使得修正因子的值能够准确的衡量待检测类的尺寸,本优选实施例对待检测类中的金融数据进行筛选和标记,将待检测类中满足的金融数据标记为1,所述标记为1的金融数据为聚类结果较为明确的金融数据,即其具有较大的概率属于待检测类,从而根据待检测类中标记为1的金融数据确定的修正因子值能够准确的衡量待检测类的尺寸,实现了根据待检测类的尺寸对待检测类的紧密性进行自适应的调整,从而消除了类间不同尺寸对类的紧密性的影响,使得根据聚类有效性指标确定的最优类别数更加的符合待分类的金融数据的分布特性;在金融数据集合中选取聚类中心的过程中,定义的概率值的计算公式中的指数函数部分通过衡量各金融数据的局部密度来确定所述金融数据是否成为聚类中心,当类间密度不同时,如果仅仅通过衡量金融数据的局部密度来选取聚类中心,容易造成不能有效的选取密度较小的类的聚类中心,从而影响聚类结果的准确性,针对上述情况,本优选实施例在所述概率值的计算公式中引入了密度调节系数,所述密度调节系数用于通过衡量所述金融数据和距离其最近的参考数据之间的分布情况对所述金融数据的局部密度进行调节,在选取所述金融数据的参考数据时,为了适应类间不同的密度情况,本优选实施例通过计算所述金融数据和参考数据之间距离的排序确定所述金融数据的参考数据,当所述参考数据为金融数据集合中距离所述金融数据较近的一个金融数据,并且所述金融数据也为金融数据集合中距离所述参考数据较近的一个金融数据时,则表明所述金融数据和所述参考数据互为较为接近的数据,即所述金融数据和所述参考数据具有较大概率属于同一个类,所述密度调节系数通过衡量所述金融数据和其参考数据之间的分布情况能够有效的判断所述金融数据所处类的密度情况,当所述金融数据和其参考数据之间的距离较大时,表明所述金融数据所处类的密度较小,此时密度调节系数的较大,即提高密度较小的类中的金融数据被选取为聚类中心的概率,即采用密度调节系数对所述金融数据的概率值中的指数函数部分进行调节,使得定义的金融数据成为聚类中心的概率值能够适应类间不同密度的情况,从而提高了聚类中心选取的准确性;选取金融数据集合X中具有最大概率值的金融数据为第一个聚类中心,即选取金融数据集合X中具有较大局部密度的金融数据为第一个聚类中心,在接下来的聚类中心的选取过程中引入了所述金融数据和已选取的聚类中心之间的距离因素,使得选取的聚类中心之间具有较大的距离,从而使得选取的聚类中心在金融数据集合X中分布的较为全面;此外,在区块链存储模块中设置有节点检测单元用于在区块链即将产生分叉前对挖矿成功的区块链节点进行检测和筛选,最终只允许唯一区块接入主链,从而能够有效的避免了分叉的产生,保证了区块链中数据的一致性并进一步维护了区块链的健壮性。
附图说明
利用附图对发明创造作进一步说明,但附图中的实施例不构成对本发明创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明结构示意图。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1,本实施例的一种基于区块链的金融大数据风控平台,包括金融数据获取模块、金融数据检测模块、金融数据传输模块和区块链存储模块,所述金融数据获取模块用于收集金融数据,并将收集到的金融数据输入到金融数据检测模块,所述金融数据检测模块用于对接收到的金融数据进行聚类,并判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,将判断为可疑数据的类中的金融数据舍弃,将判断为安全数据的类中的金融数据通过金融数据传输模块传输至区块链存储模块进行存储;所述金融数据检测模块包括金融数据分类单元和金融数据判断单元,所述金融数据分类单元用于对接收到的金融数据进行聚类,将金融数据分类单元接收到的待分类的金融数据表示为集合X,且X={xi,i=1,2,...,N},其中,xi表示集合X中的第i个金融数据,N表示金融数据集合X中的金融数据量,所述金融数据分类单元采用FCM算法将金融数据集合X中的金融数据进行分类,设C表示金融数据集合X划分的类别集合,且C={cj,j=1,2,...,c},其中,cj表示类别集合C中的第j个类,c表示类别集合C中的类别数,所述FCM算法采用聚类有效性指标Y(c)确定将金融数据集合X划分的类别数c,Y(c)的表达式为:
式中,设cl表示类别集合C中的第l个类,vl表示类cl的聚类中心,vj表示类cj的聚类中心,表示类别集合C中类的聚类中心的均值,且uij表示金融数据xi隶属于类cj的隶属度,Oijl表示金融数据xi在类cj和类cl之间的重叠度,且 其中,uil表示金融数据xi隶属于类cl的隶属度,u00表示重叠度阈值,β(cj)表示类cj对应的紧密性的修正因子,且β(cj)的值采用下列方式确定:
设类其中,表示类cj中的第k个金融数据,N(cj)表示类cj中的金融数据量,对类cj中的金融数据进行筛选,设表示金融数据隶属于类cj的隶属度,表示金融数据隶属于类别集合C中类的第二大隶属度,当时,则将类cj中的金融数据标记为1,当时,则将类cj中的金融数据标记为0;
式中,表示集合M(cj,1)中的第r个金融数据,xe表示金融数据集合X中的第e个金融数据,xa表示金融数据集合X中的第a个金融数据;所述金融数据判断单元用于判断聚类所得的各个类中的金融数据是安全数据还是可疑数据。
优选地,所述金融数据判断单元用于判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,具体为:
设θ(cj)表示类cj对应的金融数据的密度,且给定密度阈值T(c),且 当θ(cj)≥T(c)时,则判断类cj中的金融数据为安全数据,当θ(cj)<T(c)时,则判断类cj中的金融数据为可疑数据,其中,θ(min)为类别集合C中类对应的金融数据的密度的最小值,θ(mid)为类别集合C中类对应的金融数据的密度的中值,N(cj)表示类cj中的金融数据量,N表示金融数据集合X中的金融数据量。
本优选实施例为了保证在将收集的金融数据存入区块链存储模块之前的安全性,设置了金融数据检测模块,所述金融数据检测模块通过对接收到的金融数据进行聚类,并判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,保证了这些金融数据在进入区块链存储模块时的安全性;提出了一种新的FCM算法的聚类有效性指标,所述聚类有效性指标同时考虑当前类别集合中类的紧密型、分离性和重叠度,选取使得聚类有效性指标最小时对应的类别数即为要确定的最优类别数,传统的聚类有效性指标在衡量类的紧密性的时候,没有考虑到不同的类间尺寸对类的紧密性的影响,针对上述问题,本优选实施例在聚类有效性指标中引入了紧密性的修正因子对待检测类的紧密性进行修正,所述修正因子能够有效的消除类间不同尺寸对类的紧密性的影响,使得不同尺寸的类能够拥有相近的紧密性值,所述待检测类的紧密性的修正因子的值根据待检测类中的金融数据进行确定,为了使得修正因子的值能够准确的衡量待检测类的尺寸,本优选实施例对待检测类中的金融数据进行筛选和标记,将待检测类中满足的金融数据标记为1,所述标记为1的金融数据为聚类结果较为明确的金融数据,即其具有较大的概率属于待检测类,从而根据待检测类中标记为1的金融数据确定的修正因子值能够准确的衡量待检测类的尺寸,实现了根据待检测类的尺寸对待检测类的紧密性进行自适应的调整,从而消除了类间不同尺寸对类的紧密性的影响,使得根据聚类有效性指标确定的最优类别数更加的符合待分类的金融数据的分布特性。
式中,d(c)表示给定的截断距离,ρ(xi)表示金融数据xi对应的密度调节系数,且ρ(xi)的值采用下列方式确定:
设L(xi)表示金融数据xi的局部邻域数据集合,给定正整数M,且0<M<N,可以令M=5,将金融数据集合X中的金融数据按其和金融数据xi之间距离的绝对值由小到大进行排序组成序列l(xi,)选取序列l(xi)中的前2M个金融数据加入到集合L(xi)中,设L(xi)={xit,t=1,2,...,2M},其中,xit表示集合L(xi)中的第t个金融数据;将集合L(xi)中的金融数据按其和金融数据xi之间距离的绝对值由小到大进行排序组成序列l′(xi),设ηit(xi)表示金融数据xit在序列l′(xi)中的排序;设L(xit)表示金融数据xit的局部邻域数据集合,将金融数据集合X中的金融数据按其和金融数据xit之间距离的绝对值由小到大进行排序组成序列l(xit),选取序列l(xit)中的前2M个金融数据加入到集合L(xit)中,设L(xit)={xitb,b=1,2,...,2M},其中,xitb表示集合L(xit)中的第b个金融数据;将集合L(xit)中的金融数据按其和金融数据xit之间的距离的绝对值由小到大进行排序,组成序列l′(xit),设ηi(xit)表示金融数据xi在序列l′(xit)中的排序,当min{ηit(xi),ηi(xit)}<M时,则将金融数据xit标记为金融数据xi的参考数据;
设U(xi)表示金融数据xi的参考数据集合,且U(xi)={xif,f=1,2,...,N(xi,U)},则ρ(xi)的值为:
式中,xif表示集合U(xi)中的第f个参考数据,N(xi,U)表示集合U(xi)中的参考数据量。
本优选实施例用于在金融数据集合中选取聚类中心,在选取聚类中心的过程中,定义的概率值的计算公式中的指数函数部分通过衡量各金融数据的局部密度来确定所述金融数据是否成为聚类中心,当类间密度不同时,如果仅仅通过衡量金融数据的局部密度来选取聚类中心,容易造成不能有效的选取密度较小的类的聚类中心,从而影响聚类结果的准确性,针对上述情况,本优选实施例在所述概率值的计算公式中引入了密度调节系数,所述密度调节系数用于通过衡量所述金融数据和距离其最近的参考数据之间的分布情况对所述金融数据的局部密度进行调节,在选取所述金融数据的参考数据时,为了适应类间不同的密度情况,本优选实施例通过计算所述金融数据和参考数据之间距离的排序确定所述金融数据的参考数据,当所述参考数据为金融数据集合中距离所述金融数据较近的一个金融数据,并且所述金融数据也为金融数据集合中距离所述参考数据较近的一个金融数据时,则表明所述金融数据和所述参考数据互为较为接近的数据,即所述金融数据和所述参考数据具有较大概率属于同一个类,所述密度调节系数通过衡量所述金融数据和其参考数据之间的分布情况能够有效的判断所述金融数据所处类的密度情况,当所述金融数据和其参考数据之间的距离较大时,表明所述金融数据所处类的密度较小,此时密度调节系数的较大,即提高密度较小的类中的金融数据被选取为聚类中心的概率,即采用密度调节系数对所述金融数据的概率值中的指数函数部分进行调节,使得定义的金融数据成为聚类中心的概率值能够适应类间不同密度的情况,从而提高了聚类中心选取的准确性。
优选地,设V表示在金融数据集合X中选取的聚类中心集合,根据金融数据集合X中各金融数据成为聚类中心的概率值选取聚类中心,并将选取的聚类中心加入到集合V中,具体包括:
Step1:在金融数据集合X中选取具有最大概率值的金融数据为第一个聚类中心v1,并将选取的聚类中心v1加入到聚类中心集合V中;
Step2:在金融数据集合X中选取剩余的聚类中心,设xg表示金融数据集合X中第g个金融数据,定义Y(xg)表示金融数据xg成为聚类中心的权值,且Y(xg)的表达式为:
式中,γ(xg)表示金融数据xg对应的取值函数,当xg∈V时,则γ(xg)=0,当时,则γ(xg)=1,vα表示聚类中心集合V中的第α个聚类中心,N(V)表示此时聚类中心集合V中的聚类中心数,表示金融数据xg成为聚类中心的概率值;
在金融数据集合X中选取具有最大权值的金融数据为聚类中心,并将其加入到集合V中;
Step3:继续采用Step2中的方法在金融数据集合X中选取聚类中心,直到选取的聚类中心的个数等于c时停止选取聚类中心。
本优选实施例用于在金融数据集合X中选取聚类中心,选取金融数据集合X中具有最大概率值的金融数据为第一个聚类中心,即选取金融数据集合X中具有较大局部密度的金融数据为第一个聚类中心,在接下来的聚类中心的选取过程中引入了所述金融数据和已选取的聚类中心之间的距离因素,使得选取的聚类中心之间具有较大的距离,从而使得选取的聚类中心在金融数据集合X中分布的较为全面。
优选地,区块链存储模块中设置有节点检测单元,所述节点检测单元用于监测区块链节点的挖矿结果,当监测到只有一个区块链节点挖矿成功,则该区块链节点获得记账权并赚取挖矿酬金,当监测到有多个区块链节点挖矿成功时,对挖矿成功的区块链节点进行筛选,设qz表示当前挖矿成功的第z个区块链节点,且z=1,2,...,w,其中,w表示监测到的当前挖矿成功的区块链节点数,定义t(qz)表示区块链节点qz挖矿产生区块的时间,当时,则选取区块链节点qv获得记账权并赚取挖矿酬金,并将区块链节点qv产生的区块接入主链。
本优选实施例用于在区块链即将产生分叉前对挖矿成功的区块链节点进行检测和筛选,最终只允许唯一区块接入主链,从而能够有效的避免了分叉的产生,保证了区块链中数据的一致性并进一步维护了区块链的健壮性。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (3)
1.一种基于区块链的金融大数据风控平台,其特征是,包括金融数据获取模块、金融数据检测模块、金融数据传输模块和区块链存储模块,所述金融数据获取模块用于收集金融数据,并将收集的金融数据输入到金融数据检测模块,所述金融数据检测模块用于对接收到的金融数据进行聚类,并判断聚类所得的各个类中的金融数据是安全数据还是可疑数据,将判断为可疑数据的类中的金融数据舍弃,将判断为安全数据的类中的金融数据通过金融数据传输模块传输至区块链存储模块进行存储;所述金融数据检测模块包括金融数据分类单元和金融数据判断单元,所述金融数据分类单元用于对接收到的金融数据进行聚类,将金融数据分类单元接收到的待分类的金融数据表示为集合X,且X={xi,i=1,2,...,N},其中,xi表示集合X中的第i个金融数据,N表示金融数据集合X中的金融数据量,所述金融数据分类单元采用FCM算法将金融数据集合X中的金融数据进行分类,设C表示金融数据集合X划分的类别集合,且C={cj,j=1,2,...,c},其中,cj表示类别集合C中的第j个类,c表示类别集合C中的类别数,所述FCM算法采用聚类有效性指标Y(c)确定将金融数据集合X划分的类别数c,Y(c)的表达式为:
式中,设cl表示类别集合C中的第l个类,vl表示类cl的聚类中心,vj表示类cj的聚类中心,表示类别集合C中类的聚类中心的均值,且uij表示金融数据xi隶属于类cj的隶属度,Oijl表示金融数据xi在类cj和类cl之间的重叠度,且 其中,uil表示金融数据xi隶属于类cl的隶属度,u00表示重叠度阈值,β(cj)表示类cj对应的紧密性的修正因子,且β(cj)的值采用下列方式确定:
设类其中,表示类cj中的第k个金融数据,N(cj)表示类cj中的金融数据量,对类cj中的金融数据进行筛选,设表示金融数据隶属于类cj的隶属度,表示金融数据隶属于类别集合C中类的第二大隶属度,当时,则将类cj中的金融数据标记为1,当时,则将类cj中的金融数据标记为0;
式中,表示集合M(cj,1)中的第r个金融数据,xe表示金融数据集合X中的第e个金融数据,xa表示金融数据集合X中的第a个金融数据;所述金融数据判断单元用于判断聚类所得的各个类中的金融数据是安全数据还是可疑数据;
式中,d(c)表示给定的截断距离,ρ(xi)表示金融数据xi对应的密度调节系数,且ρ(xi)的值采用下列方式确定:
设L(xi)表示金融数据xi的局部邻域数据集合,给定正整数M,且0<M<N,将金融数据集合X中的金融数据按其和金融数据xi之间距离的绝对值由小到大进行排序组成序列l(xi),选取序列l(xi)中的前2M个金融数据加入到集合L(xi)中,设L(xi)={xit,t=1,2,...,2M},其中,xit表示集合L(xi)中的第t个金融数据;将集合L(xi)中的金融数据按其和金融数据xi之间距离的绝对值由小到大进行排序组成序列l′(xi),设ηit(xi)表示金融数据xit在序列l′(xi)中的排序;设L(xit)表示金融数据xit的局部邻域数据集合,将金融数据集合X中的金融数据按其和金融数据xit之间距离的绝对值由小到大进行排序组成序列l(xit),选取序列l(xit)中的前2M个金融数据加入到集合L(xit)中,设L(xit)={xitb,b=1,2,...,2M},其中,xitb表示集合L(xit)中的第b个金融数据;将集合L(xit)中的金融数据按其和金融数据xit之间的距离的绝对值由小到大进行排序,组成序列l′(xit),设ηi(xit)表示金融数据xi在序列l′(xit)中的排序,当min{ηit(xi),ηi(xit)}<M时,则将金融数据xit标记为金融数据xi的参考数据;
设U(xi)表示金融数据xi的参考数据集合,且U(xi)={xif,f=1,2,...,N(xi,U)},则ρ(xi)的值为:
式中,xif表示集合U(xi)中的第f个参考数据,N(xi,U)表示集合U(xi)中的参考数据量。
2.根据权利要求1所述的一种基于区块链的金融大数据风控平台,其特征是,设V表示在金融数据集合X中选取的聚类中心集合,根据金融数据集合X中各金融数据成为聚类中心的概率值选取聚类中心,并将选取的聚类中心加入到集合V中,具体包括:
Step1:在金融数据集合X中选取具有最大概率值的金融数据为第一个聚类中心v1,并将选取的聚类中心v1加入到聚类中心集合V中;
Step2:在金融数据集合X中选取剩余的聚类中心,设xg表示金融数据集合X中第g个金融数据,定义Y(xg)表示金融数据xg成为聚类中心的权值,且Y(xg)的表达式为:
式中,γ(xg)表示金融数据xg对应的取值函数,当xg∈V时,则γ(xg)=0,当时,则γ(xg)=1,vα表示聚类中心集合V中的第α个聚类中心,N(V)表示此时聚类中心集合V中的聚类中心数,表示金融数据xg成为聚类中心的概率值;
在金融数据集合X中选取具有最大权值的金融数据为聚类中心,并将其加入到集合V中;
Step3:继续采用Step2中的方法在金融数据集合X中选取聚类中心,直到选取的聚类中心的个数等于c时停止选取聚类中心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010909416.0A CN112036754B (zh) | 2020-06-30 | 2020-06-30 | 基于区块链的金融大数据风控系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010909416.0A CN112036754B (zh) | 2020-06-30 | 2020-06-30 | 基于区块链的金融大数据风控系统 |
CN202010607918.8A CN111507649B (zh) | 2020-06-30 | 2020-06-30 | 一种基于区块链的金融大数据风控平台 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010607918.8A Division CN111507649B (zh) | 2020-06-30 | 2020-06-30 | 一种基于区块链的金融大数据风控平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112036754A true CN112036754A (zh) | 2020-12-04 |
CN112036754B CN112036754B (zh) | 2022-09-16 |
Family
ID=71878820
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010909416.0A Active CN112036754B (zh) | 2020-06-30 | 2020-06-30 | 基于区块链的金融大数据风控系统 |
CN202010607918.8A Active CN111507649B (zh) | 2020-06-30 | 2020-06-30 | 一种基于区块链的金融大数据风控平台 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010607918.8A Active CN111507649B (zh) | 2020-06-30 | 2020-06-30 | 一种基于区块链的金融大数据风控平台 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN112036754B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114553451A (zh) * | 2020-11-25 | 2022-05-27 | 中国移动通信有限公司研究院 | 数据处理方法、系统、数据检测装置及区块链平台 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1124992A1 (en) * | 1998-10-27 | 2001-08-22 | Rosetta Inpharmatics Inc. | Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns |
US20100111396A1 (en) * | 2008-11-06 | 2010-05-06 | Los Alamos National Security | Object and spatial level quantitative image analysis |
US20100217763A1 (en) * | 2007-09-17 | 2010-08-26 | Electronics And Telecommunications Research Institute | Method for automatic clustering and method and apparatus for multipath clustering in wireless communication using the same |
CN103514565A (zh) * | 2012-06-27 | 2014-01-15 | 中国银联股份有限公司 | 金融交易处理系统的交易异常处理单元及方法 |
CN103544429A (zh) * | 2012-07-12 | 2014-01-29 | 中国银联股份有限公司 | 用于安全性信息交互的异常检测装置及方法 |
CN104680414A (zh) * | 2013-11-28 | 2015-06-03 | 冲电气工业株式会社 | 帐票数据管理系统、方法、以及帐票数据管理装置 |
CN105259816A (zh) * | 2015-11-04 | 2016-01-20 | 福建省农村信用社联合社 | 基于无线传感网络的银行动态信贷监控系统和方法 |
CN106156795A (zh) * | 2016-07-05 | 2016-11-23 | 中国银联股份有限公司 | 一种可疑洗钱账户的确定方法及装置 |
CN107220977A (zh) * | 2017-06-06 | 2017-09-29 | 合肥工业大学 | 基于模糊聚类的有效性指标的图像分割方法 |
CN108521434A (zh) * | 2018-05-29 | 2018-09-11 | 广西电网有限责任公司 | 一种基于区块链技术的网络安全入侵检测系统 |
CN108734220A (zh) * | 2018-05-23 | 2018-11-02 | 山东师范大学 | 基于k线聚类和强化学习的自适应金融时间序列预测方法 |
CN109615529A (zh) * | 2019-02-25 | 2019-04-12 | 中国农业银行股份有限公司 | 一种基于区块链的征信系统 |
CN109816507A (zh) * | 2018-11-08 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 金融资产数据的统计方法及装置、存储介质、计算机设备 |
CN110111003A (zh) * | 2019-05-08 | 2019-08-09 | 东南大学 | 一种基于改进fcm聚类算法的新能源典型场景构建方法 |
CN110163618A (zh) * | 2019-05-31 | 2019-08-23 | 深圳前海微众银行股份有限公司 | 异常交易的检测方法、装置、设备及计算机可读存储介质 |
CN110189228A (zh) * | 2019-06-24 | 2019-08-30 | 深圳前海微众银行股份有限公司 | 一种监测异常交易的方法和装置 |
CN110378607A (zh) * | 2019-07-24 | 2019-10-25 | 青岛鲁诺金融电子技术有限公司 | 一种基于算法的汽车金融服务系统 |
CN110677864A (zh) * | 2019-10-12 | 2020-01-10 | 长春工业大学 | 基于无线传感器网络的能量约束模糊c-均值聚类方法 |
CN111652733A (zh) * | 2020-07-13 | 2020-09-11 | 李国安 | 基于云计算和区块链的金融信息管理系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2851351A1 (fr) * | 2003-02-18 | 2004-08-20 | Centre Nat Rech Scient | Procede de production d'une grappe de traitement de donnees et systeme informatique pour fonctionner en grappe |
CN101236638A (zh) * | 2008-02-20 | 2008-08-06 | 中国工商银行股份有限公司 | 一种基于Web的银行卡风险监测方法及系统 |
CN102184208B (zh) * | 2011-04-29 | 2013-06-05 | 武汉慧人信息科技有限公司 | 一种基于多维数据异常簇挖掘的垃圾网页检测方法 |
CN107563645A (zh) * | 2017-09-04 | 2018-01-09 | 杭州云算信达数据技术有限公司 | 一种基于大数据的金融风险分析方法 |
CN110288123A (zh) * | 2019-05-17 | 2019-09-27 | 福建江夏学院 | 一种基于深度学习的金融信息预测方法及装置 |
CN110222962A (zh) * | 2019-05-24 | 2019-09-10 | 东方银谷(北京)科技发展有限公司 | 用于金融业务风险控制的数据配置方法及装置 |
-
2020
- 2020-06-30 CN CN202010909416.0A patent/CN112036754B/zh active Active
- 2020-06-30 CN CN202010607918.8A patent/CN111507649B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1124992A1 (en) * | 1998-10-27 | 2001-08-22 | Rosetta Inpharmatics Inc. | Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns |
US20100217763A1 (en) * | 2007-09-17 | 2010-08-26 | Electronics And Telecommunications Research Institute | Method for automatic clustering and method and apparatus for multipath clustering in wireless communication using the same |
US20100111396A1 (en) * | 2008-11-06 | 2010-05-06 | Los Alamos National Security | Object and spatial level quantitative image analysis |
CN103514565A (zh) * | 2012-06-27 | 2014-01-15 | 中国银联股份有限公司 | 金融交易处理系统的交易异常处理单元及方法 |
CN103544429A (zh) * | 2012-07-12 | 2014-01-29 | 中国银联股份有限公司 | 用于安全性信息交互的异常检测装置及方法 |
CN104680414A (zh) * | 2013-11-28 | 2015-06-03 | 冲电气工业株式会社 | 帐票数据管理系统、方法、以及帐票数据管理装置 |
CN105259816A (zh) * | 2015-11-04 | 2016-01-20 | 福建省农村信用社联合社 | 基于无线传感网络的银行动态信贷监控系统和方法 |
CN106156795A (zh) * | 2016-07-05 | 2016-11-23 | 中国银联股份有限公司 | 一种可疑洗钱账户的确定方法及装置 |
CN107220977A (zh) * | 2017-06-06 | 2017-09-29 | 合肥工业大学 | 基于模糊聚类的有效性指标的图像分割方法 |
CN108734220A (zh) * | 2018-05-23 | 2018-11-02 | 山东师范大学 | 基于k线聚类和强化学习的自适应金融时间序列预测方法 |
CN108521434A (zh) * | 2018-05-29 | 2018-09-11 | 广西电网有限责任公司 | 一种基于区块链技术的网络安全入侵检测系统 |
CN109816507A (zh) * | 2018-11-08 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 金融资产数据的统计方法及装置、存储介质、计算机设备 |
CN109615529A (zh) * | 2019-02-25 | 2019-04-12 | 中国农业银行股份有限公司 | 一种基于区块链的征信系统 |
CN110111003A (zh) * | 2019-05-08 | 2019-08-09 | 东南大学 | 一种基于改进fcm聚类算法的新能源典型场景构建方法 |
CN110163618A (zh) * | 2019-05-31 | 2019-08-23 | 深圳前海微众银行股份有限公司 | 异常交易的检测方法、装置、设备及计算机可读存储介质 |
CN110189228A (zh) * | 2019-06-24 | 2019-08-30 | 深圳前海微众银行股份有限公司 | 一种监测异常交易的方法和装置 |
CN110378607A (zh) * | 2019-07-24 | 2019-10-25 | 青岛鲁诺金融电子技术有限公司 | 一种基于算法的汽车金融服务系统 |
CN110677864A (zh) * | 2019-10-12 | 2020-01-10 | 长春工业大学 | 基于无线传感器网络的能量约束模糊c-均值聚类方法 |
CN111652733A (zh) * | 2020-07-13 | 2020-09-11 | 李国安 | 基于云计算和区块链的金融信息管理系统 |
Non-Patent Citations (9)
Title |
---|
KWON S H等: "Cluster validity index for fuzzy clustering", 《ELECTRONICS LETTERS》 * |
P. HEBERT 等: "Spatial-color pixel classification by spectral clustering for color image segmentation", 《2008 3RD INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATION TECHNOLOGIES: FROM THEORY TO APPLICATIONS》 * |
周开乐 等: "聚类有效性研究综述", 《系统工程理论与实践》 * |
朱青: "基于改进K-means算法的民航飞机降落过程油耗分析研究", 《中国博士学位论文全文数据库 工程科技Ⅱ辑》 * |
王雪: "聚类分析中面向重叠数据集的新型聚类有效性指标的研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
耿嘉艺 等: "新模糊聚类有效性指标", 《计算机应用研究》 * |
耿嘉艺 等: "紧邻类与小类数据集下的模糊聚类有效性指标", 《计算机应用研究》 * |
苗旭东 等: "基于小波和PSO-BP神经网络的金融时序预测", 《信息技术》 * |
赵娜娜 等: "新的模糊聚类有效性指标", 《微电子学与计算机》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111507649A (zh) | 2020-08-07 |
CN112036754B (zh) | 2022-09-16 |
CN111507649B (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111061620B (zh) | 一种混合策略的服务器异常智能检测方法及检测系统 | |
CN113837477B (zh) | 数据双驱动的台风灾害下电网故障预测方法、装置和设备 | |
CN101718634B (zh) | 基于多元概率模型的设备状态综合动态报警方法 | |
CN104539484B (zh) | 一种动态评估网络连接可信度的方法及系统 | |
CN109034194B (zh) | 基于特征分化的交易欺诈行为深度检测方法 | |
CN102592451B (zh) | 一种基于双截面环形线圈检测器的道路交通事件检测方法 | |
CN112330067B (zh) | 基于区块链的金融大数据分析系统 | |
KR102169452B1 (ko) | IoT 기상환경 수집 데이터의 안정성 확보 방법 | |
CN113378990B (zh) | 基于深度学习的流量数据异常检测方法 | |
CN106198551A (zh) | 一种输电线路缺陷的检测方法及装置 | |
CN110247910A (zh) | 一种异常流量的检测方法、系统及相关组件 | |
CN115099335A (zh) | 多源异构数据的异常辨识和特征筛选方法、系统 | |
CN106482967A (zh) | 一种代价敏感支持向量机机车车轮检测系统及方法 | |
CN114022904B (zh) | 一种基于两阶段的噪声鲁棒行人重识别方法 | |
CN112711757B (zh) | 一种基于大数据平台的数据安全集中管控方法及系统 | |
CN107145778A (zh) | 一种入侵检测方法及装置 | |
CN107895171A (zh) | 一种基于k均值与深度置信网络的入侵检测方法 | |
CN114422184A (zh) | 基于机器学习的网络安全攻击类型和威胁等级预测方法 | |
WO2023045512A1 (zh) | 一种基于机器学习对工业硬件进行故障检测的方法及系统 | |
CN108197254B (zh) | 一种基于近邻的数据修复方法 | |
CN111507649B (zh) | 一种基于区块链的金融大数据风控平台 | |
CN112327189A (zh) | 一种基于knn算法的储能电池健康状态综合判断方法 | |
CN114004331A (zh) | 一种基于关键指标和深度学习的故障分析方法 | |
CN106384507A (zh) | 基于稀疏检测器的行程时间实时估计方法 | |
CN115526258A (zh) | 基于Spearman相关系数特征提取的电力系统暂稳评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220831 Address after: 10th Floor, Building 8, No. 99, Jiangwancheng Road, Yangpu District, Shanghai, 200433 Applicant after: Shanghai Jike Intelligent Technology Group Co.,Ltd. Address before: 330000 room 611-11, Ziyang pearl phase I office building, No. 2999, Ziyang Avenue, Nanchang high tech Industrial Development Zone, Nanchang, Jiangxi Province Applicant before: Nanchang woody Medical Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |