CN112559618B - 一种基于金融风控业务的外部数据整合方法 - Google Patents

一种基于金融风控业务的外部数据整合方法 Download PDF

Info

Publication number
CN112559618B
CN112559618B CN202011540099.6A CN202011540099A CN112559618B CN 112559618 B CN112559618 B CN 112559618B CN 202011540099 A CN202011540099 A CN 202011540099A CN 112559618 B CN112559618 B CN 112559618B
Authority
CN
China
Prior art keywords
data
external data
display
transmission port
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011540099.6A
Other languages
English (en)
Other versions
CN112559618A (zh
Inventor
王玉晓
邓飞
苏志斌
刘继勇
田江
王鹏
温小芳
刘存玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Everbright Technology Co ltd
Everbright Xinglong Trust Co ltd
Original Assignee
Everbright Technology Co ltd
Everbright Xinglong Trust Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Everbright Technology Co ltd, Everbright Xinglong Trust Co ltd filed Critical Everbright Technology Co ltd
Priority to CN202011540099.6A priority Critical patent/CN112559618B/zh
Publication of CN112559618A publication Critical patent/CN112559618A/zh
Application granted granted Critical
Publication of CN112559618B publication Critical patent/CN112559618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Abstract

本发明提供了一种基于金融风控业务的外部数据整合方法,包括:采集不同结构的外部数据;基于同步传输规则,将采集的外部数据进行同步传输到预处理场景,进行预处理;按照预设数据整合模型以及统一性整合规律,将预处理后的外部数据进行整合处理;将整合处理结果进行可视化展现。通过同步传输,便于将数据进行整合同一,实现有效的数据价值。

Description

一种基于金融风控业务的外部数据整合方法
技术领域
本发明涉及数据整合技术领域,特别涉及一种基于金融风控业务的外部数据整合方法。
背景技术
大数据及人工智能时代,外部数据在服务信托金融业务数字化转型中的重要性愈加凸显。然而,在外部数据实际落地运用时会遇到各种各样的问题。比如,多部门各自引入,管理标准的不统一带来了数据安全得不到保障、使用成本高、数据难于整合共享等问题。
随着外部数据的增多和变化,对金融统计工作效率、统计数据的准确性、时效性要求更高,统计数据的运用范围也更广,使对外统计数据的采集和运用工作在实际操作中面临着更大的困难。
而且,目前对外采集统计数据困难,数据质量不高,数据的真实性和完整性难以保障,采集统计样本数量较少,代表性不强,增扩或调整调查样本困难;各类调查统计样本重复现象较普遍,采集数据的部门较多,项目较杂,采集数据报酬不一致,导致成本较高。
在对内数据整理分析时,各类指标错综复杂,各个业务部门无法统一数据的口径,导致数据整体分析效果不佳。从而无法为组织实现战略目标提供能力支撑,无法获知数据的有效价值以及风险控制。
并且,目前各个政府机构、事业单位之间的数据是相互独立的。这就导致,办理者在政府机构或者事业单位办理事务,如申报项目时,需要提供多种数据,为了使提交的材料符合要求,办事者需要在多个机构间件来回奔波,效率低下。
除此,由于各政府机构、事业单位之间的业务数据是相互独立的,受理业务的机构也无法直接在别的机构的数据库中查看原始数据进行核对,只能凭借材料上的盖章等证明物来对材料的真实性进行判断。
随着网络技术的高速发展,目前的材料造假技术也越来越高级,即使对材料进行了造假或者篡改,受理机构的工作人员也难以进行甄别。
除此之外,企业内部之中各个部门也在分批采集外部数据,各类数据存在重复采购现象,导致成本较高,同时,各个部门的业务口径又不相同,分析统计粒度也不一致,从而导致数据整体分析效果不佳,提供的各类报表内容也尽不相同,无法实现有效的数据价值。
因此,本发明提出一种基于金融风控业务的外部数据整合方法。
发明内容
本发明提供一种基于金融风控业务的外部数据整合方法,用以通过同步传输,便于将数据进行整合同一,实现有效的数据价值。
本发明提出一种基于金融风控业务的外部数据整合方法,包括:
采集不同结构的外部数据;
基于同步传输规则,将采集的外部数据进行同步传输到预处理场景,进行预处理;
按照预设数据整合模型以及统一性整合规律,将预处理后的外部数据进行整合处理;
将整合处理结果进行可视化展现。
在一种可能实现的方式中,将采集的外部数据进行同步传输到预处理场景,进行预处理的步骤包括:
对所述外部数据进行聚类分析,获得数据集合,且所述数据集合包括N条子数据;
确定每条子数据的数据属性,并按照所述数据属性,从场景数据库中调取相关的预处理子场景,且多个预处理子场景构成预处理场景;
将每条所述子数据同步传输到对应的预处理子场景中,同时,按照所述子数据的数据状态,对所述预处理子场景进行条件部署以及空间场景调度;
其中,所述数据状态与所述子数据中存在的源数据和目标数据相关。
在一种可能实现的方式中,将采集的外部数据进行同步传输到预处理场景之前,还包括:
确定所述预处理场景对应的接收口;
同时,确定所述外部数据的数据类型,并按照所述数据类型,判断传输所述外部数据的传输口的传输类型是否包括所述数据类型在内;
若包括,判断所述接收口与所述传输口是否适配;
若不包括,确定差别类型,同时,调取与所述差别类型相关的待扩展开口函数,并将所述待扩展开口函数叠加在传输外部数据的传输口所对应的程序中,来对传输口进行优化,同时,判断所述接收口与优化后的传输口是否适配。
在一种可能实现的方式中,所述不同结构的外部数据包括:结构化数据、半结构化数据、非结构化数据;
所述统一性整合规律与数据业务、数据指标相关;
所述可视化展示包括:BI报表展示或者视图展示。
在一种可能实现的方式中,将预处理后的外部数据进行整合处理,其整合处理的步骤包括:
对所述外部数据的数据结构进行预处理,获取所述外部数据的内存字段信息;
设置所述外部数据的内存字段信息的关键字段值,并根据所述关键字段值对所述外部数据进行排序,并按照排序结果分成N个外部数据包;
从所述N个外部数据包中选取包含所述内存字段信息齐全的有效数据,同时,将所述有效数据进行分解,分解为对象、属性两类基本元素;
将分解好的所述对象、属性两类基本元素进行分类整理,并在所述N个外部数据包内创建表格;
同时,根据所述表格获取表格模板,并读取所述对象中的第一内容值,以及读取属性中的第二内容值;
基于预设匹配数据集对所述第一内容值与所述第二内容值进行匹配,同时,将符合匹配的所述第一内容值与所述第二内容值建立映射关系;
基于所述映射关系,构建所述N个外部数据包中有关于所述有效数据的N个目标数据文件;
获取所述目标数据文件中的目标数据压缩比率,同时,获取所述有效数据的数据长度;
根据所述数据长度,并按照所述目标数据压缩比率,计算所述有效数据在所述目标数据文件中进行压缩所需要的压缩时间;
基于所述压缩时间,对所述N个目标数据文件中的所述有效数据按照所述目标压缩比率进行压缩整合,获取整合好的所述外部数据。
在一种可能实现的方式中,将整合处理结果进行可视化展现包括:
确定与所述预处理场景相关的所有展示节点以及基于所述展示节点构成的展示路径,并基于所述展示节点以及展示路径,构成第一展示树,且所述第一展示树是包括多个展示层在内的,且每个展示层包括至少两个展示节点以及至少一条展示路径;
确定所述展示节点是否响应所述整合处理结果,若响应,将所述展示节点保留使用,否则,将所述展示节点暂留使用,同时,根据响应的展示节点对所述第一展示树进行调整,获得第二展示树;
对所述整合处理结果进行聚类分析,确定主金融类型、次金融类型以及影响金融类型;
所述主金融类型、次金融类型以及影响金融类型融合到所述第二展示树中,获取第三展示树;
从所述第三展示树中提取与所述整合处理结果相关的待需要层,并对所述待需要层进行层级排序,构建层级路径,并按照所述层级路径以及所述待需要层的展示路径,将所述整合处理结果进行可视化展现;
其中,所述展示节点与预设金融类型以及与所述预设金融类型对应的可展示结果相关。
在一种可能实现的方式中,判断所述接收口与优化后的传输口是否适配包括:
获取所述接收口的网络测试数据,并将所述网络测试数据进行转换,获取转换网络测试数据;
将所述网络转换测试数据向优化后的传输口发送,并获取此时优化后的传输口所接收到所述网络转换测试数据的传递速率;
根据所述传递速率,确定优化后的传输口的数据回归系数,并根据所述数据回归系数,计算所述接收口与优化后的传输口的适配度;
Figure BDA0002854640800000051
其中,ξ表示所述接收口与优化后的传输口的适配度;λ表示优化后的传输口的数据回归系数;
Figure BDA0002854640800000052
表示第i个所述网络转换测试数据节点的数据平均值;i表示所述网络转换数据的数据节点;δ表示所述网络转换测试数据的标准差;v表示所述传递速率;v1表示所述传输口所能接收的最大数据传递速率;g表示所述接收口与优化后的传输口在匹配时的自由度比值;σ表示所述接收口与优化后的传输口的匹配灵敏度;a表示优化后的传输口在接收到所述网络转换数据时的数据分辨率;u所述接收口与优化后的传输口的匹配系数;
将当前所述接收口与优化后的传输口的适配度与预设标准适配度进行比较;
若当前所述接收口与优化后的传输口的适配度等于或大于所述预设标准适配度,判定所述接收口与优化后的传输口适配;
否则,判定所述接收口与优化后的传输口不适配,并对所述接收口与优化后的传输口进行二次优化。
在一种可能实现的方式中,对所述接收口与优化后的传输口进行二次优化包括:
基于当前所述接收口与优化后的传输口的适配度,确定所述接收口与优化后的传输口的优化特征值;
Figure BDA0002854640800000061
其中,M表示所述接收口与优化后的传输口的优化特征值;ξ表示所述接收口与优化后的传输口的适配度;τ表示所述接收口与优化后的传输口的疲劳系数;σ表示当前优化后的传输口接收所述网络转换测试数据的梯度值;q表示所述述接收口与优化后的传输口在获取适配度时的初始学习率;Q表示所述接收口与优化后的传输口在获取优化特征值时的自动调整学习率;k表示优化系数;s表示所述接收口与优化后的传输口之间平滑系数,且取值范围为
Figure BDA0002854640800000062
f表示优化后的传输口接收到所述网络转换测试数据所需要的优化梯度值;
基于所述接收口与优化后的传输口的优化特征值,从优化数据库中,调取与优化特征值相关的接口优化模型;
同时,根据所述接收口与优化后的传输口的适配度与所述预设标准适配度之间的差异度以及所述优化后的传输口上叠加的待扩展开口函数,从差异数据库中,调取接口差异模型;
基于所述接口优化模型和接口差异模型,对所述接收口与优化后的传输口进行二次优化。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于金融风控业务的外部数据整合方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明提出一种基于金融风控业务的外部数据整合方法,如图1所示,包括:
步骤1:采集不同结构的外部数据;
步骤2:基于同步传输规则,将采集的外部数据进行同步传输到预处理场景,进行预处理;
步骤3:按照预设数据整合模型以及统一性整合规律,将预处理后的外部数据进行整合处理;
步骤4:将整合处理结果进行可视化展现。
该实施例中,采集不同结构的外部数据,例如是采集的政府机构或者事业单位办理事务如在申报项目时的多种数据。
该实施例中,同步传输规则,例如,在采集政府机构或者事业单位办理事务在申报项目时的多种数据时,为了使提交的材料符合要求,办事者需要在多个机构间件来回奔波,效率低下,此时,如果将这些资料,或者多种数据进行同步传输,便于有效的获取各种数据的材料,提高工作效率。
该实施例中,对外部数据进行预处理,例如是将不同种类的数据传输到对应的类型转换模型中进行数据类型的转换,并将输出结果转换为同一种类型的数据,此时,即可算作是完整了预处理。
该实施例中,对预处理后的数据进行整合处理,例如,是将相同数据类型的所有数据融合在一起。
该实施例中,可视化展示,是为了方便用户观看。
上述技术方案的有益效果是:通过同步传输,便于将数据进行整合同一,实现有效的数据价值,提高工作处理效率。
本发明提出一种基于金融风控业务的外部数据整合方法,将采集的外部数据进行同步传输到预处理场景,进行预处理的步骤包括:
对所述外部数据进行聚类分析,获得数据集合,且所述数据集合包括N条子数据;
确定每条子数据的数据属性,并按照所述数据属性,从场景数据库中调取相关的预处理子场景,且多个预处理子场景构成预处理场景;
将每条所述子数据同步传输到对应的预处理子场景中,同时,按照所述子数据的数据状态,对所述预处理子场景进行条件部署以及空间场景调度;
其中,所述数据状态与所述子数据中存在的源数据和目标数据相关。
该实施例中,进行聚类分析是为了对同类型数据进行在同个时间段内进行整体分析,便于提高处理效率。
该实施例中,数据属性与数据类型相关。
该实施例中,调取的与预处理子场景,是为了将对应的数据类型的数据转换为同一数据类型进行数据输出。
该实施例中,同步传输,是为了进行同步处理,提高其的处理效率。
该实施例中,数据状态,例如是指该类型的数据处于可以被直接使用的情况,或者是默认不能使用的情况。
该实施例中,条件部署以及空间场景调度都是为了方便进行数据类型转换,例如数据状态为默认不能使用的情况,此时,空间场景调度以及条件部署可以是将默认不能使用的情况转换为可以使用的情况,再来进行数据类型转换。
上述技术方案的有益效果是:通过进行聚类分析,并按照数据属性,来调取对应的预处理子场景,进而根据条件部署以及空间场景调度对数据进行转换。
本发明提出一种基于金融风控业务的外部数据整合方法,将采集的外部数据进行同步传输到预处理场景之前,还包括:
确定所述预处理场景对应的接收口;
同时,确定所述外部数据的数据类型,并按照所述数据类型,判断传输所述外部数据的传输口的传输类型是否包括所述数据类型在内;
若包括,判断所述接收口与所述传输口是否适配;
若不包括,确定差别类型,同时,调取与所述差别类型相关的待扩展开口函数,并将所述待扩展开口函数叠加在传输外部数据的传输口所对应的程序中,来对传输口进行优化,同时,判断所述接收口与优化后的传输口是否适配。
本发明提出一种基于金融风控业务的外部数据整合方法,所述不同结构的外部数据包括:结构化数据、半结构化数据、非结构化数据;
所述统一性整合规律与数据业务、数据指标相关;
所述可视化展示包括:BI报表展示或者视图展示。
该实施例中,差别类型,比如,接收口接收的是char类型的,传输口接收的是int类型的,此时,即为差别类型。
该实施例中,待扩展开口函数叠加在传输外部数据的传输口所对应的程序中,是为了对传输口的传输数据类型进行扩展,且待扩展开口函数是预先设置好的,是为了可以直接在程序中补充对应的传输数据类型。
上述技术方案的有益效果是:确定接收口与传输口是为了更好的进行数据的传输,且确定差别类型,是为了进行有效的函数叠加,方便对传输口进行优化。
本发明提出一种基于金融风控业务的外部数据整合方法,将预处理后的外部数据进行整合处理,其整合处理的步骤包括:
对所述外部数据的数据结构进行预处理,获取所述外部数据的内存字段信息;
设置所述外部数据的内存字段信息的关键字段值,并根据所述关键字段值对所述外部数据进行排序,并按照排序结果分成N个外部数据包;
从所述N个外部数据包中选取包含所述内存字段信息齐全的有效数据,同时,将所述有效数据进行分解,分解为对象、属性两类基本元素;
将分解好的所述对象、属性两类基本元素进行分类整理,并在所述N个外部数据包内创建表格;
同时,根据所述表格获取表格模板,并读取所述对象中的第一内容值,以及读取属性中的第二内容值;
基于预设匹配数据集对所述第一内容值与所述第二内容值进行匹配,同时,将符合匹配的所述第一内容值与所述第二内容值建立映射关系;
基于所述映射关系,构建所述N个外部数据包中有关于所述有效数据的N个目标数据文件;
获取所述目标数据文件中的目标数据压缩比率,同时,获取所述有效数据的数据长度;
根据所述数据长度,并按照所述目标数据压缩比率,计算所述有效数据在所述目标数据文件中进行压缩所需要的压缩时间;
基于所述压缩时间,对所述N个目标数据文件中的所述有效数据按照所述目标压缩比率进行压缩整合,获取整合好的所述外部数据。
该实施例中,关键字段值指的是外部数据的内存字段信息中的重要信息字段,该字段的信息可以代表该内存字段信息的信息值。
该实施例中,内存字段信息齐全的有效数据指的是内存字段信息中的关键字、字符特征等。
该实施例中,映射关系可以是一个第一内容值对对应一个第二内容值,也可以是一个第一内容值对应多个第二内容值。
该实施例中,目标数据文件中包含外部数据包中的有效数据,是最终进行整合的文件。
该实施例中,目标数据压缩比率是通过多次训练学习得到的,根据该压缩比率对数据进行压缩,便于对数据进行整合。
上述技术方案的有益效果是:通过获取外部数据中的内存字段信息,并通过关键字将外部数据分成N个外部数据包,通过解读外部数据包中的对象、属性元素,将外部数据包中的有效数据长度进行压缩整合,确保了对外部数据包中的关键信息进行整合,避免对外部数据包中的无效信息做无用功,提高了外部数据整合的效果以及整合的效率。
本发明提出一种基于金融风控业务的外部数据整合方法,将整合处理结果进行可视化展现包括:
确定与所述预处理场景相关的所有展示节点以及基于所述展示节点构成的展示路径,并基于所述展示节点以及展示路径,构成第一展示树,且所述第一展示树是包括多个展示层在内的,且每个展示层包括至少两个展示节点以及至少一条展示路径;
确定所述展示节点是否响应所述整合处理结果,若响应,将所述展示节点保留使用,否则,将所述展示节点暂留使用,同时,根据响应的展示节点对所述第一展示树进行调整,获得第二展示树;
对所述整合处理结果进行聚类分析,确定主金融类型、次金融类型以及影响金融类型;
所述主金融类型、次金融类型以及影响金融类型融合到所述第二展示树中,获取第三展示树;
从所述第三展示树中提取与所述整合处理结果相关的待需要层,并对所述待需要层进行层级排序,构建层级路径,并按照所述层级路径以及所述待需要层的展示路径,将所述整合处理结果进行可视化展现;
其中,所述展示节点与预设金融类型以及与所述预设金融类型对应的可展示结果相关。
该实施例中,预处理场景相关的展示节点,例如是以柱形、折线等形式进行展示,且展示路径,例如是将一些数据进行柱形展示,一些数据进行折线展现,再将一些数据进行柱形、折线进行同步展示。
该实施例中,判断展示节点是否相应,一是为了筛选有效节点,二是为了提高展示效率。
该实施例中,第一展示树是预先设定好的,第二展示树是基于响应结果进行调整得到的。
该实施例中,通过对整合处理结果进行聚类分析,进而来对第二展示树进行再次调整得到的。
该实施例中,待需要层是与展示节点和展示路径有关,进而筛选层级路径,最后进行可视化展现。
该实施例中,层级是将模型进行层级划分之后获得的,且获得多个层级,层级路径是从多个层级中筛选某些层级构成的路径,且每个层级路径中是包含多个展示节点和展示路径在内的。
该实施例汇总,展示节点,例如是数据可展示的某个形状,如柱形。
上述技术方案的有益效果是:通过设置展示节点、展示路径、层级路径以及两次优化,便于确定有效的展示整合处理结果,方便观看。
本发明提出一种基于金融风控业务的外部数据整合方法,判断所述接收口与优化后的传输口是否适配包括:
获取所述接收口的网络测试数据,并将所述网络测试数据进行转换,获取转换网络测试数据;
将所述网络转换测试数据向优化后的传输口发送,并获取此时优化后的传输口所接收到所述网络转换测试数据的传递速率;
根据所述传递速率,确定优化后的传输口的数据回归系数,并根据所述数据回归系数,计算所述接收口与优化后的传输口的适配度;
Figure BDA0002854640800000131
其中,ξ表示所述接收口与优化后的传输口的适配度;λ表示优化后的传输口的数据回归系数;
Figure BDA0002854640800000132
表示第i个所述网络转换测试数据节点的数据平均值;i表示所述网络转换数据的数据节点;δ表示所述网络转换测试数据的标准差;v表示所述传递速率;v1表示所述传输口所能接收的最大数据传递速率;g表示所述接收口与优化后的传输口在匹配时的自由度比值;σ表示所述接收口与优化后的传输口的匹配灵敏度;a表示优化后的传输口在接收到所述网络转换数据时的数据分辨率;u所述接收口与优化后的传输口的匹配系数;
将当前所述接收口与优化后的传输口的适配度与预设标准适配度进行比较;
若当前所述接收口与优化后的传输口的适配度等于或大于所述预设标准适配度,判定所述接收口与优化后的传输口适配;
否则,判定所述接收口与优化后的传输口不适配,并对所述接收口与优化后的传输口进行二次优化。
该实施例中,数据回归系数指的是输出接口中外界影响因素对数据传输效果的影响,外界影响因素越大,数据传输效果越差。
该实施例中,匹配系数、匹配灵敏度是预先进行训练设定好的。
该实施例中,获取适配度时的初始学习率的取值范围为(0,1)。
上述技术方案的有益效果是:通过公式,计算接收口与优化后的传输口的适配度,来判断是否需要进行二次优化,来保证传输数据口的统一性,便于数据整合后,有利于数据的传输,其主要通过涉及数据节点的数据平均值、匹配灵敏度、网络转换数据时的数据分辨率,确保了在计算适配度时对外界因素影响的考虑,来保证判断的精准性,便于后续的有效判断。
本发明提出一种基于金融风控业务的外部数据整合方法,对所述接收口与优化后的传输口进行二次优化包括:
基于当前所述接收口与优化后的传输口的适配度,确定所述接收口与优化后的传输口的优化特征值;
Figure BDA0002854640800000141
其中,M表示所述接收口与优化后的传输口的优化特征值;ξ表示所述接收口与优化后的传输口的适配度;τ表示所述接收口与优化后的传输口的疲劳系数;σ表示当前优化后的传输口接收所述网络转换测试数据的梯度值;q表示所述述接收口与优化后的传输口在获取适配度时的初始学习率;Q表示所述接收口与优化后的传输口在获取优化特征值时的自动调整学习率;k表示优化系数;s表示所述接收口与优化后的传输口之间平滑系数,且取值范围为
Figure BDA0002854640800000142
f表示优化后的传输口接收到所述网络转换测试数据所需要的优化梯度值;
基于所述接收口与优化后的传输口的优化特征值,从优化数据库中,调取与优化特征值相关的接口优化模型;
同时,根据所述接收口与优化后的传输口的适配度与所述预设标准适配度之间的差异度以及所述优化后的传输口上叠加的待扩展开口函数,从差异数据库中,调取接口差异模型;
基于所述接口优化模型和接口差异模型,对所述接收口与优化后的传输口进行二次优化。
该实施例中,优化特征值时的自动调整学习率的取值范围为(0,1)。
该实施例中,优化数据库以及差异数据库是预先设定好的,且对应的接口优化模型,例如是升级接口,提高其格式的兼容性,且接口差异模型,例如接口只接收a类型的数据,但是经过接口差异模型处理后,可以接收a、b两种类型的数据。
上述技术方案的有益效果是:当适配度与预设的不符合时,通过基于适配度的基础上,根据公式,计算优化特征值,其涉及适配度时的初始学习率、自动调整学习率、转换测试数据的梯度值,确保涉及的参数对接口优化是必不可少的因素,最终通过优化特征值以及对应的差异度和待扩展开口函数,确定的模型,来对接收口与优化后的传输口进行优化,便于保证数据格式的统一性,且还便于确保数据在进行可视化操作时数据传输的高效性、及时性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种基于金融风控业务的外部数据整合方法,其特征在于,包括:
采集不同结构的外部数据;
基于同步传输规则,将采集的外部数据进行同步传输到预处理场景,进行预处理;
按照预设数据整合模型以及统一性整合规律,将预处理后的外部数据进行整合处理;
将整合处理结果进行可视化展现;
其中,将预处理后的外部数据进行整合处理,其整合处理的步骤包括:
对所述外部数据的数据结构进行预处理,获取所述外部数据的内存字段信息;
设置所述外部数据的内存字段信息的关键字段值,并根据所述关键字段值对所述外部数据进行排序,并按照排序结果分成N个外部数据包;
从所述N个外部数据包中选取包含所述内存字段信息齐全的有效数据,同时,将所述有效数据进行分解,分解为对象、属性两类基本元素;
将分解好的所述对象、属性两类基本元素进行分类整理,并在所述N个外部数据包内创建表格;
同时,根据所述表格获取表格模板,并读取所述对象中的第一内容值,以及读取属性中的第二内容值;
基于预设匹配数据集对所述第一内容值与所述第二内容值进行匹配,同时,将符合匹配的所述第一内容值与所述第二内容值建立映射关系;
基于所述映射关系,构建所述N个外部数据包中有关于所述有效数据的N个目标数据文件;
获取所述目标数据文件中的目标数据压缩比率,同时,获取所述有效数据的数据长度;
根据所述数据长度,并按照所述目标数据压缩比率,计算所述有效数据在所述目标数据文件中进行压缩所需要的压缩时间;
基于所述压缩时间,对所述N个目标数据文件中的所述有效数据按照所述目标数据压缩比率进行压缩整合,获取整合好的所述外部数据。
2.如权利要求1所述的外部数据整合方法,其特征在于,将采集的外部数据进行同步传输到预处理场景,进行预处理的步骤包括:
对所述外部数据进行聚类分析,获得数据集合,且所述数据集合包括M条子数据;
确定每条子数据的数据属性,并按照所述数据属性,从场景数据库中调取相关的预处理子场景,且多个预处理子场景构成预处理场景;
将每条所述子数据同步传输到对应的预处理子场景中,同时,按照所述子数据的数据状态,对所述预处理子场景进行条件部署以及空间场景调度;
其中,所述数据状态与所述子数据中存在的源数据和目标数据相关。
3.如权利要求1所述的外部数据整合方法,其特征在于,将采集的外部数据进行同步传输到预处理场景之前,还包括:
确定所述预处理场景对应的接收口;
同时,确定所述外部数据的数据类型,并按照所述数据类型,判断传输所述外部数据的传输口的传输类型是否包括所述数据类型在内;
若包括,判断所述接收口与所述传输口是否适配;
若不包括,确定差别类型,同时,调取与所述差别类型相关的待扩展开口函数,并将所述待扩展开口函数叠加在传输外部数据的传输口所对应的程序中,来对传输口进行优化,同时,判断所述接收口与优化后的传输口是否适配。
4.如权利要求1所述的外部数据整合方法,其特征在于,
所述不同结构的外部数据包括:结构化数据、半结构化数据、非结构化数据;
所述统一性整合规律与数据业务、数据指标相关;
所述可视化展现包括:BI报表展示或者视图展示。
5.如权利要求1所述的外部数据整合方法,其特征在于,将整合处理结果进行可视化展现包括:
确定与所述预处理场景相关的所有展示节点以及基于所述展示节点构成的展示路径,并基于所述展示节点以及展示路径,构成第一展示树,且所述第一展示树是包括多个展示层在内的,且每个展示层包括至少两个展示节点以及至少一条展示路径;
确定所述展示节点是否响应所述整合处理结果,若响应,将所述展示节点保留使用,否则,将所述展示节点暂留使用,同时,根据响应的展示节点对所述第一展示树进行调整,获得第二展示树;
对所述整合处理结果进行聚类分析,确定主金融类型、次金融类型以及影响金融类型;
所述主金融类型、次金融类型以及影响金融类型融合到所述第二展示树中,获取第三展示树;
从所述第三展示树中提取与所述整合处理结果相关的待需要层,并对所述待需要层进行层级排序,构建层级路径,并按照所述层级路径以及所述待需要层的展示路径,将所述整合处理结果进行可视化展现;
其中,所述展示节点与预设金融类型以及与所述预设金融类型对应的可展示结果相关。
6.如权利要求3所述的外部数据整合方法,其特征在于,判断所述接收口与优化后的传输口是否适配包括:
获取所述接收口的网络测试数据,并将所述网络测试数据进行转换,获取网络转换测试数据;
将所述网络转换测试数据向优化后的传输口发送,并获取此时优化后的传输口所接收到所述网络转换测试数据的传递速率;
根据所述传递速率,确定优化后的传输口的数据回归系数,并根据所述数据回归系数,计算所述接收口与优化后的传输口的适配度;
Figure FDA0004220607550000041
其中,ξ表示所述接收口与优化后的传输口的适配度;λ表示优化后的传输口的数据回归系数;
Figure FDA0004220607550000042
表示第i个所述网络转换测试数据节点的数据平均值;i表示所述网络转换测试数据的数据节点;δ表示所述网络转换测试数据的标准差;v表示所述传递速率;v1表示所述传输口所能接收的最大数据传递速率;g表示所述接收口与优化后的传输口在匹配时的自由度比值;σ表示所述接收口与优化后的传输口的匹配灵敏度;a表示优化后的传输口在接收到所述网络转换测试数据时的数据分辨率;u所述接收口与优化后的传输口的匹配系数;
将当前所述接收口与优化后的传输口的适配度与预设标准适配度进行比较;
若当前所述接收口与优化后的传输口的适配度等于或大于所述预设标准适配度,判定所述接收口与优化后的传输口适配;
否则,判定所述接收口与优化后的传输口不适配,并对所述接收口与优化后的传输口进行二次优化。
CN202011540099.6A 2020-12-23 2020-12-23 一种基于金融风控业务的外部数据整合方法 Active CN112559618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011540099.6A CN112559618B (zh) 2020-12-23 2020-12-23 一种基于金融风控业务的外部数据整合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011540099.6A CN112559618B (zh) 2020-12-23 2020-12-23 一种基于金融风控业务的外部数据整合方法

Publications (2)

Publication Number Publication Date
CN112559618A CN112559618A (zh) 2021-03-26
CN112559618B true CN112559618B (zh) 2023-07-11

Family

ID=75031598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011540099.6A Active CN112559618B (zh) 2020-12-23 2020-12-23 一种基于金融风控业务的外部数据整合方法

Country Status (1)

Country Link
CN (1) CN112559618B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101594537A (zh) * 2009-06-04 2009-12-02 京北方科技股份有限公司 海量图像数据压缩方法
WO2010042486A1 (en) * 2008-10-07 2010-04-15 Euclid Discoveries, Llc Feature-based video compression
CN105681920A (zh) * 2015-12-30 2016-06-15 深圳市鹰硕音频科技有限公司 一种具有语音识别功能的网络教学方法及系统
CN106649344A (zh) * 2015-10-31 2017-05-10 华为数字技术(苏州)有限公司 一种网络日志压缩方法和装置
CN107256219A (zh) * 2017-04-24 2017-10-17 卡斯柯信号有限公司 应用于自动列车控制系统海量日志的大数据融合分析方法
CN107633075A (zh) * 2017-09-22 2018-01-26 吉林大学 一种多源异构数据融合平台及融合方法
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统
CN109523446A (zh) * 2018-10-19 2019-03-26 北京北大软件工程股份有限公司 一种面向价格领域的大数据处理分析系统
CN109582667A (zh) * 2018-10-16 2019-04-05 中国电力科学研究院有限公司 一种基于电力调控大数据的多数据库混合存储方法及系统
CN109661779A (zh) * 2016-12-06 2019-04-19 奥斯佩普尔有限公司 用于压缩数据的方法和系统
CN110431545A (zh) * 2017-03-31 2019-11-08 亚马逊科技公司 针对结构化数据和非结构化数据执行查询
CN110489480A (zh) * 2019-07-04 2019-11-22 华北电力大学 一种测井数据多属性快速切换可视化方法
CN111177101A (zh) * 2019-12-18 2020-05-19 广西电网有限责任公司电力科学研究院 一种基于大数据架构的配电网多维可视化平台
CN111552899A (zh) * 2020-03-20 2020-08-18 广联达科技股份有限公司 提升前端报表显示性能的方法及系统
CN111708773A (zh) * 2020-08-13 2020-09-25 江苏宝和数据股份有限公司 一种多源科创资源数据融合方法
CN111709516A (zh) * 2020-06-09 2020-09-25 深圳先进技术研究院 神经网络模型的压缩方法及压缩装置、存储介质、设备
CN111768457A (zh) * 2020-05-14 2020-10-13 北京航空航天大学 图像数据压缩方法、装置、电子设备和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7961960B2 (en) * 2006-08-24 2011-06-14 Dell Products L.P. Methods and apparatus for reducing storage size
US9367601B2 (en) * 2012-03-26 2016-06-14 Duke University Cost-based optimization of configuration parameters and cluster sizing for hadoop
US11392561B2 (en) * 2018-09-28 2022-07-19 Oracle International Corporation Data migration using source classification and mapping

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010042486A1 (en) * 2008-10-07 2010-04-15 Euclid Discoveries, Llc Feature-based video compression
CN101594537A (zh) * 2009-06-04 2009-12-02 京北方科技股份有限公司 海量图像数据压缩方法
CN106649344A (zh) * 2015-10-31 2017-05-10 华为数字技术(苏州)有限公司 一种网络日志压缩方法和装置
CN105681920A (zh) * 2015-12-30 2016-06-15 深圳市鹰硕音频科技有限公司 一种具有语音识别功能的网络教学方法及系统
CN109661779A (zh) * 2016-12-06 2019-04-19 奥斯佩普尔有限公司 用于压缩数据的方法和系统
CN110431545A (zh) * 2017-03-31 2019-11-08 亚马逊科技公司 针对结构化数据和非结构化数据执行查询
CN107256219A (zh) * 2017-04-24 2017-10-17 卡斯柯信号有限公司 应用于自动列车控制系统海量日志的大数据融合分析方法
CN107633075A (zh) * 2017-09-22 2018-01-26 吉林大学 一种多源异构数据融合平台及融合方法
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统
CN109582667A (zh) * 2018-10-16 2019-04-05 中国电力科学研究院有限公司 一种基于电力调控大数据的多数据库混合存储方法及系统
CN109523446A (zh) * 2018-10-19 2019-03-26 北京北大软件工程股份有限公司 一种面向价格领域的大数据处理分析系统
CN110489480A (zh) * 2019-07-04 2019-11-22 华北电力大学 一种测井数据多属性快速切换可视化方法
CN111177101A (zh) * 2019-12-18 2020-05-19 广西电网有限责任公司电力科学研究院 一种基于大数据架构的配电网多维可视化平台
CN111552899A (zh) * 2020-03-20 2020-08-18 广联达科技股份有限公司 提升前端报表显示性能的方法及系统
CN111768457A (zh) * 2020-05-14 2020-10-13 北京航空航天大学 图像数据压缩方法、装置、电子设备和存储介质
CN111709516A (zh) * 2020-06-09 2020-09-25 深圳先进技术研究院 神经网络模型的压缩方法及压缩装置、存储介质、设备
CN111708773A (zh) * 2020-08-13 2020-09-25 江苏宝和数据股份有限公司 一种多源科创资源数据融合方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WebGIS多层次矢量数据压缩方法及仿真实现;赵艳伟等;《系统仿真学报》;20120608(第06期);第113-118页 *
基于GEP的流数据分类压缩并行算法研究;杨文等;《广西师范大学学报(自然科学版)》;20130915(第03期);第92-98页 *

Also Published As

Publication number Publication date
CN112559618A (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
Wulder et al. An accuracy assessment framework for large‐area land cover classification products derived from medium‐resolution satellite data
CN108351898A (zh) 用于结构化多字段文件布局的自动化解释
CN103605651A (zh) 一种基于olap多维分析的数据处理展现方法
CN113487275B (zh) 一种基于区块链的实验室检测报告管理系统
CN110263009A (zh) 日志分类规则的生成方法、装置、设备及可读存储介质
KR101125417B1 (ko) 데이터 품질 진단 방법과 시스템
US20040083422A1 (en) System and method for automatically generating patent analysis reports
CN109002470A (zh) 知识图谱构建方法及装置、客户端
CN108197301A (zh) 一种用于量化不同券商app行情刷新速度的方法
CN109582859B (zh) 保险推送方法、装置、计算机设备及存储介质
CN112559618B (zh) 一种基于金融风控业务的外部数据整合方法
CN114003568A (zh) 数据处理的方法及相关装置
US20210286782A1 (en) Data complementing system and data complementing method
Woods et al. Exploring methods for mapping seasonal population changes using mobile phone data
CN115510074B (zh) 基于一张表的分布式数据管理及应用系统
CN110209575A (zh) 测试文档生成方法、装置、电子设备及存储介质
KR20010070557A (ko) 무선 통신 단말기를 이용한 리서치 시스템 및 그 방법
CN116089490A (zh) 数据分析方法、装置、终端和存储介质
CN112001539B (zh) 一种高精度的客运预测方法及客运预测系统
CN113408964A (zh) 一种基于综合评价体系辅助政府碳管理的方法
CN111914218A (zh) 一种面向用户应用的灾害遥感产品真实性检验方法
CN117131257B (zh) 一种基于aigc的资讯文档收集系统
CN116739646B (zh) 网络交易大数据分析方法及分析系统
CN116955463B (zh) 多源异构数据整合系统
CN117271629A (zh) 一种基于大数据的财政数据调取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant