CN115438109A - 一种数据处理方法、装置、电子设备及存储介质 - Google Patents

一种数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115438109A
CN115438109A CN202210990333.8A CN202210990333A CN115438109A CN 115438109 A CN115438109 A CN 115438109A CN 202210990333 A CN202210990333 A CN 202210990333A CN 115438109 A CN115438109 A CN 115438109A
Authority
CN
China
Prior art keywords
data
service data
service
asset management
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210990333.8A
Other languages
English (en)
Inventor
钟荣清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202210990333.8A priority Critical patent/CN115438109A/zh
Publication of CN115438109A publication Critical patent/CN115438109A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种数据处理方法、装置、电子设备及存储介质,能够对多个数据源的资产管理业务数据进行转换和清洗,并按照多维客户信息的数据整合模板进行归并整合,得到资产管理业务数据。根据本申请实施例,将数据转换为结构化,去除未能转换为结构化的数据,并对多个数据源的资产管理业务数据进行统一整合,不仅可以整合不同系统的资产管理业务数据,还减少多元化异构数据的冗余和错误,提高资产管理业务数据的准确性,无需在业务交互时对来自不同数据源的资产管理业务数据进行处理,从而保障交互的及时性。

Description

一种数据处理方法、装置、电子设备及存储介质
技术领域
本申请属于资产管理技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
随着资产管理业务的快速发展,为鼓励金融机构充分释放资产管理数据潜能,推动业务由经验决策向数据决策的转变,从而促进资产管理行业的增长和创新,因此,需要将资产管理从业务驱动转为数据化驱动。
然而,现有的资产管理业务体系从负债端到资产端,资产管理业务数据往往分散在不同系统,资产管理机构在面临着海量多元化异构数据时,无法对资产管理业务数据进行整合,不仅增加数据的冗余和错误,还造成数据业务交互不及时。
发明内容
本申请实施例提供一种数据处理方法、装置、电子设备及存储介质,能够对多个数据源的资产管理业务数据进行统一整合,无需再业务交互时对来自不同数据源的资产管理业务数据进行处理,从而保障交互的及时性。
第一方面,本申请实施例提供一种数据处理方法,方法包括:
获取来自多个数据源的资产管理业务数据;
将所述资产管理业务数据转换为结构化数据,得到第一业务数据;
去除所述第一业务数据中未转换为结构化数据的数据,得到第二业务数据;
根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据。
在一些实施例中,在所述去除所述第一业务数据中未转换为结构化数据的数据,得到第二业务数据之后,所述方法还包括:
根据所述第二业务数据对应的标准数据特性,校验所述第二业务数据是否缺失和/或错误,得到校验结果;
在所述校验结果为不通过的情况下,生成验证提示信息。
在一些实施例中,所述数据整合模板为包括多维客户信息的模板,所述多维客户信息包括客户基本信息、客户交易信息和资产关联人信息中至少两个,
所述根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据,包括:
根据所述数据整合模板中的多维客户信息对所述第二业务数据进行归类,得到第三业务数据;
根据所述数据整合模板,对所述第三业务数据按照对应客户进行整合,得到归并整合后的标准业务数据。
在一些实施例中,在所述根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据之后,还包括:
响应于用户对客户信息筛选条件的输入,从所述标准业务数据中筛选满足所述客户信息筛选条件的目标客户数据;
按照预设图表方式,显示所述目标客户数据。
在一些实施例中,在所述根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据之后,所述方法还包括:
获取所述标准业务数据的特征属性;所述特征属性包括数据源、渠道方式、产品申赎和接入方式中至少一项;
根据所述特征属性,对所述标准业务数据设置标签,得到分类标签数据。
在一些实施例中,在所述根据所述特征属性,对所述标准业务数据设置标签,得到分类标签数据之后,所述方法还包括:
获取资产管理的业务需求信息;
根据所述业务需求信息对应的标签,从所述分类标签数据中筛选目标业务数据;
从所述业务需求信息对应的业务处理指标中筛选目标处理指标,所述目标处理指标的配置参数可调节;
按照所述目标处理指标对所述目标业务数据进行处理,得到业务处理结果;
输出所述业务处理结果。
第二方面,本申请实施例提供了一种数据处理装置,装置包括:
获取模块,用于获取来自多个数据源的资产管理业务数据;
转换模块,用于将所述资产管理业务数据转换为结构化数据,得到第一业务数据;
去除模块,用于去除所述第一业务数据中未转换为结构化数据的数据,得到第二业务数据;
整合模块,用于根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据。
在一些实施例中,所述装置还包括:
校验模块,用于根据所述第二业务数据对应的标准数据特性,校验所述第二业务数据是否缺失和/或错误,得到校验结果;
所述校验模块,用于在所述校验结果为不通过的情况下,生成验证提示信息。
在一些实施例中,所述数据整合模板为包括多维客户信息的模板,所述多维客户信息包括客户基本信息、客户交易信息和资产关联人信息中至少两个,
所述整合模块,还用于根据所述数据整合模板中的多维客户信息对所述第二业务数据进行归类,得到第三业务数据;
所述整合模块,还用于根据所述数据整合模板,对所述第三业务数据按照对应客户进行整合,得到归并整合后的标准业务数据。
在一些实施例中,所述装置还包括:
第一筛选模块,用于响应于用户对客户信息筛选条件的输入,从所述标准业务数据中筛选满足所述客户信息筛选条件的目标客户数据;
显示模块,用于按照预设图表方式,显示所述目标客户数据。
在一些实施例中,还包括:
所述获取模块,还用于获取所述标准业务数据的特征属性;所述特征属性包括数据源、渠道方式、产品申赎和接入方式中至少一项;
标签设置模块,用于根据所述特征属性,对所述标准业务数据设置标签,得到分类标签数据。
在一些实施例中,还包括:
所述获取模块,还用于获取资产管理的业务需求信息;
第二筛选模块,用于根据所述业务需求信息对应的标签,从所述分类标签数据中筛选目标业务数据;
所述第二筛选模块,用于从所述业务需求信息对应的业务处理指标中筛选目标处理指标,所述目标处理指标的配置参数可调节;
业务处理模块,用于按照所述目标处理指标对所述目标业务数据进行处理,得到业务处理结果;
输出模块,用于输出所述业务处理结果。
第三方面,本申请实施例提供了一种电子设备,设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如上任意一项所述的数据处理方法。
第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上任意一项所述的数据处理方法。
第五方面,本申请实施例提供了一种程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如上任意一项所述的数据处理方法。
本申请实施例的数据处理方法、装置、电子设备及存储介质,能够对多个数据源的资产管理业务数据进行转换和清洗,并按照多维客户信息的数据整合模板进行归并整合,得到资产管理业务数据。如此,本申请实施例,将数据转换为结构化,去除未能转换为结构化的数据,并对多个数据源的资产管理业务数据进行统一整合,不仅可以整合不同系统的资产管理业务数据,还减少多元化异构数据的冗余和错误,提高资产管理业务数据的准确性,无需在业务交互时对来自不同数据源的资产管理业务数据进行处理,从而保障交互的及时性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的数据处理方法的流程示意图;
图2是本申请实施例提供的数据处理装置的结构示意图;
图3是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
如背景技术部分所述,现有的资产管理业务体系从负债端到资产端,资产管理业务数据往往分散在不同系统,资产管理机构在面临着海量多元化异构数据时,无法对资产管理业务数据进行整合,不仅增加数据的冗余和错误,还造成数据业务交互不及时。
当前资产管理业务数据整合存在以几个难点:
一是数据需求不明确,导致整合的数据无法满足需求;
二是数据收集的范围不清晰,每个业务子系统根据自己业务子系统流程来组织数据,各自为政,未形成统一化管理;
三是不同业务子系统的复杂性和多样性,导致整合增加了数据冗余和错误。
如何利用大数据手段,通过将资产管理数据和金融科技融合,建立一套统一的客户数据整合平台,实现数据统一、服务统一,进而对资产管理业务数据进行数据挖掘、关联分析,从而提供全方位的风险管理工具,满足监管要求,优化资产配置和组合,提升资产管理风险管理能力,推动资产管理业务健康快速发展,是本申请所要解决的技术问题。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
为了解决现有技术问题,本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质。下面首先对本申请实施例所提供的数据处理方法进行介绍。
图1示出了本申请一个实施例提供的数据处理方法的流程示意图。如图1所示,一种数据处理方法,可以包括以下步骤S101至S104:
S101、获取来自多个数据源的资产管理业务数据;
S102、将资产管理业务数据转换为结构化数据,得到第一业务数据;
S103、去除第一业务数据中未转换为结构化数据的数据,得到第二业务数据;
S104、根据预设数据整合模板,对第二业务数据进行归并整合,得到归并整合后的标准业务数据。
本实施例中,能够对多个数据源的资产管理业务数据进行转换和清洗,并按照多维客户信息的数据整合模板进行归并整合,得到资产管理业务数据。如此,本申请实施例,将数据转换为结构化,去除未能转换为结构化的数据,并对多个数据源的资产管理业务数据进行统一整合,不仅可以整合不同系统的资产管理业务数据,还减少多元化异构数据的冗余和错误,提高资产管理业务数据的准确性,无需在业务交互时对来自不同数据源的资产管理业务数据进行处理,从而保障交互的及时性。
下面介绍上述各个步骤的具体实现方式。
在S101中,上述多个数据源的资产管理业务数据包括业务子系统的数据和外部金融市场的数据。示例性地,业务子系统的数据包括来自资产管理业务体系的直销、基金登记结算系统(Transfer Agent,TA)、交易、非标、投研和估值等子系统数据,外部金融市场的数据包括万得、财汇和路透等数据。
上述基金登记结算系统是中国结算公司开放式基金登记结算系统,用于登记投资者在上海证券账户或者深圳账户内的基金份额。
上述获取来自多个数据源的资产管理业务数据,可以是基于大数据云平台获取。示例性地,大数据云平台可以是大规模并行处理(Massively Parallel Processor,MPP)云平台,在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商用网络互相连接,批次系统计算,作为整体提供数据库服务。
在S102中,上述资产管理业务数据包括结构化数据和非结构化数据。结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。与结构化数据相对的是不适于由数据库二维表来表现的非结构化数据,包括所有格式的办公文档、可扩展标记语言(ExtensibleMarkup Language,XML)、超文本标记语言(Hyper Text Markup Language,HTML)、各类报表、图片和音频和视频信息等数据。
上述将资产管理业务数据转换为结构化数据,得到第一业务数据可以是通过大数据云的调度工具自动将所有非结构化的资产管理业务数据转换为结构化数据,即得到第一业务数据。
上述调度工具可以是气流(Airflow)调度工具,是大数据领域中一款任务调度工具,用于数据管道(data pipeline)的调度和监控。
在S103中,上述去除第一业务数据中未转换为结构化数据的数据,得到第二业务数据,可以是通过人工干预清洗去除未能转为结构化数据的无用数据,从而得到第二业务数据。
在S104中,上述根据预设数据整合模板,对第二业务数据进行归并整合,得到归并整合后的标准业务数据,可以是按照第二业务数据的数据源的一定顺序,根据预设数据整合模板进行归并整合,得到标准业务数据。
在一些实施例中,上述数据整合模板为包括多维客户信息的模板,上述多维客户信息包括客户基本信息、客户交易信息和资产关联人信息中至少两个,相应地,S104可以具体包括:
根据数据整合模板中的多维客户信息对第二业务数据进行归类,得到第三业务数据;
根据数据整合模板,对第三业务数据按照对应客户进行整合,得到归并整合后的标准业务数据。
上述客户基本信息可以是包括姓名、出生日期、户籍地址和身份证号等表示客户身份的基本信息。
上述客户交易信息可以是客户申赎产品信息、交易数量信息等信息。其中申赎产品可以是客户的理财产品和/或托管产品。
上述资产关联人信息可以是客户的理财产品或托管产品的管理人、控股股东、受益人、受托人和托管人等等资产关联人的信息。
上述根据数据整合模板中的多维客户信息对第二业务数据进行归类,得到第三业务数据和根据数据整合模板,对第三业务数据按照对应客户进行整合,得到归并整合后的标准业务数据可以是通过数据整合加工工具实现。
本实施例中,按照包括多维客户信息的数据整合模板,对第二业务数据进行归并整合,得到标准业务数据,可以规整资产管理业务数据,对同一客户信息合并整理,有效合并同类项,减少源数据的冗余,避免一人多户和重复管理分析的情况。
作为本申请的一种实现方式,为了提高第二业务数据的准确性,在步骤S103之后,还可以包括以下步骤:
根据第二业务数据对应的标准数据特性,校验第二业务数据是否缺失和/或错误,得到校验结果;
在校验结果为不通过的情况下,生成验证提示信息。
上述标准数据特性可以是基于第二业务数据的类型所对应的标准特性。
示例性的,客户基本信息中的身份证号码的标准数据特性是18位的字符串,其中1~6位为地区代码,1和2位数为各省级政府的代码,3和4位数为地、市级政府的代码,5和6位数为县、区级政府代码,第7~14位数字表示出生年、月、日;第15、16位数字表示所在地的派出所的代码;第17位数字表示性别奇数表示男性,偶数表示女性;第18位数字是校检码,可以是0~9的数字,有时也用x表示。
在第二业务数据为身份证号码的情况下,第二业务数据与身份证号码对应的标准数据特性进行校验,得到校验结果,若第二数据存在缺失和/或错误的情况,则校验结果为不通过,并且生成验证提示信息,用于提醒客户补充或修改第二业务数据。
上述第二业务数据不仅限于身份证号码,还可以是其他资产管理业务数据相关的数据,在本实施例中不做具体限定。
本实施例中,通过标准数据特性,可以对不准确的第二业务数据进行校验,并通过验证提示信息进行提醒,减少资产管理业务数据的错误,从而提高资产管理业务处理的准确性。
作为本申请的另一种实现方式,为了便于用户更加直观的了解目标客户的数据,在步骤S104之后,还可以包括以下步骤:
响应于用户对客户信息筛选条件的输入,从标准业务数据中筛选满足客户信息筛选条件的目标客户数据;
按照预设图表方式,显示目标客户数据。
上述客户信息可以是客户基本信息和客户交易信息。
上述图表方式可以是星型图、雪花图、条形图、柱状图、饼图、环形图、面积图、线形图和散点图等形式的图像和表格展示,本实施例中,不仅限于此,在此不作限定。
本实施例中,从标准业务数据中筛选满足客户信息筛选条件的目标客户数据,通过图表方式显示,可以更为直观和全面的展示相关数据。
在以上实施例中,为了便于调取资产管理业务需求相应的数据,在步骤S104之后,还可以包括:
获取标准业务数据的特征属性;
根据特征属性,对标准业务数据设置标签,得到分类标签数据。
上述特征属性可以包括数据源、渠道方式、产品申赎和接入方式中至少一项。
上述数据源包括TA、非标和交易等资产管理业务子系统,上述渠道方式包括柜面、应用端,上述产品申赎包括申购的产品,上述接入方式包括联机和批量。
上述获取标准业务数据的特征属性可以是通过Airflow调度工具获取。
本实施例中,根据标注业务数据的特征属性进行分类,并设置相应标签,便于不同资产管理的业务需求中调取相应的数据。
在一些实施例中,基于上述整合标签后的分类标签数据,为了支撑不同业务需求的资产管理,进而对数据进行挖掘分析处理,实现资产管理配置提升和优化,在上述根据特征属性,对标准业务数据设置标签,得到分类标签数据之后,方法还包括:
获取资产管理的业务需求信息;
根据业务需求信息对应的标签,从分类标签数据中筛选目标业务数据;
从业务需求信息对应的业务处理指标中筛选目标处理指标;
按照目标处理指标对目标业务数据进行处理,得到业务处理结果;
输出业务处理结果。
上述业务需求信息包括资产管理的监管报送、风险管理、客户画像、投资画像、咨询画像、高管决策、运营支撑、报表应用、指标应用、模型分析和主题分析等。
上述目标业务数据为在分类标签数据中与业务需求信息对应的数据。
上述业务处理指标为与业务需求信息对应的业务处理规则的预设指标。
上述目标处理指标为用户在业务处理指标中灵活筛选的指标,其中,目标处理指标的配置参数可调节。
上述业务处理结果可以是对应业务需求信息的分析报告。
上述按照目标处理指标对目标业务数据进行处理,得到业务处理结果,可以是基于MPP大数据云平台,通过离线计算和/或流式计算进行处理。其中,离线计算主要满足实时性要求较低和数据量较大的业务需求计量,如批量回溯客户反洗钱清单筛查、投后资产管理风险限额指标等计量和生产风险预警指标。相应地,流式计算适用于实时性要求高的业务需求计量。
本实施例中,可以基于上述整合标签后的分类标签数据,根据不同业务需求信息,筛选目标处理指标对目标业务数据进行处理,从而支撑不同业务需求的资产管理,进而对数据进行挖掘分析处理,实现资产管理配置提升和优化。
为了便于对本申请实施例中的数据处理方法的理解,对此数据处理方法的实际应用过程进行说明,并基于业务需求信息对目标业务数据进行处理的实际应用过程也进行说明,具体如下:
(1)数据接入:基于大数据云平台的Airflow调度工具,将业务系统中的TA、非标、交易、投研及其他子系统的数据,和外部市场的万得、财汇、路透及其他子系统的数据通过交互区进入云平台贴源区。
(2)数据转化清洗:通过大数据云的airflow调度工具和数据整合加工工具,系统自动将所有非结构化的数据转化成结构化数据,对于部分无法自动化数据通过人工干预清洗,去除无用数据。
(3)数据规整:取出所有结构化的数据根据业务需求,根据数据源按一定的顺序,通过整合数据模型的规则(例如,客户要素、关联关系等信息),进行归并整合,得到整合后的客户数据。
(4)基于整合后的客户数据,应用到风险管理、监管对接或投研分析等业务需求中。
基于MPP大数据云中心的资产管理体系数据整合架构,在资产管理的业务需求信息为市场指数行情变化情况,大数据云实时接入万得指数行情,通过流式计算方式,实时计量市场风险,生成市场风险结果,并还可以邮件或者短信方式推送相应的投资经理,经投资经理和风险经理确认后的一级事件类型、二级事件类型进行相应的风险处置措施,如进行某类资产减仓处理,资产变现管理等,满足理财资产管理公司风险管理需求。
在反洗钱清单筛查的业务需求处理中,大数据云平台自动获取直销或者代销标签整合后的同一客户数据,整合客户通过不同渠道理财产品申赎数据,调用自主化Solr引擎(例如,反洗钱清单筛查引擎),并灵活自定义设置特定数据源(例如,直销、TA、非标等)、特定理财产品、联机或批量方式等目标处理指标,批量数据线推送至可疑交易风险模型计量分析组件进行可疑交易分析,进行反洗钱清单筛查,筛选出客户可疑交易数据,经业务审核确认后,生成监管反洗钱可疑交易报文,并根据监管要求,完成可疑交易报文报送。
在资产投研分析的业务需求处理中,大数据平台整合基金经理管理的产品资产数据,完成底层资产穿透分析,推送至风险绩效计量引擎组件,进行投资组合中股票、债券等资产收益归因计量,生产归因分析报告。
在资产管理风险管理黑名单的业务需求中,通过灵活设置目标处理指标(即发行主体黑名单筛查规则),得到资产管理风险管理黑名单。
在客户完整新数据检查的业务需求处理中,可以灵活设置数据源、特定客户类型、校验字段和校验规则,完成对资产管理体系客户完整性数据检查。
基于上述实施例提供的数据处理方法,相应地,本申请还提供了一种数据处理装置的具体实现方式。请参见以下实施例。
如图2所示,本申请实施例提供的数据处理装置200,可以包括以下模块:
获取模块201,用于获取来自多个数据源的资产管理业务数据;
转换模块202,用于将资产管理业务数据转换为结构化数据,得到第一业务数据;
去除模块203,用于去除第一业务数据中未转换为结构化数据的数据,得到第二业务数据;
整合模块204,用于根据预设数据整合模板,对第二业务数据进行归并整合,得到归并整合后的标准业务数据。
本实施例中,能够对多个数据源的资产管理业务数据进行转换和清洗,并按照多维客户信息的数据整合模板进行归并整合,得到资产管理业务数据。如此,本申请实施例,将数据转换为结构化,去除未能转换为结构化的数据,并对多个数据源的资产管理业务数据进行统一整合,不仅可以整合不同系统的资产管理业务数据,还减少多元化异构数据的冗余和错误,提高资产管理业务数据的准确性,无需在业务交互时对来自不同数据源的资产管理业务数据进行处理,从而保障交互的及时性。
在一些实施例中,数据整合模板为包括多维客户信息的模板,多维客户信息包括客户基本信息、客户交易信息和资产关联人信息中至少两个,
整合模块204,还用于根据数据整合模板中的多维客户信息对第二业务数据进行归类,得到第三业务数据;
整合模块204,还用于根据数据整合模板,对第三业务数据按照对应客户进行整合,得到归并整合后的标准业务数据。
本实施例中,按照包括多维客户信息的数据整合模板,对第二业务数据进行归并整合,得到标准业务数据,可以规整资产管理业务数据,对同一客户信息合并整理,有效合并同类项,减少源数据的冗余,避免一人多户和重复管理分析的情况。
作为本申请的一种实现方式,为了提高第二业务数据的准确性,上述装置还可以包括:校验模块。
校验模块,用于根据第二业务数据对应的标准数据特性,校验第二业务数据是否缺失和/或错误,得到校验结果;
校验模块,用于在校验结果为不通过的情况下,生成验证提示信息。
本实施例中,通过标准数据特性,可以对不准确的第二业务数据进行校验,并通过验证提示信息进行提醒,减少资产管理业务数据的错误,从而提高资产管理业务处理的准确性。
作为本申请的另一种实现方式,为了便于用户更加直观的了解目标客户的数据,上述装置还可以包括:第一筛选模块和显示模块。
第一筛选模块,用于响应于用户对客户信息筛选条件的输入,从标准业务数据中筛选满足客户信息筛选条件的目标客户数据;
显示模块,用于按照预设图表方式,显示目标客户数据。
本实施例中,从标准业务数据中筛选满足客户信息筛选条件的目标客户数据,通过图表方式显示,可以更为直观和全面的展示相关数据。
在以上实施例中,为了便于调取资产管理业务需求相应的数据,上述装置还可以包括:标签设置模块。
上述获取模块,还用于获取标准业务数据的特征属性;特征属性包括数据源、渠道方式、产品申赎和接入方式中至少一项;
标签设置模块,用于根据特征属性,对标准业务数据设置标签,得到分类标签数据。
本实施例中,根据标注业务数据的特征属性进行分类,并设置相应标签,便于不同资产管理的业务需求中调取相应的数据。
在一些实施例中,基于上述整合标签后的分类标签数据,为了支撑不同业务需求的资产管理,进而对数据进行挖掘分析处理,实现资产管理配置提升和优化,上述装置还可以包括:第二筛选模块、业务处理模块和输出模块。
上述获取模块201,还用于获取资产管理的业务需求信息;
第二筛选模块,用于根据业务需求信息对应的标签,从分类标签数据中筛选目标业务数据;
第二筛选模块,用于从业务需求信息对应的业务处理指标中筛选目标处理指标,目标处理指标的配置参数可调节;
业务处理模块,用于按照目标处理指标对目标业务数据进行处理,得到业务处理结果;
输出模块,用于输出业务处理结果。
本实施例中,可以基于上述整合标签后的分类标签数据,根据不同业务需求信息,筛选目标处理指标对目标业务数据进行处理,从而支撑不同业务需求的资产管理,进而对数据进行挖掘分析处理,实现资产管理配置提升和优化。
图3示出了本申请实施例提供的电子设备的硬件结构示意图。
在电子设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在综合网关容灾设备的内部或外部。在特定实施例中,存储器302是非易失性固态存储器。
在特定实施例中,存储器302可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种数据处理方法。
在一个示例中,电子设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将数据处理设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的数据处理方法,从而实现结合图1和图2描述的数据处理方法和装置。
另外,结合上述实施例中的数据处理方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种数据处理方法。
结合上述实施例中的数据处理方法,本申请实施例还可提供一种计算机程序产品来实现。该计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行时实现上述实施例中的任意一项数据处理方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取来自多个数据源的资产管理业务数据;
将所述资产管理业务数据转换为结构化数据,得到第一业务数据;
去除所述第一业务数据中未转换为结构化数据的数据,得到第二业务数据;
根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据。
2.根据权利要求1所述的方法,其特征在于,在所述去除所述第一业务数据中未转换为结构化数据的数据,得到第二业务数据之后,所述方法还包括:
根据所述第二业务数据对应的标准数据特性,校验所述第二业务数据是否缺失和/或错误,得到校验结果;
在所述校验结果为不通过的情况下,生成验证提示信息。
3.根据权利要求1所述的方法,其特征在于,所述数据整合模板为包括多维客户信息的模板,所述多维客户信息包括客户基本信息、客户交易信息和资产关联人信息中至少两个,
所述根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据,包括:
根据所述数据整合模板中的多维客户信息对所述第二业务数据进行归类,得到第三业务数据;
根据所述数据整合模板,对所述第三业务数据按照对应客户进行整合,得到归并整合后的标准业务数据。
4.根据权利要求1所述的方法,其特征在于,在所述根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据之后,还包括:
响应于用户对客户信息筛选条件的输入,从所述标准业务数据中筛选满足所述客户信息筛选条件的目标客户数据;
按照预设图表方式,显示所述目标客户数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据之后,所述方法还包括:
获取所述标准业务数据的特征属性;所述特征属性包括数据源、渠道方式、产品申赎和接入方式中至少一项;
根据所述特征属性,对所述标准业务数据设置标签,得到分类标签数据。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述特征属性,对所述标准业务数据设置标签,得到分类标签数据之后,所述方法还包括:
获取资产管理的业务需求信息;
根据所述业务需求信息对应的标签,从所述分类标签数据中筛选目标业务数据;
从所述业务需求信息对应的业务处理指标中筛选目标处理指标,所述目标处理指标的配置参数可调节;
按照所述目标处理指标对所述目标业务数据进行处理,得到业务处理结果;
输出所述业务处理结果。
7.一种数据处理装置,其特征在于,包括:
获取模块,用于获取来自多个数据源的资产管理业务数据;
转换模块,用于将所述资产管理业务数据转换为结构化数据,得到第一业务数据;
去除模块,用于去除所述第一业务数据中未转换为结构化数据的数据,得到第二业务数据;
整合模块,用于根据预设数据整合模板,对所述第二业务数据进行归并整合,得到归并整合后的标准业务数据。
8.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-6任意一项所述的数据处理方法。
9.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的数据处理方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-6任意一项所述的数据处理方法。
CN202210990333.8A 2022-08-18 2022-08-18 一种数据处理方法、装置、电子设备及存储介质 Pending CN115438109A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210990333.8A CN115438109A (zh) 2022-08-18 2022-08-18 一种数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210990333.8A CN115438109A (zh) 2022-08-18 2022-08-18 一种数据处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115438109A true CN115438109A (zh) 2022-12-06

Family

ID=84243201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210990333.8A Pending CN115438109A (zh) 2022-08-18 2022-08-18 一种数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115438109A (zh)

Similar Documents

Publication Publication Date Title
US10614528B2 (en) System and method for automatic generation of reports based on electronic documents
WO2021254027A1 (zh) 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN110798567A (zh) 短信分类显示方法及装置、存储介质、电子设备
CN112950359B (zh) 一种用户识别方法和装置
CN113205402A (zh) 对账方法、装置、电子设备及计算机可读介质
US20180018312A1 (en) System and method for monitoring electronic documents
CN111027832A (zh) 一种税务风险确定方法、装置及存储介质
US10558880B2 (en) System and method for finding evidencing electronic documents based on unstructured data
CN111291246A (zh) 一种大数据快速分析系统
CN116228429A (zh) 一种检测交易数据的方法和装置
CN115438109A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN114066652A (zh) 基于多维度模型的债券信用评级方法及相关设备
Lee et al. Novel methods for resolving false positives during the detection of fraudulent activities on stock market financial discussion boards
US10387561B2 (en) System and method for obtaining reissues of electronic documents lacking required data
US20180096435A1 (en) System and method for verifying unstructured enterprise resource planning data
CN110648043A (zh) 基于地址信息的分析方法、装置、电子设备及存储介质
WO2018067698A1 (en) System and method for verifying unstructured enterprise resource planning data
CN114155038B (zh) 受疫情影响用户识别方法
CN111652501B (zh) 金融产品评估装置及方法、电子设备、存储介质
CN116739646B (zh) 网络交易大数据分析方法及分析系统
EP3526758A1 (en) Finding evidencing electronic documents based on unstructured data
CN118780910A (zh) 支付数据联合共建方法、装置、电子设备及存储介质
CN115660661A (zh) 一种线下账单数据处理方法、装置、存储介质及设备
CN118627683A (zh) 一种基于大数据的风险监控方法、设备及介质
KR101617651B1 (ko) 트랜잭션 에디터를 이용한 이 기종간 데이터 전송 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination