CN112380177B - 一种业务数据处理方法、设备、终端及存储介质 - Google Patents

一种业务数据处理方法、设备、终端及存储介质 Download PDF

Info

Publication number
CN112380177B
CN112380177B CN202011289413.8A CN202011289413A CN112380177B CN 112380177 B CN112380177 B CN 112380177B CN 202011289413 A CN202011289413 A CN 202011289413A CN 112380177 B CN112380177 B CN 112380177B
Authority
CN
China
Prior art keywords
client
data
source data
determining
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011289413.8A
Other languages
English (en)
Other versions
CN112380177A (zh
Inventor
邓成杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202011289413.8A priority Critical patent/CN112380177B/zh
Publication of CN112380177A publication Critical patent/CN112380177A/zh
Application granted granted Critical
Publication of CN112380177B publication Critical patent/CN112380177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明实施例涉及金融科技领域,公开了一种业务数据处理方法、设备、终端及存储介质,该方法包括:对获取的保险业务的源数据进行分类,确定出日志类源数据和非日志类源数据;根据源数据确定购买目标保险的客户购买的保单数据,并根据保单数据、日志类源数据和非日志类源数据计算客户行为频次;根据客户行为频次确定客户的历史行为数据对应的进程信息,并根据客户的历史行为数据对应的进程信息和源数据确定客户所属的进程机构信息;根据客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。通过这种方式,可以快速、有效地对多源异构的业务数据进行分析。本发明涉及区块链技术,上述数据可存储于区块链中。

Description

一种业务数据处理方法、设备、终端及存储介质
技术领域
本发明涉及金融科技领域,尤其涉及一种业务数据处理方法、设备、终端及存储介质。
背景技术
目前,保险等金融行业内的数据源较为复杂,数据来源多元化,存在多源异构的情况,并且行业内的数据跨系统计算较多,从而导致存储、计算等消耗较大,以及数据计算依赖设计较复杂的问题。
然而,目前主要采用AARRR模型对用户行为数据进行分析,AARRR模型主要用于对数据来源比较单一,数据源获取较为简单的数据进行分析,对多源异构的数据无法分析或者分析效果较差。因此,如何快速、有效地对多源异构、跨系统计算的数据进行分析非常重要。
发明内容
本发明实施例提供了一种业务数据处理方法、设备、终端及存储介质,可以快速、有效地对多源异构的业务数据进行分析,并可以为企业用户判断流失、转化,提高分析决策,有助于企业经营。
第一方面,本发明实施例提供了一种业务数据处理方法,所述方法包括:
获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;
根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;
根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;
根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
进一步地,所述根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次,包括:
根据所述保单数据确定购买目标保险的客户的客户标识,其中,所述客户标识包括姓名和/或身份证号码;
根据预设的客户标识与保单标识的第一映射关系,确定与所述购买目标保险的客户的客户标识对应的保单标识;
根据与所述购买目标保险的客户的客户标识对应的保单标识,确定所述购买目标保险的客户购买保险的次数,并根据所述客户购买保险的次数确定客户行为频次。
进一步地,所述根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息,包括:
根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,其中,所述进程信息包括进程编码值;
根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
进一步地,所述根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,包括:
根据所述进程信息中包括的进程编码值,按照所述进程编码值从大到小的顺序进行排序;
确定所述排序后的进程编码值中的最大进程编码值对应的进程为所述客户的最大进程。
进一步地,所述根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息,包括:
根据所述源数据中包括的客户通信方式与代理人的第二映射关系,确定与所述客户对应的代理人;
根据所述客户对应的代理人所属的地区和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
进一步地,所述根据所述客户所属的进程机构信息进行机构流转统计,包括:
根据所述客户所属的进程机构信息,获取每个机构下每个进程在每个月的人数集合;
以当前月的上一个月的用户数据作为起点,以及当前月的下一个月的用户数据作为终点,获取所述每个机构在每个进程下的流转人数。
进一步地,所述对所述源数据进行分类,确定出日志类源数据和非日志类源数据,包括:
获取所述源数据的数据格式;
根据所述源数据的数据格式确定与预设的日志类格式匹配的日志类源数据,以及确定与预设的日志类格式不匹配的非日志类源数据。
第二方面,本发明实施例提供了一种业务数据处理设备,所述设备包括:
获取单元,用于获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;
第一确定单元,用于根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;
第二确定单元,用于根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;
统计单元,用于根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
第三方面,本发明实施例提供了一种终端,所述终端包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;
根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;
根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;
根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
本发明实施例,可以获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。通过这种方式,可以快速、有效地对多源异构的业务数据进行分析,并可以为企业用户判断流失、转化,提高分析决策,有助于企业经营。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种业务数据处理方法的流程框图;
图2是本发明实施例提供的一种业务数据处理方法的示意流程图;
图3是本发明实施例提供的一种业务数据处理设备的示意框图;
图4是本发明实施例提供的一种终端的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的业务数据处理方法可以应用于一种业务数据处理设备,在某些实施例中,所述业务数据处理设备设置于终端中。在某些实施例中,所述终端包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等智能终端设备。
本发明实施例可以获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
在一个实施例中,可以图1为例进行说明,图1是本发明实施例提供一种业务数据处理方法的流程框图。如图1所示,业务数据处理设备可以获取保险业务的源数据11,并对所述源数据进行分类,得到日志类源数据111和非日志类源数据112,根据源数据11确定购买目标保险的客户购买的保单数据12,以及根据日志类源数据111、非日志类源数据112和保单数据12,计算客户行为频次13。根据客户行为频次13确定客户的历史行为数据14,根据客户的历史行为数据14确定客户归属的最大进程15,根据所述源数据11确定客户通信方式与代理人的第二映射关系16,根据所述客户通信方式与代理人的第二映射关系16和所述客户归属的最大进程15,确定所述客户所属的进程机构信息17,根据所述客户所属的进程机构信息17确定客户进程的流转信息18,其中,客户进程的流转信息18包括客户进程流转趋势、客户进程按二三级机构统计信息、客户每天的流转信息,并将各客户进程的流转信息同步发送到数据库19中。
本发明实施例通过对多个进程下客户的行为数据进行编码控制,可以快速、有效地对多源异构的业务数据进行分析,提高计算客户行为频次整个计算过程的重复使用性,可维护性,通过计算得到客户的行为数据所对应的进程编码,并根据编码值的大小可以得到客户最终的进程,可以为企业用户判断流失、转化,提高分析决策,助力企业经营。
下面结合附图2对本发明实施例提供的业务数据处理方法进行示意性说明。
请参见图2,图2是本发明实施例提供的一种业务数据处理方法的示意流程图,如图2所示,该方法可以由业务数据处理设备执行,所述业务数据处理设备设置于终端中,具体解释如前所述,此处不再赘述。具体地,本发明实施例的所述方法包括如下步骤。
S201:获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据。
本发明实施例中,业务数据处理设备可以获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据。在某些实施例中,所述保险业务包括但不限于寿险、财险、车险等。
在一个实施例中,业务数据处理设备在对所述源数据进行分类,确定出日志类源数据和非日志类源数据时,可以获取所述源数据的数据格式,并根据所述源数据的数据格式确定与预设的日志类格式匹配的日志类源数据,以及确定与预设的日志类格式不匹配的非日志类源数据。
在一个实施例中,因通过日志类源数据直接进行客户的历史行为数据对应的进程信息进行判断,计算量大,耗时久,因此,在Hadoop集群中,可以提前对日志类源数据中不必要的异常数据进行过滤并备份,以优化存储节约空间。
在具体实施过程中,所述异常数据包括但不限于如电话号码不规范,超过11位或者包含英文字符等,则确定为异常数据。在某些实施例中,可以通过正则表达式判断电话号码是否包含数字,例如,phone_no rlike'^1\\\\d{10}$';在某些实施例中,可以通过正则表达式判断电话号码的长度是否为11位,是否符合逻辑常识、业务规范的数据等,例如,length(phone_no)=11用于判断电话号码的长度是否为11位。
S202:根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次。
本发明实施例中,业务数据处理设备可以根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次。
在一个实施例中,业务数据处理设备在根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次时,可以根据所述保单数据确定购买目标保险的客户的客户标识,其中,所述客户标识包括姓名和/或身份证号码;根据预设的客户标识与保单标识的第一映射关系,确定与所述购买目标保险的客户的客户标识对应的保单标识;根据与所述购买目标保险的客户的客户标识对应的保单标识,确定所述购买目标保险的客户购买保险的次数,并根据所述客户购买保险的次数确定客户行为频次。
在一个实施例中,每个客户行为频次要求不同,如APP要求最少在最近90天内活跃两天,客户至少购买保单2天及以上。本申请此处的客户行为频次是指客户每个动作的行为次数,其中,所述客户行为频次包含客户购买保险的次数。
例如,假设根据保单数据确定购买寿险的客户的客户标识为张三,如果根据预设的客户标识与保单标识的第一映射关系,确定出与购买寿险的客户的客户标识张三对应的保单标识为1、2、3,则可以根据与购买寿险的客户的客户标识张三对应的保单标识1、2、3,确定张三购买保险的次数为3次,并根据所述客户购买保险的次数3次确定张三购买保险的客户行为频次为3。
在一个实施例中,当客户行为频次计算完毕之后,可以进行参数配置,可直接得到每个行为对应的进程信息,以快速适应业务调整。其中,参数配置的目的在于科学合理化的管理行为对应的进程,有效控制计算任务流,便于更新调整。
S203:根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息。
本发明实施例中,业务数据处理设备可以根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息。
在一个实施例中,对于非日志类源数据,可以直接根据客户的行为数据,确定电话号码与客户标识的第三映射关系。其中,客户的行为数据包括但不限于客户打开APP,客户扫描代理人二维码,客户参加代理人组织的活动等行为数据。
在一个实施例中,在根据客户的行为数据,确定电话号码与客户标识的映射关系之后,可以根据预设的客户标识与保单标识的第一映射关系,以及电话号码与客户标识的第三映射关系,确定电话号码与保单标识的第四映射关系,从而可以确定与所述客户的电话号码对应的保单,以此确定所述客户购买的保单数量。
在一个实施例中,所述业务数据处理设备在根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息时,可以根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,其中,所述进程信息包括进程编码值;根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
在一个实施例中,所述业务数据处理设备在根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程时,可以根据所述进程信息中包括的进程编码值,按照所述进程编码值从大到小的顺序进行排序;确定所述排序后的进程编码值中的最大进程编码值对应的进程为所述客户的最大进程。
在一个实施例中,所述业务数据处理设备在根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息时,可以根据所述源数据中包括的客户通信方式与代理人的第二映射关系,确定与所述客户对应的代理人;根据所述客户对应的代理人所属的地区和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
在一个实施例中,每个进程对应多个业务行为,每个业务行为包括一个行为编码;在一个实施例中,进程、行为、行为编码以及进程编码之间的关系如下表1所示。
表1
S204:根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
本发明实施例中,业务数据处理设备可以根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
在一个实施例中,业务数据处理设备在根据所述客户所属的进程机构信息进行机构流转统计时,可以根据所述客户所属的进程机构信息,获取每个机构下每个进程在每个月的人数集合;以当前月的上一个月的用户数据作为起点,以及当前月的下一个月的用户数据作为终点,获取所述每个机构在每个进程下的流转人数。
在一个实施例中,在将统计数据同步发送到数据库中时,当分布流转数据统计之后,即可使用sqoop工具将大数据平台数据同步发送到数据库中。
本发明实施例中,业务数据处理设备可以获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。通过这种方式,可以快速、有效地对多源异构的业务数据进行分析,并可以为企业用户判断流失、转化,提高分析决策,有助于企业经营。
本发明实施例还提供了一种业务数据处理设备,该业务数据处理设备用于执行前述任一项所述的方法的单元。具体地,参见图3,图3是本发明实施例提供的一种业务数据处理设备的示意框图。本实施例的业务数据处理设备包括:获取单元301、第一确定单元302、第二确定单元303、统计单元304。
获取单元301,用于获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;
第一确定单元302,用于根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;
第二确定单元303,用于根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;
统计单元304,用于根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
进一步地,所述第一确定单元302根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次时,具体用于:
根据所述保单数据确定购买目标保险的客户的客户标识,其中,所述客户标识包括姓名和/或身份证号码;
根据预设的客户标识与保单标识的第一映射关系,确定与所述购买目标保险的客户的客户标识对应的保单标识;
根据与所述购买目标保险的客户的客户标识对应的保单标识,确定所述购买目标保险的客户购买保险的次数,并根据所述客户购买保险的次数确定客户行为频次。
进一步地,所述第二确定单元303根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息时,具体用于:
根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,其中,所述进程信息包括进程编码值;
根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
进一步地,所述第二确定单元303根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程时,具体用于:
根据所述进程信息中包括的进程编码值,按照所述进程编码值从大到小的顺序进行排序;
确定所述排序后的进程编码值中的最大进程编码值对应的进程为所述客户的最大进程。
进一步地,所述第二确定单元303根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息时,具体用于:
根据所述源数据中包括的客户通信方式与代理人的第二映射关系,确定与所述客户对应的代理人;
根据所述客户对应的代理人所属的地区和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
进一步地,所述统计单元304根据所述客户所属的进程机构信息进行机构流转统计时,具体用于:
根据所述客户所属的进程机构信息,获取每个机构下每个进程在每个月的人数集合;
以当前月的上一个月的用户数据作为起点,以及当前月的下一个月的用户数据作为终点,获取所述每个机构在每个进程下的流转人数。
进一步地,所述获取单元301对所述源数据进行分类,确定出日志类源数据和非日志类源数据时,具体用于:
获取所述源数据的数据格式;
根据所述源数据的数据格式确定与预设的日志类格式匹配的日志类源数据,以及确定与预设的日志类格式不匹配的非日志类源数据。
本发明实施例中,业务数据处理设备可以获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。通过这种方式,可以快速、有效地对多源异构的业务数据进行分析,并可以为企业用户判断流失、转化,提高分析决策,有助于企业经营。
参见图4,图4是本发明实施例提供的一种终端的示意框图。如图4所示的本发明实施例中的终端可以包括:一个或多个处理器401和存储器402。存储器402用于存储计算机程序,所述计算机程序包括程序指令,处理器401用于执行存储器402存储的程序指令。其中,处理器401被配置用于调用所述程序指令执行:
获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;
根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;
根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;
根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
进一步地,所述处理器401根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次时,具体用于:
根据所述保单数据确定购买目标保险的客户的客户标识,其中,所述客户标识包括姓名和/或身份证号码;
根据预设的客户标识与保单标识的第一映射关系,确定与所述购买目标保险的客户的客户标识对应的保单标识;
根据与所述购买目标保险的客户的客户标识对应的保单标识,确定所述购买目标保险的客户购买保险的次数,并根据所述客户购买保险的次数确定客户行为频次。
进一步地,所述处理器401根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息时,具体用于:
根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,其中,所述进程信息包括进程编码值;
根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
进一步地,所述处理器401根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程时,具体用于:
根据所述进程信息中包括的进程编码值,按照所述进程编码值从大到小的顺序进行排序;
确定所述排序后的进程编码值中的最大进程编码值对应的进程为所述客户的最大进程。
进一步地,所述处理器401根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息时,具体用于:
根据所述源数据中包括的客户通信方式与代理人的第二映射关系,确定与所述客户对应的代理人;
根据所述客户对应的代理人所属的地区和所述客户归属的最大进程,确定所述客户所属的进程机构信息。
进一步地,所述处理器401根据所述客户所属的进程机构信息进行机构流转统计时,具体用于:
根据所述客户所属的进程机构信息,获取每个机构下每个进程在每个月的人数集合;
以当前月的上一个月的用户数据作为起点,以及当前月的下一个月的用户数据作为终点,获取所述每个机构在每个进程下的流转人数。
进一步地,所述处理器401对所述源数据进行分类,确定出日志类源数据和非日志类源数据时,具体用于:
获取所述源数据的数据格式;
根据所述源数据的数据格式确定与预设的日志类格式匹配的日志类源数据,以及确定与预设的日志类格式不匹配的非日志类源数据。
本发明实施例中,终端可以获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。通过这种方式,可以快速、有效地对多源异构的业务数据进行分析,并可以为企业用户判断流失、转化,提高分析决策,有助于企业经营。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器402可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。例如,存储器402还可以存储设备类型的信息。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图2所对应实施例中描述的业务数据处理方法,也可实现本发明图3所对应实施例的业务数据处理设备,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的业务数据处理设备的内部存储单元,例如业务数据处理设备的硬盘或内存。所述计算机可读存储介质也可以是所述业务数据处理设备的外部存储设备,例如所述业务数据处理设备上配备的插接式硬盘,智能存储卡(SmarS Media Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(FlashCard)等。进一步地,所述计算机可读存储介质还可以既包括所述业务数据处理设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述业务数据处理设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
需要强调的是,为进一步保证上述数据的私密和安全性,上述数据还可以存储于一区块链的节点中。其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种业务数据处理方法,其特征在于,所述方法包括:
获取保险业务的源数据,并对所述源数据进行分类,确定出日志类源数据和非日志类源数据;
根据所述源数据确定购买目标保险的客户购买的保单数据,并根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次;
所述根据所述保单数据、所述日志类源数据和所述非日志类源数据计算客户行为频次,包括:
根据所述保单数据确定购买目标保险的客户的客户标识,其中,所述客户标识包括姓名和/或身份证号码;
根据预设的客户标识与保单标识的第一映射关系,确定与所述购买目标保险的客户的客户标识对应的保单标识;
根据与所述购买目标保险的客户的客户标识对应的保单标识,确定所述购买目标保险的客户购买保险的次数,并根据所述客户购买保险的次数确定客户行为频次;
根据所述客户行为频次确定所述客户的历史行为数据对应的进程信息,并根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息;
所述根据所述客户的历史行为数据对应的进程信息和所述源数据确定所述客户所属的进程机构信息,包括:
根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,其中,所述进程信息包括进程编码值;
根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息;
所述根据所述客户的历史行为数据对应的进程信息确定所述客户归属的最大进程,包括:
根据所述进程信息中包括的进程编码值,按照所述进程编码值从大到小的顺序进行排序;
确定所述排序后的进程编码值中的最大进程编码值对应的进程为所述客户的最大进程;
所述根据所述源数据中包括的客户通信方式与代理人的第二映射关系和所述客户归属的最大进程,确定所述客户所属的进程机构信息,包括:
根据所述源数据中包括的客户通信方式与代理人的第二映射关系,确定与所述客户对应的代理人;
根据所述客户对应的代理人所属的地区和所述客户归属的最大进程,确定所述客户所属的进程机构信息;
根据所述客户所属的进程机构信息进行机构流转统计,并将统计的数据同步发送到数据库中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述客户所属的进程机构信息进行机构流转统计,包括:
根据所述客户所属的进程机构信息,获取每个机构下每个进程在每个月的人数集合;
以当前月的上一个月的用户数据作为起点,以及当前月的下一个月的用户数据作为终点,获取所述每个机构在每个进程下的流转人数。
3.根据权利要求1所述的方法,其特征在于,所述对所述源数据进行分类,确定出日志类源数据和非日志类源数据,包括:
获取所述源数据的数据格式;
根据所述源数据的数据格式确定与预设的日志类格式匹配的日志类源数据,以及确定与预设的日志类格式不匹配的非日志类源数据。
4.一种业务数据处理设备,其特征在于,所述设备用于实现权利要求1-3任意一项所述的方法。
5.一种终端,其特征在于,所述终端包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时实现权利要求1-3任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-3任一项所述的方法。
CN202011289413.8A 2020-11-17 2020-11-17 一种业务数据处理方法、设备、终端及存储介质 Active CN112380177B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011289413.8A CN112380177B (zh) 2020-11-17 2020-11-17 一种业务数据处理方法、设备、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011289413.8A CN112380177B (zh) 2020-11-17 2020-11-17 一种业务数据处理方法、设备、终端及存储介质

Publications (2)

Publication Number Publication Date
CN112380177A CN112380177A (zh) 2021-02-19
CN112380177B true CN112380177B (zh) 2023-10-13

Family

ID=74584953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011289413.8A Active CN112380177B (zh) 2020-11-17 2020-11-17 一种业务数据处理方法、设备、终端及存储介质

Country Status (1)

Country Link
CN (1) CN112380177B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909493A (zh) * 2017-12-04 2018-04-13 泰康保险集团股份有限公司 保单信息处理方法、装置、计算机设备和存储介质
CN108765094A (zh) * 2018-06-06 2018-11-06 中国平安人寿保险股份有限公司 保险数据处理方法、装置、计算机设备和存储介质
CN109829810A (zh) * 2018-12-13 2019-05-31 平安科技(深圳)有限公司 业务推荐方法、装置、计算机设备及存储介质
CN110309108A (zh) * 2019-05-08 2019-10-08 江苏满运软件科技有限公司 数据采集及储存方法、装置、电子设备、存储介质
CN111144697A (zh) * 2019-11-29 2020-05-12 泰康保险集团股份有限公司 数据处理方法、装置、存储介质及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9195841B2 (en) * 2013-03-15 2015-11-24 Sap Se Automated and delegated model-based row level security

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909493A (zh) * 2017-12-04 2018-04-13 泰康保险集团股份有限公司 保单信息处理方法、装置、计算机设备和存储介质
CN108765094A (zh) * 2018-06-06 2018-11-06 中国平安人寿保险股份有限公司 保险数据处理方法、装置、计算机设备和存储介质
CN109829810A (zh) * 2018-12-13 2019-05-31 平安科技(深圳)有限公司 业务推荐方法、装置、计算机设备及存储介质
CN110309108A (zh) * 2019-05-08 2019-10-08 江苏满运软件科技有限公司 数据采集及储存方法、装置、电子设备、存储介质
CN111144697A (zh) * 2019-11-29 2020-05-12 泰康保险集团股份有限公司 数据处理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN112380177A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
US9858426B2 (en) Computer-implemented system and method for automatically identifying attributes for anonymization
US8990252B2 (en) Anonymity measuring device
CN110659318B (zh) 基于大数据的策略推送方法、系统及计算机设备
WO2020211357A1 (zh) 数据的关联分析方法、装置、计算机设备及存储介质
CN109189367B (zh) 一种数据处理方法、装置、服务器及存储介质
EP3420475B1 (en) Systems and methods for computing data privacy-utility tradeoff
CN103345616A (zh) 基于行为分析的指纹存储比对的系统
CN111865691B (zh) 基于人工智能的报警文件分发方法、装置、设备和介质
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
US11972023B2 (en) Compatible anonymization of data sets of different sources
CN108829668B (zh) 文本信息的生成方法、装置、计算机设备及存储介质
CN114186275A (zh) 隐私保护方法、装置、计算机设备及存储介质
CN111581258B (zh) 一种安全数据分析方法、装置、系统、设备及存储介质
US20180137149A1 (en) De-identification data generation apparatus, method, and non-transitory computer readable storage medium thereof
CN112686631A (zh) 任务事项处理方法、装置、计算机设备及存储介质
CN111813946A (zh) 医疗信息反馈方法、装置、设备及可读存储介质
CN112000979B (zh) 隐私数据的数据库操作方法、系统及存储介质
CN112287111B (zh) 一种文本处理方法和相关装置
CN112380177B (zh) 一种业务数据处理方法、设备、终端及存储介质
US20210165907A1 (en) Systems and methods for intelligent and quick masking
CN114495137B (zh) 票据异常检测模型生成方法与票据异常检测方法
CN115775180A (zh) 一种数据处理方法、计算机设备及计算机可读存储介质
CN112632607A (zh) 一种数据处理方法、装置及设备
WO2020071938A1 (ru) Способ и система маркировки действий пользователя для последующего анализа и накопления
CN116708025B (zh) 一种基于云计算的账号管理方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant