CN116385045A - 一种用于收寄附加服务的数据处理方法、装置和设备 - Google Patents
一种用于收寄附加服务的数据处理方法、装置和设备 Download PDFInfo
- Publication number
- CN116385045A CN116385045A CN202310410440.3A CN202310410440A CN116385045A CN 116385045 A CN116385045 A CN 116385045A CN 202310410440 A CN202310410440 A CN 202310410440A CN 116385045 A CN116385045 A CN 116385045A
- Authority
- CN
- China
- Prior art keywords
- user
- label
- data
- model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 238000013210 evaluation model Methods 0.000 claims abstract description 50
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 230000000694 effects Effects 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 33
- 230000002159 abnormal effect Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 15
- 238000009826 distribution Methods 0.000 claims description 13
- 238000009825 accumulation Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0838—Historical data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种用于收寄附加服务的数据处理方法、装置和设备,属于数据分析技术领域。本发明通过获取用户离线数据和用户实时数据;基于用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;通过预设算法模型,对用户事实标签和用户模型标签进行加权计算,得到用户综合消费评估模型,对用户消费能力进行评估;同时,通过Flink组件对用户实时数据和用户预测标签的数据进行实时计算分析,得到用户预警标签。通过建立用户综合消费评估模型和用户预警标签,使运营人员向用户发送定制化推广活动、优惠策略以及预警提醒等信息,提供多样式的附加服务内容,从而提高对不同类型用户的收寄服务的精准度和服务质量。
Description
技术领域
本发明属于数据分析技术领域,具体涉及一种用于收寄附加服务的数据处理方法、装置和设备。
背景技术
用户黏度是指用户对品牌或产品的忠诚、信任与良性体验等结合起来形成的依赖程度和再消费期望程度,也就是增加用户双方彼此的使用数量。用户黏度是衡量用户忠诚度计划的重要指标,对于整个公司的品牌形象骑着关键作用。
随着快递行业的蓬勃发展,快递行业的市场份额抢占也正从各个大平台的订单渗透到客户端的用户订单。目前,客户端的用户收寄件服务主要依赖小程序、APP下单等,对用户只是进行了基本的、简单的收寄服务内容,对于公司品牌及服务内容的推广活动不足,无法给用户提供更多的附加服务内容,导致对不同类型用户的收寄服务不精准,服务质量较差。
发明内容
为此,本发明提供一种用于收寄附加服务的数据处理方法、装置和设备,有助于帮助解决客户端在进行用户收寄服务过程中存在着对不同类型用户的收寄服务不精准,服务质量较差的问题。
为实现以上目的,本发明采用如下技术方案:
第一方面,本发明提供一种用于收寄附加服务的数据处理方法,包括:
获取用户离线数据和用户实时数据;其中,所述用户离线数据包括用户基础数据和用户业务数据,所述用户实时数据包括运单基础数据和运单路由实时数据;
基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,所述用户画像标签包括用户事实标签、用户模型标签和用户预测标签;
通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型;其中,所述用户综合消费评估模型用来对所述用户进行消费能力的评估和评级;
通过Flink组件对所述用户实时数据和所述用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,所述用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;
将所述用户综合消费评估模型和所述用户预警标签发送至目标设备;所述目标设备为运营人员使用的设备。
进一步地,所述基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签,包括:
通过Spark组件对所述用户离线数据进行计算,得到所述用户事实标签;其中,所述事实标签包括用户收寄业务量、用户收寄件重量、用户投诉情况和用户基础属性;
通过Presto引擎、Spark组件、Hbase数据库、预设的传参参数和预设的选择条件,对所述用户离线数据进行计算,得到所述用户模型标签;其中,所述用户模型标签包括用户积分累计、用户收寄件地区分布和用户消费等级;
通过Xgboost工具的回归和提升树算法及对应的预测模型,对所述用户离线数据进行计算,得到所述用户预测标签;其中,所述用户预测标签包括积分异常预警、增值服务选择预测、投诉危险度预警、和明日寄件预测。
进一步地,所述通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型,包括:
根据所述用户事实标签和所述用户模型标签,创建特征工程,得到对应的特征数据;
通过预设算法模型,对所述特征数据进行多级维度的加权计算,得到所述用户综合消费评估模型。
进一步地,所述方法还包括:
基于用户综合消费评估模型中用户综合等级的排名和预设的正态分布阈值,对所述用户进行消费能力的评估和评级。
进一步地,所述方法还包括:
根据所述用户综合消费评估模型,同步生成用户使用报告,以根据所述用户使用报告向所述用户发送定制化推广活动及优惠策略。
进一步地,所述方法还包括:
根据所述积分异常标签中积分变动,按照预设的消息推送方式向所述用户进行积分异常提醒推送;
根据所述增值服务标签中用户以往喜好,按照所述预设的消息推送方式向所述用户进行增值服务推送;
根据所述投诉风险标签中投诉信息,向所述运营人员进行风险提醒推送。
进一步地,所述预设的消息推送方式为:弹窗或短信方式。
第二方面,本发明提供一种用于收寄附加服务的数据处理装置,包括:
数据获取模块,用于获取用户离线数据和用户实时数据;其中,所述用户离线数据包括用户基础数据和用户业务数据,所述用户实时数据包括运单基础数据和运单路由实时数据;
用户画像标签生成模块,用于基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,所述用户画像标签包括用户事实标签、用户模型标签和用户预测标签;
用户综合消费评估模型构建模块,用于通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型;其中,所述用户综合消费评估模型用来对所述用户进行消费能力的评估和评级;
实时计算模块,用于通过Flink组件对所述用户实时数据和所述用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,所述用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;
评估模型和预警标签发送模块,用于将所述用户综合消费评估模型和所述用户预警标签发送至目标设备;其中,所述目标设备为运营人员使用的设备。
进一步地,所述用户画像标签生成模块具体用于:
通过Spark组件对所述用户离线数据进行计算,得到所述用户事实标签;其中,所述事实标签包括用户收寄业务量、用户收寄件重量、用户投诉情况和用户基础属性;
通过Presto引擎、Spark组件、Hbase数据库、预设的传参参数和预设的选择条件,对所述用户离线数据进行计算,得到所述用户模型标签;其中,所述用户模型标签包括用户积分累计、用户收寄件地区分布和用户消费等级;
通过Xgboost工具的回归和提升树算法及对应的预测模型,对所述用户离线数据进行计算,得到所述用户预测标签;其中,所述用户预测标签包括积分异常预警、增值服务选择预测、投诉危险度预警和明日寄件预测。
第三方面,本发明提供一种用于收寄附加服务的数据处理设备,包括:
一个或者多个存储器,其上存储有可执行程序;
一个或者多个处理器,用于执行所述存储器中的所述可执行程序,以实现上述任一项所述方法的步骤。
本发明采用以上技术方案,至少具备以下有益效果:
本发明通过获取用户离线数据和用户实时数据;其中,用户离线数据包括用户基础数据和用户业务数据,用户实时数据包括运单基础数据和运单路由实时数据;基于用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,用户画像标签包括用户事实标签、用户模型标签和用户预测标签;通过预设算法模型对用户事实标签和用户模型标签进行加权计算,得到用户综合消费评估模型,对用户进行消费能力的评估和评级;同时,通过Flink组件对用户实时数据和用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;最后,将用户综合消费评估模型和用户预警标签发送至目标设备;其中,目标设备为运营人员使用的设备。通过建立用户综合消费评估模型和用户预警标签,使运营人员向用户发送定制化推广活动、优惠策略以及预警提醒等信息,提供多样式的附加服务内容,从而提高对不同类型用户的收寄服务的精准度和服务质量,增强用户黏度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例示出的一种用于收寄附加服务的数据处理方法的流程图;
图2是本发明实施例示出的一种用于收寄附加服务的数据处理装置的框图示意图;
图3是本发明实施例示出的一种用于收寄附加服务的数据处理设备的框图示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
请参阅图1,图1是本发明实施例示出的一种用于收寄附加服务的数据处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S11、获取用户离线数据和用户实时数据;其中,所述用户离线数据包括用户基础数据和用户业务数据,所述用户实时数据包括运单基础数据和运单路由实时数据;
步骤S12、基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,所述用户画像标签包括用户事实标签、用户模型标签和用户预测标签;
步骤S13、通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型;其中,所述用户综合消费评估模型用来对所述用户进行消费能力的评估和评级;
步骤S14、通过Flink组件对所述用户实时数据和所述用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,所述用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;
步骤S15、将所述用户综合消费评估模型和所述用户预警标签发送至目标设备;所述目标设备为运营人员使用的设备。
需要说明的是,本实施例基于用户以及相关主体的用户基础数据及用户业务数据,对用户的标签进行分组和抽象,来获得对应的用户画像标签。用户基础数据指的是与用户的个人信息相关的数据,用户业务数据指的是订单信息、交易信息和行为信息等于业务相关的数据。
需要说明的是,步骤S12中,用户画像可以理解为标签化用户模型,即多个标签的集合,由多个标签值构成。用这些高度概括且容易理解的特征词条来描述特定用户或用户群体,方便人和机器理解并处理优化。
标签是构成用户画像的核心要素,类似维度,对特定群组对象进行抽象概括形成各特征。即将获取的用户基础数据和用户业务数据,提炼分析后生成具有差异性特征值的词条,也就是上文所说的用户事实标签、用户模型标签和用户预测标签。
用户事实标签是基于个人信息和一些业务信息的特征,如用户收寄业务量、用户收寄件重量、用户投诉情况、用户基础属性等。用户模型标签是基于范围的特征,如用户积分累计、用户收寄件地区分布、用户消费等级等。用户预测标签是基于预警预测的特征,如积分异常预警、增值服务选择预测、投诉危险度预警、明日寄件预测等。
需要说明的是,用户画像标签是涵盖所有上述标签的组合,是针对用户离线数据中的用户基础数据和用户业务数据进行的特征分组得到的。可以按照主题分组,也可以按照参考数据来源进行分组,如可以按照用户基础、网点基础、用户消费行为、用户收寄量、用户的专属业务员、用户寄件操作时长、用户下单时间分布及偏好、用户专属业务员服务质量、用户售后体验等各主题分类。在本实施例中,对分组的类型不做具体限定。
需要说明的是,在步骤S13中,用户综合消费评估模型是通过预设算法模型对用户事实标签和用户模型标签进行加权计算得到的一个客观的用户综合等级,用来对用户进行消费能力的评估和评级,从而为用户定制化推广活动及优惠策略,并向运营人员发送相关消息,使其为用户推送该定制化推广活动及优惠策略。
需要说明的是,在步骤S14中,通过大数据平台Flink组件技术,将运单基础数据、运单路由实时数据、和用户预测标签的数据等进行实时的计算分析,得到用户预警标签。所述的用户预警标签包括积分异常标签、增值服务标签和投诉风险标签,用来提醒用户或运营人员进行相关处理。通过用户预警标签,可以提醒用户的积分异常情况,可以向运营人员提醒投诉相关情况,还可以可以综合的提升用户服务感知,优化派件时效,还可以提醒相应业务员是否有目前用户遗漏派送的单件,是否有该用户可揽收快件等,提高总体的揽派效率,并向用户标注附近范围内可选择的现有专属业务员和服务评价等级更高的业务员,帮助用户更好的享受收寄服务,提升用户的消费等级等。
需要说明的是,最后将用户综合消费评估模型和用户预警标签发送到运营人员使用的设备上,使运营人员得到相关消息,使其为用户推送定制化推广活动及优惠策略,以及进行相关预警处理。
可以理解的是,本发明通过获取用户离线数据和用户实时数据;其中,用户离线数据包括用户基础数据和用户业务数据,用户实时数据包括运单基础数据和运单路由实时数据;基于用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,用户画像标签包括用户事实标签、用户模型标签和用户预测标签;通过预设算法模型对用户事实标签和用户模型标签进行加权计算,得到用户综合消费评估模型,对用户进行消费能力的评估和评级;同时,通过Flink组件对用户实时数据和用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;最后,将用户综合消费评估模型和用户预警标签发送至目标设备;其中,目标设备为运营人员使用的设备。通过建立用户综合消费评估模型和用户预警标签,使运营人员向用户发送定制化推广活动、优惠策略以及预警提醒等信息,提供多样式的附加服务内容,从而提高对不同类型用户的收寄服务的精准度和服务质量。
进一步地,所述基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签,包括:
通过Spark组件对所述用户离线数据进行计算,得到所述用户事实标签;其中,所述事实标签模型包括用户收寄业务量、用户收寄件重量、用户投诉情况和用户基础属性;
通过Presto引擎、Spark组件、Hbase数据库、预设的传参参数和预设的选择条件,对所述用户离线数据进行计算,得到所述用户模型标签;其中,所述用户模型标签包括用户积分累计、用户收寄件地区分布和用户消费等级;
通过Xgboost工具的回归和提升树算法及对应的预测模型,对所述用户离线数据进行计算,得到所述用户预测标签;其中,所述用户预测标签包括积分异常预警、增值服务选择预测、投诉危险度预警、和明日寄件预测。
需要说明的是,用户画像标签包括用户事实标签、用户模型标签和用户预测标签。用户事实标签是通过Spark组件对用户离线数据进行计算得到的。用户事实标签是基于个人信息和一些业务信息的特征,如用户收寄业务量、用户收寄件重量、用户投诉情况、用户基础属性等。其中,Spark组件是一个分布式数据处理引擎,其各种组件在一个集群上协同工作。
用户模型标签是通过基于Presto引擎、Spark组件、Hbase数据库的技术架构,让用户灵活的选择分析模型,通过设定不同的传参参数及选择条件,对用户离线数据进行计算得到。用户模型标签是基于范围的特征,如用户积分累计、用户收寄件地区分布、用户消费等级等。
用户预测标签是通过Xgboost工具的回归和提升树算法及对应的预测模型,对用户离线数据进行计算得到。用户预测标签是基于预警预测的特征,如积分异常预警、增值服务选择预测、投诉危险度预警、明日寄件预测等。其中,Xgboost工具,是可扩展的分布式梯度提升决策树机器学习库,可以提供并行树提升功能,是用于回归、分类和排名问题的先进机器学习库。
需要说明的是,预测模型是前期搭建的一个模型,通过对历史数据的采集清理,提取有用的特征数据,选择合适的算法进行训练和测试,不断调整优化算法参数,最终进行应用。例如,我们根据历史的客户投诉数据和运单数据进行匹配,找出客户投诉的规律和特征,比如包括运单超时、包裹破损这些特征。
进一步地,所述通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型,包括:
根据所述用户事实标签和所述用户模型标签,创建特征工程,得到对应的特征数据;
通过预设算法模型,对所述特征数据进行多级维度的加权计算,得到所述用户综合消费评估模型。
需要说明的是,特征工程是利用领域知识从原始数据中提取特性、属性等特征的过程。本实施例中,通过对用户事实标签和用户模型标签创建特征工程,进行特征提取,得到相应的特征数据;再通过预设算法模型,对特征数据围绕多级维度进行加权计算,最后得出一个客观的用户综合等级,也就是用户综合消费评估模型。
可以理解的是,用户综合消费评估模型,可以给用户进行消费能力的评估和评级,从而为用户定制化推广活动及优惠策略,并向运营人员发送相关消息,使其为用户推送该定制化推广活动及优惠策略。
进一步地,所述方法还包括:
基于用户综合消费评估模型中用户综合等级的排名和预设的正态分布阈值,对所述用户进行消费能力的评估和评级。
需要说明的是,利用用户综合消费评估模型对用户进行消费能力的评估和评级时,是根据得到的用户等级排名和设置的正态分布的阈值进行综合评估的,从而为用户定制化推广活动及优惠策略。
进一步地,所述方法还包括:
根据所述用户综合消费评估模型,同步生成用户使用报告,以根据所述用户使用报告向所述用户发送定制化推广活动及优惠策略。
需要说明的是,根据用户综合消费评估模型,并行生成每月的用户使用报告,让产品及运营人员针对用户的使用报告优化产品内容,针对用户等级标签向用户提供积分累计、积分兑换、积分抽奖、优惠券发放、寄件优惠、专属客服等定制化相关推广活动,优化产品使用过程中存在的问题,提升整体用户黏度。
进一步地,所述方法还包括:
根据所述积分异常标签中积分变动,按照预设的消息推送方式向所述用户进行积分异常提醒推送;
根据所述增值服务标签中用户以往喜好,按照所述预设的消息推送方式向所述用户进行增值服务推送;
根据所述投诉风险标签中投诉信息,向所述运营人员进行风险提醒推送。
进一步地,所述预设的消息推送方式为:弹窗或短信方式。
需要说明的是,可以根据积分异常标签中积分的发生变动,可以用弹窗或短信方式向用户进行积分异常提醒的推送;可以根据增值服务标签中用户的以往喜好,可以用弹窗或短信方式向用户进行增值服务的推送;可以根据投诉风险标签中的投诉信息,向运营人员进行风险提醒。
请参阅图2,图2是本发明实施例示出的一种用于收寄附加服务的数据处理装置的框图示意图,该用于收寄附加服务的数据处理装置2包括:
数据获取模块21,用于获取用户离线数据和用户实时数据;其中,所述用户离线数据包括用户基础数据和用户业务数据,所述用户实时数据包括运单基础数据和运单路由实时数据;
用户画像标签生成模块22,用于基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,所述用户画像标签包括用户事实标签、用户模型标签和用户预测标签;
用户综合消费评估模型构建模块23,用于通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型;其中,所述用户综合消费评估模型用来对所述用户进行消费能力的评估和评级;
实时计算模块24,用于通过Flink组件对所述用户实时数据和所述用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,所述用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;
评估模型和预警标签发送模块25,用于将所述用户综合消费评估模型和所述用户预警标签发送至目标设备;其中,所述目标设备为运营人员使用的设备。
进一步地,所述用户画像标签生成模块22具体用于:
通过Spark组件对所述用户离线数据进行计算,得到所述用户事实标签;其中,所述事实标签包括用户收寄业务量、用户收寄件重量、用户投诉情况和用户基础属性;
通过Presto引擎、Spark组件、Hbase数据库、预设的传参参数和预设的选择条件,对所述用户离线数据进行计算,得到所述用户模型标签;其中,所述用户模型标签包括用户积分累计、用户收寄件地区分布和用户消费等级;
通过Xgboost工具的回归和提升树算法及对应的预测模型,对所述用户离线数据进行计算,得到所述用户预测标签;其中,所述用户预测标签包括积分异常预警、增值服务选择预测、投诉危险度预警和明日寄件预测。
关于上述实施例中的一种用于收寄附加服务的数据处理装置2,其各个模块执行操作的具体方式已经在上述相关方法的实施例中进行了详细描述,此处将不做详细阐述说明。
请参阅图3,图3是本发明实施例示出的一种用于收寄附加服务的数据处理设备的框图示意图,该用于收寄附加服务的数据处理设备3,包括:
一个或者多个存储器31,其上存储有可执行程序;
一个或者多个处理器32,用于执行所述存储器31中的所述可执行程序,以实现上述任一项所述方法的步骤。
关于上述实施例中的一种用于收寄附加服务的数据处理设备3,其处理器32执行存储器31中程序的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”、“多”的含义是指至少两个。
应该理解,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者可能同时存在居中元件;当一个元件被称为“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件,此外,这里使用的“连接”可以包括无线连接;使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为:表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种用于收寄附加服务的数据处理方法,其特征在于,包括:
获取用户离线数据和用户实时数据;其中,所述用户离线数据包括用户基础数据和用户业务数据,所述用户实时数据包括运单基础数据和运单路由实时数据;
基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,所述用户画像标签包括用户事实标签、用户模型标签和用户预测标签;
通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型;其中,所述用户综合消费评估模型用来对所述用户进行消费能力的评估和评级;
通过Flink组件对所述用户实时数据和所述用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,所述用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;
将所述用户综合消费评估模型和所述用户预警标签发送至目标设备;其中,所述目标设备为运营人员使用的设备。
2.根据权利要求1所述的方法,其特征在于,所述基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签,包括:
通过Spark组件对所述用户离线数据进行计算,得到所述用户事实标签;其中,所述事实标签包括用户收寄业务量、用户收寄件重量、用户投诉情况和用户基础属性;
通过Presto引擎、Spark组件、Hbase数据库、预设的传参参数和预设的选择条件,对所述用户离线数据进行计算,得到所述用户模型标签;其中,所述用户模型标签包括用户积分累计、用户收寄件地区分布和用户消费等级;
通过Xgboost工具的回归和提升树算法及对应的预测模型,对所述用户离线数据进行计算,得到所述用户预测标签;其中,所述用户预测标签包括积分异常预警、增值服务选择预测、投诉危险度预警和明日寄件预测。
3.根据权利要求1所述的方法,其特征在于,所述通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型,包括:
根据所述用户事实标签和所述用户模型标签,创建特征工程,得到对应的特征数据;
通过预设算法模型,对所述特征数据进行多级维度的加权计算,得到所述用户综合消费评估模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于用户综合消费评估模型中用户综合等级的排名和预设的正态分布阈值,对所述用户进行消费能力的评估和评级。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述用户综合消费评估模型,同步生成用户使用报告,以根据所述用户使用报告向所述用户发送定制化推广活动及优惠策略。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述积分异常标签中积分变动,按照预设的消息推送方式向所述用户进行积分异常提醒推送;
根据所述增值服务标签中用户以往喜好,按照所述预设的消息推送方式向所述用户进行增值服务推送;
根据所述投诉风险标签中投诉信息,向所述运营人员进行风险提醒推送。
7.根据权利要求6所述的方法,其特征在于,所述预设的消息推送方式为:弹窗或短信方式。
8.一种用于收寄附加服务的数据处理装置,其特征在于,包括:
数据获取模块,用于获取用户离线数据和用户实时数据;其中,所述用户离线数据包括用户基础数据和用户业务数据,所述用户实时数据包括运单基础数据和运单路由实时数据;
用户画像标签生成模块,用于基于所述用户离线数据对用户的标签进行分组和抽象,得到对应的用户画像标签;其中,所述用户画像标签包括用户事实标签、用户模型标签和用户预测标签;
用户综合消费评估模型构建模块,用于通过预设算法模型对所述用户事实标签和所述用户模型标签进行加权计算,得到用户综合消费评估模型;其中,所述用户综合消费评估模型用来对所述用户进行消费能力的评估和评级;
实时计算模块,用于通过Flink组件对所述用户实时数据和所述用户预测标签的数据进行实时计算分析,得到用户预警标签;其中,所述用户预警标签包括积分异常标签、增值服务标签和投诉风险标签;
评估模型和预警标签发送模块,用于将所述用户综合消费评估模型和所述用户预警标签发送至目标设备;其中,所述目标设备为运营人员使用的设备。
9.根据权利要求8所述的装置,其特征在于,所述用户画像标签生成模块具体用于:
通过Spark组件对所述用户离线数据进行计算,得到所述用户事实标签;其中,所述事实标签包括用户收寄业务量、用户收寄件重量、用户投诉情况和用户基础属性;
通过Presto引擎、Spark组件、Hbase数据库、预设的传参参数和预设的选择条件,对所述用户离线数据进行计算,得到所述用户模型标签;其中,所述用户模型标签包括用户积分累计、用户收寄件地区分布和用户消费等级;
通过Xgboost工具的回归和提升树算法及对应的预测模型,对所述用户离线数据进行计算,得到所述用户预测标签;其中,所述用户预测标签包括积分异常预警、增值服务选择预测、投诉危险度预警和明日寄件预测。
10.一种用于收寄附加服务的数据处理设备,其特征在于,包括:
一个或者多个存储器,其上存储有可执行程序;
一个或者多个处理器,用于执行所述存储器中的所述可执行程序,以实现权利要求1-7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310410440.3A CN116385045A (zh) | 2023-04-17 | 2023-04-17 | 一种用于收寄附加服务的数据处理方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310410440.3A CN116385045A (zh) | 2023-04-17 | 2023-04-17 | 一种用于收寄附加服务的数据处理方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116385045A true CN116385045A (zh) | 2023-07-04 |
Family
ID=86976829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310410440.3A Pending CN116385045A (zh) | 2023-04-17 | 2023-04-17 | 一种用于收寄附加服务的数据处理方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116385045A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116797341A (zh) * | 2023-08-17 | 2023-09-22 | 北京信大融金教育科技有限公司 | 基于运营平台的积分产生和管理方法、装置、设备及介质 |
-
2023
- 2023-04-17 CN CN202310410440.3A patent/CN116385045A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116797341A (zh) * | 2023-08-17 | 2023-09-22 | 北京信大融金教育科技有限公司 | 基于运营平台的积分产生和管理方法、装置、设备及介质 |
CN116797341B (zh) * | 2023-08-17 | 2023-11-21 | 北京信大融金教育科技有限公司 | 基于运营平台的积分产生和管理方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2992563C (en) | Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system | |
US10621597B2 (en) | Method and system for updating analytics models that are used to dynamically and adaptively provide personalized user experiences in a software system | |
US8250008B1 (en) | Decision tree refinement | |
KR20180103908A (ko) | 지리적 지역 히트맵을 생성하기 위한 시스템, 방법, 및 디바이스 | |
CN101110699B (zh) | 具有网络满意度预测预警功能的系统及其实现方法 | |
EP2608121A1 (en) | Managing reputation scores | |
JP5253519B2 (ja) | スマートテキストを生成するための方法、装置、及び記憶媒体 | |
US20200019822A1 (en) | EVALUATING IMPACT OF PROCESS AUTOMATION ON KPIs | |
CN111125574A (zh) | 用于生成信息的方法和装置 | |
CN108932625B (zh) | 用户行为数据的分析方法、装置、介质和电子设备 | |
CN109858683B (zh) | 确定店铺的营业状态的方法、装置、电子设备及存储介质 | |
CN111768244A (zh) | 一种广告投放的推荐方法及装置 | |
CN110162445A (zh) | 基于主机日志及性能指标的主机健康评价方法及装置 | |
CN116385045A (zh) | 一种用于收寄附加服务的数据处理方法、装置和设备 | |
CN114429364A (zh) | 业务数据管理方法和装置、存储介质及电子设备 | |
CN107230090B (zh) | 一种净推荐值nps分类方法及装置 | |
CN115237804A (zh) | 性能瓶颈的评估方法、装置、电子设备、介质和程序产品 | |
CN111612085A (zh) | 一种对等组中异常点的检测方法及装置 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
US8065174B2 (en) | Systems and methods for evaluating business-critical criteria relating to exploring entity mobility/productivity opportunities | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN112163154A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111882113A (zh) | 一种企业手机银行用户的预测方法和装置 | |
CN107944589A (zh) | 广告点击率的预测方法和预测装置 | |
CN116402546A (zh) | 店铺风险归因方法及其装置、设备、介质、产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |