CN114549035A - 一种基于电信大数据的理财用户精准获客标签构建方法 - Google Patents
一种基于电信大数据的理财用户精准获客标签构建方法 Download PDFInfo
- Publication number
- CN114549035A CN114549035A CN202111633814.5A CN202111633814A CN114549035A CN 114549035 A CN114549035 A CN 114549035A CN 202111633814 A CN202111633814 A CN 202111633814A CN 114549035 A CN114549035 A CN 114549035A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- financial
- model
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 230000000694 effects Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 239000011435 rock Substances 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 7
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000010801 machine learning Methods 0.000 abstract description 4
- 230000019771 cognition Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于电信大数据的理财用户精准获客标签构建方法,本发明主要包括:数据获取与清洗,移动APP选定和赋权,指标计算三个模块,基于电信大数据,获取了更加有效的用户数据;基于老用户实际数据,指导模型和指标构建过程,赋权和计算方法更加科学;数据清洗过程中,使用了机器学习的方式,按照老用户产生数据的特点对新用户的特征数据进行聚类。本发明刻画了用户的金融属性画像,例如用户可投资产、投资经验、活跃度等;使用了一种用户金融属性评估的模型,追踪用户浏览金融银行类APP等行为大数据,进而实现对用户风险习惯的认知。
Description
技术领域
本发明涉及的是用户画像探查领域,具体涉及一种基于电信大数据的理财用户精准获客标签构建方法。
背景技术
随着金融产品不断丰富,金融用户运营及生命周期管理的相关理论不断成熟,在金融产品目标客群圈定和营销领域已形成成熟的经验地图和用户标签构建方法。然而,这些模型或标签的构建方法中,存在“未准确识别用户金融属性”、“构建标签过程中的数据选取和清洗方法不合理”等问题,因此,如何寻找准确定位用户金融属性的数据和科学地清洗数据进而搭建标签,成为研究热点。
用户画像及以其为基础构建的用户标签,作为一种刻画目标用户核心产品诉求与有效购买力的有效工具,在各领域得到了广泛的应用、以电商领域的应用为例,企业采取对用户的行为信息、交易信息及个人基本信息抽象成原子标签,再通过逻辑组合和实际产品特征拟合,进而将用户形象具体化,从而为用户提供有针对性的产品服务和营销转化。但目前使用户画像制作用户原子标签过程中,存在着敏感数据和客观数据采集受限、无法刻画用户核心偏好、用户画像构造失真等问题,此类问题在金融服务等场景中更为普遍,这势必造成在推送服务信息时,往往并不是使用者需要的,造成的用户体验差。
综上所述,本发明设计了一种基于电信大数据的理财用户精准获客标签构建方法,以动态的理财老用户群体为样本,根据用户浏览使用APP类别和申赎行为特性等信息构建标签模型,准确圈定相应产品的潜在用户群。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供一种基于电信大数据的理财用户精准获客标签构建方法,定位用户“可投资产”、“投资经验”等特征的指标,根据用户浏览使用APP类别和申赎行为特性等信息建立了标签模型,准确圈定相应产品的潜在用户群。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于电信大数据的理财用户精准获客标签构建方法,包括以下步骤:
1、将各大平台常用的与理财有关的app进行分类,并根据下载量、使用频次、使用时长、平台理财用户的使用情况,对app进行赋权;
2、通过模型找到平台理财用户最相关的特征值,比如最高持仓额、最大申购额、风险等级等;
3、使用常用方法进行数据清洗,包括缺失值赋予默认值,排除异常值;
4、将整理好的数据建表;
5、使用spark框架建模,主要应用逻辑回归模型将用户打分,利用ROC评估模型拟合效果,并结合用户实际情况评估是否有可行性;
6、将用户可投资产、投资经验、活跃度评估得分输出落表,并建立标签,方便业务人员使用;
7、后期结合不断更新的理财用户,以及增加更多相关特征、app,对模型不断迭代,提高准确性。
本发明具有以下有益效果:
1.应用了存量用户画像分析和机器学习,设定新的指标构建方法和APP选取方案,具有更稳定的输出和更精确的数据结果;
2.设定APP使用习惯的分级指标,在不获取用户明细数据的前提下封装读取了用户在电信大数据中的APP使用数据,进一步将用户行为数据纳入到考虑中,作为衡量用户可投资产等的标准。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明的指标构建流程图
图2为本发明APP行为数据读取依赖表结构;
图3为本发明离线建模流程图;
图4为本发明APP选取示意图;
图5为本发明的赋权表示意图;
图6为本发明的输出用户可投资产分示意图;
图7为本发明的输出用户投资经验分示意图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
参照图1-3,本具体实施方式采用以下技术方案:一种基于电信大数据的理财用户精准获客标签构建方法,包括以下步骤:
1、将各大平台常用的与理财有关的app进行分类,并根据下载量、使用频次、使用时长、平台理财用户的使用情况,对app进行赋权;
2、通过模型找到平台理财用户最相关的特征值,比如最高持仓额、最大申购额、风险等级等;
3、使用常用方法进行数据清洗,包括缺失值赋予默认值,排除异常值;
4、将整理好的数据建表;
5、使用spark框架建模,主要应用逻辑回归模型将用户打分,利用ROC评估模型拟合效果,并结合用户实际情况评估是否有可行性;
6、将用户可投资产、投资经验、活跃度评估得分输出落表,并建立标签,方便业务人员使用;
7、后期结合不断更新的理财用户,以及增加更多相关特征、app,对模型不断迭代,提高准确性。
本具体实施方式基于电信大数据,获取了更加有效的用户数据;基于老用户实际数据,指导模型和指标构建过程,赋权和计算方法更加科学;数据清洗过程中,使用了机器学习的方式,按照老用户产生数据的特点对新用户的特征数据进行聚类。
本具体实施方式刻画了用户的金融属性画像,例如用户可投资产、投资经验、活跃度等;使用了一种用户金融属性评估的模型,追踪用户浏览金融银行类APP等行为大数据,进而实现对用户风险习惯的认知。
本具体实施方式可应用于金融产品目标客户分级,客户风险等级、可投资产等识别;金融产品营销策略输出。
实施例1:本实施例的一种基于电信大数据的理财用户精准获客标签构建方法,包括以下步骤:
首先是指标构建。关于可投资资产指标,理财用户根据持仓资产量区分,非理财用户通过需要用到理财的数据来训练。抽象成“年度消费、信用卡消费、话费套餐额度”等各类原子标签,用以表征非理财用户可投资产量;风险偏好理财用户根据理财风险测评结果来分,非理财用户通过理财用户的风险等级数据来训练,理财提供风险偏好的数据源,大数据专家评估训练,抽象为“理财类APP使用频次、投教类APP使用频次”等各类原子标签;
其次是进行APP选取和离线建模,分别按照如下公式,模拟得出用户收入、缴费、信用卡额度、话费套餐(最高100分,最低为0分);是否有车、是否是家庭用户(有得100分,无得0分)等评价分,以下数据均按照最高100分,最低0分计算:
score=100*log(Value)/(log(Max))
最终计算模型中,非理财用户可投资产得分=0.6*近半年月平均缴费金额得分+0.4*近半年月平均出账收入得分,理财用户可投资产得分=0.5*用户历史最高持仓额得分+0.5*历史单笔申购最大额得分。
关于投资经验等分,将投资理财APP使用月数得分按照各级APP使用总月数计算得分(最高100分,最低0分)进行由A-E赋权,赋权表见图5:
score=100*log(Value)/(log(Max))
投资理财APP使用月数得分=A级权重*A级得分+B级权重*B级得分+C级权重*C级得分+D级权重*D级得分+E级权重*E级得分。
根据上述建模过程,输出用户可投资产分(图6)、投资经验分(图7)分布如下所示,经理财用户得分与其实际表征数据(持仓、风测问卷等)分布比较,较为一致。
本实施例的APP选取(以投资经验标签为例)和权重实现说明如下:
1.选取原则:以用户投资经验指标为例,根据存量用户为例,选取用户常浏览的APP为主要目标,扩展选取同类APP
2.赋权原则:根据各类APP对应的浏览指数(浏览指数是指老用户对该类APP的使用频率;指数高,赋权高)和用户规模量级(量级大,赋权低)进行排序,按排序从高到低赋权分数
3.老用户数据较少情况,利用机器学习进行模型训练,模拟得出部分数据结果,例如用户可投资产中,对用户日常话费套餐额度、区位信息等进行综合考量,与同类老用户资产情况进行拟合。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (2)
1.一种基于电信大数据的理财用户精准获客标签构建方法,其特征在于,包括以下步骤:
(1)、将各大平台常用的与理财有关的app进行分类,并根据下载量、使用频次、使用时长、平台理财用户的使用情况,对app进行赋权;
(2)、通过模型找到平台理财用户最相关的特征值;
(3)、使用常用方法进行数据清洗,包括缺失值赋予默认值,排除异常值;
(4)、将整理好的数据建表;
(5)、使用spark框架建模,主要应用逻辑回归模型将用户打分,利用ROC评估模型拟合效果,并结合用户实际情况评估是否有可行性;
(6)、将用户可投资产、投资经验、活跃度评估得分输出落表,并建立标签,方便业务人员使用;
(7)、后期结合不断更新的理财用户,以及增加更多相关特征、app,对模型不断迭代,提高准确性。
2.根据权利要求1所述的一种基于电信大数据的理财用户精准获客标签构建方法,其特征在于,所述的步骤(2)中特征值为最高持仓额、最大申购额、风险等级。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111633814.5A CN114549035A (zh) | 2021-12-28 | 2021-12-28 | 一种基于电信大数据的理财用户精准获客标签构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111633814.5A CN114549035A (zh) | 2021-12-28 | 2021-12-28 | 一种基于电信大数据的理财用户精准获客标签构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114549035A true CN114549035A (zh) | 2022-05-27 |
Family
ID=81669254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111633814.5A Pending CN114549035A (zh) | 2021-12-28 | 2021-12-28 | 一种基于电信大数据的理财用户精准获客标签构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549035A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115760200A (zh) * | 2023-01-06 | 2023-03-07 | 万链指数(青岛)信息科技有限公司 | 基于金融交易数据的用户画像构建方法 |
-
2021
- 2021-12-28 CN CN202111633814.5A patent/CN114549035A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115760200A (zh) * | 2023-01-06 | 2023-03-07 | 万链指数(青岛)信息科技有限公司 | 基于金融交易数据的用户画像构建方法 |
CN115760200B (zh) * | 2023-01-06 | 2023-07-04 | 万链指数(青岛)信息科技有限公司 | 基于金融交易数据的用户画像构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109255506B (zh) | 一种基于大数据的互联网金融用户贷款逾期预测方法 | |
CN106651424B (zh) | 基于大数据技术的电力用户画像建立与分析方法 | |
Chien et al. | Manufacturing intelligence for semiconductor demand forecast based on technology diffusion and product life cycle | |
CN109409677A (zh) | 企业信用风险评估方法、装置、设备及存储介质 | |
Cheng et al. | Customer lifetime value prediction by a Markov chain based data mining model: Application to an auto repair and maintenance company in Taiwan | |
US20030097292A1 (en) | System and method for stability analysis of profitability of target markets for goods or services | |
CN109711424B (zh) | 一种基于决策树的行为规则获取方法、装置及设备 | |
CN108388974A (zh) | 基于随机森林和决策树的优质客户优化识别方法及装置 | |
CN111882420A (zh) | 响应率的生成方法、营销方法、模型训练方法及装置 | |
CN113469730A (zh) | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 | |
CN112837087A (zh) | 一种面向咨询服务系统的用户画像构建方法 | |
CN108154311A (zh) | 基于随机森林和决策树的优质客户识别方法及装置 | |
CN112102006A (zh) | 基于大数据分析的目标客户获取方法、搜索方法及装置 | |
CN116187808A (zh) | 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法 | |
CN114549035A (zh) | 一种基于电信大数据的理财用户精准获客标签构建方法 | |
CN117333337A (zh) | 一种基于人的能力与绩效水平智能匹配课程的方法及系统 | |
CN115293867A (zh) | 财务报销用户画像优化方法、装置、设备及存储介质 | |
CN115048503A (zh) | 一种基于内容分析的用户偏好标签设计方法 | |
CN114742599A (zh) | 一种基于自训练的用户价值分层方法、装置、存储介质及设备 | |
Fang et al. | Data mining technology and its Application In CRM of Commercial Banks | |
US20030046204A1 (en) | Method and system for assessing and improving individual customer profitability for a profit-making organization | |
Chen et al. | Research on the relationship between precision marketing and company development ability | |
Xiaona | Personalized recommendation model for mobile E-commerce users | |
Weng et al. | The study and verification of mathematical modeling for customer purchasing behavior | |
Higgs et al. | The ecology of Queensland design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |