CN109598634A - 一种基于机器学习的互联网保险实时精细化促销信息投放方法 - Google Patents
一种基于机器学习的互联网保险实时精细化促销信息投放方法 Download PDFInfo
- Publication number
- CN109598634A CN109598634A CN201811567629.9A CN201811567629A CN109598634A CN 109598634 A CN109598634 A CN 109598634A CN 201811567629 A CN201811567629 A CN 201811567629A CN 109598634 A CN109598634 A CN 109598634A
- Authority
- CN
- China
- Prior art keywords
- access
- user
- data
- probability
- sales promotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
一种基于机器学习的互联网保险实时精细化促销信息投放方法,包括如下步骤:1)离线数据的处理,用户访问行为数据处理:用户行为数据包括用户在访问卖保险的网站和手机APP的过程中会形成访问记录,记录浏览的网页、浏览内容、停留时长等信息,经步骤2)处理后形成浏览产品信息的用户访问行为数据,将这些数据做离线处理后,作为预测的训练样本和验证样本;2)用户实时访问日志通过kafka+Storm软件工具处理得到的实时数据作为模型的输入:采用kafka+Storm软件工具实现实时用户访问日志解析的技术方案;3)依据购买某险种的概率和投放促销信息的概率;最后形成投放的计算方法,提高用户购买率。
Description
技术领域
本发明涉及互联网智能信息处理方法,尤其是互联网保险行业的针对用户访问行为的 预测并对预测的结果做不同的营销策略。
背景技术
互联网保险业多以在线销售保险并提供理赔等保险相关服务为主业务,如何提高保险 销量,是互联网保险一直研究的命题,需要一种智能信息处理方法。
传统的网站营销多以离线制定优惠营销策略,商品特价信息。而没有做到针对不同用 户的访问信息实时推送优惠信息和产品推荐信息。
本发明基于大数据和机器学习技术,在用户访问网站及手机APP选择要购买保险产品、 浏览感兴趣的保险产品信息,最后形成下单(购买)或离开(不购买)的行为结果的过程 中发生了一系列连续性访问行为,分析用户的访问行为中隐藏着的用户的需求,购买倾向 等,通过用户的访问行为配合合理的算法预测以提供合理的营销策略如发优惠券等营销手 段促进用户购买,也可以根据用户行为推荐相关产品,提高购买率。
发明内容
发明目的,在现有技术背景下,提出了一种基于机器学习的互联网保险精细化促销信 息投放方法。通过机器学习智能算法,以访问数据为训练数据和输出标签,通过迭代训练 的方法形成预测模型,充分利用用户访问行为的相关性提高预测的精度;促销信息投放能 促进交易的达成。
本发明的技术方案是,一种基于机器学习的互联网保险实时精细化促销信息投放方法, 包括如下步骤:
步骤一:离线数据的处理,用户访问行为数据处理:用户行为数据包括用户在访问卖 保险的网站和手机APP的过程中会形成访问记录,记录浏览的网页、浏览内容、停留时长等信息,经步骤二处理后形成浏览产品信息的用户访问行为数据,将这些数据做离线处理后,作为预测的训练样本和验证样本;用户访问行为数据整理出的多指标数据组成训练样本和验证样本,作为机器学习算法的训练数据;即训练得到模型(参数);
步骤二:用户实时访问日志通过kafka+Storm软件工具处理得到的实时数据作为模型 的输入:采用kafka+Storm软件工具实现实时用户访问日志解析的技术方案;Storm消费 kafka,将实时的用户访问日志解析成用户访问的指标数据,将指标数据离线存入数据库 并把指标数据传给机器学习算法训练好的模型,经过模型的处理计算,预测用户购买某险 种的概率和投放促销信息(典型的是优惠券)的概率;
步骤三:依据购买某险种的概率和投放促销信息(优惠券)的概率,如果购买概率高, 投放优惠营销的概率低,不需要发放促销信息或投放次级促销优惠(非首次优惠);如果 购买概率是略低,根据投放营销概率的高低认定发放优惠;监控优惠方案投递后的成果, 评估并修正优惠方案投递标准和优惠方案的调整;最后形成投放的计算方法,提高用户购 买率;
预测出用户访问并购买的概率指标,投放促销信息的概率和保险产品的相关信息,确 定促销信息投放方法(优惠方案),监控投放效果调整营销策略。
本发明公开一种基于机器学习智能算法的互联网保险行业的精细化促销信息投放系统, 包括:机器学习算法模块、实时行为数据解析模块、促销信息投放方法推送模块。
所述机器学习算法模块,包括智能算法、离线模型训练、迭代训练。机器学习智能算 法建模能力强,可以有效减少预测模型所需的数据量,挖掘数据中存在的价值。
所述kafka+Storm实现实时日志解析的技术方案,是用户在访问网站或APP的过程中, 访问行为会被以一条条访问记录的形式记录在访问日志中,我们通过kafka将每条访问日 志取出并交给Storm(一种流式的实时计算系统)实时解析出用户的访问信息:访问时间、 访问的产品页、访问产品页的数量、访问不同险种的列表页、每个页面停留的时长,加入 购物车信息和用户的基本信息等数据。这些数据将被传给模型做处理和计算,得出此用户 在此状态的访问下购买保险的概率,需要推荐的保险类别名称,需要投放优惠营销的概率。
所述促销信息投放方法推送模块,根据机器学习智能算法(典型的是神经网络 算法)预测的结果,险种、购买概率、推送优惠概率。针对不同险种,如果购买概 率高,投放优惠营销的概率低,认定为购买率高,不需要做促销信息投放方法介入。 如果购买概率稍低,投放营销概率高的时候,根据不同险种不同优惠方案投放现金 优惠券、购买返券、购买送礼物优惠,会员积分翻倍。如果购买概率稍低,投放营 销概率稍低,进行相关险种最优惠推荐或同功能险不同险种价格最优推荐。如果购 买概率低,投放营销概率也低的情况下,推荐热门险种了解,推荐积分游戏等网站 活动,提高用户粘度。并根据投放促销信息投放方法的购买率转换,调整促销信息 投放方法,达到最优。智能算法、离线模型训练、迭代训练见实施例。
有益效果:通过机器学习智能算法,以访问数据为训练数据和输出标签,通过迭代训 练的方法形成预测模型,充分利用用户访问行为的相关性提高预测的精度,预测出用户访 问并购买的概率指标,投放促销信息的概率和保险产品的相关信息,确定促销信息投放方 法(优惠方案),监控促销信息投放效果调整营销策略。促进交易的达成。
附图说明
图1是本发明实施整体方案流程示意图。
图2是kafka+Storm实时数据计算流程示意图。
图3是访问流程示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。
参阅图1,本发明实施例的主体流程,具体步骤为:
步骤1:首先将一部分实时访问日志离线处理,得到离线数据。
步骤2:离线数据作为机器学习智能算法的训练数据,然后训练得到模型参数。
步骤3::实时访问日志通过kafka+Storm处理得到的实时数据作为模型的输入。
步骤4:预测出访问指标购买概率,投放促销信息投放方法的概率和保险产品的相关 信息,确定促销信息投放方法(优惠方案),监控投放效果调整营销策略。
参阅图2,本发明实施例的实时数据处理框架,具体包括。
步骤1:Kafka作为消息队列获得用户访问日志,将不均匀的数据转换成均匀的消息流, 数据先进入Kafka生产者然后Storm进行消费。
步骤2:Storm消费来自Kafka的信息,将访问日志处理成规则数据,数据反映了用户 的访问行为如:访问时刻、访问页面、搜索信息、停留时长、关注的产品信息等。
步骤3:把Storm处理好的数据传输给模型。
参阅图3,本发明实施例的模型返回预测结果,包含页面当前购买概率P1和当前页面 发放优惠券概率P11
用户访问页面S1后经处理过的访问数据传入模型中,经模型预测后返回预测概率,包 括当前购买概率p1和当前发放优惠概率p11,经权重计算,如果p11>0.64,则 p1*0.48+p11*0.59=p(j),如果p(j)>0.7则在S1页面发放优惠券,优惠券种类与S1页面 产品相关,p(j)<0.7不发放优惠券;如果p11<0.64,则p1*0.67+p2*0.31=p(j),如果 p(j)>0.8则在S1页面发放优惠券,优惠券种类与S1页面产品相关,若0.8>p(j)>0.5则 不发放优惠券但是在页面推荐险种(产品)信息栏中推荐与S1页面保险种类相似的险种 的信息;如果p(j)<0.5则不发放优惠券,不推荐险种(产品)产品信息,推荐热门险种 产品和网站活动信息。
应用的机器学习算法是xgboost,XGBoost是专注于梯度提升算法的机器学习函数库, 此函数库具有优良的学习效果以及高效的训练速度。
针对本例的Xgboost使用:
训练数据如上所述;
调参过程如下:
xgboost参数繁多,参数调节时,先调主要参数,再调非重要的参数,先粗调后微调, 逐步确定最佳参数组合。需要调试优化的参数如下(依重要性降序排列):
max_depth,树的最大深度,值越大,模型会学到更具体更局部的样本;决定模型复杂 性,对预测效果影响很大;典型值为3-10;
min_child_weight,最小叶子节点样本权重之和,值较小时易过拟合,值过大时易欠 拟合,默认为1;
subsample,对于每棵树,控制随机采样的比例,防止过拟合;默认为1;
learning_rate,通过减少每一步的权重,可以提高模型的鲁棒性;典型值为0.01-0.2;
设置默认参数如下:max_depth=7,min_child_weight=2,subsample=0.9,learning_rate=0.1;
模型迭代:
实时的用户访问日志解析成访问的指标数据,数据离线存入数据库之后,每周数据的 70%作为模型的新训练数据,30%作为模型的测试数据,测试训练结果;完成模型迭代;
模型返回结果:
实时的用户访问日志解析成用户访问的指标数据传给模型,经过模型的处理计算,预 测用户购买某险种的概率和投放促销信息(优惠券)的概率;
总体说明:本发明主要不是针对算法和模型的具体说明,而是基于公司新一站业务的 实时精细化促销信息投放方法这样一个流程性处理过程。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领 域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此, 本发明的保护范围当视权利要求书所界定者为准。
Claims (3)
1.一种基于机器学习的互联网保险实时精细化促销信息投放方法,其特征是,包括如下步骤:
步骤一:离线数据的处理,用户访问行为数据处理:用户行为数据包括用户在访问卖保险的网站和手机APP的过程中会形成访问记录,记录浏览的网页、浏览内容、停留时长等信息,经步骤二处理后形成浏览产品信息的用户访问行为数据,将这些数据做离线处理后,作为预测的训练样本和验证样本;用户访问行为数据整理出的多指标数据组成训练样本和验证样本,作为机器学习算法的训练数据;即训练得到模型;
步骤二:用户实时访问日志通过kafka+Storm软件工具处理得到的实时数据作为模型的输入:采用kafka+Storm软件工具实现实时用户访问日志解析的技术方案;Storm消费kafka,将实时的用户访问日志解析成用户访问的指标数据,将指标数据离线存入数据库并把指标数据传给机器学习算法训练好的模型,经过模型的处理计算,预测用户购买某险种的概率和投放促销信息的概率;
步骤三:依据购买某险种的概率和投放促销信息的概率,如果购买概率高,投放优惠营销的概率低,不需要发放促销信息或投放次级促销优惠;如果购买概率是略低,根据投放营销概率的高低认定发放优惠;监控优惠方案投递后的成果,评估并修正优惠方案投递标准和优惠方案的调整;最后形成投放的计算方法,提高用户购买率;
预测出用户访问并购买的概率指标,投放促销信息的概率和保险产品的相关信息,确定促销信息投放方法,监控投放效果调整营销策略。
2.根据权利要求1所述的基于机器学习的互联网保险实时精细化促销信息投放方法,其特征是,所述kafka+Storm实现实时日志解析的技术方案,是用户在访问网站或APP的过程中,访问行为会被以一条条访问记录的形式记录在访问日志中,通过kafka将每条访问日志取出并交给流式的实时计算系统Storm实时解析出用户的访问信息:访问时间、访问的产品页、访问产品页的数量、访问不同险种的列表页、每个页面停留的时长,加入购物车信息和用户的基本信息数据。
3.一种基于机器学习智能算法的互联网保险行业的精细化促销信息投放系统,其特征是,包括机器学习算法模块、实时行为数据解析模块、促销信息投放方法推送模块;
所述机器学习算法模块,包括智能算法、离线模型训练、迭代训练;机器学习智能算法建模能力强,有效减少预测模型所需的数据量,挖掘数据中存在的价值;
这些数据将被传给模型做处理和计算,得出此用户在此状态的访问下购买保险的概率,需要推荐的保险类别名称,需要投放优惠营销的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811567629.9A CN109598634A (zh) | 2018-12-20 | 2018-12-20 | 一种基于机器学习的互联网保险实时精细化促销信息投放方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811567629.9A CN109598634A (zh) | 2018-12-20 | 2018-12-20 | 一种基于机器学习的互联网保险实时精细化促销信息投放方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109598634A true CN109598634A (zh) | 2019-04-09 |
Family
ID=65963199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811567629.9A Pending CN109598634A (zh) | 2018-12-20 | 2018-12-20 | 一种基于机器学习的互联网保险实时精细化促销信息投放方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109598634A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112435047A (zh) * | 2020-10-30 | 2021-03-02 | 四川新网银行股份有限公司 | 一种基于埋点数据的营销外呼数据推荐方法 |
CN114518912A (zh) * | 2022-02-21 | 2022-05-20 | 度小满科技(北京)有限公司 | 一种页面加载方法、装置、设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080300957A1 (en) * | 2005-09-29 | 2008-12-04 | Japan Tobacco Inc. | Simulation Apparatus, Effect Measurement Apparatus, and Sales Promotion Support System |
CN105069654A (zh) * | 2015-08-07 | 2015-11-18 | 新一站保险代理有限公司 | 一种基于用户识别的网站实时/非实时营销投放方法及系统 |
CN107451840A (zh) * | 2016-05-31 | 2017-12-08 | 百度在线网络技术(北京)有限公司 | 一种交易信息推送方法和装置 |
CN107590684A (zh) * | 2017-08-21 | 2018-01-16 | 时趣互动(北京)科技有限公司 | 一种基于用户购买数据实时下发优惠券的方法及装置 |
CN108460618A (zh) * | 2018-01-09 | 2018-08-28 | 北京三快在线科技有限公司 | 一种资源配置方法及装置,电子设备 |
CN108765094A (zh) * | 2018-06-06 | 2018-11-06 | 中国平安人寿保险股份有限公司 | 保险数据处理方法、装置、计算机设备和存储介质 |
-
2018
- 2018-12-20 CN CN201811567629.9A patent/CN109598634A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080300957A1 (en) * | 2005-09-29 | 2008-12-04 | Japan Tobacco Inc. | Simulation Apparatus, Effect Measurement Apparatus, and Sales Promotion Support System |
CN105069654A (zh) * | 2015-08-07 | 2015-11-18 | 新一站保险代理有限公司 | 一种基于用户识别的网站实时/非实时营销投放方法及系统 |
CN107451840A (zh) * | 2016-05-31 | 2017-12-08 | 百度在线网络技术(北京)有限公司 | 一种交易信息推送方法和装置 |
CN107590684A (zh) * | 2017-08-21 | 2018-01-16 | 时趣互动(北京)科技有限公司 | 一种基于用户购买数据实时下发优惠券的方法及装置 |
CN108460618A (zh) * | 2018-01-09 | 2018-08-28 | 北京三快在线科技有限公司 | 一种资源配置方法及装置,电子设备 |
CN108765094A (zh) * | 2018-06-06 | 2018-11-06 | 中国平安人寿保险股份有限公司 | 保险数据处理方法、装置、计算机设备和存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112435047A (zh) * | 2020-10-30 | 2021-03-02 | 四川新网银行股份有限公司 | 一种基于埋点数据的营销外呼数据推荐方法 |
CN114518912A (zh) * | 2022-02-21 | 2022-05-20 | 度小满科技(北京)有限公司 | 一种页面加载方法、装置、设备及可读存储介质 |
CN114518912B (zh) * | 2022-02-21 | 2023-04-25 | 度小满科技(北京)有限公司 | 一种页面加载方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Evaluation and selection model of community group purchase platform based on WEPLPA-CPT-EDAS method | |
Han et al. | Segmentation of telecom customers based on customer value by decision tree model | |
Aldy | An environmental Kuznets curve analysis of US state-level carbon dioxide emissions | |
CN103914468B (zh) | 一种投放信息搜索的方法和装置 | |
Yücesan | Competitive supply chains | |
WO2009099947A2 (en) | Methods and apparatus to generate smart text | |
Du et al. | Implications of on-time delivery service with compensation for an online food delivery platform and a restaurant | |
Evans | Lightening up on market definition | |
CN109598634A (zh) | 一种基于机器学习的互联网保险实时精细化促销信息投放方法 | |
CN107480227A (zh) | 一种基于大数据的信息推送方法 | |
CN115619571A (zh) | 一种理财规划方法、系统及装置 | |
Cao et al. | Supplier or co-optor: Optimal channel and logistics selection problems on retail platforms | |
CN115953021A (zh) | 一种基于机器学习的供应商风险分析方法及装置 | |
Ma et al. | Procurement competition in the presence of IoT-enabled B2B E-commerce | |
Chen et al. | In-store, pre-warehouse, or store-and-warehouse integration: Strategic analysis for neighborhood fresh product retail modes | |
CN104408641B (zh) | 电子商务推荐模型的品牌特征提取方法及系统 | |
Oh | A study on consumers' intention to continue use of unmanned stores in the non-face-to-face era: focusing on the moderating effect of COVID-19 social risk | |
Liu | Research on the Operation of Agricultural Products E‐Commerce Platform Based on Cloud Computing | |
Kunz et al. | The effect of data preprocessing on a retail price optimization system | |
Worku et al. | Market chain analysis of chickpea in Northwest Ethiopia | |
Deng et al. | Multiple kernel learning on time series data and social networks for stock price prediction | |
Zhuang et al. | A Neural Network Model for China B2C E-Commerce Sales Forecast Based on Promotional Factors and Historical Data | |
He et al. | To offer or not to offer? The optimal value-insured strategy for crowdsourced delivery platforms | |
Bina et al. | Feeder Cattle Basis Risk and Determinants | |
Chun-qiu et al. | Differential game models of low carbon reputation considering government participation in supply chain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190409 |
|
RJ01 | Rejection of invention patent application after publication |