CN109766520A - 一种基于大数据的多元线性回归分析方法及系统 - Google Patents
一种基于大数据的多元线性回归分析方法及系统 Download PDFInfo
- Publication number
- CN109766520A CN109766520A CN201910024977.XA CN201910024977A CN109766520A CN 109766520 A CN109766520 A CN 109766520A CN 201910024977 A CN201910024977 A CN 201910024977A CN 109766520 A CN109766520 A CN 109766520A
- Authority
- CN
- China
- Prior art keywords
- user
- linear regression
- multiple linear
- portrait
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012417 linear regression Methods 0.000 title claims abstract description 36
- 238000004458 analytical method Methods 0.000 title claims abstract description 21
- 238000006243 chemical reaction Methods 0.000 claims abstract description 37
- 238000000611 regression analysis Methods 0.000 claims abstract description 17
- 238000004590 computer program Methods 0.000 claims description 3
- 241001269238 Data Species 0.000 abstract 1
- 238000000034 method Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大数据的多元线性回归分析方法及系统,属于多元回归分析算法领域,无法得知用户画像特征变动所带来的影响,也无法根据影响采用的用户画像特征进行选择,无法对大数据进行全面分析。本发明基于大数据,实时获取用户画像,得到用户画像特征;基于相邻两个阶段中的用户画像,计算上一阶段到下一阶段用户画像特征的转换率;基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的转换率,建立多元线性回归模型;基于建立好的多元线性回归模型计算上一阶段到下一阶段中待计算用户画像特征的转换率。本发明用于对大数据进行多元线性回归分析得到当前分析结果。
Description
技术领域
一种基于大数据的多元线性回归分析方法及系统,用于对大数据进行多元线性回归分析得到当前分析结果,属于多元回归分析算法领域。
背景技术
现有的行业大数据,多数为集合海量非结构化数据,通过对其进行实时分析,可以为互联网行业提供用户全方位信息,通过分析和挖掘用户的行为习惯,并准确预测用户行为。
大数据的关键是从大量数据中快速获取有用信息的能力,或者是从大数据资产中快速变现利用的能力。
回归分析:回归分析方法是在众多的相关变量中,根据实际问题考察其中一个或多个变量(因变量)与其余变量(自变量)的依赖关系。
开放平台:接入第三方的入口平台。
现在的主流分析策略是通过大数据的分析,分析每个从获取用户到最终装换的整个流程中一个个子环节的转换率,即通常我们说的“漏斗模型”,监控每个环节的用户转化,然后寻找每个环节可以优化的点。这种回归分析,采集的数据相对单一,仅仅从各个环节的接口调用情况即可统计出各个环节的转换率。
实际中,由于大数据中的开放平台作为服务调用的入口平台,故开放平台能够获取到接口的调用情况,因此,采用一元回归分析法,对用户行为进行分析,分析数据相对单一,只能分析接口调用的情况接口,无法得知用户画像特征变动所带来的影响,也无法根据影响采用的用户画像特征进行选择,无法对大数据进行全面分析。
其中,转换率指在一条指定的流程中,各个步骤的完成数量相对上一个步骤的百分比。
发明内容
针对上述研究的问题,本发明的目的在于提供一种基于大数据的多元线性回归分析方法,解决现有技术中的分析数据相对单一,只能分析接口调用的情况接口,无法得知用户画像特征变动所带来的影响,也无法根据影响采用的用户画像特征进行选择,无法对大数据进行全面分析。
为了达到上述目的,本发明采用如下技术方案:
一种基于大数据的多元线性回归分析方法,其特征在于,如下步骤:
步骤1、基于大数据,实时获取用户画像,得到用户画像特征;
步骤2、基于各个阶段中的用户画像,计算各个阶段针对某个用户画像特征的转换率;
步骤3、基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的转换率,建立多元线性回归模型;
步骤4、基于建立好的多元线性回归模型计算待计算用户画像特征的转换率。
一种基于大数据的多元线性回归分析系统,其特征在于,包括:
用户画像获取模块:基于大数据,实时获取用户画像,得到用户画像特征;
用户画像特征转换率模块:基于各个阶段中的用户画像,计算各个阶段针对某个用户画像特征的转换率,或基于建立好的多元线性回归模型计算待计算的用户画像特征的转换率。
多元线性回归模型建立模块:基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的用户转换率,建立多元线性回归模型。
多元线性回归模型建立模块:基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的用户转换率,建立多元线性回归模型。
本发明同现有技术相比,其有益效果表现在:
一、本发明通过大数据中的多个用户画像,即通过多个用户画像中的特征,得到各个阶段的转换率后,再建立多元线性回归模型,再通过建立好的多元线性回归模型进行实际的用户画像特征转换率评估某个用户画像特征,再对用户画像特征进行更换,实现转换率的提高或降低;
二、本发明适用范围广,可根据不同的用户画像特征对大数据进行分析,可更全面的分析大数据。
附图说明
图1为背景技术中采用一元回归分析法对各平台和用户进行分析的方法。
具体实施方式
下面将结合附图及具体实施方式对本发明作进一步的描述。
由于大数据中的开放平台作为服务调用的入口平台,故开放平台能够获取到接口的调用情况,因此,采用一元回归分析法,对用户行为进行分析,如分析用户来源、年龄、性别、职业和地区等等的接口等调用的转换率,分析数据相对单一,只能分析接口调用的情况接口,无法得知用户画像特征变动所带来的影响,也无法根据影响采用的用户画像特征进行选择,对用户进行全面分析。为了解决上述问题,本发明提出了如下方案:
一种基于大数据的多元线性回归分析方法,如下步骤:
步骤1、基于大数据,实时获取用户画像,得到用户画像特征;
步骤2、基于各个阶段中的用户画像,计算各个阶段针对某个用户画像特征的转换率;
步骤3、基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的转换率,建立多元线性回归模型;
步骤4、基于建立好的多元线性回归模型计算待计算用户画像特征的转换率。
一种基于大数据的多元线性回归分析系统,包括:
用户画像获取模块:基于大数据,实时获取用户画像,得到用户画像特征;
用户画像特征转换率模块:基于各个阶段中的用户画像,计算各个阶段针对某个用户画像特征的转换率,或基于建立好的多元线性回归模型计算待计算的用户画像特征的转换率。
多元线性回归模型建立模块:基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的用户转换率,建立多元线性回归模型。
多元线性回归模型建立模块:基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的用户转换率,建立多元线性回归模型。
实施例
基于大数据,实时获取用户画像,得到用户画像特征为用户来源、年龄、性别、职业和地区;在某一个判断或识别流程中,需要通过建立好的多元线性回归模型对某用户画像中的特征进行分析,即从阶段1转换到阶段2,具有用户画像A特征的转换率为n,具有用户画像B特征的转换率为m,如用户画像A的特征为用户来源,其从阶段1转换到阶段2的转换率为n,根据转换率可分析出对应的用户画像特征是否可以用于分析大数据。
以上仅是本发明众多具体应用范围中的代表性实施例,对本发明的保护范围不构成任何限制。凡采用变换或是等效替换而形成的技术方案,均落在本发明权利保护范围之内。
Claims (2)
1.一种基于大数据的多元线性回归分析方法,其特征在于,如下步骤:
步骤1、基于大数据,实时获取用户画像,得到用户画像特征;
步骤2、基于相邻两个阶段中的用户画像,计算上一阶段到下一阶段用户画像特征的转换率;
步骤3、基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的转换率,建立多元线性回归模型;
步骤4、基于建立好的多元线性回归模型计算上一阶段到下一阶段中待计算用户画像特征的转换率。
2.一种基于大数据的多元线性回归分析系统,其特征在于,包括:
用户画像获取模块:基于大数据,实时获取用户画像,得到用户画像特征;
用户画像特征转换率模块:基于相邻两个阶段中的用户画像,计算上一阶段到下一阶段用户画像特征的转换率,或基于建立好的多元线性回归模型计算上一阶段到下一阶段中待计算用户画像特征的转换率。
多元线性回归模型建立模块:基于多元回归分析算法,实时获取的所有的用户画像特征和其对应的用户转换率,建立多元线性回归模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910024977.XA CN109766520A (zh) | 2019-01-10 | 2019-01-10 | 一种基于大数据的多元线性回归分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910024977.XA CN109766520A (zh) | 2019-01-10 | 2019-01-10 | 一种基于大数据的多元线性回归分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109766520A true CN109766520A (zh) | 2019-05-17 |
Family
ID=66453797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910024977.XA Pending CN109766520A (zh) | 2019-01-10 | 2019-01-10 | 一种基于大数据的多元线性回归分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109766520A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112073260A (zh) * | 2020-08-12 | 2020-12-11 | 韩震 | 基于互联网的多功能智能监控方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106548280A (zh) * | 2016-10-27 | 2017-03-29 | 深圳供电局有限公司 | 一种基于大数据分析电能质量提升用户体验的方法及系统 |
CN107093084A (zh) * | 2016-08-01 | 2017-08-25 | 北京小度信息科技有限公司 | 潜在用户预测转化方法及装置 |
CN107341187A (zh) * | 2017-06-07 | 2017-11-10 | 努比亚技术有限公司 | 搜索处理方法、装置、设备和计算机存储介质 |
CN108062680A (zh) * | 2017-11-15 | 2018-05-22 | 深圳市金立通信设备有限公司 | 预估转化率确定方法、广告需求方平台及计算机可读介质 |
-
2019
- 2019-01-10 CN CN201910024977.XA patent/CN109766520A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107093084A (zh) * | 2016-08-01 | 2017-08-25 | 北京小度信息科技有限公司 | 潜在用户预测转化方法及装置 |
CN106548280A (zh) * | 2016-10-27 | 2017-03-29 | 深圳供电局有限公司 | 一种基于大数据分析电能质量提升用户体验的方法及系统 |
CN107341187A (zh) * | 2017-06-07 | 2017-11-10 | 努比亚技术有限公司 | 搜索处理方法、装置、设备和计算机存储介质 |
CN108062680A (zh) * | 2017-11-15 | 2018-05-22 | 深圳市金立通信设备有限公司 | 预估转化率确定方法、广告需求方平台及计算机可读介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112073260A (zh) * | 2020-08-12 | 2020-12-11 | 韩震 | 基于互联网的多功能智能监控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6771751B2 (ja) | リスク評価方法およびシステム | |
US10970431B2 (en) | Automated model development process | |
CN111614690B (zh) | 一种异常行为检测方法及装置 | |
CN104376418B (zh) | 基于业务的系统变更风险控制方法 | |
CN104036105B (zh) | 确定涉及大数据分析的随机性应用的正确性的方法和系统 | |
CN106415507A (zh) | 日志分析装置、攻击检测装置、攻击检测方法以及程序 | |
KR101616544B1 (ko) | Lda를 이용한 특허 문헌 분석 방법 | |
CN104182474A (zh) | 一种预流失用户的识别方法 | |
WO2006047463A2 (en) | Multi-dimensional, expert, behavior-emulation system | |
KR101505546B1 (ko) | 텍스트 마이닝을 이용한 키워드 도출 방법 | |
US10635986B2 (en) | Information processing system and information processing method | |
CN108491991A (zh) | 基于工业大数据产品工期的约束条件分析系统与方法 | |
Lorentzen et al. | Peeking into the black box: An actuarial case study for interpretable machine learning | |
CN111557011A (zh) | 企业破产预测系统及其运行方法 | |
CN110717509A (zh) | 基于树分裂算法的数据样本分析方法及装置 | |
Paradis | The distribution of branch lengths in phylogenetic trees | |
CN109766520A (zh) | 一种基于大数据的多元线性回归分析方法及系统 | |
WO2006047464A2 (en) | Training a multi-dimensional, expert behavior-emulation system | |
US11295325B2 (en) | Benefit surrender prediction | |
Khoshnevis et al. | Prioritizing ground‐motion validation metrics using semisupervised and supervised learning | |
CN106503273A (zh) | 一种iOS设备数据分析系统 | |
CN116228284A (zh) | 货品需求预测方法、训练方法、装置、计算机系统及介质 | |
CN112906723B (zh) | 一种特征选择的方法和装置 | |
Lenarduzzi et al. | Estimating software development effort based on phases | |
Rodpysh | Model to predict the behavior of customers churn at the industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190517 |